Ubix Linux, le datalab de poche

25
16
mar.
2024
Distribution

Ubix Linux est une distribution Linux libre et open-source dérivée de Debian.

Le nom « Ubix » est la forme contractée de « Ubics », acronyme issu de l'anglais Universal business intelligence computer system. De fait, le principal objectif d'Ubix Linux est d'offrir une plateforme universelle dédiée à l'informatique décisionnelle et à l'analyse des données.

Il s'agit d'une solution verticale, prête à l'emploi, dédiée à la manipulation des données et à la prise de décision. Allégée par conception, elle n'embarque qu'un jeu limité d'outils spécialisés dans ce domaine. Ceux-ci permettent néanmoins de couvrir tous les besoins dont l'acquisition, la transformation, l'analyse et la présentation des données.

Ubix Linux - Vue d'ensemble

Origines de la distribution

La volonté initiale du concepteur de la distribution était de pouvoir disposer, à tout moment et en toutes circonstances, des outils lui permettant de réaliser des analyses de données et d'en présenter le résultat ad hoc. Ce « couteau suisse » de manipulation des données, devait également lui permettre d'éviter de devoir justifier, rechercher, acquérir et installer l'écosystème logiciel nécessaire chaque fois que ce type de tâches se présentait à lui.

Son cahier des charges stipulait donc une empreinte disque la plus faible possible sans pour autant faire de concessions au niveau des fonctionnalités. La distribution se devait d'être portable et exécutable immédiatement dans des contextes variés, sans nécessité d'investissement, d'installation ou de droits d'accès particulier.

De ce fait, Ubix Linux ne se démarque pas par ses aspects « système », mais plutôt par sa destination et ses cas d'usage.

Au-delà du besoin initial

À l'heure où de nombreux concepts liés à la manipulation des données tels que le « Big Data », la « Data Science » ou le « Machine Learning » font la une de nombreux médias, ceux-ci restent encore des boîtes noires, affaire de spécialistes et d'organisation disposant des moyens de les mettre en application.

Si le grand public en intègre de mieux en mieux les grandes lignes, il ne dispose encore que de peu de recul sur la manière dont ses données peuvent être utilisées, ainsi que la richesse des débouchés associés.

D'un autre côté, de nombreux gisements de données à la portée du plus grand nombre demeurent inexploités, faute de compétences ou de moyens facilement accessibles.

Il se trouve qu'Ubix Linux peut permettre de surmonter cette difficulté, en offrant à tous les moyens de s'approprier (ou se réapproprier) et tirer parti des données disponibles.

Philosophie

Par nécessité, Ubix Linux a été conçue en intégrant uniquement des produits libres et open-source. Bien que cette distribution puisse s'avérer utile à toute personne devant manipuler des données, elle se doit de préserver et défendre une approche pédagogique et universaliste.

Elle a pour ambition de mettre les sciences de données à la portée de tous. La distribution en elle-même n'est qu'un support technique de base devant favoriser l'apprentissage par la pratique. Il est prévu de l'accompagner d'un tutoriels progressifs.

Les outils low-code/no-code intégrés dans la distribution permettent de commencer à manipuler des données sans devoir maîtriser au préalable la programmation. Néanmoins, des outils plus avancés permettent ensuite de s'initier aux principes des algorithmes d'apprentissage automatique.

Synthèse

Ubix Linux s'inscrit dans la philosophie du logiciel libre et plus particulièrement dans celle des projets GNU et Debian.

Elle se destine à :

  • demeurer accessible à tous ;
  • pouvoir s'exécuter sur des configurations matérielles relativement modestes, voire n'être installée que sur un périphérique portable USB ;
  • proposer un outil pédagogique pour appréhender de façon pratique la science des données et l'apprentissage machine ;
  • permettre la découverte, l'expérimentation et l'aguerrissement de tout un chacun aux principaux outils de manipulation des données ;
  • offrir une boîte à outils légère et agile, néanmoins complète et utile pour un public professionnel averti.

Et après…

Nous sommes à l'écoute de toute suggestion. Toutefois, les moyens étant ce qu'ils sont (au fond du garage), la réactivité à les prendre en compte pourra s'avérer inversement proportionnelle.

Nous souhaiterions que cet outil pédagogique puisse bénéficier au plus grand nombre : si vous voulez contribuer à la traduction du contenu du site officiel en espagnol, en portugais ou en allemand, vous êtes les bienvenus.

Aller plus loin

  • # Intéressant

    Posté par  (Mastodon) . Évalué à 7.

    Ce projet peut effectivement trouver ses utilisateurs comme les distributions spécialisées audio/vidéo ou autre.
    Je ne sais pas si c'est le cas mais il faudrait veiller à ce que les outils/packages permettant de se connecter aux technos big data (spark,nosql etc) soient présentes de base.
    Pour moi il manque R mais c'est simple à ajouter.

  • # packages

    Posté par  . Évalué à 6.

    dérivée de Debian.

    Cool, je suis déjà sur Debian. Est-ce que l'ensemble d'outils et de services peut s'installer comme package ?

    • [^] # Re: packages

      Posté par  . Évalué à 10. Dernière modification le 18 mars 2024 à 09:39.

      C'est vraiment un truc que j'ai le plus de mal à comprendre dans ces distributions spécialisées. Pourquoi ne pas se contenter de fournir un script et de décrire la procédure d'installation:
      - Installer une Debian de base
      - Lancer le script qui installera la liste des packages suivants

      Et en plus, éventuellement, fournir un ISO sur lequel la manip a déjà été faite.

      Ça m'a l'air bien plus facile à mettre en place que de gérer une nième distribution ?

      Déjà que l'écosystème Linux est hyper fragmenté, pourquoi diviser encore un peu plus ?

      • [^] # Re: packages

        Posté par  (Mastodon) . Évalué à 5. Dernière modification le 18 mars 2024 à 17:17.

        L'idée n'est certainement pas de diviser : elle est plutôt d'attirer des utilisateurs néophytes, plus intéressés a priori par la manipulation des données, que par des tâches d'installation.

        Une autre déclinaison est prévue pour répondre aux besoins d'utilisateurs expérimentés, qui elle, ne doit pas nécessairement embarquer le système.

        La déclinaison actuellement disponible est dédiée:

        • à être immédiatement utilisable en l'état (i.e. en limitant au maximum les actions et connaissances nécessaires pour cela) ;
        • au support d'initiatives pédagogiques (découverte, expérimentation, apprentissage, démonstrations) en business intelligence et data science pour des profils non nécessairement linuxiens ;
        • à fournir un "couteau suisse" pour des besoins ponctuels d'analyse (pouvant demeurer sur un périphérique USB).

        L'ensemble des outils mis à disposition a été de ce fait volontairement limité et a été "intégré". Un démonstrateur permet de manipuler tous les outils autour d'un seul cas d'école. Ce démonstrateur embarqué est notamment directement utilisable en mode live.

        Ensuite, si le public visé est séduit, très vite cette première déclinaison ne lui sera plus suffisante. Ce sera un succès si elle permet à toute personne intéressée de prendre son envol, abandonner ce simple tremplin, pour construire sa propre configuration en faisant ses propres choix.

    • [^] # Re: packages

      Posté par  (Mastodon) . Évalué à 2.

      Bonjour,

      Je vais une réponse plus détaillée ci-dessous.

      L'installation en tant que solution packagée est prévue dans une déclinaison ultérieure, mais pas dans celle-ci dont les cas d'usage envisagés sont assez modestes.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.