Heptapod est une divergence (fork) amicale de GitLab CE qui prend en charge le DVCS Mercurial. Le projet a deux ans et est actuellement disponible sous forme de sources et d’image Docker à installer.
Prédire la note d’un journal sur LinuxFr.org
Cette dépêche traite de l’exploration de données sur des données issues de LinuxFr.org.
Ayant découvert récemment scikit-learn, une bibliothèque Python d’apprentissage statistique (machine learning). Je voulais partager ici un début d’analyse sur des contenus issus de LinuxFr.org.
Avertissement : je ne suis pas programmeur, ni statisticien. Je ne maîtrise pas encore tous les arcanes de scikit-learn et de nombreux éléments théoriques m’échappent encore. Je pense néanmoins que les éléments présentés ici pourront en intéresser plus d’un(e).
Tous les scripts sont codés en Python et l’analyse à proprement parler a été réalisée à l’aide d’un notebook Jupyter. Un dépôt contenant les données et les scripts est disponible sur GitLab.