Chers développeurs et autres utilisateurs de logiciel libre,
Hugging Face est une société américaine qui fait de l'intelligence artificielle, créée par des Français (ce qui est courant avec l'IA).
La société a publié récemment un dataset appelé "The Stack v2", qui contient environ 67 téraoctets de code source provenant de Software Heritage et GitHub:
3.28 milliards de fichiers uniques faisant partie de 104.2 millions de repositories github ont été collectés en parcourant le graphe du dataset de Software Heritage (…)