arnaudus a écrit 5197 commentaires

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 6 (+4/-1).

    Je ne comprends pas ton rapport avec la réalité. On peut avoir des convictions personnelles fortes, mais les convictions n'ont jamais changé la réalité. La réalité c'est que les LLM fonctionnent très bien, extrêmement bien, mieux que n'importe qui aurait pu le prédire il y a quelques années, et bien mieux que certaines prétendent ici. Certains LLM sont proposés par des entreprises américaines aux accointances douteuses avec un pouvoir douteux, mais c'est totalement absurde de généraliser, il y a des LLM européens, chinois, plus ou moins libres ou open data, c'est tout un bestaire, et il ne se réduit pas à ChatGPT.

    L'existence des LLM pose tout un tas de questions sociétales et environnementales, et beaucoup sont destabilisés par les changements possibles. Ce sont des questions très raisonnables, mais je ne comprends pas comment on peut juste nier les perfs des LLM parce qu'on préfèrerait qu'ils n'existent pas. Et je dis ça alors que j'utilise beaucoup moins les LLM que mes collègues par exemple; la plupart d'entre eux n'ont ni les perfs ni le degré d'ouverture et de confidentialité pour que je leur fasse confiance; je n'ai par contre aucun doute sur l'importance qu'ils vont prendre sur la plupart des métiers.

    Sur la recherche, j'imagine que tu m'as mal compris. Comme je connais très bien ce milieu, je voulais juste remettre en perspective l'idée que l'IA ne pouvait y jouer aucun rôle. C'est juste totalement faux, parce que le travail "créatif" dans la recherche représente une fraction très réduite du temps de travail des chercheurs, qui passent leur temps à chercher et intégrer des informations, à remplir des formulaires administratifs et des demandes de financement, et à gérer un environnement de travail complexe (réunions, comités, entretiens individuels, recrutement…); bref, c'est en majorité un travail assez similaire à un travail de cadre dans n'importe quelle structure, avec des spécificités (notamment les règles et l'organisation inefficaces de la fonction publique) qui ne favorisent pas leur productivité. Donc oui, je confirme, imaginer les chercheurs comme des gens à l'intelligence supérieure qui cogitent, c'est une vision fantasmée de la recherche; au quotidien, une grande partie de l'activité est beaucoup plus "standard" et je ne vois pas pourquoi elle ne bénéficierait pas de l'existence de ces logiciels performants.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3 (+1/-1).

    Je ne sais pas ce que c'est, mais tu as l'air de suggérer que la recherche fondamentale est forcément une activité intellectuelle intense qui repousse les limites du génie humain. C'est une vision très romantisée de la chose, puisque la recherche c'est souvent beaucoup de travail systématique ou de collecte de données, par exemple.

    On est bien d'accord que les LLM tels qu'ils fonctionnent actuellement ne seront pas capables d'inventer la relativité. Ça, ce n'est pas de l'IA, ça serait l'atteinte de la singularité technologique. Mais il commence à y avoir des LLM qui servent d'assistants de recherche, qui peuvent automatiser des traitements statistiques ou des analyses de routine, qui peuvent émettre des hypothèses. Le jour où on aura des LLM performants capables de faire des synthèses et des recherches bibliographiques performantes par exemple, ça sera un outil de productivité majeur. Donc, diriger des recherches, probablement pas tout de suite, mais fournir beaucoup d'aide aux chercheurs, c'est vraiment envisageable.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 1 (+0/-2).

    Là j'avoue que c'est flippant. Ce n'est pas qu'il trouve la bonne réponse qui est flippant, c'est sa réaction: "Attendez, il y a quelque chose d'étrange dans cette formulation". Il est surpris. Sérieux, combien d'exemple faudra-t-il pour admettre que ces logiciels se comportent comme des systèmes intelligents?

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3 (+0/-0).

    À ma connaissance, les humains ne font pas tous de la recherche scientifique, et parmi les cheucheurs, bien peu sont capables de repousser les limites du savoir en innovant. Par ailleurs, si la recherche scientifique ne progressait que grâce aux capacités cognitives des chercheurs, ça serait de la philosophie.

    La question n'est pas de savoir si les LLM de 2025 sont des génies, on le sait que leur mode de fonctionnement pour l'instant les cantonne à refaire des raisonnements qui ont déja été faits. La question est de savoir s'ils se comportent comme des entités intelligentes.

    Le jour où les IA surpasseront les meilleurs chercheurs, on aura atteint la singularité technologique. Ça serait peut-être en 2027, en 2050, ou jamais, mais ça n'est pas encore le cas, et personne ne l'a prétendu.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 3 (+0/-0).

    Non, je pense que tu n'as pas assez fait l'effort de chercher par toi-même.

    Le problème est difficile, et en plus il est assez débile (parce que physiquement on ne comprend pas trop comment le clochard fait pour recycler les mégots en cigarettes). Moi je crois que je n'ai jamais compris la solution de ce truc sans qu'on me l'explique.

    Ce problème est difficile, ça n'est carrément pas un bon exemple de truc ou une personne random dans la rue va donner intuitivement la bonne solution.

    Quant à cette IA, elle a probablement vue passer cette énigme dans son corpus car elle tout de même assez connue.

    Je pense que tu es capable de donner la solution parce que toi aussi tu as déja vu passer l'énigme parce qu'elle est assez connue. Je ne vois pas vraiment où tu veux en venir.

  • [^] # Re: Pourquoi dire IA si on ne parle que des réseaux de neurones ?

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 1 (+3/-5).

    Et franchement croire que ceux-ci sont réellement intelligents, ça m'attriste sur comment on définit l'intelligence!

    Je pense que tu es dans un profond déni. Visiblement, la réalité, c'est que ça t'attriste qu'il existe des programmes informatiques qui défoncent allègrement tous les tests jamais imaginés pour définir une intelligence artificielle, alors tu préfères le nier. S'il était si évident que ces programmes n'étaient pas intelligents, il serait trivial de les mettre en défaut. Alors vas-y, juste pour vérifier : donne-nous un exemple, une tâche intellectuelle qui est à la portée de tout être humain pris au hasard dans la rue mais pas d'un LLM.

    Ce qui me semble évident, c'est que si on tombait sur un extraterrestre qui interagissait avec nous comme le fait chatGPT, jamais il ne viendrait à l'esprit de quiconque de remettre en cause son intelligence. Donc questionner l'intelligence des LLM, c'est uniquement parce qu'on croit inférer de ce que l'on comprend de leur fonctionnement qu'ils ne peuvent que "simuler" l'intelligence. Mais c'est absude! Simuler l'intelligence est exactement la définition de l'IA.

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 9 (+6/-0).

    Comment peut-on étudier le fonctionnement d'un logiciel et l'adapter à ses besoins (liberté 1 de la GPL) si celui-ci est obscur et non reproductible ?

    Ce que tu décris n'est qu'un cas extrême de choses qui arrivent tout le temps, je ne comprends pas pourquoi dans le cas d'une IA générative ça deviendrait immédiatement compliqué.

    La situation où un exécutable libre ne produit de résultats exploitable que grâce à une base de données complexe et d'origine incertaine est assez fréquente. Tu peux par exemple prendre l'équilibrage d'un jeu vidéo, avec des centaines ou des milliers de paramètres qui sont réglés de manière à rendre le jeu intéressant, à faire en sorte qu'une partie dure plus ou moins longtemps, etc. Ça n'est pas propre aux jeux vidéo d'ailleurs, rien qu'au Monopoly tu as des centaines de paramètres (emplacement et prix des propriétés, prix des maisons, prix des loyers pour une, deux, trois quatre maisons et un hôtel, nombre et effet des cartes, etc. Tout ça vient dans un fichier "ruleset.txt" et tu n'as aucune idée de la manière dont il a été généré, sauf éventuellement si les concepteurs du jeu sont très transparents (et de toutes manières tu peux à peine vérifier). Pour moi, les poids pour une IA sont une version extrême du ruleset.txt : des centaines, milliers, millions de paramètres que le programme prend en entrée et qui le rendent utilisable. Tu peux changer les paramètres et vérifier que ça marche ou pas, mais tu n'as pas accès à la procédure (automatique, humaine, mixte, au pif, statistique…) qui a mené à l'établissement de cette base de données.

    Ce qui est important, c'est que les données de poids des IA ne sont pas obfusquées : c'est réellement les données qui servent à paramétrer le modèle. Que tu considères qu'elles soient trop complexes pour toi ne change rien à l'affaire : elles sont en effet générées par un algorithme, mais c'est aussi le cas de dizaines de choses que tu utilises tous les jours (moteur de ta voiture, puces de ton ordinateur et de ton téléphone…).

    Bien sûr, ce qui semble un peu bizarre c'est que pour un réseau de neurones, le programme en lui-même est une coquille vide (mais pas énormément plus qu'un moteur de jeu vidéo). Mais c'est déja le cas pour une quantité extraordinaire de logiciels. Un moteur de recherche est une coquille vide sans les données aspirées du web, un navigateur est une coquille vide sans les données des pages qu'il est censé afficher, un algorithme de bioinformatique est une coquille vide sans l'annotation du génome dans lequel il pioche les informations, etc. Mais personne n'irait jamais dire qu'un moteur de recherche sous GPL n'est pas libre parce qu'on peut télécharger le logiciel mais pas la base de données. La liberté du logiciel libre, ça ne concerne que le logiciel.

    Je pense que cette excellente dépêche montre bien qu'une IA générative ne peut globalement répondre aux critères du logiciel libre, elle est au mieux partiellement libre ou open source.

    Je crois que tu te trompes de raisonnement. Le fait qu'un logiciel soit libre ne concerne que ce logiciel, pas ce qui arrive en amont ou en aval, et pas ce qui arrive à l'utilisateur. Ce que tu voudrais pouvoir appliquer à une IA générative va au-delà des libertés du logiciel libre, et j'irais même jusqu'à dire qu'un des critères (la possibilité d'étudier son fonctionnement) jour sur la polysémie du mot "pouvoir". Tu sembles exiger de pouvoir étudier son fonctionnement comme si tu exigeais de pouvoir courir le 100m en 8 secondes. Dans le logiciel libre, "pouvoir étudier le fonctionnement" doit se comprendre comme "avoir le droit d'essayer", pas "être en mesure de réussir". Avec les poids, tu as tout ce qu'il faut pour étudier le fonctionnement; tu peux essayer de réentrainer le modèle avec tes propres données, tu es libre, tu fais ce que tu veux. Le fait que tu ne saches pas le faire (parce que tu n'as pas les données ou parce que c'est trop complexe) ne change pas la licence du logiciel.

    Mais sur le fond, je ne suis pas en désaccord. La dépêche est excellente, mais à mon avis elle montre qu'une IA peut être un logiciel libre, mais que c'est le genre de logiciel libre qui aurait aussi besoin de plus qu'être un logiciel libre : reposer sur des données ouvertes, être intégré dans une chaine de logiciels libres, reposer sur des principes d'ouverture scientifique, etc. Tout ça va bien au-delà de la licence du logiciel. Mais ça ne veut pas dire qu'il est légitime de dire que ces logiciels ne sont pas libres : ces logiciels sont parfaitement libres, mais la liberté des logiciels n'est probablement pas suffisante pour un contrôle citoyen efficace (tout comme un navigateur libre ne garantit pas du tout que les sites que tu visites ne truffent pas ton disque de cookies et de traqueurs).

  • [^] # Re: Condamnée à quoi ?

    Posté par  . En réponse au lien La France condamnée par la Cour européenne des droits de l'homme pour violation du droit à la vie. Évalué à 3 (+0/-0). Dernière modification le 27 février 2025 à 16:14.

    Je ne comprends pas quelles sont les sanctions auxquelles l'état français serait condamné.

    Pour être honnête, je ne suis pas sûr de comprendre exactement ce que le jugement dit. Il semble confirmer qu'il y a eu un usage abusif de la force, mais en même temps que l'enquête a été bien faite (alors que l'enquête n'a pas réussi à déterminer les responsabilités individuelles). Ça me semble assez paradoxal, non? Soit c'est la chaine de commandement qui a donné des consignes illégales (volontairement ou par manque de discernement quant à l'état de la situation), soit c'est quelqu'un localement qui a été au-delà des ordres (un gendarme ou un de ses responsables sur le terrain).

    Ou alors, le jugement implique que le problème est au niveau de la loi (tout ce qui s'est passé est conforme à la loi française, mais du coup c'est la loi qui doit être changée parce qu'elle permet une violation des droits de l'Homme). Ça pourrait expliquer pourquoi l'État est condamné mais pas les individus… sauf que ma compréhension de l'article 2 de la convention EDH ne permet pas cette interprétation (on peut réprimer une émeute "conformément à la loi").

    Les arrêts de la CEDH sont souvent obscurs, parce que les textes sont très vagues. Là, en l'occurrence, le texte de référence est l'article 2, qui dit "La mort n’est pas considérée comme infligée en violation de cet article dans les cas où elle résulterait d’un recours à la force rendu absolument nécessaire : […] pour réprimer, conformément à la loi, une émeute ou une insurrection.", donc si je comprends bien la totalité du débat porte sur le terme "absolument"? Je n'y connais rien en droit, mais j'aimerais bien qu'on m'explique comment des juges peuvent déterminer si l'article 2 est transgressé ou non. Après tout, il n'est jamais absolument nécessaire de réprimer une émeute, donc on va essayer de discuter des options laisser cramer / réprimer? Comment est-ce qu'on fait pour ne pas se retrouver avec une discussion de bistro?

  • # Kof kof

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 8 (+5/-0). Dernière modification le 27 février 2025 à 14:46.

    Le deuxième, c’est de distribuer sous une licence non copyleft, genre BSD ou WTFPL. Une licence qui ne nécessite pas de distribuer le code source. Certes, mais en fait tu ne fais pas du Libre.

    Ouhlala, quand même.

    1) Le libre, c'est les 4 libertés. Donc BSD et WTFPL, c'est libre, et ça n'a jamais été ambigü, même pour la FSF (voir https://www.gnu.org/licenses/bsd.fr.html).

    2) Les licences libres non-copyleft n'ont de sens que quand le code source est distribué. Ces licence libres couvrent des logiciels libres, la différence avec les licences copyleft est que le programme modifié n'a pas impérativement à être redistribué sous la même licence (donc BSD: obligation de distribuer le code source, mais pas de le redistribuer).

    3) Un logiciel distribué sous licence libre est libre, il n'existe pas d'autre critère. Les concours de "pureté" se sont toujours mal terminés.

    Indépendamment de ça, je pense que tu t'es trompé sur l'interprétation de la définition de l'IA OpenSource par l'OSI. Contrairement à ce que tu sembles suggérer, les données d'entrainement ne font pas partie de ce qui doit être fourni (c'est très clair dans la FAQ https://hackmd.io/@opensourceinitiative/osaid-faq). Bon, je trouve que la définition de l'OSI n'est pas terrible de toutes manières, mais si je comprends bien l'idée, c'est que tu dois fournir la recette, et notamment la description des données d'entrainement (du genre, j'imagine, le type de données et les métadonnées associées), en plus des poids et du logiciel (open source).

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5 (+2/-0).

    La reproductibilité ou la transparence n'a pas grand chose à voir avec la licence du programme… J'ai l'impression qu'on mélange des concepts qui sont très distincts (Open source et Open data).

    Sans compter que la procédure d'apprentissage implique souvent des interventions humaines, donc tu as là un problème de reproductibilité évident. Même si tu décris ta procédure et qu'elle implique 1000 africains payés 1$/h pendant 6 mois, je ne vois pas ce que ça apporte, même si tu faisais la même chose tu n'aurais pas le même résultat.

    Et avec tout ça, le logiciel avec ses poids peut parfaitement être distribué sous une licence libre et entrer sans aucune ambiguité dans la définition d'un logiciel libre.

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 4 (+1/-0).

    Les humains ont conçu l'algorithme, ils ont aussi conçu le jeu d'échecs, ils ont conçu les ordinateurs sur lesquels le programme tourne… Je ne comprends pas trop où tu veux en venir.

    Je ne pense pas qu'une extension de la liberté des logiciels aux données et aux procédés qui ont permis de calculer les données d'entrée du programme soit cohérente et souhaitable. Ça semble n'avoir aucune fin. Un programme informatique, c'est un truc exécutable qui prend des données en entrée et qui te sort d'autres données; il est très fréquent d'avoir besoin de plusieurs programmes informatiques pour effectuer une tâche (gimp pour créer une image, libre office pour la mettre en page sur une dispositive, la visionneuse pour la projeter, etc), et certains programmes de cette chaine peuvent être libre et d'autres non. Quand on parle de réseaux de neurones, on parle de deux programmes, P1 qui entraine le réseau qui qui détermine des poids P en partant d'un jeu de données d'entrainement D, et un programme P2 qui prend une requête R, et qui utilise P pour donner une réponse Q. Tu as donc D -> P1 -> P, et P + R -> P2 -> Q. Si tu distribues le programme P2, tu refiles P2 et P, l'utilisateur procure la requête R, et voila, c'est un programme tout comme n'importe quelle programme informatique. P2 ne devient pas "non libre" si tu ne fournis pas toute la chaine logicielle et humaine qui a servi à déterminer P. Comme je l'ai écris plus haut, refiler P sans permettre de reproduire le processus D -> P1 -> P n'est pas très transparent, mais pour moi c'est pareil que de mettre une image retouchée avec Photoshop dans LibreOffice, ça ne concerne pas la licence de LibreOffice.

    On a le droit de trouver cette situation sous-optimale, et on peut probablement définir d'autres concepts pour définir à quelle point une IA est ouverte, mais je pense qu'essayer d'utiliser le concept du logiciel libre pour ça est une erreur qui ne peut pas mener bien loin, parce qu'il faudrait appliquer une logique absurde qui ne s'applique pas du tout aux autres programmes informatiques.

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5 (+2/-0).

    Trop tard pour modifier, j'ai fais une erreur évidente : pour les "média" (style images), la GPL impose le format "préféré" pour la modification, donc mon exemple est confus, toutes mes excuses. J'aurais dû vouloir dire 1) le libre permet de distribuer des images sous format png (pas la GPL, mais la GPL est clairement une exception), et 2) ça ne s'applique au'aux média, et pas aux données de manière générale, même sous GPL.

    Du coup, si les poids d'un réseau de neurones sont données dans un format natif (je ne sais pas en fait comment ces poids sont stockés en général, bases de données, fichiers texte, xml?), c'est clairement le format qui peut être importé ou exporté par l'algorithme d'entrainement, et j'ai l'impression que c'est exactement ce qui est demandé par la GPL.

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5 (+2/-0).

    Mais pas sur des parties jouées par des humains, si je me rappelle bien. Donc il s'est "auto-entrainé".

  • [^] # Re: IA = code + données

    Posté par  . En réponse à la dépêche Une intelligence artificielle libre est-elle possible ?. Évalué à 5 (+2/-0). Dernière modification le 27 février 2025 à 12:21.

    Un réseau de neurone sans les données d'entraînement ni les soft, c'est comme un binaire

    Bof, est-ce que ça ne serait pas plutôt un jeu avec le moteur de jeu distribué sous GPL et les données distribuées dans un format exploitable (png, jpg, etc) mais pas dans le format natif (svg…)? Ou est-ce que toute analogie est incomplète et qu'il ne faut pas raisonner comme ça?

    J'ai l'impression que l'application de la définition d'un logiciel libre suppose que tu doives disposer de toutes les informations nécessaires pour recréer l'exécutable sur ta machine, donc techniquement, le code source du réseau et les poids. Les poids ont été déterminés à partir d'une procédure d'entrainement, qui est quelque chose qui s'est déroulée en amont, qui a nécessité des données et d'autres logiciels, mais qui ne sont pas nécessaire à l'exécution du logiciel.

    D'une manière générale, la GPL n'est pas transitive quand on parle de données. Tu peux par exemple créer des images avec Photoshop et d'inclure les png dans un jeu libre, ça ne contrevient pas à la GPL. Tu peux même ne rien dire sur la manière dont les png ont été générés, tu n'as pas à fournir ni le nom, ni les sources du logiciel que tu as utilisé.

    Du coup, pour les poids d'un réseau de neurones, le respect de la GPL ne nécessite probablement pas d'expliquer d'où ils sortent: quel algorithme, quelles données d'entrainement, quelle procédure d'entrainement… Tout ça ne semble pas faire partie des informations requises par la GPL, parce qu'on parle de données d'entrée du programme, et pas du programme en lui-même.

    Bien sûr, un tel réseau de neurones, distribué sous licence libre avec les poids mais sans information sur la procédure d'entrainement, ne serait pas transparent. Mais transparent et libre, ça n'est pas la même chose: tu peux être transparent et non-libre (par exemple si tu distribues les sources sous une licence qui ne permet pas la redistribution des versions modifiées), et tu peux être libre et non-transparent, par exemple des trucs dans l'esprit de

    double expexpx(double x) { 11956.81*x-22295.44; } // This does the job
    dans ton code (c'est l'extension linéaire de la fonction autour de x=2, mais si tu ne le sais pas tu ne peux pas deviner d'où viennent les coefficients).

    Demander les données d'entrainement et l'algo sous licence libre, en prétendant qu'autrement c'est du faux libre, c'est aller plus loin que la définition du libre. On a le droit, bien sûr, de dire que les définitions actuelles du libre ne sont plus adaptées et qu'il faudrait une GPLv4 par exemple (y compris pour essayer de définir une licence pour ce qui sort des IA entrainées par des données libres), mais ça n'est pas la même chose.

    Je me suis toujours méfié des discussions sur l'"esprit du libre". L'esprit du libre, c'est d'avoir un bugtracker, c'est d'avoir une communauté ouverte, c'est seulement le copyleft, c'est d'accepter les pull request… Rien dans le libre n'impose une quelconque "pureté", et cette course à la pureté finit toujours mal, parce qu'on trouve toujours des trucs qui ne sont pas assez purs (un logo ou une marque déposés, l'autorisation de plug-ins propriétaires, des blobs binaires dans les drivers…). Je n'ai rien contre un club des purs qui s'entre-écharpent pour savoir qui est le plus à même de représenter l'esprit de l'essence du libre, mais personne n'a la légitimité de prétendre qu'un truc qui respecte les quatre libertés et/ou une licence considérée comme libre n'est "pas libre".

  • [^] # Re: DaLinuxFrenchPage

    Posté par  . En réponse au lien Cacher un message dans un emoji comme 🔥󠄴󠅑󠄼󠅙󠅞󠅥󠅨󠄶󠅢󠅕󠅞󠅓󠅘󠅀󠅑󠅗󠅕. Évalué à 7 (+4/-0).

    Note : le moteur de Firefox déteste ce genre de blague, par contre tout ce qui est basé sur Chromium semble le gérer sans trop de souci.

    Il ne faut pas le dire trop fort, parce que si Google commence à coller ça dans les trackers qu'il affiche sur 99% des pages internet, Firefox va tomber à 0.1% de part de marché en 1 semaine…

  • # Bug dans la norme?

    Posté par  . En réponse au lien Cacher un message dans un emoji comme 🔥󠄴󠅑󠄼󠅙󠅞󠅥󠅨󠄶󠅢󠅕󠅞󠅓󠅘󠅀󠅑󠅗󠅕. Évalué à 9 (+6/-0).

    Est-ce que cela a un sens d'autoriser une succession infinie de "variation selectors" pour chaque caractère?

    Dans tous les cas, il semble assez facile pour une implémentation de couper la liste à un nombre raisonnable, pour au moins éviter les conséquences sur les perfs d'affichage.

  • [^] # Re: Après le point médian...

    Posté par  . En réponse au lien Le Point applique les méthodes de l'extrême droite pour faire taire un contributeur de Wikipédia . Évalué à 4 (+5/-4).

    le Point Godwin, en tout cas.

  • [^] # Re: L’imprégnation des esprits ?

    Posté par  . En réponse au lien Debout pour les sciences, nécessité de défendre l’intégrité scientifique et combattre désinformation. Évalué à 0 (+0/-3).

    Note que les 3% du PIB c'est pour la recherche totale (publique + privée). Quand tu regardes les statistiques au niveau Européen, la recherche publique en France est à peu près au niveau des autres pays (pas au-dessus, on est bien d'accord, 0.8% à 0.9% du PIB), c'est la recherche privée qui est en retard, malgré le CIR et les cadeaux fiscaux.

    Depuis 25 ans elle démantèle lentement ses institutions de recherche.

    Pas toutes, et c'est caricatural de parler de démantèlement. La France a plein de problèmes avec ses institutions de recherche publiques, à la fois pratiques et idéologiques. Elle n'arrive pas à financer ses universités, elle n'arrive pas à leur donner le rôle qu'elles devraient avoir par rapport aux écoles d'ingénieur, elle n'arrive pas à décider quoi faire avec les what millions d'universités dans les villes moyennes qui ne pourront jamais mener une recherche efficace, elle n'arrive pas à intégrer les docteurs à la place qui leur revient sur le marché du travail, elle n'arrive pas à donner une ligne claire au CNRS, elle n'arrive pas à gérer la masse salariale (les chercheurs coûtent trop cher mais sont trop mal payés), ni la pyramide des âges (avec les décalages des départs en retraite), ni les carrières complexes (impossible de recruter un fonctionnaire après 40 ans), elle n'arrive pas à gérer l'enfer bureaucratique qu'elle a elle-même crée, elle n'arrive pas à simplifier le mille-feuille administratif, son traitement des fraudes scientifiques est moyen-âgeux, il n'y a aucun traitement des conflits d'intérêt… Il y a plein de problèmes dans la recherche, mais globalement, les indicateurs ne sont pas mauvais. La productivité est correcte, la formation universitaire est de bon niveau, certaines institutions phares sont très visibles, certaines disciplines (maths, pĥysique) sont à la pointe, les conditions de travail pour les chercheurs sont assez attractives pour les étrangers, on sort assez efficacement de la culture du mandarinat (notamment par l'attribution directe des financements aux chercheurs sans passer par les directeurs de labo), il y a en France des équipements de pointe et des projets d'équipements de pointe (surtout pour les physiciens, qui raffolent de ces gros équipements qui coûtent des milliards et que les politiques aiment bien inaugurer)… Bien sûr, quand un secteur comme ça évolue, il y a des perdants, des unités qui disparaissent, des secteurs peu performants qui sont abandonnés ou restructurés, ou redirigés vers des occuppations plus visibles (recherche appliquée, enseignement…), puisqu'une réforme à budget stable (ou en légère décroissance) ne va pas bénéficier à tout le monde. Dans tous les cas, l'idée d'une recherche publique "démantelée" me semble mal refléter la situation générale; si tu fais de la phyisque des particules ou de l'algorithmique en IA dans un grand établissement, tu n'es pas du tout démantelé. Si tu fais des sciences sociales à l'université de Trifouillis les Oies, par contre, oui, là c'est sûr que tu es démantelé.

  • [^] # Re: Equilibre

    Posté par  . En réponse au journal Wikipédia:Lettre ouverte : non à l'intimidation des contributeurs bénévoles. Évalué à 4 (+2/-1).

    Si tu me qualifie de gauchiste, je pourrais toujours crier à la calomnie ça n'en sera pas moins vrai.

    Wikipédia n'a pas vocation à affirmer des vérités, mais à rapporter un point de vue neutre. Tu peux par exemple reprendre les éléments de langage du journal ("Il se qualifie comme conservateur et identitaire" par exemple, je ne suis pas très au fait du vocabulaire alternatif utilisé par l'extrême droite), en le pondérant par une phrase dans le style "mais sa ligne éditoriale est souvent qualifiée d'extrême droite, voire d'islamophobe, par d'autres médias", ou quelque chose d'équivalent.

    Ça n'est pas un hasard si c'est dans les principes fondateurs de Wikipédia, c'est que si c'est écrit comme ça, il y a beaucoup moins de raisons de se plaindre.

  • [^] # Re: L’imprégnation des esprits ?

    Posté par  . En réponse au lien Debout pour les sciences, nécessité de défendre l’intégrité scientifique et combattre désinformation. Évalué à 4 (+2/-1).

    Mais non, mais c'est juste que je ne vois pas l'intérêt de s'offusquer pour le principe. À qui s'adressent ces documents? Les graphiques illustrent des choses qu'on sait très bien, mais ils les illustrent d'une manière que je ne trouve pas informative, et ça me gonfle. On ne peut pas se prétendre scientifique le jour, et militant le soir, en partant du principe que la rigueur du raisonnement, ça ne vaut pas pour les activités militantes.

    Si tu veux parler de l'effort de recherche, alors tu dois regarder l'évolution des équivalents temps plein ou de la masse salariale, pas des seuls recrutements. C'est complètement trivial, tu peux réduire tes recrutements tout en augmentant ta masse salariale, ça dépend de la pyramide des ages, qui reste très déséquilibrée au CNRS. En fonction de la succession des gouvernements, tu as eu une alternance de périodes fastes et moins fastes, et donc la masse salariale fait le yoyo en fonction des départs à la retraite.

    Tu peux aussi considérer la totalité de la masse salariale, et pas seulement cette des fonctionnaires. Parce que tu peux très bien augmenter ton personnel sans ouvrir de concours de fonctionnaire. Évidemment, idéologiquement, tu peux trouver ça bien ou mal, mais la question est assez indépendante de l'investissement dans la recherche (à moins d'imaginer par essence qu'un fonctionnaire est un meilleur chercheur, ce qui reste quand même assez douteux). Ce que le graphique montre, ce n'est pas une diminution de l'investissement public dans la recherche, c'est un changement progressif de modèle, avec une baisse du recrutement des cadres (fonctionnaires) de la recherche, qui vont chacun devoir financer leurs équipes par d'autres moyens (appels à projets, partenariats). À comparer par exemple avec le budget de l'ANR https://anr.fr/fileadmin/documents/2024/page-budget-2023-fig1.jpg

    Au fond, quelle est la raison du changement de modèle? Bon, c'est évidemment multifactoriel, mais c'est principalement parce que l'État n'a pas confiance dans l'efficacité du modèle "traditionnel" de la recherche française. Pour plein de raisons plus ou moins idéologiques ou plus ou moins objectives, mais en gros, l'idée c'est que l'argent public serait mieux dépensé dans des groupes de recherche temporaires qui se concentreraient sur un projet scientifique pendant 4 ou 5 ans avant d'être refondu avec des contours différents pour un autre projet. Les labos et instituts de recherche seraient les hôtes de ces projets et leurs fourniraient les moyens de travailler, mais sans autre politique de recherche que de favoriser l'épanouissement scientifique des chercheurs pendant le temps de leur projet.

    Sans surprise, c'est déja comme ça que fonctionnent les instituts scientifiques qui sont sur le devant de la scène (institut Pasteur, collège de France, etc). De nombreux chercheurs qui ont une activité scientifique soutenue n'ont pas de problèmes majeurs à être financés et à recruter les membres de leurs équipes selon leurs besoins au fil de leurs projets; ils ont par contre besoin d'un environnement scientifique (administration, locaux) et d'un accès à des équipements parfois coûteux; les enseignant-chercheurs cherchent à se débarrasser de leurs charges d'enseignement en les "rachetant" grâce au budget des projets, etc. Ce que ne dit pas par exemple les graphiques de RoguESR, c'est quelle part des chercheurs recrutés au CNRS ont déja tout ou partie de leur salaire de jeune chercheur financé par une source extérieure (typiquement, contrat européen). Ça doit énormément dépendre des sections du CNRS, mais je pense que la norme s'établit autour de 50%. Ce modèle définit un statut du chercheur plus proche d'une profession libérale que d'un statut de fonctionnaire.

    Je comprends les critiques du modèle "moderne" de la recherche, mais je ne comprends pas quel modèle on propose à la place. Un monde où on recrute toujours plus, où tout le monde a des crédits pour fonctionner, où la recherche n'est évaluée ni en terme de productivité, ni en terme de retombées pour la société, où la liberté académique est totale… En gros, il faudrait que ça soit les chercheurs qui aient le contrôle du robinet du pognon, et qu'ils n'aient pas de comptes à rendre, parce que leur statut garantirait automagiquement à la société que ce que le chercheur veut, c'est ce qui est bon pour la société. À part donner envie aux dirigeants de restreindre encore plus les marges de manœuvre, je ne vois pas ce que ça peut apporter.

    Ça parait tellement caricatural que je trouve ça contre-productif. Si on veut la la liberté académique, alors c'est normal de devoir négocier avec la société. Si on veut plus de PIB vers la recherche, c'est normal qu'il y ait des contreparties, notamment sur les retombées économiques. Si on veut des emplois sécurisés, alors c'est normal d'être évalués. C'est normal que le gouvernement et l'État aient le contrôle du robinet de pognon, c'est normal que la politique de la recherche dépende du résultat des élections. Ça ne fait pas forcément plaisir, mais c'est normal.

  • [^] # Re: L’imprégnation des esprits ?

    Posté par  . En réponse au lien Debout pour les sciences, nécessité de défendre l’intégrité scientifique et combattre désinformation. Évalué à 4 (+1/-0).

    Qu'est-ce qui te fait dire qu'ils ne savent pas de quoi ils parlent (ils ou elles)

    J'ai été très explicite : s'ils n'étaient pas au courant de la réservation des postes DR en CID 50 en 2021, c'est qu'ils n'étaient pas au fait de la manière dont les concours avaient été organisés cette année-là. Aller raconter "ahlala c'est un scandale on recrute des bureaucrates", c'est vraiment à côté de la plaque.

    Ce qui m'intéresserait bigrement ce serait de savoir quelles sont tes compétences qui te font dire que ces personnes ne savent pas de quoi elles parlent.

    À ton avis?

    Le problème, ça n'est pas de ne pas comprendre les rouages techniques des recrutements dans les EPST, parce que c'est très compliqué sans être à l'intérieur. Le problème, c'est de l'ouvrir et de se scandaliser sans avoir compris qu'il n'y avait aucune raison à se scandaliser. Ça ne défend pas du tout la recherche publique.

  • [^] # Re: L’imprégnation des esprits ?

    Posté par  . En réponse au lien Debout pour les sciences, nécessité de défendre l’intégrité scientifique et combattre désinformation. Évalué à 0 (+0/-3).

    Une chose quand même: il y a quelque chose qui est factuellement faux dans ce lien; les auteurs ne pouvaient pas savoir sans connaître les arcanes du CNRS, mais ça prouve quand même qu'ils racontent n'importe quoi parce qu'ils ne savent pas de quoi ils parlent : les 13 postes de directeur de recherche affiliés à la section "Gestion de la recherche" en 2021 ne sont absolument pas destinés à des fonctions bureaucratiques, il s'agissait de postes mis en réserve pour des recrutements au niveau DR dans les sections (en fait c'est un bricolage technique pour contourner une rigidité administrative).

    Donc oui, c'est un fait, la recherche publique recrute de moins en moins, c'est contesté en interne parce que les chercheurs pensent que la recherche devrait être mieux financée, et c'est un arbitrage budgétaire assumé par les gouvernements. Il n'y a pas de "scandale" à proprement parler, c'est une question politique (donc débat public, élections, etc).

  • [^] # Re: L’imprégnation des esprits ?

    Posté par  . En réponse au lien Debout pour les sciences, nécessité de défendre l’intégrité scientifique et combattre désinformation. Évalué à 4 (+2/-1).

    L'argument est en effet paradoxal, et traduit aussi des désaccords profonds dans les différentes communautés scientifiques.

    Il est de notoriété publique que l'évaluation des projets et des bilans scientifiques sont extrêmement complexes. Bon, pour les projets, c'est même objectivement impossible, puisqu'en recherche fondamentale, il est évident qu'on ne peut pas savoir a priori si une expérience va fonctionner, puisque savoir si ça fonctionne est le but même du projet. On ne peut donc évaluer que l'intérêt d'avoir une réponse à cette question (quelle que soit la question).

    Pour les bilans, c'est plus discutable. En fait, il y a une pression très forte des institutions et des citoyens pour une transparence et une évaluation des dépenses publiques, et l'évaluation bureaucratique de la recherche est une réponse à cette question. Le problème c'est que là encore l'évaluation est complexe. Soit elle est objectivée par des indicateurs chiffrés (nombre de publications, de brevets, d'étudiants formés, etc), avec les objections classiques liées à la manipulation des indicateurs, soit elle est confiée à des pairs spécialistes du domaine, en devenant par là-même plus subjective et plus coûteuse pour la communauté (puisque ça mobilise du temps d'expertise qui pourrait être destiné à la recherche). La situation actuelle est mixte; les chercheurs et les unités de recherche sont évalués par des experts sur la base de dossiers qui compilent les fameux indicateurs.

    Ce qu'il ne faut pas perdre de vue, c'est que la génération de chercheurs qui occupent actuellement les postes à responsabilité dans la recherche publique est une génération qui a justifié son succès scientifique par ces indicateurs bureaucratiques (et par leur succès aux appels à projets). Il semble donc assez illusoire d'imaginer qu'ils abandonnent facilement les indicateurs chiffrés alors même qu'ils leur doivent leur position sociale!

    Pour moi, poser cette question comme une question de principe est un mensonge bienveillant, basé sur la légende du chercheur de génie qui ne saurait pas publier. Comme partout, une telle situation n'est pas logiquement impossible et on pourrait forcément trouver quelques exemples statistiquement rares (par exemple en mathématiques, qui a tendance à favoriser les traits de personnalité inhabituels), mais à mon avis c'est une mauvaise perspective. Ce qui se passe, c'est qu'un bon chercheur bien implanté dans sa discipline, reconnu par ses collaborateurs et à l'international, n'a absolument aucun mal à optimiser ses indicateurs chiffrés. La réelle question c'est plutôt si c'est un bon calcul d'utiliser son expertise ou son énergie à des tâches plutôt formelles au détriment de sa créativité scientifique. A contrario, les mauvais chercheurs sont peu productifs dans tous les domaines. Ce n'est malheureusement pas des vases communicants, les problèmes sont en général assez liés et finissent par créer des cercles vicieux (mauvaise recherche -> peu de résultats intéressants -> peu de publications -> peu de financements). Ces cercles vicieux sont vécus comme des injustices par les intéressés, mais au final rien n'indique que les indicateurs de productivité ne reflètent pas la qualité des résultats scientifiques obtenus (hors fraude scientifique, évidemment).

    Tout ça pour dire qu'on peut admettre l'imperfection des indicateurs bibliométriques sans verser dans l'idée qui me semble assez absurde que l'absence de publication pourrait être interprétée comme un signe positif. Le problème de l'évaluation bibliométrique n'est pas qu'elle classe mal (parce qu'en fait elle classe plutôt bien), mais c'est qu'elle détourne les ressources vers l'optimisation du critère, ce qui n'est pas forcément souhaitable.

  • [^] # Re: Clair

    Posté par  . En réponse au journal Linus répond à la controverse sur R4L (Rust pour Linux). Évalué à 5 (+3/-1).

    Mouais, c'est une branche out of tree comme on dit, comme l'a été pendant longtemps la branche Linux-rt par exemple, à mon sens ce n'est pas un fork.

    Linus a dit en 2011 "Android is a Linux fork", donc on peut discuter éternellement si à ton sens c'est un fork, mais c'est légitime de dire qu'Android a été un fork de Linux (en tout cas, c'était l'avis du responsable de Linux à ce moment, donc c'est un avis qui me semble tout à fait crédible).

    Donc oui, Linux a été forké, et le fork a été progressivement réintégré dans le projet par des efforts des deux côtés. "Fork avorté", "faux fork", "fork temporaire", tu peux l'appeler comme tu veux, mais c'est faux de dire que Linux n'a jamais été forké.

  • [^] # Re: Clair

    Posté par  . En réponse au journal Linus répond à la controverse sur R4L (Rust pour Linux). Évalué à 4 (+1/-0).

    Ce n'est donc pas un fork car ils se basent toujours sur la branche principale pour fournir de nouvelles versions de leur côté

    Ça me semble tendu de définir le fork de cette manière, parce qu'il est quand même assez courant que les forks intègrent au fil de l'eau les corrections de bugs ou autre issus de la branche principale…

    Il me semble qu'Android était né d'un fork assumé, par la volonté de pouvoir développer vite sans devoir gérer l'intégration des patches dans la branche principale. Mais c'était aussi clair que le fork n'avait pas forcément vocation à être défintif, puisque l'espoir de convergence était réel.

    Tiens, grâce à un ternet, j'ai retrouvé ça, par exemple dans https://www.zdnet.com/article/linus-torvalds-on-android-the-linux-fork/ qui date de 2011:
    "So, for the next few years, Android, while still a Linux, is indeed a Linux fork. In the long run, though, Torvalds is sure that Android will return to the mainstream Linux kernel. For better or worse though that may not be until 2016. Fortunately, for all end-users and almost all Android developers none of this will make any real world difference."

    Donc, ça compte, ça ne compte pas comme un fork… C'est quand même pas si net. C'est un ex-fork, peut-être.