Renault a écrit 7178 commentaires

  • [^] # Re: J'apprécie certaines blagues

    Posté par  (site web personnel) . En réponse au journal Au sujet des blagues du 1er avril. Évalué à 4 (+1/-0).

    Très souvent complètement absente.

    Je ne sais pas sur quels sites d'actualité tu traines, mais je trouve cette information la quasi totalité du temps.
    Cela n'est pas toujours évident à l'identifier mais ça se trouve en général.

    Quand elle est là, elle est parfois en petit tout en bas.

    Oui.

    Quand elle est là, elle n’est généralement pas fiable : certaines dates sont automatiques pour afficher le jour (ça améliore le SEO). D’autres réflètent visiblement la dernière mise à jour (parfois des années après le post initial, sans doute pour corriger une typo).

    De même, je ne trouve pas cette pratique très souvent sur les sites d'actus. Ou alors c'est clairement identifiable en mode "mise à jour le, publié le".

    Pour moi le principal problème sur les sites d'actu c'est sa mise en valeur plus que sa présence.

    (perso, c’est d’ailleurs pour ça que je mets la date en grand et gras au début de chaque article de mon blog)

    Et c'est bien car je pense que c'est important.

  • [^] # Re: J'apprécie certaines blagues

    Posté par  (site web personnel) . En réponse au journal Au sujet des blagues du 1er avril. Évalué à 3 (+1/-1).

    Je crois que le truc qui est le plus dérangeant avec Internet c’est surtout qu’on ne lit pas forcément un article le jour de sa parution. Avec les journaux papiers, t’achetais le journal du jour et tu le lisais très rarement le lendemain. Sur le web, est un article peut être lu complètement hors contexte des années plus tard.

    Lire la date d'un article est pourtant un réflexe à acquérir.
    Même en mettant de côté l'aspect du 1er avril, un article peut être vieux (et donc faux ou trop daté pour être pertinent dans ce qu'on cherche), ou manquer de recul par rapport à un événement en cours à l'époque (ce qui peut être ce qu'on recherche par ailleurs).

  • [^] # Re: Debian?!?

    Posté par  (site web personnel) . En réponse au journal Xz (liblzma) compromis. Évalué à 9 (+6/-0).

    Pour information, Lennart explique bien que le protocole de notification est trivial pour justement être géré à la main plutôt que de dépendre de libsystemd pour juste cette fonction : https://lists.fedoraproject.org/archives/list/devel@lists.fedoraproject.org/message/VIC24J7M46BW2QSQDXBNGNUS4QXH4ZBB/

    Donc en gros c'est le choix de xz ici d'avoir privilégié une dépendance en plus pour si peu plutôt que de "refaire à la main".

  • [^] # Re: Combo glibc/systemd

    Posté par  (site web personnel) . En réponse au journal Xz (liblzma) compromis. Évalué à 4 (+2/-1).

    de cmake en plus de make & autotools ;

    Car bizarrement les systèmes de builds des distros, systèmes embarqués et autres composants sont variés, diversifier les prises en charge permet de s'assurer une bonne compatibilité d'intégration tout en ayant une compatibilité ascendante avec les projets utilisant des outils plus anciens.

    C'est un choix qui se défend même si un jour se passer de autotools pourrait être la solution.

    de m4 de la mort ?

    m4 est nécessaire avec autotools. Malheureusement.

    de tests avec des scripts shell au lieu d'un cadriciel de test unitaire ? ;

    Il n'y a pas que les tests unitaires dans la vie et utiliser des scripts pour ça n'a rien de sale même si avoir une intégration avec le code comme on peut le faire avec gtest en C++ est appréciable.

    Bref, c'est plus compliqué que tu ne sembles le penser. Après on peut souhaiter un nettoyage pour supprimer les vieux bouts mais bon ne sous estime pas la capacité des utilisateurs à râler car on a supprimé leur prise en charge de leur vieillerie aussi et qu'on accuserait vite d'être de "l'obsolescence programmée".

  • [^] # Re: Mageia est sauf

    Posté par  (site web personnel) . En réponse à la dépêche XZ et liblzma: Faille de sécurité volontairement introduite depuis au moins deux mois. Évalué à 4 (+1/-0).

    Surtout qu'ici avoir ou non la porte dérobée revient à inclure ou non une version spécifique d'un logiciel.
    C'est donc du hasard, parfois la distribution aura la bonne version parfois pas. On ne peut pas le prédire et aucune politique de distribution n'est bonne à cet égard. Donc en effet fanfaronner que X n'a pas la faille est ridicule dans ce contexte.

    Là où la distribution peut jouer c'est en compilant et en intégrant le composant avec d'autres mesures de sortes que une faille ou une porte dérobée n'ait pas d'effets. C'est là où une distribution peut faire la différence à ce sujet, mais ce n'est pas ce qui nous intéresse ici.

    Et je ne crois pas que la politique de Mageia soit justement très pro-sécurité. En même temps c'est un sujet complexe et même de grosses distributions avec plus de moyens peuvent faire mieux.

  • [^] # Re: conflit d'intérêt

    Posté par  (site web personnel) . En réponse au journal Les sms internet et ta mère . Évalué à 6 (+3/-0).

    Ou pour la sécurité sociale.

  • [^] # Re: À la découverte de Silverblue

    Posté par  (site web personnel) . En réponse à la dépêche Fedora Linux 40 Beta est disponible pour les tests. Évalué à 4 (+1/-0).

    Oui bien sûr, mais au delà de ça, des mises à jour classiques qui rendent le boot non fonctionnel chez Fedora sans que cela ne soit sous le contrôle de l'utilisateur car tout est allé au bout de la procédure, cela arrive, ce ne sont pas les rapports de bogues ou les questions sur le forum qui diront le contraire. Car il y a toujours des configurations logicielles et matérielles qui rendent ces étapes difficiles à garantir pour tout le monde, et avec suffisamment d'utilisateur il y en a toujours qui de temps en temps ont un pépin.

    Donc avoir la possibilité de revenir à un état stable de manière immédiate c'est vraiment cool.

  • [^] # Re: À la découverte de Silverblue

    Posté par  (site web personnel) . En réponse à la dépêche Fedora Linux 40 Beta est disponible pour les tests. Évalué à 3 (+0/-0).

    En moyenne c'est assez stable, mais des problèmes il y en a toujours. En particulier lors des mises à niveau.

  • [^] # Re: À la découverte de Silverblue

    Posté par  (site web personnel) . En réponse à la dépêche Fedora Linux 40 Beta est disponible pour les tests. Évalué à 5 (+2/-0).

    Cela ne m'étonnerait pas que dans le futur on ajoute une couche de plus pour apporter la flexibilité manquante, avoir quelque chose du genre :

    • Système minimal avec rpm-ostree : chargeur de démarrage, noyau, systemd, bibliothèques de base, environnement de bureau et écran de login (pas plus) ;
    • Système classique pour installer des paquets en plus, plutôt orientés utilitaires ou outils bas niveaux pour le développement ou les systèmes qui à priori ne compromettent pas le boot et pour qui l'isolation ne fonctionne pas bien ;
    • Flatpak pour les applications graphiques ;
    • Conteneurs avec toolbox pour ceux qui veulent des environnements de développement plus flexibles que ce qui est proposé par Fedora, notamment concernant les versions des langages de programmations et des outils associés.

    Cela serait cohérent avec la conception derrière et dans la continuité de Fedora.next en un sens. Si jamais du moins aucune solution satisfaisante n'est trouvée autrement.

  • [^] # Re: superbe initiative de huggingface

    Posté par  (site web personnel) . En réponse au journal Votre code dans un modèle d'IA. Évalué à 7 (+4/-0).

    Pour un truc comme Copilot, il faut donc prouver que le code issu du logiciel est dérivé d'un bout de code de la base de données.

    Même pas dans la BDD.

    Copilot reproduit par accident un bout de code identique qui n'était pas dans son apprentissage, cela violerait la loi. De la même façon que si par hasard Midjourney reproduit une oeuvre de pop culture sans pour autant l'avoir dans son entrainement aurait le même problème. C'est peu probable, mais ça montre qu'on n'a pas besoin d'avoir les données d'apprentissage pour faire condamner. Le fait que ce soit dans l'apprentissage ou non pourrait influer probablement la sanction mais ne change pas la violation de la loi.

    Ça me semble impossible avec un LLM correctement paramétré.

    Je te trouve bien confiant sur ce point quand on voit justement ce que tous les LLM font à ce sujet jusqu'à aujourd'hui. En dehors de supprimer toute référence lors de l'apprentissage c'est difficile à éviter en tout cas à ce jour.

    Encore une fois, la propriété intellectuelle ne se dilue pas, la contrefaçon est binaire : 1% de contrefaçon, ça n'existe pas; il existe un seuil de divergence au-delà duquel l'auteur initial n'a plus de droits à faire valoir.

    Si si.
    Prends une image couverte par le droit d'auteur, prends en 50% à l'identique ou presque et change le reste. Tu tomberas sous le coup de la loi même si 50% est de toi. De même pour un morceau de films, livres, musique, etc.

    Le code n'est pas différent, si tu prends quelques fonctions non triviales directement d'ailleurs, tu peux avoir des problèmes même si le reste de ton code est fait maison.

    Au passage, il y a aussi une bizarrerie à résoudre : dans oeuvre dérivée, il y a "oeuvre". Or, il est admis que la sortie d'un LLM n'ouvre pas de droits d'auteurs parce que ça n'est pas une oeuvre de l'esprit. Il n'y a donc pas d'appropriation des droits d'auteurs par quiconque.

    Il n'y a pas besoin, cela n'autorise pas les LLM à générer tout ce qu'ils veulent et on le voit bien avec les affaires en cours.

  • [^] # Re: Certains sites (très utilisés) sont 100x plus lents que PUBG

    Posté par  (site web personnel) . En réponse au lien How web bloat impacts users with slow devices. Évalué à 3 (+0/-0).

    Cela ne veut rien dire ;)

  • [^] # Re: Certains sites (très utilisés) sont 100x plus lents que PUBG

    Posté par  (site web personnel) . En réponse au lien How web bloat impacts users with slow devices. Évalué à 4 (+1/-0).

    Ils utilisent sans doute une techno qui permet de coder l'application mobile et son versant web avec un minimum de duplication. Ce genre d'outils ne génère pas un code HTML particulièrement léger.

  • [^] # Re: De considérer les politiciens comme ignorants

    Posté par  (site web personnel) . En réponse au lien [HS] « Tout sur l’économie, ou presque : Pour comprendre vraiment ce qui cloche dans le système ». Évalué à 10 (+7/-0).

    Beaucoup de politiques sont des brutes en économie,

    Certains, probablement, beaucoup ça reste à démontrer.

  • [^] # Re: superbe initiative de huggingface

    Posté par  (site web personnel) . En réponse au journal Votre code dans un modèle d'IA. Évalué à 4 (+1/-0).

    C'est le point principal et je pense que cela passera. Si c'est possible de le faire en fair use toute la culture incluse dans les IA sera anglo-saxonne.

    Le fair use pour s'entrainer c'est une chose, le fair use dans le résultat c'est beaucoup moins probable et ça va être un peu le nerf de la guerre.

    Si les IA débitent facilement des œuvres contrefaites cela peut poser un problème dans le cas où la justice considère que l'entreprise doit mettre en place des mesures sous peine de sanctions. Et ce n'est pas un sujet trivial. Cela pourrait totalement mettre à mal le fonctionnement de ces IA justement.

    C'est donc à voir, la justice va se pencher dessus mais j'ai de gros doute que ça passera crème sans efforts de la part des entreprises concernées.

  • [^] # Re: superbe initiative de huggingface

    Posté par  (site web personnel) . En réponse au journal Votre code dans un modèle d'IA. Évalué à 3 (+0/-0).

    Les violations de copyright c'est pas vraiment dépendant du moyen technique utilisé pour fabriquer l'œuvre je crois.

    Oui.

    Je pense que si tu reproduit à l'identique une grande part d'un code il y a de toute façon question à se poser, ça n'a aucune chance de se produire au hasard hors de toutes petites portions.

    C'est l'idée oui.

    Après si tu donnes un prompt assez précis pour que ça se reproduise, on peut soupçonner que le prompt avait pour but de reproduire l’œuvre …

    Pas besoin, il y a eu des cas où des termes pourtant vagues et génériques permettait de ressortir des visuels de la pop culture. On peut imaginer le cas où tu demandes un générateur de labyrinthe et il te ressort un code proche (voire identique) à un code existant.

    Et puis pour démontrer que le modèle est bel et bien généré par le jeu d'apprentissage prétendu ça doit pas être si simple, faut un apprentissage qui soit reproductible, c'est un challenge https://neptune.ai/blog/how-to-solve-reproducibility-in-ml Pas dit que ce soit la priorité des industriels d'avoir une reproductibilité digne d'une science ouverte et reproductible, c'est pas leur objectif numéro 1.

    Ici pas besoin, si quelqu'un identifie une correspondance, il y a violation. Pas besoin de prouver que c'était dans le jeu d'apprentissage. Après à l'entreprise de dire si c'était présent ou non dans l'apprentissage, on peut supposer que la justice ne traite pas les cas de manière identique.

  • [^] # Re: superbe initiative de huggingface

    Posté par  (site web personnel) . En réponse au journal Votre code dans un modèle d'IA. Évalué à 8 (+5/-0).

    Ce qui est sûr c'est que si le modèle recrache tel quel du contenu sous copyright, alors il y a violation de droit d'auteur même si la phase d'entrainement est valide juridiquement (en admettant qu'elle le soit).

    C'est une grosse limitation pour ces outils qui vont devoir y mettre des moyens de dingue pour s'assurer qu'ils ne violent pas le droit d'auteur dans ces conditions. Le plus simple est effectivement de limiter les données d'entrainement à ce qui est permis, cela limite les risques et en cas de coïncidence (sortir un code protégé mais qui n'est pas dans les données d'entrainement) ils pourraient démontrer que c'est une coïncidence et non une violation de copyright.

  • [^] # Re: Network Manager CLI

    Posté par  (site web personnel) . En réponse au journal [ HS ] ... enfin, pas tant que ça.. Évalué à 6 (+3/-0).

    Euh tu sais que la configuration de NetworkManager que tu l'édites à la main, que tu utilises la GUI de GNOME ou nmcli cela revient au même ? Les fichiers sont stockés au même endroit et de la même façon, la conf est identique… Et heureusement, ce ne sont que des interfaces utilisateurs différents, le reste de l'outil est le même.

  • [^] # Re: Magré toutes ces âneries, il y a du vrai

    Posté par  (site web personnel) . En réponse au journal [HS] 3 Gigas par semaine .... Évalué à 8 (+5/-0).

    Notons que la TV en direct utilise du multicast pour être distribué sur le territoire national. C'est bien moins coûteux et gourmand que des flux individuels pour la même qualité d'image.

  • [^] # Re: Code sur papier

    Posté par  (site web personnel) . En réponse au journal [HS] 3 Gigas par semaine .... Évalué à 9 (+6/-0). Dernière modification le 19 mars 2024 à 11:23.

    Écrire un algo en pseudo code ne me semble pas très pertinent dans un cadre pro. Dans un contexte scolaire je pense que ça peut avoir du sens car tu apprends.

    Par contre faire la conception sur papier, poser les idées, passer du temps à réfléchir dessus, etc. cela a du sens dans un contexte pro. Après chacun son outil mais je trouve la papier pratique pour cela.

  • [^] # Re: Très cool

    Posté par  (site web personnel) . En réponse au lien Quand l’IA se met à décompiler du binaire. Évalué à 9 (+6/-0). Dernière modification le 19 mars 2024 à 10:51.

    Je trouve, oui. En quoi ça ne serait pas pertinent selon toi ?

    Je veux dire, tout le monde ne connaît pas le sujet, l'article est assez trompeur sur les capacités (je trouve), le manque de recul sur l'IA est assez important en ce moment dans l'esprit de beaucoup de gens, rappeler concrètement les limites ne me paraît pas inutile.

  • [^] # Re: Très cool

    Posté par  (site web personnel) . En réponse au lien Quand l’IA se met à décompiler du binaire. Évalué à 6 (+4/-1).

    Peut être, cela n'est cependant pas trivial et ne peut être déduit avec ce qui a été publié.

    Mon propos n'est pas de dire que l'approche ne mènera à rien dans tous les cas. Je dis juste que ce qui est présenté pour l'instant ne montre rien de si extraordinaire pour justifier un article aussi dithyrambique.

    C'est une preuve de concept, faut creuser la question et pourquoi pas, ça peut donner des résultats intéressants (ou pas).

    C'est un peu comme lire les articles scientifiques de certains présentant des nouveaux matériaux ou traitements médicaux révolutionnaires alors qu'en vrai la plupart n'iront pas plus loin que le labo où la découverte a été publié car finalement c'était une mauvaise piste. Ce n'est pas un mal de communiquer dessus mais je trouve la forme souvent excessive.

    Après c'est Korben, ce n'est pas la première fois qu'il fait ça et typiquement je ne le lis pas pour cette raison.

  • [^] # Re: Très cool

    Posté par  (site web personnel) . En réponse au lien Quand l’IA se met à décompiler du binaire. Évalué à 4 (+2/-1).

    Le seul ajout est celui de tests automatiques mais le taux d'échecs même dans un cas simple est encore très faible.

    Et encore très élevé, pardon.

  • [^] # Re: Très cool

    Posté par  (site web personnel) . En réponse au lien Quand l’IA se met à décompiler du binaire. Évalué à 5 (+3/-1).

    Perso je suis moyennement convaincu, l'article de Korben semble très pute à clic.

    Ce n'est pas inintéressant mais franchement limité à ce stade. De ce qu'on peut en lire (car honnêtement je ne trouve pas que le dépôt apporte beaucoup d'infos sur l'entrainement et les tests). Cela semble travailler sur des fonctions apparemment isolées et relativement triviales (en tout cas, pas d'exemples montrant le contraire), le résultat est déjà obtenu par des outils plus classiques (décompiler du binaire en instruction C avec peu de valeur ajoutée n'a rien d'extraordinairement difficile). Le seul ajout est celui de tests automatiques mais le taux d'échecs même dans un cas simple est encore très faible.

    Alors oui, c'est le début, mais c'est encore la partie simple : le modèle arrivera-t-il à fonctionner sur un programme entier à apporter de la valeur ajoutée comme ça ? Pas sûr non plus. Ce n'est en tout cas pas à ce stade une révolution mais plus une preuve de concept à creuser.

  • [^] # Re: Magré toutes ces âneries, il y a du vrai

    Posté par  (site web personnel) . En réponse au journal [HS] 3 Gigas par semaine .... Évalué à 9 (+6/-0).

    Ce raisonnement dépend de la structure de l'empreinte des coûts environnementaux comme financiers.

    Une infrastructure télécom ce sont beaucoup de coûts fixes, c'est même l'essentiel du prix de la facture. Que tu consommes ou pas tes données, le coût financier et environnemental sera proche. Car il faut maintenir l'infrastructure, les antennes relais, les bornes de distributions, les serveurs, etc.

    D'ailleurs cela se voit bien, quand des offres illimités sont apparus, ils étaient rarement dans les prix haut de gammes des forfaits limités de l'époque. Et aujourd'hui un forfait à 100 Gio en France pour mobile est significativement moins cher que pour la plupart des pays voisin avec des quotas pourtant bien plus bas.

    Pour l'illimité au moins tu ne te poses pas la question, ce mois ci tu consommes plus pour X ou Y raison, aucun problème. Cela a aussi un coût mental de se préoccuper de savoir si on a de quoi tenir le mois, s'il faut acheter plus de data exceptionnellement, si on doit réduire significativement son usage car on ne veut pas payer plus, etc.

  • [^] # Re: Vrai question C'est quoi l'IA ?

    Posté par  (site web personnel) . En réponse au journal Cybersécurité: des chercheurs ont créé un ver qui attaque l’IA. Évalué à 4 (+1/-0).

    Ça peut, poruquoi pas.

    Bah non, si du moins l'outil qui parse ces déclarations n'en est pas une.

    Ce qui est pertinent c'est de considérer la conception et maintenance plus que l'exécution, une IA reste un programme comme un autre à la fin, la différence se situe en amont lors de son élaboration.

    La conception fait que l'algo exécutée par l'IA n'est à priori pas connu dans le détail par ses concepteurs et utilisateurs (sinon autant écrire l'algo directement à la main, c'est plus fiable et efficace). L'algo est élaborée de manière dynamique en fonction de comment il a été entrainé et des tâches qu'il doit mener.

    Cela rend aussi la maintenance délicate, difficile d'apporter des garanties fortes de fonctionnement car le détail de l'algo n'est pas connu, et corriger des défauts à la main est difficile (un peu comme altérer un binaire sans le code source, c'est faisable mais délicat). Il faut probablement ajouter des éléments lors de la conception et entrainement en croisant les doigts que cela règle le problème sans en introduire d'autres.

    Le HTML ou autres type de documents déclaratifs ne sont pas forcément de la programmation d'une part, et d'autres part le moteur de rendu est un algo conçu et éditable à la main.