GitHub vient d’annoncer le lancement de Copilot, un générateur de code, basé sur « l’intelligence artificiel ».
Le principe est qu’à partir d’un fichier vide, Copilot va vous proposer des bouts de code au fur et à mesure de votre édition. Les vidéos sur la page d’accueil du projet sont assez parlantes, avec seulement le nom et la description d’une fonction, Copilot va automatiquement créer son contenu.
On peut se dire que jusqu’ici « tout va bien », c’est « marrant » et c’est « innovant ». Mais là où ça devient dérangeant, c’est que l’AI a été entraîné sur [du code « publiquement disponible »]( et notamment du code sous GPL:
Once, GitHub Copilot suggested starting an empty file with something it had even seen more than a whopping 700,000 different times during training—that was the GNU General Public License.
Et là tout de suite ça pose la question : est-ce que le code produit par Copilot peut-être considéré comme un travail dérivé de projets GPL et donc est-ce qu’il devrait être placé lui même sous GPL ?
En tout cas, ça montre encore une fois comment le capitalisme se fout du FLOSS qu’il ne voit que comme du travail gratuit et de la maintenance externalisé (je t’envoie ce patch, à toi de le maintenir à vie). Sauf quand ça lui oblige a redistribuer bien sûr, là y a du monde pour bannir les licences copyleft.
La source de ce journal est un fil d’eeveee sur Twitter.
# Pas sur de comprendre
Posté par groumly . Évalué à 10.
J’ai du mal à comprendre le lien entre copilot et cette phrase.
Que copilot ouvre des questions légales difficiles, oui, clairement.
Mais en quoi est ce que copilot montre que GitHub se fout du floss? Surtout appliqué à GitHub qui a hébergé pendant plus d’une décennie la communauté open source pour $0 sur une infra super robuste.
Linuxfr, le portail francais du logiciel libre et du neo nazisme.
[^] # Re: Pas sur de comprendre
Posté par Thomas J. (site web personnel) . Évalué à 3.
Une super occasion pour Richard Stallman de sortir une GPL v4 et revenir sur le devant de la scène !!
En plus, ça s'était si bien passé lorsqu'il avait présenté la v3 !
[^] # Re: Pas sur de comprendre
Posté par Anonyme . Évalué à 10.
GitHub ne vie pas d’amour et d’eau fraîche, ils ont été largement financés par des VC et depuis 3 ans GH appartient à Microsoft, c’est pas non plus une SCOP de ZADistes auto-gérée.
Et puis, s’ils aiment tellement le Libre, il est où le code source de GH ?
Des auteurs choisissent explicitement une licence qui dit « si tu utilise mon code, tu dois redistribuer le tiens » et GH développe un générateur de code basé sur ce travail et disent « allez-y, c’est du code qui n’appartient à personne ».
Regarde le fil de eevee, c’est exactement ce qu’elle dit.
Cette histoire, c’est typique de :
[^] # Re: Pas sur de comprendre
Posté par groumly . Évalué à 8.
Oui, ça c’est la partie « question légales difficile ».
Ce que je te demande c’est d’appuyer ton argument « GitHub en a rien à foutre du libre », parce que depuis 13 ans qu’ils sont la, ils ont toujours été très open source friendly. Leur infra est loin d’être gratuite, et ils la mettent à disposition gratuitement pour les projets libres. Si c’est pas une contribution majeure au libre, je sais pas ce que c’est.
‘Tin t’es sacrément culotté. Tu bosses pour eidos/square enix, proprio de chez proprio, et tu te permet ce genre de remarques à propos de GitHub, qui héberge à l’œil les trois quarts des projets libres de la planète?
0 pointé ton troll.
Linuxfr, le portail francais du logiciel libre et du neo nazisme.
[^] # Re: Pas sur de comprendre
Posté par David Delassus (site web personnel) . Évalué à 10.
Sans parler des Bugtrackers, Wiki, Github Pages, Github Packages (npm, docker, maven, nuget, …), Github Actions, Dependabot, et bien d'autres fonctionnalités qui assurent la qualité d'un nombre incalculable de projets.
Sans oublier qu'ils te permettent d'avoir un nombre infini de projet privé gratuitement. Ce qui est payant en général avec Github, c'est les organisations pour collaborer avec d'autres personnes sur des projets proprio.
Le savais-tu?
Oui non c'est vrai que tout ça montre bien que Github s'en fou du libre :)
https://link-society.com - https://kubirds.com - https://github.com/link-society/flowg
# je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . Évalué à 10. Dernière modification le 01 juillet 2021 à 16:14.
M'est avis que la réponse est oui, tout comme n'importe quel projet libre qui s'inspirerait de code propriétaire se trouverait entacher par la connaissance de ce code.
Mais j'imagine que juridiquement, la réponse doit se trouver à un autre niveau que mon avis :)
<mode zenitram>
Si je ne me trompe pas, dans FLOSS il y a 'L' pour « Libre », donc si tu choisis en tant qu'auteur de conférer cette liberté aux personnes accédant à ton code, pourquoi se plaindre ensuite de la manière dont il est utilisé ? Ou alors tu inclues des clauses limitantes à cette liberté pour satisfaire tes désirs de contrôler ta production et il ne faut plus parler de « Libre ».
</mode zenitram>
La vraie question c'est: où est la liste des logiciels dont le code a été utilisé pour entraîner cette abrutie artificielle ?
J'espère que leur sélection a été rigoureuse, parce que si un seul fichier possède une licence différente de celle indiquée de manière générique sur le dépôt github qui l'héberge, les utilisateurs de Copilot risquent d'avoir de sacrés nœuds juridiques à démêler.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . Évalué à 7. Dernière modification le 01 juillet 2021 à 16:39.
extrait de la FAQ:
Traduction rapide:
À qui appartient le code que Github Copilot m'a aidé à écrire ?
GitHub Copilot est un outil, comme un compilateur ou un stylo. Les suggestions que GitHub Copilot génèrent, ainsi que le code que vous écrivez avec son aide, vous appartient, et vous en êtes responsable. Nous recommandons que vous testiez attentivement, relisiez et validiez le code, comme vous le feriez avec n'importe quel code que vous écririez par vous-même.
Traduction rapide:
Ai-je besoin de citer GitHub Copilot pour m'avoir aidé à écrire du code ?
Non, le code que vous créez avec l'aide de Github Copilot vous appartient. Alors que tout robot sympathique aime à être remercié de temps à autre, vous n'êtes aucunement obligé de citer GitHub Copilot. Tout comme avec un compilateur, le résultat de votre utilisation de GitHub Copilot vous appartient.
Commentaire:
On parle ici d’attribution du code et, en conséquence, du refus d'assumer toutes responsabilités vis-à-vis du code produit, mais absolument pas de la licence qui devrait, ou pas, y être associée.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par David Delassus (site web personnel) . Évalué à 9.
Co-pilot ne fait pas un copier coller, il a apprit et produit du nouveau code.
Si je fais un tutoriel sous licence GPL (ou équivalent), est-ce que le code produit par les lecteurs doit être sous licence GPL ?
La réponse est bien évidemment non.
J'ai travaillé sur quelques projets proprio dans d'autres boites, j'y ai appris certains design pattern que j'utilise dans mes propres projets. Je leur doit des royalties ?
Non, et Github non plus ne doit rien à ces projets (si on exclus la reconnaissance).
https://link-society.com - https://kubirds.com - https://github.com/link-society/flowg
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . Évalué à 9.
La GPL ne s’intéresse pas au copier/coller mais au travail dérivé. Est-ce que la sortie de Copilot est dérivé de code sous GPL ?
La réponse est
bien évidemmentà mon sens, ouiAu passage, si Copilot n’avait été entraîné que sur du code GPL, ta réponse serait toujours la même ? Et si il avait été entraîné sur un unique projet ?
Copilot n’a pas appris les règles de base de la programmations puis écris du code de zéro, il a pris du code déjà écrit et ressort ce code quand on lui demande.
Une « IA » ne fait de toutes façons rien par elle même, elle ne fait que ce qu’elle est programmée pour faire.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . Évalué à 10.
Copilot n'a rien appris: il fait des inférences complexes sur des proximités de morceaux de textes dont il ne comprend pas la signification. En cela il copie du code sans le comprendre en tentant de valider ces inférences par comparaison avec du code réel.
Sans aucun doute oui :)
Après est-ce qu'ils sont obligés de le distribuer sous licence GPL, non.
Mais le code produit par tes lecteurs est une œuvre issue de l'intégration de la manière de faire présentée dans ton tutoriel dans le cadre d'un objectif global différent et, dans un monde idéal, compris par tes lecteurs. Copilot ne comprend pas ce qu'il propose, il copie/colle/assemble en fonction du contexte en puisant sa capacité à faire cela dans les contenus qui ont servi à l’entraîner. Sans l'accumulation de ces contenus il ne sait rien faire.
Je suis d'accord que GitHub ne doit rien à ces projets, tant qu'il est vérifié que tous ceux dont le code a été utilisé sont réellement libres, mais Github trompe les utilisateurs de Copilot en affirmant que le code généré leur appartient. A l'heure actuelle, Github n'en a pas la moindre idée: cette question doit être débattue devant une les instances juridiques compétentes avant d'être considérée comme tranchée.
Lorsqu'un projet propriétaire a le moindre soupçon d'une rumeur impliquant qu'un projet libre aurait jeté un coup d'œil à son code propriétaire, il considère que ce projet libre porte atteinte à ses droits de propriété et déclenche les hostilités juridiques.
Je reste convaincu que tant que le monde propriétaire joue ce jeu là, le libre doit jouer avec les mêmes armes et refuser de se laisser écraser dans un cas comme celui-là: ce que propose Copilot est exclusivement conditionné à la consultation de code libre, pas de tutoriels ou d'exemples très simplifiés d'algorithmes résolvant des problèmes génériques, mais de codes ayant une finalité spécifique et proposés sous licence libre. Toutes propositions de sa part doivent donc être considérées comme mises à disposition sous licence libre.
Je souhaite ardemment voir les organisations conséquentes qui défendent le libre au niveau juridique profiter de cette occasion pour planter un drapeau dans le camp propriétaire et marquer leur territoire.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Dr BG . Évalué à 6.
Je ne serais pas catégorique et je dirais même probablement que non. Le droit d'auteur protège le texte, pas les idées ou les principes qui sont derrières. Si tu applique les idées d'un didacticiel sans faire de copié/collé de code donné en exemple, il n'y a pas grand chose à protéger.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par ted (site web personnel) . Évalué à 3.
Je ne crois pas que Pierre ait dit cela, il dit bien que ce n'est pas une obligation (ni même une demande). Je pense que son propos est que la création de logiciel sous GPL est plutôt quelque chose de bien, peu importe de comment le développeur a appris à programmer.
Un LUG en Lorraine : https://enunclic-cappel.fr
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Thomas Debesse (site web personnel) . Évalué à 7.
Tout à fait, dans certains cas tu ne peux pas avoir accès à certains boulots si tu as eu connaissance de ceci ou cela. Je me souviens d’une offre d’emploi de ReactOS qui précisait que pour pouvoir postuler il fallait ne jamais avoir eu accès à telle version de Windows 2000 qui avait fuité. Le simple fait d’avoir potentiellement pu poser tes yeux sur le code d’un autre peut te fermer un boulot. Quand John Carmack est passé d’id Software à Oculus, il y a eu des histoires de gros sous parce que John Carmack pouvait mettre en œuvre chez Oculus ses compétences acquise chez id Software…
Le problème n’est pas que tu copies, mais qu’on ne puisses pas prouver que tu ne copies pas (ce que tu peux parfois ignorer toi-même). Parfois pour certains problèmes, les solutions peuvent beaucoup se ressembler, et la meilleure manière de prouver que tu peux arriver fortuitement au même endroit par toi-même, c’est d’y aller par toi-même. ReactOS ne peut pas prendre le risque qu’un contributeur reproduise du code de Windows malgré-lui, parce que s’il en aurait pu avoir connaissance, peut-il prouver que son code est original, qu’il l’aurait produit ainsi dans tous les cas ? Ici, peut-on prouver que copilote ne copie pas ? C’est peut-être la seule vraie question, car c’est la question qui compte quand on embauche des hommes.
ce commentaire est sous licence cc by 4 et précédentes
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par ted (site web personnel) . Évalué à 4.
Le début de la série Halt and Catch Fire parle de ça.
Possible spoil
Milieu des années 80, des employés d'un fabricant de matériel informatique ont eu la bonne idée de copier le BIOS d'une machine concurrente. Pour éviter les poursuites ils ont embauché une ingénieure chargée de réécrire un nouveau BIOS sans avoir vu le code contrefait.
Un LUG en Lorraine : https://enunclic-cappel.fr
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Guillaume Rossignol . Évalué à 2.
Non, mais si par hasard tu te retrouvai à écrire dans ta boite actuelle vingt lignes rigoureusement identique que des lignes lue dans une autre boite, la question se poserait. Ou vingt lignes pas identiques, mais juste les noms de variables ont été changées ?
En théorie, avec nos collègues humain, on part du principe que s'ils recopient de code qu'ils ont vu ailleurs, ils vont prévenir pour qu'on puisse évaluer ensemble si c'est trop proche ou pas du code d'origine, ou pour qu'on décide de mettre quelqu'un d'autre sur l'implémentation pour être sur qu'on ne puisse pas être accusé de plagiat.
Sur un logiciel qui a lu tout le code disponible en open-source, j'aimerai quand même avoir un score qui garantit l’éloignement entre le code qu'il me propose à moi et toutes les lignes de code déjà existantes. Par ce que dans la phrase «Co-pilot ne fait pas un copier coller, il a apprit et produit du nouveau code.», j'aimerai être certain que le code produit est systématiquement nouveau.
C'est marrant, mais je crois pas que co-pilot ai appris des design pattern
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . Évalué à 5.
Ouais, c’est exactement comme Zenitram, je critique le capitalisme, tu détourne en disant que je critique le Libre.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . Évalué à 3.
Je n'ai pas l'impression d'avoir dit que tu critiquais le libre, mais que tu voulais le restreindre pour empêcher son exploitation dans un contexte particulier (ici le capitalisme), ce qui, de fait, dénature le terme au sens des 4 libertés qui lui sont communément associées.
[^] # Commentaire supprimé
Posté par Anonyme . Évalué à 2.
Ce commentaire a été supprimé par l’équipe de modération.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Dr BG . Évalué à 4.
Eh bien justement, on ne parle pas ici de logiciel libre en général, mais de logiciel sous GPL. Cette dernière licence veut garantir que le code dérivé soit aussi libre, ce qui n'est pas le cas ici.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Anonyme . Évalué à 5.
Mais comme l’a dit raphj (et comme le dit eevee sur Twitter), il ne s’agit pas que des licences copyleft :
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par barmic 🦦 . Évalué à 8.
Moi je pense que ça ne tiens pas du tout. S'ils font ce qu'ils disent, tu ne peux pas faire de lien entre le code qu'il génère et l'un des codes d'apprentissage. Au mieux tu as des snipets de code qui peuvent correspondre, mais ils sont bien trop triviaux pour être sujet à du droit d'auteur.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Zenitram (site web personnel) . Évalué à 5.
Un peu comme le moteur discuté dans le journal, tu apprends mais ne contrefaits pas (c'est dans l'idée mais pas complètement pareil que l'original), je valide.
Mais sinon, c'est "bizarre" qu'on n'ai jamais remis en cause les artistes (musique, peinture, chant, etc) qui sont tous à apprendre des autres pour en sortir leur version sans qu'on les accuser de "voler" (sauf quand c'est trop proche :) ), et d'un coup c'est une machine qui apprend de code "sacré" et hop branle bas de combat, fourre-tout anti-capitaliste, association libre au GPL seulement, et j'en passe.
Et si je fais du code libre (mais copyfree, faut pas déconner) en apprenant à coder en lisant du code GPL, je suis aussi un contrefacteur capitaliste qui me fout du libre, ou juste un humain qui apprend comme à l'école, que les livres/codes soient libres ou non?
Dommage, le journal aurait pu être la base d'un débat sur le rôle de la machine qui commence à apprendre et sur la notion de travail dérivé, mais il fallait bien injecter de l'anti-copyfree et de l'anti-capitalisme… C'est chiant que le libre soit si libre, il ne bannit ni le copyfree ni le capitalisme.
Bon, pour ne pas faire un autre commentaire, mais un truc qui m'a fait sourire dans le journal :
Le libre n'oblige personne à accepter ou maintenir un patch, les gens sont… Libres, y compris de ça. Hors sujet juste pour le plaisir de s'offusquer.
[^] # Re: je marche dedans ! Zenitram impersonation time !
Posté par Psychofox (Mastodon) . Évalué à 8.
Honnêtement, Band-in-a-box précède github copilot de quoi? Plus de 30 ans ?
# Pas de réutilisation
Posté par ptit_poulet . Évalué à 10.
Moi j'ai compris ça différemment.
Pour moi cette IA ne réutilise pas des bouts de code mais a appris grâce à ces bouts de code.
Sinon ça ne s'appelle pas une IA.
Du coup c'est comme si moi demain j'écris un bout de code mais que je suis obligé de mettre sous licence GPL car lors de mon apprentissage j'ai appris comment fonctionne une boucle for à partir d'un bout de code GPL.
Du coup je ne vois pas où est le problème.
Par contre le risque c'est que l'IA produise des erreurs comme un humain pourrait le faire, car si elle s'entraine à partir de bout de code piocher à droite à gauche elle sera aussi à même de reproduire de mauvaises interprétations/méthodes.
[^] # Re: Pas de réutilisation
Posté par Amiralgaby . Évalué à 1. Dernière modification le 01 juillet 2021 à 17:25.
Il y a aussi l'histoire des algorithmes dans le domaine public.
Donc si cette IA s'est basée sur des bouts de code qui sont des algorithmes comme pourrait l'être une fonction tout bête (type les fonctions dans string.h) alors techniquement, en séparant l'algorithme de ce qui relève de la créativité, cela revient au développeur.
Et franchement avoir des copyrigths sur ces fonctions c'est un peu extrême.
Amiralgaby#1847
[^] # Re: Pas de réutilisation
Posté par Anonyme . Évalué à 5.
Toutes les libc ont un copyright, par exemple :
[^] # Re: Pas de réutilisation
Posté par Dr BG . Évalué à 4.
Il y a confusion, le doit d'auteur ne protège pas l'algorithme, mais juste le texte qui le met en oeuvre. Et évidemment, ce texte doit aussi refléter une "création originale", dans le sens où ce n'est pas l'unique manière de faire, ou que n'importe qui n'aurait pas nécessairement écrit la même chose pour parvenir au même résultat (ouais, c'est vague et les mots sont de moi, je ne suis pas juriste, mais c'est l'idée). Par exemple un fichier de configuration ou une boucle for ne rentre pas dans ce champ.
[^] # Re: Pas de réutilisation
Posté par Anonyme . Évalué à 8.
J’ai exprès posté un lien à la fin de mon journal, ça aurait été intéressant d’y jeter un œil, ce message notamment :
[^] # Re: Pas de réutilisation
Posté par Colin Pitrat (site web personnel) . Évalué à 2.
Il suffit de voir comme toutes les IA de saisie automatique peuvent ressortir des paragraphes entiers quand on leur fournit juste quelques mots suffisamment rares pour ne correspondre qu'à un seul exemple vu par l'IA.
C'est possible de s'en protéger, mais pas trivial.
Cf. https://ai.googleblog.com/2020/12/privacy-considerations-in-large.html?m=1
# Un sacré merdier ?
Posté par raphj . Évalué à 10.
Normalement, les licences prennent effet sur des bouts de codes non triviaux. Si on « copie » des petits bouts « non significatifs », c'est tout bon, la licence ne s'applique pas.
Où est la limite ? Je ne sais pas. Autant être prudent, du coup.
Pour moi, si cette IA recrache un extrait significatif d'un code (à des renommages / indentations prêt), le développeur risque de produire ce qui pourrait être considéré comme un travail dérivé. Peu importe la techno derrière l'outil. Sauf qu'il ne le sait pas, contrairement à quelqu'un qui copierait directement sans utiliser un outil qui le fait pour lui.
Sinon, si cette IA ne recrache que des extraits non significatifs, c'est ok. Sauf si la somme des extraits sortis par l'IA reconstitue un code existant sur lequel elle s'est appuyée, ou un truc qui y ressemble « suffisamment ». Ou que le développeur fait ressembler l'ensemble à ce code déjà existant. Difficile à savoir aussi.
Après, est-ce très différent d'une personne qui a vu beaucoup de code (propriétaire ou non, GPL ou non) et qui écrit un nouveau code, certainement en s'inspirant de son expérience et de ses lectures passées ? Je ne sais pas non plus.
Dans tous les cas, si l'outil a des chances de recracher un bout de code non significatif existant, c'est juste un outil qui a permis de copier, de manière un peu fancy, sans même s'en rendre compte, et le dev n'a pas trop de manière de prouver qu'il n'a pas intentionnellement copié et qu'il a utilisé ce genre d'outil. C'est certainement lui qui est responsable d'un plagiat « fortuit ».
En tant qu'auteur de logiciels libres, je suis mal à l'aise sur le fait que mon code puisse être utilisé de cette manière pour produire un outil non libre et commercial¹ permettant d'écrire du code non libre. Je voudrais interdire ça. Par contre, je ne peux pas interdire les gens à publier mon code sur GitHub (ce que je ne fais pas moi-même pour le code que je contrôle, et c'est tant mieux), parce que ça demanderait de rendre mon code non libre. Donc je suis niqué, je crois.
J'imagine que les avocats de chez GitHub ont bien bossé sur le sujet mais j'espère quand-même que quelqu'un finira par trouver que ce n'est pas légal de prendre du code pour entrainer une telle IA, sans respecter les licences. Les licences comme la (A)GPL, certes, et c'est ma licence de choix, mais aussi des licences permissives qui requièrent quand-même de mentionner les auteurs.
En tant qu'utilisateur potentiel de l'outil, perso je passe mon tour. Ça me parait trop risqué légalement, et si on sort du cadre légal, je ne suis pas à l'aise avec l'idée vis à vis des auteurs des codes sur lesquels il a été entrainé.
Je trouve l'idée très cool et très intéressante (voire géniale) sur un point de vue scientifique, l'outil concret, un peu moins.
Tout ça est une réaction à chaud, c'est encore trop tôt pour avoir un avis tranché sur tout cas pour le moment.
¹ dans la FAQ du site :
(et donc si vous l'essayez, vous aidez GitHub à élaborer son outil commercial sans rémunération. On peut voir l'échange comme gagnant-gagnant, ou pas, à chacun de voir)
[^] # Re: Un sacré merdier ?
Posté par Le Pnume . Évalué à 2.
et nous voilà avec le Paradoxe de l'IA savante (https://fr.wikipedia.org/wiki/Paradoxe_du_singe_savant), comme le singe pourrait reproduire l’intégrale de la saga Vorkosigan, l'IA devrait pouvoir reproduire le noyau linux
[^] # Re: Un sacré merdier ?
Posté par raphj . Évalué à 5. Dernière modification le 01 juillet 2021 à 19:38.
Mhm… le Paradoxe du singe savant vient du fait que la séquence générée est vraiment aléatoire. Sur une infinité de temps on aura « presque sûrement » généré le noyau Linux. Mais si on retire l'aspect strictement aléatoire (l'IA n'est pas vraiment aléatoire), c'est foutu ma pauvre Lucette ! Il n'y a plus de garantie que ça va presque sûrement arriver.
Par contre, une question qui m'est venue pendant l'écriture de mon commentaire, c'est : que faire d'un dev qui produit par hasard fortuitement un code suffisamment proche d'un code existant ?
Pour moi il n'est pas coupable, mais il pourrait être condamné s'il n'arrive pas à prouver qu'il n'a jamais vu ce code existant.
Ça doit forcément arriver, en plus, pour des bouts de codes relativement courts…
[^] # Re: Un sacré merdier ?
Posté par Guillawme (site web personnel, Mastodon) . Évalué à 4.
Dans une juridiction qui fonctionne avec la présomption d’innocence, c’est à l’accusation de prouver que ce développeur a vu le code ressemblant, et non pas au développeur de prouver qu’il n’a jamais vu ce code.
[^] # Re: Un sacré merdier ?
Posté par raphj . Évalué à 3.
Je comprends la présomption d'innocence, mais que faire si la ressemblance est considérée comme une preuve ?
(à vrai dire, je ne sais pas comment ça se passe en pratique, si ça ce trouve je dis totalement de la merde)
[^] # Re: Un sacré merdier ?
Posté par NicolasP . Évalué à 3.
En théorie c'est simple, si le code est "suffisamment proche" et "non trivial", c'est une contrefaçon. La bonne foi de l'auteur de la copie/réinvention n'entre pas en compte.
En pratique, le "suffisamment proche" et "non trivial" sont loin d'être rigoureusement définis et laissent une grande marge d'interprétation.
[^] # Re: Un sacré merdier ?
Posté par _kaos_ . Évalué à 7. Dernière modification le 01 juillet 2021 à 21:43.
Version sans aléa : le code des noyaux linux, bsd et windows NT existent dans toutes leurs versions passées, à venir et même non publiées dans
π
, et ce n'est pas du hasard, car ils y seront toujours, de manière prévisible, à ces endroits.Je n'ai juste pas (encore) fini de calculer l'offset (mais ça progresse !) ;)
Matricule 23415
[^] # Re: Un sacré merdier ?
Posté par NicolasP . Évalué à 5.
Si tu arrives à le prouver, tu vas intéresser quelques mathématiciens. A ce jour, il n'a pas été démontré que π était un nombre univers.
[^] # Re: Un sacré merdier ?
Posté par _kaos_ . Évalué à 7. Dernière modification le 01 juillet 2021 à 22:11.
Ce n'est qu'un léger détail !
Et d'ailleurs, celui qui me contredira formellement les intéresse tout autant ;)
Matricule 23415
[^] # Re: Un sacré merdier ?
Posté par David Delassus (site web personnel) . Évalué à 6.
Si π n'est pas un nombre univers, alors ce système de fichier[1] risque de causer pas mal de pertes de données.
[1] - https://github.com/philipl/pifs
https://link-society.com - https://kubirds.com - https://github.com/link-society/flowg
[^] # Re: Un sacré merdier ?
Posté par NicolasP . Évalué à 3.
Pas de soucis, ils recherchent la position de chaque octet, du coup ça marche même si π n'est pas un nombre univers. Tu peux déployer en prod les yeux fermés, c'est robuste !
[^] # Re: Un sacré merdier ?
Posté par cg . Évalué à 6.
Plus simplement, il y a la bibliothèque de Babel, décrite dans une petite nouvelle de Borgès. Il s'agit à l'origine d'un exercice purement mental, un questionnement philosophique sur un fini infini.
Mais par bonheur, cette bibliothèque existe maintenant par l'intermédiaire d'un programme informatique, et contient tous les livres possibles de 410 pages (et donc tout les écrits à partir de lettres possibles de moins de 1312000 caractères). Visitez là ici : https://libraryofbabel.info/ . Il y a même un moteur de recherche, vous pourrez sans doute y trouver des bouts de ce journal et les réponses ;).
[^] # Re: Un sacré merdier ?
Posté par hugotrip . Évalué à 4.
Effectivement, plus précisément à la page 39 d'irpmtttl, qui est rangé à droite sur la deuxième étagère du premier mur de l'hexagone :
(et ils ont vraiment les droits de toutes les œuvres mises à disposition ? ;)
[^] # Re: Un sacré merdier ?
Posté par Pol' uX (site web personnel) . Évalué à 5.
Concernant les « samples », les droit d'auteurs ont été défendus même concernant de petits morceaux jugés triviaux par d'autres. D'après wikipédia, La CJUE a jugé en fonction de savoir si l'échantillon est reconnaissable ou pas.
Est-ce transposable en principe ? Pas facile de juger du degré d'originalité d'un snippet de code. Pourtant, moralement, on sent bien que piller massivement un corpus copyleft pour nourrir le léviathan propriétaire ne fait pas l'unanimité.
Adhérer à l'April, ça vous tente ?
[^] # Re: Un sacré merdier ?
Posté par barmic 🦦 . Évalué à 4.
Pour que ça marche, il faut que tu puisse montrer que tu as les droits dessus et le moindre prior art case toute ton attaque.
C'est une tempête dans un verre d'eau. L'outil ne va pas changer le monde et il ne recopiera jamais suffisamment d'un projet donné pour que tu puisses prouver la paternité.
Et en soit, des projets qui ont absorbé ces codes pour divers usages sans l'accord explicite des détenteurs du copyright, ce n'est ni le premier ni le dernier, c'est juste mieux marketé.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Un sacré merdier ?
Posté par raphj . Évalué à 3.
Tu as des exemples ? Ça m'intéresse.
[^] # Re: Un sacré merdier ?
Posté par barmic 🦦 . Évalué à 10.
Dependabot ? Tous les trucs plus ou moins annuels qui te donnent des stats sur ce qu'il y a dans ces projets ? Google aussi s'est amusé avec ils indexes tout github dans bigtable.
Quel que soit la licence c'est du code publique, croire qu'on a le moindre contrôle sur les gens qui relisent votre code parce que "peut être que ce qu'il écrit peu ressembler, même s'il ne s'en rend pas compte" à mon bout de code. C'est ce leurrer.
On est quand même entrain de lire des gens qui sont à la limite de te dire que si tu as un jour lu du code GPL, tu n'écrira plus que du GPL dans ta vie. C'est contraignant pour du code, mais si par exemple je lis un texte en CC-BY-ND, je n'ai plus le droit d'écrire parce que je ne peux pas prouver que ce que j'écris n'est pas inspiré de ce texte ?
Je comprends que copilot énerve mais faut pas en arriver à délirer pour autant.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Un sacré merdier ?
Posté par Misc (site web personnel) . Évalué à 2.
Un autre effet proche de ton exemple "j'ai lu du code GPL, je vais écrire que du code GPL", c'est que ce genre de position va avoir aussi tendance à alimenter le FUD vis à vis de la GPL.
[^] # Re: Un sacré merdier ?
Posté par barmic 🦦 . Évalué à 2.
C'est vrai que ça contribue à rendre flou le fonctionnement du copyleft
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Un sacré merdier ?
Posté par Misc (site web personnel) . Évalué à 3.
Je pense que c'est déjà flou (sinon, on n'aurais pas un débat ici).
C'est plus que faire du foin (à tort ou à raison) sur l'intégration de code GPL va rendre la perception du fonctionnement du copyleft comme juridiquement dangereux.
[^] # Re: Un sacré merdier ?
Posté par David Delassus (site web personnel) . Évalué à 0.
Perso j'évite le copyleft et les projets sous licence GPL au max.
Si je fais du libre, je fais sous licence MIT ou Apache-2.0, voir CC0 si c'est trivial, dépendre de code GPL m'empêcherai de distribuer sous ces licences.
Si je fais du proprio, je veux encore moins de code sous GPL.
AMHA, les licences GPL font plus de mal que de bien à l'écosystème à cause du flou juridique qu'est le copyleft.
https://link-society.com - https://kubirds.com - https://github.com/link-society/flowg
[^] # Re: Un sacré merdier ?
Posté par arnaudus . Évalué à 3. Dernière modification le 05 juillet 2021 à 09:30.
À la base, il y a quand même la pirouette qui donne "magiquement" à un travail technique (du code) une dimension artistique ("œuvre de l'esprit"), ce que le législateur n'avait pas du tout prévu. C'est une pirouette utile, qui permet de ne pas réécrire le code de la propriété intellectuelle et de se baser sur un consensus international, mais quand même. Je veux bien que certains bouts de code brillent par leur originalité (dans le sens où la logique sous-jacente serait tellement originale qu'on peut déterminer avec certitude que le code a été écrit par X ou par Y, même si les noms de variables ont été changés ou que le code a été traduit dans un autre langage), mais pour l'énorme majorité des bouts de code, il semble très difficile de défendre ce statut.
Il me semble tout à fait possible que les libristes ont aussi sur-interprété la protection que leur donnait la GPL via le droit d'auteur. Mettre une licence GPL est une condition nécessaire, mais probablement pas suffisante, pour avoir la certitude que quelqu'un qui reprend une partie de votre code doit respecter votre licence. Bien sûr, la question ne se pose pas si on reprend un projet entier, ou une bibliothèque de 100k lignes. Mais si des juristes spécialistes de la question semblent ne pas s'émouvoir des pratiques de cette nouvelle IA (en fait, il semble qu'il s'agisse plutôt d'une fonction d'auto-complétion basée sur un moteur de recherche), c'est peut-être que nous avons pris l'habitude de défendre une conception du droit d'auteur sur le code qui est fantasmée.
[^] # Re: Un sacré merdier ?
Posté par barmic 🦦 . Évalué à 5.
C'est le mot "œuvre" qui te fais dire que c'est artistique ? Il faut le voir comme "ouvrage". C'est un terme beaucoup utiliser pour les chantiers "gros œuvre", "maître d'œuvre", "second œuvre",…
La propriété intellectuelle ne s'est probablement jamais limité l'artistique.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Un sacré merdier ?
Posté par arnaudus . Évalué à 4.
Si. La loi de 1957 protège la "propriété littéraire et artistique". C'est la réécriture de 1987 (code de propriété intellectuelle) qui élargit, sans la définir, la notion d'œuvre de l'esprit.
La propriété intellectuelle s'étend au-delà des œuvres bien sûr (doit des marques, brevets, etc). Mais c'était bien une décision de mettre le code informatique du côté de la littérature, et pas du côté des procédés techniques (avec les brevets). En particulier, les critères de protection sont les mêmes que pour la peinture ou la sculpture: l'originalité, le fait qu'elle exprime la personnalité (et pas seulement la qualification) de l'auteur etc.
D'ailleurs, il n'y a pas que le code informatique qui est ambigû. La photographie non-artistique (photo aérienne, photo technique, reproduction d'œuvres 2D ou 3D…) n'a pas de jurisprudence fixée (un coup c'est protégé, un coup ça ne l'est pas).
[^] # Re: Un sacré merdier ?
Posté par Misc (site web personnel) . Évalué à 5.
Et ne parlons pas des gens qui t'envoient des photos d'IDE dans un document Word, en te disant "j'ai une erreur, tu peux regarder ce code ?".
Dans quel case est ce que ça rentre ? (en dehors du film d'horreur interactif)
[^] # Re: Un sacré merdier ?
Posté par Zenitram (site web personnel) . Évalué à 5. Dernière modification le 02 juillet 2021 à 09:31.
Je remercie grandement les lois de tous les pays du monde (à ma connaissance) qui t'interdisent de m'interdire d'apprendre à partir de ce que je peux lire.
J'ai l'impression que pas mal de "libristes" rêvent de mettre leur pouvoir sur le plus de choses, mais dans ce cas… Ca donnerait aussi la liberté aux vendeur de livre pour apprendre à lire de mettre un copyright précis sur tous ce que les enfants produiront maintenant et dan jusqu'à leur mort, votre futur plein de copyright ne me donne vraiment pas envie.
Vive le libre et les lois! Les 2 participent à vous empêcher d'imposer aux autres votre morale.
MERCI le libre : c'est bien pour éviter la morale des auteurs de code que le libre me plaît.
C'est fou comme les gens peuvent adorer restreindre les autres, sous couvert de vouloir plus de libertés…
Le libre est génial : ses plus ardents militants ne comprennent pas que l'idée est de se débarrasser de la morale subjectives de X ou Y (dont… Eux-même!), et ce sont les plus ardents militants qui râlent à trop de liberté alors qu'ils communiquent sur vouloir libérer. En attendant, ceux qui reçoivent du code libre trouvent toujours un moyen nouveau d'utiliser ces libertés conférés, le libre est génial.
[^] # Re: Un sacré merdier ?
Posté par raphj . Évalué à 8.
ça me va très bien que tu apprennes de mon code libre pour faire ce que tu veux. Je préfèrerais que tu ne fasses pas de code proprio mais je ne voudrais pas te l'interdire. Parce qu'on est au niveau du partage de connaissance.
Par contre, ne produit pas d'oeuvre dérivé de mon travail qui est non libre.
Soit je t'ai mal compris, soit toi moi, soit tu caricatures ma position.
Nos peurs sont finalement avérée avec Copilot mais ça ne change pas grand chose à mon avis.
https://twitter.com/mitsuhiko/status/1410886329924194309
Copilot regurgitating Quake code, including sweary comments
# Droit d'auteur fantasmé?
Posté par arnaudus . Évalué à 6.
Quand je lis certains commentaires, j'ai l'impression que les libristes fantasment un peu autour du concept de droit d'auteur, mais qu'en fait, la réponse à la question "super complexe" est en fait assez simple: oui, bien sûr, ils peuvent faire ça.
Déja, la lecture, l'analyse, ou l'indexation du code publié est bien sûr totalement légale. C'est même pour ça qu'on publie. Ça ne s'arrête pas au code : il est tout à fait légal d'analyser le contenu de livres publiés par des éditeurs traditionnels, d'en faire des analyses, et même des citations.
La seule question légale qui pourrait se poser, c'est les droits voisins : on ne peut pas aspirer une grosse base de données; ce n'est pas le contenu de la base qui est protégé, mais la base elle-même. Sauf que là, pas de problème, la base appartient à Github.
Ensuite, sur la licence du code généré automatiquement, il n'y a pas vraiment d'ambiguité. S'il est issu d'une véritable AI, l'AI ne peut pas avoir de droits (ce n'est pas une oeuvre de l'esprit, ou du moins le législateur n'a pas prévu qu'une AI puisse avoir un esprit). Reste la question du travail dérivé, mais là encore, il y a peu de doutes : s'il est impossible de prouver la paternité entre le code de départ et le code produit, alors il ne peut pas y avoir de contrefaçon. Il est difficile de se faire une idée à partir des exemples publicitaires publiés, mais il est probable que l'AI ne puisse reproduire que des bouts de code triviaux, ou non-originaux. J'imagine que Github a pris bien soin d'éliminer les copies directes dans son algorithme, ce qui fait que le code de l'IA tombera dans deux catégories : "fusion" entre des bouts de code existants (et donc, très difficile de prouver un travail dérivé), ou code trivial (plusieurs occurrences dans la base). Dans les deux cas, je pense qu'il n'y a pas d'ambiguité.
Après, si Github fait des erreurs et qu'il fournit des bouts de code non-triviaux pompés sur la base de données, alors les utilisateurs de l'AI peuvent être poursuivis pour contrefaçon. Mais dans ce cas, la situation est guère différente de celle où un intermédiaire peu scrupuleux vous a vendu des bouts de code GPL en faisant croire qu'ils étaient originaux.
Honnêtement, si j'étais Github, pour éviter les problèmes, j'entrainerais l'IA avec des échantillons non-recouvrants de la base, et je ne fournirais que le code identique entre les deux AI. Déja, ça serait une assurance de robustesse, en en plus, à tout moment, je serais capable de prouver que le code produit n'est pas un travail dérivé.
[^] # Re: Droit d'auteur fantasmé?
Posté par Anonyme . Évalué à 10. Dernière modification le 02 juillet 2021 à 14:55.
Voici le code de quake recraché par Copilot (via HN), commentaires insultants inclus :)
Code sous licence GPL-2 à laquelle une licence MIT semble être substituée dans la video.
[^] # Re: Droit d'auteur fantasmé?
Posté par arnaudus . Évalué à 4.
Je ne suis pas sûr d'avoir compris exactement ce que montre la vidéo (je ne vois pas ce qui est tapé et ce qui est inféré).
Ce qui semble évident, ça n'est pas le problème de licence, c'est que leur AI c'est de la m***. Si elle ne fait que de la complétion automatique à partir d'une base de code, ça n'est pas une AI du tout. Quand l'AI te retourne un échantillon tel quel, tu as overfitté à mort.
Hypothèse : est-ce que ce bout de code ne serait pas dupliqué un trillion de fois dans la bdd, y compris sous de mauvaises licences? Auquel cas le problème serait plus au niveau du contenu de la base de code. Ça expliquerait la copie verbatim et la licence farfelue.
Dans tous les cas, le fait que l'AI puisse recopier une licence est très inquiétant. Ça voudrait dire que l'algo a été entrainé avec des fichiers comportant les copyrights et les textes de licence, ce qui est complètement débile. Shit in, Shit out.
[^] # Re: Droit d'auteur fantasmé?
Posté par barmic 🦦 . Évalué à 3.
Le coup de la licence, je m'en fou un peu. Mais s'il produit réellement ça (il est en phase de test et ne semble être dans les mains que de haters ou d'enthousiastes à l'heure actuelle), c'est encore le inutile que ce que j'imaginais. Il overfit à mort, tente de produire le maximum de code avec le minimum d'info indépendamment de la pertinence, ils ont indexés les commentaires, amha il n'a pas de notions de syntaxe (ou alors très limitées genre mot/ligne).
L'utilité me semble vraiment limité du coup.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Droit d'auteur fantasmé?
Posté par steph1978 . Évalué à 2.
Ça montre surtout que le truc est pas encore hyper au point …
[^] # Re: Droit d'auteur fantasmé?
Posté par Misc (site web personnel) . Évalué à 2.
Et en fait, il faut aussi, si je me souviens bien, que la base de données présente une forme de travail ou d'inventivité, ou un travail que je qualifierait de "rédactionnel" à défaut de trouver mieux (curation me parait un anglicisme). Une rapide recherche parle de "droit sui generis", et si je me souviens bien, si je peut montrer que j'ai investit des moyens substanciels pour faire la dite base, alors elle va avoir droit à une protection, sinon non.
Je l'explique sans doute assez mal mais ce que j'ai retenu, c'est qu'il suffit pas de mettre 2/3 trucs pour dire "j'ai une base de données".
[^] # Re: Droit d'auteur fantasmé?
Posté par Mathias Bavay (site web personnel) . Évalué à 3.
Pour moi, il n'y a pas qu'une seule question légale de droits voisins. La question de la propriété intellectuelle des données utilisées pour entraîner un modèle me semble être dans le flou le plus complet. Imaginons que j’entraîne une AI sur toute la musique d'un artiste à succès (par exemple, Lady Gaga), sans avoir le copyright sur la musique en question. Puis l'AI me génère de la musique que est totalement dans le style de Lady Gaga avec une voix synthétique qui ressemble fortement à Lady Gaga (soyons fous, l'AI est tellement au point que les paroles veulent dire quelque chose, la voix est naturelle, la musique et l'orchestration aussi). Est ce que je peux m'attribuer le copyright et vendre la musique ainsi générée?
Imaginons un autre scénario: je construit un modèle qui calcule l'altitude en tout points de la planète à partir de données satellites, mesures de terrain, etc qui m'ont été communiquées avec un NDA puis je vends mon modèle au monde entier. Est-ce légal? Ou j’entraîne une AI sur des designs de mode trouvés sur Internet et j'utilise mon AI pour vendre les designs qu'elle produit (en imaginant là aussi que c'est une AI super performante). Ais-je le droit?
Je suis en train de préparer un très gros jeux de données de stations automatiques de mesures météorologiques, et je prend soin que les termes de la licence permettent d’entraîner des modèles dessus (CC-BY), considérant que dans ce cas, une simple citation de l'origine des données d'apprentissage n'est pas insurmontable. Mais j'ai l'impression que la plupart n'ont pas ces préoccupations de faire les choses un minimum carrées…
[^] # Re: Droit d'auteur fantasmé?
Posté par Mathias Bavay (site web personnel) . Évalué à 2.
Et j’oubliais un point: que se passe-t-il quand quelqu'un à mis mon code sur github sans mon consentement? Ceci est actuellement le cas, avec du code sous LGPL et GPL, mais cela pourrait se produire avec d'autres licences…
[^] # Re: Droit d'auteur fantasmé?
Posté par arnaudus . Évalué à 2.
Argument très intéressant. J'imagine que personne ne sait vraiment. J'aurais tendance à penser que les mêmes arguments juridiques (flous) vont s'appliquer que pour n'importe quel artiste qui a copié le style musical d'un autre. Je ne pense pas qu'Oasis ait été poursuivi par les ayant-droit des Beatles, si? :-)
Sur le fond, d'après (le peu) que je comprends de la propriété intellectuelle, il va falloir avoir des arguments précis pour plaider la contrefaçon. Je ne suis pas sûr du tout qu'on puisse invoquer le droit d'auteur sur "un style". Il va falloir aller chercher des vrais bouts de morceaux qui ressemblent beaucoup, des paroles qui se ressemblent plus qu'elles ne devraient par hasard, etc. Si l'AI est bien faite et qu'elle a juste recopié le style, alors je pense que l'ayant-droit a peu de chances de s'en tirer.
Je pense que ça dépend des termes de la licence. Il y a forcément des clauses sur la commercialisation du résultat du traitement algorithmique des données. Je ne suis pas sûr que la précision de la prédiction soit le point central ici, ce que tu fais, c'est que tu prends les données, tu les traites, et du vends le résultat. Soit c'est autorisé, soit ça ne l'est pas. Il n'y a d'ailleurs pas besoin d'AI pour ça, le problème se poserait si tu appliquais n'importe quel traitement statistique aux données (lissage, flou Gaussien…) ou si tu fittais une fonction.
Alors là, je pense que ça ne pose pas de problème. On ne peut pas interdire aux ordinateurs de faire ce que font tous les créateurs. Peut-être faut-il juste s'assurer de la légalité du contenu de la base de données.
Les licences (libres ou non) s'appliquent mal aux données, parce que les données ne sont pas soumises au droit d'auteur (même si beaucoup le voudraient ou voudraient le faire croire). Une donnée n'est pas une oeuvre de l'esprit, même si elle a été coûteuse ou difficile à obtenir. La hauteur d'une montagne, par exemple, peut être réutilisée sans mentionner la personne qui l'a calculée. La seule raison de citer l'origine d'une donnée, c'est la rigueur ou l'honnêteté. Mais je ne pense pas que tu puisses appliquer une obligation légale. La question est un peu différente avec une grosse base de données, puisque c'est la base (et pas les données) qui peuvent être protégées.
Tout dépend de la licence de ton code. Si c'est du GPL ou équivalent, que la personne l'a obtenu légalement (en la téléchargeant sur ton site par exemple), alors la GPL lui donne le droit de rediffuser le code. Si ton code était sous une licence restrictive ou proprio, et que l'indélicat l'a republiée sous une licence fantaisiste sans ton autorisation, c'est de la contrefaçon. Contacter github en premier me semble la bonne démarche, j'imagine qu'ils vont recueillir les arguments des deux parties et agir en conséquence.
Je me suis toujours dit que les utilisateurs d'un code sous GPL pouvaient être facilement trompés par des intermédiaires peu scrupuleux (qui changent la licence par exemple), et que ça pouvait leur coûter cher. Par exemple, tu télécharges un truc sous github, tu le modifies et le commercialise. Et paf, 2 ans après, tu apprends que le code n'était en fait pas sous GPL et l'auteur original te poursuivait pour contrefaçon. Soit tu payes, soit ton business coule (puisque tu ne peux plus diffuser ton code sous les mêmes conditions), et pire, tes clients peuvent à leur tour avoir des problèmes (puisqu'ils ont pu diffuser ton code sous GPL de bonne foi). À un moment, le truc devient hors de contrôle, le code est partout, sous des licences trompeuses, et il semble très difficile de réparer l'erreur. Ça donne envie quand même de recontacter les auteurs originaux pour toute réutilisation qui pourrait poser problème (histoire de vérifier que leur code est bien sous GPL et que les fichiers récupérés sont bien les bons).
# Et le rôle de la FSF ?
Posté par Misc (site web personnel) . Évalué à 4.
Je pense que ça montre aussi un constat d'échec vis à vis de la GPL (et de facto de la FSF). Car derrière le projet de Github, il y a clairement quelqu'un qui a codé, et quelqu'un qui a dit "ok on va faire ça".
Ces personnes n'ont pas du se dire "oula, on va exploiter encore plus les prolétaires" tout en se faisant des bouclettes avec leur éventuelles moustaches.
Il me parait beaucoup plus probable que l'équipe se soit dit "le code est libre, donc c'est bon". Stricto sensu, avoir le code pour pouvoir l'étudier est une des 4 libertés fondamentales énoncés par la FSF, donc c'est pas comme si c'était une conception totalement aberrante du projet.
Normalement, ce genre de souci d’interprétation se règle via des avis juridiques d'experts pour dire "voila, on pense que les auteurs du code voulaient dire en prenant tel license", et pour la GPL, historiquement, c'était en partie le travail de la FSF (ce que mes collègues appellent "license stewardship").
Mais depuis plusieurs années, la FSF a perdu une forme d'autorité sur l’interprétation de la GPL. D'une part parce que la FSF ne semble plus publier d'avis juridiques. D'autre part, parce que d'autres groupes le font, d'autres groupes dont certains se sont monter pour éviter la FSF (OSI, Software Conservency).
Et comme ce genre de souci d’interprétation se règle à grand coup d'avis d'expert publié dans des jugements, des journaux, etc, il est possible qu'en l'absence de source qui fait l'unanimité, alors les juristes de Github se sont dit en tout bonne foi, comme le reste du monde que c'est ok.
Je vois autour de moi un usage grandissant des licences permissives, que ça soit du coté des boites qui publient des trucs sans considérations juridiques (donc du MIT, car on s'en fout), ou des gens qui codent pour avoir un CV, ou qui veulent que ça soit repris sans conditions (les *bsd, mais aussi les devs ruby, python, go, etc). Je dit pas que tout le monde le fait, il reste des gens à faire du code GPL, mais j'ai le sentiment que c'est un sous group.
Et je suppose que c'est lié à une forme de dépolitisation du logiciel libre, ou plutôt, à une forme de non politisation. On montre et on parle du coté cool, sans parler du projet politique.
Il y a plusieurs causes probables. Par exemple, on pourrait supposer que ça soit lié à une professionnalisation du monde du libre. Une autre cause pourrait être la vision "opensource" mise en avant en partie par ESR et son libertarianisme (qui en général va assez bien avec le capitalisme).
Ça peut aussi être une conséquence de l'état de la FSF, un sujet qui a été largement débattu sur https://linuxfr.org/users/misc/journaux/gnu-t-es-la, sur https://linuxfr.org/users/zenitram/journaux/le-directeur-executif-de-la-fsf-demissionne-quelle-suite et sur https://linuxfr.org/users/misc/journaux/rms-et-la-fsf
Mais juste dire "le capitalisme", c'est assez vague, et ça va quand même masquer la responsabilité collective du monde du libre. Et sans se poser la question de ce qui a foiré, on ne peux pas trop évoluer.
[^] # Re: Et le rôle de la FSF ?
Posté par barmic 🦦 . Évalué à 5.
Je suis moyennement fan des amalgames que tu lance, même sous couvert du conditionnel. Je ne met jamais de copyleft dans mes projets. La raison principale c'est que c'est trop compliqué pour ce que ça apporte. Certains projets gros et/ou avec une certaine pérennité doivent faire plus réfléchir que moi, mais perso je ne comprends le copyleft. Comme tout le monde j'en ai les grandes lignes, mais quand on rentre dans les détails je n'ai jamais vu 2 fois la même explication. Créer quelque chose et ne pas comprendre sa licence n'a pas de sens amha.
Mais le copyleft n'est pas très important de mon point de vu. L'organisation du projet est bien plus importante. Ce n'est ni une dépolitisation ni une non politisation, c'est juste que ce qui me semble primordial est ailleurs.
Enfin de manière bien plus prosaïque ce serait déjà un miracle que quelqu'un reprenne mon code, je vais pas mettre plus d'embûches que nécessaire à cela.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Et le rôle de la FSF ?
Posté par Misc (site web personnel) . Évalué à 3.
Alors si je comprends bien ton commentaire, tu rentres plus dans une mouvance "le copyleft est trop complexe, ce n'est pas le bon moyen d'assurer les buts politiques du libre", c'est ça ?
C'est à dire que faire du libre pour toi à une composante politique, mais que ce n'est pas l'usage de la GPL qui va permettre d'atteindre ces buts de manière optimale, donc que tu veux utiliser autre chose ?
C'est une vision valable, mais dans ce cas, si le souci est la clarté de la GPL, alors on retombe sur la question des avis juridiques et des débats d'experts et le role de la FSF. Faire du prosélytisme vis à vis de sa licence phare est son rôle. Si même une personne convaincue par les idées comme toi ne l'utilise pas, alors il y a un probléme.
[^] # Re: Et le rôle de la FSF ?
Posté par barmic 🦦 . Évalué à 4.
À mais je suis d'accord avec les prémices de ton commentaire, je répondais uniquement à la partie qui donnait l'impression que le non copyleft était fait sans conscience ou libertarien.
Pour ce qui est de la GPL le fait que personne ne sache comment ça fonctionne oui c'est un échec.
Pour la FSF, son échec va bien au delà de la GPL.
https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll
[^] # Re: Et le rôle de la FSF ?
Posté par Zenitram (site web personnel) . Évalué à 1. Dernière modification le 02 juillet 2021 à 18:38.
A mon avis le plus gros problème ici est surtout qu'on associe le libre ou la GPL à ce sujet. Il n'a en fait rien à voir, à part que du GPL a été utilisé comme "nourriture" dans un premier jet. Mais ça aurait pu être n'importe quel code à source publiques (NC inclus, voire le code source de Windows filé aux gouvernements).
Associer le libre ici est prendre un épouvantail pour s'offusquer que ce qu'on (pense) aimer est "attaqué", alors que le sujet est bien plus général.
Ici, on se fout en réalité de la FSF et de la GPL, car le sujet est de pouvoir enlever le copyright de tout, étant que la GPL n'autorise pas ça. C'est la loi qui et visé, sans une ligne de licence GPL à analyser. Essayer d'analyser ce qui est autorisé ou pas dans la GPL est manquer largement le problème. Bref : même si la FSF avait un avis sur ça, on s'en foutrait complet car c'est l'interprétation de la loi (inter)nationale qui nous intéresse ici, les liberté de lire pour apprendre et créer derrière étant plutôt de ce domaine, une licence n'ayant pas le droit d'interdire ça (corrigez moi donc en argumentant i vous pensez que je me trompe à ce sujet, mais comme je n'ai jamais vu un auteur de livre d'étude poser un copyright sur ce que font les études je me dis que c'est quand même impossible que personne n'aurait pensé à contraindre si il pouvait).
En fait, le FUD (car il s'agit de FUD en pratique, faire peur aux utilisateurs de GPL) sur la GPL en faisant croire que c'est légitime que lire du code GPL ferait qu'ils (machine… Ou humain par ricochet) devraient faire du code GPL, si ce n'est pas se tirer une balle dans le pied qu'est-ce que c'est…
Je te corrige : depuis plusieurs années, la FSF a perdu toute forme d'autorité sur l’interprétation de la GPL ou du libre ou juste son intégrité (j'attends toujours la FSF déclarer que la SSPL n'a rien à voir avec le libre pour que ce oit bien clair que non on ne peut pas en libre bloquer une personne qu'on déteste, au contraire…).
Son problème est que ce qu'elle a créé s'est libéré d'elle et de sa volonté de contrôler ce que pourraient faire celui qui reçoit le code libre.
Mais c'est un bien grand hors sujet ici :).
Mais, et tu le sais bien car tu m'as déjà lu à ce sujet, c'est que c'était voulu à la base de ne rien mettre de politique dans le libre, juste dans des phrases marketing à côté pour qui avait envie de bouffer du "marketing FSF". Le libre, tel que défini par la FSF (donc les 4 libertés et pas les à côté marketing) n'a jamais été politique, c'est un fantasme de gens gobant un "marketing" qui peuvent y croire mais eux ce sont bien fait avoir… On pourrait même presque penser que les gens derrière la FSF se sont fait avoir par leur propre marketing :), et que la réalité de ce qu'ils ont créé a pris sa liberté.
Rappelons, pour faire râler l'auteur du journal, que le libre interdit explicitement (pour tous les usages) d'interdire l'usage par entre autre des "capitalistes". C'est voulu, par design.
Si ta question porte sur ce qui a foiré sur le copyleft et non le libre (qui est loin d'avoir foiré), oui il faudra reconnaître que militer avec une définition différente de ce qu'on veut (définir le libre alors qu'on n'aime pas le libre sauf si copyleft; utiliser une définition "non politique" alors qu'on veut faire de la "politique") c'est quand même bien chercher les emmerdes. Mais perso je remercie bien la FSF d'avoir merdé la dessus, ils ont créé un mouvement (celui du FLOSS) qui à défaut de leur plaire (ils auraient voulu du copyleft sous stéroïdes dans les limitations genre sans tivoïsation etc) me plaît! Et leur acharnement à complexifier, interdire et interpréter "rigoureusement" des choses m'ont même poussé dans le bras du libre copyfree :-D.
[^] # Re: Et le rôle de la FSF ?
Posté par Misc (site web personnel) . Évalué à 8.
Dans la mesure ou il y a du code non libre lisible publiquement sur Github (eg, sans license explicite), oui, la question se pose. Ensuite, on parle de la GPL car les gens qui foutent du code sans license sur Github le font sans doute par erreur et ne vont pas se poser de questions. Les gens qui mettent du code proprio en privé ne sont sans doute pas indexés.
Il ne reste donc que les gens qui se préoccupent des licences. Dans ce goupe, les gens qui font du permissif s'en foutent donc ne disent rien. Et il reste donc les gens qui ont des conditions sur les licences en question, cad les gens qui utilisent la GPL.
Tout le reste s'en fout implicitement, explicitement ou sont non concernés.
Encore une fois, je sais que les juristes chez nous prennent en compte les avis de la FSF. Le monde des gens spécialisés dans les questions de logiciel libre et de droit est sans doute plus petit que le monde des gens qui commentent sur Linuxfr, et je sais de source assez sur que la plupart se connaissent et se croisent régulièrement quand il n'y a pas de pandémie (exemple, le Free Software Legal and Licensing Workshop de la FSFE, la devroom Legal du FOSDEM, sans doute des discussions informelles à Libreplanet, etc).
Et le point crucial est sans doute de définir ce qui est un travail dérivé.
Mais surtout, il y a aussi la question de savoir qui a vraiment envie de clarifier ça, au point d'aller écrire un article dans une revue, et/ou d'aller au procès.
Car des gens qui veulent clarifier, y en a sans doute plein. Des gens qui vont faire le travail, ou payer des gens avec les compétences pour le faire, y en a sûrement beaucoup moins.
[^] # Re: Et le rôle de la FSF ?
Posté par Zenitram (site web personnel) . Évalué à -4. Dernière modification le 03 juillet 2021 à 13:28.
Tu te focalises toujours sur la licence GPL. Encore une fois, ce n'est pas le sujet, vu que l'outil peut analyser du code de n'importe quelle licence.
Les avis de la FSF sont utiles pour la GPL (et encore, j'attends toujours l'accord non divulgué, et aussi je me demande pourquoi la FF n'est pas allé au bout si elle pensait que son avis était correct). Hors GPL, ben non.
On s'en fout de la GPL et de la FSF car le sujet et la loi (inter)nationale sur ce qu'est (ou pas) de la contrefaçon (= est-ce que l'auteur peut appliquer sa licence ou pas, qu'elle soit GPL ou pas).
Se focaliser sur la GPL est d'une encore faire du FUD (ce qui est génial est que ce sont les pro GPL qui font peur sur la GPL en insistant que une idée que la GPL iraient plus loin que les lois nationales permettant de ne pas être considéré comme contrefaçon) et de deux dépenser du temps pour rien (mauvaise base, mauvaise conclusion).
Le journal est symptomatique : outrance "travail gratuit" ou "contre mon gré" parce que ça a touché en premier du GPL, sans regarder l'idée globale.
Pour reprendre un autre de tes commentaires :
Ce qui a foiré, c'est entre autre regarder tellement son nombril que les pro-copyleft ne voient même plus par exemple ici que le sujet n'est pas le copyleft et du coup s'éparpiller dans des combats inutiles pour eux voire contre-productifs (faire peur aux utilisateurs à coup de "bouh je veut libérer mais ça tu as pas le droit, et ça non plus" n'a à ma connaissance rarement marché à long terme surtout quand les gens sont libres d'aller voir ailleurs).
Et dire qu'il y a un monde libre qui avance sans se prendre la tête ni perdre son temps la dessus, il code plutôt : le monde libre copyfree :-D.
[^] # Re: Et le rôle de la FSF ?
Posté par Misc (site web personnel) . Évalué à 7.
La FSF France n'est pas la FSF. Déjà, ce n'est ni les mêmes moyens, ni la même structure. Et c'est surtout que vaguement lié, dans le sens ou la FSF a du laissé l'usage de son nom et basta.
Je sais qu'on est sur linuxfr, mais je pense qu'avoir un minimum de rigueur ne veut pas dire avoir une rigueur minimum, et confondre 2 structures, bien qu'acceptable pour un néophyte me semble assez curieux venant de quelqu'un qui a de la bouteille.
Les gens qui se prennent la tête sont en général des juristes, en général salarié et plutôt bien payés. Je pense que ça reflète la valeur que la societé (au sens général, pas au sens entreprise) assigne à chaque occupation.
Et si on compare aux problèmes de financement chroniques des codeurs du libre, je pense que ça montre clairement ce qu'on estime important, et ce qui ne l'est pas aux yeux du reste du monde.
# Pratique
Posté par claudex . Évalué à 5.
Moi j'aime bien, ça évite de devoir créer un compte pour avoir des clef d'API https://nitter.fdn.fr/alexjc/status/1411966249437995010
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
[^] # Re: Pratique
Posté par claudex . Évalué à 4.
Pour ceux qui n'aurait pas vu le tweet précédent https://twitter.com/alexjc/status/1412061079132413963
« Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche
# moui
Posté par steph1978 . Évalué à 3.
Je ne suis pas un grand fan de github - plateforme privée centralisé, surtout depuis qu'ils sont dans le giron de M$.
Mais là je les trouve pas forcément très attaquable.
Après tout, copilot n'est rien de plus qu'un moteur de recherche spécialisé dans le code. Il y a eu "Ggl Code Search" en son temps.
Copilot va juste copier coller dans l'IDE le résultat le plus pertinent (comme "I'm feeling lucky" de ggl).
Rien n'empêche aujourd'hui qqun d'indexer tout le contenu publique de github ou d'autres forges avec une moteur NLP et de proposer le même service.
C'est juste de GH l'a fait.
Le code ici n'est pas utilisé par GH comme du code du serviec mais comme de la donnée.
Finalement, ceux qui s'offusquent n'ont qu'à pas mettre leur précieux code GPL sur une plateforme privée. Ce sont eux qui sont en plein paradoxe, pas GH.
[^] # Re: moui
Posté par jyes . Évalué à 4.
Je ne comprends pas ton commentaire parce-que je suis d’accord avec tout sauf la conclusion. Si le code (libre) constitue les données qui alimentent ce moteur de recherche, alors les résultats qu’il retourne sont couverts par la même licence. Donc le code ne peut pas être réapproprié par l’utilisateur de ce service, contrairement à ce qu’annonce GitHub. C’est même plus compliqué car avec leur IA au milieu qui fait une sorte d’interpolation entre différentes codes existants, avec des licences variées, le résultat est même probablement couvert par plusieurs licences incompatibles et ne peut donc même pas être utilisé du tout.
Le fait que le code n’est qu’une donnée est justement ce qui risque de faire du résultat un travail dérivé. Si tu prends deux images que tu superposes (en mélangeant chaque pixel avec 50% de l’une et 50% de l’autre) tu obtiens une œuvre dérivée de ces deux images. Si tu prends beaucoup d‘images et que tu remplaces le mélange à 50-50 par une fonction beaucoup plus élaborée jusqu’à ce qu’il ne soit plus si facile de deviner les images d’origines, tu as toujours une œuvre dérivée, même si tu te caches en appelant ta fonction de mélange une intelligence artificielle.
Donc je comprends bien les critiques émises sur cette page, le code que retourne copilot ne me paraît pas si simple à se réapproprier (surtout au vu des résultats évidemment repompés qu’il retourne aujourd’hui, mais même une fois ces problèmes réglés, en IA, les données d’alimentation font parties de l’algorithme et des résultats).
Donc
Oui, mais
pas si sûr. Je pense surtout que comme c’est porté par une très grosse boîte et que c’est de l’IA à laquelle les juristes et politiques ne comprennent pas grand chose, la loi sera éventuellement adaptée pour protéger GitHub/Microsoft, mais la même chose, faite par quelqu‘un d’autre n’aurait pas les mêmes chances.
[^] # Re: moui
Posté par steph1978 . Évalué à 3.
Je ne sais pas me prononcer sur l'aspect juridique. D'ailleurs ce que je lis sur le web montre que peu savent se prononcer.
Je me prononce plus sur les intentions et n'exprime que mon opinion. Je dis que GH/Copilot ne fait pas plus qu'un moteur de recherche et qu'il n'utilise pas de code GPL lui-même sans publier le travail dérivé. Remarque que je n'en sais rien puisque le code de copilot n'est pas dispo mais ce n'est en tout cas pas ce qu'on lui reproche.
Ce qu'on peut lui reprocher, en effet, c'est de brouiller les cartes quant à l’attribution du code et à quelle licence il serait soumis. Mais finalement, celui qui va se l'approprier ce code, c'est bien l'utilisateur de copilot et pas GH directement. En gros GH est un peu pousse au crime.
Ma conclusion était purement trollesque à l'égard de ceux qui mettent leur code GPL sur GH. Si on choisi le GPL ça devrait être par conviction libriste. Le mettre sur une plateforme privée, c'est ne pas être très en accord à cette conviction. Si cette plateforme en fait un mauvais usage, je serai tenté de dire "bien fait". Je pense qu'il ne faut pas attendre des entreprises qu'elles fassent preuve d'étique. MS et FB ne l'ont jamais prétendu et GGL et APPL ont montré que même si elles le prétendent, elles font exactement le contraire.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.