Lien Judge dismisses DMCA copyright claim in GitHub Copilot suit

Posté par dovik (site web personnel) le 10 juillet 2024 à 11:55.

Étiquettes : aucune

juil.

2024

https://www.theregister.com/2024/07/08/github_copilot_dmca/

# Clarification bienvenue

Posté par arnaudus le 10 juillet 2024 à 12:42. Évalué à 10. Dernière modification le 10 juillet 2024 à 12:42.

TL/DR: c'est juste l'application des lois existantes à une situation que les législateurs n'avaient pas prévu.

Il va falloir un certain nombre de décisions de justice similaires pour "stabiliser" la situation.

Dans tous les cas, j'ai toujours pensé que c'était la seule issue possible sans modification des lois existantes, pour plusieurs raisons:

1) À ma connaissance, dans la plupart (toutes) les législations qui implémentent la convention de Berne (le socle commun à la propriété intellectuelle dans le monde), la notion de travail dérivé n'est définie que par la similarité d'une oeuvre par rapport à l'original, et pas par le processus qui a permis de créer cette oeuvre (du coup, c'est peut-être le terme de "dérivé" en français qui est trompeur). Un modèle de langage bien paramétré ne ressort pas de morceaux identifiables, et ses sorties ne peuvent donc pas être des oeuvres dérivées. C'est d'ailleurs l'argument qui justifie le jugement dont il est question: les plaignants n'ont pas fourni la preuve que les sorties du modèles étaient dérivées de leur travail.

La propriété intellectuelle ne peut pas être diluée. Elle n'est pas quantitative, soit une oeuvre est protégée, soit elle ne l'est pas. Ça veut dire qu'il est tout à fait possible par exemple d'écrire un texte qui ne contient que des phrases tirées de livres déja publiés, sans que ça soit une contrefaçon. Et c'est probablement déja arrivé, puisqu'une phrase triviale ("Il prit son chapeau et ferma la porte derrière lui") a toutes les chances d'avoir déja été écrite. Du coup, un code composé de lignes qui sont toutes tirées de sources sous GPL n'est pas nécessairement sous GPL. C'est une profonde incompréhension de la nature de la propriété intellectuelle que d'imaginer que c'est nécessairement le cas.

2) Il ne faut pas oublier que seules les oeuvres de l'esprit originales sont protégées par le droit d'auteur. Parfois on oublie ça, parce qu'on applique une licence à un ensemble de fichiers, mais il est très peu probable que vos .h qui contient des constructeurs, des destructeurs, et des méthodes triviales, soient en fait protégés par le droit d'auteur. Seuls les algorithmes un peu élaborés, les designs spécifiques à un problème donné, les optimisations un peu chiadées, etc. sont susceptibles d'ouvrir des droits d'auteur. Même si vous pouviez prouver qu'un LLM ressort une de vos fonctions telles quelles, il faudrait en plus démontrer que cette fonction est originale (par exemple, qu'elle est unique dans la base de données). Si la base de données de code contient 57 implémentations du tri à bulle et que l'IA a sorti celles avec vos noms de variables, ça ne veut pas dire qu'il y a eu contrefaçon.

3) L'aspiration de bases de données de code libre, qui est souvent reprochée à ces modèles, est tout à fait compatible avec la très grande majorité des licences libres. "Je ne voulait pas que mon code sous GPL serve à entrainer les modèles de langage" n'est pas un argument. Une modification des licences libres est peut-être envisageable, mais en tout cas l'argument n'est pas opposable.

Bref, je pense que la jurisprudence qui va s'établir va être assez claire : 1) l'inclusion de code dans une base de données destinée à l'entrainement de LLM ne constitue pas une violation de la propriété intellectuelle des auteurs du code (la question reste ouverte pour la base de données aspirée, mais on passe aux droits voisins, et en tout cas ça ne concerne pas les auteurs du code). 2) Sauf similarité dûment démontrée dans les sorties d'un modèle mal paramétré (comme l'étaient les premières versions de Copilot, si je me souviens bien), le code produit par une IA n'est pas soumis au code de la propriété intellectuelle (parce que ça n'est pas une oeuvre de l'esprit).

Ça me semble assez évident quand on lit le code de la propriété intellectuelle par exemple, mais je ne suis pas juriste et bien sûr les juges considèrent aussi autre chose que la loi. Mais en tout cas, j'ai l'impression que la plupart des arguments de ceux qui pensent que "ça devrait être interdit" n'ont pas de base légale, et qu'ils s'exposent à de grosses désillusions s'ils pensent que quelque chose comme "Je ne voulais pas que mon code soit réutilisé par des grosses boîtes pour faire du pognon" est un argument recevable.

Il y a d'ailleurs un point "philosophique" qui me semble intéressant : prétendre que la sortie d'un LLM peut violer sa propriété intellectuelle me semble quasiment auto-contradictoire. Par définition, la propriété intellectuelle ne s'applique qu'aux oeuvres de l'esprit (que la jurisprudence considère comme uniquement humain, pas de copyright sur les dessins de chimpanzés etc). Or, les sorties d'une IA ne peuvent pas être protégées par le droit d'auteur, parce que justement elles ne sont pas des oeuvres de l'esprit (sortir une sorte de code consensus ne peut produire qu'un code trivial qui ne reflète pas la personnalité de son auteur). Comment peut-on donc prétendre qu'un code suffisamment original pour être protégé par le droit d'auteur peut ressortir d'une IA d'une manière suffisamment similaire pour être une contrefaçon? (encore une fois, sauf si l'IA n'a pas été surparamétrée, ce qui est un problème technique qui peut en effet s'apparenter à de la contrefaçon)? À mon avis, il faut un raisonnement particulièrement précis pour s'en sortir. Par exemple, les "artistes numériques" prétendent que c'est le texte d'invocation de l'IA qui est l'oeuvre de leur esprit, et qui justifieraient la protection de la sortie de l'IA. Mais ça, ça permet d'attribuer une propriété à l'utilisateur de l'IA, ce qui est assez différent de la question du droit sur le bout de code qui sort d'une requête triviale.
- [^] # Re: Clarification bienvenue
  
  Posté par lcld le 10 juillet 2024 à 14:54. Évalué à -2.
  
  Je trouve au contraire que cette décision n'a rien d'évident.
  
  D'abord, elle ignore l'aspect quantitatif. Les lois ont été écrites pour les humains, selon ce qu'ils sont capables de faire, alors que les LLM ont la capacité d'ingérer des quantités de données sans commune mesure. Un peu comme si, sous prétexte qu'on peut citer ou inclure un extrait d'une oeuvre protégé (fair use), on serait libre de copier l'oeuvre entièrement. On ne peut pas se contenter de dire que les LLM "apprennent" de la même manière que nous.
  
  Ça veut dire qu'il est tout à fait possible par exemple d'écrire un texte qui ne contient que des phrases tirées de livres déja publiés, sans que ça soit une contrefaçon.
  
  Bien sûr. Mais je ne crois pas que les LLM se limitent à faire ça. S'il existe déjà un bout code de taille significative qui fait grosso modo ce que le développeur souhaite, je m'attend à ce qu'il soit repompé d'une manière qui ne serait pas autorisé normalement sans LLM.
  
  prétendre que la sortie d'un LLM peut violer sa propriété intellectuelle me semble quasiment auto-contradictoire. Par définition, la propriété intellectuelle ne s'applique qu'aux oeuvres de l'esprit (que la jurisprudence considère comme uniquement humain, pas de copyright sur les dessins de chimpanzés etc). Or, les sorties d'une IA ne peuvent pas être protégées par le droit d'auteur, parce que justement elles ne sont pas des oeuvres de l'esprit
  
  Ouais, ça c'est l'argument pour déréguler la possession une arme à feu en prétendant qu'un outil est innocent et qu'il faut se contenter de condamner une mauvaise utilisation.
  
  Mais LLM ne sont rien d'autre qu'un outil de copiage sophistiqué dont on ignore la source. Même si l'utilisateur souhaite respecter les licences, il ne peut pas le faire.
  
  J'ai l'impression que l'esprit des lois sur lesquelles les juges se sont basés n'a pas été respecté.
  
  Je ne supporte pas le fait que du code publié en GPL finisse aussi facilement dans des projets non-GPL. Et je suis d'autant plus mécontent que je maudis les LLM.
  - [^] # Re: Clarification bienvenue
    
    Posté par arnaudus le 10 juillet 2024 à 15:42. Évalué à 7.
    
    Les lois ont été écrites pour les humains, selon ce qu'ils sont capables de faire, alors que les LLM ont la capacité d'ingérer des quantités de données sans commune mesure
    
    Je ne vois pas le rapport. La loi définit la contrefaçon et les peines encourures pour contrefaçon. Or, la sortie des LLM ne correspond pas à la définition de la contrefaçon (ce n'est pas une copie ou un travail dérivé). Tout ce qui n'est pas interdit par la loi est légal, et les LLM sont donc légaux.
    
    Bien sûr, il est possible de changer les lois, et ça sera peut-être fait. Mais ça ne change rien au fait que le fonctionnement des LLM qui mangent des bases de code libre en entrée et qui recrachent du code sans auteur et sans copyright semble légal.
    
    S'il existe déjà un bout code de taille significative qui fait grosso modo ce que le développeur souhaite, je m'attend à ce qu'il soit repompé d'une manière qui ne serait pas autorisé normalement sans LLM.
    
    Tu t'attends mal. Tu ne sais pas comment fonctionnent les LLMs, ce qui n'est pas très grave en soi, mais tu te trompes sur la manière dont ces algorithmes fonctionnent. Ils ne recopient pas des morceaux de code, ils intègrent la logique des données sur lesquelles ils s'entrainent dans un réseau de neurones. Du coup, les bouts de code que tu lui as donnés ne sont pas stockés par le LLM, il n'en extrait qu'une sorte de logique générale. Il fait ensuite passer les requêtes à travers son modèle, et te revoit la sortie.
    
    Ce que tu mentionnes existe (le modèle recrache les données d'entrainement verbatim, comme un moteur de recherche), mais c'est un comportement pathologique (non-souhaité et non-souhaitable): le modèle a été sur-paramétré, le réseau n'a pas été entrainé avec assez de données, et il "colle" trop aux données d'entrainement. Tu peux aussi "provoquer" ce comportement avec des requêtes trop spécifiques (par exemple, au lieu de "tri à bulle", tu demandes "tri à bulle en 5 lignes avec des variables qui s'appellent Titeuf et Koko, et avec une erreur de logique à la ligne 3"). Mais ça reste un comportement buggué, auquel justement tu ne devrais pas t'attendre.
    
    Ouais, ça c'est l'argument pour déréguler la possession une arme à feu en prétendant qu'un outil est innocent et qu'il faut se contenter de condamner une mauvaise utilisation.
    
    On ne parle pas de déréguler les armes à feu, on parle de savoir si la sortie des LLMs peut être considérée comme de la contrefaçon. La loi n'est pas magique, elle interdit certaines choses, et ce qui n'est pas interdit est autorisé. Les licences copyleft sont explicitement publiées pour autoriser l'étude du code, ce que font les LLMs. Elles n'autorisent la publication de versions modifiées que si la même licence est appliquée. Or, les LLMs ne modifient pas le code, elles l'étudient et intègrent leur logique dans un réseau de neurones, qui peut être par la suite utilisé pour générer du code qui diffère du jeu de données d'entrainement (si c'était le même, ça ne serait qu'un moteur de recherche).
    
    Mais LLM ne sont rien d'autre qu'un outil de copiage sophistiqué dont on ignore la source.
    
    Si tu crois qu'un LLM est un moteur de recherche sophistiqué, tu ne peux pas comprendre pourquoi la licence n'est pas conservée en sortie. Mais je ne peux pas l'écrire différemment : un LLM n'est pas un moteur de recherche. C'est un algorithme qui génère quelque chose à partir de patterns qu'il a appris d'un jeu de données. Il ne ressort pas les données, il crée des données nouvelles qui correspondent à une structure qu'il a induite de ses données d'entrainement.
    
    Même si l'utilisateur souhaite respecter les licences, il ne peut pas le faire.
    
    Ça tombe bien : il n'y a aucune licence à respecter, puisque la sortie du modèle n'est pas un travail dérivé ou une contrefaçon. J'ai l'impression que ce qui n'est peut-être pas clair, c'est que tu peux mettre du 100% GPL en entrée, et que la sortie n'a pas de licence. Pourtant, c'est comme ça que fonctionne la propriété intellectuelle. Quand tu apprends à lire, tu mets du 100% copyright en entrée, et ce que tu écris t'appartient à 100% (sauf si tu as copié). Quand tu es musicien, tu mets du 100% de copyright en entrée, et ce qui sort t'appartient à 100% (sauf si tu as copié). Le fait de combiner de multiples sources d'influence ne crée pas quelque chose qui appartient à quelques % à ces sources, ça crée quelque chose qui ne leur appartient plus. C'est comme ça que ça marche avec les humains, et c'est comme ça que ça marche avec les LLM, qui fonctionnent selon le même principe.
    
    Tu peux penser que ça devrait fonctionner autrement, et on pourrait avoir une discussion sur ce sujet. Mais actuellement, à mon avis, la seule interprétation possible de la propriété intellectuelle est que la sortie des LLM n'est ni de la contrefaçon, ni une œuvre originale (puisque pas créé par un humain), et que sa publication ne peut pas être illégale (puisque pas interdite par la loi).
    
    Je ne supporte pas le fait que du code publié en GPL finisse aussi facilement dans des projets non-GPL. Et je suis d'autant plus mécontent que je maudis les LLM.
    
    J'ai bien compris ton opinion, mais je pense (c'est mon avis) que c'est ton incompréhension de ce qu'est la propriété intellectuelle, de ce qu'est la GPL, et de la manière dont les LLM fonctionnent qui te porte à croire ça.
    
    Pour ma part, j'ai du code GPL dans Github et il est donc probable qu'il a été utilisé pour entrainer de nombreux modèles de langage, et ça ne me dérange pas, parce que 1) la possibilité d'étudier et d'apprendre à partir du code est explicitement autorisé et encouragé par la GPL, 2) que la très grande majorité du code que j'ai écrit est trivial et qu'il ne pourrait pas raisonnablement être considéré comme une œuvre de l'esprit devant un tribunal (et donc que la licence que j'ai attribuée au code n'a probablement pas de substance légale), 3) que je n'ai aucun moyen de savoir si une sortie des modèles de langage a été influencée par un bout de réseau pour lequel mon code a affecté les paramètres (en gros, un bout de code qui ressemble au mien a peut-être 9 chances sur 10 de n'avoir aucun lien causal avec mon code, que mon code n'a peut-être pas été inclus dans la base pour une raison ou pour une autre), ce qui prouve bien que ça n'est pas de la contrefaçon (si même moi je ne peux pas savoir, alors comment quelqu'un d'autre le pourrait?).
    
    je maudis les LLM.
    
    Je serais intéressé de savoir si c'est parce que tu penses que leurs résultats sont médiocres ou inutiles, ou inversement parce que tu te sens humilié en tant qu'être humain par l'existence d'algorithmes capables de faire mieux que toi ce que tu pensais maitriser. Étrangement, j'ai l'impression que beaucoup de gens sont sur les deux options en même temps, ce qui me semble assez instable comme point de vue.
    
    L'idée de détester les trucs nouveaux qu'on a du mal à comprendre et qui peuvent modifier l'équilibre de notre vie n'est pas nouvelle, elle est probablement aussi vieille que l'humanité. Mais j'imagine que tu es déja au courant que cette idée n'a jamais gagné; que les nouvelles générations vont s'approprier cet outil et réussir à faire des choses avec, et que tu finiras tes jours malheureux en ronchonnant que c'était mieux avant?
    
    On voit d'ailleurs que la révolution IA n'a pas encore eu lieu. Les LLM servent beaucoup à générer du bullshit publicitaire, des articles de faux journaux, ils servent aux étudiants à tricher, et à tout un tas de gens incompétents de faire croire qu'ils savent faire des choses dont ils sont incapables (écrire du code, écrire une lettre sans faire de faute, ou dans une langue qu'ils ne connaissent pas, etc). Nul doute qu'il existe une utilité marginale à de tels outils (pour remplacer la doc des logiciels, typiquement), mais à ma connaissance, la productivité du secteur tertiaire n'a pas pris 75% en un an. Aucune raison de paniquer, aucune raison de détester un nouvel outil, aucune raison de croire que le monde va changer.
    - [^] # Re: Clarification bienvenue
      
      Posté par lcld le 10 juillet 2024 à 18:25. Évalué à 1.
      
      Etant donné que les LLM ne comprennent pas ce qu'ils font, dans le sens où c'est plutôt un modèle statistique, je suis curieux de les voir implémenter d'une manière différente quelque chose d'original qui n'existe que dans un seul logiciel.
      
      On ne parle pas de déréguler les armes à feu
      
      Euh oui, c'était juste une comparaison concernant la distinction outil/usage. Si l'usage qui en est fait est trop rarement souhaitable, on ne peut plus dédouaner l'outil.
      
      La loi n'est pas magique, elle interdit certaines choses, et ce qui n'est pas interdit est autorisé.
      
      J'ai hésité à le mentionner et j’admets que un jugement différent aurait peut-être demander d'interpréter la loi trop librement.
      
      Les licences copyleft sont explicitement publiées pour autoriser l'étude du code,
      
      C'est une mauvaise lecture de la GPL.
      
      Le souhait (disons plutôt l'utopie) est qu'il n'existe que du logiciel à source ouvert (que l'on puisse étudier) et le copyleft n'est qu'un outil y arriver. Et enfin à terme, la suppression du droit d'auteur pour le code (pour l'art, c'est une autre histoire) et seulement à ce moment, Copilot me dérangerait un peu moins.
      
      Il y a aussi les cas où pour éviter des violations de droit d'auteur, on prend une équipe pour écrire des specs à partir d'un code qu'on ne peut pas copier, et une autre pour réimplémenter à partir des spécifications.
      
      la très grande majorité du code que j'ai écrit est trivial et qu'il ne pourrait pas raisonnablement être considéré comme une œuvre de l'esprit devant un tribunal
      
      Dans le cas du code, c'est souvent trivial une fois qu'on l'a écrit, mais ça a quand même demandé un effort significatif. Le droit d'auteur permet de protéger cet effort.
      
      …
      
      En fait, tu restes sur l'idée qu'un LLM fonctionnent comme le cerveau d'un être humain. Mon propos initial est que si nous avions des capacités cognitives différentes, nos lois sur le droit d'auteur serait sans doute différentes, peut-être plus strictes, inexistantes, ou autre. Les lois sont seulement un outil pour équilibrer les rapports entre humains, et à mon avis les caractéristiques des LLM sont telles qu'elles perturbent cela.
      
      je maudis les LLM
      
      Arg, je n'invitais pas à développer ce hors-sujet ici, par manque de temps. Ai-je besoin de rappeler tous les inconvénients de l'IA et surtout des LLM ?
      
      Je serais intéressé de savoir si c'est parce que tu penses que leurs résultats sont médiocres ou inutiles, ou inversement parce que tu te sens humilié en tant qu'être humain par l'existence d'algorithmes capables de faire mieux que toi ce que tu pensais maitriser.
      
      Je suis surtout persuadé que la plupart des IA ne vaudront jamais ce que ça coûte.
      
      L'idée de détester les trucs nouveaux qu'on a du mal à comprendre et qui peuvent modifier l'équilibre de notre vie n'est pas nouvelle, elle est probablement aussi vieille que l'humanité. Mais j'imagine que tu es déja au courant que cette idée n'a jamais gagné; que les nouvelles générations vont s'approprier cet outil et réussir à faire des choses avec, et que tu finiras tes jours malheureux en ronchonnant que c'était mieux avant?
      
      Je ne suis absolument pas comme ça.
      
      Et je n'ai aucun problème à décharger l'humain de tâches ingrates par de l'automatisation fiable et économe.
  - [^] # Re: Clarification bienvenue
    
    Posté par Zenitram (site web personnel) le 10 juillet 2024 à 15:57. Évalué à 3.
    
    Les lois ont été écrites pour les humains, selon ce qu'ils sont capables de faire,
    
    Je te défie de démontrer cette phrase.
    
    Mais LLM ne sont rien d'autre qu'un outil de copiage sophistiqué dont on ignore la source. Même si l'utilisateur souhaite respecter les licences, il ne peut pas le faire.
    
    Donc si je lis ton code, l'analyse, le comprend, et utilise ce que j'ai appris pour écrire du code, c'est que de la copie et je suis dans l'illégalité?
    J'en doute fortement :).
    
    Je ne supporte pas le fait que du code publié en GPL finisse aussi facilement dans des projets non-GPL.
    
    Voila, on y est.
    Tes émotions te font oublier la réalité et tu veux absolument la tordre pour qu'elle rentre dans tes idées.
    Les adorateurs de la GPL ont longtemps fantasmer que la GPL empercheraient les "gros méchants" d'utiliser leur code, la réalité a montré que les "gros méchants" peuvent utiliser et il faudrait faire du non libre pour que ses idées soient vraiment prises en compte, mais pas de chance faire du non libre n'est pas hype.
    Les adorateurs de la GPL vont se rabattre sur fantasmer que la GPL pourra un jour empêcher que les "gros méchants" mais aussi les "petits méchants" n'utilisent les idées (le mot est important) dans du non GPL, avec la même déconvenue.
    
    A un moment il faudra comprendre que c'est peut-être ses idées qui ne sont pas en phase avec le partage et arrêter de vouloir contrôler son code, qui sait… Peut-être juste laisser le code libre de faire sa vie.
    En attendant, la seule manière de faire pour empêcher du code GPL de ne pas finir dans des projets non-GPL est de ne pas le publier (c'est possible, suffit de ne pas publier le binaire et la GPL n'impose alors pas de publier le code).
    
    Bon courage pour le retour sur Terre.
    
    Ouais, ça c'est l'argument pour déréguler la possession une arme à feu en prétendant qu'un outil est innocent et qu'il faut se contenter de condamner une mauvaise utilisation.
    
    Au passage, je comprend donc que tu adorerais interdire les couteaux de cuisine (on condamne une mauvaise utilisation de la chose mais pas une autre utilisation). Non merci.
    L'exemple des armes à feu est foireux ici, car on le contredit assez vite et du coup on comprend que tu n'as pas d'argument (ou alors des idées assez tordues pour interdire aux gens de cuisiner chez eux).
    - [^] # Re: Clarification bienvenue
      
      Posté par arnaudus le 10 juillet 2024 à 17:34. Évalué à 3.
      
      Au passage, je comprend donc que tu adorerais interdire les couteaux de cuisine (on condamne une mauvaise utilisation de la chose mais pas une autre utilisation). Non merci.
      
      Je viens de réaliser que l'analogie de l'interdiction des armes à feu venait en réponse à mon argument "seules les œuvres de l'esprit sont soumises au droit d'auteur, or les sorties des LLM ne sont pas des œuvres de l'esprit parce que la jurisprudence n'accorde ce titre qu'aux œuvres créees par les humains". Avec toute la meilleure volonté du monde, je ne vois vraiment pas le rapport.
      
      À part de conclure que l'état de droit est frustrant parce que la loi n'interdit pas ce qu'on voudrait bien interdire une fois que c'est arrivé mais qu'on ne peut pas le savoir avant que quelqu'un le fasse, je ne sais pas où tout ça nous amène.
      
      La première étape serait peut-être de proposer une GPL v4 qui interdit d'utiliser le code pour entrainer un algorithme. Ceci dit, cette clause n'est certainement pas compatible avec les libertés fondamentales 2 et 3 des logiciels libres (copier et étudier), ce qui risque de rendre les logiciels sous une telle licence non-acceptable pour plusieurs projets.
      - [^] # Re: Clarification bienvenue
        
        Posté par Zenitram (site web personnel) le 10 juillet 2024 à 20:50. Évalué à 1.
        
        cette clause n'est certainement pas compatible avec les libertés fondamentales 2 et 3 des logiciels libres
        
        Perso je m'amuse de tous les gens "dans l'esprit du libre" qui cherchent en permanence à contourner la définition du libre qui ne leur plaît pas tout en se retrouvant en permanence à l'encontre de la définition du libre :-D.
        (rappelons que beaucoup de gens "dans l'esprit du libre" applaudissent la SSPL pas libre, par exemple, et conspuent les forks libres du fait de ce qu'il pensent de leur mainteneur)
        
        Ils se font surprendre par ce qu'ils pensent aimer mais dont ils n'ont pas prévu toutes les implications, pour le plus grand plaisir d'utilisateurs.
    - [^] # Re: Clarification bienvenue
      
      Posté par lcld le 10 juillet 2024 à 18:33. Évalué à -1.
      
      Au passage, je comprend donc que tu adorerais interdire les couteaux de cuisine (on condamne une mauvaise utilisation de la chose mais pas une autre utilisation). Non merci.
      
      N'importe quoi.
      
      Bon, je pensais l'exemple assez évident.
      
      Au lieu de me prêter de telles idées, demande-moi plutôt de clarifier. (J'ai un peu détaillé dans ma réponse ci-dessus.)
      
      Même chose sur la GPL. Ca ne me dérange évidemment pas que quiconque fasse n'importe quel usage privé d'un code que j'ai publié en GPL. Quand j'écris « projets non-GPL », je fais référence à quelque chose de vendu/publié.
      - [^] # Re: Clarification bienvenue
        
        Posté par Zenitram (site web personnel) le 10 juillet 2024 à 20:47. Évalué à 1.
        
        Bon, je pensais l'exemple assez évident.
        
        Il est assez évident, juste qu'il se retourne contre toi car le sujet des armes à feu est sur autre chose (notion d'avantages contre inconvénients) plutôt qu'un truc binaire bien à utiliser contre mal à ne pas utiliser, il y a les grandes phrases.. Et la réalité que ça implique, bizarrement souvent oubliée.
        
        Quand j'écris « projets non-GPL », je fais référence à quelque chose de vendu/publié.
        
        Je ne vois pas l’intérêt de la différence, mais admettrons : je parle aussi de ça.
        Et la GPL, ou le libre en général, ne fait aucune différence entre quelque chose entre un individu privé et un "grand méchant", et c'est ça qui est bien dans le libre : ne pas dépendre de ton petit goût de vouloir faire cette différence.
        
        Je n'irai pas plus loin sur le sujet car je sais que je n'arrivera pas à te faire changer d'avis, mais juste quel plaisir de voir des gens "souffrir" (en réalité c'est un plaisir masochiste, pas de vraie souffrance) de voir leur code leur échapper. Vive le libre qui libère le code de son auteur, y compris de ceux qui ont essayé de la jouer "libre mais bon on essaye quand même de garder le contrôle contre des méchants imaginaires qu'on veut contraindre plutôt que convaincre", avec l'aide de l'évolution technologique.
        
        Les LLM va faire beaucoup de bien au bien commun en permettant au plus grand nombre et pas qu'une partie des gens d'avoir du code sur base de ce qui existe déjà, et les pro-GPL n'y pourront rien.
        
        [^] # Re: Clarification bienvenue
        
        Posté par lcld le 11 juillet 2024 à 00:53. Évalué à 0.
        
        bien à utiliser contre mal à ne pas utiliser
        
        pas compris
        
        Déjà, juste pour clarifier car je commence à douter, est-ce que tu préfères comme moi la législation française sur les armes à feu, plutôt que celle des Etats-Unis ? Et oui, je fais la distinction entre armes à feu et couteau.
        
        Mon hypothèse est que l'usage de copilot impliquerait trop souvent de devoir respecter la licence de ce qu'il a ingéré (tout comme la possession d'une arme à feu implique trop souvent de tuer, ce qui n'est pas le cas du couteau). Puisque tu n'es pas d'accord avec cette hypothèse (je parle bien de celle sur copilot), soit tu ignores ce que j'ai écrit à partir de là, soit tu pars du principe que l'hypothèse est valable. Sinon, tu mélanges tout et tu me prêtes des idées que je n'ai pas.
        
        Et la GPL, ou le libre en général, ne fait aucune différence entre quelque chose entre un individu privé et un "grand méchant", et c'est ça qui est bien dans le libre : ne pas dépendre de ton petit goût de vouloir faire cette différence.
        
        Je ne vois pas du tout où j'ai pu laisser penser ça.
        
        Si je te comprends bien, tu es un libriste qui critique les licences copyleft. A partir de là évidemment, le jugement qui a été rendu est parfait.
        
        [^] # Re: Clarification bienvenue
        
        Posté par Zenitram (site web personnel) le 11 juillet 2024 à 09:17. Évalué à 3.
        
        est-ce que tu préfères comme moi la législation française sur les armes à feu, plutôt que celle des Etats-Unis ?
        
        Je suis viscéralement contre la mort à l'américaine, mais ne sort pas cet "argument" pour tout dès que ça ressemble.
        
        En l’occurrence :
        
        Mon hypothèse est que l'usage de copilot impliquerait trop souvent de devoir respecter la licence de ce qu'il a ingéré
        
        Est loin d'être démontré et donc ton "argument" se rapproche plus du couteau, donc à l'opposé de ce que tu essayes d'imaginer sans que tu n'arrives à accepter la réalité avec ta "logique".
        
        Je ne vois pas du tout où j'ai pu laisser penser ça.
        
        Précise donc ta pensée avec tes mots "usage privé" ou "quelque chose de vendu/publié", qui laisse penser à des différences arbitraires suivant tes envies.
        
        Si je te comprends bien, tu es un libriste qui critique les licences copyleft. A partir de là évidemment, le jugement qui a été rendu est parfait.
        
        Encore une assertion pour attaquer ma personne afin de ne pas gérer le sujet, ça montre un manque d'argument.
        En l’occurrence on s'en fout pas mal de "copyleft", ici le sujet est tout ce qui est lisible donc ça inclut du non libre genre CC-NC ou du sans licence mis sur GitHub.
        
        Le sujet est "est-ce visible?".
        Oui? Ben on peut lire, apprendre, utiliser. Les LLM ne changent rien au principe, et si tu n'aimes pas il va falloir que tu ailles récupérer toutes les licences de tous les livres scolaires de ton enfance qui ont formé ton cerveau, ou retirer ça ou respecter la licence, faut assumer tes idées.
        Non? ben c'est caché donc pas de LLM dessus. Si tu n'aimes pas les LLM, voila ce qu'il te reste à faire, faut assumer ne pas vouloir qu'on regarde.
        
        Et la GPL dans tout ça? C'est ton émotion uniquement, car ça concerne du GPL mais aussi du bien non libre (étonnamment tu parles que de GPL en "oubliant" que ce que tes amis de lutte sont bien contre le libre…).
        
        Et mon plaisir (malsain?) est de voir des gens affichant vouloir partager se mettre à râler sur le partage juste parce qu'on ne fait pas comme eux veulent, ils se font prendre à leur propre jeu (comme avant RMS qui a défini le libre englobant le copyfree pour ratisser large en espérant que le copyleft prendrait la majorité à long terme en arnaquant les libristes à associer le libre "bien" que au copyleft, et le libre s'est libéré de RMS en produisant plus de copyfree que de copyleft).
        
        [^] # Re: Clarification bienvenue
        
        Posté par arnaudus le 11 juillet 2024 à 09:29. Évalué à 4.
        
        Si je te comprends bien, tu es un libriste qui critique les licences copyleft.
        
        Bah c'est assez fréquent en fait, donc tu ne devrais pas être surpris. Sur un répertoire OpenSource par exemple https://www.mend.io/blog/open-source-licenses-trends-and-predictions, les licences les plus populaires sont Apache (30%), suivi par MIT (26%), puis GPL v2 et v3 (à peu près 10% chacune). Donc le "copyleft" n'est souvent pas majoritaire parmi les licences libres; ça dépend évidemment du type de répertoire et de la manière dont on compte.
        
        Mais de toutes manières, l'argument n'est pas que le jugement viole les licences copyleft. Le jugement me semble tout à fait compatible avec l'esprit et la lettre des licences libres copyleft! C'est juste que des gens n'ont pas compris le droit d'auteur et/ou les licences libres et/ou le fonctionnement des LLM. Moi j'utilise les licences copyleft et je ne me suis jamais attendu à ce que la sortie d'un LLM puisse être sous une quelconque licence, pour toutes les raisons que j'ai évoquées au dessus. Donc tu n'arrêtes pas de dire qu'on te prête des idées que tu n'as pas, mais tu n'arrêtes pas de répéter que les libristes devraient s'opposer à ce jugement. Or, ce jugement me semble parfaitement logique, sur la forme et sur le fond, et parfaitement en accord avec le droit d'auteur et les licences logicielles libres et copyleft. Es-tu certain d'avoir bien compris comment fonctionne le droit d'auteur, les logiciels libres, et les LLM? Si oui, alors ça serait pas mal de présenter clairement ton raisonnement, plutôt que de partir dans tous les sens avec des analogies sur les armes à feu que personne ne comprend.
        
        Si tu veux dire que tu croyais avoir compris que les licences libres te protégeaient de l'analyse du code par des grandes entreprises, et qu'elles interdiraient la diffusion du produit de cette analyse, alors 1) je te crois, mais 2) le problème vient de toi, parce que rien dans le texte de la licence ne permettait de te faire croire ça. Tu t'étais donc fourvoyé et tu peux être légitimement dégoûté, mais ça ne sert à rien de t'en prendre à tout le monde, aux libristes qui ne sont pas d'accord avec toi, aux juges, aux grandes entreprises, ou aux LLM.
- [^] # Re: Clarification bienvenue
  
  Posté par Faya le 10 juillet 2024 à 20:57. Évalué à 6.
  
  Une phrase triviale ("Il prit son chapeau et ferma la porte derrière lui") a toutes les chances d'avoir déjà été écrite.
  
  Raté, d'après le plus gros corpus au monde (/s) tu es la seule personne à l'avoir déjà écrite :
  https://www.google.com/search?q=%22Il+prit+son+chapeau+et+ferma+la+porte+derri%C3%A8re+lui%22
  
  Voilà, c'était juste pour le plaisir de vérifier. Je poursuis ma route et la lecture du commentaire.
  - [^] # Re: Clarification bienvenue
    
    Posté par arnaudus le 11 juillet 2024 à 09:36. Évalué à 4.
    
    Tu as parfaitement raison. Ça marche avec les deux bouts de phrases indépendamment, mais personne ne les avait jamais mis ensemble! :-)
    
    Ceci dit, l'originalité de la citation ne permet pas forcément de prouver la contrefaçon, puisqu'il reste possible d'assembler ces deux bouts de phrase par hasard. Et par dessus tout, il est peu probable qu'une phrase aussi triviale puisse être qualifiée d’œuvre de l'esprit. Ça n'est pas une question de longueur, puisque "Les sanglots longs des violons de l'automne" est clairement une œuvre de l'esprit, alors que "J'ai vachement mal au bide ce matin", probablement pas :-)
    - [^] # Re: Clarification bienvenue
      
      Posté par Faya le 11 juillet 2024 à 17:00. Évalué à 2.
      
      "Les sanglots longs des violons de l'automne" est clairement une œuvre de l'esprit, alors que "J'ai vachement mal au bide ce matin", probablement pas :-)
      
      Je m'éloigne un peu du sujet mais je me demande si la popularité d'une œuvre peut influencer ce qu'on considère comme une œuvre de l'esprit. "Aujourd'hui maman est morte" est sûrement considérée comme tel, il y a carrément des études dessus mais si elle avait été écrite par moi sur un forum et pas par Camus dans son roman, elle n'aurait pas le même statut. Et donc œuvre de l'esprit ou pas dépendrait autant de l'objet lui même que du statut qu'il acquiert après sa publication ?
      - [^] # Re: Clarification bienvenue
        
        Posté par arnaudus le 12 juillet 2024 à 15:25. Évalué à 5.
        
        Et donc œuvre de l'esprit ou pas dépendrait autant de l'objet lui même que du statut qu'il acquiert après sa publication ?
        
        Normalement non, je ne crois pas. Ce qui compte, c'est la démarche : création intellectuelle ou artistique. En droit, il me semble aussi qu'on retient le critère de la personnalité de l'auteur pour déterminer l'originalité (en gros, est-ce que quelqu'un d'autre dans ce domaine aurait fait la même chose ou pas, est-ce qu'on peut reconnaitre l'auteur à l'aveugle par exemple). Une photo toute floue parce que tu as fais une fausse manip n'est pas une œuvre de l'esprit, la même photo faite exprès l'est. Définition assez bizarre et peu opérationnelle, je trouve…
        
        Dans les faits, le code de la propriété intellectuelle donne depuis 1994 une liste non exhaustive (https://www.legifrance.gouv.fr/codes/article_lc/LEGIARTI000006278875): les livres, les films, les dessins, les photos, le code informatique, les créations de mode… Du coup, quand tu es là-dedans, tu n'as pas à t'embêter avec ces histoires d’œuvres de l'esprit. C'est bien pratique pour les logiciels, parce que c'est un domaine où ça n'est carrément pas évident que le code porte en lui la personnalité de son auteur…
        
        De toutes manières, le droit n'est pas une science exacte. On avait déja discuté ici de plusieurs cas où la justice avait reconnu des droits pour les photographies de tableaux dans le domaine public, en prétextant du fait que le photographe devait faire des réglages et choisir l'éclairage, ce qui semble profondément contraire à l'esprit de la loi (quand ton but est de fournir une copie conforme, tous les réglages n'ont pour unique but de ne pas modifier l'oeuvre originale; quelle que soit la difficulté de la tâche il n'y a aucune démarche artistique). L'argument des musée est l'équilibre financier (dur dur d'être un musée, les reproductions papier sont une source de revenus, si on nous retire ça on va fermer et les conséquences pour la société sont terribles, etc), et la justice interprète la loi comme il faut pour éviter les conséquences néfastes d'une éventuelle application à la lettre. C'est quelque chose que je n'ai jamais compris, mais je n'y connais rien en droit, et c'est pour ça qu'il est toujours difficile d'être trop affirmatif : ça n'est pas parce que quelque chose découle logiquement d'une lecture naïve d'un texte de loi qu'on peut prédire une décision de justice.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.