C'est quand même un peu potache, et ça ne définit pas bien la question. Tout ce matériel était a priori accessible, et il n'est pas évident que les robots d'openAI aient contrevenu aux conditions d'utilisation des sites. C'est un peu comme si tu faisais regarder la télé à un robot, a priori, il n'y a pas d'infraction au droit d'auteur, le flux était disponible.
Les deux questions sont donc 1) est-ce qu'OpenAI ou ses copains ont contrevenu aux conditions d'utilisation des sites (est-ce qu'ils ont aspiré le contenu pour le stocker autrement que dans un cache par exemple), et 2) est-ce que le texte produit par les modèles de langage contrevient au droit d'auteur (est-ce du travail dérivé).
Pour moi, 1) doit être décidé au cas par cas en fonction des sites et de la manière dont les robots ont eu accès au contenu, et 2) ne fait aucun doute en droit français au moins: si le modèle n'est pas surparamétré (qu'il ne recrache pas des bouts de texte comme le faisait l'assistant de Github à un moment), la production du modèle n'est pas un travail dérivé, et elle n'est pas soumise à droit d'auteur (parce qu'elle n'est pas une œuvre de l'esprit, vu que la jurisprudence est assez claire sur le fait que seuls les humains sont susceptibles de produire des œuvres de l'esprit).
Je sais bien que certains ne comprennent pas comment tu peux entrainer un robot avec 100% de code GPL et produire du code sans licence au bout, mais la loi ne prévoit la persistance des droits d'auteurs que pour le travail dérivé (quand tu peux prouver que la deuxième œuvre a été dérivée de la première, comme une traduction ou un résumé).
# J'adore l'analogie du jour
Posté par volts . Évalué à 10.
Ça me fait penser à cette BD.
[^] # Re: J'adore l'analogie du jour
Posté par arnaudus . Évalué à 3.
C'est quand même un peu potache, et ça ne définit pas bien la question. Tout ce matériel était a priori accessible, et il n'est pas évident que les robots d'openAI aient contrevenu aux conditions d'utilisation des sites. C'est un peu comme si tu faisais regarder la télé à un robot, a priori, il n'y a pas d'infraction au droit d'auteur, le flux était disponible.
Les deux questions sont donc 1) est-ce qu'OpenAI ou ses copains ont contrevenu aux conditions d'utilisation des sites (est-ce qu'ils ont aspiré le contenu pour le stocker autrement que dans un cache par exemple), et 2) est-ce que le texte produit par les modèles de langage contrevient au droit d'auteur (est-ce du travail dérivé).
Pour moi, 1) doit être décidé au cas par cas en fonction des sites et de la manière dont les robots ont eu accès au contenu, et 2) ne fait aucun doute en droit français au moins: si le modèle n'est pas surparamétré (qu'il ne recrache pas des bouts de texte comme le faisait l'assistant de Github à un moment), la production du modèle n'est pas un travail dérivé, et elle n'est pas soumise à droit d'auteur (parce qu'elle n'est pas une œuvre de l'esprit, vu que la jurisprudence est assez claire sur le fait que seuls les humains sont susceptibles de produire des œuvres de l'esprit).
Je sais bien que certains ne comprennent pas comment tu peux entrainer un robot avec 100% de code GPL et produire du code sans licence au bout, mais la loi ne prévoit la persistance des droits d'auteurs que pour le travail dérivé (quand tu peux prouver que la deuxième œuvre a été dérivée de la première, comme une traduction ou un résumé).
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.