Le 1er octobre 2024, Christopher Farnsworth, auteur à succès de fiction notamment connu pour ses romans "Blood Oath", "Flashmob", "The Eternal World" et "The President's Vampire", a engagé une action collective (class action) contre Meta Platforms Inc. devant la Cour fédérale du district nord de Californie. Cette action se fonde principalement sur l'article 501 du Copyright Act de 1976 (17 U.S.C. § 501), qui sanctionne la violation des droits exclusifs de reproduction et de distribution protégés par l'article 106 du même texte.
L’acte expose que Meta aurait copié et reproduit sans autorisation près de 200 000 livres protégés par le droit d'auteur via un ensemble de données appelé "Books3", qui fait partie d'une base de données plus large nommée "The Pile". Books3 est constitué de livres piratés provenant du site "Bibliotik", un référentiel notoirement connu pour héberger des contenus sans licence. Meta a admis, dans un document de recherche publié le 27 février 2023, avoir utilisé Books3 pour développer son modèle Llama 1, tout en étant parfaitement conscient de la nature piratée de ces contenus.
Le demandeur souligne l'ironie de la situation, Meta ayant elle-même eu recours à la procédure DMCA pour protéger ses propres droits sur Llama 1 en mars 2023, alors que ce même modèle aurait été développé en violation des droits d'auteur d'autrui.
Cette demande met en évidence le préjudice économique subi par les auteurs, privés non seulement des ventes de leurs livres mais également des revenus potentiels de licence, dans le contexte d’un marché florissant pour les données d'entraînement d'IA.
L'action, fondée sur la Rule 23(a), (b)(2), (b)(3) et (c)(4) des Federal Rules of Civil Procedure régissant les class actions, vise à obtenir des dommages et intérêts statutaires ou réels au choix des plaignants conformément aux dispositions du Copyright Act, le remboursement des frais d'avocats, ainsi qu'une injonction permanente interdisant à Meta de poursuivre ces pratiques contrefaisantes. La class action représente tous les titulaires de droits d'auteur dont les œuvres enregistrées auprès du Copyright Office et disposant d’un numéro de publication, qui auraient été utilisées par Meta pour l'entraînement de ses modèles de langage.
Cette action fait écho à celle engagée en août 2023 par les auteurs Mona Awad et Paul Tremblay contre Anthropic et son modèle Claude, fondée sur des arguments juridiques similaires concernant l'utilisation non autorisée d'œuvres protégées pour l'entraînement d'IA.
Ces procédures, tout comme les nombreuses autres procédures actuellement en cours aux États-Unis, illustre une tendance croissante des auteurs à contester juridiquement l'utilisation de leurs œuvres par les entreprises d'IA, soulignant un conflit majeur entre les droits de propriété intellectuelle traditionnels et les pratiques émergentes en matière d'intelligence artificielle. Ces affaires judiciaires devraient apporter, dans les prochains mois, une clarification très intéressante de la notion anglo-saxonne de « fair use », appliquée à l'intelligence artificielle, pour décider si les systèmes d’IA ce sont ou non rendus coupables du « péché originel » de contrefaçon massive pour l'entraînement de leurs modèles de langage.
N.B Remerciements de l’auteur à Lou Dutreil, stagiaire DDG, pour son aide précieuse à la rédaction de cet article.