LAION est une organisation à but non lucrative qui fournit des datasets, ensembles structurés de données pouvant se présenter sous différents formats (textes, chiffres, images, vidéos, etc.) et sous différents types (tableaux, graphes, arbres, etc.). Ces datasets sont utilisés par LAION pour entrainer des modèles d’IA générative telles que Stable Diffusion et Midjourney, favorisant ainsi la recherche en apprentissage automatique. Christoph Schuhmann, son créateur, a réussi à collecter plus de 5,8 milliards d’images provenant de diverses sources et qui sont accessibles gratuitement en ligne, sur son site internet : https://laion.ai/.
Dans cette affaire, LAION a intégré une photographie de Robert Kneschke dans LAION-5B, un de ses sets d’entrainement constitué de liens vers des images et de descriptions textuelles associées. La photographie, en basse résolution et filigranée, provenait du site Bigstockphoto, où Kneschke la commercialisait et dont les conditions d’utilisation interdisaient explicitement l’exploitation des images par des « programmes automatisés ».
Assigné devant le tribunal régional de Hambourg par Robert Kneschke pour violation de ses droits d’auteur, LAION a notamment invoqué pour sa défense les exceptions de data mining prévues par la directive UE 2019/790 du Parlement européen et du Conseil du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique (ci-après « DAMUN »), lesquelles ont été transposées aux sections 60d et 44b du Code allemand de la propriété intellectuelle (UrhG) mais aussi à l’article L122-5-3 du Code français de la propriété intellectuelle.
Le data mining est crucial pour l’entraînement de modèles d’intelligence artificielle, comme ceux utilisés par LAION. Il se définit comme une analyse informatique automatisée d’informations sous forme numérique (texte, sons, images, données) qui rend possible le traitement de grandes quantités d’informations.
La directive DAMUN valide la pratique du date mining dans deux cas de figure :
Dans une décision du 27 septembre 2024, le Tribunal régional de Hambourg a rendu une décision inédite concernant ces deux exceptions de data mining invoquées par LAION, la première en Europe. Le juge allemand s’est prononcé sur l’application de l’exception de data mining à des fins de recherches scientifiques, transposée à la section 60d UrhG. Il reconnait dans un premier temps que la création du dataset par LAION relève de la recherche scientifique - même si celle-ci n’était pas encore associée à un gain immédiat de connaissances – après avoir constaté que le dataset avait été rendu disponible gratuitement à la communauté scientifique. Il estime dans un second temps que LAION, en mettant à disposition gratuitement le dataset, ne poursuit pas d’objectifs commerciaux, même si celui-ci peut être réutilisé par des organisations commerciales. Par conséquent, LAION répondant aux exigences de cette exception de data mining, le tribunal en conclut à l’absence de violation par cette dernière du droit d’auteur de Robert Kneschke.
Bien qu’il n’ait pas eu à statuer sur la question de l’exception de data mining dit « général » transposée à la section 44b UrhG, compte-tenu de la nature scientifique de l’exploitation, le tribunal a saisi l’opportunité de cette décision pour fournir des pistes de raisonnement sur les conditions de son application. Le juge allemand affirme que l’opt-out mis en place par Kneschke dans les conditions d’utilisation de Bigstockphoto, bien que rédigée sous la forme d’un texte en langage naturel, répond aux exigences de lisibilité par machine posées par la directive DAMUN. Cette réserve de droits étant valable, la reproduction de la photographie de Robert Kneschke dans le dataset de LAION n’est pas couverte par cette exception.
Cette décision est particulièrement importante puisqu’elle est la première à statuer sur l’application des exceptions de data mining prévues par la DAMUN. Plus particulièrement, elle tranche dans un sens favorable la question de savoir si la création de datasets à des fins de formation d'IA est couverte par l’exception de data mining à des fins de recherche scientifique, même lorsque des sociétés commerciales peuvent en bénéficier indirectement. Elle souligne également que l’évolution des technologies d’IA doit être prise en compte dans l’interprétation des réservations de droits, ouvrant la voie à des débats futurs sur les relations entre data mining, IA et droit d’auteur.
En conclusion, cette décision allemande nous rappelle que la mise en jeu des exceptions du data mining en matière d’IA est un exercice parfois complexe, et souvent casuistique.
N.B Remerciements de l’auteur à Lou Dutreil, stagiaire DDG, pour son aide précieuse à la rédaction de cet article.