Tandis que la mise en œuvre de l'IA Act est actuellement en cours, différents mécanismes d'application ont été prévus par ce règlement. L'un des plus importants est constitué par les codes de pratique, qui sont actuellement élaborés par l'Office de l'IA et un large éventail de parties prenantes. Ces codes de pratique constituent un ensemble de lignes directrices pour le respect de l'IA Act. Ils représenteront un outil essentiel pour garantir le respect des obligations, particulièrement durant la période intermédiaire entre l'entrée en vigueur des obligations des fournisseurs de modèles d'IA à usage général (août 2025) et l'adoption des normes (août 2027 ou plus tard). Bien que ces codes ne soient pas juridiquement contraignants, le respect de ces lignes directrices servira de «présomption de conformité» aux obligations des fournisseurs de modèles GPAI (« General Purpose Artificial Intelligence ») jusqu'à l'entrée en vigueur de normes plus robustes. Les codes de pratique sont élaborés dans le cadre d'un processus multipartite, impliquant des groupes de travail, des experts universitaires et indépendants, des fournisseurs de modèles d'IA, des membres de la société civile, etc. L'Office AI de l'UE évaluera l'adéquation des codes de pratique et pourra les approuver par le biais d'un acte d'exécution. Dans l'hypothèse où un code de pratique ne pourrait être finalisé, la Commission se réserve la possibilité de fournir des règles communes pour la mise en œuvre.
Le projet de « Code de pratiques pour les modèles d'intelligence artificielle généraliste (GPAI) », publié le 18 novembre dernier, s'inscrit dans ce cadre légal précis. Il consacre notamment une attention particulière à la conformité des modèles avec les règles européennes en matière de droits de propriété intellectuelle, et c’est sous cet angle uniquement que nous allons analyser ce nouveau texte.
Le Code établit des mesures détaillées visant à encadrer l'utilisation des contenus protégés tout au long du cycle de vie des modèles, depuis leur entraînement jusqu'à leur déploiement. Ces dispositions, qui s'appuient sur les articles 53 et 55 de l'IA Act, sont complétées par les règles issues de la Directive (UE) 2019/790 sur le droit d'auteur et les droits voisins dans le marché unique numérique, en particulier les exceptions et limitations applicables à l'extraction de textes et de données (TDM).
Rappelons pour mémoire que l'Article 53 de l'IA Act relatif aux obligations incombant aux fournisseurs de modèles d'IA à usage général dispose expressément que ces derniers sont tenus de mettre en place une politique visant à se conformer au droit de l'Union en matière de droit d'auteur et droits voisins, en identifiant et respectant, notamment au moyen de technologies de pointe, une réservation de droits exprimée conformément à l'article 4, paragraphe 3, de la directive (UE) 2019/790 ; qu’ils sont également tenus d’élaborer et mettre à la disposition du public un résumé suffisamment détaillé du contenu utilisé pour entraîner le modèle d'IA à usage général, conformément à un modèle fourni par le Bureau de l'IA. Ces règles de l’IA Act sont ainsi complétées par certaines des dispositions de ce Code de pratiques, dont nous feront ci-après une synthèse :
Le Code impose aux fournisseurs de GPAI de documenter et de rendre accessibles les informations relatives aux données utilisées pour l'entraînement, le test et la validation de leurs modèles. Cette obligation s'applique spécifiquement aux données protégées par des droits de propriété intellectuelle.
L'article 53(1)(c) de l'AI Act dispose que les fournisseurs doivent mettre en place une politique de conformité avec le droit d'auteur, incluant des mécanismes permettant d'identifier et de respecter les réserves de droits exprimées par les titulaires, conformément à l'article 4(3) de la Directive 2019/790. Le Code précise que cette transparence doit inclure :
Une question demeure néanmoins en suspens : celle de savoir si les fournisseurs doivent divulguer «chaque œuvre utilisée individuellement». Le document indique qu'une telle exigence pourrait être disproportionnée pour certains modèles, notamment ceux entraînés sur des ensembles de données massifs, comme des corpus web. Il est toutefois recommandé que les fournisseurs communiquent des informations générales sur les jeux de données, y compris des métadonnées permettant d'identifier les catégories d'œuvres utilisées, leur origine et le respect des éventuelles réserves de droits.
Le Code insiste sur la nécessité pour les fournisseurs d'utiliser des technologies de pointe pour identifier et respecter les réserves de droits (op out). Cela comprend :
Le texte recommande également la participation des fournisseurs à des discussions collaboratives avec les titulaires de droits, les organisations de gestion collective et d'autres parties prenantes pour développer des standards interopérables permettant une gestion automatisée des droits à grande échelle. Ces discussions pourraient être pilotées par la Commission européenne, qui serait chargée d'établir des solutions reconnues comme "état de l'art".
Les fournisseurs doivent tenir à jour une documentation technique détaillée sur les données utilisées, à destination de l'AI Office et, dans certains cas, des autorités nationales compétentes. Cette documentation doit inclure :
Le Code encourage également la transparence vis-à-vis du public en publiant, sur le site du fournisseur, des informations générales sur les politiques de conformité en matière de droit d'auteur. Ces informations doivent être accessibles et rédigées dans un langage compréhensible pour un large public.
La Directive (UE) 2019/790 prévoit des exceptions et limitations spécifiques pour l'extraction de textes et de données (TDM), qui permettent, sous conditions, d'utiliser des contenus protégés sans autorisation préalable. Cependant, les titulaires de droits peuvent exprimer une réserve explicite, interdisant l'utilisation de leurs œuvres à ces fins. Le Code oblige les fournisseurs à :
Pour prévenir les risques de production d'œuvres contrefaisantes ou similaires à des œuvres protégées, le Code exige des fournisseurs qu'ils implémentent des mécanismes techniques visant à :
Conclusion
Le projet de Code de pratiques met en place des exigences rigoureuses pour encadrer l'utilisation des contenus protégés dans le développement des GPAI. Bien qu'il n'impose pas encore la divulgation exhaustive œuvre par œuvre des données utilisées, il insiste sur une transparence accrue, tant vis-à-vis des autorités que du public, et sur l'emploi de technologies avancées pour garantir le respect des droits d'auteur.
En intégrant ces dispositions, le Code cherche à établir un juste équilibre entre innovation technologique et protection des droits des créateurs, tout en créant un cadre de référence harmonisé pour les fournisseurs opérant dans l'Union européenne.