Les enjeux du droit d’auteur à l’ère de l’intelligence artificielle (IA) : entre exceptions et interprétations

La propriété intellectuelle est entrée dans une zone de turbulences provoquées par les IA génératives. L’utilisation d’œuvres reste soumise à l’autorisation des auteurs, mais le droit d’auteur est limité dans certains cas comme la fouille de textes et de données. L’AI Act sera à interpréter.

Par Jade Griffaton et Emma Hanoun, avocates, DJS Avocats*

La récente législation européenne sur l’intelligence artificielle (IA) – l’AI Act dans sa dernière version de compromis final datée du 26 janvier 2024 (1) (*) (**) – adopte une définition flexible de « système d’IA », désigné comme « un système basé sur des machines conçues pour fonctionner avec différents niveaux d’autonomie et d’adaptabilité après leur déploiement et qui, à partir des données qu’il reçoit, génère des résultats tels que des prédictions, du contenu, des recommandations ou des décisions pouvant influencer des environnements physiques ou virtuels » (2).

Exception de « fouille de textes et de données »
La question de la relation entre le droit de la propriété littéraire et artistique et l’IA est une préoccupation ancienne. Lors de la phase d’entraînement, le système d’IA reçoit des données. A ce stade, se pose la question de l’intégration de contenus protégés par le droit d’auteur aux fins du développement du système. Lors de la phase de génération, le système d’IA génère des résultats, voire des créations, à la demande de l’humain. Se pose alors la question de l’encadrement juridique de ces créations générées, en tout ou partie, par un système d’IA. Ces problématiques juridiques actuelles doivent être envisagées à la lumière des nouveaux textes destinés à réguler le domaine de l’IA, et notamment la récente proposition de règlement européen sur l’IA, et la proposition de loi française visant à encadrer l’utilisation de l’IA par le droit d’auteur (3).
De nouveaux contours de la possibilité d’utiliser des œuvres pour entraîner l’IA ? Les systèmes d’IA ont besoin, au stade de leur apprentissage et développement, d’avoir accès à de grands volumes de textes, images, vidéos et autres données. Ces contenus sont susceptibles d’être protégés par le droit d’auteur. L’objectif principal du règlement IA, dévoilé en 2021 par la Commission européenne, consiste à réguler les systèmes d’IA introduits sur le marché européen, en adoptant une approche axée sur les risques et en assurant un niveau élevé de protection des droits fondamentaux, de la santé publique, de la sécurité et de l’environnement. Ainsi, l’AI Act n’a pas vocation à traiter les questions relatives au droit d’auteur. Et pourtant, il n’ignore pas totalement leur importance en présence d’un système d’IA. A ce propos, le règlement renvoie à une exception – au principe d’obtention d’une autorisation de l’auteur pour toute utilisation de son œuvre – issue du droit de l’Union européenne (UE), celle de la fouille de textes et de données (text and data mining ou TDM). Cette exception – non spécifique aux systèmes d’IA – permet, semble-t-il, de justifier juridiquement l’utilisation de contenus protégés par le droit d’auteur en dispensant les opérateurs d’IA d’obtenir l’autorisation des auteurs qui ne se sont pas opposés expressément. Elle n’est pas nouvelle. C’est la directive européenne « Droit d’auteur et les droits voisins dans le marché unique numérique » de 2019 (4) qui a voulu rendre obligatoire pour les Etats membres de prévoir une exception aux droits de reproduction d’une œuvre et d’extraction d’une base de données, à des fins d’utilisation de technologies de fouille de textes et de données – technologies qui permettent une analyse informatique automatisée de textes, sons, images ou données sous forme numérique, en grande quantité, en vue d’acquérir de nouvelles connaissances. En y faisant ce renvoi, la proposition de règlement confirme, semble-t-il, que cette exception s’applique aux systèmes d’IA mais n’apporte aucune nouveauté en la matière. La proposition de loi française – dont l’objet même est, contrairement à la proposition européenne, d’encadrer l’IA par le droit d’auteur – envisage d’incorporer dans le code de propriété intellectuelle (CPI), au sein de l’article L.131-3, un alinéa prévoyant que l’intégration d’œuvres protégées par le droit d’auteur dans le système d’IA est soumise « à une autorisation par les auteurs ». Une telle formulation – « L’intégration par un logiciel d’intelligence artificielle d’œuvres de l’esprit protégées par le droit d’auteur dans son système et a fortiori leur exploitation est soumise aux dispositions générales du présent code et donc à autorisation des auteurs ou ayants droit » (5) – pourrait recevoir diverses interprétations.

Question de l’« autorisation des auteurs »
L’intégration des œuvres dans un système d’IA est un nouveau mode d’exploitation que la proposition semble avoir voulu prendre en compte. Doit-on comprendre que l’intégration dans une IA est une forme de reproduction de l’œuvre à laquelle s’applique, comme pour toutes formes de reproduction, l’exception de fouilles de textes et de données ? Dans ce cas, le régime actuel est inchangé : donc, les développeurs d’IA peuvent encore intégrer des œuvres à la phase d’entraînement, sauf opposition des auteurs. Doit-on plutôt comprendre que cette formulation veut rompre avec le régime actuel en consacrant expressément une exigence d’obtention d’autorisation de auteurs en écartant l’exception de fouilles de textes et de données ? Dans ce cas, le nombre d’œuvres pouvant être intégrées dans les systèmes d’IA serait réduit à celles dont une autorisation a été donnée, et non celles ne faisant pas l’objet d’opposition. La première interprétation semble la plus appropriée, notamment eu égard à la formulation de l’alinéa précisant que « [l’intégration] est soumise aux dispositions générales du présent code et donc à autorisation des auteurs », et à sa place dans le CPI (6).

Pays de « common law » et pays de « civil law »
Nouvelle exigence de transparence lorsque des œuvres sont utilisées par l’IA. La proposition AI Act, bien qu’elle n’ait pas vocation à traiter de la question du droit d’auteur, exige des fournisseurs de systèmes d’IA une certaine transparence lorsque des contenus protégés par un droit d’auteur ont été utilisés au stade du développement dudit système. En effet, le texte contraint les fournisseurs de modèles d’IA à finalité générale (« general purpose IA models ») à mettre en place une politique pour respecter le droit d’auteur de l’UE, et à rendre public un résumé suffisamment détaillé du contenu utilisé pour entraîner le modèle d’IA à finalité générale (7). La mise en place de la politique aurait pour objectif d’identifier et respecter les réservations de droits – ou oppositions – au titre de l’exception de fouilles de textes et de données.
La publication du résumé suffisamment détaillé devrait se faire à partir d’un modèle publié par l’Office de l’intelligence artificiel (OIA, ou AI Office), organe instauré par la proposition de législation. Il aurait pour objet – sans être techniquement détaillé – « par exemple d’énumérer les principales collections ou ensembles de données qui ont servi à la formation du modèle, tels que les grandes bases de données privées ou publiques ou les archives de données, et en fournissant une explication narrative sur les autres sources de données utilisées » (8). De telles exigences en termes de transparence témoignent de la prise en compte des exigences posées par le droit d’auteur. D’autant que le règlement IA prévoit que les obligations de transparences ne s’appliquent pas aux fournisseurs de systèmes d’IA rendant accessibles au public, sous licence libre ou ouverte, les modèles d’IA (9) sauf celles liées au droit d’auteur. Sortir les exigences de transparence liées au droit d’auteur de l’exception générale témoigne encore de leur importance.
Vers une remise en cause de la non-« protégeabilité » des créations issues d’un système d’IA ? Alors que les pays de « common law » comme le Royaume Uni et les Etats-Unis admettent la « protégeabilité » des œuvres générées par des machines (10) – notamment parce que l’œuvre est placée au centre et les auteurs obtiennent une protection indirecte à travers la protection directe de la propriété créée –, les pays de « civil law » ont tendance à refuser qu’une œuvre au sens juridique du terme puisse être créée par une machine dès lors que la protection est attachée directement à la personne de l’auteur. Traditionnellement, l’originalité s’entend en droit français et européen de l’empreinte de la personnalité de l’auteur en manifestant ses choix libres et créatifs (11). Une telle conception exclut a priori toute originalité d’une œuvre conçue par une IA du fait du défaut de personnalité de l’IA. Si, le règlement IA ne traite pas de la question de la « protégeabilité » des « créations » générées par l’IA, la proposition de loi française, a contrario, tente de plonger au cœur du sujet. Elle envisage d’intégrer au sein de l’article L.321-2 du CPI le cas précis d’une « œuvre créée par une intelligence artificielle sans intervention humaine directe » (12). Par cette disposition, le droit français semble admettre qu’une œuvre puisse être créée par une machine, et non un être humain. Dans ce cas, la proposition de loi désigne comme titulaires des droits, non pas les personnes ayant développé le système ou ayant commandé la création à la machine, mais les auteurs des œuvres intégrées au système d’IA lors de la phase d’entraînement.
L’œuvre serait-elle alors empreinte de la personnalité des auteurs des œuvres premières ayant servi à entraîner le système d’IA ? Ces auteurs seraient à la fois titulaires de droits sur leur œuvre première – sans difficulté – et de droits sur les œuvres générées par l’IA lorsque leur œuvre première aurait été exploitée au stade de développement de l’IA. La problématique qui se pose d’emblée en pratique est celle de la multitude de titulaires d’une œuvre générée par un système d’IA. La proposition de loi envisage alors que les droits soient gérés par des organismes de gestion collective (comme la Scam ou la Sacem) qui percevront la rémunération ou une taxation versée par la société qui exploite le système d’IA lorsque l’œuvre est engendrée par l’intégration d’œuvres dont l’origine ne peut être déterminée. La proposition de loi exige aussi que soit apposée la mention « Œuvre générée par IA » et inséré le nom des auteurs des œuvres premières.

Protection des œuvres générées par l’IA
En revanche, la protection accordée aux œuvres générées par l’IA ne semble pas aussi complète que celle accordée aux œuvres « classiques » : la proposition de loi française ne traite pas plus du droit moral ni des autres droits patrimoniaux que de celui de la rémunération juste et équitable des auteurs. Peut-être que cela s’explique par l’ambition de la proposition de loi « Encadrer l’intelligence artificielle par le droit d’auteur » de garantir une rémunération juste et équitable de l’exploitation des œuvres et de garantir une traçabilité des auteurs et artistes. Il reste à voir comment seront appréhendées en pratique de telles évolutions juridiques. @

* Article écrit avec la collaboration
de Camille Rodriguez, DJS Avocats

A 170 ans, la Sacem n’a jamais été aussi fragilisée mais compte rebondir grâce aux droits d’auteur du numérique

Une nouvelle ère plus « streaming », « data », « blockchain » et même « métavers » ou « NFT » s’ouvre à la Société des auteurs, compositeurs et éditeurs de musique (Sacem). Cécile Rap-Veber, première femme à sa tête en 170 ans, devra aussi sortir de son déficit chronique cet organisme historique de la gestion collective. Pour ses 170 ans, la Sacem n’est pas près de partir à la retraite ni de battre en retraite. Pourtant, la chute de ses recettes au cours de 2020 et 2021, années sévèrement impactées par les fermetures des lieux publics diffusant de la musique (salles de concert, festivals, discothèques, cafés, bars à ambiance musicale, magasins, salles de cinémas, hôtels, kermesses, …), met en péril cette société privée à but non lucratif créée en 1851. Sa santé financière était cependant déjà vacillante avant la pandémie de coronavirus, puisque la Sacem est déficitaire depuis trois années consécutives – quand bien même n’a-t-elle pas vocation à dégager des bénéfices ni à verser des dividendes à des actionnaires. Rien que pour l’année 2020, la « perte » s’est creusée de plus de 800 % sur un an, à près de 33 millions d’euros, ce que la société de gestion collective des droits musicaux appelle « l’insuffisance de prélèvements ». Mais ce n’est pas ce déficit-là (32,7 millions précisément) sur lequel la maison ronde de l’avenue Charles-de-Gaulle à Neuillysur- Seine a communiqué l’an dernier, mais sur un « un résultat de gestion négatif » de 26,8 millions d’euros, montant repris par les médias. La différence non négligeable vient de la « réserve positive de 5,9 millions d’euros à fin 2019 » qui a permis de parvenir à un solde négatif moindre en fin d’exercice 2020. 330 millions d’euros versés par les plateformes numériques en 2021 Cette « insuffisance de prélèvements » représente alors un pourcentage de 12 % des charges de la Sacem (1). Du jamais vu en 170 ans, d’autant que ses statuts prévoient que « le compte de gestion ne peut connaître (…) de déficit supérieur à 5 % du total des charges brutes ». Comme pour l’année 2020, la société de gestion collective des droits musicaux a dû décider, lors de son assemblée générale de juin dernier, d’y déroger aussi pour l’année 2021, dont l’ampleur du déficit n’est pas encore connue. « La crise a accentué la fragilisation de vos métiers et de vos revenus. Vous le savez, l’année 2022 restera une année difficile, puisque les droits d’auteur sont par nature versés en décalé et que nous subirons les pertes liées à l’absence de vraie reprise en 2021 », a déjà prévenu Cécile Rap-Veber (photo de Une), nouvelle directrice générale-gérante de la Sacem, en s’adressant fin décembre aux 182.520 membres en France et à l’international (dont 175.750 auteurs, compositeurs, créateurs et 6.770 éditeurs), dans le magazine des sociétaires. La Sacem, organisée sur le modèle d’une coopérative, collecte et répartit les droits d’auteur qu’elle considère comme le « salaire » des musiciens : si l’année 2019 du « monde d’avant » affichait une collecte totale de plus de 1,1 milliard d’euros, l’exercice suivant a accusé le coup des fermetures pour s’en tenir à 988,5 millions d’euros, soit une chute de près de 12 %. Le « online » : 35 % de la collecte de la Sacem en 2021 Ce « repli historique » – dixit l’ex-directeur général-gérant Jean-Noël Tronc (photo ci-dessous) dans son rapport de 2020 – touche durement toutes les sources de prélèvement avec pour chacune un recul à deux chiffres en pourcentage (danse, spectacles, sonorisation et autres). Toutes ? Non. Le « online » est le segment, tel que désigné par la Sacem, où la collecte continue de progresser : + 26 % en 2020 à plus de 291,1 millions d’euros, et, d’après Cécile Rap-Veber, les versements dus par les services numériques en ligne à la Sacem ont continué à croître fortement l’an dernier malgré un contexte inchangé pour les autres contributeurs : « Nous estimons ainsi à plus de 330 millions d’euros les droits d’auteur collectés sur les plateformes cette année. La part du online représentera 35 % des revenus de la Sacem en 2021 [contre 29,4 % en 2020 et 21 % en 2019, ndlr], alors qu’elle n’était que de 6 % il y a cinq ans », a-t-elle révélé aux sociétaires. Par temps de crise sanitaire conjuguée au déficit financier chronique, le numérique – streaming et vidéo à la demande en tête – permet à la Sacem de compenser partiellement la baisse des autres droits, à défaut de faire bonne figure. « Cette croissance soutenue résulte à la fois de renégociations et nouveaux contrats (Facebook, Amazon Unlimited), de la croissance des revenus et de régularisations », avait indiqué l’an dernier la Sacem lors de la présentation de ses comptes. Cécile Rap-Veber, surnommée parfois « CRV », a mené ces négociations avec les GAFA et les grandes plateformes de streaming musical que sont Spotify (accord en 2008), YouTube, Apple Music, Amazon Music Unlimited, Facebook (en 2018), SoundCloud, Deezer, mais aussi Netflix (en 2014), Amazon Prime Video (en 2019) et Twitch (en 2020). Les accords dits de « licensing multiterritoriaux » se sont multipliés pour tenter de « capter la valeur des droits de ses membres ». Historiquement, le premier contrat signé par la Sacem remonte à… 1999, avec FranceMP3.com (le pionnier oublié, disparu aujourd’hui, de « la musique du Net » et considéré comme « l’ancêtre français d’iTunes »). CRV est aussi l’initiatrice en 2016 de l’application Urights développée avec IBM dans le cadre d’un contrat de dix ans (courant jusqu’en 2027). Présenté aujourd’hui comme « la première plateforme mondiale de traitement des exploitations d’oeuvres en ligne », cet outil de gestion Big Data des droits numériques a remplacé progressivement l’application Selol jusqu’alors utilisée pour le suivi des droits online (et dépréciée en conséquence dans les comptes de la Sacem). Hébergé dans le cloud du géant américain de l’informatique (« Big Blue » pour les anciens) – n’en déplaise aux souverainistes français du numérique –, Urights a le bras long car il permet l’identification des droits liés aux oeuvres exploitées en ligne, partout dans le monde, à l’aide d’un « tracking » des ventes sur les services de streaming et de téléchargement de musiques. Et boosté à l’intelligence artificielle et au machine learning, Urights apprend vite. La « vieille dame » de 170 ans prend ainsi des airs de start-up géante du Big Data d’envergure internationale, capable de Business Intelligence. A savoir : analyser et présenter des quantités massives de données collectées et en croissance exponentielle, provenant des plateformes de streaming et des autres sociétés de gestion collective dans le monde. « Nous sommes en mesure de traiter plusieurs trilliards d’actes de streaming à l’année », a assuré Cécile Rap-Veber, qui est entrée à la Sacem en 2013 comme directrice des licences. La question de l’évolution de la rémunération des artistes se pose d’ailleurs : fautil inciter les plateformes de streaming à passer du « market centric » (royalties calculées au prorata des écoutes totales) au « user centric » (rémunération en fonction des écoutes individuelles des abonnés) ? La Sacem devra y répondre dans le cadre d’une mission du CSPLA (2) et du CNM (3) sur ce sujet sensible (4), dont la remise du rapport est, selon les informations de Edition Multimédi@, attendu pour juillet prochain (5). Pionnière mondiale dans l’industrie musicale, de par son répertoire d’œuvre qui est le deuxième au monde après l’équivalent anglo-américain, la Sacem va profiter de cette plateforme Urights pour s’ouvrir à la gestion des droits des contenus audiovisuels et à d’autres types de droits (6) comme ceux la presse en venant en soutien de la société Droits voisin de la presse (DVP) créée fin octobre 2021 et présidée par Jean-Marie Cavada. Le «m» de Sacem ne rime plus seulement avec « musique » mais de plus en plus avec «multimédia ». « CRV », avocate, ex-Universal Music et technophile La vieille dame (la Sacem, pas Cécile Rap-Veber, 51 ans) se met en ordre de bataille pour aller chercher les droits d’auteurs jusque dans les tout nouveaux écosystèmes numériques, nouvelles sources de revenus. « Nous allons également renforcer nos investissements technologiques, créer les conditions pour que la Sacem et ses membres s’emparent des innovations telles que les NFT [utilisés par exemple par le rappeur Booba conseillé par CRV, ndlr] ou la blockchain (7), et puissent saisir les nouvelles opportunités que peut créer le métavers », a indiqué aux sociétaires celle qui fut durant treize ans (2000-2013) directrice juridique puis développement de la major Universal Music. Début novembre, la maison ronde de Neuilly sur Seine s’est dotée d’un conseil pour la stratégie et l’innovation (CSI) – « parrainé » par Jean-Michel Jarre. @

Charles de Laubier