Comment Claude de la start-up Anthropic veut devenir le grand rival de ChatGPT d’OpenAI

Alors que ChatGPT a été lancé par la start-up OpenAI il y a moins d’un an, c’est la course à l’échalotte dans les intelligences artificielles génératives. Parmi les compétiteurs, il y a Claude de la jeune pousse Anthropic fondée par d’anciens… d’OpenAI. Google et surtout Amazon la financent.

Question : Claude est-il le meilleur rival de ChatGPT ? Réponse : « Claude, développé par Anthropic, est en effet considéré comme un concurrent puissant du ChatGPT d’OpenAI ». Notre interlocuteur n’est autre que ChatGPT lui-même ! « Cependant, poursuit l’IA générative, il est important de noter que le “meilleur” modèle peut varier selon les cas d’utilisation et les exigences. Par exemple, si le support multilingue est une priorité, ChatGPT pourrait être un meilleur choix. En revanche, si le traitement de grandes quantités de données est crucial, Claude pourrait être plus approprié ».

Contre Microsoft, pour Amazon et Google
Alors que ChatGPT d’OpenAI a été lancé le 30 novembre 2022 (1) avec le succès médiatique planétaire que l’on connaît, Claude d’Anthropic n’a été dévoilé que le 14 mars 2023 (2) dans une relative indifférence générale. Mais depuis qu’Amazon a annoncé le 25 septembre injecter 4 milliards de dollars dans Anthropic (3), Claude défraie la chronique. Basée à San Francisco (Californie) comme OpenAI, la startup Anthropic a été cofondée par Dario Amodei (photo de gauche), qui en est le DG, tandis que Daniela Amodei (photo de droite), sa sœur, en est la présidente.
Tous les deux ont quitté en décembre 2020 OpenAI, où ils ont été respectivement directeur de la recherche et responsable des techniques de sécurité, suivis par sept autres de leurs collègues d’OpenAI, dont Jack Clark (ex-chargé de relations publiques) et Jared Kaplan (ex-consultant chercheur) qui sont aussi cofondateurs d’Anthropic. Ce départ groupé de la start-up de ChatGPT aurait été motivé par des désaccords sur la vision stratégique d’OpenAI et de son partenariat avec Microsoft en 2019. La firme de Redmond investissait alors dans la start-up de Sam Altman un montant initial de 1 milliard de dollars, complété en 2021. Mais les frère et sœur Amodei n’ont jamais ni démenti ni expliqué les raisons de leur départ. Mais cette façon qu’a eu OpenAI à se précipiter dans les bras d’un GAFAM a sans aucun doute joué dans leur décision d’aller cofonder Anthropic. Microsoft a par la suite augmenté son emprise sur ChatGPT en annonçant en janvier 2023 un plan d’investissement pluriannuel (4) dans OpenAI qui atteindrait, selon Bloomberg, 10 milliards de dollars (5). Face à un ChatGPT dépendant du géant Microsoft, lequel en a fait son IA générative dans moteur de recherche Bing pour aller contester la suprématie de Google Search, Anthropic se veut plus indépendant et responsable. Mais cela n’empêche pas la start-up des Amodei de décrocher 4 milliards de dollars auprès d’Amazon, dont il utilisera le cloud AWS, après avoir dans les dix-huit mois précédents levé 1,5 milliard de dollars auprès de différents investisseurs, dont… Google pour 300 millions de dollars (10 % du capital d’Anthropic). Et ce, selon le Financial Times (6), aux côtés de Sam Bankman-Fried (7) ou encore de SK Telecom (8). Google remis la main à la poche en mai 2023 lors d’un tour de table organisé par Spark Capital pour lever 450 millions de dollars (9). Mais contrairement à Microsoft pour OpenAI, Google reste pour Anthropic un actionnaire minoritaire et un prestataire technique. En effet, le 3 février, les deux entreprises ont annoncé « un nouveau partenariat » (10) afin que Google Cloud soit privilégié et que Claude puisse évoluer grâce au machine learning sur infrastructure puissante. Avec Claude 2 lancé en juillet (11), Anthropic se veut plus contrôlable, compréhensible, prévisible, orientable, interprétable, digne de confiance et… plus humain grâce au RLHF.
Le « Reinforcement Learning from Human Feedback » est une méthode d’apprentissage par renforcement qui utilise le feedback des humains sous formes de commentaires ou d’évaluations. Anthropic vient d’ailleurs de publier, le 19 septembre, son RSP (Responsible Scaling Policy), « une série de protocoles techniques et organisationnels pour gérer de façon de plus en plus performante les risques liés au développement de systèmes d’IA ». Car selon les fondateurs d’Anthropic, « les modèles d’IA créeront une valeur économique et sociale majeure, mais ils présenteront également des risques de plus en plus graves » (12).

Parmi 7 acteurs d’IA à la Maison-Blanche
Ce RSP d’Anthropic intervient deux mois après des engagements pris directement à la Maison-Blanche où Dario Amodei avait été convoqué, le 21 juillet, par le président étatsunien Joe Biden avec six autres entreprises : Amazon, Google, Meta, Microsoft, Inflection et OpenAI. Les sept acteurs de l’IA ont promis « un développement sûr, sécurisé et transparent de la technologie de l’IA » (13). Une précédente réunion à la Maison-Blanche s’était tenue le 4 mai (14). L’administration Biden-Harris en a profité pour faire le point sur les mesures prises – notamment via le Blueprint for an AI Bill of Rights (15) – afin de protéger les droits et la sécurité des Américains. @

Charles de Laubier

Discours de la présidente von der Leyen sur l’état de l’UE : l’IA a éclipsé le métavers européen

Lors de son discours sur l’état de l’Union européenne, prononcé le 13 septembre, Ursula von der Leyen – présidente de la Commission européenne – s’est focalisée sur l’intelligence artificielle. Mais pas un mot sur la stratégie du métavers européen, dont les défis sont pourtant nombreux.

Ursula von der Leyen (photo) a fait l’impasse sur les mondes virtuels. La présidente de la Commission européenne, dont le mandat commencé en décembre 2019 se terminera en novembre 2024, n’a pas eu un mot sur le métavers européen dans son discours du 13 septembre (1) à Strasbourg sur l’état de l’Union européenne (UE). Ni dans sa lettre d’intention datée du même jour et envoyée de Bruxelles à la présidente du Parlement européen (2) et au président du Conseil de l’UE (3), pour leur faire part de ses « principales priorités pour 2024 » (4).

Mondes virtuels : principes directeurs fin 2023
Pourtant, les défis des mondes virtuels sont tout aussi importants que ceux des intelligences artificielles. Est-ce à dire que « la nouvelle stratégie sur le Web 4.0 et les mondes virtuels » – présentée à Strasbourg le 11 juillet dernier n’est plus prioritaire d’ici les élections du Parlement européen de juin 2024 ? Ursula von der Leyen semble avoir tourné la page du « métavers européen », renvoyant la mise en œuvre à la Commission européenne 2024-2029.
« Les mondes virtuels changeront la façon de vivre en société et leur avènement s’accompagnera de possibilités et de risques qui doivent être pris en compte », avaient pourtant prévenu cet été pas moins de trois commissaires européens – Margrethe Vestager, Dubravka Suica et Thierry Breton – en dévoilant cette nouvelle stratégie et son calendrier. Ainsi, d’ici fin 2023, la Commission européenne va promouvoir des « principes directeurs pour les mondes virtuels », identifiés par un panel de 150 citoyens européens sélectionnés de façon aléatoire (5) et réunis entre les mois de février et d’avril derniers. Il en était ressorti 23 recommandations (6) qui ont inspiré la stratégie « Mondes virtuels », parmi lesquelles : « formation harmonisée pour le travail dans les mondes virtuels » ; « soutien financier au développement des mondes virtuels » ; « forums participatifs pour des avancées, des réglementations et des normes communes » ; « police pour agir et protéger dans les mondes virtuels » ; « accessibilité pour tous – personne n’est laissé de côté » ; « labels/certificats européens pour les applications des mondes virtuels », etc. Ces recommandations s’articulent autour de huit valeurs et principes applicables aux métavers : liberté de choix, durabilité, approche centrée sur l’humain, santé, éducation, sûreté et sécurité, transparence et intégration. La Commission européenne veut ainsi faire des mondes virtuels en Europe « un environnement numérique ouvert, sécurisé, digne de confiance, équitable et inclusif » (7). Elle veut aussi rendre disponibles au premier trimestre de 2024 des « orientations à l’intention du grand public » grâce à une « boîte à outils pour les citoyens » afin de les orienter. Il s’agit pour l’Europe de ne pas manquer la marche du siècle vers le Web3, où le marché mondial des mondes virtuels devrait exploser à plus de 800 milliards d’euros d’ici à 2030, contre 27 milliards d’euros en 2022. Et d’ici 2025 (soit dans moins de deux ans), les Vingt-sept pourraient totaliser 860.000 nouveaux emplois dans le secteur de la réalité étendue (virtuelle et augmentée). La Commission européenne va créer avec les Etats membres « un réservoir de talents » pour le développement des compétences, qui sera financé par les programmes Digital Europe (8) et Europe Creative (9). Du côté de l’écosystème industriel du Web 4.0, et dans le but d’éviter la fragmentation de ma chaîne de valeur des mondes virtuels, il est prévu de faire appel à un autre programme européen, Horizon Europe (10), pour que débute en 2025 « un partenariat candidat sur les mondes virtuels, afin de promouvoir l’excellence dans la recherche et d’élaborer une feuille de route industrielle et technologique pour les mondes virtuels ».
La Commission européenne a en outre promis d’aider les créateurs et les entreprises de médias de l’UE « à tester de nouveaux outils de création, à rapprocher les développeurs et les utilisateurs industriels, et à travailler avec les Etats membres à la mise au point de bacs à sable réglementaires pour le Web 4.0 et les mondes virtuels ». Les mondes virtuels concerneront autant les particuliers que les professionnels.

Meta Platforms y croit plus que l’Europe
Parmi les projets pan-européens sur les rails : DestinE (Destination Earth), qui vise à créer un jumeau numérique de la Terre pour simuler et visualiser au plus près l’évolution du climat, et CitiVerse, qui sera un environnement urbain immersif pour la planification et la gestion urbaines. Pour l’heure, le groupe américain Meta Platforms (ex-Facebook) essuie les plâtres (11) mais il a pris de l’avance en investissant des milliards dans son métavers perfectible Horizon Worlds (12). Apple mise de son côté sur son casque de réalité virtuelle et augmentée Vision Pro, disponible début 2024. Bien d’autres métavers se développent, comme pour les spectacles et concerts chez Vrroom (13) en France, pays où le chef de l’Etat rêve d’un « métavers européen » (14). @

Charles de Laubier

Streaming vidéo et IA génératives posent des questions existentielles au cinéma et… au jeu vidéo

La grève dure depuis 140 jours aux Etats-Unis. Les scénaristes d’« Hollywood » l’ont déclenchée le 2 mai, étendue cet été aux comédiens, et maintenant au jeu vidéo. Leurs revendications : meilleures rémunérations à l’ère du streaming et de l’intelligence artificielle.

Les scénaristes de la Writers Guild of America (WGA), en grève depuis le 2 mai, et les acteurs de la Screen Actors Guild and American Federation of Television and Radio Artists (SAG-AFTRA), en grève depuis le 13 juillet, sont très remontés contre l’Alliance of Motion Picture and Television Producers (AMPTP). Cette dernière regroupe les grands groupes de médias et de télévisions américains ainsi que des plateformes de streaming vidéo : « Amazon/MGM, Apple, Disney/ABC/Fox, NBCUniversal, Netflix, Paramount/CBS, Sony, Warner Bros. Discovery (HBO) et d’autres », mentionne le syndicat américain des comédiens. Le mouvement social s’étend aux éditeurs de jeux vidéo.

Hollywood donne d’une main, reprend de l’autre
D’un côté, la WGA (11.500 scénaristes) et, de l’autre, la SAGAFTRA (160.000 comédiens), qui vient de réélire sa présidente Fran Drescher (photo) le 8 septembre (1), négocient d’abord une augmentation des rémunérations pour tenir compte de l’inflation : les scénaristes proposent 5 % à 6 % de hausse mais les groupes cinématographiques et audiovisuels offrent 2 % à 4 % ; les acteurs proposent une augmentation de 11 % mais les groupes cinématographiques et audiovisuels offrent 5 %. Mais ce sont vis-à-vis des plateformes de streaming (Netflix, Amazon Prime Video, Disney+, …) que les revendications se font plus pressantes. Les scénaristes et les comédiens demandent à être mieux rémunérés par les plateformes de SVOD (2) sur les minimum garantis – le MBA (Minimum Basic Agreement) inscrit dans la convention collective de la WGA – et à être intéressés aux bénéfices du streaming. Cette exigence d’« une meilleure rémunération initiale et des droits résiduels » porte aussi sur les plateformes vidéo financées par la publicité, les AVOD (3) et les FAST (4).
A la veille de leur mouvement social déclenché le 2 mai, les scénaristes de la WGA avaient publié un état de leurs revendications et des réponses ou non-réponses apportées par les groupes de médias (5). Mais au point d’étape des négociations au 24 août dernier, soit au 115e jour de grève, peu d’avancées étaient signalées par le syndicat des scénaristes : « Lors de la rencontre avec les PDG, nous avons passé deux heures à expliquer que, malgré les progrès réalisés, le langage de l’offre de l’AMPTP était, comme c’est typique de cet organisme, une façon de donner d’une main et de reprendre de l’autre. (…) L’AMPTP semble donner tout en limitant les gains réels », relève-t-il. La WGA donnent quelques exemples de propositions qui ne sont pas encore suffisantes (6). Par exemple, les groupes de médias de l’AMPTP disent avoir fait une concession majeure en offrant de permettre à six membres du personnel de la WGA d’étudier les données, limitées, sur le nombre de téléspectateurs en streaming pour les trois prochaines années, afin que ces six membres puissent revenir en 2026 pour demander une fois de plus un solde basé sur le nombre de téléspectateurs. Mais entre temps, regrette la WGA, « aucun scénariste ne peut être informé de l’état de leur projet, et encore moins recevoir un résidu basé sur ces données ». La WGA a en outre calculé le coût de ses demandes pour chaque entreprise de média et chaque plateforme, « y compris l’ajout d’un financement accru de la santé pour faire face à l’impact de la grève ». Si l’on prend le cas de Netflix, les propositions de la WGA lui coûteraient 65 millions de dollars par an, soit seulement 0,206 % de son chiffre d’affaires 2022 de 31,6 milliards de dollars.
Les acteurs, eux, ont rejoint le 13 juillet les scénaristes pour élargie la grève, soit au 73e jour. « Nous luttons pour la survie de notre profession. Voici la vérité simple : nous sommes face à un système où les responsables de conglomérats de médias de plusieurs milliards de dollars sont récompensés pour exploiter les travailleurs », fustige leur syndicat SAGAFTRA pour justifier leur grève dans un « Why We Strike » (7). Lui aussi négocie pied-à-pied avec les géants de l’AMPTP. La SAG-AFTRA demande que les comédiens aient une participation aux revenus de streaming, puisque le modèle économique actuel a érodé leurs revenus résiduels : « Les artistes ont besoin d’une rémunération qui reflète la valeur que nous apportons aux streamers, lesquels profitent de notre travail ».

Rémunérer la valeur apportée aux streamers
Le 7e Art d’Hollywood exige un partage des revenus des « nouveaux médias » lorsque leurs œuvres sont exposées sur des plateformes de streaming. « Cela permettrait aux acteurs de partager le succès de spectacles de haut niveau ». Les géants des médias et du divertissement lui ont opposé une fin de non-recevoir : « Non ». La SAG-AFTRA plaide en outre la cause des « coordinateurs de cascades qui ne devraient plus être exclus des droits résiduels tels que les rediffusions sur les réseaux, la télévision étrangère et le streaming à budget élevé ». Elle demande aussi à « améliorer les résidus dus à la diffusion continue d’images réalisées pour les services de streaming par abonnement ». L’AMPTP botte en touche.
Concernant l’IA cette fois, la WGA note des avancées à la date du 28 août, mais insuffisantes : « Nous avons eu de vraies discussions et avons constaté des progrès de leur part en ce qui concerne la protection de l’IA, mais nous ne sommes pas encore rendus là où nous devons être. À titre d’exemple, ils continuent de refuser de réglementer l’utilisation de notre travail pour former l’IA à écrire du nouveau contenu pour un film »

IA génératives : menaces de cannibalisation
Les scénaristes américains demandent que soit réglementée l’utilisation de l’intelligence artificielle sur les projets couverts par le MBA : « L’IA ne peut pas écrire ou réécrire du matériel littéraire ; ne peut pas être utilisé comme matériel de base ; et le matériel couvert par le MBA [Minimum Basic Agreement, ndlr] ne peut pas être utilisé pour former l’IA ». Les employeurs d’« Hollywood » avait rejeté ces propositions dès le début des négociations, en renvoyant la question à « des réunions annuelles pour discuter des progrès technologiques »…
De leur côté, les acteurs de la SAG-AFTRA veulent eux aussi des garanties contre les IA génératives : « Les artistes-interprètes ont besoin de la protection de leurs images et de leurs représentations pour empêcher le remplacement des performances humaines par la technologie de l’intelligence artificielle ». Le syndicat des comédiens a proposé aux groupes de médias et aux plateformes des dispositions pour que les artistes interprétés puissent accorder un « consentement éclairé » et obtenir une « rémunération équitable » lorsqu’une « réplique numérique » [digital replica] est faite ou que leur représentation est modifiée à l’aide de l’IA. Mais les employeurs de l’AMPTP ne l’entendent pas de cette oreille. Les Disney, Netflix et autres Warner Bros. veulent être au contraire en mesure « de scanner l’image d’un figurant, de le payer pour une demi-journée de travail, puis d’utiliser la ressemblance d’un individu à n’importe quel but, pour toujours, sans son consentement ». Et ces entreprises veulent aussi pouvoir « apporter des changements au dialogue des artistes principaux et même créer de nouvelles scènes, sans consentement éclairé », ainsi que « pouvoir utiliser les images, les similitudes et les représentations de quelqu’un pour former de nouveaux systèmes d’IA générative sans consentement ni compensation ». En France, la Société des auteurs compositeurs dramatiques (SACD) a fait le 31 août « cinq propositions pour une intelligence artificielle éthique, responsable et respectueuse des droits des auteurs » – dont celle de faire de l’Arcom (8) le régulateur de « l’utilisation des œuvres par les IA » (9). Elle a évoqué au passage la grève aux Etats-Unis et les « légitimes inquiétudes » des scénaristes. La grève américaine a des répercutions partout dans le monde – avec le soutien d’autres syndicats comme Equity au Royaume-Uni (10). Le Festival du cinéma américain de Deauville en France et la Mostra de Venise en Italie ont manqué de stars du 7eArt. Mais au-delà des festivals, des tapis rouges et des paillettes, les conséquences de ce mouvement social venu d’Hollywood (retards ou annulation de tournages, postproduction repoussée, sous-titrages et doublages reportés, …) se font déjà sentir jusque dans les salles de cinéma (moins de films) et sur les plateformes de SVOD (moins de séries). La Fédération nationale des cinémas français (FNCF), qui espère que les 200 millions de spectateurs seront atteints en 2023 dans l’Hexagone, a évoqué le 20 juillet dernier sa préoccupation : « La grève des acteurs et scénaristes aux Etats-Unis inquiète beaucoup car elle risque de durer même si elle ne concerne que les films américains », a confié son président Richard Patry sur BFMTV (11).

L’industrie du jeu vidéo visée à son tour
La SAG-AFTRA a appelé le 1er septembre à étendre le mouvement social aux éditeurs de jeux vidéo (12), au premier rang desquels elle mentionne : Activision Blizzard, Electronic Arts, Epic Games, Take Two, Insomniac Games, Warner Bros. Games et Disney, Blindlight, Formosa Interactive et VoiceWorks Productions. « Le syndicat devrait avoir en main une autorisation de grève approuvée par les membres lorsque les négociations reprendront le 26 septembre », indique le syndicat des comédiens, le vote des membres devant se terminer la veille (13). Mêmes revendications : meilleure rémunération issue du streaming et une maîtrise des IA génératives. @

Charles de Laubier

Les majors Universal Music, Sony Music et Warner Music négocient avec les éditeurs d’IA musicales

Google et sa filiale YouTube négocient avec Universal Music l’autorisation d’utiliser pour son IA musical, MusicML, les données de la première « maison de disques ». Les autres majors, Warner Music et Sony Music, devront aussi trouver des accords. C’est plus une opportunité qu’une menace.

Le 21 août, YouTube a annoncé un accord avec Universal Music autour de l’IA musicale. Le Financial Times avait par ailleurs révélé le 9 août que sa maison mère Google et la première major mondiale de la musique enregistrée étaient en pourparlers pour autoriser que les mélodies et les voix des artistes soient exploitées par l’intelligence artificielle MusicLM (développée par Google) afin que celle-ci puisse créer de nouvelles chansons. Si ces négociations devaient aboutir, un accord de ce type serait une première pour l’industrie musicale qui, jusqu’à maintenant, voient plus ces IA génératives de musiques comme une menace pour elle.

Accords avec Google et YouTube
Quel est l’impact de l’IA générative sur l’industrie musicale ? « Imaginez que quelqu’un vole tout ce qui a de la valeur à une entreprise et l’utilise pour lancer une entreprise pour lui faire concurrence. C’est exactement ce qui se passe avec beaucoup de grands modèles d’IA d’apprentissage automatique qui existent aujourd’hui. Il s’agit d’une concurrence déloyale classique. (…) Il y a un besoin urgent de “code de la route” approprié pour l’IA générative et nous vous encourageons à agir de manière décisive et sans délai », a déclaré le 12 juillet dernier Jeffrey Harleston (photo), directeur juridique et vice-président exécutif pour les affaires commerciales et juridiques d’Universal Music. Il était auditionné au Sénat américain par le sous-comité de la commission judiciaire du Sénat, sur le thème de « l’intelligence artificielle et la propriété intellectuelle » (1).
Que vous disent les artistes au sujet de leurs voix et de la musique utilisées sans leur consentement par des IA musicales ? « Les artistes sont naturellement bouleversés que leur nom, image, ressemblance ou voix soient volés et utilisés pour suggérer qu’ils ont dit, chanté, ou fait quelque chose qu’ils n’ont jamais fait, a-t-il répondu aux sénateurs qui l’auditionnaient. C’est une violation horrible de la vie privée, et comme cela pourrait nuire à la réputation de l’artiste, cela pourrait irrémédiablement nuire à leur carrière. La voix et la personnalité d’un artiste sont leur gagne-pain et les voler – peu importe le moyen – est mal ». Il a appelé les Etats-Unis à procéder à des modifications législatives pour assurer un développement éthique de l’IA, notamment musicale. Le directeur juridique d’Universal Music avance trois points pour une future « loi pérenne sur le droit d’auteur afin de s’assurer qu’elle résiste à une IA en constante évolution technologie » : édicter une loi fédérale sur le droit de publicité [ou droit à l’image, ndlr] pour assurer la protection de la propriété intellectuelle d’un nom, d’une image, d’une ressemblance ou d’une voix ; assurer la transparence des éléments d’apprentissage de l’IA et permettre au titulaire du droit de pouvoir consulter les enregistrements détaillés des entrées d’apprentissage, sans avoir à s’engager dans un litige ; exiger l’étiquetage des oeuvres essentiellement générées par l’IA. Mais sans attendre que le Congrès américain s’empare du sujet, Universal Music cherche à trouver un terrain d’entente avec les éditeurs d’IA générative, tout du moins avec Google qui l’a approché.
La filiale d’Alphabet est aussi entrée en contact avec Warner Music. Il ne resterait plus qu’à discuter avec Sony Music pour faire le tour des trois grandes majors de la musique enregistrée. Rappelons qu’en septembre 2016, le laboratoire Sony CSL (2) avec fait sensation sur YouTube en diffusant une « nouvelle musique » des Beatles baptisée « Daddy’s Car » (3) et créée par l’IA Flow Machines du japonais (4), les Beatles faisant partie du répertoire… d’Universal Music. La n°1 des majors – au siège social situé aux Pays-Bas mais ayant son siège opérationnel basé à Santa Monica en Californie – adhère en outre aux sept principes édictés par le groupe Human Artistry Campaign (5) lancé en début d’année. Il s’agit de défendre les droits des créateurs dans le développement des technologies d’IA.
Pour l’heure, Alphabet avance à grand pas dans la musique générée par l’intelligence artificielle : tant du côté de Google qui a présenté le 26 janvier sa propre IA musicale baptisée MusicLM (6) que du côté de YouTube qui a lancé le 21 août un incubateur d’IA musicale avec des artistes, des auteurscompositeurs et des producteurs d’Universal Music (7).

MusicLM (Google), une IA hi-fi
Google présente MusicLM comme « un modèle générant une musique haute-fidélité à partir de descriptions textuelles ou d’une mélodie fredonnées ». Cette IA génère de la musique à 24 kHz qui reste cohérente sur plusieurs minutes. Et la filiale d’Alphabet d’affirmer : « Nos expériences montrent que MusicLM surpasse les systèmes précédents en termes de qualité audio et d’adhésion à la description du texte » (8). Mais cette IA musicale prometteuse n’a pas encore été rendue accessible au grand public, le géant du Net ayant la prudence de demander l’autorisation des plus grandes maisons de disques pour ne pas être accusé de contrefaçon et de spoliation des artistes. Seuls de nombreux exemples de bandes sonores générées par MusicML ont été mis en ligne.

Meta se met en trois avec Audiocraft
Google n’est pas le seul à s’aventurer sur le terrain du « text-to-music » puisque Meta a mis en logiciel libre (open source) son modèle de langage capable de générer des extraits musicaux, MusicGen. Meta (ex-groupe Facebook), qui avait présenté mi-juin dernier MusicGen comme étant légèrement supérieures à MusicLM en termes de performances, a présenté le 3 août sa panoplie IA appelée Audiocraft, composée non seulement de MusicGen, mais aussi d’AudioGen et d’EnCodec. « MusicGen, qui a été formé avec de la musique appartenant à Meta et spécifiquement sous licence, génère de la musique à partir d’entrées utilisateur textuelles, tandis qu’AudioGen, qui a été formé aux effets sonores publics, génère de l’audio à partir d’entrées utilisateur textuelles. Aujourd’hui, nous sommes ravis de publier une version améliorée de notre décodeur EnCodec, qui permet une génération de musique de meilleure qualité avec moins d’artefacts », explique Meta dans sa présentation. Les trois modèles de la suite Audiocraft sont disponibles à des fins de recherche, destinés aux chercheurs et aux praticiens. Cette ouverture devrait accélérer le développement de l’IA générative pour l’audio, lequel a pris du retard par rapport aux IA générative pour les images, la vidéo et le texte (ChatGPT, Midjourney, Bard, Dall·E 2, LLaMA, Stability AI, …). « Générer de l’audio hautefidélité de toute sorte nécessite la modélisation de signaux et de motifs complexes à différentes échelles. La musique est sans doute le type d’audio le plus difficile à générer car elle est composée de modèles locaux et de longue portée, d’une suite de notes à une structure musicale globale avec plusieurs instruments », fait remarquer la firme de Mark Zuckerberg (9).
Mais le tout-en-un proposé en open source par AudioCraft, pour la musique, le son, la compression et la génération, vise à faciliter l’innovation et la créativité musicales (composition, chanson, bande sonore, …), sans avoir à jouer une seule note sur un instrument. Meta estime même que « MusicGen peut se transformer en un nouveau type d’instrument – tout comme les synthétiseurs lors de leur apparition » (10). MusicGen a été formé sur environ 400.000 enregistrements avec descriptions textuelles et métadonnées, ce qui représente 20.000 heures de musique appartenant à Meta ou sous accords de licence. Pour l’heure, Meta ne fait état d’aucune négociation avec l’industrie musicale et encore moins avec les majors avec lesquels Google a, au contraire, pris langue. « Si vous voyez un exemple de musique UMG [Universal Music Group, ndlr] distribuée illégalement, n’hésitez pas à nous contacter à contentprotection@umusic.com », signale sur son site web (11) la première major dirigée par Lucian Grainge (photo ci-contre). C’est ce qu’on dû peut-être faire les deux artistes Drake et The Weeknd, produits par Universal Music, lorsqu’ils ont constaté en avril dernier qu’un « artiste » surnommé « Ghostwriter » (compositeur fantôme) a mis en ligne une musique avec voix s’inspirant de leur style musical. Les fichiers audio et vidéo de ce morceau de 2 minutes et 14 secondes ont été diffusés avec succès sur plusieurs plateformes de streaming musical (Spotify, YouTube/YouTube Music, Apple Music, TikTok, …), avant d’en être retirés après quelques jours. Un spécialiste américain estime que le morceau pourrait avoir été créé et promu à des fins de marketing viral par une start-up californienne Laylo (12), laquelle travaille avec des artistes musicaux et compte parmi ses investisseurs… Sony Music. Bien d’autres artistes musicaux ont été imités par des IA génératives à tendance mélomane. La chanteuse barbadienne Rihanna (signée elle aussi chez UMG) s’est par exemple étonnée au printemps de s’entendre chanter « Cuff It » de Beyoncé, via une « IA Rihanna » (13).
Le rappeur Ye (ex-Kanye West, ayant son propre label Good Music) n’a pas non plus été épargné par la déferlante IA musicale, avec les musiques « Hey There Delilah » de Plain White T’s et « Passionfruit » de Drake. Angèle, elle, s’est vue en août chanter en duo avec Gazo (14) sans son consentement. Les IA musicales Flow Machines, MusicGen, AudioGen, MusicLM, Riffusion ou encore Mubert n’ont pas fini de surprendre. Jeffrey Harleston compte sur les Etats-Unis pour résorber leur retard dans la réglementation de l’IA générative.

Les Etats-Unis derrière la Chine et l’UE
A la suite des auditions de cet été, le Congrès américain devrait légiférer sur l’IA d’ici la fin de l’année. A l’instar de la Chine (15), l’Union européenne (UE) a pris de l’avance dans l’élaboration de son « AI Act » qui est entré mi-juin en phase de discussion législative entre le Parlement européen et le Conseil de l’UE. « Les systèmes d’IA générative comme ChatGPT doivent mentionner que le contenu a été généré par une IA. (…) Des résumés détaillés des données protégées par le droit d’auteur utilisées pour la formation des IA devront également être rendus publics », prévoit le projet de règlement européen sur l’IA (16). Les IA génératives vont devoir s’accorder. @

Charles de Laubier

Protection des données : après 5 ans de mise à l’épreuve du RGPD, son réexamen sera le bienvenu

En attendant le réexamen en 2024 du règlement sur la protection des données (RGPD), les entreprises peinent à remplir certaines de leurs obligations, comme celle de transparence envers les utilisateurs, et doivent faire face au détournement du droit d’accès aux données et à la déferlante de l’IA.

Par Sandra Tubert, avocate associée, Algo Avocats

Entré en application le 25 mai 2018, deux ans après son entrée en vigueur afin de laisser aux entreprises le temps nécessaire pour se mettre en conformité, le règlement européen sur la protection des données (RGPD) affichait des objectifs ambitieux (1). La couverture médiatique dont il a fait l’objet a permis de sensibiliser les Européens à la protection de leurs données à caractère personnel, mais également au RGPD de s’imposer comme une référence pour les Etats étrangers ayant adopté une loi similaire. Pour autant, avec un recul d’un peu plus de cinq ans, le RGPD peine à remplir pleinement certains des objectifs fixés.

Internautes concernées mieux informés
Dans la lignée de la directive « Protection des données personnelles » de 1995 qui l’a précédée (2), le RGPD n’a pas choisi la voie de la patrimonialisation des données à caractère personnel. Le législateur européen n’a en effet pas créé de droit à la propriété sur les données à caractère personnel, mais s’est plutôt orienté vers une approche de protection des données permettant aux personnes concernées d’avoir une certaine maîtrise de l’utilisation faite de leurs données à caractère personnel. Deux objectifs principaux ont été associés à cette approche : renforcer la transparence sur les traitements réalisés et fournir des droits supplémentaires aux personnes concernées. C’est ainsi que le RGPD est venu renforcer l’obligation faite aux responsables du traitement de fournir une information détaillée sur les traitements mis en œuvre (3). L’objectif affiché était louable : une transparence accrue afin de permettre aux individus de comprendre en amont l’utilisation envisagée de leurs données par les entreprises et ainsi d’en avoir la maîtrise en leur laissant la possibilité d’effectuer un choix éclairé : refuser la communication de leurs données, s’opposer à certains traitements, ou bien encore donner leur consentement à la réalisation de certaines activités.
En pratique, les entreprises ont l’obligation de fournir l’intégralité des informations prévues par le RGPD de façon concise, transparente, compréhensible et aisément accessible, en utilisant des termes clairs et simples. Or répondre à ces impératifs de manière conforme à ce qui est attendu par les autorités de contrôle – comme la Commission nationale de l’informatique et des libertés (Cnil) en France – est l’une des premières difficultés que cinq ans de pratique du RGPD ont fait émerger. En effet, les organisations ont des difficultés à concilier les exigences de fourniture d’une information exhaustive et très technique – notamment concernant les bases légales du traitement et les garanties fondant les transferts des données hors de l’Union européenne (4) – avec celles de clarté et de concision. Ainsi, au titre des effets pervers de cette obligation de transparence accrue, les citoyens européens font face à des politiques de confidentialité toujours plus longues, rédigées en des termes trop techniques ou trop juridiques. De l’autre côté, les autorités de protection des données n’hésitent pas à sanctionner les manquements à cette obligation, puisque le « défaut d’information des personnes » figure parmi les manquements les plus fréquemment sanctionnés par la Cnil (5).
Cette obligation a été couplée à la fourniture de droits supplémentaires aux personnes, toujours dans une optique de leur offrir une meilleure maîtrise de leurs données. En pratique, le RGPD a repris les droits existants depuis la directive « Protection des données personnelles » (droits d’accès, de rectification, d’opposition), consacré le droit d’effacement (6) et créé de nouveaux droits (droits à la limitation du traitement et à la portabilité des données). La sensibilisation du grand public à l’existence de ces droits, grâce notamment aux actions de la Cnil et au traitement médiatique, ont eu pour effets la réception, par les entreprises, de demandes fondées sur les droits issus du RGPD de plus en plus nombreuses. Par ricochet, les autorités de protection des données ont, elles aussi, vu le nombre de plaintes déposées auprès de leurs services augmenter considérablement (7). Ainsi, la Cnil a reçu 12.193 plaintes en 2022 contre 7.703 en 2016. L’objectif fixé par le RGPD semble donc atteint sur ce point.

Droit d’accès : instrumentalisation
Néanmoins, ces dernières années ont également été témoin du détournement du droit d’accès, aussi bien dans la sphère sociale que commerciale. En effet, les entreprises reçoivent de plus en plus de demandes de droit d’accès dont l’objectif n’est pas de vérifier l’existence et la licéité du traitement des données, mais au contraire de se constituer des preuves dans le cadre d’un précontentieux ou d’un contentieux à l’encontre de l’entreprise. Cette instrumentalisation est parfaitement connue des autorités qui ont toutefois réaffirmé (8) que, dans le cadre de l’évaluation des demandes reçues, le responsable du traitement ne devait pas analyser l’objectif du droit d’accès en tant que condition préalable à l’exercice de ce droit et qu’il ne devait pas refuser l’accès au motif que les données demandées pourraient être utilisées par la personne pour se défendre en justice. Les entreprises n’ont ainsi d’autres choix que de donner suite à ces demandes, en restreignant la nature des données communiquées aux seules données relatives à la personne concernée et en veillant à ne pas porter atteinte aux droits des tiers (9).

Des obligations de sécurité renforcées
La protection des données à caractère personnel passant nécessairement par la sécurité de celles-ci, le RGPD est venu renforcer les obligations à la charge des entreprises au moyen de deux mécanismes assez efficaces : l’obligation pour les responsables du traitement de notifier les violations de données aux autorités de contrôle (10), voire directement aux personnes concernées, respectivement lorsqu’elles présentent des risques ou des risques élevés pour les personnes; l’obligation pour les responsables du traitement et les sous-traitants (11) de mettre en œuvre des mesures de sécurité appropriées aux risques présentés par le traitement.
Il est assez difficile de déterminer si les objectifs de sécurisation des données fixés par le RGPD sont atteints. Néanmoins, dans un contexte où les attaques par rançongiciel (ransomware) se multiplient chaque année (12), les autorités de contrôle sont particulièrement vigilantes quant au respect de ces deux obligations. En témoigne notamment le fait qu’en 2022, un tiers des sanctions prononcées par la Cnil concernait un manquement à l’obligation de sécurité. Ce même manquement a conduit cette dernière à prononcer sa première sanction publique à l’encontre d’un sous-traitant (13), un éditeur de logiciel, pour un montant de 1,5 million d’euros. Elle n’a pas non plus hésité à sanctionner une entreprise qui n’avait pas informé les personnes concernées de la violation de données intervenue, alors qu’elle présentait un risque élevé pour ces dernières.
Sur le respect de l’obligation de notification des violations de données, il est assez difficile de tirer de réels enseignements des chiffres disponibles, même si l’on constate des disparités importantes quant au nombre de notifications de violation de données réalisées chaque jour en fonction des pays. A titre d’exemple, il y a environ 14 notifications par jour en France, contre 27 notifications par jour au Royaume-Uni.
Cette disparité se retrouve également dans le nombre de sanctions prononcées chaque année par les autorités de contrôle et l’approche suivie par ces dernières. Si l’autorité espagnole prononce énormément de sanctions, l’autorité irlandaise est régulièrement épinglée (y compris par ses homologues) pour sa clémence et le peu de sanctions prononcées depuis l’entrée en application du RGPD, alors même qu’elle fait office d’autorité chef de file de la plupart des GAFAM (14). C’est finalement sur ce point que le RGPD peine à convaincre et à remplir pleinement ses objectifs, à savoir inciter les entreprises à se mettre en conformité au moyen d’un arsenal répressif dissuasif. En effet, à l’exception des quelques fortes sanctions (dont la dernière en date de 1,2 milliard d’euros à l’encontre de Meta), prononcées principalement à l’encontre des GAFAM et des géants du Net, les sanctions à l’encontre des sociétés sont moins fréquentes que ce qui était escompté par les associations de protection des données. Et les montants des sanctions financières sont assez éloignés des montants maximums encourus (4 % du chiffre d’affaires mondial consolidé). En France, en dehors des sanctions prononcées à l’encontre des GAFAM (dont beaucoup pour des manquements en matière de cookies, non régulés par le RGPD) et très récemment de Criteo (40 millions d’euros), le montant des sanctions prononcées par la Cnil sur le fondement du RGPD oscille depuis cinq ans entre 125.000 et 3 millions d’euros (15).
L’association Noyb (16), à l’origine de nombreuses sanctions prononcées en Europe au cours des cinq dernières années, dénonce une certaine résistance des autorités de contrôle et des tribunaux nationaux dans l’application effective du RGPD (17). Elle appelle à suivre l’initiative de la Commission européenne d’adopter un règlement sur les règles de procédure relatives à l’application du RGPD (18), ce qui permettrait selon Noyb d’uniformiser l’approche procédurale des autorités et ainsi de favoriser une meilleure application du RGPD.
Par ailleurs, si les entreprises ont pu craindre la multiplication des actions de groupe en matière de protection des données, cette modalité d’action est à l’heure actuelle peu utilisée par les associations de protection des données. En France, seulement deux actions de groupe ont été portées devant les juridictions : l’ONG Internet Society France contre Facebook et l’association UFC-Que-Choisir contre Google. Ce qui pourrait changer au regard des dernières annonces faites par Noyb suite à l’entrée en application des dispositions issues de la directive « Recours collectifs » de 2020 (19).

Vers un réexamen du RGPD en 2024
Enfin, le paysage législatif européen pourrait également avoir un impact sur l’application du RGPD. En effet, plusieurs textes européens adoptés récemment (DSA, DGA) ou en cours d’adoption (DA, AIA) ont des champs d’application recoupant celui du RGPD, ce qui va notamment nécessiter de veiller à garantir leurs bonnes articulations. A cette occasion, ou au titre de l’article 97 du RGPD (réexamen tous les 4 ans à compter du 25 mai 2020), il serait souhaitable de voir le législateur européen adresser certaines des difficultés rencontrées par les entreprises dans la mise en application pratique du RGPD. @