Cloud & AI Development Act : le futur règlement de la Commission européenne veut changer la donne

Pour que l’Union européenne devienne un « continent de l’IA », dans le cadre des objectifs de son Digital Decade à l’horizon 2030, le futur règlement sur « le développement de l’informatique en nuage et de l’IA » devra éviter de renforcer la position dominante du triumvirat Amazon-Microsoft-Google.

Alors qu’un triumvirat de l’informatique en nuage est en train de se renforcer dans l’Union européenne, constitué par les trois Big Tech américaines Amazon avec Amazon Web Services (AWS), Microsoft avec Microsoft Azur et Google avec Google Cloud, la Commission européenne s’apprête à proposer d’ici la fin de l’année 2025 un projet de règlement sur « le développement de l’informatique en nuage et de l’IA ». Ce Cloud & AI Development Act sera ensuite débattu au Parlement européen début 2026. Pour une entrée en application en 2027 ?

Triopole américain renforcé dans l’UE
Le temps long réglementaire est loin d’être celui du temps ultra-rapide des technologies. Lorsque le Cloud & AI Development Act (« CAIDA ») entrera en vigueur, d’ici deux ans, la position dominante des trois Big Tech américaines Amazon, Microsoft et Google dans le cloud aura sans aucun doute encore augmentée pour atteindre une part de marché – dans les infrastructures de cloud en Europe – plus importante qu’elle ne l’est déjà actuellement. Le triumvirat tend à devenir un triopole, qui échappe à toute régulation susceptible de favoriser la concurrence dans les Vingt-sept.
Pour l’heure, Amazon, Microsoft et Google viennent d’atteindre les 70 % de parts de marché dans les infrastructures de cloud dans l’Union européenne (UE). Tandis que la part de marché de leurs concurrents d’origine européenne – SAP, Deutsche Telekom, OVHcloud, Telecom Italia, ou encore Orange – se réduit à peau de chagrin, à savoir 15 % environ de part de marché en Europe, contre près de 30 % en 2017, d’après Synergy Research Group (voir graphique ci-dessous). « Pendant que les fournisseurs de cloud américains continuent d’investir des dizaines de milliards d’euros chaque trimestre dans des programmes d’investissement européens, cela représente une pente impossible à gravir pour toutes les entreprises qui souhaitent sérieusement contester leur leadership sur le marché », estime John Dinsdale (photo), analyste en chef de ce cabinet d’étude américain basé à Reno, dans le Nevada, aux Etats-Unis. Et cet ancien analyste en chef de chez Gartner d’ajouter : (suite) « Par conséquent, les fournisseurs de cloud européens se sont principalement installés comme fournisseurs de services à des groupes locaux de clients ayant des besoins locaux spécifiques, travaillant parfois en partenariat avec les grands fournisseurs de cloud américains. Bien que de nombreux fournisseurs de cloud européens continuent de croître, il est peu probable qu’ils fassent beaucoup bouger les lignes en termes de part de marché européenne globale » (1). Les principaux bénéficiaires de la croissance du marché depuis sept ans sont le quasi-triopole Amazon, Microsoft et Google, ces « hyperscaler » capables déployer et gérer des infrastructures de cloud de façon massive, de réparties sur des centaines de datacenters à travers le monde leur puissance informatique dans le nuage, d’offrir des services de calcul, de stockage, d’IA, de réseau et de sécurité à l’échelle planétaire, et de faire évoluer dynamiquement leurs ressources en fonction de la demande grâce à leurs architectures de cloud. AWS, Azur et Google Cloud règnent donc toujours en maîtres, non seulement dans l’Union européenne qu’ils ont colonisée, mais aussi dans le reste du monde.
Alors que le marché mondial des infrastructures de cloud à destination des entreprises approche de la barre des 100 milliards de dollars de chiffre d’affaires rien qu’au deuxième trimestre 2025, toujours d’après Synergy Research Group, pour un total sur un an de 366 milliards de dollars (en hausse annuelle d’environ 25 %), le quasi-triopole s’arroge respectivement 30 % (Amazon), 20 % (Microsoft) et 13 % (Google) de parts de marché mondiale. « Nous prévoyons que la croissance annuelle moyenne au cours des cinq prochaines années restera supérieure à 20 %, a encore indiqué John Dinsdale. Nous pouvons remercier GenAI [intelligence artificielle générative capable de produire du contenu original – texte, image, code, musique, vidéo – à partir de données existantes, ndlr] d’avoir surdimensionné ce qui était déjà un marché important et à forte croissance ».

L’IA et GenAI favorables… au triopole
Au second trimestre 2025, Synergy Research Group a en effet constaté une croissance de 140 % à 180 % des services cloud spécifiques à GenAI, et l’intelligence artificielle (IA) a contribué également à la croissance des services cloud sur un marché plus élargi – de plus en plus d’entreprises et de plateformes grand public adoptant l’IA. « Au-delà des services cloud d’entreprise, constate John Dinsdale, l’IA alimente également l’expansion des revenus d’autres services numériques. Nous constatons une forte croissance à deux chiffres des revenus provenant des médias sociaux et de la recherche en ligne » (2). Si les Etats-Unis restent de loin le plus grand marché du cloud, l’Europe progresse mais ses plus grands marchés nuagiques sont le Royaume-Uni et l’Allemagne, tandis que les grands marchés européens avec les taux de croissance les plus élevés sont l’Irlande, l’Espagne et l’Italie. La France est au ralenti.

Changer de cloud facilement, sans frais
Avec le futur règlement Cloud & AI Development Act, Bruxelles vise à « tripler les capacités des centres de données de l’UE dans les cinq à sept années à venir ». Car, actuellement, l’UE accuse dans ce domaine un retard par rapport aux Etats-Unis et à la Chine. Le CAIDA a pour objectif de lever les barrières qui empêchent le développement de la capacité des centres de données dans les Vingt-sept : difficultés d’accès aux ressources naturelles (énergie, eau, terres), d’obtention d’autorisations (complexités différentes selon les Etats membres), de se fournir en composants technologiques, et de lever des capitaux pour investir. La montée en puissance du quasi-triopole de l’informatique en nuage fait aussi craindre, pour les entreprises et les particuliers, un verrouillage de leurs données par leur fournisseur de cloud.
D’où la question cruciale, à laquelle répond partiellement le Data Act (3) qui est entré en vigueur ce 12 septembre 2025 mais sur laquelle fait l’impasse la consultation (4) de la Commission européenne en vue de proposer un CAIDA : comment faciliter la possibilité de changer de fournisseur cloud et assurer la portabilité des données ? « En mai 2024, la loi visant à sécuriser et réguler l’espace numérique [loi dite SREN] a confié à l’Arcep de nouvelles missions sur le cloud justement pour lever les barrières techniques et commerciales au changement de fournisseur », a rappelé Laure de La Raudière (photo ci-dessus), présidente de l’Arcep, à l’occasion de la conférence Cloudweek Paris qui s’est tenue le 17 septembre 2025. Le régulateur français des télécoms entend exercer son pouvoir d’intervention sur le marché du cloud. « Concernant les barrières commerciales, a-t-elle précisé, nous avons la mission d’encadrer les frais de transfert de données lors d’un changement de fournisseur. […] Ces frais doivent être, selon nous, égaux à zéro, en dehors des prestations complémentaires ou de spécificités demandées par les clients ».
Mais ce n’est pas tout, l’enjeu porte surtout sur les données des clients dans le cloud : « Concernant les barrières techniques, nous avons la mission de préciser les règles et modalités de mise en œuvre des exigences essentielles par les fournisseurs cloud relatives à la portabilité et de l’interopérabilité » (5). Transparence, droit à la portabilité et droit à l’interopérabilité sont aussi des obligations qui s’imposent aux fournisseurs de services cloud (6), dans le cadre européen du Data Act. Mais est-ce suffisant ?

L’Arcep prône une régulation ex-ante
L’Arcep, qui est membre du réseau des régulateurs européens Berec, se prépare de longue date à « réguler les réseaux du futur » (7) et s’apprête à publier une recommandation qui vise à encourager la transparence et la mise en place de bonnes pratiques de documentation et de mise à jour des API (Application Programming Interface, ou interface de programmation d’application). Pour le futur CAIDA, la France suggère surtout à la Commission européenne de prévoir une régulation ex-ante du cloud et de l’IA, où les règles contraignantes sont fixées à l’avance (8). @

Charles de Laubier

Le grand remplacement des moteurs de recherche traditionnels par des IA génératives est… poussif

Il y a un an, l’institut d’études Gartner prévoyait d’ici 2026 une baisse de 25 % du volume des requêtes sur les moteurs de recherche traditionnels au profit des robots conversationnels IA (chabots) et autres IA génératives. Or la position dominante historique de Google reste toujours aussi forte.

La suprématie de Google (filiale d’Alphabet) sur le marché mondial des moteurs de recherche reste quasiment inchangée à fin janvier 2025 par rapport à il y a un an, et malgré la déferlante des IA génératives et autres chabots boostés à l’intelligence artificielle. D’après StatCounter, le moteur de recherche Google s’arroge encore 89,78 % de part de marché mondiale dans le search (1). L’érosion est infinitésimale comparé aux 91,47 % observés il y a un an, en janvier 2024. Les rivaux restent de petits poucets, avec Bing de Microsoft à 3,94 %, le russe Yandex à 2,74 %, Yahoo à 1,27 %, le chinois Baidu à 1,71 % et DuckDuckGo en-dessous de 1 %.

Google Search : chute de 25 % d’ici 2026 ?
Le maintien de la position dominante de Google a de quoi interpeller, alors que les IA génératives en tout genre ne cessent de défrayer la chronique et que les chat-search veulent en découdre avec le search traditionnel. Les ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google), Perplexity (Perplexity AI) et autres Copilot (Microsoft), sans parler de DeepSeek (société chinoise DeepSeek AI), ne semblent pas avoir entamé – même d’un iota – la suprématie de Google. L’accès google.com reçoit à lui seul plus de 83 milliards de visites chaque mois – 83,26 milliards sur décembre 2024, selon SimilarWeb. Viennent s’ajouter les accès locaux comme google.fr, (suite)

lequel génère plus de 265 millions de visites par mois – 265,4 millions sur décembre 2024. Fort de ces fréquentations massives, la maison mère Alphabet et sa filiale Google – toutes deux présidées par Sundar Pichai – n’ont pas vraiment de quoi s’inquiéter pour l’avenir de son moteur de recherche. Du moins pour l’instant.
Est-ce à dire que l’institut américain Gartner s’est emballé un trop vite il y a un an presque jour pour jour – le 19 février 2024 – lorsqu’il a prévu « une baisse de 25 % du volume des moteurs de recherche d’ici 2026, en raison des chatbots IA et autres agents virtuels » ? La guerre déclarée entre les « TradSearch » et les « AI Search » allait provoquer une chute des requêtes – d’un quart en deux ans – sur les moteurs de recherche traditionnels, Google en tête. Or pour l’instant, rien de nouveau sous le soleil du search. Le moteur de la firme de Mountain View caracole toujours en tête, écrasant encore de tout son poids ses concurrents. Il reste cependant toute l’année 2025 pour que le pronostique de Gartner se réalise, mais c’est peu probable. Son analyste et viceprésident Alan Antin (photo) avait même affirmé : « Les solutions d’IA générative (GenAI) deviennent des moteurs de réponses de substitution, remplaçant les requêtes des utilisateurs qui auparavant pouvaient être exécutées dans les moteurs de recherche traditionnels. Cela forcera les entreprises à repenser leur stratégie de canaux marketing, car les GenAI seront davantage intégrées dans tous les aspects de l’entreprise ». Les agents virtuels vont-ils vraiment remplacer à termes la recherche traditionnelle ? Gartner explique que les IA génératives – lesquelles réduisent le coût de production des contenus – auront un impact sur la stratégie des mots-clés, ou SEO (Search Engine Optimization), et sur le score du site web, via la mesure dite Domain Authority (DA) ou Domain Rating (DR). Et comme les algorithmes des moteurs de recherche valoriseront davantage la qualité du contenu pour compenser la quantité de contenu généré par l’IA, Alan Antin recommandait aux entreprises de « se concentrer sur la production de contenu unique qui soit utile aux clients et aux clients potentiels » (2). Fini le SEO, bonjour le GEO (Generative Engine Optimisation) et le LLMO (Large Langage Model Optimisation).
En attendant une (hypothétique) bascule du vieux monde des moteurs de recherche (liens à cliquer) vers le nouveau monde des moteurs de réponses (écrites avec sources), Google a encore de beaux jours devant lui. Surtout que la filiale d’Alphabet a dégainé l’an dernier Google Overviews qui revient à mettre de l’IA dans son moteur. Après les Etats-Unis dès mai 2024, cette fonctionnalité – affichant en haut des résultats la réponse écrite de l’IA générative (les liens sponsorisés ou pas étant relégués en dessous) – a été déployée à partir d’octobre 2024 dans plus de 100 pays, pas en France (3).

Les prévisions osées de Gartner
Contacté par Edition Multimédi@ à propos de cette chute des 26 % d’ici 2026, une porte-parole de Gartner nous indique que « la prédiction n’a pas été mise à jour ». Ce n’est pas la première fois que Gartner s’avance un peu trop dans ses prévisions. En décembre 2023, l’institut de Stamford (ville du Connecticut où il a son siège social) avait prédit que 50 % des utilisateurs de médias sociaux les abandonneraient d’ici 2025 ou limiteraient considérablement leurs interactions avec eux à cause d’une dégradation de la qualité (4). On constate aujourd’hui qu’il n’y a de fuite d’ampleur des consommateurs en vue, même chez X. @

Charles de Laubier

La start-up californienne World Labs livre un aperçu de l’avenir de l’IA générative en 3D

Le 2 décembre, la start-up World Labs — devenue en septembre une licorne avec sa levée de fonds de 230 millions de dollars — a présenté en ligne les premiers résultats de son IA générative capable de générer des mondes en 3D, où les utilisateurs peuvent interagir directement.

Imaginez : vous soumettez une de vos photos ou images à une IA générative et celle-ci va créer pour vous un monde en trois dimensions (3D) où vous pourrez évoluer à partir du navigateur de votre ordinateur ou de votre smartphone. Bienvenus dans l’« intelligence spatiale ». C’est cet exploit technologique de génération d’une géométrie en 3D que promet de généraliser prochainement la jeune pousse cofondée en janvier 2024 par la chercheuse et professeure Fei-Fei Li (photo), sa PDG, Ben Mildenhall (ex-Google), Justin Johnson (ex-Meta) et Christoph Lassner (ex-Meta).

Films, jeux, … révolution « GenAI 3D »
Pour l’instant, des aperçus navigables par tous ont été mis en ligne depuis le 2 décembre (1), tandis que seulement « quelques créateurs » peuvent expérimenter l’IA générative 3D. Les autres doivent s’inscrire sur une liste d’attente (2), en prévision du prochain lancement. « Nous travaillons dur pour mettre cette technologie entre les mains des utilisateurs dès que possible ! », a assuré World Labs dans sa présentation du 2 décembre. « A partir d’une image d’entrée, notre système estime la géométrie 3D, remplit les parties invisibles de la scène, invente de nouveaux contenus pour que vous puissiez vous retourner, et génère une grande variété de types de scènes et de styles artistiques », explique-t-elle. Et de préciser : « Nos scènes 3D peuvent être rendues en temps réel dans le navigateur avec un contrôle total de la caméra. Cela signifie que vous pouvez les explorer avec une caméra en mouvement libre comme dans un jeu vidéo, ou même simuler des effets de caméra 3D comme une faible profondeur de champ ou un zoom chariot » (3). Une fois dans son navigateur, l’utilisateur évolue en temps réel dans le nouveau monde 3D, comme avec une caméra virtuelle, à l’aide de ses touches « WASD » sur un clavier Qwerty, ou avec les touches « ZQSD » pour un clavier Azerty à la française : Z pour avancer, Q pour aller à gauche, S pour reculer, D pour aller à droite. Avec la souris, il suffit de cliquer et de faire glisser pour regarder autour. (suite)

Cette performance « GenAI 3D » intervient au moment où Midjourney, la société derrière l’IA générative du même nom, a aussi un projet 3D sous le nom de code « Orb ». Evoquée sur le réseau social Discord en octobre par David Holz, le fondateur PDG de Midjourney (4), une fonctionnalité d’intelligence spatiale devrait apparaître avec la version 7 de Midjourney attendue d’ici la fin l’année. Au lieu d’utiliser le rendu polygonal traditionnel, Midjourney développe un nouveau format de type NeRF (Neural Radiance Fields), qui permet aux utilisateurs de s’immerger virtuellement dans des images générées par l’IA. Cette technique d’apprentissage automatique utilisant un réseau de neurones permet de représenter des scènes et des objets en 3D à partir d’images 2D. « Ce n’est qu’un aperçu de l’avenir de l’IA générative native 3D », indique World Labs en montrant ses premiers mondes immersifs en 3D générés à partir d’une seule image. Si la plupart des IA génératives créent du contenu 2D comme des images ou des vidéos, générer en trois dimensions par l’IA (5) changera la façon de produire des films, des jeux, des métavers, des simulateurs ou encore des représentations numériques du monde physique (réalité virtuelle et réalité augmenté). La caméra virtuelle est même capable d’effectuer des « travelling contrariés », ce que les cinéastes appellent aussi un dolly zoom.
World Labs se définit comme « une société d’intelligence spatiale qui construit de grands modèles mondiaux pour percevoir, générer et interagir avec le monde 3D ». Pour financer le développement de ses « Large World Model » (LWM), la start-up a levé jusqu’à ce jour – du moins à septembre 2024, soit en neuf mois d’existence – plus de 230 millions de dollars auprès d’investisseurs emmenés par le fonds américain Andreessen Horowitz, NEA et Radical Ventures (6). NVentures, la branche de capital-risque de Nvidia, numéro un mondial des puces GPU/IA, ainsi qu’Adobe Ventures et AMD Ventures sont dans le tour de table où l’on compte aussi Eric Schmidt, l’ancien PDG de Google.

Fei-Fei Li, d’ImageNet à World Labs
La PDG cofondatrice de World Labs, Dre. Fei-Fei Li, est surnommée « la marraine de l’IA » – « The Godmother of AI » (7). Pionnière de l’IA dans le domaine de la vision par ordinateur (elle est à l’origine d’ImageNet dans les années 2010), elle est chercheuse et professeure en intelligence artificielle « centrée sur l’être humain » à l’université américaine de Stanford (8). Née il y a 48 ans en Chine, où elle a grandi jusqu’à ses 16 ans avant d’émigrer avec sa mère aux Etats-Unis pour rejoindre son père, Fei-Fei Li est de nationalité américaine. En 2017, elle a fondé AI4All, une organisation à but non lucratif (9) pour promouvoir la diversité dans l’IA. De son côté, Google a lancé le 4 décembre Genie 2 (10), son modèle d’IA pour créer des mondes 3D jouables. @

Charles de Laubier

Les médias en ligne redoutent la transformation du moteur de recherche Google en IA générative

Plus de 25 ans après sa création par Larry Page et Sergey Brin, le moteur de recherche en quasi-monopole fait sa mue pour devenir une IA générative qui aura réponse à tout. Les sites web de presse pourraient être les victimes collatérales en termes d’audience. Le chat-search présentera moins de liens.

(après que des internautes aient signalé des résultats erronés générés par « AI Overviews », Google a annoncé le 30 mai des mesures correctrices, y compris en améliorant ses algorithmes) 

Google est mort, vive Google ! Mais cet enthousiasme ne sera sans doute pas partagé par les sites de médias en ligne qui tirent jusqu’à maintenant une part importante de leurs audiences de la consultation massive du moteur de recherche Google, lorsque ce n’est pas de son agrégateur d’actualités Google News. Depuis que Sundar Pichai, le PDG d’Alphabet, maison mère de Google, a annoncé le 14 mai – lors du Google I/O 2024 (1) – la plus grande transformation du numéro un mondial du search en un moteur d’IA générative, les éditeurs de presse en ligne s’inquiètent pour la fréquentation de leurs sites Internet. L’objet de leurs craintes s’appelle « AI Overviews », la fonctionnalité la plus « intelligente » et disruptive jamais introduite dans Google depuis son lancement il y a un quart de siècle (2). La page de résultats de recherche ne sera plus présentée de la même manière : fini la liste impersonnelle de liens donnant accès à des sites web censés répondre, après avoir cliqué, à vos requêtes courtes et souvent par mots-clés ; place à une réponse détaillée et intelligible développée par l’IA générative elle-même, en fonction de ce que vous lui avez demandé en langage naturel, avec quelques liens seulement triés sur le volet en guise de sources venant étayer la réponse et/ou le raisonnement.

Avec « AI Overviews », moins besoin de cliquer
Cette combinaison de l’IA générative et de l’IA multimodale fait passer Google de l’ère du « moteur » (search) à celle d’« assistant » (chatbot). Le nouveau Google « intelligent » a commencé à être déployé aux Etats-Unis depuis mi-mai, et d’autres pays dans le monde suivront pour atteindre 1 milliard d’utilisateurs d’ici la fin de l’année. L’IA générative de Google, appelée Gemini, vous mâche le travail sans que vous ayez forcément besoin d’aller cliquer sur les liens relégués au second plan. « Maintenant, avec l’IA générative, le moteur de recherche peut faire plus que vous ne l’imaginez. Vous pouvez donc demander ce que vous avez en tête ou ce que vous devez faire – de la recherche à la planification en passant par le brainstorming – et Google s’occupera des démarches », a expliqué Elizabeth Reid, alias Liz Reid (photo), vice-présidente de Google, responsable du moteur de recherche. Cliquer sur des liens devient une option, tant la réponse « AI Overviews » (« Aperçus de l’IA » en français) peut s’évérer satisfaisante.


La « Google dépendance » des médias
Surtout que Gemini est un grand modèle multimodal (LMM), développé par Google DeepMind, capable de comprendre et de générer du contenu en utilisant différents types de données comme du texte, des images, de l’audio et de la vidéo. YouTube, Google Maps ou encore Google Shopping seront mis à contribution. La réponse synthétique du chat-search apportée à l’utilisateur est multimédia et vise à satisfaire immédiatement ce dernier, avec peu de sites mis en exergue par AI Overviews, afin que l’internaute n’aille plus se perdre dans un inventaire de liens à la Prévert.
La liste de sites web habituellement en tête des résultats de recherche sur Google (comme sur d’autres moteurs de recherche d’ailleurs) se retrouve tout en bas de la page. Cette réorganisation du moteur de recherche de la firme de Mountain View va chambouler au passage toutes les stratégies d’optimisation pour les moteurs de recherche, ce que l’on appelle SEO (Search Engine Optimization). De plus, le nouveau « AI Google » pourrait éradiquer les « spams SEO », ou spamdexing (4), et limiter les liens sponsorisés qui parasitent les résultats de recherche. Mais les prestataires de SEO appellent à plus de transparence sur AI Overviews, rapporte eMarketer (5). Les médias en ligne optimisent eux aussi leur visibilité dans les résultats de recherche et, partant, augmentent leur trafic. Revers de la médaille de cette « Google dépendance », qui atteindrait jusqu’à près de la moitié de l’audience d’un site web : les éditeurs du monde entier s’attendent à ce que leurs audiences chutent. « A mesure que nous étendrons cette expérience, nous continuerons à nous concentrer sur l’envoi de trafic précieux aux éditeurs et aux créateurs », a tenté de les rassurer Liz Reid.
Beaucoup de candidats, peu d’élus : tel pourrait être à l’avenir le bilan de d’AI Overviews sur la presse en ligne, certains désavantagés pourraient être poussés à mettre la clé sous la porte. En France, le directeur général de l’Alliance de la presse d’information générale (Apig), qui réunit 300 titres quotidiens nationaux (Le Monde, Le Figaro, Libération, …) et régionaux (La Provence, Ouest-France, Sud-Ouest, …), a exprimé dans Le Monde ses craintes : « Le risque est que le moteur de recherche devienne un moteur de réponse. Et que les réponses générées par l’IA prennent sur le moteur la place des liens vers les sites web. Cela serait pour nous catastrophique économiquement », a ainsi prévenu Pierre Petillault (6). En prenant la main sur Google Search, le moteur « AI Overviews » effectue la recherche à la place de l’utilisateur-lecteur et produit lui-même un contenu multi-source. L’internaute gagne du temps, mais les sites web perdent en trafic et donc en publicité. Et en occupant une grande partie de la page de résultats, la réponse de « Google Gemini » tend à se suffire en elle-même. Le clic devient optionnel. « Nous voyons que les liens inclus dans AI Overviews obtiennent plus de clics que si la page était apparue comme une liste de sites web traditionnelle pour cette requête », a assuré Liz Reid pour apaiser les craintes. Mais qu’adviendra-t-il des sites web situés tout en bas de la page de résultats, où la trappe se le dispute aux oubliettes. « La question, c’est qui choisit ces liens ? Parce qu’il n’y en aura que quelques-uns [dans AI Overviews]. Comment puis-je m’assurer que mes liens, mon site, mon contenu sont inclus dans ces résultats ? J’imagine qu’il faudra payer, ce qui n’est pas vraiment différent de ce qui existait jusqu’ici », s’est interrogé David Clinch, cofondateur du cabinet de conseil Media Growth Partners (MGP), cité par l’AFP le 16 mai.
Autre inquiétude : le 21 mai, lors de son Google’s Marketing Live (7), le géant du Web a révélé que ses aperçus IA incluront des publicités signalées « sponsorisées » dans les réponses, reléguant aussi plus bas dans la page les liens sponsorisés classiques. De quoi destabiliser tout l’écosystème.
Le lièvre Microsoft associé à OpenAI a été le premier, fin 2023, à mettre de l’IA générative dans son moteur de recherche Bing. Mais il est rattrapé par la tortue Google qui a pris le temps de tester depuis un an son AI Overviews boosté par Gemini (ex-Bard). Contrairement au marché traditionnel des moteurs de recherche où Google est ultradominant, la concurrence devrait être plus exacerbée, OpenAI (8), Perplexity (9) ou encore Anthropic (10) étant décidés à tailler des croupières à Google Search.

Baisse de régime des moteurs en vue
D’autant que le cabinet américain Gartner a prédit que les moteurs de recherche traditionnels verront leur volume de requêtes chuter d’un quart (- 25 %) d’ici 2026 au profit des chatbots ou autres agents virtuels alimentés par l’IA. « Les solutions d’IA générative (GenAI) deviennent des moteurs de réponse de substitution, remplaçant les requêtes des utilisateurs qui pouvaient auparavant être exécutées dans les moteurs de recherche traditionnels. Cela forcera les entreprises à repenser leur stratégie de canaux marketing à mesure que GenAI s’intègrera à tous les aspects de l’entreprise », prévient Alan Antin, l’un de ses analyses (11). Pour ne pas caler, les moteurs de recherche sont tous contraints de devenir des moteurs de réponse à tout. @

Charles de Laubier

IA génératives, contrefaçons, exceptions au droit d’auteur et opt out : où se situent les limites ?

Adopté par les eurodéputés le 13 mars 2024, l’AI Act – approuvé par les Etats membres en décembre 2023 – va être définitivement voté en plénière par le Parlement européen. Mais des questions demeurent, notamment sur les limites du droit d’auteur face aux intelligences artificielles génératives.

Par Vanessa Bouchara, avocate associée, et Claire Benassar, avocate collaboratrice, Bouchara & Avocats.

Si l’utilisation des intelligences artificielles (1) est désormais largement répandue, ces techniques et technologies capables de simuler l’intelligence humaine restent au cœur de nombreux questionnements – tant éthiques que juridiques. Alors même que le projet de règlement européen visant à encadrer l’usage et la commercialisation des intelligences artificielles au sein de l’Union européenne, dit AI Act (2), a été adopté en première lecture le 13 mars 2024 par le Parlement européen (3), c’est l’intelligence artificielle générative – IAg, AIG ou GenAI – qui est aujourd’hui sujette à controverse.

Droit d’auteur et procès en contrefaçon
A l’origine du débat les concernant, il importe de rappeler que les systèmes d’IAg ont pour particularité de générer du contenu (textes, images, vidéos, musiques, graphiques, etc.) sur la base, d’une part, des informations directement renseignées dans l’outil par son utilisateur, et, d’autre part et surtout, des données absorbées en amont par l’outil pour enrichir et entraîner son système. Les systèmes d’intelligence artificielle générative sont ainsi accusés d’être à l’origine d’actes de contrefaçon, et pour cause : l’ensemble des données entrantes dont ils se nourrissent peuvent potentiellement être protégées par des droits de propriété intellectuelle. Où se situe donc la limite entre l’utilisation licite de ces données et la caractérisation d’un acte de contrefaçon ? Si, par principe, la reproduction de telles données est interdite, le droit européen semble désormais entrouvrir la possibilité d’utiliser celles-ci dans le seul cadre de l’apprentissage de l’IAg.

L’interdiction de reproduction de données protégées par le droit d’auteur. L’auteur d’une œuvre de l’esprit (4) jouit sur cette œuvre, du seul fait de sa création, de l’ensemble des droits conférés aux auteurs par le Code de la propriété intellectuelle (CPI). A ce titre, l’auteur d’une œuvre peut notamment s’opposer à toute reproduction de celle-ci, c’est-à-dire à toute fixation matérielle quelle qu’elle soit de son œuvre par tous procédés qui permettent de la communiquer au public d’une manière indirecte. Si l’IAg utilise en grande partie des données publiques, se pose tout de même la question de l’utilisation de ces données lorsqu’elles constituent de telles œuvres de l’esprit bénéficiant de la protection offerte par le droit d’auteur. La collecte et l’intégration de telles données dans les outils d’intelligence artificielle constituent-ils toutefois de tels actes de reproduction ? Eu égard à la définition très large du droit de reproduction, il semblerait qu’il faille répondre à cette question par la positive. En effet, la définition qui en est donnée par le législateur incite à considérer qu’en principe, tout acte de reproduction d’une œuvre doit faire l’objet d’une autorisation préalable de son auteur.
Aussi, en l’absence d’autorisation de la part de leurs auteurs, l’intégration des données d’apprentissage protégées par le droit d’auteur dans l’outil d’IAg pourrait aisément matérialiser un acte de contrefaçon par reproduction. C’est d’ailleurs à ce titre que plusieurs procédures sont en cours aux Etats-Unis. Plusieurs recours collectifs ont dernièrement été déposés en 2023 contre OpenAI et Microsoft, notamment par un regroupement d’écrivains américains – soutenus par la Authors Guild (5) – qui soutiennent que l’algorithme entraînant le robot ChatGPT manie leurs œuvres en violation de leurs droits d’auteur. Le New York Times a lui aussi porté plainte contre OpenAI et Microsoft (6). Il en est de même pour la banque d’images Getty Images qui accuse l’outil Stable Diffusion, développé par Stability AI, de violer ses droits d’auteur. Les procès se multiplient contre les IAg. Si la législation applicable est toute autre aux Etats-Unis, il nous semble toutefois que le dénouement des litiges en cours puisse potentiellement nous aiguiller sur le possible positionnement des juges français.

Exceptions, citations, extraits, …
Intelligence artificielle générative, fair use et exception de courte citation. Si les défendeurs outre Atlantique excipent généralement du concept de fair use, lequel permet l’utilisation loyale d’une œuvre par un tiers, les exceptions au droit d’auteur en France sont strictement délimitées et encadrées par les dispositions du CPI. Aussi, si les droits conférés aux auteurs d’une œuvre de l’esprit sont particulièrement étendus, le législateur les a de longue date assortis d’une liste exhaustive conséquente d’exceptions venant faire obstacle aux droits d’auteur. Parmi celles-ci, à défaut de fair use, certains entendent ainsi défendre l’IAg sur la base de l’exception de courte citation, permettant à tout tiers d’exploiter de courts extraits de l’œuvre dans la mesure où cette exploitation serait notamment justifiée par le caractère pédagogique, scientifique ou d’information de l’œuvre à laquelle elles sont incorporées. Seulement, encore faut-il que le tiers invoquant cette exception indique clairement le nom de l’auteur et la source. Ce que les outils d’IAg ne font pas, et ne peuvent pas faire eu égard à la masse de données sur laquelle se fonde leur entraînement, et surtout au regard du recoupement de l’ensemble de ces informations, lequel rend presque impossible de sourcer chacun des auteurs dont les œuvres sont utilisées.

Fouille de textes et de données limitée
L’évolution des techniques utilisées rend ainsi indispensable l’évolution du droit actuel et de la jurisprudence qui en découlera.
La limitation du droit d’auteur pour la fouille de textes et de données. Sans même anticiper l’arrivée fulgurante de l’intelligence artificielle au début des années 2020, le législateur européen est venu introduire en 2019 – via la directive « Droit d’auteur dans le marché unique numérique » (7) – une nouvelle exception au droit d’auteur en autorisant la fouille de textes et de données (« text and data mining » ou TDM), laquelle trouve ainsi à s’appliquer lorsque les reproductions d’œuvres réalisées ne remplissent pas toutes les conditions de l’exception pour les actes de reproduction provisoires. Seulement, les défenseurs de l’IAg se sont engouffrés dans cette brèche et ont entendu appliquer cette exception à la collecte et à la reproduction des données disponibles en ligne par les systèmes d’intelligence artificielle, afin de légitimer leur utilisation par ces derniers.
C’est ainsi, dans cette logique, que l’AI Act s’approprie le texte de 2019 et applique l’exception aux fins de fouille de textes et de données aux outils d’IAg. Néanmoins, exception à l’exception, le texte prévoit que tout auteur peut anticiper l’utilisation de ses œuvres par l’IA et s’opposer à cette exploitation en l’indiquant par tout moyen (droit de retrait ou opt out), auquel cas l’exception de « text and data mining » ne trouvera plus à s’appliquer. En pareille hypothèse, les systèmes d’IA seront ainsi à nouveau soumis l’obligation d’obtenir l’autorisation expresse de l’auteur afin de procéder à l’exploration de textes et de données sur ses œuvres de façon licite. Pour autant, le considérant 105 de l’AI Act, précise que les détenteurs de droits peuvent choisir de réserver leurs droits sur leurs œuvres ou autres objets pour empêcher l’exploration de texte et de données, « sauf si cela est fait à des fins de recherche scientifique ». Et dans l’article 2 du même AI Act, le sixième point prévoir que « le présent règlement ne s’applique pas aux systèmes d’IA ou aux modèles d’IA, y compris leur production, spécifiquement développés et mis en service aux seules fins de la recherche et du développement scientifiques ».
Nous nous interrogeons toutefois sur la pertinence de ce système d’« opt out » proposé aux auteurs, dans la mesure où il apparaît difficile – voire impossible – de contrôler son respect par les outils d’IA. En effet, comment un auteur peut-il contrôler que son œuvre n’est pas utilisée pour entraîner une intelligence artificielle ? A charge pour l’AI Office – le Bureau européen de l’IA créé par l’AI Act (8) – de rendre public un « résumé des contenus utilisées pour l’entraînement » de chaque IA à usage général (considérants 107 et 108 de l’AI Act, et articles 53d et 56b).
En dépit de sa volonté protectrice, et alors même qu’il n’est pas entré en vigueur, l’AI Act semble donc d’ores et déjà confronté aux difficultés inhérentes aux avancées techniques issues de l’intelligence artificielle.
Contenu généré par l’IAg et contrefaçon. Cela étant, quand bien même la fouille de données est autorisée en vertu du droit européen, cette exception reste cantonnée au seul entraînement des systèmes d’IA, et ne permet pas pour autant à l’outil de générer en fin de processus des données contrefaisantes. Aussi, dans la mesure où les données générées reproduiraient à tout le moins en partie les caractéristiques originales des données d’entraînement, elles ne pourront pas être exploitées sans l’autorisation préalable des auteurs des données d’entraînement, sauf à caractériser un acte de contrefaçon. En effet, il n’est en pratique jamais exclu que l’on puisse reconnaître tout ou partie des éléments issus des données entrantes, et il apparaît ainsi en théorie probable que des contrefaçons par imitation puissent être caractérisées. Néanmoins, dans quelle mesure l’utilisateur de l’IAg sera-t-il averti que la donnée générée contrefait une œuvre antérieure ?

Quid de la rémunération des contenus ?
S’il existe nécessairement une limite au-delà de laquelle les tribunaux pencheront en faveur de la contrefaçon, il est fort à parier que les utilisateurs des outils d’IAg la franchiront bien avant les développeurs à l’origine de ces outils. Les interrogations restent en tout cas nombreuses, comme en témoignent les deux missions lancées en France le 12 avril dernier par le Conseil supérieur de la propriété littéraire et artistique (CSPLA), d’une part sur la rémunération des contenus culturels utilisés par les IA (9) et d’autre part sur la mise en œuvre de l’AI Act (10). @