Le moteur de recherche Qwant, « dont vous êtes l’utilisateur, pas le produit ! », joue la transparence

Basé en France, Qwant revendique être « l’un des premiers moteurs de recherche indépendants en Europe » et assure ne pas conserver les données de recherche ni les vendre. Son PDG, Olivier Abecassis, se veut transparent, y compris vis-à-vis de l’Arcom dans le cadre du DSA.

L’Arcom (1) a indiqué le 12 janvier qu’elle avait été « dans l’incapacité de trouver un rapport de transparence RSN [en référence au règlement européen sur les services numériques, ou DSA, ndlr] » pour au moins une douzaine de plateformes de « services intermédiaires » qu’elle doit superviser en France, parmi lesquels Qwant. Pourtant, le Digital Services Act (2) leur impose des obligations en matière de rapports de transparence qu’ils doivent mettre « à la disposition du public […] au moins une fois par an […] sur les éventuelles activités de modération des contenus auxquelles ils se sont livrés au cours de la période concernée » (3) : injonctions reçues, activités de modération, réclamations reçues, moyens automatisés utilisés, …

DSA : des obligations de transparence
Contacté par Edition Multimédi@ sur cette absence de rapport de transparence qu’a pointée le régulateur (4), le PDG de Qwant, Olivier Abecassis (photo), nous apporte l’explication suivante : « En effet, notre rapport était rédigé mais n’était pas en ligne, ce qui a été fait dès que l’Arcom nous l’a rappelé ». Le premier rapport de transparence du moteur de recherche français a donc finalement été publié le 14 janvier sur le site web de l’entreprise basée à Paris (5). Tenant sur une page, ce document fait état d’une (suite) douzaine d’injonctions de retrait ou de désactivation de contenus illicites : onze concernant des « jeux de hasard illégaux » et une portant sur le « respect des lois internes ».
Il est précisé que le traitement des injonctions des autorités s’est fait dans un délai de 72 heures. En revanche, il n’y a pas eu d’« injonction de communication d‘informations sur des utilisateurs », ni de « modération de contenu exercée à l’initiative de Qwant », ni encore de « signalements reçus ». Qwant précise en outre qu’il n’y a pas d’outils de modération. Ces indications de transparence ont été portées à la connaissance de l’Arcom, qui est – au regard du DSA – un coordinateur pour les services numériques (CSN) chargé d’assurer la cohérence de la mise en œuvre de ce règlement à l’échelon national. A ce titre, l’Arcom fait partie du Comité européen des services numériques (EBDS), que préside la Commission européenne et où siègent les CSN de chacun des vingt-sept Etats membres de l’UE (6). Le moteur de recherche français aux ambitions européennes, fondé sur la confidentialité des données et la souveraineté technologique, ne tombe pas sous le contrôle direct de la Commission européenne, dans la mesure où il est encore loin d’atteindre les 45 millions d’utilisateurs mensuels requis pour être classé VLOSE – Very Large Online Search Engines (7).
Pour l’heure, Qwant – société rachetée en juin 2023 par Octave Klaba (président d’OVH) et son frère Miroslaw Klaba pour 14 millions d’euros via l’entreprise Synfonium créée à cette occasion avec la Banque des Territoires de la CDC (8) – dépasse à peine les 25 millions de visiteurs par mois. A précisément 25,1 millions d’utilisateurs si l’on se réfère à son audience de décembre 2025 mesurée par Similarweb, tous pays confondus – dont 52,5 % provenant de France et près de 10 % de l’Allemagne (9). Le nom de domaine qwant.com concentre l’essentiel du trafic, qwant.fr restant marginal et qwantjunior.com et qwantjunior.fr redirigeant vers l’adresse principale. Pour la France, Qwant n’est ni audité par Médiamétrie ni par l’Alliance pour les chiffres de la presse et des médias (ACPM), et la société ne publie pas elle-même de chiffres certifiés. « Nous ne souscrivons pas au panel dans chaque pays, mais surtout notre modèle privacy/B2B (10) sous-évalue notre couverture. Nous suivons nos requêtes quotidiennes. Nous restons majoritairement en France (80 %), puis l’Allemagne (7-8 %) et les USA (5 %) », nous précise Olivier Abecassis. Pour fournir ses résultats de recherche, Qwant a recours en partie depuis 2016 à la technologie de Bing, le moteur de recherche de Microsoft, mais accuse ce dernier d’abuser à la fois de sa position dominante à son détriment. Pour autant, l’Autorité de la concurrence a rejeté le 27 novembre 2025 sa plainte (11).

Accord avec une partie de la presse française
Qwant se veut aussi transparent envers la presse française, avec une partie de laquelle – via l’Alliance de la presse d’information générale (Apig) – un accord a été annoncé le 15 janvier sur les droits voisins, couvrant les moteurs Qwant, Qwant Junior et Lilo. « Ce nouvel accord […] prouve la pertinence de la négociation collective », s’est félicité Pierre Louette, alors président de l’Apig. Cet accord – négocié par la Sacem (12) – définit « les conditions générales de rémunération des contenus, permettant ensuite à chaque éditeur membre de conclure sa propre licence individuelle [avec] sa liberté de négociation » (13). Et ce, alors que le « Chat IA » est disponible depuis le 29 janvier sur Qwant et Lilo. @

Charles de Laubier

SEO, GEO et LLMO : visibilité en ligne chamboulée

En fait. Le 17 septembre, la société américaine Zeta Global – cotée en Bourse à New-York et spécialisée dans les solutions de marketing multicanal – a lancé sur sa plateforme le Generative Engine Optimization (GEO), la solution tendance pour que les marques restent visibles dans les réponses des IA génératives.

En clair. Signe des temps, la société de marketing direct Zeta Global – fondée en 2007 par par David Steinberg, son actuel PDG, et John Sculley, ancien PDG d’Apple (1983-1993) – plonge dans le grand bain mondial de l’optimisation pour les moteurs génératifs. Les spécialistes du marketing et les annonceurs publicitaires ont aimé le Search Engine Optimization (SEO), pour rendre plus visibles leurs marques et sites web dans les résultats des moteurs de recherche ; ils adorent déjà le Generative Engine Optimization (GEO). Car les moteurs de recherche traditionnels voient de plus en plus leurs utilisateurs passer aux intelligences artificielles génératives, même si Google est pour l’instant encore en position dominante avec son search. L’institut d’études Gartner a prédit « une baisse de 25 % du volume des moteurs de recherche d’ici 2026, en raison des chatbots IA et autres agents virtuels » (1).
De son côté, le cabinet de conseil Bain & Company a relevé en février 2025 que « 80 % des consommateurs (suite) s’appuient désormais sur les résultats écrits par l’IA pour au moins 40 % de leurs recherches, ce qui réduit le trafic web organique de 15 à 25 % » (2). Pas de temps à perdre : les marques et les sites web ne veulent pas être engloutis dans les classements des chat-search. Dans cette nouvelle donne de la visibilité en ligne, où l’IA générative formules les réponses, il s’agit aussi d’identifier et de corriger les lacunes de citation, les hallucinations ou les réponses. Pour être fin prêt au GEO, il faut désormais « optimiser les contenus pour qu’ils soient LLM-ready (questions-réponses, résumés, métadonnées) », comme l’explique Zeta Global, faisant référence aux grands modèles de langage – Large language model (LLM).
« Si vous n’êtes pas présent et précis dans la boîte de réponse, vous êtes invisible », prévient David Steinberg, PDG cofondateur de Zeta Global (3), qui se positionne comme « cloud marketing d’IA » (4). « Le nouvel outil permet aux spécialistes du marketing de contrôler l’apparition de leurs marques dans les principaux systèmes d’IA, notamment ChatGPT [d’OpenAI], Gemini [de Google] et Claude [d’Anthropic], et d’optimiser leurs réponses avec des recommandations ciblées et exploitables » (5). En France, des agences GEO voire LLMO (Large Language Model Optimization) montent en puissance, telles que Archipel AI, Eskimoz, Primelis, Upto1 ou Sales Odyssey. @

La presse française en ligne va payer très cher sa trop grande dépendance au moteur Google

L’accès aux sites de presse en ligne passe de plus en plus par les moteurs de recherche – Google Discover, Google Search et Google News en tête. La filiale d’Alphabet génère même en France près de 70 % du trafic total de la presse française. Cette « google-dépendance » présente un sérieux risque.

Les éditeurs de presse, qui s’inquiètent déjà de la baisse de leur trafic Internet provenant de l’incontournable Google, ne sont pas au bout de leur peine. Mi-juillet, les sites d’information américains 9to5Google (1) et TechCrunch (2) ont révélé que le géant mondial des moteurs de recherche a commencé, aux Etats-Unis seulement pour l’instant, à faire apparaître des résumés générés par l’IA dans le flux Discover (« Découvrir ») sur ses applications mobiles Android et iOS. Un porte-parole de Google a indiqué qu’il ne s’agissait pas d’un test mais bien d’un lancement.

Les « résumés d’IA » lancés sur Discover
Un des objectifs de Google est que ces « résumés d’IA » (AI Summaries) ou « résumés générés par l’IA » (AI-generated Summaries) permettent aux internautes de décider plus facilement des pages qu’ils souhaitent visiter. Au lieu d’un seul logo d’un média ou d’un seul nom de publication apparaissant dans le coin supérieur gauche de la carte dans Discover, s’affichent plusieurs icônes – comprenez différents logos de médias-sources (par exemple BBC, Le Monde, CNN, Reuters, etc.) – qui se chevauchent pour représenter le nombre d’articles utilisés par l’IA de Google pour générer le résumé – avec un avertissement de rigueur : « Generated with AI, which can make mistakes » (3). Tous les articles d’actualité ne sont pas concernés, la fonctionnalité IA n’étant pour l’instant opérationnelle que sur les sujets tendances de style de vie, de sport et de divertissement. Certaines news comprendront en outre un ensemble de puces sous le titre où seront regroupées des nouvelles similaires.
Avec ce mode IA dans Discover (que l’on retrouve dans les applis Google, dont le navigateur Chrome), à l’instar des AI Overviews dans le moteur de recherche Google, les utilisateurs n’ont plus vraiment besoin de visiter directement un site web pour obtenir des réponses à leurs requêtes. Le contenu issu de l’éditeur de presse est résumé pour eux automatiquement. Cette interface de type chatbot (suite) n’est pas l’apanage de Google, puisque d’autres applications d’IA telles que ChatGPT ou Perplexity en proposent de similaires. « L’IA permet à la recherche de faire ce qu’elle a toujours voulu faire : organiser l’information mondiale, même quand elle est fragmentée », a justifié Elizabeth Reid, alias Liz Reid (photo), vice-présidente de Google, responsable du moteur de recherche, lors du Google I/O 2025 en mai dernier (4). Déjà inquiétés par la baisse de leur trafic Internet depuis le lancement, lors de l’I/O 2024, des AI Overviews sur le moteur de recherche (5), les éditeurs de sites de presse en ligne redoutent une aggravation de leurs audiences avec l’arrivée des AI Summaries. Dans un article intitulé « L’IA est en train de tuer le Web » (6) et paru le 14 juillet 2025, l’hebdomadaire économique britannique The Economist cite des chiffres de Similarweb qui montrent que le trafic de recherche mondiale a chuté de 15 % d’une année sur l’autre en juin. Depuis le lancement des AI Overviews, cette société d’analyse du trafic a constaté que le nombre de recherches d’actualités sur le Web qui n’aboutissent à aucun clic vers les sites d’actualités est passé de 56 % à près de 69 % en mai 2025. Le trafic dit « organique » (7) a également diminué, passant de plus de 2,3 milliards de visites par mois à son apogée à la mi-2024 à moins de 1,7 milliard aujourd’hui. Et pire : cette baisse de trafic pour la presse est très loin d’être compensée par la hausse des renvois des ChatGPT, Perplexity et autres Grok vers les sites d’actualités.
Les médias et groupes de presse font monter la pression sur Google et Elizabeth Reid. Elle tente de rassurer les journaux en ligne. Lancé fin juin, Offerwall (8) arrive bien tardivement aux yeux des éditeurs dont le trafic a déjà chuté. Cet outil est censé leur permettre de générer des revenus au-delà des options plus dépendantes du trafic, comme les publicités. Avec Google Ad Manager, Offerwall leur propose différentes méthodes pour donner accès à leur contenu, comme les micropaiements ou la participation des utilisateurs à des sondages, à l’inscription à des newsletters, à des visionnages d’annonces, etc.

« Google-addiction » de la presse française
Pas encore concernée par les résumés de l’IA sur Discover, la presse française le sera dans les prochains mois. Pour l’heure, l’Alliance de la presse d’information générale (Apig) s’est félicitée le 16 juillet de voir les audiences de 68 titres membres augmenter : en juin 2025, le trafic a globalement augmenté de 6,5 % par rapport à juin 2024, et de 3,5 % par rapport à mai 2025. « La part de trafic issue de Google continue de croître (+15,1 %), notamment grâce au dynamisme de Google Discover, et représente désormais 69 % du trafic total. Cette évolution souligne l’importance croissante des moteurs de recherche dans l’accès à l’information », précise l’Apig (9). La presse française, après la presse américaine, pourrait s’en mordre les doigts. @

Charles de Laubier

Les médias en ligne redoutent la transformation du moteur de recherche Google en IA générative

Plus de 25 ans après sa création par Larry Page et Sergey Brin, le moteur de recherche en quasi-monopole fait sa mue pour devenir une IA générative qui aura réponse à tout. Les sites web de presse pourraient être les victimes collatérales en termes d’audience. Le chat-search présentera moins de liens.

(après que des internautes aient signalé des résultats erronés générés par « AI Overviews », Google a annoncé le 30 mai des mesures correctrices, y compris en améliorant ses algorithmes) 

Google est mort, vive Google ! Mais cet enthousiasme ne sera sans doute pas partagé par les sites de médias en ligne qui tirent jusqu’à maintenant une part importante de leurs audiences de la consultation massive du moteur de recherche Google, lorsque ce n’est pas de son agrégateur d’actualités Google News. Depuis que Sundar Pichai, le PDG d’Alphabet, maison mère de Google, a annoncé le 14 mai – lors du Google I/O 2024 (1) – la plus grande transformation du numéro un mondial du search en un moteur d’IA générative, les éditeurs de presse en ligne s’inquiètent pour la fréquentation de leurs sites Internet. L’objet de leurs craintes s’appelle « AI Overviews », la fonctionnalité la plus « intelligente » et disruptive jamais introduite dans Google depuis son lancement il y a un quart de siècle (2). La page de résultats de recherche ne sera plus présentée de la même manière : fini la liste impersonnelle de liens donnant accès à des sites web censés répondre, après avoir cliqué, à vos requêtes courtes et souvent par mots-clés ; place à une réponse détaillée et intelligible développée par l’IA générative elle-même, en fonction de ce que vous lui avez demandé en langage naturel, avec quelques liens seulement triés sur le volet en guise de sources venant étayer la réponse et/ou le raisonnement.

Avec « AI Overviews », moins besoin de cliquer
Cette combinaison de l’IA générative et de l’IA multimodale fait passer Google de l’ère du « moteur » (search) à celle d’« assistant » (chatbot). Le nouveau Google « intelligent » a commencé à être déployé aux Etats-Unis depuis mi-mai, et d’autres pays dans le monde suivront pour atteindre 1 milliard d’utilisateurs d’ici la fin de l’année. L’IA générative de Google, appelée Gemini, vous mâche le travail sans que vous ayez forcément besoin d’aller cliquer sur les liens relégués au second plan. « Maintenant, avec l’IA générative, le moteur de recherche peut faire plus que vous ne l’imaginez. Vous pouvez donc demander ce que vous avez en tête ou ce que vous devez faire – de la recherche à la planification en passant par le brainstorming – et Google s’occupera des démarches », a expliqué Elizabeth Reid, alias Liz Reid (photo), vice-présidente de Google, responsable du moteur de recherche. Cliquer sur des liens devient une option, tant la réponse « AI Overviews » (« Aperçus de l’IA » en français) peut s’évérer satisfaisante.


La « Google dépendance » des médias
Surtout que Gemini est un grand modèle multimodal (LMM), développé par Google DeepMind, capable de comprendre et de générer du contenu en utilisant différents types de données comme du texte, des images, de l’audio et de la vidéo. YouTube, Google Maps ou encore Google Shopping seront mis à contribution. La réponse synthétique du chat-search apportée à l’utilisateur est multimédia et vise à satisfaire immédiatement ce dernier, avec peu de sites mis en exergue par AI Overviews, afin que l’internaute n’aille plus se perdre dans un inventaire de liens à la Prévert.
La liste de sites web habituellement en tête des résultats de recherche sur Google (comme sur d’autres moteurs de recherche d’ailleurs) se retrouve tout en bas de la page. Cette réorganisation du moteur de recherche de la firme de Mountain View va chambouler au passage toutes les stratégies d’optimisation pour les moteurs de recherche, ce que l’on appelle SEO (Search Engine Optimization). De plus, le nouveau « AI Google » pourrait éradiquer les « spams SEO », ou spamdexing (4), et limiter les liens sponsorisés qui parasitent les résultats de recherche. Mais les prestataires de SEO appellent à plus de transparence sur AI Overviews, rapporte eMarketer (5). Les médias en ligne optimisent eux aussi leur visibilité dans les résultats de recherche et, partant, augmentent leur trafic. Revers de la médaille de cette « Google dépendance », qui atteindrait jusqu’à près de la moitié de l’audience d’un site web : les éditeurs du monde entier s’attendent à ce que leurs audiences chutent. « A mesure que nous étendrons cette expérience, nous continuerons à nous concentrer sur l’envoi de trafic précieux aux éditeurs et aux créateurs », a tenté de les rassurer Liz Reid.
Beaucoup de candidats, peu d’élus : tel pourrait être à l’avenir le bilan de d’AI Overviews sur la presse en ligne, certains désavantagés pourraient être poussés à mettre la clé sous la porte. En France, le directeur général de l’Alliance de la presse d’information générale (Apig), qui réunit 300 titres quotidiens nationaux (Le Monde, Le Figaro, Libération, …) et régionaux (La Provence, Ouest-France, Sud-Ouest, …), a exprimé dans Le Monde ses craintes : « Le risque est que le moteur de recherche devienne un moteur de réponse. Et que les réponses générées par l’IA prennent sur le moteur la place des liens vers les sites web. Cela serait pour nous catastrophique économiquement », a ainsi prévenu Pierre Petillault (6). En prenant la main sur Google Search, le moteur « AI Overviews » effectue la recherche à la place de l’utilisateur-lecteur et produit lui-même un contenu multi-source. L’internaute gagne du temps, mais les sites web perdent en trafic et donc en publicité. Et en occupant une grande partie de la page de résultats, la réponse de « Google Gemini » tend à se suffire en elle-même. Le clic devient optionnel. « Nous voyons que les liens inclus dans AI Overviews obtiennent plus de clics que si la page était apparue comme une liste de sites web traditionnelle pour cette requête », a assuré Liz Reid pour apaiser les craintes. Mais qu’adviendra-t-il des sites web situés tout en bas de la page de résultats, où la trappe se le dispute aux oubliettes. « La question, c’est qui choisit ces liens ? Parce qu’il n’y en aura que quelques-uns [dans AI Overviews]. Comment puis-je m’assurer que mes liens, mon site, mon contenu sont inclus dans ces résultats ? J’imagine qu’il faudra payer, ce qui n’est pas vraiment différent de ce qui existait jusqu’ici », s’est interrogé David Clinch, cofondateur du cabinet de conseil Media Growth Partners (MGP), cité par l’AFP le 16 mai.
Autre inquiétude : le 21 mai, lors de son Google’s Marketing Live (7), le géant du Web a révélé que ses aperçus IA incluront des publicités signalées « sponsorisées » dans les réponses, reléguant aussi plus bas dans la page les liens sponsorisés classiques. De quoi destabiliser tout l’écosystème.
Le lièvre Microsoft associé à OpenAI a été le premier, fin 2023, à mettre de l’IA générative dans son moteur de recherche Bing. Mais il est rattrapé par la tortue Google qui a pris le temps de tester depuis un an son AI Overviews boosté par Gemini (ex-Bard). Contrairement au marché traditionnel des moteurs de recherche où Google est ultradominant, la concurrence devrait être plus exacerbée, OpenAI (8), Perplexity (9) ou encore Anthropic (10) étant décidés à tailler des croupières à Google Search.

Baisse de régime des moteurs en vue
D’autant que le cabinet américain Gartner a prédit que les moteurs de recherche traditionnels verront leur volume de requêtes chuter d’un quart (- 25 %) d’ici 2026 au profit des chatbots ou autres agents virtuels alimentés par l’IA. « Les solutions d’IA générative (GenAI) deviennent des moteurs de réponse de substitution, remplaçant les requêtes des utilisateurs qui pouvaient auparavant être exécutées dans les moteurs de recherche traditionnels. Cela forcera les entreprises à repenser leur stratégie de canaux marketing à mesure que GenAI s’intègrera à tous les aspects de l’entreprise », prévient Alan Antin, l’un de ses analyses (11). Pour ne pas caler, les moteurs de recherche sont tous contraints de devenir des moteurs de réponse à tout. @

Charles de Laubier

Le Monde en France, El País en Espagne, Die Welt en Allemagne : OpenAI séduit la presse au cas par cas

OpenAI a réussi à convaincre de grands titres de presse en Europe – Le Monde, El País et Die Welt – et, aux Etats-Unis, l’agence de presse AP et l’American Journalism Project pour que son IA générative ChatGPT soit plus au fait de l’actualité dans des langues différentes. Le New York Times, lui, a préféré un procès.

Le directeur des opérations d’OpenAI, Brad Lightcap (photo), n’est pas peu fier d’avoir décroché des accords pluriannuels avec les grands quotidiens européens Le Monde en France, El País en Espagne et Die Welt en Allemagne. « En partenariat avec Le Monde et Prisa Media [éditeur d’El País], notre objectif est de permettre aux utilisateurs de ChatGPT du monde entier de se connecter à l’actualité de façon interactive et pertinente », s’est-il félicité le 13 mars dernier lors de l’annonce des deux accords noués pour plusieurs années avec respectivement le groupe français Le Monde pour son quotidien éponyme et le groupe espagnol Prisa Media pour son quotidien El País, de même que pour son quotidien économique et financier Cinco Días et son site d’actualités El Huffpost (1). Trois mois auparavant, ce même Brad Lightcap annonçait un premier partenariat avec le groupe allemand Axel Springer pour son quotidien Die Welt, et son tabloïd Bild, ainsi que pour ses sites d’information Politico (édition européenne) et Business Insider (économie et finances). « Ce partenariat avec Axel Springer aidera à offrir aux gens de nouvelles façons d’accéder à du contenu de qualité, en temps réel, grâce à nos outils d’IA. Nous sommes profondément engagés à nous assurer que les éditeurs et les créateurs du monde entier bénéficient de la technologie avancée de l’IA et de nouveaux modèles de revenus », avait alors assuré le directeur des opérations d’OpenAI (2).

ChatGPT, polyglotte et informé : merci la presse
Ces « partenariats mondiaux d’information » permettent à ChatGPT d’européaniser un peu plus ses capacités d’informer en mettant à contribution trois premiers quotidiens du Vieux Continent, de trois langues différentes (français, espagnol et allemand). Et ce, après avoir largement entraîné en anglais ses grands modèles de langage « Generative Pre-trained Transformer » (GPT, GPT-2, GPT-3 et l’actuel GPT-4, en attendant GPT-5 en cours de développement). Avant les groupes européens Le Monde, Prisa Media et Axel Springer, OpenAI avait conclu aux Etats-Unis deux partenariats signés en juillets 2023 avec respectivement l’agence de presse américaine Associated Press (AP) et l’association de soutien à l’information locale American Journalism Project (AJP).

Sur fond de plainte du New York Times
« Nous sommes impatients d’apprendre d’AP [et de savoir] comment nos modèles d’IA peuvent avoir un impact positif sur l’industrie de l’information. L’accès à ses archives de textes factuels de haute qualité, aideront à améliorer les capacités et l’utilité des systèmes d’OpenAI », avait alors dit Brad Lightcap, lors de l’annonce le 13 juillet 2023 du partenariat avec l’agence de presse américaine (3). Depuis près d’une décennie, AP utilise la technologie de l’IA pour automatiser certaines tâches routinières et libérer les journalistes pour faire des reportages plus fouillés. Elle va même jusqu’à publier des dépêches automatisées prévisualisant et récapitulant certains événements sportifs, élargissant ainsi son offre de contenu.

Cinq jours après, le 18 juillet 2023, OpenAI nouait un premier accord journalistique avec cette fois l’American Journalism Project (AJP). Pour l’occasion, ce n’est pas Brad Lightcap qui avait fait une déclaration mais le cofondateur PDG d’OpenAI Sam Altman lui-même : « Nous sommes fiers de soutenir la mission de l’AJP consistant à renforcer notre démocratie en reconstruisant le secteur de l’information locale du pays. Cette collaboration souligne notre conviction que l’IA doit profiter à tous et être utilisée comme un outil pour améliorer le travail. Nous sommes impatients […] d’explorer les façons dont la technologie de l’IA peut renforcer le travail du journalisme local », avait-il expliqué (4). La société californienne (basée à San Francisco) a versé un crédit de 5 millions de dollars à cette association à but non lucratif soutenant l’information locale aux Etats-Unis pour aider des éditeurs et agences de presse locaux « à évaluer et à déployer les technologies émergentes d’IA au sein de leurs organisations », ainsi qu’« à développer des outils qui pourraient [les] aider ».
Par ailleurs, le 8 août 2023, OpenAI a versé 395.000 dollars pour la « Ethics and Journalism Initiative » de l’institut de journalisme Arthur L. Carter Journalism de l’Université de New York (5). La licorne OpenAI, cornaquée par Microsoft qui en est devenu actionnaire et investisseur à hauteur de 13 milliards de dollars, veut ainsi montrer patte blanche vis-à-vis des médias du monde entier avec son robot textuel présenté comme un partenaire du journalisme et respectueux du droit d’auteur. Et ce, au moment où GPT-4 est accusé de pirater les journaux – et, comme l’a montré le 6 mars dernier la société d’évaluation Patronus AI, les livres (6) – pour s’entraîner et apprendre automatiquement. Le New York Times, lui, n’a pas souhaité signer un accord « ChatGPT », préférant croiser le fer judiciaire en portant plainte le 27 décembre 2023 contre OpenAI devant le tribunal de New York. « Microsoft et OpenAI utilisent illégalement le travail du Times [le New York Times, ndlr] pour créer des produits d’intelligence artificielle qui lui font concurrence et menacent la capacité du Times à fournir ce service. Leurs outils d’IA générative (GenAI) reposent sur des grands modèles de langage (LLM, ou Large Language Model) qui ont été créés en copiant et en utilisant des millions d’articles de presse protégés par le droit d’auteur du Times, des enquêtes approfondies, des articles d’opinion, des critiques, des guides pratiques, etc », a dénoncé The New York Times Company dans sa plainte de 69 pages (7). Et d’accuser Microsoft et OpenAI d’avoir opéré un piratage d’ampleur sur son quotidien de référence : « Bien que Microsoft et OpenAI aient effectué des copies à grande échelle à partir de nombreuses sources, ils ont accordé une importance particulière au contenu du Times lors de la construction de leurs LLM, révélant une préférence qui reconnaît la valeur de ses œuvres. Grâce au Bing Chat de Microsoft (récemment rebaptisé Copilot) et au ChatGPT d’OpenAI, ces derniers cherchent à profiter de l’investissement massif du Times dans son journalisme en l’utilisant pour créer des produits de substitution sans autorisation ni paiement ».
OpenAI s’est inscrit en faut contre les allégations du New York Times, en assurant « travaill[er] dur dans [son] processus de conception technologique pour soutenir les organisations de presse ». Le labo-start-up de Sam Altman a aussi indiqué avoir discuté avec « des dizaines de personnes » (8), dont la News Media Alliance (exNewspaper Association of America) qui a « applaudi » le procès intenté par le NYT (9).

« Source significative de revenus » (Le Monde)
Malgré ses approches au cas par cas avec la presse et ses premiers accords de partenariat, OpenAI n’échappera pas – à l’instar de Google et Facebook en leur temps – à rendre des comptes devant la justice. La presse, le livre ou encore le cinéma hésitent entre accord et procès. En Europe, Le Monde, El País et Die Welt ont préféré signer avec « ChatGPT » plutôt que de trouver un accord-cadre collectif via, par exemple en France, l’Alliance de la presse d’information générale (Apig). Le groupe Le Monde se dit satisfait de cet accord qui, selon ses dirigeants Louis Dreyfus et Jérôme Fenoglio (10), a « l’avantage de consolider [son] modèle économique en apportant une source significative de revenus supplémentaires ». @

Charles de Laubier