Abusives, ces blocklists qui provoquent un manque à gagner publicitaire pour toute la presse en ligne

Les marques ont tellement peur de voir leurs publicités se retrouver sur des pages web où apparaissent des mots-clés tels que « mort », « sexe » ou encore « arme à feu » qu’elles les empêchent de s’y afficher. Ces blocklists en arrivent à priver la presse en ligne de ces revenus publicitaires.

Les annonceurs publicitaires veulent à tout prix une « sécurité » ou une « protection » pour leurs marques lorsqu’elles s’exposent dans le monde numérique (réseaux sociaux, presse en ligne, …). Cette exigence de « brand safety » (protection de la marque) est de plus en plus doublée d’une demande de « brand suitability » (adéquation à la marque). Objectif des annonceurs : trier sur le volet – de façon automatisée pour la publicité qui est jusqu’à 90 % programmatique – les sites web ou les plateformes sur lesquels les publicités de leurs marques auront le droit de s’exposer, sans risque de se retrouver sur des contenus qu’ils jugent indésirables.

Surblocages provoqués par des mots-clés
Mais là où le bât blesse, c’est que les multiples « listes noires » constituées à partir de mots-clés indésirables – ou « blocklists » (listes de blocages), afin d’exclure de la campagne publicitaire tous les contenus en ligne jugés a priori infréquentables – pénalisent de plus en plus la presse en ligne. Car l’information journalistique ne manque pas de parler des sujets sensibles ou des actualités parfois violentes (accidents, meurtres, attentats, sexes, politiques, …). Résultat : à force de trop vouloir aseptiser leurs environnements publicitaires pour ne pas « infecter » leur image de marque, les annonceurs se privent d’affichages sur de nombreux sites de presse en ligne. Les éditeurs de médias numériques se retrouvent donc comme les victimes collatérales de ces listes de blocages automatisées – appelées aussi « filterlists » et constituées en amont par les annonceurs et leurs agences médias – propulsées aveuglément par des algorithmes dans un monde pour l’essentiel programmatique. Ce surblocage engendre un manque à gagner pour toute la presse numérique, partout dans le monde, qu’elle soit éditée par des pure players ou par des journaux papier (quotidiens, tabloïdes, magazines, …) déclinés en ligne.
Or, bien que le phénomène abusif soit documenté depuis les années 2010, (suite) ni les organisations de la presse, ni les syndicats des éditeurs médias, ni les associations d’annonceurs n’ont jusqu’à présent réussi à se mettre d’accord pour empêcher cet overblocking publicitaire généralisé. Les professionnels de la « réclame » se souviennent de mars 2017, lorsque plusieurs marques – L’Oréal, Audi, Marks & Spencer, HSBC, Sky, etc. – ont suspendu leurs publicités sur YouTube et Google Display Network. Le « scandale du brand safety » avait été révélé par The Times (1) : leurs publicités se retrouvaient à côté de contenus extrémistes ou inappropriés comme la haine ou l’apologie du viol, ce qui portait atteindre à leur image et revenait pour eux à les financer. Les deux filiales d’Alphabet (YouTube et Google) avaient dû revoir leurs mécanismes de placement publicitaire, via notamment YouTube Select (ex-Reserve) ou Demand Gen. Des contrôleurs tiers ont en outre été mis en place tels que Integral Ad Science (IAS (2)), NewsGuard (3), ou encore DoubleVerify (DV). Les blocklists prolifèrent depuis, à tel point qu’une étude de Cheq – société israélienne de cybersécurité et de protection publicitaire – a révélé en 2020 que « le problème des listes noires de sécurité des marques, pénalisant incorrectement un contenu entièrement sûr, coûte aux éditeurs un chiffre d’affaires stupéfiant de 3,2 milliards de dollars chaque année ». Exemple : au New York Times, « seulement 9 des 100 principales actualités [publiées] en 2019 ont été jugées sûres pour les marques [brand safe] par les listes noires » (4). Cinq ans après cette étude, ces listes noires de blocage publicitaire continuent encore aujourd’hui de priver la presse en ligne de revenus publicitaires non négligeables et pourtant vitaux.
La presse française n’échappe pas au phénomène des blocklists intempestives. Alors que dans la catégorie « éditions et info » les investissements publicitaires ont reculé au premier semestre 2025 de – 5 % en display (5) et de – 6 % en vidéo, le marché de la publicité digital dans son ensemble progressait, lui, de + 12 % sur la même période, selon le Bump (6) de France Pub et de l’Institut de recherches et d’études publicitaires (Irep), avec Kantar Media : cherchez l’erreur.

30-40 % de contenus d’information exclus
« Ce décalage s’explique notamment par l’utilisation de blocklists. Mal calibrées ou insuffisamment mises à jour, elles excluent entre 30 % et 40 % des contenus d’information – articles politiques, économiques, société – alors que ces environnements représentent jusqu’à 80 % du trafic des sites de presse », déplore l’Alliance de la presse d’information générale (Apig), où l’on retrouve Le Monde, Le Figaro, Libération, Le Parisien, mais aussi Ouest-France, L’Est Républicain, Le Télégramme, Sud-Ouest ou La Provence. L’Apig l’a démontré à partir d’une étude (7) sans précédent commanditée à l’agence d’études Iligo, fondée par Olivier Goulet (photo ci-dessus), l’actuel président de l’Irep. @

Charles de Laubier

La presse française en ligne va payer très cher sa trop grande dépendance au moteur Google

L’accès aux sites de presse en ligne passe de plus en plus par les moteurs de recherche – Google Discover, Google Search et Google News en tête. La filiale d’Alphabet génère même en France près de 70 % du trafic total de la presse française. Cette « google-dépendance » présente un sérieux risque.

Les éditeurs de presse, qui s’inquiètent déjà de la baisse de leur trafic Internet provenant de l’incontournable Google, ne sont pas au bout de leur peine. Mi-juillet, les sites d’information américains 9to5Google (1) et TechCrunch (2) ont révélé que le géant mondial des moteurs de recherche a commencé, aux Etats-Unis seulement pour l’instant, à faire apparaître des résumés générés par l’IA dans le flux Discover (« Découvrir ») sur ses applications mobiles Android et iOS. Un porte-parole de Google a indiqué qu’il ne s’agissait pas d’un test mais bien d’un lancement.

Les « résumés d’IA » lancés sur Discover
Un des objectifs de Google est que ces « résumés d’IA » (AI Summaries) ou « résumés générés par l’IA » (AI-generated Summaries) permettent aux internautes de décider plus facilement des pages qu’ils souhaitent visiter. Au lieu d’un seul logo d’un média ou d’un seul nom de publication apparaissant dans le coin supérieur gauche de la carte dans Discover, s’affichent plusieurs icônes – comprenez différents logos de médias-sources (par exemple BBC, Le Monde, CNN, Reuters, etc.) – qui se chevauchent pour représenter le nombre d’articles utilisés par l’IA de Google pour générer le résumé – avec un avertissement de rigueur : « Generated with AI, which can make mistakes » (3). Tous les articles d’actualité ne sont pas concernés, la fonctionnalité IA n’étant pour l’instant opérationnelle que sur les sujets tendances de style de vie, de sport et de divertissement. Certaines news comprendront en outre un ensemble de puces sous le titre où seront regroupées des nouvelles similaires.
Avec ce mode IA dans Discover (que l’on retrouve dans les applis Google, dont le navigateur Chrome), à l’instar des AI Overviews dans le moteur de recherche Google, les utilisateurs n’ont plus vraiment besoin de visiter directement un site web pour obtenir des réponses à leurs requêtes. Le contenu issu de l’éditeur de presse est résumé pour eux automatiquement. Cette interface de type chatbot (suite) n’est pas l’apanage de Google, puisque d’autres applications d’IA telles que ChatGPT ou Perplexity en proposent de similaires. « L’IA permet à la recherche de faire ce qu’elle a toujours voulu faire : organiser l’information mondiale, même quand elle est fragmentée », a justifié Elizabeth Reid, alias Liz Reid (photo), vice-présidente de Google, responsable du moteur de recherche, lors du Google I/O 2025 en mai dernier (4). Déjà inquiétés par la baisse de leur trafic Internet depuis le lancement, lors de l’I/O 2024, des AI Overviews sur le moteur de recherche (5), les éditeurs de sites de presse en ligne redoutent une aggravation de leurs audiences avec l’arrivée des AI Summaries. Dans un article intitulé « L’IA est en train de tuer le Web » (6) et paru le 14 juillet 2025, l’hebdomadaire économique britannique The Economist cite des chiffres de Similarweb qui montrent que le trafic de recherche mondiale a chuté de 15 % d’une année sur l’autre en juin. Depuis le lancement des AI Overviews, cette société d’analyse du trafic a constaté que le nombre de recherches d’actualités sur le Web qui n’aboutissent à aucun clic vers les sites d’actualités est passé de 56 % à près de 69 % en mai 2025. Le trafic dit « organique » (7) a également diminué, passant de plus de 2,3 milliards de visites par mois à son apogée à la mi-2024 à moins de 1,7 milliard aujourd’hui. Et pire : cette baisse de trafic pour la presse est très loin d’être compensée par la hausse des renvois des ChatGPT, Perplexity et autres Grok vers les sites d’actualités.
Les médias et groupes de presse font monter la pression sur Google et Elizabeth Reid. Elle tente de rassurer les journaux en ligne. Lancé fin juin, Offerwall (8) arrive bien tardivement aux yeux des éditeurs dont le trafic a déjà chuté. Cet outil est censé leur permettre de générer des revenus au-delà des options plus dépendantes du trafic, comme les publicités. Avec Google Ad Manager, Offerwall leur propose différentes méthodes pour donner accès à leur contenu, comme les micropaiements ou la participation des utilisateurs à des sondages, à l’inscription à des newsletters, à des visionnages d’annonces, etc.

« Google-addiction » de la presse française
Pas encore concernée par les résumés de l’IA sur Discover, la presse française le sera dans les prochains mois. Pour l’heure, l’Alliance de la presse d’information générale (Apig) s’est félicitée le 16 juillet de voir les audiences de 68 titres membres augmenter : en juin 2025, le trafic a globalement augmenté de 6,5 % par rapport à juin 2024, et de 3,5 % par rapport à mai 2025. « La part de trafic issue de Google continue de croître (+15,1 %), notamment grâce au dynamisme de Google Discover, et représente désormais 69 % du trafic total. Cette évolution souligne l’importance croissante des moteurs de recherche dans l’accès à l’information », précise l’Apig (9). La presse française, après la presse américaine, pourrait s’en mordre les doigts. @

Charles de Laubier

Les médias en ligne redoutent la transformation du moteur de recherche Google en IA générative

Plus de 25 ans après sa création par Larry Page et Sergey Brin, le moteur de recherche en quasi-monopole fait sa mue pour devenir une IA générative qui aura réponse à tout. Les sites web de presse pourraient être les victimes collatérales en termes d’audience. Le chat-search présentera moins de liens.

(après que des internautes aient signalé des résultats erronés générés par « AI Overviews », Google a annoncé le 30 mai des mesures correctrices, y compris en améliorant ses algorithmes) 

Google est mort, vive Google ! Mais cet enthousiasme ne sera sans doute pas partagé par les sites de médias en ligne qui tirent jusqu’à maintenant une part importante de leurs audiences de la consultation massive du moteur de recherche Google, lorsque ce n’est pas de son agrégateur d’actualités Google News. Depuis que Sundar Pichai, le PDG d’Alphabet, maison mère de Google, a annoncé le 14 mai – lors du Google I/O 2024 (1) – la plus grande transformation du numéro un mondial du search en un moteur d’IA générative, les éditeurs de presse en ligne s’inquiètent pour la fréquentation de leurs sites Internet. L’objet de leurs craintes s’appelle « AI Overviews », la fonctionnalité la plus « intelligente » et disruptive jamais introduite dans Google depuis son lancement il y a un quart de siècle (2). La page de résultats de recherche ne sera plus présentée de la même manière : fini la liste impersonnelle de liens donnant accès à des sites web censés répondre, après avoir cliqué, à vos requêtes courtes et souvent par mots-clés ; place à une réponse détaillée et intelligible développée par l’IA générative elle-même, en fonction de ce que vous lui avez demandé en langage naturel, avec quelques liens seulement triés sur le volet en guise de sources venant étayer la réponse et/ou le raisonnement.

Avec « AI Overviews », moins besoin de cliquer
Cette combinaison de l’IA générative et de l’IA multimodale fait passer Google de l’ère du « moteur » (search) à celle d’« assistant » (chatbot). Le nouveau Google « intelligent » a commencé à être déployé aux Etats-Unis depuis mi-mai, et d’autres pays dans le monde suivront pour atteindre 1 milliard d’utilisateurs d’ici la fin de l’année. L’IA générative de Google, appelée Gemini, vous mâche le travail sans que vous ayez forcément besoin d’aller cliquer sur les liens relégués au second plan. « Maintenant, avec l’IA générative, le moteur de recherche peut faire plus que vous ne l’imaginez. Vous pouvez donc demander ce que vous avez en tête ou ce que vous devez faire – de la recherche à la planification en passant par le brainstorming – et Google s’occupera des démarches », a expliqué Elizabeth Reid, alias Liz Reid (photo), vice-présidente de Google, responsable du moteur de recherche. Cliquer sur des liens devient une option, tant la réponse « AI Overviews » (« Aperçus de l’IA » en français) peut s’évérer satisfaisante.


La « Google dépendance » des médias
Surtout que Gemini est un grand modèle multimodal (LMM), développé par Google DeepMind, capable de comprendre et de générer du contenu en utilisant différents types de données comme du texte, des images, de l’audio et de la vidéo. YouTube, Google Maps ou encore Google Shopping seront mis à contribution. La réponse synthétique du chat-search apportée à l’utilisateur est multimédia et vise à satisfaire immédiatement ce dernier, avec peu de sites mis en exergue par AI Overviews, afin que l’internaute n’aille plus se perdre dans un inventaire de liens à la Prévert.
La liste de sites web habituellement en tête des résultats de recherche sur Google (comme sur d’autres moteurs de recherche d’ailleurs) se retrouve tout en bas de la page. Cette réorganisation du moteur de recherche de la firme de Mountain View va chambouler au passage toutes les stratégies d’optimisation pour les moteurs de recherche, ce que l’on appelle SEO (Search Engine Optimization). De plus, le nouveau « AI Google » pourrait éradiquer les « spams SEO », ou spamdexing (4), et limiter les liens sponsorisés qui parasitent les résultats de recherche. Mais les prestataires de SEO appellent à plus de transparence sur AI Overviews, rapporte eMarketer (5). Les médias en ligne optimisent eux aussi leur visibilité dans les résultats de recherche et, partant, augmentent leur trafic. Revers de la médaille de cette « Google dépendance », qui atteindrait jusqu’à près de la moitié de l’audience d’un site web : les éditeurs du monde entier s’attendent à ce que leurs audiences chutent. « A mesure que nous étendrons cette expérience, nous continuerons à nous concentrer sur l’envoi de trafic précieux aux éditeurs et aux créateurs », a tenté de les rassurer Liz Reid.
Beaucoup de candidats, peu d’élus : tel pourrait être à l’avenir le bilan de d’AI Overviews sur la presse en ligne, certains désavantagés pourraient être poussés à mettre la clé sous la porte. En France, le directeur général de l’Alliance de la presse d’information générale (Apig), qui réunit 300 titres quotidiens nationaux (Le Monde, Le Figaro, Libération, …) et régionaux (La Provence, Ouest-France, Sud-Ouest, …), a exprimé dans Le Monde ses craintes : « Le risque est que le moteur de recherche devienne un moteur de réponse. Et que les réponses générées par l’IA prennent sur le moteur la place des liens vers les sites web. Cela serait pour nous catastrophique économiquement », a ainsi prévenu Pierre Petillault (6). En prenant la main sur Google Search, le moteur « AI Overviews » effectue la recherche à la place de l’utilisateur-lecteur et produit lui-même un contenu multi-source. L’internaute gagne du temps, mais les sites web perdent en trafic et donc en publicité. Et en occupant une grande partie de la page de résultats, la réponse de « Google Gemini » tend à se suffire en elle-même. Le clic devient optionnel. « Nous voyons que les liens inclus dans AI Overviews obtiennent plus de clics que si la page était apparue comme une liste de sites web traditionnelle pour cette requête », a assuré Liz Reid pour apaiser les craintes. Mais qu’adviendra-t-il des sites web situés tout en bas de la page de résultats, où la trappe se le dispute aux oubliettes. « La question, c’est qui choisit ces liens ? Parce qu’il n’y en aura que quelques-uns [dans AI Overviews]. Comment puis-je m’assurer que mes liens, mon site, mon contenu sont inclus dans ces résultats ? J’imagine qu’il faudra payer, ce qui n’est pas vraiment différent de ce qui existait jusqu’ici », s’est interrogé David Clinch, cofondateur du cabinet de conseil Media Growth Partners (MGP), cité par l’AFP le 16 mai.
Autre inquiétude : le 21 mai, lors de son Google’s Marketing Live (7), le géant du Web a révélé que ses aperçus IA incluront des publicités signalées « sponsorisées » dans les réponses, reléguant aussi plus bas dans la page les liens sponsorisés classiques. De quoi destabiliser tout l’écosystème.
Le lièvre Microsoft associé à OpenAI a été le premier, fin 2023, à mettre de l’IA générative dans son moteur de recherche Bing. Mais il est rattrapé par la tortue Google qui a pris le temps de tester depuis un an son AI Overviews boosté par Gemini (ex-Bard). Contrairement au marché traditionnel des moteurs de recherche où Google est ultradominant, la concurrence devrait être plus exacerbée, OpenAI (8), Perplexity (9) ou encore Anthropic (10) étant décidés à tailler des croupières à Google Search.

Baisse de régime des moteurs en vue
D’autant que le cabinet américain Gartner a prédit que les moteurs de recherche traditionnels verront leur volume de requêtes chuter d’un quart (- 25 %) d’ici 2026 au profit des chatbots ou autres agents virtuels alimentés par l’IA. « Les solutions d’IA générative (GenAI) deviennent des moteurs de réponse de substitution, remplaçant les requêtes des utilisateurs qui pouvaient auparavant être exécutées dans les moteurs de recherche traditionnels. Cela forcera les entreprises à repenser leur stratégie de canaux marketing à mesure que GenAI s’intègrera à tous les aspects de l’entreprise », prévient Alan Antin, l’un de ses analyses (11). Pour ne pas caler, les moteurs de recherche sont tous contraints de devenir des moteurs de réponse à tout. @

Charles de Laubier