La Chine est le premier pays à s’attaquer aux « deepfake », ces contenus hyper-truqués à l’IA

Depuis le 10 janvier 2023, en Chine, le règlement « Deep Synthesis Provisions » est entré en vigueur pour réguler voire interdire les « deepfake » créés à l’aide de l’intelligence artificielle en détournant textes, images audios et/ou vidéos. Ces créations hyperréalistes prennent de l’ampleur.

Le président ukrainien Volodymyr Zelensky a expliqué l’an dernier dans une vidéo qu’il avait capitulé face aux russes et qu’il appelait les soldats de son pays à déposer les armes (1). L’acteur américain Morgan Freeman s’est exprimé en 2021 sur la chaîne YouTube néerlandaise Diep Nep pour dire : « Je ne suis pas Morgan Freeman. Ce que vous voyez n’est pas réel » (2). Car ces vidéos et de nombreuses autres postées sur les réseaux sociaux – lorsque ce ne sont pas des textes, des images ou des podcasts – sont des « deepfake », des contenus entièrement manipulés et détournés à l’aide de l’intelligence artificielle (IA) et l’apprentissage machine (AM).

La Chine devance les USA et l’UE
Le résultat est vraisemblable et bluffant. L’année 2023 pourrait être celle de l’explosion de ces vidéos truquées hyperréalistes. Les Etats-Unis ont commencé à légiférer par endroits (Californie, New York, Virginie, Texas) contre les abus des deepfakes – nom composé de deep learning et de fake news. Le Parlement européen devrait bientôt examiner en séance publique la proposition de règlement « Artificial Intelligence Act » (3) mise sur les rails il y a vingt mois (4). Mais c’est la Chine qui vient de devancer l’Occident en faisant entrer en vigueur le 10 janvier 2023 un règlement applicable à l’ensemble de l’Empire du Milieu.
Le texte composé de 25 articles est surnommé le « Deep Synthesis Provisions » (5) et s’applique désormais à toute la filière des fournisseurs de « synthèse profonde » (deepfake). Son entrée en vigueur est l’aboutissement d’un processus qui avait commencé après un discours du président Xi Jinping (photo) devant le Politburo en octobre 2021 où il mettait en garde contre « les symptômes malsains et incontrôlés » de l’économie numérique. C’est le Cyberespace Administration of China (CAC), en cheville avec les ministères de l’Industrie et des Technologies de l’information (MIIT) et de la Sécurité publique (MPS), qui a été à la manoeuvre. Le CAC a été chargé d’élaborer ce règlement « Deep Synthesis Provisions », dont la première version a été publiée il y a un an (fin janvier 2022) à l’occasion d’une consultation publique d’un mois. La version finale a été publiée fin novembre dernier. « Les services qui offrent un dialogue intelligent, des voix synthétisées, la génération de visages, des scénarios de simulation immersive, etc., pour générer ou modifier considérablement la fonction du contenu d’information, devraient être marqués de façon significative pour éviter la confusion ou l’identification erronée du public. », explique le CAC dans un communiqué du 11 décembre (6). La Chine définit la technologie de synthèse profonde comme celle qui utilise l’apprentissage profond (deep learning), la réalité virtuelle et d’autres algorithmes synthétiques pour produire du texte, des images, de l’audio, de la vidéo, des scènes virtuelles ou en 3D, et d’autres informations réseau. Les fournisseurs de services de synthèse approfondie sont tenus de désigner les entreprises qui offrent des services, logiciels et supports techniques. La responsabilité incombe aux prestataires de services de synthèse profonde en matière de sécurité des données et de protection des informations personnelles, de transparence (notamment en établissant des lignes directrices, des critères et des processus pour reconnaître les informations fausses ou préjudiciables), et de gestion de contenu et étiquetage (étiquettes ou logos).
Les dispositions du règlement « Deep Synthesis Provisions » s’appuient sur un règlement « Online Audio and Video Information Services » (7) de 2019 qui interdit sur Internet l’utilisation de photos, d’audios et de vidéos générés par ordinateur pour produire ou diffuser des fausses nouvelles. Mais comme dans le reste du monde, il sera difficile de faire la part des choses, entre fake news et parodie. La censure chinoise ajoute une corde à son arc.
Quoi qu’il en soit, Pékin prend très au sérieux la menace des deepfakes, y compris des algorithmes (8), à l’heure où la bataille commerciale exacerbée avec Washington fait rage sur fond de guerre en Ukraine déclenchée par sa voisine et amie la Russie.

La notion de « contenus illicites » du DSA
En attendant l’adoption du règlement « Artificial Intelligence Act », l’Europe s’est dotée du Digital Services Act (DSA) qui entre en vigueur en 2023. Il prévoit notamment que les plateformes numériques « lutte[nt] contre la diffusion de contenus illicites en ligne et contre les risques, pour la société, de diffusion d’informations trompeuses » (considérant 9), la notion (vague ?) de « contenus illicites » étant mentionnée dans au moins huit articles du DSA (9) – mais sans qu’il y soit question explicitement de deepfake. Avec son « Deep Synthesis Provisions », la Chine a pris de l’avance et pourrait être suivie par d’autres pays autoritaires. @

Charles de Laubier

L’industrie de la musique a du mal à s’attaquer au fléau des « fake streams » : l’opacité domine

Cela fait des années que la fraude au streaming musical est détectée sans que ce fléau des « fake streams » ne soit stoppé. Et ce, au détriment de la rémunération des artistes relégués dans le classement. Cela pourrait représenter jusqu’à 30 % de l’audience des musiques écoutées en ligne.

En 2021, le total du chiffre d’affaires généré par le streaming musical dans le monde atteignait 16,9 milliards de dollars. C’est devenu la principale source de revenus de l’industrie de la musique enregistrée, soit plus de 65 % du total (numérique, physique, droits voisins et synchronisation confondus), d’après la Fédération internationale de l’industrie phonographique (IFPI), dirigée par Frances Moore (photo). Mais, selon différentes sources, de 5% à 30 % en volume de la musique en streaming relèveraient de fausses écoutes – les « fake streams ».

845 millions de dollars captés illégalement ?
Impossible à ce stade de savoir ce que cela représente en valeur en raison de l’opacité des plateformes de streaming musical (Spotify, Deezer, Apple Music, Amazon Music, …). Si les fake streams devaient représenter ne serait-ce que 5 % du chiffre d’affaires du streaming musical dans le monde, cela correspondrait à… 845 millions de dollars de captés illégalement au détriment d’autres artistes relégués mécaniquement dans le volume de streams. Pire : en appliquant 10 % en valeur, l’addition de la fraude aux clics dépasserait largement les 1,5 milliard de dollars !
Cette extrapolation faite par Edition Multimédi@ est bien sûr invérifiable, mais elle n’est pas invraisemblable tant les fake streams ont pris de l’ampleur aux dires de la filière musicale. En juillet 2019, dans le magazine américain Rolling Stone, un label affirmait que « 3 % à 4% des flux mondiaux sont des flux illégitimes, représentant environ 300 millions de dollars de recettes potentielles perdues qui sont passées de sources légitimes à des sources illégitimes et illégales » (1). Depuis, les « fermes à clics » et la « manipulation de streams » ont proliféré pour augmenter l’audience de titres : logiciels robotisés (bot, botnet) ou personnes physiques rémunérée pour générer du clic. Au niveau mondial, le taux de 30 % a même été avancé par la filière musicale, notamment cité par le journaliste Sophian Fanen, cofondateur de Les Jours et auteur de l’enquête au long cours sur « La fête du fake stream» (2). Il nous précise cependant : « Il ne s’agit que d’une estimation, et [ce taux de 30 %] ne concerne que la nouveauté. Les faux streams ne fabriquent pas de l’argent ; ils font grossir artificiellement la masse globale de streams à partir de laquelle les plateformes rémunèrent la filière à partir de leurs revenus mensuels (qui varient) ». En France, où l’Union des producteurs phonographiques français indépendants (UPFI) est montée au créneau le 6 décembre pour appeler « à un sursaut du secteur et des pouvoirs publics face à ce phénomène désastreux à l’ampleur grandissante », le taux de fake streams se situerait entre 5% et 10 % des écoutes quotidiennes, d’après ElectronLibre. L’UPFI a adressé une lettre à sa centaine de membres et labels indépendants (Believe, Harmonia Mundi, PlayTwo, Wagram Music, …) pour « condamne[r] fermement et sans équivoque le principe de manipulation des écoutes, rappelant qu’elle relève d’une tricherie (…), un artiste ayant acheté des streams capte une rémunération qui lèse l’ensemble des artistes » (3). Elle estime en outre que l’Arcom (4) serait « légitime » pour réguler le streaming et « recueillir les plaintes contre les acteurs fournissant des prestations d’achat de streams ».
Contacté par Edition Multimédi@, le directeur général de l’UPFI, Guilhem Cottet, rappelle qu’en mai 2021 un amendement avait été déposé dans ce sens au Sénat dans le cadre de l’examen du projet de loi « Régulation et protection de l’accès aux oeuvres culturelles à l’ère numérique », celle-là même qui a fondé l’Arcom. Bien qu’il ait été retiré, cet amendement (5) soutenu par la filière musicale proposait que l’Arcom puisse avoir des pouvoirs d’enquête et de « lutte contre la manipulation de diffusions en flux ». Ses agents habilités et assermentés pourraient « constater les faits susceptibles de constituer une infraction ». « En parallèle, rappelle aussi Guilhem Cottet, les organisations de producteurs avaient adressé un courrier à Roselyne Bachelot (6) pour la sensibiliser sur ce dossier : à la suite de cela, elle avait missionné une étude du Centre national de la musique (CNM), qui devrait être publiée début 2023 ». Au lieu de juin 2022…

Spotify dit lutter contre les manipulations
Le CNM bute sur la non-divulgation des données d’écoutes par les plateformes de streaming. C’est le cas du numéro un mondial de la musique en ligne Spotify qui affirme pourtant auprès de ses actionnaires et investisseurs – le groupe de Stockholm est coté à la Bourse de New York (Nyse) – prendre très au sérieux les fake streams : « L’échec à gérer et corriger efficacement [par des algorithmes et manuellement] les tentatives de manipulation des flux pourrait avoir une incidence négative sur nos activités, nos résultats d’exploitation et notre situation financière », prévient-il dans son dernier rapport annuel. @

Charles de Laubier

Pour pallier la disparition des cookies, la publicité contextuelle cherche à s’imposer dans le monde

La fin prochaine des cookies, et autres traceurs publicitaire intrusifs sur les terminaux des internautes pris pour cibles, a ouvert la voie à la publicité contextuelle. C’est aussi une alternative à l’exploitation des données personnelles des utilisateurs. Des adtech comme Seedtag relèvent le défi.

« La publicité contextuelle est une technique publicitaire qui vise à diffuser sur un support (web, télévision) des publicités choisies en fonction du contexte dans lequel le contenu publicitaire est inséré », définit la Cnil sur son site web (1). Avantage : le ciblage contextuel ne nécessite pas d’avoir des informations sur la personne regardant la publicité, ni de collecter des données personnelles la concernant. Bref, c’est l’arme anti-cookie et anti-data par excellence. Des adtech comme l’espagnole Seedtag s’en sont fait une spécialité, devançant notamment le champion français des cookies, Criteo (2), qui tente de pivoter dans le contextuel.

Seedtag, « n°1 mondial » du contextuel
La start-up Seedtag, fondée en 2014 par deux anciens de chez Google, Jorge Poyatos (photo de gauche) et Albert Nieto (photo de droite), a créé une intelligence artificielle contextuelle – baptisée Liz – qui permet aux annonceurs de « toucher les consommateurs en fonction de leurs intérêts sans utiliser aucune donnée personnelle ». Ayant son siège social à Madrid, cette licorne en puissance se déploie à l’international, tant en Europe qu’aux Etats-Unis et en Amérique du Sud. Fin juillet, elle a annoncé avoir levé 250 millions d’euros auprès du fonds américain Advent International. Celui-ci rejoint d’autres investisseurs institutionnels déjà présents dans Seedtag, à savoir Oakley Capital, Adara Ventures et All Iron Ventures. Objectif : « Faire évoluer le secteur de la publicité digitale à plus grande échelle », notamment outre-Atlantique.
Seedtag se revendique déjà comme étant « le numéro un en Europe et en Amérique Latine dans la publicité contextuelle ». S’étant d’abord développé dans la publicité intégrée au sein des images illustrant des articles (in-image advertising), Seedtag a ensuite élargi son offre à la vidéo (outstream) et aux bannières (display). Pour se hisser à la première place de ce marché dynamique, la start-up madrilène rachète certains de ses concurrents : la société italienne AtomikAd est tombée dans son escarcelle en novembre 2020, suivie de l’allemand Recognified en février 2021, puis du français KMTX en juillet 2022. En plus de son IA contextuelle, Liz, Seedtag ajoute ainsi des cordes à son arc pour mieux cibler les internautes sans recourir aux cookies ni exploiter leurs données, ni les suivre à la trace dans leurs navigations sur le Web. Ses outils alternatifs vont du placement in-content jusqu’à l’automatisation des performances marketing (apprentissage automatique). « En diffusant des publicités dans le contenu, nous tirons pleinement parti de l’attention des utilisateurs : selon l’eye-tracking [oculométrie en français, à savoir le suivi des mouvements des yeux sur un écran, ndlr] les publicités intégrées au contenu captent l’attention plus rapidement et la retiennent plus longtemps ».
Cette optimisation du ciblage publicitaire cookie-free est obtenue par la « lecture » approfondie des contenus des pages pour obtenir le meilleur résultat pour l’annonceur. De grandes marques telles que Microsoft, LG, Heineken, Nestlé, Renault, Unilever, Levi’s, Forbes, Marie-Claire, Vanity Fair ou encore Sky Sport font partie du portefeuille de clients de Seedtag. Par exemple, la filiale française dirigée par Clarisse Madern a renouvelé en début d’année des partenariats avec des éditeurs tels que CMI (Elle, Marianne, Télé 7 jours, …), Prisma Media (Capital, Gala, Geo, …), Lagardère Publicité News et Reworld Media.
En mai dernier, avec l’appui d’une étude de l’institut marketing Nielsen réalité auprès de 1.800 consommateurs au Royaume-Uni, Seedtag a démontré que le ciblage contextuel était bien plus accepté que le ciblage utilisant leurs données personnelles : « Les consommateurs étaient 2,5 fois plus intéressés par la publicité contextuelle que lorsqu’il la publicité n’est pas ciblée. De plus, les résultats ont montré que les personnes qui ont vu des publicités contextuelles étaient 32 % plus susceptibles de passer l’action après avoir vu la publicité. Les consommateurs ciblés en fonction du contexte se sont sentis 40 % plus enthousiastes à l’égard de la catégorie [du message publicitaire] que ceux ciblés sur le plan démographique et 28 % plus enthousiastes que ceux ciblés uniquement en raison de leur intérêt dans la catégorie » (3).

Les navigateurs deviennent cookieless
En début d’année, dans le cadre de ses tests pour sa solution alternative « Privacy Sandbox », Google avait annoncé la fin des cookies tiers sur son navigateur Chrome d’ici à fin 2023 (4), au lieu de 2022 initialement prévu. Alors qu’Apple avec Safari et Mozilla avec Firefox sont déjà cookieless (5), la filiale d’Alphabet a dû prolonger les tests : « Nous avons maintenant l’intention de commencer à éliminer progressivement les cookies tiers dans Chrome dans la seconde moitié de l’année 2024 », a-t-elle indiqué le 27 juillet dernier (6). @

Charles de Laubier

Readium LCP : la solution de gestion de droits digitaux de l’EDRLab veut libérer le livre numérique

Le déverrouillage des ebooks est en marche, grâce au DRM (Digital Rights Management) conçu par l’EDRLab (European Digital Reading Lab). Cet outil appelé Readium LCP (Licensed Content Protection) se veut une alternative aux verrous propriétaires d’Amazon, d’Apple, d’Adobe ou de Kobo.

La plupart des maisons d’édition, des libraires, des bibliothèques et des plateformes de distribution de ebooks l’ont adoptée : la solution de gestion de droits numériques développée et promue par l’association européenne EDRLab, basée à Paris, est en train de se généraliser au monde du livre après un an de test. Baptisé Readium LCP, cet outil DRM se veut une alternative ouverte aux verrous propriétaires des Amazon, Apple, Adobe et autres Kobo (Rakuten). La France a été le premier pays à l’adopter, suivie de l’Allemagne, de la Grande-Bretagne et d’autres pays européens, voire partout dans le monde (1).

Copie privée, circulation et inclusion
Les acteurs français du prêt numérique en bibliothèque l’utilisent déjà tels que Numilog, Eden Livres, Immatériel, Vivlio, La Médi@thèque et BiblioAccess, ainsi que les plateformes de ventes de livres numériques comme ePagine. A l’instar du groupe Editis (Vivendi) ou d’Hachette Livre (Lagardère), des éditeurs y ont de plus en plus recours. Objectif : libérer le marché du livre numérique, en permettant enfin aux lecteurs de partager les fichiers de leurs ebooks dans le respect du droit d’auteur. Ainsi, les utilisateurs peuvent user de leur droit à la copie privée (exception au droit d’auteur) puisque le partage est limité à une trentaine de personnes ou de terminaux au sein de leur cercle familial voire amical. « Readium LCP est une solution de gestion des droits basée sur les mots de passe, avec laquelle les titulaires de droits peuvent protéger efficacement et à faible coût leur contenu ePub, PDF et livres audio contre le partage excessif. Il s’agit d’une solution simple mais fiable pour la distribution de contenu protégé, basée sur des algorithmes de cryptage solides et des techniques classiques de PKI [gestionnaire de clés publiques, ou Public Key Infrastructure, ndlr]. La solution est en même temps minimalement intrusive pour les utilisateurs finaux, qui n’ont pas besoin de créer un compte tiers et peuvent même partager leurs ebooks avec leur famille ou des amis proches », explique l’EDRLab cofondé durant l’été 2015 par Hachette Livre, Editis, Madrigall/ Gallimard-Flammarion et Media Participations, avec le Syndicat national de l’édition (SNE), le Cercle de la Librairie (CL) et le Centre national du livre (CNL), ainsi que le ministère de la Culture (2). L’EDRLab contribue en outre aux évolutions du format ePub 3 pour les ebooks, en attendant de l’IDPF (3) un éventuel ePub 4 multimédia (texte, audio, vidéo, …). En « libéralisant » le marché du livre numérique, les professionnels de la filière font d’une pierre deux coups : la norme internationale Readium LCP les met d’ores et déjà en conformité avec la directive européenne sur l’accessibilité de l’édition numérique, ou « Accessibility Act » (4), qui entrera en vigueur à partir du 28 juin 2025. Celle-ci inclut les personnes handicapées dans l’accès aux produits et services – dont les ebooks et les liseuses. Readium LCP est aussi conçu en mode privacy-by-design pour la protection de la vie privée et des données personnelles.
L’industrie du livre européenne fait ainsi le pari de la circulation facilitée des œuvres de l’écrit, comme l’a fait en son temps l’industrie de la musique. Fini les obstacles techniques au partage de ebooks. Fini l’impossibilité d’accéder à un fichier numérique de livre après la fermeture d’une librairie en ligne. Il s’agit de déverrouiller, enfin (5). « Avec Readium LCP, l’utilisateur peut constituer sans contraintes sa bibliothèque numérique. Car ce DRM dispense désormais le lecteur de la création d’un compte auprès d’un service tiers et de son identification préalable à la lecture de son livre numérique. Reposant sur un système de phrase secrète (pass-phrase), cette solution lui permet d’accéder facilement à ses livres numériques sur différents supports de lecture », explique la plateforme ePagine, librairie numérique lancée en 2008 par la société Tite-Live sous le nom d’Aligastore. Cette plateforme de marché de librairies opère aussi pour Place des Libraires, Bookeen, Gibert ou encore Gallimard.

ePagine et Numilog aux avant-postes
Cofondateur d’ePagine, François Boujard (photo de gauche) vient d’annoncer cet été que « la totalité du catalogue de l’édition française est désormais compatible avec Readium LCP, ePagine appliquant la protection d’EDRLab sur l’ensemble des fichiers hébergés ». Autre diffuseur numérique et libraire en ligne, Numilog a indiqué début juillet avoir adopté lui aussi le DRM sur ses plateformes Numilog.com et Girlybook.com – après l’avoir rendu disponible dès 2021 sur Biblioaccess.com (prêt numérique pour bibliothèques). « Cela pourrait avoir à terme un impact positif important sur le marché des livres numériques », espère Denis Zwirn (photo de droite), président fondateur de Numilog. @

Charles de Laubier

Plus de 200 opérateurs mobiles, dans 80 pays, offrent la 5G à plus de 1 milliard d’utilisateurs

Les équipementiers télécoms – Samsung, Huawei, Ericsson, Nokia, Apple, Qualcomm, Intel ou ZTE – se frottent les mains : la cinquième génération de mobiles prend enfin son envol. Deux seuils sont dépassés cette année : plus de 200 opérateurs 5G et plus de 1 milliard d’utilisateurs dans le monde.

Pour les membres exécutifs de la Global Mobile Suppliers Association (GSA), que sont Samsung, Huawei, Ericsson, Nokia, Apple, Qualcomm, Intel et ZTE, le marché mondial de la 5G décolle enfin. Leur organisation internationale, basée au Royaume-Uni et présidée par Joe Barrett (photo), a publié fin juin auprès de ses adhérents un état des déploiements de la 5G dans le monde : sur près de 500 opérateurs télécoms (1) dans 150 pays et régions qui investissent dans un réseau 5G (y compris tests, achat de licences, projets, déploiements et lancements commerciaux), plus de 200 d’entre eux dans 80 pays ont lancé des services mobiles (2).

5G fixe (FWA) et 5G standalone (SA)
La GSA, dont le snapshot est établi à fin mai 2022 (voir 1er graphique), a recensé parmi ces opérateurs 85 dans 46 pays et territoires qui ont lancé des services de 5G fixe à la norme 3GPP (3), appelés aussi Fixed Wireless Access (FWA). Cela représente tout de même environ 40 % des opérateurs télécoms qui offrent de la 5G fixe. Preuve supplémentaire, s’il en était besoin, que la cinquième génération de mobiles ne sera pas uniquement au service de la mobilité. Elle est amenée aussi à concurrencer la fibre optique dans les foyers, dont certains n’hésiteront pas à remplacer leur « box » fixe (ADSL ou FTTH) par une « box » 5G (FWA).
Autre constat : quelque 108 opérateurs télécoms ont investi dans ce que l’on appelle la « 5G autonome » ou « 5G standalone » (5G SA), dont 28 d’entre eux sont des réseaux publics. Il s’agit de réseaux construits uniquement pour la 5G, contrairement à d’autres réseaux 5G qui s’appuient sur des réseaux 4G existants. L’avantage de cette 5G autonome – dotée de ses propres équipements – est qu’elle est bien plus performante, en termes de connexions disponibles, de temps de latence très faibles et de très haut débits dignes de ce nom. Mais cette « vraie » 5G suppose de la part des « telcos » des investissements plus importants. Partir des installations 4G déjà en place pour monter progressivement en puissance vers la 5G nécessite en effet de moindres dépenses, mais – contrairement à ce que croit le client abonné – les appels voix continuent de passer par la 4G et les données transitent par la 4G et la 5G. La 5G SA, elle, forte de son autonomie et de sa pleine puissance, est « 100% 5G » et peut même être une sérieuse alternative dans les zones rurales mal ou pas desservies par la fibre optique de bout-en-bout, pour peu que les opérateurs télécoms se donnent la peine d’investir de façon « autonome ».
Par exemple, en France, Bouygues Telecom (4), SFR, Free et Orange ont prévu de mettre en service dès 2023 leurs réseaux 5G standalone. Pour l’heure, selon les chiffres publiés le 7 juillet par l’Arcep au 31 mars 2022, l’Hexagone compte 4,1 millions d’abonnés 5G. Autrement dit, la France ne pèse que 0,4 % du milliard d’utilisateurs identifiés par CSS Insight. Ce cabinet d’étude britannique a publié fin juin une estimation du nombre d’utilisateurs 5G dans le monde : la barre du milliard est en train d’être franchie pour atteindre 1,2 milliard d’utilisateurs à la fin de cette année et, selon ses prévisions, ce nombre aura plus que doublé en 2024 (voir 2e graphique). La 5G devient réalité, du moins si la « vraie » 5G suit le mouvement. @

Charles de Laubier