Hypertrucages vidéo au réalisme confondant générés par l’IA, les deepfakes se banalisent

Rien ne les arrêtera. Les hypertrucages vidéo et audio déferlent sur le Web et les applications mobiles, comme jamais. Fléau pour les uns, divertissement pour les autres, le phénomène pousse la créativité à son paroxysme. C’est aussi un marché mondial prometteur de plusieurs milliards d’euros.

(Le 23 février 2026, soit une semaine après la publication de cet article, 61 « Cnil » du monde entier ont cosigné une déclaration pour s’inquiéter des deepfakes)

Les deepfakes, que l’intelligence artificielle rend de plus en plus spectaculaires et incroyables, se propagent à la vitesse grand-V sur les réseaux sociaux, les applications mobiles ou encore par e-mail. Ces hypertrucages vidéo plus vrais que nature – mais aussi ceux uniquement audio (1) – en mettent plein la vue. Or, au-delà des abus, polémiques, désinformations et autres cyberattaques qu’ils peuvent provoquer, les deepfakes constituent un marché mondial protéiforme en pleine croissance de plusieurs milliards d’euros.

La barre des 10 milliards de $ en 2026
« Le marché mondial des technologies deepfake était évalué à 9,19 milliards de dollars en 2025, et devrait passer de 11,18 milliards en 2026 à 51,42 milliards d’ici 2034, affichant un taux de croissance annuel moyen de 21 % durant cette période », avance le cabinet d’études indien Fortune Business Insights dans ses prévisions mises à jour en janvier 2026. Cette évaluation porte uniquement sur les logiciels et services que peuvent acheter des clients de plus en plus nombreux, tels que sociétés de médias et de divertissement, publicitaires, organisations gouvernementales, partis politiques, cybercommerçants, etc. « Le segment “logiciel” détenait la plus grande part de marché des technologies deepfake, avec (suite) une part de 68,7 %, tandis que le segment “création” de deepfakes représente 37,92 % de part de marché », estime l’étude (2).
L’un des segments de ce marché mondial en plein boom réside dans les outils de détection des deepfakes, afin de prévenir l’utilisation abusive de ces images générées par IA. « La période électorale actuelle a entraîné une augmentation du contenu deepfake à travers le monde. La demande de solutions pour détecter ce “média synthétique” devrait augmenter et influencer positivement le marché de la technologie deepfake. De plus, comme le marché dépend fortement de la technologie IA, les avancées du marché de l’IA générative devraient favoriser la croissance du marché mondial des deepfakes », prédit la société Fortune Business Insights, fondée et dirigée par Rahul Bhandari (photo). Et encore, cette barre des 10 milliards de dollars susceptible d’être franchie durant cette année 2026 ne prend pas encore en compte tous les revenus induits par les deepfakes tels que ceux de la publicité en ligne, du marketing d’influence, des sociétés de conseil de la production audiovisuelle et cinématographique, ni de la fraude et cybercriminalité. Techniquement, le deepfake repose sur des algorithmes avancés d’apprentissage automatique (machine learning), principalement par des réseaux antagonistes génératifs (GAN, pour Generative Adversarial Network) utilisant deux réseaux de neurones, afin de générer des images et des vidéos réalistes. Grâce à un entraînement itérative, ces réseaux neuronaux apprennent à produire des résultats de plus en plus réalistes, ce qui fait que les deepfakes sont pratiquement indifférenciables des vidéos ou audios authentiques. L’utilisation de ces hypertrucages de synthèse améliore en outre les expériences de réalité augmentée (AR) et de réalité virtuelle (VR), où mondes numériques et mondes réels se mêlent dans des environnements digitaux immersifs, comme dans le jeu vidéo, la formation et même la thérapie.
La croissance annuelle à deux chiffres des deepfakes pourrait même augmenter sur ce marché mondial à la fois tiré par les usages créatifs et par la lutte contre les abus, d’autant que la régulation – visant à imposer la transparence sur ces créations IA par la « preuve d’authenticité » (watermarking, signatures numérique, labels IA, …) – va y contribuer. Dans une étude intitulée « Connected Consumer » et publiée en novembre 2024, le cabinet d’audit et de conseil américain Deloitte avait estimé que « le marché mondial de la détection des deepfakes – tel qu’il est mis en œuvre par les géants de la technologie, des médias et des réseaux sociaux – croîtra de 42 % par an, passant de 5,5 milliards de dollars en 2023 à 15,7 milliards de dollars en 2026 ». Toujours selon Deloitte il y a un peu plus d’un an, « le marché de la détection de deepfake pourrait suivre une trajectoire similaire à celle de la cybersécurité » (3).

CP2A à Washington et Code à Bruxelles
Deloitte a rejoint la Coalition pour la provenance et l’authenticité du contenu (C2PA, Coalition for Content Provenance and Authenticity), laquelle, depuis sa création en 2021 à Washington par Adobe, ARM, BBC, Intel, Microsoft et Truepic (rejoints au comité directeur par Google, Meta, OpenAI et Publicis), a vocation a lutter contre les deepfakes trompeurs grâce à des « normes techniques ouvertes et mondiale pour certifier la source et l’histoire (ou la provenance) du contenu numérique » (4). A Bruxelles, cette fois, la Commission européenne espère publier en mai ou juin 2026 un « Code de pratique sur le marquage et l’étiquetage des contenus générés par IA » (5). Mais le projet divise. @

Charles de Laubier

MrBeast (alias Jimmy Donaldson), n°1 mondial des youtubeurs, fait de l’ombre aux vidéastes locaux

Depuis que la filiale vidéo de Google a annoncé – lors de sa conférence « Made On YouTube », miseptembre – le déploiement mondial du doublage vocal automatisé par l’IA, les youtubeurs locaux craignent de voir le n°1 mondial américain MrBeast détourner leur public à son insatiable profit.

Déjà numéro un mondial des youtubeurs depuis près de trois ans, depuis qu’il a coiffé au poteau en novembre 2022 PewDiePie (alias le Suédois Felix Kjellberg), le tenant du titre à l’époque, le célèbre vidéaste MrBeast (alias l’Américain Jimmy Donaldson) va profiter à plein régime de la généralisation de la traduction automatique et du doublage par l’IA Gemini de Google – avec la nouvelle fonctionnalité de synchronisation des lèvres – pour accroître son influence partout dans tous les pays du monde.

Doublage IA et synchronisation labiale
La concurrence frontale avec les youtubeurs locaux est lancée. D’autant que MrBeast (photo de gauche) n’a pas attendu la conférence annuelle « Made On YouTube », le 16 septembre 2025, pour adopter l’audio multilingue. Ce qui lui a permis de recentrer toute son audience mondiale sur sa chaîne principale, l’amenant à abandonner progressivement toutes les déclinaisons locales: Beast Español, Beast Português, Beast Japanese, ou encore « MrBeast en français » qui affichait près de 1,8 million d’abonnés. Le n°1 des youtubeurs aux près d’un demi-milliard d’abonnés – 442 millions de followers, à début octobre 2025 – est même l’un des chouchous de la filiale vidéo de Google. Dès l’année 2022, il a été parmi les early-adopters de la traduction automatique des vidéos en plusieurs langues. Lorsque YouTube a demandé à un petit groupe de créateurs de tester sa nouvelle fonctionnalité polyglotte.
MrBeast commence alors par (suite) doubler ses vidéos les plus populaires en plus d’une dizaine de langues, ce qui n’a pas manqué d’attirer de nouveaux « téléspectateurs » du monde entier – et sur sa chaîne principale (1) qui existe depuis février 2012. « Les créateurs qui testent des vidéos doublées multilingues ont constaté que plus de 15 % de leur temps de visionnage provenait de vues dans la langue secondaire de la vidéo », avait alors relevé Ritz Campbell, chef de produit chez YouTube (2), celui qui a supervisé le développement du « YouTube Auto-Dubbing ». Le 10 septembre 2025, il a précisé que ce taux était passé à 25 % des temps de visionnage : « Certains de nos créateurs les plus connus, comme MrBeast et Mark Rober, touchent maintenant des millions de téléspectateurs supplémentaires dans de nouveaux coins du monde, […] avec une moyenne de plus de 30 langues par vidéo » (3). MrBeast accélère donc la cadence avec l’IA Gemini de Google, en test pour la synchronisation labiale. Cette innovation pour les doublages linguistiques, mise au point par Google DeepMind et Google Translate, permet sur la vidéo d’aligner visuellement les lèvres d’un orateur avec la langue doublée afin de « rendre les doublages encore plus précis, expressifs et naturels » (4). Cette fonctionnalité « lip-syncing » dans le doublage vidéo automatique (auto-dubbing) est toujours en test, mais depuis le Made On YouTube 2025 la version bêta est ouverte à plus de créateurs. En gestation depuis l’an dernier, cette technique dopée à l’IA permet de « restituer dans le doublage IA le ton et les intonations, ainsi que l’ambiance de l’environnement du créateur », avait indiqué Johanna Voolich (photo de droite), la Chief Product Officer de YouTube à Mountain View.
Jimmy Donaldson, ce jeune homme de 27 ans, est aux Etats-Unis ce que Lucas Hauchard – Squeezie et ses presque 20 millions de followers – est à la France (5). MrBeast est un boute-en-train de la vidéo virale et un « homme-sandwich » du Web, cumulant à ce jour – et au bout de plus de treize ans d’existence – près de 100 milliards de vues (96,5 milliards de vues au 03-10-25). Il a déclaré pour la première fois en février 2025 être milliardaire : « Je vaux 1 milliard de dollars ! », a-t-il confié dans un podcast (6). Jimmy Donaldson gagnerait, par mois, environ 7 millions de dollars. MrBeast est entré dans le Guinness des records en juin 2024 pour avoir atteint le plus grand nombre d’abonnés sur YouTube (7). Depuis, son record d’audience a bondi de 63,5 %. D’après le classement établi par HypeAuditor, la chaîne MrBeast est en tête sur YouTube au niveau mondial (8) – toutes catégories confondues (créateurs individuels et entités commerciales), tandis que celle de PewDiePie (9) a été reléguée à la douzième position avec 110 millions de followers.

Auto-traduction et conquête du monde
Sur la deuxième marche du podium mondial, il y a la chaîne T-Series liée à Bollywood et diffusée par la société indienne Super Cassettes Industries, et sur la troisième marche la chaîne Cocomelon, propriété de Moonbug Entertainment, société britannique spécialisée dans les contenus pour enfants. Le doublage IA va rebattre les cartes des audiences sur YouTube. @

Charles de Laubier

Economie de l’attention et éducation à l’image : le rapport aux écrans est à la fois craint et désiré

Deux rapports se télescopent : celui des ministères de la Culture et de l’Education nationale sur « l’éducation à l’image » pour les jeunes, grands utilisateurs d’écrans, et celui de la direction du Trésor à Bercy sur « l’économie de l’attention » qui alerte sur la baisse du PIB à cause des écrans.

« L’économie de l’attention à l’ère du numérique » est le titre de la publication « Trésor-Eco », publiée en septembre 2025 par la direction du Trésor, au ministère de l’Economie, des Finances et de la Souveraineté industrielle et numérique. Cette étude affirme que l’économie de l’attention pourrait faire perdre à terme à la France entre 2 et 3 points de PIB. De son côté, le rapport « Offrir à chaque élève une éducation au cinéma et à l’image de qualité », publié aussi en septembre par deux ministères (Culture et Education nationale), veut accroître la formation des jeunes à l’image, donc aux écrans. Contradictoire ?

Impact sur le produit intérieur brut
Le premier rapport a comme auteur Solal ChardonBoucaud (photo de gauche), adjoint au chef du bureau Numérique et activités tertiaires, à la direction générale du Trésor, et le second Edouard Geffray (photo de droite), conseiller d’Etat et ancien directeur général de l’enseignement scolaire. « L’économie de l’attention génèrent […] des externalités négatives importantes pour les utilisateurs et la société (par exemple perte de temps productif, impact sur les facultés cognitives ou la santé mentale). Celles-ci pourraient atteindre – selon un travail de recension de la littérature existante – entre 2 et 3 points de PIB à long terme pour la partie quantifiable de ces impacts », souligne Solal Chardon-Boucaud. Cet impact négatif des écrans, que la direction du Trésor a évalué à long terme et situé à l’horizon 2060 contre une perte de l’ordre 0,6 point de PIB à court terme, tient compte de trois facteurs que sont la détérioration des capacités cognitives, la perte de temps productif, et la dégradation de la santé mentale.
En creux, les effets négatifs futurs de l’économie de l’attention dépendent (suite) du rapport aux écrans qu’ont les enfants d’aujourd’hui. « Cet ordre de grandeur – qui doit être considéré avec prudence en raison des hypothèses sur lesquelles il repose – dépend avant tout de la détérioration des capacités cognitives des enfants, qui réduira leur productivité future lorsqu’ils seront entrés sur le marché du travail », précise le Trésor (1). L’économie de l’attention désigne l’ensemble des modèles économiques par lesquels les entreprises cherchent à valoriser l’attention des consommateurs. C’est ce que l’on appelle « la captation de l’attention des utilisateurs », qui est au cœur de la bataille entre plateformes numériques, au premier rang desquelles les Gafam. Leurs modèles économiques reposent pour une grande part sur la publicité : « Celle-ci permet de fournir gratuitement ou à tarif préférentiel certains services appréciés par les consommateurs, qui les rémunèrent indirectement en constituant une audience pour un annonceur publicitaire ». Autrement dit : si c’est gratuit, c’est vous le produit.
Mais la publicité n’est pas la seule ressource de l’économie de l’attention, les contenus payants contribuant aussi au chiffre d’affaires. Pour maximiser leurs revenus, les plateformes – moteurs de recherche, réseaux sociaux, sites d’information – sont lancées dans une course à l’attention, étant donné le nombre limité d’heures de temps d’éveil des utilisateurs, dont les capacités cognitives ne sont pas extensibles et dont l’attention ne peut être captée par deux acteurs simultanément. C’est là que la technique entre en action pour capter cette attention. « Le numérique permet aux plateformes de concevoir des interfaces maximisant particulièrement le temps passé sur leurs services, par exemple via le défilement infini [le fameux scrolling, ndlr], qui permet de présenter du contenu de manière continue à mesure que l’utilisateur fait défiler la page, explique la note « Trésor-Eco ».De même, la recommandation algorithmique de contenus permet aux plateformes de sélectionner les contenus les plus à même de maintenir l’utilisateur en ligne. Cette augmentation de ‘’l’engagement’’ des utilisateurs correspond à l’intérêt économique des plateformes »

« Adolécrans », forces vives de demain
« En effet, poursuit Solal Chardon-Boucaud, chaque seconde supplémentaire passée par un utilisateur sur la plateforme est génératrice de profits, puisque le temps passé à consommer des contenus augmente aussi le nombre de publicités présentées ». L’impact négatif de l’économie de l’attention se joue donc dès l’enfance, affirme le Trésor, même si les adultes sont d’ores et déjà concernés par la « dégradation du capital humain » due à cette captation de l’attention. Les enfants mettent-ils vraiment en danger, avec les écrans, le PIB de la France ? « De nombreuses études mettent en évidence que la forte exposition aux écrans dès le plus jeune âge, et en particulier l’utilisation des réseaux sociaux et du smartphone, a un impact particulièrement fort sur les capacités d’attention, de mémorisation et les compétences langagières des enfants », souligne Solal Chardon-Boucaud dans sa note « TrésorEco », citant un article de la chercheuse canadienne Brae Anne McArthur, spécialisée en psychologie clinique et développement de l’enfant, paru en 2022 dans la revue « Pediatric Research » (2).

Cinéma, « antidote [au] fléau » des écrans !
Autre exemple de préoccupation concernant les jeunes : « Certaines fonctionnalités liées à l’économie de l’attention comme l’autocomplétion (3) ou les recommandations automatiques de contenus, qui empêchent d’effectuer ses propres recherches et réduisent les capacités à “apprendre en essayant”, pourraient aussi être particulièrement dommageables pour les plus jeunes », citant cette fois le philosophe français Bernard Stiegler, auteur de « La Société automatique » paru en 2025 chez Fayard (4). Autrement dit, les écrans « fabriquent »- ils vraiment « du crétin digital » comme le prétend le docteur en neuroscience Michel Desmurget, dans son livre paru en 2019 aux éditions du Seuil (5), en évoquant « les dangers des écrans pour nos enfants » ? Bien sûr que non (6), n’en déplaise aux députés Delaporte et Miller qui ont publié début septembre leur rapport à charge contre TikTok (lire p. 3).
De même, Edition Multimédi@ se demande si l’économie de l’attention est vraiment potentiellement négative pour le PIB au regard d’une supposée détérioration des capacités cognitives, « lorsque toutes les cohortes d’enfants concernées seront entrées sur le marché du travail » ? Rien n’est moins sûr si l’on se réfère à l’analyse « Trésor-Eco » qui met quelques bémols à sa démonstration : « L’économie numérique de l’attention génère de la valeur ». Outre l’utilité générée par les plateformes pour les consommateurs directs et les échanges marchands, via notamment la publicité qui constitue le mode de financement principal des grandes plateformes, « certains outils développés par les acteurs de l’économie de l’attention pourraient par ailleurs générer d’importants gains de productivité, reconnaît la direction du Trésor, même si ces retombées positives sont plus difficiles à quantifier ». Dans ces conditions, faut-il que la jeune génération s’affranchisse des écrans ou bien faut-il au contraire la former pour mieux les utiliser ? Une réponse vient de l’autre étude, celle publiée par les ministères de la Culture et de l’Education nationale, où Edouard Geffray fait des « propositions pour une ambition renouvelée en matière d’éducation à l’image et en faveur du développement de “Ma classe au cinéma” » (7). L’écran y est présenté comme « un fléau » pour les jeunes : « Entre 8 et 12 ans, les jeunes passent près de 4 h 45 par jour sur les écrans, ce chiffre dépassant les 6 heures par jour entre 13 et 18 ans, et variant du simple au double selon les jours avec ou sans école. Ils passent donc, à l’échelle d’une année, plus de temps devant des écrans qui se sont individualisés […] qu’en cours ». Résultats, selon ce rapport alarmiste : les jeunes « sont ainsi bombardés d’images, de plus en plus créées ou modifiées par l’intelligence artificielle, sans être en capacité de distinguer le vrai du faux, ni a fortiori de comprendre et d’interpréter une bonne partie des contenus ».
Côté sociabilisation, « [les jeunes] se trouvent ainsi enfermés dans des bulles de contenus courts, “swipant” d’un contenu à un autre, guidés par des outils de suggestion dont ils ne maîtrisent pas les tenants et les aboutissants ». Pire, « c’est leur capacité à distinguer et apprécier les nuances et à comprendre l’implicite qui se trouve obérée, au profit d’univers explicites, exclusifs et catégoriques ». Mais le rapport apporte un remède – miracle ? – aux ministères de la Culture et de l’Education nationale : l’éducation à l’image et surtout au cinéma, comprenez aussi les salles de cinéma dont la fréquentation continue de baisser (8). « Le cinéma constitue l’exact antidote à ce fléau, affirme Edouard Geffray. Il est le seul dispositif attentionnel qui permette aux jeunes d’accéder, de manière ininterrompue et collective, à un imaginaire structuré et officiellement fictif ou documentaire. Il constitue le seul endroit où, pour reprendre l’expression de Godard, ils lèvent les yeux vers un écran au lieu de les baisser, et où l’écran est à l’origine d’une émotion collective et pas seulement d’une juxtaposition d’émotions individuelles et déconnectées les unes des autres ».
C’est en fait la salle de cinéma contre les écrans des smartphones et des tablettes : « [Le cinéma, comprenez la salle obscure, ndlr] est le vecteur d’une sociabilité réelle devant le grand écran, là où les réseaux sociaux proposent une sociabilité virtuelle via le micro-écran. Il élargit ainsi l’horizon, aussi bien physique que social ou intellectuel, qui, pour nos jeunes, se limite, plusieurs heures par jour, à un écran de 30 à 50 cm2 ».

Salles obscures contre « petits écrans »
D’ailleurs, le président du Centre national du cinéma et de l’image animé (CNC), Gaëtan Bruel (photo ci-dessus), a commenté favorablement ce rapport Geffray : « Pour travailler ce rapport aux écrans, l’éducation aux images est un levier très puissant – quand il existe –, mais seuls 15 % de nos élèves peuvent bénéficier de “Ma classe au cinéma”, principal dispositif en la matière. Faire plus et mieux est un impératif national », a-t-il posté sur LinkedIn le 7 septembre (9). A en croire ce rapport, l’éducation à l’image devrait d’abord favoriser les salles obscures. @

Charles de Laubier

Mort en direct d’un streamer vidéo en France : l’affaire « Pormanove » devient l’affaire « Kick »

Dans la torpeur de l’été, durant la nuit du 17 au 18 août, un homme est mort au bout 298 heures de direct sur Internet – après avoir subi coups et insultes. Sa chaîne « Jeanpormanove », monétisée, était la plus vue sur Kick. Cette plateforme australienne doit maintenant répondre devant la justice.

L’affaire « Pormanove », du nom du streamer vidéaste français Jean Pormanove mort en direct sur sa chaîne vidéo diffusée sur la plateforme Kick, n’a pas pu vous échapper. Elle défraie la chronique depuis cette nuit du 17 au 18 août, durant laquelle Raphaël Graven (son vrai nom) a perdu la vie, à 46 ans, après 298 heures de diffusion non-stop et après avoir subi – de façon soi-disant consentie – des humiliations, des violences, des insultes et des sévices en tout genre. Sa chaîne « Jeanpormanove » sur Kick était suivie par près de 200.000 abonnés, dont certains payants ou donateurs.

Deux parquets français poursuivent Kick
Depuis ce drame humain, la plateforme australienne Kick est, en France, dans le collimateur du gouvernement, du régulateur Arcom et de la justice. Deux parquets ont ouvert leur enquête : le parquet de Nice dès le 19 août pour « recherche des causes de la mort » et le parquet de Paris le 25 août pour « fourniture en bande organisée de plateforme en ligne illicite ». La procureure de la République Laure Beccuau (photo de gauche) a précisé que « les deux parquets sont en lien étroit afin de se communiquer réciproquement les éléments susceptibles d’éclairer l’une et l’autre procédure ».
L’entreprise Kick risque gros si elle est reconnue coupable d’avoir diffusé des contenus illicites. En cas d’infraction, le code pénal français – modifié par la loi du 13 juin 2025, réprimant pénalement la violation d’obligations issues du règlement européen DSA (Digital Services Act) – prévoit dix ans d’emprisonnement et 500.000 euros d’amende « lorsqu’elles sont commises en bande organisée » (1). L’office anticybercriminalité (Ofac) de la direction nationale de la police judiciaire (DNPJ) est saisi des investigations. Cette nouvelle enquête du parquet de Paris (2) cherchera (suite) à déterminer : si la plateforme Kick fournissait, en connaissance de cause, des services illicites, notamment par la diffusion de vidéos d’atteintes volontaires à l’intégrité de la personne ; si la plateforme Kick satisfaisait aux obligations issues du règlement européen sur les services numériques (DSA), notamment l’obligation de signaler aux autorités les risques d’atteintes à la vie ou à la sécurité des personnes. Le paquet de Nice a, quant à lui, confié les investigations à la police judiciaire de Nice, laquelle avait déjà été saisie en décembre 2024 d’une enquête pour « violences volontaires en réunion sur personnes vulnérables […] et diffusion d’enregistrement d’images relatives à la commission d’infractions d’atteintes volontaires à l’intégrité de la personne ». Et ce, après un article de Mediapart révélant l’existence de ces diffusions vidéo problématiques : « Sur la plateforme Kick, des streameurs français multiplient les humiliations physiques et psychologiques en direct tous les soirs, pour obtenir les dons des spectateurs » (3).
La ministre déléguée chargée du Numérique, Clara Chappaz (photo de droite), était au courant des dérapages de Kick au moins huit mois avant le décès de « JP » (le surnom lié au pseudo de Raphaël Graven), soit à partir des révélations de Mediapart (4) et de l’enquête judiciaire initiée à Nice. « Jean Pormanove a été humilié et maltraité pendant des mois en direct sur la plateforme Kick, s’est émue publiquement Clara Chappaz, le lendemain du drame. Le décès de Jean Pormanove et les violences qu’il a subies sont une horreur absolue » (5). Clara Chappaz, décidée à « remettre de l’ordre dans le Far West numérique », a annoncé le 19 août saisir l’Arcom (6) et procéder à un signalement sur Pharos, la plateforme de signalement de contenus illicites sur Internet, qui dépend du ministère de l’Intérieur.
On apprendra plus tard, le 26 août (7), que Pharos avait déjà été alerté 80 fois à propos de la chaîne « Jeanpormanove » sur Kick. La ministre a indiqué ce jour-là que l’Etat saisira la justice sur le fondement de la loi « Confiance dans l’économie numérique » (8). Réplique de la société Kick le 28 août : « Nous restons impliqués dans la coopération avec les autorités [françaises] et nous sommes déçus d’avoir appris dans la presse la procédure lancée par la ministre, ce qui suggère qu’il ne s’agit pas de sécurité des créateurs ou des consommateurs, ou du bien-être de l’industrie, mais d’une argumentation politicienne qui cherche à tirer parti d’une perte tragique. Nous espérons qu’il sera possible de travailler sereinement avec les autorités françaises et de corriger les fausses informations qui circulent ».

L’Arcom et la MCA se concertent
Jusqu’au 22 août, la société australienne Kick Streaming Pty Ltd n’avait pas encore nommé de représentant légal dans l’Union européenne, où elle est basée à Malte, conformément au DSA (9). L’Arcom et le régulateur maltais MCA se concertent depuis le 20 août (10). Les cofondateurs de Kick, l’Australien Ed Craven et l’Américain Bijan Tehrani devenus milliardaires grâce surtout au casino en ligne Stake, n’auraient pas imaginé pire publicité. @

Charles de Laubier

La bataille des IA génératives d’images et de vidéos s’exacerbe, avec les Etats-Unis en force

Après deux ans de bataille des IA génératives textuelles, déclenchée fin novembre 2022 par ChatGPT d’OpenAI, l’année 2025 s’annonce comme celle des IA génératives d’images et de vidéos. Edition Multimédi@ passe en revue une sélection de concurrents, tous d’origine américaine. Mais les chinois sont en embuscades.


Grok
Pays d’origine : Etats-Unis
Propriétaire : xAI (Elon Musk)
Lancement : novembre 2023
Générateur de textes et d’images
https://x.ai/grok, https://x.com/i/grok
Disponibilité : gratuit depuis le 14-12-24
Accessible en France : oui
Remarque : Grok est développé par la start-up xAI créé en juillet 2023 par le milliardaire Elon Musk (cofondateur d’OpenAI qu’il a quitté en 2018). En plus de générer du texte, Grok peut aussi faire de même en créant des images réalistes grâce à son modèle text-to-image Aurora.


Sora
Pays d’origine : Etats-Unis
Propriétaire : OpenAI (Sam Altman)
Lancement : février 2024
Générateur de vidéo ultraréalistes
https://openai.com/sora, https://sora.com
Disponibilité : payant dans ChatGPT Plus et Pro
Accessible en France : non
Remarque : Sora est un modèle de type text-to-video développé par OpenAI, déjà à l’origine de ChatGPT, lequel intègre Sora depuis début décembre 2024 via les abonnements payants ChatGPT Plus et ChatGPT Pro. Sora signifie en japonais « ciel » (potentiel illimité). (suite)


Dall-E
Pays d’origine : Etats-Unis
Propriétaire : OpenAI (Sam Altman)
Lancement : janvier 2021
Générateur d’images
https://openai.com/index/dall-e-3, https://chatgpt.com
Disponibilité : gratuit (limité) et payant (au-delà)
Accessible en France : oui
Remarque : Dall-E est le pionnier du text-to-image grand public, développé par OpenAI (ChatGPT). Sa version actuelle, Dall-E 3, est disponible depuis septembre 2023, intégrée depuis dans ChatGPT via les abonnements payants ChatGPT Plus et Enterprise.


Gen (Gen-2, Gen-3)
Pays d’origine : Etats-Unis
Propriétaire : Runway AI
Lancement : février 2023
Générateur de vidéos
https://runwayml.com, https://app.runwayml.com
Disponibilité : gratuit (limité) et payant (au-delà)
Accessible en France : oui
Remarque : La start-up newyorkaise Runway AI a été créée en 2018 par les Chiliens Cristóbal Valenzuela et Alejandro Matamala, ainsi que par le Grec Anastasis Germanidis. Ses modèles sont de type text-to-video et video-to-video, utilisés notamment par des producteurs de films.


Firefly
Pays d’origine : Etats-Unis
Propriétaire : Adobe
Lancement : mars 2023
Générateur d’images, de vidéos et d’audio
https://firefly.adobe.com
Disponibilité : gratuit (limité, sur inscription) ou payant (entreprises)
Accessible en France : oui
Remarque : Abobe, éditeur des logiciels de création Photoshop, Acrobat, Illustrator et Premiere Pro, a lancé la première version de Firefly en mars 2023. Le modèle text-to-video a été lancé en octobre 2024 en version bêtapublique limitée (sur inscription en liste d’attente).


Midjourney
Pays d’origine : Etats-Unis
Propriétaire : Midjourney
Lancement : juillet 2022
Générateur d’images
https://www.midjourney.com/explore
Disponibilité : payant (abonnements)
Accessible en France : oui
Remarque : La start-up californienne Midjourney a été créée par David Holz. La version actuelle, la V6.1, a été lancée fin juillet 2024. Le mois suivant, elle a été rendue accessible à partir du Web et non plus seulement à partir de Discord comme auparavant.

Se sont aussi jetés dans la bataille du text-to-image et du texte-to-video : le chinois ByteDance (maison mère de TikTok) avec X-Portrait 2 et MagicVideoV2 ; le chinois Faceu Technology (filiale de ByteDance) avec Jimeng AI ; le chinois Kuaishou Technology avec Kling ; le chinois Zhipu AI avec Ying ; le chinois Shengshu Technology avec Vidu ; l’américain Google (Alphabet) avec Lumiere ; son compatriote Meta avec Make-A-Video et Movie Gen ; le français Turbo Studio avec Submagic ; la britannique Synthesia avec Synthesia ; la californienne World Labs avec « GenAI 3D » (lire EM@334, p. 5).