La Ligue de football professionnel (LFP) court-circuite les Canal+, BeIn Sports et autres DAZN

La filiale LFP Media, dirigée par Nicolas de Tavernost, lance sa propre chaîne Ligue 1+ pour y diffuser les matchs de la saison 2025-2026, qui commence le 15 août 2025. Et ce, au nez et à la barbe des diffuseurs sportifs traditionnels. BeIn et DAZN ne sont plus que distributeurs, en attendant Canal+.

C’est une première historique. Après l’avoir annoncée le 1er juillet par un communiqué puis présentée avec ses trois tarifs le 10 juillet lors d’une conférence de presse, la plateforme TV digitale de la Ligue de football professionnel (LFP) diffusera ses premiers matchs à partir du 15 août 2025. Baptisée « Ligue 1+ », cette « chaîne » numérique est gérée et opérée par la filiale LFP Media (alias LFP 1), dont le directeur général depuis avril (1) est l’ancien PDG du groupe M6, Nicolas de Tavernost (photo de gauche), par ailleurs vice-président de CMA Médias, branche médias du groupe CMA CGM (Rodolphe Saadé).

9 matchs en fin de semaine sur LFP 1+
Les championnats français de football ont donc désormais leur propre « chaîne de télévision ». Du jamais vu. « C’est la première fois qu’une ligue de football crée et exploite sa propre chaîne, concurrençant ainsi directement les diffuseurs sportifs traditionnels (Canal+, BeIn, WBD). Cela pourrait expliquer pourquoi Canal+ a refusé d’y participer », analyse Thierry Fautier, cofondateur et directeur général de The Media League, agence conseil des entreprises de médias et de divertissement, dans un post publié sur LinkedIn le 2 juillet. « En court-circuitant les diffuseurs sportifs traditionnels comme Canal+ et beIN Sports, la LFP poursuit une stratégie audacieuse centrée sur sa propre distribution, complétée par des opérateurs IPTV [Orange, Bouygues Telecom, Free et SFR, ndlr] ou des réseaux sportifs alternatifs comme WBD (Eurosport) et BeIn, qui, pour la première fois de leur histoire, distribueront des contenus qu’ils n’ont pas produits », poursuit cet expert en streaming vidéo et haute définition, vétéran de la Silicon Valley. Selon lui, (suite) la plateforme Ligue 1+ – diffusée aussi en OTT (directement sur Internet) – aurait besoin d’attirer environ 2 millions d’abonnés pour égaler le chiffre d’affaires de 400 millions d’euros provenant du précédent accord avec DAZN – prononcez « Da Zone » (2). « Cet objectif de 2 millions d’abonnés reflète la moyenne des modèles modérés et optimistes, et peut être considéré comme une prévision réalistement optimiste », estime-t-il (3).
À la suite d’un différend entre LFP Media et DAZN, porté devant le tribunal des activités économiques de Paris, une médiation judiciaire a permis d’aboutir début mai à un accord (4), permettant au premier de résilier le contrat initialement prévu jusqu’en 2029 (après une seule saison), en récupérant la pleine maîtrise de ses droits, et au second – alors qu’il avait cessé de payer estimant les résultats décevantes – de solder ses comptes avec le premier, et en se contentant de distribuer Ligue 1+. Ce divorce partiel a permis à Vincent Labrune (photo de droite), président de la LFP, de créer cette plateforme TV et digitale de la LFP, proposée selon trois tarifs : 14,99 euros par mois pour un engagement sur toute la saison 2025-2026, 19,99 euros sans engagement, et 9,99 euros pour les moins de 26 ans (5).
Cependant, à ce prix-là, la chaîne de LFP Media (6) n’aura pas tous les matchs de la « Ligue 1 McDonald’s » car BeIn (7) Sports conserve les droits de diffusion d’une rencontre le samedi jusqu’à la fin de la saison en 2026. « BeIn apporte en contrepartie 80 millions d’euros en cash à la Ligue 1, soit l’équivalent de 400.000 abonnés, pour un match », avait indiqué le 10 juin sur RMC Nicolas de Tavernost, qui fut propriétaire des Girondins de Bordeaux entre 1999 et 2018 via M6. « Mon ambition est de collaborer étroitement avec l’ensemble des clubs professionnels français et CVC [le fonds d’investissement britannique CVC Capital Partners, cofondateur de LFP Media, dont il détient 13 % du capital depuis 2022 (8), ndlr]. Ensemble, nous travaillerons au développement et à la réussite des championnats français », a-t-il assuré lors de sa nomination à la tête de LFP Media. Et d’ajouter alors : « En termes d’abonnés, si on fait moins de 1 million d’abonnés la première année, c’est qu’on aura échoué. […] On estime que les fans de foot prêts à s’abonner à un service de foot payant sont de l’ordre de 3,5 millions en France » (9). Au journal L’Equipe le 1er juillet (10), Nicolas de Tavernost a indiqué que le budget de « la chaîne 100 % Ligue 1 »serait compris « entre 65 et 70 millions d’euros par saison » (production, diffusion, personnel et marketing compris).

« Deux années difficiles » attendues
Le directeur général de LFP Media vise « 1 million d’abonnés la première année ». D’après une hypothèse de Philippe Bailly, du cabinet NPA Conseil, « la chaîne générerait près de 110 millions d’euros de chiffre d’affaires avec 1 million d’abonnés, et dégagerait alors [comme marge] un peu plus de 40 millions d’euros » (11). Le lendemain, dans Le Parisien, Nicolas de Tavernost a prévenu : « Il y aura certainement deux années difficiles […] ». Et il espère à terme le retour de Canal+ qui, selon lui, ne peut pas « se passe[r] de la L1 durablement »… @

Charles de Laubier

Le groupe « LVMH Médias » se retire face à Meta

En fait. Le 12 mai, Edition Multimédi@ a appris que le groupe Les Echos-Le Parisien venait de se retirer de la plainte de 67 éditeurs français, déposée le 22 avril devant le tribunal économique de Paris, contre le géant Meta (Facebook, Instagram, …) accusé de pratiques illégales dans la publicité en ligne.

En clair. « Les Echos se sont retirés de la plainte des médias français qu’ils avaient largement contribué à monter contre Meta », a fait savoir le 12 mai dans un post sur LinkedIn Eric Scherer, directeur du MediaLab de l’information et des affaires internationales de France Télévisions. Le groupe de télévision publique fait partie des 67 éditeurs de 200 médias français qui ont porté plainte le 22 avril – devant le tribunal des activités économiques de Paris (ex-tribunal de commerce) – contre les « pratiques illégales » dans la publicité en ligne de Meta Platforms (1), la maison mère de Facebook, Instagram et de WhatsApp. Parmi les plaignants, il y a aussi Radio France, TF1, Le Figaro, RMC BFM, Lagardère (Europe 1, Paris Match, Le JDD), Libération, Ouest France, Centre France, La Voix du Nord, La Dépêche, ou encore Marianne.
Le groupe Les Echos-Le Parisien, dirigé par Pierre Louette, était de la partie et même moteur dans cette action judicaire contre la firme de Mark Zuckerberg. Mais la filiale média de LVMH a donc renoncé en se désolidarisant de ce front commun. Pourquoi ? Eric Scherer avance « un indice » (2) qui n’est autre qu’un (suite)

post vidéo du quotidien Le Figaro publié le 7 mai sur X (ex-Twitter) : « Le président américain [Donald Trump] a qualifié le PDG de LVMH [Bernard Arnault] et son fils Alexandre, qui l’accompagnait, de “très bons amis” » (3).
En creux, l’homme le plus riche de France et 6e fortune mondiale (4) – et ex-1ère mondiale – n’aurait pas voulu froisser son « ami » – de longue date – à la Maison-Blanche, où il a été reçu le 6 mai dans le Bureau ovale avec son fils aîné Alexandre. « Bernard, c’est un honneur de vous avoir ici ; nous allons avoir une réunion après ceci », lui avait lancé Donald Trump.
De là à ce que le président des Etats-Unis – à l’investiture duquel Bernard Arnault a aussi assisté le 20 janvier – lui ait demandé de retirer sa plainte contre son autre nouvel ami Mark Zuckerberg… Ce n’est pas la première fois que le groupe Les Echos-Le Parisien renonce à poursuivre en justice une Big Tech américaine : ce fut le cas contre X détenu par Elon Musk, un autre ami du locataire de la Maison-Blanche. « LVMH Médias » s’est là aussi désolidarisé, a rapporté Reuters en février (5), de l’action judiciaire intenté par plusieurs médias français qui accusent l’ex-Twitter de ne pas les rémunérer au titre des droits voisins. @

Copies de la presse et du livre : le numérique pousse le CFC à faire une « transition » jusqu’à l’été

Les rediffusions d’articles de presse et de contenus de livres augmentent, portées par les panoramas de presse numériques : le Centre français d’exploitation du droit de copie (CFC), mandaté par le ministère de la Culture, a collecté 67,9 millions d’euros en 2024, en hausse de près de 5 %.

Unique société de gestion collective agréée par le ministère de la Culture pour collecter les redevances dues lors des reproductions des contenus de la presse, du livre et des sites web, le Centre français d’exploitation du droit de copie (CFC) n’a cessé depuis vingt ans de voir les droits collectés croître pour le compte des éditeurs, journalistes et auteurs. L’année 2024 a été marquée à nouveau par un record des redevances perçues, à 67,9 millions d’euros, soit une hausse de 4,8 % sur un an.

Un « directeur de la transition » jusqu’à l’été
A ce rythme, selon les calculs de Edition Multimédi@, les 100 millions seront atteints en 2032. Si le secteur de l’enseignement et de la formation est encore très papivore de journaux et livres imprimés, ce n’est pas le cas des entreprises privées et publiques qui ont pour la plupart basculé dans les contenus numériques. Mais le papier continue de perdre du terrain. Or cette digitalisation de la copie à rythme soutenu depuis une vingtaine d’années a métamorphosé le CFC, créé en 1983 et agréé par le ministère de la Culture, ainsi qu’audité par la commission de contrôle des organismes de gestion des droits d’auteur et des droits voisins (CCOGDA), rattachée à la Cour des comptes. La veille informationnelle (panorama de presse, veille web, agrégateurs de flux, …) s’est démultipliée et complexifiée (1). « Après trois ans d’implication stratégique et opérationnelle pour transformer [le CFC] », la directrice générale et gérante Laura Boulet a quitté son poste en février « en accord avec le conseil d’administration » présidé par Guillaume Montégudet (photo ci-dessous). (suite)

« Face aux défis que représentent les nouvelles exploitations des contenus, notamment numériques, il est essentiel de garantir aux utilisateurs des conditions d’usage toujours respectueuses des valeurs fondamentales des droits des auteurs et des éditeurs, de la presse et du livre », a déclaré ce dernier au moment d’annoncer en janvier l’embauche de Laurent Maille (photo ci-dessus) comme « directeur général de transition ». Ce gestionnaire de la réorganisation et de la transformation d’entreprise a été missionné « jusqu’à l’été ». Et ce, « avec toutes les équipes du CFC » et « au service de la juste valorisation des contenus ». Dans son dernier rapport publié à l’été 2024, la commission de la Cour des comptes a pointé « la progression des charges de gestion du CFC (+17 % sur la période), plus rapide que celle des perceptions », en raison principalement de « l’augmentation des charges de personnel » (indemnités de départ, hausse de 10 % des effectifs, …). La CCOGDA a aussi invité le CFC à résorber « l’écart entre les droits affectés et ceux effectivement versés aux ayants droit » et à réduire « le montant des crédits d’action artistique et culturelle non utilisés » (2). En plus de la numérisation galopante, cet organisme privé de gestion collective s’est en outre vu confié les activités B2B (crawlers et services de veille média) de la Société des droits voisins de la presse (DVP), laquelle a été créée en octobre 2021 pour collecter auprès des plateformes numériques et les réseaux sociaux les droits voisins (3) pour le compte de ses éditeurs et agences de presse membres (320 éditeurs et agences de presse publiant 730 publications).
Au sein du CFC, la « commission répartition » entre auteurs et éditeurs des sommes perçues est composée par trois collèges : le collège des auteurs et des sociétés d’auteurs, le collège des éditeurs de presse, et le collège des éditeurs de livres. Un appel à candidatures est ouvert jusqu’au 4 avril 2025 (4) pour le renouvellement d’une partie des membres (élus pour une durée de deux ans), en vue de la prochaine assemblée générale du CFC le 26 juin 2025. Quoi qu’il en soit, la collecte pour le droit de copie bat à nouveau des records annuels depuis l’année covid 2020.

Quatre sources principales de redevances
Le CFC distingue quatre sources principales de redevances, copies « papier » et « numérique » confondues, en France : le secteur de l’enseignement et de la formation (40 % de la collecte en 2024) ; le secteur des entreprises privées et publiques (34 %) ; le secteur des sociétés et plateformes en ligne de veille d’information (7,6 %) ; enfin, la part copie privée numérique de la presse versée initialement à l’organisme Copie France (4,3 %). Le reste vient d’autres pays, puisque sur le total des 67,9 millions d’euros collectés en 2024, un peu plus de 4,1 millions – soit environ 6 % du total – proviennent de l’étranger.
L’enseignement et la formation constituent donc le premier secteur pourvoyeur de fonds de la collecte globale du CFC, pour un montant l’an dernier en France de 32,6 millions d’euros, en hausse de 7 %. « Cette croissance provient, d’une part, d’une renégociation des protocoles d’accord signés avec le ministère de l’Education nationale et de l’Enseignement supérieur et, d’autre part, d’une nouvelle licence, destinée aux établissements hors tutelle du ministère et aux organismes de formation, qui autorise à la fois les rediffusions papier et numériques du livre et de la presse », explique le CFC. Ainsi, ce sont 62.000 établissements d’enseignement et de formation, dont 2.000 établissements ayant signé cette nouvelle licence depuis sa mise en œuvre fin 2022 (660 de plus en 2024), qui paient leurs redevances au titre du droit d’auteur lorsqu’ils font des copies et/ou de la rediffusion d’articles de presse et d’extraits de livres, que cela soit au format papier ou numérique.

L’Education encore très papivore
Bien que la collecte « pédagogique » numérique augmente bien plus vite (+ 18 %) que les copies papier (+ 5 %), il n’en reste pas moins que la collecte pour la photocopie (la « reprographie ») par ces établissements est encore très largement majoritairement sous forme papier (85,3 % des 32,6 millions d’euros). « Ces autorisations couvrent tous les supports de cours ou de formation qui intègrent des extraits de livres et des articles de presse et qui sont diffusés aux apprenants (élèves, étudiants, stagiaires) sous forme de photocopies, sur leurs espaces numériques de travail ou par mail, en vidéo projection ou lors de visioconférences », précise le CFC. Pour autant, l’enseignement et la formation restent encore très papivores.
Les entreprises privées et publiques ont versé, elles, 23,1 millions d’euros en 2024, collecte en progression de 7 %. Cette hausse provient à la fois d’une revalorisation de la redevance due au titre de la licence dite « CIPro » (copies internes professionnelles) et de la signature de 540 licences d’autorisation. Dans ce secteur, le CFC propose quatre grandes catégories de licences, lesquelles autorisent toutes les rediffusions de contenus par les entreprises et les administrations : les copies internes professionnelles (presse et livre) ; les panoramas de presse (ou « press clipping ») ; les mises en ligne d’articles de presse sur les réseaux sociaux et sur les sites web des organisations ; les diffusions de copies d’articles de presse à des contacts professionnels externes ciblés (clients, adhérents, prospects, …). « La licence CIPro (copies internes professionnelles) autorise les personnels à effectuer des rediffusions numériques de presse et des copies papier de presse et de livres de façon ponctuelle et non structurée (hors panoramas de presse). Cette licence représente 60 % du nombre total d’autorisations signées avec les entreprises et 30 % des perceptions dans ce secteur (hors sociétés et plateformes de veille d’information) », explique le CFC. Les rediffusions effectuées par le secteur professionnel sont essentiellement numériques (95 % des 23,1 millions d’euros).
Les sociétés et plateformes de veille d’information contribue au droit de copie à hauteur de 5,2 millions d’euros en 2024, soit une hausse de 3 %, la plus faible de tous les secteurs. Au total, 37 sociétés et plateformes de veille d’information et 316 sociétés de relations presse ont signé des licences avec le CFC. L’augmentation des sommes « veille d’information » perçues l’an dernier concerne essentiellement la veille web pour laquelle les perceptions ont été multipliées par deux : + 96,5 %, 786.000 euros. Mais cette web veille est encore minoritaire (15,4 % des 5,2 millions d’euros), par rapport à la veille d’information (84,6 %). « Les licences destinées aux professionnels de la veille d’information autorisent trois types de prestations : la veille média « classique » (sélection et reproduction d’articles de presse et leur diffusion à des entreprises clientes, notamment sous la forme de panorama de presse) ; la veille web (crawling des sites de presse en ligne et mise à disposition de la veille à des entreprises clientes, sous forme de liens permettant d’accéder aux sites web des éditeurs) ; la veille audiovisuelle (sélection et reproduction d’extraits de programmes audiovisuels et radiophoniques et leur mise à disposition à des entreprises clientes) », détaille le CFC. Quant aux sociétés de relations presse qui effectuent une veille média pour leurs clients, parallèlement à leur activité principale, elles disposent d’une licence spécifique qui les autorise à réaliser et à diffuser des panoramas de presse ou des copies ponctuelles de presse à ces entreprises.
La copie privée numérique de la presse d’information a rapporté, elle, 2,9 millions d’euros en 2024, soit une hausse de 13 %. Cette somme provient de la taxe « copie privée », officiellement « rémunération pour copie privée », qui est présentée comme la « contrepartie » du droit de tout un chacun à la copie privée dans le cercle familial, qui relève d’une exception au droit d’auteur : c’est-à-dire de la légalité de faire des copies de fichiers numériques de toutes sortes pour un usage personnel : musiques, films, séries, livres numériques, photos ou encore documentaires. Cette taxe est prélevée directement auprès du grand public lorsqu’il achète un appareil électronique neuf doté d’une capacité de stockage numérique : smartphone, disque dur externe, clé USB, « box », … Les 2,9 millions d’euros perçus par le CFC sont une toute petite partie des près de 300 millions d’euros par an que collecte la société privée Copie France (5).

Le CFC, 5e mondial dans sa catégorie
Sur 115 organismes de gestion collective qui gèrent à travers le monde les droits d’auteur de la presse et du livre au titre des copies, reproductions et rediffusions de leurs contenus dans le pays concerné, soit 1,6 milliard d’euros perçus au total en 2023, le CFC se classe en cinquième position (6). Et ce, après le Copy Clearance Center (CCC) des Etats-Unis (450 millions d’euros), le WG Wort en Allemagne (160 millions d’euros) et le Copyright Licensing Agency (CLA) en GrandeBretagne (100 millions d’euros). @

Charles de Laubier

Le New York Times, ce n’est plus seulement l’actu

En fait. Le 5 février, le groupe coté New York Times a présenté ses résultats annuels : 2,6 milliards de dollars de chiffre d’affaires (+ 6,6 % sur un an), pour un bénéfice net de 293,8 millions de dollars (+ 26,2 %). Mais fait significatif : près d’un tiers de ses 10,8 millions d’abonnés numériques ne le sont pas à l’actualité !

En clair. La presse, c’est de moins en moins de l’actualité. Le New York Times le confirme de plus en plus : près d’un tiers (32 %) de ses 10,8 millions d’abonnés numériques n’ont pas accès à l’actualité qui est pourtant le cœur d’un quotidien. Ces abonnés « sans news », actuellement un peu plus de 3,4 millions, le sont uniquement sur d’autres offres que le journal d’actualités lui-même, telles que : « Wirecutter » (critiques de produits, conseils d’achat et offres exclusives), des jeux (mots croisés, jeux de mots, sudoku), « Cooking » (recettes de cuisines, de conseils de chefs ou cheffes), des contenus audio (podcasts, récits, The Daily), et « The Athletic » (sports, scores, retransmissions). Sans parler du shopping (1).
Le cap symbolique du tiers des abonnés numériques du « NYT » sans news devrait être franchi au cours de ce premier trimestre 2025, en raison d’une croissance trimestrielle oscillant de 4,4 % à 8,4 % depuis un an. Ces « sans news » progressent même fortement puisque cela représente un bond de 26 % entre 2023 et 2024. Loin d’être un épiphénomène, c’est une tendance lourde de signification pour les journaux, d’autant que (suite)

dans le même temps le New York Time observe une chute de ses abonnés à l’actualité seule : ces « news only » numériques sont passés sous la barre des 2 millions d’abonnés, à 1,9 million, ce qui représente une chute proche de 30 % (29,6 %) sur un an, dont un recul de 8,5 % au quatrième trimestre 2024. Les abonnés au papier (print), eux, ne sont plus que 610.000 lecteurs.
Le New York Time mise sur sa stratégie de « bundle » et d’offre « multi-produits » à prix avantageux pour attirer des abonnés intéressés à la fois par les news du journal mais aussi pas ses produits et offres annexes. C’est là que le « Times » compte le plus d’abonnés et sa meilleure croissance annuelle : plus de 5,4 millions d’abonnés « bundle ou multi-produits » (2), en hausse de 29 % sur un an. C’est une stratégie gagnante car le New York Times, qui, à l’instar des opérateurs télécoms, surveille son ARPU (3) comme le lait sur le feu : ce revenu moyen par « utilisateur » (plus seulement lecteur) est le plus élevé pour les abonnés numériques « bundlelisés » : 12,53 dollars sur le dernier trimestre de 2024, soit une hausse de 3,3 % sur un an. Par ailleurs, concernant l’IA, le New York Times est en procès (4) contre OpenAI et Microsoft. @

L’enjeu de la base légale et de l’information dans la conformité au RGPD des fournisseurs d’IA

Depuis peu, les fournisseurs de systèmes d’intelligence artificielle (IA) font l’objet d’une attention accrue de la part des autorités de contrôle européennes, lesquelles analysent leur conformité au règlement sur la protection des données (RGPD), de l’information des personnes à la base légale.

Par Sandra Tubert, avocate associée et Alicia Forgues, docteure en droit, Algo Avocats

Après avoir sanctionné OpenAI en décembre 2024 pour ses manquements au RGPD en lien avec son IA générative ChatGPT (1), l’autorité italienne de protection des données – la GPDP (2) – vient cette fois d’ordonner, le 30 janvier dernier (3), le blocage immédiat de l’application et du site web DeepSeek en Italie en raison de manquements présumés au RGPD. Avant d’ordonner la limitation du traitement, la GPDP avait adressé le 28 janvier une demande d’informations à DeepSeek, afin qu’elle précise les données traitées, les finalités poursuivies, leurs bases légales, le lieu de stockage, ainsi que la typologie de données utilisées pour entraîner les modèles d’IA, leurs sources et les modalités d’information des personnes (4).

Modèles d’IA, systèmes d’IA et données
D’autres « Cnil » européennes ont ouvert des enquêtes. Si le recours à l’IA n’impacte pas véritablement les réponses à apporter à certaines de ces questions, les bases légales de traitement et modalités d’information des personnes posent plus de difficultés lorsqu’il s’agit des traitements mis en œuvre dans le cadre de l’entraînement des modèles d’IA. En effet, ces derniers sont entraînés à l’aide d’un grand nombre de données, parmi lesquelles figurent parfois des données personnelles. Celles-ci se divisent en deux catégories : les données fournies directement par des personnes concernées ou les utilisateurs du système d’IA intégrant le modèle d’IA, auxquelles se rajoutent les données collectées durant l’utilisation du service (données first-party) et les données de non-utilisateurs collectées par web scraping ou grâce à la signature de contrats de licences d’utilisation de contenus (données third-party).
Lorsque le fournisseur se contente d’utiliser des données first-party pour entraîner ses modèles d’IA, le contact direct dont il dispose avec les personnes concernées par le traitement lui permet de les informer de manière classique, notamment via une politique de confidentialité – à laquelle il sera renvoyé depuis un formulaire de collecte ou un courriel – qui devra être précise et claire sur les finalités d’entraînement des modèles (notamment en distinguant l’information portant sur l’entraînement des modèles des autres traitements). A l’inverse, s’il utilise également (suite)

des données third-party, le fournisseur fait face à une difficulté, celle d’identifier un moyen approprié pour informer les personnes concernées de l’utilisation de leurs données à des fins d’entraînement des modèles d’IA. Sur ce point, la décision de sanction de 15 millions d’euros rendue en Italie par la GPDP à l’encontre d’OpenAI contient quelques enseignements. Elle y rappelle qu’elle avait, en avril 2023, ordonné à OpenAI un certain nombre de mesures pour se conformer à l’obligation d’information du RGPD. Selon la GPDP, OpenAI devait non seulement publier une mention d’information sur son site Internet explicitant clairement les finalités d’entraînement des modèles, mais aussi mettre à disposition des personnes un outil permettant d’exercer leurs droits (notamment d’opposition). Le fournisseur de ChatGPT devait également et surtout mener une campagne non promotionnelle à la radio, dans les journaux et à la télévision, dont le contenu aurait dû être validé par l’autorité. Objectif : que les utilisateurs et non-utilisateurs soient clairement sensibilisés à l’utilisation de leurs données à des fins d’entraînement des modèles d’IA et aux droits dont ils disposent, afin qu’ils puissent pleinement les exercer. Cette dernière modalité d’information demandée questionne sur les motivations entourant cette mesure (volume de personnes et de données concernées ? méconnaissance de ces traitements par le grand public en 2023 ?). En effet, cette mesure semble difficilement transposable à l’ensemble des acteurs entraînant des modèles d’IA.
En France, la Commission nationale de l’informatique et des libertés (Cnil) propose dans ses fiches IA (5) d’autres pistes pour informer les personnes. Première suggestion : s’appuyer sur le diffuseur des données (celui qui les a collectées initialement auprès des personnes) pour fournir une information complète, étant précisé que la seule mention d’une ré-exploitation par des tiers est insuffisante et qu’il convient, au contraire, d’indiquer que les données seront utilisées afin de développer un système d’IA et d’en désigner nommément le fournisseur.

Exception à l’information individuelle
Deuxième suggestion de la Cnil : rendre les informations disponibles publiquement sur un site web ou panneau d’affichage, sans procéder à une information individuelle, en s’appuyant sur l’exception prévue par le RGPD (à savoir l’information individuelle se révèlerait impossible ou exigerait des efforts disproportionnés (6)). Sur ce point, il conviendra alors de documenter le caractère disproportionné, suite à une mise en balance entre les efforts exigés – comme l’absence de coordonnées des personnes, le nombre de personnes concernées, les coûts de communication – et l’atteinte portée à la vie privée des personnes, notamment le caractère intrusif du traitement. La Cnil précise que l’information générale devra alors indiquer les sources précises utilisées pour constituer la base de données d’entraînement (ou a minima les catégories de sources lorsqu’elles sont trop nombreuses) ainsi que les moyens pour contacter le diffuseur auprès duquel les données ont été récupérées (7).

Intérêt légitime et ses limites : incertitude
Au-delà de l’information, l’entraînement des modèles d’IA questionne sur l’identification de la base légale parmi les six options inscrites dans le RGPD (8). Dans sa décision à l’encontre d’OpenAI, la GPDP a relevé un manquement sur ce point, lui reprochant une réflexion insuffisante sur le sujet, matérialisée par le fait qu’au cours de la procédure, la société a évoqué à la fois l’intérêt légitime et l’exécution du contrat comme base légale de son traitement d’entraînement des modèles d’IA. La GPDP rappelle ainsi aux fournisseurs de systèmes d’IA leur obligation d’identifier la base légale du traitement en amont de la mise en œuvre de ces traitements et de documenter leur analyse si l’intérêt légitime est retenu. Malheureusement, elle n’explore pas plus en profondeur la légitimité de fonder de tels traitements sur l’intérêt légitime ou ses limites, laissant les fournisseurs dans l’incertitude. Or, l’intérêt légitime est la base légale vers laquelle se tournent majoritairement les fournisseurs de système d’IA.
Ceci s’explique principalement par les cas restreints dans lesquels il est possible de fonder les traitements d’entraînement des modèles sur le consentement ou l’exécution du contrat. Cette dernière est souvent rapidement exclue, puisqu’une interprétation stricte en est retenue par les autorités et la CJUE et qu’elle ne peut être utilisée qu’en présence d’un contrat entre le fournisseur du système d’IA et les personnes concernées, pour des traitements objectivement indispensables à l’exécution des obligations prévues par ce contrat. Le consentement peut, quant à lui, être mobilisé par les fournisseurs utilisant des données firstparty, mais n’est pas véritablement disponible pour ceux qui entraînent leurs modèles d’IA avec des données third-party. Dès lors, le recours à l’intérêt légitime pour entraîner des modèles se généralise, même si cette démarche est critiquée, notamment par l’association Noyb (9).
Face à cette incertitude, l’autorité irlandaise (DPC) a émis une demande d’avis auprès du Comité européen de la protection des données (EDPB) en septembre 2024. La DPC souhaitait obtenir des renseignements sur la façon dont un responsable du traitement peut démontrer le bien-fondé de l’intérêt légitime en tant que base légale de traitement pour le développement de modèles d’IA (10). En réponse, l’EDPB a adopté en décembre dernier un avis (11), assez théorique (sans éclaircissements inédits), dans lequel il rappelle et présente les grandes notions et critères à prendre en compte en lien avec les trois conditions cumulatives pour documenter le fait qu’un traitement puisse être fondé sur l’intérêt légitime. L’EDPB y propose néanmoins quelques exemples de mesures souhaitables pour atténuer les risques identifiés lors de la balance des intérêts (pseudonymisation des données d’entraînement, masquage des données personnelles ou leur substitution par des données synthétiques, mise en place d’un délai entre la constitution de la base et l’entrainement des modèles pour permettre l’exercice des droits, …). Pour les données collectées par web scraping, l’EDPB propose des mesures spécifiques (exclure certaines catégories de données ou certaines sources, créer des listes d’opposition gérées par le fournisseur de systèmes d’IA, …). La DPC a salué l’avis rendu, de même que la Cnil, dont les travaux préexistants sur le sujet (qui apportent un éclairage complémentaire et plus concret) ne sont pas contredits (12). En dépit des recommandations figurant dans ces avis, les difficultés liées au recours à l’intérêt légitime dans un contexte d’entraînement des modèles d’IA sont mises en lumière par l’avertissement rendu par la GPDP, le 27 novembre 2024, à l’encontre de l’éditeur de presse Gedi (13). Celui-ci avait conclu un contrat avec OpenAI relatif à la communication d’archives de journaux pour permettre à ce dernier d’entraîner ses modèles d’IA et de mettre à disposition les contenus de presse de Gedi accompagnés d’un résumé, en temps réel, sur ChatGPT (14). En effet, bien que Gedi ait réalisé une analyse d’impact sur la protection des données, dans laquelle il indiquait fonder à la fois ses traitements et ceux d’OpenAI sur l’intérêt légitime, la GPDP a mis en lumière plusieurs difficultés liées à cette position (15).

Affaire « Gedi » : le cas des archives de presse
La première est la présence dans ces archives d’un volume important de données personnelles, notamment sensibles ou relatives à des infractions. L’autorité italienne rappelle alors que la base légale de l’intérêt légitime ne peut pas, à elle seule, légitimer le traitement de telles données sensibles et qu’il est nécessaire d’identifier, en plus, une des exceptions prévues par le RGPD (16). La seconde est relative à l’information des personnes et à leurs attentes raisonnables. La GPDP estime en effet que les personnes dont les données figurent dans ces archives de journaux ne peuvent pas s’attendre à une telle communication à OpenAI et que l’ajout prévu dans la politique de confidentialité de Gedi (non encore publié) s’adresse aux utilisateurs enregistrés de ses journaux et non aux personnes mentionnées dans les articles transmis. @