Le quotidien français 20 Minutes, à l’audience record, passe sous le contrôle du groupe belge Rossel

Avec ses 100 millions de visites par mois, seuil atteint en 2025, 20 Minutes – média « 100 % numérique » depuis l’abandon du papier en juillet 2024 – bascule sous « conditions » dans les mains du groupe belge Rossel (Le Soir, La Meuse, …), bien implanté aussi dans le Nord de la France (La Voix du Nord, Courrier Picard, …).

C’est une question de « semaines » pour finaliser l’opération, a priori en mars. Le groupe familial belge Rossel, détenu par la famille Hurbain depuis sa création en 1887, passe un cap historique en France en prenant le contrôle du quotidien national français 20 Minutes. Il ne détenait jusqu’alors dans l’Hexagone que des quotidiens régionaux comme La Voix du Nord, Courrier Picard ou Paris Normandie, ainsi que des hebdomadaires locaux, des magazines, des radios (Radio Contact et Champagne FM) et la télévision locale Wéo (1).
En rachetant les 49,3 % que le groupe français Sipa Ouest-France codétenait à part égale à la sienne (hormis 1,4 % d’actions autodétenues) dans la société 20 Minutes France basée à Levallois-Perret dans les Hauts-de-Seine, le groupe de médias bruxellois a désormais les coudées franches pour continuer à concurrencer les quotidiens nationaux français Le Monde, Le Figaro, Le Parisien, ou encore Libération. Quotidien gratuit lancé en France par le groupe norvégien Schibsted il y aura 24 ans le 15 mars 2026, 20 Minutes – présenté alors comme « un nouveau média complémentaire de la presse classique » s’adressant à « une nouvelle génération de lecteurs qui ne lit pas la presse payante » – s’est imposé rapidement dans le paysage de la presse française. Edité au format papier jusqu’en juillet 2024 (distribué gratuitement dans les grandes villes françaises), 20 Minutes est devenu le premier média numérique le plus consulté.

20 Minutes, en tête des médias en ligne
D’après un sondage mené par YouGov pour le Reuters Institute for the Study of Journalism, publié dans le Digital News Report 2025 en juin dernier (2), 20 Minutes – que dirige Sabina Gros (photo de gauche) – arrive en tête des médias numériques les plus fréquentés chaque semaine par les Français (14 %), devant Le Monde à égalité avec TF1 Info (12%) ou encore Franceinfo (11%), laissant même loin derrière Le Parisien à égalité avec Le Figaro (9 %) et même Ouest-France (7 %). Cependant, si l’on se fie cette fois aux audiences en ligne (sites web et applications mobiles) déclarées par les éditeurs eux-mêmes auprès de l’Alliance pour les chiffres de la presse et des médias (ACPM) qui les certifie, 20 Minutes se maintient en 9e position en nombre de visites par mois, et même 7e si l’on met à part Leboncoin et Tele-Loisirs (3), devançant tout de même Le Parisien et Libération. L’audience a même bondi en 2025 de 22,9 %, au point de (suite) franchir pour la première fois la barre des 100 millions de visites par mois en septembre et octobre derniers (4) (voir tableau ci-dessous).

« Conflit social » versus « chantage à l’emploi »
« 20 Minutes deviendra ainsi le média national de référence du groupe Rossel », s’est félicité l’acquéreur belge, du moins en France puisqu’il est aussi éditeur du quotidien national francophone Le Soir dans son pays d’origine, aux côtés des quotidiens régionaux belges La Meuse, Nord Eclair, La Province ou encore La Capitale. Le groupe Rossel, dirigé par Bernard Marchant (photo de droite) qui en est l’administrateur délégué, publie aussi de nombreux titres de presse en France tels que L’Union (diffusé dans l’Aisne, la Marne et les Ardennes), Libération Champagne (dans l’Aube), L’Est Eclair (l’Aube également), L’Ardennais (dans les Ardennes), Nord éclair (dans la région de Lille et dans l’Artois) ou encore Paris Normandie (en Normandie). Le groupe Rossel avait tenté en 2014 de racheter Nice-Matin, cette fois sur la Côte d’Azur, mais le tribunal de commerce de Nice avait préféré la candidature de reprise de la coopérative des salariés – du temps de Bernard Tapie et six ans avant que Xaviel Niel s’en empare grâce à un autre groupe belge, Nethys, qui lui céda ses parts (5).
Mais la perspective de la prise de contrôle de 20 Minutes, annoncée aux salariés par Bernard Marchant, présent le 27 novembre 2025 dans les locaux du journal, ne se fait pas dans un climat apaisé. Le patron de Rossel a posé ses « conditions » : que les syndicats signent un accord de la direction sur les droits d’auteur et les droits voisins (660 euros par an pour chaque journaliste), ce que refusent trois d’entre eux exigeant plus – entre 2.000 et 3.000 euros par an (6), validés par Commission droits d’auteur et droits voisins (CDADV), laquelle dépend de la DGMIC au ministère de la Culture (7). « Nous ne souhaitons pas investir dans une entreprise où il y a un conflit social », avait prévenu Bernard Marchant devant les salariés lors d’une autre réunion début décembre avec, cette fois, le coactionnaire Sipa Ouest-France vendeur, lequel était représenté par son directeur général Fabrice Bakhouche. L’administrateur délégué du groupe Rossel l’a confirmé à l’AFP début décembre (8). Les syndicats de journalistes, qui réfutent le terme de « conflit social » (9), reprochent à ce dernier de faire « un chantage inacceptable » auprès des salariés de 20 Minutes en leur disant que s’il devait payer les droits voisins aux conditions de la CDADV (près de 1 million d’euros seraient dus aux journalistes sur la période 2019-2024), « il mettrait 20 Minutes en cessation de paiement et le titre serait racheté, avec des coupes dans les effectifs à la clé », selon ses propos rapportés par les élus SNJ-CGT, SNJ, SNME-CFDT, CFE-CGC et Filpac-CGT du comité de groupe Rossel France (10).
La plupart des salariés de 20 Minutes avaient alors pris peur et avaient adressé à leurs syndicats une lettre pour leur demander « d’accepter la proposition de Bernard Marchand » et, selon ces derniers, « de toucher une somme cinq fois inférieure à celle à laquelle ils peuvent prétendre grâce à la décision de la CDADV ». Ce que les syndicats SNJ, SNJ-CGT, CFDT-Journalistes et SGJ-FO de 20 Minutes (11), sauf CFE-CGC, épaulés par ceux de Rossel France, refusent « parce qu’accepter le chantage à l’emploi dans un groupe qui perd de l’argent, certes, mais affiche toujours des revenus au-dessus de ceux des autres titres en France, est inacceptable ! » (12). Organisé le 16 janvier 2026 par la direction, un référendum – actuellement contesté en référé, selon nos informations – leur a donné tort. « Le sauvetage du titre [est conditionné] à la diminution drastique de la part des droits voisins des journalistes, en imposant par référendum, un pourcentage de 5 %, alors que la CDADV avait tranché pour 18 % », ont dénoncé les syndicats de journalistes, dont FO le 3 février (13). La justice pourrait être saisie. 20 Minutes compte aujourd’hui moins d’une soixantaine de journalistes, après des dizaines de suppressions de postes.

Sabina Gros remplace Ronan Dubois
Une fois la prise de contrôle finalisée, Sabina Gros sera confirmée comme directrice générale de 20 Minutes France, tout en conservant ses fonctions de directrice générale délégué (COO) de la régie publicitaire Rossel Advertising. Cette ancienne de Reworld Media et d’Unify (TF1) assure l’intérim à la tête de 20 Minutes depuis le départ en novembre 2025 de Ronan Dubois, lequel a essuyé une motion de défiance en 2021 et a été accusé en 2025 de propos transphobes. Il a rebondi en janvier 2026 chez Webedia comme directeur général délégué. @

Charles de Laubier

Droits voisins : les Etats de l’UE peuvent obliger les réseaux sociaux à rémunérer la presse

Ce ne sont que les conclusions de l’avocat général rendues cet été, mais elles ont de grandes chances d’être suivies par la Cour de justice de l’Union européenne (CJUE) : les réseaux sociaux peuvent être obligés par les Etats membres à rémunérer la presse pour ses contenus qu’ils utilisent.

Les conclusions de l’avocat général de la Cour de justice de l’Union européenne (CJUE) – le Polonais Maciej Szpunar (photo) – ont été rendues le 10 juillet 2025. L’arrêt est donc attendu entre octobre et janvier prochains. Statistiquement, la CJUE suit les conclusions de l’avocat général dans environ 70 % à 80 % des affaires. En substance : « Les Etats membres peuvent adopter des mesures de soutien pour garantir l’effectivité des droits des éditeurs de presse pour autant que ces mesures ne portent pas atteinte à la liberté contractuelle » (1).

Les réseaux sociaux sont bien concernés
Avant d’en venir au fond de l’affaire qui opposait Meta Platforms (Facebook) au régulateur italien des communications (Agcom (2)) sur la question de la rémunération de la presse au titre des droits voisins, signalons que l’avocat général a tenu à lever le doute sur le cas des réseaux sociaux. Car lors de l’audience du 10 février 2025, la CJUE avait posé la question aux participants de savoir si les réseaux sociaux étaient soumis aux droits voisins consacrés par l’article 15 de la directive « Droit d’auteur et droits voisins dans le marché unique numérique » (« Copyright » (3)) ou en sont au contraire exemptés en tant qu’hébergeur aux responsabilités néanmoins renforcées par l’article 17 de cette même directive. Par cette question générale, les éditeurs en Europe, y compris leurs organisations professionnelles comme l’Alliance de la presse d’information générale (Apig) en France, s’étaient fortement inquiétés du risque de voir les réseaux sociaux comme Facebook, X ou encore LinkedIn échapper aux droits voisins et de n’avoir ainsi rien à payer aux médias pour les contenus qu’ils utilisent. Cette éventualité aurait été redoutable pour les journaux en ligne des Vingt-sept.
Or les conclusions de l’avocat général, (suite) estimant que « le débat […] semble avoir révélé certains malentendus », ont de quoi rassurer la presse européenne : « Il est certes clair que le service de réseau social tel que Facebook, proposé par Meta, répond à la définition de “service de la société de l’information” […] Le réseau Facebook ne se limite pas à être un lieu passif de partage de contenus entre utilisateurs. A l’aide d’algorithmes sophistiqués, il propose aux utilisateurs des contenus concrets en fonction de leurs centres d’intérêt supposés, sans que ces utilisateurs n’aient effectué de recherche sur ces contenus ou que ceux-ci leurs soient proposés par d’autres utilisateurs. Facebook est donc un véritable fournisseur de contenus autonome, dont la spécificité est que les contenus ne sont ni créés ni achetés par lui : ils sont téléversés par les utilisateurs et c’est ensuite Facebook qui se charge de proposer ces contenus aux utilisateurs », développe Maciej Szpunar.
Et d’ajouter : « Une telle utilisation ne saurait, à mon avis, être attribuée aux utilisateurs, mais doit être considérée comme effectuée par le fournisseur des services de la société de l’information qu’est Meta et, par conséquent, dans la mesure où elle concerne des publications de presse, comme relevant des droits exclusifs des éditeurs ». Pour autant, l’avocat général précise que lorsque les éditeurs de presse partagent eux-mêmes leurs propres publications sur un réseau social comme Facebook, ils ne sauraient prétendre à aucune rémunération au titre des droits voisins prévus à l’article 15 de cette directive « Copyright ». « Cela découle de la nature de ces droits en tant que droits exclusifs, expliquet-il. Le titulaire d’un tel droit ayant lui-même mis à la disposition du public l’objet protégé sur un réseau social ou tout autre service de la société de l’information devrait en effet être supposé avoir donné son autorisation pour les utilisations de cet objet conformes aux conditions de fourniture du service en cause ». Même si – comme l’a fait remarquer à l’audience la Commission européenne – la procédure devant la CJUE n’était pas de savoir si l’article 15 s’appliquait aux réseaux sociaux comme Facebook, la question posée a eu le mérite de lever le doute et de confirmer la responsabilité des réseaux sociaux au regard des droits voisins de la presse.

« Compensation équitable » : décision italienne
Le litige entre Meta Platforms Ireland Limited et le régulateur Agcom portait sur la compatibilité de la législation italienne transposant la directive « Copyright ». La maison mère de Facebook, d’Instagram et de WhatsApp a introduit en 2023 un recours devant le tribunal administratif régional pour le Latium (Italie) visant à annuler une décision de l’Agcom datée du 19 janvier 2023 et ayant pour objet le « règlement portant définition des critères de référence aux fins de la détermination de la compensation équitable pour l’utilisation en ligne de publications de presse » (4), conformément à la loi italienne « Protection du droit d’auteur » (5). Cette décision fixe notamment un taux pouvant aller jusqu’à 70 %, applicable sur les recettes publicitaires des prestataires de services de la société de l’information tels que Facebook « provenant de l’utilisation en ligne des publications de presse de l’éditeur, déduction faite des recettes de l’éditeur provenant de la redirection du trafic sur son site Internet ». Cette décision italienne, contraignante, réglemente même la procédure permettant de demander à l’Agcom de déterminer le montant de la compensation équitable, voire de décider unilatéralement ce montant. Pour Meta, c’en est trop.

Recours de Meta contre l’Agcom
La firme de Menlo Park (Californie), cofondée et dirigée par Mark Zuckerberg (photo ci-dessous), fait notamment valoir que la décision de l’Agcom est contraire à l’article 15 de la directive « Copyright », « qui consacre non pas des droits de rémunération, mais des droits de nature exclusive ». En outre, Meta estime que cette réglementation italienne – avec ses obligations imposées aux plateformes numériques, ses limitations significatives de la liberté contractuelle des opérateurs économiques et des pouvoirs confiés à l’Agcom – serait également contraire à la liberté d’entreprise, garantie par la charte des droits fondamentaux de l’Union européenne (6), et, en particulier, au principe de libre concurrence. De plus, Meta souligne l’absence de proportionnalité et d’adéquation des mesures adoptées par le législateur italien. Autrement dit, l’Italie est-elle aller trop loin dans la transposition et l’interprétation de la directive « Copyright » ? La Botte a en effet opté pour une régulation sectorielle bien plus contraignante que par exemple celle de l’Hexagone, ce qui a naturellement soulevé des interrogations juridiques.
La France a adopté une approche plus souple et consensuelle que celle de l’Italie, les négociations entre éditeurs et plateformes (notamment Google) ayant été encadrées par l’Autorité de la concurrence, mais sans intervention directe dans la fixation des montants. La Péninsule, elle, a mis en place un système très structuré : une « compensation équitable » obligatoire en faveur des éditeurs, des obligations de négociation imposées aux plateformes, un rôle actif de l’Agcom dans la fixation des montants de rémunération. Plutôt que de trancher, le tribunal administratif italien a décidé de surseoir à statuer et de poser à la CJUE pas moins de trois questions préjudicielles :
1 . L’article 15 de la directive « Copyright » peut-il être interprété en ce sens qu’il s’oppose à l’introduction de dispositions nationales – telles que celles prévues par la loi italienne « Protection du droit d’auteur » et celles figurant dans la décision de l’Agcom ?
2 . L’article 15 de la directive « Copyright » s’oppose-til à des dispositions nationales, telles que celles visées dans la première question, qui imposent aux plateformes numériques une obligation de divulgation de données soumise au contrôle de l’Agcom, et dont le non-respect entraîne l’application de sanctions administratives ?
3 . Les principes de la liberté d’entreprise, de libre concurrence, et de proportionnalité, s’opposent-ils à des dispositions nationales, telles que des droits à rémunération en sus des droits exclusifs, des obligations de négocier avec les éditeurs une compensation équitable, des pouvoirs conférés à l’Agcom de surveillance, de sanction voire de fixer le montant exact de la compensation équitable ?
La demande de décision préjudicielle est parvenue à la CJUE le 21 décembre 2023. Des observations écrites ont été déposées notamment par le gouvernement français, présent parmi les participants à l’audience qui s’est tenue le 10 février 2025. Après avoir analysé dans le détail les trois questions pré-judicielles posées, l’avocat général « propose » de répondre aux première et deuxième questions que : « l’article 15 de la directive [« Copyright »] doit être interprété en ce sens qu’il ne s’oppose pas aux dispositions internes d’un Etat membre [comme le prévoit l’Italie via l’Agcom, ndlr], sous réserve que ces dispositions ne privent pas les éditeurs de la possibilité de refuser de donner une telle autorisation ni de la donner à titre gratuit, qu’elles n’imposent aux fournisseurs des services de la société de l’information aucun paiement sans lien avec une utilisation effective ou envisagée de telles publications, et qu’elles ne limitent pas de manière contraignante la liberté contractuelle des parties ». Concernant la troisième question sur la liberté d’entreprise (Charte), d’une part, et sur la libre concurrence (TFUE), d’autre part, Maciej Szpunar évacue d’emblée le second principe car « [les articles 119 et 109 du TFUE] ne sont pertinents aux fins du contrôle de la conformité des dispositions nationales en cause ».

Libre concurrence et liberté d’entreprendre
Pour la libre concurrence, il rappelle qu’elle comporte notamment l’interdiction de l’abus de position dominante sur le marché, consacrée en droit de l’Union européenne (7). « Ainsi, conclut l’avocat général, les mesures destinées à renforcer le pouvoir de négociation des éditeurs doivent être considérées non pas comme portant atteinte à la libre concurrence, mais comme la favorisant ». Par conséquent, la liberté d’entreprendre ne s’oppose pas à des limitations aux droits consacrés ni à des dispositions nationales. @

Charles de Laubier

Entraînement de modèles d’IA grâce aux données collectées par web scraping : les règles à suivre

Les plaintes à l’encontre de fournisseurs de systèmes d’IA se multiplient, que ce soit pour violation des droits de propriété intellectuelle ou pour manquements en matière de données à caractère personnel, notamment en lien avec leurs pratiques de collecte de données en ligne (web scraping).

Par Sandra Tubert et Laura Ziegler avocates associées, Algo Avocats

Afin de développer un système d’intelligence artificielle (IA) performant, il est nécessaire d’entraîner en amont les modèles qui le composent au moyen de vastes ensemble de données. Constituer ces ensembles de données d’entraînement représente donc un enjeu majeur pour les fournisseurs de systèmes d’IA. Plusieurs alternatives s’offrent à eux : utiliser les bases de données dont ils disposent en interne ; obtenir des licences auprès de titulaires de droits de propriété intellectuelle sur des contenus pertinents ; ou recourir au web scraping pour récupérer des données accessibles en ligne sur différents sites Internet.

Exception de Text and Data Mining
Cette troisième option, le web scraping (« moissonnage des données »), a connu un essor important ces dernières années. Pour autant, bon nombre d’acteurs récupèrent des données en ligne pour entraîner leurs modèles sans appréhender tous les enjeux et problématiques qui y sont attachés. Alors que plusieurs plaintes ou enquêtes d’autorités visent des fournisseurs de modèles d’IA à usage général pour des allégations de violation des droits de propriété intellectuelle ou de manquements au règlement général sur la protection des données (RGPD), l’entrée en vigueur prochaine du règlement européen sur l’intelligence artificielle – l’AI Act dont le texte final (1) a été signé le 13 juin 2024 – pourrait mettre en évidence les problématiques entourant les sources de données utilisées pour entraîner les modèles.

En effet, l’article 53 et l’annexe XI de l’AI Act imposent, entre autres, aux fournisseurs de modèles d’IA à usage général (2) de mettre à disposition des informations sur les données utilisées pour l’entraînement de ces modèles, au moyen d’un document-type qui sera mis à disposition par le bureau de l’IA (AI Office). Ils doivent notamment indiquer comment ces données ont été obtenues et sélectionnées, ainsi que toutes les mesures prises pour détecter les sources de données inadéquates. Pour pouvoir se conformer de manière sereine à ces nouvelles exigences (3), il est indispensable de s’assurer que les données d’entraînement ont été récupérées et collectées dans le respect des droits de propriété intellectuelle et du RGPD, sous peine de risquer des actions en contrefaçon ou des procédures de sanction devant les autorités de contrôle (4). En effet, le contenu d’un site Internet qu’un acteur entend scrapper (« moissonner ») pour constituer une base de données d’entraînement peut à la fois contenir des données à caractère personnel, mais également être protégé au titre du droit d’auteur (5) ou du droit des bases de données (6). Or, par principe, toute reproduction et utilisation d’un contenu protégé par un droit de propriété intellectuelle nécessite d’obtenir l’autorisation du titulaire des droits concernés. Néanmoins, afin de favoriser le développement de l’IA, le code de la propriété intellectuelle (CPI) a introduit, pour le droit d’auteur et le droit des producteurs de bases de données, les exceptions de fouilles de textes et de données (dites de Text and Data Mining) qui permettent de scrapper des données à des fins d’entraînement des modèles, sous réserve de respecter un certain nombre de conditions. Il y a en réalité deux régimes : la fouille de textes et de données à des fins de recherche scientifique (7) et celle à des fins diverses (8).
L’exception de fouille à des fins de recherches scientifique présente l’avantage d’être un droit absolu (le titulaire des droits ne peut pas s’y opposer), sous réserve que l’accès aux données soit réalisé de manière licite (9). Néanmoins, son périmètre est relativement restreint puisque seuls peuvent s’en prévaloir certains acteurs limitativement énumérés (10). La plupart des fournisseurs de systèmes d’IA ne peut donc pas mobiliser cette exception et doit se rabattre sur l’exception générale dite à des fins diverses. Pour pouvoir invoquer le bénéfice de cette exception générale, le fournisseur de système d’IA doit accéder aux données de manière licite et s’assurer que le titulaire des droits de propriété intellectuelle ne s’y est pas opposé.

« Moissonnage » et données personnelles
Les textes précisent que l’opposition du titulaire des droits « n’a pas à être motivée et peut être exprimée par tout moyen », notamment « au moyen de procédés lisibles par machine, y compris des métadonnées, et par le recours à des conditions générales d’utilisation » (11). Pour l’opposition via des procédés techniques, plusieurs outils existent (Robot.txt, AI.txt, TDMRep, …). En pratique, cela signifie que pour pouvoir scrapper les données des sites Internet à des fins d’entraînement des modèles, les fournisseurs de systèmes d’IA ne doivent pas contourner les éventuels dispositifs de protection existants (par exemple un accès restreint par un compte utilisateur) et doivent s’assurer, au moment de l’extraction des données, que les conditions générales d’utilisation (CGU) et/ou mentions légales du site Internet ne contiennent pas de clause interdisant l’extraction des données et que les métadonnées du site Internet n’expriment pas non plus une telle interdiction. L’AI Act confirme ce dernier point (12).
Lorsqu’un titulaire de droits s’est opposé à l’extraction de ses données, le fournisseur de système d’IA n’a d’autre choix que d’obtenir une autorisation expresse (13) au moyen d’un accord de licence ou de partenariat, comme ont récemment pu le faire OpenAI avec Le Monde, Die Welt et El País (14). Une fois ces vérifications opérées, le fournisseur de système d’IA devra suivre des étapes supplémentaires si le contenu qu’il souhaite « moissonner » contient des données à caractère personnel, afin de respecter le RGPD.

Base légale de l’intérêt légitime
Ces derniers mois, la Cnil a publié plusieurs fiches pour guider les fournisseurs de systèmes d’IA (15) au sein desquelles elle clarifie comment appliquer les principes clefs aux spécificités de l’IA. Elle y admet qu’il est possible de fonder les traitements d’entraînement des modèles d’IA sur la base légale de l’intérêt légitime, notamment lorsque les données sont collectées à partir de sources publiques (16), sous réserve de mener une analyse au cas par cas permettant de documenter la légitimité de l’intérêt poursuivi, sa nécessité et le fait qu’il n’y a pas d’atteinte disproportionnée aux intérêts, droits et libertés des personnes. Pour autant, en juin 2024, Noyb a porté plainte – auprès de onze « Cnil » en Europe – contre Meta dont il conteste la faculté de se fonder sur l’intérêt légitime pour récupérer les données de Facebook et Instagram afin d’entraîner ses modèles d’IA. Dans l’attente, Meta a stoppé son projet (17).
La première étape avant de scrapper des données à caractère personnel est de définir la finalité du traitement, à partir de laquelle l’analyse de conformité aux principes de protection des données personnelles pourra être réalisée. A partir de cette finalité (créer une base de données afin d’entraîner des modèles d’IA permettant d’évaluer l’appréciation d’œuvres par le public, développer un LLM capable de répondre à des questions, générer du texte, effectuer des résumés, etc,…), le fournisseur de modèles d’IA devra s’assurer du respect du principe de minimisation, en ne collectant que les données pertinentes et nécessaires pour atteindre son objectif. Concrètement, cela signifie qu’il doit s’interroger en amont sur les catégories de données nécessaires pour l’entraînement du modèle d’IA. En pratique, il devra définir les catégories de données à collecter et mettre en place des filtres permettant d’exclure la collecte de certaines données. Dans sa fiche dédiée au web scraping (18), la Cnil précise que dans l’hypothèse où des données non pertinentes seraient collectées malgré les filtres mis en place, il convient de supprimer ces données, immédiatement après leur collecte ou dès elles ont été identifiées. Elle appelle également à la prudence sur la collecte automatique de données sensibles en invitant les fournisseurs à appliquer des filtres permettant d’écarter la collecte de données sensibles (19) non pertinentes ou à exclure de leurs activités de scraping certains sites comportant par nature ce type de données.
Respecter le RGPD suppose, par ailleurs, d’informer les personnes concernées et de faciliter l’exercice de leurs droits. La Cnil reconnaît (20) qu’en cas de collecte parweb scraping, une information individuelle des personnes pourrait, dans certains cas, être disproportionnée et donc non obligatoire. Elle recommande alors au fournisseur du système d’IA de fournir une information générale (par exemple au sein de sa politique de confidentialité) contenant notamment les catégories de sites sources utilisés avec des liens hypertextes vers ceux-ci, en proposant un modèle dédié. Pour les droits des personnes, elle rappelle qu’un responsable du traitement n’a pas à conserver ou collecter des informations supplémentaires qui ne lui sont pas nécessaires dans le seul but de permettre l’exercice des droits. La Cnil propose néanmoins des exemples de mesures que les fournisseurs de modèles d’IA pourraient mettre en place pour faciliter l’exercice des droits (comme la conservation de métadonnées ou d’informations sur la source des données pour faciliter la recherche d’une personne au sein de la base ou l’indication aux personnes des données à fournir pour les identifier).
La Cnil propose enfin de mettre en place des mesures supplémentaires pour garantir l’équilibre attendu de ces traitements basés sur l’intérêt légitime. Certaines mesures découlant des règles précédemment citées semblent réalisables : exclure par défaut la collecte à partir de certains sites contenant des données intrusives ; prévoir la possibilité de s’opposer au traitement de manière discrétionnaire ; appliquer des procédés d’anonymisation ou de pseudonymisation après la collecte des données. D’autres semblent moins pragmatiques.

AI Office : recommandations très attendues
Certains acteurs pourraient ainsi saisir l’opportunité de remonter leurs questionnements, difficultés pratiques, appréciation des règles dans le cadre de la consultation publique à laquelle sont soumises certaines fiches jusqu’au 15 septembre 2024 (21) ou répondre au questionnaire (22). A l’aune de l’entrée en vigueur de l’AI Act, les fournisseurs de modèles d’IA à usage général attendront donc les précieuses recommandations et modèles du bureau de l’IA, tout récemment créé (23), sur les documents à produire pour les sources de données d’entraînement, afin de leur permettre d’engager les travaux nécessaires à la compilation de ces informations. @

L’industrie du livre est appelée à mieux rémunérer les auteurs à l’ère du numérique et de l’IA

Le Syndicat national de l’édition (SNE) a tenu le 27 juin 2024 son assemblée générale annuelle. L’industrie du livre dans les Vingt-sept, dont la France, va passer sous les fourches caudines de la Commission européenne qui a lancé – via sa DG Connect – une enquête sur les contrats d’auteur.

Ce n’est pas anodin à l’ère du numérique et en pleine déferlante de l’intelligence artificielle : la DG Connect – direction générale des réseaux de communication, du contenu et de la technologie de la Commission européenne – a lancé jusqu’au 21 juin une « enquête sur les pratiques contractuelles touchant le transfert du droit d’auteur et des droits voisins ». Si cette démarche porte sur le secteur de la création et de la culture en général au regard des artistes, elle concerne en particulier les maisons d’édition et leurs contrats avec les auteurs.

Papier, ebook, audio, streaming, IA, …
Cette enquête menée en ligne (1) s’est adressée d’abord directement aux auteurs et aux artistes des industries culturelles et créatives en Europe. Mais leurs organisations professionnelles et représentatives (2) ont pu y répondre aussi. L’objectif de cette étude est notamment de « recueillir des données et des preuves concernant les arrangements contractuels liés au transfert du droit d’auteur ou des droits voisins, et évaluer leurs effets, en particulier sur la capacité des créateurs à recevoir une rémunération équitable et la capacité des producteurs à utiliser efficacement leurs droits à long termes ». Les contrats d’édition posent problèmes et le partage de la valeur entre les éditeurs de livres et les auteurs laisse à désirer. A l’occasion du troisième anniversaire de l’entrée en vigueur de la directive européenne « Droit d’auteur et droits voisins dans le marché unique numérique » de 2019, le Conseil des écrivains européens – European Writers’ Council (EWC) basé à Bruxelles – a publié début juin un rapport sur « les clauses contractuelles dans les accords d’édition dans le secteur du livre européen » (3).

Conclusion de l’écrivaine allemande Nina George (photo), présidente d’honneur de l’EWC : « La transparence est l’engagement nécessaire pour l’équité ». Connue dans le monde entier comme l’auteure de « The Little Paris Bookshop », un best-seller international, Nina George – qui est aussi journaliste – rappelle que « la chaîne de valeur commence toujours par l’auteur et son manuscrit original, sans lequel il ne peut y avoir de publication ». Le manuscrit est le fondement de l’industrie du livre. Pourtant, soulignet-elle à l’attention notamment des maisons d’édition qui contractualisent avec les auteurs : « Contrairement à un écrivain, les employés et les sous-traitants reçoivent un salaire fixe ou des honoraires liés au rendement, tandis que l’écrivain n’est jamais payé pour son travail. L’auteur ne reçoit qu’une part financière des revenus liés à l’utilisation […], entre 5 % et 8 % du prix de vente pour les éditions de livres de poche et entre 8 % et 10 % pour les couvertures cartonnées. Et avant les impôts, soit dit en passant ». Et cette situation – engendrant précarité et paupérisation – perdure puisqu’il n’y a pas eu d’augmentation de ces redevances depuis des décennies, « comme si 10 % était un obstacle magique ». La présidente du Conseil des écrivains européens appelle à la transparence dans tout le monde de l’édition, « en particulier dans l’utilisation transfrontalière et la circulation des livres via des traductions, ainsi que dans l’environnement numérique et vers des intermédiaires de streaming, commerciaux comme Amazon, Audible, Storytel et Spotify, ainsi que les bibliothèques non commerciales, comme les bibliothèques publiques ».
Le contexte ayant considérablement évolué depuis les premiers contrats-types de la fin des années 1990, les maisons d’édition doivent adapter leurs clauses contractuelles avec les auteurs. Et Nina George d’enfoncer le clou face à une industrie du livre non satisfaisante : « Il existe de nombreux besoins d’adaptation dans les contrats, en particulier sur les abonnements audio et ebook et la transparence de la diffusion en streaming, ainsi que sur la rémunération proportionnelle et appropriée. Cela nécessite de la transparence sur tous les […] maillons de la chaîne du livre, ainsi que sur la demande des intermédiaires de streaming, et sur l’intelligence artificielle (IA) liée à la fouille de textes (4) ou encore sur la programmation d’algorithmes pour les systèmes d’IA générative ». Malgré la directive « Droit d’auteur et droits voisins dans le marché unique numérique », les écrivains semblent des laissés-pour compte dans une Europe en manque d’équité et d’harmonisation dans un marché unique de plus en plus numérique.

Pour un meilleur partage de la valeur
La Commission européenne est donc appelée à remédier au déséquilibre dans le partage de la valeur du livre, comme lui recommandent aussi les eurodéputés dans leur résolution du 21 novembre 2023 « sur un cadre de l’Union [européenne] pour la situation sociale et professionnelle des artistes et des travailleurs des secteurs de la culture et de la création » (5). L’enquête de la DG Connect, chargée justement du marché unique numérique, devrait déboucher sur des mesures lors de la prochaine mandature. @

Charles de Laubier

Divisée face aux Gafam, la presse française ne favorise pas la transparence sur les droits voisins

Carine Fouteau, nouvelle présidente et directrice de la publication Mediapart, pointe la non transparence de Google sur les sommes dues au titre des droits voisins de la presse. Mais elle s’en prend aussi « aux médias qui ont fait le choix du chacun pour soi en signant des accord individuels ».

C’est le premier coup de gueule de Carine Fouteau (photo), cette journaliste qui a succédé en mars 2024 à Edwy Plenel à la présidence de la Société éditrice de Mediapart. La nouvelle directrice de la publication de Mediapart a dénoncé fin avril « l’opacité des Gafam » en général et « l’absence de transparence » de Google en particulier. Le média d’investigation reproche notamment « les clauses de confidentialité imposées par Google » dans le cadre de l’accord que ce dernier a signé en octobre 2023 avec la Société des droits voisins de la presse (DVP).

L’Autorité de la concurrence a déjà sévi
Ce premier « accord majeur » de la Société DVP avec Google porte sur l’exploitation des contenus de presse par Google Actualités, Google Search et Google Discover sur la période allant d’octobre 2019 à décembre 2022. Le montant total ainsi collecté – pour le compte des 305 éditeurs (dont Edition Multimédi@) et agences de presse membres de cet organisme de gestion collective – n’a pas été divulgué. Et pour cause, Google impose à la Société DVP des clauses de confidentialité qui l’empêche de publier l’enveloppe globale obtenue dans le cadre de cet accord contractuel. La nouvelle patronne de Mediapart (1), dont la société éditrice est membre du conseil d’administration de la Société DVP, pointe ce défaut de transparence. Les sommes correspondantes à cette première période ont été versées en mars aux éditeurs membres, tandis que le média fondé par Edwy Plenel a décidé de ne pas encaisser la « substantielle somme » lui revenant. « La rétribution ne retourne pour autant pas à l’envoyeur (Google) : elle reste en réserve dans l’organisme de gestion collective, en attendant que le voile sur les chiffres soit levé », a précisé Carine Fouteau sur le site d’investigation.

Elle rappelle que l’Autorité de la concurrence (ADLC) venait, par décision datée du 15 mars dernier (2), d’infliger à Google une amende de 250 millions d’euros pour ne pas avoir respecté certains engagements rendus obligatoires depuis juin 2022, notamment sur la transparence justement. « Nous avons développé une méthodologie non-discriminatoire et transparente », s’est défendu Google (3). Cette décision était la quatrième rendue en quatre ans par l’ADLC sur ce dossier « Google/droits voisins de la presse », dont une première amende de 500 millions d’euros infligée à Google le 12 juillet 2021 (4) pour non-respect des injonctions qui lui avaient été faites par décision du 9 avril 2020 (5). Selon nos informations, la somme collectée au titre de l’année 2023 par la Société DVP auprès de Google sera répartie entre les éditeurs membres à la fin de l’année 2024. Des négociations sont aussi en cours avec d’autres géants du Net (6). Meta (Facebook, Instagram) et Microsoft (MSN, LinkedIn) pourraient être les prochains à signer avec l’organisme de gestion collective. Des négociations sont également en cours avec X (ex-Twitter). « Pour faire plier les mastodontes de la tech, il est urgent que la représentation nationale, via le Parlement, prenne le relais et complète la loi de 2019 [établissant un droit voisin de la presse par transposition en France de la directive européenne de 2019 sur le “droit d’auteur dans le marché unique numérique”, ndlr] en inscrivant ce refus du secret dans le marbre », a estimé Carine Fouteau.
La Société DVP – présidée par Jean-Marie Cavada – a en fait confié toutes ces négociations à deux organismes : la Sacem (7) pour les plateforme numériques dites B2C (orientées consommateurs) telles que Google, Meta, Microsoft, LinkedIn ou encore Twitter ; le CFC (8) pour les plateformes numériques dites B2B (pour entreprises et professionnels) telles que les prestataires de veille média comme Onclusive (ex-Kantar Media), Cision (ex-L’Argus de la presse) ou encore des crawlers (9).
La non-transparence dans la rémunération des droits voisins de la presse vient aussi du fait que la presse française négocie en ordre dispersé avec les Gafam. Et cela vaut aussi bien pour les moteurs de recherche et agrégateurs d’actualités que pour les intelligences artificielles génératives. « Contrairement aux médias qui ont fait le choix du chacun pour soi en signant des accords individuels, nous considérons que seul un front uni des acteurs du secteur est à même de faire fléchir ces multinationales, qui, sans législation, continueraient de piller nos articles », a estimé la présidente de la Société éditrice de Mediapart.

Moteurs et IA générative : la presse dispersée
Rappelons que l’ADLC avait remis en cause en juillet 2021 le premier accord-cadre signé entre Google et l’Alliance de la presse d’information générale (Apig). Un second fut nécessaire, pour que les quotidiens membres (300 titres) puissent signer individuellement (10). Mais le 9 avril dernier, l’Apig a annoncé confier à la Sacem la renégociation de ses accords-cadres avec Google et Meta (11), après lui avoir confié en octobre 2023 les négociations avec les autres géants du Net. @

Charles de Laubier