Samsung Electronics entre dans une nouvelle ère : celle de l’IA et… des revendications salariales

Lee Jae-yong (alias Jay Y. Lee) – petit-fils de Lee Byung-chul, fondateur du chaebol Samsung, la plus grande entreprise sud-coréenne – a deux défis à relever à la tête de la filiale Samsung Electronics : réussir la révolution de l’intelligence artificielle et répondre aux revendications salariales.

Lee Jae-yong (photo) est devenu cette année, et pour la première fois, la personne la plus riche de Corée du Sud. Le président du groupe Samsung, premier chaebol (méga-conglomérat détenu par une dynastie familiale) de ce pays d’Asie de l’Est, s’est ainsi hissé à la 191ème place des plus grandes fortunes mondiales, selon Forbes (au 19-07-24), à hauteur de 11,2 milliards de dollars de patrimoine professionnel (1).
Ayant été gracié en août 2022 par le président de la République de Corée (l’actuel Yoon Suk-yeol), après avoir été emprisonné en 2017 puis en 2021 pour corruption, détournement de fonds, parjure et dissimulation criminelle (pots-de-vin versés en haut lieu), Lee Jaeyong (56 ans), alias Jay Y. Lee, a pu reprendre en octobre 2022 la présidence du chaebol Samsung et de sa puissante filiale Samsung Electronics – créée en 1969 et devenue numéro un mondial des smartphones ainsi que numéro un mondial des téléviseurs. Avant ses démêlés judiciaires et ses peines carcérales, et alors même qu’il était déjà suspect après l’éclatement du scandale politicofinancier en octobre 2016, Lee Jae-yong avait déjà été de fait à la tête du méga-conglomérat Samsung et du groupe Samsung Electronics de 2014 à 2017. Son père Lee Kun-hee – alors première fortune de Corée du Sud et décédé en octobre 2020 – en avait fait son héritier à la suite de problèmes cardiaques (2).

Sur fond de procès, Lee Jae-yong face aux défis
Autant dire que le sort du « prince héritier », comme certains le surnomment lorsqu’il n’est pas appelé familièrement « Jay Y », relève du miracle économique. La grâce présidentielle d’il y a près de deux ans – avec effacement de toute trace de corruption dans son casier judiciaire – est intervenue après l’insistance d’entreprises américaines et sud-coréennes appelant à la clémence afin que soit préservé Samsung, acteur majeur de l’économie du pays et partenaire crucial des Etats-Unis dans la production de puces mémoires en tant que producteur de plus de la moitié de ce marché dans le monde. Le petit-fils du fondateur de Samsung, fils unique et aîné de trois sœurs, en a-t-il fini avec la justice ? Presque. L’agence de presse sud-coréenne Yonhap a fait état le 5 février dernier d’une décision d’un tribunal de Séoul acquittant le président exécutif de Samsung des accusations de manipulations de comptes et de cours portées contre lui, liées à une fusion entre deux filiales de Samsung en 2015 dans le but de consolider le contrôle de la dynastie familiale sur le groupe « trois étoiles » – c’est la signification en coréen de « Samsung » (jusqu’en 1993, le logo du chaebol était d’ailleurs composé de trois étoiles). Mais les procureurs ont fait appel de son acquittement…

IA et puces mémoires profitent à Samsung
Lee Jae-yong, personnalité la plus riche de Corée du Sud depuis trois mois maintenant, doit en outre s’acquitter – avec ses deux sœurs encore vivantes (3) – de la somme colossale de 8,5 milliards de dollars de droits de succession, depuis le décès en 2020 du patriarche multimilliardaire Lee Kun-hee et détenteur d’une vaste collection de tableaux de maîtres. Ses héritiers ont pu étaler les paiements au fisc sud-coréen sur cinq ans, avec les dernières échéances prévues en 2025.

La famille Lee, qui contrôle les entreprises du chaebol (terme voulant aussi dire « ploutocratie » en coréen) par des participations croisées voire opaques, n’est-elle pas tentée d’augmenter les dividendes aux actionnaires pour s’acquitter de ses droits de successions ? C’est ce qu’ont pensé des analyses lorsqu’un dividende exceptionnel a été décidé en janvier 2021 par la plus emblématique de ses filiales cotées en Bourse. En janvier 2024, le géant de l’électronique a annoncé que « Samsung Electronics versera un dividende annuel régulier de 9,8 milliards de wons [6,5 milliards d’euros, ndlr] dans le cadre du rendement total des actionnaires de 50 % du flux de trésorerie disponible pour la période allant de 2024 à 2026 » (4).
Samsung Electronics, qui fête ses 55 ans cette année et toujours basée depuis le début et comme sa maison mère dans la ville de Suwon (située à une trentaine de kilomètres au sud de la capitale Séoul), est la poule aux œufs d’or de la famille Lee. Si le chaebol Samsung n’est pas lui-même en Bourse, il tire ses valorisations de plusieurs de ses filiales cotées : Samsung Electronics (ex-Samsung Electric Industries), Samsung SDS (fondée en 1985), Samsung Biologics (créée en 2011), Samsung Engineering (fondée en 1969), Samsung Fire & Marine Insurance (renommée ainsi en 1993), ou encore Samsung Life Insurance (rebaptisée ainsi en 1963). Mais c’est Samsung Electronics qui fait l’essentiel de la fortune de Lee Jae-yong. Coté depuis 1975 et actuellement présent sur trois places boursières que sont Séoul, Francfort et Londres, le vaisseau amiral technologique du chaebol atteint aujourd’hui une capitalisation boursière de 402,5 milliards de dollars (au 19-07-24), soit 369,6 milliards d’euros. Depuis que le « prince héritier » a été confirmé en octobre 2022 à la tête du conglomérat et de sa filiale-phare, la capitalisation n’a cessé de grimper (5) grâce à une action « SMSN » revigorée.
Malgré une année 2023 (au 31 décembre) la plus mauvaise depuis une décennie (chiffre d’affaires en baisse, à 180 milliards d’euros, et bénéfice net divisé par plus de trois, à 10,8 milliards d’euros), le premier trimestre 2024 (au 31 mars 2024) a affiché un redressement financier spectaculaire : chiffre d’affaires trimestriel en hausse de 12,8 %, à 49,6 milliards d’euros, pour un bénéfice net bondissant de 328,7 %, à 4,6 milliards d’euros. La reprise de la demande en puces mémoire (DRAM) s’est confirmée, portée par les besoins des serveurs des IA génératives en plein boom, les ordinateurs personnels et les téléphones portables. L’intelligence artificielle (IA) booste également les ventes des smartphones du numéro un mondial, repassé depuis le début de l’année devant Apple (6) qui lui avait ravi – fin 2023 seulement – la première place (7). Lee Jae-yong entend bien ne plus se faire doubler par la Pomme et a engagé avec la firme de Cupertino un bras de fer dans les smartphones dopés à l’IA. Lors de ses annonces « Galaxy Unpacked 2024 », le 10 juillet aux Etats- Unis (8) et le 11 juillet au Carrousel du Louvre à Paris (9), le président de Samsung Mobile, TM Roh (10), a annoncé que « Galaxy AI sera disponible sur 200 millions de terminaux Galaxy [smartphones et tablettes, ndlr] cette année ». Le géant sud-coréen a étendu à l’IA son partenariat de plus de dix ans avec Google, qui lui apporte Gemini AI. Dans l’IA encore, il vient tout juste de racheter la start-up britannique Oxford Semantic.
Samsung Electronics prépare en outre la sortie cette année d’un casque de réalité mixe conçu avec Google et Qualcomm pour concurrencer l’Apple Vision Pro qui est à la peine. Pendant que Samsung Electronics et son président exécutif milliardaire s’enrichissent, les 124.000 salariés qui travaillent pour lui en Corée du Sud – sur les 267.860 employés dans le monde (11) – ne sont pas satisfaits de leur sort.

Salariés laissés pour compte ? Grève historique
Les négociations entre la firme de Suwon et le premier syndicat du groupe – la National Samsung Electronics Union (NSEU) représentant 31.000 salariés (12), soit près du quart de l’effectif total de l’entreprise dans le pays – se sont enlisées. Après une première grève qui n’a rien donné, le NSEU a lancé le 10 juillet une grève illimitée historique pour « faire plier la direction » sur ses revendications : augmentation des salaires supérieures aux 5,1 % avancés par la direction, transparence sur les primes, un jour de congé en plus par an, … Le grand-père était hostile aux syndicats ; le petit-fils devra composer avec eux. @

Charles de Laubier

A l’ère de l’IA et de la data, la gestion collective des droits d’auteur veut devenir plus « intelligente »

Le 26 juin, lors de l’AG de la SCPP, organisme de gestion collective des droits des producteurs de musique, a été adopté le projet d’une filiale commune avec l’Adami (artistes et interprètes). Objectif : faire « données communes », notamment face à l’IA. La SPPF veut aussi les rejoindre.

Voilà qui devrait aller dans le sens de la Cour des comptes : un mouvement de rapprochement en France entre les organismes de gestion collective (OGC) des droits d’auteur et des droits voisins. Cette mise en commun concerne d’abord leurs systèmes d’information pour mieux moderniser leur « Big Data » et se mettre en ordre de bataille face à la déferlante de l’intelligence artificielle. Les magistrats du palais de Cambon, présidés par Pierre Moscovici (photo), ne cesse de prôner un tel rapprochement dans le rapport annuel de la commission de contrôle des OGC.

Rationaliser en faisant « Big Data » commun
Lors de l’assemblée générale annuelle de la Société civile des producteurs phonographiques (SCPP), le 26 juin, une résolution validant la création d’une « filiale commune paritaire » avec l’Adami (Administration des droits des artistes et musiciens interprètes) a été adoptée. Le premier OGC collecte et répartit les droits d’auteur gérés collectivement pour le compte des producteurs de musiques enregistrées, dont les trois majors que sont Universal Music, Sony Music et Warner Music. Le second OGC collecte et répartit les droits d’auteurs pour le compte des artistes interprètes de la musique et de l’audiovisuel.
La SCPP est le bras armé financier du Syndicat national de l’édition phonographique (Snep) et compte plus de 4.500 producteurs de musique membres, tandis que l’Adami est au service de près de 100.000 artistes-interprètes. Improbable par le passé, ce rapprochement entre les deux organismes a été annoncé le 27 mai dernier (1) et va se concrétiser par « une mise en commun, à travers la création d’une filiale commune et paritaire, de leurs bases de données respectives et de leurs outils de répartition pour les droits à rémunération que sont la rémunération pour copie privée et la rémunération équitable ». Une étude de faisabilité est en train d’être menée pour savoir comment sera mise en œuvre opérationnelle cette répartition, et pour adopter des règles communes d’affectation « par phonogramme » – comprenez par musique enregistrée où le streaming domine désormais.

A à l’heure de la multiplication des IA génératives dévoreuses de catalogues musicaux, la mise en commun des moyens informatiques et des data s’impose. « Les organismes de gestion collective sont devenus des sociétés du Big Data nécessitant de constamment adapter leur système d’information. Ce défi prendra sa pleine mesure avec le développement de l’IA », justifient la SCPP dirigée par Marc Guez et l’Adami gérée par Michel Joubert. Un autre OGC, la Société civile des producteurs de phonogrammes en France (SPPF), qui revendique 2.330 producteurs associés et que dirige Jérôme Roger, a indiqué le 6 juin « vouloir rejoindre cette initiative dès que possible » (2). Tout en se réjouissant de l’accord de partenariat entre la SCPP et l’Adami, la SPPF – rivale historique de la SCPP et pendant de l’Union des producteurs phonographiques français indépendants (UPFI) – rappelle qu’elle avait conclu en 2022 un accord de partenariat avec la même Adami qui prévoyait « la possibilité d’une mise en commun de leurs systèmes d’information respectifs afin d’améliorer notamment la qualité des travaux d’identification ».
Dans le rapport de 2023 de sa commission de contrôle des organismes de gestion des droits d’auteur et des droits voisins, la Cour des comptes avait encore suggéré cette rationalisation informatique entre la SCPP et la SPPF pour faire des économies: « Le système d’information de la SCPP semble plus mature et en adéquation avec les enjeux du secteur. Un travail de convergence vers le système d’information de la SCPP pourrait être mis en place dans le cadre d’un rapprochement entre les deux organismes ». Les magistrats du palais de Cambon pointent «la complexité du dispositif français» faisant intervenir trois organismes, dont deux OGC de premier niveau (la SCPP et la SPPF) et un OGC intermédiaire (la SCPA), qui répartissent les droits collectés par d’autres OGC (SPRE, Copie France). Et en plus d’être rivales, la SCPP et la SPPF ferraillent en justice sur des contentieux entre elles depuis 2018.

Vers un rapprochement de tous les OGC ?
Selon la Cour des comptes, les deux OGC font soit « un divorce intégral, qui pourrait impliquer la dissolution de la SCPA », soit « une “sortie par le haut”, qui pourrait se traduire par un rapprochement plus étroit pouvant aller jusqu’à la fusion, au sein d’une nouvelle entité dont la SCPA pourrait être la préfiguration » (3). En tout cas, l’accord SCPPAdami pourrait être la première étape à un rapprochement entre l’ensemble des OGC en France, comme le souhaite la SPPF. Les auteurs, artistes et interprètes seraient gagnants. Et après, un rapprochement du Snep et de l’UPFI ? « Un rapprochement des syndicats n’est pas à l’ordre du jour », répond à Edition Multimédi@ Alexandre Lasch, directeur général du Snep. @

Charles de Laubier

Entraînement de modèles d’IA grâce aux données collectées par web scraping : les règles à suivre

Les plaintes à l’encontre de fournisseurs de systèmes d’IA se multiplient, que ce soit pour violation des droits de propriété intellectuelle ou pour manquements en matière de données à caractère personnel, notamment en lien avec leurs pratiques de collecte de données en ligne (web scraping).

Par Sandra Tubert et Laura Ziegler avocates associées, Algo Avocats

Afin de développer un système d’intelligence artificielle (IA) performant, il est nécessaire d’entraîner en amont les modèles qui le composent au moyen de vastes ensemble de données. Constituer ces ensembles de données d’entraînement représente donc un enjeu majeur pour les fournisseurs de systèmes d’IA. Plusieurs alternatives s’offrent à eux : utiliser les bases de données dont ils disposent en interne ; obtenir des licences auprès de titulaires de droits de propriété intellectuelle sur des contenus pertinents ; ou recourir au web scraping pour récupérer des données accessibles en ligne sur différents sites Internet.

Exception de Text and Data Mining
Cette troisième option, le web scraping (« moissonnage des données »), a connu un essor important ces dernières années. Pour autant, bon nombre d’acteurs récupèrent des données en ligne pour entraîner leurs modèles sans appréhender tous les enjeux et problématiques qui y sont attachés. Alors que plusieurs plaintes ou enquêtes d’autorités visent des fournisseurs de modèles d’IA à usage général pour des allégations de violation des droits de propriété intellectuelle ou de manquements au règlement général sur la protection des données (RGPD), l’entrée en vigueur prochaine du règlement européen sur l’intelligence artificielle – l’AI Act dont le texte final (1) a été signé le 13 juin 2024 – pourrait mettre en évidence les problématiques entourant les sources de données utilisées pour entraîner les modèles.

En effet, l’article 53 et l’annexe XI de l’AI Act imposent, entre autres, aux fournisseurs de modèles d’IA à usage général (2) de mettre à disposition des informations sur les données utilisées pour l’entraînement de ces modèles, au moyen d’un document-type qui sera mis à disposition par le bureau de l’IA (AI Office). Ils doivent notamment indiquer comment ces données ont été obtenues et sélectionnées, ainsi que toutes les mesures prises pour détecter les sources de données inadéquates. Pour pouvoir se conformer de manière sereine à ces nouvelles exigences (3), il est indispensable de s’assurer que les données d’entraînement ont été récupérées et collectées dans le respect des droits de propriété intellectuelle et du RGPD, sous peine de risquer des actions en contrefaçon ou des procédures de sanction devant les autorités de contrôle (4). En effet, le contenu d’un site Internet qu’un acteur entend scrapper (« moissonner ») pour constituer une base de données d’entraînement peut à la fois contenir des données à caractère personnel, mais également être protégé au titre du droit d’auteur (5) ou du droit des bases de données (6). Or, par principe, toute reproduction et utilisation d’un contenu protégé par un droit de propriété intellectuelle nécessite d’obtenir l’autorisation du titulaire des droits concernés. Néanmoins, afin de favoriser le développement de l’IA, le code de la propriété intellectuelle (CPI) a introduit, pour le droit d’auteur et le droit des producteurs de bases de données, les exceptions de fouilles de textes et de données (dites de Text and Data Mining) qui permettent de scrapper des données à des fins d’entraînement des modèles, sous réserve de respecter un certain nombre de conditions. Il y a en réalité deux régimes : la fouille de textes et de données à des fins de recherche scientifique (7) et celle à des fins diverses (8).
L’exception de fouille à des fins de recherches scientifique présente l’avantage d’être un droit absolu (le titulaire des droits ne peut pas s’y opposer), sous réserve que l’accès aux données soit réalisé de manière licite (9). Néanmoins, son périmètre est relativement restreint puisque seuls peuvent s’en prévaloir certains acteurs limitativement énumérés (10). La plupart des fournisseurs de systèmes d’IA ne peut donc pas mobiliser cette exception et doit se rabattre sur l’exception générale dite à des fins diverses. Pour pouvoir invoquer le bénéfice de cette exception générale, le fournisseur de système d’IA doit accéder aux données de manière licite et s’assurer que le titulaire des droits de propriété intellectuelle ne s’y est pas opposé.

« Moissonnage » et données personnelles
Les textes précisent que l’opposition du titulaire des droits « n’a pas à être motivée et peut être exprimée par tout moyen », notamment « au moyen de procédés lisibles par machine, y compris des métadonnées, et par le recours à des conditions générales d’utilisation » (11). Pour l’opposition via des procédés techniques, plusieurs outils existent (Robot.txt, AI.txt, TDMRep, …). En pratique, cela signifie que pour pouvoir scrapper les données des sites Internet à des fins d’entraînement des modèles, les fournisseurs de systèmes d’IA ne doivent pas contourner les éventuels dispositifs de protection existants (par exemple un accès restreint par un compte utilisateur) et doivent s’assurer, au moment de l’extraction des données, que les conditions générales d’utilisation (CGU) et/ou mentions légales du site Internet ne contiennent pas de clause interdisant l’extraction des données et que les métadonnées du site Internet n’expriment pas non plus une telle interdiction. L’AI Act confirme ce dernier point (12).
Lorsqu’un titulaire de droits s’est opposé à l’extraction de ses données, le fournisseur de système d’IA n’a d’autre choix que d’obtenir une autorisation expresse (13) au moyen d’un accord de licence ou de partenariat, comme ont récemment pu le faire OpenAI avec Le Monde, Die Welt et El País (14). Une fois ces vérifications opérées, le fournisseur de système d’IA devra suivre des étapes supplémentaires si le contenu qu’il souhaite « moissonner » contient des données à caractère personnel, afin de respecter le RGPD.

Base légale de l’intérêt légitime
Ces derniers mois, la Cnil a publié plusieurs fiches pour guider les fournisseurs de systèmes d’IA (15) au sein desquelles elle clarifie comment appliquer les principes clefs aux spécificités de l’IA. Elle y admet qu’il est possible de fonder les traitements d’entraînement des modèles d’IA sur la base légale de l’intérêt légitime, notamment lorsque les données sont collectées à partir de sources publiques (16), sous réserve de mener une analyse au cas par cas permettant de documenter la légitimité de l’intérêt poursuivi, sa nécessité et le fait qu’il n’y a pas d’atteinte disproportionnée aux intérêts, droits et libertés des personnes. Pour autant, en juin 2024, Noyb a porté plainte – auprès de onze « Cnil » en Europe – contre Meta dont il conteste la faculté de se fonder sur l’intérêt légitime pour récupérer les données de Facebook et Instagram afin d’entraîner ses modèles d’IA. Dans l’attente, Meta a stoppé son projet (17).
La première étape avant de scrapper des données à caractère personnel est de définir la finalité du traitement, à partir de laquelle l’analyse de conformité aux principes de protection des données personnelles pourra être réalisée. A partir de cette finalité (créer une base de données afin d’entraîner des modèles d’IA permettant d’évaluer l’appréciation d’œuvres par le public, développer un LLM capable de répondre à des questions, générer du texte, effectuer des résumés, etc,…), le fournisseur de modèles d’IA devra s’assurer du respect du principe de minimisation, en ne collectant que les données pertinentes et nécessaires pour atteindre son objectif. Concrètement, cela signifie qu’il doit s’interroger en amont sur les catégories de données nécessaires pour l’entraînement du modèle d’IA. En pratique, il devra définir les catégories de données à collecter et mettre en place des filtres permettant d’exclure la collecte de certaines données. Dans sa fiche dédiée au web scraping (18), la Cnil précise que dans l’hypothèse où des données non pertinentes seraient collectées malgré les filtres mis en place, il convient de supprimer ces données, immédiatement après leur collecte ou dès elles ont été identifiées. Elle appelle également à la prudence sur la collecte automatique de données sensibles en invitant les fournisseurs à appliquer des filtres permettant d’écarter la collecte de données sensibles (19) non pertinentes ou à exclure de leurs activités de scraping certains sites comportant par nature ce type de données.
Respecter le RGPD suppose, par ailleurs, d’informer les personnes concernées et de faciliter l’exercice de leurs droits. La Cnil reconnaît (20) qu’en cas de collecte parweb scraping, une information individuelle des personnes pourrait, dans certains cas, être disproportionnée et donc non obligatoire. Elle recommande alors au fournisseur du système d’IA de fournir une information générale (par exemple au sein de sa politique de confidentialité) contenant notamment les catégories de sites sources utilisés avec des liens hypertextes vers ceux-ci, en proposant un modèle dédié. Pour les droits des personnes, elle rappelle qu’un responsable du traitement n’a pas à conserver ou collecter des informations supplémentaires qui ne lui sont pas nécessaires dans le seul but de permettre l’exercice des droits. La Cnil propose néanmoins des exemples de mesures que les fournisseurs de modèles d’IA pourraient mettre en place pour faciliter l’exercice des droits (comme la conservation de métadonnées ou d’informations sur la source des données pour faciliter la recherche d’une personne au sein de la base ou l’indication aux personnes des données à fournir pour les identifier).
La Cnil propose enfin de mettre en place des mesures supplémentaires pour garantir l’équilibre attendu de ces traitements basés sur l’intérêt légitime. Certaines mesures découlant des règles précédemment citées semblent réalisables : exclure par défaut la collecte à partir de certains sites contenant des données intrusives ; prévoir la possibilité de s’opposer au traitement de manière discrétionnaire ; appliquer des procédés d’anonymisation ou de pseudonymisation après la collecte des données. D’autres semblent moins pragmatiques.

AI Office : recommandations très attendues
Certains acteurs pourraient ainsi saisir l’opportunité de remonter leurs questionnements, difficultés pratiques, appréciation des règles dans le cadre de la consultation publique à laquelle sont soumises certaines fiches jusqu’au 15 septembre 2024 (21) ou répondre au questionnaire (22). A l’aune de l’entrée en vigueur de l’AI Act, les fournisseurs de modèles d’IA à usage général attendront donc les précieuses recommandations et modèles du bureau de l’IA, tout récemment créé (23), sur les documents à produire pour les sources de données d’entraînement, afin de leur permettre d’engager les travaux nécessaires à la compilation de ces informations. @

La France revoit sa stratégie numérique culturelle

En fait. Le 11 juin, le ministère de la Culture a publié le bilan complet de sa démarche de « stratégie numérique culturelle » qui a duré deux ans (consultation publique et groupes de travail). Son « service du numérique » a identifié les défis à relever et un plan d’action alliant culture et numérique.

En clair. Le ministère de la Culture, passé en janvier 2024 sous la coupe de Rachida Dati (1), cherche à mettre en œuvre une nouvelle « politique culturelle » en tenant compte de l’« explosion des pratiques numériques », de la « transformation des formes de création », du « bouleversement des circuits de distribution », de la « modification des modèles économiques » ou encore des « difficultés à assurer un partage équitable de la valeur ». Par exemple, « les débats actuels autour des NFT, des technologies immersives et de l’intelligence artificielle montrent à quel point les nouveaux usages numériques interrogent ». C’est dans cet esprit que le rapport de la rue de Valois sur la « stratégie numérique culturelle » à mettre en œuvre a été publié le 13 juin dernier.
Ce document de 32 pages (2) assorti de huit fiches (3) pour un « plan d’actions » à mener (ou à poursuivre) d’ici fin 2024 et courant 2025, voire en 2026, a été élaboré durant deux ans par le « service numérique » (SNum) du ministère de la Culture. Ce SNum a été créé par un arrêté du 31 décembre 2020 (4) et, opérationnel depuis début 2021, est dirigé par depuis lors par Romain Delassus. En tant que « chef du SNum », il a tenu à souligner que « loin de vouloir construire un jardin à la française, ou de se positionner en donneur d’ordre vis-à-vis de l’écosystème culturel, l’objectif de cette démarche est au contraire de responsabiliser et d’aider chaque équipe et chaque établissement dans la construction de sa propre stratégie numérique ».

La première des huit actions consiste à « structurer l’écosystème de la création artistique en environnement numérique » sous la coordination des Drac (5). Et côté financement, le plan France 2030 permet notamment de « développer la production et la diffusion d’expériences immersives » : plateformes numériques, jeu vidéo, réalité virtuelle et augmentée, …
Edition Multimédi@ remarque au passage que ni le rapport ni les fiches n’utilisent le terme « métavers ». Signalons aussi le sixième objectif qui est de « bâtir un plan d’actions évolutif “intelligence artificielle culturelle” », dans le cadre de la Stratégie nationale pour l’IA (Snia) coordonnée par Guillaume Avrin à la DGE (6). Par ailleurs, deux rapports d’étape du CSPLA sur l’IA et le droit d’auteur sont attendus cet été, tandis qu’un appel à projets « France 2030 » sera lancé cette année pour « la transition des secteurs culturels [vers l’IA] ». @

Robots, crawlers, IA, … levée de boucliers en ligne

En fait. Le 18 juin, la société Clipeum a annoncé avoir le premier quotidien régional Ouest-France comme nouveau client de son outil Botscorner qui permet d’identifier robots, crawlers et IA génératives pour les faire payer. Selon nos informations, le CFC n’y fait plus appel, lui préférant Human Security.

En clair. Après avoir annoncé le 23 mai la signature avec Le Monde pour l’utilisation de son outils Botscorner destiné à repérer et à cartographier les robots de crawling (aspirateurs de sites web destinés à exploiter leurs contenus), la société Clipeum – dont le nom veut dire « bouclier » en latin – a annoncé le 18 juin un nouvel accord avec, cette fois, Ouest-France. Ces deux nouveaux clients rejoignent ainsi les nombreux éditeurs de presse en ligne en France – Le Figaro, Le Parisien, L’Equipe, Le Point, Challenges, L’Usine nouvelle, Libération ou encore L’Express – qui ont opté pour ce type de solutions – Botscorner, DataDome, Human Security (ex-White Ops), … – capables d’analyser le trafic entrant et d’identifier les robots (bots) absorbant leurs articles.
Selon les informations de Edition Multimédi@, le Centre français d’exploitation du droit de copie (CFC), qui a lancé en 2018 son « outil de régulation des robots de crawling » (ORRC), ne s’appuie plus sur Botscorner depuis fin 2023 mais sur Human Security, une société newyorkaise. Objectif pour l’éditeur de presse en ligne : analyser les logs des bots et crawlers arrivant sur leurs sites web et proposer des licences d’autorisation rémunératrices aux sociétés qui activent ces robots de crawling.

Ces exploitants de contenus journalistiques se nomment Meltwater – épinglé en 2022 par le CFC avant un accord en février dernier (1) –, Press Monitor, Netvibes (Dassault Systèmes), Access Intelligence, Emplifi, ou encore Feeder et Flipboard (2), ainsi que désormais des opérateurs d’IA génératives comme ChatGPT d’OpenAI ou Gemini de Google. « Botscorner permet aux éditeurs d’identifier les robots (media monitoring, intelligence artificielle, SEO (3), RSS (4), …) et leur fournit ainsi les informations B2B (5) nécessaires pour leur permettre de réguler l’accès à leurs contenus protégés par le droit d’auteur et de nouer d’éventuels contrats », a expliqué Yan Gilbert, directeur général de Clipeum.
Cela permet aussi d’écarter les bots malveillants et de protéger les contenus contre le scraping (moissonnage du Web) qui relève du piratage en ligne s’il n’y a pas d’accord. Durant son partenariat de six ans avec Clipeum/Botscorner, l’ORRC du CFC a bénéficié à plus d’une cinquantaine de sites web. Le CFC a aussi pu signer avec une vingtaine de crawlers français et étrangers des licences encadrant les prestations de veille web. @