L’Europe veut encadrer les algorithmes pour retirer les contenus illicites et éviter les « faux positifs »

Le futur règlement européen Digital Services Act (DSA) veut encadrer l’utilisation d’algorithmes dans la gestion des contenus sur les réseaux sociaux et d’en retirer ceux « jugés » illicites. Mais le risque de « faux positifs » (bloqués à tort) va poser des problèmes aux régulateurs et aux juges.

Par Winston Maxwell*, Telecom Paris, Institut polytechnique de Paris

Bloquer la publication d’un contenu est une décision grave, portant potentiellement atteinte à l’un des droits fondamentaux les plus importants pour la démocratie : la liberté d’expression. Pour la préserver, le droit constitutionnel américain et français exigent généralement qu’une décision interdisant la diffusion de contenus soit prise par une autorité judiciaire, et qu’elle le soit prise après la publication du contenu, non avant (1).

Blocage automatique : quelle légitimité ?
Les plateformes ne s’embarrassent pas de ces principes, filtrant des contenus avant leur publication par l’utilisation de robots. Faut-il s’en inquiéter ? S’agit-il d’une violation des droits fondamentaux des utilisateurs ? Le recours aux algorithmes pour identifier des contenus illégaux est devenu incontournable en raison de la quantité des informations publiées par les utilisateurs des réseaux sociaux. Même si la loi n’impose pas aux plateformes une obligation générale de surveillance des contenus, laquelle reste interdite (2), celles-ci ont mis en place des systèmes automatisés de détection de contenus illicites. Le champ d’application de ces outils s’est élargi grâce à l’émergence de modèles d’apprentissage automatique (machine learning), capables d’identifier des images et textes plus complexes, de comprendre le contexte d’une phrase ou d’une image, voire de juger de la véracité d’une affirmation.
Le futur règlement européen Digital Services Act (DSA) met en lumière les multiples rôles d’algorithmes dans la gestion de contenus sur les réseaux sociaux. Ces algorithmes identifient des contenus illicites et procèdent à leur retrait avec ou sans intervention humaine ; ils signalent l’existence d’utilisateurs potentiellement abusifs du service ; ils organisent la présentation de contenus et de publicités aux utilisateurs en fonction de leurs profils. Le règlement DSA propose d’encadrer l’utilisation d’algorithmes, surtout ceux utilisés pour retirer des contenus illicites. Les outils sont calibrés pour bloquer automatiquement, et sans intervention humaine, des contenus les plus manifestement illégaux. En cas de doute, la machine enverra le cas à des décisionnaires humains. Une grande partie des décisions de retrait de contenus sont aujourd’hui prises sans intervention humaine (3), ce qui soulève la question de leur légitimité et des garanties qui les entourent. Le DSA prévoit des garanties procédurales et de transparence similaires à celles qui existent pour les décisions prises par l’Etat. Le droit constitutionnel impose à l’Etat des règles contraignantes en matière de blocage de contenus illicites, alors que les plateformes, elles, ne sont pas directement concernées par ces contraintes constitutionnelles. Cependant, les plateformes dites « structurantes » ont un pouvoir quasi-étatique en matière de liberté d’expression. Il est donc logique d’étendre à ces plateformes les règles de transparence et de procédure qui s’appliquent aux décisions de l’Etat.
En 2018, les organisations de défense des droits civiques aux Etats-Unis ont élaboré des principes minimaux de transparence et de procédure équitable qui doivent s’appliquer aux décisions de retrait de contenus ou de suspension de comptes sur les réseaux sociaux. Appelés « Santa Clara Principles » (4), ces principes non-contraignants recommandent la publication par chaque plateforme numérique de données détaillées sur les alertes, les décisions de retrait et de suspension. Ils prévoient la notification aux utilisateurs affectés par les décisions de retrait, la publication de règles claires sur les types de contenus interdits sur la plateforme, la mention de raisons du retrait, la fourniture d’informations sur l’utilisation ou non d’un outil automatique, et une procédure efficace de contestation devant un décisionnaire humain différent de la personne qui a pris la décision initiale. Les Santa Clara Principles (SCP) reprennent, pour les adapter aux plateformes, une partie des règles constitutionnelles de « due process » aux Etats-Unis qui s’appliquent aux décisions, notamment algorithmiques, de l’Etat.

Le DSA va plus loin que les « SCP »
Le projet de règlement DSA rendrait contraignant un certain nombre des SCP, et notamment l’obligation d’informer l’utilisateur que son contenu a été retiré et de lui fournir une explication sur les raisons du retrait. La notification doit également mentionner l’utilisation éventuelle d’un outil automatique, et fournir des informations claires sur la possibilité de contester la décision. Le DSA exige une procédure efficace pour gérer les contestations d’utilisateurs, une procédure qui ne peut pas s’appuyer uniquement sur des moyens automatisés. Les utilisateurs peuvent donc contester un retrait devant un décisionnaire humain. Le DSA va au-delà des SCP en matière de transparence algorithmique, en exigeant la publication par les plateformes structurantes d’information sur les objectifs poursuivis par l’algorithme, les indices de performance, et les garanties entourant son utilisation.
Le projet de loi français sur le « respect des principes de la République », adopté par l’Assemblée nationale le 16 février dernier et actuellement examiné au Sénat (5), va plus loin encore en prévoyant la communication au Conseil supérieur de l’audiovisuel (CSA) des paramètres utilisés par les outils automatisés, des méthodes et des données utilisées pour l’évaluation et l’amélioration de leur performance.

Algorithmes, « faux positifs » et censure
La performance des algorithmes sera un sujet-clé pour le régulateur. Quel est le niveau acceptable de « faux positifs », à savoir des contenus bloqués à tort ? On sait que les tribunaux n’apprécient guère les faux positifs en matière de liberté d’expression (lire encadré ci-dessous) et qu’un algorithme d’apprentissage automatique va forcément générer des faux positifs. Le niveau de faux positifs dépendra notamment du niveau de sensibilité de l’algorithme dans la détection de « vrais » positifs, par exemple une vraie vidéo terroriste. Si l’on réduit le nombre de faux positifs, on va nécessairement réduire la sensibilité de l’algorithme dans la détection de vrais cas de contenus illégaux. Le bon équilibre entre les faux positifs et les faux négatifs sera un sujet délicat, et le niveau d’équilibre sera différent selon le type de contenus. Laisser passer la vidéo d’un acte terroriste du type Christchurch aura un coût très élevé pour la société, alors que laisser passer un morceau de musique protégé par le droit d’auteur sera a priori moins dommageable.
Les taux d’erreurs algorithmiques peuvent varier en fonction de la langue utilisée – un algorithme d’analyse de textes sera généralement plus performant en anglais – et peuvent également refléter les biais présents dans les données d’entraînement. Les algorithmes apprennent à partir des exemples de contenus retirés précédemment par les analystes humains. Ces analystes humains sont faillibles. Ils ont leur propre biais – biais culturels, linguistiques, ethniques, de genre – et commettent eux-aussi des erreurs d’appréciation qui seront reproduits ensuite par les algorithmes (6). Ainsi, il faut veiller non seulement au « bon » niveau de faux positifs et de faux négatifs selon le type de contenu, mais également vérifier que le niveau de perfor-mances de l’algorithme ne varie pas selon la couleur de la peau ou le sexe des personnes impliquées, selon la langue utilisée, ou selon le type de discours haineux (7). Ces multiples équilibres devraient être abordés dans un premier temps dans les études de risques systémiques conduites par les plateformes structurantes, en application de l’article 26 du futur règlement DSA en Europe. Ces études devront analyser l’impact des algorithmes d’identification et de retrait de contenus sur les droits fondamentaux. Ainsi, les plateformes devront proposer des solutions techniques et humaines pour concilier des objectifs – souvent contradictoires – liés à la mise en place d’un système de détection performant qui respecte en même temps la liberté d’expression, la protection des données personnelles et la protection contre les discriminations. Actuellement, le projet de règlement DSA prévoit que la Commission européenne sera le régulateur principal pour les plateformes structurantes. Celle-ci pourra émettre des recommandations relatives aux systèmes algorithmiques. Mais la manière de gérer les tensions entre la liberté d’expression et d’autres droits est avant tout une affaire nationale, dépendant du contexte, de l’histoire et de la culture de chaque pays (8).
En France, le CSA serait mieux placé que la Commission européenne pour évaluer les systèmes algorithmiques mis en place par les grandes plateformes pour analyser des contenus destinés au public français. Le paramétrage des algorithmes devra nécessairement refléter ces circonstances locales, et le contrôle de ces paramètres relèverait plus naturellement de la compétence du régulateur national. Un contrôle national de ces outils renforcerait en revanche le morcèlement des approches réglementaires entre Etats membres, et nécessiterait donc un système de coordination au niveau européen similaire à ce qui existe pour la régulation des télécoms et le RGPD. @

* Winston Maxwell, ancien avocat, est depuis juin 2019
directeur d’études Droit et Numérique à Telecom Paris.

FOCUS

Le droit est allergique aux surblocages
Le droit constitutionnel est peu tolérant aux « faux positifs » en matière de liberté d’expression. Les risques de surblocage ont été soulignés par la Cour suprême des Etats-Unis dans l’affaire « Reno c. ACLU » (9) dans les années 1990, et par la Cour de justice de l’Union européenne (CJUE) dans les affaires « Scarlet c. Sabam » (10) en 2011 et « Sabam c. Netlog » (11) en 2012. Ces deux dernières affaires concernaient la mise en place, à la demande d’un tribunal belge, d’un dispositif simple pour bloquer des contenus protégés par le droit d’auteur, s’appuyant sur un procédé de « hash » pour identifier les fichiers contrevenants.
La CJUE a considéré que ce procédé créait une atteinte disproportionnée à la protection des données à caractère personnel, mais également à la liberté d’expression en raison du risque de surblocage. L’outil serait incapable de détecter s’il s’agissait d’une citation, d’une parodie ou d’une autre utilisation permises par l’une des exceptions du droit d’auteur. Plus récemment, le Conseil constitutionnel a annulé deux dispositions de la loi française « Avia » (contre la cyberhaine) en raison du risque de surblocage de contenus « non manifestement illicites » (12). Pour des contenus faisant l’apologie du terrorisme, le Conseil constitutionnel a considéré que les injonctions de l’autorité administrative (13) ne constituaient pas une garantie suffisante et que les opérateurs de plateformes ne devaient pas suivre ces injonctions de manière automatique. @

Europe : les plateformes numériques visées sont préoccupées par le projet de régulation du Net

Les GAFAM sont les premiers concernés par les deux textes législatifs proposés le 15 décembre 2020 par la Commission européenne. Un mois après la publication de ce « paquet numérique » (Digital Services Act et Digital Markets Act), Edition Multimédi@ revient sur les réactions des acteurs du Net.

« Le diable sera dans les détails », a lancé Siada El Ramly (photo), directrice générale de Dot Europe (ex-Edima), lobby des GAFAM et d’autres. De son côté, Christian Borggreen, directeur de la CCIA Europe, où l’on retrouve aussi les géants du Net, dit en substance : « La réglementation numérique ne doit pas empêcher l’innovation numérique ». Tandis que DigitalEurope (ex-Eicta), également porte-voix de la high-tech dirigé par Cecilia Bonefeld-Dahl, estime que tout est question d’« équilibre entre la protection des droits fondamentaux et la prévention des activités illégales et nuisibles en ligne ».

Régime de responsabilité limitée en question
La présentation des projets de loi Digital Services Act (DSA) et Digital Markets Act (DMA) par la Commission européenne le 15 décembre dernier n’a pas laissé les Big Tech indifférentes. Lors d’un séminaire en ligne organisé le 17 décembre dernier par Dot Europe, sa directrice Siada El Ramly a prévenu : « Si elle est élaborée et mise en œuvre de la bonne façon, la loi sur les services numériques – le DSA – pourrait offrir un cadre plus robuste pour la modération du contenu en ligne. Il reste cependant beaucoup de détails à régler et le processus en est encore à un stade précoce ». Et la directrice de Dot Europe basée à Bruxelles de rappeler : « Il existe déjà une législation sur le contenu en ligne au niveau national et européen et il sera crucial que le DSA travaille de manière cohérente avec toutes les règles déjà en place. Les principes de la directive (européenne) sur le commerce électronique demeurent une base solide et importante pour l’élaboration de futures règles et nous devrions nous appuyer sur ses fondements avec la loi sur les services numériques ». Entrée en vigueur il y a vingt ans maintenant, la fameuse directive dite « E-commerce » assure aux plateformes numériques et aux réseaux sociaux un statut protecteur d’hébergeur qui leur accorde une responsabilité limitée dans les contenus stockés, partagés et/ou diffusés par leurs millions d’utilisateurs. Ainsi, les GAFAM et les autres acteurs concernés ne peuvent être tenus pour responsables des informations et contenus exploités par internautes qui utilisent leurs plateformes numériques – à moins que ces dernières n’aient pris connaissance du caractère illicite de ces contenus illicites et/ou piratés mais ne les aient pas  promptement retirés ou rendus inaccessibles. « En janvier 2020, nos membres ont demandé à la Commission européenne d’introduire un nouveau cadre de responsabilité en ligne pour leur permettre de mieux lutter contre le contenu illégal en ligne et nous sommes encouragés de voir que certains des points que nous avons soulevés ont été pris en compte dans le projet de DSA », a indiqué Dot Europe dès le 15 décembre.
Une des autres préoccupations concerne la transparence exigée concernant les algorithmes utilisés par les plateformes numériques, lesquelles seront tenues de divulguer les paramètres utilisés par ces règles opératoires dont l’application permet de résoudre un problème énoncé, comme le classement de produits et ou de services dans les résultats de recherche. « Nous avons certaines préoccupations en matière de sécurité concernant la possibilité d’exiger que les plateformes fournissent un accès direct à leurs algorithmes, a expliqué Siada El Ramly. La transparence peut être obtenue par de nombreuses façons différentes et le saut pour potentiellement forcer les entreprises à exposer leurs informations exclusives peut être disproportionné ».
Les GAFAM auront l’obligation de donner aux autorités qui le demandent un accès à leurs algorithmes, comme l’avait justifié en octobre dernier Margrethe Vestager, viceprésidente exécutive de la Commission européenne, chargée de la Concurrence : « Nous ne pouvons pas laisser les décisions qui affectent l’avenir de notre démocratie être prises dans le secret de quelques conseils d’administration d’entreprises ». Intervenant lors d’un événement organisé par AlgorithmWatch (3), la Danoise a prévenu les grandes plateformes qu’elles devront fournir aux régulateurs demandeurs plus d’informations sur le fonctionnement de leurs algorithmes.

Trop de régulation tue l’innovation
L’organisation Dot Europe, qui représente les GAFAM (Google, Amazon, Facebook, Apple et Microsoft) ainsi que TikTok, Spotify, Snap, Twitter, eBay, Verizon Media, King, Airbnb, Expedia, Mozilla, Allegro, Etsy ou encore Yelp, ne se focalise pas seulement sur le DSA (4), axé sur les contenus (lutter contre la cyberhaine, la désinformation et tout contenu illicite), mais aussi sur le DMA (5) qui veut imposer à la dizaine de grandes plateformes numériques dites « systémiques » (dont les GAFAM) des contraintes antitrust et empêchant les abus de position dominante de certains écosystèmes. L’association américaine CCIA (Computer and Communications Industry Association) a, elle aussi, réagi dès le 15 décembre avec notamment un semblant de pointe d’ironie : « Nous espérons que les futures négociations viseront à faire de l’Union européenne un leader en matière d’innovation numérique, et pas seulement en matière de réglementation numérique ».

Des amendes jusqu’à 10% du chiffre d’affaires
Basée à Washington, la CCIA – vétérane de la high-tech (créée en 1972) – dispose aussi à Bruxelles d’un bureau qui veille au grain. « Une réglementation solide et fondée sur des données probantes jouera un rôle essentiel pour encourager l’innovation, les investissements et le choix des consommateurs en Europe », prévient Christian Borggreen, directeur de la CCIA Europe basée aussi à Bruxelles, tout en se « réjouiss[ant] à la perspective de travailler avec les décideurs politiques de l’Union européenne pour veiller à ce que les propositions atteignent les objectifs énoncés, afin que les Européens continuent de récolter tous les avantages des produits et services numériques ».
La CCIA, dont sont membres les GAFA (sauf Apple) aux côtés de Twitter, Pinterest, Rakuten, eBay, Uber et d’autres, relève que le projet de loi européen sur les marchés numériques – le DMA (6) – vise à cibler les services de base des « gatekeepers » numériques en restructurant leurs relations avec les utilisateurs commerciaux et en imposant de nouvelles modalités et obligations (lesquelles pourront évoluer et être étendues). Le DMA menace aussi de sanctionner ces grandes plateformes du Net en cas d’infraction à ces nouvelles règles européennes : « Des sanctions structurelles et comportementales [seront] imposées en cas de non-respect, y compris des amendes pouvant atteindre 10 % du chiffre d’affaires annuel global d’une entreprise ». Dans le même esprit, le projet de loi européen sur les services numériques – le DSA (7) – impose des obligations de réactivité raisonnable (due diligence obligations) aux plateformes en ligne. Il introduit également un régime spécifique pour les « très grandes plateformes en ligne » (à partir de 45 millions d’utilisateurs actifs dans l’Union européenne), qui devront se conformer à des obligations supplémentaires telles qu’en matière de transparence stricte et de déclaration, de vérifications annuelles, de divulgation des principaux paramètres utilisés dans leurs systèmes de recommandation (dont les algorithmes) et la nomination d’un agent de conformité. Là aussi la CCIA retient que les amendes peuvent atteindre 6% du chiffre d’affaires annuel en cas de non-conformité. « Nous appuyons les efforts visant à encourager l’innovation et une concurrence efficace. Nous espérons que la loi finale ciblera les comportements problématiques plutôt que la taille de l’entreprise », a déclaré Kayvan Hazemi-Jebelli, un ancien du cabinet d’avocats Hogan Lovells, conseil depuis plus d’un an de la CCIA à Bruxelles en matière concurrentielle et réglementaire. « Le DMA introduirait de nouvelles règles de définition du marché régissant les services de base des plateformes. Dans ces marchés numériques en évolution dynamique, le risque de législation contre-productive est élevé. Nous espérons que le résultat final sera bon pour les consommateurs de l’Union européenne, les utilisateurs commerciaux et l’écosystème numérique dans son ensemble », a-t-il fait valoir. Concernant le DSA, cette fois, la CCIA espère ce que les Européens continueront à bénéficier de tous les avantages économiques et sociaux des services numériques. « Toute nouvelle obligation doit être réalisable et proportionnée aux risques connus. La création d’un régime spécifique axé sur les “très grandes plateformes en ligne” risque de pousser par inadvertance le contenu et les produits illégaux vers les petits fournisseurs de services numériques », met en garde Victoria de Posson, directrice des affaires publiques de la CCIA Europe.
Quant à l’association DigitalEurope, également installée à Bruxelles et représentant les GAFAM ainsi que Samsung, Huawei, Sony, Nvidia ou encore Dropbox, elle plaide pour une réglementation de l’Internet qui soit « un équilibre entre la protection des droits fondamentaux comme la liberté d’expression et la vie privée, d’un côté, et la prévention des activités illégales et nuisibles en ligne, de l’autre ». Sa directrice générale, Cecilia Bonefeld-Dahl, appelle l’Union européenne à « exploiter au maximum les outils de concurrence existants avant d’envisager l’introduction de nouveaux mécanismes susceptibles d’entraver l’innovation et l’entrée sur le marché ».

Google se sent visé ; Facebook tacle Apple
Membre de ses trois lobbies européens, Google – la filiale d’Alphabet – a fait part de ses inquiétudes vis-à-vis du DSA et du DMA. « Nous sommes préoccupés par le fait que les propositions faites par la Commission européenne semblent cibler spécifiquement une poignée d’entreprises et rendre plus difficile le développement de nouveaux produits pour soutenir les petites entreprises en Europe », a déclaré Karan Bhatia, directeur des affaires publiques et réglementaires de Google. Un porte-parole de Facebook en a profité, quant à lui, pour s’en prendre à la marque à la pomme : « Nous espérons que le DMA fixera également des limites pour Apple. Apple contrôle tout un écosystème, d’un appareil à l’autre et utilise ce pouvoir pour nuire aux développeurs et aux consommateurs, ainsi qu’aux grandes plateformes comme Facebook ». Ambiance. @

Charles de Laubier