Après ChatGPT, les robots conversationnels se bousculent sur le marché de l’IA générative

Les chatbots conversationnels se bousculent au portillon, dans le sillage de ChatGPT. La concurrence s’organise sur marché mondial qui annonce des chamboulements colossaux dans les moteurs de recherche sur Internet, encore dominés par Google. Plus pour longtemps.

Après ChatGPT que la start-up américaine OpenAI – dirigée par son cofondateur Sam Altman (photo) – a lancé le 30 novembre 2022 (1) avec un succès médiatique sans précédent, Bard tente de se lancer à sa poursuite après avoir été annoncé le 6 février dernier par Google mais réservé encore quelques semaines à un nombre limité de happy few testeurs (2). Le lendemain, Microsoft – qui a investi des milliards de dollars dans OpenAI – a annoncé la mise en test dans son moteur de recherche Bing (3) du modèle de traitement du langage naturel utilisé par ChatGPT (Generative Pre-trained Transformer). Et ce n’est pas fini.

La bataille des IA génératrices fait rage
Le 24 février, c’est au tour de Meta de lancer son LLaMA – à des fins de tests également (4). Trois jours après, il est question que Elon Musk – lequel a été un des cofondateurs d’OpenAI – se lance lui aussi dans la course à l’IA générative (5). Au même moment, à savoir le 27 février, Snap y va aussi de son robot conversationnel (chatbot) qui répond au nom de « My AI », également disponible à titre expérimental (6). Toutes ces initiatives ne sont que la face émergée de l’intelligence artificielle conjuguée aux traitements de langage naturel et à l’exploitation de mégabases de données, lorsque que l’IA générative n’est pas aussi connectée au Web (7). Il existe bien d’autres IA créatrices, telles que : Dall.E 2, développée par OpenAI, pour créer des images et des œuvres d’art originales et réalistes à partir d’une description textuelle ; Stable Diffusion, développée par Stability AI, en tant que modèle d’apprentissage automatique (deep learning), permettant de générer des images numériques réalistes à partir de descriptions en langage naturel ; Midjourney, développée par le laboratoire de recherche éponyme, aussi une IA générative conçue pour générer des images à partir de texte ; Cedille, un modèle de génération de texte francophone développé par la société suisse Coteries (8).
Pour conforter son avance, OpenAI a lancé le 1er mars une interface de programmation (API) pour faciliter partout l’intégration de ChatGPT et de Whisper (voix à texte). Textes, photos, vidéos, musiques, … Les IA génératrices s’immiscent dans tous les domaines et cela ne date pas d’hier. Par exemple, la nouvelle musique « des Beatles » baptisée « Daddy’s Car » avait fait sensation en septembre 2016 sur YouTube (9). Or, en réalité, ce titre a été composé par l’équipe « Musique et IA » du laboratoire Sony CSL (10). Il a été créé dans le style des Beatles par le scientifique François Pachet et le musicien Benoît Carré akaSkygge (« ombre » en danois) à l’aide de Flow Machines, une IA « mélomane » (11). Avec elle, ils ont créé en 2018 un album intitulé « Hello World ». François Pachet est aujourd’hui directeur chez Spotify en charge du « développement de la prochaine génération d’outils de composition musicale assistée par IA ».
L’industrie musicale va être bousculée, tout comme l’industrie de l’édition (livre et presse). Le cinéma n’y échappera pas non plus (scénarios et séries). Toutes les industries culturelles et créatives seront impactées, avec les questions de droit d’auteur et de propriété intellectuelle que cela soulève. Par exemple, l’agence photo américaine Getty Images (également banque d’images) a annoncé le 17 janvier porter plainte contre Stability AI (l’éditeur de Stable Diffusion) pour lui avoir « illégalement copié et traité des millions d’images protégées par le droit d’auteur et les métadonnées associées » (12). Plus récemment, le 21 février, le Copyright Office américain a conclu que les images de la bande dessinée « Zarya of the Dawn » créées par l’IA Midjourney, ne peuvent pas être protégées par le droit d’auteur (13). Quant aux « deepfake », ces vidéos hyperréalistes truquées à l’IA, elles commencent pour certaines à poser problème (14). La Chine vient de les interdire (15). La justice commence à faire bouger les lignes (16) et l’Union européenne s’apprête à promulguer son règlement « Artificial Intelligence Act » (17) pour réguler les systèmes d’IA « à haut risque ». Cela irait dans le sens de Brad Smith, président de Microsoft, pour qui « une réglementation efficace en matière d’IA devrait être axée sur les applications les plus à risque ».

Aussi pour des entreprises plus « intelligentes »
Il y a encore peu d’études sur cette vague innovante de création automatique de contenus. Le marché mondial de l’IA générative pourrait être multiplié par dix d’ici la décennie en cours, pour dépasser en 2030 les 100 milliards de dollars. « D’ici 2025, nous nous attendons à ce que plus de 30 % – contre zéro aujourd’hui – de nouveaux médicaments et de nouveaux matériaux soient systématiquement découverts à l’aide de techniques d’IA génératives. Et ce n’est là qu’un des nombreux cas d’utilisation par l’industrie », prévoit Brian Burke, vice-président de la recherche en innovation technologique au sein du cabinet d’études Gartner. @

Charles de Laubier

Tout en justifiant son soutien à la directive « Copyright », Qwant prépare une grosse levée de fonds et vise la Bourse

Slogan de Qwant : « Le moteur de recherche qui respecte votre vie privée » – … « et le droit d’auteur », rajouteraiton depuis que son PDG Eric Léandri soutient la directive « Droit d’auteur » – adoptée le 26 mars. Mais il se dit opposé au filtrage du Net. Côté finances, le moteur de recherche veut lever 100 millions d’euros et vise la Bourse.

Qwant, société franco-allemande dont le capital est détenu majoritairement par son PDG fondateur Eric Léandri (photo), à 20 % par la CDC et à 18,4 % par le groupe de médias allemand Axel Springer (1), cherche d’abord à lever 30 millions d’euros de cash dans les deux mois. Objectif : accélérer le développement de ses plateformes. « Nous sollicitons des investisseurs, tandis que nos actionnaires CDC et Axel Springer nous suivent. Ensuite, nous irons vers une vraie belle augmentation de capital d’ici la fin de l’année ou début 2020, avec une levée de fonds à 100 millions d’euros », indique Eric Léandri à Edition Multimédi@. Avec une introduction en Bourse à cette occasion ? « Allez savoir… Rien n’est fermé ! Pour cela, vous avez des obligations d’être propre au niveau comptable », nous a-t-il confié. Concernant le financement de 25 millions d’euros consenti par la Banque européenne d’investissement (BEI) en octobre 2015, le solde a finalement été entièrement versé en 2018. Le renforcement financier de Qwant prend du temps, l’explication de son soutien à la directive européenne « Droit d’auteur dans le marché unique numérique » aussi ! Eric Léandri ne cesse de devoir justifier son choix – mais en assurant qu’il est contre les robots de filtrage automatisé que permet l’article 13 (devenu 17) de cette directive adoptée le 26 mars.

Liberté de l’Internet versus presse indépendante ?
 « Il fallait que la directive “Droit d’auteur” soit votée pour que la presse finisse par être indépendante et libre. Sinon, d’ici trois ans, il n’y aura plus de journaux, sauf quelques-uns financés par des géants et des journalistes payés au lance-pierre. Et sans presse, un moteur de recherche n’est pas capable de vous donner autre chose que les résultats de l’Internet », nous explique-t-il. D’un côté, il est salué par le ministre de la Culture, Franck Riester, pour « a[voir]annoncé le 20 mars son engagement en faveur de la directive “Droit d’auteur” ». De l’autre, il est critiqué pour avoir appelé à voter pour un texte qui déroule le tapis rouge aux robots filtreurs au profit des  ayants droits mais – potentiellement – au détriment de la liberté d’expression et des droits fondamentaux.
« Je ne mets pas en balance la liberté de l’Internet contre la liberté des auteurs et ayants droit, nous assure Eric Léandri. Je dis que ce n’est pas des robots filtreurs qu’il faut mettre devant les sites web ».

« Précédent démocratiquement redoutable »
Et le PDG de Qwant de mettre en garde les industries culturelles : « Si c’est le filtrage généralisé que veulent nos amis les ayants droits, ils vont se retrouver en conflit avec d’autres dispositions européennes qui l’interdisent (4) ». Pour un moteur de recherche européen « qui protège les libertés de ses utilisateurs », mais qui ouvre la boîte de Pandore à la légalisation du filtrage généralisé sur « un Internet libre » dont il se revendique pourtant comme un de ses fervents « défenseurs », c’est pour le moins troublant. Le paradoxe de Qwant a de quoi désorienter les internautes qui, à raison
de 70 millions de visites par mois atteintes à ce jour par cet « anti- Google », ont généré en 2018 plus de 18 milliards de requêtes, contre 9,8 milliards en 2017. Le moteur de recherche franco-allemande ne cesse de vanter son modèle avec « zéro traceur publicitaire », son PDG allant jusqu’à présenter son moteur de recherche comme « la Suisse de l’Internet ». Cela ne l’empêche pas d’aller dans le sens du risque énorme pour le Web – 30 ans cette année (5) – de voir se généraliser les robots pour surveiller les contenus de ses utilisateurs.
Pour éviter d’en arriver là, tout va maintenant se jouer lors de la transposition dans chaque pays européen de cette directive « Droit d’auteur » et de son article 13 (devenu 17), lequel (6), concède Eric Léandri, « est écrit avec les pieds » ! « Battons-nous pour mettre en place un site web, totalement open source de base de données globale partagée des auteurs, interrogeable à tout moment, qui est le contraire d’un filtre. Car si l’on généralise par exemple Content ID de YouTube, qui récupérera alors les adresses IP des internautes, cela entre là aussi en contradiction avec toutes les lois européennes – dont le RGPD (7) exigeant le consentement préalable des visiteurs. Cela ne passera pas », prévient-il. Le PDG de Qwant affirme n’être ni « anti-droit d’auteur » ni « pro-GAFA ». Dans un droit de réponse en juillet 2018, sa société mettait tout de même
en garde : « L’article 13 [le 17] créerait de notre point de vue un précédent démocratiquement redoutable » (8). Guillaume Champeau (photo de droite), l’ancien journaliste fondateur et dirigeant de Numerama, devenu il y a deux ans et demi directeur « Ethique et Affaires juridiques » de Qwant, ne disait pas autre chose sur le blog de l’entreprise en juin 2018 : « [L’article 13 devenu 17]exigera des plateformes qu’elles implémentent des méthodes de filtrage automatisées. (…) Ceci aura un impact sur la liberté d’expression » (9). Et il sait de quoi il parle, lui qui fut l’auteur d’un mémoire universitaire en 2015 intitulé « Les intermédiaires de l’Internet face aux droits de l’homme : de l’obligation de respecter à la responsabilité de protéger ». Tristan Nitot, ancien dirigeant de Mozilla Europe devenu il y a près d’un an vice-président
« Advocacy, Open Source & Privacy » de Qwant, se retrouve lui-aussi en porte-à-faux après l’adoption de la directive « Copyright ». Ces deux dirigeants ont forgé ces dernières années leur réputation sur la défense des droits fondamentaux sur un Internet ouvert et neutre. Vont-ils démissionner pour autant ? « Démissions ? Non, il y a aucune démission en perspective, nous répond Eric Léandri. Ils veulent maintenant trouver des solutions. Il n’est pas question de démissionner devant des lois qui ne me conviennent pas vraiment, mais qui empêchent les uns (grands) d’écrabouiller les autres (petits) ». Dans un tweet posté juste après le vote des eurodéputés en faveur de la directive
« Copyright » (lire p.3), le directeur « Ethique et Affaires juridiques » de Qwant ne s’avoue pas vaincu pour autant : « Maintenant que la #CopyrightDirective a été adoptée, nous devons travailler ensemble pour créer les outils libres et ouverts dont nous aurons besoin (y compris une base de données ouverte de signatures d’oeuvres protégées). L’article 13 [le 17] ne devrait pas être appliqué sans ceux-ci ! ». Ce projet de serveur centralisé en laisse perplexes plus d’un (10) (*). Cette solution de la dernière chance a pour but d’éviter non seulement les robots filtreurs mais aussi de recourir aux technologies propriétaires d’identification des œuvres, telles que Content ID (11) ou à Rights Manager de Facebook. Et le PDG de Qwant d’assurer à Edition Multimédi@ :
« Ma proposition règle tous les problèmes et n’entre en conflit avec aucun autre règlement. Qwant financera cette plateforme, non exclusive, que l’on mettra à disposition courant avril. Ce site aura une capacité à gérer des milliards de photos [y compris vidéos, musiques et textes, ndlr]. Nous mettrons aussi les technologies open source à disposition pour que cette base puisse être dupliquée partout en Europe ».

« Mission d’étude » Hadopi-CNC-CSPLA
Mais quid du reste du monde au regard de l’Internet sans frontières ? Reste à savoir
s’il ne s’agira pas d’une usine à gaz. Qwant n’ira pas voir lui-même tous les éditeurs de contenus ; ce sont eux qui les déposeront dans la base d’indexation pour les protéger. L’Hadopi, le CNC et le CSPLA ont lancé le 1er avril « une mission conjointe d’étude et de propositions sur les outils de reconnaissance des contenus protégés sur les plateformes ». @

Charles de Laubier

Rêve de Robots

Aujourd’hui est un jour particulier au boulot. Une matinée consacrée à l’accueil d’un nouveau collaborateur. En principe, pas de quoi se relever la nuit. Sauf que cette fois-ci, je ne suis pas le seul à être sur les dents. La curiosité de toute l’équipe est, depuis des semaines, mise à rude épreuve car notre nouveau collègue est un robot.
Un robot de bureau multi-tâches venant épauler notre petite entreprise, autant pour nous aider dans les tâches répétitives que pour les travaux d’experts qu’il maîtrise, qu’il apprend ou qu’il acquiert sur le réseau. Et le soir, quand tout le monde est parti, il continue de travailler tout en assurant la télésurveillance de notre bâtiment. Je vous dois de préciser que nous sommes loin d’être des pionniers et que notre investissement, bien réfléchi, s’inscrit dans un mouvement d’équipement des entreprises qui adoptent de plus en plus ces assistants d’un nouveau genre. Nous voici partie prenante de cette nouvelle phase majeure du développement de la robotique professionnelle, qui, avec la « cobotique », conduit de nombreuses entreprises à faire cohabiter humains et robots. Quel chemin parcouru depuis Unimate, ce premier robot industriel intégré aux lignes d’assemblage de General Motors en 1961. Les robots ont rapidement colonisés les sites industriels à partir des années 1980, jusqu’à représenter un parc de plus de 1 million de machines dans le monde dès 2012. La plupart sont issus des lignes de production des leaders ABB, Fanuc Robotics, Kuka ou Motoman, destinés à doper la productivité des usines. Ce qui n’a pas été sans provoquer d’importantes tensions sur l’emploi des ouvriers confrontés à cette concurrence, alors même qu’il fallait se battre sur le front des bas salaires des économies émergentes.

« Ce peuple de machines intelligentes trône
désormais au sommet d’une nouvelle espèce
composée de myriades d’objets communicants. »

Ce second âge de la robotique se caractérise par une large prolifération de ces
machines polyvalentes et professionnelles au sein des ateliers des PME, grâce à
une programmation facile et un prix accessible. Ce fut le cas des bras articulés et commercialisés avec succès dès 2008 par la start-up danoise Universal Robots.
Les activités tertiaires ont suivi. A tel point que le taux d’automatisation de l’industrie
et des services devrait franchir le seuil des 50 % avant 2030. Mais l’une des conséquences les plus importantes est la relocalisation des fonctions de production
au plus près des zones de consommation, sous la pression de l’explosion des coûts
de transport mais aussi grâce aux nouvelles possibilités permises par ce que l’on appelle la « robocalisation » : la robotisation des entreprises comme moyen de faire revenir en Europe des emplois industriels.

Le plus marquant est sans doute le succès des robots personnels qui envahissent également notre vie quotidienne : robotique des transports, robotique médicale, robotique rééducative grâce à des prothèses intelligentes et des exosquelettes. Nos robots compagnons assurent désormais les tâches domestiques, la surveillance mais également des jeux ou des séances d’éducation. Parfois maladroitement humanoïdes, ils prennent des formes multiples, lorsqu’ils ne sont pas invisibles. Ce peuple de machines intelligentes trône désormais au sommet d’une nouvelle espèce composée de myriades d’objets communicants. La croissance de ce nouveau marché a été au rendez-vous, multiplié par 30 en dix ans. Entre 2013 et 2016, 22 millions de robots de tout type furent commercialisés. La plus grande part, plus de 15 millions, sont des robots domestiques (aspirateurs, tondeuse, nettoyeurs de fenêtre, …), le reste étant dédié au jeu, l’éducation et à la recherche. Pour ne pas être en reste, la France lança en 2013 une politique ambitieuse en vue de se classer parmi les 5 premiers pays mondiaux. Les trois premiers étaient d’ores et déjà bien connus : le Japon, la Corée
et les Etats-Unis. La même année, Google a de son côté essayé d’organiser cet écosystème complexe avide de data, en multipliant des acquisitions de start-up.
Cette évolution d’une humanité complétée d’un double mécanique, rêvée depuis l’Antiquité et prenant forme avec les premiers automates au XVIIIe siècle, est l’une des composante clés de notre siècle, avec sa face inquiétante décrite dans de si nombreux romans d’anticipation, et qui donne toute sa saveur à ce mot de Jacques Prévert : « Le progrès : trop robot pour être vrai ». @

Jean-Dominique Séval*
Prochaine chronique « 2025 » : Le mobile.
* Directeur général adjoint de l’IDATE,
auteur du livre « Vous êtes déjà en 2025 »
(http://lc.cx/b2025).