Pinterest, le moteur de découverte visuelle devenu rentable, se fait moins discret avec l’IA

Créé il y a 15 ans, le petit réseautage de photos et d’images Pinterest fait des envieux : il a atteint les 570 millions d’utilisateurs actifs mensuels, en hausse de 10 % sur un an. Devenue très rentable en 2024, la plus discrète des « très grandes plateformes » mise sur l’IA pour mieux « monétiser ».

Pinterest affiche une santé insolente et une audience presque digne d’un Gafam : au mois de mai, la plateforme d’images et de photos à découvrir a atteint un record de fréquentation, avec 570 millions d’utilisateurs actifs mensuels. Cela correspond à une hausse de 10 % sur un an – et même 23 % sur deux. La monétisation de cette audience, mesurée selon l’indicateur ARPU (1) très surveillé par le PDG Bill Ready (photo) et consolidé par trimestre, a été de 1,52 dollars au premier trimestre 2025, en hausse de 5 % sur un an). Il peut dépasser les 2 dollars comme au dernier trimestre 2024 (à 2,12 dollars précisément).

Toujours imité, jamais égalé, même par Google
Les revenus pris en compte pour le calcul de l’ARPU proviennent principalement des activités en ligne des utilisateurs (génératrices de recettes), telles que les interactions avec des publicités ou des contenus sponsorisés – sur la base du coût par clic (CPC), du coût par mille impressions (CPM), du coût par jour (CPJ) ou, pour les vidéos, du coût par vue (CPV). Et 15 ans après sa création, la rentabilité est au rendez-vous : l’an dernier, Pinterest est devenu pour la première fois rentable en affichant son premier bénéfice net, à 1,86 milliard de dollars, pour un chiffre d’affaires de 3,64 milliards de dollars, en hausse de 19 %. Cotée en Bourse depuis avril 2019, l’ex-licorne (2) basée à San Francisco (California) a une capitalisation (3) de 21 milliards de dollars (au 30-05-25). La montée en puissance de Pinterest a toujours inquiété (suite) Facebook, dont la maison mère Meta Platforms tente de donner la réplique avec Instagram, son réseau social de partage de photos et de vidéo – racheté en 2012 pour 1 milliard de dollars, soit deux ans après le lancement de Pinterest. Facebook a même lancé en 2017 la fonction « Collections », façon Pinterest.
De nombreux autres – Fancy, We Heart It, Juxtapost, Wanelo, Svpply, Etsy, Lemon8 ou encore lancés récemment Cosmos (2023) et MyMind (2024) – ont tenté d’imiter le pionnier de l’épingle – « to pin », en anglais – permettant de constituer des tableaux virtuels d’images et de photos en fonction de ses centres d’intérêt (décoration, voyages, mode, cuisine, …). Amazon avait aussi lancé en 2013 la fonctionnalité « Collections », mais l’a rapidement abandonnée. En revanche, Google essaie depuis une dizaine d’année de concurrencer Pinterest. Cela a commencé par « Google+ Collections » lancé en 2015, toujours pour permettre aux utilisateurs de créer des collections d’images thématiques et de les partager, mais fermé en avril 2019 faute d’engagement du public notamment. De même, la fonction « Save » sur Google Images a été discrètement supprimée. Mais la filiale d’Alphabet a persévéré : en juin 2020, l’application Google Keen – créée par incubateur Area 120 de Google (4) – est lancée comme une plateforme sociale « expérimentale » inspirée de Pinterest et automatisée par l’IA pour les recommandations. Près de quatre ans après, rideau ! La plateforme Staykeen.com est fermée, avec ce message de fin : « Jusqu’à la prochaine fois » (5)…
Le géant mondial des moteurs de recherche… chercherait toujours la killer-application de Pinterest, si l’on en croyait le site The Information, lequel s’attendait le 12 mai (6) à ce que la conférence Google I/O en mai 2025 soit l’occasion pour Google de lancer un nouveau service de sauvegarde et de regroupement d’images en albums ou dossiers. Mais le PDG de la firme de Mountain View, Sundar Pichai, n’a finalement pas annoncé son nouveau « Pinterest ». Le réseau social aux tableaux épinglés, que PayPal avait songé acquérir pour 45 milliards de dollars, d’après Bloomberg (7) en octobre en 2021, a fait un pied-de-nez à Google en juin 2022 en débauchant son « président du commerce, des paiements et du prochain milliard d’utilisateurs » (8), Bill Ready (de son vrai prénom William), pour être PDG (9). Pinterest a depuis renforcé sa monétisation grâce au e-commerce. « Notre modèle d’IA multimodale propriétaire est 30 % plus susceptible de repérer et de recommander du contenu pertinent. […] notre Taste Graph a augmenté de 75 % au cours des deux dernières années », a indiqué ce dernier lors d’une conférence téléphonique le 8 mai dernier.

Europe : obligations vis-à-vis du DSA
Pas facile de rattraper en pleine accélération « IA » le moteur de découverte visuelle créé par Paul Sciarra et Ben Silbermann (ex-PDG, depuis président exécutif), devenu « très grande plateforme » aux yeux de la Commission européenne depuis qu’elle l’a désigné comme tel le 25 avril 2023 au regard du Digital Services Act (DSA) – au même titre que les Gafam et d’autres comme TikTok, Snapchat ou encore l’ex-Twitter (10). En Europe, Pinterest revendique au 31 mars 2025 pas moins de 148 millions d’utilisateurs actifs mensuels, soit 26 % des 570 millions dans le monde. Mais la plateforme n’en a déclaré le 11 avril (11) que 81,1 millions dans l’UE. @

Charles de Laubier

La bataille des IA génératives d’images et de vidéos s’exacerbe, avec les Etats-Unis en force

Après deux ans de bataille des IA génératives textuelles, déclenchée fin novembre 2022 par ChatGPT d’OpenAI, l’année 2025 s’annonce comme celle des IA génératives d’images et de vidéos. Edition Multimédi@ passe en revue une sélection de concurrents, tous d’origine américaine. Mais les chinois sont en embuscades.


Grok
Pays d’origine : Etats-Unis
Propriétaire : xAI (Elon Musk)
Lancement : novembre 2023
Générateur de textes et d’images
https://x.ai/grok, https://x.com/i/grok
Disponibilité : gratuit depuis le 14-12-24
Accessible en France : oui
Remarque : Grok est développé par la start-up xAI créé en juillet 2023 par le milliardaire Elon Musk (cofondateur d’OpenAI qu’il a quitté en 2018). En plus de générer du texte, Grok peut aussi faire de même en créant des images réalistes grâce à son modèle text-to-image Aurora.


Sora
Pays d’origine : Etats-Unis
Propriétaire : OpenAI (Sam Altman)
Lancement : février 2024
Générateur de vidéo ultraréalistes
https://openai.com/sora, https://sora.com
Disponibilité : payant dans ChatGPT Plus et Pro
Accessible en France : non
Remarque : Sora est un modèle de type text-to-video développé par OpenAI, déjà à l’origine de ChatGPT, lequel intègre Sora depuis début décembre 2024 via les abonnements payants ChatGPT Plus et ChatGPT Pro. Sora signifie en japonais « ciel » (potentiel illimité). (suite)


Dall-E
Pays d’origine : Etats-Unis
Propriétaire : OpenAI (Sam Altman)
Lancement : janvier 2021
Générateur d’images
https://openai.com/index/dall-e-3, https://chatgpt.com
Disponibilité : gratuit (limité) et payant (au-delà)
Accessible en France : oui
Remarque : Dall-E est le pionnier du text-to-image grand public, développé par OpenAI (ChatGPT). Sa version actuelle, Dall-E 3, est disponible depuis septembre 2023, intégrée depuis dans ChatGPT via les abonnements payants ChatGPT Plus et Enterprise.


Gen (Gen-2, Gen-3)
Pays d’origine : Etats-Unis
Propriétaire : Runway AI
Lancement : février 2023
Générateur de vidéos
https://runwayml.com, https://app.runwayml.com
Disponibilité : gratuit (limité) et payant (au-delà)
Accessible en France : oui
Remarque : La start-up newyorkaise Runway AI a été créée en 2018 par les Chiliens Cristóbal Valenzuela et Alejandro Matamala, ainsi que par le Grec Anastasis Germanidis. Ses modèles sont de type text-to-video et video-to-video, utilisés notamment par des producteurs de films.


Firefly
Pays d’origine : Etats-Unis
Propriétaire : Adobe
Lancement : mars 2023
Générateur d’images, de vidéos et d’audio
https://firefly.adobe.com
Disponibilité : gratuit (limité, sur inscription) ou payant (entreprises)
Accessible en France : oui
Remarque : Abobe, éditeur des logiciels de création Photoshop, Acrobat, Illustrator et Premiere Pro, a lancé la première version de Firefly en mars 2023. Le modèle text-to-video a été lancé en octobre 2024 en version bêtapublique limitée (sur inscription en liste d’attente).


Midjourney
Pays d’origine : Etats-Unis
Propriétaire : Midjourney
Lancement : juillet 2022
Générateur d’images
https://www.midjourney.com/explore
Disponibilité : payant (abonnements)
Accessible en France : oui
Remarque : La start-up californienne Midjourney a été créée par David Holz. La version actuelle, la V6.1, a été lancée fin juillet 2024. Le mois suivant, elle a été rendue accessible à partir du Web et non plus seulement à partir de Discord comme auparavant.

Se sont aussi jetés dans la bataille du text-to-image et du texte-to-video : le chinois ByteDance (maison mère de TikTok) avec X-Portrait 2 et MagicVideoV2 ; le chinois Faceu Technology (filiale de ByteDance) avec Jimeng AI ; le chinois Kuaishou Technology avec Kling ; le chinois Zhipu AI avec Ying ; le chinois Shengshu Technology avec Vidu ; l’américain Google (Alphabet) avec Lumiere ; son compatriote Meta avec Make-A-Video et Movie Gen ; le français Turbo Studio avec Submagic ; la britannique Synthesia avec Synthesia ; la californienne World Labs avec « GenAI 3D » (lire EM@334, p. 5).

La start-up californienne World Labs livre un aperçu de l’avenir de l’IA générative en 3D

Le 2 décembre, la start-up World Labs — devenue en septembre une licorne avec sa levée de fonds de 230 millions de dollars — a présenté en ligne les premiers résultats de son IA générative capable de générer des mondes en 3D, où les utilisateurs peuvent interagir directement.

Imaginez : vous soumettez une de vos photos ou images à une IA générative et celle-ci va créer pour vous un monde en trois dimensions (3D) où vous pourrez évoluer à partir du navigateur de votre ordinateur ou de votre smartphone. Bienvenus dans l’« intelligence spatiale ». C’est cet exploit technologique de génération d’une géométrie en 3D que promet de généraliser prochainement la jeune pousse cofondée en janvier 2024 par la chercheuse et professeure Fei-Fei Li (photo), sa PDG, Ben Mildenhall (ex-Google), Justin Johnson (ex-Meta) et Christoph Lassner (ex-Meta).

Films, jeux, … révolution « GenAI 3D »
Pour l’instant, des aperçus navigables par tous ont été mis en ligne depuis le 2 décembre (1), tandis que seulement « quelques créateurs » peuvent expérimenter l’IA générative 3D. Les autres doivent s’inscrire sur une liste d’attente (2), en prévision du prochain lancement. « Nous travaillons dur pour mettre cette technologie entre les mains des utilisateurs dès que possible ! », a assuré World Labs dans sa présentation du 2 décembre. « A partir d’une image d’entrée, notre système estime la géométrie 3D, remplit les parties invisibles de la scène, invente de nouveaux contenus pour que vous puissiez vous retourner, et génère une grande variété de types de scènes et de styles artistiques », explique-t-elle. Et de préciser : « Nos scènes 3D peuvent être rendues en temps réel dans le navigateur avec un contrôle total de la caméra. Cela signifie que vous pouvez les explorer avec une caméra en mouvement libre comme dans un jeu vidéo, ou même simuler des effets de caméra 3D comme une faible profondeur de champ ou un zoom chariot » (3). Une fois dans son navigateur, l’utilisateur évolue en temps réel dans le nouveau monde 3D, comme avec une caméra virtuelle, à l’aide de ses touches « WASD » sur un clavier Qwerty, ou avec les touches « ZQSD » pour un clavier Azerty à la française : Z pour avancer, Q pour aller à gauche, S pour reculer, D pour aller à droite. Avec la souris, il suffit de cliquer et de faire glisser pour regarder autour. (suite)

Cette performance « GenAI 3D » intervient au moment où Midjourney, la société derrière l’IA générative du même nom, a aussi un projet 3D sous le nom de code « Orb ». Evoquée sur le réseau social Discord en octobre par David Holz, le fondateur PDG de Midjourney (4), une fonctionnalité d’intelligence spatiale devrait apparaître avec la version 7 de Midjourney attendue d’ici la fin l’année. Au lieu d’utiliser le rendu polygonal traditionnel, Midjourney développe un nouveau format de type NeRF (Neural Radiance Fields), qui permet aux utilisateurs de s’immerger virtuellement dans des images générées par l’IA. Cette technique d’apprentissage automatique utilisant un réseau de neurones permet de représenter des scènes et des objets en 3D à partir d’images 2D. « Ce n’est qu’un aperçu de l’avenir de l’IA générative native 3D », indique World Labs en montrant ses premiers mondes immersifs en 3D générés à partir d’une seule image. Si la plupart des IA génératives créent du contenu 2D comme des images ou des vidéos, générer en trois dimensions par l’IA (5) changera la façon de produire des films, des jeux, des métavers, des simulateurs ou encore des représentations numériques du monde physique (réalité virtuelle et réalité augmenté). La caméra virtuelle est même capable d’effectuer des « travelling contrariés », ce que les cinéastes appellent aussi un dolly zoom.
World Labs se définit comme « une société d’intelligence spatiale qui construit de grands modèles mondiaux pour percevoir, générer et interagir avec le monde 3D ». Pour financer le développement de ses « Large World Model » (LWM), la start-up a levé jusqu’à ce jour – du moins à septembre 2024, soit en neuf mois d’existence – plus de 230 millions de dollars auprès d’investisseurs emmenés par le fonds américain Andreessen Horowitz, NEA et Radical Ventures (6). NVentures, la branche de capital-risque de Nvidia, numéro un mondial des puces GPU/IA, ainsi qu’Adobe Ventures et AMD Ventures sont dans le tour de table où l’on compte aussi Eric Schmidt, l’ancien PDG de Google.

Fei-Fei Li, d’ImageNet à World Labs
La PDG cofondatrice de World Labs, Dre. Fei-Fei Li, est surnommée « la marraine de l’IA » – « The Godmother of AI » (7). Pionnière de l’IA dans le domaine de la vision par ordinateur (elle est à l’origine d’ImageNet dans les années 2010), elle est chercheuse et professeure en intelligence artificielle « centrée sur l’être humain » à l’université américaine de Stanford (8). Née il y a 48 ans en Chine, où elle a grandi jusqu’à ses 16 ans avant d’émigrer avec sa mère aux Etats-Unis pour rejoindre son père, Fei-Fei Li est de nationalité américaine. En 2017, elle a fondé AI4All, une organisation à but non lucratif (9) pour promouvoir la diversité dans l’IA. De son côté, Google a lancé le 4 décembre Genie 2 (10), son modèle d’IA pour créer des mondes 3D jouables. @

Charles de Laubier

L’année 2024 sera-t-elle plus « intelligente » que les précédentes ? Les acteurs de l’IA y travaillent

Edition Multimédi@ est partenaire média du 3e World AI Cannes Festival (WAICF), rendez-vous mondial consacré à l’intelligence artificielle et organisé du 8 au 10 février 2024 au Palais des festivals de Cannes. L’occasion de faire le point sur quelques forces en présence d’envergue mondiale.

L’intelligence artificielle, c’est désormais le foisonnement permanent sur fond de bataille des LLM (Large Language Model), ces grands modèles de langage utilisés par les agents conversationnels et les IA génératives, capables d’exploiter en temps réel des milliards voire des dizaines de milliards de paramètres. Depuis le 30 novembre 2022, date du lancement fracassant de ChatGPT (1) d’OpenAI, cornaqué par Microsoft (2), le marché mondial de l’IA ne cesse de prendre de l’ampleur. Alors que les questions sur les IA responsables (éthique, biais, droit d’auteur, droit à l’image, …) sont autant de défis à relever. Parmi les derniers prétendants aux premières places de la course à l’intelligence numérique potentiellement utilisable par des milliards d’êtres humains connectés : Mistral AI, Gemini, Anthropic et Llama, en attendant Ferret… d’Apple.

Mistral AI. La start-up française, devenue licorne (non cotée en Bourse mais valorisée près de 2 milliards d’euros), a été fondée en avril 2023 par Arthur Mensch, Guillaume Lample et Timothée Lacroix. Le 10 décembre dernier, elle a annoncé avoir levé 385 millions d’euros auprès d’investisseurs et a ouvert à l’intention des développeurs sa plateforme open source de modèles génératifs « les plus puissants » dans leur version bêta (3). Arthur Mensch, un ancien « scientist » de chez DeepMind, filiale de Google (tandis que les deux autres cofondateurs viennent de Facebook/Meta), a l’ambition de « créer un champion européen à vocation mondiale dans l’intelligence artificielle ». Son modèle d’IA, baptisé « Mixtral 8x7B », a été présenté comme étant six fois plus rapide que le langage Llama 2 70B du groupe Meta qu’il « surpasse » dans « la plupart des benchmarks ». De plus, « il égale ou surpasse GPT 3.5 [d’OpenAI] » (4).

Gemini. C’est le modèle d’IA « le plus grand et le plus performant » que Google a annoncé le 6 décembre dernier dans un post (5) cosigné par Sundar Pichai, PDG de Google et de sa maison mère Alphabet, et par Demis Hassabis, directeur général et cofondateur en 2010 de la start-up DeepMind Technologies que Google a rachetée il y a dix ans (en janvier 2014) pour quelque 628 millions de dollars. Rebaptisée Google DeepMind et filiale d’Alphabet, elle a rendu disponible la version 1.0 de Gemini (6) qui est déployé dans plusieurs produits et plateformes de la firme de Mountain View (où se trouve le QG Googleplex). L’IA générative Bard, que Google a lancée précipitamment il y aura un an le 6 février (7), profite désormais d’« une version affinée de Gemini Pro pour un raisonnement plus avancé » et il s’agit de « la plus grande mise à jour de Bard depuis son lancement ». Gemini est présenté comme un modèle multimodal (texte, images, audio et vidéo).

Anthropic. Fondée en décembre 2020 par d’anciens d’OpenAI, Dario Amodei et sa sœur Daniela Amodei, la startup Anthropic – dont ils sont respectivement directeur général et présidente – est basée à San Francisco (Californie) comme OpenAI. Ils ont été suivis par sept autres de leurs collègues d’OpenAI. Amazon avait annoncé le 25 septembre 2023 l’injection de 4 milliards de dollars dans Anthropic (8), qui avait levé 1,5 milliard de dollars dix-huit mois auparavant auprès d’investisseurs – dont 300 millions de dollars de Google qui a pris 10 % du capital et a promis à la start-up de lui apporter jusqu’à 2 milliards de dollars en plus. Anthropic, qui recourt au cloud AWS d’Amazon, a lancé en mars 2023 son IA générative appelée Claude (9) (claude.ai), dont la version 2 est disponible depuis juillet dernier. Mais avec son futur « Claude-Next », la rival d’OpenAI se positionne déjà pour se mesurer au futur ChatGPT-5 attendu cette année.

Llama. Cela fera un an, le 24 février prochain, que Meta Platforms (ex-Facebook) a lancé « LLaMA » (Large Language Model Meta AI), son grand modèle de langage en open source (10). La firme de Mark Zuckerberg a ensuite annoncé le 18 juillet dernier la version Llama 2 en partenariat avec Microsoft (pour utiliser son cloud Azure), mais en la rendant aussi disponible chez Amazon Web Services (AWS), Hugging Face et d’autres fournisseurs. « Llama 2 est gratuit pour la recherche et l’utilisation commerciale », précise Meta (11). Le géant de Menlo Park (Californie) utilise aussi son IA pour créer de nouvelles fonctions sur ses réseaux sociaux Instagram, Facebook et WhatsApp. Le 7 décembre, il a présenté « Purple Llama », une boîte à outils également en open source pour la sécurité et la confiance en matière d’IA responsable (12). Rappelons que le directeur général de l’intelligence artificielle de Meta est le Français Yann Le Cun, recruté il y a dix ans maintenant (en décembre 2013) et basé à New-York. @

Charles de Laubier

Un an après avoir lancé ChatGPT, aux airs de « Google-killer », OpenAI prépare un « smartphone-killer »

La start-up californienne OpenAI, cofondée par son actuel DG Sam Altman et devenue licorne valorisée presque 100 milliards de dollars, défraie la chronique depuis le lancement de ChatGPT il y a un an. Après avoir déstabilisé Google, elle veut lancer un petit terminal « smartphone-killer » boosté à l’IA.

(Vendredi 17 novembre 2023 au soir, heure de Paris, soit peu après le bouclage du n°310 de Edition Multimédi@ faisant sa Une sur OpenAI et Sam Altman, nous apprenions le limogeage surprise de ce dernier par son conseil d’administration. Vingt-quatre heure après, OpenAI revenait sur sa décision… Après avoir hésité à rejoindre Microsoft prêt à l’embaucher, Sam Altman a finalement trouvé le 22 novembre un accord avec OpenAI – avec le soutien du bailleur de fonds Microsoft – pour finalement y retourner !)

Google et Apple pourraient bien être les prochaines victimes collatérales d’OpenAI. Car la licorne à l’origine de l’IA générative ChatGPT, lancée il y a un an presque jour pour jour, accélère son offensive technologique. D’une part, elle a organisé le 6 novembre sa toute première conférence des développeurs, OpenAI DevDay, où ont notamment été lancés un « GPT-4 Turbo » et des interfaces de programmation (API) pour créer des agents conversationnels personnalisés intégrables dans des applications ou pour développer son propre « ChatGPT » autonome sans codage (1).
En mettant le turbo, OpenAI veut faire une super-IA tout-en-un capable de générer par elle-même aussi bien du texte et des images, mais aussi de l’audio et de la vidéo. Le 9 novembre, un programme open source baptisé « OpenAI Data Partnerships » (2) a même été lancé pour exploiter tous azimuts des données publiques et privées afin de former encore plus largement les IA génératives. Ce qui positionne la future plateforme IA intégrée d’OpenAI comme un potentiel « Google-killer ». D’autre part, son PDG cofondateur Sam Altman (photo) avait confirmé dès fin septembre être en « discussions avancées » avec l’ancien designer de l’iPhone chez Apple, l’Américano-britannique Jony Ive, et le PDG fondateur du conglomérat Softbank, le Japonais Masayoshi Son, autour d’un projet de lancement d’un terminal à intelligence artificielle susceptible de remplacer à terme les smartphones (3).

Un trio de rêve : OpenAI-Softbank-LoveFrom
Parallèlement, mais sans lien a priori avec ce projet d’appareil, Sam Altman a dit le 13 novembre au Financial Time qu’il demandait à Microsoft des fonds supplémentaires, en plus des 10 milliards de dollars déjà accordés sur plusieurs années par ce dernier, afin de rendre l’IA encore plus intelligente – vers le futur ChatGPT-5 et au-delà (4). Il faudra en tout cas attendre de nombreux mois avant que ne voit le jour le terminal IA grand public rêvé par OpenAI, LoveFrom (société de design créée en 2019 par Jony Ive (5) qui a recruté d’anciens collègues d’Apple comme Marc Newson) et Softbank, dont la filiale britannique ARM pourrait produire les puces.

Mais les trois entrepreneurs ont sûrement dû suspendre leur brainstorming, le temps de suivre le lancement d’un petit terminal boosté à l’IA conversationnelle et sans écran (à épingler ou à magnétiser sur un vêtement ou un sac), baptisé Ai Pin. Présenté le 9 novembre et en précommande depuis le 16 novembre aux Etats-Unis, sa disponibilité est prévue début 2024 – sans encore de date pour l’Europe.

Avec son « Ai Pin », Humane montre la voie
Son concepteur : la start-up californienne Humane, cofondée en 2017 par deux anciens dirigeants d’Apple (l’exdirecteur design Imran Chaudhri et l’ex-directrice logiciel Bethany Bongiorno), mari et femme dans la vie. Respectivement président et directrice générale, ils se sont entourés de dizaines d’anciens employés de la marque à la pomme spécialistes de design, d’écran ou encore de cloud – tous placés sous la houlette de Patrick Gates ancien directeur ingénierie d’Apple et actuel Chief Technology Officer (CTO) de Huname. Et parmi sa dizaine d’investisseurs, auprès desquels Humane a levé à ce jour 230 millions de dollars, il y a… Sam Altman, sans que l’on sache combien le patron d’OpenAI a mis de sa poche aux côtés de Kindred Ventures, SK Networks, LG Technology Ventures, Microsoft, Volvo Cars Tech Fund, Tiger Global ou encore Qualcomm Ventures. Et comme le monde est décidément petit : la licorne OpenAI et les start-up LoveFrom et Humane, avec lesquelles elle croit en une sorte de « smartphone-killer », sont toutes les trois basées à San Francisco, en Californie.
De la taille d’une petite boîte d’allumettes, Ai Pin de Humane répond au doigt et à la voix grâce à respectivement son micro et son pavé tactile intuitif. En faisant des gestes ou en interagissant via l’écran à encre laser projeté sur sa paume, l’épingle IA peut être utilisée aisément au quotidien et lors des déplacements. Son prix – moitié moins élevé qu’un iPhone – est de 699 dollars (6) auquel s’ajoute un abonnement de 24 dollars par mois comprenant : un numéro de téléphone portable dédié au Ai Pin – grâce à une carte eSIM intégrée – et un nombre illimité de conversations, de SMS et de data, avec un stockage dans le cloud.
Le 9 novembre, Humane a annoncé aussi être un opérateur mobile virtuel (MVNO) aux Etats-Unis et en partenariat exclusif avec T-Mobile US – le troisième plus grand opérateur télécoms américain, derrière AT&T et Verizon. D’après ses spécifications (7), le petit bijou de technologie de Humane prend des photos à 13 mégapixels (4.208 x 3.120 px) et des vidéos (dont la résolution n’est en revanche pas encore indiquée). Mais comment sans écran savoir si le sujet est bien cadré ? L’IA (AI-Powered Photographer) et la projection laser sur la main du photographe pourraient faire l’affaire. Côté musique, la plateforme de streaming Tidal (d’origine norvégienne et ex-plateforme musicale du rappeur Jay-Z) est accessible et optimisée à l’IA. Sam Altman ne manquera sûrement pas de s’inspirer de l’Ai Pin pour son futur « OpenAI device », qui a l’ambition d’être à l’IA ce que l’iPhone fut à l’écran tactile – ce qui pourrait être… une vraie épine dans le pied d’Apple. Le multimilliardaire Masayoshi Son, 69e fortune mondiale (8), serait prêt à investir 1 milliard de dollars – sans doute via l’un de ses deux Vision Funds (9) – dans une joint-venture avec le patron de ChatGPT (OpenAI) et le designer Jony Ive (LoveFrom), d’après le Financial Times (10).
A l’instar de Humane qui a pris de l’avance avec son Ai Pin, le trio Altman-Son-Ive vise aussi à ne plus être dépendant des écrans et à accroître l’interaction entre l’homme et l’IA. Une fois l’appareil IA conçu, la licence OpenAI deviendrat-elle aussi un MVNO ? Pour peu que le « device » d’OpenAI ait lui aussi son eSIM intégrée. Il se trouve que le géant japonais Softbank de Masayoshi Son est aussi actionnaire minoritaire de T-Mobile US (3,3 % du capital après avoir fusionné Sprint avec T-Mobile US) et, en Europe, de Deutsche Telekom (4,5 %) : cela pourrait aider par la suite… « Google-killer », « Apple-killer », « smartphone-killer », … Cette nouvelle génération d’AI wearables (dispositifs portables basés sur l’intelligence artificielle) pourrait faire des ravages si le grand public décidait de se les approprier. Le moteur de recherche classique de Google, dont la toute première mise en ligne de la version bêta date d’il y a un quart de siècle, a déjà été court-circuité par les Assistant (Google), Alexa (Amazon) et autres Siri (Apple). Avec les IA génératives et la commande vocale assistée par l’IA, sa position dominante va être sérieusement contestée. Pour tenter d’assurer ses arrières la filiale d’Alphabet est prise d’agitations : non seulement Google pousse son IA générative Bard, mais a aussi investi 300 millions de dollars pour prendre 10 % du capital d’Anthropic (11), un rival d’OpenAI.

Sam Altman, le futur « Steve Jobs » ?
Depuis le succès planétaire de son iPhone et de son système d’exploitation iOS, lancés il y a plus de quinze ans par Steve Jobs, Apple n’a pas vraiment innové depuis avec un nouvel appareil disruptif. Comme si le PDG de la firme de Cupertino depuis fin août 2011, Tim Cook, s’était endormi sur les lauriers de Steve Jobs décédé début octobre de la même année. Les nombreux transfuges d’Apple partis chez Humane ou chez LoveFrom en disent long : la marque à la pomme ne fait plus rêver. Avec son épingle Ai Pin et son système d’exploitation Cosmos (« AIby-design »), Humane prend des airs d’« Apple-killer » voire d’« iOS-killer ». A moins que le trio Altman-Son-Ive ne donne le coup de grâce au « capitaine » Cook. @

Charles de Laubier