La start-up californienne World Labs livre un aperçu de l’avenir de l’IA générative en 3D

Le 2 décembre, la start-up World Labs — devenue en septembre une licorne avec sa levée de fonds de 230 millions de dollars — a présenté en ligne les premiers résultats de son IA générative capable de générer des mondes en 3D, où les utilisateurs peuvent interagir directement.

Imaginez : vous soumettez une de vos photos ou images à une IA générative et celle-ci va créer pour vous un monde en trois dimensions (3D) où vous pourrez évoluer à partir du navigateur de votre ordinateur ou de votre smartphone. Bienvenus dans l’« intelligence spatiale ». C’est cet exploit technologique de génération d’une géométrie en 3D que promet de généraliser prochainement la jeune pousse cofondée en janvier 2024 par la chercheuse et professeure Fei-Fei Li (photo), sa PDG, Ben Mildenhall (ex-Google), Justin Johnson (ex-Meta) et Christoph Lassner (ex-Meta).

Films, jeux, … révolution « GenAI 3D »
Pour l’instant, des aperçus navigables par tous ont été mis en ligne depuis le 2 décembre (1), tandis que seulement « quelques créateurs » peuvent expérimenter l’IA générative 3D. Les autres doivent s’inscrire sur une liste d’attente (2), en prévision du prochain lancement. « Nous travaillons dur pour mettre cette technologie entre les mains des utilisateurs dès que possible ! », a assuré World Labs dans sa présentation du 2 décembre. « A partir d’une image d’entrée, notre système estime la géométrie 3D, remplit les parties invisibles de la scène, invente de nouveaux contenus pour que vous puissiez vous retourner, et génère une grande variété de types de scènes et de styles artistiques », explique-t-elle. Et de préciser : « Nos scènes 3D peuvent être rendues en temps réel dans le navigateur avec un contrôle total de la caméra. Cela signifie que vous pouvez les explorer avec une caméra en mouvement libre comme dans un jeu vidéo, ou même simuler des effets de caméra 3D comme une faible profondeur de champ ou un zoom chariot » (3). Une fois dans son navigateur, l’utilisateur évolue en temps réel dans le nouveau monde 3D, comme avec une caméra virtuelle, à l’aide de ses touches « WASD » sur un clavier Qwerty, ou avec les touches « ZQSD » pour un clavier Azerty à la française : Z pour avancer, Q pour aller à gauche, S pour reculer, D pour aller à droite. Avec la souris, il suffit de cliquer et de faire glisser pour regarder autour. (suite)

L’ambition de Perplexity de vouloir détrôner le moteur de recherche Google laisse… perplexe

La start-up Perplexity AI, cofondée en août 2022 et dirigée par Aravind Srinivas, a lancé un moteur conversationnel intelligent présenté comme « une alternative aux moteurs de recherche traditionnels » – autrement dit à Google qui domine largement le marché mondial.

Selon nos informations auprès de Statcounter, Google domine toujours de manière écrasante le marché mondial des moteurs de recherche avec – sur le mois de mars 2024 – 91,38 % de part de marché (1) avec près de 80 milliards de visites ce mois-là selon Similarweb, suivi de très très loin par Bing (Microsoft) qui peine à faire mieux que 3,35 % avec près de 1,3 milliard de visite sur le mois, ou encore par Yahoo avec seulement 1,1 % mais sans que l’on sache précisément le nombre de visite correspondant à son moteur par rapport à son portail média. Autant dire que la filiale d’Alphabet est en situation de quasi-monopole.

« Chat-search », à la fois moteur et robot
C’est à cette position dominante dans le search que de nouveaux entrants rêvent de s’attaquer en tentant de profiter de l’effet de levier technologique de l’intelligence artificielle en général et de l’IA générative en particulier. L’Indo-américain Aravind Srinivas (photo de gauche) et le Biélorusse Denis Yarats (photo de droite) travaillant aux Etats-Unis, tous les deux cofondateurs en août 2022 de la start-up californienne Perplexity AI, ont entrepris de faire entrer la recherche en ligne dans la nouvelle ère de ce qu’ils appellent l’« AI-native search ». Leur moteur conversationnel, qui a dépassé en mars 2024 les 56 millions de visites, est présenté comme un « couteau suisse » de la recherche en ligne.

Web3/blockchain, le retour du numérique d’occasion

En fait. Le 21 février, Jérémy Benech, cofondateur de la plateforme Liwé, a indiqué à Edition Multimédi@ que le développement de la fonction « revente de livres numériques » est en cours de développement. Avec le Web3, les industries culturelles doivent se préparer à la légalisation du marché de l’occasion numérique.

En clair. N’en déplaise aux industries culturelles : le marché de l’occasion numérique revient, dix ans après que la société américaine ReDigi – pionnier de la revente d’occasion digitale de musiques, de livres, de jeux vidéo, d’applications et de logiciels – ait essuyé les plâtres judiciaires. Le label Capitol Records avait eu raison de la vente de musiques numériques d’occasion. Ce fut un procès fleuve pour violation des droits d’auteur, de la plainte à New-York en 2012 jusqu’au rejet du dernier recours de ReDigi (1) par la Cour suprême des Etats-Unis en 2019 (2). ReDigi a dû mettre la clé sous la porte.
Depuis, l’eau a coulé sous les ponts, et le Web3 – avec les chaînes de blocs (blockchain), les jetons non-fongibles (NFT) et les cryptomonnaies (tokens) – est apparu. Et cela change tout en termes de traçabilité des actifs numériques, d’authentification des détenteurs et d’inviolabilité des transactions. C’est dans ce cadre que s’inscrit la jeune pousse Liwé, basée à Saintes (CharenteMaritime), qui a lancé en mai 2023 la version bêta de sa librairie numérique du même nom. Son catalogue d’ebooks et l’autopublication sont disponibles, mais pas encore de quoi revendre des livres numériques d’occasion. « Il nous reste à développer la revente légale d’ebooks, notre principale innovation, qui sera disponible en septembre », indique à Edition Multimédi@ Jérémy Benech, cofondateur de la plateforme Liwé.

Casques : la start-up française Lynx lève des fonds

En fait. Alors qu’Apple commence le 2 février la commercialisation de son casque de réalité mixte Vision Pro aux Etats-Unis, la start-up française Lynx Mixed Reality va produire en nombre son casque – de réalité mixte aussi (AR/VR) – à partir du 12 février. Son fondateur nous confirme avoir levé des fonds.

En clair. « Nous allons effectuer la première production en masse de notre casque de réalité mixte Lynx R1, en assemblant dès le 12 février 500 unités ‘’PVT’’ [comprenez Production Validation and Testing, à savoir la dernière phase avant le début de la production en série, ndlr]. Et nous devrions passer à 1.000 unités produites dès le mois d’avril », indique à Edition Multimédi@ Stan Larroque, le PDG fondateur de Lynx Mixed Reality, alias la start-up française SL Process dont il est l’actionnaire principal.
Ce millier de casques produits dès le printemps est possible grâce à une levée de fonds en cours. « J’aurai de très bonnes nouvelles à vous partager en février concernant la société », nous confie-t-il, sans toutefois préciser le montant des fonds levés. Initialement, il avait indiqué le 21 décembre dernier avoir envisagé une « production de masse à 1.000 exemplaires par mois d’ici fin 2023 » mais la start-up basée à Boulogne-Billancourt a dû lever le pied car le financement n’était pas encore à la hauteur. « Cela est dû en grande partie au calendrier de notre collecte de fonds, qui devrait se terminer avec succès entre janvier et février 2024 », avait alors précisé Stan Larroque (1).

La CSNP demande à l’Etat de lancer une étude d’impact sur les communs numériques

La Commission supérieure du numérique et des postes (CSNP) a publié le 8 novembre un avis sur les communs numériques. Bien qu’ouverts et gratuits, plusieurs « freins » à leur développement sont identifiés. Les Etats jouent parfois contre eux, en finançant des produits ou services similaires.

Parmi les onze recommandations que fait la Commission supérieure du numérique et des postes (CSNP) – instance bicamérale et transpartisane en interaction avec Bercy – dans son avis rendu le 8novembre et intitulé «Commun numériques : vers un modèle souverain et durable », la n°5 suggère à l’Etat français de « lancer une étude d’impact économique et sociétale comparée pour les communs numériques d’intérêt général ». Et ce, « afin d’évaluer, notamment d’un point de vue comparatif, les coûts générés et évités par les communs numériques d’intérêt général ».

Clarifier les aides d’Etat dans les communs
La CSNP, dont la mission sur les communs numériques a été pilotée par Jeanne Bretécher (photo), mentionne juste en guise d’exemple où une étude comparée pourrait être pertinente : « NumAlim versus Open Food Facts ». Mais sans expliquer pourquoi. Ces deux initiatives poursuivent le même objectif : fournir des informations sur les produits alimentaires. Mais les deux sont d’origine différente, comme l’analyse Edition Multimédi@. Open Food Facts est un projet collaboratif lancé par des citoyens bénévoles pour créer une base de données libre et ouverte sur les produits alimentaires, utilisé par NutriScore, Yuka, Foodvisor et ScanUp ou encore Centipède. Alors que NumAlim est en revanche un projet initié par l’Ania (1), le lobby de l’industrie alimentaire, et opéré par la société Agdatahub (détenue par la holding API-Agro), pour créer une plateforme de données ouvertes mais aussi payantes sur les produits alimentaires. Mais au-delà du fait qu’Open Food Facts à but non lucratif est un vrai commun numérique gratuit et que NumAlim est une plateforme commerciale avec sa place de marché « BtoB » HubAlim, leurs financements diffèrent : Open Food Facts dépend principalement des contributions de bénévoles et de dons, tandis que NumAlim bénéficie du financement de la Banque des Territoires, filiale d’investissement de la Caisse des Dépôts (CDC), bras armé financier de l’Etat français.