Startups : la course aux world models s'accélère

Prometheus : ce que prépare la nouvelle startup de Jeff Bezos

51

1Ars Technica AI

Prometheus : ce que prépare la nouvelle startup de Jeff Bezos

Jeff Bezos a officiellement lancé Prometheus en novembre dernier en tant que co-PDG aux côtés du co-fondateur Vik Bajaj, et la startup vient de boucler une nouvelle levée de fonds de 12 milliards de dollars, portant sa valorisation à 41 milliards. Cela fait suite à un premier tour de 6,2 milliards de dollars l'année précédente. Les investisseurs comprennent des noms de premier plan comme JPMorgan Chase, Goldman Sachs et BlackRock, auxquels s'ajoute une contribution personnelle significative de Bezos lui-même. L'entreprise compte actuellement 150 employés. Une grande partie de ces capitaux sera consacrée à l'achat de puissance de calcul, Bezos ayant confié à CNBC que l'activité est "très gourmande en calcul" et nécessite la création de vastes ensembles de données. Prometheus se positionne sur le créneau de l'IA physique, une discipline qui applique les principes du deep learning, ceux-là mêmes qui alimentent les grands modèles de langage et l'IA générative, à des domaines concrets comme la robotique et la fabrication industrielle. L'enjeu est considérable : si les LLM ont révolutionné le traitement du langage et de l'image, l'IA physique ambitionne de faire de même avec le monde réel, en dotant les machines d'une capacité à percevoir, raisonner et agir dans des environnements non structurés. Pour l'industrie manufacturière, la logistique et la robotique, les retombées potentielles sont massives. La démarche de Bezos s'inscrit dans une vague plus large d'investissements colossaux dans l'IA physique, un domaine où figurent aussi des acteurs comme Figure AI, Physical Intelligence ou encore Boston Dynamics. Avec 18,2 milliards de dollars levés en deux tours, Prometheus dispose d'une puissance de feu rare pour une startup aussi jeune, lui permettant de construire les infrastructures de données et de calcul nécessaires à l'entraînement de modèles complexes. Les détails sur les produits concrets restent encore flous, mais l'ampleur du financement et le profil des investisseurs institutionnels signalent des ambitions industrielles de long terme.

UEL'afflux massif de capitaux américains dans l'IA physique pourrait à terme fragiliser la compétitivité de l'industrie manufacturière et robotique européenne face à des acteurs bien mieux capitalisés.

💬 18 milliards levés pour 150 employés, ça fait réfléchir sur l'échelle du truc. L'IA physique, c'est le pari que les LLM n'étaient que le début, et que la vraie disruption arrive dans les usines et les entrepôts, pas dans les chatbots. Reste à voir ce que Prometheus sort concrètement, parce que pour l'instant on a surtout une valorisation vertigineuse et des slides.

RobotiqueOpinion

1 source

Une startup forme des robots en envoyant des humains filmer le ménage chez vous

42

2Ars Technica AI

Une startup forme des robots en envoyant des humains filmer le ménage chez vous

La startup allemande MicroAGI propose depuis le 28 mai 2026 un service de nettoyage à domicile entièrement gratuit aux habitants de New York, avec une contrepartie inhabituelle : les agents de ménage portent des caméras qui enregistrent l'intégralité de leur intervention. Le service est accessible via l'application Shift, lancée simultanément par l'entreprise. Pour réserver, les utilisateurs doivent fournir leur numéro de téléphone, adresse e-mail, adresse du domicile et les instructions d'accès. Chaque session dure environ deux heures. La communication autour du lancement a été soignée : vidéos sur X et LinkedIn accompagnées des notes de piano d'« Empire State of Mind » de Jay-Z et Alicia Keys. Les images captées par les caméras servent à entraîner la prochaine génération de robots domestiques. MicroAGI se décrit comme une équipe d'ingénieurs, de chercheurs et d'opérateurs dont la mission est d'« accélérer l'IA incarnée », c'est-à-dire des systèmes capables d'agir physiquement dans le monde réel. Le modèle économique est clair : les habitants obtiennent un ménage gratuit, la startup obtient des données rares et précieuses, des séquences vidéo en vue subjective montrant comment un humain navigue dans un appartement, manipule des objets et exécute des tâches quotidiennes. Ce type de données est l'un des goulots d'étranglement majeurs du développement de robots ménagers. L'initiative s'inscrit dans une course mondiale à la robotique domestique, où des acteurs comme Figure, Physical Intelligence ou Boston Dynamics investissent des centaines de millions de dollars pour doter des robots d'une compréhension fine de l'environnement humain. La collecte de données via des humains équipés de caméras est une approche déjà adoptée par plusieurs laboratoires, mais rarement proposée directement au grand public sous forme de service commercial. Le modèle soulève néanmoins des questions sur la vie privée : les résidents invitent chez eux des inconnus munis de caméras, dans leurs espaces les plus intimes. MicroAGI n'a pas encore précisé comment ces données seront stockées, protégées ou éventuellement partagées.

UEMicroAGI étant une startup allemande, ses pratiques de collecte de données vidéo au domicile de particuliers pourraient être scrutées au regard du RGPD européen.

RobotiqueActu

1 source

De DeepSeek à DeepRoute : pourquoi un chercheur en IA de premier plan a misé sur le monde physique

42

3Pandaily

De DeepSeek à DeepRoute : pourquoi un chercheur en IA de premier plan a misé sur le monde physique

Le 25 avril 2026, lors du Salon de l'automobile de Pékin, la startup chinoise d'autonomie véhiculaire DeepRoute.ai a tenu une conférence de presse inhabituelle dans le hall A4 du China International Exhibition Center : aucun véhicule en exposition, aucun prototype sur scène. Son PDG, Maxwell Zhou, a choisi ce vide comme manifeste. En une après-midi, il a dévoilé la nouvelle architecture stratégique de l'entreprise autour du concept de "Physical AI", son modèle fondateur (Foundation Model), une ébauche d'agent intégrant conduite et habitacle, et un chiffre clé : un véhicule sur trois équipé d'un système NOA urbain en Chine tourne aujourd'hui sur la technologie DeepRoute, soit plus de 300 000 voitures en circulation. L'événement a également marqué la première apparition publique de Ruan Chong, ancien directeur R&D de DeepSeek et chercheur central en IA multimodale, depuis son arrivée chez DeepRoute en tant que Chief Scientist. Ce repositionnement marque une rupture nette avec la logique dominante du secteur. Là où les acteurs de la conduite autonome se sont longtemps concurrencés sur des benchmarks techniques, quelle pluie, quel angle mort, quel cas limite, DeepRoute revendique désormais un rôle d'infrastructure, comparable selon Zhou à "l'électricité ou les télécommunications". L'objectif affiché est d'atteindre 1 000 miles ou plus entre deux interventions critiques (MPCI) d'ici fin 2026. "Quatre-vingt-dix pour cent de ce qui compte, c'est la sécurité", a déclaré Zhou, ajoutant que Tesla a déjà atteint ce seuil et que les petits modèles ne permettront jamais d'y parvenir : "Quoi que vous fassiez dans le monde des petits modèles, vous ne pouvez pas obtenir dix fois mieux en travaillant plus fort." Le virage vers les grands modèles de fondation est donc présenté comme une nécessité structurelle, pas une option. Le recrutement de Ruan Chong illustre une dynamique plus large que Zhou a explicitement nommée : les responsables de la recherche multimodale des grands groupes internet chinois migrent vers la conduite autonome. Ruan lui-même a expliqué ce choix avec franchise : "Les modèles de langage sont très matures, presque n'importe quelle tâche peut être traitée par un seul modèle. Mais dans l'intelligence multimodale et incarnée, on en est loin. Je préfère être à la frontière." Cette migration de talents, si elle se confirme, signale que le centre de gravité de l'IA appliquée se déplace du texte vers le monde physique. DeepRoute entend capitaliser sur cette fenêtre, avant que le secteur n'atteigne lui-même la maturité qu'a connue le NLP.

UELa montée en puissance de DeepRoute et la migration de talents IA vers l'autonomie véhiculaire en Chine renforcent la pression compétitive sur les constructeurs automobiles européens dans la course au véhicule autonome.

RobotiqueOpinion

1 source

$World Models contre VLAs : la fracture qui divise l'IA physique$

45

4The Information AI

World Models contre VLAs : la fracture qui divise l'IA physique

L'industrie de la robotique est traversée par un débat technique majeur qui divise les acteurs de la Silicon Valley : quelle architecture d'intelligence artificielle doit piloter les robots de demain ? D'un côté, les partisans des modèles vision-langage-action (VLA), des dérivés des grands modèles de langage (LLM) qui ont été entraînés spécifiquement pour contrôler des robots. De l'autre, les défenseurs des "world models", des modèles entraînés principalement sur de la vidéo pour prédire ce qui va se produire dans un environnement physique lorsqu'un robot exécute une action. Ce clivage s'est cristallisé ce mois-ci avec deux annonces symboliques : la startup de vidéo IA Luma a lancé un laboratoire dédié à l'IA physique centré sur les world models pour la robotique, tandis que la startup de robots humanoïdes 1X a annoncé la création de son propre laboratoire world model. L'enjeu est considérable. Des figures comme Elon Musk et Jensen Huang prédisent un "moment ChatGPT" pour la robotique, où l'IA permettra d'accomplir une large gamme de tâches physiques à une échelle comparable à celle des chatbots aujourd'hui. Le choix de l'architecture sous-jacente déterminera quelles entreprises domineront ce marché, quelles approches bénéficieront des investissements massifs des capital-risqueurs, et in fine quelle technologie se retrouvera au coeur des robots industriels, logistiques et domestiques des prochaines années. Ce débat intervient alors que la robotique entre dans une phase d'accélération inédite, portée par les progrès des LLM et la disponibilité croissante de données vidéo pour l'entraînement. Les VLA profitent de l'élan des modèles de langage déjà bien maîtrisés, mais les world models promettent une compréhension plus profonde des lois physiques et une meilleure capacité à anticiper les conséquences des actions dans le monde réel. La multiplication des laboratoires spécialisés, financés par du capital-risque, suggère que les prochains mois verront des benchmarks décisifs entre ces deux approches.

💬 Le vrai pari IA de 2026, c'est pas les agents logiciels, c'est ça. VLAs contre world models, c'est le choix d'architecture qui va verrouiller le marché robotique pour dix ans, parce qu'un robot déployé en usine sur la mauvaise stack, tu le remplaces pas du jour au lendemain. Ce qui me frappe, c'est que Luma et 1X ont tous les deux basculé world models la même semaine : quelque chose se consolide.

RobotiqueOpinion

1 source

Une startup fondée par un ex-chercheur Nvidia, parmi les nouvelles initiatives sur les world models

À lire aussi

Prometheus : ce que prépare la nouvelle startup de Jeff Bezos

Une startup forme des robots en envoyant des humains filmer le ménage chez vous

De DeepSeek à DeepRoute : pourquoi un chercheur en IA de premier plan a misé sur le monde physique

World Models contre VLAs : la fracture qui divise l'IA physique