Dossier Google DeepMind — page 6

878 articles · page 6 sur 18

Suivi de l'actualité de Google DeepMind : modèles Gemini, recherche IA, publications, lancements de produits et annonces officielles, mises à jour en continu.

251Le Big Data LLMsActu

Google temporise avec Gemini 3.5 Pro : le lancement aurait été repoussé

Google prendrait plusieurs mois de retard sur le lancement de Gemini 3.5 Pro, son modèle d'intelligence artificielle le plus avancé. Présenté officiellement lors de la conférence Google I/O en mai 2026, ce modèle devait initialement arriver dès le mois de juin. Deux mois plus tard, aucune sortie publique n'a eu lieu. Selon un rapport de Bloomberg publié le 16 juillet 2026 par les journalistes Davey Alba et Julia Love, les résultats obtenus pendant l'entraînement du modèle n'auraient pas satisfait les équipes internes, en particulier sur les tâches liées au codage informatique. Une source proche du dossier évoque des résultats jugés "décevants". Face à ce constat, Google aurait lancé fin juin une nouvelle phase d'entraînement accompagnée d'une mise à jour des données utilisées, revoyant ainsi une partie du développement entre la présentation de mai et la date de lancement initialement prévue. L'entreprise n'a pas confirmé publiquement ces informations, mais a reconnu tester Gemini 3.5 Pro ainsi qu'une version améliorée de Gemini Flash et d'autres modèles auprès de partenaires sélectionnés, sans communiquer de nouvelle date de sortie. Ce retard illustre à quel point le développement logiciel assisté par IA est devenu un terrain de bataille stratégique entre les grands acteurs du secteur. OpenAI multiplie les annonces autour de GPT-5.6, Anthropic avance avec Claude Fable 5, tandis que xAI et Mistral cherchent eux aussi à imposer leurs assistants de codage. Pour Google, l'enjeu est d'autant plus sensible que l'entreprise utilise déjà massivement l'IA en interne : en avril 2026, le PDG Sundar Pichai indiquait que près de 75 % du nouveau code produit par ses équipes était généré avec l'aide de l'IA, contre environ 50 % quelques mois plus tôt. Un lancement raté de Gemini 3.5 Pro sur le codage exposerait donc Google à une contradiction difficile à assumer face à ses concurrents comme face à ses propres usages internes. Ce paradoxe s'explique aussi par une organisation interne encore fragmentée. Plusieurs équipes développent leurs propres outils d'IA pour le code, notamment Google DeepMind, Vertex AI et Android Studio, et l'unification de ces solutions reste un chantier en cours. Certains ingénieurs maison resteraient par ailleurs prudents face à une dépendance excessive au code généré automatiquement. Dans ce contexte, retarder la sortie de Gemini 3.5 Pro peut décevoir les utilisateurs qui l'attendaient depuis mai, mais ce choix vise avant tout à éviter un lancement raté qui aurait fragilisé la position de Google dans la course à l'IA générative appliquée au développement logiciel.

Dossier Google DeepMind — page 6

Google temporise avec Gemini 3.5 Pro : le lancement aurait été repoussé

L'idée de standards IA de Hassabis reçoit un soutien : et maintenant ?

ACE-Ego-0 : unification des données égocentrées humaines et robotiques pour le préentraînement VLA

MuseVLA : un modèle VLA multimodal adaptatif pour la manipulation robotique

Qwen-RobotSuite : trois modèles d'IA incarnée pour la manipulation VLA, la modélisation du monde et la navigation

Récupérer plutôt que réentraîner : étendre les modèles vision-langage-action (VLA) à de nouvelles tâches au moment de l'inférence

Modèle d'action géométrique pour l'apprentissage de politiques robotiques

WAM4D : modèle d'action du monde 4D rapide via des tokens de registre spatial

GIVE : ancrage des gestes humains dans les modèles vision-langage-action (VLA)

EWAM : un modèle d'action du monde amélioré pour l'adaptation en ligne en boucle fermée dans l'IA incarnée

Anthropic cherche à louer ses premiers data centers avec le soutien financier de Google

À l'intérieur de XRZero-G0, un nouveau jeu de données ouvert de 2 000 heures pour la recherche en robotique

Combler le fossé morphologique : adapter les modèles VLA à la manipulation dextérique par ajustement conditionné par l'intention

Transformer la prévoyance en action : réorientation de l'alignement des représentations dans les modèles action-monde

SAFE-Pruner : élagage de tokens guidé par l'attention sémantique pour les modèles VLA en manipulation robotique

VeriSpace : une méthode de vérification spatiale des actions pour les modèles vision-langage-action

TORL-VLA : apprentissage par renforcement en ligne à guidage tactile pour la manipulation à contacts intensifs

Ego-Pi : affinage VLA sur données égocentriques humaines et robotiques

MotionWAM : vers des modèles fondation action-monde pour la loco-manipulation humanoïde en temps réel

FAWAM : modèles d'action du monde sensibles aux forces pour la manipulation en boucle fermée à contacts multiples

Sakana AI parie qu'une IA capable de s'améliorer elle-même peut mettre fin à la course au calcul des grands laboratoires

PHASER : rejeu d'expérience sémantique et par phase pour les modèles VLA

PaCo-VLA : a priori de compliance protégé par passivité pour la manipulation VLA riche en contacts

Le lauréat du prix Turing Richard Sutton estime que l'IA générative pure ne peut pas faire de vraie science

Notes à soi-même : VLA augmentées d'un bloc-notes pour les tâches de manipulation à mémoire

Genesis AI lance Nyx, Quadrants et Genesis World 1.0, une plateforme physique pour évaluer les modèles de robotique à grande échelle

Régularisation contrastive des représentations pour les modèles vision-langage-action (VLA)

La recherche NVIDIA montre que des robots entraînés en simulation peuvent accomplir des tâches réelles

Claude Opus 4.8 est désormais disponible sur AWS

Les modèles VLA peuvent-ils apprendre en continu depuis des données réelles sans oublier ?

Elon Musk prépare déjà Grok 5, la prochaine IA géante pour les développeurs ?

X-DiffVLA : têtes d'action par diffusion pour modèles VLA multi-corps

INSIGHT : introspection de séquence au moment de l'inférence pour générer des déclencheurs d'aide dans les modèles VLA

Hassabis voit l'humanité « au pied de la singularité », LeCun conteste l'intelligence des IA actuelles

VLANeXt : recettes pour construire des modèles VLA performants

Google associe son modèle Genie à Street View pour créer des mondes IA explorables basés sur des lieux réels

COBALT : apprentissage robotique collaboratif par téléopération cloud via smartphones

NVIDIA et Google Cloud misent sur la prochaine génération de créateurs en IA

Agora-1 transforme le classique GoldenEye N64 en simulation IA jouable à quatre

OxyGen : gestion unifiée du cache KV pour l'inférence de modèles VLA en parallélisme multi-tâches

Apprentissage de la continuation native pour les politiques de flux par découpage d'actions

SADP : politique de diffusion consciente des sous-objectifs pour robots explicables, apprise à partir de démonstrations générées par modèle fondation

Amorçage auto-supervisé du raisonnement incarné pour la prédiction d'actions

Quoi ignorer, quoi traiter : affinage par renforcement des modèles VLA robustes aux distracteurs visuels

FrameSkip : apprendre à partir de moins de frames mais plus informatifs dans l'entraînement des modèles VLA

MatterSim : vers une IA pour les matériaux plus rapide, multi-tâches et orientée synthèse expérimentale

NoTVLA : adapter les robots humanoïdes via des interfaces d'action narratives sans modifier le modèle VLA

Latent Reasoning VLA : pensée latente et prédiction pour les modèles vision-langage-action

Sam Altman troublé par son IA : GPT-5.5 commence à demander des faveurs

Google teste l'agent IA Remy pour Gemini, avec un accent mis sur le contrôle utilisateur