Aller au contenu principal
OutilsThe Information AI2h

Google Gemini prend de l'avance sur OpenAI

1 source couvre ce sujet·Source originale ↗·
Résumé IA

Google a discrètement lancé une fonctionnalité d'agent IA dans son app Gemini, permettant aux utilisateurs de Pixel et Samsung de commander un Uber ou un repas via DoorDash directement depuis l'application. Cette capacité d'automatisation de tâches, annoncée sans grand tapage le mois dernier, fonctionne déjà concrètement — contrairement à ChatGPT d'OpenAI qui ne propose pas encore l'équivalent. Google marque ainsi un point dans la course aux agents IA véritablement opérationnels.

Articles similaires

1MarkTechPost1h

Luma Labs lance Uni-1 : le modèle Transformer autorégressif qui raisonne par intentions avant de générer des images

Luma Labs vient de lancer Uni-1, un modèle de génération d'images basé sur une architecture transformer autorégressif decoder-only, qui se distingue des modèles de diffusion classiques (comme Stable Diffusion ou Flux) en traitant texte et images comme une séquence unifiée de tokens. Avant de générer une image, le modèle effectue une phase de raisonnement pour comprendre les intentions spatiales et logiques de l'instruction, ce qui lui permet de surpasser Flux Max et Gemini sur les benchmarks RISEBench et ODinW-13. Accessible sur lumalabs.ai/uni-1 au tarif d'environ 0,10 $ par image, Uni-1 accepte des instructions en langage naturel sans nécessiter de prompt engineering élaboré.

OutilsActu
1 source
2Ars Technica AI5h

Le PDG de Nvidia tente d'expliquer pourquoi DLSS 5 n'est pas du "contenu IA de mauvaise qualité

Jensen Huang, PDG de Nvidia, a défendu DLSS 5 face aux critiques de la communauté gaming qui l'accusait de produire de l'"AI slop". Il a expliqué que la technologie reste guidée par les artistes du jeu, qui définissent la géométrie et les textures 3D servant de "structure de référence" — DLSS 5 améliore chaque image sans en modifier le contenu. Huang a précisé lors du podcast Lex Fridman que cette approche "conditionnée par la 3D" la distingue fondamentalement des contenus IA génériques qu'il dit lui-même ne pas apprécier.

OutilsActu
1 source
3The Decoder7h

L'Uni-1 de Luma AI pourrait être le premier vrai rival à la domination de Google Nano Banana en génération d'images

Luma AI lance Uni-1, un modèle qui combine compréhension et génération d'images au sein d'une architecture unifiée, capable de raisonner à travers les prompts pendant la création. Ce nouveau modèle se positionne comme un concurrent direct à OpenAI et Google, notamment face au modèle Nano Banana de Google qui domine actuellement le marché de la génération d'images.

OutilsActu
1 source