Dossier Agents IA — page 4

1550 articles · page 4 sur 31

Les agents IA : déploiements en production, écart pilote/prod, débat sur la confiance, agent debt et négociations automatisées.

151NVIDIA AI Blog InfrastructureActu

NVIDIA et ses partenaires transforment la publicité et le marketing avec l'IA à Cannes Lions

Au festival Cannes Lions, qui se tient du 22 au 26 juin en France, plusieurs entreprises partenaires de NVIDIA présentent leurs solutions d'intelligence artificielle pour transformer la publicité et le marketing à grande échelle. Parmi elles : Alembic, Amazon Web Services (AWS), Criteo, Higgsfield, KERV.ai et Taboola. Alembic, spécialisée dans l'IA causale, sera la première entreprise du secteur à utiliser les systèmes NVIDIA DGX Vera Rubin SuperPODs pour modéliser les véritables moteurs de croissance marketing, non plus de simples corrélations, mais des relations de causalité réelles entre canaux, marchés et audiences. Criteo, qui gère l'un des plus grands réseaux de recommandation publicitaire au monde, a quant à elle atteint une accélération d'environ deux fois plus rapide dans l'entraînement de ses modèles grâce aux GPU NVIDIA Blackwell et à la bibliothèque open source cuEmbed, libérant ainsi près de 17 000 heures de GPU par an. AWS propose de son côté une pile d'infrastructure clé en main pour les acteurs de l'adtech, permettant de faire tourner des modèles d'IA directement dans les fenêtres d'enchères en temps réel via NVIDIA Triton Inference Server. Taboola utilise ces mêmes GPU pour alimenter DeeperDive, son moteur de réponses conversationnelles. Ces annonces illustrent un basculement profond dans l'industrie publicitaire : là où le numérique avait apporté la vitesse, l'IA apporte désormais l'autonomie opérationnelle. Pour les régies et plateformes publicitaires, l'enjeu n'est plus de savoir si elles adopteront l'IA, mais si leur infrastructure pourra suivre le rythme. La capacité à enchérir, recommander et optimiser en quelques millisecondes sur des milliards de transactions quotidiennes nécessite une puissance de calcul que seuls les GPU spécialisés peuvent fournir aujourd'hui. Pour Criteo, gagner 17 000 heures GPU par an, c'est concrètement réduire les coûts de calcul tout en améliorant la pertinence des recommandations produit pour des centaines de millions d'acheteurs. Pour les annonceurs utilisant AWS, passer de règles manuelles à des modèles d'IA pour l'optimisation des prix d'enchère représente un avantage concurrentiel direct sur les marchés programmatiques. Cette convergence entre NVIDIA et l'écosystème publicitaire s'inscrit dans une dynamique plus large d'industrialisation de l'IA à l'échelle des entreprises. NVIDIA, dont les GPU dominent le marché de l'entraînement des modèles d'IA, cherche désormais à s'imposer aussi dans l'inférence à la milliseconde, le moment où l'IA doit prendre une décision en production. Cannes Lions, rendez-vous annuel de l'industrie créative et publicitaire mondiale, devient ainsi une vitrine technologique où les fournisseurs d'infrastructure rivalisent pour convaincre les grandes marques et agences que l'IA agentique, des systèmes capables de planifier, exécuter et optimiser des campagnes de manière autonome, est désormais prête pour le déploiement en entreprise.

UECriteo, acteur français majeur de l'adtech, économise 17 000 heures GPU par an grâce aux puces NVIDIA Blackwell, renforçant directement sa compétitivité sur les marchés programmatiques européens.

Dossier Agents IA — page 4

NVIDIA et ses partenaires transforment la publicité et le marketing avec l'IA à Cannes Lions

Intelligence contextuelle pour vos données et agents IA à grande échelle

Amazon Bedrock AgentCore : des agents plus informés et capables d'apprentissage continu

HSBC et Google Cloud scellent un partenariat pour l’IA bancaire

DeLM de Stanford réduit de 50 % les coûts des tâches multi-agents, sans orchestrateur central

Les assureurs réorientent leur stratégie IA vers la souscription des risques fondamentaux

Les tests d'intrusion appliqués à l'IA : définition et enjeux

Détection des pannes et analyse des causes racines des agents IA avec Strands Evals

Coder à l'intuition peut créer votre pipeline, mais ne l'expliquera pas six mois plus tard

WANIWANI lève 8 millions de dollars : après les comparateurs, les agents IA ouvrent une nouvelle bataille de l’intermédiation

L'IRE identifie un autre spécimen de LOTUSLITE

NanoClaw et JFrog lancent un 'système immunitaire' pour bloquer le téléchargement de code malveillant par les agents IA

Coinbase for Agents : automatiser le trading de portefeuille grâce à l'IA

Moonshot AI lance Kimi Work, un agent de bureau qui exploiterait Kimi K2.6 et un essaim de 300 sous-agents

NotebookLM de Google intègre désormais un ordinateur cloud avec exécution de code et recherche à base d'agents

Anthropic lance Claude Fable 5 et Claude Mythos 5 : même modèle de base, garde-fous distincts, nouvelle catégorie Mythos

Cohere publie en open source un agent de code fonctionnant sur un seul H100

Hey Siri, voici l'IA

Red Hat et NVIDIA dévoilent une nouvelle infrastructure dédiée aux agents IA

Les agents IA ancrés dans le monde réel

Moonshot AI vise une valorisation de 30 milliards de dollars avec une nouvelle levée de fonds

Gemma 4 12B permet des flux de travail multimodaux à base d'agents sur appareil, sans encodeur

Pourquoi les stablecoins pourraient devenir la monnaie native des agents IA

Avec Qwen3.7-Plus, Alibaba veut transformer l'IA multimodale en agent autonome à part entière

Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents

Les 15 meilleurs outils de vibe coding en 2026 : prix, fonctionnalités et cas d'usage

550 milliards de paramètres : NVIDIA dévoile son plus gros modèle open source

Meta envisage de facturer jusqu'à 200 dollars par mois pour son agent IA "Hatch

Monako : Ces lunettes connectées ne veulent pas filmer vos vacances, elles veulent coder

Améliorez la précision des appels d'outils de vos agents avec SFT et DPO sur Amazon SageMaker AI

Nous Research publie Hermes Desktop : une interface native multiplateforme pour Hermes Agent v0.15.2 avec sortie en streaming

Alibaba lance Qwen3.7-Plus : texte, vidéo et images pour 0,4 $/1,6 $ par million de tokens, mais en source fermée

Perplexity AI présente son système d'inférence hybride local-cloud au Computex 2026

Baz améliore la précision de la revue de code par agents IA grâce à Amazon Bedrock AgentCore

Les nouveaux agents IA de Zip visent à empêcher les équipes financières d'uploader des contrats dans ChatGPT

JetBrains lance Mellum2 : un modèle MoE de 12 milliards de paramètres pour les tâches spécialisées dans les pipelines IA multi-modèles

MiniMax publie M3 : architecture MSA, contexte d'un million de tokens, multimodalité native et codage par agents autonomes

OpenAI envisage de publier un outil interne qui affaiblirait l'avantage logiciel de Nvidia

AgentOps : déployer des agents IA à grande échelle avec Amazon Bedrock AgentCore

Asana rachète Stack AI pour renforcer ses agents IA no-code

Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer

J’ai transformé mon PC en développeur IA avec OpenClaw (et voici combien ça me coûte vraiment)

Salesforce : des agents IA ont réduit une migration de 231 jours à 13 jours, avec moins d'incidents

Les agents IA entrent dans une phase de refonte face aux problèmes de fiabilité en entreprise

Le code : outil de raisonnement et d'action des agents IA, pas seulement leur production

Les journaux de requêtes SQL donnent aux agents IA le contexte nécessaire pour éviter les jointures halluccinées

Fini les templates ? CapCut lance Design Studio 2.0, l’IA qui joue les directrices artistiques

Les agents IA provoquent silencieusement des pannes de type chaos engineering que les entreprises ne détectent pas encore

Tutoriel : implémenter GBrain, la couche mémoire auto-câblée de Garry Tan (Y Combinator) pour agents IA

Google I/O illustre comment la science pilotée par l'IA change de trajectoire