Dossier AWS — page 6

811 articles · page 6 sur 17

Ce qu'on suit chez AWS côté IA : Bedrock et ses modèles, SageMaker, les puces Trainium et Inferentia, l'investissement dans Anthropic et l'offre cloud IA.

251AWS ML Blog LLMsActu

Grok arrive sur Amazon Bedrock

xAI a annoncé la disponibilité générale de son modèle Grok 4.3 sur Amazon Bedrock, une intégration coécrite avec Eric Jiang, responsable chez xAI (filiale de SpaceX). xAI devient ainsi fournisseur de modèles sur la plateforme Bedrock d'Amazon. Grok 4.3 se distingue par un niveau d'effort de raisonnement configurable, quatre paliers disponibles (aucun, faible, moyen, élevé) que les développeurs peuvent ajuster selon chaque requête. Le modèle accepte du texte et des images en entrée, dispose d'une fenêtre de contexte d'un million de tokens et tourne sur Mantle, le nouveau moteur d'inférence d'Amazon Bedrock qui utilise des API compatibles OpenAI plutôt que l'API Runtime classique de Bedrock. Selon les benchmarks internes publiés par xAI au moment du lancement, Grok 4.3 s'est classé numéro un sur le test Omniscience d'Artificial Analysis, avec le taux d'hallucination le plus bas parmi les modèles de pointe comparés. Il occupe également la première place du benchmark Tau2 Telecom d'Artificial Analysis, qui évalue l'appel d'outils dans des scénarios de support client, ainsi que des tests Vals AI portant sur le droit jurisprudentiel et la finance d'entreprise. xAI affirme que le modèle se situe sur la frontière de Pareto entre intelligence et coût, avec un rapport allant jusqu'à dix fois plus d'intelligence par dollar dépensé que d'autres modèles concurrents. Cette annonce compte pour les équipes qui développent des agents et des flux de travail automatisés en entreprise, car elle leur offre un modèle unique capable de couvrir tout un éventail de tâches sans changer d'outil. Une simple classification peut tourner avec un effort de raisonnement nul pour minimiser la latence, tandis qu'une analyse de contrat ou de jurisprudence peut mobiliser le niveau élevé lorsque la profondeur d'analyse prime sur la vitesse de réponse. Cette flexibilité, combinée à la gestion fiable des appels d'outils et au respect des instructions, rend le modèle particulièrement adapté à des usages comme la révision de contrats, l'analyse de conventions de crédit ou les questions-réponses sur des documents financiers volumineux, des tâches où le modèle doit à la fois raisonner sur de longs textes et interagir avec des systèmes externes. Cette intégration s'inscrit dans la stratégie d'Amazon Web Services visant à diversifier les modèles disponibles sur Bedrock au-delà de ses partenaires historiques, en ouvrant la porte à des fournisseurs tiers comme xAI. Pour les développeurs, l'accès à Grok 4.3 passe par le SDK OpenAI ou des requêtes HTTPS directes vers l'API Chat Completions ou l'API Responses, via une URL propre à chaque région AWS, par exemple https://bedrock-mantle.us-west-2.api.aws/openai/v1 pour la région us-west-2. Les paramètres par défaut diffèrent aussi légèrement de la norme OpenAI : la température est fixée à 0,7 au lieu de 1, le top_p à 0,95 au lieu de 1, et le nombre maximal de tokens de complétion à 131 072 par défaut, des réglages que les équipes doivent ajuster explicitement si leur application l'exige.

UELes développeurs et entreprises françaises utilisant AWS pourront accéder à Grok 4.3 via les régions européennes de Bedrock, mais aucune entreprise ou régulation française/européenne n'est directement impliquée.

Dossier AWS — page 6

Grok arrive sur Amazon Bedrock

Un hôte téléphonique IA pour restaurants avec Amazon Bedrock AgentCore et Amazon Nova 2 Sonic

« Datalab Lift face à la concurrence : comment un extracteur à 9 milliards de paramètres, guidé par schéma, se compare à NuExtract3, LlamaExtract, Marker et Docling »

Amazon Nova permet de masquer automatiquement les données personnelles dans les images

Sécuriser le déploiement des modèles de pointe auprès des clients

Créer un agent de prise de rendez-vous médicaux avec Amazon Nova 2 Sonic

Les lois d'échelle, examinées avec rigueur

L'IA multimodale appliquée à la recherche d'images aériennes à grande échelle

ComfyUI sur Amazon SageMaker : exécuter des workflows de traitement

Surveiller et déboguer l'inférence IA générative avec SageMaker sur CloudWatch

La mise en cache des conteneurs dans Amazon SageMaker AI accélère le déploiement des modèles

Créer un assistant de réparation d'équipements alimenté par l'IA avec Amazon Bedrock AgentCore

Comment déployer des opérations IA autonomes à grande échelle sur Amazon Bedrock

Détection d'objets avec Amazon Nova 2 Lite

Amazon Bedrock AgentCore Gateway étend sa prise en charge du protocole MCP

72 GPU dans un seul rack : Dell livre le premier Vera Rubin NVL72 à CoreWeave

Les fournisseurs d'inférence connaissent-ils un essor ?

L’IA physique : le prochain marché que surveille déjà Wall Street

Amazon Nova Act est désormais éligible à la conformité HIPAA

Agent vocal scalable avec Amazon Nova Sonic : multi-agents, outils et segmentation de session

Applications de streaming vocal en temps réel avec Amazon Nova Sonic et WebRTC

Affiner un LLM avec Databricks Unity Catalog et Amazon SageMaker AI

Des agents avec recherche web grâce à Strands et Exa

OpenClaw vs Hermes Agent : Nous Research domine le classement mondial d'OpenRouter avec son agent auto-améliorant

9 meilleurs outils IA pour le développement piloté par les specs en 2026 : Kiro, BMAD, GSD et plus encore

Tutor Intelligence crée une Data Factory pour entraîner ses robots par IA dans le monde réel

Hapag-Lloyd utilise Amazon Bedrock pour transformer les retours clients en informations exploitables

Les agents IA ratent toutes les discussions de votre équipe. SageOX propose une infrastructure de contexte pour agents autonomes

Exploiter l'analyse IA à base d'agents sur Amazon SageMaker avec Amazon Athena et Amazon Quick

Configurer Amazon Bedrock AgentCore Gateway pour un accès sécurisé aux ressources privées

Groupe SoftBank lance une pépite robotique déjà valorisée 100 milliards

Amazon Quick Flows automatise les tâches répétitives

Créer des agents Strands avec les modèles SageMaker AI et MLflow

Créez votre premier agent en quelques minutes : nouvelles fonctionnalités d'Amazon Bedrock AgentCore

Traçabilité de bout en bout avec DVC et Amazon SageMaker AI MLflow

Amazon SageMaker AI accélère l'inférence d'IA générative avec les instances G7e

Optimiser la recherche sémantique vidéo avec la distillation de modèles Amazon Nova sur Amazon Bedrock

Génération SQL à partir de texte : une approche économique avec Amazon Nova Micro et Bedrock

L'Agents SDK d'OpenAI renforce la gouvernance avec l'exécution en sandbox

DustPhotonics : La nouvelle cible prioritaire d’Intel et Nvidia dans l’IA

Amazon Bedrock AgentCore permet d'intégrer un agent IA de navigation en direct dans une application React

Des agents en essaim : présentation d'une approche ludique et rentable

La gouvernance peut-elle suivre vos ambitions en IA ? Gestion du risque à l'ère des agents autonomes

Le groupe Volkswagen réinvente son marketing avec l'IA générative

Construire un système de détection des éruptions solaires sur SageMaker AI avec des réseaux LSTM et les données ESA STIX

Créer une IA adaptée à l'âge et au contexte avec Amazon Bedrock Guardrails

Amazon Polly introduit le streaming bidirectionnel pour la synthèse vocale en temps réel

Les propriétés de mise à l'échelle des métriques aval dans l'entraînement des grands modèles de langage

Amazon Bedrock propose l'ajustement par renforcement via des API compatibles OpenAI : guide technique

Une visite exclusive du laboratoire Trainium d'Amazon, la puce qui a conquis Anthropic, OpenAI et même Apple