Dossier AWS — page 3

829 articles · page 3 sur 17

Ce qu'on suit chez AWS côté IA : Bedrock et ses modèles, SageMaker, les puces Trainium et Inferentia, l'investissement dans Anthropic et l'offre cloud IA.

101AWS ML Blog InfrastructureActu

Couchbase construit une architecture IA multi-modèle pour Capella iQ avec Amazon Bedrock

Le fournisseur de bases de données Couchbase a fait évoluer son assistant de développement Capella iQ pour s'appuyer sur Amazon Bedrock et la famille de modèles Claude d'Anthropic, en remplacement d'une architecture d'inférence à modèle unique. Le projet, décrit dans un billet co-écrit avec Tushar Madaan de Couchbase, repose sur une infrastructure déployée sur deux régions AWS, us-east-1 et us-west-2, afin de garantir une haute disponibilité. Un cluster Amazon EKS héberge trois microservices clés dans us-east-1 : cp-api, qui reçoit les requêtes des développeurs et orchestre les appels d'inférence ; cp-internal-api, qui gère la communication interne et la logique de routage des modèles ; et cp-ns, qui gère la configuration au niveau des espaces de noms, notamment les préférences de fournisseur de modèles par client. Un point de terminaison d'interface VPC assure une connectivité privée entre ce cluster et le runtime d'Amazon Bedrock, permettant d'exploiter l'inférence multi-région (Cross-Region Inference, ou CRIS) sur trois régions américaines : us-east-1, us-east-2 et us-west-2. Cette bascule répond à un besoin très concret de résilience opérationnelle et de flexibilité pour les grandes entreprises clientes de Couchbase. En s'appuyant sur l'inférence multi-région d'Amazon Bedrock, Capella iQ peut absorber des pics de trafic soudains et basculer automatiquement vers une région disponible en cas de dégradation, sans capacité pré-provisionnée et sans logique applicative supplémentaire à gérer côté Couchbase. Autre point important pour les clients entreprise : l'intégralité du trafic d'inférence, prompts et réponses inclus, transite exclusivement par l'infrastructure privée d'AWS et ne passe jamais par l'internet public, ce qui répond aux exigences de sécurité et de résidence des données propres à ce type de clientèle. Concrètement, quand un développeur demande à Capella iQ de générer une requête SQL++, de recommander un index ou de poursuivre une conversation multi-tours, le pod cp-api authentifie la demande, récupère le contexte de session, construit le prompt en intégrant l'historique de conversation, puis transmet l'appel via le point de terminaison VPC vers Bedrock, avant de renvoyer la réponse normalisée au développeur. Cette évolution s'inscrit dans la tendance plus large des éditeurs de logiciels d'entreprise à adopter des architectures d'inférence agnostiques par rapport au modèle, plutôt que de rester dépendants d'un unique fournisseur de LLM. Face à la croissance de l'adoption de Capella iQ, Couchbase avait besoin d'un système capable de s'adapter aux préférences de déploiement variées de ses clients tout en conservant une infrastructure scalable et robuste. Le choix d'Amazon Bedrock comme couche d'inférence permet à Couchbase de bénéficier directement des capacités de basculement régional et de répartition de charge gérées par AWS, sans avoir à développer cette logique en interne. Cette approche illustre aussi comment les modèles Claude d'Anthropic s'intègrent de plus en plus dans des produits d'infrastructure de données critiques, où la fiabilité, la confidentialité des données et la conformité pèsent autant que la qualité pure des réponses générées.

Dossier AWS — page 3

Couchbase construit une architecture IA multi-modèle pour Capella iQ avec Amazon Bedrock

Grok arrive sur Amazon Bedrock

Flo Health met à l'échelle la revue de contenu médical avec Amazon Bedrock (partie 2)

L'IA d'AWS et Bluesight pour la conformité 340B des hôpitaux

Bluesight construit une solution IA à base d'agents avec Amazon Bedrock

Les défenseurs adoptent aussi l'injection de prompts

Déploiement de modèles quantifiés sur Amazon SageMaker AI avec Unsloth

KTern.AI développe une IA à base d'agents pour SAP sur Amazon Bedrock AgentCore

Automatiser le tri et la priorisation de vos boîtes mail avec Amazon Bedrock

L'article mentionne Mistral AI Studio, pas seulement Anthropic ou une autre techno propriétaire, mais je vais quand même traduire simplement le titre technique demandé

Face aux géants américains, Mistral AI et Naver misent sur l’IA industrielle souveraine

Traduction concise et factuelle du sens réel

Se retire de GovCloud (US) : NVIDIA Nemotron et OpenAI GPT OSS accessibles sur Amazon Bedrock

HippoRAG : RAG neuro-inspiré avec Amazon Bedrock, Amazon Neptune et un PageRank personnalisé

Dans l’ombre de Mythos et Fable ressuscités, la Chine progresse rapidement

Sécuriser le déploiement des modèles de pointe auprès des clients

« Simplifier l'accès multi-comptes aux modèles Amazon Bedrock avec les habilitations gérées »

« Mise en œuvre de patterns de résilience avec Amazon Bedrock et une passerelle LLM »

Building une NER bilingue pour la logistique cargo avec Amazon Bedrock

Les agents IA ont besoin de contexte partout, même là où le cloud ne peut pas les suivre

Construire un pipeline de traitement des dossiers de santé avec des agents IA sur Amazon Bedrock et AWS HealthLake

Claude Code a triplé la productivité des ingénieurs : les entreprises manquent maintenant de concepteurs produit

Vercel lance Eve, un framework open source pour créer des agents IA

Des agents IA en production pour la conformite financiere : les lecons de Stripe

Les surcouches à base d'agents pour moderniser les services d'entreprise existants

Analyser AWS Health en libre-service avec les agents IA d'Amazon Bedrock

Fable 5 : un indice découvert dans le code de Claude relance l’espoir d’un retour

Mistral lance OCR 4, un outil d'extraction documentaire taillé pour l'IA en entreprise

Créer un agent de prise de rendez-vous médicaux avec Amazon Nova 2 Sonic

Business Intelligence pilotée par l'IA avec Snowflake et Amazon Quick

Mistral OCR 4 apporte des sorties structurées prêtes à citer aux pipelines RAG, agents autonomes et recherche d'entreprise

Together AI et Hugging Face profitent de l'essor de l'open source

Infrastructure partagée, locataires isolés : la mutualisation multi-tenant avec Amazon Bedrock AgentCore

ComfyUI sur Amazon SageMaker : exécuter des workflows de traitement

Copilot a fouillé vos emails, LiteLLM a exposé des clés admin : faites cet audit en 5 points

AWS prépare une nouvelle génération d’agents IA d’entreprise

AWS rejoint la course à la couche contextuelle avec un graphe enrichi par les agents, sans curation manuelle

Intelligence contextuelle pour vos données et agents IA à grande échelle

Les puces IA moins coûteuses d'Amazon séduisent les entreprises

La mise en cache des conteneurs dans Amazon SageMaker AI accélère le déploiement des modèles

Google Cloud soutient l’ambition de superintelligence d’Ineffable Intelligence

Amazon et cinq autres entreprises auraient déclenché les mesures gouvernementales contre le modèle Fable d'Anthropic

Traiter des PDF et en extraire des insights : concevoir un pipeline intelligent avec les services IA générative d'AWS

Pourquoi Microsoft et d'autres clients d'Anthropic ont tardé à adopter Claude Fable

☕️ Microsoft bloque Claude Fable 5 en interne à cause de la rétention des données

Créer un assistant de réparation d'équipements alimenté par l'IA avec Amazon Bedrock AgentCore

Premier avis de sinistre automatisé : Strands Agents et Amazon Bedrock AgentCore pour un traitement intelligent des déclarations

IBM et Google Cloud veulent accélérer l’adoption de l’IA dans les entreprises

Generalist lève 400 millions de dollars pour développer ses modèles d'IA généralistes

Amazon déploie son assistant shopping IA chez les enseignes, dont Kate Spade