Dossier Microsoft — page 9

1107 articles · page 9 sur 23

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

401AWS ML Blog OutilsOutil

Traiter des PDF et en extraire des insights : concevoir un pipeline intelligent avec les services IA générative d'AWS

Amazon Web Services a dévoilé une architecture complète de traitement intelligent de documents reposant sur ses services d'IA générative, notamment Amazon Bedrock Data Automation (BDA). Ce service unifié permet d'extraire des informations structurées depuis des documents multimodaux, PDF, images, vidéos, fichiers audio, avec une capacité allant jusqu'à 3 000 pages et 500 Mo par requête API. Contrairement aux solutions OCR classiques qui se limitent à l'extraction de texte brut, BDA analyse le contexte, classe automatiquement chaque section d'un document dans la bonne catégorie, l'associe au bon modèle de traitement, et fournit des scores de confiance sur les données extraites. L'architecture s'appuie sur quatre couches intégrées : ingestion des fichiers via Amazon S3, extraction et stockage avec DynamoDB, couche d'intelligence sémantique via Amazon Bedrock Knowledge Base, et coordination agentique par des agents spécialisés hébergés sur Amazon Bedrock AgentCore Runtime, orchestrés par AWS Step Functions. Pour les organisations qui traitent chaque jour des millions de documents, contrats juridiques, dossiers médicaux, factures, déclarations d'assurance, cette solution répond à un goulot d'étranglement majeur : l'intervention humaine obligatoire dans les pipelines traditionnels. En automatisant la classification, la normalisation et la validation des données, BDA réduit les coûts opérationnels, accélère les délais de traitement et limite les erreurs de saisie. La capacité à relier plusieurs documents entre eux via une base de connaissances sémantique permet également des analyses croisées impossibles avec les approches OCR conventionnelles, ouvrant la voie à des cas d'usage comme l'audit automatisé de contrats ou l'analyse comparative de rapports financiers. Ce lancement s'inscrit dans une course que se livrent les grands fournisseurs cloud, AWS, Microsoft Azure et Google Cloud, pour proposer des pipelines documentaires clé en main à destination des entreprises. AWS positionne BDA comme une réponse directe aux limites des solutions point-à-point qui nécessitaient jusqu'ici d'assembler manuellement des modèles OCR, des LLM et des orchestrateurs distincts. En intégrant l'ensemble dans une API unifiée au sein de Bedrock, Amazon cherche à réduire la friction technique pour les équipes data et à accélérer l'adoption de l'IA générative dans des secteurs très réglementés comme la finance, la santé et le droit. Les prochaines évolutions attendues concernent l'élargissement des formats supportés et le renforcement des capacités d'analyse de graphiques et de visualisations complexes embarqués dans les documents.

UELes entreprises européennes des secteurs réglementés (finance, santé, droit) peuvent adopter BDA via AWS pour automatiser leurs pipelines documentaires, sous réserve de conformité RGPD quant au stockage des données dans les régions AWS européennes.

Dossier Microsoft — page 9

Traiter des PDF et en extraire des insights : concevoir un pipeline intelligent avec les services IA générative d'AWS

ZoomMate connecte les conversations aux workflows

Apple présente la troisième génération de ses modèles de fondation

Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud

OpenAI : Sam Altman voit l'IA proactive comme la prochaine grande étape après les chatbots et les agents

Meta traque les moindres gestes de ses employés pour nourrir son IA : ils ont dit stop

OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle

Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet

Workday et Google Cloud déploient des agents IA pour les RH et la finance

Nvidia présente RTX Spark comme la puce qui rend enfin les agents IA locaux viables sur Windows

ElegantVLA : apprendre quand raisonner pour des modèles vision-langage-action (VLA) efficaces

Anthropic lance Claude Opus 4.8 : workflows dynamiques, mode rapide moins cher et limite de 1 000 sous-agents

Merck et Mastercard obtiennent des résultats concrets avec les agents IA : l'infrastructure d'abord

Les meilleures plateformes d'authentification pour agents IA et serveurs MCP en 2026

Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI

Nvidia bat tous les records et SpaceX vise des horizons illimités

L'équipe Qwen d'Alibaba lance Qwen3.5-LiveTranslate-Flash : interprétation multimodale en temps réel dans 60 langues avec une latence de 2,8 secondes

Plus besoin de micro, Alexa+ se lance maintenant dans les podcasts IA

☕️ Le pape lance une commission sur l’intelligence artificielle

ChatGPT veut accéder à votre compte bancaire pour analyser vos dépenses

Anthropic lance Claude pour les PME afin d'intégrer l'IA dans vos outils du quotidien

Gemini Intelligence : 7 choses que votre Android va (enfin) faire à votre place

Google DeepMind présente un pointeur de souris IA propulsé par Gemini, capable de capturer le contexte visuel et sémantique autour du curseur

Perceptron Mk1 présente un modèle d'analyse vidéo très performant, 80 à 90 % moins cher qu'Anthropic, OpenAI et Google

Personal Computer : le « Claude Cowork » de Perplexity est enfin accessible à tous

Au-delà de ChatGPT : les outils d’IA les plus utilisés dans les bureaux français

Les émissions de gaz à effet de serre des data centers pourraient dépasser celles de nations entières

Google lance ses puces TPU 8, trois fois plus puissantes, pour accélérer l'entraînement IA et réduire les coûts cloud

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

Nvidia Rubin Ultra : le GPU qui transformera les AI Factories en 2027

Meta formerait des agents IA en surveillant les souris et claviers de ses employés

La mise à jour de Codex pose les bases de la « superapp » d’OpenAI

Les bons résultats de TSMC confirment l'élan de l'IA

Une étude Databricks montre que les agents multi-étapes surpassent le RAG mono-requête sur des sources multiples

The Download : l'état de l'IA et la protection des ours par drones

Cisco en négociations pour acquérir la startup de sécurité IA Astrix pour au moins 250 millions de dollars

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?

AWS Agent Registry : la gestion des agents à grande échelle désormais en prévisualisation

OpenAI prévoit que le marché publicitaire atteindra 102 milliards de dollars d'ici 2030

Le trafic issu des LLM convertit à 30-40 % et la plupart des entreprises n'en tirent pas parti

ChatGPT, Gemini, Claude… Pika donne un visage (et une voix) à toutes vos IA !

TensorWave peut-il dépasser l'avantage concurrentiel de Nvidia ?

On a testé Perplexity Computer : c’est révolutionnaire, mais ça coute cher

Gemma 4 : intelligence multimodale de pointe sur appareil

Améliorer la qualité et la robustesse des systèmes de synthèse vocale basés sur les LLM

Apple change de cap : Siri va regrouper ChatGPT, Gemini et toutes les IA !

NVIDIA GTC : l'Omniverse au service de l'IA physique

IA pratique : cessez de confier vos secrets aux services d’IA

Sanders et AOC proposent d'interdire la construction de centres de données

Trustpilot s'associe à des entreprises d'IA face au déclin de la recherche traditionnelle