Aller au contenu principal

Dossier Microsoft — page 13

1056 articles · page 13 sur 22

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

Optimiser vos budgets IT : Flezi Foundry automatise la chaîne de valeur
601Le Big Data OutilsOutil

Optimiser vos budgets IT : Flezi Foundry automatise la chaîne de valeur

Le groupe informatique vietnamien FPT a lancé Flezi Foundry, une plateforme SaaS qui intègre des agents d'intelligence artificielle spécialisés dans l'ensemble du cycle de vie des projets logiciels. Concrètement, ces agents autonomes prennent en charge le codage, les tests de sécurité et la documentation technique, tandis que les ingénieurs humains conservent un rôle de superviseur pour valider les décisions et garantir la qualité finale. Frank Bignone, haut dirigeant chez FPT, présente cette approche comme le passage à une ère où l'intelligence est intégrée au fonctionnement même des services, et non plus seulement aux outils utilisés. La plateforme ambitionne également d'automatiser entre 60 % et 90 % des demandes de support de premier niveau grâce à un module de services managés capable de trier les alertes et de résoudre les incidents sans intervention humaine, avec un engagement de disponibilité fixé à 99,5 %. L'enjeu central est économique et organisationnel : FPT promet un gain de productivité de 30 % sans augmentation des budgets IT, ce qui représente une proposition directement adressée aux directions informatiques soumises à des pressions croissantes de réduction des coûts. En libérant les ingénieurs des tâches répétitives, l'entreprise mise sur une réaffectation de la valeur humaine vers des problèmes plus complexes. Pour les grandes organisations qui externalisent une partie de leur développement logiciel, ce modèle pourrait modifier en profondeur la structure des contrats de sous-traitance et redéfinir ce qu'on attend d'un prestataire IT. L'infrastructure repose sur un mix cloud privé et ressources propres de FPT, un argument de sécurité destiné à rassurer les directions techniques réticentes à confier des systèmes critiques à des agents automatisés. FPT, dont les centres de compétences sont principalement implantés au Vietnam et au Japon, s'inscrit dans une vague plus large de plateformes d'ingénierie agentique qui émergent en 2025 et 2026, portées par la maturité croissante des grands modèles de langage capables de produire et de déboguer du code de manière autonome. Face aux craintes que suscite l'automatisation massive, le groupe a structuré un parcours d'intégration progressif : analyse des besoins, pilotes en conditions réelles, puis comparaison mesurée des performances avant et après déploiement. Cette approche par étapes vise à limiter les risques perçus et à construire la confiance des clients avant une adoption plus large. FPT positionne ainsi Flezi Foundry comme un modèle potentiellement standard pour la collaboration homme-machine dans l'industrie IT mondiale, dans un marché où Microsoft, Google et des dizaines de startups se livrent une concurrence intense sur le même territoire.

UELes grandes organisations européennes qui externalisent leur développement logiciel pourraient voir la structure de leurs contrats IT évoluer si ce modèle agentique se généralise, mais FPT ne dispose pas de présence significative en France ou en Europe.

1 source
Conférence CVPR 2026 sur la vision par ordinateur et la reconnaissance de formes
602Apple Machine Learning 

Conférence CVPR 2026 sur la vision par ordinateur et la reconnaissance de formes

Apple sera présent à la conférence CVPR 2026 (IEEE/CVF Conference on Computer Vision and Pattern Recognition), qui se tient en présentiel à Denver, au Colorado Convention Center, du 3 au 7 juin 2026. L'entreprise y présente de nouveaux travaux de recherche et en assure la sponsorisation, confirmant ainsi son engagement continu auprès de la communauté scientifique mondiale spécialisée en vision par ordinateur et en reconnaissance de formes. La participation d'Apple à ce type d'événement illustre la montée en puissance de sa stratégie de recherche publique. En publiant ses travaux à CVPR, l'un des rendez-vous académiques les plus influents dans le domaine de l'intelligence artificielle visuelle, Apple signale ses priorités technologiques tout en attirant des talents issus du milieu universitaire. Pour l'industrie, cette visibilité académique est devenue un levier de recrutement et de légitimité scientifique face à des concurrents comme Google DeepMind, Meta AI ou Microsoft Research, qui investissent massivement dans la publication ouverte. CVPR est considéré comme l'une des conférences les plus sélectives et les plus citées en intelligence artificielle, rassemblant chaque année plusieurs milliers de chercheurs du monde entier. Apple, longtemps critiqué pour son opacité scientifique comparée à ses rivaux, a progressivement ouvert sa recherche au cours des dernières années, notamment via son blog officiel et des publications dans des conférences de premier plan. Le contenu précis des travaux présentés à Denver devrait être détaillé lors de l'événement début juin.

RecherchePaper
1 source
AWS SMGS transforme sa gestion commerciale avec un assistant conversationnel IA sur Amazon Bedrock AgentCore
603AWS ML Blog 

AWS SMGS transforme sa gestion commerciale avec un assistant conversationnel IA sur Amazon Bedrock AgentCore

Amazon Web Services a déployé en interne un assistant conversationnel basé sur l'intelligence artificielle, baptisé NarrateAI, pour transformer la façon dont les dirigeants de son organisation SMGS (Sales, Marketing and Global Services) accèdent aux données métier. Développé sur Amazon Bedrock AgentCore et accessible via l'interface Amazon Quick, l'outil permet à tous les niveaux hiérarchiques, du PDG aux équipes terrain, de poser des questions en langage naturel sur la performance commerciale et d'obtenir des réponses immédiatement exploitables. L'architecture repose sur deux couches distinctes : une couche de traitement par lots qui génère en amont des narratives personnalisées par utilisateur à partir de requêtes SQL paramétrées sur Amazon Redshift, et une couche temps réel qui répond aux questions de manière conversationnelle. AWS Lambda transforme les données extraites en JSON structuré, tandis que des templates Jinja les restituent en textes lisibles. Le recours à Bedrock AgentCore a permis de réduire le délai de déploiement de plusieurs mois à quelques semaines, en évitant de construire une infrastructure d'orchestration sur mesure. L'enjeu concret est significatif : les dirigeants AWS consacraient auparavant plusieurs heures à préparer manuellement leurs revues métier, en naviguant entre de multiples tableaux de bord et en réconciliant des sources de données disparates. NarrateAI supprime cette friction en livrant des analyses contextualisées à la demande, sans intermédiaire. Les équipes de reporting ne sont plus un goulot d'étranglement, et les décisions stratégiques peuvent être prises sur la base de données fraîches plutôt qu'en attendant des rapports consolidés. Pour une organisation de la taille d'AWS SMGS, qui opère à l'échelle mondiale sur des hiérarchies complexes, cette capacité à accéder instantanément à une vue unifiée de la performance représente un avantage opérationnel direct sur la réactivité des décisions commerciales. Ce projet s'inscrit dans une tendance de fond chez les grandes entreprises tech qui cherchent à remplacer la business intelligence traditionnelle, fondée sur des dashboards statiques, par des interfaces conversationnelles pilotées par des agents IA. Amazon Bedrock AgentCore, le service serverless d'AWS pour l'orchestration d'agents, est ici utilisé en interne avant d'être commercialisé auprès des clients, une stratégie classique chez AWS qui consiste à "dogfooder" ses propres services. La publication de ce retour d'expérience détaillé, incluant les patterns d'ingénierie et les choix architecturaux, vise clairement à convaincre les entreprises clientes d'adopter la même stack. Alors que les concurrents comme Microsoft et Google avancent eux aussi sur les agents IA d'entreprise, AWS positionne NarrateAI comme une vitrine de ce qu'il est possible de construire rapidement et en production avec Bedrock AgentCore.

OutilsOutil
1 source
Créer des agents IA pour la business intelligence avec Amazon Bedrock AgentCore
604AWS ML Blog 

Créer des agents IA pour la business intelligence avec Amazon Bedrock AgentCore

OPLOG, entreprise turque spécialisée dans la logistique e-commerce pilotée par l'IA et la robotique, traite des millions de colis chaque mois en Turquie, au Royaume-Uni et en Allemagne pour des marques internationales et des marketplaces globales. Face à une fragmentation critique de ses données métier réparties entre HubSpot CRM, Microsoft Teams, Databricks et plusieurs autres systèmes indépendants, la société a développé une plateforme de business intelligence (BI) basée sur des agents IA déployés via Amazon Bedrock AgentCore. Concrètement, OPLOG a construit trois agents distincts à l'aide du Strands Agents SDK d'AWS, intégrés avec le modèle Claude Sonnet d'Anthropic et Amazon Bedrock Knowledge Bases pour la recherche par RAG. Les résultats mesurés sont nets : réduction de 35 % des cycles de vente, amélioration de 91 % de la complétude des données CRM, et réduction de 98 % du temps consacré à la recherche manuelle. L'impact opérationnel est significatif pour toute organisation B2B confrontée à des silos de données. Avant ce système, les équipes d'OPLOG passaient plusieurs heures par jour à extraire manuellement des rapports de systèmes disparates, à synthétiser l'information et à préparer des mises à jour. Les rapports hebdomadaires manquaient 60 % des opportunités commerciales, les deals ayant déjà évolué avant que l'analyse soit disponible. Désormais, trois agents autonomes prennent en charge ces tâches en temps réel : le Deal Analyzer Agent tourne selon un calendrier aligné sur l'activité commerciale et analyse les deals HubSpot récents pour vérifier leur conformité méthodologique, en remontant les résultats directement dans Microsoft Teams. Le Sales Coach Agent réagit aux webhooks HubSpot lorsqu'un deal change de stade, valide les champs requis selon le modèle commercial (B2C, B2B, ou mixte), et crée automatiquement des tâches pour les données manquantes. Un troisième agent, dont le détail n'est pas entièrement publié, complète le dispositif côté recherche de prospects. Ce déploiement s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent à faire des agents IA le nouveau standard de l'automatisation d'entreprise. Amazon Bedrock AgentCore, l'environnement d'exécution managé d'AWS pour agents IA, vise à simplifier ce type d'architecture en éliminant la gestion d'infrastructure tout en offrant scalabilité et traçabilité. Le choix de Claude Sonnet (Anthropic) comme moteur de raisonnement positionne AWS dans une logique de multi-partenariat avec les principaux labs IA. Pour des entreprises comme OPLOG, dont la croissance rapide dépasse les capacités des outils BI traditionnels, cette approche par agents spécialisés et indépendants offre une voie pragmatique vers l'automatisation sans refonte complète du système d'information.

UEOPLOG, présent en Allemagne et au Royaume-Uni, illustre une architecture d'agents IA applicable aux entreprises logistiques et B2B européennes pour automatiser leur BI et réduire les silos de données.

OutilsOutil
1 source
« Ingérable » : le fondateur de Linux sévère quant aux identifications de bugs par IA
605Frandroid 

« Ingérable » : le fondateur de Linux sévère quant aux identifications de bugs par IA

Linus Torvalds, créateur et mainteneur principal du noyau Linux, a vivement critiqué la prolifération des rapports de bugs générés par intelligence artificielle lors du déploiement de Linux 7.1 RC4. Dans un message adressé à la liste de diffusion des développeurs du noyau, il a qualifié cette situation d'« ingérable », dénonçant le flot de signalements automatisés envoyés par des utilisateurs utilisant des outils d'IA pour analyser le code source et identifier de supposées vulnérabilités ou erreurs. Le problème, selon Torvalds, ne tient pas à l'intention des contributeurs, mais à la qualité désastreuse des rapports produits. Les outils d'IA génèrent des faux positifs en masse, signalant des « bugs » qui n'en sont pas, ou identifiant des problèmes sans comprendre le contexte architectural du noyau. Les mainteneurs du projet, déjà surchargés, doivent trier manuellement ces centaines de signalements inutiles, ce qui ralentit le vrai travail de développement et épuise les équipes bénévoles qui font tourner l'un des projets open source les plus critiques au monde. Cette prise de position s'inscrit dans un débat plus large sur la place de l'IA dans le développement logiciel. Si les grands éditeurs comme Microsoft ou Google intègrent activement des assistants IA dans leurs workflows de développement, les projets open source communautaires font face à un afflux non régulé de contributions semi-automatisées. Linux n'est pas le premier projet à subir ce phénomène : plusieurs dépôts majeurs sur GitHub ont déjà dû mettre en place des règles strictes pour filtrer les pull requests et issues d'origine artificielle.

SociétéOpinion
1 source
Votre entreprise est-elle prête pour l'IA ?
606VentureBeat AI 

Votre entreprise est-elle prête pour l'IA ?

La grande majorité des entreprises ont abordé l'intelligence artificielle avec un objectif simple : automatiser plus vite, à moindre coût et à grande échelle. Chatbots pour les demandes de service, modèles de machine learning pour les prévisions, tableaux de bord analytiques pour la prise de décision : ces déploiements ponctuels ont constitué la première vague d'adoption. Pourtant, selon une analyse publiée par EdgeVerve, spécialiste des plateformes d'IA d'entreprise, beaucoup d'organisations constatent aujourd'hui que multiplier les solutions individuelles ne se traduit pas automatiquement par un impact à l'échelle de l'entreprise. Les pilotes se succèdent, mais la valeur stagne. La prochaine étape de maturité ne consiste plus à déployer davantage de modèles, mais à faire évoluer l'IA en continu selon les objectifs business, les contraintes réglementaires et les contextes clients. C'est ce que EdgeVerve nomme les "écosystèmes d'IA adaptatifs" : des réseaux d'agents, de modèles, de sources de données et de services de décision capables de fonctionner ensemble de façon dynamique, en intégrant traitement du langage naturel, vision par ordinateur, analytique prédictive et prise de décision autonome, tout en maintenant une supervision humaine. L'enjeu est particulièrement critique pour les organisations dites Global Business Services (GBS), qui pilotent des processus à haut volume dans des marchés aux réglementations et comportements clients très différents. Pour ces structures, l'automatisation statique atteint vite ses limites : elle ne sait pas s'adapter aux signaux en temps réel ni coordonner des flux de travail qui traversent fonctions, régions et systèmes. Les recherches de SSON Research identifient plusieurs freins persistants à l'adoption de l'IA générative dans ce secteur : mauvaise qualité des données, manque de compétences spécialisées, préoccupations autour de la confidentialité, retour sur investissement flou et contraintes budgétaires. Mais derrière ces symptômes, la cause commune est la fragmentation : des données cloisonnées, une gouvernance floue, des initiatives IA pilotées localement sans stratégie partagée. Résultat : les entreprises accumulent des solutions qui ne communiquent pas, des modèles sans contexte commun et une gouvernance traitée comme une formalité plutôt qu'un principe de conception. La distinction que fait EdgeVerve entre "écosystème" et "plateforme" est au coeur de la solution proposée. L'écosystème décrit l'ambition : comment les capacités IA collaborent à l'échelle de l'entreprise. La plateforme en est le socle technique, fournissant des services communs qui permettent aux agents d'accéder à des données harmonisées, d'orchestrer des processus de bout en bout, de s'interconnecter avec les applications existantes et d'opérer dans des périmètres de sécurité et de conformité définis. Sans cette couche plateforme, les écosystèmes adaptatifs restent théoriques. C'est sur ce marché que des acteurs comme EdgeVerve, filiale d'Infosys, se positionnent face à des concurrents comme ServiceNow ou Microsoft, alors que les grandes entreprises cherchent à passer d'une IA de projets pilotes à une IA véritablement opérationnelle et gouvernée.

UELes entreprises européennes soumises à l'AI Act et aux exigences de gouvernance pourraient s'appuyer sur des approches d'écosystèmes adaptatifs pour concilier scalabilité IA et conformité réglementaire.

OutilsActu
1 source
Amazon Quick : accélérer le chemin des données d'entreprise vers les décisions assistées par IA
607AWS ML Blog 

Amazon Quick : accélérer le chemin des données d'entreprise vers les décisions assistées par IA

Amazon vient d'annoncer cinq nouvelles fonctionnalités pour Amazon Quick, sa plateforme d'analyse de données propulsée par l'IA, pensées pour les grandes entreprises qui gèrent des dizaines de millions de lignes de données réparties sur de multiples domaines métier. La fonctionnalité phare, Dataset Q&A, permet à n'importe quel utilisateur de poser une question en langage naturel directement sur ses datasets et d'obtenir une réponse en quelques secondes, sans passer par un analyste ni attendre la création d'un tableau de bord sur mesure. Le système génère automatiquement du SQL, l'exécute sur l'intégralité des données sans échantillonnage, et renvoie un résultat chiffré accompagné d'une explication complète de la logique utilisée : requête SQL générée, filtres appliqués, hypothèses formulées, et résumé en langage courant pour les non-techniciens. Le programme AWS Technical Field Communities a déjà mis cette approche en pratique : la précision des requêtes a progressé de plus de 48 %, et le temps de résolution est passé de 90 minutes à moins de 5 minutes pour une communauté de plus de 15 000 membres. Ce que change Amazon Quick, c'est l'élimination du goulet d'étranglement humain qui ralentit habituellement la prise de décision en entreprise. Lorsqu'un dirigeant veut savoir comment évolue le taux de désabonnement d'un produit, la réponse nécessite aujourd'hui soit un tableau de bord préexistant, soit une requête manuelle par un analyste, soit l'attente d'un ticket résolu en heures, voire en jours. En rendant l'accès aux données aussi direct que poser une question, Amazon Quick réduit ce délai à quelques secondes tout en préservant la gouvernance : les politiques de sécurité au niveau des lignes et des colonnes déjà configurées s'appliquent automatiquement aux requêtes générées par l'IA, sans configuration supplémentaire. L'utilisateur ne voit que ce qu'il est autorisé à voir, peu importe la formulation de sa question. Amazon Quick s'inscrit dans une tendance de fond qui voit les grands fournisseurs cloud chercher à démocratiser l'accès aux données d'entreprise via des interfaces conversationnelles. Face à des concurrents comme Microsoft Fabric avec Copilot ou Google Looker Studio, Amazon mise sur la fiabilité et l'auditabilité des réponses, deux points critiques pour les grandes organisations soumises à des exigences réglementaires strictes. Le défi technique central n'est pas la génération de SQL, mais la résolution des ambiguïtés sémantiques : quand un utilisateur parle de "croissance", entend-il des transactions, des clients, du revenu ou des unités vendues ? La fonctionnalité d'enrichissement sémantique permet aux équipes data de codifier les définitions métier directement dans les métadonnées des datasets, afin que l'IA réponde selon le vocabulaire réel de l'organisation plutôt qu'une interprétation approximative des noms de colonnes.

OutilsOutil
1 source
Amazon QuickSight va plus loin que la BI classique avec sa fonction Questions-Réponses sur les données
608AWS ML Blog 

Amazon QuickSight va plus loin que la BI classique avec sa fonction Questions-Réponses sur les données

Amazon a dévoilé une fonctionnalité appelée Dataset Q&A, intégrée à son outil de business intelligence Amazon QuickSight, qui permet aux équipes d'interroger leurs données en langage naturel sans avoir à construire de nouveaux tableaux de bord. Concrètement, un responsable peut poser une question complexe directement dans une interface de chat et obtenir une réponse précise en quelques secondes, en s'appuyant sur les jeux de données existants. Pour illustrer le potentiel de cette technologie, AWS a développé en interne un agent analytique baptisé TARA (Technical Analysis Research Agent), conçu par l'équipe Specialist Data Lens. TARA connecte plusieurs ensembles de données intégrés, des API système en temps réel et des agents de recherche spécialisés via le protocole MCP, le tout au travers d'une interface conversationnelle unifiée. Le programme AWS Technical Field Communities, qui gère des centaines de milliers d'engagements clients par an dans des dizaines de domaines technologiques, utilise déjà TARA pour piloter ses opérations au quotidien. L'enjeu est considérable pour toute organisation qui dépend de la donnée pour prendre des décisions rapides. Avant l'arrivée de ce type d'outil, une question d'un dirigeant se transformait en interruption pour un ingénieur BI : ce dernier suspendait ses travaux planifiés, construisait l'agrégation demandée, renvoyait une réponse qui générait inévitablement de nouvelles questions. Le vrai coût n'était pas dans l'exécution de la requête, mais dans le délai de transmission entre celui qui pose la question et celui qui dispose des outils pour y répondre. Avec Dataset Q&A, ce goulot d'étranglement disparaît : les équipes explorent librement des dimensions multiples sans file d'attente, sans perturber les tableaux de bord opérationnels dont dépendent leurs collègues. Par ailleurs, TARA gère la protection des données personnelles (PII) de manière native, permettant de faire remonter du contexte qualitatif sensible de façon sécurisée, ce qui était jusqu'ici un obstacle majeur à l'analyse conversationnelle en entreprise. Cette évolution s'inscrit dans une tendance de fond : les outils de BI traditionnels, pensés pour répondre à des questions connues à l'avance, montrent leurs limites face à la complexité croissante des opérations à grande échelle. AWS n'est pas seul sur ce terrain. Microsoft, Google et des acteurs spécialisés comme ThoughtSpot ou Databricks investissent massivement dans des interfaces en langage naturel pour démocratiser l'accès à la donnée. Ce qui distingue l'approche d'Amazon est l'intégration native dans QuickSight, déjà largement déployé chez les entreprises clientes du cloud AWS, et la possibilité de connecter des sources hétérogènes via MCP. TARA reste pour l'instant un outil interne à AWS, mais les capacités Dataset Q&A sur lesquelles il repose sont disponibles pour tous les clients QuickSight, ouvrant la voie à des déploiements similaires dans d'autres secteurs.

UELes entreprises européennes clientes d'Amazon QuickSight peuvent adopter dès maintenant cette fonctionnalité d'interrogation en langage naturel, réduisant leur dépendance aux équipes BI pour l'analyse ad hoc.

OutilsOutil
1 source
AgentCore : optimisation de la qualité des agents, désormais en préversion
609AWS ML Blog 

AgentCore : optimisation de la qualité des agents, désormais en préversion

Amazon a annoncé ce 5 mai 2026 l'intégration de nouvelles capacités d'optimisation automatique dans AgentCore, sa plateforme de déploiement d'agents IA, désormais disponibles en préversion. Ces fonctionnalités couvrent trois mécanismes complémentaires : les Recommandations, l'évaluation par lots (batch evaluation) et les tests A/B. Le moteur de recommandations analyse les traces de production et les résultats d'évaluation pour proposer des améliorations concrètes des prompts système ou des descriptions d'outils, en ciblant un critère de performance défini par le développeur. L'évaluation par lots permet ensuite de valider ces suggestions sur un jeu de données de test prédéfini, en mesurant des scores agrégés pour détecter d'éventuelles régressions. Enfin, les tests A/B comparent deux versions d'un agent en production via AgentCore Gateway, en répartissant le trafic réel selon un pourcentage configurable et en restituant les résultats avec intervalles de confiance et significativité statistique. L'ensemble s'appuie sur un système de traçabilité OpenTelemetry géré par AgentCore Observability, qui capture chaque appel au modèle, chaque invocation d'outil et chaque étape de raisonnement. Ces nouvelles capacités répondent à un problème structurel bien connu des équipes IA en production : la dégradation silencieuse des agents au fil du temps. Lorsque les modèles évoluent, les comportements utilisateurs changent, ou les prompts sont réutilisés dans des contextes imprévus, la qualité baisse sans signal d'alerte clair. Jusqu'ici, le cycle de correction restait entièrement manuel : un utilisateur se plaint, un développeur lit des traces, formule une hypothèse, réécrit le prompt, teste quelques cas et pousse un correctif qui peut en créer un autre. AgentCore ferme cette boucle en remplaçant l'intuition du développeur par des données systématiques, avec un signal de récompense configurable : taux de succès des objectifs, précision de sélection des outils, pertinence, sécurité. Yoshiharu Okuda, directeur de la stratégie IA générative chez NTT DATA, a confirmé que des processus qui nécessitaient auparavant plusieurs semaines de réglage manuel se transforment désormais en cycles rapides et reproductibles. AgentCore est la plateforme d'Amazon Web Services pour construire, connecter et optimiser des agents IA à grande échelle, avec des milliers de développeurs déjà actifs. Cette annonce s'inscrit dans une course plus large entre les grands fournisseurs cloud pour proposer des outils d'opérationnalisation des agents, au-delà de la simple inférence. Google Vertex AI, Microsoft Azure AI et AWS se disputent les équipes qui passent de la phase expérimentale à la production à grande échelle, là où la maintenance de la qualité devient un défi d'ingénierie à part entière. En automatisant la boucle observer-évaluer-améliorer, AWS positionne AgentCore comme une infrastructure de fond pour les organisations qui ne peuvent pas se permettre des équipes dédiées à l'optimisation manuelle de prompts sur des cycles hebdomadaires, alors que leurs agents dérivent chaque jour en production.

OutilsActu
1 source
Du data lake à l'analyse compatible IA : nouvelle source de données avec S3 Tables dans Amazon QuickSight
610AWS ML Blog 

Du data lake à l'analyse compatible IA : nouvelle source de données avec S3 Tables dans Amazon QuickSight

Amazon a annoncé l'intégration des S3 Tables au format Apache Iceberg comme nouvelle source de données dans Amazon QuickSight, son service d'analyse et de business intelligence piloté par l'IA. Cette mise à jour permet aux entreprises de requêter directement des tables Iceberg stockées dans un S3 table bucket, sans passer par des couches intermédiaires comme un entrepôt de données ou un système OLAP. QuickSight supporte désormais deux modes d'interrogation pour ces tables : Direct Query, qui offre un accès en quasi-temps réel aux données, et SPICE (Super-fast, Parallel, In-memory Calculation Engine), son moteur de calcul en mémoire haute performance. Pour illustrer le cas d'usage, Amazon cite l'exemple d'AnyCompany Corp., une institution financière mondiale qui ingère des transactions en temps réel via Amazon Kinesis Data Streams et Amazon Data Firehose vers un S3 table bucket, permettant une détection de fraude et un suivi des taux d'approbation quasi instantanés depuis des sources hétérogènes : terminaux de paiement, applications mobiles, objets connectés et passerelles en ligne. Cet ajout représente une avancée concrète pour les équipes data et analytique des grandes entreprises. Jusqu'ici, analyser des données à grande échelle stockées dans un data lake nécessitait généralement de les déplacer vers un entrepôt de données ou un système OLAP, ce qui introduisait de la latence, des coûts supplémentaires et une complexité opérationnelle importante. En permettant de requêter directement le data lake depuis QuickSight, Amazon élimine ces pipelines de transformation coûteux. Les utilisateurs métiers peuvent ainsi explorer des jeux de données massifs, interagir en langage naturel et obtenir des visualisations à jour sans dépendre de processus batch ni nécessiter d'expertise en machine learning. La scalabilité constitue un autre avantage clé : les requêtes portent sur des volumes importants stockés dans S3 sans contrainte de taille ni besoin de réplication préalable. Cette annonce s'inscrit dans la montée en puissance des architectures de données modernes autour des formats de table ouverts comme Apache Iceberg, conçus pour offrir de meilleures performances, une gouvernance simplifiée et des coûts réduits par rapport aux entrepôts traditionnels. Amazon, Microsoft et Google se livrent une concurrence intense sur le segment de l'analytique cloud, chacun cherchant à rendre ses services d'analyse plus accessibles et plus proches des données sources. En intégrant les S3 Tables à QuickSight, AWS renforce son positionnement autour du concept de "source unique de vérité" dans le data lake, tout en réduisant la dépendance aux solutions tierces comme Snowflake ou Databricks. La prochaine étape logique pourrait être une intégration plus poussée des capacités d'IA générative de QuickSight avec ces nouvelles sources, afin d'automatiser davantage la détection d'anomalies et la génération d'insights à la volée.

InfrastructureActu
1 source
Le pari risqué de Larry
611The Verge AI 

Le pari risqué de Larry

Oracle se positionne aujourd'hui comme l'un des baromètres les plus fiables pour mesurer l'état réel du marché de l'intelligence artificielle. La société fondée par Larry Ellison, bien connue pour ses bases de données et ses logiciels d'entreprise, a opéré un virage stratégique radical vers l'IA, d'une nature singulière dans le paysage technologique actuel. Contrairement à OpenAI ou Anthropic, Oracle ne construit pas de modèles fondamentaux. Elle n'est pas non plus un pure player de l'infrastructure cloud nouvelle génération comme CoreWeave, même si elle s'est lancée sur le marché du bare-metal. Oracle reste avant tout une entreprise de logiciels en mode SaaS, qui a misé massivement sur une vision très précise de ce que sera l'IA demain. Ce pari est d'autant plus audacieux que le coeur historique d'Oracle, ses licences logicielles traditionnelles, connaît un déclin progressif. L'entreprise, l'une des plus anciennes du secteur tech avec Microsoft pour seul concurrent comparable en âge, a donc choisi de réinventer son modèle plutôt que de gérer une descente contrôlée. Pour les investisseurs et les analystes, Oracle devient ainsi un indicateur de choix : si son pari IA tient, c'est que la demande enterprise pour l'IA est profonde et durable ; si les résultats déçoivent, le signal sera difficile à ignorer pour l'ensemble du secteur. L'enjeu dépasse Oracle elle-même. Les grandes entreprises traditionnelles du logiciel cherchent toutes à se repositionner face aux nouveaux entrants de l'IA, et Oracle représente le cas le plus tranché de cette transition forcée. Sa capacité à convertir sa base clients historique en revenus IA, tout en concurrençant AWS, Azure et Google Cloud sur l'infrastructure, définira si les acteurs legacy peuvent survivre dans l'écosystème IA ou s'ils seront progressivement marginalisés.

UELes entreprises européennes clientes d'Oracle pourraient être indirectement affectées par ce pivot stratégique, mais l'article ne traite pas d'un impact spécifique sur le marché français ou européen.

BusinessOpinion
1 source
Créer des workflows LLM traçables et évalués avec Promptflow, Prompty et OpenAI
612MarkTechPost 

Créer des workflows LLM traçables et évalués avec Promptflow, Prompty et OpenAI

Un tutoriel publié récemment détaille la construction d'un pipeline LLM complet et prêt pour la production, en s'appuyant sur trois outils clés : Promptflow, le format Prompty, et l'API OpenAI, le tout déployé dans un environnement Google Colab. Le workflow s'articule autour de plusieurs briques : une connexion sécurisée à OpenAI via un backend keyring alternatif, un fichier Prompty structuré servant de composant LLM central (ici GPT-4o-mini, avec une température de 0,2 et un maximum de 350 tokens), puis un flux de type "flex flow" basé sur une classe Python qui combine un prétraitement déterministe avec le raisonnement du modèle. Le système permet d'injecter des hints calculés dans les réponses du modèle, d'activer une traçabilité pas-à-pas de chaque exécution, de lancer des requêtes unitaires ou en batch, et de générer des sorties dans un format structuré. La chaîne se conclut par un pipeline d'évaluation automatisé dans lequel un LLM joue le rôle de juge pour noter les réponses produites face à des réponses attendues. L'intérêt de cette approche est double : elle apporte de la traçabilité à chaque étape d'un pipeline LLM, un manque criant dans beaucoup de déploiements actuels, et elle industrialise l'évaluation en remplaçant la validation manuelle par un juge automatisé. Pour les équipes qui cherchent à passer du prototype au système en production, ce type d'architecture garantit qu'on peut auditer, déboguer et améliorer le comportement du modèle de façon systématique. La combinaison d'un outil déterministe (le calcul sécurisé) et d'un raisonnement LLM dans un même flow illustre aussi comment orchestrer des agents hybrides, sujet central du moment dans le développement d'applications IA. Promptflow est un framework open source lancé par Microsoft en 2023, initialement pensé pour Azure AI Studio mais disponible en local. Il répond à un besoin croissant dans l'industrie : les équipes ne manquent plus de modèles, mais d'outils pour structurer, tester et maintenir des workflows LLM dans la durée. Le format Prompty, introduit plus récemment, standardise la définition des appels au modèle en séparant la configuration (modèle, paramètres, connexion) du template de prompt, ce qui facilite la réutilisation et la gouvernance. Avec l'essor du concept de LLM-as-a-judge, popularisé notamment par des travaux de Lmsys et repris par OpenAI et Anthropic dans leurs propres systèmes d'évaluation, le tutoriel s'inscrit dans une tendance de fond : automatiser non seulement la génération, mais aussi le contrôle qualité des sorties, condition nécessaire pour une adoption enterprise sérieuse de l'IA générative.

OutilsTuto
1 source
ServiceNow : la plateforme qui transformera votre entreprise avec l’automatisation IA
613Le Big Data 

ServiceNow : la plateforme qui transformera votre entreprise avec l’automatisation IA

ServiceNow s'est imposé comme l'une des plateformes d'automatisation d'entreprise les plus ambitieuses du marché, avec une capitalisation boursière qui dépasse les 150 milliards de dollars. Née comme un simple outil de gestion de tickets informatiques, la société américaine a radicalement transformé son positionnement pour devenir ce qu'elle appelle un "système d'enregistrement unique" pour l'ensemble de l'organisation. Sa Now Platform, architecture cloud-native, centralise aujourd'hui les flux de travail IT, RH et service client sur une infrastructure unifiée. L'entreprise a également lancé Now Assist, son module d'intelligence artificielle générative, capable de résumer automatiquement des tickets complexes, de suggérer des résolutions et de générer des rapports sans intervention humaine. Pour accélérer cette stratégie IA, ServiceNow a multiplié les acquisitions technologiques ces dernières années, absorbant des spécialistes du machine learning et de l'automatisation pour intégrer ces capacités nativement dans sa plateforme. L'enjeu central de cette évolution est la destruction des silos opérationnels qui ralentissent encore la majorité des grandes organisations. En unifiant sur une seule plateforme des processus qui étaient auparavant gérés dans des systèmes disparates, ERP, ITSM, outils RH, ServiceNow promet une visibilité totale sur les opérations et une réduction significative des tâches manuelles répétitives. Son approche low-code permet par ailleurs aux équipes métier, sans compétences techniques avancées, de créer leurs propres workflows sur mesure, ce qui démocratise le développement applicatif au sein d'entreprises qui ne peuvent pas se permettre d'embaucher des développeurs pour chaque besoin interne. Pour les directions informatiques et les DSI, c'est un argument de poids : réduire la dette technique tout en accélérant la transformation numérique sans multiplier les outils. ServiceNow évolue dans un marché ultra-concurrentiel où Microsoft, Salesforce et SAP proposent des offres similaires d'automatisation et d'intégration IA. Ce qui différencie la firme de Santa Clara, c'est sa focalisation exclusive sur l'orchestration des processus inter-départementaux, là où ses concurrents restent souvent cantonnés à des verticales spécifiques. La montée en puissance de l'IA générative dans les entreprises accélère la course : chaque éditeur cherche à se positionner comme le "cerveau" central de l'organisation. ServiceNow mise sur l'exhaustivité de sa plateforme et la profondeur de ses intégrations pour fidéliser des clients grands comptes dont les migrations sont coûteuses et longues. La question qui se pose désormais est celle du retour sur investissement réel pour les entreprises ayant déployé ces outils à grande échelle, un sujet sur lequel les données indépendantes restent encore rares.

UELes DSI des grandes organisations françaises et européennes sont des cibles directes de l'offre ServiceNow, mais l'article ne traite d'aucun enjeu réglementaire ou impact spécifique au marché européen.

OutilsOutil
1 source
RAG sans vecteurs : PageIndex récupère l'information par raisonnement
614MarkTechPost 

RAG sans vecteurs : PageIndex récupère l'information par raisonnement

PageIndex propose une alternative radicale aux systèmes de RAG (Retrieval-Augmented Generation) traditionnels : plutôt que de découper les documents en fragments et de rechercher les plus similaires par calcul vectoriel, la plateforme construit un index hiérarchique en forme d'arbre, modélisant la structure du document telle qu'elle existe, chapitres, sous-sections et titres imbriqués compris. Un modèle de langage comme GPT-5.4 raisonne ensuite sur cet arbre, navigue entre les noeuds et identifie les sections pertinentes avant même de lire le texte complet. La démonstration proposée porte sur le célèbre article scientifique "Attention Is All You Need", publié en 2017, qui a fondé l'architecture Transformer aujourd'hui omniprésente dans l'IA. Deux requêtes croisées sont posées sur ce document sans qu'un seul vecteur ou embedding ne soit calculé. Les performances de PageIndex ont été mesurées notamment sur FinanceBench, un benchmark spécialisé dans les documents financiers complexes, où l'approche surpasse significativement les pipelines vectoriels classiques. L'enjeu dépasse la simple optimisation technique. Dans les rapports financiers, les textes juridiques ou les articles de recherche, la réponse à une question ne se trouve pas toujours dans le paragraphe "le plus proche" sémantiquement : elle exige de relier des informations dispersées sur plusieurs sections, de comprendre la structure du document et d'effectuer un raisonnement en plusieurs étapes. Les systèmes RAG classiques échouent silencieusement sur ce type de requêtes, en retournant des résultats plausibles mais inexacts. PageIndex rend le processus de récupération interprétable et traçable, ce qui est crucial pour les applications professionnelles où une hallucination ou une approximation peut avoir des conséquences réelles, que ce soit dans un cabinet d'avocats, une salle d'analyse financière ou un laboratoire de recherche. Le RAG vectoriel s'est imposé comme l'architecture de référence pour connecter les LLM à des bases de connaissances externes depuis 2022-2023, porté par des bibliothèques comme LangChain ou LlamaIndex. Mais les limites de la recherche par similarité sémantique sont connues et documentées : les chunks perdent le contexte, les distances cosinus ne capturent pas la logique, et les documents longs déjouent systématiquement les pipelines standards. Plusieurs équipes cherchent des alternatives, comme GraphRAG de Microsoft, qui s'appuie sur des graphes de connaissances, ou les approches à base d'agents orchestrant plusieurs appels LLM. PageIndex s'inscrit dans cette tendance en pariant sur le raisonnement structuré plutôt que sur la puissance brute des embeddings. Avec l'arrivée de modèles toujours plus capables comme GPT-5.4, cette approche devient viable à grande échelle et pourrait redéfinir la manière dont les systèmes d'IA extraient l'information de documents complexes.

💬 Le problème avec le RAG par chunks, c'est que tu perds la structure du document avant même d'avoir posé ta question. PageIndex fait le pari inverse : construire un arbre qui reflète l'organisation réelle du document, puis laisser le LLM naviguer dedans plutôt que de faire des calculs de distance cosinus à l'aveugle. Ça marche visiblement bien sur les docs financiers complexes, et pour les usages pro où une hallucination coûte cher, c'est exactement le bon angle d'attaque.

OutilsOutil
1 source
Concevoir un système multi-agents CAMEL de production : planification, outils, cohérence et affinement critique
615MarkTechPost 

Concevoir un système multi-agents CAMEL de production : planification, outils, cohérence et affinement critique

Un tutoriel publié récemment détaille comment concevoir un système multi-agents de niveau production à l'aide du framework CAMEL, une bibliothèque Python open source dédiée à l'orchestration d'agents LLM. Le pipeline décrit met en scène cinq agents spécialisés aux rôles clairement délimités : un planificateur, un chercheur, un rédacteur, un critique et un rééditeur. L'ensemble repose sur GPT-4o d'OpenAI (via l'API), la validation de schémas avec Pydantic 2.7, et l'affichage structuré via Rich 13.7. Concrètement, le système génère des synthèses techniques documentées de façon autonome, en combinant recherche web en temps réel, échantillonnage par auto-cohérence et raffinement itératif piloté par critique interne. Ce type d'architecture multi-agents représente une évolution significative par rapport aux approches LLM classiques en pipeline simple. En distribuant les responsabilités entre agents distincts, chacun doté de contraintes de sortie précises (schémas JSON validés par Pydantic), le système réduit les hallucinations et améliore la cohérence des résultats. L'ajout d'un agent critique qui évalue la production de l'agent rédacteur, puis déclenche un agent rééditeur si le score est insuffisant, introduit une boucle de contrôle qualité autonome : le système s'auto-corrige sans intervention humaine. Pour les équipes produit ou data qui cherchent à industrialiser des workflows de génération de contenu ou d'analyse, cette approche offre un cadre reproductible, modulaire et extensible. CAMEL (Communicative Agents for "Mind" Exploration of Large Language Model Society) est un framework open source initié en 2023, qui a gagné en maturité avec des versions stables permettant l'intégration native d'outils web, de modèles multi-plateformes et de mécanismes de validation structurée. Le tutoriel s'inscrit dans un mouvement plus large d'industrialisation des agents LLM, où des acteurs comme LangChain, AutoGen de Microsoft ou CrewAI cherchent à standardiser la façon dont on compose des agents spécialisés. L'enjeu central est de passer du prototype expérimental au système fiable en production, ce qui exige précisément les mécanismes décrits ici : contrôle de schéma, gestion des erreurs, logique de retry et traçabilité des sorties. Les prochaines évolutions de ces frameworks devraient intégrer davantage de mémoire persistante entre agents et des mécanismes de délégation dynamique des tâches, rapprochant ces systèmes des premières formes d'automatisation cognitive véritablement autonome.

OutilsTuto
1 source
Windows et Copilot : 5 astuces secrètes à connaître
616Le Big Data 

Windows et Copilot : 5 astuces secrètes à connaître

Microsoft intègre depuis plusieurs mois Copilot directement dans Windows 11, transformant l'assistant d'intelligence artificielle en outil natif accessible depuis n'importe quel contexte de travail. Parmi les fonctionnalités les moins connues, le raccourci clavier Alt + Barre d'espace permet d'invoquer Copilot instantanément par-dessus toute application ouverte, sans quitter l'écran actif. Sur les PC labellisés Copilot+, une touche physique dédiée remplit la même fonction. L'interface s'affiche soit en panneau latéral fixe, soit en fenêtre flottante compacte, selon les préférences configurées dans les paramètres système. Par ailleurs, Windows 11 intègre désormais un mode vocal accessible via une icône micro dans l'interface de l'assistant, permettant des échanges parlés en temps réel, avec transcription immédiate et réponse écrite, ou lue à voix haute selon le matériel. Le raccourci Win + H active quant à lui la dictée globale du système comme alternative complémentaire. Ces fonctionnalités changent concrètement la manière dont les professionnels interagissent avec leur machine. L'objectif affiché de Microsoft est de réduire les micro-interruptions : consulter l'IA sans minimiser ses fenêtres, poser une question vocalement sans structurer sa phrase, obtenir une aide sur une formule Excel ou une reformulation sans changer d'application. Pour les utilisateurs qui passent de longues heures sur des tâches cognitives, le gain en concentration est réel. Le mode vocal est particulièrement pertinent pour le brainstorming ou l'explication de problèmes complexes, où la fluidité orale dépasse la rapidité de frappe. Ces usages font de Copilot moins un moteur de recherche amélioré qu'un véritable partenaire de travail intégré au flux quotidien. Cette évolution s'inscrit dans la stratégie globale de Microsoft de placer l'IA au coeur de Windows, accélérée depuis l'investissement massif dans OpenAI et le lancement de Copilot en 2023. La certification Copilot+ PC, introduite en 2024, définit un nouveau standard matériel incluant une puce NPU dédiée aux traitements d'IA locaux, permettant des fonctions comme Recall ou la génération d'images en temps réel. L'enjeu pour Microsoft est double : différencier Windows face à macOS sur le terrain de l'IA embarquée, et pousser les entreprises vers des abonnements Microsoft 365 Copilot, facturés 30 dollars par utilisateur par mois. La question qui reste ouverte est celle de l'adoption réelle : beaucoup de ces raccourcis et modes restent ignorés du grand public, ce qui explique la multiplication de guides pratiques pour démocratiser des usages que Microsoft juge pourtant centraux dans sa vision de l'informatique personnelle de demain.

UELes entreprises françaises et européennes sous Microsoft 365 sont directement concernées par l'abonnement Copilot à 30 $/utilisateur/mois, un surcoût à peser dans leurs décisions d'adoption.

OutilsOutil
1 source
617AI News 

Snowflake élargit ses plateformes IA techniques et grand public

Snowflake a annoncé une expansion significative de ses deux plateformes d'intelligence artificielle, Snowflake Intelligence et Cortex Code, lors d'une mise à jour publiée cette semaine. Snowflake Intelligence cible les employés non techniques qui souhaitent automatiser des tâches métier en langage naturel : préparer des présentations, lancer des analyses multi-étapes ou envoyer des messages de suivi. Cortex Code, lui, s'adresse aux équipes de développement logiciel en entreprise. Parmi les nouveautés : des intégrations élargies avec Google Workspace, Jira, Salesforce et Slack via le protocole MCP (Model Context Protocol), de nouvelles connexions à des sources de données externes comme AWS Glue, Databricks et PostgreSQL, ainsi qu'un support du protocole ACP (Agent Communication Protocol). Une extension VS Code pour Cortex Code est en préversion privée, et un plugin Snowflake pour Claude Code est en cours de développement. Une application iOS pour Snowflake Intelligence doit entrer en préversion publique prochainement. La plateforme revendique plus de 9 100 clients utilisant ses produits IA chaque semaine, et plus de la moitié de sa base cliente utilise désormais l'une ou l'autre des deux plateformes depuis leur lancement il y a six mois. Ces annonces illustrent la montée en puissance des plateformes dites "agentiques" dans l'entreprise, capables d'exécuter des séquences de tâches de manière autonome à partir d'une simple instruction en langage naturel. Pour les grandes organisations, l'enjeu est de permettre à des collaborateurs sans compétences techniques de piloter des flux de travail complexes, tout en maintenant un contrôle strict sur les droits d'accès et la conformité aux politiques internes. La possibilité de sauvegarder et partager des workflows, combinée à des fenêtres de contexte étendues qui mémorisent les préférences utilisateur, réduit la friction dans l'adoption quotidienne. Le mode "Plan Mode", qui permet de prévisualiser et valider un flux avant son exécution, répond directement aux craintes des entreprises face aux agents IA autonomes. Ces développements s'inscrivent dans une course intense entre fournisseurs de données cloud pour devenir la couche d'orchestration IA de référence en entreprise. Snowflake, historiquement positionné sur le stockage et l'analyse de données, cherche à élargir son emprise vers l'exécution d'actions concrètes, un territoire que se disputent aussi Microsoft, Salesforce et Google. Les nouvelles fonctionnalités découlent en partie du projet SnowWork, une initiative de recherche lancée le mois dernier pour tester la plateforme et collecter les retours utilisateurs. L'ouverture via MCP et ACP signale une stratégie d'interopérabilité délibérée : plutôt que de construire un écosystème fermé, Snowflake mise sur la connectivité avec les outils déjà en place dans les organisations, pariant que la valeur viendra de l'orchestration plutôt que du remplacement.

OutilsOutil
1 source
618AWS ML Blog 

Commandes omnicanales avec Amazon Bedrock AgentCore et Amazon Nova 2 Sonic

Amazon a présenté une architecture complète pour construire des systèmes de commande vocale omnicanaux en s'appuyant sur deux de ses services cloud : Amazon Bedrock AgentCore, une plateforme dédiée au déploiement d'agents IA en production, et Amazon Nova 2 Sonic, un modèle de fondation speech-to-speech disponible via Amazon Bedrock. La solution permet à une application de traiter des commandes vocales en temps réel sur plusieurs points de contact simultanément, application mobile, site web et interface vocale, tout en maintenant le contexte conversationnel entre les échanges. L'infrastructure s'appuie sur AWS CDK pour le déploiement, le protocole MCP (Model Context Protocol) pour connecter l'agent IA aux services métier, et une série de services managés : Amazon Cognito pour l'authentification OAuth 2.0, API Gateway pour exposer les endpoints REST, AWS Lambda pour la logique métier, DynamoDB pour le stockage des profils et commandes, et AWS Location Services pour les recommandations géolocalisées de points de retrait. L'intérêt principal de cette architecture réside dans sa capacité à isoler chaque composant pour les faire évoluer indépendamment. AgentCore Runtime exécute chaque session utilisateur dans une microVM isolée, ce qui garantit qu'un pic de charge sur une session n'affecte pas les autres, un problème classique des systèmes vocaux en production. Le MCP standardise la communication entre l'agent et les services backend, ce qui permet de modifier ou d'étendre la logique métier sans réécrire le code d'intégration. Pour les équipes qui construisent des expériences de commande vocale à grande échelle, restauration rapide, retail, logistique, cette séparation claire entre la couche IA, le frontend et le backend réduit significativement la complexité opérationnelle et les risques de régression lors des mises à jour. La publication de cette solution s'inscrit dans une compétition intense autour des agents IA en production. Google, Microsoft et des acteurs comme Anthropic proposent leurs propres infrastructures agentiques, mais AWS mise sur l'intégration native avec son écosystème de services cloud existants comme différenciateur clé. Nova 2 Sonic, le modèle speech-to-speech au coeur du système, représente l'entrée d'Amazon dans les interfaces vocales conversationnelles en temps réel, un segment où OpenAI s'est imposé avec GPT-4o Voice. En publiant ce tutoriel complet avec une architecture de restaurant fictive comme backend d'exemple, Amazon cherche à accélérer l'adoption par les développeurs et à établir AgentCore comme standard de fait pour le déploiement d'agents IA sur AWS. Les prochaines étapes logiques incluront probablement l'extension à d'autres modalités et l'intégration avec des systèmes de caisse et d'inventaire existants.

OutilsOutil
1 source
619MarkTechPost 

Tutoriel : faire tourner PrismML Bonsai LLM 1-bit sur CUDA avec GGUF, benchmarks, chat, JSON et RAG

PrismML a publié une pile de déploiement optimisée pour faire tourner Bonsai, un modèle de langage de 1,7 milliard de paramètres quantifié à 1 bit, sur GPU via accélération CUDA. Le modèle utilise le format GGUF avec une quantisation Q1\0\g128, et s'appuie sur une version personnalisée de llama.cpp distribuée par PrismML-Eng sur GitHub sous la balise de version prism-b8194-1179bfc. Un tutoriel complet détaille l'installation de l'environnement depuis Google Colab : vérification du GPU et de la version CUDA, installation des dépendances Python (huggingface\_hub, requests, tqdm, openai), téléchargement des binaires précompilés adaptés à la version CUDA détectée (12.4, 12.8 ou 13.1), puis chargement du modèle Bonsai-1.7B pour l'inférence. Le guide couvre ensuite sept cas d'usage concrets : inférence de base, benchmarking, conversation multi-tours, génération JSON structurée, génération de code, mode serveur compatible avec l'API OpenAI, et un pipeline RAG (retrieval-augmented generation) minimal. L'intérêt principal de Bonsai réside dans son empreinte mémoire extrêmement réduite grâce à la quantisation 1 bit : là où un modèle de 1,7 milliard de paramètres en FP16 occuperait environ 3,4 Go de VRAM, la version 1 bit descend bien en dessous de 1 Go, rendant le modèle utilisable sur des GPU d'entrée de gamme ou dans des environnements cloud à ressources limitées. La compatibilité avec le serveur OpenAI permet de brancher Bonsai directement sur des applications existantes sans modifier le code client. Pour les développeurs qui construisent des agents, des chatbots ou des pipelines RAG sur du matériel modeste, c'est une alternative sérieuse aux modèles quantifiés classiques en 4 ou 8 bits. La quantisation à 1 bit est une direction de recherche active depuis la publication de BitNet par Microsoft en 2023, qui avait montré qu'un modèle entraîné nativement en 1 bit pouvait conserver une qualité compétitive à faible coût computationnel. Bonsai s'inscrit dans cette lignée, et PrismML mise sur llama.cpp comme moteur d'inférence universel, bien implanté dans la communauté open source depuis sa création par Georgi Gerganov fin 2022. Le format GGUF, successeur de GGML, est aujourd'hui le standard de facto pour le déploiement local de LLMs quantifiés. La prochaine étape logique pour PrismML sera de proposer des modèles Bonsai dans des tailles supérieures (7B, 13B) pour mesurer si la qualité tient à plus grande échelle, et de valider les performances sur des benchmarks standardisés face à des modèles comme Phi-3 Mini ou Gemma 3.

💬 Moins d'1 Go de VRAM pour faire tourner un LLM complet, c'est le genre de chiffre qui change vraiment ce qu'on peut faire sur du matos lambda. La compatibilité API OpenAI en prime, ça veut dire qu'on branche ça sur un projet existant en cinq minutes. Bon, 1,7B de paramètres ça reste petit, reste à voir ce que ça vaut sur des tâches un peu exigeantes face à un Phi-3 Mini bien quantifié en 4 bits.

LLMsTuto
1 source
620AWS ML Blog 

Déploiements par cas d'usage sur SageMaker JumpStart

Amazon a annoncé le lancement des déploiements optimisés sur SageMaker JumpStart, une nouvelle fonctionnalité qui permet aux entreprises utilisant AWS de configurer leurs modèles d'intelligence artificielle en fonction de cas d'usage précis plutôt que de simples paramètres techniques génériques. Disponible dès maintenant dans SageMaker Studio, cette mise à jour concerne une trentaine de modèles au lancement, dont plusieurs variantes de Meta Llama 3.1 et 3.2 (de 1B à 70B paramètres), Mistral 7B et Mistral Small 24B, les modèles Qwen3 d'Alibaba (jusqu'à 32B), Phi-3 de Microsoft, Gemma de Google et Falcon3 de TII. Les utilisateurs choisissent d'abord un cas d'usage textuel, rédaction générative, interaction de type chat, résumé de contenu, questions-réponses, puis sélectionnent une contrainte d'optimisation parmi quatre options : coût, débit, latence ou performance équilibrée. Une configuration de déploiement préconfigurée est alors générée automatiquement pour l'endpoint SageMaker. Ce changement répond à une limite concrète du système précédent : JumpStart proposait jusque-là de configurer les déploiements selon le nombre d'utilisateurs simultanés attendus, avec visibilité sur la latence P50, le temps avant le premier token (TTFT) et le débit en tokens par seconde. Ce modèle était utile pour des scénarios généralistes, mais ignorait que les performances optimales varient radicalement selon le type de tâche. Un système de résumé de documents longs n'a pas les mêmes besoins qu'un chatbot temps réel ou qu'un pipeline de génération de contenu en batch. En exposant directement ces dimensions aux équipes produit et data, AWS réduit la friction entre la sélection d'un modèle et sa mise en production effective, sans exiger d'expertise fine en infrastructure GPU ni en tuning de serving. Cette évolution s'inscrit dans la compétition acharnée que se livrent les grands fournisseurs cloud, AWS, Google Cloud et Microsoft Azure, pour capter les budgets d'inférence IA des entreprises. SageMaker JumpStart existe depuis plusieurs années comme point d'entrée vers les modèles pré-entraînés sur AWS, mais la plateforme cherche à monter en valeur face à des alternatives comme Vertex AI Model Garden ou Azure AI Studio qui proposent également des expériences de déploiement guidées. Le support des modèles image et vidéo est annoncé comme prochaine étape, et la liste des modèles compatibles est présentée comme amenée à s'élargir rapidement. Pour les entreprises déjà dans l'écosystème AWS, cette simplification pourrait accélérer les cycles de mise en production de modèles open-source sans passer par des équipes MLOps dédiées.

UELes entreprises européennes déployant des modèles open-source sur AWS peuvent réduire leur dépendance aux équipes MLOps grâce à cette simplification du cycle de mise en production.

OutilsOutil
1 source
621AWS ML Blog 

Bonnes pratiques pour l'inférence sur Amazon SageMaker HyperPod

Amazon a enrichi sa plateforme SageMaker HyperPod d'un ensemble de fonctionnalités dédiées à l'inférence de modèles d'IA générative, avec pour promesse affichée une réduction du coût total de possession allant jusqu'à 40%. La solution s'appuie sur Amazon Elastic Kubernetes Service (EKS) comme orchestrateur et permet de créer un cluster en quelques clics depuis la console SageMaker AI. Deux modes de configuration sont proposés : une installation rapide avec des ressources par défaut, et une installation personnalisée permettant d'intégrer des infrastructures existantes. Une fois le cluster actif, l'opérateur d'inférence intégré permet de déployer des modèles directement depuis des buckets S3, des systèmes de fichiers FSx for Lustre, ou depuis le catalogue SageMaker JumpStart, sans écrire une seule ligne de code. Des notebooks d'exemple couvrent les cas d'usage courants : modèles préconstruits, modèles fine-tunés, configurations personnalisées. L'enjeu central de cette mise à jour est la gestion dynamique des ressources GPU, historiquement coûteuse et complexe à piloter. HyperPod introduit une architecture de scalabilité à deux niveaux : KEDA (Kubernetes Event-Driven Autoscaling), un projet open source de la Cloud Native Computing Foundation, gère l'autoscaling des pods en fonction de métriques temps réel comme la longueur de la file de requêtes, la latence, ou des métriques CloudWatch et Prometheus personnalisées. KEDA peut réduire le nombre de pods à zéro en l'absence de trafic, supprimant ainsi les coûts à l'arrêt. En parallèle, Karpenter opère au niveau des nœuds de calcul : il provisionne ou retire des instances selon les besoins des pods en attente, et tourne dans le plan de contrôle EKS, ce qui évite tout surcoût lié à l'autoscaler lui-même. Cette combinaison permet de passer de zéro à une charge de production en réponse à la demande réelle. Ce lancement intervient dans un contexte où le déploiement de modèles de fondation à grande échelle est devenu un point de friction majeur pour les équipes IA en entreprise : infrastructure difficile à calibrer, pics de trafic imprévisibles, surinvestissement GPU, et délais de mise en production allongés. AWS positionne HyperPod comme une réponse complète à ce trilemme coût-performance-simplicité, en absorbant la complexité opérationnelle dans une couche managée. La plateforme concurrence directement les offres de Google (Vertex AI) et Microsoft Azure (ML endpoints managés), qui proposent des approches similaires. Les suites probables incluent une intégration plus poussée avec les outils d'observabilité AWS et une extension du support à d'autres architectures de modèles, alors que la course aux infrastructures d'inférence efficaces s'intensifie dans tout le secteur cloud.

InfrastructureActu
1 source
622AWS ML Blog 

Le Spring AI SDK pour Amazon Bedrock AgentCore est désormais en disponibilité générale

Amazon a rendu disponible en accès général le Spring AI SDK pour Amazon Bedrock AgentCore, une bibliothèque open source qui permet aux développeurs Java de construire et déployer des agents IA autonomes en production sur l'infrastructure d'AWS. Ce SDK s'intègre nativement dans l'écosystème Spring Boot 3.5 et Java 17 minimum, en exploitant les patterns familiers du framework : annotations, auto-configuration et advisors composables. Concrètement, un développeur ajoute une dépendance au projet, annote une méthode, et le SDK prend en charge tout le reste, de la gestion des endpoints jusqu'au streaming des réponses en temps réel. Jusqu'à présent, intégrer Amazon Bedrock AgentCore dans une application Spring représentait plusieurs semaines de travail d'infrastructure avant même d'écrire la moindre logique métier : il fallait implémenter manuellement les endpoints /invocations et /ping, gérer le streaming Server-Sent Events avec son protocole précis, configurer les health checks, le rate limiting, et connecter les advisors et les outils. Le SDK automatise entièrement ce contrat technique imposé par l'AgentCore Runtime. En particulier, il détecte automatiquement les tâches asynchrones longues et signale un statut "HealthyBusy" au runtime pour éviter qu'il ne retire des ressources pendant un traitement actif, un détail critique dans un modèle de facturation à l'usage où les temps d'inactivité ne sont pas facturés. Les équipes peuvent ainsi se concentrer sur la logique des agents plutôt que sur la plomberie infrastructure, et déployer des fonctionnalités comme la mémoire conversationnelle, l'automatisation de navigateur et l'exécution de code en sandbox. L'émergence de ce SDK s'inscrit dans une tendance de fond : les entreprises cherchent à passer des preuves de concept en IA générative à des systèmes agentiques véritablement opérationnels à grande échelle, capables de planifier et d'exécuter des tâches complexes en plusieurs étapes de manière autonome. AWS positionne Bedrock AgentCore comme une plateforme universelle, compatible avec n'importe quel framework et n'importe quel modèle. En ciblant spécifiquement la communauté Java et Spring, l'une des plus larges dans l'entreprise, Amazon ouvre un couloir direct vers la production pour des millions de développeurs backend qui auraient autrement dû franchir une barrière technique considérable. La concurrence dans ce segment est vive : Microsoft avec Azure AI, Google avec Vertex AI et des acteurs comme LangChain ou CrewAI proposent leurs propres abstractions pour les agents IA. La disponibilité générale du Spring AI AgentCore SDK marque une étape dans la maturité de l'outillage autour des agents IA en entreprise, où la gouvernance, la sécurité et la scalabilité deviennent des critères aussi importants que les capacités du modèle lui-même.

UELes développeurs Java et Spring Boot en Europe peuvent intégrer directement Amazon Bedrock AgentCore dans leurs projets sans semaines de travail d'infrastructure, accélérant la mise en production d'agents IA sur AWS.

OutilsOutil
1 source
Google investit 10 millions de dollars pour former 40 000 ouvriers américains à l’IA
623Le Big Data 

Google investit 10 millions de dollars pour former 40 000 ouvriers américains à l’IA

Google a annoncé le 13 avril 2026 un investissement de 10 millions de dollars via son fonds Google.org pour former 40 000 travailleurs du secteur manufacturier américain à l'intelligence artificielle. Ce financement est versé au Manufacturing Institute, organisme affilié à la National Association of Manufacturers, qui disposera de deux nouveaux programmes de formation. Le premier, une introduction à l'IA destinée aux ouvriers de production, adapte les contenus pédagogiques existants de Google aux réalités du terrain industriel. Le second, plus technique, cible les techniciens qui intègrent directement l'IA dans les processus de fabrication. En complément du financement, Google engage ses propres ingénieurs et experts dans la conception des curricula, tandis que le Manufacturing Institute se charge de les contextualiser pour chaque environnement d'atelier. Un certificat professionnel IA de Google sera également mis à disposition des travailleurs manufacturiers sans frais. L'enjeu dépasse la simple formation : d'ici 2033, près de 1,9 million de postes dans l'industrie américaine pourraient rester vacants faute de profils adaptés aux technologies émergentes. En équipant les ouvriers d'une maîtrise concrète de l'IA, l'initiative vise à réduire ce déficit structurel tout en améliorant la productivité des chaînes de production face à des concurrents internationaux déjà engagés dans cette transformation. Pour les industriels, la capacité à déployer l'IA au niveau opérationnel, et pas seulement dans les directions IT, représente un levier de compétitivité direct. Le programme adresse aussi un frein psychologique souvent sous-estimé : la crainte de l'automatisation chez les travailleurs. En montrant des cas d'usage concrets où l'IA augmente les compétences humaines plutôt qu'elle ne les remplace, Google cherche à accélérer l'adoption sur le terrain. Cette initiative s'inscrit dans une tendance plus large où les géants technologiques ne se contentent plus de vendre des outils, mais investissent activement dans la montée en compétences des utilisateurs finaux pour lever les freins à l'adoption de leurs propres technologies. Google n'est pas seul sur ce terrain : Microsoft, Amazon et d'autres ont lancé des programmes similaires ces dernières années, mais celui-ci se distingue par son ancrage dans le secteur manufacturier traditionnel, souvent perçu comme à la traîne sur la transformation numérique. Le choix du Manufacturing Institute comme partenaire opérationnel est stratégique : l'organisme dispose d'un réseau établi dans l'industrie lourde et peut déployer des formations à grande échelle rapidement. La question qui reste ouverte est celle de la mesure d'impact réel sur la productivité et l'emploi, des indicateurs que Google et le Manufacturing Institute devront documenter pour justifier l'extension possible du programme au-delà des 40 000 bénéficiaires initiaux.

SociétéOpinion
1 source
Tutoriel NVIDIA PhysicsNeMo : Darcy Flow, FNOs, PINNs, modèles de substitution et benchmarking d'inférence
624MarkTechPost 

Tutoriel NVIDIA PhysicsNeMo : Darcy Flow, FNOs, PINNs, modèles de substitution et benchmarking d'inférence

NVIDIA a publié PhysicsNeMo, une bibliothèque dédiée à l'apprentissage automatique informé par la physique, et un tutoriel complet en montre l'implémentation pratique sur Google Colab. Le guide couvre l'ensemble du pipeline scientifique : génération de données pour le problème de l'écoulement de Darcy 2D, entraînement de modèles avancés dont l'opérateur de Fourier neuronal (FNO) et un réseau convolutif de base, ainsi qu'une introduction aux réseaux de neurones informés par la physique (PINNs). Le tutoriel se conclut par une comparaison d'architectures, une évaluation des prédictions et un benchmark d'inférence, avec sauvegarde des modèles entraînés. Techniquement, le problème de Darcy 2D sert de cas d'école : il s'agit de résoudre l'équation -∇·(k(x,y)∇u(x,y)) = f(x,y) sur un domaine carré de résolution 64×64, où k représente le champ de perméabilité en entrée et u le champ de pression en sortie, les données étant générées via des champs aléatoires gaussiens et un solveur par différences finies. Ce type d'outil intéresse directement les ingénieurs et chercheurs qui travaillent sur des simulations physiques coûteuses en calcul. Les opérateurs neuronaux comme le FNO peuvent apprendre des solutions d'équations aux dérivées partielles sans résoudre le système à chaque fois, réduisant les temps de calcul de plusieurs ordres de grandeur par rapport aux solveurs classiques. Pour des domaines comme la modélisation des écoulements souterrains, la conduction thermique, la mécanique des fluides ou la conception de matériaux, ces modèles de substitution (surrogate models) permettent d'explorer des milliers de scénarios là où un simulateur numérique traditionnel n'en traiterait que quelques dizaines dans le même temps. Le benchmark d'inférence inclus dans le tutoriel permet de quantifier précisément ce gain. PhysicsNeMo s'inscrit dans une tendance de fond portée par NVIDIA depuis plusieurs années : outiller la communauté scientifique avec des frameworks qui combinent deep learning et contraintes physiques. La bibliothèque fait écho à d'autres initiatives similaires comme DeepMind's GraphCast pour la météo ou les travaux de Microsoft sur les modèles de simulation climatique. L'enjeu est de démocratiser la scientific machine learning en abaissant la barrière d'entrée technique : en proposant une implémentation fonctionnelle sur Colab, accessible sans infrastructure GPU dédiée pour les premiers tests, NVIDIA cible aussi bien les doctorants en physique computationnelle que les équipes R&D industrielles. Le fait que le tutoriel propose des implémentations de secours (fallback) lorsque PhysicsNeMo n'est pas disponible suggère une conception pensée pour la robustesse et l'adoption progressive dans des environnements de production variés.

OutilsTuto
1 source
625AWS ML Blog 

Créer des fonctions de récompense efficaces avec AWS Lambda pour personnaliser Amazon Nova

Amazon Web Services propose une méthode concrète pour personnaliser ses modèles de langage Amazon Nova grâce à AWS Lambda comme moteur d'évaluation. L'approche repose sur le Reinforcement Fine-tuning (RFT), une technique d'apprentissage par renforcement qui se distingue du traditionnel Supervised Fine-tuning (SFT) : là où le SFT exige des milliers d'exemples annotés avec des raisonnements détaillés, le RFT apprend à partir de signaux d'évaluation appliqués aux réponses finales du modèle. Concrètement, une fonction Lambda reçoit les réponses générées par Nova lors de l'entraînement, les évalue selon plusieurs critères (exactitude, sécurité, formatage, concision) et retourne un score numérique, généralement compris entre -1 et 1. Les scores élevés renforcent les comportements positifs ; les scores faibles les découragent. Ce cycle se répète des milliers de fois pour affiner progressivement le modèle, avec Amazon CloudWatch qui surveille la distribution des scores en temps réel. L'intérêt de cette architecture est double, technique et économique. Sur le plan technique, elle permet de définir des systèmes de récompense multi-dimensionnels qui capturent des critères de qualité nuancés, réduisant ainsi le risque de "reward hacking", ces situations où un modèle exploite des raccourcis pour maximiser son score sans réellement progresser sur les objectifs visés. Un cas typique serait une réponse de service client qui doit simultanément être précise, empathique, concise et conforme à l'identité de la marque : autant de critères difficiles à couvrir avec des exemples annotés. Sur le plan économique, Lambda s'adapte automatiquement à la charge d'entraînement sans qu'une équipe ait à gérer une infrastructure dédiée, rendant la personnalisation de modèles fondamentaux accessible à des développeurs sans expertise approfondie en machine learning. Cette publication s'inscrit dans une concurrence intense entre les grands fournisseurs cloud pour démocratiser la personnalisation des grands modèles de langage. Google, Microsoft et AWS se disputent les entreprises qui souhaitent adapter des modèles fondamentaux à leurs cas d'usage métier sans repartir de zéro. Amazon Nova, lancé fin 2024, représente l'offensive d'AWS sur ce marché avec une gamme de modèles positionnés sur le rapport performance/coût. En proposant une intégration native entre RFT, Lambda et CloudWatch, AWS cherche à réduire la friction technique qui freine encore l'adoption en entreprise. Deux variantes coexistent selon les besoins : RLVR (Reinforcement Learning via Verifiable Rewards) pour les tâches à réponses objectivement vérifiables comme du code ou des calculs, et RLAIF (Reinforcement Learning via AI Feedback) pour des évaluations plus subjectives. Les prochaines étapes logiques seront l'extension de ces outils à d'autres modèles Nova et une intégration plus poussée avec les pipelines MLOps existants sur AWS.

OutilsOutil
1 source
626Ars Technica AI 

Ce que les fichiers fuités de "SteamGPT" révèlent sur l'IA chez Steam

Des fichiers faisant référence à un mystérieux "SteamGPT" ont été découverts dans une mise à jour du client Steam publiée le 7 avril 2026. Repérés par le projet automatisé SteamTracking sur GitHub, ces fichiers apparaissent à trois endroits distincts dans la mise à jour et contiennent des termes techniques révélateurs : inférence multi-catégories, fine-tuning, et "modèles upstream". Le nom lui-même est une référence évidente aux modèles de transformeurs génératifs pré-entraînés popularisés par ChatGPT. Valve, l'entreprise derrière Steam, n'a fait aucune annonce officielle à ce sujet. L'analyse des noms de variables et des références dans ces fichiers suggère que Valve envisagerait d'utiliser des outils d'IA à des fins internes plutôt que grand public : évaluer automatiquement des incidents signalés dans les jeux et identifier des comptes potentiellement suspects. Si cette interprétation est correcte, cela représente une application concrète de l'IA pour modérer à grande échelle une plateforme qui héberge des dizaines de millions de joueurs actifs et des milliers de développeurs. L'automatisation de ces processus pourrait accélérer les décisions de modération et réduire la charge pesant sur les équipes humaines de Valve. Valve est réputée pour sa discrétion et son refus de communiquer sur ses projets avant qu'ils ne soient prêts. Steam est la plus grande plateforme de distribution de jeux PC au monde, avec plus de 130 millions de comptes actifs, ce qui génère un volume considérable d'incidents, de signalements et de comportements suspects à traiter quotidiennement. L'intégration de l'IA dans ces processus s'inscrit dans une tendance plus large : Microsoft, Epic Games et d'autres acteurs du secteur explorent déjà des outils similaires pour la modération et l'assistance aux développeurs. La forme exacte que prendrait SteamGPT, et si ce projet sera jamais rendu public, reste pour l'instant inconnue.

OutilsOutil
1 source
627Le Big Data 

Comment HubSpot révolutionne le marketing avec l’IA ?

HubSpot a intégré en 2024 et 2025 un écosystème d'agents IA autonomes, baptisé Breeze, directement dans sa plateforme CRM utilisée par plus de 288 000 clients. Lancé officiellement lors de l'INBOUND 2024 puis enrichi jusqu'en 2026, Breeze se décompose en trois couches : un assistant conversationnel généraliste (Breeze Assistant), des agents spécialisés par fonction (Breeze Agents), et plus de 80 fonctionnalités IA intégrées comme l'AI Blog Writer, le Content Remix ou le scoring prédictif de leads. Parmi ces agents, le Prospecting Agent surveille les comptes cibles, détecte les signaux d'intention d'achat et rédige des emails personnalisés en autonomie, déjà adopté par plus de 10 000 clients. Un Customer Agent prend en charge le support client de bout en bout. Ces agents se configurent en quelques heures et restent traçables et contrôlables par les équipes. L'impact est mesurable : selon une enquête interne HubSpot, 72 % des startups utilisant ces outils constatent une amélioration de l'up-sell et du cross-sell, et 37 % observent une baisse significative de leur coût d'acquisition client. Le Prospecting Agent permettrait de presque doubler le volume de rendez-vous qualifiés. Au-delà des chiffres, le changement de paradigme est structurel : les équipes marketing et commerciales passent de l'exécution manuelle de tâches répétitives à une supervision stratégique, pendant que les agents gèrent la prospection, la création de contenu et le support. Pour les PME et startups B2B, l'enjeu est direct, automatiser des workflows complets sans recruter, avec une cohérence de données garantie par le CRM natif. Ce virage s'inscrit dans un contexte où le comportement des acheteurs a profondément changé : plus de six recherches sur dix ne génèrent désormais aucun clic, les réponses étant fournies directement par des assistants IA ou des extraits enrichis dans les moteurs de recherche. Les tunnels de conversion classiques, fondés sur des scénarios "si X alors Y", montrent leurs limites face à des parcours d'achat de plus en plus fragmentés et imprévisibles. HubSpot répond à cette rupture en positionnant Breeze comme une couche d'intelligence unifiée, appuyée sur les données CRM de chaque entreprise, ce qui la différencie des solutions IA génériques. La concurrence avec Salesforce Einstein, Microsoft Dynamics ou des outils comme Clay s'intensifie, et la capacité à proposer des agents prêts à l'emploi, sans développement sur mesure, devient un avantage décisif pour capter les équipes RevOps des entreprises de taille intermédiaire.

UELes PME et startups B2B françaises utilisant HubSpot peuvent automatiser leur prospection et support client via Breeze sans développement sur mesure.

OutilsOutil
1 source
628AWS ML Blog 

Amazon Bedrock AgentCore Runtime introduit des capacités MCP client avec état

Amazon a introduit des capacités client MCP (Model Context Protocol) avec état dans son service AgentCore Runtime sur Amazon Bedrock, marquant une évolution majeure pour les développeurs d'agents IA. Jusqu'à présent, les serveurs MCP hébergés sur cette plateforme fonctionnaient en mode sans état : chaque requête HTTP était traitée de façon indépendante, sans mémoire entre les appels. Le nouveau mode avec état, activé via un simple paramètre stateless_http=False, provision une microVM dédiée par session utilisateur, persistant jusqu'à 8 heures ou 15 minutes d'inactivité. Cette architecture permet désormais trois capacités clés du protocole MCP : l'élicitation (demander une saisie utilisateur en cours d'exécution), le sampling (solliciter du contenu généré par un LLM côté client), et les notifications de progression (streamer des mises à jour en temps réel). La continuité de session est assurée via un en-tête Mcp-Session-Id, échangé lors de l'initialisation et inclus dans toutes les requêtes suivantes. Ces nouvelles capacités transforment fondamentalement la nature des workflows agents. Là où les implémentations sans état forçaient les agents à s'exécuter de bout en bout sans interruption, les agents peuvent désormais mener de véritables conversations bidirectionnelles avec leurs clients : s'arrêter pour demander une clarification à l'utilisateur au milieu d'un appel d'outil, déléguer dynamiquement la génération de contenu au LLM présent côté client, ou signaler l'avancement d'opérations longues en temps réel. Pour les équipes qui construisent des assistants IA complexes, des pipelines de traitement de documents ou des agents d'automatisation nécessitant validation humaine intermédiaire, c'est un changement de paradigme concret qui élimine des contournements architecturaux souvent coûteux à maintenir. Le Model Context Protocol, standard ouvert définissant comment les applications LLM se connectent à des outils et sources de données externes, gagne rapidement en adoption depuis son lancement par Anthropic fin 2024. Amazon avait déjà intégré l'hébergement de serveurs MCP sans état dans AgentCore Runtime dans une version précédente ; cette mise à jour complète l'implémentation bidirectionnelle du protocole. L'isolation entre sessions via des microVMs dédiées garantit la sécurité et l'indépendance des contextes, chaque session bénéficiant de CPU, mémoire et système de fichiers séparés. Si une session expire ou que le serveur redémarre, les clients reçoivent une erreur 404 et doivent réinitialiser la connexion. Cette approche positionne AWS comme un acteur central dans l'infrastructure d'agents IA d'entreprise, en rivalité directe avec les offres similaires de Microsoft Azure et Google Cloud dans la course à standardiser les architectures agentiques.

UELes équipes européennes développant des agents IA sur des plateformes cloud peuvent désormais implémenter des workflows agentiques bidirectionnels natifs sans contournements architecturaux coûteux.

OutilsActu
1 source
Gemma 4 : le nouveau modèle d’IA de Google s’invite sur Nintendo Switch
629Frandroid 

Gemma 4 : le nouveau modèle d’IA de Google s’invite sur Nintendo Switch

Une développeuse a réussi à faire tourner Gemma 4, le modèle d'intelligence artificielle open source de Google, directement sur une Nintendo Switch, sans connexion à un serveur distant. L'exploit repose sur la version la plus compacte du modèle, publiée par Google en avril 2025 dans le cadre de sa gamme Gemma 4, qui décline plusieurs tailles allant de 1 à 27 milliards de paramètres. C'est la variante 1B, soit un milliard de paramètres, qui a été portée sur la console de Nintendo, dont le matériel repose sur une puce NVIDIA Tegra X1 et 4 Go de RAM partagée. Cet accomplissement illustre la progression rapide de la miniaturisation des modèles de langage et leur capacité à s'exécuter sur du matériel grand public, bien loin des serveurs GPU qui équipent habituellement ce type de charge de travail. Pour les développeurs embarqués et les constructeurs d'appareils connectés, cela ouvre des perspectives concrètes : intégrer des capacités d'inférence locale dans des terminaux à faible consommation, sans dépendance au cloud et sans coût de bande passante. Google a lancé la famille Gemma comme alternative ouverte à ses modèles propriétaires Gemini, ciblant explicitement les usages sur appareil. La Switch, conçue en 2017, n'était évidemment pas pensée pour l'IA générative, ce qui rend la démonstration d'autant plus symbolique. Elle s'inscrit dans une tendance plus large de course à l'efficience, où des acteurs comme Meta avec Llama, Microsoft avec Phi ou Apple avec ses modèles on-device cherchent tous à repousser les limites du possible sur silicium contraint.

LLMsActu
1 source
Top 10 des entreprises IA : qui domine vraiment la révolution mondiale ?
630Le Big Data 

Top 10 des entreprises IA : qui domine vraiment la révolution mondiale ?

Une poignée de géants technologiques concentre aujourd'hui l'essentiel de la puissance de l'intelligence artificielle mondiale. Microsoft, en tête, a réalisé un pivot stratégique majeur en investissant plusieurs milliards de dollars dans OpenAI, le laboratoire créateur de ChatGPT. En échange de ce partenariat exclusif, la firme de Redmond intègre les modèles GPT dans l'ensemble de son écosystème sous la marque Copilot : Windows, la suite Office, GitHub et ses outils de cybersécurité. Son cloud Azure sert simultanément de plateforme d'entraînement pour OpenAI et d'infrastructure pour les entreprises souhaitant déployer leurs propres applications d'IA. Alphabet, maison mère de Google, incarne quant à elle une présence encore plus ancienne dans le domaine : en 2017, ses chercheurs ont publié "Attention Is All You Need", le papier fondateur de l'architecture transformer sur laquelle reposent aujourd'hui la quasi-totalité des grands modèles de langage. Nvidia, OpenAI, Meta, Amazon, Apple, Anthropic et d'autres acteurs complètent ce cercle restreint qui contrôle modèles, puces et infrastructure cloud. Ce niveau de concentration a des conséquences directes sur l'ensemble de l'économie numérique. En contrôlant à la fois les algorithmes et l'infrastructure, ces entreprises deviennent les principaux distributeurs d'IA pour des centaines de millions d'utilisateurs et pour les entreprises qui cherchent à automatiser leurs processus. Microsoft et Google, en particulier, transforment des logiciels déjà massivement adoptés en interfaces d'intelligence artificielle, rendant l'adoption quasi-transparente pour l'utilisateur final. Les entreprises qui souhaitent développer leurs propres solutions d'IA se retrouvent en grande partie dépendantes de l'infrastructure cloud de ces mêmes acteurs, renforçant ainsi leur position dominante sur toute la chaîne de valeur, de la recherche fondamentale jusqu'à la distribution commerciale. Cette domination est le fruit de décennies d'investissement massif dans la recherche et l'infrastructure. Google Finance cette transformation depuis les années 2010 via DeepMind et Google Brain, tandis que Microsoft a su reconvertir sa position de leader du logiciel d'entreprise en levier d'adoption de l'IA générative. La barrière à l'entrée est désormais astronomique : entraîner un grand modèle de langage compétitif nécessite des dizaines de milliers de GPU et des investissements se chiffrant en milliards de dollars, ce que seuls quelques acteurs peuvent se permettre. La question qui se pose pour la suite est double : comment les régulateurs, notamment en Europe avec l'AI Act, vont-ils encadrer cette concentration de pouvoir technologique, et quels nouveaux entrants, à l'image d'Anthropic ou Mistral, parviendront à s'imposer face à des géants qui ont pris plusieurs longueurs d'avance ?

UELa concentration du pouvoir IA entre quelques géants américains renforce la dépendance des entreprises européennes à des infrastructures cloud étrangères, un enjeu central de l'AI Act et une menace directe pour la souveraineté numérique de l'UE.

BusinessActu
1 source
Publicité dans l’IA : 63% des utilisateurs disent perdre confiance dans les réponses
631Siècle Digital 

Publicité dans l’IA : 63% des utilisateurs disent perdre confiance dans les réponses

Une enquête Ipsos Consumer Tracker menée auprès de 1 085 adultes américains révèle que 63% des utilisateurs déclarent perdre confiance dans les réponses des assistants IA dès lors que celles-ci intègrent de la publicité. L'étude met également en lumière un fossé générationnel marqué : 49% des 18-34 ans se disent très familiers avec l'IA, contre seulement 15% des plus de 55 ans, ce qui illustre à quel point l'adoption reste concentrée sur les tranches d'âge jeunes. Ce chiffre de 63% est particulièrement significatif pour l'industrie, car il pointe une tension fondamentale entre monétisation et crédibilité. Les grands acteurs comme Google, OpenAI ou Microsoft misent sur l'intégration publicitaire pour rentabiliser leurs assistants IA, dont les coûts d'infrastructure restent colossaux. Or, si les utilisateurs perçoivent les réponses comme biaisées par des intérêts commerciaux, c'est l'utilité même du produit qui s'effondre, et avec elle la fidélisation. Cette défiance s'inscrit dans un contexte où la question de la monétisation de l'IA conversationnelle est devenue centrale. Après une phase d'adoption portée par la gratuité et la nouveauté, les plateformes cherchent désormais des modèles économiques viables. Le recours à la publicité, traditionnel sur le web, se heurte ici à une attente différente : les utilisateurs traitent les assistants IA comme des conseillers neutres, non comme des médias. Trouver un équilibre entre revenus publicitaires et perception d'objectivité sera l'un des défis majeurs des prochains mois pour l'ensemble du secteur.

SociétéOpinion
1 source
Des agents d'intégration des employés par IA avec Amazon Quick
632AWS ML Blog 

Des agents d'intégration des employés par IA avec Amazon Quick

Amazon a lancé Quick, un service d'agents IA entièrement géré et sans code, conçu pour automatiser l'onboarding des nouveaux employés en entreprise. Concrètement, Quick permet aux équipes RH de créer des assistants conversationnels capables de répondre aux questions des nouvelles recrues sur les politiques internes, les avantages sociaux ou les procédures administratives, de suivre la complétion des documents de conformité, et de traiter automatiquement les tickets courants, comme une demande d'équipement IT via ServiceNow ou l'envoi d'un message de bienvenue sur Slack. Le service s'intègre aux outils existants de l'entreprise : SharePoint, OneDrive, Confluence, Amazon S3, et les outils de gestion de projet. Il repose sur trois composants clés : des bases de connaissances indexées depuis ces sources multiples, des connecteurs d'actions permettant à l'agent d'agir directement dans les systèmes tiers, et des espaces collaboratifs qui regroupent fichiers, tableaux de bord et bases de connaissances pour une équipe donnée. L'enjeu est significatif pour les grandes organisations : les entreprises perdent un temps considérable par nouvelle recrue pendant la période d'intégration, les employés n'atteignant souvent qu'une fraction de leur productivité potentielle durant le premier mois. Les équipes RH, elles, s'épuisent à répondre aux mêmes questions répétitives, à basculer entre wikis, emails, outils de ticketing et plateformes de messagerie pour coordonner chaque étape. Avec Quick, un agent unifié centralise toutes ces interactions : il présente la checklist d'onboarding à jour, répond avec un langage validé par l'entreprise, ouvre des demandes dans les outils métier, et oriente le nouvel arrivant vers l'étape suivante, le tout sans intervention manuelle d'un chargé RH. Ce lancement s'inscrit dans la stratégie plus large d'Amazon Web Services d'imposer ses services managés dans les workflows d'entreprise, face à des concurrents comme Microsoft Copilot ou ServiceNow Now Assist qui occupent déjà ce terrain. L'approche sans code de Quick vise explicitement les équipes RH non techniques, qui peuvent configurer leurs agents via une interface visuelle plutôt que du développement sur mesure. Deux modes coexistent : un assistant système généraliste disponible par défaut, et des agents personnalisés adaptés aux processus spécifiques de chaque organisation. La question qui se pose désormais est celle de l'adoption réelle dans des environnements enterprise souvent fragmentés, où les intégrations avec des dizaines d'outils legacy restent le principal frein, et où la gouvernance des données RH sensibles transitant par un service cloud tiers soulèvera inévitablement des questions de conformité.

UELes entreprises européennes devront évaluer la conformité RGPD avant de confier des données RH sensibles à ce service cloud américain.

OutilsOutil
1 source
Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur
633AWS ML Blog 

Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur

Amazon a introduit une fonctionnalité de personnalisation de modèles sans serveur dans SageMaker AI, permettant aux équipes d'améliorer drastiquement les capacités d'appel d'outils des agents IA sans gérer d'infrastructure GPU. Dans un cas concret publié début avril 2026, des ingénieurs ont affiné le modèle Qwen 2.5 7B Instruct en utilisant la technique RLVR (Reinforcement Learning with Verifiable Rewards) et ont obtenu une amélioration de 57% du score de qualité des appels d'outils sur des scénarios inédits, c'est-à-dire des outils que le modèle n'avait jamais vus lors de l'entraînement. La méthode repose sur un principe simple : le modèle génère huit réponses candidates par prompt, une fonction de récompense vérifie lesquelles sont correctes, et l'algorithme GRPO (Group Relative Policy Optimization) renforce les comportements qui surpassent la moyenne du groupe. SageMaker AI prend en charge les familles de modèles Amazon Nova, Llama, Qwen et DeepSeek, avec un suivi des métriques via MLflow intégré. L'enjeu est concret : les agents IA en production échouent fréquemment lors des appels d'outils, qu'il s'agisse d'halluciner des fonctions inexistantes, de passer des paramètres incorrects, ou de déclencher une action là où ils devraient demander une clarification. Ces erreurs bloquent le déploiement en production et détruisent la confiance des utilisateurs. La nouvelle approche serverless d'Amazon supprime l'obstacle opérationnel majeur que représentait jusqu'ici le fine-tuning par renforcement : achat de GPU, orchestration mémoire entre les phases de rollout et d'entraînement, infrastructure de récompenses, gestion des checkpoints. Les équipes peuvent désormais se concentrer sur leurs données, leur modèle et leur fonction de récompense, le reste étant géré par la plateforme. Le fine-tuning supervisé classique (SFT) montre ses limites pour ce type de tâche : il nécessite des exemples étiquetés pour chaque comportement souhaité, mais peine à généraliser la prise de décision entre appeler un outil, demander des informations supplémentaires, ou refuser d'agir. RLVR contourne ce problème en exploitant la nature vérifiable des appels d'outils : soit le modèle a appelé la bonne fonction avec les bons paramètres, soit non. Cette objectivité binaire rend l'appel d'outils particulièrement adapté à l'apprentissage par renforcement. Amazon positionne cette offre dans un marché de l'IA agentique en forte croissance, où des acteurs comme Google (Vertex AI), Microsoft (Azure ML) et des startups spécialisées se disputent les équipes qui cherchent à industrialiser des agents fiables, avec un accès simplifié via SageMaker Studio et un compte AWS standard.

OutilsActu
1 source
Amazon Bedrock et Amazon OpenSearch : créer un moteur de recherche intelligent pour le RAG hybride
634AWS ML Blog 

Amazon Bedrock et Amazon OpenSearch : créer un moteur de recherche intelligent pour le RAG hybride

Amazon a présenté une approche technique détaillée pour construire des assistants d'IA générative de nouvelle génération, combinant Amazon Bedrock, Amazon Bedrock AgentCore, le framework Strands Agents et Amazon OpenSearch dans une architecture dite "RAG hybride" (Retrieval-Augmented Generation). Ces systèmes, plus sophistiqués que de simples chatbots, sont capables de mener des conversations en plusieurs étapes, d'adapter leurs réponses aux besoins spécifiques de chaque utilisateur, et d'exécuter des tâches en arrière-plan telles que des appels d'API ou des requêtes en base de données en temps réel. L'exemple concret illustré dans l'article est celui d'un assistant de réservation hôtelière : l'agent interroge d'abord une base de données pour identifier les établissements correspondant aux critères du client, puis effectue des appels API pour récupérer disponibilités et tarifs actuels, avant de synthétiser ces informations dans une réponse cohérente. Le coeur de l'innovation réside dans la combinaison de deux approches de recherche d'information : la recherche textuelle classique par mots-clés et la recherche sémantique vectorielle. Cette dernière repose sur des embeddings vectoriels précalculés, stockés dans des bases de données vectorielles comme OpenSearch, qui permettent de trouver des résultats pertinents même lorsque les termes exacts ne correspondent pas. Le système convertit la requête de l'utilisateur en vecteur numérique et identifie les contenus les plus proches dans un espace à haute dimension, en utilisant des métriques de distance comme la similarité cosinus. Un exemple frappant illustre la puissance de cette approche : pour la requête "2x4 lumber board", le système sémantique identifie "building materials" comme résultat pertinent, là où une recherche lexicale aurait échoué. Cette capacité d'alignement sémantique est particulièrement précieuse pour les entreprises dont les bases de connaissances métier utilisent une terminologie différente de celle employée par leurs clients. Cette publication s'inscrit dans la stratégie d'Amazon Web Services de positionner Bedrock comme la plateforme centrale pour le déploiement d'agents d'IA en entreprise. Le RAG hybride répond à un défi bien documenté des LLMs : leur incapacité à accéder nativement à des données récentes ou propriétaires. En greffant une couche de récupération dynamique sur des modèles comme ceux disponibles via Bedrock, AWS propose une alternative aux solutions de fine-tuning, plus coûteuses et moins flexibles. La concurrence dans ce segment est intense, avec des offres similaires chez Microsoft Azure (Azure AI Search) et Google Cloud (Vertex AI Search). L'intégration native d'OpenSearch dans cet écosystème renforce l'attrait pour les entreprises déjà clientes AWS, tandis que l'introduction de Bedrock AgentCore signale une montée en gamme vers des architectures multi-agents plus complexes, capables d'orchestrer plusieurs outils et sources de données simultanément.

OutilsOutil
1 source
Codex propose désormais une tarification plus flexible pour les équipes
635OpenAI Blog 

Codex propose désormais une tarification plus flexible pour les équipes

OpenAI a annoncé l'ajout d'une option de facturation à l'usage pour Codex, son agent de programmation, disponible désormais pour les abonnés ChatGPT Business et Enterprise. Ce modèle tarifaire vient compléter les formules d'abonnement existantes et permet aux équipes de ne payer que ce qu'elles consomment réellement, sans engagement forfaitaire fixe. Ce changement facilite concrètement l'adoption de Codex dans les entreprises qui hésitaient à s'engager sur un abonnement avant d'évaluer leur usage réel. Les équipes de développement peuvent désormais tester l'outil à petite échelle, mesurer le retour sur investissement, puis augmenter progressivement leur consommation sans friction tarifaire. C'est particulièrement pertinent pour les grandes organisations où les déploiements se font par étapes et nécessitent des validations budgétaires successives. Codex s'inscrit dans la stratégie d'OpenAI pour conquérir le marché des outils de développement, en concurrence directe avec GitHub Copilot (Microsoft), Cursor et Claude d'Anthropic. La tarification à l'usage est devenue un standard dans ce secteur, les entreprises préférant une corrélation directe entre coût et valeur produite. Cette flexibilité tarifaire devrait accélérer la pénétration de Codex dans les équipes techniques enterprise, segment où la friction à l'adoption reste le principal frein.

UELes équipes de développement européennes abonnées à ChatGPT Business ou Enterprise peuvent désormais adopter Codex sans engagement forfaitaire, réduisant la friction budgétaire pour les DSI soumis à des cycles de validation stricts.

OutilsOutil
1 source
OPINION. « Fin de la taxe Zucman : vers une fiscalité des agents intelligents »
636La Tribune 

OPINION. « Fin de la taxe Zucman : vers une fiscalité des agents intelligents »

Gabriel Zucman, économiste français reconnu pour ses travaux sur la fiscalité des ultra-riches, a défendu une taxation mondiale des grandes fortunes comme réponse aux inégalités croissantes. Mais une tribune d'opinion publiée récemment remet en question cette approche au profit d'une nouvelle piste : taxer directement les agents intelligents plutôt que les individus ou les entreprises qui les déploient. L'argument central est que le modèle fiscal des économies développées repose encore sur le travail humain — cotisations, impôts sur les revenus — alors que l'automatisation par IA érode progressivement cette base. L'enjeu est considérable : si les agents IA remplacent des millions de travailleurs, les États perdent des recettes fiscales massives sans mécanisme de compensation. Une fiscalité des agents intelligents permettrait de maintenir le financement des services publics et de la protection sociale à mesure que l'automatisation s'accélère. Cela toucherait directement les grandes entreprises tech — Google, Meta, Microsoft — qui déploient ces systèmes à grande échelle. Ce débat s'inscrit dans une réflexion plus large sur l'adaptation des États à l'ère de l'IA. Plusieurs économistes et institutions, dont l'OCDE, commencent à explorer des pistes similaires. La question n'est plus théorique : avec l'explosion des agents autonomes capables de réaliser des tâches cognitives complexes, la fenêtre pour concevoir un cadre fiscal adapté se referme rapidement.

UEL'OCDE et des économistes européens, dont le Français Gabriel Zucman, explorent une taxation directe des agents IA pour compenser l'érosion des recettes fiscales liées à l'automatisation, un enjeu structurel pour le financement de la protection sociale en France et en Europe.

RégulationReglementation
1 source
Comment créer des workflows AgentScope prêts pour la production avec agents ReAct, outils personnalisés, débat multi-agents, sorties structurées et pipelines concurrents
637MarkTechPost 

Comment créer des workflows AgentScope prêts pour la production avec agents ReAct, outils personnalisés, débat multi-agents, sorties structurées et pipelines concurrents

AgentScope, le framework open-source de gestion d'agents IA développé par Alibaba DAMO Academy, dispose désormais d'un tutoriel complet permettant de construire des workflows multi-agents prêts pour la production. Publié début 2026 et conçu pour tourner intégralement dans Google Colab, ce guide pas à pas couvre cinq niveaux de complexité croissante : de l'appel basique à un modèle OpenAI jusqu'à un pipeline concurrent où plusieurs agents spécialistes travaillent en parallèle. La stack technique repose sur Python 3, les bibliothèques agentscope, openai, pydantic et nest_asyncio, avec le modèle gpt-4o-mini comme moteur de raisonnement. Le tutoriel montre comment enregistrer des fonctions Python personnalisées — calcul mathématique, horodatage — dans un Toolkit, inspecter les schémas JSON générés automatiquement, puis connecter ces outils à un agent ReActAgent capable de décider dynamiquement quand les appeler. Ce type de ressource répond à un besoin concret dans l'écosystème des agents IA : la majorité des développeurs savent appeler un LLM, mais peinent à passer à une architecture robuste et modulaire en production. Le tutoriel introduit notamment MsgHub, la primitive d'AgentScope pour orchestrer des débats structurés entre agents — un pattern utile pour la vérification de faits, la critique de code ou la validation de décisions critiques. L'intégration de Pydantic pour forcer des sorties structurées élimine l'un des problèmes les plus fréquents en production : les réponses libres d'un LLM qui cassent le parsing aval. Enfin, le pipeline concurrent — plusieurs spécialistes analysent un problème en parallèle, un synthétiseur agrège leurs conclusions — réduit significativement la latence pour les tâches décomposables, ce qui est central dans les systèmes d'analyse ou de veille automatisée. AgentScope s'inscrit dans une compétition féroce entre frameworks d'orchestration d'agents : LangChain, LlamaIndex, AutoGen de Microsoft ou CrewAI occupent déjà le terrain, mais AgentScope mise sur une API asynchrone native, une gestion mémoire intégrée (InMemoryMemory) et des formateurs de messages spécifiques aux providers (OpenAIChatFormatter, OpenAIMultiAgentFormatter). Le choix de gpt-4o-mini comme modèle de référence dans le tutoriel reflète l'orientation coût/performance qui domine les déploiements réels en 2025-2026. La prochaine étape logique pour ce type de workflow serait l'intégration de mémoire persistante externe et de mécanismes de supervision — deux angles sur lesquels la communauté AgentScope est activement attendue.

💬 AgentScope commence à ressembler à quelque chose de sérieux. Le pattern `MsgHub` pour les débats structurés entre agents, c'est exactement ce qui manque quand tu essaies de faire de la validation critique sans que tout parte en freestyle. Reste à voir si ça tient face à AutoGen ou CrewAI en conditions réelles, parce que sur le papier, tous ces frameworks ont l'air bien jusqu'au premier bug de prod.

OutilsTuto
1 source
Construire un pipeline IA de génération prêt pour la production avec Gemma 3 1B Instruct, Hugging Face Transformers et Colab
638MarkTechPost 

Construire un pipeline IA de génération prêt pour la production avec Gemma 3 1B Instruct, Hugging Face Transformers et Colab

Google a récemment mis à disposition Gemma 3 1B Instruct, un modèle de langage compact de 1 milliard de paramètres conçu pour être déployé dans des environnements contraints, notamment sur CPU ou GPU grand public. Un tutoriel détaillé publié sur la plateforme AnalyticsVidhya propose un pipeline complet et reproductible pour faire tourner ce modèle directement dans Google Colab, en s'appuyant sur la bibliothèque Hugging Face Transformers (version 4.51.0 minimum), ainsi que sur les outils accelerate, sentencepiece et safetensors. Le workflow couvre l'authentification sécurisée via un token Hugging Face, le chargement du tokenizer et du modèle avec détection automatique du matériel disponible (CUDA ou CPU), et l'utilisation de la précision bfloat16 pour optimiser la mémoire sur GPU. Ce type de guide a une valeur concrète pour les développeurs et data scientists qui souhaitent intégrer des LLM légers dans leurs applications sans recourir à des infrastructures coûteuses. Gemma 3 1B se distingue par sa taille réduite, ce qui le rend accessible à un large éventail de machines, y compris les environnements gratuits de Colab. Le tutoriel ne se limite pas au simple chargement du modèle : il propose des utilitaires réutilisables pour la génération de texte, la mise en forme des prompts en structure de conversation (chat template), et teste le modèle sur des cas d'usage réels — génération libre, réponses structurées au format JSON, chaînage de prompts, benchmarking de vitesse et résumé déterministe. Cette approche orientée production, plutôt que démonstration, répond à un besoin croissant de reproductibilité dans les projets d'IA appliquée. Gemma 3 est la troisième génération de la famille de modèles open-weights de Google DeepMind, lancée début 2025 pour concurrencer des modèles comme Llama 3 de Meta ou Phi-3 de Microsoft sur le segment des LLM légers et locaux. L'écosystème Hugging Face joue ici un rôle central de plateforme de distribution et d'intégration, avec des outils standardisés qui facilitent le passage du prototype à la production. La disponibilité de modèles performants sous 2 milliards de paramètres est un enjeu stratégique : elle permet des déploiements on-device, réduit les coûts d'inférence et ouvre la voie à des applications embarquées ou hors-ligne. Les prochaines étapes naturelles de ce type de pipeline incluent le fine-tuning sur données propriétaires, le déploiement via une API FastAPI ou Gradio, et l'intégration dans des workflows RAG (retrieval-augmented generation).

LLMsTuto
1 source
Alphabet : après Google, YouTube et Waymo, la prochaine révolution est l’algorithme TurboQuant
639Presse-citron 

Alphabet : après Google, YouTube et Waymo, la prochaine révolution est l’algorithme TurboQuant

Google a dévoilé TurboQuant, un nouvel algorithme de compression destiné à optimiser l'utilisation de la mémoire dans les systèmes d'intelligence artificielle. Développé en interne au sein d'Alphabet, cet outil n'est pas un produit grand public, mais une brique technique fondamentale visant à réduire la quantité de mémoire vive nécessaire pour faire fonctionner des modèles de grande taille. La présentation a eu lieu il y a quelques jours, sans annonce de disponibilité externe pour l'instant. L'enjeu est considérable : l'un des principaux freins au déploiement massif de l'IA reste le coût des infrastructures, notamment la mémoire GPU, extrêmement onéreuse. Un algorithme capable de compresser efficacement les poids des modèles sans dégrader leurs performances permettrait à Google de réduire significativement ses coûts opérationnels, tout en accélérant ses services — à commencer par son moteur de recherche, qui intègre désormais des résumés et réponses générés par IA à grande échelle. La compression de modèles, ou quantification, est un champ de recherche très actif où s'affrontent les grandes entreprises tech et les laboratoires académiques. Des techniques comme GPTQ, AWQ ou la quantification 4 bits ont déjà permis des gains importants, mais Google semble vouloir pousser plus loin avec une approche maison. TurboQuant s'inscrit dans une stratégie plus large d'Alphabet pour contrôler toute la chaîne technique de l'IA — des puces (TPU) aux algorithmes d'inférence — et maintenir son avance face à Microsoft, Meta et Amazon.

InfrastructureOpinion
1 source
Créer un agent FinOps avec Amazon Bedrock AgentCore
640AWS ML Blog 

Créer un agent FinOps avec Amazon Bedrock AgentCore

Amazon a dévoilé une solution clé en main pour construire un agent FinOps basé sur Amazon Bedrock AgentCore, permettant aux équipes financières de gérer les coûts AWS à travers plusieurs comptes via une interface conversationnelle unique. L'architecture repose sur Claude Sonnet 4.5 d'Anthropic, le Strands Agent SDK et le protocole MCP (Model Context Protocol), déployée via AWS CDK. L'agent consolide les données de trois services AWS — Cost Explorer, Budgets et Compute Optimizer — et propose plus de 20 outils spécialisés couvrant l'intégralité du spectre de la gestion des coûts cloud. La mémoire conversationnelle conserve jusqu'à 30 jours de contexte, permettant des questions de suivi sans répéter les informations préalables. Concrètement, cette solution élimine la nécessité pour les équipes finance et DevOps de naviguer manuellement entre plusieurs consoles AWS pour obtenir une vue consolidée des dépenses. Un responsable peut simplement demander "Quels sont mes principaux postes de dépenses ce mois-ci ?" et obtenir une réponse immédiate, sans requêtes SQL ni exports manuels. L'authentification repose sur Amazon Cognito (gestion des utilisateurs et flux OAuth 2.0 machine-à-machine), tandis qu'AWS Amplify héberge l'interface web. L'accès en langage naturel démocratise la visibilité sur les coûts cloud à l'ensemble de l'organisation, y compris aux profils non techniques — un enjeu majeur dans les entreprises où la facture AWS est souvent opaque pour les décideurs métier. Le FinOps — la pratique de gouvernance financière du cloud — est devenu un domaine à part entière alors que les dépenses cloud des entreprises ont explosé ces cinq dernières années, rendant le suivi des coûts multi-comptes complexe et chronophage. Amazon Bedrock AgentCore, lancé récemment par AWS, est la réponse d'Amazon à la vague d'agents IA d'entreprise : une plateforme d'exécution managée pour déployer des agents LLM avec mémoire, outils et identité gérés nativement. Cette solution illustre parfaitement la stratégie d'AWS de transformer ses propres services (Cost Explorer, Compute Optimizer) en sources de données accessibles via des agents IA, réduisant la friction d'adoption. La concurrence s'intensifie sur ce segment : Microsoft Copilot pour Azure Cost Management et Google Cloud Carbon Footprint poursuivent des ambitions similaires. La prochaine étape logique sera l'automatisation des recommandations d'optimisation, passant d'un agent qui répond à des questions à un agent qui agit directement sur l'infrastructure pour réduire les coûts.

UELes entreprises françaises et européennes utilisant AWS peuvent simplifier leur gestion de coûts cloud multi-comptes via cet agent, sans impact réglementaire ou institutionnel spécifique.

OutilsOutil
1 source
STADLER réinvente le travail intellectuel dans une entreprise vieille de 230 ans
641OpenAI Blog 

STADLER réinvente le travail intellectuel dans une entreprise vieille de 230 ans

STADLER, entreprise vieille de 230 ans spécialisée dans les systèmes de tri et de gestion des déchets, a déployé ChatGPT auprès de 650 collaborateurs pour transformer leur façon de traiter l'information et de produire du contenu. L'initiative, menée en partenariat avec OpenAI, vise à automatiser les tâches répétitives à forte valeur cognitive — rédaction de documents, synthèse de rapports, recherche interne — afin de libérer du temps pour des activités à plus forte valeur ajoutée. Des gains de productivité mesurables ont déjà été observés dans plusieurs départements depuis le déploiement. L'enjeu est de taille pour une entreprise industrielle traditionnelle : intégrer des outils d'IA générative dans des processus métiers souvent rigides constitue un changement culturel autant que technologique. Pour les 650 employés concernés, cela représente une nouvelle façon de travailler au quotidien, avec des assistants IA capables de rédiger, résumer et structurer l'information en quelques secondes là où il fallait auparavant plusieurs heures. Le cas STADLER illustre une tendance de fond : les entreprises industrielles centenaires, longtemps considérées comme réfractaires à l'innovation numérique rapide, accélèrent désormais leur adoption de l'IA générative. OpenAI multiplie ce type de partenariats avec des entreprises B2B pour ancrer ChatGPT Enterprise dans les flux de travail réels, face à la concurrence de Microsoft Copilot et Google Gemini for Workspace. La prochaine étape pour STADLER sera probablement d'étendre ces usages à l'ensemble de la chaîne de valeur, de la conception à la relation client.

UEUne entreprise industrielle européenne de 650 salariés adopte ChatGPT Enterprise, illustrant l'accélération de l'IA générative dans le tissu industriel traditionnel du continent.

OutilsActu
1 source
Amazon Bedrock lance l'inférence d'IA générative en Asie-Pacifique (Nouvelle-Zélande)
642AWS ML Blog 

Amazon Bedrock lance l'inférence d'IA générative en Asie-Pacifique (Nouvelle-Zélande)

Amazon Web Services vient d'ouvrir l'accès à Amazon Bedrock depuis la région Asie-Pacifique (Nouvelle-Zélande), identifiée sous le code ap-southeast-6 et basée à Auckland. Les clients néo-zélandais peuvent désormais appeler directement les modèles d'Anthropic — Claude Opus 4.5 et 4.6, Sonnet 4.5 et 4.6, et Haiku 4.5 — ainsi que les modèles Amazon Nova 2 Lite, sans passer par une région étrangère. Le mécanisme repose sur l'inférence cross-région : lorsqu'une requête est émise depuis Auckland, Amazon Bedrock la distribue dynamiquement vers une ou plusieurs régions de destination — Auckland elle-même, Sydney (ap-southeast-2) ou Melbourne (ap-southeast-4) — en fonction de la charge et de la disponibilité. Toutes les données transitent exclusivement sur le réseau privé AWS, chiffrées en transit, sans jamais passer par l'internet public. Les appels sont enregistrés dans AWS CloudTrail depuis la région source, et les logs d'invocation peuvent être dirigés vers CloudWatch ou S3 dans la même région. Cette disponibilité régionale répond à une demande concrète des entreprises néo-zélandaises soumises à des exigences de résidence des données. Le profil géographique « AU » permet désormais de garantir que les traitements d'inférence restent dans le périmètre Australie–Nouvelle-Zélande, ce qui est décisif pour des secteurs comme la santé, la finance ou les services publics, où la localisation des données est une contrainte légale ou réglementaire. En parallèle, les organisations sans contrainte de résidence peuvent opter pour le profil global, qui route vers n'importe quelle région commerciale AWS dans le monde pour maximiser le débit disponible. Ce double choix de routage offre une flexibilité opérationnelle rare sur le marché du cloud. Amazon Bedrock s'étend ainsi progressivement dans la zone Pacifique, une région stratégique pour AWS face à la concurrence de Google Cloud et Microsoft Azure, qui ont également multiplié leurs ouvertures de datacenters locaux ces dernières années. La Nouvelle-Zélande, bien que marché de taille modeste, représente un point d'ancrage important pour les entreprises multinationales opérant dans la région ANZ. L'intégration d'Auckland dans le profil cross-région AU — sans modifier les comportements existants de Sydney et Melbourne — illustre une approche incrémentale conçue pour ne pas perturber les architectures déjà en production. La prochaine étape probable sera l'élargissement du catalogue de modèles accessibles depuis cette nouvelle région source, au fur et à mesure que les capacités d'inférence locales monteront en charge.

InfrastructureActu
1 source
Affiner les LLM avec des données non structurées via SageMaker Unified Studio et S3
643AWS ML Blog 

Affiner les LLM avec des données non structurées via SageMaker Unified Studio et S3

Amazon Web Services a annoncé une intégration entre Amazon SageMaker Unified Studio et les buckets Amazon S3 grand public, permettant d'exploiter des données non structurées directement dans les workflows de machine learning. Le cas d'usage présenté illustre l'affinage du modèle Llama 3.2 11B Vision Instruct — développé par Meta — pour des tâches de questions-réponses visuelles (VQA), comme l'extraction automatique d'informations depuis des reçus ou documents scannés. Le modèle de base atteint un score ANLS de 85,3 % sur le benchmark DocVQA, une métrique mesurant la similarité entre réponse prédite et réponse attendue. Pour l'affinage, AWS utilise le dataset DocVQA de Hugging Face, qui contient 39 500 exemples d'entraînement associant image, question et réponse. Trois versions affinées sont produites avec des volumes de données variables : 1 000, 5 000 et 10 000 images, orchestrées entièrement via SageMaker Unified Studio et évaluées avec Amazon SageMaker MLflow en mode serverless. Cet affinement ciblé permet aux équipes data de dépasser les limites d'un modèle généraliste sans reconstruire une infrastructure complexe de bout en bout. Pour les entreprises traitant des documents à haute valeur — contrats, factures, rapports médicaux — gagner quelques points de précision au-delà de 85 % peut représenter une différence opérationnelle significative. L'intégration native entre S3 et le catalogue SageMaker supprime une friction majeure : les données non structurées (images, PDF, textes bruts) deviennent des actifs directement exploitables par les équipes ML sans pipeline d'ingestion personnalisé. Le suivi des expériences via MLflow serverless permet en outre de comparer objectivement les trois variantes affinées et de documenter les gains de performance, une exigence croissante dans les déploiements enterprise. Cette annonce s'inscrit dans la stratégie d'AWS pour faire de SageMaker Unified Studio une plateforme unifiée couvrant l'ensemble du cycle MLOps, depuis l'ingestion des données brutes jusqu'au déploiement en production. La montée en puissance des modèles multimodaux — capables de traiter simultanément texte et image — crée une demande forte pour des outils d'affinage accessibles, sans que chaque équipe doive maîtriser les subtilités de l'entraînement distribué. AWS positionne ici SageMaker JumpStart comme point d'accès aux modèles fondamentaux, tandis que l'infrastructure d'entraînement repose sur des instances p4de.24xlarge, des GPU haute performance nécessitant une demande d'augmentation de quota. La prochaine étape logique pour AWS sera d'élargir cette intégration à d'autres formats de données non structurées et à davantage de modèles fondamentaux, dans un contexte où Google, Microsoft Azure et les plateformes spécialisées comme Modal ou Together AI se disputent le même terrain des équipes ML entreprise.

OutilsOutil
1 source
Le fondateur d’Apple donne son avis sur l’IA, et il n’y va pas de main morte
644Le Big Data 

Le fondateur d’Apple donne son avis sur l’IA, et il n’y va pas de main morte

Steve Wozniak, cofondateur d'Apple et figure emblématique de la Silicon Valley, a exprimé dans une interview accordée à Fox Business une franche désillusion vis-à-vis de l'intelligence artificielle générative. Il affirme être « déçu souvent » par les outils actuels et admet les utiliser rarement. Ses deux critiques principales : l'incapacité des IA à reproduire l'émotion humaine, et un problème de fiabilité persistant. Quand il interroge un système comme ChatGPT, il obtient des réponses longues, structurées et factuelles — là où un humain raconterait, contextualiserait, partagerait une expérience subjective. Cette dimension émotionnelle et intentionnelle lui semble fondamentalement absente des modèles actuels. Sur la fiabilité, il est tout aussi catégorique : « Je veux un contenu fiable à chaque fois », une exigence que les LLM actuels ne remplissent pas, capables de produire des réponses convaincantes mais parfois fausses, sans signaler leurs propres limites. Ces critiques ont un poids particulier dans le contexte actuel, où l'IA s'immisce dans des domaines à fort enjeu — éducation, santé, information — et où la confiance des utilisateurs est un enjeu central. Si les modèles de langage sont conçus pour optimiser pertinence et clarté, ils ne garantissent pas une authenticité ni une constance qui permettraient de les ériger en sources d'autorité. Pour Wozniak, tant que cette fiabilité n'est pas acquise, l'IA reste un outil d'assistance, pas un substitut au jugement humain. C'est une préoccupation partagée par de nombreux acteurs du secteur, notamment sur les risques de désinformation ou de décisions automatisées mal fondées dans des contextes critiques. Cette prise de position intervient dans un moment de tension stratégique pour Apple elle-même. L'entreprise a lancé en 2024 Apple Intelligence avec l'ambition affichée de rattraper OpenAI, Google et Microsoft sur le terrain de l'IA, mais plusieurs fonctionnalités annoncées tardent à être déployées, signe d'une progression prudente. Tim Cook, lui, décrit l'IA comme « profondément enrichissante et potentiellement très positive » pour l'expérience utilisateur — un contraste saisissant avec le scepticisme de son cofondateur historique, qui n'a plus de rôle opérationnel dans l'entreprise. Wozniak s'inscrit ainsi dans une tradition de voix critiques venues de l'intérieur même de la tech — des figures comme Geoffrey Hinton ou Yann LeCun qui, chacun à leur manière, ont formulé des réserves profondes sur la trajectoire actuelle de l'IA. Son discours rappelle que l'enthousiasme industriel autour de ces technologies ne fait pas l'unanimité, y compris parmi ceux qui ont bâti le monde numérique d'aujourd'hui.

SociétéOpinion
1 source
L'IA qui fait vraiment la différence pour les entreprises
645VentureBeat AI 

L'IA qui fait vraiment la différence pour les entreprises

Après deux ans de démonstrations spectaculaires et de prototypes précipités, les dirigeants technologiques des grandes entreprises adoptent en 2026 un discours nettement plus pragmatique sur l'intelligence artificielle. Lors d'un webinaire organisé par OutSystems, des responsables techniques issus d'entreprises comme Thermo Fisher Scientific et McConkey Auction Group ont témoigné d'une même priorité : faire passer les agents IA du stade expérimental à la production réelle, avec des résultats mesurables. Chez Thermo Fisher, Rajkiran Vajreshwari, responsable du développement applicatif, a décrit comment son équipe a abandonné les assistants IA mono-tâches au profit d'un système multi-agents coordonné : à l'arrivée d'un ticket de support, un agent de triage classe la demande et la route dynamiquement vers un agent spécialisé — intention et priorité, contexte produit, dépannage ou conformité — chacun opérant dans un périmètre strict et auditable. L'enjeu central n'est plus le choix du bon modèle de langage, mais l'orchestration : comment router les tâches, coordonner les workflows, gouverner l'exécution et intégrer les agents dans des systèmes construits sur des décennies. Une nouvelle catégorie de risque est apparue en parallèle : le « shadow AI », autrement dit le code de niveau production généré par des employés sans supervision informatique. Ces outils maison sont exposés aux hallucinations, aux fuites de données, aux violations de politique et à la dérive des modèles. Luis Blando, CPTO d'OutSystems, résume la réponse des organisations les plus avancées en trois actions : fournir des garde-fous aux utilisateurs, utiliser l'IA pour gouverner l'IA à l'échelle du portefeuille applicatif, et s'appuyer sur des plateformes qui intègrent ces contrôles nativement plutôt que de les construire manuellement. Ce tournant pragmatique survient alors que les premières vagues d'enthousiasme autour des LLM se heurtent à leurs limites réelles en environnement d'entreprise : sans orchestration, sans connexion aux données métier existantes et sans gouvernance, les modèles les plus puissants produisent peu de valeur durable. Les profils les plus recherchés ne sont plus les data scientists spécialisés, mais les développeurs généralistes et les architectes d'entreprise capables de faire dialoguer agents IA, systèmes legacy et processus métier. La compétition se joue désormais moins sur la puissance brute des modèles que sur la capacité des plateformes — OutSystems, mais aussi Microsoft, Salesforce ou ServiceNow — à proposer des environnements où les agents peuvent être déployés, surveillés et gouvernés à l'échelle industrielle.

OutilsOutil
1 source
Ocorian : les family offices se tournent vers l'IA pour analyser leurs données financières
646AI News 

Ocorian : les family offices se tournent vers l'IA pour analyser leurs données financières

Selon une étude mondiale publiée par Ocorian, 86 % des family offices ont désormais recours à l'intelligence artificielle pour analyser leurs données financières et améliorer leurs opérations quotidiennes. Ces structures de gestion de patrimoine privé, représentant ensemble 119,37 milliards de dollars d'actifs, utilisent le machine learning pour moderniser leurs workflows, détecter des anomalies, automatiser le reporting et respecter des cadres réglementaires de plus en plus exigeants. Les outils déployés s'appuient majoritairement sur de grandes infrastructures cloud comme Microsoft Azure ou Google Cloud, qui fournissent la puissance de calcul et les protocoles de sécurité nécessaires. Sur le calendrier d'adoption, 26 % des dirigeants interrogés estiment que l'IA va transformer l'administration et les performances dès l'année prochaine, tandis que 72 % tablent sur un impact plus large à horizon deux à cinq ans. Cette adoption massive marque un tournant pour un secteur historiquement conservateur. L'IA permet aux équipes opérationnelles de repérer des schémas de fraude ou des manquements à la conformité bien plus rapidement que les contrôles manuels, tout en allégeant la charge administrative liée aux obligations réglementaires. Mais l'intégration reste complexe : les architectures de données héritées nécessitent souvent une refonte profonde avant de pouvoir supporter des outils d'analyse prédictive, et moderniser les systèmes sans perturber les services clients constitue un défi majeur. Michael Harman, directeur commercial d'Ocorian pour le Royaume-Uni et les îles Anglo-Normandes, résume bien la situation : les family offices comprennent que l'IA aura un impact considérable et qu'ils doivent commencer à explorer ce domaine, mais ils auront besoin d'accompagnement pour réussir cette transition. Paradoxalement, malgré ce fort taux d'utilisation opérationnelle, seuls 7 % des répondants — issus de 16 territoires dont le Royaume-Uni, les États-Unis, les Émirats arabes unis et Singapour — cherchent actuellement à investir directement dans des entreprises du secteur IA, préférant s'appuyer sur des solutions éprouvées plutôt qu'absorber les risques liés aux startups émergentes. Ce chiffre devrait toutefois évoluer rapidement : 74 % de ces organisations prévoient d'augmenter leurs investissements dans les actifs numériques au cours des trois prochaines années, dont 20 % de façon significative. Les family offices gèrent le patrimoine de familles fortunées et constituent l'un des segments les plus discrets — et les plus puissants — de la finance mondiale. Leur adoption accélérée de l'IA s'inscrit dans une tendance plus large de numérisation du secteur financier, sous la pression conjuguée de la complexité réglementaire croissante et de la concurrence des fintechs.

UELes family offices britanniques et des îles Anglo-Normandes figurent parmi les 16 territoires étudiés, illustrant une adoption croissante de l'IA dans la gestion de patrimoine en Europe, notamment sous la pression des cadres réglementaires financiers comme DORA.

BusinessActu
1 source
Gemini dans Dragon Quest, Copilot dans Xbox : les bots IA s’invitent dans les jeux vidéo
64701net 

Gemini dans Dragon Quest, Copilot dans Xbox : les bots IA s’invitent dans les jeux vidéo

Microsoft intègre Copilot dans les consoles Xbox, tandis que Square Enix et Google annoncent l'arrivée de Gemini dans Dragon Quest X. Ces déploiements signalent une tendance de fond : les bots IA s'imposent dans les jeux vidéo, que les joueurs le souhaitent ou non. La question de l'accueil par la communauté gaming reste entière.

OutilsOutil
1 source
Les machines pourront-elles jamais être intelligentes ?
648Microsoft Research 

Les machines pourront-elles jamais être intelligentes ?

Dans le podcast The Shape of Things to Come de Microsoft Research, Doug Burger réunit Nicolò Fusi (Microsoft Research) et Subutai Ahmad (Numenta) pour explorer si les systèmes d'IA actuels sont véritablement intelligents. Ils comparent les grands modèles de langage (LLMs) basés sur les transformers avec l'architecture distribuée et en apprentissage continu du cerveau humain, en analysant les différences d'efficacité, de représentation et d'ancrage sensorimoteur. La question centrale : les architectures digitales et biologiques sont-elles sur une trajectoire convergente, ou fondamentalement incompatibles ?

RecherchePaper
1 source
5 astuces ingénieuses qui boostent les data centers IA
649The Information AI 

5 astuces ingénieuses qui boostent les data centers IA

Face à l'explosion des besoins en électricité pour l'IA, les géants tech rivalisent d'ingéniosité : Meta a transformé ses datacenters traditionnels en clusters GPU en quelques mois et installé des "tent cities" à New Albany (Ohio), tandis que Google relie plusieurs datacenters via fibre optique pour mutualiser des gigawatts de puissance. Microsoft a racheté un sous-station électrique inutilisée construite pour Foxconn à Mount Pleasant (Wisconsin), permettant à son datacenter Fairwater de dépasser 350 MW. Ces approches — reconversion de sites industriels, récupération d'infrastructures abandonnées, et même utilisation de moteurs à réaction pour la production d'énergie — illustrent la course effrénée à la puissance de calcul qui redessine l'industrie.

InfrastructureActu
1 source
Les avantages de l'IA physique deviennent l'arme secrète de la fabrication
650MIT Technology Review 

Les avantages de l'IA physique deviennent l'arme secrète de la fabrication

La transformation industrielle évolue vers l'intelligence physique, où l'IA opère fiablement dans le monde réel. Microsoft et NVIDIA collaborent pour aider les fabricants à passer de l'expérimentation à la production à grande échelle. Les fabricants de frontière privilégient l'expansion des capacités humaines, l'accélération de l'innovation et la création de nouvelles valeurs, tout en maintenant la fiabilité et le contrôle. L'industrie manufacturière, centrale dans ce changement, intègre l'IA dans l'exécution physique, comblant le fossé entre l'automatisation et l'adaptabilité humaine grâce à l'IA physique.

UEL'alliance Microsoft-NVIDIA renforce l'intégration de l'IA physique dans la fabrication européenne, potentiellement boostant les entreprises comme Mistral, OVHcloud, Dassault, SAP, et Airbus en améliorant leur automatisation et adaptabilité.

RobotiqueOutil
1 source