OutilsLatent Space5h· 2 min de lecture

Ahmad Osman explique pourquoi l'IA locale rattrape son retard

Ahmad Osman, fondateur de la société Osmantic qui développe des logiciels open source pour déployer et faire fonctionner des systèmes d'IA locale, s'est exprimé lors de l'AI Engineer World's Fair, où il a animé un atelier en deux parties consacré aux modèles de langage locaux et aux agents de type « workstation ». La demande a été telle que certains participants n'ont pas pu être accueillis faute de place. Osman avait préparé un site permettant de comparer en direct différentes machines, comme le DGX Spark de Nvidia ou les postes AMD Strix Halo, face à des modèles cloud propriétaires, en observant performance, qualité de sortie, vitesse et latence. Son objectif était de rendre l'IA locale tangible plutôt que théorique, à un moment où l'écart entre modèles open source et modèles propriétaires de pointe continue de se réduire, selon lui à quatre ou huit mois de retard seulement. Le public de ses ateliers allait d'étudiants cherchant leur première machine capable de faire tourner de l'IA jusqu'à des cadres d'entreprise réfléchissant au routage de modèles et au contrôle des données internes.

Cette évolution compte parce qu'elle change la perception d'une technologie encore associée, dans l'esprit de beaucoup, aux modèles peu performants de 2022. Osman insiste sur le fait qu'un modèle ne suffit pas à reproduire l'expérience d'outils comme ChatGPT ou Claude Code, qui s'appuient sur une infrastructure complète incluant recherche web, outils et services annexes. Il cite l'exemple d'un ami ayant acheté une carte graphique RTX 5090 pour faire tourner Qwen 3.5 en local et connecté à Claude Code : la tentative de modifier l'éclairage RGB de sa carte a échoué localement, faute d'accès à une recherche internet permettant de contourner la date limite des données d'entraînement, alors que la version hébergée du service a réussi sans problème. Une fois l'accès à un moteur de recherche ajouté au système local, la tâche a pu être menée à bien. Pour Osman, cette distinction est essentielle pour les entreprises qui envisagent l'IA locale comme une infrastructure sérieuse plutôt qu'un simple gadget technique.

Sur son site Open Source AI Must Win, Osman défend une position plus large : la capacité à étudier, construire, réparer, déployer, auditer, adapter, enseigner, préserver et faire fonctionner des systèmes d'intelligence artificielle sans demander la permission relèverait d'un enjeu existentiel. Cette conviction s'inscrit dans un mouvement plus vaste observé lors de l'AI Engineer World's Fair, où les modèles ouverts apparaissent de plus en plus comme des alternatives crédibles aux grands modèles fermés. Le matériel disponible pour les particuliers et les entreprises, des téléphones et ordinateurs portables jusqu'aux stations de travail dédiées à base de GPU, progresse rapidement, ce qui alimente l'intérêt croissant des développeurs comme des dirigeants pour une IA maîtrisée localement, indépendante des services cloud des grands fournisseurs.

Dans nos dossiers

Open weight & Open source Claude Code Qwen3 AMD

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Information AI

Tencent mise sur OpenClaw pour rattraper son retard dans la course à l'IA en Chine

Tencent a lancé ce mois-ci pas moins de huit applications et services basés sur OpenClaw, le framework open source de création d'agents IA devenu viral en janvier 2026. Parmi eux, QClaw — imaginé par Shuyu Zhang, un chef de produit récemment embauché — permet d'installer un agent IA en un clic et de le piloter directement depuis WeChat, l'application de messagerie dominante en Chine. Dimanche dernier, Tencent a également lancé Weixin ClawBot, un outil qui intègre OpenClaw nativement dans Weixin, le nom chinois de WeChat. Cette offensive illustre l'urgence ressentie au sein du géant technologique de Shenzhen : après des années perçu comme un suiveur dans la course à l'IA en Chine, Tencent tente de rattraper son retard en s'appuyant sur l'engouement mondial pour OpenClaw. L'intégration dans WeChat est stratégique — avec plus d'un milliard d'utilisateurs actifs, la plateforme offre une rampe de distribution sans équivalent pour déployer des agents IA à grande échelle auprès du grand public chinois. OpenClaw a déclenché une vague d'adoption frénétique dans l'industrie technologique mondiale depuis son émergence en janvier, et la Chine ne fait pas exception. Tencent affronte sur ce terrain des rivaux comme Alibaba, ByteDance et Baidu, tous engagés dans une course effrénée aux agents IA. La capacité de Tencent à tirer parti de l'écosystème WeChat pourrait lui donner un avantage décisif, mais la vitesse de déploiement et la qualité des agents restent des variables critiques dans une compétition qui s'intensifie semaine après semaine.

OutilsOutil

1 source

2VentureBeat AI

Pourquoi l'IA qui fonctionne en laboratoire échoue souvent en production, et comment y remédier

La majorité des entreprises ne manquent pas d'ambition pour expérimenter l'intelligence artificielle, elles échouent à la faire fonctionner en conditions réelles. C'est le constat que dresse un responsable de l'organisation AI Foundations de Capital One, la grande banque américaine, dans une tribune publiée mi-2026. Selon lui, la vraie rupture ne se situe pas dans l'adoption des derniers modèles, mais dans le passage du prototype prometteur au système fiable à l'échelle de production. Les environnements d'entreprise restent complexes, fragmentés et averse au risque, ce qui suffit à faire dérailler la plupart des initiatives dès qu'elles quittent le laboratoire. La réponse de Capital One passe par une intégration délibérée de la recherche fondamentale et du développement appliqué au sein d'une même organisation. Plutôt que de laisser la recherche académique déconnectée des contraintes opérationnelles, latence réelle, données de production, besoins métier concrets, la banque impose une boucle de feedback permanente entre chercheurs et équipes terrain. Cette approche a notamment permis de combiner des architectures multi-agents pour que des agents IA spécialisés coordonnent des tâches distinctes en parallèle, comme analyser le contexte client et préparer de la documentation simultanément. Le résultat concret : Chat Concierge, un service d'achat automobile qui ne se contente pas de répondre à des questions mais prend des actions au nom du client, simulant un raisonnement humain. La banque cite également des avancées en détection de fraude, personnalisation et expériences digitales. Sur le plan méthodologique, l'article distingue trois étapes que les organisations doivent traiter comme de véritables filtres, non comme des formalités. Une preuve de concept doit produire un signal objectif mesurable, pas une présentation de ce qu'on "pourrait" faire. Un pilote dont l'échec est impossible n'est pas un pilote : il doit élargir le périmètre et tester si la solution aide réellement un humain à travailler mieux. Enfin, la mise en production est décrite comme un sport collectif qui dépasse la seule résolution du problème algorithmique. Ce cadre, défendu par Capital One dans un contexte de forte pression à montrer des retours sur investissement concrets en IA, reflète une tendance plus large dans l'industrie financière : après des années d'expérimentation, les grandes institutions cherchent à industrialiser leurs capacités IA en posant des processus de validation rigoureux plutôt qu'en multipliant les démos spectaculaires.

OutilsOpinion

1 source

3AI News

Xebia : pourquoi les agents IA échouent sans un socle de données solide

Niels Zeilemaker, directeur technique mondial de Xebia, a exposé lors de l'AI & Big Data Expo une thèse claire : les agents d'intelligence artificielle échouent moins à cause de leur conception que de la qualité des données sur lesquelles ils opèrent. Selon lui, un agent mal alimenté peut interpréter incorrectement des champs de données, en fusionner qui n'auraient jamais dû l'être, et produire des résultats faux, non par défaut propre, mais parce que la fondation de données n'est pas prête. Pour répondre à ce problème, Xebia a développé deux offres distinctes : Xebia Axis (Agentic Data Foundation, ou ADF), qui étend la plateforme de données d'une entreprise pour y héberger des agents et les déployer aussi bien en usage client qu'interne, et Xebia ACE (AI-Native Software Engineering), un cadre qui intègre l'IA dans l'ensemble du cycle de développement logiciel. Ce dernier promet une accélération des livraisons pouvant atteindre 40 % et une réduction des coûts de transformation des systèmes legacy jusqu'à 70 %. L'enjeu central que soulève Zeilemaker touche à la gestion des catalogues de données. Dans une organisation humaine, un catalogue imparfait ne bloque jamais vraiment le travail : on appelle un collègue, on contourne, on clarifie. Les agents, eux, n'ont pas cette souplesse. Ils s'appuient exclusivement sur ce qui est documenté, et si la description d'un jeu de données est erronée ou incomplète, leur performance s'effondre. Cette contrainte change radicalement la manière dont les entreprises doivent envisager leur gouvernance des données avant tout déploiement agentique. Ce n'est plus une question de bonne pratique optionnelle, mais d'un prérequis technique strict qui conditionne le retour sur investissement de tout projet d'IA en production. Xebia positionne cette approche dans un contexte de demande croissante des grandes entreprises pour des migrations accélérées vers des plateformes modernes. Le cabinet constate que ses clients veulent sortir des systèmes legacy plus vite et plus sûrement qu'auparavant, et cherchent des méthodes comprimant un calendrier de 12 a 24 mois en un engagement a périmètre fixe et jalons définis. Xebia dit y parvenir en combinant l'expertise de ses ingénieurs avec des agents spécialisés co-développés avec le client. Le cabinet participait également au TechEx Global North America, où il a présenté cette philosophie de partage de connaissances comme un avantage concurrentiel direct. Zeilemaker cite le "vibe coding" comme illustration d'une tendance plus large : l'IA reconfigure le développement logiciel, et les entreprises qui n'ont pas sécurisé leur fondation de données risquent de construire des capacités agentiques sur du sable.

UEXebia, cabinet de conseil d'origine néerlandaise, propose ces offres aux grandes entreprises européennes cherchant à moderniser leurs systèmes legacy pour déployer des agents IA.

OutilsActu

1 source

4AWS ML Blog

AWS propose un cadre pratique pour réussir son adoption de l'IA générative

Amazon Web Services a publié un cadre méthodologique baptisé "Generative AI Path-to-Value" (P2V), conçu pour aider les entreprises à transformer leurs projets pilotes d'IA générative en systèmes opérationnels créateurs de valeur durable. Cette initiative intervient alors qu'un nombre croissant d'organisations constatent un écart entre la phase d'expérimentation, souvent prometteuse, et le déploiement en production à grande échelle. Le cadre identifie quatre catégories de blocages récurrents : la valeur (absence de ROI clairement défini et de critères de succès mesurables), le risque (exposition légale, confidentialité des données, conformité réglementaire), la technologie (intégration avec les systèmes existants, qualité des données, observabilité, scalabilité, gestion des coûts cloud) et les ressources humaines (résistance au changement, manque de compétences, redéfinition des rôles). L'enjeu est considérable pour les équipes techniques et les directions métier : sans méthode structurée, la majorité des initiatives d'IA générative restent bloquées entre le prototype et la mise en production, sans jamais produire de bénéfices mesurables. Le cadre P2V repositionne la mise en production non pas comme une finalité, mais comme une étape intermédiaire sur un chemin plus long vers la création de valeur pérenne. Concrètement, cela oblige les organisations à définir des métriques d'évaluation, à constituer des jeux de données de test, à mettre en place un monitoring continu de la qualité, et à intégrer des pratiques FinOps pour maîtriser les coûts d'infrastructure. Pour les utilisateurs finaux et les équipes IT, cela se traduit par des projets mieux gouvernés, des déploiements plus stables et un retour sur investissement plus facile à justifier auprès des décideurs. Ce travail de formalisation s'inscrit dans une dynamique plus large : après l'euphorie des années 2023-2024 marquées par l'explosion des POC, les grandes entreprises entrent dans une phase de maturité où l'accent passe de l'expérimentation à l'industrialisation. AWS n'est pas seul sur ce terrain, Microsoft Azure, Google Cloud et des cabinets de conseil comme McKinsey ou Accenture publient des cadres similaires pour accompagner cette transition. La bataille se joue désormais sur l'adoption en entreprise, et les hyperscalers qui fourniront les meilleures méthodologies d'intégration auront un avantage décisif. La prochaine étape pour AWS sera probablement d'ancrer ce cadre P2V dans ses offres de services managés et de conseil, transformant une publication méthodologique en levier commercial concret.

UELes entreprises européennes utilisant AWS peuvent s'appuyer sur ce cadre méthodologique pour structurer l'industrialisation de leurs projets d'IA générative et mieux justifier leur ROI auprès des décideurs.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic