L'été des meta-harnesses
La semaine du 23 juin 2026 aura marqué un tournant dans l'architecture des systèmes d'IA. OpenAI a officiellement dévoilé Jalapeño, son premier chip custom pour l'inférence de modèles de langage, co-développé avec Broadcom et destiné à alimenter ChatGPT, l'API, Codex et ses futurs produits d'agents. Côté performance, les estimations de la communauté pointent vers une die quasi pleine reticle, environ 216 Go de HBM3E, 7,1 à 7,4 To/s de bande passante et 10 PFLOPS en FP4. Ce qui frappe autant que les chiffres, c'est la vitesse d'exécution : un cycle design-to-tapeout de neuf mois, exceptionnellement court pour un ASIC haute performance, et prétendument accéléré par les propres modèles d'OpenAI. Le même jour, Chris Lattner annonçait le rachat de sa société Modular par Qualcomm, tout en confirmant que le langage Mojo passerait bien en open source. Par ailleurs, Matei Zaharia, CTO de Databricks, a lancé Omnigent, une architecture open source et modulaire visant à standardiser l'orchestration de n'importe quel agent de codage ou de travail cognitif dans un cadre sécurisé et scalable.
Ces annonces illustrent une recomposition profonde des couches d'infrastructure de l'IA. Pour les grands laboratoires, posséder sa propre silicon n'est plus un avantage différenciateur mais une condition de survie économique : maîtriser les chips, les compilateurs, la mémoire et l'ordonnancement permet de s'émanciper de la dépendance aux GPU de marché et de contrôler le rapport performance/watt à grande échelle. Le rachat de Modular par Qualcomm dessine une alternative crédible à l'écosystème NVIDIA/CUDA, jusqu'ici dominant. Côté Omnigent, le signal est différent mais aussi significatif : le fait que des architectures similaires émergent indépendamment dans des centaines d'entreprises AI-native suggère qu'un standard ouvert d'orchestration d'agents finira par s'imposer, à la manière dont MCP a structuré l'intégration des outils.
L'autre fil conducteur de la semaine est l'intégration des agents directement dans les flux de travail d'entreprise. Anthropic a positionné Claude comme un agent "organisationnel" dans Slack, avec sa propre identité, des actions auditables et des accès révocables centralement. Andrej Karpathy a jugé cette évolution sous-estimée, notant qu'il ne s'agit pas d'un simple bot mais d'un harness à l'échelle d'une organisation. Cette vision soulève des questions de sécurité non triviales : Kenton Varda de Cloudflare a plaidé pour une approche par capacités à granularité fine plutôt que des permissions explicites par agent, arguant que le modèle actuel ne passera pas à l'échelle. Le débat est ouvert, et les prochains mois diront quelle philosophie de sécurité s'imposera à mesure que les agents deviennent des collègues à part entière.
Les entreprises et développeurs européens bénéficieront d'alternatives crédibles à l'écosystème NVIDIA/CUDA via le rachat de Modular par Qualcomm et d'un standard ouvert d'orchestration d'agents avec Omnigent, réduisant leur dépendance aux fournisseurs américains dominants.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




