Aller au contenu principal
Google lance Open Knowledge Format et ça secoue déjà le web
OutilsLe Big Data3h· 2 min de lecture

Google lance Open Knowledge Format et ça secoue déjà le web

Source originale ↗·

Google Cloud a officialisé le 12 juin 2026 un nouveau format ouvert baptisé Open Knowledge Format, ou OKF, conçu pour que les agents IA puissent naviguer dans les savoirs internes d'une organisation sans se perdre dans des piles de documents mal rangés. L'annonce émane de l'équipe Data Cloud de Google, portée par Sam McVeety et Amir Hormati. Le principe est volontairement simple : chaque connaissance d'une organisation, une définition de métrique, une procédure, la description d'une table de base de données, devient un fichier Markdown accompagné d'un en-tête YAML. Le seul champ obligatoire est le type du document, ce qui limite la lourdeur administrative. Ces fichiers peuvent se référencer mutuellement via des liens ordinaires, transformant un dossier plat en graphe consultable. Google fournit également des outils de démonstration concrets : un agent capable de parcourir un jeu de données BigQuery pour générer automatiquement un fichier par table, ainsi qu'un visualiseur qui transforme l'ensemble en graphe interactif.

Le problème que vise OKF est bien réel pour quiconque déploie des agents IA en entreprise aujourd'hui. Un modèle de langage, aussi puissant soit-il en génération, ignore tout du contexte interne d'une organisation : les exceptions à une règle, les multiples acceptions d'un même indicateur selon les équipes, les usages non documentés d'une table de données. Avant de produire quoi que ce soit d'utile, l'agent doit reconstruire ce contexte en fouillant wikis, catalogues, notes et documents partagés. OKF propose une alternative structurée : plutôt qu'un sac de documents déversé en vrac dans le contexte, l'agent reçoit une carte lisible et navigable du savoir interne, et peut trouver la bonne information sans tout ingurgiter d'un coup. Pour les équipes data et les développeurs d'agents, c'est un gain de fiabilité et de précision potentiellement significatif.

Google ne prétend pas avoir inventé l'idée de zéro. OKF s'inscrit dans le prolongement direct du concept de « LLM Wiki » popularisé par Andrej Karpathy en avril 2026, qui proposait déjà une base Markdown construite et maintenue par un agent. Depuis, les développeurs avaient commencé à bricoler leurs propres conventions, entre AGENTS.md, CLAUDE.md et bases Obsidian connectées à des LLM, sans standard commun. OKF ambitionne d'être cette convention partagée, permettant aux agents de lire ces wikis de manière interopérable. La version publiée reste une v0.1 explicitement présentée comme un point de départ, et le format ne vise pas le web public ni le référencement naturel : il cible exclusivement les connaissances internes des organisations. La vraie question, désormais, est de savoir si l'écosystème des outils IA adoptera ce standard ou continuera de proliférer en dialectes incompatibles.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Google Cloud lance l'Open Knowledge Format (OKF), spécification Markdown neutre pour fournir du contexte aux agents IA
1MarkTechPost 

Google Cloud lance l'Open Knowledge Format (OKF), spécification Markdown neutre pour fournir du contexte aux agents IA

Google Cloud a présenté l'Open Knowledge Format (OKF), une spécification ouverte et neutre vis-à-vis des fournisseurs, destinée à standardiser la manière dont les agents d'intelligence artificielle accèdent au contexte interne des organisations. En version 0.1, OKF représente la connaissance sous forme de répertoires de fichiers markdown accompagnés d'un en-tête YAML. Chaque concept, qu'il s'agisse d'une table de base de données, d'une métrique, d'un runbook ou d'une API, est décrit dans un fichier unique dont le chemin constitue son identifiant. Les champs structurés réservés sont minimalistes : type, title, description, resource, tags et timestamp. Le résultat est un bundle entièrement lisible sur GitHub, transportable en tarball, et ne nécessitant ni SDK, ni service tiers, ni schéma propriétaire. Ce format s'attaque à un problème concret qui plombe les déploiements d'agents IA en entreprise : la dispersion du contexte interne. Quand un agent doit répondre à la question "comment calculer les utilisateurs actifs hebdomadaires depuis notre flux d'événements ?", il doit assembler la réponse depuis des catalogues de métadonnées aux API incompatibles, des wikis d'équipe, des drives partagés et des commentaires de code. Chaque éditeur propose aujourd'hui son propre schéma de knowledge graph, rendant la connaissance non portable entre produits et organisations. Avec OKF, un wiki produit par une équipe peut être consommé directement par un agent différent sans traduction, éliminant le travail dupliqué que chaque développeur d'agents accomplit aujourd'hui depuis zéro. L'idée sous-jacente a été formulée par Andrej Karpathy dans un gist publié en avril 2026, où il soulignait que les LLM sont particulièrement adaptés à la maintenance de wikis structurés : ils ne s'ennuient pas, n'oublient pas de mettre à jour les références croisées, et peuvent éditer de nombreux fichiers en une seule passe. Le pattern existait déjà sous diverses formes, des vaults Obsidian connectés à des agents de code aux fichiers AGENTS.md et CLAUDE.md devenus conventions courantes, en passant par les dépôts "métadonnées as code". Aucun de ces formats ne s'interopérait. OKF tente de devenir la couche de standardisation manquante. La spécification étant ouverte et délibérément sans friction technique, son adoption dépendra de la capacité de la communauté à converger autour de ces conventions avant que d'autres éditeurs ne proposent leurs propres alternatives propriétaires.

UELes entreprises européennes déployant des agents IA peuvent adopter ce format ouvert pour structurer leur contexte interne sans dépendance à un éditeur propriétaire américain.

OutilsOutil
1 source
Google Cloud lance un format ouvert pour convertir des documents épars en fichiers Markdown destinés aux agents IA
2The Decoder 

Google Cloud lance un format ouvert pour convertir des documents épars en fichiers Markdown destinés aux agents IA

Google Cloud a lancé l'Open Knowledge Format (OKF), un nouveau standard destiné à transformer la documentation organisationnelle éparpillée en fichiers Markdown structurés avec frontmatter YAML. L'objectif : rendre la connaissance interne des entreprises portable et directement exploitable par des agents d'intelligence artificielle. La spécification, délibérément minimaliste, propose un cadre commun pour unifier des contenus aujourd'hui dispersés entre wikis, bases de données, outils SaaS et documents PDF. L'enjeu est considérable pour les entreprises qui déploient des agents IA en interne. Actuellement, ces agents peinent à accéder à la connaissance organisationnelle parce qu'elle ne respecte aucun format unifié. OKF résout ce problème structurel en imposant une couche de standardisation légère : chaque document devient un fichier texte lisible à la fois par un humain et par un LLM, avec des métadonnées explicites permettant aux agents de comprendre le contenu, sa portée et sa pertinence sans transformation préalable. La démarche de Google Cloud s'inscrit dans un mouvement intellectuel récent : Andrej Karpathy, chercheur emblématique passé par Tesla et OpenAI, avait popularisé ce concept sous l'appellation "LLM Wiki", plaidant pour des bases de connaissances conçues nativement pour les modèles de langage. En formalisant cette intuition sous forme de standard ouvert, Google Cloud cherche à s'imposer comme référence dans l'écosystème des agents d'entreprise, un marché en forte croissance où la qualité et l'accessibilité de la connaissance structurée sont devenues des avantages concurrentiels décisifs.

UELes entreprises et administrations européennes déployant des agents IA peuvent adopter ce standard ouvert pour structurer leur documentation interne et améliorer l'interopérabilité de leurs systèmes de gestion des connaissances.

💬 Le vrai goulot d'étranglement des agents IA en entreprise, c'est jamais le modèle, c'est la connaissance éparpillée dans 14 outils différents. Karpathy avait nommé le truc il y a un moment, Google vient juste de le mettre en costume corporate avec un nom de standard. Reste à voir combien d'éditeurs SaaS vont jouer le jeu, parce qu'un format ouvert sans adoption, c'est juste un PDF de plus.

OutilsOpinion
1 source
Google lance des agents Deep Research capables d'explorer le web et vos données privées
3VentureBeat AI 

Google lance des agents Deep Research capables d'explorer le web et vos données privées

Google a dévoilé lundi une mise à jour majeure de ses agents de recherche autonomes, en lançant deux nouvelles versions de son outil Deep Research dans l'API Gemini : Deep Research et Deep Research Max. Construits sur le modèle Gemini 2.5 Pro, ces agents permettent pour la première fois aux développeurs de combiner des données issues du web ouvert avec des informations internes à l'entreprise via un seul appel API. Ils intègrent également la génération native de graphiques et d'infographies directement dans les rapports produits, ainsi que la connexion à des sources de données tierces grâce au protocole MCP (Model Context Protocol). Les deux agents sont disponibles dès aujourd'hui en prévisualisation publique dans les offres payantes de l'API Gemini. Sur le plan des performances, Google annonce des scores de 93,3 % sur le benchmark DeepSearchQA et 54,6 % sur HLE pour la version Max, selon un message du PDG Sundar Pichai publié sur X. Les deux agents répondent à des besoins différents selon une logique de compromis entre vitesse et exhaustivité. Deep Research, la version standard, est optimisée pour des usages interactifs à faible latence : elle convient aux interfaces utilisateurs qui doivent répondre à des questions analytiques complexes en quasi-temps réel, comme un tableau de bord financier. Deep Research Max, à l'inverse, mobilise un calcul étendu à l'inférence pour produire des analyses plus profondes et mieux sourcées, conçues pour des workflows asynchrones en arrière-plan. C'est l'outil pour une équipe d'analystes qui lance une série de rapports de due diligence avant de quitter le bureau et les récupère entièrement traités le lendemain matin. C'est surtout la prise en charge du protocole MCP qui constitue le saut qualitatif le plus significatif : elle permet aux agents d'interroger des bases de données privées, des référentiels documentaires internes et des services de données spécialisés, transformant Deep Research d'un outil de veille web en quelque chose qui s'approche d'un analyste de données universel. Ce lancement s'inscrit dans une course qui s'intensifie entre les grands acteurs de l'IA pour proposer des systèmes capables de conduire de manière autonome des recherches multi-sources, un travail qui mobilise traditionnellement des heures, voire des jours, d'analyse humaine. Google positionne cette infrastructure comme l'épine dorsale des workflows de recherche en entreprise, notamment dans la finance, les sciences du vivant et l'intelligence de marché. La première version de Deep Research avait été lancée en décembre 2025 via l'Interactions API, et le produit aurait « gagné beaucoup de terrain en trois mois », selon Logan Kilpatrick, responsable des relations développeurs chez Google AI. Ce déploiement accéléré signale que Google entend faire de son API Gemini une plateforme centrale pour les applications d'agents d'entreprise, un segment où OpenAI, Anthropic et Microsoft se disputent également une position dominante.

UELes entreprises européennes intégrant leurs données internes via MCP devront vérifier la conformité RGPD avant d'adopter cette API.

OutilsOutil
1 source
Workday et Google Cloud déploient des agents IA pour les RH et la finance
4Le Big Data 

Workday et Google Cloud déploient des agents IA pour les RH et la finance

Workday et Google Cloud ont annoncé le 29 mai 2026 une extension significative de leur partenariat, visant à intégrer les agents IA de Workday directement dans Gemini Enterprise, la suite collaborative de Google. Concrètement, l'agent Sana Self-Service de Workday s'imbrique désormais dans l'environnement Google que les collaborateurs utilisent au quotidien. Un salarié peut ainsi consulter son solde de congés, récupérer un bulletin de paie ou soumettre une demande d'absence sans jamais ouvrir l'interface Workday. Les managers gagnent eux aussi en autonomie : approbation de feuilles de temps, lancement d'évaluations de performance, accès aux objectifs d'équipe, tout cela depuis une interface conversationnelle unique. Côté finance, les utilisateurs peuvent interroger les politiques de dépenses et initier des démarches administratives sans changer d'outil. L'annonce confirme par ailleurs que Gemini devient le modèle d'IA par défaut de Sana dans Workday, remplaçant les solutions précédemment utilisées. L'enjeu est considérable pour les grandes organisations, qui souffrent depuis des années d'une fragmentation logicielle coûteuse : les équipes jonglent quotidiennement entre suites RH, ERP financiers, outils collaboratifs et plateformes analytiques pour accomplir des tâches souvent élémentaires. En ancrant les agents directement dans les outils de travail existants, Workday et Google Cloud cherchent à éliminer ces frictions et à accélérer l'exécution des processus métiers. Pour les directions RH et financières, qui manipulent des données sensibles soumises à des réglementations strictes, l'intégration apporte aussi les capacités de raisonnement avancé, le support multimodal et le traitement multilingue de Gemini, tout en maintenant les garde-fous métier, les règles d'approbation et les contrôles de conformité propres à Workday. Ce rapprochement s'inscrit dans une tendance de fond qui voit les grands éditeurs de logiciels d'entreprise transformer leurs plateformes en orchestrateurs d'agents IA. Workday, qui gère les ressources humaines et les finances de milliers de grandes entreprises mondiales, dispose d'un levier stratégique majeur : ses données métier structurées, longtemps cloisonnées dans ses interfaces propriétaires. En ouvrant ces données aux agents via Gemini, l'éditeur américain positionne sa plateforme comme un nœud central des architectures multi-agents qui émergent dans les grands groupes. Pour Google Cloud, faire de Gemini le moteur par défaut de Sana représente une victoire commerciale et un signal fort envoyé à l'ensemble de l'écosystème enterprise, dans un marché où Microsoft, avec Copilot intégré à Office 365 et Dynamics, exerce une pression concurrentielle intense. Les prochaines étapes du partenariat devraient porter sur l'orchestration de workflows plus complexes, impliquant plusieurs agents agissant en coordination sur des processus bout-en-bout.

UELes grandes entreprises françaises et européennes utilisant Workday et Google Workspace pourraient réduire la fragmentation logicielle de leurs équipes RH et finance grâce à cette intégration.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic