SociétéNext INpact6sem

AI Overviews : Google conteste le taux de 10% d’erreurs, mais en dénombre lui-même… 22%

Résumé IASource uniqueImpact UE

Le New York Times a mandaté la start-up Oumi pour analyser les AI Overviews de Google, ces résumés générés par IA qui apparaissent en tête des résultats de recherche, à l'aide du benchmark SimpleQA, publié par OpenAI en 2024 et comportant plus de 4 000 questions à réponses vérifiables. Deux séries de tests ont été conduites : une première en octobre 2025 avec le modèle Gemini 2, une seconde en février 2026 après migration vers Gemini 3, sur un corpus identique de 4 326 recherches Google. Résultat : Gemini 2 répondait correctement dans 85 % des cas, Gemini 3 dans 91 %. Mais le NYT souligne un autre problème : plus de la moitié des réponses correctes de Gemini 3 sont « non étayées », c'est-à-dire qu'elles renvoient vers des sources qui ne confirment pas entièrement l'information fournie, un taux qui a bondi de 37 % à 56 % entre octobre et février, soit une hausse de 50 %. Google a contesté ces chiffres, jugeant que SimpleQA, conçu par un concurrent direct, constitue un benchmark biaisé.

Le problème dépasse la simple question de précision technique. Google traite plus de cinq mille milliards de recherches par an, ce qui signifie, selon le calcul du NYT, que des dizaines de millions de réponses erronées sont distribuées chaque heure. À cette échelle, une marge d'erreur de 9 % se traduit par des centaines de milliers d'inexactitudes par minute, diffusées à des utilisateurs qui, selon une étude citée dans l'article, ne vérifient pas les réponses fournies par les IA dans 92 % des cas. La mention « L'IA peut se tromper » affichée en petits caractères sous chaque résumé apparaît donc largement insuffisante face à l'ampleur du phénomène.

Le paradoxe central de cette affaire est que Google, en contestant le benchmark d'OpenAI, a mis en avant son propre outil de mesure, révisé pour être, selon ses termes, « plus précis ». Or cet outil interne aboutit à un taux d'erreur supérieur à 20 %, soit le double du chiffre que Google cherchait à réfuter. La situation illustre la tension structurelle à laquelle font face les grands moteurs de recherche : intégrer des LLMs pour rester compétitifs face à ChatGPT et Perplexity, tout en assumant une responsabilité éditoriale sur des milliards de réponses quotidiennes. Gemini 3 progresse en précision brute, mais dégrade simultanément la traçabilité des sources, un compromis qui soulève des questions durables sur la fiabilité des interfaces IA comme point d'entrée unique vers l'information.

Impact France/UE

Les utilisateurs européens de Google Search sont directement exposés à ces taux d'erreur élevés, soulevant des questions de transparence et de responsabilité éditoriale dans le cadre des obligations de l'AI Act.

Dans nos dossiers

OpenAI Gemini

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

Google bouleverse le SEO avec AI Overviews : quelles conséquences pour les entreprises ?

Google a profondément modifié le fonctionnement de son moteur de recherche en déployant massivement les AI Overviews, des résumés générés automatiquement par l'intelligence artificielle qui s'affichent désormais en tête des résultats avant tout lien externe. Selon le Pew Research Center, seulement 8 % des utilisateurs cliquent encore sur un résultat classique lorsqu'un de ces encadrés synthétiques apparaît. D'après les analyses disponibles, ces résumés sont présents dans entre 18 % et plus de 50 % des recherches, une étude de Xponent21 estimant même leur présence dans plus d'une requête sur deux en 2025. Google justifie cette évolution par sa volonté d'« accélérer l'accès à l'information », mais le résultat est sans ambiguïté : le moteur ne joue plus uniquement le rôle d'intermédiaire vers le web, il devient un espace de consommation fermé où la réponse est délivrée sans sortie vers un site tiers. Pour les entreprises dont le modèle repose sur l'acquisition de trafic organique via Google, les conséquences sont immédiates et structurelles. Moins de clics signifie moins d'opportunités de conversion, de leads et de revenus publicitaires. Le contenu des éditeurs continue d'être indexé et utilisé comme matière première par l'IA, mais sans garantie de retour d'audience. Face à cette réalité, le SEO classique, centré sur le positionnement dans les résultats, laisse progressivement place à l'AEO, l'Answer Engine Optimization, dont l'objectif est d'être la source citée dans une réponse générée par l'IA plutôt que simplement bien classé. Cela implique des contenus plus courts, plus structurés, orientés vers des intentions de recherche précises, au détriment des formats longs et généralistes. La dépendance à Google s'avère par ailleurs plus risquée qu'avant, poussant les entreprises à diversifier leurs canaux vers les réseaux sociaux, les newsletters ou les communautés. Ce basculement s'inscrit dans une transformation plus large du paysage de la recherche en ligne. Google accorde désormais davantage de poids aux contenus publiés sur les réseaux sociaux, signal que le référencement déborde du web traditionnel. Parallèlement, la concurrence s'intensifie : ChatGPT explore des formats hybrides mêlant recherche, assistant et e-commerce via son projet Atlas, avec une intégration annoncée de Shopify qui illustre la convergence entre recherche conversationnelle et achat. La monétisation de l'audience semble aussi s'accentuer, à mesure que les fiches Google Business évoluent et que la publicité occupe plus de place dans l'interface. La recherche devient transactionnelle et intégrée, et l'accès à une visibilité organique réelle pourrait progressivement devenir un privilège payant.

UELes entreprises françaises et européennes dépendant du trafic organique Google doivent repenser leur stratégie vers l'AEO, sous peine de perdre structurellement leur visibilité et leurs revenus liés au référencement naturel.

SociétéOutil

1 source

2Le Big Data

Google l’avoue : 75 % de son code est désormais écrit par l’IA

Lors de la keynote d'ouverture de Google Cloud Next 2026 à Las Vegas, le 22 avril, Sundar Pichai a révélé que 75 % du nouveau code produit en interne chez Google est désormais généré par l'intelligence artificielle, chaque résultat étant ensuite relu et validé par des ingénieurs humains. Ce chiffre marque une progression spectaculaire : l'IA représentait 50 % du code à l'automne 2025, et seulement 25 % un an plus tôt. Pour illustrer les gains obtenus, Google cite une migration de code complexe réalisée six fois plus rapidement qu'en 2025. L'outil central de cette transformation est Gemini, le modèle maison, bien que certains ingénieurs de Google DeepMind aient également accès à Claude Code, développé par Anthropic. Les équipes adoptent ce que Google appelle des workflows agentiques, c'est-à-dire des systèmes capables d'agir de façon autonome sur des tâches définies, sous supervision humaine. L'impact est d'abord organisationnel : les développeurs délèguent désormais les tâches répétitives et les chantiers techniques à l'IA, pour se concentrer sur la supervision, l'architecture et les arbitrages stratégiques. Cette évolution se traduit concrètement dans les critères d'évaluation interne de Google, où la maîtrise des outils IA est désormais prise en compte. Sur le plan économique, une telle automatisation laisse entrevoir des réductions significatives des délais et des coûts de développement logiciel. En contrepartie, la dépendance aux modèles d'IA s'accroît mécaniquement, créant une vulnérabilité nouvelle pour une entreprise dont l'infrastructure repose sur des millions de lignes de code critiques. La cohabitation entre Gemini et Claude Code au sein d'une même organisation génère par ailleurs des tensions internes dont Google n'a pas détaillé les contours. Cette annonce s'inscrit dans une accélération générale de l'adoption de l'IA dans le développement logiciel à l'échelle de l'industrie. Microsoft, Meta et Amazon ont toutes communiqué des métriques similaires ces derniers mois, sans toutefois atteindre le seuil symbolique des 75 %. Pour Google, qui emploie des dizaines de milliers d'ingénieurs, franchir ce cap envoie un signal fort au marché : l'IA n'est plus un assistant périphérique mais un acteur central de la production logicielle industrielle. La trajectoire observée, un doublement tous les six à douze mois, alimente les spéculations sur un seuil de 90 % dès 2027. La vraie question n'est plus de savoir si les machines écrivent du code, mais à quelle vitesse le métier d'ingénieur va se redéfinir autour du pilotage de ces systèmes plutôt que de la saisie brute.

UELa bascule vers 75 % de code généré par IA chez Google accélère une redéfinition du métier d'ingénieur logiciel qui concerne directement les entreprises tech et ESN européennes dans leurs pratiques de recrutement et d'organisation.

SociétéOpinion

1 source

3Next INpact

Le contenu d’un tiers des nouveaux sites est généré totalement ou partiellement par IA

En mai 2025, 35 % des sites internet nouvellement créés contenaient des textes entièrement ou majoritairement générés par intelligence artificielle, selon un rapport publié par Internet Archive. Cette étude, signée par Mark Graham, responsable de la Wayback Machine, accompagné d'un chercheur maison et de deux doctorants, s'appuie sur l'analyse du texte brut de milliers de sites archivés. Pour détecter l'origine des contenus, l'équipe a comparé plusieurs outils, Binoculars, Desklib, DivEye, avant de retenir l'API commerciale Pangram v3, choisie pour sa capacité à traiter le HTML et à analyser des textes en plusieurs langues, avec un taux de précision annoncé à 99,98 %. La proportion de sites à contenu genAI est passée de zéro avant le lancement de ChatGPT fin 2022 à ce tiers des nouvelles publications en l'espace de deux ans et demi. Ce que révèle ce rapport va à l'encontre des craintes les plus répandues. Sondés par les chercheurs, 75 % des internautes redoutaient d'être davantage exposés à des informations factuellement erronées, et 83 % anticipaient une homogénéisation du style des textes sur le web. Or, les données d'Internet Archive ne confirment ni l'une ni l'autre de ces hypothèses : les fact-checkers mandatés par l'équipe n'ont pas trouvé de corrélation statistiquement significative entre la hausse du contenu IA et une augmentation des fausses informations. L'homogénéisation stylistique, elle non plus, ne progresse pas mécaniquement. En revanche, deux effets distincts sont bien documentés : une contraction sémantique mesurable, les textes générés couvrent un spectre de vocabulaire et d'idées plus étroit, et un glissement artificiel vers la positivité, les contenus IA affichant systématiquement un ton plus optimiste et lissé que ceux rédigés par des humains. Ce travail s'inscrit dans un débat plus large sur ce que certains chercheurs appellent la "théorie de l'Internet mort", formulée dès 2021 et relancée début 2024 : l'idée que le web serait progressivement peuplé de contenus automatisés où des machines s'adressent à d'autres machines, au détriment d'une production humaine authentique. La méthode du rapport comporte toutefois des limites importantes : Pangram v3 est un outil commercial dont la méthode n'a pas été évaluée par des chercheurs indépendants, et les résultats dépendent donc directement de sa fiabilité réelle. Reste que cette étude est l'une des premières à quantifier l'empreinte de l'IA générative à l'échelle du web archivé, et elle devrait pousser les plateformes, moteurs de recherche et régulateurs à affiner leur compréhension des effets concrets, moins spectaculaires que redoutés, mais bien réels, de cette prolifération silencieuse.

UECette étude quantitative sur la prolifération des contenus IA pourrait alimenter les travaux des régulateurs européens, notamment sur les obligations de transparence et de marquage des contenus générés par IA prévues dans l'AI Act.

SociétéPaper

1 source

4Next INpact

Après 3 ans d’IA générative, un marché de l’emploi des développeurs touché mais pas coulé

Trois ans après l'émergence de ChatGPT, les premières données statistiques sérieuses sur l'impact de l'IA générative sur l'emploi des développeurs commencent à dessiner une tendance claire. L'INSEE, dans une note de conjoncture récente, relève qu'aux États-Unis, l'emploi dans les services de conception de systèmes informatiques recule depuis deux années consécutives : -1,2 % en 2024, puis -1,6 % en 2025. Dans le secteur plus large des activités spécialisées, scientifiques et techniques, la croissance s'est effondrée, passant de +2,5 % en 2023 à -0,2 % en 2025. Dans le même temps, la productivité apparente dans ces secteurs s'est améliorée, signe que moins de salariés produisent autant, voire plus. Un rapport de la Réserve fédérale américaine publié en mars 2025 arrive à des conclusions similaires par une méthode différente : en simulant l'évolution du marché sans l'essor des grands modèles de langage, les chercheurs estiment qu'environ 500 000 emplois de développeurs supplémentaires auraient été créés depuis novembre 2022. L'écart entre la trajectoire réelle et la trajectoire simulée ne s'est creusé significativement qu'à partir de mi-2024, coïncidant avec la diffusion massive d'outils comme Claude Code, Codex ou Cursor. Ces chiffres ne signifient pas pour autant que 500 000 développeurs se retrouvent au chômage. La Fed souligne elle-même que les résultats ne doivent pas être interprétés comme une suppression nette d'emplois : de nombreux développeurs ont pu migrer vers des postes de management, de product, ou vers des métiers qui intègrent désormais des compétences techniques sans porter le titre explicite de "développeur". Ce qui change, c'est surtout la demande de nouveaux postes, notamment juniors, qui stagne dans les industries traditionnellement grandes consommatrices de développeurs, là où elle aurait dû continuer à croître. Le risque à moyen terme est structurel : moins de juniors recrutés aujourd'hui, c'est mécaniquement moins de seniors disponibles dans cinq à dix ans. L'industrie de l'IA générative elle-même ne compense pas encore les pertes. La Fed chiffre à moins de 15 000 le total des effectifs d'OpenAI, Anthropic et Google DeepMind réunis, dont une fraction seulement sont des développeurs. Même en multipliant par six pour intégrer les startups et les équipes IA de Meta, Microsoft ou ailleurs, on n'atteint pas 2 % des développeurs américains. La France observe des dynamiques comparables, selon les données mentionnées par l'article. Le tableau qui se dessine est donc celui d'un marché ni effondré ni inchangé, mais structurellement réorienté : l'IA compresse la demande de code répétitif et junior, tout en déplaçant la valeur vers des profils capables de piloter, superviser et orienter ces outils, une transition qui laisse peu de place à l'attentisme.

UELa France connaît des dynamiques comparables selon l'article, avec une stagnation des recrutements juniors qui menace le renouvellement des compétences techniques dans les entreprises françaises à un horizon de cinq à dix ans.

💬 500 000 emplois qui ne se sont pas créés, c'est pas du tout la même chose que 500 000 licenciements, et c'est une distinction qui compte vraiment. Le vrai problème, c'est le pipeline junior qui se bouche : les boîtes recrutent moins d'entrées de gamme, ça se voit pas maintenant, mais dans dix ans il va manquer des seniors. Pas spectaculaire comme scénario, mais bien plus vicieux.

SociétéPaper

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour