Aller au contenu principal

Outils — page 15

1363 articles · page 15 sur 28

Les meilleurs outils IA : applications, produits et services propulsés par l'intelligence artificielle.

Microsoft supprime les boutons Copilot de ses applications Windows 11
701The Verge AI OutilsOpinion

Microsoft supprime les boutons Copilot de ses applications Windows 11

Microsoft a commencé à retirer les boutons Copilot jugés "inutiles" de plusieurs applications natives de Windows 11. Dans la dernière version de Notepad destinée aux Windows Insiders, le bouton Copilot a été remplacé par un menu "outils d'écriture". L'application Snipping Tool ne fait plus apparaître le bouton Copilot lors de la sélection d'une zone à capturer. D'autres applications sont concernées : Photos et Widgets font également partie des premières visées par cette suppression progressive. Ce changement s'inscrit dans un plan plus large annoncé par Microsoft pour "corriger" Windows 11 en réduisant la friction inutile dans l'interface. La décision reconnaît implicitement que l'intégration massive de Copilot dans chaque recoin du système d'exploitation a pu nuire à l'expérience utilisateur plutôt que l'améliorer. Fait notable : si les boutons disparaissent, les fonctionnalités IA sous-jacentes, elles, restent en place, Microsoft ne renonce pas à l'IA, il recalibre sa mise en avant. Cette volte-face intervient après des mois de critiques sur la surcharge d'intégrations Copilot dans Windows 11, souvent perçues comme intrusives ou redondantes. Microsoft avait misé très tôt sur Copilot comme différenciateur majeur de son OS, au point d'y dédier une touche physique sur certains claviers. La suppression de ces points d'entrée signale une maturation de la stratégie : plutôt qu'une présence omniprésente, l'IA doit s'intégrer là où elle apporte une valeur réelle, sans encombrer l'interface au quotidien.

UELes millions d'utilisateurs Windows 11 en France et en Europe verront progressivement disparaître les boutons Copilot de leurs applications natives, sans perte des fonctionnalités sous-jacentes.

702Le Big Data 

Sprinklr muscle son IA pour les équipes marketing et service client

Sprinklr a dévoilé sa mise à jour Printemps 2026, une refonte significative de sa plateforme unifiée destinée aux équipes marketing et service client. Au cœur de cette version, l'éditeur américain mise sur des agents autonomes dotés d'un système de validation par tests et de journaux détaillés, permettant aux entreprises de comprendre précisément le comportement de chaque agent déployé. Le Copilote Agent est également renforcé : il intervient désormais en temps réel pour formuler des recommandations ciblées sur des indicateurs opérationnels comme la résolution au premier contact. En parallèle, le Copilote Marketing offre une lecture instantanée des performances de campagne, tandis qu'un copilote dédié aux retours clients transforme les données brutes en insights directement exploitables. L'intégration avec TikTok et Canva vient compléter l'arsenal des équipes créatives, facilitant la production de contenus dans le respect des règles de marque. Cette mise à jour répond à une attente critique des grandes organisations : déployer l'IA à grande échelle sans perdre le contrôle ni la lisibilité sur ce qu'elle produit. Karthik Suri, Chief Product Officer de Sprinklr, formule clairement l'enjeu : l'IA doit non seulement générer des résultats mesurables, mais aussi inspirer confiance. En rendant les agents testables, ajustables et traçables via une interface sans code baptisée AI+ Studio, Sprinklr abaisse la barrière technique pour les équipes métier tout en renforçant la gouvernance. Les profils clients unifiés, qui agrègent les données issues de multiples canaux dans une vue consolidée, réduisent la fragmentation informationnelle sans multiplier les outils. L'ensemble de la chaîne analytique est également revue : les signaux collectés sont filtrés et enrichis par l'IA générative, ce qui limite le bruit et améliore la pertinence des informations remontées aux équipes. Sprinklr occupe une position établie sur ce marché, figurant dans le Magic Quadrant de Gartner sur la Voix du Client, ce qui lui confère une crédibilité auprès des grands comptes cherchant à consolider leurs outils d'expérience client. La tendance de fond est claire : après des années de promesses autour de l'IA générative, les entreprises exigent désormais des résultats vérifiables et des mécanismes de contrôle robustes. Sprinklr répond à cette maturité du marché en positionnant ses agents non comme des boîtes noires, mais comme des briques pilotables et auditables. La prochaine étape sera de démontrer, chiffres à l'appui, que ces copilotes améliorent effectivement les taux de résolution et réduisent les coûts opérationnels, deux métriques sur lesquelles les directions achats des grandes entreprises attendent des preuves concrètes avant tout déploiement à grande échelle.

UELes grandes entreprises européennes utilisant Sprinklr pour leur service client peuvent évaluer ces nouvelles fonctionnalités d'agents autonomes et de gouvernance IA pour améliorer leurs opérations marketing et support.

OutilsOutil
1 source
Guide de code complet sur NVIDIA KVPress : inférence LLM à contexte long et compression du cache KV
703MarkTechPost 

Guide de code complet sur NVIDIA KVPress : inférence LLM à contexte long et compression du cache KV

NVIDIA a publié KVPress, une bibliothèque open source conçue pour compresser le cache clé-valeur (KV cache) des grands modèles de langage et réduire drastiquement leur consommation mémoire lors des inférences sur de longs contextes. Un tutoriel complet publié récemment par des ingénieurs en IA illustre son fonctionnement concret à travers une implémentation pas-à-pas exécutable sur Google Colab. L'exemple s'appuie sur le modèle Qwen2.5-1.5B-Instruct de Qwen, chargé en quantification 4 bits via la bibliothèque BitsAndBytes, et fait appel à la version 0.4.0 de KVPress. Deux stratégies de compression sont comparées : ExpectedAttentionPress, qui estime l'importance des tokens en fonction de l'attention attendue, et KnormPress, qui s'appuie sur la norme des vecteurs K pour éliminer les entrées peu pertinentes. Le pipeline génère un corpus synthétique long, pose des questions ciblées sur ce corpus, puis mesure les écarts de performance et d'empreinte mémoire entre la génération standard et les différentes configurations compressées. L'enjeu est considérable pour l'industrie du traitement du langage naturel. Le KV cache est le principal goulot d'étranglement mémoire lors de l'inférence sur de longs contextes : chaque token généré alimente un cache qui grossit linéairement, rendant les fenêtres de 32 000, 128 000 voire un million de tokens extrêmement coûteuses en VRAM. KVPress permet de ne conserver dans ce cache que les entrées jugées les plus informatives, en supprimant dynamiquement les tokens à faible contribution. Pour les développeurs déployant des applications d'analyse de documents, de recherche d'information ou d'agents conversationnels à mémoire longue, cette compression peut rendre viables des scénarios qui nécessiteraient sinon du matériel de classe A100 ou H100. La possibilité de faire tourner ces expériences sur Colab, avec une simple GPU grand public, illustre bien la baisse de barrière à l'entrée que KVPress ambitionne d'offrir. La gestion du KV cache est devenue l'un des fronts les plus actifs de la recherche en inférence LLM depuis que les fenêtres contextuelles ont explosé en 2023-2024. Des techniques comme Sliding Window Attention, PagedAttention (à la base de vLLM) ou les approches de quantification du cache ont émergé pour répondre à cette pression. NVIDIA, en proposant KVPress comme couche d'abstraction modulaire compatible avec le pipeline Hugging Face Transformers, cherche à standardiser l'accès à ces optimisations pour un public plus large que les seules équipes d'infrastructure. La prochaine étape naturelle sera d'évaluer ces stratégies sur des modèles de plus grande taille et sur des benchmarks de rétention d'information à longue portée, pour quantifier précisément le compromis entre taux de compression et fidélité des réponses dans des cas d'usage de production.

OutilsTuto
1 source
704VentureBeat AI 

OpenAI lance ChatGPT Pro à 100 dollars avec des limites d'utilisation de Codex 5 fois supérieures à celles de Plus

OpenAI a lancé un nouveau palier d'abonnement à 100 dollars par mois pour ChatGPT, baptisé ChatGPT Pro, ciblant explicitement les développeurs et les "vibe coders", ces utilisateurs qui construisent des logiciels en langage naturel avec l'aide de l'IA. Cette offre se positionne entre le plan Plus à 20 dollars et le plan Pro existant à 200 dollars, et son argument principal est simple : elle offre cinq fois plus d'utilisation de Codex, l'environnement de développement assisté par IA d'OpenAI, par rapport au plan Plus. Sam Altman, PDG et co-fondateur d'OpenAI, a annoncé le lancement sur X en évoquant une "très forte demande". Concrètement, le plan à 100 dollars permet par exemple d'envoyer entre 300 et 1 500 messages locaux avec le modèle GPT-5.3-Codex toutes les cinq heures, contre 45 à 225 pour le plan Plus, et d'effectuer entre 50 et 400 tâches cloud sur la même fenêtre, contre 10 à 60. Les revues de code passent également de 10 à 25 pull requests par semaine à 100 à 250. Le plan à 200 dollars offre quant à lui le double du plan à 100 dollars, soit dix fois les limites du Plus. Ce lancement signale une montée en puissance d'OpenAI sur le segment du développement logiciel assisté, un marché devenu stratégique. En introduisant un palier intermédiaire, l'entreprise cherche à capter les développeurs qui trouvaient le plan Plus trop limité sans vouloir payer 200 dollars. La décision est toutefois ambiguë : OpenAI a simultanément annoncé un "rééquilibrage" de l'utilisation de Codex pour les abonnés Plus, réduisant les sessions longues au profit de sessions plus courtes et distribuées dans la semaine, ce qui revient de facto à restreindre les usages intensifs des utilisateurs à 20 dollars, les incitant à passer à la formule supérieure. Le contexte concurrentiel explique en grande partie cette accélération. Anthropic, principal rival d'OpenAI, a récemment révélé un chiffre d'affaires annualisé dépassant 30 milliards de dollars, devançant les 24 à 25 milliards estimés d'OpenAI. Cette croissance est portée en grande partie par l'adoption massive de Claude Code et Claude Cowork, des outils de développement assisté par IA qui gagnent rapidement du terrain auprès des équipes techniques. OpenAI, qui a largement contribué à populariser l'IA générative, se retrouve ainsi à devoir défendre son leadership sur un segment qu'il a pourtant contribué à inventer. La guerre des abonnements pour coder avec l'IA ne fait que commencer, avec des acteurs comme Google, GitHub Copilot et Cursor également dans la course.

UELes développeurs européens disposent d'un nouveau palier intermédiaire à 100$/mois pour accéder à Codex avec des limites 5x supérieures au plan Plus, une option concrètement utilisable par les équipes techniques en France et en Europe.

OutilsOutil
1 source
Préparez votre portefeuille : OpenAI lance un nouveau niveau ChatGPT Pro à 100 $
705Le Big Data 

Préparez votre portefeuille : OpenAI lance un nouveau niveau ChatGPT Pro à 100 $

OpenAI a annoncé le 9 avril 2026 un nouveau niveau d'abonnement ChatGPT Pro à 100 dollars par mois, venant s'ajouter au niveau Plus existant. Ce plan premium offre entre 5 et 20 fois plus d'utilisation de Codex, l'outil de génération et de complétion de code intégré à ChatGPT. Les abonnés Pro accèdent également au raisonnement avancé via GPT-5.4 Pro, à un nombre maximal de tâches Codex simultanées, au chargement illimité de fichiers avec GPT-5.3, à la génération d'images sans restriction, ainsi qu'à un accès étendu à la recherche approfondie, au mode agent, aux projets, aux tâches planifiées et aux GPT personnalisés. OpenAI a précisé dans la foulée que l'accès promotionnel à Codex accordé aux abonnés Plus prenait fin le jour même de l'annonce. Ce nouveau palier cible principalement les développeurs intensifs et les professionnels qui s'appuient quotidiennement sur des capacités de raisonnement avancées. Pour eux, la possibilité de conduire des sessions Codex longues et complexes représente un gain concret : prototypes plus ambitieux, itérations plus rapides, réduction du temps de développement logiciel. Les entreprises technologiques peuvent également y voir un levier pour accélérer leurs cycles de production sans multiplier les abonnements individuels. L'accès anticipé aux nouvelles fonctionnalités constitue un avantage supplémentaire pour ceux qui cherchent à rester à la pointe des capacités disponibles. À 100 dollars mensuels, le tarif reste élevé pour un usage individuel, mais se positionne en dessous des coûts d'API pour des volumes d'utilisation équivalents. Cette annonce s'inscrit dans une stratégie de montée en gamme progressive qu'OpenAI déploie depuis le lancement de ChatGPT Plus à 20 dollars en 2023. La société fait face à des coûts d'infrastructure considérables liés à l'entraînement et à l'inférence de modèles toujours plus puissants, et la segmentation tarifaire lui permet de financer ces investissements tout en conservant une offre accessible au grand public. La guerre des assistants IA s'intensifie avec Google, Anthropic et Microsoft qui proposent leurs propres niveaux premium, poussant chaque acteur à différencier son offre par la performance brute et les outils spécialisés. Codex, repositionné comme outil central du plan Pro, illustre le pari d'OpenAI sur le marché des développeurs, segment jugé stratégique pour ancrer l'usage professionnel de ChatGPT dans les workflows d'entreprise. Les prochains mois diront si ce prix trouve preneur au-delà des early adopters.

UELes développeurs et entreprises françaises peuvent souscrire à ce nouveau palier, mais sans avantage tarifaire spécifique pour l'Europe et avec un coût élevé pour un usage individuel.

OutilsOpinion
1 source
706The Verge AI 

Google Gemini peut désormais répondre à vos questions avec des modèles 3D et des simulations

Google a dévoilé une nouvelle fonctionnalité pour son assistant Gemini permettant de générer des modèles 3D interactifs et des simulations en réponse aux questions des utilisateurs. Concrètement, lorsqu'un utilisateur pose une question sur un phénomène physique ou scientifique, Gemini peut désormais produire une représentation tridimensionnelle animée, accompagnée de commandes permettant de la manipuler en temps réel : rotation du modèle, curseurs pour ajuster des paramètres, boutons pour mettre en pause ou masquer certains éléments visuels. Lors d'un test rapporté par The Verge, un utilisateur a demandé une simulation de la Lune orbitant autour de la Terre, et Gemini a généré un modèle 3D complet avec un curseur pour contrôler la vitesse de l'orbite, une option pour masquer la trajectoire et un bouton de pause. Cette évolution représente un changement notable dans la façon dont les IA conversationnelles transmettent l'information. Plutôt que de se limiter à du texte ou des images statiques, Gemini ouvre la voie à une pédagogie interactive, particulièrement utile pour l'enseignement des sciences, de la physique ou de l'astronomie. Les enseignants, étudiants et professionnels pourront explorer des concepts complexes de manière intuitive, sans recourir à des logiciels spécialisés. Cette fonctionnalité s'inscrit dans la course que se livrent les grands acteurs de l'IA générative pour différencier leurs produits au-delà du simple chat textuel. Google, qui fait face à une concurrence intense d'OpenAI et d'Anthropic, cherche à positionner Gemini comme un assistant multimodal de référence. La capacité à produire des visualisations dynamiques et paramétrables pourrait devenir un avantage décisif, notamment dans les secteurs éducatif et scientifique.

UELes utilisateurs européens de Gemini peuvent dès maintenant exploiter cette fonctionnalité pour l'enseignement scientifique et la vulgarisation, sans nécessiter de logiciels spécialisés.

707AWS ML Blog 

Amazon Bedrock : comprendre le cycle de vie des modèles

Amazon Web Services a formalisé le cycle de vie des modèles de fondation (FM) disponibles sur sa plateforme Bedrock, en introduisant un cadre structuré en trois états distincts : Actif, Hérité (Legacy) et Fin de vie (EOL). Ce système vise à donner aux entreprises une visibilité suffisante pour planifier leurs migrations sans interruption de service. Concrètement, un modèle reste disponible au minimum 12 mois après son lancement, puis passe en état Legacy avec un préavis d'au moins 6 mois avant sa date de fin de vie. AWS a également introduit une nouvelle phase intermédiaire appelée "extended access" pour les modèles dont la fin de vie est postérieure au 1er février 2026 : après 3 mois en état Legacy, le modèle entre dans cette période d'accès étendu pendant laquelle les utilisateurs actifs peuvent continuer à l'utiliser au moins 3 mois supplémentaires. Durant cette fenêtre, les demandes d'augmentation de quota ne seront plus approuvées et les tarifs peuvent être ajustés par le fournisseur du modèle, avec notification préalable. Cet encadrement change concrètement la manière dont les équipes techniques doivent gérer leurs applications IA en production. Jusqu'ici, une fin de vie pouvait surprendre des équipes insuffisamment préparées, entraînant des pannes ou des migrations précipitées. Avec ce calendrier prévisible, les développeurs peuvent anticiper les transitions, tester les modèles de remplacement via la console Bedrock ou l'API, et adapter leur code sans urgence. L'état d'un modèle est désormais exposé directement dans les réponses API via le champ modelLifecycle, accessible lors d'appels GetFoundationModel ou ListFoundationModels. Il faut toutefois noter que les comptes inactifs en phase Legacy, c'est-à-dire n'ayant pas appelé le modèle pendant 15 jours ou plus, peuvent perdre l'accès prématurément. La migration vers un nouveau modèle reste une action manuelle : rien ne se fait automatiquement lorsqu'un modèle atteint sa date EOL. Cette politique s'inscrit dans un contexte où Amazon Bedrock multiplie les modèles disponibles, provenant de fournisseurs comme Anthropic, Meta, Mistral ou Cohere, chacun avec ses propres cycles de mise à jour. À mesure que ces modèles évoluent rapidement, l'accumulation de versions obsolètes pose des problèmes de maintenance et de sécurité pour AWS comme pour ses clients. En clarifiant les règles du jeu, AWS cherche à professionnaliser la gestion du cycle de vie des IA en entreprise, sur le modèle de ce que font déjà les plateformes cloud pour leurs APIs et services logiciels. La prochaine étape pour les équipes utilisant Bedrock sera d'intégrer ces états dans leurs processus de surveillance et d'alerte, afin de ne jamais être pris de court lors d'une transition de modèle.

UELes entreprises européennes utilisant Amazon Bedrock doivent intégrer ce nouveau cadre de cycle de vie dans leurs processus de gestion des applications IA en production pour éviter des interruptions de service.

OutilsOpinion
1 source
708AWS ML Blog 

Amazon Bedrock AgentCore permet d'intégrer un agent IA de navigation en direct dans une application React

Amazon a lancé le composant BrowserLiveView dans son SDK TypeScript Bedrock AgentCore, permettant aux développeurs d'intégrer un flux vidéo en temps réel d'une session de navigation autonome directement dans leurs applications React. Concrètement, trois lignes de JSX suffisent pour embarquer ce flux live : le composant reçoit une URL présignée SigV4 générée côté serveur, établit une connexion WebSocket persistante, et diffuse la session du navigateur distant via le protocole Amazon DCV. L'architecture repose sur trois couches : le navigateur React de l'utilisateur qui affiche le flux, un serveur applicatif qui orchestre les sessions via l'API Bedrock AgentCore, et l'infrastructure AWS Cloud qui héberge les sessions navigateur isolées. Les sessions peuvent également être enregistrées sur Amazon S3 pour un visionnage différé depuis la console AWS. Cette visibilité en temps réel répond à un problème concret de confiance dans les agents IA autonomes. Lorsqu'un agent navigue sur le web, remplit des formulaires ou traite des données sensibles au nom d'un utilisateur, celui-ci n'a jusqu'ici aucune fenêtre sur ces actions. Avec BrowserLiveView, l'utilisateur suit chaque navigation, chaque soumission de formulaire et chaque interaction au moment où elle se produit, ce qui est nettement plus rassurant que recevoir une simple confirmation textuelle après coup. Pour les workflows supervisés, notamment dans les secteurs régulés comme la finance ou la santé, un superviseur peut observer l'agent en direct et intervenir sans quitter l'application. L'outil répond aussi aux exigences d'audit : la preuve visuelle des actions de l'agent constitue une traçabilité exploitable pour la conformité réglementaire et le débogage. Amazon Bedrock AgentCore s'inscrit dans la stratégie plus large d'AWS pour industrialiser les agents IA fiables en entreprise. La question de la transparence des agents autonomes est devenue centrale alors que les grandes organisations cherchent à déléguer des tâches complexes à des systèmes IA tout en conservant un contrôle humain. Plusieurs acteurs, dont Google avec ses agents Gemini et Microsoft avec Copilot Studio, développent des approches similaires de supervision d'agents web. AWS positionne ici son offre sur la simplicité d'intégration et la sécurité native, avec une authentification déléguée sans infrastructure streaming à maintenir côté développeur. La prochaine étape logique sera l'extension de cette visibilité à d'autres types d'agents au-delà de la navigation web, et probablement des mécanismes d'intervention manuelle directement depuis le flux live pour renforcer encore le contrôle humain dans la boucle.

UELes entreprises françaises et européennes utilisant AWS Bedrock pour des agents autonomes dans des secteurs régulés (finance, santé) disposent d'un mécanisme de traçabilité visuelle directement exploitable pour répondre aux exigences d'audit et de conformité imposées par le droit européen.

OutilsOutil
1 source
Intel TSNC : l’incroyable IA qui va réduire le poids de vos jeux vidéo par 18
709Le Big Data 

Intel TSNC : l’incroyable IA qui va réduire le poids de vos jeux vidéo par 18

Intel a dévoilé une nouvelle technologie baptisée TSNC, pour Texture Set Neural Compression, capable de réduire la taille des textures de jeux vidéo jusqu'à 18 fois par rapport aux formats non compressés. Concrètement, l'outil propose deux profils : une Variante A qui offre une compression jusqu'à 9x avec une perte de qualité visuelle d'environ 5 %, à peine perceptible à l'œil nu, et une Variante B qui pousse la compression à 18x au prix d'une légère dégradation entre 6 et 7 %. Plutôt que d'imposer un format propriétaire incompatible avec les outils existants, Intel a conçu TSNC pour s'intégrer naturellement dans les pipelines de production actuels, en s'appuyant sur la compression par blocs BC1 déjà standard dans l'industrie. Un réseau de neurones est entraîné sur des ensembles de textures similaires, regroupées dans un espace commun, puis un MLP à trois couches se charge de reconstruire les données au moment voulu. Cette décompression peut intervenir à l'installation, lors des temps de chargement, ou en cours de session selon les priorités du développeur. Sur l'architecture Panther Lake avec GPU intégré Arc B390, les cœurs XMX dédiés à l'IA génèrent le premier pixel en 0,194 nanoseconde, une latence pratiquement invisible pour un joueur. L'enjeu est considérable pour l'ensemble de la chaîne, des studios aux joueurs. Les jeux modernes atteignent régulièrement plusieurs dizaines de gigaoctets, une tendance directement liée à l'accumulation de textures haute résolution. Quand la VRAM sature, les performances s'effondrent brutalement. Une compression aussi agressive, sans perte visuelle notable, permettrait de réduire significativement la taille des téléchargements, d'alléger la pression sur la mémoire vidéo et d'améliorer l'expérience sur des machines d'entrée et de milieu de gamme. Intel a d'ailleurs prévu une solution de repli basée sur des instructions classiques pour les GPU plus anciens ou ceux de la concurrence, ce qui ouvre la technologie bien au-delà de son propre écosystème matériel. Cette annonce s'inscrit dans une compétition qui s'intensifie autour de la compression neuronale des textures. Nvidia travaille déjà sur sa propre technologie, baptisée NTC, tandis que Sony serait engagé sur des projets analogues en vue d'une future PlayStation 6. La pression exercée par l'explosion des tailles de jeux pousse toute l'industrie à chercher des solutions alternatives à la simple augmentation de la VRAM ou de la capacité de stockage. Intel, en adoptant une stratégie compatible avec les standards existants, cherche à faciliter l'adoption par les studios sans les forcer à revoir entièrement leurs workflows. La vraie question désormais est celle de l'intégration dans les moteurs de jeu comme Unreal ou Unity, et du calendrier auquel les premiers titres l'exploiteront concrètement.

UELes studios de jeux européens pourraient intégrer TSNC dans leurs pipelines de production pour réduire la taille des jeux et alléger la pression sur la mémoire vidéo, sous réserve d'une adoption par les moteurs Unreal et Unity.

OutilsOutil
1 source
710AWS ML Blog 

Amazon Bedrock AgentCore Runtime introduit des capacités MCP client avec état

Amazon a introduit des capacités client MCP (Model Context Protocol) avec état dans son service AgentCore Runtime sur Amazon Bedrock, marquant une évolution majeure pour les développeurs d'agents IA. Jusqu'à présent, les serveurs MCP hébergés sur cette plateforme fonctionnaient en mode sans état : chaque requête HTTP était traitée de façon indépendante, sans mémoire entre les appels. Le nouveau mode avec état, activé via un simple paramètre stateless_http=False, provision une microVM dédiée par session utilisateur, persistant jusqu'à 8 heures ou 15 minutes d'inactivité. Cette architecture permet désormais trois capacités clés du protocole MCP : l'élicitation (demander une saisie utilisateur en cours d'exécution), le sampling (solliciter du contenu généré par un LLM côté client), et les notifications de progression (streamer des mises à jour en temps réel). La continuité de session est assurée via un en-tête Mcp-Session-Id, échangé lors de l'initialisation et inclus dans toutes les requêtes suivantes. Ces nouvelles capacités transforment fondamentalement la nature des workflows agents. Là où les implémentations sans état forçaient les agents à s'exécuter de bout en bout sans interruption, les agents peuvent désormais mener de véritables conversations bidirectionnelles avec leurs clients : s'arrêter pour demander une clarification à l'utilisateur au milieu d'un appel d'outil, déléguer dynamiquement la génération de contenu au LLM présent côté client, ou signaler l'avancement d'opérations longues en temps réel. Pour les équipes qui construisent des assistants IA complexes, des pipelines de traitement de documents ou des agents d'automatisation nécessitant validation humaine intermédiaire, c'est un changement de paradigme concret qui élimine des contournements architecturaux souvent coûteux à maintenir. Le Model Context Protocol, standard ouvert définissant comment les applications LLM se connectent à des outils et sources de données externes, gagne rapidement en adoption depuis son lancement par Anthropic fin 2024. Amazon avait déjà intégré l'hébergement de serveurs MCP sans état dans AgentCore Runtime dans une version précédente ; cette mise à jour complète l'implémentation bidirectionnelle du protocole. L'isolation entre sessions via des microVMs dédiées garantit la sécurité et l'indépendance des contextes, chaque session bénéficiant de CPU, mémoire et système de fichiers séparés. Si une session expire ou que le serveur redémarre, les clients reçoivent une erreur 404 et doivent réinitialiser la connexion. Cette approche positionne AWS comme un acteur central dans l'infrastructure d'agents IA d'entreprise, en rivalité directe avec les offres similaires de Microsoft Azure et Google Cloud dans la course à standardiser les architectures agentiques.

UELes équipes européennes développant des agents IA sur des plateformes cloud peuvent désormais implémenter des workflows agentiques bidirectionnels natifs sans contournements architecturaux coûteux.

OutilsActu
1 source
711InfoQ AI 

MCP Dev Summit de l'AAIF : passerelles, gRPC et renforcement des protocoles

Le MCP Dev Summit North America 2026 s'est tenu les 2 et 3 avril au New York Marriott Marquis, réunissant environ 1 200 participants autour de l'évolution du Model Context Protocol (MCP). Organisé par l'Agentic AI Foundation, une initiative portée par la Linux Foundation, le sommet a mis en avant les défis concrets de déploiement du MCP en environnement d'entreprise, avec des contributions notables d'Amazon et d'Uber. Les discussions techniques ont porté sur trois axes majeurs : la sécurisation des passerelles (gateways), l'intégration via gRPC, et l'observabilité des protocoles en production. Ces orientations reflètent une maturité croissante du MCP, qui passe du stade expérimental à des déploiements à grande échelle dans des infrastructures critiques. Pour des entreprises comme Amazon ou Uber, la capacité à faire communiquer des agents IA de manière fiable, sécurisée et traçable devient un impératif opérationnel. L'accent mis sur l'interopérabilité signale que l'écosystème cherche à éviter la fragmentation entre implémentations propriétaires. Le MCP, initialement proposé par Anthropic fin 2024 comme standard ouvert pour connecter les modèles de langage aux outils et données externes, connaît une adoption accélérée depuis que des acteurs majeurs comme OpenAI et Google ont annoncé leur support. La prise en charge par la Linux Foundation via l'Agentic AI Foundation marque une étape vers sa gouvernance communautaire. Ce sommet illustre que le vrai enjeu n'est plus l'existence du protocole, mais sa robustesse industrielle face aux exigences de sécurité et de scalabilité des grandes organisations.

UEL'adoption du MCP comme standard ouvert sous gouvernance Linux Foundation crée un cadre d'interopérabilité que les entreprises européennes déployant des agents IA devront intégrer dans leurs architectures.

OutilsActu
1 source
712Le Big Data 

IA et généalogie : un assistant puissant, mais jamais le chef d’orchestre

François Lerebourg, PDG de CDIP et créateur du logiciel Généatique 2026, intègre l'intelligence artificielle au cœur de sa suite généalogique pour automatiser les tâches les plus fastidieuses : transcription paléographique de manuscrits anciens, traduction de documents en latin ou en allemand gothique, identification des métiers d'ancêtres, colorisation de photographies d'époque. Concrètement, l'utilisateur scanne un acte notarial ou un registre paroissial, et l'IA produit une première transcription en signalant les zones d'incertitude par une croix rouge dans le texte restitué. La colorisation de photos s'effectue à la demande, sans altération des pixels originaux, même si l'algorithme peut proposer une teinte de peau que l'utilisateur est libre de corriger. Les traitements passent par le cloud mais les données sont effacées après téléchargement, une architecture pensée pour protéger des informations personnelles sensibles. L'impact est considérable pour les millions d'amateurs de généalogie, souvent des retraités qui passaient jusqu'ici des dizaines d'heures à déchiffrer des écritures illisibles ou à trier des archives papier. Lerebourg parle d'une révolution comparable à l'arrivée du web il y a trente ans : la barrière technique qui décourageait les novices s'effondre, rendant la discipline accessible à un public beaucoup plus large. Le modèle revendiqué est celui du « compagnonnage numérique » plutôt que de l'automatisation totale : l'IA libère du temps pour ce qui a de la valeur, c'est-à-dire vérifier les sources, croiser les indices et construire un récit cohérent. La démocratisation de la généalogie passe ainsi par une redistribution du travail entre machine et humain, où la machine absorbe l'ingrat et l'humain conserve le jugement. Cette approche s'inscrit dans un moment charnière pour les logiciels patrimoniaux, confrontés à des outils d'IA générative dont les hallucinations et les confusions entre homonymes restent des risques réels. Lerebourg ne les minimise pas : des prompts soigneusement conçus et une sélection rigoureuse des modèles permettent de limiter les erreurs, mais la validation humaine reste non négociable. La question de la souveraineté des données personnelles est également centrale dans un secteur qui manipule des informations intimes, noms, dates, lieux de naissance, filiations, et où la confiance des utilisateurs est le premier actif. L'enjeu pour Généatique 2026 et ses concurrents est de montrer qu'une IA utile n'est pas une IA autonome, et que la valeur ajoutée tient précisément dans la capacité à savoir où s'arrêter.

UECDIP est une entreprise française et Généatique 2026 s'adresse directement aux généalogistes francophones, avec une architecture cloud effaçant les données après traitement, pensée pour répondre aux exigences du RGPD.

OutilsOutil
1 source
713InfoQ AI 

Les copilotes IA pour développeurs : comment choisir et maximiser sa productivité

Sepehr Khosravi, développeur et expert en outillage IA, a présenté une analyse approfondie de l'état actuel des assistants de code basés sur l'intelligence artificielle, en s'intéressant particulièrement aux outils comme Cursor et Claude Code. Sa présentation dépasse la simple comparaison de fonctionnalités pour entrer dans les détails techniques qui différencient ces solutions : le mode "Composer" de Cursor, qui orchestre des modifications multi-fichiers en autonomie, et les capacités de recherche contextuelle de Claude Code, capable de naviguer dans de grandes bases de code pour comprendre l'architecture avant d'agir. L'enjeu central soulevé par Khosravi est la gestion des fenêtres de contexte et des intégrations MCP (Model Context Protocol), deux facteurs souvent négligés qui déterminent en pratique l'efficacité réelle de ces outils en environnement professionnel. Il souligne que le gain de productivité ne se limite pas à l'accélération de l'écriture de code : les workflows agentiques permettent de compresser l'ensemble du cycle de développement, de la compréhension du problème à la revue de code, en réduisant les allers-retours entre développeurs. S'appuyant sur des retours d'expérience de responsables techniques dans des entreprises tech, Khosravi illustre comment les équipes qui tirent le meilleur parti de ces outils ne les utilisent pas comme de simples autocompléteurs améliorés, mais comme des agents intégrés dans leurs processus. La concurrence entre éditeurs comme Cursor, GitHub Copilot et Anthropic s'intensifie sur ce segment des workflows agentiques, qui représente désormais le vrai terrain de différenciation dans l'outillage développeur.

OutilsOutil
1 source
714Presse-citron 

Revolut lance son IA spéciale banque et finance : conseils, économie, assistance, elle change l’interface de l’application

Revolut a annoncé le lancement d'AIR (AI by Revolut), un assistant d'intelligence artificielle directement intégré à son application mobile. Disponible en premier au Royaume-Uni avec un déploiement progressif sur d'autres marchés, AIR permet aux utilisateurs de gérer leurs finances via une interface conversationnelle en langage naturel. Concrètement, l'assistant peut analyser les dépenses, bloquer une carte bancaire, suivre des investissements, gérer des abonnements ou encore fournir une assistance lors de voyages, le tout sans naviguer dans les menus traditionnels de l'application. Ce changement représente un tournant dans la façon dont des millions d'utilisateurs interagissent avec leur banque au quotidien. En remplaçant la navigation par menus par un simple échange textuel, Revolut cherche à réduire la friction dans la gestion financière personnelle. Pour les utilisateurs, cela signifie pouvoir poser une question comme "combien ai-je dépensé en restaurants ce mois-ci ?" et obtenir une réponse instantanée, sans chercher dans plusieurs onglets. C'est un pari sur l'adoption massive des interfaces conversationnelles dans la fintech. Revolut, qui compte plus de 50 millions de clients dans le monde, s'inscrit ainsi dans une tendance de fond : l'intégration de l'IA générative dans les services financiers. Des concurrents comme Monzo ou N26 explorent des fonctionnalités similaires, tandis que les banques traditionnelles peinent à s'adapter à cette rapidité d'exécution. AIR représente une étape vers une application bancaire pilotée entièrement par l'IA, une vision que Revolut semble vouloir concrétiser marché après marché.

UERevolut étant présent en France et dans toute l'UE avec des millions de clients, le déploiement progressif d'AIR pourrait transformer concrètement l'expérience bancaire quotidienne des utilisateurs européens de la néobanque.

OutilsOutil
1 source
715The Verge AI 

Google facilite la création de deepfakes de soi-même

YouTube Shorts lance une nouvelle fonctionnalité propulsée par l'intelligence artificielle permettant aux créateurs de contenu de se cloner numériquement. Annoncé en 2026, l'outil permet à chaque utilisateur de générer un avatar réaliste qui reproduit son apparence et sa voix, pouvant ensuite être inséré dans des vidéos Shorts existantes ou servir à en produire de nouvelles entièrement générées par IA. Cette fonctionnalité ouvre des possibilités concrètes pour les créateurs : produire du contenu sans se filmer, maintenir une présence régulière sur la plateforme, ou adapter des vidéos à plusieurs langues via un avatar localisé. Mais elle soulève aussi des inquiétudes profondes sur les usages malveillants, notamment les deepfakes non consentis et les arnaques par usurpation d'identité, problèmes auxquels YouTube peine déjà à faire face à grande échelle. Cette annonce illustre la tension croissante chez les grandes plateformes entre l'adoption agressive des outils génératifs pour rester compétitives et la nécessité de réguler les abus qu'ils engendrent. YouTube a multiplié ces derniers mois les signalements de contenus IA trompeurs, d'escroqueries utilisant des sosies de célébrités, et de désinformation automatisée. En proposant désormais des avatars officiels et encadrés, Google tente de canaliser cette dynamique tout en restant dans la course face à TikTok et Instagram, qui développent eux aussi leurs propres outils de création assistée par IA. La question de la frontière entre usage légitime et détournement reste entière.

UEL'AI Act européen impose des obligations de divulgation pour les contenus synthétiques générés par IA, ce lancement de YouTube soulève des questions de conformité directes pour la plateforme et ses créateurs opérant en Europe.

OutilsOutil
1 source
Google fusionne Gemini et NotebookLM : les projets ne sont plus réservés à ChatGPT et Claude
716Numerama 

Google fusionne Gemini et NotebookLM : les projets ne sont plus réservés à ChatGPT et Claude

Google s'apprête à intégrer les carnets NotebookLM directement dans l'interface de son chatbot Gemini, une fonctionnalité dévoilée à quelques semaines de la Google I/O 2026. Cette conférence annuelle, au cours de laquelle le géant californien devrait présenter un large éventail de nouveautés liées à ses intelligences artificielles, sert de toile de fond à plusieurs annonces anticipées destinées à préparer le terrain. L'intégration des projets NotebookLM dans Gemini constitue l'une des initiatives les plus attendues de ce cycle. Jusqu'ici, la gestion de projets structurés et de bases de connaissances personnelles était le domaine réservé de ChatGPT (avec ses "Projects") et de Claude (avec ses "Projects" d'Anthropic). Gemini en était dépourvu, ce qui le plaçait en retrait pour les utilisateurs souhaitant organiser leurs recherches ou travailler sur des documents sur la durée. En fusionnant NotebookLM dans son chatbot, Google comble ce manque et offre à Gemini une dimension de gestion documentaire persistante que ses concurrents proposaient déjà. NotebookLM, lancé en 2023 et popularisé notamment par sa fonction de génération de podcasts audio synthétiques, avait jusqu'alors une existence séparée au sein de l'écosystème Google. Ce rapprochement entre les deux produits s'inscrit dans une stratégie plus large de consolidation des outils IA de Google autour de Gemini, qui doit devenir le point d'entrée unifié de l'IA grand public de l'entreprise. La Google I/O 2026, dont la date exacte n'a pas encore été précisée, devrait fournir davantage de détails sur le périmètre exact de cette intégration et les autres fonctionnalités à venir.

UELes utilisateurs européens de Gemini disposeront d'une gestion documentaire persistante intégrée, les mettant à parité avec ChatGPT et Claude sur cette fonctionnalité clé.

OutilsOutil
1 source
Anthropic lance une infrastructure gérée pour agents IA autonomes
717The Decoder 

Anthropic lance une infrastructure gérée pour agents IA autonomes

Anthropic a lancé "Claude Managed Agents", une infrastructure hébergée permettant aux développeurs de construire et déployer des agents IA autonomes directement sur les serveurs de l'entreprise. Ce service géré prend en charge l'exécution des agents, la gestion des sessions, la mémoire persistante et l'orchestration des tâches longues, sans que les équipes techniques n'aient à gérer elles-mêmes l'infrastructure sous-jacente. Notion et Rakuten font partie des premiers partenaires à avoir adopté la plateforme, intégrant ces agents dans leurs produits pour automatiser des flux de travail complexes. L'enjeu est significatif : jusqu'ici, déployer des agents IA fiables en production exigeait une ingénierie considérable pour gérer les états, les interruptions, les erreurs et la durée de vie des sessions. En proposant cette couche d'infrastructure clé en main, Anthropic abaisse la barrière d'entrée pour les entreprises qui veulent aller au-delà des simples chatbots vers des systèmes capables d'agir de façon autonome sur des tâches multi-étapes, comme la recherche, la rédaction ou l'automatisation de processus métiers. Ce lancement s'inscrit dans une course accélérée entre les grands acteurs de l'IA pour capter le marché des agents. OpenAI a déployé ses propres capacités agentiques via l'API Assistants et les outils de l'opérateur, tandis que Google mise sur Vertex AI Agent Builder. Anthropic, fort d'un financement de plusieurs milliards de dollars notamment d'Amazon et Google, positionne cette offre managée comme un argument commercial direct face aux entreprises qui hésitent à construire leur propre stack agentique.

UELes entreprises européennes peuvent bénéficier de cette infrastructure gérée pour déployer des agents IA sans développer leur propre stack technique, mais aucun acteur ou régulateur européen n'est directement impliqué.

💬 Ce qui bloquait tout le monde jusqu'ici, c'était pas l'agent, c'était la plomberie derrière : états, sessions, interruptions, tâches qui durent des heures. Anthropic prend ça en charge, et j'y vois surtout une arme commerciale directe pour aller chercher les boîtes qui voulaient dépasser le chatbot sans construire leur propre stack. Ça va accélérer fort, et OpenAI va répondre vite.

OutilsOpinion
1 source
Enfin ! Gemini débarque sur toutes les enceintes Google Home de France
718Le Big Data 

Enfin ! Gemini débarque sur toutes les enceintes Google Home de France

Le 7 avril 2026, Google a officiellement étendu son assistant Gemini aux enceintes connectées de 16 nouveaux pays, dont la France, l'Allemagne, l'Espagne, l'Italie, le Royaume-Uni, le Japon et l'Australie. Présenté en octobre 2025 sous le nom "Gemini for Home", cet assistant avait d'abord été déployé en avant-première aux États-Unis, puis au Canada et au Mexique. Le déploiement en France est progressif : les utilisateurs doivent s'inscrire via l'application Google Home pour rejoindre le programme d'accès anticipé, et Google promet une activation pour tous les inscrits d'ici une semaine. L'ensemble des enceintes Google Home et Nest sont compatibles, y compris les modèles anciens comme le Google Home de 2016 ou les Nest Mini, bien que le mode "Gemini Live", permettant des conversations continues sans répéter "OK Google", soit réservé aux appareils sortis après 2019, comme le Nest Audio ou les écrans Nest Hub. Cette intégration marque un saut qualitatif significatif pour les enceintes connectées. Gemini apporte la capacité de traiter des questions complexes, d'exécuter plusieurs actions simultanément et de maintenir le contexte au fil d'une conversation prolongée. Concrètement, un utilisateur peut formuler une demande vague, retrouver une chanson à partir d'une description approximative, enchaîner plusieurs instructions dans une même phrase, ou piloter plusieurs appareils domestiques via des routines personnalisées, et l'assistant s'adapte. Pour les utilisateurs de maison connectée, c'est une rupture avec l'ère des commandes vocales rigides et limitées des assistants précédents. Sur le plan stratégique, Google prend une avance importante sur ses concurrents directs : Apple n'a pas encore déployé la version améliorée de Siri en France, et Amazon n'y a pas lancé Alexa+ non plus. Google devient ainsi le premier grand acteur à intégrer de l'intelligence artificielle générative directement dans des enceintes grand public sur le marché français. L'enjeu est considérable dans une guerre de l'assistant domestique qui s'intensifie. En revanche, une contrainte majeure pèse sur l'expansion : Google ne vend actuellement plus aucune enceinte en France, tous ses modèles étant en rupture de stock. La prochaine étape attendue est le lancement d'un nouveau modèle, le Google Home Speaker, qui pourrait être dévoilé lors de la Google I/O 2026, prévue le 19 mai, et qui serait conçu spécifiquement pour exploiter le plein potentiel de Gemini.

UEGemini est désormais disponible sur les enceintes Google Home en France, faisant de Google le premier acteur à déployer l'IA générative dans des enceintes grand public sur le marché français.

Valve pourrait bientôt confier son service d’assistance à SteamGPT
719Frandroid 

Valve pourrait bientôt confier son service d’assistance à SteamGPT

Valve envisage de déployer un chatbot interne baptisé SteamGPT pour prendre en charge une partie des demandes d'assistance sur sa plateforme Steam. L'outil, dont l'existence a été révélée récemment, serait destiné à épauler les équipes de support de l'entreprise face au volume considérable de tickets générés quotidiennement par les millions d'utilisateurs de la plateforme. Aucune date de lancement officielle n'a encore été communiquée par Valve. Steam est la plus grande plateforme de distribution de jeux vidéo sur PC au monde, avec plus de 130 millions de comptes actifs mensuels. Le support client y représente un défi logistique majeur : remboursements, litiges, problèmes techniques, comptes compromis. Automatiser une partie de ce traitement permettrait à Valve de réduire les délais de réponse et de libérer ses agents humains pour les cas complexes, une approche déjà adoptée par des géants comme Amazon ou Apple dans leurs propres services client. Cette initiative s'inscrit dans une tendance plus large d'intégration de l'IA générative dans les fonctions support des grandes entreprises technologiques. Valve, connue pour sa discrétion et son refus des structures hiérarchiques traditionnelles, opère avec des effectifs relativement réduits pour une entreprise de son envergure, ce qui rend l'automatisation particulièrement stratégique. La question de la qualité de traitement des cas sensibles, notamment la gestion des comptes suspendus ou des fraudes, restera centrale si le déploiement de SteamGPT se confirme.

UELes millions d'utilisateurs européens de Steam pourraient bénéficier d'un support client plus rapide, mais l'outil reste interne et n'a aucun impact réglementaire ou économique direct pour la France ou l'UE.

OutilsOutil
1 source
Top des meilleures alternatives à Higgsfield - avril 2026
720Le Big Data 

Top des meilleures alternatives à Higgsfield - avril 2026

En avril 2026, le marché des générateurs vidéo par intelligence artificielle a profondément évolué, rendant obsolète la domination qu'avait Higgsfield sur la création vidéo mobile. Trois outils se distinguent désormais comme alternatives crédibles : Fliki, Seedance et Vidnoz. Fliki permet de transformer un article de blog en vidéo Instagram en moins de deux minutes, avec synchronisation automatique entre script, voix off et médias d'illustration, en Full HD (1080p) aux formats MP4 et MOV. Seedance, développé par ByteDance, génère des séquences en 2K et 4K natifs avec des contrôles de caméra avancés permettant travellings et zooms sans distorsion, dans des formats cinéma jusqu'au 2.39:1. Vidnoz, de son côté, s'appuie sur un catalogue de plus de 1 000 avatars humains avec synchronisation labiale quasi parfaite, couvrant de nombreuses nationalités et tonalités vocales. Ces trois plateformes répondent à des besoins professionnels distincts et concrets. Fliki cible les créateurs de contenu qui doivent alimenter les réseaux sociaux à cadence soutenue : son interface sans courbe d'apprentissage en fait un outil d'industrialisation de la présence digitale. Seedance s'adresse aux équipes qui placent la direction artistique au centre de leur production, avec une gestion de l'éclairage volumétrique et une cohérence des personnages entre les plans, deux points faibles récurrents chez la concurrence. Vidnoz transforme la communication d'entreprise : formations, messages de vente personnalisés ou présentations localisées deviennent réalisables sans studio ni acteurs, ce qui réduit considérablement les coûts de production audiovisuelle. L'émergence simultanée de ces outils reflète une accélération structurelle du secteur depuis fin 2025, portée par des modèles de diffusion vidéo de nouvelle génération capables de maintenir la cohérence visuelle sur plusieurs plans consécutifs. ByteDance, déjà omniprésent dans la création de contenu court via TikTok, positionne Seedance comme un outil professionnel haut de gamme face aux offres américaines. Higgsfield reste pertinent pour les usages mobiles spontanés, mais perd du terrain sur les workflows de production structurés. La prochaine bataille se jouera sur la génération audio native, la personnalisation des avatars et la réduction des temps de rendu, Seedance affiche encore des délais pénalisants pour des sorties 4K. Pour les professionnels du marketing et de la formation, choisir entre vitesse, esthétique et réalisme humain est devenu la décision centrale de leur stack créatif en 2026.

OutilsOutil
1 source
Google intègre le support MCP dans Colab pour permettre l'exécution cloud d'agents IA
721InfoQ AI 

Google intègre le support MCP dans Colab pour permettre l'exécution cloud d'agents IA

Google a publié le Colab MCP Server, un outil open source qui permet aux agents d'intelligence artificielle d'interagir directement avec Google Colab via le Model Context Protocol (MCP). Cette intégration donne aux agents la capacité d'exécuter du code, de lancer des notebooks et de piloter des environnements cloud Colab sans intervention humaine, en passant par une interface standardisée que les principaux frameworks d'agents reconnaissent nativement. L'enjeu est concret : les développeurs qui construisent des agents IA se heurtent régulièrement à deux problèmes, la puissance de calcul disponible localement et la sécurité des exécutions. En déportant ces tâches vers Colab, les agents peuvent faire tourner des modèles lourds, traiter des jeux de données volumineux ou exécuter du code potentiellement risqué dans un environnement isolé et géré par Google, sans exposer la machine du développeur. Cela ouvre la voie à des workflows d'automatisation bien plus ambitieux, notamment pour les équipes qui n'ont pas accès à des GPU dédiés. Ce lancement s'inscrit dans la montée en puissance du Model Context Protocol, standard initialement proposé par Anthropic et rapidement adopté par l'ensemble de l'industrie comme protocole commun pour connecter les agents aux outils externes. Google, qui avait déjà intégré MCP dans plusieurs de ses produits, étend ainsi sa surface de compatibilité avec l'écosystème agent. Le fait que le serveur soit open source suggère une volonté d'ancrer Colab comme infrastructure de référence pour l'exécution agentique dans le cloud.

UELes équipes européennes de développement IA peuvent déléguer l'exécution agentique à un environnement cloud isolé, facilitant le développement sans infrastructure GPU dédiée.

OutilsOutil
1 source
Guide de programmation pour créer des pipelines avancés d'analyse de documents avec Google LangExtract, OpenAI et visualisation interactive
722MarkTechPost 

Guide de programmation pour créer des pipelines avancés d'analyse de documents avec Google LangExtract, OpenAI et visualisation interactive

Google a publié LangExtract, une bibliothèque Python conçue pour transformer des documents textuels non structurés en données exploitables par machine, en s'appuyant sur les modèles de langage d'OpenAI. L'outil s'intègre directement avec l'API OpenAI, notamment le modèle gpt-4o-mini, et permet d'analyser une large variété de documents : contrats juridiques, comptes-rendus de réunion, annonces produits ou journaux d'opérations. Le pipeline d'extraction repose sur des prompts configurables et des exemples annotés fournis par le développeur, à partir desquels LangExtract identifie des entités, des obligations, des délais, des risques ou des clauses spécifiques, tout en ancrant chaque résultat à sa position exacte dans le texte source via des intervalles de caractères. Les sorties sont générées en double format : JSONL pour le traitement programmatique, et HTML interactif pour la visualisation directe dans un environnement notebook. L'intérêt concret de LangExtract réside dans sa capacité à industrialiser l'analyse documentaire sans infrastructure lourde. Là où la lecture manuelle de centaines de contrats ou de rapports mobilise des équipes entières, un pipeline LangExtract peut extraire automatiquement les parties contractantes, les conditions de paiement, les pénalités ou les clauses de résiliation, et les organiser en tableaux Pandas directement exploitables pour des workflows d'automatisation ou des systèmes décisionnels. Pour les équipes juridiques, financières ou opérationnelles, cela représente un gain de temps considérable et une réduction des erreurs humaines sur des tâches répétitives à fort enjeu. La bibliothèque supporte également le traitement parallèle via un paramètre max_workers, ce qui rend l'approche viable à l'échelle. LangExtract s'inscrit dans une tendance plus large d'outillage autour des LLM pour l'extraction d'information structurée, un domaine en pleine expansion depuis que les modèles de fondation ont démontré leur capacité à comprendre des textes complexes. Google positionne ici un outil de niveau intermédiaire : plus accessible que de coder une chaîne d'extraction LLM from scratch, mais plus flexible que les solutions no-code. La dépendance à l'API OpenAI (et donc à gpt-4o-mini ou ses successeurs) implique des coûts variables selon le volume de documents traités, ce qui constitue une limite pour les déploiements à très grande échelle. La prochaine évolution attendue de ce type d'outil serait la compatibilité avec des modèles open-source locaux comme Ollama, afin de supprimer cette dépendance externe et de traiter des documents sensibles sans sortir les données du périmètre de l'entreprise.

OutilsOutil
1 source
Gemini intègre des carnets de notes pour organiser vos projets
723The Verge AI 

Gemini intègre des carnets de notes pour organiser vos projets

Google a annoncé mercredi le lancement d'une nouvelle fonctionnalité appelée "notebooks" dans son assistant Gemini. Cette fonction permet aux utilisateurs de regrouper en un seul endroit des fichiers, des conversations passées et des instructions personnalisées autour d'un sujet donné. Gemini peut ensuite exploiter tout ce contenu comme contexte lors des échanges. Google décrit les notebooks comme des "bases de connaissances personnelles partagées entre les produits Google", avec une intégration qui commence dans Gemini avant de s'étendre à d'autres services de la suite. Cette fonctionnalité représente un changement important dans la manière dont les utilisateurs interagissent avec les assistants IA : plutôt que de repartir de zéro à chaque conversation, ils peuvent maintenant maintenir un fil de continuité autour de projets ou de sujets précis. Pour les professionnels qui utilisent Gemini au quotidien, cela signifie moins de répétition et une meilleure cohérence dans les réponses obtenues. L'intégration prévue avec l'ensemble de l'écosystème Google pourrait renforcer significativement l'utilité de l'outil dans des contextes de travail réels. La fonctionnalité s'inscrit directement dans la compétition avec OpenAI, dont la fonctionnalité "Projects" de ChatGPT, lancée en 2024, propose un concept très similaire. Google se retrouve donc dans une position de suiveur sur ce terrain précis, même si son avantage réside dans l'intégration native avec ses propres produits (Docs, Drive, Gmail, etc.). La bataille pour fidéliser les utilisateurs via des espaces de travail persistants est désormais un axe stratégique central pour les grands acteurs de l'IA générative.

UELa fonctionnalité notebooks de Gemini est disponible pour les utilisateurs européens, offrant une meilleure continuité de travail, mais sans impact réglementaire ou stratégique spécifique pour la France ou l'UE.

OutilsOutil
1 source
Guide complet d'utilisation de ModelScope : recherche de modèles, inférence, fine-tuning, évaluation et export
724MarkTechPost 

Guide complet d'utilisation de ModelScope : recherche de modèles, inférence, fine-tuning, évaluation et export

ModelScope, la plateforme de partage de modèles d'intelligence artificielle développée par Alibaba et son laboratoire DAMO Academy, s'impose comme une alternative crédible à Hugging Face pour les développeurs souhaitant accéder à des modèles pré-entraînés, des jeux de données et des pipelines d'inférence. Un tutoriel complet publié récemment détaille un workflow de bout en bout exécutable sur Google Colab, couvrant l'installation de l'environnement, la recherche de modèles via le hub ModelScope, le téléchargement de snapshots comme BERT, le chargement du jeu de données IMDB, le fine-tuning d'un classificateur de sentiment, son évaluation et son export pour déploiement. La procédure repose sur un écosystème de bibliothèques Python incluant PyTorch, Transformers d'Hugging Face, Accelerate, scikit-learn et Optimum, avec une compatibilité GPU vérifiée dès le départ via CUDA. Ce type de guide pratique a une valeur concrète pour les équipes d'ingénierie et de recherche qui cherchent à industrialiser leurs workflows IA sans repartir de zéro. En montrant que ModelScope s'intègre nativement avec les outils Hugging Face, notamment les pipelines Transformers pour l'analyse de sentiment ou la vision par ordinateur, le tutoriel réduit la barrière à l'entrée pour les équipes déjà familières de cet écosystème. La possibilité de télécharger localement des snapshots de modèles, d'accéder à des datasets comme IMDB via l'API MsDataset, et d'exporter les modèles fine-tunés vers des formats de production (via Optimum) en fait un outil pertinent aussi bien pour l'expérimentation que pour des déploiements à plus grande échelle. ModelScope a été lancé en 2022 par Alibaba DAMO Academy avec l'ambition de construire un écosystème ouvert de modèles centré sur la communauté chinoise et internationale du machine learning. La plateforme héberge des milliers de modèles dans des domaines variés, NLP, vision, audio, multimodal, et se positionne directement face à Hugging Face, qui reste la référence mondiale avec plus de 500 000 modèles disponibles. La dépendance au réseau chinois pour certaines API (la recherche de modèles peut être indisponible hors de Chine, comme le mentionne le tutoriel lui-même) constitue une friction réelle pour les utilisateurs occidentaux. Néanmoins, avec l'accélération des sorties de modèles chinois performants comme Qwen, DeepSeek ou Yi, ModelScope devient un point d'accès incontournable pour quiconque souhaite travailler avec ces modèles dès leur publication, souvent avant leur disponibilité sur d'autres plateformes.

OutilsTuto
1 source
Claude, OpenClaw et la nouvelle réalité : les agents IA sont là, et le chaos aussi
725VentureBeat AI 

Claude, OpenClaw et la nouvelle réalité : les agents IA sont là, et le chaos aussi

L'ère des agents IA autonomes est désormais une réalité concrète, portée par trois outils majeurs qui redéfinissent ce que les logiciels peuvent accomplir sans intervention humaine. OpenClaw, anciennement connu sous les noms Moltbot et Clawdbot, a dépassé les 150 000 étoiles sur GitHub en quelques jours après son lancement et s'installe directement sur les machines locales avec un accès profond au système : tri de boîte mail, réponses automatiques, curation de contenu, planification de voyages. Google Antigravity, lui, est un agent de développement doté d'un environnement intégré capable de passer d'une simple instruction à une application fonctionnelle, écriture, test, intégration et correction de bugs compris. Enfin, Anthropic a dévoilé Claude Cowork, un agent spécialisé pour des secteurs comme le droit et la finance, capable d'automatiser la revue de contrats ou le tri de documents juridiques. Son annonce a provoqué une chute notable des actions de sociétés de legal-tech et de SaaS, un phénomène rapidement baptisé "SaaSpocalypse" par les observateurs du marché. L'impact de ces agents va bien au-delà de la simple automatisation de tâches répétitives. En confiant à ces systèmes un accès à des données sensibles, fichiers personnels, détails financiers, documents légaux, les utilisateurs délèguent une autorité réelle sur des décisions à fort enjeu. Les risques sont proportionnels à la puissance accordée : un agent fiscal pourrait manquer des économies importantes ou, à l'inverse, inclure des déductions illégales ; un agent de développement pourrait injecter du code défectueux ou introduire des failles invisibles dans des systèmes critiques. La question de la confiance envers les fournisseurs comme Anthropic ou Google devient donc centrale, d'autant qu'OpenClaw, en tant que projet open source, ne dispose d'aucune autorité centrale de gouvernance pour encadrer les usages. Ce basculement vers l'IA agentique s'inscrit dans une trajectoire commencée fin 2022 avec l'émergence des chatbots conversationnels, mais qui s'accélère désormais vers des systèmes capables d'agir, pas seulement de répondre. La crainte d'une intelligence artificielle générale (AGI) n'est plus de la science-fiction pour de nombreux chercheurs. Face à ce chaos organisé, les experts s'accordent sur quelques impératifs : journalisation des actions des agents, validation humaine sur les décisions critiques, et développement d'une ontologie partagée permettant à des agents hétérogènes de communiquer dans un langage commun. Un cadre de responsabilité, de transparence et de sécurité, associé à une infrastructure d'identité distribuée, apparaît comme la condition sine qua non pour que ces écosystèmes agentiques tiennent leurs promesses sans déclencher la prochaine grande panique technologique.

UELa disruption des secteurs legal-tech et SaaS par des agents IA autonomes (droit, finance) menace directement des entreprises européennes positionnées sur ces marchés, sans cadre réglementaire adapté à ce niveau d'autonomie agentique.

OutilsOutil
1 source
Supervision humaine dans les workflows d'agents autonomes en santé et sciences du vivant
726AWS ML Blog 

Supervision humaine dans les workflows d'agents autonomes en santé et sciences du vivant

Amazon Web Services a publié un guide technique détaillant quatre approches concrètes pour intégrer une supervision humaine dans les workflows d'agents IA déployés dans le secteur de la santé et des sciences du vivant. Ces architectures s'appuient sur le framework Strands Agents, Amazon Bedrock AgentCore Runtime et le Model Context Protocol (MCP), et sont conçues pour répondre aux exigences réglementaires GxP qui imposent une traçabilité complète de chaque décision sensible. Les quatre méthodes présentées couvrent des scénarios différents : interruption via un système de hooks dans la boucle agentique, contrôle intégré directement dans la logique des outils, délégation asynchrone à un approbateur externe via AWS Step Functions et Amazon SNS, et enfin l'élicitation native du protocole MCP pour une approbation interactive en temps réel via des événements server-sent (SSE). L'enjeu est considérable pour les établissements de santé et les laboratoires pharmaceutiques qui automatisent des opérations à fort impact : codification médicale, soumissions réglementaires, accès aux données de patients ou modification de protocoles d'essais cliniques. Sans point de contrôle humain formalisé, ces systèmes ne peuvent pas satisfaire aux exigences GxP, qui imposent une autorisation documentée avant toute action sur des données de santé protégées (PHI). L'architecture proposée distingue explicitement les niveaux de risque : une recherche du nom d'un patient s'exécute sans validation, la consultation de ses constantes vitales ou antécédents médicaux déclenche une demande d'autorisation humaine, et un acte comme une sortie hospitalière nécessite l'approbation d'un superviseur externe notifié par email. Cette gradation permet de préserver les gains d'efficacité de l'automatisation tout en maintenant la sécurité des patients et la conformité réglementaire. L'émergence des agents IA dans les environnements GxP crée une tension fondamentale entre autonomie des systèmes et obligations légales de surveillance. Le secteur pharmaceutique et hospitalier est soumis à des audits stricts qui exigent de pouvoir retracer qui a approuvé quoi, et à quel moment, pour chaque opération sensible. AWS positionne ici ses services managés comme une infrastructure d'entreprise capable d'absorber ces contraintes sans ralentir les pipelines de traitement clinique. Le choix d'une architecture serverless via AgentCore Runtime vise l'isolation des sessions et la scalabilité, deux propriétés critiques pour des environnements multi-établissements. Le code de l'ensemble des patterns est disponible publiquement sur GitHub, ce qui suggère une stratégie d'adoption large : AWS cherche à s'imposer comme la référence d'infrastructure pour l'IA agentique réglementée, un marché en forte croissance à mesure que les hôpitaux et les grands groupes pharmaceutiques passent à l'échelle leurs expérimentations en production.

UELes établissements de santé et laboratoires pharmaceutiques européens soumis aux réglementations GxP et à la certification HDS peuvent adapter ces patterns d'architecture pour conformer leurs déploiements d'agents IA aux exigences de traçabilité et d'approbation documentée imposées par les autorités sanitaires européennes.

OutilsOutil
1 source
Amazon Nova Embeddings : construire un moteur de recherche audio intelligent par analyse sémantique
727AWS ML Blog 

Amazon Nova Embeddings : construire un moteur de recherche audio intelligent par analyse sémantique

Amazon a lancé le 28 octobre 2025 Amazon Nova Multimodal Embeddings, un modèle d'embedding unifié disponible via Amazon Bedrock, capable de traiter simultanément du texte, des documents, des images, des vidéos et de l'audio au sein d'un seul et même système. Concrètement, ce modèle convertit n'importe quel contenu audio en vecteurs numériques denses dans un espace à haute dimension, avec quatre options de taille : 3 072 dimensions (par défaut), 1 024, 384 ou 256. Chaque vecteur encode à la fois les propriétés acoustiques d'un son, rythme, hauteur tonale, timbre, couleur émotionnelle, et son sens sémantique. Deux extraits musicaux similaires, par exemple un violon et un violoncelle jouant la même mélodie, obtiendront une similarité cosinus de 0,87, les plaçant proches dans cet espace vectoriel, tandis qu'un morceau de rock avec batterie n'obtiendra que 0,23 face à ces mêmes clips. L'enjeu est considérable pour tous ceux qui gèrent de grandes bibliothèques audio : studios de production, plateformes de podcast, services de streaming, équipes de post-production. Les méthodes traditionnelles, transcription manuelle, balisage de métadonnées, conversion parole-texte, ne capturent que le contenu linguistique. Elles sont aveugles aux propriétés acoustiques pures : l'ambiance d'une pièce, l'émotion dans une voix, le genre musical, les sons environnementaux. Nova Multimodal Embeddings comble ce vide en permettant des requêtes en langage naturel comme "musique mélancolique avec piano" ou "bruit de foule dans un stade", sans qu'aucune transcription préalable ne soit nécessaire. Le résultat est une recherche sémantique sur le son lui-même, pas seulement sur ses métadonnées. Le modèle repose sur une technique appelée Matryoshka Representation Learning (MRL), qui structure les embeddings de façon hiérarchique, à la manière des poupées russes : un vecteur de 3 072 dimensions contient toute l'information, mais on peut tronquer aux 256 premières dimensions et conserver des résultats précis. Cela permet de générer les embeddings une seule fois, puis d'ajuster la taille selon les contraintes de coût de stockage ou de performance, sans retraiter l'audio. Cette approche s'inscrit dans la tendance plus large des modèles d'embedding multimodaux unifiés, où Amazon rivalise directement avec Google (Vertex AI Embeddings) et OpenAI (CLIP, Whisper). L'intégration native dans Bedrock facilite le déploiement en production via des bases de données vectorielles compatibles k-NN. La prochaine étape logique sera l'intégration de ces capacités dans des pipelines RAG (retrieval-augmented generation) pour des agents conversationnels capables de répondre à des questions sur du contenu audio sans intervention humaine préalable.

UELes studios de production, plateformes de podcast et services de streaming européens peuvent intégrer cette API via Amazon Bedrock pour améliorer leurs moteurs de recherche audio sémantique.

OutilsOutil
1 source
Affinage par renforcement sur Amazon Bedrock : bonnes pratiques
728AWS ML Blog 

Affinage par renforcement sur Amazon Bedrock : bonnes pratiques

Amazon a intégré le Reinforcement Fine-Tuning (RFT) à sa plateforme Bedrock, permettant aux entreprises de personnaliser ses modèles maison Amazon Nova ainsi que plusieurs modèles open source sans avoir besoin de vastes jeux de données étiquetés. Selon les résultats publiés par l'entreprise, cette technique peut générer jusqu'à 66 % de gain de précision par rapport aux modèles de base, à un coût et une complexité réduits. Concrètement, le RFT fonctionne différemment de l'apprentissage supervisé classique : au lieu de s'entraîner sur des paires entrée/sortie correctes, le modèle génère des réponses candidates, qui sont ensuite notées par une fonction de récompense, et ses paramètres sont mis à jour pour favoriser les réponses les mieux notées. Cette boucle itéractive, générer, scorer, ajuster, permet au modèle de découvrir des stratégies que de simples exemples statiques ne pourraient pas lui enseigner. La fonction de récompense est implémentée via AWS Lambda, directement appelée par Bedrock pendant l'entraînement. Cette approche ouvre des possibilités concrètes pour deux grandes familles de tâches. D'un côté, les tâches à critères vérifiables automatiquement : génération de code devant passer des tests unitaires, raisonnement mathématique avec réponses exactes, extraction de données structurées devant respecter un schéma strict, ou orchestration d'API. C'est ce qu'Amazon appelle le RLVR (Reinforcement Learning with Verifiable Rewards). De l'autre côté, les tâches subjectives comme la modération de contenu, les chatbots ou la rédaction créative, où un modèle juge évalue les sorties selon une grille d'évaluation détaillée, approche baptisée RLAIF (Reinforcement Learning with AI Feedback). Pour les équipes techniques, l'intérêt est d'éviter la collecte laborieuse de milliers d'exemples annotés, particulièrement difficile à réaliser pour des tâches de raisonnement complexe où l'expertise humaine est coûteuse. Le RFT s'inscrit dans une tendance lourde de l'industrie IA depuis les succès de DeepSeek-R1 début 2025, qui avait démontré que l'entraînement par renforcement sur des tâches vérifiables pouvait produire des capacités de raisonnement spectaculaires à moindre coût. Amazon emboîte le pas en industrialisant cette technique dans un service cloud managé, ce qui la rend accessible aux équipes sans infrastructure d'entraînement propre. En proposant RFT directement dans Bedrock avec des métriques de suivi intégrées et des guidelines de tuning d'hyperparamètres, Amazon cherche à s'imposer face à Azure et Google Cloud sur le segment de la personnalisation de modèles en entreprise. Le dataset GSM8K, utilisé comme exemple de référence dans la documentation, illustre bien l'ambition : transformer des modèles généralistes en spécialistes fiables sur des domaines métier précis, sans expertise en machine learning approfondie.

UELes entreprises européennes sur AWS peuvent désormais affiner des modèles IA sans jeux de données annotés massifs ni infrastructure ML propre, abaissant la barrière d'entrée pour la personnalisation de modèles en production.

OutilsOutil
1 source
Une startup crée un logiciel de gestion de code pour les adeptes du tokenmaxxing
729The Information AI 

Une startup crée un logiciel de gestion de code pour les adeptes du tokenmaxxing

GitButler, une startup berlinoise spécialisée dans la gestion de code, vient de lever 17 millions de dollars lors d'un tour de table de série A mené par Andreessen Horowitz. L'opération inclut également les investisseurs existants A.Capital Ventures et Fly Ventures. L'annonce a été faite par Scott Chacon, PDG de l'entreprise, qu'il a cofondée il y a trois ans avec les entrepreneurs Anne Leuschner et Kiril Videlov. Le logiciel de GitButler vise à faciliter la coordination entre développeurs humains et agents de codage IA, en modernisant les outils de gestion de versions qui existent depuis plusieurs décennies. Cette levée de fonds s'inscrit dans un contexte où les entreprises technologiques poussent leurs équipes à utiliser massivement l'IA pour écrire du code. Meta, notamment, a vu émerger en interne un classement informel mesurant quels ingénieurs consomment le plus de tokens IA, une pratique baptisée "tokenmaxxing". Cette course à l'utilisation de l'IA génère une demande croissante pour des outils capables d'organiser, de tracer et de superviser le code produit par ces agents, qui travaillent en parallèle des développeurs humains et à un rythme que les systèmes traditionnels de contrôle de versions peinent à suivre. Les outils de versioning classiques comme Git ont été conçus pour un flux de travail entièrement humain, où les modifications sont soumises de façon réfléchie et espacée. L'irruption d'agents IA capables de générer des milliers de lignes de code en continu bouscule ces paradigmes établis. GitButler parie que ce changement structurel crée un nouveau marché pour des couches logicielles intermédiaires entre les agents et les dépôts de code. Avec le soutien d'Andreessen Horowitz, l'un des fonds les plus influents de la Silicon Valley, la startup dispose désormais des ressources pour s'imposer dans cet espace encore peu défriché, à mesure que le "tokenmaxxing" se généralise au-delà de Meta.

UEGitButler, startup berlinoise, s'impose comme acteur européen des outils de développement IA avec ce financement d'Andreessen Horowitz, renforçant l'écosystème tech allemand face à la Silicon Valley.

💬 Le tokenmaxxing chez Meta, c'est le genre d'anecdote qui te dit que l'époque a vraiment changé, et moi je la crois. Git a 20 ans, il n'a jamais été conçu pour des agents qui crachent du code en continu, le tuyau est trop étroit. GitButler parie sur la bonne couche au bon moment, avec 17M et a16z dans le dos, reste à voir si la prod suit.

OutilsActu
1 source
[Tuto] Utiliser des IA génératives en local et influence du GPU sur les performances
730Next INpact 

[Tuto] Utiliser des IA génératives en local et influence du GPU sur les performances

Faire tourner un grand modèle de langage sur sa propre machine est désormais accessible à quiconque dispose d'un ordinateur suffisamment puissant. Des outils comme Ollama permettent d'installer et d'utiliser localement des LLM tels que Mistral, LLaMA ou Qwen, sans connexion internet et sans envoyer la moindre donnée à un serveur tiers. L'article propose un tutoriel pas à pas pour configurer cet environnement en local, accompagné d'un comparatif de performances entre deux configurations : un serveur équipé de 24 cœurs CPU sans GPU, et un autre disposant d'une carte graphique dédiée. Le résultat est sans appel : l'écart de vitesse d'inférence entre les deux setups est énorme, le GPU surclassant massivement le CPU seul pour ce type de charge de travail. L'enjeu central est la confidentialité des données. Utiliser ChatGPT, Claude ou Le Chat implique d'envoyer ses requêtes sur les serveurs d'OpenAI, Anthropic ou Mistral, où elles peuvent potentiellement servir à l'entraînement ou à l'amélioration des modèles. Pour les professionnels manipulant des données sensibles, documents juridiques, médicaux, financiers, code propriétaire, cette dépendance aux infrastructures cloud représente un risque réel. L'exécution locale supprime complètement ce vecteur : le modèle tourne sur la machine de l'utilisateur, les données n'en sortent jamais. C'est aussi une question d'autonomie : pas de quota d'API, pas d'abonnement mensuel, pas de coupure de service. Deux contraintes techniques conditionnent la faisabilité de cette approche. D'abord la mémoire : les poids d'un modèle de 7 milliards de paramètres occupent environ 4 à 8 Go selon le niveau de quantisation, tandis qu'un modèle de 70 milliards en requiert facilement 40 Go ou plus. Ensuite la puissance de calcul : un GPU accélère les opérations matricielles qui constituent le cœur de l'inférence, là où un CPU seul produit des réponses lentes et difficilement utilisables en pratique. Cette architecture locale n'est pas nouvelle, la communauté open source travaille dessus depuis la publication de LLaMA par Meta en 2023, mais elle est devenue beaucoup plus accessible grâce à des outils comme Ollama, LM Studio ou llama.cpp, qui abstraient la complexité technique. L'essor des modèles compacts et quantisés (3B, 7B, 14B paramètres) rend aujourd'hui possible une expérience satisfaisante même sur du matériel grand public, à condition de disposer d'une carte graphique avec suffisamment de VRAM.

UELes professionnels européens soumis au RGPD peuvent éliminer le risque d'envoi de données sensibles vers des serveurs américains en exécutant leurs modèles en local.

OutilsTuto
1 source
OpenClaw vs ChatGPT : quel agent IA local bat le roi du cloud ?
731Le Big Data 

OpenClaw vs ChatGPT : quel agent IA local bat le roi du cloud ?

En 2026, le débat entre agents IA locaux et solutions cloud a pris une nouvelle dimension avec l'émergence d'OpenClaw, un agent dit "skills-based" qui s'exécute directement sur la machine de l'utilisateur. Contrairement à ChatGPT Agent, le mode Operator d'OpenAI lancé dans le courant de l'année, OpenClaw accède au terminal, manipule les fichiers locaux, gère les dépôts Git et peut tourner en arrière-plan même session fermée, envoyant des notifications sur Discord à la fin d'une tâche. ChatGPT Agent fonctionne lui exclusivement dans le navigateur : l'IA clique, défile et remplit des formulaires à la place de l'utilisateur, mais s'arrête dès que l'onglet est fermé. Sur le plan tarifaire, OpenClaw revient à environ 10 à 30 dollars par mois selon la consommation d'API, contre 20 dollars fixes pour l'abonnement ChatGPT Plus incluant l'accès au mode Operator. La différence fondamentale entre les deux approches tient à la souveraineté des données et à la flexibilité technique. Avec OpenClaw, l'utilisateur choisit lui-même ses modèles, Claude 3.5 pour les raisonnements complexes, Llama 3 ou Kimi pour les tâches répétitives, afin d'optimiser ses coûts, tandis que ChatGPT impose l'écosystème OpenAI sans possibilité de substitution. La mémoire d'OpenClaw est persistante via des fichiers stockés sur disque ; celle de ChatGPT Agent est éphémère, réinitialisée à chaque session. Pour les professionnels qui valorisent l'intégration profonde dans leur environnement de travail, scripts actifs, assets locaux, automatisations conditionnelles, l'agent local représente un levier que le cloud ne peut pas reproduire. Nvidia a par ailleurs introduit NemoClaw, une couche de sécurité greffable sur OpenClaw pour encadrer les actions de l'agent et prévenir les comportements non désirés, comblant l'un des reproches traditionnels faits aux solutions locales. Ce duel s'inscrit dans un basculement plus large du marché de l'IA : on ne parle plus de simples chatbots, mais d'agents capables d'agir de manière autonome sur des systèmes réels. OpenAI a misé sur l'accessibilité maximale avec une interface sans friction, au prix d'un contrôle réduit pour l'utilisateur. OpenClaw, porté par une communauté technique exigeante, répond à un besoin croissant de confidentialité et d'autonomie, notamment dans les secteurs sensibles, finance, santé, défense, où héberger des données sur des serveurs tiers reste rédhibitoire. La vraie question pour 2026 n'est donc pas laquelle des deux IA est "plus intelligente", mais laquelle correspond au niveau de contrôle et de confiance que chaque utilisateur est prêt à exercer sur ses outils numériques.

UELa souveraineté des données mise en avant par OpenClaw répond aux exigences du RGPD et aux contraintes des secteurs réglementés en France et en UE (finance, santé, défense), où l'hébergement tiers reste problématique.

OutilsOutil
1 source
Cloudflare et GoDaddy s’allient pour permettre aux sites de bloquer les bots IA
732Siècle Digital 

Cloudflare et GoDaddy s’allient pour permettre aux sites de bloquer les bots IA

Cloudflare et GoDaddy ont annoncé un partenariat visant à donner aux propriétaires de sites web un contrôle direct sur les robots d'intelligence artificielle qui explorent leurs pages. Concrètement, GoDaddy va intégrer l'outil AI Crawl Control de Cloudflare dans sa plateforme d'hébergement, utilisée par des millions de sites à travers le monde. Via un tableau de bord simplifié, les propriétaires pourront autoriser ou bloquer individuellement les crawlers des grands modèles d'IA, ceux d'OpenAI, Anthropic, Google, Meta ou d'autres acteurs, sans avoir à modifier manuellement leur fichier robots.txt. L'enjeu est considérable pour les créateurs de contenu, éditeurs et développeurs indépendants qui voient leurs textes, images et données aspirés massivement par des entreprises d'IA sans consentement ni compensation. Ce type d'outil leur restitue une capacité de négociation concrète : bloquer certains acteurs, en autoriser d'autres, voire conditionner l'accès à des accords commerciaux. Pour l'industrie, c'est un signal fort que la question du droit à l'extraction de données web entre dans une phase de normalisation technique. Ce partenariat s'inscrit dans un contexte de tension croissante entre les éditeurs de contenu et les entreprises d'IA générative. Plusieurs procès sont en cours, notamment contre OpenAI et Google, pour utilisation non autorisée de contenus protégés dans l'entraînement de modèles. Cloudflare, qui traite une part massive du trafic internet mondial, se positionne ainsi comme un acteur clé de la gouvernance du web à l'ère de l'IA, aux côtés de partenaires comme GoDaddy dont la base d'utilisateurs garantit une adoption rapide et large.

UELes éditeurs et créateurs de contenu européens hébergés chez GoDaddy disposent désormais d'un outil concret pour bloquer individuellement les crawlers IA, ce qui renforce leur position dans les débats européens sur le droit d'auteur et l'extraction de données encadrée par l'AI Act.

OutilsActu
1 source
Le succès de l'IA dans le développement logiciel et les besoins de pilotage centralisé
733AI News 

Le succès de l'IA dans le développement logiciel et les besoins de pilotage centralisé

Selon une enquête menée par OutSystems auprès de 1 879 responsables informatiques dans dix pays, l'intelligence artificielle agentique a franchi le cap du pilote pour entrer en production dans de nombreuses entreprises. Le rapport, intitulé The State of AI Development 2026, révèle que 97 % des répondants explorent une forme de stratégie agentique, et que près de la moitié d'entre eux indiquent que plus de 50 % de leurs projets IA ont quitté la phase expérimentale. Les gains les plus concrets ne proviennent pas de la réduction des coûts, pourtant citée en premier par les dirigeants, mais de l'outillage des développeurs logiciels avec des assistants de génération de code : seuls 22 % des répondants jugent leurs déploiements les plus efficaces en matière d'efficience opérationnelle, contre une majorité qui pointe le développement assisté par IA comme premier vrai succès. Ce décalage entre les attentes et les résultats illustre un problème structurel : les organisations adoptent l'IA plus vite qu'elles ne parviennent à en cadrer l'usage. OutSystems avertit que la gouvernance et l'intégration aux systèmes existants constituent les deux véritables points de blocage. Ainsi, 48 % des répondants identifient l'intégration aux systèmes legacy comme la capacité la plus critique pour élargir l'usage agentique, et 38 % y voient la principale raison pour laquelle les projets restent bloqués entre pilote et production. Contrairement à ce que prônent de nombreux éditeurs IA, une vaste opération de nettoyage des données n'est pas un préalable obligatoire : des agents peuvent fonctionner efficacement dans des environnements de données complexes, à condition que la gouvernance soit renforcée en parallèle. La géographie de l'adoption révèle des disparités profondes. L'Inde domine nettement, avec 50 % des entreprises indiennes déclarant un taux de réussite de leurs projets IA entre 51 % et 75 %, et la plus forte proportion d'utilisateurs se qualifiant d'"experts". À l'inverse, la France et l'Allemagne restent les marchés les plus sceptiques, l'Allemagne enregistrant la plus haute proportion de dirigeants n'utilisant aucune forme d'IA agentique. Les secteurs financier et technologique montrent la progression la plus rapide du pilote vers la production, car ils disposent d'une ligne de vue claire entre automatisation et retour sur investissement mesurable. Le rapport suggère aux secteurs plus lents de s'inspirer de ce modèle : commencer par des workflows à fort volume et périmètre étroit, où les performances se mesurent et les échecs se contiennent, en se concentrant d'abord sur la fonction IT.

UELa France et l'Allemagne sont identifiées comme les marchés les plus sceptiques en matière d'IA agentique, signalant un retard européen que les DSI français devraient prendre en compte dans leur feuille de route d'adoption.

OutilsOutil
1 source
L'état des lieux des assistants de codage IA
734InfoQ AI 

L'état des lieux des assistants de codage IA

Birgitta Böckeler, experte chez Thoughtworks, dresse un état des lieux lucide des assistants de codage par IA en 2025. Dans une présentation intitulée State of Play: AI Coding Assistants, elle analyse comment ces outils ont évolué bien au-delà du simple "vibe coding", cette pratique consistant à générer du code de manière intuitive sans structure rigoureuse, pour entrer dans une phase de maturité plus exigeante, centrée sur ce qu'elle appelle le "context engineering" : l'art de fournir aux modèles le bon contexte au bon moment pour produire du code fiable. Le coeur de son argument porte sur la notion de "harness engineering", soit la conception de contraintes architecturales et de filets de sécurité qui permettent à des agents autonomes de générer du code sans introduire de régressions ou de failles critiques. Pour les responsables techniques, cela implique un arbitrage constant entre vitesse de développement et maintenabilité du code, avec en toile de fond des risques de sécurité réels liés à l'autonomie croissante des modèles, et des coûts d'inférence qui peuvent rapidement s'emballer. Cette réflexion s'inscrit dans un moment charnière pour l'industrie du développement logiciel, où des outils comme GitHub Copilot, Cursor ou les agents de codage d'Anthropic et OpenAI redéfinissent le rôle des ingénieurs. La question n'est plus de savoir si l'IA peut écrire du code, mais comment encadrer cette capacité pour qu'elle soit viable en production, à grande échelle et sur le long terme.

OutilsOutil
1 source
Comment garantir le succès d’un projet d’IA agentielle en entreprise
735Le Big Data 

Comment garantir le succès d’un projet d’IA agentielle en entreprise

Les projets d'intelligence artificielle agentielle explosent dans les entreprises, mais la réalité des déploiements reste bien en deçà des ambitions affichées. Selon McKinsey, le marché mondial de l'IA agentielle pourrait bondir de 5 à 7 milliards de dollars en 2024 à plus de 199 milliards d'ici 2034. Pourtant, Gartner estime que plus de 40 % de ces projets seront abandonnés avant fin 2027, et une étude Qlik révèle que si 97 % des entreprises ont prévu un budget dédié, seulement 18 % sont parvenues à un déploiement complet. Le fossé entre l'enthousiasme et l'exécution est immense, et il s'explique avant tout par des infrastructures de données insuffisamment matures. Contrairement aux outils d'IA générative, qui assistent les employés dans des tâches ponctuelles et peuvent être contrôlés avant toute action, les agents IA agissent directement dans les flux de travail opérationnels : ils détectent des anomalies financières, ajustent la chaîne d'approvisionnement, déclenchent des processus automatiquement. Cette autonomie réduit drastiquement la marge d'erreur tolérée. Un agent qui s'appuie sur des données fragmentées, dupliquées ou mal attribuées peut prendre des décisions erronées sans possibilité de correction immédiate. Les données non structurées, courriels, documents internes, bases de connaissances, aggravent le problème : leur propriétaire est rarement identifié, leur exactitude difficile à vérifier. Résultat : les entreprises découvrent au moment du déploiement que leurs fondations de données ne sont tout simplement pas prêtes à supporter ce niveau de responsabilité. La gouvernance des données et la clarté des responsabilités humaines constituent donc le vrai enjeu stratégique de l'IA agentielle. Définir qui est propriétaire des données, qui valide les décisions automatisées et à quel moment une intervention humaine s'impose n'est pas une formalité administrative : c'est la condition pour que les équipes fassaient confiance au système et pour garantir conformité et traçabilité. En Europe, la loi sur l'IA impose d'ailleurs des exigences de transparence et de gestion des risques dès la conception, ce qui, malgré la contrainte perçue, offre un cadre structurant pour une adoption plus maîtrisée. La prolifération des outils ajoute une couche de complexité supplémentaire : les entreprises qui empilent des solutions sans architecture cohérente se retrouvent avec des silos technologiques qui reproduisent exactement les problèmes de données qu'elles cherchaient à résoudre. La consolidation préalable des données n'est pas un prérequis technique parmi d'autres, c'est le fondement sans lequel aucun projet d'IA agentielle sérieux ne peut tenir ses promesses à grande échelle.

UEL'AI Act européen impose des exigences de transparence et de gestion des risques dès la conception pour les projets d'IA agentielle, structurant directement les déploiements en entreprise sur le marché européen.

OutilsOpinion
1 source
GEO : quand l’intelligence artificielle redessine les règles du search
736FrenchWeb 

GEO : quand l’intelligence artificielle redessine les règles du search

Les moteurs de recherche génératifs -- ChatGPT, Perplexity AI, Google AI Overviews -- transforment en profondeur la manière dont les internautes accèdent à l'information en ligne. Là où le SEO traditionnel visait à positionner des pages web dans des listes de résultats, le GEO (Generative Engine Optimization) désigne les pratiques émergentes pour apparaître dans les réponses synthétiques produites directement par ces systèmes d'IA. Les directions marketing et les responsables de la visibilité digitale se retrouvent confrontés à un changement de paradigme dont les contours restent encore à définir. L'enjeu est considérable : si un moteur génératif répond directement à la question d'un utilisateur sans qu'il visite un site, le trafic organique s'effondre, quelles que soient les positions SEO obtenues. Des études récentes montrent déjà une baisse du taux de clics sur les résultats Google depuis le déploiement des AI Overviews aux États-Unis. Pour les marques, les éditeurs et les e-commerçants, la question n'est plus seulement d'être bien référencé, mais d'être cité, synthétisé ou recommandé par ces nouveaux intermédiaires algorithmiques. Google, Microsoft avec Bing Copilot et des acteurs comme Perplexity AI se livrent une bataille pour capter l'intention de recherche avant même que l'utilisateur ne clique. Face à cette recomposition, les professionnels du marketing explorent de nouvelles tactiques : structuration sémantique renforcée, production de contenus factuels et sourcés, construction d'une autorité thématique reconnue par les LLM. Le GEO n'est pas encore une discipline codifiée, mais il s'impose déjà comme un chantier stratégique incontournable pour 2025 et au-delà.

UELes entreprises et éditeurs européens doivent adapter leur stratégie de visibilité digitale face à la montée des moteurs génératifs qui réduisent le trafic organique traditionnel.

OutilsOutil
1 source
Combiner Google Search, Google Maps et fonctions personnalisées dans un appel Gemini avec chaînes d'agents multi-étapes
737MarkTechPost 

Combiner Google Search, Google Maps et fonctions personnalisées dans un appel Gemini avec chaînes d'agents multi-étapes

Google a annonce en mars 2026 une mise a jour majeure de son API Gemini permettant desormais de combiner dans un seul appel API des outils integres comme Google Search et Google Maps avec des fonctions personnalisees definies par le developpeur. Jusqu'ici, ces capacites devaient etre appelees separement, necessitant plusieurs requetes et une orchestration manuelle cote client. La mise a jour introduit egalement trois mecanismes cles : la circulation de contexte, qui preserve l'historique complet de chaque appel d'outil et de chaque reponse entre les tours de conversation ; les identifiants uniques de reponse d'outil, qui permettent de lier precisement chaque appel de fonction parallele a son resultat correspondant ; et le "Grounding with Google Maps", qui injecte des donnees de localisation en temps reel directement dans le raisonnement du modele. Les modeles concernes sont gemini-3-flash-preview pour les combinaisons d'outils et gemini-2.5-flash pour l'ancrage cartographique, les deux etant accessibles sans configuration de facturation. Cette evolution transforme la facon dont les developpeurs peuvent construire des agents IA autonomes. Auparavant, orchestrer plusieurs sources d'information, une recherche web, une donnee meteo via API tierce, et une localisation geographique, exigeait plusieurs allers-retours et une logique de coordination externe complexe. Desormais, un unique appel suffit pour que Gemini planifie, execute et synthetise des informations issues de sources heterogenes en une seule chaine de raisonnement. Pour les applications metier, assistants de voyage, outils de veille concurrentielle, agents de support client, cela reduit la latence, simplifie l'architecture et rend les systemes multi-outils beaucoup plus accessibles aux equipes de taille modeste. L'introduction des identifiants de reponse paralleles resout par ailleurs un probleme concret de fiabilite : quand plusieurs fonctions sont appelees simultanement, il etait auparavant difficile de garantir que chaque reponse correspondait bien a la bonne requete. Ces annonces s'inscrivent dans une competition intense entre Google, OpenAI et Anthropic pour imposer leur API comme la couche d'orchestration de reference pour les agents IA. OpenAI avait deja introduit le "parallel function calling" dans GPT-4 en 2023, et Anthropic a renforce les capacites d'outils de Claude tout au long de 2025. Google repond avec une integration native de son ecosysteme, Search et Maps etant des atouts considerables qu'aucun concurrent ne peut repliquer a l'identique. La prochaine etape probable est une extension de ce modele a d'autres services Google (Gmail, Calendar, Drive), transformant Gemini en un agent capable d'agir directement dans l'infrastructure numerique quotidienne des entreprises. La question qui demeure est celle du controle et de la transparence : a mesure que les chaines agentiques se complexifient, auditer ce qu'un modele a reellement fait, et pourquoi, devient un enjeu critique pour la confiance des utilisateurs professionnels.

OutilsOutil
1 source
Comment deployer Open WebUI avec integration securisee de l'API OpenAI, tunnel public et acces au chat depuis le navigateur
738MarkTechPost 

Comment deployer Open WebUI avec integration securisee de l'API OpenAI, tunnel public et acces au chat depuis le navigateur

Un tutoriel publié récemment détaille comment déployer Open WebUI dans Google Colab, l'environnement de notebooks Python hébergé par Google, en le connectant à l'API officielle d'OpenAI pour obtenir une interface de chat accessible directement depuis un navigateur. La procédure repose entièrement sur Python et couvre l'installation des dépendances via pip, la configuration sécurisée de la clé API OpenAI par saisie terminal (via getpass, pour éviter que les identifiants n'apparaissent en clair dans le notebook), la définition des variables d'environnement nécessaires, le lancement du serveur Open WebUI sur le port 8080, et la création d'un tunnel public via l'outil Cloudflared de Cloudflare. Ce tunnel génère une URL partageable qui permet d'accéder à l'interface depuis n'importe quel navigateur, même en dehors de Colab. Le modèle par défaut configuré dans l'exemple est gpt-4o-mini, mais l'utilisateur peut en choisir un autre au démarrage. Un répertoire de données dédié est créé dans /content/open-webui-data pour stocker les données d'exécution, et une clé secrète aléatoire est générée automatiquement pour sécuriser l'interface web. Ce type de déploiement intéresse principalement les développeurs, chercheurs et équipes techniques qui souhaitent expérimenter Open WebUI sans disposer d'un serveur dédié ni passer par une installation locale complexe. Colab offre une machine virtuelle gratuite (ou quasi-gratuite) avec accès réseau, ce qui en fait un terrain de test rapide pour des outils comme Open WebUI qui nécessitent normalement un environnement serveur. La capacité à exposer le service via un tunnel Cloudflare résout le problème classique d'accessibilité des services locaux dans Colab, rendant l'interface partageable en quelques minutes. Pour les équipes qui évaluent des alternatives à ChatGPT ou qui veulent tester Open WebUI avant un déploiement en production, cette approche réduit drastiquement la friction d'entrée. Open WebUI est une interface web open source conçue pour interagir avec des modèles de langage, qu'ils soient hébergés localement via Ollama ou accessibles via des API tierces comme celle d'OpenAI. Le projet a gagné en popularité depuis 2023 comme alternative auto-hébergeable aux interfaces propriétaires, avec des fonctionnalités comme la gestion de conversations, le support multi-modèles et la personnalisation des prompts système. Cloudflare Tunnel, l'outil utilisé ici pour l'exposition publique, est un service qui crée des connexions sécurisées sortantes sans nécessiter d'ouverture de ports ni de configuration réseau avancée. La combinaison de ces deux outils dans Colab reflète une tendance plus large : rendre les infrastructures IA accessibles à des non-ops, en abaissant les prérequis techniques pour expérimenter des stacks qui étaient jusqu'ici réservées aux équipes disposant de leurs propres serveurs.

OutilsTuto
1 source
Amazon Bedrock Projects : gérer les coûts de l'IA
739AWS ML Blog 

Amazon Bedrock Projects : gérer les coûts de l'IA

Amazon a lancé une nouvelle fonctionnalité appelée Amazon Bedrock Projects, qui permet aux équipes techniques d'attribuer précisément les coûts d'inférence IA à des charges de travail spécifiques. Concrètement, chaque "projet" dans Bedrock constitue une frontière logique représentant une application, un environnement ou une expérimentation. Les développeurs associent des tags de ressources à ces projets et transmettent un identifiant de projet dans leurs appels API. Ces données remontent ensuite dans AWS Cost Explorer et AWS Data Exports, les outils de suivi financier d'Amazon Web Services, permettant de filtrer, regrouper et analyser les dépenses par dimension métier : application, équipe, environnement ou centre de coûts. La fonctionnalité est compatible avec les API OpenAI (Responses API et Chat Completions API), ce qui facilite l'intégration pour les équipes déjà habituées à ces standards. Les requêtes envoyées sans identifiant de projet sont automatiquement rattachées à un projet par défaut dans le compte AWS concerné. L'enjeu est direct pour les grandes organisations qui font tourner plusieurs applications IA en parallèle : sans attribution précise, impossible de savoir quelle équipe consomme quoi, ni d'effectuer des refacturations internes (chargebacks) ou d'investiguer des pics de dépenses inexpliqués. Bedrock Projects répond à ce besoin en donnant une visibilité granulaire sur la facture IA, département par département. Une équipe "CustomerExperience" peut ainsi être distinguée d'une équipe "DataScience", chacune avec son propre centre de coûts. Cela permet également de guider les décisions d'optimisation : identifier quels workloads sont disproportionnément coûteux par rapport à leur valeur métier, et agir en conséquence. Cette annonce s'inscrit dans une tendance plus large de maturité de la FinOps appliquée à l'IA. À mesure que les déploiements LLM passent du stade expérimental à la production à grande échelle, la gestion financière devient un enjeu stratégique autant que technique. AWS rejoint ainsi des préoccupations déjà bien présentes chez les DSI et les directeurs financiers, qui voient les budgets cloud IA gonfler rapidement sans toujours disposer des outils pour les piloter. La stratégie de tags recommandée par Amazon -- Application, Environment, Team, CostCenter -- reflète les pratiques standard de gouvernance cloud, mais appliquées désormais spécifiquement à la couche inférence. Les prochaines étapes logiques pourraient inclure des alertes budgétaires par projet ou des quotas d'utilisation, des mécanismes déjà existants dans AWS pour d'autres services et qui manquent encore à Bedrock Projects dans sa forme actuelle.

UELes organisations européennes utilisant AWS Bedrock peuvent désormais mieux contrôler et attribuer leurs coûts d'inférence IA, un enjeu croissant pour les DSI soumis à des contraintes budgétaires strictes.

OutilsActu
1 source
1 milliard de tokens par jour, 1M lignes de code, 0% de code humain : l'ingénierie extrême d'OpenAI
740Latent Space 

1 milliard de tokens par jour, 1M lignes de code, 0% de code humain : l'ingénierie extrême d'OpenAI

Ryan Lopopolo, ingénieur chez OpenAI au sein de l'équipe Frontier, a publié un essai remarqué sur ce qu'il appelle le "harness engineering", une approche radicale du développement logiciel entièrement délégué à des agents IA. Sur une période de cinq mois, son équipe a construit et livré un produit interne en bêta sans écrire une seule ligne de code manuellement : plus d'un million de lignes dans le dépôt, des milliers de pull requests générées par Codex, zéro code écrit par un humain, et surtout zéro relecture humaine avant les merges. Le projet a également abouti à Symphony, une bibliothèque de référence en Elixir conçue par Alex Kotliarskyi, qui orchestre un réseau massif d'agents Codex travaillant en parallèle avec des spécifications détaillées mais sans implémentation prédéfinie. Lopopolo affirme qu'il serait presque "négligent" de ne pas consommer plus d'un milliard de tokens par jour, ce qui représente environ 2 000 à 3 000 dollars de dépenses quotidiennes aux tarifs actuels. Ce qui rend cette expérience significative, c'est le changement de paradigme qu'elle illustre : le vrai goulot d'étranglement dans le développement logiciel piloté par l'IA n'est plus la puissance de calcul ni la qualité du modèle, mais l'attention humaine. Quand un agent échouait, l'équipe ne l'encourageait pas à "réessayer", elle se demandait quelle capacité, quel contexte ou quelle structure manquait au système. Résultat : les humains ont progressivement cessé de relire du code pour se concentrer sur la construction de l'infrastructure d'observabilité, des specs, des tests et des scores de qualité qui permettent aux agents de réviser, corriger et fusionner leur propre travail. La boucle de compilation a été optimisée pour rester sous la minute, condition indispensable pour maintenir les agents productifs. OpenAI positionne Codex comme bien plus qu'un simple assistant de code : la messagerie interne de l'entreprise, illustrée par leur campagne Super Bowl ("you can just build things"), signale une ambition claire de faire des agents de vrais coéquipiers autonomes plutôt que des copilotes. Lopopolo vient d'une trajectoire entre Snowflake, Brex, Stripe et Citadel, et travaille désormais sur le déploiement sûr d'agents à l'échelle entreprise. L'équipe Frontier représente un laboratoire vivant pour tester ce futur : un modèle d'organisation où le code est écrit pour le modèle autant que pour l'ingénieur, où les compétences, la documentation et les trackers Markdown deviennent des vecteurs pour encoder le "goût" technique directement dans le contexte de l'agent. Le harness engineering pourrait bien redéfinir ce que signifie être ingénieur logiciel dans les années à venir.

UELes équipes d'ingénierie européennes pourraient être amenées à repenser leurs pratiques de développement logiciel si l'approche 'harness engineering' se démocratise au-delà d'OpenAI.

OutilsOutil
1 source
Amazon Nova 2 Sonic : créer des podcasts conversationnels en temps réel
741AWS ML Blog 

Amazon Nova 2 Sonic : créer des podcasts conversationnels en temps réel

Amazon a lancé Nova Sonic 2, un modèle de compréhension et de génération vocale intégré à sa plateforme Bedrock, capable de produire des conversations audio naturelles en temps réel avec une latence très faible. Le modèle prend en charge sept langues dont le français, l'allemand, l'espagnol et l'hindi, et dispose d'une fenêtre de contexte pouvant atteindre un million de tokens. Nova Sonic 2 offre une API de streaming pour les conversations multi-tours, avec des capacités d'instruction complexe, d'appel d'outils externes et de bascule fluide entre voix et texte. Amazon illustre ses usages avec un générateur de podcasts automatisé : deux hôtes IA conversent en temps réel sur n'importe quel sujet, sans intervention humaine, depuis la recherche jusqu'à la diffusion audio finale. L'enjeu est direct pour les créateurs de contenu et les organisations médias. Produire un podcast traditionnel mobilise studio, matériel, talents vocaux, montage et coordination de planning, des contraintes qui limitent la cadence de publication et le volume de sujets couverts. Nova Sonic 2 supprime la plupart de ces frictions : pas de conflits d'agenda, pas d'irrégularités liées à la disponibilité humaine, et une personnalisation potentielle en temps réel selon le profil de l'auditeur. Pour les entreprises qui cherchent à déployer du contenu audio à grande échelle, formation interne, support client vocal, newsletters audio, le rapport coût-performance revendiqué par Amazon représente un changement structurel dans l'économie de la production audio. Le marché du podcast a connu une croissance explosive ces dernières années, porté par son avantage d'accessibilité unique : il se consomme en faisant autre chose, là où le contenu visuel exige l'attention totale. Plusieurs acteurs technologiques cherchent à capter cette dynamique avec de l'IA générative vocale. OpenAI avec ses voix dans ChatGPT, Google avec NotebookLM Audio Overviews, qui génère déjà des podcasts synthétiques à partir de documents, et ElevenLabs avec ses outils de clonage vocal se positionnent sur ce segment. Amazon entre dans la compétition avec l'avantage de l'intégration native à Bedrock, ses Guardrails de sécurité, ses Agents et ses bases de connaissances, ce qui facilite l'adoption en entreprise. La prochaine étape logique sera la personnalisation dynamique du contenu par auditeur, un terrain encore peu défriché mais que Nova Sonic 2, avec sa fenêtre de contexte d'un million de tokens, semble techniquement en mesure d'adresser.

UELe support natif du français et l'intégration à AWS Bedrock facilitent l'adoption par les médias et entreprises européennes souhaitant automatiser leur production audio.

OutilsOpinion
1 source
Les modeles se standardisent : l'avantage concurrentiel en IA se deplace vers les donnees maitrisees et leurs plateformes
742VentureBeat AI 

Les modeles se standardisent : l'avantage concurrentiel en IA se deplace vers les donnees maitrisees et leurs plateformes

Alors que les grands modèles de langage atteignent un niveau de performance comparable entre eux, l'avantage concurrentiel dans l'IA d'entreprise se déplace vers la donnée et les plateformes qui la gouvernent. C'est le constat que dresse Box, spécialiste de la gestion de contenu cloud, dans une analyse publiée début avril 2026. Selon Yash Bhavnani, responsable IA chez Box, "ce n'est plus ce que fait le modèle qui compte, c'est la donnée non structurée de l'entreprise elle-même : ses contrats, ses dossiers clients, ses spécifications produits, la façon dont tout cela est organisé, gouverné et rendu accessible à l'IA." Ben Kus, directeur technique de Box, va plus loin : "Les organisations qui domineront en IA sont celles qui auront construit l'infrastructure de gouvernance pour rendre n'importe quel modèle fiable, avec les bons droits d'accès, le bon contenu accessible et une piste d'audit claire pour chaque action." L'enjeu est immédiat et concret. Quand des employés utilisent des modèles frontières pour résumer des documents ou rédiger des rapports sans connexion à un système de référence interne contrôlé, les résultats deviennent impossibles à auditer et potentiellement dangereux. Bhavnani cite l'exemple d'un assureur qui utilise l'IA pour analyser des sinistres : une faible précision ou une sortie non traçable est tout simplement inacceptable. Plus grave encore, Box rapporte que des clients constatent que leurs employés téléchargent des documents sensibles sur des comptes personnels pour y lancer leurs propres workflows IA, sans aucune visibilité côté entreprise. Ce contournement génère des doublons, des silos de connaissance fantômes et des risques de conformité réels dans des secteurs soumis à HIPAA, FedRAMP High ou SOC 2. La montée en puissance des agents IA autonomes, capables d'exécuter des tâches multi-étapes sur des documents et des systèmes entiers sans intervention humaine, rend la question encore plus critique. Ces agents agissent plus vite que les humains et manquent souvent du jugement contextuel nécessaire pour distinguer les données auxquelles ils sont autorisés à accéder. Kus est catégorique : "Une plateforme IA sans gestion des permissions est trop dangereuse à déployer." Box positionne ainsi ses plateformes de contenu non plus comme de simples dépôts de fichiers, mais comme des couches d'orchestration, des "AI control planes" intercalés entre les modèles, les agents et les données d'entreprise. Cette évolution reflète un virage structurel dans l'industrie : la prochaine bataille de l'IA d'entreprise ne se jouera pas sur les benchmarks des modèles, mais sur la capacité des éditeurs de logiciels à offrir une gouvernance des données robuste, traçable et intégrée nativement à chaque flux de travail.

UELa problématique de gouvernance des données IA est directement applicable aux entreprises européennes soumises au RGPD, qui impose traçabilité et contrôle des accès sur les données personnelles traitées par des systèmes automatisés.

OutilsActu
1 source
Google Vids monte en puissance : les modèles IA les plus récents pour créer une vidéo en un clic
743Siècle Digital 

Google Vids monte en puissance : les modèles IA les plus récents pour créer une vidéo en un clic

Google a annoncé une mise à jour majeure de Google Vids, son outil de création vidéo intégré à Google Workspace, en déployant ses modèles d'intelligence artificielle les plus récents. La plateforme intègre désormais Veo 3.1, capable de générer des clips vidéo en 720p à partir d'une simple description textuelle. L'outil propose également la composition musicale automatique, la personnalisation d'avatars animés, la capture d'écran intégrée et une création de bout en bout à partir d'une idée initiale. Pour les entreprises et les équipes qui produisent du contenu régulièrement, cette mise à jour réduit considérablement le temps et les compétences techniques nécessaires à la production vidéo. Là où il fallait auparavant un outil de montage, des assets sonores et un opérateur formé, Google Vids promet de compresser ce workflow en quelques clics. La cible est clairement professionnelle : présentations internes, formations, communications corporate, ou contenus marketing légers, sans passer par une agence ou un logiciel spécialisé. Google positionne Vids comme le pendant vidéo de Google Slides dans l'écosystème Workspace, capitalisant sur sa base d'utilisateurs enterprise déjà captive. La montée en puissance de Veo, son modèle vidéo génératif, s'inscrit dans une compétition directe avec Sora d'OpenAI et Runway. En intégrant ces capacités directement dans Workspace plutôt qu'en produit autonome, Google mise sur l'effet d'adoption naturelle, là où ses concurrents doivent convaincre les utilisateurs de changer d'outil. La question reste de savoir si la qualité des rendus sera suffisante pour des usages professionnels exigeants.

UEGoogle Workspace étant massivement déployé dans les entreprises françaises et européennes, cette mise à jour impacte directement les équipes qui produisent du contenu vidéo dans cet écosystème.

OutilsOutil
1 source
Google lance une application pour utiliser son IA en local sur iPhone et Android
744Numerama 

Google lance une application pour utiliser son IA en local sur iPhone et Android

Google a lancé AI Edge Gallery, une nouvelle application disponible sur iPhone et Android permettant de faire tourner des modèles d'intelligence artificielle directement sur l'appareil, sans connexion réseau. L'application s'appuie sur les modèles Gemma 4, la dernière génération de modèles open source légers de Google, conçus pour fonctionner sur des terminaux mobiles aux ressources limitées. Elle propose plusieurs expériences interactives exploitant ces capacités d'inférence locale. Cette initiative marque une étape concrète dans la course à l'IA embarquée sur smartphone. Faire tourner un modèle de langage en local élimine la latence réseau, préserve la confidentialité des données et permet une utilisation hors connexion, trois avantages majeurs pour les utilisateurs mobiles. Pour Google, c'est aussi un moyen de tester l'adoption de Gemma 4 auprès du grand public et de démontrer que ses modèles open source sont compétitifs sur des appareils du quotidien, face à des concurrents comme Apple Intelligence ou les solutions embarquées de Meta. Google s'inscrit ici dans une tendance de fond : après avoir imposé Gemini comme assistant par défaut sur Android, l'entreprise cherche à étendre sa présence sur iOS tout en investissant dans l'IA on-device. Gemma 4, présenté récemment, est précisément optimisé pour ce type de déploiement. AI Edge Gallery fonctionne pour l'instant comme un terrain d'expérimentation ouvert, ce qui laisse supposer qu'une intégration plus profonde dans les produits Google grand public pourrait suivre selon les retours des utilisateurs.

UEL'inférence locale préserve les données sur l'appareil, un avantage concret pour les utilisateurs européens soumis au RGPD, sans transfert vers des serveurs tiers.

OutilsOutil
1 source
Pas de Claude pour Claws
745Ben's Bites 

Pas de Claude pour Claws

Anthropic a décidé de couper l'accès à Claude via abonnement Claude Code pour les outils tiers comme OpenClaw, le harness alternatif populaire dans la communauté des développeurs. Concrètement, les utilisateurs qui accédaient à Claude depuis OpenClaw grâce à leur abonnement mensuel ne peuvent plus le faire : ils doivent désormais passer à une facturation à l'usage ou fournir leur propre clé API. Pour atténuer l'impact, Anthropic a offert un crédit unique équivalent à un mois d'abonnement. La décision intervient alors qu'Anthropic surveille de près la consommation de calcul générée par ces usages agentiques via des harnesses tiers, qui s'avère particulièrement gourmande. Parallèlement, Google a publié Gemma 4, une famille de quatre nouveaux modèles open-weights : deux variantes puissantes destinées aux ordinateurs de bureau et portables performants (26B MoE et 31B dense), et deux modèles ultra-légers pour mobile (2B et 4B), particulièrement pertinents pour les entreprises souhaitant les affiner sur leurs propres données. Du côté financier, Anthropic a vu son chiffre d'affaires annualisé atteindre 30 milliards de dollars, contre 9 milliards fin 2025, avec 6 milliards d'ARR ajoutés en février 2026 seulement. Cette restriction d'Anthropic n'est pas anodine : elle révèle une stratégie claire de réorientation des utilisateurs vers les outils propriétaires de l'entreprise -- Dispatch, tâches planifiées, projets, et computer use -- qui recoupent directement les fonctionnalités qu'OpenClaw proposait. Pour la communauté des développeurs, c'est une source de confusion majeure : beaucoup ne savent plus précisément dans quels contextes leur abonnement Claude Code reste utilisable hors du harness officiel. Le fondateur d'OpenClaw, Peter, ne compte pas abandonner pour autant et travaille à intégrer GPT-5.4 dans son outil pour offrir des performances comparables à Opus, profitant du rachat d'OpenClaw par OpenAI. Dans un contexte plus large, plusieurs signaux marquent une accélération de la structuration de l'écosystème IA. OpenAI a racheté TBPN, un podcast influent auprès des professionnels du secteur, un mouvement dont la logique commerciale reste débattue : le podcast est rentable, en croissance, et dispose d'une audience fidèle, ce qui rend l'intérêt mutuel de l'acquisition peu évident selon certains analystes. Sur le plan des outils de développement, Cursor a lancé une version 3 avec une fenêtre autonome dédiée à l'exécution d'agents, incluant des fonctionnalités de transition local-vers-cloud et de travail multi-projets. Enfin, Andrej Karpathy a partagé une approche inédite des bases de connaissances pour agents, organisée thématiquement avec résumés, rétroliens et wikis -- une piste qui intéresse de nombreux développeurs cherchant à structurer la mémoire de leurs systèmes agentiques.

UELes développeurs européens utilisant Claude via des harnesses tiers comme OpenClaw doivent migrer vers une clé API personnelle ou une facturation à l'usage, et peuvent envisager Gemma 4 comme alternative open-weights pour leurs usages agentiques.

OutilsActu
1 source
Block lance Managerbot, un agent Square proactif et la preuve la plus convaincante du pari IA de Jack Dorsey
746VentureBeat AI 

Block lance Managerbot, un agent Square proactif et la preuve la plus convaincante du pari IA de Jack Dorsey

Block a dévoilé le 7 avril 2026 Managerbot, un agent IA intégré à sa plateforme Square et destiné aux petits commerçants. Contrairement au précédent assistant Square AI, qui répondait passivement aux questions des vendeurs, Managerbot surveille en continu l'activité d'un commerce, détecte les problèmes émergents et propose des actions concrètes sans attendre qu'on lui pose de questions. Le produit est en cours de déploiement progressif, avec une disponibilité complète pour l'ensemble des utilisateurs Square prévue dans les prochains mois. Block n'a pas précisé si Managerbot serait facturé séparément ou inclus dans les abonnements existants. L'agent repose sur des modèles frontier d'Anthropic (Claude Sonnet) et d'OpenAI (famille GPT), combinés à un cadre technique propriétaire baptisé "agent harness", lui-même construit sur Goose, le framework open-source de Block. Managerbot intervient aujourd'hui dans trois domaines clés : la gestion des stocks, la planification des équipes et la création de campagnes marketing. Pour les stocks, l'agent croise les niveaux d'inventaire, la vitesse de vente et des signaux externes comme la météo ou les événements locaux afin d'anticiper les ruptures et d'optimiser les achats. Pour les plannings, il analyse les prévisions de ventes et génère automatiquement des grilles horaires qui équilibrent les préférences des employés et les besoins de couverture -- une tâche que Willem Avé, responsable produit de Square chez Block, qualifie de "problème informatique difficile" qui peut mobiliser plusieurs heures par semaine chez un dirigeant de PME. En marketing, Managerbot identifie les tendances de ventes et rédige des campagnes de reconquête ou des promotions ciblées sur les meilleurs segments de clientèle. Block indique observer "une amélioration très significative" des résultats de ces campagnes par rapport à ce que créent certains vendeurs manuellement, sans publier de chiffres précis. Cette annonce s'inscrit dans le pari stratégique assumé par Jack Dorsey, PDG de Block, selon lequel l'IA peut transformer en profondeur la façon dont son entreprise opère et sert les millions de petits commerces qui dépendent de Square au quotidien. La transition du réactif au proactif représente un changement de paradigme majeur pour les outils de gestion destinés aux TPE et PME, qui disposent rarement des ressources humaines pour analyser en continu leurs données opérationnelles. Block mise sur son "agent harness" et sur l'expérience acquise via Money Bot, son agent financier dans Cash App, pour se différencier face aux modèles tiers qu'elle exploite. L'enjeu est de taille : Square équipe des centaines d'outils différents -- facturation, stocks, paie, marketing, planification -- et Managerbot doit naviguer dans cet ensemble de façon cohérente au sein d'une boucle agentique unifiée, ce qui constitue le véritable défi technique derrière la promesse commerciale.

UELes petits commerçants français et européens utilisant Square pourraient bénéficier d'un agent proactif de gestion des stocks, plannings et marketing, mais le calendrier de déploiement en Europe n'est pas précisé.

OutilsOutil
1 source
Boomi appelle cela l'activation des données et affirme qu'il s'agit du maillon manquant dans tout déploiement d'IA
747AI News 

Boomi appelle cela l'activation des données et affirme qu'il s'agit du maillon manquant dans tout déploiement d'IA

En 2026, le principal obstacle au déploiement de l'intelligence artificielle en entreprise n'est pas la qualité des modèles ni leur capacité à raisonner : c'est la fragmentation des données. C'est le constat que tire Boomi, spécialiste de l'intégration de données, après avoir analysé 75 000 agents IA en production chez ses clients. La société, qui revendique plus de 30 000 clients dans le monde dont plus d'un quart du Fortune 500, a présenté le 9 mars 2026 une mise à jour majeure de sa plateforme centrée sur ce qu'elle appelle l'"activation des données" pour l'IA agentique. Steve Lucas, PDG de Boomi, résume la position de l'entreprise : "L'IA ne crée de valeur que lorsque les données sont correctement activées, fiables et gouvernées au préalable." Pour répondre à ce problème, Boomi a lancé Meta Hub, un référentiel central conçu pour standardiser les définitions métier à travers l'entreprise et fournir un contexte cohérent à chaque agent IA. La mise à jour inclut également une extraction en temps réel des données SAP via la capture de données en continu, ainsi que de nouvelles fonctionnalités de gouvernance pour les agents Snowflake Cortex, avec journaux d'audit et traces de session intégrés dans l'Agent Control Tower de Boomi. L'enjeu est considérable pour les grandes organisations. Un agent IA qui croise des données clients issues d'un CRM avec des données tarifaires issues d'un ERP peut se retrouver à travailler à partir de définitions contradictoires d'un même concept, qu'il s'agisse d'un client ou d'un produit. Les résultats qu'il produit ne sont cohérents que si les standards de données sous-jacents le sont aussi. C'est précisément ce vide que Boomi cherche à combler : permettre aux agents de raisonner à partir d'une compréhension unifiée de la logique métier, plutôt que de synthétiser des interprétations disparates tirées de systèmes cloisonnés. La question de la gouvernance prend également de l'importance, les entreprises réclamant de plus en plus de visibilité sur les actions prises par leurs agents IA, jusqu'ici trop souvent opaques. Ce positionnement reçoit une validation externe significative. Le 16 mars, Gartner a classé Boomi parmi les Leaders de son Magic Quadrant 2026 pour les plateformes d'intégration en tant que service, pour la douzième année consécutive, en le plaçant en tête sur la capacité d'exécution. Le 31 mars, l'IDC MarketScape sur la gestion des API à l'échelle mondiale lui a accordé le même rang, soulignant sa stratégie centrée sur l'IA. Gartner note explicitement que "l'intégration prête pour l'IA" est désormais un critère d'évaluation stratégique à part entière, ce qui marque un tournant : les plateformes iPaaS ne sont plus jugées uniquement sur leurs capacités d'intégration traditionnelles, mais sur leur aptitude à rendre les agents IA fiables dans des processus métier réels. Le passage du pilote à la production reste bloqué pour beaucoup d'organisations non pas faute de modèles, mais faute d'infrastructure de données à la hauteur.

UELes entreprises européennes clientes de Boomi pourraient bénéficier de ces nouvelles capacités d'activation des données pour leurs déploiements d'agents IA, sans impact réglementaire ou stratégique spécifique à la France ou à l'UE.

OutilsActu
1 source
ChatGPT, Gemini, Claude… Pika donne un visage (et une voix) à toutes vos IA !
748Le Big Data 

ChatGPT, Gemini, Claude… Pika donne un visage (et une voix) à toutes vos IA !

Pika Labs a lancé le 2 avril 2026 PikaStream 1.0, un modèle temps réel qui transforme n'importe quel agent IA -- ChatGPT, Claude, Gemini ou autre -- en interlocuteur visible et vocal dans une visioconférence. Concrètement, l'outil permet à un agent IA de rejoindre une réunion Google Meet sous forme d'avatar animé, avec une voix clonée en quelques secondes d'enregistrement. Le tarif annoncé est de 0,20 dollar la minute d'utilisation. Le module principal, pikastream-video-meeting, est distribué en open source sur GitHub dans le cadre d'une initiative plus large baptisée Pika Skills, un ensemble de briques modulaires destinées à étendre les capacités des agents IA. L'intégration ne requiert pas de configuration complexe : il suffit de partager un lien de réunion pour que l'agent prenne le relais. Ce que PikaStream change fondamentalement, c'est le passage de l'IA textuelle à l'IA incarnée. Jusqu'ici, interagir avec un modèle comme Claude ou Gemini restait confiné à une interface de chat, parfois augmentée de la voix, mais sans présence visuelle. PikaStream franchit ce cap en dotant l'agent d'un avatar cohérent avec l'identité de l'utilisateur ou de son entreprise, d'une voix personnalisée et d'une mémoire persistante des échanges passés. L'agent sait avec qui il travaille, ce qui a déjà été discuté, et maintient une personnalité stable d'une réunion à l'autre. Il peut aussi agir en direct pendant l'appel -- chercher un document, rédiger un compte rendu, mettre à jour un outil de gestion de projet ou envoyer un e-mail -- sans interrompre la conversation. Pour les équipes distribuées, cela ouvre la possibilité de déléguer les réunions de routine à un agent, réduisant la fatigue liée aux appels vidéo répétitifs. La sortie de PikaStream s'inscrit dans une course plus large entre les acteurs de l'IA à rendre leurs modèles physiquement présents dans les workflows professionnels. Des projets comme Microsoft Copilot ou les agents vocaux d'OpenAI explorent des territoires proches, mais PikaStream se distingue par son approche ouverte et son interopérabilité explicite avec les agents existants, quelle que soit leur origine. Le choix de l'open source est stratégique : en laissant les développeurs adapter et enrichir le module, Pika Labs mise sur une adoption rapide dans les environnements techniques, là où les solutions fermées butent souvent sur des résistances d'intégration. Les questions éthiques restent cependant ouvertes -- cloner une voix et un visage pour qu'une IA parle en votre nom en réunion soulève des enjeux de consentement, d'authenticité et de responsabilité qui n'ont pas encore de réponse réglementaire claire. La prochaine étape probable sera l'intégration avec d'autres plateformes de visioconférence comme Zoom ou Microsoft Teams.

UELa technologie de clonage vocal et d'avatar IA soulève des enjeux de consentement et d'authenticité non encadrés par l'AI Act européen, dont les dispositions sur les systèmes d'identification biométrique pourraient s'appliquer à ce type d'usage professionnel.

OutilsOutil
1 source
SEO et GEO, stratégies de visibilité à l’ère des moteurs de recherche génératifs
749Le Big Data 

SEO et GEO, stratégies de visibilité à l’ère des moteurs de recherche génératifs

Plus d'un Français sur deux utilise désormais des outils d'IA dans ses usages numériques, et cette adoption massive reconfigure en profondeur les stratégies de visibilité en ligne. Tristan de La Chevasnerie, fondateur de l'Agence Pierrot et spécialiste du référencement web, documente cette transition du SEO traditionnel vers le GEO, le Generative Engine Optimization. L'enjeu est considérable : en 2025, 25 % de la population mondiale utilise régulièrement ChatGPT, et les utilisateurs n'y naviguent plus entre des liens, ils attendent une réponse directement formulée. Dans ce nouveau schéma, c'est l'algorithme qui sélectionne les sources en amont, avant même que l'internaute ne formule une intention d'achat ou de comparaison. La bonne nouvelle pour les entreprises déjà actives en SEO est que les fondations restent les mêmes : un bon positionnement sur Google augmente significativement les chances d'être cité par les moteurs génératifs. La différence tient dans les détails d'exécution. En termes de stratégie onsite, les IA consultent en priorité les encarts de résumé placés en début de page pour saisir l'essence d'un texte : les contenus doivent être structurés, sourcés et fiables. Côté offsite, la multiplication des citations dans des médias tiers devient déterminante, car les IA croisent de nombreuses sources pour valider la légitimité d'une information. Surtout, publier des textes produits à 100 % par une IA constitue une erreur stratégique majeure : une IA ne fait que synthétiser ce qui existe déjà sur le web, produisant un contenu redondant et potentiellement invisible pour les algorithmes de citation. Le contenu qui émerge est celui qui comble un "content gap", c'est-à-dire qui apporte des informations absentes des autres sources, des données chiffrées, des témoignages d'experts, une valeur ajoutée irréductible. Ce basculement s'inscrit dans une transformation plus large de l'écosystème de l'information en ligne. L'arrivée imminente des AI Overviews de Google, qui affichent une réponse générée avant les résultats classiques, va encore accentuer ce phénomène : le clic vers le site web devient secondaire par rapport au fait d'être cité directement dans la réponse du moteur. Pour les marques, cela implique de repenser leur production éditoriale comme un travail hybride, où l'IA assure l'exhaustivité du sujet tandis que l'intervention humaine apporte la pertinence, les sources et l'originalité. Les acteurs qui maîtriseront ce dosage, et qui sauront structurer leurs contenus pour les machines tout en les rendant utiles aux humains, disposeront d'un avantage concurrentiel décisif dans un paysage numérique en train de se réorganiser autour de la réponse plutôt que du lien.

UELes entreprises françaises doivent repenser leurs stratégies éditoriales et de référencement pour s'adapter au GEO, sous peine de perdre leur visibilité face à l'essor des réponses génératives de Google et ChatGPT.

OutilsOutil
1 source
Slack unifié chez Salesforce : nouvelle interface pour les agents IA
750Le Big Data 

Slack unifié chez Salesforce : nouvelle interface pour les agents IA

Salesforce a annoncé une refonte majeure de Slack pour en faire l'interface centrale de pilotage des agents IA en entreprise. L'éditeur américain positionne désormais sa plateforme de messagerie collaborative comme un point d'entrée unique capable de réunir conversations, données et automatisations dans un seul espace. Au coeur de cette évolution, Slackbot change de dimension : l'assistant ne se limite plus à répondre à des requêtes simples mais intervient directement dans les flux de travail, s'appuyant sur les conversations, fichiers et historiques disponibles. Il peut rédiger, analyser ou générer du code, et apprend progressivement les habitudes de chaque utilisateur pour adapter ses réponses. Parker Harris, cofondateur de Salesforce, résume l'ambition : Slack devient selon lui "le système d'exploitation du travail", capable de relier collaborateurs, données et applications dans une interface conversationnelle unifiée. Grâce au protocole MCP, Slackbot peut également mobiliser différents agents ou applications tierces sans que l'utilisateur ait à naviguer entre plusieurs outils. L'impact concret se mesure déjà chez les premières entreprises adoptantes. Des sociétés comme Anthropic ou reMarkable rapportent des gains de temps significatifs, certains utilisateurs évoquant jusqu'à 90 minutes économisées par jour. La gestion des réunions illustre bien ces gains : Slackbot peut transcrire les échanges, produire une synthèse et déclencher automatiquement les actions nécessaires dès la fin d'une conversation, les informations étant directement injectées dans les outils internes. L'introduction de "compétences IA réutilisables" va plus loin encore : les équipes définissent une tâche précise avec ses règles et son format, et Slackbot l'identifie puis l'applique automatiquement lors des occurrences suivantes, sans intervention humaine. L'intégration poussée avec l'écosystème Salesforce permet par ailleurs de gérer des opportunités commerciales, suivre des clients ou déclencher des processus métier directement depuis une conversation. Cette transformation s'inscrit dans une tendance de fond qui traverse tout le secteur technologique : la course à l'agent IA universel, capable d'orchestrer des actions complexes à partir d'une simple instruction en langage naturel. Salesforce, qui avait racheté Slack en 2021 pour 27,7 milliards de dollars, cherche à rentabiliser cet investissement en faisant de la plateforme le liant de son vaste écosystème CRM et d'automatisation. La concurrence est directe avec Microsoft, qui intègre Copilot dans Teams selon une logique similaire, et avec des acteurs comme Notion ou Linear qui misent eux aussi sur l'IA conversationnelle pour centraliser les opérations. L'enjeu pour Salesforce est de transformer Slack d'un simple outil de messagerie en colonne vertébrale opérationnelle des entreprises, au moment où la multiplication des outils SaaS crée une fragmentation croissante que les organisations cherchent à résorber.

UELes entreprises européennes utilisant l'écosystème Salesforce devront évaluer cette refonte de Slack dans leur stratégie d'automatisation et d'intégration des agents IA.

OutilsOutil
1 source