Aller au contenu principal

Outils — page 12

1361 articles · page 12 sur 28

Les meilleurs outils IA : applications, produits et services propulsés par l'intelligence artificielle.

Clutch dévoile la première app marketplace B2B sur ChatGPT
551Le Big Data OutilsOutil

Clutch dévoile la première app marketplace B2B sur ChatGPT

Clutch, plateforme américaine de référencement de prestataires B2B utilisée chaque année par des millions d'acheteurs, a lancé la première application marketplace de services professionnels intégrée directement à ChatGPT. Concrètement, un acheteur qui interroge le chatbot d'OpenAI sur les « meilleures agences marketing pour SaaS » ou souhaite « comparer des prestataires web selon la satisfaction client » obtient désormais une réponse structurée tirée de la base de données Clutch : profils qualifiés, avis clients authentiques, indicateurs de prix et éléments de différenciation. L'annonce a été diffusée via Business Wire et positionne Clutch comme le premier acteur à transformer ChatGPT en canal de sourcing B2B opérationnel. L'enjeu est considérable parce que le parcours d'achat professionnel se déplace rapidement des moteurs de recherche classiques vers les interfaces conversationnelles pilotées par l'IA. Plutôt que de naviguer entre plusieurs sites, de comparer manuellement des prestataires et de recouper des informations parfois contradictoires, les décideurs formulent désormais leurs besoins directement dans ChatGPT et attendent une réponse immédiatement exploitable. En injectant des données propriétaires vérifiées dans ce flux, Clutch répond à une limite structurelle des modèles génératifs : leur tendance à produire des réponses plausibles mais pas toujours exactes, construites à partir de corpus publics hétérogènes. Pour des décisions B2B impliquant des budgets élevés et des risques opérationnels, la fiabilité de l'information est critique. L'application promet donc des données contrôlées plutôt que probabilistes, réduisant le risque d'erreurs ou d'informations obsolètes. Pour les prestataires de services référencés sur Clutch, le changement de logique est profond. Jusqu'ici, être visible signifiait optimiser sa présence sur les moteurs de recherche ou les marketplaces traditionnelles. Désormais, il s'agit d'être intégré dans les recommandations générées par l'IA dès l'émergence du besoin, bien avant qu'une recherche active ne commence. Les profils vérifiés deviennent des actifs stratégiques qui pèsent sur la décision dès les premières interactions conversationnelles. Cette évolution s'inscrit dans une tendance plus large : OpenAI a ouvert son écosystème d'applications tierces pour enrichir les capacités de ChatGPT, et plusieurs acteurs cherchent à y ancrer leur offre en données structurées. Clutch, fort de sa position d'intermédiaire de confiance dans le monde B2B, parie que cette intégration précoce lui permettra de capter une part croissante d'un marché où la prescription algorithmique remplace progressivement la navigation humaine.

1 source
Les audiences synthétiques IA sont déjà là et s'apprêtent à bouleverser le conseil
552VentureBeat AI 

Les audiences synthétiques IA sont déjà là et s'apprêtent à bouleverser le conseil

Les "audiences synthétiques", des versions numériques de personnes réelles simulées par l'IA, sont en train de bousculer l'industrie du conseil et des études de marché. Des startups comme Electric Twin, Artificial Societies et Aaru, ainsi que le géant centenaire Dentsu, ont déjà commercialisé des outils permettant de sonder virtuellement des milliers de profils en quelques minutes, pour quelques dollars. Ce qui nécessitait autrefois quatre mois de terrain, deux mois de mise en forme et des dizaines de milliers d'euros de budget peut désormais être accompli en deux minutes et pour un coût marginal. Le principe : on fournit à un modèle d'IA des informations détaillées sur une personne ou un type de profil, et on lui demande de simuler ses opinions, comportements et décisions face à une série de questions, comme si l'on sondait un vrai individu. L'impact potentiel sur l'ensemble du secteur du conseil, marketing, sondages, études consommateurs, veille stratégique, est considérable. Les cabinets comme McKinsey, Nielsen, Gartner ou Publicis, dont les modèles économiques reposent en partie sur la collecte et l'analyse d'opinions humaines, sont directement exposés. Un article de référence publié en 2024 par Park et al. à Stanford a établi qu'une IA peut reproduire les réponses humaines à des questionnaires avec une précision moyenne de 85 %, dépassant les 90 % sur certaines portions de grandes enquêtes sociales. Le cabinet de capital-risque Andreessen Horowitz (a16z) résume la promesse en trois mots : "plus rapide, plus intelligent, moins cher". Si la rapidité et le coût sont incontestables, la précision reste, elle, un point de débat ouvert. WPP, le géant mondial de la communication dont les effectifs et le chiffre d'affaires rivalisent avec ceux de petits États européens, illustre bien les tensions et les synergies en jeu. L'auteur de l'analyse, qui y a travaillé de 2023 à 2025 au siège londonien, y a construit des outils similaires pour de nombreux groupes du Fortune 500 et conseillé des chercheurs de la New York University. WPP s'est depuis tourné vers des partenariats avec des startups tout en développant ses propres solutions internes. Le principal frein à l'adoption reste la méfiance des grandes entreprises face au risque de fuite de données, une crainte que l'auteur juge plus émotionnelle que rationnelle, en soulignant que ces mêmes entreprises confient déjà leurs données sensibles à Microsoft, Google ou Amazon. Les prochaines années seront décisives : ce sont les acheteurs de ces études, les grands groupes internationaux, qui dicteront la vitesse et la forme de cette transformation.

UEPublicis (groupe français) et WPP (groupe britannique) sont directement exposés à la disruption de leurs modèles économiques fondés sur les études consommateurs, avec des implications stratégiques immédiates pour les cabinets de conseil et agences de communication européens.

OutilsOutil
1 source
Claude se connecte directement à vos applications personnelles comme Spotify, Uber Eats et TurboTax
553The Verge AI 

Claude se connecte directement à vos applications personnelles comme Spotify, Uber Eats et TurboTax

Anthropic élargit les capacités de son assistant Claude en lui permettant de se connecter directement à des applications personnelles du quotidien. Parmi les nouveaux connecteurs annoncés figurent Spotify, Audible, Uber, Instacart, AllTrails, TripAdvisor et TurboTax. L'intégration fonctionne de façon proactive : une fois une application connectée, Claude propose lui-même d'y recourir dans la conversation, par exemple en suggérant AllTrails pour planifier une randonnée ou Instacart pour commander des courses. Cette expansion marque un tournant dans la stratégie d'Anthropic, qui s'était jusqu'ici concentré sur les usages professionnels avec des intégrations comme Microsoft 365. En ciblant désormais les applications grand public, l'entreprise cherche à ancrer Claude dans la vie quotidienne des utilisateurs et non plus uniquement dans leur environnement de travail. L'enjeu est de taille : transformer un assistant de productivité en véritable interface personnelle, capable de coordonner achats, voyages, musique et finances depuis une seule conversation. La bataille des connecteurs d'applications s'accélère dans tout le secteur. OpenAI proposait déjà des intégrations similaires dans ChatGPT, notamment avec Spotify, ce qui place Anthropic en position de rattrapage sur ce terrain précis. En multipliant les partenariats avec des plateformes populaires, les deux entreprises cherchent à capter les habitudes numériques des utilisateurs et à devenir le point d'entrée central de leur vie connectée, une position stratégique dont dépendra en grande partie l'adoption massive des assistants IA dans les prochains mois.

UELes connecteurs Spotify et Uber bénéficieront aux utilisateurs européens de Claude, mais la majorité des intégrations annoncées (TurboTax, Instacart, AllTrails) sont exclusivement américaines et sans équivalent en France/UE.

OpenAI lance ChatGPT pour les cliniciens : la médecine change-t-elle ère ?
554Le Big Data 

OpenAI lance ChatGPT pour les cliniciens : la médecine change-t-elle ère ?

OpenAI a officiellement lancé le 23 avril 2026 une version gratuite de ChatGPT spécialement conçue pour les professionnels de santé, médecins, infirmiers praticiens, pharmaciens et assistants médicaux. Cette décision intervient alors que des millions de cliniciens utilisent déjà ChatGPT chaque semaine dans leur pratique, un usage qui a plus que doublé en un an selon OpenAI. L'outil cible les tâches administratives répétitives : rédaction de documentation clinique, lettres médicales, demandes d'autorisation préalable, synthèses de littérature médicale générées en quelques minutes à partir de publications validées. Il s'appuie sur GPT-5.4, la version la plus récente du modèle, et intègre des fonctionnalités de conformité HIPAA, une authentification multifactorielle, ainsi que la création de flux de travail réutilisables pour standardiser des tâches comme les instructions aux patients. Pour l'heure, le service est limité aux États-Unis, avec une extension progressive prévue via des partenaires du secteur médical. L'impact potentiel est significatif pour un secteur sous pression constante : la surcharge administrative est l'une des premières causes de burn-out chez les soignants, et tout outil capable d'absorber une partie de cette charge représente un gain concret de temps clinique. Pour valider le déploiement, OpenAI a mandaté des médecins-conseils pour analyser plus de 700 000 réponses générées par le système. Sur un panel de 6 924 conversations, 99,6 % des réponses ont été jugées sûres et correctes par ces experts. OpenAI a également publié HealthBench Professional, un référentiel ouvert qui évalue les conversations médicales réelles sur trois axes, consultation, documentation et recherche, à partir de 6 924 scénarios cliniques dont un tiers a été conçu comme tests de résistance par des médecins. Sur ce benchmark, GPT-5.4 obtient un score de 59, surpassant plusieurs modèles concurrents et certaines réponses rédigées par des humains. Des benchmarks externes comme MedHELM confirment ces performances. Cette initiative s'inscrit dans une compétition intense entre les grands acteurs de l'IA pour s'imposer dans le secteur médical, considéré comme l'un des débouchés les plus rentables et structurants de l'IA générative. Google, Microsoft et des startups spécialisées comme Nabla ou Abridge occupent déjà ce terrain. OpenAI, fort de sa base d'utilisateurs cliniciens déjà constituée, choisit d'accélérer en proposant un accès gratuit pour créer l'adhérence avant de monétiser via des offres entreprises ou des partenariats institutionnels. La limite reste néanmoins centrale et assumée : l'outil est conçu pour assister, jamais pour remplacer le jugement clinique. La question de la responsabilité médicale en cas d'erreur générée par l'IA reste entière, et sera probablement le prochain front réglementaire que ce déploiement mondial devra affronter.

UELe service est actuellement limité aux États-Unis, mais l'expansion progressive annoncée pourrait à terme concurrencer directement les acteurs européens du secteur comme la startup française Nabla, et soulève des questions réglementaires sur la conformité RGPD pour un éventuel déploiement en Europe.

OutilsOutil
1 source
ChatGPT Workspace Agents : OpenAI révolutionne le travail d’équipe ?
555Le Big Data 

ChatGPT Workspace Agents : OpenAI révolutionne le travail d’équipe ?

OpenAI a annoncé le 22 avril 2026 le déploiement des Workspace Agents dans ChatGPT, une mise à jour majeure qui transforme l'outil en agents autonomes capables d'exécuter des tâches complexes en arrière-plan. Contrairement à l'assistant conversationnel classique qui attend des instructions à chaque étape, ces agents s'intègrent nativement à des outils tiers, Slack, Google Drive, CRM, et continuent de travailler dans le cloud même lorsque l'utilisateur est déconnecté. Concrètement, un agent peut être configuré pour récupérer automatiquement les statistiques hebdomadaires depuis plusieurs plateformes, les compiler et publier un résumé à heure fixe sur un canal d'équipe. Un autre peut surveiller l'arrivée de nouveaux prospects dans un CRM, analyser leur profil en ligne et préparer un brouillon d'e-mail personnalisé prêt à envoyer. Un troisième peut répondre en temps réel aux questions internes sur Slack à partir d'une base de connaissances connectée. Ce basculement d'un outil réactif vers un collaborateur proactif représente un changement structurel pour les entreprises. Jusqu'ici, l'IA générative nécessitait une supervision permanente : chaque étape d'un flux de travail devait être déclenchée manuellement. Avec les Workspace Agents, des processus entiers, reporting, prospection, support interne, peuvent être délégués à la machine, libérant les équipes pour des tâches à plus haute valeur ajoutée. Le rôle de l'utilisateur évolue de celui d'opérateur à celui de manager : il définit les objectifs, valide les résultats, mais ne gère plus l'exécution. Pour les PME sans équipes techniques dédiées, l'impact peut être particulièrement significatif, en leur donnant accès à un niveau d'automatisation autrefois réservé aux grandes organisations dotées de systèmes complexes. Ce lancement s'inscrit dans une course intense entre les grands acteurs de l'IA à transformer leurs modèles en plateformes d'action autonome. Microsoft intègre des capacités similaires via Copilot dans sa suite 365, Google pousse ses agents dans Workspace, et des startups comme Zapier ou Make repositionnent également leurs offres face à cette nouvelle concurrence. OpenAI, dont les revenus annuels dépassent désormais les 3 milliards de dollars selon les dernières estimations, cherche à ancrer ChatGPT au coeur des workflows professionnels pour justifier ses abonnements Teams et Enterprise. La question qui reste ouverte est celle de la gouvernance : laisser des agents agir de façon autonome sur des outils d'entreprise soulève des enjeux de sécurité, de traçabilité et de contrôle des accès que les entreprises devront adresser avant tout déploiement à grande échelle.

UELes entreprises européennes devront évaluer la conformité RGPD des Workspace Agents avant déploiement, notamment sur le traitement autonome de données internes par des agents cloud opérant hors supervision directe.

Le Nano Banana de ChatGPT
556Ben's Bites 

Le Nano Banana de ChatGPT

OpenAI a frappé fort cette semaine avec le lancement de ChatGPT Images 2.0, une refonte majeure de son module de génération d'images qui remet le service en compétition directe avec les outils de Google et Midjourney. La nouveauté la plus remarquée : une précision inédite sur le texte intégré aux images, au point que les utilisateurs peinent à trouver des fautes dans des générations contenant des centaines de mots. Le modèle est disponible dans l'application Codex en tant que compétence dédiée, avec une intégration aux modèles de raisonnement pour enchaîner appels d'outils et génération d'images, créer un QR code à partir d'un lien, récupérer un logo depuis le web, puis l'intégrer dans une composition. Les cas d'usage prolifèrent déjà : captures d'écrans d'interfaces réalistes, magazines illustrés multi-pages, recommandations de style personnalisées et codes QR créatifs. La capacité à générer des interfaces utilisateur crédibles ouvre une piste intéressante pour combler le déficit de goût graphique souvent reproché aux modèles de code. Des tests comparatifs menés sur la conversion d'une maquette en application fonctionnelle, une vitrine publicitaire conçue par Ben's Bites, révèlent une hiérarchie nuancée : Claude Design devance Magicpath AI, qui devance les modèles bruts comme Gemini 3.1 Pro ou Opus 4.6 sur la compréhension du concept et l'utilisabilité. En revanche, Gemini remporte la fidélité pixel par pixel, tandis qu'Opus 4.7 bat GPT-5.4 sur la correspondance visuelle avec la maquette de référence. GPT-5.4 produit un code plus fonctionnel et maintient une cohérence visuelle sur les pages non montrées, comme le panneau d'administration. Un point aveugle subsiste pour tous : les assets, images d'illustration, icônes, textures, qui font souvent la différence entre une maquette et une interface banale ne survivent pas à la conversion depuis une capture d'écran. Ces annonces s'inscrivent dans une semaine d'actualité dense pour l'industrie de l'IA. OpenAI a déployé les Workspace Agents, des agents propulsés par Codex accessibles aux utilisateurs Business, Enterprise et Education, configurables avec une personnalité, des tâches précises et des accès à des outils externes comme Linear ou Slack, appelés à terme à remplacer les GPTs personnalisés. De son côté, Google a ouvert l'API Deep Research avec deux configurations basées sur Gemini 3.1 Pro, revendiquant les meilleures performances en recherche web, avec support MCP et génération de graphiques. Enfin, un accord stratégique se dessine entre Cursor et SpaceX : SpaceX mettra ses GPU à disposition pour entraîner les modèles de code de Cursor, avec une option d'acquisition à 60 milliards de dollars d'ici fin 2025, ou un accord de partenariat à 10 milliards si l'acquisition n'a pas lieu, un signal que la course aux modèles de code spécialisés entre dans une nouvelle phase industrielle.

UELes nouvelles APIs et outils (ChatGPT Images 2.0, Deep Research, Workspace Agents) sont accessibles aux développeurs et entreprises européens, mais aucune réglementation ou entreprise française n'est directement impliquée.

OutilsOutil
1 source
Gemini Enterprise : Google lance sa plateforme unifiée pour orchestrer des agents IA
557Le Big Data 

Gemini Enterprise : Google lance sa plateforme unifiée pour orchestrer des agents IA

Google a présenté le 22 avril 2026, lors de Google Cloud Next 2026, Gemini Enterprise : une plateforme unifiée conçue pour orchestrer des flottes d'agents IA à l'échelle de l'entreprise. La nouveauté fusionne l'application Gemini Enterprise pour les utilisateurs finaux et la nouvelle Gemini Enterprise Agent Platform pour les développeurs, absorbant au passage Vertex AI qui disparaît en tant que plateforme indépendante. Plus de 200 modèles sont accessibles via Model Garden, dont les dernières générations Gemini mais aussi des modèles tiers d'Anthropic et autres. La marketplace intégrée permet de connecter des agents issus de partenaires comme Oracle, ServiceNow, Adobe, Salesforce ou Workday. Du côté technique, la plateforme introduit Agent Studio pour le développement low-code, un SDK basé sur des graphes pour les systèmes multi-agents, et Agent Runtime pour des agents capables de fonctionner en continu pendant des heures, voire des jours. Des outils d'optimisation complètent l'ensemble : Agent Simulation, Evaluation et Observability. Pour les directions informatiques, la gouvernance est au coeur du dispositif. Chaque agent se voit attribuer une identité cryptographique via Agent Identity, tandis qu'un registre central valide les outils et agents autorisés, et qu'Agent Gateway applique les politiques de sécurité à l'échelle de l'organisation. La couche de protection intègre Model Armor pour contrer les injections malveillantes et les fuites de données, appuyée par Security Command Center pour la détection des vulnérabilités. Du côté des équipes métier, Agent Designer permet de créer et déployer des agents sans écrire de code, depuis une interface unique avec boîte de réception centralisée, espaces projets à mémoire partagée et outil collaboratif Canvas pour produire des documents exportables vers Microsoft Office. Un agent Data Insights natif analyse données structurées et non structurées pour générer visualisations et rapports, tandis que Deep Research synthétise sources web et données internes. Ce lancement s'inscrit dans une course intense entre les grands acteurs du cloud pour capter les budgets IA des entreprises. Microsoft, avec Copilot Studio et Azure AI Foundry, Amazon avec Bedrock Agents, et Salesforce avec Agentforce occupent le même terrain. Google répond en cassant la fragmentation de son offre précédente : Vertex AI, Duet AI, Gemini for Workspace coexistaient sans cohérence claire pour les acheteurs. En absorbant tout dans une plateforme unique, Google vise à simplifier les cycles de vente et à verrouiller les grandes entreprises dans son écosystème. La compatibilité revendiquée avec Microsoft 365 et Google Workspace trahit la volonté de ne pas imposer une migration brutale, mais de s'intégrer aux environnements existants. L'enjeu des prochains mois sera la disponibilité réelle de ces fonctionnalités et leur tenue à l'échelle, deux points sur lesquels les annonces de Cloud Next ont historically précédé des déploiements progressifs.

UELes entreprises européennes utilisant Google Cloud devront évaluer la migration vers cette plateforme unifiée, dont les mécanismes de gouvernance (identité cryptographique des agents, registre central, audit de sécurité) pourraient faciliter la mise en conformité avec l'AI Act.

OutilsOutil
1 source
Microsoft lance le "vibe working" dans Word, Excel et PowerPoint
558The Verge 

Microsoft lance le "vibe working" dans Word, Excel et PowerPoint

Microsoft déploie cette semaine un nouveau mode appelé Agent Mode dans ses applications Office, Word, Excel et PowerPoint. Baptisé en interne "vibe working", ce mode représente une version nettement plus avancée de Copilot, l'assistant IA que Microsoft commercialise auprès des entreprises depuis 2023. Sumit Chauhan, vice-président de l'Office Product Group, reconnaît publiquement les limites de la première version : "Quand nous avons lancé Copilot, les modèles fondationnels n'étaient pas assez puissants pour lui permettre d'agir directement dans les applications." Ce basculement vers un agent actif change fondamentalement la nature du produit. Jusqu'ici, Copilot dans Office se contentait de répondre à des questions ou de générer du contenu dans un volet latéral, sans pouvoir modifier directement un document, une feuille de calcul ou une présentation. Agent Mode franchit cette barrière : l'assistant peut désormais prendre des actions concrètes sur le "canvas", c'est-à-dire manipuler le contenu des fichiers de façon autonome, sur instruction de l'utilisateur. Pour les entreprises qui paient l'abonnement Copilot 365 (environ 30 dollars par utilisateur par mois), cela justifie enfin une partie de la promesse initiale. Cette annonce s'inscrit dans une course industrielle intense. Google a lancé des fonctionnalités similaires dans Workspace, et les grands éditeurs de productivité misent tous sur les "agents" comme prochaine étape après les assistants génératifs. Microsoft, qui a investi plusieurs milliards dans OpenAI, dispose d'un accès privilégié aux dernières versions de GPT-4o et o-series, ce qui lui permet aujourd'hui de tenir des promesses que les modèles de 2023 ne pouvaient pas encore tenir.

UELes entreprises européennes sous abonnement Microsoft 365 doivent évaluer l'adoption de l'Agent Mode Copilot 365 (environ 30 $/utilisateur/mois), qui franchit enfin la barrière de la manipulation autonome des documents Office.

OutilsOutil
1 source
OpenAI affirme que ChatGPT for Clinicians surpasse les médecins sur les tâches cliniques, même avec temps illimité et accès au web
559The Decoder 

OpenAI affirme que ChatGPT for Clinicians surpasse les médecins sur les tâches cliniques, même avec temps illimité et accès au web

OpenAI lance ChatGPT for Clinicians, une version gratuite de son chatbot spécialement destinée aux professionnels de santé. Selon un nouveau benchmark publié par la société, le modèle GPT-5.4 surpasse les médecins humains sur des tâches cliniques, y compris dans des conditions où ces derniers disposent d'un temps illimité et d'un accès libre à Internet. L'annonce constitue l'une des affirmations les plus audacieuses jamais formulées par une entreprise d'IA sur les capacités médicales de ses modèles. Ce résultat est notable précisément parce que la comparaison ne se fait pas à armes inégales : les médecins testés pouvaient consulter n'importe quelle source en ligne et prendre tout le temps nécessaire pour répondre. Si le modèle confirme ces performances en conditions réelles, les implications sont concrètes pour le diagnostic, la rédaction de comptes-rendus ou l'analyse de cas complexes. Pour les professionnels de santé, l'outil pourrait agir comme un assistant de haut niveau, disponible en permanence et sans coût d'accès, ce qui représente un changement significatif dans le quotidien des cliniciens. L'initiative s'inscrit dans une compétition intense entre les grands laboratoires d'IA pour s'imposer dans le secteur médical, considéré comme l'un des plus stratégiques. Google, Microsoft et des startups spécialisées comme Nabla ou Suki investissent massivement dans l'assistance aux cliniciens. En proposant un accès gratuit, OpenAI cherche à accélérer l'adoption et à s'établir comme référence dans un domaine où la confiance, la validation clinique et les enjeux réglementaires restent des obstacles majeurs à franchir.

UELes cliniciens européens pourraient utiliser cet outil gratuitement, mais son déploiement en Europe reste conditionné aux exigences strictes de l'AI Act qui classe les outils d'IA médicale comme systèmes à haut risque nécessitant certification.

💬 OpenAI qui publie un benchmark montrant qu'OpenAI bat les médecins, bon, ça mérite une validation externe avant de crier victoire. La vraie surprise, c'est le gratuit: dans un secteur où les concurrents facturent des fortunes aux hôpitaux, arriver gratos c'est un pari d'adoption qui peut vraiment bousculer les acteurs en place. Pour l'Europe, l'AI Act classe ces outils en haut risque, certification obligatoire, donc 2027 au mieux.

OutilsOutil
1 source
Excel & Google Sheets : Fin des formules, ChatGPT débarque et fait tout le job
560Le Big Data 

Excel & Google Sheets : Fin des formules, ChatGPT débarque et fait tout le job

OpenAI a lancé le 22 avril 2026 une nouvelle fonctionnalité appelée ChatGPT Sidebar, qui s'intègre directement dans Excel et Google Sheets sous forme de barre latérale ou de complément. L'installation se fait en quelques clics via le menu des modules complémentaires sur Google Sheets, ou via l'onglet Compléments d'Excel. Une fois connecté à son compte OpenAI, l'utilisateur dispose d'un assistant capable de créer des structures de fichiers, modifier des données, mettre à jour des tableaux et analyser des tendances réparties sur plusieurs onglets, le tout en langage naturel. L'outil demande systématiquement confirmation avant d'effectuer toute modification, préservant ainsi le contrôle de l'utilisateur. Il prend également en charge l'import de fichiers dans un large éventail de formats : images (JPEG, PNG, GIF), documents (PDF, Word, Pages), présentations (PowerPoint), feuilles de calcul (CSV, Excel), ainsi que formats texte et code (JSON, YAML, HTML, Markdown). La limite est fixée à 20 fichiers par message, avec un maximum de 25 Mo par fichier. L'outil est actuellement en phase bêta et réservé aux abonnés payants des offres Plus, Pro, Business, Enterprise, Edu et K-12. Pour des millions de professionnels qui passent des heures à construire des formules complexes ou à chercher des anomalies dans des tableaux imbriqués, cette intégration représente un changement concret de flux de travail. L'assistant peut repérer des tendances de dépenses sur plusieurs onglets en secondes, là où un analyste aurait autrefois mobilisé une demi-journée. Selon Jack R. Curran et d'autres membres de l'équipe OpenAI, l'outil couvre aussi bien des usages personnels, comme l'organisation d'un mariage ou la gestion d'une activité en ligne, que des besoins professionnels comme la construction d'un plan d'affaires ou l'analyse de données. La capacité à interagir en langage naturel abaisse significativement la barrière d'entrée pour les utilisateurs non-téchniques, qui n'ont plus besoin de maîtriser les syntaxes de formules pour exploiter pleinement un tableur. Cette annonce s'inscrit dans une dynamique d'expansion agressive d'OpenAI vers les outils de productivité bureautique, un territoire jusqu'ici dominé par Microsoft avec Copilot intégré à Office 365, et par Google avec Gemini dans Workspace. En s'installant directement dans Excel, concurrent historique de ses propres partenaires Microsoft, OpenAI joue sur tous les tableaux simultanément. La limitation aux abonnés payants suggère une stratégie de montée en gamme : convaincre les entreprises de migrer vers des formules Business ou Enterprise. L'absence de synchronisation avec l'historique ChatGPT classique constitue une limitation notable pour l'instant, mais laisse anticiper une intégration plus profonde dans les prochaines versions. La bataille pour devenir le co-pilote universel du travail de bureau ne fait que commencer.

UELes professionnels français et européens abonnés aux offres payantes ont accès à cette intégration qui modifie concrètement les pratiques de travail sur tableur, sans impact réglementaire spécifique à l'UE pour l'instant.

💬 Installer ChatGPT directement dans Excel, le produit phare de Microsoft, c'est le genre de coup qui mérite qu'on s'y arrête. Pour les profils non-techs qui jonglent avec des tableaux sans vraiment maîtriser les formules, là c'est du concret, pas du vent. Abonnés payants seulement pour l'instant, donc la vraie adoption, on verra dans six mois.

OutilsOutil
1 source
Alibaba ouvre l'application Qwen à des partenaires externes avec China Eastern Airlines
561SCMP Tech 

Alibaba ouvre l'application Qwen à des partenaires externes avec China Eastern Airlines

Alibaba a annoncé son premier partenariat externe pour son application grand public d'intelligence artificielle Qwen, en s'associant à China Eastern Airlines, l'une des trois grandes compagnies aériennes nationales chinoises. Grâce à cette intégration, les utilisateurs de l'application Qwen peuvent désormais gérer l'intégralité du processus de réservation de vol, recherche de billets, achat, sélection du siège et enregistrement, au sein d'une seule interface conversationnelle en langage naturel, sans quitter l'application. Ce partenariat marque une étape décisive dans la stratégie d'Alibaba : faire de Qwen non plus un simple assistant textuel, mais un agent capable d'agir concrètement dans le monde réel pour le compte de l'utilisateur. L'intégration avec China Eastern illustre ce qu'on appelle les capacités « agentiques », la possibilité pour un modèle de langage d'enchaîner des actions complexes dans des systèmes tiers. Pour les voyageurs chinois, cela représente un gain de fluidité considérable, toutes les étapes d'une réservation étant centralisées dans un seul dialogue. Cette initiative s'inscrit dans une course mondiale aux assistants IA capables de se connecter à des services réels. En Chine, Alibaba fait face à une concurrence intense de Baidu, ByteDance et surtout de DeepSeek, dont la montée en puissance a redistribué les cartes début 2025. En ouvrant Qwen à des partenaires extérieurs, Alibaba cherche à constituer un écosystème d'intégrations qui rendrait son application indispensable au quotidien, à l'image de ce que WeChat a réussi avec ses mini-programmes il y a près d'une décennie.

OutilsOutil
1 source
Tesla Chine intègre le modèle d'IA Doubao dans son système embarqué
562Pandaily 

Tesla Chine intègre le modèle d'IA Doubao dans son système embarqué

Tesla China a finalisé le dépôt réglementaire de son système vocal embarqué le 20 avril 2026, ouvrant la voie à l'intégration du modèle d'intelligence artificielle Doubao de ByteDance dans ses véhicules vendus en Chine. Selon des informations relayées par AI Daily, la page officielle de Tesla China avait déjà révélé dans ses "Conditions d'utilisation de l'assistant vocal embarqué" que la Model Y L serait équipée à la fois du modèle Doubao et de DeepSeek, tous deux accessibles via Volcano Engine, la plateforme cloud de ByteDance. La répartition des rôles est précise : Doubao prend en charge les commandes vocales courantes, réglage de la navigation, contrôle de la lecture multimédia, ajustements climatiques et consultation du manuel propriétaire, tandis que DeepSeek alimente des fonctionnalités conversationnelles plus avancées, permettant des échanges de nature plus générale avec le véhicule. Cette intégration marque une étape concrète dans la localisation de l'expérience Tesla en Chine, marché qui représente une part critique de ses ventes mondiales. En adoptant deux modèles d'IA développés par des acteurs chinois majeurs, Tesla reconnaît implicitement que les LLM occidentaux ne suffisent pas à répondre aux attentes des consommateurs locaux, qu'il s'agisse de la langue, des usages culturels ou des exigences réglementaires. Pour les utilisateurs, cela se traduit par un assistant embarqué nettement plus capable et mieux adapté aux conditions de conduite chinoises. Cette décision s'inscrit dans un contexte de concurrence intense sur le marché automobile chinois, où des constructeurs locaux comme BYD, NIO ou Li Auto intègrent depuis plusieurs années des assistants IA avancés directement dans leurs plateformes. Tesla, longtemps en retard sur ce volet en Chine, avait déjà engagé des discussions avec Baidu pour la cartographie et les services connectés. Le choix de Doubao, modèle phare de ByteDance aux centaines de millions d'utilisateurs, et de DeepSeek, devenu en quelques mois une référence mondiale en matière d'efficience des LLM, reflète la volonté de Tesla de s'aligner rapidement sur les standards locaux pour ne pas perdre de terrain face à une industrie nationale en pleine accélération technologique.

OutilsActu
1 source
Concevoir un système multi-agents CAMEL de production : planification, outils, cohérence et affinement critique
563MarkTechPost 

Concevoir un système multi-agents CAMEL de production : planification, outils, cohérence et affinement critique

Un tutoriel publié récemment détaille comment concevoir un système multi-agents de niveau production à l'aide du framework CAMEL, une bibliothèque Python open source dédiée à l'orchestration d'agents LLM. Le pipeline décrit met en scène cinq agents spécialisés aux rôles clairement délimités : un planificateur, un chercheur, un rédacteur, un critique et un rééditeur. L'ensemble repose sur GPT-4o d'OpenAI (via l'API), la validation de schémas avec Pydantic 2.7, et l'affichage structuré via Rich 13.7. Concrètement, le système génère des synthèses techniques documentées de façon autonome, en combinant recherche web en temps réel, échantillonnage par auto-cohérence et raffinement itératif piloté par critique interne. Ce type d'architecture multi-agents représente une évolution significative par rapport aux approches LLM classiques en pipeline simple. En distribuant les responsabilités entre agents distincts, chacun doté de contraintes de sortie précises (schémas JSON validés par Pydantic), le système réduit les hallucinations et améliore la cohérence des résultats. L'ajout d'un agent critique qui évalue la production de l'agent rédacteur, puis déclenche un agent rééditeur si le score est insuffisant, introduit une boucle de contrôle qualité autonome : le système s'auto-corrige sans intervention humaine. Pour les équipes produit ou data qui cherchent à industrialiser des workflows de génération de contenu ou d'analyse, cette approche offre un cadre reproductible, modulaire et extensible. CAMEL (Communicative Agents for "Mind" Exploration of Large Language Model Society) est un framework open source initié en 2023, qui a gagné en maturité avec des versions stables permettant l'intégration native d'outils web, de modèles multi-plateformes et de mécanismes de validation structurée. Le tutoriel s'inscrit dans un mouvement plus large d'industrialisation des agents LLM, où des acteurs comme LangChain, AutoGen de Microsoft ou CrewAI cherchent à standardiser la façon dont on compose des agents spécialisés. L'enjeu central est de passer du prototype expérimental au système fiable en production, ce qui exige précisément les mécanismes décrits ici : contrôle de schéma, gestion des erreurs, logique de retry et traçabilité des sorties. Les prochaines évolutions de ces frameworks devraient intégrer davantage de mémoire persistante entre agents et des mécanismes de délégation dynamique des tâches, rapprochant ces systèmes des premières formes d'automatisation cognitive véritablement autonome.

OutilsTuto
1 source
OpenAI dévoile Workspace Agents, successeur des GPTs personnalisés pour entreprises, intégrable à Slack, Salesforce et d'autres services
564VentureBeat AI 

OpenAI dévoile Workspace Agents, successeur des GPTs personnalisés pour entreprises, intégrable à Slack, Salesforce et d'autres services

OpenAI a lancé ce jeudi une nouvelle offre baptisée « Workspace Agents », destinée aux entreprises utilisant ChatGPT dans un cadre professionnel. Disponible dès maintenant pour les abonnés ChatGPT Business à 20 dollars par utilisateur par mois, ainsi que pour les plans Enterprise, Edu et Teachers, cette fonctionnalité permet de créer ou de sélectionner des agents depuis une bibliothèque de modèles préconfigurés, capables d'agir directement dans des outils tiers comme Slack, Google Drive, Salesforce, Notion, Microsoft 365, Atlassian Rovo et d'autres applications courantes en entreprise. Concrètement, un agent peut rédiger un email à toute une équipe, extraire des données pour générer une présentation, ou exécuter des tâches complexes en plusieurs étapes, sans que l'utilisateur à l'origine de la demande ait besoin de rester connecté. OpenAI précise que la fonctionnalité sera gratuite jusqu'au 6 mai 2026, date à laquelle une tarification basée sur des crédits entrera en vigueur. De nouvelles capacités sont annoncées : déclencheurs automatiques, tableaux de bord avancés, et intégration dans Codex, l'outil de génération de code de l'entreprise. L'enjeu principal n'est pas simplement d'avoir des assistants IA plus puissants, mais de transformer l'IA en ressource organisationnelle partagée plutôt qu'en outil de productivité individuelle. L'onglet « Agents » dans la barre latérale de ChatGPT fonctionne comme un annuaire d'équipe : les agents créés par des collègues sont accessibles et réutilisables par toute l'organisation. Ce modèle s'attaque directement à l'un des problèmes chroniques du travail en entreprise, la transmission entre personnes, systèmes et étapes d'un processus, en permettant à un agent de gérer cette complexité de bout en bout. Pour les directions informatiques et les responsables métiers, cela représente un nouveau paradigme de déploiement de l'IA : non plus des outils ponctuels, mais des workflows autonomes pilotés par des agents paramétrés selon des règles et des permissions définies par l'entreprise. La différence technique fondamentale avec les anciens « custom GPTs » réside dans l'architecture sous-jacente : ces agents sont propulsés par Codex, la plateforme cloud de développement assisté par IA qu'OpenAI a considérablement enrichie en 2026, notamment il y a six jours à peine avec l'ajout de plus de 90 plugins, de la mémoire persistante, de l'utilisation d'ordinateur en arrière-plan et de la capacité à planifier des tâches futures. Un agent Workspace n'est donc pas un simple modèle de langage qui répond à une invite : c'est une session Codex qui écrit du code, exécute des requêtes, produit des graphiques et retient ce qu'elle a appris pour la prochaine occurrence. Cette architecture d'exécution de code est ce qui distingue ces agents des solutions concurrentes reposant sur des boucles d'appels LLM classiques. À mesure qu'OpenAI annonce de nouveaux déclencheurs et une intégration plus profonde dans son écosystème, la concurrence avec Microsoft Copilot, Google Workspace AI et les plateformes d'agents comme Salesforce Agentforce s'intensifie sur le terrain stratégique des grandes entreprises.

UELes entreprises françaises et européennes abonnées à ChatGPT Business peuvent tester gratuitement ces agents intégrés à Slack, Notion, Microsoft 365 et Salesforce avant l'entrée en vigueur de la tarification le 6 mai 2026.

OutilsOutil
1 source
Transcription audio multilingue économique à grande échelle avec Parakeet-TDT et AWS Batch
565AWS ML Blog 

Transcription audio multilingue économique à grande échelle avec Parakeet-TDT et AWS Batch

NVIDIA a publié en août 2025 Parakeet-TDT-0.6B-v3, un modèle de transcription automatique de la parole open source couvrant 25 langues européennes, dont le français, l'allemand, l'espagnol, le polonais ou l'ukrainien. Capable de détecter automatiquement la langue parlée, ce modèle affiche un taux d'erreur sur les mots de 6,34 % en conditions acoustiques propres et de 11,66 % à 0 dB de rapport signal/bruit, tout en prenant en charge des fichiers audio allant jusqu'à trois heures. Distribué sous licence CC-BY-4.0, il s'appuie sur une architecture Token-and-Duration Transducer (TDT) qui prédit simultanément les tokens de texte et leur durée, permettant de sauter silences et segments redondants pour atteindre des vitesses d'inférence très largement supérieures au temps réel. Dans la configuration présentée, le modèle tourne sur AWS Batch avec des instances GPU G6 équipées de NVIDIA L4, qui offrent le meilleur ratio coût/performance, bien qu'il soit également compatible avec des instances G5, G4dn ou P5 pour un débit maximal. Le pipeline est entièrement événementiel : un fichier audio déposé sur Amazon S3 déclenche une règle Amazon EventBridge, qui soumet automatiquement un job à AWS Batch, lequel provisionne les ressources, télécharge l'image de conteneur depuis Amazon ECR et restitue une transcription JSON horodatée dans un bucket de sortie. Le coût final descend à quelques fractions de centime par heure d'audio. L'enjeu principal est économique. Pour les organisations traitant des volumes massifs d'audio, qu'il s'agisse d'archives médias, d'enregistrements de centres d'appels, de données d'entraînement pour l'IA ou de sous-titrage vidéo à la demande, les services ASR gérés facturent généralement à la durée réelle du fichier, ce qui fait exploser les coûts dès que les volumes augmentent. En ne payant que de brèves fenêtres de calcul GPU plutôt que la totalité de la durée audio, combiné à l'utilisation d'instances EC2 Spot moins onéreuses et au streaming par tampons, ce pipeline peut réduire la facture de transcription de façon substantielle par rapport aux APIs cloud classiques comme celles d'AWS Transcribe ou de Google Speech-to-Text. La prise en charge native de 25 langues sans configuration par langue supprime également une complexité opérationnelle significative pour les entreprises internationales. Cette approche s'inscrit dans une tendance plus large consistant à substituer des modèles open source performants aux services gérés pour les charges de travail à fort volume. NVIDIA, qui diffuse Parakeet dans le cadre de son écosystème NeMo, cherche à s'imposer comme référence en ASR face à OpenAI avec Whisper, à AssemblyAI ou encore à Amazon Transcribe. Le fait qu'un modèle de 600 millions de paramètres atteigne ces niveaux de précision multilingue ouvre la voie à des pipelines entièrement maîtrisés, hébergés en interne ou dans un cloud privé, sans dépendance à un fournisseur. La prochaine étape logique pour les équipes qui adoptent cette architecture sera d'enchaîner directement en aval des modules de post-traitement automatisés, résumé, analyse de sentiment ou détection d'entités, pour extraire encore plus de valeur des transcriptions produites.

UELe modèle Parakeet couvre nativement 25 langues européennes dont le français, offrant aux organisations françaises et européennes un pipeline de transcription audio économique et souverain, sans dépendance à un service ASR propriétaire.

OutilsTuto
1 source
Grok va bientôt personnaliser votre fil d'actualité sur X
566The Verge 

Grok va bientôt personnaliser votre fil d'actualité sur X

X a annoncé mercredi une nouvelle fonctionnalité permettant à Grok, son chatbot d'intelligence artificielle, de prendre en charge la curation du fil d'actualité des utilisateurs. Selon Nikita Bier, directeur produit de X, les abonnés Premium sur iOS bénéficient d'un accès anticipé à cette option : ils peuvent épingler des thématiques spécifiques dans leur onglet d'accueil, que Grok utilise ensuite pour sélectionner et ordonner les publications affichées dans chaque fil. L'accès anticipé pour les utilisateurs Android est prévu « très prochainement », selon Bier. Cette évolution représente un changement majeur dans la manière dont X gère la personnalisation de son interface. Jusqu'ici, l'algorithme de recommandation fonctionnait de manière opaque, sans que l'utilisateur puisse y injecter directement des préférences thématiques explicites. Avec Grok intégré à la boucle, la plateforme promet une personnalisation plus fine, en combinant la compréhension sémantique de chaque publication par l'IA avec les données comportementales de l'utilisateur. Le système serait encore plus efficace sur des sujets avec lesquels l'utilisateur interagit déjà régulièrement. Cette fonctionnalité s'inscrit dans la stratégie plus large d'Elon Musk d'intégrer Grok au coeur de l'expérience X, après des mois de déploiements progressifs incluant les résumés de fils de discussion, l'analyse d'images et le mode vocal. En faisant de l'IA le filtre central du fil d'actualité, X se positionne face à des concurrents comme TikTok ou YouTube, dont les algorithmes de recommandation ultra-personnalisés ont prouvé leur efficacité en matière d'engagement. La question de la transparence algorithmique et des biais potentiels introduits par Grok dans la sélection de l'information reste entière.

UELes questions de transparence algorithmique soulevées pourraient renforcer les obligations de X vis-à-vis du Digital Services Act (DSA) européen, qui impose aux très grandes plateformes de rendre compte de leurs systèmes de recommandation.

OutilsOutil
1 source
OpenAI permet désormais aux équipes de créer des bots personnalisés capables de travailler de façon autonome
567The Verge 

OpenAI permet désormais aux équipes de créer des bots personnalisés capables de travailler de façon autonome

OpenAI a annoncé le déploiement d'agents "workspace" directement intégrés à ChatGPT, désormais accessibles aux abonnés des formules Business, Enterprise, Edu et Teachers. Ces agents, hébergés dans le cloud, sont conçus pour exécuter des tâches professionnelles de manière autonome : l'un peut par exemple surveiller le web à la recherche de retours sur un produit et envoyer un rapport automatisé sur Slack, tandis qu'un autre est capable de rédiger des e-mails de suivi commercial directement dans Gmail. OpenAI a présenté ces capacités dans un billet de blog accompagné de plusieurs cas d'usage concrets. Pour les entreprises abonnées, ce lancement représente un changement de paradigme : il ne s'agit plus seulement d'un assistant qui répond à des questions, mais d'un système capable d'agir dans leurs outils du quotidien sans intervention humaine constante. L'intégration native à des services comme Slack et Gmail abaisse significativement la barrière d'adoption pour des équipes non techniques, et positionne ChatGPT comme une plateforme d'automatisation opérationnelle à part entière. Cette annonce s'inscrit dans une course effrénée au développement d'agents IA autonomes. Le phénomène a été amplifié par la viralité d'OpenClaw, un agent IA se présentant comme "l'IA qui fait vraiment les choses", fondé par Peter Steinberger, qui a depuis rejoint OpenAI. La tendance reflète une conviction grandissante dans l'industrie : la prochaine vague de valeur de l'IA ne viendra pas des chatbots, mais des systèmes capables d'agir de façon autonome dans des environnements de travail réels.

UELes entreprises françaises et européennes abonnées à ChatGPT Business ou Enterprise peuvent désormais déployer ces agents autonomes dans leurs outils quotidiens (Slack, Gmail) sans compétences techniques.

OutilsOutil
1 source
Créez votre premier agent en quelques minutes : nouvelles fonctionnalités d'Amazon Bedrock AgentCore
568AWS ML Blog 

Créez votre premier agent en quelques minutes : nouvelles fonctionnalités d'Amazon Bedrock AgentCore

Amazon a annoncé de nouvelles fonctionnalités pour Bedrock AgentCore, sa plateforme de développement d'agents IA, qui promettent de réduire drastiquement le temps nécessaire pour passer d'une idée à un agent fonctionnel. La pièce maîtresse de cette mise à jour est le "managed agent harness", une couche d'infrastructure gérée qui permet de déclarer et lancer un agent en trois appels d'API seulement, sans écrire de code d'orchestration. Le développeur n'a qu'à définir quel modèle utiliser, quels outils appeler et quelles instructions suivre : AgentCore assemble automatiquement le calcul, la mémoire, les identités et la sécurité. La plateforme est compatible avec les frameworks déjà en usage dans l'industrie : LangGraph, LlamaIndex, CrewAI et Strands Agents, le framework open source d'AWS qui propulse le harness. AgentCore gère également la persistance de l'état de session sur un système de fichiers durable, ce qui permet à un agent de suspendre une tâche en cours et de la reprendre exactement là où il s'était arrêté. Jusqu'ici, construire l'infrastructure sous-jacente d'un agent, compute, sandbox d'exécution de code, connexions sécurisées aux outils, stockage persistant, gestion des erreurs, représentait plusieurs jours de travail avant de pouvoir tester la moindre logique métier. Avec AgentCore, tester une variante d'agent, changer de modèle ou ajouter un outil devient une modification de configuration et non une réécriture de code. Rodrigo Moreira, VP Engineering chez VTEX, l'un des premiers utilisateurs, confirme que ce qui prenait auparavant des jours de mise en place peut désormais être validé en quelques minutes. Cette accélération du cycle de prototypage est particulièrement significative pour les équipes produit qui veulent itérer rapidement sur la logique agent sans s'embourber dans la plomberie backend. Les patterns "human-in-the-loop", souvent coûteux à implémenter, deviennent pratiques grâce à la persistance native de session, sans nécessiter de refonte architecturale ultérieure. La sortie de ces fonctionnalités s'inscrit dans une concurrence féroce entre les grands fournisseurs cloud pour capter les équipes qui industrialisent l'IA agentique. AWS fait le pari que les développeurs adoptent plus facilement un service géré s'il supprime la friction initiale tout en restant extensible : lorsque les besoins d'orchestration personnalisée ou de coordination multi-agents se précisent, il suffit de basculer d'une configuration déclarative vers du code, sur la même plateforme, avec la même pipeline de déploiement et le même isolement microVM. La prochaine étape annoncée, déployer et opérer les agents depuis le même terminal, vise à unifier le cycle complet de développement, de la première idée jusqu'à la production, dans un seul environnement sans rupture d'outil.

UELes équipes de développement françaises et européennes peuvent réduire leur temps de prototypage d'agents IA, accélérant l'industrialisation de l'IA agentique pour les entreprises du continent.

OutilsOutil
1 source
Equinox et JAX en pratique : modules natifs, transformations filtrées, couches à état et pipelines d'entraînement
569MarkTechPost 

Equinox et JAX en pratique : modules natifs, transformations filtrées, couches à état et pipelines d'entraînement

Equinox s'impose discrètement comme l'une des bibliothèques de deep learning les plus élégantes construites sur JAX, l'environnement de calcul numérique de Google. Développée comme une surcouche légère, elle repose sur un principe central : chaque modèle est un eqx.Module, traité nativement comme un PyTree, la structure d'arbre que JAX utilise pour manipuler ses tenseurs. Concrètement, cela signifie qu'une couche Linear, un bloc convolutif Conv1dBlock ou un réseau MLP se décomposent automatiquement en feuilles (les poids, les biais) et en métadonnées structurelles, sans couche d'abstraction cachée. Le tutoriel publié cette semaine détaille l'ensemble du workflow : initialisation des modules, champs statiques via eqx.field(static=True), transformations filtrées comme filterjit et filtergrad, couches avec état comme BatchNorm, et entraînement complet sur un problème de régression synthétique, le tout combiné avec Optax pour l'optimisation et Jaxtyping pour les annotations de forme. L'intérêt pratique d'Equinox réside dans la façon dont il résout une friction fondamentale de JAX : comment gérer des paramètres entraînables et des métadonnées non-différentiables dans le même objet. Avec les transformations filtrées, il devient possible d'appliquer jit ou grad uniquement sur les feuilles numériques du modèle, en excluant automatiquement les chaînes de caractères, entiers ou booléens qui définissent l'architecture. Cette distinction évite les erreurs de traçage silencieuses qui affectent les approches naïves. Pour les chercheurs qui travaillent sur des architectures expérimentales, où l'on mélange souvent des hyperparamètres fixes et des poids appris, c'est un gain de fiabilité et de lisibilité significatif. Les couches comme BatchNorm, qui maintiennent un état interne (moyenne courante, variance), sont également prises en charge de manière explicite, sans recourir à des contournements complexes. Equinox s'inscrit dans un mouvement plus large qui voit JAX gagner du terrain dans la recherche en apprentissage automatique, notamment face à PyTorch. Google DeepMind, qui l'utilise intensivement, ainsi que de nombreux laboratoires académiques ont adopté cet écosystème pour sa capacité à composer des transformations fonctionnelles (différentiation, vectorisation, parallélisme) de façon modulaire. Equinox se positionne comme une alternative à Flax ou Haiku, les deux bibliothèques historiques de l'écosystème JAX, en privilegiant une syntaxe plus proche de PyTorch tout en restant purement fonctionnelle. Avec l'essor des modèles de grande taille et les besoins croissants en parallélisme matériel, des outils qui séparent clairement la structure du modèle de son état numérique devraient continuer à gagner en adoption dans les mois à venir.

OutilsTuto
1 source
OpenAI transforme ChatGPT en plateforme d'automatisation d'équipe avec des agents de travail
570The Decoder 

OpenAI transforme ChatGPT en plateforme d'automatisation d'équipe avec des agents de travail

OpenAI déploie une nouvelle fonctionnalité dans ChatGPT baptisée "workspace agents", qui représente une évolution majeure des GPTs personnalisés lancés en 2023. Ces agents, propulsés par Codex, le moteur de programmation d'OpenAI, sont conçus pour automatiser des flux de travail complexes au sein des équipes professionnelles. Contrairement aux interactions classiques avec un chatbot, ces agents peuvent s'exécuter en arrière-plan, sans surveillance humaine active, et enchaîner des tâches sur la durée. L'enjeu est considérable pour les entreprises : il ne s'agit plus de demander une réponse ponctuelle à un assistant IA, mais de déléguer des processus entiers, comme la gestion de rapports, la coordination entre outils ou le traitement de données récurrentes. Ce basculement transforme ChatGPT d'un simple outil conversationnel en véritable plateforme d'automatisation d'équipe, positionnant OpenAI en concurrence directe avec des solutions comme Microsoft Copilot, Notion AI ou encore les agents proposés par Google Workspace. Cette annonce s'inscrit dans une course effrénée à l'agentique, où les grands acteurs de l'IA cherchent à s'ancrer durablement dans les outils de productivité professionnelle. OpenAI a précisé que les GPTs personnalisés existants resteraient disponibles dans l'immédiat, une transition progressive devant être proposée ultérieurement. Le choix de Codex comme moteur sous-jacent suggère une orientation forte vers les tâches techniques et développeur, même si les usages visés dépassent largement ce seul périmètre.

UEL'adoption des workspace agents ChatGPT par les entreprises européennes soulève des enjeux de conformité RGPD, les processus métier et données sensibles étant délégués à une plateforme américaine.

OutilsOutil
1 source
OpenAI lance Privacy Filter, un modèle open source de suppression des données personnelles dans les jeux de données d'entreprise
571VentureBeat AI 

OpenAI lance Privacy Filter, un modèle open source de suppression des données personnelles dans les jeux de données d'entreprise

OpenAI a publié Privacy Filter, un modèle open source spécialisé dans la détection et la suppression des informations personnelles identifiables (PII) avant qu'elles n'atteignent un serveur distant. Disponible sur Hugging Face sous licence Apache 2.0, cet outil repose sur 1,5 milliard de paramètres mais n'en active que 50 millions à chaque traitement, grâce à une architecture Sparse Mixture-of-Experts qui réduit considérablement la charge de calcul. Contrairement aux grands modèles de langage classiques qui lisent un texte de gauche à droite, Privacy Filter est un classificateur bidirectionnel de tokens : il analyse chaque phrase dans les deux sens simultanément, ce qui lui permet de mieux distinguer, par exemple, si le prénom "Alice" désigne une personne privée ou un personnage littéraire public. Le modèle gère une fenêtre de contexte de 128 000 tokens, suffisante pour traiter un document juridique entier en une seule passe, et s'appuie sur un décodeur de Viterbi contraint avec un schéma de balisage BIOES pour garantir la cohérence des entités redactées. Il détecte huit catégories de données sensibles : noms de personnes, coordonnées, identifiants numériques, URLs, numéros de compte, dates et identifiants secrets comme les clés API. L'enjeu concret est considérable pour les entreprises soumises au RGPD ou à la réglementation HIPAA dans le secteur de la santé. En déployant Privacy Filter directement sur leurs serveurs internes ou dans leur cloud privé, elles peuvent anonymiser les données localement avant de les envoyer vers un modèle plus puissant comme GPT-5 ou gpt-oss-120b, sans jamais exposer d'informations sensibles à l'extérieur. Ce modèle résout un problème structurel de l'adoption de l'IA en entreprise : le risque que des données confidentielles, médicales ou financières se retrouvent intégrées dans des pipelines d'inférence ou de fine-tuning hébergés dans le cloud. La possibilité de faire tourner le modèle sur un laptop standard ou directement dans un navigateur web abaisse encore davantage la barrière d'entrée. Cette publication s'inscrit dans un retour marqué d'OpenAI vers l'open source, après des années centrées sur des modèles propriétaires accessibles uniquement via ChatGPT et l'API. Début 2025, l'entreprise avait déjà lancé la famille gpt-oss, des modèles à poids ouverts orientés raisonnement, puis ouvert plusieurs outils d'orchestration agentique. Privacy Filter est un dérivé direct de cette famille gpt-oss, réentraîné pour la classification plutôt que la génération. Ce virage stratégique suggère qu'OpenAI cherche à consolider sa position dans l'écosystème développeur face à la concurrence de Meta (LLaMA), Mistral et Google, en proposant des briques d'infrastructure que les entreprises peuvent intégrer sans dépendance à ses services payants. La prochaine étape logique serait l'extension des catégories PII supportées et l'intégration native dans les frameworks agentiques déjà publiés.

UELes entreprises françaises et européennes soumises au RGPD peuvent déployer Privacy Filter en local pour anonymiser leurs données sensibles avant tout envoi vers un service cloud, réduisant directement leur risque de non-conformité réglementaire.

💬 C'est exactement le verrou qui bloquait l'adoption en entreprise depuis deux ans. Un modèle léger, déployable en local, qui filtre les données personnelles avant d'envoyer vers le cloud : sur le papier, c'est le genre de brique qu'on attendait. Et distribuer ça sous Apache 2.0, c'est malin : si ton pipeline s'appuie sur leurs outils gratuits, tu vas finir par appeler leurs modèles payants derrière.

OutilsOutil
1 source
Privacy Filter : découvrez le nouvel outil OpenAI capable de protéger vos données personnelles
572Le Big Data 

Privacy Filter : découvrez le nouvel outil OpenAI capable de protéger vos données personnelles

OpenAI a publié le 22 avril 2026 Privacy Filter, son premier modèle open source de l'année, sous licence Apache 2.0. Il s'agit d'un modèle de classification de tokens bidirectionnel, dérivé de GPT-OSS, conçu pour détecter et masquer automatiquement les données personnelles dans des textes non structurés : noms, adresses, numéros d'identification, e-mails, secrets d'API et autres informations identifiables. Avec seulement 1,5 milliard de paramètres, le modèle est suffisamment compact pour tourner en local, y compris directement dans un navigateur. Il supporte une fenêtre de contexte de 128 000 tokens, ce qui lui permet d'analyser des documents longs en une seule passe. Sur le benchmark PII-Masking-300k, il affiche des résultats proches du haut du classement après ajustements des données d'évaluation, et OpenAI précise en utiliser déjà une version optimisée en interne. Ce lancement répond à un besoin concret dans les environnements professionnels où l'IA traite des volumes croissants de données sensibles : logs d'agents, pipelines d'entraînement, systèmes de journalisation. En fonctionnant entièrement en local, Privacy Filter évite d'exposer les données à des serveurs externes, ce qui réduit les risques de fuite et simplifie la conformité réglementaire, notamment face au RGPD. Contrairement aux approches classiques fondées sur des règles fixes, le modèle analyse le contexte linguistique, ce qui améliore la détection des informations implicites ou formulées de manière indirecte. Les développeurs peuvent en outre ajuster les seuils de filtrage pour moduler l'équilibre entre précision et rappel selon leurs cas d'usage, et le modèle est disponible en formats Transformers et ONNX pour une intégration flexible. Ce mouvement s'inscrit dans une tendance plus large : celle des grands laboratoires d'IA qui cherchent à regagner la confiance des entreprises en proposant des outils de gouvernance des données intégrés dès la conception, plutôt qu'ajoutés après coup. OpenAI, longtemps critiqué pour ses pratiques d'utilisation des données d'entraînement, envoie ici un signal à destination des équipes techniques et des directions juridiques qui conditionnent le déploiement de l'IA à des garanties de confidentialité. Le choix de l'open source sous Apache 2.0 facilite aussi l'adoption dans des environnements régulés où les dépendances propriétaires sont problématiques. La société prévient néanmoins que Privacy Filter n'est pas une solution universelle et que ses performances varient selon les langues et les contextes, laissant ouverte la question de son efficacité sur des données très spécifiques ou des formats atypiques.

UELa conformité RGPD est directement facilitée pour les entreprises françaises et européennes : le modèle tourne en local sans envoi de données vers des serveurs externes, simplifiant les obligations de traitement des données personnelles.

OutilsOutil
1 source
Google Meet va aussi prendre des notes IA pour les réunions en présentiel
573The Verge 

Google Meet va aussi prendre des notes IA pour les réunions en présentiel

Google étend les capacités de son assistant IA Gemini aux réunions en présentiel : la fonction de prise de notes automatique, jusqu'ici réservée aux appels Google Meet, peut désormais générer des résumés et des transcriptions lors de réunions physiques, mais aussi lors de visioconférences Zoom et Microsoft Teams. Cette évolution, révélée par 9to5Google, marque une sortie de la phase alpha où la fonctionnalité était uniquement disponible sur Android pour un groupe restreint d'utilisateurs. Elle est désormais accessible plus largement, sans contrainte de salle de réunion ni de rendez-vous planifié à l'avance. L'impact est significatif pour les professionnels qui alternent entre réunions virtuelles et physiques : Gemini devient un assistant de réunion universel, indépendant du support utilisé. La possibilité de capturer automatiquement les échanges lors d'une discussion informelle dans un couloir ou d'une réunion de dernière minute représente un gain de temps concret. Google précise également qu'un participant distant peut rejoindre une réunion en présentiel en basculant vers un appel vidéo classique. Cette annonce s'inscrit dans une course entre les grands acteurs technologiques pour intégrer l'IA dans les flux de travail quotidiens. Microsoft propose des fonctions similaires via Copilot dans Teams, et plusieurs startups comme Otter.ai ou Fireflies.ai ont bâti leur modèle entier sur la transcription de réunions. En élargissant Gemini au-delà de son propre écosystème, Google adopte une stratégie d'ubiquité visant à fidéliser les utilisateurs professionnels quel que soit leur environnement de collaboration.

UELes professionnels européens utilisant Google Workspace peuvent désormais bénéficier de la prise de notes automatique Gemini dans leurs réunions physiques et sur Zoom ou Teams, sans dépendre d'un outil tiers.

OutilsOutil
1 source
JiuwenClaw ouvre la voie à l'ingénierie de coordination, nouvelle étape dans la maîtrise du génie logiciel
574MarkTechPost 

JiuwenClaw ouvre la voie à l'ingénierie de coordination, nouvelle étape dans la maîtrise du génie logiciel

La communauté open source openJiuwen a publié une nouvelle version de JiuwenClaw intégrant une fonctionnalité appelée AgentTeam, qui introduit un concept inédit baptisé "Coordination Engineering". L'idée : faire travailler plusieurs agents d'intelligence artificielle ensemble comme une équipe humaine soudée, capable de se répartir les tâches, de communiquer entre eux et de livrer un résultat complexe sans aucune intervention humaine. La démonstration la plus frappante de cette capacité a été réalisée lors de tests internes : le système a produit une présentation technique de 200 diapositives, structurée et logiquement cohérente, en moins de 20 minutes. Pour ce faire, un agent "Leader" a décomposé le sujet en dix axes d'analyse, confié chaque axe à un agent dédié chargé de générer 20 slides, puis fusionné l'ensemble sous une thématique unifiée. Ce type de collaboration multi-agents représente un franchissement de cap significatif dans la conception des systèmes d'IA autonomes. Jusqu'ici, la plupart des architectures d'agents reposaient sur un pilotage humain constant ou sur des pipelines rigides et préprogrammés. Avec AgentTeam, la coordination devient dynamique : le Leader construit l'équipe selon les besoins du projet, peut ajouter ou retirer des membres en cours d'exécution, et chaque agent revendique ses tâches de manière proactive sur un tableau de bord partagé. Les dépendances entre tâches sont gérées automatiquement, et un mécanisme de récupération sur incident prend en charge les pannes sans intervention extérieure. Pour les entreprises cherchant à automatiser des processus de production de contenu, d'analyse ou de développement logiciel, ce niveau d'autonomie organisationnelle pourrait réduire considérablement le besoin de supervision humaine. Ce développement s'inscrit dans une tendance plus large de l'industrie de l'IA vers les systèmes multi-agents, où des acteurs comme OpenAI, Anthropic ou des projets open source concurrents explorent des architectures permettant à plusieurs LLMs de collaborer. JiuwenClaw se distingue en formalisant trois mécanismes techniques précis : une hiérarchie Leader/Teammates avec planification dynamique, un espace de fichiers partagé accessible à tous les agents de l'équipe, et un système de validation à deux niveaux où le Leader doit approuver les plans d'exécution sensibles avant leur mise en oeuvre. Le projet est disponible en open source sur GitHub. La prochaine étape pour l'écosystème sera de déterminer si cette approche tient à plus grande échelle, avec des équipes d'agents plus nombreuses, des tâches plus longues, et des environnements moins contrôlés que les démonstrations actuelles.

OutilsOutil
1 source
Amazon Bedrock intègre la mémoire d'entreprise avec Amazon Neptune et Mem0
575AWS ML Blog 

Amazon Bedrock intègre la mémoire d'entreprise avec Amazon Neptune et Mem0

TrendMicro, l'un des plus grands éditeurs mondiaux de logiciels antivirus, a déployé une architecture de mémoire persistante pour son chatbot d'entreprise Trend's Companion, en collaboration avec les équipes AWS et son Generative AI Innovation Center. Le système repose sur trois piliers technologiques : Amazon Bedrock pour l'orchestration des agents IA, Amazon Neptune pour stocker un graphe de connaissances propre à chaque entreprise cliente, et Mem0 pour gérer à la fois la mémoire conversationnelle à court terme et la mémoire persistante à long terme. Concrètement, lorsqu'un utilisateur envoie un message, le modèle Claude sur Amazon Bedrock extrait automatiquement les entités, relations et éléments mémorisables, qui sont ensuite vectorisés via Amazon Bedrock Titan Text Embed et indexés dans Amazon OpenSearch Service et Neptune. Un mécanisme de réordonnancement via Amazon Bedrock Rerank ou Cohere Rerank garantit que les informations les plus pertinentes remontent en priorité lors de chaque requête. L'enjeu est de taille pour les chatbots d'entreprise : jusqu'ici, ces systèmes perdaient le fil dès qu'une conversation se terminait, obligeant les utilisateurs à se répéter et rendant impossible toute capitalisation sur les échanges passés. Avec cette architecture, le chatbot peut désormais référencer l'historique des interactions, retrouver des connaissances organisationnelles structurées et adapter ses réponses au contexte spécifique d'une entreprise cliente, sans que l'utilisateur ait besoin de tout réexpliquer. Un mécanisme de validation humaine renforce encore la fiabilité du système : après chaque réponse, l'IA associe ses affirmations aux souvenirs précis sur lesquels elle s'est appuyée, et l'utilisateur peut approuver ou rejeter ces associations. Les mémoires validées restent dans la base de connaissances ; les autres sont supprimées d'OpenSearch et de Neptune. Ce "human-in-the-loop" donne aux entreprises un contrôle direct sur la qualité et la fiabilité du savoir accumulé par leur chatbot. Cette initiative s'inscrit dans une tendance de fond qui voit les grands éditeurs tech chercher à transformer leurs assistants IA de simples répondeurs en véritables agents dotés de mémoire organisationnelle. TrendMicro fait face à une clientèle d'entreprises qui attendent des outils capables de comprendre leur environnement propre, leurs processus internes et leur historique de support, sans compromettre la sécurité des données. Le choix d'Amazon Neptune comme socle du graphe de connaissances est particulièrement significatif : contrairement à une base vectorielle classique, un graphe permet de modéliser des relations complexes entre entités, offrant une précision structurée que la recherche sémantique seule ne peut pas atteindre. A mesure que les agents IA autonomes se généralisent dans les entreprises, ce type d'architecture hybride, combinant graphe de connaissances, mémoire vectorielle et validation humaine, pourrait s'imposer comme un standard pour tout déploiement IA à l'échelle organisationnelle.

OutilsOutil
1 source
Agentforce Vibes 2.0 de Salesforce s'attaque à un problème méconnu : la surcharge de contexte dans les agents IA
576VentureBeat AI 

Agentforce Vibes 2.0 de Salesforce s'attaque à un problème méconnu : la surcharge de contexte dans les agents IA

La plateforme australienne de financement de startups VentureCrowd a réduit de 90 % la durée de certains cycles de développement front-end grâce à des agents IA de codage, mais cette performance a eu un prix. Diego Mogollon, directeur produit de l'entreprise, a constaté que les agents raisonnaient exclusivement à partir des données accessibles au moment de l'exécution, ce qui les rendait «confiants et faux» dès que le contexte fourni était incomplet ou mal structuré. Le problème identifié porte un nom : le «context bloat», ou gonflement de contexte, un phénomène où les agents IA accumulent progressivement trop de données, d'instructions et d'outils au fil de workflows de plus en plus complexes. Pour y répondre, Salesforce vient de publier Agentforce Vibes 2.0, une mise à jour de sa plateforme de développement d'agents intégrée à l'écosystème Salesforce, disponible dès le plan gratuit. Cette version étend la compatibilité avec des frameworks tiers comme ReAct et introduit deux nouveaux concepts : les Abilities, qui définissent ce que l'agent cherche à accomplir, et les Skills, qui désignent les outils qu'il utilisera pour y parvenir. Le problème du gonflement de contexte est plus structurel qu'il n'y paraît. Plus un agent dispose de contexte, plus il consomme de tokens, ce qui ralentit les traitements et fait grimper les coûts. Pour les entreprises qui déploient ces systèmes à grande échelle, cela se traduit par une perte de contrôle sur la latence, la fiabilité et les budgets. Mogollon résume le paradoxe central : «Ce n'est pas un problème d'IA, c'est un problème de contexte déguisé en problème d'IA, et c'est le premier mode d'échec que j'observe dans les implémentations agentiques.» VentureCrowd a d'ailleurs dû restructurer l'ensemble de sa base de code avant même de pouvoir déployer des agents efficaces, les agents amplifiant les défauts des données qu'ils reçoivent. L'approche de Salesforce avec Agentforce Vibes 2.0 se distingue par son intégration native aux modèles de données existants des entreprises, plutôt que de chercher à minimiser le contexte. D'autres plateformes adoptent une philosophie différente : Claude Code et Codex d'OpenAI privilégient une exécution autonome, où les agents lisent des fichiers et exécutent des commandes en continu, avec des mécanismes de compaction activés lorsque le contexte devient trop volumineux. La tendance générale est à la gestion du contexte croissant plutôt qu'à sa limitation, ce qui soulève des questions de fond pour l'ensemble du secteur. Avec la multiplication des workflows agentiques complexes en entreprise, la maîtrise du contexte s'impose comme un enjeu technique et économique de premier plan, et les éditeurs qui proposeront les architectures les plus efficientes sur ce point prendront un avantage concurrentiel décisif.

OutilsOutil
1 source
Alibaba lance l'avatar "Qwen XiaoJiuWo" pour unifier son écosystème d'assistants IA
577Pandaily 

Alibaba lance l'avatar "Qwen XiaoJiuWo" pour unifier son écosystème d'assistants IA

Alibaba a officiellement lancé le 22 avril 2026 "Qwen XiaoJiuWo", un avatar numérique destiné à incarner l'interface unifiée de tout son écosystème d'intelligence artificielle Qwen. Ce personnage virtuel sera intégré à l'application Qwen avant d'être progressivement déployé sur les grandes plateformes du groupe : Taobao, Fliggy, Amap et Alipay. Selon les données du registre commercial, Alibaba (China) Co., Ltd. a déposé plusieurs marques liées à "Qwen XiaoJiuWo" dès le 10 mars 2026, couvrant des domaines aussi variés que l'IA en tant que service (AIaaS), les logiciels de chatbot et la robotique humanoïde. Ces dépôts sont encore en cours d'examen. L'application Qwen comptait en mars 2026 quelque 166 millions d'utilisateurs actifs mensuels, selon QuestMobile, ce qui la place en deuxième position parmi les applications natives d'IA en Chine. Sur le seul premier trimestre 2026, la base d'utilisateurs a progressé d'environ 126 millions. Ce lancement ne constitue pas un nouveau produit à proprement parler, mais une stratégie de cohérence de marque dans un marché extrêmement concurrentiel. En dotant son assistant d'une identité visuelle forte et reconnaissable, Alibaba cherche à fidéliser ses utilisateurs et à créer un sentiment de continuité entre des plateformes très différentes. La fréquence d'utilisation mensuelle reste cependant un point de vigilance : avec 19,8 sessions par utilisateur en moyenne, Qwen se situe en dessous de plusieurs concurrents directs, ce qui suggère que l'engagement reste à consolider malgré la croissance spectaculaire du nombre d'inscrits. Ce mouvement s'inscrit dans une compétition acharnée entre les géants technologiques chinois pour dominer le marché de l'IA grand public. Baidu avec Ernie Bot, ByteDance et ses propres modèles, ainsi que des acteurs plus récents comme DeepSeek exercent une pression croissante sur Alibaba. Le dépôt de marques incluant la robotique humanoïde laisse entrevoir des ambitions bien au-delà du simple chatbot. Alibaba semble vouloir faire de Qwen XiaoJiuWo un point d'entrée transversal vers l'ensemble de ses services numériques, pariant sur l'unification de l'expérience utilisateur comme levier de différenciation à long terme.

OutilsOpinion
1 source
OpenClaw peine à confirmer après son succès fulgurant
578The Information AI 

OpenClaw peine à confirmer après son succès fulgurant

OpenClaw, un logiciel d'agents IA devenu en quelques mois l'un des projets open source à la croissance la plus rapide de l'histoire de la tech, se retrouve à un carrefour délicat. Porté par une communauté de volontaires, ce projet a explosé du jour au lendemain sans que ses mainteneurs n'aient eu le temps d'anticiper une telle adoption. Aujourd'hui, ses responsables doivent décider s'ils transforment OpenClaw en outil fiable pour les entreprises, ou s'ils préservent l'ADN expérimental qui a fait son succès. La question n'est pas anodine : les entreprises qui intègrent des agents IA dans leurs processus métier ont besoin de stabilité, de documentation, de support et de garanties de pérennité que des équipes bénévoles peinent structurellement à offrir. Si OpenClaw ne franchit pas ce cap, il risque de rester un outil de laboratoire réservé aux développeurs avertis, laissant le terrain aux solutions commerciales concurrentes capables d'absorber les exigences des grands comptes. Le phénomène OpenClaw illustre une tension bien connue dans l'open source : les projets qui percent brutalement se retrouvent écrasés par leur propre succès, sans les ressources pour absorber la charge. Dans un secteur des agents IA en pleine ébullition, où des dizaines de frameworks se disputent l'adhésion des développeurs, la fenêtre pour s'imposer comme standard de référence est courte. Les mainteneurs devront probablement choisir entre chercher des financements externes, créer une fondation ou une entité commerciale, ou risquer que la communauté se fragmente autour de forks mieux gouvernés.

OutilsOutil
1 source
Photon lance Spectrum, framework TypeScript open source pour déployer des agents IA sur iMessage, WhatsApp et Telegram
579MarkTechPost 

Photon lance Spectrum, framework TypeScript open source pour déployer des agents IA sur iMessage, WhatsApp et Telegram

Photon, une société d'infrastructure spécialisée dans l'exécution d'agents IA à faible latence, a lancé Spectrum, un SDK open-source en TypeScript et une plateforme cloud qui permettent de déployer des agents IA directement sur iMessage, WhatsApp, Telegram, Slack, Discord, Instagram et d'autres messageries grand public. Disponible sous licence MIT via npm install spectrum-ts, le framework offre une interface de programmation unifiée : les développeurs écrivent la logique de leur agent une seule fois, et Spectrum gère la livraison sur chaque plateforme. Pour étendre un agent d'iMessage à WhatsApp, il suffit d'ajouter une entrée dans le tableau providers. L'infrastructure repose sur un réseau edge-first qui affiche une latence de bout en bout mesurée entre 150 et 250 millisecondes, contre 500 ms à 1,5 seconde pour la moyenne du secteur CPaaS, avec un engagement de disponibilité de 99,9 %. Le SDK inclut un rendu adaptatif qui ajuste automatiquement la mise en forme aux contraintes natives de chaque plateforme, permettant par exemple d'envoyer un sondage structuré dans l'application Messages d'Apple sans tomber sur un rendu en texte brut. Ce lancement s'attaque à l'un des problèmes les plus persistants du secteur : la distribution des agents IA. Malgré des capacités de raisonnement remarquables, la grande majorité des agents restent cantonnés à des interfaces développeurs ou des applications spécialisées que le grand public n'installe jamais. En permettant de déployer un agent directement dans les messageries que des milliards de personnes utilisent quotidiennement, Spectrum supprime la friction d'adoption qui freine concrètement l'usage. Pour les équipes produit, cela signifie qu'un assistant IA peut apparaître dans la liste de contacts d'un utilisateur comme n'importe quel autre interlocuteur, sans téléchargement ni inscription. La précision des types pour les messages entrants et sortants réduit également une catégorie entière d'erreurs de production fréquentes dans les déploiements d'agents. Le problème de distribution que Spectrum cherche à résoudre est structurel : l'essor des LLM a largement devancé les mécanismes pour les rendre accessibles au-delà des communautés techniques. Les CPaaS existants comme Twilio ont historiquement ciblé la messagerie transactionnelle, pas les workloads conversationnels à haute fréquence des agents IA. Photon se positionne donc sur un segment encore peu occupé, à l'intersection de l'infrastructure de messagerie et de l'orchestration d'agents. Le SDK expose également une API definePlatform pour créer des connecteurs vers des plateformes non standard, ce qui élargit le périmètre potentiel bien au-delà des intégrations actuelles. Le support de Python, Go, Rust et Swift est annoncé dans la feuille de route, ce qui laisse anticiper une adoption rapide au-delà de l'écosystème TypeScript. La vraie question reste de savoir si la promesse de latence et de fiabilité tient à l'échelle, une fois que des équipes de production commenceront à s'y appuyer sérieusement.

UELe SDK facilite le déploiement d'agents IA sur WhatsApp et Telegram, très utilisés en France et dans l'UE, ce qui pourrait réduire la friction d'adoption pour les développeurs européens souhaitant toucher le grand public.

OutilsOutil
1 source
Le rôle de l'IA dans le développement des bots de trading forex
580AI News 

Le rôle de l'IA dans le développement des bots de trading forex

L'intelligence artificielle transforme en profondeur le développement des robots de trading sur le marché des changes (forex), un secteur qui brasse quotidiennement plus de 7 500 milliards de dollars d'échanges à travers le monde. Là où les premiers robots forex reposaient sur des règles statiques, entrer en position lorsqu'une moyenne mobile franchit un seuil précis, sortir lorsqu'un prix cible est atteint, les systèmes modernes intègrent désormais des techniques d'apprentissage automatique, de traitement du langage naturel (NLP), d'apprentissage profond et de renforcement par essais-erreurs. Ces architectures permettent aux algorithmes de s'entraîner sur des historiques de données, d'identifier des corrélations complexes entre indicateurs techniques et variables macroéconomiques, puis d'ajuster leurs stratégies en continu à mesure que de nouvelles données arrivent. Le NLP joue un rôle particulier : il permet aux systèmes de scanner en temps réel les annonces des banques centrales, les rapports économiques et les flux d'actualités financières pour détecter des changements de sentiment susceptibles de faire bouger les paires de devises. L'impact le plus concret de cette évolution concerne la gestion du risque. Les marchés des changes sont réputés pour leur volatilité et leur fonctionnement 24 heures sur 24, cinq jours par semaine, ce qui rend la surveillance manuelle exhaustive pratiquement impossible même pour les traders les plus expérimentés. Les systèmes pilotés par IA peuvent surveiller simultanément des dizaines de signaux, mouvements de prix, niveaux de volatilité, évolutions de liquidité, corrélations entre paires de devises, et identifier des signaux d'alerte bien plus tôt que les méthodes traditionnelles. Cette capacité à traiter des volumes massifs d'informations hétérogènes en temps réel représente un avantage décisif : elle réduit l'exposition aux pertes soudaines tout en permettant de saisir des opportunités fugaces que l'analyse humaine ne pourrait pas détecter à cette vitesse. Cette mutation s'inscrit dans une transformation plus large de la finance algorithmique. Pendant des décennies, les robots de trading ont été l'apanage des grandes institutions, banques d'investissement, fonds spéculatifs, qui disposaient des ressources pour développer et maintenir des systèmes sophistiqués. La démocratisation des frameworks d'apprentissage automatique open source et la réduction des coûts de calcul cloud ont progressivement ouvert ce terrain aux traders indépendants et aux petites sociétés de gestion. Les modèles peuvent désormais être réentraînés régulièrement pour intégrer les nouvelles dynamiques de marché, ce qui réduit l'obsolescence rapide qui frappait les anciens robots à règles fixes. La question qui se pose pour les acteurs du secteur n'est plus de savoir si l'IA doit intégrer leurs systèmes de trading, mais à quelle vitesse et avec quels garde-fous humains maintenir dans la boucle de décision.

UELes gérants de fonds et traders indépendants européens sont concernés par la démocratisation de ces outils algorithmiques, mais l'article n'aborde aucune spécificité réglementaire ou institutionnelle propre à l'UE.

OutilsOutil
1 source
Créez vos clips de recettes IA sans passer des heures au montage : le guide de survie des créateurs culinaires - avril 2026
581Le Big Data 

Créez vos clips de recettes IA sans passer des heures au montage : le guide de survie des créateurs culinaires - avril 2026

En avril 2026, la plateforme de montage automatisé Submagic a publié un guide pratique destiné aux créateurs de contenu culinaire, présentant son outil AI Clip Maker comme une solution clé pour produire des vidéos de recettes adaptées aux réseaux sociaux sans intervention manuelle prolongée. L'outil analyse les rushs bruts pour en extraire automatiquement les séquences à fort impact : bruits caractéristiques comme le croustillant d'un pain ou le crépitement d'une poêle, moments de découpe, dressage final. Il intègre également un recadrage intelligent en format 9:16 qui suit les déplacements du sujet à l'écran, ainsi qu'un sous-titrage automatique qui transcrit les paroles en éléments graphiques superposés à l'image, ingrédients, quantités, temps de cuisson, pour une lecture possible sans le son. L'enjeu est directement économique pour des milliers de créateurs indépendants actifs sur Instagram Reels, TikTok ou YouTube Shorts. Le montage d'une vidéo culinaire professionnelle représente traditionnellement plusieurs heures de travail par production : dérushage, découpe, recadrage, sous-titrage, rythme. En automatisant ces étapes, des outils comme Submagic permettent de multiplier le volume de publications sans augmenter proportionnellement le temps de travail, ce qui constitue un avantage concurrentiel direct dans un espace saturé où la fréquence de publication influence fortement les algorithmes de recommandation. La consommation silencieuse des vidéos, majoritaire dans les transports et lieux publics, renforce par ailleurs l'utilité des sous-titres automatiques, devenus un standard de facto du format. Ce type d'outils s'inscrit dans un mouvement plus large d'industrialisation de la création de contenu, porté par la démocratisation des modèles de vision par ordinateur capables d'analyser simultanément pistes audio et vidéo. Depuis 2024, plusieurs acteurs comme Descript, Captions ou CapCut ont intégré des fonctions similaires d'auto-montage et de recadrage, transformant progressivement le métier de créateur en exercice de supervision plutôt que d'exécution technique. La niche culinaire est particulièrement visée car elle combine des contraintes techniques fortes, format vertical, plans serrés sur textures, narration fragmentée, avec une audience massive et monétisable. La question qui se pose désormais pour l'industrie est celle de la différenciation : quand tous les créateurs utilisent les mêmes algorithmes de montage, c'est la qualité du tournage brut et la personnalité éditoriale qui redeviennent les seuls facteurs distinctifs.

OutilsOutil
1 source
OpenAI prépare Hermes pour ChatGPT : Le « tueur d’emplois » ultime ?
582Le Big Data 

OpenAI prépare Hermes pour ChatGPT : Le « tueur d’emplois » ultime ?

OpenAI travaille en secret sur une fonctionnalité majeure pour ChatGPT, baptisée en interne "Hermes". Les premières informations proviennent de captures d'écran issues de tests internes, diffusées le 21 avril 2026 par Tibor Blaho, un leaker reconnu pour la fiabilité de ses révélations sur OpenAI. D'après ces images, Hermes serait une plateforme complète dédiée aux agents IA, intégrant un outil de création appelé "Studio", des modèles de workflows prêts à l'emploi, ainsi qu'un système de planification. Les agents pourraient fonctionner 24h/24 et 7j/7, être déployés dans des services tiers comme Slack, et se voir attribuer des compétences, fichiers, instructions et mémoire persistante. Un utilisateur pourrait, par exemple, confier à un agent la gestion des messages Slack entrants pendant la nuit ou la génération automatique d'un rapport hebdomadaire chaque lundi matin. L'enjeu est considérable pour le marché du travail et l'industrie technologique. Si Hermes tient ses promesses, combiné à Codex, l'outil de génération de code d'OpenAI, il pourrait automatiser une part significative des tâches administratives et répétitives au sein des entreprises. Les postes concernés ne disparaîtraient pas nécessairement du jour au lendemain, mais pourraient se réduire progressivement à des fonctions de supervision, selon les observateurs du secteur. Pour les entreprises, cela représenterait un levier de productivité important. Pour les travailleurs du tertiaire, c'est une pression supplémentaire sur des métiers déjà fragilisés par l'automatisation croissante des processus. Hermes s'inscrit dans une stratégie plus large d'OpenAI visant à transformer ChatGPT en une véritable plateforme d'agents, en capitalisant sur les GPT personnalisés et le générateur de workflows déjà présents. Aucun calendrier officiel ni détail technique n'ont été communiqués par l'entreprise, qui reste délibérément discrète. Selon certains observateurs, ce silence serait lié à des contraintes d'infrastructure : OpenAI voudrait s'assurer de disposer d'une capacité de calcul suffisante avant d'annoncer un lancement et de déclencher une explosion de la demande. En parallèle, d'autres fonctionnalités seraient en développement, dont une personnalisation des images à partir d'une photo de référence dans ImageGen, un "Concours Images 2.0" et un mode "Résumé audio" offrant plusieurs formats allant du podcast radio au briefing exécutif. OpenAI se retrouve en compétition directe avec Google, Microsoft et des acteurs émergents comme Cohere sur le segment des agents d'entreprise, un marché que tous considèrent comme le prochain terrain décisif de l'IA générative.

UESi Hermes est lancé, les travailleurs européens du tertiaire seraient exposés à une automatisation accrue de leurs tâches administratives et répétitives via ChatGPT.

OutilsOutil
1 source
Tencent lance une bêta internationale de sa plateforme d'agents IA QClaw
583Pandaily 

Tencent lance une bêta internationale de sa plateforme d'agents IA QClaw

Tencent Cloud a lancé le 21 avril 2026 la version bêta internationale de QClaw, sa plateforme d'agents IA destinée au grand public. Développé par l'équipe Tencent PC Manager et construit sur le framework open-source OpenClaw, le produit avait d'abord été lancé sur le marché chinois en mars 2026. La version internationale intègre plus de 80 mises à jour fonctionnelles et a été développée en à peine cinq jours, la majorité du code ayant été générée par intelligence artificielle. QClaw est actuellement disponible en accès anticipé aux États-Unis, au Canada, à Singapour et en Corée du Sud, avec une prise en charge multilingue. Durant cette phase bêta, les utilisateurs reçoivent une allocation quotidienne de tokens et l'accès anticipé reste limité en nombre de places. La proposition centrale de QClaw est de rendre les agents IA accessibles sans installation ni compétences techniques particulières. La plateforme propose un "Agent Playground" rassemblant des rôles variés comme des coachs fitness ou des tuteurs en langues, et s'intègre avec les principaux modèles du marché, notamment GPT et Claude. Un mécanisme de sécurité intégré surveille et valide les actions exécutées par les agents, répondant directement aux inquiétudes croissantes autour de l'autonomie des IA. Ce positionnement "plug-and-play" cible un segment de marché encore peu saturé : les utilisateurs non-développeurs qui souhaitent bénéficier de l'automatisation sans friction technique. Cette sortie internationale s'inscrit dans la stratégie d'expansion mondiale accélérée des géants technologiques chinois, qui cherchent à exporter leurs outils IA à mesure que le marché intérieur arrive à maturité. Tencent rejoint ainsi Alibaba, ByteDance et d'autres acteurs dans la course à l'adoption internationale de leurs plateformes IA. La vitesse de développement revendiquée, cinq jours pour une mise à jour majeure, illustre comment les entreprises utilisent désormais l'IA pour accélérer leur propre cycle de production logicielle. La compatibilité avec des modèles concurrents comme Claude signale une approche ouverte visant à maximiser l'adoption, plutôt qu'un écosystème fermé. Les prochains mois diront si QClaw peut s'imposer face à des concurrents comme Manus ou les offres d'agents d'OpenAI sur ces marchés anglophones.

OutilsOutil
1 source
OpenAI publie en open source Euphony, un outil de visualisation web pour les données Harmony Chat et les sessions Codex
584MarkTechPost 

OpenAI publie en open source Euphony, un outil de visualisation web pour les données Harmony Chat et les sessions Codex

OpenAI a publié en open source Euphony, un outil de visualisation fonctionnant directement dans le navigateur, conçu pour transformer des données de conversation structurées en vues interactives lisibles. L'outil prend en charge deux formats propriétaires d'OpenAI : les conversations au format Harmony et les fichiers de session Codex au format JSONL. Euphony peut ingérer ces données de trois manières : en collant du JSON directement depuis le presse-papiers, en chargeant un fichier local, ou en pointant vers une URL publique, y compris des datasets hébergés sur Hugging Face. Une fois les données chargées, l'outil détecte automatiquement le format et rend une timeline de conversation navigable, avec un panneau d'inspection des métadonnées, un mode grille pour parcourir rapidement de grands datasets, un mode édition pour modifier le contenu JSONL dans le navigateur, et un filtrage basé sur JMESPath pour interroger les structures JSON complexes. Ce problème est concret pour quiconque travaille avec des agents IA multi-étapes : un agent Codex qui lit des fichiers, appelle des API, génère du code et révise ses propres sorties peut produire des centaines de lignes de JSON brut, où tokens bruts, chaînes décodées et métadonnées structurées s'entremêlent. Sans outillage dédié, retracer ce que le modèle faisait à chaque étape revient à reconstituer un puzzle sans image de référence. Euphony répond directement à ce besoin en rendant exploitable une richesse de données qui jusqu'ici restait enfouie dans des fichiers difficilement lisibles à l'œil nu. Pour les équipes d'évaluation et de fine-tuning, la possibilité d'inspecter des champs de métadonnées par conversation, scores, sources, labels, directement dans l'interface représente un gain de productivité significatif. Le contexte technique éclaire pourquoi cet outil était nécessaire. Le format Harmony, utilisé pour entraîner la série de modèles open-weight gpt-oss d'OpenAI, est structurellement plus riche qu'un format de chat standard : il supporte des sorties multi-canaux (raisonnement, appels d'outils, réponses normales dans une même conversation), des hiérarchies d'instructions basées sur les rôles (system, developer, user, assistant) et des namespaces d'outils nommés. Cette richesse est précieuse pour l'entraînement et l'évaluation, mais elle rend l'inspection manuelle particulièrement pénible. Euphony est disponible en deux modes : un mode purement frontend sans dépendance serveur, activé via la variable d'environnement VITEEUPHONYFRONTEND_ONLY=true, et un mode assisté par un serveur FastAPI local qui gère le chargement de datasets volumineux et le rendu Harmony côté backend. L'outil est également conçu pour être intégré comme composant web dans d'autres applications, ce qui ouvre la voie à une adoption dans des pipelines d'évaluation ou des interfaces internes d'équipes IA.

OutilsOutil
1 source
Hugging Face lance ml-intern, un agent IA open source qui automatise l'après-entraînement des LLM
585MarkTechPost 

Hugging Face lance ml-intern, un agent IA open source qui automatise l'après-entraînement des LLM

Hugging Face a publié ml-intern, un agent d'intelligence artificielle open-source conçu pour automatiser de bout en bout le post-entraînement des grands modèles de langage (LLM). Construit sur le framework smolagents de la société, l'outil est capable de réaliser de manière autonome des revues de littérature scientifique sur arXiv, de découvrir des jeux de données sur le Hub Hugging Face, d'exécuter des scripts d'entraînement et d'évaluer itérativement les résultats, le tout sans intervention humaine. Lors d'une démonstration officielle, l'agent a pris le modèle de base Qwen3-1.7B, qui obtenait initialement environ 10 % sur le benchmark GPQA de raisonnement scientifique, et l'a porté à 32 % en moins de 10 heures sur un seul GPU H100, franchissant la barre des 27,5 % en seulement trois heures. Ce résultat dépasse celui de Claude Code d'Anthropic, actuellement à 22,99 % sur cette même tâche, et se rapproche du record actuel de 33 % obtenu avec le modèle Gemma-3-4B, deux fois plus grand. L'impact de ml-intern est direct pour les équipes de recherche en machine learning : il automatise un cycle de travail qui mobilise habituellement plusieurs ingénieurs pendant plusieurs jours. L'agent gère la génération de données synthétiques lorsque les jeux de données existants sont insuffisants, comme dans un test médical où il a produit des exemples d'entraînement ciblant des cas limites en langage médical et en réponse d'urgence multilingue. Il implémente également des techniques avancées comme le Group Relative Policy Optimization (GRPO), une variante du RLHF moins gourmande en mémoire que le PPO standard, en surveillant les courbes de récompense et en lançant des ablations pour identifier les composants efficaces. L'ensemble du suivi expérimental repose sur Trackio, un outil natif au Hub présenté comme alternative open-source à Weights & Biases. Cette publication s'inscrit dans une tendance de fond : l'automatisation du travail des chercheurs en IA par des agents eux-mêmes entraînés à raisonner sur des pipelines ML. Le benchmark PostTrainBench, développé par l'université de Tübingen et le Max Planck Institute, a servi de cadre d'évaluation standardisé, contraignant les agents à post-entraîner un modèle de base en moins de 10 heures. En positionnant ml-intern comme supérieur à Claude Code sur cette tâche précise, Hugging Face signale une ambition claire : faire de son écosystème, du Hub aux outils d'entraînement, une plateforme autonome et intégrée capable de rivaliser avec les solutions propriétaires d'Anthropic ou de Google. La disponibilité en open-source de l'agent ouvre la voie à des adaptations communautaires rapides, et le benchmark PostTrainBench devrait s'imposer comme référence pour évaluer les prochaines générations de ces outils.

UEHugging Face, entreprise française cofondatrice de l'écosystème open-source IA européen, renforce son positionnement face aux solutions propriétaires américaines en offrant aux équipes de recherche françaises et européennes un agent gratuit capable d'automatiser le post-entraînement de LLMs sans dépendance cloud.

OutilsOutil
1 source
Construire un pipeline d'optimisation bayésienne conditionnelle des hyperparamètres avec Hyperopt, TPE et arrêt anticipé
586MarkTechPost 

Construire un pipeline d'optimisation bayésienne conditionnelle des hyperparamètres avec Hyperopt, TPE et arrêt anticipé

Un tutoriel publié récemment détaille l'implémentation complète d'un pipeline d'optimisation bayésienne des hyperparamètres en Python, en combinant la bibliothèque Hyperopt et l'algorithme TPE (Tree-structured Parzen Estimator). L'objectif est de construire un espace de recherche conditionnel qui bascule dynamiquement entre deux familles de modèles (régression logistique et machines à vecteurs de support SVM), en explorant des plages de paramètres distinctes pour chacune. Le code s'appuie sur scikit-learn pour la construction de pipelines et l'évaluation par validation croisée stratifiée en 5 plis, appliquée au jeu de données Breast Cancer. Pour la régression logistique, les paramètres explorés incluent le coefficient de régularisation C sur une plage logarithmique de 1e-4 à 1e2, le solveur (lbfgs ou liblinear) et le nombre d'itérations maximum entre 200 et 2000. Pour le SVM, l'algorithme explore les noyaux rbf et polynomial, ainsi que les paramètres C et gamma. Le tutoriel intègre également un arrêt précoce déclenché dès que les améliorations de la fonction de perte stagnent, ainsi qu'une analyse complète de l'objet Trials, qui consigne l'historique de chaque évaluation effectuée. Pour les praticiens du machine learning, l'optimisation manuelle des hyperparamètres reste coûteuse en temps et peu reproductible. L'approche bayésienne présentée dépasse les méthodes classiques comme la recherche par grille ou la recherche aléatoire : au lieu d'explorer l'espace de paramètres de façon exhaustive ou aveugle, TPE modélise la distribution des configurations performantes et oriente intelligemment les essais suivants. La structure conditionnelle de l'espace de recherche, rendue possible par hp.choice dans Hyperopt, évite de tester des paramètres non pertinents pour une architecture donnée, réduisant ainsi le nombre d'évaluations inutiles. L'intégration du mécanisme d'arrêt précoce basé sur la stagnation des résultats permet en outre d'économiser des ressources de calcul significatives, un avantage concret dès que les modèles deviennent coûteux à entraîner. Hyperopt est une bibliothèque Python open source dont les bases théoriques remontent aux travaux de James Bergstra et ses collaborateurs sur les estimateurs de Parzen et l'optimisation bayésienne. Dans un contexte où l'entraînement de grands modèles mobilise des budgets considérables, l'optimisation efficace des hyperparamètres est devenue un enjeu industriel de premier plan. Des outils concurrents comme Optuna, Ray Tune ou Weights & Biases Sweeps proposent des fonctionnalités similaires voire plus avancées, mais Hyperopt conserve une base d'utilisateurs fidèle pour sa simplicité et son intégration directe dans des pipelines scikit-learn. Le framework présenté est conçu pour être étendu à l'apprentissage profond et aux environnements distribués, ce qui en fait un point d'entrée solide pour des équipes souhaitant industrialiser leur processus de tuning sans repartir de zéro.

OutilsTuto
1 source
Orchestration d'agents
587MIT Technology Review 

Orchestration d'agents

Les agents IA orchestrés en réseau constituent désormais la prochaine grande rupture technologique. Alors que ChatGPT a rendu les grands modèles de langage accessibles au grand public, les outils multi-agents représentent une étape qualitativement différente : des systèmes capables de déléguer, coordonner et exécuter des tâches complexes en parallèle. Claude Code, lancé par Anthropic l'année dernière, permet par exemple de piloter simultanément plusieurs dizaines de sous-agents, chacun affecté à une portion distincte d'une base de code. Chez OpenAI, Codex joue un rôle similaire. Anthropic affirme avoir développé son application de productivité Claude Cowork en seulement dix jours grâce à Claude Code, là où un projet comparable aurait nécessité plusieurs mois. Perplexity a également lancé Computer, un outil généraliste pour professionnels. Google DeepMind propose de son côté Co-Scientist, une plateforme qui permet aux chercheurs de confier à des équipes d'agents la recherche bibliographique, la génération d'hypothèses et la conception d'expériences. L'enjeu dépasse largement le secteur du logiciel. Ces outils s'adressent désormais à tous les cols blancs : gestion de boîtes mail, suivi d'inventaires, traitement des réclamations clients. La promesse centrale est de transformer le travailleur qualifié en chef de projet capable de superviser une équipe d'agents, multipliant ainsi sa productivité. Les partisans de cette technologie évoquent une rupture comparable à ce que la chaîne d'assemblage de Henry Ford a représenté pour l'industrie manufacturière au siècle dernier : une réorganisation profonde du travail de connaissance, potentiellement synonyme de suppressions massives de postes dans les fonctions tertiaires ou, à l'inverse, d'un bond de productivité sans précédent pour ceux qui sauront maîtriser ces outils. La montée en puissance de ces systèmes s'inscrit dans une dynamique portée par les géants de la tech. Des entreprises comme Nvidia et Tencent ont déjà commencé à développer leurs propres agents en s'appuyant sur des bases open source, comme celles popularisées par OpenClaw, un assistant personnel vocal qui avait capté l'attention malgré des failles de sécurité notoires. La vraie question qui se pose aujourd'hui n'est plus technique mais systémique : jusqu'où peut-on laisser des agents autonomes interagir avec des infrastructures critiques, des systèmes de santé, des plateformes financières ou des réseaux sociaux ? Les grands modèles de langage restent imprévisibles, et ce qui n'est qu'une erreur bénigne dans une interface de chat peut devenir un incident grave lorsque l'agent agit directement dans le monde réel. Le secteur avance vite, mais le cadre de contrôle, lui, peine à suivre.

UELa prolifération d'agents autonomes dans les fonctions tertiaires et les infrastructures critiques interpelle directement le cadre réglementaire européen, notamment l'AI Act qui classe certains usages d'agents autonomes comme systèmes à haut risque nécessitant audit et supervision humaine.

OutilsOutil
1 source
Google lance des agents Deep Research capables d'explorer le web et vos données privées
588VentureBeat AI 

Google lance des agents Deep Research capables d'explorer le web et vos données privées

Google a dévoilé lundi une mise à jour majeure de ses agents de recherche autonomes, en lançant deux nouvelles versions de son outil Deep Research dans l'API Gemini : Deep Research et Deep Research Max. Construits sur le modèle Gemini 2.5 Pro, ces agents permettent pour la première fois aux développeurs de combiner des données issues du web ouvert avec des informations internes à l'entreprise via un seul appel API. Ils intègrent également la génération native de graphiques et d'infographies directement dans les rapports produits, ainsi que la connexion à des sources de données tierces grâce au protocole MCP (Model Context Protocol). Les deux agents sont disponibles dès aujourd'hui en prévisualisation publique dans les offres payantes de l'API Gemini. Sur le plan des performances, Google annonce des scores de 93,3 % sur le benchmark DeepSearchQA et 54,6 % sur HLE pour la version Max, selon un message du PDG Sundar Pichai publié sur X. Les deux agents répondent à des besoins différents selon une logique de compromis entre vitesse et exhaustivité. Deep Research, la version standard, est optimisée pour des usages interactifs à faible latence : elle convient aux interfaces utilisateurs qui doivent répondre à des questions analytiques complexes en quasi-temps réel, comme un tableau de bord financier. Deep Research Max, à l'inverse, mobilise un calcul étendu à l'inférence pour produire des analyses plus profondes et mieux sourcées, conçues pour des workflows asynchrones en arrière-plan. C'est l'outil pour une équipe d'analystes qui lance une série de rapports de due diligence avant de quitter le bureau et les récupère entièrement traités le lendemain matin. C'est surtout la prise en charge du protocole MCP qui constitue le saut qualitatif le plus significatif : elle permet aux agents d'interroger des bases de données privées, des référentiels documentaires internes et des services de données spécialisés, transformant Deep Research d'un outil de veille web en quelque chose qui s'approche d'un analyste de données universel. Ce lancement s'inscrit dans une course qui s'intensifie entre les grands acteurs de l'IA pour proposer des systèmes capables de conduire de manière autonome des recherches multi-sources, un travail qui mobilise traditionnellement des heures, voire des jours, d'analyse humaine. Google positionne cette infrastructure comme l'épine dorsale des workflows de recherche en entreprise, notamment dans la finance, les sciences du vivant et l'intelligence de marché. La première version de Deep Research avait été lancée en décembre 2025 via l'Interactions API, et le produit aurait « gagné beaucoup de terrain en trois mois », selon Logan Kilpatrick, responsable des relations développeurs chez Google AI. Ce déploiement accéléré signale que Google entend faire de son API Gemini une plateforme centrale pour les applications d'agents d'entreprise, un segment où OpenAI, Anthropic et Microsoft se disputent également une position dominante.

UELes entreprises européennes intégrant leurs données internes via MCP devront vérifier la conformité RGPD avant d'adopter cette API.

OutilsOutil
1 source
Windows et Copilot : 5 astuces secrètes à connaître
589Le Big Data 

Windows et Copilot : 5 astuces secrètes à connaître

Microsoft intègre depuis plusieurs mois Copilot directement dans Windows 11, transformant l'assistant d'intelligence artificielle en outil natif accessible depuis n'importe quel contexte de travail. Parmi les fonctionnalités les moins connues, le raccourci clavier Alt + Barre d'espace permet d'invoquer Copilot instantanément par-dessus toute application ouverte, sans quitter l'écran actif. Sur les PC labellisés Copilot+, une touche physique dédiée remplit la même fonction. L'interface s'affiche soit en panneau latéral fixe, soit en fenêtre flottante compacte, selon les préférences configurées dans les paramètres système. Par ailleurs, Windows 11 intègre désormais un mode vocal accessible via une icône micro dans l'interface de l'assistant, permettant des échanges parlés en temps réel, avec transcription immédiate et réponse écrite, ou lue à voix haute selon le matériel. Le raccourci Win + H active quant à lui la dictée globale du système comme alternative complémentaire. Ces fonctionnalités changent concrètement la manière dont les professionnels interagissent avec leur machine. L'objectif affiché de Microsoft est de réduire les micro-interruptions : consulter l'IA sans minimiser ses fenêtres, poser une question vocalement sans structurer sa phrase, obtenir une aide sur une formule Excel ou une reformulation sans changer d'application. Pour les utilisateurs qui passent de longues heures sur des tâches cognitives, le gain en concentration est réel. Le mode vocal est particulièrement pertinent pour le brainstorming ou l'explication de problèmes complexes, où la fluidité orale dépasse la rapidité de frappe. Ces usages font de Copilot moins un moteur de recherche amélioré qu'un véritable partenaire de travail intégré au flux quotidien. Cette évolution s'inscrit dans la stratégie globale de Microsoft de placer l'IA au coeur de Windows, accélérée depuis l'investissement massif dans OpenAI et le lancement de Copilot en 2023. La certification Copilot+ PC, introduite en 2024, définit un nouveau standard matériel incluant une puce NPU dédiée aux traitements d'IA locaux, permettant des fonctions comme Recall ou la génération d'images en temps réel. L'enjeu pour Microsoft est double : différencier Windows face à macOS sur le terrain de l'IA embarquée, et pousser les entreprises vers des abonnements Microsoft 365 Copilot, facturés 30 dollars par utilisateur par mois. La question qui reste ouverte est celle de l'adoption réelle : beaucoup de ces raccourcis et modes restent ignorés du grand public, ce qui explique la multiplication de guides pratiques pour démocratiser des usages que Microsoft juge pourtant centraux dans sa vision de l'informatique personnelle de demain.

UELes entreprises françaises et européennes sous Microsoft 365 sont directement concernées par l'abonnement Copilot à 30 $/utilisateur/mois, un surcoût à peser dans leurs décisions d'adoption.

OutilsOutil
1 source
Agents IA autonomes : les meilleurs outils à installer en local sur son PC
590Le Big Data 

Agents IA autonomes : les meilleurs outils à installer en local sur son PC

Les agents IA autonomes capables de s'exécuter directement sur un ordinateur personnel constituent une nouvelle génération d'outils radicalement différents des chatbots classiques. Contrairement à ces derniers, ils ne se contentent pas de répondre à des questions : ils planifient et exécutent des missions complexes de façon indépendante, en décomposant un objectif large en étapes logiques, en vérifiant leurs propres résultats et en ajustant leur stratégie en cas d'erreur. Sur le plan technique, ces systèmes s'appuient sur un modèle de langage (LLM) comme moteur de raisonnement, couplé à une mémoire de suivi et à des outils d'action concrets, lecture de fichiers, navigation web, exécution de code. Des frameworks comme LangChain, CrewAI ou AutoGen structurent ces opérations, tandis que des applications comme GPT4All (développée par Nomic AI) ou Ollama permettent de faire tourner localement des modèles comme Llama 3 ou Mistral. Le choix du modèle dépend directement du matériel disponible : un modèle de 7 milliards de paramètres quantifié (Q4/Q5) exige environ 8 Go de VRAM, quand la précision standard (fp16) double ce besoin, et les modèles de 13 à 34 milliards de paramètres requièrent au moins 24 Go. L'intérêt principal de cette exécution en local réside dans la souveraineté des données et l'indépendance opérationnelle. Les documents sensibles ne quittent jamais le disque dur, ce qui supprime les risques liés aux fuites de données sur des serveurs tiers. L'absence de connexion internet requise élimine également les pannes dépendant de services cloud, les frais d'API et les abonnements mensuels. Pour les professionnels manipulant des données confidentielles, données médicales, juridiques, financières, cette rupture avec le cloud représente un changement de paradigme concret. Les outils comme Lain Agent ciblent les utilisateurs non techniques sous Windows sans configuration avancée, tandis qu'AutoGen ou LangChain offrent aux développeurs une flexibilité totale pour connecter ces agents à des systèmes Git, des bases de données ou des pipelines d'automatisation. Ce mouvement vers l'IA locale s'inscrit dans une tendance plus large de démocratisation matérielle accélérée par la montée en puissance des GPU grand public et des puces NPU intégrées dans les processeurs modernes. Pendant des années, exécuter un LLM performant nécessitait une infrastructure serveur hors de portée du particulier. La quantification des modèles et l'optimisation des runtimes comme Ollama ont radicalement abaissé cette barrière. Les acteurs impliqués sont aussi bien des laboratoires de recherche open source (Meta avec Llama, Mistral AI) que des startups spécialisées dans l'outillage local (Nomic AI). La prochaine étape logique sera l'intégration native de ces agents dans les systèmes d'exploitation et les environnements de développement, rendant l'autonomie locale accessible sans aucune configuration technique préalable.

UEMistral AI (entreprise française) est citée comme acteur clé du mouvement open source local, et la souveraineté des données mise en avant répond directement aux contraintes RGPD pesant sur les entreprises européennes.

OutilsOutil
1 source
Google révolutionne la maison connectée : Gemini devient vraiment naturel
591Le Big Data 

Google révolutionne la maison connectée : Gemini devient vraiment naturel

Google a annoncé le 21 avril 2026 le déploiement de la fonctionnalité "Conversation continue" sur ses appareils équipés de l'assistant Gemini pour la maison connectée. Répondant à une demande largement exprimée par les utilisateurs du programme d'accès anticipé, cette mise à jour supprime l'obligation de répéter le mot d'activation "Hey Google" à chaque nouvelle commande. Concrètement, après une première interaction, le micro reste actif quelques secondes, permettant d'enchaîner les échanges sans relancer la commande vocale. Le déploiement s'accompagne de plusieurs évolutions : conservation du contexte conversationnel entre les répliques, prise en charge multilingue étendue à toutes les langues compatibles avec Google Home, amélioration de la détection pour distinguer les conversations informelles des vraies commandes, et ouverture de la fonctionnalité à l'ensemble des occupants d'un foyer, invités compris. L'activation se fait depuis les paramètres de l'application Google Home, et s'applique automatiquement à tous les appareils compatibles du domicile. Ce changement est significatif car il s'attaque à l'un des principaux freins à l'adoption quotidienne des assistants vocaux : la friction liée aux déclencheurs répétitifs. En rendant les échanges plus continus et moins mécaniques, Google cherche à transformer Gemini en interlocuteur réel plutôt qu'en outil à commandes isolées. Pour les foyers avec plusieurs occupants, la compatibilité multi-utilisateurs sans configuration individuelle représente un gain d'accessibilité concret. Pour les professionnels du secteur de la maison connectée, fabricants de dispositifs compatibles Google Home inclus, cette évolution redéfinit le niveau d'expérience utilisateur attendu, et pousse indirectement à réévaluer la conception des interactions vocales dans leurs propres produits. Cette mise à jour s'inscrit dans une course à la naturalité entre les grands acteurs de l'assistant vocal domestique. Amazon avec Alexa, Apple avec Siri HomeKit et Google se livrent depuis plusieurs années une compétition où la qualité de la conversation est devenue l'enjeu central, après avoir longtemps misé sur l'étendue du catalogue d'appareils compatibles. L'intégration de Gemini dans l'écosystème Google Home, amorcée progressivement depuis le tournant LLM de 2023-2024, marque l'aboutissement d'une stratégie visant à remplacer l'ancien Assistant par un modèle de langage plus capable. La prochaine étape probable concerne la mémoire à long terme entre sessions et la personnalisation contextuelle poussée, deux axes sur lesquels OpenAI et Anthropic exercent également une pression indirecte via leurs propres interfaces conversationnelles. La maison connectée entre dans une phase où l'intelligence du dialogue prime sur le simple catalogue de commandes.

UELa fonctionnalité 'Conversation continue' est disponible pour les utilisateurs francophones de Google Home, le français étant inclus dans les langues compatibles dès le déploiement.

OutilsOutil
1 source
Claude Code s'étend à toute l'organisation via Amazon Bedrock
592AWS ML Blog 

Claude Code s'étend à toute l'organisation via Amazon Bedrock

Anthropic et Amazon Web Services ont annoncé le lancement de Claude Cowork dans Amazon Bedrock, une intégration qui permet aux entreprises de déployer l'application de bureau Claude directement depuis leur infrastructure AWS. Concrètement, les utilisateurs téléchargent l'application Claude Desktop sur leur machine, puis le service informatique de l'entreprise pousse une configuration centralisée via des outils de gestion de parc comme Jamf, Microsoft Intune ou Group Policy. L'inférence est entièrement routée vers Amazon Bedrock dans les régions AWS choisies par l'organisation, sans licence par siège payée à Anthropic : la facturation est à la consommation, intégrée à l'accord AWS existant. L'application donne accès aux projets, artefacts, mémoire, import-export de fichiers, connecteurs distants et serveurs MCP. Les fonctionnalités nécessitant l'infrastructure Anthropic, onglet Chat, Computer Use, Skills Marketplace, sont exclues de cette offre. L'enjeu dépasse la seule productivité des développeurs. Claude Cowork vise à étendre l'adoption de l'IA à l'ensemble des travailleurs de la connaissance d'une organisation : chefs de produit, analystes, équipes juridiques ou RH peuvent déléguer de la recherche documentaire, de l'analyse de fichiers, de la génération de rapports, sans quitter leur environnement de travail habituel. Pour les entreprises soumises à des contraintes réglementaires strictes, l'argument central est la souveraineté des données : Amazon Bedrock ne stocke pas les prompts, fichiers, inputs ou outputs d'outils, ni les réponses du modèle, et ne les utilise pas pour entraîner des modèles fondamentaux. Les profils d'inférence régionaux, cross-régionaux ou globaux permettent de choisir le niveau de résidence des données adapté à chaque juridiction. Cette annonce s'inscrit dans une dynamique plus large de déploiement entreprise de l'IA générative, où les grands groupes cherchent à concilier puissance des modèles de pointe et exigences de conformité interne. AWS et Anthropic approfondissent ainsi un partenariat stratégique amorcé il y a plusieurs années, Amazon ayant investi plusieurs milliards de dollars dans Anthropic. Pour les organisations qui utilisent déjà Claude Code dans Bedrock pour leurs équipes techniques, la même configuration peut être réutilisée pour déployer Cowork. L'intégration avec IAM, VPC endpoints, CloudTrail et CloudWatch permet une gouvernance et une observabilité natives. La prochaine étape probable : étendre les capacités des serveurs MCP disponibles dans ce contexte géré, afin de connecter Claude aux systèmes métier internes sans compromettre l'isolation réseau.

UELes entreprises européennes soumises au RGPD peuvent déployer Claude à grande échelle via leurs régions AWS européennes, avec résidence des données garantie et sans que les prompts ou fichiers soient utilisés pour entraîner des modèles.

OutilsOutil
1 source
Une seule API, des rapports complets : la révolution Deep Research est là
593Le Big Data 

Une seule API, des rapports complets : la révolution Deep Research est là

Google a officiellement lancé le 21 avril 2026 deux nouveaux agents d'analyse accessibles via l'API Gemini : Deep Research et Deep Research Max. Alimentés par le modèle Gemini 3.1 Pro, ces agents transforment une simple requête en rapport d'analyse structuré, en enchaînant automatiquement la collecte de données, le recoupement de sources et la mise en forme des résultats. Deep Research cible les usages interactifs qui privilégient la rapidité, tandis que Deep Research Max adopte une approche plus exhaustive, multipliant les sources et affinant ses conclusions pour une précision accrue. L'API génère également des infographies et des graphiques directement intégrés aux rapports, rendant les données exploitables sans passer par des outils tiers. Des acteurs spécialisés comme FactSet, S&P Global et PitchBook participent déjà à l'écosystème, confirmant l'ancrage industriel de la démarche. Ce lancement change concrètement la façon dont les entreprises peuvent mobiliser l'IA pour l'analyse. Jusqu'ici, les outils de recherche automatisée se limitaient à récupérer des réponses ponctuelles ; l'API Deep Research orchestre un véritable processus d'investigation autonome. Elle connecte le web ouvert aux bases de données internes via le Model Context Protocol, permettant aux organisations d'intégrer leurs données propriétaires dans le flux d'analyse sans les exposer à l'extérieur. L'accès au web peut même être désactivé entièrement, ce qui ouvre la porte aux secteurs soumis à des contraintes de confidentialité strictes, finance, santé, droit. Les utilisateurs conservent par ailleurs un contrôle précis : ils peuvent ajuster le plan de recherche avant son exécution et suivre les étapes en temps réel, ce qui renforce la traçabilité des résultats produits. Cette évolution s'inscrit dans une course technologique qui s'est accélérée depuis que les grands laboratoires ont compris que la valeur des LLM ne réside pas seulement dans la génération de texte, mais dans leur capacité à raisonner sur des corpus complexes et hétérogènes. OpenAI avait ouvert la voie avec son propre produit Deep Research début 2025 ; Google répond aujourd'hui avec une offre directement exposée en API, ciblant les développeurs et les équipes analytiques plutôt que les seuls utilisateurs finaux. Les domaines visés, études de marché, sciences de la vie, analyse financière, sont précisément ceux où le coût de production d'un rapport de qualité est élevé et où la vitesse d'analyse constitue un avantage concurrentiel direct. La prochaine étape sera de mesurer si la qualité des rapports produits tient face aux standards des analystes humains dans ces secteurs exigeants.

UELes entreprises françaises des secteurs finance, santé et droit peuvent intégrer cette API d'analyse autonome dans leurs systèmes propriétaires via le Model Context Protocol, sans exposer leurs données à des services externes.

OutilsOutil
1 source
Google lance des agents Deep Research et Deep Research Max pour automatiser la recherche complexe
594The Decoder 

Google lance des agents Deep Research et Deep Research Max pour automatiser la recherche complexe

Google DeepMind a lancé Deep Research Max, un nouvel agent IA reposant sur Gemini 2.5 Pro, capable de mener des recherches autonomes sur le web et dans des sources de données propriétaires. Pour la première fois, les développeurs peuvent connecter des flux financiers et d'autres sources spécialisées via le Model Context Protocol (MCP). L'agent accompagne une version standard, Deep Research, déjà disponible dans les produits Google, tandis que la variante Max vise davantage les usages professionnels et techniques. L'enjeu est considérable pour les secteurs où l'analyse de données complexes est chronophage : finance, droit, recherche académique, conseil stratégique. En automatisant la collecte et la synthèse d'informations issues de sources hétérogènes, y compris des bases propriétaires inaccessibles au grand public, ces agents pourraient transformer le travail d'analyste ou de chercheur. La possibilité de brancher des flux financiers en temps réel via MCP représente une ouverture concrète vers des cas d'usage enterprise jusqu'ici difficiles à couvrir avec des LLM généralistes. Google s'inscrit ici dans une course intense aux agents de recherche autonomes : OpenAI a lancé son propre Deep Research début 2025, et Perplexity propose des fonctionnalités similaires. Le Model Context Protocol, initialement développé par Anthropic, s'impose progressivement comme standard d'interopérabilité entre agents IA et sources de données tierces, ce qui explique l'adoption par Google. Les benchmarks avancés restent peu transparents sur leur méthodologie, un point de vigilance récurrent dans ce secteur où les annonces marketing précèdent souvent les preuves indépendantes.

UELes entreprises européennes des secteurs finance, droit et conseil stratégique peuvent tester cet agent pour automatiser l'analyse de sources propriétaires via MCP.

OpenAI lance Euphony : la révolution Codex qui change la lecture des conversations IA
595Le Big Data 

OpenAI lance Euphony : la révolution Codex qui change la lecture des conversations IA

OpenAI a publié le 21 avril 2026 un nouvel outil open-source baptisé Euphony, conçu pour visualiser les données de chat et les journaux de sessions Codex. Concrètement, l'outil permet aux développeurs de coller une URL publique ou d'importer un fichier local, et Euphony convertit automatiquement ces données brutes en une interface de messagerie lisible dans le navigateur. L'outil prend en charge le rendu Markdown complet, y compris les formules mathématiques et les blocs de code, une fonction de traduction intégrée pour les sessions en langue étrangère, ainsi qu'un mode éditeur permettant de modifier directement le texte et les métadonnées sans changer d'environnement. Le filtrage par requêtes JMESPath permet de trier des milliers de conversations selon des critères très précis, tandis qu'un mode Focus masque les appels d'outils techniques pour ne conserver que le dialogue essentiel. Les développeurs peuvent également partager un lien direct vers un message spécifique et annoter les réponses avec des étiquettes colorées personnalisables. Cet outil répond à un problème concret et quotidien pour quiconque travaille avec des LLMs en production : les logs de sessions d'IA sont volumineux, structurés de façon peu intuitive, et difficiles à analyser manuellement. En rendant ces données navigables visuellement, Euphony accélère les cycles d'évaluation et de débogage. La visualisation des jetons Harmony, qui montre comment le modèle segmente chaque mot, apporte une transparence supplémentaire sur le fonctionnement interne du pipeline. Pour les équipes qui construisent ou affinent des agents IA, la possibilité d'annoter, de filtrer et de partager des extraits précis transforme un outil de consultation en véritable tableau de bord d'évaluation collaborative. OpenAI positionne Euphony dans un contexte où Codex, son moteur de génération de code, est de plus en plus utilisé pour des tâches complexes et des sessions longues générant des volumes importants de données conversationnelles. La publication en open-source signale une stratégie d'ouverture vers la communauté développeur, cohérente avec d'autres initiatives récentes de la société visant à rendre l'écosystème Codex plus accessible. En intégrant nativement le contenu système et les métadonnées développeur dans l'interface, l'outil comble un angle mort des environnements de développement actuels, où l'inspection du contexte complet d'une session reste fastidieuse. La prochaine étape logique serait une intégration directe dans les environnements de développement ou les plateformes d'évaluation de modèles, un marché où des acteurs comme LangSmith ou Weights & Biases sont déjà bien établis.

OutilsOutil
1 source
596AWS ML Blog 

Traçabilité de bout en bout avec DVC et Amazon SageMaker AI MLflow

Les équipes de machine learning en production font face à un problème récurrent : retracer précisément l'origine d'un modèle déployé. Quelle version du jeu de données l'a entraîné ? Peut-on reproduire à l'identique un modèle mis en production il y a six mois ? Amazon Web Services propose une réponse concrète en combinant trois outils : DVC (Data Version Control), Amazon SageMaker AI et SageMaker AI MLflow Apps. L'architecture s'articule en quatre étapes : un job SageMaker Processing prétraite les données brutes et les versionne via DVC en les poussant vers Amazon S3 ; un job SageMaker Training clone le dépôt DVC à un tag Git précis, récupère le dataset exact via dvc pull, entraîne le modèle et enregistre tout dans MLflow. Chaque run MLflow stocke un identifiant datagitcommit_id, soit le hash DVC pointant vers le dataset exact dans S3. Le modèle entraîné est ensuite enregistré dans le MLflow Model Registry et peut être déployé sur un endpoint SageMaker. La chaîne de traçabilité complète devient alors : modèle en production → run MLflow → commit DVC → dataset dans Amazon S3. Cet enchaînement répond à un besoin critique dans les secteurs régulés : santé, services financiers, véhicules autonomes. Dans ces domaines, les exigences d'audit imposent de relier chaque modèle déployé à ses données d'entraînement précises, et de pouvoir exclure à la demande des enregistrements individuels des futurs cycles d'entraînement. Sans ce niveau de traçabilité, une question apparemment simple, "quelles données ont servi à entraîner le modèle actuellement en production ?", peut mobiliser plusieurs jours d'enquête dans des logs dispersés, des notebooks et des buckets S3. La solution proposée réduit ce risque opérationnel en rendant la traçabilité structurelle plutôt qu'optionnelle. DVC est un outil open source gratuit qui étend Git pour gérer des datasets volumineux et des artefacts ML que Git seul ne peut pas versionner. MLflow, de son côté, assure le suivi des expériences, le registre des modèles et la lignée. Les deux outils couvrent chacun la moitié du problème de traçabilité, et leur combinaison ferme la boucle. L'implémentation requiert un compte AWS avec des permissions sur SageMaker, S3, CodeCommit et IAM, Python 3.11 ou 3.12, et le SDK SageMaker v3.4.0 minimum. Les notebooks utilisent AWS CodeCommit comme backend Git pour les métadonnées DVC, mais l'architecture est compatible avec GitHub, GitLab ou Bitbucket moyennant un simple remplacement de l'URL remote. AWS publie des notebooks d'accompagnement permettant de déployer les deux patterns décrits, traçabilité au niveau du dataset et traçabilité au niveau de l'enregistrement individuel, directement dans un compte AWS existant.

UELa traçabilité structurelle décrite répond directement aux exigences de documentation et d'auditabilité imposées par l'AI Act européen pour les systèmes d'IA à haut risque dans les secteurs régulés (santé, finance, véhicules autonomes).

OutilsTuto
1 source
597VentureBeat AI 

Von recommande tous les grands modèles IA pour l'analyse des revenus, et automatise leur combinaison

Von, une nouvelle plateforme d'intelligence artificielle lancée par l'équipe derrière Rattle, une startup spécialisée dans l'automatisation des processus, s'attaque à un paradoxe bien connu dans les entreprises tech : si les outils comme Claude Code ou Cursor ont radicalement transformé le quotidien des développeurs, les équipes commerciales restent, elles, prisonnières de silos de données, de saisies manuelles dans les CRM et de reportings approximatifs. Fondée par Sahil Aggarwal, Von se positionne non pas comme une solution ponctuelle supplémentaire, mais comme une "couche d'intelligence" unifiée pour les équipes Go-To-Market. La plateforme commence par construire un "graphe de contexte" de l'entreprise en ingérant des données structurées issues de CRM comme Salesforce et HubSpot, ainsi que des données non structurées provenant d'enregistreurs d'appels (Gong, Zoom, Chorus), de fils de messagerie et de documentation interne. Elle s'appuie ensuite sur une architecture multi-modèles : Claude d'Anthropic pour le raisonnement de haut niveau, ChatGPT pour le traitement massif de données, et Gemini de Google pour la génération de contenus créatifs comme les présentations et rapports. Lors d'une démonstration, Von a analysé 101 comptes PME pour identifier les risques de désabonnement en un peu plus de trois minutes, une tâche qu'un analyste humain effectuerait en une à deux semaines. L'enjeu est considérable pour les opérations commerciales. L'un des problèmes chroniques des équipes de vente est l'écart entre ce qui est enregistré dans un CRM et ce qui s'est réellement dit lors d'un appel client. Von résout ce problème en croisant automatiquement les transcriptions d'appels avec les données Salesforce, permettant d'identifier des incohérences dans les raisons de pertes de deals ou d'évaluer la santé d'une opportunité commerciale sur la base du sentiment réel exprimé, et non d'une mise à jour manuelle d'un commercial. La plateforme génère également des fiches de briefing pré-appel, des analyses de victoires et défaites commerciales regroupées par thèmes, et automatise les tâches administratives Salesforce à faible valeur ajoutée. En agissant comme un "Data Scientist IA" ou un "VP RevOps" virtuel, Von promet de libérer les équipes des tâches de reporting répétitives pour les recentrer sur la vente. Ce positionnement s'inscrit dans une tendance plus large de l'IA d'entreprise : après avoir conquis les workflows techniques, les grandes plateformes cherchent à s'implanter dans les fonctions commerciales et opérationnelles, historiquement moins automatisées. Von hérite de l'expertise de Rattle dans l'intégration des outils de vente, ce qui lui confère une connaissance fine des flux de données GTM. Le choix d'une stratégie "mixture of models" plutôt que d'un modèle unique reflète une maturité technique croissante dans l'industrie, où l'optimisation coût-performance dicte désormais l'architecture des solutions. La prochaine étape pour Von sera de démontrer sa capacité à s'imposer face à des acteurs établis comme Clari, Gong ou Salesforce Einstein dans un marché de l'intelligence des revenus déjà très concurrentiel et en pleine consolidation.

OutilsOutil
1 source
598AI News 

Snowflake élargit ses plateformes IA techniques et grand public

Snowflake a annoncé une expansion significative de ses deux plateformes d'intelligence artificielle, Snowflake Intelligence et Cortex Code, lors d'une mise à jour publiée cette semaine. Snowflake Intelligence cible les employés non techniques qui souhaitent automatiser des tâches métier en langage naturel : préparer des présentations, lancer des analyses multi-étapes ou envoyer des messages de suivi. Cortex Code, lui, s'adresse aux équipes de développement logiciel en entreprise. Parmi les nouveautés : des intégrations élargies avec Google Workspace, Jira, Salesforce et Slack via le protocole MCP (Model Context Protocol), de nouvelles connexions à des sources de données externes comme AWS Glue, Databricks et PostgreSQL, ainsi qu'un support du protocole ACP (Agent Communication Protocol). Une extension VS Code pour Cortex Code est en préversion privée, et un plugin Snowflake pour Claude Code est en cours de développement. Une application iOS pour Snowflake Intelligence doit entrer en préversion publique prochainement. La plateforme revendique plus de 9 100 clients utilisant ses produits IA chaque semaine, et plus de la moitié de sa base cliente utilise désormais l'une ou l'autre des deux plateformes depuis leur lancement il y a six mois. Ces annonces illustrent la montée en puissance des plateformes dites "agentiques" dans l'entreprise, capables d'exécuter des séquences de tâches de manière autonome à partir d'une simple instruction en langage naturel. Pour les grandes organisations, l'enjeu est de permettre à des collaborateurs sans compétences techniques de piloter des flux de travail complexes, tout en maintenant un contrôle strict sur les droits d'accès et la conformité aux politiques internes. La possibilité de sauvegarder et partager des workflows, combinée à des fenêtres de contexte étendues qui mémorisent les préférences utilisateur, réduit la friction dans l'adoption quotidienne. Le mode "Plan Mode", qui permet de prévisualiser et valider un flux avant son exécution, répond directement aux craintes des entreprises face aux agents IA autonomes. Ces développements s'inscrivent dans une course intense entre fournisseurs de données cloud pour devenir la couche d'orchestration IA de référence en entreprise. Snowflake, historiquement positionné sur le stockage et l'analyse de données, cherche à élargir son emprise vers l'exécution d'actions concrètes, un territoire que se disputent aussi Microsoft, Salesforce et Google. Les nouvelles fonctionnalités découlent en partie du projet SnowWork, une initiative de recherche lancée le mois dernier pour tester la plateforme et collecter les retours utilisateurs. L'ouverture via MCP et ACP signale une stratégie d'interopérabilité délibérée : plutôt que de construire un écosystème fermé, Snowflake mise sur la connectivité avec les outils déjà en place dans les organisations, pariant que la valeur viendra de l'orchestration plutôt que du remplacement.

OutilsOutil
1 source
599Ben's Bites 

Claude, mon designer attitré

Anthropic a lancé Claude Opus 4.7 ce week-end, accompagné d'une série de mises à jour significatives pour son écosystème. Le nouveau modèle améliore notablement les capacités de vision, c'est-à-dire l'interprétation d'images, et introduit un niveau de raisonnement inédit baptisé « xhigh », qui s'insère entre les niveaux « high » et « max » déjà existants. Simultanément, Claude hérite d'un onglet Design, une interface de type canvas avec chat latéral permettant de générer des wireframes ou des prototypes haute fidélité à partir d'un formulaire de 5 à 10 questions. Le flux image vers prototype se révèle particulièrement efficace, bien que les générations restent limitées à 2 ou 3 sessions hebdomadaires sur l'abonnement à 20 dollars pendant cette phase de prévisualisation. Du côté de l'agent de code Codex, trois nouveautés ont été déployées : la fonctionnalité Computer Use, qui permet à l'agent d'utiliser des applications macOS en arrière-plan sans bloquer l'ordinateur de l'utilisateur ; Chronicle, un mécanisme opt-in qui exploite le contexte d'écran récent pour construire des souvenirs ; et un ensemble de plugins, dont la génération d'images. Par ailleurs, la startup Factory AI, qui développe l'agent de code Droid, a bouclé une levée de fonds de 150 millions de dollars, portant sa valorisation à 1,5 milliard de dollars. Ces annonces illustrent la course effrénée des acteurs de l'IA à transformer leurs modèles en plateformes complètes. L'onglet Design de Claude, en particulier, s'attaque directement au marché du prototypage rapide jusqu'ici dominé par des outils comme Figma, en proposant une boucle de création entièrement guidée par le langage naturel. La fonctionnalité Computer Use de Codex, elle, cherche à dépasser les démos laborieuses de contrôle d'interface pour offrir une automatisation fluide en tâche de fond, ce qui représente un saut qualitatif si les performances tiennent à l'usage réel. La valorisation de Factory AI à 1,5 milliard confirme l'appétit des investisseurs pour les agents de développement logiciel autonomes. Dans ce contexte d'accélération, OpenAI a connu une semaine difficile sur le plan humain : trois cadres de premier plan ont quitté l'entreprise, à savoir Kevin Weil, ancien directeur produit devenu responsable d'OpenAI for Science, Bill Peebles, co-créateur du générateur vidéo Sora, et Srinivas Narayanan, directeur technique des applications B2B. Ces départs simultanés alimentent les questions sur la cohésion interne d'OpenAI à un moment charnière. Vercel a également annoncé avoir subi une intrusion via le compte d'un employé compromis sur un autre produit IA tiers, soulignant les risques croissants liés à la prolifération des outils connectés. Enfin, la critique adressée à Claude Cowork, l'espace de travail collaboratif d'Anthropic, rappelle une tension persistante : les capacités avancées restent inaccessibles aux utilisateurs non initiés, risquant de nourrir la désillusion envers l'IA pour les prochains mois.

UELes utilisateurs et designers européens peuvent accéder aux nouvelles fonctionnalités de prototypage de Claude via l'abonnement standard à 20 dollars, bien que les générations restent limitées en phase de prévisualisation.

OutilsOutil
1 source
600The Verge AI 

Yelp rend son chatbot IA bien plus utile

Yelp vient d'annoncer une refonte majeure de son assistant chatbot, baptisé Yelp Assistant, avec l'ambition de transformer la plateforme en véritable concierge numérique. Selon le communiqué officiel de l'entreprise, le bot sera désormais placé "au centre de l'expérience applicative", capable de répondre à des questions, formuler des recommandations personnalisées et gérer des réservations au sein d'une seule et même conversation. Cette mise à jour s'inscrit dans une série d'évolutions axées sur l'IA que Yelp déploie depuis plusieurs mois. L'enjeu est de taille : faire passer l'IA d'un rôle purement informatif à un rôle d'action concrète. Plutôt que de simplement lire des avis, l'utilisateur peut désormais accomplir une tâche complète sans quitter l'application. Pour Yelp, dont le modèle repose sur des millions d'avis générés par les utilisateurs, c'est aussi une façon de monétiser autrement cette base de données unique en guidant l'utilisateur jusqu'à la réservation finale. Cette initiative reflète une tendance plus large dans l'industrie tech : les plateformes à forte base de données propriétaires cherchent à transformer leur actif en avantage compétitif face aux assistants IA généralistes comme ChatGPT ou Google Gemini. Yelp, qui reste une référence aux États-Unis pour les avis locaux sur les restaurants et commerces, mise sur la profondeur de ses données de contexte local pour se différencier. La prochaine étape sera de voir si les utilisateurs adoptent réellement ce mode de navigation conversationnel plutôt que la recherche classique.

OutilsOutil
1 source