Aller au contenu principal
Le Nano Banana de ChatGPT
OutilsBen's Bites1h

Le Nano Banana de ChatGPT

1 source couvre ce sujet·Source originale ↗·

OpenAI a frappé fort cette semaine avec le lancement de ChatGPT Images 2.0, une refonte majeure de son module de génération d'images qui remet le service en compétition directe avec les outils de Google et Midjourney. La nouveauté la plus remarquée : une précision inédite sur le texte intégré aux images, au point que les utilisateurs peinent à trouver des fautes dans des générations contenant des centaines de mots. Le modèle est disponible dans l'application Codex en tant que compétence dédiée, avec une intégration aux modèles de raisonnement pour enchaîner appels d'outils et génération d'images, créer un QR code à partir d'un lien, récupérer un logo depuis le web, puis l'intégrer dans une composition. Les cas d'usage prolifèrent déjà : captures d'écrans d'interfaces réalistes, magazines illustrés multi-pages, recommandations de style personnalisées et codes QR créatifs.

La capacité à générer des interfaces utilisateur crédibles ouvre une piste intéressante pour combler le déficit de goût graphique souvent reproché aux modèles de code. Des tests comparatifs menés sur la conversion d'une maquette en application fonctionnelle, une vitrine publicitaire conçue par Ben's Bites, révèlent une hiérarchie nuancée : Claude Design devance Magicpath AI, qui devance les modèles bruts comme Gemini 3.1 Pro ou Opus 4.6 sur la compréhension du concept et l'utilisabilité. En revanche, Gemini remporte la fidélité pixel par pixel, tandis qu'Opus 4.7 bat GPT-5.4 sur la correspondance visuelle avec la maquette de référence. GPT-5.4 produit un code plus fonctionnel et maintient une cohérence visuelle sur les pages non montrées, comme le panneau d'administration. Un point aveugle subsiste pour tous : les assets, images d'illustration, icônes, textures, qui font souvent la différence entre une maquette et une interface banale ne survivent pas à la conversion depuis une capture d'écran.

Ces annonces s'inscrivent dans une semaine d'actualité dense pour l'industrie de l'IA. OpenAI a déployé les Workspace Agents, des agents propulsés par Codex accessibles aux utilisateurs Business, Enterprise et Education, configurables avec une personnalité, des tâches précises et des accès à des outils externes comme Linear ou Slack, appelés à terme à remplacer les GPTs personnalisés. De son côté, Google a ouvert l'API Deep Research avec deux configurations basées sur Gemini 3.1 Pro, revendiquant les meilleures performances en recherche web, avec support MCP et génération de graphiques. Enfin, un accord stratégique se dessine entre Cursor et SpaceX : SpaceX mettra ses GPU à disposition pour entraîner les modèles de code de Cursor, avec une option d'acquisition à 60 milliards de dollars d'ici fin 2025, ou un accord de partenariat à 10 milliards si l'acquisition n'a pas lieu, un signal que la course aux modèles de code spécialisés entre dans une nouvelle phase industrielle.

Impact France/UE

Les nouvelles APIs et outils (ChatGPT Images 2.0, Deep Research, Workspace Agents) sont accessibles aux développeurs et entreprises européens, mais aucune réglementation ou entreprise française n'est directement impliquée.

À lire aussi

Gemini Enterprise : Google lance sa plateforme unifiée pour orchestrer des agents IA
1Le Big Data 

Gemini Enterprise : Google lance sa plateforme unifiée pour orchestrer des agents IA

Google a présenté le 22 avril 2026, lors de Google Cloud Next 2026, Gemini Enterprise : une plateforme unifiée conçue pour orchestrer des flottes d'agents IA à l'échelle de l'entreprise. La nouveauté fusionne l'application Gemini Enterprise pour les utilisateurs finaux et la nouvelle Gemini Enterprise Agent Platform pour les développeurs, absorbant au passage Vertex AI qui disparaît en tant que plateforme indépendante. Plus de 200 modèles sont accessibles via Model Garden, dont les dernières générations Gemini mais aussi des modèles tiers d'Anthropic et autres. La marketplace intégrée permet de connecter des agents issus de partenaires comme Oracle, ServiceNow, Adobe, Salesforce ou Workday. Du côté technique, la plateforme introduit Agent Studio pour le développement low-code, un SDK basé sur des graphes pour les systèmes multi-agents, et Agent Runtime pour des agents capables de fonctionner en continu pendant des heures, voire des jours. Des outils d'optimisation complètent l'ensemble : Agent Simulation, Evaluation et Observability. Pour les directions informatiques, la gouvernance est au coeur du dispositif. Chaque agent se voit attribuer une identité cryptographique via Agent Identity, tandis qu'un registre central valide les outils et agents autorisés, et qu'Agent Gateway applique les politiques de sécurité à l'échelle de l'organisation. La couche de protection intègre Model Armor pour contrer les injections malveillantes et les fuites de données, appuyée par Security Command Center pour la détection des vulnérabilités. Du côté des équipes métier, Agent Designer permet de créer et déployer des agents sans écrire de code, depuis une interface unique avec boîte de réception centralisée, espaces projets à mémoire partagée et outil collaboratif Canvas pour produire des documents exportables vers Microsoft Office. Un agent Data Insights natif analyse données structurées et non structurées pour générer visualisations et rapports, tandis que Deep Research synthétise sources web et données internes. Ce lancement s'inscrit dans une course intense entre les grands acteurs du cloud pour capter les budgets IA des entreprises. Microsoft, avec Copilot Studio et Azure AI Foundry, Amazon avec Bedrock Agents, et Salesforce avec Agentforce occupent le même terrain. Google répond en cassant la fragmentation de son offre précédente : Vertex AI, Duet AI, Gemini for Workspace coexistaient sans cohérence claire pour les acheteurs. En absorbant tout dans une plateforme unique, Google vise à simplifier les cycles de vente et à verrouiller les grandes entreprises dans son écosystème. La compatibilité revendiquée avec Microsoft 365 et Google Workspace trahit la volonté de ne pas imposer une migration brutale, mais de s'intégrer aux environnements existants. L'enjeu des prochains mois sera la disponibilité réelle de ces fonctionnalités et leur tenue à l'échelle, deux points sur lesquels les annonces de Cloud Next ont historically précédé des déploiements progressifs.

UELes entreprises européennes utilisant Google Cloud devront évaluer la migration vers cette plateforme unifiée, dont les mécanismes de gouvernance (identité cryptographique des agents, registre central, audit de sécurité) pourraient faciliter la mise en conformité avec l'AI Act.

OutilsOutil
1 source
Microsoft lance le "vibe working" dans Word, Excel et PowerPoint
2The Verge 

Microsoft lance le "vibe working" dans Word, Excel et PowerPoint

Microsoft déploie cette semaine un nouveau mode appelé Agent Mode dans ses applications Office, Word, Excel et PowerPoint. Baptisé en interne "vibe working", ce mode représente une version nettement plus avancée de Copilot, l'assistant IA que Microsoft commercialise auprès des entreprises depuis 2023. Sumit Chauhan, vice-président de l'Office Product Group, reconnaît publiquement les limites de la première version : "Quand nous avons lancé Copilot, les modèles fondationnels n'étaient pas assez puissants pour lui permettre d'agir directement dans les applications." Ce basculement vers un agent actif change fondamentalement la nature du produit. Jusqu'ici, Copilot dans Office se contentait de répondre à des questions ou de générer du contenu dans un volet latéral, sans pouvoir modifier directement un document, une feuille de calcul ou une présentation. Agent Mode franchit cette barrière : l'assistant peut désormais prendre des actions concrètes sur le "canvas", c'est-à-dire manipuler le contenu des fichiers de façon autonome, sur instruction de l'utilisateur. Pour les entreprises qui paient l'abonnement Copilot 365 (environ 30 dollars par utilisateur par mois), cela justifie enfin une partie de la promesse initiale. Cette annonce s'inscrit dans une course industrielle intense. Google a lancé des fonctionnalités similaires dans Workspace, et les grands éditeurs de productivité misent tous sur les "agents" comme prochaine étape après les assistants génératifs. Microsoft, qui a investi plusieurs milliards dans OpenAI, dispose d'un accès privilégié aux dernières versions de GPT-4o et o-series, ce qui lui permet aujourd'hui de tenir des promesses que les modèles de 2023 ne pouvaient pas encore tenir.

UELes entreprises européennes sous abonnement Microsoft 365 doivent évaluer l'adoption de l'Agent Mode Copilot 365 (environ 30 $/utilisateur/mois), qui franchit enfin la barrière de la manipulation autonome des documents Office.

OutilsOutil
1 source
OpenAI affirme que ChatGPT for Clinicians surpasse les médecins sur les tâches cliniques, même avec temps illimité et accès au web
3The Decoder 

OpenAI affirme que ChatGPT for Clinicians surpasse les médecins sur les tâches cliniques, même avec temps illimité et accès au web

OpenAI lance ChatGPT for Clinicians, une version gratuite de son chatbot spécialement destinée aux professionnels de santé. Selon un nouveau benchmark publié par la société, le modèle GPT-5.4 surpasse les médecins humains sur des tâches cliniques, y compris dans des conditions où ces derniers disposent d'un temps illimité et d'un accès libre à Internet. L'annonce constitue l'une des affirmations les plus audacieuses jamais formulées par une entreprise d'IA sur les capacités médicales de ses modèles. Ce résultat est notable précisément parce que la comparaison ne se fait pas à armes inégales : les médecins testés pouvaient consulter n'importe quelle source en ligne et prendre tout le temps nécessaire pour répondre. Si le modèle confirme ces performances en conditions réelles, les implications sont concrètes pour le diagnostic, la rédaction de comptes-rendus ou l'analyse de cas complexes. Pour les professionnels de santé, l'outil pourrait agir comme un assistant de haut niveau, disponible en permanence et sans coût d'accès, ce qui représente un changement significatif dans le quotidien des cliniciens. L'initiative s'inscrit dans une compétition intense entre les grands laboratoires d'IA pour s'imposer dans le secteur médical, considéré comme l'un des plus stratégiques. Google, Microsoft et des startups spécialisées comme Nabla ou Suki investissent massivement dans l'assistance aux cliniciens. En proposant un accès gratuit, OpenAI cherche à accélérer l'adoption et à s'établir comme référence dans un domaine où la confiance, la validation clinique et les enjeux réglementaires restent des obstacles majeurs à franchir.

UELes cliniciens européens pourraient utiliser cet outil gratuitement, mais son déploiement en Europe reste conditionné aux exigences strictes de l'AI Act qui classe les outils d'IA médicale comme systèmes à haut risque nécessitant certification.

💬 OpenAI qui publie un benchmark montrant qu'OpenAI bat les médecins, bon, ça mérite une validation externe avant de crier victoire. La vraie surprise, c'est le gratuit: dans un secteur où les concurrents facturent des fortunes aux hôpitaux, arriver gratos c'est un pari d'adoption qui peut vraiment bousculer les acteurs en place. Pour l'Europe, l'AI Act classe ces outils en haut risque, certification obligatoire, donc 2027 au mieux.

OutilsOutil
1 source
Excel & Google Sheets : Fin des formules, ChatGPT débarque et fait tout le job
4Le Big Data 

Excel & Google Sheets : Fin des formules, ChatGPT débarque et fait tout le job

OpenAI a lancé le 22 avril 2026 une nouvelle fonctionnalité appelée ChatGPT Sidebar, qui s'intègre directement dans Excel et Google Sheets sous forme de barre latérale ou de complément. L'installation se fait en quelques clics via le menu des modules complémentaires sur Google Sheets, ou via l'onglet Compléments d'Excel. Une fois connecté à son compte OpenAI, l'utilisateur dispose d'un assistant capable de créer des structures de fichiers, modifier des données, mettre à jour des tableaux et analyser des tendances réparties sur plusieurs onglets, le tout en langage naturel. L'outil demande systématiquement confirmation avant d'effectuer toute modification, préservant ainsi le contrôle de l'utilisateur. Il prend également en charge l'import de fichiers dans un large éventail de formats : images (JPEG, PNG, GIF), documents (PDF, Word, Pages), présentations (PowerPoint), feuilles de calcul (CSV, Excel), ainsi que formats texte et code (JSON, YAML, HTML, Markdown). La limite est fixée à 20 fichiers par message, avec un maximum de 25 Mo par fichier. L'outil est actuellement en phase bêta et réservé aux abonnés payants des offres Plus, Pro, Business, Enterprise, Edu et K-12. Pour des millions de professionnels qui passent des heures à construire des formules complexes ou à chercher des anomalies dans des tableaux imbriqués, cette intégration représente un changement concret de flux de travail. L'assistant peut repérer des tendances de dépenses sur plusieurs onglets en secondes, là où un analyste aurait autrefois mobilisé une demi-journée. Selon Jack R. Curran et d'autres membres de l'équipe OpenAI, l'outil couvre aussi bien des usages personnels, comme l'organisation d'un mariage ou la gestion d'une activité en ligne, que des besoins professionnels comme la construction d'un plan d'affaires ou l'analyse de données. La capacité à interagir en langage naturel abaisse significativement la barrière d'entrée pour les utilisateurs non-téchniques, qui n'ont plus besoin de maîtriser les syntaxes de formules pour exploiter pleinement un tableur. Cette annonce s'inscrit dans une dynamique d'expansion agressive d'OpenAI vers les outils de productivité bureautique, un territoire jusqu'ici dominé par Microsoft avec Copilot intégré à Office 365, et par Google avec Gemini dans Workspace. En s'installant directement dans Excel, concurrent historique de ses propres partenaires Microsoft, OpenAI joue sur tous les tableaux simultanément. La limitation aux abonnés payants suggère une stratégie de montée en gamme : convaincre les entreprises de migrer vers des formules Business ou Enterprise. L'absence de synchronisation avec l'historique ChatGPT classique constitue une limitation notable pour l'instant, mais laisse anticiper une intégration plus profonde dans les prochaines versions. La bataille pour devenir le co-pilote universel du travail de bureau ne fait que commencer.

UELes professionnels français et européens abonnés aux offres payantes ont accès à cette intégration qui modifie concrètement les pratiques de travail sur tableur, sans impact réglementaire spécifique à l'UE pour l'instant.

💬 Installer ChatGPT directement dans Excel, le produit phare de Microsoft, c'est le genre de coup qui mérite qu'on s'y arrête. Pour les profils non-techs qui jonglent avec des tableaux sans vraiment maîtriser les formules, là c'est du concret, pas du vent. Abonnés payants seulement pour l'instant, donc la vraie adoption, on verra dans six mois.

OutilsOutil
1 source