Aller au contenu principal
OpenAI : Sam Altman évoque en interne un modèle "très puissant" capable d'"accélérer vraiment l'économie
LLMsThe Decoder12sem· 1 min de lecture

OpenAI : Sam Altman évoque en interne un modèle "très puissant" capable d'"accélérer vraiment l'économie

Source originale ↗·

OpenAI aurait finalisé le pré-entraînement de son prochain grand modèle d'intelligence artificielle, dont le nom de code interne est "Spud". Selon des informations rapportées par The Decoder, le PDG Sam Altman aurait présenté ce modèle en interne en termes particulièrement enthousiastes, le qualifiant de "très puissant" et capable d "accélérer vraiment l'économie".

Cette annonce intervient dans un contexte de compétition intense entre les grands acteurs de l'IA — Google, Anthropic, Meta et xAI — où chaque nouvelle génération de modèle est scrutée pour ses capacités à transformer des secteurs entiers. Un modèle capable d'impacter l'économie à cette échelle représenterait un saut qualitatif significatif au-delà des assistants conversationnels actuels, avec des implications potentielles pour la productivité, l'automatisation et la recherche scientifique.

Les détails techniques restent limités à ce stade : l'article source ne précise ni la taille du modèle, ni son architecture, ni la date de lancement publique prévue. Ce qui est confirmé, c'est que la phase de pré-entraînement — l'étape la plus coûteuse et la plus longue du développement — serait achevée. Sam Altman a communiqué cette information en interne, ce qui suggère que le modèle est encore en phase d'évaluation et d'ajustement avant toute mise sur le marché.

Si les propos d'Altman se confirment, "Spud" pourrait représenter une nouvelle étape vers ce qu'OpenAI appelle l'AGI — une intelligence artificielle générale. La formulation "accélérer l'économie" rappelle les ambitions déclarées de l'entreprise de développer des systèmes capables de contribuer activement à la recherche et à la croissance, au-delà du simple usage grand public.

Impact France/UE

Un nouveau modèle OpenAI de cette envergure pourrait accélérer l'adoption de l'IA en Europe et renforcer la pression réglementaire dans le cadre de l'AI Act.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

OpenAI lance GPT-Rosalind, son premier modèle d'IA pour les sciences du vivant, conçu pour accélérer la découverte de médicaments et la génomique
1MarkTechPost 

OpenAI lance GPT-Rosalind, son premier modèle d'IA pour les sciences du vivant, conçu pour accélérer la découverte de médicaments et la génomique

OpenAI a lancé GPT-Rosalind, son premier modèle d'intelligence artificielle spécialisé dans les sciences du vivant, conçu pour accélérer la recherche en biologie, en génomique et en découverte de médicaments. Contrairement aux modèles généralistes comme GPT-5, GPT-Rosalind est fine-tuné sur les exigences analytiques propres à la recherche biologique : synthèse de littérature scientifique, conception de protocoles expérimentaux, prédiction de comportements de séquences ARN, et planification d'hypothèses. Le modèle est accessible via ChatGPT, Codex et l'API d'OpenAI, mais uniquement dans le cadre d'un programme d'accès contrôlé réservé aux entreprises qualifiées aux États-Unis. OpenAI lance simultanément un plugin Life Sciences pour Codex, connectant les modèles à plus de 50 outils scientifiques et bases de données biologiques. Sur le benchmark BixBench, conçu pour évaluer des tâches réelles de bioinformatique, GPT-Rosalind atteint un taux de réussite de 0,751. Sur LABBench2, il surpasse GPT-5.4 sur six des onze tâches testées, avec des gains particulièrement nets sur CloningQA, qui évalue la conception de réactifs pour des protocoles de clonage moléculaire. Le potentiel concret de ce modèle est illustré par une évaluation menée en partenariat avec Dyno Therapeutics sur des séquences ARN inédites, jamais intégrées à aucun corpus d'entraînement public. Dans cet environnement Codex, les meilleures soumissions du modèle se sont classées au-dessus du 95e percentile des experts humains pour les tâches de prédiction, et au 84e percentile pour la génération de séquences. Ce résultat est particulièrement significatif car il exclut tout effet de mémorisation et démontre une capacité de raisonnement réelle sur des données biologiques nouvelles. Pour l'industrie pharmaceutique, où le développement d'un médicament prend en moyenne dix à quinze ans et coûte des milliards de dollars, des outils capables de compresser les phases analytiques les plus lourdes représentent un levier économique et scientifique considérable. Ce lancement s'inscrit dans une course que se livrent les grands laboratoires d'IA pour s'imposer dans les sciences de la vie, un secteur qui attire des investissements massifs et où les enjeux réglementaires sont élevés. Google DeepMind a déjà marqué ce terrain avec AlphaFold pour la prédiction de structures protéiques, tandis que des startups comme Insilico Medicine ou Recursion Pharmaceuticals misent sur l'IA pour repenser entièrement le pipeline de découverte de médicaments. OpenAI positionne GPT-Rosalind non pas comme un remplaçant des chercheurs, mais comme un assistant capable de prendre en charge les étapes les plus chronophages du processus scientifique. L'accès restreint au lancement, avec des garde-fous techniques pour signaler les activités potentiellement dangereuses, reflète la prudence qu'impose ce domaine sensible, où une erreur de modèle pourrait avoir des conséquences directes sur des protocoles de laboratoire ou des décisions cliniques.

UEL'accès étant limité aux entreprises américaines qualifiées au lancement, l'impact immédiat sur les biotechs et laboratoires pharmaceutiques européens est indirect, mais ce type de modèle spécialisé pourrait redéfinir les standards de R&D dans un secteur encadré par la réglementation européenne sur les médicaments et les dispositifs médicaux.

LLMsActu
1 source
Les modèles de raisonnement GPT ont une trajectoire vers l'AGI, selon Greg Brockman d'OpenAI
2The Decoder 

Les modèles de raisonnement GPT ont une trajectoire vers l'AGI, selon Greg Brockman d'OpenAI

Greg Brockman, cofondateur d'OpenAI, a déclaré que les modèles de raisonnement GPT offrent désormais une « ligne de vue » directe vers l'intelligence artificielle générale (AGI). Selon lui, le débat sur la capacité des modèles textuels à atteindre une intelligence générale est clos : l'architecture GPT constitue la voie vers l'AGI. Cette prise de position tranche avec des années d'incertitude dans la communauté de la recherche en IA, où beaucoup estimaient que les grands modèles de langage, aussi performants soient-ils, resteraient fondamentalement limités à des tâches spécialisées. En affirmant que le cap est désormais visible, Brockman signale qu'OpenAI considère ses modèles de raisonnement — comme o1 et o3 — non pas comme des outils, mais comme les prémices d'une intelligence véritablement générale. Cette déclaration intervient dans un contexte de compétition intense entre OpenAI, Google DeepMind, Anthropic et xAI, chacun revendiquant des avancées vers l'AGI. La question de définir précisément ce qu'est l'AGI reste toutefois ouverte, et des voix critiques dans la communauté scientifique contestent que les architectures actuelles, même dotées de capacités de raisonnement avancées, puissent y parvenir sans rupture technologique majeure.

LLMsOpinion
1 source
Tencent dévoile son premier grand modèle IA, dirigé par un ancien chercheur d'OpenAI
3SCMP Tech 

Tencent dévoile son premier grand modèle IA, dirigé par un ancien chercheur d'OpenAI

Tencent Holdings a dévoilé jeudi son nouveau modèle d'intelligence artificielle phare, baptisé HY3-Preview, marquant une étape importante dans la stratégie IA du groupe de Shenzhen. C'est le premier grand modèle lancé depuis que Yao Shunyu, ancien chercheur chez OpenAI, a rejoint l'entreprise pour diriger ses efforts en IA fondamentale. Fermé et non accessible au public en open source, HY3-Preview se distingue par une architecture relativement compacte de 295 milliards de paramètres, une taille modeste pour un modèle de cette ambition. Tencent positionne HY3-Preview comme son modèle le plus puissant à ce jour, comparable aux meilleures solutions chinoises disponibles, mais encore en retrait face aux leaders américains comme OpenAI et Google DeepMind. L'arrivée de Yao Shunyu, figure reconnue de la recherche en IA, signale la volonté du groupe de monter en gamme sur les fondations mêmes de ses systèmes, au-delà de ses applications existantes comme Weixin ou Tencent Cloud. Ce lancement s'inscrit dans une intense course technologique entre les géants technologiques chinois, qui cherchent à réduire l'écart avec les États-Unis dans un contexte de restrictions à l'export de puces Nvidia. Alibaba, Baidu, et ByteDance ont chacun intensifié leurs investissements en modèles fondationnels ces derniers mois. Que Tencent, longtemps perçu comme plus discret sur ce terrain, franchisse ce cap avec un recrutement aussi symbolique qu'un ex-OpenAI, témoigne d'une accélération générale de la compétition IA en Asie.

LLMsActu
1 source
Claude Fable 5 : le premier modèle Mythos est puissant, coûteux et très filtré
4The Decoder 

Claude Fable 5 : le premier modèle Mythos est puissant, coûteux et très filtré

Anthropic a lancé Claude Fable 5, le premier modèle de sa nouvelle gamme Mythos, positionnée au-dessus de la famille Claude 4. Le modèle domine quasiment tous les benchmarks actuels, dont SWE-bench Verified où il atteint 95 %, un score sans précédent pour une IA généraliste. La facture est à la hauteur des ambitions : Fable 5 est facturé 10 ou 50 dollars par million de tokens selon le niveau d'usage, soit le double du tarif d'Opus 4.8, jusqu'ici le modèle le plus cher de la gamme. Cette puissance accrue s'accompagne de contraintes significatives. Les filtres de sécurité, renforcés dans cette version, bloquent environ 9 % des requêtes, un taux notable qui risque de poser problème aux développeurs travaillant dans des secteurs sensibles comme la santé, le droit ou la sécurité informatique. Plus surprenant encore, Anthropic a introduit une politique de rétention des données de 30 jours qui s'applique désormais même aux contrats dits "zero data retention", une décision qui inquiète les entreprises ayant souscrit ces options précisément pour garantir la confidentialité totale de leurs échanges. Ce lancement marque une inflexion stratégique pour Anthropic, qui segmente désormais explicitement son offre par niveau de performance et de coût. La classe Mythos vise les usages professionnels et d'infrastructure les plus exigeants, là où la concurrence avec OpenAI et Google s'intensifie. La question du prix et des restrictions de contenu déterminera si les entreprises adoptent Fable 5 ou maintiennent des solutions moins onéreuses pour leurs pipelines de production.

UELa modification de la politique de rétention des données à 30 jours, y compris pour les contrats 'zero data retention', impose aux entreprises européennes une révision de leur conformité GDPR concernant les échanges avec l'API Anthropic.

💬 95% sur SWE-bench, c'est du solide. La rétention 30 jours imposée même aux contrats "zero data retention", c'est Anthropic qui change les règles en cours de route, et les entreprises européennes vont avoir un vrai sujet GDPR sur les bras. 9% de blocages sur un modèle vendu pour les cas pro les plus sensibles, ça va faire mal en prod.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic