Aller au contenu principal
Mise à jour de la carte du système GPT-5 : GPT-5.2
RechercheOpenAI Blog21sem

Mise à jour de la carte du système GPT-5 : GPT-5.2

Résumé IASource uniqueImpact UE
Source originale ↗·

GPT-5.2 est la dernière famille de modèles de la série GPT-5, utilisant une approche globale de mitigation des risques similaire à celle décrite dans la GPT-5 System Card et la GPT-5.1 System Card. Ces modèles ont été formés sur des ensembles de données variés, y compris des informations publiques sur Internet, des informations accessibles grâce à des partenariats avec des tiers, et des informations fournies ou générées par des utilisateurs, des entraîneurs humains ou des chercheurs.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Complément au carton du système GPT-5.2 : GPT-5.2-Codex
1OpenAI Blog 

Complément au carton du système GPT-5.2 : GPT-5.2-Codex

Cet addendum décrit les mesures de sécurité exhaustives mises en place pour GPT-5.2-Codex, incluant une formation spécialisée au risque pour les tâches nuisibles et l'injection de requêtes, ainsi que des mesures au niveau du produit comme le panning du système d'agent et l'accès réseau configurables.

RégulationOutil
1 source
ReSim : une simulation fiable du monde réel pour la conduite autonome
2arXiv cs.RO 

ReSim : une simulation fiable du monde réel pour la conduite autonome

Des chercheurs ont publié sur arXiv un nouveau modèle de simulation du monde pour la conduite autonome, baptisé ReSim, pour Reliable Simulation. L'approche repose sur un générateur vidéo à architecture de transformeur de diffusion, entraîné non plus uniquement sur des données de conduite réelle, mais sur un corpus mixte combinant des trajectoires humaines et des données synthétiques issues du simulateur CARLA. Le modèle est conçu pour prédire de manière fiable comment une scène de conduite va évoluer selon différentes actions du véhicule ego, y compris des comportements dangereux ou non experts, typiquement un freinage brutal, un écart de voie ou une manœuvre imprudente. Pour fermer la boucle entre simulation et apprentissage, les auteurs introduisent également un module Video2Reward capable d'estimer un signal de récompense directement à partir des futures simulées générées par ReSim. Les gains mesurés sont significatifs : ReSim affiche une fidélité visuelle supérieure de 44 %, améliore la contrôlabilité du modèle de plus de 50 % pour les comportements experts comme non experts, et progresse de 2 % en planification et de 25 % en sélection de politique sur le benchmark NAVSIM. Ce dernier point est particulièrement important pour l'industrie : pouvoir évaluer des politiques de conduite dans des scénarios rares ou risqués sans avoir à rouler physiquement avec ces comportements représente un levier majeur pour accélérer la validation des systèmes d'aide à la conduite et des véhicules autonomes. Le problème que ReSim cherche à résoudre est structurel dans le domaine : les modèles du monde entraînés exclusivement sur des données réelles sont biaisés vers la conduite sûre et experte, car c'est ce qui compose l'immense majorité des datasets. Les comportements anormaux, accidentels ou simplement maladroits y sont sous-représentés, ce qui rend ces modèles incapables de simuler fidèlement ce qui se passe quand un véhicule autonome dévie de la norme. En combinant données réelles et données synthétiques contrôlées, ReSim ouvre une voie vers des environnements d'évaluation plus robustes, une priorité pour des acteurs comme Waymo, Tesla ou Mobileye, qui cherchent à réduire leur dépendance aux miles de test sur route ouverte.

RecherchePaper
1 source
BioNeMo de NVIDIA : mise à l'échelle de la modélisation biomoléculaire par parallélisme de contexte
3NVIDIA Developer Blog 

BioNeMo de NVIDIA : mise à l'échelle de la modélisation biomoléculaire par parallélisme de contexte

NVIDIA a annoncé une avancée majeure dans son framework BioNeMo avec l'intégration du parallélisme de contexte, une technique permettant de distribuer le traitement de longues séquences biologiques sur plusieurs GPU simultanément. Pendant des décennies, la biologie computationnelle s'était heurtée à une contrainte fondamentale : la mémoire limitée d'un seul GPU obligeait les chercheurs à fragmenter les protéines complexes en sous-unités isolées pour les modéliser. BioNeMo franchit désormais ce seuil en permettant le repliement de protéines entières et de complexes moléculaires sans découpage préalable, ce que les spécialistes appellent le repliement "zero-shot". L'impact est direct pour les laboratoires pharmaceutiques et les équipes de biologie structurale : modéliser des protéines longues ou des assemblages multi-chaînes avec précision, sans sacrifier la cohérence structurelle liée à la fragmentation artificielle. Le "fossé de contexte", cet angle mort où les grandes molécules devenaient inaccessibles aux modèles d'IA faute de mémoire, disparaît avec cette approche, ouvrant la voie à des prédictions structurelles bien plus fidèles à la réalité cellulaire. Cette évolution s'inscrit dans la course que se livrent les grands acteurs technologiques pour dominer la biologie computationnelle à l'ère de l'IA. NVIDIA positionne BioNeMo comme la plateforme de référence pour les modèles de fondation biomoléculaires, face à des concurrents comme DeepMind avec AlphaFold ou Evo de Arc Institute. Le parallélisme de contexte, déjà éprouvé dans la formation de grands modèles de langage via Megatron-LM, est ici adapté aux spécificités des séquences biologiques, signal fort que les techniques d'entraînement LLM migrent activement vers les sciences du vivant.

UELes laboratoires pharmaceutiques et instituts de recherche européens (Sanofi, Institut Pasteur, universités de médecine) pourraient bénéficier d'une modélisation protéique plus précise et sans fragmentation, accélérant potentiellement la découverte de médicaments et la recherche biomédicale.

RecherchePaper
1 source
Carte du Système GPT-5.3-Codex : Règles Critiques
4OpenAI Blog 

Carte du Système GPT-5.3-Codex : Règles Critiques

GPT-5.3-Codex est le modèle de codage agentic le plus performant à ce jour, intégrant les capacités de codage avancées de GPT-5.2-Codex et les compétences en raisonnement et en connaissances professionnelles de GPT-5.2.

LLMsPaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour