Aller au contenu principal
Progrès dans la recherche indépendante sur l'alignement de l'IA
RechercheOpenAI Blog17sem· 1 min de lecture

Progrès dans la recherche indépendante sur l'alignement de l'IA

Source originale ↗·

OpenAI verse 7,5 millions de dollars au Projet d'alignement pour soutenir des recherches indépendantes sur l'alignement de l'intelligence artificielle, visant à renforcer les efforts mondiaux pour atténuer les risques liés à la sécurité et à la sûreté de l'intelligence artificielle générale (AGI). Ce financement vise à encourager des études non liées à des intérêts commerciaux, afin d'améliorer la compréhension et la gestion des défis de l'AGI.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Pensée profonde Gemini 3: Progrès dans la science, la recherche et l'ingénierie
1Google AI Blog 

Pensée profonde Gemini 3: Progrès dans la science, la recherche et l'ingénierie

Titre: Gemini 3 Deep Think : Avancées scientifiques, de la recherche et de l'ingénierie Nous déployons une mise à jour majeure de Gemini 3 Deep Think, notre mode de raisonnement spécialisé.

UEAucun impact direct — L'article décrit une mise à jour logicielle, Gemini 3 Deep Think, qui améliore les capacités de raisonnement artificiel, sans spécification d'applications spécifiques ou d'impact sur des entreprises ou des réglementations françaises ou européennes.

RechercheOutil
1 source
2Import AI 

Import AI 454 : automatiser la recherche sur l'alignement, étude de sécurité d'un modèle chinois, HiFloat4

Des chercheurs de Huawei ont publié une étude démontrant la supériorité de HiFloat4, leur format de précision 4 bits propriétaire, face à MXFP4, le standard ouvert développé par l'Open Compute Project. Les tests ont été conduits sur des puces Ascend de Huawei avec trois architectures de modèles : OpenPangu-1B, Llama3-8B et Qwen3-MoE-30B. Les résultats sont clairs : HiFloat4 atteint une erreur relative d'environ 1,0 % par rapport à une baseline BF16 pleine précision, contre 1,5 % pour MXFP4. Fait notable, cet avantage se creuse à mesure que les modèles grossissent. HiFloat4 n'a besoin que d'une seule technique de stabilisation (RHT) pour atteindre ce niveau, là où MXFP4 exige trois mécanismes combinés. Par ailleurs, des chercheurs du programme Anthropic Fellows ont publié une étude montrant que des agents Claude sont capables d'automatiser la recherche en sécurité IA : ces agents proposent des idées, mènent des expériences et itèrent de façon autonome sur un problème ouvert, en l'occurrence la supervision "weak-to-strong", soit la capacité d'un modèle moins puissant à superviser efficacement un modèle plus capable. Résultat : les agents ont surpassé deux chercheurs humains qui avaient pourtant travaillé sept jours sur le même problème. Ces deux avancées ont des implications concrètes et distinctes. Côté Huawei, disposer d'un format de précision réduite plus efficace signifie tirer davantage de performance des puces Ascend sans augmenter la consommation électrique, un enjeu critique pour l'entraînement et l'inférence à grande échelle. Pour l'industrie, cela confirme qu'une alternative sérieuse aux formats occidentaux existe et peut fonctionner sur un écosystème matériel entièrement indépendant. Côté Anthropic, la démonstration que Claude peut conduire de la recherche en alignement de manière autonome est un signal précoce mais significatif : si des agents IA peuvent progresser sur les problèmes de sécurité plus vite que des humains, cela ouvre la voie à une accélération massive de ce champ de recherche, encore largement sous-doté face à la vitesse de développement des capacités. Le format HiFloat4 s'inscrit dans la continuité de HiFloat8, présenté précédemment, et reflète une tendance de fond chez les acteurs chinois du hardware : face aux restrictions américaines d'exportation qui coupent la Chine de l'accès aux puces Nvidia H100 en volume suffisant, Huawei et ses pairs investissent massivement dans l'optimisation logicielle et les formats de données propriétaires pour compenser ce déficit. C'est une réponse structurelle aux sanctions, pas un simple exercice académique. Du côté d'Anthropic, l'automatisation de la recherche en alignement répond à une urgence : le rythme de progression des capacités des LLMs dépasse celui des travaux de sécurité, et si des agents peuvent combler cet écart, ils pourraient devenir un outil central dans la course à rendre l'IA plus fiable avant qu'elle ne devienne incontrôlable.

UEL'émergence de HiFloat4 comme alternative propriétaire aux formats ouverts (MXFP4) illustre la fragmentation des standards matériels IA, un enjeu stratégique pour les entreprises européennes qui devront naviguer entre écosystèmes incompatibles dans leurs choix d'infrastructure.

RecherchePaper
1 source
Le programme NAIRR Science redéfinit la recherche scientifique grâce à l'infrastructure IA de NVIDIA
3NVIDIA AI Blog 

Le programme NAIRR Science redéfinit la recherche scientifique grâce à l'infrastructure IA de NVIDIA

Le programme pilote NAIRR (National Artificial Intelligence Research Resource), lancé par la Fondation nationale des sciences américaine (NSF), a soutenu plus de 700 projets de recherche au cours des deux dernières années, dans des domaines aussi variés que la prédiction de structures protéiques et la gestion des épidémies infectieuses. NVIDIA a contribué au programme en fournissant aux chercheurs un accès dédié à au moins quatre nœuds DGX pendant un minimum d'un mois, accompagné d'un support technique continu. Parmi les projets phares figure le modèle Walrus, développé par le consortium Polymathic AI regroupant le Flatiron Institute, l'Université de Cambridge et le Lawrence Berkeley National Lab : entraîné sur un vaste jeu de données baptisé "the Well", ce modèle de fondation pour les simulations de fluides a été rendu public avec ses données, son code et ses poids. À l'Université du Michigan, le professeur Venkat Viswanathan a dirigé le développement de MIST (Molecular Insight SMILES Transformers), une famille de modèles moléculaires pré-entraînés sur des bases de données non étiquetées, affinés sur plus de 400 relations structure-propriété et capables d'égaler ou de surpasser l'état de l'art en électrochimie, chimie quantique et physiologie. MIST a été développé sur un cluster de 40 GPU NVIDIA DGX, complété par 200 000 heures GPU sur le cluster Polaris de l'ALCF. Ces travaux illustrent une accélération concrète du rythme de la découverte scientifique grâce à l'infrastructure GPU. En fusionnant MIST avec des grands modèles de langage généralistes, les chercheurs du Michigan rendent les calculs de chimie quantique accessibles à un public plus large de scientifiques computationnels, ouvrant la voie à des matériaux de stockage d'énergie de nouvelle génération pour l'électrification des transports lourds et aériens. Walrus, de son côté, vise à devenir le modèle de fondation le plus polyvalent jamais construit pour modéliser les comportements fluides, avec des applications potentielles dans l'industrie, la météorologie et l'ingénierie. Ces outils ne restent pas dans les laboratoires : leur mise à disposition publique accélère leur adoption et leur amélioration collective. Le programme NAIRR s'inscrit dans une stratégie plus large de démocratisation de l'accès à la puissance de calcul pour la recherche académique américaine, face à la concentration croissante des ressources IA dans le secteur privé. En offrant des allocations de GPU à des institutions universitaires, le NSF cherche à rééquilibrer les conditions de la recherche fondamentale à l'heure où les coûts d'entraînement explosent. NVIDIA, en fournissant à la fois du matériel et un accompagnement technique, consolide son positionnement comme infrastructure de référence pour la recherche scientifique. La suite du programme NAIRR, dont la pérennisation fait l'objet de discussions au Congrès, pourrait déterminer si les États-Unis maintiennent un avantage compétitif dans la recherche en IA publique face à des acteurs privés et étrangers de plus en plus puissants.

UEL'Université de Cambridge participe au consortium Polymathic AI (modèle Walrus), mais le programme NAIRR est une initiative fédérale américaine sans incidence directe sur les financements ou politiques de recherche en France ou dans l'UE.

RechercheActu
1 source
L'IA comme prolongement de l'intelligence humaine
4Microsoft Research 

L'IA comme prolongement de l'intelligence humaine

Une nouvelle approche théorique publiée dans le cadre d'une collaboration interdisciplinaire propose de revoir fondamentalement la façon dont on comprend les systèmes d'intelligence artificielle. Intitulée "The Origins of Artificial Intelligence in Natural Intelligence", cette recherche soutient que les grands modèles de langage ne sont ni des esprits humains en devenir, ni de simples outils statistiques sophistiqués, mais des extensions des structures cognitives propres à l'être humain. S'appuyant sur la phénoménologie du philosophe Edmund Husserl, les auteurs avancent que le langage humain contient déjà des structures sédimentées de compréhension du monde, et que les modèles d'IA apprennent précisément à modéliser et prolonger ces structures. Ce cadre théorique rejoint des travaux récents comme "The Blind Spot" d'Adam Frank, Marcelo Gleiser et Evan Thompson, ou encore "The Abstraction Fallacy" du chercheur de DeepMind Alexander Lerchner, qui posent tous la même question de fond : et si l'IA fonctionnait parce qu'elle s'appuie sur ce que les humains ont déjà construit ? Cette perspective permet d'expliquer à la fois les performances remarquables des modèles actuels et leurs limites récurrentes. Les LLM peuvent produire des textes cohérents dans des domaines très variés parce qu'ils ont appris les relations statistiques entre concepts à travers des milliards de textes humains. Mais ils hallucinent parce qu'ils étendent des patterns à l'intérieur du langage, sans être ancrés dans un rapport direct au monde. Là où un humain est constamment corrigé par l'expérience, un modèle prolonge des configurations linguistiques sans pouvoir vérifier leur rapport à la réalité. Cela explique aussi le "compositionality gap" documenté par la recherche : les modèles progressent beaucoup plus vite en fluidité et en rappel factuel qu'en raisonnement compositionnel véritable, c'est-à-dire la capacité à combiner des concepts de façon réellement nouvelle. Ce n'est pas simplement une limite d'ingénierie, disent les auteurs, mais une frontière structurelle. Sur le plan des implications, cette théorie déplace le débat sur la sécurité de l'IA : plutôt que de s'inquiéter d'une "IA renégate" qui surpasserait l'intelligence humaine, elle invite à traiter la sécurité comme un défi de système, relevant à la fois de l'ingénierie et de la gouvernance. Concevoir l'IA comme une extension de l'intelligence humaine, et non comme son remplacement, offre un cadre plus opérationnel pour construire des systèmes fiables. Dans un contexte où les investissements dans les LLM atteignent des niveaux records et où les débats sur l'alignement et les risques existentiels monopolisent l'attention, cette approche phénoménologique propose une voie plus sobre : comprendre ce que l'IA est vraiment avant de décider ce qu'elle pourrait devenir.

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic