Aller au contenu principal
NeurIPS 2026 : la conférence où se joue l’avenir scientifique, industriel et géopolitique de l’IA
RechercheFrenchWeb6sem· 1 min de lecture

NeurIPS 2026 : la conférence où se joue l’avenir scientifique, industriel et géopolitique de l’IA

Source originale ↗·

NeurIPS 2026 se tiendra du 6 au 13 décembre à Sydney, en Australie, avec deux éditions satellites simultanées à Atlanta et à Paris. Organisée chaque année depuis 1987, la conférence "Neural Information Processing Systems" est l'un des rendez-vous académiques les plus influents du secteur de l'intelligence artificielle, rassemblant chercheurs, ingénieurs et décideurs du monde entier autour des dernières avancées en apprentissage automatique. La formule multi-sites, avec des hubs sur trois continents, confirme l'ampleur croissante d'un événement devenu trop vaste pour un seul lieu.

NeurIPS est aujourd'hui bien plus qu'un congrès scientifique : c'est un baromètre de l'état de l'art en IA et un lieu de recrutement stratégique pour les grands laboratoires. Google, Meta, OpenAI, Microsoft ou encore Mistral y exposent leurs travaux, signalent leurs priorités de recherche et captent les meilleurs talents académiques. La présence d'un satellite à Paris souligne par ailleurs la montée en puissance de l'écosystème européen, qui cherche à peser dans une compétition technologique dominée par les États-Unis et la Chine.

La conférence s'inscrit dans un contexte de tension géopolitique autour du contrôle des modèles de pointe, des données d'entraînement et des puces spécialisées. Depuis l'émergence des grands modèles de langage à partir de 2022, NeurIPS est devenu un terrain d'observation pour gouvernements et investisseurs autant que pour la communauté scientifique. L'édition 2026 devrait refléter les débats en cours sur la régulation internationale de l'IA, la sécurité des systèmes et la course aux modèles multimodaux de prochaine génération.

Impact France/UE

La tenue d'un hub satellite à Paris pour NeurIPS 2026 offre aux chercheurs et entreprises françaises un accès direct à la conférence de référence mondiale en IA, renforçant la visibilité de l'écosystème européen face aux géants américains et chinois.

💬 L'analyse de Mathieu

Le hub parisien, c'est une bonne nouvelle pour l'éco IA français, même si faut pas se raconter des histoires : le vrai centre de gravité reste à Sydney (et avant ça, dans les labos de San Francisco et Pékin). Ce qui m'intéresse dans cette édition 2026, c'est moins les papers que ce que les grands labos vont choisir de montrer, parce que NeurIPS est devenu autant une vitrine stratégique qu'une conférence scientifique. Reste à voir si Mistral et les européens y font autre chose que de la figuration.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Conférence CVPR 2026 sur la vision par ordinateur et la reconnaissance de formes
1Apple Machine Learning 

Conférence CVPR 2026 sur la vision par ordinateur et la reconnaissance de formes

Apple sera présent à la conférence CVPR 2026 (IEEE/CVF Conference on Computer Vision and Pattern Recognition), qui se tient en présentiel à Denver, au Colorado Convention Center, du 3 au 7 juin 2026. L'entreprise y présente de nouveaux travaux de recherche et en assure la sponsorisation, confirmant ainsi son engagement continu auprès de la communauté scientifique mondiale spécialisée en vision par ordinateur et en reconnaissance de formes. La participation d'Apple à ce type d'événement illustre la montée en puissance de sa stratégie de recherche publique. En publiant ses travaux à CVPR, l'un des rendez-vous académiques les plus influents dans le domaine de l'intelligence artificielle visuelle, Apple signale ses priorités technologiques tout en attirant des talents issus du milieu universitaire. Pour l'industrie, cette visibilité académique est devenue un levier de recrutement et de légitimité scientifique face à des concurrents comme Google DeepMind, Meta AI ou Microsoft Research, qui investissent massivement dans la publication ouverte. CVPR est considéré comme l'une des conférences les plus sélectives et les plus citées en intelligence artificielle, rassemblant chaque année plusieurs milliers de chercheurs du monde entier. Apple, longtemps critiqué pour son opacité scientifique comparée à ses rivaux, a progressivement ouvert sa recherche au cours des dernières années, notamment via son blog officiel et des publications dans des conférences de premier plan. Le contenu précis des travaux présentés à Denver devrait être détaillé lors de l'événement début juin.

RecherchePaper
1 source
Fonctions d'activation Sigmoid et ReLU : le coût en inférence de la perte de contexte géométrique
2MarkTechPost 

Fonctions d'activation Sigmoid et ReLU : le coût en inférence de la perte de contexte géométrique

Les réseaux de neurones profonds peuvent être compris comme des systèmes géométriques : chaque couche transforme l'espace d'entrée pour construire des frontières de décision de plus en plus complexes. Une étude comparative récente explore comment deux fonctions d'activation fondamentales, Sigmoid et ReLU (Rectified Linear Unit), influencent cette géométrie interne et, par conséquent, l'efficacité des modèles lors de l'inférence. L'expérience repose sur un jeu de données synthétique classique, le "two-moons", généré avec scikit-learn : 400 points répartis en deux classes non linéairement séparables, avec un bruit de 0,18 pour simuler des conditions réalistes. Les deux architectures sont strictement identiques, même nombre de couches, même largeur, seule la fonction d'activation diffère, ce qui permet une comparaison propre et isolée. Le constat central est le suivant : Sigmoid compresse toutes les valeurs d'entrée dans un intervalle étroit entre 0 et 1. Conséquence directe, les points éloignés des frontières de décision deviennent indiscernables les uns des autres, car l'information sur leur distance à ces frontières est effacée couche après couche. Ce phénomène, appelé perte de contexte géométrique, affaiblit la capacité du réseau à construire des représentations riches en profondeur. ReLU, à l'inverse, conserve la magnitude des entrées positives : l'information de distance continue de circuler à travers les couches, permettant au réseau de rester expressif sans nécessiter une largeur excessive ni une puissance de calcul démesurée. En pratique, cela se traduit par des modèles ReLU plus efficaces à l'inférence et mieux adaptés au passage à l'échelle. Ces observations s'inscrivent dans une évolution plus large du domaine du deep learning. ReLU a progressivement remplacé Sigmoid comme fonction d'activation standard dans les réseaux profonds dès les années 2010, notamment grâce aux travaux fondateurs d'Hinton, LeCun et Bengio sur le problème de la disparition du gradient. Sigmoid souffrait en effet d'un double problème : saturation des gradients lors de la rétropropagation, et perte d'information géométrique lors de la propagation avant. L'étude actuelle met l'accent précisément sur ce second aspect, moins souvent discuté que le premier. Avec la montée en puissance des grands modèles de langage et des architectures à des centaines de milliards de paramètres, l'efficacité à l'inférence est devenue un enjeu industriel majeur. Des variantes de ReLU comme GELU ou SwiGLU, utilisées dans GPT-4 ou LLaMA, héritent de cette même propriété de préservation de l'information, confirmant que le choix de la fonction d'activation reste un levier critique pour la performance et l'économie de calcul des systèmes d'IA modernes.

RecherchePaper
1 source
Le programme NAIRR Science redéfinit la recherche scientifique grâce à l'infrastructure IA de NVIDIA
3NVIDIA AI Blog 

Le programme NAIRR Science redéfinit la recherche scientifique grâce à l'infrastructure IA de NVIDIA

Le programme pilote NAIRR (National Artificial Intelligence Research Resource), lancé par la Fondation nationale des sciences américaine (NSF), a soutenu plus de 700 projets de recherche au cours des deux dernières années, dans des domaines aussi variés que la prédiction de structures protéiques et la gestion des épidémies infectieuses. NVIDIA a contribué au programme en fournissant aux chercheurs un accès dédié à au moins quatre nœuds DGX pendant un minimum d'un mois, accompagné d'un support technique continu. Parmi les projets phares figure le modèle Walrus, développé par le consortium Polymathic AI regroupant le Flatiron Institute, l'Université de Cambridge et le Lawrence Berkeley National Lab : entraîné sur un vaste jeu de données baptisé "the Well", ce modèle de fondation pour les simulations de fluides a été rendu public avec ses données, son code et ses poids. À l'Université du Michigan, le professeur Venkat Viswanathan a dirigé le développement de MIST (Molecular Insight SMILES Transformers), une famille de modèles moléculaires pré-entraînés sur des bases de données non étiquetées, affinés sur plus de 400 relations structure-propriété et capables d'égaler ou de surpasser l'état de l'art en électrochimie, chimie quantique et physiologie. MIST a été développé sur un cluster de 40 GPU NVIDIA DGX, complété par 200 000 heures GPU sur le cluster Polaris de l'ALCF. Ces travaux illustrent une accélération concrète du rythme de la découverte scientifique grâce à l'infrastructure GPU. En fusionnant MIST avec des grands modèles de langage généralistes, les chercheurs du Michigan rendent les calculs de chimie quantique accessibles à un public plus large de scientifiques computationnels, ouvrant la voie à des matériaux de stockage d'énergie de nouvelle génération pour l'électrification des transports lourds et aériens. Walrus, de son côté, vise à devenir le modèle de fondation le plus polyvalent jamais construit pour modéliser les comportements fluides, avec des applications potentielles dans l'industrie, la météorologie et l'ingénierie. Ces outils ne restent pas dans les laboratoires : leur mise à disposition publique accélère leur adoption et leur amélioration collective. Le programme NAIRR s'inscrit dans une stratégie plus large de démocratisation de l'accès à la puissance de calcul pour la recherche académique américaine, face à la concentration croissante des ressources IA dans le secteur privé. En offrant des allocations de GPU à des institutions universitaires, le NSF cherche à rééquilibrer les conditions de la recherche fondamentale à l'heure où les coûts d'entraînement explosent. NVIDIA, en fournissant à la fois du matériel et un accompagnement technique, consolide son positionnement comme infrastructure de référence pour la recherche scientifique. La suite du programme NAIRR, dont la pérennisation fait l'objet de discussions au Congrès, pourrait déterminer si les États-Unis maintiennent un avantage compétitif dans la recherche en IA publique face à des acteurs privés et étrangers de plus en plus puissants.

UEL'Université de Cambridge participe au consortium Polymathic AI (modèle Walrus), mais le programme NAIRR est une initiative fédérale américaine sans incidence directe sur les financements ou politiques de recherche en France ou dans l'UE.

RechercheActu
1 source
L’IA est-elle consciente ? La réponse insolite d’un chercheur de Microsoft
4Le Big Data 

L’IA est-elle consciente ? La réponse insolite d’un chercheur de Microsoft

Adrian de Wynter, chercheur chez Microsoft, a publié un article scientifique au titre volontairement provocateur : « Si les LLM possèdent des attributs humains, alors Age of Empires II aussi ». Pour étayer sa thèse, il n'a pas eu recours à des serveurs de calcul ni à des GPU dernier cri, mais aux chèvres virtuelles du célèbre jeu de stratégie sorti en 1999. En utilisant l'éditeur de scénarios intégré au jeu, il a réussi à transformer ces animaux numériques en composants logiques fonctionnels, reproduisant des portes élémentaires comme NAND, XNOR et AND, les briques de base de tout système informatique. Ces mécanismes lui ont ensuite permis de construire un perceptron, la forme la plus simple de réseau de neurones artificiels. De Wynter surnomme affectueusement ses créatures les « bit-goats », contraction de « bit » et « goat ». La démonstration n'est pas un simple tour de passe-passe : elle pointe une faille fondamentale dans les débats actuels sur la conscience des IA. Personne ne dispose aujourd'hui d'une méthode universellement reconnue pour mesurer ou prouver l'existence d'une conscience chez un système artificiel. Les affirmations en ce sens reposent donc sur des intuitions, des métaphores et des analogies difficiles à vérifier scientifiquement. En montrant que les mêmes mécanismes logiques qui sous-tendent les LLM modernes peuvent être reproduits dans un jeu vidéo avec des chèvres pixellisées, de Wynter illustre que le substrat, c'est-à-dire le support physique ou logiciel sur lequel tourne un système, ne suffit pas à lui conférer des propriétés particulières. Ce n'est pas parce qu'un modèle tourne sur une infrastructure sophistiquée qu'il pense, et ce n'est pas parce qu'un système repose sur quelque chose d'improbable qu'il en est incapable. Ce travail s'inscrit dans un débat qui divise la communauté scientifique depuis l'émergence de ChatGPT fin 2022. D'un côté, des chercheurs comme ceux associés à des projets de « conscience artificielle » estiment que les grands modèles de langage représentent les prémices d'une intelligence générale. De l'autre, une majorité de spécialistes y voient des systèmes statistiques sophistiqués qui prédisent des mots sans rien comprendre. Le problème central, que l'expérience des bit-goats expose avec humour, est que notre cerveau associe spontanément le langage fluide à la conscience : quand une machine s'exprime de manière convaincante, nous lui prêtons naturellement compréhension et réflexion. Adrian de Wynter ne tranche pas la question de savoir si les IA sont conscientes, mais démontre que les outils conceptuels dont on dispose pour y répondre sont, pour l'instant, largement insuffisants.

💬 Les "bit-goats" d'Age of Empires II posent la vraie question : si un perceptron construit avec des chèvres pixellisées d'un jeu de 1999 satisfait les mêmes critères logiques qu'un LLM, sur quoi se basent ceux qui affirment que les LLM "pensent" ? On n'a aucun critère mesurable pour définir la conscience artificielle, et ce travail le prouve avec plus de rigueur que la plupart des tribunes publiées depuis 3 ans. J'attends de voir si ça met fin aux grandes déclarations sur "l'IA qui ressent".

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic