Un nouveau cadre d'évaluation pour les agents vocaux (EVA)
Le contenu de l'article est manquant — seul le titre a été fourni. Peux-tu partager le texte complet de l'article ?
Le contenu de l'article est manquant — seul le titre a été fourni. Peux-tu partager le texte complet de l'article ?
Des chercheurs de l'Université de Colombie-Britannique, NYU, Edinburgh et Meta (FAIR + Meta Superintelligence Labs) ont introduit les Hyperagents, un nouveau framework d'auto-amélioration récursive où l'agent peut modifier non seulement ses performances sur une tâche, mais aussi le mécanisme même qui génère ces améliorations. Contrairement au Darwin Gödel Machine (DGM) qui reposait sur un méta-agent fixe et artisanal, le DGM-H intègre agent de tâche et méta-agent dans un seul programme entièrement éditable, éliminant la nécessité d'aligner le domaine de la tâche avec celui de l'auto-modification. Le système a été testé avec succès sur des domaines variés — code, revue d'articles scientifiques, conception de récompenses en robotique et notation de mathématiques olympiques — démontrant une amélioration au-delà des optima locaux.
UEL'Université d'Édimbourg figure parmi les co-auteurs, ce qui illustre la contribution européenne à cette avancée, mais l'impact opérationnel direct sur la France ou l'UE reste inexistant à ce stade.
Des chercheurs explorent l'utilisation de l'IA pour prédire les pandémies, y compris des menaces inconnues comme le coronavirus. L'approche consiste à modéliser des trajectoires potentielles sur les 200 premiers jours suivant la détection du premier cas, même sans données préexistantes sur le pathogène.
UELes systèmes de surveillance épidémiologique européens (ECDC) pourraient bénéficier de tels outils prédictifs pour anticiper les futures pandémies.
Andrej Karpathy a confié à un agent autonome l'optimisation de son environnement d'entraînement overnight, et celui-ci a découvert des améliorations qu'il n'avait pas détectées malgré vingt ans d'expérience. Selon Karpathy, les humains sont désormais le goulot d'étranglement de la recherche en IA, notamment pour les tâches aux résultats facilement mesurables.