Andrej Karpathy libère 'Autorecherche', un outil Python de 630 lignes permettant aux agents AI de mener des expériences ML autonomes sur des GPU uniques
Andrej Karpathy a publié 'autoresearch', un outil Python minimaliste permettant aux agents AI d'exécuter des expériences ML autonomes sur une seule GPU NVIDIA. Le projet, condensé en ~630 lignes de code, utilise une boucle d'itération autonome avec des métriques BPB (bits par byte) comme principale validation. Tobi Lutke, CEO de Shopify, a adapté ce framework, rapportant une amélioration de 19% sur les scores de validation en optimisant un modèle plus petit via l'agent. Les optimisations trouvées par l'agent ont été intégrées dans le cadre nanochat plus vaste, montrant la polyvalence de l'outil.
Andrej Karpathy's 'Autoresearch' tool, a 630-line Python library, enables AI agents to conduct autonomous machine learning experiments on NVIDIA GPUs, potentially enhancing European AI research and development, aligning with the EU AI Act's emphasis on trustworthy AI by facilitating transparent, efficient, and controlled AI experimentation within European companies, particularly e-commerce leaders like Shopify.