Vous cherchez un article ? Utilisez la recherche — cette page suit l'actualité de la recherche en IA.

Recherche

50 sur 809 articles

Papers, découvertes scientifiques et avancées en IA

Google's TabFM se passe d'entraînement par jeu de données et prédit quand même sur des tables jamais vues

Google Research a dévoilé TabFM, un modèle de fondation capable de faire des prédictions sur des données tabulaires sans jamais être entraîné sur le jeu de données concerné. Grâce à l'apprentissage en contexte, TabFM produit ses résultats en un seul passage avant, à partir d'un prompt unique combinant les exemples historiques et les nouvelles lignes à prédire. Selon Weihao Kong, chercheur chez Google Research, ce modèle épargne aux équipes data les pipelines classiques de nettoyage, d'imputation des valeurs manquantes et d'encodage des variables catégorielles, ainsi que les boucles répétitives d'optimisation d'hyperparamètres portant sur le taux d'apprentissage, la profondeur des arbres ou les ratios de sous-échantillonnage. TabFM s'appuie sur deux architectures antérieures : TabPFN, développée par la société Prior Labs, qui avait le première démontré la faisabilité d'une classification zéro-shot sur de petits tableaux, et TabICL, conçue par l'Institut national de recherche en sciences et technologies du numérique en France, qui a résolu les limites de passage à l'échelle grâce à une technique de compression des lignes. Pour les développeurs et ingénieurs en entreprise, l'enjeu est concret : ce qui nécessitait auparavant des semaines de construction de pipelines peut désormais tenir en un simple appel API. Prenons l'exemple d'un analyste cherchant à prédire le désabonnement d'un client : au lieu d'entraîner un modèle XGBoost sur mesure, il lui suffit de transmettre à TabFM un échantillon de données de sessions passées accompagné de la session active à évaluer, pour obtenir instantanément une probabilité de churn. Cette approche supprime aussi la dette opérationnelle liée à la surveillance de la dérive des données et au réentraînement périodique des modèles, un fardeau récurrent pour les équipes qui maintiennent des systèmes de machine learning en production. Cette avancée s'inscrit dans un mouvement plus large : alors que les modèles génératifs de texte et de vision sont depuis longtemps passés à l'inférence zéro-shot par simple prompt, les données tabulaires, qui représentent pourtant la majorité des données d'entreprise stockées dans les entrepôts, les CRM et les registres financiers, étaient restées à l'écart de cette évolution. La raison tient aux limites des grands modèles de langage face aux tableaux : leur fenêtre de contexte sature vite face à des tableaux de quelques milliers de lignes, leur tokenisation fragmente maladroitement les valeurs numériques, et la mise à plat d'une structure à deux dimensions en texte linéaire leur fait perdre la correspondance entre lignes et colonnes. TabFM contourne ce problème en traitant directement les données comme une grille, préservant leur intégrité structurelle plutôt que de les forcer dans une chaîne de texte.

UEL'architecture TabICL, sur laquelle s'appuie TabFM, a été développée par l'Institut national de recherche en sciences et technologies du numérique (Inria), une contribution française majeure à cette avancée.

Recherche

Google's TabFM se passe d'entraînement par jeu de données et prédit quand même sur des tables jamais vues

Google Deepmind affirme que les générateurs vidéo possèdent déjà les modèles du monde qui manquaient à la vision par ordinateur

L'IA a du mal à détecter les textes générés quand les modèles imitent le style d'un auteur

Les chatbots IA lisant des radiographies peuvent se montrer dangereusement sûrs d'eux, même quand ils se trompent

Perplexity AI publie WANDR, un benchmark ouvert pour évaluer les agents de recherche capables d'explorer largement et en profondeur

Plus d'articles

Sakana AI utilise la diffusion d'erreurs pour entraîner des réseaux à double flux conformes à Dale, atteignant 96,7% sur MNIST et 61,7% sur CIFAR-10 sans rétropropagation

Zyphra publie ZUNA1.1, un modèle d'EEG en Apache 2.0 acceptant des entrées de 0,5 à 30 secondes

Distiller le comportement des modèles frontières à partir de télémétrie de production, d'OTEL aux SLMs

L’IA rend l’édition scientifique « plus lente, de moins bonne qualité et plus chère »

L'oubli gratuit : exploiter les points à faible influence pour réduire les coûts de calcul

La Table du Futur Devrait Ressembler à un Data Center

Le distillation autonome (auto-distillation) simple améliore la génération de code

Recherche vidéo incrémentale personnalisée : hybridation d'embeddings texte et ID

« Les multiples personnalités du premier chatbot »

Une seule couche suffit : adapter les encodeurs visuels pré-entraînés pour la génération d'images

CLaRa : relier recherche documentaire et génération grâce au raisonnement latent continu

Quantification de l'incertitude pour l'appel de fonctions dans les LLM

L'évaluation des modèles devient encore plus difficile

Recherche sur les environnements proactifs d'agents : simuler des utilisateurs actifs pour évaluer les assistants proactifs

Recherche sémantique multilingue pour la recherche musicale sur Apple Music

Recherche

Google's TabFM se passe d'entraînement par jeu de données et prédit quand même sur des tables jamais vues

Google Deepmind affirme que les générateurs vidéo possèdent déjà les modèles du monde qui manquaient à la vision par ordinateur

L'IA a du mal à détecter les textes générés quand les modèles imitent le style d'un auteur

Les chatbots IA lisant des radiographies peuvent se montrer dangereusement sûrs d'eux, même quand ils se trompent

Perplexity AI publie WANDR, un benchmark ouvert pour évaluer les agents de recherche capables d'explorer largement et en profondeur

Plus d'articles

Sakana AI utilise la diffusion d'erreurs pour entraîner des réseaux à double flux conformes à Dale, atteignant 96,7% sur MNIST et 61,7% sur CIFAR-10 sans rétropropagation

Zyphra publie ZUNA1.1, un modèle d'EEG en Apache 2.0 acceptant des entrées de 0,5 à 30 secondes

Distiller le comportement des modèles frontières à partir de télémétrie de production, d'OTEL aux SLMs

L’IA rend l’édition scientifique « plus lente, de moins bonne qualité et plus chère »

L'oubli gratuit : exploiter les points à faible influence pour réduire les coûts de calcul

La Table du Futur Devrait Ressembler à un Data Center

Le distillation autonome (auto-distillation) simple améliore la génération de code

Recherche vidéo incrémentale personnalisée : hybridation d'embeddings texte et ID

« Les multiples personnalités du premier chatbot »

Une seule couche suffit : adapter les encodeurs visuels pré-entraînés pour la génération d'images

CLaRa : relier recherche documentaire et génération grâce au raisonnement latent continu

Quantification de l'incertitude pour l'appel de fonctions dans les LLM

L'évaluation des modèles devient encore plus difficile

Recherche sur les environnements proactifs d'agents : simuler des utilisateurs actifs pour évaluer les assistants proactifs

Recherche sémantique multilingue pour la recherche musicale sur Apple Music