Aller au contenu principal
Des entreprises d'IA ciblent les acteurs d'improvisation pour entraîner leurs modèles aux émotions humaines
LLMsThe Verge AI13sem· 1 min de lecture

Des entreprises d'IA ciblent les acteurs d'improvisation pour entraîner leurs modèles aux émotions humaines

Source originale ↗·

Les grandes entreprises d'IA recrutent des acteurs d'improvisation pour entraîner leurs modèles à mieux comprendre et reproduire les émotions humaines. Une offre d'emploi publiée via Handshake — une société spécialisée dans la fourniture de données d'entraînement à OpenAI et d'autres laboratoires — recherche des profils capables de "portraire authentiquement des émotions" et de "rester fidèles à la voix d'un personnage tout au long d'une scène". Les candidats ne monteront pas sur scène : leur talent servira à alimenter des modèles d'intelligence artificielle.

Ce recrutement révèle une évolution majeure dans la stratégie des acteurs de l'IA : après avoir massivement ingéré du texte et des images, les laboratoires cherchent désormais à combler un manque persistant — la nuance émotionnelle et le jeu dramatique. Les modèles actuels peinent encore à simuler des échanges conversationnels crédibles, riches en sous-texte et en variation de ton. Les improvisateurs, formés à réagir spontanément et à incarner des personnages complexes, représentent une source de données particulièrement précieuse pour ce type d'entraînement.

Handshake AI fait partie d'un écosystème en pleine expansion de sociétés spécialisées dans la fourniture de données d'entraînement de niche. Ces entreprises intermédiaires se positionnent entre les talents humains et les grands labos, proposant des missions de plus en plus ciblées — jeu de rôle, expression émotionnelle, simulation de dialogues complexes. Le profil recherché insiste sur la capacité à "rester authentique" et à maintenir une cohérence de personnage, des compétences directement issues de la formation théâtrale à l'improvisation.

Cette tendance soulève des questions sur la rémunération et les droits des artistes sollicités pour enrichir des systèmes commerciaux. Alors que la Screen Actors Guild et d'autres syndicats ont déjà bataillé contre l'utilisation non consentie de performances d'acteurs, ce nouveau marché du "talent émotionnel" à la tâche pourrait raviver les tensions entre la communauté artistique et l'industrie tech.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Le nouveau modèle d'Anthropic cible les utilisateurs avancés mais coupe l'accès aux rivaux IA
1The Information AI 

Le nouveau modèle d'Anthropic cible les utilisateurs avancés mais coupe l'accès aux rivaux IA

Anthropic a publié mardi une version publique de Claude Fable 5, son modèle de nouvelle génération, une itération légèrement bridée du système baptisé en interne "Mythos", dont les rumeurs circulaient depuis plusieurs semaines dans les milieux du développement. Les premiers accès au modèle ont été ouverts aux développeurs d'applications, qui ont pu l'évaluer dans des conditions réelles. Leurs retours confirment l'essentiel des attentes : Fable 5 surpasse nettement les générations précédentes d'Anthropic sur le code, le raisonnement spatial et les tâches de connaissance générale. Une restriction notable a toutefois été intégrée dès le lancement : toute requête touchant à la cybersécurité est automatiquement redirigée vers le modèle Claude Opus 4.8, jugé moins puissant, afin de limiter les risques de détournement. Ce qui frappe dans les retours des testeurs, c'est moins la performance brute que la nature des tâches sur lesquelles Fable 5 se distingue vraiment. Sur des questions simples ou de difficulté intermédiaire, le type de requêtes qu'on adresserait à Google Search ou à ChatGPT, l'amélioration par rapport aux modèles précédents d'Anthropic reste difficile à percevoir. En revanche, sur des travaux longs et complexes, le bond est significatif : des développeurs ont rapporté avoir généré un jeu vidéo complet à partir d'un seul prompt, un cas d'usage qui illustre une montée en gamme qualitative sur les tâches nécessitant planification, cohérence prolongée et enchaînement logique sur plusieurs étapes. Ce lancement s'inscrit dans une compétition frontale entre les grands laboratoires d'IA, où chaque sortie de modèle est scrutée comme un indicateur de positionnement stratégique. Anthropic, adossé à des milliards de dollars d'investissements d'Amazon et Google, cherche à affirmer sa place face à OpenAI et Google DeepMind sur le segment des utilisateurs avancés et des équipes de développement professionnelles. La décision de limiter les capacités liées à la cybersécurité révèle également la pression croissante pesant sur ces entreprises pour démontrer que la puissance des modèles peut être déployée de façon responsable, sans devenir un vecteur d'exploitation. Les prochaines semaines diront si la version complète de Mythos franchit un nouveau palier.

UELes développeurs et équipes techniques en France et en Europe peuvent intégrer ce nouveau modèle dans leurs workflows, avec des gains significatifs sur les tâches complexes de code et de raisonnement.

💬 Le gap sur les tâches simples, je m'en fous. C'est sur les enchaînements longs et complexes que ça change quelque chose, et les testeurs qui ont généré un jeu vidéo complet depuis un seul prompt en sont la meilleure illustration. La restriction cybersec vers Opus 4.8, c'est du pragmatisme habillé en éthique, mais dans le contexte actuel difficile de faire autrement.

LLMsOpinion
1 source
SLM (Small Language Models) : ces modèles IA conviennent-ils aux entreprises ?
2Le Big Data 

SLM (Small Language Models) : ces modèles IA conviennent-ils aux entreprises ?

Face à la montée en puissance des grands modèles de langage généralistes, une nouvelle tendance s'installe dans les entreprises : les SLM, ou Small Language Models. Ces modèles compacts fonctionnent avec un nombre réduit de paramètres et sont entraînés sur des jeux de données ciblés plutôt que sur l'intégralité du web. Contrairement aux LLM classiques qui nécessitent des serveurs spécialisés et des centres de calcul coûteux, les SLM peuvent tourner directement sur l'infrastructure interne d'une entreprise. Leur architecture allégée leur permet d'être déployés sur des machines standard, sans dépendance au cloud. La contrepartie est claire : leur base de connaissances est volontairement restreinte, ce qui rend la qualité des données d'entraînement absolument critique. Un SLM mal entraîné sur des données médiocres devient rapidement inutilisable. L'attrait concret pour les entreprises tient à quatre avantages opérationnels majeurs. D'abord, le coût : chaque requête vers un grand modèle distant génère une dépense, alors qu'un SLM local traite les données sans frais supplémentaires. Ensuite, la vitesse : sans traversée des couches réseau, les réponses arrivent sensiblement plus vite. La confidentialité constitue un troisième argument de poids : aucun document ne quitte le réseau interne, ce qui répond directement aux exigences de nombreux secteurs réglementés comme la finance, la santé ou le juridique. Enfin, la sobriété énergétique : ces modèles consomment nettement moins de ressources matérielles, ce qui réduit à la fois la facture électrique et les besoins en équipement. Un assistant SLM dédié au support client peut par exemple maîtriser parfaitement les procédures internes et les produits d'une entreprise, sans aucun risque de fuite de données vers un tiers. Ce tournant vers les SLM s'inscrit dans une remise en question plus large d'une décennie de course aux grands modèles. Pendant longtemps, l'industrie technologique a postulé que la taille était synonyme de performance, justifiant des investissements colossaux en infrastructure cloud. Cette logique atteint ses limites économiques et pratiques pour une majorité d'entreprises qui n'ont pas les moyens ni les besoins de Google ou Microsoft. Les grands acteurs ont d'ailleurs anticipé ce virage : Microsoft a lancé sa gamme Phi, Google ses modèles Gemma, Meta ses versions légères de LLaMA. La compétition se déplace désormais vers l'efficience plutôt que la seule puissance brute. Pour les organisations qui cherchent une IA fiable, rapide et maîtrisée, les SLM représentent une voie d'adoption plus réaliste que le recours systématique aux géants du cloud.

UELes SLM représentent une option stratégique pour les entreprises européennes soumises au RGPD, permettant de traiter des données sensibles en interne sans les transmettre à des services cloud étrangers.

💬 J'ai vu trop de projets IA bloqués au bout de trois mois parce que le DSI refusait d'envoyer des données patients ou des contrats dans le cloud américain. Les SLM répondent exactement à ça : tu gardes tout en interne, ça tourne sur du hardware qu'une PME peut se payer, et le RGPD devient un avantage plutôt qu'un frein. Le seul truc sur lequel faut pas se louper, c'est la qualité des données d'entraînement, parce que compact et mal nourri, ça donne inutilisable en quinze jours.

LLMsOutil
1 source
Mistral mise sur l'IA sur mesure pour concurrencer OpenAI et Anthropic dans l'entreprise
3TechCrunch AI 

Mistral mise sur l'IA sur mesure pour concurrencer OpenAI et Anthropic dans l'entreprise

Mistral lance Mistral Forge, une plateforme permettant aux entreprises d'entraîner des modèles d'IA personnalisés à partir de zéro sur leurs propres données. Cette approche se distingue de celle d'OpenAI et Anthropic, qui misent davantage sur le fine-tuning et les méthodes basées sur la récupération d'information. Mistral positionne ainsi cette offre comme une alternative plus flexible et souveraine pour le marché enterprise.

UEMistral, entreprise française, renforce la souveraineté numérique européenne en proposant aux entreprises une alternative locale pour entraîner des modèles IA sur leurs propres données.

LLMsOutil
1 source
4VentureBeat AI 

Kimi K2.6 exécute des agents pendant plusieurs jours et révèle les limites de l'orchestration d'entreprise

Moonshot AI, le laboratoire chinois à l'origine de la famille de modèles Kimi, a lancé Kimi K2.6, un modèle conçu spécifiquement pour les agents à exécution continue. Contrairement aux systèmes concurrents, Moonshot revendique des cas d'usage internes où des agents ont fonctionné en autonomie pendant plusieurs heures, et dans un cas documenté, cinq jours d'affilée, pour gérer de la surveillance d'infrastructure et de la réponse à des incidents. Le modèle est désormais disponible sur Hugging Face, via l'API Kimi, Kimi Code et l'application Kimi. Sa principale nouveauté technique réside dans une version améliorée des "Agent Swarms", capables de coordonner jusqu'à 300 sous-agents exécutant simultanément 4 000 étapes parallèles. À la différence de Claude Code d'Anthropic ou de Codex d'OpenAI, qui s'appuient sur des rôles prédéfinis pour orchestrer leurs agents, K2.6 laisse le modèle lui-même décider de l'orchestration en temps réel. Cette évolution met en lumière une fragilité structurelle dans l'écosystème des agents IA : les frameworks d'orchestration existants ont été conçus pour des agents qui s'exécutent en quelques secondes ou minutes, pas pour des processus qui durent des jours. Maintenir l'état d'un agent sur une longue durée pose des problèmes inédits, car l'environnement dans lequel il opère ne cesse d'évoluer pendant son exécution. L'agent doit appeler des outils, des API et des bases de données différents tout au long de sa vie, ce qu'aucun framework actuel n'a été conçu pour gérer proprement. Mark Lambert, directeur produit chez ArmorCode, souligne que le déficit de gouvernance dépasse déjà le rythme de déploiement : ces systèmes génèrent du code et des changements système plus vite que la plupart des organisations ne peuvent les examiner, corriger ou auditer. La course aux agents longue durée s'inscrit dans une compétition plus large entre fournisseurs de modèles, où la capacité d'orchestration est devenue un avantage concurrentiel à part entière. Anthropic, OpenAI et désormais Moonshot AI expérimentent tous des architectures multi-sessions et d'exécution en arrière-plan, mais aucun n'a encore résolu le problème fondamental : sans mécanisme de rollback clair, un agent autonome qui échoue après plusieurs heures d'exécution peut laisser des systèmes dans un état incohérent. Kunal Anand, directeur produit chez F5, résume le défi : l'industrie est passée des scripts aux services, puis aux agents, mais le saut architectural que représentent les agents à long horizon était loin d'être anticipé par la plupart des entreprises. Le praticien Maxim Saplin l'énonce clairement : l'orchestration reste fragile, et ce n'est pas en affinant les prompts qu'on réglera le problème, mais en repensant à la fois les produits et l'entraînement des modèles.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic