OutilsLe Big Data6sem

Vous en avez marre des IA ? Cette startup vous paye 800 $ pour les torturer

Résumé IASource uniqueImpact UE

La startup Memvid propose 800 $ pour une journée de travail atypique : pousser des chatbots dans leurs limites jusqu'à les faire flancher. Le poste, baptisé « AI bully », ne requiert aucune compétence technique — uniquement une capacité à remarquer chaque incohérence, à répéter inlassablement les mêmes consignes, et à documenter avec rigueur chaque moment où l'intelligence artificielle décroche. Loin d'être un gadget marketing, cette offre pointe une faille structurelle des grands modèles de langage actuels.

Le problème au cœur de cette démarche est celui de la mémoire de contexte. Contrairement à un humain, un LLM ne dispose pas d'une mémoire continue : il opère dans une « fenêtre de contexte » de taille limitée, au-delà de laquelle les informations antérieures s'effacent ou se diluent. Résultat concret : une consigne donnée au début d'une longue conversation peut disparaître, un utilisateur se déclarant végétarien se voit proposer du bacon quarante messages plus tard, une demande de ton formel est ignorée après quelques échanges. Ces défaillances, banales pour qui utilise ces outils quotidiennement, restent difficiles à quantifier précisément en environnement de laboratoire.

Google, Anthropic et d'autres acteurs majeurs tentent d'y remédier — le premier en ajoutant des capacités de mémoire persistante à ses modèles, le second en permettant à Claude de conserver certains échanges entre sessions. Mais ces solutions demeurent fragmentées et imprévisibles. Memvid choisit une approche différente : cartographier ces défaillances dans des conditions réelles, avec de vrais utilisateurs dont la patience s'érode progressivement. L'entreprise cible les boucles infinies, les contradictions internes, les pertes de contexte brutales — autant de comportements impossibles à reproduire fidèlement dans un cadre contrôlé.

Le profil recherché dit beaucoup sur l'état du secteur : pas d'ingénieur, pas de chercheur, mais des personnes « relou et tatillonnes » selon les termes mêmes de l'offre. Que la mémoire persistante reste en 2026 le « Saint Graal non débloqué » de l'IA conversationnelle — et qu'une startup doive rémunérer des utilisateurs frustrés pour en cartographier les limites — illustre à quel point ce chantier fondamental n'est pas encore résolu.

Dans nos dossiers

Anthropic

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Frandroid

Marre d’Instagram ou de X ? Vous pouvez construire votre propre réseau social avec cet assistant IA

Bluesky, le réseau social décentralisé concurrent de X, a lancé Attie, un assistant IA conçu pour permettre à n'importe qui de créer son propre réseau social sans écrire une ligne de code. L'outil s'appuie sur le protocole AT (ATmosphere Protocol), la fondation ouverte sur laquelle repose Bluesky, pour générer et configurer des instances sociales personnalisées via de simples instructions en langage naturel. L'enjeu est considérable : jusqu'ici, déployer une plateforme sociale indépendante nécessitait des compétences techniques avancées, réservant cette capacité aux développeurs et aux entreprises. Attie démocratise ce pouvoir, permettant à des communautés de niche, des associations ou des créateurs de s'affranchir des algorithmes et des règles imposées par Meta ou X, en contrôlant entièrement leur espace numérique. Bluesky a connu une croissance explosive fin 2024, franchissant les 20 millions d'utilisateurs lors de l'exode post-élection américaine depuis X. La société, financée notamment par Jack Dorsey avant sa rupture avec le projet, mise sur l'interopérabilité et la décentralisation comme arguments différenciants face aux géants centralisés. Attie s'inscrit dans cette stratégie : transformer le protocole AT en plateforme créative accessible au plus grand nombre, et accélérer l'adoption de l'écosystème fédéré face à un marché dominé par une poignée d'acteurs.

UELes associations, médias indépendants et communautés européennes peuvent désormais créer leur propre réseau social fédéré sans compétences techniques, réduisant leur dépendance aux plateformes américaines soumises à leurs propres règles algorithmiques.

OutilsOutil

1 source

2Siècle Digital

Et si plusieurs IA travaillaient ensemble pour mieux vous aider ? Microsoft tente le pari

Microsoft a dévoilé Researcher, un nouvel agent intégré à Microsoft 365 Copilot, conçu pour dépasser les capacités d'un seul modèle de langage en orchestrant plusieurs IA en parallèle. Plutôt que de s'appuyer sur un unique modèle qui répond directement, Researcher décompose les requêtes complexes en sous-tâches distribuées à différents agents spécialisés — certains pour la recherche web, d'autres pour l'analyse de données internes ou la synthèse — avant de recomposer une réponse cohérente. Cette architecture multi-agents s'inscrit dans la stratégie plus large de Microsoft pour ses outils de productivité professionnelle. L'enjeu est concret pour les entreprises clientes de Microsoft 365 : les tâches de recherche approfondie, comme la préparation d'un dossier stratégique ou l'analyse concurrentielle, nécessitent aujourd'hui plusieurs heures de travail humain. Researcher vise à produire en quelques minutes des synthèses longues et sourcées, avec un niveau de précision supérieur à ce que peut offrir un assistant conversationnel classique. C'est la différence entre poser une question à un généraliste et confier un brief à une équipe d'analystes. Cette annonce s'inscrit dans une accélération du marché des agents IA, où OpenAI (avec Deep Research), Google (avec Gemini Deep Research) et Perplexity jouent déjà des coudes. Microsoft mise sur son ancrage dans l'environnement professionnel — Teams, Outlook, SharePoint, Word — pour différencier Researcher par sa capacité à croiser sources externes et données internes d'entreprise. La course ne porte plus sur le modèle le plus puissant, mais sur l'architecture qui coordonne le mieux plusieurs cerveaux artificiels.

UELes entreprises françaises et européennes utilisatrices de Microsoft 365 Copilot pourraient automatiser des tâches de recherche stratégique longues (dossiers, analyses concurrentielles), avec un gain de temps potentiellement significatif sur des flux de travail existants.

💬 L'angle intéressant ici c'est pas l'orchestration multi-agents en elle-même, ça fait un moment qu'on en parle. C'est que Microsoft peut brancher ça sur SharePoint, Teams, Outlook, et croiser tes données internes avec le web en un seul run. Reste à voir si ça tient sur de vrais dossiers d'entreprise et pas juste des démos bien cadrées.

OutilsOutil

1 source

3Next INpact

NemoClaw, analyse et prise en main de la « prison » pour sécuriser les agents IA

NVIDIA a annoncé NemoClaw lors de la GTC, un projet open source en version alpha conçu pour sécuriser les agents IA, notamment OpenClaw. NemoClaw propose un environnement avec des garde-fous de confidentialité et de sécurité, donnant aux utilisateurs le contrôle sur le comportement de leurs agents et la gestion de leurs données. OpenClaw, anciennement Clawdbot/Moltbot, est un agent IA open source développé par Peter Steinberger (désormais chez OpenAI) permettant d'accéder à des données personnelles pour agir comme assistant virtuel.

OutilsOpinion

1 source

4Frandroid

Votre ordinateur ou smartphone peut-il faire tourner une IA ? Ce site vous donne la réponse en un clic

CanIRun.ai est un nouveau site qui permet de vérifier en un clic si votre appareil — smartphone, tablette ou PC — est capable de faire tourner une intelligence artificielle en local, sans passer par le cloud. C'est une information concrète et utile pour des millions d'utilisateurs qui souhaitent expérimenter des modèles d'IA comme LLaMA ou Mistral directement sur leur machine, sans dépendre de serveurs distants ni payer d'abonnement. Savoir si son matériel est compatible évite des heures de configuration inutile. L'IA locale gagne en popularité depuis la prolifération de modèles open source légers et performants, mais les exigences en RAM, GPU et stockage restent un frein pour le grand public.

UELes utilisateurs européens peuvent directement vérifier la compatibilité de leur appareil pour faire tourner des modèles open source comme Mistral en local.

OutilsOutil

1 source