Aller au contenu principal
LLMsThe Decoder4j

Grok 4.20 loin derrière Gemini et GPT-5.4, mais établit un record d'absence d'hallucinations

1 source couvre ce sujet·Source originale ↗·
Résumé IA

Le Grok 4.20 de xAI se distingue comme le modèle le moins sujet aux hallucinations parmi tous les modèles testés, tout en étant rapide et économique. Cependant, il accuse un retard significatif face aux modèles de pointe comme Gemini et GPT-5.4 sur les benchmarks standards.

Articles similaires

1MarkTechPost4h

Mistral AI lance Mistral Small 4 : un modèle MoE de 119 milliards de paramètres qui unifie instruction, raisonnement et tâches multimodales

Mistral AI lance Mistral Small 4, un modèle MoE de 119 milliards de paramètres (6B actifs par token) qui unifie pour la première fois les capacités d'instruction, de raisonnement, de vision et de codage agentique en un seul modèle. Il supporte une fenêtre de contexte de 256k tokens et introduit un paramètre `reasoning_effort` configurable à l'inférence, permettant de choisir entre réponse rapide et raisonnement approfondi sans changer de modèle. Par rapport à Mistral Small 3, il affiche une réduction de 40% du temps de complétion et un débit 3x supérieur en configuration optimisée.

UEMistral AI, fleuron français de l'IA, renforce sa compétitivité européenne avec un modèle unifiant vision, raisonnement et codage agentique à haute efficacité, réduisant la dépendance des entreprises et développeurs européens aux solutions américaines.

LLMsOutil
1 source
2The Verge AI4j

Claude d'Anthropic peut désormais répondre avec des graphiques, diagrammes et autres visuels

Anthropic a mis à jour Claude pour lui permettre de générer automatiquement des graphiques, diagrammes et autres visualisations directement dans la conversation. Ces visuels s'affichent en ligne (et non dans un panneau latéral) quand Claude juge qu'une image serait utile au contexte. Par exemple, une question sur le tableau périodique peut déclencher une visualisation interactive, ou une question sur la structure d'un bâtiment peut produire un schéma des charges.

LLMsActu
1 source
3Frandroid4j

Tout savoir sur NemoClaw, le futur concurrent d’OpenClaw signé Nvidia

Nvidia lance NemoClaw, son propre clone d'OpenClaw, après que Jensen Huang avait qualifié OpenClaw de logiciel « le plus important de l'histoire ». Le PDG de Nvidia confirme ainsi l'entrée directe de la firme en concurrence frontale avec OpenClaw. Aucun détail technique supplémentaire n'est disponible dans l'article.

LLMsActu
1 source