LLMs — page 3

495 articles · page 3 sur 10

Toute l'actualité des modèles de langage (LLM) : GPT, Claude, Gemini, Mistral, Llama — benchmarks, nouvelles sorties et comparatifs.

Recherche Business Éthique Outils Régulation Robotique Sécurité Société Infrastructure Création Autre

101AWS ML Blog LLMsTuto

Formation de modèles de langage en azerbaïdjanais sur Amazon SageMaker AI

Azercell Telecom LLC, principal opérateur télécom d'Azerbaïdjan, a développé en six semaines un grand modèle de langage (LLM) en azerbaïdjanais sur la plateforme Amazon SageMaker AI, en partenariat avec le AWS Generative AI Innovation Center. L'objectif : doter l'entreprise d'un chatbot client et d'outils spécialisés pour les usages télécoms, en partant de zéro dans une langue pour laquelle aucun blueprint d'entraînement n'existait. Le cadre technique mis en place repose sur trois étapes séquentielles : la création d'un tokenizer sur mesure, un pré-entraînement continu à partir du modèle Llama 3.2 1B de Meta, puis un affinage supervisé via la méthode LoRA. Sur une instance ml.p5.48xlarge, les optimisations au niveau noyau permises par la bibliothèque Liger Kernels ont abouti à un débit d'entraînement supérieur de 23 % et une consommation mémoire GPU au pic réduite de 58 %. Le tokenizer azerbaïdjanais personnalisé, quant à lui, divise par deux le nombre de tokens nécessaires par mot, ce qui double concrètement la quantité de texte exploitable dans la fenêtre de contexte du modèle. Ces résultats illustrent un défi bien réel pour l'IA appliquée aux langues à faibles ressources : l'azerbaïdjanais est une langue agglutinante, dans laquelle un seul mot peut encoder des informations grammaticales qu'une phrase anglaise exprime par plusieurs mots distincts. Les tokenizers optimisés pour l'anglais fragmentent ces formes complexes de façon inefficace, dégradant les performances et augmentant les coûts de calcul. En construisant un tokenizer monolingue sur mesure, Azercell et AWS ont résolu ce problème structurel avant même de commencer l'entraînement proprement dit, ce qui améliore chacune des étapes suivantes. Pour les entreprises qui opèrent dans des marchés linguistiques non dominants, cette approche modulaire représente un modèle reproductible : chaque composant (tokenizer, pré-entraînement, affinage) peut être optimisé indépendamment et réutilisé sur des tâches différentes. Le projet s'inscrit dans un mouvement plus large de souveraineté linguistique numérique, alors que les LLM généralistes peinent à performer dans les dizaines de langues mal représentées dans leurs données d'entraînement. L'azerbaïdjanais partage des caractéristiques morphologiques avec le turc, le kazakh ou l'ouzbek, ce qui rend cette méthodologie potentiellement transférable à tout un ensemble de langues turcophones d'Asie centrale. Azercell prévoit de passer à des modèles de plus grande taille, pour lesquels l'entraînement distribué sur SageMaker deviendra indispensable, alors que le proof-of-concept actuel à 1 milliard de paramètres n'en avait pas encore besoin. La collaboration avec le AWS Generative AI Innovation Center suit un modèle désormais courant : un géant du cloud apporte l'ingénierie d'infrastructure, l'entreprise locale apporte la donnée et la connaissance métier, et le résultat est un actif IA propriétaire impossible à obtenir via un modèle généraliste.

UELa méthodologie de tokenizer sur mesure pour langues agglutinantes pourrait inspirer des initiatives similaires pour les langues régionales européennes sous-représentées (basque, hongrois, finnois), sans impact direct sur la France ou l'UE.

LLMs — page 3

Formation de modèles de langage en azerbaïdjanais sur Amazon SageMaker AI

Anthropic lance Claude Opus 4.8 : amélioration modeste mais concrète, devant GPT-5.5 sur la plupart des benchmarks

RAG (Retrieval-Augmented Generation) : une approche pour optimiser l’usage de l’IA

Apple tente d'intégrer le grand modèle Gemini dans l'iPhone pour améliorer Siri

Claude Opus 4.8 d'Anthropic disponible : mode rapide 3 fois moins cher et alignement proche de Mythos

De Google Remy à Gemini Spark : l’avènement de l’agent IA autonome

Claude Opus 4.8 est désormais disponible sur AWS

Anthropic frappe fort : Claude Opus 4.8 écrase déjà GPT-5.5 et Mythos arrive bientôt

Microsoft lancera un nouveau modèle de code la semaine prochaine

DeepSWE : Claude n’est pas aussi doué qu’on ne le pensait en codage, il a triché !

MiniMax annonce le modèle M3 : attention fragmentée et réponses longues 15,6 fois plus rapides

GPT-5.6 : On connaît sa date de sortie, le compte à rebours est lancé

DeepSWE bouleverse le classement IA, sacre GPT-5.5 et révèle que Claude Opus exploite une faille dans les benchmarks

Elon Musk prépare déjà Grok 5, la prochaine IA géante pour les développeurs ?

MiniCPM5-1B : cette minuscule IA de 0,5 Go enterre déjà des modèles bien plus gros

StepFun lance StepAudio 2.5 Realtime : un modèle vocal bout-en-bout avec RLHF dédié au jeu de rôle et compréhension paraverbale

Le dernier modèle IA d'Alibaba a optimisé de façon autonome le code de sa puce personnalisée pendant 35 heures

The Download : l'avenir du code, les « Jeux olympiques sous stéroïdes » et la science par l'IA

Microsoft lance Fara1.5 (4B/9B/27B), des agents de navigation qui surpassent OpenAI Operator et Gemini 2.5 Computer Use

Qwen3.7-Max d'Alibaba peut fonctionner de manière autonome pendant 35 heures et prend en charge des frameworks externes comme Claude Code d'Anthropic

Qwen lance Qwen3.7-Max : un modèle agent de raisonnement avec une fenêtre de contexte d'un million de tokens

Cohere lance Command A+, un modèle MoE sparse de 218 milliards de paramètres pour agents autonomes, utilisable sur seulement deux GPU H100

Amazon Bedrock AgentCore lève la limite de la fenêtre de contexte

Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA

Cohere maîtrise la quantification sans perte et les citations natives avec Command A+, son premier modèle Apache 2.0

« Nous sommes aux pieds de la singularité » : ce que Google a vraiment dit sur l’AGI

Gemini 3.5 Flash veut réduire les coûts IA des entreprises

NVIDIA AI lance Nemotron-Labs-Diffusion : modèle de langage à trois modes, 6 fois plus de tokens par inférence que Qwen3-8B

Le Gemini 3.5 Flash de Google emboite le pas à Anthropic et OpenAI en augmentant sensiblement le prix de ses nouveaux modèles

Google présente Gemini 3.5 Flash à I/O 2026 : un modèle plus rapide et moins cher pour les agents IA et le code

Google I/O 2026 : Les rumeurs disaient vrai, Gemini 3.5 débarque et va tout balayer

Google I/O 2026 : Gemini 3.5 Flash, Omni (NanoBanana pour la vidéo), Spark (agents en arrière-plan) et Antigravity 2.0

Gemini 3.5 Flash pourrait être assez rapide pour que l'IA générative devienne vraiment utile

Google affirme que Gemini 3.5 Flash peut réduire les coûts IA des entreprises de plus d'un milliard de dollars par an

Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini

Gemini Omni : le modèle IA multimodal de Google

L'écart se creuse-t-il entre Anthropic et les modèles open source ?

Les clés pour décrocher un poste dans un laboratoire d'IA de pointe (en préentraînement)

Google I/O 2026 : Google tease une IA ultra-puissante. Le coup de grâce face à OpenAI ?

Ce que Google va annoncer cette semaine

iOS 27 : Siri a deux ans de retard sur l’IA… et Apple va nous sortir une version bêta

Compresser et évaluer des LLMs affinés par instruction avec FP8, GPTQ et SmoothQuant via llmcompressor

Pendant six mois, quatre modèles d'IA ont animé des stations de radio, avec des résultats allant du correct au délirant

Avancées récentes en architectures LLM : partage KV, mHC et attention compressée

Zyphra publie ZAYA1-8B-Diffusion-Preview : le premier modèle de diffusion MoE converti à partir d'un LLM autorégressif, avec une accélération jusqu'à 7,7x

Les meilleurs agents IA pour le développement logiciel : classement par benchmarks

Le méta-système de Poetiq construit un cadre universel améliorant tous les LLM sur LiveCodeBench Pro sans affinage

Un nouveau site évalue les modèles d'IA de pointe sur l'échelle de QI humain : les résultats font déjà débat

Affiner un LLM avec Databricks Unity Catalog et Amazon SageMaker AI

Elle a quitté OpenAI et créé une IA qui discute (enfin) comme un humain