OutilsMarkTechPost · 19 juin 2026, 05:44· 2 min de lecture

Salesforce CodeGen : générer, valider et reclasser des fonctions Python avec tests et vérifications de sécurité

Salesforce CodeGen est un modèle de génération de code disponible sur Hugging Face, conçu pour produire des fonctions Python à partir de descriptions en langage naturel. Un tutoriel publié récemment présente un pipeline complet autour de ce modèle, allant du chargement du modèle jusqu'à l'export d'artefacts en passant par la validation automatique et le reclassement de candidats. Le workflow s'appuie sur la bibliothèque Transformers d'Hugging Face et PyTorch, avec support GPU via CUDA. Plusieurs variantes du modèle sont proposées selon les ressources disponibles : codegen-350M-mono pour les environnements légers comme Google Colab, codegen-2B-mono pour plus de puissance, et codegen25-7b-mono pour les configurations les plus exigeantes, avec 7 milliards de paramètres. La génération s'effectue avec des paramètres calibrés, notamment une température de 0,35 et un top-p de 0,92, favorisant des sorties précises sans sacrifier toute diversité.

Ce type de pipeline dépasse la simple complétion de code : il intègre des étapes de vérification syntaxique, de contrôle de sécurité statique, et de validation par tests unitaires automatisés. L'approche "best-of-N" permet de générer plusieurs candidats pour une même tâche, puis de retenir le meilleur selon des critères objectifs, ce qui améliore significativement la qualité des sorties par rapport à une génération unique. Pour les développeurs et les équipes d'ingénierie, cela représente une voie vers l'automatisation partielle de tâches répétitives, avec des garanties de qualité intégrées. La mesure de complexité cyclomatique via la bibliothèque Radon et l'analyse de tokens via Tiktoken donnent des métriques concrètes sur le code produit, utiles pour des environnements de production où la maintenabilité compte.

Salesforce a lancé la famille CodeGen en 2022 comme alternative ouverte à GitHub Copilot, et les modèles sont depuis accessibles librement sur Hugging Face. La montée en puissance des modèles de code open source s'est accélérée avec l'arrivée de DeepSeek Coder, StarCoder 2 et Code Llama, tous positionnés sur le même segment. Ce tutoriel illustre comment des modèles relativement légers, à partir de 350 millions de paramètres, peuvent être intégrés dans des pipelines structurés sans dépendre d'API cloud propriétaires. L'enjeu pour les entreprises est double : réduire les coûts liés aux services comme GPT-4o ou Claude pour la génération de code, et garder le contrôle sur les données traitées. La prochaine étape logique pour ce genre de workflow serait l'intégration dans des environnements d'intégration continue, où la validation automatique de code généré pourrait s'inscrire directement dans les processus de revue.

Dans nos dossiers

Hugging Face Microsoft CUDA DeepSeek

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AWS ML Blog

AWS lance des agents autonomes pour les tests de sécurité et les opérations cloud

Amazon Web Services a annoncé la disponibilité générale de deux agents autonomes d'intelligence artificielle lors de son événement re:Invent : AWS Security Agent, dédié aux tests d'intrusion, et AWS DevOps Agent, spécialisé dans les opérations cloud. Ces systèmes appartiennent à une nouvelle catégorie baptisée « frontier agents », des IA capables de travailler de façon autonome pendant des heures, voire des jours, sans supervision humaine continue. Selon AWS, les retours des clients en phase de préversion sont significatifs : AWS Security Agent réduit les délais de tests de pénétration de plusieurs semaines à quelques heures, tandis qu'AWS DevOps Agent accélère la résolution d'incidents de 3 à 5 fois. Des entreprises comme Bamboo Health et HENNGE K.K. témoignent de résultats concrets, cette dernière affirmant avoir réduit la durée de ses cycles de sécurité de plus de 90 %. L'enjeu pour les équipes de sécurité et d'exploitation est majeur. La plupart des organisations ne peuvent aujourd'hui faire réaliser des tests de pénétration manuels que sur leurs applications les plus critiques, faute de temps et de budget, laissant la majorité de leur portefeuille logiciel vulnérable entre deux cycles d'audit. AWS Security Agent change cette équation en analysant le code source, les diagrammes d'architecture et la documentation pour reconstituer des chaînes d'attaque complexes que les scanners traditionnels ne détectent pas. Côté opérations, AWS DevOps Agent s'intègre avec les principaux outils du marché, CloudWatch, Datadog, Dynatrace, Splunk, Grafana, GitHub, GitLab, et corrèle télémétrie, code et données de déploiement pour identifier la cause racine d'un incident, qu'il s'agisse d'infrastructures AWS, Azure, hybrides ou on-premise. Pour les équipes SRE débordées, c'est la promesse d'un coéquipier disponible en permanence. Ces annonces s'inscrivent dans une course à l'automatisation des opérations IT qui s'intensifie depuis l'essor des grands modèles de langage. Les hyperscalers, AWS, Microsoft Azure, Google Cloud, cherchent tous à proposer des agents capables de gérer des tâches complexes et durables, au-delà des simples assistants conversationnels. AWS positionne explicitement ces outils non comme des aides ponctuelles, mais comme de véritables extensions de l'équipe humaine, capables de prendre des décisions en plusieurs étapes sans intervention constante. Amy Herzog, vice-présidente et RSSI d'AWS, indique que l'entreprise utilise elle-même AWS Security Agent en interne. La question qui se posera à mesure de l'adoption est celle de la gouvernance : jusqu'où déléguer à une IA des décisions critiques sur la sécurité ou la stabilité des systèmes de production ?

UELes entreprises européennes utilisant AWS peuvent adopter ces agents pour réduire leurs coûts et délais de tests de sécurité, mais la délégation de décisions critiques à une IA soulève des questions de conformité avec le RGPD et l'AI Act.

OutilsOutil

1 source

2MarkTechPost

Guide Claude Code 2026 : 25 fonctionnalités avec exemples et démo

Un guide complet des 25 fonctionnalités de Claude Code a été publié à destination des ingénieurs IA, développeurs et data scientists, détaillant comment l'outil d'Anthropic a évolué d'un simple assistant en ligne de commande vers un système agentique structuré en couches. L'outil fonctionne dans le terminal, l'application desktop et les IDE, s'appuyant sur une boucle agentique capable de lire des fichiers, exécuter des commandes, modifier du code et appeler des outils externes. Cette architecture s'articule autour de primitives distinctes : les fichiers CLAUDE.md (constitution du projet lue à chaque session), les skills (fichiers SKILL.md invocables via une commande /nom), les sous-agents (instances spécialisées avec leurs propres fenêtres de contexte), les slash commands intégrées comme /init, /compact ou /review, les hooks (scripts déterministes déclenchés à des points précis du cycle de vie), et les serveurs MCP (Model Context Protocol) pour connecter Claude Code à GitHub, des bases de données ou des navigateurs. Les plugins regroupent l'ensemble en un bundle versionné installable en une commande. S'ajoutent des fonctionnalités comme les checkpoints automatiques avec retour arrière (deux appuis sur Échap), le mode Plan pour explorer sans exécuter, les modes de permission graduables, et Auto Mode, actuellement en aperçu recherche, qui utilise un classifieur Sonnet 4.6 distinct pour évaluer chaque action avant de l'autoriser ou de l'escalader. Pour les équipes techniques, cette architecture en couches change concrètement la manière de travailler sur des projets à long terme. Les sous-agents isolent les tâches verbeuses pour préserver la clarté du contexte principal, tandis que l'Agent SDK expose la même boucle de manière programmatique via query(), permettant d'intégrer /code-review ou d'autres commandes dans des scripts. Le mode headless (claude -p "requête") et l'entrée par pipe (cat logs.txt | claude -p) ouvrent la voie à l'intégration dans des pipelines CI, des jobs planifiés et des hooks pre-commit via GitHub Actions, sans terminal interactif. Ce guide s'inscrit dans une montée en puissance rapide de Claude Code depuis ses débuts expérimentaux. Anthropic a progressivement empilé des couches de contrôle, permissions granulaires, sandboxing, compaction de contexte pour les longues sessions, pour rendre possibles des workflows autonomes sans sacrifier les garde-fous. La concurrence s'est densifiée dans ce segment : GitHub Copilot Agent, Cursor et d'autres environnements agentiques se disputent les workflows des développeurs. Dans ce contexte, Claude Code mise sur la compositionnalité comme avantage différenciant, c'est-à-dire la capacité d'assembler des primitives simples (skills, hooks, MCP, plugins) en systèmes d'ingénierie largement automatisés, adaptés aux équipes qui veulent dépasser l'autocomplétion pour atteindre une véritable délégation de tâches.

OutilsOutil

1 source

3AWS ML Blog

Créez des applications vocales en temps réel avec Amazon SageMaker AI et vLLM

Depuis novembre 2025, Amazon SageMaker AI propose un mode de streaming bidirectionnel pour l'inférence en temps réel, permettant aux développeurs de faire circuler des données en continu dans les deux sens entre leurs applications et les conteneurs de modèles. Mistral AI en est l'un des premiers bénéficiaires concrets : le modèle Voxtral-Mini-4B-Realtime-2602, conçu spécifiquement pour la transcription vocale en temps réel, peut désormais être déployé sur un endpoint SageMaker via un conteneur vLLM. Le framework open source vLLM, de son côté, expose une API dite Realtime accessible via WebSocket à l'adresse /v1/realtime, qui traite l'audio de façon incrémentale et renvoie les tokens de transcription au fur et à mesure que le son arrive, sans attendre la fin de l'enregistrement. SageMaker gère la traduction de protocole entre HTTP/2 côté client et WebSocket côté conteneur sur le port 8443, de façon transparente et sans configuration supplémentaire. L'enjeu est direct pour toute une classe d'applications professionnelles qui se heurtaient jusqu'ici à la latence inhérente aux architectures requête-réponse classiques : agents vocaux, sous-titrage en direct, analytique de centres d'appels, outils d'accessibilité. Dans ces contextes, attendre que l'intégralité d'un enregistrement soit reçue avant de lancer la transcription brise l'expérience temps réel. La nouvelle architecture permet une connexion full-duplex persistante : l'audio entre en continu, la transcription sort en continu. vLLM applique par ailleurs une exécution par graphe CUDA en morceaux pour réduire la latence par token lors du streaming, tandis que SageMaker assure le monitoring via Amazon CloudWatch, les keepalives WebSocket et la résilience de connexion sans instrumentation personnalisée. Cette évolution s'inscrit dans une tendance plus large de convergence entre infrastructure cloud managée et serving open source haute performance. Amazon a progressivement enrichi SageMaker pour couvrir des cas d'usage au-delà de l'inférence batch classique, et le support du streaming bidirectionnel représente une réponse directe à la montée des LLM multimodaux et des applications temps réel. Mistral AI, avec sa gamme Voxtral, positionne ses modèles compacts sur le segment de la voix embarquée et managée, en concurrence avec des solutions propriétaires comme Whisper d'OpenAI ou les API de Google Cloud Speech. Le fait que vLLM soit open source garantit aux équipes une maîtrise totale sur la configuration, la quantisation et la compilation des modèles, sans dépendance à un fournisseur de serving. Un dépôt GitHub accompagne le tutoriel pour reproduire le déploiement complet.

UEMistral AI, entreprise française, voit ses modèles Voxtral intégrés nativement sur AWS SageMaker, renforçant la visibilité et l'adoption commerciale de ses solutions vocales sur le marché cloud mondial.

OutilsTuto

1 source

4AWS ML Blog

Configurer un flux de code d'autorisation sécurisé avec AgentCore Gateway et des clients MCP

Amazon vient de détailler comment sécuriser les échanges entre les assistants de développement basés sur l'IA et les serveurs d'outils d'entreprise, à travers une configuration OAuth reposant sur son service Amazon Bedrock AgentCore. Le composant central de cette architecture est l'AgentCore Gateway, un point d'entrée géré qui centralise le routage et la sécurisation des communications entre agents IA et serveurs MCP (Model Context Protocol). La démonstration s'appuie sur Kiro, l'environnement de développement intégré d'Amazon orienté IA, qui joue le rôle de client OAuth. Côté fournisseur d'identité, l'exemple utilise Amazon Cognito, mais le schéma s'applique à tout IdP compatible, Okta, Microsoft Entra ID, ou tout autre système émettant des jetons de sécurité standards. Le flux fonctionne en plusieurs étapes : Kiro tente de se connecter au point d'accès MCP de la Gateway, reçoit un challenge HTTP 401 accompagné d'un en-tête pointant vers les métadonnées OAuth de la ressource protégée, puis récupère auprès de l'IdP un jeton d'identité valide avant que la requête ne soit enfin autorisée et transmise au serveur MCP sous-jacent. L'enjeu est concret : dans les environnements professionnels, les équipes cherchent à exposer des outils internes (bases de données, API métier, services cloud) à leurs assistants IA, sans sacrifier le contrôle d'accès. Sans mécanisme d'authentification robuste, n'importe quel agent pourrait interroger ces serveurs MCP sans vérification d'identité. Avec ce schéma, chaque requête émise par un assistant IA est associée à l'identité réelle de l'utilisateur qui a lancé la session, ce qui permet d'appliquer des politiques d'accès fines et d'auditer précisément qui a accédé à quoi. Pour les équipes de sécurité, c'est un changement de paradigme : l'IA cesse d'être un trou dans le périmètre de sécurité et devient un canal traçable comme n'importe quel autre. Ce tutoriel s'inscrit dans un mouvement plus large autour du protocole MCP, standardisé par Anthropic fin 2024 et rapidement adopté par l'ensemble de l'industrie comme lingua franca entre les agents IA et leurs outils. Amazon Bedrock AgentCore, lancé récemment, positionne AWS comme infrastructure d'hébergement de référence pour les agents en production, en ajoutant gestion du cycle de vie, monitoring et sécurité d'entreprise par-dessus les serveurs MCP. L'introduction d'un proxy OAuth optionnel dans l'architecture illustre la fragmentation encore existante entre les clients IA, les IdPs et les serveurs MCP : les standards évoluent vite, mais les implémentations concrètes nécessitent encore des couches d'adaptation. La prochaine étape probable est une intégration native de ces flux d'authentification directement dans les spécifications MCP, réduisant le besoin de proxies intermédiaires.

OutilsTuto

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic