Aller au contenu principal
Sidekick de HubSpot : revue de code IA multi-modèles avec des retours 90 % plus rapides et 80 % d'approbation des ingénieurs
OutilsInfoQ AI13sem· 1 min de lecture

Sidekick de HubSpot : revue de code IA multi-modèles avec des retours 90 % plus rapides et 80 % d'approbation des ingénieurs

Source originale ↗·

HubSpot a déployé en interne un système de revue de code alimenté par l'IA baptisé Sidekick, qui analyse les pull requests à l'aide de grands modèles de langage. Le résultat est saisissant : le délai avant le premier retour sur une PR a été réduit de près de 90 %, et l'outil est aujourd'hui utilisé sur des dizaines de milliers de pull requests internes.

Ce type d'initiative illustre une tendance de fond dans l'industrie tech : l'intégration de l'IA directement dans les workflows de développement logiciel, non pas pour remplacer les ingénieurs, mais pour accélérer les cycles de revue. Le goulot d'étranglement que représente l'attente d'un retour humain sur une PR est l'un des principaux freins à la vélocité des équipes — une friction que Sidekick s'attaque directement.

L'architecture du système repose sur deux couches : un premier LLM analyse le code soumis, puis un second agent dit "judge agent" filtre et valide les retours avant qu'ils ne soient transmis aux développeurs. Cette approche multi-modèles vise à réduire le bruit et les faux positifs, un défi classique des outils de revue automatisée. Le taux d'adhésion des ingénieurs atteint 80 %, ce qui témoigne d'une confiance inhabituelle pour un outil automatisé dans un processus aussi sensible que la revue de code.

La publication de ce retour d'expérience par l'ingénieure Leela Kumili positionne HubSpot parmi les entreprises qui documentent publiquement leurs déploiements IA internes — une démarche qui alimente l'ensemble de l'industrie sur les bonnes pratiques d'intégration de l'IA dans les processus d'ingénierie logicielle.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Modélisation de capteurs virtuels avec l'IA et la conception basée sur les modèles
1IEEE Spectrum AI 

Modélisation de capteurs virtuels avec l'IA et la conception basée sur les modèles

MathWorks propose un webinaire gratuit centré sur l'intégration de l'intelligence artificielle dans les workflows de conception basée sur les modèles (Model-Based Design), avec pour cas d'usage principal la modélisation de capteurs virtuels. La session couvre l'ensemble du cycle de vie d'un modèle d'IA : conception et entraînement sous MATLAB, validation et vérification formelle, compression pour optimisation mémoire, génération de code C sans bibliothèques tierces, et déploiement sur processeurs embarqués. Des tests PIL (Processor-in-the-Loop) sont également au programme pour évaluer les performances réelles du code généré. L'intérêt concret de cette approche réside dans la capacité à intégrer des réseaux de neurones directement dans Simulink pour des simulations au niveau système, sans sortir de l'environnement de développement. La vérification formelle du comportement des réseaux de neurones, une étape rarement outillée dans les pipelines d'IA industrielle, représente un apport notable pour les secteurs où la sûreté est critique, comme l'automobile, l'aérospatiale ou l'industrie manufacturière. La compression des modèles pour réduire l'empreinte mémoire et accélérer l'exécution est particulièrement pertinente pour les contraintes des systèmes embarqués. Ce webinaire s'inscrit dans une tendance de fond : rapprocher les outils d'IA des environnements d'ingénierie système traditionnels. MathWorks, avec MATLAB et Simulink, occupe une position historiquement forte dans les industries à forte contrainte de certification. En proposant un flux bout-en-bout pour les capteurs virtuels, l'entreprise répond à un besoin croissant de remplacement ou de complément aux capteurs physiques coûteux par des modèles appris, tout en conservant les exigences de traçabilité et de vérification propres aux systèmes critiques.

UELes secteurs européens de l'aérospatiale et de l'automobile, soumis à des normes de certification strictes (DO-178C, ISO 26262), pourraient bénéficier de ces workflows de vérification formelle pour accélérer l'intégration de l'IA dans les systèmes embarqués critiques.

OutilsOutil
1 source
IBM lance Bob pour sécuriser le codage IA en production, via routage multi-modèles et contrôles humains
2VentureBeat AI 

IBM lance Bob pour sécuriser le codage IA en production, via routage multi-modèles et contrôles humains

IBM a lancé hier à l'échelle mondiale Bob, sa plateforme de développement logiciel propulsée par l'intelligence artificielle. L'outil, conçu pour écrire, tester et gérer du code tout au long du cycle de développement, est déjà utilisé par plus de 80 000 employés d'IBM après avoir démarré avec seulement 100 utilisateurs internes à l'été 2025. Bob repose sur un routage multi-modèles : il peut s'appuyer sur les modèles Granite d'IBM, les modèles Claude d'Anthropic, ou encore ceux de la société française Mistral, ainsi que sur des modèles distillés plus légers. Les modèles open source comme Qwen d'Alibaba sont explicitement exclus. Selon IBM, certaines équipes ont économisé jusqu'à 70 % du temps sur certaines tâches, soit en moyenne dix heures par semaine. Neal Sundaresan, directeur général de l'automatisation et de l'IA chez IBM, résume la philosophie de la plateforme : « La capacité du modèle seule ne suffit pas. La façon dont vous le déployez, dont vous structurez le contexte, et dont vous maintenez les humains dans la boucle détermine si l'IA tient réellement ses promesses. » Ce qui distingue Bob de concurrents comme Cursor ou Claude Code, c'est le niveau de contrôle et de gouvernance qu'il impose sur les workflows agentiques. Là où d'autres outils placent le développeur au début de la tâche pour qu'il enchaîne les étapes manuellement, Bob introduit des points de contrôle humains structurés à intervalles réguliers, tout en permettant à des agents IA d'accomplir des tâches complexes en plusieurs étapes. Cette approche répond directement aux besoins des grandes entreprises, qui craignent les failles de sécurité et les défaillances d'orchestration lorsque des agents autonomes accèdent à des données en production. Pour les directions techniques et les équipes d'audit, la traçabilité et la capacité à intervenir à tout moment priment sur la vitesse. Cette annonce s'inscrit dans une tension croissante dans l'industrie entre deux visions de l'IA agentique. D'un côté, des systèmes ouverts et autonomes comme OpenClaw ou NemoClaw de Nvidia, qui poussent les limites de l'automatisation dans des environnements bac à sable. De l'autre, des plateformes comme Bob qui privilégient la fiabilité, l'auditabilité et la supervision humaine. OpenAI a récemment ajouté dans son Agents SDK un support pour des implémentations en bac à sable, tandis que Kilo lançait Kilo Claw centré sur la sécurité des agents autonomes. IBM, fort de ses décennies d'expérience dans les systèmes d'entreprise critiques, choisit délibérément la prudence. Sundaresan le dit sans détour : « Il vaut mieux ouvrir la grille lentement que de dire, 'oups, comment je la referme maintenant ?' »

UEMistral, startup française, est intégrée nativement comme l'un des modèles supportés par Bob aux côtés de Claude et Granite, lui offrant une vitrine directe auprès des 80 000 développeurs IBM et renforçant la crédibilité des LLMs européens dans les environnements enterprise critiques.

OutilsOutil
1 source
Pragmatique par conception : l'ingénierie de l'IA pour le monde réel
3MIT Technology Review 

Pragmatique par conception : l'ingénierie de l'IA pour le monde réel

L'IA s'impose progressivement dans l'ingénierie produit — automobile, médical, électroménager — avec une approche prudente et mesurée : 90 % des organisations prévoient d'augmenter leurs investissements dans les 1-2 prochaines années, mais 45 % d'entre elles limitent cette hausse à 25 %. Les priorités immédiates sont la simulation, la validation et l'analyse prédictive, avec une exigence forte de gouvernance et de responsabilité humaine, car les erreurs dans ce domaine ont des conséquences physiques irréversibles. La qualité produit et la durabilité sont les principaux bénéfices attendus, devant la réduction des coûts ou la vitesse de mise sur marché.

OutilsOpinion
1 source
4MarkTechPost 

Implémentation pratique de systèmes multi-agents avec SmolAgents : exécution de code, appels d'outils et orchestration dynamique

SmolAgents, le framework minimaliste d'agents IA publié par HuggingFace, fait l'objet d'un tutoriel technique détaillé montrant comment construire des systèmes multi-agents prêts pour la production. La version stable utilisée est la 1.24.0, couplée au modèle OpenAI gpt-4o-mini via l'interface LiteLLM. Le tutoriel couvre l'ensemble de la chaîne : installation des dépendances (smolagents, duckduckgo-search, wikipedia), configuration sécurisée des clés API, création d'outils personnalisés (conversion de températures, vérification de nombres premiers, stockage clé-valeur en mémoire), puis orchestration de plusieurs agents collaborant entre eux. Deux paradigmes d'agents sont explorés en parallèle : le CodeAgent, qui génère et exécute du code Python dans un environnement sandbox, et le ToolCallingAgent, qui appelle des outils de façon structurée. Depuis la version 1.8.0, la gestion multi-agents se fait en passant directement des sous-agents via le paramètre managedagents, la classe ManagedAgent ayant été supprimée. Ce type de tutoriel révèle l'état réel des pratiques en matière de développement d'agents IA en 2025 : les développeurs cherchent des frameworks légers, modulaires et transparents, en réaction à la complexité des solutions précédentes comme LangChain ou AutoGen. SmolAgents répond à ce besoin en exposant une boucle d'exécution simple (tâche, génération de code, exécution, observation, itération jusqu'à finalanswer()), tout en permettant une gestion dynamique des outils via un dictionnaire agent.tools modifiable à la volée. Pour les équipes qui construisent des applications IA en production, cette approche réduit les abstractions inutiles et facilite le débogage, deux points critiques lorsque les agents opèrent dans des environnements réels avec des données sensibles ou des contraintes de latence. L'essor de SmolAgents s'inscrit dans une tendance plus large : après l'enthousiasme pour les agents autonomes "tout-en-un", l'industrie converge vers des architectures modulaires où des agents spécialisés collaborent plutôt qu'un seul agent tente de tout faire. HuggingFace, fort de sa communauté open-source et de son écosystème de modèles, positionne SmolAgents comme l'alternative légère aux frameworks propriétaires, compatible avec des LLMs locaux ou des API tierces. La suppression de ManagedAgent en v1.8.0 illustre la maturité croissante du framework et sa volonté de simplifier l'API à mesure que les cas d'usage se stabilisent. Les prochaines évolutions attendues portent sur l'intégration native d'outils de recherche, de mémoire persistante et de sandboxing renforcé, des briques essentielles pour déployer des agents dans des contextes d'entreprise.

UEHuggingFace, entreprise fondée en France, consolide son écosystème open-source avec SmolAgents, offrant aux équipes de développement européennes une alternative légère et auditable aux frameworks d'agents propriétaires.

💬 SmolAgents fait exactement ce qu'il promet : rester petit. Après des mois à me battre avec LangChain sur des trucs qui auraient dû prendre 10 lignes, voir un framework qui expose sa boucle d'exécution à plat, sans magie cachée, c'est presque reposant. Reste à voir si ça tient quand les agents tournent avec de vraies contraintes de latence et des données sensibles, mais c'est le bon pari.

OutilsTuto
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic