Aller au contenu principal
Découvrez AgentKit, les nouvelles évaluations et RFT pour les agents
RobotiqueOpenAI Blog37sem· 1 min de lecture

Découvrez AgentKit, les nouvelles évaluations et RFT pour les agents

Source originale ↗·

Aujourd'hui, nous dévoilons AgentKit, des évaluations améliorées et le reinforcement fine-tuning pour les agents afin d'accélérer la transition des prototypes vers la production.

Impact France/UE

AgentKit offre des évaluations et un reinforcement fine-tuning pour les agents, potentiellement aidant les entreprises françaises et européennes, notamment dans les secteurs de l'IA et du service client, à améliorer leurs systèmes d'IA, en conformité avec le futur AI Act, tout en respectant les dispositions du RGPD concernant la gestion des données.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Des agents IA pour les équipes de robots
1IEEE Spectrum AI 

Des agents IA pour les équipes de robots

Le laboratoire de physique appliquée de l'université Johns Hopkins (APL) a publié une présentation détaillant ses travaux récents sur l'IA agentique appliquée aux équipes de robots collaboratifs. Baptisée "Agentic AI for Robot Teams", cette communication expose une architecture scalable conçue pour doter des systèmes robotiques hétérogènes de capacités d'autonomie, de coordination et d'adaptabilité. Les chercheurs y décrivent comment des agents fondés sur des grands modèles de langage (LLM) peuvent être déployés sur du matériel réel, avec des démonstrations impliquant des équipes de robots aux profils et capacités différents. Le document, disponible sous forme de livre blanc, présente également les leçons tirées des phases de recherche et développement en cours. L'enjeu est considérable : faire travailler ensemble des robots qui ne partagent ni les mêmes capteurs, ni les mêmes actionneurs, ni les mêmes logiciels impose des défis de coordination que les architectures classiques peinent à résoudre. En intégrant des LLM comme couche de raisonnement et de planification, les équipes de l'APL cherchent à rendre ces systèmes capables de s'adapter dynamiquement aux imprévus, de se répartir les tâches et de maintenir une cohérence collective sans supervision humaine constante. Cette approche pourrait transformer des domaines comme la logistique autonome, la gestion de catastrophes, les opérations militaires ou l'exploration de milieux hostiles, où envoyer des équipes humaines reste risqué ou impossible. Le Johns Hopkins APL est l'un des principaux centres de recherche appliquée du Département de la Défense américain, ce qui situe ces travaux dans un contexte stratégique lié à la robotique militaire et aux systèmes autonomes multi-agents. La montée en puissance des LLM depuis 2022 a ouvert une nouvelle voie pour la robotique agentique, jusqu'ici freinée par la rigidité des architectures de contrôle traditionnelles. Les suites annoncées portent sur la généralisation de l'architecture à des équipes plus larges et plus hétérogènes, ainsi que sur l'amélioration de la robustesse dans des environnements dégradés ou incertains.

RobotiqueActu
1 source
Présentation de l'environnement de déploiement étaté pour les agents sur Amazon Bedrock
2OpenAI Blog 

Présentation de l'environnement de déploiement étaté pour les agents sur Amazon Bedrock

L'environnement de exécution stataique pour les agents d'Amazon Bedrock introduit une orchestration persistante, une mémoire et une exécution sécurisée pour les flux de travail d'IA multi-étapes alimentés par OpenAI.

UEAucun impact direct — Cet article concerne une nouvelle fonctionnalité d'Amazon Bedrock, une plateforme d'IA, sans spécification d'applications ou implications pour des entreprises françaises ou européennes, ni référence à des lois spécifiques comme le RGPD ou l'AI Act.

RobotiqueOutil
1 source
Databricks rachète Quotient AI pour fiabiliser les agents d’IA
3Le Big Data 

Databricks rachète Quotient AI pour fiabiliser les agents d’IA

Databricks acquiert Quotient AI pour renforcer la fiabilité des agents d'IA dans ses solutions Genie et Agent Bricks. Quotient AI, spécialisée dans l'évaluation et l'entraînement des agents d'IA, offre des outils d'évaluation précis et des boucles d'apprentissage basées sur le renforcement, adaptés à des contextes spécifiques et aux règles internes des entreprises, réduisant ainsi les risques d'erreurs et de non-conformité.

UEDatabricks, entreprise européenne, renforce ses solutions d'IA via l'acquisition de Quotient AI, améliorant ainsi la fiabilité et la sécurité des agents d'IA pour les entreprises telles que SAP et Airbus.

RobotiqueOutil
1 source
En Pratique: Évaluation des Agents Utilisant des Outils dans des Environnements du Monde Réel avec OpenEnv
4HuggingFace Blog 

En Pratique: Évaluation des Agents Utilisant des Outils dans des Environnements du Monde Réel avec OpenEnv

OpenEnv, un cadre de simulation, a été utilisé pour évaluer l'efficacité des agents utilisateurs d'outils dans des environnements réels. Les chercheurs ont testé diverses stratégies d'agents dans des scénarios inspirés de la vie réelle, montrant une amélioration significative des performances grâce à l'adaptation et à l'apprentissage. Des exemples concrets incluent la navigation dans des espaces complexes et la manipulation d'objets pour résoudre des tâches, avec des agents démontrant une capacité à s'adapter à des changements imprévus.

UEL'utilisation d'OpenEnv pour évaluer les agents utilisateurs d'outils renforce l'efficacité des entreprises européennes dans le développement de robots autonomes et d'IA, en améliorant les capacités d'adaptation et d'apprentissage dans des environnements réels, en conformité potentielle avec l'AI Act et le RGPD pour les applications industrielles et domestiques.

RobotiqueOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic