OutilsAI News4h· 2 min de lecture

Omio accélère son développement produit voyage avec les modèles OpenAI

Omio, plateforme de voyage multimodale opérant avec plus de 3 000 transporteurs dans 47 pays, a intégré les modèles OpenAI à l'ensemble de ses opérations d'ingénierie pour accélérer radicalement le développement de ses produits. L'entreprise a d'abord déployé ChatGPT en accès libre à tous ses employés, avant d'embarquer OpenAI Codex directement dans le cycle de développement logiciel, de la recherche préliminaire à la maintenance système, en passant par la conception architecturale, le codage, les tests automatisés et la revue de code. Des connecteurs internes sur mesure relient les environnements de données propriétaires à ces outils, permettant aux développeurs de sauter l'étape de recherche d'information pour passer directement à l'exécution. En 2023, Omio a aussi lancé l'une des premières interfaces de réservation conversationnelle du secteur, en connectant les modèles OpenAI à son inventaire de transport en temps réel, trains, bus, ferries, vols, permettant aux utilisateurs de formuler des requêtes en langage naturel comme "le trajet le plus rapide de Rome à Florence" et d'obtenir des itinéraires directement réservables.

L'impact sur la productivité est saisissant : selon les analyses internes d'Omio, l'effort technique nécessaire pour construire un produit donné ne représente plus que 20 % de ce qu'il était auparavant. Des projets qui mobilisaient plusieurs développeurs pendant un trimestre entier se réalisent désormais avec un seul ingénieur en un mois environ. Cette compression des délais transforme la façon dont l'entreprise alloue ses ressources : il est désormais possible de prototyper rapidement, de tester la demande réelle des utilisateurs à moindre coût, et d'éliminer les fonctionnalités non viables avant d'engager une production à pleine échelle. Les équipes techniques itèrent sur les produits existants à une cadence bien plus élevée, déployant mises à jour et nouvelles interfaces en production à un rythme accéléré.

La démarche d'Omio illustre une ambition plus radicale que la simple adoption d'outils IA. Son directeur technique, Tomas Vocetka, impose à chaque fonction interne de repenser entièrement ses modes opératoires pour fonctionner comme une entreprise nativement IA, et non de se contenter d'ajouter une couche technologique à des processus existants inchangés. Cette philosophie s'étend désormais au-delà des équipes techniques : la direction déploie Codex dans les fonctions non-techniques de l'organisation. Dans un secteur du voyage historiquement fragmenté, où les utilisateurs devaient naviguer entre de multiples sites pour comparer modes de transport et assembler manuellement leurs itinéraires, l'intégration conversationnelle d'Omio positionne la plateforme comme un guichet unique capable d'interpréter l'intention du voyageur et de répondre avec des options ancrées dans les prix et disponibilités en temps réel.

Impact France/UE

Omio, entreprise européenne présente en France, illustre comment l'intégration profonde d'outils IA peut multiplier par cinq la vitesse de développement produit dans le secteur du voyage, susceptible d'influencer les pratiques des acteurs européens du tourisme numérique.

Dans nos dossiers

OpenAI Codex

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

GitHub Spec-Kit : développement piloté par les specs

GitHub a publié en open source Spec-Kit, une boîte à outils conçue pour introduire le développement piloté par spécifications (SDD, Spec-Driven Development) dans les workflows d'agents IA comme GitHub Copilot, Claude Code ou Gemini CLI. Le dépôt a rapidement dépassé 90 000 étoiles et 8 000 forks sur GitHub, ce qui en fait l'un des projets d'outillage développeur à la croissance la plus rapide de ces derniers mois. Spec-Kit se compose de deux éléments principaux : la CLI Specify, écrite en Python 3.11+, et un ensemble de templates et scripts qui structurent l'expérience SDD. Après installation via uv, la commande specify init initialise un projet et donne accès à une série de commandes slash : /speckit.specify pour capturer ce qu'on veut construire, /speckit.plan pour générer le plan d'implémentation technique, /speckit.tasks pour décomposer ce plan en tâches ordonnées par dépendances, /speckit.taskstoissues pour convertir ces tâches en issues GitHub, et /speckit.implement pour confier leur exécution à l'agent IA. Des commandes optionnelles comme /speckit.clarify et /speckit.analyze permettent d'identifier les zones sous-spécifiées avant de lancer la génération de code. Le problème que Spec-Kit tente de résoudre est fondamental dans l'usage actuel des agents de codage IA : les développeurs ont tendance à les utiliser comme des moteurs de recherche, en décrivant vaguement ce qu'ils veulent, ce qui produit du code qui compile mais rate l'intention réelle. GitHub appelle cela le "vibe-coding", une approche acceptable pour des prototypes rapides mais insuffisante pour des applications critiques ou des bases de code complexes. En imposant une spécification structurée comme source de vérité, un document qui décrit le quoi et le pourquoi sans imposer de choix technologique, Spec-Kit force l'agent à travailler à partir d'instructions non ambiguës plutôt que d'interpréter des descriptions floues. La spec reste un artefact vivant, mis à jour à mesure que les exigences évoluent, et non un document figé rédigé puis oublié en début de projet. Le SDD n'est pas une idée entièrement nouvelle : des approches "documentation-first" ou "requirements-driven" existent depuis des décennies dans le génie logiciel. Ce que Spec-Kit change, c'est l'intégration native de cette discipline dans les outils d'IA générative, à un moment où l'industrie cherche à aller au-delà de l'autocomplétion intelligente vers une véritable délégation de tâches complexes à des agents autonomes. L'enjeu est de taille : si les agents de codage doivent gérer des missions de plus en plus ambitieuses, la qualité des instructions qu'on leur donne devient un levier critique de fiabilité. En open-sourçant Spec-Kit sous ce nom et avec cette adoption initiale, GitHub positionne clairement cette méthodologie comme une norme émergente, potentiellement intégrée à terme dans l'écosystème Copilot.

💬 90 000 étoiles en quelques semaines, c'est pas rien. L'idée de forcer une spec structurée avant de lancer l'agent, ça fait vingt ans qu'on sait que c'est la bonne approche, mais là GitHub fait enfin le lien avec les outils génératifs d'une façon qui peut vraiment coller aux équipes qui vivent dans Copilot. Reste à voir si la discipline tient dans la durée ou si ça finit comme tous les "requirements-first" qui crèvent dès le sprint 2.

OutilsOutil

1 source

2AWS ML Blog

Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur

Amazon a introduit une fonctionnalité de personnalisation de modèles sans serveur dans SageMaker AI, permettant aux équipes d'améliorer drastiquement les capacités d'appel d'outils des agents IA sans gérer d'infrastructure GPU. Dans un cas concret publié début avril 2026, des ingénieurs ont affiné le modèle Qwen 2.5 7B Instruct en utilisant la technique RLVR (Reinforcement Learning with Verifiable Rewards) et ont obtenu une amélioration de 57% du score de qualité des appels d'outils sur des scénarios inédits, c'est-à-dire des outils que le modèle n'avait jamais vus lors de l'entraînement. La méthode repose sur un principe simple : le modèle génère huit réponses candidates par prompt, une fonction de récompense vérifie lesquelles sont correctes, et l'algorithme GRPO (Group Relative Policy Optimization) renforce les comportements qui surpassent la moyenne du groupe. SageMaker AI prend en charge les familles de modèles Amazon Nova, Llama, Qwen et DeepSeek, avec un suivi des métriques via MLflow intégré. L'enjeu est concret : les agents IA en production échouent fréquemment lors des appels d'outils, qu'il s'agisse d'halluciner des fonctions inexistantes, de passer des paramètres incorrects, ou de déclencher une action là où ils devraient demander une clarification. Ces erreurs bloquent le déploiement en production et détruisent la confiance des utilisateurs. La nouvelle approche serverless d'Amazon supprime l'obstacle opérationnel majeur que représentait jusqu'ici le fine-tuning par renforcement : achat de GPU, orchestration mémoire entre les phases de rollout et d'entraînement, infrastructure de récompenses, gestion des checkpoints. Les équipes peuvent désormais se concentrer sur leurs données, leur modèle et leur fonction de récompense, le reste étant géré par la plateforme. Le fine-tuning supervisé classique (SFT) montre ses limites pour ce type de tâche : il nécessite des exemples étiquetés pour chaque comportement souhaité, mais peine à généraliser la prise de décision entre appeler un outil, demander des informations supplémentaires, ou refuser d'agir. RLVR contourne ce problème en exploitant la nature vérifiable des appels d'outils : soit le modèle a appelé la bonne fonction avec les bons paramètres, soit non. Cette objectivité binaire rend l'appel d'outils particulièrement adapté à l'apprentissage par renforcement. Amazon positionne cette offre dans un marché de l'IA agentique en forte croissance, où des acteurs comme Google (Vertex AI), Microsoft (Azure ML) et des startups spécialisées se disputent les équipes qui cherchent à industrialiser des agents fiables, avec un accès simplifié via SageMaker Studio et un compte AWS standard.

OutilsActu

1 source

3VentureBeat AI

RunPod Flash : un outil Python open source pour accélérer le développement IA sans conteneurs

RunPod, la plateforme cloud spécialisée dans les GPU haute performance pour le développement IA, a lancé ce jeudi un nouvel outil open source baptisé RunPod Flash. Distribué sous licence MIT, cet outil Python vise à supprimer une contrainte jusqu'ici incontournable dans le développement serverless sur GPU : la conteneurisation Docker. Dans le cycle de développement traditionnel, un développeur devait écrire un Dockerfile, construire une image, la pousser vers un registre, puis attendre que l'environnement se déploie avant qu'une seule ligne de code puisse s'exécuter sur un GPU distant. Flash remplace ce processus par un moteur de build multiplateforme qui génère automatiquement un artefact Linux x86_64 depuis un Mac M-series, détecte la version Python locale, force les wheels binaires, et monte les dépendances directement à l'exécution sur la flotte serverless de RunPod. Le nouveau décorateur @Endpoint, pièce centrale de cette version GA, centralise la configuration de ce pipeline en un seul appel de fonction. L'impact concret est double. Pour les équipes de recherche, la suppression de ce que RunPod appelle la "taxe de packaging" réduit drastiquement les cycles d'itération : plus besoin de rebuilder et repousser une image à chaque modification de code. Pour les applications en production, Flash embarque des fonctionnalités de niveau entreprise, API HTTP avec load balancing basse latence, traitement par lots en file d'attente, stockage persistant multi-datacenter. L'outil permet également de construire des pipelines dits "polyglots" : un endpoint CPU bon marché peut prendre en charge le prétraitement des données avant de router automatiquement vers un GPU NVIDIA H100 ou B200 pour l'inférence. Cette architecture réduit aussi les "cold starts", ces délais à froid qui pénalisent les environnements serverless, en évitant d'initialiser de lourdes images conteneurisées à chaque requête. Derrière Flash se trouve une infrastructure réseau propriétaire SDN/CDN que RunPod a construite pour résoudre ce que son CTO Brennen Smith décrit comme le vrai problème du GPU cloud : non pas les processeurs eux-mêmes, mais le réseau et le stockage qui les relient. L'outil est explicitement conçu pour servir de substrat aux agents IA et assistants de code, Claude Code, Cursor, Cline sont cités nommément, leur permettant d'orchestrer et déployer du matériel distant de façon autonome. "Tout le monde parle d'IA agentique, mais il faut une colle solide pour que ces agents puissent réellement fonctionner", a déclaré Smith à VentureBeat. RunPod entre ainsi en compétition directe avec AWS Lambda et Modal sur le segment du serverless GPU, en pariant que la suppression de la friction de déploiement sera le facteur décisif pour les labs et équipes produit qui multiplient les expérimentations IA.

OutilsActu

1 source

4AWS ML Blog

Créer des agents Strands avec les modèles SageMaker AI et MLflow

Amazon Web Services a publié un guide technique détaillant la construction d'agents d'intelligence artificielle en combinant trois de ses outils : le SDK open source Strands Agents, les endpoints de modèles Amazon SageMaker AI, et la plateforme d'observabilité MLflow hébergée sur SageMaker Serverless. Le SDK Strands, à approche pilotée par le modèle, permet de créer un agent fonctionnel en quelques lignes de code en associant un modèle de langage, un prompt système et un ensemble d'outils. Les modèles sont déployés via SageMaker JumpStart, un hub machine learning qui permet d'évaluer et de sélectionner rapidement des modèles de fondation selon des critères de qualité et de responsabilité prédéfinis. L'intégration de MLflow permet ensuite de tracer les appels d'agents, de versionner les modèles et d'implémenter des tests A/B entre plusieurs variantes de modèles pour en évaluer les performances à l'aide de métriques objectives. Cette architecture répond à un besoin concret des grandes entreprises qui ne peuvent pas se contenter des services de modèles entièrement gérés : contrôle précis sur les instances de calcul, politiques de mise à l'échelle, configuration réseau compatible avec les architectures de sécurité existantes, et conformité en matière de résidence des données. Là où Amazon Bedrock simplifie l'accès aux modèles de fondation en masquant l'infrastructure, SageMaker AI laisse à l'organisation la maîtrise de l'endroit et de la manière dont l'inférence se produit, ce qui est décisif pour les secteurs réglementés comme la finance ou la santé. La couche MLflow ajoute une dimension industrielle : les équipes peuvent comparer les performances de différents modèles dans des conditions réelles, réduire les coûts en sélectionnant le modèle le plus efficace pour chaque tâche, et maintenir un historique d'expériences exploitable dans le temps. La publication de ce guide s'inscrit dans une course plus large pour capter les déploiements d'agents IA en production. AWS répond ainsi à la demande croissante des équipes MLOps qui veulent bénéficier de la commodité du cloud tout en conservant une maîtrise fine de l'infrastructure, une position souvent impossible avec les APIs gérées de type Bedrock ou OpenAI. Strands Agents, rendu open source par Amazon, concurrence directement des frameworks comme LangChain ou CrewAI, avec l'avantage d'une intégration native dans l'écosystème AWS. L'accent mis sur les tests A/B et l'évaluation continue des agents signale que le secteur entre dans une phase de maturité : il ne s'agit plus seulement de faire fonctionner un agent, mais de le mesurer, le comparer, et l'améliorer de façon systématique en production.

UECette architecture de déploiement d'agents avec contrôle fin sur la résidence des données répond aux exigences du RGPD, la rendant pertinente pour les secteurs réglementés européens comme la finance et la santé.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic