Aller au contenu principal
OutilsAWS ML Blog13sem· 1 min de lecture

Bark.com et AWS s'associent pour construire une solution de génération vidéo à grande échelle

Source originale ↗·

Bark.com et Amazon Web Services ont collaboré pour transformer radicalement le pipeline de création de contenu vidéo marketing, en passant d'un processus manuel de plusieurs semaines à une génération automatisée en quelques heures. La plateforme britannique, qui met en relation des milliers de personnes chaque semaine avec des prestataires de services professionnels — du jardinage aux soins à domicile —, avait identifié un besoin urgent d'accélérer sa production de publicités personnalisées pour les réseaux sociaux.

Le défi était structurel : mener des campagnes efficaces en mid-funnel exige des volumes élevés de créatifs personnalisés pour permettre des tests A/B rapides, mais le workflow manuel de Bark ne pouvait pas absorber ce rythme ni supporter la création de variantes pour plusieurs segments clients simultanément. L'enjeu dépasse le simple gain de productivité — c'est la capacité même d'une entreprise à personnaliser son discours à grande échelle qui est en jeu, un avantage concurrentiel décisif dans la publicité numérique.

L'architecture déployée repose sur plusieurs couches de services AWS : Amazon S3 pour le stockage des assets, AWS Lambda et AWS Step Functions pour l'orchestration d'un pipeline en sept étapes, et Amazon Bedrock avec le modèle Claude Sonnet 3.7 d'Anthropic pour la génération de texte, la segmentation client et l'évaluation qualité. Le volet vidéo s'appuie sur Wan 2.1 Text2Video-14B, un modèle de 14 milliards de paramètres distribué sur huit GPU d'une instance p4de.24xlarge SageMaker via du parallélisme tensoriel. La synthèse vocale est gérée par des conteneurs Amazon ECS sur instances g5.2xlarge, avec une mise à l'échelle à zéro en période d'inactivité.

Cette collaboration avec l'AWS Generative AI Innovation Center a permis à Bark de valider quatre objectifs clés — réduction du temps de production, personnalisation multi-segments, cohérence de marque et qualité équivalente aux publicités produites manuellement. Le dispositif est présenté comme un modèle réplicable pour toute entreprise confrontée à des défis similaires de passage à l'échelle dans la création de contenu.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Construire une solution d'observabilité d'entreprise pour Amazon QuickSight
1AWS ML Blog 

Construire une solution d'observabilité d'entreprise pour Amazon QuickSight

Amazon Web Services propose une architecture de référence pour centraliser l'observabilité d'Amazon Q, sa plateforme d'IA générative d'entreprise. La solution, publiée par AWS, agrège les données opérationnelles issues de deux sources principales : les journaux CloudWatch Vended Logs, qui capturent les conversations, les retours utilisateurs, la consommation des agents et le stockage d'index, ainsi que les événements AWS CloudTrail, qui enregistrent toutes les actions effectuées par les utilisateurs et les services sur la plateforme. Ces données transitent via des filtres d'abonnement CloudWatch vers des flux Amazon Data Firehose, sont transformées par des fonctions AWS Lambda, puis stockées dans un data lake sécurisé sur Amazon S3. Le tout est chiffré au repos via une clé AWS KMS gérée par le client avec rotation automatique. Les équipes d'administration peuvent ensuite interroger ce lac de données avec Amazon Athena, visualiser les métriques dans un tableau de bord QuickSight, ou poser des questions en langage naturel à un agent conversationnel Amazon Q personnalisé. Le déploiement s'appuie sur AWS CDK et requiert Python 3.9 minimum, Node.js 20 et AWS CLI V2. Pour les organisations qui déploient Amazon Q à grande échelle, cette solution répond à un besoin concret : obtenir une vue unifiée de l'adoption, de la satisfaction des utilisateurs, des coûts et de la gouvernance depuis un seul tableau de bord. Sans cela, les données sont éparpillées entre plusieurs services AWS et deviennent rapidement inexploitables à l'échelle de centaines ou milliers d'utilisateurs. La protection des données sensibles est intégrée dès la collecte via des politiques de masquage dans CloudWatch, capables de détecter et anonymiser automatiquement des clés privées, informations financières, données personnelles ou de santé. AWS Lake Formation apporte en complément un contrôle fin des accès au niveau des tables et des colonnes. Amazon Q s'est imposé comme la réponse d'AWS au déploiement d'IA générative en entreprise, en intégrant dans un seul produit des espaces collaboratifs, des agents conversationnels, des flux automatisés, des outils de recherche et des capacités de business intelligence via QuickSight. Mais la croissance de ces déploiements a mis en évidence un angle mort : l'absence d'outil natif pour piloter l'usage à l'échelle. Cette architecture d'observabilité comble ce manque en s'appuyant entièrement sur des services AWS managés, sans infrastructure supplémentaire à maintenir. Elle s'inscrit dans une tendance plus large où les plateformes d'IA d'entreprise doivent désormais justifier leur ROI avec des métriques d'usage précises, répondre aux exigences d'audit réglementaire, et permettre aux directions métier de piloter les investissements IA en temps réel.

OutilsActu
1 source
2AWS ML Blog 

Utiliser RAG pour la génération vidéo avec Amazon Bedrock et Amazon Nova Reel

Amazon a développé un pipeline multimodal appelé VRAG (Video Retrieval Augmented Generation) qui génère des vidéos personnalisées en combinant récupération d'images et génération par IA. La solution utilise Amazon Bedrock, Amazon Nova Reel et OpenSearch : l'utilisateur fournit un objet d'intérêt et une instruction de caméra (ex. « rotation dans le sens horaire »), le système retrouve l'image la plus pertinente depuis un index vectoriel et génère la vidéo correspondante. Le traitement par lot via un fichier prompts.txt permet de produire plusieurs vidéos en une seule exécution, offrant une base scalable pour la création de contenu vidéo assistée par IA dans des secteurs comme la publicité, l'éducation ou le jeu vidéo.

OutilsOutil
1 source
Construire un assistant de recherche à base d'agents avec Groq, LangGraph, sous-agents et mémoire
3MarkTechPost 

Construire un assistant de recherche à base d'agents avec Groq, LangGraph, sous-agents et mémoire

Un tutoriel publié récemment détaille la construction d'un assistant de recherche agentique fonctionnant sur l'infrastructure d'inférence de Groq, en combinant LangGraph, LangChain et le modèle open source Llama 3.3 70B Versatile de Meta. L'architecture repose sur l'endpoint compatible OpenAI de Groq, disponible gratuitement via console.groq.com, ce qui permet d'utiliser l'interface ChatOpenAI de LangChain sans modifier le code en profondeur, simplement en redirigeant la clé API et l'URL de base. L'agent ainsi construit dispose d'un ensemble d'outils concrets: recherche web via DuckDuckGo, récupération de pages, lecture et écriture de fichiers, exécution de code Python, délégation à des sous-agents spécialisés, et une mémoire persistante entre les sessions. Le tout s'appuie sur des bibliothèques comme BeautifulSoup4 pour le parsing HTML et Pydantic pour la validation des données. Ce qui rend cette approche notable, c'est la combinaison d'une infrastructure gratuite et d'une architecture capable de raisonnement multi-étapes. L'agent ne se contente pas de répondre à une question: il décompose un sujet de recherche en sous-questions, interroge plusieurs sources, croise les informations pour identifier les consensus et les divergences, puis génère des rapports structurés sauvegardés dans un répertoire de sortie. La mémoire à long terme lui permet de réutiliser des connaissances acquises lors d'exécutions précédentes, évitant de recommencer from scratch à chaque session. Pour les développeurs et chercheurs qui cherchent à automatiser des workflows de veille ou d'analyse documentaire, cette architecture offre un point de départ fonctionnel sans coût d'inférence immédiat. Ce tutoriel s'inscrit dans une tendance de fond qui voit LangGraph s'imposer comme framework de référence pour les systèmes agentiques en Python, face à des alternatives comme AutoGen ou CrewAI. Groq, de son côté, mise sur la vitesse d'inférence permise par ses puces LPU propriétaires pour attirer les développeurs avec un tier gratuit généreux, dans l'espoir de les convertir en clients payants à l'échelle. L'utilisation de Llama 3.3 70B, modèle open source de Meta, illustre également la montée en puissance des modèles non propriétaires capables d'exécuter du tool calling fiable, compétence longtemps réservée aux modèles fermés comme GPT-4. La prochaine étape naturelle pour ce type de système serait l'intégration de sources structurées, une mémoire vectorielle plus sophistiquée, ou le déploiement dans des environnements de production avec contrôle des coûts.

OutilsTuto
1 source
Grab présente une étude de cas sur la conception d'un système multi-agents pour le support technique à grande échelle
4InfoQ AI 

Grab présente une étude de cas sur la conception d'un système multi-agents pour le support technique à grande échelle

L'équipe centrale de données de Grab, le géant technologique sud-est asiatique, a conçu et déployé un système d'intelligence artificielle multi-agents pour automatiser les tâches d'assistance technique répétitives au sein de sa plateforme d'entrepôt de données. L'architecture repose sur une séparation claire entre deux types de flux de travail : d'un côté l'investigation des incidents, de l'autre les améliorations de la plateforme. Ces agents spécialisés opèrent sous la supervision d'une couche d'orchestration centrale qui coordonne leurs actions selon la nature des requêtes entrantes. L'enjeu est considérable pour les équipes d'ingénierie de Grab : le système permet de réduire significativement la charge opérationnelle, d'accélérer la résolution des problèmes et, surtout, de libérer les ingénieurs des tâches de "pompier" chronophages. Plutôt que de passer leurs journées à traiter des tickets récurrents, les équipes peuvent désormais concentrer leur énergie sur des travaux à plus forte valeur ajoutée, notamment l'ingénierie de la plateforme elle-même et son amélioration continue. Ce cas d'usage illustre une tendance de fond dans les grandes entreprises technologiques : l'adoption des systèmes multi-agents pour absorber la complexité opérationnelle à l'échelle. Les entrepôts de données d'une plateforme comme Grab, qui sert des dizaines de millions d'utilisateurs à travers l'Asie du Sud-Est, génèrent un volume de demandes d'assistance qu'aucune équipe humaine ne peut traiter efficacement sans automatisation. La publication de ce retour d'expérience positionne Grab parmi les pionniers de l'application concrète des agents IA en environnement d'entreprise à grande échelle.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic