OutilsPandaily6sem· 1 min de lecture

CapCut lance un assistant IA pour le montage vidéo en langage naturel

CapCut, l'application de montage vidéo développée par ByteDance, a lancé un nouvel assistant IA permettant aux utilisateurs de réaliser des tâches d'édition vidéo par commandes vocales ou textuelles en langage naturel. Baptisé AI Assistant, cet outil repose sur une interface LUI (Language User Interface) : l'utilisateur tape ou prononce une instruction comme "crée un vlog" ou "change la musique de fond", et le système prend en charge automatiquement le montage, les transitions et le traitement audio. Concrètement, l'assistant peut organiser les séquences, synchroniser le rythme des images, effectuer des modifications en lot, générer des sous-titres et rédiger des ébauches de scripts. Plutôt qu'exporter une vidéo figée, il produit un brouillon entièrement modifiable, que l'utilisateur peut affiner selon ses besoins.

Pour les créateurs de contenu du quotidien, ce type d'outil représente un gain de temps substantiel : là où un workflow traditionnel de montage non-linéaire exige de naviguer manuellement entre couches, effets et pistes audio, une simple phrase suffit désormais à déclencher une séquence d'opérations complexes. Techniquement, l'assistant s'appuie sur un système d'orchestration multi-tâches qui décompose chaque instruction en sous-tâches, sélection de la bande-son, étalonnage colorimétrique, découpage, toutes exécutées au sein d'un même projet. Lorsqu'une consigne reste ambiguë, le système relance l'utilisateur pour préciser l'intention avant d'agir.

Ce lancement s'inscrit dans une tendance de fond qui traverse l'ensemble de l'industrie des outils créatifs : le glissement des interfaces basées sur des outils vers des interfaces orientées tâches. Des acteurs comme Adobe, Runway ou Descript avancent dans la même direction, intégrant des couches d'IA générative dans leurs pipelines d'édition. CapCut, fort d'une base d'utilisateurs massive notamment chez les créateurs de contenus courts sur TikTok, dispose d'un terrain d'expérimentation privilégié. Les observateurs notent toutefois que la technologie reste pour l'instant adaptée aux scénarios de création grand public, et que les cas d'usage professionnels avancés nécessiteront des développements supplémentaires.

Impact France/UE

L'outil est accessible aux nombreux créateurs de contenu français actifs sur CapCut et TikTok, sans impact réglementaire spécifique au marché européen.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AI News

Laserfiche lance des agents IA pour les flux de travail en langage naturel

Laserfiche, éditeur spécialisé dans la gestion de contenu d'entreprise, a lancé le 7 mai 2026 des agents d'intelligence artificielle capables d'exécuter des tâches complexes à partir de simples instructions en langage naturel. Ces agents sont accessibles via Smart Chat, une interface conversationnelle intégrée à la plateforme Laserfiche Cloud. Ils s'appuient sur des modèles de raisonnement génératifs (LLM) pour analyser des documents, identifier des informations spécifiques et déclencher des actions concrètes, comme déplacer un fichier, signaler une anomalie ou router un contrat vers le bon interlocuteur. Les capacités de chaque agent sont strictement encadrées par les permissions de l'utilisateur connecté, ce qui garantit que les données sensibles restent protégées selon les règles de conformité en vigueur dans l'organisation. L'intérêt principal de ces agents réside dans leur capacité à automatiser la zone grise entre les workflows préconçus et les tâches manuelles répétitives, sans exiger de compétences techniques de la part des utilisateurs. Dans les services juridiques, ils peuvent détecter des incohérences dans des contrats avant de les soumettre à une revue humaine. En comptabilité fournisseurs, ils repèrent les factures en retard et les transmettent aux équipes concernées. En RH, ils analysent les dossiers employés pour classer automatiquement les documents dans les bons répertoires selon le niveau d'accès de l'utilisateur. Cette polyvalence opérationnelle réduit le temps consacré à la gestion documentaire et libère les équipes pour des tâches à plus forte valeur ajoutée, quel que soit leur niveau de maîtrise technique. Laserfiche s'inscrit dans une tendance de fond qui voit les grandes plateformes de gestion de contenu intégrer des couches d'IA agentique pour transformer la relation des entreprises à leurs données. Jusqu'ici, retrouver un document impliquait de connaître son emplacement exact dans une arborescence souvent complexe. Justin Pava, chief product evangelist de l'entreprise, résume l'évolution en cours : l'endroit où un document est stocké va progressivement perdre de son importance, au profit de la capacité à agir directement sur l'information grâce aux métadonnées extraites automatiquement et à la recherche assistée par IA. Des mises à jour sont déjà prévues pour permettre aux agents de fonctionner en arrière-plan, de surveiller des conditions système de manière autonome et de s'intégrer plus profondément dans les processus métier existants. Cette annonce positionne Laserfiche en concurrence directe avec d'autres acteurs de la gestion documentaire qui cherchent eux aussi à capitaliser sur l'essor des agents IA en entreprise.

OutilsOutil

1 source

2Siècle Digital

Google Vids monte en puissance : les modèles IA les plus récents pour créer une vidéo en un clic

Google a annoncé une mise à jour majeure de Google Vids, son outil de création vidéo intégré à Google Workspace, en déployant ses modèles d'intelligence artificielle les plus récents. La plateforme intègre désormais Veo 3.1, capable de générer des clips vidéo en 720p à partir d'une simple description textuelle. L'outil propose également la composition musicale automatique, la personnalisation d'avatars animés, la capture d'écran intégrée et une création de bout en bout à partir d'une idée initiale. Pour les entreprises et les équipes qui produisent du contenu régulièrement, cette mise à jour réduit considérablement le temps et les compétences techniques nécessaires à la production vidéo. Là où il fallait auparavant un outil de montage, des assets sonores et un opérateur formé, Google Vids promet de compresser ce workflow en quelques clics. La cible est clairement professionnelle : présentations internes, formations, communications corporate, ou contenus marketing légers, sans passer par une agence ou un logiciel spécialisé. Google positionne Vids comme le pendant vidéo de Google Slides dans l'écosystème Workspace, capitalisant sur sa base d'utilisateurs enterprise déjà captive. La montée en puissance de Veo, son modèle vidéo génératif, s'inscrit dans une compétition directe avec Sora d'OpenAI et Runway. En intégrant ces capacités directement dans Workspace plutôt qu'en produit autonome, Google mise sur l'effet d'adoption naturelle, là où ses concurrents doivent convaincre les utilisateurs de changer d'outil. La question reste de savoir si la qualité des rendus sera suffisante pour des usages professionnels exigeants.

UEGoogle Workspace étant massivement déployé dans les entreprises françaises et européennes, cette mise à jour impacte directement les équipes qui produisent du contenu vidéo dans cet écosystème.

OutilsOutil

1 source

3Le Big Data

OpenAI lance un assistant financier dans ChatGPT, mais pas pour tout le monde

OpenAI a lancé le 15 mai 2026 une fonctionnalité de gestion financière personnelle directement intégrée à ChatGPT. Baptisé assistant financier, cet outil permet aux utilisateurs de connecter leurs comptes bancaires via Plaid, un service déjà utilisé par de nombreuses applications fintech. Plus de 12 000 établissements financiers sont compatibles avec cette première version. Une fois les comptes synchronisés, ChatGPT génère automatiquement un tableau de bord personnalisé qui agrège dépenses, abonnements, paiements à venir et investissements. L'utilisateur peut ensuite interroger l'IA en langage naturel, comme il le ferait avec un conseiller bancaire, et lui confier des objectifs précis, achat immobilier, remboursement de prêt, épargne, que le modèle intègre pour contextualiser ses réponses. Pour l'instant, la fonctionnalité est exclusivement réservée aux abonnés ChatGPT Pro aux États-Unis, OpenAI souhaitant observer les usages réels avant un déploiement étendu aux abonnés Plus. Cette intégration marque une évolution significative dans la stratégie de ChatGPT, qui sort du registre de l'assistant généraliste pour entrer dans celui des services financiers personnels, un secteur historiquement dominé par des acteurs spécialisés comme Mint, YNAB ou les applications propriétaires des banques. En accédant directement aux données transactionnelles, OpenAI offre une couche d'analyse et d'interprétation que les outils existants ne proposent pas en langage naturel. Pour les utilisateurs, l'impact concret est potentiellement important : comprendre ses habitudes de dépense, anticiper des dérapages budgétaires, ou simplement savoir où part son argent chaque mois sans multiplier les outils. La société précise toutefois que l'assistant ne remplace pas un conseiller financier professionnel, une mise en garde prudente face au risque d'erreurs ou de confiance excessive dans les recommandations de l'IA. Ce lancement s'inscrit dans une tendance plus large de l'IA générative cherchant à s'ancrer dans des usages quotidiens à forte valeur perçue, après la santé, le droit et la productivité. Pour OpenAI, l'enjeu est double : justifier le tarif élevé de l'abonnement Pro et collecter des données d'usage réel sur un cas d'application sensible avant un déploiement massif. Le choix de Plaid comme intermédiaire technique n'est pas anodin, la startup avait failli être rachetée par Visa en 2020 pour 5,3 milliards de dollars avant que l'accord soit bloqué par le département de Justice américain. La question de la confidentialité des données bancaires reste le principal point de friction : confier l'intégralité de ses transactions à un chatbot représente un saut de confiance que tous les utilisateurs ne sont pas prêts à franchir. Le déploiement progressif voulu par OpenAI vise précisément à mesurer ce seuil d'acceptabilité avant de l'élargir à l'ensemble de sa base mondiale.

UELe lancement est limité aux États-Unis pour l'instant ; une expansion en Europe nécessiterait une mise en conformité stricte avec le RGPD concernant le transfert de données bancaires vers un service IA tiers.

💬 OpenAI utilise ses abonnés Pro comme cobayes sur le cas d'usage le plus sensible qui soit, et c'est la seule façon sérieuse de mesurer si les gens sont vraiment prêts à ce saut. Plaid est déjà dans le tuyau de la moitié des fintechs qu'on utilise sans y penser, donc techniquement c'est moins une rupture qu'un changement de surface visible. En Europe, entre le RGPD et nos banques qui gardent leurs données comme Fort Knox, on va pas voir ça de sitôt.

OutilsOutil

1 source

4Le Big Data

Penguin Ai lance Gwen, un assistant numérique sur mesure pour la santé

Penguin AI a lancé Gwen, une plateforme d'intelligence artificielle personnalisable destinée aux opérations de santé. Conçue pour permettre aux organisations du secteur de créer, déployer et faire évoluer des assistants numériques, Gwen propose dès son lancement une bibliothèque de plus de 100 modules préconfigurés couvrant des tâches aussi variées que le codage rétrospectif HCC, la gestion des autorisations préalables, la synthèse de documents cliniques ou la vérification d'éligibilité des patients. Pour les besoins plus spécifiques, l'outil Gwen Studio permet à n'importe quel utilisateur de concevoir ses propres flux de travail à partir d'une simple instruction, et de passer d'une idée à une application opérationnelle en moins de 25 minutes. La plateforme est disponible immédiatement sur le site de Penguin AI, avec une version gratuite accessible sans engagement commercial ni paiement initial. Le secteur de la santé souffre depuis longtemps d'un décalage structurel entre les outils disponibles et la réalité du terrain. Les équipes administratives sont contraintes de travailler avec des solutions rigides qui ne s'adaptent pas à la diversité des situations rencontrées : un codeur médical qui repère une opportunité de classification simple est soumis aux mêmes processus de vérification qu'un cas complexe, ce qui ralentit les opérations. Les profils techniques, data scientists en tête, se heurtent à un autre obstacle : même capables de concevoir rapidement un agent adapté à une nouvelle politique d'un organisme payeur, ils ne disposent pas d'une plateforme capable de gérer le contexte clinique nécessaire, laissant leur expertise sous-exploitée. Gwen vise précisément à combler ce fossé, en donnant aux analystes et développeurs une solution immédiatement déployable, sans passer par de longues procédures d'autorisation. Ce qui distingue Gwen des solutions généralistes est son approche de la transparence : chaque résultat produit s'accompagne d'une explication du raisonnement clinique utilisé, permettant aux professionnels de comprendre comment une décision a été prise et de garder le contrôle à chaque étape. Cette caractéristique est à double tranchant. Une étude arXiv menée auprès de 257 étudiants en médecine sur 3 855 diagnostics montre que les explications d'une IA correcte améliorent la précision de 6,3 points, mais que lorsque l'IA se trompe dans son raisonnement, la précision chute de 4,9 points, ce qui concerne 27 % des situations. En cause : les IA modernes produisent des explications convaincantes même lorsqu'elles sont dans l'erreur, ce qui peut entraîner les cliniciens vers de mauvaises décisions. Penguin AI s'inscrit dans un marché de l'IA de santé en forte croissance, où la promesse d'automatisation des tâches administratives se heurte encore à des questions de fiabilité et de responsabilité médicale que les acteurs du secteur n'ont pas encore pleinement résolues.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic