Dossier Sora — page 2

93 articles · page 2 sur 2

Sora, le générateur vidéo d'OpenAI : lancement, polémiques sur le « slop », fermeture progressive, fin du deal Disney d'un milliard.

51Apple Machine Learning RecherchePaper

Le calibrage de l'attention creuse accélère la génération de texte en vidéo

Une équipe de recherche propose une nouvelle méthode pour accélérer la génération de vidéos par intelligence artificielle, baptisée attention parcimonieuse calibrée (calibrated sparse attention). Les modèles de diffusion actuels produisent des vidéos de haute qualité à partir de texte, mais reposent sur d'immenses architectures de type transformeur dont la vitesse est freinée par le calcul de l'attention spatio-temporelle, l'étape qui relie chaque portion de l'image dans le temps et l'espace. Les chercheurs ont observé qu'une part importante des connexions entre tokens, les unités élémentaires traitées par le modèle, produit systématiquement des scores d'attention négligeables, quel que soit le contenu de la vidéo générée. Mieux, ces schémas de connexions faibles se répètent souvent d'une requête à l'autre, y compris pour les liens entre blocs de tokens voisins dans l'image. Cette découverte ouvre la voie à une accélération significative sans perte de qualité perceptible: puisque ces connexions apportent une contribution quasi nulle au résultat final, leur calcul peut simplement être ignoré. Pour l'industrie de la génération vidéo par IA, en pleine expansion avec des outils comme Sora, Runway ou Kling, la latence et le coût de calcul restent des freins majeurs à l'adoption à grande échelle, que ce soit pour la production créative professionnelle ou les usages grand public. Réduire ces temps de génération sans sacrifier le rendu visuel pourrait rendre ces outils plus accessibles et moins gourmands en ressources GPU. Cette approche s'inscrit dans une tendance plus large de recherche sur l'optimisation des grands modèles de diffusion vidéo, où l'attention parcimonieuse, déjà explorée pour les grands modèles de langage, est adaptée aux spécificités spatio-temporelles de la vidéo. En identifiant et exploitant la redondance structurelle de l'attention plutôt qu'en réduisant la taille du modèle, les auteurs visent un compromis efficace entre vitesse et fidélité, une piste que d'autres laboratoires devraient probablement explorer à mesure que la demande pour la génération vidéo en temps réel augmente.

Dossier Sora — page 2

Le calibrage de l'attention creuse accélère la génération de texte en vidéo

Neill Blomkamp, réalisateur de District 9, dévoile son premier court-métrage entièrement généré par IA

Créez des vidéos de foot virales gratuitement avec l’IA (Chaîne Youtube sur la Coupe du Monde 2026)

Grok Imagine Video 1.5 : cette IA génère maintenant des vidéos avec le son

Prompt vidéo IA, la méthode simple pour obtenir un rendu pro

Pourquoi les agents vidéo sont la prochaine étape, Ethan He, xAI Grok Imagine

Edimakor avis 2026 : test complet de l’éditeur vidéo IA

Google corrige plusieurs bugs dans les limites d'utilisation de Gemini qui épuisaient les quotas trop rapidement

X-Square Robot dévoile WALL-WM, le premier modèle du monde à IA incarnée avec prédiction au niveau événementiel

Seedance 2.0 : Comment créer des vidéos TikTok avec l’IA ?

Kuaishou envisage de scinder sa filiale Kling AI à une valorisation de 20 milliards de dollars

STARFlow-V : modélisation vidéo générative de bout en bout par flux normalisants

Seedance 2.0 : Le guide complet de la création vidéo multimodale

Modèles du monde

Claude, mon designer attitré

HappyHorse : l’IA vidéo qui domine les réseaux sociaux appartient en fait à Alibaba

Départs, réorganisation, portrait de Sam Altman, entrée en bourse : ça patine chez OpenAI

Google Vids monte en puissance : les modèles IA les plus récents pour créer une vidéo en un clic

Les créateurs de contenu sommés de prouver qu'ils n'ont pas utilisé l'IA

« L’humanité va se scinder en deux » : interview choc et confessions explosives d’OpenAI

Test de Kling AI : le nouveau géant de la vidéo réaliste par intelligence artificielle - avril 2026

OpenAI veut se « recentrer », mais s’offre le podcast préféré de la Silicon Valley

Fidji Simo d'OpenAI rachète le podcast TBPN malgré sa campagne contre les projets parallèles

Google Vids : créez, modifiez et partagez des vidéos gratuitement

Derrière les fruits stars de TikTok, une machine à cash pilotée par l’IA

Google AI publie Veo 3.1 Lite : génération vidéo rapide et économique via l'API Gemini

Créez avec Veo 3.1 Lite, notre modèle de génération vidéo le plus accessible

Une startup permet de générer des vidéos à moindre coût

OpenAI abandonne ses « quêtes secondaires » pour faire face à Anthropic

OpenAI met en pause pour une durée indéterminée la sortie de sa version adulte de ChatGPT

OpenAI met en pause le « mode adulte » de ChatGPT et change de cap stratégique

OpenAI : le « mode adulte » de ChatGPT définitivement à l’arrêt

OpenAI suspend son chatbot érotique pour une durée indéterminée

OpenAI abandonne ses paris ratés et se concentre sur les entreprises

Les gros paris de Disney sur le metaverse et l'IA médiocre ne paient pas

Lyria 3 Pro : créez des morceaux plus longs

Apple peut « distiller » le grand modèle Gemini de Google

Le PDG d'OpenAI redistribue les responsabilités et prépare le modèle IA 'Spud

« Que deviendront les intelligences artificielles si elles doivent sans cesse utiliser les mêmes données ? »

Le culte de l'IA générative a un goût d'eugénisme

Face à la colère d’Hollywood, ByteDance suspend le lancement mondial de son IA vidéo Seedance 2.0

Les modèles d'IA sur mesure sont la prochaine grande révolution du cinéma

Comment Higgsfield transforme des idées simples en vidéos sociales cinématographiques