OutilsOpenAI Blog65sem· 1 min de lecture

Présentation de nos modèles audio de dernière génération via l'API

Pour la première fois, les développeurs peuvent maintenant diriger un modèle de conversion de texte en parole pour adopter un style spécifique, par exemple "parler comme un agent de service client empathique", débouchant sur une personnalisation accrue des agents vocaux.

Impact France/UE

Les entreprises françaises et européennes dans les secteurs de la technologie vocale et de l'IA peuvent améliorer la personnalisation de leurs agents vocaux grâce à cette nouvelle API, conformément aux exigences du RGPD et à l'attente de l'AI Act, en permettant aux développeurs de diriger les modèles de conversion texte en parole pour adopter des styles spécifiques, comme un agent de service client empathique.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Google AI Blog

Créez avec Lyria 3, notre nouveau modèle de génération musicale

Google lance Lyria 3, son nouveau modèle de génération musicale, désormais accessible en préversion payante via l'API Gemini et en test gratuit dans Google AI Studio. Cette mise à disposition marque une étape importante pour les développeurs souhaitant intégrer de la création musicale dans leurs applications. Lyria 3 représente la version la plus avancée de la famille Lyria, offrant des capacités de synthèse audio de haute qualité directement accessibles via API. Lyria est la gamme de modèles IA musicaux de Google DeepMind, concurrente directe d'outils comme Suno ou Udio. Son intégration à l'écosystème Gemini facilite son adoption par les développeurs déjà familiers avec les outils Google.

OutilsActu

1 source

2TechCrunch AI

Google lance Lyria 3 Pro, son nouveau modèle de génération musicale

Google lance Lyria 3 Pro, une nouvelle version améliorée de son modèle de génération musicale par intelligence artificielle. Ce modèle produit des morceaux plus longs et offre davantage d'options de personnalisation que son prédécesseur. Google prévoit de l'intégrer à Gemini, ses produits entreprise et d'autres services. Cette avancée marque une accélération concrète de l'IA générative dans le domaine musical, un secteur jusqu'ici dominé par des acteurs spécialisés comme Suno ou Udio. En s'appuyant sur son écosystème Gemini, Google dispose d'un levier de distribution massif pour imposer Lyria comme référence. La course à la génération musicale par IA s'intensifie alors que les grandes plateformes cherchent à intégrer ces capacités directement dans leurs outils créatifs et professionnels.

OutilsActu

1 source

3Google AI Blog

Créez avec Veo 3.1 Lite, notre modèle de génération vidéo le plus accessible

Google a mis en disponibilité Veo 3.1 Lite, sa nouvelle version allégée de modèle de génération vidéo, en accès payant via l'API Gemini et en test gratuit sur Google AI Studio. Présenté comme le modèle de génération vidéo le plus économique de la gamme, il s'adresse aux développeurs et entreprises souhaitant intégrer la création vidéo IA dans leurs applications sans supporter les coûts de la version complète Veo 3.1. Ce lancement répond à une demande croissante de solutions vidéo IA accessibles pour les équipes produit et les startups. En proposant une alternative moins coûteuse, Google ouvre la génération vidéo à une base bien plus large de développeurs, au-delà des grandes entreprises capables d'absorber les tarifs premium. La disponibilité directe via l'API Gemini facilite l'intégration dans des pipelines existants. Veo 3.1 Lite s'inscrit dans la stratégie de Google de démocratiser ses outils d'IA générative face à la concurrence de Sora d'OpenAI et Runway. La famille Veo, lancée en 2024, monte progressivement en accessibilité après avoir ciblé initialement les partenaires enterprise. La phase de "paid preview" suggère une disponibilité générale prochaine, avec des tarifs définitifs à préciser.

UELes développeurs et startups européens peuvent désormais intégrer la génération vidéo IA dans leurs pipelines applicatifs à moindre coût via l'API Gemini.

OutilsOutil

1 source

4Blog du Modérateur

Microsoft présente MAI-Image-2, la nouvelle mouture de son générateur d’images par IA

Microsoft a lancé MAI-Image-2, une nouvelle version de son générateur d'images par IA. Ce modèle s'inscrit dans la stratégie d'autonomie de Microsoft en matière d'IA générative, visant à réduire sa dépendance envers des tiers pour la création d'images. L'annonce confirme la volonté de Microsoft de développer ses propres capacités en IA générative multimodale.

OutilsActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic