Accélérer l'entraînement des transformers avec…

NVIDIA lance un kit d'outils BioNeMo Agent pour accélérer l'IA des chercheurs en sciences de la vie sur Claude Science

36

1NVIDIA AI Blog

NVIDIA lance un kit d'outils BioNeMo Agent pour accélérer l'IA des chercheurs en sciences de la vie sur Claude Science

NVIDIA et Anthropic ont annoncé cette semaine l'intégration du BioNeMo Agent Toolkit de NVIDIA à Claude Science, le nouvel environnement de travail conçu par Anthropic pour la recherche scientifique. Claude Science permet aux chercheurs de dialoguer en langage naturel avec des agents capables de piloter leurs travaux de bout en bout, sans configurer manuellement modèles, points d'accès ou environnements logiciels. Grâce à cette intégration, ces agents peuvent désormais s'appuyer sur les modèles accélérés de NVIDIA, ses bibliothèques et ses microservices NIM, dont des outils spécialisés comme Evo 2, Boltz-2 et OpenFold3, pour analyser des séquences génomiques, prédire des structures de protéines ou concevoir des molécules candidates. NVIDIA précise que 18 des 20 plus grandes entreprises pharmaceutiques mondiales utilisent déjà BioNeMo, signe de l'ancrage de la plateforme dans l'industrie. Le toolkit fonctionne en transformant les capacités accélérées de NVIDIA en compétences activables par les agents, qui sélectionnent l'outil adapté, préparent les données d'entrée et exécutent le flux de travail, tout en se connectant aux ressources de calcul NVIDIA où qu'elles soient déployées. Cette avancée s'inscrit dans la transition vers une recherche scientifique pilotée par des agents autonomes, capables de raisonner, planifier et orchestrer des workflows complexes sans intervention humaine constante. Concrètement, un chercheur peut désormais demander à Claude de concevoir de multiples inhibiteurs potentiels à partir d'une mutation antigénique connue associée à un cancer, l'agent se chargeant alors d'enchaîner prédiction, optimisation et validation à haut débit grâce aux microservices NIM. L'enjeu est de taille pour l'industrie pharmaceutique et les laboratoires de recherche, où la vitesse d'itération conditionne directement le rythme des découvertes en génomique, protéomique, conception moléculaire et ingénierie des protéines. En intégrant le calcul accéléré directement dans l'environnement où s'effectue le raisonnement scientifique, NVIDIA et Anthropic cherchent à supprimer les frictions techniques qui ralentissent habituellement le passage de l'hypothèse à l'expérimentation. Cette intégration répond à un constat de fond : un agent scientifique autonome ne raisonne jamais isolément, il doit enchaîner des tâches très diverses, du criblage de bibliothèques de composés à l'analyse de contexte génomique, en passant par la génération de conformères ou la comparaison de réponses à des perturbations cellulaires, avant de recommander la prochaine expérience. La rapidité de chaque étape dépend directement de la performance des outils sous-jacents. C'est pourquoi NVIDIA met en avant des gains de vitesse concrets au sein du BioNeMo Agent Toolkit, comme Parabricks, qui réduit l'analyse génomique de plusieurs heures à quelques minutes, ou RAPIDS-singlecell, développé par le collectif scverse, qui ramène un flux de prétraitement et de clustering portant sur 1,3 million de cellules de 52 minutes à seulement 25 secondes.

OutilsActu

1 source

Pocket : la nouvelle appli de Meta transforme vos idées en mini-jeux avec l’IA

45

2Le Big Data

Pocket : la nouvelle appli de Meta transforme vos idées en mini-jeux avec l’IA

Meta Platforms a dévoilé Pocket, une nouvelle application qui transforme une simple description textuelle en mini-jeu interactif grâce à l'intelligence artificielle. L'utilisateur écrit son idée en quelques mots, et l'IA génère automatiquement une expérience jouable baptisée « gizmo », sans qu'aucune ligne de code ne soit nécessaire. Cette approche s'appuie sur le concept du « vibe-coding », popularisé ces derniers mois. Une fois créés, les gizmos sont publiés dans un fil vertical qui rappelle fortement TikTok ou Instagram Reels : les utilisateurs font défiler les créations des autres, les testent en quelques secondes, puis passent à la suivante d'un geste. Certains mini-jeux exploitent les capteurs du smartphone, comme l'inclinaison, les vibrations, le son ou l'appareil photo, pour offrir une expérience plus immersive. Chaque création peut aussi être partagée via un lien ou remixée par d'autres utilisateurs, qui peuvent modifier le concept initial pour produire leur propre version. Pour l'instant, l'application n'est disponible que dans certaines régions, via le Google Play Store. Avec Pocket, Meta cherche à rendre la création de jeux vidéo aussi accessible et immédiate que la publication d'une vidéo sur un réseau social, en supprimant la barrière technique de la programmation. L'enjeu est de taille pour l'entreprise, qui tente depuis plusieurs années de renouveler l'attrait de ses plateformes face à la concurrence de TikTok et à l'essor de formats courts et interactifs. En misant sur du contenu généré par IA plutôt que filmé ou monté, Meta ouvre une nouvelle catégorie de divertissement participatif, où n'importe quel utilisateur devient potentiellement créateur de jeu. Pour les créateurs de contenu comme pour les développeurs indépendants, cette démocratisation pourrait bouleverser l'écosystème du jeu mobile léger, en abaissant drastiquement le coût et le temps nécessaires pour produire une expérience interactive virale. Le lancement de Pocket ne sort pas de nulle part. En mars dernier, Meta avait recruté l'équipe de la startup Atma Sciences Inc., créatrice de l'application Gizmo, et obtenu une licence sur sa technologie de vibe-coding, capable de générer du code à partir d'instructions en langage naturel. Avant son rachat, Gizmo affichait déjà plus de 14 000 évaluations sur l'App Store d'Apple, avec une note moyenne de 4,9 sur 5, preuve d'une traction réelle auprès des premiers utilisateurs. Pocket reprend cette base technique éprouvée en l'intégrant dans un environnement bien plus social, pensé pour la découverte et le partage. Meta prévoit de promouvoir l'application sur ses autres plateformes, Facebook et Instagram en tête, afin d'accélérer son adoption avant un éventuel déploiement plus large.

💬 Meta rachète pas juste une techno, il rachète une preuve de traction (14 000 notes, 4,9/5 avant même le rachat), et ça change tout dans la manière de lire le lancement. Le pari c'est que la barrière à l'entrée du jeu vidéo devienne aussi basse que celle d'un post Instagram, et sur le papier ça peut vraiment redistribuer les cartes du mobile léger. Reste que Meta a déjà raté plusieurs coups face à TikTok, donc la vraie question c'est la rétention une fois la nouveauté passée, pas la démo.

OutilsOutil

1 source

Construire des transformers économes en mémoire avec xFormers : séquences compactes, GQA, ALiBi, SwiGLU et attention causale

36

3MarkTechPost

Construire des transformers économes en mémoire avec xFormers : séquences compactes, GQA, ALiBi, SwiGLU et attention causale

Un tutoriel publié récemment détaille comment exploiter xFormers, la bibliothèque open source de Meta, pour construire des modèles Transformer à la fois rapides et économes en mémoire GPU. L'auteur y implémente pas à pas cinq optimisations clés : l'attention mémoire-efficiente, le masquage causal, les séquences de longueur variable compressées (packed sequences), l'attention multi-requêtes groupées (GQA), et les biais positionnels ALiBi. Le tout culmine dans un modèle de type GPT complet, entraînable, qui intègre également des couches feed-forward SwiGLU et l'entraînement en précision mixte automatique. Les benchmarks sont conduits sur GPU CUDA avec PyTorch, en comparant xFormers à une implémentation d'attention naïve sur des longueurs de séquences allant de 512 à 4 096 tokens. L'enjeu central est la mémoire. L'attention standard matérialise en mémoire une matrice de scores de taille M×M (nombre de tokens au carré), ce qui devient rapidement prohibitif à mesure que les séquences s'allongent : doubler la longueur quadruple la consommation mémoire. L'attention mémoire-efficiente de xFormers calcule le même résultat exact sans jamais stocker cette matrice complète, grâce à une réécriture algorithmique de type FlashAttention. En pratique, cela permet d'entraîner des modèles sur des séquences bien plus longues avec le même matériel, ou d'augmenter la taille des batches, ce qui accélère la convergence. Pour les chercheurs et les ingénieurs qui travaillent avec des ressources GPU limitées, notamment sur du matériel grand public ou des serveurs partagés, ces gains ne sont pas marginaux : ils peuvent rendre faisable ce qui ne l'était pas. xFormers est développé par Meta AI et s'inscrit dans un mouvement plus large d'optimisation des Transformers, apparu après la publication de FlashAttention par Tri Dao et ses collègues de Stanford en 2022. Depuis, plusieurs bibliothèques concurrentes ont émergé (FlashAttention-2, FlashAttention-3, Triton), mais xFormers se distingue par son intégration directe dans l'écosystème PyTorch et par la richesse de ses primitives prêtes à l'emploi : GQA pour réduire le coût des têtes d'attention, ALiBi pour généraliser à des longueurs de séquences non vues à l'entraînement, SwiGLU pour améliorer la qualité des représentations. Ces briques sont précisément celles qu'utilisent des modèles de référence comme LLaMA ou Mistral. Ce tutoriel illustre comment les assembler concrètement, comblant ainsi le fossé entre la théorie des papiers de recherche et leur mise en oeuvre opérationnelle.

UECes optimisations de mémoire GPU, utilisées notamment par Mistral, bénéficient aux équipes de recherche européennes qui entraînent des modèles avec des ressources GPU limitées.

OutilsTuto

1 source

Comment l’IA transforme la gestion de chantier en 2026 ?

47

4Le Big Data

Comment l’IA transforme la gestion de chantier en 2026 ?

Moins de 10 % des entreprises du bâtiment utilisent aujourd'hui l'intelligence artificielle dans leur gestion opérationnelle, mais 70 % prévoient de franchir le pas dans les prochains mois, soit 15 points de plus qu'il y a un an selon le baromètre Orisha Construction. Le marché mondial de l'IA appliquée à la construction devrait atteindre 4,5 milliards de dollars en 2026. Concrètement, six applications transforment déjà le quotidien des professionnels : la génération automatique de devis, la prédiction des retards, l'optimisation de planning, l'analyse de photos par vision par ordinateur, les chatbots clients pour artisans, et la détection d'anomalies de sécurité. Sur le seul volet du chiffrage, un artisan qui dictait vocalement ses paramètres peut aujourd'hui obtenir un devis structuré en 45 minutes au lieu de quatre heures, avec des relances automatisées (email J+3, SMS J+7, appel J+14) qui font passer le taux de transformation de 15 à 30 %. Les solutions SaaS concernées démarrent entre 150 et 250 euros par mois pour un indépendant, avec un retour sur investissement atteint en trois à quatre mois. L'impact dépasse la simple productivité administrative. En croisant données météo, disponibilité des ressources et historiques de sinistres, les algorithmes de prédiction permettent d'identifier une rupture d'approvisionnement trois semaines à l'avance, laissant le temps de mobiliser un fournisseur alternatif sans perdre un seul jour de chantier. McKinsey et Orisha estiment que cette approche réduit de 15 à 25 % les coûts liés aux erreurs, reprises et retards. Sur le terrain, des drones et caméras fixes capturent quotidiennement l'avancement réel, que l'IA quantifie sans relevé manuel. Les équipements de protection individuelle non portés sont détectés instantanément sur les images, réduisant les risques d'accidents et les responsabilités juridiques. Pour les artisans, un chatbot répond aux demandes de devis en dehors des heures ouvrées, supprimant les pertes de contrats par manque de réactivité. Le paradoxe du secteur est bien connu : la construction affiche une productivité qui progresse d'à peine 1 % par an depuis des décennies, malgré une pression croissante liée à la volatilité des prix des matériaux, la pénurie de compagnons qualifiés et une réglementation de plus en plus dense. C'est précisément cette accumulation de contraintes qui pousse les acteurs à chercher des gains opérationnels rapides et mesurables, plutôt que des transformations structurelles longues. Des éditeurs comme Trustup Pro intègrent déjà plusieurs de ces briques dans des logiciels de suivi de chantier tout-en-un. La prochaine étape, déjà en cours dans les grandes entreprises, est l'interconnexion de ces outils avec les ERP et les plateformes de sous-traitance, pour que le conducteur de travaux dispose d'un tableau de bord prédictif unifié plutôt que d'une série d'alertes isolées.

UELe secteur du bâtiment français est directement visé, avec des éditeurs tricolores comme Orisha Construction et Trustup Pro qui commercialisent déjà ces briques IA à destination des artisans et conducteurs de travaux.

💬 Le bâtiment stagne à +1 % de productivité par an depuis trente ans, et d'un coup 70 % des boîtes seraient prêtes à basculer. Ce chiffre vient d'un éditeur qui vend ces solutions, garde ça en tête. Mais les cas d'usage tiennent la route : 45 minutes pour un devis au lieu de 4 heures, ROI à 3 mois pour 150 euros par mois, c'est le genre de gain mesurable qui convainc un artisan, pas un DSI.

OutilsOutil

1 source

Accélérer l'entraînement des transformers avec NVIDIA Apex et torch.amp

À lire aussi

NVIDIA lance un kit d'outils BioNeMo Agent pour accélérer l'IA des chercheurs en sciences de la vie sur Claude Science

Pocket : la nouvelle appli de Meta transforme vos idées en mini-jeux avec l’IA

Construire des transformers économes en mémoire avec xFormers : séquences compactes, GQA, ALiBi, SwiGLU et attention causale

Comment l’IA transforme la gestion de chantier en 2026 ?