Aller au contenu principal
RobotiqueMarkTechPost2sem

Google lance TensorFlow 2.21 et LiteRT : meilleures performances GPU, nouvelle accélération NPU et déploiement edge PyTorch simplifié

1 source couvre ce sujet·Source originale ↗·
Résumé IA

Google a lancé TensorFlow 2.21 introduisant LiteRT, maintenant prêt pour la production, qui offre des améliorations de performance GPU (1,4 fois plus rapide) et une intégration NPU avancée pour une déploiement fluide des modèles PyTorch sur les appareils mobiles et edge. LiteRT remplace TensorFlow Lite, simplifiant la conversion des modèles entraînés avec PyTorch ou JAX pour un déploiement on-device, tout en renforçant la sécurité et les mises à jour des dépendances.

Google has officially released TensorFlow 2.21. The most significant update in this release is the graduation of LiteRT from its preview stage to a fully production-ready stack. Moving forward, LiteRT serves as the universal on-device inference framework, officially replacing TensorFlow Lite (TFLite). This update streamlines the deployment of machine learning models to mobile and edge devices while expanding hardware and framework compatibility. LiteRT: Performance and Hardware Acceleration When deploying models to edge devices (like smartphones or IoT hardware), inference speed and battery efficiency are primary constraints. LiteRT addresses this with updated hardware acceleration: GPU Improvements: LiteRT delivers 1.4x faster GPU performance compared to the previous TFLite framework. NPU Integration: The release introduces state-of-the-art NPU acceleration with a unified, streamlined workflow for both GPU and NPU across edge platforms. This infrastructure is specifically designed to support cross-platform GenAI deployment for open models like Gemma. Lower Precision Operations (Quantization) To run complex models on devices with limited memory, developers use a technique called quantization. This involves lowering the precision—the number of bits—used to store a neural network’s weights and activations. TensorFlow 2.21 significantly expands the tf.lite operators’ support for lower-precision data types to improve efficiency: The SQRT operator now supports int8 and int16x8 . Comparison operators now support int16x8 . tfl.cast now supports conversions involving INT2 and INT4 . tfl.slice has added support for INT4 . tfl.fully_connected now includes support for INT2 . Expanded Framework Support Historically, converting models from different training frameworks into a mobile-friendly format could be difficult. LiteRT simplifies this by offering first-class PyTorch and JAX support via seamless model conversion . Developers can now train their models in PyTorch or JAX and convert them directly for on-device deployment without needing to rewrite the architecture in TensorFlow first. Maintenance, Security, and Ecosystem Focus Google is shifting its TensorFlow Core resources to focus heavily on long-term stability. The development team will now exclusively focus on: Security and bug fixes: Quickly addressing security vulnerabilities and critical bugs by releasing minor and patch versions as required. Dependency updates: Releasing minor versions to support updates to underlying dependencies, including new Python releases. Community contributions: Continuing to review and accept critical bug fixes from the open-source community. These commitments apply to the broader enterprise ecosystem, including: TF.data, TensorFlow Serving, TFX, TensorFlow Data Validation, TensorFlow Transform, TensorFlow Model Analysis, TensorFlow Recommenders, TensorFlow Text, TensorBoard, and TensorFlow Quantum. Key Takeaways LiteRT Officially Replaces TFLite: LiteRT has graduated from preview to full production, officially becoming Google’s primary on-device inference framework for deploying machine learning models to mobile and edge environments. Major GPU and NPU Acceleration: The updated runtime delivers 1.4x faster GPU performance compared to TFLite and introduces a unified workflow for NPU (Neural Processing Unit) acceleration, making it easier to run heavy GenAI workloads (like Gemma) on specialized edge hardware. Aggressive Model Quantization (INT4/INT2): To maximize memory efficiency on edge devices, tf.lite operators have expanded support for extreme lower-precision data types. This includes int8 / int16 for SQRT and comparison operations, alongside INT4 and INT2 support for cast , slice , and fully_connected operators. Seamless PyTorch and JAX Interoperability: Developers are no longer locked into training with TensorFlow for edge deployment. LiteRT now provides first-class, native model conversion for both PyTorch and JAX, streamlining the pipeline from research to production. Check out the Technical details and Repo . Also, feel free to follow us on Twitter and don’t forget to join our 120k+ ML SubReddit and Subscribe to our Newsletter . Wait! are you on telegram? now you can join us on telegram as well. The post Google Launches TensorFlow 2.21 And LiteRT: Faster GPU Performance, New NPU Acceleration, And Seamless PyTorch Edge Deployment Upgrades appeared first on MarkTechPost .

À lire aussi

1Next INpact4h

☕️ Amazon s’offre la startup Fauna Robotics et son robot dédié aux interactions humaines

Amazon a acquis Fauna Robotics, une startup new-yorkaise fondée en 2024 et financée à hauteur de 30 millions de dollars. L'équipe de 50 personnes développe Sprout, un robot humanoïde de 107 cm et 22,7 kg présenté officiellement le 27 janvier 2026. Doté de 29 degrés de liberté, d'une interface vocale naturelle et d'un design arrondi, Sprout est conçu pour interagir avec des humains dans des environnements comme l'hôtellerie, le commerce ou l'enseignement. Les deux cofondateurs et l'ensemble des équipes rejoignent la division robotique d'Amazon. Cette acquisition marque un tournant dans la stratégie robotique d'Amazon, jusqu'ici concentrée sur la logistique et le transport. Avec Sprout, le géant du e-commerce signale un intérêt renouvelé pour la robotique de service à la personne — un marché potentiellement immense, mais techniquement difficile. Amazon espère capitaliser sur sa relation de confiance établie avec des millions de foyers via ses activités retail et ses appareils connectés pour introduire des robots directement dans les espaces de vie et de travail. Ce n'est pas la première incursion d'Amazon dans la robotique personnelle : Astro, son robot domestique lancé en 2021, s'était soldé par un échec commercial et technique. L'acquisition de Fauna Robotics, qui fait suite à celle de la startup suisse Rivr spécialisée dans la livraison autonome, témoigne d'une volonté persistante de conquérir ce terrain malgré les déconvenues passées.

RobotiqueOpinion
1 source
2The Decoder20h

Agile Robots et Google DeepMind s'associent pour déployer des robots dopés à l'IA dans les usines

Agile Robots et Google DeepMind s'associent pour développer des robots industriels alimentés par l'IA. La société munichoise intégrera les modèles Gemini Robotics de DeepMind dans ses équipements pour des applications en milieu industriel.

UEAgile Robots, entreprise munichoise, intègre les modèles DeepMind dans ses robots industriels, ce qui concerne directement le tissu industriel européen et les perspectives d'automatisation en Europe.

RobotiqueActu
1 source
3IEEE Spectrum AI23h

Le tournant imminent de la guerre des drones en Ukraine

Yaroslav Azhnyuk, ingénieur ukrainien et fondateur de la société de robotique The Fourth Law, décrit l'émergence d'une nouvelle ère de guerre autonome, où des essaims de drones pilotés par IA s'affrontent sans intervention humaine directe. Depuis l'invasion russe de février 2022, les forces ukrainiennes ont transformé des drones civils grand public en armes létales à faible coût, déclenchant une révolution militaire aujourd'hui visible aussi dans le conflit entre les États-Unis, Israël et l'Iran — notamment via les drones Shahed iraniens lancés par milliers contre l'Ukraine. La prochaine étape de cette révolution, l'autonomie complète des drones guidés par IA, est déjà en cours de développement en Ukraine malgré les systèmes de brouillage russes de plus en plus sophistiqués.

UELe développement de drones autonomes guidés par IA en Ukraine concerne directement la sécurité européenne et pourrait influencer les doctrines militaires et réglementations sur les systèmes d'armes létaux autonomes au sein de l'UE.

RobotiqueOpinion
1 source
4TechCrunch AI1j

Agile Robots devient la dernière entreprise de robotique à s'associer avec Google DeepMind

Agile Robots s'associe à Google DeepMind pour intégrer les modèles fondamentaux de robotique du laboratoire dans ses robots. En échange, Agile Robots collectera des données au profit de la recherche de DeepMind. Cette collaboration s'inscrit dans la tendance croissante des partenariats entre fabricants de robots et grands laboratoires d'IA.

UEAgile Robots, entreprise sino-allemande basée à Munich, renforce ses capacités IA via DeepMind, ce qui pourrait influencer la compétitivité de la robotique européenne face aux acteurs américains et asiatiques.

RobotiqueActu
1 source