
Avec sa puce Napier, Tensordyne veut faire 13x à 17x mieux que les GPU NVIDIA
Tensordyne, une start-up germano-américaine, a présenté sa puce Napier avec des promesses qui font tourner les têtes dans l'industrie des semi-conducteurs dédiés à l'IA : jusqu'à 13 fois plus de tokens par seconde que les GPU NVIDIA, avec une efficacité pouvant atteindre 17 fois supérieure selon les configurations testées. Le coeur de cette performance repose sur une idée mathématique ancienne mais rarement appliquée au silicium à cette échelle : remplacer les multiplications en virgule flottante par des additions en espace logarithmique. Concrètement, lorsqu'on travaille avec des logarithmes, multiplier deux nombres revient à additionner leurs logarithmes, une opération nettement moins gourmande en transistors et en énergie sur un circuit intégré. C'est ce que Tensordyne appelle sa "sauce secrète", formalisée dans l'architecture de la puce Napier.
L'enjeu est considérable car les modèles de langage modernes sont des machines à calcul d'une intensité rare. GPT-3, avec ses 175 milliards de paramètres, mobilise environ 350 milliards d'opérations par token généré, principalement des multiplications matricielles. Si Tensordyne tient ses promesses, la réduction du coût énergétique et matériel par inférence pourrait transformer l'économie du déploiement de l'IA en production : moins de serveurs pour le même débit, ou un débit bien plus élevé pour le même budget infrastructure. Pour les data centers, les fournisseurs cloud et les entreprises qui font tourner des modèles en continu, ce ratio performance/watt est directement traduit en dollars sur les factures électriques et en capacité de montée en charge.
NVIDIA domine aujourd'hui le marché des accélérateurs IA grâce à ses GPU et surtout à son écosystème logiciel CUDA, devenu un standard de facto que les concurrents peinent à contourner. Des alternatives existent, notamment les TPU de Google ou les puces d'Intel et AMD, mais aucune n'a réussi à briser l'inertie de la base installée CUDA. Tensordyne arrive donc sur un terrain très défendu, avec une approche architecturale radicalement différente qui suppose de reconstruire une chaîne logicielle compatible. L'arithmétique logarithmique n'est pas nouvelle en informatique, mais son application systématique aux réseaux de neurones à très grande échelle est encore largement expérimentale. Les prochains mois diront si Napier tient ses benchmarks en conditions réelles et si la start-up parvient à convaincre suffisamment d'acteurs pour constituer un écosystème viable face au titan de Santa Clara.
La dimension germanique de cette start-up germano-américaine ouvre une piste pour l'écosystème semi-conducteur européen, mais les performances annoncées restent non vérifiées de manière indépendante.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




