
FRACTILE lève 187 millions d’euros pour développer les puces destinées aux futurs agents IA
Fractile, startup britannique spécialisée dans les semi-conducteurs pour l'intelligence artificielle, a annoncé une levée de fonds de 220 millions de dollars, soit environ 187 millions d'euros. L'entreprise se distingue de la majorité des acteurs du secteur en ne ciblant pas l'entraînement des modèles, mais leur inférence, c'est-à-dire l'exécution concrète des modèles une fois entraînés, notamment dans le cadre des agents IA autonomes qui doivent raisonner et agir en temps réel.
Ce financement souligne une tension croissante dans l'écosystème IA : si les GPU de Nvidia dominent la phase d'entraînement, l'inférence à grande échelle représente un goulot d'étranglement distinct, à la fois en termes de coût, de latence et de consommation énergétique. Avec la montée en puissance des agents IA capables d'enchaîner des raisonnements complexes, la demande en puces optimisées pour cette couche d'exécution devient critique pour les entreprises qui déploient ces systèmes à grande échelle.
Fractile s'inscrit dans une vague de startups cherchant à concurrencer Nvidia sur des segments spécifiques du marché des puces IA, comme Groq, Etched ou Cerebras. Le pari de se concentrer sur les agents plutôt que sur l'entraînement général reflète une conviction que l'ère des modèles fondamentaux cède progressivement la place à celle du déploiement applicatif. Ce tour de table permettra à l'entreprise d'accélérer le développement de son architecture propriétaire et de recruter dans un marché des talents semi-conducteurs très compétitif.
Une startup britannique spécialisée en puces d'inférence IA pourrait offrir aux entreprises européennes une alternative crédible à Nvidia pour le déploiement d'agents IA à grande échelle, réduisant partiellement leur dépendance aux fournisseurs américains.
L'inférence, c'est le vrai goulot d'étranglement qu'on sous-estime depuis des années, et là Fractile met presque 200M€ sur la table pour s'y attaquer en ciblant spécifiquement les agents. C'est le bon timing, parce qu'un agent qui enchaîne dix appels LLM pour accomplir une tâche, ça coûte une fortune en latence et en énergie avec des GPU pensés pour l'entraînement. Bon, sur le papier c'est solide, mais le cimetière des startups chips anti-Nvidia est bien fourni, alors reste à voir si l'architecture tient quand les clients arrivent en prod.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




