Chaque grand laboratoire veut désormais son silicium

The Information a rapporté le 2 juillet 2026 qu'Anthropic est en discussions préliminaires avec Samsung pour fabriquer une puce IA sur mesure, en lorgnant, dit-on, sur le procédé de gravure 2nm de Samsung et son packaging avancé. Les échanges restent exploratoires - Anthropic n'a pas décidé ce que fera la puce, quelle sera sa puissance, ni comment elle s'inscrira dans un serveur - et Samsung a déjà participé au tour de financement Series H d'Anthropic en tant que partenaire stratégique d'infrastructure.

Ce mouvement complète un schéma plutôt qu'il ne l'amorce. Google exploite ses propres TPU depuis des années, Amazon a Trainium, et fin juin OpenAI a dévoilé une puce d'inférence conçue par Broadcom baptisée Jalapeno. Reuters avait d'abord signalé en avril qu'Anthropic envisageait du silicium sur mesure. Avec ceci, le dernier grand laboratoire qui reposait sur le matériel Nvidia du commerce conçoit désormais autour de lui.

Pourquoi une entreprise de modèles fabrique une puce

Les raisons tiennent à l'approvisionnement et au contrôle. Anthropic a évoqué des pénuries de puces, et des composants sur mesure réglés pour une seule charge de travail peuvent battre le matériel généraliste sur la performance par watt, la métrique qui décide de la facture d'électricité d'un centre de données. OpenAI a fait exactement cet argumentaire pour Jalapeno. Maîtriser la conception desserre aussi l'emprise de Nvidia sur l'allocation comme sur le prix.

Il s'agit d'un ajout, pas d'un remplacement. La position affichée d'Anthropic est qu'une pile matérielle diversifiée, incluant des puces Google, Amazon et Nvidia, restera essentielle à sa stratégie de calcul. Une puce sur mesure est une couverture contre un fournisseur unique, pas un abandon de celui-ci, et le premier silicium fonctionnel est encore à des années de distance.

Ce que cela signifie pour les opérateurs européens

La lecture à court terme est ennuyeuse et importante : rien ne devient bon marché de sitôt. Les puces sur mesure mettent deux à trois ans à atteindre la production, si bien que le pouvoir de fixation des prix de Nvidia sur votre facture de calcul tient bien jusqu'en 2028. Quiconque modélise ses coûts d'IA en espérant que l'intégration verticale l'en soulage cette année modélise la mauvaise année.

La lecture stratégique est celle à retenir. Le calcul se fragmente en piles propriétaires où l'entreprise qui fabrique le modèle fabrique aussi la puce, ce qui transforme discrètement le choix d'un modèle en un engagement sur du silicium. L'Europe, notamment, n'a aucun laboratoire dans cette course au silicium - un rappel que la dépendance du continent au calcul est plus profonde que le choix d'une région cloud. Un industriel de taille moyenne à Lyon ou à Milan ne pèse pas dans cet arbitrage : il le subit.