Cosa stanno facendo esattamente Qualcomm e Tenstorrent?

Stanno attaccando l'inferenza, la parte dell'IA che entra in funzione ogni volta che un modello risponde a una query, anziché l'addestramento, la parte che Nvidia domina con più nettezza. Il 28 ottobre 2025 Qualcomm ha presentato due acceleratori per data center, l'AI200 e l'AI250, costruiti sulla propria tecnologia di unità di elaborazione neurale e mirati con decisione al costo dell'inferenza e all'efficienza energetica, con l'AI200 previsto per la disponibilità commerciale nel 2026 e l'AI250 nel 2027. Separatamente, nel giugno 2026 The Information ha riferito, con copertura successiva di Reuters, The Register e Tom's Hardware, che Qualcomm sarebbe in trattativa per acquistare Tenstorrent, la startup di Jim Keller, a una valutazione di circa 8-10 miliardi di dollari. Keller ha guidato in passato il lavoro sull'architettura in Apple, AMD e Tesla. Insieme, le due mosse puntano allo stesso bersaglio da due direzioni.

Perché è una minaccia più seria rispetto ai precedenti sfidanti di Nvidia?

Perché colpisce l'unico punto in cui Nvidia è misurabilmente più debole, non quello in cui è più forte. Nvidia detiene ancora circa l'80 per cento del mercato degli acceleratori per IA in termini di ricavi, e la sua presa sull'addestramento supera, secondo quanto riferito, il 90 per cento. Ma nell'inferenza la sua quota è più bassa, riferita tra il 60 e il 75 per cento, e l'inferenza è la parte della spesa per IA che cresce più rapidamente, con una proiezione di raggiungere circa due terzi di tutta la spesa in calcolo per l'IA entro il 2026. L'inferenza è anche più sensibile al prezzo e meno dipendente dal software CUDA di Nvidia, che è il vero fossato. Uno sfidante che vince sul costo per query in un mercato che si sposta verso l'inferenza è un animale diverso da uno che promette un chip di addestramento più veloce.

Cosa aggiunge la dimensione Tenstorrent che un chip da solo non offre?

La proprietà. Tenstorrent si fonda su RISC-V, un'architettura a set di istruzioni aperta che i clienti possono licenziare e attorno alla quale progettare, anziché affittarla alle condizioni di un unico fornitore. Secondo quanto riferito, alla fine del 2025 Tenstorrent era in trattativa per raccogliere circa 800 milioni di dollari guidati da Fidelity a una valutazione di circa 3,2 miliardi di dollari, dopo aver chiuso oltre 693 milioni in un round di Serie D guidato da Samsung Securities e AFW Partners alla fine del 2024. Se Qualcomm la acquisisce vicino alla cifra riferita di 10 miliardi di dollari, la logica strategica non è solo un altro acceleratore. È una via perché gli hyperscaler e le grandi imprese possiedano una parte maggiore del proprio stack di calcolo anziché prenderla in leasing. Per un settore che inizia a rendersi conto di quanta parte della propria base di costi risieda dentro un unico fornitore, è questa la parte che merita attenzione.

Cosa dovrebbe trarne un proprietario o un family office?

Trattate la concentrazione dei fornitori nella vostra infrastruttura di IA come una questione di bilancio, non come una nota tecnica a piè di pagina. Il titolo è una rivalità di borsa. La sostanza è che il costo di far funzionare l'IA si sta spostando da una spesa una tantum di addestramento verso una voce permanente di inferenza, e quella voce passa attualmente quasi interamente attraverso un unico fornitore. Servola fornisce consulenza a proprietari e family office su strategia di infrastruttura e di fornitori, e la conclusione ricorrente è sempre la stessa: le aziende in portafoglio raramente sanno quale quota del loro costo di IA sia vincolata a un'unica architettura, né quanto costerebbe qualificare un'alternativa. Le mosse di Qualcomm e Tenstorrent sono una prova precoce che stanno arrivando alternative credibili. Il lavoro consiste nel conoscere la propria esposizione prima che il conto si accumuli.