Infrastructure

La prima sfida seria a Nvidia non è una GPU migliore. È il livello dell'inferenza.

Gli AI200/AI250 di Qualcomm e una mossa da 10 miliardi su Tenstorrent puntano al livello dell'inferenza, dove Nvidia è più debole. Perché i proprietari dovrebbero guardare ai chip, non ai titoli.

Di Leon Soliman · 2026-06-19 · 3 min di lettura

Punti chiave

Qualcomm ha presentato i suoi acceleratori per data center AI200 e AI250 il 28 ottobre 2025, concepiti per l'inferenza dell'IA anziché per l'addestramento, con l'AI200 previsto per la disponibilità commerciale nel 2026 e l'AI250 nel 2027.
Secondo quanto riferito, Qualcomm sarebbe in trattativa per acquisire Tenstorrent, la startup di chip di Jim Keller, a una valutazione di circa 8-10 miliardi di dollari, notizia riportata per la prima volta da The Information nel giugno 2026 e ripresa da Reuters, The Register e Tom's Hardware.
Nvidia detiene ancora circa l'80 per cento del mercato degli acceleratori per IA in termini di ricavi, ma la sua quota specificamente nell'inferenza è più bassa, secondo quanto riferito tra il 60 e il 75 per cento, e si prevede che l'inferenza arrivi a rappresentare circa due terzi di tutta la spesa in calcolo per l'IA entro il 2026.
La competizione si è spostata dalle prestazioni grezze di addestramento al costo dell'inferenza per query e al lock-in software, dove il vantaggio CUDA di Nvidia è più debole.
La scommessa di Tenstorrent è RISC-V, un set di istruzioni aperto che consente agli acquirenti di licenziare e possedere l'architettura anziché affittarla, una minaccia di tipo diverso rispetto a un chip più veloce.

Cosa stanno facendo esattamente Qualcomm e Tenstorrent?

Stanno attaccando l'inferenza, la parte dell'IA che entra in funzione ogni volta che un modello risponde a una query, anziché l'addestramento, la parte che Nvidia domina con più nettezza. Il 28 ottobre 2025 Qualcomm ha presentato due acceleratori per data center, l'AI200 e l'AI250, costruiti sulla propria tecnologia di unità di elaborazione neurale e mirati con decisione al costo dell'inferenza e all'efficienza energetica, con l'AI200 previsto per la disponibilità commerciale nel 2026 e l'AI250 nel 2027. Separatamente, nel giugno 2026 The Information ha riferito, con copertura successiva di Reuters, The Register e Tom's Hardware, che Qualcomm sarebbe in trattativa per acquistare Tenstorrent, la startup di Jim Keller, a una valutazione di circa 8-10 miliardi di dollari. Keller ha guidato in passato il lavoro sull'architettura in Apple, AMD e Tesla. Insieme, le due mosse puntano allo stesso bersaglio da due direzioni.

Perché è una minaccia più seria rispetto ai precedenti sfidanti di Nvidia?

Perché colpisce l'unico punto in cui Nvidia è misurabilmente più debole, non quello in cui è più forte. Nvidia detiene ancora circa l'80 per cento del mercato degli acceleratori per IA in termini di ricavi, e la sua presa sull'addestramento supera, secondo quanto riferito, il 90 per cento. Ma nell'inferenza la sua quota è più bassa, riferita tra il 60 e il 75 per cento, e l'inferenza è la parte della spesa per IA che cresce più rapidamente, con una proiezione di raggiungere circa due terzi di tutta la spesa in calcolo per l'IA entro il 2026. L'inferenza è anche più sensibile al prezzo e meno dipendente dal software CUDA di Nvidia, che è il vero fossato. Uno sfidante che vince sul costo per query in un mercato che si sposta verso l'inferenza è un animale diverso da uno che promette un chip di addestramento più veloce.

Cosa aggiunge la dimensione Tenstorrent che un chip da solo non offre?

La proprietà. Tenstorrent si fonda su RISC-V, un'architettura a set di istruzioni aperta che i clienti possono licenziare e attorno alla quale progettare, anziché affittarla alle condizioni di un unico fornitore. Secondo quanto riferito, alla fine del 2025 Tenstorrent era in trattativa per raccogliere circa 800 milioni di dollari guidati da Fidelity a una valutazione di circa 3,2 miliardi di dollari, dopo aver chiuso oltre 693 milioni in un round di Serie D guidato da Samsung Securities e AFW Partners alla fine del 2024. Se Qualcomm la acquisisce vicino alla cifra riferita di 10 miliardi di dollari, la logica strategica non è solo un altro acceleratore. È una via perché gli hyperscaler e le grandi imprese possiedano una parte maggiore del proprio stack di calcolo anziché prenderla in leasing. Per un settore che inizia a rendersi conto di quanta parte della propria base di costi risieda dentro un unico fornitore, è questa la parte che merita attenzione.

Cosa dovrebbe trarne un proprietario o un family office?

Trattate la concentrazione dei fornitori nella vostra infrastruttura di IA come una questione di bilancio, non come una nota tecnica a piè di pagina. Il titolo è una rivalità di borsa. La sostanza è che il costo di far funzionare l'IA si sta spostando da una spesa una tantum di addestramento verso una voce permanente di inferenza, e quella voce passa attualmente quasi interamente attraverso un unico fornitore. Servola fornisce consulenza a proprietari e family office su strategia di infrastruttura e di fornitori, e la conclusione ricorrente è sempre la stessa: le aziende in portafoglio raramente sanno quale quota del loro costo di IA sia vincolata a un'unica architettura, né quanto costerebbe qualificare un'alternativa. Le mosse di Qualcomm e Tenstorrent sono una prova precoce che stanno arrivando alternative credibili. Il lavoro consiste nel conoscere la propria esposizione prima che il conto si accumuli.

Da leggere ora: Alphabet raccoglie 80 miliardi di dollari per l'IA. È il vostro segnale per smettere di competere sull'infrastruttura. · DeepSeek V4 è gratuito da possedere. La maggior parte delle aziende lo affitterà comunque a token.

Domande frequenti

Qualcomm sta davvero battendo Nvidia adesso?

No. A metà 2026 Nvidia detiene ancora circa l'80 per cento del mercato degli acceleratori per IA in termini di ricavi, e l'AI200 di Qualcomm è previsto per la disponibilità commerciale solo nel 2026, con l'AI250 nel 2027. Il significato sta nel bersaglio, l'inferenza e il costo, non nella quota di mercato attuale.

Qualcomm ha confermato che acquisterà Tenstorrent?

No. A giugno 2026 le trattative sono state riferite per la prima volta da The Information e riprese da Reuters, The Register e Tom's Hardware a una valutazione di circa 8-10 miliardi di dollari, e i resoconti hanno sottolineato che non vi è alcuna garanzia che un accordo si chiuda. Trattatela come una negoziazione riferita, non come un'acquisizione completata.

Perché l'inferenza conta più dell'addestramento per il costo?

L'addestramento avviene una sola volta per costruire un modello, mentre l'inferenza entra in funzione ogni singola volta che il modello risponde a una query, per cui per qualsiasi azienda che usi l'IA su larga scala l'inferenza diventa il costo ricorrente. Si prevede che l'inferenza rappresenterà circa due terzi della spesa in calcolo per l'IA entro il 2026, ed è per questo che la concorrenza si sta concentrando lì.

La prima vera crepa nella posizione di Nvidia non è arrivata da un chip più veloce. È arrivata dalla consapevolezza che l'inferenza è dove finisce il denaro e dove il lock-in è più sottile, e i proprietari accorti stanno mappando quell'esposizione ora, anziché leggerne più avanti.

AI Infrastructure Semiconductors Nvidia Vendor Strategy

Altro dal Servola Journal

Infrastructure

Alphabet raccoglie 80 miliardi di dollari per l'IA. È il vostro segnale per smettere di competere sull'infrastruttura.

2026-06-21 · 2 min di lettura

Leggi l'articolo →

Infrastructure

DeepSeek V4 è gratuito da possedere. La maggior parte delle aziende lo affitterà comunque a token.

2026-06-20 · 3 min di lettura

Leggi l'articolo →

Infrastructure

Nvidia finanzia i laboratori che comprano i suoi chip. Il boom dell'IA si sta pagando da solo?

2026-06-19 · 3 min di lettura

Leggi l'articolo →

Servola

Se la vostra base di costi per l'IA passa attraverso un unico fornitore di chip, è esattamente questa l'esposizione che mappiamo e pianifichiamo, con discrezione e con un unico responsabile.

Richiedi un colloquio riservato Chi è Servola →

Servola è consulenza tecnologica per un numero ristretto di famiglie e family office. Quando una decisione non può essere delegata, sediamo dalla vostra parte del tavolo.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Tutti gli articoli