Infrastructure

DeepSeek V4 è gratuito da possedere. La maggior parte delle aziende lo affitterà comunque a token.

DeepSeek V4 è a pesi aperti e di livello di frontiera. Allora perché la maggior parte delle aziende affitta ancora l'intelligenza a token? La vera risposta è la governance, non il prezzo.

Di Leon Soliman · 2026-06-20 · 3 min di lettura

Punti chiave

DeepSeek ha rilasciato V4 il 24 aprile 2026 come modelli a pesi aperti con licenza MIT, il che significa che i pesi si possono scaricare, eseguire sul proprio hardware e mettere a punto senza un contratto a token.
Il modello di punta di DeepSeek, V4-Pro, è un mixture-of-experts da 1.600 miliardi di parametri che, nei benchmark agentici, secondo quanto riportato ottiene punteggi al pari di sistemi chiusi di frontiera come GPT-5.5 e Claude Opus 4.7.
Nonostante opzioni a pesi aperti credibili, nel 2026 una manciata di fornitori chiusi assorbe ancora la grande maggioranza della spesa enterprise in API, con i modelli a pesi aperti come piccola minoranza, secondo le stime del settore.
L'hosting in proprio non è automaticamente più economico: le analisi dei costi del 2026 collocano il costo totale di proprietà reale a tre o cinque volte la sola voce GPU, una volta contati ingegneri, aggiornamenti e capacità inutilizzata.
Per i titolari la decisione è di governance, non di prezzo. La residenza dei dati ai sensi del GDPR può rendere un endpoint ospitato in proprio o privato l'unica opzione conforme, a prescindere da quale costi meno.

Cosa ha rilasciato davvero DeepSeek con V4?

DeepSeek ha rilasciato V4 il 24 aprile 2026 come modelli a pesi aperti con licenza MIT, in due dimensioni chiamate V4-Pro e V4-Flash. I pesi aperti contano più del marketing open-source: i pesi sono pubblicati su Hugging Face, quindi un'azienda può eseguire il modello sulle proprie macchine, metterlo a punto sui propri dati e servirlo ai propri utenti senza un rapporto a token con DeepSeek. Il modello di punta V4-Pro è un mixture-of-experts da 1.600 miliardi di parametri con circa 49 miliardi di parametri attivi per token, e nei benchmark agentici, secondo quanto riportato, si colloca al pari di sistemi chiusi di frontiera come GPT-5.5 e Claude Opus 4.7. È la linea che gli stessi rilasci V3 e R1 di DeepSeek hanno superato per primi tra la fine del 2024 e l'inizio del 2025. La capacità di livello di frontiera non è più qualcosa che solo pochi fornitori possono affittarti.

Se il modello è gratuito da possedere, perché quasi tutti lo affittano?

Perché affittare nasconde il lavoro vero, e il lavoro vero è costoso in modi che una tabella di prezzo per milione di token non mostra mai. Le stime del settore collocano ancora la stragrande maggioranza della spesa enterprise in API del 2026 presso una manciata di fornitori chiusi, e i modelli a pesi aperti solo presso una piccola minoranza, anche se ormai esistono pesi aperti credibili. La ragione non è l'ignoranza. Eseguire un modello di frontiera in casa significa GPU, uno stack di serving, aggiornamenti del modello, sicurezza e le persone che tengono in vita tutto questo. Le analisi dei costi del 2026 collocano il costo totale di proprietà reale a tre o cinque volte la sola voce hardware, una volta contati gli stipendi di ingegneria e la capacità inutilizzata. Per un team che spende qualche migliaio al mese per un'API, assumere un ingegnere dell'inferenza per risparmiare costa molto più di quanto faccia risparmiare. Affittare è spesso la risposta giusta. Ciò che costa soldi alle persone è affittare senza essersi mai posti la domanda.

Allora quando l'hosting in proprio è davvero la scelta migliore?

Quando la domanda smette di riguardare il prezzo e inizia a riguardare il controllo. Il punto di incrocio onesto in cui l'hosting in proprio batte l'economia delle API sul solo costo tende a collocarsi da qualche parte nell'intervallo tra cinquantamila e duecentomila dollari di spesa mensile in API, a seconda di quanto si usa effettivamente il modello. Le ragioni più durature non sono finanziarie. Se operi sotto il GDPR, un endpoint ospitato in proprio o privato può essere l'unica configurazione in cui i tuoi dati non lasciano mai un perimetro che controlli tu, a prescindere dal costo in quel trimestre. Se il modello è il cuore del tuo prodotto e non una comodità, possedere i pesi significa che un fornitore non può dismetterlo, riprezzarlo o negartelo a piacimento. Un family office o un'azienda guidata dal titolare vuole ciò che continuerà a controllare tra cinque anni, e questo raramente è la voce più economica sulla fattura di oggi.

Cosa dovrebbe fare un titolare prima della prossima fattura dell'IA?

Separa la domanda sulla capacità dalla domanda sulla proprietà, perché non sono la stessa decisione. Primo, decidi cosa è per te il modello: un servizio che consumi o un asset da cui dipendi. Un servizio puoi quasi sempre affittarlo. Un asset vale la pena possederlo. Secondo, pretendi un costo totale di proprietà reale, non un prezzo a token; se il tuo team ti mostra solo la voce dell'API, non ha fatto l'analisi. Terzo, tratta la residenza dei dati e la concentrazione dei fornitori come rischi a livello di consiglio di amministrazione, non come preferenze ingegneristiche, perché è lì che i pesi aperti come DeepSeek V4 cambiano ciò che è possibile e non solo ciò che è economico. Servola fornisce consulenza sull'infrastruttura IA e sulla decisione tra costruire e affittare, con un unico responsabile e senza agenda di fornitore.

Da leggere ora: Alphabet raccoglie 80 miliardi di dollari per l'IA. È il vostro segnale per smettere di competere sull'infrastruttura. · Nvidia finanzia i laboratori che comprano i suoi chip. Il boom dell'IA si sta pagando da solo?

Domande frequenti

DeepSeek V4 è davvero gratuito per uso commerciale?

I pesi sono rilasciati con licenza MIT, che consente uso commerciale, hosting in proprio e messa a punto. Gratuito da possedere non significa gratuito da eseguire; paghi comunque l'hardware, l'ingegneria e l'onere operativo di servirlo da te.

Ospitare in proprio un modello a pesi aperti è sempre più economico di un'API chiusa?

No. Le analisi dei costi del 2026 collocano il costo totale di proprietà reale a circa tre o cinque volte la sola spesa in GPU, una volta inclusi ingegneri, aggiornamenti del modello e capacità inutilizzata. Al di sotto di una soglia di utilizzo significativa, un'API chiusa è di solito la scelta più economica e semplice.

Perché un'azienda regolamentata o guidata dal titolare dovrebbe mai ospitare in proprio?

Soprattutto per controllo, non per costo. La residenza dei dati ai sensi del GDPR può rendere un endpoint ospitato in proprio o privato l'unica opzione conforme, e possedere i pesi elimina il rischio che un fornitore riprezzi, dismetta o limiti un modello da cui dipende la tua attività.

DeepSeek V4 non ha reso più economica da affittare l'intelligenza di frontiera. L'ha resa possibile da possedere. La maggior parte delle aziende che nel 2027 pagheranno ancora a token saranno quelle che non si sono mai fermate a chiedersi quale servisse davvero.

AI Infrastructure Open Weights DeepSeek Self-Hosting Governance

Altro dal Servola Journal

Infrastructure

Alphabet raccoglie 80 miliardi di dollari per l'IA. È il vostro segnale per smettere di competere sull'infrastruttura.

2026-06-21 · 2 min di lettura

Leggi l'articolo →

Infrastructure

Nvidia finanzia i laboratori che comprano i suoi chip. Il boom dell'IA si sta pagando da solo?

2026-06-19 · 3 min di lettura

Leggi l'articolo →

Infrastructure

La prima sfida seria a Nvidia non è una GPU migliore. È il livello dell'inferenza.

2026-06-19 · 3 min di lettura

Leggi l'articolo →

Servola

Se stai valutando se possedere o affittare la tua IA, è esattamente ciò su cui forniamo consulenza, con discrezione e con un unico responsabile.

Richiedi un colloquio riservato Chi è Servola →

Servola è consulenza tecnologica per un numero ristretto di famiglie e family office. Quando una decisione non può essere delegata, sediamo dalla vostra parte del tavolo.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Tutti gli articoli