Cosa ha rilasciato davvero DeepSeek con V4?

DeepSeek ha rilasciato V4 il 24 aprile 2026 come modelli a pesi aperti con licenza MIT, in due dimensioni chiamate V4-Pro e V4-Flash. I pesi aperti contano più del marketing open-source: i pesi sono pubblicati su Hugging Face, quindi un'azienda può eseguire il modello sulle proprie macchine, metterlo a punto sui propri dati e servirlo ai propri utenti senza un rapporto a token con DeepSeek. Il modello di punta V4-Pro è un mixture-of-experts da 1.600 miliardi di parametri con circa 49 miliardi di parametri attivi per token, e nei benchmark agentici, secondo quanto riportato, si colloca al pari di sistemi chiusi di frontiera come GPT-5.5 e Claude Opus 4.7. È la linea che gli stessi rilasci V3 e R1 di DeepSeek hanno superato per primi tra la fine del 2024 e l'inizio del 2025. La capacità di livello di frontiera non è più qualcosa che solo pochi fornitori possono affittarti.

Se il modello è gratuito da possedere, perché quasi tutti lo affittano?

Perché affittare nasconde il lavoro vero, e il lavoro vero è costoso in modi che una tabella di prezzo per milione di token non mostra mai. Le stime del settore collocano ancora la stragrande maggioranza della spesa enterprise in API del 2026 presso una manciata di fornitori chiusi, e i modelli a pesi aperti solo presso una piccola minoranza, anche se ormai esistono pesi aperti credibili. La ragione non è l'ignoranza. Eseguire un modello di frontiera in casa significa GPU, uno stack di serving, aggiornamenti del modello, sicurezza e le persone che tengono in vita tutto questo. Le analisi dei costi del 2026 collocano il costo totale di proprietà reale a tre o cinque volte la sola voce hardware, una volta contati gli stipendi di ingegneria e la capacità inutilizzata. Per un team che spende qualche migliaio al mese per un'API, assumere un ingegnere dell'inferenza per risparmiare costa molto più di quanto faccia risparmiare. Affittare è spesso la risposta giusta. Ciò che costa soldi alle persone è affittare senza essersi mai posti la domanda.

Allora quando l'hosting in proprio è davvero la scelta migliore?

Quando la domanda smette di riguardare il prezzo e inizia a riguardare il controllo. Il punto di incrocio onesto in cui l'hosting in proprio batte l'economia delle API sul solo costo tende a collocarsi da qualche parte nell'intervallo tra cinquantamila e duecentomila dollari di spesa mensile in API, a seconda di quanto si usa effettivamente il modello. Le ragioni più durature non sono finanziarie. Se operi sotto il GDPR, un endpoint ospitato in proprio o privato può essere l'unica configurazione in cui i tuoi dati non lasciano mai un perimetro che controlli tu, a prescindere dal costo in quel trimestre. Se il modello è il cuore del tuo prodotto e non una comodità, possedere i pesi significa che un fornitore non può dismetterlo, riprezzarlo o negartelo a piacimento. Un family office o un'azienda guidata dal titolare vuole ciò che continuerà a controllare tra cinque anni, e questo raramente è la voce più economica sulla fattura di oggi.

Cosa dovrebbe fare un titolare prima della prossima fattura dell'IA?

Separa la domanda sulla capacità dalla domanda sulla proprietà, perché non sono la stessa decisione. Primo, decidi cosa è per te il modello: un servizio che consumi o un asset da cui dipendi. Un servizio puoi quasi sempre affittarlo. Un asset vale la pena possederlo. Secondo, pretendi un costo totale di proprietà reale, non un prezzo a token; se il tuo team ti mostra solo la voce dell'API, non ha fatto l'analisi. Terzo, tratta la residenza dei dati e la concentrazione dei fornitori come rischi a livello di consiglio di amministrazione, non come preferenze ingegneristiche, perché è lì che i pesi aperti come DeepSeek V4 cambiano ciò che è possibile e non solo ciò che è economico. Servola fornisce consulenza sull'infrastruttura IA e sulla decisione tra costruire e affittare, con un unico responsabile e senza agenda di fornitore.