Infrastructure

DeepSeek V4 is gratis te bezitten. De meeste bedrijven huren het toch per token.

DeepSeek V4 heeft open gewichten en is van topniveau. Waarom huren de meeste bedrijven intelligentie dan nog per token? Het echte antwoord is governance, niet de prijs.

Door Leon Soliman · 2026-06-20 · 3 min leestijd

Belangrijkste punten

DeepSeek bracht V4 uit op 24 april 2026 als open-weight modellen onder de MIT-licentie, wat betekent dat de gewichten kunnen worden gedownload, op eigen hardware kunnen draaien en kunnen worden bijgesteld zonder contract per token.
DeepSeeks vlaggenschip V4-Pro is een mixture-of-experts-model met 1,6 biljoen parameters dat op agentische benchmarks naar verluidt op gelijke hoogte scoort met gesloten topsystemen zoals GPT-5.5 en Claude Opus 4.7.
Ondanks geloofwaardige open-weight opties nemen in 2026 een handvol gesloten leveranciers nog steeds het grootste deel van de zakelijke API-uitgaven voor hun rekening, met open-weight modellen als kleine minderheid, volgens schattingen uit de sector.
Zelf hosten is niet automatisch goedkoper: kostenanalyses uit 2026 zetten de echte total cost of ownership op drie tot vijf keer de kale GPU-post zodra je ingenieurs, updates en ongebruikte capaciteit meetelt.
Voor eigenaren is de beslissing er een van governance, niet van prijs. Datalocatie onder de AVG kan een zelfgehoste of private endpoint tot de enige conforme optie maken, ongeacht welke goedkoper is.

Wat heeft DeepSeek met V4 eigenlijk uitgebracht?

DeepSeek bracht V4 uit op 24 april 2026 als open-weight modellen onder de MIT-licentie, in twee maten genaamd V4-Pro en V4-Flash. Open gewichten tellen zwaarder dan open-source marketing: de gewichten staan gepubliceerd op Hugging Face, dus een bedrijf kan het model op eigen machines draaien, het bijstellen op eigen data en het aanbieden aan eigen gebruikers zonder een relatie per token met DeepSeek. Het vlaggenschip V4-Pro is een mixture-of-experts-model met 1,6 biljoen parameters waarvan ongeveer 49 miljard parameters actief zijn per token, en op agentische benchmarks belandt het naar verluidt op gelijke hoogte met gesloten topsystemen zoals GPT-5.5 en Claude Opus 4.7. Dit is de grens die DeepSeeks eigen V3- en R1-releases als eerste overschreden eind 2024 en begin 2025. Capaciteit van topniveau is niet langer iets dat slechts enkele leveranciers je kunnen verhuren.

Als het model gratis te bezitten is, waarom huurt bijna iedereen het dan?

Omdat huren het echte werk verbergt, en het echte werk is duur op manieren die een tabel met prijs per miljoen tokens nooit laat zien. Schattingen uit de sector leggen het overgrote deel van de zakelijke API-uitgaven van 2026 nog steeds bij een handvol gesloten leveranciers, en open-weight modellen bij slechts een kleine minderheid, ook al bestaan er inmiddels geloofwaardige open gewichten. De reden is geen onwetendheid. Een topmodel in eigen huis draaien betekent GPU's, een serving-stack, modelupdates, beveiliging en de mensen die dat alles in leven houden. Kostenanalyses uit 2026 zetten de echte total cost of ownership op drie tot vijf keer de kale hardwarepost zodra je ingenieurssalarissen en ongebruikte capaciteit meerekent. Voor een team dat een paar duizend per maand aan een API uitgeeft, kost het aannemen van een inferentie-ingenieur om te besparen veel meer dan het bespaart. Huren is vaak het juiste antwoord. Wat mensen geld kost, is huren zonder de vraag ooit gesteld te hebben.

Wanneer is zelf hosten dan echt de betere keuze?

Wanneer de vraag niet langer over prijs gaat en over controle begint te gaan. Het eerlijke omslagpunt waarop zelf hosten de API-economie op kosten alleen verslaat, ligt doorgaans ergens in het bereik van vijftigduizend tot tweehonderdduizend dollar aan maandelijkse API-uitgaven, afhankelijk van hoeveel je het model daadwerkelijk gebruikt. De duurzamere redenen zijn niet financieel. Als je onder de AVG opereert, kan een zelfgehoste of private endpoint de enige configuratie zijn waarbij je data nooit een perimeter verlaten die jij beheert, ongeacht de kosten dat kwartaal. Als het model de kern van je product is in plaats van een gemak, betekent het bezitten van de gewichten dat een leverancier het niet naar believen kan uitfaseren, herprijzen of weigeren. Een family office of een eigenaargeleid bedrijf wil datgene wat het over vijf jaar nog beheert, en dat is zelden de goedkoopste regel op de factuur van vandaag.

Wat moet een eigenaar doen voor de volgende AI-factuur?

Scheid de vraag over capaciteit van de vraag over eigendom, want het is niet dezelfde beslissing. Beslis ten eerste wat het model voor je is: een nutsvoorziening die je verbruikt, of een bezit waarvan je afhankelijk bent. Een nutsvoorziening kun je bijna altijd huren. Een bezit is het waard om te bezitten. Eis ten tweede een echte total cost of ownership, geen tokenprijs; als je team je alleen de API-regel laat zien, heeft het de analyse niet gedaan. Behandel ten derde datalocatie en leverancierconcentratie als risico's op bestuursniveau, niet als technische voorkeuren, want daar veranderen open gewichten zoals DeepSeek V4 wat mogelijk is in plaats van alleen wat goedkoop is. Servola adviseert over AI-infrastructuur en de keuze tussen bouwen en huren, met een enkele verantwoordelijke en zonder leveranciersagenda.

Lees hierna: Alphabet haalt 80 miljard dollar op voor AI. Dat is uw signaal om te stoppen met concurreren op infrastructuur. · Nvidia financiert de labs die zijn chips kopen. Betaalt de AI-boom zichzelf?

Veelgestelde vragen

Is DeepSeek V4 echt gratis voor commercieel gebruik?

De gewichten worden uitgebracht onder de MIT-licentie, die commercieel gebruik, zelf hosten en bijstellen toestaat. Gratis te bezitten betekent niet gratis te draaien; je betaalt nog steeds voor de hardware, de techniek en de operationele last om het zelf aan te bieden.

Is het zelf hosten van een open-weight model altijd goedkoper dan een gesloten API?

Nee. Kostenanalyses uit 2026 zetten de echte total cost of ownership op ongeveer drie tot vijf keer de kale GPU-uitgaven zodra ingenieurs, modelupdates en ongebruikte capaciteit zijn meegeteld. Onder een betekenisvolle gebruiksdrempel is een gesloten API meestal de goedkopere en eenvoudigere keuze.

Waarom zou een gereguleerd of eigenaargeleid bedrijf überhaupt zelf hosten?

Vooral voor controle, niet voor kosten. Datalocatie onder de AVG kan een zelfgehoste of private endpoint tot de enige conforme optie maken, en het bezitten van de gewichten neemt het risico weg dat een leverancier een model waarvan je bedrijf afhankelijk is, herprijst, uitfaseert of beperkt.

DeepSeek V4 maakte topintelligentie niet goedkoper om te huren. Het maakte haar mogelijk om te bezitten. De meeste bedrijven die in 2027 nog per token betalen, zijn degene die nooit stilstonden bij de vraag wat ze eigenlijk nodig hadden.

AI Infrastructure Open Weights DeepSeek Self-Hosting Governance

Meer uit het Servola Journal

Infrastructure

Alphabet haalt 80 miljard dollar op voor AI. Dat is uw signaal om te stoppen met concurreren op infrastructuur.

2026-06-21 · 2 min leestijd

Lees het artikel →

Infrastructure

Nvidia financiert de labs die zijn chips kopen. Betaalt de AI-boom zichzelf?

2026-06-19 · 3 min leestijd

Lees het artikel →

Infrastructure

De eerste serieuze uitdaging voor Nvidia is geen betere GPU. Het is de inferentielaag.

2026-06-19 · 3 min leestijd

Lees het artikel →

Servola

Als je afweegt of je je AI moet bezitten of huren, is dat precies waarover wij adviseren, discreet en met een enkele verantwoordelijke.

Vraag een vertrouwelijk gesprek aan Over Servola →

Servola is technologisch advies voor een klein aantal families en family offices. Wanneer een beslissing niet kan worden gedelegeerd, zitten wij aan uw kant van de tafel.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alle artikelen