Wat heeft DeepSeek met V4 eigenlijk uitgebracht?
DeepSeek bracht V4 uit op 24 april 2026 als open-weight modellen onder de MIT-licentie, in twee maten genaamd V4-Pro en V4-Flash. Open gewichten tellen zwaarder dan open-source marketing: de gewichten staan gepubliceerd op Hugging Face, dus een bedrijf kan het model op eigen machines draaien, het bijstellen op eigen data en het aanbieden aan eigen gebruikers zonder een relatie per token met DeepSeek. Het vlaggenschip V4-Pro is een mixture-of-experts-model met 1,6 biljoen parameters waarvan ongeveer 49 miljard parameters actief zijn per token, en op agentische benchmarks belandt het naar verluidt op gelijke hoogte met gesloten topsystemen zoals GPT-5.5 en Claude Opus 4.7. Dit is de grens die DeepSeeks eigen V3- en R1-releases als eerste overschreden eind 2024 en begin 2025. Capaciteit van topniveau is niet langer iets dat slechts enkele leveranciers je kunnen verhuren.
Als het model gratis te bezitten is, waarom huurt bijna iedereen het dan?
Omdat huren het echte werk verbergt, en het echte werk is duur op manieren die een tabel met prijs per miljoen tokens nooit laat zien. Schattingen uit de sector leggen het overgrote deel van de zakelijke API-uitgaven van 2026 nog steeds bij een handvol gesloten leveranciers, en open-weight modellen bij slechts een kleine minderheid, ook al bestaan er inmiddels geloofwaardige open gewichten. De reden is geen onwetendheid. Een topmodel in eigen huis draaien betekent GPU's, een serving-stack, modelupdates, beveiliging en de mensen die dat alles in leven houden. Kostenanalyses uit 2026 zetten de echte total cost of ownership op drie tot vijf keer de kale hardwarepost zodra je ingenieurssalarissen en ongebruikte capaciteit meerekent. Voor een team dat een paar duizend per maand aan een API uitgeeft, kost het aannemen van een inferentie-ingenieur om te besparen veel meer dan het bespaart. Huren is vaak het juiste antwoord. Wat mensen geld kost, is huren zonder de vraag ooit gesteld te hebben.
Wanneer is zelf hosten dan echt de betere keuze?
Wanneer de vraag niet langer over prijs gaat en over controle begint te gaan. Het eerlijke omslagpunt waarop zelf hosten de API-economie op kosten alleen verslaat, ligt doorgaans ergens in het bereik van vijftigduizend tot tweehonderdduizend dollar aan maandelijkse API-uitgaven, afhankelijk van hoeveel je het model daadwerkelijk gebruikt. De duurzamere redenen zijn niet financieel. Als je onder de AVG opereert, kan een zelfgehoste of private endpoint de enige configuratie zijn waarbij je data nooit een perimeter verlaten die jij beheert, ongeacht de kosten dat kwartaal. Als het model de kern van je product is in plaats van een gemak, betekent het bezitten van de gewichten dat een leverancier het niet naar believen kan uitfaseren, herprijzen of weigeren. Een family office of een eigenaargeleid bedrijf wil datgene wat het over vijf jaar nog beheert, en dat is zelden de goedkoopste regel op de factuur van vandaag.
Wat moet een eigenaar doen voor de volgende AI-factuur?
Scheid de vraag over capaciteit van de vraag over eigendom, want het is niet dezelfde beslissing. Beslis ten eerste wat het model voor je is: een nutsvoorziening die je verbruikt, of een bezit waarvan je afhankelijk bent. Een nutsvoorziening kun je bijna altijd huren. Een bezit is het waard om te bezitten. Eis ten tweede een echte total cost of ownership, geen tokenprijs; als je team je alleen de API-regel laat zien, heeft het de analyse niet gedaan. Behandel ten derde datalocatie en leverancierconcentratie als risico's op bestuursniveau, niet als technische voorkeuren, want daar veranderen open gewichten zoals DeepSeek V4 wat mogelijk is in plaats van alleen wat goedkoop is. Servola adviseert over AI-infrastructuur en de keuze tussen bouwen en huren, met een enkele verantwoordelijke en zonder leveranciersagenda.
Lees hierna: Alphabet haalt 80 miljard dollar op voor AI. Dat is uw signaal om te stoppen met concurreren op infrastructuur. · Nvidia financiert de labs die zijn chips kopen. Betaalt de AI-boom zichzelf?