Wat DeepSeek aankondigde

Op 30 juni 2026 meldde DeepSeek dat de officiële versie van V4 medio juli verschijnt en daarmee de sinds 24 april beschikbare preview aflost, zo bericht TechNode. Het belangrijkste nieuws is geen benchmark. Het is een prijsmechanisme: voor het eerst op een grote AI-API kosten tokens op verschillende tijden verschillend veel, met tarieven die verdubbelen in de dagelijkse vensters van 9:00 tot 12:00 en 14:00 tot 18:00 uur, de Chinese kantooruren, terwijl het daltarief gelijk blijft.

De modellen zelf zijn stevig: een contextvenster van 1 miljoen tokens wordt standaard in de hele reeks, V4-Pro is een mixture-of-experts-ontwerp met 1,6 biljoen parameters waarvan 49 miljard actief, V4-Flash een model van 284 miljard met 13 miljard actief. De documentatie van DeepSeek voegt een harde deadline toe: de oudere endpoints deepseek-chat en deepseek-reasoner zijn na 24 juli onbereikbaar, dus bestaande integraties moeten migreren, of de nieuwe meter ze nu bevalt of niet.

Waarom een modellab prijst als een energiebedrijf

Tijdsafhankelijke prijzen bestaan in precies één soort markt: vaste capaciteit, schommelende vraag. Stroomnetten vonden ze uit omdat opslag duur was en de piekvraag de omvang van het hele systeem bepaalde. Dat een AI-lab nu naar hetzelfde gereedschap grijpt, is een erkenning die meer waard is dan welke keynote ook: inferentiecapaciteit is eindig, GPU's sluiten niet beleefd aan in de rij, en het marginale token om 10:30 op een dinsdag kost de exploitant meer dan hetzelfde token om middernacht.

Het breekt ook een comfortabele aanname. De sector vertelt al twee jaar dat intelligentie elk kwartaal goedkoper wordt. Per token blijft dat waar. Maar het nieuwe mechanisme betekent dat de prijs van hetzelfde verzoek geen constante meer is, en wie op vlakke stukskosten begrootte, bezit nu een klein energiehandelsprobleem. Zodra één leverancier laat zien dat klanten piekprijzen accepteren, heeft elke andere alle reden om te volgen.

Het Europese klokvoordeel

Voor Europese kopers ligt de geografie van de piekvensters ongewoon gunstig. De gemelde piekuren vallen tussen 3:00 en 6:00 en tussen 8:00 en 12:00 uur Midden-Europese zomertijd, de klok van Amsterdam. Vanaf twaalf uur draait de hele werkmiddag en avond in het daltarief. Een Europees bedrijf dat DeepSeek gebruikt, betaalt het lage tarief voor het grootste deel van zijn werkdag, terwijl een Chinese concurrent tijdens de zijne het dubbele betaalt.

De praktische stap is architectonisch, niet contractueel: scheid latentiekritische aanroepen van uitstelbare. Nachtelijke batchruns, embeddings, herindexering, evaluaties en rapportages kunnen met een wachtrij en een cron-regel in dalvensters worden gepland. Die discipline is het bouwen waard, ook als u DeepSeek nooit gebruikt, want tijdsafhankelijke prijzen zijn nu gedemonstreerd, en de versie van uw eigen leverancier is één productoverleg verwijderd.

Wat te doen voor medio juli

Drie acties passen in de twee weken voor de release. Ten eerste: wie de verdwijnende endpoints deepseek-chat of deepseek-reasoner draait, heeft voor 24 juli een migratieplan nodig, getest, niet gepland. Ten tweede: teams die welke bemeten AI-API dan ook gebruiken, zouden hun workloads nu als uitstelbaar of interactief moeten labelen, zodat plannen later een configuratiewijziging is. Ten derde: wie het AI-budget beheert, zou de uitgaven onder een tweetarievenprijs moeten modelleren en elke leverancier bij verlenging één vraag stellen: verbindt u zich voor de looptijd aan tijdsonafhankelijke prijzen, of niet. Het antwoord is in beide gevallen informatie.