AI Economy

AI-tokens hebben nu een spitsuur

DeepSeek lanceert V4 medio juli met de eerste tijdsafhankelijke AI-API-prijzen: dubbele tarieven tijdens Chinese kantooruren. Waarom tokens een nutsvoorziening worden en Europa een klokvoordeel krijgt.

AI EconomyDoor Servola Tech Desk2026-07-043 min leestijd

AI-ondersteund, door mensen geredigeerd. Editorial standards

Belangrijkste punten

Op 30 juni 2026 kondigde DeepSeek de officiële release van V4 aan voor medio juli, met de eerste tijdsafhankelijke prijzen op een grote AI-API: gebruik in de dagelijkse piekvensters van 9:00 tot 12:00 en 14:00 tot 18:00 uur kost het dubbele van het daltarief.
V4 komt met een contextvenster van 1 miljoen tokens als standaard voor de hele reeks, aangevoerd door V4-Pro, een mixture-of-experts-model met 1,6 biljoen parameters waarvan 49 miljard actief, naast het lichtere V4-Flash; de oudere endpoints deepseek-chat en deepseek-reasoner verdwijnen na 24 juli.
Tijdsafhankelijke prijzen importeren de economie van het stroomnet in AI: een erkenning dat inferentiecapaciteit eindig is en dat de vraag, niet alleen het verbruik, nu de prijs bepaalt.
Europese kopers krijgen een letterlijk klokvoordeel: de gemelde piekvensters vallen in de vroege ochtend en de ochtend in Centraal-Europa, waardoor de hele Europese middag en avond in het daltarief lopen.

Wat DeepSeek aankondigde

Op 30 juni 2026 meldde DeepSeek dat de officiële versie van V4 medio juli verschijnt en daarmee de sinds 24 april beschikbare preview aflost, zo bericht TechNode. Het belangrijkste nieuws is geen benchmark. Het is een prijsmechanisme: voor het eerst op een grote AI-API kosten tokens op verschillende tijden verschillend veel, met tarieven die verdubbelen in de dagelijkse vensters van 9:00 tot 12:00 en 14:00 tot 18:00 uur, de Chinese kantooruren, terwijl het daltarief gelijk blijft.

De modellen zelf zijn stevig: een contextvenster van 1 miljoen tokens wordt standaard in de hele reeks, V4-Pro is een mixture-of-experts-ontwerp met 1,6 biljoen parameters waarvan 49 miljard actief, V4-Flash een model van 284 miljard met 13 miljard actief. De documentatie van DeepSeek voegt een harde deadline toe: de oudere endpoints deepseek-chat en deepseek-reasoner zijn na 24 juli onbereikbaar, dus bestaande integraties moeten migreren, of de nieuwe meter ze nu bevalt of niet.

Waarom een modellab prijst als een energiebedrijf

Tijdsafhankelijke prijzen bestaan in precies één soort markt: vaste capaciteit, schommelende vraag. Stroomnetten vonden ze uit omdat opslag duur was en de piekvraag de omvang van het hele systeem bepaalde. Dat een AI-lab nu naar hetzelfde gereedschap grijpt, is een erkenning die meer waard is dan welke keynote ook: inferentiecapaciteit is eindig, GPU's sluiten niet beleefd aan in de rij, en het marginale token om 10:30 op een dinsdag kost de exploitant meer dan hetzelfde token om middernacht.

Het breekt ook een comfortabele aanname. De sector vertelt al twee jaar dat intelligentie elk kwartaal goedkoper wordt. Per token blijft dat waar. Maar het nieuwe mechanisme betekent dat de prijs van hetzelfde verzoek geen constante meer is, en wie op vlakke stukskosten begrootte, bezit nu een klein energiehandelsprobleem. Zodra één leverancier laat zien dat klanten piekprijzen accepteren, heeft elke andere alle reden om te volgen.

Het Europese klokvoordeel

Voor Europese kopers ligt de geografie van de piekvensters ongewoon gunstig. De gemelde piekuren vallen tussen 3:00 en 6:00 en tussen 8:00 en 12:00 uur Midden-Europese zomertijd, de klok van Amsterdam. Vanaf twaalf uur draait de hele werkmiddag en avond in het daltarief. Een Europees bedrijf dat DeepSeek gebruikt, betaalt het lage tarief voor het grootste deel van zijn werkdag, terwijl een Chinese concurrent tijdens de zijne het dubbele betaalt.

De praktische stap is architectonisch, niet contractueel: scheid latentiekritische aanroepen van uitstelbare. Nachtelijke batchruns, embeddings, herindexering, evaluaties en rapportages kunnen met een wachtrij en een cron-regel in dalvensters worden gepland. Die discipline is het bouwen waard, ook als u DeepSeek nooit gebruikt, want tijdsafhankelijke prijzen zijn nu gedemonstreerd, en de versie van uw eigen leverancier is één productoverleg verwijderd.

Wat te doen voor medio juli

Drie acties passen in de twee weken voor de release. Ten eerste: wie de verdwijnende endpoints deepseek-chat of deepseek-reasoner draait, heeft voor 24 juli een migratieplan nodig, getest, niet gepland. Ten tweede: teams die welke bemeten AI-API dan ook gebruiken, zouden hun workloads nu als uitstelbaar of interactief moeten labelen, zodat plannen later een configuratiewijziging is. Ten derde: wie het AI-budget beheert, zou de uitgaven onder een tweetarievenprijs moeten modelleren en elke leverancier bij verlenging één vraag stellen: verbindt u zich voor de looptijd aan tijdsonafhankelijke prijzen, of niet. Het antwoord is in beide gevallen informatie.

Lees hierna: Nvidia vangt nu huur op zijn eigen chips · OpenAI biedt Washington een belang aan

Veelgestelde vragen

Wanneer verschijnt DeepSeek V4 officieel en wat verandert er?

DeepSeek kondigde op 30 juni aan dat de officiële V4-versie medio juli 2026 komt, met standaard een contextvenster van 1 miljoen tokens en piekprijzen op de API: dubbele tarieven in de dagelijkse vensters van 9:00 tot 12:00 en 14:00 tot 18:00 uur, Chinese kantoortijd.

Wat gebeurt er met de bestaande DeepSeek-endpoints?

Volgens de DeepSeek-documentatie zijn de oudere endpoints deepseek-chat en deepseek-reasoner na 24 juli 2026 onbereikbaar; integraties die erop gebouwd zijn moeten migreren naar de V4-reeks.

Hoe moeten Europese bedrijven reageren op piekuurprijzen voor AI?

Gebruik het tijdsverschil: de gemelde pieken eindigen rond het middaguur Midden-Europese tijd. Plan uitstelbare workloads zoals batchverwerking en embeddings in de Europese middag en nacht, en vraag elke AI-leverancier of de prijzen contractueel tijdsonafhankelijk blijven.

Elke infrastructuur die ertoe doet, krijgt uiteindelijk spitsuurprijzen: wegen, elektriciteit en nu intelligentie. De leveranciers vertellen u, in de duidelijkste taal die de handel kent, dat rekenkracht schaars is en de vraag de prijs bepaalt. Bedrijven die daar nu voor bouwen, met wachtrijen, schema's en workload-niveaus, behandelen de toeslag zoals een fabriek het nachttarief behandelt: als andermans kosten.

DeepSeek AI Pricing API Inference Cloud Costs AI Economy

Meer uit het Servola Journal

AI Economy

Nvidia vangt nu huur op zijn eigen chips

Op 1 juli 2026 onthulde Nvidia omzetdeling en kredietsteun voor AI-clouds: het verkoopt de GPU's en houdt een deel van de huur. Wat dat betekent voor de prijs van rekenkracht.

3 min leestijd

AI Economy

OpenAI biedt Washington een belang aan

Sam Altman stelt voor om circa 5 procent van OpenAI, zo'n 42,6 miljard dollar, over te dragen aan een Amerikaans staatsfonds. Wat een staatsaandeelhouder betekent voor Europese bedrijven.

3 min leestijd

AI Economy

Europa bouwt de robot, Amerika betaalt

NEURA Robotics haalde op 10 juni 2026 tot 1,4 miljard dollar op en robotica werd de best gefinancierde sector van Europa. Waarom het geld naar belichaamde AI ging en wat dat voor eigenaren betekent.

3 min leestijd1 weergaven

Servola

Servola helpt eigenaren AI-kostenarchitecturen te bouwen die prijswijzigingen van leveranciers overleven in plaats van ze te absorberen.

Vraag een vertrouwelijk gesprek aan Over Servola →

Servola is technologisch advies voor een klein aantal families en family offices. Wanneer een beslissing niet kan worden gedelegeerd, zitten wij aan uw kant van de tafel.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alle artikelen