AI Economy

AI-tokens har nu myldretid

DeepSeek udgiver V4 midt i juli med de første tidsafhængige AI-API-priser: dobbelt takst i kinesisk arbejdstid. Hvorfor tokens bliver en forsyning, og Europa vinder en urfordel.

AI EconomyAf Servola Tech Desk2026-07-043 min læsning

AI-assisteret, redigeret af mennesker. Editorial standards

Vigtigste punkter

Den 30. juni 2026 annoncerede DeepSeek den officielle udgivelse af V4 til midten af juli med de første tidsafhængige priser på et stort AI-API: forbrug i de daglige spidsvinduer 9:00 til 12:00 og 14:00 til 18:00 faktureres til det dobbelte af lavlasttaksten.
V4 kommer med et kontekstvindue på 1 million tokens som standard i hele serien, anført af V4-Pro, en mixture-of-experts-model med 1,6 billioner parametre og 49 milliarder aktive, ved siden af den lettere V4-Flash; de ældre endpoints deepseek-chat og deepseek-reasoner pensioneres efter den 24. juli.
Tidsafhængige priser importerer elnettets økonomi i AI: en indrømmelse af, at inferenskapacitet er endelig, og at efterspørgslen, ikke kun forbruget, nu sætter prisen.
Europæiske købere vinder en bogstavelig urfordel: de meldte spidsvinduer svarer til tidlig morgen og formiddag i Centraleuropa, så hele den europæiske eftermiddag og aften kører i lavlast.

Hvad DeepSeek annoncerede

Den 30. juni 2026 meddelte DeepSeek, at den officielle version af V4 udkommer midt i juli og afløser den preview, der har været tilgængelig siden den 24. april, som TechNode rapporterer. Hovednyheden er ikke en benchmark. Det er en prismekanisme: for første gang på et stort AI-API koster tokens forskelligt afhængigt af tidspunktet, med takster der fordobles i de daglige vinduer 9:00 til 12:00 og 14:00 til 18:00, kinesisk arbejdstid, mens lavlasttaksten er uændret.

Modellerne selv er tunge: et kontekstvindue på 1 million tokens bliver standard i hele serien, V4-Pro er et mixture-of-experts-design med 1,6 billioner parametre og 49 milliarder aktive, V4-Flash en model på 284 milliarder med 13 milliarder aktive. DeepSeeks dokumentation tilføjer en hård frist: de ældre endpoints deepseek-chat og deepseek-reasoner bliver utilgængelige efter den 24. juli, så eksisterende integrationer skal migrere, uanset om de kan lide den nye måler.

Hvorfor et modellaboratorium prissætter som et elselskab

Tidsafhængige priser findes i én slags marked: fast kapacitet, svingende efterspørgsel. Elnettene opfandt dem, fordi lagring var dyr, og spidsbelastningen dimensionerede hele systemet. At et AI-laboratorium nu griber til samme værktøj, er en indrømmelse, der er mere værd end nogen keynote: inferenskapacitet er endelig, GPU'er stiller sig ikke pænt i kø, og margintokenet klokken 10:30 en tirsdag koster operatøren mere end det samme token ved midnat.

Det knuser også en bekvem antagelse. Branchen har i to år fortalt, at intelligens bliver billigere hvert kvartal. Per token er det stadig sandt. Men den nye mekanisme betyder, at prisen for den samme forespørgsel ikke længere er en konstant, og den, der budgetterede med flade enhedsomkostninger, ejer nu et lille energihandelsproblem. Så snart en leverandør viser, at kunder accepterer spidspriser, har alle andre al mulig grund til at følge efter.

Den europæiske urfordel

For europæiske købere ligger spidsvinduernes geografi usædvanligt venligt. De meldte spidstimer falder mellem 3:00 og 6:00 og mellem 8:00 og 12:00 centraleuropæisk sommertid, Københavns klokkeslæt. Fra middag kører hele arbejdseftermiddagen og aftenen i lavlast. En europæisk virksomhed, der bruger DeepSeek, betaler den nedsatte takst det meste af sin arbejdsdag, mens en kinesisk konkurrent betaler det dobbelte i sin.

Det praktiske træk er arkitektonisk, ikke kontraktligt: adskil latenskritiske kald fra dem, der kan vente. Natlige batchkørsler, embeddings, genindeksering, evalueringer og rapporter kan lægges i lavlastvinduer med en kø og en cron-linje. Den disciplin er værd at bygge, selv hvis I aldrig bruger DeepSeek, for tidsafhængige priser er nu demonstreret, og jeres egen leverandørs version er ét produktmøde væk.

Hvad man skal gøre inden midten af juli

Tre handlinger kan nås i de to uger før udgivelsen. For det første: enhver, der kører de udgående endpoints deepseek-chat eller deepseek-reasoner, skal have en migrationsplan inden den 24. juli, testet, ikke bare planlagt. For det andet: hold, der bruger et hvilket som helst målt AI-API, bør mærke deres arbejdsbyrder som udskydelige eller interaktive nu, så planlægning senere kun er en konfigurationsændring. For det tredje: den, der ejer AI-budgettet, bør modellere forbruget under en totakst-pris og stille hver leverandør ét spørgsmål ved fornyelse: forpligter I jer til tidsuafhængige priser i kontraktens løbetid, eller ej. Svaret er i begge tilfælde information.

Læs videre: Nvidia tjener nu husleje på sine egne chips · OpenAI tilbyder Washington en andel

Ofte stillede spørgsmål

Hvornår udkommer DeepSeek V4 officielt, og hvad ændrer sig?

DeepSeek annoncerede den 30. juni, at den officielle V4-version kommer midt i juli 2026, med kontekstvindue på 1 million tokens som standard og spidspriser på API'et: dobbelt takst i de daglige vinduer 9:00 til 12:00 og 14:00 til 18:00, kinesisk arbejdstid.

Hvad sker der med de eksisterende DeepSeek-endpoints?

Ifølge DeepSeeks dokumentation bliver de ældre endpoints deepseek-chat og deepseek-reasoner utilgængelige efter den 24. juli 2026, så integrationer bygget på dem skal migrere til V4-serien.

Hvordan bør europæiske virksomheder reagere på spidspriser for AI?

Udnyt tidsforskellen: de meldte spidser slutter omkring middag centraleuropæisk tid. Planlæg udskydelige arbejdsbyrder som batch og embeddings til den europæiske eftermiddag og nat, og spørg hver AI-leverandør, om priserne forbliver tidsuafhængige i kontrakten.

Enhver infrastruktur, der betyder noget, ender med myldretidspriser: veje, elektricitet og nu intelligens. Leverandørerne fortæller jer, på det tydeligste sprog handlen kender, at regnekraft er knap, og at efterspørgslen sætter prisen. Virksomheder, der bygger efter det faktum nu, med køer, tidsplaner og arbejdsbyrde-niveauer, vil behandle tillægget, som en fabrik behandler natstrøm: som andres omkostning.

DeepSeek AI Pricing API Inference Cloud Costs AI Economy

Mere fra Servola Journal

AI Economy

Nvidia tjener nu husleje på sine egne chips

Den 1. juli 2026 afslørede Nvidia omsætningsdeling og kreditstøtte til AI-clouds: Det sælger GPU'erne og beholder en andel af huslejen. Hvad det betyder for prisen på regnekraft.

3 min læsning

AI Economy

OpenAI tilbyder Washington en andel

Sam Altman foreslår at overdrage omkring 5 procent af OpenAI, cirka 42,6 milliarder dollar, til en amerikansk statsfond. Hvad en statslig aktionær betyder for europæiske virksomheder.

3 min læsning

AI Economy

Europa bygger robotten, USA betaler

NEURA Robotics rejste op til 1,4 milliarder dollar den 10. juni 2026, og robotteknologi blev Europas mest finansierede sektor. Hvorfor pengene gik til legemliggjort AI, og hvad det betyder for ejere.

3 min læsning1 visninger

Servola

Servola hjælper ejere med at bygge AI-omkostningsarkitekturer, der overlever leverandørernes prisændringer i stedet for at absorbere dem.

Anmod om en fortrolig introduktion Om Servola →

Servola er teknologisk rådgivning for et lille antal familier og family offices. Når en beslutning ikke kan delegeres, sidder vi på din side af bordet.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alle artikler