Hvad DeepSeek annoncerede
Den 30. juni 2026 meddelte DeepSeek, at den officielle version af V4 udkommer midt i juli og afløser den preview, der har været tilgængelig siden den 24. april, som TechNode rapporterer. Hovednyheden er ikke en benchmark. Det er en prismekanisme: for første gang på et stort AI-API koster tokens forskelligt afhængigt af tidspunktet, med takster der fordobles i de daglige vinduer 9:00 til 12:00 og 14:00 til 18:00, kinesisk arbejdstid, mens lavlasttaksten er uændret.
Modellerne selv er tunge: et kontekstvindue på 1 million tokens bliver standard i hele serien, V4-Pro er et mixture-of-experts-design med 1,6 billioner parametre og 49 milliarder aktive, V4-Flash en model på 284 milliarder med 13 milliarder aktive. DeepSeeks dokumentation tilføjer en hård frist: de ældre endpoints deepseek-chat og deepseek-reasoner bliver utilgængelige efter den 24. juli, så eksisterende integrationer skal migrere, uanset om de kan lide den nye måler.
Hvorfor et modellaboratorium prissætter som et elselskab
Tidsafhængige priser findes i én slags marked: fast kapacitet, svingende efterspørgsel. Elnettene opfandt dem, fordi lagring var dyr, og spidsbelastningen dimensionerede hele systemet. At et AI-laboratorium nu griber til samme værktøj, er en indrømmelse, der er mere værd end nogen keynote: inferenskapacitet er endelig, GPU'er stiller sig ikke pænt i kø, og margintokenet klokken 10:30 en tirsdag koster operatøren mere end det samme token ved midnat.
Det knuser også en bekvem antagelse. Branchen har i to år fortalt, at intelligens bliver billigere hvert kvartal. Per token er det stadig sandt. Men den nye mekanisme betyder, at prisen for den samme forespørgsel ikke længere er en konstant, og den, der budgetterede med flade enhedsomkostninger, ejer nu et lille energihandelsproblem. Så snart en leverandør viser, at kunder accepterer spidspriser, har alle andre al mulig grund til at følge efter.
Den europæiske urfordel
For europæiske købere ligger spidsvinduernes geografi usædvanligt venligt. De meldte spidstimer falder mellem 3:00 og 6:00 og mellem 8:00 og 12:00 centraleuropæisk sommertid, Københavns klokkeslæt. Fra middag kører hele arbejdseftermiddagen og aftenen i lavlast. En europæisk virksomhed, der bruger DeepSeek, betaler den nedsatte takst det meste af sin arbejdsdag, mens en kinesisk konkurrent betaler det dobbelte i sin.
Det praktiske træk er arkitektonisk, ikke kontraktligt: adskil latenskritiske kald fra dem, der kan vente. Natlige batchkørsler, embeddings, genindeksering, evalueringer og rapporter kan lægges i lavlastvinduer med en kø og en cron-linje. Den disciplin er værd at bygge, selv hvis I aldrig bruger DeepSeek, for tidsafhængige priser er nu demonstreret, og jeres egen leverandørs version er ét produktmøde væk.
Hvad man skal gøre inden midten af juli
Tre handlinger kan nås i de to uger før udgivelsen. For det første: enhver, der kører de udgående endpoints deepseek-chat eller deepseek-reasoner, skal have en migrationsplan inden den 24. juli, testet, ikke bare planlagt. For det andet: hold, der bruger et hvilket som helst målt AI-API, bør mærke deres arbejdsbyrder som udskydelige eller interaktive nu, så planlægning senere kun er en konfigurationsændring. For det tredje: den, der ejer AI-budgettet, bør modellere forbruget under en totakst-pris og stille hver leverandør ét spørgsmål ved fornyelse: forpligter I jer til tidsuafhængige priser i kontraktens løbetid, eller ej. Svaret er i begge tilfælde information.
Læs videre: Nvidia tjener nu husleje på sine egne chips · OpenAI tilbyder Washington en andel



