Vad DeepSeek annonserade

Den 30 juni 2026 meddelade DeepSeek att den officiella versionen av V4 släpps i mitten av juli och ersätter förhandsversionen som funnits sedan den 24 april, enligt TechNode. Huvudnyheten är ingen benchmark. Det är en prismekanism: för första gången på ett stort AI-API kostar tokens olika beroende på tid på dygnet, med taxor som fördubblas i de dagliga fönstren 9:00 till 12:00 och 14:00 till 18:00, kinesisk kontorstid, medan lågtrafiktaxan är oförändrad.

Modellerna i sig är tunga: ett kontextfönster på 1 miljon tokens blir standard i hela serien, V4-Pro är en mixture-of-experts-konstruktion med 1,6 biljoner parametrar varav 49 miljarder aktiva, V4-Flash en modell på 284 miljarder med 13 miljarder aktiva. DeepSeeks dokumentation lägger till en hård deadline: de äldre endpointerna deepseek-chat och deepseek-reasoner blir otillgängliga efter den 24 juli, så befintliga integrationer måste migrera vare sig de gillar den nya mätaren eller inte.

Varför ett modellabb prissätter som ett kraftbolag

Tidsbaserade priser finns i en enda sorts marknad: fast kapacitet, svängande efterfrågan. Elnäten uppfann dem eftersom lagring var dyr och toppefterfrågan dimensionerade hela systemet. Att ett AI-labb nu tar till samma verktyg är ett erkännande värt mer än någon keynote: inferenskapacitet är ändlig, GPU:er köar inte artigt, och margintokenet klockan 10:30 en tisdag kostar operatören mer än samma token vid midnatt.

Det spräcker också ett bekvämt antagande. Branschen har i två år berättat att intelligens blir billigare varje kvartal. Per token stämmer det fortfarande. Men den nya mekanismen betyder att priset för samma förfrågan inte längre är en konstant, och den som budgeterat med platta styckkostnader äger nu ett litet energihandelsproblem. Så snart en leverantör visar att kunder accepterar toppriser har alla andra all anledning att följa efter.

Den europeiska klockfördelen

För europeiska köpare ligger toppfönstrens geografi ovanligt vänligt. De rapporterade topptimmarna infaller mellan 3:00 och 6:00 samt mellan 8:00 och 12:00 centraleuropeisk sommartid, Stockholms klocka. Från tolv på dagen rullar hela arbetseftermiddagen och kvällen i lågtrafik. Ett europeiskt företag som använder DeepSeek betalar den rabatterade taxan under större delen av sin arbetsdag, medan en kinesisk konkurrent betalar dubbelt under sin.

Det praktiska draget är arkitektoniskt, inte kontraktuellt: separera latenskritiska anrop från uppskjutbara. Nattliga batchkörningar, embeddings, omindexering, utvärderingar och rapporter kan schemaläggas i lågtrafikfönster med en kö och en cron-rad. Den disciplinen är värd att bygga även om ni aldrig använder DeepSeek, för tidsbaserade priser är nu demonstrerade, och er egen leverantörs version är ett produktmöte bort.

Vad som bör göras före mitten av juli

Tre åtgärder ryms i de två veckorna före lanseringen. För det första: den som kör de utgående endpointerna deepseek-chat eller deepseek-reasoner behöver en migrationsplan före den 24 juli, testad, inte bara planerad. För det andra: team som använder vilket uppmätt AI-API som helst bör märka sina arbetslaster som uppskjutbara eller interaktiva nu, så att schemaläggning senare bara är en konfigurationsändring. För det tredje: den som äger AI-budgeten bör modellera utgifterna under ett tvåtaxepris och ställa varje leverantör en fråga vid förnyelse: förbinder ni er till tidsoberoende priser under avtalstiden, eller inte. Svaret är i båda fallen information.