AI Economy

AI-tokens har nu rusningstid

DeepSeek släpper V4 i mitten av juli med de första tidsbaserade AI-API-priserna: dubbel taxa under kinesisk kontorstid. Varför tokens blir en nyttighet och Europa vinner en klockfördel.

AI EconomyAv Servola Tech Desk2026-07-043 min lästid

AI-assisterad, redigerad av människor. Editorial standards

Viktigaste punkterna

Den 30 juni 2026 annonserade DeepSeek den officiella lanseringen av V4 till mitten av juli, med de första tidsbaserade priserna på ett stort AI-API: användning i de dagliga toppfönstren 9:00 till 12:00 och 14:00 till 18:00 debiteras dubbelt mot lågtrafiktaxan.
V4 kommer med ett kontextfönster på 1 miljon tokens som standard i hela serien, anfört av V4-Pro, en mixture-of-experts-modell med 1,6 biljoner parametrar varav 49 miljarder aktiva, vid sidan av lättare V4-Flash; de äldre endpointerna deepseek-chat och deepseek-reasoner pensioneras efter den 24 juli.
Tidsbaserade priser importerar elnätets ekonomi till AI: ett erkännande att inferenskapacitet är ändlig och att efterfrågan, inte bara förbrukningen, nu sätter priset.
Europeiska köpare vinner en bokstavlig klockfördel: de rapporterade toppfönstren motsvarar tidig morgon och förmiddag i Centraleuropa, vilket lämnar hela den europeiska eftermiddagen och kvällen i lågtrafik.

Vad DeepSeek annonserade

Den 30 juni 2026 meddelade DeepSeek att den officiella versionen av V4 släpps i mitten av juli och ersätter förhandsversionen som funnits sedan den 24 april, enligt TechNode. Huvudnyheten är ingen benchmark. Det är en prismekanism: för första gången på ett stort AI-API kostar tokens olika beroende på tid på dygnet, med taxor som fördubblas i de dagliga fönstren 9:00 till 12:00 och 14:00 till 18:00, kinesisk kontorstid, medan lågtrafiktaxan är oförändrad.

Modellerna i sig är tunga: ett kontextfönster på 1 miljon tokens blir standard i hela serien, V4-Pro är en mixture-of-experts-konstruktion med 1,6 biljoner parametrar varav 49 miljarder aktiva, V4-Flash en modell på 284 miljarder med 13 miljarder aktiva. DeepSeeks dokumentation lägger till en hård deadline: de äldre endpointerna deepseek-chat och deepseek-reasoner blir otillgängliga efter den 24 juli, så befintliga integrationer måste migrera vare sig de gillar den nya mätaren eller inte.

Varför ett modellabb prissätter som ett kraftbolag

Tidsbaserade priser finns i en enda sorts marknad: fast kapacitet, svängande efterfrågan. Elnäten uppfann dem eftersom lagring var dyr och toppefterfrågan dimensionerade hela systemet. Att ett AI-labb nu tar till samma verktyg är ett erkännande värt mer än någon keynote: inferenskapacitet är ändlig, GPU:er köar inte artigt, och margintokenet klockan 10:30 en tisdag kostar operatören mer än samma token vid midnatt.

Det spräcker också ett bekvämt antagande. Branschen har i två år berättat att intelligens blir billigare varje kvartal. Per token stämmer det fortfarande. Men den nya mekanismen betyder att priset för samma förfrågan inte längre är en konstant, och den som budgeterat med platta styckkostnader äger nu ett litet energihandelsproblem. Så snart en leverantör visar att kunder accepterar toppriser har alla andra all anledning att följa efter.

Den europeiska klockfördelen

För europeiska köpare ligger toppfönstrens geografi ovanligt vänligt. De rapporterade topptimmarna infaller mellan 3:00 och 6:00 samt mellan 8:00 och 12:00 centraleuropeisk sommartid, Stockholms klocka. Från tolv på dagen rullar hela arbetseftermiddagen och kvällen i lågtrafik. Ett europeiskt företag som använder DeepSeek betalar den rabatterade taxan under större delen av sin arbetsdag, medan en kinesisk konkurrent betalar dubbelt under sin.

Det praktiska draget är arkitektoniskt, inte kontraktuellt: separera latenskritiska anrop från uppskjutbara. Nattliga batchkörningar, embeddings, omindexering, utvärderingar och rapporter kan schemaläggas i lågtrafikfönster med en kö och en cron-rad. Den disciplinen är värd att bygga även om ni aldrig använder DeepSeek, för tidsbaserade priser är nu demonstrerade, och er egen leverantörs version är ett produktmöte bort.

Vad som bör göras före mitten av juli

Tre åtgärder ryms i de två veckorna före lanseringen. För det första: den som kör de utgående endpointerna deepseek-chat eller deepseek-reasoner behöver en migrationsplan före den 24 juli, testad, inte bara planerad. För det andra: team som använder vilket uppmätt AI-API som helst bör märka sina arbetslaster som uppskjutbara eller interaktiva nu, så att schemaläggning senare bara är en konfigurationsändring. För det tredje: den som äger AI-budgeten bör modellera utgifterna under ett tvåtaxepris och ställa varje leverantör en fråga vid förnyelse: förbinder ni er till tidsoberoende priser under avtalstiden, eller inte. Svaret är i båda fallen information.

Läs vidare: Nvidia tar nu ut hyra på sina egna chip · OpenAI erbjuder Washington en andel

Vanliga frågor

När släpps DeepSeek V4 officiellt och vad ändras?

DeepSeek annonserade den 30 juni att den officiella V4-versionen kommer i mitten av juli 2026, med kontextfönster på 1 miljon tokens som standard och topptidspriser på API:et: dubbel taxa i de dagliga fönstren 9:00 till 12:00 och 14:00 till 18:00, kinesisk kontorstid.

Vad händer med de befintliga DeepSeek-endpointerna?

Enligt DeepSeeks dokumentation blir de äldre endpointerna deepseek-chat och deepseek-reasoner otillgängliga efter den 24 juli 2026, så integrationer byggda på dem måste migrera till V4-serien.

Hur bör europeiska företag svara på topptidspriser för AI?

Utnyttja tidsskillnaden: de rapporterade topparna slutar runt tolv centraleuropeisk tid. Schemalägg uppskjutbara laster som batch och embeddings till den europeiska eftermiddagen och natten, och fråga varje AI-leverantör om priserna förblir tidsoberoende i avtalet.

Varje infrastruktur som betyder något får till slut rusningstidspriser: vägar, el och nu intelligens. Leverantörerna berättar, på det tydligaste språk handeln känner, att beräkningskraft är knapp och att efterfrågan sätter priset. Företag som bygger för det faktumet nu, med köer, scheman och lastnivåer, kommer att behandla tillägget som en fabrik behandlar natt-taxan: som någon annans kostnad.

DeepSeek AI Pricing API Inference Cloud Costs AI Economy

Mer från Servola Journal

AI Economy

Nvidia tar nu ut hyra på sina egna chip

Den 1 juli 2026 presenterade Nvidia intäktsdelning och kreditstöd för AI-moln: bolaget säljer GPU:erna och behåller en andel av hyran. Vad det betyder för priset på beräkningskraft.

3 min lästid

AI Economy

OpenAI erbjuder Washington en andel

Sam Altman föreslår att omkring 5 procent av OpenAI, cirka 42,6 miljarder dollar, överlåts till en amerikansk statsfond. Vad en statlig aktieägare betyder för europeiska företag.

3 min lästid

AI Economy

Europa bygger roboten, USA betalar

NEURA Robotics reste upp till 1,4 miljarder dollar den 10 juni 2026 och robotik blev Europas mest finansierade sektor. Varför pengarna gick till förkroppsligad AI och vad det betyder för ägare.

3 min lästid1 visningar

Servola

Servola hjälper ägare att bygga AI-kostnadsarkitekturer som överlever leverantörernas prisändringar i stället för att absorbera dem.

Begär en konfidentiell introduktion Om Servola →

Servola är teknologisk rådgivning för ett litet antal familjer och family offices. När ett beslut inte kan delegeras sitter vi på din sida av bordet.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alla artiklar