AI Economy

Tokeny AI mają teraz godziny szczytu

DeepSeek wyda V4 w połowie lipca z pierwszym taryfowaniem godzinowym API AI: podwójne stawki w chińskich godzinach pracy. Dlaczego tokeny stają się medium jak prąd, a Europa zyskuje przewagę zegara.

AI EconomyAutor Servola Tech Desk2026-07-043 min czytania

Wspomagane przez AI, redagowane przez ludzi. Editorial standards

Najważniejsze punkty

30 czerwca 2026 roku DeepSeek zapowiedział oficjalne wydanie V4 na połowę lipca, wprowadzając pierwsze taryfowanie godzinowe w dużym API AI: użycie w dziennych oknach szczytu od 9:00 do 12:00 i od 14:00 do 18:00 jest rozliczane podwójnie względem stawki poza szczytem.
V4 przychodzi z oknem kontekstu 1 miliona tokenów w standardzie całej linii, na czele z V4-Pro, modelem mixture-of-experts o 1,6 biliona parametrów i 49 miliardach aktywnych, obok lżejszego V4-Flash; starsze endpointy deepseek-chat i deepseek-reasoner znikają po 24 lipca.
Taryfy godzinowe importują do AI ekonomię sieci energetycznej: to przyznanie, że moc inferencyjna jest skończona i że cenę ustala teraz popyt, a nie samo zużycie.
Europejscy nabywcy zyskują dosłowną przewagę zegara: raportowane okna szczytu przypadają na wczesny ranek i przedpołudnie w Europie Środkowej, zostawiając całe europejskie popołudnie i wieczór poza szczytem.

Co ogłosił DeepSeek

30 czerwca 2026 roku DeepSeek poinformował, że oficjalna wersja V4 ukaże się w połowie lipca, zastępując dostępną od 24 kwietnia wersję zapoznawczą, jak donosi TechNode. Główna nowość to nie benchmark, lecz mechanizm cenowy: po raz pierwszy w dużym API AI tokeny będą kosztować różnie w zależności od pory dnia, ze stawkami podwajanymi w dziennych oknach od 9:00 do 12:00 i od 14:00 do 18:00, czyli w chińskich godzinach pracy, przy niezmienionej stawce poza szczytem.

Same modele są poważne: okno kontekstu 1 miliona tokenów staje się standardem całej linii, V4-Pro to konstrukcja mixture-of-experts o 1,6 biliona parametrów i 49 miliardach aktywnych, a V4-Flash to model o 284 miliardach parametrów i 13 miliardach aktywnych. Dokumentacja DeepSeek dodaje twardy termin: starsze endpointy deepseek-chat i deepseek-reasoner przestają działać po 24 lipca, więc istniejące integracje muszą migrować, czy nowy licznik im się podoba, czy nie.

Dlaczego laboratorium modeli wycenia jak elektrownia

Taryfy godzinowe istnieją w jednym typie rynku: stała moc, wahający się popyt. Sieci energetyczne je wymyśliły, bo magazynowanie było drogie, a szczyt popytu wyznaczał rozmiar całego systemu. To, że laboratorium AI sięga teraz po to samo narzędzie, jest przyznaniem wartym więcej niż każda prezentacja: moc inferencyjna jest skończona, procesory GPU nie ustawiają się grzecznie w kolejce, a krańcowy token o 10:30 we wtorek kosztuje operatora więcej niż ten sam token o północy.

To łamie też wygodne założenie. Branża od dwóch lat powtarza, że inteligencja tanieje co kwartał. W przeliczeniu na token to wciąż prawda. Ale nowy mechanizm oznacza, że cena tego samego zapytania nie jest już stałą, a kto planował płaskie koszty jednostkowe, ma teraz mały problem z handlu energią. Gdy jeden dostawca pokaże, że klienci akceptują ceny szczytowe, wszyscy inni mają pełną motywację, by pójść w jego ślady.

Europejska przewaga zegara

Dla europejskich nabywców geografia okien szczytu jest niezwykle łaskawa. Raportowane godziny szczytu wypadają między 3:00 a 6:00 oraz między 8:00 a 12:00 czasu środkowoeuropejskiego letniego, tego samego co w Warszawie. Od południa całe robocze popołudnie i wieczór biegną poza szczytem. Europejska firma korzystająca z DeepSeek płaci obniżoną stawkę przez większość swojego dnia pracy, podczas gdy chiński konkurent płaci podwójnie w trakcie swojego.

Praktyczny ruch jest architektoniczny, nie kontraktowy: oddzielić wywołania krytyczne dla opóźnień od tych, które mogą poczekać. Nocne przetwarzanie wsadowe, embeddingi, reindeksację, ewaluacje i raporty można zaplanować w oknach poza szczytem za pomocą kolejki i wpisu w cronie. Tę dyscyplinę warto zbudować, nawet jeśli nigdy nie użyjecie DeepSeek, bo taryfy godzinowe zostały właśnie zademonstrowane, a wersja waszego dostawcy jest o jedno spotkanie produktowe stąd.

Co zrobić przed połową lipca

Trzy działania mieszczą się w dwóch tygodniach przed premierą. Po pierwsze: kto korzysta z wygaszanych endpointów deepseek-chat lub deepseek-reasoner, potrzebuje planu migracji przed 24 lipca, przetestowanego, a nie tylko zaplanowanego. Po drugie: zespoły używające jakiegokolwiek rozliczanego API AI powinny już teraz oznaczyć swoje obciążenia jako odraczalne lub interaktywne, by planowanie było później tylko zmianą konfiguracji. Po trzecie: właściciel budżetu AI powinien zamodelować wydatki przy cenie dwustrefowej i zadać każdemu dostawcy jedno pytanie przy odnowieniu: czy zobowiązuje się pan do cen niezależnych od pory dnia na czas umowy, czy nie. Odpowiedź, tak czy inaczej, jest informacją.

Czytaj dalej: Nvidia pobiera już czynsz od własnych chipów · OpenAI oferuje Waszyngtonowi udziały

Często zadawane pytania

Kiedy DeepSeek V4 wychodzi oficjalnie i co się zmienia?

DeepSeek ogłosił 30 czerwca, że oficjalna wersja V4 pojawi się w połowie lipca 2026 roku, z oknem kontekstu 1 miliona tokenów w standardzie i cenami szczytowymi w API: podwójne stawki w dziennych oknach od 9:00 do 12:00 i od 14:00 do 18:00, w chińskich godzinach pracy.

Co stanie się z istniejącymi endpointami DeepSeek?

Według dokumentacji DeepSeek starsze endpointy deepseek-chat i deepseek-reasoner przestają być dostępne po 24 lipca 2026 roku, więc zbudowane na nich integracje muszą migrować do linii V4.

Jak europejskie firmy powinny zareagować na ceny szczytowe AI?

Wykorzystać różnicę stref: raportowane szczyty kończą się około południa czasu środkowoeuropejskiego. Odraczalne obciążenia, jak wsady i embeddingi, planować na europejskie popołudnie i noc, a każdego dostawcę AI pytać, czy ceny pozostaną umownie niezależne od pory dnia.

Każda infrastruktura, która się liczy, prędzej czy później dostaje ceny godzin szczytu: drogi, prąd, a teraz inteligencja. Dostawcy mówią wam najprostszym językiem, jaki zna handel, że moc obliczeniowa jest rzadka, a cenę ustala popyt. Firmy, które zaprojektują się pod ten fakt już teraz, z kolejkami, harmonogramami i poziomami obciążeń, będą traktować dopłatę tak, jak fabryka traktuje nocną taryfę: jako cudzy koszt.

DeepSeek AI Pricing API Inference Cloud Costs AI Economy

Więcej z Servola Journal

AI Economy

Nvidia pobiera już czynsz od własnych chipów

1 lipca 2026 r. Nvidia ujawniła podział przychodów i wsparcie kredytowe dla chmur AI: sprzedaje GPU i zatrzymuje część czynszu. Co to oznacza dla ceny mocy obliczeniowej.

3 min czytania

AI Economy

OpenAI oferuje Waszyngtonowi udziały

Sam Altman proponuje przekazanie około 5 procent OpenAI, mniej więcej 42,6 miliarda dolarów, amerykańskiemu funduszowi państwowemu. Co państwowy akcjonariusz oznacza dla europejskich firm.

3 min czytania

AI Economy

Europa buduje robota, Ameryka płaci

NEURA Robotics pozyskała do 1,4 miliarda dolarów 10 czerwca 2026, a robotyka stała się najlepiej finansowanym sektorem Europy. Dlaczego pieniądze poszły w ucieleśnioną AI i co to oznacza dla właścicieli.

3 min czytania1 wyświetlenia

Servola

Servola pomaga właścicielom budować architektury kosztów AI, które przetrwają zmiany cen dostawców, zamiast je wchłaniać.

Poproś o poufną rozmowę O Servoli →

Servola to doradztwo technologiczne dla niewielkiej liczby rodzin i family offices. Gdy decyzji nie można delegować, siadamy po Twojej stronie stołu.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Wszystkie artykuły