Co ogłosił DeepSeek

30 czerwca 2026 roku DeepSeek poinformował, że oficjalna wersja V4 ukaże się w połowie lipca, zastępując dostępną od 24 kwietnia wersję zapoznawczą, jak donosi TechNode. Główna nowość to nie benchmark, lecz mechanizm cenowy: po raz pierwszy w dużym API AI tokeny będą kosztować różnie w zależności od pory dnia, ze stawkami podwajanymi w dziennych oknach od 9:00 do 12:00 i od 14:00 do 18:00, czyli w chińskich godzinach pracy, przy niezmienionej stawce poza szczytem.

Same modele są poważne: okno kontekstu 1 miliona tokenów staje się standardem całej linii, V4-Pro to konstrukcja mixture-of-experts o 1,6 biliona parametrów i 49 miliardach aktywnych, a V4-Flash to model o 284 miliardach parametrów i 13 miliardach aktywnych. Dokumentacja DeepSeek dodaje twardy termin: starsze endpointy deepseek-chat i deepseek-reasoner przestają działać po 24 lipca, więc istniejące integracje muszą migrować, czy nowy licznik im się podoba, czy nie.

Dlaczego laboratorium modeli wycenia jak elektrownia

Taryfy godzinowe istnieją w jednym typie rynku: stała moc, wahający się popyt. Sieci energetyczne je wymyśliły, bo magazynowanie było drogie, a szczyt popytu wyznaczał rozmiar całego systemu. To, że laboratorium AI sięga teraz po to samo narzędzie, jest przyznaniem wartym więcej niż każda prezentacja: moc inferencyjna jest skończona, procesory GPU nie ustawiają się grzecznie w kolejce, a krańcowy token o 10:30 we wtorek kosztuje operatora więcej niż ten sam token o północy.

To łamie też wygodne założenie. Branża od dwóch lat powtarza, że inteligencja tanieje co kwartał. W przeliczeniu na token to wciąż prawda. Ale nowy mechanizm oznacza, że cena tego samego zapytania nie jest już stałą, a kto planował płaskie koszty jednostkowe, ma teraz mały problem z handlu energią. Gdy jeden dostawca pokaże, że klienci akceptują ceny szczytowe, wszyscy inni mają pełną motywację, by pójść w jego ślady.

Europejska przewaga zegara

Dla europejskich nabywców geografia okien szczytu jest niezwykle łaskawa. Raportowane godziny szczytu wypadają między 3:00 a 6:00 oraz między 8:00 a 12:00 czasu środkowoeuropejskiego letniego, tego samego co w Warszawie. Od południa całe robocze popołudnie i wieczór biegną poza szczytem. Europejska firma korzystająca z DeepSeek płaci obniżoną stawkę przez większość swojego dnia pracy, podczas gdy chiński konkurent płaci podwójnie w trakcie swojego.

Praktyczny ruch jest architektoniczny, nie kontraktowy: oddzielić wywołania krytyczne dla opóźnień od tych, które mogą poczekać. Nocne przetwarzanie wsadowe, embeddingi, reindeksację, ewaluacje i raporty można zaplanować w oknach poza szczytem za pomocą kolejki i wpisu w cronie. Tę dyscyplinę warto zbudować, nawet jeśli nigdy nie użyjecie DeepSeek, bo taryfy godzinowe zostały właśnie zademonstrowane, a wersja waszego dostawcy jest o jedno spotkanie produktowe stąd.

Co zrobić przed połową lipca

Trzy działania mieszczą się w dwóch tygodniach przed premierą. Po pierwsze: kto korzysta z wygaszanych endpointów deepseek-chat lub deepseek-reasoner, potrzebuje planu migracji przed 24 lipca, przetestowanego, a nie tylko zaplanowanego. Po drugie: zespoły używające jakiegokolwiek rozliczanego API AI powinny już teraz oznaczyć swoje obciążenia jako odraczalne lub interaktywne, by planowanie było później tylko zmianą konfiguracji. Po trzecie: właściciel budżetu AI powinien zamodelować wydatki przy cenie dwustrefowej i zadać każdemu dostawcy jedno pytanie przy odnowieniu: czy zobowiązuje się pan do cen niezależnych od pory dnia na czas umowy, czy nie. Odpowiedź, tak czy inaczej, jest informacją.