Co tak naprawdę DeepSeek wydał wraz z V4?
DeepSeek wydał V4 24 kwietnia 2026 roku jako modele o otwartych wagach na licencji MIT, w dwóch rozmiarach o nazwach V4-Pro i V4-Flash. Otwarte wagi liczą się bardziej niż marketing open source: wagi są opublikowane na Hugging Face, więc firma może uruchomić model na własnych maszynach, dostroić go na własnych danych i udostępnić własnym użytkownikom bez relacji rozliczanej za token z DeepSeek. Flagowy V4-Pro to model mixture-of-experts o 1,6 biliona parametrów, z których około 49 miliardów jest aktywnych na token, a w testach agentowych podobno plasuje się na równi z zamkniętymi systemami klasy frontier, takimi jak GPT-5.5 i Claude Opus 4.7. To linia, którą własne wydania DeepSeek V3 i R1 przekroczyły jako pierwsze pod koniec 2024 i na początku 2025 roku. Możliwości klasy frontier nie są już czymś, co może wynająć ci jedynie kilku dostawców.
Skoro model można posiadać za darmo, dlaczego niemal każdy go wynajmuje?
Bo wynajem ukrywa prawdziwą pracę, a prawdziwa praca jest kosztowna w sposób, którego tabela ceny za milion tokenów nigdy nie pokazuje. Szacunki branżowe nadal lokują zdecydowaną większość korporacyjnych wydatków na API w 2026 roku u garstki zamkniętych dostawców, a modele o otwartych wagach jedynie u niewielkiej mniejszości, mimo że wiarygodne otwarte wagi już istnieją. Powodem nie jest niewiedza. Uruchomienie modelu klasy frontier we własnym zakresie oznacza GPU, stos serwujący, aktualizacje modelu, bezpieczeństwo i ludzi, którzy utrzymują to wszystko przy życiu. Analizy kosztów z 2026 roku szacują rzeczywisty całkowity koszt posiadania na trzy do pięciu razy samą pozycję sprzętową, gdy doliczy się pensje inżynierów i niewykorzystaną moc. Dla zespołu wydającego kilka tysięcy miesięcznie na API zatrudnienie inżyniera inferencji w celu oszczędności kosztuje znacznie więcej, niż oszczędza. Wynajem często jest właściwą odpowiedzią. To, co kosztuje ludzi pieniądze, to wynajem bez postawienia sobie tego pytania.
Kiedy więc samodzielny hosting jest naprawdę lepszym wyborem?
Gdy pytanie przestaje dotyczyć ceny, a zaczyna dotyczyć kontroli. Uczciwy punkt przecięcia, w którym samodzielny hosting wygrywa z ekonomią API pod względem samego kosztu, zwykle leży gdzieś w przedziale od pięćdziesięciu tysięcy do dwustu tysięcy dolarów miesięcznych wydatków na API, w zależności od tego, jak intensywnie faktycznie używasz modelu. Bardziej trwałe powody nie są finansowe. Jeśli działasz w ramach RODO, samodzielnie hostowany lub prywatny endpoint może być jedyną konfiguracją, w której twoje dane nigdy nie opuszczają perymetru, który kontrolujesz, niezależnie od kosztu w danym kwartale. Jeśli model jest rdzeniem twojego produktu, a nie udogodnieniem, posiadanie wag oznacza, że dostawca nie może go wycofać, zmienić ceny ani odmówić ci go wedle uznania. Family office lub firma kierowana przez właściciela chce tego, co nadal będzie kontrolować za pięć lat, a to rzadko jest najtańsza pozycja na dzisiejszej fakturze.
Co właściciel powinien zrobić przed kolejną fakturą za AI?
Oddziel pytanie o możliwości od pytania o własność, bo to nie ta sama decyzja. Po pierwsze, ustal, czym jest dla ciebie model: usługą, którą konsumujesz, czy aktywem, od którego zależysz. Usługę niemal zawsze możesz wynająć. Aktywo warto posiadać. Po drugie, żądaj rzeczywistego całkowitego kosztu posiadania, a nie ceny za token; jeśli twój zespół pokazuje ci tylko pozycję API, nie wykonał analizy. Po trzecie, traktuj lokalizację danych i koncentrację dostawców jako ryzyka na poziomie zarządu, a nie preferencje inżynierskie, bo to właśnie tam otwarte wagi takie jak DeepSeek V4 zmieniają to, co jest możliwe, a nie tylko to, co jest tanie. Servola doradza w zakresie infrastruktury AI oraz decyzji między budową a wynajmem, z jednym odpowiedzialnym właścicielem i bez agendy dostawcy.
Czytaj dalej: Alphabet pozyskuje 80 miliardów dolarów na AI. To Twój sygnał, by przestać konkurować w infrastrukturze. · Nvidia finansuje laboratoria, które kupują jej układy. Czy boom AI płaci sam za siebie?