Infrastructure

DeepSeek V4 można posiadać za darmo. Większość firm i tak będzie go wynajmować za token.

DeepSeek V4 ma otwarte wagi i jest klasy frontier. Dlaczego więc większość firm nadal wynajmuje inteligencję za token? Prawdziwa odpowiedź to nadzór korporacyjny, a nie cena.

Autor Leon Soliman · 2026-06-20 · 3 min czytania

Najważniejsze punkty

DeepSeek wydał V4 24 kwietnia 2026 roku jako modele o otwartych wagach na licencji MIT, co oznacza, że wagi można pobrać, uruchomić na własnym sprzęcie i dostroić bez umowy rozliczanej za token.
Flagowy V4-Pro firmy DeepSeek to model mixture-of-experts o 1,6 biliona parametrów, który w testach agentowych podobno uzyskuje wyniki na równi z zamkniętymi systemami klasy frontier, takimi jak GPT-5.5 i Claude Opus 4.7.
Mimo wiarygodnych opcji o otwartych wagach w 2026 roku garstka zamkniętych dostawców wciąż pochłania znaczną większość korporacyjnych wydatków na API, a modele o otwartych wagach stanowią niewielką mniejszość, według szacunków branżowych.
Samodzielny hosting nie jest automatycznie tańszy: analizy kosztów z 2026 roku szacują rzeczywisty całkowity koszt posiadania na trzy do pięciu razy samą pozycję GPU, gdy doliczy się inżynierów, aktualizacje i niewykorzystaną moc.
Dla właścicieli decyzja dotyczy nadzoru, a nie ceny. Lokalizacja danych w ramach RODO może sprawić, że samodzielnie hostowany lub prywatny endpoint stanie się jedyną zgodną opcją, niezależnie od tego, która jest tańsza.

Co tak naprawdę DeepSeek wydał wraz z V4?

DeepSeek wydał V4 24 kwietnia 2026 roku jako modele o otwartych wagach na licencji MIT, w dwóch rozmiarach o nazwach V4-Pro i V4-Flash. Otwarte wagi liczą się bardziej niż marketing open source: wagi są opublikowane na Hugging Face, więc firma może uruchomić model na własnych maszynach, dostroić go na własnych danych i udostępnić własnym użytkownikom bez relacji rozliczanej za token z DeepSeek. Flagowy V4-Pro to model mixture-of-experts o 1,6 biliona parametrów, z których około 49 miliardów jest aktywnych na token, a w testach agentowych podobno plasuje się na równi z zamkniętymi systemami klasy frontier, takimi jak GPT-5.5 i Claude Opus 4.7. To linia, którą własne wydania DeepSeek V3 i R1 przekroczyły jako pierwsze pod koniec 2024 i na początku 2025 roku. Możliwości klasy frontier nie są już czymś, co może wynająć ci jedynie kilku dostawców.

Skoro model można posiadać za darmo, dlaczego niemal każdy go wynajmuje?

Bo wynajem ukrywa prawdziwą pracę, a prawdziwa praca jest kosztowna w sposób, którego tabela ceny za milion tokenów nigdy nie pokazuje. Szacunki branżowe nadal lokują zdecydowaną większość korporacyjnych wydatków na API w 2026 roku u garstki zamkniętych dostawców, a modele o otwartych wagach jedynie u niewielkiej mniejszości, mimo że wiarygodne otwarte wagi już istnieją. Powodem nie jest niewiedza. Uruchomienie modelu klasy frontier we własnym zakresie oznacza GPU, stos serwujący, aktualizacje modelu, bezpieczeństwo i ludzi, którzy utrzymują to wszystko przy życiu. Analizy kosztów z 2026 roku szacują rzeczywisty całkowity koszt posiadania na trzy do pięciu razy samą pozycję sprzętową, gdy doliczy się pensje inżynierów i niewykorzystaną moc. Dla zespołu wydającego kilka tysięcy miesięcznie na API zatrudnienie inżyniera inferencji w celu oszczędności kosztuje znacznie więcej, niż oszczędza. Wynajem często jest właściwą odpowiedzią. To, co kosztuje ludzi pieniądze, to wynajem bez postawienia sobie tego pytania.

Kiedy więc samodzielny hosting jest naprawdę lepszym wyborem?

Gdy pytanie przestaje dotyczyć ceny, a zaczyna dotyczyć kontroli. Uczciwy punkt przecięcia, w którym samodzielny hosting wygrywa z ekonomią API pod względem samego kosztu, zwykle leży gdzieś w przedziale od pięćdziesięciu tysięcy do dwustu tysięcy dolarów miesięcznych wydatków na API, w zależności od tego, jak intensywnie faktycznie używasz modelu. Bardziej trwałe powody nie są finansowe. Jeśli działasz w ramach RODO, samodzielnie hostowany lub prywatny endpoint może być jedyną konfiguracją, w której twoje dane nigdy nie opuszczają perymetru, który kontrolujesz, niezależnie od kosztu w danym kwartale. Jeśli model jest rdzeniem twojego produktu, a nie udogodnieniem, posiadanie wag oznacza, że dostawca nie może go wycofać, zmienić ceny ani odmówić ci go wedle uznania. Family office lub firma kierowana przez właściciela chce tego, co nadal będzie kontrolować za pięć lat, a to rzadko jest najtańsza pozycja na dzisiejszej fakturze.

Co właściciel powinien zrobić przed kolejną fakturą za AI?

Oddziel pytanie o możliwości od pytania o własność, bo to nie ta sama decyzja. Po pierwsze, ustal, czym jest dla ciebie model: usługą, którą konsumujesz, czy aktywem, od którego zależysz. Usługę niemal zawsze możesz wynająć. Aktywo warto posiadać. Po drugie, żądaj rzeczywistego całkowitego kosztu posiadania, a nie ceny za token; jeśli twój zespół pokazuje ci tylko pozycję API, nie wykonał analizy. Po trzecie, traktuj lokalizację danych i koncentrację dostawców jako ryzyka na poziomie zarządu, a nie preferencje inżynierskie, bo to właśnie tam otwarte wagi takie jak DeepSeek V4 zmieniają to, co jest możliwe, a nie tylko to, co jest tanie. Servola doradza w zakresie infrastruktury AI oraz decyzji między budową a wynajmem, z jednym odpowiedzialnym właścicielem i bez agendy dostawcy.

Czytaj dalej: Alphabet pozyskuje 80 miliardów dolarów na AI. To Twój sygnał, by przestać konkurować w infrastrukturze. · Nvidia finansuje laboratoria, które kupują jej układy. Czy boom AI płaci sam za siebie?

Często zadawane pytania

Czy DeepSeek V4 jest naprawdę darmowy do użytku komercyjnego?

Wagi są udostępniane na licencji MIT, która zezwala na użytek komercyjny, samodzielny hosting i dostrajanie. Darmowe posiadanie nie oznacza darmowego uruchamiania; nadal płacisz za sprzęt, pracę inżynierską i obciążenie operacyjne związane z samodzielnym udostępnianiem.

Czy samodzielny hosting modelu o otwartych wagach jest zawsze tańszy niż zamknięte API?

Nie. Analizy kosztów z 2026 roku szacują rzeczywisty całkowity koszt posiadania na około trzy do pięciu razy sam wydatek na GPU, gdy uwzględni się inżynierów, aktualizacje modelu i niewykorzystaną moc. Poniżej istotnego progu użycia zamknięte API jest zwykle tańszym i prostszym wyborem.

Dlaczego firma regulowana lub kierowana przez właściciela miałaby w ogóle hostować samodzielnie?

Głównie dla kontroli, a nie dla kosztu. Lokalizacja danych w ramach RODO może sprawić, że samodzielnie hostowany lub prywatny endpoint stanie się jedyną zgodną opcją, a posiadanie wag eliminuje ryzyko, że dostawca zmieni cenę, wycofa lub ograniczy model, od którego zależy twój biznes.

DeepSeek V4 nie sprawił, że inteligencja klasy frontier stała się tańsza do wynajęcia. Sprawił, że stała się możliwa do posiadania. Większość firm wciąż płacących za token w 2027 roku to będą te, które nigdy nie zatrzymały się, by zapytać, której z nich naprawdę potrzebowały.

AI Infrastructure Open Weights DeepSeek Self-Hosting Governance