Infrastructure

DeepSeek V4 är gratis att äga. De flesta företag hyr det ändå per token.

DeepSeek V4 har öppna vikter och är i frontklass. Så varför hyr de flesta företag fortfarande intelligens per token? Det verkliga svaret är styrning, inte priset.

Av Leon Soliman · 2026-06-20 · 3 min lästid

Viktigaste punkterna

DeepSeek släppte V4 den 24 april 2026 som open-weight-modeller under MIT-licensen, vilket innebär att vikterna kan laddas ner, köras på egen hårdvara och finjusteras utan ett avtal per token.
DeepSeeks flaggskepp V4-Pro är en mixture-of-experts-modell med 1,6 biljoner parametrar som på agentiska benchmarks enligt uppgift presterar i nivå med slutna frontsystem som GPT-5.5 och Claude Opus 4.7.
Trots trovärdiga open-weight-alternativ står en handfull slutna leverantörer 2026 fortfarande för den stora majoriteten av företagens API-utgifter, medan open-weight-modeller utgör en liten minoritet, enligt branschens uppskattningar.
Att driva i egen regi är inte automatiskt billigare: kostnadsanalyser från 2026 sätter den verkliga totala ägandekostnaden till tre till fem gånger den rena GPU-posten när ingenjörer, uppdateringar och outnyttjad kapacitet räknas in.
För ägare är beslutet en fråga om styrning, inte om pris. Dataplacering enligt GDPR kan göra en egenhostad eller privat endpoint till det enda regelmässiga alternativet, oavsett vilket som är billigast.

Vad släppte DeepSeek egentligen med V4?

DeepSeek släppte V4 den 24 april 2026 som open-weight-modeller under MIT-licensen, i två storlekar med namnen V4-Pro och V4-Flash. Öppna vikter väger tyngre än open source-marknadsföring: vikterna är publicerade på Hugging Face, så ett företag kan köra modellen på sina egna maskiner, finjustera den på sina egna data och leverera den till sina egna användare utan ett förhållande per token med DeepSeek. Flaggskeppet V4-Pro är en mixture-of-experts-modell med 1,6 biljoner parametrar, varav omkring 49 miljarder parametrar är aktiva per token, och på agentiska benchmarks hamnar den enligt uppgift i nivå med slutna frontsystem som GPT-5.5 och Claude Opus 4.7. Det är den gräns som DeepSeeks egna släpp V3 och R1 korsade först i slutet av 2024 och början av 2025. Förmåga i frontklass är inte längre något som bara några få leverantörer kan hyra ut till dig.

Om modellen är gratis att äga, varför hyr då nästan alla den?

För att hyrandet döljer det verkliga arbetet, och det verkliga arbetet är dyrt på sätt som en tabell med pris per miljon tokens aldrig visar. Branschens uppskattningar placerar fortfarande den övervägande delen av 2026 års företags-API-utgifter hos en handfull slutna leverantörer, och open-weight-modeller hos endast en liten minoritet, även om det nu finns trovärdiga öppna vikter. Skälet är inte okunskap. Att köra en frontmodell internt innebär GPU:er, en serving-stack, modelluppdateringar, säkerhet och de personer som håller allt detta vid liv. Kostnadsanalyser från 2026 sätter den verkliga totala ägandekostnaden till tre till fem gånger den rena hårdvaruposten när man räknar in ingenjörslöner och outnyttjad kapacitet. För ett team som spenderar några tusen i månaden på en API kostar det att anställa en inferensingenjör för att spara långt mer än det sparar. Att hyra är ofta rätt svar. Det som kostar folk pengar är att hyra utan att någonsin ha ställt frågan.

Så när är det att driva i egen regi verkligen det bättre valet?

När frågan slutar handla om pris och börjar handla om kontroll. Den ärliga brytpunkten där egen drift slår API-ekonomin på enbart kostnad tenderar att ligga någonstans i intervallet femtio tusen till två hundra tusen dollar i månatliga API-utgifter, beroende på hur mycket du faktiskt använder modellen. De mer hållbara skälen är inte ekonomiska. Om du verkar under GDPR kan en egenhostad eller privat endpoint vara den enda konfigurationen där dina data aldrig lämnar en perimeter du kontrollerar, oavsett kostnaden det kvartalet. Om modellen är kärnan i din produkt snarare än en bekvämlighet innebär ägandet av vikterna att en leverantör inte kan avveckla, omprissätta eller neka dig den efter eget godtycke. Ett family office eller ett ägarlett företag vill ha det som det fortfarande kontrollerar om fem år, och det är sällan den billigaste raden på dagens faktura.

Vad bör en ägare göra före nästa AI-faktura?

Skilj frågan om förmåga från frågan om ägande, för det är inte samma beslut. Bestäm först vad modellen är för dig: en nyttighet du förbrukar, eller en tillgång du är beroende av. En nyttighet kan du nästan alltid hyra. En tillgång är värd att äga. Kräv för det andra en verklig total ägandekostnad, inte ett tokenpris; om ditt team bara visar dig API-raden har det inte gjort analysen. Behandla för det tredje dataplacering och leverantörskoncentration som risker på styrelsenivå, inte som tekniska preferenser, för det är där öppna vikter som DeepSeek V4 ändrar vad som är möjligt och inte bara vad som är billigt. Servola råder om AI-infrastruktur och beslutet mellan att bygga och hyra, med en enda ansvarig ägare och utan leverantörsagenda.

Läs vidare: Alphabet tar in 80 miljarder dollar till AI. Det är din signal att sluta konkurrera om infrastruktur. · Nvidia finansierar de labb som köper dess chip. Betalar AI-boomen sig själv?

Vanliga frågor

Är DeepSeek V4 verkligen gratis för kommersiellt bruk?

Vikterna släpps under MIT-licensen, som tillåter kommersiellt bruk, egen drift och finjustering. Gratis att äga betyder inte gratis att köra; du betalar fortfarande för hårdvaran, ingenjörsarbetet och den operativa bördan av att leverera den själv.

Är det alltid billigare att driva en open-weight-modell själv än en sluten API?

Nej. Kostnadsanalyser från 2026 sätter den verkliga totala ägandekostnaden till ungefär tre till fem gånger de rena GPU-utgifterna när ingenjörer, modelluppdateringar och outnyttjad kapacitet är inräknade. Under en meningsfull användningströskel är en sluten API oftast det billigare och enklare valet.

Varför skulle ett reglerat eller ägarlett företag överhuvudtaget driva i egen regi?

Mest för kontroll snarare än kostnad. Dataplacering enligt GDPR kan göra en egenhostad eller privat endpoint till det enda regelmässiga alternativet, och ägandet av vikterna tar bort risken att en leverantör omprissätter, avvecklar eller begränsar en modell som din verksamhet är beroende av.

DeepSeek V4 gjorde inte frontintelligens billigare att hyra. Den gjorde den möjlig att äga. De flesta företag som fortfarande betalar per token 2027 kommer att vara de som aldrig stannade upp för att fråga vilket de egentligen behövde.

AI Infrastructure Open Weights DeepSeek Self-Hosting Governance