Vad släppte DeepSeek egentligen med V4?

DeepSeek släppte V4 den 24 april 2026 som open-weight-modeller under MIT-licensen, i två storlekar med namnen V4-Pro och V4-Flash. Öppna vikter väger tyngre än open source-marknadsföring: vikterna är publicerade på Hugging Face, så ett företag kan köra modellen på sina egna maskiner, finjustera den på sina egna data och leverera den till sina egna användare utan ett förhållande per token med DeepSeek. Flaggskeppet V4-Pro är en mixture-of-experts-modell med 1,6 biljoner parametrar, varav omkring 49 miljarder parametrar är aktiva per token, och på agentiska benchmarks hamnar den enligt uppgift i nivå med slutna frontsystem som GPT-5.5 och Claude Opus 4.7. Det är den gräns som DeepSeeks egna släpp V3 och R1 korsade först i slutet av 2024 och början av 2025. Förmåga i frontklass är inte längre något som bara några få leverantörer kan hyra ut till dig.

Om modellen är gratis att äga, varför hyr då nästan alla den?

För att hyrandet döljer det verkliga arbetet, och det verkliga arbetet är dyrt på sätt som en tabell med pris per miljon tokens aldrig visar. Branschens uppskattningar placerar fortfarande den övervägande delen av 2026 års företags-API-utgifter hos en handfull slutna leverantörer, och open-weight-modeller hos endast en liten minoritet, även om det nu finns trovärdiga öppna vikter. Skälet är inte okunskap. Att köra en frontmodell internt innebär GPU:er, en serving-stack, modelluppdateringar, säkerhet och de personer som håller allt detta vid liv. Kostnadsanalyser från 2026 sätter den verkliga totala ägandekostnaden till tre till fem gånger den rena hårdvaruposten när man räknar in ingenjörslöner och outnyttjad kapacitet. För ett team som spenderar några tusen i månaden på en API kostar det att anställa en inferensingenjör för att spara långt mer än det sparar. Att hyra är ofta rätt svar. Det som kostar folk pengar är att hyra utan att någonsin ha ställt frågan.

Så när är det att driva i egen regi verkligen det bättre valet?

När frågan slutar handla om pris och börjar handla om kontroll. Den ärliga brytpunkten där egen drift slår API-ekonomin på enbart kostnad tenderar att ligga någonstans i intervallet femtio tusen till två hundra tusen dollar i månatliga API-utgifter, beroende på hur mycket du faktiskt använder modellen. De mer hållbara skälen är inte ekonomiska. Om du verkar under GDPR kan en egenhostad eller privat endpoint vara den enda konfigurationen där dina data aldrig lämnar en perimeter du kontrollerar, oavsett kostnaden det kvartalet. Om modellen är kärnan i din produkt snarare än en bekvämlighet innebär ägandet av vikterna att en leverantör inte kan avveckla, omprissätta eller neka dig den efter eget godtycke. Ett family office eller ett ägarlett företag vill ha det som det fortfarande kontrollerar om fem år, och det är sällan den billigaste raden på dagens faktura.

Vad bör en ägare göra före nästa AI-faktura?

Skilj frågan om förmåga från frågan om ägande, för det är inte samma beslut. Bestäm först vad modellen är för dig: en nyttighet du förbrukar, eller en tillgång du är beroende av. En nyttighet kan du nästan alltid hyra. En tillgång är värd att äga. Kräv för det andra en verklig total ägandekostnad, inte ett tokenpris; om ditt team bara visar dig API-raden har det inte gjort analysen. Behandla för det tredje dataplacering och leverantörskoncentration som risker på styrelsenivå, inte som tekniska preferenser, för det är där öppna vikter som DeepSeek V4 ändrar vad som är möjligt och inte bara vad som är billigt. Servola råder om AI-infrastruktur och beslutet mellan att bygga och hyra, med en enda ansvarig ägare och utan leverantörsagenda.