Hvad udgav DeepSeek egentlig med V4?
DeepSeek udgav V4 den 24. april 2026 som open-weight-modeller under MIT-licensen, i to størrelser ved navn V4-Pro og V4-Flash. Åbne vægte betyder mere end open-source-marketing: vægtene er udgivet på Hugging Face, så en virksomhed kan køre modellen på sine egne maskiner, finjustere den på sine egne data og levere den til sine egne brugere uden et forhold per token med DeepSeek. Flagskibet V4-Pro er en mixture-of-experts-model med 1,6 billioner parametre, hvoraf cirka 49 milliarder parametre er aktive per token, og på agentiske benchmarks lander den efter sigende på linje med lukkede frontsystemer som GPT-5.5 og Claude Opus 4.7. Det er den linje, som DeepSeeks egne udgivelser V3 og R1 krydsede først i slutningen af 2024 og begyndelsen af 2025. Kapacitet i frontklassen er ikke længere noget, kun få leverandører kan leje ud til dig.
Hvis modellen er gratis at eje, hvorfor lejer næsten alle den så?
Fordi leje skjuler det egentlige arbejde, og det egentlige arbejde er dyrt på måder, som en tabel med pris per million tokens aldrig viser. Branchens skøn placerer stadig langt størstedelen af 2026's virksomheds-API-forbrug hos en håndfuld lukkede leverandører, og open-weight-modeller hos kun et lille mindretal, selvom der nu findes troværdige åbne vægte. Grunden er ikke uvidenhed. At køre en frontmodel internt betyder GPU'er, en serving-stack, modelopdateringer, sikkerhed og de folk, der holder det hele i live. Omkostningsanalyser fra 2026 sætter de reelle samlede ejeromkostninger til tre til fem gange den rene hardwarepost, når man tæller ingeniørlønninger og ubrugt kapacitet med. For et team, der bruger et par tusind om måneden på en API, koster det at ansætte en inferensingeniør for at spare langt mere, end det sparer. Leje er ofte det rigtige svar. Det, der koster folk penge, er at leje uden nogensinde at have stillet spørgsmålet.
Hvornår er selvhosting så reelt det bedste valg?
Når spørgsmålet ophører med at handle om pris og begynder at handle om kontrol. Det ærlige skæringspunkt, hvor selvhosting slår API-økonomien på pris alene, ligger typisk et sted i intervallet mellem halvtreds tusind og to hundrede tusind dollars i månedligt API-forbrug, afhængigt af hvor meget man faktisk bruger modellen. De mere holdbare grunde er ikke finansielle. Hvis du opererer under GDPR, kan et selvhostet eller privat endpoint være den eneste konfiguration, hvor dine data aldrig forlader en perimeter, du kontrollerer, uanset omkostningen det kvartal. Hvis modellen er kernen i dit produkt snarere end en bekvemmelighed, betyder ejerskab af vægtene, at en leverandør ikke kan udfase, omprissætte eller nægte dig den efter forgodtbefindende. Et family office eller en ejerledet virksomhed vil have det, den stadig kontrollerer om fem år, og det er sjældent den billigste post på dagens faktura.
Hvad bør en ejer gøre før den næste AI-faktura?
Adskil spørgsmålet om kapacitet fra spørgsmålet om ejerskab, for det er ikke den samme beslutning. Beslut først, hvad modellen er for dig: et forsyningsgode, du forbruger, eller et aktiv, du afhænger af. Et forsyningsgode kan du næsten altid leje. Et aktiv er værd at eje. Kræv for det andet reelle samlede ejeromkostninger, ikke en tokenpris; hvis dit team kun viser dig API-posten, har det ikke lavet analysen. Behandl for det tredje dataopbevaring og leverandørkoncentration som risici på bestyrelsesniveau, ikke som tekniske præferencer, for det er der, åbne vægte som DeepSeek V4 ændrer, hvad der er muligt, og ikke kun, hvad der er billigt. Servola rådgiver om AI-infrastruktur og beslutningen mellem at bygge og leje, med en enkelt ansvarlig ejer og uden leverandøragenda.
Læs videre: Alphabet rejser 80 milliarder dollar til AI. Det er dit signal om at stoppe med at konkurrere på infrastruktur. · Nvidia finansierer de laboratorier, der køber dens chips. Betaler AI-boomet sig selv?