Was hat DeepSeek mit V4 tatsächlich veröffentlicht?

DeepSeek hat V4 am 24. April 2026 als Open-Weight-Modelle unter der MIT-Lizenz herausgebracht, in zwei Größen namens V4-Pro und V4-Flash. Offene Gewichte zählen mehr als Open-Source-Marketing: Die Gewichte sind auf Hugging Face veröffentlicht, also kann ein Unternehmen das Modell auf eigenen Maschinen betreiben, mit eigenen Daten feinabstimmen und den eigenen Nutzern bereitstellen, ohne eine Pro-Token-Beziehung mit DeepSeek. Das Flaggschiff V4-Pro ist ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern, von denen pro Token rund 49 Milliarden aktiv sind, und in agentischen Benchmarks landet es Berichten zufolge auf einer Stufe mit geschlossenen Spitzensystemen wie GPT-5.5 und Claude Opus 4.7. Diese Linie haben DeepSeeks eigene Releases V3 und R1 Ende 2024 und Anfang 2025 zuerst überschritten. Spitzenfähigkeit ist nicht länger etwas, das nur wenige Anbieter vermieten können.

Wenn das Modell gratis zu besitzen ist, warum mietet es fast jeder?

Weil das Mieten die eigentliche Arbeit verbirgt, und die eigentliche Arbeit ist teuer auf eine Weise, die eine Tabelle mit Preisen pro Million Token nie zeigt. Branchenschätzungen verorten den weitaus größten Teil der Enterprise-API-Ausgaben 2026 nach wie vor bei einer Handvoll geschlossener Anbieter, und Open-Weight-Modelle bei nur einer kleinen Minderheit, obwohl es inzwischen glaubwürdige offene Gewichte gibt. Der Grund ist nicht Unwissenheit. Ein Spitzenmodell im eigenen Haus zu betreiben bedeutet GPUs, einen Serving-Stack, Modell-Updates, Sicherheit und die Leute, die all das am Leben halten. Kostenanalysen aus 2026 beziffern die echten Gesamtbetriebskosten auf das Drei- bis Fünffache der reinen Hardware-Position, sobald man Gehälter der Ingenieure und Leerlaufkapazität mitrechnet. Für ein Team, das ein paar Tausend im Monat für eine API ausgibt, kostet das Einstellen eines Inferenz-Ingenieurs zum Sparen weit mehr, als es spart. Mieten ist oft die richtige Antwort. Was die Leute Geld kostet, ist Mieten, ohne die Frage je gestellt zu haben.

Wann ist Selbst-Hosting also wirklich die bessere Wahl?

Wenn die Frage aufhört, sich um den Preis zu drehen, und beginnt, sich um Kontrolle zu drehen. Der ehrliche Punkt, an dem Selbst-Hosting die API-Ökonomie allein auf den Kosten schlägt, liegt tendenziell irgendwo im Bereich von fünfzigtausend bis zweihunderttausend Dollar monatlicher API-Ausgaben, je nachdem, wie stark man das Modell tatsächlich nutzt. Die beständigeren Gründe sind nicht finanziell. Wenn Sie unter der DSGVO arbeiten, kann ein selbst gehosteter oder privater Endpunkt die einzige Konfiguration sein, bei der Ihre Daten nie eine von Ihnen kontrollierte Perimetergrenze verlassen, ungeachtet der Kosten in dem Quartal. Wenn das Modell der Kern Ihres Produkts ist und nicht bloße Bequemlichkeit, bedeutet der Besitz der Gewichte, dass ein Anbieter Sie nicht nach Belieben abschalten, neu bepreisen oder verweigern kann. Ein Family Office oder ein inhabergeführtes Unternehmen will das, was es in fünf Jahren noch kontrolliert, und das ist selten die günstigste Position auf der heutigen Rechnung.

Was sollte ein Eigentümer vor der nächsten KI-Rechnung tun?

Trennen Sie die Frage nach der Fähigkeit von der Frage nach dem Eigentum, denn das ist nicht dieselbe Entscheidung. Erstens: Entscheiden Sie, was das Modell für Sie ist, ein Versorgungsgut, das Sie verbrauchen, oder ein Vermögenswert, von dem Sie abhängen. Ein Versorgungsgut können Sie fast immer mieten. Ein Vermögenswert lohnt sich zu besitzen. Zweitens: Verlangen Sie echte Gesamtbetriebskosten, keinen Token-Preis; wenn Ihr Team Ihnen nur die API-Position zeigt, hat es die Analyse nicht gemacht. Drittens: Behandeln Sie Datenresidenz und Anbieterkonzentration als Risiken auf Vorstandsebene, nicht als technische Vorlieben, denn genau dort verändern offene Gewichte wie DeepSeek V4, was möglich ist, statt nur, was günstig ist. Servola berät zu KI-Infrastruktur und zur Entscheidung zwischen Bauen und Mieten, mit einem verantwortlichen Eigentümer und ohne Anbieteragenda.