Infrastructure

DeepSeek V4 ist gratis zu besitzen. Die meisten Firmen mieten es trotzdem pro Token.

DeepSeek V4 hat offene Gewichte und Spitzenniveau. Warum mieten die meisten Unternehmen Intelligenz dann noch immer pro Token? Die wahre Antwort ist Governance, nicht der Preis.

Von Leon Soliman · 2026-06-20 · 3 Min. Lesezeit

Die wichtigsten Punkte

DeepSeek hat V4 am 24. April 2026 als Open-Weight-Modelle unter der MIT-Lizenz veröffentlicht. Das heißt, die Gewichte lassen sich herunterladen, auf eigener Hardware betreiben und feinabstimmen, ohne einen Vertrag pro Token.
DeepSeeks Flaggschiff V4-Pro ist ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern, das in agentischen Benchmarks Berichten zufolge auf einer Stufe mit geschlossenen Spitzensystemen wie GPT-5.5 und Claude Opus 4.7 abschneidet.
Trotz glaubwürdiger Open-Weight-Optionen entfällt 2026 laut Branchenschätzungen der große Teil der Enterprise-API-Ausgaben weiterhin auf eine Handvoll geschlossener Anbieter, während Open-Weight-Modelle eine kleine Minderheit bleiben.
Selbst-Hosting ist nicht automatisch günstiger: Kostenanalysen aus 2026 beziffern die echten Gesamtbetriebskosten auf das Drei- bis Fünffache der reinen GPU-Position, sobald Ingenieure, Updates und Leerlaufkapazität mitgezählt werden.
Für Eigentümer ist die Entscheidung eine Frage der Governance, nicht des Preises. Die Datenresidenz unter der DSGVO kann ein selbst gehostetes oder privates Endpunkt-Setup zur einzig konformen Option machen, ganz gleich, was günstiger ist.

Was hat DeepSeek mit V4 tatsächlich veröffentlicht?

DeepSeek hat V4 am 24. April 2026 als Open-Weight-Modelle unter der MIT-Lizenz herausgebracht, in zwei Größen namens V4-Pro und V4-Flash. Offene Gewichte zählen mehr als Open-Source-Marketing: Die Gewichte sind auf Hugging Face veröffentlicht, also kann ein Unternehmen das Modell auf eigenen Maschinen betreiben, mit eigenen Daten feinabstimmen und den eigenen Nutzern bereitstellen, ohne eine Pro-Token-Beziehung mit DeepSeek. Das Flaggschiff V4-Pro ist ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern, von denen pro Token rund 49 Milliarden aktiv sind, und in agentischen Benchmarks landet es Berichten zufolge auf einer Stufe mit geschlossenen Spitzensystemen wie GPT-5.5 und Claude Opus 4.7. Diese Linie haben DeepSeeks eigene Releases V3 und R1 Ende 2024 und Anfang 2025 zuerst überschritten. Spitzenfähigkeit ist nicht länger etwas, das nur wenige Anbieter vermieten können.

Wenn das Modell gratis zu besitzen ist, warum mietet es fast jeder?

Weil das Mieten die eigentliche Arbeit verbirgt, und die eigentliche Arbeit ist teuer auf eine Weise, die eine Tabelle mit Preisen pro Million Token nie zeigt. Branchenschätzungen verorten den weitaus größten Teil der Enterprise-API-Ausgaben 2026 nach wie vor bei einer Handvoll geschlossener Anbieter, und Open-Weight-Modelle bei nur einer kleinen Minderheit, obwohl es inzwischen glaubwürdige offene Gewichte gibt. Der Grund ist nicht Unwissenheit. Ein Spitzenmodell im eigenen Haus zu betreiben bedeutet GPUs, einen Serving-Stack, Modell-Updates, Sicherheit und die Leute, die all das am Leben halten. Kostenanalysen aus 2026 beziffern die echten Gesamtbetriebskosten auf das Drei- bis Fünffache der reinen Hardware-Position, sobald man Gehälter der Ingenieure und Leerlaufkapazität mitrechnet. Für ein Team, das ein paar Tausend im Monat für eine API ausgibt, kostet das Einstellen eines Inferenz-Ingenieurs zum Sparen weit mehr, als es spart. Mieten ist oft die richtige Antwort. Was die Leute Geld kostet, ist Mieten, ohne die Frage je gestellt zu haben.

Wann ist Selbst-Hosting also wirklich die bessere Wahl?

Wenn die Frage aufhört, sich um den Preis zu drehen, und beginnt, sich um Kontrolle zu drehen. Der ehrliche Punkt, an dem Selbst-Hosting die API-Ökonomie allein auf den Kosten schlägt, liegt tendenziell irgendwo im Bereich von fünfzigtausend bis zweihunderttausend Dollar monatlicher API-Ausgaben, je nachdem, wie stark man das Modell tatsächlich nutzt. Die beständigeren Gründe sind nicht finanziell. Wenn Sie unter der DSGVO arbeiten, kann ein selbst gehosteter oder privater Endpunkt die einzige Konfiguration sein, bei der Ihre Daten nie eine von Ihnen kontrollierte Perimetergrenze verlassen, ungeachtet der Kosten in dem Quartal. Wenn das Modell der Kern Ihres Produkts ist und nicht bloße Bequemlichkeit, bedeutet der Besitz der Gewichte, dass ein Anbieter Sie nicht nach Belieben abschalten, neu bepreisen oder verweigern kann. Ein Family Office oder ein inhabergeführtes Unternehmen will das, was es in fünf Jahren noch kontrolliert, und das ist selten die günstigste Position auf der heutigen Rechnung.

Was sollte ein Eigentümer vor der nächsten KI-Rechnung tun?

Trennen Sie die Frage nach der Fähigkeit von der Frage nach dem Eigentum, denn das ist nicht dieselbe Entscheidung. Erstens: Entscheiden Sie, was das Modell für Sie ist, ein Versorgungsgut, das Sie verbrauchen, oder ein Vermögenswert, von dem Sie abhängen. Ein Versorgungsgut können Sie fast immer mieten. Ein Vermögenswert lohnt sich zu besitzen. Zweitens: Verlangen Sie echte Gesamtbetriebskosten, keinen Token-Preis; wenn Ihr Team Ihnen nur die API-Position zeigt, hat es die Analyse nicht gemacht. Drittens: Behandeln Sie Datenresidenz und Anbieterkonzentration als Risiken auf Vorstandsebene, nicht als technische Vorlieben, denn genau dort verändern offene Gewichte wie DeepSeek V4, was möglich ist, statt nur, was günstig ist. Servola berät zu KI-Infrastruktur und zur Entscheidung zwischen Bauen und Mieten, mit einem verantwortlichen Eigentümer und ohne Anbieteragenda.

Weiterlesen: Alphabet nimmt 80 Milliarden Dollar für KI auf. Das ist Ihr Signal, den Wettlauf um Infrastruktur zu beenden. · Nvidia finanziert die Labore, die seine Chips kaufen. Bezahlt sich der KI-Boom selbst?

Häufig gestellte Fragen

Ist DeepSeek V4 wirklich gratis kommerziell nutzbar?

Die Gewichte sind unter der MIT-Lizenz veröffentlicht, die kommerzielle Nutzung, Selbst-Hosting und Feinabstimmung erlaubt. Gratis zu besitzen heißt nicht gratis zu betreiben; Sie zahlen weiterhin für die Hardware, die Technik und den betrieblichen Aufwand, es selbst bereitzustellen.

Ist das Selbst-Hosting eines Open-Weight-Modells immer günstiger als eine geschlossene API?

Nein. Kostenanalysen aus 2026 beziffern die echten Gesamtbetriebskosten auf rund das Drei- bis Fünffache der reinen GPU-Ausgaben, sobald Ingenieure, Modell-Updates und Leerlaufkapazität enthalten sind. Unterhalb einer nennenswerten Nutzungsschwelle ist eine geschlossene API meist die günstigere und einfachere Wahl.

Warum sollte ein reguliertes oder inhabergeführtes Unternehmen überhaupt selbst hosten?

Meist wegen Kontrolle statt Kosten. Die Datenresidenz unter der DSGVO kann ein selbst gehostetes oder privates Endpunkt-Setup zur einzig konformen Option machen, und der Besitz der Gewichte beseitigt das Risiko, dass ein Anbieter ein Modell, von dem Ihr Geschäft abhängt, neu bepreist, abschaltet oder einschränkt.

DeepSeek V4 hat Spitzenintelligenz nicht günstiger zum Mieten gemacht. Es hat sie besitzbar gemacht. Die meisten Firmen, die 2027 noch pro Token zahlen, werden jene sein, die nie innegehalten haben, um zu fragen, was sie wirklich brauchten.

AI Infrastructure Open Weights DeepSeek Self-Hosting Governance

Mehr aus dem Servola Journal

Infrastructure

Alphabet nimmt 80 Milliarden Dollar für KI auf. Das ist Ihr Signal, den Wettlauf um Infrastruktur zu beenden.

2026-06-21 · 2 Min. Lesezeit

Beitrag lesen →

Infrastructure

Nvidia finanziert die Labore, die seine Chips kaufen. Bezahlt sich der KI-Boom selbst?

2026-06-19 · 3 Min. Lesezeit

Beitrag lesen →

Infrastructure

Die erste ernsthafte Herausforderung für Nvidia ist keine bessere GPU. Es ist die Inferenz-Ebene.

2026-06-19 · 3 Min. Lesezeit

Beitrag lesen →

Servola

Wenn Sie abwägen, ob Sie Ihre KI besitzen oder mieten sollen, ist das genau das, wozu wir beraten, diskret und mit einem verantwortlichen Eigentümer.

Vertrauliches Gespräch anfragen Über Servola →

Servola ist technologische Beratung für einige wenige Familien und Family Offices. Wenn eine Entscheidung nicht delegierbar ist, sitzen wir auf Ihrer Seite des Tisches.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alle Beiträge