Was DeepSeek angekündigt hat

Am 30. Juni 2026 erklärte DeepSeek, die offizielle Version von V4 erscheine Mitte Juli und löse die seit dem 24. April verfügbare Vorschau ab, wie TechNode berichtet. Das eigentliche Novum ist kein Benchmark, sondern ein Preismechanismus: Erstmals bei einer großen KI-API kosten Tokens zu verschiedenen Tageszeiten unterschiedlich viel; in den täglichen Fenstern von 9:00 bis 12:00 und 14:00 bis 18:00 Uhr, den chinesischen Geschäftszeiten, verdoppeln sich die Sätze, die Nebenzeit bleibt unverändert.

Die Modelle selbst sind gewichtig: Ein Kontextfenster von 1 Million Token wird Standard der gesamten Reihe, V4-Pro ist ein Mixture-of-Experts-Design mit 1,6 Billionen Parametern und 49 Milliarden aktiven, V4-Flash ein Modell mit 284 Milliarden Parametern und 13 Milliarden aktiven. Die Dokumentation von DeepSeek setzt zudem eine harte Frist: Die älteren Endpunkte deepseek-chat und deepseek-reasoner sind nach dem 24. Juli nicht mehr erreichbar; bestehende Integrationen müssen migrieren, ob ihnen der neue Zähler gefällt oder nicht.

Warum ein Modelllabor Preise macht wie ein Stromversorger

Zeitabhängige Preise existieren in genau einer Art von Markt: feste Kapazität, schwankende Nachfrage. Stromnetze haben sie erfunden, weil Speicher teuer waren und die Spitzenlast die Größe des ganzen Systems bestimmte. Dass ein KI-Labor nun zum selben Werkzeug greift, ist ein Eingeständnis, das mehr wert ist als jede Keynote: Inferenzkapazität ist endlich, GPUs stellen sich nicht höflich an, und das Grenztoken um 10:30 Uhr an einem Dienstag kostet den Betreiber mehr als dasselbe Token um Mitternacht.

Es zerbricht auch eine bequeme Annahme. Zwei Jahre lang hat die Branche erzählt, Intelligenz werde jedes Quartal billiger. Pro Token stimmt das weiter. Aber der neue Mechanismus bedeutet, dass der Preis derselben Anfrage keine Konstante mehr ist; wer mit flachen Stückkosten geplant hat, besitzt jetzt ein kleines Energiehandelsproblem. Sobald ein Anbieter zeigt, dass Kunden Spitzenpreise akzeptieren, haben alle anderen jeden Anreiz zu folgen.

Der europäische Uhrzeitvorteil

Für europäische Einkäufer liegt die Geographie der Spitzenfenster ungewöhnlich günstig. Die gemeldeten Spitzenzeiten fallen auf 3:00 bis 6:00 und 8:00 bis 12:00 Uhr mitteleuropäischer Sommerzeit. Ab Mittag in Frankfurt, Wien oder Zürich läuft der gesamte Arbeitsnachmittag und Abend in der Nebenzeit. Ein europäisches Unternehmen zahlt bei DeepSeek für den Großteil seines Geschäftstags den vergünstigten Satz, während ein chinesischer Wettbewerber während seines eigenen das Doppelte zahlt.

Der praktische Schritt ist architektonisch, nicht vertraglich: latenzkritische Aufrufe von aufschiebbaren trennen. Nächtliche Batchläufe, Embeddings, Neuindexierung, Evaluationen und Berichte lassen sich mit einer Warteschlange und einem Cron-Eintrag in Nebenzeitfenster legen. Diese Disziplin lohnt sich selbst dann, wenn Sie DeepSeek nie nutzen, denn zeitabhängige Preise sind jetzt vorgeführt, und die Version Ihres eigenen Anbieters ist nur eine Produktsitzung entfernt.

Was bis Mitte Juli zu tun ist

Drei Schritte passen in die zwei Wochen vor der Veröffentlichung. Erstens: Wer die auslaufenden Endpunkte deepseek-chat oder deepseek-reasoner betreibt, braucht vor dem 24. Juli einen getesteten, nicht bloß geplanten Migrationspfad. Zweitens: Teams mit beliebigen getakteten KI-APIs sollten ihre Workloads jetzt als aufschiebbar oder interaktiv markieren, damit die Planung später nur eine Konfigurationsänderung ist. Drittens: Wer das KI-Budget verantwortet, sollte die Ausgaben unter einem Zwei-Tarif-Preis modellieren und jedem Anbieter zur Verlängerung eine Frage stellen: Verpflichten Sie sich für die Vertragslaufzeit zu zeitunabhängigen Preisen oder nicht. Die Antwort ist in beiden Fällen eine Information.