Die Abrechnung je Nutzer endet im Stillen

Ein Jahrzehnt lang waren Softwarekosten vorhersehbar. Sie zahlten eine feste Gebühr je Nutzer und Monat, und die Rechnung bewegte sich kaum, egal wie intensiv jemand arbeitete. Dieses Modell bricht nun bei KI-Werkzeugen zusammen. Im Juni 2026 stellte ein führender KI-Assistent für Programmierung seine Tarife auf nutzungsabhängige Abrechnung um und berechnet die Token, die jede Anfrage verbraucht, statt eines festen Lizenzpreises.

Der Wechsel ist deshalb so bedeutsam, weil KI-Agenten sich nicht wie ein Mensch verhalten, der sich durch ein Menü klickt. Ein autonomer Agent, der seine eigene Arbeit plant, bearbeitet und prüft, kann in der Größenordnung des Tausendfachen an Token einer einzelnen Frage verbrauchen. Dieselbe Lizenz, die im Vorjahr einen festen Betrag kostete, läuft nun gegen einen offenen Zähler, und die intensivsten Nutzer fordern ihn am stärksten.

Die Zahlen sind schon jetzt alarmierend

Die ersten Berichte sind nicht subtil. Intensive Agentennutzer haben unter dem neuen nutzungsabhängigen Modell prognostizierte Kosten erlebt, die das Zehn- bis Fünfzigfache erreichen. Ein großes Technologieunternehmen soll sein gesamtes Jahresbudget für KI-Programmierwerkzeuge innerhalb von vier Monaten ausgegeben und danach jeden Mitarbeiter auf einen festen Monatsbetrag je Werkzeug begrenzt haben. Selbst eines der größten Softwareunternehmen der Welt soll Ende Juni die meisten seiner internen Lizenzen für ein externes KI-Werkzeug gekündigt haben, mit Verweis auf außer Kontrolle geratene Token-Kosten.

Es gibt eine tiefere Falle. Die Token-Preise sind seit 2023 stark gefallen, doch die gesamten KI-Rechnungen sind gestiegen, weil günstigere Token zu weitaus intensiverer Nutzung einladen. Niedrigere Stückpreise schützen kein Budget, wenn der Verbrauch unbegrenzt ist. Die Kostenposition, von der Eigentümern gesagt wurde, sie würde mit der Größe schrumpfen, ist diejenige, die am schnellsten wächst.

Die Guthaben laufen Ende Sommer aus

Ein großer Teil des aktuellen Schmerzes wird durch Aktionsguthaben abgefedert, die die Anbieter an die Abrechnungsumstellung gekoppelt haben. Diese Guthaben sind befristet. Im prominentesten Fall reicht der Puffer nur bis zum Sommer 2026 und endet dann, sodass ab dem Herbst die volle nutzungsabhängige Rechnung wirksam wird.

Das macht den Zeitpunkt konkret. Eine Organisation, die ihren tatsächlichen, unbegrenzten KI-Verbrauch nicht misst, bevor die Guthaben verfallen, erfährt die wahre Zahl auf einer Rechnung statt in einer Planung. Die ruhigen Monate sind das Zeitfenster, um Kontrollen einzurichten, nicht der Moment, nachdem der Zähler voll sichtbar wird.

Steuerung, nicht ein günstigeres Werkzeug

Der Reflex, zu dem Modell zu wechseln, das in diesem Quartal gerade am günstigsten ist, verfehlt den Kern. Die eigentliche Gefahr ist das Fehlen von Zuordnung und Obergrenzen. Die meisten Organisationen können nicht sagen, welches Team, welcher Agent oder welcher Arbeitsablauf einen Anstieg ausgelöst hat, und können ihn deshalb nicht steuern. Branchenumfragen zeigen inzwischen, dass nahezu jedes Unternehmen aktiv versucht, KI-Ausgaben zu steuern, während die tatsächliche Fähigkeit dazu deutlich hinterherhinkt.

Die Handlung des Eigentümers ist klar und nicht technisch. Fordern Sie Kostenzuordnung je Team und je Agent, setzen Sie harte Obergrenzen, bevor die Aktionsguthaben auslaufen, und machen Sie die Wahl des Modells zu einer bewussten Entscheidung für jede Aufgabe statt zu einer Voreinstellung. KI ist nun ein nutzungsabhängiges Versorgungsgut. Sie muss auch so betrieben werden.