Die Schlagzeile ist selten das stärkste Modell

Wenn ein Labor ein neues Modell ankündigt und die Presse es aufgreift, neigen Unternehmer dazu anzunehmen, der Name in der Schlagzeile sei das Leistungsfähigste, was verfügbar ist. Das ist er meist nicht. Die jüngste Aufmerksamkeit bei Anthropic galt Sonnet 5, doch Sonnet 5 ist die ausgewogene Mittelstufe der Claude-Familie. Das Flaggschiff, die leistungsfähigste Stufe, ist Opus 4.8. Unter Sonnet steht Haiku, die schnelle und günstige Stufe, neben Fable 5, einem spezialisierten Mitglied derselben Familie. OpenAI liefert dieselbe Struktur: GPT-5.6 erscheint als Sol, das Flaggschiff, Terra, die ausgewogene Stufe, die bei etwa der Hälfte der Kosten der Vorgängergeneration bei ähnlicher Leistung positioniert ist, und Luna, die schnelle und günstigste Stufe.

Das ist mittlerweile die Standardstruktur bei jedem ernstzunehmenden Labor, und sie existiert aus gutem Grund. Ein einzelnes Modell kann nicht zugleich das stärkste, das günstigste und das schnellste sein. Also teilen die Labore die Familie in Stufen auf und lassen die Käufer wählen. Die Schlagzeile fällt tendenziell auf die Veröffentlichung, die am berichtenswertesten oder am weitesten verbreitet ist, was oft die Mittelstufe statt des Flaggschiffs ist. Die Presse zu lesen sagt Ihnen, was erschienen ist. Sie sagt Ihnen nicht, welche Stufe in Ihr Unternehmen gehört.

Flaggschiff reservieren, Mittelstufe fahren, schnelle Stufe skalieren

Die Flaggschiff-Stufe verdient ihren Aufpreis bei wirklich schweren Problemen: dichtes juristisches oder finanzielles Schlussfolgern, mehrstufige Analysen, bei denen eine falsche Annahme das Ergebnis entwertet, komplexer Code und Arbeit, bei der ein Fehler später teuer aufzudecken ist. Für diese Klasse von Aufgaben ist die Zahlung für Opus 4.8 oder Sol die günstige Wahl, denn die Kosten einer schwachen Antwort übersteigen die Kosten des besseren Modells bei weitem. Hier sparen Sie nicht.

In der Mittelstufe läuft tatsächlich der große Teil des Tages ab. Sonnet 5 oder Terra bewältigen das Entwerfen, Zusammenfassen, Kundenantworten, die Recherchesynthese und den stetigen Strom an Routine-Wissensarbeit auf einem Niveau, das die meisten Teams nicht vom Flaggschiff unterscheiden können. Die schnelle Stufe übernimmt dann die volumenstarke Arbeit mit niedrigem Einsatz, die Klassifizierung, das Tagging und die Massenverarbeitung, die tausende Male pro Stunde läuft, wo Geschwindigkeit und Kosten pro Aufruf mehr zählen als die letzten paar Punkte an Leistungsfähigkeit. Passen Sie die Stufe zur Aufgabe an, und Sie geben Geld dort aus, wo es das Ergebnis verändert.

Wie ein Unternehmer tatsächlich wählen sollte

Sie müssen keine Versionsnummern verfolgen, um diese Entscheidung gut zu treffen. Sie brauchen eine kurze Regel. Fragen Sie, was passiert, wenn die Antwort falsch ist. Wenn eine falsche Antwort teuer, langsam zu erkennen oder schwer umzukehren ist, leiten Sie die Aufgabe zum Flaggschiff. Wenn eine falsche Antwort günstig zu erkennen und zu beheben ist, ist die Mittelstufe die richtige Wahl und die Ersparnis ist real. Wenn die Aufgabe in hohem Volumen läuft und jeder Aufruf von niedrigem Einsatz ist, ist die schnelle Stufe genau dafür gebaut. Dieselbe Logik gilt, ob Sie sich auf die Claude-Familie oder die GPT-Familie festlegen, denn beide liefern dieselben drei Rollen.

Die Falle ist der Kauf nach Namen. Alles auf das Flaggschiff zu standardisieren bedeutet, über tausende Routine-Aufrufe hinweg für eine Leistungsfähigkeit zu viel zu zahlen, die nie genutzt wird. Alles auf das Modell in den Schlagzeilen zu standardisieren bedeutet, die Handvoll schwerer Probleme stillschweigend zu unterversorgen, die das Einführen von KI überhaupt erst rechtfertigten. Keines von beidem ist eine Strategie. Die Unternehmer, die das richtig machen, behandeln die Stufe als bewusste Wahl pro Arbeitslast, so wie sie niemals den Seniorpartner ans Kopiergerät stellen oder die Fusion dem Praktikanten übergeben würden.