Was Together AI wirklich einsammelte, und warum die Geldgeber zählen

Am 1. Juli 2026 verkündete Together AI eine Series C über 800 Millionen Dollar bei einer Post-Money-Bewertung von 8,3 Milliarden Dollar. Das ist rund eine Verdopplung gegenüber den 3,3 Milliarden von Anfang 2025. Aramco Ventures führte die Runde über sein Prosperity7-Programm an, mit Vista Equity Partners, General Catalyst, Emergence Capital, Nvidia, March Capital, Pegatron und SE Ventures. Das insgesamt aufgenommene Kapital liegt nun bei etwa 1,3 Milliarden Dollar.

Die Zahl, die die Geschichte trägt, ist nicht die Bewertung. Es sind die 1,15 Milliarden Dollar an Jahresbuchungen, die das Unternehmen für sein jüngstes Quartal meldete, mit über einer Million Entwicklern und Tausenden Unternehmen wie Cursor, Cognition und Decagon. Das ist kein Labor, das Kapital auf der Suche nach einem Modell verbrennt. Es ist ein Geschäft, das etwas verkauft, wofür Firmen bereits im großen Stil zahlen.

Wenn ein staatlicher Oel-Investor und der dominierende Chiphersteller in dieselbe Firma investieren, wetten sie nicht darauf, dass ein einzelnes Modell gewinnt. Sie wetten darauf, dass es ein dauerhafter, wachsender Markt ist, viele Modelle günstig zu betreiben. Das ist das Signal, das Unternehmer lesen sollten.

Die Wette gilt der Inferenz-Ebene, nicht dem Modell

Zwei Jahre lang war die Standardannahme in Unternehmen einfach: ein geschlossenes Spitzenmodell eines großen US-Labors wählen, dessen API aufrufen und die Rechnung pro Token als Betriebskosten hinnehmen. Together AI ist auf der umgekehrten Prämisse finanziert. Die Plattform betreibt Modelle mit offenen Gewichten wie DeepSeek, Kimi und MiniMax, verpackt in eigene Software zur Inferenz-Optimierung, und wirbt damit, dass Kunden zwischen sechs- und sechzigmal weniger zahlen als bei vergleichbaren geschlossenen Bereitstellungen. Decagon berichtete, die Inferenzkosten nach dem Wechsel um rund das Sechsfache gesenkt zu haben.

Die Unterscheidung ist wichtig, weil sie zwei Dinge trennt, die Unternehmer gern vermischen. Die Intelligenz, die Sie mieten, und die Infrastruktur, die sie bereitstellt, sind jetzt verschiedene Produkte, verkauft von verschiedenen Firmen, bepreist auf verschiedenen Kurven. Das Modell mag kostenlos herunterzuladen sein. Für die effiziente Bereitstellung bei niedriger Latenz und planbaren Kosten wurden gerade 800 Millionen Dollar gezahlt.

Unabhängige Messungen stützen die Verschiebung. OpenRouter-Daten, die neben der Finanzierung zitiert werden, zeigen, dass sich die Nutzung offener Modelle auf der Plattform von Together im Jahresvergleich verdreifacht hat. Das ist keine Marketingaussage über künftige Akzeptanz. Es ist gemessener Verkehr, der von geschlossenen zu offenen Endpunkten wandert, weil sich die Rechnung geändert hat.

Was sich für Unternehmer und Betreiber ändert

Die praktische Folge ist, dass Ihre KI-Kostenstruktur zu einer Entscheidung wird statt zu einer Vorgabe. Wenn ein nennenswerter Teil Ihrer Last aus Zusammenfassung, Extraktion, Klassifikation oder Weiterleitung besteht, zahlen Sie sehr wahrscheinlich zu viel, wenn Sie das gegen ein geschlossenes Spitzenmodell laufen lassen. Die Aufgabe braucht kein Spitzen-Reasoning, sondern ein solides offenes Modell, das effizient bereitgestellt wird. Genau diese Last soll dieser Markt aufnehmen.

Das Gegengewicht ist real und darf nicht weggewischt werden. Hyperscaler bauen eigene Inferenz-Kapazität in einem Maßstab auf, den ein einzelnes Start-up nicht erreichen kann, und eine spezialisierte Plattform ist ein weiterer Anbieter, den man steuern, absichern und von dem man abhängen muss. Die ehrliche Frage ist nicht, ob Inferenz mit offenen Modellen günstiger ist. Es geht darum, ob die Ersparnis den zusätzlichen Lieferanten und den Aufwand rechtfertigt, Arbeit zwischen Ebenen zu verteilen. Für ein Unternehmen, das monatlich Zehntausende Euro für KI ausgibt, tut sie das meist.

Die europäische Lesart und die Souveränität

Für einen Betreiber in der EU oder in Großbritannien erweitert diese Finanzierung leise die Speisekarte. Jede glaubwürdige Alternative zu den zwei größten US-Laboren für geschlossene Modelle verbessert Ihre Verhandlungsposition und senkt das Klumpenrisiko, einen Geschäftsprozess auf Preis und Verfügbarkeit eines einzigen Anbieters aufzubauen. Die von Together bereitgestellten Modelle haben offene Gewichte. Sie lassen sich im Prinzip in einer Rechtsordnung und Infrastruktur Ihrer Wahl betreiben, nicht nur über eine in den USA gehostete API.

Das macht Together selbst noch nicht zur europäischen Souveränitäts-Antwort; es ist ein US-Unternehmen, und Aramco-Kapital bringt eigene Erwägungen mit sich. Aber das Muster, das es bestätigt, offene Gewichte plus eine effiziente Bereitstellungsebene, ist dieselbe Architektur, die Europas eigene Bemühungen um souveräne KI verfolgen. Der kommerzielle Beweis, dass dieses Modell Geld verdient, ist selbst für Betreiber nützlich, die nie bei Together unterschreiben werden. Er sagt Ihnen, dass die Option real ist, finanziert und kaum verschwinden wird.