Was genau tun Qualcomm und Tenstorrent?

Sie greifen die Inferenz an, jenen Teil der KI, der jedes Mal läuft, wenn ein Modell eine Abfrage beantwortet, statt das Training, den Bereich, den Nvidia am stärksten dominiert. Am 28. Oktober 2025 stellte Qualcomm zwei Rechenzentrums-Beschleuniger vor, den AI200 und den AI250, gebaut auf der eigenen Technologie für neuronale Recheneinheiten und klar auf Inferenzkosten und Energieeffizienz ausgerichtet, wobei der AI200 2026 und der AI250 2027 kommerziell verfügbar sein sollen. Davon getrennt meldete The Information im Juni 2026, mit Folgeberichterstattung von Reuters, The Register und Tom's Hardware, dass Qualcomm Gespräche über den Kauf von Jim Kellers Start-up Tenstorrent zu einer Bewertung von rund 8 bis 10 Milliarden Dollar führt. Keller leitete zuvor die Architekturarbeit bei Apple, AMD und Tesla. Zusammen zielen die beiden Schritte aus zwei Richtungen auf dasselbe Ziel.

Warum ist das eine ernstere Bedrohung als frühere Nvidia-Herausforderer?

Weil sie genau dort ansetzt, wo Nvidia messbar schwächer ist, nicht dort, wo es am stärksten ist. Nvidia hält umsatzseitig weiterhin rund 80 Prozent des Marktes für KI-Beschleuniger, und sein Griff auf das Training liegt Berichten zufolge über 90 Prozent. Doch bei der Inferenz ist sein Anteil niedriger, gemeldet im Bereich von 60 bis 75 Prozent, und die Inferenz ist der am schnellsten wachsende Teil der KI-Ausgaben, der bis 2026 voraussichtlich rund zwei Drittel aller KI-Rechenausgaben erreichen wird. Inferenz ist zudem preissensibler und weniger abhängig von Nvidias CUDA-Software, die der eigentliche Burggraben ist. Ein Herausforderer, der in einem sich zur Inferenz verschiebenden Markt bei den Kosten pro Abfrage gewinnt, ist ein anderes Kaliber als einer, der einen schnelleren Trainingschip verspricht.

Was fügt der Tenstorrent-Aspekt hinzu, das ein Chip allein nicht bietet?

Eigentum. Tenstorrent baut auf RISC-V auf, einer offenen Befehlssatz-Architektur, die Kunden lizenzieren und um die herum sie entwerfen können, statt sie zu den Bedingungen eines einzigen Anbieters zu mieten. Tenstorrent führte Berichten zufolge Ende 2025 Gespräche über eine Finanzierung von rund 800 Millionen Dollar unter Führung von Fidelity bei einer Bewertung von etwa 3,2 Milliarden Dollar, nachdem es Ende 2024 eine Series D von mehr als 693 Millionen unter Führung von Samsung Securities und AFW Partners abgeschlossen hatte. Wenn Qualcomm es nahe der gemeldeten Marke von 10 Milliarden Dollar übernimmt, ist die strategische Logik nicht nur ein weiterer Beschleuniger. Es ist ein Weg für Hyperscaler und Großunternehmen, einen größeren Teil ihres Rechen-Stacks zu besitzen, statt ihn zu leasen. Für eine Branche, die gerade erkennt, wie viel ihrer Kostenbasis bei einem einzigen Lieferanten liegt, ist das der Teil, der Beachtung verdient.

Was sollten ein Eigentümer oder ein Family Office daraus mitnehmen?

Behandeln Sie die Lieferantenkonzentration in Ihrer KI-Infrastruktur als Bilanzfrage, nicht als technische Randnotiz. Die Schlagzeile ist eine Börsenrivalität. Die Substanz ist, dass sich die Kosten des KI-Betriebs von einer einmaligen Trainingsausgabe hin zu einem dauerhaften Inferenz-Posten verschieben, und dieser Posten läuft derzeit fast vollständig über einen einzigen Anbieter. Servola berät Eigentümer und Family Offices zu Infrastruktur- und Lieferantenstrategie, und der wiederkehrende Befund ist stets derselbe: Portfoliounternehmen wissen selten, welcher Anteil ihrer KI-Kosten an eine einzige Architektur gebunden ist oder was es kosten würde, eine Alternative zu qualifizieren. Die Schritte von Qualcomm und Tenstorrent sind ein frühes Indiz dafür, dass glaubwürdige Alternativen entstehen. Die Aufgabe besteht darin, Ihr Risiko zu kennen, bevor sich die Rechnung aufsummiert.