Infrastructure

Die erste ernsthafte Herausforderung für Nvidia ist keine bessere GPU. Es ist die Inferenz-Ebene.

Qualcomms AI200/AI250 und ein gemeldeter 10-Mrd.-Vorstoß auf Tenstorrent zielen auf die Inferenz-Ebene, wo Nvidia am schwächsten ist. Warum Eigentümer auf die Chips achten sollten, nicht auf die Schlagzeilen.

Von Leon Soliman · 2026-06-19 · 3 Min. Lesezeit

Die wichtigsten Punkte

Qualcomm hat am 28. Oktober 2025 seine Rechenzentrums-Beschleuniger AI200 und AI250 vorgestellt, gebaut für KI-Inferenz statt für das Training, wobei der AI200 für 2026 und der AI250 für 2027 zur kommerziellen Verfügbarkeit vorgesehen ist.
Qualcomm führt Berichten zufolge Gespräche über die Übernahme des Chip-Start-ups Tenstorrent von Jim Keller zu einer Bewertung von rund 8 bis 10 Milliarden Dollar, zuerst gemeldet von The Information im Juni 2026 und aufgegriffen von Reuters, The Register und Tom's Hardware.
Nvidia hält umsatzseitig weiterhin rund 80 Prozent des Marktes für KI-Beschleuniger, doch sein Anteil speziell bei der Inferenz ist niedriger, Berichten zufolge im Bereich von 60 bis 75 Prozent, und die Inferenz dürfte bis 2026 rund zwei Drittel der gesamten KI-Rechenausgaben ausmachen.
Der Wettbewerb hat sich von der reinen Trainingsleistung hin zu den Inferenzkosten pro Abfrage und zur Software-Bindung verschoben, wo Nvidias CUDA-Vorteil schwächer ist.
Tenstorrents Wette ist RISC-V, ein offener Befehlssatz, der Käufern erlaubt, Architektur zu lizenzieren und zu besitzen, statt sie zu mieten, was eine andere Art von Bedrohung darstellt als ein schnellerer Chip.

Was genau tun Qualcomm und Tenstorrent?

Sie greifen die Inferenz an, jenen Teil der KI, der jedes Mal läuft, wenn ein Modell eine Abfrage beantwortet, statt das Training, den Bereich, den Nvidia am stärksten dominiert. Am 28. Oktober 2025 stellte Qualcomm zwei Rechenzentrums-Beschleuniger vor, den AI200 und den AI250, gebaut auf der eigenen Technologie für neuronale Recheneinheiten und klar auf Inferenzkosten und Energieeffizienz ausgerichtet, wobei der AI200 2026 und der AI250 2027 kommerziell verfügbar sein sollen. Davon getrennt meldete The Information im Juni 2026, mit Folgeberichterstattung von Reuters, The Register und Tom's Hardware, dass Qualcomm Gespräche über den Kauf von Jim Kellers Start-up Tenstorrent zu einer Bewertung von rund 8 bis 10 Milliarden Dollar führt. Keller leitete zuvor die Architekturarbeit bei Apple, AMD und Tesla. Zusammen zielen die beiden Schritte aus zwei Richtungen auf dasselbe Ziel.

Warum ist das eine ernstere Bedrohung als frühere Nvidia-Herausforderer?

Weil sie genau dort ansetzt, wo Nvidia messbar schwächer ist, nicht dort, wo es am stärksten ist. Nvidia hält umsatzseitig weiterhin rund 80 Prozent des Marktes für KI-Beschleuniger, und sein Griff auf das Training liegt Berichten zufolge über 90 Prozent. Doch bei der Inferenz ist sein Anteil niedriger, gemeldet im Bereich von 60 bis 75 Prozent, und die Inferenz ist der am schnellsten wachsende Teil der KI-Ausgaben, der bis 2026 voraussichtlich rund zwei Drittel aller KI-Rechenausgaben erreichen wird. Inferenz ist zudem preissensibler und weniger abhängig von Nvidias CUDA-Software, die der eigentliche Burggraben ist. Ein Herausforderer, der in einem sich zur Inferenz verschiebenden Markt bei den Kosten pro Abfrage gewinnt, ist ein anderes Kaliber als einer, der einen schnelleren Trainingschip verspricht.

Was fügt der Tenstorrent-Aspekt hinzu, das ein Chip allein nicht bietet?

Eigentum. Tenstorrent baut auf RISC-V auf, einer offenen Befehlssatz-Architektur, die Kunden lizenzieren und um die herum sie entwerfen können, statt sie zu den Bedingungen eines einzigen Anbieters zu mieten. Tenstorrent führte Berichten zufolge Ende 2025 Gespräche über eine Finanzierung von rund 800 Millionen Dollar unter Führung von Fidelity bei einer Bewertung von etwa 3,2 Milliarden Dollar, nachdem es Ende 2024 eine Series D von mehr als 693 Millionen unter Führung von Samsung Securities und AFW Partners abgeschlossen hatte. Wenn Qualcomm es nahe der gemeldeten Marke von 10 Milliarden Dollar übernimmt, ist die strategische Logik nicht nur ein weiterer Beschleuniger. Es ist ein Weg für Hyperscaler und Großunternehmen, einen größeren Teil ihres Rechen-Stacks zu besitzen, statt ihn zu leasen. Für eine Branche, die gerade erkennt, wie viel ihrer Kostenbasis bei einem einzigen Lieferanten liegt, ist das der Teil, der Beachtung verdient.

Was sollten ein Eigentümer oder ein Family Office daraus mitnehmen?

Behandeln Sie die Lieferantenkonzentration in Ihrer KI-Infrastruktur als Bilanzfrage, nicht als technische Randnotiz. Die Schlagzeile ist eine Börsenrivalität. Die Substanz ist, dass sich die Kosten des KI-Betriebs von einer einmaligen Trainingsausgabe hin zu einem dauerhaften Inferenz-Posten verschieben, und dieser Posten läuft derzeit fast vollständig über einen einzigen Anbieter. Servola berät Eigentümer und Family Offices zu Infrastruktur- und Lieferantenstrategie, und der wiederkehrende Befund ist stets derselbe: Portfoliounternehmen wissen selten, welcher Anteil ihrer KI-Kosten an eine einzige Architektur gebunden ist oder was es kosten würde, eine Alternative zu qualifizieren. Die Schritte von Qualcomm und Tenstorrent sind ein frühes Indiz dafür, dass glaubwürdige Alternativen entstehen. Die Aufgabe besteht darin, Ihr Risiko zu kennen, bevor sich die Rechnung aufsummiert.

Weiterlesen: Alphabet nimmt 80 Milliarden Dollar für KI auf. Das ist Ihr Signal, den Wettlauf um Infrastruktur zu beenden. · DeepSeek V4 ist gratis zu besitzen. Die meisten Firmen mieten es trotzdem pro Token.

Häufig gestellte Fragen

Schlägt Qualcomm Nvidia jetzt tatsächlich?

Nein. Stand Mitte 2026 hält Nvidia umsatzseitig weiterhin rund 80 Prozent des Marktes für KI-Beschleuniger, und Qualcomms AI200 ist erst für 2026 zur kommerziellen Verfügbarkeit vorgesehen, der AI250 für 2027. Die Bedeutung liegt im Ziel, Inferenz und Kosten, nicht im aktuellen Marktanteil.

Hat Qualcomm bestätigt, dass es Tenstorrent kauft?

Nein. Stand Juni 2026 wurden die Gespräche zuerst von The Information gemeldet und von Reuters, The Register und Tom's Hardware zu einer Bewertung von rund 8 bis 10 Milliarden Dollar aufgegriffen, und die Berichterstattung wies darauf hin, dass es keine Garantie für einen Abschluss gibt. Behandeln Sie es als gemeldete Verhandlung, nicht als abgeschlossene Übernahme.

Warum ist die Inferenz für die Kosten wichtiger als das Training?

Das Training geschieht einmal, um ein Modell zu bauen, während die Inferenz jedes Mal läuft, wenn das Modell eine Abfrage beantwortet, sodass die Inferenz für jedes Unternehmen, das KI in großem Maßstab nutzt, zur wiederkehrenden Kostenstelle wird. Die Inferenz dürfte bis 2026 rund zwei Drittel der KI-Rechenausgaben ausmachen, weshalb sich der Wettbewerb dort konzentriert.

Der erste echte Riss in Nvidias Position kam nicht von einem schnelleren Chip. Er kam aus der Erkenntnis, dass die Inferenz der Ort ist, an dem das Geld hinfließt und an dem die Bindung am dünnsten ist, und die klugen Eigentümer kartieren dieses Risiko jetzt, statt später davon zu lesen.

AI Infrastructure Semiconductors Nvidia Vendor Strategy

Mehr aus dem Servola Journal

Infrastructure

Alphabet nimmt 80 Milliarden Dollar für KI auf. Das ist Ihr Signal, den Wettlauf um Infrastruktur zu beenden.

2026-06-21 · 2 Min. Lesezeit

Beitrag lesen →

Infrastructure

DeepSeek V4 ist gratis zu besitzen. Die meisten Firmen mieten es trotzdem pro Token.

2026-06-20 · 3 Min. Lesezeit

Beitrag lesen →

Infrastructure

Nvidia finanziert die Labore, die seine Chips kaufen. Bezahlt sich der KI-Boom selbst?

2026-06-19 · 3 Min. Lesezeit

Beitrag lesen →

Servola

Wenn Ihre KI-Kostenbasis über einen einzigen Chiplieferanten läuft, ist das genau das Risiko, das wir kartieren und planen, leise, mit einem verantwortlichen Ansprechpartner.

Vertrauliches Gespräch anfragen Über Servola →

Servola ist technologische Beratung für einige wenige Familien und Family Offices. Wenn eine Entscheidung nicht delegierbar ist, sitzen wir auf Ihrer Seite des Tisches.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alle Beiträge