Was Mistral offengelegt hat

Am 2. Juli 2026 veröffentlichte das französische KI-Labor Mistral Leanstral 1.5 unter einer Apache-2.0-Lizenz, mit offenen Gewichten auf Hugging Face und einem kostenlosen API-Endpunkt. Laut Mistrals eigener Ankündigung handelt es sich um ein Mixture-of-Experts-Modell mit 119 Mrd. Parametern insgesamt, davon etwa 6 Mrd. aktiv, mit einem Kontext von 256k Token, spezialisiert auf formales Theorembeweisen in Lean 4 und Autoformalisierung. Vereinfacht heißt Beweisen in Lean 4, eine Aussage über Ihre Software in einen Satz zu verwandeln, den eine Maschine Zeile für Zeile prüfen kann, sodass Korrektheit belegt und nicht bloß angenommen wird.

Die Benchmark-Werte sind nahe an der Sättigung: 100 Prozent auf den miniF2F-Validierungs- und Testsätzen, 587 von 672 PutnamBench-Aufgaben gelöst, 87 Prozent auf FATE-H und 34 Prozent auf FATE-X, mit starker Test-Time-Skalierung von 44 Aufgaben bei kleinem Rechenbudget bis auf 587 bei großem. Für Eigentümer aufschlussreicher: Im Test deckte das Modell 5 bisher unbekannte Fehler in 57 Code-Repositorien auf, darunter einen kritischen Überlauf in einer Zigzag-Decoding-Bibliothek, den herkömmliche Tests üblicherweise übersehen würden.

Code schreiben war die leichte Hälfte

Eine KI Code schreiben zu lassen, ist weitgehend gelöst. Zu beweisen, dass der Code korrekt ist, ist es nicht, und das ist die Hälfte, die zählt für alles, was Sie sich nicht falsch leisten können. Je mehr Modelle Ihre Software erzeugen, desto stärker übersteigt die Menge des Codes die menschliche Prüfkapazität, und die Verifikationsschicht wird still zum Engpass und zur eigentlichen Absicherung.

Genau darum wiegt ein Beweismotor wie Leanstral schwerer als ein weiterer Code-Generator. In der deutschen Ingenieurkultur ist geprüftes Vertrauen längst Standard, von TUV-artigen Abnahmen bis zur Absicherung in Automobil und Industrie. Beweisbare Korrektheit rückt von akademischem Luxus zu einer realistischen Beschaffungsvorgabe für kritische und regulierte Software, wo ein belegter Beweis mehr wiegt als jede bestandene Testreihe.

Den Prüfer besitzen

Der Souveränitätspunkt ist hier kein weiterer Chatbot. Es ist der Prüfer. Weil Leanstral als europäische offene Gewichte unter Apache-2.0 ausgeliefert wird, können Sie die Prüfschicht im Haus betreiben, genau einsehen, was sie tut, und sie behalten, statt eine US-API aufzurufen und einer Blackbox zu vertrauen, die Sie weder sehen noch bewahren.

So bleibt die Vertrauensschicht Ihrer Software-Lieferkette prüfbar und unter Ihrer Kontrolle. Wenn Maschinen den Code schreiben, lautet die entscheidende Frage, wem die Maschine gehört, die die Maschine prüft. Ein Beweismotor, den Sie selbst betreiben, beantwortet diese Frage zu Ihren Gunsten, ohne dass Sie Ihren sensibelsten Code an einen fremden Dienst abgeben müssen.