Co Mistral otworzył

Dnia 2 lipca 2026 francuskie laboratorium AI Mistral wydało Leanstral 1.5 na licencji Apache-2.0, z otwartymi wagami na Hugging Face i darmowym punktem końcowym API. Według własnego ogłoszenia Mistrala to model typu mixture-of-experts, 119 mld parametrów łącznie, z około 6 mld aktywnych i kontekstem 256k tokenów, wyspecjalizowany w formalnym dowodzeniu twierdzeń w Lean 4 i autoformalizacji. Mówiąc prosto, dowodzenie w Lean 4 to zamiana twierdzenia o twoim oprogramowaniu na zdanie, które maszyna sprawdza linia po linii, tak że poprawność jest wykazana, a nie założona.

Wyniki testów odniesienia zbliżają się do nasycenia: 100 procent na zbiorach walidacyjnym i testowym miniF2F, 587 z 672 zadań PutnamBench rozwiązanych, 87 procent na FATE-H i 34 procent na FATE-X, z silnym skalowaniem w czasie obliczeń, od 44 zadań przy małym budżecie do 587 przy dużym. Bardziej wymowne dla właściciela, w testach model ujawnił 5 dotąd nieznanych błędów w 57 repozytoriach kodu, w tym krytyczne przepełnienie w bibliotece dekodowania zigzag, które zwykłe testy zazwyczaj pomijają.

Pisanie kodu było łatwiejszą połową

Skłonienie AI do pisania kodu jest w dużej mierze rozwiązane. Udowodnienie, że kod jest poprawny, nie jest, a to ta połowa, która liczy się przy wszystkim, na czego błąd nie możesz sobie pozwolić. Gdy modele generują coraz więcej twojego oprogramowania, ilość kodu przewyższa ludzką zdolność przeglądu, a warstwa weryfikacji po cichu staje się wąskim gardłem i prawdziwą gwarancją.

Dlatego silnik dowodów jak Leanstral waży więcej niż kolejny generator kodu. Dla oprogramowania krytycznego i regulowanego dowodliwa poprawność przechodzi od akademickiego luksusu ku realistycznemu wymogowi przetargowemu, gdzie wykazany dowód znaczy tyle, ile nie dorówna żadna zaliczona seria testów. Właściciel, który potrafi wykazać, że komponent jest udowodniony, a nie tylko przetestowany, negocjuje z mocniejszej pozycji wobec regulatorów, ubezpieczycieli i klientów.

Posiadać weryfikator

Punkt suwerenności nie jest tu kolejnym chatbotem. To weryfikator. Ponieważ Leanstral dostarczany jest jako europejskie otwarte wagi na licencji Apache-2.0, warstwę sprawdzającą uruchamiasz u siebie, dokładnie widzisz, co robi, i ją zachowujesz, zamiast wołać amerykańskie API i ufać czarnej skrzynce, której ani nie widzisz, ani nie zatrzymujesz.

Dzięki temu warstwa zaufania twojego łańcucha dostaw oprogramowania pozostaje audytowalna i pod twoją kontrolą. Gdy maszyny piszą kod, rozstrzygające pytanie brzmi, kto jest właścicielem maszyny, która sprawdza maszynę. Silnik dowodów, który sam uruchamiasz, odpowiada na to pytanie na twoją korzyść, nie zmuszając cię do oddania najwrażliwszego kodu obcej usłudze.