Che cosa ha reso open Mistral

Il 2 luglio 2026 il laboratorio francese di IA Mistral ha rilasciato Leanstral 1.5 sotto licenza Apache-2.0, con pesi aperti su Hugging Face e un endpoint API gratuito. Secondo l'annuncio di Mistral è un modello a mistura di esperti, 119B di parametri totali con circa 6B attivi e un contesto da 256k token, specializzato nella dimostrazione formale di teoremi in Lean 4 e nell'autoformalizzazione. In parole semplici, provare in Lean 4 significa trasformare un'affermazione sul vostro software in un enunciato che una macchina controlla riga per riga, cosicché la correttezza è dimostrata anziché presunta.

I risultati sui benchmark sono vicini alla saturazione: 100 per cento sui set di validazione e test di miniF2F, 587 di 672 problemi PutnamBench risolti, 87 per cento su FATE-H e 34 per cento su FATE-X, con un forte scaling al momento del calcolo, da 44 problemi con poco budget fino a 587 con molto. Più significativo per un proprietario, nei test il modello ha scoperto 5 bug prima ignoti in 57 repository di codice, tra cui un overflow critico in una libreria di decodifica zigzag che i test convenzionali di norma non colgono.

Scrivere il codice era la metà facile

Far scrivere codice a un'IA è ormai in gran parte risolto. Provare che quel codice è corretto no, ed è la metà che conta per tutto ciò che non potete permettervi sbagliato. Man mano che i modelli generano più software, il volume di codice supera la capacità umana di revisione, e lo strato di verifica diventa in silenzio il collo di bottiglia e la vera garanzia.

Ecco perché un motore di prove come Leanstral pesa più di un ennesimo generatore di codice. Per il software critico e regolamentato la correttezza dimostrabile passa da lusso accademico a requisito realistico di appalto, dove una prova dimostrata vale ciò che nessuna suite di test superati può eguagliare. Il proprietario capace di attestare che un componente è provato, e non solo testato, tratta da una posizione più solida con enti regolatori, assicuratori e clienti.

Possedere il controllore

Il punto di sovranità qui non è un altro chatbot. È il verificatore. Poiché Leanstral è distribuito come pesi aperti europei sotto Apache-2.0, potete eseguire lo strato di controllo in casa, ispezionare esattamente ciò che fa e conservarlo, invece di chiamare un'API statunitense e fidarvi di una scatola nera che non vedete né trattenete.

Così lo strato di fiducia della vostra catena di fornitura software resta verificabile e sotto il vostro controllo. Quando le macchine scrivono il codice, la domanda decisiva è chi possiede la macchina che controlla la macchina. Un motore di prove che eseguite voi stessi risponde a quella domanda a vostro favore, senza costringervi a cedere il codice più sensibile a un servizio esterno.