Negentien dagen offline, op last van de overheid
Op 30 juni 2026 maakte Anthropic bekend dat het Amerikaanse ministerie van Handel de exportcontroles op Claude Fable 5 en Mythos 5 had opgeheven, en begon de dag erna met het herstellen van de toegang. De schorsing duurde 19 dagen: opgelegd op 12 juni, vereiste ze dat elke buitenlandse burger overal werd geblokkeerd, een voorwaarde die Anthropic niet realtime kon controleren, dus haalde het beide modellen voor iedereen offline. CNBC, Decrypt en The Hacker News versloegen de afsluiting en de ommekeer.
De aanleiding was specifiek. Onderzoekers bij Amazon hadden een manier gedemonstreerd om de beveiligingen van Fable 5 te omzeilen en het model softwarekwetsbaarheden te laten identificeren en uitbuitingstechnieken te laten demonstreren. De overheid behandelde een gejailbreakt frontier-model als een gecontroleerde cybercapaciteit, en de markt leerde dat een model per aanwijzing kan worden uitgeschakeld, midden in het contract, wereldwijd.
Wat de toegang werkelijk terugkocht
Het model kwam niet terug omdat het bevel afliep. Het kwam terug omdat Anthropic een oplossing en een argument voorlegde. De oplossing is een hertraind veiligheidsclassificatiemodel gericht op de gemelde techniek, dat die volgens het bedrijf nu in meer dan 99 procent van de pogingen blokkeert; gemarkeerde verzoeken worden met een melding aan de gebruiker omgeleid naar Claude Opus 4.8, een minder capabel model. Anthropic erkent dat het strakkere net ook meer legitiem werk vangt en accepteert meer vals-positieven bij routinematig programmeren als bewuste veiligheidsmarge.
Het argument weegt minstens zo zwaar: capaciteitspariteit. Anthropic documenteerde dat minder capabele, vrij beschikbare modellen, waaronder het eigen Opus 4.8, OpenAI's GPT-5.5 en Kimi K2.7, dezelfde kwetsbaarheidsdemonstraties konden repliceren. Als een capaciteit overal is, beperkt het controleren van het model van een leverancier niets. Die logica heropende Fable 5, en ze bepaalt stilletjes hoe toekomstige controles werken: ze grijpen alleen aan de uiterste top van de capaciteitscurve, terwijl de vloer eronder blijft stijgen.
Het raamwerk, twee dagen later gepubliceerd
Op 2 juli publiceerde Anthropic de machinerie achter de oplossing. Cyberverzoeken worden in vier niveaus gesorteerd: verboden gebruik zoals ransomware en data-exfiltratie, volledig geblokkeerd; dubbelgebruik met hoog risico zoals exploit-ontwikkeling en privilege-escalatie, grotendeels geblokkeerd totdat betere toegangscontroles bestaan; dubbelgebruik met laag risico zoals open-source-inlichtingen en kwetsbaarheidsidentificatie binnen de mogelijkheden van bestaande tools, toegestaan met monitoring; en goedaardig werk zoals veilig programmeren en incidentrespons, toegestaan met minimale wrijving.
Daarnaast kwam een voorgestelde jailbreak-ernstschaal, CJS, van 0 voor informatief tot 4 voor kritiek, gescoord op vier assen: hoeveel capaciteit de jailbreak toevoegt boven bestaande tools, hoeveel offensieve taken hij mogelijk maakt, hoe makkelijk hij te bewapenen is en hoe vindbaar hij is. Een HackerOne-premieprogramma voor het vinden van jailbreaks begeleidt het raamwerk, dat Anthropic uitdrukkelijk een vroege versie noemt.
CVSS voor jailbreaks, en waar het zich verspreidt
Beveiligingsteams kennen deze film. CVSS begon als de scoreconventie van een leverancier en werd het getal waar elke patchbeslissing, elke inkoopvragenlijst en elk cyberverzekeringsformulier om vraagt. Een jailbreak-ernstschaal vult hetzelfde vacuüm: als vandaag een omzeilingstechniek rondgaat, heeft een CISO geen standaardmanier om te zeggen hoe erg die is. CJS, of de opvolger waar de sector op uitkomt, geeft risicocomités, toezichthouders en verzekeraars een gemene deler voor blootstelling aan AI-modellen.
Voor Europese operators is de richting concreet: verwacht dat AI-leveranciersvragenlijsten een jailbreak-ernstsectie krijgen, dat cyberverzekeraars vragen welke modellen u aan onvertrouwde invoer blootstelt, en dat de safety case, classificatiebewijs plus ernstscore, het document wordt dat beslist of een model in gereguleerde processen onder kaders als NIS2 mag draaien.
De les voor operators: beschikbaarheid is nu voorwaardelijk
Het diepere feit van deze episode is niet de jailbreak maar de 19 dagen. Een frontier-model met bedrijfscontracten ging wereldwijd op zwart per overheidsbevel en kwam pas terug toen een safety case de toezichthouder overtuigde. Modelbeschikbaarheid is nu aan bewijs gebonden, en storingen van deze klasse zijn een aangetoonde faalwijze, geen hypothese. Elk bedrijf waarvan de processen op een enkele frontier-API leunen, zou dat moeten behandelen als een fabrieksgrondstof met een enkele leverancier: met een geteste failover naar een tweede model, een geschreven omschakelprocedure en een contract dat regelt wat er met de tarieven gebeurt als het product wordt uitgezet door iemand bij wie geen van beide partijen in beroep kan.
Lees hierna: Cybercrime leent uw thuisinternet · Jouw AI-agent vertrouwt een vergiftigd tool



