Cybersecurity

Een teruggetrokken frontier-model is weer online

De VS hieven de exportcontroles op Claude Fable 5 na 19 dagen op. Anthropic kocht de toegang terug met een hertraind classificatiemodel en een CVSS-achtige jailbreak-ernstschaal. Wat dit betekent voor operators.

CybersecurityDoor Servola Tech Desk2026-07-044 min leestijd

AI-ondersteund, door mensen geredigeerd. Editorial standards

Een teruggetrokken frontier-model is weer online

Belangrijkste punten

Het Amerikaanse ministerie van Handel hief op 30 juni 2026 de exportcontroles op Claude Fable 5 en Mythos 5 op, na een schorsing van 19 dagen; de toegang werd vanaf 1 juli wereldwijd hersteld, met heractivering op de cloudplatforms, zo melden CNBC en The Hacker News.
De controles volgden op een jailbreak van Amazon-onderzoekers die Fable 5 softwarekwetsbaarheden liet identificeren en de uitbuiting liet demonstreren; Anthropic antwoordde met een hertraind veiligheidsclassificatiemodel dat de techniek naar eigen zeggen in ruim 99 procent van de pogingen blokkeert en gemarkeerde verzoeken omleidt naar een minder capabel model.
Onderdeel van het vrijgave-argument was capaciteitspariteit: andere beschikbare modellen, waaronder GPT-5.5 en Kimi K2.7, konden dezelfde demonstraties repliceren, dus het beperken van een model beperkte de capaciteit niet meer.
Twee dagen na de herstart publiceerde Anthropic een taxonomie met vier niveaus voor cyberverzoeken en een voorgestelde CJS-jailbreak-ernstschaal van 0 tot 4, gescoord op capaciteitswinst, breedte, bewapenbaarheid en vindbaarheid, een CVSS-achtig instrument dat inkoop en verzekeraars naar verwachting zullen overnemen.

Negentien dagen offline, op last van de overheid

Op 30 juni 2026 maakte Anthropic bekend dat het Amerikaanse ministerie van Handel de exportcontroles op Claude Fable 5 en Mythos 5 had opgeheven, en begon de dag erna met het herstellen van de toegang. De schorsing duurde 19 dagen: opgelegd op 12 juni, vereiste ze dat elke buitenlandse burger overal werd geblokkeerd, een voorwaarde die Anthropic niet realtime kon controleren, dus haalde het beide modellen voor iedereen offline. CNBC, Decrypt en The Hacker News versloegen de afsluiting en de ommekeer.

De aanleiding was specifiek. Onderzoekers bij Amazon hadden een manier gedemonstreerd om de beveiligingen van Fable 5 te omzeilen en het model softwarekwetsbaarheden te laten identificeren en uitbuitingstechnieken te laten demonstreren. De overheid behandelde een gejailbreakt frontier-model als een gecontroleerde cybercapaciteit, en de markt leerde dat een model per aanwijzing kan worden uitgeschakeld, midden in het contract, wereldwijd.

Wat de toegang werkelijk terugkocht

Het model kwam niet terug omdat het bevel afliep. Het kwam terug omdat Anthropic een oplossing en een argument voorlegde. De oplossing is een hertraind veiligheidsclassificatiemodel gericht op de gemelde techniek, dat die volgens het bedrijf nu in meer dan 99 procent van de pogingen blokkeert; gemarkeerde verzoeken worden met een melding aan de gebruiker omgeleid naar Claude Opus 4.8, een minder capabel model. Anthropic erkent dat het strakkere net ook meer legitiem werk vangt en accepteert meer vals-positieven bij routinematig programmeren als bewuste veiligheidsmarge.

Het argument weegt minstens zo zwaar: capaciteitspariteit. Anthropic documenteerde dat minder capabele, vrij beschikbare modellen, waaronder het eigen Opus 4.8, OpenAI's GPT-5.5 en Kimi K2.7, dezelfde kwetsbaarheidsdemonstraties konden repliceren. Als een capaciteit overal is, beperkt het controleren van het model van een leverancier niets. Die logica heropende Fable 5, en ze bepaalt stilletjes hoe toekomstige controles werken: ze grijpen alleen aan de uiterste top van de capaciteitscurve, terwijl de vloer eronder blijft stijgen.

Het raamwerk, twee dagen later gepubliceerd

Op 2 juli publiceerde Anthropic de machinerie achter de oplossing. Cyberverzoeken worden in vier niveaus gesorteerd: verboden gebruik zoals ransomware en data-exfiltratie, volledig geblokkeerd; dubbelgebruik met hoog risico zoals exploit-ontwikkeling en privilege-escalatie, grotendeels geblokkeerd totdat betere toegangscontroles bestaan; dubbelgebruik met laag risico zoals open-source-inlichtingen en kwetsbaarheidsidentificatie binnen de mogelijkheden van bestaande tools, toegestaan met monitoring; en goedaardig werk zoals veilig programmeren en incidentrespons, toegestaan met minimale wrijving.

Daarnaast kwam een voorgestelde jailbreak-ernstschaal, CJS, van 0 voor informatief tot 4 voor kritiek, gescoord op vier assen: hoeveel capaciteit de jailbreak toevoegt boven bestaande tools, hoeveel offensieve taken hij mogelijk maakt, hoe makkelijk hij te bewapenen is en hoe vindbaar hij is. Een HackerOne-premieprogramma voor het vinden van jailbreaks begeleidt het raamwerk, dat Anthropic uitdrukkelijk een vroege versie noemt.

CVSS voor jailbreaks, en waar het zich verspreidt

Beveiligingsteams kennen deze film. CVSS begon als de scoreconventie van een leverancier en werd het getal waar elke patchbeslissing, elke inkoopvragenlijst en elk cyberverzekeringsformulier om vraagt. Een jailbreak-ernstschaal vult hetzelfde vacuüm: als vandaag een omzeilingstechniek rondgaat, heeft een CISO geen standaardmanier om te zeggen hoe erg die is. CJS, of de opvolger waar de sector op uitkomt, geeft risicocomités, toezichthouders en verzekeraars een gemene deler voor blootstelling aan AI-modellen.

Voor Europese operators is de richting concreet: verwacht dat AI-leveranciersvragenlijsten een jailbreak-ernstsectie krijgen, dat cyberverzekeraars vragen welke modellen u aan onvertrouwde invoer blootstelt, en dat de safety case, classificatiebewijs plus ernstscore, het document wordt dat beslist of een model in gereguleerde processen onder kaders als NIS2 mag draaien.

De les voor operators: beschikbaarheid is nu voorwaardelijk

Het diepere feit van deze episode is niet de jailbreak maar de 19 dagen. Een frontier-model met bedrijfscontracten ging wereldwijd op zwart per overheidsbevel en kwam pas terug toen een safety case de toezichthouder overtuigde. Modelbeschikbaarheid is nu aan bewijs gebonden, en storingen van deze klasse zijn een aangetoonde faalwijze, geen hypothese. Elk bedrijf waarvan de processen op een enkele frontier-API leunen, zou dat moeten behandelen als een fabrieksgrondstof met een enkele leverancier: met een geteste failover naar een tweede model, een geschreven omschakelprocedure en een contract dat regelt wat er met de tarieven gebeurt als het product wordt uitgezet door iemand bij wie geen van beide partijen in beroep kan.

Lees hierna: Cybercrime leent uw thuisinternet · Jouw AI-agent vertrouwt een vergiftigd tool

Veelgestelde vragen

Waarom gingen Fable 5 en Mythos 5 offline?

Een exportcontrolebevel van het Amerikaanse ministerie van Handel van 12 juni 2026 volgde op een jailbreak van Amazon-onderzoekers die Fable 5 kwetsbaarheden liet identificeren en de uitbuiting liet demonstreren. Het bevel verbood toegang voor buitenlandse burgers, wat Anthropic niet realtime kon controleren, dus schorste het beide modellen volledig.

Wat veranderde er om de herstart mogelijk te maken?

Anthropic hertrainde een veiligheidsclassificatiemodel dat de gemelde techniek naar eigen zeggen in ruim 99 procent van de pogingen blokkeert en gemarkeerde verzoeken omleidt naar een minder capabel model, en documenteerde dat andere beschikbare modellen dezelfde demonstraties konden repliceren. De controles vervielen op 30 juni en de toegang keerde vanaf 1 juli terug.

Wat is de CJS-jailbreak-ernstschaal?

Een voorgestelde vijftrapsbeoordeling van CJS-0 tot CJS-4, op 2 juli gepubliceerd door Anthropic, die jailbreaks scoort op capaciteitswinst, breedte van mogelijk gemaakte taken, bewapenbaarheid en vindbaarheid, bewust analoog aan CVSS in kwetsbaarheidsbeheer. Het is een vroege versie, met een HackerOne-premieprogramma erbij.

Het eerste frontier-model dat door een overheid werd uitgeschakeld, kwam niet terug via advocaten. Het kwam terug via bewijs: een classificatiemodel, een ernstschaal en een gedocumenteerde safety case. Dat is de nieuwe vorm van AI-beschikbaarheid, en die snijdt aan twee kanten. Leveranciers die veiligheid kunnen bewijzen, mogen kracht verkopen, en operators die veerkracht kunnen bewijzen, mogen erop leunen. Alle anderen zijn een aanwijzing verwijderd van negentien stille dagen.

Anthropic Export Controls Jailbreak AI Security Cybersecurity Model Governance

Meer uit het Servola Journal

Cybersecurity

Cybercrime leent uw thuisinternet

Google en de FBI ontmantelden NetNut, een proxynetwerk van minstens 2 miljoen thuisapparaten dat in een week door 316 dreigingsgroepen werd gebruikt. Waarom IP-reputatie dood is en uw apparaten de nieuwe perimeter zijn.

3 min leestijd

Cybersecurity

Jouw AI-agent vertrouwt een vergiftigd tool

Microsoft waarschuwt dat een vergiftigde tool-beschrijving jouw AI-agent kan veranderen in een datalek, zonder een regel te schenden of een bug te misbruiken. Wat ondernemers moeten vastzetten.

2 min leestijd1 weergaven

Cybersecurity

Je AI-browser kan je wachtwoorden lekken

Onderzoekers toonden aan dat een geboobytrapte webpagina een browser-AI-agent uit zijn eigen veiligheidsregels kan praten en wachtwoorden en toegang laat prijsgeven. Wat eigenaren moeten doen.

2 min leestijd1 weergaven

Servola

Servola helpt eigenaren model-failoverplannen en AI-leverancierseisen te bouwen voor de volgende beschikbaarheidsschok, niet erna.

Vraag een vertrouwelijk gesprek aan Over Servola →

Servola is technologisch advies voor een klein aantal families en family offices. Wanneer een beslissing niet kan worden gedelegeerd, zitten wij aan uw kant van de tafel.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alle artikelen