Nitton dagar offline, på regeringens order
Den 30 juni 2026 meddelade Anthropic att det amerikanska handelsdepartementet hade hävt de exportkontroller det lagt på Claude Fable 5 och Mythos 5, och började återställa åtkomsten dagen därpå. Avstängningen varade 19 dagar: pålagd den 12 juni krävde den att varje utländsk medborgare överallt blockerades, ett villkor Anthropic inte kunde verifiera i realtid, så båda modellerna togs offline för alla. CNBC, Decrypt och The Hacker News bevakade nedsläckningen och helomvändningen.
Utlösaren var specifik. Forskare hos Amazon hade demonstrerat ett sätt att kringgå Fable 5:s skydd och få modellen att identifiera mjukvarusårbarheter och demonstrera utnyttjandetekniker. Regeringen behandlade en jailbreakad frontier-modell som en kontrollerad cyberförmåga, och marknaden lärde sig att en modell kan stängas av per direktiv, mitt i avtalet, världen över.
Vad som faktiskt köpte tillbaka åtkomsten
Modellen kom inte tillbaka för att ordern löpte ut. Den kom tillbaka för att Anthropic la fram en åtgärd och ett argument. Åtgärden är en omtränad säkerhetsklassificerare riktad mot den rapporterade tekniken, som enligt bolaget nu blockerar den i mer än 99 procent av försöken; flaggade förfrågningar omdirigeras till Claude Opus 4.8, en mindre kapabel modell, med besked till användaren. Anthropic medger att det tätare nätet också fångar mer legitimt arbete och accepterar fler falsklarm i rutinkodning som en avsiktlig säkerhetsmarginal.
Argumentet väger minst lika tungt: kapacitetsparitet. Anthropic dokumenterade att mindre kapabla, fritt tillgängliga modeller, däribland egna Opus 4.8, OpenAI:s GPT-5.5 och Kimi K2.7, kunde replikera samma sårbarhetsdemonstrationer. När en förmåga finns överallt begränsar kontroll av en leverantörs modell ingenting. Den logiken återöppnade Fable 5, och den definierar i det tysta hur framtida kontroller fungerar: de biter bara i toppen av kapacitetskurvan, medan golvet därunder fortsätter stiga.
Ramverket som publicerades två dagar senare
Den 2 juli publicerade Anthropic maskineriet bakom åtgärden. Cyberförfrågningar sorteras i fyra nivåer: förbjuden användning som ransomware och dataexfiltration, helt blockerad; högriskdubbelanvändning som exploit-utveckling och privilegie-eskalering, mestadels blockerad tills bättre åtkomstkontroller finns; lågriskdubbelanvändning som öppen underrättelseinhämtning och sårbarhetsidentifiering inom befintliga verktygs förmåga, tillåten med övervakning; och godartat arbete som säker kodning och incidenthantering, tillåtet med minimal friktion.
Samtidigt kom en föreslagen skala för jailbreak-allvar, CJS, från 0 för informativ till 4 för kritisk, poängsatt på fyra axlar: hur mycket förmåga jailbreaket tillför utöver befintliga verktyg, hur många offensiva uppgifter det möjliggör, hur lätt det kan göras till vapen och hur upptäckbart det är. Ett HackerOne-belöningsprogram för jailbreak-fynd åtföljer ramverket, som Anthropic uttryckligen kallar ett tidigt utkast.
CVSS för jailbreaks, och vart det sprider sig
Säkerhetsteam har sett den här filmen. CVSS började som en leverantörs poängkonvention och blev siffran som varje patchbeslut, inköpsformulär och cyberförsäkringsblankett frågar efter. En skala för jailbreak-allvar fyller samma vakuum: när en kringgåendeteknik cirkulerar i dag har en CISO inget standardsätt att säga hur illa den är. CJS, eller den efterträdare branschen enas om, ger riskkommittéer, tillsynsmyndigheter och försäkringsbolag en gemensam nämnare för exponering mot AI-modeller.
För europeiska operatörer är riktningen konkret: räkna med att AI-leverantörsformulär får en sektion om jailbreak-allvar, att cyberförsäkringsbolag frågar vilka modeller ni exponerar för obetrott innehåll, och att säkerhetscaset, klassificerarbevis plus allvarspoäng, blir dokumentet som avgör om en modell får användas i reglerade flöden under ramverk som NIS2.
Lärdomen för operatörer: tillgänglighet är nu villkorad
Episodens djupare faktum är inte jailbreaket utan de 19 dagarna. En frontier-modell med företagsavtal släcktes globalt genom regeringsdirektiv och kom tillbaka först när ett säkerhetscase tillfredsställde tillsynen. Modelltillgänglighet är nu villkorad av bevis, och avbrott av den här klassen är ett demonstrerat felsätt, ingen hypotes. Varje företag vars flöden hänger på ett enda frontier-API bör behandla det som en fabriksinsats med en enda leverantör: med en testad failover till en andra modell, en nedskriven omkopplingsrutin och ett avtal som säger vad som händer med avgifterna när produkten stängs av av någon som ingen av parterna kan överklaga till.
Läs vidare: Cyberbrottet lånar ert hemmanätverk · Din AI-agent litar pa ett forgiftat verktyg



