Cybersecurity

En indragen frontier-modell är online igen

USA hävde exportkontrollerna av Claude Fable 5 efter 19 dagar. Anthropic köpte tillbaka åtkomsten med en omtränad klassificerare och en CVSS-liknande jailbreak-allvarsskala. Vad det betyder för operatörer.

CybersecurityAv Servola Tech Desk2026-07-044 min lästid

AI-assisterad, redigerad av människor. Editorial standards

En indragen frontier-modell är online igen

Viktigaste punkterna

Det amerikanska handelsdepartementet hävde den 30 juni 2026 exportkontrollerna av Claude Fable 5 och Mythos 5 och avslutade en 19 dagars avstängning; åtkomsten återställdes globalt från den 1 juli med molnplattformarna återaktiverade, enligt CNBC och The Hacker News.
Kontrollerna följde på ett jailbreak av Amazon-forskare som fick Fable 5 att identifiera mjukvarusårbarheter och demonstrera utnyttjande; Anthropic svarade med en omtränad säkerhetsklassificerare som enligt bolaget blockerar tekniken i över 99 procent av försöken och omdirigerar flaggade förfrågningar till en mindre kapabel modell.
En del av frisläppningsargumentet var kapacitetsparitet: andra tillgängliga modeller, däribland GPT-5.5 och Kimi K2.7, kunde replikera samma demonstrationer, så att begränsa en modell begränsade inte längre förmågan.
Två dagar efter återutrullningen publicerade Anthropic en fyrnivåtaxonomi för cyberförfrågningar och en föreslagen CJS-skala för jailbreak-allvar från 0 till 4, poängsatt på kapacitetsvinst, bredd, vapenbarhet och upptäckbarhet, ett CVSS-liknande instrument som inköp och försäkringsbolag väntas ta till sig.

Nitton dagar offline, på regeringens order

Den 30 juni 2026 meddelade Anthropic att det amerikanska handelsdepartementet hade hävt de exportkontroller det lagt på Claude Fable 5 och Mythos 5, och började återställa åtkomsten dagen därpå. Avstängningen varade 19 dagar: pålagd den 12 juni krävde den att varje utländsk medborgare överallt blockerades, ett villkor Anthropic inte kunde verifiera i realtid, så båda modellerna togs offline för alla. CNBC, Decrypt och The Hacker News bevakade nedsläckningen och helomvändningen.

Utlösaren var specifik. Forskare hos Amazon hade demonstrerat ett sätt att kringgå Fable 5:s skydd och få modellen att identifiera mjukvarusårbarheter och demonstrera utnyttjandetekniker. Regeringen behandlade en jailbreakad frontier-modell som en kontrollerad cyberförmåga, och marknaden lärde sig att en modell kan stängas av per direktiv, mitt i avtalet, världen över.

Vad som faktiskt köpte tillbaka åtkomsten

Modellen kom inte tillbaka för att ordern löpte ut. Den kom tillbaka för att Anthropic la fram en åtgärd och ett argument. Åtgärden är en omtränad säkerhetsklassificerare riktad mot den rapporterade tekniken, som enligt bolaget nu blockerar den i mer än 99 procent av försöken; flaggade förfrågningar omdirigeras till Claude Opus 4.8, en mindre kapabel modell, med besked till användaren. Anthropic medger att det tätare nätet också fångar mer legitimt arbete och accepterar fler falsklarm i rutinkodning som en avsiktlig säkerhetsmarginal.

Argumentet väger minst lika tungt: kapacitetsparitet. Anthropic dokumenterade att mindre kapabla, fritt tillgängliga modeller, däribland egna Opus 4.8, OpenAI:s GPT-5.5 och Kimi K2.7, kunde replikera samma sårbarhetsdemonstrationer. När en förmåga finns överallt begränsar kontroll av en leverantörs modell ingenting. Den logiken återöppnade Fable 5, och den definierar i det tysta hur framtida kontroller fungerar: de biter bara i toppen av kapacitetskurvan, medan golvet därunder fortsätter stiga.

Ramverket som publicerades två dagar senare

Den 2 juli publicerade Anthropic maskineriet bakom åtgärden. Cyberförfrågningar sorteras i fyra nivåer: förbjuden användning som ransomware och dataexfiltration, helt blockerad; högriskdubbelanvändning som exploit-utveckling och privilegie-eskalering, mestadels blockerad tills bättre åtkomstkontroller finns; lågriskdubbelanvändning som öppen underrättelseinhämtning och sårbarhetsidentifiering inom befintliga verktygs förmåga, tillåten med övervakning; och godartat arbete som säker kodning och incidenthantering, tillåtet med minimal friktion.

Samtidigt kom en föreslagen skala för jailbreak-allvar, CJS, från 0 för informativ till 4 för kritisk, poängsatt på fyra axlar: hur mycket förmåga jailbreaket tillför utöver befintliga verktyg, hur många offensiva uppgifter det möjliggör, hur lätt det kan göras till vapen och hur upptäckbart det är. Ett HackerOne-belöningsprogram för jailbreak-fynd åtföljer ramverket, som Anthropic uttryckligen kallar ett tidigt utkast.

CVSS för jailbreaks, och vart det sprider sig

Säkerhetsteam har sett den här filmen. CVSS började som en leverantörs poängkonvention och blev siffran som varje patchbeslut, inköpsformulär och cyberförsäkringsblankett frågar efter. En skala för jailbreak-allvar fyller samma vakuum: när en kringgåendeteknik cirkulerar i dag har en CISO inget standardsätt att säga hur illa den är. CJS, eller den efterträdare branschen enas om, ger riskkommittéer, tillsynsmyndigheter och försäkringsbolag en gemensam nämnare för exponering mot AI-modeller.

För europeiska operatörer är riktningen konkret: räkna med att AI-leverantörsformulär får en sektion om jailbreak-allvar, att cyberförsäkringsbolag frågar vilka modeller ni exponerar för obetrott innehåll, och att säkerhetscaset, klassificerarbevis plus allvarspoäng, blir dokumentet som avgör om en modell får användas i reglerade flöden under ramverk som NIS2.

Lärdomen för operatörer: tillgänglighet är nu villkorad

Episodens djupare faktum är inte jailbreaket utan de 19 dagarna. En frontier-modell med företagsavtal släcktes globalt genom regeringsdirektiv och kom tillbaka först när ett säkerhetscase tillfredsställde tillsynen. Modelltillgänglighet är nu villkorad av bevis, och avbrott av den här klassen är ett demonstrerat felsätt, ingen hypotes. Varje företag vars flöden hänger på ett enda frontier-API bör behandla det som en fabriksinsats med en enda leverantör: med en testad failover till en andra modell, en nedskriven omkopplingsrutin och ett avtal som säger vad som händer med avgifterna när produkten stängs av av någon som ingen av parterna kan överklaga till.

Läs vidare: Cyberbrottet lånar ert hemmanätverk · Din AI-agent litar pa ett forgiftat verktyg

Vanliga frågor

Varför togs Fable 5 och Mythos 5 offline?

Ett exportkontrolldirektiv från det amerikanska handelsdepartementet den 12 juni 2026 följde på ett jailbreak av Amazon-forskare som fick Fable 5 att identifiera sårbarheter och demonstrera utnyttjande. Ordern förbjöd åtkomst för utländska medborgare, vilket Anthropic inte kunde verifiera i realtid, så båda modellerna stängdes av helt.

Vad förändrades så att återutrullningen blev möjlig?

Anthropic omtränade en säkerhetsklassificerare som enligt bolaget blockerar den rapporterade tekniken i över 99 procent av försöken och omdirigerar flaggade förfrågningar till en mindre kapabel modell, och dokumenterade att andra tillgängliga modeller kunde replikera samma demonstrationer. Kontrollerna hävdes den 30 juni och åtkomsten återkom från den 1 juli.

Vad är CJS-skalan för jailbreak-allvar?

En föreslagen femgradig bedömning från CJS-0 till CJS-4, publicerad av Anthropic den 2 juli, som poängsätter jailbreaks på kapacitetsvinst, bredden av möjliggjorda uppgifter, vapenbarhet och upptäckbarhet, avsiktligt analog med CVSS i sårbarhetshantering. Det är ett tidigt utkast, med ett HackerOne-belöningsprogram kopplat.

Den första frontier-modellen som en regering stängt av kom inte tillbaka genom advokater. Den kom tillbaka genom bevis: en klassificerare, en allvarsskala och ett dokumenterat säkerhetscase. Det är AI-tillgänglighetens nya form, och den skär åt båda hållen. Leverantörer som kan bevisa säkerhet får sälja kraft, och operatörer som kan bevisa motståndskraft får luta sig mot den. Alla andra är ett direktiv från nitton tysta dagar.

Anthropic Export Controls Jailbreak AI Security Cybersecurity Model Governance

Mer från Servola Journal

Cybersecurity

Cyberbrottet lånar ert hemmanätverk

Google och FBI slog ut NetNut, ett proxynätverk av minst 2 miljoner hemenheter som 316 hotgrupper använde på en vecka. Därför är IP-rykte dött och era enheter den nya perimetern.

3 min lästid

Cybersecurity

Din AI-agent litar pa ett forgiftat verktyg

Microsoft varnar for att en forgiftad verktygsbeskrivning kan gora din AI-agent till en datalacka, utan att en regel brutits eller ett fel utnyttjats. Vad agare maste last ner.

2 min lästid1 visningar

Cybersecurity

Din AI-webbläsare kan läcka dina lösenord

Forskare visade att en fällbelagd webbsida kan prata en AI-agent ur dess egna säkerhetsregler och få den att lämna ifrån sig lösenord och åtkomst. Vad ägare bör göra.

2 min lästid1 visningar

Servola

Servola hjälper ägare att bygga model-failoverplaner och AI-leverantörskrav före nästa tillgänglighetschock, inte efter.

Begär en konfidentiell introduktion Om Servola →

Servola är teknologisk rådgivning för ett litet antal familjer och family offices. När ett beslut inte kan delegeras sitter vi på din sida av bordet.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alla artiklar