Nitten dage offline, efter regeringsordre
Den 30. juni 2026 meddelte Anthropic, at det amerikanske handelsministerium havde ophævet de eksportkontroller, det havde pålagt Claude Fable 5 og Mythos 5, og begyndte at genoprette adgangen dagen efter. Suspensionen varede 19 dage: pålagt den 12. juni krævede den, at enhver udenlandsk statsborger overalt blev blokeret, en betingelse Anthropic ikke kunne verificere i realtid, så begge modeller blev taget offline for alle. CNBC, Decrypt og The Hacker News dækkede nedlukningen og kovendingen.
Udløseren var specifik. Forskere hos Amazon havde demonstreret en måde at omgå Fable 5's værn på og få modellen til at identificere softwaresårbarheder og demonstrere udnyttelsesteknikker. Regeringen behandlede en jailbreaket frontier-model som en kontrolleret cyberkapacitet, og markedet lærte, at en model kan slukkes ved direktiv, midt i kontrakten, verden over.
Hvad der reelt købte adgangen tilbage
Modellen kom ikke tilbage, fordi ordren udløb. Den kom tilbage, fordi Anthropic fremlagde en rettelse og et argument. Rettelsen er en gentrænet sikkerhedsklassifikator rettet mod den rapporterede teknik, som ifølge firmaet nu blokerer den i mere end 99 procent af forsøgene; markerede forespørgsler omdirigeres til Claude Opus 4.8, en mindre kapabel model, med besked til brugeren. Anthropic indrømmer, at det strammere net også fanger mere legitimt arbejde, og accepterer flere falske positiver i rutinemæssig kodning som en bevidst sikkerhedsmargin.
Argumentet vejer mindst lige så tungt: kapacitetsparitet. Anthropic dokumenterede, at mindre kapable, frit tilgængelige modeller, herunder eget Opus 4.8, OpenAIs GPT-5.5 og Kimi K2.7, kunne replikere de samme sårbarhedsdemonstrationer. Når en kapacitet findes overalt, begrænser kontrol af én leverandørs model ingenting. Den logik genåbnede Fable 5, og den definerer stille, hvordan fremtidige kontroller virker: de binder kun i toppen af kapacitetskurven, mens gulvet nedenunder bliver ved med at stige.
Rammeværket, offentliggjort to dage senere
Den 2. juli offentliggjorde Anthropic maskineriet bag rettelsen. Cyberforespørgsler sorteres i fire trin: forbudt brug som ransomware og dataudsivning, blokeret helt; højrisiko-dobbeltbrug som exploit-udvikling og privilegie-eskalering, mest blokeret indtil bedre adgangskontroller findes; lavrisiko-dobbeltbrug som open source-efterretning og sårbarhedsidentifikation inden for eksisterende værktøjers formåen, tilladt med overvågning; og godartet arbejde som sikker kodning og hændelsesrespons, tilladt med minimal friktion.
Sammen med det kom en foreslået jailbreak-alvorsskala, CJS, fra 0 for informativ til 4 for kritisk, scoret på fire akser: hvor meget kapacitet jailbreaket tilføjer ud over eksisterende værktøjer, hvor mange offensive opgaver det muliggør, hvor let det kan gøres til våben, og hvor let det kan opdages. Et HackerOne-dusørprogram for jailbreak-fund ledsager rammeværket, som Anthropic udtrykkeligt kalder et tidligt udkast.
CVSS for jailbreaks, og hvor det spreder sig hen
Sikkerhedsteams har set denne film. CVSS begyndte som en leverandørs pointkonvention og blev det tal, som hver patch-beslutning, hvert indkøbsspørgeskema og hver cyberforsikringsformular spørger efter. En jailbreak-alvorsskala udfylder samme tomrum: når en omgåelsesteknik cirkulerer i dag, har en CISO ingen standardmåde at sige, hvor slem den er. CJS, eller den efterfølger branchen samles om, giver risikokomiteer, tilsyn og forsikringsselskaber en fællesnævner for eksponering mod AI-modeller.
For europæiske operatører er retningen konkret: forvent, at AI-leverandørspørgeskemaer får et afsnit om jailbreak-alvor, at cyberforsikringsselskaber spørger, hvilke modeller I udsætter for utroværdigt input, og at sikkerhedssagen, klassifikatorbevis plus alvorsscore, bliver dokumentet, der afgør, om en model må bruges i regulerede arbejdsgange under rammer som NIS2.
Lektionen for operatører: tilgængelighed er nu betinget
Episodens dybere kendsgerning er ikke jailbreaket, men de 19 dage. En frontier-model med virksomhedskontrakter gik globalt i sort ved regeringsdirektiv og kom først tilbage, da en sikkerhedssag tilfredsstillede tilsynet. Modeltilgængelighed er nu betinget af beviser, og nedbrud af denne klasse er en påvist fejltilstand, ikke en hypotese. Enhver virksomhed, hvis arbejdsgange afhænger af et enkelt frontier-API, bør behandle det, som den behandler en fabriksråvare med én leverandør: med en testet failover til en anden model, en nedskrevet omskiftningsprocedure og en kontrakt, der siger, hvad der sker med gebyrerne, når produktet slukkes af nogen, ingen af parterne kan anke til.
Læs videre: Cyberkriminelle låner Deres hjemmenet · Din AI-agent stoler på forgiftet værktøj



