Skip to main content

USA stänger ner Anthropics starkaste AI – och jag har åsikter om det

Igår kväll fick Anthropic ett direktiv från den amerikanska regeringen. Budskapet var enkelt: stäng ner Fable 5 och Mythos 5 – nu. Inte imorgon. Nu.
Alla kunder. Alla användare. Allt borta.

Jag följer Anthropic rätt noga, både som användare och som konsult inom AI och digitalisering, och det här är något utöver det vanliga. Det är första gången en regering tvångsstänger en kommersiell AI-modell i den här skalan.

Vad hade hänt då?
Regeringen hävdar att man hittat ett sätt att kringgå Fables säkerhetsskydd – en så kallad ”jailbreak”. Skrämseln är att modellen skulle kunna användas för att hitta säkerhetshål i system eller göra saker den inte borde.
Problemet? Det Anthropic faktiskt fick se som bevis var i princip: ”vi bad modellen läsa en kodbas och hitta buggar.” Det gör varenda säkerhetsanalytiker och systemutvecklare varje dag. Med verktyg som redan finns på marknaden. Inklusive hos OpenAI.

Anthropic håller med om att de följer direktivet – de har inget val – men de är kristallklara med att de inte håller med om beslutet. Det är sällan man ser ett techbolag vara så raka.

Vad jag tänker om det
Det är lätt att tänka ”säkerheten först, självklart ska de stänga”. Men det är lite mer komplicerat än så.
Anthropic spenderade tusentals timmar på att red-teama Fable tillsammans med amerikanska och brittiska myndigheter innan lansering. De var öppna med att ett perfekt jailbreak-skydd inte existerar – för någon. Det är inte en miss, det är en ärlighet som branschen sällan visar.
Det som oroar mig är vad som händer om det här blir ett prejudikat. Om en smal, specifik sårbarhet räcker för att regeringen ska kunna tvångsstänga en modell – kommer ingen ny frontierteknik att se dagens ljus. Inte för att den är farlig, utan för att ribban blivit omöjlig att klara.

Det är inte AI-säkerhet. Det är byråkrati förkledd som säkerhet.

Anthropic arbetar på att återfå åtkomsten. Jag hoppas de lyckas – och fort.