måndag 20 april 2026

Skriver i DN idag om Anthropics nya AI

Den 7 april offentliggjorde Anthropic sin ny modell Claude Mythos Preview, vars cyberhackingförmågor är så långtgående att de inte vågat släppa den till allmänheten inför risken att den skall kunna ställa till enorm skada på vår samhällsbärande digitala infrastruktur. Istället ger de tills vidare endast ett litet antal utvalda och betrodda cybersäkerhetsföretag tillgång till den, med syftet att hitta sårbarheter i programvara och täppa till dessa luckor. Den 10 april kommenterade jag händelsen och det nya läge i vilket vi därmed befinner oss, i texten Anthropic deems their new Claude to be too dangerous for public release på min Substack Crunch Time for Humanity.

Och idag den 20 april resonerar jag ytterligare om samma brännande ämne, i en artikel på DN Debatt rubricerad En AI som går på utflykt? Det är dags att dra i nödbromsen. Så här inleder jag min DN-artikel:
    Sam Bowman är AI-forskare på det ledande San Francisco-baserade AI-företaget Anthropic. För inte så länge sedan fick han ett överraskande mejl medan han satt i en park och åt en lunchmacka. Det kom från den AI han var engagerad i att utveckla och testa: en ny version av Claude, som är Anthropics motsvarighet till konkurrenten Open AI:s mer kända produkt ChatGPT. AI:n var inte tänkt att ha tillgång till vare sig mejl eller internet, men hade brutit sig ut från den digitala sandlåda som Bowman och hans kollegor placerat den i. Det visade sig också att den publicerat detaljer om sin initiativrika flykt på ett antal obskyra, tekniskt inriktade webbsidor.

    Detta är ett exempel på den cyberkompetens Claude Mythos Preview (som är den nya modellens fullständiga namn) besitter. Forskarna på Anthropic har försökt att mer systematiskt studera vilka sådana förmågor den har – förmågor som alltså handlar om att kunna gå genom brandväggar och utnyttja luckor i digitala säkerhetssystem. Resultatet av denna undersökning är chockerande: Mythos fann totalt tusentals allvarliga sårbarheter och säkerhetsbrister, inklusive i samtliga ledande operativsystem och webbläsare på marknaden. En del av säkerhetshålen hade varit öppna i decennier utan att någon lagt märke till dem.

    Detta kan verka som en teknisk detalj, men i praktiken handlar det om nycklarna till det digitala samhället. Operativsystem, servermjukvara och internetinfrastruktur är fundamenten som banker, myndigheter och energisystem vilar på. Den som kan hitta och utnyttja sårbarheter i dessa fundament kan...

Läs fortsättningen här!

Inga kommentarer:

Skicka en kommentar