-
Sam Bowman är AI-forskare på det ledande San Francisco-baserade AI-företaget Anthropic. För inte så länge sedan fick han ett överraskande mejl medan han satt i en park och åt en lunchmacka. Det kom från den AI han var engagerad i att utveckla och testa: en ny version av Claude, som är Anthropics motsvarighet till konkurrenten Open AI:s mer kända produkt ChatGPT. AI:n var inte tänkt att ha tillgång till vare sig mejl eller internet, men hade brutit sig ut från den digitala sandlåda som Bowman och hans kollegor placerat den i. Det visade sig också att den publicerat detaljer om sin initiativrika flykt på ett antal obskyra, tekniskt inriktade webbsidor.
Detta är ett exempel på den cyberkompetens Claude Mythos Preview (som är den nya modellens fullständiga namn) besitter. Forskarna på Anthropic har försökt att mer systematiskt studera vilka sådana förmågor den har – förmågor som alltså handlar om att kunna gå genom brandväggar och utnyttja luckor i digitala säkerhetssystem. Resultatet av denna undersökning är chockerande: Mythos fann totalt tusentals allvarliga sårbarheter och säkerhetsbrister, inklusive i samtliga ledande operativsystem och webbläsare på marknaden. En del av säkerhetshålen hade varit öppna i decennier utan att någon lagt märke till dem.
Detta kan verka som en teknisk detalj, men i praktiken handlar det om nycklarna till det digitala samhället. Operativsystem, servermjukvara och internetinfrastruktur är fundamenten som banker, myndigheter och energisystem vilar på. Den som kan hitta och utnyttja sårbarheter i dessa fundament kan...
Claude förefaller lika ovillig att avstå från någon kunskap som Bibelns Eva och kommer knappast länge finnas kvar i någon Edens lustgård, utan kommer sprida sig över världen även om man försöker stoppa den. Mänsklighetens enda chans att överleva det här är att en kosmisk super-intelligens kommer till vår hjälp, men en sådan tror ju ni ateister inte på... 😁
SvaraRaderaJag är osäker på om kommentaren gick igenom systemet och kör därför också den här kommentaren som ett rent test...
SvaraRadera