Hoppa till innehåll
Utvecklarens nya skydd utklassar OpenAI:s inbyggda AI-säkerhet
Foto: YouTube
Teknik

Utvecklarens nya skydd utklassar OpenAI:s inbyggda AI-säkerhet

Av

OpenAI kallar AI-kapningar via prompt injections för ett olösligt problem. Nu hävdar en oberoende utvecklare att hen har knäckt koden.

Att lura en AI att strunta i sina inbyggda spärrar och i stället lyda en hackers dolda instruktioner kallas för "prompt injection". Tekniken har blivit en av AI-världens absolut största huvudvärkar och liknas ofta vid avancerad social manipulation.

Problemet är så pass allvarligt att OpenAI nyligen gick ut och erkände att det förmodligen aldrig kommer att kunna lösas helt. Särskilt nu när AI-agenter får tillgång till webben och användarnas privata data har riskerna växt enormt.

Men nu har en oberoende utvecklare släppt Arc Gate – ett nytt säkerhetsverktyg som fungerar som en sköld framför vanliga AI-modeller. Verktyget granskar och blockerar skadliga instruktioner innan de ens hinner nå språkmodellen.

Enligt utvecklarens egna tester utklassar Arc Gate branschens standardlösningar. I tester mot de svåraste och mest vilseledande attackerna fångade verktyget upp betydligt fler intrångsförsök än både OpenAI:s eget modereringssystem och Metas säkerhetsmodell LlamaGuard.

Arc Gate använder fyra lager av säkerhet, bland annat avancerad beteendeanalys och övervakning av längre konversationer. Trots den tunga bevakningen lägger systemet bara till en fördröjning på en dryg tredjedels sekund. I testerna flaggades heller inga oskyldiga konversationer av misstag.

Att en oberoende kodare lyckas bygga ett så kraftfullt system väcker uppmärksamhet i en bransch där storföretagen kämpar. Enligt tekniksajten Venturebeat har i dagsläget bara omkring 35 procent av alla företag som använder AI i produktion ett dedikerat skydd mot just prompt injections.

Läs också:

Vår journalistik bygger på trovärdighet och opartiskhet. Fakta som publiceras ska vara verifierbara och relevanta. Vi strävar efter förstahandskällor och att vara på plats där händelser utspelar sig. Läs mer här.