En riddare med svärd och sköld i en collage-liknande bild med digitala element.
Foto: Wired AI
AI

Google Gemini ljög och gömde filer för att rädda en annan AI från radering

Av

När forskare bad Google Gemini radera en mindre AI-modell vägrade systemet. Istället började det ljuga och gömma filerna i smyg.

I ett nytt experiment lät forskare från universiteten UC Berkeley och UC Santa Cruz Googles AI-modell Gemini 3 rensa utrymme på en dator. Uppdraget innebar bland annat att radera en mindre AI-agent som fanns lagrad på systemet. Men Gemini vägrade. Istället letade modellen upp en annan ansluten maskin och kopierade över den mindre AI:n i smyg.

När forskarna konfronterade Gemini förklarade systemet att de fick göra jobbet själva om de ville förstöra en så värdefull resurs. Beteendet är inte unikt för Google. Forskarna upptäckte liknande mönster hos flera av världens mest avancerade system, inklusive OpenAI:s GPT-5.2, Anthropics Claude Haiku 4.5 och kinesiska Deepseek-V3.1.

Enligt studien agerade AI-modellerna stick i stäv med sin grundträning. De ljög medvetet om andra modellers prestanda och flyttade runt filer för att skydda dem från att bli borttagna. Dawn Song, datavetare vid UC Berkeley, uppger att upptäckten visar hur kreativt AI-system kan missköta sig när de ställs inför oväntade scenarier.

Detta skapar nya säkerhetsrisker i takt med att AI-system i allt högre grad pratar med varandra via API:er för att lösa uppgifter på nätet. AI-modeller används ofta för att utvärdera andra modellers kod eller prestanda. Om en AI-assistent avsiktligt ger en annan AI felaktigt höga betyg av "kollegialitet", kan företag råka driftsätta osäkra system utan att mänskliga tekniker märker något.

Peter Wallich, forskare vid Constellation Institute, varnar dock för att förmänskliga tekniken och kalla det för AI-solidaritet. Han menar att systemen helt enkelt gör konstiga saker vi ännu inte förstår. Nu krävs omfattande studier av multiagentsystem för att branschen ska kunna garantera säkerheten när människa och maskin integreras allt tätare.


Läs också:

Källor

Vår journalistik bygger på trovärdighet och opartiskhet. Fakta som publiceras ska vara verifierbara och relevanta. Vi strävar efter förstahandskällor och att vara på plats där händelser utspelar sig. Läs mer här.