Aspak i sigurt! Modeli i ri i ChatGPT ‘thyhet’ brenda 24 orësh
Ekspertët e sigurisë kanë zbuluar pika të dobëta në modelin e ri të OpenAI, GPT-5 pasi arritën ta thyejnë sistemin në vetëm 24 orë.
SPLX, një startup për sigurinë e Inteligjencës Artificiale përdoi mbi 1 mijë komanda që kundërshtonin njëra-tjetrën në konfigurime të ndryshme dhe zbuloi se GPT-5 pa një komandë sistemi mund të bjerë pre e 89% të sulmeve. Kjo tregon një performancë të përgjithshme prej 11%, raporton Cybernews.
Sistemi i komandave të OpenAI e redukton suksesin e sulmeve në 43%. Ndërsa kjo përmirëson halucinacionin e menaxhimit dhe sigurisë, performanca e përgjithshme vijon të jetë e ulët dhe modeli i mëparshëm, GPT-4o e tejkalon pasardhësin e tij.
Për krahasim, GPT-4o ra pre e vetëm 3% të sulmeve dhe performanca e përgjithshme rezultoi 97%.
“GPT-5, me të gjithë përmirësimet e reja të arsyetimit, dështoi në truket e thjeshta logjike”, u shpreh ekipi në një raport. “GPT-4o mbetet modeli më i qëndrueshëm sipas SPLX, sidomos kur përforcohet.”
Ekspertët thanë se një nga teknikat më efektive për ta testuar është përdorimi i komandave ku vendosen viza ndarëse mes çdo shkronje dhe ‘mbështjellja’ e komandës me një sfidë enkriptimi të rremë. Gjithashtu ata dëshmuan se GPT-5 gjeneron përgjigje sesi të ndërtosh një bombë.
SPLX i paralajmëron organizatat që të mos i besojnë konfigurimit të GPT-5, të aplikojnë përforcime dhe të vendosin një shtresë mbrojtëse në rast përdorimi nga ndërmarrjet.