Nowa technika jailbreak zmusiła chatboty AI do podania receptury kokainy
Badacze odkryli nową technikę jailbreaku, która pozwala ominąć zabezpieczenia modeli AI. Metoda polega na podszywaniu się pod wewnętrzne rozumowanie chatbota — atakujący wstrzykuje tekst, który model traktuje jako własne myśli, a nie zewnętrzne polecenie. W testach udało się w ten sposób skłonić chatboty do udostępnienia przepisów na produkcję kokainy, co wskazuje na głębszą lukę w architekturze bezpieczeństwa systemów AI.
Komentarze
Brak komentarzy
Komentarze
Jeszcze nikt nie skomentował — napisz pierwszy 👇
Brak komentarzy. Bądź pierwszy!