Anthropic, kompanija specijalizovana za razvoj veštačke inteligencije, pokrenula je inicijativu kojom namerava da privuče pažnju nezavisnih stručnjaka za sajber bezbednost. U pitanju je poseban program kroz koji će kompanija plaćati hakerima za identifikaciju slabosti u njihovim AI sistemima. Ovaj pristup, poznat kao bug bounty, ima za cilj da podstakne istraživače da prijave sve eventualne propuste, a ne da ih koriste za potencijalno štetne aktivnosti.
Program se fokusira na pronalaženje ponovljivih grešaka koje mogu dovesti do ozbiljnih negativnih ishoda u širokom spektru scenarija.
Majkl Selito, koji vodi globalne poslove u kompaniji Anthropic, istakao je da većina dosadašnjih programa nije obuhvatala otkrivanje mogućnosti jailbreakovanja, iako je prepoznato da su svi aktuelni AI modeli podložni takvim napadima u određenoj meri.
Nagrade za uspešno identifikovane propuste mogu dostići i do 15.000 dolara, a ovaj program je deo šire obaveze kompanije prema bezbednosti, koju je potvrdila i u saradnji sa američkom administracijom.
(Kurir.rs/Telegraf/M.J)
Bonus video: