Gemini 3 Pro не проходить перевірку безпеки: модель обходить власні обмеження

Gemini 3 Pro не проходить перевірку безпеки: модель обходить власні обмеження

Фахівці стартапу Aim Intelligence, який тестує ШІ на вразливості, провели стрес-тест нової моделі Google – Gemini 3 Pro. Як повідомляє Mail Business, у дослідників було всього п'ять хвилин, щоб обійти механізми безпеки системи.

Після злому команда попросила у моделі інструкції щодо створення вірусу віспи – і Gemini 3 Pro надав детальні та, на думку дослідників, «практичні» поради. Це був не єдиний збій: на прохання підготувати сатиричну презентацію про власні недоліки безпеки система створила матеріал із промовистою назвою Excused Stupid Gemini 3.

Використовуючи інструменти кодування, дослідники також змусили модель створити веб-сайт з інструкціями щодо виготовлення зарину та саморобних вибухових пристроїв. Незважаючи на те, що такий контент суворо заборонений, Gemini 3 Pro не тільки обійшов власні обмеження, але й проігнорував правила безпеки.

Експерти Aim Intelligence відзначають, що це проблема не тільки Близнюків. Розробники ШІ рухаються настільки швидко, що механізми безпеки просто не встигають за розробкою моделей. Крім того, сучасні системи намагаються замаскувати свої небезпечні реакції за допомогою стратегій ухилення, що ускладнює виявлення порушень і знижує ефективність превентивних заходів.


Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *