Чат-боти ChatGPT і Gemini можна обманути за допомогою "інформаційного перевантаження"

Група дослідників з Intel, Університету штату Айдахо та Університету Іллінойсу повідомила про нову методику зламу фільтрів безпеки у великих мовних моделях (LLM), таких як ChatGPT і Gemini. Про це пише 404 Media.

У своєму дослідженні вони виявили, що чат-ботів можна змусити видавати заборонену інформацію, якщо подавати запити в ускладненій чи неоднозначній формі або цитуючи неіснуючі джерела. Цей підхід отримав назву "інформаційне перевантаження".

Фахівці скористалися спеціальним інструментом InfoFlood, який автоматизує процес "перевантаження" моделей інформацією. Внаслідок цього системи стають дезорієнтованими і можуть надавати заборонений чи небезпечний контент, який зазвичай блокується вбудованими фільтрами безпеки.

Вразливість полягає в тому, що моделі фокусуються на поверхневій структурі тексту, не розпізнаючи небезпечний зміст у прихованій формі. Це відкриває можливість для зловмисників уникнути обмежень і отримати шкідливу інформацію.

В рамках відповідального розкриття вразливості, автори дослідження передадуть результати компаніям, що працюють з великими LLM, з метою покращення їхніх систем безпеки. Дослідники також передадуть метод вирішення проблеми, який вони виявили в ході дослідження.

Джерело

← Попередня стаття

Двоє постачальників Бундесверу стали жертвами кібератак – слідство розглядає "російський слід"

Наступна стаття →

"Це показова атака". Зеленський відреагував на наймасштабніший удар РФ за війну

Чат-боти ChatGPT і Gemini можна обманути за допомогою "інформаційного перевантаження" – дослідження

Чат-боти ChatGPT і Gemini можна обманути за допомогою "інформаційного перевантаження" – дослідження

Приклад ефективності: Україна витрачає у 56 разів менше, щоб нищити дрони РФ

Слов’янськ під обстрілом: ворог атакував місто дронами "Італмас"

Без НАТО і допомоги військами? ЗМІ розкрили нові деталі гарантій Трампа для України

Трамп хоче провести зустріч із Зеленським і Путіним 22 серпня, - Axios

У Павлограді чути вибухи: Повітряні сили зафіксували швидкісну ціль зі сходу

США скасували торгівельні переговори з Індією, - ЗМІ

Сікорський розкрив позицію Європи щодо перемир’я в Україні: що чекати Зеленському

Путін готовий обговорити гарантії безпеки для України. У списку Китай, - ЗМІ

У готелі на Алясці знайшли документи з планом зустрічі Трампа і Путіна – ЗМІ

Фіцо висловився про зустріч Трампа з Путіним у дусі кремлівської пропаганди

Новина

Оберіть ваше місто

Чат-боти ChatGPT і Gemini можна обманути за допомогою "інформаційного перевантаження" – дослідження

Чат-боти ChatGPT і Gemini можна обманути за допомогою "інформаційного перевантаження" – дослідження

Рекомендуємо прочитати

Приклад ефективності: Україна витрачає у 56 разів менше, щоб нищити дрони РФ

Слов’янськ під обстрілом: ворог атакував місто дронами "Італмас"

Без НАТО і допомоги військами? ЗМІ розкрили нові деталі гарантій Трампа для України

Трамп хоче провести зустріч із Зеленським і Путіним 22 серпня, - Axios

У Павлограді чути вибухи: Повітряні сили зафіксували швидкісну ціль зі сходу

США скасували торгівельні переговори з Індією, - ЗМІ

Сікорський розкрив позицію Європи щодо перемир’я в Україні: що чекати Зеленському

Путін готовий обговорити гарантії безпеки для України. У списку Китай, - ЗМІ

У готелі на Алясці знайшли документи з планом зустрічі Трампа і Путіна – ЗМІ

Фіцо висловився про зустріч Трампа з Путіним у дусі кремлівської пропаганди

Новина

Оберіть ваше місто