Компанія OpenAI запускає новий режим блокування в ChatGPT. Він має допомогти захистити користувачів від атак через приховані інструкції в інтернет-контенті.
OpenAI захищає від кібератак
Йдеться про атаки типу prompt injection (впровадження підказок), коли зловмисні команди маскуються на вебсторінках, у документах або інших джерелах даних. Якщо штучний інтелект обробляє такий контент, ці інструкції можуть вплинути на його поведінку або спонукати до розкриття конфіденційної інформації.
Щоб знизити ризики, режим блокування обмежує низку функцій ChatGPT. Після його активації сервіс не переглядатиме вебсторінки в реальному часі, а працюватиме лише з кешованими даними. Також буде відключено завантаження та відображення зображень з інтернету, функцію глибокого дослідження та агентський режим. Водночас генерація зображень залишиться доступною.
У OpenAI наголошують, що новий механізм не гарантує повного захисту. Компанія визнає, що приховані інструкції можуть міститися навіть у кешованому контенті або завантажених користувачем файлах, тому певний ризик впливу на відповіді чат-бота все одно зберігається.
Наразі режим блокування поступово стає доступним для бізнес-акаунтів ChatGPT. А також для частини персональних облікових записів, які відповідають вимогам програми.
