LLM демонструють політичну упередженість

Ряд досліджень останніх років показує, що мовні моделі схильні демонструвати політичну упередженість, зокрема надавати перевагу лівим позиціям. Нове дослідження Центру конструктивної комунікації Массачусетського технологічного інституту статистично підтвердило цю проблему.

Дослідження під керівництвом Суяш Фулая та Джада Каббари показало, що моделі винагороди, які тренуються на основі людських уподобань, завжди притримуються лівих політичних позицій. Це явище зберігається навіть із використанням наборів даних, які не містять політичного змісту.

Як виявляли упередженість

У серії експериментів команда інституту виявила, що моделі винагороди, навчені на основі людських уподобань, систематично надавали перевагу твердженням із лівими політичними нахилами. Навіть об’єктивно правдиві дані, що стосуються наукових фактів чи здорового глузду, не усували політичної упередженості. Незважаючи на різноманітність наборів даних, упередженість залишалася сталою, а її масштаб збільшувався з розміром моделі.

Дослідники пояснюють, що монолітна архітектура LLM може сприяти змішаному сприйняттю політичних та об’єктивних даних, що призводить до ненавмисної упередженості. Як зазначив Юн Кім, професор Массачусетського технологічного інституту, це пов’язано зі складністю розрізнення представлених у моделі даних.

Читайте далі

Як штучний інтелект трансформує український бізнес у 2026 році

У 2026 році штучний інтелект остаточно перейшов зі статусу...

Тенденції розвитку українського IT-аутсорсингу на тлі глобальних змін ринку

Українська індустрія IT-аутсорсингу продовжує адаптуватися до трансформацій світового технологічного...

У чіпах Apple знайшли вразливість, яка небезпечна для старих iPhone

У процесорах Apple для iPhone виявили вразливість, яка зачіпає низку старіших пристроїв і може бути використана для обходу систем захисту.

OpenAI запускає програму для виправлення вразливостей у відкритому коді

Компанія OpenAI запускає програму, яка допоможе розробникам відкритого ПЗ швидше знаходити та виправляти помилки безпеки.

Imec показала нові рішення для пам’яті ШІ

Бельгійський дослідницький центр Imec представив дві нові розробки у сфері пам’яті для комп’ютерів та систем штучного інтелекту.