MLCommons анонсує створення інструменту AI Safety для оцінки безпеки ШІ-систем

Компанія MLCommons, відома своїми проєктами з розробки бенчмарків для ШІ-індустрії, оголосила про випуск нового інструменту, спрямованого на оцінку безпеки ШІ-систем. 

Інструмент, відомий як AI Safety v0.5, розроблений на етапі proof-of-concept і призначений для оцінки великих мовних моделей (LLM), які використовуються в сучасних чат-ботах. Основна мета – аналізувати відповіді системи на запити з “небезпечних категорій” з метою виявлення потенційних загроз.

Технологія широко використовується в різних цілях, включаючи підготовку фішингових атак, поширення дезінформації та навіть скоєння кіберзлочинів. MLCommons відзначає, що виміряти безпеку таких систем складно, але дуже важливо.

AI Safety v0.5 включає понад 43 тисячі тестових запитів, що дозволяє класифікувати загрози на різні рівні, зрозумілі навіть для непрофесіоналів. Інструмент буде корисним як для виявлення відомих небезпек, так і для виявлення нових, які можуть виникнути в майбутньому.

MLCommons зазначає, що випуск AI Safety v0.5 – лише перший крок у розробці таких інструментів. Вони сподіваються на отримання відгуків від спільноти для випуску покращеної версії v1.0 цього року.

Читайте далі

Як штучний інтелект трансформує український бізнес у 2026 році

У 2026 році штучний інтелект остаточно перейшов зі статусу...

Тенденції розвитку українського IT-аутсорсингу на тлі глобальних змін ринку

Українська індустрія IT-аутсорсингу продовжує адаптуватися до трансформацій світового технологічного...

У чіпах Apple знайшли вразливість, яка небезпечна для старих iPhone

У процесорах Apple для iPhone виявили вразливість, яка зачіпає низку старіших пристроїв і може бути використана для обходу систем захисту.

OpenAI запускає програму для виправлення вразливостей у відкритому коді

Компанія OpenAI запускає програму, яка допоможе розробникам відкритого ПЗ швидше знаходити та виправляти помилки безпеки.

Imec показала нові рішення для пам’яті ШІ

Бельгійський дослідницький центр Imec представив дві нові розробки у сфері пам’яті для комп’ютерів та систем штучного інтелекту.