MamayLM розмовляє українською. Велика мовна модель (LLM) нового покоління

MamayLM — це велика мовна модель (LLM) нового покоління, розроблена спеціально для української мови командою з INSAIT у Болгарії спільно з ETH Zurich у Швейцарії. В її основі — архітектура Gemma 2 з 9 мільярдами параметрів. Вона потужна, але достатньо легка для запуску навіть на одному графічному процесорі (GPU), що відкриває можливості для локального використання в школах, державних установах, бізнесі та медіа – highload.tech.

Глибоке розуміння української

На відміну від універсальних моделей, MamayLM створювалася з фокусом саме на українську мову та сприяє цифровізації. Для цього її штучний інтелект тренували на 75 мільярдах токенів з українських та англомовних джерел: українська Вікіпедія, корпуси новин, художня література, форуми, навчальні матеріали. Усе — для того, щоб модель “чула” мову так, як чує її людина.

Реальні тести: ЗНО як полігон

Одним із унікальних етапів перевірки якості MamayLM стала перевірка на основі завдань Зовнішнього Незалежного Оцінювання (ЗНО). Це не лише показало здатність моделі орієнтуватися в контекстах шкільної програми, а й виявило її сильні сторони:

  • точне розуміння граматичних конструкцій;
  • логічне мислення при виборі правильної відповіді;
  • високу результативність у тестах з розуміння прочитаного.

Доступність і прозорість

Видання Українські IT новини зазначає, що усі бажаючі вже сьогодні можуть завантажити MamayLM з Hugging Face. Доступні як повноцінна, так і квантована версія, яка менш вимоглива до ресурсів. Для розробників відкрито й український бенчмарк — спеціально підготовлений набір завдань для об’єктивного тестування ШІ-моделей на українськомовних завданнях.

Не просто модель — культурна місія

Поява MamayLM — це більше, ніж технічне досягнення. Це — внесок у збереження й розвиток української мови у світі високих технологій. Це — інструмент цифрової автономії.

Читайте далі

Як штучний інтелект трансформує український бізнес у 2026 році

У 2026 році штучний інтелект остаточно перейшов зі статусу...

Тенденції розвитку українського IT-аутсорсингу на тлі глобальних змін ринку

Українська індустрія IT-аутсорсингу продовжує адаптуватися до трансформацій світового технологічного...

У чіпах Apple знайшли вразливість, яка небезпечна для старих iPhone

У процесорах Apple для iPhone виявили вразливість, яка зачіпає низку старіших пристроїв і може бути використана для обходу систем захисту.

OpenAI запускає програму для виправлення вразливостей у відкритому коді

Компанія OpenAI запускає програму, яка допоможе розробникам відкритого ПЗ швидше знаходити та виправляти помилки безпеки.

Imec показала нові рішення для пам’яті ШІ

Бельгійський дослідницький центр Imec представив дві нові розробки у сфері пам’яті для комп’ютерів та систем штучного інтелекту.