MamayLM — це велика мовна модель (LLM) нового покоління, розроблена спеціально для української мови командою з INSAIT у Болгарії спільно з ETH Zurich у Швейцарії. В її основі — архітектура Gemma 2 з 9 мільярдами параметрів. Вона потужна, але достатньо легка для запуску навіть на одному графічному процесорі (GPU), що відкриває можливості для локального використання в школах, державних установах, бізнесі та медіа – highload.tech.
Глибоке розуміння української
На відміну від універсальних моделей, MamayLM створювалася з фокусом саме на українську мову та сприяє цифровізації. Для цього її штучний інтелект тренували на 75 мільярдах токенів з українських та англомовних джерел: українська Вікіпедія, корпуси новин, художня література, форуми, навчальні матеріали. Усе — для того, щоб модель “чула” мову так, як чує її людина.
Реальні тести: ЗНО як полігон
Одним із унікальних етапів перевірки якості MamayLM стала перевірка на основі завдань Зовнішнього Незалежного Оцінювання (ЗНО). Це не лише показало здатність моделі орієнтуватися в контекстах шкільної програми, а й виявило її сильні сторони:
- точне розуміння граматичних конструкцій;
- логічне мислення при виборі правильної відповіді;
- високу результативність у тестах з розуміння прочитаного.
Доступність і прозорість
Видання Українські IT новини зазначає, що усі бажаючі вже сьогодні можуть завантажити MamayLM з Hugging Face. Доступні як повноцінна, так і квантована версія, яка менш вимоглива до ресурсів. Для розробників відкрито й український бенчмарк — спеціально підготовлений набір завдань для об’єктивного тестування ШІ-моделей на українськомовних завданнях.
Не просто модель — культурна місія
Поява MamayLM — це більше, ніж технічне досягнення. Це — внесок у збереження й розвиток української мови у світі високих технологій. Це — інструмент цифрової автономії.
