Міністерство цифрової трансформації України та компанія «Київстар» повідомили про важливий прогрес у розвитку першої національної великої мовної моделі «Сяйво». Модель успішно завершила ключові етапи навчання і перейшла до закритого бета-тестування – пише dou.
Що вже зроблено
За словами розробників, повністю завершено етапи pre-training (переднавчання) та supervised fine-tuning (контрольованого тонкого налаштування). Наразі модель перебуває на етапі alignment — вирівнювання, під час якого фахівці активно працюють над:
- підвищенням якості та релевантності відповідей;
- забезпеченням безпеки використання;
- зменшенням можливих помилок та «галюцинацій»;
- відповідністю етичним стандартам та українському культурному контексту.
Етапи тестування
На першому етапі бета-тестування залучать експертів чотирьох спеціалізованих комітетів:
- Історичного
- Лінгвістичного
- Етико-правового
- Технічного
Спочатку тестуватимуть зменшену версію моделі. Після отримання результатів та врахування зауважень планується масштабування до повноцінної великої мовної моделі.
Стратегічне значення проєкту
«Сяйво» — це не просто чергова мовна модель. Це стратегічний проєкт, спрямований на забезпечення цифрового суверенітету України. Модель навчається переважно на українських даних, включаючи понад 10 ТБ історичних архівних матеріалів від Укрдержархіву. Це дозволить їй краще розуміти національний контекст, історію, мову та сучасні реалії країни.
Очікується, що «Сяйво» стане основою для:
- розвитку державних сервісів у порталі «Дія»;
- створення нових цифрових продуктів для бізнесу;
- розвитку української мови в цифровому просторі.
Назва моделі була обрана українцями шляхом голосування в застосунку «Дія» ще в березні 2026 року.
«Створення власної потужної мовної моделі — це інвестиція в технологічну незалежність держави. Ми прагнемо, щоб “Сяйво” була не тільки технологічно досконалою, але й безпечною, етичною та максимально адаптованою до потреб українців», — зазначили в Міністерстві цифрової трансформації.
Видання Українські IT новини зазначає, що подальші етапи тестування та терміни можливого відкритого доступу до моделі обіцяють оголосити додатково.
