В Україні готуються до запуску національної великої мовної моделі (LLM). Бета-версію українського аналога ChatGPT розробляє Центр компетенцій WINWIN AI при Міністерстві цифрової трансформації у партнерстві з мобільним оператором «Київстар». Презентація проєкту запланована на весну 2026 року.
На чому базується український ШІ
Технологічною основою нової системи стала відкрита мовна модель Gemma від Google. Водночас розробники наголошують: йдеться не про копіювання, а про глибоку адаптацію під українську мову, культурний та історичний контекст. Очікується, що це дозволить моделі генерувати більш точні та природні відповіді українською.
Як навчають модель
Наразі команда працює над підготовкою та верифікацією даних для навчання ШІ. Модель тренують не лише на відкритих інтернет-джерелах, а й на оцифрованих архівних документах, наукових дослідженнях і матеріалах українських медіа. Частина цих даних раніше існувала виключно в паперовому форматі.
Для контролю якості та безпечності відповідей створено окремий наглядовий комітет. Він стежить за тим, щоб контент, який генерує ШІ, був коректним, історично достовірним і відповідав етичним стандартам.
Що зміниться вже у січні
У січні 2026 року розробники планують завершити формування верифікованої бази даних та вдосконалити токенізатор — інструмент, який відповідає за обробку тексту й швидкість роботи моделі.
Крім того, цього ж місяця в застосунку «Дія» стартує публічне голосування, під час якого українці зможуть обрати назву для національного штучного інтелекту.