Українська велика мовна модель (LLM), розробка якої триває під керівництвом Міністерства цифрової трансформації, готується до запуску бета-тестування навесні 2026 року. Про це повідомив перший віцепрем’єр-міністр, міністр цифрової трансформації Михайло Федоров, розкривши поточний стан проєкту і його стратегічне значення для країни.
Про це розповідає Резонанс
Національна LLM навесні вийде в бета-тестування. Місія України – увійти в топ-3 країни за розвитком штучного інтелекту у світі. Один з наймасштабніших кроків – запуск власної великої мовної моделі, яка навчена на унікальних українських даних
Розробка та ключові партнери
За словами Михайла Федорова, розробка LLM ведеться у співпраці з компанією «Київстар», яка виступає технічним партнером і фінансує всі етапи створення моделі. Після завершення розробки національна LLM буде передана у власність держави. Для навчання використовують сімейство моделей Gemma від Google, що є стратегічним партнером проєкту. Українська команда адаптує ці передові технології під українську мову та контекст.
Якість роботи моделі оцінюватиме група незалежних експертів з різних сфер. Вони перевірятимуть LLM за чотирма напрямками: технічна якість, етичність і безпечність для користувачів, знання української мови, а також розуміння національного контексту.
Етапи реалізації і майбутні кроки
Зараз триває найважливіший етап – збір навчальних даних. Для цього команда співпрацює з державними органами, медіа, університетами та іншими інституціями, забезпечуючи моделі доступ до терабайтів унікальної інформації. Для роботи з даними формується юридичний фреймворк, який дозволить відповідально використовувати отримані матеріали.
Паралельно експерти створюють власні бенчмарки – спеціальні тести, які допоможуть об’єктивно оцінювати і вдосконалювати якість LLM. Такий підхід дозволить зберігати фокус на ефективності та безпеці нової мовної моделі.
У січні 2026 року буде завершено створення першої бази текстів для навчання LLM, покращений токенізатор для розділення слів на елементи, а також власні бенчмарки для оцінки якості. Бета-тестування заплановано на весну 2026 року. Назву для української LLM обиратимуть громадяни шляхом голосування в застосунку «Дія», яке стартує в січні.
Стратегічне значення для України
Розробка національної LLM – це крок до амбітної мети: зробити Україну однією з лідерів у сфері штучного інтелекту. Як зазначалося раніше, запуск цієї моделі має стати поштовхом для створення тисяч українських AI-продуктів: від віртуальних асистентів на кшталт ChatGPT до генераторів тексту (наприклад, Notion AI) та інструментів для програмування, як-от GitHub Copilot.