Запуск національної LLM перенесли на весну 2026 року, оскільки Мінцирфи стикнулося з проблемою збору даних, яка складається з двох частин: юридичної та технічноЗапуск національної LLM перенесли на весну 2026 року, оскільки Мінцирфи стикнулося з проблемою збору даних, яка складається з двох частин: юридичної та технічно

Старт національної LLM гальмується через збір даних: у чому проблема

2026/01/27 19:01

Старт національної LLM гальмується через збір даних: у чому проблема

Запуск національної LLM перенесли на весну 2026 року, оскільки Мінцирфи стикнулося з проблемою збору даних, яка складається з двох частин: юридичної та технічної. 

Залишити коментар

Запуск національної LLM перенесли на весну 2026 року, оскільки Мінцирфи стикнулося з проблемою збору даних, яка складається з двох частин: юридичної та технічної. 

Про це розповів Олександр Борняков, тимчасовий виконувач обов’язків Міністра цифрової трансформації, в інтерв’ю для DOU та YouTube-каналу «УТ-2».

Юридична частина проблеми полягає в утому, що міністерство як держорган не може просто автоматично збирати чи вилучати дані, які захищені чиїмось інтелектуальним правом на відміну від приватних структур. 

«Ми отримали від партнерів чітке „hard no“ щодо використання певних масивів даних. Якщо ми отримаємо хоча б один судовий позов — увесь проєкт розвалиться», — пояснює Борняков. 

Тому міністерство не може так ризикувати, оскільки на цій моделі будуються держпослуги. Для цього зараз створюють юридичний фреймворк для отримання згод.

«Хочемо ухвалити норму: якщо інформація є публічною і викладена на сайті у відкритому доступі, її може використовувати LLM для навчання», — зазначає тимчасовий очільник Мінцифри.

Окрім юридичної частини, була затримка у технічній. Це стосувалося створення команди.

«Наймати айтівців зараз досить важко. Kyivstar тут дуже допоміг. Вони як партнер взяли частину процесів на себе і навіть залучили людей зі своєї команди. Зрештою, команду вдалося сформувати», — каже Борняков. 

Також затримка була з вибором платформи, але зрештою основою буде Gemma від Google.

«Ми візьмемо всі дані, які маємо — книги, архіви, — і згодуємо їх моделі. Зараз наш власний токенізатор уже майже завершений», — додає очільник Мінцифри.

Наразі розробляються спеціальні тести, які будуть демонструвати якість роботи моделі. Після навчання планують вийти в реліз. 

«Триває найважливіша частина роботи». Федоров розповів на якому етапі розробки перебуває національна LLM
По темi
«Триває найважливіша частина роботи». Федоров розповів на якому етапі розробки перебуває національна LLM
Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON
По темi
Українська відповідь ChatGPT. Як «Київстар» із Мінцифри будуватимуть національну LLM для України: інсайти й міжнародний ШІ-досвід VEON
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Залишити коментар
Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою service@support.mexc.com для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.