Google та консорціум африканських дослідницьких установ запустили набір даних WAXAL, новий масштабний проєкт для… Публікація Google to train AI in 21 African languagesGoogle та консорціум африканських дослідницьких установ запустили набір даних WAXAL, новий масштабний проєкт для… Публікація Google to train AI in 21 African languages

Google навчатиме ШІ 21 африканській мові, включаючи йоруба, хауса та ігбо

2026/02/02 22:00

Google та консорціум африканських дослідницьких інституцій запустили набір даних WAXAL — масштабну нову ініціативу для вирішення однієї з основних проблем штучного інтелекту (ШІ) на континенті: його нездатності інтерпретувати та розуміти більшість африканських мов.

Проєкт надає великий відкритий набір мовленнєвих даних, що охоплює 21 мову Африки на південь від Сахари, і відкриває голосові технології для понад 100 мільйонів людей, виключених з економіки ШІ.

Набір даних WAXAL є результатом трирічної співпраці, профінансованої Google та очолюваної місцевими університетами та громадськими групами.

Він включає 1 250 годин транскрибованого природного мовлення та понад 20 годин студійних записів, спрямованих на створення високоякісних синтетичних голосів. Він охоплює такі мови, як хауса, йоруба, луганда, ігбо та ачолі, багато з яких використовують десятки мільйонів людей, але які залишаються значною мірою невидимими для комерційних мовленнєвих систем.

Google та африканські університети запускають набір даних WAXAL для навчання ШІ 21 африканській мові, включаючи йорубу, хаусу та ігбо

Незважаючи на всі розмови про глобальний ШІ, голосові технології все ще значною мірою орієнтуються на англійську та невелику кількість європейських і азійських мов. Африка, де проживає понад 2 000 мов, залишилася на узбіччі.

Цей розрив не є академічним; він визначає, хто може користуватися цифровими послугами, хто має доступ до освітніх і медичних інструментів і хто може створювати компанії на основі сучасних платформ ШІ. Google представила цю роботу як крок до скорочення тривалого розриву в даних, який тримав багато африканських мов поза голосовими асистентами та іншими інструментами.

Чому набір даних WAXAL важливий для африканської архітектури ШІ

Окрім безпосереднього усунення цього дисбалансу, проєкт має таке ж значення, як і самі дані.

На відміну від попередніх ініціатив, де африканські мовленнєві дані витягувалися та належали іншим, WAXAL очолювали африканські інституції на місцях. Університет Макерере в Уганді, Університет Гани та Digital Umuganda в Руанді здійснювали нагляд за збором даних, залученням громадськості та управлінням мовами за технічної підтримки Google Research Africa.

Важливо, що ці інституції зберігають право власності на дані. Це помітний зсув у галузі, яку часто критикують за відтворення видобувної динаміки під прапором відкритості.

За словами Аїші Уолкотт-Браянт, голови Google Research Africa, "Остаточний вплив WAXAL полягає в розширенні можливостей людей в Африці. Цей набір даних забезпечує критичну основу для студентів, дослідників та підприємців для створення технологій на власних умовах, їхніми власними мовами, нарешті охоплюючи понад 100 мільйонів людей".

"Ми з нетерпінням чекаємо, коли африканські новатори використають ці дані для створення всього — від нових освітніх інструментів до голосових сервісів, які створюють відчутні економічні можливості по всьому континенту", — додала вона. 

Google та африканські університети запускають набір даних WAXAL для навчання ШІ 21 африканській мові, включаючи йорубу, хаусу та ігбоАїша Уолкотт-Браянт, голова Google Research Africa

Це формулювання підтримують залучені університети. Джойс Накатумба-Набенде, старший викладач Університету Макерере, сказала:

"Щоб ШІ мав реальний вплив в Африці, він повинен говорити нашими мовами та розуміти наші контексти. Набір даних WAXAL надає нашим дослідникам високоякісні дані, необхідні для створення мовленнєвих технологій, які відображають наші унікальні спільноти. В Уганді це вже зміцнило наш місцевий дослідницький потенціал та підтримало нові проєкти, очолювані студентами та викладачами".

В Університеті Гани асоційований професор Ісаак Віафе вказав на масштаб громадської участі: 

"Для нас в Університеті Гани вплив WAXAL виходить за межі самих даних. Це дало нам змогу створити власні мовні ресурси та навчити нове покоління дослідників ШІ. Понад 7 000 волонтерів приєдналися до нас, тому що хотіли, щоб їхні голоси та мови належали до цифрового майбутнього. Сьогодні ці колективні зусилля запустили екосистему інновацій у таких галузях, як охорона здоров'я, освіта та сільське господарство. Це доводить, що коли дані існують, можливості розширюються скрізь".

Є підстави для обережного оптимізму. Відкриті набори мовленнєвих даних можуть знизити бар'єри для місцевих стартапів і дослідників, яким не вистачає ресурсів для збору даних у масштабі. Вони також можуть зменшити залежність від іноземних API, які рідко підтримують африканські мови належним чином, якщо взагалі підтримують.

Google та африканські університети запускають набір даних WAXAL для навчання ШІ 21 африканській мові, включаючи йорубу, хаусу та ігбоНабір даних WAXAL

Проте набори даних не гарантують результатів; створення надійних голосових систем вимагає постійних інвестицій, локального розгортання та комерційних шляхів, які зберігають цінність у країні. Роль Google як фінансуючої сторони та організатора викличе увагу, особливо щодо того, як дані WAXAL використовуватимуться глобальними компаніями в майбутньому.

Наразі випуск набору даних WAXAL є конкретним кроком до більш лінгвістично інклюзивної екосистеми ШІ. Це не вирішує проблем ШІ в Африці, але вирішує фундаментальну. Голос часто є найприроднішим інтерфейсом з технологіями. Забезпечити, щоб ШІ міг почути, як говорить Африка, в усьому її різноманітті, давно назріло.

Допис Google навчатиме ШІ 21 африканській мові, включаючи йорубу, хаусу та ігбо вперше з'явився на Technext.

Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою service@support.mexc.com для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.

Вам також може сподобатися

Kopser для Техасу охоплює 18 тисяч незареєстрованих виборців у окрузі Тревіс

Kopser для Техасу охоплює 18 тисяч незареєстрованих виборців у окрузі Тревіс

Kopser for Texas зв'язався з понад 18 000 незареєстрованими мешканцями округу Тревіс, прагнучи розширити участь виборців. Під керівництвом кандидата Джозефа Копсера кампа
Поділитись
Citybuzz2026/02/03 08:10
Команда Трампа виділила $22,44 мільйона на BitGo через гаманець.

Команда Трампа виділила $22,44 мільйона на BitGo через гаманець.

PANews повідомило 3 лютого, що, згідно з моніторингом Onchain Lens, команда Трампа виділила гаманець (Aduis...PUU4) для переказу 5,267 мільйона Trumps вартістю
Поділитись
PANews2026/02/03 09:25
Нещодавнє зростання Solana (SOL) може вражати, але інвестори, які націлені на життєзмінний ROI, дивляться в інший бік

Нещодавнє зростання Solana (SOL) може вражати, але інвестори, які націлені на життєзмінний ROI, дивляться в інший бік

Пост "Нещодавнє ралі Solana (SOL) може вражати, але інвестори, які націлені на життєзмінний ROI, дивляться в інший бік" з'явився на BitcoinEthereumNews.com. Останнє ралі Solana (SOL) привернуло інвесторів з усього світу, але більша історія для інвесторів з баченням полягає в тому, куди прямують наступні хвилі життєзмінних прибутків. Оскільки Solana продовжує демонструвати високі рівні використання екосистеми та мережі, поступово створюється сцена для Mutuum Finance (MUTM). MUTM оцінюється в $0,035 у своєму швидкозростаючому передпродажі. Зростання ціни на 14,3% - це те, на що інвестори очікуватимуть у наступній фазі. Понад $15,85 мільйонів було зібрано, оскільки передпродаж продовжує набирати обертів. На відміну від більшості токенів, що катаються на короткострокових хвилях прогріву, Mutuum Finance стає вибором, орієнтованим на утиліті, з більшим потенціалом цінності, а отже, все кращим варіантом для інвесторів, які шукають більше, ніж просто рух ціни. Solana утримує прибутки біля $234, оскільки спекуляції тривають Solana (SOL) наразі торгується за ціною $234,08, утримуючи свій 24-годинний діапазон близько $234,42 до $248,19, що ілюструє останню тенденцію. Токен зафіксував сильні семиденні прибутки майже на 13%, значно перевищуючи більшість своїх конкурентів, оскільки його підтримують зростаючий обсяг та інституційні покупки. Рівень опору знаходиться на $250-$260, а рівень підтримки, здається, на $220-$230, і тому це важливі рівні для потенційного прориву або відкату ринку. Однак нова DeFi криптовалюта Mutuum Finance розглядається ринковими спостерігачами як така, що має більший потенціал зростання, оскільки все ще перебуває на етапі передпродажу. Mutuum Finance Фаза 6 Передпродажу Mutuum Finance наразі перебуває на Етапі передпродажу 6 і пропонує токени за $0,035. Передпродаж відбувається дуже швидко, і інвестори вже зібрали понад $15,85 мільйонів. Проект також очікує на стейблкоїн, прив'язаний до USD на блокчейні Ethereum для зручних платежів та як зберігач довгострокової цінності. Mutuum Finance - це платформа DeFi з подвійним кредитуванням та багатоцільовим призначенням, яка приносить користь як позичальникам, так і кредиторам. Вона надає мережу для роздрібних, а також...
Поділитись
BitcoinEthereumNews2025/09/18 06:23