Google 與非洲研究機構聯盟推出了 WAXAL 數據集,這是一項重大的新舉措… 這篇文章 Google 將以 21 種非洲語言訓練 AIGoogle 與非洲研究機構聯盟推出了 WAXAL 數據集,這是一項重大的新舉措… 這篇文章 Google 將以 21 種非洲語言訓練 AI

Google 將以 21 種非洲語言訓練 AI,包括約魯巴語、豪薩語和伊博語

Google 與非洲研究機構聯盟推出了 WAXAL 資料集,這是一項重大的新計畫,旨在解決人工智慧(AI)在非洲大陸面臨的主要挑戰之一,即無法解釋和理解大多數非洲語言。

該專案提供了一個大型開放語音資料集,涵蓋 21 種撒哈拉以南非洲語言,並為超過 1 億被排除在 AI 經濟之外的人們帶來語音技術。

WAXAL 資料集是由 Google 資助、當地大學和社群團體領導的三年合作成果。

它包含 1,250 小時的轉錄自然語音和超過 20 小時的錄音室級錄音,旨在建立高保真合成語音。它針對豪薩語、約魯巴語、盧干達語、伊博語和阿喬利語等語言,其中許多語言有數千萬人使用,但在商業語音系統中仍然基本上不可見。

Google 與非洲大學推出 WAXAL 資料集,以訓練 AI 理解 21 種非洲語言,包括約魯巴語、豪薩語和伊博語

儘管有關全球 AI 的討論很多,但語音技術仍然嚴重偏向英語以及少數歐洲和亞洲語言。非洲擁有超過 2,000 種語言,卻一直被邊緣化。

這種差距不僅是學術性的;它決定了誰可以使用數位服務、誰可以取得教育和醫療保健工具,以及誰能在現代 AI 平台上建立公司。Google 將這項工作定位為縮小長期資料差距的一步,這種差距使許多非洲語言無法出現在語音助理和其他工具上。

為什麼 WAXAL 資料集對非洲 AI 架構很重要

除了直接解決這種不平衡之外,該專案本身與資料同樣重要。

與早期非洲語音資料被提取並歸其他地方所有的計畫不同,WAXAL 由非洲機構在當地領導。烏干達的馬凱雷雷大學、迦納大學和盧安達的 Digital Umuganda 監督資料收集、社群參與和語言管理,並獲得 Google Research Africa 的技術支援。

至關重要的是,這些機構保留了資料的所有權。這在一個經常因在開放旗幟下複製掠奪性動態而受到批評的領域中是一個顯著的轉變。

根據 Google Research Africa 負責人 Aisha Walcott-Bryant 的說法:「WAXAL 的最終影響是賦予非洲人民權力。這個資料集為學生、研究人員和企業家提供了關鍵基礎,讓他們能夠按照自己的條件、使用自己的語言建立技術,最終觸及超過 1 億人。」

她補充說:「我們期待看到非洲創新者使用這些資料創造一切,從新的教育工具到語音啟用服務,在整個非洲大陸創造實實在在的經濟機會。」

Google 與非洲大學推出 WAXAL 資料集,以訓練 AI 理解 21 種非洲語言,包括約魯巴語、豪薩語和伊博語Aisha Walcott-Bryant,Google Research Africa 負責人

參與的大學也呼應了這一框架。馬凱雷雷大學高級講師 Joyce Nakatumba-Nabende 表示:

「要讓 AI 在非洲產生真正的影響,它必須說我們的語言並理解我們的背景。WAXAL 資料集為我們的研究人員提供了建立反映我們獨特社群的語音技術所需的高品質資料。在烏干達,它已經增強了我們當地的研究能力,並支援了由學生和教職員領導的新專案。」

在迦納大學,副教授 Isaac Wiafe 指出公眾參與的規模:

「對我們迦納大學來說,WAXAL 的影響超越了資料本身。它賦予了我們建立自己的語言資源和培養新一代 AI 研究人員的能力。超過 7,000 名志願者加入我們,因為他們希望自己的聲音和語言屬於數位未來。今天,這種集體努力在健康、教育和農業等領域激發了創新生態系統。這證明了當資料存在時,可能性就會到處擴展。」

有理由持謹慎樂觀態度。開放語音資料集可以降低缺乏大規模收集資料資源的當地新創企業和研究人員的障礙。它們還可以減少對外國 API 的依賴,這些 API 很少能很好地支援非洲語言,即使有也是如此。

Google 與非洲大學推出 WAXAL 資料集,以訓練 AI 理解 21 種非洲語言,包括約魯巴語、豪薩語和伊博語WAXAL 資料集

儘管如此,資料集並不能保證結果;建立可靠的語音系統需要持續投資、本地部署以及將價值留在國內的商業途徑。Google 作為資助者和召集人的角色將受到審查,特別是關於 WAXAL 資料未來如何被全球公司使用。

目前,WAXAL 資料集的發布標誌著朝向更具語言包容性的 AI 生態系統邁出了具體的一步。它並不能解決非洲的 AI 挑戰,但它解決了一個基礎性的挑戰。語音通常是與技術最自然的介面。確保 AI 能夠聽到非洲所有多樣性的聲音,早就該做到了。

這篇文章《Google 訓練 AI 理解 21 種非洲語言,包括約魯巴語、豪薩語和伊博語》首次發表於 Technext。

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

馬斯克又要「讓遊戲再次偉大」?預告 xAI 明年產出高品質遊戲與影視內容

馬斯克又要「讓遊戲再次偉大」?預告 xAI 明年產出高品質遊戲與影視內容

馬斯克預告 xAI 將在明年大規模產出高品質 AI 生成遊戲與影視內容。這些完全客製化的 AI 生成遊戲與影視內容,將徹底顛覆娛樂產業,引發業界對 xAI 未來的無限想像。 馬斯克最近他在 X 平台發文,預告 xAI 預計在明年(2027 年)開始大規模產出高品質、可即時生成的影視內容與電子遊戲,甚至強調這些內容可以完
分享
Techbang2026/02/03 09:30
中國率先禁用隱藏式車門把手,試圖制訂新世代車輛「新規則」

中國率先禁用隱藏式車門把手,試圖制訂新世代車輛「新規則」

你有找不到電動車門把手的困擾嗎?基於安全考量,中國將於 2027 年起強制車輛配備機械式開啟機制,禁用隱藏式車門把手。此全球首例的規範,不僅衝擊既有車輛設計,更加深中國在全球車輛標準制定上的影響力。
分享
Inside2026/02/03 10:18
Solana 的(SOL)近期漲勢可能令人印象深刻,但尋求改變生活的 ROI 的投資者正在關注其他地方

Solana 的(SOL)近期漲勢可能令人印象深刻,但尋求改變生活的 ROI 的投資者正在關注其他地方

這篇文章《Solana(SOL)近期漲勢令人印象深刻,但尋求改變生活的投資回報率的投資者正在關注其他地方》發表於BitcoinEthereumNews.com。Solana(SOL)最近的漲勢吸引了來自各地的投資者,但對有遠見的投資者來說,更大的故事是下一波能改變生活的回報將會出現在哪裡。隨著Solana繼續保持生態系統使用率和網絡利用率的高水平,Mutuum Finance(MUTM)的舞台正在慢慢搭建。 MUTM在其快速增長的預售中定價為$0.035。投資者將在下一階段期待14.3%的價格增值。隨著預售持續獲得動力,已籌集超過$15.85百萬。與大多數只是短期炒作的代幣不同,Mutuum Finance正成為一個以實用為重點的選擇,具有更多價值潛力,因此對於尋求不僅僅是價格波動的投資者來說,是一個越來越好的選擇。 Solana在$234附近維持漲幅,投機持續 Solana(SOL)目前交易價格為$234.08,24小時範圍保持在$234.42至$248.19之間,展示了最近的趨勢。該代幣錄得近13%的強勁七日漲幅,遠超過大多數同類代幣,這得益於交易量增加和機構買入的支持。阻力位在$250-$260,支撐位似乎在$220-$230,因此這些是潛在突破或回調的重要水平。 然而,市場觀察者認為,新的DeFi加密貨幣Mutuum Finance仍處於預售階段,具有更多上漲潛力。 Mutuum Finance第6階段預售 Mutuum Finance目前處於預售第6階段,提供價格為$0.035的代幣。預售進展非常快,投資者已籌集超過$15.85百萬。該項目還期待在Ethereum區塊鏈上推出與美元掛鉤的穩定幣,用於便捷支付和作為長期價值的保存者。 Mutuum Finance是一個雙重借貸、多用途的DeFi平台,同時使借款人和貸款人受益。它為零售以及...
分享
BitcoinEthereumNews2025/09/18 06:23