聯發科發布 Breeze 3 系列模型,強化台語與台灣口音辨識能力,支援繁體中文與台語多場景應用。
聯發創新基地 (MediaTek Research)今日 (3/4)發表全新MediaTek Research Breeze 3 (簡稱MR Breeze 3)系列模型,這次的升級不僅延續Breeze系列深耕繁體中文與台灣文化的初衷,更將AI的觸角首度深入「台語」語音領域,同時針對台灣獨有的社會情境打造在地化的AI內容安全防線。
其中,台語語音辨識模型Breeze ASR 26與安全防護模型Breeze Guard 26將採開源形式分享給大眾使用,全系列模型目前均已上線至Breeze AI LINE官方帳號供民眾體驗。
Breeze ASR 26:克服聲調與混用難題,讓AI真正聽懂台語
台語擁有豐富的聲調變化及多元的書寫方式,這項語言特色一直是語音辨識技術上極大的挑戰 。當目前全球主流的語音辨識模型逐漸能嫻熟辨識英語與華語時,面對台語卻常常出現「聽攏無」的窘境。
為了解決這個痛點,聯發創新基地推出Breeze ASR 26。這款模型以OpenAI Whisper為基礎架構,使用約10000小時的台語合成語音資料進行訓練,相較傳統生硬的朗讀式語料,這批合成語音涵蓋更貼近日常生活的對話情境,具備自然的語速變化與口語用詞,甚至包含台灣人極為習慣的「國台語夾雜使用」情境。
基於上述特性,使得Breeze ASR 26能夠真正學習台灣人平時講台語的口語習慣。在實際應用上,即使說話過程中夾雜華語或英文單詞 (例如:「你這個kha-bang有夠媠,在哪裡買的」),模型依然能夠即刻且正確地進行語音辨識並轉換為文字。
BreezyVoice 26:獲滿分評價,AI開口說道地台灣腔
除了聽得懂,還要說得自然。繼去年推出以自然台灣口音中文語音合成大受好評的BreezyVoice後,這次全新發表的BreezyVoice 26則進一步讓AI學會「講台語」。
BreezyVoice 26是基於CosyVoice 2架構開發,同樣使用大量的台語合成語音資料進行訓練,能將文字轉換為自然流暢的台語語音。
這款模型最大的特色在於其令人驚豔的「語音自然程度」。在人工評測文字轉語音的品質 (MOS)中,BreezyVoice 26獲得滿分5分的極高評價。評測者一致認為其轉譯出來的語音就像真人講話一般,這主要歸功於模型從大量合成資料中,忠實地掌握台灣人講台語時的語調和節奏。
Breeze Guard 26:專為台灣社會情境打造的資安守門員
在語言能力之外,AI應用的安全性把關同樣不容忽視。現有的國際安全模型多半針對英文內容設計,對於台灣獨有的風險情境 (如本土常見的詐騙話術、在地文化脈絡下的歧視性言論等),往往難以進行精準判斷 。
為此,聯發創新基地開發了Breeze Guard 26 AI安全防護模型。由於過去MR Breeze 2在預訓練階段已經大量學習繁體中文的新聞、論壇、公部門文件等內容,對台灣社會與文化有深厚理解。Breeze Guard 26便以Breeze 2 8B為基礎模型,進一步加入超過12000筆針對台灣風險情境所設計的訓練資料進行特化訓練。
這套防護網能精準聚焦台灣常見的有害內容,包含言語不雅、詐騙、不實資訊、言語歧視,以及政治操弄等不同類型的文字內容。
推動開源生態與LINE官方帳號體驗
為了持續建構完整的台灣在地AI能力並推進技術發展,聯發創新基地也同步發表了台語語音評測基準「Breeze Taigi Benchmark」與台灣安全評測基準「TS-Bench」,供學界與業界夥伴使用 。
對於一般使用者,目前這三款模型皆已整合至Breeze AI LINE官方帳號中。使用者只需透過選單切換,即可體驗「聽我說話」 (台語語音轉文字)、「唸給我聽」 (文字轉台語語音),以及「內容把關」 (判斷內容安全性)等三大功能。


