聯發創新基地(MediaTek Research)發表全新 MediaTek Research Breeze 3(後略 MR Breeze 3)系列,包含台語語音辨識模型 Breeze ASR 26、台語語音合成模型 BreezyVoice 26,以及專為台灣設計的 AI 內容安全防護模型 Breeze Guard 26。MR Breeze 3 延續 Breeze 系列深耕繁體中文與台灣文化,將 AI 能力進一步拓展至台語語音領域,並在 AI 應用領域上建立在地化的安全防線。其中,Breeze ASR 26 及 Breeze Guard 26 將開源分享給大眾使用,且所有模型皆可在 Breeze AI LINE 官方帳號體驗。
台語語音辨識模型 Breeze ASR 26 — 讓 AI 聽懂台語
台語擁有豐富的聲調變化及多元的書寫方式,然而此特色卻成為語音辨識技術上極大的挑戰。目前全球主流的語音辨識模型漸能嫻熟辨識英語與華語,對於台語卻常常出現「聽攏無」的窘境。
Breeze ASR 26 即是為此而生。Breeze ASR 26 以 OpenAI Whisper 為基礎架構,使用約 10,000 小時的台語合成語音資料進行訓練;相較於傳統朗讀式語料,合成語音涵蓋更貼近日常生活的對話情境,有自然的語速變化、口語用詞、國台語夾雜使用的情境,讓模型能夠真正習得台灣人平時講台語的特色。
在 Breeze AI LINE 官方帳號中,只要打開麥克風並以台語敘述,Breeze ASR 26 即刻啟動並將語音轉為文字。舉例來說,開啟麥克風並說「(台語)你這個 kha-bang 有夠媠,(華語)在哪裡買的」,Breeze ASR 26 便即刻辨識出來。即便說話過程夾雜華語或英文單詞,模型仍能正確辨識。

台語語音合成模型 BreezyVoice 26 — 讓 AI 開口說台語
在去年的 MediaTek Research Breeze 2 系列中,BreezyVoice 以自然的台灣口音中文語音合成大受好評。此次全新發表的 BreezyVoice 26 則更進一步讓 AI 「講台語」。BreezyVoice 26 基於 CosyVoice 2 架構,同樣使用大量的台語合成語音資料進行訓練,讓模型將文字轉換為自然流暢的台語語音。
BreezyVoice 26 最大的特色在於語音自然程度,其人工評測文字轉語音的品質獲得滿分 5 分的評價(MOS)。評測者認為,BreezyVoice 26 轉譯出來的語音就像真人講話。這主要歸功於模型是從大量合成語音資料中進行學習,忠實地掌握台灣人講台語時的語調和節奏。
在 Breeze AI LINE 官方帳號中,輸入「你這個帳戶的年利率有 3%」,BreezyVoice 26 隨即生成一段自然的台語語音。

AI 安全防護模型 Breeze Guard 26 — 專為台灣社會情境所設計的內容把關
隨著 AI 應用日益普及,確保 AI 能夠辨識並防範有害內容更顯重要。然而,現有的國際安全模型多針對英文內容設計,對於台灣獨有的風險情境如本土常見的詐騙話術、在地文化脈絡下的歧視性言論等卻往往難以精準判斷。
過去 MR Breeze 2 在預訓練階段其實已大量學習繁體中文的新聞、論壇、公部門文件等內容,已具備對台灣社會與文化的深厚理解。Breeze Guard 26 即以 Breeze 2 8B 為基礎模型,再加以超過 12,000 筆針對台灣風險情境所設計的訓練資料進行訓練,聚焦台灣常見的有害內容包括言語不雅、詐騙、不實資訊、言語歧視、政治操弄等不同類型文字內容。
結語
MR Breeze 3 系列完整呈現聯發創新基地在「讓 AI 更懂台灣」這條路上又更向前邁進一步。從聽懂台語、說出台語,到守護台灣數位環境的安全,聯發創新基地將持續建構完整的台灣在地 AI 能力。
聯發創新基地也同步發表了台語語音評測基準 Breeze Taigi Benchmark 與台灣安全評測基準 TS-Bench,歡迎學界與業界夥伴使用,共同推進台灣 AI 技術的發展。
立即體驗 Breeze AI LINE 官方帳號
以上三個模型都可以在 Breeze AI LINE 官方帳號直接體驗。透過下方選單即可切換不同功能:
-
聽我說話:對著手機說台語,AI 藉由 Breeze ASR 26 讓語音即時轉為文字
-
唸給我聽:直接輸入文字,AI 透過 BreezyVoice 26 將文字轉為台語唸給你聽
-
內容把關:直接輸入文字,AI 憑藉 Breeze Guard 26 協助判斷內容安全性
聯發創新基地相關連結:
關於聯發創新基地
所有聯發創新基地模型
Breeze AI LINE 官方帳號
