Breeze ASR 26:填補台語語音辨識空白的關鍵里程碑
聯發創新基地(MediaTek Research)推出 Breeze ASR 26,這是首款針對台語(台灣台語)深度優化的開源模型。作為 MR Breeze 3 系列的一員,這款擁有 20 億參數的模型精通國、台、英三語夾雜辨識,讓 AI 真正走進台灣的語言現實。
Breeze ASR 26:填補台語語音辨識空白的關鍵里程碑
在語音技術的演進過程中,低資源語言往往被遺忘。對於台灣而言,國語辨識雖已趨於成熟,但**台語(台灣台語/閩南語)**長期以來一直是全球 AI 模型的軟肋。
為了填補這一空白,**聯發創新基地(MediaTek Research)**於 2026 年初發表了 Breeze ASR 26。作為 MR Breeze 3 系列的核心,這款模型的問世標誌著一個歷史性的里程碑:它是首個專為台灣母音與靈魂量身打造的高性能開源 ASR 系統。
理解母語:20 億參數的深度優化
Breeze ASR 26 是一款擁有 20 億參數的模型,基於 OpenAI Whisper 架構開發。不同於主要針對台灣國語優化的前代 Breeze ASR 25,ASR 26 使用了超過 10,000 小時 的高品質台語合成與真實語音數據進行訓練。
核心技術規格:
- 基礎架構:基於 OpenAI Whisper 微調優化
- 模型大小:約 20 億(2B)參數(量化後約 2.9 GB)
- 開源授權:Apache 2.0
- 專業領域:台語辨識,支援國、台、英三語夾雜(Code-switching)。
為什麼 Breeze ASR 26 是遊戲規則改變者
Breeze ASR 26 真正令人驚嘆的地方,在於它能夠處理台灣日常生活中複雜的語言模式。
1. 精通「三語夾雜」辨識
台灣人的對話很少只使用一種語言。在一句話中混合國語、台語和英語是極為普遍的。Breeze ASR 26 專門針對這種轉換進行了訓練。 範例:「你這個 kha-bang (包包) 有夠媠 (漂亮),在哪裡買的?」 該模型能精準轉錄這類「混合語」句子,這是過去通用模型難以企及的成就。
2. 準確度的顯著突破
像 Whisper-large-v2 這樣的全球模型在轉錄台語時,字元錯誤率 (CER) 通常居高不下。Breeze ASR 26 在聯發科同步發表的「Breeze Taigi Benchmark」中達到了約 30.13% 的 CER,相較於通用系統實現了質的飛躍。
3. 在地端部署的優化
隱私是聯發創新基地的核心價值之一。Breeze ASR 26 針對消費級硬體進行了優化。透過量化技術,它可以在僅有 4GB VRAM 的筆記型電腦(如 RTX 3050)上執行,實現對機敏對話或文化遺產項目的私密、離線轉錄。
4. 標準化的文本輸出
為了確保與現代文本處理工具及大型語言模型 (LLM) 的相容性,Breeze ASR 26 將聽到的台語直接轉錄為繁體中文漢字。這使得輸出結果能被更廣泛的受眾直接閱讀與使用。
MR Breeze 3 生態系
Breeze ASR 26 是 2026 年發表的模型家族成員之一:
- BreezyVoice 26:語音合成 (TTS) 模型,能說出具備自然台灣節奏與語調的台語(人工評分達滿分 5 分)。
- Breeze Guard 26:AI 安全模型,針對 12,000 個在地風險場景(包括台灣本土詐騙手法與假訊息)進行訓練。
結論:用 AI 保存文化
Breeze ASR 26 不僅僅是一項技術成就,它更是一個文化保存的工具。透過讓機器能夠高精度地理解與轉錄台語,聯發創新基地正確保台灣的語言遺產在數位時代不被遺忘。
無論您是要構建三語客服機器人、轉錄口述歷史,還是為台語內容製作無障礙字幕,Breeze ASR 26 都是全新的標準。
開發者可以在 Hugging Face 的 MediaTek-Research/Breeze-ASR-26 路徑下載模型並開始開發。