Breeze ASR 26：填補台語語音辨識空白的關鍵里程碑

在語音技術的演進過程中，低資源語言往往被遺忘。對於台灣而言，國語辨識雖已趨於成熟，但**台語（台灣台語/閩南語）**長期以來一直是全球 AI 模型的軟肋。

為了填補這一空白，**聯發創新基地（MediaTek Research）**於 2026 年初發表了 Breeze ASR 26。作為 MR Breeze 3 系列的核心，這款模型的問世標誌著一個歷史性的里程碑：它是首個專為台灣母音與靈魂量身打造的高性能開源 ASR 系統。

Breeze ASR 26 是一款擁有 20 億參數的模型，基於 OpenAI Whisper 架構開發。不同於主要針對台灣國語優化的前代 Breeze ASR 25，ASR 26 使用了超過 10,000 小時 的高品質台語合成與真實語音數據進行訓練。

Breeze ASR 26 真正令人驚嘆的地方，在於它能夠處理台灣日常生活中複雜的語言模式。

台灣人的對話很少只使用一種語言。在一句話中混合國語、台語和英語是極為普遍的。Breeze ASR 26 專門針對這種轉換進行了訓練。 範例：「你這個 kha-bang (包包) 有夠媠 (漂亮)，在哪裡買的？」 該模型能精準轉錄這類「混合語」句子，這是過去通用模型難以企及的成就。

像 Whisper-large-v2 這樣的全球模型在轉錄台語時，字元錯誤率 (CER) 通常居高不下。Breeze ASR 26 在聯發科同步發表的「Breeze Taigi Benchmark」中達到了約 30.13% 的 CER，相較於通用系統實現了質的飛躍。

隱私是聯發創新基地的核心價值之一。Breeze ASR 26 針對消費級硬體進行了優化。透過量化技術，它可以在僅有 4GB VRAM 的筆記型電腦（如 RTX 3050）上執行，實現對機敏對話或文化遺產項目的私密、離線轉錄。

為了確保與現代文本處理工具及大型語言模型 (LLM) 的相容性，Breeze ASR 26 將聽到的台語直接轉錄為繁體中文漢字。這使得輸出結果能被更廣泛的受眾直接閱讀與使用。

Breeze ASR 26 是 2026 年發表的模型家族成員之一：

Breeze ASR 26 不僅僅是一項技術成就，它更是一個文化保存的工具。透過讓機器能夠高精度地理解與轉錄台語，聯發創新基地正確保台灣的語言遺產在數位時代不被遺忘。

無論您是要構建三語客服機器人、轉錄口述歷史，還是為台語內容製作無障礙字幕，Breeze ASR 26 都是全新的標準。

開發者可以在 Hugging Face 的 MediaTek-Research/Breeze-ASR-26 路徑下載模型並開始開發。