[AI 應用] 聯發科創新基地發表 AI 語音辨識模型，更理解台灣用語及口音，發生不會聽成花生 [複製連結]

天龍

權天使(三級)

Rank: 6 Rank: 6

狀態︰離線

電梯直達

1樓

發表於 2025-7-1 15:07:25 |只看該作者 |倒序瀏覽 | 被感謝次數

x 1

聯發科集團轄下的前瞻技術研究單位聯發創新基地（MediaTek Research）發表，採用OpenAI Whisper的AI語音辨識開源模型 MediaTek Research Breeze ASR 25（後略 MR Breeze ASR 25）。

聯發科表示，相較於 OpenAI Whisper，更加理解台灣用語及口音。同時，在台灣常見的中、英混合的用語情境上，也達到更高的精準度。此外，模型以 Apache 2.0 條款釋出，以利促進百工百業在各類創意 AI 領域應用。

聯發創新基地負責人許大山博士表示，開源語音辨識模型雖逐年進步，但對於在地用語及口音的辨識度仍顯不足，例如把「發生什麼事」聽成「花生什麼事」。有鑑於語音辨識是 AI 應用的關鍵啟動功能，此次特別釋出「聽得懂在地語言」的 ASR 模型 MR Breeze ASR 25，其精準度相較於 OpenAI 的 Whisper 提升近 10%、中英語轉換表現（Code-switching）則增進 56%。藉此，聯發創新基地能以完整的繁體中文 AI ，積極推進繁體中文AI的創新並普及模型於地端及裝置端的使用。

聯發創新基地自 2025 年起已陸續開源全套繁體中文 AI 模型，包含整合視覺功能的語言模型（Visual Large Language Models，V-LLM）、針對台灣口音調整的文字轉語音模型（Text to Speech，TTS）、以及能調用外部資訊的函式呼叫（Function Calling）模型。此次釋出的MR Breeze ASR 25 為 MR Breeze 系列第二代語音辨識開源模型，能即時將語音轉為文字，並透過強化台灣語料及台灣口音，來符合本土應用需求。而目前，MR Breeze ASR 25 已於 HuggingFace上架。

錄自：科技新報

已有 1 人評分	SOGO幣	收起理由
smartlion	+ 10	您發表的文章內容豐富，無私分享造福眾人，.

總評分: SOGO幣 + 10 查看全部評分

喜歡嗎？分享這篇文章給親朋好友︰

檢舉

返回列表

本論壇為非營利自由討論平台，所有個人言論不代表本站立場。文章內容如有涉及侵權，請通知管理人員，將立即刪除相關文章資料。侵權申訴或移除要求：abuse@oursogo.com
GMT+8, 2025-7-22 21:43	手機版\|SOGO論壇

	品味生活\|休閒天地\|興趣嗜好\|學術藝文\|女性頻道\|電腦數位\|遊戲天堂\|影視音樂\|宗教綜合\|綜合圖片\|綜合影片\|成人園地
	© 2004-2025 SOGO論壇 OURSOGO.COM

[AI 應用] 聯發科創新基地發表 AI 語音辨識模型，更理解台灣用語及口音，發生不會聽成花生 [複製連結]

瀏覽過的版塊