[AI 應用] AI評測揭曉：GPT-5表現最佳、Gemini 2.5最具「臺灣價值」 [複製連結]

天龍

智天使(八級)

Rank: 11

狀態︰在線上

電梯直達

1樓

發表於 2025-10-5 19:14:05 |只看該作者 |倒序瀏覽 | 被感謝次數

x 1

AI產品與系統評測中心（Artificial Intelligence Evaluation Center,AIEC）今10月3日首次公布語言模型基準評測結果，公開比較國內外模型表現，並首次納入「臺灣價值觀」指標，呼應國際AI主權浪潮。這場評測不僅是技術成績單，更是台灣AI在地化及可信賴發展的重要里程碑。

AIEC本次共評測42項國內外語言模型，依模型規模分小模型（13B以下）及大模型（13B以上）兩大類。指標除了「高中學測國文科」與「學測社會科」外，更加入「臺灣價值觀」評測，意在檢視模型是否能回應在地語境與文化需求。

小模型中，由台灣團隊開發的TAIDE（Gemma-3-TAIDE-12b）表現亮眼，不僅超越其所依循的GoogleGemma-3-12b-it，更展現台灣在AI調校與研發的實力。大模型則以OpenAIGPT-5整體表現最佳，而GoogleGemini2.5Flash在「臺灣價值觀」測驗中突出，顯示跨國大廠已開始重視特定文化價值的回應能力。

部分中國語言模型在「臺灣價值觀」項目中也展現不錯成績，可能因採用「蒸餾技術」，透過歐美模型的輸出作為訓練資料。

評測也揭示，若歐美模型缺乏台灣繁體中文語料，其在「臺灣價值觀」上的表現普遍不佳，突顯「本土化語料」的重要性。數位發展部正推動「台灣主權AI語料庫」，提供具在地語境及本土價值的繁體中文資料，以確保未來生成式AI更符合台灣文化與使用需求。

AIEC表示，未來將持續針對不同產品與應用場景，推動本土AI評測工具開發，同時與國際規範接軌，打造「安全、穩健、可信賴」的AI評測體系。另將廣泛徵求各界專家出題，經審核後納入題庫，確保評測題材多元並貼近社會議題。

錄自：TN科技島

已有 1 人評分	SOGO幣	收起理由
smartlion	+ 10	您發表的文章內容豐富，無私分享造福眾人，.

總評分: SOGO幣 + 10 查看全部評分

喜歡嗎？分享這篇文章給親朋好友︰

檢舉

返回列表

本論壇為非營利自由討論平台，所有個人言論不代表本站立場。文章內容如有涉及侵權，請通知管理人員，將立即刪除相關文章資料。侵權申訴或移除要求：abuse@oursogo.com
GMT+8, 2025-12-4 15:41	手機版\|SOGO論壇

	品味生活\|休閒天地\|興趣嗜好\|學術藝文\|女性頻道\|電腦數位\|遊戲天堂\|影視音樂\|宗教綜合\|綜合圖片\|綜合影片\|成人園地
	© 2004-2025 SOGO論壇 OURSOGO.COM

[AI 應用] AI評測揭曉：GPT-5表現最佳、Gemini 2.5最具「臺灣價值」 [複製連結]

瀏覽過的版塊