SOGO論壇

手機版 ■ 站務公告 ■ 加分活動 ■ 綜合教學 ■ 疑問建議 ■ 私密影像申訴檢舉專區

SOGO論壇 › 論壇 › ≡ 電腦數位 ≡ › AI › Google 新研究：AI 模型準確率最高僅 69%，答錯率高達三 ...

查看: 3280|回覆: 0

上一主題

下一主題

[AI 應用] Google 新研究：AI 模型準確率最高僅 69%，答錯率高達三分之一 [複製連結]

天使長(十級)

Rank: 13

狀態︰離線

電梯直達

跳轉到指定樓層

1樓

發表於 2025-12-16 17:09:29 |只看該作者 |倒序瀏覽 | 被感謝次數

被感謝次數

x 1

Google 最新研究，目前人工智慧聊天機器人事實準確性還是項重大挑戰，最佳模型如 Gemini 3 Pro 準確率僅 69%。數據來自 Google 最新 FACTS 基準測試，即使最先進 AI，仍無法達 70% 準確率，這對需精準數據的行業如金融、醫療和法律來說，會造成嚴重後果。

FACTS基準測試由Google FACTS團隊與Kaggle合作開發，直接測試AI模型在真實世界的事實準確性。測試有四方面：參數知識、搜尋性能、基於文件準確性和多模態理解。結果顯示，Gemini 3 Pro準確性領先，得分69%，其他模型Gemini 2.5 Pro和OpenAI ChatGPT-5接近62%。

儘管GPT-5.2網路搜尋錯誤率降低45%，思考模式降低80%，但Google和OpenAI都強調高風險應用仍需人類重複驗證。獨立測試顯示，儘管這些模型深度和情感洞察方面有進步，仍未達人類準確性。

研究還指出，AI模型多模態任務表現最差，準確率經常低於50%。這代表聊天機器人解讀圖表或圖片時，會自信地誤讀數據，導致難察覺的錯誤。Google數據顯示，儘管AI不斷進步，但要當成完全可靠的訊息來源前，仍需驗證和人類監督。

今年AI評估和具體化需求增加，業界對AI的期望也逐漸調整。專家呼籲使用AI時，還是該保持謹慎，避免盲目信任。

錄自：科技新報

已有 1 人評分	SOGO幣	收起理由
smartlion	+ 10	您發表的文章內容豐富，無私分享造福眾人，.

總評分: SOGO幣 + 10 查看全部評分

喜歡嗎？分享這篇文章給親朋好友︰

感謝作者

本論壇為非營利自由討論平台，所有個人言論不代表本站立場。文章內容如有涉及侵權，請通知管理人員，將立即刪除相關文章資料。侵權申訴或移除要求：abuse@oursogo.com
GMT+8, 2026-7-4 22:37	手機版\|SOGO論壇

	品味生活\|休閒天地\|興趣嗜好\|學術藝文\|女性頻道\|電腦數位\|遊戲天堂\|影視音樂\|宗教綜合\|綜合圖片\|綜合影片\|成人園地
	© 2004-2026 SOGO論壇 OURSOGO.COM

回頂部