SOGO論壇
  登入   註冊   找回密碼
查看: 2925|回覆: 0
列印 上一主題 下一主題

[AI 應用] Google 新研究:AI 模型準確率最高僅 69%,答錯率高達三分之一 [複製連結]

Rank: 11Rank: 11Rank: 11Rank: 11

狀態︰ 離線
跳轉到指定樓層
1
發表於 2025-12-16 17:09:29 |只看該作者 |倒序瀏覽 | x 1
Google 最新研究,目前人工智慧聊天機器人事實準確性還是項重大挑戰,最佳模型如 Gemini 3 Pro 準確率僅 69%。數據來自 Google 最新 FACTS 基準測試,即使最先進 AI,仍無法達 70% 準確率,這對需精準數據的行業如金融、醫療和法律來說,會造成嚴重後果。

FACTS基準測試由Google FACTS團隊與Kaggle合作開發,直接測試AI模型在真實世界的事實準確性。測試有四方面:參數知識、搜尋性能、基於文件準確性和多模態理解。結果顯示,Gemini 3 Pro準確性領先,得分69%,其他模型Gemini 2.5 Pro和OpenAI ChatGPT-5接近62%。

儘管GPT-5.2網路搜尋錯誤率降低45%,思考模式降低80%,但Google和OpenAI都強調高風險應用仍需人類重複驗證。獨立測試顯示,儘管這些模型深度和情感洞察方面有進步,仍未達人類準確性。

研究還指出,AI模型多模態任務表現最差,準確率經常低於50%。這代表聊天機器人解讀圖表或圖片時,會自信地誤讀數據,導致難察覺的錯誤。Google數據顯示,儘管AI不斷進步,但要當成完全可靠的訊息來源前,仍需驗證和人類監督。

今年AI評估和具體化需求增加,業界對AI的期望也逐漸調整。專家呼籲使用AI時,還是該保持謹慎,避免盲目信任。

錄自:科技新報
已有 1 人評分SOGO幣 收起 理由
smartlion + 10 您發表的文章內容豐富,無私分享造福眾人,.

總評分: SOGO幣 + 10   查看全部評分

喜歡嗎?分享這篇文章給親朋好友︰
               感謝作者     

您需要登錄後才可以回覆 登入 | 註冊


本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請通知管理人員,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com

GMT+8, 2025-12-31 23:35

© 2004-2025 SOGO論壇 OURSOGO.COM
回頂部