SOGO論壇
  登入   註冊   找回密碼
查看: 16|回覆: 0
列印 上一主題 下一主題

[AI 應用] 找 AI 看診到底行不行?牛津大學:和搜尋引擎準確度差不多 [複製連結]

Rank: 13Rank: 13Rank: 13Rank: 13

狀態︰ 離線
跳轉到指定樓層
1
發表於 2026-2-10 19:15:01 |只看該作者 |倒序瀏覽 | x 1
最新研究顯示,AI 聊天機器人醫療建議表現與傳統搜尋引擎相當,卻未改善用戶健康度。

研究由牛津網路研究所與牛津大學納菲爾德基層健康科學系的學者,與 MLCommons 及其他機構合作,近 1,300 名英國參與者,測試十個專家設計的醫療情境,參與者隨機分成兩組,一組用大型語言模型(LLMs)如 GPT-4o、Llama 3 和 Command R+,另一組為個人常用診斷方法,大部分為網路搜尋或個人知識。

結果顯示,使用 LLM 參與者的評估健康狀況和建議行動表現,與用搜尋引擎的參與者相當,成功率僅 33%~45%。儘管 LLM 理論上結構化問題有 94.9% 準確率,但實際互動時因人類與 AI 溝通不良,導致表現差距頗大。用戶經常忽略關鍵細節、誤解聊天機器人意思或忽視建議。

共同作者之一、牛津網路研究所副教授 Luc Rocher 表示,儘管 AI 不斷突破,但要保證將來模型能平衡用戶的慰藉需求與公共衛生系統的有限,仍是個挑戰。越來越多人依賴聊天機器人給予醫療建議,大眾可能會將錯誤但看似合理的診斷導入已吃緊的醫療體系。

研究者強調,AI 聊天機器人尚未準備好在現實世界當醫生,呼籲開發者和監管機構部署 LLM 照護病患前,必須實際評估用戶。

錄自:科技新報

已有 1 人評分SOGO幣 收起 理由
smartlion + 20 您發表的文章內容豐富,無私分享造福眾人,.

總評分: SOGO幣 + 20   查看全部評分

喜歡嗎?分享這篇文章給親朋好友︰
               感謝作者     

您需要登錄後才可以回覆 登入 | 註冊

本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請通知管理人員,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com

GMT+8, 2026-5-5 12:37

© 2004-2026 SOGO論壇 OURSOGO.COM
回頂部