SOGO論壇
  登入   註冊   找回密碼
查看: 1589|回覆: 0
列印 上一主題 下一主題

[AI 應用] 洛斯阿拉莫斯國家實驗室推出 PAS 工具,即時揪出視覺語言模型「自說自話」的幻覺輸出 [複製連結]

Rank: 13Rank: 13Rank: 13Rank: 13

狀態︰ 離線
跳轉到指定樓層
1
發表於 2026-6-13 13:54:58 |只看該作者 |倒序瀏覽 | x 1
洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)研究團隊近日提出一項名為 Prelim Attention Score(PAS)的新工具,主打即時偵測視覺語言模型是否出現「幻覺」輸出,也就是模型描述了圖片中不存在、或與影像內容不一致的物體與資訊。這項方法可在模型運作過程中同步監測,協助判斷答案究竟是根據影像生成,還是過度依賴自身先前產生的文字。

研究人員指出,PAS 可直接套用在既有主流視覺語言模型上,幾乎不需要額外運算成本,因此具備「即插即用」特性。洛斯阿拉莫斯電腦科學家曼尼什·巴塔拉(Manish Bhattarai)表示,PAS 具備即時監測能力,能以低額外運算負擔提升多模態 AI 的安全性與可信度,並在偵測幻覺方面達到先進水準。

PAS 的運作方式,是追蹤自迴歸式視覺語言模型在逐步生成每個 token 時,注意力主要來自影像、文字提示,還是模型自己前面已生成的詞句。當系統對某個物件的描述過度倚賴前文時,PAS 就會給出提示分數;分數越接近零,代表越不可能出現幻覺輸出。洛斯阿拉莫斯實習生 Xuan Nhat Hoang 形容,這套工具是讀取 AI 已經產生的訊號,能在不增加太多負擔的前提下,找出模型開始「自說自話」的關鍵時刻。

團隊表示,PAS 未來可用於醫學影像、科學文件分析、工程圖面、遙測資料等需要嚴格驗證視覺內容的場景,避免不受支撐的影像陳述影響後續決策。這項研究在今年 6 月於丹佛舉行、由 IEEE 與 Computer Vision Foundation 主辦的 Computer Vision and Pattern Recognition(CVPR)2026 會議上發表,並獲洛斯阿拉莫斯實驗室的 Laboratory Directed Research and Development 計畫資助。

錄自:科技新報

已有 1 人評分SOGO幣 收起 理由
smartlion + 30 您發表的文章內容豐富,無私分享造福眾人,.

總評分: SOGO幣 + 30   查看全部評分

喜歡嗎?分享這篇文章給親朋好友︰
               感謝作者     

您需要登錄後才可以回覆 登入 | 註冊

本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請通知管理人員,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com

GMT+8, 2026-7-5 06:27

© 2004-2026 SOGO論壇 OURSOGO.COM
回頂部