[AI 應用] 洛斯阿拉莫斯國家實驗室推出 PAS 工具，即時揪出視覺語言模型「自說自話」的幻覺輸出 [複製連結]

天龍

天使長(十級)

Rank: 13

狀態︰離線

電梯直達

1樓

發表於 2026-6-13 13:54:58 |只看該作者 |倒序瀏覽 | 被感謝次數

x 1

洛斯阿拉莫斯國家實驗室（Los Alamos National Laboratory）研究團隊近日提出一項名為 Prelim Attention Score（PAS）的新工具，主打即時偵測視覺語言模型是否出現「幻覺」輸出，也就是模型描述了圖片中不存在、或與影像內容不一致的物體與資訊。這項方法可在模型運作過程中同步監測，協助判斷答案究竟是根據影像生成，還是過度依賴自身先前產生的文字。

研究人員指出，PAS 可直接套用在既有主流視覺語言模型上，幾乎不需要額外運算成本，因此具備「即插即用」特性。洛斯阿拉莫斯電腦科學家曼尼什·巴塔拉（Manish Bhattarai）表示，PAS 具備即時監測能力，能以低額外運算負擔提升多模態 AI 的安全性與可信度，並在偵測幻覺方面達到先進水準。

PAS 的運作方式，是追蹤自迴歸式視覺語言模型在逐步生成每個 token 時，注意力主要來自影像、文字提示，還是模型自己前面已生成的詞句。當系統對某個物件的描述過度倚賴前文時，PAS 就會給出提示分數；分數越接近零，代表越不可能出現幻覺輸出。洛斯阿拉莫斯實習生 Xuan Nhat Hoang 形容，這套工具是讀取 AI 已經產生的訊號，能在不增加太多負擔的前提下，找出模型開始「自說自話」的關鍵時刻。

團隊表示，PAS 未來可用於醫學影像、科學文件分析、工程圖面、遙測資料等需要嚴格驗證視覺內容的場景，避免不受支撐的影像陳述影響後續決策。這項研究在今年 6 月於丹佛舉行、由 IEEE 與 Computer Vision Foundation 主辦的 Computer Vision and Pattern Recognition（CVPR）2026 會議上發表，並獲洛斯阿拉莫斯實驗室的 Laboratory Directed Research and Development 計畫資助。

錄自：科技新報

已有 1 人評分	SOGO幣	收起理由
smartlion	+ 30	您發表的文章內容豐富，無私分享造福眾人，.

總評分: SOGO幣 + 30 查看全部評分

喜歡嗎？分享這篇文章給親朋好友︰

檢舉

返回列表

本論壇為非營利自由討論平台，所有個人言論不代表本站立場。文章內容如有涉及侵權，請通知管理人員，將立即刪除相關文章資料。侵權申訴或移除要求：abuse@oursogo.com
GMT+8, 2026-7-5 06:27	手機版\|SOGO論壇

	品味生活\|休閒天地\|興趣嗜好\|學術藝文\|女性頻道\|電腦數位\|遊戲天堂\|影視音樂\|宗教綜合\|綜合圖片\|綜合影片\|成人園地
	© 2004-2026 SOGO論壇 OURSOGO.COM

[AI 應用] 洛斯阿拉莫斯國家實驗室推出 PAS 工具，即時揪出視覺語言模型「自說自話」的幻覺輸出 [複製連結]

瀏覽過的版塊