[AI 應用] AI 聊天機器人 vs. 妄想用戶：Grok 與 Gemini 表現堪憂，GPT-5.2 與 Claude 維持界線 [複製連結]

陽光先生

座天使(七級)

Rank: 10

狀態︰離線

電梯直達

1樓

發表於 6 天前 |只看該作者 |倒序瀏覽 | 被感謝次數

x 1

紐約市立大學與英國國王學院共同研究指出，當研究者模擬出有憂鬱、解離與社交退縮特徵的使用者，各 AI 聊天機器人反應差異極大，xAI Grok 4.1 Fast 與 Google Gemini 3 Pro 反應最令人擔憂，OpenAI GPT-5.2 與 Anthropic Claude Opus 4.5 相對有維持安全界線。

團隊設計出「Lee」虛構人物，長達 116 回合對話，由「世界是否是電腦模擬」的單純好奇逐漸滑向更明確的妄想內容，以觀察五款主流模型不同對話階段、累積上下文增加時，是否會強化使用者錯誤信念。受測模型為 GPT-4o、GPT-5.2、Grok 4.1 Fast、Gemini 3 Pro 與 Claude Opus 4.5。

結果顯示，Grok 面對自殺暗示時不僅沒踩煞車，研究者形容為帶「鼓勵」意味，甚至以令人不安的詩意語言讚揚對方「準備就緒」；鏡中雙身情境，還延伸出雙重身分與儀式性行為。Gemini 則在處理家書草稿時，形容使用者親友是個威脅，暗示親友可能試圖「重設」或「藥物控制」當事人。GPT-4o 也有明顯問題，包括認可「邪惡鏡中實體」說法，甚至建議聯絡靈異調查員。

GPT-5.2 與 Claude Opus 4.5 表現明顯較佳。GPT-5.2 拒絕協助把將妄想之詞加諸家人，改以更誠實直接表述引導；Claude 則要求使用者關閉應用程式、聯絡信任的人，必要時前往就診。作者 Luke Nicholls 表示，差異顯示降低模型誘發妄想的風險可行，問題不在技術無法解決，而是各公司的安全設計與標準選擇是否完整。

錄自：科技新報

已有 1 人評分	SOGO幣	收起理由
smartlion	+ 20	您發表的文章內容豐富，無私分享造福眾人，.

總評分: SOGO幣 + 20 查看全部評分

喜歡嗎？分享這篇文章給親朋好友︰

檢舉

返回列表

本論壇為非營利自由討論平台，所有個人言論不代表本站立場。文章內容如有涉及侵權，請通知管理人員，將立即刪除相關文章資料。侵權申訴或移除要求：abuse@oursogo.com
GMT+8, 2026-5-5 06:14	手機版\|SOGO論壇

	品味生活\|休閒天地\|興趣嗜好\|學術藝文\|女性頻道\|電腦數位\|遊戲天堂\|影視音樂\|宗教綜合\|綜合圖片\|綜合影片\|成人園地
	© 2004-2026 SOGO論壇 OURSOGO.COM

[AI 應用] AI 聊天機器人 vs. 妄想用戶：Grok 與 Gemini 表現堪憂，GPT-5.2 與 Claude 維持界線 [複製連結]

瀏覽過的版塊