SOGO論壇
  登入   註冊   找回密碼
查看: 610|回覆: 0
列印 上一主題 下一主題

[AI 應用] 研究:AI 搜尋來源更冷門、內容豐富度可媲美傳統搜尋 [複製連結]

Rank: 10Rank: 10Rank: 10

狀態︰ 離線
跳轉到指定樓層
1
發表於 3 天前 |只看該作者 |倒序瀏覽 | x 1
隨著人工智慧技術的迅速發展,AI 驅動的搜尋引擎在提供資訊的方式上與傳統搜尋引擎有顯著差異。最近,德國波鴻魯爾大學和馬克斯·普朗克軟體系統研究所的研究人員發表一篇名為《生成式 AI 時代的網路搜尋特徵》(Characterizing Web Search in The Age of Generative AI)的預印本論文,比較了 Google 搜尋引擎的傳統連結結果與其 AI 概述,以及 Gemini-2.5-Flash 和 GPT-4o 的網路搜尋模式。

研究涉及多個來源的測試查詢,包括提交給ChatGPT的具體問題、AllSides上的政治主題,以及亞馬遜最受搜尋的100個產品列表。結果顯示,生成式搜尋工具引用的來源,通常來自於比傳統搜尋中前十名連結更不受歡迎的網站,根據域名追蹤器Tranco的數據,這些來源更有可能不在前1,000或前100萬的域名之內。

例如,Google的AI概述中有53%的來源在相同查詢的前十名Google連結中不存在,而40%的來源甚至不在前100名的Google連結接中。這些差異並不意味著AI生成的結果一定「更差」。研究發現,基於GPT的搜尋更可能引用企業實體和百科全書等來源,而幾乎不引用社群媒體網站。

 
在 Science Queries 資料集上,不同搜尋引擎所取得的網域類型有所不同。

此外,AI驅動的搜尋結果在可辨識的「概念」數量上與傳統前十名連結相似,顯示出相似的細節、豐富性和新穎性。然而,研究人員指出,生成式引擎往往會壓縮資訊,有時會省略傳統搜尋保留的次要或模糊的方面,尤其是在查詢模糊的情況下,傳統搜尋結果提供更好的覆蓋。

儘管如此,AI搜尋引擎在將預訓練(pre-trained)的「內部知識」與引用網站的數據結合方面具有優勢,特別是GPT-4o與搜尋工具,經常不引用任何網路來源,而是根據其訓練直接提供回應。然而,這種對預訓練數據的依賴在尋找即時資訊時可能成為限制。

研究人員呼籲未來的研究應該探索「新的評估方法,綜合考慮來源多樣性、概念覆蓋和生成搜尋系統的綜合行為」。

錄自:科技新報

已有 1 人評分SOGO幣 收起 理由
smartlion + 20 您發表的文章內容豐富,無私分享造福眾人,.

總評分: SOGO幣 + 20   查看全部評分

喜歡嗎?分享這篇文章給親朋好友︰
               感謝作者     

您需要登錄後才可以回覆 登入 | 註冊


本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請通知管理人員,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com

GMT+8, 2025-11-5 16:40

© 2004-2025 SOGO論壇 OURSOGO.COM
回頂部