- 註冊時間
- 2024-2-27
- 最後登錄
- 2025-11-5
- 主題
- 查看
- 積分
- 897
- 閱讀權限
- 100
- 文章
- 459
- 相冊
- 3
- 日誌
- 2
  
狀態︰
離線
|
隨著人工智慧技術的迅速發展,AI 驅動的搜尋引擎在提供資訊的方式上與傳統搜尋引擎有顯著差異。最近,德國波鴻魯爾大學和馬克斯·普朗克軟體系統研究所的研究人員發表一篇名為《生成式 AI 時代的網路搜尋特徵》(Characterizing Web Search in The Age of Generative AI)的預印本論文,比較了 Google 搜尋引擎的傳統連結結果與其 AI 概述,以及 Gemini-2.5-Flash 和 GPT-4o 的網路搜尋模式。
研究涉及多個來源的測試查詢,包括提交給ChatGPT的具體問題、AllSides上的政治主題,以及亞馬遜最受搜尋的100個產品列表。結果顯示,生成式搜尋工具引用的來源,通常來自於比傳統搜尋中前十名連結更不受歡迎的網站,根據域名追蹤器Tranco的數據,這些來源更有可能不在前1,000或前100萬的域名之內。
例如,Google的AI概述中有53%的來源在相同查詢的前十名Google連結中不存在,而40%的來源甚至不在前100名的Google連結接中。這些差異並不意味著AI生成的結果一定「更差」。研究發現,基於GPT的搜尋更可能引用企業實體和百科全書等來源,而幾乎不引用社群媒體網站。
在 Science Queries 資料集上,不同搜尋引擎所取得的網域類型有所不同。
此外,AI驅動的搜尋結果在可辨識的「概念」數量上與傳統前十名連結相似,顯示出相似的細節、豐富性和新穎性。然而,研究人員指出,生成式引擎往往會壓縮資訊,有時會省略傳統搜尋保留的次要或模糊的方面,尤其是在查詢模糊的情況下,傳統搜尋結果提供更好的覆蓋。
儘管如此,AI搜尋引擎在將預訓練(pre-trained)的「內部知識」與引用網站的數據結合方面具有優勢,特別是GPT-4o與搜尋工具,經常不引用任何網路來源,而是根據其訓練直接提供回應。然而,這種對預訓練數據的依賴在尋找即時資訊時可能成為限制。
研究人員呼籲未來的研究應該探索「新的評估方法,綜合考慮來源多樣性、概念覆蓋和生成搜尋系統的綜合行為」。
錄自:科技新報
|
-
總評分: SOGO幣 + 20
查看全部評分
|