SOGO論壇
  登入   註冊   找回密碼
查看: 2944|回覆: 1
列印 上一主題 下一主題

[AI 應用] AI 研究者開發「世界模型」,挑戰大型語言模型框架 [複製連結]

Rank: 8Rank: 8

狀態︰ 離線
跳轉到指定樓層
1
發表於 2025-6-16 20:50:48 |只看該作者 |倒序瀏覽 | x 2
本文最後由 無人島 於 2025-6-16 21:06 編輯

隨著 OpenAI、Anthropic 及大型科技公司在開發最先進的大型語言模型上投入數十億美元,有些 AI研究者正致力於下一個重大突破。這些研究者包括史丹佛大學的李飛飛(Fei-Fei Li)和 Meta 的 AI 科學家楊立昆(Yann LeCun),他們正在開發所謂的「世界模型」(World Models)。

 

與大型語言模型不同,世界模型根據人類對周圍世界的心理構建來預測事件,而不是僅依賴於訓練資料中單詞和短語之間的統計關係。

李飛飛在2024年共同創立了World Labs,並獲得來自Andreessen Horowitz、新企業協會和Radical Ventures等風險投資公司的2.3億美元初始資金。World Labs的目標是將AI模型從2D像素平面提升到完整的3D世界,賦予它們與人類一樣豐富的空間智慧,並更像人類的思考模式。

李飛飛認為,世界模型在創意領域、機器人技術或任何需要無限宇宙的領域都有應用潛力。這可能在軍事應用上帶來進展,幫助戰場上的人員更好地感知周圍環境並預測敵人的下一步行動。

在Meta,楊立昆也有一個小團隊專注於類似的項目。他們使用影片資料來訓練模型,並在不同層次上進行抽象影片的模擬。讓AI不是在像素層面進行預測,而是讓系統能在抽象層面上進行預測,而希望可以透過這個模式去除所有難以預測的細節。

楊立昆和李飛飛都認為,這些模型是創造真正超越人類思維AI的唯一途徑。他們強調,AI系統需要能夠快速學習新任務,理解物理世界,而不僅僅是文本和語言,還要具備一定的常識、推理和規劃能力,以及持久的記憶

錄自:科技新報
已有 1 人評分威望 收起 理由
smartlion + 5 感謝update最新AI模型!並追蹤更進一步的資.

總評分: 威望 + 5   查看全部評分

喜歡嗎?分享這篇文章給親朋好友︰
               感謝作者     

Rank: 8Rank: 8

狀態︰ 離線
2
發表於 2025-6-16 21:04:22 |只看該作者
想了解更多「世界模型」的資訊,請Gemini解釋『什麼是AI世界模型?與傳統大語言處理模型有什麼技術特徵上的差異?世界模型有什麼優缺點?目前進展為何?』

Gemini回覆如下:

「AI世界模型」(AI World Model)是人工智慧領域正在迅速發展的一個方向,旨在讓AI系統能夠建立一個對真實世界的內在模擬器,從而理解、預測和模擬現實世界的動態環境。

什麼是AI世界模型?

世界模型是一種生成式AI模型,它能從多模態的輸入數據(如文本、圖像、視頻和運動數據)中學習,並理解現實世界的物理特性、空間關係和因果關係。它的目標是建構一個內部模型,能夠「想像」和「預演」可能的後果,而不需要在真實世界中實際行動。
核心思想:
* 內部模擬: 讓AI系統能夠在內部模擬出真實世界的運作方式,包括物體的行為、環境的變化以及不同動作可能帶來的結果。
* 預測能力: 能夠預測未來事件,而不僅僅是基於過去數據的模式識別。
* 因果理解: 具備對事物之間因果關係的理解,這對於真正的智慧至關重要。

 

簡單來說:

大語言模型擅長「說話」和「理解文字」,它在語言層面表現出色,但對物理世界如何運作的「常識」和「因果關係」理解有限。而世界模型則旨在彌補這一點,讓AI能夠「看見」、「感受」並「推測」真實世界的變化,就像人類的心智模型一樣。

世界模型的優缺點
優點:
* 高效學習與泛化能力:
   * 減少對真實世界互動的需求: 世界模型可以在內部進行「心理演練」,無需在真實世界中頻繁試錯,這在機器人訓練或自動駕駛模擬等高成本、高風險領域尤其重要。
   * 更強的泛化能力: 通過理解底層的物理和因果規律,AI能夠更好地適應新環境和未知情況,而不是僅僅依賴於訓練數據中見過的模式。
* 更接近人類的智慧:
   * 具備常識與推理: 能夠擁有類似人類的物理與空間常識,並進行更高層次的規劃和決策,包括「如果...那麼會怎樣?」的反事實推理。
   * 提升規劃與決策能力: AI可以預測不同行動序列的結果,從而選擇最佳方案,實現更具前瞻性的決策。
* 潛力廣泛:
   * 不只用於生成影片,未來可應用於數位和實體領域的複雜預測和規劃,例如藥物開發模擬、複雜工程設計、軍事戰術規劃等。
   * 有望推動通用人工智慧(AGI)的發展。

缺點:
* 模型複雜性與訓練難度:
   * 數據需求量大且多樣: 需要極其廣泛且具體的訓練數據,涵蓋各種不同的場景和細微差別,以建立對現實世界的全面理解。
   * 計算資源消耗巨大: 由於模型複雜且需要處理多模態數據,其訓練和維持需要消耗更多的計算資源和能源。
   * 模型建構挑戰: 建立一個能準確模擬現實世界的內部模型本身就是一個巨大的技術挑戰,因為現實世界的複雜性遠超人類現有認知。
* 仍處於發展初期:
   * 雖然進展迅速,但距離真正能精確、全面模擬現實世界的「世界模型」還有很長的路要走。目前的模型仍存在侷限性,特別是在處理高度複雜、不確定性高的情境時。
* 潛在的倫理與安全問題:
   * 若世界模型被用於惡意目的(如精準模擬作戰環境、生成超現實假內容),可能帶來嚴重的倫理和安全風險。

目前進展
AI世界模型正處於快速發展階段,許多頂尖的AI研究機構和科技公司(如Google DeepMind、Meta AI、OpenAI)都在積極投入。
* Google DeepMind: 其CEO Demis Hassabis 認為世界模型是邁向通用人工智慧(AGI)的重要一步。
* Meta AI (Yann LeCun團隊): 致力於開發基於視頻數據訓練的模型,目標是讓AI能從抽象層面進行預測,而非僅限於像素層面,以去除難以預測的細節,並強調AI需要快速學習新任務、理解物理世界、具備常識、推理和規劃能力以及持久記憶。
* OpenAI: 雖然以LLM聞名,但也意識到單純語言模型的局限性,並在探索多模態和更深層次世界理解的技術。例如,Sora這樣的視頻生成模型,可以看作是世界模型在特定生成任務上的初步應用,它展示了模型對時空連貫性和物理規律的初步理解。

主要進展方向包括:
* 多模態學習: 整合不同類型的數據(視覺、聽覺、觸覺、語言等),讓模型能從更多維度理解世界。
* 生成式AI的應用: 許多最新的生成式AI模型(如文本到視頻生成)都在某種程度上融入了世界模型的概念,因為它們需要理解物體在時空中的行為才能生成連貫的內容。
* 強化學習的結合: 將世界模型與強化學習結合,讓AI智能體可以在虛擬環境中進行訓練,從而大幅提高學習效率。
* 邁向通用人工智慧: 研究人員普遍認為,世界模型是實現具備人類級別理解、推理和規劃能力的通用人工智慧的關鍵。
總體來說,AI世界模型代表了AI領域的一個重要範式轉變,從單純的數據模式識別轉向對現實世界的更深層次理解和模擬,這對於創造更智能、更具適應性和更接近人類智慧的AI系統至關重要。
已有 1 人評分威望 收起 理由
smartlion + 5 您的真誠回覆內容精闢,堪為表率,值得鼓勵.

總評分: 威望 + 5   查看全部評分

您需要登錄後才可以回覆 登入 | 註冊


本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請通知管理人員,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com

GMT+8, 2025-7-27 12:58

© 2004-2025 SOGO論壇 OURSOGO.COM
回頂部