- 註冊時間
- 2025-2-12
- 最後登錄
- 2026-3-23
- 主題
- 查看
- 積分
- 1960
- 閱讀權限
- 120
- 文章
- 779
- 相冊
- 1
- 日誌
- 0
  
狀態︰
離線
|
在一項引人注目的實驗中,程式設計新創公司 Cursor 利用 OpenAI 的 GPT-5.2,部署了數百個自主 AI 代理,成功從零開始建造並運行了一個完整的網頁瀏覽器,且在整整一週內無需人類干預。這個成就產生了約 300 萬行代碼,並在開發者中引發討論,展示了長期運行代理的先進能力。
這款瀏覽器擁有自己的瀏覽器引擎,能渲染網頁、處理Flexbox布局、顯示圖像和執行腳本,儘管存在一些可見的故障,證明它並非基於現有的引擎。Cursor的自定義協調層管理著數百個代理,透過結構化角色防止混亂:規劃者負責創建任務,工作者執行任務,而評審代理則驗證任務的完成。最初的平面層級結構失敗,因為代理變得風險厭惡並出現瓶頸,這突顯了提示設計的重要性超過基礎設施。
這項實驗的成本約為8萬美元的AI代幣,並持續運行了數天到數週。Cursor是一個針對AI開發優化的Visual Studio Code分支,支援GPT、Claude、Gemini和Grok等模型,具備多文件編輯、終端命令和「指針」系統等功能,以高效處理上下文而不會使代理記憶過載。
這項成就引發開發者熱議,獨立研究員西門·威利森(Simon Willison)曾預測到2029年將會有人使用AI建造完整的網頁瀏覽器,而Cursor的進展將這個時間表提前,讓專家們感到驚訝。OpenAI工程師Bill Chen強調,這個項目使用的GPT-5.2模型顯示了在長期任務中更高的連貫性和智慧,這標誌著一種「能力過剩」的現象,即最先進的AI模型能夠做的事情,遠超過目前的公開部署。
Cursor工程師Jonas Nelle指出,隨著 AI 模型持續進步,工程師和研究人員需要每隔幾個月重新審視他們對 AI 模型能力的假設。雖然他坦言「今天不會下載它來取代 Chrome」,但這個瀏覽器專案「肯定比以往任何模型所能做到的都要好」。
儘管這些工具仍然是研究原型,尚未公開,但Cursor的實驗顯示了AI在複雜、持續的軟件工程中的潛力。
錄自:科技新報
|
-
總評分: SOGO幣 + 40
查看全部評分
|