SOGO論壇

標題: 整合 Operator、深入研究雙優勢,代理新工具 ChatGPT agent 登場 [列印本頁]

作者: Teddyhug    時間: 5 天前     標題: 整合 Operator、深入研究雙優勢,代理新工具 ChatGPT agent 登場

OpenAI 將自主代理能力直接整合到 ChatGPT,結合 Operator、Deep Research(深入研究)2 款代理工具的優勢,打造最新 ChatGPT agent(ChatGPT 智慧體),可看出 OpenAI 正全力投入現今最熱門的代理式 AI 領域。

ChatGPT agent 結合 OpenAI 自家 Operator 操作網站的能力、Deep Research 整合網路資訊的能力,以及 ChatGPT 的對話技能,打造出一套自主代理系統,於是 ChatGPT 會依照指示為你完成工作、加速產出過程。這代表你能將構想和問題延伸到具體行動,像是深入研究財務資料、填寫線上表單,或是製作精美簡報。

OpenAI 舉例對 ChatGPT 提出「看一下我的行事曆,並根據最近的新聞,簡單歸納接下來與客戶開會的重點」,或是「分析 3 家競爭對手並製作成簡報」等要求,ChatGPT agent 將會瀏覽網站內容、選擇日期、篩選結果、提醒你安全登入、執行程式碼,甚至產出簡報和試算表等可以編輯的輸出內容,完成整個研究結果。

ChatGPT agent 在執行重要操作前會徵詢你的許可,並在需要時向你徵詢額外資訊,你可以隨時能夠中斷作業、接管瀏覽器,或者直接停止任務。值得一提的是,ChatGPT agent 內建一項「監視模式」保護措施,比方說進行金融交易時,系統會要求用戶不得離開畫面去做其他事,否則 ChatGPT agent 將會暫停運作。

[youtube]https://youtu.be/2wzGS_WUZYQ?si=S-7qLDQrtoR2DHht[/youtube]

事實上,ChatGPT agent 是今年兩項重要突破技術自然演進的成果:Operator 這款代理工具透過遠端瀏覽器直接操作網站,結合多步驟網路推理工具 Deep Research,前者可在網站上捲動、點選及輸入內容,而後者擅長分析和歸納資訊要點。OpenAI 發現,用戶嘗試向 Operator 提出的查詢,其實更適合交由 Deep Research 處理,於是結合兩者優點。

ChatGPT agent 背後的模型透過強化學習進行訓練,可完成需要多種工具的複雜任務;這次就用到透過圖形使用者介面操作網站的視覺瀏覽器、用來處理簡單推理型網路查詢的文字瀏覽器,以及直接存取 API 的機制。

Operator 更對外媒表示,ChatGPT agent 能夠存取「整台電腦」,並非只有瀏覽器,大大增強它能使用的工具集,未來的應用範圍可望更廣。

ChatGPT agent 即日起逐步向 ChatGPT Pro / Plus / Team 訂閱用戶開放,本月也將開放 ChatGPT Enterprise 企業版 / Edu 教育版用戶使用。其中,ChatGPT Pro 方案用戶每月任務數幾乎無上限,而其他訂閱用戶每月可執行 50 項任務,可彈性加購使用額度。

OpenAI 指出這次發表只是將自主代理能力直接整合到 ChatGPT 的開端,團隊計劃持續新增項目以及改進,讓 ChatGPT agent 與時俱進。

[youtube]https://www.youtube.com/live/1jn_RpbPbEc?si=aYGQFyoaTPLGWFva[/youtube]

錄自:科技新報






歡迎光臨 SOGO論壇 (https://oursogo.com/) Powered by OURSOGO.COM