SOGO論壇
  登入   註冊   找回密碼
查看: 3408|回覆: 0
列印 上一主題 下一主題

[AI 應用] OpenAI 發表開放權重模型 gpt-oss,效能堪比 o4-mini、可離線運行 [複製連結]

Rank: 10Rank: 10Rank: 10

狀態︰ 離線
跳轉到指定樓層
1
發表於 2025-8-6 17:20:10 |只看該作者 |倒序瀏覽 | x 2
OpenAI 終於推出自 GPT-2 以來首款開放權重推理模型,包括 gpt-oss-120b、gpt-oss-20b 兩種版本,擁有堪比 o4-mini 的強大性能,可在裝置端上運行,能對特定用途進行微調。對 OpenAI 而言,代表發展策略除專有模型外,也嘗試開放模型這一條路,以應對 DeepSeek 等對手所帶來的競爭壓力。

gpt-oss-120b、gpt-oss-20b 皆採 OpenAI 去年秋季 o1 模型中的 CoT(Chain of Thought)推理方式,讓生成式 AI 工具透過多步驟處理來回答提問,而非直接提供答案。

兩款 gpt-oss 僅支援文字,而非多模態,但能瀏覽網頁、呼叫雲端模型協助特定任務、執行程式碼,並能作為 AI 代理操作軟體。此外,兩款皆採 Apache 2.0 授權,是開放權重模型的常見選項,可用於商業用途,或納入其他授權軟體中。

gpt-oss-120b 在核心推理基準測試中的表現與 o4-mini 幾乎持平,只要單一 80GB GPU 就能高效運行。參數量較小的 gpt-oss-20b 基準測試結果與 o3-mini 相似,甚至可在至少 16GB 記憶體的裝置執行,無需昂貴的運算基礎設施。

NVIDIA 表示,gpt-oss 可在 NVIDIA GeForce RTX 和 RTX PRO GPU 運行,如 AWS、微軟 Azure 也提供 gpt-oss 給客戶選用。

「我們很高興能將這款耗費數十億美元研發的模型提供給全球用戶,讓更多人能接觸到 AI。」OpenAI 執行長奧特曼(Sam Altman)表示,gpt-oss-120b 與 gpt-oss-20b 已經上傳至開源機器學習社群平台 Hugging Face,提供免費下載。而 OpenAI 上一次釋出開放權重模型,是 2019 年發表的 GPT-2。

開放權重模型獨特之處,在於「權重」對外公開,任何人都能檢視內部參數,了解模型如何處理資訊。「開放權重模型具備截然不同優勢」,OpenAI 總裁布洛克曼(Greg Brockman)認為,並非要以免費選項取代專有模型,而是與現有付費模型互補。

這批開放權重模型原訂今年 3 月公開,為了進一步安全測試不得不延後。實際上,開放權重模型比封閉模型風險更高,任何人都能取得並微調以達到特定用途,在安全上需要更多考量。

來自中國的 DeepSeek 以其低成本運行的開放權重模型震撼 AI 市場,為業界帶來更多競爭壓力,美國也有 Meta 的 Llama 作為開放代表。雖然 OpenAI 發表 gpt-oss 未直接提及 DeepSeek 或任何 AI 公司,但奧特曼明確表示,期望美國成為開放權重模型的創新重鎮,「OpenAI 的使命是確保通用人工智慧造福全人類」,期待全球都能在基於民主價值、由美國打造且免費開放的 AI 技術上共同創新,共享利益。

錄自:科技新報
已有 1 人評分SOGO幣 收起 理由
smartlion + 10 您發表的文章內容豐富,無私分享造福眾人,.

總評分: SOGO幣 + 10   查看全部評分

喜歡嗎?分享這篇文章給親朋好友︰
               感謝作者     

您需要登錄後才可以回覆 登入 | 註冊


本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請通知管理人員,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com

GMT+8, 2025-8-24 06:13

© 2004-2025 SOGO論壇 OURSOGO.COM
回頂部