SOGO論壇
  登入   註冊   找回密碼
查看: 17|回覆: 0
列印 上一主題 下一主題

[AI 應用] Claude Sonnet 4.6 上線,評測勝 Opus 4.6 成 Free 及 Pro 用戶預設模型 [複製連結]

Rank: 13Rank: 13Rank: 13Rank: 13

狀態︰ 離線
跳轉到指定樓層
1
發表於 2026-2-20 16:16:27 |只看該作者 |倒序瀏覽 | x 1
Anthropic 17 日推出 Claude Sonnet 4.6,並設成 Free 及 Pro 方案用戶 claude.ai 與 Claude Cowork 應用程式預設模型。新版寫程式、電腦操控、長文本推理及知識型工作等均有提升,API 定價則與上代 Sonnet 4.5 一樣。

性能突破媲美 Opus
Sonnet 4.6 以 Sonnet 定價提供 Opus 級智慧,是新版最受矚目賣點。過去需要 Opus 系列才能完成的辦公室任務,如分析複雜試算表或填寫多步驟網頁表單,Sonnet 4.6 已達人類操作水準。第三方評測機構 Vals AI 測試顯示 Sonnet 4.6 在 Vals Index 及 Vals Multimodal Index 兩大指標均排名第一。財務代理評測得分 63.3%,稅務評測 v2 得分 77.1%,均超越同期 Opus 4.6。亦在 AIME 數學評測取得 92.3% 高分。

 

寫程式力大幅提升
Sonnet 4.6 於 SWE-bench 評測取得 76.2% 得分,程式碼除錯範疇較 Sonnet 4.5 提升超過 10 個百分點。Anthropic 表示早期獲試用資格的開發者大多傾向選用 Sonnet 4.6,而非前代甚至 2025 年 11 月的 Claude Opus 4.5,反映市場認可度相當高。新版有 1,000,000 token 上下文視窗,有助處理大型企業檔案及複雜長文本分析任務。

電腦操控達業界新高
Sonnet 4.6 在 Computer Use 功能方面,複雜保險業電腦操控評測取得 94% 高分,是所有 Claude 系列模型最高成績。新版本能主動分析操作失誤並自行修正,大幅提升自主工作流程的可靠性。Anthropic 形容性格溫暖誠實和親社會並偶爾帶幽默感,同時具強安全性,未出現高風險錯位跡象。

Sonnet 4.6 的 API 定價與 Sonnet 4.5 相同。每 1,000,000 input tokens 收費 3 美元,outputtokens 為每 1,000,000 收費 15 美元。Free 方案用戶可直接使用新版預設模型。Pro 方案月費維持 20 美元。Opus 4.6 仍是代理寫程式、自動程式操控及多學科推理的首選,適合定位更高階的專業用戶。Anthropic 近日完成 300 億美元融資,公司估值達 3,800 億美元,較去年 9 月估值增倍。

錄自:科技新報

已有 1 人評分SOGO幣 收起 理由
smartlion + 20 您發表的文章內容豐富,無私分享造福眾人,.

總評分: SOGO幣 + 20   查看全部評分

喜歡嗎?分享這篇文章給親朋好友︰
               感謝作者     

您需要登錄後才可以回覆 登入 | 註冊

本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請通知管理人員,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com

GMT+8, 2026-5-5 07:41

© 2004-2026 SOGO論壇 OURSOGO.COM
回頂部