標題: Gemini 3 Deep Think 大升級,學術基準測試勝 Claude Opus 4.6、GPT-5.2 [列印本頁] 作者: lionking0809 時間: 2026-2-13 17:22:45 標題: Gemini 3 Deep Think 大升級,學術基準測試勝 Claude Opus 4.6、GPT-5.2
Deep Think 可說是 Google 為 Gemini 打造的一種進階推理模式,以解決科學、研究及工程領域的挑戰。現在 Google 推出 Gemini 3 Deep Think 重大升級,在學術基準測試勝過 Claude Opus 4.6、GPT-5.2。
Google 去年展示專門設計的 Deep Think,成功應對多項棘手的推理挑戰,在世界級的數學與程式設計競賽達到金牌水準。近期,Deep Think 也讓專門代理能進行研究級數學探索。
升級後的 Deep Think 持續突破邊界,在最嚴格的學術基準測試拿下高分,包括:
在測試先進模型極限的基準測試 Humanity’s Last Exam,以不使用任何工具的情況創下 48.4% 新紀錄。