SOGO論壇 › 論壇 › ≡ 電腦數位 ≡ › AI › 通用 LLM 挑戰數學奧林匹亞試題，OpenAI 推理模型達金牌 ...

查看: 3014|回覆: 1

[AI 應用] 通用 LLM 挑戰數學奧林匹亞試題，OpenAI 推理模型達金牌水準 [複製連結]

Teddyhug

智天使(八級)

Rank: 11

狀態︰離線

電梯直達

1樓

發表於 2025-7-21 15:34:47 |只看該作者 |正序瀏覽 | 被感謝次數

x 1

歷史悠久、規模盛大的國際數學奧林匹亞競賽（International Mathematical Olympiad，IMO），今年不只有天資聰穎的各國學生參賽，還有 OpenAI 以尚未公開的實驗性推理模型加入挑戰，為自家 AI 發展增添重要里程碑。

從事大型語言模型和推理研究的 OpenAI 科學家 Alexander Wei 在 X 發文表示，OpenAI 最新推理模型解出今年 IMO 競賽 6 道題目中的 5 題。模型對每道數學題目提交作答證明，並由 3 名前 IMO 獎牌得主獨立評分，取得一致共識確認最終分數。滿分 42 分的前提下，OpenAI 總共得到 35 分，足以獲得金牌。

面對 IMO 需要提交難以驗證、長達多頁的作答證明，OpenAI 以強化學習，打造出能夠撰寫複雜且能嚴謹論證、媲美數學家的模型。

OpenAI 與學生選手遵照相同規則，在 2 場各 4.5 小時的考試，由模型讀取數學題目說明，以自然語言方式產生作答證明，而且不得使用網路或其他工具。

IMO 題目要求持續的創造性思考，遠遠超越過往的基準測試。在推理所需時間上，OpenAI 的模型從基準測試 GSM8K（頂尖人才需約 0.1 分鐘）、MATH（約 1 分鐘）、AIME（約 10 分鐘）再到這次 IMO（約 100 分鐘），持續有所突破。

實際上，IMO 競賽讓各國派出最多 6 名學生參賽，挑戰極具難度的數學題目。今年有 630 名參賽者，僅 67 人獲頒金牌。

值得一提的是，Alexander Wei 談到 OpenAI 很快將會推出 GPT-5，期待大家試用。他也補充，IMO 金牌級模型屬於實驗性研究模型，暫不打算在未來數個月釋出具有強大數學能力的產品。

錄自：科技新報

已有 1 人評分	SOGO幣	收起理由
smartlion	+ 20

總評分: SOGO幣 + 20 查看全部評分

喜歡嗎？分享這篇文章給親朋好友︰

檢舉

smartlion

SOGO版主

Rank: 15

狀態︰離線

2樓

發表於 2025-7-21 18:21:00 |只看該作者

善用AI工具，也可以讓AI提升您的專業能力！
但使用AI也需要保持人類思辨的能力，別被AI牽著走，
要反過來，引領著AI走出屬於自己的一片天地！

落霞與孤鶩齊飛，秋水共長天一色

檢舉

返回列表

[AI 應用] 通用 LLM 挑戰數學奧林匹亞試題，OpenAI 推理模型達金牌水準 [複製連結]

瀏覽過的版塊

版主勳章

熱心參予論壇活動及用心回覆主題勳章

本論壇為非營利自由討論平台，所有個人言論不代表本站立場。文章內容如有涉及侵權，請通知管理人員，將立即刪除相關文章資料。侵權申訴或移除要求：abuse@oursogo.com
GMT+8, 2026-1-8 20:18	手機版\|SOGO論壇

	品味生活\|休閒天地\|興趣嗜好\|學術藝文\|女性頻道\|電腦數位\|遊戲天堂\|影視音樂\|宗教綜合\|綜合圖片\|綜合影片\|成人園地
	© 2004-2026 SOGO論壇 OURSOGO.COM