- 註冊時間
- 2012-4-23
- 最後登錄
- 2026-1-11
- 主題
- 查看
- 積分
- 1405
- 閱讀權限
- 110
- 文章
- 684
- 相冊
- 4
- 日誌
- 1
   
狀態︰
離線
|
中國AI新創公司DeepSeek傳出即將推出新一代旗艦模型,主打程式設計能力,內部評測甚至認為,在寫程式相關任務上,表現已超越OpenAI的ChatGPT與Anthropic的Claude等主流模型。
根據科技媒體《The Information》報導,DeepSeek下一代旗艦模型在處理「極長程式碼提示」(extremely long coding prompts)方面有技術突破,目標是讓模型能一次讀懂並操作更大規模的程式專案,而不是只處理短段落程式碼,DeepSeek內部的基準測試(benchmark)中發現,這款新模型在多項程式能力測試中,成績優於目前市面上知名的多個大型語言模型。
報導指出,這款新旗艦模型預計命名為DeepSeek V4,最快可能在「接下來幾週內」對外發布,時間點大約落在該公司前一款推理模型DeepSeek R1公開滿一周年後,R1是在2025年1月20日推出,主打強化邏輯推理與數學解題能力。
DeepSeek新模型特別強調在寫程式上,而DeepSeek若能在長程式碼處理上表現優異,可能有機會切入企業內部舊系統維護、程式碼審查與自動重構等應用面。
近一年來,中國AI新創不斷強調在模型參數規模、推理能力與應用落地上的突破,與美國科技巨頭之間的差距越來越小,若DeepSeek V4實際表現真如內部評測所稱,在寫程式上比ChatGPT與Claude更強,可能真的將為全球AI競賽帶來新一輪壓力。
錄自:TN科技島
|
-
總評分: SOGO幣 + 10
查看全部評分
|