[AI 應用] DeepSeek-V3.2-Exp 發表！推理效率提效，API 價格至少砍半 [複製連結]

天龍

智天使(八級)

Rank: 11

狀態︰離線

電梯直達

1樓

發表於 2025-10-1 16:13:39 |只看該作者 |倒序瀏覽 | 被感謝次數

x 1

中國 DeepSeek（深度求索）邁向下一代 AI 歷程中，更新一款實驗版本「DeepSeek-V3.2-Exp」。

DeepSeek 透過 Hugging Face 平台介紹最新 DeepSeek-V3.2-Exp，它採用一種名為 DeepSeek Sparse Attention（DSA）新技術，作為邁向新一代架構的中間步驟。

DeepSeek 今年以推理模型 DeepSeek-R1 震驚矽谷，計劃推出新產品鞏固在中國 AI 產業的領先地位。DeepSeek-V3.2-Exp 在 DeepSeek-V3.1-Terminus 基礎上加入一種稀疏注意力機制，即 DSA，針對長篇文本的訓練和推理效率進行改善與驗證。

DeepSeek-V3.2-Exp 採用 DSA，凸顯 DeepSeek 尋求降低訓練成本與難度的方法，尤其是被限制取得 NVIDIA 晶片資源的情況下。DeepSeek 創辦人梁文鋒今年以此主題與他人合著一篇論文，闡述開發者如何將軟體創新與校準後的硬體結合，以減少運算需求。

降低成本讓 DeepSeek 的模型具競爭力，DeepSeek 將 API 價格砍半甚至更多，加入其他中國新創公司以大幅降價吸引開發者的行列。值得一提的是，中國 AI 晶片廠商華為與寒武紀宣布，產品將支援 DeepSeek 最新模型更新。

DeepSeek 也表示，最新模型支援 FP8 精度，同時正在努力支援 BF16。模型要處理數以百萬的數值，使用像 FP8 與 BF16 這類較小的格式可在速度與精度之間取得平衡，在受限硬體上執行大型語言模型變得更容易。雖然 FP8 準度不高，但對許多 AI 任務而言很有用，BF16 則被認為訓練模型時更為精確。

錄自：科技新報

已有 1 人評分	SOGO幣	收起理由
smartlion	+ 10	您發表的文章內容豐富，無私分享造福眾人，.

總評分: SOGO幣 + 10 查看全部評分

喜歡嗎？分享這篇文章給親朋好友︰

檢舉

返回列表

本論壇為非營利自由討論平台，所有個人言論不代表本站立場。文章內容如有涉及侵權，請通知管理人員，將立即刪除相關文章資料。侵權申訴或移除要求：abuse@oursogo.com
GMT+8, 2025-11-21 08:00	手機版\|SOGO論壇

	品味生活\|休閒天地\|興趣嗜好\|學術藝文\|女性頻道\|電腦數位\|遊戲天堂\|影視音樂\|宗教綜合\|綜合圖片\|綜合影片\|成人園地
	© 2004-2025 SOGO論壇 OURSOGO.COM

[AI 應用] DeepSeek-V3.2-Exp 發表！推理效率提效，API 價格至少砍半 [複製連結]

瀏覽過的版塊