登入
註冊
找回密碼
品味生活 |
休閒天地 |
興趣嗜好 |
學術藝文 |
女性頻道 |
電腦數位 |
遊戲天堂 |
影視音樂 |
宗教綜合 |
綜合圖片 |
綜合影片 |
成人園地 |
辣妹直播
新聞時事區
生活優遊區
會員廣告交流區
感恩懺悔區
愛情紅綠燈
上班一族
生活智慧王
醫療保健區
美食王國
財富與風險區
消費購物區
釣友天下
海釣討論區
淡水討論區
釣蝦討論區
教學資訊區
汽機車討論區
搞怪爆笑區
趣味笑話區
搞笑圖片區
搞笑短片區
環瀛搜奇區
幽浮事件簿
靈異鬼怪區
數位影像生活
著名旅遊景點
博奕綜合討論區
休閒飲品
品酒專區
咖啡專區
茶香專區
星座命理區
動漫卡通區
連載區
動漫圖片區
軍事討論區
軍旅生涯
非主流討論區
中外歷史區
體育運動區
武術專區
健身會所
職業摔角區
布布發燒區
寵物世界
流浪動物關懷照護社
模型玩具區
園藝花卉區
自行車綜合區
專業討論區
休閒討論區
方寸之美
玩石天地
長篇小說區
連載中之小說
小說討論區
短篇小說區
經典文章區
原創天地
IQ題猜謎語
民俗文化區
懷舊柑仔店
藝術鑑賞區
校園生活
福爾摩沙風情
客家文化
閩南語小棧
原住民札記
手作小物
發明大觀園
女人話題 (男性禁言)
女性秘語 (男性禁言)
溫馨家庭區
寶貝生活館
天使寶寶專區
媽咪孕事區
時尚潮流館
婚姻資訊區
健康塑身區
美容美髮區
珠寶首飾區
AI
電腦軟體分享區
電腦軟體交流討論區
軟體應用教學區
手機通訊產品交流區
APP軟體區
手機圖鈴館
桌上型電腦討論區
硬體知識圖書館
筆記型電腦討論區
電腦DIY配件討論區
數位3C館
電子電機暨資訊工程館
手機遊戲討論區
ONLINE GAME
電競討論區
PC GAME
TV GAME
Facebook 討論版
影視戲劇區
明星貼圖區
樂壇綜合區
樂譜及樂器區
佛教
道教
西方教派
一貫道與其他教派
自拍樂園
原創自拍區
正妹貼圖區
性感誘惑區
激情性愛區
成人卡漫區
成人卡漫下載區
禁忌卡漫
另類圖片區
絲襪美腿區
西洋辣妹區
唯美清純區
自然美景區
電腦桌布分享區
優質套圖區
超市發表區
打包下載區
新註冊會員貼圖專區
成人長片直播區
成人短片直播區
BT下載區
HTTP長片下載區
HTTP短片下載區
歷史存放區
成人交流區
成人文學區
成人文學圖書館
搞笑圖影片區
成人笑話區
成人笑話圖書館
性愛秘技區
性愛秘技圖書館
圖影片求檔區
手機版
■
站務公告
■
加分活動
■
綜合教學
■
疑問建議
■
私密影像申訴檢舉專區
搜尋
搜尋
本版
會員
SOGO論壇
›
論壇
›
≡ 電腦數位 ≡
›
AI
›
專為 AI 推論而生!NVIDIA 留一手底牌 Rubin CPX GPU, ...
返回列表
查看:
2201
|
回覆:
0
[AI 應用]
專為 AI 推論而生!NVIDIA 留一手底牌 Rubin CPX GPU,恐改變 ASIC 競爭格局?
[複製連結]
陽光色叔
陽光色叔
註冊時間
2025-2-12
最後登錄
2025-11-15
主題
查看
積分
247
閱讀權限
50
文章
123
相冊
1
日誌
0
大天使(二級)
大天使(二級), 積分 247, 距離下一級還需 53 積分
串個門
加好友
打招呼
發私訊
狀態︰
離線
電梯直達
1
樓
發表於 2025-11-3 17:45:02
|
只看該作者
|
倒序瀏覽
|
x
1
隨著生成式 AI 應用百花齊放,AI 推論(Inference)成為下一個主戰場,與 AI 訓練(Training)相比,推論更貼近終端應用,直接決定了 AI 技術能否落地與帶來實際價值。
事實上,AI 大神吳恩達早前 2023 年接受媒體採訪時曾表示,「我希望未來推論發生的場景能多於訓練,如此一來 AI 才會成功」,意味 AI 技術成功與推論應用的蓬勃程度相關,以及 AI 變現的場景很大一部分落在推論市場。
另一方面,一個大語言模型可能需要數週到數月時間進行訓練,一旦完成,它可以透過雲端或終端裝置,在全球被無數次用來生成文字、回答問題或翻譯語言。因此,推論的需求量和應用廣度通常遠超於訓練。
NVIDIA 推 Rubin CPX GPU,專為「長情境」AI 推論設計
面對推論市場的龐大商機,NVIDIA 宣布推出 Rubin CPX GPU,專為大規模情境推論打造新一代 GPU,將與 Rubin GPU 和 Vera CPU 協同工作,以加速特定的工作負載,預期 2026 年底上市。
NVIDIA 指出,NVIDIA Rubin CPX 可在處理長情境時提供最高效能與詞元收益,遠超當今系統設計所能承載的範疇。這讓 AI 程式碼助理從簡單的程式碼生成工具,轉型為可理解並最佳化大型軟體項目的複雜系統。
一般來說,AI 模型可能需要使用多達 100 萬個詞元來處理一小時內容的影片,這已達到傳統 GPU 運算的極限。Rubin CPX 將影片解碼器與編碼器,以及長情境推論處理技術整合至單一晶片,為影片搜尋與高品質生成影片等長格式應用。此外,Rubin CPX GPU 採用經濟實惠的單晶片設計,搭載強大的 NVFP4 運算資源,並經過最佳化,可為 AI 推論任務提供極高的效能與能源效率。
接著,本文綜合市場消息分享幾個亮點。
亮點一:CPX GPU 採用 GDDR7 而非 HBM 記憶體
目前大型 AI 模型的推論通常分為兩個階段,分別是「上下文階段」(Context Phase,即 Prefill)和「生成階段」(Generation Phase,即 Decode)。前者是運算密集型的初始階段,用來處理輸入並生成第一個輸出 token;後者則是模型基於已處理的上下文生成後續的 token。
簡單來說,上下文階段可以想像成 「閱讀理解」 的初始階段,需要大量運算,因為模型要處理所有資訊,建立大腦記憶庫,理解其中的意思,並準備好回答問題或生成內容;生成階段則是「開始作答」的階段,模型用第一階段建立的上下文記憶,一次生成一個字、詞或句子,生成階段主要依賴記憶體的存取速度,因為模型需要快速查找已理解的資訊來生成後續文字。
NVIDIA 的 Rubin CPX GPU 主要就是專為長上下文推理而設計,這當中需要極高的運算吞吐量,來處理百萬以上 token 的上下文工作負載,因此需要充足、但頻寬不一定要很高的記憶體,傳統資料中心 GPU 雖然擁有大量 HBM 記憶體,可以處理這類工作負載,但在此任務上並不高效。
因此,第一個亮點是採用 128 GB GDDR7 記憶體,而非過去常使用的 HBM 記憶體,這能使這款 GPU 價格更實惠,且可加速處理要求最嚴苛、基於情境的工作負載。
至於第二階段主要受記憶體頻寬和互連限制,需要快速存取先前生成的 token 及注意力快取,因此可用傳統資料中心 GPU,如 Blackwell Ultra 或 Rubin GPU 的 HBM4 記憶體來高效處理這類任務。
雖然 GDDR7 頻寬遠低於 HBM3E 或 HBM4,但功耗更低、每 GB 成本大幅下降,且不需昂貴的 CoWoS 先進封裝技術,因此 Rubin CPX GPU 不僅比一般 Rubin 處理器便宜,且功耗大幅降低,使散熱設計更簡單。NVIDIA 也表示,每投資 1 億美元於 Rubin CPX,即能帶來高達 50 億美元的詞元收益,相當於投資回報率達 30 至 50 倍,對於客戶是相當具有吸引力的方案。
亮點二:Rubin CPX 沒有 NVLink,但提供高度擴展
NVIDIA 指出,Rubin CPX 提供多種配置選項,包括 Vera Rubin NVL144 CPX,可結合 NVIDIA Quantum‑X800 InfiniBand 橫向擴展運算架構,或者搭配採用 Spectrum-XGS 乙太網路技術和 ConnectX-9 SuperNIC 的 Spectrum-X 乙太網路平台整合。
為了支撐 Rubin CPX 的效能,NVIDIA 同步推出 PCIe Switch+CX8 I/O板,這是全球首款量產的 PCIe 6.0 規格 I/O 產品,將 PCIe Switch 晶片與 ConnectX-8 SuperNIC 整合於同一大板,搭載 9 個 PCIe 插槽與 8 個 NIC 連接器。
透過將 PCIe Switch 和 CX8 NIC 這兩個關鍵元件合而為一,這塊板子如同 AI 伺服器的「神經中樞」,把多個重要晶片整合在一起,簡化伺服器設計和零件數量,讓所有零組件都能以超高速互相溝通。
相較於訓練場景追求極高點對點頻寬的 NVLink,推論場景更重視在單機或多 GPU 伺服器中彈性分配資源與共享運算能力。透過 PCIe Switch,資料中心能更有效地管理 GPU 運算資源,以應對來自不同應用、不同模型的推論請求。
亮點三:軟硬體高度整合
在軟體方面,Rubin CPX 完全支援 NVIDIA 的 AI 生態系統,包括 CUDA 以及能提升效率的 Dynamo 平台、Nemotron 模型以及 NVIDIA AI Enterprise 套件等。
此外,AI 模型與產品的開發者不需要透過手動方式,將推論的「上下文階段」和「生成階段」在 GPU 之間進行分割,即可在 Rubin NVL144 CPX 機架級解決方案上運行。NVIDIA 建議使用其 Dynamo 軟體編排層,智能管理並將推論工作負載在不同類型的 GPU 上分配。NVIDIA 指出,Dynamo 還可以管理 KV 快取傳輸,將延遲降到最低。
這些軟體工具讓企業無論是在雲端、資料中心還是工作站,都能輕鬆地部署 AI 應用,再搭配 NVIDIA廣大的開發者社群和超過 6,000 種應用程式,可使 Rubin CPX 的硬體優勢迅速轉為實際的商業價值。
NVIDIA 執行長黃仁勳表示,Vera Rubin 平台將標誌著 AI 運算領域的又一次躍進,不僅推出新一代 Rubin GPU,更創造名為「CPX」的全新處理器類別。Rubin CPX 是首款專為大規模情境 AI 打造的 CUDA GPU,能讓模型同時處理具備數百萬個詞元的推理任務。
市場怎麼看 Rubin CPX GPU?
目前從業界反應來看,這顆晶片是否吃掉 ASIC 該切入的利基市場仍有待觀察,因為採用 GDDR7 記憶體,成本優勢相當明顯,加上軟硬體整合穩固,對於業界來說是相當有吸引力的選擇方案之一。
由於 Rubin CPX 被歸類為專用 GPU,對博通和 AMD 可能帶來許多壓力。業界人士指出,目前許多主要客戶仍在找尋做為 NVIDIA 的替代方案,主要是為了因應成本考量,而 Rubin CPX 的推出是否做為吸引,仍值得觀察,但對於想避免積極使用 NVIDIA 方案的客戶來說,仍可能會繼續原有路線。
錄自:科技新報
已有
1
人評分
SOGO幣
收起
理由
smartlion
+ 10
您發表的文章內容豐富,無私分享造福眾人,.
總評分:
SOGO幣 + 10
查看全部評分
喜歡嗎?分享這篇文章給親朋好友︰
檢舉
返回列表
高級模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登錄後才可以回覆
登入
|
註冊
回覆文章
回覆後跳轉到最後一頁
積分 0, 距離下一級還需 積分
本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請
通知管理人員
,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com
GMT+8, 2025-11-17 22:15
手機版
|
SOGO論壇
品味生活
|
休閒天地
|
興趣嗜好
|
學術藝文
|
女性頻道
|
電腦數位
|
遊戲天堂
|
影視音樂
|
宗教綜合
|
綜合圖片
|
綜合影片
|
成人園地
© 2004-2025 SOGO論壇 OURSOGO.COM
回頂部