(資料圖)
本期投資提示: Rubin CPX 專為計算密集的Prefill 階段優化, BOM 成本或低至Rubin 的1/4。英偉達發布Rubin CPX,專門針對AI 視頻生成和軟件開發等大規模上下文處理任務。根據SemiAnalysis 預測,Rubin CPX 將以單光罩尺寸提供20PFLOPS 的NVFP4 稠密算力(Rubin 雙光罩尺寸,33PFLOPS),128GB GDDR7(Rubin 288GB HBM4);可集成到VR200 Oberon NVL144 中,也可作為獨立機柜Scale-out 至AI 集群中運行,為終端客戶優化TCO。CPX 定于2026 年底上市。 CPX 實質性降低Prefill 階段的首token 輸出及KV Cache 生成成本。PD 分離機制是將AI 推理過程分為兩個獨立階段的系統設計。Prefill(預填充)專注高吞吐計算以處理大量輸入數據,Decode(解碼)則依賴高速內存傳輸逐token 輸出。基于工程優化降本思路,可以將Prefill、Decode 階段分離至不同硬件節點實現。Prefill 節點可以增加算力并減少存力,Decode 節點可以減少算力并增加存力。 Token 經濟性提升至少來自4 個因素。1)提高計算效率,針對NVFP4 格式優化。該項性能提升可能源自將die 面積資源專門用于增加 NVFP4 計算單元數量。2)GDDR 取代HBM,每GB 成本相較HBM 可降低50%。3)CPX 預計將采用成熟的FCBGA 單die封裝,規避CoWoS 帶來的成本上升和良率損失。4)CPX 無須NVLink Scale-up,而是基于PCIe 6.0,通過CX-9 進行Scale-out,可節約8,000 美元/GPU 的擴展成本。 算力密度、集成復雜度提升,驅動互聯、液冷、組裝增量。VR200 CPX 新增8 個CPX,托盤內以硅含量計的算力密度明顯提升。相應的,功能單元排布、連接(銅纜/PCB 變化)、帶寬(網卡數量)、供電及散熱均相應變化。 變化1)新增PCB 正交中板。來自HPM 母板的PCIe 信號通過連接器進入PCB 正交中板,再通過另一側連接器傳輸到子板上的CX-9 NIC 和Rubin CPX。通過升級正交中板及子板的CCL 材料,可以確保良好的信號完整性。 變化2)CX 網卡至OSFP 端口的Overpass 線纜得以取消。在VR200 計算托盤的新排布中,CX-9 網卡從托盤后部移至前部,與OSFP 端口的距離得以縮短,傳輸路徑損耗降低,得以通過PCB 連接。Overpass 線纜取消,提高可維護性并減少空間占用。 變化3)托盤內功率密度提升,液冷用量提升。預計Rubin CPX 和CX-9 網卡從托盤后部移至前部的另一潛在原因系為均衡熱源分布。為冷卻托盤前部的合計TDP 達到7040W的8 塊CPX,散熱方式也須從風冷升級為液冷。上下兩個CPX PCB 將共享一塊液冷板,通過充分利用1U 托盤高度及冷板雙面空間,實現最大的計算資源密度。 建議關注:1)PCB/CCL 增量:勝宏科技、方正科技、鵬鼎控股、景旺電子、滬電股份,生益科技,菲利華、中材科技、宏和科技,東材科技。2)連接器增量:立訊精密;3)集成復雜度提升:工業富聯;4)液冷用量提升:英維克、領益智造、比亞迪電子。 風險提示:技術路線不確定的風險, AI 投資需求不及預期的風險。【免責聲明】本文僅代表第三方觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
【免責聲明】本文僅代表第三方觀點,不代表和訊網立場。投資者據此操作,風險請自擔。