2025WAIC:國產算力破局之戰,開打?
中國算力產業正經歷一場前所未有的從“受制于人”到“自主可控”的破局之戰。2025 WAIC展會集中展現了國產算力在超節點架構、光互連、異構協同以及算力集群化、全鏈路國產化等方面的重大突破,這是一場由底層硬件創新驅動、產業協同賦能的生態系統性突圍。
其中核心技術路線包括曦智科技聯合壁仞科技、中興推出全球首款分布式光交換(dOCS)超節點,通過采用硅光芯片實現GPU間光互連,以及華為昇騰384超節點打破英偉達NVLink的私有協議壟斷,為國產萬卡集群提供可擴展架構新范式,同時更多國內AI芯片企業展示的系統級創新、軟硬協同,打通了從技術攻堅到商業落地的正循環“最后一公里”。
這體現出國產算力逐漸從“替代備份”走向“技術引領”,其中關鍵勝負手在于超節點集群打破算力密度天花板,光互連/液冷等技術破解物理限制,以及開放異構生態化解碎片化困局。而以智能計算超節點應運而生并成為解決算力瓶頸的關鍵方案為代表,這場國產算力破局之戰不僅是技術維度的創新突破,更是中國AI產業從“硬件依賴”到“系統定義”的范式躍升。
AI超節點成解決算力瓶頸關鍵路徑
在大模型參數指數級增長推動下,業界對GPU集群的規模需求也在快速擴大,從千卡級、萬卡級再到十萬卡級等,這體現出對算力的需求增長速度逐步遠超芯片性能提升曲線。
對于未來如何構建越來越大規模的GPU算力集群?解決路徑是Scale Up和Scale Out。其中,Scale Up(縱向擴展)增加單節點資源數量,Scale Out(橫向擴展)增加節點的數量。簡單理解,每臺服務器里面多塞幾塊GPU,這時一臺服務器就是一個節點,即Scale Up。而通過網絡將多臺電腦(節點)連接起來就是Scale Out。
據了解,Scale Out考驗的是節點之間通信能力,而Scale Up在性能、成本、組網和運維等方面具有重要優勢。在AI訓練過程中,通常包括多種并行計算方式,其中PP(流水線并行)和DP(數據并行)的通信量較小,一般交由Scale Out處理。而TP(張量并行)、 EP(專家并行)的通信量大,這就需要交由Scale Up(超節點內部)處理。
當前,超節點作為Scale Up的最優解,通過內部高速總線互連,能夠有效支撐并行計算任務,加速GPU之間的參數交換和數據同步,縮短大模型的訓練周期。其核心技術優勢在于突破單服務器限制,數十塊甚至數百塊GPU集成在一個機架內;超帶寬域(HBD)技術可將GPU間通信時延壓縮至百納秒級,實現GPU間數據交換的無縫銜接,并大幅降低組網復雜度;以及支持Scale Up與Scale Out融合,實現“樂高式”靈活搭建。
超節點最初是英偉達提出的概念,并將以超大帶寬互聯16卡以上GPU-GPU的Scale Up系統稱為超節點。歷經多年發展和數次迭代,2024年3月,英偉達發布NVL72超節點,可以將36個Grace CPU和72個Blackwell GPU集成到一個液冷機柜中,實現總計720 PFLOPs的AI訓練性能,或1440 PFLOPs的推理性能。
從NVL72開始,超節點概念在算力行業內被頻繁提及,并逐漸從藍圖走向現實。在2025WAIC現場,中國企業也帶來了超節點技術方案,而且成為大會最大看點之一。
國內首個光互連光交換GPU超節點亮相
在2025WAIC“智算云啟,共繪生態”論壇上,上海儀電聯合曦智科技、壁仞科技、中興通訊正式發布國內首個光互連光交換GPU超節點解決方案——光躍LightSphere X。
據悉,該超節點以曦智科技全球首創的分布式光交換(dOCS)芯片為核心,通過基于壁仞科技自主原創架構的大算力通用GPU液冷模組壁勵166L與全新載板互連,并搭載中興通訊高性能AI國產服務器及儀電開放智算云平臺軟件,構建起高帶寬、低延遲、靈活可擴展的自主可控智算集群生態,即將于上海儀電智算中心落地。
鑒于算力集群邁入“萬卡協同”時代,當前業界一種常見方案是通過提升單機柜功耗來部署更多GPU,但受限于數據中心單機柜的功耗天花板,單機柜GPU密度提升存在瓶頸。
對此,光躍LightSphere X采用光互連技術,通過增加機柜數量構建超節點,突破傳統互連方式下超節點的物理限制。相比銅纜,光纜的遠距離傳輸優勢可實現交付與機柜解耦,其核心價值在于:突破單機柜功耗束縛,支持萬卡級彈性擴展,兼容現有機房設施降低部署成本,并可按算力需求動態調整超節點規模,實現分階段建設。
同時,光躍LightSphere X的曦智科技分布式光交換(dOCS)技術進一步提升了超節點的靈活度和系統可擴展性,從而達到提升系統性價比的目的。得益于多計算Chiplet與CoWoS 2.5D封裝協同設計的GPU模組,光躍LightSphere X擁有強大算力。該模組基于壁仞科技的大算力(單卡1P級)通用GPU液冷模組,極大增強了集群訓推性能。
未來,光躍LightSphere X將成為儀電首個采用該方案的超節點國產算力集群,其靈活的拓撲結構和規模適應不同模型的通信需求,開放的協議架構打破廠商壁壘,構建了從光芯片、GPU模組、到液冷服務器及高速域算力集群的全棧自主可控生態,可全面賦能千億級參數大模型訓練與推理需求,為我國人工智能跨越式發展提供澎湃動力。
各大AI芯片企業向“系統化”奮進
在算力基礎設施的務實轉型浪潮中,系統化創新、全鏈路國產化的推進節奏成為新焦點。因為大模型的快速發展和迭代,不僅改變了以往模型碎片化的產業生態,更驅動算力基礎設施朝著系統化和集群化發展。對此,國產AI芯片企業均在不同維度的系統化攻堅奮進。
其中,摩爾線程以全功能GPU為核心底座構建的“云邊端”全棧AI產品和解決方案亮相2025WAIC展覽區,包括KUAE2智算集群解決方案面向大規模智算中心,集成計算、存儲、網絡硬件及分布式計算軟件,最高支持10240個全功能GPU部署。
摩爾線程還提出,公司將通過系統級工程創新,打造生產先進模型的“AI工廠”,實現先進架構、芯片算力、單節點效率、集群效率優化與可靠性等協同躍升的深度技術創新。
目前,芯片、超節點、網絡、并行計算以及云架構下的大模型適配環環相扣,為算力與大模型的協同創新與發展提供了巨大空間。鑒于此,燧原科技打出“組合拳”,在大會期間首次展出燧原S60高性能人工智能推理加速卡和DeepSeek一體機系列產品,同時還發布第四代訓推一體產品燧原L600,以及推出全新計算系統——云燧OGX系列產品。
沐曦集成在大會上首次展示了旗艦訓推一體GPU曦云C600以及從芯片到集群的立體化呈現。據悉,曦云C600性能全面對標國際旗艦GPU產品,包括搭載當前業界前沿的HBM3e顯存等。而基于上代產品曦云C500系列芯片,沐曦在現場展示了PCIe服務器、OAM服務器和光互連服務器解決方案,這些服務器基本都實現了“全鏈路國產化”。
此外,無問芯穹首次發布展示了三大“操作系統級”產品——“無穹AI云”“無界智算平臺”與“無垠終端智能解決方案”,分別面向跨地域智算網絡、智算集群與多形態智能終端等全規模場景,統一適配多元算力,提供從模型調度、性能優化到AI應用部署的全鏈路支持。
據了解,無問芯穹展示的全球首創單任務千卡異構混訓系統及Infini-AI異構云平臺,突破異構芯片、異地集群、異屬算力統一管理的技術瓶頸,算力利用率高達97.6%。
中國智算超節點首度上演“集體秀”
伴隨著國內智算集群建設從單點突破邁向系統攻堅階段,國產AI超節點無疑是系統級創新的重要體現,不僅要設計好底層芯片以及將大量芯片連接起來的“神經網絡”,還需通過優化節點內的高速互聯、存儲架構和軟件棧,最大化發揮國產芯片集群的整體效能。
在2025WAIC上,尤為受關注的是耗費數十億元的華為昇騰384超節點真機。作為展區“鎮館之寶”,其通過總線技術達成384個NPU之間的大帶寬低時延互聯,有效解決集群內計算、存儲等各資源之間通信瓶頸。同時,昇騰384超節點單卡推理性能提升4倍,Decoding吞吐達到2300+Tokens,通訊時延降低至50ms以下,MFU算力使用率達50%,在業界位居領先水平。
據官方公告,華為AI算力集群解決方案CloudMatrix 384,通過全互連拓撲架構實現芯片間的高效協同,可提供達300 PFLOPs密集BF16算力,性能接近英偉達NVL72系統兩倍。按照國外投行觀點,華為的規模化解決方案“領先于英偉達和AMD目前市場上的產品一代”,并且認為中國在AI基礎設施上取得的突破,將對全球AI產業格局產生深遠影響。
同時,中興展示了架構代際領先的智算超節點服務器,算力高密集成、高效互聯,為超大參數規模的模型訓練和推理打造高算效的硬件底座。其單機柜可搭載64個GPU,內置16個計算節點,8個交換節點,機內Scale up可擴展至2048張算力卡,機間支持Scale out拓展至萬卡規模。據了解,相比起華為單機搭載32卡,中興可以做到單機搭載64卡。
此外,新華三展出的是超節點產品H3C UniPod S80000全球首秀。這是專為萬億級大模型的訓練與推理需求量身打造的核心設備,支持單機柜、多機柜等多種形態,Scale-up互聯規模提升300%;依托以太互聯協議,可實現Scale-up南向互聯;以及能夠實現單機柜64卡(與中興一樣)高密部署及互聯互通,并同時具備向1024卡互聯演進的能力。
超聚變則帶來了全球首個多元智算即插即用超級集群系統,實現全面軟硬件基礎設施技術和算力生態,能夠兼容10+加速卡,提供雙生態南北向安全異構算力。同時,其做到單柜128個AI加速卡,112G/224G的高速互連;使用第5代100%原生液冷,可實現節能超20%。
結語
在大模型時代,面對算力的需求增長速度逐步遠超芯片性能提升曲線,單芯片性能差異的重要性逐漸讓位于整個集群的總體效能。鑒于芯片性能、開發成本和國際限制等因素,國內要達到與國際主流方案相當的總算力需“以量補質”。這使得AI超節點成為勢必被催生的高效、可擴展、標準化的算力集群架構,并且是我國構建大規模算力基礎設施的現實可行方向。
可喜的是,2025WAIC顯示出以壁仞科技、華為為代表的中國AI智算企業正在不斷努力,攻堅從人工智能產業的核心底座——以芯片、板卡、服務器、計算集群等為核心構成的算力基礎設施,再到與本土行業應用的深度創新協同,促使一條貫穿大模型生態的國產化鏈條加速成型。而這場中國智算超節點的“集體秀”,不僅是技術路線選擇,更關乎整個產業發展命脈。
