7月11日,中國移動完成了業界首次百公里級800G以太網智算協同訓練的現網技術試驗,標志著智算中心互聯技術取得重要進展,為高效聚合分散算力資源提供了關鍵技術支撐。
本次試驗主要面向城市群(如京津冀、長三角城市群)智算中心分布在多地,需要聚合零散算力資源進行模型訓練的場景。本次試驗采用了中國移動提出的全調度以太網與高速光網絡融合的技術體系(GSE-DCI),單臺設備將路由功能和長距光傳輸融合,單光纖可支持高達32個800G波長通道的超大容量傳輸,相比傳統智算中心互聯技術實現了單比特成本降低40%,功耗降低35%,節點時延降低20%。在700億級參數大模型的并行訓練場景下,其訓練效率可達同等GPU規模單一節點的98%。該方案可最大限度協同智算中心內外網絡,大幅提升跨智算中心訓練算效,有效解決算力碎片化問題。
800G以太網是面向未來智算與互聯網需求制定的新一代互聯標準。中國移動引領了全球最大技術組織IEEE(國際電氣電子工程師學會)的中長距800G以太網標準制定,IEEE是全球電子、計算機、通信等領域制定行業國際標準的核心機構。
下一步,中國移動將依托算力網絡試驗裝置(CFITI)開展更多基礎網絡前沿技術驗證。