人工智能快速迭代,大模型時期僅依靠算力堆疊已無法實現模型性能的同步線性提升,模型算法與底層硬件、軟件棧、開發框架間的協同效果最終影響其訓推效率與性能表現,人工智能軟硬件生態重要性凸顯。中國信息通信研究院人工智能研究所軟硬件與創新生態部主任李論分享了人工智能軟硬件產品創新及生態構建的幾點思考,助力我國盡快構建起技術領先、良性發展的軟硬件生態體系。
一、大模型的創新迭代與軟硬件系統深度耦合
大模型的升級迭代需要在龐大的軟硬件系統上進行實驗。模型的原始創新和應用迭代落地已非常依賴先進的軟硬件協同技術生態體系,框架、芯片、集群、網絡等與算法間的協同愈發緊密。當前以DeepSeek為代表的模型憑借工程化創新,實現性能的大幅度提升。特別是通過模型架構、硬件算力和互聯通信等方面的極致優化和協同來提升訓練和推理的效能。從全球范圍看,Meta、字節等國內外頭部企業也均在加快更大規模集群的軟硬件協同優化,如創新集群網絡架構、構建先進的運維工具、優化分布式并行策略等。我們預計,在下個階段,軟硬件協同和生態體系的構建會是全球大模型創新和算力設施建設的競爭焦點。
二、我國在軟硬件協同和適配方面發展現狀
模型和底層硬件的適配是硬件能力能否充分釋放的關鍵。以業界典型的開源大模型DeepSeek為例,目前在國內主流廠商的軟硬件產品上運行DeepSeek模型,仍然需要結合實際應用場景進行深度優化,從而滿足精度、性能以及產品服務等延伸需求。
我們把軟硬件適配分為三個階段,第一階段是完成軟硬件產品的基礎適配,保障模型在軟硬件系統上運行無報錯,達到“基本可用”狀態。第二階段是完成系統性能調優,如精度對齊,提升吞吐、延遲等指標表現,初步達到“好用”狀態。第三階段是和實際的場景結合,通過用戶、業務提供商、供應商等多方協作,進一步提升落地應用效果。
在此背景下,中國信通院通過構建人工智能軟硬件基準體系AISHPerf,推動國產化適配測試工作。我們發現大量國產軟硬件系統已能支持DeepSeek運行,通過一系列的優化,能夠在數天內實現“可用”,且部分廠商模型適配效果已與官方技術報告實現精度對齊,同時,短期內出現多種工具包及一體機、公有云服務等產品形態,模型易用性不斷提升。
三、人工智能算力設施及軟硬件產品發展路徑
從整體發展來看,我們認為規模定律在未來幾年仍將延續。業界主要有兩種發展思路:一是擴大訓練算力規模,增加模型尺寸,提升模型精度。二是聚焦參數一定范圍內的模型改造與高效訓練,特別在計算受限下,通過模型參數與訓練數據有效配比和算法架構改造提升訓練效能,是廠商技術比拼的關鍵。
在這樣的發展路徑下,有三個創新重點:一是聚焦系統性能、提升算力利用率。算力需求雖仍在大幅度增長,但當前大量集群的算力利用率仍不足50%,需要進行計算、存儲、通信的軟硬件深度協同,來實現系統性能提升。二是聚焦推理優化方面的創新。大模型推理成為落地應用的關鍵環節,通過硬件、軟件一體化集成,及分布式并行推理等技術能有效提升推理效率,出現一體機、推理集群等新的產品服務形式。三是面向多樣場景的適配是落地關鍵。DeepSeek等開源模型生態有望進一步促進行業應用需求增長,但各個場景性能指標存在差異,存在大量點對點適配問題,需深度適配優化。
四、我國需面向應用需求持續推動軟硬件產品創新和生態建設
應用模型的高效部署和生態協同范式的建立是下階段AI產品的創新關鍵。為了進一步凝聚產業共識,降低軟硬件選型技術難度和開發門檻,依托工信部人工智能標準化技術委員會,中國信通院基于人工智能軟硬件基準AISHPerf工作組已推進十余項標準制定工作,覆蓋算子、計算設備、訓推集群、框架工具、邊端系統、智算的互聯、網絡等領域。此外,我們在北京亦莊建設了首個人工智能軟硬件協同創新與適配驗證中心,面向包括芯片、服務器、不同類型的計算設備、集群、開發框架及平臺、一體機等在內的人工智能軟硬件產品,去提供相應的實驗驗證、測試和產業培育等工作。下一步,我們將持續開展大模型軟硬一體設備、框架軟件與工具、大規模智算集群等系列測試驗證工作,舉辦“興智杯”全國人工智能創新應用大賽、大模型創新發展與軟硬件協同生態論壇等大型賽會活動,希望能夠有序引導人工智能模型和軟硬件廠商間的協同創新,集聚各方力量盡快構建起技術領先、良性發展的產業生態體系。