隨著人工智能(AI)技術飛速發展,算力需求呈現爆發式增長。從GPT-1到GPT-5,模型參數量從1.17億躍升至數萬億,模型結構也在不斷演進,從稠密LLM模型向MoE稀疏化模型以及多模態模型持續演進。
面對這一趨勢,單純依靠傳統服務器的簡單堆疊已無法滿足需求,AI算力設施正加速向高密度、液冷化、集群化方向演進,這不僅帶來了更高的功率負載和更復雜的散熱要求,也對傳統數據中心的散熱、供配電系統、網絡設計等提出了新的挑戰。
9月17日,在上海召開的首屆AIDC產業發展大會上,中國電子工程設計院數據中心事業部副總經理王志強向包括《每日經濟新聞》在內的媒體記者表示:“當前整個GPU芯片及AI集群的功率密度演進速度,已超過傳統云數據中心的技術演進路徑。超高密度、超大規模部署,使基礎設施在動力適配、樓體結構、空間規劃等方面面臨巨大挑戰。”
在王志強看來,為匹配AI負載的快速演進對算力的需求,機房要具備足夠的靈活性和彈性擴展能力,并且在機房的規劃和建設模式上也需具有前瞻性。
算力設施將走向高密、液冷
事實上,隨著AI訓練與推理任務復雜度的不斷提升,單機柜功率正從當前的50kW(千瓦,功率計量單位)向300kW甚至更高水平躍進。與此同時,超節點規模的擴展也使得單集群供電需求躍升至數百MW(兆瓦,電功率的基本單位),遠遠超過了現有數據中心單棟樓10—20MW的供電能力。
在實際部署落地的過程中,高功率密度帶來基礎設施的升級挑戰遠比想象中復雜。
王志強表示:“去年單柜20kW還算主流,今年華為384型機柜已經做到60kW,而字節、阿里、騰訊這些互聯網大廠在推理和訓練場景的單柜容量很快會突破100kW。”
功率密度外,制冷也成為數據中心投資規劃中無法回避的難題。在冷卻技術方面,風冷方案已接近極限,液冷成為轉型方向。這意味著數據中心的基礎設施必須同步迭代。
對此,當日(9月17日)發布的《AIDC機房參考設計白皮書》中對AIDC(AI數據中心)的設計思路及部署模式給出了一些建議。比如:構建全鏈路高效供電體系,中低壓配電系統按最大容量池化設計;在建筑結構規劃上,機房設計必須預留充足的層高和承重余量,以適配不斷增重的AI服務器及相關設備,同時保障后續設備更新換代的靈活性;對于超節點域內的互聯走線,按照最短互聯走線距離進行規劃設計,確保超節點內時延最低。
在全球計算聯盟(GCC)秘書處CTO苗福友看來,未來兩三年,國內AIDC建設仍將保持每年40%以上的年增速,隨后每年新增建設量還會增加,然后慢慢趨于平緩。預計到2030年前后,年增長率或在10%左右。
與新建機房相比,當前更為現實的問題是,存量數據中心機房以低密風冷機房為主,面向AIDC高密液冷機柜需求,如何才能實現平滑演進?
對此,王志強介紹了幾種路徑:第一,在規劃層面要引入模塊化理念;第二,做到風液兼容和匹配,原來風液比是4∶6,未來一年就可能變成1∶9。“確實很難,但我們已經找到了一些出口,比如在荷載層面、空間層面、架構層面做適度合理的極簡。”
中外AIDC發展路徑存在差異
今年以來,海外科技巨頭們在AI基建上持續加碼。今年8月,OpenAI CEO奧特曼表示,未來公司將投入數萬億美元夯實AI基建,用于支持各項人工智能服務。更早之前,Meta CEO扎克伯格也表示,Meta將斥資數千億美元建設幾個大型AI數據中心。
據統計,2025年年初以來,多個國家和地區紛紛宣布將千億美元以上資金規模投向AI基建領域。
針對我國AIDC和海外AI基建之間的發展路徑差別,王志強回應稱: “在功率密度上,國際領先項目已普遍達到120至150kW/柜,英偉達2028年規劃向600kW推進,更追求單柜的超高密度;而國內更多依靠光網絡封裝,在我們可以掌握的制程下,通過集群的方式來解決,目前主流在40-60kW/柜。在技術路線上,海外更注重GPU的性能發揮,常配置冷機提供中溫冷凍水,通過更低的水溫使GPU能夠工作在更高效的功率段上,而國內受節能降耗驅動,大概供水的水溫在30—40攝氏度,是比較高的,可以實現全年的自然冷卻(可能會限制部分算力設備的峰值性能)。”
此外,在集群規模上也面臨差距。“海外已實現10萬卡的集群落地,而國內基于國產算力卡的超大規模集群也在做,但規模再大就會面臨組網的挑戰。不過目前很多技術,比如硅光封裝、光互聯等正在解決產業界的問題。”王志強說道。
雖然我國AIDC建設面臨諸多挑戰,但產業各方已積極行動。中國電子技術標準化研究院高級工程師沈芷月介紹稱,在標準方面,全球計算聯盟(GCC)已經布局了智能計算、數據中心、機密計算、邊緣計算、綠色計算等多個領域的重點標準,目前已發布20項,預計年底將達到30項。在技術的研發與創新方面,針對目前AIDC面臨的熱、電、空間等問題的挑戰,產業界將繼續投入新技術的研發和推廣,以提升AIDC的能效和性能。此外,還會加大產業協同與生態建設。
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。