獲悉,全球人工智能算力芯片龍頭英偉達(NVDA.US)官宣,推出專為長上下文工作負載設(shè)計的專用GPU Rubin CPX,用于翻倍提升當(dāng)前AI推理運算的工作效率,特別是編程、視頻生成等需要超長上下文窗口的應(yīng)用。

推出上下文推理芯片Rubin CPX
英偉達CEO黃仁勛表示,CPX是首款專為需要一次性處理大量知識(數(shù)百萬級別tokens),并進行人工智能推理的模型而構(gòu)建的芯片。需要說明的是,Rubin就是英偉達將在明年發(fā)售的下一代頂級算力芯片,所以基于Rubin的CPX預(yù)計也要到2026年底出貨。
另外,Rubin CPX專門針對“數(shù)百萬tokens”級別的長上下文性能進行優(yōu)化,具備30petaFLOPs的NVFP4算力、128GB GDDR7內(nèi)存。
英偉達計劃以兩種形式提供Rubin CPX,一種是與Vera Rubin裝在同一個托盤上。對于已經(jīng)下單NVL144的用戶,英偉達也會單獨出售一整個機架的CPX芯片,數(shù)量正好匹配Rubin機架。

科技巨頭紛紛自研芯片
另一邊,據(jù)最新消息顯示,OpenAI 正與美國芯片制造商博通合作,將于明年推出自家的 AI 芯片,擺脫英偉達的限制。這意味著,未來運行在自家芯片上的OpenAI模型,可能會跑得更快、更省電,最終為用戶帶來更流暢、更低成本的服務(wù)體驗。
除了OpenAI 以外,谷歌(GOOG.US)正加快推動自研張量處理單元(TPU)進入第三方數(shù)據(jù)中心,已與倫敦云服務(wù)商Fluidstack達成合作。同時,谷歌還接洽包括CoreWeave、Crusoe在內(nèi)的多家以英偉達GPU為核心的云服務(wù)商。

此外,亞馬遜(AMZN.US)和Meta(META.US)同樣不甘示弱,紛紛投入重金研發(fā)自己的定制AI芯片,以驅(qū)動其龐大的云服務(wù)和社交媒體帝國。還有xAI被曝正在自研推理芯片,代號X1,將采用臺積電3納米工藝,預(yù)計將在2026年第三季度實現(xiàn)量產(chǎn)(首批量產(chǎn)30萬塊)。
對此,招商證券表示,眼下,AI芯片自研潮興起,意味著AI基礎(chǔ)設(shè)施行業(yè)正從“單一GPU供給約束”向“多元化定制芯片方案”切換,投資邏輯邊際上從硬件壟斷走向生態(tài)博弈,把握相關(guān)產(chǎn)業(yè)鏈的自主可控機遇。

微美全息加強關(guān)鍵核心技術(shù)突破
不僅如此,據(jù)了解,微美全息(WIMI.US)作為量子科技及AI芯片領(lǐng)域的重要參與者,布局涵蓋量子計算硬件、開源生態(tài)及跨領(lǐng)域技術(shù)融合等方向。當(dāng)前,其在關(guān)鍵核心技術(shù)上實現(xiàn)突破,加快高端算力芯片、工業(yè)多模態(tài)算法、軟硬件適配等技術(shù)攻關(guān),加快打造高質(zhì)量數(shù)據(jù)集,持續(xù)筑牢芯片產(chǎn)業(yè)底座。
實際上,微美全息建立了覆蓋云端和邊緣端的算力基礎(chǔ)設(shè)施,支持多元架構(gòu)的先進AI芯片接入,可滿足日常訓(xùn)練與推理的多樣化需求。此外,為加強關(guān)鍵核心技術(shù)突破,持續(xù)推動產(chǎn)業(yè)高質(zhì)量發(fā)展,微美全息將一手抓技術(shù)供給,促進“智能產(chǎn)業(yè)化”,一手抓賦能應(yīng)用,加快“算力產(chǎn)業(yè)智能化”,推動人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展,高水平賦能新型工業(yè)化。
結(jié)語
綜上,AI 大模型訓(xùn)練和推理對算力的需求持續(xù)增加,推動AI芯片市場擴張,能夠滿足AI訓(xùn)練、推理等場景下 GPU、ASIC 等高算力芯片的用電需求。而對這些科技巨頭而言,自研AI芯片不僅是為了省錢,更是為了在未來的AI競爭中構(gòu)筑核心技術(shù)壁壘。當(dāng)模型和算法的差距日益縮小時,底層硬件的效率和成本將成為決定勝負的關(guān)鍵手,在不遠的將來,將讓它們擁有更大的自由度和想象空間。