當(dāng)“架構(gòu)之源”走向“芯片實(shí)體”,Arm用AGI CPU重繪數(shù)據(jù)中心版圖
掃描二維碼
隨時(shí)隨地手機(jī)看文章
在半導(dǎo)體產(chǎn)業(yè)的傳統(tǒng)認(rèn)知中,Arm 是構(gòu)建數(shù)字世界的“圖紙?zhí)峁┥獭?。然而,隨著代理式 AI(Agentic AI)對(duì)異構(gòu)計(jì)算需求的指數(shù)級(jí)增長(zhǎng),單純的 IP 和計(jì)算子系統(tǒng)授權(quán)已難以完全消納市場(chǎng)對(duì)于算力部署時(shí)效性的渴求。Arm AGI CPU的發(fā)布,標(biāo)志著這家處理器架構(gòu)巨頭正式跨越“從設(shè)計(jì)到實(shí)體”的戰(zhàn)略藩籬,通過(guò)提供量產(chǎn)級(jí)自研芯片,補(bǔ)齊了其從 IP、計(jì)算子系統(tǒng)(CSS)到量產(chǎn)芯片(Full Chip)的最后一塊拼圖。這不僅是 Arm 35 年史上的戰(zhàn)略質(zhì)變,更是其在全球數(shù)據(jù)中心去 x86 化、追求極致能效比進(jìn)程中投下的一枚重磅砝碼。
技術(shù)突破:3nm 芯粒架構(gòu)下的“性能密度”重構(gòu)
在現(xiàn)代數(shù)據(jù)中心,尤其是代理式 AI 場(chǎng)景下,CPU 的角色正在從單純的控制平面向高并發(fā)任務(wù)編排轉(zhuǎn)移。Arm AGI CPU 的硬核實(shí)力主要體現(xiàn)在其對(duì)“計(jì)算平衡”的極致追求。
異構(gòu)集成的成熟芯粒(Chiplet)方案,是 Arm AGI CPU 實(shí)現(xiàn)核心規(guī)??焖贁U(kuò)張與制造良率平衡的基石。該產(chǎn)品在單顆芯片內(nèi)集成了兩顆規(guī)格完全相同的芯粒,并由臺(tái)積電(TSMC)3nm工藝制造。這種設(shè)計(jì)在保證良率的同時(shí),實(shí)現(xiàn)了核心規(guī)模的快速擴(kuò)張。每顆芯粒均獨(dú)立集成 CPU 核心、內(nèi)存接口及 I/O 模塊,確保了系統(tǒng)內(nèi)部數(shù)據(jù)流的高效交換。
在核心算力層面,Arm Neoverse V3 核心的引入為單線程任務(wù)提供了極高性能的確定性保障。 該 CPU 單芯片集成多達(dá) 136 個(gè) Arm Neoverse V3核心。在 1OU 雙節(jié)點(diǎn)參考服務(wù)器配置下,每臺(tái)刀片服務(wù)器中集成兩顆 CPU 芯片,共計(jì) 272 個(gè)核心。與傳統(tǒng) x86 架構(gòu)在持續(xù)高負(fù)載下因核心資源爭(zhēng)搶導(dǎo)致降頻不同,Arm AGI CPU 堅(jiān)持每線程獨(dú)立核心的設(shè)計(jì),這為其在處理大規(guī)模并行代理任務(wù)時(shí)提供了確定的性能輸出。
“反常規(guī)”的內(nèi)存布局策略,則印證了 Arm 對(duì)代理式 AI 負(fù)載中數(shù)據(jù)搬運(yùn)特性的深度理解。盡管 HBM(高帶寬內(nèi)存)在加速器中大行其道,但 Arm 在 AGI CPU 上選擇了更具通用靈活性的 12 通道 DDR5接口,速率達(dá) 8,800 MT/s。其單核心內(nèi)存帶寬達(dá)到 6GB/s,時(shí)延低于 100ns。這種配置策略顯然是為代理式 AI 中頻繁的數(shù)據(jù)搬運(yùn)、詞元(Token)調(diào)度與協(xié)同編排定制的,而非單純追求理論峰值算力。
最終,這些底層技術(shù)的優(yōu)化在機(jī)架級(jí)部署密度上實(shí)現(xiàn)了質(zhì)的飛躍,直接擊中了 AI 基礎(chǔ)設(shè)施的能效痛點(diǎn)。在標(biāo)準(zhǔn) 36kW風(fēng)冷機(jī)架中,Arm AGI CPU 可實(shí)現(xiàn) 8,160 個(gè)核心的滿配部署(共 30 臺(tái)刀片,每刀片服務(wù)器集成2個(gè)CPU);而在 200kW液冷方案中,這一數(shù)字躍升至 45,000 個(gè)核心以上(容納 336 顆 CPU)。據(jù)官方估算,其單機(jī)架性能可達(dá)最新 x86 系統(tǒng)的兩倍以上。
格局陡變:為什么“代理式 AI”需要一顆專屬 CPU?
目前的 AI 基礎(chǔ)設(shè)施正處于從“模型訓(xùn)練”向“智能體協(xié)同”的重心轉(zhuǎn)移。所謂代理式 AI,其特征是軟件智能體自主交互、實(shí)時(shí)決策且全年無(wú)休。
這一變革直接引發(fā)了 CPU 算力需求的非線性增長(zhǎng)。由于代理式 AI(Agentic AI)具備自主交互、實(shí)時(shí)決策且全年無(wú)休的特征,整個(gè)系統(tǒng)的運(yùn)行重心正在發(fā)生偏移:大部分工作并非發(fā)生在加速器的詞元生成環(huán)節(jié),而是分布在詞元的調(diào)度、分發(fā)、服務(wù)管理及跨系統(tǒng)數(shù)據(jù)遷移上。Arm 首席執(zhí)行官 Rene Haas 指出,由于智能體可自主生成新智能體并持續(xù)運(yùn)行,市場(chǎng)對(duì) CPU 的算力需求將提升至當(dāng)前的 4 倍以上。
面對(duì)現(xiàn)代數(shù)據(jù)中心嚴(yán)苛的功耗約束,Arm 通過(guò)規(guī)避 x86 的冗余開(kāi)銷,成功撞碎了阻礙規(guī)模化擴(kuò)展的“功耗墻”。在 300W TDP的約束下,x86 處理器往往面臨復(fù)雜指令集帶來(lái)的額外開(kāi)銷。Arm AGI CPU 能夠以更簡(jiǎn)化的架構(gòu)提供更高的工作負(fù)載密度。對(duì)于吉瓦(GW)級(jí)別的 AI 數(shù)據(jù)中心而言,采用該方案預(yù)計(jì)可節(jié)省高達(dá) 100 億美元的資本支出(CAPEX)。
關(guān)于軟件生態(tài)這“最后一公里”的挑戰(zhàn),長(zhǎng)期由 x86 統(tǒng)治的護(hù)城河正在被全球范圍內(nèi)的產(chǎn)業(yè)共識(shí)所瓦解。隨著主流云廠商及 Meta、NVIDIA 等企業(yè)在 Arm 生態(tài)的持續(xù)投入,已有超過(guò)一萬(wàn)家企業(yè)在數(shù)據(jù)中心采用 Arm 技術(shù)。Arm 云 AI 事業(yè)部執(zhí)行副總裁 Mohamed Awad也在媒體問(wèn)答中表示,絕大多數(shù) AI 部署及核心軟件已實(shí)現(xiàn)對(duì) Arm 的原生支持,因此他對(duì) Arm 在數(shù)據(jù)中心領(lǐng)域承載各類現(xiàn)代工作負(fù)載的軟件生態(tài)布局充滿信心。
“我全都要!” Arm 的全棧式躍遷與多維協(xié)同邏輯
Arm AGI CPU 的推出,揭示了 Arm 現(xiàn)任領(lǐng)導(dǎo)層更宏大的戰(zhàn)略抱負(fù)——打破 Arm 延續(xù)了 35 年的‘不觸碰芯片實(shí)體’的行業(yè)傳統(tǒng),展現(xiàn)出重塑全球計(jì)算供應(yīng)鏈的宏大雄心。
1.商業(yè)模式的“三軌并行”
Arm 明確表示,未來(lái)將同時(shí)保留 IP 授權(quán)、計(jì)算子系統(tǒng)(CSS)授權(quán)以及自有芯片銷售三種模式。這是一種極其精妙的戰(zhàn)略平衡:針對(duì)亞馬遜、谷歌等具備頂層自研能力的巨頭,繼續(xù)提供 CSS/IP;而針對(duì)急于部署代理式 AI 但不愿卷入底層芯片研發(fā)周期的 Tier 2 廠商,直接提供量產(chǎn)級(jí)芯片。
2. 2030 年的“財(cái)務(wù)軍令狀”
Rene Haas 給出了一份極具前瞻性的財(cái)務(wù)路線圖:預(yù)計(jì)未來(lái) 5 年,相關(guān)產(chǎn)品的總潛在市場(chǎng)(TAM)約為 1,000 億美元。到 2030 年,Arm 目標(biāo)實(shí)現(xiàn):
·公司總營(yíng)收達(dá) 250 億美元;
·其中芯片業(yè)務(wù)貢獻(xiàn) 150 億美元,營(yíng)收規(guī)模超越傳統(tǒng) IP 業(yè)務(wù)預(yù)期(100 億美元);
·每股收益(EPS)達(dá)到 9 美元。
3.對(duì)供應(yīng)鏈的影響
Arm 此次深度整合了臺(tái)積電(3nm 制造)、美光(內(nèi)存協(xié)同)、安靠(Amkor,OSAT 封裝服務(wù))及超微電腦(Supermicro,液冷集群參考設(shè)計(jì))。這種深度綁定的鏈條顯示出 Arm 正在從一個(gè)“輕資產(chǎn)”的授權(quán)商向“重資源”整合的芯片供應(yīng)商轉(zhuǎn)型。
結(jié)語(yǔ)
Arm AGI CPU 的發(fā)布,實(shí)際上是 Arm 在對(duì)數(shù)據(jù)中心客戶進(jìn)行一次“分層管理”。對(duì)于頭部云巨頭,它通過(guò) AGI CPU 展示“樣板間”性能,推動(dòng) CSS 授權(quán);對(duì)于生態(tài)其他成員,它直接提供“精裝修房”。這顆芯片不僅僅是硅片與電路的集合,它是 Arm 試圖主導(dǎo)代理式 AI 時(shí)代底層標(biāo)準(zhǔn)的宣言。在 x86 固守領(lǐng)地、RISC-V 追趕后方的夾縫中,Arm 選擇了向上突破,直接接管物理實(shí)體。這一躍,可能決定了未來(lái)十年 AI 算力的基礎(chǔ)底色。





