國產(chǎn)GPU重磅發(fā)布 明年超英偉達(dá)Rubin架構(gòu)
1月27日消息,國產(chǎn)GPU迎來了重磅更新,這家名叫天數(shù)智芯的公司發(fā)布的四代架構(gòu)路線圖顯示,明年超英偉達(dá)Rubin架構(gòu)。
天數(shù)智芯AI與加速計算技術(shù)負(fù)責(zé)人單天逸公布四代架構(gòu)路線圖顯示,2025年,天數(shù)天樞架構(gòu)超越Hopper(H200系列);2026年,天數(shù)天璇架構(gòu)對標(biāo)Blackwell(B200);2026年,天數(shù)天璣架構(gòu)超越Blackwell;2027年,天數(shù)天權(quán)架構(gòu)超越Rubin;2027年之后將轉(zhuǎn)向突破性計算芯片架構(gòu)設(shè)計。
針對行業(yè)面臨的能效比偏低、創(chuàng)造力不足、實際使用困難等問題,單天逸表示,天數(shù)智芯通過優(yōu)化設(shè)計為客戶創(chuàng)造最優(yōu)TCO(總體擁有成本),從容應(yīng)對復(fù)雜應(yīng)用場景;可預(yù)期,借助精準(zhǔn)仿真模擬,讓客戶在部署前即可預(yù)判性能表現(xiàn),實現(xiàn)“所見即所得”;可持續(xù),無縫適配從傳統(tǒng)算法到未來未知算法的演進(jìn),確保長期使用價值。
此外,單天逸介紹了四代架構(gòu)的關(guān)鍵細(xì)節(jié):天數(shù)天樞架構(gòu),支持從高精度科學(xué)計算到AI精度計算,AI 芯片在執(zhí)行注意力機(jī)制相關(guān)計算時,算力的實際有效利用效率達(dá)到 90% 以上;天數(shù)天璇架構(gòu),新增 ixFP4 精度支持;天數(shù)天璣架構(gòu),實現(xiàn)全場景AI與加速計算覆蓋;天數(shù)天權(quán)架構(gòu),融入更多精度支持與創(chuàng)新設(shè)計。
具體來說,對于天數(shù)天樞架構(gòu),單天逸詳述了如何實現(xiàn)多項核心技術(shù)創(chuàng)新:TPC BroadCast(計算組廣播機(jī)制)設(shè)計通過上游數(shù)據(jù)廣播減少重復(fù)訪存,等效提升帶寬并降低功耗。
Instruction Co-Exec(多指令并行處理系統(tǒng))設(shè)計實現(xiàn)多類型指令并行處理,增強(qiáng)復(fù)雜任務(wù)處理能力;Dynamic Warp Scheduling(動態(tài)線程組調(diào)度系統(tǒng))機(jī)制則通過動態(tài)調(diào)度避免資源爭搶,提升計算資源利用率。
官方強(qiáng)調(diào),這些創(chuàng)新讓天數(shù)天樞的效率較當(dāng)前行業(yè)平均水平提升60%,基于這些效率優(yōu)勢,實現(xiàn)在DeepSeek V3場景平均比Hopper架構(gòu)高約20%性能。
發(fā)布會上,天數(shù)智芯董事長兼CEO蓋魯江表示,AI 算力需以全棧自研筑牢生態(tài)根基,以開放合作定義發(fā)展新范式,以長期主義共筑產(chǎn)業(yè)未來;天數(shù)智芯愿與伙伴攜手,讓自主通用 GPU 成果惠及千行百業(yè),共促國產(chǎn)算力生態(tài)繁榮。
對于這樣的重磅新品,中國工程院院士劉韻潔也來站臺。
按照這位院士的說法,AI算力需兼顧量的充足與質(zhì)的卓越,要突破單點性能,更要實現(xiàn)軟硬件高效協(xié)同,既要覆蓋核心數(shù)據(jù)中心,更要延伸至邊端末梢,實現(xiàn)全場景賦能;并肯定天數(shù)智芯多年來走出了自主創(chuàng)新、生態(tài)共建的扎實發(fā)展之路。





