安謀科技Arm China發(fā)布全新“周易” X3 NPU:算力高達(dá)80 FP8 TFLOPS
11月18日消息,作為國(guó)內(nèi)領(lǐng)先的芯片IP設(shè)計(jì)與服務(wù)提供商,安謀科技近日上海舉辦新品發(fā)布會(huì),正式推出了新一代“周易”X3 NPU。
這也是安謀科技打造Arm China“All in AI”產(chǎn)品戰(zhàn)略之后,發(fā)布的第一款重磅產(chǎn)品,面向基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端、智能物聯(lián)網(wǎng)四大領(lǐng)域。
它可為AI加速卡、智能座艙、ADAS高級(jí)輔助駕駛、具身智能機(jī)器人、AI PC筆記本、AI手機(jī)、智能網(wǎng)關(guān)、智能IPC網(wǎng)絡(luò)攝像機(jī)等提供高效的端側(cè)AI計(jì)算能力。
安謀科技旗下?lián)碛幸幌盗凶匝挟a(chǎn)品,除了“周易”NPU,還有“星辰”CPU、“山?!盨PU、“玲瓏”多媒體系列,全面覆蓋核心領(lǐng)域,可匹配多場(chǎng)景AI計(jì)算需求。
“周易”NPU團(tuán)隊(duì)成立于2018年,是國(guó)內(nèi)最早的NPU研發(fā)團(tuán)隊(duì)之一,可提供涵蓋硬件、軟件、工具的全棧式端到端方案,而且研發(fā)支持100%來(lái)自中國(guó)本土團(tuán)隊(duì)。
“周易”X3 NPU基于專為大模型而生的最新DSP+DSA通用架構(gòu),兼顧C(jī)NN與Transformer,有效解決端側(cè)AI大模型運(yùn)行難題。
它單個(gè)Cluster叢簇可配備最多4個(gè)核心,F(xiàn)P8算力8~80 TFlops(萬(wàn)億次浮點(diǎn)計(jì)算),而且可靈活配置,單個(gè)核心的帶寬高達(dá)256GB/s。
在架構(gòu)層面,“周易”X3實(shí)現(xiàn)了多項(xiàng)創(chuàng)新,包括:
- 集成自研解壓硬件WDC:
大模型Weight軟件無(wú)損壓縮后,通過(guò)硬件解壓能獲得額外15-20%的等效帶寬提升。
- 新增端側(cè)W4A8/W4A16計(jì)算加速模式:
均為大模型運(yùn)行必備。同構(gòu)對(duì)模型權(quán)重進(jìn)行低比特量化,大幅降低帶寬消耗,支持云端大模型向端側(cè)的高效遷移。
- 集成AI專屬硬件引擎AIFF(AI Fixed-Function)與專用硬化調(diào)度器:
可實(shí)現(xiàn)超低至0.5%的CPU負(fù)載與低調(diào)度延遲,靈活支持端側(cè)多任務(wù)場(chǎng)景和任意優(yōu)先級(jí)調(diào)度場(chǎng)景,確保高優(yōu)先級(jí)任務(wù)的即時(shí)響應(yīng)。
- 支持INT4/8/16/32、FP4/8/16/32、BF16多精度融合計(jì)算和強(qiáng)浮點(diǎn)計(jì)算:
可靈活適配智能手機(jī)邊緣部署、AI PC推理、智能汽車(chē)等從傳統(tǒng)CNN到前沿大模型的數(shù)據(jù)類(lèi)型需求,平衡性能與能效。





