一體AI芯片是怎么一回事
智能生活,智能城市,慢慢的我們會(huì)進(jìn)入物聯(lián)網(wǎng)時(shí)代,海量的數(shù)據(jù)蜂擁而至。特別是各種應(yīng)用終端和邊緣側(cè)需要處理的數(shù)據(jù)越來(lái)越多,而且對(duì)處理器的穩(wěn)定性,以及功耗提出了越來(lái)越高的要求,這樣,傳統(tǒng)的計(jì)算體系和架構(gòu)的短板就顯得愈加突出,這些使得計(jì)算+存儲(chǔ)+AI的融合發(fā)展成為了一大方向。
目前來(lái)看,不論是PC還是超算,處理器和存儲(chǔ)芯片都是分離的,這就是馮諾依曼50多年前確立的計(jì)算架構(gòu)。隨著技術(shù)的發(fā)展,存儲(chǔ)計(jì)算分離的架構(gòu)瓶頸越來(lái)越明顯。
一般芯片的設(shè)計(jì)思路是增加大量的并行計(jì)算單元,在傳統(tǒng)的計(jì)算架構(gòu)當(dāng)中,存儲(chǔ)一直是有限且稀缺的資源,隨著運(yùn)算單元的增加,每個(gè)單元能夠使用的存儲(chǔ)器的帶寬和大小將逐漸減小,而隨著人工智能時(shí)代的到來(lái),這種矛盾顯得愈加突出。在很多AI推理運(yùn)算中,90%以上的運(yùn)算資源都消耗在數(shù)據(jù)搬運(yùn)的過(guò)程中。芯片內(nèi)部到外部的帶寬,以及片上緩存空間限制了運(yùn)算的效率。因此,在業(yè)界和學(xué)術(shù)界,越來(lái)越多的人認(rèn)為存算一體化是未來(lái)的趨勢(shì),可以很好地解決“存儲(chǔ)墻”問(wèn)題。
基于NOR閃存架構(gòu)的存算一體AI芯片,利用NOR Flash的模擬特性,可直接在存儲(chǔ)單元內(nèi)進(jìn)行全精度矩陣卷積運(yùn)算(乘加運(yùn)算)。規(guī)避了數(shù)據(jù)在ALU和存儲(chǔ)器之間來(lái)回傳輸?shù)钠款i,從而使功耗大幅降低、提高了運(yùn)算效率。其Flash存儲(chǔ)單元可以存儲(chǔ)神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù),同時(shí)還可以完成和此權(quán)重相關(guān)的乘加法運(yùn)算,從而將乘加法運(yùn)算和存儲(chǔ)融合到了一個(gè)Flash單元里面。例如,100萬(wàn)個(gè)Flash單元可以存儲(chǔ)100萬(wàn)個(gè)權(quán)重參數(shù),同時(shí)還可以并行完成100萬(wàn)次乘加法運(yùn)算。相比于傳統(tǒng)的馮諾依曼架構(gòu)深度學(xué)習(xí)芯片,這種的運(yùn)算效率非常高,而且成本低廉,因?yàn)槭∪チ?u>DRAM、SRAM以及片上并行計(jì)算單元,從而簡(jiǎn)化了系統(tǒng)設(shè)計(jì)。
目前來(lái)看,這種基于NOR閃存架構(gòu)的存算一體AI芯片,其主要應(yīng)用領(lǐng)域就是對(duì)成本和運(yùn)算效率(特別是功耗)敏感的應(yīng)用,如邊緣側(cè)的低功耗、低成本語(yǔ)音識(shí)別等。而隨著人工智能和物聯(lián)網(wǎng)的發(fā)展,它還可以拓展更多的應(yīng)用場(chǎng)景。
致芯解密專家認(rèn)為,在發(fā)展存算一體AI芯片方面,除了存儲(chǔ)和計(jì)算技術(shù)本身之外,行業(yè)相關(guān)的接口標(biāo)準(zhǔn)跟進(jìn)特別重要,特別是對(duì)于以存儲(chǔ)為基礎(chǔ)的新型應(yīng)用來(lái)說(shuō)。還需要不斷完善生態(tài)系統(tǒng)建設(shè),才能使整個(gè)產(chǎn)業(yè)發(fā)展起來(lái)。





