日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > EDA > 電子設(shè)計(jì)自動(dòng)化
[導(dǎo)讀]緩慢的軟件模擬器給體系結(jié)構(gòu)研究帶來(lái)了極大不便,F(xiàn)PGA硬件仿真的模擬速度很快,但仿真系統(tǒng)的規(guī)模嚴(yán)重受限于FPGA的容量。較大規(guī)模的體系結(jié)構(gòu)系統(tǒng)仿真采用多片F(xiàn)PGA互連,不僅增加了設(shè)計(jì)的復(fù)雜性,也增加成本。因此提出一種面向?qū)ΨQ體系結(jié)構(gòu)的FPGA仿真模型。經(jīng)仿真系統(tǒng)評(píng)估,其仿真系統(tǒng)能夠增大FPGA芯片的仿真規(guī)模,減少仿真系統(tǒng)對(duì)FPGA資源的需求,有效支持在有限的FPGA資源上進(jìn)行大規(guī)模對(duì)稱體系結(jié)構(gòu)仿真研究。

隨著元器件制造工藝的不斷進(jìn)步,單片上可集成的晶體管數(shù)急劇增加。納米工藝將使單芯片中晶體管密度達(dá)到每平方厘米包含百億至千億。2010年已出現(xiàn)集成度超過(guò)10億支晶體管的高性能CPU(Intel的Polaris),2020年將達(dá)到70億。因此,單片多核、眾核等體系結(jié)構(gòu)以其豐富的計(jì)算資源,且處理器核或計(jì)算簇的數(shù)量根據(jù)應(yīng)用計(jì)算量和并行度的需求可擴(kuò)展的特性,成為體系結(jié)構(gòu)研究領(lǐng)域的一個(gè)重要方向。
    在芯片設(shè)計(jì)中,需要花費(fèi)極大的人力和物力用于測(cè)試和驗(yàn)證,而其中還有很大一部分測(cè)試工作必須等到芯片樣片出產(chǎn)后才能進(jìn)行,這嚴(yán)重影響了芯片的開(kāi)發(fā)周期和設(shè)計(jì)成本。軟件模擬器可以對(duì)各種規(guī)模的處理器進(jìn)行時(shí)鐘精確模擬,但其模擬精度受限于建模的精度,且隨著系統(tǒng)規(guī)模的增大和建模精度的提高,軟件模擬的時(shí)間急劇增加直至不可接受。FPGA仿真為芯片設(shè)計(jì)的測(cè)試和驗(yàn)證提供了一個(gè)很好的解決方案,它具有建造運(yùn)行和成品幾乎一樣快的工作原型硬件的能力,同時(shí)又具備可編程和快速可重構(gòu)的靈活性,能夠更加精準(zhǔn)地模擬系統(tǒng)仿存、I/O等行為,因此FPGA仿真能極大降低芯片研發(fā)的固有風(fēng)險(xiǎn),縮短產(chǎn)品的開(kāi)發(fā)周期。將被仿真的體系結(jié)構(gòu)稱為目標(biāo)系統(tǒng),將由FPGA構(gòu)成的仿真平臺(tái)則稱為仿真系統(tǒng)。在仿真系統(tǒng)的設(shè)計(jì)中,其仿真規(guī)模嚴(yán)重受限于FPGA芯片的容量,在面向多核、眾核這類具有高擴(kuò)展性的體系結(jié)構(gòu)仿真時(shí),問(wèn)題更為明顯。若采用更大容量的FPGA或利用多片F(xiàn)PGA仿真,將面臨FPGA開(kāi)發(fā)板重設(shè)計(jì)和多片F(xiàn)PGA互連通信等問(wèn)題。隨著研究的深入,系統(tǒng)會(huì)越來(lái)越復(fù)雜,這會(huì)造成研究成本和設(shè)計(jì)復(fù)雜度越來(lái)越高。因此,如何最大化片上資源的利用率,增大FPGA的仿真規(guī)模成為處理器設(shè)計(jì)和體系結(jié)構(gòu)研究中的一個(gè)重要問(wèn)題。
    本文提出了一種面向?qū)ΨQ體系結(jié)構(gòu)的FPGA仿真模型,該模型的核心設(shè)計(jì)思想是:分時(shí)復(fù)用仿真系統(tǒng)中的一個(gè)單元來(lái)仿真目標(biāo)系統(tǒng)中多個(gè)對(duì)稱單元的行為,從而利用較少的硬件資源完成系統(tǒng)仿真,提高FPGA的利用率。

1 對(duì)稱多核體系結(jié)構(gòu)FPGA仿真模型
   
對(duì)稱多核如SMP(Symmetry Multi-Processor)體系結(jié)構(gòu)中,通常包含多個(gè)對(duì)稱的處理器核或計(jì)算核心,這里統(tǒng)稱為計(jì)算核。計(jì)算核占據(jù)了多核體系結(jié)構(gòu)的主要硬件開(kāi)銷,且對(duì)稱多核體系結(jié)構(gòu)的硬件仿真平臺(tái)FPGA資源消耗隨計(jì)算核數(shù)目成線性增加。這里提出的對(duì)稱多核體系結(jié)構(gòu)FPGA仿真模型,解耦合計(jì)算核數(shù)目與系統(tǒng)硬件開(kāi)銷的線性關(guān)系,其核心設(shè)計(jì)思想是:在構(gòu)建仿真系統(tǒng)時(shí),使用一個(gè)與目標(biāo)系統(tǒng)中單個(gè)計(jì)算核等同的處理單元,稱為虛擬計(jì)算單元VAU(Virtual Arithmetic Unit)代替所有的對(duì)稱計(jì)算核,通過(guò)分時(shí)復(fù)用VAU實(shí)現(xiàn)一個(gè)計(jì)算單元虛擬多個(gè)計(jì)算核的行為。
    圖l中的左圖是當(dāng)前具有對(duì)稱結(jié)構(gòu)的多核體系結(jié)構(gòu)模型抽象,n個(gè)對(duì)稱的計(jì)算核通過(guò)特定的互連結(jié)構(gòu)連接,其連接關(guān)系由目標(biāo)處理器的工作模式?jīng)Q定;右圖是本文提出的仿真模型??梢钥闯觯抡嫦到y(tǒng)中采用一個(gè)VAU代替了目標(biāo)系統(tǒng)中所有對(duì)稱的處理單元PU。在對(duì)目標(biāo)系統(tǒng)進(jìn)行仿真時(shí),計(jì)算頁(yè)控制器VAUC(VAU Controller)控制1個(gè)VAU分時(shí)復(fù)用的方式工作,虛擬多個(gè)PU并行執(zhí)行。分時(shí)的粒度與處理單元之間的耦合度相關(guān)。虛擬計(jì)算單元將目標(biāo)系統(tǒng)中并行執(zhí)行模式轉(zhuǎn)變?yōu)榇袌?zhí)行的方式進(jìn)行仿真,以時(shí)間換取空間,減少系統(tǒng)中計(jì)算資源的消耗。BS(Backup Storage)用于存儲(chǔ)VAU虛擬各PU執(zhí)行時(shí)的中間結(jié)果。



2 仿真系統(tǒng)執(zhí)行模式
2.1 多核/眾核體系結(jié)構(gòu)仿真系統(tǒng)執(zhí)行模式

    對(duì)稱多核處理器中處理單元之間的耦合度不同,使得對(duì)應(yīng)的仿真系統(tǒng)的執(zhí)行模式也不一樣。多核/眾核體系結(jié)構(gòu)通常采用粗粒度耦合執(zhí)行的方式。如圖2(a)所示.多個(gè)處理單元之間相互比較獨(dú)立,其同步和通信通常處于任務(wù)級(jí),即多個(gè)處理單元間的通信和同步的次數(shù)遠(yuǎn)小于它們執(zhí)行的指令數(shù)。圖中PUi和PUj之間有一次通信,PUi、PUj和PUk之間有一次同步。對(duì)應(yīng)的仿真系統(tǒng)的執(zhí)行模式如圖2(b)所示,VAU先對(duì)PUi進(jìn)行仿真,執(zhí)行到與通信點(diǎn)時(shí),將PUi的執(zhí)行信息導(dǎo)入BS,然后VAU對(duì)PUi進(jìn)行仿真,執(zhí)行到與通信點(diǎn)時(shí),將PUj的執(zhí)行信息導(dǎo)入BS,將PUi的執(zhí)行信息由BS導(dǎo)入VMU,對(duì)PUi的后續(xù)行為進(jìn)行仿真,以此類推,如圖2所示,箭頭每穿過(guò)中線一次,表示計(jì)算頁(yè)切換一次仿真對(duì)象,指向下的箭頭表示VMU的信息導(dǎo)入BS,指向上的箭頭表示BS中的信息導(dǎo)出至VMU。為了減少現(xiàn)場(chǎng)切換的次數(shù),對(duì)兩個(gè)PU通信時(shí)的執(zhí)行過(guò)程進(jìn)行優(yōu)化,如圖2(c)所示,VAU仿真PUi執(zhí)行至通信點(diǎn)時(shí),切換至PUj進(jìn)行仿真,只有在PUj遇到其他同步或通信時(shí),才進(jìn)行現(xiàn)場(chǎng)切換,否則VAU一直對(duì)PUj進(jìn)行仿真,直至PUj執(zhí)行結(jié)束。PUj執(zhí)行到與通信點(diǎn)時(shí),PUj將通信數(shù)據(jù)發(fā)送至網(wǎng)絡(luò)緩沖,并寫(xiě)入PUi對(duì)應(yīng)的存儲(chǔ)空間,如圖2(c)中虛線所示。


2.2 SIMD體系結(jié)構(gòu)仿真系統(tǒng)執(zhí)行模式
    SIMD體系結(jié)構(gòu)的處理單元之間是緊密耦合的,所有處理單元的執(zhí)行過(guò)程都是嚴(yán)格同步的,即同一時(shí)鐘周期內(nèi)每個(gè)處理單元都對(duì)不同的數(shù)據(jù)進(jìn)行完全同樣的操作,如圖3(a)所示。


    在SIMD體系結(jié)構(gòu)仿真系統(tǒng)中,必須在邏輯上保持這種完全同步的執(zhí)行模式。本文采用的方式是,一條指令流出之后,讓它在指令流水線中保持n個(gè)時(shí)鐘周期(可以在連續(xù)的n個(gè)時(shí)鐘內(nèi)都發(fā)射同一條指令),VAU在這n個(gè)周期內(nèi)分別對(duì)各處理單元對(duì)應(yīng)的數(shù)據(jù)進(jìn)行處理。若將n個(gè)時(shí)鐘周期看作系統(tǒng)的工作周期,則n個(gè)數(shù)據(jù)是在同一工作周期內(nèi)被處理,如圖3(b)所示。這樣則在邏輯上保持SIMD的執(zhí)行模式。

3 仿真系統(tǒng)評(píng)估
   
本文的目標(biāo)系統(tǒng)如圖4(a)所示。它由多個(gè)計(jì)算節(jié)點(diǎn)以Torus片上網(wǎng)絡(luò)連接構(gòu)成,其計(jì)算節(jié)點(diǎn)數(shù)目可以根據(jù)應(yīng)用需求進(jìn)行擴(kuò)展。對(duì)應(yīng)的仿真系統(tǒng)如圖4(b)所示。在仿真系統(tǒng)中,采用一個(gè)虛擬計(jì)算節(jié)點(diǎn)(VAU)代替目標(biāo)系統(tǒng)中的p個(gè)計(jì)算節(jié)點(diǎn),圖4(b)以p=4為例,展示了仿真系統(tǒng)的結(jié)構(gòu)。目標(biāo)系統(tǒng)中p個(gè)計(jì)算節(jié)點(diǎn)的計(jì)算操作都由VAU以圖2的工作模式完成。VAU中包含一個(gè)現(xiàn)場(chǎng)保存存儲(chǔ)器(context backup),用于保存目標(biāo)系統(tǒng)中p個(gè)計(jì)算節(jié)點(diǎn)的中間結(jié)果。contextbackup的容量為每個(gè)計(jì)算節(jié)點(diǎn)中本地存儲(chǔ)器容量的p倍,這樣,context backup就有足夠的能力存儲(chǔ)p個(gè)計(jì)算節(jié)點(diǎn)的中間結(jié)果,從而減少與外部存儲(chǔ)器的數(shù)據(jù)交換,減少VAU的停頓時(shí)間。


    采用FPGA EP2S180(擁有143 520 ALUT,相當(dāng)于18萬(wàn)邏輯門(mén))實(shí)現(xiàn)了多種結(jié)構(gòu)(計(jì)算節(jié)點(diǎn)的數(shù)目不同)的目標(biāo)系統(tǒng)和基于仿真模型的仿真系統(tǒng),并利用相應(yīng)的硬件綜合工具Quartus分析仿真系統(tǒng)的FPGA資源開(kāi)銷。系統(tǒng)采用包含1個(gè)cluster的MASA流處理器作為計(jì)算節(jié)點(diǎn)。為更好地驗(yàn)證仿真模型,流處理器中采用功能裁剪的cluster,如圖4所示,cluster中僅包含3個(gè)計(jì)算單元和1個(gè)I/O單元,并相應(yīng)降低指令和數(shù)據(jù)存儲(chǔ)器的容量。在仿真系統(tǒng)中,VAU中的processor為流處理器中的核心計(jì)算部件,context backup代替了片上存儲(chǔ)部件,其容量為SRF的p倍。該實(shí)驗(yàn)的目的是分析所提出的仿真模型對(duì)仿真系統(tǒng)的硬件資源消耗和仿真速度的影響。
3.1 資源消耗分析
   
圖5是目標(biāo)系統(tǒng)和仿真系統(tǒng)的FPGA資源消耗統(tǒng)計(jì)。由于布局布線的需求,F(xiàn)PGA芯片的資源使用率最高通常只能達(dá)到70%~80%。圖5中“×”標(biāo)識(shí)表示當(dāng)前配置超出EP2S180的仿真能力??梢钥闯?,在不采用仿真優(yōu)化技術(shù)時(shí),EP2S180可仿真的最大規(guī)模目標(biāo)系統(tǒng)為24個(gè)計(jì)算節(jié)點(diǎn)?;诒疚牡姆抡婺P?,當(dāng)p值等于4時(shí),EP2S180的仿真能力提高至64個(gè)節(jié)點(diǎn);當(dāng)p值等于8時(shí),其仿真能力提高至96個(gè)節(jié)點(diǎn)。當(dāng)p值增大時(shí),其仿真能力可進(jìn)一步提升。實(shí)驗(yàn)結(jié)果表明,本文提出的仿真模型能夠增大FPGA芯片可仿真系統(tǒng)的規(guī)模。


3.2 仿真速度分析
   
本文采用矩陣乘運(yùn)算,分別在8、16、32個(gè)節(jié)點(diǎn)的目標(biāo)系統(tǒng)和仿真系統(tǒng)上執(zhí)行,測(cè)試二者的仿真速度。目標(biāo)系統(tǒng)和仿真系統(tǒng)的工作頻率為75 MHz。圖6展示了二者的執(zhí)行時(shí)間。


    可以看出,仿真系統(tǒng)的執(zhí)行時(shí)間大于目標(biāo)系統(tǒng)。其時(shí)間增量主要是由于仿真系統(tǒng)將目標(biāo)系統(tǒng)中多個(gè)processor并行處理的任務(wù)移植到一個(gè)VAU上串行執(zhí)行造成。仿真系統(tǒng)沒(méi)有改變目標(biāo)系統(tǒng)的數(shù)據(jù)傳輸路徑和模式,因此,數(shù)據(jù)傳輸?shù)臅r(shí)間并沒(méi)有增加。另外,由于VAU虛擬的p個(gè)pro-cessor共享了存儲(chǔ)空間,仿真系統(tǒng)中消除了p個(gè)processor之間的數(shù)據(jù)傳輸時(shí)間。雖然仿真系統(tǒng)相對(duì)于目標(biāo)系統(tǒng)執(zhí)行時(shí)間有所增加,但其時(shí)間增量處于秒級(jí)。相對(duì)于緩慢的軟件模擬器,并綜合考慮仿真模型對(duì)FPGA仿真規(guī)模帶來(lái)的好處,因此認(rèn)為該仿真模型帶來(lái)的仿真時(shí)間增量是可以接受的。

4 結(jié)束語(yǔ)
   
本文提出了面向?qū)ΨQ多核體系結(jié)構(gòu)的FPGA仿真模型,以及基于該模型的多核/眾核、SIMD體系結(jié)構(gòu)的執(zhí)行模式。相對(duì)于軟硬件聯(lián)合仿真方法,該仿真模型減少了軟硬件協(xié)同邏輯并避免了設(shè)計(jì)復(fù)雜的軟件劃分算法。實(shí)驗(yàn)結(jié)果表明,面向?qū)ΨQ多核體系結(jié)構(gòu)的FPGA仿真模型能有效地減少仿真系統(tǒng)FPGA資源的需求,增大FPGA的仿真規(guī)模,并且其帶來(lái)的仿真時(shí)間增量是可接受的。但該仿真模型主要是面向?qū)ΨQ體系結(jié)構(gòu),而不適用于異構(gòu)多核系統(tǒng)等非對(duì)稱結(jié)構(gòu)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

美國(guó)紐約州阿蒙克2022年10月20日 /美通社/ -- IBM(NYSE: IBM)發(fā)布 2022 年第三季度業(yè)績(jī)報(bào)告。 IBM 董事長(zhǎng)兼首席執(zhí)行官 Arvind Kri...

關(guān)鍵字: IBM 軟件 BSP 云平臺(tái)

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險(xiǎn)積極籌備個(gè)人養(yǎng)老金的產(chǎn)品設(shè)計(jì)和系統(tǒng)開(kāi)發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動(dòng)商業(yè)養(yǎng)老保險(xiǎn)、個(gè)人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險(xiǎn)等產(chǎn)品供給。 搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字: 溫度 BSP 東風(fēng) 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元,承載著生存與活動(dòng)的最基本功能。而對(duì)于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對(duì)于空間和生活深層關(guān)系的思考,同時(shí)也塑造著人與空間的新型連接...

關(guān)鍵字: 溫度 BSP 智能化 進(jìn)程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績(jī)預(yù)告。今年前三季度,公司預(yù)計(jì)實(shí)現(xiàn)營(yíng)業(yè)收入7.54億元至8.33億元,同比增長(zhǎng)60.24%至77.03%;歸母凈利潤(rùn)預(yù)計(jì)為1.73億...

關(guān)鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級(jí)企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠(chéng)健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國(guó)軟件定義存儲(chǔ)及超融合市場(chǎng)研究報(bào)告》,報(bào)告顯示:2022年上半年浪潮超融合銷售額同比增長(zhǎng)59.4%,近5倍于...

關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團(tuán)成立60周年的紀(jì)念日。趁著首都銀行集團(tuán)成立60周年與首都銀行(中國(guó))在華深耕經(jīng)營(yíng)12年的“大日子”,圍繞作為外資金融機(jī)構(gòu)對(duì)在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字: 數(shù)字化 BSP 供應(yīng)鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會(huì)社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運(yùn)國(guó)際物流有限公司(Nipp...

關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國(guó)進(jìn)出口商品交易會(huì)("廣交會(huì)")于"云端"開(kāi)幕。本屆廣交會(huì)上高新技術(shù)企業(yè)云集,展出的智能產(chǎn)品超過(guò)140,...

關(guān)鍵字: 中國(guó)智造 BSP 手機(jī) CAN

要問(wèn)機(jī)器人公司哪家強(qiáng),波士頓動(dòng)力絕對(duì)是其中的佼佼者。近來(lái)年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開(kāi)發(fā)的機(jī)器人會(huì)后空翻,自主爬樓梯等。這不,波士頓動(dòng)力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻,表演的機(jī)器人包括...

關(guān)鍵字: 機(jī)器人 BSP 工業(yè)機(jī)器人 現(xiàn)代汽車

電子設(shè)計(jì)自動(dòng)化

21369 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉