日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > EDA > 電子設(shè)計自動化
[導讀] 最近出現(xiàn)的 FPGA設(shè)計工具和 IP有效減少了計算占用的資源,大大簡化了浮點數(shù)據(jù)通路的實現(xiàn)。而且,與數(shù)字信號處理器不同, FPGA能夠支持浮點和定點混合工作的 DSP數(shù)據(jù)通路,實現(xiàn)的性能超過了 100 GFLOPS。在所有信

    最近出現(xiàn)的 FPGA設(shè)計工具和 IP有效減少了計算占用的資源,大大簡化了浮點數(shù)據(jù)通路的實現(xiàn)。而且,與數(shù)字信號處理器不同, FPGA能夠支持浮點和定點混合工作的 DSP數(shù)據(jù)通路,實現(xiàn)的性能超過了 100 GFLOPS。在所有信號處理算法中,對于只需要動態(tài)范圍浮點算法的很多高性能 DSP應用,這是非常重要的優(yōu)點。選擇 FPGA并結(jié)合浮點工具和 IP,設(shè)計人員能夠靈活的處理定點數(shù)據(jù)寬度、浮點數(shù)據(jù)精度和達到的性能等級,而這是處理器體系結(jié)構(gòu)所無法實現(xiàn)的。

引言

對于通信、軍事、醫(yī)療等應用中的很多復雜系統(tǒng),首先要使用浮點數(shù)據(jù)處理算法,利用 C或者 MATLAB軟件進行仿真和建模。而最終實現(xiàn)幾乎都采用定點或者整數(shù)算法。算法被仔細映射到有限動態(tài)范圍內(nèi),調(diào)整數(shù)據(jù)通路中的每一功能。這就需要很多取整和飽和步驟,如果處理的不合適,就會對算法性能有不利的影響。在集成過程中一般還需要進行大量的驗證工作,以確保系統(tǒng)工作符合仿真結(jié)果。

以前,由于缺乏 FPGA工具包的支持, FPGA設(shè)計人員一般不選擇浮點算法。使用很多浮點 FPGA運算符時,由于需要大量邏輯和布線資源,因此,它的另一個缺點是性能太差。 FPGA高效實現(xiàn)復數(shù)浮點函數(shù)的關(guān)鍵是使用基于乘法器的算法,利用大量集成在 FPGA器件中的硬件乘法器資源。用于實現(xiàn)這些非線性函數(shù)的乘法器必須有很高的精度,以保證乘法迭代過程中的精度要求。而且,高精度乘法器不需要在每一次乘法迭代中進行歸一化和逆歸一化處理,大大降低了對邏輯和布線的要求。

FPGA采用硬件數(shù)字信號處理 (DSP)模塊,能夠?qū)崿F(xiàn)高效的 36位x36位乘法器,對于單精度浮點算法,提供足夠的位數(shù),滿足一般的單精度 24位尾數(shù)要求。這些乘法器還能夠用于構(gòu)建更大的乘法器,實現(xiàn)高達 72位 x72位的雙精度浮點算法。

由于浮點算法動態(tài)范圍較大,相對于浮點仿真,大大簡化了系統(tǒng)性能驗證任務,因此,對于設(shè)計人員而言,這種算法通常能夠提高性能。在某些應用中,定點算法是不可行的。動態(tài)范圍要求使用浮點算法的一個常見的例子是矩陣求逆運算。

浮點 IP內(nèi)核
Altera現(xiàn)在提供業(yè)界最全面的單精度和雙精度浮點 IP內(nèi)核,其性能非常高。目前提供的浮點 IP內(nèi)核包括:


■加法 /減法
■乘法
■除法
■倒數(shù)
■指數(shù)
■對數(shù)
■平方根
■逆平方根
■矩陣乘法
■矩陣求逆
■快速傅立葉變換 (FFT)
■對比
■整數(shù)和分數(shù)轉(zhuǎn)換
f本白皮書只提供單精度指標。對于雙精度指標,請參考浮點宏功能用戶指南。

 WP-01116-1.0

2009年 10月, 1.0版


充分發(fā)揮 FPGA浮點 IP內(nèi)核的優(yōu)勢 Altera公司

基本功能
圖1詳細列出了基本浮點功能及其性能。對比浮點除法與加減法所需要的資源及其性能,表明系統(tǒng)設(shè)計人
員不需要在算法中避開除法運算以簡化硬件實現(xiàn)。

圖1. 邏輯和寄存器使用對比(左側(cè)),以及乘法器和 fMAX對比(右側(cè))

矩陣乘法
Altera在提供基于 FPGA的參數(shù)賦值浮點矩陣IP內(nèi)核方面有其獨到之處。這些運算符集成了數(shù)十甚至上百個
浮點運算符,保持了較高的性能。矩陣乘法內(nèi)核還可以用于完成標準測試或者 GFLOP/S和 GFLOP/W。
SGEMM矩陣乘法內(nèi)核的性能結(jié)果如表1所示,它實際是后編譯時序逼近結(jié)果,與確定 GFLOP/S通常使用的 Altera公司充分發(fā)揮 FPGA浮點 IP內(nèi)核的優(yōu)勢 紙筆浮點計算方法不同。任何其他 FPGA供應商都不支持這類基準測試,用戶使用 Altera Quartus. II軟件中提供的參數(shù)賦值矩陣乘法 IP內(nèi)核,很容易自己進行測試。

表 1. 單精度矩陣乘法性能結(jié)果

MatrixAA大小
MatrixBB大小
Vectorsize
使用的邏輯
GFLOPSf MAX (MHz)
功耗 (mW)
ALM (1)
DSP使用 (2)
M9KM144K
存儲器 (bits)
靜態(tài)
動態(tài)
I/O
總計
36x112 112x36 8 4,604 32 43 2 576,200 4 291 2,008 1,063 300 3,334
36x224 224x36 16 7,882 64 77 4 1,101,920 9 291 2,045 1,821 300 4,165
36x448 448x36 32 14,257 128 137 8 2,153,040 18 291 2,110 3,448 300 5,858
64x64 64x64 32 13,154 128 41 8 1,333,233 18 292 2,112 2,604 306 5,023
128x128 128x128 64 25,636 256 141 16 3,173,189 37 293 2,244 5,384 306 7,934

注釋:

(1) 自適應邏輯模塊
(2) 18x18 DSP模塊
使用 Quartus II功耗估算器,很容易計算得到實際的每瓦每秒 giga浮點結(jié)果 (GFLOPS/W)。使用 Altera.
Stratix. IV EP4SE230 FPGA部分資源時,結(jié)果達到了 5 GFLOPS/W。使用 Stratix IV EP4SE530器件中更大的
矩陣乘法內(nèi)核,結(jié)果大約為 7 GFLOPS/W,計算密度為 200 GFLOPS。利用整個器件實現(xiàn)大規(guī)模浮點算法
時,分散了 FPGA靜態(tài)功耗,效率非常高。

Altera開發(fā)的浮點技術(shù)大大降低了實現(xiàn)大規(guī)模浮點數(shù)據(jù)通路的邏輯和布線資源要求。使用浮點數(shù)據(jù)通路優(yōu)化
工具非常關(guān)鍵,對資源要求的降低使得單位浮點邏輯/布線運算比達到了高端 FPGA的水平。這反映在工
具能夠?qū)崿F(xiàn)接近 300 MHz的 fMAX,與例化的矩陣乘法規(guī)模無關(guān)。通過這種方式,在大規(guī)模浮點設(shè)計中,用
戶能夠可靠的使用 FPGA 80%以上的資源,實現(xiàn)大于 200-MHz的 fMAX性能。

矩陣求逆
FPGA中浮點算法最常見的應用是矩陣求逆。大部分無線多輸入多輸出 (MIMO)算法、雷達 STAP系統(tǒng)、醫(yī)療
成像聚束和很多高性能計算應用都需要進行矩陣求逆。參數(shù)賦值矩陣求逆浮點 IP內(nèi)核的實例性能 (表2)
顯示了非常高的矩陣吞吐量。 4x4矩陣求逆內(nèi)核能夠進行每秒 2千萬次矩陣求逆運算,速度足以支持 LTE
無線 MIMO應用。

表 2. 單精度浮點矩陣求逆 (Cholesky算法 )性能

快速傅立葉變換
FFT是另一種大動態(tài)范圍應用實例。由于 FFT算法的內(nèi)在特性,位精度一般會隨著 FFT長度增加而增大。某些應用使用級聯(lián) FFT,需要更大的動態(tài)范圍。很多雷達應用使用 FFT進行定點算法,裝入測距數(shù)據(jù)。這一般還需要第二次 FFT,裝入多普勒測距數(shù)據(jù),動態(tài)范圍足夠高,需要采用浮點算法。如圖3和圖4所示,相對于定點算法,需要增加邏輯以實現(xiàn)單精度浮點算法,而電路 fMAX、存儲器和乘法器基本相似。


充分發(fā)揮 FPGA浮點 IP內(nèi)核的優(yōu)勢 Altera公司

圖3. FFT邏輯和寄存器使用對比

結(jié)論
Altera新的浮點電路優(yōu)化技術(shù)集成到浮點 IP內(nèi)核中,同時提高了密度,并提供更多的邏輯資源,實現(xiàn)了優(yōu)異
的 FPGA浮點性能。其他供應商提供專用浮點處理器解決方案,但是,大部分都達不到 Altera FPGA解決
方案的 GFLOPS高性能水平,而且沒有一個能夠?qū)崿F(xiàn) Stratix IV FPGA解決方案的 GFLOP/W性能。國家科
學基金會 (NSF)高性能配置計算中心 (CHREC)的獨立基準測試證明了這一點,認為 Stratix IV EP4SE530雙
精度浮點處理的性能最好。

Altera FPGA的其他優(yōu)點包括業(yè)界領(lǐng)先的外部存儲器帶寬資源以及性能達到 12.5 Gbps的SERDES收發(fā)器等。
FPGA平臺還提供性能最好的定點數(shù)據(jù)通路,實現(xiàn)了非常靈活的 I/O和存儲器接口。通過這些功能, Stratix
IV FPGA成為構(gòu)建高性能浮點數(shù)據(jù)通路的理想平臺,可以用在多種應用中,從高性能計算到雷達和電子戰(zhàn),
直至基于 MIMO的 SDR/無線系統(tǒng),以及無線聚束應用等。


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

(全球TMT2022年10月17日訊)為全球技術(shù)基礎(chǔ)設(shè)施提供高速連接的企業(yè)Alphawave IP Group plc發(fā)布其截至2022年9月30日的三個月交易和業(yè)務更新文告。公司從2022年9月1日起整合了已收購的O...

關(guān)鍵字: ALPHA IP GROUP PLC

最近為什么越來越多的研究開始利用FPGA作為CNN加速器?FPGA與CNN的相遇究竟能帶來什么神奇效果呢?原來,F(xiàn)PGA擁有大量的可編程邏輯資源,相對于GPU,它的可重構(gòu)性以及高功耗能效比的優(yōu)點,是GPU無法比擬的;同時...

關(guān)鍵字: FPGA 可編程邏輯資源 GPU

FPGA的應用領(lǐng)域包羅萬象,我們今天來看看在音樂科技領(lǐng)域及醫(yī)療照護的智能巧思。

關(guān)鍵字: FPGA 科技領(lǐng)域 智能

東芝公司(Toshiba)關(guān)于經(jīng)營重組方案,計劃與國內(nèi)基金“日本產(chǎn)業(yè)合作伙伴”(JIP)為核心的企業(yè)聯(lián)盟優(yōu)先展開談判。JIP向中部電力、歐力士等多家日企尋求出資參與東芝重組。東芝9月30日宣布,從通過第一輪招標的多個陣營...

關(guān)鍵字: 東芝 IP TOSHIBA 電力

東芝公司(Toshiba)關(guān)于經(jīng)營重組方案,計劃與國內(nèi)基金“日本產(chǎn)業(yè)合作伙伴”(JIP)為核心的企業(yè)聯(lián)盟優(yōu)先展開談判。JIP向中部電力、歐力士等多家日企尋求出資參與東芝重組。東芝9月30日宣布,從通過第一輪招標的多個陣營...

關(guān)鍵字: 東芝 IP TOSHIBA 電力

強大的產(chǎn)品可降低信號噪音并提高分辨率與動態(tài)

關(guān)鍵字: Spectrum儀器 數(shù)字化儀 FPGA

北京2022年10月11日 /美通社/ -- 在四川大涼山深處,有一只"涼山黑鷹"少年籃球隊:隊員平均年齡12歲,平均身高1米3,球隊剛成立時,連個像樣的球場都沒有。然而,憑著一腔熱情和驚人天賦,這只...

關(guān)鍵字: 網(wǎng)絡(luò) BSP 內(nèi)核 騰訊

最近某項目采用以太網(wǎng)通信,實踐起來有些奇怪,好像設(shè)計成只能應答某類計算機的ICMP(ping)命令, 某類計算機指的是Windows特定系統(tǒng),其他系統(tǒng)發(fā)送ping都不能正確識別。

關(guān)鍵字: 嵌入式Linux FPGA 協(xié)議

近兩年,國外廠商的FPGA芯片價格飆升,由于價格,貨期,出口管制等多方面因素的影響,很多公司都在尋找FPGA國產(chǎn)化替代方案。我工作中正在使用的幾款芯片也面臨停產(chǎn)的風險,用一片少一片,了解到國產(chǎn)FPGA發(fā)展的也不錯,完全自...

關(guān)鍵字: FPGA 芯片 EDA

這個國慶假期前,溫州14歲的小文(化名)在“鬼門關(guān)”前走了一遭。感冒發(fā)燒的小文,因為課業(yè)繁忙強撐著沒去醫(yī)院治療,撐了兩天高燒遲遲沒退。等到醫(yī)院后,小文心肌炎暴發(fā),一度心臟停跳半分鐘…...

關(guān)鍵字: IP 傳導

電子設(shè)計自動化

21369 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉