日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 嵌入式 > 嵌入式硬件

摘 要: 綜合考慮面積和速度等因素,采用一次多項式擬合實現(xiàn)了簡單快速的log-add算法單元。實驗結(jié)果表明,在相同的精度要求下,其FPGA實現(xiàn)資源占用合理,硬件開銷好于其他次數(shù)的多項式擬合實現(xiàn)方案。
關鍵詞: 多項式擬合;log-add算法單元;FPGA實現(xiàn)

在多路實時語音處理系統(tǒng)中,基于高斯混合概率模型[1,2]的系統(tǒng)后端運算量非常大,采用log-add算法單元可以簡化運算,提高運算效率。其函數(shù)形式為[3]:

查表法可以認為是多項式次數(shù)為0的情況,隨著精度要求的增加,查找表會變得很大[5]。函數(shù)逼近可以采用多項式擬合,首先根據(jù)所需要的精度確定多項式次數(shù)和分段的大小,然后計算每一段的多項式系數(shù)。
設分段的大小為d(d=2-k,k=0,1,2…),計算各段系數(shù)時,各段函數(shù)平移到區(qū)間[0,d),如圖2所示。用Matlab進行多項式擬合依次得到各段系數(shù)。由此可以得出各段的擬合多項式為:

這樣實現(xiàn)時可以把二進制的定點數(shù)x分為MSBs和LSBs兩段。MSBs對應段標號i,由段標號取出系數(shù)ci0,ci1,ci2…;LSBs對應浮點數(shù)xl,代表段內(nèi)偏移值。由圖3可以計算出f(x)。

MSBs和LSBs應該這樣選取,例如定標為Q32.f,選擇d=1/2,則MSBs為高32-(f-1)位,LSBs為低f-1位;選擇d=1/4, 則MSBs為高32-(f-2)位,LSBs為低f-2位……;如果MSBs為32或31,則變成了查表法。
2 多項式擬合的實現(xiàn)方案
2.1 多項式次數(shù)與分段大小、精度的關系
用Matlab進行仿真,表1列出了各種精度要求下各次多項式所需的分段大小(d),其中?啄為精度要求,?茁為多項式的次數(shù)。
由表1可以看出,相同次數(shù)的情況下,精度要求越高,分段大小d越?。欢嗤鹊那闆r下,次數(shù)越高,分段大小d越大。另外,次數(shù)越低,精度越高,分段大小d下降的數(shù)量級越快。



表2列出各次多項式在不同精度要求下,所需要系數(shù)個數(shù)(n)的分布情況。

由表2可以看出,其結(jié)果與表1趨于一致。相同次數(shù)下,精度要求越高,所需要的系數(shù)個數(shù)n越多;而相同精度下,次數(shù)越高,所需要系數(shù)個數(shù)n越少。n隨著次數(shù)的降低和精度的提高迅速增大。
與n相反,多項式的計算量隨著多項式次數(shù)的增加而增加。根據(jù)horner算法[3]多項式的表達式如下:

式(6)表明,多項式次數(shù)增加1次,計算多項式的函數(shù)值增加1次乘法和1次加法。多項式系數(shù)存儲量與多項式的計算量是其FPGA實現(xiàn)時互相制約的兩個因素。
3 仿真結(jié)果
為了取得面積與速度的平衡,根據(jù)測試結(jié)果及實際系統(tǒng)的要求,選擇δ=10-4、β=1來實現(xiàn)。本文采用Xilinx ISE Design Suite 10.1進行仿真測試。定標取Q32.23,其硬件實現(xiàn)計算流程如圖4,輸入為定點數(shù)x,由MSBs和LBSs取得系數(shù)和xl,經(jīng)過reg系數(shù)寄存器及1次乘法和1次加法,輸出y。

時序仿真結(jié)果結(jié)果如圖5。輸入x是32 bit的無符號定點數(shù),輸出為y;clk是時鐘;reset為復位信號;MSBs是x的高位,用于得到多項式系數(shù);LSBs是x的低位即自變量;temp是用于緩存中間結(jié)果,coef[...]是多項式系數(shù)。輸出延遲3個時鐘周期,流水線填滿后,每個時鐘周期輸出一個結(jié)果。

例如輸入32’h00333333(浮點數(shù)0.4),從圖中可以看出其輸出y為24’h41aba5,與實際函數(shù)值24’h41aa7c存在誤差。其實現(xiàn)結(jié)果與浮點結(jié)果比較誤差如圖6??梢钥闯龆c數(shù)誤差在800以內(nèi),也就是浮點數(shù)約10-4以內(nèi),誤差范圍與表1相一致。

使用ISE軟件的XST工具綜合,選擇設備為Xilinx公司Virtex5系列的XC5VFX100T(speed-2)。其資源占用情況如表3,其中Xilinx公司的乘加硬件設備DSP48E用于算法中的乘法運算及加法運算[6]。

可以對比δ=10-4,β=0,1,2,3四種實現(xiàn)方式的硬件開銷,如表4。

由表4可以看出,雖然多項式次數(shù)為0時使用寄存器(Registers)和查找表(LUTs)最少,且乘法和加法次數(shù)(DSP48Es)為0,但由于其使用了24×40 960 ROM,占用存儲面積較大;而一次多項式擬合雖然所占用查找表(LUTs)一項相對較多,但綜合考慮,其他資源占用都比較均衡。其整體的資源開銷要好于其他方案。
log-add算法單元作為高斯混合概率模型FPGA實現(xiàn)的基本算法單元,能夠簡化運算、提高運算效率。在系統(tǒng)精度要求10-4的情況下,采用一次多項式擬合能夠有效地節(jié)省硬件開銷,實現(xiàn)簡單快速log-add算法單元,為大規(guī)模實時處理多路語音數(shù)據(jù)提供了重要保證。
參考文獻
[1] Douglas A.Reynolds,THOMAS E.Quatieri,Robert B.Dunn. Speaker verification using adapted gaussian mixture models[J].Digital Signal Processing,2000(10).
[2] Kazuo Miura,Hiroki Noguchi,Hiroshi Kawaguchi,et al.A low memory bandwidth gaussian mixture model(GMM) processor for 20,000-word real-time speech recognition FPGA system[J].ICECE Technology,2008.FPT.2008.
[3] MELNIKOFF S J,F(xiàn)QUIGLEY S.Implementing the Log-add Algorithm in Hardware[J].Electronics Letters,2003.
[4] LEE B R,BURGESS N.A pallrallel Look-up logarithmic number system addition subtraction scheme for FPGA[J]. Proc.FPT,2003.
[5] 李煒,沈緒榜.對數(shù)數(shù)值系統(tǒng)的研究[J].微電子學與計算機,2004.
[6] 胡彬.Xilinx ISE Design Suite 10.x FPGA開發(fā)指南—邏輯設計篇[M].北京:人民郵電出版社,2008.

本站聲明: 本文章由作者或相關機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

在工業(yè)控制系統(tǒng)中,Modbus RTU協(xié)議的CRC校驗如同通信網(wǎng)絡的"免疫系統(tǒng)",某石化廠DCS系統(tǒng)曾因CRC計算錯誤導致0.3%的數(shù)據(jù)包丟失,引發(fā)連鎖控制故障。本文將深入解析CRC-16/MODBUS算法原理,對比軟件...

關鍵字: Modbus RTU CRC 算法

加密算法分對稱加密和非對稱算法,其中對稱加密算法的加密與解密密鑰相同,非對稱加密算法的加密密鑰與解密密鑰不同,此外,還有一類不需要密鑰的散列算法。

關鍵字: 算法 嵌入式

在現(xiàn)代數(shù)字系統(tǒng)設計中,將算法高效地轉(zhuǎn)化為 RTL(寄存器傳輸級)實現(xiàn)是 FPGA 工程師的核心任務之一。這一過程不僅需要對算法有深入理解,還需掌握 FPGA 的硬件特性和設計技巧。本文將詳細介紹從算法到 RTL 實現(xiàn)的關...

關鍵字: 算法 寄存器傳輸級 數(shù)字系統(tǒng)

從本質(zhì)上講,算法是一種有條不紊、分步驟解決問題或完成任務的方法。無論是簡單的數(shù)字相加公式,還是復雜的機器學習協(xié)議,算法都是軟件應用的基礎,確保任務能夠高效有效地執(zhí)行。

關鍵字: 算法 嵌入式

2025年8月14日,致力于亞太地區(qū)市場的國際領先半導體元器件分銷商---大聯(lián)大控股宣布,其旗下詮鼎推出基于新突思(Synaptics)SL1680嵌入式處理器的AI疲勞駕駛檢測方案。

關鍵字: AI 嵌入式處理器 Type-C

在自動駕駛技術的發(fā)展歷程中,激光雷達(LiDAR)宛如一顆備受矚目的新星,其獨特的技術特性使其成為追求高安全性、高可靠性自動駕駛方案的首選。然而,這顆新星并非毫無爭議,“價格昂貴、結(jié)構(gòu)復雜、算法難度高” 等標簽,也讓一些...

關鍵字: 自動駕駛 激光雷達 算法

4月2日消息,近日,有關智能駕駛而引發(fā)的交通事故在網(wǎng)絡上引起了大家的熱烈討論,對此,央視網(wǎng)評指出,“智能駕駛”,也請握緊方向盤。

關鍵字: 算法 智能駕駛

所謂排序算法,即通過特定的算法因式將一組或多組數(shù)據(jù)按照既定模式進行重新排序。這種新序列遵循著一定的規(guī)則,體現(xiàn)出一定的規(guī)律,因此,經(jīng)處理后的數(shù)據(jù)便于篩選和計算,大大提高了計算效率。對于排序,我們首先要求其具有一定的穩(wěn)定性,...

關鍵字: 排序算法 算法

快速排序通過一趟排序?qū)⒋判蛄蟹指畛瑟毩⒌膬刹糠?,其中一部分序列的關鍵字均比另一部分序列的關鍵字小,則可分別對這兩部分序列繼續(xù)進行排序,以達到整個序列有序的目的。

關鍵字: 快速排序 算法

算法,作為解決問題的精確描述,是描述策略機制的系統(tǒng)方法。讓我們在周末輕松探討五個具有深遠影響的算法:Metropolis-Hastings算法、單純形法、快速傅立葉變換、快速排序算法,以及計算特征值的QR算法。這些算法在...

關鍵字: 算法 快速排序算法
關閉