日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 工業(yè)控制 > 電子設(shè)計自動化
[導(dǎo)讀]摘要:采用VC++和Matlab混合編程搭建了一個高效的基于HMM的語音識別實驗驗證平臺。結(jié)合FPGA的特點,直接使用加法器、乘法器、比較器等建立一個Viterbi算法結(jié)構(gòu),采用改進方法計算Viterbi得分,實現(xiàn)一種簡單的基于HMM的語

摘要:采用VC++和Matlab混合編程搭建了一個高效的基于HMM的語音識別實驗驗證平臺。結(jié)合FPGA的特點,直接使用加法器、乘法器、比較器等建立一個Viterbi算法結(jié)構(gòu),采用改進方法計算Viterbi得分,實現(xiàn)一種簡單的基于HMM的語音模板匹配。

1 引言

Matlab 是一款高性能的數(shù)值計算和可視化軟件,集成數(shù)值分析、矩陣計算、信號運算、 信號處理和圖形顯示于一體,構(gòu)成了一個方便的、界面友好的用戶環(huán)境。目前,基于Matlab 的語音識別開發(fā)平臺雖然在可讀性、可移植性和可擴充性上優(yōu)于其它編程語言,且調(diào)試功能 強大、數(shù)據(jù)庫函數(shù)豐富,可使研究人員“站在巨人的肩上”更加直觀、方便地進行分析、計 算與設(shè)計工作,從而大大地節(jié)省了時間[1]。但考慮到其執(zhí)行代碼速度低下,不能直接與硬件 底層直接接觸等缺點,因此提出了采用Matlab 和VC++混合編程來搭建語音識別實驗平臺, 并對傳統(tǒng)Viterbi 算法進行變形,直接使用FPGA 的加法器、比較器和邏輯操作來計算觀察 值序列,以實現(xiàn)一種簡單的嵌入式語音模板匹配。

2 基于HMM 的語音識別

2.1 語音識別系統(tǒng)

語音識別系統(tǒng)(Speech Recognition System,SRS)基本上是一個模式分類的任務(wù),即通 過訓(xùn)練,系統(tǒng)能夠把輸入的語音按一定模式進行分類[2]。實驗在Matlab 7.0 系統(tǒng)上建立了一 個簡單的基于隱馬爾可夫模型(Hidden Markov Model,HMM)的語音識別過程,如圖1。


(1)語音輸入:在一般實驗室環(huán)境下進行語音信號采樣,采樣格式為PCM,采樣頻率 16 KHZ,A/D 的量化精度8 Bit。然后經(jīng)過去噪、預(yù)加重、分幀、加窗等處理過程,去掉語音信號中包含的大量冗余信息,加強語音信號的高頻共振峰,便于進行頻譜分析。

(2)端點檢測:考慮到語音信號的錄制是在較為安靜的實驗室環(huán)境下進行,利用過零 率Z 來檢測清音,用短時能量E 來檢測濁音,兩者配合實現(xiàn)可靠的端點檢測[3]。

(3)特征提取和量化:對有效語音段進行特征提取,即提取基于Mel 刻度的倒頻譜矢 量(Mel Frequency Cepstrum Coefficients,MFCC),它是識別過程中的輸入特征值。特征值 經(jīng)矢量量化Vector Quantization,VQ),輸出VQ 碼本類別號,即HMM 訓(xùn)練與識別階段使 用的觀察值序列o。

(4)模型訓(xùn)練與語音識別:訓(xùn)練階段,系統(tǒng)采用一系列訓(xùn)練觀察值估計HMM 參數(shù),


2.2 Viterbi 算法

由于計算復(fù)雜度的限制,對于基于HMM 的實時語音識別來說,需要設(shè)計一個高效的硬 件結(jié)構(gòu)來執(zhí)行Viterbi 譯碼過程,以加速HMM 的識別過程??紤]了FPGA 的特點,分別采 用對數(shù)概率和狀態(tài)概率的最小路徑對傳統(tǒng)的Viterbi 算法進行變形,其計算P( o |λ ) v 的過程 如下[5]:


通過上面的變形,不僅可以使傳統(tǒng) Viterbi 算法中的乘法轉(zhuǎn)成加法,降低時間消化,有 效地避免數(shù)據(jù)下溢的問題。而且隨著Viterbi 計算過程的進行,已計算的狀態(tài)概率值隨之增 加,改原來找結(jié)束概率的最大值為最小值[6]。因此,只需要計算T 時刻的概率T δ( i) ,它是 大于前參考單詞模型的最小值Pv 的。

實驗將直接使用 FPGA 的加法器、比較器和邏輯操作來實現(xiàn)上述公式(2)和公式(3), 可以顯著提高系統(tǒng)效率,系統(tǒng)結(jié)構(gòu)如下圖2。


在這一方案中,識別過程直接由 FPGA 芯片內(nèi)的邏輯塊從觀察序列中計算概率得分, 其中,觀察值序列通過VQ 得出。系統(tǒng)包括了兩個用來存儲轉(zhuǎn)移矩陣A 和輸出概率矩陣B 的存儲器,一個處理單元(Processing Element,PE)陣列,控制器,地址生成和附加比較 邏輯。PE 包括有Viterbi 算法的核心模塊加-比-選單元(Add-Compare-Select Unit,ACSU), 狀態(tài)累加器,和用來比較( i ) T δ 和極值Pv的附加比較器。PE 從HMM 參數(shù)寄存器中取出參 考模型,沿最小路徑計算其概率,然后與極值Pv 進行比較。當(i) T δ 大于Pv 時,控制器在 下一狀態(tài)時使PE 操作無效;同時,控制器控制存儲器緩沖操作,并生成整個計算過程中的 控制信號。

3 VC++和Matlab 混合編程

對于在 FPGA 上實現(xiàn)語音識別的核心模塊——Viterbi 算法時,有許多工作需要在實驗 前完成,如定制硬件源代碼、轉(zhuǎn)換浮點數(shù)據(jù)為定點數(shù)據(jù)和電路仿真等。為減少這部分工作, 采用軟硬件協(xié)同設(shè)計的思想,由軟件來執(zhí)行HMM 模型訓(xùn)練和其它識別過程(如MFCC、 VQ 等)。在實驗時,用軟件來執(zhí)行HMM 模型訓(xùn)練和語音單詞識別。然后,把實驗數(shù)據(jù)(語 音數(shù)據(jù)和HMM 模型參數(shù))轉(zhuǎn)換成定點數(shù)據(jù)格式,由PCI 設(shè)備驅(qū)動程序?qū)嶒灁?shù)據(jù)、源代 碼等下載到硬件,用于FPGA 驗證平臺。

根據(jù)上述思想,采用Matlab 和VC + +混合編制PCI 設(shè)備驅(qū)動程序,利用Matlab 系統(tǒng)提 供的外部程序調(diào)用接口MEX 文件來實現(xiàn)其于VC++的混合編程。MEX 文件是一種約定格式 編寫的文件,使用C 語言或FOTRAN 語言編寫,是由Matlab 解釋器自動調(diào)用并執(zhí)行的動態(tài) 鏈接函數(shù)(Dynamic Link Library Function),它在Mac 下以.mex 為后綴名,在Windows 下 即.dll 文件?;贑 語言的MEX 文件主要由兩部分組成,第一部分稱為入口子程序,其作 用是在Matlab 系統(tǒng)與被調(diào)用的外部子程序間建立通信聯(lián)系。第二部分稱為計算功能子程序,它包含所有實際需要完成的功能的源代碼,由入口子程序調(diào)用[7]。


該方法可以在軟硬件之間達到一致的識別結(jié)果,其方案描述如圖3 所示。實驗中,計算 由FPGA 硬件完成,該子程序的主要負責FPGA 與PCI 的數(shù)據(jù)傳遞,即PCI 設(shè)備驅(qū)動。通 過MEX 文件,不僅可在Matlab 系統(tǒng)中像調(diào)用內(nèi)建函數(shù)一樣調(diào)用存在的算法,使資源得到 充分利用,避免重復(fù)程序設(shè)計。同時,還可以對硬件直接進行編程,彌補Matlab 的不足。

4 實驗

該語音識別實驗采用的硬件平臺是包括有Altera Cyclone 系列EP1C12 的FPGA 和 PCI9054 芯片的PCI 開發(fā)板。EP1C 的FPGA 負責硬件Viterbi 計算,PCI9054 在驅(qū)動程序的 幫助下負責PC 和FPGA 間實驗數(shù)據(jù)和結(jié)果的傳輸。

由于 FPGA 的空間限制,實驗選擇了4 狀態(tài)的HMM 模型和容量64 的VQ 碼本,占用 FPGA 的LE(邏輯單元)1,125 個,存儲單元占用約132K 位。然后將.sof 目標文件下載到 PCI 卡上的FPGA 芯片中運行,在Matlab 中調(diào)用VC++編寫的PCI 設(shè)備驅(qū)動程序,將VQ 后 的語音數(shù)據(jù)和HMM 模型參數(shù)傳送給FPGA 內(nèi)的Viterbi 譯碼電路,實驗中,通過驅(qū)動程序 輸出模板標號與實際語音的標號及仿真實驗導(dǎo)出的標號一致。

在 P4 3.0GHz 的PC 機和200MHz FPGA 驗證平臺上,對于約100 幀的單個語音文件識 別而言,軟/硬件Viterbi 算法的耗時如下表1 所示。


由上述實驗結(jié)果證明了該Viterbi 算法的VLSI 結(jié)構(gòu)能夠準確且快速地實現(xiàn)語音識別的解 碼過程,滿足嵌入式計算精度要求,表明該實現(xiàn)方案是切實可行的。

5 結(jié)束語

本文的創(chuàng)新點:采用 Matlab、VC + +和FPGA 搭建了一個軟硬件協(xié)同的語音識別實驗 研究平臺,以VC++來彌補Matlab 不能與硬件底層進行直接接觸的不足。并在傳統(tǒng)Viterbi 算法基礎(chǔ)上,對其采取一定變形,直接使用FPGA 的加法器、比較器和邏輯操作建立Viterbi 算法的VLSI 結(jié)構(gòu),來計算觀察值序列,以實現(xiàn)一種簡單的基于HMM 語音識別的模板匹配。 采用這種軟硬件協(xié)同的實驗研究平臺,可在利用前面Matlab 的實驗成果基礎(chǔ)上,逐步實現(xiàn) 語音識別各功能模塊的嵌入式設(shè)計,減少工作量,并易于調(diào)試。



來源:xiaobai2次

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉