日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 汽車電子 > 汽車電子
[導(dǎo)讀]現(xiàn)代電子技術(shù)的發(fā)展,使得越來(lái)越多的車載電器加入到汽車電子行列中,在改善汽車性能的同時(shí),也增加了汽車駕駛操作的復(fù)雜度,給行車過程帶來(lái)了不安全隱患。隨著語(yǔ)音識(shí)別算法的改進(jìn)和新一代專用語(yǔ)音處理芯片的問世,使

現(xiàn)代電子技術(shù)的發(fā)展,使得越來(lái)越多的車載電器加入到汽車電子行列中,在改善汽車性能的同時(shí),也增加了汽車駕駛操作的復(fù)雜度,給行車過程帶來(lái)了不安全隱患。隨著語(yǔ)音識(shí)別算法的改進(jìn)和新一代專用語(yǔ)音處理芯片的問世,使得語(yǔ)音控制代替了手動(dòng)控制車載電器,從而減輕了駕駛員手動(dòng)操作負(fù)擔(dān),大大提高了行車安全性。

目前我國(guó)的車身電子語(yǔ)音控制主要集中在汽車導(dǎo)航系統(tǒng)的應(yīng)用上,語(yǔ)音識(shí)別技術(shù)在車身電子中的應(yīng)用沒有充分發(fā)揮。本文首次提出了一種以專用語(yǔ)音處理芯片UniSpeech-SDA80D51為核心組成的非特定人車載音響語(yǔ)音控制系統(tǒng)的設(shè)計(jì)方案,并實(shí)現(xiàn)了系統(tǒng)樣機(jī)的研制。

1 車載音響語(yǔ)音控制系統(tǒng)

系統(tǒng)由語(yǔ)音采集、語(yǔ)音識(shí)別、控制驅(qū)動(dòng)和車載音響等模塊構(gòu)成,系統(tǒng)完成的主要功能是:語(yǔ)音采集模塊用于采集駕駛員發(fā)出的語(yǔ)音命令信號(hào),由語(yǔ)音識(shí)別模塊實(shí)現(xiàn)信號(hào)的A/D轉(zhuǎn)換, 并對(duì)轉(zhuǎn)換的數(shù)字信號(hào)進(jìn)行語(yǔ)音識(shí)別處理,最終輸出與語(yǔ)音命令相對(duì)應(yīng)的詞條編碼信號(hào),控制模塊對(duì)接收的詞條編碼信號(hào)進(jìn)行邏輯分析與處理并產(chǎn)生對(duì)應(yīng)的控制信號(hào)驅(qū)動(dòng)車載音響動(dòng)作,代替駕駛員的手動(dòng)操作。

1.1 語(yǔ)音識(shí)別模塊

語(yǔ)音識(shí)別模塊主要由UniSpeech-SDA80D51芯片及外圍電路組成。

SDA80D51是德國(guó)Infineon公司專為語(yǔ)音識(shí)別和語(yǔ)音處理應(yīng)用領(lǐng)域新推出的高集成度SoC專用芯片,其基本結(jié)構(gòu)如圖1所示。

由圖1可知,SDA80D51片內(nèi)集成了直接雙訪問快速SRAM、2路ADC和2路DAC、多種通信接口和通用GPIO等部件。SDA80D51工作方式以M8051為主控制芯片,主要完成系統(tǒng)配置和SPI、PWM、I2C、GPIO等接口的控制以及語(yǔ)音數(shù)據(jù)的傳輸工作; DSP核心OAK為協(xié)處理器,完成語(yǔ)音識(shí)別算法、語(yǔ)音編解碼算法等語(yǔ)音處理工作。

非特定人語(yǔ)音信號(hào)由定向拾音器輸入,經(jīng)過SDA80D51內(nèi)部的數(shù)據(jù)采集模塊進(jìn)行A/D轉(zhuǎn)換,再經(jīng)過識(shí)別程序的預(yù)處理、端點(diǎn)檢測(cè)、特征參數(shù)提取、模板匹配等處理,選擇識(shí)別詞表中最接近的詞條序號(hào)作為識(shí)別結(jié)果,識(shí)別結(jié)果通過GPIO口輸出。

1.2 控制驅(qū)動(dòng)模塊

控制驅(qū)動(dòng)模塊由MCU和模擬開關(guān)及外圍電路構(gòu)成,模塊主要用來(lái)接收語(yǔ)音識(shí)別結(jié)果,并對(duì)詞條編碼信號(hào)進(jìn)行邏輯分析和處理,通過模擬開關(guān)電路產(chǎn)生對(duì)應(yīng)功能的控制信號(hào)驅(qū)動(dòng)音響動(dòng)作。其中MCU選用美國(guó)ATMEL公司產(chǎn)品AT89S51,綜合AT89S51輸出I/O信號(hào)電壓特性和SL1102C1音響控制面板電阻式分流鍵盤電路的特點(diǎn),確定使用繼電器模擬SL1102C1控制面板按鍵的閉合和斷開動(dòng)作。AT89S51和繼電器模擬開關(guān)電路原理圖如圖2所示。

1.3 音響模塊

本設(shè)計(jì)是基于SL1102C1型汽車音響。SL1102C1是專門為中檔轎車設(shè)計(jì)的汽車音響,具有MP3播放、收音機(jī)和顯示時(shí)間等功能,目前大量使用在江淮同悅轎車上。SL1102C1前板共有開關(guān)機(jī)/靜音、音效、播放/暫停等15個(gè)按鍵和一個(gè)用來(lái)調(diào)節(jié)音量的編碼開關(guān)。

SL1102C1前板鍵控為分壓識(shí)別方式,按鍵包含短按和長(zhǎng)按兩種動(dòng)作。AT89S51輸出電壓為TTL電平,直接驅(qū)動(dòng)音響容易引起鍵碼誤識(shí)別,造成系統(tǒng)誤操作,因此本文采用圖2所示電路,很好地解決了上述問題。當(dāng)AT89S51接收到語(yǔ)音編碼信號(hào)后,立即進(jìn)行邏輯分析并輸出對(duì)應(yīng)的控制信號(hào)驅(qū)動(dòng)繼電器吸合模擬按鍵動(dòng)作,按鍵的短按和長(zhǎng)按功能通過軟件實(shí)現(xiàn)。

模擬開關(guān)電路還適用于SL1102C1前板上的編碼開關(guān),編碼開關(guān)具有音量調(diào)節(jié)功能。開關(guān)旋鈕旋轉(zhuǎn)時(shí),開關(guān)上端子輸出對(duì)應(yīng)的脈沖信號(hào)。當(dāng)MCU收到操作編碼開關(guān)的語(yǔ)音命令信號(hào)后,驅(qū)動(dòng)端子輸出脈沖信號(hào),模擬開關(guān)旋鈕功能。

2 系統(tǒng)軟件設(shè)計(jì)

系統(tǒng)軟件包括非特定人語(yǔ)音識(shí)別模塊和邏輯控制模塊。

2.1 非特定人語(yǔ)音識(shí)別模塊

非特定人語(yǔ)音識(shí)別模塊基于隱馬爾可夫模型算法。HMM算法通過對(duì)大量語(yǔ)音數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì),建立識(shí)別詞條的統(tǒng)計(jì)模型語(yǔ)音庫(kù),然后從待識(shí)別語(yǔ)音中提取特征,與模型庫(kù)進(jìn)行匹配,由比較匹配分?jǐn)?shù)得到識(shí)別結(jié)果,并通過SDA80D51的GPIO口輸出。非特定人語(yǔ)音識(shí)別模塊主要由信號(hào)預(yù)處理、特征參數(shù)提取、模型匹配和Viterbi算法部分組成,模塊框圖如圖3所示。

2.1.1 信號(hào)預(yù)處理

信號(hào)預(yù)處理部分主要完成輸入語(yǔ)音信號(hào)的采樣、 模/數(shù)轉(zhuǎn)換功能。A/D變換由SDA80D51內(nèi)嵌12位A/D變換器實(shí)現(xiàn),采樣頻率固定為8 kHz。

2.1.2 特征參數(shù)提取

特征參數(shù)提取基于語(yǔ)音幀,采用分幀提取特片。先對(duì)語(yǔ)音信號(hào)進(jìn)行重疊分幀,前一幀和后一幀重疊一半(幀信號(hào)重疊是體現(xiàn)相鄰兩幀數(shù)據(jù)之間的相關(guān)性),幀長(zhǎng)為25 ms,對(duì)每幀提取一次語(yǔ)音特片。

MFCC參數(shù)屬于感知頻域倒譜參數(shù),反映了語(yǔ)音信號(hào)短時(shí)幅度譜的特征。p維MFCC參數(shù)的具體計(jì)算提取過程如下:

(1)用DFFT對(duì)每幀s(n:m)計(jì)算線性頻譜,計(jì)算頻譜模的平方為功率譜;

(2)功率譜經(jīng)過 Mel 濾波器組獲得到D個(gè)參數(shù)X(i),D是Mel濾波器組中三角形濾波器的數(shù)量;

(3)對(duì)X(i)做對(duì)數(shù)運(yùn)算和離散余弦變換,余弦變換計(jì)算公式如下:

式中的Y(i)是第i個(gè)Mel濾波器對(duì)數(shù)能量的輸出,i=1,2,…,D。

2.1.3 HMM語(yǔ)音識(shí)別算法

隱馬爾可夫算法采用概率統(tǒng)計(jì)模型描述語(yǔ)音信號(hào),HMM模型建立在Markov 鏈基礎(chǔ)上,使用 MarKov 鏈來(lái)模擬語(yǔ)音信號(hào)統(tǒng)計(jì)特性的變化。HMM模型為雙重隨機(jī)過程,其一是Markov鏈,由(π,A)描述狀態(tài)的轉(zhuǎn)移,輸出為狀態(tài)序列;另一個(gè)是隨機(jī)過程,由B描述,在統(tǒng)計(jì)意義上B反映了狀態(tài)和觀察值之間的對(duì)應(yīng)關(guān)系,輸出為觀察值矢量序列。Markov鏈中狀態(tài)和時(shí)間參數(shù)都是離散的Markov 過程。

Viterbi 算法是一種幀同步動(dòng)態(tài)規(guī)整算法,在給定觀察值序列和模型時(shí),Viterbi算法給出了一個(gè)概率密度P(Q,O|λ)最大的狀態(tài)序列。Viterbi算法包括初始化、遞推、終止、路徑回溯和確定最佳狀態(tài)序列。

對(duì)于語(yǔ)音處理而言,因Q的變化,P(Q,O|λ)取值范圍很大,而P(Q,O|λ)的最大值占了全部P(Q,O|λ)的很大的成分,所以可以用Viterbi算法來(lái)計(jì)算P(O|λ)。

2.2 控制模塊

控制模塊的主要功能是:在AT89S51查詢到語(yǔ)音詞條信號(hào)后,查表獲得詞條編碼,根據(jù)編碼判斷對(duì)應(yīng)按鍵是長(zhǎng)按或短按,分別進(jìn)入相應(yīng)的子程序處理。在子程序中,輸出語(yǔ)音命令所對(duì)應(yīng)的I/O控制信號(hào)驅(qū)動(dòng)繼電器吸合模擬按鍵或編碼開關(guān)動(dòng)作,并及時(shí)復(fù)位I/O口??刂颇K還具有完全兼容手動(dòng)控制的功能,在語(yǔ)音控制操作的同時(shí)也可以進(jìn)行手動(dòng)操作,手動(dòng)的優(yōu)先級(jí)高于語(yǔ)音命令,這樣可以避免語(yǔ)音控制和手動(dòng)控制之間沖突。

控制模塊部分程序代碼如下:

void main()
{…… //初始化
while(1)
{…… //初始化
while(P0 == 0x00) //等待語(yǔ)音信號(hào)
{ WDTRST=0x1E;
WDTRST=0xE1; //WD指令
YXSY=0;}
YXSY = 1;
if(date != P0)
{ delayms(6); //延時(shí)函數(shù)
date = P0;
if(date==1 || date==2) //開機(jī)、靜音
{ PWR = 0; //電源按鈕按下
delayms(200);
PWR = 1;} //電源按鈕松開
……
P1 = 0xff;
P2 = 0xff;}}}

3 系統(tǒng)實(shí)測(cè)結(jié)果

本系統(tǒng)在江淮同悅SL1102C1型車載音響上進(jìn)行了非特定人語(yǔ)音識(shí)別率和模擬開關(guān)動(dòng)作準(zhǔn)確率測(cè)試。由于汽車音響的語(yǔ)音詞條為2~4個(gè)字,語(yǔ)音識(shí)別率實(shí)驗(yàn)內(nèi)容為車載音響常用2字詞條指令18條、3字詞條指令12條、4字詞條指令10條,實(shí)驗(yàn)對(duì)象為6人4男、2女(普通話和方言),實(shí)驗(yàn)環(huán)境為實(shí)驗(yàn)室環(huán)境。為了提高系統(tǒng)的識(shí)別率,系統(tǒng)采用奧林巴斯 ME52定向麥克,提高了麥克接收范圍,系統(tǒng)測(cè)試結(jié)果如表1所示。

由表1可知,系統(tǒng)的識(shí)別率與語(yǔ)音指令詞條字?jǐn)?shù)、麥克接收距離、說話人方言有關(guān)。男聲和女聲的識(shí)別率接近。

在系統(tǒng)控制電路實(shí)驗(yàn)中,模擬開關(guān)動(dòng)作達(dá)到了較高的準(zhǔn)確率,測(cè)試結(jié)果為98%以上,只要控制程序運(yùn)行正常,各路繼電器就能按照程序安排執(zhí)行閉合和斷開模擬手動(dòng)開關(guān)操作。

實(shí)現(xiàn)汽車電器的語(yǔ)音控制是未來(lái)車載電器的發(fā)展趨勢(shì),越來(lái)越多的解決方案被不斷提出和驗(yàn)證。本文提出的設(shè)計(jì)是在SL1102C1型車載音響上使用SDA80D51芯片,實(shí)現(xiàn)了車載音響非特定人的語(yǔ)音識(shí)別與控制。該設(shè)計(jì)得到的樣機(jī)有較高的識(shí)別率,工作穩(wěn)定、可擴(kuò)展性強(qiáng),達(dá)到預(yù)期的設(shè)計(jì)目標(biāo),整個(gè)設(shè)計(jì)方案和實(shí)現(xiàn)方法是可行的。由于語(yǔ)音識(shí)別率隨著環(huán)境、說話人不同而變化,雖然HMM算法在噪聲很少的環(huán)境下可以獲得很高的識(shí)別率,但當(dāng)測(cè)試語(yǔ)音或者環(huán)境中含有不同程度的噪聲污染時(shí),語(yǔ)音識(shí)別系統(tǒng)的性能會(huì)有所下降。提高系統(tǒng)的抗噪性和魯棒性是語(yǔ)音識(shí)別系統(tǒng)走向?qū)嵱没年P(guān)鍵之一。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

在嵌入式系統(tǒng)開發(fā)中,程序燒錄是連接軟件設(shè)計(jì)與硬件實(shí)現(xiàn)的關(guān)鍵環(huán)節(jié)。當(dāng)前主流的單片機(jī)燒錄技術(shù)已形成ICP(在電路編程)、ISP(在系統(tǒng)編程)、IAP(在應(yīng)用編程)三大技術(shù)體系,分別對(duì)應(yīng)開發(fā)調(diào)試、量產(chǎn)燒錄、遠(yuǎn)程升級(jí)等不同場(chǎng)景。...

關(guān)鍵字: 單片機(jī) ISP ICP IAP 嵌入式系統(tǒng)開發(fā)

至于功能,首先這肯定是音響。其次,它是智能的,和普通的有很大差別。舉個(gè)栗子,以前的手機(jī)和智能手機(jī)一樣。

關(guān)鍵字: 音響

?在極低光照環(huán)境下顯著提升圖像質(zhì)量,超越傳統(tǒng)計(jì)算機(jī)視覺技術(shù)。

關(guān)鍵字: AI ISP

當(dāng)前端側(cè)AI正在快速落地推進(jìn),而智能車載領(lǐng)域尤為活躍,特別是在國(guó)內(nèi)市場(chǎng),智能車載的快速發(fā)展引人注目。據(jù)Yole預(yù)測(cè),2023年至2029年,全球車載攝像頭市場(chǎng)規(guī)模將從57億美元增至84億美元。但目前車載視覺系統(tǒng)方案尚未統(tǒng)...

關(guān)鍵字: ISP AI視覺 飛凌微 圖像傳感器 CMOS SoC

隨著數(shù)字成像技術(shù)的飛速發(fā)展,圖像信號(hào)處理器(ISP, Image Signal Processor)在相機(jī)系統(tǒng)中的作用愈發(fā)重要。ISP主要負(fù)責(zé)對(duì)前端圖像傳感器輸出的信號(hào)進(jìn)行后期處理,以提升圖像質(zhì)量,使其在不同光學(xué)條件下都...

關(guān)鍵字: ISP ISP架構(gòu)

北京2024年8月13日 /美通社/ -- 8月12日,2024浪潮信息區(qū)域ISP伙伴戰(zhàn)略簽約儀式成功舉辦,全國(guó)33家億級(jí)和千萬(wàn)級(jí)元腦區(qū)域伙伴與浪潮信息簽署戰(zhàn)略合作協(xié)議。本次簽約共覆蓋全國(guó)13個(gè)省區(qū),涉及互聯(lián)網(wǎng)、電信、金...

關(guān)鍵字: ISP 模型 人工智能 開發(fā)平臺(tái)

8月12日消息,根據(jù)洛圖科技(RUNTO)的報(bào)告,2024年上半年,中國(guó)智能音箱市場(chǎng)在線上和線下全渠道的銷量共計(jì)達(dá)到805.5萬(wàn)臺(tái)。

關(guān)鍵字: 曼卡頓 音響

巡演首度于室內(nèi)場(chǎng)館開辦 銀河綜藝館首位歌手開唱六場(chǎng) 澳門2024年8月1日 /美通社/ -- "巨肺天后"G.E.M.鄧紫棋第四次個(gè)人大型巡回演唱會(huì)——《I AM GLORIA》8月2日(本周五)晚...

關(guān)鍵字: BSP 音響 NET 流媒體

降低成本-為高精度聲學(xué)測(cè)量產(chǎn)線設(shè)計(jì)

關(guān)鍵字: 麥克風(fēng) EQset 技術(shù) 音響

該方案基于“內(nèi)容服務(wù)+硬件終端”集成一體模式,致力于打造環(huán)繞聲/全景聲內(nèi)容端到端一體化整體解決方案。

關(guān)鍵字: 音響
關(guān)閉