日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 消費(fèi)電子 > 消費(fèi)電子
[導(dǎo)讀]引言基于內(nèi)容的音頻檢索指通過(guò)音頻特征分析,對(duì)不同音頻數(shù)據(jù)賦以不同語(yǔ)義,使具有相同語(yǔ)義的音頻在聽(tīng)覺(jué)上保持相似。該技術(shù)在許多領(lǐng)域都有極大應(yīng)用價(jià)值。在檢索系統(tǒng)中一種常見(jiàn)情形是將安靜環(huán)境下訓(xùn)練的模型應(yīng)用于實(shí)際

引言

基于內(nèi)容的音頻檢索指通過(guò)音頻特征分析,對(duì)不同音頻數(shù)據(jù)賦以不同語(yǔ)義,使具有相同語(yǔ)義的音頻在聽(tīng)覺(jué)上保持相似。該技術(shù)在許多領(lǐng)域都有極大應(yīng)用價(jià)值。在檢索系統(tǒng)中一種常見(jiàn)情形是將安靜環(huán)境下訓(xùn)練的模型應(yīng)用于實(shí)際有背景噪聲的環(huán)境。尤其在哼唱輸入的情況下,噪聲不可避免,因此噪聲背景環(huán)境中的音頻識(shí)別技術(shù)一直備受關(guān)注。本文給出一個(gè)將音頻增強(qiáng)和音頻檢索系統(tǒng)相連接的抗噪聲音頻檢索系統(tǒng),重點(diǎn)分析基于內(nèi)容的音頻檢索系統(tǒng)的前端抗噪技術(shù)。

2  系統(tǒng)平臺(tái)的建立

基于內(nèi)容的音頻檢索系統(tǒng)運(yùn)用多媒體信息處理技術(shù),結(jié)合人感知心理研究和模式識(shí)別技術(shù)實(shí)現(xiàn)音頻檢索,包括音頻分割、特征提取和索引檢索等關(guān)鍵步驟。在提交哼唱式音頻過(guò)程中不可避免地會(huì)受到來(lái)自周?chē)h(huán)境和傳輸媒介引入的噪聲、設(shè)備內(nèi)部電噪聲的干擾。這些干擾將使檢索系統(tǒng)的性能惡化。因此,必須對(duì)帶噪音頻進(jìn)行抗噪處理。音頻檢索系統(tǒng)首先是建立數(shù)據(jù)庫(kù),對(duì)音頻數(shù)據(jù)進(jìn)行特征提取。音頻檢索主要采用哼唱查詢方式,用戶通過(guò)查詢界面哼入查詢信息,然后提交查詢。在進(jìn)行屬性特征提取前通過(guò)前端抗噪模塊增強(qiáng)哼唱語(yǔ)音。接著系統(tǒng)對(duì)哼唱音頻提取特征,然后檢索引擎對(duì)特征矢量進(jìn)行匹配,按相關(guān)性排序后通過(guò)查詢接口返回給用戶。圖1為抗噪聲檢索系統(tǒng)原理框圖。

3  音頻抗噪技術(shù)分析

3.1  語(yǔ)音增強(qiáng)算法分類

系統(tǒng)前端輸入信號(hào)通常是哼唱輸入,語(yǔ)音頻段可以采用語(yǔ)音增強(qiáng)技術(shù)。語(yǔ)音增強(qiáng)是指為了提高受噪聲污染的語(yǔ)音信號(hào)的質(zhì)量而對(duì)含噪語(yǔ)音所做的處理,主要用于從帶噪語(yǔ)音信號(hào)中提取純凈的原始音頻或原始語(yǔ)音參數(shù)。根據(jù)不同的標(biāo)準(zhǔn),語(yǔ)音增強(qiáng)算法有多種分類方法。

從信號(hào)輸入的通道數(shù)分為單通道的語(yǔ)音增強(qiáng)算法與多通道的語(yǔ)音增強(qiáng)算法。單通道語(yǔ)音系統(tǒng)下語(yǔ)音與噪聲同時(shí)存在于一個(gè)通道中,語(yǔ)音信息與噪聲信息必須從同一個(gè)信號(hào)中得出。常用方法包括譜減法、信號(hào)統(tǒng)計(jì)模型方法、聽(tīng)覺(jué)掩蔽算法、維納濾波方法、信號(hào)子空間算法等。多通道語(yǔ)音增強(qiáng)算法則采用麥克風(fēng)陣列獲取信號(hào)數(shù)據(jù),它可充分利用陣列信號(hào)的信號(hào)源方向、說(shuō)話人位置等空間特性,結(jié)合語(yǔ)音信號(hào)與噪聲的特征實(shí)現(xiàn)語(yǔ)音增強(qiáng)。代表性的算法有自適應(yīng)波束形成算法、結(jié)合波束形成與后濾波算法及各種基于信號(hào)子空間、統(tǒng)計(jì)模型算法等。

另一種分類方法是根據(jù)對(duì)語(yǔ)音信號(hào)處理方式的不同,將語(yǔ)音增強(qiáng)算法分為時(shí)域語(yǔ)音增強(qiáng)算法和變換域語(yǔ)音增強(qiáng)算法兩大類。時(shí)域語(yǔ)音增強(qiáng)是在時(shí)間域直接處理帶噪語(yǔ)音來(lái)恢復(fù)純凈語(yǔ)音,利用語(yǔ)音信號(hào)在時(shí)域中的短時(shí)平穩(wěn)特性、相關(guān)特性等來(lái)研究具有針對(duì)性的噪聲消除技術(shù),其代表性算法有最大后驗(yàn)概率估計(jì)法、卡爾曼濾波法、梳狀濾波器法、子空間的方法、自適應(yīng)噪聲抵消算法、語(yǔ)音生成模型等。變換域語(yǔ)音增強(qiáng)需一個(gè)適當(dāng)?shù)淖儞Q將語(yǔ)音信號(hào)轉(zhuǎn)換到變換域中,然后針對(duì)變換域中的帶噪語(yǔ)音分量的特性設(shè)計(jì)算法恢復(fù)純凈語(yǔ)音分量,最后通過(guò)相應(yīng)的反變換獲得純凈語(yǔ)音信號(hào)在時(shí)域中的估計(jì)。其常用變換有離散傅里葉變換、離散余弦變換及K-L變換和小波變換等,代表性算法有譜減法、維納濾波法、短時(shí)譜幅度的MMSE估計(jì)、自適應(yīng)濾波法等、聽(tīng)覺(jué)掩蔽效應(yīng)增強(qiáng)算法,小波變換算法、基于頻域盲源分離的語(yǔ)音增強(qiáng)技術(shù)等。還有一些新方法,如神經(jīng)網(wǎng)絡(luò)、分形理論等。

3.2 系統(tǒng)抗噪算法的確定

在基于內(nèi)容的音頻檢索系統(tǒng)中,用戶通過(guò)哼唱等方式輸入檢索信息,基于單麥克風(fēng)輸入的單通道語(yǔ)音增強(qiáng)算法是一種簡(jiǎn)便、實(shí)用的形式。變換域語(yǔ)音增強(qiáng)算法可充分利用變換域中語(yǔ)音與背景噪聲較其在時(shí)域中更為顯著的特征區(qū)別,且能有效消除語(yǔ)音信號(hào)在時(shí)域中存在的相關(guān)特性,因此其對(duì)帶噪語(yǔ)音的增強(qiáng)效果要優(yōu)于時(shí)域語(yǔ)音增強(qiáng)算法。因此系統(tǒng)適合采用譜減法、聽(tīng)覺(jué)掩蔽算法、維納濾波方法、信號(hào)子空間算法。

維納濾波法能改善平穩(wěn)段的譜估計(jì),殘留噪聲類似于白噪聲,降低音樂(lè)噪聲的干擾,但算法復(fù)雜度較大,適用于對(duì)實(shí)時(shí)性要求不高的場(chǎng)合。聽(tīng)覺(jué)掩蔽算法可減少不必要的語(yǔ)音失真,實(shí)際應(yīng)用中常只能用帶噪語(yǔ)音估計(jì)掩蔽閾值,則估計(jì)結(jié)果誤差較大,對(duì)噪聲估計(jì)要求較高。信號(hào)子空間算法能有效去除帶噪語(yǔ)音中的背景噪聲,使語(yǔ)音的質(zhì)量和可懂度都有較大提高,但計(jì)算量較大。譜減法算法簡(jiǎn)單,算法復(fù)雜度低,實(shí)現(xiàn)較容易,能夠最大程度上滿足實(shí)時(shí)性要求,但會(huì)引入較大音樂(lè)噪聲,適合在平穩(wěn)噪聲環(huán)境和對(duì)實(shí)時(shí)性要求較高的場(chǎng)合使用。由于本系統(tǒng)為實(shí)時(shí)檢索系統(tǒng),對(duì)實(shí)時(shí)性和快速性的要求較高,因此這里采用譜減法。

4  基于譜減法的減噪技術(shù)

4.1  譜減法的基本原理

譜減法就是在頻域?qū)⒃肼暤念l譜分量從帶噪語(yǔ)音信號(hào)的頻譜中減去。其基本思想是:在假定加性高斯噪聲與短時(shí)平穩(wěn)的語(yǔ)音信號(hào)獨(dú)立的條件下,從帶噪語(yǔ)音信號(hào)的功率譜中減去噪聲的功率譜,從而得到增強(qiáng)后較為純凈的語(yǔ)音頻譜。其基本原理框圖如圖2所示,圖1中,s(n)表示純凈語(yǔ)音,d(n)表示加性噪聲,r(n)=s(n)+d(n)表示帶噪語(yǔ)音信號(hào),Yk和Sk(k=0,1,2…)分別表示帶噪語(yǔ)音信號(hào)和純凈語(yǔ)音的頻譜系數(shù),λn(k)表示噪聲的功率譜系數(shù)。

式中,α和β為參數(shù)。當(dāng)α=1,β=1時(shí),為幅度譜減法形式。當(dāng)α=2,β=1時(shí),為功率譜減法形式。

該譜減法稱為傳統(tǒng)譜相減法。它基于人耳對(duì)聲音相位不敏感特性,從含噪語(yǔ)音中減去估計(jì)噪聲而達(dá)到語(yǔ)音增強(qiáng)的目的,直觀簡(jiǎn)單,但容易產(chǎn)生“音樂(lè)噪聲”,因此實(shí)際應(yīng)用中常采用譜減法的改進(jìn)算法。

4.2  譜減法的改進(jìn)算法

用功率譜減法處理語(yǔ)音信號(hào)后,在頻域中仍殘留有噪聲,要濾除或減少這些噪聲,可適當(dāng)?shù)亩鄿p去噪聲分量,使殘留噪聲在幅值上減少,從而降低噪聲的影響,即過(guò)減法。此時(shí)式(1)取β>1,這樣語(yǔ)音失真可能會(huì)增大。因此,通過(guò)噪聲估計(jì)來(lái)調(diào)整和確定β的取值。β值的取值原則:對(duì)信噪比低的帶噪語(yǔ)音,噪聲的方差大,β可適當(dāng)大些;對(duì)信噪比高的帶噪語(yǔ)音,β取值則可小些。因?yàn)樵肼曌V的估計(jì)是平均值,所以當(dāng)前幀的噪聲譜實(shí)際上與估計(jì)值有偏差,因此,經(jīng)譜減法計(jì)算的語(yǔ)音譜值可能是負(fù)值,一般則設(shè)結(jié)果設(shè)為零,即采用半波整流法,還可采用殘余噪聲衰減法,噪聲殘留的幅值介于零和整個(gè)非語(yǔ)音活動(dòng)期最大噪聲殘留幅值之間,由于殘留噪聲的隨機(jī)性,在每個(gè)頻點(diǎn)上其振幅值隨不同分析幀而隨機(jī)波動(dòng),因此在給定頻點(diǎn)上通過(guò)用相鄰幀的頻點(diǎn)振幅最小值代替當(dāng)前幀的振幅而壓縮殘留噪聲。這樣就形成改進(jìn)型譜減法的系統(tǒng),能有效實(shí)現(xiàn)前端減噪。

5  結(jié)束語(yǔ)

基于內(nèi)容的音頻檢索技術(shù)適應(yīng)性更強(qiáng),具有廣泛的應(yīng)用價(jià)值,具有噪聲魯棒性的檢索系統(tǒng)在實(shí)際應(yīng)用中不可或缺。本文給出一個(gè)將音頻增強(qiáng)和音頻檢索系統(tǒng)級(jí)聯(lián)的抗噪聲音頻檢索系統(tǒng),從不同角度分析語(yǔ)音增強(qiáng)算法,并通過(guò)比較選取譜減法作為基于內(nèi)容的音頻檢索系統(tǒng)的前端抗噪技術(shù),同時(shí)給出譜減法的改進(jìn)算法。

 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

美國(guó)紐約州阿蒙克2022年10月20日 /美通社/ -- IBM(NYSE: IBM)發(fā)布 2022 年第三季度業(yè)績(jī)報(bào)告。 IBM 董事長(zhǎng)兼首席執(zhí)行官 Arvind Kri...

關(guān)鍵字: IBM 軟件 BSP 云平臺(tái)

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險(xiǎn)積極籌備個(gè)人養(yǎng)老金的產(chǎn)品設(shè)計(jì)和系統(tǒng)開(kāi)發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動(dòng)商業(yè)養(yǎng)老保險(xiǎn)、個(gè)人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險(xiǎn)等產(chǎn)品供給。 搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字: 溫度 BSP 東風(fēng) 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元,承載著生存與活動(dòng)的最基本功能。而對(duì)于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對(duì)于空間和生活深層關(guān)系的思考,同時(shí)也塑造著人與空間的新型連接...

關(guān)鍵字: 溫度 BSP 智能化 進(jìn)程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績(jī)預(yù)告。今年前三季度,公司預(yù)計(jì)實(shí)現(xiàn)營(yíng)業(yè)收入7.54億元至8.33億元,同比增長(zhǎng)60.24%至77.03%;歸母凈利潤(rùn)預(yù)計(jì)為1.73億...

關(guān)鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級(jí)企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠(chéng)健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國(guó)軟件定義存儲(chǔ)及超融合市場(chǎng)研究報(bào)告》,報(bào)告顯示:2022年上半年浪潮超融合銷(xiāo)售額同比增長(zhǎng)59.4%,近5倍于...

關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團(tuán)成立60周年的紀(jì)念日。趁著首都銀行集團(tuán)成立60周年與首都銀行(中國(guó))在華深耕經(jīng)營(yíng)12年的“大日子”,圍繞作為外資金融機(jī)構(gòu)對(duì)在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字: 數(shù)字化 BSP 供應(yīng)鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會(huì)社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運(yùn)國(guó)際物流有限公司(Nipp...

關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國(guó)進(jìn)出口商品交易會(huì)("廣交會(huì)")于"云端"開(kāi)幕。本屆廣交會(huì)上高新技術(shù)企業(yè)云集,展出的智能產(chǎn)品超過(guò)140,...

關(guān)鍵字: 中國(guó)智造 BSP 手機(jī) CAN

要問(wèn)機(jī)器人公司哪家強(qiáng),波士頓動(dòng)力絕對(duì)是其中的佼佼者。近來(lái)年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開(kāi)發(fā)的機(jī)器人會(huì)后空翻,自主爬樓梯等。這不,波士頓動(dòng)力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻,表演的機(jī)器人包括...

關(guān)鍵字: 機(jī)器人 BSP 工業(yè)機(jī)器人 現(xiàn)代汽車(chē)

消費(fèi)電子

96016 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉