[導(dǎo)讀]為提高應(yīng)用于移動終端的視頻解碼器的解碼速度,根據(jù)DSP-BF533的特點,給出一個新型的優(yōu)化方案,把解碼執(zhí)行程序分成數(shù)據(jù)解碼和準(zhǔn)備、高級解碼、DMA 3個軟件模塊,按照一定的規(guī)則并行執(zhí)行以上3個模塊,顯著提高圖像解碼速度。
1 引言
H.264是在ITU-T和ISO/IEC等組織先前制定的編碼標(biāo)準(zhǔn)的基礎(chǔ)上提出的,它與現(xiàn)今國際上大多數(shù)的視頻壓縮標(biāo)準(zhǔn)一樣,例如H.264、H.263、MPEG-2、MPEG-4都是采用基于塊的離散余弦變換與量化相結(jié)合的混合編碼技術(shù)?;诜謮K的離散余弦變換具有壓縮率高,計算復(fù)雜度低。易于實現(xiàn)等優(yōu)點。H.264具有以下特點:比H.263+和MPEG-4(SP)減小50%碼率;對信道時延的適應(yīng)性較強;提高差錯恢復(fù)能力;復(fù)雜度可分級設(shè)計,以適應(yīng)不同復(fù)雜度的應(yīng)用;引入先進技術(shù),包括4×4整數(shù)變換、空域內(nèi)的幀內(nèi)預(yù)測、1/4像素精度的運動估計新技術(shù)帶來較高的編碼比,同時大大提高算法的復(fù)雜度。因此,H.264技術(shù)已廣泛應(yīng)用于高清視頻的編解碼設(shè)備。
視頻解碼算法的熵解碼、反量化、反變換、幀內(nèi)預(yù)測、幀間亮度插值、幀間色度插值以及去方塊濾波等稱為核心模塊,減少這些核心模塊的等待時間對加快解碼器的工作具有重要意義。本文在DSP-BF533平臺上,利用軟件流水的思想,針對軟件模塊間協(xié)同工作提出一種新型的優(yōu)化設(shè)計方案。
2 H.264解碼器原理
H.264編碼器結(jié)構(gòu)系統(tǒng)由以下幾部分組成:網(wǎng)絡(luò)數(shù)據(jù)提取層(NAL)、VAL緩存器、熵解碼、反掃描反量化反變換、幀間預(yù)測、幀內(nèi)預(yù)測、圖像參考幀緩存器、去方塊濾波,如圖1所示。首先從碼流中獲取NAL單元數(shù)據(jù),通過RBSP解析出序列參數(shù)集、圖像參數(shù)集和圖像數(shù)據(jù)。把數(shù)據(jù)和參數(shù)存儲在VCL緩存器中,然后再在視頻編碼層(VCL Table)中熵解碼。熵解碼模塊(VLD)解析所有參數(shù)和參考圖像索引等,提供各種控制信息和殘差數(shù)據(jù)。通過反量化反變化先將一維數(shù)據(jù)轉(zhuǎn)換成二維數(shù)組或矩陣,再通過逆掃描過程將變換系數(shù)量化值序列映射到對應(yīng)坐標(biāo),主要有逆zig_zag掃描和逆場掃描兩種模式。之后讀取數(shù)據(jù)讀取并進行判斷、幀內(nèi)預(yù)測和幀間預(yù)測,再綜合所有預(yù)測和反變換反量化的數(shù)據(jù),最后進行方塊濾波,這樣能夠大大減輕因預(yù)測、量化而產(chǎn)生的塊效應(yīng),從而獲得更好的主觀圖像質(zhì)量和客觀性能。同時還可選取已恢復(fù)的圖像作為后續(xù)處理圖像的參考幀。
3 DSP-BF533的解碼器設(shè)計與優(yōu)化
3.1 解碼器軟件設(shè)計框圖
根據(jù)DSP-BF533的內(nèi)含存儲器控制器(DMA)的特點,設(shè)計一個整合DMA的解碼流程,如圖2所示。把兩個與DMA有關(guān)的步驟添加到普通解碼器中,步驟1是從片外存儲器中讀取數(shù)據(jù);步驟2是將已處理好的數(shù)據(jù)輸出到片外存儲器。
從圖2中可看到具體流程:①對下一個宏塊進行頂部數(shù)據(jù)分割,分割出殘差數(shù)據(jù)之前的數(shù)據(jù)。同時為解碼提供幀內(nèi)預(yù)測、參考圖像索引和向量;②啟動DMA讀取分割出來的數(shù)據(jù),其中也要讀入解碼參考圖像索引和向量;③對圖像數(shù)據(jù)進行幀內(nèi)預(yù)測;④利用底部分割讀入的映射數(shù)據(jù),進行反變換和反量化;⑤通過濾波重建圖像;⑥通過DMA把圖像數(shù)據(jù)輸出到片外和片內(nèi)存儲器;⑦對下一個宏塊進行底部數(shù)據(jù)分割,然后取出映射數(shù)據(jù)供下一個宏塊解碼使用嘲。
為了避免DSP內(nèi)核等待DMA讀人數(shù)據(jù),把解碼數(shù)據(jù)預(yù)先從宏塊中分割成頂部數(shù)據(jù)和底部數(shù)據(jù),頂部數(shù)據(jù)包括殘差數(shù)據(jù)之前的數(shù)據(jù),剩下的數(shù)據(jù)就是底部數(shù)據(jù)。如果有P幀到來時數(shù)據(jù)已事先分割,然后DMA啟動。當(dāng)DSP內(nèi)核在解碼當(dāng)前宏塊時,DMA讀入下一個宏塊。如果在當(dāng)前宏塊參考數(shù)據(jù)需要利用時,此數(shù)據(jù)解碼完成后還可通過DMA輸入到片內(nèi)存儲器。因為當(dāng)前宏塊頂部數(shù)據(jù)對下一個宏塊的濾波沒有參考價值,所以這些宏塊頂部數(shù)據(jù)就被DMA傳送到外部存儲器。該設(shè)計第1個宏塊未進入解碼過程,因為初始狀態(tài)時一系列參考圖像和參數(shù)都沒有設(shè)定,所以第1個宏塊只是設(shè)定解碼器參考圖像和參數(shù)行初始化,為下一宏塊解碼使用。宏塊數(shù)據(jù)的分割和DMA的數(shù)據(jù)讀入都可在解碼中并行執(zhí)行,即執(zhí)行當(dāng)前宏塊時可設(shè)定下一個宏塊所需參數(shù)以及讀入解碼數(shù)據(jù),這樣可減少各模塊間的等待時間,提高工作效率。上述可并行執(zhí)行的過程如圖2中以橢圓方框表示。[!--empirenews.page--]
3.2 軟件流水新型算法
很多設(shè)計中,解碼參數(shù)準(zhǔn)備、解碼和DMA的數(shù)據(jù)輸出等過程按順序串行執(zhí)行的,該設(shè)計有條理安排這3個過程并行執(zhí)行,充分利用DSP-BF533的指令并行執(zhí)行特點,減少各軟件模塊之間的等待時間。
下面以4×4的宏塊矩陣為例,首先給4×4矩陣標(biāo)上4行4列的坐標(biāo),然后把程序處理分成5個階段.其狀態(tài)分別按順序?qū)?yīng)1、2、4、8、16,以便狀態(tài)機運算,如表1所列。CAVLC為解析讀入的數(shù)據(jù)并為后續(xù)的圖像整合重建提供參數(shù)和參考圖像等數(shù)據(jù)的過程,hl_decode是高級解碼過程,即根據(jù)準(zhǔn)備好的條件綜合重建圖像的過程。DMA是對已解碼數(shù)據(jù)的傳送過程。對照表1和表2分析:當(dāng)新的一幀圖像到來時,當(dāng)前狀態(tài)標(biāo)號為1,此時只有CAVLC執(zhí)行;當(dāng)運行到坐標(biāo)為x=1,y=0時,進入第2個狀態(tài),當(dāng)前狀態(tài)標(biāo)號為2,CAVLC和hl_decode并行執(zhí)行;當(dāng)運行到坐標(biāo)x=1,y=1時,進入第3個狀態(tài),標(biāo)號為4,3個模塊同時并行執(zhí)行;到坐標(biāo)y>4時,進入第4個狀態(tài),標(biāo)號為8,只有hl_decode和DMA兩個并行執(zhí)行,CAVLC已經(jīng)完成對所有宏塊的解碼前準(zhǔn)備工作;再判斷x>0,進入第5個狀態(tài)。標(biāo)號為16,此時只運行DMA模塊。
因此,解碼第1個宏塊時處在狀態(tài)1,之后連續(xù)4個宏塊是狀態(tài)2,再連續(xù)11個宏塊進入狀態(tài)3,隨后1個宏塊是狀態(tài)4,最后3個宏塊進入狀態(tài)5。
如果假設(shè)CAVLC的執(zhí)行時間A,hl_decode的執(zhí)行時間B,DMA的執(zhí)行時間C,普通算法的執(zhí)行總時間T=16A+16B+16C;本文提出的方法時間T2=A+16B+3C,因此,明顯縮短了程序執(zhí)行時間。
4 測試結(jié)果
在DSP-BF533測試平臺上測試Claire.cif和Pairs.cif,從測試分析的結(jié)果看來:優(yōu)化后的結(jié)果提高解碼速率,達到實時應(yīng)用要求。結(jié)果如表3所列。
5 結(jié)束語
針對移動視頻終端應(yīng)用,根據(jù)DSP的特點,提出一個新型的軟件流水算法,使得模塊問的協(xié)作更緊密,更好利用程序運行的空余時間,減少程序等待時間,提高解碼速率。實驗測試該程序已達到對CIF圖像的實時解碼要求,以后進一步優(yōu)化,以達到更高更可靠的解碼效率,使得基于DSP-BF533的設(shè)計完全可擴展到從無線3G網(wǎng)絡(luò)、數(shù)字電視,到IP網(wǎng)絡(luò),媒體的存儲格式等不同領(lǐng)域。
本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
系統(tǒng)參數(shù)設(shè)置窗口用于設(shè)置系統(tǒng)整體和各個模塊的參數(shù),一般情況下,不需要對整個系統(tǒng)默認參數(shù)進行改動設(shè)置,只需要對軟件的一些常用參數(shù)進行設(shè)置,比如光標(biāo)設(shè)置,封裝庫指定等。已達到使軟件快速高效地配置資源的目的,從而更高效地使用軟...
關(guān)鍵字:
參數(shù)設(shè)置
模塊
軟件
魁北克市, Oct. 20, 2022 (GLOBE NEWSWIRE) -- 最靈活、最穩(wěn)健、最精確的高級駕駛輔助系統(tǒng)(ADAS)和自動駕駛(AD)軟件技術(shù)全球領(lǐng)先提供商LeddarTech?很高興宣布將參加在密歇根州...
關(guān)鍵字:
汽車
LED
軟件
數(shù)據(jù)融合
美國紐約州阿蒙克2022年10月20日 /美通社/ -- IBM(NYSE: IBM)發(fā)布 2022 年第三季度業(yè)績報告。 IBM 董事長兼首席執(zhí)行官 Arvind Kri...
關(guān)鍵字:
IBM
軟件
BSP
云平臺
高盛集團(Goldman Sachs Group)周二證實了一項全面重組計劃,這是該公司歷史上最大的改革舉措之一。高盛將把其交易和投行業(yè)務(wù)合并為一個部門,使該行從四個部門縮減至三個部門,縮減進軍零售銀行業(yè)務(wù)的努力,專注于...
關(guān)鍵字:
DMA
GROUP
GO
AN
SWM32S單片機有1個SDIO接口,支持多媒體卡(MMC)、SD 存儲卡、SDIO 卡等設(shè)備,可以使用軟件方法或者 DMA 方法(SDIO 模塊內(nèi)部 DMA,與芯片 DMA 模塊無關(guān))進行數(shù)據(jù)傳輸。
關(guān)鍵字:
SWM32S單片機
SDIO
DMA
標(biāo)普500指數(shù)今年迄今為止下跌22.7%,但高盛(Goldman Sachs)策略師認為估值依然太高。摩根士丹利旗下的Morgan Stanley Wealth Management稱,面對高通脹環(huán)境下的利率大幅上升,股...
關(guān)鍵字:
DMA
MANAGEMENT
高通
ST
高盛集團(Goldman Sachs Group)計劃將其最大的業(yè)務(wù)合并為三個部門,進行該華爾街公司歷史上最大的一次業(yè)務(wù)重組。高盛將把其旗艦投行業(yè)務(wù)和交易業(yè)務(wù)合并為一個部門,同時將資產(chǎn)管理和財富管理業(yè)務(wù)合并為另一個部門。...
關(guān)鍵字:
APPLE
DMA
GENERAL
GREEN
北京2022年10月17日 /美通社/ -- "天下武功、唯快不破",數(shù)字經(jīng)濟時代尤甚。 數(shù)據(jù)極富價值,堪比新時代的石油。數(shù)字經(jīng)濟時代,數(shù)據(jù)價值如何快速、高效地釋放顯得尤為重要。自20...
關(guān)鍵字:
軟件
IO
SSD
CPU
最近呢,在工作期間,確實被這種問題給困擾了,如何有效的管理電腦自啟動的程序,相信大多數(shù)人都沒有搞透徹,下面主要從Windows和Linux兩個系統(tǒng)來進行分享,喜歡的記得點贊和再看哦!
關(guān)鍵字:
自啟
電腦
軟件
濟南2022年10月14日 /美通社/ -- 近日,浪潮新基建成功通過CMMI(軟件能力成熟度集成模型)三級認證并正式獲得資質(zhì)證書。繼2021年組建后,僅一年時間就斬獲全球軟件領(lǐng)域最權(quán)威的認證之一,標(biāo)志著浪潮新基建在技術(shù)...
關(guān)鍵字:
軟件
新基建
智慧城市
模型
魁北克, Oct. 13, 2022 (GLOBE NEWSWIRE) -- 提供最靈活、最強大和最準(zhǔn)確ADAS及AD傳感技術(shù)的全球領(lǐng)先企業(yè)LeddarTech?欣然宣布,公司將采用一項業(yè)務(wù)戰(zhàn)略,將更多的資金和團隊資源用...
關(guān)鍵字:
LED
汽車
軟件
ADAS
麥格納(MAGNA)正在進行一項1.2億美元的投資,在印度班加羅爾建立和運營一座全新工程中心,旨在為出行電動化提供支持。該設(shè)施占地約2.2萬平方米,預(yù)計將于2023年第一季度開業(yè),屆時該中心將聘請眾多經(jīng)驗豐富的工程師和技...
關(guān)鍵字:
工程師
仿真
電動汽車
軟件
嵌入式軟件技術(shù)到目前為止己經(jīng)在很多領(lǐng)域起到了中流砥柱的作用,例如在電子消費、移動通訊方面,這種技術(shù)為我國的很多行業(yè)提供了更多的可能性。未來,嵌入式軟件技術(shù)會為人類做出更大的貢獻。伴隨著計算機技術(shù)與電子技術(shù)的成熟發(fā)展,電子...
關(guān)鍵字:
嵌入式
軟件
人工智能
(全球TMT2022年9月29日訊)銳思華創(chuàng)正式宣布9月同時拿下兩個定點項目,本次拿到的定點項目均為國內(nèi)知名主機廠商新能源車型,其中一款車型發(fā)布之后有望成為國內(nèi)新一代新能源運動轎車領(lǐng)跑車型,另一款車型定位為中大型SUV...
關(guān)鍵字:
新能源
CW
軟件
CORE
2022年9月28日,在英特爾On技術(shù)創(chuàng)新峰會的第二天,英特爾詳細說明了其在推進開放生態(tài)上的努力和投入,從芯片到系統(tǒng),再到應(yīng)用和軟件堆棧的各個層級,如何在開發(fā)者社區(qū)中成為創(chuàng)新的催化劑。
關(guān)鍵字:
英特爾
軟件
Intel
無錫2022年9月28日 /美通社/ -- 近日,江蘇省工業(yè)和信息化廳公示2022年(第9批)省級軟件企業(yè)技術(shù)中心擬認定名單,經(jīng)企業(yè)申報、各市推薦、形式審查、專家評審等程序,浪潮卓數(shù)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限公司(簡稱浪潮卓數(shù))...
關(guān)鍵字:
軟件
數(shù)據(jù)流
數(shù)據(jù)安全
數(shù)據(jù)采集
霍尼韋爾數(shù)據(jù)中心管理平臺提供創(chuàng)新的用戶體驗,增加業(yè)務(wù)的彈性, 提高工作效率并提供關(guān)鍵的可持續(xù)性KPI指標(biāo)的可見性 亞特蘭大2022年9月28日 /美通社/ -- 全球樓宇互聯(lián)行業(yè)領(lǐng)導(dǎo)者霍尼韋爾(納斯達克代碼:HON)...
關(guān)鍵字:
數(shù)據(jù)中心
霍尼韋爾
PI
軟件
蘇州空天信息研究院23室軟件工程技術(shù)部在充分發(fā)揮自身在技術(shù)研發(fā)、人才資源優(yōu)勢的基礎(chǔ)上,時刻關(guān)注和研究國內(nèi)外軟件工程領(lǐng)域的發(fā)展動態(tài)和技術(shù)導(dǎo)向,不斷探索新方向,采用新技術(shù),研發(fā)優(yōu)化新產(chǎn)品,于2020年開始著手研發(fā)技術(shù)體制驗證...
關(guān)鍵字:
程序運行
軟件
(全球TMT2022年9月23日訊)9月20日,浪潮信息宣布元宇宙服務(wù)器MetaEngine支持新一代GPU芯片及Omniverse軟件棧,助力用戶更高效地創(chuàng)建數(shù)字資產(chǎn)。單臺MetaEngine可配置8張最新的NVID...
關(guān)鍵字:
芯片
軟件
GPU
SE
(全球TMT2022年9月23日訊)萊維特發(fā)布新一代高性能聲卡-CONNECT 6。它是一款面向音樂人、內(nèi)容創(chuàng)作者和主播等多應(yīng)用場景的專業(yè)級聲卡,適配Windows、Mac電腦和iPhone,iPad及Android手...
關(guān)鍵字:
NEC
聲卡
IPAD
軟件