日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式分享
如果說圖像采集是“獲取素材”,圖像預(yù)處理是“優(yōu)化素材”,那么特征提取就是整個(gè)計(jì)算機(jī)視覺技術(shù)鏈路的“核心環(huán)節(jié)”——機(jī)器之所以能區(qū)分不同的物體、識(shí)別不同的場(chǎng)景,關(guān)鍵就在于通過特征提取,從預(yù)處理后的圖像中,捕捉到能代表物體本質(zhì)的“關(guān)鍵線索”(即特征)。這些特征是機(jī)器區(qū)分不同物體的核心依據(jù),就像人類能通過“尖耳朵、圓眼睛”區(qū)分貓和狗,通過“四條腿、平面光滑”區(qū)分桌子和椅子一樣,機(jī)器通過提取物體的核心特征,實(shí)現(xiàn)對(duì)物體的初步“認(rèn)知”。
特征提取的核心目標(biāo),是從復(fù)雜的圖像中,篩選出具有代表性、區(qū)分度高、穩(wěn)定性強(qiáng)的特征——代表性是指特征能反映物體的本質(zhì)屬性(如人臉的五官特征、杯子的輪廓特征);區(qū)分度高是指不同物體的特征差異明顯(如貓的尖耳朵與狗的垂耳朵);穩(wěn)定性強(qiáng)是指特征在不同光線、不同角度、不同場(chǎng)景下,能保持相對(duì)穩(wěn)定(如無論從正面還是側(cè)面拍攝,杯子的“有柄、圓形”特征始終存在)。根據(jù)技術(shù)發(fā)展階段,特征提取主要分為兩大流派:傳統(tǒng)人工特征提取和深度學(xué)習(xí)自動(dòng)特征提取,兩者的技術(shù)邏輯和應(yīng)用場(chǎng)景存在顯著差異。
傳統(tǒng)人工特征提取,是早期計(jì)算機(jī)視覺的主流方式,核心是依靠工程師人工設(shè)計(jì)算法,定義“什么是特征”,再通過算法從圖像中提取出人工定義的特征。這種方式對(duì)工程師的專業(yè)知識(shí)要求極高,需要結(jié)合具體場(chǎng)景,設(shè)計(jì)針對(duì)性的特征提取算法,常用的人工特征提取方法主要有三類:
一是邊緣檢測(cè),核心是提取物體的輪廓邊緣,這是最基礎(chǔ)、最常用的人工特征。邊緣是物體與背景、物體內(nèi)部不同區(qū)域的分界線,能直觀反映物體的形狀輪廓,常用的邊緣檢測(cè)算法有Sobel算子、Canny算子、Robert算子等。比如,Canny算子通過“噪聲抑制→梯度計(jì)算→邊緣定位→邊緣連接”四個(gè)步驟,能精準(zhǔn)提取出物體的邊緣輪廓,避免邊緣斷裂或虛假邊緣,廣泛應(yīng)用于物體輪廓識(shí)別、工業(yè)零件檢測(cè)等場(chǎng)景。
二是角點(diǎn)檢測(cè),核心是提取物體的角點(diǎn)特征——角點(diǎn)是圖像中灰度值變化劇烈的點(diǎn),也是物體形狀的關(guān)鍵節(jié)點(diǎn)(如桌子的四個(gè)角、書本的邊角、人臉的眼角),能幫助機(jī)器判斷物體的形狀和位置。常用的角點(diǎn)檢測(cè)算法有Harris角點(diǎn)檢測(cè)、SIFT角點(diǎn)檢測(cè)等,其中SIFT算法能提取出具有尺度不變性、旋轉(zhuǎn)不變性的角點(diǎn)特征,即使物體旋轉(zhuǎn)、縮放,也能精準(zhǔn)識(shí)別。
三是紋理提取,核心是捕捉圖像的紋理信息——紋理是物體表面的細(xì)微結(jié)構(gòu)(如布料的花紋、木材的紋理、皮膚的毛孔),不同物體的紋理差異明顯,可用于區(qū)分紋理不同的物體。常用的紋理提取算法有LBP算法、HOG算法等,其中HOG算法(方向梯度直方圖)能提取出物體的紋理梯度特征,廣泛應(yīng)用于行人檢測(cè)、手勢(shì)識(shí)別等場(chǎng)景。
但傳統(tǒng)人工特征提取存在明顯的局限性:一方面,人工設(shè)計(jì)的特征往往不夠全面,無法適應(yīng)復(fù)雜多變的場(chǎng)景——比如同樣是杯子,有的是圓形、有的是方形、有的帶花紋、有的是純色,人工設(shè)計(jì)的特征很難覆蓋所有情況;另一方面,人工設(shè)計(jì)特征效率低下,需要針對(duì)不同場(chǎng)景重新設(shè)計(jì)算法,無法應(yīng)對(duì)海量的圖像數(shù)據(jù)和多樣化的應(yīng)用場(chǎng)景。隨著深度學(xué)習(xí)技術(shù)的崛起,傳統(tǒng)人工特征提取逐漸被深度學(xué)習(xí)自動(dòng)特征提取取代,徹底解決了人工特征的痛點(diǎn)。
深度學(xué)習(xí)自動(dòng)特征提取,核心是依靠卷積神經(jīng)網(wǎng)絡(luò)(CNN),模擬人類大腦的視覺皮層結(jié)構(gòu),實(shí)現(xiàn)特征的自動(dòng)化提取,無需人工干預(yù)。卷積神經(jīng)網(wǎng)絡(luò)通過多層卷積層、池化層、全連接層的協(xié)同作用,從圖像中自動(dòng)提取不同層次的特征,形成“低級(jí)特征→中級(jí)特征→高級(jí)特征”的分層提取邏輯,完美貼合人類視覺的認(rèn)知規(guī)律:
底層卷積層主要提取圖像的低級(jí)特征,這類特征是最基礎(chǔ)的視覺信息,包括邊緣、線條、顏色塊、紋理斑點(diǎn)等,比如圖像中的水平線條、垂直線條、紅色塊、藍(lán)色塊等,這些特征不具備明顯的物體代表性,但卻是構(gòu)成高級(jí)特征的基礎(chǔ);
中層卷積層和池化層,會(huì)將底層提取的低級(jí)特征進(jìn)行組合、篩選,形成中級(jí)特征——比如將“邊緣+線條”組合成物體的局部輪廓(如貓的耳朵輪廓、杯子的杯口輪廓),將“顏色塊+紋理斑點(diǎn)”組合成物體的局部紋理(如貓的毛發(fā)紋理、布料的花紋);
高層卷積層和全連接層,則會(huì)將中層的中級(jí)特征進(jìn)一步整合、優(yōu)化,提取出具有強(qiáng)代表性、高區(qū)分度的高級(jí)特征——這類特征能直接反映物體的本質(zhì)屬性,比如貓的“尖耳朵、圓眼睛、毛茸茸身體”,人臉的“五官組合、輪廓特征”,車輛的“車身輪廓、車輪特征”等。
舉個(gè)通俗的例子:當(dāng)機(jī)器處理一張“貓”的圖像時(shí),CNN的底層會(huì)先提取出貓的胡須邊緣、耳朵線條、身體輪廓線條、毛發(fā)顏色塊等低級(jí)特征;中層會(huì)將這些邊緣、線條、顏色塊組合起來,形成貓的耳朵形狀、臉部輪廓、身體輪廓等中級(jí)特征;高層則會(huì)將這些中級(jí)特征整合,提取出“貓”的核心高級(jí)特征,這些特征能讓機(jī)器明確區(qū)分“貓”和“狗”“兔子”等其他動(dòng)物。
與傳統(tǒng)人工特征提取相比,深度學(xué)習(xí)自動(dòng)特征提取具有三大優(yōu)勢(shì):一是自動(dòng)化程度高,無需人工設(shè)計(jì)特征,算法能自動(dòng)適配不同場(chǎng)景、不同圖像,降低工程師的工作量;二是特征覆蓋全面,能提取出不同層次的特征,適配復(fù)雜多變的場(chǎng)景;三是適應(yīng)性強(qiáng),能在不同光線、不同角度、不同遮擋條件下,精準(zhǔn)提取物體的核心特征,大幅提升特征提取的準(zhǔn)確性和穩(wěn)定性。目前,深度學(xué)習(xí)自動(dòng)特征提取已成為主流,廣泛應(yīng)用于各類計(jì)算機(jī)視覺場(chǎng)景,是現(xiàn)代計(jì)算機(jī)視覺技術(shù)的核心支撐。
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀
關(guān)閉