盡管
計(jì)算機(jī)視覺(jué)技術(shù)在自動(dòng)駕駛環(huán)境感知中已實(shí)現(xiàn)廣泛落地,且技術(shù)不斷迭代升級(jí),但在實(shí)際實(shí)操過(guò)程中,由于自動(dòng)駕駛場(chǎng)景的復(fù)雜性、極端環(huán)境的干擾、硬件性能的限制等因素,仍面臨諸多難點(diǎn)與挑戰(zhàn),這些難點(diǎn)直接影響了環(huán)境感知的精度、實(shí)時(shí)性與穩(wěn)定性,也是當(dāng)前自動(dòng)駕駛技術(shù)發(fā)展的核心瓶頸。下面總結(jié)五大最常見(jiàn)的實(shí)操難點(diǎn),結(jié)合行業(yè)經(jīng)驗(yàn),分析難點(diǎn)成因與初步優(yōu)化思路。
(一)難點(diǎn)一:極端環(huán)境下的感知精度不足
這是最核心、最常見(jiàn)的實(shí)操難點(diǎn)——自動(dòng)駕駛車輛需應(yīng)對(duì)雨天、大霧天、夜間、強(qiáng)光逆光、暴雪、沙塵等各類極端環(huán)境,而在這些環(huán)境下,車載攝像頭采集的圖像會(huì)出現(xiàn)模糊、失真、光線不足、對(duì)比度低等問(wèn)題,導(dǎo)致計(jì)算機(jī)視覺(jué)算法的特征提取不準(zhǔn)確,出現(xiàn)誤判、漏判,影響感知精度。
例如,雨天路面有積水,會(huì)產(chǎn)生反光,導(dǎo)致車道線識(shí)別模糊,目標(biāo)檢測(cè)出現(xiàn)誤判(將積水反光誤判為障礙物);夜間光線不足,行人、騎行者的特征不明顯,容易出現(xiàn)漏判;大霧天能見(jiàn)度低,遠(yuǎn)處的車輛、行人無(wú)法被精準(zhǔn)識(shí)別,深度估計(jì)的精度大幅下降。
優(yōu)化思路:一是采用“圖像增強(qiáng)”技術(shù),通過(guò)算法提升極端環(huán)境下圖像的清晰度、對(duì)比度,突出目標(biāo)特征;二是融合多模態(tài)數(shù)據(jù),結(jié)合激光雷達(dá)、毫米波雷達(dá)的感知數(shù)據(jù),彌補(bǔ)計(jì)算機(jī)視覺(jué)在極端環(huán)境下的不足,實(shí)現(xiàn)“視覺(jué)+雷達(dá)”的融合感知;三是采用專用攝像頭(如紅外攝像頭、熱成像攝像頭),提升夜間、大霧天的目標(biāo)識(shí)別精度;四是通過(guò)大量極端環(huán)境樣本訓(xùn)練算法,讓算法自主學(xué)習(xí)極端環(huán)境下的目標(biāo)特征與圖像規(guī)律,提升場(chǎng)景適應(yīng)性。
(二)難點(diǎn)二:目標(biāo)遮擋與形態(tài)多變導(dǎo)致的漏判、誤判
自動(dòng)駕駛場(chǎng)景中,目標(biāo)遮擋與形態(tài)多變的問(wèn)題十分突出,也是導(dǎo)致計(jì)算機(jī)視覺(jué)感知誤判、漏判的重要原因。目標(biāo)遮擋主要包括:車輛被其他車輛、行人、樹(shù)木、建筑物遮擋,行人被人群、護(hù)欄遮擋,交通標(biāo)志被樹(shù)葉、污漬、施工擋板遮擋;目標(biāo)形態(tài)多變主要包括:行人彎腰、奔跑、橫穿馬路,騎行者姿態(tài)不固定,車輛的車型、顏色差異較大,交通標(biāo)志的磨損、變形等。
例如,在城市道路中,小型轎車被大型貨車遮擋,計(jì)算機(jī)視覺(jué)算法無(wú)法識(shí)別被遮擋的轎車,容易出現(xiàn)漏判,導(dǎo)致碰撞風(fēng)險(xiǎn);行人彎腰撿拾物品時(shí),姿態(tài)發(fā)生變化,算法可能無(wú)法精準(zhǔn)識(shí)別為行人,出現(xiàn)誤判。
優(yōu)化思路:一是采用多攝像頭融合技術(shù),通過(guò)前視、側(cè)視、后視、環(huán)視攝像頭協(xié)同,實(shí)現(xiàn)對(duì)目標(biāo)的360°無(wú)死角檢測(cè)與跟蹤,減少遮擋帶來(lái)的影響;二是優(yōu)化目標(biāo)檢測(cè)與跟蹤算法,采用“特征融合+運(yùn)動(dòng)預(yù)測(cè)”技術(shù),即使目標(biāo)被短暫遮擋,也能通過(guò)之前提取的目標(biāo)特征與運(yùn)動(dòng)軌跡,快速重新識(shí)別并跟蹤目標(biāo);三是構(gòu)建多樣化的目標(biāo)樣本庫(kù),涵蓋不同姿態(tài)、不同形態(tài)、不同遮擋程度的目標(biāo)樣本,訓(xùn)練算法的泛化能力,提升識(shí)別準(zhǔn)確率。
(三)難點(diǎn)三:感知精度與實(shí)時(shí)性的平衡難題
自動(dòng)駕駛環(huán)境感知對(duì)“精度”與“實(shí)時(shí)性”均有極高要求——精度不足會(huì)導(dǎo)致誤判、漏判,引發(fā)安全風(fēng)險(xiǎn);實(shí)時(shí)性不足會(huì)導(dǎo)致感知數(shù)據(jù)滯后,無(wú)法為決策層提供及時(shí)的支撐,影響車輛的自主控制(如無(wú)法及時(shí)剎車、變道)。但計(jì)算機(jī)視覺(jué)技術(shù)的核心矛盾之一,就是“精度與實(shí)時(shí)性的平衡”:追求高精度,需要復(fù)雜的算法模型與大量的計(jì)算量,會(huì)降低實(shí)時(shí)性;追求實(shí)時(shí)性,需要簡(jiǎn)化算法模型,會(huì)降低感知精度。
例如,語(yǔ)義分割技術(shù)是實(shí)現(xiàn)場(chǎng)景語(yǔ)義理解的核心,但語(yǔ)義分割是像素級(jí)的識(shí)別,計(jì)算量較大,若采用高精度的DeepLabv3+算法,在車載硬件上的運(yùn)行速度較慢,無(wú)法滿足實(shí)時(shí)感知需求;若采用輕量化的ENet算法,實(shí)時(shí)性提升,但分割精度下降,容易出現(xiàn)語(yǔ)義混淆。
優(yōu)化思路:一是采用“輕量化網(wǎng)絡(luò)結(jié)構(gòu)”,對(duì)傳統(tǒng)的深度學(xué)習(xí)算法進(jìn)行優(yōu)化,簡(jiǎn)化網(wǎng)絡(luò)層數(shù)、減少計(jì)算量,在保證精度的前提下,提升實(shí)時(shí)性(如采用MobileNet、ShuffleNet作為基礎(chǔ)網(wǎng)絡(luò));二是采用“硬件加速”技術(shù),結(jié)合車載GPU、FPGA、ASIC等專用芯片,提升算法的運(yùn)行速度,滿足實(shí)時(shí)感知需求;三是采用“動(dòng)態(tài)調(diào)整算法精度”的策略,根據(jù)行駛場(chǎng)景的復(fù)雜程度,動(dòng)態(tài)調(diào)整算法的精度與計(jì)算量——如高速道路場(chǎng)景,算法精度可適當(dāng)降低,提升實(shí)時(shí)性;城市復(fù)雜道路場(chǎng)景,算法精度提升,確保感知準(zhǔn)確。
(四)難點(diǎn)四:車載硬件性能的限制
計(jì)算機(jī)視覺(jué)算法的運(yùn)行,依賴車載硬件(攝像頭、車載芯片、存儲(chǔ)設(shè)備)的支撐,而車載硬件的性能的存在諸多限制,直接影響了計(jì)算機(jī)視覺(jué)技術(shù)的感知效果:一是車載攝像頭的分辨率、幀率、動(dòng)態(tài)范圍有限,無(wú)法采集到高質(zhì)量的圖像數(shù)據(jù)(如低分辨率攝像頭無(wú)法清晰采集遠(yuǎn)處目標(biāo)的特征);二是車載芯片的計(jì)算能力有限,無(wú)法支撐復(fù)雜算法的實(shí)時(shí)運(yùn)行,導(dǎo)致感知數(shù)據(jù)滯后;三是車載存儲(chǔ)設(shè)備的容量有限,無(wú)法存儲(chǔ)大量的圖像數(shù)據(jù)與算法模型,影響算法的迭代與優(yōu)化。
例如,部分低端自動(dòng)駕駛車輛,采用低分辨率的前視攝像頭,無(wú)法清晰識(shí)別遠(yuǎn)處的交通標(biāo)志與行人,導(dǎo)致感知精度下降;車載芯片的計(jì)算能力不足,無(wú)法支撐多攝像頭融合感知與復(fù)雜語(yǔ)義分割算法的實(shí)時(shí)運(yùn)行,導(dǎo)致實(shí)時(shí)性不足。
優(yōu)化思路:一是提升車載硬件性能,采用高分辨率、高幀率、寬動(dòng)態(tài)范圍的車載攝像頭,提升圖像采集質(zhì)量;采用高性能的車載芯片(如英偉達(dá)Orin、華為MDC、高通Snapdragon Ride),提升計(jì)算能力,支撐復(fù)雜算法的實(shí)時(shí)運(yùn)行;擴(kuò)大車載存儲(chǔ)設(shè)備的容量,滿足圖像數(shù)據(jù)與算法模型的存儲(chǔ)需求。二是優(yōu)化算法模型,適配車載硬件的性能限制,采用輕量化算法,減少計(jì)算量與存儲(chǔ)需求,實(shí)現(xiàn)算法與硬件的高效適配。
(五)難點(diǎn)五:多場(chǎng)景泛化能力不足
計(jì)算機(jī)視覺(jué)算法的性能,高度依賴訓(xùn)練樣本的覆蓋范圍,而自動(dòng)駕駛的場(chǎng)景十分復(fù)雜,不同地區(qū)、不同路段、不同天氣的場(chǎng)景差異較大,導(dǎo)致算法的多場(chǎng)景泛化能力不足——算法在某一地區(qū)、某一場(chǎng)景下的感知精度較高,但在其他地區(qū)、其他場(chǎng)景下,感知精度大幅下降,無(wú)法適配多樣化的自動(dòng)駕駛場(chǎng)景。
例如,某算法在北方干燥地區(qū)的感知精度可達(dá)95%以上,但在南方多雨地區(qū),由于雨天場(chǎng)景的樣本不足,感知精度下降至80%以下;某算法在城市道路場(chǎng)景下適配良好,但在鄉(xiāng)村道路場(chǎng)景下,由于道路結(jié)構(gòu)、交通標(biāo)志的差異,出現(xiàn)大量誤判、漏判。
優(yōu)化思路:一是構(gòu)建多地區(qū)、多場(chǎng)景、多天氣的大規(guī)模樣本庫(kù),涵蓋城市道路、高速道路、鄉(xiāng)村道路、施工路段等各類場(chǎng)景,雨天、大霧天、夜間、強(qiáng)光等各類天氣,不同地區(qū)的交通規(guī)則與道路結(jié)構(gòu),提升算法的泛化能力;二是采用“遷移學(xué)習(xí)”技術(shù),將在某一場(chǎng)景下訓(xùn)練好的算法模型,遷移到其他場(chǎng)景下,通過(guò)少量樣本微調(diào),提升算法在新場(chǎng)景下的感知精度;三是結(jié)合車路協(xié)同技術(shù),利用路側(cè)攝像頭的感知數(shù)據(jù),補(bǔ)充車載攝像頭的感知不足,提升算法對(duì)不同場(chǎng)景的適配能力。