極線校正:立體視覺中的幾何約束與匹配加速技術(shù)(二)
極線校正的實現(xiàn)方法可根據(jù)技術(shù)路徑分為 “基于基礎(chǔ)矩陣的間接法” 與 “基于標(biāo)定參數(shù)的直接法”,兩種方法在精度與效率上各有側(cè)重,適用于不同場景。基于基礎(chǔ)矩陣的方法無需相機內(nèi)參,僅通過圖像特征點匹配即可估計 F 矩陣,進而求解旋轉(zhuǎn)矩陣,這種方法靈活性強,適用于未標(biāo)定的臨時雙目系統(tǒng),如手持手機拍攝的立體圖像對。其典型流程為:使用 SIFT 或 ORB 算法提取左右視圖的特征點,通過 RANSAC 算法剔除誤匹配,利用 8 點法計算基礎(chǔ)矩陣 F,再從 F 中分解出本質(zhì)矩陣 E(E=K?FK,K 為相機內(nèi)參矩陣),最后通過奇異值分解(SVD)從 E 中得到旋轉(zhuǎn)矩陣 R 與平移向量 t,生成校正所需的同形變換矩陣。但這種方法受特征匹配精度影響較大,當(dāng)圖像紋理稀疏時,F 矩陣估計誤差可能導(dǎo)致極線傾斜角超過 5°,因此更適合紋理豐富的場景?;跇?biāo)定參數(shù)的直接法則利用預(yù)先標(biāo)定的內(nèi)外參,直接計算旋轉(zhuǎn)矩陣,精度更高且穩(wěn)定性強,是工業(yè)級立體系統(tǒng)的首選方案。其核心是通過相機外參(旋轉(zhuǎn)矩陣 R 與平移向量 T)構(gòu)建校正旋轉(zhuǎn)矩陣,使校正后的左右相機坐標(biāo)系滿足 R?R??1=R?R??1,即光軸平行,常用的 Bouguet 算法通過最小化重投影誤差優(yōu)化旋轉(zhuǎn)參數(shù),可將極線偏差控制在 0.5 像素以內(nèi)。校正過程中的圖像重投影通常采用雙線性插值或雙三次插值,前者計算速度快(約 1ms / 幀)但可能產(chǎn)生鋸齒,后者精度高但耗時增加 3 倍,需根據(jù)實時性需求權(quán)衡選擇。
極線校正的技術(shù)性能通常通過 “極線偏差” 與 “圖像質(zhì)量損失” 兩個指標(biāo)衡量,前者反映幾何精度,后者體現(xiàn)信息保留程度。極線偏差定義為校正后同名點的行坐標(biāo)差,理想情況下應(yīng)趨近于 0,實際應(yīng)用中需控制在 1 像素以內(nèi),否則會顯著增加匹配難度。影響偏差的主要因素包括:相機標(biāo)定誤差(尤其是畸變系數(shù)擬合不準(zhǔn))、旋轉(zhuǎn)矩陣計算精度、圖像插值誤差等,在廣角相機等畸變較大的場景中,即使經(jīng)過校正,邊緣區(qū)域的極線偏差仍可能達到 3-5 像素,需要結(jié)合局部畸變補償算法進一步優(yōu)化。圖像質(zhì)量損失則源于重投影過程中的像素拉伸與插值,當(dāng)旋轉(zhuǎn)角度較大(如超過 30°)時,圖像邊緣可能出現(xiàn)明顯模糊,此時需采用自適應(yīng)插值算法(如基于邊緣檢測的加權(quán)插值),在保持極線精度的同時減少信息丟失。此外,校正后的圖像通常需要裁剪以去除無效黑邊,裁剪比例與相機基線長度相關(guān),基線越長,有效視場損失越大,因此在系統(tǒng)設(shè)計時需在基線長度(影響深度測量范圍)與視場保留之間進行平衡,例如自動駕駛雙目相機的基線通常設(shè)為 0.5-1.5 米,裁剪后有效視場仍能覆蓋 80° 水平角。





