相機標定:從幾何建模到像素精準映射的視覺基礎(一)
相機標定作為計算機視覺領域連接三維物理世界與二維圖像空間的核心技術,通過建立相機成像的數(shù)學模型,求解內參(焦距、主點坐標)與外參(旋轉矩陣、平移向量)及畸變系數(shù),實現(xiàn)像素坐標到真實世界坐標的精準映射。在人類通過視覺感知環(huán)境的過程中,大腦會自動校正眼球的光學畸變并融合雙眼視差,而相機作為人工視覺系統(tǒng),必須通過標定消除鏡頭制造誤差、安裝偏差帶來的成像扭曲,才能為后續(xù)的三維重建、目標定位等任務提供可靠的幾何基準。從早期依賴精密機械裝置的標定方法,到如今基于棋盤格的自動標定算法,相機標定的技術演進始終圍繞 “精度提升” 與 “操作簡化” 兩大目標,其成果已廣泛支撐起工業(yè)檢測、自動駕駛、機器人導航等領域的高精度視覺需求。本文將系統(tǒng)闡述相機標定的理論基礎、實現(xiàn)方法、應用場景及技術挑戰(zhàn),揭示其在視覺系統(tǒng)中的基礎性作用與發(fā)展?jié)摿Α?span>
相機標定的理論根基源于透視投影原理與鏡頭畸變模型,二者共同構成了從三維空間到二維圖像的完整映射關系。針孔相機模型是標定的基礎幾何框架,該模型假設光線通過一個理想針孔投射到像平面,空間點 P (X,Y,Z) 與其像點 p (u,v) 的映射關系可表示為:u = fx*(X/Z) + cx,v = fy*(Y/Z) + cy,其中 fx、fy 為 x、y 方向的焦距(像素單位),cx、cy 為主點坐標(圖像中心)。然而,真實鏡頭因光學設計與制造工藝限制,存在非線性畸變,主要包括徑向畸變(由鏡頭曲率不均導致,表現(xiàn)為圖像邊緣的放射狀扭曲)和切向畸變(由鏡頭裝配偏差導致,表現(xiàn)為圖像的傾斜拉伸),其數(shù)學模型通常采用多項式表示:徑向畸變 δr = k1r2 + k2r? + k3r?,切向畸變 δt = p1(r2+2x2) + 2p2xy,其中 k1、k2、k3 為徑向畸變系數(shù),p1、p2 為切向畸變系數(shù),r 為像素到主點的距離。相機標定的核心任務即通過已知的空間點與對應像點,求解內參矩陣 K(包含 fx、fy、cx、cy)、外參矩陣(R,t)及畸變系數(shù),使重投影誤差(實際像點與理論像點的像素距離)最小化,理想情況下應控制在 0.5 像素以內。
相機標定的實現(xiàn)方法可根據(jù)是否依賴已知結構的靶標分為 “基于靶標的標定法” 與 “自標定法”,兩類方法在精度、操作復雜度上各有側重,適用于不同場景?;诎袠说臉硕ǚㄊ枪I(yè)界的主流選擇,其通過拍攝已知三維坐標的特征點(如棋盤格角點),利用透視約束求解相機參數(shù),其中張氏標定法因操作簡便、精度可靠成為最廣泛應用的方案。該方法的典型流程為:打印棋盤格靶標并從不同角度拍攝 10-20 張圖像,通過角點檢測算法提取棋盤格角點的圖像坐標,結合其已知的世界坐標(通常設棋盤格平面為 Z=0),構建透視方程 AX=0,利用最小二乘法求解內參與外參的初始值,再通過光束平差法(Bundle Adjustment)優(yōu)化所有參數(shù),使整體重投影誤差最小。為提升精度,靶標設計需滿足特征點分布均勻、角點數(shù)量充足(如 8×11 格點),拍攝時需覆蓋相機視場的不同區(qū)域,避免姿態(tài)單一導致的參數(shù)退化?;谥鲃影袠说臉硕ǚ▌t適用于高精度場景,如利用激光跟蹤儀或運動捕捉系統(tǒng)提供靶標三維坐標,可將標定精度提升至 0.1 像素以內,但設備成本高昂,僅用于航空航天等高端領域。





