資策會MIC資深產業(yè)分析師陳賜賢
3D空間物體量測技術可以用來偵測及分析待測物體形狀、外觀及距離,量測過程中搜集到的影像數(shù)據(jù)資料可以在電腦虛擬環(huán)境中建立物體3D空間數(shù)位模型,這些數(shù)位模型具有相當廣泛的商業(yè)用途,像是微軟(Microsoft)推出的Kinect人機互動電玩游戲裝置就是3D空間物體量測技術的應用實例。
一般而言,3D空間物體量測是將光線投射到待測物體,并藉由光線的反射計算出物體在3D空間的距離,由于量測到的數(shù)據(jù)資料包含深度訊息,因此,常以深度影像(Depth Image)稱之。
透過深度影像與二維影像(2D Image)的結合,便能夠獲得二維影像中每一畫素(Pixel)的深度訊息,并將二維影像轉為3D影像,若持續(xù)對某特定場景進行物體量測,就能夠辨識出物體在3D空間中的縱深運動軌跡。
捕捉物體深度影像的方法有許多種,若依據(jù)物體材質、辨識環(huán)境、辨識精密度等不同條件,基本上可區(qū)分為接觸式(Contact)與非接觸式(Non-contact)兩種方法。
接觸式方法指的是透過實際接觸而量測出物體深度影像,非接觸式方法則是透過音波(Sound Wave)、微波(Microwave)或光學(Optics)進行物體深度影像量測,產業(yè)界近期研發(fā)重點以非接觸式方法為主。
3D手勢感應控制(3D Gesture Sensing Control)屬于非接觸式物體深度影像量測方法,若依據(jù)量測技術之不同,3D手勢感應控制又可區(qū)分為三大技術類型,包括結構光掃描(Structured Light Scanning)、時差測距(Time-of-Flight, ToF)與三角測距(Triangulation)(圖1),以下將就各技術優(yōu)劣進行分析比較。
資料來源:資策會MIC
圖1 3D手勢感應控制技術類型
精細度高/成本低 結構光適用智慧電視
結構光指的是具有特定形狀模式的光線,像是線條狀、平面狀、網(wǎng)格狀等,結構光掃描的基本原理是將結構光投射到待測物體表面,并用攝影機擷取受物體表面影響的變形結構光圖像訊息,包括物體的距離、物體表面形狀變化、物體間隙等。
微軟推出的第一代Kinect人機互動電玩游戲裝置就是采用結構光掃描技術的應用實例,使用紅外線、結構光圖案繞射元件及紅外線互補式金屬氧化物半導體(CMOS)影像感測器等構件進行深度影像捕捉,并透過影像處理器將深度影像運算成3D深度圖像,并進行3D手勢感應控制圖像辨識及動作指令轉換。
值得一提的是,結構光掃描技術主要優(yōu)點是可以處理大量掃描活動、掃描速度快、精細度相對較高、成本相對較低。另一方面,結構光掃描技術主要缺點是較易受環(huán)境光源干擾,因此,結構光掃描技術相對較適合在室內運用。
結構光掃描技術較佳的偵測距離為1.8~3.5公尺,因此,目前結構光掃描技術較合適的應用產品為智慧電視,而或許這也是蘋果(Apple)會以3.6億美元并購PrimeSense的主要策略意圖,導入結構光掃描技術打造具備3D手勢感應控制性能的Apple TV,其后續(xù)發(fā)展值得關注。
量測速度快 時差測距稱霸游戲應用
使用時差測距技術進行3D空間物體量測,首先,對待測物體發(fā)射光線,其次,計算該光線到達待測物體表面后反射回來的時間差,由于光速為已知條件,因此透過時間差的偵測數(shù)據(jù)可以計算出待測物體的距離。
以色列廠商3DV Systems開發(fā)的ZCam就是采用時差測距技術的應用實例,使用紅外線及加速度計(Accelerometer)對待測物體進行3D空間相對位置變化感測,進而建構待測物體深度影像數(shù)據(jù)資料。另外,值得一提的是,2013年11月微軟發(fā)表的第二代Kinect人機互動電玩游戲裝置則轉而改采布局已久的時差測距技術。
時差測距技術主要優(yōu)點系量測速度非???、物體量測演算法相對簡單、較不易受環(huán)境光源干擾,但缺點為辨識度易受待測物體表面特性影響、成本相對高、精細度相對低。
時差測距技術的偵測距離為超過0.3公尺即可運作,因此,就目前時差測距技術應用在消費性資通訊產品上,判斷其應用范圍較廣,可含括平板電腦、筆記型電腦、智慧電視機甚至智慧型手機。
值得一提的是,相較于結構光掃描技術,時差測距技術具有量測速度非常快的優(yōu)勢,因為只有夠快的量測速度才能夠符合電玩游戲裝置與智慧行動裝置人機介面訴求的直覺且流暢的人機互動操控體驗感受,而這或許也是微軟透過并購Canesta與3DV Systems這兩家擁有時差測距關鍵技術與專利權廠商最主要的目的。
不受環(huán)境光干擾 三角測距實現(xiàn)AR應用
使用三角測距技術進行3D空間物體量測,首先須對待測物體發(fā)射雷射光線,接著攝影機搜尋座落于待測物體上的雷射光點,隨著待測物體與量測裝置之間的距離差異,雷射光點座落在攝影機影像感測元件上的位置也會不同。
由于雷射光線發(fā)射機與攝影機間的距離及雷射光線發(fā)射角度皆為已知,因此,可以透過雷射光點座落于攝影機影像感測元件上的位置計算出待測物體與量測裝置之間的距離。
索尼(Sony)推出的PlayStation 4電玩游戲裝置配備的雙眼相機(PlayStation 4 Eye Camera)就是采用三角測距技術的應用實例,使用者可藉由PlayStation 4的雙眼相機及游戲控制手把(DualShock 4)上的發(fā)光二極體(LED)燈追蹤控制手把位置及辨識使用者手勢或是身體動作變化,進行像是擴增實境(Augmented Reality, AR)電玩游戲裝置互動體驗感受。
值得一提的是,三角測距技術主要優(yōu)點為較不易受環(huán)境光源干擾、成本相對較低。三角測距主要缺點為量測速度較慢、精細度相對較低、量測距離較短,因此,三角測距技術并不適用遠距離測量。[!--empirenews.page--]
另一方面,由于三角測距量測速度較慢,且感應裝置微型化后明顯減低影像感測精細度。因此,三角測距技術相較于結構光掃描技術與時差測距技術在消費性產品市場發(fā)展?jié)摿ο鄬^弱。
看好3D感測發(fā)展后勢 大廠展開并購布局
2013年11月蘋果以3.6億美元并購3D手勢感應控制技術重要廠商PrimeSense,此項并購消息的競爭策略意涵是,蘋果相關產品在人機介面(User Interface)設計上,將從多點觸控(Multi-Touch Control)進展到3D手勢感應控制(3D Gesture Sensing Control)。
從手指碰觸控制到手勢感應控制的人機介面設計趨勢不容小覷,因為當蘋果積極采用3D手勢感應控制技術重新打造Apple TV、iPad、iPhone,帶動作業(yè)系統(tǒng)、硬體與人機介面最佳化設計風潮,并促使App Store軟體開發(fā)商開發(fā)出更合適、更有趣的3D手勢感應控制性能相關軟體與應用程式(App),此發(fā)展趨勢很有可能進一步對電視、平板電腦、手機市場帶來新一波競爭沖擊。
由于3D手勢感應控制可以帶給使用者更直覺、更流暢的人機互動操控體驗感受,因此,近年來已成為資通訊領域大廠積極布局的新興科技。
除蘋果并購PrimeSense外,其他資通訊領域大廠也不遑多讓,近年來也透過并購方式積極布局3D手勢感應控制相關技術,包括微軟并購Canesta、3DV Systems,英特爾(Intel)并購Omek,Google并購Flutter。另外,晶片大廠安謀國際(ARM)與EyeSight計劃合作將3D手勢感應控制功能導入智慧型手機,三星(Samsung)則開始在智慧電視中導入手勢感應操控功能訴求更直覺、更流暢的人機互動操控體驗感受。
科技業(yè)者后續(xù)應密切觀察指標性大廠,像是蘋果、Google、英特爾、微軟、索尼、三星等,近期在3D手勢感應控制技術實際商品化推展態(tài)度及市場銷售實績,做為投入產品開發(fā)、市場產銷或加入供應鏈體系的重要觀測指標。





