日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 物聯(lián)網(wǎng) > 《物聯(lián)網(wǎng)技術》雜志
[導讀]摘 要 :針對傳統(tǒng)神經(jīng)網(wǎng)絡需要人工對參數(shù)進行提取的問題,提出基于 Leap Motion 結合卷積神經(jīng)網(wǎng)絡的手勢識別方法。首先利用 Leap Motion 獲取高精度手勢圖像,然后對圖像進行灰度處理,采用卷積神經(jīng)網(wǎng)絡算法自動對原始圖像進行特征提取及分類,最后設計 6 層卷積神經(jīng)網(wǎng)絡用于手勢識別。實驗結果表明,卷積神經(jīng)網(wǎng)絡算法在6 種手勢測試集上的準確率可達 96.5%,且識別時間短,模型具有較好的魯棒性。


0 引 言

傳統(tǒng)人機交互模式大多依賴鍵盤鼠標等直接接觸的設備,但這種交互方式不夠自然有效,已無法滿足人們的需求。人們迫切需要一種更自然、更符合人們生活習慣的交互方式,如語音、意念、手勢等。其中,手勢憑借自然、直觀等特點 [1] 在人機交互中得到廣泛運用,如今手勢識別已成為國內(nèi)外學者研究的重點。文獻 [2] 利用豪斯多夫(Hausdorff)距離模板匹配的思想實現(xiàn)手勢識別,將模版手勢與待識別手勢進行邊緣特征提取后變換到歐氏空間距離,其最短距離即對應的模版手勢。文獻 [3] 基于 SVM 構造多類分類器的手勢識別,對手勢分別進行一對一、一對多的數(shù)據(jù)分類,SVM算法是在樣本空間或特征空間構造出最優(yōu)超平面 [3],使超平面與樣本數(shù)集合之間的距離最大。文獻 [4] 采用 Kinect 傳感器對手勢圖像進行獲取,采用動態(tài)時間規(guī)整(Dynamic TimeWarping,DTW)的方法將不對齊的兩個序列在某一時刻點進行壓縮,實現(xiàn)兩個點歐氏空間距離最小。文獻 [5] 利用 BP算法訓練多層前饋網(wǎng)絡。

分析上述文獻,發(fā)現(xiàn)以下問題 : 

(1)模版匹配的方法無法解決時間可變性問題,識別精度低 ;

(2)基于 SVM 算法對大規(guī)模樣本訓練集的訓練時間較長,難以運用在實際問題中 ; 

(3)DTW 存在時間規(guī)整引入誤差的問題,降低了識別精度 ;

(4)采用傳統(tǒng)人工神經(jīng)網(wǎng)絡結構需要人工對參數(shù)進行提取。

針對以上問題,本文采用卷積神經(jīng)網(wǎng)絡算法對采集的手勢進行識別。

市面上有兩種深度視覺傳感器 :一種是 Kinect 傳感器,側重于識別人體骨骼,也能識別人臉與人手,但識別人手的精度不高 ;另一種是 Leap Motion 傳感器,能夠采集人體手部的關鍵點信息,故能更好地應用在手勢識別中。

1 Leap Motion 手勢數(shù)據(jù)采集

Leap Motion 是一種采用立體視覺原理的傳感器,內(nèi)部配備雙攝像頭,如同人眼從不同角度捕捉畫面。骨骼追蹤模型如圖 1 所示,此模型在視野不清晰時能夠預測手指與手的位置,即使手指交叉也可被 Leap Motion 追蹤。當 LeapMotion 檢測到手或桿狀物體時,系統(tǒng)會給 Frame 里的每一個Hand 分配一個唯一的 ID 標識符。Leap Motion 能夠?qū)κ植?/span>信息進行描述,并在 Hand ::pointable()函數(shù)里提供指尖、關節(jié)點等的位置以及手掌的方向向量、法向量信息 [6],最后將 Leap Motion 采集到的人體手勢數(shù)據(jù)通過 USB 接口傳輸給PC 端。

基于 Leap Motion 和卷積神經(jīng)網(wǎng)絡的手勢識別



2 卷積神經(jīng)網(wǎng)絡

卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)是一種前饋神經(jīng)網(wǎng)絡,其神經(jīng)元可響應一部分覆蓋范圍內(nèi)的周圍單元,對于大規(guī)模模式識別有著非常好的泛化能力。CNN 還是一個分類器,是一種具有監(jiān)督功能的機器學習工具,與傳統(tǒng)神經(jīng)網(wǎng)絡相比,避免了對圖像進行復雜的前期預處理,可直接將原始圖像輸入模型,圖像經(jīng)過卷積層、池化層、全局平均池化層,最后輸出分類圖像結果。CNN 主要用來識別位移、縮放及其他形式扭曲不變性的二維圖像。 CNN 同一特征平面映射面上的神經(jīng)元權值相同,所以局部權值共享的特殊結構在圖像識別方面有著獨特的優(yōu)越性。

2.1 卷積神經(jīng)網(wǎng)絡結構

卷積層的作用是對局部進行感知,在原始圖像的一個小區(qū)域上進行特征提取,池化層的作用是將卷積層輸出的特征面繼續(xù)進行特征化。本文選用最大值池化法(Max Pooling),可保留區(qū)域矩陣塊中的最大數(shù)值,忽略其他值,并能提高模型的魯棒性。全局平均池化層的作用是經(jīng)過若干卷積池化后將所有特征全連接起來組成一個特征向量,這個特征向量更能表達原始圖像 ;Filter(過濾器)的作用是將輸入的圖像劃分為多個區(qū)域,同時 Filter 在映射圖像中的參數(shù)共享,且相互獨立 ;激活函數(shù)的作用是使整個網(wǎng)絡呈現(xiàn)出非線性。本文采用線性整流函數(shù)(Rectified Linear Unit,ReLU),ReLU 函數(shù)可將神經(jīng)元的一部分輸出為 0,減少參數(shù)之間的關系,有效緩解過擬合情況的發(fā)生。卷積神經(jīng)網(wǎng)絡結構如圖 2 所示,輸入層為 32×32 通道為 3 的圖像。Filter 尺寸為 5×5,深度為 3。但在實際計算中,存在無法將原始圖像邊界點利用起來的情況,針對此問題可根據(jù)實際情況設定補零的層數(shù)(ZeroPadding)。

基于 Leap Motion 和卷積神經(jīng)網(wǎng)絡的手勢識別


2.2 卷積層與池化層


在卷積層中,將第一層的特征圖與卷積核進行卷積,然后通過激活函數(shù)得出卷積層的特征圖,其公式如下 :

基于 Leap Motion 和卷積神經(jīng)網(wǎng)絡的手勢識別

式 中:i 表示網(wǎng)絡層數(shù);j 表示特征圖個數(shù);f (*) 表 示激活函數(shù);k 表示卷積核;mj 表示輸入特征圖;b 表示偏置項。

在池化層中,神經(jīng)元 x 的計算公式如下 :

基于 Leap Motion 和卷積神經(jīng)網(wǎng)絡的手勢識別


式中 n 表示從上一層到池化層的窗口大小。池化是對該層輸入 n×n 大小的矩陣區(qū)域加權求和,因此輸出圖像的大小是原來輸入圖像大小的 1 ? n[8]。

3 實驗結果與分析

為了驗證 CNN 算法在手勢識別上具有較好的準確性,確保 Leap Motion 能夠采集到每一個手勢,實驗者需在距離Leap Motion 傳感器正上方 100 mm 處采集 6 種手勢。手勢類別如圖 3 所示,6 個手勢分別代表 1,2,3,4,5,6 這六個數(shù)字,每種手勢采集 200 個樣本,樣本均為 112×112 的手勢像素矩陣,訓練集和測試集各為 1 200 個。訓練前對樣本進行灰度處理,如圖 4 所示。

基于 Leap Motion 和卷積神經(jīng)網(wǎng)絡的手勢識別



實驗結果見表 1 所列。手勢 5 的正確率達 96.5%,且識別時間較短 ;但手勢 4 的正確率只有 86%,響應時間較長。由于訓練所用樣本較少,導致復雜手勢識別較低,因此可增加訓練樣本數(shù)量,提高手勢識別的準確性。

基于 Leap Motion 和卷積神經(jīng)網(wǎng)絡的手勢識別



4 結 語

本文設計了 6 層卷積神經(jīng)網(wǎng)絡用于手勢識別,與其他神經(jīng)網(wǎng)絡相比,由于加入了權重共享原則,因此能夠降低參數(shù)數(shù)目。理論上設計神經(jīng)網(wǎng)絡層數(shù)越多、節(jié)點越多,在訓練模型上的效果就越好,甚至會達到 100% 的預測精度。但隨之帶來的是模型過擬合,將模型放在測試數(shù)據(jù)上,預測效果嚴重降低。殘差神經(jīng)網(wǎng)絡是解決此類問題的方法之一,也是未來深度神經(jīng)網(wǎng)絡算法的又一研究方向。




本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

(全球TMT2022年10月17日訊)Brother內(nèi)置墨倉彩色噴墨一體機DCP-C421W新上市。此次Brother創(chuàng)新引入"按需打印,按頁付費"的家庭文印新模式:通過微信小程序購買打印頁數(shù),墨水則由廠家提供。通過綁...

關鍵字: DC 微信小程序 打印機 高精度

一直以來,機器學習都是大家的關注焦點之一。因此針對大家的興趣點所在,小編將為大家?guī)頇C器學習的相關介紹,詳細內(nèi)容請看下文。

關鍵字: 機器學習 深度學習 數(shù)據(jù)挖掘

在四年前的爭論中,Marcus認為:“深度學習必須通過一些借鑒自經(jīng)典符號系統(tǒng)的操作得到增強,也就是說需要充分利用經(jīng)典人工智能技術(允許顯式地表示層次結構和抽象規(guī)則)的混合模型,并將其同深度學習的優(yōu)勢相結合?!笔聦嵣?,符號...

關鍵字: 深度學習 人工智能 數(shù)字化

過去20年間,深度學習通過一系列有效的商業(yè)應用在人工智能研究和項目中占有優(yōu)勢。但光彩背后,一些根深蒂固的問題威脅著技術的提升。舉例來說,典型的深度學習程序無法很好地執(zhí)行一項以上的任務,嚴重限制了該技術在嚴格控制環(huán)境下特定...

關鍵字: 深度學習 人工智能

首先,沒有人感到驚訝,深度學習仍然是該領域的主導力量。它從根本上改變了計算機視覺的可能性,以及我們?nèi)绾巫龅竭@一點。它使開發(fā)更多地由數(shù)據(jù)驅(qū)動而不是代碼驅(qū)動,它改變了我們使用的工具和技術。但數(shù)據(jù)是一種痛苦。你從哪里得到它?你...

關鍵字: 深度學習 AI

(全球TMT2022年8月4日訊)籮筐技術公司宣布,籮筐自主研發(fā)高速公路數(shù)字孿生可視化管控平臺,應用"惡劣天氣低能見度與團霧數(shù)字智能監(jiān)測預警系統(tǒng)"專利技術,順利通過高速路段實路運行檢驗,并通過中國工程院院士及交通安全行...

關鍵字: 高速公路 智能監(jiān)測 預警系統(tǒng) 高精度

六分科技借力提升位置數(shù)據(jù)服務信息安全管理水平 北京2022年7月20日 /美通社/ -- 近日,國際公認的測試、檢驗和認證機構SGS授予北京六分科技有限公司(以下簡稱"六分科技")ISO/IEC 2...

關鍵字: ISO 信息安全 安全管理 高精度

機器學習將是下述內(nèi)容的主要介紹對象,通過這篇文章,小編希望大家可以對機器學習的相關情況以及信息有所認識和了解,詳細內(nèi)容如下。

關鍵字: 機器學習 深度學習 AI

(全球TMT2022年6月29日訊)2022年6月24日,由重慶市職業(yè)教育學會主辦的"重慶市職業(yè)教育學會傳媒藝術專業(yè)委員會教育年會暨‘中視典杯'重慶市第五屆職業(yè)院校傳媒藝術作品大賽"在重慶市巴南區(qū)文化藝術中心舉行。作為...

關鍵字: 大賽 VR 虛擬現(xiàn)實 高精度

自動駕駛將是下述內(nèi)容的主要介紹對象,通過這篇文章,小編希望大家可以對自動駕駛的相關情況以及信息有所認識和了解,詳細內(nèi)容如下。

關鍵字: 自動駕駛 智能駕駛 深度學習

《物聯(lián)網(wǎng)技術》雜志

2511 篇文章

關注

發(fā)布文章

編輯精選

技術子站

關閉