有初科技|靜態到動態，二維到三維，手勢識別技術去哪兒？

在美國好萊塢電影中，經常酷酷的主演大手一揮調出一個“空氣投影”螢幕，對著空氣中的螢幕一通點選就開啟一個空間、大門、箱子……收穫觀眾一臉懵逼後的暗暗肯定，那麼，這個技術現實中怎麼實現？

一、手勢識別的類別

在好萊塢主角的鏡頭中，有靜態手勢、平面手勢、立體手勢三種，靜態手勢的“輪廓”識別、平面手勢的“變化輪廓+二維變化方向”識別、立體手勢的“變化輪廓+三維變化方向”識別，識別難度依次升高，有初科技就是第三種三維空間運動手勢識別技術。

二、手勢識別的應用場景

從理解角度來講，靜態手勢就像一個點，相對於攝像頭靜止；平面手勢就像平面滑動的手，或形態變化，或方向變化；立體手勢就像空氣中揮動的手，動作自由變化，方向自由變化。

在應用場景中， VR/AR、電視、手機、電腦……三維空間運動手勢識別比較適合，也是未來主流手勢識別方案，有初科技更是專注這一領域，做到0。01mm識別精度。

三、手勢識別的技術方案

對於靜態手勢，透過攝像頭拍攝物體的二維影象，配合大資料，演算法分析物體特徵；對於平面手勢，除了拍攝二維影象，還要跟蹤、定位，識別或者推測動作意圖；對於立體手勢，除了平面資訊，還有縱深景深層次的資訊，識別難度進一步增加。

1、靜態手勢識別

這是最簡單的手勢識別，可以識別靜態物體，如剪刀、石頭、布等手勢，許多短影片特效、手機手勢自動拍攝使用這種技術方案。

它是一種模式匹配技術，把攝像頭輸入的二維影象資訊，進行大資料比對，演算法進一步分析影象，從而識別這種手勢的含義。

這種技術方案的模式簡單，只能應用於預定的影象識別，應用場景有限，為更復雜的動態識別提供基礎！

2、平面手勢識別

相比靜態的手勢識別，這種技術方案可以識別動態手勢，不僅可以識別手型，還可以識別一些簡單的二維手勢動作，比如揮手、手掌展開等，不過，也僅限於一個平面內的動作，沒有景深、遠近層次識別能力。

除了影象識別，還加入了動作識別，對於一些開關、翻頁、滑動……手勢識別也可以實現了。

3、立體手勢識別

對於立體手勢識別，進入了手勢識別最複雜的層面，靜態手勢識別和平面手勢識別都是立體手勢識別的基礎，也就是加入了景深遠近層次的立體識別，此時，多個攝像頭進行資訊捕捉、定位、跟蹤才可以實現。

這種識別方案，主流的技術有結構光（Structure Light）、光飛時間（Time of Flight）、多角成像（Multi-camera），而多角成像（Multi-camera）是成本最低廉的方案，市場化普及的門檻更低。

它類似人眼睛的工作原理，單隻眼睛看到的影象和兩隻眼睛看到的範圍、角度不同，後者有更大範圍，而且具有了不同方位的定位能力。也就是說，多角成像增加普通攝像頭就可以大大提升效果，不需要任何額外的特殊裝置，硬體要求最低，完全依賴於計算機視覺演算法來匹配兩張圖片裡的相同目標，多角成像技術、效果、成本綜合最優。

愛伊米

有初科技|靜態到動態，二維到三維，手勢識別技術去哪兒？

相關文章

推薦文章