愛伊米

有初科技|靜態到動態,二維到三維,手勢識別技術去哪兒?

在美國好萊塢電影中,經常酷酷的主演大手一揮調出一個“空氣投影”螢幕,對著空氣中的螢幕一通點選就開啟一個空間、大門、箱子……收穫觀眾一臉懵逼後的暗暗肯定,那麼,這個技術現實中怎麼實現?

有初科技|靜態到動態,二維到三維,手勢識別技術去哪兒?

一、手勢識別的類別

在好萊塢主角的鏡頭中,有靜態手勢、平面手勢、立體手勢三種,靜態手勢的“輪廓”識別、平面手勢的“變化輪廓+二維變化方向”識別、立體手勢的“變化輪廓+三維變化方向”識別,識別難度依次升高,有初科技就是第三種三維空間運動手勢識別技術。

二、手勢識別的應用場景

從理解角度來講,靜態手勢就像一個點,相對於攝像頭靜止;平面手勢就像平面滑動的手,或形態變化,或方向變化;立體手勢就像空氣中揮動的手,動作自由變化,方向自由變化。

在應用場景中, VR/AR、電視、手機、電腦……三維空間運動手勢識別比較適合,也是未來主流手勢識別方案,有初科技更是專注這一領域,做到0。01mm識別精度。

三、手勢識別的技術方案

對於靜態手勢,透過攝像頭拍攝物體的二維影象,配合大資料,演算法分析物體特徵;對於平面手勢,除了拍攝二維影象,還要跟蹤、定位,識別或者推測動作意圖;對於立體手勢,除了平面資訊,還有縱深景深層次的資訊,識別難度進一步增加。

1、靜態手勢識別

這是最簡單的手勢識別,可以識別靜態物體,如剪刀、石頭、布等手勢,許多短影片特效、手機手勢自動拍攝使用這種技術方案。

它是一種模式匹配技術,把攝像頭輸入的二維影象資訊,進行大資料比對,演算法進一步分析影象,從而識別這種手勢的含義。

這種技術方案的模式簡單,只能應用於預定的影象識別,應用場景有限,為更復雜的動態識別提供基礎!

2、平面手勢識別

相比靜態的手勢識別,這種技術方案可以識別動態手勢,不僅可以識別手型,還可以識別一些簡單的二維手勢動作,比如揮手、手掌展開等,不過,也僅限於一個平面內的動作,沒有景深、遠近層次識別能力。

除了影象識別,還加入了動作識別,對於一些開關、翻頁、滑動……手勢識別也可以實現了。

3、立體手勢識別

對於立體手勢識別,進入了手勢識別最複雜的層面,靜態手勢識別和平面手勢識別都是立體手勢識別的基礎,也就是加入了景深遠近層次的立體識別,此時,多個攝像頭進行資訊捕捉、定位、跟蹤才可以實現。

這種識別方案,主流的技術有結構光(Structure Light)、光飛時間(Time of Flight)、多角成像(Multi-camera),而多角成像(Multi-camera)是成本最低廉的方案,市場化普及的門檻更低。

它類似人眼睛的工作原理,單隻眼睛看到的影象和兩隻眼睛看到的範圍、角度不同,後者有更大範圍,而且具有了不同方位的定位能力。也就是說,多角成像增加普通攝像頭就可以大大提升效果,不需要任何額外的特殊裝置,硬體要求最低,完全依賴於計算機視覺演算法來匹配兩張圖片裡的相同目標,多角成像技術、效果、成本綜合最優。