盡管早期的消費型智能眼鏡也嘗試過使用觸控板和手持或可穿戴控制器用于信息輸入,但實際上HoloLens 2的手勢控制界面和Magic Leap One代表著智能眼鏡輸入的未來。
谷歌的研究部門開發(fā)了一種新的機器學(xué)習(xí)模型,可以在輕量智能眼鏡中實現(xiàn)高端AR系統(tǒng)中的復(fù)雜手勢控制,無需額外的體積或者深度感測和運動傳感器的成本。
本周,谷歌人工智能團隊公布了手掌/手指追蹤的最新方法。新方法使用了開源、跨平臺的MediaPipe框架,在移動設(shè)備上(而不是在云端)即時處理視頻,通過機器學(xué)習(xí)模型映射多達21個手部和手指點。
“我們希望向更廣泛的研究和開發(fā)團隊提供這種手感功能,帶來更多創(chuàng)造性案例,刺激新的應(yīng)用程序和研究途徑的產(chǎn)生,”谷歌團隊在一篇詳博客文章中寫道。
手掌/手指追蹤方法實際上把任務(wù)劃分成為三個機器學(xué)習(xí)模型。谷歌的研究人員沒有使用機器學(xué)習(xí)模型來識別手掌本身,而是用的手掌檢測算法,平均準確率接近96%。
檢測到手掌后,另一個機器學(xué)習(xí)模型識別出了相機視圖中手掌的21個關(guān)節(jié)坐標點。第三種算法通過記錄每個手指的手勢,與預(yù)定義的手勢進行匹配,學(xué)習(xí)模型支持分辨計數(shù)和其他各種手勢。
換句話說,這種機器學(xué)習(xí)方法可以直接應(yīng)用在Android或iOS設(shè)備上,無需專門的運動或深度傳感器。谷歌團隊還在研發(fā)開放源代碼方式的模型,以便其他開發(fā)人員和研究人員使用。團隊的計劃也會不斷提高機器學(xué)習(xí)模型的準確性和性能。
在不久的將來,這款手控跟蹤系統(tǒng)將幫助開發(fā)者打造類似于Snapchat和Facebook的AR體驗,將手控識別和跟蹤技術(shù)融入自拍中。
谷歌還可以利用這項技術(shù)與Pixel 4上的Soli雷達傳感器合作,打造一些獨特的AR體驗,類似于iPhone X系列上的Animojis,后者把蘋果的ARKit和TrueDepth相機組合使用。
然而,通過這一進步,我們更要思考機器學(xué)習(xí)方法可以給智能眼鏡帶來什么。硬件制造商不再使用運動深度傳感器,更接近HoloLens 2和Magic Leap One上的用戶輸入方法。
越來越多的科技公司需要人工智能來解決AR可穿戴設(shè)備在外形和功能方面的問題。甚至微軟也在混合使用ARKit和ARcore的人工智能方法來檢測界面瑕疵,以更好地實現(xiàn)HoloLens 2的新場景理解能力。軟件應(yīng)該是研發(fā)智能眼鏡的關(guān)鍵。只能眼鏡足夠輕薄,可以每天佩戴,而不僅限于家里或辦公室區(qū)域。
-
谷歌
+關(guān)注
關(guān)注
27文章
6242瀏覽量
110099 -
手勢識別
+關(guān)注
關(guān)注
8文章
231瀏覽量
48673 -
AI
+關(guān)注
關(guān)注
89文章
37540瀏覽量
293306
發(fā)布評論請先 登錄
【飛凌OK-MX9596-C開發(fā)板試用】③云端AI拍照識別
【技術(shù)討論】智能戒指手勢交互:如何優(yōu)化PCBA成本與實現(xiàn)<20ms低延遲?
XenG202G | 揮手手勢識別參考設(shè)計(三維)
RK3576助力智慧安防:8路高清采集與AI識別
AI 芯片浪潮下,職場晉升新契機?
基于恩智浦Mi.MX RT700 MCU實現(xiàn)手勢識別開發(fā)
【嘉楠堪智K230開發(fā)板試用體驗】手勢識別
【BPI-CanMV-K230D-Zero開發(fā)板體驗】人臉檢測、手勢識別、車牌識別
活動名單公布!學(xué)電路設(shè)計分享學(xué)習(xí)心得、技術(shù)疑問及實戰(zhàn)成果,贏取專屬禮品!
工地AI行為識別系統(tǒng)作用
景區(qū)AI行為識別系統(tǒng)作用

谷歌公布AI手勢識別新成果
評論