成人网18视频网站,qvod激情视频在线观看,色国产精品一区在线观看,久久99热国产这有精品,天天舔天天爽,国产日韩视频,伊人久久精品成人网

<noscript id="vxpfr"></noscript>

<center id="vxpfr"></center>

產(chǎn)品系列

行業(yè)應用

投資者關(guān)系

技術(shù)支持

關(guān)于創(chuàng )澤

當前位置：首頁(yè) > 新聞資訊 > 機器人趨勢 > 手勢識別：AI 交互的正確打開(kāi)方式

手勢識別：AI 交互的正確打開(kāi)方式

來(lái)源：-- 編輯：創(chuàng )澤時(shí)間：2020/4/25 主題：其他 [加盟]

一、概述

“手勢是人類(lèi)溝通的自然的方式。硬件限制是我們不能很好地控制我們的設備的限制”，這里的硬件限制指的是傳統的手勢識別算法需要額外的深度傳感器。感謝近十多年不斷發(fā)展的可適應 AI 和邊緣計算崛起，使得這一切逐漸變?yōu)榭赡堋?

我們或將在智能手機、平板電腦、臺式電腦、筆記本電腦、智能手表和智能電視，IOT 設備中看到更多結合空中手勢來(lái)操作的未來(lái)功能。
今年我們已經(jīng)看到有這樣的趨勢，科技巨頭都紛紛推出了自己的手勢識別能力：谷歌在自己的手機和智能音箱上提供了手勢交互的能力，華為在旗艦手機 Mate30 上推出了自己的手勢操控等等，蘋(píng)果也剛剛提交了手勢在智能音箱上應用的相關(guān)專(zhuān)利，實(shí)際上，手勢作為人機交互自然的方式場(chǎng)景簡(jiǎn)直是不言自明，想像一下這些場(chǎng)景：

在看電視的時(shí)候想要換臺，想要調整音量，找不到遙控器的時(shí)候，直接使用手勢來(lái)操作，免去找不到遙控器的抓狂煩惱。

在駕駛汽車(chē)，如果你聽(tīng)到了一很難聽(tīng)的歌，希望趕快切掉，如果需要與觸摸屏顯示器進(jìn)行交互，駕駛員需要將視線(xiàn)從道路上移開(kāi)，這樣有潛在的危險，使用手勢識別使得駕駛更安全。

在使用 iPad 看劇時(shí)，這個(gè)時(shí)候老板/老婆電話(huà)突然進(jìn)來(lái)了，我們對著(zhù) iPad 使用靜音手勢操控設備靜音，科技以人為本。

在智能家居場(chǎng)景，使用手勢操作你的電燈，空調，甚至抽油煙機都是可以想象的場(chǎng)景

總結來(lái)說(shuō)：“You are the only interface you need”。

二、我們現在的業(yè)務(wù)場(chǎng)景

我們所屬天貓精靈 M 實(shí)驗室，主要負責跟天貓精靈相關(guān)的視覺(jué)算法，我們的主要研究方向人機交互視覺(jué)算法，包括手勢識別，肢體識別，還有多模態(tài)視覺(jué)語(yǔ)音交互等。

去年，我們推出了基于天貓精靈智能音箱的超輕量手勢識別算法，今年我們更進(jìn)一步，在技術(shù)，業(yè)務(wù)，算法上進(jìn)行了更為深入的探索：

在天貓精靈大屏產(chǎn)品 CC, CCH, CCL 等上線(xiàn)了手勢操控能力。

我們同優(yōu)酷iPad客戶(hù)端的小伙伴一起，在優(yōu)酷 iPad 版也成功應用了我們的手勢識別能力。

我們在教育L域，我們嘗試了使用手指作為輸入，實(shí)現了手指點(diǎn)讀的相關(guān)能力，讓小朋友“哪里不會(huì )點(diǎn)哪里”。

目前我們在跟電視廠(chǎng)商等 IOT 生態(tài)廠(chǎng)商合作，實(shí)現大屏手勢交互步，未來(lái)丟掉遙控器將不是夢(mèng)。

三、無(wú)處不在的單點(diǎn)（靜態(tài)）手勢

3.1 從天貓精靈到優(yōu)酷 iPad 手勢識別
去年，我們推出了基于天貓精靈智能音箱的超輕量手勢識別算法，今年我們與優(yōu)酷的小伙伴合作，把單點(diǎn)手勢能力進(jìn)一步移植到了優(yōu)酷 iPad 場(chǎng)景中。
3.1.1 單點(diǎn)手勢應用：優(yōu)酷吃飯看劇神器
來(lái)自用戶(hù)的聲音：吃飯看劇神器
這是在優(yōu)酷上線(xiàn)后用戶(hù)自發(fā)介紹的使用視頻，也非常符合我們的場(chǎng)景預期和用戶(hù)痛點(diǎn)：

在看劇的時(shí)候，經(jīng)常有需要跳過(guò)某一小段，快進(jìn)或者快退的時(shí)刻，解決不便直接操作的時(shí)刻（例如吃飯，手里不方便等場(chǎng)景）。

在 iPad 場(chǎng)景：1）受設備體積和重量影響，很少手持設備；2）屏幕較大，用戶(hù)距離設備通常有一定距離，手勢識別帶來(lái)了更為J致的體驗提升。

3.2 走的更遠：大屏遠距手勢交互
3.2.1 大屏交互場(chǎng)景
近年來(lái)，智能電視（智屏）正越來(lái)越多的進(jìn)入千家萬(wàn)戶(hù)。據工信部預測，到 2020 年，智能電視市場(chǎng)滲透率有望達到 90% 以上。除了數量?jì)?yōu)勢，強大的交互能力是智慧家庭入口的必備特質(zhì)。作為智慧家庭 IoT 的另一個(gè)重要入口，智能電視的大屏幕更易實(shí)現交互。
3.2.2 挑戰
要走的更遠，也常常伴隨更大的挑戰。和天貓精靈 CC 或 iPad 這種近身設備相比，在智能電視場(chǎng)景進(jìn)行手勢算法研發(fā)面臨主要面臨的挑戰有：

更遠的距離。智能電視有一塊大屏幕，往往 3-5 米是一個(gè)對人較為舒適和健康的觀(guān)看距離。在這樣一個(gè)距離下，人手在畫(huà)面占比非常小。

更多的人數�？赡苡卸嗳送瑫r(shí)在看電視，因此我們要能及時(shí)甄別和響應每一位觀(guān)眾的交互需求。

更復雜的背景。不同家庭不同電視的擺放位置千變萬(wàn)化，我們的算法要在變化中找不變（手勢識別）

有限的算力。雖然智能電視越來(lái)越普及，但是它們配置的硬件性能依然非常有限。

3.2.3 大屏方案
針對以上挑戰，經(jīng)過(guò)我們算法研發(fā)探索，提出語(yǔ)義注意力機制導引的快速人手檢測和分類(lèi)方法（Contextual-attention-guided fast tiny hand detection and classification）。
大屏解決方案: Contextual-attention-guided fast tiny hand detection and classification
1）Lightweight hourglass-like backbone
輕量J類(lèi) hourglass 模塊對輸入進(jìn)行下采樣，在獲取具有G層語(yǔ)義信息的特征圖的同時(shí)，盡量保留細節性特征，有利于對 tiny hand 的檢測。
2）Contextual attention
3-5 米場(chǎng)景下，人手在整個(gè)輸入圖像中占的像素比非常小。手雖然很小，但是手一般長(cháng)“人”身上，而且距離人體特定的部位（如手腕、胳膊、人臉）較近，同時(shí)與這些部位可能會(huì )有相近的顏色。這些人體或人體部位往往較手要更大，為我們 tiny hand 的檢測提供了額外的 clues，利用這些 clues，可以更好的對 tiny hand 進(jìn)行檢測�；诖�，我們利用 Similarity Context 和 Semantics Context 來(lái)作為 Contextual attention ，從而指導網(wǎng)絡(luò )獲取手區域以外的語(yǔ)義信息，增強檢測能力。

四、落地與優(yōu)化閉環(huán)

相信任何一個(gè)做過(guò) AI 算法落地的同學(xué)，都會(huì )遇到各種各樣的實(shí)際算法問(wèn)題，不管是科大訊飛的語(yǔ)音交互，到現在無(wú)處不在的人臉識別，甚至谷歌的搜索詞排名算法，基于深度學(xué)習的AI算法的非常重要的一個(gè)特點(diǎn)就是越用越好，并漸漸形成數據相關(guān)壁壘。
我們在手勢先后在天貓精靈和優(yōu)酷上線(xiàn)后，我們同樣也經(jīng)歷了這樣的一個(gè)過(guò)程，為了讓我們的算法“越用越好”：

提出了新的檢測算法，應用了前沿的 Overflow-aware 量化方案，J致算法體驗。

我們接入了 AutoML 助力 AI 應用快速落地，以動(dòng)態(tài)閉環(huán)的形式優(yōu)化我們的算法。

4.1 更快更強的端上檢測算法 + overflow-aware 量化應用
4.1.1 更強的端上檢測算法
基于 anchor-free 方案，更G效的算法框架，使用 heatmap 輔助 anchor 方案
基于天貓精靈音箱，IOT 視覺(jué)模組等不同設備算力的硬件條件，對端上的手勢識別提出了更加G的要求，我們進(jìn)一步提升手勢識別算法能力框架：基于流行的 anchor-free centernet 算法，提出了 centernet-lite 的端上檢測算法，不過(guò)在實(shí)際算法的落地的過(guò)程中，我們發(fā)現目前流行的 anchor-free 方案在小網(wǎng)絡(luò )有一些天然劣勢：

由于其天然基于 heatmap，終精度與 heatmap 有很大關(guān)系，這對小型化不利。

同時(shí)，由于 heatmap 的原因，這種方案無(wú)法很好的解決同一類(lèi)物體重疊的情況。

4.1.2 應用 Overflow-aware 低比特量化算法
端上量化
加速目前業(yè)界流行的方案為谷歌 8bit 量化算法，事實(shí)上，有更優(yōu)秀的低比特量化算法：通過(guò)學(xué)習的方法，學(xué)習每一層的 min/max 范圍，動(dòng)態(tài)的調整每一層的量化方案，目前在推理引擎端加速比為 70%。
終我們采用使用 heatmap 方案來(lái)輔助 anchor 檢測方案且融合 Overflow，這取得了比較好的精度和效果的平衡，在天貓精靈硬件上。

4.2 優(yōu)化閉環(huán)：AUTOAI 的手勢線(xiàn)上識別優(yōu)化框架（讓算法越用越好）
我們利用在 deep learning 中有類(lèi)似模型蒸餾的思想，通過(guò)采用預先訓練好的復雜模型（Teacher model）的輸出作為監督信號去訓練線(xiàn)上網(wǎng)絡(luò )（student model）。我們可以在不直接接觸業(yè)務(wù)數據的情況下，不斷進(jìn)行算法的優(yōu)化。
使用圍欄的優(yōu)化結果：

五、產(chǎn)品J的序列（動(dòng)態(tài)）手勢
5.1 為什么要做動(dòng)態(tài)手勢識別
我們在單點(diǎn)手勢已經(jīng)做了非常多的嘗試和應用落地，但是動(dòng)態(tài)手勢作為一種更自然更“爽”的交互方式，是我們一直在不斷鉆研的實(shí)際方向。
從產(chǎn)品的思路上來(lái)說(shuō)，動(dòng)態(tài)手勢提供了更多的交互感和參與感，其應用的場(chǎng)景可能也是不一樣的，比如單點(diǎn)手勢可能應用與 IOT 設備等操控類(lèi)型的算法場(chǎng)景，動(dòng)態(tài)手勢其d特的參與感讓其更適用于教育，娛樂(lè )，線(xiàn)下運營(yíng)等實(shí)際場(chǎng)景，這也是我們不斷突破這個(gè)場(chǎng)景的原因。
5.2 基于 skeleton 的動(dòng)態(tài)手勢識別算法
去年，我們實(shí)現了基于 skeleton-based 的動(dòng)態(tài)手勢識別算法(相關(guān)工作已經(jīng)投稿ISMAR2019,并成功發(fā)表，鏈接：https://ieeexplore.ieee.org/document/8951971)：
但是在實(shí)際的產(chǎn)品化過(guò)程中，我們發(fā)現對于通用的動(dòng)態(tài)手勢識別，純粹的 skeleton-based 方案可能并不實(shí)用，主要原因有：

算力：完成 skeleton-based 的一系列操作：手勢檢測+指尖回歸+時(shí)序網(wǎng)絡(luò )等需要較G算力，在天貓精靈等 IOT 設備上無(wú)法達到產(chǎn)品J別的能力。

motion blur：由于手勢運動(dòng)較快的原因，大部分動(dòng)態(tài)手勢都有運動(dòng)模糊的情況，對檢測+關(guān)鍵點(diǎn)這類(lèi)算法非常不友好。

因此，我們把目光投到了以動(dòng)作識別為基礎、指尖回歸為輔助的時(shí)序推理方案。
5.3 基于視頻理解的動(dòng)態(tài)手勢識別算法
時(shí)序推理
原理：圖像關(guān)系的時(shí)序推理（temporal reasoning）能力，要讓計算機認識這兩個(gè)行為，需要兩張及以上的幀圖像來(lái)相互輔助識別。一個(gè)行為需要被多個(gè)幀協(xié)作來(lái)解釋。這種方案很好的解決了 motion blur 的問(wèn)題，且算力上更可控。
Our Temporal Generation Network_
為解決運動(dòng)模糊等問(wèn)題，采用基于 RGB 時(shí)序序列為主框架的視頻識別方案，提取連續采樣幀的特征，并使用改良的G效快速的非退化 3D 卷積網(wǎng)絡(luò )，對時(shí)序特征進(jìn)行融合。
同時(shí)針對特定手勢的識別，提出一種基于手指關(guān)鍵點(diǎn)的輔助分支，使用 heatmap 分支對指尖關(guān)鍵點(diǎn)進(jìn)行多任務(wù)學(xué)習并回歸，檢測出手指的運動(dòng)軌跡，與 RGB 分支進(jìn)行特征融合，輔助動(dòng)態(tài)手勢識別。算法整體結合了基于 RGB 和關(guān)鍵點(diǎn)方案的優(yōu)勢，達到了速度與精度的平衡。

六、未來(lái)展望
我們已經(jīng)在單點(diǎn)手勢識別，序列手勢識別在算法、業(yè)務(wù)都進(jìn)行了較多的探索和嘗試，關(guān)于手勢識別的未來(lái)算法探索方向和業(yè)務(wù)發(fā)力點(diǎn)，我們也有一些自己的展望：
6.1 3D 手勢崛起
3D 人手姿勢估計是指基于輸入的 RGB 或 RGB-D 圖片進(jìn)行人手建模并找到關(guān)鍵部件（如，骨節點(diǎn)）位置的過(guò)程。我們生活在三維世界，三維手勢交互必然帶來(lái)更自然更舒適的交互體驗。我們也在 3D 人手交互方面正進(jìn)行積J探索，未來(lái)在電商產(chǎn)品交互式展示、VR/AR、手語(yǔ)識別、在線(xiàn)教育等方面，我們會(huì )推出更多的交互性更強的產(chǎn)品，提供更人性化的交互體驗和服務(wù)。
Oculus Quest 在今年推出的 3D 手勢操控
6.2 手勢在 IOT 場(chǎng)景的應用
手勢控制能否超越語(yǔ)音控制成為智能家居設備自然不過(guò)的設備呢？在 IOT 場(chǎng)景，如果可以使用手勢控制電視，燈泡，空調等等。目前已經(jīng)有一些 startup 開(kāi)始了在這方面的探索。
比如 Bixi，Bixi 是一款手勢小遙控器，感應你的空中手勢，可以指揮你喜歡的智能手機應用程序、LifX 或者 Hue 燈泡、互聯(lián)網(wǎng)揚聲器、GoPro 和許多其他 IoT 設備。
再比如如下圖的 Bearbot 萬(wàn)用遙控器,除了萌系的外觀(guān)以外,還可以支持自定義手勢控制全屋家電,讓你從此擺脫一堆遙控器的束縛。
Bearbot 手勢遙控器，圖片來(lái)源：https://www.indiegogo.com/projects/bearbot#/
6.3 手勢在教育場(chǎng)景的更多應用
除了手指點(diǎn)讀，手勢在教育行業(yè)其實(shí)應該有更多的應用，比如現在大火的在線(xiàn)教育，手勢可以增加虛擬課堂的互動(dòng)感和，同時(shí)對于小朋友來(lái)說(shuō)，手勢/視覺(jué)提供的有趣新奇的操控體驗也是對幼兒提G課堂注意力非常重要的一環(huán)，例如，引導舉手回答問(wèn)題。再比如，我們需要做一些課堂小練習，普通的模式太枯燥，使用動(dòng)態(tài)手勢識別“畫(huà)對勾”，“畫(huà)叉叉”讓小朋友以互動(dòng)游戲的方式完成這些練習。

查看更多相似文章

協(xié)作機器人國內外發(fā)展情況

協(xié)作機器人，其操作精度完全取決于核心零部件控制精度，更換作業(yè)時(shí)需要人工重設機械臂運動(dòng)軌跡

ai產(chǎn)品評測與抗疫支撐

研究領(lǐng)域覆蓋人工智能全產(chǎn)業(yè)鏈，建設開(kāi)源生態(tài)、打造相關(guān)技術(shù)標準、推動(dòng)可信AI落地，促進(jìn)產(chǎn)業(yè)融合

基于服務(wù)機器人的避障能力測試方法研究

機器人避障是機器人技術(shù)中一項最基礎也是關(guān)鍵的功能，在讓機器人行動(dòng)過(guò)程中保證不發(fā)生碰撞，避免結構的過(guò)度老化、脫落

我國工業(yè)機器人的發(fā)展趨勢

2019年工業(yè)機器人市場(chǎng)規模呈現下降趨勢，但總體市場(chǎng)規模仍然呈現穩定上升趨勢，預計到2022年，達到552.3億元

國內機器人發(fā)展現狀與趨勢

2019年中國機器人市場(chǎng)規模持續增長(cháng),預計到2022年市場(chǎng)規模將達到991.9億元，2020-2022三年復合增長(cháng)率為19.0%。

服務(wù)機器人發(fā)展趨勢

新冠肺炎讓服務(wù)機器人承擔了必要的責任,讓服務(wù)機器人迎來(lái)黃金發(fā)展期

物流機器人優(yōu)勢-發(fā)展趨勢和應用前景

物流機器人是在倉儲、物流、運輸行業(yè)，用于貨物輸送與分揀等作業(yè)的機器人，能夠自主或按預定路線(xiàn)自動(dòng)行駛，將貨物或物料自動(dòng)從起始點(diǎn)運送到目的地，有效提高運送和分揀效率，減少人工操作帶來(lái)的風(fēng)險

物流機器人-國內外發(fā)展情況

物流機器人國外起步較早，在機械結構、導航定位、運動(dòng)控制、傳感器等方面較為成熟，國內物流機器人雖起步較晚，但發(fā)展迅猛，在電商、汽車(chē)、煙草、印鈔、新聞紙等行業(yè)已有大規模應用。

清潔機器人優(yōu)勢-發(fā)展趨勢和應用前景

清潔機器人,能夠對室內或室外環(huán)境進(jìn)行自動(dòng)清潔工作，具有環(huán)境識別、路徑規劃、自主導航、智能避障、自動(dòng)清潔等功能

清潔機器人-國內外發(fā)展情況

清潔機器人,國外步較早,產(chǎn)品形態(tài)和應用場(chǎng)景也較為成熟,國內依托于逐漸成熟的低速自動(dòng)駕駛技術(shù),推出商用清潔機器人產(chǎn)品

陪護機器人優(yōu)勢-發(fā)展趨勢和應用前景

陪護機器人,能夠協(xié)助醫護人員或家屬對患者或老人進(jìn)行護理，監測被陪護對象的健康情況，并提供陪伴服務(wù)

陪護機器人-國內外發(fā)展情況

陪護機器人能夠協(xié)助醫護人員或家屬對患者或老人進(jìn)行護理,國內陪護機器人的研究與國外相比起步較晚,存在一定的差距

資料獲取

新聞資訊

== 資訊 ==

» 2025養老機器人行業(yè)政策-《互聯(lián)家庭環(huán)

» 養老機器人研究,近萬(wàn)億級機器人市場(chǎng),生態(tài)

» 人形機器人市場(chǎng)規模,它還能有多大-205

» 7個(gè)關(guān)于人形機器人的關(guān)鍵要點(diǎn)：市場(chǎng),技術(shù)

» 2025~2035元趨勢報告(機器人)-

» 山東省“人工智能+教育”實(shí)施方案2025

» 2025具身機器人行業(yè)未來(lái)展望報告-當前

» 機器人和嵌入式邊緣AI應用設計的計算平臺

» 人腦與機器人大腦對應關(guān)系：大小腦對中央控

» 人形機器人運動(dòng)控制:制約商業(yè)化落地進(jìn)程的

» 山東省機器人產(chǎn)業(yè)高質(zhì)量發(fā)展行動(dòng)計劃（20

» 2025AI賦能教育：高考志愿填報工具使

» 核電人形機器人的八點(diǎn)特性:高輻射耐受性,

» 核電人形機器人專(zhuān)題報告[工業(yè)應用場(chǎng)景],

» 機器人的大腦在手眼腦協(xié)同中發(fā)揮怎么樣的作

== 機器人推薦 ==

迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人底盤(pán)

機器人底盤(pán)

商用機器人 Disinfection Robot 展廳機器人智能垃圾站輪式機器人底盤(pán) 迎賓機器人移動(dòng)機器人底盤(pán) 講解機器人紫外線(xiàn)消毒機器人大屏機器人霧化消毒機器人服務(wù)機器人底盤(pán) 智能送餐機器人霧化消毒機機器人OEM代工廠(chǎng) 消毒機器人排名智能配送機器人圖書(shū)館機器人導引機器人移動(dòng)消毒機器人導診機器人迎賓接待機器人前臺機器人導覽機器人酒店送物機器人云跡科技潤機器人云跡酒店機器人智能導診機器人

版權所有 © 創(chuàng )澤智能機器人集團股份有限公司 中國運營(yíng)中心：北京·清華科技園九號樓5層中國生產(chǎn)中心：山東日照太原路71號
銷(xiāo)售1：4006-935-088 銷(xiāo)售2：4006-937-088 客服電話(huà)： 4008-128-728

<pre id="t5ym8"><strong id="t5ym8"></strong></pre>