資料介紹
三個難點
與棋類運動和電腦游戲不同,在機器人運動控制領(lǐng)域運用增強學(xué)習(xí)方法主要有以下三個難點:
“高”,即狀態(tài)和行為維數(shù)高。比如讓機器人為我們端杯水,需要增強學(xué)習(xí)算法提供如下的最優(yōu)運動控制策略:憑借具有深度、魚眼和普通圖像拍攝功能的實感TM攝像頭獲得圖像,分析出人和杯子的方向、距離、姿態(tài)以及人的表情,并通過聽覺獲得人發(fā)出命令的方位和急促程度,從而控制機器人(機械腿或底盤)走到人的面前;借助機器人手獲得重量、溫度、滑動信息,依據(jù)人手的方位控制機器人手臂和手指各關(guān)節(jié)的實時角度。這個過程所涉及的狀態(tài)和行為的維數(shù)以百萬計,而對每個狀態(tài)行為進行價值(如人的滿意度)計算也非常困難。
“大”,即狀態(tài)信息誤差大。棋類運動中的狀態(tài)(盤面)信息完全準(zhǔn)確,但機器人所面對的狀態(tài)信息,大多存在明顯誤差。如在遞水這個場景中,我們所獲得的人和杯子的方向、距離、姿態(tài)以及人的表情、動作信息都存在誤差。誤差可能是由機械振動或機器人運動等因素造成,也可能是因為傳感器精度不夠高,存在噪聲,亦或是由于算法不夠精確。這些誤差都增加了增強學(xué)習(xí)的難度。
“少”,即樣本量少。不同于人臉等圖像識別任務(wù)中動輒百萬的訓(xùn)練樣本,機器人增強學(xué)習(xí)可獲得的樣本數(shù)量少、成本高,主要原因是:機器人在運動過程中可能出現(xiàn)疲勞和損壞,還可能會對目標(biāo)物或環(huán)境造成破壞;機器人的參數(shù)在運動中會發(fā)生改變;機器人運動需要一定的時間;很多機器人學(xué)習(xí)任務(wù)需要人的參與配合(如上述遞水場景中需要有人接水)。這些都使得獲得大量訓(xùn)練樣本十分困難。
三種解決方法
面對上述困難,我們難道就無計可施了嗎?當(dāng)然不是,科學(xué)家們提出了一整套解決問題的思路,主要有如下三點:
一個融合了“虛、先、近”三種策略的機器人運動控制增強學(xué)習(xí)框架
“虛”,即采用虛實結(jié)合的技術(shù)。我們可以通過程序虛擬出環(huán)境讓機器人進行預(yù)訓(xùn)練,以克服實際采樣過程中可能出現(xiàn)的種種難題。虛擬軟件不但能模擬機器人的完整運動特性,如有幾個關(guān)節(jié)、每個關(guān)節(jié)能如何運動等,還能模擬機器人和環(huán)境作用的物理模型,如重力、壓力、摩擦力等。機器人可以在虛擬環(huán)境中先進行增強學(xué)習(xí)的訓(xùn)練,直到訓(xùn)練基本成功再在實際環(huán)境中進一步學(xué)習(xí)。虛實結(jié)合的增強學(xué)習(xí)主要面臨兩個挑戰(zhàn)。一個是如何保證虛擬環(huán)境中的學(xué)習(xí)結(jié)果在實際中仍然有效。面對這一難題,我們可以對虛擬環(huán)境與實際環(huán)境中的差別進行隨機性的建模,在虛擬環(huán)境中訓(xùn)練時引入一些噪聲。另一個挑戰(zhàn)是如何實時獲得外部環(huán)境和目標(biāo)的虛擬模型,最新的深度攝像頭可以幫助我們解決這個問題。
“先”,即先驗知識。引入先驗知識可以大幅降低增強學(xué)習(xí)優(yōu)化的難度。先驗知識有很多種,但對于機器人而言,獲得先驗知識比較有效的途徑是“學(xué)徒學(xué)習(xí)”,即讓機器人模仿人的示教動作,再在應(yīng)用中通過增強學(xué)習(xí)優(yōu)化。由于機器人運動所面臨的狀態(tài)維數(shù)極高,通過手工輸入知識非常困難,而人做示范則較為方便,還降低了先驗知識引入的門檻,不太了解機器人技術(shù)的人也可以進行。示教主要有三類方法:一是由人拖動機器手做動作;二是使用專門的運動捕捉設(shè)備獲得人的動作;三是直接使用深度攝像頭獲取人的動作。從長遠看,第三種方法會成為以后的發(fā)展趨勢。
“近”,即近似。由于機器人運動控制的狀態(tài)維數(shù)高、樣本少且存在誤差,所以將維數(shù)高的狀態(tài)近似為不丟失主要信息又能增加可訓(xùn)練性的函數(shù)就成為一項重要的選擇。使用近似方法提高增強學(xué)習(xí)算法性能的一大熱點就是將深度學(xué)習(xí)技術(shù)與增強學(xué)習(xí)相結(jié)合所形成的深度增強學(xué)習(xí)技術(shù),此技術(shù)直接將機器人的狀態(tài)(如傳感器和關(guān)節(jié)狀態(tài)輸入)通過高層的卷積神經(jīng)網(wǎng)絡(luò)映射為機器人的動作輸出,大大提高了機器人基于增強學(xué)習(xí)進行運動控制的性能。該技術(shù)在近兩年來取得了突破性的進展。
上述解決方法為增強學(xué)習(xí)在機器人動作控制領(lǐng)域的應(yīng)用打開了大門,成為機器人研究的重要方向之一,但目前還存在許多實際難題亟待解決??蒲腥藛T正在對深度增強學(xué)習(xí)、學(xué)徒學(xué)習(xí)(模仿學(xué)習(xí))和虛實結(jié)合學(xué)習(xí)方面進行一系列探索。
- 基于Matlab的機構(gòu)與機器人分析資料下載 13次下載
- 基于DSP和PC的農(nóng)業(yè)機器人控制系統(tǒng) 18次下載
- 基于DSP的排險機器人車體控制系統(tǒng) 14次下載
- 機器人PID控制概述 27次下載
- 如何實現(xiàn)雙足步行機器人系統(tǒng)設(shè)計與運動控制及虛擬現(xiàn)實的仿真研究 20次下載
- 如何分析新型二自由度平動并聯(lián)機器人的結(jié)構(gòu)和運動學(xué) 7次下載
- 基于ZMP的雙足機器人動態(tài)步行控制研究 31次下載
- 設(shè)計全向滾動球形機器人的內(nèi)驅(qū)動機構(gòu)和運動分析與軌跡規(guī)劃 6次下載
- 基于關(guān)節(jié)型機器人運動誤差分析 6次下載
- 機器人運動學(xué)(精品教程) 0次下載
- 中型足球機器人運動控制研究 0次下載
- 一種基于DSP的移動機器人運動控制器設(shè)計 77次下載
- 輪式移動機器人WMR的運動分析 33次下載
- 神經(jīng)網(wǎng)絡(luò)在機器人運動控制中的應(yīng)用 38次下載
- 基于ARM9的嵌入式足球機器人運動控制系統(tǒng)
- 如何使用PLC控制機器人 1878次閱讀
- 運動控制和機器人系統(tǒng)有什么區(qū)別 603次閱讀
- 機器人運動學(xué)中的非完整約束與運動模型推導(dǎo) 2016次閱讀
- 機器人控制系統(tǒng)分類_機器人控制系統(tǒng)有哪些 2.6w次閱讀
- 機器人控制器有哪些類型_機器人控制器發(fā)展 1.2w次閱讀
- 移動機器人控制系統(tǒng)設(shè)計與仿真 3638次閱讀
- 為什么是使用減速機而不是直接控制電機轉(zhuǎn)速來控制機器人關(guān)節(jié)運動? 7586次閱讀
- 如何利用減速器替代電機轉(zhuǎn)速控制機器人運動 4646次閱讀
- 淺析運動控制和機器人系統(tǒng)的區(qū)別 6988次閱讀
- 機器人的運動控制的介紹和如何將機器人的運動控制分成4種任務(wù) 1w次閱讀
- 人工智能AI在機器人運動控制領(lǐng)域盤點簡介 6947次閱讀
- AI和VR在機器人控制的實在應(yīng)用匯總 5620次閱讀
- 為什么使用減速器代替電機轉(zhuǎn)速來控制機器人關(guān)節(jié)運動? 4745次閱讀
- 基于PLC的機器人伺服運動控制系統(tǒng)設(shè)計詳解 1.6w次閱讀
- 集成、PLC、機器人和運動控制 5197次閱讀
下載排行
本周
- 1高功率密度碳化硅MOSFET軟開關(guān)三相逆變器損耗分析
- 2.27 MB | 33次下載 | 10 積分
- 2經(jīng)典1000W純正弦波逆變器原理圖資料
- 0.08 MB | 6次下載 | 10 積分
- 3DH1766系列·三路可編程直流電源技術(shù)手冊
- 1.93 MB | 3次下載 | 免費
- 4智能蓄電池充放電測試儀 蓄電池放電檢測儀專業(yè)防護功能
- 0.13 MB | 2次下載 | 免費
- 5GD選型手冊
- 6.92 MB | 2次下載 | 免費
- 68784芯片點位圖資料
- 0.16 MB | 1次下載 | 1 積分
- 7WORLD 3000 H型接線圖資料
- 0.17 MB | 1次下載 | 10 積分
- 8HAL9303線性霍爾效應(yīng)傳感器技術(shù)手冊
- 0.70 MB | 1次下載 | 免費
本月
- 1高功率密度碳化硅MOSFET軟開關(guān)三相逆變器損耗分析
- 2.27 MB | 33次下載 | 10 積分
- 2常用電子元器件使用手冊
- 2.40 MB | 30次下載 | 免費
- 3電路、電流和電壓介紹
- 14.96 MB | 9次下載 | 免費
- 4MS1826 HDMI 多功能視頻處理器數(shù)據(jù)手冊
- 4.51 MB | 8次下載 | 免費
- 5USB拓展塢PCB圖資料
- 0.57 MB | 7次下載 | 免費
- 6經(jīng)典1000W純正弦波逆變器原理圖資料
- 0.08 MB | 6次下載 | 10 積分
- 7TYPEC電路原理圖資料
- 0.14 MB | 5次下載 | 免費
- 8SR520-SR5100肖特基二極管規(guī)格書
- 0.11 MB | 4次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935134次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191424次下載 | 10 積分
- 5十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183352次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81600次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73818次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論