資料介紹
描述
強(qiáng)化學(xué)習(xí)是人工智能的一個(gè)分支,計(jì)算機(jī)通過與問題直接交互來了解問題。該項(xiàng)目使用強(qiáng)化學(xué)習(xí)來嘗試學(xué)習(xí)在舊 iPhone 上玩 Doodle Jump 游戲。相機(jī)每秒從 iphone 拍攝 30 張圖像。對(duì)這些圖像進(jìn)行分析,然后一個(gè)簡單的機(jī)器人通過旋轉(zhuǎn) iPhone 并按下屏幕上的按鈕來操縱 iPhone。
硬件
該項(xiàng)目的“智能”部分是運(yùn)行機(jī)器人操作系統(tǒng) (ROS) 和 TensorFlow 的 Nvidia Jetson。機(jī)器人包括:
- 用于旋轉(zhuǎn) iPhone 的步進(jìn)電機(jī)。
- 用于按下 iPhone 屏幕上的按鈕的伺服電機(jī)和螺線管。
- Ximea 相機(jī)用于捕捉 iPhone 屏幕的圖片,并通過 USB3 將它們提供給 Jetson。
- EIBot 板驅(qū)動(dòng)步進(jìn)器和伺服系統(tǒng)。
- 復(fù)古外觀的盒子中還有一個(gè)電源,可為 Jetson 提供 12 伏電壓,為 EIBot 板提供 19 伏電壓,為 USB 集線器提供 5 伏電壓。
- 用于運(yùn)行 Linux 和控制事物的鍵盤、鼠標(biāo)和顯示器。
軟件
ROS 是構(gòu)建此類項(xiàng)目的絕佳方式。使用 ROS,我可以將系統(tǒng)構(gòu)建為一組使用標(biāo)準(zhǔn)消息傳遞系統(tǒng)進(jìn)行通信的獨(dú)立進(jìn)程。該項(xiàng)目包括 C++ 和 Python 進(jìn)程。消息編譯器以兩種語言構(gòu)建存根,因此可以輕松傳遞消息。ROS的主要模塊包括:
- 從相機(jī)接收?qǐng)D像的相機(jī)驅(qū)動(dòng)程序。
- 從屏幕上讀取分?jǐn)?shù)的簡單神經(jīng)網(wǎng)絡(luò)。
- 一個(gè)更大的、基于 TensorFlow 的神經(jīng)網(wǎng)絡(luò),用于分析從相機(jī)接收到的圖片。這是通過與機(jī)器人交互訓(xùn)練的網(wǎng)絡(luò)。
- 一個(gè)存檔過程,負(fù)責(zé)將操作和屏幕圖像保存在 sqlite 數(shù)據(jù)庫中以供以后訓(xùn)練使用。
- EIBot 板驅(qū)動(dòng)程序。
- 屏幕驅(qū)動(dòng)程序。
強(qiáng)化學(xué)習(xí)
人工智能的強(qiáng)化學(xué)習(xí)分支是最活躍的領(lǐng)域之一。該系統(tǒng)使用一種稱為模仿學(xué)習(xí)的變體。我使用機(jī)器人操縱 iPhone 玩了數(shù)百場(chǎng) Doodle Jump 游戲。系統(tǒng)存檔圖像和我采取的行動(dòng)。這些圖像和動(dòng)作被用作神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集。在系統(tǒng)開始做任何有意義的事情之前,它需要數(shù)千張訓(xùn)練圖像。目前該系統(tǒng)可以玩一個(gè)基本的游戲。它不會(huì)瘋狂??地按下按鈕或隨機(jī)搖動(dòng)屏幕。作為學(xué)習(xí)的一部分,我會(huì)盡可能及時(shí)地糾正錯(cuò)誤的決定。這些游戲和修正,以及隨機(jī)選擇的最后 20K 張圖像,在每次運(yùn)行后用作訓(xùn)練。
這個(gè)過程比我預(yù)期的要慢得多。我希望通過采用更復(fù)雜的學(xué)習(xí)模型來改進(jìn)事情,我希望讓系統(tǒng)松散以自行學(xué)習(xí)。
- 使用Matlab進(jìn)行強(qiáng)化學(xué)習(xí)電子版資源下載 0次下載
- 基于強(qiáng)化學(xué)習(xí)的虛擬場(chǎng)景角色乒乓球訓(xùn)練 62次下載
- 基于深度強(qiáng)化學(xué)習(xí)的無人機(jī)控制律設(shè)計(jì)方法 46次下載
- 一種新型的多智能體深度強(qiáng)化學(xué)習(xí)算法 36次下載
- 基于深度強(qiáng)化學(xué)習(xí)仿真集成的壓邊力控制模型 0次下載
- 基于強(qiáng)化學(xué)習(xí)的壯語詞標(biāo)注方法 14次下載
- 虛擬乒乓球手的強(qiáng)化學(xué)習(xí)模仿訓(xùn)練方法 12次下載
- 基于深度強(qiáng)化學(xué)習(xí)的路口單交叉信號(hào)控制 21次下載
- 強(qiáng)化學(xué)習(xí)的雙權(quán)重最小二乘Sarsa算法 5次下載
- 模型化深度強(qiáng)化學(xué)習(xí)應(yīng)用研究綜述 9次下載
- 機(jī)器學(xué)習(xí)中的無模型強(qiáng)化學(xué)習(xí)算法及研究綜述 11次下載
- 一種基于多智能體協(xié)同強(qiáng)化學(xué)習(xí)的多目標(biāo)追蹤方法 20次下載
- 人工智能到底是什么?什么工作需要學(xué)習(xí)人工智能 17次下載
- 人工智能深度學(xué)習(xí)處理架構(gòu)的演進(jìn)GPU功耗和延遲問題如何解決 28次下載
- 強(qiáng)化學(xué)習(xí)在RoboCup帶球任務(wù)中的應(yīng)用劉飛 0次下載
- 通過強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇 387次閱讀
- 機(jī)器學(xué)習(xí)是如何工作的? 人工智能與機(jī)器學(xué)習(xí)實(shí)例 2081次閱讀
- 懶惰強(qiáng)化學(xué)習(xí)算法在發(fā)電調(diào)控REG框架的應(yīng)用 936次閱讀
- 如何避開人工智能的陷阱 1254次閱讀
- 對(duì)NAS任務(wù)中強(qiáng)化學(xué)習(xí)的效率進(jìn)行深入思考 5086次閱讀
- 量化深度強(qiáng)化學(xué)習(xí)算法的泛化能力 2423次閱讀
- 如何構(gòu)建強(qiáng)化學(xué)習(xí)模型來訓(xùn)練無人車算法 4911次閱讀
- 基于強(qiáng)化學(xué)習(xí)的MADDPG算法原理及實(shí)現(xiàn) 2.1w次閱讀
- 用PopArt進(jìn)行多任務(wù)深度強(qiáng)化學(xué)習(xí) 5699次閱讀
- 強(qiáng)化學(xué)習(xí)環(huán)境研究,智能體玩游戲?yàn)槭裁磪柡?/a> 3644次閱讀
- 什么是強(qiáng)化學(xué)習(xí)?純強(qiáng)化學(xué)習(xí)有意義嗎?強(qiáng)化學(xué)習(xí)有什么的致命缺陷? 1.7w次閱讀
- 探討機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、NLP、計(jì)算機(jī)視覺最新進(jìn)展 5624次閱讀
- 人工智能強(qiáng)化學(xué)習(xí)的原理和目標(biāo) 4948次閱讀
- 5個(gè)頂級(jí)的人工智能開源工具 6240次閱讀
- 利用強(qiáng)化學(xué)習(xí)探索多巴胺對(duì)學(xué)習(xí)的作用 4750次閱讀
下載排行
本周
- 1PFC電路與BOOST電路設(shè)計(jì)實(shí)例分享
- 1.83 MB | 12次下載 | 4 積分
- 2世平基于靈動(dòng)微 SPIN560C 的低壓無刷電機(jī)應(yīng)用方案
- 10.93 MB | 11次下載 | 免費(fèi)
- 3電源測(cè)試報(bào)告-基于 國民技術(shù) N32L406 和杰華特 JW3376+3330 的 BMS 方案
- 6.47 MB | 11次下載 | 免費(fèi)
- 4PWM控制器的控制方法
- 0.39 MB | 3次下載 | 4 積分
- 5電流檢測(cè)芯片F(xiàn)P135應(yīng)用說明
- 1.24 MB | 3次下載 | 免費(fèi)
- 6全面解讀被動(dòng)式與主動(dòng)式PFC電路
- 1.27 MB | 1次下載 | 4 積分
- 7HC88L051F4低功耗芯片規(guī)格書
- 4.76 MB | 1次下載 | 免費(fèi)
- 8CIU32D655x5數(shù)據(jù)手冊(cè)
- 2.14 MB | 1次下載 | 免費(fèi)
本月
- 1常用電子元器件使用手冊(cè)
- 2.40 MB | 52次下載 | 免費(fèi)
- 2高功率密度碳化硅MOSFET軟開關(guān)三相逆變器損耗分析
- 2.27 MB | 33次下載 | 10 積分
- 3PFC電路與BOOST電路設(shè)計(jì)實(shí)例分享
- 1.83 MB | 12次下載 | 4 積分
- 4世平基于靈動(dòng)微 SPIN560C 的低壓無刷電機(jī)應(yīng)用方案
- 10.93 MB | 11次下載 | 免費(fèi)
- 5電源測(cè)試報(bào)告-基于 國民技術(shù) N32L406 和杰華特 JW3376+3330 的 BMS 方案
- 6.47 MB | 11次下載 | 免費(fèi)
- 6USB拓展塢PCB圖資料
- 0.57 MB | 11次下載 | 免費(fèi)
- 7MS1826 HDMI 多功能視頻處理器數(shù)據(jù)手冊(cè)
- 4.51 MB | 9次下載 | 免費(fèi)
- 8HAL9303線性霍爾效應(yīng)傳感器技術(shù)手冊(cè)
- 0.70 MB | 9次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935134次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191424次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183352次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81600次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73818次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論