根據(jù)《自然》最新發(fā)表的一項(xiàng)研究,一類(lèi)增強(qiáng)學(xué)習(xí)算法在雅達(dá)利經(jīng)典游戲中的得分超過(guò)了人類(lèi)玩家和已有的人工智能系統(tǒng)。這類(lèi)算法被統(tǒng)稱為Go-Explore,它改善了對(duì)復(fù)雜環(huán)境的探索方式,或有望朝著實(shí)現(xiàn)真正智能學(xué)習(xí)體邁出重要一步。
增強(qiáng)學(xué)習(xí)可以讓人工智能系統(tǒng)通過(guò)探索和理解復(fù)雜環(huán)境來(lái)進(jìn)行決策,并學(xué)習(xí)如何以最優(yōu)的方式獲得獎(jiǎng)勵(lì)。然而,當(dāng)遇到很少給予反饋的復(fù)雜環(huán)境時(shí),目前的加強(qiáng)學(xué)習(xí)算法似乎很容易碰壁。
但Go-Explore突破了這些障礙。它可以對(duì)環(huán)境進(jìn)行全面探索,同時(shí)構(gòu)建一個(gè)檔案庫(kù)來(lái)記住它去過(guò)的地方,確保自己不會(huì)忘記通往有望成功的中期階段或是最終勝利(獎(jiǎng)勵(lì))的路線。
利用這類(lèi)算法,論文作者解決了之前未能解決的2600個(gè)雅達(dá)利游戲,驗(yàn)證了這類(lèi)算法的潛力。作者指出,記住并回到有望成功的探索區(qū)域的簡(jiǎn)單原則,是一種強(qiáng)大、通用的探索方法。他們認(rèn)為論文所報(bào)道的算法有望應(yīng)用于機(jī)器人、語(yǔ)言理解和藥物設(shè)計(jì)。
責(zé)任編輯:YYX
-
人工智能
+關(guān)注
關(guān)注
1813文章
49597瀏覽量
260089 -
學(xué)習(xí)算法
+關(guān)注
關(guān)注
0文章
16瀏覽量
7585
發(fā)布評(píng)論請(qǐng)先 登錄
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!
兆芯攜手合作伙伴在WAIC 2025展示人工智能計(jì)算與決策解決方案
超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(大模型篇)
維智科技為什么提出時(shí)空人工智能
物聯(lián)網(wǎng)+人工智能的無(wú)限可能
人工智能和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)
什么是嵌入式人工智能

增強(qiáng)學(xué)習(xí)可讓人工智能通過(guò)探索和理解來(lái)進(jìn)行決策
評(píng)論