亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

<big id="ks5cr"></big>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費(fèi)

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

一種AI算法，可以根據(jù)說話聲音來預(yù)測說話人將作出怎樣的肢體動作

來自UC Berkeley和MIT的研究人員開發(fā)了一種AI 算法，可以根據(jù)說話聲音來預(yù)測說話人將作出怎樣的肢體動作。所預(yù)測的動作十分自然、流暢，本文帶來技術(shù)解讀。

人在說話的時候，常常伴隨著身體動作，不管是像睜大眼睛這樣細(xì)微的動作，還是像手舞足蹈這樣夸張的動作。

最近，來自UC Berkeley和MIT的研究人員開發(fā)了一種AI算法，可以根據(jù)說話聲音來預(yù)測說話人將作出怎樣的肢體動作。

研究人員稱，只需要音頻語音輸入，AI就能生成與聲音一致的手勢。具體來說，他們進(jìn)行的是人的獨(dú)白到手勢和手臂動作的“跨模態(tài)轉(zhuǎn)換”(cross-modal translation)。相關(guān)論文發(fā)表在CVPR 2019上。

研究人員收集了10個人144小時的演講視頻，其中包括一名修女、一名化學(xué)教師和5名電視節(jié)目主持人(Conan O’Brien, Ellen DeGeneres, John Oliver, Jon Stewart, 以及Seth Meyers)。

演講視頻數(shù)據(jù)集

他們使用現(xiàn)有的算法生成代表說話者手臂和手位置的骨架圖形。然后他們用這些數(shù)據(jù)訓(xùn)練了自己的算法，這樣AI就可以根據(jù)說話者的新音頻來預(yù)測手勢。

圖1：從語音到手勢的轉(zhuǎn)換的示例結(jié)果。由下往上：輸入音頻、由我們的模型預(yù)測的手臂和手的姿態(tài)，以及由Caroline Chan等人在“Everybody Dance Now”論文中提出的方法合成的視頻片段。

研究人員表示，在定量比較中，生成的手勢比從同一說話者者隨機(jī)選擇的手勢更接近現(xiàn)實，也比從一種不同類型的算法預(yù)測的手勢更接近現(xiàn)實。

圖2：特定于說話者的手勢數(shù)據(jù)集

說話者的手勢也是獨(dú)特的，對一個人進(jìn)行訓(xùn)練并預(yù)測另一個人的手勢并不奏效。將預(yù)測到的手勢輸入到現(xiàn)有的圖像生成算法中，可以生成半真實的視頻。

研究團(tuán)隊表示，他們的下一步是不僅根據(jù)聲音，還根據(jù)文字稿來預(yù)測手勢。該研究潛在的應(yīng)用包括創(chuàng)建動畫角色、動作自如的機(jī)器人，或者識別假視頻中人的動作。

為了支持對手勢和語音之間關(guān)系的計算理解的研究，他們還發(fā)布了一個大型的個人特定手勢視頻數(shù)據(jù)集。

方法詳解：兩階段從語音預(yù)測視頻

給定原始語音，我們的目標(biāo)是生成說話者相應(yīng)的手臂和手勢動作。

我們分兩個階段來完成這項任務(wù)——首先，由于我們用于訓(xùn)練的唯一信號是相應(yīng)的音頻和姿勢檢測序列，因此我們使用L1回歸到2D關(guān)鍵點(diǎn)的序列堆棧來學(xué)習(xí)從語音到手勢的映射。

其次，為了避免回歸到所有可能的手勢模式的平均值，我們使用了一個對抗性鑒別器，以確保產(chǎn)生的動作相對于說話者的典型動作是可信的。

任何逼真的手勢動作都必須在時間上連貫流暢。我們通過學(xué)習(xí)表示整個話語的音頻編碼來實現(xiàn)流暢性，該編碼考慮了輸入語音的完整時間范圍s，并一次性(而不是遞歸地)預(yù)測相應(yīng)姿勢的整個時間序列p。

我們的完全卷積網(wǎng)絡(luò)由一個音頻編碼器和一個1D UNet轉(zhuǎn)換架構(gòu)組成的，如圖3所示。

圖3：語音到手勢的翻譯模型。

一個 convolutional audio encoder對2D譜圖進(jìn)行采樣并將其轉(zhuǎn)換為1D信號。然后，平移模型G預(yù)測相應(yīng)的2D姿勢序列堆棧。對真實數(shù)據(jù)姿勢的L1回歸提供了一個訓(xùn)練信號，而一個對抗性辨別器D則確保預(yù)測的動作既具有時間一致性，又符合說話者的風(fēng)格。

我們使用UNet架構(gòu)進(jìn)行轉(zhuǎn)換，因為它的bottleneck為網(wǎng)絡(luò)提供了過去和未來的時間上下文，而skip connections允許高頻時間信息通過，從而能夠預(yù)測快速移動。

定量和定性結(jié)果

圖4：我們訓(xùn)練過的模型是特定于人的。對于每個說話者的音頻輸入(行)，我們應(yīng)用所有其他單獨(dú)訓(xùn)練的說話者模型(列)。顏色飽和度對應(yīng)于待測集上的L1損耗值(越低越好)。對于每一行，對角線上的項都是顏色最淺的，因為模型使用訓(xùn)練對象的輸入語音效果最好。

表1：在測試集上使用L1損失的語音到手勢轉(zhuǎn)換任務(wù)的定量結(jié)果(越低越好)

圖5：語音到手勢轉(zhuǎn)換的定性結(jié)果。我們展示了Dr. Kubinec(講師)和Conan O’Brien(節(jié)目主持人)的輸入音頻頻譜圖和預(yù)測手勢。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

語音

語音

+關(guān)注

關(guān)注
3

文章
403

瀏覽量
39401
鑒別器

鑒別器

+關(guān)注

關(guān)注
0

文章
8

瀏覽量
8854
AI算法

AI算法

+關(guān)注

關(guān)注
0

文章
268

瀏覽量
13024

原文標(biāo)題：你說話時的肢體動作，AI僅憑聲音就能預(yù)測 | CVPR 2019

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

華秋（原“華強(qiáng)聚豐”）：

電子發(fā)燒友

華秋開發(fā)

華秋電路(原"華強(qiáng)PCB")

華秋商城(原"華強(qiáng)芯城")

華秋智造

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機(jī)器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

華秋

關(guān)于我們

投資關(guān)系

新聞動態(tài)

加入我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

硬聲APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

黃晶晶：huangjingjing@elecfans.com

內(nèi)容合作（海外）

張迎輝：mikezhang@elecfans.com

供應(yīng)鏈服務(wù) PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區(qū)合作

劉勇：liuyong@huaqiu.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

電子工程師社區(qū)

1-32層PCB打樣·中小批量

元器件現(xiàn)貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業(yè)動態(tài)

聯(lián)系我們

企業(yè)文化

企業(yè)宣傳片

加入我們

版權(quán)所有 ? 湖南華秋數(shù)字科技有限公司

長沙市望城經(jīng)濟(jì)技術(shù)開發(fā)區(qū)航空路6號手機(jī)智能終端產(chǎn)業(yè)園2號廠房3層（0731-88081133）
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
亚洲精品久久久久久久久久久