亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

理論到操作實(shí)現(xiàn) 讓AI玩具機(jī)器人等智能硬件在嘈雜環(huán)境中只聽(tīng)我說(shuō)話

ListenAI ? 來(lái)源:jf_40317719 ? 作者:jf_40317719 ? 2025-10-17 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【理論到操作實(shí)現(xiàn)】讓AI玩具機(jī)器人智能硬件在嘈雜環(huán)境中只聽(tīng)我說(shuō)話

前言

本文分享的小聆AI相關(guān)的理論和聲紋技術(shù),主要是用來(lái)提升 AI 智能玩具、機(jī)器人等智能硬件在實(shí)際場(chǎng)景的語(yǔ)音交互體驗(yàn)。在用戶使用中通常會(huì)遇到這些問(wèn)題:1、身邊人交談干擾;2、用戶發(fā)音模糊;3、玩具碰撞聲、哭鬧聲等突發(fā)高頻噪聲易被聲學(xué) VAD 誤判為語(yǔ)音;4、呼吸聲、風(fēng)聲等高頻干擾導(dǎo)致語(yǔ)音失真。針對(duì)這些影響人機(jī)交互的常見(jiàn)問(wèn)題,小聆AI做了對(duì)應(yīng)處理,并在小程序端增加了單獨(dú)人聲慮噪的配置功能,大家按照文章中的步驟操作即可自主實(shí)現(xiàn)智能硬件對(duì)應(yīng)功能。下方視頻為實(shí)際人機(jī)交互場(chǎng)景中的率噪效果。

https://docs2.listenai.com/z/233.mp4

單獨(dú)人聲慮噪的實(shí)現(xiàn)理論

為保證AI玩具機(jī)器人等智能硬件在嘈雜環(huán)境中只聽(tīng)“我”說(shuō)話的效果,從以下幾點(diǎn)進(jìn)行了優(yōu)化:

1、 語(yǔ)音VAD優(yōu)化:消除非人聲噪聲,不響應(yīng)常見(jiàn)家居噪聲(如風(fēng)扇、電視等)

2、 聲紋過(guò)濾:對(duì)人聲進(jìn)行聲紋對(duì)比,只保留指定聲紋的音頻

3、 語(yǔ)義VAD噪聲過(guò)濾:分析上下文語(yǔ)義,用戶附和時(shí)不打斷播報(bào),用戶猶豫、停頓延長(zhǎng)拾音時(shí)間

實(shí)現(xiàn)步驟

1、 準(zhǔn)備一個(gè)語(yǔ)音交互硬件,可以是CSK6大模型開(kāi)發(fā)板、聆思Arcs mini大模型MCP開(kāi)發(fā)板、也可以是ESP32語(yǔ)音模組

2、 打開(kāi)“小聆AI”小程序,點(diǎn)擊添加設(shè)備,選擇對(duì)應(yīng)硬件按提示操作即可完成綁定進(jìn)行配置 (ESP32的開(kāi)發(fā)板可以選擇【開(kāi)源套件】)

3、 綁定成功后,進(jìn)入【語(yǔ)音識(shí)別配置】→【識(shí)別模式】→ 【僅識(shí)別已注冊(cè)聲紋的用戶】

識(shí)別默認(rèn)默認(rèn)為【所有人】

識(shí)別已注冊(cè)聲紋的用戶:在連續(xù)交互模式下,僅識(shí)別已注冊(cè)聲紋的用戶語(yǔ)音,如果只想讓AI語(yǔ)音只回復(fù)指定人可以選擇這項(xiàng)

識(shí)別喚醒設(shè)備的用戶:在連續(xù)交互模式下,僅支持喚醒設(shè)備的用戶繼續(xù)交互,其余人的語(yǔ)音將不會(huì)被識(shí)別 (可以理解為AI語(yǔ)音只回復(fù)用名字叫醒它的那個(gè)人)

4、 點(diǎn)擊【確認(rèn)】后,進(jìn)入聲紋注冊(cè)頁(yè)面,點(diǎn)擊【開(kāi)始錄音】,按文本讀完后點(diǎn)擊創(chuàng)建即可。

5、 聲紋創(chuàng)建成功后會(huì)進(jìn)入聲紋對(duì)應(yīng)的【編輯畫(huà)像】界面,這個(gè)頁(yè)面可以手動(dòng)填入聲紋主人的興趣愛(ài)好、需要AI長(zhǎng)期記憶的內(nèi)容。

畫(huà)像編輯完成后返回【識(shí)別模式】界面,選擇【僅識(shí)別已注冊(cè)聲紋的用戶】即可實(shí)現(xiàn)視頻中的效果。

小聆AI語(yǔ)音交互的更多資料和玩法實(shí)現(xiàn)參考

小聆AI詳細(xì)配置參考:https://docs2.listenai.com/x/S_TEd8h7C

零代碼克隆原神可莉?qū)崿F(xiàn)桌面陪伴參考: https://docs2.listenai.com/x/x7CVdoQI3

更多個(gè)性配置方法可以參考官方開(kāi)發(fā)文檔:https://docs2.listenai.com/x/S_TEd8h7C

CSK6大模型開(kāi)發(fā)板的硬件資料:https://docs2.listenai.com/x/nTn9kMMCU

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    37535

    瀏覽量

    293277
  • 聲紋
    +關(guān)注

    關(guān)注

    0

    文章

    24

    瀏覽量

    4518
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3396

    瀏覽量

    4874
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器人交互與感知

    機(jī)器人· 應(yīng)用領(lǐng)域:迎賓機(jī)器人、養(yǎng)老機(jī)器人、導(dǎo)覽機(jī)器人· 多攝像頭輸入:同時(shí)實(shí)現(xiàn)人臉識(shí)別(迎賓)、跌倒檢測(cè)(養(yǎng)老)、自主導(dǎo)航避障(導(dǎo)覽)
    發(fā)表于 10-29 16:41

    工業(yè)機(jī)器人的特點(diǎn)

    的基礎(chǔ),也是三者的實(shí)現(xiàn)終端,智能制造裝備產(chǎn)業(yè)包括高檔數(shù)控機(jī)床、工業(yè)機(jī)器人、自動(dòng)化成套生產(chǎn)線、精密儀器儀表、智能傳感器、汽車自動(dòng)化焊接線、柔性自動(dòng)化生產(chǎn)線、
    發(fā)表于 07-26 11:22

    具身智能硬件真正“活”起來(lái) 商湯科技機(jī)器人會(huì)說(shuō)話,需要幾步?

    交互能力! 第一步:打開(kāi)機(jī)器人,連接機(jī)器人; 第二步:機(jī)器人系統(tǒng),解壓“日日新V6軟件包”,運(yùn)行配置界面,配置API KEY并點(diǎn)擊開(kāi)始,
    的頭像 發(fā)表于 06-06 14:25 ?1005次閱讀

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    : 一、機(jī)器人視覺(jué):從理論到實(shí)踐 第7章詳細(xì)介紹了ROS2機(jī)器視覺(jué)領(lǐng)域的應(yīng)用,涵蓋了相機(jī)標(biāo)定、OpenCV集成、視覺(jué)巡線、二維碼識(shí)別以及深度學(xué)習(xí)目標(biāo)檢測(cè)
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】+內(nèi)容初識(shí)

    機(jī)器人技術(shù)的飛速發(fā)展,ROS 2 作為其核心工具之一,為開(kāi)發(fā)者提供了強(qiáng)大的支持。與傳統(tǒng)的理論書(shū)籍不同,本書(shū)深入淺出地講解了 ROS 2 的架構(gòu)、開(kāi)發(fā)流程以及智能
    發(fā)表于 04-27 11:24

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開(kāi)源六軸機(jī)械臂產(chǎn)品

    識(shí)別聯(lián)調(diào)。 進(jìn)迭時(shí)空致力于為智能機(jī)器人提供完整全棧優(yōu)化的RISC-V AI硬件解決方案,第一代RISC-V AI CPU芯片K1已完成
    發(fā)表于 04-25 17:59

    芯訊通SIM8918模組AI玩具的應(yīng)用

    隨著生成式AI大模型的迅速崛起,AI的應(yīng)用也越來(lái)越多樣化,從智能手機(jī)到智能家居,再到一只能夠與人互動(dòng)和感知用戶情緒的
    的頭像 發(fā)表于 03-01 09:35 ?1373次閱讀

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊

    具身智能機(jī)器人的基礎(chǔ)模塊,這個(gè)是本書(shū)的第二部分內(nèi)容,主要分為四個(gè)部分:機(jī)器人計(jì)算系統(tǒng),自主機(jī)器人的感知系統(tǒng),自主機(jī)器人的定位系統(tǒng),自主
    發(fā)表于 01-04 19:22

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型

    取得了令人矚目的效果。 閱讀感悟 從傳統(tǒng)的手動(dòng)編程到借助大模型實(shí)現(xiàn)智能化、自主化,從單一模態(tài)的交互到多模態(tài)信息的深度融合,再到擴(kuò)散模型的應(yīng)用,機(jī)器人控制技術(shù)正在以驚人的速度進(jìn)化。這不
    發(fā)表于 12-29 23:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    、家庭服務(wù)機(jī)器人。具身智能機(jī)器人技術(shù)與市場(chǎng)的融合閉環(huán)是自主經(jīng)濟(jì)重要的發(fā)展方向之一。 具身智能
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.全書(shū)概覽與第一章學(xué)習(xí)

    ,詳細(xì)介紹了具身智能機(jī)器人的基礎(chǔ)模塊,給讀者闡明了機(jī)器人如何感知環(huán)境以及對(duì)環(huán)境進(jìn)行交互。 第三
    發(fā)表于 12-27 14:50

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)具身人工智能的價(jià)值

    嵌入式人工智能(EAI)將人工智能集成到機(jī)器人物理實(shí)體,使它們能夠感知、學(xué)習(xí)環(huán)境并與之動(dòng)態(tài)交
    發(fā)表于 12-24 00:33

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    動(dòng)態(tài)互動(dòng)的。 該理論強(qiáng)調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。具身
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    ,互聯(lián)網(wǎng)行業(yè)占成熟經(jīng)濟(jì)體的GDP增長(zhǎng)的21%,世界經(jīng)濟(jì)正面向數(shù)字經(jīng)濟(jì)轉(zhuǎn)型的大趨勢(shì)。具身智能機(jī)器人集成人工智能、高端制造、新材料技術(shù),其核心在于通過(guò)
    發(fā)表于 12-19 22:26

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個(gè)浪潮!

    進(jìn)行動(dòng)態(tài)互動(dòng)實(shí)現(xiàn)的。 這種理論強(qiáng)調(diào),智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境
    發(fā)表于 11-11 10:20