亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型驅(qū)動(dòng)下的人機(jī)交互革命,“超擬真人互動(dòng)”?讓玩具讀懂你的情緒

Simon觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃山明 ? 2025-10-31 09:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)日前,在大灣區(qū)AI玩具生態(tài)大會(huì)上,百度智能云正式發(fā)布基于“超擬真人互動(dòng)”理念的智能硬件多模態(tài)交互解決方案。該方案通過大模型與多模態(tài)技術(shù)的深度融合,從技術(shù)架構(gòu)到場(chǎng)景落地,全方位重構(gòu)了智能硬件的人機(jī)交互范式,為行業(yè)提供了從技術(shù)底層到商業(yè)應(yīng)用的完整路徑。

從人機(jī)交互的技術(shù)演進(jìn)邏輯來看,經(jīng)歷了文本交互(CUI)、圖像交互(GUI)到自然語言多模態(tài)交互(LUI)的三次關(guān)鍵躍遷。百度智能云提出的LUI架構(gòu),以大語言模型(LLM)為核心,整合語音、視覺、情感計(jì)算等多模態(tài)技術(shù),實(shí)現(xiàn)了從指令響應(yīng)到智能理解的質(zhì)變。

在這一架構(gòu)中,設(shè)備不再局限于單一模態(tài)的信息處理,而是能夠同時(shí)解析語音語調(diào)、文字語義、表情動(dòng)作等多維度輸入,通過情感識(shí)別模塊實(shí)時(shí)感知用戶情緒,結(jié)合長短期記憶與用戶畫像技術(shù),構(gòu)建起“感知-理解-響應(yīng)”的完整交互閉環(huán)。


為實(shí)現(xiàn)超擬真人互動(dòng)的技術(shù)目標(biāo),百度智能云在低延時(shí)、多模態(tài)融合、主動(dòng)任務(wù)規(guī)劃等技術(shù)維度實(shí)現(xiàn)了突破。在實(shí)時(shí)交互性能上,端到端音頻延時(shí)被優(yōu)化至1.3秒以內(nèi),實(shí)時(shí)打斷延時(shí)小于0.8秒,視覺反饋延時(shí)控制在2秒內(nèi),這一指標(biāo)達(dá)到了行業(yè)領(lǐng)先的流暢交互標(biāo)準(zhǔn)。

多模態(tài)融合方面,方案支持文本、語音、圖像、視頻等多類型輸入輸出,通過FuncCallM函數(shù)調(diào)用模型與多模型組件協(xié)同,實(shí)現(xiàn)了跨模態(tài)信息的高效處理與統(tǒng)一理解。主動(dòng)任務(wù)規(guī)劃能力則依托Agent技術(shù)框架,使設(shè)備能夠基于用戶畫像和場(chǎng)景上下文,自主發(fā)起設(shè)備控制、信息提醒等復(fù)雜任務(wù),徹底改變了傳統(tǒng)被動(dòng)交互模式。

百度智能云構(gòu)建的智能硬件多模態(tài)互動(dòng)框架,呈現(xiàn)出全棧式技術(shù)賦能的特點(diǎn)。在端側(cè)層,針對(duì)可穿戴、智能家居、AI 玩具、辦公設(shè)備等不同終端形態(tài),完成了對(duì)樂鑫、杰理等主流芯片平臺(tái),以及 RTOS、AndroidiOS操作系統(tǒng)的深度適配,解決了異構(gòu)硬件的兼容性難題。

平臺(tái)層整合了天氣、教育、健康等垂直領(lǐng)域的內(nèi)容生態(tài),同時(shí)提供聲紋識(shí)別、情感識(shí)別、長短期記憶等基礎(chǔ)組件,為開發(fā)者提供了開箱即用的交互能力模塊。模型層基于千帆大模型平臺(tái),部署了對(duì)話模型、視覺生成模型、實(shí)時(shí)推理模型等核心算法,通過ModelBuilder工具鏈支持開發(fā)者進(jìn)行模型微調(diào)與定制,實(shí)現(xiàn)了大模型技術(shù)的工程化落地。

在技術(shù)落地場(chǎng)景中,該方案展現(xiàn)出強(qiáng)大的行業(yè)適配性。以AI玩具領(lǐng)域?yàn)槔?,通過多模態(tài)交互技術(shù),設(shè)備可支持成語接龍、猜謎語等語音交互游戲,同時(shí)具備拍照識(shí)物、涂鴉生成圖片等視覺交互能力,在教育場(chǎng)景中實(shí)現(xiàn)了英語口語教學(xué)、數(shù)學(xué)解題指導(dǎo)等功能,形成了娛樂與學(xué)習(xí)的復(fù)合應(yīng)用模式。

在設(shè)備控制領(lǐng)域,創(chuàng)新提出云端指令定制與端側(cè)意圖理解的協(xié)同架構(gòu),既支持方言、非標(biāo)發(fā)音的精準(zhǔn)識(shí)別,又能通過函數(shù)調(diào)用實(shí)現(xiàn)復(fù)雜設(shè)備的聯(lián)動(dòng)控制,例如根據(jù)用戶“有點(diǎn)冷”的語音指令,自動(dòng)完成關(guān)窗、調(diào)溫、音樂播放等一系列操作。


從技術(shù)架構(gòu)的擴(kuò)展性來看,該方案提供了靈活的對(duì)接方式,支持OpenAI-LLM API、Function Call、MCP三種云端對(duì)接模式,同時(shí)預(yù)留了第三方設(shè)備控制接口,便于與智能家居生態(tài)中的各類設(shè)備進(jìn)行集成。在交互形態(tài)上,支持實(shí)時(shí)對(duì)話、按鍵式對(duì)話、喚醒詞對(duì)話等多種模式,并配套實(shí)時(shí)打斷、按鍵式打斷、喚醒詞打斷的完整打斷機(jī)制,滿足了不同場(chǎng)景下的交互效率需求。這種技術(shù)設(shè)計(jì)既保障了交互的自然性,又兼顧了場(chǎng)景的多樣性,為大規(guī)模商業(yè)化應(yīng)用奠定了基礎(chǔ)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3396

    瀏覽量

    4874
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    眼電EOG人機(jī)交互會(huì)是未來交互的一種主流嗎?

    HUIYING基于眼電的人機(jī)交互系統(tǒng)概述基于眼電(EOG)的人機(jī)交互系統(tǒng)(HMI)的研發(fā)源于對(duì)非侵入式、高精度且持久可穿戴的醫(yī)療輔助設(shè)備的需求。傳統(tǒng)人機(jī)交互方式如觸摸屏、操縱桿或基于肌電(EMG
    的頭像 發(fā)表于 11-07 18:01 ?1422次閱讀
    眼電EOG<b class='flag-5'>人機(jī)交互</b>會(huì)是未來<b class='flag-5'>交互</b>的一種主流嗎?

    重構(gòu)未來自適應(yīng)人機(jī)交互的創(chuàng)新技術(shù)

    人機(jī)交互的概念可以追溯到工業(yè)革命時(shí)期,在當(dāng)時(shí)機(jī)器開始取代人類勞動(dòng)。然而,直到20世紀(jì)中葉,人機(jī)交互領(lǐng)域才受到廣泛關(guān)注。人機(jī)界面(HMI)是人與機(jī)器之間
    的頭像 發(fā)表于 10-31 16:30 ?581次閱讀
    重構(gòu)未來自適應(yīng)<b class='flag-5'>人機(jī)交互</b>的創(chuàng)新技術(shù)

    【內(nèi)測(cè)活動(dòng)同步開啟】這么小?這么強(qiáng)?新一代大模型MCP開發(fā)板來啦!

    噪,無懼嘈雜環(huán)境 云端接入小聆AI,輕松實(shí)現(xiàn)個(gè)性化定制 搭載領(lǐng)先大模型全鏈路技術(shù):小聆AI 智能語音交互方案 集成情緒感知與表達(dá) :支持情感發(fā)音人;支持聲音復(fù)刻,實(shí)現(xiàn)個(gè)性化定制 獨(dú)家人聲濾噪:基于聲紋
    發(fā)表于 09-25 11:47

    邊聊安全 | 人機(jī)交互對(duì)功能安全的影響

    上海磐時(shí)PANSHI“磐時(shí),做汽車企業(yè)的安全智庫”人機(jī)交互對(duì)功能安全的影響HMI,HumanMachineInterface,也就是大家熟知的人機(jī)接口。近年來,HMI的功能也隨著汽車智能化的發(fā)展
    的頭像 發(fā)表于 09-05 16:21 ?21次閱讀
    邊聊安全 | <b class='flag-5'>人機(jī)交互</b>對(duì)功能安全的影響

    串口屏:重塑人機(jī)交互的開發(fā)革命

    在智能設(shè)備蓬勃發(fā)展的今天,人機(jī)界面已成為產(chǎn)品差異化的關(guān)鍵。傳統(tǒng)GUI開發(fā)需要耗費(fèi)大量時(shí)間在底層驅(qū)動(dòng)和圖形算法上,而串口屏的出現(xiàn),正在徹底改變這一現(xiàn)狀。 技術(shù)突破:交互開發(fā)回歸本質(zhì) 串
    發(fā)表于 08-28 14:56

    人機(jī)交互:連接人類與數(shù)字世界的橋梁

    )等技術(shù)的發(fā)展,人機(jī)交互已經(jīng)從傳統(tǒng)的鍵盤鼠標(biāo)操作,演進(jìn)為語音識(shí)別、手勢(shì)控制、腦機(jī)接口等更自然、更智能的交互方式。 ? 人機(jī)交互的發(fā)展歷程 早期的人機(jī)交互主要依賴命令行界面(CLI),用
    的頭像 發(fā)表于 08-11 15:21 ?1238次閱讀

    蘇州唯理科技神經(jīng)腕帶肌電臂環(huán)人機(jī)交互演示

    人機(jī)交互
    jf_74911425
    發(fā)布于 :2025年07月08日 22:02:34

    聲學(xué)技術(shù)如何重構(gòu)人機(jī)交互生態(tài)

    人機(jī)交互的底層邏輯。隨著非線性聲學(xué)計(jì)算與強(qiáng)化學(xué)習(xí)的深度融合,聲音交互正從“聽得見”邁向“聽得懂”,并逐漸成為 AI 時(shí)代的重要接口。
    的頭像 發(fā)表于 04-14 13:50 ?716次閱讀

    模型“開口說話”,啟英泰倫重塑AI玩具交互新體驗(yàn)!

    的熱潮。接入大模型的AI玩具從市場(chǎng)需求來看,AI玩具正在重新定義兒童陪伴與教育的方式,不僅滿足“玩”的基本需求,而且,通過智能“擬人化”交互可為兒童提供豐富的
    的頭像 發(fā)表于 04-11 18:31 ?813次閱讀
    <b class='flag-5'>讓</b>大<b class='flag-5'>模型</b>“開口說話”,啟英泰倫重塑AI<b class='flag-5'>玩具</b><b class='flag-5'>交互</b>新體驗(yàn)!

    AR互動(dòng)與傳統(tǒng)的交互方式相比更加豐富多元

    AR 互動(dòng)的另一個(gè)顯著特點(diǎn),是其豐富多元的互動(dòng)方式。與傳統(tǒng)的交互方式相比,AR 互動(dòng)不再局限于鼠標(biāo)、鍵盤、觸摸屏等有限的輸入方式,而是通過多種先進(jìn)的技術(shù)手段,實(shí)現(xiàn)了更加自然、豐富
    的頭像 發(fā)表于 03-10 17:48 ?777次閱讀
    AR<b class='flag-5'>互動(dòng)</b>與傳統(tǒng)的<b class='flag-5'>交互</b>方式相比更加豐富多元

    廣和通正式推出AI玩具模型解決方案

    ,即可實(shí)現(xiàn)音視頻及圖像的實(shí)時(shí)傳輸、語音識(shí)別、自然語言處理以及機(jī)器學(xué)習(xí)等多種功能。這意味著玩具能夠與用戶進(jìn)行更加豐富的互動(dòng),通過擬人、動(dòng)物或IP的形式,以視、聽、觸等多維度的方式與用
    的頭像 發(fā)表于 01-24 10:36 ?1592次閱讀

    廣和通發(fā)布AI玩具模型解決方案

    玩具行業(yè)的新篇章。 這一解決方案的最大亮點(diǎn)在于其高度的集成性和智能化。無需外接MCU,即可輕松實(shí)現(xiàn)音視頻及圖像的實(shí)時(shí)傳輸、精準(zhǔn)的語音識(shí)別、流暢的自然語言處理以及強(qiáng)大的機(jī)器學(xué)習(xí)功能。通過擬人、動(dòng)物或IP的生動(dòng)形式,該方案能夠
    的頭像 發(fā)表于 01-21 14:45 ?1482次閱讀

    廣和通AI解決方案內(nèi)置大模型玩具成為你的智慧伙伴

    和機(jī)器學(xué)習(xí),通過擬人/動(dòng)物/IP形式,與用戶進(jìn)行視/聽/觸多維度交互,為AI玩具的創(chuàng)新發(fā)展開辟新思路。
    的頭像 發(fā)表于 01-21 11:03 ?873次閱讀
    廣和通AI解決方案內(nèi)置大<b class='flag-5'>模型</b>,<b class='flag-5'>讓</b><b class='flag-5'>玩具</b>成為你的智慧伙伴

    廣和通推出AI玩具模型解決方案

    和機(jī)器學(xué)習(xí),通過擬人/動(dòng)物/IP形式,與用戶進(jìn)行視/聽/觸多維度交互,為AI玩具的創(chuàng)新發(fā)展開辟新思路。
    的頭像 發(fā)表于 01-21 10:27 ?1532次閱讀

    的人機(jī)交互入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    Chat AI眼鏡、蜂巢科技推出的界環(huán)AI音頻眼鏡等,不同品牌推出的新品都有其各自的定位。與此同時(shí),在市場(chǎng)需求的帶動(dòng),越來越多企業(yè)進(jìn)入AI眼鏡賽道。 ? ? 全新的人機(jī)交互入口已現(xiàn)?大模型加持AI 眼鏡 來自市場(chǎng)調(diào)研機(jī)構(gòu)貝哲
    的頭像 發(fā)表于 11-21 00:57 ?4439次閱讀
    新<b class='flag-5'>的人機(jī)交互</b>入口?大<b class='flag-5'>模型</b>加持、AI眼鏡賽道開啟百鏡大戰(zhàn)