亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種適用于動態(tài)環(huán)境的3DGS-SLAM系統(tǒng)

INDEMIND ? 來源:INDEMIND ? 2025-06-13 10:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當前基于神經(jīng)輻射場(NeRF)或3D高斯?jié)姙R(3DGS)的SLAM方法在重建靜態(tài)3D場景方面表現(xiàn)出色,但在動態(tài)環(huán)境中的跟蹤和重建方面卻面臨著挑戰(zhàn)?,F(xiàn)有的基于NeRF的SLAM方法解決動態(tài)問題通常依賴于RGB-D輸入,而很少有方法能適應純RGB輸入。為了克服這些局限性,我們提出了Dy3DGS-SLAM,這是首個使用單目RGB輸入的針對動態(tài)場景的3D高斯?jié)姙R(3DGS)SLAM方法。實驗結果證明,Dy3DGS-SLAM在動態(tài)環(huán)境中實現(xiàn)了最先進的跟蹤和渲染效果,優(yōu)于或達到了現(xiàn)有的RGB-D方法的水平。

? 文章:

Dy3DGS-SLAM: Monocular 3D Gaussian Splatting SLAM for Dynamic Environments

? 作者:

Mingrui Li, Yiming Zhou, Hongxing Zhou, Xinggang Hu, Florian Roemer, Hongyu Wang, Ahmad Osman

? 論文鏈接:

https://arxiv.org/abs/2506.05965

? 編譯:

INDEMIND

01 本文核心內容

近期,基于NeRF或3DGS的密集SLAM系統(tǒng)引起了廣泛關注。這些系統(tǒng)在靜態(tài)場景中實現(xiàn)了逼真的渲染效果,并逐漸向大規(guī)?;蚋咛魬?zhàn)性的場景拓展。然而,由于現(xiàn)實世界中存在大量動態(tài)物體,這類SLAM系統(tǒng)在應對這一挑戰(zhàn)時卻表現(xiàn)不佳。另一個受到關注的問題是如何在不依賴RGB-D傳感器,僅使用單目RGB輸入的情況下取得更好的效果,該類傳感器更易獲取,且具有更大的潛力。

盡管一些基于NeRF的方法,如DN-SLAM、DDNSLAM、NID-SLAM和RoDyn-SLAM已嘗試解決動態(tài)物體的問題,但它們往往依賴于預定義的動態(tài)先驗或嚴重依賴深度先驗來確定動態(tài)物體掩碼,這使得它們在僅有單目RGB輸入的環(huán)境中難以適用。

此外,由于NeRF表示的局限性,渲染精度受到限制,常常導致嚴重的渲染偽影。基于3DGS的諸如SplaTAM、Photo-SLAM和MonoGS等SLAM系統(tǒng)在靜態(tài)環(huán)境中表現(xiàn)良好,但在動態(tài)場景中往往會遇到跟蹤失敗和建圖錯誤的問題。因此,我們提出了Dy3DGS-SLAM,這是首個專為動態(tài)環(huán)境設計的僅使用RGB的3DGS-SLAM系統(tǒng)。我們利用光流來獲取動態(tài)掩碼,無需依賴預定義的移動對象,盡管這些掩碼在紋理均勻或快速運動的區(qū)域可能會有噪聲。為了解決這個問題,我們引入了單目深度估計,提供互補的空間線索,特別是在處理遮擋和深度不連續(xù)性時。然后,我們提出了一種深度正則化的掩碼融合策略,結合了這兩種模態(tài)的優(yōu)勢,減輕了各自的局限性,生成了更精確、更穩(wěn)健的動態(tài)掩碼。

在跟蹤方面,我們將估計的深度和融合后的掩碼納入運動損失中,有效地在位姿估計網(wǎng)絡中恢復尺度和位姿,從而獲得更準確的跟蹤結果。在渲染方面,為了解決瞬態(tài)干擾和遮擋問題,我們根據(jù)動態(tài)像素的顏色和深度對動態(tài)高斯分布進行懲罰。與基準方法相比,我們的方法顯著減少了渲染偽影,并極大地提高了幾何精度。

本文的貢獻可概括為:

?提出了Dy3DGS-SLAM,這是首個僅基于RGB的適用于動態(tài)環(huán)境的3DGS-SLAM系統(tǒng),能夠在動態(tài)環(huán)境中實現(xiàn)穩(wěn)健的跟蹤和高保真度的重建。

? 提出了一種掩碼融合方法,通過結合光流的運動線索和深度估計的幾何一致性,能夠準確地覆蓋動態(tài)對象?;谌诤虾蟮难诖a,我們引入了新穎的運動和渲染損失,以有效減輕動態(tài)對象在跟蹤和渲染中的干擾。

? 在三個真實數(shù)據(jù)集上的實驗結果表明,與基準方法相比,我們的方法在跟蹤和渲染性能方面表現(xiàn)更優(yōu)。

02 方法架構

我們的系統(tǒng)流程如圖1所示。我們解決了將從光流獲得的動態(tài)掩碼與從單目輸入估計的深度圖融合的問題,從而得到精確的動態(tài)融合掩碼。我們提出了運動估計網(wǎng)絡,并引入了結合深度估計的運動損失,使網(wǎng)絡能夠迭代地優(yōu)化精確的相機位姿。我們對被標記為動態(tài)的像素對應的高斯分布進行懲罰,并基于單目深度應用額外的渲染損失,以優(yōu)化場景細節(jié)。最后,我們利用多視圖一致性合成靜態(tài)場景。

92894d70-45f3-11f0-b715-92fbcf53809c.png

03 實驗結果

A.實驗細節(jié)與指標

數(shù)據(jù)集和實現(xiàn)細節(jié)

我們在三個來自真實世界的公開數(shù)據(jù)集上進行了評估:TUMRGB-D、AirDOS-Shibuya和BONNRGB-D,這些數(shù)據(jù)集均捕捉了真實的室內環(huán)境。

我們在一臺配備單個RTX3090TiGPU的臺式機上進行了SLAM實驗。我們展示了針對實時應用設計的多進程實現(xiàn)的結果。與3DGS框架一致,時間關鍵的光柵化和梯度計算均使用CUDA實現(xiàn)。

指標和基線方法

為評估相機跟蹤精度,我們報告關鍵幀絕對軌跡誤差(ATE)的均方根誤差(RMSE)。對于運行時性能和網(wǎng)絡迭代速度,我們分別測量每秒幀數(shù)(FPS)和毫秒(ms)。GPU使用情況以兆字節(jié)(MB)為單位進行評估。我們將我們的Dy3DGS-SLAM方法與傳統(tǒng)動態(tài)SLAM方法(如ORB-SLAM3、Droid-SLAM、DynaSLAM、DytanVO和ReFusion以及基于 NeRF 的最新 RGB-D 傳感器方法(包括 NICE-SLAM、ESLAM、Co-SLAM和NID-SLAM)進行比較。此外,我們還考慮了基于3DGS的SplaTAM。

B.在TUM和BonnRGB-D上的跟蹤評估。

跟蹤

如表II所示,我們展示了來自TUM數(shù)據(jù)集的三個高度動態(tài)序列、一個輕度動態(tài)序列和兩個靜態(tài)序列的結果。

929d496a-45f3-11f0-b715-92fbcf53809c.png

92b36c54-45f3-11f0-b715-92fbcf53809c.png

得益于我們提出的動態(tài)掩碼融合方法,我們的系統(tǒng)在跟蹤性能方面優(yōu)于基于RGB-D的方法,甚至可與傳統(tǒng)的SLAM方法相媲美。此外,我們在更復雜且更具挑戰(zhàn)性的BONN數(shù)據(jù)集上評估了跟蹤性能,如表I所示。即使在這些更復雜和大規(guī)模的場景中,我們的方法也取得了卓越的性能。我們的方法優(yōu)于所有其他方法,NID-SLAM是唯一一個結果接近我們的方法。此外,我們的方法在性能上優(yōu)于傳統(tǒng)方法。這表明我們的動態(tài)掩碼融合能夠有效地去除動態(tài)物體并增強跟蹤過程。

建圖

92c93a66-45f3-11f0-b715-92fbcf53809c.png

為了全面評估我們所提出系統(tǒng)在動態(tài)場景中的性能,我們分析了從定性角度來看結果。我們將渲染的圖像與從生成的高斯圖中獲得的真實姿態(tài)進行比較,使用與其他方法相同的視角。選擇了四個具有挑戰(zhàn)性的序列:來自波恩數(shù)據(jù)集的人群和人員跟蹤,以及來自TUMRGBD數(shù)據(jù)集的f3walkxyzval和f3walkstatic。如圖2所示,我們的方法在幾何和紋理細節(jié)方面顯示出顯著優(yōu)勢,尤其是在減少偽影方面。值得注意的是,我們的方法基于單目系統(tǒng),并已在兩個真實世界數(shù)據(jù)集上得到驗證,證明了僅使用簡單相機即可準確記錄動態(tài)場景的能力。這突顯了我們的方法在有效追蹤和重建室內環(huán)境方面的潛力,使其成為深度傳感器不可用的應用場景中的寶貴工具。

04 總結

我們提出了Dy3DGS-SLAM,這是首個基于3DGS的單目RGB輸入的動態(tài)場景SLAM方法。該方法首先通過光流估計生成動態(tài)對象掩碼,將這些掩碼與單目深度估計相結合,創(chuàng)建融合掩碼并恢復尺度,從而準確捕捉動態(tài)對象掩碼。為了進一步提高位姿精度,我們基于融合掩碼優(yōu)化了損失函數(shù),減少了多次迭代帶來的計算成本。此外,為了增強渲染性能,我們應用了額外的光度和深度損失,以消除瞬態(tài)干擾偽影并提高幾何精度。實驗結果表明,與基線方法相比,Dy3DGS-SLAM在動態(tài)環(huán)境中實現(xiàn)了最先進的跟蹤和渲染性能。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 相機
    +關注

    關注

    5

    文章

    1525

    瀏覽量

    55312
  • RGB
    RGB
    +關注

    關注

    4

    文章

    820

    瀏覽量

    61322
  • SLAM
    +關注

    關注

    24

    文章

    452

    瀏覽量

    33112

原文標題:Dy3DGS-SLAM:適用于動態(tài)環(huán)境的3DGS-SLAM,僅需單目RGB

文章出處:【微信號:gh_c87a2bc99401,微信公眾號:INDEMIND】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一種適用于模擬/數(shù)字混合信號環(huán)境的接地技術

    本文分享了一種適用于模擬/數(shù)字混合信號環(huán)境的接地技術。
    發(fā)表于 04-25 07:46

    一種適用于室內復雜環(huán)境的高精度、環(huán)境自適應性強的定位算法

    摘要對于室內復雜環(huán)境來說, 適用于室外定位的 GPS 系統(tǒng)和蜂窩移動網(wǎng)絡在室內中的定位精度明顯惡化, 無法滿足室內用戶精確定位的需求。因此, 研究一種
    發(fā)表于 08-18 08:12

    一種適用于嵌入式系統(tǒng)的模塊動態(tài)加載技術

    嵌入式系統(tǒng)中的模塊動態(tài)加載技術摘要提出一種適用于嵌入式系統(tǒng)的模塊動態(tài)加載技術,設計實現(xiàn)簡單,占用
    發(fā)表于 12-20 06:32

    一種適用于醫(yī)學領域的頻率可調濾波器

    一種適用于醫(yī)學領域的頻率可調濾波器_李嚴
    發(fā)表于 01-07 16:06 ?0次下載

    一種特別適用于片上LDO系統(tǒng)的過流保護電路

    一種特別適用于片上LDO系統(tǒng)的過流保護電路_胡佳俊
    發(fā)表于 01-07 16:52 ?22次下載

    一種適用于SoC的瞬態(tài)增強型線性穩(wěn)壓器_張琪

    一種適用于SoC的瞬態(tài)增強型線性穩(wěn)壓器_張琪
    發(fā)表于 01-07 22:23 ?0次下載

    一種適用于鋼管廠的自動稱重及重量分攤系統(tǒng)_郭雅默

    一種適用于鋼管廠的自動稱重及重量分攤系統(tǒng)_郭雅默
    發(fā)表于 01-13 21:36 ?0次下載

    基于一種適用于惡劣安裝環(huán)境的MS6000水情監(jiān)測系統(tǒng)介紹

    MS6000水情監(jiān)測系統(tǒng),是款無線、低功耗、免維護、適用于惡劣安裝環(huán)境的綜合型遙測設備。設備針對水文遙測點多分布在野外、無電源的特點而專門設計,可廣泛
    的頭像 發(fā)表于 03-15 17:04 ?2594次閱讀

    一種適用于動態(tài)場景的SLAM方法

    同時定位與地圖構建(SLAM)作為機器人領域的硏究熱點,近年來取得了快速發(fā)展,但多數(shù)SLAM方法未考慮應用場景中的動態(tài)或可移動目標。針對該問題,提出一種
    發(fā)表于 03-18 10:39 ?21次下載
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b>場景的<b class='flag-5'>SLAM</b>方法

    一種基于直接法的動態(tài)稠密SLAM方案

    基于特征點法的視覺SLAM系統(tǒng)很難應用于稠密建圖,且容易丟失動態(tài)對象。而基于直接法的SLAM系統(tǒng)
    的頭像 發(fā)表于 03-13 09:38 ?1877次閱讀

    一種適用于動態(tài)場景的多層次地圖構建算法

    本文提出了一種適用于動態(tài)場景的多層次地圖構建算法,如圖1所示的系統(tǒng)框架。首先,利用YOLOX[8]獲取場景的語義信息,采用多目標跟蹤算法對漏檢進行補償,利用DBSCAN密度聚類算法和深
    發(fā)表于 08-28 10:56 ?1207次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b>場景的多層次地圖構建算法

    一種適用于動態(tài)環(huán)境的實時視覺SLAM系統(tǒng)

    既能保證效率和精度,又無需GPU,行業(yè)第個達到此目標的視覺動態(tài)SLAM系統(tǒng)
    的頭像 發(fā)表于 09-30 14:35 ?1841次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b><b class='flag-5'>環(huán)境</b>的實時視覺<b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    近期興起的神經(jīng)輻射場(NeRF)與三維高斯?jié)姙R(3DGS)技術在視覺SLAM中展現(xiàn)出令人鼓舞的突破性成果。然而,當前主流方法多依賴RGBD傳感器,并且僅適用于室內環(huán)境。在大規(guī)模室外場景
    的頭像 發(fā)表于 05-27 14:13 ?940次閱讀
    三維高斯?jié)姙R大規(guī)模視覺<b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>解析

    一種適用于動態(tài)環(huán)境的實時RGB-D SLAM系統(tǒng)

    了UP-SLAM,這是一種適用于動態(tài)環(huán)境的實時RGB-D SLAM
    的頭像 發(fā)表于 07-04 15:14 ?826次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b><b class='flag-5'>環(huán)境</b>的實時RGB-D <b class='flag-5'>SLAM</b><b class='flag-5'>系統(tǒng)</b>

    一種適用于動態(tài)環(huán)境的自適應先驗場景-對象SLAM框架

    由于傳統(tǒng)視覺SLAM動態(tài)場景中容易會出現(xiàn)嚴重的定位漂移,本文提出了一種新穎的基于場景-對象的可靠性評估框架,該框架通過當前幀質量指標以及相對于可靠參考幀的場景變化,全面評估SLAM
    的頭像 發(fā)表于 08-19 14:17 ?507次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>適用于</b><b class='flag-5'>動態(tài)</b><b class='flag-5'>環(huán)境</b>的自適應先驗場景-對象<b class='flag-5'>SLAM</b>框架