摘要:作者:Zhen Hong, Bowen Wang, Haoran Duan, Yawen Huang, Xiong Li, Zhenyu Wen, Xiang Wu, Wei Xiang, Yefeng Zheng
原文链接:五个数据集SOTA!速度更快!清华新作SP-SLAM:具有场景先验的神经实时稠密SLAM
0. 论文信息作者:Zhen Hong, Bowen Wang, Haoran Duan, Yawen Huang, Xiong Li, Zhenyu Wen, Xiang Wu, Wei Xiang, Yefeng Zheng
原文链接:
1. 导读神经隐式表示最近在密集同时定位和映射(SLAM)中显示出有希望的进展。然而,现有的工作在重建质量和实时性能方面存在缺点,主要是由于没有利用任何先验信息的不灵活的场景表示策略。在本文中,我们介绍了SP-SLAM,一种新的神经RGB-D SLAM系统,可以实时执行跟踪和映射。SP-SLAM计算深度图像,并在表面附近建立稀疏体素编码的场景先验,以实现模型的快速收敛。随后,从单帧深度图像计算的编码体素被融合成一个全局体,这有利于高保真的表面重建。同时,我们使用三平面来存储场景外观信息,在实现高质量几何纹理映射和最小化内存消耗之间取得平衡。此外,在SP-SLAM中,我们引入了一种有效的映射优化策略,允许系统在运行时持续优化所有历史输入帧的姿态,而不增加计算开销。我们对五个基准数据集(Replica、ScanNet、TUM RGB-D、Synthetic RGB-D、7-Scenes)进行了广泛的评估。结果表明,与现有方法相比,我们实现了优越的跟踪精度和重建质量,同时运行速度明显加快。
2. 效果展示建图优化策略对我们的系统的影响。绿色轨迹表示地面真实相机运动,而红色轨迹表示估计的相机运动。与选择一组关键帧以保持场景地图相比,使用稀疏采样的像素对每个输入帧进行优化可以实现更稳健的相机跟踪和更真实的场景重建。
绿色矩形突出的区域展示了我们的几何学更高的精确度,红色矩形突出的区域表明我们的方法能够生成更平滑的表面。
ScanNet数据集重建质量的定性比较。ScanNet的基本真值网格是通过BundleFusion获得的。.与现有方法相比,我们的方法生成了更平滑的场景表面和更详细的几何结构。
3. 方法我们的系统概览如图2所示。在给定RGB-D图像输入流的情况下,我们的系统估计每个帧的摄像机姿态并生成场景图。具体地说,深度编码器从深度图像中提取局部几何先验,并将它们融合为全局稀疏体积。场景的外观特征存储在三个轴对齐的平面上,将三维世界坐标系中的任意一点r映射到稀疏体和三平面上,在那里插值特征被解码为彩色cr和截断符号距离场(TSDF)。通过两个浅层MLP。我们从每个输入帧中采样一定数量的像素,并将它们添加到像素数据库中。在每个帧上进行跟踪,通过少量迭代优化相机姿态。在跟踪固定数量的帧后执行映射。我们选择优化后的帧,并从像素数据库中检索像素,以共同优化相应帧的相机姿态和混合场景表示。推荐课程:对于3D激光SLAM,LeGo-LOAM到底有多重要?
4. 实验结果5. 总结我们提出了SP-SLAM,这是一个实时的密集RGB-D SLAM系统,它将场景几何先验融入神经隐式SLAM框架中,旨在同时提升实时性能和准确性。我们证明,神经隐式SLAM能够在不增加计算负载的情况下,优化每一输入帧的姿态,同时无需遵循传统SLAM范式,即无需选择一组关键帧进行优化。大量实验证实,SP-SLAM在跟踪和重建方面超越了现有方法,并且运行速度显著提高。
对更多实验结果和文章细节感兴趣的读者,可以阅读一下论文原文~
科研级-精迅V1!高精度单目/双目3D结构光扫描仪套件![源码+结构光&点云课程+答疑+硬件]如何快速搭建一套3D线结构光三维扫描仪?精度0.05mm!一款重量轻、价格低的面结构光3D相机!无惧高反、黑色物体两款高精度圆点/棋盘格标定板[硬件+代码]御风250-四旋翼无人机(基于PX4)科研级-三维手持扫描仪HandBot-S1,配套硬件+源码+教程+答疑来源:智者之眼