新闻中心
高级驾驶模拟:逼真环视数据的驾驶场景重建
原标题:drivinggaussian:用于周围动态自动驾驶场景的复合高斯点状绘制
请点击这里查看论文:https://arxiv.org/pdf/2312.07920.pdf
代码链接:https://pkuvd
ig.github.io/DrivingGaussian/
作者单位:北京大学谷歌研究 加州大学默塞德分校
论文思路:
本文提出 DrivingGaussian,这是一个针对动态自动驾驶场景的高效率和高效益的框架。对于具有移动物体的复杂场景,本文首先使用增量静态3D高斯 (incremental static 3D Gaussians) 顺序渐进地对整个场景的静态背景进行建模。然后,本文利用复合动态高斯图(composite dynamic Gaussian graph) 来处理多个移动物体,单独重建每个物体并恢复它们在场景中的准确位置和遮挡关系。本文进一步使用 LiDAR 先验进行 Gaussian Splatting 来重建具有更多细节的场景并保持全景一致性。DrivingGaussian 在驾驶场景重建方面优于现有方法,并能够实现具有高保真度和多相机一致性的逼真环视合成。
主要贡献:
根据本文了解,DrivingGaussian是第一个使用复合高斯飞溅技术进行大规模动态驾驶场景表示和建模的框架
引入了两个新颖的模块,包括增量静态3D高斯和复合动态高斯图。前者增量地重建静态背景,而后者则使用高斯图对多个动态物体进行建模。在激光雷达先验的辅助下,该方法有助于在大规模驾驶场景中恢复完整的几何形状
综合实验证明,DrivingGaussian在具有挑战性的自动驾驶基准测试中优于先前的方法,并且能够模拟各种极端情况以进行下游任务
网络设计:
本文介绍了一种名为DrivingGaussian的新型框架,用于表示环视动态自动驾驶场景。该框架的关键思想是使用来自多个传感器的顺序数据对复杂的驾驶场景进行分层建模。通过采用Composite Gaussian Splatting技术,将整个场景分解为静态背景和动态物体,并分别对每个部分进行重建。具体而言,首先使用增量静态3D高斯方法从环视多相机视图顺序构建综合场景。然后,采用复合动态高斯图单独重建每个运动物体,并通过高斯图将它们动态地集成到静态背景中。在此基础上,通过Gaussian Splatting进行全局渲染,捕捉现实世界中的遮挡关系,包括静态背景和动态物体。此外,本文还在GS表示中引入了LiDAR先验,相比于使用随机初始化或SfM生成的点云,它能够恢复更精确的几何形状并保持更好的多视图一致性
大量的实验表明,本文的方法在公共自动驾驶数据集上实现了最先进的性能。即使事先没有激光雷达,本文的方法仍然表现出良好的性能,证明了其在重建大规模动态场景方面的多功能性。此外,本文的框架支持动态场景构建和极端情况(corner case)模拟,有助于验证自动驾驶系统的安全性和鲁棒性。
VALL-E
VALL-E是一种用于文本到语音生成 (TTS) 的语言建模方法
134
查看详情
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图 1. DrivingGaussian 实现了环视动态自动驾驶场景的逼真渲染性能。朴素的方法 [13, 49] 要么在大范围背景中产生 unpleasant 伪影和模糊,要么难以重建动态物体和详细的场景几何形状。DrivingGaussian 首先引入了 Composite Gaussian Splatting 来有效地表示复杂的环视驾驶场景中的静态背景和多个动态物体。DrivingGaussian 能够跨多相机高质量合成环视视图,并促进长期动态场景重建。

图 2.本文方法的总体流程。左:DrivingGaussian 从多传感器获取连续数据,包括多相机图像和 LiDAR。中:为了表示大规模动态驾驶场景,本文提出了 Composite Gaussian Splatting ,它由两个部分组成。第一部分增量地重建广泛的静态背景,而第二部分使用高斯图构造多个动态物体并将它们动态地集成到场景中。右图:DrivingGaussian 在多个任务和应用场景中展示了良好的性能。

图 3. 具有增量静态3D高斯和动态高斯图的 Composite Gaussian Splatting 。本文采用 Composite Gaussian Splatting 将整个场景分解为静态背景和动态物体,分别重建每个部分并整合它们进行全局渲染。
实验结果:







总结:
本文介绍了DrivingGaussian,一种基于所提出的Composite Gaussian Splatting来表示大规模动态自动驾驶场景的新颖框架。DrivingGaussian使用增量静态3D高斯逐步对静态背景进行建模,并使用复合动态高斯图捕获多个移动物体。本文进一步利用LiDAR先验来实现精确的几何结构和多视图一致性。DrivingGaussian在两个自动驾驶数据集上实现了最先进的性能,实现了高质量的环视视图合成和动态场景重建
引用:
Zhou, X., Lin, Z., Shan, X., Wang, Y., Sun, D., & Yang, M. (2025). DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes. ArXiv. /abs/2312.07920

原文链接:https://www.php.cn/link/a878dbebc902328b41dbf02aa87abb58
以上就是高级驾驶模拟:逼真环视数据的驾驶场景重建的详细内容,更多请关注其它相关文章!
# 自动驾驶
# 营销网站建设怎么操作
# 忻城县钛回收网站建设
# 新疆个性化网站建设
# 最先进
# 高质量
# 将于
# 三大
# 实现了
# 景中
# 高斯
# 斯图
# 多个
# 多相
# 数据
# 洗护类营销推广策略
# 陕西矩阵seo专业公司
# 诗词文案网站推广方法
# seo标签优化教程
# 室内设计行业关键词排名
# 成都英语seO招聘信息
# 北京关键词seo公司
相关栏目:
【
行业资讯67740 】
【
技术百科0 】
【
网络运营39195 】
相关推荐:
苹果的type-c接口是什么
如何发挥固态硬盘性能
linux如何调出命令行
固态硬盘如何装入机箱
typescript是什么类型的语言
typescript参数怎么用
j*a怎么用json数组
如何区别固态硬盘
东芝固态硬盘如何保修
夸克是什么空间单位
壁挂炉power常亮是什么意思
手机全功能type-c接口是什么意思
单片机蜂鸣器响了怎么停
喇叭上标的power30w是什么意思
市盈率为负值是什么意思
电瓶车屏幕上显示power是什么意思
为什么夸克运行不了
如何查看固态硬盘速度
12306放票时间规律(2025)
基金市盈率是什么意思
得物怎样降低手续费 得物如何降低手续费教程
汽车上power是什么意思
摩托车上power是什么意思
type-c全能接口是什么意思
4800日元等于多少人民币
i5 6500怎么装win7
电动车eco和power是什么意思
夸克的答案为什么不对
如何由js快速切换typescript
苹果ipad爱奇艺怎么投屏到电视
平板键盘nfc功能是什么意思
国标控制器单片机怎么接线
没网环境如何安装typescript
typescript学会要多久
电动车power灯亮是什么意思
燃气热水器上的power是什么意思
春运抢票哪个平台好抢
awk命令如何对两列加分隔符
干股是什么意思
比亚迪秦nfc功能是什么意思
双十一的哪一天最优惠呢
openwrt有哪些功能
nosql数据库的应用场景有哪些
j*a怎么保存到数组
舆论是什么意思
市盈率ttm市盈动静是什么意思
单片机怎么发送can 信号
typescript多久能学完
路由器上面的power红灯是什么意思
新找到ao3镜像网站链接入口


2024-01-01
浏览次数:次
返回列表