RadSegNet: A Reliable Approach to Radar Camera Fusion 论文笔记

原文链接:https://arxiv.org/abs/2208.03849

1.引言

        相机有丰富的纹理和语义信息,但在远距离、遮挡和极端天气条件下会失效;雷达能提供全天候可靠的、长距离的无遮挡检测,但因其缺少丰富的纹理和语义信息,识别物体困难。

        早期方法将雷达点云投影到图像视图,但这样不能解决物体遮挡;或是分别提取图像特征和雷达BEV特征后在物体层面融合,但这种同时特征提取会导致某一模态失效时整个模型失效。本文采用独立特征提取思想,在雷达BEV表达下进行检测,并独立提取图像的语义特征。

        为将图像语义信息传播到雷达,本文提出语义-点-网格(SPG)表达,从相机提取信息到雷达,然后在增强雷达数据上检测,从而实现了独立特征提取。

3.雷达入门

        雷达和激光雷达一样,都使用飞行时间(ToF)反射分析来生成点云。原始雷达数据是密集的,但包含大量背景热噪声和多路径噪声,通常使用恒定虚警率(CFAR)以得到稀疏点云。这样导致雷达点云中的物体边缘不如激光雷达清晰,使得从雷达中学习基于形状的特征来区别感兴趣物体和背景很困难。

        但由于波长更长,雷达有更远的检测距离,且可以检测遮挡物体(通过地面反射)以及可全天候工作。

4.方法

4.1 BEV输入表达

        由于在前视图中使用局部操作如2D卷积会使不同深度的物体被同一卷积核处理,性能可能受到限制;本文考虑在BEV下表达输入,因在BEV下无遮挡。

        BEV占用网格:将雷达点云压缩高度,并离散化为占用网格,即若网格内有雷达点则为1,否则为0。该操作以结构化格式保留了雷达点的空间关系。

        雷达点特征:BEV占用网格的离散化空间丢失了细化边界框所需的有用信息,因此为每个网格附加上雷达点特征,包含坐标、多普勒和强度信息,得到最终的雷达表达:

s:=(I,d,r,x,z,y,n)

其中I为占用值,dr为多普勒和强度信息,xz为平均深度和水平坐标;高度y被离散为若干区间得到高度直方图,对应若干通道;n表示网格内的点数。

4.2 与相机数据融合

        多模态同时特征提取可以解决图像缺少深度信息的问题,但也会导致模型因图像数据不可靠而性能下降。

        本文提出SPG编码独立地从图像提取信息,即提取图像纹理和语义信息与雷达组合。

4.3 语义-点-网格特征编码

        图像语义特征:使用预训练的鲁棒语义分割网络来得到语义掩膜。

        将语义添加到SPG:如下图所示。为每个物体类别建立一张与雷达BEV相同大小的图,作为额外的语义特征通道。每个网格的值是通过将雷达点投影到图像上,取最近像素的语义特征得到的(对于网格内有多个点的情况,对所有特征取平均)。该操作可以减少检测中的FP。

        该操作不会过滤掉任何雷达点,以更好的利用雷达模态信息;图像的纹理和高分辨率特征被浓缩为语义特征,可以辅助雷达的鲁棒检测。

4.4 在SPG特征上进行边界框预测

        所有BEV特征被输入到深度神经网络进行特征提取和边界框预测。主干是带跳跃连接的编码器-解码器结构,通过下采样和上采样融合了多尺度特征。

        使用基于锚框的检测头(分类头/focal损失+回归头/SmoothL1损失)。

5.实施

        训练细节:锚框大小由数据集平均物体尺寸得到。使用IoU区分正负锚框,仅正锚框用于计算损失。

6.Astyx数据集上的评估

6.1 BEV边界框预测

        前视图融合的方法性能最差;BEV融合方法在长距离或遮挡下的检测更好。本文的独立特征提取比同时特征提取有更好的性能,特别是对于遮挡物体而言。

6.2 雷达与激光雷达的性能比较

        实验表明,使用雷达的方法无论是在单一模态还是与图像融合情况下均比激光雷达方法更优;在仅使用雷达的情况下,RadSegNet的性能也比PointPillars高许多(激光雷达则仅有微小提升)。

        这些结果都是由于雷达的长距离无遮挡感知特性以及SPG对雷达的编码能力。

6.3 在对抗性相机场景中的性能

        在晴朗天气数据下训练,在极端天气增广数据上实验,RadSegNet比SotA有更低的性能下降。这说明本文方法能够独立提取各模态特征。

6.4 消融研究

        SPG编码的每个通道均能带来性能提升,其中语义特征能带来最显著的性能提升。

7.在RADIATE数据集上的评估

        实施细节:RADIATE提供的是雷达的强度图且无高度信息,本文使用CFAR得到雷达点云,并使用传感器高度作为点的高度。

7.1 在晴朗/极端天气下的性能

        本文方法比SotA有更好的性能,且用晴朗+极端天气数据训练比仅用晴朗数据训练,在极端天气数据上评估的性能高出一倍以上,这说明:

  1. 晴朗天气数据和极端天气数据之间存在domain gap;

  2. RadSegNet的独立特征提取使得在有极端天气监督时,能有比SotA更高的可靠性。

        此外,在不同数据集上的高性能表明本文方法适用于不同雷达类型。

8.讨论

        本文方法在图像失效时会下降到雷达单一模态的性能;可以进一步在性能出现较大下降时关闭相机分支。

        雷达数据在极端天气下的变化就是噪声增多,导致检测距离下降。可以通过使用更高的发射功率,或是在极端天气数据下进行模型微调来解决。

补充材料

B.激光雷达与雷达性能比较

        激光雷达+相机融合方法比雷达+相机融合方法在近距离有更高的检测性能,但随着距离增加性能下降,这是由于点云变得稀疏且遮挡问题严重。

C.极端天气实施细节

        使用imgaug库中的数据增广方法模拟极端天气。实验结果表明雪天对性能的影响最小,雾天其次,影响最大的是雨天。

E.结构细节

        网络结构如下图所示,为U-Net风格的结构。

蓝色虚线框内的为编码器,橙色虚线框内的为解码器,绿色虚线框内的为检测头

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


学习编程是顺着互联网的发展潮流,是一件好事。新手如何学习编程?其实不难,不过在学习编程之前你得先了解你的目的是什么?这个很重要,因为目的决定你的发展方向、决定你的发展速度。
IT行业是什么工作做什么?IT行业的工作有:产品策划类、页面设计类、前端与移动、开发与测试、营销推广类、数据运营类、运营维护类、游戏相关类等,根据不同的分类下面有细分了不同的岗位。
女生学Java好就业吗?女生适合学Java编程吗?目前有不少女生学习Java开发,但要结合自身的情况,先了解自己适不适合去学习Java,不要盲目的选择不适合自己的Java培训班进行学习。只要肯下功夫钻研,多看、多想、多练
Can’t connect to local MySQL server through socket \'/var/lib/mysql/mysql.sock问题 1.进入mysql路径
oracle基本命令 一、登录操作 1.管理员登录 # 管理员登录 sqlplus / as sysdba 2.普通用户登录
一、背景 因为项目中需要通北京网络,所以需要连vpn,但是服务器有时候会断掉,所以写个shell脚本每五分钟去判断是否连接,于是就有下面的shell脚本。
BETWEEN 操作符选取介于两个值之间的数据范围内的值。这些值可以是数值、文本或者日期。
假如你已经使用过苹果开发者中心上架app,你肯定知道在苹果开发者中心的web界面,无法直接提交ipa文件,而是需要使用第三方工具,将ipa文件上传到构建版本,开...
下面的 SQL 语句指定了两个别名,一个是 name 列的别名,一个是 country 列的别名。**提示:**如果列名称包含空格,要求使用双引号或方括号:
在使用H5混合开发的app打包后,需要将ipa文件上传到appstore进行发布,就需要去苹果开发者中心进行发布。​
+----+--------------+---------------------------+-------+---------+
数组的声明并不是声明一个个单独的变量,比如 number0、number1、...、number99,而是声明一个数组变量,比如 numbers,然后使用 nu...
第一步:到appuploader官网下载辅助工具和iCloud驱动,使用前面创建的AppID登录。
如需删除表中的列,请使用下面的语法(请注意,某些数据库系统不允许这种在数据库表中删除列的方式):
前不久在制作win11pe,制作了一版,1.26GB,太大了,不满意,想再裁剪下,发现这次dism mount正常,commit或discard巨慢,以前都很快...
赛门铁克各个版本概览:https://knowledge.broadcom.com/external/article?legacyId=tech163829
实测Python 3.6.6用pip 21.3.1,再高就报错了,Python 3.10.7用pip 22.3.1是可以的
Broadcom Corporation (博通公司,股票代号AVGO)是全球领先的有线和无线通信半导体公司。其产品实现向家庭、 办公室和移动环境以及在这些环境...
发现个问题,server2016上安装了c4d这些版本,低版本的正常显示窗格,但红色圈出的高版本c4d打开后不显示窗格,
TAT:https://cloud.tencent.com/document/product/1340