RAY-Net：一种融合了辅助修正的摩托车头盔检测方法-科研动态-中国石油大学（北京）人工智能学院

学校主页

您所在的位置：首页 - 科学研究 - 科研动态

科研动态

RAY-Net：一种融合了辅助修正的摩托车头盔检测方法

日期：2024-07-29 | 访问量：

中文题目：RAY-Net：一种融合了辅助修正的摩托车头盔检测方法

论文题目：RAY-Net: A Motorcycle Helmet Detection Method Integrated Auxiliary Correction

录用会议：The 2024 Twentieth International Conference on Intelligent Computing (CCF C)

作者列表：

1）刘志强中国石油大学（北京）人工智能学院硕23

2）王智广中国石油大学（北京）人工智能学院计算机科学与技术系教师

3）李晓雪中国石油大学（北京）人工智能学院硕23

4）祝留宇中国石油大学（北京）人工智能学院硕23

5）胡思颍中国石油大学（北京）人工智能学院硕22

6）鲁强中国石油大学（北京）人工智能学院智能科学与技术系教师

摘要:

在城市交通安全监测领域，检测行驶中的摩托车的驾驶员是否佩戴头盔是一项至关重要且具有实际意义的任务，然而这一任务目前面临两大挑战。首先，该领域缺乏涵盖夜间和雨天等挑战性场景的开源数据集。其次，行人和路边停放的摩托车通常会干扰行驶中的摩托车的检测任务，从而影响检测结果的准确性。为了解决上述两个问题，本文收集并注释了夜间等具有挑战性的场景的图像，得到了52800张注释图像，构建了一个更为全面的数据集，并将其命名为增强型摩托车头盔检测数据集（EMHDD）。此外，本文还提出了一种集成了辅助校正功能的两阶段检测模型RAY-Net。该模型包括检测阶段和识别阶段。在检测阶段，该模型通过辅助校正解决了路边行人和停放的摩托车造成的检测结果不理想的问题。随后，识别阶段对检测阶段的结果进行识别，并确定驾驶员是否佩戴头盔。

设计与实现:

EMHDD

经过六个月的工作，本文收集了多个城市道路中包括白天、夜间、多云和雨天等场景的数据。本文通过在北京市和山东省济南市合理地设置了多个采样点，利用摄像机拍摄收集有关摩托车的交通数据。通过对实际情况的分析以及对模型训练效果的考虑，本文在完成数据采集工作后，进一步完成了以下三种数据的清洗工作：

长时间没有摩托车出现的视频片段。
摩托车未完全出现于图像中的视频片段。
摩托车距离摄像机很远的视频片段。

本文通过对所有数据的检查和清洗工作后，获得了265个有效视频片段，共计440分钟。我们从这265个视频片段中以每秒2帧的速率提取出52800张图像。如表1所示，白天、夜间、雨天和阴天这四种主要场景分别占整个数据集的17.05%、59.09%、9.09%和14.77%。图1展示了该数据集中不同场景的图像。

图1：EMHDD中各种场景数据的展示。(a)白天；(b)夜间；(c)雨天；(d)阴天。

本文提出的摩托车头盔检测算法RAY-Net由检测器和识别器组成。如图2所示，上部分表示检测器，下部分表示识别器。我们分别训练这两个独立的网络模块，利用检测器检测出行驶中的摩托车并利用识别器识别摩托车驾驶员的头盔佩戴情况。

本文在检测阶段增加了一个辅助校正模块。对于检测任务，检测器首先检测输入图像中三种类别的对象：运动中的摩托车（Driving）、人（Person）和摩托车（Motorcycle）。辅助校正模块使用人（Person）和摩托车（Motorcycle）两个类别校正检测结果，该模块通过人和摩托车的边界框之间的交并比（IoU）评估它们的相关性，保留具有高相关性的组合以校正检测结果。识别器对校正后的检测结果进行识别，并判断摩托车驾驶员是否佩戴头盔。

图2 RAY-Net模型的结构

该辅助校正算法的流程在Algorithm 1中给出。

实验结果及分析:

1.对比实验：

我们在HELMET和EMHDD数据集上进行了充分的实验，将本文使用的检测器和识别器与其他现有的最先进的方法进行比较。如表2和表3所示，本文提出的集成了辅助校正模块的检测器与其他方法相比具有更高的精度，这证明本文所提出的检测器能够有效地防止行人和路边停放的摩托车被误识别为目标物体。同时我们使用的识别器也同样具有优势。

值得注意的是，两个阶段的所有模型在EMHDD上的准确性与HELMET上的准确性相比，都有明显的下降趋势。这是因为本文自建的EMHDD数据集包括了极具挑战性的场景，如夜间和雨天，如果不进行数据预处理，模型的准确性将受到严重影响。这进一步说明了未来研究需要关注更复杂的场景，同时也证明了本文自建的EMHDD数据集的全面性。

2.消融实验：

本文对检测器的辅助校正模块进行了消融分析，在HELMET、HD、UMD和自建的EMHDD数据集上进行了全面的实验，以展示本文所提出的辅助校正模块的有效性。

如表4所示，集成了辅助校正模块后，检测器的精度有明显提升。改进后的模型在开源数据集HELMET和UMD以及我们自建的EMHDD数据集上表现更好，仅在HD上的性能几乎相同，这表明我们提出的辅助校正模块是有效的。这是因为辅助校正模块能够筛除被错误检测为目标对象的数据，从而提高检测阶段的准确性。

结论:

由于目前的开源数据集都存在不足，本文收集了两个城市中不同街道的数据，并构建了一个更复杂、更全面的数据集EMHDD。本文提出的RAY-Net是一个由检测器和识别器组成的两阶段模型，它们协同工作以提高系统的整体效率。在检测阶段，本文使用RetinaNet作为基础模型，并添加辅助校正模块。检测器在检测行驶中的摩托车的同时，还要检测人和摩托车这两种类别的物体作为辅助校正依据以校正检测结果。实验结果表明，该方法可以有效地筛除行人和路边停放的摩托车，从而更准确地检测出行驶中的摩托车。辅助校正模块能够提高系统的整体精度，并减少识别器的工作负载。在识别阶段，本文使用YOLOv8作为基础模型。实验结果表明本文在识别阶段使用的方法优于其他方法。在未来的研究中，我们将进一步考虑如何预处理不同场景的数据，以提高系统整体的准确性。

作者简介:

王智广，教授，博士生导师，北京市教学名师。中国计算机学会（CCF）高级会员，全国高校实验室工作研究会信息技术专家指导委员会委员，全国高校计算机专业（本科）实验教材与实验室环境开发专家委员会委员，北京市计算机教育研究会常务理事。长期从事分布式并行计算、三维可视化、计算机视觉、知识图谱方面的研究工作，主持或承担国家重大科技专项子任务、国家重点研发计划子课题、国家自然科学基金、北京市教委科研课题、北京市重点实验室课题、地方政府委托课题以及企业委托课题20余项，在国内外重要学术会议和期刊上合作发表学术论文70余篇，培养了100余名硕士博士研究生。