当前位置: 网站首页   >   学院新闻   >   正文

机械优集学院研究生黄寅杰在智能交通领域TOP期刊上发表研究论文

作者: 王福元   审核人: 卢倩   信息来源:    发布时间: 2025-02-24

近日,机械优集学院研究生黄寅杰在智能交通领域顶级期刊《IEEE Transactions on Intelligent Transportation Systems》(中科院1区,JCR Q1区,TOP期刊,影响因子8.5)上发表了题为《D-TLDetector: Advancing Traffic Light Detection With a Lightweight Deep Learning Model》的研究论文。研究生黄寅杰为第一作者,导师王福元教授为通讯作者,盐城工学院为第一单位。

该论文针对复杂天气条件下的交通灯识别课题开展研究,提出了一种轻量级交通信号灯检测模型,该模型采用轻量化骨干网络和Low-GD neck 构架。在骨干网络设计中,采用了结构性重参数化和轻量化视觉变换器(VITs)来增强模型,通过多分支和Feed-Forward Network(FFN)结构来分别增强信息丰富性和模型的位置感知能力。

在模型的骨干部分,基于EfficientV2结构重新设计了一种新型的LightWeight Block:在Neck 部分,采用了Low-stage gather-and-distribute branch(LSGD)以取代传统的特征金字塔网络FPN。在交通信号灯数据集上提出了一种基于Stable Diffusion 的数据扩充方法,结构如图1所示。

Figure 1. The flowchart of algorithm

在传统backbone 网络的设计中,常常忽略了下采样过程中输入数据发生的显著信息损失。因此,交通信号灯等小目标物体的重要特征信息很容易在传递到输出末端时消失。另外,鉴于移动设备平台的计算能力有限,需要更轻量级的特征提取模型。在EfficientNetV2 的启发下,结合轻量化VITs 架构和structural reparameterization,构建了一种轻量级特征提取网络。如图2所示。

Figure 2. The overview of lightweight backbone architecture

图11展示了五种不同轻量化模块的Grad-CAM 图进行比较。在这次比较中,Grad-CAM图是基于BackBone 最后一层的输出特征生成的。图片中红色区域越深表示网络对该部分特征的关注度越高,这些区域对模型的物体识别影响较大。通过观察和对比这些Grad-CAM 图,意到不同轻量化网络架构下热力图的特征分布和关注区域各异。

Figure 11 Grad-CAM images with various lightweight backbone networks

图14所示为mAP和FPS在各种场景中的关系。 图片中越接近左上角,模型总体的性能就越好。由此可见,在输入尺寸为640 情况下轻量化模型的检测速度比常规模型快,但是检测精度相对较低。提出的D-TLDetector 模型与轻量化型号和常规型号相比,表现出明显的优势,可以有效地平衡检测速度(135FPS)和检测精度(98.23%)。

Fig. 14. Comparison of tested models on YCTL2024 and BSTLD datasets, highlighting mAP and FPS performance

D-TLDetector 克服了传统检测模型在信息交换和数据增强方面的局限,同时有效解决了在复杂天气条件下的数据不足问题。实验结果表明,模型在BSTLD 和YCYL2024 数据集上实现了优异的性能,特别是在复杂交通场景中展示了显著的检测能力和鲁棒性。此外,D-TLDetector 的轻量化设计使其适于在资源受限的边缘计算设备上部署,从而有望在智能交通系统等实际应用中发挥重要作用。

Fig. 15. Detection result images for different models

(a) Yolov5n; (b) Yolov7-Tiny; (c) Yolov8n; (d) D-TLDetector

论文链接网址:https://ieeexplore.ieee.org/document/10834444

Copyright© 2021 All Rights Reserved. 盐城工学院-机械工程学院 优集学院版权所有  苏ICP备11037185号-1