Keywords: YOLO Architecture; Real-Time Object Detection; Inference Acceleration, Convolutional Neural Networks, Attention Mechanism, Depthwise Separable Convolutions
TL;DR: TL;DR
Abstract: 随着计算机视觉技术的不断进步,实时物体检测已广泛应用于自动驾驶、智能监控和增强现实等多个领域。YOLO(You Only Look Once)架构因其高检测速度和良好准确性而受到广泛关注。然而,YOLO模型在推理阶段的计算复杂度和延迟问题仍然存在,限制了其在资源受限环境中的实际应用。
本文针对YOLO架构提出了一种系统的推理加速技术,主要通过修改卷积神经网络(CNN)层的架构和优化注意力头结构来实现。具体而言,本文对YOLOv5模型的卷积层进行了深度可分离卷积的替代,以减少计算量,同时引入改进的多头自注意力机制,以提高特征提取的效率。
实验结果表明,经过这些优化,模型的推理速度提升了69.3%,而检测精度仅下降了10.1%。这一结果证明了所提出方法的有效性,为YOLO架构在实际应用中的推广提供了可行的解决方案。通过减少计算复杂度和优化特征提取过程,本文的技术为在资源受限环境中实现高效的实时物体检测开辟了新的可能性。
Submission Number: 25
Loading