YOLO-FireAD:通过混合注意力与双池化融合实现高精度实时火灾检测

B站影视 内地电影 2025-06-11 17:44 1

摘要:本文提出YOLO-FireAD火灾检测模型,其核心的注意力逆残差模块(AIR)和双池化模块(DPDF)有效增强关键特征并保留细节,在显著减少51.8%参数量的同时,将检测精度(mAP50-95)提升了1.8%,大幅改善了小火焰漏检和环境噪声干扰问题。>>更多资

【导读】

本文提出YOLO-FireAD火灾检测模型,其核心的注意力逆残差模块(AIR)双池化模块(DPDF)有效增强关键特征并保留细节,在显著减少51.8%参数量的同时,将检测精度(mAP50-95)提升了1.8%,大幅改善了小火焰漏检和环境噪声干扰问题。>>更多资讯可加入CV技术群获取了解哦~

论文标题:

YOLO-FireAD: Efficient Fire Detection via Attention- Guided Inverted Residual Learning and Dual-Pooling Feature Preservation

论文链接:

在动态环境中进行火灾检测面临持续挑战,包括光照变化的干扰、大量误报或漏报,以及难以同时实现效率与准确性。为解决现有YOLO模型在特征提取限制及信息丢失问题,本研究提出基于注意力引导逆残差学习与双池化下采样融合的火灾检测方法(YOLO-FireAD),其核心创新包括:

注意力引导反向残差块(AIR)通过将混合通道-空间注意力与反向残差相结合,实现对火灾特征的自适应增强并抑制环境噪声;双池化下采样融合块(DPDF)通过可学习融合最大-平均池化输出,保留多尺度火灾模式,从而缓解小规模火灾检测失败的问题。

在两个公开数据集上的广泛评估表明,本模型具有高效的性能。模型保持了参数总数(比YOLOv8n低51. 8% )的参数总数,mAP75高于主流实时目标检测模型YOLOv8n、YOLOv9t、YOLOv10n、YOLOv11n、YOLOv12n及其他YOLOv8变体1.3-5.5%。

方法

如图1所示,YOLO-FireAD采用“骨干-颈部-头部”三层架构,该架构经过优化,适用于早期火灾检测和高效率。其核心在于将AIR模块的注意力引导特征增强与DPDF模块的多粒度特征保留机制贯穿整个网络,从而将火灾检测的mAP50-95提升至34.6%(比YOLOv8 高出1.8%),同时保持高效率(参数数量比YOLOv8少53%)。

在骨干网络阶段,基于多级特征提取设计,其由CBS基础模块、AIR注意力模块和DPDF下采样模块交替堆叠组成:

CBS 模块通过 3×3 卷积提取火焰的局部纹理特征(如边缘闪烁、烟雾扩散模式);AIR 模块嵌入注意力机制,增强火焰核心区域的响应并抑制类似火灾的干扰;DPDF 模块在分辨率下采样过程中,通过双池化融合策略同时保留火焰高光细节(最大池化)和烟雾连续性(平均池化)。

在颈部阶段采用双向特征金字塔结构,通过UpSample和Concat操作融合深度语义与浅层细节。DPDF模块在特征融合节点进行分辨率对齐和噪声过滤,以消除烟雾遮挡引起的特征模糊。AIR模块插入跨层连接器,动态校准不同尺度特征的注意力分布。

检测头在保持多尺度检测能力的同时,通过堆叠CBS模块实现通道压缩,最终进入损失函数CIoU损失以及用于定位和分类的交叉熵损失。

如果你也想要使用模型进行改进,Coovally——新一代AI开发平台,为研究者和产业开发者提供极简高效的AI训练与优化体验!Coovally支持计算机视觉全任务类型,包括目标检测、文字识别、实例分割,并且即将推出关键点检测、多模态3D检测、目标追踪等全新任务类型。

千款模型+海量数据,开箱即用!

平台汇聚国内外开源社区超1000+热门模型,覆盖YOLO系列、Transformer、ResNet等主流视觉算法。同时集成300+公开数据集,涵盖图像分类、目标检测、语义分割等场景,一键下载即可投入训练,彻底告别“找模型、配环境、改代码”的繁琐流程!

实验设置

本节将简要介绍实验设置及相关资源。随后,本研究将依次介绍实验数据集、实验配置及评估指标。

数据集

本研究使用的两个数据集——fire_detection数据集和fire数据集——均来自Paddle社区,包含大量多尺度复杂火焰火灾场景及烟雾。

配置

实验程序在搭载NVIDIA GeForce RTX 4090显卡驱动的Ubuntu 22.04操作系统上运行。深度学习框架选用PyTorch 2.1.0,使用Jupyter Notebook作为编译器,指定编程语言为Python 3.10,且比较分析中使用的所有算法在同一计算环境下运行且操作一致。图像尺寸标准化为640×640×3,批量大小为128,优化器为AdamW,学习率设置为0.002,动量为0.9,训练周期数为200。

评估指标

模型性能通过检测准确性指标(精度、召回率、F1分数)、综合mAP分数(mAP50、mAP75、mAP50-95)以及计算效率参数(参数数量、GFLOPs、模型大小)进行全面评估。

实验细节与分析

为验证本文提出的YOLO-FireAD检测模型优越性,对上述数据集进行了系列验证,并采用上述提及的多种评估指标进行评估与分析。

首先,介绍了当前主流的物体检测模型及其变体,并与本文提出的模型进行比较实验,以展示所提模型的优越性。然后,对本文提出的模型结果进行评估,包括比较实验分析、泛化实验分析和消融研究分析。最后,分析了本文提出的模型的局限性。

训练过程:图5记录了模型在训练集和测试集上,每次迭代中不同阈值下边界框损失、分类损失、焦点损失、模型精度、召回率和平均精度随迭代次数的变化情况。根据图表可知,在训练初期,模型各损失值较高且收敛迅速,而模型指标迅速上升,表明此时模型学习效率较高。随着迭代次数的增加,各曲线的变化率逐渐减小,大约经过40次迭代后,曲线开始趋于稳定,最终在约200次迭代后,曲线基本保持稳定。

对比实验(fire_detection数据集):为了验证YOLO-FireAD的性能,对比实验将YOLO-FireAD与YOLOv8n、YOLOv9t、YOLOv10n、YOLO11n、YOLOv12n以及YOLOv8n的改进模型,并在 fire_detection 数据集上分析模型性能,通过 P、R、F1score、mAP50、mAP50-75、mAP50-95、参数数量、FLOPs 和模型大小等指标评估模型性能,

实验结果如表1所示,图6为F1、mAP50和参数的实验数据可视化图表。

可以看出,YOLO-FireAD模型在所有性能指标上表现优异,其P、R、F1和mAP(mAP50、mAP75和mAP50-90)均显著优于其他模型。P的优势最为明显,分别比YOLOv8n、YOLOv12n、YOLOv8n+HAM和YOLOv8n+WIoUv3高出10.7%、9.4%、12%和11.4%。此外,YOLO-FireAD 的 mAP75 在所有模型中表现最佳,这表明 YOLO-FireAD 在不同 IoU 阈值下均能保持高检测性能,使其在复杂的物体检测任务中具有显著优势。在保持高精度的同时,YOLO-FireAD 的复杂度也显著低于其他模型,其参数数量为 145 万,仅为 YOLOv8n 的 48.2%,浮点运算量为 4.6G,模型大小为 3.3MB,均为所有对比模型中最低。

可视化对比‍:图7展示了几个主流模型与YOLO-FireAD在实际场景中的检测结果,以便清晰对比不同模型在火焰危险检测中的性能差异。YOLOv8n能够在大多数场景中识别火焰,但识别准确率略低,且在密集火焰场景中存在一定检测漏报。与YOLOv8n相比,YOLO11n和YOLOv12n在密集火焰场景下的漏检率更高,这表明它们在复杂场景下的火焰识别存在一定局限性。与上述三种模型相比,YOLOv8n+ASF在火焰密集时漏检率显著降低,但对小火焰存在一定漏检,这表明其在处理小型目标时存在一定局限性。与上述模型相比,YOLO-FireAD凭借其AIR模块的注意力机制表现显著优异,该机制可动态调整特征图权重,使网络更聚焦于火焰目标,尤其在多密集火焰场景中效果突出。 DPDF 模块通过双池融合策略在分辨率下采样过程中同步保留火焰高光细节,避免了下采样过程中小火焰特征的丢失,从而实现了对小火焰更准确的识别。

热力图可视化:图8展示了YOLOv8n和YOLO-FireAD在火焰识别任务中的热力图可视化结果。从图中可以看出,尽管YOLOv8n能够识别出大多数火焰,但存在一些误检,且火焰的识别不够明显,同时还存在漏检现象。相比之下,YOLO-FireAD表现明显更优,能够准确识别火焰位置并更清晰地识别小型火焰。

泛化能力验证:此外,我们在Fire数据集上验证了模型的泛化能力,结果如表2所示。可以看出,YOLO-FireAD同样表现良好。在所有对比模型中,mAP50-95 表现最佳,达到8.12%,分别高于YOLOv9t、YOLOv10n、YOLOv8n+HAM、YOLOv8n+WIoUv3 的 1.39%、1.13%、1.37% 和 2.25%。

为了进一步验证YOLO-FireAD中提出的两个模块的有效性,我们在fire_detection数据集上使用YOLOv8n作为基线算法,对AIR和DPDF模块进行了消融实验,实验结果如表3所示。尽管仅引入AIR模块后YOLO-FireAD的mAP50-95略有下降,但P值从64.6%提升至68.0%,增幅近3.4%。同时,参数数量、浮点运算次数和模型大小均显著减少,尤其是参数数量从3.01减少到1.84,减少了约39%。这证明了AIR在轻量化方面的作用。

当仅将DPDF模块引入YOLO-FireAD时,与YOLOv8n相比,模型的P、R、mAP50、mAP50-95指标均得到提升,其中P的提升最为显著,从64.6%提升至69.2%,同时参数、FLOPs和模型规模也实现了减少。这证明了DPDF模块在提升模型识别准确性方面的实用性。

当两者结合时,整体模型性能达到最优,P进一步提升至75.3%,较YOLOv8n高出10.7%,而mAP50-95从32.8%提升至34.6%。参数、FLOPs 和模型大小分别减少至 1.45M、4.6G 和 6.1MB,这表明 AIR 和 DPDF 在 YOLO-FireAD 中都发挥了不可或缺的作用。两者的结合使 YOLO-FireAD 能够通过增强关键特征和多粒度特征的优化融合,显著提高检测率的同时保证模型准确性。

无需代码,训练结果即时可见!

在Coovally平台上,上传数据集、选择模型、启动训练无需代码操作,训练结果实时可视化,准确率、损失曲线、预测效果一目了然。无需等待,结果即训即看,助你快速验证算法性能!

从实验到落地,全程高速零代码!

无论是学术研究还是工业级应用,Coovally均提供云端一体化服务:

免环境配置:直接调用预置框架(PyTorch、TensorFlow等);免复杂参数调整:内置自动化训练流程,小白也能轻松上手;高性能算力支持:分布式训练加速,快速产出可用模型;无缝部署:训练完成的模型可直接导出,或通过API接入业务系统。

平台链接:

无论你是算法新手还是资深工程师,Coovally以极简操作与强大生态,助你跳过技术鸿沟,专注创新与落地。访问官网,开启你的零代码AI开发之旅!

结论

本研究提出了一种高效的火灾检测框架YOLO-FireAD,通过两个创新模块——注意力引导的反向残差块(AIR)和双池下采样融合块(DPDF)——解决了实际部署中的关键挑战。AIR将轻量级通道-空间混合注意力机制融入反向残差学习,实现自适应特征校准的同时抑制火焰样干扰。DPDF通过融合最大池化(max-pooling)的边缘保留能力和平均池化(average-pooling)的上下文一致性,缓解了下采样过程中的特征退化。在两个基准测试中的广泛实验表明,该框架具有优越性,与YOLOv8相比,mAP提升1.8%,且参数减少51.8%。

然而,在极端光照条件和动态火势蔓延场景中,残差特征的模糊性仍存在局限性。未来研究将聚焦两个方向:整合红外-可见光多模态数据以提升烟雾遮挡场景下的检测可靠性,以及优化跨平台部署以适配异构边缘设备。

来源:小码科普君

相关推荐