摘要:单位:1.中国热带农业科学院农业机械研究所;2.农业农村部热带作物农业装备重点实验室;3.广东省热带作物装备科技创新中心
单位:1.中国热带农业科学院农业机械研究所;2.农业农村部热带作物农业装备重点实验室;3.广东省热带作物装备科技创新中心
简介:周思理,男,江西新干人,研究实习员,硕士,从事热带智能农机装备研究。*通信作者,研究员,硕士,从事热带作物机械化研究。
基金项目:湛江市科技计划项目(2021A05188);海南省自然科学基金项目(522QN385);海南省自然科学基金项目(324MS095);广西壮族自治区市场监督管理局科技项目(GSJKJZC2024-3)。
来源:《安徽农业科学》2025年8期
引文格式:周思理,李国杰,何冯光,等.YOLOv8算法分类识别机收甘蔗杂质的研究[J].安徽农业科学,2025,53(8):200-204,208.
长按识别
OSID开放科学计划
长按识别论文专属二维码,听作者讲述论文写作背景,与同行交流心得体会。
我国是全球第三大甘蔗生产国,对于机械化作业需求很高,其中机械化收获在多年的发展中取得了一定进步,但收获后会混有不同种类杂质,如蔗梢、蔗叶、泥沙等,而杂质含量是影响制糖产糖率和经济效益高低的关键因素之一。同时会造成糖厂设备使用寿命缩短、生产成本增加以及一级糖料出糖率降低等。然而,现在糖厂对于入厂甘蔗测杂仍然依靠人工抽样检测或目测,导致效率低、误差大、缺乏科学依据等问题,致使糖厂、机收队与蔗农三者间产生利益矛盾。
针对国内甘蔗含杂率检测现状,很多学者进行了研究并取得一定进展。目前,YOLO系列算法已被广泛应用于图像识别、目标检测等领域,其中YOLOv8算法面向小目标检测具有较大优越性,如检测速度快、模型性能大幅提升及精度和稳定性也有所提高等,十分适合应用于机收甘蔗杂质分类识别。笔者采用该算法,通过搭建图像采集平台,构建机收甘蔗数据集并进行分类训练,最后输出结果,旨在为糖厂生产过程中的杂质扣除环节提供技术支持。
1 硬件和算法设计
1.1 硬件设计
1.1.1 主要硬件体系结构。机收甘蔗含杂率分类识别系统主要由计算机、工业相机及镜头、光源、相机支架、铝型材箱体等组成,硬件体系结构如图1所示。
图1 硬件体系结构
采用UItraLAB-EX630i型计算机,系统为Windows10专业工作站版,Intel(R)Xeon(R)Gold 5220R CPU@2.20 GHz,显卡NVIDIA GeFerce RTX 3070,内存64GB DDR4 2933MHz,其工作性能可以满足工业相机采集图像及识别功能。
1.1.2 工业相机选型。采用海康MV-CS060-10GC型工业相机作为图像采集与识别器,其分辨率为3072×2048、像元尺寸2.4μm×2.4μm、信噪比41.3dB、焦距6mm,采用Sony IMX178型传感器,如图2a所示。
注:a.MV-CS060-10GC型工业相机;b.镜头。
图2 工业相机及镜头
该相机搭载优异的图像传感器,动态范围高,具有信噪比好、兼容性高等特点。拍摄视场的宽度、镜头焦距、感光芯片的靶面尺寸和物距这四者满足公式(1):
式中: f为镜头焦距;WD为物距;FOV为拍摄视场的宽度;H为芯片的靶面尺寸。
该系统中相机安装的高度为0.5~1.0m可调,因此拟定物距WD=600mm,FOV=800mm,H=7.37mm带入式(1)中,计算出f=5.5,镜头通常在6~600mm选择。根据拍摄场景大小,综合考虑,镜头采用海康MVL-HF0628M-6MPE,如图2b所示。
1.1.3 光源选型。光源是机器视觉识别最为关键的部分之一,光源的优劣直接决定了图像的质量,进而影响整个系统的识别效果。机器视觉中常见的光源分为荧光灯、卤素灯和LED灯3种。其中 LED 灯亮度稳定、寿命长、功耗低,在光源的使用中占据主导地位。LED光源按照结构不同分为环形光源、条形光源、方形光源等。机收甘蔗表面细长,故采用条形光源可以使其表面光照均匀。最初采用2根普通的条形光源置于相机的上方,但在试验中发现,由于拍照黑箱尺寸太大,光源亮度不够,故采用科麦视觉公司的BRD18030线扫描光源,如图3所示。该光源由大功率LED 灯阵列组成,具有高亮度、高均匀性和高稳定性的特点,且亮度可调,采用2个线扫描光源与甘蔗及杂质轴向水平安装。
注:a.光源控制器;b.条形光源。
图3 BRD18030线扫描光源
1.1.4 图像采集平台搭建。为防止外界自然光影响获取高质量图像过程,该平台采用黑色哑光铝型材搭建,并在周围覆盖黑色吸光背景布,避免复杂背景对图像识别的干扰。同时,为了保证采集到的机收甘蔗图像与处理得到结果的实时性,减少了物料的堆叠和粘连,为后续图像处理降低难度,设计了一种移动装置(图4)。将机收甘蔗放于传送带上,采集平台位于传送装置上方,即可采集和处理移动过程的机收甘蔗图像。但要获取移动状态下机收甘蔗清晰无拖影图像需满足以下条件:在曝光时间内机收甘蔗移动的距离小于相机的精度,即曝光时间(t)×机收甘蔗移动速度(v)≤相机分辨率(p)。
图4 图像采集平台
采用海康彩色工业相机结合其SDK工具包,自编写图像采集程序,设置相机参数,即能获取清晰图片,图像采集过程中始终保持镜头与机收甘蔗成分统一高度,且采取垂直拍摄方式,此举可减少相机标定操作,还可减少在测量与计算镜头焦距时的误差,更利于后续的计算机处理。具体图像采集流程见图5。
图5 图像采集流程
1.2 机收甘蔗杂质分类识别算法设计
1.2.1 分类识别算法流程。采用YOLOv8网络训练方法对建立的机收甘蔗数据集进行训练。YOLOv8与前几代YOLO算法相比实现了进一步轻量化,而且使用了一种称为极限检测网络(ExtremeNet)的新结构以及C2f骨干网络,该网络使用更多的跳层连接和分割操作,以增强梯度流和特征融合,使得YOLOv8算法精度明显提高,运行速度也大幅加快,因此该算法应用于识别区分实时移动的机收甘蔗具有明显优势。首先将建立的数据集预处理,再利用labelme软件标定机收甘蔗不同成分特征,标定完成后的图像用于YOLOv8模型进行训练、验证数据集,最后训练完成的模型用来对机收甘蔗杂质进行识别分类,该模型训练具体流程如图6所示。
图6 YOLOv8识别流程
1.2.2 数据预处理。目前切断式甘蔗收获机除杂系统不够完善,导致所收获的甘蔗杂质含量较多,通过对收获现场收集的机收甘蔗杂质进行分类,主要包括蔗叶、蔗梢和蔗根等。
为控制样本正平衡,3种杂质类型各随机选择600张图片,每张图片均进行尺寸归一化处理,尺寸大小为665×207,同时为提高模型的鲁棒性,将样本按1∶9的比例分为测试集和训练集。
图像采集过程中一般会存在噪声影响图像质量问题,因此需要利用滤波技术去除噪声来改善图像质量和清晰度,使图像更具可视化效果和可识别性。常见的滤波方法有多种,如均值滤波、中值滤波、双边滤波和高斯滤波等。笔者采用高斯滤波方法,利用高斯函数作为权重对图像进行卷积操作,其滤波器为1个二维的高斯核,将滤波器与机收甘蔗不同成分图像的每个像素进行加权平均,具体见式(2):
式中:G(x,y)为图像在(x,y)位置处的像素值;σ为标准差;x、y为坐标点。
通过高斯滤波后的图像变得更平滑,如表1所示。
1.2.3 YOLOv8网络模型。YOLOv8网络模型具有图像分类、物体检测和实例分割等功能,包括Input、Backbone、Neck、Head、Output5个部分,可调整模型尺寸参数、降低计算量,构建一个模型特征表达能力够强的网络模块,如图7所示。
图7 YOLOv8预测流程
Backbone模块相当于模型的骨干网络,使用C2f结构提取机收甘蔗不同成分特征,是后续进行目标检测的关键步骤,能将目标与背景、位置和形状等信息区分开来;Neck模块类似模型的颈部,对提取的图像特征进一步处理和加工,增强网络对不同缩放尺度对象特征融合的能力,提高检测的准确性和精准度;Head就是模型的检测头,将上一步处理后的特征图像经过卷积层、激活函数和上采样等操作生成目标对象的位置、类别和置信度等核心信息,具备增强模型的泛化能力,该模型结构如图8所示。
图8 YOLOv8网络结构
2 结果与分析
2.1 试验设置
在上述电脑配置环境下结合YOLOv8网络模型,完全可开发出高性能图像识别区分模型,工作流程方法如图9所示。
图9 YOLOv8算法总体执行流程
该模型利用预训练权重迁移学习方法进行训练,训练及测试均在同一系统上开展,将YOLOv8所训练的图像尺寸统一为665×207,利用3通道训练15批次共300回合,学习率和衰减率分别设为0.001和0.005,滤波器数值设为25。
2.2 评价指标
为检验机收甘蔗成分识别的精准性,采用查全率(Recall)、查准率(Precision)和平均精度均值(mAP@0.5)对检测结果进行量化评价。
2.2.1 查全率。表示召回率,指检测结果中正确像素数量占实际样本像素的百分比,其计算公式如下:
式中:R为查全率;Tp为正确识别的像素数;FN为漏识别的像素数。其中,Tp、FN由人工标注而得。
2.2.2 查准率。表示准确率,指所有检测结果中正确像素数量占总检测结果的百分比,其计算公式如下:
式中:P为查准率;Tp为正确识别的像素数;Fp为误识别的像素数。其中,Tp、Fp均由人工标注而得。
2.2.3 平均精度均值。指的是模型的精确度随召回率的变化趋势。该值与召回率成正比,该模型取混淆矩阵的IoU的阈值为0.5时,得出样本的平均精度。
2.3 试验结果
经过300次训练后得到如图10所示的定位损失变化曲线。由图10可知,在前期的训练过程中损失值下降迅速,表示模型迅速拟合;通过迭代40次后损失值下降速度降低,直至定位损失收敛至0.016。
图10 定位损失曲线
在模型训练结束后,随机选取蔗段、蔗叶、蔗梢和蔗根各60张样本图片进行测试,并统计识别正确和错误数量,结果见表2。
根据训练结果以召回率(Recall)为横坐标、准确率(Precision)为纵坐标,建立Recall-Precision曲线图,表示两者之间的关系,结果如图11所示。由图11可知,该模型整体预测准确率约为77.4%,能够有效识别区分机收甘蔗不同杂质。
图11 Recall-Precision曲线
3
结论
通过采集机收甘蔗图像构建数据集,再利用高斯滤波器对图像处理去噪,随后按照一定比例分成数据集和训练集,经过迭代训练300次后,各取60张样本图像进行检测并统计错误和正确识别图像数量,建立Recall-Precision之间关系,最终该模型能够较好地识别出机收甘蔗成分,且平均精度为77.4%。该研究可为后续机收甘蔗含杂率的检测提供一定借鉴。
更多推荐论文
论文推荐|阿胶和阿胶肽对血管内皮细胞氧化损伤的作用研究
论文推荐|不同产地富士苹果果实品质差异性分析
论文推荐|番茄灰霉病生防菌的分离鉴定·发酵条件优化及其防治效果
论文推荐|甘肃省中部干旱地区大麦引种试验
论文推荐|“双碳”目标下低碳农业的发展策略研究
论文推荐|农业科研机构影响力提升的五大措施
论文推荐|黔西北喀斯特山区农业碳排放时空特征与脱钩效应分析
论文推荐|2013—2023年安徽省地表水环境质量分析
论文推荐|ICP-MS法测定不同品种茶树中26种元素及评价分析
论文推荐|数字乡村建设助推农业绿色发展的机理分析与实践路径
采编:小白
排版:小同
来源:安徽农业科学