人工智能在农业风险管理中存在的问题、建议与展望

B站影视 2024-12-06 22:43 1

摘要:GUI Zechun, ZHAO Sijian. Research Application of Artificial Intelligence in Agricultural Risk Management: A Review[J]. Smart Agric

本文节选自:

桂泽春, 赵思健. 人工智能在农业风险管理中的应用研究综述[J]. 智慧农业(中英文), 2023, 5(1): 82-98.

GUI Zechun, ZHAO Sijian. Research Application of Artificial Intelligence in Agricultural Risk Management: A Review[J]. Smart Agriculture, 2023, 5(1): 82-98.

官网全文在线阅读

人工智能在农业风险管理中存在的问题、建议与展望

1 存在的主要问题及建议

从当前的研究进展可以看出,AI在农业风险管理的研究中有着优异的表现和诸多优势,尤其是在准确度和鲁棒性方面提升明显。但同时,也发现AI应用还存在一些缺陷和不足。AI要在农业风险管理中得到深入应用与推广,一些技术性问题还需要进一步探讨和解决。其中,两个主要的技术问题是模型性能提升问题和小样本问题。

1.1 模型性能提升问题

AI在农业风险管理研究中的模型性能提升一直是应用中的关键问题,模型性能提升主要包括特征提取能力提高、预测和识别精度提升和鲁棒性增强三大方面。尽管以往研究中通过调整模型自身参数能提升模型性能,但往往会遇到瓶颈,提升幅度并不理想。因此,为了更好地提升模型性能,可以尝试多种模型对比法、模型结合法和神经网络结构优化法等三种方法。

多种模型对比法是在不对已有模型进行改进的前提下,通过穷举法将候选模型集合中的所有模型和可能的对应参数用于进行任务建模,最终通过对比预测结果选取其中综合表现最好的模型和对应参数。具体实践中,如当学习任务为回归任务或者分类任务时,可以选择所有可能的回归或者分类算法进行建模,再根据评估指标选出其中的最优模型及参数。

模型结合法是指不同的模型具有不同的挖掘能力及适用的范围,通过“集百家之所长”的思想,在组合不同模型的基础之上,再根据模型评价指标选出表现最好的组合模型和对应的参数,将不同模型之间组合起来往往可以得到较明显的优化效果。具体实践中,可以选择线性模型和非线性模型相结合、时间序列模型和空间结构模型相结合、降维聚类模型和回归分类模型相结合等。

神经网络结构的优化(图1)是指通过改变神经网络的部分结构如层数、非线性函数、卷积核大小和使用的池化类型等,以提高模型对特征的自动提取能力与对目标的识别精度、增强模型的鲁棒性以防止过拟合、提高模型训练的高效性和减少模型参数以实现轻量化应用等。LeNet神经网络最开始的提出是用于解决手写数字的识别问题,而随着识别任务难度的增大,原有的LeNet模型不再适用于复杂任务的识别,人们对LeNet进行改进提出了新的神经网络模型——AlexNet,该模型赢得了2012年的ImageNet竞赛冠军,向人们展现了其强大的图像识别能力。具体实践中,对神经网络结构的优化有很多方法,可以依据自身建模的任务需要对神经网络进行定制化构造,如为了学习被识别对象不同大小的特征,可以在神经网络中使用不同大小的卷积核进行特征提取。

图1 神经网络结构优化

Fig. 1 Optimization of neural network structure

上述三种方法可依据实际使用人对AI的熟悉了解程度进行选择性采用以提升模型的性能。相对来说对比多种模型法是最容易实现的,只需根据哪些算法是属于回归还是分类类型,直接调用即可。模型结合法需要使用者对各种模型的应用领域及特点优势有较多的理解,通过不同模型的组合使用再进行调参,由于一定数量不同模型的组合以及调参时要使用到网格搜索法,使用模型结合法提升模型性能往往需要花费较多的时间在进行模型选择和参数训练上。神经网络结构优化法对使用者的深度学习理论基础以及代码能力要求较高,是三种性能提升方法中难度最大的,可以依据使用者自身具体情况进行选择。

1.2 小样本问题

数据就是AI的“石油”。进行机器学习算法训练时需要大量的数据集提供给模型本身去学习海量数据中所蕴含的信息和特征,挖掘出数据中线性和非线性的信息以进行模式识别。然而,在开展农业风险管理相关研究时发现,用于训练的数据样本往往非常有限,尤其是针对多指标数据建模问题,常因为指标数据难收集和采集而出现小样本问题,让AI无法充分发挥效用。此外,针对AI所需的特定样本数据制作,例如病虫害病例照片的标签制作等,需要花费大量的人力和时间,且常常出现样本质量低、有效样本少的小样本问题。

为了解决小样本问题,并在不加大人力时间成本投入的前提下,可采用数据增广技术、迁移学习技术和生成对抗网络来处理。数据增广适合于数据集类型为图像的深度学习任务。所谓数据增广就是在原有图像数据集的基础之上,采用镜像、旋转、缩放、裁剪、平移、颜色抖动、调整对比度、随机擦除和高斯噪声等方法对图像数据进行处理以增加数据量。在计算机视觉领域,迁移学习技术在解决小样本问题中取得了很好的效果。生成对抗网络是一种无监督生成模型,学习过程是生成器和鉴别器两个神经网络之间的极大极小博弈,使用生成对抗网络扩展小规模数据集已经在AI领域得到了广泛的应用。

在具体实践中,数据增广、迁移学习、生成对抗网络往往可以结合使用,数据增广和生成对抗网络强调对数据量的增加,从数据源头增加输入信息量以增加模型的鲁棒性,迁移学习偏重在相似识别模式下对已有神经网络结构和参数权重的调用来进行模型初始化,通常训练速度会更快且识别精度会更高。

2 总结与展望

本文阐述了AI在农业脆弱性评估、农业风险预测和农业损害评估三大方面的应用研究进展,总结认为AI农业风险管理应从以下方面展开。

(1)AI在农业脆弱性评估中的特征重要性评估缺乏科学有效的验证指标,且应用的方式导致无法比较多个AI算法之间的优劣,建议可采用主客观法进行评价,另外,未来可考虑将AI引入对农业脆弱性曲线的构建。

(2)在风险预测中,发现随着预测时间的增加,机器学习模型的预测能力往往会下降,过拟合问题是风险预测中的常见问题。且目前研究针对图数据空间信息的挖掘还较少,针对农业产业链的上下游关系和与农业相关的行业关系,未来可以更多地应用图神经网络对农业价格风险预测进一步深入研究。

(3)在损害评估中,提高模型的特征提取能力和鲁棒性是建模的主流方向,未来可以更多地引入评估目标相关领域的专业知识以增强对目标的特征学习,另外模型训练需要对大量图像数据进行标注,耗时耗力,对小样本数据进行增广也是未来研究的重点内容。

AI由于其强大的自学习能力在很多领域得到了广泛应用,然而其存在的“黑箱”可解释性差、数据标注成本大和算力要求高等问题也不可避免地限制了它的进一步发展与推广。增强AI的可解释性、提高模型训练的效率、提升算法模型的学习能力和减少人工标注数据的成本等问题有待进一步地深入研究。如今,中国的农业正在朝着智慧农业转型,伴随着AI、物联网、大数据和云计算等方面技术的提升与深入应用,可以预见,未来的农业风险管理将会愈发高效、精准和智能。

为方便农业科学领域读者、作者和审稿专家学术交流,促进智慧农业发展,为更好地服务广大读者、作者和审稿人,编辑部建立了微信交流服务群,有关专业领域内的问题讨论、投稿相关的问题均可在群里咨询。

发布征集

来源:鱛

相关推荐