深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。它的较终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远**过先前相关技术。比如,在农业发展领域里表型研究方面就得到较大的应用。
随着以机器学习乃至深度学习等为代表的数据处理技术快速发展,基于无人机遥感图像的麦穗检测方法逐渐成为替代传统人工测量方法的新选择。目前,大多数现有的麦穗图像数据集往往基于地面表型平台或手持设备采集得到,数量和质量往往不能令人满意。同时,这些数据集包含有限数量的图像和品种使得深度学习网络鲁棒性降低。
尽管基于深度学习CNN的目标检测方法显著提高了从近地面获得的小麦图像的麦穗检测性能。然而,对于基于空中尺度的无人机拍摄的不同阶段、高密度和重叠等情况的麦穗图像,现有的基于深度学习的目标检测方法往往检测效果不佳。由于CNN感受视野通常很小,不利于捕获全局特征。虽然CNN已经成为计算机视觉领域上的标准方法,凭借强大的表示能力可以减轻上述挑战的影响。在计算机视觉领域,骨干网络一直是特征提取的重要部件。通常卷积操作擅长提取细节,要掌握全局信息往往需要堆叠很多个卷积层。注意力机制善于把握整体,但在训练时又需要大量的数据学习其辨别性的特征。而把卷积核注意力结合的Transformer在减少计算开销的情况下提高了性能。在2020年,Vision Transformer(ViT)的出现,到目标检测的DETR,再到图像分割的SETR以及3D人体姿态的METRO等引发了新一轮范式转变。使用Transformer来完成目标检测视觉任务成为了一个新的研究方向。与现有流行的CNN方法相比,基于Transformer的方法在视觉任务上也显示出了良好的性能。
因此,在麦穗检测中引入Transformer,设计开发了三种均基于Transformer做主干的目标检测网络,包括两阶段方法FR-Transformer和单阶段方法R-Transformer和Y-Transformer。与其他各种流行目标检测CNN方法相比, FR-Transformer方法优于它们,其中AP50为88.3%,AP75为38.5%。结果表明,所提FR-Transformer方法能够较好地满足田间环境下无人机快速准确检测麦穗的需求。这些更加相关且直接的信息为小麦产量的进一步估算提供可靠的参考。
深度学习技术目前除了被应用在上文中提到的小麦无人机低空遥感图像检测中,同时也被应用在玉米、水稻、食用菌、甘蔗等各类农作物表型测量中。比如,食用菌行业常用的菌丝表型仪、智能育种出菇箱等设备系统都应用了深度学习技术对菌丝、食用菌的生长进行表型监测,另外有些企业或科研机构为了提高效率,选择使用数字化植物表型大数据平台,即以深度学习技术为核心,将研发、生产等环节通过智能算法系统融合一起,把*的经验载入每个生产环节,并将监测到的生产数据进行记录存储分析,较终实现科学、高效的育种与生产。
注:文章来源“小麦研究联盟”。