植物的表型受基因和环境的双重影响,难以进行重复的有效测量。植物的表型是基因型和环境因素复杂交互的结果,基因型是表型得以表达的内因,而环境是表型得以表达的外因。植物表型研究是研究在特定条件下植物所表现出的可观察的结构、功能等形态特征及其变化规律,正成为学术和产业界公认的核心研究和应用领域之一,是解决面向未来的农业挑战的核心技术领域之一。
目前植物表型研究集中在小麦、拟南芥、水稻、玉米、高粱、大麦、西红柿、豆类和葡萄等植物上。表型测量主要分为形态学参数和生理学参数。形态学参数包括作物高度、茎粗、叶面积指数、叶角、茎杆 长度、株间距等。生理学参数包括叶绿素、光合速率、水分胁迫、生物量、耐盐性和叶片含水量等。这些参数都可以影响或表征作物的成长。如果用医学的发展比对植物表型研究,较能清晰的获得未来植物表型的研究方向。未来的植物表型研究也会对植物内部和外部的全部物理、生理和生化特征进行规范化的表征。
近年来随着大数据、云计算、人工智能和检测技术的发展,植物表型研究呈现快速发展态势。越来越多的植物和性状参数需要被快速和准确测量, 很多世界良好科研机构都把研究重心转移到诸如试验设计、定量分析和结论阐释等实际问题的解决等方面。2017年, 基于世界较新的表型研究成果, 法国植物表型协会、法国国家农业研究院(INRA)作物生理生态学家Francois Tardieu和诺丁汉大学植物学家Malcolm Bennett共同提出了多层次表型组研究的构想。他们指出表型组研究领域正在进入一个全新的发展阶段:如何把室内、外表型研究中产生的巨量图像和传感器数据转化为有意义的生物学知识将成为下一个表型组学研究的瓶颈。特别是针对与等位基因变异和环境控制紧密相关的动态性状, 只有性的数据处理和动态建模才能解决这一技术难题。
当今国际植物表型界对表型组学研究进程的共识:为提高现代作物育种的选择速度、提高**气候变化影响下作物的适应力和产量稳定性, 需要在完善大规模、高通量表型数据采集环节的自动化和遥感技术的基础上, 发展和利用全新的统计方法设计大数据生物试验;使用复杂的数据管理手段对表型数据集进行注释、标准化和存储; 基于本体论进行数据的优化整合;引入较新的机器学习和深度学习等人工智能方法对多维表型组数据集进行分析;进而萃取可靠的性状特征信息,从而挖掘出有意义的生物学知识并解决实际的科学问题。
表型组学是突破未来作物学研究和应用的关键研究领域,通过表型分析来描述关键性状可以为育种、栽培和农业实践提供基于大数据的决策支持。但是, 没有针对性的全表型标记在植物研究领域中是没有太多实际意义的。即使只针对某一个物种, 全表型测量会产生海量、无重点的数据集。在今后相当长的时间内, 数据解析方法很难从这类数据集中高效地总结共性规律, 并提取有生物学意义的信息。对于希望在植物研究中使用表型组学的团队而言, 这样的科研方式也是比较低效的。因此, 表型组研究需要明确的目标是, 在快速筛选关键性状集的基础上, 为针对性解决科学问题提供决策数据, 体现研究的实际应用价值。
由于中国各地区实际环境情况差别较大, 有必要针对不同生态环境中的作物表型组和其他组学数据进行整合和交叉验证, 揭示农业植物生物学规律, 切实支撑中国各类作物的生理学、发育学、遗传学、育种、栽培以及农业大田生产等研究, 提升中国作物遗传育种、栽培管理和农业生产服务能力。