大数据技术在黑土地保护中的应用 | |||||||
|
|||||||
黑土地作为大自然馈赠给人类的天然宝藏,是最适合作物生长的土壤。人们常用“一两黑土二两油”来形容其肥沃与珍贵。与黄土、红土等类型的土壤相比,肥沃是黑土地得天独厚的优势;然而,土壤结构一旦遭到破坏其不可逆转性特征又成为黑土地天生的缺陷。因此,如何合理利用黑土地并确保黑土理化结构不被破坏,是困扰全球科学家的难题;平衡黑土地“用好”和“养好”之间的关系是黑土地保护的关键。 从全球黑土地四大分布区域的发展历史来看,都经历了开发、利用、破坏和保护 4 个过程。从黑土地的保护措施所积累的有效性经验来看:美国利用先进的农机具走上了实现保护性耕作的道路,并且诞生了约翰迪尔(John Deere)、孟山都(Monsanto)等世界级农业科技巨头;乌克兰则由于地广人稀,具备大面积开展土地和耕作轮休的条件,因此其通过彻底的休息实现黑土地的保护;阿根廷是目前全球黑土地保护性耕作的实践者,在机械化的基础上,全面实现免耕播种、条带播种、秸秆还田和等高种植的耕作方式。 从国外的经验来看,结合全球粮食安全的大背景,我国的黑土地保护必须立足“用好”。“用好”除了要重视土壤、微生物等基础机理的研究外,还需要利用专用农业机械装备及信息化手段进行保护性耕作,即:在利用专用智能化农业机械装备基础上,通过信息化和智能化手段,科学评价保护性耕作的效果,并给出科学的作业指导与建议。农业信息技术先后经历了从农业专家系统,到农业数字化、农业信息化,再到基于大数据的农业智能化的多阶段发展与技术积累,信息技术已经成为推动农业生产力发展的核心驱动力,从而为黑土地保护性应用提供科学的决策依据打下了技术基础。 1 黑土地保护急需体系化信息系统的支撑 在农业信息技术领域,我国早在 20 世纪 80 年代就已借鉴了数字化技术在工业生产中的应用经验,开始发展农业信息管理系统(MIS),在农业生产的物资管理等方面起到了作用。20 世纪 90 年代初,农业专家系统进一步借助计算机技术的发展,为农业生产提供信息化的指导,并推广和普及了更多的先进农业科技。21 世纪初,在互联网浪潮的推动下,“互联网+农业”的概念风起云涌,多样化的物联网(IoT)种类、丰富的移动终端应用提升了农业各个生产环节的数字化水平。近年来,随着物联网的广泛应用,以及大数据技术的兴起,依靠大数据的人工智能技术开始快速渗透到农业领域,并对农业科技的发展起到了巨大的推动作用。 但是,我国农业信息技术总体上仍然较为落后,难以满足黑土地保护性作业的需求,具体表现在 3 个方面。 (1)缺乏完善的数据采集体系,黑土地家底不清 国内并不缺少针对土壤信息数据采集技术的研发,无论是传感器技术还是卫星遥感技术,都投入了大量的研发力量;但不同数据采集手段之间无法形成体系,难以全面反映黑土地的资源情况。以高分系列遥感卫星为例,由于缺乏其他数据样本的验证,目前其遥感数据无法全面、准确地反映黑土地有机质的演变情况。 (2)缺少基础模型与算法,难以支撑黑土地的作业决策 科学作业决策的核心是模型与算法,但我国在农业算法与模型领域严重落后。美国的农业技术转移决策支持系统(DSSAT)模型拥有超过 30 年的研发历史,已成为世界农学研究中模拟实验的主要模型之一,而我国的农学研究中也大量使用 DSSAT。但是,DSSAT 的核心模型主要以美国的气候与土壤条件为基础,并不适用于我国——只能应用于研究模拟,无法应用于实际生产过程。缺乏自主的模型与算法是导致我国黑土地的演变机理不清、无法进行科学决策作业的核心原因之一。 (3)农机智能化水平低,黑土地保护性作业过程无机可用 以免耕播种为例,免耕播种是保护性耕作中最常见也是最关键的技术之一。但是,目前免耕播种机使用过程中存在机具调整技术难度大、全量秸秆覆盖还田情况下通过性能较差、播种质量及作业速度不高等问题,这都需要采用智能化、自动化最新技术来升级完善。 要解决上述问题,必须以系统化的思维,采用自顶向下的设计模式,构建成体系的信息系统,以满足黑土地保护的信息化需求。实际上,农业生产过程的数据流向是一个“数据采集、状态判断、作业决策与作业执行”的过程,与军事作战领域中的 OODA(观察—判断—决策—执行)理论非常相似。基于此,中国科学院计算技术研究所提出了基于智能 OODA 环打通数据流的农业模拟器思路,并在黑土地保护专项中进行了先期实践。 2 农业生产的智能 OODA 环 OODA 理论最早提出于军事领域,是由美国军事战略家约翰 · 博伊德(John Boyd)开发的一种工具——用于解释个人和组织如何在不确定和混乱的环境中获胜。OODA 循环模型是“观察”(observe)、“判断”(orient)、“决策”(decide)、“执行”(act)循环的缩写,最初被称为“Boyd 循环”。OODA 循环模型在战术方面是对“空对空”交战的描述,是根据参战对象自己的战略环境在不断进化中调整战略的手段——它是一个有机的模型,而不是一个机械的模型。 在大多系统动态运作的应用场景中,执行器与传感器协同和所处环境进行信息交互,其动态交互过程符合 OODA 循环模型: 应用系统通过传感器对目标对象进行“观察”,采集相关信息; 根据应用需求,对后续决策处理的目标和原则进行“判断”,同时准备决策所需数据集,对采集的数据进行预处理,并进行初步分析; 按照应用决策处理的目标和原则对数据综合分析及“决策”,并提出优化控制策略; 执行器(也称为反应器)与物理系统或环境进行交互,接收信号并将信号转化为一种物理行为,最终通过“执行”优化控制策略、改变目标对象相关状态,从而改变系统状态。在系统状态改变后,利用反馈机制,系统通过传感器观察新状态下的相关参数,并不断重复 OODA 的动态循环过程。 基于智能 OODA 环的新型农业生产方式 基于智能 OODA 环的新型农业生产方式,同样可分为多维感知、融合处理、智能决策和协同执行 4 个部分,并引入智能技术提高这 4 个阶段的数据采集与决策精度;在智慧农业技术体系标准和规范的指导下,将信息作为农业生产要素,用现代信息技术对农业对象、环境和耕作全过程进行可视化表达、数字化设计、信息化管理。具体步骤为: 对土壤、气象、水文、作物“四情”(墒情、苗情、虫情、灾情),以及农机乃至市场等信息进行实时全面的观察和收集; 对所有采集数据进行统一的数据处理和分析,并对应不同的农业模型与算法得到具体的作业命令; 通过智能农机和自动化装置实现精准、高效的作业,同时实时监测信息处理、决策和执行过程中整个系统的变化,并不断修正模型达到最优化的效果。 3 农业模拟器的功能与架构 相较于大气物理和新型材料等重大战略领域科学,传统农业科学的发展较多依赖经验和简单统计的建模,而与计算建模的结合相对较弱,直接制约了农业科学现代化的发展。尤其是在智能化时代,农业领域数据积累不足,计算建模方法缺乏,使得知识挖掘不充分。因此,智能农业要解决的首要问题是农业科学的计算建模。鉴于其他学科的经验,发展可计算的模型和模拟系统是行之有效的技术途径。然而,不同于物理学、化学等领域较为单纯的科学发现活动,农业是一个与生产过程紧密联系的科研实践活动。因此,亟待构建基于新建模范式的农业模拟器系统,实现人工模拟系统和真实生产系统的在线迭代平台。 3.1 第五范式建模 人类从事科学研究的范式一直在随着技术的进步而演变。到目前为止,现代科学活动中存在 4 种研究范式: 第一范式是实验观察,发现客观存在的自然现象,如可以从实验得到的晶体结构; 第二范式是理论研究,通过理论推导归纳出一般性的规律,形成对客观世界认识探索的理论体系,如第一性原理、牛顿力学的提出; 第三范式是数值模拟,这是近现代科学研究借助强大的计算工具形成的方法,如在高性能计算机系统上运用第一性原理计算产生高精度的各种构型数据; 第四范式是大数据分析,通过积累的大量已知数据,然后通过计算得出相关关系。 上述 4 种科研范式中,实验研究和理论分析在实践活动中分离,没有涉及生产过程迭代建模。第五范式是把理论研究和实验科学通过“数值+数据+智能”技术耦合成一个在线迭代的有机整体,形成“理论+实验”科学活动的“自动驾驶系统”。智能农业模拟器与传统农业信息系统及 DSSAT、WOFOST 等第四范式的典型农学模拟系统不同,具体体现在 2 个方面。 (1)模型研制方面 WOFOST 模型是在欧洲生产模型基础上研制而来,着重强调其在定量评价土地生产力、区域产量预报、风险分析和年际间产量变化及气候变化影响量化等研究中的应用。DSSAT 模型则是在借鉴欧洲模型的基础上,结合美国农业特点所研制的模型。该模型汇总了各种作物生长模型和标准化模型的输入、输出变量格式,方便模型的普及和应用。上述 2 种模型都属于国外农业模型并得到广泛应用。到目前为止,我国开展的作物模型研究仍以引进并使用国外作物模型为主,或在国外作物模型的基础上进行修改或简化,真正自主研发并得到广泛使用的作物模型为数较少。智能农业模拟器则是我国独立自主研发的农业软件,这使得我国农业生产模型方面将不再受到西方国家的制约。 (2)功能方面 WOFOST 是多种作物的普适性模型,主要适用光合作用、呼吸作用、蒸腾作用、干物质生成与分配、作物生育进程、根系生长分布、土壤水分状况。该模型可以针对 3 种不同的生产过程模拟作物生长变化过程,即模拟潜在作物生长、水分限制条件下的作物生长和养分限制条件下的作物生长。DSSAT 是一种针对特定作物的模型,如大豆、玉米、高粱等作物;该模型兼容了许多作物生长模型,构成“作物系统模型”软件包,然后应用公共的土壤水分运动模型和土壤碳氮模型,能够模拟不同作物和作业地的生产过程。然而,上述 2 种模型都存在一些问题: 输出结果受到输入数据影响。例如,试验区气象数据、土壤数据、作物品种数据等对结果影响较大;对历年来的数据收集难度较大,在运行时缺失的数据只能按缺省值处理,对结果的输出也会产生一定的影响。 模型应用需要根据实际情况进行调整,需要对源代码进行修改。 数据不够全面。如,缺少气象数据、光谱数据等。 模型中缺乏病虫害等因素的考虑可能导致数据不准确。智能农业模拟器基于更加完备的数据采集系统,将输入与输出进行解耦;然后,通过边缘计算对农业生产实时数据进行处理,结合科学的指导意见完成决策反馈,从而指导农业作业生产。 因此,智能农业模拟器通过人工模拟系统与真实生产系统的在线迭代,推动科学家的理论研究与生产实际系统的相互促进,以实现实验室模型和算法与生产一线的指挥系统“在线连接”,进而令农业生产实现“自动化”,最终达到提高作业效率与农业产量、降低生产成本的目的。 3.2 农业模拟器的体系结构 基于智能 OODA 环是第五范式建模的有效实践途径之一,农业模拟器应包含 4 个主要阶段。 (1)观察——农业全要素数据采集、存储标准体系 农学基本上是一门以数据积累、统计建模为基础的学科,数据在其学科发展中拥有至关重要的作用。因此,在农业模拟及农业生产决策必须建立在数据的基础上,在传统的农业模拟系统(如 DSSAT、WOFOST)应用中,其使用的大量基础模型(如 CERES-Maize、CERES-Wheat 等作物生长预测模型)均是建立在数据统计基础上。农业模拟器“在线连接”的属性决定了其必须对农业生产过程中的数据进行在线监控;而上述模型所采用的基于历史数据作为系统输入的模式无法满足农业模拟器的广域大粒度和实时在线模拟需求,这就决定了必须采用各种数据采集技术(如遥感、探地雷达、传感器等)对农业生产过程中的全要素进行全面的数据采集。同时,农业模拟器的“广域”特性也决定了农业数据采集过程具备高并发、高通量特性,而农业生产的重点区域(如我国黑土地分布的东北地区)存在大量的公众服务网络覆盖不足的问题,也对数据的实时采集带来了挑战。针对上述问题,农业模拟器的设计必须是完全面向农业生产过程的数据采集、存储与交换体系,以此更好地解决农业模拟数据来源的问题。 (2)判断——构建农业全要素状态判断与演变模型 对农业生产过程中不同要素(如作物健康状态、土壤健康状态等)作出定性与定量分析,并预测其状态演变是作业决策的基础。农学领域针对此已存在大量的研究,如表型鉴定、胁迫模型、蒸腾模型、土壤侵蚀演变等。但从目前来看,这些研究仍存在一定的局限性,主要体现为数据来源受限、以环境变化均质为前提等。这使得每种模型不具备广域条件下的普适性,一旦目标环境与模型自身构建所处的环境间存在较大偏差时,要么无法适用,要么需要花费大量的时间重新进行校正。因此,对农业模拟器而言,需要在现有模型的基础上,通过大数据技术和人工智能技术,自动修正已有模型或构建新的模型,以实现广域农业生产过程中的实时在线判断。 (3)决策——研究基于农业生产全要素的生产决策方法 农业生产决策是根据生产要素的状态给出对应的作业决策。例如,决定种子、农药、化肥的使用量,决定追肥时机,决定灌溉时机与用水量等。对此,农业模拟器需要解决的核心问题包括 2 个方面: 农艺知识体系的数字化,即利用现有的农艺知识体系构建农业生产决策的基础算法与模型; 结合生产过程,实现对算法与模型的修正,构建完整“数据—模型”的闭环模型,以实现决策算法与模型的自进化。解决上述问题的技术路径,需要利用知识图谱、知识发现等知识工程领域技术,以实现对农艺知识的挖掘和数字化,并进而利用大数据技术、人工智能技术等方法进行对模型的在线修正或者二次建模。 (4)执行——突破农机装备的智能作业控制与执行技术 作为基于智能 OODA 环的农业模拟器的最后一环,该阶段是理论与实验结合最为密切并明显区分于其他范式建模的关键所在。在农业生产过程中,决策产生的作业方案通过智能化农机装备进行高质量的作业,并在作业过程中通过多样化传感器设备进行实时的数据采集,最终形成“观察—判断—决策—执行”的 OODA 闭环,以此打通实验室模型和算法与生产一线的指挥系统“在线连接”,实现农业模拟器不断演进。此外,自动化作业执行可以有效规避人工作业带来的作业质量不达标问题,进而降低农业模拟器的数据误差。要实现农机装备的智能作业控制与执行,需要针对无人驾驶装备系统、整机电子系统、作业机具的精准控制、动力系统与作业机具的协同控制等方向进行深入研究,形成智能 OODA 环需要的成套作业装备。
农业模拟器的功能示意图 3.3 农业模拟器的软硬件系统 针对上述过程,农业模拟器的软硬件构成应该主要包括 3 个方面。 (1)空天地一体化的农业生产数据观测网络 该网络对应于智能 OODA 环中的“观察”环节。 在地面,通过各种传感器设备、气象站设备完成土壤、环境、气候信息的采集,通过遥感、伽马辐射接收、无人机载多光谱/高光谱等设备实现对土壤、作物、水肥信息的采集。 在空中,在利用通导遥一体的卫星系统提供遥感数据的同时,解决农业数据回传与控制指令下发所需要的广域通信覆盖问题,以及农机装备自动执行过程中的高精度定位问题。 观测网络应当具备海量 IoT 传感器的并发接入能力,以支撑农业生产过程中大量部署的传感器通过 IoT 网络实现数据的回传。 (2)边缘计算平台 边缘计算系统用于“判断”与“执行”2 个环节的计算支撑。 边缘计算平台为农业生产过程中小粒度实时在线判断提供计算支撑。例如,作物的病虫害识别一般通过近距离的图像识别方法进行处理,此类“判断”模型需要在服务端利用平台进行大量训练;模型训练完成后可以在边缘计算平台端实现实时判断,进而降低数据回传至云服务端所产生的时延,以此提高决策的时效性。 针对“执行”过程,边缘计算平台就近为无人驾驶、机具作业控制提供基础计算能力,以满足农机在此过程中的智能执行需求。 (3)多样化算力中心 多样化算力中心是农业模拟器系统的核心组件,是“大脑”,其为农业 OODA过程中的“观察”“判断”和“决策”3 个环节提供核心算力支撑。 在“观察”环节,算力中心需要提供针对不同数据类型的存储支持,包括对传感器、气象站结构化时序数据的存储,利用对象存储或分布式存储系统支撑遥感数据、无人机测绘数据的存储;同时,“观察”阶段的传感器通过 IoT 海量接入也需要服务端提供算力支撑。 在“判断”环节,算力中心需要提供多样化的人工智能处理能力,为农业全要素状态判断与演变模型的构建提供支撑,包括面向海量遥感数据、无人机测绘数据、伽马辐射图谱数据、远中近红外数据反演所需的分布式人工智能训练,以及针对多用户的模型训练等。 在“决策”环节,算力中心需要提供面向知识工程的算力支撑,包括针对知识图谱构建的大规模图计算;在此基础上,提供面向农艺知识与决策推理的推理训练算力,最终实现农业生产决策方案的输出。 4 农业模拟器在黑土地保护中的应用 构建基于第五范式的农业模拟器系统,需要将理论、模型、算法与现实农业生产密切结合、验证并不断迭代演进。东北地区是我国机械化程度最高、农业数字化和信息化发展最早的区域之一,具备农业模拟器系统开展试验示范的多种应用场景。当前,中国科学院(以下简称“中科院”)正集合院内优势力量组织实施“黑土地保护与利用科技创新工程(黑土粮仓)”战略性先导科技专项(A 类),中科院计算技术研究所作为大河湾示范区建设牵头单位,借助研制的数字化系统及智能装备构建了黑土地 OODA 闭环正反馈系统,突破当前孤立、线性、滞后的农业模型缺陷,形成“依靠数据决策、智能农机执行”的农业生产模式,打通数据有效流动的环节,将基于数据决策的智能化执行的农业生产模式转化为对黑土地保护和利用的生产力。具体的作用主要体现在 3 个方面。 (1)数据观察环节 结合卫星与无人机遥感、移动式近地面传感设备及固定式传感器等多种数据采集技术,构建空天地一体化、多维度的黑土地作业全要素观测网络,获取农田本地数据,如土壤(氮、磷、钾、微量元素含量,以及温湿度、土壤墒情、电导率等)、气候(当地的基本气候情况)、水(地下水位、盐碱度、pH 值等)、生物(历年的农作物种植情况、长势、病情、虫情等)、作业(免耕播种和施肥施药精度、作业速度和面积等)的基本信息。前期通过卫星遥感实现数万亩耕地的大尺度监测;确定风险区域后,使用无人机开展百亩量级的针对性观测;部分重要区域布置固定式传感器开展长期持续观测,以实现地块级的农业信息监测。后续待移动式近地面传感设备成熟后,将其安装在智能农机上,使其在作业的同时采集土壤和作物的多种信息,从而大幅提高信息监测的颗粒度精细水平。 (2)数据判断、决策环节 根据算法分析需求,针对采集数据开展整理、清洗和融合,以实现对采集数据在后续模型与算法分析中的定性和定量判定。针对黑土地保护,结合地理信息系统(GIS)技术得到区域内土壤侵蚀强度空间分布图,综合地区的土壤侵蚀特征,研究分析在不同的土地利用类型下土壤侵蚀的关系,以及坡度对土壤侵蚀的影响。根据土壤侵蚀动态变化、土地利用变化及植被覆盖度变化情况,建立侵蚀与环境因子的转移矩阵并分析相互关系,实时预测土壤侵蚀动态。针对黑土地作业,面向特定作物通过统计学习、人工智能与复杂系统最优化的方法,构建土壤元素、水、肥、温度、湿度、光照、病、虫、草等基础信息模型与作物生长趋势、灾情预警、产量估算之间的数字化表达和修正模型。通过系统化机器学习与模拟,最终给出针对特定作物不同时期的水、肥、药、农艺等实时处方建议。 (3)作业执行环节 一方面,针对现有农机装备进行智能化改造升级;另一方面,突破新一代清洁能源智能农机控制芯片、操作系统、无人驾驶、精准控制等核心技术,并综合集成电机、电池、电控、数控底盘等技术,创制针对黑土地主要作物的系列(50—400 马力)清洁能源智能农机成套装备。 此外,针对免耕播种、秸秆还田、条耕等保护性作业关键环节,提高农机农艺结合水平,强化农机装备传感器与智能变量作业农机具的集成应用。具备智能网联、无人驾驶和一定自主决策能力的智能农机,不仅可按照作业命令实现针对具体作物“耕、种、管、收”全生命周期的精准高效保护性作业,同时还能实时采集土壤和作物信息,以及深耕深松、精量播种、变量施肥施药等作业质量信息,然后通过智能 OODA 环开展在作业任务自动分配、农机智能调度、农机作业质量指导等方面的迭代优化。 5 挑战与对策 科学技术的进步为农业生产提供了新的手段,在研究黑土地“用好”“养好”的过程中,需要利用好现代信息技术手段。通过智能 OODA 环为农业建立全要素的模拟器提供了新的科学研究方法,也为黑土地保护提供了新的思路。但是,建立农业模拟器是一个基于信息技术、横跨多个学科的工程,尤其要注重对黑土地成因、破坏过程、保护机制、农艺过程在信息空间的建模。为了能够在中科院战略性先导科技专项“黑土粮仓”中实现信息技术引领的黑土地保护模式,本文提出 3 点建议。 (1)强化跨学科协同 农业模拟器要在黑土地保护中发挥作用,需要将已有的保护性耕作技术,以及土壤、微生物、环境等要素在信息空间进行建模,通过海量实时数据的采集,在信息空间完成模型的迭代训练。目前,不同的黑土地保护科研团队分别专注于各自的领域,形成了各自领域的保护模型,但是这些模型还属于基于传统科研范式的模型,在后续需要加强互相之间的高质量合作,以实现信息与农学、土壤学、生物学的学科融合,形成完备的农业模型。 (2)强化黑土地保护数据价值挖掘 数据流的采集需要大量的资金投入,但由于农业生产与第二、第三产业相比投入产出比较低,很容易导致数据价值得不到体现而限制了信息化建设资金的供给。尽管近些年来国家加大了对农业信息化建设的投入,并取得了一定的成绩,但是始终依靠国家投入并不是长久之计。因此,未来我们需要开展商业化的运营,在数据流的快速流动中实现数据价值的变现,并更好地投入到智能 OODA 环的循环迭代中。 (3)针对黑土地保护建设科学装置 新的研究范式、新的技术手段、新的科研装置都是加快科研成果产出的利器。黑土地保护需要建设一个全要素的农业模拟器研究与开发平台,然后基于该平台实现传统保护模型的数字化,并通过数据训练这些模型以接近农业生产实际。这就需要将面向黑土地保护的农业模拟器视为黑土地保护的科学装置,为黑土地保护提供“体检报告”,指导黑土地保护措施的实施。 文章源自:孙凝晖, 张玉成, 王竑晟, 刘子辰, 陈海华, 谭光明. 农业模拟器:用智能技术打通黑土地保护的数据流. 中国科学院院刊, 2021, 36(10): 1165-1174. 孙凝晖 中国工程院院士。中国科学院计算技术研究所学术所长、研究员、博士生导师,中国科学院大学计算机科学与技术学院院长。主要研究领域包括高性能计算、计算机体系结构。 张玉成 中国科学院计算技术研究所正高级工程师,中国科学院智能农业机械装备工程实验室副主任。主要研究领域智能农机,复杂农业系统控制理论与方法。 |
【打印本页】 【关闭本页】 |