网站首页 公文大全 个人文档 实用范文 讲话致辞 实用工具 心得体会 哲学范文 总结范文 范文大全 报告 合同 文书 信函 实用
  • 汇报体会
  • 节日庆典
  • 礼仪
  • 毕业论文
  • 评语寄语
  • 导游词
  • 口号大全
  • 其他范文
  • 百花范文网 > 实用范文 > 其他范文 > 基于Bayesian-XGBoost的生菜作物系数估算方法

    基于Bayesian-XGBoost的生菜作物系数估算方法

    时间:2023-01-15 19:20:06来源:百花范文网本文已影响

    高海荣,张钟莉莉,岳焕芳,张 馨,郭 瑞,李志伟

    (1.山西农业大学 农业工程学院,山西 太谷 030801;
    2.北京市农林科学院 智能装备技术研究中心,北京 100097;
    3.农业农村部农业信息软硬件产品质量检测重点实验室,北京 100097;
    4.北京市农业技术推广站,北京 100029;
    5.北京市农林科学院 信息技术研究中心,北京 100097)

    蒸发蒸腾量是表征作物需水量的重要参数,蒸发蒸腾量的准确计算对于指定合理的灌溉制度具有重要意义,已成为很多国内外学者的研究热点。研究者全面研究了玉米[1]、番茄[2]、茄子[3]等作物的蒸散量变化规律,为进一步提高农田水分利用效率提供了依据。蒸发蒸腾量的确定主要分为实测法和计算法,其中,实测法是以直接通过试验来测定,王振龙等[4]利用大型称重式蒸渗仪试验资料及气象资料,建立了淮北平原地区全生育期冬小麦和夏玉米蒸散量模型;
    GONG等[5]采用加权溶丝仪、微溶性仪和汁液流量监测系统对温室番茄滴灌条件下的蒸散量、蒸腾量和蒸发量进行测定。该方法存在试验成本较高,工作量较大等问题[6]。目前应用较为广泛的是FAO于1998年提出的计算法,其通过PM公式代入空气温度、空气湿度等气象参数计算得到参考作物蒸发蒸腾量(ET0),并乘以作物系数(Kc)来表征实际作物不同阶段蒸发蒸腾量[7-8]。FAO给出了84种作物不同生育期的Kc推荐值,但是Kc受到气候、环境等因素影响,国内使用FAO推荐的Kc计算作物蒸发蒸腾量与实际值存在偏差[9]。国内学者通过开展田间试验获取Kc,纪瑞鹏等[10]利用多年的20个代表站点的日常农业气象土壤湿度观测资料,分区建立了玉米Kc与时间(旬)关系的6次多项式函数来获取Kc;
    李霞等[11]结合地面实测土壤含水量(SM)和叶面积指数(LAI),通过逐步回归分析建立科尔沁地区草甸及沙丘试验区的Kc估算模型。但是试验研究得到的Kc会受到不同种植方式、种植气候和种植类型影响,同时研究需要开展多年试验,存在试验工作量大、可扩展性差等问题。对灌溉管理而言,有研究指出,Kc值过高估算会造成高达20%的灌溉水浪费,而对Kc值过低估算会造成高达38%的减产[12],估算Kc的准确度至关重要[13]。

    Kc是作物本身生理学特性的反映,它与作物生长密切相关,尤其是作物的生长参数。随着机器视觉技术的发展,给研究者提供了一种新路径来解析作物生长情况,实现Kc的准确测算。基于此,本研究提出了一种基于Bayesian-XGBoost进行Kc在线估算的方法,采用超绿算法和最大类间方差法进行图像处理实现生菜冠层覆盖度(PGC)提取,利用Bayesian-XGBoost算法建立生菜Kc估算模型并进行验证,同时进一步运用PM公式估算ETc,旨在为以后指导作物灌溉、生长调控等方面提供新方法。

    1.1 试验材料

    供试材料为波士顿奶油生菜,由北京市昌平区小汤山基地提供。

    1.2 试验设计

    试验于2020年8—10月在北京市昌平区国家精准农业示范基地日光温室内进行。该地区位于东经116.46°,北纬40.18°,海拔50 m。试验采用盆栽种植,生菜选取长势相同的六叶一心期定植,每盆种植1株。盆栽土壤取自基地农田0~20 cm的土层,为粉质黏壤土,自然风干后粉碎过2 mm筛,试验所用塑料盆内径29 cm,盆高23 cm,每盆装有8 kg风干土,一次性分别施用尿素(N 46%)、磷酸二铵(N 12%、P2O542%)、硫酸钾(K2O 52%)1.57、1.53、1.54 g作为底肥,并与土壤搅拌均匀,生育期内不追肥。

    1.3 测定指标及方法

    1.3.1 作物蒸发蒸腾量实测值测量 采用国家农业智能装备工程技术研究中心研发的智能称重系统[14](精度为±1 g,量程为0~20 kg),自动采集生菜生育期内作物蒸发蒸腾量的变化,10 min/次。

    1.3.2 作物生长图像采集 每天9:00在自然光照条件下使用型号EOS7D佳能相机置于高度为70~80 cm处垂直拍摄盆栽生菜俯视图像,图像的分辨率为5 184×3 456,每次进行图像采集时均在同一盆栽拍摄2张,并人工选取效果好、质量高的作为试验样本。

    1.3.3 气象数据获取 采用温室云环境EP400型数据采集器进行环境监测(国家农业智能装备工程技术研究中心研发),数据采集器可对空气温度(量程为-40~80℃,精度为±0.5℃)、空气相对湿度(量程为0~100%,精度为±3%)、光照强度(量程为0~100 klx,精度为±10 klx)进行测量,每1 h自动采集一次气象数据,每天记录试验地最高和最低空气温度。

    1.4 作物系数确定与分析

    参考作物蒸发蒸腾量(ET0)的确定对于生菜日需水量确定具有重要意义,本试验根据PM公式采用传感器传输的空气温度、空气湿度等气象参数来计算ET0,其计算基于微气象学方法和能力平衡[15]。

    式中,ET0为参考作物蒸发蒸腾量(mm/d);
    T为平均温度(℃);
    Δ为饱和水汽压关系曲线斜率(kPa·℃);
    es为饱和水汽压(kPa);
    ea为实际水汽压(kPa);
    Rn为净辐射(MJ/(m2·d));
    G为土壤热通量(MJ/(m2·d));
    γ为湿度表常数(kPa/℃)。

    作物系数(Kc)是根据实际蒸发蒸腾量与ET0的比值进行计算。

    式中,ETc为作物生育期内作物阶段耗水量(mm/d)。

    1.5 图像预处理

    图像分割是根据图像的颜色、纹理等特征将图像划分成若干个互不相容的区域。生菜是典型的绿色植物,颜色特征较背景更为明显,为了使植物与背景分割,获取所需要PGC,本研究采用了超绿算法来进行提取(图1)。超绿算法[16-17]提取绿色植物图像效果较好,阴影、土壤图像等均能较明显地被抑制,植物图像更为突出。其中,超绿算法如公式(3)。

    图1 生菜PGC提取流程Fig.1 PGC extraction flow chart of lettuce

    式中,EXG为灰度化,G为绿色,R为红色,B为蓝色。

    为了将植物与背景分割开来需先确定一个阈值,然后将每个像素点的灰度值和阈值相比较,根据比较结果将该像素划分为植物或者背景。本研究采用了最大类间方差法(Ostu法)[18-19],计算简单且不受图像亮度和对比度影响,不用人为设定参数,是一种自动选择阈值的方法,其计算过程简单、稳定。

    1.6 模型构建

    1.6.1 Bayesian算法 贝叶斯优化[20]在目标函数(黑箱函数)未知的情况下,通过猜测黑箱函数长什么样,来求一个可接受的最大值。和网格搜索相比,其优点是迭代次数少(节省时间),粒度可以到很小。贝叶斯优化有2个核心过程,即先验函数(PF)与采集函数(AC),采集函数也可以叫效能函数。PF主要利用高斯过程回归;
    AC主要包括EI、PI、UCB这几种方法,同时exploration与exploitation的平衡,也是通过AC来完成的。

    1.6.2 XGBoost算法XGBoost模型是近年来较为新兴的主流算法之一,该模型引入按顺序训练模型的增强方法的策略,组合每一个弱学习器的子集来获得新的较强学习器,所用到的树模型则是CART回归树模型[21-24]。该算法的优点是使用许多策略去防止过拟合,支持并行化,添加了对稀疏数据的处理。

    式中,fi(t)是第t轮的模型预测,ft(xi)为步骤t的学习者;
    fi(t)和ft-1i是步骤为t的新的函数和保留前面t-1的模型预测;
    xi是输入变量。

    1.6.3 Bayesian-XGBoost作物系数估算模型 采用Bayesian-XGBoost模型作为核心算法构建PGC和实测作物系数之间的线性关系(图2)。模型的输入项为PGC,输出项为Kc,通过Bayesian调参得到最优参数,经过XGBoost得到Kc估算值。本研究中主要参数、默认值和参数释义如表1所示。

    表1 模型参数介绍Tab.1 Model parameters

    图2 Bayesian-XGBoost模型Fig.2 Bayesian-XGBoost model

    模型的训练过程如图3所示,包含以下几个步骤:(1)将获取的PGC样本集按8∶2比例随机划分为训练集和测试集;
    (2)通过贝叶斯算法优化XGBoost模型超参数,采用MSE作为贝叶斯优化的目标函数值,通过高斯过程回归确定后验概率分布;
    (3)由采集函数根据后验概率分布的期望和方差确定下一个采样点;
    (4)将新确定的采样点加入下一循环进行迭代,重复步骤(2)直到达到最佳迭代次数;
    (5)XGBoost算法在训练数据集上进行模型训练,得到最优估算模型。

    图3 Bayesian-XGBoost算法流程Fig.3 Bayesian-XGBoost algorithm flow chart

    1.7 模型评估

    本研究使用了3个常用的统计指标,分别为平均绝对误差(MAE)、均方根误差(RMSE)和决定系数(R2)对预测模型进行分析,R2越大,RMSE和MAE越小,表明预测模型结果更加精确。

    其 中,ŷi为 预 测 值;
    yi为 实 测 值;
    yˉi为 平 均 值,n为预测结果总个数。

    1.8 数据分析

    生菜蒸发蒸腾量和Kc的处理采用Excel软件进行,采用Origin 2017软件进行Kc和蒸散量估算值和真实值图表绘制,流程图和模型图采用Visio 2013绘制,采用PyCharm 2019a进行图像分割处理。利用Python语言建立Bayesian-XGBoost温湿度补偿模型,模型所用的计算机处理器为Inter(R)Core(TM)i5-7200U CPU@2.50GHz 2.60GHz,内存4.00 GB,64位操作系统,集成开发环境为

    PyCharm 2019a。

    2.1 生菜的PGC变化分析

    由表2可知,基于超绿算法进行图像分割提取的生菜PGC在全生育期内随着生育期的推进呈先逐渐增长后趋于平稳的趋势。生菜的PGC从移栽时的10.38%逐渐增长到收获时的81.00%。全生育期内生菜PGC日均增幅为1.56%。在幼苗期和莲座期,生菜PGC呈快速增长趋势,日均增幅为2.00%,进入结球期后生菜的PGC增长幅度减小且趋于平稳。

    表2 不同生育期内生菜PGC变化Tab.2 PGC changes of lettuce in different growth stages %

    2.2 贝叶斯算法最佳迭代次数寻优

    为获取贝叶斯算法最佳迭代次数,将多组超参数代入XGBoost模型中,得到的估算效果如表3所示。

    表3 不同迭代次数下精度对比Tab.3 Precision comparison under different iterations

    由表3可知,展叶生菜的迭代次数与R2呈正相关,随着迭代次数的增加,RSME、MAE无明显变化,Loss呈逐渐降低趋势,但当迭代次数从400次增加到500次时,Loss无明显变化。综合RSME、MAE、Loss、R2的结果来看,选取迭代次数400次为贝叶斯优化算法最佳迭代次数,其RMSE、MAE、Loss分别为0.219、0.162、0.047。

    2.3 Kc的估算模型评价

    图4为采用Bayesian-XGBoost估算的全生育期内Kc和真实值的变化趋势。由图4可知,随着生育期的推进,生菜的蒸腾作用逐渐增强,生菜的Kc也逐渐增大。在结球期时,作物蒸腾作用较强,生菜Kc估算值达到最大值,为2.65。生菜在幼苗期、莲座期和结球期3个生长阶段Kc估算值的平均值分别为1.12、1.29和2.26,较真实值的相对误差分别为4.17%、1.09%和1.14%。生菜Kc的真实值与估算值之间的相对误差值区间在[-2,2]之内,整体估算值与真实值之间误差较小,波动范围较小,为±1左右,可以实现不同生育阶段Kc估算。

    图4 全生育期内Kc估算值和真实值变化趋势Fig.4 Variation trend of Kc estimated value and real value during the whole growth period

    2.4 ETc的估算模型评价

    生菜全生育期内ETc估算值和真实值变化趋势如图5所示。

    图5 生菜全生育期内ETc估算值和真实值变化趋势Fig.5 Variation trend of ETc estimated value and real value of lettuce during the whole growth period

    本研究将估算Kc和通过传感器采集的温室环境参数带入PM公式来计算ETc,实现了ETc的估算。从图5可以看出,幼苗期生菜的平均估算ETc为2.35 mm/d,真实值为2.31 mm/d,较平均ETc真实值的相对误差值为-1.68%。到了莲座期和结球期,生菜的需水量增大,ETc增大,生菜估算平均值分别为2.35、2.45 mm/d,真实值分别为2.52、2.62 mm/d,较平均ETc真实值相对误差值分别为-1.68%和7.07%,可以表征不同生育阶段的需水量。ETc真实值与估算值误差值区间为[-2,2],日均误差值均小于±1.5,能够实现实时动态监测作物需水量。

    作物系数是在特定环境条件和作物下获取,不同环境条件或作物都会引起Kc的变化。目前针对作物系数的估算进行了不同层次的研究,不同品种、不同地域作物系数的影响因素也尽不相同。为了解决作物系数准确测算问题,本研究利用超绿算法对展叶生菜进行了作物冠层覆盖率的提取,基于Bayesian-XGBoost建立了生菜作物系数估算模型,并结合PM公式进一步估算生菜蒸发蒸散量。结果表明,该估算模型能够动态监测作物系数全生育过程变化,不同生育期内作物系数分别为1.12、1.29和2.26,其真实值与估算值之间的误差值均小于±1.00。并通过采用PM公式对作物蒸散量进行计算来帮助农民决定灌溉量,灌溉量的日均值为2.38 mm/d,有效解决了在不影响生产力的情况下减少用水问题。同时本研究是盆栽作物且在温室中进行,所处的地域也存在差别,作物生长受到气候、人为和土壤等因素影响,作物系数呈逐渐增加趋势。与本研究相比,由于FAO推荐的生菜作物系数是在特定条件下的,其中,前期、中期、后期作物系数分别为0.70、1.00、0.95,与试验实测的作物系数差异较大。这可能是因为FAO推荐的作物系数针对的是作物生长阶段无水分胁迫、耕作和田间水分管理条件良好,作物能获得最大产量时的值[25-27],使得FAO推荐的值与实际值误差较大。总体上来看,本研究作物系数的估算值更加符合实测值。因此,基于Bayesian-XGBoost能够精准估算作物系数,很好地解决了作物系数连续动态监测,为以后指导作物精确灌溉提供了理论依据。

    猜你喜欢 生菜作物系数 覆盖作物及其作用的研究进展作物学报(2022年1期)2022-11-05中国农业科学院揭示大塑料和微塑料对作物生长发育和土壤健康的潜在影响蔬菜(2022年10期)2022-10-18脆嫩爽口的生菜中老年保健(2022年6期)2022-08-19吉林省省级作物种质资源保护单位名单(第一批)中国种业(2022年1期)2022-01-27生菜小星星·阅读100分(低年级)(2020年8期)2020-10-26小小糕点师娃娃乐园·3-7岁综合智能(2017年9期)2018-02-01苹果屋娃娃乐园·3-7岁综合智能(2017年8期)2018-02-01嬉水娃娃乐园·3-7岁综合智能(2017年7期)2018-02-01生菜?你爱吃圆的还是散叶儿的?食品与健康(2017年3期)2017-03-15生菜有道美食堂(2017年2期)2017-02-14

    相关热词搜索:生菜 估算 作物

    • 范文大全
    • 说说大全
    • 学习资料
    • 语录
    • 生肖
    • 解梦
    • 十二星座