技术文章
Technical articles
更新时间:2026-06-04
点击次数:24
应用方向
在我国烟草生产必须严格执行上级下达的计划产量的背景下,准确且稳定的产量估算对生产管理具有重要意义。本文提出多源数据融合策略,构建烟草产量估算模型:数据包括无人机(UAV)机载高光谱特征(HF)、田间采集的生物物理参数(BPP)以及实验室测定的生化参数(BCP)。考虑不同生育期的作物状态共同影响最终产量,模型采用两类典型循环神经网络(RNN)——LSTM与GRU,并以随机森林(RF)作为基线。针对跨年度数据时间维度不一致问题,设计一维卷积自编码器(AEC1D)以统一输入维度。结果表明,多源融合优于任一单源特征;其中采用HF+BCP+BPP的GRU模型精度最高(
=0.705)。同时,LSTM与GRU整体优于RF;特征贡献约为HF45%、BPP32%、BCP23%。该研究验证了多源融合与 RNN 在烟草产量估算中的优势,可为精准化田间管理提供支持。
关键词:多源数据融合;RNN;产量估算;HF+BCP+BPP;AEC1D
背景
我国烟草属于重要经济作物,为调控市场供给、保持产品与价格稳定,行业主管部门对企业下达年度生产计划,产量超出计划通常需要额外审批,因此企业急需“准确、稳定"的产量估算以支撑生产决策与过程管理。传统产量估算主要依赖田间调查,存在耗时、成本高且误差大的问题。近年来,以高光谱成像为代表的无损监测技术在农业中得到广泛应用,但高光谱数据波段多、信息冗余强,若仅构建植被指数易受土壤背景与冠层结构影响且可能出现饱和,光谱信息利用率也有限。另一方面,产量与 LAI、株高、叶氮等生物物理/生化指标密切相关,但将“高光谱特征(HF)+生物物理参数(BPP)+生化参数(BCP)"三类信息联合用于烟草产量建模的研究仍相对不足。基于此,本文提出多源融合并引入能学习时序依赖的 RNN(LSTM/GRU),同时设计 AEC1D处理跨年观测次数不一致,以构建更全面、可用于生产管理的烟草产量估算框架。
实验与数据采集
(1)实验设置
本研究在云南省大理州弥渡县(MD)与祥云县(XY)开展两年田间试验,覆盖多地块与多品种情景。试验以氮肥梯度为主开展处理设计,其中 N100 为当地常规施肥量,N0 为不施氮,N150 为 1.5 倍常规量,其余处理按比例推算;整体采用随机区组设计,每小区不少于 80 株,株行距为 1.2 m×0.5 m,其余田间管理措施按照当地规范执行。观测安排选择关键生育期开展:2022 年在莲座期、现蕾期与打顶期共观测 3 次,而 2023 年受天气条件限制仅在莲座期与打顶期观测 2 次,导致跨年度样本的时间步(time step)不一致。

图1研究区域的地理位置及实验样地的布置
(2)数据采集
本研究构建了“无人机高光谱-田间生物物理-实验室生化指标-实测产量"的多源数据体系。无人机端采用DJI M600搭载江苏双利合谱科技有限公司的GaiaSky-mini2-VN高光谱相机获取400~1000 nm(175波段)的冠层光谱数据,飞行通常安排在10:00~15:00的晴朗无风时段,航高约80 m,起飞前使用灰板进行辐射定标,影像在ENVI平台完成后续处理。田间同步采集生物物理参数(BPP),包括株高(PH)、株幅(PW)与叶面积指数(LAI);生化参数(BCP)则包括叶氮含量(LNC)与叶绿素相对含量(LCC,SPAD)。其中LNC以小区中心随机抽取2株植株、每株取上中部各2片叶送实验室测定;LCC 使用SPAD-502Plus在同一批测量株上选择完*展开叶多点测量并取平均得到小区代表值。产量标签以烘烤后烟叶重量为准:收获前每小区选取5株代表植株标记,烟叶烘烤约1周后称重(剔除未完*转黄叶片),并以5株烘烤叶总重Yinit按Yield = 3.33×Yinit换算为单位面积产量(t/ha)。数据集最初为231个样本,剔除病害与影像质量不佳小区后保留189个有效样本;每个生育期样本包含PH、PW、LAI、LNC、LCC以及175个高光谱波段等特征。
研究结果
(1)多源特征体系构建与对比
研究在高光谱基础上分别叠加BCP(LNC、LCC)与BPP(PH、PW、LAI)进行对比,结果在RF、LSTM、GRU三类算法下均一致:多源融合显著优于单一HF,且HF+BCP+BPP始终取得最高或*稳定的精度;同时HF+BPP通常略优于HF+BCP,说明结构/群体生长状态信息对叶产量更直接。仅用HF时精度*低,体现“光谱必要但不充分",需要生物物理/生化信息补足对生长与营养状态的刻画。

(a)不同特征组合下RF的产量估算

(b)不同特征组合下LSTM的产量估算

(c)不同特征组合下GRU的产量估算
图2基于多种模型构建的产品估计模型散点图对比
(2)烟草高光谱特征重构与降维
从提升烟草估产可用光谱信息与可学习性的角度,本研究引入SFI将整条光谱曲线按一阶导数的5个稳定极值分段,对各段进行拟合并求定积分,把全谱压缩为5维特征。该重构显著降低维度与冗余,并保留了光谱曲线形态与全谱响应信息,相比仅依赖少数植被指数更充分利用高光谱数据,并增强对外界因素与参数扰动的鲁棒性,为后续多源融合与RNN时序学习提供更稳定、紧凑的光谱输入。
(3)跨年观测时序维度统一
本研究针对跨年度样本的联合时序建模对2022年三期观测与2023年两期观测导致的输入时间维不一致问题,引入一维卷积自编码器(AEC1D)作为时序对齐模块。该模型在编码端利用1×2卷积核(stride=1)在相邻生育期之间提取局部时序关联,并将2022年的3个时间步压缩映射为2个时间步;随后经解码重构得到与2023一致的输入形状,从而在统一维度的同时尽量保留生育期动态信息。重构结果显示,不同特征组合下测试集R²仍保持较高且与训练集差异较小,表明该方法具有较好的泛化能力,并优于简单padding补零对齐,为后续LSTM/GRU产量估算提供稳定一致的时序输入。
图3设计的AEC1D编码器组件

图4不同特征组合下的重建结果对比
结论
本文面向烟草生产计划管理对“准确、稳定"产量估算的需求,构建了融合无人机高光谱特征(HF)、田间生物物理参数(BPP)与生化参数(BCP)的多源估产框架,并引入循环神经网络(LSTM/GRU)刻画多生育期时序信息。结果表明,多源融合显著优于任一单源输入,*优组合为HF+BCP+BPP;在该组合下GRU取得最高精度(
=0.705,RMSEV=0.554 t/ha,MAPEV=16.41%),LSTM次之且整体优于RF等传统方法。同时,针对跨年度观测次数不一致(2022三期、2023两期)导致RNN输入形状不统一的问题,提出一维卷积自编码器AEC1D进行时序维度对齐,相比padding补零对齐获得更优的建模表现。结果分析显示三类特征对精度提升的平均贡献约为HF 45%、BPP32%、BCP23%。本研究验证了“多源融合+RNN"的烟草估产优势,并指出未来可进一步融合气候、土壤、水分等影响因素以完*模型适用性。
来源
Zhang M ,Zhang B ,Zhao C , et al.Tobacco yield estimation via multi-source data fusion and recurrent neural networks[J].International Journal of Applied Earth Observation and Geoinformation,2025,144104925-104925.