三源数据强强融合！高光谱联动株高、叶氮指标助力烟田数字化估产体系

更新时间：2026-06-04

点击次数：184

应用方向

在我国烟草生产必须严格执行上级下达的计划产量的背景下，准确且稳定的产量估算对生产管理具有重要意义。本文提出多源数据融合策略，构建烟草产量估算模型：数据包括无人机（UAV）机载高光谱特征（HF）、田间采集的生物物理参数（BPP）以及实验室测定的生化参数（BCP）。考虑不同生育期的作物状态共同影响最终产量，模型采用两类典型循环神经网络（RNN）——LSTM与GRU，并以随机森林（RF）作为基线。针对跨年度数据时间维度不一致问题，设计一维卷积自编码器（AEC1D）以统一输入维度。结果表明，多源融合优于任一单源特征；其中采用HF+BCP+BPP的GRU模型精度最高（=0.705）。同时，LSTM与GRU整体优于RF；特征贡献约为HF45%、BPP32%、BCP23%。该研究验证了多源融合与 RNN 在烟草产量估算中的优势，可为精准化田间管理提供支持。

关键词：多源数据融合；RNN；产量估算；HF+BCP+BPP；AEC1D

背景

我国烟草属于重要经济作物，为调控市场供给、保持产品与价格稳定，行业主管部门对企业下达年度生产计划，产量超出计划通常需要额外审批，因此企业急需“准确、稳定"的产量估算以支撑生产决策与过程管理。传统产量估算主要依赖田间调查，存在耗时、成本高且误差大的问题。近年来，以高光谱成像为代表的无损监测技术在农业中得到广泛应用，但高光谱数据波段多、信息冗余强，若仅构建植被指数易受土壤背景与冠层结构影响且可能出现饱和，光谱信息利用率也有限。另一方面，产量与 LAI、株高、叶氮等生物物理/生化指标密切相关，但将“高光谱特征（HF）+生物物理参数（BPP）+生化参数（BCP）"三类信息联合用于烟草产量建模的研究仍相对不足。基于此，本文提出多源融合并引入能学习时序依赖的 RNN（LSTM/GRU），同时设计 AEC1D处理跨年观测次数不一致，以构建更全面、可用于生产管理的烟草产量估算框架。

实验与数据采集

（1）实验设置

本研究在云南省大理州弥渡县（MD）与祥云县（XY）开展两年田间试验，覆盖多地块与多品种情景。试验以氮肥梯度为主开展处理设计，其中 N100 为当地常规施肥量，N0 为不施氮，N150 为 1.5 倍常规量，其余处理按比例推算；整体采用随机区组设计，每小区不少于 80 株，株行距为 1.2 m×0.5 m，其余田间管理措施按照当地规范执行。观测安排选择关键生育期开展：2022 年在莲座期、现蕾期与打顶期共观测 3 次，而 2023 年受天气条件限制仅在莲座期与打顶期观测 2 次，导致跨年度样本的时间步（time step）不一致。

图1研究区域的地理位置及实验样地的布置

（2）数据采集

本研究构建了“无人机高光谱-田间生物物理-实验室生化指标-实测产量"的多源数据体系。无人机端采用DJI M600搭载江苏双利合谱科技有限公司的GaiaSky-mini2-VN高光谱相机获取400~1000 nm（175波段）的冠层光谱数据，飞行通常安排在10:00~15:00的晴朗无风时段，航高约80 m，起飞前使用灰板进行辐射定标，影像在ENVI平台完成后续处理。田间同步采集生物物理参数（BPP），包括株高（PH）、株幅（PW）与叶面积指数（LAI）；生化参数（BCP）则包括叶氮含量（LNC）与叶绿素相对含量（LCC，SPAD）。其中LNC以小区中心随机抽取2株植株、每株取上中部各2片叶送实验室测定；LCC 使用SPAD-502Plus在同一批测量株上选择完*展开叶多点测量并取平均得到小区代表值。产量标签以烘烤后烟叶重量为准：收获前每小区选取5株代表植株标记，烟叶烘烤约1周后称重（剔除未完*转黄叶片），并以5株烘烤叶总重Yinit按Yield = 3.33×Yinit换算为单位面积产量（t/ha）。数据集最初为231个样本，剔除病害与影像质量不佳小区后保留189个有效样本；每个生育期样本包含PH、PW、LAI、LNC、LCC以及175个高光谱波段等特征。

研究结果

（1）多源特征体系构建与对比

研究在高光谱基础上分别叠加BCP（LNC、LCC）与BPP（PH、PW、LAI）进行对比，结果在RF、LSTM、GRU三类算法下均一致：多源融合显著优于单一HF，且HF+BCP+BPP始终取得最高或*稳定的精度；同时HF+BPP通常略优于HF+BCP，说明结构/群体生长状态信息对叶产量更直接。仅用HF时精度*低，体现“光谱必要但不充分"，需要生物物理/生化信息补足对生长与营养状态的刻画。

(a)不同特征组合下RF的产量估算

(b)不同特征组合下LSTM的产量估算

(c)不同特征组合下GRU的产量估算

图2基于多种模型构建的产品估计模型散点图对比

（2）烟草高光谱特征重构与降维

从提升烟草估产可用光谱信息与可学习性的角度，本研究引入SFI将整条光谱曲线按一阶导数的5个稳定极值分段，对各段进行拟合并求定积分，把全谱压缩为5维特征。该重构显著降低维度与冗余，并保留了光谱曲线形态与全谱响应信息，相比仅依赖少数植被指数更充分利用高光谱数据，并增强对外界因素与参数扰动的鲁棒性，为后续多源融合与RNN时序学习提供更稳定、紧凑的光谱输入。

（3）跨年观测时序维度统一

本研究针对跨年度样本的联合时序建模对2022年三期观测与2023年两期观测导致的输入时间维不一致问题，引入一维卷积自编码器（AEC1D）作为时序对齐模块。该模型在编码端利用1×2卷积核（stride=1）在相邻生育期之间提取局部时序关联，并将2022年的3个时间步压缩映射为2个时间步；随后经解码重构得到与2023一致的输入形状，从而在统一维度的同时尽量保留生育期动态信息。重构结果显示，不同特征组合下测试集R²仍保持较高且与训练集差异较小，表明该方法具有较好的泛化能力，并优于简单padding补零对齐，为后续LSTM/GRU产量估算提供稳定一致的时序输入。

图3设计的AEC1D编码器组件

图4不同特征组合下的重建结果对比

结论

本文面向烟草生产计划管理对“准确、稳定"产量估算的需求，构建了融合无人机高光谱特征（HF）、田间生物物理参数（BPP）与生化参数（BCP）的多源估产框架，并引入循环神经网络（LSTM/GRU）刻画多生育期时序信息。结果表明，多源融合显著优于任一单源输入，*优组合为HF+BCP+BPP；在该组合下GRU取得最高精度（=0.705，RMSEV=0.554 t/ha，MAPEV=16.41%），LSTM次之且整体优于RF等传统方法。同时，针对跨年度观测次数不一致（2022三期、2023两期）导致RNN输入形状不统一的问题，提出一维卷积自编码器AEC1D进行时序维度对齐，相比padding补零对齐获得更优的建模表现。结果分析显示三类特征对精度提升的平均贡献约为HF 45%、BPP32%、BCP23%。本研究验证了“多源融合+RNN"的烟草估产优势，并指出未来可进一步融合气候、土壤、水分等影响因素以完*模型适用性。

来源

Zhang M ,Zhang B ,Zhao C , et al.Tobacco yield estimation via multi-source data fusion and recurrent neural networks[J].International Journal of Applied Earth Observation and Geoinformation,2025,144104925-104925.