基于混合深度学习的最优基因型环境选择方法

Sep, 2023

基于混合深度学习的最优基因型环境选择方法

A Hybrid Deep Learning-based Approach for Optimal Genotype by Environment Selection

Zahra Khalilzadeh, Motahareh Kashanian, Saeed Khaki, Lizhi Wang

TL;DR精确的农作物产量预测对于改善农业实践和确保农作物在不同气候中的适应性至关重要。在MLCAS2021作物产量预测挑战中，我们利用了一个包含93,028个训练记录的数据集，预测了10,337个测试记录的产量，涵盖了28个美国州和加拿大省的159个地点，时间跨度为13年（2003-2015）。我们开发了两种新颖的卷积神经网络（CNN）架构：CNN-DNN模型，将CNN和全连接网络相结合，以及CNN-LSTM-DNN模型，增加了一个LSTM层用于天气变量。利用广义集成方法（GEM），我们确定了最优模型权重，相比基准模型，我们的模型性能更优。GEM模型在测试数据上实现了较低的均方根误差（5.55%至39.88%），减小的平均绝对误差（5.34%至43.76%）和更高的相关系数（1.1%至10.79%）。我们将CNN-DNN模型应用于不同地点和气候条件下的高成绩基因型的识别，帮助基于天气变量进行基因型选择。我们的数据驱动方法对于有限测试年份的情况非常有价值。此外，通过使用均方根误差变化进行特征重要性分析，我们突出了地点、MG、年份和基因型的重要性，以及气候变量MDNI和AP的重要性。

Abstract

Precise crop yield prediction is essential for improving agricultural practices and ensuring crop resilience in varying climates. Integrating weather data across the growing season, especially for different crop