提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所 、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据 的高效整合与利用 ,将助力深度学习在全基因组选择中 的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型 ,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔 ,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择 的核心 ,极大地影响了全基因组预测 的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系 。
相较于传统模型 ,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机 ,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米 、小麦和番茄3种作物 的4种不同维度 的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法 。
与其他五种主流预测方法相比 ,该方法有以下优点 : 可以利用多组学数据开展全基因组预测 ;算法设计中包含批归一化层 、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度 ;预测精度稳健 ,在小型数据集上的表现与目前主流预测模型相当 ,在大规模数据集上预测优势更加明显 ;计算时间与传统方法相近 ,比已有深度学习方法提速近10倍 ;超参数调整对用户更加友好。
该研究得到了国家重点研发计划 、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
绿水青山“瞰”中国丨塞罕坝 :开垦一片荒原 ,用信念种下一片森林******
开垦一片荒原 ,用信念种下一片森林 。
如今的塞罕坝一改“黄沙遮天日 ,飞鸟无栖树”景象。从1962年至2020年年底 ,塞罕坝森林面积由24万亩增加到115万亩,森林覆盖率从18%提高到82%。为首都阻沙源 、为京津涵水源 、为河北增资源、为当地拓财源 ,这颗“华北绿宝石”,发挥着巨大的生态效益、经济效益和社会效益。
2017年 ,塞罕坝林场建设者获得联合国环保最高荣誉——“地球卫士奖” 。
六十年寒来暑往,塞罕坝人种下 的 是树,也是希望,更是未来,写就了中国生态文明 的发展奇迹 。
联合出品:生态环境部宣传教育司 光明网
监 制 :战 钊
编 导:张佳兴 蔡 琳
(文图 :赵筱尘 巫邓炎)