提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
扎根一线,投身良种技术攻关******
称重,测量,观察籽粒大小、饱满度……在实验室见到党的二十大代表、天津市农业科学院农作物研究所研究员时晓伟时,她正在几百份小麦种子样品前紧张忙碌,“这些都是最新培育的小麦品种,一部分将带到云南扩繁。”
从事小麦优质高产育种研究工作22年,时晓伟探索出了南繁加代、穿梭育种、品质综合评价和试验示范同步进行的小麦高效育种技术方法,显著提高了育种进程和新品种选育质量。
随着春节临近,时晓伟和同事们正抓紧分析春小麦品质,“我们利用时空、气候差异,进行穿梭育种、南繁加代,从而提升品种选育质量,加快繁育速度。”
打开编号“S22F6—1372”的小麦样品口袋,时晓伟小心拈出10余粒小麦种子,轻轻捧在手心,对着灯光仔细查看。“这个品系粒大,但太瘪,黑胚重,可做大粒亲本,做品种不适合。”时晓伟说。
对培育的小麦进行室内考种,是一项精细的技术活。时晓伟说,不仅要观察每一世代不同家系间小麦籽粒的饱满度、大小、均匀程度、有无黑胚、胚乳是角质还是粉质等性状,还要结合田间农艺性状调查记载,综合考虑保留哪些家系进入下一世代,淘汰哪些家系。
来到小麦品质分析实验室,里面有揉混仪、粉质仪、拉伸仪等分析仪器,还有2022年新添置的全套面包烘焙设备。“通过面包的组织结构、粘弹性等,分析评价面粉品质。”时晓伟说,只有通过全方位、严格的品质分析,才能选择优质高产品系进入天津市春小麦区域试验。
小麦品种迭代从6年6代,逐渐缩短为3年8代;小麦亩产从津强1号的150公斤,增长到津强14号、16号的亩产450公斤左右;津强系列强筋春小麦品种累计推广1000多万亩……20多年来,时晓伟和团队全身心投入小麦优质高产育种研究工作。截至目前,共选育出14个强筋高产春小麦品种、7个优质高产冬小麦品种。
走出实验室,记者跟随时晓伟来到位于天津市武清区的冬小麦育种试验田。“冬小麦早已浇完冬水,进入‘冬眠’时间。”看着泛着青色的麦苗,时晓伟说,让小麦高产,既要有良种,也要科学种植,精心管理,“要关注气温、降水等情况,加强实地踏勘,及时弥补麦田裂缝,防止麦苗受冻,确保麦苗春季返青。”
接下来这一个月,时晓伟还要深入农村,给基层农技人员及麦农授课,讲解麦田管理注意事项。“只要能让小麦丰收,把小麦当家品种牢牢攥在自己手里,再苦再累都值得。”时晓伟说,2023年春天,具有高产、强筋、抗病特性的津强14号、16号小麦将投入小面积生产示范,“我对这两款品种的种植前景充满信心。”
党的二十大报告提出,“全方位夯实粮食安全根基”“深入实施种业振兴行动”。时晓伟表示,将继续扎根一线加强良种技术攻关,助力小麦优质高产,助力农民增产增收。(记者 武少民)
(文图:赵筱尘 巫邓炎)