導讀:中國農業(yè)科學院作物科學研究所、國家南繁研究院與阿里達摩院聯合研發(fā)出全流程智慧育種平臺,實現了育種數據管理和分析、計算加速、AI 預測親本及優(yōu)良品種的育種全流程整合。
近日,全球植物科學頂尖期刊《分子植物》(Molecular Plant)刊載了中國科學家的最新研究,中國農業(yè)科學院作物科學研究所、國家南繁研究院與阿里達摩院聯合研發(fā)出全流程智慧育種平臺,實現了育種數據管理和分析、計算加速、AI 預測親本及優(yōu)良品種的育種全流程整合。
該平臺的數據容量、運行速度以及數據安全號稱“達到世界先進水平”,全球已有 23 家科研機構率先使用。
論文共同一作兼通訊作者李慧慧介紹說,種子是農業(yè)的“芯片”,對農業(yè)發(fā)展至關重要,但傳統育種方式成本高、工作量大,往往需要耗時十年甚至更久。在 AI 等技術加持下,“智慧育種”可通過模擬作物生長氣候、土壤及生長周期等信息,綜合作物表型、基因型等數據建立模型,進而預測作物性狀、篩選優(yōu)異基因型,大幅縮短育種周期。
不過,智慧育種需要高通量數據分析,依賴龐大的計算和建模、復雜的操作,對育種家挑戰(zhàn)很大。中國農業(yè)科學院作物科學研究所、國家南繁研究院與達摩院融合生物技術和 AI 技術,合作開發(fā)出高通量計算平臺,在網頁端為育種家提供“一站式、低門檻”的服務。
具體而言,該平臺整合了種質資源信息管理、育種試驗設計與模擬、海量育種組學數據存儲、高通量數據分析以及智能育種決策等模塊,支持大規(guī)模組學信息、表型信息數據的整合利用與深度挖掘。
數據顯示,該平臺已被全球 23 家科研機構用于育種研究,包括中國水稻研究所、中國科學院遺傳與發(fā)育生物學研究所、國際畜牧研究所、荷蘭瓦格寧根大學等。
為加速育種決策運算,智慧育種平臺引入多種大數據計算、人工智能模型、自動化處理模塊。論文通訊作者、達摩院智慧育種科學家顧斐介紹,平臺實現針對基因測序數據的變異位點計算加速 110 倍,基因型過濾加速 25 倍以上,群體遺傳學分析加速 1000 倍以上。
針對全基因組選擇算法,平臺的準確率平均提升 15% 以上,預測穩(wěn)定性提升 5%。此外,該平臺數據存儲容量達 1PB,可支持上百個用戶同時開展高效的育種大數據管理、調度和分析