近日,中國農業科學院植物保護研究所農藥應用風險控制創新團隊先后在Environmental Science &Technology和Journal of Hazardous Materials上發表研究論文。他們首次利用機器學習模型直接預測植物根部從土壤中吸收累積農藥等有機污染物的量,解決了傳統線性模型無法模擬農藥被植物吸收的非線性關系,并揭示了影響植物累積農藥的關鍵化學分子結構,為農產品在產地環境化學污染的預測提供了新的工具和手段。
準確預測植物吸收和累積農業污染物對保障食品安全、產地修復和人類健康暴露評估具有重要的意義。然而,由于污染物—土壤—植物根系之間復雜的相互作用,建立穩健可靠的預測模型仍然具有很大挑戰性。傳統的線性預測模型難以預測污染物—土壤—植物間的非線性關系,導致預測值與實際值差異較大。
該研究對比了四種不同的機器學習算法,通過對341個數據點、72個化合物的數據集進行訓練,預測植物根系富集值,證明了新構建的GBRT-ECFP模型為最優預測模型。此外,該研究解析了化學分子、土壤與植物特性之間的非線性關系。子結構重要性分析明確了分子子結構與植物富集之間的關系,確定了-O、-Cl、芳環和大共軛π系統等為與植物累積相關的關鍵化學子結構。該項研究為未來新農藥植物吸收潛能評估和農田農藥污染安全評價提供了新的可靠工具。(李晨)