12月8日,中國科學院上海營養與健康研究所武愛波研究組在國際學術期刊Advanced Science在線發表了題為“CACLENS: A Multitask Deep Learning System for Enzyme Discovery”的研究論文。該研究建立了端到端篩選目標酶的多任務計算框架,大幅提高了功能酶的預測與發現效率,并成功應用于真菌毒素降解酶的挖掘。
近年來,深度學習在酶的結構、功能與性質的大規模預測領域取得了顯著進展。然而,由于缺乏面向多模態輸入和多任務輸出的統一建模能力,現有方法仍難以滿足高性能功能酶篩選的需求。針對這一挑戰,研究團隊設計并開發了CACLENS (Cross-Attention & Contrastive Learning-enabled Enzyme Selection)框架,將CGC(Customized Gate Control)門控機制、對比學習與交叉注意力等方法深度融合,構建出可同時執行多項預測任務的一體化酶篩選平臺。

圖1:基于多任務模型的新功能酶智能挖掘與篩選框架
CACLENS能以較低的計算成本同時完成反應類型分類、酶EC號預測與反應可行性評估三項關鍵任務,并在多個任務上展現出顯著優勢。具體而言,在反應類型分類中,經過對ADP/ATP/H?等常見輔因子清洗處理后,模型性能優于現有方法rxnfp;在EC號預測方面,整體表現超過主流模型CLEAN;在反應可行性評估中,即使采用偏向ESP與EnzRank的評估策略,CACLENS仍取得更佳結果,并能穩健處理未見過或與訓練集序列相似度較低的酶。
針對真菌毒素玉米赤霉烯酮(ZEN),研究團隊以CACLENS的多任務聯合預測結果為基礎,從大規模序列空間中快速篩選出10個潛在降解酶候選體。隨后,通過基因合成、異源表達與純化獲得相應酶蛋白,并對其降解性能開展系統實驗驗證。結果表明,約一半的候選酶具有對ZEN 的催化活性,其中ZD4與ZD7能夠在體外體系中降解超過90%的ZEN。

圖2:ZEN與ZOL及其降解產物的色譜圖
整體來看,CACLENS在三項任務中均展現出穩健、領先的預測能力,證明其在功能酶篩選中的重要應用潛力。該研究為多領域的新型功能酶挖掘提供了技術支撐,也為未來構建智能化酶工程設計平臺、繼續深入挖掘真菌毒素降解新酶奠定了基礎。
中國科學院上海營養與健康研究所武愛波研究員、田野副研究員為該論文的通訊作者,博士研究生伊西龍為第一作者。該工作得到國家自然基金委杰出青年科學基金、科技部國家重點研發計劃、上海市農業科技創新等項目支持。
原文鏈接:
https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202518063
推送單元:武愛波研究組、科技規劃與任務處