近日,上海科技大學(xué)免疫化學(xué)研究所/生命科學(xué)與技術(shù)學(xué)院白芳課題組在國際學(xué)術(shù)期刊《生物信息學(xué)簡報》( Briefings in Bioinformatics)上發(fā)表題為“DiffPROTACs is a deep learning-based generator for Proteolysis Targeting Chimeras”的研究論文。該工作開發(fā)了一個名為DiffPROTACs的蛋白水解靶向嵌合體分子(PROteolysis TArgeting Chimera,PROTAC)的生成和設(shè)計新計算方法。
PROTAC分子是一種新型的雙功能藥物分子實體,由三個部分組成,分別是與靶標(biāo)和E3水解酶結(jié)合的配體,以及調(diào)控靶蛋白與E3互作穩(wěn)定性的鏈接子(Linker)。該類分子一方面可以保持靶標(biāo)配體原有的調(diào)控功能,另外一方面可以直接降解疾病靶標(biāo)。與傳統(tǒng)小分子抑制劑相比,PROTAC顯示出多種優(yōu)越性,例如能夠靶向不可成藥的蛋白、可有效地緩解藥物耐藥性進展、對靶標(biāo)蛋白的親和力要求低等。然而,由于PROTAC構(gòu)效關(guān)系不明確,其理性設(shè)計計算方法尤為或缺。目前較為普遍的做法仍依賴于藥物化學(xué)家根據(jù)經(jīng)驗,在兩端配體已知的前提下,從長度、分子物理化學(xué)性質(zhì)等多個方面出發(fā),隨機替換鏈接子獲得PROTAC分子,進一步合成后進行藥效評估,這對藥物研發(fā)成本投入具有較高的要求,同時,化合物本身的結(jié)構(gòu)新穎性也較為受限。
白芳課題組長期以來致力于PROTAC分子設(shè)計與藥效評價等開發(fā)新工具、新方法,目前已經(jīng)開發(fā)了PROTAC降解藥效評價方法DeepPROTACs ( Nat. Commun., 2022)等,用戶遍布全球17個國家。本項目在前期工作的基礎(chǔ)上,針對PROTAC分子設(shè)計目前存在的上述局限性問題,引入人工智能生成算法,以決定PROTAC藥效的因素——靶蛋白-E3互作穩(wěn)定性作為生成模型的空間約束條件,發(fā)展了PROTAC鏈接子的智能化生成新方法。該方法可以生成化學(xué)結(jié)構(gòu)多樣性豐富的PROTAC新分子。
“生成式人工智能”的興起為藥物研發(fā)領(lǐng)域帶來新的曙光。其中,擴散模型和Transformers是重要生成式代表算法。基于這兩個算法,本文針對PROTAC分子鏈接子任務(wù)設(shè)計并發(fā)展了一種新的擴散生成模型DiffPROTACs(模型架構(gòu)如圖1所示)。該模型利用Transformer來學(xué)習(xí)并生成基于給定配體的新的PROTAC的連接子。同時,為了將分子的空間結(jié)構(gòu)性質(zhì)引入到該模型中,本文設(shè)計了O(3)等變圖Transformer(O(3) Equivariant Graph Transformer,OEGT)模塊,并分別使用Transformer和圖神經(jīng)網(wǎng)絡(luò)更新連接子節(jié)點的特征與坐標(biāo),從而保證了模型相對于旋轉(zhuǎn)的等變性,提高數(shù)據(jù)學(xué)習(xí)性能。

圖 1.?PROTAC分子生成模型DiffPROTACs算法框架示意圖。
經(jīng)過系統(tǒng)測試與評價表明:DiffPROTACs生成的PROTAC分子的有效性、結(jié)構(gòu)獨特性分別可達93.86%和68.7%。在如2所示的測試案例中(復(fù)合物結(jié)構(gòu)PDB編號:8BDT),DiffPROTACs可生成多種結(jié)構(gòu)多樣性豐富的鏈接子,同時,不僅可有效生成出已報導(dǎo)的PROTAC真實的分子結(jié)構(gòu),且生成分子與實驗解析構(gòu)象間的平均均方根偏差(Root Mean Square Deviation,RMSD)僅為0.53 ?。

圖2. PROTAC分子生成實例。
a)針對靶標(biāo)BRD4和E3水解酶VHL生成的PROTAC鏈接子二維圖及三維構(gòu)象示例;b)Diff PORTAC可生成已報道真實PROTAC(PDB編號:8BDT,黃色)的連接子及天然活性構(gòu)象(灰色)。
為了進一步幫助業(yè)界進行PROTAC分子的設(shè)計或者篩選,本文使用DiffPROTACs生成了一系列新的PROTAC分子,為設(shè)計者提供PROTAC虛擬篩選庫,該數(shù)據(jù)庫可以通過以下鏈接下載?https://bailab.siais.shanghaitech.edu.cn/service/DiffPROTACs-generated.tgz。此外,本文發(fā)展的DiffPROTACs也開發(fā)了網(wǎng)絡(luò)服務(wù)器為業(yè)界提供非商業(yè)用途的免費使用(網(wǎng)址:https://bailab.siais.shanghaitech.edu.cn/services/diffprotacs/)。源代碼也已同時發(fā)布,供業(yè)屆深入研究提供基礎(chǔ)(https://github.com/fenglei104/DiffPROTACs)。
本項目工作中,上海科技大學(xué)信息科學(xué)與技術(shù)學(xué)院2021級碩士研究生李風(fēng)雷和華東師范大學(xué)醫(yī)學(xué)與健康研究院副研究員胡喬宇(原白芳課題組博士后)為本文共同第一作者。上海科技大學(xué)生命學(xué)院助理教授、免疫化學(xué)研究所白芳研究員為通訊作者。上海科技大學(xué)為第一完成單位。
文章鏈接:
https://academic.oup.com/bib/article/25/5/bbae358/7727300



