本申請(qǐng)涉及分子設(shè)計(jì)模擬領(lǐng)域,具體而言,涉及一種基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)方法、系統(tǒng)及應(yīng)用。
背景技術(shù):
1、現(xiàn)有酶產(chǎn)品研發(fā)的技術(shù)路線主要可分為4類(lèi):理性設(shè)計(jì)、定向進(jìn)化、從頭設(shè)計(jì)、蛋白語(yǔ)言模型篩選配合強(qiáng)化學(xué)習(xí)迭代。其中,定向進(jìn)化和從頭設(shè)計(jì)由于對(duì)酶活機(jī)制缺乏理解,只能通過(guò)加大實(shí)驗(yàn)的通量,通過(guò)濕實(shí)驗(yàn)試錯(cuò),因而成本高昂。近年涌現(xiàn)的蛋白語(yǔ)言模型與ai強(qiáng)化學(xué)習(xí)融合的新模式,雖可解決蛋白基本性質(zhì)(如熱穩(wěn)定性、水溶性)的預(yù)測(cè)和設(shè)計(jì),但同樣因缺乏對(duì)酶活機(jī)制的詳盡理解,無(wú)法直接解決其催化活性設(shè)計(jì),也就無(wú)法解決酶對(duì)多個(gè)不同底物催化活性差異的調(diào)整,即特異性(選擇性)設(shè)計(jì)。而在這四種研發(fā)范式中,理性設(shè)計(jì)以其后續(xù)實(shí)驗(yàn)通量要求可低至數(shù)個(gè)突變體的優(yōu)勢(shì)著稱(chēng)。盡管如此,因“理性信息量不足”,理性設(shè)計(jì)的實(shí)際成功率很低,導(dǎo)致實(shí)際研發(fā)成本(實(shí)驗(yàn)總次數(shù))居高不下,并未相對(duì)于其他技術(shù)流派展現(xiàn)出成本優(yōu)勢(shì)。
2、全原子分子動(dòng)力學(xué)模擬(molecular?dynamics,md)是研究構(gòu)象變化的標(biāo)準(zhǔn)方法和擴(kuò)展結(jié)構(gòu)數(shù)據(jù)庫(kù)的有效手段,然而復(fù)雜酶體系動(dòng)輒含有數(shù)十萬(wàn)乃至數(shù)百萬(wàn)原子(酶、溶劑、離子、核酸等),導(dǎo)致力的計(jì)算規(guī)模超大(原子數(shù)的平方),計(jì)算速度過(guò)低,因此預(yù)以md為基礎(chǔ)搜索構(gòu)象變化的過(guò)渡態(tài),前提便是通過(guò)算法大幅度提速。然而,通過(guò)算法提速的前提又是已大致知曉能準(zhǔn)確描述過(guò)渡態(tài)位置(結(jié)構(gòu))的坐標(biāo)(維度),而尋找這些維度(即過(guò)渡態(tài)結(jié)構(gòu))本就是md計(jì)算的核心目標(biāo),事前顯然是未知的,可選擇的坐標(biāo)總數(shù)又高達(dá)數(shù)百萬(wàn),事前猜測(cè)也是天方夜譚。因此,提速需求和計(jì)算目標(biāo)兩者互為對(duì)方的前提條件,自相矛盾。這便是理論化學(xué)界著名的反應(yīng)坐標(biāo)問(wèn)題,已困擾計(jì)算生物學(xué)界長(zhǎng)達(dá)數(shù)十年。
3、因此,需要一種復(fù)雜酶設(shè)計(jì)方案來(lái)解決上述問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、基于現(xiàn)有技術(shù)存在的問(wèn)題,本申請(qǐng)?zhí)峁┝艘环N基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)方法、系統(tǒng)及應(yīng)用。具體方案如下:
2、第一部分,本申請(qǐng)?zhí)岢隽艘环N基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)方法,包括如下:
3、確定復(fù)雜酶及其一或多個(gè)已知的穩(wěn)態(tài)結(jié)構(gòu);
4、根據(jù)所述穩(wěn)態(tài)結(jié)構(gòu)搜索所述復(fù)雜酶構(gòu)象變化的過(guò)渡態(tài);
5、基于所述過(guò)渡態(tài)的結(jié)構(gòu)信息和能量信息確定影響所述復(fù)雜酶活性的活性因素;
6、根據(jù)所述活性因素設(shè)計(jì)一或多個(gè)酶突變體,分析酶突變體的效果并驗(yàn)證酶突變體是否合格;
7、將驗(yàn)證合格的酶突變體作為設(shè)計(jì)完成的復(fù)雜酶。
8、在一些具體實(shí)施例中,基于所述過(guò)渡態(tài)的結(jié)構(gòu)信息和能量信息確定影響所述復(fù)雜酶活性的活性因素,包括:
9、基于所述結(jié)構(gòu)信息確定過(guò)渡態(tài)結(jié)構(gòu)和中間態(tài)結(jié)構(gòu)中原子的結(jié)構(gòu)變化和能量變化,確定影響復(fù)雜酶活性的關(guān)鍵原子集,通過(guò)分析所述關(guān)鍵原子集包括位置、體積、電荷、疏水性在內(nèi)的性質(zhì)以及包括作用方式和作用能量在內(nèi)的相互作用得到原子結(jié)構(gòu)因素和原子能量因素,綜合所述原子結(jié)構(gòu)因素和所述原子能量因素得到所述活性因素。
10、在一些具體實(shí)施例中,所述過(guò)渡態(tài)的搜索方式包括基于旅行商問(wèn)題的自動(dòng)化路徑搜索算法、快速斷層成像算法、過(guò)渡路徑采樣算法、有限溫度弦算法、路徑元?jiǎng)恿W(xué)方法、溫和爬升動(dòng)力學(xué)算法、結(jié)合gad與降維算法的過(guò)渡態(tài)搜索算法、結(jié)合分散性與變分原理正則化神經(jīng)網(wǎng)絡(luò)的過(guò)渡態(tài)識(shí)別方法。
11、在一些具體實(shí)施例中,所述過(guò)渡態(tài)的搜索具體包括:
12、根據(jù)已知穩(wěn)態(tài)結(jié)構(gòu)進(jìn)行復(fù)雜酶構(gòu)象變化的路徑模擬得到初始路徑;
13、尋找距離所述初始路徑最近的最小自由能路徑;
14、計(jì)算沿所述最小自由能路徑方向的自由能分布曲線,根據(jù)自由能分布曲線確定過(guò)渡態(tài)結(jié)構(gòu)和中間態(tài)結(jié)構(gòu)。
15、在一些具體實(shí)施例中,驗(yàn)證酶突變體是否合格具體包括:
16、若酶突變體的效果達(dá)到所述復(fù)雜酶效果的預(yù)設(shè)百分比,則對(duì)酶突變體進(jìn)行實(shí)驗(yàn)驗(yàn)證,并將通過(guò)實(shí)驗(yàn)驗(yàn)證的酶突變體認(rèn)證為驗(yàn)證合格;
17、若酶突變體的效果未達(dá)到所述復(fù)雜酶效果的預(yù)設(shè)百分比,則在該酶突變體的基礎(chǔ)上調(diào)整突變位點(diǎn)或氨基酸種類(lèi)得到新的酶突變體;
18、若酶突變體的效果無(wú)效或與所述復(fù)雜酶的效果相異,則根據(jù)活性因素重新設(shè)計(jì)酶突變體。
19、在一些具體實(shí)施例中,分析酶突變體的效果具體包括:
20、進(jìn)行短時(shí)間平衡后,確定設(shè)計(jì)該酶突變體所依據(jù)活性因素對(duì)應(yīng)的復(fù)雜酶,將所述復(fù)雜酶的初始路徑中的每個(gè)節(jié)點(diǎn)結(jié)構(gòu)依次作為目標(biāo)結(jié)構(gòu),逐步將酶突變體由初始態(tài)結(jié)構(gòu)拉到所述目標(biāo)結(jié)構(gòu),從而獲得驗(yàn)證初始路徑;
21、尋找距離初始路徑最近的最小自由能路徑得到驗(yàn)證最小自由能路徑;
22、計(jì)算沿所述驗(yàn)證最小自由能路徑方向的自由能分布曲線;
23、根據(jù)所述自由能分布曲線獲取酶突變體包括反應(yīng)速率、反應(yīng)特異性在內(nèi)的活性信息,進(jìn)而確定該酶突變體的效果。
24、在一些具體實(shí)施例中,若復(fù)雜酶存在一個(gè)已知穩(wěn)態(tài)結(jié)構(gòu),則通過(guò)高斯加速分子動(dòng)力學(xué)模擬獲取初始路徑;
25、若復(fù)雜酶存在兩個(gè)已知穩(wěn)態(tài)結(jié)構(gòu),則通過(guò)靶向分子動(dòng)力學(xué)模擬得到初始路徑。
26、第二部分,本申請(qǐng)?zhí)岢隽艘环N基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)系統(tǒng),包括如下:
27、輸入單元,用于確定復(fù)雜酶及其一或多個(gè)已知的穩(wěn)態(tài)結(jié)構(gòu);
28、過(guò)渡態(tài)單元,用于根據(jù)所述穩(wěn)態(tài)結(jié)構(gòu)搜索所述復(fù)雜酶構(gòu)象變化的過(guò)渡態(tài);
29、活性因素單元,用于基于所述過(guò)渡態(tài)的結(jié)構(gòu)信息和能量信息確定影響所述復(fù)雜酶活性的活性因素;
30、設(shè)計(jì)單元,用于根據(jù)所述活性因素設(shè)計(jì)一或多個(gè)酶突變體,分析酶突變體的效果并驗(yàn)證酶突變體是否合格;
31、輸出單元,用于將驗(yàn)證合格的酶突變體作為設(shè)計(jì)完成的復(fù)雜酶。
32、第三部分,本申請(qǐng)?zhí)岢隽艘环N計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括:
33、一個(gè)或多個(gè)處理器;
34、存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序;
35、當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如第一部分中任一所述的基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)方法。
36、第四部分,本申請(qǐng)?zhí)岢隽艘环N計(jì)算機(jī)程序產(chǎn)品,包括可執(zhí)行指令,用于被處理器執(zhí)行時(shí),實(shí)現(xiàn)如第一部分中任一所述的基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)方法。
37、有益效果:本申請(qǐng)?zhí)岢隽艘环N基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)方法、系統(tǒng)及應(yīng)用,運(yùn)用構(gòu)象變化過(guò)渡態(tài)搜索進(jìn)行復(fù)雜酶活性和特異性設(shè)計(jì),基于分子動(dòng)力學(xué)模擬的高效過(guò)渡態(tài)搜索算法,精確且快速獲得與復(fù)雜酶的活性直接相關(guān)的構(gòu)象變化動(dòng)力學(xué)機(jī)制細(xì)節(jié),使得對(duì)復(fù)雜酶活性及特異性的全面理性設(shè)計(jì)成為可能,從而能夠?qū)ζ溥M(jìn)行定點(diǎn)突變,切實(shí)降低計(jì)算完成后所需的實(shí)驗(yàn)次數(shù),大幅降低復(fù)雜酶產(chǎn)品研發(fā)的總體成本。
38、為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說(shuō)明如下。
1.一種基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)方法,其特征在于,包括如下:
2.根據(jù)權(quán)利要求1所述的復(fù)雜酶設(shè)計(jì)方法,其特征在于,基于所述過(guò)渡態(tài)的結(jié)構(gòu)信息和能量信息確定影響所述復(fù)雜酶活性的活性因素,包括:
3.根據(jù)權(quán)利要求1所述的復(fù)雜酶設(shè)計(jì)方法,其特征在于,所述過(guò)渡態(tài)的搜索方式包括基于旅行商問(wèn)題的自動(dòng)化路徑搜索算法、快速斷層成像算法、過(guò)渡路徑采樣算法、有限溫度弦算法、路徑元?jiǎng)恿W(xué)方法、溫和爬升動(dòng)力學(xué)算法、結(jié)合gad與降維算法的過(guò)渡態(tài)搜索算法、結(jié)合分散性與變分原理正則化神經(jīng)網(wǎng)絡(luò)的過(guò)渡態(tài)識(shí)別方法。
4.根據(jù)權(quán)利要求3所述的復(fù)雜酶設(shè)計(jì)方法,其特征在于,所述過(guò)渡態(tài)的搜索具體包括:
5.根據(jù)權(quán)利要求1所述的復(fù)雜酶設(shè)計(jì)方法,其特征在于,驗(yàn)證酶突變體是否合格具體包括:
6.根據(jù)權(quán)利要求1所述的復(fù)雜酶設(shè)計(jì)方法,其特征在于,分析酶突變體的效果具體包括:
7.根據(jù)權(quán)利要求4所述的復(fù)雜酶設(shè)計(jì)方法,其特征在于,若復(fù)雜酶存在一個(gè)已知穩(wěn)態(tài)結(jié)構(gòu),則通過(guò)高斯加速分子動(dòng)力學(xué)模擬獲取初始路徑;
8.一種基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)系統(tǒng),其特征在于,包括如下:
9.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括:
10.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括可執(zhí)行指令,用于被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1-7中任一所述的基于構(gòu)象變化過(guò)渡態(tài)搜索的復(fù)雜酶設(shè)計(jì)方法。