本發明涉及生物,具體涉及一種寡核苷酸集合以及多重擴增子建庫方法。
背景技術:
1、目前的擴增子建庫,都是采用兩輪pcr擴增的方式完成文庫的構建,第一輪擴增由帶有第二輪引物識別序列(即index序列)的基因特異性引物對特定區域進行擴增;第二輪擴增通過帶有index序列互補序列的引物對第一輪產物進行擴增完成文庫擴增。這種最通用的方法會帶來的問題:1.第一輪擴增之后需要進行純化回收,再進行配制第二輪體系,并進行第二輪擴增,以及對最終產物進行回收,即一共需要兩輪擴增和兩輪回收,增加了操作的復雜性。2.由于第一輪產物兩端帶的是第二輪引物識別的通用序列,因此當存在較多樣本同時進行擴增時,第一輪產物進行回收配制體系等操作容易通過氣溶膠進行交叉污染,從而影響樣本間鑒定片段信號的真實性。3.由于兩輪擴增之間具有較多的操作步驟,且需要開蓋加樣,有可能引起樣本間的交叉污染,進而阻礙靶向擴增子測序的自動化操作。
2、中國專利cn104093890b和美國專利us10876108b2專利公開了一種通過先進行建庫,再使用一端特異性引物和另一端通用性引物擴增特定片段進行擴增子建庫,這種建庫模式仍然需要經過多輪完成擴增子建庫,仍然存在操作步驟復雜以及氣溶膠交叉污染的情況。特別是在病原靶向測序(tngs)的應用場景上,氣溶膠造成的樣本間交叉污染嚴重影響了靶向病原檢測技術的自動化運用和大規模推廣。
3、因此,將兩輪擴增變成一輪擴增是技術發展的趨勢,也有利于解決在靶向病原檢測應用中的樣本間的交叉污染的問題。
技術實現思路
1、本發明的目的在于提供一種寡核苷酸對以及多重擴增子建庫方法,通過連接或互補延伸的方式將多重擴增體系中的基因特異性多重擴增引物和文庫擴增引物生成連接產物或延伸產物,再通過該連接產物或延伸產物作為長引物即可一步完成擴增子文庫的構建。相對于傳統的多重擴增子建庫方法,本發明提供的方法能夠減少開蓋操作步驟,避免交叉污染風險。
2、本發明的第一方面包括一種寡核苷酸集合,所述寡核苷酸集合包含第一寡核苷酸引物和第二寡核苷酸引物,所述第一寡核苷酸引物從5’端至3’端依次包含測序接頭序列、標簽序列和測序引物序列,所述第二寡核苷酸引物從5’端至3’端依次包含基因特異性引物的反向互補序列和測序引物的反向互補序列。
3、在一些實施方案中,所述第一寡核苷酸引物和所述第二寡核苷酸引物通過所述測序引物序列和所述測序引物的反向互補序列互補配對。
4、在一些實施方案中,所述“反向互補序列”指通過堿基配對原則關聯的核苷酸序列。例如,序列“5'-atcg-3'”的反向互補序列是“5'-cgat-3'”。
5、在一些實施方案中,所述標簽序列是用于區分不同待測樣本的隨機序列。在一些實施方案中,所述標簽序列為至少3個核苷酸,例如4-12個核苷酸,優選6-8個核苷酸,例如8個核苷酸。
6、在一些實施方案中,所述基因特異性引物序列是根據待測dna樣本的目標片段設計的特異性引物序列。例如,所述基因特異性引物序列包含至少3個核苷酸,例如3-50個核苷酸,例如3個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、18個、20個、22個、25個、26個、28個、30個、32個、35個、38個、40個、42個、45個、48個和50個核苷酸。
7、在一些實施方案中,所述基因特異性引物的反向互補序列的一個或多個核苷酸上位點含有rna堿基修飾,所述修飾是ra(腺嘌呤核糖核苷)、ru(尿嘧啶核糖核苷)、rg(鳥嘌呤核糖核苷)和rc(胞嘧啶核糖核苷)中的至少一種。在一些實施方案中,所述修飾的數量是至少1個,例如1個、2個、3個、5個、6個、7個、8個、9個、10個、12個或15個。
8、在一些實施方案中,當所述基因特異性引物的反向互補序列的多個核苷酸位點上含有rna堿基修飾時,所述多個核苷酸位點是連續的或不連續的,且彼此獨立是ra、ru、rg和rc中的一種。
9、在一些實施方案中,所述第二寡核苷酸引物中的一個或多個核苷酸位點上含有rna堿基修飾,所述修飾是ra(腺嘌呤核糖核苷)、ru(尿嘧啶核糖核苷)、rg(鳥嘌呤核糖核苷)和rc(胞嘧啶核糖核苷)中的至少一種,所述修飾的數量是至少1個,例如1個、2個、3個、5個、6個、7個、8個、9個、10個、12個、15個、16個、18個或20個。
10、在一些實施方案中,當所述第二寡核苷酸引物中的多個核苷酸位點上含有rna堿基修飾時,所述多個核苷酸位點是連續的或不連續的,且彼此獨立是ra、ru、rg和rc中的一種。
11、在一些實施方案中,所述第二寡核苷酸引物的3’末端含有封閉修飾,其作用是阻止dntp添加至第二寡核苷酸引物的3’末端進行延伸。在一些實施方案中,所述封閉修飾是3’磷酸化修飾或間臂修飾;優選地,所述間臂修飾是spacer?c3修飾、spacer?c6修飾、spacer?c9修飾、dspacer修飾或pc-linker修飾。
12、在一些實施方案中,所述第一寡核苷酸引物包括至少一對上游第一寡核苷酸引物和下游第一寡核苷酸引物。
13、在一些實施方案中,所述上游第一寡核苷酸引物從5’端至3’端依次包含上游測序接頭序列、上游標簽序列和上游測序引物序列,所述下游第一寡核苷酸引物從5’端至3’端依次包含下游測序接頭序列、下游標簽序列和下游測序引物序列。
14、在一些實施方案中,所述上游第一寡核苷酸引物不包含(上游)標簽序列,和/或,所述下游第一寡核苷酸引物不包含(下游)標簽序列。
15、在一些實施方案中,所述測序接頭序列是當前或將來測序平臺(包括但不限于iontorrent平臺、illumina平臺和華大平臺mgi)使用的測序基質相關序列。
16、在一些實施方案中,所述測序接頭序列包括上游測序接頭序列和/或下游測序接頭序列。
17、在一些實施方案中,所述上游測序接頭序列是illumina平臺的p5接頭序列,所述下游測序接頭序列illumina平臺的p7接頭序列;反之亦然。
18、在一些實施方案中,所述上游測序接頭序列是iontorrent平臺的p1銜接頭序列,所述下游測序接頭序列是iontorrent平臺的a銜接頭序列;反之亦然。
19、在一些實施方案中,所述上游測序接頭序列是mgi平臺的單端標簽建庫上游夾板序列,所述下游測序接頭序列是mgi平臺的單端標簽建庫下游夾板序列;反之亦然。在一些實施方案中,所述上游測序接頭序列是mgi平臺的雙端標簽建庫上游夾板序列,所述下游測序接頭序列是mgi平臺的雙端標簽建庫下游夾板序列;反之亦然。
20、在一些實施方案中,所述上游第一寡核苷酸引物是illumina平臺的i5引物,所述下游第一寡核苷酸引物是illumina平臺的i7引物;反之亦然。
21、在一些實施方案中,所述第二寡核苷酸引物包括至少一對上游第二寡核苷酸引物和下游第二寡核苷酸引物。
22、在一些實施方案中,所述上游第二寡核苷酸引物從5’端至3’端依次包含基因特異性上游引物的反向互補序列和上游測序引物的反向互補序列。
23、在一些實施方案中,所述下游第二寡核苷酸引物從5’端至3’端依次包含基因特異性下游引物的反向互補序列和下游測序引物的反向互補序列。
24、在一些實施方案中,所述上游第一寡核苷酸引物和所述上游第二寡核苷酸引物通過所述上游測序引物序列和所述上游測序引物的反向互補序列互補配對。
25、在一些實施方案中,所述下游第一寡核苷酸引物和所述下游第二寡核苷酸引物通過所述下游測序引物序列和所述下游測序引物的反向互補序列互補配對。
26、本發明的第二方面提供一種組合物,其包含dna聚合酶、核糖核酸內切酶、dntp、緩沖成分、金屬鹽和引物組合;其中,所述引物組合包含第一方面所述的第一寡核苷酸引物和第一方面所述的第二寡核苷酸引物,特別是,至少一對上游第一寡核苷酸引物和下游第一寡核苷酸引物以及至少一對上游第二寡核苷酸引物和下游第二寡核苷酸引物。
27、在一些實施方案中,所述第一寡核苷酸引物和所述第二寡核苷酸引物能夠通過測序引物序列及測序引物的反向互補序列互補配對。在一些實施方案中,所述第一寡核苷酸引物和所述第二寡核苷酸引物各自分別以單鏈形式存在于所述組合物中。在一些實施方案中,所述第一寡核苷酸引物和所述第二寡核苷酸引物通過所述測序引物序列和所述測序引物的反向互補序列形成部分雙鏈結構的形式存在于所述組合物中。
28、在一些實施方案中,所述第一寡核苷酸引物包含至少一對第一方面所述的上游第一寡核苷酸引物和下游第一寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
29、在一些實施方案中,每一對所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區別在于標簽序列不相同。
30、在一些實施方案中,所述第二寡核苷酸引物包含至少一對第一方面所述的上游第二寡核苷酸引物和第一方面所述的下游第二寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
31、在一些實施方案中,每一對所述上游第二寡核苷酸引物和所述下游第二寡核苷酸引物之間的區別在于基因特異性引物序列不相同。
32、在一些實施方案中,所述組合物還包括dna樣本。
33、在一些實施方案中,所述dna樣本是gdna或cdna。
34、在一些實施方案中,所述dna聚合酶至少包含一種耐熱dna聚合酶。
35、在一些實施方案中,所述dna聚合酶至少包含一種耐熱dna聚合酶和一種常溫dna聚合酶。
36、在一些實施方案中,所述耐熱dna聚合酶是taq?dna聚合酶、pfu?dna聚合酶、ventdna聚合酶、deep?vent?dna聚合酶或kod?dna聚合酶。
37、在一些實施方案中,所述耐熱聚合酶是熱啟動的聚合酶,例如抗體封閉的聚合酶或配體封閉的聚合酶。
38、在一些實施方案中,所述dna聚合酶至少包含一種非熱啟動的聚合酶和一種熱啟動的聚合酶。
39、在一些實施方案中,所述常溫dna聚合酶是klenow?dna聚合酶、bst?dna聚合酶或phi?29dna聚合酶。
40、在一些實施方案中,本發明所述的“常溫聚合酶”是指能在常溫例如45℃以下發揮聚合活性的聚合酶。
41、在一些實施方案中,所述核糖核酸內切酶識別rna/dna雜交鏈并切割rna鏈。
42、在一些實施方案中,所述核糖核酸內切酶是能夠識別核糖核苷酸位點并切除磷酸二酯鍵的內切酶;優選地,所述所述核糖核酸內切酶是rnase?h2。
43、在一些實施方案中,所述核糖核酸內切酶是rnase?h2的同源蛋白。
44、在一些實施方案中,所述緩沖成分是tris、tris-hcl、tris堿或hepes中的一種或多種,優選tris。
45、在一些實施方案中,所述金屬鹽是mg2+鹽,優選mgcl2。
46、在一些實施方案中,所述金屬鹽是mg2+鹽,以及k+鹽、mn2+鹽、cs+鹽、na+鹽和ca2+鹽中的一種或多種。
47、在一些實施方案中,所述組合物中還包含本領域公知的其它能夠幫助dna聚合酶、核糖核酸內切酶發揮作用的組分,例如甘油。
48、在一些實施方案中,所述組合物中還包含表面活性劑,例如陰離子表面活性劑、陽離子表面活性劑和非離子表面活性劑中的一種或多種。
49、本發明的第三方面提供一種多重擴增子建庫方法,所述方法包括如下步驟:
50、(1)配制包含至少一對第一寡核苷酸引物、至少一對第二寡核苷酸引物和樣本核酸的反應體系;其中,所述第一寡核苷酸引物從5’端至3’端依次包含測序接頭序列、標簽序列和測序引物序列,所述第二寡核苷酸引物從5’端至3’端依次包含基因特異性引物的反向互補序列和測序引物的反向互補序列,所述第二寡核苷酸引物中包含可切割基團;
51、(2)使所述第一寡核苷酸引物的3’端和所述第二寡核苷酸引物的3’端反向互補配對,使所述第一寡核苷酸引物沿5’-3’方向延伸獲得延伸產物;
52、(3)切割所述第二寡核苷酸引物中的所述基因特異性引物的反向互補序列;
53、(4)以步驟(2)所述延伸產物作為引物對所述樣本核酸進行pcr擴增。
54、在一些實施方案中,所述標簽序列是用于區分不同樣本的隨機序列。在一些實施方案中,所述標簽序列為至少3個核苷酸,例如4-12個核苷酸,優選6-8個核苷酸,例如8個核苷酸。
55、在一些實施方案中,所述基因特異性引物序列是根據待測dna樣本的目標片段設計的特異性引物序列。例如,所述基因特異性引物序列包含至少3個核苷酸,例如3-50個核苷酸,例如3個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、18個、20個、22個、25個、26個、28個、30個、32個、35個、38個、40個、42個、45個、48個和50個核苷酸。
56、在一些實施方案中,所述第二寡核苷酸引物的3’末端含有封閉修飾,其作用是阻止dntp添加至第二寡核苷酸引物的3’末端進行延伸。在一些實施方案中,所述封閉修飾是3’磷酸化修飾或間臂修飾;優選地,所述間臂修飾是spacer?c3修飾、spacer?c6修飾、spacer?c9修飾、dspacer修飾或pc-linker修飾。
57、在一些實施方案中,所述至少一對第一寡核苷酸引物包括至少一對上游第一寡核苷酸引物和下游第一寡核苷酸引物。
58、在一些實施方案中,所述上游第一寡核苷酸引物從5’端至3’端依次包含上游測序接頭序列、上游標簽序列和上游測序引物序列,所述下游第一寡核苷酸引物從5’端至3’端依次包含下游測序接頭序列、下游標簽序列和下游測序引物序列。
59、在一些實施方案中,所述上游第一寡核苷酸引物不包含(上游)標簽序列,和/或,所述下游第一寡核苷酸引物不包含(下游)標簽序列。
60、在一些實施方案中,所述測序接頭序列是當前或將來測序平臺(包括但不限于iontorrent平臺、illumina平臺和華大平臺mgi)使用的測序基質相關序列。
61、在一些實施方案中,所述測序接頭序列包括上游測序接頭序列和下游測序接頭序列。
62、在一些實施方案中,所述上游測序接頭序列是illumina平臺的p5接頭序列,下游測序接頭序列illumina平臺的p7接頭序列;反之亦然。
63、在一些實施方案中,所述上游測序接頭序列是ion?torrent平臺的p1銜接頭序列,所述下游測序接頭序列是ion?torrent平臺的a銜接頭序列;反之亦然。
64、在一些實施方案中,所述上游測序接頭序列是mgi平臺的單端標簽建庫上游夾板序列,所述下游測序接頭序列是mgi平臺的單端標簽建庫下游夾板序列;反之亦然。在一些實施方案中,所述上游測序接頭序列是mgi平臺的雙端標簽建庫上游夾板序列,所述下游測序接頭序列是mgi平臺的雙端標簽建庫下游夾板序列;反之亦然。
65、在一些實施方案中,所述上游第一寡核苷酸引物是illumina平臺的i5引物,所述下游第一寡核苷酸引物是illumina平臺的i7引物;反之亦然。
66、在一些實施方案中,所述至少一對第二寡核苷酸引物包括至少一對上游第二寡核苷酸引物和下游第二寡核苷酸引物。
67、在一些實施方案中,所述上游第二寡核苷酸引物從5’端至3’端依次包含基因特異性上游引物的反向互補序列和上游測序引物的反向互補序列。
68、在一些實施方案中,所述下游第二寡核苷酸引物從5’端至3’端依次包含基因特異性下游引物的反向互補序列和下游測序引物的反向互補序列。
69、在一些實施方案中,所述上游第一寡核苷酸引物和所述上游第二寡核苷酸引物通過所述上游測序引物序列和所述上游測序引物的反向互補序列互補配對。
70、在一些實施方案中,所述下游第一寡核苷酸引物和下游第二寡核苷酸引物通過所述下游測序引物序列和所述上游測序引物的反向互補序列互補配對。
71、在一些實施方案中,所述第一寡核苷酸引物包含至少一對第一方面所述的上游第一寡核苷酸引物和下游第一寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
72、在一些實施方案中,每一對所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區別在于標簽序列不相同。
73、在一些實施方案中,所述第二寡核苷酸引物包含至少一對第一方面所述的上游第二寡核苷酸引物和下游第二寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
74、在一些實施方案中,每一對所述上游第二寡核苷酸引物和所述下游第二寡核苷酸引物之間的區別在于基因特異性引物序列不相同。
75、在一些實施方案中,所述樣本核酸是dna,例如,所述dna是gdna或cdna。
76、在一些實施方案中,所述可切割基團是指可以被核酸內切酶或核酸外切酶識別并切割的核苷酸底物。
77、在一些實施方案中,所述可切割基團是脫氧尿苷三磷酸(dutp)或脫氧肌苷三磷酸(ditp)。在一些實施方案中,當所述可切割基團是dutp時,所述反應體系中還包含尿嘧啶dna糖基化酶(uracil?dna?glycosylase,udg酶)或單鏈選擇性單功能尿嘧啶dna糖基化酶(single-strand?selective?monofunctional?uracil-dnaglycosylase,smug酶);當所述可切割基團是ditp時,所述反應體系中還包含烷基腺嘌呤dna糖基化酶(alkyladenine?dnaglycosylase,aag酶)或者內切酶ⅴ(endonuclease?v)。
78、在一些實施方案中,所述可切割基團是rna堿基,所述rna堿基是ra(腺嘌呤核糖核苷)、ru(尿嘧啶核糖核苷)、rg(鳥嘌呤核糖核苷)和rc(胞嘧啶核糖核苷)中的至少一種。在一些實施方案中,所述rna堿基的數量是至少1個,例如1個、2個、3個、5個、6個、7個、8個、9個、10個、12個或15個。在一切實施方案中,當所述可切割基團是rna堿基時,所述反應體系中還包含核糖核酸內切酶,所述核糖核酸內切酶是能夠識別核糖核苷酸位點并切除磷酸二酯鍵的內切酶;優選地,所述核糖核酸內切酶是rnase?h2或rnase?h2的同源蛋白。
79、在一些實施方案中,所述可切割基團位于所述第二寡核苷酸引物中的基因特異性引物的反向互補序列和/或測序引物的反向互補序列。
80、在一些實施方案中,所述步驟(3)是在核酸內切酶或核酸外切酶作用下切割所述第二寡核苷酸引物中的所述基因特異性引物的反向互補序列上的可切割基團,例如在核糖核酸內切酶的作用下識別并切割所述基因特異性引物的反向互補序列上的核糖核苷酸位點。
81、在一些實施方案中,所述第一寡核苷酸引物包含至少一對所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
82、在一些實施方案中,每一對所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區別在于標簽序列不相同。
83、在一些實施方案中,所述第二寡核苷酸引物包含至少一對所述上游第二寡核苷酸引物和所述下游第二寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
84、在一些實施方案中,每一對所述上游第二寡核苷酸引物和所述下游第二寡核苷酸引物之間的區別在于基因特異性引物序列不相同。
85、在一些實施方案中,所述反應體系中還包括dna聚合酶。
86、在一些實施方案中,所述dna聚合酶至少包含一種耐熱dna聚合酶。
87、在一些實施方案中,所述dna聚合酶至少包含一種耐熱dna聚合酶和一種常溫dna聚合酶。
88、在一些實施方案中,所述耐熱聚合酶是熱啟動的聚合酶,例如抗體封閉的聚合酶或配體封閉的聚合酶。
89、在一些實施方案中,所述dna聚合酶至少包含一種非熱啟動的聚合酶和一種熱啟動的聚合酶。
90、在一些實施方案中,所述耐熱dna聚合酶是taq?dna聚合酶、pfu?dna聚合酶、ventdna聚合酶、deep?vent?dna聚合酶或kod?dna聚合酶。
91、在一些實施方案中,所述常溫dna聚合酶是klenow?dna聚合酶、bst?dna聚合酶或phi?29dna聚合酶。
92、在一些實施方案中,所述步驟(2)的反應是在非熱啟動的聚合酶作用下進行;所述步驟(4)的反應是在熱啟動的聚合酶作用下進行。
93、在一些實施方案中,所述步驟(2)的反應是在常溫聚合酶作用下進行;所述步驟(4)的反應是在耐熱聚合酶作用下進行。
94、在一些實施方案中,所述步驟(2)的反應溫度是20-50℃,優選25-40℃,例如25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃或40℃。
95、在一些實施方案中,所述步驟(2)的反應時間是5-40分鐘,優選10-30分鐘,例如10分鐘、11分鐘、12分鐘、13分鐘、14分鐘、15分鐘、16分鐘、17分鐘、18分鐘、19分鐘、20分鐘、21分鐘、22分鐘、23分鐘、24分鐘、25分鐘、26分鐘、27分鐘、28分鐘、29分鐘或30分鐘。
96、在一些實施方案中,所述步驟(2)的反應條件是25-40℃孵育10-30分鐘、25-40℃孵育10-25分鐘、25-40℃孵育10-20分鐘或30℃孵育10-20分鐘,包括但不限于前述步驟(2)的反應溫度和步驟(2)的反應時間的任意組合。
97、在一些實施方案中,所述步驟(3)的反應溫度是40-80℃,優選60-80℃,例如60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃或80℃。
98、在一些實施方案中,所述步驟(3)的反應時間是5-30分鐘,優選5-20分鐘,例如5分鐘、6分鐘、7分鐘、8分鐘、9分鐘、10分鐘、11分鐘、12分鐘、13分鐘、14分鐘、5分鐘、16分鐘、17分鐘、18分鐘、19分鐘或20分鐘。
99、在一些實施方案中,所述步驟(3)的反應條件是60-80℃孵育10-20分鐘、65-80℃孵育10-20分鐘、70-80℃孵育10-20分鐘、70-80℃孵育10-15分鐘、70-75℃孵育10-15分鐘、72℃孵育10-15分鐘或72℃孵育10分鐘,包括但不限于前述步驟(3)的反應溫度和步驟(3)的反應時間的任意組合。
100、在一些實施方案中,所述步驟(2)反應過程中,第一寡核苷酸引物和第二寡核苷酸引物在dna聚合酶作用下互補延伸產生的延伸產物是index-panel長引物,所述index-panel長引物從5’端至3’端依次包含測序接頭序列-標簽序列-測序引物序列-基因特異性引物序列。
101、在一些實施方案中,所述反應體系中還包括緩沖成分。在一些實施方案中,所述緩沖成分是tris、tris-hcl、tris堿或hepes中的一種或多種,優選tris。
102、在一些實施方案中,所述反應體系中還包括金屬鹽。在一些實施方案中,所述金屬鹽是mg2+鹽,優選mgcl2。在一些實施方案中,所述金屬鹽是mg2+鹽,以及k+鹽、mn2+鹽、cs+鹽、na+鹽和ca2+鹽中的一種或多種。
103、在一些實施方案中,所述反應體系中還包含dntp。
104、在一些實施方案中,所述反應體系中還包含本領域公知的其它能夠幫助dna聚合酶、核糖核酸內切酶發揮作用的組分,例如甘油。
105、在一些實施方案中,所述反應體系中還包含表面活性劑,例如陰離子表面活性劑、陽離子表面活性劑和非離子表面活性劑中的一種或多種。
106、在一些實施方案中,所述步驟(4)的pcr擴增包括一個或多個循環(例如20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40個)的變性、退火和延伸;優選地,所述pcr擴增包括預變性以及多個循環(例如20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40個)的變性、退火和延伸。
107、在一些實施方案中,所述變性是高溫變性,所述高溫變性是至少90℃高溫變性,例如90℃、91℃、92℃、93℃、94℃和95℃高溫變性。
108、在一些實施方案中,所述變性同時實現:(1)使樣本dna由雙鏈變性為單鏈;(2)使rnase?h2蛋白失活。
109、在一些實施方案中,所述pcr擴增是一輪pcr擴增。
110、在一些實施方案中,所述pcr擴增的條件可以是本領域一般技術人員已知的任意常規pcr擴增條件。
111、在一些實施方案中,所述方法還包括步驟(5),對樣本核酸的擴增產物進行純化。
112、在一些實施方案中,所述純化采用磁珠法、高鹽沉淀法、離心柱法或酚氯仿抽提法,優選磁珠法。
113、本發明的第四方面提供一種寡核苷酸引物,所述寡核苷酸從5’端至3’端依次包含測序接頭序列-標簽序列-測序引物序列-基因特異性引物序列。
114、本發明的第五方面提供一種寡核苷酸組合,所述寡核苷酸組合包含第一寡核苷酸引物、第三寡核苷酸引物和橋式引物,所述第一寡核苷酸引物從5’端至3’端依次包含測序接頭序列、標簽序列和測序引物序列,所述第三寡核苷酸引物從5’端至3’端依次包含通用序列和基因特異性引物序列,所述橋式引物從5’端至3’端依次包括通用序列的反向互補序列和測序引物的反向互補序列。
115、在一些實施方案中,所述標簽序列是用于區分不同樣本的隨機序列。在一些實施方案中,所述標簽序列為至少3個核苷酸,例如4-12個核苷酸,優選6-8個寡核苷酸,例如8個核苷酸。
116、在一些實施方案中,所述基因特異性引物序列是根據待測dna樣本的目標片段設計的特異性引物序列。例如,所述基因特異性引物序列包含至少3個核苷酸,例如3-50個核苷酸,例如3個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、18個、20個、22個、25個、26個、28個、30個、32個、35個、38個、40個、42個、45個、48個和50個核苷酸。
117、在一些實施方案中,所述通用序列的反向互補序列是指與通用序列部分或全部反向互補的序列,所述測序引物的反向互補序列是指與測序引物部分或全部反向互補的序列。
118、在一些實施方案中,所述第三寡核苷酸引物的5’末端含有或不含有磷酸化修飾。
119、在一些實施方案中,所述橋式引物的3’末端含有封閉修飾,其作用是阻止dntp添加至橋式引物的3’末端進行延伸。在一些實施方案中,所述封閉修飾是3’磷酸化修飾或間臂修飾;優選地,所述間臂修飾是spacer?c3修飾、spacer?c6修飾、spacer?c9修飾、dspacer修飾或pc-linker修飾。
120、在一些實施方案中,所述通用序列是隨機序列,且所述通用序列不和所述測序接頭序列、所述標簽序列和/或所述測序引物序列相同或互補配對。
121、在一些實施方案中,所述通用序列是固定序列,其作用在于通過和橋式引物互補使得第一寡核苷酸引物與第三寡核苷酸引物連接,且所述通用序列不和所述測序接頭序列、所述標簽序列和/或所述測序引物序列相同或互補配對。
122、在一些實施方案中,所述通用序列不和目的基因序列相同或互補配對。
123、在一些實施方案中,所述通用序列的堿基組成平衡。
124、在一些實施方案中,所述通用序列的長度為5-200bp,例如5bp、6bp、7bp、8bp、9bp、10bp、15bp、20bp、25bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、120bp、150bp、160bp、180bp和200bp。
125、在一些實施方案中,所述第一寡核苷酸引物包括至少一對上游第一寡核苷酸引物和下游第一寡核苷酸引物。
126、在一些實施方案中,所述上游第一寡核苷酸引物從5’端至3’端依次包含上游測序接頭序列、上游標簽序列和上游測序引物序列,所述下游第一寡核苷酸引物從5’端至3’端依次包含下游測序接頭序列、下游標簽序列和下游測序引物序列。
127、在一些實施方案中,所述上游第一寡核苷酸引物不包含(上游)標簽序列,和/或,所述下游第一寡核苷酸引物不包含(下游)標簽序列。
128、在一些實施方案中,所述測序接頭序列是當前或將來測序平臺(包括但不限于iontorrent平臺、illumina平臺和華大平臺mgi)使用的測序基質相關序列。
129、在一些實施方案中,所述測序接頭序列包括上游測序接頭序列和下游測序接頭序列。
130、在一些實施方案中,所述上游測序接頭序列是illumina平臺的p5接頭序列,下游測序接頭序列illumina平臺的p7接頭序列;反之亦然。
131、在一些實施方案中,所述上游測序接頭序列是iontorrent平臺的p1銜接頭序列,所述下游測序接頭序列是ion?torrent平臺的a銜接頭序列;反之亦然。
132、在一些實施方案中,所述上游測序接頭序列是mgi平臺的單端標簽建庫上游夾板序列,所述下游測序接頭序列是mgi平臺的單端標簽建庫下游夾板序列;反之亦然。在一些實施方案中,所述上游測序接頭序列是mgi平臺的雙端標簽建庫上游夾板序列,所述下游測序接頭序列是mgi平臺的雙端標簽建庫下游夾板序列;反之亦然。
133、在一些實施方案中,所述上游第一寡核苷酸引物是illumina平臺的i5引物,所述下游第一寡核苷酸引物是illumina平臺的i7引物;反之亦然。
134、在一些實施方案中,所述第三寡核苷酸引物包括至少一對上游第三寡核苷酸引物和下游第三寡核苷酸引物。
135、在一些實施方案中,所述上游第三寡核苷酸引物從5’端至3’端依次包含上游通用序列和基因特異性上游引物序列。
136、在一些實施方案中,所述下游第三寡核苷酸引物從5’端至3’端依次包含下游通用序列和基因特異性下游引物序列。
137、在一些實施方案中,所述橋式引物包括至少一對上游橋式引物和下游橋式引物。
138、在一些實施方案中,所述上游橋式引物從5’端至3’端依次包括上游通用序列的反向互補序列和上游測序引物的反向互補序列。
139、在一些實施方案中,所述下游橋式引物從5’端至3’端依次包括下游通用序列的反向互補序列和下游測序引物的反向互補序列。
140、在一些實施方案中,所述上游測序引物是truseq文庫結構的測序引物1,所述下游測序引物是truseq文庫結構的測序引物2;反之亦然。
141、在一些實施方案中,所述上游測序引物是nextera文庫結構的測序引物1,所述下游測序引物是nextera文庫結構的測序引物2;反之亦然。
142、在一些實施方案中,所述上游測序引物是truseq文庫結構的測序引物1,所述下游測序引物是nextera文庫結構的測序引物2;反之亦然。
143、在一些實施方案中,所述上游測序引物是nextera文庫結構的測序引物1,所述下游測序引物是truseq文庫結構的測序引物2;反之亦然。
144、本發明的第六方面提供一種組合物,所述組合物包含dna聚合酶、t4?dna連接酶、atp、dntp、緩沖成分、金屬鹽和引物組合;所述引物組合包含第五方面所述的第一寡核苷酸引物、第三寡核苷酸引物和橋式引物。
145、在一些實施方案中,所述第一寡核苷酸引物、所述第三寡核苷酸引物和所述橋式引物各自分別以單鏈形式存在于所述組合物中。在一些實施方案中,所述第一寡核苷酸引物和所述橋式引物通過所述測序引物序列互補,且所述第三寡核苷酸引物和所述橋式引物通過所述通用引物序列互補形成三引物的雙鏈互補結構的形式存在于所述組合物中。
146、在一些實施方案中,所述第一寡核苷酸引物包含至少一對第四方面所述的上游第一寡核苷酸引物和下游第一寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
147、在一些實施方案中,每一對所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區別在于標簽序列不相同。
148、在一些實施方案中,所述第三寡核苷酸引物包含至少一對第五方面所述的上游第三寡核苷酸引物和下游第三寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
149、在一些實施方案中,每一對所述上游第三寡核苷酸引物和所述下游第三寡核苷酸引物之間的區別在于基因特異性引物序列不相同。
150、在一些實施方案中,所述橋式引物包含至少一對第五方面所述的上游橋式引物和第四方面所述的下游橋式引物,例如至少1對或2對。
151、在一些實施方案中,每一對所述上游橋式引物和所述下游橋式引物的區別在于測序引物不同。
152、在一些實施方案中,所述組合物還包括dna樣本。
153、在一些實施方案中,所述dna樣本是gdna或cdna。
154、在一些實施方案中,所述第三寡核苷酸引物的5’末端含有或不含有磷酸化修飾。
155、在一些實施方案中,當所述第三寡核苷酸引物的5’末端不含有磷酸化修飾時,且所述組合物中還包括能夠使第三寡核苷酸引物的5’末端產生磷酸化修飾的物質,例如t4多核苷酸激酶(t4?polynucleotide?kinase,t4?pnk)。
156、在一些實施方案中,所述第一寡核苷酸引物和所述第三寡核苷酸引物的質量比或摩爾比是n:1,所述n是大于或等于1且小于或等于5的常數,例如1、2、3、4和5。
157、在一些實施方案中,所述dna聚合酶是本領域已知的任意耐熱dna聚合酶。在一些實施方案中,所述耐熱dna聚合酶是taq?dna聚合酶、pfu?dna聚合酶、vent?dna聚合酶、deepvent?dna聚合酶和kod?dna聚合酶中的一種或多種。
158、在一些實施方案中,所述緩沖成分是tris、tris-hcl、tris堿或hepes中的一種或多種,優選tris。
159、在一些實施方案中,所述金屬鹽是mg2+鹽,優選mgcl2。
160、在一些實施方案中,所述金屬鹽是mg2+鹽,以及k+鹽、mn2+鹽、cs+鹽、na+鹽和ca2+鹽中的一種或多種。
161、在一些實施方案中,所述組合物中還包含其它能夠幫助組合物中的各組分例如酶發揮作用的物質,例如甘油。
162、在一些實施方案中,所述組合物中還包含表面活性劑,例如陰離子表面活性劑、陽離子表面活性劑和非離子表面活性劑中的一種或多種。
163、本發明的第七方面提供一種多重擴增子建庫方法,所述方法包括如下步驟:
164、(1)配制包含至少一對第一寡核苷酸引物、至少一對第三寡核苷酸引物、至少一對橋式引物和樣本核酸的反應體系;其中,所述第一寡核苷酸引物從5’端至3’端依次包含測序接頭序列、標簽序列和測序引物序列,所述第三寡核苷酸引物從5’端至3’端依次包含通用序列和基因特異性引物序列,所述橋式引物從5’端至3’端依次包括通用序列的反向互補序列和測序引物的反向互補序列;
165、(2)使所述第一寡核苷酸引物的3’端和所述橋式引物的3’端反向互補配對,使所述第三寡核苷酸引物的5’端和所述橋式引物的5’端反向互補配對,連接所述第一寡核苷酸引物和所述第三寡核苷酸引物獲得連接產物;
166、(3)以步驟(2)所述的連接產物作為引物對所述樣本核酸進行pcr擴增。
167、在一些實施方案中,所述標簽序列是用于區分不同樣本的隨機序列。在一些實施方案中,所述標簽序列為至少3個核苷酸,例如4-12個核苷酸,優選6-8個核苷酸,例如8個。
168、在一些實施方案中,所述基因特異性引物序列是根據待測dna樣本的目標片段設計的特異性引物序列。例如,所述基因特異性引物序列包含至少3個核苷酸,例如3-50個核苷酸,例如3個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、18個、20個、22個、25個、26個、28個、30個、32個、35個、38個、40個、42個、45個、48個和50個核苷酸。
169、在一些實施方案中,所述通用序列的反向互補序列是指與通用序列部分或全部反向互補的序列,所述測序引物的反向互補序列是指與測序引物部分或全部反向互補的序列。
170、在一些實施方案中,所述第三寡核苷酸引物的5’末端含有或不含有磷酸化修飾。
171、在一些實施方案中,所述橋式引物的3’末端含有封閉修飾,其作用是阻止dntp添加至橋式引物的3’末端進行延伸。在一些實施方案中,所述封閉修飾是3’磷酸化修飾或間臂修飾;優選地,所述間臂修飾是spacer?c3修飾、spacer?c6修飾、spacer?c9修飾、dspacer修飾或pc-linker修飾。
172、在一些實施方案中,所述通用序列是隨機序列,且所述通用序列不和所述測序接頭序列、所述標簽序列和/或所述測序引物序列相同或互補配對。
173、在一些實施方案中,所述通用序列是固定序列,其作用在于通過和橋式引物互補使得第一寡核苷酸引物與第三寡核苷酸引物連接,且所述通用序列不和所述測序接頭序列、所述標簽序列和/或所述測序引物序列相同或互補配對。
174、在一些實施方案中,所述通用序列不和目的基因序列相同或互補配對。
175、在一些實施方案中,所述通用序列的堿基組成平衡。
176、在一些實施方案中,所述通用序列的長度為10-200bp,例如10bp、15bp、20bp、25bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、120bp、150bp、160bp、180bp和200bp。
177、在一些實施方案中,所述至少一對第一寡核苷酸引物包括至少一對上游第一寡核苷酸引物和下游第一寡核苷酸引物。
178、在一些實施方案中,所述上游第一寡核苷酸引物從5’端至3’端依次包含上游測序接頭序列、上游標簽序列和上游測序引物序列,所述下游第一寡核苷酸引物從5’端至3’端依次包含下游測序接頭序列、下游標簽序列和下游測序引物序列。
179、在一些實施方案中,所述上游第一寡核苷酸引物不包含(上游)標簽序列,和/或,所述下游第一寡核苷酸引物不包含(下游)標簽序列。
180、在一些實施方案中,所述測序接頭序列是當前或將來測序平臺(包括但不限于iontorrent平臺、illumina平臺和華大平臺mgi)使用的測序基質相關序列。
181、在一些實施方案中,所述至少一對測序接頭序列包括至少一對上游測序接頭序列和下游測序接頭序列。
182、在一些實施方案中,所述上游測序接頭序列是illumina平臺的p5接頭序列,下游測序接頭序列illumina平臺的p7接頭序列;反之亦然。
183、在一些實施方案中,所述上游測序接頭序列是iontorrent平臺的p1銜接頭序列,所述下游測序接頭序列是ion?torrent平臺的a銜接頭序列;反之亦然。
184、在一些實施方案中,所述上游測序接頭序列是mgi平臺的單端標簽建庫上游夾板序列,所述下游測序接頭序列是mgi平臺的單端標簽建庫下游夾板序列;反之亦然。在一些實施方案中,所述上游測序接頭序列是mgi平臺的雙端標簽建庫上游夾板序列,所述下游測序接頭序列是mgi平臺的雙端標簽建庫下游夾板序列;反之亦然。
185、在一些實施方案中,所述上游第一寡核苷酸引物是illumina平臺的i5引物,所述下游第一寡核苷酸引物是illumina平臺的i7引物;反之亦然。
186、在一些實施方案中,所述第三寡核苷酸引物包括至少一對上游第三寡核苷酸引物和下游第三寡核苷酸引物。
187、在一些實施方案中,所述上游第三寡核苷酸引物從5’端至3’端依次包含上游通用序列和基因特異性上游引物序列。
188、在一些實施方案中,所述下游第三寡核苷酸引物從5’端至3’端依次包含下游通用序列和基因特異性下游引物序列。
189、在一些實施方案中,所述至少一對橋式引物包括至少一對上游橋式引物和下游橋式引物。
190、在一些實施方案中,所述上游橋式引物從5’端至3’端依次包括上游通用序列的反向互補序列和上游測序引物的反向互補序列。
191、在一些實施方案中,所述下游橋式引物從5’端至3’端依次包括下游通用序列的反向互補序列和下游測序引物的反向互補序列。
192、在一些實施方案中,所述上游測序引物是truseq文庫結構的測序引物1,所述下游測序引物是truseq文庫結構的測序引物2;反之亦然。
193、在一些實施方案中,所述上游測序引物是nextera文庫結構的測序引物1,所述下游測序引物是nextera文庫結構的測序引物2;反之亦然。
194、在一些實施方案中,所述上游測序引物是truseq文庫結構的測序引物1,所述下游測序引物是nextera文庫結構的測序引物2;反之亦然。
195、在一些實施方案中,所述上游測序引物是nextera文庫結構的測序引物1,所述下游測序引物是truseq文庫結構的測序引物2;反之亦然。
196、在一些實施方案中,所述至少一對第一寡核苷酸引物包含至少一對所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
197、在一些實施方案中,每一對所述上游第一寡核苷酸引物和所述下游第一寡核苷酸引物之間的區別在于標簽序列不相同。
198、在一些實施方案中,所述至少一對第三寡核苷酸引物包含至少一對所述上游第三寡核苷酸引物和所述下游第三寡核苷酸引物,例如至少1對、5對、10對、20對、50對、100對、200對、300對和500對,包括但不限于1-1000之間的任意自然數。
199、在一些實施方案中,每一對所述上游第三寡核苷酸引物和所述下游第三寡核苷酸引物之間的區別在于基因特異性引物序列不相同。
200、在一些實施方案中,所述至少一對橋式引物包含至少一對所述上游橋式引物和所述下游橋式引物,例如至少1對或2對。
201、在一些實施方案中,每一對所述上游橋式引物和所述下游橋式引物的區別在于測序引物不同。
202、在一些實施方案中,所述步驟(2)的反應溫度是20-50℃,優選25-45℃,例如25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃或45℃。
203、在一些實施方案中,所述步驟(2)的反應時間是1-60分鐘,優選5-40分鐘,例如5分鐘、6分鐘、7分鐘、8分鐘、9分鐘、10分鐘、11分鐘、12分鐘、13分鐘、14分鐘、15分鐘、16分鐘、17分鐘、18分鐘、19分鐘、20分鐘、21分鐘、22分鐘、23分鐘、24分鐘、25分鐘、26分鐘、27分鐘、28分鐘、29分鐘、30分鐘、31分鐘、32分鐘、33分鐘、34分鐘、35分鐘、36分鐘、37分鐘、38分鐘、39分鐘或40分鐘。
204、在一些實施方案中,所述步驟(2)的反應條件是20-50℃孵育1-60分鐘、20-50℃孵育5-40分鐘、25-45℃孵育5-40分鐘、25-40℃孵育5-40分鐘、25-40℃孵育5-35分鐘、25-35℃孵育5-35分鐘、25-35℃孵育5-30分鐘或37℃孵育5-30分鐘,包括但不限于前述孵育溫度和孵育時間的任意組合。
205、在一些實施方案中,所述反應體系中還包括dna連接酶,優選t4?dna連接酶。在一些實施方案中,所述步驟(2)的孵育過程中,所述第一寡核苷酸引物和所述第三寡核苷酸引物在橋式引物和t4?dna連接酶的作用下產生的連接產物是index-t4-panel長引物,所述index-t4-panel長引物從5’端至3’端依次包括接頭序列-標簽序列-測序引物序列-通用序列-基因特異性引物序列。
206、在一些實施方案中,所述樣本核酸是dna,例如,所述dna是gdna或cdna。
207、在一些實施方案中,所述第三寡核苷酸引物的5’末端含有或不含有磷酸化修飾。
208、在一些實施方案中,當所述第三寡核苷酸引物的5’末端不含有磷酸化修飾時,所述組合物中還包括能夠使第三寡核苷酸引物的5’末端產生磷酸化修飾的物質,例如t4多核苷酸激酶(t4?polynucleotide?kinase,t4?pnk)。
209、在一些實施方案中,所述第一寡核苷酸引物和所述第三寡核苷酸引物的質量比或摩爾比是n:1,所述n是大于或等于1且小于或等于5的常數,例如1、2、3、4和5。
210、在一些實施方案中,所述反應體系中還包括dna聚合酶。在一些實施方案中,所述dna聚合酶是本領域已知的任意耐熱dna聚合酶。在一些實施方案中,所述耐熱dna聚合酶是taq?dna聚合酶、pfu?dna聚合酶、vent?dna聚合酶、deep?vent?dna聚合酶和kod?dna聚合酶中的一種或多種。
211、在一些實施方案中,所述反應體系中還包括緩沖成分。在一些實施方案中,所述緩沖成分是tris、tris-hcl、tris堿或hepes中的一種或多種,優選tris。
212、在一些實施方案中,所述反應體系中還包括金屬鹽。在一些實施方案中,所述金屬鹽是mg2+鹽,優選mgcl2。在一些實施方案中,所述金屬鹽是mg2+鹽,以及k+鹽、mn2+鹽、cs+鹽、na+鹽和ca2+鹽中的一種或多種。
213、在一些實施方案中,所述反應體系中還包含dntp。
214、在一些實施方案中,所述反應體系中還包含本領域公知的其它能夠幫助dna聚合酶、核糖核酸內切酶發揮作用的組分,例如甘油。
215、在一些實施方案中,所述反應體系中還包含表面活性劑,例如陰離子表面活性劑、陽離子表面活性劑和非離子表面活性劑中的一種或多種。
216、在一些實施方案中,所述pcr擴增包括一個或多個(例如20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40個循環的變性、退火和延伸;優選地,所述pcr擴增包括預變性以及多個循環(例如20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39和40個)的變性、退火和延伸。
217、在一些實施方案中,所述pcr擴增是一輪pcr擴增。
218、在一些實施方案中,所述pcr擴增的條件可以是本領域一般技術人員已知的任意常規pcr擴增條件。
219、在一些實施方案中,所述方法還包括步驟(4),對樣本核酸的擴增產物進行純化。
220、在一些實施方案中,所述純化采用磁珠法、高鹽沉淀法、離心柱法或酚氯仿抽提法,優選磁珠法。
221、本發明的第八方面提供一種寡核苷酸引物,所述寡核苷酸引物從5’端至3’端依次包括接頭序列-標簽序列-測序引物序列-通用序列-基因特異性引物序列。
222、本發明的第九方面提供第三方面或第七方面的方法在多重擴增子建庫中的應用。
223、在本發明中,序列及其反向互補序列之間可以是完全互補,也可以是部分互補,只要能夠實現其后續的延伸和擴增即可。
224、“完全互補”是指該序列的全部核苷酸堿基能夠與相應的反向互補序列的全部核苷酸堿基配對。
225、“部分互補”是指該序列的連續序列中至少30%(例如40%、50%、60%、70%、80%、90%、95%或99%),但不是全部的堿基與相應的反向互補序列的全部連續序列中相同數目的堿基雜交。
226、本發明的組合物用于多重擴增體系。