制備rna探針的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及核苷酸序列,特別是制備RNA探針的方法及裝置,以及能夠用以捕獲 特定區(qū)域的試劑盒。
【背景技術(shù)】
[0002] 目標(biāo)序列捕獲實(shí)驗(yàn)的主要用途之一是研究導(dǎo)致疾病發(fā)生的遺傳變異。全外顯子捕 獲技術(shù)的出現(xiàn),極大的推動(dòng)人們對(duì)基因和疾病關(guān)系的研究。根據(jù)統(tǒng)計(jì),大概85%的單基因疾 病突變位點(diǎn)位于外顯子區(qū)域,與全基因組重測(cè)序相比,相同成本下,覆蓋度更深、數(shù)據(jù)準(zhǔn)確 性更高,更加簡(jiǎn)便、經(jīng)濟(jì)、高效。它也可用于尋找復(fù)雜疾病如癌癥、糖尿病、肥胖癥的致病基 因和易感基因等的研究。在全基因組測(cè)序成本大幅下降之前,捕獲測(cè)序的方法仍然是疾病 等領(lǐng)域研究的熱門測(cè)序法,年需求量巨大。
[0003] 2009年,基因組定向捕獲工具的出現(xiàn),讓外顯子組的捕獲成為可能。基于雜交的序 列捕獲技術(shù)作為低成本高通量對(duì)基因組連續(xù)或不連續(xù)候選區(qū)域進(jìn)行研究的技術(shù),在過(guò)去的 三年中已經(jīng)被廣泛用于疾病相關(guān)研究,其不僅費(fèi)用更低,數(shù)據(jù)的闡釋也更為簡(jiǎn)單?;陔s交 的序列捕獲技術(shù)作為低成本高通量對(duì)基因組連續(xù)或不連續(xù)候選區(qū)域進(jìn)行研究的技術(shù),在過(guò) 去的幾年中已經(jīng)被廣泛用于疾病相關(guān)研究。目前,Agilent公司的SureSelect液相探針、 Roche NimbleGen的固相芯片以及Roche NimbleGen的EZ液相探針是市場(chǎng)上最成熟的序 列捕獲試劑,幾乎占領(lǐng)了 90%以上的基于雜交的序列捕獲技術(shù)市場(chǎng)。由于序列捕獲試劑在 生命科學(xué)、基因組學(xué)及醫(yī)學(xué)方面的火爆市場(chǎng),從2010年,也有幾家其他機(jī)構(gòu)在研發(fā)和推出 序列捕獲試劑,例如,Illumina在2010年推出了其TruSeq捕獲試劑,Life Techonologies 公司2011年秋也將推出了其TargetSeq序列捕獲試劑,還有一些小的公司或研究機(jī)構(gòu)正在 研發(fā)序列捕獲芯片或試劑。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明一方面提供一種制備RNA探針的方法,該方法包括:依據(jù)目標(biāo)區(qū)域的參考 序列獲取多個(gè)DNA片段,所述目標(biāo)區(qū)域?yàn)榛蚪M的一部分或是整個(gè)基因組,所述DNA片段的 全部覆蓋所述目標(biāo)區(qū)域的一次或多次,所述DNA片段長(zhǎng)度為25-250nt ;修飾所述DNA片段, 使得每個(gè)DNA的一個(gè)末端帶有至少一個(gè)啟動(dòng)子、另一個(gè)末端帶有一段序列(沁" ;擴(kuò)增修飾 后的DNA片段,獲得DNA擴(kuò)增產(chǎn)物;轉(zhuǎn)錄所述DNA擴(kuò)增產(chǎn)物,獲得多個(gè)RNA片段,所述多個(gè) RNA片段構(gòu)成所述RNA探針;其中,N為A、T、C或G,m為N的個(gè)數(shù),4〈m〈20。
[0005] 本發(fā)明另一方面提供一種試劑盒,其包括利用本發(fā)明一方面的方法制備得的RNA 探針,所述RNA探針游離于溶液中,所述RNA探針能夠特異性識(shí)別人全外顯子組。
[0006] 本發(fā)明的再一方面提供本發(fā)明一方面的試劑盒在捕獲外顯子區(qū)域中的用途。
[0007] 本發(fā)明的又一方面提供一種制備RNA探針的裝置,該裝置能夠用以執(zhí)行完成本 發(fā)明一方面的RNA探針制備方法的所有或者部分步驟,該裝置包括:DNA片段獲取單元, 用于依據(jù)目標(biāo)區(qū)域的參考序列獲取多個(gè)DNA片段,所述目標(biāo)區(qū)域?yàn)榛蚪M的一部分或是 整個(gè)基因組,所述DNA片段的全部覆蓋所述目標(biāo)區(qū)域的一次或多次,所述DNA片段長(zhǎng)度為 25-250nt ;修飾單元,與所述DNA片段獲取單元連接,用于修飾所述DNA片段,獲得修飾后的 DNA片段使得每個(gè)DNA的一個(gè)末端帶有至少一個(gè)啟動(dòng)子、另一個(gè)末端帶有一段序列(N)",N 為A、T、C或G,m為N的個(gè)數(shù),4〈m〈20 ;擴(kuò)增單元,與所述修飾單元相連,用于擴(kuò)增所述修飾 后的DNA片段,獲得DNA擴(kuò)增產(chǎn)物;轉(zhuǎn)錄單元,與所述擴(kuò)增單元相連,用于轉(zhuǎn)錄所述DNA擴(kuò)增 產(chǎn)物,獲得多個(gè)RNA片段,所述多個(gè)RNA片段構(gòu)成所述RNA探針。
[0008] 根據(jù)本發(fā)明提供的制備RNA探針的方法,和或制備RNA探針的裝置,和/或包含能 夠捕獲全外顯子組RNA探針的試劑盒,能夠簡(jiǎn)單方便的獲得RNA探針、RNA液相探針或者獲 得能夠捕獲目標(biāo)區(qū)域的的試劑盒,目標(biāo)區(qū)域可以使人類全外顯子區(qū)域,人類基因組的其他 區(qū)域,如疾病相關(guān)區(qū)域、全染色體、高變區(qū)域等,或者是其它基因組物種的與人類外顯子裙 部或部分區(qū)域序列相似度高的區(qū)域,或者同一環(huán)境中混合物種樣本恒變區(qū)等相似區(qū)域。利 用本發(fā)明的RNA探針制備方法也能夠方便的獲得相對(duì)較長(zhǎng)的RNA探針序列,能夠高特異性 捕獲目標(biāo)區(qū)域。也能用于其它物種的相似區(qū)域的捕獲。利用本發(fā)明的RNA探針制備方法或 裝置制備的探針捕獲區(qū)域可控、制備成本較低,所需時(shí)間較短。
【附圖說(shuō)明】
[0009] 本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施方式的描述中將 變得明顯和容易理解,其中:
[0010] 圖1是本發(fā)明的一個(gè)【具體實(shí)施方式】中的制備RNA探針的裝置示意圖;
[0011] 圖2是本發(fā)明的一個(gè)【具體實(shí)施方式】中的使用Agilent-51M的測(cè)序結(jié)果,其中,A為 堿基累積深度圖,B為堿基測(cè)序深度分布,C為染色體深度覆蓋度圖;
[0012] 圖3是本發(fā)明的一個(gè)【具體實(shí)施方式】中的使用Nimblegen-70M的測(cè)序結(jié)果,其中A 為堿基累積深度圖,B為堿基測(cè)序深度分布圖,C為染色體深度覆蓋度圖;
[0013] 圖4是本發(fā)明的一個(gè)【具體實(shí)施方式】中的使用本發(fā)明的試劑盒BGI kit的測(cè)序結(jié) 果,其中,A為堿基累積深度圖,B為堿基測(cè)序深度分布圖,C為染色體深度覆蓋度圖。
【具體實(shí)施方式】
[0014] 根據(jù)本發(fā)明的一個(gè)實(shí)施方式,提供了一種制備RNA探針的方法,該方法包括以下 步驟:
[0015] 步驟一:依據(jù)目標(biāo)區(qū)域的參考序列獲取多個(gè)DNA片段。
[0016] 依據(jù)目標(biāo)區(qū)域的參考序列獲取多個(gè)DNA片段,所述目標(biāo)區(qū)域?yàn)榛蚪M的一部分或 者整個(gè)基因組,所述DNA片段的全部覆蓋所述目標(biāo)區(qū)域的一次或多次,所述DNA片段長(zhǎng)度為 25-250nt。參考序列為已知序列,并且參考序列上的各個(gè)堿基或核苷酸有位置編號(hào),用于 其它片段序列上的堿基或核苷酸的參考定位,參考序列可以從公開(kāi)網(wǎng)站或者他人公開(kāi)的資 料中獲得,比如從NCBI數(shù)據(jù)庫(kù)獲得人的參考基因組序列,也可以是自己測(cè)定和/或組裝獲 得的序列確定的基因組或者基因組的部分片段序列。在本發(fā)明的一個(gè)【具體實(shí)施方式】中,所 說(shuō)的依據(jù)目標(biāo)區(qū)域的參考序列獲取多個(gè)DNA片段包括:確定所述目標(biāo)區(qū)域的參考序列,從 所述參考序列的一端開(kāi)始,在所述參考序列上依次獲取DNA片段直至所述參考序列的另一 端,所述DNA片段之間可以完全重疊、部分重疊或完全不重疊。在本發(fā)明的一個(gè)具體實(shí)施方 式中,可以依據(jù)目標(biāo)區(qū)域在參考基因組上的位置獲取所述目標(biāo)區(qū)域的參考序列,可以預(yù)先 設(shè)定DNA片段的長(zhǎng)度為一個(gè)定值,比如120nt,從所述參考序列的第一個(gè)核苷酸開(kāi)始拷貝所 述參考序列獲取第一條DNA片段,接著從所述參考序列的第二個(gè)核苷酸開(kāi)始拷貝所述參考 序列獲取第二條DNA片段,這樣依次獲取后續(xù)DNA片段直至第K條DNA片段,第K條DNA片 段的一端超出所述參考序列,其中,K為所述DNA片段的總條數(shù),這樣實(shí)際上第K條DNA片 段的長(zhǎng)度為119nt。在本發(fā)明的一個(gè)【具體實(shí)施方式】中,在獲得K條DNA片段后,對(duì)DNA片段 進(jìn)行篩選,以獲得GC含量在40-50%的DNA片段,這樣能使最終的一組RNA探針的GC含量 都在40-50%,利于這組RNA探針在同一反應(yīng)體系和/或同一反應(yīng)條件下進(jìn)行捕獲和/或洗 脫。在本發(fā)明的一個(gè)【具體實(shí)施方式】中,對(duì)DNA片段的篩選還包括,將DNA片段比回到目標(biāo)區(qū) 域參考序列上,以獲得在參考序列上具有唯一比對(duì)位置的DNA片段,這樣能夠增強(qiáng)最終獲 得的一組RNA探針的特異性。
[0017] 本發(fā)明的該步驟的實(shí)施方式可以編寫成程序,借助計(jì)算機(jī)可讀媒介執(zhí)行該程序來(lái) 實(shí)現(xiàn)。
[0018] 步驟二:修飾DNA片段。
[0019] 修飾獲自步驟一的DNA片段,使得每個(gè)DNA片段的一個(gè)末端帶有至少一個(gè)啟動(dòng)子、 另一個(gè)末端帶有一段序列(沁",其中,N為A、T、C或G,m為N的個(gè)數(shù),4〈m〈20。這樣修飾