
本發(fā)明涉及分子生物學(xué)領(lǐng)域,特別涉及應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法。
背景技術(shù):
:端粒是位于真核細(xì)胞線性染色體末端的一小段dna-蛋白質(zhì)復(fù)合體,其作用是保護(hù)染色體dna的末端,避免染色體dna的降解、末端融合以及非正常重組等。在哺乳動(dòng)物細(xì)胞中,端粒dna由ttaggg序列和aatccc序列重復(fù)串聯(lián)組成。由于dna的末端復(fù)制問題,細(xì)胞的每次分裂都伴隨著端粒dna一小段序列的丟失。細(xì)胞的每次分裂都會(huì)伴隨著染色體末端端粒的縮短,細(xì)胞也因此逐漸老化、直至喪失增殖能力而死亡。端粒長度的變化與多種疾病密切相關(guān),如癌癥、早衰綜合征等。因此測量端粒長度能提供與疾病相關(guān)的重要信息。目前測量端粒長度主要是基于qpcr的方法,對(duì)重復(fù)區(qū)段進(jìn)行擴(kuò)增,端粒dna的片段越長,重復(fù)區(qū)段的拷貝數(shù)就多。但是這種方法只能檢測所有染色體端粒重復(fù)區(qū)段長度的大概平均值,無法精確檢測單獨(dú)每一條染色體的端粒長度。而且由于染色體dna其他部分也存在類似端粒dna重復(fù)序列的結(jié)構(gòu),這部分序列也會(huì)影響qpcr對(duì)端粒長度的檢測。從實(shí)驗(yàn)操作上來說,由于qpcr反應(yīng)很容易受到其他條件影響,基于qpcr測量方法的定量結(jié)果穩(wěn)定性不好,如果結(jié)果ct值相差1,會(huì)導(dǎo)致端粒長度測量結(jié)果增加1倍。因此,研發(fā)新的、更準(zhǔn)確的測量端粒dna長度的方法是本領(lǐng)域技術(shù)人員亟需解決的技術(shù)問題。技術(shù)實(shí)現(xiàn)要素:有鑒于此,本發(fā)明提供的應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法,能有效解決當(dāng)前不能獲得端粒dna全長和準(zhǔn)確測量單條染色體端粒dna的技術(shù)缺陷。為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供以下技術(shù)方案:本發(fā)明公開了染色體端粒dna的擴(kuò)增方法,包括下列步驟:1)提取基因組dna;2)將步驟1)的基因組dna進(jìn)行預(yù)處理;3)將步驟2)獲得的預(yù)處理后的基因組dna兩端的末端連接擴(kuò)增接頭,得到帶有擴(kuò)增接頭的基因組dna;4)分別對(duì)步驟3)的帶有擴(kuò)增接頭的基因組dna序列和擴(kuò)增接頭序列設(shè)計(jì)引物對(duì),對(duì)端粒dna進(jìn)行pcr擴(kuò)增。作為優(yōu)選,所述步驟2)的基因組dna進(jìn)行預(yù)處理為將所述基因組dna的兩端進(jìn)行末端修復(fù)。作為優(yōu)選,所述步驟2)基因組dna兩端進(jìn)行末端修復(fù)為將基因組dna片段的末端補(bǔ)平,然后對(duì)基因組dna的5’端進(jìn)行磷酸化,以及將基因組dna片段的3’端添加腺嘌呤da。更為優(yōu)選,所述腺嘌呤da為脫氧腺嘌呤da。作為優(yōu)選,所述步驟3)的擴(kuò)增接頭還包括標(biāo)簽序列。其中,所述步驟3)的擴(kuò)增接頭還包括標(biāo)簽序列,具體為所述擴(kuò)增接頭與所述標(biāo)簽序列重組后的新型擴(kuò)增接頭。所述新型擴(kuò)增接頭除了擴(kuò)增接頭外還包括標(biāo)簽序列。其中,所述擴(kuò)增接頭直接與步驟2)的預(yù)處理后的基因組dna連接,或所述擴(kuò)增接頭與所述標(biāo)簽序列重組后的新型擴(kuò)增接頭與步驟2)的預(yù)處理后的基因組dna連接。其中,所述步驟4)擴(kuò)增得到的端粒dna產(chǎn)物的序列包括端粒dna序列和標(biāo)簽序列。作為優(yōu)選,所述步驟3)的擴(kuò)增接頭的標(biāo)簽序列為與人類基因組dna比對(duì)的evalue大于1的序列,不會(huì)對(duì)后續(xù)分析造成干擾。其中,所述標(biāo)簽序列用于區(qū)分不同人來源的染色體端粒dna。作為優(yōu)選,為了能應(yīng)用于大樣本量的項(xiàng)目,所述步驟3)的擴(kuò)增接頭的標(biāo)簽序列為16個(gè)bp。作為優(yōu)選,所述步驟3)還包括將得到的帶有擴(kuò)增接頭的基因組dna進(jìn)行純化,以便獲得高質(zhì)量的帶有擴(kuò)增接頭的基因組dna。作為優(yōu)選,所述擴(kuò)增接頭為y型接頭、環(huán)狀接頭或線性接頭中的一種。更為優(yōu)選,所述擴(kuò)增接頭為y型接頭。其中,所述y型接頭為形狀像y,根部互補(bǔ),其余部分不互補(bǔ)的dna序列。本發(fā)明還提供了一種染色體端粒dna的擴(kuò)增試劑盒,包括基因組dna提取體系、基因組dna預(yù)處理體系、擴(kuò)增接頭、擴(kuò)增接頭與基因組dna連接體系和端粒dna的pcr體系。其中,所述基因組dna提取體系用于提取人體基因組dna;所述基因組dna預(yù)處理體系用于對(duì)基因組dna的末端進(jìn)行補(bǔ)平,5’端磷酸化和3’端添加腺嘌呤da;所述擴(kuò)增接頭與基因組dna連接體系用于將所述擴(kuò)增接頭連接到所述預(yù)處理后的基因組dna末端;所述端粒dna的pcr體系用于擴(kuò)增基因組dna5’端和擴(kuò)增基因組dna3’端的端粒片段。作為優(yōu)選,所述基因組dna預(yù)處理體系包括基因組dna的末端補(bǔ)平體系、基因組dna的末端磷酸化體系和基因組dna的末端3’端進(jìn)行添加腺嘌呤da體系。作為優(yōu)選,所述基因組dna的末端補(bǔ)齊體系為基因組dna的平末端修復(fù)體系;所述基因組dna的平末端修復(fù)體系包括t4dnapolymerase或/和dna聚合酶i大片段(klenow片段)。作為優(yōu)選,所述基因組dna的末端磷酸化體系包括t4多聚核苷酸激酶。作為優(yōu)選,所述基因組dna片段的3’端進(jìn)行添加腺嘌呤da體系包括klenow(exon-)。作為優(yōu)選,所述擴(kuò)增接頭與基因組dna連接體系包括連接酶。所述連接酶為t4dna連接酶。作為優(yōu)選,所述擴(kuò)增接頭如seqidno.1~seqidno.31所示。其中,所述基因組dna預(yù)處理可以在一個(gè)反應(yīng)中完成,或多個(gè)反應(yīng)中完成。作為優(yōu)選,所述端粒dna的pcr體系的引物對(duì)為基因組dna的5’端非端粒區(qū)的引物和所述擴(kuò)增接頭的引物用于擴(kuò)增基因組dna的5’端端粒,或基因組dna的3’端非端粒區(qū)的引物和所述擴(kuò)增接頭的引物用于擴(kuò)增基因組dna的3’端端粒。其中,所述基因組dna的5’端非端粒區(qū)的引物為5’基因組dna的近端粒區(qū)的非端粒區(qū)引物;所述基因組dna的3’端非端粒區(qū)的引物為3’基因組dna的近端粒區(qū)的非端粒區(qū)引物。其中,所述端粒dna的pcr體系的引物對(duì)包括以下的可能(從5’到3’的單鏈dna):1、擴(kuò)增接頭序列的引物和近5’端的端粒的非端粒區(qū)基因組dna反向互補(bǔ)引物;2、近3’端的端粒的非端粒區(qū)基因組dna引物和擴(kuò)增接頭序列反向互補(bǔ)引物。其中,與所述擴(kuò)增接頭互補(bǔ)配對(duì)的引物和所述近3’端的端粒的非端粒區(qū)基因組dna引物,或近5’端的端粒的非端粒區(qū)基因組dna反向互補(bǔ)引物和擴(kuò)增接頭上的引物的具體長度不做限定。作為優(yōu)選,所述端粒dna的pcr體系包括預(yù)處理后帶有擴(kuò)增接頭的基因組dna、擴(kuò)增端粒dna的pcr引物對(duì)、pcr工具酶、dntp和pcr反應(yīng)緩沖液。所述引物對(duì)由接頭通用pcr引物和端粒dna特異性引物構(gòu)成,所述通用pcr引物如seqidno.32所示,端粒dna特異性引物如seqidno.33~seqidno.35所示。本發(fā)明還公開了應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法,包括下列步驟:1))提取基因組dna片段;2))將步驟1))的基因組dna片段進(jìn)行預(yù)處理;3))步驟2))獲得的預(yù)處理后的基因組dna片段兩端的末端添加擴(kuò)增接頭,得到帶有擴(kuò)增接頭的基因組dna片段;4))分別對(duì)步驟3))的帶有擴(kuò)增接頭的基因組dna片段的基因組dna序列和擴(kuò)增接頭序列設(shè)計(jì)引物對(duì),對(duì)端粒dna進(jìn)行pcr擴(kuò)增;5))將步驟4))的pcr擴(kuò)增的端粒dna構(gòu)建三代測序文庫后,將所述三代測序文庫上機(jī)測序,得到測序數(shù)據(jù)。本發(fā)明還提供了應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的試劑盒,包括基因組dna提取體系、基因組dna預(yù)處理體系、擴(kuò)增接頭、擴(kuò)增接頭與基因組dna連接體系、端粒dna的pcr體系和三代測序文庫構(gòu)建體系。其中,所述三代測序文庫構(gòu)建體系用于構(gòu)建擴(kuò)增的端粒dna進(jìn)行三代測序文庫,綜上所述,本發(fā)明公開了染色體端粒dna的擴(kuò)增方法,該方法能特異性的擴(kuò)增染色體端粒dna的全長,而且,還能通過標(biāo)簽序列區(qū)分不同人的染色體端粒dna,采用不同引物還能擴(kuò)增不同染色體的端粒dna,而且該擴(kuò)增方法步驟簡單,特異性強(qiáng)。本發(fā)明還公開的應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法能同時(shí)測量不同人、不同染色體的端粒dna,所擴(kuò)增的端粒dna全長片段使用3代測序方法能準(zhǔn)確測量端粒dna序列長度。先富集基因組dna的端粒后在測序端粒dna序列,大大提高了測序端粒dna的準(zhǔn)確率和精度,而且還能降低成本。本發(fā)明公開的檢測染色體端粒dna全長的方法能達(dá)到單堿基分辨率,彌補(bǔ)了特異性地準(zhǔn)確測量單條染色體完整端粒dna技術(shù)的空白。附圖說明為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹。圖1示應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法介紹圖;圖2示應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法原理步驟說明圖;圖3示應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法的膠圖,其中序號(hào)1為基因組dna膠圖(m為marker,1、2、3欄為樣品1、樣品2、樣品3的基因組dna)、序號(hào)2為預(yù)處理后基因組dna連接擴(kuò)增接頭的膠圖(m為marker,1、2、3欄為樣品1、2、3中基因組dna連接擴(kuò)增接頭后的dna)、序號(hào)3為端粒dna(m為marker,1、2、3欄為一號(hào)染色體、二號(hào)染色體和七號(hào)染色體端粒dna片段);圖4示nanoporeminion測序的gc含量分析,藍(lán)色線是總的數(shù)據(jù)集,紅色線是篩選過濾后的端粒dna的reads;圖5示nanoporeminion測序的reads的讀長分析,藍(lán)色線是總的數(shù)據(jù)集,紅色線是篩選過濾后的端粒dna的reads;圖6示端粒dna中ttaggg或者其互補(bǔ)序列aatccc重復(fù)出現(xiàn)在reads中的次數(shù);圖7示本發(fā)明的方法與對(duì)比例方法測量端粒dna長度結(jié)果比較圖,其中橫坐標(biāo)chr1、chr2和chr7為300例樣品中一號(hào)染色體、二號(hào)染色體和七號(hào)染色體的端粒dna全長分布;對(duì)比例方法為通過qpcr方法間接測量300例樣品所有染色體端粒dna的平均長度分布。其中,chr1為一號(hào)染色體,chr2為二號(hào)染色體,chr7為七號(hào)染色體。具體實(shí)施方式本發(fā)明公開了應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法,本領(lǐng)域技術(shù)人員可以借鑒本文內(nèi)容,適當(dāng)改進(jìn)工藝參數(shù)實(shí)現(xiàn)。特別需要指出的是,所有類似的替換和改動(dòng)對(duì)本領(lǐng)域技術(shù)人員來說是顯而易見的,它們都被視為包括在本發(fā)明。本發(fā)明的方法及應(yīng)用已經(jīng)通過較佳實(shí)施例進(jìn)行了描述,相關(guān)人員明顯能在不脫離本
發(fā)明內(nèi)容、精神和范圍內(nèi)對(duì)本文所述的方法和應(yīng)用進(jìn)行改動(dòng)或適當(dāng)變更與組合,來實(shí)現(xiàn)和應(yīng)用本發(fā)明技術(shù)。本發(fā)明提供的應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法,其中所用原料及試劑均可由市場購得。實(shí)施例1對(duì)中青年人和老年人的端粒dna進(jìn)行測序,具體方法如下:選取150個(gè)在18~45歲的中青年人,男女各75個(gè);選取150個(gè)60~90歲的老年人,男女各75個(gè)。提取150個(gè)中青年人和150個(gè)老年人組的基因組dna,具體步驟如下:1、提取上述人群中血液的dna,做好標(biāo)記;2、使用試劑盒illustradnaextractionkitphytopure(genucleonrpn-8510)提取高質(zhì)量大片段基因組dna。對(duì)獲取的300例樣品的基因組dna進(jìn)行瓊脂糖凝膠電泳檢測基因組dna,如圖1所示,1、2和3欄為樣品1、2和3基因組dna電泳圖,基因組dna片段基本分布在15k以上。實(shí)施例2對(duì)實(shí)施例1提取的基因組dna處理,具體步驟如下:1、測定實(shí)施例1基因組dna濃度,對(duì)基因組dna片段進(jìn)行末端修復(fù),將基因組dna的末端補(bǔ)平、磷酸化,采用如下基因組dna的末端補(bǔ)平、磷酸化體系(100μl)進(jìn)行基因組dna的末端補(bǔ)平、磷酸化:將以上基因組dna的末端補(bǔ)平、磷酸化體系混合后,22℃反應(yīng)20min,柱式法純化,50-100μlte洗脫,得到混合物1。2、對(duì)步驟1的混合物1獲得的基因組dna片段的3’端進(jìn)行添加da,采用如下加da體系(100μl)進(jìn)行:將以上加da體系完全混合后,置于37℃反應(yīng)20min,柱式法純化后,50-100ulte洗脫,得到基因組dna預(yù)處理后的基因組dna片段。實(shí)施例3對(duì)實(shí)施例2經(jīng)過基因組dna末端修復(fù)、5’端磷酸化和3’端添加腺嘌呤da的基因組dna的末端連接帶有標(biāo)簽序列的擴(kuò)增接頭,其中,標(biāo)簽序列設(shè)于擴(kuò)增接頭中,在本實(shí)施例中,標(biāo)簽序列的長度為16bp,使得擴(kuò)增接頭區(qū)分不同人的端粒dna。擴(kuò)增接頭序列可以為y型、圓環(huán)型、線狀型,本實(shí)施例使用y型擴(kuò)增接頭,實(shí)施例1中150個(gè)中青年人和150個(gè)老年人總共有300個(gè)樣品,分別設(shè)計(jì)300個(gè)標(biāo)簽序列制備的y型擴(kuò)增接頭區(qū)分不同樣品,本實(shí)施例只列舉30個(gè)y型擴(kuò)增接頭。1、y型擴(kuò)增接頭制備方法如下:y型擴(kuò)增接頭由兩條引物退火連接而成,y型擴(kuò)增接頭的引物序列如seqidno.1~seqidno.31所示,引物組合方式如表1所示(擴(kuò)增接頭1由seqidno.1與seqidno.2退火連接而成;擴(kuò)增接頭2由seqidno.1與seqidno.3退火連接而成;擴(kuò)增接頭3由seqidno.1與seqidno.4退火連接而成,以此類推),其中,seqidno.2~seqidno.31的引物5’端需要進(jìn)行磷酸化修飾以提高連接效率,引物使用引物稀釋液(10mmtris-hcl,ph7.5)稀釋至終濃度為100μm。分別將兩個(gè)引物取30μl等體積混合到200μlpcr管中,放置在pcr熱循環(huán)儀中,通過以下程序參數(shù)形成y型接頭:5minutes95℃;5minutes72℃;-0.1℃/sdropdownto20℃,保持5minutes;holdat4℃。表1y型接頭統(tǒng)計(jì)表2、y型擴(kuò)增接頭與基因組dna片段連接方法,具體步驟如下:y型擴(kuò)增接頭使用引物稀釋液(10mmtris-hcl,ph7.5)稀釋至終濃度為1.0μm。使用ultratmligationmodule(nebe7445l)試劑盒進(jìn)行接頭連接,按照試劑盒說明書制備體系;使用移液槍輕微吹打均勻反應(yīng)體系,pcr管短暫離心,把反應(yīng)體系液體收集到管底,并放入pcr熱循環(huán)儀中,開啟熱蓋45℃,20℃反應(yīng)15minutes。圖中2表示基因組dna與y型擴(kuò)增接頭連接后的產(chǎn)物的電泳圖,同樣取了樣品1、2、和3作為電泳圖展示。實(shí)施例4對(duì)實(shí)施例3得到的帶有擴(kuò)增接頭的基因組dna片段進(jìn)行純化,具體步驟如下:使用agencourtampurexp(beckmancoulter,a63881)核酸純化磁珠純化回收接頭連接產(chǎn)物。步驟:取30μlampurexpbeads,放置到新的pcr管中,室溫平衡30minutes以上,加入到上述接頭連接步驟反應(yīng)體系中,使用移液槍輕微吹打均勻,室溫放置10minutes。pcr管放到磁力架上吸附磁珠,等待5minutes后,使用移液槍移去上清,并加入140μl新鮮配置的80%乙醇(使用ddh2o配置),蓋上管蓋并保持在磁力架上,室溫放置10minutes。使用移液槍移去上清。重復(fù)用140μl新鮮配置的80%乙醇清洗磁珠。移去所有乙醇后,打開管蓋,室溫晾干5minutes,揮發(fā)乙醇。pcr管從磁力架上拿下來,加入30μl洗脫液(10mmtris-hcl,ph8.0)吹打均勻,室溫放置10minutes,重新放在磁力架上吸附磁珠,包含純化的接頭連接產(chǎn)物的上清液體移到新的pcr管中,-20℃保存。實(shí)施例5分別在實(shí)施例4所述的基因組dna和所述的擴(kuò)增接頭序列設(shè)計(jì)特異性引物對(duì)端粒dna進(jìn)行pcr擴(kuò)增,具體步驟如下:所述端粒dna的pcr體系包括基因組dna的5’端非端粒區(qū)引物和所述擴(kuò)增接頭的引物用于擴(kuò)增基因組dna的5’端端粒;或,基因組dna的3’端非端粒區(qū)引物和所述擴(kuò)增接頭的引物用于擴(kuò)增基因組dna的3’端端粒。具體來說,在5’到3’方向,pcr擴(kuò)增引物為,所述擴(kuò)增接頭的引物和與近5’端端粒區(qū)的基因組dna反向互補(bǔ)的引物,或在5’到3’方向,近3’端端粒區(qū)的基因組dna引物和與所述擴(kuò)增接頭反向互補(bǔ)的引物。pcr引物對(duì)如seqidno.32~seqidno.35所示,兩個(gè)引物等量混合,使用引物稀釋液(10mmtris-hcl,ph7.5)稀釋至終濃度10μm,組成primermix。pcr引物對(duì)如表2所示。表2pcr引物對(duì)使用gcgenomiclapolymerasemix試劑盒(takara,codeno.639153)擴(kuò)增端粒dna長片段。根據(jù)試劑盒說明配置pcr擴(kuò)增反應(yīng)體系組分。使用移液槍輕微吹打均勻反應(yīng)體系,短暫離心,把擴(kuò)增反應(yīng)體系液體收集到管底,并放入pcr熱循環(huán)儀中,開啟熱蓋105℃,擴(kuò)增反應(yīng)程序參數(shù)如下:s1:95℃for5minutes;s2:95℃for30sec;s3:60℃for30sec;s4:72℃for15minutes;重復(fù)s2~s4:30cycles;s5:72℃for15minutes;s6:holdat4℃。pcr擴(kuò)增產(chǎn)物加入75μlddh2o擴(kuò)充至100μl,然后加入40ulampurexpbeads,如實(shí)施例4操作步驟,純化回收擴(kuò)增產(chǎn)物,最后使用30μl洗脫緩沖液洗脫,獲得高質(zhì)量的帶有擴(kuò)增接頭的基因組dna,將帶有擴(kuò)增接頭的基因組dna進(jìn)行瓊脂糖凝膠電泳檢測,結(jié)果如圖3所示。圖中3是通過染色體1、染色體2和染色體7近染色體端的特異性引物和接頭引物,分別特異性擴(kuò)增染色體1,染色體2和染色體7的全長端粒dna片段。盡管有少許非特異性,但是本發(fā)明方法能夠非常高效和特異地?cái)U(kuò)增染色體端粒dna全長片段。實(shí)施例6nanopore測序文庫構(gòu)建建庫試劑盒用nanopore的試劑盒,1dsequencingkit(sqk-rad002rapidsequencingkit)將實(shí)施例5的帶有擴(kuò)增接頭的基因組dna產(chǎn)物按照nanopore試劑盒的說明書進(jìn)行文庫構(gòu)建。上機(jī)測序及數(shù)據(jù)分析,具體步驟如下:1、按照nanoporeminionsequencer的要求上機(jī)測序:上樣到r9.4/flo-min106flowcell中,經(jīng)過minionmk1b測序儀器檢測。2、按照測序數(shù)據(jù)分析pipeline將測序數(shù)據(jù)轉(zhuǎn)化為fastq格式;3、數(shù)據(jù)分析:a、過濾不包含與所述擴(kuò)增接頭互補(bǔ)配對(duì)的引物和基因組dna上的引物的reads和,與所述基因組dna互補(bǔ)配對(duì)的引物和擴(kuò)增接頭上的引物的reads;b、過濾不包含重復(fù)ttaggg和ccctaarepeats的序列;c、統(tǒng)計(jì)過濾后reads的長度分布;d、輸出分析結(jié)果。其中,fastaq數(shù)據(jù)中的篩選符合條件的reads,篩選條件為同時(shí)有與所述擴(kuò)增接頭互補(bǔ)配對(duì)的引物和基因組dna上的引物的reads和,與所述基因組dna互補(bǔ)配對(duì)的引物和擴(kuò)增接頭上的引物的reads,及同時(shí)序列中具有ttaggg或aatccc重復(fù)序列的reads。通過接頭序列中的barcode,區(qū)分不同人的樣品。另外通過graphmap0.3.1軟件比對(duì)將這些reads對(duì)比到人類近染色體端序列,區(qū)分不同染色體的reads,然后計(jì)算相應(yīng)染色體reads的長度。并做如下的分析。表3nanoporeminion測序總體情況sequence通過質(zhì)檢的端粒dnareadsreads3104125857totalbases269823055197780299readsaveragelength(bp)86927649其中,nanoporeminion測序總體情況對(duì)300例樣品的測序總體情況如表3所示,總共測出310401條序列,其中端粒dnareads數(shù)量為258564條,其中端粒dna的平均長度為8325bp。圖4至圖7為nanoporeminion測序的數(shù)據(jù)分析,圖4示全部reads中g(shù)c含量統(tǒng)計(jì)圖,其中,藍(lán)色線是總的數(shù)據(jù)集,紅色線是篩選過濾后的端粒dna測序reads,篩選過濾的條件為:reads兩端分別包含與所述擴(kuò)增接頭互補(bǔ)配對(duì)的引物和基因組dna上的引物和,與所述基因組dna互補(bǔ)配對(duì)的引物和擴(kuò)增接頭上的引物,另外reads中包含ttaggg或ccctaa重復(fù)序列。本發(fā)明方法得到的端粒dnareads中g(shù)c含量約為62.5%,符合端粒dna的堿基組成。本發(fā)明檢測端粒dna長度的結(jié)果如表4所示。表4端粒dna長度的結(jié)果統(tǒng)計(jì)對(duì)實(shí)施例6中圖7和表4的說明如下:中青年組chr1端粒dna長度的平均值為9267bp,老年人組chr1端粒dna長度的平均值為8913bp;中青年組chr2端粒dna長度的平均值為9184bp,老年組chr2端粒dna長度的平均值為7638bp;中青年組chr3端粒dna長度的平均值為6925bp,老年組chr3端粒dna長度的平均值為4895bp。在chr1、chr2及chr3的端粒dna長度測序結(jié)果中,老年組的端粒dna平均長度均比中年組要短,說明老年組的端粒整體上相比于中青年組的要顯著縮短,p<0.05。中青年組及老年組chr1、chr2及chr7端粒測序結(jié)果的箱線圖見圖7。對(duì)比例中圖7和表4的說明的說明如下:對(duì)比例qpcr方法測得的中青年組的端粒dna的平均長度為8326bp,對(duì)比例測得的老年組的端粒平均長度為7356bp,老年組的端粒長度也相比于中青年組要短,中青年組及老年組qpcr檢測端粒dna平均長度結(jié)果的箱線圖同見圖7。圖5為reads的讀長分析,其中,藍(lán)色線是總的數(shù)據(jù)集,紅色線是篩選過濾后的端粒dna測序reads,篩選過濾的條件如上述,圖5所示,端粒dna的reads中包含部分近端粒區(qū)序列(約1~2kbp),可以發(fā)現(xiàn),端粒dna測序reads讀長符合已知染色體端粒長度分布范圍(4-10kbp)。圖6為端粒dna的reads中ttaggg或者其互補(bǔ)序列aatccc重復(fù)出現(xiàn)在總reads中的次數(shù)分布圖。從圖6中可以看到,測序的端粒dnareads片段中,存在大量的ttaggg/aatccc重復(fù)序列,符合已知端粒dna序列的組成。經(jīng)過統(tǒng)計(jì),測序數(shù)據(jù)中符合端粒dna條件的reads中,ttaggg/aatccc重復(fù)序列平均重復(fù)出現(xiàn)次數(shù)1200次。對(duì)比例采用telomeremeasurementbyquantitativepcr(richardm.cawthon,nucleicacidsresearch,2002)分析端粒dna的方法,該方法是采用了t/s比率的比率,即t/s比率可以得出端粒的相對(duì)長度,而t/s比率與端粒長度成正比關(guān)系。t/s計(jì)算公式如下:t/s=[2ct(telomeres)/2ct(36b4)]=2-δct。端粒長度可以通過標(biāo)準(zhǔn)曲線y=1910.5x+4157計(jì)算,其中x為t/s比率,y為端粒dna的平均長度。使用該方法計(jì)算中青年人組和老年人組全部染色體的端粒的平均長度,結(jié)果如圖7中對(duì)比例方法所示。圖7為本發(fā)明方法與對(duì)比例方法測量端粒dna長度比較圖。圖7的chr1、chr2和chr7為通過標(biāo)簽序列可以區(qū)分不同人的染色體序列,篩選的端粒dnareads,使用graphmap軟件與人的一號(hào)染色體、二號(hào)染色體和七號(hào)染色體的近端粒區(qū)域比對(duì),通過比對(duì)結(jié)果區(qū)分端粒dnareads屬于哪條染色體,同時(shí)該reads長度減去reads中部分近端粒的染色體dna長度,獲得該染色體端粒的長度,統(tǒng)計(jì)每個(gè)人一號(hào)染色體、二號(hào)染色體和七號(hào)染色體端粒dna的長度。而對(duì)比例的測量端粒dna的方法只能測量基因組上所有染色體端粒dna的平均長度。分別對(duì)中青年人和老年人組一號(hào)染色體、二號(hào)染色體和七號(hào)染色體的端粒長度做分布圖,發(fā)現(xiàn)不同染色體中,端粒dna長度具有差異。另外同時(shí)發(fā)現(xiàn),中青年人組中一號(hào)染色體、二號(hào)染色體和七號(hào)染色體的端粒長度均大于老年人組,符合以往研究。對(duì)比例方法中同時(shí)也驗(yàn)證了中青年人組端粒dna長度大于老年人組,但是由于傳統(tǒng)方法只能檢測基因組所有染色體端粒的總體長度水平,無法精確測量每個(gè)染色體的端粒長度,所以在檢測結(jié)果上,置信區(qū)間的分布較本發(fā)明的大,不利于準(zhǔn)確比較端粒的長度。綜上所述,本發(fā)明公開的應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法能特異性的擴(kuò)增不同染色體的端粒dna全長,所擴(kuò)增全長的端粒dna片段使用3代測序方法準(zhǔn)確測量其片段序列長度,準(zhǔn)確率和精度都超過傳統(tǒng)的方法,本發(fā)明公開的檢測染色體端粒dna全長的方法精度達(dá)到1bp。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本
技術(shù)領(lǐng)域:
的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。sequencelisting<110>廣州普麥健康咨詢有限公司<120>應(yīng)用三代測序技術(shù)檢測染色體端粒dna全長的方法<130>mp1710561<160>35<170>patentinversion3.5<210>1<211>50<212>dna<213>人工序列<400>1ggcgacctccgagatctacactctttacctacacgagcctcctacgtact50<210>2<211>63<212>dna<213>人工序列<400>2gtacgtaggaggccacgtcttaccgacagtgaccttcgtatgtagtcttctgcttccgat60cga63<210>3<211>63<212>dna<213>人工序列<400>3gtacgtaggaggccacgtctcggattccaaggtactcgtatgtagtcttctgcttccgat60cga63<210>4<211>63<212>dna<213>人工序列<400>4gtacgtaggaggccacgtctcctcatggtcagtcatcgtatgtagtcttctgcttccgat60cga63<210>5<211>63<212>dna<213>人工序列<400>5gtacgtaggaggccacgtccgaatacgtctaggagtcgtatgtagtcttctgcttccgat60cga63<210>6<211>63<212>dna<213>人工序列<400>6gtacgtaggaggccacgtccgcaactacgtatctctcgtatgtagtcttctgcttccgat60cga63<210>7<211>63<212>dna<213>人工序列<400>7gtacgtaggaggccacgtcgtacacctcggcattatcgtatgtagtcttctgcttccgat60cga63<210>8<211>63<212>dna<213>人工序列<400>8gtacgtaggaggccacgtctcgtctgaagcctatctcgtatgtagtcttctgcttccgat60cga63<210>9<211>63<212>dna<213>人工序列<400>9gtacgtaggaggccacgtcctgtaccaagaccttgtcgtatgtagtcttctgcttccgat60cga63<210>10<211>63<212>dna<213>人工序列<400>10gtacgtaggaggccacgtcaggatagcccttccattcgtatgtagtcttctgcttccgat60cga63<210>11<211>63<212>dna<213>人工序列<400>11gtacgtaggaggccacgtcgtccttgatgcgtaactcgtatgtagtcttctgcttccgat60cga63<210>12<211>63<212>dna<213>人工序列<400>12gtacgtaggaggccacgtccacagactttacgtgctcgtatgtagtcttctgcttccgat60cga63<210>13<211>63<212>dna<213>人工序列<400>13gtacgtaggaggccacgtcccaaggttcacgcaattcgtatgtagtcttctgcttccgat60cga63<210>14<211>63<212>dna<213>人工序列<400>14gtacgtaggaggccacgtcttccaggttcatctcctcgtatgtagtcttctgcttccgat60cga63<210>15<211>63<212>dna<213>人工序列<400>15gtacgtaggaggccacgtcgagagtacgtcgttactcgtatgtagtcttctgcttccgat60cga63<210>16<211>63<212>dna<213>人工序列<400>16gtacgtaggaggccacgtcggaggaataggaacactcgtatgtagtcttctgcttccgat60cga63<210>17<211>63<212>dna<213>人工序列<400>17gtacgtaggaggccacgtccagtgcttcttgctagtcgtatgtagtcttctgcttccgat60cga63<210>18<211>63<212>dna<213>人工序列<400>18gtacgtaggaggccacgtctggaagcaagctaagctcgtatgtagtcttctgcttccgat60cga63<210>19<211>63<212>dna<213>人工序列<400>19gtacgtaggaggccacgtcgaacggttggaatgtctcgtatgtagtcttctgcttccgat60cga63<210>20<211>63<212>dna<213>人工序列<400>20gtacgtaggaggccacgtctacggtctccagtatctcgtatgtagtcttctgcttccgat60cga63<210>21<211>63<212>dna<213>人工序列<400>21gtacgtaggaggccacgtctctacgcagtaaccgatcgtatgtagtcttctgcttccgat60cga63<210>22<211>63<212>dna<213>人工序列<400>22gtacgtaggaggccacgtcgacgtcatcttacagctcgtatgtagtcttctgcttccgat60cga63<210>23<211>63<212>dna<213>人工序列<400>23gtacgtaggaggccacgtctccattgcagcgagattcgtatgtagtcttctgcttccgat60cga63<210>24<211>63<212>dna<213>人工序列<400>24gtacgtaggaggccacgtccaatagccaagacacctcgtatgtagtcttctgcttccgat60cga63<210>25<211>63<212>dna<213>人工序列<400>25gtacgtaggaggccacgtcccagttgatggtgaagtcgtatgtagtcttctgcttccgat60cga63<210>26<211>63<212>dna<213>人工序列<400>26gtacgtaggaggccacgtcaagaccgtttgcgagatcgtatgtagtcttctgcttccgat60cga63<210>27<211>63<212>dna<213>人工序列<400>27gtacgtaggaggccacgtcgcaattccgaatccgttcgtatgtagtcttctgcttccgat60cga63<210>28<211>63<212>dna<213>人工序列<400>28gtacgtaggaggccacgtcccgcttaatacctgcatcgtatgtagtcttctgcttccgat60cga63<210>29<211>63<212>dna<213>人工序列<400>29gtacgtaggaggccacgtcgtcgattgtatggcactcgtatgtagtcttctgcttccgat60cga63<210>30<211>63<212>dna<213>人工序列<400>30gtacgtaggaggccacgtcctcgaacacaactccatcgtatgtagtcttctgcttccgat60cga63<210>31<211>63<212>dna<213>人工序列<400>31gtacgtaggaggccacgtctgcatcgtggacatcatcgtatgtagtcttctgcttccgat60cga63<210>32<211>21<212>dna<213>人工序列<400>32cgatcggaagcagaagactac21<210>33<211>20<212>dna<213>人工序列<400>33caactccgccgttgcaaagg20<210>34<211>21<212>dna<213>人工序列<400>34cgtatcccacacaccacaccc21<210>35<211>20<212>dna<213>人工序列<400>35cagacagtgcacaaagccac20當(dāng)前第1頁12