基于單分子靶向測(cè)序技術(shù)檢測(cè)egfr/kras/braf基因突變位點(diǎn)的探針、方法、試劑及其應(yīng)用
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于分子生物學(xué)領(lǐng)域,特別是涉及一種基于單分子靶向測(cè)序技術(shù)檢測(cè) EGFR/KRAS/BRAF基因突變位點(diǎn)的探針、方法、試劑及其應(yīng)用,以及一種無創(chuàng)檢測(cè)基因突變位 點(diǎn)的方法。
【背景技術(shù)】
[0002] 表皮生長(zhǎng)因子受體(epidermal growth factor receptor,EGFR)是位于7號(hào)染色 體短臂上的原癌基因 C-erbB-l(HER-l)的表達(dá)產(chǎn)物,是表皮生長(zhǎng)因子受體家族(HER)中的4 個(gè)成員之一,HER家族在細(xì)胞生理過程中發(fā)揮重要的調(diào)節(jié)作用。EGFR酪氨酸激酶區(qū)域的突變 主要發(fā)生在18~21號(hào)外顯子,其中19和21號(hào)外顯子突變占總突變的90% AGFR信號(hào)傳導(dǎo)的 異常是導(dǎo)致多種腫瘤發(fā)生的原因。研究表明,EGFR在多種腫瘤中都有表達(dá),如結(jié)直腸癌、乳 腺癌、胰腺癌、前列腺癌和非小細(xì)胞肺癌等。
[0003] K-ras基因是一種原癌基因,長(zhǎng)約35kb,位于12號(hào)染色體短臂上,是ras基因家族成 員之一,編碼KRAS蛋白。K-ras基因常見的突變位點(diǎn)位于2號(hào)外顯子的12號(hào)密碼子和13號(hào)密 碼子上、3號(hào)外顯子的61號(hào)密碼子,其中有7個(gè)突變熱點(diǎn):G12C、G12R、G12S、G12V、G12D、G12A、 G13V/D,占 K-ras基因總突變的98%以上。研究表明體細(xì)胞K-ras基因突變與多種人類惡性 腫瘤,如肺癌、白血病、黏蛋白腺癌、胰腺癌、結(jié)直腸癌有關(guān),而生殖細(xì)胞K-ras基因突變與努 南綜合征和心臟-面部-皮膚(cardi〇-facio_cutaneous,CFC)綜合征相關(guān)。
[0004] BRAF基因是一種原癌基因,定位于7號(hào)染色體上,編碼絲/蘇氨酸特異性激酶。約 90%的BRAF基因突變發(fā)生在外顯子15的1799位核苷酸上,T突變?yōu)锳,導(dǎo)致纈氨酸被谷氨酸 取代(V600E)』RAF基因突變?cè)诤谏亓?、結(jié)直腸癌、神經(jīng)膠質(zhì)瘤、肉瘤、卵巢癌、乳腺癌以及 肺癌等腫瘤細(xì)胞系中的發(fā)生率依次為59%、18%、11%、9%、14%、2%、3%;此外,81^? V600E在甲狀腺乳頭狀癌中的發(fā)生率高達(dá)35.8% ARAF基因突變是晚期及復(fù)發(fā)性結(jié)直腸癌 最重要的預(yù)后指標(biāo)之一,與患者較差的總體生存期密切相關(guān)。
[0005] 目前常見的檢測(cè)這三個(gè)基因突變的方法有Sanger測(cè)序法和熒光定量PCR法。 Sanger測(cè)序法中,單對(duì)引物可檢測(cè)多個(gè)突變,但對(duì)多個(gè)基因、或同一基因的不同外顯子上的 突變位點(diǎn)就需分別進(jìn)行擴(kuò)增測(cè)序,操作繁瑣,并且靈敏度較低約20%,假陰性率較高。熒光 定量PCR法雖然靈敏度高,但每對(duì)引物只能檢測(cè)一種突變,且每種突變需單獨(dú)建立一個(gè)PCR 反應(yīng)體系,同時(shí)檢測(cè)多個(gè)樣本多個(gè)突變位點(diǎn)操作繁瑣。這兩種方法對(duì)樣本的需要量都較大, 不適合同時(shí)檢測(cè)多個(gè)基因突變位點(diǎn)。
[0006] 高通量測(cè)序法(NGS)雖然靈敏度高,同時(shí)可檢測(cè)多個(gè)突變位點(diǎn),但其建庫流程復(fù) 雜,操作繁瑣,時(shí)間長(zhǎng),成本高。
【發(fā)明內(nèi)容】
[0007] 鑒于此,本發(fā)明提供了一種基于單分子靶向測(cè)序技術(shù)檢測(cè)EGFR/KRAS/BRAF基因突 變位點(diǎn)的探針、方法和應(yīng)用。本發(fā)明還提供了一種用于單分子靶向測(cè)序的樣品的制備方法。
[0008] 第一方面,本發(fā)明提供了 一種基于單分子靶向測(cè)序技術(shù)檢測(cè)EGFR/KRAS/BRAF基因 突變位點(diǎn)的探針,包括檢測(cè)EGFR、KRAS和BRAF基因中一個(gè)或多個(gè)基因的突變位點(diǎn)的一條或 多條探針,所述探針的核苷酸序列為SEQ ID NO: 1~SEQ ID N0:16所示序列中的一條或多 條。
[0009] 具體地,如SEQ ID NO: 1~SEQ ID N0:16所示探針如下表1所示。
[0010]表1·SEQIDN0:1~SEQIDN0:16所示探針
[0011]
[0012] 具體地,具有SEQ ID N0:1、SEQ ID N0:2所示序列的探針用于檢測(cè)EGFR基因的外 顯子18區(qū)域的突變位點(diǎn);具體地,具有SEQ ID N0:3、SEQ ID N0:4所示序列的探針用于檢測(cè) EGFR基因的外顯子19區(qū)域的突變位點(diǎn);具體地,具有SEQ ID N0:5~SEQ ID N0:8所示序列 的探針用于檢測(cè)EGFR基因的外顯子20區(qū)域的突變位點(diǎn);具體地,具有SEQ ID N0:9、SEQ ID NO: 10所示序列的探針用于檢測(cè)EGFR基因的外顯子21區(qū)域的突變位點(diǎn);具體地,具有SEQ ID N0:11、SEQ ID NO: 12所示序列的探針用于檢測(cè)KRAS基因的外顯子2區(qū)域的突變位點(diǎn);具體 地,具有SEQ ID NO: 13、SEQ ID N0:14所示序列的探針用于檢測(cè)KRAS基因的外顯子3區(qū)域的 突變位點(diǎn);具體地,具有SEQ ID N0:15、SEQ ID勵(lì):16所示序列的探針用于檢測(cè)81^?基因的 外顯子15區(qū)域的突變位點(diǎn)。
[0013] 在本發(fā)明一實(shí)施例中,所述SEQ ID NO: 1~SEQ ID N0:16任一所示序列的5'端連 接有-(CH2)n-p〇ly(T)m-、-p 〇ly(T)m-或 _(CH2)n_,其中,n、m為自然數(shù)。
[0014]優(yōu)選地,η為6-10的自然數(shù)。
[0015] 優(yōu)選地逆為10-30的自然數(shù)。
[0016] 優(yōu)選地,n、m均為10。
[0017] 在本發(fā)明一實(shí)施例中,所述的多條探針檢測(cè)EGFR、KRAS和BRAF基因中任意兩個(gè)或 三個(gè)基因的突變位點(diǎn);其中,所述EGFR基因的突變位點(diǎn)位于:EGFR基因的外顯子18~外顯子 21區(qū)域中的至少一個(gè);所述KRAS基因的突變位點(diǎn)位于:KRAS基因的外顯子2~外顯子3區(qū)域 中的至少一個(gè);所述BRAF基因的突變位點(diǎn)位于:BRAF基因的外顯子15區(qū)域。
[0018] 優(yōu)選地,所述多條探針為SEQ ID NO: 1~SEQ ID N0:16所示的核苷酸序列組成的 探針組。
[0019] 本領(lǐng)域技術(shù)人員可以理解的,若摸索的檢測(cè)探針(比如,SEQ ID N0:1~SEQ ID NO: 16所示的核苷酸序列組成的探針組)獲得了較佳的雜交效果,一般情況下,設(shè)計(jì)探針的 時(shí)候,適當(dāng)?shù)膶⑻结樈M中任一一條探針序列的長(zhǎng)度延長(zhǎng)或截短〇~3個(gè)堿基,也可以獲得不 錯(cuò)的檢測(cè)效果,也應(yīng)納入本發(fā)明保護(hù)范圍。
[0020]第二方面,本發(fā)明提供了一種用于單分子靶向測(cè)序的樣品的制備方法,包括:通過 封阻反應(yīng)在待測(cè)DNA片段的3 '端修飾雙脫氧核糖核酸,獲得3 '端修飾有雙脫氧核糖核酸的 待測(cè)DNA片段;其中,封阻反應(yīng)中,脫氧核糖核酸與待修飾的DNA片段的摩爾比為1: 25~1: 200 〇
[0021]在本發(fā)明一實(shí)施例中,所述的在待測(cè)DNA片段選自PCR產(chǎn)物、片段化的基因組DNA或 經(jīng)純化的血液中的游離DNA。
[0022] 在本發(fā)明一實(shí)施例中,所述的PCR產(chǎn)物為采用多重PCR引物擴(kuò)增待測(cè)樣品所得的多 重PCR產(chǎn)物,其中,所述的多重PCR引物為引物組,所述引物組中各引物的核苷酸序列為SEQ ID N0:17~SEQ ID N0:30所示。
[0023] 在本發(fā)明一實(shí)施例中,所述的雙脫氧核糖核酸修飾有光學(xué)檢測(cè)標(biāo)記。
[0024]可以理解的是,本領(lǐng)域技術(shù)人員可以采用任一常規(guī)的方法在待測(cè)DNA片段的上修 飾雙脫氧核糖核酸;比如,可參照二代高通量測(cè)序文庫構(gòu)建方法中加 A的方法進(jìn)行DNA片段 的封阻;相比之下,本發(fā)明后續(xù)實(shí)施例中采用的封阻方法更佳,因?yàn)榧幢闶菍?duì)于對(duì)片段化的 基因組進(jìn)行封阻,本發(fā)明后續(xù)實(shí)施例中采用的封阻方法也不需要進(jìn)行末端補(bǔ)平即可直接進(jìn) 行封阻反應(yīng),操作非常簡(jiǎn)便。更優(yōu)選地,可采用Terminal Transferase Kit(NEB,M0315L)或 等同的試劑體系進(jìn)行封阻反應(yīng)。更進(jìn)一步地,本申請(qǐng)人對(duì)該商用試劑盒的封阻反應(yīng)條件進(jìn) 行多次優(yōu)化,摸索出較佳的對(duì)DNA片段的3 '端修飾雙脫氧核糖核酸的封阻反應(yīng)條件,當(dāng)脫氧 核糖核酸與待修飾的DNA片段的摩爾比為1:100時(shí),封阻效率可達(dá)到98%以上;而即使在該 摩爾比為1:25~1:200時(shí),封阻效率仍然可達(dá)到70%~9%以上。
[0025]相比現(xiàn)有二代測(cè)序文庫的制備,本發(fā)明第二方面提供了的用于單分子靶向測(cè)序的 樣品的制備方法所獲得的3'端修飾有雙脫氧核糖核酸的待測(cè)DNA片段,可直接用于單分子 靶向測(cè)序,與5'端連接到基底表面的靶向引物進(jìn)行雜交,進(jìn)行測(cè)序反應(yīng);而不需要進(jìn)行添加 測(cè)序接頭(adaptor)等步驟,極大簡(jiǎn)化了測(cè)序樣品文庫的制備步驟。
[0026] 第三方面,本發(fā)明提供了 一種基于單分子靶向測(cè)序技術(shù)檢測(cè)EGFR/KRAS/BRAF基因 突變位點(diǎn)的方法,包括如下步驟:
[0027] (i)將靶向引物的5'端連接到基底表面;其中,所述的靶向引物為本發(fā)明第一方面 所述的探針;
[0028] (ii)提供或制備待測(cè)模板核酸,其中,所述的待測(cè)模板核酸的3'端修飾有帶光學(xué) 檢測(cè)標(biāo)記的雙脫氧核糖核酸;將所述待測(cè)模板核酸與所述步驟(i )中連接到基底表面上的 靶向引物進(jìn)行雜交,形成雜交的靶向引物/模板核酸復(fù)合物;
[0029] (i i i)對(duì)所述靶向引物/模板核酸復(fù)合物進(jìn)行成像;
[0030] (iv)將所述靶向引物/模板核酸復(fù)合物、聚合酶以及一種或多種帶光學(xué)檢測(cè)標(biāo)記 的核苷酸混合,通過聚合酶反應(yīng)將一種或多種帶光學(xué)檢測(cè)標(biāo)記的核苷酸添加至靶向引物鏈 的3'端;獲得延伸產(chǎn)物;其中,所述帶光學(xué)檢測(cè)標(biāo)記的核苷酸還具有可斷裂的基團(tuán);
[0031] (V)對(duì)延伸后的靶向引物/模板核酸復(fù)合物進(jìn)行成像,并結(jié)合步驟(iii)中靶向引 物/模板核酸復(fù)合物的定位結(jié)果,進(jìn)行圖像比對(duì)和糾偏,以鑒定模板核酸上的待測(cè)核苷酸序 列;
[0032] (vi)除去延伸產(chǎn)物上帶光學(xué)檢測(cè)標(biāo)記的核苷酸的可斷裂的基團(tuán):
[0033] (vi i)重復(fù)步驟(iii)至(vi)-次或多次以鑒定所述模板核酸中的1個(gè)或多個(gè)核苷 酸。
[0034] 本發(fā)明通過延伸反應(yīng)、成像檢測(cè)和切除光學(xué)檢測(cè)標(biāo)記分子的反復(fù)循環(huán),實(shí)現(xiàn)單分 子靶向測(cè)序技術(shù)(SMTS)實(shí)時(shí)測(cè)序。
[0035]如本發(fā)明所述的,所述的"待測(cè)DNA片段"與"待測(cè)模板核酸"可以互換。
[0036]可以理解的是,可采用本領(lǐng)域常規(guī)的探針固定方法將本發(fā)明第一方面的探針序列 (即所述步驟(i)中的靶向引物)的5'端連接到基底表面。但申請(qǐng)人在研究過程中發(fā)現(xiàn),不同