亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于分析核酸混合物的探針、文庫(kù)和試劑盒及其構(gòu)建方法

文檔序號(hào):440722閱讀:882來(lái)源:國(guó)知局
專利名稱:用于分析核酸混合物的探針、文庫(kù)和試劑盒及其構(gòu)建方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于檢測(cè)、分類或定量復(fù)雜的核酸混合物,例如轉(zhuǎn)錄物組(transcriptome)中的組分的核酸探針、核酸探針文庫(kù)和試劑盒,以及它們的使用方法。
背景技術(shù)
隨著用于描繪成千上萬(wàn)基因的表達(dá)譜的微陣列,例如GeneChipTM陣列(Affymetrix,Inc.,Santa Clara,CA)的出現(xiàn),利用傳統(tǒng)方法例如RNA印跡分析和點(diǎn)印跡分析所需的財(cái)力和物力的一小部分,就可以鑒別出表達(dá)的基因和細(xì)胞表型之間的相關(guān)性。微陣列允許開(kāi)發(fā)多個(gè)平行測(cè)定,以鑒別和驗(yàn)證疾病的生物學(xué)標(biāo)記和可以用于診斷和治療的藥物靶標(biāo)。此外,基因表達(dá)譜也可以用于評(píng)估和預(yù)測(cè)暴露于某種因子(例如,藥物、潛在的毒素或致癌物等)或條件(例如,溫度、pH等)的代謝和毒理學(xué)后果。
微陣列實(shí)驗(yàn)常常產(chǎn)生僅其中一小部分對(duì)于實(shí)驗(yàn)者是有價(jià)值的大量數(shù)據(jù)。此外,由于基于微陣列的分析的高度平行模式,對(duì)于各個(gè)捕獲探針而言,條件可能不是最佳的?;谶@些原因,微陣列實(shí)驗(yàn)十分經(jīng)常地尾隨使用單基因均相測(cè)定的驗(yàn)證研究或被該驗(yàn)證研究隨后替代。這些單基因均相測(cè)定經(jīng)常是基于定量PCR的方法,例如5′核酸酶測(cè)定或其它類型的雙標(biāo)記探針定量實(shí)驗(yàn)。然而,這些實(shí)驗(yàn)仍是耗時(shí)的單反應(yīng)實(shí)驗(yàn),受到高成本和耗時(shí)的探針設(shè)計(jì)程序的阻礙。而且,5′核酸酶測(cè)定探針相對(duì)較大(例如,15-30個(gè)核苷酸)。因此,目前已知的均相測(cè)定系統(tǒng)中的這些限制性對(duì)微陣列發(fā)現(xiàn)結(jié)果的驗(yàn)證以及對(duì)聚焦的靶驗(yàn)證方法均構(gòu)成了瓶頸。
用于避免此瓶頸的一個(gè)方法是省去5′核酸酶測(cè)定中使用的昂貴雙標(biāo)記指示探針和分子信標(biāo),代之使用在結(jié)合雙鏈而非單鏈DNA時(shí)發(fā)熒光的非序列特異性DNA嵌入染料,例如SYBR Green。使用該染料,可以通用地實(shí)時(shí)檢測(cè)任何擴(kuò)增的序列。然而,該技術(shù)受到幾個(gè)問(wèn)題的阻礙。例如,PCR擴(kuò)增過(guò)程中的非特異引物引發(fā)可以產(chǎn)生參與定量過(guò)程的與目的無(wú)關(guān)的非靶擴(kuò)增子。而且,在該反應(yīng)中普遍存在PCR引物之間的相互作用,從而形成“引物二聚體”。由于PCR反應(yīng)中典型使用高濃度的引物,這可以導(dǎo)致顯著數(shù)量的短雙鏈非靶擴(kuò)增子,該擴(kuò)增子也結(jié)合嵌合染料。因此,通過(guò)實(shí)時(shí)PCR定量mRNA的優(yōu)選方法是使用序列特異性檢測(cè)探針。
用于避免隨機(jī)擴(kuò)增和引物二聚體形成問(wèn)題的一個(gè)方法是使用可以用于檢測(cè)大量不同類型的核酸分子但又保持一定的序列特異性的通用檢測(cè)探針,該方法已經(jīng)由Simeonov等(Nucleic Acid Research30(17)91,2002;美國(guó)專利公布20020197630)描述,其涉及使用包含了具有給定的某個(gè)(或某些)長(zhǎng)度的所有可能序列中10%以上的序列的探針文庫(kù)。該文庫(kù)可以包含各種非天然核酸堿基和其它修飾以穩(wěn)定文庫(kù)中探針/引物與靶序列的結(jié)合。即使如此,對(duì)于大多數(shù)序列,也需要至少8個(gè)堿基的最短長(zhǎng)度來(lái)獲得可以與大多數(shù)和應(yīng)用(例如實(shí)時(shí)PCR)相關(guān)的測(cè)定條件相容的穩(wěn)定程度。由于具有所有可能的8聚體的通用文庫(kù)含有65,536個(gè)不同序列,因此先前由Simeonov等考慮的甚至最小的文庫(kù)也含有所有可能性的10%以上,即,至少6554個(gè)序列,這在操作上是不實(shí)際的而且其構(gòu)建成本巨大。
從實(shí)踐的角度出發(fā),幾個(gè)因素限制了當(dāng)前的均相測(cè)定應(yīng)用的方便性和利用度。常規(guī)測(cè)定技術(shù)的使用者面臨的問(wèn)題包括●由于購(gòu)買針對(duì)每個(gè)轉(zhuǎn)錄物的探針的價(jià)格很高,當(dāng)嘗試在少數(shù)樣本中檢測(cè)許多不同基因時(shí),將會(huì)價(jià)格高得驚人。
●合成標(biāo)記探針是耗時(shí)的,而且從訂貨到收到廠家發(fā)出的貨物的時(shí)間常常超過(guò)1周。
●用戶設(shè)計(jì)的試劑盒可能不會(huì)在第一次時(shí)起作用,因此,按每測(cè)定計(jì),有效的試劑盒是昂貴的。
●難于快速地檢測(cè)新靶標(biāo)或反復(fù)地改進(jìn)探針設(shè)計(jì)。
●商業(yè)有效探針的確切探針序列可能不為消費(fèi)者所知,從而導(dǎo)致在結(jié)果的評(píng)估和科學(xué)出版的適宜性上出現(xiàn)問(wèn)題。
●當(dāng)測(cè)定條件或組分不清時(shí),不能從替代來(lái)源定購(gòu)試劑。
本發(fā)明解決了這些實(shí)際問(wèn)題,并旨在確保快速和價(jià)廉地開(kāi)發(fā)出用于定量基因轉(zhuǎn)錄物的準(zhǔn)確而特異的測(cè)定。
發(fā)明簡(jiǎn)述期望能夠使用有限數(shù)量的寡核苷酸檢測(cè)探針在均相測(cè)定系統(tǒng)中定量例如人轉(zhuǎn)錄物組(transcriptome)中的大多數(shù)基因(例如,>98%)的表達(dá)。本發(fā)明解決了上述均相測(cè)定的現(xiàn)有方案面臨的問(wèn)題。這通過(guò)提供構(gòu)建具有足夠的序列特異性的通用多探針的方法來(lái)實(shí)現(xiàn),所述通用多探針不可能檢測(cè)隨機(jī)擴(kuò)增的序列片段或引物二聚體,但各自仍能夠檢測(cè)許多不同的靶序列。這些探針可以用于不同的測(cè)定中,并可以組合在小探針文庫(kù)(50至500個(gè)探針)中,當(dāng)與靶特異性引物組聯(lián)合時(shí),其可以用于檢測(cè)和/或定量由成千上萬(wàn)個(gè)不同核酸組成的復(fù)雜混合物中的各組分(例如檢測(cè)在由>30,000個(gè)不同核酸組成的人轉(zhuǎn)錄物組中的各轉(zhuǎn)錄物)。
每個(gè)多探針(multi-probe)包含兩個(gè)元件1)由一個(gè)或多個(gè)標(biāo)記物組成以檢測(cè)探針和靶的結(jié)合的檢測(cè)元件或檢測(cè)部分;和2)確保與特定目標(biāo)靶(一個(gè)或多個(gè))結(jié)合的識(shí)別元件或識(shí)別序列標(biāo)簽。檢測(cè)元件可以是均相測(cè)定中使用的任何檢測(cè)原理。可以通過(guò)與靶結(jié)合后一個(gè)或多個(gè)標(biāo)記物的可測(cè)量的性質(zhì)改變直接地檢測(cè)結(jié)合(例如,有或沒(méi)有莖結(jié)構(gòu)的分子信標(biāo)類測(cè)定),或者可以通過(guò)結(jié)合后的隨后反應(yīng)(例如在5′核酸酶測(cè)定中通過(guò)DNA聚合酶的5′核酸酶活性進(jìn)行的切割)來(lái)間接地檢測(cè)結(jié)合。
每個(gè)檢測(cè)元件可以包含淬滅劑,其選自歐洲專利申請(qǐng)04078170和03759288公開(kāi)的淬滅劑。在本發(fā)明的上下文中,與這兩篇專利申請(qǐng)中公開(kāi)的淬滅劑有關(guān)的所有內(nèi)容涉及形成寡核苷酸探針的一部分的淬滅劑,所述探針是本發(fā)明的文庫(kù)的一部分,因而這兩篇的內(nèi)容在本文中引作參考。
淬滅劑優(yōu)選地具有式I 其中R1,R4,R5和R8中的一個(gè)或兩個(gè)獨(dú)立地是鍵,或選自取代的或未取代的氨基,其構(gòu)成與寡核苷酸探針的剩余部分的連接,且其中其它的R1至R8基團(tuán)各自獨(dú)立地是氫或取代的或未取代的羥基,氨基,烷基,芳基,芳烷基或烷氧基。氨基的取代基可以是烷基,烷基芳基或芳基。
在式I的上下文中,術(shù)語(yǔ)″烷基(alkyl)″在本文中用于指分支的或未分支的、飽和的或不飽和的、單價(jià)烴基,其通常具有約1-30個(gè)碳,優(yōu)選1-6個(gè)碳。合適的烷基包含,例如,含有一個(gè)或多個(gè)亞甲基、次甲基(methine)和/或次甲基(methyne)的結(jié)構(gòu)。分支的結(jié)構(gòu)具有與異丙基、叔丁基、異丁基、2-乙基丙基等類似的分支基序。如本文所使用的,該術(shù)語(yǔ)包括″取代的烷基″和″環(huán)烷基″?!迦〈耐榛逯盖懊娑x的烷基,其包含一個(gè)或多個(gè)取代基,例如,C1-C6-烷基,芳基,?;?,鹵素(即鹵代烷基,例如,CF3),羥基,氨基,烷氧基,烷基氨基,?;被?,硫代酰胺,酰基氧,芳基氧,芳基氧烷基,巰基,硫代,氮雜,氧雜,飽和的和不飽和的環(huán)烴,雜環(huán)等。這些基團(tuán)可以結(jié)合到烷基的任意碳或取代基上。另外,這些基團(tuán)可以從烷基鏈垂下或摻入烷基鏈中。
術(shù)語(yǔ)“烷基芳基”在本上下文中指通過(guò)組合烷基和芳基得到的基團(tuán)。典型的烷基芳基包括苯乙基,乙基苯基等。
術(shù)語(yǔ)“烷基氨基”在本上下文中指被烷基取代的氨基。在一個(gè)優(yōu)選的實(shí)施方案中,氨基結(jié)合到蒽醌結(jié)構(gòu)上。
術(shù)語(yǔ)“烷基芳基氨基”在本上下文中指被烷基芳基取代的氨基。在一個(gè)優(yōu)選的實(shí)施方案中,氨基結(jié)合到蒽醌結(jié)構(gòu)上。
術(shù)語(yǔ)“芳基氨基”在本上下文中指指被芳基取代的氨基。在一個(gè)優(yōu)選的實(shí)施方案中,氨基結(jié)合到蒽醌結(jié)構(gòu)上。
在本發(fā)明中使用的淬滅劑的特別優(yōu)選的實(shí)例包括1,4-二-(3-羥基-丙基氨基)-蒽醌,1-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-4-(3-羥基丙基氨基)-蒽醌,1,5-二-(3-羥基-丙基氨基)-蒽醌,1-(3-羥基丙基氨基)-5-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-蒽醌,1,4-二-(4-(2-羥乙基)苯基氨基)-蒽醌,1-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-4-(4-(2-羥乙基)苯基氨基)-蒽醌,1,8-二-(3-羥基-丙基氨基)-蒽醌,1,4-二(3-羥基丙基氨基)-6-甲基蒽醌,1-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-4-(3-羥基丙基氨基)-6(7)-甲基-蒽醌,1,4-二(4-(2-羥乙基)苯基氨基)-6-甲基-蒽醌,1,4-二(4-甲基-苯基氨基)-6-羧基-蒽醌,1,4-二(4-甲基-苯基氨基)-6-(N-(6,7-二羥基-4-氧-庚烷-1-基))羧酰胺-蒽醌,1,4-二(4-甲基-苯基氨基)-6-(N-(7-二甲氧基三苯甲基氧-6-羥基-4-氧-庚烷-1-基))羧酰胺-蒽醌,1,4-二(丙基氨基)-6-羧基-蒽醌,1,4-二(丙基氨基)-6-(N-(6,7-二羥基-4-氧-庚烷-1-基))羧酰胺-蒽醌,1,4-二(丙基氨基)-6-(N-(7-二甲氧基三苯甲基氧-6-羥基-4-氧-庚烷-1-基))羧酰胺-蒽醌,1,5-二(4-(2-羥乙基)苯基氨基)-蒽醌,1-(4-(2-羥乙基)苯基氨基)-5-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-蒽醌,1,8-二(3-羥基丙基氨基)-蒽醌,1-(3-羥基丙基氨基)-8-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-蒽醌,1,8-二(4-(2-羥乙基)苯基氨基)-蒽醌,和1-(4-(2-羥乙基)苯基氨基)-8-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-蒽醌。
一種特別優(yōu)選的淬滅劑是實(shí)施例21的化合物11,即1,4-二(2-羥乙基氨基)-6-甲基蒽醌。
識(shí)別元件也有助于本發(fā)明的新穎性。它包含短寡核苷酸部分,其序列經(jīng)選擇以致能夠檢測(cè)給定的復(fù)雜樣品混合物中的一個(gè)靶核苷酸大子集。分別被設(shè)計(jì)用于檢測(cè)許多不同靶分子的這些新探針被稱作多探針。通過(guò)選擇最頻繁遇到的序列來(lái)設(shè)計(jì)用于多個(gè)靶的探針和利用短識(shí)別序列的重現(xiàn)的概念是新的,并與設(shè)計(jì)出來(lái)以便盡可能具有針對(duì)單個(gè)靶序列的特異性的常規(guī)探針不同。隨后,周圍引物和選擇的探針序列一起,確保該多探針的特異性。由試圖用最少量的探針處理最大量的靶而產(chǎn)生的此新的設(shè)計(jì)原理同樣是本發(fā)明的一部分。這通過(guò)如下發(fā)現(xiàn)得以實(shí)現(xiàn)含有非常短的8-9聚體LNA的寡核苷酸探針與基于PCR的測(cè)定是相容的。在本發(fā)明的一個(gè)方面,在識(shí)別元件中摻入核苷酸堿基、核苷堿基或核酸堿基(nucleobase)的修飾物或類似物,以及可能地小溝結(jié)合劑及其它修飾,所有這些均旨在穩(wěn)定探針和靶分子之間形成的雙鏈體,以便可以使用具有最寬靶范圍的最短可能探針序列。在本發(fā)明的一個(gè)優(yōu)選方面,所述修飾是摻入LNA殘基,以將識(shí)別元件的長(zhǎng)度減少至8或9個(gè)核苷酸,并同時(shí)維持形成的雙鏈體足夠的穩(wěn)定性,以便在普通的測(cè)定條件下檢測(cè)到。典型地,所述文庫(kù)中少于20%的寡核苷酸探針在識(shí)別元件的5’和/或3’位置具有胍基(G),但是優(yōu)選地,少于10%的寡核苷酸探針在識(shí)別元件的5’末端具有G,例如少于5%。特別優(yōu)選的是這樣的文庫(kù),其中識(shí)別元件在5’末端不具有G。
優(yōu)選地,修飾多探針,以使該探針與具有相同序列但未修飾的探針相比在相同檢測(cè)條件(例如PCR條件或嚴(yán)格雜交條件)下對(duì)靶序列的結(jié)合親和力增加至少兩倍。優(yōu)選的修飾包括,但不限于,摻入已經(jīng)通過(guò)化學(xué)基團(tuán)修飾或已經(jīng)被類似物(例如,摻入核糖或脫氧核糖類似物)替代或者已經(jīng)通過(guò)使用非磷酸二酯鍵的核苷酸間鍵(例如非磷酸酯的核苷酸間鍵)進(jìn)行過(guò)修飾的核酸堿基、核苷堿基或核苷酸,以增加結(jié)合親和力。優(yōu)選的修飾還可以包括附著雙鏈體穩(wěn)定劑,例如小溝結(jié)合劑(MGB)或嵌入核酸(INA)。此外,優(yōu)選的修飾還可以包括添加非區(qū)分性堿基,例如5-硝基吲哚,其能夠穩(wěn)定雙鏈體形成,不管靶鏈相對(duì)位置上的核酸堿基如何。實(shí)際上,一個(gè)優(yōu)選的實(shí)施方案要求,本發(fā)明的文庫(kù)中的所有探針都包含至少一個(gè)5-硝基吲哚殘基,且最優(yōu)選地,所有探針包含一個(gè)單獨(dú)的5-硝基吲哚殘基。最后,能夠序列特異地與靶序列結(jié)合的、由非糖-磷酸主鏈組成的多探針,例如PNA,也是所考慮的修飾。所有上述增加結(jié)合親和力的不同修飾在下文中將稱作“穩(wěn)定化修飾”,由此產(chǎn)生的多探針在下文中也將稱作“修飾的寡核苷酸”。更優(yōu)選地,修飾的寡核苷酸的結(jié)合親和力比具有相同序列但無(wú)該穩(wěn)定化修飾的探針的結(jié)合高至少約3倍、4倍、5倍或20倍。
最優(yōu)選地,穩(wěn)定化修飾是摻入一個(gè)或多個(gè)LNA核苷酸類似物。根據(jù)本發(fā)明的6至12個(gè)核苷酸的探針可以包含1至8個(gè)穩(wěn)定化核苷酸,例如LNA核苷酸。當(dāng)包含至少兩個(gè)LNA核苷酸時(shí),這些核苷酸可以是連續(xù)的,或被一個(gè)或多個(gè)非LNA核苷酸隔開(kāi)。在一方面,LNA核苷酸是α和/或xylo LNA核苷酸。
本發(fā)明還提供可以在NASBA測(cè)定條件下使用的寡聚體多探針文庫(kù)。
NASBA是一種適于擴(kuò)增RNA的、特異性等溫核酸擴(kuò)增方法。通過(guò)用硫氰酸胍+Triton X-100裂解,最后從二氧化硅顆粒上洗脫純化的核酸,進(jìn)行核酸分離。通過(guò)NASBA進(jìn)行的擴(kuò)增涉及三種酶(即,AMV逆轉(zhuǎn)錄酶、RNase H和T7RNA聚合酶)的協(xié)同活性。通過(guò)在分離時(shí)加入的內(nèi)部校準(zhǔn)物,實(shí)現(xiàn)定量檢測(cè),其中所述內(nèi)部校準(zhǔn)物與野生型RNA一起擴(kuò)增,并隨后使用電化學(xué)發(fā)光進(jìn)行鑒別。
本發(fā)明也提供了包含多探針的寡聚體多探針文庫(kù),所述多探針包含至少一個(gè)上述定義的穩(wěn)定化修飾。優(yōu)選地,探針的長(zhǎng)度小于約20個(gè)核苷酸,更優(yōu)選地小于12個(gè)核苷酸,最優(yōu)選地約8或9個(gè)核苷酸。此外,優(yōu)選地,文庫(kù)包含約3000種以下的探針,更優(yōu)選地,文庫(kù)包含500種以下的探針,最優(yōu)選地約100種探針。根據(jù)識(shí)別元件所連接的檢測(cè)元件的類型,含有標(biāo)記的多探針的文庫(kù)可以用于多種應(yīng)用中。這些應(yīng)用包括,但不限于,雙或單標(biāo)記測(cè)定,例如5′核酸酶測(cè)定,分子信標(biāo)應(yīng)用(參見(jiàn)例如Tyagi和Kramer Nat.Biotechnol.14303-308,1996)和其它基于FRET的測(cè)定。
在本發(fā)明的一個(gè)方面,對(duì)上述多探針一起進(jìn)行設(shè)計(jì),以便可以彼此補(bǔ)充成為具有給定長(zhǎng)度的所有可能序列的一個(gè)如下預(yù)定子集,該子集經(jīng)選擇能夠使用最少數(shù)量的多探針序列檢測(cè)/表征/定量復(fù)雜混合物中最大數(shù)量的核酸。這些預(yù)先設(shè)計(jì)的所有可能序列的小子集構(gòu)成多探針文庫(kù)。本發(fā)明的多探針文庫(kù)通過(guò)如下方式以極大降低的復(fù)雜度實(shí)現(xiàn)該功能性有意地選擇最常出現(xiàn)的、具有一種或多種給定長(zhǎng)度的寡聚體、同時(shí)努力地使該選擇多樣化,以在復(fù)雜核酸靶群體中達(dá)到最佳可能的覆蓋率。在一個(gè)優(yōu)選方面,文庫(kù)的探針與核酸靶群體(例如,人mRNA群體)中的約60%以上雜交。更優(yōu)選地,探針與靶分子群體的所有靶核酸分子中的70%以上、80%以上、90%以上、95%以上,甚至98%以上雜交(見(jiàn),例如

圖1)。
在本發(fā)明的一個(gè)最優(yōu)選方面,包含具有選定的探針長(zhǎng)度的所有可能序列中的約0.1%的探針文庫(kù)(即,例如,約100種多探針)能夠檢測(cè)、分類和/或定量任何特定物種(尤其是哺乳動(dòng)物,更尤其是人)的轉(zhuǎn)錄物組中98%以上的mRNA轉(zhuǎn)錄物(即,>35,000個(gè)不同的mRNA序列)。事實(shí)上,優(yōu)選地,本發(fā)明的多探針文庫(kù)覆蓋靶群體的所有靶核酸中的至少85%。
在現(xiàn)有均相測(cè)定中存在的上述問(wèn)題通過(guò)使用本發(fā)明的多探針文庫(kù)得以解決,所述文庫(kù)由短檢測(cè)探針的最小組合組成,該探針經(jīng)選擇能夠識(shí)別或檢測(cè)給定生物的給定細(xì)胞類型中所有表達(dá)基因的大多數(shù)。一方面,文庫(kù)包含可以檢測(cè)具有超過(guò)約10,000個(gè)基因、超過(guò)約15,000個(gè)基因、超過(guò)約20,000個(gè)基因、超過(guò)約25,000個(gè)基因、超過(guò)約30,000個(gè)基因或超過(guò)約35,000個(gè)基因或者等同數(shù)量的不同mRNA轉(zhuǎn)錄物的轉(zhuǎn)錄物組中的每個(gè)轉(zhuǎn)錄物的探針。在一個(gè)優(yōu)選方面,文庫(kù)包含可以檢測(cè)哺乳動(dòng)物轉(zhuǎn)錄物序列(例如,小鼠、大鼠、兔、猴或人序列)的探針。
通過(guò)提供可以用于快速開(kāi)發(fā)定量實(shí)時(shí)終點(diǎn)PCR測(cè)定的節(jié)省成本的多探針集合,本發(fā)明克服了在目前均相測(cè)定中存在的上述限制性。本發(fā)明多探針的檢測(cè)元件可以是單標(biāo)記的或雙標(biāo)記的(例如,通過(guò)在探針的每個(gè)末端或在探針的內(nèi)部位置包含標(biāo)記物)。因此,可以調(diào)整本發(fā)明探針,使其適用于5′核酸酶測(cè)定、分子信標(biāo)測(cè)定、FRET測(cè)定和其它相似測(cè)定。一方面,檢測(cè)多探針包括能夠彼此相互作用以產(chǎn)生信號(hào)或改變信號(hào)的兩個(gè)標(biāo)記物,由此可以在探針與靶序列雜交后檢測(cè)到信號(hào)或信號(hào)改變。一個(gè)特別的方面是,兩個(gè)標(biāo)記物包含淬滅分子和報(bào)道分子。
另一方面,探針包含靶特異性識(shí)別片段,該片段能夠特異地與包含互補(bǔ)識(shí)別序列的多個(gè)不同核酸分子雜交。本發(fā)明的一個(gè)特定的檢測(cè)方面稱作“具有莖區(qū)的分子信標(biāo)”,即,識(shí)別片段的兩側(cè)連接可以退火形成發(fā)夾的第一和第二互補(bǔ)發(fā)夾形成序列。報(bào)道標(biāo)記物連接于一個(gè)互補(bǔ)序列的末端,而淬滅部分連接于另一互補(bǔ)序列的末端。在第一和第二互補(bǔ)序列雜交時(shí)(即,探針識(shí)別片段未與其靶雜交時(shí))形成的莖使得這兩個(gè)標(biāo)記物彼此緊靠,從而導(dǎo)致報(bào)道分子產(chǎn)生的信號(hào)由于熒光共振能量轉(zhuǎn)移(FRET)而被淬滅。當(dāng)探針與靶序列雜交時(shí)降低了兩個(gè)標(biāo)記物之間的接近度,接近度的改變引起兩個(gè)標(biāo)記物之間的相互作用發(fā)生改變。由此探針的雜交致使從報(bào)道分子產(chǎn)生信號(hào)(例如,熒光),該信號(hào)可以被檢測(cè)和/或定量。
另一方面,多探針包含位于短識(shí)別序列的相對(duì)末端的報(bào)道分子和淬滅分子,這樣兩個(gè)部分彼此充分接近以致淬滅分子可以顯著地降低報(bào)道分子所產(chǎn)生的信號(hào)。這在探針游離于溶液中以及其與靶核酸結(jié)合時(shí)均是如此。在本發(fā)明的一個(gè)稱作“5′核酸酶測(cè)定”的特定檢測(cè)方面,多探針可以容易地被DNA聚合酶的5′核酸酶活性切割。該反應(yīng)可以導(dǎo)致淬滅分子和報(bào)道分子分離以及可檢測(cè)信號(hào)產(chǎn)生。由此,可以在基于擴(kuò)增的測(cè)定中使用這樣的探針以檢測(cè)和/或定量靶核酸的擴(kuò)增過(guò)程。
第一方面,本發(fā)明涉及上述多探針文庫(kù)。在該寡核苷酸探針文庫(kù)中,每個(gè)探針都包含具有約8-9個(gè)核苷酸長(zhǎng)度的檢測(cè)元件和識(shí)別片段,其中所述核苷酸中的一些或所有核酸堿基被與天然核酸堿基相比能夠增加結(jié)合親和力的非天然堿基替代,和/或所述寡核苷酸探針中的一些或所有核苷酸單元被化學(xué)基團(tuán)修飾以增加結(jié)合親和力,和/或其中所述寡核苷酸被化學(xué)基團(tuán)修飾以增加結(jié)合親和力,這樣探針在適于檢測(cè)的條件下將具有與靶序列結(jié)合的充分穩(wěn)定性,而且,其中,不同識(shí)別片段的數(shù)量占給定長(zhǎng)度的所有可能片段的10%以下,而且其中90%以上的探針可以檢測(cè)靶核酸群體中的一個(gè)以上互補(bǔ)靶,由此該寡核苷酸探針文庫(kù)可以檢測(cè)靶核酸群體的所有靶序列中的實(shí)質(zhì)上大部分靶序列。
因此,本發(fā)明涉及寡核苷酸探針文庫(kù),其中文庫(kù)中的每個(gè)探針都由識(shí)別序列標(biāo)簽和檢測(cè)部分組成,其中每個(gè)寡核苷酸探針中的至少一個(gè)單體是修飾的單體類似物,從而與相應(yīng)的未修飾寡核苷酸(其例如可以是未修飾的寡脫氧核糖核苷酸或寡核糖核苷酸)相比,增加了對(duì)互補(bǔ)靶序列的結(jié)合親和力,這樣,文庫(kù)探針具有充分的穩(wěn)定性可以用于序列特異性地結(jié)合和檢測(cè)任何給定靶群體中的靶核酸的實(shí)質(zhì)性部分,而且,其中不同識(shí)別序列的數(shù)量占給定長(zhǎng)度的所有可能序列標(biāo)簽的10%以下。
本發(fā)明還涉及寡核苷酸探針文庫(kù),其中文庫(kù)探針的識(shí)別序列標(biāo)簽片段已經(jīng)以至少一種以下方式進(jìn)行了修飾i)被至少一個(gè)非天然核苷酸替代;和ii)被至少一個(gè)化學(xué)基團(tuán)替代,以增加探針的穩(wěn)定性。
而且,本發(fā)明還涉及寡核苷酸探針文庫(kù),其中識(shí)別序列標(biāo)簽長(zhǎng)6-12個(gè)核苷酸(即,6、7、8、9、10、11或12),而且其中優(yōu)選長(zhǎng)度是8或9個(gè)核苷酸。
此外,本發(fā)明還涉及被LNA核苷酸替代的識(shí)別序列標(biāo)簽。
本發(fā)明的另一部分是,包含式I淬滅劑和5’-硝基吲哚殘基的寡核苷酸探針。認(rèn)為這種有用的多探針本身是創(chuàng)造性的。優(yōu)選的這種探針沒(méi)有5’胍基殘基,且通常這樣的發(fā)明的探針公開(kāi)在本說(shuō)明書和權(quán)利要求書中。特別優(yōu)選的探針是表1,表1A,圖13,或圖14所述的那些集合。
此外,本發(fā)明涉及本發(fā)明的文庫(kù),其中超過(guò)90%寡核苷酸探針可以結(jié)合和檢測(cè)核酸群體中的至少兩個(gè)靶序列,優(yōu)選地因?yàn)榻Y(jié)合的靶序列與探針的識(shí)別序列互補(bǔ)。
而且,優(yōu)選地,探針能夠檢測(cè)靶核酸群體中的一個(gè)以上靶標(biāo),例如,探針能夠與靶核酸群體中所含的多個(gè)不同核酸分子雜交。
本發(fā)明還提供用于設(shè)計(jì)包含至少一個(gè)穩(wěn)定化核酸堿基的多探針的方法、系統(tǒng)和寫在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序(“計(jì)算機(jī)程序產(chǎn)品”)。所述方法包含查詢靶序列數(shù)據(jù)庫(kù)(例如,表達(dá)序列數(shù)據(jù)庫(kù))和設(shè)計(jì)一個(gè)小的探針集合(例如,50或100或200或300或500種),其中所述探針1)具有在PCR條件下結(jié)合其相應(yīng)靶序列的充分結(jié)合穩(wěn)定性,ii)具有有限的自身形成雙鏈體結(jié)構(gòu)的傾向,和iii)能夠結(jié)合和檢測(cè)/定量給定序列數(shù)據(jù)庫(kù)(例如,表達(dá)序列數(shù)據(jù)庫(kù))的所有序列中的至少約60%、至少約70%、至少約80%、至少約90%或至少約95%。
計(jì)算機(jī)(In silico)設(shè)計(jì)探針,以包含具有給定長(zhǎng)度的所有可能核苷酸組合,從而形成虛擬候選探針數(shù)據(jù)庫(kù)。這些虛擬探針相對(duì)于靶序列數(shù)據(jù)庫(kù)進(jìn)行檢索,以鑒別具有檢測(cè)數(shù)據(jù)庫(kù)中最多不同靶序列的最大能力的探針(“最佳探針”)。從虛擬探針數(shù)據(jù)庫(kù)取出如此鑒別的最佳探針。此外,從靶核酸數(shù)據(jù)庫(kù)中扣除通過(guò)此先前的最佳探針集合鑒別的靶核酸。然后剩余的探針相對(duì)于剩余的靶序列進(jìn)行檢索以鑒別第二組最佳探針。重復(fù)該方法直到鑒別到能夠所需地覆蓋靶序列數(shù)據(jù)庫(kù)的一組探針??梢詫⒃摻M探針存儲(chǔ)在數(shù)據(jù)庫(kù)中作為序列來(lái)源用于轉(zhuǎn)錄物組分析??梢院铣删哂邢鄳?yīng)于該數(shù)據(jù)庫(kù)中序列的識(shí)別序列的多探針,以產(chǎn)生多探針文庫(kù)。
在一個(gè)優(yōu)選方面,靶序列數(shù)據(jù)庫(kù)包含相應(yīng)于人mRNA的核酸序列(例如,mRNA分子、cDNA等)。
另一方面,本發(fā)明方法還包含計(jì)算穩(wěn)定性,這基于識(shí)別序列包含至少一個(gè)穩(wěn)定化核苷酸(例如,LNA分子)的前提。在一個(gè)優(yōu)選方面,利用計(jì)算的穩(wěn)定性,在首次相對(duì)于靶序列數(shù)據(jù)庫(kù)進(jìn)行查詢以起始最佳探針識(shí)別序列的鑒別之前,從虛擬候選探針數(shù)據(jù)庫(kù)中除去穩(wěn)定性不足的探針識(shí)別序列。
另一方面,本發(fā)明方法還包含基于識(shí)別序列包含至少一個(gè)穩(wěn)定化核苷酸(例如LNA分子)的前提,計(jì)算給定探針識(shí)別序列自身形成雙鏈體結(jié)構(gòu)的傾向。在一個(gè)優(yōu)選方面,利用計(jì)算的傾向性,在首次相對(duì)于靶序列數(shù)據(jù)庫(kù)進(jìn)行查詢以起始最佳探針識(shí)別序列的鑒別之前,從虛擬候選探針數(shù)據(jù)庫(kù)中除去可能形成探針雙鏈體的探針識(shí)別序列。
另一方面,本發(fā)明方法還包含通過(guò)相對(duì)于剩余靶序列的查詢以及相對(duì)于起始靶序列集合的查詢,評(píng)價(jià)給定候選探針識(shí)別序列可加入至不斷增長(zhǎng)的最佳探針候選物集合的適用性。在一個(gè)優(yōu)選方面,只有同時(shí)頻繁出現(xiàn)在剩余靶序列和最初靶序列中的探針識(shí)別序列才被添加至正在增長(zhǎng)的最佳探針識(shí)別序列集合中。在最優(yōu)選的方面,這通過(guò)如下方式實(shí)現(xiàn)計(jì)算由這些查詢得到的分?jǐn)?shù)的乘積,并選擇具有最高乘積并且在針對(duì)當(dāng)前靶標(biāo)的查詢中仍屬于具有最佳分?jǐn)?shù)的20%的探針識(shí)別序列的探針識(shí)別序列。
本發(fā)明還提供寫入計(jì)算機(jī)可讀介質(zhì)的計(jì)算機(jī)程序,所述程序包含用于檢索包含多個(gè)不同靶序列的數(shù)據(jù)庫(kù)和用于鑒別能夠確定所述數(shù)據(jù)庫(kù)中的至少約60%、約70%、約80%、約90%和約95%序列的一組探針識(shí)別序列的指令。一方面,該程序提供實(shí)施如上所述方法的指令。另一方面,該程序提供實(shí)施如圖2所示的算法的指令。本發(fā)明還提供系統(tǒng),其中所述系統(tǒng)包含用于儲(chǔ)存包含多個(gè)不同靶序列的序列信息的數(shù)據(jù)庫(kù)的儲(chǔ)存器,還包含用于執(zhí)行如下程序指令的應(yīng)用程序,所述程序指令用于從數(shù)據(jù)庫(kù)中檢索出能夠與數(shù)據(jù)庫(kù)中至少約60%、約70%、約80%、約90%和約95%的序列雜交的一組探針識(shí)別序列。
本發(fā)明另一方面涉及包含各自獨(dú)立地具有約1至8或9個(gè)核苷酸長(zhǎng)度的識(shí)別片段和檢測(cè)元件的寡核苷酸探針,其中寡核苷酸中的一些或所有核苷酸被相對(duì)于天然核苷酸堿基而言能夠增加結(jié)合親和力的非天然堿基或堿基類似物替代,和/或寡核苷酸探針的一些或所有核苷酸單元被化學(xué)基團(tuán)修飾或被類似物置換以增加結(jié)合親和力,和/或其中所述寡核苷酸被化學(xué)基團(tuán)修飾或是寡核苷酸類似物以增加結(jié)合親和力,這樣,探針具有在適于檢測(cè)的條件下結(jié)合靶序列的充分穩(wěn)定性,而且其中探針能夠檢測(cè)靶核酸群體中一個(gè)以上的互補(bǔ)靶標(biāo)。
本發(fā)明的一個(gè)優(yōu)選實(shí)施方式是用于表征或檢測(cè)或定量靶核酸的試劑盒,所述試劑盒包含多探針文庫(kù)樣品。一方面,試劑盒包含針對(duì)其用途的計(jì)算機(jī)(in silico)操作方案。另一方面,試劑盒包含與獲得廉價(jià)DNA引物的建議相關(guān)的信息。這些試劑盒中所包含的探針可以具有上述的任一或所有特征。在一個(gè)優(yōu)選方面,多個(gè)探針都包含至少一個(gè)穩(wěn)定化核苷酸,例如LNA核苷酸。另一方面,多個(gè)探針都包含與至少一個(gè)化學(xué)基團(tuán)偶聯(lián)或穩(wěn)定結(jié)合的核苷酸以增加探針的結(jié)合穩(wěn)定性。在再一優(yōu)選方面,試劑盒包含約100種不同探針。根據(jù)本發(fā)明的試劑盒允許用戶快速且有效地開(kāi)發(fā)用于成千上萬(wàn)個(gè)不同核酸靶標(biāo)的測(cè)定。
本發(fā)明還提供包含一個(gè)或多個(gè)LNA核苷酸、具有約8或9個(gè)核苷酸的減少長(zhǎng)度的多探針。通過(guò)選擇通常出現(xiàn)的8和9-聚體作為靶,可以使用相同探針檢測(cè)許多不同基因。每一8或9-聚體探針可以用于檢測(cè)7000個(gè)以上的不同人mRNA序列。而必需的特異性由針對(duì)靶基因的廉價(jià)DNA引物以及靶向所擴(kuò)增的DNA的該8或9-聚體探針序列的組合作用來(lái)保證(圖1)。
在一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明涉及包含LNA替代的八聚體和九聚體的寡核苷酸多探針文庫(kù),該文庫(kù)具有少于約1000個(gè)序列,優(yōu)選少于500個(gè)序列,或更優(yōu)選地少于約200個(gè)序列,例如由約100個(gè)不同的所選序列組成,由此該文庫(kù)能夠識(shí)別靶生物或靶器官中約90%以上、更優(yōu)選地約95%以上,更優(yōu)選地約98%以上的mRNA序列。
陽(yáng)性對(duì)照樣品在設(shè)計(jì)用于多基因的實(shí)時(shí)PCR檢測(cè)測(cè)定時(shí)反復(fù)出現(xiàn)的問(wèn)題是這些從頭設(shè)計(jì)的成功率小于100%。查明非功能性測(cè)定可能是棘手的,因?yàn)槔硐氲孛總€(gè)探針需要一個(gè)靶特異性模板以檢驗(yàn)該檢測(cè)探針的功能性。而且,如果未知在測(cè)試樣品中是否存在靶標(biāo),則靶特異性模板可以用作陽(yáng)性對(duì)照。當(dāng)使用本發(fā)明所述探針文庫(kù)試劑盒中的有限數(shù)量的檢測(cè)探針(例如,90個(gè))進(jìn)行操作時(shí),也可以提供PCR可擴(kuò)增模板形式的陽(yáng)性對(duì)照靶,該陽(yáng)性對(duì)照靶含有針對(duì)該有限數(shù)量的探針的所有可能靶標(biāo)(例如,90個(gè))。該特征允許用戶評(píng)價(jià)各探針的功能,而對(duì)于非重現(xiàn)的以探針為基礎(chǔ)的測(cè)定,該特征是不適宜的,由此該特征構(gòu)成了本發(fā)明的又一有益特征。針對(duì)圖13列出的優(yōu)選的提議探針識(shí)別序列,我們?cè)O(shè)計(jì)了用于所有探針的對(duì)照序列多聯(lián)體,以包含用于前40個(gè)探針中每個(gè)探針的PCR可擴(kuò)增靶。
探針序列選擇本發(fā)明的一個(gè)重要方面是,在給定靶選擇標(biāo)準(zhǔn)的情況下,選擇最佳的探針靶序列,以便使用盡可能少的探針靶向眾多靶標(biāo)。這可以通過(guò)如下方式實(shí)現(xiàn)有意地選擇出現(xiàn)頻率高于從隨機(jī)分布可預(yù)期到的出現(xiàn)頻率的靶序列。
因此,本發(fā)明一方面涉及選擇可在本發(fā)明多探針文庫(kù)中使用的寡核苷酸序列的方法,該方法包含a)提供預(yù)定數(shù)量N(典型地選自6、7、8、9、10、11和12的整數(shù),優(yōu)選地8或9)核苷酸的所有可能寡核苷酸的第一集合(firstlist),所述寡核苷酸具有至少50℃(優(yōu)選地至少60℃,例如至少62℃)的解鏈溫度Tm;b)提供靶核酸序列的第二集合(second list)(例如本文討論的靶核酸群體的集合);c)針對(duì)所述第一集合的每一成員,分別地從所述第二集合鑒別并存儲(chǔ)包含了該成員的互補(bǔ)序列的第二集合成員的數(shù)目;d)選擇在步驟c的鑒別中與步驟c中鑒別出的最大數(shù)量的第二集合成員匹配的所述第一集合成員;e)將步驟d中選擇的成員添加至第三集合,該第三集合由選擇的可用于本發(fā)明文庫(kù)中的寡核苷酸組成;
f)從所述第一集合中扣除步驟d中選擇的成員,以提供修訂的第一集合;m)重復(fù)步驟d至f,直到所述第三集合由下述成員組成,所述成員一起能夠與步驟b的靶核酸序列集合中的至少30%成員互補(bǔ)(通常地,該百分?jǐn)?shù)將更高,例如,至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%,或甚至更高,例如至少97%、至少98%,甚至高達(dá)至少99%)。作為另一個(gè)特征,具有反對(duì)在第三集合中包含具有5’胍基(G)的成員的偏好,和/或反對(duì)在第三集合中包含具有3’胍基(G)的成員的偏好。這是下述令人驚奇的發(fā)現(xiàn)的結(jié)果,即當(dāng)本發(fā)明的探針不含有5’胍基殘基時(shí),它們?cè)跍y(cè)定中是非常有效的,但是還已經(jīng)證實(shí),3’胍基的省略會(huì)在測(cè)定條件下提供優(yōu)點(diǎn)。
所以,優(yōu)選地,在所述第三集合的所有寡核苷酸序列中,避免胍基作為5’殘基。
優(yōu)選地,該第一集合僅僅包含不能自我雜交的寡核苷酸,以便使隨后的探針使用具有較少的假陽(yáng)性傾向。
所述選擇方法可以在步驟f之后但在步驟m之前包含數(shù)個(gè)步驟g)從所述第二集合中扣除所有如下成員以獲得修訂的第二集合,其中所述成員包含與在步驟d中選出的成員互補(bǔ)的序列;h)針對(duì)所述修訂的第一集合的每一成員,從所述修訂的第二集合中鑒別和存儲(chǔ)包含與所述每一成員互補(bǔ)的序列的成員的數(shù)量;i)選擇在步驟h的鑒別中與步驟h中鑒別到的最大數(shù)量的第二集合成員匹配的所述第一集合的成員;或者,選擇通過(guò)步驟h中鑒別的數(shù)量和步驟c中鑒別的數(shù)量的乘積能夠給出最大數(shù)的所述第一集合成員;j)將步驟i中選擇的成員加入所述第三集合;k)從所述修訂的第一集合中扣除步驟i中選出的成員;和l)從所述修訂的第二集合中扣除所有如下成員,所述成員包含與步驟i中選出的成員互補(bǔ)的序列。
優(yōu)選地,如下實(shí)現(xiàn)上述的避免胍基作為5’殘基i)減小步驟a的集合,以僅包括不包含5’胍基殘基的那些序列,和/或ii)避免在步驟d和/或i中選擇包含5’胍基殘基的那些序列,和/或iii)在步驟e和/或j中省略包含5’胍基殘基的那些序列。
步驟c后步驟d的選擇可以方便地在鑒別所述第一集合中的如下成員之后進(jìn)行,所述成員與所述第二集合中超過(guò)選定百分?jǐn)?shù)(60%或更高,例如,優(yōu)選地80%)的最大成員數(shù)的成員雜交,由此在步驟d中僅僅選擇如此鑒別的成員。
本發(fā)明的方法也可以包括下述特征,即確保以前未被定性為有用探針的成員不會(huì)進(jìn)入第三集合?;蛘?,以更簡(jiǎn)單的描述,在設(shè)計(jì)文庫(kù)以后,測(cè)試各成員的有用性,將在相關(guān)測(cè)定中表現(xiàn)次優(yōu)的探針包含在“陰性集合”中,在以后設(shè)計(jì)新探針和探針文庫(kù)時(shí),再檢查該“陰性集合”。為了避免在第三集合中包含以前定性失敗的寡核苷酸序列,可以i)減小步驟a的集合,以僅包括以前沒(méi)有定性失敗的那些序列,和/或ii)避免在步驟d或i中選擇以前沒(méi)有定性失敗的那些序列,和/或iii)在步驟e和/或j中省略以前沒(méi)有定性失敗的那些序列。
在該選擇方法的實(shí)際實(shí)施中,所述第一、第二和第三集合存儲(chǔ)在計(jì)算機(jī)系統(tǒng)的存儲(chǔ)器,優(yōu)選地在數(shù)據(jù)庫(kù)中。存儲(chǔ)器(也稱作“計(jì)算機(jī)可讀介質(zhì)”)可以是易失性的和非易失性的,即,常規(guī)用于計(jì)算機(jī)系統(tǒng)中的任何存儲(chǔ)裝置隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、數(shù)據(jù)存儲(chǔ)裝置例如硬盤、CD-ROM、DVD-ROM和任何其它已知的存儲(chǔ)裝置。
本發(fā)明還提供在計(jì)算機(jī)可讀介質(zhì)(如上定義)中寫入了實(shí)施本發(fā)明選擇方法的指令的計(jì)算機(jī)程序產(chǎn)品。即,可以在快速計(jì)算機(jī)存儲(chǔ)器中編譯和負(fù)載該計(jì)算機(jī)程序,或者可以在永久性存儲(chǔ)裝置上(任選地以壓縮格式)負(fù)載并從該存儲(chǔ)裝置執(zhí)行該計(jì)算機(jī)程序。因此,本發(fā)明也包含如下系統(tǒng),該系統(tǒng)包含靶序列數(shù)據(jù)庫(kù)和用于執(zhí)行該計(jì)算機(jī)程序的應(yīng)用程序。圖17中給出了用于該計(jì)算機(jī)程序的源代碼。
在隨機(jī)分布的核酸群體中,具有給定長(zhǎng)度的選定序列的出現(xiàn)率將遵循以下定義的統(tǒng)計(jì)學(xué)分布N1=該給定的核酸群體的全長(zhǎng)(例如,在2003年6月30日第1次發(fā)布的RefSeq中為76,002,917個(gè)堿基對(duì))。
N2=該核酸群體包含的片段數(shù)目(例如,在2003年6月30日第1次發(fā)布的RefSeq中為38,556個(gè)基因)。
N3=識(shí)別序列的長(zhǎng)度(例如,9個(gè)堿基對(duì))N4 =出現(xiàn)率N4=(N1-((N3-1)×2×N2))/(4N3)例如, 或者 因此,如在以上實(shí)例中所述,隨機(jī)的8-聚體和9-聚體序列在具有所述38,556個(gè)mRNA序列的隨機(jī)群體中分別地平均出現(xiàn)1,151次和287次。
在以上實(shí)例中,源于38,556個(gè)基因的76,002,917個(gè)堿基對(duì)將相應(yīng)于平均1971bp的轉(zhuǎn)錄物長(zhǎng)度,各含有1971-16或者1955個(gè)9-聚體靶序列。因此,作為統(tǒng)計(jì)學(xué)最小值,對(duì)于一個(gè)探針靶向一個(gè)基因而言,將需要38,556/1955/287或5671個(gè)9-聚體探針。
然而,9-聚體序列的出現(xiàn)并非隨機(jī)分布的。事實(shí)上,一小組序列有驚人的高出現(xiàn)率,高達(dá)從隨機(jī)分布預(yù)期到的出現(xiàn)率的30倍以上。在根據(jù)優(yōu)選標(biāo)準(zhǔn)選擇的一個(gè)特定靶群體中,優(yōu)選地,應(yīng)當(dāng)選擇最常見(jiàn)的序列以增加所選的探針靶序列文庫(kù)的覆蓋率。如前所述,應(yīng)當(dāng)逐步實(shí)施選擇,以便在起始的靶群體中以及在每個(gè)選擇步驟之后的剩余群體中都對(duì)最常見(jiàn)的靶序列的選擇作出評(píng)價(jià)。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施方案中,探針文庫(kù)的靶標(biāo)是整個(gè)表達(dá)的轉(zhuǎn)錄物組。
由于逆轉(zhuǎn)錄酶反應(yīng)的成功率隨著所用的RT引物的距離變長(zhǎng)而減小,而且,由于通常使用poly-T引物靶向mRNA的poly-A尾,故上述靶標(biāo)可以進(jìn)一步被限制到僅僅包含每個(gè)mRNA中的1000個(gè)最近側(cè)的堿基。這可以導(dǎo)致對(duì)另一組最佳探針靶序列的選擇以獲得最佳覆蓋率。
同樣地,上述靶標(biāo)也可以被限制到僅僅包含基因內(nèi)含子側(cè)翼50bp的編碼區(qū)序列,從而確保測(cè)定優(yōu)選地僅監(jiān)測(cè)mRNA而不監(jiān)測(cè)基因組DNA,或者,可以限制到僅僅包含不含有二-、三-或四-重復(fù)序列的區(qū)域,以避免探針或引物與不舍已知等位基因變異的區(qū)域的反復(fù)結(jié)合,避免由于極高GC含量的靶序列或區(qū)域中的序列變異導(dǎo)致的引物或探針的錯(cuò)誤退火,從而避免對(duì)PCR擴(kuò)增的抑制作用。
取決于每個(gè)靶選擇,最佳探針集合可以隨著每個(gè)靶選擇中的靶序列的普遍性而發(fā)生變化。
探針文庫(kù)的實(shí)例人基因組的通過(guò)將基因組序列分成500核苷酸長(zhǎng)的片段,可以從基因組(它可以是人)提取基因組序列的集合。這樣的探針文庫(kù)可以用于測(cè)量任意的基因組序列,包括調(diào)節(jié)序列,內(nèi)含子,重復(fù)序列和其它基因組序列。通過(guò)本文公開(kāi)的方法,參考圖17,已經(jīng)鑒別出了下面的文庫(kù)。
適用于人基因組的寡核苷酸(oligo)的表



細(xì)菌可以從NCBI:ftp.ncbi.nih.gov下載199個(gè)細(xì)菌和古細(xì)菌基因組。根據(jù)核苷酸的使用,可以將基因組分類。核苷酸的均等使用是,每種核苷酸(a,c,g,t)使用頻率為25%。均等使用的偏差可以是例如偏差超過(guò)3%。按照該標(biāo)準(zhǔn),將199個(gè)基因組分成91個(gè)AT富集的,44個(gè)GC富集的,28個(gè)沒(méi)有>3%偏度,21個(gè)A富集的,15個(gè)其它類別。
細(xì)菌可以是高度AT富集的。這可以解釋為什么來(lái)自人探針文庫(kù)的探針不會(huì)產(chǎn)生良好的覆蓋率。因?yàn)榈徒怄湝囟?,為富含AT的生物設(shè)計(jì)探針是一項(xiàng)挑戰(zhàn)。探針必須更長(zhǎng),以達(dá)到解鏈溫度,但是這會(huì)降低覆蓋率。在下面的“細(xì)菌表”中,給出了主要的富含AT的基因組的探針文庫(kù)(也通過(guò)圖17所述的程序進(jìn)行鑒別)。



選擇檢測(cè)手段和鑒別單核酸本發(fā)明的另一部分涉及用于鑒別檢測(cè)靶核酸的手段的方法,該方法包含A)向計(jì)算機(jī)系統(tǒng)輸入唯一地確定所述靶核酸的核酸序列的數(shù)據(jù),其中所述計(jì)算機(jī)系統(tǒng)包含容納有至少一個(gè)本發(fā)明核酸探針文庫(kù)的組成信息的數(shù)據(jù)庫(kù),而且,其中所述計(jì)算機(jī)系統(tǒng)還包含針對(duì)所述至少一個(gè)文庫(kù)的每一探針的靶核酸序列數(shù)據(jù)庫(kù),和/或還包含獲取和比較核酸序列數(shù)據(jù)的手段;B)在該計(jì)算機(jī)系統(tǒng)中從所述至少一個(gè)文庫(kù)鑒別探針,其中所述探針的序列存在于靶核酸序列中或存在于該靶核酸序列的互補(bǔ)序列中;C)在計(jì)算機(jī)系統(tǒng)中鑒別可以擴(kuò)增所述靶核酸序列的引物;和D)提供指出步驟B中鑒別的探針和步驟C中鑒別的引物序列的輸出結(jié)果,作為用于檢測(cè)的特定鑒別手段。
當(dāng)期望快速而特異地鑒別特定核酸時(shí),上述方法有幾個(gè)優(yōu)點(diǎn)。如果研究者已經(jīng)獲得了適宜的本發(fā)明多探針文庫(kù),該方法使得可以在數(shù)秒內(nèi)獲取有關(guān)應(yīng)當(dāng)應(yīng)用于隨后測(cè)定的文庫(kù)探針的相關(guān)信息以及應(yīng)當(dāng)合成的引物的相關(guān)信息。由于引物對(duì)能夠過(guò)夜合成,而探針的合成通常是十分費(fèi)時(shí)而繁瑣的,因此時(shí)間因素是重要的。
為了有利于該方法的應(yīng)用,可以標(biāo)識(shí)探針文庫(kù)(例如,通過(guò)可以基本上告知計(jì)算機(jī)系統(tǒng)該探針文庫(kù)的組成的產(chǎn)品代碼)。由此,步驟A包含向計(jì)算機(jī)系統(tǒng)輸入標(biāo)識(shí)所述至少一個(gè)核酸文庫(kù)的數(shù)據(jù),從該核酸文庫(kù)將期望選出在特定檢測(cè)手段中使用的成員。
優(yōu)選的輸入界面是基于因特網(wǎng)的網(wǎng)頁(yè)界面,因?yàn)樵摲椒梢苑奖愕卮鎯?chǔ)在網(wǎng)絡(luò)服務(wù)器上以允許已經(jīng)獲得本發(fā)明探針文庫(kù)的用戶進(jìn)入。然而,該方法也可以用作可以安裝在單個(gè)計(jì)算機(jī)或局域網(wǎng)上的安裝型計(jì)算機(jī)應(yīng)用程序的一部分。
在該方法的優(yōu)選實(shí)施方案中,選擇步驟C中鑒別的引物以便最小化在PCR反應(yīng)中擴(kuò)增基因組核酸的可能性。這當(dāng)然只有在樣品可能含有基因組物質(zhì)的情況下是恰當(dāng)?shù)摹R环N簡(jiǎn)單的使擴(kuò)增基因組核酸的可能性最小化的方式是,在至少一個(gè)引物中包含在基因組DNA中被內(nèi)含子打斷的核苷酸序列。以此方式,引物將只引發(fā)已經(jīng)剪接去除了內(nèi)含子的轉(zhuǎn)錄物的擴(kuò)增。
或者,可以選擇不能擴(kuò)增基因組DNA或其它轉(zhuǎn)錄物的引物對(duì)。通過(guò)使用引物針對(duì)該基因組和轉(zhuǎn)錄物組進(jìn)行計(jì)算機(jī)化的搜索,即計(jì)算機(jī)PCR,可以鑒別這樣的引物。這樣的搜索必須發(fā)現(xiàn)和過(guò)濾下述的引物對(duì),其中左和右引物可以匹配典型擴(kuò)增子長(zhǎng)度距離內(nèi)的DNA,所述長(zhǎng)度可以是600個(gè)核苷酸或數(shù)千個(gè)核苷酸。左和右引物可以以4種不同的方式匹配1左引物和右引物的反向互補(bǔ)鏈。2左引物和左引物的反向互補(bǔ)鏈。3右引物和左引物的反向互補(bǔ)鏈。4右引物和右引物的反向互補(bǔ)鏈。
本發(fā)明方法的另一優(yōu)化是選擇步驟C中的引物以最小化從靶核酸序列的PCR擴(kuò)增獲得的擴(kuò)增子的長(zhǎng)度,此外,還優(yōu)選選擇該引物以優(yōu)化GC含量以便實(shí)施隨后的PCR。
就探針選擇方法而言,可以以提供寫在計(jì)算機(jī)可讀介質(zhì)上的實(shí)施本發(fā)明的指令的計(jì)算機(jī)程序產(chǎn)品形式,為終端用戶提供選擇檢測(cè)手段的方法。因此,本發(fā)明也提供了包含本發(fā)明探針文庫(kù)數(shù)據(jù)庫(kù)和執(zhí)行該計(jì)算機(jī)程序的應(yīng)用程序的系統(tǒng)。
該方法和計(jì)算機(jī)程序和系統(tǒng)允許定性或定量地確定樣品中靶核酸的存在,其包含i)通過(guò)本發(fā)明的檢測(cè)手段選擇方法,鑒別用于檢測(cè)靶核酸的特異手段,其中用于檢測(cè)的該特定手段包含寡核苷酸探針和一組引物;ii)獲得在步驟i)中鑒別的引物和寡核苷酸探針;iii)在來(lái)自步驟ii)的引物和寡核苷酸探針的存在下對(duì)樣品實(shí)施分子擴(kuò)增程序;和
iv)基于步驟iii)的結(jié)果確定靶核酸的存在。
方便地,步驟ii)中獲得的引物是通過(guò)合成獲得的,而且優(yōu)選地該寡核苷酸探針獲自本發(fā)明文庫(kù)。
分子擴(kuò)增方法典型地是PCR或NASBA程序,但是任何用于核酸特異擴(kuò)增(和可能地檢測(cè))的體外方法也均是有用的。優(yōu)選的PCR方法是qPCR(也稱作實(shí)時(shí)逆轉(zhuǎn)錄PCR或動(dòng)態(tài)RT-PCR)。
本發(fā)明的其它方面在以下進(jìn)行討論。
附圖簡(jiǎn)述圖1在(A)圖中說(shuō)明常規(guī)長(zhǎng)探針的使用,并在(B)圖中說(shuō)明來(lái)自根據(jù)本發(fā)明構(gòu)建的文庫(kù)的短多探針的特性和使用。該短多探針包含選擇的識(shí)別片段,這樣每個(gè)探針序列均可以用于檢測(cè)和/或定量包含互補(bǔ)識(shí)別序列的幾個(gè)不同靶序列。圖1A顯示根據(jù)現(xiàn)有技術(shù)的方法。圖1B顯示根據(jù)本發(fā)明一個(gè)方面的方法。
圖2是顯示用于設(shè)計(jì)根據(jù)本發(fā)明一個(gè)方面的文庫(kù)的多探針序列的方法的流程圖。該方法可以通過(guò)執(zhí)行寫在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序所提供的指令來(lái)實(shí)施。在一個(gè)方面,該程序指令通過(guò)包含序列數(shù)據(jù)庫(kù),例如表達(dá)序列數(shù)據(jù)庫(kù)的系統(tǒng)來(lái)執(zhí)行。
圖3說(shuō)明在根據(jù)本發(fā)明一個(gè)方面的100個(gè)探針的文庫(kù)中靶向每一基因的探針的冗余性。Y軸顯示了人轉(zhuǎn)錄物組中被文庫(kù)中不同數(shù)量的探針靶向的基因數(shù)。明顯地,在所有基因中大多數(shù)基因都被幾個(gè)探針靶向。每基因的平均探針數(shù)為17.4。
圖4顯示選擇的具有給定長(zhǎng)度的超冗余寡核苷酸對(duì)人轉(zhuǎn)錄物組的覆蓋率。該圖顯示了約38,000個(gè)人mRNA序列中可以通過(guò)遞增數(shù)量的不同長(zhǎng)度的所選短多探針檢測(cè)的百分?jǐn)?shù)。該圖說(shuō)明不同長(zhǎng)度的最佳選擇的(即,超冗余的、非自我互補(bǔ)的、熱穩(wěn)定的)短多探針對(duì)人轉(zhuǎn)錄物組的理論覆蓋率。該智人(Homo sapiens)轉(zhuǎn)錄物組序列從歐洲生物信息機(jī)構(gòu)(EMBL-EBI)獲得。最接近每個(gè)mRNA序列3′末端的1000nt區(qū)域(3′末端上游50nt至1050nt)被用于分析。在每個(gè)序列通過(guò)PCR擴(kuò)增后,擴(kuò)增的雙鏈體的兩條鏈都被認(rèn)為是探針文庫(kù)中的多探針的有效靶標(biāo)。排除甚至在具有LNA替代的情況下也不具有適當(dāng)Tm的探針序列和自身互補(bǔ)的探針序列。
圖5顯示寡核苷酸探針EQ13992的MALDI-MS譜,顯示[M-H]-=4121,3Da。
圖6顯示在雙標(biāo)記探針測(cè)定中使用9-聚體多探針檢測(cè)靶序列的典型實(shí)時(shí)PCR曲線。結(jié)果來(lái)自使用LNA增強(qiáng)的雙標(biāo)記9nt長(zhǎng)探針靶向同一基因內(nèi)的不同9-聚體序列的實(shí)時(shí)PCR反應(yīng)。在PCR中分別分析三個(gè)不同的雙標(biāo)記探針,產(chǎn)生469、570或671的SSA4擴(kuò)增子(每個(gè)長(zhǎng)81至95nt)。圖a、b和c分別顯示雙標(biāo)記探針469、570和671。每個(gè)探針僅僅檢測(cè)其設(shè)計(jì)用于檢測(cè)的擴(kuò)增子。對(duì)于雙標(biāo)記探針469、570和671,Ct值分別是23.7、23.2和23.4。加入2×107個(gè)拷貝的SSA4 cDNA作為模板。盡管在探針序列和其相應(yīng)的引物對(duì)上均存在差異,但結(jié)果之間高度相似,這說(shuō)明該測(cè)定是十分可靠的。
圖7顯示具有9-聚體和10-聚體識(shí)別位點(diǎn)的分子信標(biāo)的實(shí)時(shí)PCR曲線的實(shí)例。圖(A)具有10-聚體識(shí)別位點(diǎn)的分子信標(biāo)探針檢測(cè)469SSA4擴(kuò)增子。僅僅在添加有SSA4 cDNA(2×107拷貝)的樣品中獲得信號(hào)。得到24.0的Ct值。圖(B)顯示了使用具有9-聚體識(shí)別位點(diǎn)的分子信標(biāo)檢測(cè)570SSA4擴(kuò)增子的相似實(shí)驗(yàn)。僅僅在添加SSA4 cDNA(2×107個(gè)拷貝)時(shí)獲得信號(hào)。
圖8顯示使用具有9-聚體識(shí)別位點(diǎn)的SYBR探針靶向570SSA4擴(kuò)增子的實(shí)時(shí)PCR曲線實(shí)例。僅僅在添加了SSA4 cDNA(2×107個(gè)拷貝)的樣品中獲得信號(hào),而在不添加模板時(shí)檢測(cè)不到信號(hào)。
圖9顯示使用雙標(biāo)記探針測(cè)定原理得到的三個(gè)不同9-聚體多探針的校準(zhǔn)曲線。通過(guò)三個(gè)雙標(biāo)記探針檢測(cè)不同拷貝數(shù)水平的SSA4 cDNA。循環(huán)閾值nr定義各PCR首次檢測(cè)到信號(hào)時(shí)的循環(huán)數(shù)。三個(gè)線性回歸線的斜率(α)和相關(guān)系數(shù)(R2)為α=-3.456&R2=0.9999(雙標(biāo)記的469);α=-3.468&R2=0.9981(雙標(biāo)記的570);α=-3.499&R2=0.9993(雙標(biāo)記的671)。
圖10顯示在暴露于熱休克之前和之后在野生型酵母菌株以及突變菌株中利用9-聚體雙標(biāo)記的多探針定量熱休克蛋白,其中在所述突變菌株中已經(jīng)缺失了該相應(yīng)的基因。顯示了利用雙標(biāo)記的570探針對(duì)野生型(wt)酵母和SSA4敲除突變體中的SSA4轉(zhuǎn)錄物水平的實(shí)時(shí)檢測(cè)。所述不同菌株在30℃培養(yǎng)直到收獲(-HS)或者在收獲前暴露于40℃30分鐘。在本實(shí)例中使用雙標(biāo)記的570探針。僅僅在wt型菌株中檢測(cè)到該轉(zhuǎn)錄物,在+HS培養(yǎng)物中該轉(zhuǎn)錄物極其大量。對(duì)于+HS和-HS培養(yǎng)物,Ct值分別為26.1和30.3。
圖11顯示如何通過(guò)相同的9-聚體探針檢測(cè)一個(gè)以上基因同時(shí)不檢測(cè)不含探針靶序列(即,與識(shí)別序列互補(bǔ))的核酸分子的一個(gè)實(shí)例。在(a)中,雙標(biāo)記的469既檢測(cè)SSA4(469擴(kuò)增子)也檢測(cè)POL5轉(zhuǎn)錄物,Ct值分別為29.7和30.1。從APG9和HSP82轉(zhuǎn)錄物未檢測(cè)到信號(hào)。在(b)中,雙標(biāo)記的570既檢測(cè)SSA4(570擴(kuò)增子)也檢測(cè)APG9轉(zhuǎn)錄物,Ct值分別為31.3和29.2。從POL5和HSP82轉(zhuǎn)錄物未檢測(cè)到信號(hào)。在(c)中,雙標(biāo)記的671既檢測(cè)SSA4(671擴(kuò)增子)也檢測(cè)HSP82轉(zhuǎn)錄物,Ct值分別為29.8和25.6。從POL5和APG9轉(zhuǎn)錄物未檢測(cè)到信號(hào)。圖注中顯示在不同PCR中產(chǎn)生的擴(kuò)增子。使用與圖10所述測(cè)定相同量的cDNA。僅僅使用來(lái)自未熱休克的野生型酵母的cDNA。
圖12顯示在圖11的實(shí)例所示的PCR反應(yīng)中產(chǎn)生的部分?jǐn)U增子的瓊脂糖凝膠電泳,說(shuō)明探針對(duì)包含識(shí)別序列的靶序列是特異的,但是其不與不含該靶序列的核酸分子雜交。泳道1含有SSA4-469擴(kuò)增子(81bp),泳道2含有POL5擴(kuò)增子(94bp),泳道3含有APG9擴(kuò)增子(97bp),泳道4含有HSP82擴(kuò)增子(88bp)。泳道M含有50bp梯度作為大小指示劑。明顯地,在所有4種情況中都形成了產(chǎn)物;然而,僅僅包含正確的多探針靶序列的擴(kuò)增(即,SSA4-467和POL5)被雙標(biāo)記的探針467檢測(cè)到。從泳道1和2中檢測(cè)到的片段的大小差異,說(shuō)明事實(shí)上產(chǎn)生并檢測(cè)到了兩種不同的擴(kuò)增。
圖13優(yōu)選的靶序列。
圖14其它優(yōu)選的靶序列。
圖15長(zhǎng)聚物(1ongmer)(陽(yáng)性對(duì)照)。序列顯示在SEQ ID NOs.32-46中。
圖16選擇探針和設(shè)計(jì)用于qPCR的引物的方案。
圖17在多探針數(shù)據(jù)集的計(jì)算中使用的程序的源代碼。
圖18用攜帶Q4淬滅劑以及熒光素染料的探針進(jìn)行實(shí)時(shí)PCR得到的結(jié)果。
圖19用攜帶3’-硝基吲哚的雙標(biāo)記的探針進(jìn)行實(shí)時(shí)PCR得到的結(jié)果。
圖20用相對(duì)于擴(kuò)增的靶序列具有完全匹配或單個(gè)錯(cuò)配的探針進(jìn)行實(shí)時(shí)PCR得到的結(jié)果。作為對(duì)照,在實(shí)驗(yàn)組中包含沒(méi)有加入模板的PCR。
發(fā)明詳述本發(fā)明涉及短寡核苷酸探針或多探針,其被選擇和設(shè)計(jì)用于檢測(cè)、分類或表征和/或定量許多不同的靶核酸分子。這些多探針包含至少一個(gè)用于增加探針對(duì)識(shí)別序列的結(jié)合親和力的非天然修飾(例如,LNA核苷酸),其中所述識(shí)別序列是靶核酸分子的子序列。這些靶核酸分子在該識(shí)別序列之外是不同的。
一方面,多探針包含至少一個(gè)用化學(xué)基團(tuán)修飾以增加探針對(duì)識(shí)別序列(它是靶核酸序列的子序列)的結(jié)合親和力的核苷酸。另一方面,探針包含至少一個(gè)非天然核苷酸和至少一個(gè)被化學(xué)基團(tuán)修飾的核苷酸。再一方面,所述至少一個(gè)非天然核苷酸被化學(xué)基團(tuán)修飾。本發(fā)明還提供包含所述探針的試劑盒、文庫(kù)和其它組合物。
本發(fā)明還提供i)針對(duì)給定的靶序列混合物選擇和設(shè)計(jì)適宜的寡核苷酸探針的方法,ii)具有這些能力的單個(gè)探針,和iii)經(jīng)選擇和設(shè)計(jì)以致能夠用最少數(shù)量的探針序列檢測(cè)、分類和/或定量最大數(shù)量的靶核苷酸的此類探針文庫(kù)。根據(jù)本發(fā)明的每一探針因此均能夠結(jié)合許多不同的靶,并且當(dāng)與PCR測(cè)定中的一組特異引物組合時(shí)可以用于創(chuàng)建特異測(cè)定。
本發(fā)明的優(yōu)選核苷酸由約8至9個(gè)核苷酸單元組成,其實(shí)質(zhì)性部分包含穩(wěn)定化核苷酸,例如LNA核苷酸。優(yōu)選的文庫(kù)含有約100個(gè)這樣的探針,這些探針經(jīng)選擇和設(shè)計(jì)可以表征一組特異核酸,例如,mRNA、cDNA或基因組DNA。該文庫(kù)可以有多種用途,例如,基因表達(dá)分析、SNP檢測(cè)等(見(jiàn)例如圖1)。
定義針對(duì)本發(fā)明公開(kāi)中使用的特定術(shù)語(yǔ),提供如下定義。
除非上下文有清楚的另行說(shuō)明,如本文中所用,單數(shù)形式“a”、“an”和“the”包含復(fù)數(shù)的情況。例如,術(shù)語(yǔ)“細(xì)胞”包含多個(gè)細(xì)胞,包含其混合物。術(shù)語(yǔ)“核酸分子”包含多個(gè)核酸分子。
在本文中,術(shù)語(yǔ)“轉(zhuǎn)錄物組”(transcriptome)指任何物種基因組中轉(zhuǎn)錄的元件構(gòu)成的完整集合。
除了mRNA外,該術(shù)語(yǔ)也指用于結(jié)構(gòu)和調(diào)節(jié)目的的非編碼RNA。
在本文中,術(shù)語(yǔ)“擴(kuò)增子”指小的復(fù)制DNA片段。
本文中,“樣品”指從一個(gè)或多個(gè)生物體分離的組織或體液樣品,包含但不限于,例如,皮膚、血漿、血清、脊髓液、淋巴液、滑液、尿、眼淚、血液細(xì)胞、器官、腫瘤,以及體外細(xì)胞培養(yǎng)組分(包含但不限于通過(guò)細(xì)胞在細(xì)胞培養(yǎng)基中的生長(zhǎng)而產(chǎn)生的條件培養(yǎng)基、重組細(xì)胞和細(xì)胞組分)的樣品。
如本文所使用的,“生物”指活的實(shí)體,包含但不限于,例如,人、小鼠、大鼠、果蠅(例如D.melanogaster)、秀麗隱桿線蟲(chóng)(C.elegans)、酵母、擬南芥(Arabidopsis)、斑馬魚、靈長(zhǎng)類動(dòng)物(例如黑猩猩)、家畜等。
術(shù)語(yǔ)“SBC核酸堿基”指“選擇性結(jié)合的互補(bǔ)”核酸堿基,即,可以與其互補(bǔ)核酸堿基形成穩(wěn)定的氫鍵但不能與其它SBC核酸堿基形成穩(wěn)定氫鍵的修飾的核酸堿基。例如,SBC核酸堿基A′可以與其互補(bǔ)的非修飾核酸堿基T形成穩(wěn)定的氫鍵鍵合對(duì)。同樣,SBC核酸堿基T′可以與其互補(bǔ)的非修飾核酸堿基A形成穩(wěn)定的氫鍵鍵合對(duì)。然而,SBC核酸堿基A′和T ′與堿基對(duì)A′-T和A-T′相比將形成不穩(wěn)定的氫鍵鍵合對(duì)。同樣地,C的SBC核酸堿基被稱作C′,可以與其互補(bǔ)的非修飾核酸堿基G形成穩(wěn)定的氫鍵鍵合對(duì),而G的SBC核酸堿基被稱作G′,可以與其互補(bǔ)的非修飾核酸堿基C形成穩(wěn)定的氫鍵鍵合對(duì);而與堿基對(duì)C′-G和C-G′相比,C′和G′將形成不穩(wěn)定的氫鍵鍵合對(duì)。當(dāng)形成2個(gè)或2個(gè)以上的氫鍵時(shí)獲得穩(wěn)定的氫鍵鍵合對(duì),例如,A′和T、A和T′、C和G′以及C′和G之間形成的對(duì)。當(dāng)形成1個(gè)氫鍵或不形成氫鍵時(shí)獲得不穩(wěn)定的氫鍵鍵合對(duì),例如,A′和T′以及C′和G′之間的對(duì)。
尤其有意義的SBC核酸堿基是2,6-二氨基嘌呤(A′,也稱作D)以及2-硫代尿嘧啶(U′,也稱作2SU)(2-硫代-4-氧代-嘧啶)和2-硫代胸腺嘧啶(T′,也稱作2ST)(2-硫代-4-氧代-5-甲基-嘧啶)。圖4說(shuō)明A-2ST以及D-T對(duì)具有2個(gè)或2個(gè)以上的氫鍵,而D-2ST對(duì)形成單個(gè)(不穩(wěn)定的)氫鍵。同樣地,圖9顯示了SBC核酸堿基吡咯并-[2,3-d]嘧啶-2(3H)-酮(C′,也稱作PyrroloPyr)以及次黃嘌呤(G′,也稱作I)(6-氧代-嘌呤),其中PyrroloPyr-G以及C-I對(duì)各具有2個(gè)氫鍵,而PyrroloPyr-I對(duì)形成單個(gè)氫鍵。
“SBC LNA寡聚體”指含有至少一個(gè)“LNA單元”的“LNA寡聚體”,其中該核酸堿基是“SBC核酸堿基”?!熬哂蠸BC核酸堿基的LNA單元”是指“SBC LNA單體”。一般來(lái)講,SBC LNA寡聚體包括除了SBCLNA單體外還含有其它修飾的或天然的核苷酸或核苷的寡聚體?!癝BC單體”是指具有SBC核酸堿基的非LNA單體?!暗刃蛄泄押塑账帷笔侵冈赪atson-Crick意義上與相應(yīng)的修飾寡核苷酸具有相同序列的寡核苷酸,例如,序列agTtcATg等價(jià)于agTscD2SUg,其中s等價(jià)于SBCDNA單體2-硫代-t或2-硫代-u,D等價(jià)于SBC LNA單體LNA-D,2SU等價(jià)于SBC LNA單體LNA2SU。
如本文所用,術(shù)語(yǔ)“核酸”、“多核苷酸”和“寡核苷酸”指引物、探針、待檢測(cè)的寡聚體片段、寡聚體對(duì)照和未標(biāo)記的封閉寡聚體,并且應(yīng)當(dāng)屬于多聚脫氧核糖核苷酸(含有2-脫氧-D-核糖)、多聚核糖核苷酸(含有D-核糖)、以及作為嘌呤或嘧啶堿基或修飾的嘌呤或嘧啶堿基的N糖苷的任何其它類型的多核苷酸。術(shù)語(yǔ)“核酸”、“多核苷酸”和“寡核苷酸”之間并不存在有意的長(zhǎng)度區(qū)別,這些術(shù)語(yǔ)可以互換使用。這些術(shù)語(yǔ)僅僅指分子的一級(jí)結(jié)構(gòu)。因此,這些術(shù)語(yǔ)包含雙鏈和單鏈DNA以及雙鏈和單鏈RNA。寡核苷酸由相應(yīng)于指定的核苷酸序列區(qū)域的約至少3個(gè)核苷酸、優(yōu)選至少約6個(gè)核苷酸,更優(yōu)選至少約8至30個(gè)核苷酸的序列組成?!跋鄳?yīng)”指與該指定的序列相同或互補(bǔ)。
物理上,寡核苷酸不一定來(lái)源于任何已有或天然的序列,而是可以以任何方式產(chǎn)生,包含化學(xué)合成、DNA復(fù)制、逆轉(zhuǎn)錄或其組合。術(shù)語(yǔ)“寡核苷酸”或“核酸”意指半合成來(lái)源的或合成來(lái)源的基因組DNA或RNA、cDNA的多核苷酸,根據(jù)其來(lái)源或操作,該多核苷酸(1)與天然和其連接的所有或部分多核苷酸均不相連;和/或(2)與非其天然連接的多核苷酸連接;和(3)是天然中不存在的。
由于單核苷酸之間的反應(yīng)通過(guò)一個(gè)單核苷酸的戊糖環(huán)的5′磷酸與其相鄰單核苷酸的3′氧按一定方向借助磷酸二酯鍵連接而形成寡核苷酸,故當(dāng)寡核苷酸的5′磷酸未與單核苷酸戊糖環(huán)的3′氧連接時(shí)寡核苷酸的末端被稱作“5′末端”,而如果其3′氧未與隨后的單核苷酸的戊糖環(huán)的5′磷酸連接時(shí)則該寡核苷酸的末端被稱作“3′末端”。在本文中,一段核酸序列,即使位于更大寡核苷酸的內(nèi)部,也可以說(shuō)具有5′和3′末端。
當(dāng)兩個(gè)不同的非重疊的寡核苷酸與同一個(gè)線性互補(bǔ)核酸序列的不同區(qū)域退火時(shí),一個(gè)寡核苷酸的3′末端將對(duì)著另一個(gè)寡核苷酸的5′末端;前者可以被稱作“上游”寡核苷酸,而后者被稱作“下游”寡核苷酸。
術(shù)語(yǔ)“引物”可以指一個(gè)以上引物,其是指當(dāng)被放置在催化與核酸鏈互補(bǔ)的引物延伸產(chǎn)物合成的條件下時(shí),能夠作為沿著互補(bǔ)鏈的合成的起始點(diǎn)起作用的寡核苷酸,而無(wú)論該寡核苷酸是天然的(以純化的限制性消化產(chǎn)物的形式)還是合成產(chǎn)生的。所述條件包含在適宜的緩沖液(“緩沖液”包含作為輔因子或影響pH、離子強(qiáng)度等的組分)中以及在適宜溫度下存在4種不同的脫氧核糖核苷三磷酸以及聚合誘導(dǎo)劑例如DNA聚合酶或逆轉(zhuǎn)錄酶。引物優(yōu)選是單鏈的以便獲得最大擴(kuò)增效率。
如本文所用,術(shù)語(yǔ)“PCR反應(yīng)”、“PCR擴(kuò)增”、“PCR”和“實(shí)時(shí)PCR”是可以互換使用的術(shù)語(yǔ),其用于指應(yīng)用核酸擴(kuò)增系統(tǒng)以擴(kuò)增所檢測(cè)的靶核酸。該系統(tǒng)的實(shí)例包含聚合酶鏈?zhǔn)椒磻?yīng)(PCR)系統(tǒng)和連接酶鏈?zhǔn)椒磻?yīng)(LCR)系統(tǒng)。本領(lǐng)域技術(shù)人員已知的和近來(lái)描述的其它方法有基于核酸序列的擴(kuò)增(NASBATM,Cangene,Mississauga,Ontario)和Qβ復(fù)制酶系統(tǒng)。通過(guò)所述擴(kuò)增反應(yīng)形成的產(chǎn)物可以進(jìn)行實(shí)時(shí)檢測(cè)或也可以不進(jìn)行實(shí)時(shí)監(jiān)測(cè),或者僅在反應(yīng)后進(jìn)行終點(diǎn)測(cè)量。
本文中,核酸序列的互補(bǔ)物是指當(dāng)與該核酸序列對(duì)齊以致一個(gè)序列的5′末端與另一序列的3′末端配對(duì)時(shí)與該核酸序列存在反平行關(guān)系的寡核苷酸。在本發(fā)明的核酸中可以包含在天然核酸中不常見(jiàn)的堿基,這些堿基包含例如次黃苷和7-脫氮雜鳥(niǎo)嘌呤(7-deazaguanine)?;パa(bǔ)可以不是完全的;穩(wěn)定的雙鏈體可以含有錯(cuò)配堿基對(duì)或未配對(duì)的堿基。核酸技術(shù)領(lǐng)域的技術(shù)人員可以通過(guò)經(jīng)驗(yàn)地考慮多個(gè)變量,包含例如寡核苷酸的長(zhǎng)度、寡核苷酸中胞嘧啶和鳥(niǎo)嘌呤堿基的濃度百分?jǐn)?shù)、離子強(qiáng)度以及錯(cuò)配堿基對(duì)的發(fā)生率,以確定雙鏈體的穩(wěn)定性。
核酸雙鏈體的穩(wěn)定性可以通過(guò)解鏈溫度或“Tm”測(cè)定。在規(guī)定條件下特定核酸雙鏈體的Tm是半數(shù)堿基對(duì)解離時(shí)的溫度。
如本文所使用的,術(shù)語(yǔ)“探針”指標(biāo)記的寡核苷酸,其與靶核酸中的序列由于探針中的至少一段序列與該靶區(qū)中的序列互補(bǔ)而形成雙鏈體結(jié)構(gòu)。探針優(yōu)選地不含有與用作聚合酶鏈?zhǔn)椒磻?yīng)引物的序列互補(bǔ)的序列。一般地,探針的3′端被“封閉”以阻止探針摻入引物延伸產(chǎn)物。“封閉”可以通過(guò)使用非互補(bǔ)堿基或通過(guò)向最后一個(gè)核苷酸的3′羥基添加化學(xué)基團(tuán)例如生物素或甚至磷酸基團(tuán)(取決于所選的部分,這可以通過(guò)還起到標(biāo)記的作用而達(dá)到雙重目的)來(lái)實(shí)現(xiàn)。
術(shù)語(yǔ)“標(biāo)記物”在本文中指可以用于提供可檢測(cè)(優(yōu)選地可定量的)信號(hào)并且可以與核酸或蛋白質(zhì)連接的任何原子或分子。標(biāo)記物可以提供能夠通過(guò)熒光、放射性、比色、X射線衍射或吸收、磁性、酶活性等檢測(cè)的信號(hào)。
如本文所使用的,“5′→3′核酸酶活性”或“5′至3′的核酸酶活性”是指模板特異性核酸聚合酶的活性,包含常規(guī)與一些DNA聚合酶相關(guān)的5′→3′外切核酸酶活性--通過(guò)該活性,核苷酸依次從寡核苷酸的5′末端被除去(例如,大腸桿菌DNA聚合酶I具有該活性而Klenow片段則不具備該活性)--或者5′→3′內(nèi)切核酸酶活性--其中距離5′末端一個(gè)以上核苷酸的位置處發(fā)生切除--或者兩者。
如本文所使用的,術(shù)語(yǔ)“熱穩(wěn)定核酸聚合酶”指與例如來(lái)自大腸桿菌的核苷酸聚合酶相比對(duì)加熱具有相對(duì)較高的穩(wěn)定性并且催化核苷聚合的酶。一般地,該酶在與靶序列退火的引物的3′末端起始合成,并沿著模板朝著5′方向前進(jìn),而且,如果其具有5′至3′的核酸酶活性時(shí),將水解或置換介入其間的退火探針以釋放標(biāo)記和未標(biāo)記的探針片段或完整探針,直到合成終止。分離自水生棲熱菌(Thermus aquaticus)的代表性熱穩(wěn)定酶(Taq)描述在美國(guó)專利4,889,818中,在常規(guī)PCR中使用它的方法描述在Saiki等(1988),Science239487中。
術(shù)語(yǔ)“核酸堿基”包含天然核酸堿基腺嘌呤(A)、鳥(niǎo)嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)以及非天然核酸堿基例如黃嘌呤、二氨基嘌呤、8-氧代-N6-甲基腺嘌呤、7-脫氮雜黃嘌呤、7-脫氮雜鳥(niǎo)嘌呤、N4,N4-橋亞乙基胞嘧啶(ethanocytosin)、N6,N6-橋亞乙基(ethano)-2,6-二氨基嘌呤、5-甲基胞嘧啶、5-(C3-C6)-炔基-胞嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、假尿嘧啶(pseudoisocytosine)、2-羥基-5-甲基-4-三唑并吡啶、異胞嘧啶、異鳥(niǎo)嘌呤、次黃苷和Benner等的美國(guó)專利5,432,272以及Susan M.Freier和Karl-Heinz Altmann,Nucleic Acid Research,254429-4443,1997中描述的“非天然”核酸堿基。術(shù)語(yǔ)“核酸堿基”由此不僅包含已知的嘌呤和嘧啶雜環(huán),還包含它們的雜環(huán)類似物和互變異構(gòu)體。其它天然和非天然核酸堿基包含如下文獻(xiàn)中描述的那些美國(guó)專利3,687,808;AntisenseResearch and Application,S.T.Crooke和B.Lebleu編,CRC Press,1993中Sanghvi著的第15章;Englisch等,Angewandte Chemie,International Edition,30613-722,1991(見(jiàn),尤其是第622和623頁(yè));以及Concise Encyclopedia of Polymer Science andEngineering,J.I.Kroschwitz Ed.,John Wiley&Sons,858-859頁(yè),1990;Cook,Anti-Cancer DrugDesign6585-607,1991;所有上述文獻(xiàn)特此完整并入作為參考。
術(shù)語(yǔ)“核苷堿基”或“核酸堿基類似物”也旨在包含可以象核苷堿基一樣起作用的雜環(huán)化合物,包含某些“通用堿基”,這些堿基按最經(jīng)典的意義不是核苷堿基但是其可以充當(dāng)核苷堿基。尤其可以提及的“通用堿基”是3-硝基吡咯和5-硝基吲哚。其它優(yōu)選化合物包含芘和吡啶并唑衍生物、芘基、芘基甲基丙三醇衍生物等。其它優(yōu)選的通用堿基包含,吡咯、二唑或三唑衍生物,包含本領(lǐng)域已知的那些通用堿基。
“通用堿基”是指天然的或期望地非天然的化合物或基團(tuán),其可以與天然堿基(例如,腺嘌呤、鳥(niǎo)嘌呤、胞嘧啶、尿嘧啶和/或胸腺嘧啶)配對(duì)并且如本文所述具有差15、12、10、8、6、4或2℃或更少的Tm。
“寡核苷酸”、“寡聚體”或“寡物”指通過(guò)核苷間鍵連接的一條連續(xù)的單體(例如,雜環(huán)堿基的糖苷)鏈。在寡物中兩個(gè)連續(xù)單體之間的鍵由2至4個(gè)、期望地3個(gè)基團(tuán)/原子組成,所述基團(tuán)/原子選自-CH2-、-O-、-S-、-NRH-、>C=O、>C=NRH、>C=S、-Si(R″)2-、-SO-、-S(O)2-、-P(O)2-、-PO(BH3)-、-P(O,S)-、-P(S)2-、-PO(R″)-、-PO(OCH3)-、和-PO(NHRH)-,其中RH選自氫和C1-4烷基,且R″選自C1-6-烷基和苯基。該鍵的說(shuō)明性實(shí)例有-CH2-CH2-CH2-、-CH2-CO-CH2-、-CH2-CHOH-CH2-、-O-CH2-O-、-O-CH2-CH2-、-O-CH2-CH=(當(dāng)用作與隨后單體形成的鍵時(shí)包含R5)、-CH2-CH2-O-、-NRH-CH2-CH2-、-CH2-CH2-NRH-、-CH2-NRH-CH2-、-O-CH2-CH2-NRH-、-NRH-CO-O-、-NRH-CO-NRH-、-NRH-CS-NRH-、-NRH-C(=NRH)-NRH-、-NRH-CO-CH2-NRH-、-O-CO-O-、-O-CO-CH2-O-、-O-CH2-CO-O-、-CH2-CO-NRH-、-O-CO-NRH-、-NRH-CO-CH2-、-O-CH2-CO-NRH-、-O-CH2-CH2-NRH-、-CH=N-O-、-CH2-NRH-O-、-CH2-O-N=(當(dāng)用作與隨后單體形成的鍵時(shí)包含R5)、-CH2-O-NRH-、CO-NRH-CH2-、CH2-NRH-O-、CH2-NRH-CO-、-O-NRH-CH2-、-O-NRH-、-O-CH2-S-、-S-CH2-O-、-CH2-CH2-S-、-O-CH2-CH2-S-、-S-CH2-CH=(當(dāng)用作與隨后單體形成的鍵時(shí)包含R5)、-S-CH2-CH2-、-S-CH2-CH2-O-、-S-CH2-CH2-S-、-CH2-S-CH2-、-CH2-SO-CH2-、-CH2-SO2-CH2-、-O-SO-O-、-O-S(O)2-O-、-O-S(O)2-CH2-、-O-S(O)2-NRH-、-NRH-S(O)2-CH2-、-O-S(O)2-CH2-、-O-P(O)2-O-、-O-P(O,S)-O-、-O-P(S)2-O-、-S-P(O)2-O-、-S-P(O,S)-O-、-S-P(S)2-O-、-O-P(O)2-S-、-O-P(O,S)-S-、-O-P(S)2-S-、-S-P(O)2-S-、-S-P(O,S)-S-、-S-P(S)2-S-、-O-PO(R″)-O-、-O-PO(OCH3)-O-、-O-PO(OCH2CH3)-O-、-O-PO(OCH2CH2S-R)-O-、-O-PO(BH3)-O-、-O-PO(NHRN)-O-、-O-P(O)2-NRH-、-NRH-P(O)2-O-、-O-P(O,NRH)-O-、-CH2-P(O)2-O-、-O-P(O)2-CH2-、和-O-Si(R″)2-O-;尤其期望的是其中的-CH2-CO-NRH-、-CH2-NRH-O-、-S-CH2-O-、-O-P(O)2-O-、-O-P(O,S)-O-、-O-P(S)2-O-、-NRH-P(O)2-O-、-O-P(O,NRH)-O-、-O-PO(R″)-O-、-O-PO(CH3)-O-、和-O-PO(NHRN)-O-,其中RH選自氫和C1-4-烷基,且R″選自C1-6-烷基和苯基。其它示例性實(shí)例可見(jiàn)于Mesmaeker等,Current Opinion in Structural Biology1995,5,343-355和Susan M.Freier和Karl-Heinz Altmann,NucleicAcids Research,1997,25卷,4429-4443頁(yè)。核苷間鍵的左側(cè)作為取代基P*與5元環(huán)的3′位置連接,而其右側(cè)與前一單體的5′位置連接。
“LNA單元”指單個(gè)LNA單體(例如,LNA核苷或LNA核苷酸)或包含至少一個(gè)LNA單體的寡聚體(例如,寡核苷酸或核酸)。一般地,描述于WO99/14226中的LNA單元是尤其期望摻入本發(fā)明寡核苷酸中的修飾核酸。此外,該核酸可以在3′和/或5′末端被本領(lǐng)域已知的任何修飾類型修飾。例如,任一端或兩端可以用保護(hù)基加帽、連接柔性連接基團(tuán)、連接反應(yīng)性基團(tuán)以有助于附著基質(zhì)表面,等。期望的LNA單元及其合成方法也公開(kāi)在如下文獻(xiàn)中WO 00/47599、US 6,043,060、US6,268,490、PCT/JP98/00945、WO 0107455、WO 0100641、WO 9839352、WO 0056746、WO 0056748、WO 0066604;Morita等,Bioorg.Med.Chem.Lett.12(1)73-76,2002;Hakansson等,Bioorg.Med.Chem.Lett.11(7)935-938,2001;Koshkin等,J.Org.Chem.66(25)8504-8512,2001;Kvaerno等,J.Org.Chem.66(16)5498-5503,2001;Hakansson等,J.Org.Chem.65(17)5161-5166,2000;Kvaerno等,J.Org.Chem.65(17)5167-5176,2000;Pfundheller等,Nucleosides Nucleotides18(9)2017-2030,1999;和Kumar等,Bioorg.Med.Chem.Lett.8(16)2219-2222,1998。
優(yōu)選的LNA單體,也稱作“氧基-LNA”,是包含PCT公布WO03/020739中所述雙環(huán)化合物的LNA單體,其中下式(I)中所示R4′和R2′之間的橋在一起表示-CH2-O-(甲氧基LNA)或-CH2-CH2-O-(乙氧基LNA,也稱作ENA)。
其它優(yōu)選的LNA單體稱作“硫基-LNA”或“氨基-LNA”,包含WO99/14226中所公開(kāi)的雙環(huán)結(jié)構(gòu),其中下式(I)所示R4′和R2′之間的橋中的雜原子在一起表示-CH2-S-、-CH2-CH2-S-、-CH2-NH-或-CH2-CH2-NH-。
“LNA修飾的寡核苷酸”是指包含至少一個(gè)下式(I)的LNA單體單元的寡核苷酸及其堿式鹽和酸加成鹽,其具有以下描述的示例性修飾實(shí)例
其中X選自-O-,-S-,-N(RN)-,-C(R6R6*)-,-O-C(R7R7*)-,-C(R6R6*)-O-, -S-C(R7R7*)-,-C(R6R6*)-S-,-N(RN*)-C(R7R7*)-,-C(R6R6*)-N(RN*)-,和-C(R6R6*)-C(R7R7*)。
B選自如上所述的修飾堿基,例如,任選取代的碳環(huán)芳基,例如,任選取代的芘或任選取代的芘基甲基丙三醇,或任選取代的雜脂環(huán)或任選取代的雜芳族,例如,任選取代的吡啶并唑、任選取代的吡咯、任選取代的二唑或任選取代的三唑部分;氫、羥基、任選取代的C1-4-烷氧基、任選取代的C1-4-烷基、任選取代的C1-4-酰氧基、核酸堿基、DNA嵌入劑、光化學(xué)活性基團(tuán)、熱化學(xué)活性基團(tuán)、螯合基團(tuán)、報(bào)道基團(tuán)和配體;P表示用于和隨后的單體形成核苷間鍵的基團(tuán)位置或表示5′末端基團(tuán),該核苷間鍵或5′末端基團(tuán)任選地包含取代基R5。取代基R2、R2*、R3及R3*中的一個(gè)是基團(tuán)P*,P*表示與前面的單體形成的核苷間鍵或2′/3′-末端基團(tuán)。R1*、R4*、R5、R5*、R6、R6*、R7、R7*、RN取代基以及不表示P*的R2、R2*、R3和R3*取代基各自可以表示選自如下的包含約1-8個(gè)基團(tuán)/原子的雙基-C(RaRb)-、-C(Ra)=C(Ra)-、-C(Ra)=N-、-C(Ra)-O-、-O-、-Si(Ra)2-、-C(Ra)-S、-S-、-SO2-、-C(Ra)-N(Rb)-、-N(Ra)-和>C=Q,其中Q選自-O-、-S-和-N(Ra)-,且Ra和Rb各自獨(dú)立地選自氫、任選取代的C1-12-烷基、任選取代的C2-12-鏈烯基、任選取代的C2-12-炔基、羥基、C1-12-烷氧基、C2-12-鏈烯基氧基、羧基、C1-12-烷氧羰基、C1-12-烷基羰基、甲?;?、芳基、芳基氧基羰基、芳基氧基、芳基羰基、雜芳基、雜芳基氧基羰基、雜芳基氧基、雜芳基羰基、氨基、單和雙(C1-6-烷基)氨基、氨基甲酰基、單和雙(C1-6-烷基)氨基羰基、氨基-C1-6-烷基-氨基羰基、單和雙(C1-6-烷基)氨基-C1-6-烷基-氨基羰基、C1-6-烷基-羰基氨基、脲基、C1-6-烷?;趸?、sulphono、C1-6-烷基磺酰基氧基、硝基、疊氮基、硫烷基(sulphanyl)、C1-6-烷基硫基、鹵素、DNA嵌入劑、光化學(xué)活性基團(tuán)、熱化學(xué)活性基團(tuán)、螯合基團(tuán)、報(bào)道基團(tuán)和配體,其中芳基和雜芳基可以被任選地取代,并且其中兩個(gè)孿位取代基Ra和Rb一起可以是任選取代的亞甲基(=CH2),而且其中兩個(gè)選自Ra、Rb的非孿位或?qū)\位的取代基和存在的且不參與P、P*或所述雙基的取代基R1*、R2、R2*、R3、R3*、R4*、R5、R5*、R6、R6*、R7、R7*之任一可以一起形成選自前述相同類型的雙基的連接的雙基;由此非孿位取代基對(duì)與(i)和所述非孿位取代基結(jié)合的原子及(ii)任何介于其間的原子一起形成單或雙環(huán)實(shí)體;存在的但不參與P、P*或雙基的取代基R1*、R2、R2*、R3、R4*、R5、R5*、R6、R6*、R7和R7*各自獨(dú)立地選自氫、任選取代的C1-12-烷基、任選取代的C2-12-鏈烯基、任選取代的C2-12-炔基、羥基、C1-12-烷氧基、C2-12-鏈烯基氧基、羧基、C1-12-烷氧羰基、C1-12-烷基羰基、甲?;?、芳基、芳基氧基羰基、芳基氧基、芳基羰基、雜芳基、雜芳基氧基羰基、雜芳基氧基、雜芳基羰基、氨基、單和雙(C1-6-烷基)氨基、氨基甲?;?、單和雙(C1-6-烷基)氨基羰基、氨基-C1-6-烷基-氨基羰基、單和雙(C1-6-烷基)氨基-C1-6-烷基-氨基羰基、C1-6-烷基-羰基氨基、脲基、C1-6-烷?;趸ulphono、C1-6-烷基磺酰基氧基、硝基、疊氮基、硫烷基(sulphanyl)、C1-6-烷基硫基、鹵素、DNA嵌入劑、光化學(xué)活性基團(tuán)、熱化學(xué)活性基團(tuán)、螯合基團(tuán)、報(bào)道基團(tuán)和配體,其中芳基和雜芳基可以被任選地取代,并且其中兩個(gè)孿位取代基可以一起表示氧代、硫氧代(thioxo)、亞氨基或任選取代的亞甲基,或者可以一起形成由1-5個(gè)碳原子亞烷基鏈組成的螺雙基,其中所述亞烷基鏈任選地被選自-O-、-S-和-(NRN)-(其中RN選自氫和C1-4-烷基)的一個(gè)或多個(gè)雜原子/基團(tuán)中斷和/或終止,并且其中兩個(gè)相鄰(非孿位)取代基可以表示導(dǎo)致雙鍵的另一鍵;而且,當(dāng)存在但不參與雙基時(shí),RN*選自氫和C1-4-烷基。
示例性的5′、3′和/或2′末端基團(tuán)包括-H、-OH、鹵代(例如,氯代、氟代、碘代或溴代)、任選取代的芳基(例如苯基或芐基)、烷基(例如,甲基或乙基)、烷氧基(例如甲氧基)、?;?例如,乙?;虮郊柞;?、芳?;?、芳烷基、羥基、羥基烷基、烷氧基、芳基氧基、芳烷氧基、硝基、氰基、羧基、烷氧羰基、芳氧羰基、芳烷氧基羰基、酰基氨基、芳?;被⑼榛酋;⒎蓟酋;?、雜芳基磺?;?、烷基亞磺酰基、芳基亞磺?;㈦s芳基亞磺?;?、烷基硫基、芳基硫基、雜芳基硫基、芳烷基硫基、雜芳烷基硫基、脒基、氨基、氨基甲酰基、氨磺?;?、鏈烯基、炔基、保護(hù)基(例如,甲硅烷基、4,4′-二甲氧基三苯甲基、單甲氧基三苯甲基、或三苯甲基)、接頭(例如,含有胺、乙二醇、醌例如蒽醌的接頭)、可檢測(cè)標(biāo)記物(例如,放射性標(biāo)記或熒光標(biāo)記)和生物素。
可以理解,此處提及核酸單元、核酸殘基、LNA單元或類似術(shù)語(yǔ)時(shí)包含單獨(dú)的核苷單元和核苷酸單元以及寡核苷酸中的核苷單元和核苷酸單元。
“修飾的堿基”或其它類似術(shù)語(yǔ)指可以與天然堿基(例如,腺嘌呤、鳥(niǎo)嘌呤、胞嘧啶、尿嘧啶和/或胸腺嘧啶)配對(duì)和/或可以與非天然核酸堿基或核苷堿基配對(duì)的合成物(例如,非天然的核酸堿基或核苷堿基)。期望地,修飾的堿基提供如所述的差15、12、10、8、6、4或2℃或更少的Tm。示例性修飾堿基描述在EP1072679和WO97/12896中。
術(shù)語(yǔ)“化學(xué)基團(tuán)”指分子的一部分。“被化學(xué)基團(tuán)修飾”由此指通過(guò)包含不尋常的化學(xué)結(jié)構(gòu)對(duì)標(biāo)準(zhǔn)分子結(jié)構(gòu)所進(jìn)行的修飾。所述結(jié)構(gòu)的附著可以是共價(jià)的或非共價(jià)的。
術(shù)語(yǔ)在寡核苷酸探針中“包含化學(xué)基團(tuán)”由此指附著分子結(jié)構(gòu)。該化學(xué)基團(tuán)包括但不限于共價(jià)地和/或非共價(jià)地結(jié)合的小溝結(jié)合劑(MGB)和/或嵌入核酸(INA)--選自不對(duì)稱菁染料、DAPI、SYBR GreenI、SYBR Green II、SYBR Gold、PicoGreen、噻唑橙、Hoechst33342、溴化乙錠、1-O-(1-芘基甲基)丙三醇和Hoechst33258。其它化學(xué)基團(tuán)包括修飾的核酸堿基、核苷堿基或LNA修飾的寡核苷酸。
術(shù)語(yǔ)“雙標(biāo)記的探針”指具有兩個(gè)附著的標(biāo)記物的寡核苷酸。一方面,一個(gè)標(biāo)記物附著于探針?lè)肿拥?′端,而另一標(biāo)記物附著于分子的3′端。本發(fā)明的一個(gè)特定方面包含附著于一端的熒光分子和附著于另一端的能夠通過(guò)熒光共振能量轉(zhuǎn)移(FRET)淬滅該熒光團(tuán)的分子。5′核酸酶測(cè)定探針和一些分子信標(biāo)是雙標(biāo)記的探針的實(shí)例。
術(shù)語(yǔ)“5′核酸酶測(cè)定探針”指可以被DNA聚合酶的5′-3′外切核酸酶活性水解的雙標(biāo)記探針。在特定的PCR測(cè)定所用條件下,5′核酸酶測(cè)定探針不一定被DNA聚合酶的5′-3′外切核酸酶活性水解。名稱“5′核酸酶測(cè)定”的使用與所觀察到的水解程度無(wú)關(guān),其并不表示實(shí)驗(yàn)者的任何預(yù)期。術(shù)語(yǔ)“5′核酸酶測(cè)定探針”和“5′核酸酶測(cè)定”僅僅指這樣的測(cè)定,在該測(cè)定中并不特別關(guān)注避免所涉及的探針的水解。“5′核酸酶測(cè)定探針”常常被稱作“TaqMan測(cè)定探針”,而“5′核酸酶測(cè)定”則常常被稱作“TaqMan測(cè)定”。這些名稱在本申請(qǐng)中可以互換使用。
術(shù)語(yǔ)“寡核苷酸類似物”指能夠識(shí)別特定的靶核苷酸序列的核酸結(jié)合分子。一種特定的寡核苷酸類似物是肽核酸(PNA),在PNA中,寡核苷酸的糖磷酸主鏈被蛋白樣主鏈替代。在PNA中,核酸堿基與不帶電荷的聚酰胺主鏈結(jié)合,產(chǎn)生嵌合的假肽-核酸結(jié)構(gòu),該結(jié)構(gòu)與核酸形式同形。
術(shù)語(yǔ)“分子信標(biāo)”指不可能受到DNA聚合酶的5′-3′外切核酸酶活性影響的單或雙標(biāo)記的探針。對(duì)探針、聚合酶或測(cè)定條件的特定修飾可以避免由于DNA聚合酶的5′-3′外切核酸酶活性而分離標(biāo)記物或核苷酸組分。因此,檢測(cè)的原則取決于分子信標(biāo)與其靶序列結(jié)合后在標(biāo)記物引起的信號(hào)上出現(xiàn)的可檢測(cè)的差異。在本發(fā)明的一個(gè)方面,該寡核苷酸探針通過(guò)其5′和3′端的互補(bǔ)序列的介導(dǎo)而在選定的測(cè)定溫度下形成分子內(nèi)發(fā)夾結(jié)構(gòu)。所述的寡核苷酸可以在一端結(jié)合熒光分子,在另一端結(jié)合當(dāng)與發(fā)夾結(jié)構(gòu)中的熒光團(tuán)互相靠近時(shí)能淬滅該熒光團(tuán)的分子。在本發(fā)明的另一方面,并不基于探針序列兩端的互補(bǔ)結(jié)構(gòu)形成發(fā)夾結(jié)構(gòu),而是可以由于一個(gè)或兩個(gè)標(biāo)記物與所形成的雙鏈體結(jié)構(gòu)之間的相互作用,或由于結(jié)合后探針空間構(gòu)象的一般改變--或由于結(jié)合后標(biāo)記物之間的降低的相互作用,而導(dǎo)致結(jié)合后所檢測(cè)到的信號(hào)改變。分子信標(biāo)的一個(gè)特定方面包含多個(gè)LNA殘基以抑制DNA聚合酶的5′-3′外切核酸酶活性的水解作用。
術(shù)語(yǔ)“多探針”在本文中指含有識(shí)別片段的探針,其中所述識(shí)別片段是與靶核酸分子中的識(shí)別序列充分互補(bǔ)以致可以在中等嚴(yán)格條件下和/或適于PCR、5′核酸酶測(cè)定和/或分子信標(biāo)分析(或一般地任何基于FRET的方法)的條件下與該序列結(jié)合的探針序列。所述條件是本領(lǐng)域技術(shù)人員熟知的。優(yōu)選地,識(shí)別序列存在于所評(píng)價(jià)的多個(gè)序列,例如轉(zhuǎn)錄物組中。本發(fā)明的多探針可以含有非天然核苷酸(“穩(wěn)定化核苷酸”)并且可以比含有相同序列但無(wú)穩(wěn)定化修飾的探針具有更高的識(shí)別序列結(jié)合親和力。優(yōu)選地,多探針的至少一個(gè)核苷酸被化學(xué)基團(tuán)修飾(例如,在PCR反應(yīng)的至少雜交階段,共價(jià)地或以其它方式穩(wěn)定地結(jié)合),以增加識(shí)別片段對(duì)識(shí)別序列的結(jié)合親和力。
如本文所使用的,對(duì)識(shí)別序列比含有相同序列但無(wú)穩(wěn)定化核苷酸的探針具有增加的“結(jié)合親和力”的多探針是指這樣的探針,該探針的識(shí)別片段的結(jié)合常數(shù)(Ka)比雙鏈分子的互補(bǔ)鏈的結(jié)合常數(shù)高。在另一優(yōu)選實(shí)施方案中,該探針的識(shí)別片段的結(jié)合常數(shù)比雙鏈分子中靶序列的識(shí)別序列的互補(bǔ)鏈的解離常數(shù)(Kd)高。
“多探針文庫(kù)”或“多探針的文庫(kù)”包含多個(gè)多探針,由此文庫(kù)中探針的總數(shù)能夠識(shí)別轉(zhuǎn)錄物組的大部分(包含豐度最高的序列),這樣轉(zhuǎn)錄物組中約60%、約70%、約80%、約85%,更優(yōu)選地約90%,甚至更優(yōu)選地95%的靶核酸可以被探針檢測(cè)。
當(dāng)單體含有能夠根據(jù)Watson-Crick堿基配對(duì)原則(例如,G與C、A與T或A與U)形成氫鍵的核酸堿基或者含有其它氫鍵鍵合基序(例如二氨基嘌呤與T、次黃苷與C、假異胞嘧啶與G等)時(shí),該單體被稱作是“互補(bǔ)的”。
術(shù)語(yǔ)“隨后的單體”指位于5′端方向的相鄰單體,“前面的單體”指位于3′端方向的相鄰單體。
如本文所使用的,術(shù)語(yǔ)“靶群體”是指多個(gè)不同的核酸序列,例如來(lái)自特定物種的基因組或其它核酸,包括基因組的轉(zhuǎn)錄物組,其中轉(zhuǎn)錄物組指任何物種的基因組的所有轉(zhuǎn)錄的元件的集合。通常,核酸群體中不同靶序列的數(shù)目為至少100,但是清楚地,該數(shù)目常常高得多(超過(guò)200、500、1000和10000--當(dāng)靶群體是真核生物的轉(zhuǎn)錄物組時(shí))。
如本文所使用的,術(shù)語(yǔ)“靶核酸”指任何相關(guān)的具有單一特定序列的核酸,例如,生物核酸,例如來(lái)源于患者、動(dòng)物(人或非人動(dòng)物)、植物、細(xì)菌、真菌、古細(xì)菌(archae)、細(xì)胞、組織、生物體等。例如,當(dāng)靶核酸來(lái)源于細(xì)菌、古細(xì)菌、植物、非人動(dòng)物、細(xì)胞、真菌或非人生物時(shí),本發(fā)明方法任選地還包含基于靶核酸的檢測(cè),選擇該細(xì)菌、古細(xì)菌、植物、非人動(dòng)物、細(xì)胞、真菌或非人生物。一個(gè)實(shí)施方案中,靶核酸來(lái)源于患者,例如人患者。在該實(shí)施方案中,本發(fā)明任選地還包含基于靶核酸的檢測(cè),選擇療法、診斷疾病、或診斷疾病的遺傳易感性。
如本文所使用的,術(shù)語(yǔ)“靶序列”指任何靶核酸中的特定核酸序列。
術(shù)語(yǔ)“嚴(yán)格條件”在本文中是指在約Tm-5℃(低于探針解鏈溫度(Tm)5℃)至約低于Tm20-25℃的范圍內(nèi)出現(xiàn)的嚴(yán)格性。本領(lǐng)域技術(shù)人員將理解,可以改變雜交的嚴(yán)格性以鑒別或檢測(cè)相同或相關(guān)的多核苷酸序列。雜交技術(shù)一般地可以參見(jiàn)Nucleic Acid Hybridization,APractical Approach,Bd.Hames,B.D.和Higgins,S.J.,IRL Press,1985;Gall和Pardue,Proc.Natl.Acad.Sci.,USA63378-383,1969;和John等,Nature223582-587,1969。
多探針現(xiàn)參考圖1B,根據(jù)本發(fā)明的多探針優(yōu)選為短的序列探針,其可以與多個(gè)不同靶核酸中存在的識(shí)別序列結(jié)合,由此該多探針特異地與靶核酸雜交但不與不含有該識(shí)別序列的核酸分子發(fā)生可檢測(cè)水平的雜交。優(yōu)選地,多探針的集合,或多探針文庫(kù),能夠識(shí)別轉(zhuǎn)錄物組的大部分(包含豐度最高的序列),例如轉(zhuǎn)錄物組中的約60%、約70%、約80%、約85%、更優(yōu)選地約90%、甚至更優(yōu)選地95%的靶核酸可以被探針檢測(cè)。本發(fā)明的多探針包含“穩(wěn)定化修飾”,例如非天然核苷酸(“穩(wěn)定化核苷酸”),其比包含相同序列但無(wú)該穩(wěn)定化序列的探針對(duì)識(shí)別序列具有更高的結(jié)合親和力。優(yōu)選地,多探針的至少一個(gè)核苷酸被化學(xué)基團(tuán)修飾(例如,在PCR反應(yīng)的至少雜交階段,與探針共價(jià)地或以其它方式穩(wěn)定地結(jié)合),以增加識(shí)別片段對(duì)識(shí)別序列的結(jié)合親和力。
一方面,具有6至12個(gè)核苷酸的多探針包含1至6個(gè)或甚至多達(dá)12個(gè)的穩(wěn)定化核苷酸,例如LNA核苷酸。LNA增強(qiáng)的探針文庫(kù)含有識(shí)別短識(shí)別序列(例如,8至9個(gè)核苷酸)的短探針。LNA核酸堿基可以包含α-LNA分子(見(jiàn)例如,WO 00/66604)或xylo-LNA分子(見(jiàn)例如,WO00/56748)。
一方面,優(yōu)選地,多探針與其識(shí)別序列結(jié)合時(shí)的Tm為約55℃至約70℃。
另一方面,多探針包含一個(gè)或多個(gè)修飾的核酸堿基。修飾的堿基單元可以含有與核酸單元,例如呋喃糖基(furasonyl)環(huán)的1′位通過(guò)接頭,例如直鏈或支鏈亞烷基或亞鏈烯基基團(tuán)連接的環(huán)單元(例如,碳環(huán)單元如芘基)。亞烷基基團(tuán)適宜地具有1個(gè)(即,-CH2-)至約12個(gè)碳原子,更典型地1至約8個(gè)碳原子,甚至更典型地1至約6個(gè)碳原子。亞鏈烯基基團(tuán)適宜地具有1、2或3個(gè)碳-碳雙鍵以及2至約12個(gè)碳原子,更典型地2至約8個(gè)碳原子,甚至更典型地2至約6個(gè)碳原子。
本發(fā)明的多探針對(duì)于實(shí)施諸如實(shí)時(shí)PCR等測(cè)定是理想的,因?yàn)楸景l(fā)明的探針優(yōu)選具有少于約25個(gè)核苷酸、少于約15個(gè)核苷酸、少于約10個(gè)的核苷酸,例如8或9個(gè)核苷酸。優(yōu)選地,多探針可以在PCR條件下與靶序列中的識(shí)別序列特異地雜交,并且優(yōu)選地該識(shí)別序列存在于至少約50個(gè)、至少約100個(gè)、至少約200個(gè)、至少約500個(gè)不同的靶核酸分子中。本發(fā)明的多探針文庫(kù)包含含有不同識(shí)別序列的多探針,這樣任何兩個(gè)多探針都可以與不同的靶核酸分子組雜交。在一方面,所述的靶核酸分子組包含一些相同的靶核酸分子,即,含有目的基因序列的靶核酸分子可以被一個(gè)以上的多探針結(jié)合。該靶核酸分子將含有至少兩個(gè)不同的識(shí)別序列,這些序列可以重疊1個(gè)或多個(gè)核苷酸,但少于包含x個(gè)核苷酸的識(shí)別序列的x個(gè)核苷酸。
一方面,多探針文庫(kù)包含多個(gè)不同的多探針,每個(gè)不同的探針?lè)謩e地定位在固體基質(zhì)上的離散位置。在本文中,“定位”指被限制于或定址于所述位置上,這樣,可以沿著在該位置檢測(cè)到的雜交事件跟蹤到具有已知序列身份的探針。定位的探針可以和基質(zhì)穩(wěn)定地結(jié)合或可以不和基質(zhì)穩(wěn)定地結(jié)合。例如,探針可以處于微滴定板孔中的溶液中,并由此被定位或定址于該孔。作為備選方案,或者此外地,探針可以與基質(zhì)穩(wěn)定地結(jié)合,這樣在一次或多次使用緩沖液洗滌該基質(zhì)后探針仍保留在基質(zhì)上的確定位置上。例如,探針可以通過(guò)化學(xué)方式與基質(zhì)直接地或通過(guò)接頭分子結(jié)合,其中所述接頭分子可以是核酸序列、肽或?qū)|(zhì)上的分子具有親和力的任何類型的分子。
或者,靶核酸分子可以定位在基質(zhì)上(例如,以細(xì)胞、細(xì)胞裂解物或核酸的形式點(diǎn)在基質(zhì)上)。
一旦確定了適當(dāng)?shù)男蛄?,?yōu)選地多LNA探針使用現(xiàn)有技術(shù)中(Tetrahedron543607-30,1998)描述的商業(yè)上可獲得的方法以及設(shè)備,通過(guò)化學(xué)方式合成。例如,可以使用固相亞磷酰胺方法制備短LNA探針(Caruthers等,Cold Spring Harbor Symp.Quant.Biol.47411-418,1982;Adams等,J.Am.Chem.Soc.105661(1983))。
多探針文庫(kù)中的多探針與一個(gè)或一個(gè)以上靶序列(優(yōu)選地與多個(gè)靶序列)的雜交程度可以通過(guò)本領(lǐng)域已知的任何方法進(jìn)行測(cè)定。如果沒(méi)有可檢測(cè)的雜交,雜交程度是0。典型地,使用標(biāo)記的信號(hào)核酸檢測(cè)雜交?;パa(bǔ)核酸或信號(hào)核酸可以通過(guò)典型地用于檢測(cè)是否存在雜交的多核苷酸的幾種方法中的任一種進(jìn)行標(biāo)記。最常見(jiàn)的檢測(cè)方法是使用與標(biāo)記的抗體、熒光團(tuán)或化學(xué)發(fā)光試劑結(jié)合的配體。其它標(biāo)記物包含可以充當(dāng)用于標(biāo)記的配體的特異結(jié)合對(duì)的成員的抗體。標(biāo)記的選擇取決于所需的靈敏性與探針綴合的容易程度、穩(wěn)定性要求和可用的設(shè)備。
含有LNA的探針典型地在合成過(guò)程中進(jìn)行標(biāo)記。亞磷酰胺合成方法的靈活性還有利于容易地產(chǎn)生帶有可用于該標(biāo)準(zhǔn)化學(xué)的所有商業(yè)接頭、熒光團(tuán)和標(biāo)記分子的LNA。LNA也可以通過(guò)酶反應(yīng),例如激酶反應(yīng)來(lái)標(biāo)記。
本發(fā)明的多探針可以含有單個(gè)標(biāo)記物或多個(gè)標(biāo)記物。在一個(gè)方面,所述多個(gè)標(biāo)記物包含在多探針與靶序列發(fā)生雜交時(shí)可以彼此相互作用以產(chǎn)生信號(hào)或產(chǎn)生信號(hào)改變的成對(duì)標(biāo)記物。
另一方面,多探針包含熒光團(tuán)部分和淬滅劑部分,這兩個(gè)部分在多探針中所處的位置使得該探針的雜交狀態(tài)可以通過(guò)來(lái)自該核酸的熒光信號(hào)的增加而區(qū)別于該探針的未雜交狀態(tài)。一方面,多探針除了含有識(shí)別元件外還含有第一和第二互補(bǔ)序列,這兩個(gè)序列在探針未與靶分子中的識(shí)別序列雜交時(shí)將彼此特異地雜交,從而使得淬滅分子與所述報(bào)道分子足夠接近以淬滅報(bào)道分子的熒光。靶分子的雜交使得淬滅分子與報(bào)道分子遠(yuǎn)離,導(dǎo)致與雜交量成比例的信號(hào)。
另一方面,可以使用具有5′核酸酶活性的聚合酶檢測(cè)核酸鏈的聚合。將熒光團(tuán)和淬滅分子以充分接近的方式摻入探針中,以致在探針與其識(shí)別序列雜交時(shí)淬滅分子淬滅熒光團(tuán)分子的信號(hào)。具有5′核酸酶活性的聚合酶對(duì)探針的切割將導(dǎo)致淬滅分子和熒光團(tuán)分子分離以及隨著核酸序列存在遞增信號(hào)量。
在本文中,術(shù)語(yǔ)“標(biāo)記物”指報(bào)道基團(tuán),其本身可以被檢測(cè)或者可以作為檢測(cè)系列的一部分被檢測(cè)。報(bào)道基團(tuán)的功能性部分的實(shí)例是生物素、地高辛配基、熒光基團(tuán)(能夠吸收特定波長(zhǎng)的電磁輻射,例如光或x射線,并隨后以更長(zhǎng)波長(zhǎng)的輻射形式放出所吸收的能量的基團(tuán);舉例說(shuō)明實(shí)例有DANSYL(5-二甲基氨基)-1-萘磺?;?、DOXYL(N-氧基-4,4-二甲基唑烷)、PROXYL(N-氧基-2,2,5,5-四甲基吡咯烷)、TEMPO(N-氧基-2,2,6,6-四甲基哌啶)、二硝基苯基、吖啶、香豆素、Cy3及Cy5(Biological Detection Systems,Inc.的商標(biāo))、赤蘚紅、香豆酸、7-羥基香豆素、得克薩斯紅、羅丹明、四甲基羅丹明、Rox、7-硝基苯并-2--1-二唑(NBD)、芘、熒光素、銪、釕、釤和其它稀土金屬)、放射性同位素標(biāo)記物、化學(xué)發(fā)光標(biāo)記物(可以通過(guò)化學(xué)反應(yīng)過(guò)程中釋放的光而得到檢測(cè)的標(biāo)記物)、自旋標(biāo)記物(與生物分子結(jié)合的自由基(例如,取代的有機(jī)氨基氧(nitroxide))或其它順磁探針(例如,Cu2+、Mg2+),其可以通過(guò)使用電子自旋共振譜法檢測(cè))。尤其有意義的實(shí)例是生物素、熒光素、得克薩斯紅、羅丹明、二硝基苯基、地高辛配基、釕、銪、Cy5、Cy3等。
靶核酸分子的適宜實(shí)例可以包含多種多樣的真核和原核細(xì)胞,包含原生質(zhì)體;或可能含有靶核酸的其它生物材料。因此,本發(fā)明的方法可以應(yīng)用于組織培養(yǎng)動(dòng)物細(xì)胞、動(dòng)物細(xì)胞(例如,血液、血清、血漿、網(wǎng)織紅細(xì)胞、淋巴細(xì)胞、尿、骨髓組織、腦脊液或從血液或淋巴制備的任何產(chǎn)物)或任何類型的組織活檢物(例如,肌肉活檢物、肝活檢物、腎活檢物、膀胱活檢物、骨活檢物、軟骨活檢物、皮膚活檢物、胰腺活檢物、腸道活檢物、胸腺活檢物、乳腺活檢物、子宮活檢物、睪丸活檢物、眼活檢物或腦活檢物,例如在裂解緩沖液中勻漿)、歸檔的組織核酸、植物細(xì)胞或?qū)B透壓休克敏感的其它細(xì)胞、以及細(xì)菌細(xì)胞、酵母、病毒、支原體、原生動(dòng)物、立克次氏體、真菌和其它小微生物細(xì)胞等。
可以分析被多個(gè)多探針識(shí)別的靶核酸以檢測(cè)在靶核酸分子群體中占10%以下、約5%以下、約1%以下、約0.1%以下、約0.01%以下的序列(例如,特定的基因序列)。用于檢測(cè)該序列的測(cè)定類型不是本發(fā)明的限制性特征,可以包含PCR或本領(lǐng)域已知的或開(kāi)發(fā)用于檢測(cè)靶核酸分子群體中所占不足10%的識(shí)別序列的一些其它適宜測(cè)定。
一方面,檢測(cè)較低豐度的識(shí)別序列的測(cè)定包含與至少一個(gè)引物雜交,其中所述引物能夠特異地與該識(shí)別序列雜交,但是其不能實(shí)質(zhì)性地與群體中約50個(gè)以上、約25個(gè)以上、約10個(gè)以上、約5個(gè)以上、約2個(gè)以上(例如,該探針識(shí)別純合基因序列的兩個(gè)拷貝)的靶核酸分子,或1個(gè)以上的靶核酸(例如,樣品中存在的單拷貝雜合基因序列的等位基因)雜交。在一個(gè)優(yōu)選的方面,提供一對(duì)此類引物,該對(duì)引物位于多探針?biāo)b別的識(shí)別序列側(cè)翼,即,位于識(shí)別序列的可擴(kuò)增距離內(nèi),由此可以產(chǎn)生約40至5000個(gè)堿基的擴(kuò)增子,優(yōu)選地產(chǎn)生50至500個(gè)或更優(yōu)選地60至100個(gè)堿基的擴(kuò)增子。可以標(biāo)記這些引物中的一個(gè)或多個(gè)。
多種擴(kuò)增反應(yīng)是本領(lǐng)域技術(shù)人員熟知的,包含但不限于PCR、RT-PCR、LCR、體外轉(zhuǎn)錄、滾環(huán)PCR、OLA等。也可以在多重PCR中使用多個(gè)引物以檢測(cè)一組特定的靶分子。
本發(fā)明還提供設(shè)計(jì)用于本發(fā)明方法和試劑盒中的多探針序列的方法。圖2顯示了略述該方法步驟的流程圖。
一方面,計(jì)算機(jī)(in silico)產(chǎn)生多個(gè)具有n個(gè)核苷酸的n聚體(n-聚體),以包含所有可能的n聚體。選擇具有Tm≥60℃的n聚體的子集。另一方面,選擇探針子集,在所述子集中的探針不能自身雜交,從而提供一列候選n聚體或一個(gè)候選n聚體數(shù)據(jù)庫(kù)。使用每個(gè)n聚體的序列查詢包含多個(gè)靶序列的數(shù)據(jù)庫(kù)。優(yōu)選地,該靶序列數(shù)據(jù)庫(kù)含有表達(dá)的序列,例如人mRNA序列。
從用于查詢數(shù)據(jù)庫(kù)的該列候選n聚體,選擇鑒別最大數(shù)量的靶序列的n聚體(例如,包含與靶數(shù)據(jù)庫(kù)中最大數(shù)量的靶序列的子序列互補(bǔ)的識(shí)別片段的n聚體),以產(chǎn)生n聚體/靶序列矩陣。將與最大數(shù)量的靶序列結(jié)合的n聚體的序列存儲(chǔ)在最佳探針序列數(shù)據(jù)庫(kù)中,并且從候選n聚體數(shù)據(jù)庫(kù)中扣除這些n聚體。從靶序列數(shù)據(jù)庫(kù)中除去被此第一組最佳探針鑒別的靶序列。然后針對(duì)剩余的候選探針重復(fù)該過(guò)程,直到鑒別到包含了能夠覆蓋約60%以上、約80%以上、約90%以上,約95%的靶序列的多個(gè)n聚體的一組多探針??梢允褂妹恳徊借b別的最佳序列產(chǎn)生虛擬(virtual)多探針序列數(shù)據(jù)庫(kù)。然后可以合成含有來(lái)自該多探針數(shù)據(jù)庫(kù)的序列的多探針。
另一方面,該方法還包含通過(guò)在剩余靶序列中進(jìn)行查詢和在最初的靶序列組中進(jìn)行查詢來(lái)評(píng)價(jià)將給定候選探針包含在不斷增長(zhǎng)的最佳候選探針組中的一般適用性。在一個(gè)優(yōu)選方面,僅僅頻繁地出現(xiàn)在剩余靶序列以及最初的靶序列中的探針識(shí)別序列才被加入到不斷增長(zhǎng)的該組最佳探針識(shí)別序列中。在一個(gè)最優(yōu)選的方面,這通過(guò)如下方式實(shí)現(xiàn)計(jì)算從這些查詢獲得的分?jǐn)?shù)的乘積(product),并選擇具有最高乘積并且在相對(duì)于當(dāng)前的靶進(jìn)行的查詢中仍屬于具有20%的最佳得分的探針識(shí)別序列的探針識(shí)別序列。
本發(fā)明還提供有利于上述方法實(shí)施的計(jì)算機(jī)程序產(chǎn)品(見(jiàn),例如圖2)。一方面,該計(jì)算機(jī)程序產(chǎn)品包含能夠通過(guò)可與網(wǎng)絡(luò)連接進(jìn)行存儲(chǔ)器交流的計(jì)算機(jī)或用戶設(shè)備來(lái)執(zhí)行的程序指令。
本發(fā)明還提供包含含有靶序列數(shù)據(jù)庫(kù)的計(jì)算機(jī)存儲(chǔ)器和用于執(zhí)行該計(jì)算機(jī)程序產(chǎn)品提供的指令的應(yīng)用系統(tǒng)的系統(tǒng)。
包含多探針的試劑盒本發(fā)明的一個(gè)優(yōu)選實(shí)施方案是用于表征或檢測(cè)或定量靶核酸的試劑盒,其包含多探針文庫(kù)樣品。一方面,該試劑盒含有針對(duì)其應(yīng)用的計(jì)算機(jī)(in silico)操作方案。另一方面,該試劑盒含有與得到低價(jià)DNA引物的建議有關(guān)的信息。試劑盒中所含的探針可以具有上述的任何或所有特征。在一個(gè)優(yōu)選方面,多個(gè)探針包含至少一個(gè)穩(wěn)定化核酸堿基,例如LNA核酸堿基。
另一方面,多個(gè)探針包含與至少一個(gè)化學(xué)基團(tuán)偶聯(lián)或穩(wěn)定結(jié)合以增加該探針的結(jié)合穩(wěn)定性的核苷酸。在再一優(yōu)選方面,試劑盒包含多個(gè)不同的探針以覆蓋具有不同靶序列的群體,例如轉(zhuǎn)錄物組,的至少60%。在一個(gè)優(yōu)選方面,該轉(zhuǎn)錄物組是人轉(zhuǎn)錄物組。
另一方面,試劑盒包含至少一個(gè)用一個(gè)或多個(gè)標(biāo)記物標(biāo)記的探針。在再一方面,一個(gè)或多個(gè)探針包含能夠在基于FRET的測(cè)定中彼此相互作用的標(biāo)記物,即,這些探針可以設(shè)計(jì)用于基于5′核酸酶或分子信標(biāo)的測(cè)定。
本發(fā)明的試劑盒允許用戶快速且有效地開(kāi)發(fā)用于許多不同核酸靶的測(cè)定。該試劑盒還可以包含一種或多種用于實(shí)施擴(kuò)增反應(yīng)例如PCR的試劑。
實(shí)施例本發(fā)明現(xiàn)將參考如下實(shí)施例作進(jìn)一步說(shuō)明。應(yīng)當(dāng)理解,以下僅僅是舉例的形式,并且可以對(duì)細(xì)節(jié)進(jìn)行修改而仍落入本發(fā)明的范圍內(nèi)。
在以下實(shí)施例中,探針的引用編號(hào)代表在以下合成實(shí)施例中所示的LNA-寡核苷酸序列。
實(shí)施例1轉(zhuǎn)錄物組數(shù)據(jù)的來(lái)源從ENSEMBL獲得人轉(zhuǎn)錄物組mRNA序列。ENSEMBL是EMBL-EBI與Sanger Institute的協(xié)作項(xiàng)目,用于開(kāi)發(fā)軟件系統(tǒng)以產(chǎn)生并維持對(duì)真核基因組的自動(dòng)注釋(見(jiàn),例如,Butler,Nature406(6794)333,2000)。ENSEMBL主要由Wellcome Trust資助。應(yīng)當(dāng)注意的是,序列數(shù)據(jù)可以從包含表達(dá)序列的任何類型數(shù)據(jù)庫(kù)獲得,然而,ENSEMBL是尤其有吸引力的,因?yàn)槠浣o出最新的序列數(shù)據(jù)以及對(duì)后生動(dòng)物基因組的最佳可能注釋。2003年5月14日自ENSEMBL ftp站點(diǎn)ftp://ftp.ensembl.org/pub/current_human/data下載了“Homo-sapiens.cdna.fa”。該文件含有所有ENSEMBL轉(zhuǎn)錄物預(yù)報(bào)(即,37347個(gè)不同序列)。從每個(gè)序列中選取3′末端上游50個(gè)核苷酸至3′末端上游1050個(gè)核苷酸的區(qū)域。進(jìn)一步相對(duì)于來(lái)自NCBI的參考序列(RefSeq)集中的人mRNA序列,評(píng)價(jià)所選的探針序列組(見(jiàn)以下最佳方式)。RefSeq標(biāo)準(zhǔn)被用作醫(yī)學(xué)、功能性和多樣性研究的基礎(chǔ);其為基因鑒別和表征、突變分析、表達(dá)研究、多態(tài)性的發(fā)現(xiàn)以及比較分析提供了穩(wěn)定的參照。RefSeq集旨在為主要研究的生物提供一組全面的、完整的非冗余序列,包含基因組DNA、轉(zhuǎn)錄物(RNA)和蛋白質(zhì)產(chǎn)物。對(duì)于來(lái)自ENSEMBL的37347個(gè)序列以及RefSeq集中的19567個(gè)序列,均發(fā)現(xiàn)了相似的覆蓋率,即,說(shuō)明數(shù)據(jù)庫(kù)的類型不是本發(fā)明的限制性特征。
實(shí)施例2計(jì)算多探針數(shù)據(jù)集(dataset)(α文庫(kù))設(shè)計(jì)在UNIX計(jì)算機(jī)上運(yùn)行的特定軟件以計(jì)算文庫(kù)中的最佳探針集合。圖2的流程圖舉例說(shuō)明了該算法。
分兩步獲得對(duì)轉(zhuǎn)錄物組的最佳覆蓋。第一步,確定n聚物與基因的稀疏矩陣,由此可以容易地發(fā)現(xiàn)含有給定的n聚體的基因的數(shù)量。這通過(guò)使用-p選項(xiàng)以及FASTA格式輸入的序列文件運(yùn)行g(shù)etcover程序來(lái)進(jìn)行。
第二步,基于第一步確定的矩陣,使用算法確定最佳覆蓋率。為此目的,輸入所述矩陣以運(yùn)行程序,例如getcover程序。然而,本領(lǐng)域技術(shù)人員可以容易地設(shè)計(jì)出實(shí)現(xiàn)相似功能并用于執(zhí)行相似步驟的程序。
獲得對(duì)轉(zhuǎn)錄物組的良好寡核苷酸覆蓋1.產(chǎn)生所有的4n個(gè)n聚體,并計(jì)算預(yù)期的解鏈溫度。從該集合中除去具有60℃以下解鏈溫度或具有高自身雜交能量的n聚體。這給出具有可接受的物理性質(zhì)的一列n聚體。
2.從ENSEMBL數(shù)據(jù)庫(kù)中選取代表人轉(zhuǎn)錄物組的一列基因序列。
3.起始主循環(huán)給定該n聚體和基因列,通過(guò)在給定基因中鑒別所有的n聚體并將結(jié)果存儲(chǔ)在矩陣中,產(chǎn)生n聚體相對(duì)于基因的稀疏矩陣。
4.如果這是第一次迭代,存儲(chǔ)該矩陣的拷貝備用,并命名為“總n聚體/基因矩陣”。
5.鑒別覆蓋最多基因的n聚體并將其所覆蓋的基因的數(shù)目存儲(chǔ)為“max-gene”。
6.確定矩陣中剩余基因的覆蓋率,并將覆蓋率達(dá)到至少80%的max-gene的基因存儲(chǔ)在“具有良好覆蓋率的n聚體集合”中。
7.最佳n聚體是其當(dāng)前的覆蓋率與總覆蓋率的乘積為最大的n聚體。
8.從該n聚體集合中去除該最佳n聚體(步驟1)。
9.從該基因集合中去除此n聚體所覆蓋的基因(步驟2)。
10.將該n聚體添加至最佳n聚體集合中,從步驟3開(kāi)始繼續(xù)該程序直到不再能找到n聚體。
用于計(jì)算多探針數(shù)據(jù)集的程序代碼(Niels Tolstrup2003的“getcover”1.0版)列在圖17中。其由三個(gè)專利模塊getcover.c,dyp.c,dyp.h組成。
該程序還并入了被GNU Lesser General Public Licence覆蓋的4個(gè)模塊getopt.c,getopt.h,getoptl.c,getopt-init.c/*Copyright(C)1987,88,89,90,91,92,93,94,95,96,98,99,2000,2001Free Software Foundation,Inc.
這些文件是GNU C Library的一部分。GNU C Library是免費(fèi)軟件;可以在Free Software Foundation公布的GNU Lesser GeneralPublic License的條件下對(duì)其進(jìn)行重新分配和/或修改*/該軟件用aap編譯。用于制備該程序的main.aap文件同樣列在圖17中。
為了運(yùn)行已編譯的程序,使用以下命令getcover-l 8,9-b bad.lst-p-f<h_sap_cdna_50_1050.fasta>h_sap_cdna_50_1050_19.statgetcover-l 8,9-b bad.lst-s<h_sap_cdna_50_1050_19.stat>h_sap_cdna_50_1050_19.cover使用該計(jì)算機(jī)程序與用于執(zhí)行上述算法的指令,利用如下參數(shù)設(shè)置分析人轉(zhuǎn)錄物組L89探針長(zhǎng)度=8或9個(gè)核苷酸i1包含分?jǐn)?shù)(inclusion fraction)=100%d15靶雙鏈體相對(duì)于自身雙鏈體的ΔTm=15℃t62靶雙鏈體的最小Tm=62℃c還使用的互補(bǔ)靶序列m80使用乘積規(guī)則和80%規(guī)則從處理剩余靶的最一般探針中選擇的最佳探針nLNA核苷酸優(yōu)選包含在識(shí)別片段的中心部分;bbad.lst是根據(jù)經(jīng)驗(yàn)已知較壞且必須排除的寡物的列表;結(jié)果鑒別到多探針靶序列數(shù)據(jù)庫(kù)。
該數(shù)據(jù)庫(kù)中的靶序列是用于多探針文庫(kù)的示例性最佳靶。這些最佳多探針列在下表1中,其包含5′熒光素?zé)晒鈭F(tuán)和3′Eclipse或其它淬滅劑(見(jiàn)下)。
表1雙標(biāo)記物寡核苷酸探針cagcctcccagagccaagctgtgaaggagggaaggaggagctggaagccagagagctgtggagacccaggagcagccagatgaggagactggggaactccagcccttctgggacagtggactcctgcactcctccattctgccaacagccattgaggtggctgctgccaggagagatttctccaaaggcagcctccagcattcctgcacagtggtgctgtggcactgctgggtttggggaaaaggggaagaagggccttcctggcaggcagatgtgggaatggatggaacagcagcctgtgccaactgggaattctggcacagctccattccctggtcacaggacagaaggcccccacccaaccccatttcctcccatcccagatggtggtgctgcccagaggtggaacaggtgctttcctccactgaggcatgtggacactgtctccctgctccactgctggttggaggcctgctgtgatggagagacagtgccaatggtgaaagctggataaggcagaatggggaactggaaggtggagagc
cagccaggagggagagcaggcagccttggtggcagcaggactctgccatcaggagccaccttggctgtgctgctgctgagacacacaccagccaccagaggagaccctcccacatcttcactgtgaccctgtggctaggaggcacacctgcaagggggaacagtggctcactgccaccagggcctgggaccattctcccactgtgtggcagaggcaacagggaacctggagcttcccagtctgggactctgggcaacccagcagtccagtgtctgcctgtctggaggattctcctgctcctccctggaaggctccactgccttcctgccttccccactgtgcctctgccaccccacctccctctgccactgtgctcacagcctcattcctctgcagcaggtctgtgagcctgtggtctggtgatgctccatcctcctcctccttcaggctgtggctgtgctgtccctcagccatctgggtccttctccctcctctccctcttccccttggagcctgcctccctctgcctctgggcacccaggctcctccttccctggctgctgggcatctctctggttcctgctcccgccgccctctggctcttgggctcatcctccctcctccttgctgggcctgccatcaggagctgcagcctggctgctctccactgggatcctgctgcagcagccctggagtctgccctgactcctccatgctggagcttcagccttggtggtccagccagcttcctcccttccagcttgggactcagcccagttcctggctccaggtcctgctggactccaccatcctcagccagcatcccaggagctctccagccaggagcagcagaggctctcagccttggctctgccaggaggctgccttcttctggctcaggcagccagcctccctgggagactgtctgcctgcctctagctggagcccagcccctgtcccacttctgccctgctgcccagctccctctgcccactgctccctggctgtgccagccgcctggacactggtggaacctggagacctcagccttgccatcagctgggaccagggcctcctcttct cttcccctctgcttccccaccaccctggctcccttgggcacagcaggctctgctgcccagggcattctggtctctggagccagccaccctccacctccgccgcccatccagccagaggagctgccccacttcttctc
atggctgcctctcctctgggcagcttccctccctcctgcccaggagccctggtctcttcctcagatggtggcctctggtccctggggcctccaaggcctggggctctgtctcccagtggcattggggtcttgccatccttcccctcttgggcattctggtccttcttctc ttccctccttcctcaga tccaaggcttggggtc這些超高豐度的9-聚體和8-聚體序列滿足圖2中的選擇標(biāo)準(zhǔn),即,●每個(gè)探針的靶在人轉(zhuǎn)錄物組的序列中占至少6%(即,各2200個(gè)以上的靶序列,在最接近轉(zhuǎn)錄物3′末端的1000nt內(nèi)靶向800個(gè)以上的序列)。
●它們不自身互補(bǔ)(即,不可能形成探針雙鏈體)。
自身得分低于所估計(jì)的與靶形成的雙鏈體的Tm至少10。
●與其靶序列形成的雙鏈體具有60℃或大于60℃的Tm。
它們當(dāng)組合在一起時(shí),覆蓋人轉(zhuǎn)錄物組中>98%的mRNA。
下表1a中給出了表1中尤其優(yōu)選的多探針形式表1aLNA替代的寡核苷酸cAgCCTCccAGAGCCaaGCTGTGaaGGAGGGaaGGAGGAgcTGGAAGccAGAGAGctGTGGAGaccCAGGAgcAGCCAGatGAGGAGactGGGGAacTCCAgCccTTCTGGgaCAGTGGacTCCtGCacTCCTCCatTCTGCCaaCAGCCAttGAGGtGgcTgCTGCcaGGAGAGatTTCTCCaaAGGCAGccTCCAGCatTCCTGCacAGTGGTgctGTGGCacTGCTGggtTTGGGGaaAAGGGGaaGAAGGGccTTCCTGgcAGGCAGatGTGGGAatGGATGGaaCAGCAGcctGTGCCaaCTGGGAatTCTGGCacaGCTCCatTCCCTGgtCACAGGacAGAAGGccCCCACCcaACCCCAttTCCTCCcaTCCCAGatGGTGGTgctGCCCagaGGTGGAacAGGtGCt
tTCCTCCacTGAGGCatGTGGACacTGTCTCccTGCTCCacTGCtGGttGGAGgCctGCTGTGatGGAGAGacAGtGCCaatGGTGAAaGCTGGAtaAGGCAGaaTGGGGAacTGGAAGgtGGAGAGccAGCcAGgaGGGAGAgcAGGcAGccTTGGTGgcAGCAGGacTCtGCCatCAGGaGccACCTTGgcTGTGCTgcTGCTGAgaCACACACcAgCCACcaGAGGAGacCCtCCCacATCTTCAcTGTGACcctGTGGCtaGGAGGcacACCtGCaaGGGGGAacaGTGGCtcACtGCCacCAGgGcctGgGACCatTCTCCCacTGTGTGgcAGAGGCaaCAGGGAacTGgcTGCcAGCAGGCcAGCATCCtCTGCCCAccGCCgCCcTGCCTCTcAGAGGCTcTGGACACcTCCTCCTcTCCACCTcATCCTCCtCAgCAGCcTGGAGGAcTCCTCCCcTCTGCCTtTCTTGGCcaGCcTGGcTTCCCCAcAGTGGCAcggCGGCAcAGcAGCCcTTCAGCCcAGCACCCcTGGTGGTcTTCCTCCcTCTGCCAcTCTCCTCcCTTCTCCccAGGAGGcTTCTGCCtCTGgTCCcCTCTTCCcAGCcTCCcAGCAGGTcAGGAGCCtGTTGCCAaGcTGGAGtcTGGAGCcTGTCTCCtGGaTGGCcTGcTGcCcTGCCCCAcTGGGACTcCAGCATCtGGcTGTGcATCCAGCcTGCCTGTtCTTCTTCTcCTGGAGaaTGGcTGCtGGaAGGCtcgCCGCCcCAGGGcCcTCCTGCCcTGTGCCTtGCTGTTCcCACCACCcTGGGGcccTGTGCTCtCAAGGGCacAGCCTCA cTCCATCCcTGTGAGCtgCTGCTCcAGAGGAGcTGGGCAAcTCTTCCCtcGCCGTCtGcTGGAGcCAGCCGCcTGGGCACtTGATGCCaGGAGcAGtGGTGGcctGGGCATCcCTTCAGCaGGaGCTGcTGGGGCTtCCTCCTCaTTCCAGCtCCTGCTGcTGCTCCCcTCTGGCTtTGATGGCcCTGGAGCtGCTGTCCtgcTGGGCcCAGTTCCcTCCTCCAtCCTCTCCcTCAGCCAtTGGCTTCcCAGCCAGtGGTGGAAcTGCTCTCtTGCCTTCcCCAGCAGaGCTGGGAcTGGAGTCaTGGCTTCtTCTCCTGcTGGTCTCcTGTGGTCcACCCGCTcAGCCCAGtTCCCAGTcTTCAGGCtCTTTGCCcTTCCTGCtCCTCTTCT tCTGGGTCcTGGTTGC
cTCCACCAtCCAGTGTcTTGGAGCtGGACACCcTTCCAGCtGGGcAGCcCAGGCTCtcGTCGCCcCCAGCCCcCAGGGCAtCTCTGGTcCATCAGCcTGCCTTCcTGGCTCCcTTGGGCTtGGTGGATcTCCAGCCtCTGcTGCcTGCCATCaTGGTGGTcCACCTCCcAGCCACCcACTGGGAcCtGGTGCtTCCTCTGtTCcTGGCtGCCCTGatCCTCGTCtGGCTCTGtCCTCAGCtTGGTGGTtTCTTGCCtGGTGATGcTCCTTCCtTGGGACTtGGgCTTCtGTGGcTGcTGGGAGAcTGCTGGAtGATGAGCcTTCTCCCtCCTGCTCcAGGaGCTtCCTggCCcTGCCTCCcAGGcAGCcTCAGCCTcCTCCTTCcAGCTCCCtCCACTGCtTCTGGCTtGCTGGAGcTGCTTCCcTGCCACCcTGTCTGCccTCAGCCtCcAGGTCcTGTCCCA-其中,小寫字母表示脫氧核糖核苷酸,大寫字母表示LNA核苷酸。
>95.0%的mRNA序列在接近其3′末端的1000nt內(nèi)(距離3′末端50至1050位)被靶向,而且>95%的mRNA含有針對(duì)文庫(kù)中一個(gè)以上探針的靶序列。在含有37,347個(gè)核酸序列的人轉(zhuǎn)錄物組中鑒別到此100個(gè)多探針的超過(guò)650,000個(gè)的靶位點(diǎn)。在該轉(zhuǎn)錄物組中針對(duì)每個(gè)轉(zhuǎn)錄物,多探針的平均數(shù)目是17.4,中值是14個(gè)不同探針的靶位點(diǎn)。
盡管未選擇上述序列以針對(duì)特定的生物體進(jìn)行優(yōu)化,但是上述序列也是用于其它轉(zhuǎn)錄物組的優(yōu)異探針選擇。因此,盡管事實(shí)上上述探針設(shè)計(jì)用于僅在人轉(zhuǎn)錄物組中鑒別/表征/定量轉(zhuǎn)錄物,但我們?cè)u(píng)價(jià)了上述文庫(kù)對(duì)小鼠和大鼠基因組的覆蓋率。例如,見(jiàn)表2。

nt~核苷酸。
實(shí)施例3頻繁出現(xiàn)的9-聚體寡核苷酸對(duì)人轉(zhuǎn)錄物組的預(yù)期覆蓋率示例性測(cè)定數(shù)據(jù)(類似于圖6)說(shuō)明,如果實(shí)時(shí)PCR測(cè)定所用的雙標(biāo)記探針用LNA進(jìn)行增強(qiáng),則可以將該探針的識(shí)別序列的長(zhǎng)度根據(jù)該序列而減少到8或9個(gè)核苷酸。LNA的獨(dú)特雙鏈體穩(wěn)定化性質(zhì)對(duì)于確保該短的雙鏈體具有足夠的穩(wěn)定性(即,Tm>60℃)是必需的。該功能性實(shí)時(shí)PCR探針將幾乎是純的LNA,在識(shí)別序列中具有6至10個(gè)LNA寡核苷酸。然而,該短識(shí)別序列使得可以使用相同的LNA探針檢測(cè)和定量許多不同基因的豐度。通過(guò)根據(jù)圖2所示算法適當(dāng)?shù)剡x擇最佳(即,最常見(jiàn)的)8或9-聚體識(shí)別序列,可以覆蓋含有約37347個(gè)mRNA的人轉(zhuǎn)錄物組(圖3)。
圖3顯示了可以在各序列的近3′末端的長(zhǎng)1000nt片段(即,距離3′末端50nt至1050nt的序列)中被不同長(zhǎng)度的優(yōu)化探針檢測(cè)到的人轉(zhuǎn)錄物組中的mRNA序列的預(yù)期覆蓋率,表示為人轉(zhuǎn)錄物組中mRNA序列總數(shù)的百分?jǐn)?shù)。這些探針被要求足夠穩(wěn)定(Tm>60℃)并具有低的形成自身雙鏈體的傾向,這就消除了許多9-聚體以及甚至更多的8-聚體探針序列。
如果可以將具有給定長(zhǎng)度的所有探針序列用作探針,則明顯地可以通過(guò)這些最短的可能探針序列獲得對(duì)轉(zhuǎn)錄物組的最佳覆蓋。當(dāng)僅有有限數(shù)量的探針(<55個(gè))被包含在文庫(kù)中時(shí),這確是如此(圖4)。然而,由于許多具有低GC含量的短探針不具有充分的熱穩(wěn)定性,故將其從文庫(kù)中刪除??山邮艿?-聚體探針的有限多樣性在檢測(cè)低GC含量的基因方面效力較低,因此,由100個(gè)不同的9-聚體探針組成的文庫(kù)比類似的8-聚體文庫(kù)對(duì)轉(zhuǎn)錄物組具有更好的覆蓋。然而,最佳選擇是由不同長(zhǎng)度的序列組成的混合文庫(kù),例如以上列出的最佳文庫(kù)模式。在圖4中未顯示該文庫(kù)的覆蓋率。
所設(shè)計(jì)的含有100個(gè)最常見(jiàn)的9-聚體和8-聚體的探針文庫(kù),即,“人mRNA探針文庫(kù)”可以以方便的盒子或微量滴定板形式操作。
可以改變此用于人mRNA的100個(gè)探針的初始集合以產(chǎn)生相似文庫(kù)試劑盒用于來(lái)自其它物種(小鼠、大鼠、果蠅、秀麗隱桿線蟲(chóng)(C.elegans)、酵母、擬南芥、斑馬魚、靈長(zhǎng)類動(dòng)物、家畜等)的轉(zhuǎn)錄物組。構(gòu)建這些新的探針文庫(kù)幾乎不需要費(fèi)力,因?yàn)檫@些人mRNA探針中大多數(shù)都可以重新用于這些新的文庫(kù)試劑盒(表2)。
實(shí)施例4文庫(kù)中靶向每一基因的探針數(shù)目不僅所提議的文庫(kù)中的有限數(shù)量的探針可以靶向人轉(zhuǎn)錄物組的大部分(>98%),而且存在大程度的冗余,因?yàn)榇蠖鄶?shù)基因(幾乎95%)可以被一個(gè)以上的探針檢測(cè)。針對(duì)上述最佳文庫(kù)模式中的100個(gè)探針,已經(jīng)在人轉(zhuǎn)錄物組(37347個(gè)基因)中鑒別到650,000個(gè)以上的靶位點(diǎn)。這導(dǎo)致每個(gè)探針平均6782個(gè)靶位點(diǎn)(即,轉(zhuǎn)錄物組的18%),范圍是每個(gè)探針2527個(gè)序列至12066個(gè)序列。能夠檢測(cè)一個(gè)特定基因的平均探針數(shù)是17.4,中值為14。由此,在僅100個(gè)探針的該文庫(kù)中,我們有至少14個(gè)探針針對(duì)所有人mRNA序列中的50%以上序列。
可以被文庫(kù)中給定數(shù)目的探針?biāo)邢虻幕驍?shù)顯示在圖4中。
實(shí)施例5設(shè)計(jì)9-聚體探針以證實(shí)可行性選擇來(lái)自酵母(釀酒酵母(Saccharomyces cerevisiae))的SSA4基因用于表達(dá)測(cè)定,因?yàn)樵摶蜣D(zhuǎn)錄水平可以通過(guò)熱休克誘導(dǎo),而且可以獲得敲除表達(dá)的突變體。從人轉(zhuǎn)錄物組中常見(jiàn)的9mer序列中選擇3個(gè)不同的9-聚體序列(表3)。這些序列存在于人轉(zhuǎn)錄物組中1.8至6.4%的mRNA序列的3′末端附近。進(jìn)一步的選擇標(biāo)準(zhǔn)是中等水平的自身互補(bǔ)性和等于或大于60℃的Tm。所有三個(gè)序列都存在于SSA4 ORF的末端1000個(gè)堿基內(nèi)。通過(guò)合成在5′末端帶有FITCH熒光團(tuán)而在3′末端帶有Eclipse淬滅劑(Epoch Biosciences)的這三個(gè)序列,構(gòu)建了5′核酸酶測(cè)定探針。根據(jù)探針在ORF YER103W(SSA4)--其中位置1201被設(shè)定為位置1--中的位置,對(duì)探針進(jìn)行命名。設(shè)計(jì)三對(duì)引物以產(chǎn)生各含有這三個(gè)探針序列之一的三個(gè)不重疊的擴(kuò)增子。根據(jù)擴(kuò)增子所包含的探針序列,命名擴(kuò)增子。
表3設(shè)計(jì)的5′核酸酶測(cè)定探針和引物

bp~堿基對(duì)還設(shè)計(jì)了兩個(gè)分子信標(biāo)以檢測(cè)SSA4 469-和SSA4 570序列,并分別命名為信標(biāo)-469和信標(biāo)-570。SSA4 469信標(biāo)的序列是CAAGGAGAAGTTG(SEQ ID NO7,10-聚體識(shí)別位點(diǎn)),該序列應(yīng)當(dāng)使得該寡核苷酸形成分子內(nèi)信標(biāo)結(jié)構(gòu),具有通過(guò)5′-CAA和TTG-3′之間的LNA-LNA相互作用形成的莖。SSA4 570信標(biāo)的序列是CAAGGAAAGttG(9-聚體識(shí)別位點(diǎn)),其中該分子內(nèi)信標(biāo)結(jié)構(gòu)可以在5′-CAA和ttG-3′之間形成。合成在5′末端帶有熒光素?zé)晒鈭F(tuán)而在3′末端帶有Dabcyl淬滅劑的這兩個(gè)序列。
還設(shè)計(jì)了一個(gè)SYBR Green標(biāo)記的探針以檢測(cè)SSA4 570序列,并將該探針命名為SYBR-探針-570。該探針的序列是CAAGGAAaG。合成在5′末端具有氨基-C6接頭的該探針,在該5′末端將熒光團(tuán)SYBR Green101(Molecular Probes)根據(jù)廠商說(shuō)明書附著于其上。在與靶序列雜交后,接頭附著的熒光團(tuán)應(yīng)嵌入產(chǎn)生的LNA-DNA雙鏈體區(qū),造成來(lái)自SYBR Green101的增加的熒光。
表4序列

實(shí)施例6合成、去保護(hù)和純化雙標(biāo)記的寡核苷酸在自動(dòng)DNA合成儀(Expedite8909DNA合成儀,PerSeptiveBiosystems,0.2μmol規(guī)模)上,使用亞磷酰胺方法(Beaucage和Caurthers,Tetrahedron Lett.221859-1862,1981)以及2-氰基乙基保護(hù)的LNA和DNA亞磷酰胺(Sinha等,Tetrahedron Lett.245843-5846,1983),制備雙標(biāo)記的寡核苷酸EQ13992至EQ14148(表4)。用Eclipse淬滅劑(EQ13992-EQ13996)或Dabcyl(EQ13997-EQ14148)以及5′-熒光素亞磷酰胺(GLEN Research,Sterling,Virginia,USA)衍生CPG固相支持物。相較于DNA亞磷酰胺,針對(duì)LNA亞磷酰胺(250s偶聯(lián)時(shí)間)改變合成循環(huán)。在偶聯(lián)步驟,使用1H-四唑或4,5-二氰基咪唑(Proligo,Hamburg,德國(guó))作為活化劑。
使用32%氨水對(duì)該寡核苷酸進(jìn)行去保護(hù)(室溫1小時(shí),然后60℃2小時(shí)),并通過(guò)HPLC(Shimadzu-SpectraChrom系列;XterraTMRP18柱,10?m 7.8×150mm(Waters)純化。緩沖液A0.05M乙酸三乙銨pH7.4;B50%乙腈水溶液。洗脫液0-25min10-80%B;25-30min80%B)。寡核苷酸的組成和純度通過(guò)MALDI-MS(PerSeptiveBiosystem,Voyager DE-PRO)分析進(jìn)行驗(yàn)證,見(jiàn)表5。圖5是EQ13992的MALDI-MS譜,顯示[M-H]-=4121,3Da。這是本發(fā)明9-聚體探針的典型MALDI-MS譜。
表5

大寫表示LNA單體(A,G,mC,T),其中mC是LNA甲基胞嘧啶。小寫表示DNA單體(a,g,c,t)。Fitc=熒光素;EQL=Eclipse淬滅劑;Dabcyl=Dabcyl淬滅劑。MW=分子量。
實(shí)施例7
制備用9-聚體探針進(jìn)行檢測(cè)的SSA4 cDNA標(biāo)準(zhǔn)在PCR測(cè)定中分析構(gòu)建的9聚體探針的功能,其中檢查探針檢測(cè)不同SSA4 PCR擴(kuò)增子的能力。體外轉(zhuǎn)錄表達(dá)載體pTRIamp18(Ambion)中的SSA4基因下游區(qū),將得到的cRNA逆轉(zhuǎn)錄,獲得用作上述PCR反應(yīng)的模板的cDNA。SSA4基因的下游區(qū)按如下方式克隆PCR擴(kuò)增使用酵母基因組DNA作為模板,通過(guò)標(biāo)準(zhǔn)PCR擴(kuò)增部分酵母基因。從野生型釀酒酵母標(biāo)準(zhǔn)實(shí)驗(yàn)室菌株,使用Nucleon MiY DNA提取試劑盒(Amersham Biosciences),根據(jù)供應(yīng)商的說(shuō)明書,制備基因組DNA。在PCR擴(kuò)增的第一步,使用含有限制性酶切位點(diǎn)的正向引物和含有通用接頭序列的反向引物。在該步中,向擴(kuò)增子的3′末端,鄰近終止密碼子的地方,添加20bp。在擴(kuò)增的第二步,用含有poly-T20尾和限制性酶切位點(diǎn)的嵌套引物更換反向引物。該SSA4擴(kuò)增子含有729bp的SSA4 ORF加上20bp的通用接頭序列以及poly-A20尾。
所用PCR引物如下YER103W-For-SacIacgtgagctcattgaaactgcaggtggtattatga(SEQ ID NO23)YER103W-Rev-Unigatccccgggaattgccatgctaatcaacctcttcaaccgttgg(SEQ ID NO24)Uni-polyT-BamHIacgtggatccttttttttttttttttttttgatccccgggaattgccatg(SEQ ID NO25).
質(zhì)粒DNA構(gòu)建體用限制性酶EcoRI+BamHI,切割PCR擴(kuò)增子。使用Quick Ligation試劑盒(New England Biolabs),根據(jù)供應(yīng)商的說(shuō)明書,將該DNA片段與pTRIamp18載體(Ambion)連接,并通過(guò)標(biāo)準(zhǔn)方法轉(zhuǎn)化大腸桿菌DH-5。
DNA測(cè)序?yàn)榱蓑?yàn)證PCR擴(kuò)增子的克隆,使用M13正向引物和M13反向引物測(cè)序質(zhì)粒DNA,并在ABI377上分析。
體外轉(zhuǎn)錄使用Megascript T7試劑盒(Ambion),根據(jù)供應(yīng)商的說(shuō)明書,實(shí)施體外轉(zhuǎn)錄,獲得SSA4 cRNA。
逆轉(zhuǎn)錄用1μg cRNA和0.2U逆轉(zhuǎn)錄酶Superscript II RT(Invitrogen),根據(jù)供應(yīng)商的說(shuō)明書--但添加20U Suprase-In(RNAse抑制劑-Ambion)--進(jìn)行逆轉(zhuǎn)錄。在QiaQuick PCR純化柱(Qiagen)上,根據(jù)供應(yīng)商的說(shuō)明書,使用所提供的EB-緩沖液進(jìn)行洗脫,純化產(chǎn)生的cDNA。測(cè)定洗脫的cDNA的DNA濃度,并將該cDNA稀釋成相應(yīng)于2×107個(gè)拷貝/μl的SSA4 cDNA拷貝濃度。
實(shí)施例8用于雙標(biāo)記探針測(cè)定的方案根據(jù)如下方案(表6),混合用于雙標(biāo)記探針PCR的試劑表6

*)5′核酸酶測(cè)定探針的終濃度為0.1μM,而信標(biāo)/SYBR-探針的終濃度為0.3μM。
在本實(shí)驗(yàn)中,加入2×107個(gè)拷貝的SSA4 cDNA作為模板。在DNAEngine Opticon(MJ Research)中,使用如下PCR循環(huán)方案,實(shí)施測(cè)定
表7

*對(duì)于具有9-聚體識(shí)別位點(diǎn)的信標(biāo)-570,退火溫度降至44℃。
表6中所示PCR反應(yīng)的組成以及表7中所列PCR循環(huán)方案將稱作標(biāo)準(zhǔn)5′核酸酶測(cè)定或標(biāo)準(zhǔn)信標(biāo)測(cè)定條件。
實(shí)施例99-聚體5′核酸酶測(cè)定探針的特異性在如下測(cè)定中證實(shí)這些5′核酸酶測(cè)定探針的特異性,在該測(cè)定中向3個(gè)不同的PCR反應(yīng)分別加入各探針,產(chǎn)生不同的SSA4 PCR擴(kuò)增子。如圖6所示,每個(gè)探針僅產(chǎn)生熒光信號(hào)以及其所設(shè)計(jì)檢測(cè)的擴(kuò)增子(也見(jiàn)圖10、11和12)。重要的是,不同探針具有十分相似的循環(huán)閾值Ct(從23.2至23.7),說(shuō)明這些測(cè)定和探針具有十分等同的效力。而且,說(shuō)明當(dāng)將所述測(cè)定用于真實(shí)表達(dá)測(cè)定時(shí),這些測(cè)定應(yīng)當(dāng)檢測(cè)到相似的表達(dá)水平。這是一個(gè)重要發(fā)現(xiàn),因?yàn)椴煌结樤谛阅苌系淖兓允遣槐黄谕摹?br> 實(shí)施例109-聚體和10-聚體分子信標(biāo)探針的特異性此外,還針對(duì)分子信標(biāo)設(shè)計(jì)概念,證實(shí)了檢測(cè)實(shí)時(shí)新產(chǎn)生的PCR擴(kuò)增子的能力。設(shè)計(jì)用于469擴(kuò)增子、具有10-聚體識(shí)別序列的分子信標(biāo),在PCR中存在用于產(chǎn)生該469擴(kuò)增子的SSA4 cDNA模板和引物時(shí),產(chǎn)生了清晰的信號(hào),圖7A。所觀察到的Ct值為24.0,十分類似于使用5′核酸酶測(cè)定探針獲得的Ct值,這再次說(shuō)明不同探針的十分相似的靈敏度。當(dāng)不加入SSA4模板時(shí),無(wú)信號(hào)產(chǎn)生。利用設(shè)計(jì)用于570擴(kuò)增子、具有9-聚體識(shí)別序列的分子信標(biāo),得到相似結(jié)果,見(jiàn)圖7B。
實(shí)施例119-聚體SYBR-探針的特異性還針對(duì)SYBR-探針設(shè)計(jì)概念證實(shí)了檢測(cè)新產(chǎn)生的PCR擴(kuò)增子的能力。設(shè)計(jì)用于該SSA4 cDNA的570擴(kuò)增子的此9-聚體SYBR-探針,在PCR中存在用于產(chǎn)生該570擴(kuò)增子的SSA4 cDNA模板和引物時(shí),產(chǎn)生了清晰的信號(hào),見(jiàn)圖8。當(dāng)不加入SSA4模板時(shí),無(wú)信號(hào)產(chǎn)生。
實(shí)施例12定量轉(zhuǎn)錄物拷貝數(shù)檢測(cè)不同水平的基因轉(zhuǎn)錄物的能力是探針在真實(shí)表達(dá)測(cè)定中使用的基本需要。在如下測(cè)定中通過(guò)三個(gè)5′核酸酶測(cè)定探針,證實(shí)了該需要得到滿足,其中,在所述測(cè)定中將不同水平的來(lái)源于表達(dá)載體的SSA4 cDNA以及所述5′核酸酶測(cè)定探針之一一起加入不同PCR反應(yīng)中(圖9)。根據(jù)標(biāo)準(zhǔn)5′核酸酶測(cè)定條件設(shè)定組成和循環(huán)條件。
循環(huán)開(kāi)始前PCR中的cDNA拷貝數(shù)通過(guò)循環(huán)閾值Ct(即,首先檢測(cè)到信號(hào)時(shí)的循環(huán)數(shù))來(lái)反映。在此,信號(hào)僅定義為當(dāng)熒光高于3至10個(gè)PCR循環(huán)中檢測(cè)到的熒光的標(biāo)準(zhǔn)差5倍時(shí)的信號(hào)。結(jié)果顯示在起始cDNA拷貝數(shù)的對(duì)數(shù)和Ct值之間存在良好的總體相關(guān)性(圖9)。這種相關(guān)性表現(xiàn)為取決于探針而具有-3.456至-3.499的斜率的直線以及0.9981至0.9999的相關(guān)系數(shù)。曲線的斜率反映PCR的效率,其中,假設(shè)在每個(gè)PCR循環(huán)中擴(kuò)增子加倍,則100%效率相應(yīng)于-3.322的斜率。目前PCR的斜率指示94%至100%的PCR效率。該相關(guān)系數(shù)和PCR效率與在使用17至26個(gè)核苷酸長(zhǎng)度的DNA5′核酸酶測(cè)定探針檢測(cè)相同SSA4 cDNA水平的測(cè)定中獲得的值(結(jié)果未顯示)同樣高或更高。因此,這些結(jié)果證實(shí)這3個(gè)9-聚體5′核酸酶測(cè)定探針滿足真實(shí)表達(dá)探針的要求,說(shuō)明這些探針應(yīng)當(dāng)可以用于表達(dá)譜分析。
實(shí)施例13檢測(cè)酵母中SSA4轉(zhuǎn)錄物水平在生長(zhǎng)在不同培養(yǎng)條件(±熱休克)下的不同酵母菌株中,檢測(cè)SSA4轉(zhuǎn)錄物的表達(dá)水平。標(biāo)準(zhǔn)實(shí)驗(yàn)室釀酒酵母菌株在上述實(shí)驗(yàn)中用作野生型酵母。從EUROSCARF(登記號(hào)Y06101)獲得SSA4敲除突變體。該菌株在此稱作SSA4突變體。兩個(gè)酵母菌株均于30℃生長(zhǎng)于YPD培養(yǎng)基中,直到OD600等于0.8A。將待進(jìn)行熱休克的酵母培養(yǎng)物轉(zhuǎn)移至40℃放置30分鐘,之后離心收獲細(xì)胞并將沉淀冷凍在-80℃。同時(shí),未熱休克的細(xì)胞保留在30℃生長(zhǎng)30分鐘,之后按如上方式收獲。
使用FastRNA試劑盒(Bio101)以及FastPrep儀器,根據(jù)供應(yīng)商說(shuō)明書從收獲的酵母分離RNA。
使用5μg錨定寡物(dT)引物以便在1μg總RNA上引發(fā)反應(yīng),并使用0.2U逆轉(zhuǎn)錄酶Superscript II RT(Invitrogen),根據(jù)供應(yīng)商說(shuō)明書--除了加入20U Superase-In(RNAse抑制劑-Ambion)--進(jìn)行逆轉(zhuǎn)錄。2小時(shí)孵育后,70℃5分鐘使酶失活。用10mM Tris緩沖液pH8.5將cDNA反應(yīng)物稀釋5倍,并通過(guò)在MicroSpinTMS-400HR柱(Amersham Pharmacia Biotech)上純化而去除寡核苷酸和酶。在實(shí)施表達(dá)測(cè)定前,將cDNA稀釋20倍。使用標(biāo)準(zhǔn)5′核酸酶測(cè)定條件--除了加入2μL模板外--以及雙標(biāo)記-570探針,進(jìn)行該表達(dá)測(cè)定。模板是最初逆轉(zhuǎn)錄反應(yīng)物的100倍稀釋物。所用的4種不同cDNA模板來(lái)源于進(jìn)行或未進(jìn)行熱休克的野生型或突變體。該測(cè)定產(chǎn)生預(yù)期的結(jié)果(圖10),顯示與未接受升高溫度的野生型酵母(Ct=30.3)相比,熱休克的野生型酵母的SSA4轉(zhuǎn)錄物水平(Ct=26.1)增加。無(wú)論培養(yǎng)條件如何,在突變酵母中均未檢測(cè)到轉(zhuǎn)錄物。3.5的Ct值差相應(yīng)于熱休克的野生型酵母相對(duì)于未熱休克的野生型酵母而言誘導(dǎo)了17倍的表達(dá)水平,該值接近文獻(xiàn)(Causton等,2001)中報(bào)道的約19的值。這些值通過(guò)使用標(biāo)準(zhǔn)曲線獲得,其中所述標(biāo)準(zhǔn)曲線利用雙標(biāo)記的570探針在具有已知量的SSA4轉(zhuǎn)錄物的定量實(shí)驗(yàn)中獲得(見(jiàn)圖9)。這些實(shí)驗(yàn)說(shuō)明,這些9-聚體探針能夠檢測(cè)到與公開(kāi)的結(jié)果十分相符的表達(dá)水平。
實(shí)施例14使用單個(gè)9-聚體探針進(jìn)行多轉(zhuǎn)錄物檢測(cè)為了驗(yàn)證這三個(gè)5′核酸酶測(cè)定探針檢測(cè)其它基因的表達(dá)水平的能力,選擇了其中各存在所述探針序列之一的三個(gè)不同酵母基因。設(shè)計(jì)引物以擴(kuò)增圍繞探針序列的60-100堿基對(duì)區(qū)域。下表中顯示了所選的三個(gè)酵母基因和相應(yīng)的引物。
表8另一種表達(dá)測(cè)定的設(shè)計(jì)

來(lái)源于未熱休克的野生型酵母的總cDNA用作該表達(dá)測(cè)定的模板,該表達(dá)測(cè)定利用標(biāo)準(zhǔn)5′核酸酶測(cè)定條件--除了加入2μL模板外--進(jìn)行。如圖11所示,根據(jù)表8所列的測(cè)定設(shè)計(jì),所有的三個(gè)探針均能夠檢測(cè)到基因的表達(dá)。使用表8所列之外的任何其它探針和引物組合均未檢測(cè)到表達(dá)。對(duì)于SSA4、POL5、HSP82和APG9,在文獻(xiàn)中可以獲得表達(dá)數(shù)據(jù)(Holstege,等,1998)。對(duì)于未熱休克的酵母,對(duì)于SSA4(0.8個(gè)轉(zhuǎn)錄物拷貝/細(xì)胞)、POL5(0.8個(gè)轉(zhuǎn)錄物拷貝/細(xì)胞)和HSP82(1.3個(gè)轉(zhuǎn)錄物拷貝/細(xì)胞),這些數(shù)據(jù)描述了相似的表達(dá)水平,而APG9轉(zhuǎn)錄物水平稍低(0.1個(gè)轉(zhuǎn)錄物拷貝/細(xì)胞)。
該數(shù)據(jù)與此處所獲得的結(jié)果十分相符,因?yàn)槌薍SP82具有25.6的Ct值外,所有其它基因均表現(xiàn)出相似的Ct值。這提示,HSP82轉(zhuǎn)錄物在這些實(shí)驗(yàn)所用的菌株中的豐度比文獻(xiàn)顯示的豐度要高。使用圖11a所示針對(duì)雙標(biāo)記-469探針的PCR,進(jìn)行瓊脂糖凝膠電泳。瓊脂糖凝膠(圖12)顯示,在未獲得信號(hào)的反應(yīng)中實(shí)際上產(chǎn)生了PCR產(chǎn)物,因此來(lái)自這些反應(yīng)的熒光信號(hào)的缺乏并非由PCR失敗所致。而且,在表達(dá)測(cè)定中針對(duì)不同基因產(chǎn)生的不同長(zhǎng)度的擴(kuò)增子說(shuō)明,在表達(dá)測(cè)定中針對(duì)不同基因產(chǎn)生的信號(hào)實(shí)際上是特異于目標(biāo)基因的。
實(shí)施例15選擇靶標(biāo)使用來(lái)自http://WWW.ensembl.org/EnsMart的EnsMart軟件16.1版,從Homo Sapiens NCBI33 dbSNP115 Ensembl Genes的所有外顯子,提取分別距各外顯子的任一端的50bp,形成人Exon50靶集合。使用GetCover程序(參見(jiàn)圖17),計(jì)算所有探針靶序列的出現(xiàn)率,除去根據(jù)過(guò)度自我互補(bǔ)、過(guò)度GC含量等未通過(guò)選擇標(biāo)準(zhǔn)的探針靶序列。在剩余序列中,選擇豐度最高的探針靶序列(No.1,覆蓋3200個(gè)靶),之后選擇出現(xiàn)率高于豐度最高的探針靶序列的出現(xiàn)率的0.8倍(3200×0.8)或2560個(gè)靶的所有探針靶。從剩余的樣品中計(jì)算各探針的新命中數(shù),而且計(jì)算每個(gè)探針靶的新命中數(shù)相較于已有選擇的乘積以及該相同探針靶的總出現(xiàn)率,并通過(guò)選擇最高的乘積數(shù)來(lái)選擇下一個(gè)豐度最高的探針靶序列。下表示例了探針靶的長(zhǎng)度(n)、序列(nmer)和在所有靶標(biāo)中的出現(xiàn)率(cover),以及每個(gè)探針靶選擇的新命中數(shù)(Newhit)、Newhit與cover的乘積(newhit×cover)和從所有累計(jì)的探針得到的靶群體中的累計(jì)命中數(shù)(sum)。



實(shí)施例16人基因的qPCR將該探針文庫(kù)與如下實(shí)時(shí)PCR設(shè)計(jì)軟件聯(lián)合使用,其中所述軟件能夠●通過(guò)獨(dú)特的標(biāo)識(shí)符或通過(guò)注冊(cè)提交的核酸序列,識(shí)別輸入的序列●鑒別可以靶向該核酸的所有探針●根據(jù)靶序列選擇標(biāo)準(zhǔn),例如最接近3′末端或最接近內(nèi)含子-外顯子邊界,分揀探針●如果可以的話,根據(jù)PCR設(shè)計(jì)規(guī)則,設(shè)計(jì)位于靶向該核酸序列的探針側(cè)翼的PCR引物●基于以上步驟,提出可用的實(shí)時(shí)PCR測(cè)定。
通過(guò)www.probelibrary.com上的軟件,可以設(shè)計(jì)用于人基因的有效和可靠的qPCR測(cè)定。
ProbeFinder軟件可以針對(duì)給定的人基因快速而可靠地設(shè)計(jì)出最佳的qPCR探針和引物。
該設(shè)計(jì)包含如下步驟1)確定內(nèi)含子的位置通過(guò)選擇跨qPCR的內(nèi)含子,消除來(lái)自染色體DNA的噪音。通過(guò)blast檢索人基因組確定內(nèi)含子。出現(xiàn)在DNA上但不出現(xiàn)在轉(zhuǎn)錄物上的區(qū)域被認(rèn)為是內(nèi)含子。
2)將探針文庫(kù)與基因匹配這90個(gè)探針中的至少一個(gè)可以覆蓋幾乎所有人轉(zhuǎn)錄物,識(shí)別序列標(biāo)簽的LNA修飾使得這種高覆蓋率成為可能。
3)設(shè)計(jì)引物和選擇最佳的qPCR測(cè)定用‘Primer3′(Whitehead Inst.For Biomedical Research,S.Rozen和H.J.Skaletsky),設(shè)計(jì)引物。最后,根據(jù)選定的規(guī)則排列探針的等級(jí),從而確保最佳可能的qPCR。這些規(guī)則有利于跨擴(kuò)增子的內(nèi)含子以除去來(lái)自DNA污染的假信號(hào)、并有利于用于可重復(fù)的相似測(cè)定的小的擴(kuò)增子尺寸以及優(yōu)化用于PCR的GC含量。
實(shí)施例17制備ena-單體和寡聚體制備ENA-T單體,并將其用于制備本發(fā)明的雙標(biāo)記探針。
在如下序列中,X代表2′-O,4′-C-亞乙基-5-甲基尿嘧啶(ENA-T)。該單體的合成在WO 00/47599中描述。用于摻入5′-O-二甲氧基三苯甲基-2′-O,4′-C-亞乙基-5-甲基尿嘧啶-3′-O-(2-氰基乙基-N,N,-二異丙基)亞磷酰胺的反應(yīng)條件相應(yīng)于用于制備實(shí)施例6中所述LNA寡聚體的反應(yīng)條件。
制備如下三個(gè)雙標(biāo)記的探針

X表示ENA-T單體。小寫字母表示DNA單體(a,g,c,t)。Fitc=熒光素;EQL=Eclipse淬滅劑;Dabcyl=Dabcyl淬滅劑。MW=分子量。除了‘X′之外的大寫字母表示甲氧基LNA核苷酸。
實(shí)施例18雙標(biāo)記探針測(cè)定方案根據(jù)下面的方案(表9),混合實(shí)時(shí)雙標(biāo)記探針PCR的試劑表9

在來(lái)自表9的上述PCR混合物中,包含下面表10的引物、探針和寡物模板;表10

大寫字母是LNA核苷酸;6-Fitc熒光素6-異硫氰酸酯;#Q41,4-二(2-羥乙基氨基)-6-甲基蒽醌,參照實(shí)施例21,其也顯示了該分子的2-氰基乙基保護(hù)的亞磷酰胺形式(即1-(4-(2-(2-氰基乙氧基(二異丙基氨基)膦基氧)乙基)苯基氨基)-4-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-6(7)-甲基-蒽醌)的制備,其用于實(shí)施例6的一般方法;z2’-脫氧-5-硝基吲哚-呋喃核糖基(ribofuranosyl);mC5-甲基胞嘧啶。
如實(shí)施例6一般描述地,制備17302Q4雙標(biāo)記探針。
使用下面的PCR循環(huán)方案(表11),在DNA Engine Opticon(MJResearch)中進(jìn)行測(cè)定表11

在圖18中解釋了實(shí)時(shí)PCR的結(jié)果,它證實(shí),含有淬滅劑Q4的雙標(biāo)記探針完全能起實(shí)時(shí)PCR探針的功能。
實(shí)施例19雙標(biāo)記探針在實(shí)時(shí)PCR中的功能性雙標(biāo)記探針測(cè)定的方案根據(jù)下面的方案(表12),混合實(shí)時(shí)雙標(biāo)記探針PCR的試劑表12

在來(lái)自表12的上述PCR混合物中,包含下面表13的引物、探針和寡物模板;表13


*大寫字母是LNA核苷酸;6-Fitc熒光素6-異硫氰酸酯;#Q11,4-二(3-羥基丙基氨基)-蒽醌,參照實(shí)施例20,其也顯示了該分子的2-氰基乙基保護(hù)的亞磷酰胺形式(1-(3-(2-氰基乙氧基(二異丙基氨基)膦基氧)丙基氨基)-4-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-蒽醌)的制備,其用于實(shí)施例6的一般方法;z2’-脫氧-5-硝基吲哚-呋喃核糖基;mC5-甲基胞嘧啶。
如實(shí)施例6一般描述地,制備15305Q1雙標(biāo)記探針。
使用下面的PCR循環(huán)方案,在DNA Engine Opticon(MJ Research)中進(jìn)行測(cè)定表14

在圖19中解釋了實(shí)時(shí)PCR的結(jié)果,它證實(shí),含有3’-硝基吲哚的雙標(biāo)記探針完全能起實(shí)時(shí)PCR探針的功能。
實(shí)施例20制備1-(3-(2-氰基乙氧基(二異丙基氨基)膦基氧)丙基氨基)-4-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-蒽醌(3)
1,4-二(3-羥基丙基氨基)-蒽醌 (1)將醌茜隱色體(Leucoquinizarin)(9.9g;0.04mol)與3-氨基-1-丙醇(10mL)和乙醇(200mL)相混合,并回流加熱6小時(shí)。將混合物冷卻至室溫,在大氣條件下攪拌過(guò)夜。將混合物倒入水(500mL)中,濾出沉淀,用水(200mL)洗滌,并干燥。將固體在醋酸乙酯(300mL)中煮沸,冷卻至室溫,通過(guò)過(guò)濾收集固體。
產(chǎn)量8.2g(56%)1-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-4-(3-羥基丙基氨基)-蒽醌(2)將1,4-二(3-羥基丙基氨基)-蒽醌(7.08g;0.02mol)溶于干燥的N,N-二甲基甲酰胺(150mL)和干燥的吡啶(50mL)的混合物中。加入二甲氧基三苯甲基氯(3.4g;0.01mol),將混合物攪拌2小時(shí)。加入另外的二甲氧基三苯甲基氯(3.4g;0.01mol),將混合物攪拌3小時(shí)。在真空下濃縮混合物,將殘余物重新溶于二氯甲烷(400mL)中,用水(2×200ml)洗滌,并干燥(Na2SO4)。通過(guò)硅膠墊(10cm;h10cm)過(guò)濾溶液,用二氯甲烷洗脫,直到單-DMT-蒽醌產(chǎn)物開(kāi)始洗出,此后,將溶劑換為二氯甲烷中的2%甲醇。合并純級(jí)分,濃縮,得到藍(lán)色泡沫。
產(chǎn)量7.1g(54%)1H-NMR(CDCl3)10.8(2H,2xt,J=5.3Hz,NH),8.31(2H,m,AqH),7.67(2H,dt,J=3.8和9.4,AqH),7.4-7.1(9H,m,ArH+AqH),6.76(4H,m,ArH)3.86(2H,q,J=5.5Hz,CH2OH),3.71(6H,s,CH3),3.54(4H,m,NCH2),3.26(2H,t,J=5.7Hz,CH2ODMT),2.05(4H,m,CCH2C),1.74(1H,t,J=5Hz,OH).
1-(3-(2-氰基乙氧基(二異丙基氨基)膦基氧)丙基氨基)-4-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-蒽醌(3)將1-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-4-(3-羥基丙基氨基)-蒽醌(0.66g;1.0mmol)溶于干燥的二氯甲烷(100mL)中,并加入3分子篩。將混合物攪拌3小時(shí),然后加入2-氰基乙基-N,N,N’,N’-四異丙基二亞磷酰胺(335mg;1.1mmol)和4,5-二氰基咪唑(105mg;0.9mmol)。將混合物攪拌5小時(shí),然后加入飽和NaHCO3(50mL),并攪拌10分鐘。分離相,用飽和NaHCO3(50mL)、鹽水(50mL)洗滌有機(jī)相,并干燥(Na2SO4)。濃縮后,得到藍(lán)色泡沫狀的亞磷酰胺,不經(jīng)純化地用于寡核苷酸合成。
產(chǎn)量705mg(82%)31P-NMR(CDCl3)150.01H-NMR(CDCl3)10.8(2H,2xt,J=5.3Hz,NH),8.32(2H,m,AqH),7.67(2H,m,AqH),7.5-7.1(9H,m,ArH+AqH),6.77(4H,m,ArH)3.9-3.75(4H,m),3.71(6H,s,OCH3),3.64-3.52(3.54(6H,m),3.26(2H,t,J=5.8Hz,CH2ODMT),2.63(2H,t,J=6.4Hz,CH2CN)2.05(4H,m,CCH2C),1.18(12H,dd,J=3.1Hz,CCH3)。
實(shí)施例21制備1-(4-(2-(2-氰基乙氧基(二異丙基氨基)膦基氧)乙基)苯基氨基)-4-(4-(2-(4, 4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-6(7)-甲基-蒽醌(13)
6-甲基-醌茜(10)將4-甲基-鄰苯二甲酸酐(10g,62mmol)、對(duì)氯酚(3.6g,28mmol)和硼酸(1.6g)溶于濃H2SO4(34ml),在覆蓋玻璃板的燒瓶中,將混合物在200℃攪拌6小時(shí)。反應(yīng)結(jié)束后,冷卻混合物,然后倒入水(160ml)中,通過(guò)過(guò)濾收集沉淀。將固體懸浮于沸水(320ml)中,煮沸5分鐘,通過(guò)過(guò)濾收集固體。干燥后,得到暗紅色固體狀的產(chǎn)物(5g,19.7mmol)。MALDI-MSm/z255.7(M+H)。
1,4-二(4-(2-羥乙基)苯基氨基)-6-甲基-蒽醌(11)將6-甲基-醌茜(10,2.5g)懸浮于醋酸(30ml)中,加入Zn-粉(2g),將混合物在90℃攪拌1h。然后通過(guò)硅藻土墊,過(guò)濾混合物,冷卻至室溫,加入水(90ml),然后通過(guò)過(guò)濾收集還原的蒽醌衍生物。然后,將固體與硼酸(1.9g;0.03mol)和乙醇(100mL)相混合,并回流1小時(shí)。將混合物冷卻至室溫,加入4-氨基苯乙基醇(4.1g;0.03mol),此后加熱混合物回流3天。將濃縮的混合物重新溶于二氯甲烷(300mL)中,用水(3×100mL)洗滌,干燥(Na2SO4)并濃縮。在硅膠柱上,使用MeOH/二氯甲烷純化殘余物。產(chǎn)量1.5g(30%)。
1-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-4-(4-(2-羥乙基)苯基氨基)-6(7)-甲基-蒽醌(12)
將1,4-二(4-(2-羥乙基)苯基氨基)-6-甲基-蒽醌(0.95g;1.9mmol)溶于干燥的吡啶(30mL)。加入二甲氧基三苯甲基氯(0.34g;1mmol),將混合物攪拌2小時(shí)。加入另外的二甲氧基三苯甲基氯(0.34g;1mmol),將混合物攪拌4小時(shí)。在真空下濃縮混合物,將殘余物重新溶于二氯甲烷(200mL)中,用水(2×100ml)洗滌,并干燥(Na2SO4)。通過(guò)柱色譜(甲苯/EtoAc)純化產(chǎn)物。產(chǎn)量0.81g(54%).
1-(4-(2-(2-氰基乙氧基(二異丙基氨基)膦基氧)乙基)苯基氨基)-4-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-6(7)-甲基-蒽醌(13)將1-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-4-(4-(2-羥乙基)苯基氨基)-6(7)-甲基-蒽醌(0.50g;0.63mmol)溶于干燥的二氯甲烷(50mL)中,并加入3分子篩。將混合物攪拌3小時(shí),然后加入2-氰基乙基-N,N,N’,N’-四異丙基二亞磷酰胺(215mg;0.72mmol)和4,5-二氰基咪唑(64mg;0.55mmol)。將混合物攪拌4小時(shí),然后加入飽和NaHCO3(25mL),并攪拌10分鐘。分離相,用飽和NaHCO3(25mL)、鹽水(25mL)洗滌有機(jī)相,并干燥(Na2SO4)。然后蒸發(fā)亞磷酰胺至干燥,不經(jīng)純化地用于寡核苷酸合成。產(chǎn)量0.59g(94%)。
實(shí)施例22使用探針文庫(kù)進(jìn)行SNP檢測(cè)單核苷酸多態(tài)性(SNP)是人和其它基因組中最常見(jiàn)的基因變體類型。通過(guò)同時(shí)使用2種不同標(biāo)記的探針,它們各自與一個(gè)SNP等位基因特異性地雜交,可以使用雙標(biāo)記的探針進(jìn)行SNP檢測(cè)。實(shí)時(shí)PCR的結(jié)果由此可以指示一個(gè)或另一個(gè)或兩個(gè)等位基因在樣品中的存在??梢允褂没蚪MDNA或RNA作為樣品。
SNP大多數(shù)隨機(jī)地發(fā)生,作為SNP的結(jié)果,預(yù)見(jiàn)到幾乎任意的序列背景可以存在許多排列,目前已知超過(guò)200萬(wàn)SNP。因此,要使所有保藏的相關(guān)探針用于供給或建立SNP檢測(cè)測(cè)定,需要數(shù)百萬(wàn)探針。
與本發(fā)明有關(guān)的,由于使用LNA實(shí)現(xiàn)的短探針,使用含有LNA的8或9-聚體探針,可以減少該數(shù)目。理論上,可以存在49或262144種可能的9-聚體和48或65536種8-聚體,且是覆蓋所有可能的SNP序列所必需的。含有LNA的寡物的另一個(gè)優(yōu)點(diǎn)是提高的特異性,允許將探針中的SNP-位置置于探針中的任意位置。因此,每個(gè)探針可以覆蓋9個(gè)不同的SNP位置,這可以將8-聚體序列所需的65536減少至65536/9=7281。檢測(cè)也可以發(fā)生在兩條鏈上,從而僅需要7281/2=3640個(gè)探針。
實(shí)施例23SNP辨別實(shí)施例-在實(shí)時(shí)PCR中使用雙標(biāo)記探針實(shí)現(xiàn)單個(gè)錯(cuò)配辨別雙標(biāo)記探針測(cè)定方案根據(jù)下面的方案(表15),混合實(shí)時(shí)雙標(biāo)記探針PCR的試劑表15

在上述PCR混合物(表15)中,包含下面的引物、探針和寡物模板;表16

大寫字母是LNA核苷酸;
6-Fitc熒光素6-異硫氰酸酯;EQLEclipseTMDark淬滅劑(Epoch Biosciences);mC5-甲基胞嘧啶。
使用下面的PCR循環(huán)方案,在DNA Engine Opticon(MJResearch)中進(jìn)行測(cè)定表17

在圖20中解釋了實(shí)時(shí)PCR的結(jié)果,它證實(shí),雙標(biāo)記探針能辨別完美匹配的靶標(biāo)和相對(duì)于探針具有單個(gè)錯(cuò)配的靶標(biāo)。
參考文獻(xiàn)及注釋1.Helen C.Causton,Bing Ren,Sang Seok Koh,Christopher T.Harbison,Elenita Kanin,Ezra G.Jennings,Tong Ihn Lee,Heather L.True,Eric S.Lander,and Richard A.Young(2001).Remodelling of Yeast Genome ExpresSion in Response toEnvironmental Changes.Mol.Biol.Cell 12323-337(2001).
2.Frank C.P.Holstege,Ezra G.Jennings,John J.Wyrick,TongIhn Lee,Chr istoph J.Hengartner,Michael R.Green,ToddR.Golub,Eric S.Lander,and Richard A.Young(1998).Dissecting the Regulatory Circuitry of a Eukaryotic Genome.Cell 1998 95717-728.
3.Simeonov,Anton and Theo T.Nikiforov,Single nucleotidepolymorphism genotyping using short,fluorescentlylabelled locked nucleic acid(LNA)probes and fluores cencepolarization detection,Nucleic Acid Research,2002,Vol.30 No17e 91.
本領(lǐng)域技術(shù)人員可以改變、修飾和以其它方式實(shí)施本文的描述,而不偏離此處描述和所要求保護(hù)的本發(fā)明的精神和范圍,這些改變、修飾和實(shí)施方式均包含在本發(fā)明的范圍內(nèi)。
以上公開(kāi)的參考文獻(xiàn)、專利、專利申請(qǐng)和國(guó)際申請(qǐng)完整地并入此處作為參考。
序列表<110>Exiqon A/S<120>用于分析核酸混合物的探針、文庫(kù)和試劑盒及其構(gòu)建方法<130>16079PCT00<160>49<170>PatentIn version3.2<210>1<211>23<212>DNA<213>人工序列<220>
<223>合成序列<400>1cgcgtttact ttgaaaaatt ctg23<210>2<211>20<212>DNA<213>人工序列<220>
<223>合成序列<400>2gcttccaatt tcctggcatc 20<210>3<211>25<212>DNA<213>人工序列<220>
<223>合成序列<400>3gcccaagatg ctataaattg gttag 25<210>4<211>23
<212>DNA<213>人工序列<220>
<223>合成序列<400>4gggtttgcaa caccttctag ttc 23<210>5<211>18<212>DNA<213>人工序列<220>
<223>合成序列<400>5tacggagctg caggtggt 18<210>6<211>18<212>DNA<213>人工序列<220>
<223>合成序列<400>6gttgggccgt tgtctggt 18<210>7<211>13<212>DNA<213>人工序列<220>
<223>合成序列<400>7caaggagaag ttg13<210>8<211>13<212>DNA<213>人工序列
<220>
<223>合成序列<400>8caaggagaag ttg13<210>9<211>12<212>DNA<213>人工序列<220>
<223>合成序列<400>9caaggaaagt tg 12<210>10<211>23<212>DNA<213>人工序列<220>
<223>合成序列<400>10cgcgtttact ttgaaaaatt ctg 23<210>11<211>20<212>DNA<213>人工序列<220>
<223>合成序列<400>11gcttccaatt tcctggcatc 20<210>12<211>25<212>DNA<213>人工序列<220>
<223>合成序列<400>12gcccaagatg ctataaattg gttag 25<210>13<211>23<212>DNA<213>人工序列<220>
<223>合成序列<400>13gggtttgcaa caccttctag ttc 23<210>14<211>18<212>DNA<213>人工序列<220>
<223>合成序列<400>14tacggagctg caggtggt 18<210>15<211>18<212>DNA<213>人工序列<220>
<223>合成序列<400>15gttgggccgt tgtctggt 18<210>16<211>20<212>DNA<213>人工序列<220>
<223>合成序列
<400>16gcgagagaaa acaagcaagg 20<210>17<211>20<212>DNA<213>人工序列<220>
<223>合成序列<400>17attcgtcttc actggcatca 20<210>18<211>25<212>DNA<213>人工序列<220>
<223>合成序列<400>18cagctaaaaa tgatgacaat aatgg 25<210>19<211>23<212>DNA<213>人工序列<220>
<223>合成序列<400>19attacatcat gattagggaa tgc 23<210>20<211>21<212>DNA<213>人工序列<220>
<223>合成序列<400>20gggtttgaac attgatgagg a 21
<210>21<211>20<212>DNA<213>人工序列<220>
<223>合成序列<400>21ggtgtcagct ggaacctctt 20<210>22<211>13<212>DNA<213>人工序列<220>
<223>合成序列<220>
<221>modified_base<222>(1)..(1)<223>N是LNA甲基胞嘧啶<220>
<221>misc_feature<222>(1)..(1)<223>n是a,c,g,或t<400>22naaggagaag ttg13<210>23<211>35<212>DNA<213>人工序列<220>
<223>合成序列<400>23acgtgagctc attgaaactg caggtggtat tatga35<210>24
<211>44<212>DNA<213>人工序列<220>
<223>合成序列<400>24gatccccggg aattgccatg ctaatcaacc tcttcaaccg ttgg 44<210>25<211>50<212>DNA<213>人工序列<220>
<223>合成序列<400>25acgtggatcc tttttttttt tttttttttt gatccccggg aattgccatg50<210>26<211>20<212>DNA<213>人工序列<220>
<223>合成序列<400>26gcgagagaaa acaagcaagg 20<210>27<211>20<212>DNA<213>人工序列<220>
<223>合成序列<400>27attcgtcttc actggcatca 20<210>28<211>25<212>DNA
<213>人工序列<220>
<223>合成序列<400>28cagctaaaaa tgatgacaat aatgg 25<210>29<211>23<212>DNA<213>人工序列<220>
<223>合成序列<400>29attacatcat gattagggaa tgc 23<210>30<211>21<212>DNA<213>人工序列<220>
<223>合成序列<400>30gggtttgaac attgatgagg a 21<210>31<211>20<212>DNA<213>人工序列<220>
<223>合成序列<400>31ggtgtcagct ggaacctctt 20<210>32<211>164<212>DNA<213>人工序列
<220>
<223>合成序列<400>32caccgttcgg catatccata tttcccacag ccaccaccag gaaggcagca gccaggagga60gcagcctcct cagagaagca gcctggagac ttcctccagc tccagggccg ccgcctgctg 120gagcagcagc accagaagag ggggaggtac ggttggttgt acga164<210>33<211>108<212>DNA<213>人工序列<220>
<223>合成序列<400>33tggcggacgc acaccgctta cccctgctgg aggaagctga ggaggagcag cctggagcag 60cagcagccag ctccgccgcc aggaagccga ctcacgggcc acgcatta 108<210>34<211>115<212>DNA<213>人工序列<220>
<223>合成序列<400>34gggtgcgacc gtgagtcaat ggtctccagg aggctgtctt ctggtgctgc tcctctgctg 60cctccagctt ctctggccct ggtggtggct gtgggtaatg cgtggcccgt gagtc 115<210>35<211>106<212>DNA<213>人工序列<220>
<223>合成序列<400>35attgactcac ggtcgcacca aactctgctg ggctgcctgg aagctccagg agaacttcca 60
gccagctcct ccaccagcag gaagaataac cgtggaacgc ggtcat 106<210>36<211>124<212>DNA<213>人工序列<220>
<223>合成序列<400>36atacccatcc aaggcgtccc taaaggaggc agaggaaggg agctgccttc ccagcccttc60tcccagcaca gcagagcaga gccacctcca gccacatcac caaaatgacc gcgttccacg 120gtta124<210>37<211>115<212>DNA<213>人工序列<220>
<223>合成序列<400>37attgactcac ggtcgcacca aacctggaag gcagaggaac tgcctcctcc accatcacca60ctgctgggct gggaagcttc cagcacagca ggaaataacc gtggaacgcg gtcat115<210>38<211> 121<212>DNA<213>人工序列<220>
<223>合成序列<400>38atacccatcc aaggcgtccc taaact tctc ccagagccac ctccagccag ccacaccagc 60agagcaggaa ggagctgcct ggagcagctc ccaggagaaa aatgaccgcg ttccacggtt 120a 121<210>39
<211>115<212>DNA<213>人工序列<220>
<223>合成序列<400>39attgactcac ggtcgcacca aattcctctg ccttcctgct ctgctgggag aaggaggtgg60tgatgtggct ggaaggaggc agctccagga gaaaataacc gtggaacgcg gtcat115<210>40<211>114<212>DNA<213>人工序列<220>
<223>合成序列<400>40atacccatcc aaggcgtccc taaacttcca ggcagctccc tccagccagc aggacttccc 60agcccagctc ctccaccagc acagcagagc caaaatgacc gcgttccacg gtta114<210>41<211>114<212>DNA<213>人工序列<220>
<223>合成序列<400>41ttagggacgc cttggatggg tatggctgag gcggctggct cctgcatcct cttctgcctc 60tgctcccagc tgagccatgc cctggcttcc accaattgcc gacccaccgg gata114<210>42<211>122<212>DNA<213>人工序列<220>
<223>合成序列<400>42
attcgctacg gcccaacacc ttactccacc tcctgcccca ctggggctga agtccagtgt 60ctggagctgc ttcccagtgg gcagccatcc agcaggccac catatcccgg tgggtcggca120at 122<210>43<211>124<212>DNA<213>人工序列<220>
<223>合成序列<400>43taaggtgttg ggccgtagcg aatcgctctg ccactggggc ctggtctcca tcctctcctc 60cctgggcaac ctgctgtcct tggcagtggg gaagctgtgc caattgtcct ccgcccggac120tcat 124<210>44<211>122<212>DNA<213>人工序列<220>
<223>合成序列<400>44ttagggacgc cttggatggg tatctctgcc actggctcca gatcctcttc tgccccactg 60ccatgggcag ctggggcctc ctccctccac ctggcttccc caattgccga cccaccggga120ta 122<210>45<211>118<212>DNA<213>人工序列<220>
<223>合成序列<400>45attcgctacg gcccaacacc ttacctcagc cccagctcca tccagccgcc aaggactggt 60
ctcctgccct gggcaactgg gaatggctgc ttccaccata tcccggtggg tcggcaat 118<210>46<211>124<212>DNA<213>人工序列<220>
<223>合成序列<400>46taaggtgttg ggccgtagcg aatctgcctc ttcagccgct ctgctcccag ctgagccatc 60cagtgtgcag gagaggacag caggtggcac agcaggccac caattgtcct ccgcccggac 120tcat 124<210>47<211>17<212>DNA<213>人工序列<220>
<223>合成序列<400>47gactcacggt cgcacca 17<210>48<211>16<212>DNA<213>人工序列<220>
<223>合成序列<400>48ccgcgttcca cggtta 16<210>49<211>115<212>DNA<213>人工序列<220>
<223>合成序列
<400>49attgactcac ggtcgcacca aattcctctg ccttcctgct ctgctgggag aaggaggtgg 60 tgatgtggctggaaggaggc agctccagga gaaaataacc gtggaacgcg gtcat 11權(quán)利要求
1.寡核苷酸探針文庫(kù),其中文庫(kù)中的每個(gè)探針均由識(shí)別序列標(biāo)簽和檢測(cè)部分組成,其中,在每個(gè)寡核苷酸探針中至少一個(gè)單體是經(jīng)修飾的單體類似物,從而相對(duì)于相應(yīng)的未修飾的寡核苷酸而言增加了對(duì)互補(bǔ)靶序列的結(jié)合親和力,由此這些文庫(kù)探針具有足夠的穩(wěn)定性用于序列特異性地結(jié)合和檢測(cè)任何給定靶群體中的靶核酸的實(shí)質(zhì)性部分,并且其中,不同識(shí)別序列的數(shù)目占具有給定長(zhǎng)度的所有可能序列標(biāo)簽的不到10%,并且其中每個(gè)探針含有用于檢測(cè)的熒光團(tuán)-淬滅劑對(duì),其中所述淬滅劑具有式(I) 其中R1,R4,R5和R8中的一個(gè)或兩個(gè)獨(dú)立地是鍵,或選自取代的或未取代的氨基,其構(gòu)成與寡核苷酸探針的剩余部分的連接,且其中剩余的R1至R8基團(tuán)各自獨(dú)立地是氫,或取代的或未取代的羥基,氨基,烷基,芳基,芳烷基或烷氧基,和/或其中所述文庫(kù)中少于20%的寡核苷酸探針在5′和/或3′位置具有胍基(G)殘基。
2.根據(jù)權(quán)利要求1的文庫(kù),其中所述淬滅劑選自1,4-二-(3-羥基-丙基氨基)-蒽醌,1-(3-(4,4′-二甲氧基-三苯甲基氧)丙基氨基)-4-(3-羥基丙基氨基)-蒽醌,1,5-二-(3-羥基-丙基氨基)-蒽醌,1-(3-羥基丙基氨基)-5-(3-(4,4′-二甲氧基-三苯甲基氧)丙基氨基)-蒽醌,1,4-二-(4-(2-羥乙基)苯基氨基)-蒽醌,1-(4-(2-(4,4′-二甲氧基-三苯甲基氧)乙基)苯基氨基)-4-(4-(2-羥乙基)苯基氨基)-蒽醌,1,8-二-(3-羥基-丙基氨基)-蒽醌,1,4-二(3-羥基丙基氨基)-6-甲基蒽醌,1-(3-(4,4′-二甲氧基-三苯甲基氧)丙基氨基)-4-(3-羥基丙基氨基)-6(7)-甲基-蒽醌,1,4-二(4-(2-羥乙基)苯基氨基)-6-甲基-蒽醌,1,4-二(4-甲基-苯基氨基)-6-羧基-蒽醌,1,4-二(4-甲基-苯基氨基)-6-(N-(6,7-二羥基-4-氧-庚烷-1-基))甲酰胺-蒽醌,1,4-二(4-甲基-苯基氨基)-6-(N-(7-二甲氧基三苯甲基氧-6-羥基-4-氧-庚烷-1-基))甲酰胺-蒽醌,1,4-二(丙基氨基)-6-羧基-蒽醌,1,4-二(丙基氨基)-6-(N-(6,7-二羥基-4-氧-庚烷-1-基))甲酰胺-蒽醌,1,4-二(丙基氨基)-6-(N-(7-二甲氧基三苯甲基氧-6-羥基-4-氧-庚烷-1-基))甲酰胺-蒽醌,1,5-二(4-(2-羥乙基)苯基氨基)-蒽醌,1-(4-(2-羥乙基)苯基氨基)-5-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-蒽醌,1,8-二(3-羥基丙基氨基)-蒽醌,1-(3-羥基丙基氨基)-8-(3-(4,4’-二甲氧基-三苯甲基氧)丙基氨基)-蒽醌,1,8-二(4-(2-羥乙基)苯基氨基)-蒽醌,和1-(4-(2-羥乙基)苯基氨基)-8-(4-(2-(4,4’-二甲氧基-三苯甲基氧)乙基)苯基氨基)-蒽醌。
3.根據(jù)權(quán)利要求1的文庫(kù),其中所述淬滅劑是1,4-二(2-羥基-乙基氨基)-6-甲基蒽醌。
4.根據(jù)前述權(quán)利要求中的任一項(xiàng)的文庫(kù),其中少于10%的寡核苷酸探針在5′末端具有G,例如少于5%。
5.根據(jù)權(quán)利要求4的文庫(kù),其中文庫(kù)中沒(méi)有寡核苷酸在5′末端具有G。
6.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中文庫(kù)中探針的識(shí)別序列標(biāo)簽片段已經(jīng)以至少一種如下方式修飾i)用至少一個(gè)非天然存在的核苷酸進(jìn)行替代;ii)用至少一個(gè)化學(xué)基團(tuán)進(jìn)行替代以增加探針的穩(wěn)定性。
7.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中識(shí)別序列標(biāo)簽長(zhǎng)6至12個(gè)核苷酸。
8.根據(jù)權(quán)利要求7的寡核苷酸探針文庫(kù),其中識(shí)別序列標(biāo)簽長(zhǎng)8或9個(gè)核苷酸。
9.根據(jù)權(quán)利要求8的寡核苷酸探針文庫(kù),其中識(shí)別序列標(biāo)簽用LNA核苷酸替代。
10.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中90%以上的寡核苷酸探針可以結(jié)合并檢測(cè)核酸群體中的至少兩個(gè)靶序列。
11.根據(jù)權(quán)利要求10的文庫(kù),其中識(shí)別序列標(biāo)簽與核酸群體中的至少兩個(gè)靶序列互補(bǔ)。
12.具有8和9個(gè)核苷酸長(zhǎng)度的寡核苷酸探針的文庫(kù),其包含權(quán)利要求1-11之任一項(xiàng)中定義的寡核苷酸探針的子集的混合物。
13.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中核酸群體中的不同靶序列的數(shù)目是至少100。
14.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中每個(gè)寡核苷酸探針中的至少一個(gè)核苷酸用非天然存在的核苷酸類似物、脫氧核糖或核糖類似物或非磷酸二酯鍵的核苷酸間鍵替代。
15.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中檢測(cè)部分是共價(jià)地或非共價(jià)地結(jié)合的小溝結(jié)合劑或嵌入劑,其選自不對(duì)稱菁染料、DAPI、SYBR Green I、SYBR Green II、SYBR Gold、PicoGreen、噻唑橙、Hoechst 33342、溴化乙錠、1-O-(1-芘基甲基)丙三醇和Hoechst 33258。
16.根據(jù)權(quán)利要求14或15的寡核苷酸探針文庫(kù),其中所述非磷酸二酯鍵的核苷酸間鍵是非磷酸酯的核苷酸間鍵。
17.根據(jù)權(quán)利要求16的寡核苷酸探針文庫(kù),其中所述核苷酸間鍵選自烷基膦酸酯、亞磷酰胺、烷基磷酸三酯、硫代磷酸酯和二硫代磷酸酯鍵。
18.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中所述寡核苷酸探針含有非天然存在的核苷酸,例如2′-O-甲基、二氨基嘌呤、2-硫代尿嘧啶、5-硝基吲哚、通用或簡(jiǎn)并堿基、嵌入核酸或小溝結(jié)合劑,以增強(qiáng)探針與互補(bǔ)核酸序列的結(jié)合。
19.根據(jù)權(quán)利要求18的文庫(kù),其中所有寡核苷酸探針含有至少一個(gè)5-硝基吲哚殘基。
20.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中所述不同識(shí)別序列占具有給定長(zhǎng)度的所有可能寡核苷酸的1%以下。
21.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中每個(gè)探針都可以使用雙標(biāo)記物利用分子信標(biāo)測(cè)定原理進(jìn)行檢測(cè)。
22.根據(jù)權(quán)利要求1-20之任一項(xiàng)的寡核苷酸探針文庫(kù),其中每個(gè)探針都可以使用雙標(biāo)記物利用5′核酸酶測(cè)定原理進(jìn)行檢測(cè)。
23.根據(jù)前述權(quán)利要求中的任一項(xiàng)的文庫(kù),其中每個(gè)探針都含有單個(gè)檢測(cè)部分,該檢測(cè)部分可以通過(guò)分子信標(biāo)測(cè)定原理進(jìn)行檢測(cè)。
24.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中靶核酸群體是mRNA樣品、cDNA樣品或基因組DNA樣品。
25.根據(jù)權(quán)利要求24的寡核苷酸探針文庫(kù),其中所述靶mRNA或靶cDNA群體來(lái)源于人、小鼠、大鼠、擬南芥、黑腹果蠅(Drosophilamelanogaster)、黑猩猩或秀麗隱桿線蟲(chóng)(Caenorhabditis elegan)的轉(zhuǎn)錄物組。
26.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中所述探針靶序列在靶核酸群體的4%以上不同靶核酸中出現(xiàn)至少一次。
27.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中從所述文庫(kù)中已經(jīng)除去自身互補(bǔ)的探針序列。
28.根據(jù)權(quán)利要求27的寡核苷酸探針文庫(kù),其中所述自身互補(bǔ)的序列已經(jīng)被選擇除去(de-selected)。
29.根據(jù)權(quán)利要求27的寡核苷酸探針文庫(kù),其中所述自身互補(bǔ)的序列已經(jīng)通過(guò)序列特異性修飾,例如非標(biāo)準(zhǔn)核苷酸、具有SBC核酸堿基的核苷酸、2′-0-甲基、二氨基嘌呤、2-硫代尿嘧啶、通用或簡(jiǎn)并堿基或小溝結(jié)合劑,而被消除。
30.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中每個(gè)探針的解鏈溫度(Tm)通過(guò)用非天然存在的修飾,例如,LNA,任選地用SBC核酸堿基修飾的、2′-O-甲基、二氨基嘌呤、2-硫代尿嘧啶、5-硝基吲哚、通用或簡(jiǎn)并堿基、嵌入核酸或小溝結(jié)合劑,進(jìn)行替代以增強(qiáng)探針與互補(bǔ)核酸序列的結(jié)合,而被調(diào)整以適用于基于PCR的測(cè)定。
31.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中每個(gè)探針的解鏈溫度(Tm)為至少50℃。
32.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中每個(gè)探針在5′末端具有DNA核苷酸,和/或在3′末端具有DNA核苷酸。
33.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中每個(gè)探針可以通過(guò)分子信標(biāo)原理進(jìn)行檢測(cè)。
34.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中靶群體是人轉(zhuǎn)錄物組。
35.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中每個(gè)寡核苷酸探針檢測(cè)最大可能數(shù)目的不同靶核酸,從而導(dǎo)致所述文庫(kù)對(duì)給定靶核酸群體的最大覆蓋。
36.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中為了獲得最大程度的檢測(cè),這些寡核苷酸探針經(jīng)選擇而在靶核酸群體中具有盡可能多的靶序列或結(jié)合位點(diǎn)。
37.根據(jù)前述權(quán)利要求中的任一項(xiàng)的寡核苷酸探針文庫(kù),其中為了獲得最大程度的檢測(cè),這些寡核苷酸探針經(jīng)選擇而在靶核酸群體中盡可能多的靶核酸內(nèi)具有至少一個(gè)靶序列。
38.表1或表1a或圖13或圖14的寡核苷酸探針文庫(kù),其能夠檢測(cè)任何給定核酸群體中的互補(bǔ)序列。
39.根據(jù)前述權(quán)利要求中的任一項(xiàng)的文庫(kù),其包含各具有說(shuō)明書中表1或表1a所列的識(shí)別元件的探針,和/或其包含各具有與所述表1中所列的識(shí)別元件互補(bǔ)的識(shí)別元件的探針。
40.寡核苷酸探針,其包含式I的淬滅劑和5′-硝基吲哚殘基。
41.權(quán)利要求40的寡核苷酸探針,其沒(méi)有5′胍基殘基。
42.權(quán)利要求40或41的寡核苷酸探針,它在權(quán)利要求1-9,14-18,21-23,和31-1的任一項(xiàng)中定義。
43.根據(jù)權(quán)利要求40-42中的任一項(xiàng)的寡核苷酸探針,所述探針選自與表1、表1A、圖13或圖14所示序列互補(bǔ)或相同的探針。
44.根據(jù)權(quán)利要求40-43中的任一項(xiàng)的寡核苷酸探針,其具有選自表1或表1A的核苷酸序列。
45.選擇可用于前述任一項(xiàng)權(quán)利要求的文庫(kù)中的寡核苷酸序列的方法,其包含a)提供具有預(yù)定核苷酸數(shù)目N的所有可能寡核苷酸的第一集合,其中所述寡核苷酸具有至少50℃的解鏈溫度Tm,b)提供靶核酸序列的第二集合,c)針對(duì)所述第一集合的每個(gè)成員,從所述第二集合中鑒別和存儲(chǔ)包含與所述第一集合的所述的每個(gè)成員互補(bǔ)的序列的成員的數(shù)目,d)選擇在步驟c的鑒別中與步驟c中鑒別到的最大數(shù)目的所述第二集合的成員匹配的所述第一集合的成員,e)將步驟d中選擇的成員添加至由選出的、可用于前述任一項(xiàng)權(quán)利要求的文庫(kù)中的寡核苷酸組成的第三集合中,f)從所述第一集合中扣除步驟d中選擇的成員以提供修訂的第一集合,m)重復(fù)步驟d至f,直到所述第三集合由下述成員組成,所述成員一起能夠與步驟b的靶核酸序列集合中的至少30%成員的互補(bǔ),其中所述方法具有反對(duì)在第三集合中包含具有5’胍基(G)的成員的偏好,和/或反對(duì)在第三集合中包含具有3’胍基(G)的成員的偏好。
46.根據(jù)權(quán)利要求45的方法,其中避免胍基作為所述第三集合的所有寡核苷酸序列的5′殘基。
47.根據(jù)權(quán)利要求46的方法,其中通過(guò)如下方式實(shí)現(xiàn)避免胍基作為5’殘基i)減小步驟a的集合,以僅包括不包含5’胍基殘基的那些序列,和/或ii)避免在步驟d中選擇包含5’胍基殘基的那些序列,和/或iii)在步驟e中省略包含5’胍基殘基的那些序列。
48.根據(jù)權(quán)利要求45-47中的任一項(xiàng)的方法,其中Tm是至少60℃。
49.根據(jù)權(quán)利要求45-48中的任一項(xiàng)的方法,其中所述寡核苷酸的第一集合僅僅包含不能夠自身雜交的寡核苷酸。
50.根據(jù)權(quán)利要求45-49中的任一項(xiàng)的方法,其在步驟f之后但在步驟m之前包含下面的步驟g)從所述第二集合中扣除所有如下成員以獲得修訂的第二集合,其中所述成員包含與在步驟d中選出的成員互補(bǔ)的序列;h)針對(duì)所述修訂的第一集合的每一成員,從所述修訂的第二集合中鑒別和存儲(chǔ)包含與所述每一成員互補(bǔ)的序列的成員的數(shù)量;i)選擇在步驟h的鑒別中與步驟h中鑒別到的最大數(shù)量的第二集合成員匹配的所述第一集合的成員;或者,選擇通過(guò)步驟h中鑒別的數(shù)量和步驟c中鑒別的數(shù)量的乘積能夠給出最大數(shù)的所述第一集合成員;j)將步驟i中選擇的成員加入所述第三集合;k)從所述修訂的第一集合中扣除步驟i中選出的成員;和l)從所述修訂的第二集合中扣除所有如下成員,所述成員包含與步驟i中選出的成員互補(bǔ)的序列。
51.根據(jù)引用權(quán)利要求46的權(quán)利要求50的方法,其中如下實(shí)現(xiàn)避免胍基作為5’殘基避免在步驟i中選擇包含5’胍基殘基的那些序列,和/或在步驟j中省略包含5’胍基殘基的那些序列。
52.根據(jù)權(quán)利要求45-51中的任一項(xiàng)的方法,其中繼續(xù)步驟m中的重復(fù)步驟,直到所述第三集合的組成成員組合在一起可以與來(lái)自步驟b的靶核酸序列集合中的至少85%成員互補(bǔ)為止。
53.根據(jù)權(quán)利要求45-52中的任一項(xiàng)的方法,其中,在選出所述第三集合的第一個(gè)成員后,在步驟c之后并在步驟d中的選擇之前鑒別在所述第一集合中與超過(guò)所述最大數(shù)目的選定百分?jǐn)?shù)的所述第二集合成員雜交的成員,由此僅有如此鑒別到的這些成員進(jìn)行步驟d中的選擇。
54.根據(jù)權(quán)利要求53的方法,其中選定的百分?jǐn)?shù)為80%。
55.根據(jù)權(quán)利要求45-54中的任一項(xiàng)的方法,其中確保以前未被定性為有用探針的成員不會(huì)進(jìn)入第三集合。
56.根據(jù)權(quán)利要求55的方法,其中如下避免在第三集合中包含以前定性失敗的寡核苷酸序列i)減小步驟a的集合,以僅包括以前沒(méi)有定性失敗的那些序列,和/或ii)避免在步驟d或i中選擇以前沒(méi)有定性失敗的那些序列,和/或iii)在步驟e和/或j中省略以前沒(méi)有定性失敗的那些序列。
57.根據(jù)權(quán)利要求45-56中的任一項(xiàng)的方法,其中N是選自6,7,8,9,10,11和12的整數(shù)。
58.根據(jù)權(quán)利要求57的方法,其中N是8或9。
59.根據(jù)權(quán)利要求45-58中的任一項(xiàng)的方法,其中所述步驟b的第二集合包含權(quán)利要求24或25定義的靶核酸序列。
60.根據(jù)權(quán)利要求45-59中的任一項(xiàng)的方法,其基本上按照?qǐng)D2所示方式實(shí)施。
61.根據(jù)權(quán)利要求45-60中的任一項(xiàng)的方法,其中所述第一、第二和第三集合存儲(chǔ)在計(jì)算機(jī)系統(tǒng)的存儲(chǔ)器中,優(yōu)選地存儲(chǔ)在數(shù)據(jù)庫(kù)中。
62.提供執(zhí)行根據(jù)權(quán)利要求45-61之任一項(xiàng)的方法的指令的計(jì)算機(jī)程序產(chǎn)品,其寫在計(jì)算機(jī)可讀介質(zhì)中。
63.包含靶序列的數(shù)據(jù)庫(kù)以及用于執(zhí)行權(quán)利要求62的計(jì)算機(jī)程序的應(yīng)用程序的系統(tǒng)。
64.鑒別用于檢測(cè)靶核酸的特定手段的方法,該方法包含A)向計(jì)算機(jī)系統(tǒng)中輸入唯一地標(biāo)識(shí)所述靶核酸的核酸序列的數(shù)據(jù),其中所述計(jì)算機(jī)系統(tǒng)包含容納有至少一個(gè)根據(jù)權(quán)利要求1-39之任一項(xiàng)的核酸探針文庫(kù)的組成信息的數(shù)據(jù)庫(kù),并且,其中該計(jì)算機(jī)系統(tǒng)還包含針對(duì)所述至少一個(gè)文庫(kù)中的每個(gè)探針的靶核酸序列的數(shù)據(jù)庫(kù),和/或還包含用于獲取和比較核酸序列數(shù)據(jù)的手段,B)在該計(jì)算機(jī)系統(tǒng)中鑒別來(lái)自所述至少一個(gè)文庫(kù)的探針,其中該探針的序列存在于所述靶核酸序列中或存在于與該靶核酸序列互補(bǔ)的序列中,C)在該計(jì)算機(jī)系統(tǒng)中鑒別可以擴(kuò)增該靶核酸序列的引物,和D)提供指出步驟B中鑒別的探針和步驟C中鑒別的引物序列的輸出結(jié)果,作為對(duì)特定檢測(cè)手段的鑒別。
65.根據(jù)權(quán)利要求64的方法,其中步驟A還包含向所述計(jì)算機(jī)系統(tǒng)輸入標(biāo)識(shí)期望從中選出用于該特定檢測(cè)手段中的成員的至少一個(gè)核酸文庫(kù)的數(shù)據(jù)。
66.根據(jù)權(quán)利要求65的方法,其中標(biāo)識(shí)該至少一個(gè)文庫(kù)的組成的數(shù)據(jù)是產(chǎn)品代碼。
67.根據(jù)權(quán)利要求64-66中的任一項(xiàng)的方法,其中步驟A中的輸入通過(guò)因特網(wǎng)界面實(shí)現(xiàn)。
68.根據(jù)權(quán)利要求64-66中的任一項(xiàng)的方法,其中選擇在步驟C中鑒別到的引物,以最小化在PCR反應(yīng)中擴(kuò)增基因組核酸的可能性。
69.根據(jù)權(quán)利要求68的方法,其中選擇至少一個(gè)所述引物以包含在基因組DNA中被內(nèi)含子中斷的核苷酸序列。
70.根據(jù)權(quán)利要求64-69中的任一項(xiàng)的方法,其中選擇在步驟C中選出的引物,以最小化在靶核酸序列上實(shí)施PCR獲得的擴(kuò)增子的長(zhǎng)度。
71.根據(jù)權(quán)利要求64-70中的任一項(xiàng)的方法,其中選擇在步驟C中選出的引物,以優(yōu)化GC含量以便實(shí)施PCR。
72.計(jì)算機(jī)程序產(chǎn)品,其提供用于執(zhí)行根據(jù)權(quán)利要求64-71之任一項(xiàng)的方法的指令,該指令寫在計(jì)算機(jī)可讀介質(zhì)上。
73.一種系統(tǒng),其包含權(quán)利要求1-39之任一項(xiàng)中定義的核酸探針的數(shù)據(jù)庫(kù)和用于執(zhí)行權(quán)利要求72的計(jì)算機(jī)程序的應(yīng)用程序。
74.表征多個(gè)靶序列的方法,其包含使靶序列的樣品與根據(jù)權(quán)利要求1-39之任一項(xiàng)的文庫(kù)接觸,和檢測(cè)、表征或定量與所述靶序列結(jié)合的探針序列。
75.根據(jù)權(quán)利要求74的方法,其檢測(cè)所述多探針序列結(jié)合的所述多個(gè)序列中低于10%存在的核酸序列。
76.根據(jù)權(quán)利要求75的方法,其中所述靶mRNA序列或cDNA序列包含轉(zhuǎn)錄物組。
77.根據(jù)權(quán)利要求76的方法,其中所述轉(zhuǎn)錄物組是人轉(zhuǎn)錄物組。
78.根據(jù)權(quán)利要求74-77中的任一項(xiàng)的方法,其中所述探針文庫(kù)與固相支持物共價(jià)結(jié)合。
79.根據(jù)權(quán)利要求78的方法,其中所述固相支持物包含微量滴定板,該微量滴定板的每個(gè)孔包含一種不同的文庫(kù)探針。
80.根據(jù)權(quán)利要求74-79中的任一項(xiàng)的方法,其中檢測(cè)步驟通過(guò)擴(kuò)增包含與文庫(kù)探針互補(bǔ)的識(shí)別序列的靶核酸序列來(lái)進(jìn)行。
81.權(quán)利要求80的方法,其中使用位于與文庫(kù)探針互補(bǔ)的識(shí)別序列側(cè)翼的寡核苷酸引物對(duì)進(jìn)行靶核酸擴(kuò)增。
82.權(quán)利要求74-81的方法,其中一個(gè)或多個(gè)靶核酸序列的存在或表達(dá)水平與物種的表型相關(guān)。
83.權(quán)利要求82的方法,其中所述表型是疾病。
84.使用根據(jù)權(quán)利要求1-39之任一項(xiàng)的文庫(kù)分析核酸混合物的方法,其包含步驟(a)使靶寡核苷酸與標(biāo)記的寡核苷酸探針的文庫(kù)接觸,以便所述靶寡核苷酸與所述探針文庫(kù)的至少一個(gè)成員雜交,由此形成雜交的文庫(kù),其中所述寡核苷酸探針的每個(gè)都具有已知的序列并與固相支持物上的已知位置結(jié)合;(b)使所述雜交的文庫(kù)與能夠切割雙鏈寡核苷酸的核酸酶接觸以從所述雜交的文庫(kù)中釋放出所述標(biāo)記的寡核苷酸探針的一部分或其片段;和(c)鑒別所述雜交的文庫(kù)上已經(jīng)除去了標(biāo)記的探針或其片段的位置,以確定所述未標(biāo)記的靶寡核苷酸的序列。
85.使用權(quán)利要求1-39之任一項(xiàng)的文庫(kù)分析核酸混合物的方法,其包含步驟(a)使靶寡核苷酸與標(biāo)記的寡核苷酸探針的文庫(kù)接觸,以使所述靶寡核苷酸與所述探針文庫(kù)的至少一個(gè)成員雜交,由此形成雜交的文庫(kù),其中所述寡核苷酸探針的每個(gè)都具有已知的序列并與固相支持物上的已知位置結(jié)合;(b) 鑒別所述雜交的文庫(kù)上標(biāo)記的探針或其片段已發(fā)生雜交的位置,以確定所述靶寡核苷酸的序列;和(c) 鑒別所述雜交的文庫(kù)上已經(jīng)除去了標(biāo)記的探針或其片段的位置,以確定所述未標(biāo)記的靶寡核苷酸的序列。
86.定性或定量地確定樣品中靶核酸的存在的方法,該方法包含i)利用根據(jù)權(quán)利要求64-71之任一項(xiàng)的方法,鑒別檢測(cè)所述靶核酸的特定手段,其中所述特定檢測(cè)手段包含寡核苷酸探針和引物組,ii)獲得步驟i)中鑒別的引物和寡核苷酸探針,iii)在存在來(lái)自步驟ii)的引物和寡核苷酸探針的情況下對(duì)所述樣品實(shí)施分子擴(kuò)增操作,和iv)基于步驟iii)的結(jié)果,確定靶核酸的存在。
87.根據(jù)權(quán)利要求86的方法,其中步驟ii)中獲得的引物是通過(guò)合成獲得的。
88.根據(jù)權(quán)利要求86或87的方法,其中寡核苷酸探針是從根據(jù)權(quán)利要求1-39之任一項(xiàng)的文庫(kù)中獲得的。
89.根據(jù)權(quán)利要求86-88中的任一項(xiàng)的方法,其中步驟iii)中的所述操作是PCR或NASBA操作。
90.根據(jù)權(quán)利要求89的方法,其中所述PCR操作是qPCR。
全文摘要
本發(fā)明涉及用于檢測(cè)、分類或定量復(fù)雜的核酸混合物,例如轉(zhuǎn)錄物組中的組分的核酸探針、核酸探針文庫(kù)和試劑盒、以及它們的使用方法。本發(fā)明還涉及鑒別可用于該探針文庫(kù)的核酸探針的方法,和鑒別可用于檢測(cè)給定核酸的手段的方法。
文檔編號(hào)C12Q1/68GK101090979SQ200580044448
公開(kāi)日2007年12月19日 申請(qǐng)日期2005年12月21日 優(yōu)先權(quán)日2004年12月22日
發(fā)明者N·B·拉姆辛, P·莫利特贊, S·M·伊馳瓦爾德, N·托爾斯特魯普 申請(qǐng)人:埃克斯魁恩公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1