亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

通過(guò)角度配置搜索的用于基因分型的系統(tǒng)和方法

文檔序號(hào):6360672閱讀:269來(lái)源:國(guó)知局

專(zhuān)利名稱(chēng)::通過(guò)角度配置搜索的用于基因分型的系統(tǒng)和方法通過(guò)角度配置搜索的用于基因分型的系統(tǒng)和方法
背景技術(shù)
:在本領(lǐng)域內(nèi)公知配置為雙重反應(yīng)的基因分型測(cè)定。在這種雙重反應(yīng)中,在不同的波長(zhǎng)處發(fā)光的兩種染料可以與各探針相關(guān),所述各探針針對(duì)生物樣品中的靶二倍體基因位點(diǎn)的兩個(gè)等位基因中的一個(gè)。在這種雙重反應(yīng)中,通過(guò)結(jié)合第一染料信號(hào)(信號(hào)I)和第二染料信號(hào)(信號(hào)2)得到3個(gè)可能的基因型的各自的離散信號(hào)集,其產(chǎn)生以(信號(hào)1,信號(hào)I)、(信號(hào)1,信號(hào)2)和(信號(hào)2,信號(hào)2)給出的3個(gè)離散信號(hào)集??梢允占@種信號(hào)作為可以包括多個(gè)數(shù)據(jù)點(diǎn)的數(shù)據(jù)集,其中各數(shù)據(jù)點(diǎn)對(duì)應(yīng)于多個(gè)樣品中各樣品的3個(gè)離散信號(hào)集中的一個(gè)。這種數(shù)據(jù)點(diǎn)的數(shù)據(jù)集可以被存儲(chǔ)在多種計(jì)算機(jī)可讀介質(zhì)中,以及在分析過(guò)程或者分析之后被分析或動(dòng)態(tài)地分析。關(guān)于此,對(duì)于3個(gè)可能的基因型中的每個(gè)產(chǎn)生的的3個(gè)離散信號(hào)集,可以顯示在笛卡爾坐標(biāo)圖中。這種坐標(biāo)圖的軸可以顯示為第一染料信號(hào)對(duì)第二染料信號(hào),其中各樣品的各離散信號(hào)集可以表示為這種坐標(biāo)圖中的數(shù)據(jù)點(diǎn)。然后,對(duì)于代表二倍體基因組的多個(gè)來(lái)自任何地方的樣品,1-3個(gè)點(diǎn)群集可以出現(xiàn)在這樣的笛卡爾坐標(biāo)圖中。經(jīng)常以這種方法確定各數(shù)據(jù)點(diǎn)在笛卡爾坐標(biāo)圖中的角度,從而所述數(shù)據(jù)可以以角度的形式表達(dá)。在本領(lǐng)域內(nèi),通常使用群集分析來(lái)分析這些數(shù)據(jù),以定義離散群集,并且僅基于群集擬合指定基因型?;诙喾N理由,這種方法可能不能精確地指定樣品的基因型。首先,多個(gè)基因型測(cè)定的3個(gè)角度的角度配置可以顯著地不同,以及額外地,對(duì)于任何具體的基因型測(cè)定,所述角度配置可能在運(yùn)行到運(yùn)行(run-to-run)中不同。關(guān)于此,單獨(dú)的角度信息不足以指定基因型。其次,關(guān)于分析的多個(gè)生物樣品,可能具有僅在I個(gè)或2個(gè)群集中聚集的數(shù)據(jù)。關(guān)于其中存在所有3個(gè)群集的數(shù)據(jù),可以更容易實(shí)現(xiàn)模型的擬合,因?yàn)榻嵌瓤臻g被3個(gè)可能的解決方案限制。然而,關(guān)于從多個(gè)生物樣品得到的數(shù)據(jù)集(其中,僅出現(xiàn)I個(gè)或2個(gè)群集),模型的擬合可能更加困難,導(dǎo)致對(duì)至少一些樣品作出的不正確的讀取基因型(genotypecall)。例如,在這種數(shù)據(jù)集的最終讀取可能依賴(lài)于對(duì)照樣品的角度。關(guān)于此,如果對(duì)照樣品被污染,例如,或者以任何方式錯(cuò)誤地鑒定為不正確的群集,則所述群集的各成員將被作出不正確的讀取。本領(lǐng)域需要基因型數(shù)據(jù)的穩(wěn)健分析,其中,最佳化被明確地定義,并且在數(shù)據(jù)集中指定樣品基因型的最終結(jié)果中產(chǎn)生合適的置信度,其中所述數(shù)據(jù)集可以由基于生物體基因組的倍性狀態(tài)的有限數(shù)目的數(shù)據(jù)點(diǎn)群集表示。圖1為示出了用于分析基因分型數(shù)據(jù)的方法的多個(gè)實(shí)施方案的流程圖。圖2為示出了用于基因分型數(shù)據(jù)的數(shù)據(jù)分析前處理的方法的多個(gè)實(shí)施方案的流程圖。圖3為根據(jù)用于分析基因分型數(shù)據(jù)的方法的多個(gè)實(shí)施方案,將角度指定為數(shù)據(jù)群集的示例性的圖表。圖4為PCR儀器(其可以被用于處理用于分析基因型的樣品)的方塊圖。圖5為PCR儀器(其可以被用于處理用于分析基因型的樣品)的方塊圖。圖6為說(shuō)明在PCR儀器的控制和接口中可以使用的示例性的計(jì)算機(jī)系統(tǒng)的部件的方塊圖。圖7A-7C為可以為根據(jù)角度配置(其為基因分型數(shù)據(jù)的可能的角度配置)數(shù)據(jù)庫(kù)的多個(gè)實(shí)施方案,可以是角度配置的子集的角度配置的圖示。圖8A-8C為用于分析基因分型數(shù)據(jù)的方法的多個(gè)實(shí)施方案的圖示。圖9A-9C為用于分析基因分型數(shù)據(jù)的方法的多個(gè)實(shí)施方案的圖示。圖10A-10C為根據(jù)用于分析基因分型數(shù)據(jù)的方法的多個(gè)實(shí)施方案,示例性的兩個(gè)群集數(shù)據(jù)集擬合的圖示。圖11A-11C為根據(jù)用于分析基因分型數(shù)據(jù)的方法的多個(gè)實(shí)施方案,示例性的一個(gè)群集數(shù)據(jù)集擬合的圖示。具體實(shí)施方案本教導(dǎo)涉及用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)的實(shí)施方案。根據(jù)方法和系統(tǒng)的多個(gè)實(shí)施方案,可以進(jìn)行角度配置搜索。在多個(gè)實(shí)施方案中,可以進(jìn)行在整個(gè)角度配置空間內(nèi)的窮舉搜索以向多個(gè)角度提供擬合,所述角度是由從多個(gè)生物樣品中產(chǎn)生的數(shù)據(jù)集中的多個(gè)數(shù)據(jù)點(diǎn)確定的。關(guān)于多個(gè)實(shí)施方案,可以定義角度配置空間以確??梢源_定整體擬合。根據(jù)多種方法和系統(tǒng),可以搜索可能的角度配置數(shù)據(jù)庫(kù),其中,各角度配置包括3個(gè)角度。根據(jù)多種方法和系統(tǒng),可能的角度配置數(shù)據(jù)庫(kù)可以包括對(duì)于各角度配置的可能出現(xiàn)的角度配置的概率。關(guān)于用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)的多個(gè)實(shí)施方案,在可以進(jìn)行角度配置搜索之前可以進(jìn)行數(shù)據(jù)的預(yù)處理。此外,使用用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)的多個(gè)實(shí)施方案,可以指定對(duì)樣品作出的讀取基因型(genotypecall)的質(zhì)量評(píng)分。根據(jù)本教導(dǎo),方法和系統(tǒng)的多種實(shí)施方案可以使用數(shù)據(jù)集,其可以根據(jù)示于圖3中的圖表表示。這種表示可以產(chǎn)生于使用兩種在不同的波長(zhǎng)處發(fā)光的染料的分析,該染料可以與針對(duì)生物樣品中的二倍體基因位點(diǎn)的兩個(gè)等位基因中的一個(gè)的各探針相關(guān)。在這種雙重反應(yīng)中,產(chǎn)生了三個(gè)可能的基因型的各自的離散信號(hào)集。在信號(hào)I對(duì)信號(hào)2的笛卡爾坐標(biāo)系統(tǒng)中,如圖3所示,在這種圖示中示出的各數(shù)據(jù)點(diǎn)可以具有位于給定的3個(gè)離散信號(hào)集的一個(gè)中的坐標(biāo),例如,參考圖3,如(信號(hào)I,信號(hào)I)、(信號(hào)I,信號(hào)2)和(信號(hào)2,信號(hào)2)。如之前所述,多個(gè)樣品的各離散信號(hào)集可以作為數(shù)據(jù)點(diǎn)被存儲(chǔ)在數(shù)據(jù)集中。這種數(shù)據(jù)集可以被存儲(chǔ)在多個(gè)計(jì)算機(jī)可讀介質(zhì)中,在分析過(guò)程或分析之后被分析或動(dòng)態(tài)地分析,將會(huì)下面詳細(xì)地討論。用于顯示用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)的實(shí)施方案的特征的一種這樣的測(cè)定可以使用TaqMan⑩試劑,以及可以使用FAM和VIC染料標(biāo)記。然而,本領(lǐng)域的普通的技術(shù)人員將會(huì)認(rèn)識(shí)到包括標(biāo)記探針試劑的多種測(cè)定可以被用于得到數(shù)據(jù),根據(jù)本發(fā)明的方法和系統(tǒng)的多個(gè)實(shí)施方案可以分析所述數(shù)據(jù)。根據(jù)多個(gè)實(shí)施方案,術(shù)語(yǔ)“標(biāo)記探針”通常指的是在擴(kuò)增反應(yīng)中使用的分子,通常用于定量或?qū)崟r(shí)PCR分析,以及終點(diǎn)分析。這種標(biāo)記探針可以用于監(jiān)測(cè)靶多核苷酸的擴(kuò)增。在一些實(shí)施方案中,存在于擴(kuò)增反應(yīng)中的寡核苷酸探針適合于監(jiān)測(cè)隨著時(shí)間產(chǎn)生的擴(kuò)增子的量。這種寡核苷酸探針包括,但是不限于在此描述的5'-外切核酸酶測(cè)定TaqMan探針(還可以參見(jiàn)美國(guó)專(zhuān)利第5,538,848號(hào))、多種莖環(huán)分子信標(biāo)(參見(jiàn),例如,美國(guó)專(zhuān)利第6,103,476號(hào)和第5,925,517號(hào),以及Tyagi和Kramer,1996,NatureBiotechnology14:303-308)、無(wú)莖或線性信標(biāo)(參見(jiàn),例如W099/21881)、PNAMolecularBeacons(參見(jiàn),例如,美國(guó)專(zhuān)利第6,355,421號(hào)和第6,593,091號(hào))、線性PNA信標(biāo)(參見(jiàn),Kubista等,2001,SPIE4264:53-58)、非FRET探針(參見(jiàn),例如,美國(guó)專(zhuān)利第6,150,097號(hào))、Sunrise/Amplifluor⑧探針(美國(guó)專(zhuān)利第6,548,250號(hào))、莖環(huán)和duplexScorpion探針(Solinas等,2001,NucleicAcidsResearch29:E96,以及美國(guó)專(zhuān)利第6,589,743號(hào))、凸環(huán)探針(美國(guó)專(zhuān)利第6,590,091號(hào))、偽結(jié)探針(美國(guó)專(zhuān)利第6,589,250號(hào))、cyclicons(美國(guó)專(zhuān)利第6,383,752號(hào))、MGBEclipse探針(EpochBiosciences)、發(fā)卡結(jié)構(gòu)探針(美國(guó)專(zhuān)利第6,596,490號(hào))、肽核酸(PNA)light-up探針、自組裝納米粒子探針、和二茂鐵改性的探針,例如,在美國(guó)專(zhuān)利第6,485,901號(hào)中所述;Mhlanga等,2001,Methods25:463-471;Whitcombe等,1999,NatureBiotechnology.17:804-807;Isacsson等,2000,MolecularCellProbes.14:321-328;Svanvik等,2000,AnalBiochem.28126-35;ffolffs等,2001,Biotechniques766:769-771;Tsourkas等,2002,NucleicAcidsResearch.30:4208-4215;Riccelli等,2002,NucleicAcidsResearch30:4088-4093;Zhang等,2002Shangha1.34:329-332;Maxwell等,2002,J.Am.Chem.Soc.124:9606-9612;Broude等,2002,TrendsBiotechnol.20:249-56;Huang等,2002,ChemRes.Toxicol.15118-126;和Yu等,2001,J.Am.Chem.Soc14:11155-11161。標(biāo)記探針還可以包括黑洞淬滅劑(Biosearch)、IowaBlack(IDT)、QSY淬滅劑(分子探針)和丹磺?;虳abcel磺酸酯/羧酸酯淬滅劑(Epoch)。標(biāo)記探針還可以包括兩種探針,其中,例如,熒光基團(tuán)在一種探針上,而淬滅劑在另一種探針上,其中,兩種探針一起在靶上雜交淬滅信號(hào),或者其中,在靶上的雜交通過(guò)改變熒光而改變信號(hào)特征。標(biāo)記探針還可以包含用磺酸基代替羧酸酯基的熒光素染料磺酸衍生物,亞磷酰胺形式的熒光素,亞磷酰胺形式的CY5(例如,可購(gòu)自Amersham)。如在此所使用,術(shù)語(yǔ)“核苷酸樣品”指的是根據(jù)本發(fā)明的教導(dǎo)在生物樣品中發(fā)現(xiàn)的核苷酸??煽紤]可以侵入性或非侵入性地采集樣品。所述樣品可以在纖維、織物、香煙、口香糖、粘合劑材料、泥土或無(wú)生命物體之上,之中,在其中,來(lái)自其中,或者與其一起發(fā)現(xiàn)。如在此使用的“樣品”是以最廣泛的含義使用,并且指的是包含核苷酸的樣品,其中,從所述核苷酸中可以得到靶基因或靶多核苷酸。樣品可以包括細(xì)胞、從細(xì)胞中分離的染色體(例如,分散的中期染色體)、基因組DNA、RNA、cDNA等。樣品可以為動(dòng)物源或植物源的,涵蓋包含核苷酸的任何有機(jī)體,包括,但不限于,植物、家畜、寵物和人樣品,并且可以來(lái)源于多種源。這些源可以包括,但不限于,全血、頭發(fā)、血液、尿液、組織活體檢查、淋巴、骨、骨髓、牙齒、羊水、頭發(fā)、皮膚、精液、肛門(mén)分泌物、陰道分泌物、汗液、唾液、腮抹試、多種環(huán)境樣品(例如,農(nóng)業(yè)的、水和泥土)、研究樣品、純化的樣品和溶解的細(xì)胞。應(yīng)該理解,通過(guò)使用本領(lǐng)域已知的多種樣品制備程序中的任一種,例如,包括使用這樣的程序,如機(jī)械力、超聲、限制酶、或本領(lǐng)域中已知的任何方法,可以從所述樣品中分離包含靶多核苷酸序列的核酸樣品。在此使用的術(shù)語(yǔ)“靶多核苷酸”、“靶基因”、“靶基因位點(diǎn)”等以可換的方式使用,以及指的是特定的目的核苷酸序列?!鞍小笨梢詾榇龜U(kuò)增的多核苷酸序列,并且可以在其它核苷酸分子的存在下存在或存在于更大的核苷酸分子中??梢詮娜魏卧粗械玫剿霭卸嗪塑账幔约翱梢园ㄈ魏瘟康牟煌慕M成組分。例如,所述靶可以為核苷酸(例如,DNA或RNA)。所述靶可以被甲基化、沒(méi)有被甲基化或同時(shí)甲基化和沒(méi)有被甲基化。此外,應(yīng)該理解在特定的目的核苷酸序列的上下文中使用的“靶”還指其替代物,例如,擴(kuò)增產(chǎn)物和天然序列。在一些實(shí)施方案中,特定的目的核苷酸序列為從降解源(degradedsource)中得到的短DNA分子,例如,可以在如法醫(yī)樣品中發(fā)現(xiàn),但不限于此。如上所述,本教導(dǎo)的特定的目的核苷酸序列可以從任何量的有機(jī)體和源得到。關(guān)于靶基因位點(diǎn)的倍性狀態(tài),對(duì)于其中兩個(gè)等位基因定義位點(diǎn)的具有二倍體基因組的有機(jī)體,這種二倍體狀態(tài)存在三個(gè)可能的基因型。本領(lǐng)域的普通的技術(shù)人員將會(huì)理解任何倍性狀態(tài)與定義基因型類(lèi)別的有限量的等位基因組合離散地相關(guān)。因此,關(guān)于具有目的靶基因位點(diǎn)的任何樣品的任何倍性狀態(tài),存在有限的和可計(jì)算量的基因型。如在此所使用,“DNA”指的是如在本領(lǐng)域內(nèi)所理解的多種形式的脫氧核糖核酸,例如,基因組DNA、cDNA、分離的核酸分子、載體DNA和染色體DNA?!昂怂帷敝傅氖侨魏涡问降腄NA或RNA。分離的核酸分子的實(shí)例包括,但不限于,在載體中包含的重組DNA分子、在異源宿主細(xì)胞中保持的重組DNA分子、部分地或基本上純化的核酸分子和合成的DNA分子。通常地,“分離的”核酸沒(méi)有在核酸來(lái)源的生物體的基因組DNA中天然位于核酸側(cè)翼的序列(即,位于核酸的5'和3'末端的序列)。此外,“分離的”核酸分子,例如cDNA分子,當(dāng)通過(guò)重組技術(shù)制備時(shí)一般基本無(wú)其它細(xì)胞物質(zhì)或培養(yǎng)基,或者當(dāng)化學(xué)合成時(shí),無(wú)化學(xué)前體或其它化學(xué)藥品。如在圖4和圖5所示的方塊圖所示,根據(jù)本教導(dǎo)的用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)的多個(gè)實(shí)施方案可以使用熱循環(huán)儀的多個(gè)實(shí)施方案。如圖4所示,根據(jù)熱循環(huán)儀500的多個(gè)實(shí)施方案,熱循環(huán)儀可以包括置于在多個(gè)樣品512上的加熱蓋510,所述多個(gè)樣品512包含在樣品支撐裝置中。在多個(gè)實(shí)施方案中,樣品支撐裝置可以為具有多個(gè)樣品區(qū)域的玻璃或塑料玻片,其中,樣品區(qū)域具有位于樣品區(qū)域和加熱罩512之間的蓋。樣品支撐裝置的一些實(shí)例可以包括,但不限于,多孔板,例如標(biāo)準(zhǔn)微孔96孔板、384孔板、每次分析能夠處理數(shù)千個(gè)樣品的微裝置,例如,微流體裝置,如縮微卡,或微芯片,或由基本的平面支撐(例如玻璃或塑料玻片)制備的任何類(lèi)型的裝置。在樣品支撐裝置的多個(gè)實(shí)施方案中,樣品區(qū)域可以包括凹陷、壓痕、壟及其組合,在所述基板的表面上形成的規(guī)則或不規(guī)則陣列的圖形。熱循環(huán)儀的多個(gè)實(shí)施方案中,包括樣品區(qū)組514、用于加熱或冷卻的兀件516和熱交換器518。根據(jù)本教導(dǎo)的熱塊組件的多個(gè)實(shí)施方案包括圖4的熱循環(huán)系統(tǒng)500的部件514-518。在圖5中,熱循環(huán)系統(tǒng)600的多個(gè)實(shí)施方案包括實(shí)施方案的熱循環(huán)器500的部件,以及假若圖5的多個(gè)實(shí)施方案為實(shí)時(shí)的,還額外包括探測(cè)系統(tǒng)。相反,關(guān)于圖4的熱循環(huán)儀的各實(shí)施方案,作為終點(diǎn)或在熱循環(huán)檢測(cè)后進(jìn)行檢測(cè)。檢測(cè)系統(tǒng)可以具有發(fā)出電磁能的照明源,和檢測(cè)器或成像器610,其用于接收來(lái)自在樣品支撐裝置中的樣品616的電磁能。關(guān)于熱循環(huán)儀500和600的實(shí)施方案,控制系統(tǒng)530和624分別可以用于控制探測(cè)、加熱蓋和熱塊組件的功能。最終用戶(hù)可以通過(guò)熱循環(huán)儀500的用戶(hù)界面522和熱循環(huán)儀600的用戶(hù)界面626訪問(wèn)所述控制系統(tǒng)。如在圖6中所示的計(jì)算機(jī)系統(tǒng)700可以起到提供控制熱循環(huán)儀的功能和用戶(hù)界面功能的作用。此外,計(jì)算機(jī)系統(tǒng)700可以提供數(shù)據(jù)處理、顯示和報(bào)告準(zhǔn)備功能。所有的這種儀器控制功能可以局部地專(zhuān)用于熱循環(huán)儀,或者計(jì)算機(jī)系統(tǒng)700可以提供部分或所有的控制、分析和報(bào)告功能的遠(yuǎn)程控制,將在后面更加詳細(xì)地討論。圖6為闡述計(jì)算機(jī)系統(tǒng)700的方塊圖,可以使用所述計(jì)算機(jī)系統(tǒng)700以進(jìn)行處理功能,根據(jù)多個(gè)實(shí)施方案,圖4的熱循環(huán)儀系統(tǒng)500或圖5的熱循環(huán)儀系統(tǒng)600的實(shí)施方案可以使用它。計(jì)算機(jī)系統(tǒng)700可以包括一個(gè)或多個(gè)的處理器,例如處理器704??梢允褂猛ㄓ玫幕蛱胤N用途的處理引擎(例如,如微處理器、控制器或其它控制邏輯)實(shí)現(xiàn)處理器704。在該實(shí)例中,處理器704被聯(lián)結(jié)到總線702上或其它通信介質(zhì)上。此外,應(yīng)該理解到圖6的計(jì)算機(jī)系統(tǒng)700可以以多種形式的任意一種實(shí)施,例如,機(jī)架式計(jì)算機(jī)、主機(jī)、超級(jí)計(jì)算機(jī)、服務(wù)器、客戶(hù)端、桌面式計(jì)算機(jī)、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)(tabletcomputer)、手持式計(jì)算裝置(例如,PDA、手機(jī)、智能手機(jī)、掌上型計(jì)算機(jī)等)、群網(wǎng)格、上網(wǎng)本、嵌入式系統(tǒng)或其它任何類(lèi)型的對(duì)于給定的用途或環(huán)境可能是需要的或合適的特種或通用用途的計(jì)算機(jī)裝置。此外,計(jì)算機(jī)系統(tǒng)700可以包括包含客戶(hù)端/服務(wù)器環(huán)境和一個(gè)或多個(gè)的數(shù)據(jù)庫(kù)服務(wù)器的常規(guī)網(wǎng)絡(luò)系統(tǒng),或LIS/LIMS基礎(chǔ)架構(gòu)集成。在本領(lǐng)域內(nèi)已知一些常規(guī)的網(wǎng)絡(luò)系統(tǒng),包括局域網(wǎng)(LAN)或廣域網(wǎng)絡(luò)(WAN),以及包括無(wú)線和/或有線部件。此外,客戶(hù)端/服務(wù)器環(huán)境、數(shù)據(jù)庫(kù)服務(wù)器和網(wǎng)絡(luò)也在本領(lǐng)域中有詳細(xì)描述。計(jì)算機(jī)系統(tǒng)700可以包括用于交換信息的總線702或其它通信機(jī)制,和與總線702聯(lián)結(jié)用于處理信息的處理器704。計(jì)算機(jī)系統(tǒng)700還包括內(nèi)存706,其可以為隨機(jī)存取內(nèi)存(RAM)或其它動(dòng)態(tài)內(nèi)存,聯(lián)結(jié)到總線702以存儲(chǔ)等待處理器704執(zhí)行的指令。內(nèi)存706還可以被用于存儲(chǔ)在等待處理器704執(zhí)行的指令的執(zhí)行過(guò)程中的臨時(shí)變量或其它中間信息。計(jì)算機(jī)系統(tǒng)700進(jìn)一步包括只讀內(nèi)存(ROM)708或聯(lián)結(jié)到總線702上以存儲(chǔ)靜態(tài)信息和處理器704指令的其它靜態(tài)存儲(chǔ)器。計(jì)算機(jī)系統(tǒng)700還可以包括存儲(chǔ)器710,例如,磁盤(pán)、光盤(pán),或設(shè)置固態(tài)驅(qū)動(dòng)器(SSD)并聯(lián)結(jié)到總線702上以存儲(chǔ)信息和指令。存儲(chǔ)器710可以包括介質(zhì)驅(qū)動(dòng)器和可移動(dòng)存儲(chǔ)接口。介質(zhì)驅(qū)動(dòng)器可以包括驅(qū)動(dòng)器或支撐固定的或可移動(dòng)的存儲(chǔ)介質(zhì)的其它裝置,例如,硬盤(pán)驅(qū)動(dòng)器、軟盤(pán)驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、光盤(pán)驅(qū)動(dòng)器、⑶或DVD驅(qū)動(dòng)器(R或RW)、閃存驅(qū)動(dòng)器或其它可移動(dòng)或固定的介質(zhì)驅(qū)動(dòng)器。如這些實(shí)例所顯示,存儲(chǔ)介質(zhì)可以包括具有存儲(chǔ)在其中的特殊的計(jì)算機(jī)軟件、指令或數(shù)據(jù)的計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)。在可替換的實(shí)施方案中,存儲(chǔ)器710可以包括其它類(lèi)似的媒介以允許計(jì)算機(jī)程序或其它指令或數(shù)據(jù)載入到計(jì)算機(jī)系統(tǒng)700中。這樣的媒介可以包括,例如,可移動(dòng)存儲(chǔ)單元和接口,例如,程序盒和盒式接口,可移動(dòng)記憶體(例如,閃存或其它可移動(dòng)存儲(chǔ)模塊)和記憶卡插槽,以及允許軟件和數(shù)據(jù)從存儲(chǔ)器710傳輸?shù)接?jì)算機(jī)系統(tǒng)700中的其它可移動(dòng)存儲(chǔ)單元和接口。計(jì)算機(jī)系統(tǒng)700還可以包括通信接口718。通信接口718可以被用于允許軟件或數(shù)據(jù)在計(jì)算機(jī)系統(tǒng)700和外部設(shè)備之間傳輸。通信接口718的實(shí)例可以包括調(diào)制解調(diào)器、網(wǎng)絡(luò)接口(例如以太網(wǎng)或其它NIC卡)、通信端口(例如,如USB端口、RS-232C串行端口)、PCMCIA插槽和卡、藍(lán)牙等。通過(guò)通信接口718傳輸?shù)能浖蛿?shù)據(jù)為信號(hào)的形式,其可以為電信號(hào)、電磁信號(hào)、光信號(hào)或能夠被通信接口718接收的其它信號(hào)。這些信號(hào)可以通過(guò)通信接口718經(jīng)過(guò)通道(例如無(wú)線介質(zhì)、電線或電纜、光纖或其它通信介質(zhì))發(fā)送和接收。通道的一些實(shí)例包括電話(huà)線、手機(jī)連接、RF連接、網(wǎng)絡(luò)接口、局域或廣域網(wǎng)絡(luò)和其它通信通道。計(jì)算機(jī)系統(tǒng)700通過(guò)總線702可以聯(lián)結(jié)到顯示器712(例如,陰極射線管(CRT)或液晶顯示器(LCD)),以向計(jì)算機(jī)用戶(hù)顯示信息。包括字母數(shù)字和其它鍵輸入裝置714聯(lián)結(jié)到總線702上用于例如向處理器704傳達(dá)信息和命令選擇。輸入裝置還可以為顯示器,例如,配置有觸摸屏輸入能力的IXD顯示器。另一種用戶(hù)輸入裝置為光標(biāo)控制器716,例如,鼠標(biāo)、軌跡球或光標(biāo)方向鍵,其用于向處理器704傳達(dá)方向信息和命令選擇和用于控制顯示器712上的光標(biāo)移動(dòng)。這種輸入裝置通常在兩個(gè)軸(第一軸(如X)和第二軸(如y))上具有二級(jí)自由度,其允許在平面內(nèi)指定位置。計(jì)算機(jī)系統(tǒng)700提供了數(shù)據(jù)處理并為這些數(shù)據(jù)提供了置信水平。與本教導(dǎo)的實(shí)施方案的某些實(shí)施一致,通過(guò)響應(yīng)執(zhí)行在內(nèi)存706中包含的一個(gè)或多個(gè)的序列的一個(gè)或多個(gè)的指令的處理器704,由計(jì)算機(jī)系統(tǒng)700提供數(shù)據(jù)處理和置信度值。這樣的指定可以從另一計(jì)算機(jī)可讀介質(zhì)(例如存儲(chǔ)器710)中讀取到內(nèi)存706中。在內(nèi)存706中包含的指令序列的執(zhí)行導(dǎo)致處理器704實(shí)施在此所述的處理狀態(tài)?;蛘呖梢允褂糜策B線電路代替軟件指令或與軟件指令結(jié)合以實(shí)施本教導(dǎo)的實(shí)施方案。因此,本教導(dǎo)的實(shí)施方案的實(shí)施不限于硬件電路和軟件的任何具體的結(jié)合。在此使用的術(shù)語(yǔ)“計(jì)算機(jī)可讀介質(zhì)”和“計(jì)算機(jī)程序產(chǎn)品”通常指的是參與向處理器704提供一個(gè)或多個(gè)的序列或一個(gè)或多個(gè)的指令的任何介質(zhì)用于執(zhí)行。這樣的指令通常稱(chēng)作“計(jì)算機(jī)程序代碼”(其可以以計(jì)算機(jī)程序的形式或其它分組方法分組),當(dāng)執(zhí)行時(shí),使計(jì)算機(jī)系統(tǒng)700能夠?qū)嵤┍景l(fā)明的實(shí)施方案的特征或功能。這些和其它形式的計(jì)算機(jī)可讀介質(zhì)可以采取許多形式,包括但不限于,非易失性介質(zhì)、易失性介質(zhì)和傳輸介質(zhì)。非易失性介質(zhì)包括,例如,固態(tài)、光盤(pán)或磁盤(pán),例如,存儲(chǔ)器710。易失性介質(zhì)包括動(dòng)態(tài)內(nèi)存,例如內(nèi)存706。傳輸介質(zhì)包括同軸電纜、銅線和光纖,包括具有總線702的電線。計(jì)算機(jī)可讀介質(zhì)的普通形式包括,例如,如下文所述的軟盤(pán)、軟磁盤(pán)、硬盤(pán)、磁帶或任何其它磁性介質(zhì)、CD-ROM、任何其它光學(xué)介質(zhì)、穿孔卡、紙帶、具有孔圖形的任何其它物理介質(zhì)、RAM、PROM和EPROM、FLASH-EPR0M、任何其它內(nèi)存芯片或盒式磁帶內(nèi)存、本文下文描述的載波,或計(jì)算機(jī)可讀取的任何其它介質(zhì)。計(jì)算機(jī)可讀介質(zhì)的多種形式可以參與向處理器704運(yùn)送一個(gè)或多個(gè)的序列的一個(gè)或多個(gè)的指令用于執(zhí)行。例如,所述指令可以最初存儲(chǔ)在遠(yuǎn)程計(jì)算機(jī)的磁盤(pán)上。所述遠(yuǎn)程計(jì)算機(jī)可以將指令載入到其動(dòng)態(tài)內(nèi)存中,并使用調(diào)制調(diào)解器通過(guò)電話(huà)線發(fā)送指令。計(jì)算機(jī)系統(tǒng)700的本地調(diào)制調(diào)解器700可以接收電話(huà)線上的數(shù)據(jù)并使用紅外發(fā)送器將數(shù)據(jù)轉(zhuǎn)化為紅外信號(hào)。聯(lián)結(jié)到總線702上的紅外探測(cè)器可以接收在紅外信號(hào)上攜帶的數(shù)據(jù),并將數(shù)據(jù)置入到總線702上。總線702將數(shù)據(jù)傳輸至內(nèi)存706中,處理器704從內(nèi)存706中取回并執(zhí)行指令。在由處理器704執(zhí)行之前或之后,通過(guò)內(nèi)存706接收的指令可以任選地存儲(chǔ)在存儲(chǔ)器710中。本領(lǐng)域的技術(shù)人員將會(huì)認(rèn)識(shí)到使用硬件、軟件、固件或其酌情的組合可以實(shí)施多種實(shí)施方案的操作。例如,在軟件、固件或硬線邏輯的控制下使用處理器或其它數(shù)字電路可以實(shí)施一些處理。(術(shù)語(yǔ)“邏輯”在此指的是固定的硬件、可編程的邏輯和/或其適當(dāng)?shù)慕M合,如本領(lǐng)域的技術(shù)人員將會(huì)認(rèn)識(shí)到的實(shí)現(xiàn)所列舉的功能。)軟件和固件可以被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中。正如本領(lǐng)域的技術(shù)人員所熟知,使用模擬電路可以實(shí)施一些其它處理。此外,在本發(fā)明的實(shí)施方案中可以采用內(nèi)存或其它存儲(chǔ)器,以及通信部件。將會(huì)理解到,基于清楚的目的,上述描述參照不同的功能單元和處理器已經(jīng)描述了本發(fā)明的實(shí)施方案。然而,顯而易見(jiàn)的是可以使用在不同的功能單元、處理器或域之間的功能性的任何合適的分布,而不會(huì)不利于本發(fā)明。例如,說(shuō)明的由分開(kāi)的處理器或控制器實(shí)施的功能性可以由同一處理器或控制器實(shí)施。因此,訪問(wèn)具體的功能單元僅被看作是訪問(wèn)用于提供所述的功能的裝置,而不是預(yù)示嚴(yán)格的邏輯或物理結(jié)構(gòu)或組織。如之前所討論,參考資料被制成圖3,其顯示根據(jù)本教導(dǎo)的多個(gè)實(shí)施方案的數(shù)據(jù)的理想圖表。正如本領(lǐng)域的普通技術(shù)人員所被告知,關(guān)于基因分型測(cè)定的多個(gè)實(shí)施方案,針對(duì)靶二倍體基因位點(diǎn)的第一等位基因(指定作為等位基因A的范例)的第一探針可以具有與所述探針相關(guān)的第一染料。類(lèi)似地,具有第二染料的第二探針可以為針對(duì)基因位點(diǎn)的第二等位基因(指定作為等位基因B的范例)。作為在熱循環(huán)中發(fā)生的擴(kuò)增,關(guān)于A純合的生物樣品,第一染料的一組信號(hào)將被報(bào)告為純合體AA的各等位基因。類(lèi)似地,關(guān)于B純合的生物樣品,第二染料的一組信號(hào)將被報(bào)告為純合體BB的各等位基因。最后,關(guān)于生物樣品雜合體,第一染料的信號(hào)和第二染料的信號(hào)的一組信號(hào)將被報(bào)告為雜合體AB。關(guān)于此,如此設(shè)計(jì)的基因分型測(cè)定的多個(gè)實(shí)施方案產(chǎn)生靶二倍體基因位點(diǎn)的三個(gè)可能的等位基因組合的各自的離散信號(hào)集,如圖3所示,其顯示數(shù)據(jù)點(diǎn)的3個(gè)群集。關(guān)于圖1的步驟10,以及參考圖3,各數(shù)據(jù)點(diǎn)表示在用于分析基因型的多個(gè)生物樣品中探測(cè)到的樣品的離散信號(hào)集。如上所討論,示于圖3中的各數(shù)據(jù)點(diǎn)可以具有給出的(信號(hào)1,信號(hào)I)、(信號(hào)1、信號(hào)2)和(信號(hào)2,信號(hào)2)的三個(gè)離散信號(hào)集中的一個(gè)坐標(biāo)。關(guān)于例如圖4所示的熱循環(huán)儀,在樣品被循環(huán)至最后一個(gè)循環(huán)之后,可以進(jìn)行探測(cè)作為終點(diǎn)后讀數(shù)。關(guān)于例如在圖5中所示的熱循環(huán)儀,可以隨著樣品循環(huán)至最后一個(gè)循環(huán)進(jìn)行實(shí)時(shí)動(dòng)態(tài)探測(cè),并且可以額外地進(jìn)行探測(cè)作為終點(diǎn)后讀數(shù)。參考圖1的步驟20,以及如圖3所示,用于建立各數(shù)據(jù)點(diǎn)的角度的基線可以由y=C表示的線構(gòu)成,其中,C為常數(shù),以及如圖3所示,包括數(shù)據(jù)的定義的原點(diǎn)。如圖3所示的原點(diǎn)(IV)為各角度αι、%和^13的頂點(diǎn)。根據(jù)本教導(dǎo)的多個(gè)實(shí)施方案,在各群集中的各數(shù)據(jù),圖3中的1、ii和iii可以具有通過(guò)使用數(shù)據(jù)點(diǎn)和定義的原點(diǎn)構(gòu)成的線確定的角度。根據(jù)本發(fā)明的多個(gè)實(shí)施方案,分別與角度αρ%和%相關(guān)的線1、II和III的集合集組成角度配置,其可以選自角度配置數(shù)據(jù)庫(kù),將在后面詳細(xì)討論。根據(jù)多個(gè)實(shí)施方案,原點(diǎn)可以由陰性對(duì)照定義。陰性對(duì)照可以稱(chēng)作無(wú)模板對(duì)照(NTC),其為不包含靶目的基因位點(diǎn)的樣品。關(guān)于基因分型測(cè)定的多個(gè)實(shí)施方案,所述陰性對(duì)照或NTC可以不包含寡核苷酸材料,以及可以包含,例如,但不限于,使體積等同于正被測(cè)定的生物樣品的試劑。根據(jù)其它實(shí)施方案的基因分型測(cè)定,所述NTC可以包含,例如,但不限于,不包含正被測(cè)定的靶基因位點(diǎn)的序列的有效的寡核苷酸樣品。正如本領(lǐng)域的普通技術(shù)人員所被告知,這種NTC樣品還可以產(chǎn)生可被探測(cè)到的背景信號(hào)。關(guān)于此,一個(gè)或多個(gè)的NTC樣品可以用于定義原點(diǎn)和基線,可以探測(cè)從所述原點(diǎn)和基線到樣品發(fā)出的3個(gè)可能的等位基因各自的離散信號(hào)集的角度。在多個(gè)實(shí)施方案中,由此,多個(gè)NTC樣品可以用于確定原點(diǎn)和基線。如本領(lǐng)域的普通技術(shù)人員所被告知,可以存在多種方式處理來(lái)自多個(gè)NTC樣品的數(shù)據(jù)以確定原點(diǎn)的值,包括,但不限于,確定多個(gè)NTC樣品的平均數(shù)、中位數(shù)和形心。用于定義原點(diǎn)的可選的實(shí)施方案可能不涉及使用NTC樣品。例如,所述定義的原定可以基于之前得到的數(shù)據(jù)預(yù)定義。另一實(shí)施方案可以使用樣品群集的形態(tài)以確定原點(diǎn)。另一實(shí)施方案可以基于使用在早期循環(huán)中采集的熒光數(shù)據(jù),其可以標(biāo)示基于定義原點(diǎn)目的的可接受的原點(diǎn)?;蛘?,正如本領(lǐng)域的技術(shù)人員所被告知,包含定義的原點(diǎn)的基線(y=C,其中C為常數(shù))可以基于用戶(hù)定義的原理任意地定義,其中,所述線包含用戶(hù)定義的數(shù)據(jù)原點(diǎn)。例如,可以將原點(diǎn)選擇為示于圖3中的圖表的原點(diǎn),其中,y=O將提供基線。根據(jù)多個(gè)實(shí)施方案,關(guān)于圖1的步驟20,在數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)的角度可以由包含確定的或選定的原點(diǎn)的基線確定。如在圖1的步驟30中所示,關(guān)于本教導(dǎo)的用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)的實(shí)施方案的多個(gè)實(shí)施方案,可以進(jìn)行最佳的角度配置搜索。根據(jù)多個(gè)實(shí)施方案,可以實(shí)施角度配置空間的窮舉搜索,其中多個(gè)樣品的數(shù)據(jù)點(diǎn)的數(shù)據(jù)集可以擬合選自角度配置數(shù)據(jù)庫(kù)的最佳擬合角度配置。原則上,關(guān)于經(jīng)歷二倍體基因組的基因分型分析的K樣品,存在3K種可能的基因型定位,其通常可能為太多種可能而不能有效地搜索每種可能。根據(jù)本教導(dǎo)的系統(tǒng)和方法,可以生成角度配置數(shù)據(jù)庫(kù),從其中可以實(shí)施搜索,使數(shù)據(jù)在數(shù)據(jù)集中擬合為最佳的角度配置。在多個(gè)實(shí)施方案中,基因分型的數(shù)據(jù)集可以被選擇為用于生成角度配置數(shù)據(jù)庫(kù)的訓(xùn)練集。根據(jù)多個(gè)實(shí)施方案,角度配置數(shù)據(jù)庫(kù)可以包括特殊的角度配置出現(xiàn)的概率,其與數(shù)據(jù)庫(kù)中的各角度配置相關(guān)。關(guān)于根據(jù)本教導(dǎo)的系統(tǒng)和方法的多個(gè)實(shí)施方案,特殊的角度配置發(fā)生的概率可以評(píng)估為訓(xùn)練集中特殊角度配置出現(xiàn)頻率的函數(shù)。例如,角度配置發(fā)生的概率可以通過(guò)評(píng)價(jià)訓(xùn)練集中所述角度配置出現(xiàn)的次數(shù)除以訓(xùn)練集中角度配置的總數(shù)來(lái)估算。這種基因分型數(shù)據(jù)的數(shù)據(jù)集可以選擇為具有表示基因分型數(shù)據(jù)的屬性,使用通過(guò)角度配置用于基因分型的系統(tǒng)和方法的多個(gè)實(shí)施方案可以分析所述基因分型數(shù)據(jù)。用作用于生成角度配置數(shù)據(jù)庫(kù)的訓(xùn)練集的數(shù)據(jù)集可以具有從影響這種數(shù)據(jù)集的變量中得到的屬性,所述變量包括,但不限于,分析的樣品類(lèi)型(即,某種細(xì)胞、組織或生物流體型)、樣品制備方法、測(cè)定條件(即,探針、報(bào)告基因、試劑和基體)和儀器(即,探測(cè)器、熱塊組件和樣品塊)。因此,可以選擇用于生成角度配置數(shù)據(jù)庫(kù)的訓(xùn)練集以特別地反映被分析的數(shù)據(jù)的類(lèi)型。在多個(gè)實(shí)施方案中,用戶(hù)可以定義角度配置空間。例如,本教導(dǎo)的多個(gè)實(shí)施方案可以使用超過(guò)100,000個(gè)基因分型測(cè)定的數(shù)據(jù)集,基于進(jìn)行基因分型分析的屬性選擇所述基因分型測(cè)定以作為生成角度配置數(shù)據(jù)庫(kù)的基礎(chǔ),從其中可以實(shí)施搜索,使數(shù)據(jù)在數(shù)據(jù)集中擬合得到最佳的角度配置。這種訓(xùn)練集可以用于定義角度空間,由其可以生成角度配置數(shù)據(jù)庫(kù)。關(guān)于本教導(dǎo)的系統(tǒng)和方法的多個(gè)實(shí)施方案,可以定義角度配置空間從而提供窮舉搜索以確保相關(guān)的置信可以發(fā)現(xiàn)樣品與角度配置的整體擬合。例如,代替搜索3Κ種可能的基因型定位,使用在多個(gè)實(shí)施方案中的選擇的超過(guò)100,000次基因分型測(cè)定的訓(xùn)練集,根據(jù)本教導(dǎo)的系統(tǒng)和方法的多個(gè)實(shí)施方案的角度配置空間定義如下Ci1可以在-47.5°M92.5°之間變化。α2可以在-47.5°M137.5°之間變化。α3可以在-2.5°至137.5°之間變化。各角度的角度空間為5°。角度以如下次序增加:α丄<α2<α3。使用從具有目標(biāo)屬性的基因分型數(shù)據(jù)訓(xùn)練集中得到的上述邊界條件,可以生成總數(shù)為3797個(gè)獨(dú)特的角度配置的角度配置數(shù)據(jù)庫(kù)。此外,關(guān)于本教導(dǎo)的系統(tǒng)和方法的多個(gè)實(shí)施方案,在數(shù)據(jù)庫(kù)中的各獨(dú)特的角度配置可以與可以出現(xiàn)的角度配置的概率相關(guān)。例如,但不限于,在圖1的步驟30中使用的數(shù)據(jù)庫(kù)的多個(gè)實(shí)施方案可以根據(jù)通過(guò)選擇訓(xùn)練數(shù)據(jù)集怎樣定義角度配置空間而變化。因此,根據(jù)選擇的訓(xùn)練集,在數(shù)據(jù)庫(kù)中的角度配置的數(shù)量可以大于或小于3797。例如,訓(xùn)練集的選擇可以影響可以怎樣定義角度的范圍以形成比在上述實(shí)例中的3797個(gè)獨(dú)特角度配置多或少的可能的角度配置。訓(xùn)練集的選擇可以將角度空間改變?yōu)榇笥诨蛐∮?°,其還可以影響角度配置數(shù)據(jù)庫(kù)的多個(gè)實(shí)施方案的角度配置的數(shù)量。此外,訓(xùn)練集的選擇可以影響在角度配置數(shù)據(jù)庫(kù)的多個(gè)實(shí)施方案中出現(xiàn)的任一角度配置的概率的計(jì)算。關(guān)于訓(xùn)練集的選擇,較合意的是限定數(shù)據(jù)集具有從影響這種數(shù)據(jù)集的變量中得到的有限組的屬性從而提高用于這些特征的算法的準(zhǔn)確性。例如,合意的是從單一的測(cè)定型中選擇數(shù)據(jù)集以確保所述算法為用于該測(cè)定的最佳的算法。關(guān)于根據(jù)本教導(dǎo)的系統(tǒng)和方法的多個(gè)實(shí)施方案,從訓(xùn)練集中依靠經(jīng)驗(yàn)生成的角度配置的獨(dú)特集可以被存儲(chǔ)到數(shù)據(jù)庫(kù)中??梢栽O(shè)計(jì)這種數(shù)據(jù)庫(kù)以保持靜態(tài)(即,不變)以用于根據(jù)本教導(dǎo)的系統(tǒng)和方法,或者可以設(shè)計(jì)為動(dòng)態(tài)變化并持續(xù)更新。根據(jù)多個(gè)實(shí)施方案,數(shù)據(jù)庫(kù)可以由最終用戶(hù)直接更新,或通過(guò)自動(dòng)過(guò)程更新。在多個(gè)實(shí)施方案中,可以將新角度配置可以加入到數(shù)據(jù)庫(kù)中作為用最新數(shù)據(jù)更新的數(shù)據(jù)集。例如,角度配置數(shù)據(jù)庫(kù)可以隨著用特殊的測(cè)定運(yùn)行更多的樣品并加入到訓(xùn)練集中而更新。在此方面,通過(guò)訓(xùn)練數(shù)據(jù)集的選擇,可以生成角度配置數(shù)據(jù)庫(kù)的多個(gè)實(shí)施方案,并且可以獨(dú)特地形成用于評(píng)估目標(biāo)測(cè)定和數(shù)據(jù)集。在圖7A-7C中,通過(guò)圖表示出了根據(jù)角度配置數(shù)據(jù)庫(kù)的多個(gè)實(shí)施方案的3個(gè)可能的角度配置,以幫助理解如圖1的步驟30所示的進(jìn)行最佳角度配置搜索的多個(gè)實(shí)施方案。如在各圖的旁邊所示,示出的各示例性角度配置的三個(gè)角度和角度空間與如在上述實(shí)例中給出的多個(gè)實(shí)施方案的角度配置數(shù)據(jù)庫(kù)一致。盡管角度以度的形式列出,如本領(lǐng)域的技術(shù)人員所了解,可以使用任何形式的角度表達(dá),例如弧度或極坐標(biāo)。在圖7A-7C中,三個(gè)離散角度的各示例性的角度以度的形式列出,具有的角度空間為5°,從而各角度配置覆蓋了定義的角度配置空間的獨(dú)特部分。圖8A和SB,以及圖9A和9B描述了本教導(dǎo)的用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)的多個(gè)實(shí)施方案,如在圖1中的步驟10-30所示。在圖8A中,示出了用于基因分型測(cè)定的多個(gè)生物樣品的數(shù)據(jù)點(diǎn)的數(shù)據(jù)集,如在圖8A中的群集1、ii和iii所顯示。此外,群集iv示于圖8A中,該群集可用于確定定義的原點(diǎn)。如之前所討論,這種群集可以為來(lái)自樣品的無(wú)模板對(duì)照(NTC)集中的數(shù)據(jù)點(diǎn)的數(shù)據(jù)集。在本教導(dǎo)的多個(gè)實(shí)施方案中,可以確定各樣品數(shù)據(jù)點(diǎn)的角度,其中各角度的頂點(diǎn)IV,例如,但不限于,如圖8B和8C和圖9B和9C所示,為定義的原點(diǎn)。在重復(fù)的步驟中,按照與數(shù)據(jù)庫(kù)中的角度配置的擬合可以評(píng)估各樣品,例如在圖8B中通過(guò)圖表顯示了角度配置。如在圖8C中所示,圖8B的角度配置的中心線1、II和III似乎為與所述數(shù)據(jù)的合理擬合。相反,與圖9A-9C相比,來(lái)自數(shù)據(jù)庫(kù)的角度配置(如在圖9B所示)沒(méi)有與圖9A中的數(shù)據(jù)良好地?cái)M合,如從圖9C可以明顯地顯示。如在下面將更加詳細(xì)地討論,關(guān)于本教導(dǎo)的各實(shí)施方案的方法和系統(tǒng),可以計(jì)算擬合度值,其包括所有的數(shù)據(jù)點(diǎn)與數(shù)據(jù)庫(kù)中的角度配置的擬合之和的一項(xiàng),并且可以用于評(píng)價(jià)所述數(shù)據(jù)與數(shù)據(jù)庫(kù)中的角度配置的擬合。圖1中的方法100的多個(gè)實(shí)施方案的圖表描述示于圖10A-10C和圖11A-11C中。在各圖中,列出了擬合度值,其中,擬合度值定義如下權(quán)利要求1.用指令編碼的、通過(guò)處理器執(zhí)行的、用于測(cè)定生物樣品中的基因位點(diǎn)的基因型的計(jì)算機(jī)可讀介質(zhì),所述指令包括用于實(shí)施如下步驟的指令接收基因分型測(cè)定的數(shù)據(jù)集,其中,所述數(shù)據(jù)集包括多個(gè)生物樣品中各樣品的數(shù)據(jù)占.確定所述數(shù)據(jù)集中各數(shù)據(jù)點(diǎn)的角度,其中,所述各角度的頂點(diǎn)包括定義的原點(diǎn);進(jìn)行數(shù)據(jù)集的最佳角度配置搜索;所述最佳角度配置搜索包括將數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)確定的角度與數(shù)據(jù)庫(kù)中的多個(gè)角度配置中的角度配置最佳擬合;和基于所述數(shù)據(jù)集與最佳擬合的角度配置的擬合指定多個(gè)生物樣品中各樣品的最終基因型類(lèi)別,其中,所述最佳擬合角度配置的各角度與定義基因型類(lèi)別的有限的等位基因組合離散地相關(guān)。2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,包括多個(gè)角度的最佳擬合的最佳角度配置搜索被表達(dá)為擬合度值的項(xiàng),所述擬合度值用于評(píng)估數(shù)據(jù)集的最佳擬合。3.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)可讀介質(zhì),其中,用于評(píng)估所述數(shù)據(jù)集的最佳擬合的擬合度值進(jìn)一步包括在角度配置數(shù)據(jù)庫(kù)中各角度配置出現(xiàn)的指定概率的項(xiàng)。4.根據(jù)權(quán)利要求3所述的計(jì)算機(jī)可讀介質(zhì),其中,所述項(xiàng)使用指定概率的對(duì)數(shù)表達(dá)。5.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)可讀介質(zhì),其中,用于評(píng)估數(shù)據(jù)集的最佳擬合的擬合度值進(jìn)一步包括哈定-溫伯等位基因頻率的項(xiàng)。6.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,確認(rèn)的基線為包含定義的原點(diǎn)的線。7.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,所述原點(diǎn)是由無(wú)模板對(duì)照樣品定義的。8.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,在所述數(shù)據(jù)庫(kù)中的各角度配置包括3個(gè)角度。9.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,對(duì)于二倍體有機(jī)體,所述可限定數(shù)目的等位基因組合為3個(gè)。10.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其中,所述角度配置數(shù)據(jù)庫(kù)為從基因分型的數(shù)據(jù)庫(kù)中經(jīng)驗(yàn)得到的。11.根據(jù)權(quán)利要求10所述的計(jì)算機(jī)可讀介質(zhì),其中,所述基因分型數(shù)據(jù)的數(shù)據(jù)庫(kù)是基于關(guān)于基因分型數(shù)據(jù)怎樣產(chǎn)生的內(nèi)在屬性選擇的。12.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其進(jìn)一步包括預(yù)處理所述數(shù)據(jù)的步驟。13.根據(jù)權(quán)利要求12所述的計(jì)算機(jī)可讀介質(zhì),其中,所述預(yù)處理數(shù)據(jù)包括確認(rèn)異常值。14.根據(jù)權(quán)利要求12所述的計(jì)算機(jī)可讀介質(zhì),其中,所述預(yù)處理數(shù)據(jù)包括確認(rèn)陰性樣品對(duì)照。15.根據(jù)權(quán)利要求12所述的計(jì)算機(jī)可讀介質(zhì),其中,所述預(yù)處理數(shù)據(jù)包括確認(rèn)未擴(kuò)增樣品。16.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)可讀介質(zhì),其進(jìn)一步包括指定各樣品的最終基因型類(lèi)別的質(zhì)量評(píng)分的步驟。17.用于確定生物樣品中的基因位點(diǎn)的基因型的計(jì)算機(jī)實(shí)施方法,所述方法包括接收基因分型測(cè)定的數(shù)據(jù)集,其中,所述數(shù)據(jù)集包括多個(gè)生物樣品中各樣品的數(shù)據(jù)占.處理計(jì)算機(jī)中的數(shù)據(jù)集以確定生物樣品中的各樣品的基因型,所述處理包括確定數(shù)據(jù)集中各數(shù)據(jù)點(diǎn)的角度,其中,所述各角度的頂點(diǎn)包含定義的原點(diǎn);進(jìn)行數(shù)據(jù)集的最佳角度配置搜索;所述最佳角度配置搜索包括將所述數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)確定的角度與數(shù)據(jù)庫(kù)中的多個(gè)角度配置中的角度配置最佳擬合;和基于所述數(shù)據(jù)集與所述最佳擬合的角度配置的擬合指定多個(gè)生物樣品中各樣品的最終基因型類(lèi)別,其中,所述最佳擬合角度配置的各角度與定義基因型類(lèi)別的有限的等位基因組合離散地相關(guān)。18.根據(jù)權(quán)利要求17所述的方法,其進(jìn)一步包括預(yù)處理所述數(shù)據(jù)的步驟。19.根據(jù)權(quán)利要求17所述的方法,其進(jìn)一步包括指定各樣品的最終基因型類(lèi)別的質(zhì)量評(píng)分的步驟。20.根據(jù)權(quán)利要求17所述的方法,其中,包括多個(gè)角度的最佳擬合的所述最佳角度配置搜索被表達(dá)為擬合度值的項(xiàng),所述擬合度值用于評(píng)估數(shù)據(jù)集的最佳擬合。21.根據(jù)權(quán)利要求20所述的方法,其中,用于評(píng)估所述數(shù)據(jù)集的最佳擬合的擬合度值進(jìn)一步包括在角度配置數(shù)據(jù)庫(kù)中的各角度配置出現(xiàn)指定概率的項(xiàng)。22.根據(jù)權(quán)利要求20所述的方法,其中,用于評(píng)估數(shù)據(jù)集的最佳擬合的擬合度值進(jìn)一步包括哈定-溫伯等位基因頻率的項(xiàng)。23.系統(tǒng),其包括處理器;和與所述處理器通信的內(nèi)存;所述存儲(chǔ)器存儲(chǔ)用于如下步驟的指令通過(guò)處理器接收基因分型測(cè)定的數(shù)據(jù)集,其中,所述數(shù)據(jù)集包括多個(gè)生物樣品中各樣品的數(shù)據(jù)點(diǎn);確定所述數(shù)據(jù)集中各數(shù)據(jù)點(diǎn)的角度,其中,所述各角度的頂點(diǎn)包括定義的原點(diǎn);進(jìn)行數(shù)據(jù)集的最佳角度配置搜索;所述最佳角度配置搜索包括將所述數(shù)據(jù)集中的各數(shù)據(jù)點(diǎn)確定的角度與數(shù)據(jù)庫(kù)中的多個(gè)角度配置中的角度配置最佳擬合;和基于所述數(shù)據(jù)集與最佳擬合的角度配置的擬合指定多個(gè)生物樣品中各樣品的最終基因型類(lèi)別,其中,所述最佳擬合角度配置的各角度與定義基因型類(lèi)別的有限的可能的等位基因組合離散地相關(guān)。24.計(jì)算機(jī)系統(tǒng),其包括數(shù)據(jù)庫(kù),其具有包含信息的記錄,所述信息確認(rèn)基因分型測(cè)定的信號(hào)數(shù)據(jù)的多個(gè)角度配置,其中,產(chǎn)生所述角度配置以覆蓋定義的角度配置空間;和允許用戶(hù)選擇性地訪問(wèn)在所述記錄中包含的信息的用戶(hù)界面。25.根據(jù)權(quán)利要求24所述的計(jì)算機(jī)系統(tǒng),其中,所述數(shù)據(jù)庫(kù)進(jìn)一步包括記錄,所述記錄包含確認(rèn)各角度配置記錄的可能出現(xiàn)的角度配置概率的信息。全文摘要本發(fā)明提供了用于分析基因分型數(shù)據(jù)的方法和系統(tǒng)。根據(jù)方法和系統(tǒng)的多個(gè)實(shí)施方案,可以進(jìn)行角度配置搜索。在多個(gè)實(shí)施方案中,可以進(jìn)行整個(gè)角度配置空間內(nèi)的窮舉搜索以向多個(gè)角度提供擬合,所述角度是由從多個(gè)生物樣品產(chǎn)生的數(shù)據(jù)集中的多個(gè)點(diǎn)確定的。關(guān)于多個(gè)實(shí)施方案,可以定義角度配置空間以確??梢源_定整體擬合。根據(jù)多種方法和系統(tǒng),可以搜索可能的角度配置數(shù)據(jù)庫(kù),其中,各角度配置可以包括3個(gè)角度。根據(jù)多種方法和系統(tǒng),可能的角度配置數(shù)據(jù)庫(kù)可以包括對(duì)于各角度配置的可能出現(xiàn)的角度配置概率。文檔編號(hào)G06F19/10GK103038773SQ201180025506公開(kāi)日2013年4月10日申請(qǐng)日期2011年4月8日優(yōu)先權(quán)日2010年4月8日發(fā)明者馬克新·??死暾?qǐng)人:生命技術(shù)公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1