專利名稱:用于復(fù)雜網(wǎng)絡(luò)中的全系統(tǒng)動力學(xué)的量化的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及診斷疾病。更具體地,本發(fā)明涉及分析生物樣本以獲得基因表達(dá)值從而確定生物樣本的健康程度。
背景技術(shù):
交互組件的大復(fù)雜網(wǎng)絡(luò)難以作為整體動態(tài)系統(tǒng)來描述。在遺傳學(xué)研究中,檢查大量基因或基因網(wǎng)絡(luò)的科學(xué)家通常致力于標(biāo)識似乎對特定結(jié)果或病變很重要的一個(gè)基因或一組基因。所需要的是用于大規(guī)模地分析基因和基因網(wǎng)絡(luò)之間的互連以輸出患者的健康程度的報(bào)告的低成本且有效率的設(shè)備、方法和系統(tǒng)。
發(fā)明內(nèi)容
為了解決本領(lǐng)域的需要,根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供一種診斷疾病的方法,包括基因表達(dá)讀取器分析至少一個(gè)生物樣本并基于分析生物樣本輸出來自至少兩個(gè)基因的基因表達(dá)值,利用適當(dāng)編程的計(jì)算機(jī)計(jì)算生物樣本的比例因數(shù)a,其中該比例因數(shù)a是通過以下步驟從基因表達(dá)值中計(jì)算出的以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù);計(jì)算所述鏈數(shù)Cn的平均數(shù)C·;計(jì)算Cn的最大數(shù)M,其中M包括所有的基因表達(dá)值組對于給定的所述閾值C的鏈數(shù)Cn的數(shù)量中的最大值;對于不同的所述閾值C,重復(fù)地施加關(guān)系式Cave=M/log(M) JfCave值數(shù)據(jù)相對于M/log(M)進(jìn)行比較;以及計(jì)算對所比較的數(shù)據(jù)的擬合以輸出比例因數(shù)a,其中比例因數(shù)a是所述擬合的斜率。該方法還包括利用適當(dāng)編程的計(jì)算機(jī)將生物樣本的比例因數(shù)a的值與數(shù)據(jù)庫中來自經(jīng)分析的生物樣本的其它比例因數(shù)a’進(jìn)行比較;以及利用適當(dāng)編程的計(jì)算機(jī)輸出報(bào)告,其中該報(bào)告包括至少一個(gè)生物樣本的健康程度的評估。根據(jù)本方法實(shí)施例的一個(gè)方面,至少一個(gè)生物樣本可包括唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)或有機(jī)物質(zhì)。在本方法實(shí)施例的另一個(gè)方面中,基因表達(dá)讀取器包括至少兩個(gè)基因探針。在本方法實(shí)施例的又一個(gè)方面中,鏈數(shù)Cn的數(shù)量包括N個(gè)表達(dá)值組中的每組的鏈數(shù)的數(shù)量,其中每個(gè)所述表達(dá)值組包括在表達(dá)值組和其它N-I個(gè)基因表達(dá)值組的基因表達(dá)值序列η1; n2, . . . ητ之間的以閾值C的基因表達(dá)值序列η” η2,…ητ。根據(jù)本方法實(shí)施例的另一個(gè)方面,比例因數(shù)a通過以下步驟計(jì)算利用適當(dāng)編程的計(jì)算機(jī)對于不同的閾值C重復(fù)地施加Cave=M/log(M),以及將Cave值相對于M/log (M)進(jìn)行比較,并計(jì)算該比較的線性擬合以獲得比例因數(shù)a。在本方法實(shí)施例的又一個(gè)方面,比較a的值還包括比較比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫進(jìn)行比較。根據(jù)本方法實(shí)施例的另一個(gè)方面,閾值C在O至I之間的范圍中。
在本發(fā)明的另一個(gè)實(shí)施例中,提供一種診斷疾病的系統(tǒng),包括基因表達(dá)讀取器,用于分析至少一個(gè)生物樣本并輸出至少兩個(gè)基因的基因表達(dá)值;計(jì)算機(jī)服務(wù)器,用于從基因表達(dá)讀取器接收基因表達(dá)值并管理和向用戶傳達(dá)患者信息;以及主存在計(jì)算機(jī)服務(wù)器上的計(jì)算機(jī)程序,其中計(jì)算機(jī)程序分析基因表達(dá)值并輸出報(bào)告,其中該報(bào)告包括至少一個(gè)生物樣本的健康程度的評估,其中評估包括將至少一個(gè)生物樣本的比例因數(shù)a與數(shù)據(jù)庫中來自先前分析的生物樣本的其它比例因數(shù)a’進(jìn)行比較,其中比例因數(shù)a是利用所述計(jì)算機(jī)程序通過以下步驟從所述基因表達(dá)值計(jì)算出的以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù);計(jì)算鏈數(shù)Cn的平均數(shù)C_ ;計(jì)算Cn的最大數(shù)M,其中M包括所有的基因表達(dá)值組對于給定的閾值C的鏈數(shù)Cn的數(shù) 量中的最大值;對于不同的閾值C,重復(fù)地施加關(guān)系式Cave=M/log(M);將Cave值數(shù)據(jù)相對于M/log(M)數(shù)據(jù)進(jìn)行比較;以及對所比較的數(shù)據(jù)的施加擬合以輸出比例因數(shù)a,其中比例因數(shù)a是擬合的斜率。在本系統(tǒng)實(shí)施例的一個(gè)方面,至少一個(gè)生物樣本可包括唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)或有機(jī)物質(zhì)。在本系統(tǒng)實(shí)施例的另一個(gè)方面中,基因表達(dá)讀取器包括至少兩個(gè)基因探針。在本系統(tǒng)實(shí)施例的又一個(gè)方面中,鏈數(shù)Cn的數(shù)量包括N個(gè)表達(dá)值組中的每組的鏈數(shù)的數(shù)量,其中每個(gè)所述表達(dá)值組包括在表達(dá)值組和其它N-I個(gè)基因表達(dá)值組的基因表達(dá)值序列η1; n2, . . . ητ之間的以閾值C的基因表達(dá)值序列η” η2,…ητ。根據(jù)本系統(tǒng)實(shí)施例的另一個(gè)方面,比例因數(shù)a通過以下步驟計(jì)算利用適當(dāng)編程的計(jì)算機(jī)對于不同的閾值C重復(fù)地施加Cave=M/log(M),以及將Cave值相對于M/log (M)進(jìn)行比較,并計(jì)算該比較的線性擬合以獲得比例因數(shù)a。在本系統(tǒng)實(shí)施例的又一個(gè)方面,比較a的值還包括比較比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫進(jìn)行比較。在本系統(tǒng)實(shí)施例的又一個(gè)方面,閾值C在O和I之間的范圍中。在另一個(gè)實(shí)施例中,本發(fā)明包括一種芯片上的實(shí)驗(yàn)室裝置,包括用于保持生物樣本容器、基因表達(dá)讀取器和微處理器的襯底,其中生物樣本容器包括對所述基因表達(dá)讀取器的樣本輸入,其中基因表達(dá)讀取器基于分析至少一個(gè)生物樣本來輸出至少兩個(gè)基因的基因表達(dá)值,其中微處理器包括用于分析至少一個(gè)生物學(xué)樣本中的基因表達(dá)的計(jì)算機(jī)程序,其中計(jì)算機(jī)程序編譯所述基因表達(dá)值;以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù);計(jì)算所述鏈數(shù)Cn的平均數(shù)C·;計(jì)算Cn的最大數(shù)M,其中M包括所有的基因表達(dá)值組對于給定的所述閾值C的鏈數(shù)Cn的數(shù)量中的最大值;對于不同的閾值C,重復(fù)地施加關(guān)系式Cave=M/log(M) JfCave值數(shù)據(jù)相對于M/log(M)進(jìn)行比較;以及計(jì)算對所比較的數(shù)據(jù)的擬合以輸出比例因數(shù)a,其中比例因數(shù)a是擬合的斜率;將至少一個(gè)生物樣本的比例因數(shù)a的值與其它存儲的來自經(jīng)分析的生物樣本的比例因數(shù)a’進(jìn)行比較;以及輸出報(bào)告,其中報(bào)告包括至少一個(gè)生物樣本的健康程度的評估。根據(jù)本裝置實(shí)施例的一個(gè)方面,至少一個(gè)生物樣本可包括唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)或有機(jī)物質(zhì)。在本裝置實(shí)施例的另一個(gè)方面中,基因表達(dá)讀取器包括至少兩個(gè)基因探針。在本裝置實(shí)施例的又一個(gè)方面中,鏈數(shù)Cn的數(shù)量包括N個(gè)表達(dá)值組中的每組的鏈數(shù)的數(shù)量,其中每個(gè)所述表達(dá)值組包括在表達(dá)值組和其它N-I個(gè)基因表達(dá)值組的基因表達(dá)值序列叫,n2, . . . ητ之間的以閾值C的基因表達(dá)值序列Ii1, n2, . . . ητ。根據(jù)本裝置實(shí)施例的一個(gè)方面,比例因數(shù)a通過以下步驟計(jì)算利用適當(dāng)編程的計(jì)算機(jī)對于不同的閾值C重復(fù)地施加Cave=M/log(M),以及將Cave值相對于M/log (M)進(jìn)行比較,并計(jì)算該比較的線性擬合以獲得比例因數(shù)a。在本裝置實(shí)施例的又一個(gè)方面,比較a的值還包括比較比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫·進(jìn)行比較。在本裝置實(shí)施例的又一個(gè)方面,閾值C在O和I之間的范圍中。
圖I示出本發(fā)明的一個(gè)實(shí)施例的方法的流程圖。圖2示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的由計(jì)算機(jī)程序用于計(jì)算比例因數(shù)所使用的進(jìn)程的圖形圖像。圖3示出本發(fā)明的一個(gè)實(shí)施例的系統(tǒng)的流程圖。圖4示出本發(fā)明的一個(gè)實(shí)施例的裝置的示意圖。
具體實(shí)施例方式為了解決本領(lǐng)域的需要,根據(jù)本發(fā)明的一個(gè)實(shí)施例提供一種診斷疾病的方法。圖I示出本發(fā)明的一個(gè)實(shí)施例的方法100的流程圖,包括基因表達(dá)讀取器101分析至少一個(gè)生物樣本并基于所述分析至少一個(gè)生物樣本輸出來自至少兩個(gè)基因的基因表達(dá)值102,并且利用適當(dāng)編程的計(jì)算機(jī)103計(jì)算該生物樣本的比例因數(shù)a,其中所述比例因數(shù)a是通過以下步驟從基因表達(dá)值中計(jì)算出的以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù)104 ;計(jì)算所述鏈數(shù)Cn的平均數(shù)Cave106 ;計(jì)算Cn的最大數(shù)M 108,其中M包括所有的基因表達(dá)值組對于給定的所述閾值C的鏈數(shù)Cn的數(shù)量中的最大值;對于不同的所述閾值C,重復(fù)地施加關(guān)系式Cave=M/log(M) 110 ;將所述Cave數(shù)據(jù)值相對于M/log (M)的進(jìn)行比較112 ;以及計(jì)算對所比較的數(shù)據(jù)的擬合以輸出比例因數(shù)a,其中比例因數(shù)a是擬合的斜率,并且利用適當(dāng)編程的計(jì)算機(jī)將至少一個(gè)生物樣本的比例因數(shù)a的值與數(shù)據(jù)庫中來自經(jīng)分析的生物樣本的其它比例因數(shù)a’進(jìn)行比較114 ;以及利用適當(dāng)編程的計(jì)算機(jī)輸出報(bào)告116,其中該報(bào)告包括至少一個(gè)生物樣本的健康程度的評估。在本發(fā)明的一個(gè)方面中,基因表達(dá)讀取器包括至少兩個(gè)基因探針。根據(jù)方法100的一個(gè)實(shí)施例,本發(fā)明利用N個(gè)表達(dá)值組的例如來自微陣列或基因芯片的基因表達(dá)值,該N個(gè)表達(dá)值組可包括例如給定組織的基因組中的大量(如果不是全部的話)基因。在一個(gè)實(shí)施例中,N不需要包含微陣列數(shù)據(jù)的所有可用表達(dá)值組,而是僅需要包含該微陣列數(shù)據(jù)的大子集。在方法100的一個(gè)實(shí)施例中,可按多個(gè)時(shí)間間隔T從微陣列讀取基因表達(dá)值ητ。用于量化的數(shù)據(jù)集將包括以下形式的N組基因表達(dá)值ητ ην η2,· . · · ητ其中η是以T間隔獲取的N個(gè)基因之一的基因表達(dá)值。對于基因表達(dá)值組Ni中的基因表達(dá)值η」的序列,對基因表達(dá)值組Ni和每個(gè)其它基因表達(dá)值組(其它N-I組)之間的相關(guān)性取絕對值。其相關(guān)性高于閾值C的其它基因表達(dá)值組的總數(shù)被稱為Cn,且表示將該基因表達(dá)值組連接到數(shù)據(jù)集中具有C或更大值的所有其它基因表達(dá)值組的鏈的數(shù)量。然后對于所有的N個(gè)基因表達(dá)值組,對于給定C,取得Cn的最大值,且稱為M。對于給定的C,取得所有的Cn的平均值且稱為Cavg。根據(jù)本發(fā)明的一個(gè)實(shí)施例,對于不同的C值,M和Cavg的值形成以下關(guān)系式Cavg= (M/log (M) )a為了得出比例因數(shù)a的值,通過以下步驟重復(fù)以上方法對于不同的閾值C施加關(guān)系式Cave=M/log(M),將所述Cave數(shù)據(jù)值相對于M/log (M)數(shù)據(jù)進(jìn)行比較;以及施加對所比較的數(shù)據(jù)的擬合以輸出比例因數(shù)a,其中比例因數(shù)a是擬合的斜率。根據(jù)本實(shí)施例,閾值C在O至I之間的范圍中。在方法100的一個(gè)實(shí)施例中,圖2所示的是示例性圖形比例因數(shù)表示200,其中截止值C的值的數(shù)量是十九,C是相關(guān)性的絕對值,例如皮爾森相關(guān)性(Pearsoncorrelation),且C的范圍是以每個(gè)點(diǎn).05的遞減值從.95至.05。然后測量擬合到該數(shù)據(jù)的對數(shù)-對數(shù)曲線的線的斜率。在這種情況下,示出a為 I. 74。在圖2中,所測量的相關(guān)性值在對酵母(釀酒酵母S. cerevisiae)中的3360個(gè)基因(N=3360)以7分鐘間隔取得的六個(gè)基因表達(dá)值(T=6)的時(shí)間序列之間。盡管在該示例中使用3360個(gè)基因,然而在其它示例中使用基因可以是任意數(shù)量,但一般為數(shù)千。在一個(gè)實(shí)施例中,可將該方法施加到在單個(gè) 時(shí)間上測量的基因表達(dá)值的多個(gè)組,而不是不同時(shí)間上的各基因表達(dá)值。換言之,相關(guān)性值在由單個(gè)時(shí)間處取得的來自T個(gè)基因的基因表達(dá)值構(gòu)成的N個(gè)組之間。在該實(shí)施例的一個(gè)示例中,假設(shè)單個(gè)時(shí)間處5個(gè)不同基因的基因表達(dá)值標(biāo)記為1-5,可形成三個(gè)基因表達(dá)值組(Ν=3 ),每個(gè)組包含三個(gè)基因表達(dá)值(Τ=3 )。例如,基因表達(dá)值來自基因1-3、2-4、3-5。本發(fā)明計(jì)算每個(gè)組與其它兩個(gè)(N-l=2)之間的皮爾森相關(guān)性的絕對值。假設(shè)所計(jì)算的相關(guān)性值中的4個(gè)>.95。則對于C=. 95和Ν=3的C_=4/3=l. 33。此夕卜,假設(shè)對于任何單個(gè)基因表達(dá)值組的絕對值皮爾森相關(guān)性值>.95的最大數(shù)量是2。則對于C=. 95的M將為2。單個(gè)時(shí)間組和時(shí)間序列(多個(gè)時(shí)間組)方法的本質(zhì)在于,在每種情況下,在一個(gè)組和所有其它組之間取得相關(guān)性值。然后計(jì)算多少相關(guān)性值大于閾值C。任意單個(gè)組的最大數(shù)量是M。所有組的總數(shù)除以組數(shù)(N)得到C·。盡管根據(jù)本發(fā)明的一個(gè)方面有兩種不同的方式計(jì)算比例因數(shù)a,該比例因數(shù)a可能是不同的值,但唯一的要求是用于生成a的任一方法在生物樣本之間比較a的值時(shí)必須一致。根據(jù)方法100的一個(gè)方面,至少一個(gè)生物樣本可包括唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)或其它有機(jī)物質(zhì)。在方法100的另一個(gè)方面,比較a的值還包括比較比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫進(jìn)行比較。在本發(fā)明的另一個(gè)實(shí)施例中,圖3示出一種用于診斷疾病300的系統(tǒng),包括用戶302,其具有生物樣本304以輸入到基因表達(dá)讀取器306,該基因表達(dá)讀取器306用于分析至少一個(gè)生物樣本304并輸出310至少兩個(gè)基因的基因表達(dá)值,并且例如利用因特網(wǎng)將該基因表達(dá)值傳達(dá)310到計(jì)算機(jī)服務(wù)器312,該計(jì)算機(jī)服務(wù)器312用于從基因表達(dá)讀取器306接收所述基因表達(dá)值并管理和傳達(dá)患者信息,其中該患者信息然后被提供給用戶302。計(jì)算機(jī)程序314主存在所述計(jì)算機(jī)服務(wù)器312上,并分析基因表達(dá)值以隨后輸出可在顯示器318上查看的報(bào)告316,該報(bào)告316包括至少一個(gè)生物樣本的健康程度的評估。根據(jù)本實(shí)施例,評估包括將至少一個(gè)生物樣本的比例因數(shù)a與數(shù)據(jù)庫中來自先前分析的生物樣本的其 它比例因數(shù)a’進(jìn)行比較,其中比例因數(shù)a是利用計(jì)算機(jī)程序314通過以下步驟從基因表達(dá)值計(jì)算出的以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù);計(jì)算鏈數(shù)Cn的平均數(shù)Cave ;計(jì)算Cn的最大數(shù)M,其中M包括所有的所述基因表達(dá)值組對于給定的所述閾值C的鏈數(shù)Cn的數(shù)量中的最大值;對于不同的閾值C,重復(fù)地施加關(guān)系式C_=M/log(M);將Cave數(shù)據(jù)值相對于M/log(M)的數(shù)據(jù)進(jìn)行比較;以及對所比較的數(shù)據(jù)的施加擬合以輸出比例因數(shù)a,其中比例因數(shù)a是擬合的斜率。根據(jù)系統(tǒng)300的一個(gè)實(shí)施例,至少一個(gè)生物樣本可包括唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)或有機(jī)物質(zhì)。在系統(tǒng)300的另一個(gè)方面中,基因表達(dá)讀取器包括至少兩個(gè)基因探針。在系統(tǒng)300的又一個(gè)方面中,鏈數(shù)Cn的數(shù)量包括N個(gè)表達(dá)值組中的每組的鏈數(shù)的數(shù)量,其中每個(gè)所述表達(dá)值組包括在表達(dá)值組和其它N-I個(gè)基因表達(dá)值組的基因表達(dá)值序列n” n2, . . . ητ之間的以閾值C的基因表達(dá)值序列η” η2,…ητ。根據(jù)系統(tǒng)300的另一個(gè)方面,比例因數(shù)a通過以下步驟計(jì)算利用適當(dāng)編程的計(jì)算機(jī)對于不同的閾值C重復(fù)地施加Cave=M/log(M),以及將Cave值相對于M/log(M)進(jìn)行比較,并計(jì)算該比較的線性擬合以獲得比例因數(shù)a。在系統(tǒng)300的又一個(gè)方面,比較a的值還包括比較比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫進(jìn)行比較。在系統(tǒng)300的又一個(gè)方面,閾值C在O和I之間的范圍中。圖4示出本發(fā)明的另一個(gè)實(shí)施例,包括芯片上的實(shí)驗(yàn)室裝置400,其具有用于保持生物樣本容器404、基因表達(dá)讀取器406和微處理器408的襯底402,其中生物樣本容器404包括對基因表達(dá)讀取器的樣本輸入410,其中基因表達(dá)讀取器基于分析至少一個(gè)生物樣本來輸出412至少兩個(gè)基因的基因表達(dá)值,其中微處理器408包括用于分析由用戶302輸入到樣本容器404中的生物學(xué)樣本304中的基因表達(dá)的計(jì)算機(jī)程序314。計(jì)算機(jī)程序314編譯基因表達(dá)值,以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù);計(jì)算所述鏈數(shù)Cn的平均數(shù)Cave ;計(jì)算Cn的最大數(shù)M,其中M包括所有的基因表達(dá)值組對于給定的所述閾值C的鏈數(shù)Cn的數(shù)量的最大值;對于不同的閾值C,重復(fù)地施加關(guān)系式C_=M/log(M);將Cave數(shù)據(jù)值相對于M/log(M)數(shù)據(jù)進(jìn)行比較;以及計(jì)算對所比較的數(shù)據(jù)的擬合以輸出比例因數(shù)a,其中比例因數(shù)a是擬合的斜率;將至少一個(gè)生物樣本的比例因數(shù)a的值與其它存儲的來自經(jīng)分析的生物樣本的比例因數(shù)a’進(jìn)行比較,以及輸出報(bào)告316,其中報(bào)告316包括至少一個(gè)生物樣本的健康程度的評估。該報(bào)告可被傳達(dá)到具有計(jì)算機(jī)軟件416和顯示器或打印機(jī)418的計(jì)算機(jī)414。此外,應(yīng)理解襯底402可以是任何適當(dāng)?shù)钠脚_、主機(jī)或外殼,且計(jì)算機(jī)414可與襯底402分離或與襯底402集成。根據(jù)裝置400的一個(gè)方面,至少一個(gè)生物樣本可包括唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)或有機(jī)物質(zhì)。在裝置400的另一個(gè)方面中,基因表達(dá)讀取器包括至少兩個(gè)基因探針。在裝置400的又一個(gè)方面中,鏈數(shù)Cn的數(shù)量包括N個(gè)表達(dá)值組中的每組的鏈數(shù)的·數(shù)量,其中每個(gè)所述表達(dá)值組包括在表達(dá)值組和其它N-I個(gè)基因表達(dá)值組的基因表達(dá)值序列Ii1, n2, . . . ητ之間的以閾值C的基因表達(dá)值序列Ii1, n2, . . . ητ。根據(jù)裝置400的另一個(gè)方面,比例因數(shù)a通過以下步驟計(jì)算利用適當(dāng)編程的計(jì)算機(jī)對于不同的閾值C重復(fù)地施加Cave=M/log(M),以及將Cave值相對于M/log(M)進(jìn)行比較,并計(jì)算該比較的線性擬合以獲得比例因數(shù)a。在裝置400的又一個(gè)方面,比較a的值還包括比較比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫進(jìn)行比較。在裝置400的又一個(gè)方面,閾值C在O和I之間的范圍中?,F(xiàn)已根據(jù)若干示例性實(shí)施例描述了本發(fā)明,這些實(shí)施例在所有方面都旨在是說明性的,而非限制性的。因此,在本發(fā)明在具體實(shí)施中可以有許多變化,這許多變化可以由本領(lǐng)域普通技術(shù)人員從這里所包含的描述中推導(dǎo)出。例如,以類似于基因網(wǎng)絡(luò)中的單個(gè)基因表達(dá)值的方式量化其它復(fù)雜互連網(wǎng)絡(luò),其中網(wǎng)絡(luò)中的單個(gè)網(wǎng)絡(luò)組件或節(jié)點(diǎn)可具有將其切換為“運(yùn)行”的程度。示例可包括表征蛋白質(zhì)-蛋白質(zhì)交互網(wǎng)絡(luò)中的每個(gè)單個(gè)蛋白質(zhì)與網(wǎng)絡(luò)中的其它蛋白質(zhì)形成化學(xué)鍵所需的總能量的數(shù),即其它生物化學(xué)網(wǎng)絡(luò),其中對于每個(gè)組件可類似地量化單個(gè)組件和其它組件之間的交互;反映去往/來自通信或計(jì)算機(jī)網(wǎng)絡(luò)中的每個(gè)單個(gè)節(jié)點(diǎn)的信息流的數(shù);以及反映穿過城市交通網(wǎng)絡(luò)中的各個(gè)交叉點(diǎn)或運(yùn)輸網(wǎng)絡(luò)中的各個(gè)中樞之間的交通流的數(shù)。所有這些變化均視為落在由下面的權(quán)利要求書及其法律等效方案定義的本發(fā)明的范圍和精神內(nèi)。
權(quán)利要求
1. 一種診斷疾病的方法,包括 a.基因表達(dá)讀取器分析至少一個(gè)生物樣本并基于所述分析所述至少一個(gè)生物樣本輸出來自至少兩個(gè)基因的基因表達(dá)值; b.利用適當(dāng)編程的計(jì)算機(jī)計(jì)算所述至少一個(gè)生物樣本的比例因數(shù)a,其中所述比例因數(shù)a是從所述基因表達(dá)值中計(jì)算出的,所述計(jì)算包括 1.以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值 C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù); 計(jì)算所述鏈數(shù)Cn的平均數(shù)C·; iii.計(jì)算所述Cn的最大數(shù)M,其中所述M包括所有的所述基因表達(dá)值組對于給定的所述閾值C的所述鏈數(shù)Cn的數(shù)量中的最大值; iv.對于不同的所述閾值C,重復(fù)地施加關(guān)系式CaTC=M/log(M); v.將所述Cave值數(shù)據(jù)相對于M/log(M)進(jìn)行比較;以及 vi.計(jì)算對所比較的數(shù)據(jù)的擬合以輸出所述比例因數(shù)a,其中所述比例因數(shù)a是所述擬合的斜率; c.利用所述適當(dāng)編程的計(jì)算機(jī)將所述至少一個(gè)生物樣本的所述比例因數(shù)a的值與數(shù)據(jù)庫中來自經(jīng)分析的生物樣本的其它比例因數(shù)a’進(jìn)行比較;以及 d.利用所述適當(dāng)編程的計(jì)算機(jī)輸出報(bào)告,其中所述報(bào)告包括所述至少一個(gè)生物樣本的健康程度的評估。
2.如權(quán)利要求I所述的方法,其特征在于,所述至少一個(gè)生物樣本選自下組唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)及其它有機(jī)物質(zhì)。
3.權(quán)利要求I所述的方法,其特征在于,所述基因表達(dá)讀取器包括至少兩個(gè)基因探針。
4.權(quán)利要求I所述的方法,其特征在于,所述鏈數(shù)Cn的數(shù)量包括N個(gè)表達(dá)值組中的每組的鏈數(shù)的數(shù)量,其中每個(gè)所述表達(dá)值組包括在所述表達(dá)值組和其它N-I個(gè)基因表達(dá)值組的基因表達(dá)值序列Ii1, n2, . . . ητ之間的以閾值C的基因表達(dá)值序列Ii1, n2, . . . ητ。
5.權(quán)利要求I所述的方法,其特征在于,所述比例因數(shù)a通過以下步驟計(jì)算利用所述適當(dāng)編程的計(jì)算機(jī)對于不同的所述閾值C重復(fù)地施加所述Cave=M/log(M),以及將Cave值相對于M/log(M)進(jìn)行比較,并計(jì)算所述比較的線性擬合以獲得所述比例因數(shù)a。
6.權(quán)利要求I所述的方法,其特征在于,所述比較所述a的值還包括比較所述比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫進(jìn)行比較。
7.權(quán)利要求I所述的方法,其特征在于,所述閾值C在O和I之間的范圍中。
8.一種用于診斷疾病的系統(tǒng),包括 a.基因表達(dá)讀取器,用于分析至少一個(gè)生物樣本并輸出至少兩個(gè)基因的基因表達(dá)值; b.計(jì)算機(jī)服務(wù)器,用于從基因表達(dá)讀取器接收所述基因表達(dá)值并管理和向用戶傳達(dá)患者信息;以及 c.主存在所述計(jì)算機(jī)服務(wù)器上的計(jì)算機(jī)程序,其中所述計(jì)算機(jī)程序分析所述基因表達(dá)值并輸出報(bào)告,其中所述報(bào)告包括所述至少一個(gè)生物樣本的健康程度的評估,其中所述評估包括將所述至少一個(gè)生物樣本的比例因數(shù)a與數(shù)據(jù)庫中來自先前分析的生物樣本的其它比例因數(shù)a’進(jìn)行比較,其中所述比例因數(shù)a是利用所述計(jì)算機(jī)程序從所述基因表達(dá)值計(jì)算出的,所述計(jì)算包括 i.以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù); 計(jì)算所述鏈數(shù)Cn的平均數(shù)C·; iii.計(jì)算所述Cn的最大數(shù)M,其中所述M包括所有的所述基因表達(dá)值組對于給定的所述閾值C的所述鏈數(shù)Cn的數(shù)量中的最大值; iv.對于不同的所述閾值C,重復(fù)地施加關(guān)系式CaTC=M/log(M); v.將所述Cave值數(shù)據(jù)相對于M/log(M)的數(shù)據(jù)進(jìn)行比較;以及 vi.對所比較的數(shù)據(jù)的施加擬合以輸出所述比例因數(shù)a,其中所述比例因數(shù)a是所述擬合的斜率。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述至少一個(gè)生物樣本選自下組唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)及有機(jī)物質(zhì)。
10.權(quán)利要求8所述的系統(tǒng),其特征在于,所述基因表達(dá)讀取器包括至少兩個(gè)基因探針。
11.權(quán)利要求8所述的系統(tǒng),其特征在于,所述鏈數(shù)Cn的數(shù)量包括N個(gè)表達(dá)值組中的每組的鏈數(shù)的數(shù)量,其中每個(gè)所述表達(dá)值組包括在所述表達(dá)值組和其它N-I個(gè)基因表達(dá)值組的基因表達(dá)值序列Ii1, η2, · · · ητ之間的以閾值C的基因表達(dá)值序列Ii1, n2, . . . ηΤο
12.權(quán)利要求8所述的系統(tǒng),其特征在于,所述比例因數(shù)a通過以下步驟計(jì)算利用所述適當(dāng)編程的計(jì)算機(jī)對于不同的所述閾值C重復(fù)地施加所述Cave=M/log(M),以及將Cave值相對于M/log(M)進(jìn)行比較,并計(jì)算所述比較的線性擬合以獲得所述比例因數(shù)a。
13.權(quán)利要求8所述的系統(tǒng),其特征在于,所述比較所述a的值還包括比較所述比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫進(jìn)行比較。
14.權(quán)利要求8所述的系統(tǒng),其特征在于,所述閾值C在O和I之間的范圍中。
15.一種芯片上的實(shí)驗(yàn)室裝置,包括 a.用于保持生物樣本容器、基因表達(dá)讀取器和微處理器的襯底,其中所述生物樣本容器包括對所述基因表達(dá)讀取器的樣本輸入,其中所述基因表達(dá)讀取器基于分析至少一個(gè)生物樣本來輸出至少兩個(gè)基因的基因表達(dá)值,其中所述微處理器包括用于分析所述至少一個(gè)生物學(xué)樣本中的基因表達(dá)的計(jì)算機(jī)程序,其中所述計(jì)算機(jī)程序i.編譯所述基因表達(dá)值; 以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù); iii.計(jì)算所述鏈數(shù)Cn的平均數(shù)Cave; iv.計(jì)算所述Cn的最大數(shù)M,其中所述M包括所有的所述基因表達(dá)值組對于給定的所述閾值C的所述鏈數(shù)Cn的數(shù)量中的最大值; i.對于不同的所述閾值C,重復(fù)地施加關(guān)系式CaTC=M/log(M); 將所述Cave值數(shù)據(jù)相對于M/log (M)進(jìn)行比較;以及iii.計(jì)算對所比較的數(shù)據(jù)的擬合以輸出所述比例因數(shù)a,其中所述比例因數(shù)a是所述擬合的斜率; iv.將所述至少一個(gè)生物樣本的所述比例因數(shù)a的值與其它存儲的來自經(jīng)分析的生物樣本的比例因數(shù)a’進(jìn)行比較;以及 V.輸出報(bào)告,其中所述報(bào)告包括所述至少一個(gè)生物樣本的健康程度的評估。
16.如權(quán)利要求15所述的裝置,其特征在于,所述至少一個(gè)生物樣本選自下組唾液、尿、其它體液、滑液、乳腺導(dǎo)管液、血液和血液組分、組織、瘤、骨髓、干細(xì)胞、誘導(dǎo)多能細(xì)胞、細(xì)胞系、植物物質(zhì)及有機(jī)物質(zhì)。
17.權(quán)利要求15所述的裝置,其特征在于,所述基因表達(dá)讀取器包括至少兩個(gè)基因探針。
18.權(quán)利要求15所述的裝置,其特征在于,所述鏈數(shù)Cn的數(shù)量包括N個(gè)表達(dá)值組中的每組的鏈數(shù)的數(shù)量,其中每個(gè)所述表達(dá)值組包括在所述表達(dá)值組和其它N-I個(gè)基因表達(dá)值組的基因表達(dá)值序列Ii1, n2, . . . ητ之間的以閾值C的基因表達(dá)值序列Ii1, n2, . . . ητ。
19.權(quán)利要求15所述的裝置,其特征在于,所述比例因數(shù)a通過以下步驟計(jì)算利用所述適當(dāng)編程的計(jì)算機(jī)對于不同的所述閾值C重復(fù)地施加所述Cave=M/log(M),以及將Cave值相對于M/log(M)進(jìn)行比較,并計(jì)算所述比較的線性擬合以獲得所述比例因數(shù)a。
20.權(quán)利要求15所述的裝置,其特征在于,所述比較所述a的值還包括比較所述比例因數(shù)a的副產(chǎn)品,將健康樣本相對于疾病樣本進(jìn)行比較,或?qū)⑽粗獦颖九c來自已知條件下的樣本的值的數(shù)據(jù)庫進(jìn)行比較。
21.權(quán)利要求15所述的裝置,其特征在于,所述閾值C在O和I之間的范圍中。
全文摘要
提供了診斷疾病的裝置、方法和系統(tǒng),利用基因表達(dá)讀取器分析生物樣本并輸出基因表達(dá)值,以利用計(jì)算機(jī)通過以下步驟計(jì)算比例因數(shù)以閾值C對不同時(shí)間的各基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù),或以閾值C對單個(gè)時(shí)間的基因表達(dá)值的多個(gè)組的鏈數(shù)Cn的數(shù)量進(jìn)行計(jì)數(shù);計(jì)算鏈數(shù)Cn的平均數(shù)Cave;計(jì)算Cn的最大數(shù)M;對于不同的所述閾值C,重復(fù)地施加關(guān)系式Cave=M/log(M);將Cave數(shù)據(jù)值相對于M/log(M)進(jìn)行比較;以及計(jì)算對所比較的數(shù)據(jù)的擬合以輸出比例因數(shù)a。將比例因數(shù)a與數(shù)據(jù)庫中的其它比例因數(shù)a’進(jìn)行比較以輸出健康程度的評估的報(bào)告。
文檔編號G06F19/10GK102971737SQ201180033710
公開日2013年3月13日 申請日期2011年7月6日 優(yōu)先權(quán)日2010年7月8日
發(fā)明者S·C·肖 申請人:第一基因股份有限公司