亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種測序圖像的識別系統(tǒng)及方法

文檔序號:6368155閱讀:331來源:國知局
專利名稱:一種測序圖像的識別系統(tǒng)及方法
技術(shù)領(lǐng)域
本發(fā)明涉及圖像信息處理領(lǐng)域,更具體地說,涉及一種測序圖像的識別系統(tǒng)及方法。
背景技術(shù)
第二代測序技術(shù)的一個項關(guān)鍵技術(shù)就是堿基識別。在核酸測序過程中,根據(jù)堿基互補配對原則,采用不同顏色的熒光染料來標(biāo)記的不同堿基(即攜帶標(biāo)記物的堿基),使待測核酸的堿基與攜帶標(biāo)記物的堿基發(fā)生反應(yīng),然后,利用不同顏色的激發(fā)光照射堿基,攜帶不同標(biāo)記物的堿基在激發(fā)光的激發(fā)下,發(fā)出不同顏色的熒光,利用采圖裝置采集核酸測序的圖像,得到測序圖像,最后,對測序數(shù)據(jù)進行處理。其中,測序圖像中每個堿基位置上的堿基在激發(fā)光的激發(fā)下發(fā)光,得到的圖像會有不同的熒光信號,由于熒光染料不同,所以熒光 信號強度不同。而對測序數(shù)據(jù)進行處理的核心就是識別測序圖像中不同的堿基的熒光信號。一種突光染料只標(biāo)記一種堿基,一種激發(fā)光激發(fā)能夠激發(fā)一種突光染料發(fā)光,理論上每個堿基位置上的堿基只有一種熒光信號,根據(jù)每個堿基位置上的熒光信號強度,可以直接區(qū)分出熒光信號的類型,從而根據(jù)熒光信號的類型可以直接識別出對應(yīng)的堿基。但是,由于熒光染料清洗不干凈、激發(fā)光波長的區(qū)分度不明顯(同一種激發(fā)光可能激發(fā)多種攜帶標(biāo)記物的堿基發(fā)光)、beads (磁珠)結(jié)合tag (標(biāo)簽)不純等原因造成同一堿基位置上會有多種的熒光信號。單純從熒光信號很難區(qū)分該堿基位置上的堿基到底屬于哪一種堿基?,F(xiàn)有技術(shù)中,在保證通量的情況下,測序圖像有成千上萬張,堿基識別速度的快慢直接影響到整個核酸檢測的效率?,F(xiàn)有技術(shù)方案中,堿基識別的方法包括如下步驟:A、獲取每個位置上堿基的四色熒光的信號強度(每個位置上的堿基有四個信號強度值);B、將每個位置上的堿基至于四維空間中,得每個堿基在四維空間中的對應(yīng)的點;C、在四維空間中隨機選擇四個點作為質(zhì)心;D、計算各點到四個質(zhì)心的距離,將點分類到距質(zhì)心的距離最近的類中,直到將所有堿基對應(yīng)的點都分到相應(yīng)的類;E、根據(jù)已經(jīng)分的類,再重新計算每個類的質(zhì)心;F、重復(fù)步驟D和步驟E的操作,直到質(zhì)心不再變化。此時,所分的四類分別代表四種堿基(A,G,C,T)。該技術(shù)方案中,隨機選取四個點作為質(zhì)心,在對每個堿基對應(yīng)的點進行分類時,要多次重復(fù),從而影響了堿基識別的速度。因此,需要一種能夠快速準(zhǔn)確識別測序圖像中堿基類型的測序圖像的識別系統(tǒng)及方法。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種測序圖像的識別系統(tǒng)及方法,旨在解決現(xiàn)有技術(shù)測序圖像中堿基識別速度慢、堿基識別不準(zhǔn)確等的問題。為了實現(xiàn)發(fā)明目的,一種測序圖像的識別系統(tǒng)包括堿基處理單元、堿基矯正單元和堿基識別單元。其中所述堿基處理單元,用于根據(jù)熒光信號強度對每個堿基位置點上的喊基進行初步喊基識別,得不同喊基類,并確定所獲得的每類喊基類的質(zhì)心,并將喊基類和其質(zhì)心發(fā)給堿基矯正單元。所述堿基矯正單元,用于根據(jù)每個堿基位置點上的堿基到每類堿基類的質(zhì)心的距離對每類堿基類進行調(diào)整,得新的堿基類,并將新的堿基類發(fā)給堿基識別單元。所述堿基識別單元,用于通過新的堿基類對每個堿基位置點上的堿基進行精確堿基識別,得測序圖像中每個堿基位置點上的堿基類型。其中,所述的堿基類型為能夠一一對應(yīng)實現(xiàn)堿基互補的堿基,該堿基類型無特殊限制,如 A-U, A-T,G-C,優(yōu)選為 A、G、C、T 或者 A、G、C、U。所述堿基處理單元包括分類模塊和計算模塊。其中,所述分類模塊,用于根據(jù)熒光信號強度,將每個堿基位置點上的堿基歸類到熒光信號強度最大的熒光信號代表的堿基所在的類,對堿基進行初步堿基識別,得不同堿基類,并將堿基類發(fā)給計算模塊。所述計算模塊,用于利用均值法獲得每類堿基類的質(zhì)心,得每類堿基類的質(zhì)心。所述堿基矯正單元包括距離度量模塊和堿基歸類模塊。其中,所述距離度量模塊,用于利用歐式距離度量每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離。所述堿基歸類模塊,與距離度量模塊連接,用于獲取每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離,并將該堿基位置上的堿基歸類到距離其最近的質(zhì)心所在的堿基類,得新的堿基類。其中,所述系統(tǒng)還包括圖像處理單元,用于獲取測序圖像并獲取測序圖像中每個堿基位置點上的堿基的熒光信號強度,并將每個堿基位置上的熒光信號強度發(fā)給堿基處理單元。其中,所述圖像處理單元包括圖像獲取模塊和圖像配準(zhǔn)模塊。其中,所述圖像獲取模塊,用于從核酸檢測裝置中獲取測序圖像,并將獲取的測序圖像發(fā)給圖像配準(zhǔn)模塊。所述圖像配準(zhǔn)模塊,用于將測序圖像進行圖像配準(zhǔn),得每個堿基位置點上熒光信號強度。其中,所述的核酸檢測裝置用于根據(jù)堿基互補配對原則對核酸序列進行檢測。進一步的,所述圖像處理單元還包括歸一模塊,與圖像配準(zhǔn)模塊連接,用于將每個堿基位置上的熒光信號強度進行歸一化處理。進一步的,所述圖像獲取模塊,用于通過USB接口、串口和紅外接口中的任意一種獲取測序圖像。進一步的,所述測序圖像的識別系統(tǒng),用于通過直接控制方式、中斷控制方式、DMA控制方式和通道控制方式中的一種獲取測序圖像。為了更好地實現(xiàn)發(fā)明目的,一種測序圖像的識別方法包括如下步驟步驟A、獲取測序圖像中每個堿基位置點上的堿基的熒光信號強度。步驟B、根據(jù)所述熒光信號強度對每個堿基位置點上的堿基進行初步堿基識別,得不同堿基類,并確定所獲得的每類堿基類的質(zhì)心。步驟C、根據(jù)每個堿基位置點上的堿基到每類堿基類的質(zhì)心的距離對每類堿基類進行調(diào)整,得新的堿基類。步驟D、通過新的堿基類對每個堿基位置點上的堿基進行精確堿基識別,得測序圖像中每個堿基位置點上的堿基類型。其中,所述步驟B包括BI、根據(jù)所述熒光信號強度,將每個堿基位置點上的堿基歸類到熒光信號強度最大的熒光信號代表的堿基所在的類,對堿基進行初步堿基識別,得不同堿基類。B2、利用均值法獲得每類堿基類的質(zhì)心,得每類堿基類的質(zhì)心。
其中,所述測序圖像包括在同一采圖位置上拍攝的多張測序圖像。所述步驟A包括:Al、從核酸檢測裝置中獲取測序圖像。A2、將同一采圖位置上的測序圖像進行圖像配準(zhǔn),得每個堿基位置點上的熒光信號強度。
進一步的,所述步驟A2之后還包括步驟A3、將每個堿基位置上的熒光信號強度進行歸一化處理。其中,所述步驟C包括步驟Cl、利用歐式距離度量每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離。步驟C2、將堿基歸類到距離其最近的質(zhì)心所在的堿基類,得新的堿基類。其中,所述熒光信號強度值在O到4095之間。由上可知,本發(fā)明僅通過初步堿基識別和精確堿基識別,即可實現(xiàn)對于測序圖像識別,從而大大提高了堿基識別的速度。


圖I是本發(fā)明一實施例中測序圖像的識別系統(tǒng)結(jié)構(gòu)示意圖。圖2是本發(fā)明一實施例中測序圖像的示意圖。圖3是本發(fā)明一實施例中各堿基位置上不同熒光信號的強度示意圖。圖4是本發(fā)明一實施例中堿基類的示意圖。圖5是本發(fā)明一實施例中堿基處理單元的結(jié)構(gòu)示意圖。圖6是本發(fā)明一實施例中堿基矯正單元的結(jié)構(gòu)示意圖。圖7是本發(fā)明另一實施例中測序圖像的識別系統(tǒng)的結(jié)構(gòu)示意圖。圖8是本發(fā)明一實施例中圖像處理單元的結(jié)構(gòu)示意圖。圖9是本發(fā)明一實施例中測序圖像的識別方法的方法流程圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。本發(fā)明中熒光信號的種類無特殊限制,可以為2色熒光信號(同一個堿基位置用兩個循環(huán)來檢測),4色突光信號(同一個堿基位置用一個循環(huán)來檢測),8色突光信號(同一個循環(huán)檢測兩個堿基位置)等等,但其原理相同,但其他多種熒光信號均屬于本發(fā)明保護的范圍。以下實施例僅以四色熒光信號為例。在核酸測序過程中,采用不同顏色的熒光染料來標(biāo)記不同的核苷酸,在生化領(lǐng)域,用堿基代表某類核苷酸,比如用堿基A代表腺嘌呤核苷酸。以下對核苷酸簡稱為堿基。本發(fā)明提出第一實施例,一種測序圖像的識別系統(tǒng)包括堿基處理單元、堿基矯正單元和堿基識別單元,如圖I所示。以下將對所述單元進行詳細說明。(I)堿基處理單元1,用于根據(jù)熒光信號強度對每個堿基位置點上的堿基進行初步堿基識別,得不同堿基類,并確定所獲得的每類堿基類的質(zhì)心,并將堿基類和其質(zhì)心發(fā)給堿基矯正單元2。在核酸測序過程中,采用不同顏色的熒光染料來標(biāo)記不同的核苷酸(稱熒光標(biāo)記的堿基,也稱攜帶標(biāo)記物的堿基),根據(jù)堿基互補配對原則,待測核酸的堿基與熒光標(biāo)記的堿基進行互補配對,使待測核酸帶上熒光染料標(biāo)記物,對不同類型的熒光染料采用不同的激發(fā)光(包括激發(fā)光的波長不同)來激發(fā)熒光染料,熒光染料發(fā)光,然后,利用采圖裝置采集圖像,得到測序圖像。其中,一種的熒光染料標(biāo)記一種核苷酸,當(dāng)利用熒光照射時,使得每種通過堿基互補配對的堿基發(fā)出的熒光不同(包括熒光顏色不同,該熒光用熒光信號、熒光信號強度來度量)。最終使得每個堿基位置點上都有熒光信號,每種熒光信號代表一種堿基類型,但是由于目前技術(shù)中,同一堿基位置上有多種熒光信號。圖3示出了同一位置上的堿基的四種熒光信號強度,每種顏色的曲線代表一種熒光信號,每種熒光信號強度值在圖中顯示的是曲線的高高低低,曲線上較高的點,對應(yīng)的熒光信號強度大,曲線上較低的點,對應(yīng)的突光信號強度小。該圖中,橫坐標(biāo)表不堿基位置,縱坐標(biāo)表不突光信號強度值,同一堿基位置上有四個熒光信號。經(jīng)過初步識別得到的結(jié)果如圖4中的a圖所示,每個堿基位置點上的堿基進行初步識別,得不同堿基類。所述熒光信號強度的度量方式無特殊限制。優(yōu)選的,該熒光信號強度為該堿基位置點上該熒光信號亮度。優(yōu)選的,該熒光信號強度為該堿基位置點上RGB的映射強度,即將RGB映射成亮度,先給出一示例亮度L= δ 1*R+ δ 2*G+ δ 3*B, δ 1+ δ 2+ δ 3=3,則可以得到該 堿基位置點上RGB的映射強度,也即得到該堿基位置點上不同熒光信號的熒光信號強度。該熒光信號強度值無特殊限制,但為了實現(xiàn)更好的熒光信號區(qū)分,熒光信號強度值優(yōu)選在O到4095之間。也即可以將亮度進行映射,得到熒光信號強度值在O到4095之間。(2)堿基矯正單元2,用于根據(jù)每個堿基位置點上的堿基到每類堿基類的質(zhì)心的距離對每類堿基類進行調(diào)整,得新的堿基類,并將新的堿基類發(fā)給堿基識別單元3。新的堿基類是在堿基類的基礎(chǔ)上進行的進一步精確分類,如圖4中的b圖所示,堿基矯正單元2重新歸類(調(diào)整或舍棄了堿基處理單元I中堿基與其所在的堿基類的屬性不符的堿基)。相對于圖4中的a圖,圖4中的b圖所示的堿基的分類更集中,每類堿基類幾乎無重置部分,也即喊基矯正單兀2大大提聞了每個喊基位置上喊基所在喊基類的準(zhǔn)確性。(3)堿基識別單元3,用于通過新的堿基類對每個堿基位置點上的堿基進行精確堿基識別,得測序圖像中每個堿基位置點上的堿基類型。每類新的堿基類代表一種堿基,通過堿基所在的堿基類實現(xiàn)對堿基位置上的堿基的識別。如圖4所示,不同顏色的堿基類代表不同的堿基,每個堿基位置上的堿基屬于某一類堿基類,從而實現(xiàn)了堿基的識別。其中,本實施例中所述的四色熒光信號無特殊限制,優(yōu)選為紅、黃、綠、藍四種熒光信號。本實施例的技術(shù)方案通過堿基處理單元、堿基矯正單元和堿基識別單元實現(xiàn)了測序圖像中堿基的快速且準(zhǔn)確的識別。本實施例中,堿基處理單元I可包括分類模塊和計算模塊,如圖5所示。下面將對兩個模塊分別進行詳細說明。(I)分類模塊11,用于根據(jù)熒光信號強度,將每個堿基位置點上的堿基歸類到熒光信號強度最大的熒光信號代表的堿基所在的類,對堿基進行初步堿基識別,得不同堿基類,并將堿基類發(fā)給計算模塊12。分類模塊11根據(jù)熒光信號強度值,將每個堿基位置上的堿基進行歸類。以下對分類模塊給出一優(yōu)選的實施方案,當(dāng)堿基位置上的幾種熒光信號中,熒光信號強度最大的熒光信號至少有2個時,則認為該堿基為無法識別的堿基,該堿基不歸類,當(dāng)堿基位置上的幾種熒光信號中,熒光信號強度最大的熒光信號只有一個,則將該堿基位置上的堿基歸類到熒光信號強度最大的熒光信號代表的堿基所在的類,從而實現(xiàn)對所有堿基位置上的堿基的歸類。如下給出一具體的示例,各堿基位置上的堿基的熒光信號強度分別為1 (1479.58,1214. 52,1123. 09,803. 46),2 (538. 8,639. 07,721. 67,1034. 47),3 (1543. 23,1543. 23,1218. 13,1220. 96),4 (1272. 61,1554. 82,875. 48,918. 86),5 (997. 94,815. 69,1114. 53,
1171. 08),6(913. 73,764. 51,1006. 71,696. 51),7(764. 85,881. 62,714. 44,813. 85),......η
(xn, yn, zn, rn), ......, m (xm, ym, zm, rm),其中,I, 2, 3,4, 5,6, 7, ......, η......, m,......代
表的是堿基位置,而堿基位置上對應(yīng)的(xn,yn, zn, rn)是熒光信號強度,xn代表第一種熒光信號的熒光信號強度,yn代表第二種熒光信號的熒光信號強度,zn代表第三種熒光信號的突光信號強度,rn代表第四種突光信號的突光信號強度。根據(jù)本技術(shù)方案對堿基進行歸
類,則 I (1479. 58,1214. 52,1123. 09,803. 46)、......為一類,4 (1272. 61,1554. 82,875. 48,
918. 86),7 (764. 85,881. 62,714. 44,813. 85),......為一類,6 (913. 73,764. 51·,1006. 71,
696.51)、......為一類,2 (538. 8,639. 07,721. 67,1034. 47),5 (997. 94,815. 69,1114. 53,
1171.08)、......為一類,其中,3 (1543. 23,1543. 23,1218. 13,1220. 96)、......被舍棄,得到
四個堿基類。對分類模塊11給出另一優(yōu)選的實施方案,當(dāng)某個堿基位置上的堿基最大的多個熒光信號強度相等時,則將該堿基分別分類到多個最大的熒光信號對應(yīng)的堿基類。各堿基位置上的堿基的熒光信號強度分別為1 (1479. 58,1214. 52,1123. 09,803. 46),2 (538.8,639. 07,721. 67,1034. 47),3 (1543. 23,1543. 23,1218. 13,1220. 96),4 (1272. 61,1554. 82,875. 48,918. 86),5 (997. 94,815. 69,1114. 53,1171. 08),6 (913. 73,764. 51,1006. 71,
696. 51),7 (764. 85,881. 62,714. 44,813. 85), ......n (xn, yn, zn, rn), ......, m (xm, ym,
2111,1'111),其中,1,2,3,4,5,6,7,……,n……,m,……表示的是堿基位置,而堿基位置上對應(yīng)的(xn, yn, zn, rn)是突光信號強度,xn代表第一種突光信號的突光信號強度,yn代表第二種熒光信號的熒光信號強度,zn代表第三種熒光信號的熒光信號強度,rn代表第四種熒光信號的熒光信號強度。根據(jù)本技術(shù)方案對堿基進行歸類,則1(1479. 58,1214. 52,1123. 09,
803. 46)、3 (1543. 23,1543. 23,1218. 13,1220. 96)、...... 一類;3 (1543. 23,1543. 23,
1218. 13,1220. 96),4 (1272. 61,1554. 82,875. 48,918. 86),7 (764. 85,881. 62,714. 44,
813.85)、......一類;6 (913. 73,764. 51,1006. 71,696. 51),......一類;2 (538. 8,639. 07,
721. 67,1034. 47),5 (997. 94,815. 69,1114. 53,1171. 08),......一類。上述技術(shù)方案對堿基進行初步處理,該技術(shù)方案簡單,且與現(xiàn)有技術(shù)方案相比,大大提高了準(zhǔn)確性和效率。(2)計算模塊12,用于利用均值法獲得每類堿基類的質(zhì)心,得每類堿基類的質(zhì)心。采用均值法計算每類堿基類的質(zhì)心mean,以下給出以示例,mean ((xl+x2+......
+xk) /k, (yl+y2+......+yk) /k, (zl+z2+......+zk) /k, (rl+r2+......+rk)/k),依次計算每類
堿基類的質(zhì)心,得每類堿基類的質(zhì)心為meanl, mean2, mean3, mean4。本技術(shù)方案中,能夠簡單且準(zhǔn)確的獲得每類堿基類的質(zhì)心,從而保證了堿基處理單元的對每個堿基位置上堿基處理的精度和速度。為整個系統(tǒng)快速準(zhǔn)確識別堿基奠定了基礎(chǔ)。本實施例中,堿基矯正單元2可包括距離度量模塊和堿基歸類模塊,如圖6所示。其中
(I)距離度量模塊21,用于利用歐式距離度量每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離。度量每個堿基位置上的堿基到四類堿基類的質(zhì)心的距離。其中,利用兩點間的距離來計算堿基位置上的堿基到每類堿基類的質(zhì)心的距離,優(yōu)選的,該距離為歐式距離。(2)堿基歸類模塊22,與距離度量模塊連接,用于獲取每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離,并將該堿基位置上的堿基歸類到距離其最近的質(zhì)心所在的堿基類,得新的堿基類。針對堿基歸類模塊22,本實施例給出一示例,如某一堿基位置上的堿基的熒光信號強度N(xN, yN, zN, rN),每類喊基類的質(zhì)心為meanl, mean2, mean3, mean4,喊基N到每類喊基類的質(zhì)心的距離分別為 N_meanl,N_mean2,N_mean3,N_mean4,假設(shè)N_meanl > N_mean2> N_mean3 > N_mean4,則將堿基位置上的堿基N歸類到質(zhì)心為meanl的堿基類。以下給出一優(yōu)選的實施方案,堿基位置上的堿基所屬的堿基類與該堿基位置上的 堿基距離某堿基類的質(zhì)心最近的堿基類,如果不屬于同一類堿基類,則認為該堿基位置上的堿基為無效堿基,舍棄該堿基位置上的堿基;如果屬于同一類堿基,則該堿基歸類到該堿基類。以下給出另一優(yōu)選的實施方案,堿基位置上的堿基距離某類堿基類的質(zhì)心最近,則將該堿基位置上的堿基歸類到某堿基類,如果該堿基位置上的堿基距離至少兩類堿基類的質(zhì)心最近,則舍棄該喊基。上述技術(shù)方案舍棄了部分由于測序反應(yīng)、測序設(shè)備等本身原因造成同一堿基位置上的堿基的熒光信號的混淆而無法區(qū)分堿基,從而提高了系統(tǒng)的準(zhǔn)確性和速度?;诘谝粚嵤├?,本發(fā)明提出第二實施例,本系統(tǒng)還可包括圖像處理單元。如圖7所示,所述圖像處理單元0,用于獲取測序圖像中每個堿基位置點上的堿基的熒光信號強度,并將每個堿基位置上的熒光信號強度發(fā)給堿基處理單元I。測序圖像如圖2所示,圖像處理單元O獲取測序圖像并獲取測序圖像中每個堿基位置點上的熒光信號強度,如果測序圖像為q色熒光采圖得到的測序圖像,則每個堿基位置上每個堿基有q個熒光信號,對應(yīng)有q個熒光信號強度。其中,圖2中a圖為明場圖,圖2中b,c,d,e圖均為熒光圖。本實施例中的圖像處理單元O從核酸檢測裝置中獲取測序圖像。該圖像處理單元0,用于通過USB接口、串口和紅外接口中的任意一種獲取測序圖像。優(yōu)選的,圖像處理單元采用USB接口獲取測序圖像。同時,該系統(tǒng)用于通過直接控制方式、中斷控制方式、DMA控制方式和通道控制方式中的一種獲取測序圖像。該圖像處理單元O可實時獲取測序圖像,也可根據(jù)需要隨時獲取測序圖像。本實施例中,所述圖像處理單元可包括圖像獲取模塊和圖像配準(zhǔn)模塊。將對所述兩個模塊進行詳細說明,如圖8中a圖所示。(I)圖像獲取模塊01,用于從核酸檢測裝置中獲取測序圖像,并將獲取的測序圖像發(fā)給圖像配準(zhǔn)模塊。本實施例中的核酸檢測裝置用于根據(jù)堿基互補配對原則對核酸序列進行檢測。該核酸檢測裝置無特殊限制,市場上出售的高通量基因測序設(shè)備均適用于本發(fā)明中,例如=Pstar高通量基因測序儀、PacBioRS基因測序系統(tǒng)、Ion PGM測序儀、MiSeq測序系統(tǒng)、MiniON納米孔測序儀、GS Junior測序系統(tǒng)等。在核酸檢測裝置內(nèi)進行測序反應(yīng),當(dāng)測序反應(yīng)進行完時,先用明場燈照射測序反應(yīng)區(qū)域,拍攝明場圖,如圖2中a圖所示,所有堿基位置上的堿基均發(fā)光;然后,再利用不同的激發(fā)光激發(fā)測序反應(yīng)區(qū)域,每種激發(fā)光激發(fā)一種帶熒光染料的堿基發(fā)光,拍攝熒光圖,四類攜帶標(biāo)記物的堿基,用四種激發(fā)光激發(fā),可得同一采圖位置上的四種熒光圖像,如圖2中b,c,d,e圖所示。其中,圖2中a,b,c, d, e圖為同一位置上的測序圖像。(2)圖像配準(zhǔn)模塊02,用于將測序圖像進行圖像配準(zhǔn),得每個堿基位置點上熒光信號強度。采用圖像配準(zhǔn)技術(shù),即將多張采集同一位置的測序圖像的對應(yīng)位置進行重合,將如圖2所示的b,c,d,e圖與a圖分別匹配,得到每個堿基位置上的四個熒光信號,根據(jù)每個堿基位置上的熒光信號獲得熒光信號強度。本實施例的上述技術(shù)方案采用圖像配準(zhǔn)技術(shù)對同一采圖位置上的多張測序圖像進行精確匹配,從而能夠更準(zhǔn)確的獲取使得每個堿基位置上的堿基的幾種熒光信號,該技術(shù)方案為堿基識別的準(zhǔn)確性提供了保障。本實施例中,所述圖像處理單元還可包括歸一模塊。如圖8中b圖所示,所述的歸一模塊03,與圖像配準(zhǔn)模塊02連接,用于將每個堿基位置上的熒光信號強度進行歸一化處 理。所述歸一模塊將每個堿基位置上的熒光信號強度進行歸一化處理,設(shè)某堿基位置上的堿基Beadn的突光信號強度Beadn Ca, g, c, t),則進行歸一化處理后的堿基Beadn的突光信號強度為(c/sqrt (c'2+t'2+a'2+g'2), t/sqrt (c'2+t'2+a'2+g'2), a/sqrt(c'2+t'2+a'2+g'2),g/sqrt (c'2+t'2+a'2+g'2))。本技術(shù)方案中,采用歸一化對堿基位置上的堿基的熒光信號強度進行處理,該技術(shù)方案簡便,同時使得測序圖像的微小變化對結(jié)果影響較小,從而提高了圖像處理單元處理的精度,同時采用歸一化大大提高了后續(xù)的單元處理對測序圖像堿基識別的速度。本發(fā)明提出第三實施例,一種測序圖像的識別方法,如圖9所示,將對所述方法包括可包括的步驟進行詳細說明。SI、獲取測序圖像中每個堿基位置點上的堿基的熒光信號強度。所述熒光信號強度的度量方式無特殊限制。優(yōu)選的,該熒光信號強度為該堿基位置點上該熒光信號的亮度。優(yōu)選的,該熒光信號強度為該堿基位置點上RGB的映射強度,即將RGB映射成亮度,先給出一示例亮度L= δ 1*R+ δ 2*G+ δ 3*B, δ 1+ δ 2+ δ 3=3,則可以得到該堿基位置點上RGB的映射強度,也即得到該堿基位置點上不同熒光信號的熒光信號強度。該熒光信號強度值無特殊限制,但為了實現(xiàn)更好的熒光信號區(qū)分,熒光信號強度值優(yōu)選在O到4095之間。也即可以將亮度進行映射,得到熒光信號強度值在O到4095之間。S2、根據(jù)所述熒光信號強度對每個堿基位置點上的堿基進行初步堿基識別,得不同堿基類,并確定所獲得的每類堿基類的質(zhì)心。圖3示出了同一位置上的堿基的四種熒光信號強度,每種顏色的曲線代表一種熒光信號,每種熒光信號強度值在圖中顯示的是曲線的高高低低,曲線上較高的點,對應(yīng)的熒光信號強度大,曲線上較低的點,對應(yīng)的熒光信號強度小。該圖中,橫坐標(biāo)表示堿基位置,縱坐標(biāo)表示熒光信號強度值,同一堿基位置上有四個熒光信號。經(jīng)過初步識別得到的結(jié)果如圖4中的a圖所示,每個堿基位置點上的堿基進行初步識別,得不同堿基類。其中,每種顏色代表一種突光信號。S3、根據(jù)每個堿基位置點上的堿基到每類堿基類的質(zhì)心的距離,得新的堿基類。新的堿基類是在堿基類的基礎(chǔ)上進行的進一步精確分類,如圖4中的b圖所示,堿基矯正單元2重新歸類(調(diào)整或舍棄了堿基處理單元中堿基與其所在的堿基類的屬性不符的堿基)。相對于圖4中的a圖,圖4中的b圖所示的堿基的分類更集中,每類堿基類幾乎無重置部分,也即喊基矯正單兀大大提聞了每個喊基位置上喊基所在喊基類的準(zhǔn)確性。S4、通過新的堿基類對每個堿基位置點上的堿基進行精確堿基識別,得測序圖像中每個堿基位置點上的堿基類型。每類新的堿基類代表一種堿基,通過堿基所在的類別實現(xiàn)對堿基位置上的堿基的識別。如圖4所示,每個堿基位置上的堿基屬于某一類堿基類,不同顏色的堿基類代表不同的堿基,從而實現(xiàn)了堿基的識別。其中,本實施例中所述的四色熒光信號無特殊限制,優(yōu)選為紅、黃、綠、藍四種熒光信號。在核酸測序過程中,采用不同顏色的熒光染料來標(biāo)記不同的堿基,根據(jù)堿基互補配對原則,待測核酸進行互補配對,使得待測核酸帶上熒光染料標(biāo)記的堿基,對不同類型的熒光染料采用不同的激發(fā)光(包括激發(fā)光的波長和激發(fā)光的強度)來激發(fā)熒光染料發(fā)光,然后,利用采圖裝置采集圖像,可以得到測序圖像。其中,一種的熒光染料標(biāo)記一種堿基,從而使得每種堿基發(fā)出的熒光不同(包括熒光的顏色和熒光信號的強度)。最終使得每個堿基位置點上都有突光信號,每種突光信號代表一種堿基類型,但是由于目前技術(shù)中,同一堿基位置上有不同的熒光信號,也即同一堿基位置上有多個熒光信號。本實施例的上述技術(shù)方案能夠通過對堿基位置上的堿基的初步堿基識別和精確堿基識別,最終實現(xiàn)測序圖像的堿基精確識別,與現(xiàn)有技術(shù)相比,該技術(shù)方案不僅堿基識別的步驟簡單,也即能夠?qū)崿F(xiàn)快速堿基識別,而且堿基識別的精度高。本實施例中,所述測序圖像包括在同一采圖位置上拍攝的多張測序圖像,如圖2所示,a為明場圖,圖2中b, c, d, e圖均為熒光圖。本實施例中,將對所述步驟SI可包括的步驟進行詳細說明。S11、從核酸檢測裝置中獲取測序圖像。本實施例中的核酸檢測裝置用于根據(jù)堿基互補配對原則對核酸序列進行檢測。該核酸檢測裝置無特殊限制,市場上出售的高通量基因測序設(shè)備均適用于本發(fā)明中,例如高通量基因測序儀、PaciBioRS基因測序系統(tǒng)等。在核酸檢測裝置內(nèi)進行測序反應(yīng),當(dāng)測序反應(yīng)進行完時,先用明場燈照射測序反應(yīng)區(qū)域,拍攝明場圖,如圖2中a圖所示,所有堿基位置上的堿基均發(fā)光;然后再利用不同的激發(fā)光激發(fā)測序反應(yīng)區(qū)域,每種激發(fā)光激發(fā)一種帶熒光染料的堿基發(fā)光,拍攝熒光圖,四類攜帶標(biāo)記物的堿基,用四種激發(fā)光激發(fā),可得同一采圖位置上的四種熒光圖像,如圖2中b,c,d,e圖所示。其中,圖2中a,b,c, d, e圖為同一位置上的測序圖像。S12、將同一采圖位置上的測序圖像進行圖像配準(zhǔn),得每個堿基位置點上的熒光信號強度。采用圖像配準(zhǔn)技術(shù),即將多張采集同一位置的測序圖像的對應(yīng)位置進行重合,將如圖2所示的b,c,d,e圖與a圖分別匹配,得到每個堿基位置上的四個熒光信號,根據(jù)每個堿基位置上的熒光信號獲得熒光信號強度。本實施例的上述技術(shù)方案采用圖像配準(zhǔn)技術(shù)對同一采圖位置上的多張測序圖像進行精確匹配,從而能夠更準(zhǔn)確的獲取使得每個堿基位置上的堿基的幾種熒光信號,該技術(shù)方案為堿基識別的準(zhǔn)確性提供了保障。本實施例中,將對所述步驟SI還可以包括的步驟進行詳細說明。S13、將每個堿基位置上的熒光信號強度進行歸一化處理。每個堿基位置上的熒光信號強度進行歸一化處理,設(shè)某堿基位置上的堿基Beadn的突光信號強度Beadn (a, g, c, t),則進行歸ー化處理后的堿基Beadn的突光信號強度為(c/sqrt (c'2+t'2+a'2+g'2), t/sqrt (c'2+t'2+a'2+g'2), a/sqrt (c'2+t'2+a'2+g'2),g/sqrt (c'2+t'2+a'2+g'2)) 本技術(shù)方案中,采用歸一化對堿基位置上的堿基的熒光信號強度進行處理,該技術(shù)方案簡便,同時使得測序圖像的微小變化對結(jié)果影響較小,從而提高了圖像處理單元處理的精度,同時采用歸ー化大大提高了后續(xù)測序圖像堿基識別的速度。
本實施例中,將對所述步驟S2可包括的步驟進行說明。S21、根據(jù)所述熒光信號強度,將每個堿基位置點上的堿基歸類到熒光信號強度最大的熒光信號代表的堿基所在的類,對堿基進行初步堿基識別,得不同堿基類。針對堿基的初步識別,本實施例給出ー實施方案,當(dāng)堿基位置上的幾種熒光信號中,熒光信號強度最大的熒光信號至少有2個時,則認為該堿基為無法識別的堿基,該堿基不歸類,當(dāng)堿基位置上的幾種熒光信號中,熒光信號強度最大的熒光信號只有ー個,則將該堿基位置上的堿基歸類到熒光信號強度最大的熒光信號代表的堿基所在的類,從而實現(xiàn)對所有堿基位置上的堿基的歸類。本實施例中給出另一實施方案,當(dāng)某個堿基位置上的堿基最大的多個熒光信號強度相等時,則將該堿基分別分類到多個最大的熒光信號對應(yīng)的堿基類。S22、利用均值法獲得每類堿基類的質(zhì)心,得每類堿基類的質(zhì)心。采用均值法計算姆類堿基類的質(zhì)心mean,以下給出以示例,mean ((xl+x2+......
+xk) /k, (yl+y2+......+yk) /k, (zl+z2+......+zk) /k, (rl+r2+......+rk)/k),依次計算姆類
堿基類的質(zhì)心,得姆類堿基類的質(zhì)心為meanl, mean2, mean3, mean4。本技術(shù)方案中,能夠簡單且準(zhǔn)確的獲得每類堿基類的質(zhì)心,從而保證了的堿基處理的精度和速度。為該方案能夠快速、準(zhǔn)確進行堿基識別奠定了基礎(chǔ)。為了便于理解,本實施例中,將對所述步驟S3可包括的步驟進行詳細說明。S31、利用歐式距離度量每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離。度量每個堿基位置上的堿基到四類堿基類的質(zhì)心的距離,其中,利用兩點間的距離來計算堿基位置上的堿基到每類堿基類的質(zhì)心的距離,優(yōu)選的,該距離為歐式距離。S32、將堿基歸類到距離其最近的質(zhì)心所在的堿基類,得新的堿基類。針對堿基歸類模塊,本實施例給出ー不例,如某ー堿基位置上的堿基的突光信號強度N(xN, yN, zN, rN),姆類堿基類的質(zhì)心為meanl, mean2, mean3, mean4,堿基N到姆類堿基類的質(zhì)心的距離分別為 N_meanl, N_mean2, N_mean3, N_mean4,假設(shè) N_mean2 > N_meanl> N_mean3 > N_mean4,則將堿基位置上的堿基N歸類到質(zhì)心為mean2的堿基類。以下給出ー優(yōu)選的實施方案,堿基位置上的堿基所屬的堿基類與該堿基位置上的堿基距離某堿基類的質(zhì)心最近的堿基類,如果不屬于同一類堿基類,則認為該堿基位置上的堿基為無效堿基,舍棄該堿基位置上的堿基;如果屬于同一類堿基,則該堿基歸類到該堿基類。以下給出另一優(yōu)選的實施方案,堿基位置上的堿基距離某類堿基類的質(zhì)心最近,則將該堿基位置上的堿基歸類到某堿基類,如果該堿基位置上的堿基距離至少兩類堿基類的質(zhì)心相等且最近,則舍棄該堿基。上述技術(shù)方案舍棄了部分由于測序反應(yīng)、測序設(shè)備等原因造成同ー堿基位置上的喊基的突光イ目號的混渚而無法區(qū)分喊基,從而提聞了喊基識別的準(zhǔn)確性,也進一步提聞了堿基識別的速度。應(yīng)當(dāng)說明的是,本發(fā)明典型的應(yīng)用但不限于測序圖像堿基識別的本身,在其他類似的信息處理領(lǐng)域中也可以應(yīng)用本發(fā)明所闡述的方法。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保 護范圍之內(nèi)。
權(quán)利要求
1.一種測序圖像的識別系統(tǒng),其特征在于,所述系統(tǒng)包括堿基處理單元、堿基矯正單元和堿基識別單元; 所述堿基處理單元,用于根據(jù)熒光信號強度對每個堿基位置點上的堿基進行初步堿基識別,得不同堿基類,并確定所獲得的每類堿基類的質(zhì)心,并將堿基類和其質(zhì)心發(fā)給堿基矯正單元; 所述堿基矯正單元,用于根據(jù)每個堿基位置點上的堿基到每類堿基類的質(zhì)心的距離對每類堿基類進行調(diào)整,得新的堿基類,并將新的堿基類發(fā)給堿基識別單元; 所述堿基識別單元,用于通過新的堿基類對每個堿基位置點上的堿基進行精確堿基識別,得測序圖像中每個堿基位置點上的堿基類型。
2.根據(jù)權(quán)利要求I所述的測序圖像的識別系統(tǒng),其特征在于,所述堿基處理單元包括分類模塊和計算模塊; 所述分類模塊,用于根據(jù)熒光信號強度,將每個堿基位置點上的堿基歸類到熒光信號強度最大的熒光信號代表的堿基所在的類,對堿基進行初步堿基識別,得不同堿基類,并將堿基類發(fā)給計算模塊; 所述計算模塊,用于利用均值法獲得每類堿基類的質(zhì)心,得每類堿基類的質(zhì)心。
3.根據(jù)權(quán)利要求I所述的測序圖像的識別系統(tǒng),其特征在于,所述堿基矯正單元包括距離度量模塊和堿基歸類模塊; 所述距離度量模塊,用于利用歐式距離度量每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離; 所述堿基歸類模塊,與距離度量模塊連接,用于獲取每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離,并將該堿基位置上的堿基歸類到距離其最近的質(zhì)心所在的堿基類,得新的喊基類。
4.根據(jù)權(quán)利要求I所述的測序圖像的識別系統(tǒng),其特征在于,所述系統(tǒng)還包括圖像處理單元,用于獲取測序圖像并獲取測序圖像中每個堿基位置點上的堿基的熒光信號強度,并將每個堿基位置上的熒光信號強度發(fā)給堿基處理單元。
5.根據(jù)權(quán)利要求4所述的測序圖像的識別系統(tǒng),其特征在于,所述圖像處理單元包括圖像獲取模塊和圖像配準(zhǔn)模塊; 所述圖像獲取模塊,用于從核酸檢測裝置中獲取測序圖像,并將獲取的測序圖像發(fā)給圖像配準(zhǔn)模塊; 所述圖像配準(zhǔn)模塊,用于將測序圖像進行圖像配準(zhǔn),得每個堿基位置點上熒光信號強度。
6.根據(jù)權(quán)利要求5所述的測序圖像的識別系統(tǒng),其特征在于,所述圖像處理單元還包括歸一模塊,與圖像配準(zhǔn)模塊連接,用于將每個堿基位置上的熒光信號強度進行歸一化處理。
7.根據(jù)權(quán)利要求5或6所述的測序圖像的識別系統(tǒng),其特征在于,所述圖像獲取模塊,用于通過USB接口、串口和紅外接口中的任意一種獲取測序圖像。
8.根據(jù)權(quán)利要求5或6所述的測序圖像的識別系統(tǒng),其特征在于,所述測序圖像的識別系統(tǒng),用于通過直接控制方式、中斷控制方式、DMA控制方式和通道控制方式中的一種獲取測序圖像。
9.一種測序圖像的識別方法,其特征在于,所述方法包括步驟 A、獲取測序圖像中每個堿基位置點上的堿基的熒光信號強度; B、根據(jù)所述熒光信號強度對每個堿基位置點上的堿基進行初步堿基識別,得不同堿基類,并確定所獲得的每類堿基類的質(zhì)心; C、根據(jù)每個堿基位置點上的堿基到每類堿基類的質(zhì)心的距離對每類堿基類進行調(diào)整,得新的堿基類; D、通過新的堿基類對每個堿基位置點上的堿基進行精確堿基識別,得測序圖像中每個堿基位置點上的堿基類型。
10.根據(jù)權(quán)利要求9所述的測序圖像的識別方法,其特征在于,所述步驟B包括 BI、根據(jù)所述熒光信號強度,將每個堿基位置點上的堿基歸類到熒光信號強度最大的熒光信號代表的堿基所在的類,對堿基進行初步堿基識別,得不同堿基類; B2、利用均值法獲得每類堿基類的質(zhì)心,得每類堿基類的質(zhì)心。
11.根據(jù)權(quán)利要求9所述的測序圖像的識別方法,其特征在于,所述測序圖像包括在同一采圖位置上拍攝的多張測序圖像。
12.根據(jù)權(quán)利要求11所述的測序圖像識別方法,其特征在于,所述步驟A包括 Al、從核酸檢測裝置中獲取測序圖像; A2、將同一采圖位置上的測序圖像進行圖像配準(zhǔn),得每個堿基位置點上的熒光信號強度。
13.根據(jù)權(quán)利要求12所述的測序圖像的識別方法,其特征在于,所述步驟A2之后還包括 A3、將每個堿基位置上的熒光信號強度進行歸一化處理。
14.根據(jù)權(quán)利要求9所述的測序圖像的識別方法,其特征在于,所述步驟C包括 Cl、利用歐式距離度量每個堿基位置上的堿基到每類堿基類的質(zhì)心的距離; C2、將堿基歸類到距離其最近的質(zhì)心所在的堿基類,得新的堿基類。
15.根據(jù)權(quán)利要求9至14中任一項所述的測序圖像的識別方法,其特征在于,所述熒光信號強度值在O到4095之間。
全文摘要
本發(fā)明涉及圖像信息處理領(lǐng)域,提供了一種測序圖像的識別系統(tǒng)。所述系統(tǒng)包括堿基處理單元、堿基矯正單元和堿基識別單元。所述堿基處理單元,用于根據(jù)熒光信號強度對每個堿基位置點上的堿基進行初步堿基識別,得不同堿基類,并確定所獲得的每類堿基類的質(zhì)心;所述堿基矯正單元,用于根據(jù)每個堿基位置點上的堿基到每類堿基類的質(zhì)心的距離,得新的堿基類;所述堿基識別單元,用于通過新的堿基類對每個堿基位置點上的堿基進行精確堿基識別,得測序圖像中每個堿基位置點上的堿基類型。本發(fā)明還提供了一種測序圖像的識別方法。本發(fā)明的技術(shù)方案實現(xiàn)了測序圖像中的堿基類型的快速且準(zhǔn)確的識別。
文檔編號G06K9/00GK102676657SQ201210112800
公開日2012年9月19日 申請日期2012年4月18日 優(yōu)先權(quán)日2012年4月18日
發(fā)明者盛司潼 申請人:盛司潼
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1