亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

對微陣列圖像進行自動解碼的方法

文檔序號:6456605閱讀:290來源:國知局

專利名稱::對微陣列圖像進行自動解碼的方法
技術領域
:本發(fā)明涉及在微陣列圖像上自動確定探針點的位置從而可以將圖像數(shù)據(jù)轉換為生物活性的度量的方法。
背景技術
:DNA微陣列技術是新近出現(xiàn)的并且發(fā)展迅速。目前,在全球基因表達項目的系統(tǒng)研究中廣泛使用使用微陣列來推斷基因功能,測量基因拷貝數(shù)的多態(tài)性,以及基因組DNA蛋白質的相互作用。從微陣列圖像中提取數(shù)據(jù)具有許多內在的問題不一致的雜交導致不均勻的探針強度和幾何結構;將芯片放置到掃描儀中的位置不是固定的,這意味著芯片的拐角可以在任何地方;掃描儀經(jīng)常使得到的圖像失真,而這對于將這些圖像轉換為需要的數(shù)據(jù)而言會產(chǎn)生問題;由于同時存在許多不同的設計模式,因此基準可被置于許多不同的組合中。DNA微陣列包括固體表面,單鏈的DNA分子已被化學地結合到該固體表面上。微陣列被廣泛用于研究基因表達,以將基因活動與生物過程關聯(lián)起來并且將基因分組為互連活動的網(wǎng)絡。微陣列是非常有利的,因為它們允許以并行和半自動的方式來測量數(shù)千個基因的表達。在功能基因組學中,存在不同類型的微陣列,包括基因表達陣列、單核苷酸多態(tài)性(SNP)陣列、基因啟動子陣列、比較基因組雜交陣列、CpG島陣列——在此僅提及其中的一些。對于所有這些類型的陣列而言,需要處理掃描的圖像,以恢復微陣列數(shù)據(jù)。作為比較基因組雜交方法[6的例子,代表性寡核苷酸微陣列分析(ROMA)已在冷泉港實驗室(CSHL)被開發(fā)出來。此技術在可獲得的用于在人體基因組中檢查拷貝數(shù)的多態(tài)性(CNP)的分辨率方面是一項非常重大的進步。通過采用具有較少(6個堿基對)識別位點(recognitionsite)的酶來消化基因組,大量差不多均勻分布在該基因組上的片段將會產(chǎn)生。在每個片段中,唯一的探針被識別并被放置在微陣列上的一個點上。目前正在使用具有85000個探針的芯片,而具有大約400000個探針的芯片正在測試中。用該芯片標記和雜交從樣本組織細胞中提取的DNA;強度的變化與樣本中片段的拷貝數(shù)成比例。通過使用此方法,人們能夠識別出腫瘤和正?;蚪M之間的變化,以及正常的人體基因組之間的變化。然而,這些高密度的芯片向可獲得的芯片讀取器提出了挑戰(zhàn)。通過使用步進電機和激光掃描儀,激發(fā)的雜交探針被轉換為圖像,即像素陣列。電機每次將掃描儀移動幾個微米,并且獲得新行讀出。采用這種方法,根據(jù)電機采取的步長,在l、2或5微米的各種分辨率上數(shù)字化微陣列芯片。通過掃描儀的機械和光學操作將圖像中的探針陣列平移和旋轉未知的量。此外,可能存在梯形失真(keystoning)效應(即陣列成為梯形而不是矩形),和/或在探針位置中較小的正弦擾動(也就是說,探針實際上在正弦曲線上對齊,而不是在直線上對齊)。對于具有高密度微陣列的高吞吐量研究而言所需要的是,自動(即沒有人的介入)識別探針位置的軟件,這些探針位置的強度將被轉換為探針強度。目前,正在研究芯片上的探針模式,但是用棋盤模式實現(xiàn)了最大密度。也就是說,必須廢棄一半芯片面積,因為目前的圖像處理軟件不能足夠地分辨探針。如果可以設計出改進的軟件,那么在ROMA芯片上可能實現(xiàn)兩倍的信息密度。在文獻資料中存在其他試圖進行自動微陣列圖像分析的算法。Brandle等人[參考文獻l]和Uehara和Kakadiaris[參考文獻6]都提出了將圖像轉換到期望的數(shù)值所需要的全部功能的方法,并且都倡導使用Radon變換(見下文),但是就我們所知,還未提出用于校正微陣列圖像中梯形失真問題的方法。軟件工具BioDiscoveryImagene7.0聲稱即使在用于多個陣列的批模式處理中也能自動地找到位點以及放置網(wǎng)格,然而這些算法目前不是公用的(http:〃www/biodiscovery.com/index/imagene-cgh)。Khojasteh等人[參考文獻2]提出了一種通過多尺度的邊緣檢測算法[2從陣列CGH數(shù)據(jù)中自動識別DNA拷貝數(shù)的增多和減少的區(qū)域的算法。5在此公開的從微陣列掃描圖像中自動識別拐角和探針的方法克服了這些問題。測試圖像來自ROMA微陣列技術,但是該方法足以普遍地用在其他類型的微陣列圖像上。
發(fā)明內容根據(jù)本發(fā)明,公開了一種在具有圖像空間的高密度和高分辨率微陣列掃描圖像中自動識別微陣列芯片拐角和探針的方法,其中,該方法通過將多遍(multipass)拐角尋找算法應用到所述圖像,使得在掃描過程中產(chǎn)生的圖像中的誤差失真最小化。具體地,本發(fā)明的目的在于提供一種即使在拐角自身處沒有探針的情況下,也能在具有圖像空間的高密度和高分辨率微陣列掃描圖像中自動識別微陣列芯片拐角和探針的方法,其中,該方法通過將多遍拐角尋找算法應用到所述圖像,使得在掃描過程中產(chǎn)生的圖像中的誤差失真最小化,該方法包括將Radon變換應用于輸入的微陣列圖像,以將該圖像投影到角度和距離空間中,其中在該空間中可以找到直線的取向;將快速傅里葉變換應用于步驟(a)的投影圖像,以尋找該投影圖像的最佳傾角;為所述最佳傾角確定最佳的第一個和最后一個局部極大值;將所確定的第一個和最后一個局部極大值反投影到所述圖像空間中,以尋找所述圖像的第一個列線和最后一個列線的第一近似;旋轉所述圖像并重復步驟(a)至(d),以尋找所述圖像的頂部行線和底部行線的第一近似;從所述列線和行線的交點中確定該圖像的所述四個拐角的第一近似;應用啟發(fā)式算法,以確定步驟(f)的第一近似是否足夠;以及可選地,在所述四個拐角的第一近似周圍修剪所述掃描圖像并且重復步驟(a)至(f)。本發(fā)明的另一個目的在于提供一種方法,其中,所述微陣列掃描圖像是從選自由以下項組成的組中的成員所產(chǎn)生的圖像代表性寡核苷酸微陣列分析、基因表達陣列、單核苷酸多態(tài)性陣列、CgP島陣列、啟動子微陣列和蛋白質-DNA相互作用陣列。本發(fā)明的另一個目的在于,提供一種方法,其中,在所述圖像中的誤差失真包括梯形失真效應。本發(fā)明的另一個目的在于,提供一種方法,其中,在所述圖像中的誤差失真包括正弦的或彎曲的探針位置線而不是直的位置線。本發(fā)明的另一個目的在于,提供一種方法,其中,所述掃描圖像的分辨率為1、2或5微米。本發(fā)明的另一個目的在于,提供一種方法,其中,用Cy3和Cy5熒光團掃描所述掃描圖像。本發(fā)明的另一個目的在于,提供一種方法,其中,所述掃描圖像是由包含大約85000個探針到大約400000個探針的芯片產(chǎn)生的。本發(fā)明的另一個目的在于,提供一種進一步包括權利要求1的方法的方法,該方法進一步包括估計一個或多個探針的位置。本發(fā)明的另一個目的在于,提供一種進一步包括權利要求1的方法的方法,該方法進一步包括以子采樣或剪裁的方式處理所述圖像。本發(fā)明的另一個目的在于,提供一種進一步包括權利要求1的方法的方法,該方法進一步包括將所述圖像數(shù)據(jù)轉換為生物活性的度量。參考以下實施例和附圖,更詳細地解釋本發(fā)明的這些和其他方面。圖1示出了ROMA圖像,其中85000個探針以2ym的分辨率掃描(圖像大小為150MB);圖2示出了程序的圖像軸系統(tǒng);圖3示出了尋找拐角(Find—corners)(圖像)算法的偽代碼;圖4示出了用于圖像空間投影的Radon空間;圖5示出了對最佳角度的采樣Radon變換;圖6示出了圖像投影的采樣FFT;圖7示出了對具有基準點的圖像進行Radon變換的例子;圖8示出了圖7所示的投影的放大圖;圖9示出了在ROMA圖像中的估計線。具體實施例方式在此公開的內容提出了一種用于尋找微陣列圖像的拐角以及網(wǎng)格化或尋找微陣列圖像的內部探針的自動方法,該方法有助于將該圖像解碼成數(shù)字。我們使用了圖像處理方法,例如Radon變換和快速傅里葉變換以及若干啟發(fā)式算法來尋找微陣列拐角和探針的精確位置?;谖覀兊募夹g,甚至在拐角處本身沒有探針的布局的情況下,我們能夠將拐角識別到幾個像素內。在圖1中示出了高密度微陣列圖像(在我們的實例中為ROMA圖像)的例子。存在多種探針設計放置方法。迄今所檢查的探針是邊長為16ym的正方形,這些正方形之間具有2Mm的通道。可以以5jLim、2Mm或lMm掃描這些圖像,或甚至小于微米的分辨率被考慮,從而產(chǎn)生每探針具有3、8或16個像素以及每個通道具有0、l或2個像素的圖像。根據(jù)在此公開的方法,啟發(fā)式算法可以通過以下方式用于高密度芯片(即85000400000個探針)1)在水平和垂直方向上對圖像進行子采樣(例如取每兩個像素中的一個像素或每四個像素中的一個像素)。我們還可以取左上角四分之一圖像的一部分,以及右上角四分之一、左下角四分之一和右下角四分之一圖像中的一部分,以便以合理的圖像尺寸開始第一次近似。這也可以基于印制圖案和基準標志。此外,采用多種基準標志圖案(作為非常明亮的探針而可見)來印制芯片。以兩個彩色頻率(通常為Cy3和Cy5熒光團)掃描每個圖像。用于拐角尋找算法的最佳圖像處理結果可以從對總強度圖像,即所述兩個彩色頻率的總和,所進行的分析中獲得。需要自動微陣列圖像解碼,以尋找拐角點、執(zhí)行網(wǎng)格化和解碼為微陣列數(shù)據(jù)。在此過程中,需要智能的圖像處理算法,以矯正由化學反應(即標準化)和掃描過程產(chǎn)生的偽像。所開發(fā)的和以下所描述的軟件的目標在于,自動地在像素坐標中定位探針陣列的四個拐角。采用此信息,假設不存在正弦擾動,雙線性變換可以被用于定位探針形心。用于高密度陣列的ROMA技術是一種新方法,并且目前還不存在處理這些圖像的適當方法。尋找微陣列圖像中的拐角點是進行網(wǎng)格化以在該圖像上尋找探針位置并解碼為微陣列數(shù)據(jù)所需要的第一步驟。成像過程引入偽像并且使圖像歪斜。檢測和補償由掃描過程產(chǎn)生的偽像是重要的。我們設計了多遍算法,以在高分辨率和高密度微陣列圖像中檢測拐角點。該算法包括外循環(huán)和內循環(huán)。外循環(huán)執(zhí)行第一遍(pass)以尋找拐角,倘若8不存在梯形失真(即,探針陣列仍為矩形),那么該第一遍拐角尋找將是準確的。擬合優(yōu)度(goodness-of-fit)度量被計算,并且如果結果令人滿意,那么該算法將報告其結果并停止。如果此測試失敗,那么執(zhí)行內循環(huán)以試圖校正梯形失真。擬合優(yōu)度度量被再次計算,并且如果結果可以接受,那么就報告該結果,否則該算法報告失敗并停止。如圖2所示,所述結果包括以像素為單位的探針陣列拐角的x和y坐標。所述算法使用了Radon變換[5??梢哉J為Radon變換類似于從不同角度觀察果園。當正好以直角觀察時,各行之間的所有樹和通道將清晰可見。如果圖像中的像素是在該角度被總計的,那么會產(chǎn)生清晰和規(guī)則的強度振蕩(見圖7和圖8)。計算Radon變換的傅里葉變換[4,并且使用啟發(fā)式算法標準來識別最佳角度。應用此啟發(fā)式算法以獲得在水平和垂直方向上旋轉的最佳角度。在選定了最佳旋轉角度之后,通過對該角度選擇Radon變換中的第一個和最后一個局部極大值,識別出探針陣列的邊緣。此操作首先在整個圖像上執(zhí)行。然后,如果擬合優(yōu)度測量表明圖像發(fā)生了梯形失真,那么用經(jīng)剪裁的子圖像在水平方向上和/或垂直方向上重復整個過程,以僅檢測不平行的邊緣。圖3示出了用于該算法的偽代碼。用于沿著圖像的最右面和最左面的邊緣來尋找線(findLines)的算法如下我們將Radon變換應用到輸入微陣列圖像。Radon變換將圖像投影到極坐標空間中,即角度和距離空間(e和p),在該空間中,可以找到直線的取向。OOCO—CO—co其中,gOc,力為原始圖像,其作為笛卡兒坐標中的強度陣列,gCo")為經(jīng)Radon變換的圖像,e為旋轉角,p為到軸系統(tǒng)的原點的最小距離,5()為DiraC(函數(shù)。為了最小化計算量,該算法執(zhí)行分級Radon變換,該Radon變換開始于以0.1度的步長將^從-1度到+1度變化。我們的關于來自一個掃描儀的圖像的經(jīng)驗表明,此范圍對于此掃描儀而言是足夠的。其他的具有更多旋轉可變性的掃描儀可能需要擴展此范圍。Radon變換被逐9步地應用到所有的^{-1,-0.9,-0.8,...,l}。圖5示出了對于特定6的Radon變換的采樣投影。我們將快速傅里葉變換應用到每個^曲線,以尋找圖像的傾角。所選擇的傾角《是其FFT包含單頻中最高能量的那個傾角。圖6示出了圖5中所示的投影的FFT。我們選取《并且這次以0.01的步長從《-0.1到《+0.1應用Radon變換并且進行到步驟3。再一次,可能必須改變這些參數(shù)選擇,以用于不同的掃描儀圖像組。對于特定e值的Radon變換的每個應用,我們獲得在P空間上的圖像的垂直投影。對于每個^:(&,...,621),我們獲得單獨的曲線,從該曲線中選擇在其快速傅里葉變換中的單頻中具有最高能量的^作為旋轉的最佳角度。我們尋找最佳角度的Radon變換的局部極大值。下面的圖7示出了對在單頻中具有最高能量的角度的Radon變換。星形表示局部極大值。我們尋找至少達到全局最大值的20%的第一個和最后一個局部極大值。在圖7中的開始處和結束處的小圓圈表示選定的第一個和最后一個局部極大值。可替換地,如果我們找到比平均信號水平高很多的峰值,那么我們接受該峰值為我們的第一個/最后一個局部極大值并且忽略這些極大值周圍的其他峰值(圖7)。這通常發(fā)生于探針周圍具有基準標志的設計中。圖8示出了投影和選定的局部極大值的放大圖。第一列和最后一列由滿足一定標準的第一個和最后一個局部極大值估計得到。這些對于在陣列圖像實際開始之前避免選取噪聲而言是必要的。為了進行該處理,我們僅處理圖像的前三分之一和最后三分之一中的極大值。我們選取其局部平均梯度小于20%的局部極大值的子集。然后,我們尋找第一最大值點,其高度至少為該圖像中間三分之一中的平均強度的25%。這捕獲了典型的陣列邊緣。接著,在存在基準點的情況下,我們測試在該圖像的前(或最后)三分之一中的最大值是否比該圖像的前(或最后)三分之一中的平均值的兩倍大。如果我們獲得了這樣的點,我們指定它們?yōu)榈谝粋€和最后一個有效的極大值,以取代之前找到的極大值。在圖7的開始處和結束處所示的小圓圈表示選定的第一個和最后一個局部極大值。圖8示出了投影和選定的局部極大值的放大圖。我們將對應的第一個和最后一個局部極大值反投影到圖像空間,以尋找經(jīng)過圖像的第一列和最后一列的線的第一近似。此時,我們具有由我們從反投影中找到的點和角度定義的線。這些線是通過最左列和最右列的線。下式將Radon空間中的p映射到圖像空間。圖4用圖形表示了需要執(zhí)行的估計。VCOoog(/7,e)=j"j"g(x,少)cJ(/7—xcos<9—_ysin<9)ix£/;/每個Radon變換具^長度Radon尺寸,該Radon尺寸是Radon變換可以達到的最大可能尺寸。這由下式給出Radon尺寸=^寬度2+高度2用于所有其他角度的Radon變換僅覆蓋了Radon尺寸的陣列的一部分。這由下式給出實際Radon尺寸(sizeActualRadon)=寬度*008(9)+高度*8111(6)對于Radon變換中的每個期望點,其到圖像空間的反投影由下式給出一x—l(RadonLoc-RadonStart)/cos(60-高度氺tan(S)如果<9>0bp—l(RadonLoc-RadonStart)/cos(6)其他我們需要計算在圖像中經(jīng)過此點的線的方程式。_y=+c傾斜角是由執(zhí)行快速傅里葉變換(FFT)后選定為在單頻中具有最高值的6給定的。為了估計方程中常數(shù)c的值,我們使y一,以用于Radon變換的反投影點。因此,接著我們對經(jīng)旋轉的圖像執(zhí)行步驟2-7,以估計經(jīng)過頂部行和底部行的線。為了找到拐角的第一近似,我們尋找四條線(頂部、底部、左邊和右邊)的交點。通過以上步驟,我們具有這四條線的方程式,并且我們求解這四個方程式,以估計這四個拐角點。接下來,我們測試估計的拐角是否合適。為此目的,我們再次使用Radon變換。對于選定的6的Radon變換的FFT,計算全局最大值與全局最大能量頻率自身周圍的能量總和的比值,該比值由以下等式計算得到[最大能量i]-max(fft)最大能量和-sum(fft(i-10:i+10))r產(chǎn)最大能量和/最大能量如果此比值rj在選定的閾值(基于若干實驗以及估計哪個適用,啟發(fā)式地將該閾值選為0.4)以下,那么我們在第一近似周圍修剪該圖像并且再次應用Radon變換。重復以上過程,并且如果甚至在第二輪中,此比值仍在選定的閾值以下,那么返回失敗。我們使用了具有各種分辨率的測試圖像來測試我們的算法。在表1中提供了各種測試圖像和它們的分辨率。在許多情況下,Cy5和Cy3是兩個被捆綁在一個tiff文件中的圖像??傆嫓y試了14個圖像。掃描分辨率圖像的數(shù)量圖像號5,91-92戶2+2*10-111拜112表l測試圖像和它們的分辨率表2示出了表l中所引用14個圖像中的12個圖像的拐角的真實數(shù)據(jù)(groundtruth)位置。對于以下計算沒有考慮在圖1中表示為2*的以2^"掃描的兩個圖像,因為所述算法返回失敗。這兩個圖像被沖洗(washout),而且所述算法不能較好地估計旋轉角度,并且在對剪裁的圖像執(zhí)行了Radon變換之后,在步驟9中宣告失敗。真實數(shù)據(jù)是通過人工觀察MATLAB圖中的圖像和以右上方的探針為中心而估計出來的。在不存在探針的情況下,線被繪制,并且拐角點被確定為這些線的交點。對于圖像ll,ROMA芯片的雜交出現(xiàn)問題,拐角被沖洗并且不能被人工估計(在表中標識為"無")。對于這樣的情況,擁有自動化的方法是非常寶貴的,因為對于操作員而言不可能找到拐角。用于精度計算的圖像ll的真實數(shù)據(jù)被取為與圖像10的真實數(shù)據(jù)相同,圖像10是C3y熒光團的掃描。真實數(shù)據(jù)的拐xlx2x3x4yiy2y3y4角12<table>tableseeoriginaldocumentpage13</column></row><table>表212個圖像的拐角的真實數(shù)據(jù)位置表3示出了通過所述算法和用于每個圖像的表2中的真實數(shù)據(jù)值得到的估計拐角和拐角估計值之間的總絕對差(TAD)。例如,對于圖像1,表3中的TAD是如此計算出來的,即對表2和表3中的xl(或105.3-105=0.3);x2(或80-80=0);x3(2690.3-2690=0.3);x4(2665-2665=0);y1(50.4-50=0.4);y2(3504.4-3504=0.4);y3(64.6-64.1=0.5);和y4(3519.5-3519-0.5)取絕對差的和。因此,通過相加這些絕對差,圖像1的TAD為2.4。圖9示出了在ROMA圖像中估計線和估計拐角的例子。這是程序的可視化輸出,其中我們可以看到疊加在實際ROMA陣列上的估計線和估計拐角。<table>tableseeoriginaldocumentpage13</column></row><table>470.574.42656.52660.446.13500.140.93494.96.3570.574.42655.52659.446.63499.640.53493.53.7686.4卯.62669.42673.6111.83564.8105.23558.27.3780.282.92665.22667.9152.93606.9148.23602.26.88596226442647113.53567.5108.53562.53974.376.72657.32659.752.93505.951.13504.15.710421.3397.97239.57216.1265.58658.12008592.67.211421.3397.97239.57216.1265.58658.12008592.62.3121010.4992.51423814220512.917568377.8174335.45表3拐角的估計位置以及從整個圖像的用于拐角的真實數(shù)據(jù)中得到的總絕對差表4示出了每個估計像素的差異(DPEP)值以及作為探針尺寸的百分比的該值。這是在每個不同的掃描分辨率中的所有絕對差的和除以八倍的圖像數(shù)目(我們?yōu)槊總€圖像估計八個值)所得到的。每個探針是邊長為16Mm的正方形。所以,在5jLim處,每個探針大約有3x3個像素。=Z7MD/(圖像總數(shù)*8)掃描尺寸每個估計值的差值每個探針的像素(16mm寬)探針尺寸的百分比5ym0.6097223x320.324072Mm0.593758x87.4218751jlim1.362516x168.515625表4每個估計值的絕對差以及作為探針尺寸的百分比因此,通過使用Radon變換,我們能夠精確地估計高密度ROMA圖像的拐角。在目前的數(shù)據(jù)集中,最大差值大約為探針尺寸的20%。這正意味著,為了找到最佳擬合的網(wǎng)格,在估計拐角周圍的搜索區(qū)域最多需要是大約幾個像素。這將免去為了找到圖像的網(wǎng)格點而對人工介入的需要,從而允許此技術的大量部署。根據(jù)本發(fā)明的在此公開的方法給出了使高分辨率的ROMA圖像轉換到數(shù)字的整個過程自動化的良好前景。除了與ROMA—起使用,本公開的方法還可以考慮與不同種類的陣列一起使用,這些不同種類的陣列包括基因表達陣列、單核苷酸多態(tài)性(SNP)陣列、CpG島陣列、啟動子微陣列、蛋白質-DNA相互作用陣列和其他包括在拐角上具有"空白"探針的、用人工方法非常難估計的微陣列的陣列。此外,借助與Radon變換結合的快速傅里葉變換,可以發(fā)現(xiàn)正弦波,該正弦波可能發(fā)生在掃描儀以高分辨率工作的時候。此外,我們相信我們的算法的擴展將可能使微陣列上的容量翻一倍,并且可以使用芯片上的所有地方,而不是如現(xiàn)在所使用的以使探針能正確被讀取的棋盤模式。與上述僅對直線進行Radon投影的方法相類似,為了補償正弦變化,我們可以沿著變化頻率的正弦曲線、在不同的相位處和在不同的幅度處投影圖像,以尋找最合適的正弦曲線和旋轉角度。此方法將能夠對正弦變化進行補償并且能夠以更佳的精度定位探針。需要這樣的投影,以尋找所選擇的Radon變換的局部極小值,并且查看極小值的和是否在闞值之內。在沒有正弦變化的情況下,這些極小值接近于0。否則,將存在比背景噪聲大一點的值,該值可以觸發(fā)此正弦變化補償步驟被執(zhí)行。為了估計探針,我們?yōu)樽罴呀嵌?、頻率、相位和幅度尋找Radon變換的局部極大值,并且在水平和垂直兩個方向上將這些局部極大值投影回成像空間中。這些線的交點給出了探針的位置。本公開的方法還可以考慮用于1)以子采樣或剪裁的方式處理圖像,以改善處理的速度一一這在較高密度或批處理中將是十分重要的;2)對解碼到數(shù)據(jù)進行處理。一種選擇是在空間域中解碼剪裁的矩陣。這也可以基于傅里葉變換數(shù)據(jù)來實現(xiàn)。雖然已經(jīng)關于本發(fā)明的具體實施例描述了本發(fā)明,但是本領域技術人員應當認識到,在不偏離本發(fā)明的精神和范圍的情況下,可以實現(xiàn)許多修改、改進和/或改變。因此,明確的是本發(fā)明僅由權利要求書及其等同物的范圍限定。權利要求1.一種在具有圖像空間的高密度和高分辨率微陣列掃描圖像中自動識別微陣列芯片的拐角和探針的方法,該方法包括以下步驟(a)將Radon變換應用于輸入的微陣列圖像,以將該圖像投影到角度和距離空間中,在該空間中可以找到直線的取向;(b)將快速傅里葉變換應用于步驟(a)的所述投影圖像,并且應用啟發(fā)式算法,以尋找該投影圖像的最佳傾角;(c)應用啟發(fā)式算法,以為所述最佳傾角確定最佳的第一個和最后一個局部極大值;(d)將所確定的第一個和最后一個局部極大值反投影到所述圖像空間中,以尋找所述圖像的第一個列線和最后一個列線的第一近似;(e)旋轉所述圖像并重復步驟(a)至(d),以尋找所述圖像的頂部行線和底部行線的第一近似;(f)從所述列線和行線的交點中確定所述圖像的四個拐角的第一近似;(g)應用啟發(fā)式算法,以確定步驟(f)的所述第一近似是否足夠;以及(h)可選地,在所述四個拐角的第一近似周圍修剪所述掃描圖像并且重復步驟(a)至(f)。2.根據(jù)權利要求1所述的方法,其中,所述微陣列掃描圖像是從選自由以下項組成的組中的成員所產(chǎn)生的圖像代表性寡核苷酸微陣列分析、基因表達陣列、單核苷酸多態(tài)性陣列、CgP島陣列、啟動子微陣列和蛋白質-DNA相互作用陣列。3.根據(jù)權利要求1所述的方法,其中,在所述圖像中的誤差失真包括梯形失真效應。4.根據(jù)權利要求1所述的方法,其中,在所述圖像中的誤差失真包括正弦的或彎曲的探針位置線而不是直的位置線。5.根據(jù)權利要求1所述的方法,其中,所述掃描圖像的分辨率為1、2或5微米。6.根據(jù)權利要求1所述的方法,其中,用Cy3和Cy5熒光團掃描所述掃描圖像。7.根據(jù)權利要求1所述的方法,其中,所述掃描圖像是由包含大約85000個探針到大約400000個探針的芯片產(chǎn)生的。8.根據(jù)權利要求1所述的方法,該方法進一步包括估計一個或多個探針的位置的步驟。9.根據(jù)權利要求1所述的方法,該方法進一步包括以子采樣或剪裁的方式處理所述圖像的步驟。10.根據(jù)權利要求1所述的方法,該方法進一步包括將所述圖像數(shù)據(jù)轉換為生物活性度量的步驟。全文摘要一種在具有圖像空間的高密度和高分辨率微陣列掃描圖像中,即使在拐角處不存在探針的情況下也能自動識別微陣列芯片的拐角和探針的方法,其中,該方法通過將多遍拐角尋找算法應用到所述圖像上使得在掃描過程中產(chǎn)生的圖像中的誤差失真最小化,所述方法包括(a)將Radon變換應用于輸入的微陣列圖像,以將該圖像投影到角度和距離空間中,在該空間中可以找到直線的取向;(b)將快速傅里葉變換應用于步驟(a)的所述投影圖像10,以尋找該投影圖像的最佳傾角;(c)確定所述最佳傾角的最佳第一個和最后一個局部極大值;(d)將所述確定的第一個和最后一個局部極大值反投影到所述圖像空間中,以尋找所述圖像的第一個列線和最后一個列線的第一近似;(e)旋轉所述圖像并重復步驟(a)至(d),以尋找所述圖像的頂部行線和底部行線的第一近似;(f)從所述列線和行線的交點中確定所述圖像的四個拐角的第一近似;(g)應用啟發(fā)式算法,以確定步驟(f)的所述第一近似是否足夠;以及(h)可選地,在所述四個拐角的第一近似周圍修剪所述掃描圖像并且重復步驟(a)至(f)。文檔編號G06K9/32GK101553824SQ200780044539公開日2009年10月7日申請日期2007年12月3日優(yōu)先權日2006年12月1日發(fā)明者J·D·沙弗,L·阿尼霍特里,N·蒂米特羅瓦申請人:皇家飛利浦電子股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1