一種基于質(zhì)譜信息的生物特征圖像識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于可視化質(zhì)譜信息技術(shù)的復(fù)雜樣本快速識(shí)別方法。
【背景技術(shù)】
[0002]復(fù)雜生物樣本的識(shí)別是當(dāng)今各個(gè)研究領(lǐng)域最有挑戰(zhàn)的課題之一。復(fù)雜樣本含有多個(gè)化學(xué)成分,化合物的種類(lèi)繁多,物理和化學(xué)性質(zhì)差異很大。利用這些化合物的信息識(shí)別復(fù)雜樣本,并對(duì)其進(jìn)行歸類(lèi),在動(dòng)植物品種的判斷、疾病的診斷等領(lǐng)域具有強(qiáng)烈的需求。質(zhì)譜是一種可用來(lái)識(shí)別復(fù)雜樣品的有效技術(shù)。特別是和色譜技術(shù)聯(lián)用后,它能夠?qū)?fù)雜樣品進(jìn)行分離和檢測(cè),獲取樣品中各個(gè)化合物的母離子與子離子的質(zhì)譜信息如質(zhì)荷比和電荷數(shù)等,其優(yōu)點(diǎn)是快捷、靈敏和準(zhǔn)確,因而是蛋白質(zhì)組學(xué)和代謝組學(xué)的主要工具,也是食品與藥品檢測(cè)、疾病診斷和環(huán)境監(jiān)測(cè)等研究領(lǐng)域的主要工具之一。目前,利用質(zhì)譜或色譜-質(zhì)譜進(jìn)行模式識(shí)別的技術(shù)如指紋譜技術(shù)和組學(xué)技術(shù)正在蓬勃發(fā)展,但是,基于它們的識(shí)別模式均是以信號(hào)為中心法則所發(fā)展起來(lái)的識(shí)別,要么可靠性差,數(shù)據(jù)維度低,信息不夠豐富,要么特別依賴專業(yè)人士對(duì)于信息的解讀,因此特別需要發(fā)展快速、準(zhǔn)確的復(fù)雜樣品識(shí)別技術(shù)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明要解決的技術(shù)問(wèn)題是一種基于質(zhì)譜信息的質(zhì)譜特征圖像識(shí)別方法,本發(fā)明改變傳統(tǒng)的方法,從生物樣本的色譜-質(zhì)譜信息轉(zhuǎn)化為m/z-t-1圖像,體現(xiàn)各個(gè)化合物的質(zhì)量差異,通過(guò)識(shí)別圖像的輪廓和紋理等空間信息,提高識(shí)別生物樣本的效率。
[0004]為了解決上述技術(shù)問(wèn)題本發(fā)明提供一種基于質(zhì)譜信息的生物特征圖像識(shí)別方法,其特征在于構(gòu)建生物樣本中的質(zhì)譜信息所組成的圖像,對(duì)圖像進(jìn)行識(shí)別,依次對(duì)樣本進(jìn)行分類(lèi)。按以下步驟進(jìn)行:
[0005]I)對(duì)所要比較的樣本,以規(guī)范、可重復(fù)的方法進(jìn)行提取和處理。
[0006]2)將處理后的樣品利用高效色譜-質(zhì)譜儀進(jìn)行分析,獲取原始色譜和質(zhì)譜信息。
[0007]3)將原始色譜和質(zhì)譜信息轉(zhuǎn)換為m/z-t-1數(shù)據(jù)矩陣。
[0008]4)利用計(jì)算機(jī)處理技術(shù),計(jì)算和比較樣本之間的相似度,判斷樣本之間的相互關(guān)系O
[0009]5)將m/z-t-1數(shù)據(jù)矩陣轉(zhuǎn)化為如圖1所示的m/z-t-1圖像,提取圖像中的點(diǎn),紋理和輪廓。
[0010]6)發(fā)現(xiàn)和比較樣本之間的特征區(qū)域,發(fā)現(xiàn)用于不同組樣本的標(biāo)志性圖像信息。
[0011]本發(fā)明為生物特征的識(shí)別提供一個(gè)更加有力的工具,本發(fā)明總結(jié):
[0012]1.本發(fā)明采用采用圖像處理技術(shù),將樣本各個(gè)化合物之間的質(zhì)量和保留時(shí)間的關(guān)聯(lián)性轉(zhuǎn)化為空間關(guān)系,針對(duì)由該空間關(guān)系所展示的紋理和輪廓進(jìn)行識(shí)別,具有識(shí)別能力高,提取特征容易的優(yōu)點(diǎn)。
[0013]2.本發(fā)明全面利用了樣本中各個(gè)化合物的質(zhì)量信息,而不需要對(duì)各個(gè)化合物進(jìn)行鑒定,能夠大大提尚識(shí)別效率。
[0014]3.與常用于分類(lèi)的指紋圖譜法指紋圖譜法、質(zhì)譜指紋圖譜法相比,本發(fā)明增加了分離這一維度,具有更高的分辨率和識(shí)別效率。
[0015]4.與色譜-質(zhì)譜指紋圖譜法或基于組學(xué)技術(shù)的分類(lèi)法相比,本發(fā)明更充分利用了各個(gè)化合物之間的質(zhì)量的相關(guān)性,比較的過(guò)程簡(jiǎn)單且直接。
[0016]—種基于空間聚類(lèi)質(zhì)譜信息的復(fù)雜生物樣本快速識(shí)別技術(shù)。包括步驟:首先對(duì)樣本進(jìn)行色譜-質(zhì)譜分析,獲取樣本中化合物的質(zhì)量信息(質(zhì)荷比m/z),色譜保留信息(t)和質(zhì)譜信號(hào)強(qiáng)度(I) ;Wm/Z和t為坐標(biāo),畫(huà)出樣本的質(zhì)量-時(shí)間圖像,每個(gè)可測(cè)化合物在該圖像中均有特定的空間位置,化合物的質(zhì)譜信號(hào)強(qiáng)度以點(diǎn)的色度值表示;生成的m/z-t-1圖像適用于樣本的識(shí)別,通過(guò)從圖像中抽提整體空間信息和局部空間信息如輪廓、紋理或色度,將樣本中的生物特征轉(zhuǎn)化為空間特征,每個(gè)化合物組成或豐度不同的樣本將顯示出特異性的空間信息;選擇和比較m/z-t-1圖像中在空間上緊密聚類(lèi)的數(shù)據(jù)點(diǎn),發(fā)現(xiàn)圖像的特征區(qū)域,進(jìn)行相似性分析,用于樣本的識(shí)別和性質(zhì)判斷。本發(fā)明突破了以質(zhì)譜信號(hào)強(qiáng)度識(shí)別樣本的方法或只以少量指標(biāo)性化合物的質(zhì)譜信息識(shí)別樣本的方法,創(chuàng)造性地利用了由復(fù)雜樣本中各個(gè)化合物質(zhì)譜特征所形成的空間信息,大大提高了基于質(zhì)譜的復(fù)雜樣本識(shí)別能力,對(duì)于藥物或食品的甄別,疾病的診斷等多個(gè)領(lǐng)域具有廣闊的應(yīng)用前景。
【附圖說(shuō)明】
[0017]圖1黃芪和淫羊藿顯示的m/z-t-1圖像。
【具體實(shí)施方式】
[0018]本發(fā)明突破了以質(zhì)譜信號(hào)強(qiáng)度識(shí)別樣本的方法或只以少量指標(biāo)性化合物的質(zhì)譜信息識(shí)別樣本的方法,創(chuàng)造性地利用了由復(fù)雜樣本中各個(gè)化合物質(zhì)譜特征所形成的空間信息,大大提高了基于質(zhì)譜的復(fù)雜樣本識(shí)別能力,對(duì)于藥物或食品的甄別,疾病的診斷等多個(gè)領(lǐng)域具有廣闊的應(yīng)用前景。
[0019]現(xiàn)結(jié)合實(shí)施例和附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)說(shuō)明,實(shí)施例僅限于說(shuō)明本發(fā)明,而非對(duì)本發(fā)明的限定。
[0020]本發(fā)明中,質(zhì)譜圖像來(lái)自特性已知或未知的樣本,從質(zhì)譜圖像由色譜-質(zhì)譜聯(lián)用儀采集后經(jīng)軟件處理生成。作為演示,下述很多例子中都使用中藥作為對(duì)象進(jìn)行模式識(shí)別和分類(lèi)。但是,在本發(fā)明的某些實(shí)施例,用來(lái)分析的樣本可能是源自任何生物體的對(duì)象或其它可由色譜-質(zhì)譜進(jìn)行分析的多成分樣本。
[0021]在本發(fā)明中,產(chǎn)生的每一個(gè)質(zhì)譜圖像至少含色譜分離信息和質(zhì)量信息。色譜分離信息可以由保留時(shí)間或保留時(shí)間的函數(shù)表示。質(zhì)量信息可以以質(zhì)荷比,分子量,或由質(zhì)荷比計(jì)算得到的質(zhì)量數(shù),或任意以由質(zhì)荷比相關(guān)函數(shù)所表示的質(zhì)量信息。用于分離樣本的儀器包括但不局限于色譜儀,氣象色譜儀,毛細(xì)管電泳儀和薄層層析等。測(cè)定質(zhì)荷比的儀器可以包括但不局限于時(shí)間飛行質(zhì)譜儀,軌道阱質(zhì)譜儀,傅里葉變換離子回旋共振質(zhì)譜儀等。
[0022]在m/z-t-1質(zhì)譜圖像中,每個(gè)化合物的質(zhì)譜信號(hào)強(qiáng)度數(shù)據(jù)以不同灰度或色度的點(diǎn)表示;質(zhì)譜信號(hào)強(qiáng)度數(shù)據(jù)也可以以“峰值”進(jìn)行表示。圖1顯示的是以灰度點(diǎn)表示的m/z-t-1質(zhì)譜圖像,每個(gè)化合物對(duì)應(yīng)的點(diǎn)均有對(duì)應(yīng)的m/z和t坐標(biāo)值。在某些實(shí)施例中,信號(hào)強(qiáng)度的大小不作為分類(lèi)或識(shí)別的參數(shù),化合物對(duì)應(yīng)點(diǎn)的灰度值或色度值可設(shè)定為一致。
[0023]在本發(fā)明中,需要對(duì)圖像進(jìn)行分割后進(jìn)行分析。分割后圖像單元的大小取決于質(zhì)譜數(shù)據(jù)的分辨率和準(zhǔn)確度以及色譜保留時(shí)間的可重復(fù)性。根據(jù)質(zhì)譜儀器的性能,圖像的質(zhì)量分辨率可設(shè)定在0_2Da之間。采集質(zhì)量數(shù)據(jù)的質(zhì)譜儀器高分辨率和高準(zhǔn)確度越高,圖像分析可設(shè)定的質(zhì)量分辨率也越高。例如,由普通的離子阱質(zhì)譜儀所獲得數(shù)據(jù),圖像的質(zhì)量分辨率可設(shè)在2Da,但對(duì)于由高分辨的軌道阱質(zhì)譜儀所獲取的數(shù)據(jù),圖像的質(zhì)量分辨率可設(shè)為1ppm0
[0024]圖像分析的時(shí)間分辨率由樣本之間色譜保留時(shí)間的差異性所決定,差異性越小,可設(shè)定的時(shí)間分辨率越高。由于色譜儀器自身原因,不同樣本的分離保留時(shí)間可產(chǎn)生程度不同的偏差。在某些實(shí)施例中,樣本之間的保留時(shí)間偏差可以由軟件進(jìn)行校正,對(duì)于樣本特性差異過(guò)大的樣本,不同樣本中可以加入混合內(nèi)標(biāo),由軟件根據(jù)內(nèi)標(biāo)的保留時(shí)間對(duì)整個(gè)樣本的色譜保留時(shí)間進(jìn)行校正。
[0025]樣本之間的相似性越高,表示具有共同的特性越多。相似性分析的結(jié)果可用來(lái)預(yù)測(cè)一個(gè)未知樣本是否歸屬于一類(lèi)具有特定的樣本??勺R(shí)別的特性包括,但并不僅限于,圖像的整體輪廓,圖像的整體紋理,某個(gè)特定區(qū)域內(nèi)輪廓與紋理,一組相鄰或非相鄰的圖像單元所組成的輪廓、紋理、空間關(guān)系,一個(gè)或一組圖像單元的峰高或色差等??勺R(shí)別的特性包括單一特性或一組特性。這種特性可用于區(qū)分不同的樣本,如不同種屬的植物,患病和正常的受試者,受污染的水和正常的水,不同廠家生產(chǎn)的同一類(lèi)的食品和藥品等。
[0026]復(fù)雜生物樣品是指該樣本中是含有多種物質(zhì)的混合體,其形態(tài)可以是固態(tài)、液態(tài)、氣態(tài)或混合態(tài)。不同樣本的差異性是指化合物的組成或含量有區(qū)別。任何源自天然的含混合有機(jī)物樣本均可以用于本發(fā)明的實(shí)施例。這些樣本包含但不局限于植物的根、莖、葉、皮、花、果、種子等以及它們的組織與各種加工品等;人和動(dòng)物血液、血清、血漿、乳汁、淚、唾液、精液、