用于設(shè)計生物模型的計算機實現(xiàn)的方法
【專利說明】用于設(shè)計生物模型的計算機實現(xiàn)的方法
[0001]本發(fā)明涉及計算機程序和系統(tǒng)領(lǐng)域,并且更具體地涉及合并或組合生物模型的領(lǐng)域。生物模型通過表示分子(或?qū)嶓w或元素)以及它們之間的交互來描述某種生物現(xiàn)象。
[0002]這種系統(tǒng)旨在分析模型、設(shè)計模型、或者模擬和理解復(fù)雜的正常的和病態(tài)的生命系統(tǒng)的突現(xiàn)特征以提出一種全局動態(tài)的和預(yù)測性的愿景。
[0003]合并過程在于選擇來自輸入模型中的哪些實體必須被聚集在輸出模型中。
[0004]圖1、2和3圖示了模型A(圖1)和B(圖2)的組合以傳遞出輸出模型AB(圖3)。在此示例中,公共的實體被命名為Mp和PO。在這些圖中,方形表示實體間的交互。輸出模型AB取決于應(yīng)當(dāng)在A和B兩個模型中識別出哪些實體。
[0005]由于多種原因(相同的生物現(xiàn)象可能具有不同的建模,模型可能已經(jīng)由不同的人制成,具有不同的命名約定,……),這一系列選擇是一種不平凡的過程。很多準(zhǔn)則可以用于幫助做出這些選擇,例如分子名稱、注釋或圖形拓?fù)洹?br>[0006]注釋是附接于模型元素的額外數(shù)據(jù),它們將非結(jié)構(gòu)化的信息添加至模型,主要使用文本格式。例如,注釋可用于對公共數(shù)據(jù)庫的參考。這種數(shù)據(jù)庫在生物信息學(xué)領(lǐng)域是非常常用的。
[0007]商標(biāo)Uniprot提供的數(shù)據(jù)庫是大型且廣泛使用的蛋白質(zhì)數(shù)據(jù)庫的一個示例。每個數(shù)據(jù)庫具有它自己的唯一的標(biāo)識符語法。例如,模型的蛋白質(zhì)可以具有注釋“uniprot:P38731”。標(biāo)識符“P38731”是Uniprot特有的并且是指Uniprot數(shù)據(jù)庫中的對象:http://www.uniprot.0rg/uniprot/P38731 ( “含鐵細(xì)胞鐵輸送者ARN1”)。由于這些注釋是由用戶在沒有進行任何一致性檢查的情況下添加的,因此它們可能包含很多錯誤。此外,一些復(fù)制品或歧義存在于公共數(shù)據(jù)庫中。這兩點解釋了為什么即使使用完全注釋的模型,合并也不是一個簡單的過程。
[0008]合并過程要么可人工進行要么可由算法自動進行,在這種情況下結(jié)果可能包含錯誤,并且因此需要人工修正。
[0009]本發(fā)明允許用戶查閱此合并過程,并允許用戶改正所提出的結(jié)果。
[0010]在系統(tǒng)生物合并領(lǐng)域中的一種已知的先進工具是已知商標(biāo)為SemanticSBML的軟件,它是一種在線工具,允許用戶要么從商標(biāo)為B1Models的資源庫提供的模型數(shù)據(jù)庫中要么從用戶硬盤中選擇生物模型,并將它們組合。該操作的目的是產(chǎn)生單個輸出模型。
[0011]合并用戶界面被呈現(xiàn)為一表格,如圖4中所示,每列表示一個模型。每行表示輸出模型的一個元素。如果一行僅為一個輸入模型填充,那么這意味著一個元素被簡單地復(fù)制到輸出模型(例如,截屏中的ACh)。如果對于同一行來說多列被填充,那么這意味著這組輸入模型實體將導(dǎo)致輸出模型中的單個實體或元素(例如,在截屏中,來自模型I的BasalACh2和來自模型2的BasalACh2將被組合)。
[0012]對于每行,用戶可以使用復(fù)選框選擇要么保留要么拒絕該組。該應(yīng)用還允許用戶取消合并組,并根據(jù)來自輸入模型的預(yù)先選擇的元素創(chuàng)建新組。
[0013]使用現(xiàn)有的解決方案,在不暗含來自用戶的大量交互的情況下不可能將元素從一個合并組改變至另一組,這對應(yīng)著所實現(xiàn)方法的大量步驟。例如,如果元素A需要被添加至預(yù)先存在的合并組{B,C,D},那么用戶必須:
[0014]-分解組{B,C,D},
[0015]-選擇A,然后B,然后C,然后D,以及
[0016]-點擊“match selected” 命令。
[0017]對于該應(yīng)用的可用性和生產(chǎn)率來說,進行簡單操作所需的交互數(shù)量是一個主要缺陷。
[0018]在圖5至10中展示了使用SemanticSBML進行的這一操作的示例。在圖5中,第一模型的元素EGF關(guān)聯(lián)于第二模型的元素EGFR,并且第一模型的元素EGFR關(guān)聯(lián)于第二模型的元素EGF。為了改正這一錯誤,需要八次點擊(點擊由虛線圓圈表示):
[0019]-一次點擊用于分解第一組“EGF/EGFR” ;
[0020]-一次點擊用于分解第二組“EGFR/EGF” ;
[0021]-兩次點擊用于從每個模型中選擇EGF,然后一次點擊用于創(chuàng)建具有它們的新組(“match selected”);
[0022]-兩次點擊用于從每個模型中選擇EGFR;以及
[0023]-—次點擊用于創(chuàng)建具有它們的新組(“matchselected”)。
[0024]本發(fā)明的一個目標(biāo)是提供一種計算機實現(xiàn)的方法和系統(tǒng)以克服上述問題,尤其是大幅地限制拖放操作的數(shù)量。
[0025]根據(jù)本發(fā)明的一個方面,提出了一種用于設(shè)計生物模型的計算機實現(xiàn)的方法,包括以下步驟:
[0026]-提供生物模型集合,每個生物模型包括多個元素以及元素間的交互;
[0027]-提供被識別為相同的元素的組,每個元素具有相關(guān)聯(lián)的生物模型;
[0028]-將元素從第一組移動至第二組以改正元素的分組;
[0029]-更新這兩個組;以及
[0030]-根據(jù)所更新的組合并所述生物模型集合以創(chuàng)建組合的模型。
[0031]這一方法允許用戶簡化生物模型的合并,并限制改正所提供的元素組所必須的操作的數(shù)量。本方法生產(chǎn)率更高并且更易于使用。
[0032]除了特定“未分組元素”組和可用空組的存在之外,這種單個移動交互給予用戶表達(dá)整組合并組合的能力同時限制了用戶交互的數(shù)量。
[0033]根據(jù)一個實施例,提供被識別為相同的元素的組的步驟使用附接至生物模型的注釋。
[0034]注釋的使用給予了用于處理合并建議的列表的識別線索。
[0035]根據(jù)一個實施例,提供生物模型集合的步驟使用至少一個外部數(shù)據(jù)庫。
[0036]對數(shù)據(jù)庫進行訪問允許使用具有不受限數(shù)量的生物模型的訪問數(shù)據(jù)庫,只要它們被放在這些數(shù)據(jù)庫中即可。
[0037]根據(jù)一個實施例,該方法包括以下步驟:在接受相應(yīng)合并建議的情況下,使用公共注釋在公共元素周圍部分地表示生物模型。
[0038]從而可能的是:將組合模型中的與用戶當(dāng)前正在處理的元素相對應(yīng)的部分可視化,并理解該元素的鄰域的合并的結(jié)果。
[0039]根據(jù)一個實施例,將一元素從第一組移動至第二組以改正元素的分組的步驟避免了當(dāng)非空時破壞第一組或第二組的中間步驟。
[0040]這一方法提高了效率,并限制了計算機處理的時間。
[0041]根據(jù)一個實施例,將一元素從第一組移動至第二組以改正元素的分組的步驟是由拖放技術(shù)執(zhí)行的。
[0042]因此,這是一種執(zhí)行此步驟的簡單方式。
[0043]根據(jù)一個實施例,將一元素從第一組移動至第二組以改正元素的分組的步驟包括創(chuàng)建臨時空組的步驟。
[0044]因此,這是一種使用同種用戶交互執(zhí)行創(chuàng)建新組的簡單方式。
[0045]根據(jù)一個實施例,該方法包括以下步驟:例如使用復(fù)選框或提示框來對組進行激活/取消激活。
[0046]根據(jù)一個實施例,在一個組中,元素由各自的表示來區(qū)分,例如專用顏色、圖標(biāo)或圖案。
[0047]根據(jù)本發(fā)明的另一方面,提出了一種計算機可讀介質(zhì),具有計算機可執(zhí)行指令以使得計算機系統(tǒng)執(zhí)行上述用于設(shè)計生物模型的方法。
[0048]根據(jù)本發(fā)明的另一方面,提出了一種計算機程序產(chǎn)品,存儲在計算機可讀介質(zhì)上,用于設(shè)計生物模型,包括使得該系統(tǒng)采取上述步驟的代碼模塊。
[0049]根據(jù)本發(fā)明的另一方面,提出了一種用于設(shè)計生物模型的裝置,包括用于執(zhí)行上述方法的步驟的模塊。
[0050]通過研宄以非限制性示例的方式描述的以及由附圖進行圖示的一些實施例,將會更好地理解本發(fā)明,其中:
[0051]-圖1到10圖示了用于組合或合并生物模型的現(xiàn)有技術(shù);
[0052]-圖11到26圖示了根據(jù)本發(fā)明一個方面的用于設(shè)計生物模型的計算機實現(xiàn)的方法的示例;
[0053]-圖27圖示了可以實現(xiàn)本發(fā)明的計算機網(wǎng)絡(luò)或相似數(shù)字處理環(huán)境;以及
[0054]-圖28圖示了計算機的內(nèi)部結(jié)構(gòu)圖。
[0055]下圖更詳細(xì)地解釋了本發(fā)明的運作。
[0056]在由用戶選擇了用于組成合并模型的生物模型之后,使用局部視圖顯示來自這些模型的元素。在圖11中,每個元素由它的名字以及例如在小長方形中具有特定填充的圖案表示,所述圖案指示該元素的原始模型。
[0057]如果不同的模型元素顯示為被分組的,那么這意味著它們可能會被合并在一起。這樣的一組命名為一個“合并組”。圖11表示一個合并組。
[0058]合并組還包括復(fù)選框。如果用戶想要考慮合并提議,那么可以勾選該復(fù)選框,或者如果用戶想要忽略合并提議,那么可以不勾選該復(fù)選框。
[0059]如果該合并過程僅為人工進行,向用戶顯示初始列表,該初始列表具有的合并組與元素的總數(shù)一樣多,每組包含一個模型元素,例如圖12所示的。如果提供了一種合并算法,列表的初始化來自于該算法的結(jié)果,例如圖13所示的。
[0060]本方法的特定特征關(guān)注于用于修改合并提議列表的方式。圖1