生物信息項(xiàng)目的自動(dòng)化分析方法及系統(tǒng)的制作方法
【專利摘要】公開了一種生物信息項(xiàng)目的自動(dòng)化分析方法,包括步驟:創(chuàng)建項(xiàng)目并存于業(yè)務(wù)管理系統(tǒng)中,每個(gè)項(xiàng)目包括多個(gè)子項(xiàng)目;當(dāng)子項(xiàng)目的類型為只過濾子項(xiàng)目,即根據(jù)預(yù)設(shè)的參數(shù)配置運(yùn)用統(tǒng)一的過濾標(biāo)準(zhǔn)對(duì)經(jīng)測(cè)序儀測(cè)序完成后的樣品下機(jī)數(shù)據(jù)進(jìn)行過濾與分析,生成分析結(jié)果;當(dāng)子項(xiàng)目的類型為標(biāo)準(zhǔn)化子項(xiàng)目,則該子項(xiàng)目對(duì)應(yīng)的樣品在經(jīng)測(cè)序儀測(cè)序的同時(shí),對(duì)該樣品創(chuàng)建標(biāo)準(zhǔn)流程分析,且在創(chuàng)建每個(gè)標(biāo)準(zhǔn)流程分析過程中由用戶根據(jù)當(dāng)前子項(xiàng)目的樣品情況輸入對(duì)應(yīng)的過濾參數(shù);經(jīng)測(cè)序儀測(cè)序完成后,先根據(jù)輸入的過濾參數(shù)過濾掉部分樣品數(shù)據(jù),然后運(yùn)用所創(chuàng)建的標(biāo)準(zhǔn)流程分析對(duì)剩下的每一樣品數(shù)據(jù)進(jìn)行過濾與分析,生成分析結(jié)果。
【專利說明】生物信息項(xiàng)目的自動(dòng)化分析方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及生物信息分析領(lǐng)域,尤其涉及一種生物信息項(xiàng)目的自動(dòng)化分析方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著生命科學(xué)領(lǐng)域?qū)嶒?yàn)技術(shù)的快速發(fā)展,科學(xué)儀器的自動(dòng)化、智能化水平日益提高,數(shù)據(jù)產(chǎn)出能力有了質(zhì)的飛躍。同時(shí),生命科學(xué)研宄對(duì)分析測(cè)試的要求無論在樣品數(shù)量、分析周期、分析項(xiàng)目和數(shù)據(jù)準(zhǔn)確性等方面都提出了更高的標(biāo)準(zhǔn)和要求,生物實(shí)驗(yàn)室產(chǎn)出的信息呈幾何級(jí)數(shù)增長(zhǎng)。
[0003]在傳統(tǒng)的生物實(shí)驗(yàn)室中,由于數(shù)據(jù)類型多樣、格式不一,數(shù)據(jù)的保存、交換、查詢、分析、維護(hù)都很不方便,嚴(yán)重阻礙了研宄人員之間的信息提交。在大規(guī)模并行測(cè)序(也叫下一代測(cè)序技術(shù)、高通量測(cè)序,英文:NGS、High-throughput Sequencing)的實(shí)驗(yàn)和生物信息學(xué)分析中涉及到的多種流程,如DNA文庫構(gòu)建,基因組測(cè)序,數(shù)據(jù)處理,結(jié)果分析,成果產(chǎn)出,數(shù)據(jù)共享等多個(gè)環(huán)節(jié),每個(gè)環(huán)節(jié)有不同的技術(shù)人員參與,因此在各個(gè)環(huán)節(jié)傳遞或是承接中會(huì)出現(xiàn)信息丟失或是效率低下等等問題。尤其在生物信息學(xué)中的測(cè)序,高性能計(jì)算環(huán)節(jié),專業(yè)測(cè)序?qū)嶒?yàn)室需要接受大量的測(cè)序訂單項(xiàng)目、安排測(cè)序?qū)嶒?yàn)、及時(shí)處理高速產(chǎn)出的測(cè)序結(jié)果。
[0004]在生物信息學(xué)中的測(cè)序完成后的環(huán)節(jié)中,所有項(xiàng)目有相應(yīng)的業(yè)務(wù)線項(xiàng)目組來做。業(yè)務(wù)線既做只過濾,又做標(biāo)準(zhǔn)化,又做個(gè)性化。同樣要經(jīng)過1.項(xiàng)目管理立項(xiàng)、2.信息人負(fù)責(zé)人審批、3.信息執(zhí)行人確認(rèn),4.安排跑流程,5.報(bào)告填寫,6.交付,7.項(xiàng)目管理溝通等過程,因此耗費(fèi)了業(yè)務(wù)線的本就有限的資源。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的提供一種生物信息項(xiàng)目的自動(dòng)化分析方法和系統(tǒng),能有效簡(jiǎn)化現(xiàn)有的生物信息分析的過程和步驟,減少工作量,節(jié)約資源。
[0006]本發(fā)明提供了一種生物信息項(xiàng)目的自動(dòng)化分析方法,包括步驟:
[0007]步驟一:創(chuàng)建項(xiàng)目并存于業(yè)務(wù)管理系統(tǒng)中,每個(gè)項(xiàng)目包括多個(gè)子項(xiàng)目;并選擇所述創(chuàng)建項(xiàng)目中的子項(xiàng)目和任務(wù)信息;所述子項(xiàng)目的類型包括只過濾子項(xiàng)目和標(biāo)準(zhǔn)化子項(xiàng)目;
[0008]步驟二:當(dāng)所述子項(xiàng)目的類型為只過濾子項(xiàng)目,則根據(jù)選擇的子項(xiàng)目類型和任務(wù)信息,依次從下機(jī)數(shù)據(jù)管理系統(tǒng)中獲取對(duì)應(yīng)的且經(jīng)過測(cè)序儀測(cè)序后的樣品數(shù)據(jù);且每獲取一個(gè)樣品數(shù)據(jù),即根據(jù)預(yù)設(shè)的參數(shù)配置運(yùn)用統(tǒng)一的過濾標(biāo)準(zhǔn)進(jìn)行過濾與分析,從而過濾不符合參數(shù)配置的樣品數(shù)據(jù);且待獲取的所有樣品數(shù)據(jù)過濾與分析完后,生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息;
[0009]步驟三:當(dāng)所述子項(xiàng)目的類型為標(biāo)準(zhǔn)化子項(xiàng)目時(shí),則該子項(xiàng)目對(duì)應(yīng)的樣品在經(jīng)測(cè)序儀測(cè)序的同時(shí),對(duì)該樣品創(chuàng)建包括過濾分析、表達(dá)譜定量分析、差異比較分析、Cluster聚類分析、靶基因預(yù)測(cè)分析、KOGO分析和堿基編輯分析中的一種或多種的標(biāo)準(zhǔn)流程分析,且在創(chuàng)建每個(gè)標(biāo)準(zhǔn)流程分析過程中由用戶根據(jù)當(dāng)前子項(xiàng)目的樣品情況輸入對(duì)應(yīng)的過濾參數(shù);經(jīng)測(cè)序儀測(cè)序完成后,根據(jù)所述輸入的過濾參數(shù)對(duì)每一樣品數(shù)據(jù)進(jìn)行過濾,從而去掉不符合過濾參數(shù)的樣品數(shù)據(jù);然后再運(yùn)用所創(chuàng)建的標(biāo)準(zhǔn)流程分析對(duì)符合過濾參數(shù)的每一樣品數(shù)據(jù)步驟四:對(duì)所述分析結(jié)果進(jìn)行質(zhì)控,若質(zhì)控通過,則直接輸出該分析結(jié)果;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),則重新編輯所述樣品數(shù)據(jù)或過濾/質(zhì)控參數(shù)后再次進(jìn)行步驟二或者步驟三的過濾與分析過程,直至分析結(jié)果通過質(zhì)控;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距超過閾值,則編輯所述樣品且廢棄相關(guān)Lane,并在所述業(yè)務(wù)管理系統(tǒng)中重新下單。
[0010]作為上述方案的改進(jìn),每個(gè)子項(xiàng)目的概要信息包括子項(xiàng)目代碼、子項(xiàng)目名稱、子項(xiàng)目類型、是否是只過濾、總的樣品數(shù)、執(zhí)行人、開始時(shí)間和結(jié)束時(shí)間、子項(xiàng)目狀態(tài)以及子項(xiàng)目相關(guān)操作。
[0011]作為上述方案的改進(jìn),所述樣品信息包括樣品名稱、文庫名稱、Lane ID、測(cè)序策略、Flowcell ID、Raw data、Raw Reads> Read Length、GC%、Q20%、Q30%、Error Rate、喊基分布圖以及堿基質(zhì)控分布圖。
[0012]作為上述方案的改進(jìn),還包括:
[0013]步驟五:將所述分析結(jié)果進(jìn)行存儲(chǔ)備份。
[0014]作為上述方案的改進(jìn),在所述步驟四中:若質(zhì)控不通過且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),在重新編輯所述樣品數(shù)據(jù)是可以單個(gè)樣品數(shù)據(jù)編輯或樣品批量編輯。
[0015]本發(fā)明還提供了一種生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng),包括:
[0016]創(chuàng)建單元,用于創(chuàng)建項(xiàng)目并存于業(yè)務(wù)管理系統(tǒng)中,每個(gè)項(xiàng)目包括多個(gè)子項(xiàng)目;并選擇所述創(chuàng)建項(xiàng)目中的子項(xiàng)目和任務(wù)信息;所述子項(xiàng)目的類型包括只過濾子項(xiàng)目和標(biāo)準(zhǔn)化子項(xiàng)目;
[0017]第一過濾分析單元,用于當(dāng)所述子項(xiàng)目的類型為只過濾子項(xiàng)目,則根據(jù)選擇的子項(xiàng)目類型和任務(wù)信息,依次從下機(jī)數(shù)據(jù)管理系統(tǒng)中獲取對(duì)應(yīng)的且經(jīng)過測(cè)序儀測(cè)序后的樣品數(shù)據(jù);且每獲取一個(gè)樣品數(shù)據(jù),即根據(jù)預(yù)設(shè)的參數(shù)配置運(yùn)用統(tǒng)一的過濾標(biāo)準(zhǔn)進(jìn)行過濾與分析,從而過濾不符合參數(shù)配置的樣品數(shù)據(jù);且待獲取的所有樣品數(shù)據(jù)過濾與分析完后,生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息;第二過濾分析單元,用于當(dāng)所述子項(xiàng)目的類型為標(biāo)準(zhǔn)化子項(xiàng)目時(shí),則該子項(xiàng)目對(duì)應(yīng)的樣品在經(jīng)測(cè)序儀測(cè)序的同時(shí),對(duì)該樣品創(chuàng)建包括過濾分析、表達(dá)譜定量分析、差異比較分析、Cluster聚類分析、靶基因預(yù)測(cè)分析、K0G0分析和堿基編輯分析中的一種或多種的標(biāo)準(zhǔn)流程分析,且在創(chuàng)建每個(gè)標(biāo)準(zhǔn)流程分析過程中由用戶根據(jù)當(dāng)前子項(xiàng)目的樣品情況輸入對(duì)應(yīng)的參數(shù);經(jīng)測(cè)序儀測(cè)序完成后,根據(jù)所述輸入的過濾參數(shù)對(duì)每一樣品數(shù)據(jù)進(jìn)行過濾,從而去掉不符合過濾參數(shù)的樣品數(shù)據(jù);然后再運(yùn)用所創(chuàng)建的標(biāo)準(zhǔn)流程分析對(duì)符合過濾參數(shù)的每一樣品數(shù)據(jù)進(jìn)行分析,從而生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息;
[0018]質(zhì)控單元,用于對(duì)所述分析結(jié)果進(jìn)行質(zhì)控,若質(zhì)控通過,則直接輸出該分析結(jié)果;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),則重新編輯所述樣品數(shù)據(jù)或過濾/質(zhì)控參數(shù)后再次進(jìn)行步驟二或者步驟三的過濾與分析過程,直至分析結(jié)果通過質(zhì)控;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距超過閾值,則編輯所述樣品且廢棄相關(guān)Lane,并在所述業(yè)務(wù)管理系統(tǒng)中重新下單。
[0019]作為上述方案的改進(jìn),每個(gè)子項(xiàng)目的概要信息包括子項(xiàng)目代碼、子項(xiàng)目名稱、子項(xiàng)目類型、是否是只過濾、總的樣品數(shù)、執(zhí)行人、開始時(shí)間和結(jié)束時(shí)間、子項(xiàng)目狀態(tài)以及子項(xiàng)目相關(guān)操作。
[0020]作為上述方案的改進(jìn),所述樣品信息包括樣品名稱、文庫名稱、Lane ID、測(cè)序策略、Flowcell ID、Raw data、Raw Reads> Read Length、GC%、Q20%、Q30%、Error Rate、喊基分布圖以及堿基質(zhì)控分布圖。
[0021]作為上述方案的改進(jìn),還包括:
[0022]存儲(chǔ)單元:用于將所述分析結(jié)果進(jìn)行存儲(chǔ)備份。
[0023]作為上述方案的改進(jìn),在所述質(zhì)控單元中:若質(zhì)控不通過且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),在重新編輯所述樣品數(shù)據(jù)是可以單個(gè)樣品數(shù)據(jù)編輯或樣品批量編輯。
[0024]與現(xiàn)有技術(shù)相比,本發(fā)明公開的生物信息項(xiàng)目的自動(dòng)化分析方法及系統(tǒng)具有如下有益效果:能夠針對(duì)只測(cè)序和標(biāo)準(zhǔn)化兩種不同類型的子項(xiàng)目的信息分別進(jìn)行自動(dòng)化過濾和分析,從而有效簡(jiǎn)化現(xiàn)有的生物信息分析的過程和步驟,減少工作量,節(jié)約資源。
【專利附圖】
【附圖說明】
[0025]圖1是本發(fā)明實(shí)施例中一種生物信息項(xiàng)目的自動(dòng)化分析方法的流程示意圖。
[0026]圖2顯示了圖1中的步驟S2的具體流程。
[0027]圖3顯示了圖1中的步驟S3的具體流程。
[0028]圖4顯示了圖1中的步驟S4的具體流程。
[0029]圖5顯示了圖1中的步驟S5的具體流程。
[0030]圖6是本發(fā)明實(shí)施例中一種生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng)的結(jié)構(gòu)示意圖。
[0031]圖7示出了本發(fā)明實(shí)生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng)的一個(gè)實(shí)施例的UI頁面的屏幕截圖,該截圖顯示了子項(xiàng)目的選擇列表。
[0032]圖8示出了本發(fā)明實(shí)生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng)的一個(gè)實(shí)施例的UI頁面的屏幕截圖,該截圖顯示了每個(gè)子項(xiàng)目的概要信息。
[0033]圖9示出了本發(fā)明實(shí)生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng)的一個(gè)實(shí)施例的UI頁面的屏幕截圖,該截圖顯示了只過濾子項(xiàng)目的參數(shù)設(shè)置界面。
[0034]圖10示出了本發(fā)明實(shí)生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng)的一個(gè)實(shí)施例的Π頁面的屏幕截圖,該截圖顯示了標(biāo)準(zhǔn)化子項(xiàng)目的參數(shù)設(shè)置界面和標(biāo)準(zhǔn)流程分析選擇界面。
【具體實(shí)施方式】
[0035]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0036]參見圖1,是本發(fā)明實(shí)施例提供的一種生物信息項(xiàng)目的自動(dòng)化分析方法的結(jié)構(gòu)示意圖。該生物信息項(xiàng)目的自動(dòng)化分析方法,包括步驟:
[0037]S1:創(chuàng)建項(xiàng)目并存于業(yè)務(wù)管理系統(tǒng)中,每個(gè)項(xiàng)目包括多個(gè)子項(xiàng)目;并選擇所述創(chuàng)建項(xiàng)目中的子項(xiàng)目和任務(wù)信息;所述子項(xiàng)目的類型包括只過濾子項(xiàng)目和標(biāo)準(zhǔn)化子項(xiàng)目;
[0038]在該步驟中,所選擇的每個(gè)子項(xiàng)目的概要信息包括子項(xiàng)目代碼、子項(xiàng)目名稱、子項(xiàng)目類型、是否是只過濾、總的樣品數(shù)、執(zhí)行人、開始時(shí)間和結(jié)束時(shí)間、子項(xiàng)目狀態(tài)以及子項(xiàng)目相關(guān)操作。
[0039]S2:當(dāng)所述子項(xiàng)目的類型為只過濾子項(xiàng)目,則根據(jù)選擇的子項(xiàng)目類型和任務(wù)信息,依次從下機(jī)數(shù)據(jù)管理系統(tǒng)中獲取對(duì)應(yīng)的且經(jīng)過測(cè)序儀測(cè)序后的樣品數(shù)據(jù);且每獲取一個(gè)樣品數(shù)據(jù),即根據(jù)預(yù)設(shè)的參數(shù)配置運(yùn)用統(tǒng)一的過濾標(biāo)準(zhǔn)進(jìn)行過濾與分析,從而過濾不符合參數(shù)配置的樣品數(shù)據(jù);且待獲取的所有樣品數(shù)據(jù)過濾與分析完后,生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息;在該步驟中,所述樣品信息包括樣品名稱、文庫名稱、Lane ID、測(cè)序策略、Flowcell ID>Raw data、Raw Reads>Read Length、GC%、Q20%、Q30%、Error Rate、堿基分布圖以及堿基質(zhì)控分布圖。
[0040]S3:當(dāng)所述子項(xiàng)目的類型為標(biāo)準(zhǔn)化子項(xiàng)目時(shí),則該子項(xiàng)目對(duì)應(yīng)的樣品在經(jīng)測(cè)序儀測(cè)序的同時(shí),對(duì)該樣品創(chuàng)建包括過濾分析、表達(dá)譜定量分析、差異比較分析、Cluster聚類分析、靶基因預(yù)測(cè)分析、K0G0分析和堿基編輯分析中的一種或多種的標(biāo)準(zhǔn)流程分析,且在創(chuàng)建每個(gè)標(biāo)準(zhǔn)流程分析過程中由用戶根據(jù)當(dāng)前子項(xiàng)目的樣品情況輸入對(duì)應(yīng)的過濾參數(shù);經(jīng)測(cè)序儀測(cè)序完成后,根據(jù)所述輸入的過濾參數(shù)對(duì)每一樣品數(shù)據(jù)進(jìn)行過濾,從而去掉不符合過濾參數(shù)的樣品數(shù)據(jù);然后再運(yùn)用所創(chuàng)建的標(biāo)準(zhǔn)流程分析對(duì)符合過濾參數(shù)的每一樣品數(shù)據(jù)進(jìn)行分析,從而生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息;
[0041]S4:對(duì)所述分析結(jié)果進(jìn)行質(zhì)控,若質(zhì)控通過,則直接輸出該分析結(jié)果;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),則重新編輯所述樣品數(shù)據(jù)或過濾/質(zhì)控參數(shù)后再次進(jìn)行步驟S2或者步驟S3的過濾與分析過程,直至分析結(jié)果通過質(zhì)控;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距超過閾值,則編輯所述樣品且廢棄相關(guān)Lane,并在所述業(yè)務(wù)管理系統(tǒng)中重新下單。
[0042]其中,這個(gè)lane是下機(jī)數(shù)據(jù)的一個(gè)計(jì)量單位,也是進(jìn)行測(cè)序反應(yīng)的位置,對(duì)應(yīng)測(cè)序的玻璃板(也叫做測(cè)序芯片)上的一條。
[0043]S5:將所述分析結(jié)果進(jìn)行存儲(chǔ)備份。
[0044]本發(fā)明的過濾分析是根據(jù)子項(xiàng)目的類型為只過濾子項(xiàng)目還是標(biāo)準(zhǔn)化子項(xiàng)目區(qū)別進(jìn)行的,下面分別通過圖2和圖3進(jìn)行詳細(xì)說明。
[0045]如圖2所示,當(dāng)子項(xiàng)目的類型為只過濾子項(xiàng)目時(shí)對(duì)樣品信息進(jìn)行過濾分析的過程包括步驟:
[0046]S201:檢測(cè)對(duì)應(yīng)的一個(gè)只測(cè)序樣品(sample)下機(jī);
[0047]在該步驟中,下機(jī)是指將樣品數(shù)據(jù)通過測(cè)序儀完成測(cè)序后得到的樣品數(shù)據(jù)。測(cè)序儀通過測(cè)序,將片段化的DNA或者RNA文庫中的遺傳信息讀取出來,以其對(duì)應(yīng)的光學(xué)信號(hào),計(jì)算機(jī)代碼進(jìn)行儲(chǔ)存,最終轉(zhuǎn)換成對(duì)應(yīng)的堿基ATCG信息。測(cè)序過程是我們讀取生物的遺傳、變異信息的重要方式,也是進(jìn)行生物信息分析的先行步驟。
[0048]S202:根據(jù)預(yù)設(shè)的參數(shù)配置對(duì)該只測(cè)序樣品進(jìn)行過濾與分析(run);
[0049]該步驟中,運(yùn)用統(tǒng)一的過濾分析標(biāo)準(zhǔn)對(duì)每一個(gè)只測(cè)序樣品的下機(jī)數(shù)據(jù)進(jìn)行,從而過濾掉不符合標(biāo)準(zhǔn)的下機(jī)數(shù)據(jù)。
[0050]S203:確定該子項(xiàng)目(project)的所有只測(cè)序樣品(sample)是否過濾與分析(run)完?若是,則進(jìn)行步驟S204,否則返回步驟S202;
[0051]S204:生成分析結(jié)果。
[0052]如圖3所示,當(dāng)子項(xiàng)目的類型為標(biāo)準(zhǔn)化子項(xiàng)目時(shí)對(duì)樣品信息進(jìn)行過濾分析的過程包括步驟:
[0053]S301:檢測(cè)一個(gè)標(biāo)準(zhǔn)化樣品(sample)上機(jī);
[0054]在該步驟中,上機(jī)是指將樣品數(shù)據(jù)上傳到測(cè)序儀以進(jìn)行測(cè)序。
[0055]S302:對(duì)該標(biāo)準(zhǔn)化樣品創(chuàng)建一個(gè)或多個(gè)標(biāo)準(zhǔn)流程分析,且創(chuàng)建標(biāo)準(zhǔn)流程分析的同時(shí)由用戶設(shè)置對(duì)應(yīng)的過濾參數(shù);該標(biāo)準(zhǔn)流程分析包括但不限于過濾分析、表達(dá)譜定量分析、差異比較分析、Cluster聚類分析、靶基因預(yù)測(cè)分析、K0G0分析和堿基編輯分析
[0056]S303:檢測(cè)所選樣品(sample)下機(jī);
[0057]在該步驟中,下機(jī)是指將樣品數(shù)據(jù)通過測(cè)序儀完成測(cè)序后得到的樣品數(shù)據(jù)。
[0058]S304:根據(jù)用戶設(shè)置的過濾參數(shù)對(duì)該標(biāo)準(zhǔn)化樣品進(jìn)行過濾,從而過濾掉該標(biāo)準(zhǔn)化樣品中不符合過濾參數(shù)的樣品下機(jī)數(shù)據(jù),然后運(yùn)用創(chuàng)建的標(biāo)準(zhǔn)流程分析對(duì)過濾后剩下的樣品數(shù)據(jù)進(jìn)行分析;
[0059]S305:確定該子項(xiàng)目(project)的所有標(biāo)準(zhǔn)化樣品(sample)是否過濾與分析(run)完?若是,則進(jìn)行步驟S306,否則返回步驟S304;
[0060]S306:生成分析結(jié)果。
[0061]參考圖4,是對(duì)一個(gè)子項(xiàng)目中的任意一個(gè)樣品數(shù)據(jù)進(jìn)行過濾分析后得到的分析結(jié)果進(jìn)行質(zhì)控的過程,注意質(zhì)控是在子項(xiàng)目的所有樣品的樣品數(shù)據(jù)分析過濾完后才進(jìn)行的,且對(duì)每個(gè)樣品依次進(jìn)行質(zhì)控,具體包括步驟:
[0062]S401:檢測(cè)到某個(gè)樣品完成過濾分析,并生成分析結(jié)果;
[0063]S402:對(duì)該分析結(jié)果進(jìn)行質(zhì)控;
[0064]具體是將分析結(jié)果與質(zhì)控標(biāo)準(zhǔn)進(jìn)行比對(duì)。
[0065]S403:判斷質(zhì)控是否通過,若質(zhì)控通過,進(jìn)入步驟S404,否則進(jìn)入步驟S405 ;
[0066]S404:輸出該分析結(jié)果;
[0067]S405:判斷所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距是否不在閾值范圍內(nèi)(即差距太大),若否則進(jìn)入步驟S406,否則轉(zhuǎn)入步驟S408 ;
[0068]S406:重新編輯該樣品數(shù)據(jù)或過濾/質(zhì)控參數(shù);
[0069]在該步驟中,可以單個(gè)樣品數(shù)據(jù)編輯或樣品批量編輯。
[0070]S407:根據(jù)子項(xiàng)目類型重新對(duì)該樣品數(shù)據(jù)進(jìn)行過濾與分析,再次生成分析結(jié)果;并返回步驟S402 ;
[0071]S408:編輯所述樣品且廢棄相關(guān) Lane,并在 BMS (Business Management System,業(yè)務(wù)管理系統(tǒng))中重新下單。該處下單是指,子項(xiàng)目及其對(duì)應(yīng)的基本信息不變,但重新創(chuàng)建一個(gè)分析流程,對(duì)其進(jìn)行分析;
[0072]S409:等待新的樣品數(shù)據(jù)下機(jī)以及根據(jù)樣品所述的子項(xiàng)目類型而進(jìn)行對(duì)應(yīng)的過濾與分析,生成分析結(jié)果,并返回步驟S402 ;
[0073]然后,當(dāng)一個(gè)子項(xiàng)目的所有樣品數(shù)據(jù)進(jìn)行質(zhì)控后,則生成一個(gè)QC報(bào)告。
[0074]參考圖5,對(duì)樣品數(shù)據(jù)的分析結(jié)果進(jìn)行存儲(chǔ)備份的過程具體包括步驟:
[0075]S501:樣品數(shù)據(jù)分析;
[0076]S502:判斷該樣品分析是否完成?若是,則進(jìn)入步驟S503,否則繼續(xù)步驟S501 ;
[0077]S503:啟動(dòng)系統(tǒng)設(shè)備備份功能為可用;
[0078]S504:用戶確認(rèn)可以備份,并點(diǎn)擊“備份”;
[0079]S505:系統(tǒng)提示備份請(qǐng)求已經(jīng)提交;
[0080]S506:系統(tǒng)向交付系統(tǒng)拷貝數(shù)據(jù),其中,交付系統(tǒng)包括分析執(zhí)行人對(duì)數(shù)據(jù)的提交,審核員審核,數(shù)據(jù)釋放給客戶;
[0081]S507:判斷拷貝是否成功?若是,則進(jìn)入步驟S508,否則進(jìn)入步驟S509:
[0082]S508:提示用戶備份成功;并結(jié)束。
[0083]S509:提示用戶備份出錯(cuò),并返回步驟S504。
[0084]可見,本實(shí)施例公開的生物信息項(xiàng)目的自動(dòng)化分析方法,能夠針對(duì)只測(cè)序和標(biāo)準(zhǔn)化兩種不同類型的子項(xiàng)目的信息分別進(jìn)行自動(dòng)化過濾和分析,從而有效簡(jiǎn)化現(xiàn)有的生物信息分析的過程和步驟,減少工作量,節(jié)約資源。
[0085]本發(fā)明還提供了一種生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng),如圖6所示,包括創(chuàng)建單元10、第一過濾分析單元20、第二過濾分析單元30、質(zhì)控單元40以及存儲(chǔ)單元50,其中創(chuàng)建單元10、第一過濾分析單元20、第二過濾分析單元30、質(zhì)控單元40以及存儲(chǔ)單元50可以整合到一個(gè)后臺(tái)服務(wù)器中,而前端直接在網(wǎng)頁上操作,由用戶進(jìn)行操作以及輸入?yún)?shù),具體的:
[0086]創(chuàng)建單元10,用于創(chuàng)建項(xiàng)目并存于業(yè)務(wù)管理系統(tǒng)(Business Management System,BMS,測(cè)序及信息分析任務(wù)分配和管理系統(tǒng),包含了子項(xiàng)目、責(zé)任人、數(shù)據(jù)等組織信息)中,每個(gè)項(xiàng)目包括多個(gè)子項(xiàng)目;并選擇所述創(chuàng)建項(xiàng)目中的子項(xiàng)目和任務(wù)信息;所述子項(xiàng)目的類型包括只過濾子項(xiàng)目和標(biāo)準(zhǔn)化子項(xiàng)目;
[0087]如圖7所示,為本發(fā)明實(shí)生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng)的一個(gè)實(shí)施例的UI頁面的屏幕截圖,該截圖顯示了子項(xiàng)目的選擇列表。該子項(xiàng)目列表中顯示了多個(gè)子項(xiàng)目,且每個(gè)子項(xiàng)目注明為只過濾項(xiàng)目(Y)還是標(biāo)準(zhǔn)化項(xiàng)目(N)。而圖8是具體顯示了一個(gè)子項(xiàng)目的概要信息。每個(gè)子項(xiàng)目的概要信息包括子項(xiàng)目代碼、子項(xiàng)目名稱、子項(xiàng)目類型、是否是只過濾、總的樣品數(shù)、執(zhí)行人、開始時(shí)間和結(jié)束時(shí)間、子項(xiàng)目狀態(tài)以及子項(xiàng)目相關(guān)操作。
[0088]第一過濾分析單元20,用于當(dāng)所述子項(xiàng)目的類型為只過濾子項(xiàng)目,則根據(jù)選擇的子項(xiàng)目類型和任務(wù)信息,依次從下機(jī)數(shù)據(jù)管理系統(tǒng)(Data Management System,DMS,對(duì)測(cè)序完成的下機(jī)數(shù)據(jù)進(jìn)行質(zhì)量監(jiān)控和數(shù)據(jù)管理)中獲取對(duì)應(yīng)的且經(jīng)過測(cè)序儀測(cè)序后的樣品數(shù)據(jù);且每獲取一個(gè)樣品數(shù)據(jù),即根據(jù)預(yù)設(shè)的參數(shù)配置運(yùn)用統(tǒng)一的過濾標(biāo)準(zhǔn)進(jìn)行過濾與分析,從而過濾不符合參數(shù)配置的樣品數(shù)據(jù);且待獲取的所有樣品數(shù)據(jù)過濾與分析完后,生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息;
[0089]參考圖9,是本發(fā)明實(shí)生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng)的一個(gè)實(shí)施例的Π頁面的屏幕截圖,該截圖顯示了只過濾子項(xiàng)目的參數(shù)設(shè)置界面。
[0090]第二過濾分析單元30,用于當(dāng)所述子項(xiàng)目的類型為標(biāo)準(zhǔn)化子項(xiàng)目時(shí),則該子項(xiàng)目對(duì)應(yīng)的樣品在經(jīng)測(cè)序儀測(cè)序的同時(shí),對(duì)該樣品創(chuàng)建包括過濾分析、表達(dá)譜定量分析、差異比較分析、Cluster聚類分析、靶基因預(yù)測(cè)分析、KOGO分析和堿基編輯分析中的一種或多種的標(biāo)準(zhǔn)流程分析,且在創(chuàng)建每個(gè)標(biāo)準(zhǔn)流程分析過程中由用戶根據(jù)當(dāng)前子項(xiàng)目的樣品情況輸入對(duì)應(yīng)的過濾參數(shù);經(jīng)測(cè)序儀測(cè)序完成后,根據(jù)所述輸入的過濾參數(shù)對(duì)每一樣品數(shù)據(jù)進(jìn)行過濾,從而去掉不符合過濾參數(shù)的樣品數(shù)據(jù);然后再運(yùn)用所創(chuàng)建的標(biāo)準(zhǔn)流程分析對(duì)符合過濾參數(shù)的每一樣品數(shù)據(jù)進(jìn)行分析,從而生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品?目息;
[0091]其中,所述樣品信息包括樣品名稱、文庫名稱、Lane ID、測(cè)序策略、Flowcell ID、Raw data、Raw Reads>Read Length、GC%、Q20%、Q30%、Error Rate、喊基分布圖以及喊基質(zhì)控分布圖。
[0092]參考圖10,是本發(fā)明實(shí)生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng)的一個(gè)實(shí)施例的Π頁面的屏幕截圖,該截圖顯示了標(biāo)準(zhǔn)化子項(xiàng)目的參數(shù)設(shè)置界面和標(biāo)準(zhǔn)流程分析選擇界面。
[0093]質(zhì)控單元40,用于對(duì)所述分析結(jié)果進(jìn)行質(zhì)控,若質(zhì)控通過,則直接輸出該分析結(jié)果;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),則重新編輯所述樣品數(shù)據(jù)(可以單個(gè)樣品數(shù)據(jù)編輯或樣品批量編輯)或過濾/質(zhì)控參數(shù)后再次進(jìn)行第一過濾分析單元20或者第二過濾分析單元30的過濾與分析過程,直至分析結(jié)果通過質(zhì)控;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距超過閾值,則編輯所述樣品且廢棄相關(guān)Lane,并在所述業(yè)務(wù)管理系統(tǒng)中重新下單;以及
[0094]存儲(chǔ)單元50:用于存儲(chǔ)備份所述分析結(jié)果。
[0095]可見,本實(shí)施例公開的生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng),能夠針對(duì)只測(cè)序和標(biāo)準(zhǔn)化兩種不同類型的子項(xiàng)目的信息分別進(jìn)行自動(dòng)化過濾和分析,從而有效簡(jiǎn)化現(xiàn)有的生物信息分析的過程和步驟,減少工作量,節(jié)約資源。
[0096]以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也視為本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種生物信息項(xiàng)目的自動(dòng)化分析方法,其特征在于,包括步驟: 步驟一:創(chuàng)建項(xiàng)目并存于業(yè)務(wù)管理系統(tǒng)中,每個(gè)項(xiàng)目包括多個(gè)子項(xiàng)目;并選擇所述創(chuàng)建項(xiàng)目中的子項(xiàng)目和任務(wù)信息;所述子項(xiàng)目的類型包括只過濾子項(xiàng)目和標(biāo)準(zhǔn)化子項(xiàng)目; 步驟二:當(dāng)所述子項(xiàng)目的類型為只過濾子項(xiàng)目,則根據(jù)選擇的子項(xiàng)目類型和任務(wù)信息,依次從下機(jī)數(shù)據(jù)管理系統(tǒng)中獲取對(duì)應(yīng)的且經(jīng)過測(cè)序儀測(cè)序后的樣品數(shù)據(jù);且每獲取一個(gè)樣品數(shù)據(jù),即根據(jù)預(yù)設(shè)的參數(shù)配置運(yùn)用統(tǒng)一的過濾標(biāo)準(zhǔn)進(jìn)行過濾與分析,從而過濾不符合參數(shù)配置的樣品數(shù)據(jù);且待獲取的所有樣品數(shù)據(jù)過濾與分析完后,生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息; 步驟三:當(dāng)所述子項(xiàng)目的類型為標(biāo)準(zhǔn)化子項(xiàng)目時(shí),則該子項(xiàng)目對(duì)應(yīng)的樣品在經(jīng)測(cè)序儀測(cè)序的同時(shí),對(duì)該樣品創(chuàng)建包括過濾分析、表達(dá)譜定量分析、差異比較分析、Cluster聚類分析、靶基因預(yù)測(cè)分析、KOGO分析和堿基編輯分析中的一種或多種的標(biāo)準(zhǔn)流程分析,且在創(chuàng)建每個(gè)標(biāo)準(zhǔn)流程分析過程中由用戶根據(jù)當(dāng)前子項(xiàng)目的樣品情況輸入對(duì)應(yīng)的過濾參數(shù);經(jīng)測(cè)序儀測(cè)序完成后,根據(jù)所述輸入的過濾參數(shù)對(duì)每一樣品數(shù)據(jù)進(jìn)行過濾,從而去掉不符合過濾參數(shù)的樣品數(shù)據(jù);然后再運(yùn)用所創(chuàng)建的標(biāo)準(zhǔn)流程分析對(duì)符合過濾參數(shù)的每一樣品數(shù)據(jù)進(jìn)行分析,從而生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息; 步驟四:對(duì)所述分析結(jié)果進(jìn)行質(zhì)控,若質(zhì)控通過,則直接輸出該分析結(jié)果;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),則重新編輯所述樣品數(shù)據(jù)或過濾/質(zhì)控參數(shù)后再次進(jìn)行步驟二或者步驟三的過濾與分析過程,直至分析結(jié)果通過質(zhì)控;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距超過閾值,則編輯所述樣品且廢棄相關(guān)Lane,并在所述業(yè)務(wù)管理系統(tǒng)中重新下單。
2.如權(quán)利要求1所述的生物信息項(xiàng)目的自動(dòng)化分析方法,其特征在于,每個(gè)子項(xiàng)目的概要信息包括子項(xiàng)目代碼、子項(xiàng)目名稱、子項(xiàng)目類型、是否是只過濾、總的樣品數(shù)、執(zhí)行人、開始時(shí)間和結(jié)束時(shí)間、子項(xiàng)目狀態(tài)以及子項(xiàng)目相關(guān)操作。
3.如權(quán)利要求1所述的生物信息項(xiàng)目的自動(dòng)化分析方法,其特征在于,所述樣品信息包括樣品名稱、文庫名稱、Lane ID、測(cè)序策略、Flowcell ID、Raw data、Raw Reads、ReadLength、GC%、Q20%、Q30%、Error Rate、堿基分布圖以及堿基質(zhì)控分布圖。
4.如權(quán)利要求1所述的生物信息項(xiàng)目的自動(dòng)化分析方法,其特征在于,還包括: 步驟五:將所述分析結(jié)果進(jìn)行存儲(chǔ)備份。
5.如權(quán)利要求1所述的生物信息項(xiàng)目的自動(dòng)化分析方法,其特征在于,在所述步驟四中:若質(zhì)控不通過且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),在重新編輯所述樣品數(shù)據(jù)是可以單個(gè)樣品數(shù)據(jù)編輯或樣品批量編輯。
6.一種生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng),其特征在于,包括: 創(chuàng)建單元,用于創(chuàng)建項(xiàng)目并存于業(yè)務(wù)管理系統(tǒng)中,每個(gè)項(xiàng)目包括多個(gè)子項(xiàng)目;并選擇所述創(chuàng)建項(xiàng)目中的子項(xiàng)目和任務(wù)信息;所述子項(xiàng)目的類型包括只過濾子項(xiàng)目和標(biāo)準(zhǔn)化子項(xiàng)目; 第一過濾分析單元,用于當(dāng)所述子項(xiàng)目的類型為只過濾子項(xiàng)目,則根據(jù)選擇的子項(xiàng)目類型和任務(wù)信息,依次從下機(jī)數(shù)據(jù)管理系統(tǒng)中獲取對(duì)應(yīng)的且經(jīng)過測(cè)序儀測(cè)序后的樣品數(shù)據(jù);且每獲取一個(gè)樣品數(shù)據(jù),即根據(jù)預(yù)設(shè)的參數(shù)配置運(yùn)用統(tǒng)一的過濾標(biāo)準(zhǔn)進(jìn)行過濾與分析,從而過濾不符合參數(shù)配置的樣品數(shù)據(jù);且待獲取的所有樣品數(shù)據(jù)過濾與分析完后,生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息; 第二過濾分析單元,用于當(dāng)所述子項(xiàng)目的類型為標(biāo)準(zhǔn)化子項(xiàng)目時(shí),則該子項(xiàng)目對(duì)應(yīng)的樣品在經(jīng)測(cè)序儀測(cè)序的同時(shí),對(duì)該樣品創(chuàng)建包括過濾分析、表達(dá)譜定量分析、差異比較分析、Cluster聚類分析、靶基因預(yù)測(cè)分析、KOGO分析和堿基編輯分析中的一種或多種的標(biāo)準(zhǔn)流程分析,且在創(chuàng)建每個(gè)標(biāo)準(zhǔn)流程分析過程中由用戶根據(jù)當(dāng)前子項(xiàng)目的樣品情況輸入對(duì)應(yīng)的參數(shù);經(jīng)測(cè)序儀測(cè)序完成后,根據(jù)所述輸入的過濾參數(shù)對(duì)每一樣品數(shù)據(jù)進(jìn)行過濾,從而去掉不符合過濾參數(shù)的樣品數(shù)據(jù);然后再運(yùn)用所創(chuàng)建的標(biāo)準(zhǔn)流程分析對(duì)符合過濾參數(shù)的每一樣品數(shù)據(jù)進(jìn)行分析,從而生成分析結(jié)果,分析結(jié)果包括子項(xiàng)目信息和對(duì)應(yīng)的樣品信息; 質(zhì)控單元,用于對(duì)所述分析結(jié)果進(jìn)行質(zhì)控,若質(zhì)控通過,則直接輸出該分析結(jié)果;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),則重新編輯所述樣品數(shù)據(jù)或過濾/質(zhì)控參數(shù)后再次進(jìn)行步驟二或者步驟三的過濾與分析過程,直至分析結(jié)果通過質(zhì)控;若質(zhì)控不通過,且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距超過閾值,則編輯所述樣品且廢棄相關(guān)Lane,并在所述業(yè)務(wù)管理系統(tǒng)中重新下單。
7.如權(quán)利要求6所述的生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng),其特征在于,每個(gè)子項(xiàng)目的概要信息包括子項(xiàng)目代碼、子項(xiàng)目名稱、子項(xiàng)目類型、是否是只過濾、總的樣品數(shù)、執(zhí)行人、開始時(shí)間和結(jié)束時(shí)間、子項(xiàng)目狀態(tài)以及子項(xiàng)目相關(guān)操作。
8.如權(quán)利要求61所述的生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng),其特征在于,所述樣品信息包括樣品名稱、文庫名稱、Lane ID、測(cè)序策略、Flowcell ID、Raw data、Raw Reads、ReadLength、GC%、Q20%、Q30%、Error Rate、堿基分布圖以及堿基質(zhì)控分布圖。
9.如權(quán)利要求6所述的生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng),其特征在于,還包括: 存儲(chǔ)單元:用于將通過質(zhì)控的所述分析結(jié)果進(jìn)行存儲(chǔ)備份。
10.如權(quán)利要求6所述的生物信息項(xiàng)目的自動(dòng)化分析系統(tǒng),其特征在于,在所述質(zhì)控單元中:若質(zhì)控不通過且所述分析結(jié)果和質(zhì)控標(biāo)準(zhǔn)的差距在閾值范圍內(nèi),在重新編輯所述樣品數(shù)據(jù)是可以單個(gè)樣品數(shù)據(jù)編輯或樣品數(shù)據(jù)批量編輯。
【文檔編號(hào)】G06F19/22GK104484581SQ201410742375
【公開日】2015年4月1日 申請(qǐng)日期:2014年12月8日 優(yōu)先權(quán)日:2014年12月8日
【發(fā)明者】蘇海橋, 董博, 徐偉玲, 石俊杰, 黃澤輝, 梁紹光, 劉娜, 李國(guó)慶 申請(qǐng)人:深圳華大基因科技服務(wù)有限公司