一種針對icd起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法
【專利摘要】本發(fā)明公開一種針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,包括以下步驟:1)從ICD起搏器中導出PDF格式的報告文件;2)根據(jù)報告文件設置CRT參數(shù)抽取規(guī)則庫;3)讀取文件內(nèi)容;4)掃描報告文件,并提取文本內(nèi)容;5)調(diào)用CRT參數(shù)抽取規(guī)則庫,編程抽取符合抽取規(guī)則的數(shù)據(jù);6)將數(shù)據(jù)寫入數(shù)據(jù)庫;該針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法能節(jié)省人力資源。
【專利說明】
一種針對I CD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法
技術(shù)領域
[0001 ]本發(fā)明涉及一種針對I⑶起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法。
【背景技術(shù)】
[0002]充血性心力衰竭是有較高死亡率的嚴重疾患,每年有成千上萬的患者死于心力衰竭。在過去的10余年中,在患者體內(nèi)植入CRT設備已經(jīng)成為治療該級別最顯著的非藥物治療方法。
[0003]患者植入CRT設備后,需要定期回醫(yī)院進行隨訪,以便心血管??漆t(yī)生對CRT近期的工作進行評價,并結(jié)合CRT的診斷功能,優(yōu)化設備參數(shù)、調(diào)整治療方案。CRT設備植入患者回醫(yī)院進行隨訪時,心血管??漆t(yī)生工作流程如下一一通過CRT廠家提供的程控儀,讀取患者體內(nèi)的CRT程控數(shù)據(jù)從CRT程儀器中的患者數(shù)據(jù)導出為PDF格式的隨訪報告,人工查閱報告中的各項參數(shù)指標,做出醫(yī)學判斷。將本次導出的報告進行存檔,以便患者下次隨訪時進行對比。
[0004]目前國內(nèi)外CRT廠家僅允許將程控數(shù)據(jù)導出為TOF文件,不允許導出為excel、csv、xml等文件格式。由于PDF文件是典型的非結(jié)構(gòu)化數(shù)據(jù)格式,國內(nèi)臨床科研工作者進行心血管領域的大數(shù)據(jù)研究時,只能通過人工抄錄的方式從上述TOF文件中提取各項參數(shù)指標。由于患者數(shù)量多、程控參數(shù)復雜,人工抄錄勞動強度大。
【發(fā)明內(nèi)容】
[0005]本發(fā)明要解決的技術(shù)問題是提供一種能節(jié)省人力資源的針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法。
[0006]為解決上述問題,本發(fā)明采用如下技術(shù)方案:
一種針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,包括以下步驟:
1)從I⑶起搏器中導出I3DF格式的報告文件;
2)根據(jù)報告文件設置CRT參數(shù)抽取規(guī)則庫;
3)讀取文件內(nèi)容;
4)掃描報告文件,并提取文本內(nèi)容;
5)調(diào)用CRT參數(shù)抽取規(guī)則庫,編程抽取符合抽取規(guī)則的數(shù)據(jù);
6)將數(shù)據(jù)寫入數(shù)據(jù)庫。
[0007]作為優(yōu)選,所述CRT參數(shù)抽取規(guī)則庫的每條規(guī)則均對應著報告文件中的一個指標或參數(shù)。
[0008]作為優(yōu)選,所述步驟3)的具體實現(xiàn)方式為:
3.1)采用JAVA程序打開報告文件;
3.2)編程讀取報告文件。
[0009]作為優(yōu)選,所述步驟4)的具體實現(xiàn)方式為:
4.1)逐行掃描報告文件的內(nèi)容; 4.2)將每行的內(nèi)容提取出來。
[0010]作為優(yōu)選,所述步驟5)的具體實現(xiàn)方式為:
5.1)使用JAVA程序調(diào)用CRT參數(shù)抽取規(guī)則庫;
5.2)在CRT參數(shù)抽取規(guī)則庫找到每行內(nèi)容的抽取規(guī)則;
5.3)根據(jù)抽取規(guī)則將報告文件中整行匹配的數(shù)據(jù)抽取出來;
作為優(yōu)選,所述步驟6 )的具體實現(xiàn)方式為:
6.6)編程將抽取出來的數(shù)據(jù)進行匯總;
6.6)將匯總后的數(shù)據(jù)寫入數(shù)據(jù)庫。
[0011]作為優(yōu)選,所述數(shù)據(jù)庫為SQL數(shù)據(jù)庫,功能強大、簡單易學、使用方便。
[0012]作為優(yōu)選,所述編程均為JAVA編程,具有簡單性、面向?qū)ο?、分布式、健壯性、安全性、平臺獨立與可移植性、多線程、動態(tài)性等特點,功能強大和簡單易用。
[0013]本發(fā)明的有益效果為:采用計算機編程讀取PDF格式的CRT程控文件中的文本內(nèi)容,將文本內(nèi)容抽取出來并保存到數(shù)據(jù)庫,并可導出成Excel和cvs等數(shù)據(jù)格式進行統(tǒng)計分析,數(shù)據(jù)抽取效率和數(shù)據(jù)抽取準確率高,徹底解決了人工抄錄模式難以管控質(zhì)量的難題,能節(jié)省人力資源,方便醫(yī)務人員工作,以便心血管??漆t(yī)生對CRT近期的工作進行評價,以便患者下次隨訪時進行對比。
【附圖說明】
[0014]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0015]圖1為實施例2中的步驟5)的數(shù)據(jù)抽取流程圖。
【具體實施方式】
[0016]實施例1
一種針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,包括以下步驟:
1)從I⑶起搏器中導出I3DF格式的報告文件;
2)根據(jù)報告文件設置CRT參數(shù)抽取規(guī)則庫;
3)讀取文件內(nèi)容;
4)掃描報告文件,并提取文本內(nèi)容;
5)調(diào)用CRT參數(shù)抽取規(guī)則庫,編程抽取符合抽取規(guī)則的數(shù)據(jù),如圖1所示;
6)將數(shù)據(jù)寫入數(shù)據(jù)庫。
[0017]本實施例的有益效果為:采用計算機編程讀取TOF格式的CRT程控文件中的文本內(nèi)容,將文本內(nèi)容抽取出來并保存到數(shù)據(jù)庫,并可導出成Excel和cvs等數(shù)據(jù)格式進行統(tǒng)計分析,數(shù)據(jù)抽取效率和數(shù)據(jù)抽取準確率高,徹底解決了人工抄錄模式難以管控質(zhì)量的難題,能節(jié)省人力資源,方便醫(yī)務人員工作,以便心血管專科醫(yī)生對CRT近期的工作進行評價,以便患者下次隨訪時進行對比。
[0018]實施例2 一種針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,包括以下步驟:
1)從I⑶起搏器中導出I3DF格式的報告文件;
2)根據(jù)報告文件設置CRT參數(shù)抽取規(guī)則庫;
3)采用JAVA編程打開報告文件,JAVA編程讀取報告文件;
4)逐行掃描報告文件的內(nèi)容,將每行的內(nèi)容提取出來;
5)使用JAVA編程調(diào)用CRT參數(shù)抽取規(guī)則庫,在CRT參數(shù)抽取規(guī)則庫中找到每行內(nèi)容的抽取規(guī)則;根據(jù)抽取規(guī)則將報告文件中整行匹配的數(shù)據(jù)抽取出來,如圖1所示;
6)使用JAVA編程將抽取出來的數(shù)據(jù)進行匯總;將匯總后的數(shù)據(jù)寫入SQL數(shù)據(jù)庫。
[0019]所述CRT參數(shù)抽取規(guī)則庫的每條規(guī)則均對應著報告文件中的一個指標或參數(shù),如設置了規(guī)則“體重=$ {體重} (kg)”后,當輸入文本為“王強,體重=89 (kg)”時,JAVA程序則通過規(guī)則抽取數(shù)字“89”,并返回一下結(jié)果“體重=89”。
[0020]本實施例的有益效果為:采用JAVA編程讀取PDF格式的CRT程控文件中的文本內(nèi)容,將文本內(nèi)容抽取出來并保存到SQL數(shù)據(jù)庫,并可導出成Excel和cvs等數(shù)據(jù)格式進行統(tǒng)計分析,數(shù)據(jù)抽取效率和數(shù)據(jù)抽取準確率高,徹底解決了人工抄錄模式難以管控質(zhì)量的難題,能節(jié)省人力資源,方便醫(yī)務人員工作,以便心血管??漆t(yī)生對CRT近期的工作進行評價,以便患者下次隨訪時進行對比。
[0021]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何不經(jīng)過創(chuàng)造性勞動想到的變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1.一種針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:包括以下步驟:。2.1)從I⑶起搏器中導出PDF格式的報告文件; 2)根據(jù)報告文件設置CRT參數(shù)抽取規(guī)則庫; 3)讀取文件內(nèi)容; 4)掃描報告文件,并提取文本內(nèi)容; 5)調(diào)用CRT參數(shù)抽取規(guī)則庫,編程抽取符合抽取規(guī)則的數(shù)據(jù); 6)將數(shù)據(jù)寫入數(shù)據(jù)庫。3.根據(jù)權(quán)利要求1所述的針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述CRT參數(shù)抽取規(guī)則庫的每條規(guī)則均對應著報告文件中的一個指標或參數(shù)。4.根據(jù)權(quán)利要求2所述的針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟3)的具體實現(xiàn)方式為: 3.1)編程打開報告文件; 3.2)讀取報告文件。5.根據(jù)權(quán)利要求3所述的針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟4)的具體實現(xiàn)方式為: 4.1)逐行掃描報告文件的內(nèi)容; 4.2)將每行的內(nèi)容提取出來。6.根據(jù)權(quán)利要求4所述的針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟5)的具體實現(xiàn)方式為: 5.1)使用JAVA程序調(diào)用CRT參數(shù)抽取規(guī)則庫; 5.2)在CRT參數(shù)抽取規(guī)則庫找到每行內(nèi)容的抽取規(guī)則; 5.3)根據(jù)抽取規(guī)則將報告文件中整行匹配的數(shù)據(jù)抽取出來; 根據(jù)權(quán)利要求5所述的針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟6)的具體實現(xiàn)方式為: 6.6)編程將抽取出來的數(shù)據(jù)進行匯總; 6.6)將匯總后的數(shù)據(jù)寫入數(shù)據(jù)庫。7.根據(jù)權(quán)利要求6所述的針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述數(shù)據(jù)庫為SQL數(shù)據(jù)庫。8.根據(jù)權(quán)利要求7所述的針對ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述編程均為JAVA編程。
【文檔編號】G06F17/30GK105912883SQ201610494115
【公開日】2016年8月31日
【申請日】2016年6月30日
【發(fā)明人】陳樣新, 毛涌泉, 羅超
【申請人】廣州市皓軒軟件科技有限公司