用于分析數(shù)據(jù)的計(jì)算機(jī)系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用于分析數(shù)據(jù)的計(jì)算機(jī)系統(tǒng)和一種用于分析數(shù)據(jù)的方法。
【背景技術(shù)】
[0002]對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析,也稱為數(shù)據(jù)挖掘,近年來(lái)在信息技術(shù)的所有領(lǐng)域都變得越發(fā)重要。在此,在醫(yī)學(xué)領(lǐng)域中經(jīng)常有分析現(xiàn)有數(shù)據(jù)以從中產(chǎn)生患者的增值的目的,例如改善的并快速的診斷。另外,借助統(tǒng)計(jì)分析可以為負(fù)責(zé)任的醫(yī)生或者醫(yī)療機(jī)構(gòu)獲得有價(jià)值的信息,例如最佳檢查方法。醫(yī)學(xué)設(shè)備的制造者可以使用這些信息,以便提供前瞻性的設(shè)備服務(wù)。
[0003]在統(tǒng)計(jì)分析中的一個(gè)問(wèn)題在于數(shù)據(jù)的可用性。正是在醫(yī)學(xué)領(lǐng)域,患者相關(guān)的數(shù)據(jù)是敏感的,并且具有針對(duì)濫用的特別保護(hù)。即便是非患者相關(guān)的數(shù)據(jù),例如系統(tǒng)應(yīng)用數(shù)據(jù)或者檢查時(shí)間,也具有高度敏感性,從而同樣應(yīng)當(dāng)保護(hù)。只要這些數(shù)據(jù)離開(kāi)內(nèi)部的本地計(jì)算機(jī)網(wǎng)絡(luò),這些數(shù)據(jù)就僅有有限的監(jiān)管,從而經(jīng)常不能保證所需的數(shù)據(jù)安全性。
[0004]因此,許多機(jī)構(gòu)決定將敏感數(shù)據(jù)僅在自己的本地計(jì)算機(jī)網(wǎng)路中進(jìn)行存儲(chǔ)和分析。拒絕分發(fā)原始數(shù)據(jù),例如轉(zhuǎn)發(fā)患者照片、診斷或系統(tǒng)應(yīng)用數(shù)據(jù),導(dǎo)致限制了統(tǒng)計(jì)數(shù)據(jù)分析,甚至完全阻礙了統(tǒng)計(jì)數(shù)據(jù)分析。
[0005]目前,借助協(xié)議、數(shù)據(jù)加密和數(shù)據(jù)匿名來(lái)克服缺少數(shù)據(jù)安全性和用戶缺少提供原始數(shù)據(jù)的意愿的問(wèn)題。盡管采取這些措施,許多機(jī)構(gòu)仍然如上所述拒絕分發(fā)、外部存儲(chǔ)和分析這些原始數(shù)據(jù)。
[0006]僅對(duì)數(shù)據(jù)進(jìn)行中央分析的另一個(gè)問(wèn)題在于,這是技術(shù)復(fù)雜的并且需要將大數(shù)據(jù)量傳輸?shù)街醒雽?shí)例。中央實(shí)例還必須提供高帶寬和處理資源,以便實(shí)際能夠處理這些數(shù)據(jù)。
【發(fā)明內(nèi)容】
[0007]本發(fā)明要解決的技術(shù)問(wèn)題是,提供一種用于分析數(shù)據(jù)的計(jì)算機(jī)系統(tǒng)和方法,其降低在本地計(jì)算機(jī)網(wǎng)絡(luò)與中央計(jì)算機(jī)網(wǎng)絡(luò)之間傳輸?shù)臄?shù)據(jù)量。
[0008]該技術(shù)問(wèn)題通過(guò)具有本發(fā)明特征的主題來(lái)解決。本發(fā)明的優(yōu)選實(shí)施方式是附圖和以下描述的主題。
[0009]根據(jù)本發(fā)明的第一方面,通過(guò)一種用于分析數(shù)據(jù)的計(jì)算機(jī)系統(tǒng)解決該技術(shù)問(wèn)題,該計(jì)算機(jī)系統(tǒng)具有:用于存儲(chǔ)原始數(shù)據(jù)的本地計(jì)算機(jī)網(wǎng)絡(luò),其包括借助基于原始數(shù)據(jù)的統(tǒng)計(jì)分析產(chǎn)生本地分析數(shù)據(jù)的本地?cái)?shù)據(jù)挖掘單元;以及用于從本地計(jì)算機(jī)網(wǎng)絡(luò)接收本地分析數(shù)據(jù)的中央計(jì)算機(jī)網(wǎng)絡(luò),其包括借助基于本地分析數(shù)據(jù)的統(tǒng)計(jì)分析產(chǎn)生中央分析數(shù)據(jù)的中央數(shù)據(jù)挖掘單元。由此例如實(shí)現(xiàn)將數(shù)據(jù)挖掘分析劃分成本地部分和中央部分的技術(shù)效果。通過(guò)本地統(tǒng)計(jì)分析,本地分析數(shù)據(jù)的數(shù)據(jù)量相比于原始數(shù)據(jù)的數(shù)據(jù)量有所降低。本地分析數(shù)據(jù)可以比原始數(shù)據(jù)更快地傳輸?shù)街醒胗?jì)算機(jī)網(wǎng)絡(luò)。由此更有效地使用傳輸資源。此外,通過(guò)劃分統(tǒng)計(jì)分析可以改善數(shù)據(jù)安全性。特別是可以利用較低的技術(shù)花費(fèi)在本地分析原始數(shù)據(jù),并且使原始數(shù)據(jù)不離開(kāi)內(nèi)部的本地計(jì)算機(jī)網(wǎng)絡(luò)。中央計(jì)算機(jī)網(wǎng)絡(luò)又能夠以較低的技術(shù)花費(fèi)繼續(xù)處理本地分析數(shù)據(jù)。
[0010]在所述計(jì)算機(jī)系統(tǒng)的一種優(yōu)選實(shí)施方式中,本地計(jì)算機(jī)網(wǎng)絡(luò)包括用于存儲(chǔ)本地分析數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)器。由此例如實(shí)現(xiàn)可以在向中央計(jì)算機(jī)網(wǎng)絡(luò)傳輸之前收集并中間存儲(chǔ)本地分析數(shù)據(jù)的技術(shù)優(yōu)點(diǎn)。
[0011]在所述計(jì)算機(jī)系統(tǒng)的另一種優(yōu)選實(shí)施方式中,中央計(jì)算機(jī)網(wǎng)絡(luò)包括用于存儲(chǔ)中央分析數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)器。由此例如實(shí)現(xiàn)可以存儲(chǔ)和進(jìn)一步評(píng)估中央分析數(shù)據(jù)的技術(shù)優(yōu)點(diǎn)。
[0012]在所述計(jì)算機(jī)系統(tǒng)的另一種優(yōu)選實(shí)施方式中,本地?cái)?shù)據(jù)挖掘單元包括至少一個(gè)可替換的數(shù)據(jù)挖掘代理,用于執(zhí)行統(tǒng)計(jì)分析。由此例如實(shí)現(xiàn)可以更新數(shù)據(jù)挖掘代理并匹配于新問(wèn)題的技術(shù)優(yōu)點(diǎn)。由此可以按照靈活方式評(píng)估原始數(shù)據(jù)。
[0013]在所述計(jì)算機(jī)系統(tǒng)的另一種優(yōu)選實(shí)施方式中,能夠通過(guò)中央計(jì)算機(jī)網(wǎng)絡(luò)替代數(shù)據(jù)挖掘代理。由此例如實(shí)現(xiàn)可以在中央數(shù)據(jù)挖掘時(shí)根據(jù)問(wèn)題獲得本地分析數(shù)據(jù)的技術(shù)優(yōu)點(diǎn)。
[0014]在所述計(jì)算機(jī)系統(tǒng)的另一種優(yōu)選實(shí)施方式中,中央計(jì)算機(jī)網(wǎng)絡(luò)包括代理存儲(chǔ)器,在其中存儲(chǔ)了多個(gè)數(shù)據(jù)挖掘代理。由此例如實(shí)現(xiàn)可以提供多個(gè)數(shù)據(jù)挖掘代理來(lái)根據(jù)需求向本地?cái)?shù)據(jù)挖掘單元進(jìn)行傳輸?shù)募夹g(shù)優(yōu)點(diǎn)。
[0015]在所述計(jì)算機(jī)系統(tǒng)的另一種優(yōu)選實(shí)施方式中,本地?cái)?shù)據(jù)挖掘單元包括至少一個(gè)可配置的數(shù)據(jù)挖掘代理,用于執(zhí)行統(tǒng)計(jì)分析。由此例如實(shí)現(xiàn)在不完全重新進(jìn)行傳輸下能夠?qū)?shù)據(jù)挖掘代理匹配于不同任務(wù)的技術(shù)優(yōu)點(diǎn)。由此可以降低傳輸量。
[0016]在所述計(jì)算機(jī)系統(tǒng)的另一種優(yōu)選實(shí)施方式中,能夠通過(guò)中央計(jì)算機(jī)網(wǎng)絡(luò)配置數(shù)據(jù)挖掘代理。由此例如實(shí)現(xiàn)可以由中央數(shù)據(jù)挖掘單元以技術(shù)上簡(jiǎn)單的方式控制和匹配數(shù)據(jù)挖掘代理的技術(shù)優(yōu)點(diǎn)。
[0017]在所述計(jì)算機(jī)系統(tǒng)的另一種優(yōu)選實(shí)施方式中,所述中央計(jì)算機(jī)網(wǎng)絡(luò)被構(gòu)造為,將中央分析數(shù)據(jù)傳送到本地計(jì)算機(jī)網(wǎng)絡(luò)。由此例如實(shí)現(xiàn)可以通過(guò)本地計(jì)算機(jī)系統(tǒng)進(jìn)一步評(píng)估中央分析數(shù)據(jù)的技術(shù)優(yōu)點(diǎn)。
[0018]在所述計(jì)算機(jī)系統(tǒng)的另一種優(yōu)選實(shí)施方式中,所述本地計(jì)算機(jī)網(wǎng)絡(luò)被構(gòu)造為,根據(jù)所傳送的中央分析數(shù)據(jù)產(chǎn)生本地分析數(shù)據(jù)。由此實(shí)現(xiàn)可以根據(jù)中央分析數(shù)據(jù)改變和/或優(yōu)化本地?cái)?shù)據(jù)挖掘的技術(shù)優(yōu)點(diǎn)。
[0019]根據(jù)本發(fā)明的第二方面,通過(guò)一種分析數(shù)據(jù)的方法解決上述技術(shù)問(wèn)題,具有以下步驟:在本地計(jì)算機(jī)網(wǎng)絡(luò)中存儲(chǔ)原始數(shù)據(jù);借助基于原始數(shù)據(jù)的統(tǒng)計(jì)分析通過(guò)在本地計(jì)算機(jī)網(wǎng)絡(luò)中的本地?cái)?shù)據(jù)挖掘單元產(chǎn)生本地分析數(shù)據(jù);向中央計(jì)算機(jī)網(wǎng)絡(luò)傳送本地分析數(shù)據(jù);以及借助基于本地分析數(shù)據(jù)的統(tǒng)計(jì)分析通過(guò)在中央計(jì)算機(jī)網(wǎng)絡(luò)中的中央數(shù)據(jù)挖掘單元產(chǎn)生中央分析數(shù)據(jù)。由此實(shí)現(xiàn)與按照第一方面的計(jì)算機(jī)系統(tǒng)相同的技術(shù)優(yōu)點(diǎn)。
[0020]在所述方法的一種優(yōu)選實(shí)施方式中,所述方法包括步驟:通過(guò)中央計(jì)算機(jī)網(wǎng)絡(luò)替代本地?cái)?shù)據(jù)挖掘單元的數(shù)據(jù)挖掘代理。由此例如同樣實(shí)現(xiàn)可以更新數(shù)據(jù)挖掘代理并匹配于新問(wèn)題的技術(shù)優(yōu)點(diǎn)。由此可以按照靈活方式評(píng)估原始數(shù)據(jù)。
[0021]在所述方法的另一種優(yōu)選實(shí)施方式中,所述方法包括步驟:通過(guò)中央計(jì)算機(jī)網(wǎng)絡(luò)配置本地?cái)?shù)據(jù)挖掘單元的數(shù)據(jù)挖掘代理。由此例如同樣實(shí)現(xiàn)可以由中央數(shù)據(jù)挖掘單元以技術(shù)上簡(jiǎn)單的方式控制并匹配數(shù)據(jù)挖掘代理的技術(shù)優(yōu)點(diǎn)。
[0022]在所述方法的另一種優(yōu)選實(shí)施方式中,所述方法包括步驟:向本地計(jì)算機(jī)網(wǎng)絡(luò)傳送中央分析數(shù)據(jù)。由此例如同樣實(shí)現(xiàn)可以通過(guò)本地計(jì)算機(jī)系統(tǒng)進(jìn)一步評(píng)估中央分析數(shù)據(jù)的技術(shù)優(yōu)點(diǎn)。
[0023]在所述方法的另一種優(yōu)選實(shí)施方式中,所述方法包括步驟:根據(jù)所傳送的中央分析數(shù)據(jù)產(chǎn)生本地分析數(shù)據(jù)。由此例如同樣實(shí)現(xiàn)可以根據(jù)中央分析數(shù)據(jù)改變并優(yōu)化本地?cái)?shù)據(jù)挖掘的技術(shù)優(yōu)點(diǎn)。
[0024]以上對(duì)技術(shù)問(wèn)題的解決主要是參照要求保護(hù)的系統(tǒng)描述。在此提到的特征、優(yōu)點(diǎn)或替代實(shí)施方式同樣也可以轉(zhuǎn)用到其它描述或要求保護(hù)的主題,反之亦然。換言之,例如也可以利用結(jié)合系統(tǒng)描述或要求保護(hù)的特征擴(kuò)展方法權(quán)利要求或?yàn)閷?shí)施該方法而確定的計(jì)算機(jī)程序,反之亦然。在此,通過(guò)相應(yīng)的產(chǎn)生模塊特別是硬件模塊來(lái)構(gòu)造本方法相應(yīng)的功能特征。
[0025]以上描述的本方法的根據(jù)本發(fā)明的實(shí)施方式也可以構(gòu)造為利用計(jì)算機(jī)程序的計(jì)算機(jī)程序產(chǎn)品,其中當(dāng)計(jì)算機(jī)程序在計(jì)算機(jī)或計(jì)算機(jī)的處理器上運(yùn)行時(shí),計(jì)算機(jī)用于執(zhí)行以上描述的根據(jù)本發(fā)明的方法。
[0026]—種替代解決方案也在于具有計(jì)算機(jī)程序代碼的計(jì)算機(jī)程序,當(dāng)計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí),執(zhí)行要求保護(hù)的或以上描述的方法的全部方法步驟。在此,計(jì)算機(jī)程序也可以存儲(chǔ)在可機(jī)器讀取的存儲(chǔ)介質(zhì)上。
[0027]—種替代解決方案在于存儲(chǔ)介質(zhì),其用于存儲(chǔ)以上描述的計(jì)算機(jī)實(shí)施的方法,并且能夠由計(jì)算機(jī)讀取。
[0028]在本發(fā)明的范圍內(nèi),不是所有方法步驟都強(qiáng)制必須在同一個(gè)基于計(jì)算機(jī)的實(shí)例執(zhí)行,而是也可以在不同的設(shè)備或?qū)嵗?例如本地和/或中央單元)執(zhí)行。也可以將以上描述的方法的各個(gè)部分在一個(gè)可出售的單元中實(shí)施,而將其它部分在另一個(gè)可出售的單元(所謂的分散式系統(tǒng))中實(shí)施。同樣也可以改變方法步驟的順序。然而,在本發(fā)明的一種優(yōu)選實(shí)施中設(shè)置有,首先執(zhí)行本地分析,然后執(zhí)行中央分析(這也可以在更晚的時(shí)間點(diǎn)進(jìn)行)。
【附圖說(shuō)明】
[0029]在以下詳細(xì)的附圖描述中,借助附圖描述了非限定性的實(shí)施例的特征和其它優(yōu)點(diǎn)。其中:
[0030]圖1示出了計(jì)算機(jī)系統(tǒng)的示意圖;以及
[0031]圖2示出了方法的框圖。
【具體實(shí)施方式】
[0032]圖1示出了用于在醫(yī)學(xué)領(lǐng)域中分析數(shù)據(jù)的計(jì)算機(jī)系統(tǒng)100的示意圖。計(jì)算機(jī)系統(tǒng)100包括在醫(yī)院中用于本地存儲(chǔ)原始數(shù)據(jù)的多個(gè)本地計(jì)算機(jī)網(wǎng)絡(luò)101-1,和一個(gè)與本地計(jì)算機(jī)網(wǎng)絡(luò)101-1連接的中央計(jì)算機(jī)網(wǎng)絡(luò)101-2。計(jì)算機(jī)網(wǎng)絡(luò)101-1和101-2通過(guò)不同技術(shù)的、原來(lái)獨(dú)立的計(jì)算機(jī)的聯(lián)合構(gòu)成。在計(jì)算機(jī)網(wǎng)絡(luò)101-1和101-2中的計(jì)算機(jī)的聯(lián)合可以通過(guò)不同的網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn),例如通過(guò)以太網(wǎng)或LAN連接有線地或通過(guò)WLAN連接無(wú)線地連接各個(gè)計(jì)算機(jī)。在計(jì)算機(jī)網(wǎng)絡(luò)101-1和101-2中的計(jì)算機(jī)可以按不同的拓?fù)浠ハ嗦?lián)網(wǎng),以便保證共同的數(shù)據(jù)交換,例如按環(huán)形拓?fù)?、星形拓?fù)洹?shù)形拓?fù)浠蚓W(wǎng)狀拓?fù)洹?br>[0033]原始數(shù)據(jù)優(yōu)選是醫(yī)學(xué)數(shù)據(jù)或健康數(shù)據(jù)。原始數(shù)據(jù)包括安全性重要的數(shù)據(jù)組或者所謂的PHI數(shù)據(jù)(受保護(hù)的或要保護(hù)的個(gè)人相關(guān)的健康數(shù)據(jù),Protected HealthInformat1n) 0原始數(shù)據(jù)在本地通過(guò)計(jì)算機(jī)終端115或醫(yī)學(xué)設(shè)備輸入到本地計(jì)算機(jī)網(wǎng)絡(luò)101-1,并且例如包括患者數(shù)據(jù)組、患者照片、診斷或系統(tǒng)應(yīng)用數(shù)據(jù)。原始數(shù)據(jù)存儲(chǔ)在本地計(jì)算機(jī)網(wǎng)絡(luò)101-1的內(nèi)部數(shù)據(jù)存儲(chǔ)器105-1 (“Internal Data Store”)中。本地計(jì)算機(jī)網(wǎng)絡(luò)101-1通過(guò)防火墻113被保護(hù)。防火墻113構(gòu)成安全系統(tǒng),其保護(hù)本地計(jì)算機(jī)網(wǎng)絡(luò)101-1免受不希望的網(wǎng)絡(luò)訪問(wèn)。
[0034]本地計(jì)算機(jī)網(wǎng)絡(luò)101-1包括本地?cái)?shù)據(jù)挖掘單元103-1,用于借助基于所存儲(chǔ)的原始數(shù)據(jù)的統(tǒng)計(jì)分析產(chǎn)生本地分析數(shù)據(jù)。數(shù)據(jù)挖掘單元103-1將系統(tǒng)式統(tǒng)計(jì)方法應(yīng)用于來(lái)自內(nèi)部數(shù)據(jù)存儲(chǔ)器105-1的原始數(shù)據(jù),以實(shí)現(xiàn)識(shí)別新樣本的目的。在本地計(jì)算機(jī)網(wǎng)絡(luò)101-1的數(shù)據(jù)存儲(chǔ)器107-1 ( “本地?cái)?shù)據(jù)挖掘存儲(chǔ)器”)中收集并中間存儲(chǔ)所獲得的本地分析數(shù)據(jù)。因此,數(shù)據(jù)挖掘基于收集、存儲(chǔ)并借助統(tǒng)計(jì)分析算法(數(shù)據(jù)挖掘算法)分析原始數(shù)據(jù)。
[0035]然后,可以將這樣獲得的本地分析數(shù)據(jù)傳送到中央計(jì)算機(jī)網(wǎng)絡(luò)101-2。為此目的,中央計(jì)算機(jī)網(wǎng)絡(luò)101-2包括用于中間存儲(chǔ)所傳送的本地分析數(shù)據(jù)(“中間結(jié)果”)的數(shù)據(jù)存儲(chǔ)器105-2。一般地,本地計(jì)算機(jī)網(wǎng)絡(luò)101-1也可以包括多個(gè)數(shù)據(jù)挖掘單元103-1,例如用于在本地計(jì)算機(jī)網(wǎng)絡(luò)101-1內(nèi)執(zhí)行多級(jí)數(shù)據(jù)挖掘。
[0036]中央計(jì)算機(jī)網(wǎng)絡(luò)101-2包括另外的中央數(shù)據(jù)挖掘單元103-2 ( “數(shù)據(jù)挖掘核心”),用于借助基于所傳送的本地分析數(shù)據(jù)(這也可以稱為第一結(jié)果或中間結(jié)果)的統(tǒng)計(jì)分析產(chǎn)生中央分析數(shù)據(jù)。中央計(jì)算機(jī)網(wǎng)絡(luò)101-2例如由數(shù)據(jù)云或計(jì)算機(jī)中心