專利名稱:用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型的制作方法
技術(shù)領(lǐng)域:
本發(fā)明主要涉及數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種用于存儲(chǔ)多維知識(shí)的數(shù) 據(jù)倉(cāng)庫(kù)模型。
背景技術(shù):
數(shù)據(jù)倉(cāng)庫(kù)主要功能是將政府、企業(yè)等組織通過(guò)在線交易處理系統(tǒng)(OLTP)長(zhǎng)年累 月所累積的海量數(shù)據(jù),通過(guò)數(shù)據(jù)倉(cāng)庫(kù)理論所特有的數(shù)據(jù)存儲(chǔ)架構(gòu),進(jìn)行有系統(tǒng)的分析整理, 以便進(jìn)行各種分析方法如在線分析處理(OLAP)、數(shù)據(jù)挖掘(Data Mining),并進(jìn)而支持如決 策支持系統(tǒng)(DSS)、主管信息系統(tǒng)(EIS)等的建立,幫助決策者能從海量數(shù)據(jù)中快速有效的 分析出有價(jià)值的信息,以便制定決策及快速應(yīng)對(duì)外界環(huán)境的變動(dòng),幫助建構(gòu)商業(yè)智能(Bi)。一般來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)可由關(guān)系數(shù)據(jù)庫(kù),或?qū)閿?shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)的多維度數(shù)據(jù)庫(kù)建立, 其架構(gòu)可分為星狀及雪花狀架構(gòu),包含數(shù)個(gè)維度數(shù)據(jù)表,及一個(gè)事實(shí)數(shù)據(jù)表?,F(xiàn)有數(shù)據(jù)倉(cāng)庫(kù) 的主要問(wèn)題在于數(shù)據(jù)倉(cāng)庫(kù)缺乏一個(gè)有堅(jiān)實(shí)理論基礎(chǔ)的知識(shí)模型,無(wú)法把其中存儲(chǔ)的海量 數(shù)據(jù)提升到知識(shí)的高度,因此也就難以實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的最終目標(biāo)——知識(shí)發(fā)現(xiàn)。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型,能夠?qū)崿F(xiàn)知識(shí)發(fā) 現(xiàn)、實(shí)現(xiàn)知識(shí)無(wú)限關(guān)聯(lián)并快速找到所需的知識(shí),以克服現(xiàn)有技術(shù)存在的上述不足。本發(fā)明的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)一種用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型,包括絕對(duì)維層,其包括絕對(duì)時(shí)間維模塊、絕對(duì)地點(diǎn)維模塊、主分類維模塊,其中時(shí)間維 模塊分為年、月、日、時(shí)、分、秒多個(gè)級(jí)別,地點(diǎn)維模塊分為國(guó)家、省、市、區(qū)縣、鄉(xiāng)鎮(zhèn)以及街道 多個(gè)級(jí)別,主分類維模塊分為若干副分類維模塊;集合層,其包括事件模塊、組織模塊、關(guān)系模塊,集合層通過(guò)其內(nèi)部的相對(duì)維層包 含實(shí)體層;相對(duì)維層,其包括相對(duì)時(shí)間維模塊、相對(duì)地點(diǎn)維模塊、角色維模塊,其中時(shí)間維模 塊為過(guò)去、現(xiàn)在和將來(lái),相對(duì)地點(diǎn)維模塊為東、西、南、北以及中,角色維模塊為組織機(jī)構(gòu)里 面的職位劃分以及合同書里面的甲方乙方;實(shí)體層,其包括人員模塊、物品模塊、聯(lián)系方式模塊;所述絕對(duì)維層、集合層、相對(duì)維層和實(shí)體層都是由節(jié)點(diǎn)組成,節(jié)點(diǎn)是知識(shí)模型中的 最小單元,節(jié)點(diǎn)有兩個(gè)基本參數(shù)即亮度和狀態(tài),其中亮度為此節(jié)點(diǎn)點(diǎn)亮以后有多亮;狀態(tài)為 此節(jié)點(diǎn)亮了沒(méi)有,狀態(tài)分為三種即暗、照亮、點(diǎn)亮;所述數(shù)據(jù)倉(cāng)庫(kù)還包括以下表地點(diǎn)維表、主分類維表、副分類維表、相對(duì)維表、基本 實(shí)體集合表、擴(kuò)展實(shí)體集合表;所述數(shù)據(jù)倉(cāng)庫(kù)的抽取、轉(zhuǎn)換、加載過(guò)程需要把原始數(shù)據(jù)導(dǎo)入到數(shù)據(jù)倉(cāng)庫(kù)中,原始數(shù) 據(jù)表的字段可以分為五類實(shí)體標(biāo)識(shí)字段、相對(duì)維字段、集合標(biāo)識(shí)字段、絕對(duì)維字段和原始數(shù)據(jù)定位字段,其中實(shí)體標(biāo)識(shí)字段包括人員編號(hào)、物品編號(hào)、聯(lián)系方式編號(hào);相對(duì)維字段包 括時(shí)間維、地點(diǎn)維、角色維;集合標(biāo)識(shí)字段包括事件編號(hào)、組織編號(hào)、關(guān)系編號(hào);絕對(duì)維字段 包括時(shí)間維、經(jīng)度維、緯度維、地點(diǎn)維、分類維;原始數(shù)據(jù)定位字段可以是一個(gè)或多個(gè)字段。本發(fā)明的有益效果為容納時(shí)間模塊、地點(diǎn)模塊、分類模塊等多維度知識(shí),以及事 件活動(dòng)、組織機(jī)構(gòu)、親屬關(guān)系、通話記錄、航班、酒店等多種集合,還有人員、物品、房產(chǎn)、機(jī)動(dòng) 車輛、聯(lián)系方式、銀行賬號(hào)等多種實(shí)體?,F(xiàn)有的社交網(wǎng)站、知識(shí)網(wǎng)站、信息追蹤和軌跡研判等 系統(tǒng),能夠?qū)崿F(xiàn)知識(shí)發(fā)現(xiàn)、實(shí)現(xiàn)知識(shí)無(wú)限關(guān)聯(lián)并快速找到所需的知識(shí)。
下面根據(jù)附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。圖1是本發(fā)明實(shí)施例所述的用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型框圖。
具體實(shí)施例方式如圖1所示,本發(fā)明實(shí)施例所述的一種用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型,包括 絕對(duì)維層,包括絕對(duì)時(shí)間維模塊、絕對(duì)地點(diǎn)維模塊、主分類維模塊,其中時(shí)間維模塊分為年、 月、日、時(shí)、分、秒多個(gè)級(jí)別,地點(diǎn)維模塊分為國(guó)家、省、市、區(qū)縣、鄉(xiāng)鎮(zhèn)以及街道多個(gè)級(jí)別,主 分類維模塊分為若干副分類維模塊;集合層,包括事件模塊、組織模塊、關(guān)系模塊,集合層通 過(guò)其內(nèi)部的相對(duì)維層包含實(shí)體層;相對(duì)維層,包括相對(duì)時(shí)間維模塊、相對(duì)地點(diǎn)維模塊、角色 維模塊,其中時(shí)間維模塊為過(guò)去、現(xiàn)在和將來(lái),相對(duì)地點(diǎn)維模塊為東、西、南、北以及中,角色 維模塊為組織機(jī)構(gòu)里面的職位劃分以及合同書里面的甲方乙方;實(shí)體層,包括人員模塊、物 品模塊、聯(lián)系方式模塊,例如,一個(gè)人、一件物品、一張照片、一個(gè)電子郵箱都是唯一的,都是 實(shí)體。集合層為聯(lián)系為一體的維度和實(shí)體,其中維度位于知識(shí)模型的底層,而實(shí)體位于 知識(shí)模型的頂層。集合占據(jù)一定的時(shí)間維、地點(diǎn)維和主分類維,并包含一個(gè)或多個(gè)實(shí)體。一 個(gè)集合可以包含一個(gè)或多個(gè)實(shí)體,一個(gè)實(shí)體也可以從屬于一個(gè)或多個(gè)集合,組織機(jī)構(gòu)、事件 活動(dòng)、好友圈子、人際關(guān)系、物權(quán)關(guān)系這些都是集合,集合并不直接包含實(shí)體,而是通過(guò)集合 內(nèi)部的維度包含實(shí)體。集合外部的維度稱為絕對(duì)維,集合內(nèi)部的維度稱為相對(duì)維,相對(duì)維 也分為相對(duì)時(shí)間維、相對(duì)地點(diǎn)維、相對(duì)分類維(或者叫角色維)。每個(gè)維是由多個(gè)維節(jié)點(diǎn)組 成的,每個(gè)集合是由多個(gè)集合節(jié)點(diǎn)組成的,每個(gè)實(shí)體是由多個(gè)實(shí)體節(jié)點(diǎn)組成的。所述絕對(duì)維 層、集合層、相對(duì)維層和實(shí)體層都是由節(jié)點(diǎn)組成,節(jié)點(diǎn)是知識(shí)模型中的最小單元,節(jié)點(diǎn)有兩 個(gè)基本參數(shù)即亮度和狀態(tài),其中亮度為此節(jié)點(diǎn)點(diǎn)亮以后有多亮;狀態(tài)為此節(jié)點(diǎn)亮了沒(méi)有,狀 態(tài)分為三種即暗、照亮、點(diǎn)亮;節(jié)點(diǎn)是本發(fā)明的最小單元,節(jié)點(diǎn)有多種表現(xiàn)形式,在前臺(tái)頁(yè)面 的網(wǎng)狀圖里,節(jié)點(diǎn)表現(xiàn)為網(wǎng)絡(luò)節(jié)點(diǎn);在后臺(tái)的數(shù)據(jù)倉(cāng)庫(kù)里,節(jié)點(diǎn)表現(xiàn)為一條數(shù)據(jù);在一篇文 章里,節(jié)點(diǎn)表現(xiàn)為一句話;在用戶對(duì)知識(shí)模型的操作中,節(jié)點(diǎn)表現(xiàn)為用戶增加的一條知識(shí)。 在不進(jìn)行知識(shí)查找時(shí),所有的節(jié)點(diǎn)都是暗的;在進(jìn)行知識(shí)查找時(shí),其中一小部分節(jié)點(diǎn)會(huì)被點(diǎn) 亮,點(diǎn)亮的節(jié)點(diǎn)又會(huì)照亮跟它連接的另外一些節(jié)點(diǎn),這些節(jié)點(diǎn)中的一部分又會(huì)被點(diǎn)亮,這樣 不斷向外發(fā)展,就會(huì)形成一條條連續(xù)不斷的查找路徑。由于知識(shí)庫(kù)中的節(jié)點(diǎn)是普遍聯(lián)系的, 所以不管從哪個(gè)節(jié)點(diǎn)出發(fā),都能到達(dá)其它任意一個(gè)節(jié)點(diǎn)。所有節(jié)點(diǎn)的亮度都是同一個(gè)初始值,也就是說(shuō)所有節(jié)點(diǎn)的亮度都相同,節(jié)點(diǎn)的亮度會(huì)在3種因素的影響下發(fā)生變化,3種因素為時(shí)間、點(diǎn)亮次數(shù)、評(píng)價(jià),時(shí)間越長(zhǎng),節(jié)點(diǎn)的亮 度越小,亮度越小亮度的減小速度越慢,最終會(huì)趨近于0 ;每點(diǎn)亮一次,節(jié)點(diǎn)的亮度就會(huì)變 大一些,亮度越大亮度的增加速度越慢,最終會(huì)趨近于一個(gè)最大亮度;評(píng)價(jià)越高,亮度也越 高。亮度隨時(shí)間變化曲線和亮度隨點(diǎn)亮次數(shù)變化曲線疊加起來(lái),就形成了總的亮度變化曲 線??偟牧炼惹€為一開(kāi)始為亮度初始值,然后較快地增加,達(dá)到亮度最大值,然后下降, 下降速度越來(lái)越慢,最后趨近于0;節(jié)點(diǎn)的亮度曲線,基本上能夠反映現(xiàn)實(shí)世界的真實(shí)情 況。一個(gè)節(jié)點(diǎn)被點(diǎn)亮以后,一方面,它能照亮與它直接連接的其它節(jié)點(diǎn);另一方面,它能照亮 與它距離較近的其它節(jié)點(diǎn),節(jié)點(diǎn)亮度越高,它的照亮距離越大,照亮范圍也越大。所述數(shù)據(jù)倉(cāng)庫(kù)還包括以下表地點(diǎn)維表、主分類維表、副分類維表、相對(duì)維表、基本 實(shí)體集合表、擴(kuò)展實(shí)體集合表;地點(diǎn)維表 主分類維表 副分類維表 相對(duì)維表 基本實(shí)體集合表 擴(kuò)展實(shí)體集合表 所述數(shù)據(jù)倉(cāng)庫(kù)的抽取、轉(zhuǎn)換、加載過(guò)程需要把原始數(shù)據(jù)導(dǎo)入到數(shù)據(jù)倉(cāng)庫(kù)中,原始數(shù) 據(jù)表的字段可以分為五類實(shí)體標(biāo)識(shí)字段、相對(duì)維字段、集合標(biāo)識(shí)字段、絕對(duì)維字段和原始 數(shù)據(jù)定位字段,其中實(shí)體標(biāo)識(shí)字段包括人員編號(hào)、物品編號(hào)、聯(lián)系方式編號(hào);相對(duì)維字段包 括時(shí)間維、地點(diǎn)維、角色維;集合標(biāo)識(shí)字段包括事件編號(hào)、組織編號(hào)、關(guān)系編號(hào);絕對(duì)維字段 包括時(shí)間維、經(jīng)度維、緯度維、地點(diǎn)維、分類維;原始數(shù)據(jù)定位字段可以是一個(gè)或多個(gè)字段。每個(gè)表都至少有1個(gè)核心字段,這個(gè)核心字段可以是實(shí)體標(biāo)識(shí)字段、相對(duì)維字段、 集合標(biāo)識(shí)字段、絕對(duì)維字段,核心字段一般不為空。展現(xiàn)界面采用基于Web (互聯(lián)網(wǎng))的RIA(富因特網(wǎng)應(yīng)用)技術(shù),主要包括登錄頁(yè) 面、瀏覽頁(yè)面、導(dǎo)航窗口、坐標(biāo)軸窗口、集合實(shí)體展開(kāi)窗口、集合實(shí)體過(guò)濾窗口。登錄頁(yè)面比 較簡(jiǎn)單,包含用戶名、密碼等輸入框,與普通Web登錄頁(yè)面一樣。瀏覽頁(yè)面是瀏覽數(shù)據(jù)倉(cāng)庫(kù) 中的數(shù)據(jù)的主頁(yè)面。它采用單體RIA,包含多個(gè)相同的標(biāo)簽頁(yè),可以打開(kāi)或者關(guān)閉標(biāo)簽頁(yè),類 似于Web瀏覽器。每個(gè)標(biāo)簽頁(yè)的左側(cè)是工具條,工具條上有多個(gè)按鈕,點(diǎn)擊按鈕可以彈出某 個(gè)功能窗口,功能窗口在上側(cè)和右側(cè)浮動(dòng)。工具條包括主頁(yè)、歷史、收藏夾、地址導(dǎo)航、搜索 導(dǎo)航、圖形控制、過(guò)濾、收藏、導(dǎo)出、打印、選項(xiàng)等。標(biāo)簽頁(yè)的主體部分是一個(gè)以圖形化方式顯 示數(shù)據(jù)倉(cāng)庫(kù)中的多維知識(shí)的坐標(biāo)系,坐標(biāo)系有X軸、Y軸和Z軸,分別顯示時(shí)間維、地點(diǎn)維和 主分類維。坐標(biāo)系中分布著由節(jié)點(diǎn)和連線組成的網(wǎng)絡(luò),節(jié)點(diǎn)代表集合和實(shí)體,連線代表相對(duì) 維,通過(guò)點(diǎn)擊工具條和坐標(biāo)系,可以實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的切片、旋轉(zhuǎn)、上鉆、下鉆等操作。導(dǎo)航窗 口是瀏覽頁(yè)面中的一個(gè)功能窗口,功能窗口通過(guò)點(diǎn)擊工具條彈出的,功能窗口分為地址導(dǎo) 航窗口和搜索導(dǎo)航窗口,地址導(dǎo)航窗口為按照三個(gè)維(時(shí)間維、地點(diǎn)維和主分類維)進(jìn)行導(dǎo)航,搜索導(dǎo)航窗口是按照關(guān)鍵詞進(jìn)行導(dǎo)航。坐標(biāo)軸窗口是瀏覽頁(yè)面中的一個(gè)功能窗口,它是 通過(guò)雙擊坐標(biāo)軸彈出的,它的作用是進(jìn)行維度的切片和上鉆、下鉆,維度的旋轉(zhuǎn)是通過(guò)圖形 控制窗口完成的。集合實(shí)體展開(kāi)窗口是瀏覽頁(yè)面中的一個(gè)功能窗口,它是通過(guò)雙擊坐標(biāo)系 中的某個(gè)集合或?qū)嶓w而彈出的。在坐標(biāo)系的某個(gè)坐標(biāo)點(diǎn)上,有時(shí)可能有多個(gè)集合或?qū)嶓w,這 些集合和實(shí)體會(huì)互相重疊,上面的會(huì)蓋住下面的。在這種情況下,該點(diǎn)的集合或?qū)嶓w的圖標(biāo) 上會(huì)出現(xiàn)一個(gè)加號(hào),點(diǎn)擊它就會(huì)彈出集合實(shí)體展開(kāi)窗口,在窗口中會(huì)清楚明白地展現(xiàn)出各 個(gè)集合和實(shí)體,集合實(shí)體過(guò)濾窗口是瀏覽頁(yè)面中的一個(gè)功能窗口,通過(guò)點(diǎn)擊工具條彈出的。
權(quán)利要求
一種用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型,其特征在于,其包括絕對(duì)維層,其包括絕對(duì)時(shí)間維模塊、絕對(duì)地點(diǎn)維模塊、主分類維模塊,其中時(shí)間維模塊分為年、月、日、時(shí)、分、秒多個(gè)級(jí)別,地點(diǎn)維模塊分為國(guó)家、省、市、區(qū)縣、鄉(xiāng)鎮(zhèn)以及街道多個(gè)級(jí)別,主分類維模塊分為若干副分類維模塊;集合層,其包括事件模塊、組織模塊、關(guān)系模塊,集合層通過(guò)其內(nèi)部的相對(duì)維層包含實(shí)體層;相對(duì)維層,其包括相對(duì)時(shí)間維模塊、相對(duì)地點(diǎn)維模塊、角色維模塊,其中時(shí)間維模塊為過(guò)去、現(xiàn)在和將來(lái),相對(duì)地點(diǎn)維模塊為東、西、南、北、中,角色維模塊為組織機(jī)構(gòu)里面的職位劃分以及合同書里面的甲方乙方;實(shí)體層包括人員模塊、物品模塊、聯(lián)系方式模塊。
2.根據(jù)權(quán)利要求1所述的用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型,其特征在于所述絕對(duì) 維層、集合層、相對(duì)維層和實(shí)體層都是由節(jié)點(diǎn)組成,節(jié)點(diǎn)是知識(shí)模型中的最小單元,節(jié)點(diǎn)有 兩個(gè)基本參數(shù)即亮度和狀態(tài),其中亮度為此節(jié)點(diǎn)點(diǎn)亮以后有多亮;狀態(tài)為此節(jié)點(diǎn)亮了沒(méi)有, 狀態(tài)分為三種即暗、照亮、點(diǎn)亮。
3.根據(jù)權(quán)利要求1或2所述的用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型,其特征在于,所述數(shù) 據(jù)倉(cāng)庫(kù)還包括以下表地點(diǎn)維表、主分類維表、副分類維表、相對(duì)維表、基本實(shí)體集合表、擴(kuò) 展實(shí)體集合表。
4.根據(jù)權(quán)利要求1或2所述的用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型,其特征在于所述 數(shù)據(jù)倉(cāng)庫(kù)的抽取、轉(zhuǎn)換、加載過(guò)程需要把原始數(shù)據(jù)導(dǎo)入到數(shù)據(jù)倉(cāng)庫(kù)中,原始數(shù)據(jù)表的字段可 以分為五類實(shí)體標(biāo)識(shí)字段、相對(duì)維字段、集合標(biāo)識(shí)字段、絕對(duì)維字段和原始數(shù)據(jù)定位字段, 其中實(shí)體標(biāo)識(shí)字段包括人員編號(hào)、物品編號(hào)、聯(lián)系方式編號(hào);相對(duì)維字段包括時(shí)間維、地點(diǎn) 維、角色維;集合標(biāo)識(shí)字段包括事件編號(hào)、組織編號(hào)、關(guān)系編號(hào);絕對(duì)維字段包括時(shí)間維、經(jīng) 度維、緯度維、地點(diǎn)維、分類維;原始數(shù)據(jù)定位字段是一個(gè)或多個(gè)字段。
全文摘要
本發(fā)明涉及一種用于存儲(chǔ)多維知識(shí)的數(shù)據(jù)倉(cāng)庫(kù)模型,包括絕對(duì)維層,包括絕對(duì)時(shí)間維模塊、絕對(duì)地點(diǎn)維模塊、主分類維模塊;集合層,包括事件模塊、組織模塊、關(guān)系模塊;相對(duì)維層,包括相對(duì)時(shí)間維模塊、相對(duì)地點(diǎn)維模塊、角色維模塊;實(shí)體層,包括人員模塊、物品模塊、聯(lián)系方式模塊。本發(fā)明的有益效果為容納時(shí)間模塊、地點(diǎn)模塊、分類模塊等多維度知識(shí),以及事件活動(dòng)、組織機(jī)構(gòu)、親屬關(guān)系、通話記錄、航班、酒店等多種集合,能夠?qū)崿F(xiàn)知識(shí)發(fā)現(xiàn)、實(shí)現(xiàn)知識(shí)無(wú)限關(guān)聯(lián)并快速找到所需的知識(shí)。
文檔編號(hào)G06F17/30GK101882164SQ20101022841
公開(kāi)日2010年11月10日 申請(qǐng)日期2010年7月16日 優(yōu)先權(quán)日2010年7月16日
發(fā)明者張為斌 申請(qǐng)人:張為斌