顯現(xiàn)數(shù)據(jù)集間的關(guān)系的制作方法
【專利摘要】本文描述的技術(shù)涉及顯現(xiàn)數(shù)據(jù)集間的關(guān)系。數(shù)據(jù)集集合中的數(shù)據(jù)集被指派描述所述數(shù)據(jù)集的內(nèi)容的詞語。詞語在包括非結(jié)構(gòu)化文本的源文檔中的同時出現(xiàn)被標(biāo)識,且基于詞語在源文檔中的同時出現(xiàn),數(shù)據(jù)集間的關(guān)系被標(biāo)識。數(shù)據(jù)集間的關(guān)系被根據(jù)用戶陳述的可視化指令可視化。
【專利說明】顯現(xiàn)數(shù)據(jù)集間的關(guān)系
[0001 ] 背景
[0002]為了組織數(shù)據(jù)并使數(shù)據(jù)適于處理,數(shù)據(jù)常被存儲在數(shù)據(jù)集中。通常,數(shù)據(jù)集的設(shè)計(jì)者在定義該數(shù)據(jù)集的模式(schema)時還將向該數(shù)據(jù)集指派分類(classificat1n)。相應(yīng)地,設(shè)計(jì)者通過向數(shù)據(jù)集指派同一分類來標(biāo)識相關(guān)的數(shù)據(jù)集。例如,警察局可設(shè)計(jì)并維護(hù)“事故”數(shù)據(jù)集和“票據(jù)”數(shù)據(jù)集,其中“事故”數(shù)據(jù)集包括關(guān)于城市中的汽車事故的數(shù)據(jù),而“票據(jù)”數(shù)據(jù)集包括關(guān)于向城市中的旅行者給出的交通罰單的數(shù)據(jù)。數(shù)據(jù)集的設(shè)計(jì)者可向這兩個數(shù)據(jù)集均指派分類“交通”;因此,審閱者可搜索被指派了分類“交通”的數(shù)據(jù)集,并查明上面引用的這兩個數(shù)據(jù)集是相關(guān)的。然而,這些數(shù)據(jù)集之間的關(guān)系是靜態(tài)的。而且,目前缺少用于向用戶顯現(xiàn)數(shù)據(jù)集間的關(guān)系的適當(dāng)機(jī)制。
[0003]概述
[0004]以下是在本文更詳細(xì)描述的主題的簡要概述。本概述不旨在成為關(guān)于權(quán)利要求的范圍的限制。
[0005]本文描述了一種計(jì)算系統(tǒng)。該計(jì)算系統(tǒng)被配置成標(biāo)識數(shù)據(jù)集間的關(guān)系。該計(jì)算系統(tǒng)包括處理器和計(jì)算機(jī)可讀存儲,該計(jì)算機(jī)可讀存儲包括由該處理器執(zhí)行的組件。所述組件包括過濾器組件,該過濾器組件接收標(biāo)識第一詞語或第二詞語中的至少一者的查詢,該第一詞語被指定為描述第一數(shù)據(jù)集的內(nèi)容,該第二詞語被指定為描述第二數(shù)據(jù)集的內(nèi)容。該過濾器組件進(jìn)一步響應(yīng)于接收到該查詢而訪問數(shù)據(jù)立方體并從中提取計(jì)數(shù)值,該計(jì)數(shù)值指示第一詞語在來自多個源文檔中的文檔子集中的聚集的出現(xiàn)次數(shù),該第二詞語在該數(shù)據(jù)立方體中被標(biāo)識為該文檔子集中的每個文檔的主要詞語。所述組件還包括可視化器組件,該可視化器組件基于由該過濾器組件從該數(shù)據(jù)立方體提取的計(jì)數(shù)值來形成可視化,該可視化指示該第一數(shù)據(jù)集與該第二數(shù)據(jù)集有關(guān)。
[0006]附圖簡述
[0007]圖1是被配置成構(gòu)造數(shù)據(jù)立方體的示例性系統(tǒng)的功能框圖,該數(shù)據(jù)立方體適于在構(gòu)造表示數(shù)據(jù)集間的關(guān)系的可視化時使用。
[0008]圖2是示出該數(shù)據(jù)立方體的示例性構(gòu)造的圖示。
[0009]圖3示出可通過在圖1中示出的系統(tǒng)構(gòu)造的示例性數(shù)據(jù)立方體。
[0010]圖4是被配置成向用戶顯現(xiàn)數(shù)據(jù)集間的關(guān)系的示例性系統(tǒng)的功能框圖。
[0011]圖5示出示例性可視化。
[0012]圖6示出了描繪數(shù)據(jù)集間的關(guān)系的示例性可視化。
[0013]圖7示出了進(jìn)一步描繪數(shù)據(jù)集間的關(guān)系的示例性可視化。
[0014]圖8示出了可結(jié)合構(gòu)造表示數(shù)據(jù)集間的關(guān)系的可視化使用的示例性圖形工具。
[0015]圖9示出了描繪數(shù)據(jù)集間的關(guān)系的示例性可視化。
[0016]圖10示出了描繪數(shù)據(jù)集間的關(guān)系的另一示例性可視化。
[0017]圖11是示出了用于構(gòu)造數(shù)據(jù)立方體的示例性方法的流程圖,其中在該數(shù)據(jù)立方體上進(jìn)行查詢以標(biāo)識數(shù)據(jù)集間的關(guān)系。
[0018]圖12是示出用于構(gòu)造表示數(shù)據(jù)集間的關(guān)系的可視化的示例性方法的流程圖。
[0019]圖13是示出用于控制顯示器以視覺地描繪數(shù)據(jù)集間的關(guān)系的示例性方法的流程圖。
[0020]圖14是示出用于響應(yīng)于接收用戶輸入而動態(tài)地更新可視化的示例性方法的流程圖。
[0021]圖15示出了示例性計(jì)算系統(tǒng)。
[0022]詳細(xì)描述
[0023]現(xiàn)在參考附圖來描述與可視化數(shù)據(jù)集間的關(guān)系有關(guān)的各種技術(shù),其中在附圖中貫穿始終使用相同的附圖標(biāo)記來引述相同的要素。在以下描述中,為解釋起見,闡明了眾多具體細(xì)節(jié)以提供對一個或多個方面的全面理解。然而,顯然這(些)方面可以在沒有這些具體細(xì)節(jié)的情況下實(shí)施。在其他實(shí)例中,以框圖形式示出公知的結(jié)構(gòu)和設(shè)備以便于描述一個或多個方面。另外,要理解,被描述為由特定系統(tǒng)組件執(zhí)行的功能性可由多個組件執(zhí)行。類似地,例如,一組件可被配置成執(zhí)行被描述為由多個組件實(shí)現(xiàn)的功能。
[0024]此外,術(shù)語“或”意指包括性“或”而非排斥性“或”。即,除非另有指定或從上下文顯而易見,否則短語“X采用A或B”意指任何自然的包括性排列。即,短語“X采用A或B”藉由以下實(shí)例中任何實(shí)例得到滿足:X米用A;X米用B ;或X米用A和B兩者。另外,本申請和所附權(quán)利要求書中所使用的冠詞“一”和“某”一般應(yīng)當(dāng)被解釋成表示“一個或多個”,除非另外聲明或者可從上下文中清楚看出是指單數(shù)形式。
[0025]此外,如本文所使用的,術(shù)語“組件”和“系統(tǒng)”旨在包含用使得在被處理器執(zhí)行時執(zhí)行特定功能性的計(jì)算機(jī)可執(zhí)行指令配置的計(jì)算機(jī)可讀數(shù)據(jù)存儲。計(jì)算機(jī)可執(zhí)行指令可包括例程、功能等等。還要理解組件或系統(tǒng)可以位于單個設(shè)備上或跨若干設(shè)備分布。此外,如本文使用的,術(shù)語“示例性”旨在意味用作某些事情的說明或示例,而并非旨在指示優(yōu)選。
[0026]本文描述了與顯現(xiàn)數(shù)據(jù)集間的關(guān)系有關(guān)的各種技術(shù)。本文描述的技術(shù)使得用戶能夠標(biāo)識兩個或更多個不同數(shù)據(jù)集彼此相關(guān),即使這些數(shù)據(jù)集在構(gòu)造時沒有被指示為相關(guān)。而且,本文描述的技術(shù)使得用戶能夠定義要被可視化的數(shù)據(jù)集間的關(guān)系。從而,本文描述的技術(shù)向用戶提供了關(guān)于此前不可獲得的數(shù)據(jù)集間的關(guān)系的信息。
[0027]現(xiàn)在參考圖1,示出了被配置成構(gòu)造和/或更新具有超過兩個維度的數(shù)據(jù)結(jié)構(gòu)(例如,數(shù)據(jù)立方體)的示例性系統(tǒng)100,其中該數(shù)據(jù)立方體在被構(gòu)造時包括指示實(shí)體(諸如數(shù)據(jù)集)之間的關(guān)系的數(shù)據(jù)。系統(tǒng)100包括計(jì)算設(shè)備102,該計(jì)算設(shè)備可以是任何適當(dāng)?shù)挠?jì)算設(shè)備,包括但不限于:服務(wù)器計(jì)算設(shè)備、客戶端計(jì)算設(shè)備(例如,臺式計(jì)算設(shè)備、膝上型計(jì)算設(shè)備、平板計(jì)算設(shè)備、移動電話、可穿戴計(jì)算設(shè)備等)。計(jì)算設(shè)備102可通過網(wǎng)絡(luò)109訪問多個數(shù)據(jù)源104-108。在非限制性示例中,網(wǎng)絡(luò)109可以是因特網(wǎng)。多個數(shù)據(jù)源104-108包括相應(yīng)的多個源文檔110-114。從而,第一數(shù)據(jù)源104包括第一源文檔110,第二數(shù)據(jù)源106包括第二源文檔112,而第η數(shù)據(jù)源108包括第η源文檔114。
[0028]在一示例中,數(shù)據(jù)源104-108中的至少一者可以是社交聯(lián)網(wǎng)應(yīng)用或站點(diǎn)。例如,第一數(shù)據(jù)源104可以是社交聯(lián)網(wǎng)應(yīng)用或站點(diǎn),而源文檔110可以是由該社交聯(lián)網(wǎng)應(yīng)用或站點(diǎn)的用戶陳述的可公開訪問的帖子、評論、消息等。在另一示例中,數(shù)據(jù)源104-108中的至少一者可以是新聞應(yīng)用或站點(diǎn)。因此,例如,第二數(shù)據(jù)源106可以是新聞應(yīng)用或站點(diǎn),而第二源文檔112可以是或包括由該新聞應(yīng)用或站點(diǎn)發(fā)布的新聞項(xiàng)或故事、關(guān)于該新聞故事陳述的用戶評論等。在又一示例中,數(shù)據(jù)源104-108中的至少一者可以是博客應(yīng)用或站點(diǎn)。從而,第η數(shù)據(jù)源108可以是博客應(yīng)用或站點(diǎn),而第η源文檔114可以是可公開訪問的博客帖子、對這些帖子的評論等。根據(jù)上文,可以查明,源文檔110-114可包括包含非結(jié)構(gòu)化文本的任何適當(dāng)?shù)奈臋n、帖子、新聞故事等。
[0029]計(jì)算設(shè)備102被編程為從源文檔110-114提取數(shù)據(jù),其中所提取的數(shù)據(jù)指示源文檔110-114的文本中所包括的詞語之間的關(guān)系。如本文所用的,“詞語(term)”旨在包含單詞、短語、字母組合詞、縮略詞等。從源文檔提取的數(shù)據(jù)進(jìn)而可被用來推斷數(shù)據(jù)集間的關(guān)系。
[0030]更具體地,數(shù)據(jù)集可具有被指派給它的詞語,其中所述詞語指示該數(shù)據(jù)集的內(nèi)容。例如,該詞語可以是該數(shù)據(jù)集的標(biāo)題。在另一示例中,該詞語可以是數(shù)據(jù)集的設(shè)計(jì)者指派給該數(shù)據(jù)集的標(biāo)簽。在又一示例中,數(shù)據(jù)集可具有行和列,其中向行和列指派了標(biāo)題。這些標(biāo)題中的一者或多者可以是該數(shù)據(jù)集的標(biāo)簽。在又一示例中,數(shù)據(jù)集中最頻繁出現(xiàn)的詞語的閾值數(shù)量內(nèi)的詞語可以是被指派給該數(shù)據(jù)集的標(biāo)簽。感興趣的數(shù)據(jù)集集合中的每個數(shù)據(jù)集可具有指派給它的至少一個詞語。因此,當(dāng)基于對源文檔110-114的分析發(fā)現(xiàn)被指派給第一數(shù)據(jù)集的第一詞語(其指示該第一數(shù)據(jù)集的內(nèi)容)和被指派給第二數(shù)據(jù)集的第二詞語(其指示該第二數(shù)據(jù)集的內(nèi)容)相關(guān)時,則可以推斷出第一數(shù)據(jù)集和第二數(shù)據(jù)集的內(nèi)容同樣相關(guān)。
[0031]計(jì)算設(shè)備102包括處理器116和存儲器118,其中存儲器118的內(nèi)容能被處理器116訪問。例如,存儲器118可包括能被處理器訪問的數(shù)據(jù)和由處理器執(zhí)行的組件。存儲器118可任選地包括感興趣的詞語120。例如,感興趣的詞語120中的每個詞語可被指派給至少一個感興趣的數(shù)據(jù)集。從而,例如,感興趣的詞語120中的詞語可以是數(shù)據(jù)集集合中的數(shù)據(jù)集的標(biāo)題。
[0032]存儲器118還包括被配置成在源文檔110-114的至少一子集中搜索感興趣的詞語120中的詞語的計(jì)數(shù)器組件122。一般而言,計(jì)數(shù)器組件122被配置成標(biāo)識源文檔110-114中的詞語對(pair of terms)的同時出現(xiàn)(co-occurrence),其中詞語對中的每個詞語被包括在感興趣的詞語120中。在非限制性示例中,計(jì)數(shù)器組件122可被配置成針對源文檔中包括感興趣的詞語120中的詞語q的每個文檔對詞語i的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù)。
[0033]因此,例如,計(jì)算設(shè)備102可訪問第一數(shù)據(jù)源104并取得來自第一源文檔110的第一源文檔。計(jì)數(shù)器組件122可被配置成針對感興趣的詞語120中存在于第一源文檔中的每個詞語對該詞語的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù)。任選地,計(jì)數(shù)器組件122可基于詞語在第一源文檔中的出現(xiàn)次數(shù)而將一詞語標(biāo)記為第一源文檔的主要詞語。例如,當(dāng)一詞語為一文檔中的最頻繁出現(xiàn)的詞語的閾值次數(shù)之一時,該詞語可被標(biāo)記為該文檔的主要詞語。在另一示例中,當(dāng)一詞語被包括在一文檔的標(biāo)題或摘要中時,該詞語可被標(biāo)記為該文檔的主要詞語。在又一示例中,當(dāng)一詞語在一文檔的標(biāo)題中且還在該文檔的最頻繁出現(xiàn)的詞語的最高閾值次數(shù)中時,該詞語可被標(biāo)記為該文檔的主要詞語。
[0034]在一示例中,響應(yīng)于計(jì)數(shù)器組件標(biāo)識第一源文檔的主要詞語,計(jì)數(shù)器組件122可確定感興趣的詞語120不包括該主要詞語。在此情況下,計(jì)數(shù)器組件122可避免計(jì)算詞語(在感興趣的詞語120中)的同時出現(xiàn),并可訪問來自源文檔110-114的下一源文檔。
[0035]然而,當(dāng)計(jì)數(shù)器組件122查明第一源文檔的主要詞語被包括在感興趣的詞語120中時,則計(jì)數(shù)器組件122可針對在該第一源文檔中的每個感興趣的詞語對該感興趣的詞語的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù)。在一非限制性示例中,如果感興趣的詞語120包括詞語“事故”和“票據(jù)”,且計(jì)數(shù)器組件122確定第一源文檔的主要詞語是“事故”,則計(jì)數(shù)器組件122可對詞語“票據(jù)”在該源文檔中的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù)。計(jì)數(shù)器組件122可計(jì)算感興趣的詞語120中標(biāo)識的每個感興趣的詞語的相應(yīng)計(jì)數(shù)值。從而,計(jì)數(shù)器組件122可輸出包括以下的數(shù)據(jù):I)第一源文檔的主要關(guān)鍵詞的身份;以及2)指示其它感興趣的詞語在第一源文檔中的出現(xiàn)次數(shù)的計(jì)數(shù)值。此外,計(jì)數(shù)器組件122所輸出的數(shù)據(jù)可包括第一源文檔的源(例如,第一數(shù)據(jù)源104)的身份,并可進(jìn)一步包括指示張貼或創(chuàng)建該源文檔的時間的時間戳。在計(jì)數(shù)器組件122完成針對第一源文檔的此處理之后,計(jì)數(shù)器組件122可訪問下一源文檔并重復(fù)上述處理。從而,計(jì)數(shù)器組件122可針對每個數(shù)據(jù)源104-108中的每個源文檔執(zhí)行該處理。
[0036]在另一示例性實(shí)施例中,計(jì)數(shù)器組件122可不關(guān)于任何感興趣的詞語執(zhí)行上面引用的處理。在這樣的實(shí)施例中,計(jì)數(shù)器組件122可訪問源文檔并標(biāo)識其主要關(guān)鍵詞。計(jì)數(shù)器組件122隨后可對該源文檔中的每個其它詞語(排除掉預(yù)定義停止列表中的詞語)的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù),以使得計(jì)數(shù)器組件122針對每個源文檔的輸出是包括以下的數(shù)據(jù):I)該源文檔的該主要詞語(或該多個主要詞語)的身份;2)該源文檔中的其它詞語的身份;3)該源文檔中的每個詞語的計(jì)數(shù)值;4)該源文檔的源;以及5)時間戳。
[0037]存儲器118還包括與計(jì)數(shù)器組件122通信的數(shù)據(jù)結(jié)構(gòu)生成器組件124。數(shù)據(jù)結(jié)構(gòu)生成器組件124接收計(jì)數(shù)器組件122的輸出并生成基于該計(jì)數(shù)器組件122的輸出的數(shù)據(jù)立方體126。在一示例中,如圖所示,數(shù)據(jù)立方體可具有若干維度,包括但不限于主要詞語、時間、和/或數(shù)據(jù)源。如可查明的,數(shù)據(jù)立方體126通過上面引用的維度來索引上面描述的計(jì)數(shù)值。如將在下面更詳細(xì)地描述的,數(shù)據(jù)立方體126中的這些計(jì)數(shù)值可被用來顯現(xiàn)數(shù)據(jù)集間的關(guān)系O
[0038]現(xiàn)在轉(zhuǎn)向圖2,示出了示出計(jì)數(shù)器組件122關(guān)于源文檔202的示例性操作的圖表200。如上所指示的,計(jì)數(shù)器組件122可通過網(wǎng)絡(luò)109訪問數(shù)據(jù)源104-108中的一個或多個,并可從這些數(shù)據(jù)源獲得源文檔202。在本示例中,源文檔202包括以下詞語:PM2.5、工廠(FACTORY)、汽車(CAR)以及風(fēng)(WIND)。在此示例中,這些詞語被包括在感興趣的詞語120中。
[0039]計(jì)數(shù)器組件122訪問源文檔202并對源文檔202中上面提及的各詞語中的每個詞語的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù)。如圖所示,計(jì)數(shù)器組件122可確定詞語“PM2.5”在源文檔202中出現(xiàn)四次,詞語“工廠”在源文檔202中出現(xiàn)三次,詞語“汽車”在源文檔2020中出現(xiàn)兩次,而詞語“風(fēng)”在源文檔202中出現(xiàn)一次。在此示例中,主要詞語是在源文檔202中最常出現(xiàn)的詞語。因此,計(jì)數(shù)器組件122可將PM2.5標(biāo)識為主要詞語。計(jì)數(shù)器組件122還可標(biāo)識從其獲得源文檔202的數(shù)據(jù)源,以及被指派給該源文檔202的時間值。
[0040]基于以上,計(jì)數(shù)器組件122可輸出一數(shù)據(jù)結(jié)構(gòu)204。數(shù)據(jù)結(jié)構(gòu)204可包括標(biāo)識從其獲得源文檔202的源的字段206、標(biāo)識指派給源文檔202的時間戳的字段208、標(biāo)識源文檔202的主要關(guān)鍵詞(例如PM2.5)的字段210、標(biāo)識詞語PM2.5、工廠、汽車和風(fēng)的計(jì)數(shù)值(在源文檔202中出現(xiàn)次數(shù))的字段212-218。響應(yīng)于計(jì)數(shù)器組件122輸出數(shù)據(jù)結(jié)構(gòu)204,計(jì)數(shù)器組件122可訪問下一源文檔220,并重復(fù)上述處理。在計(jì)數(shù)器組件122完成對源文檔220的處理之后,計(jì)數(shù)器組件122可訪問下一源文檔220,直到跨源104-108的所有源文檔均已被處理為止。
[0041]如上所述,數(shù)據(jù)結(jié)構(gòu)生成器組件124可接收數(shù)據(jù)結(jié)構(gòu)204,以及與由計(jì)數(shù)器組件122所分析的源文檔中的剩余者相對應(yīng)的其它數(shù)據(jù)結(jié)構(gòu),并可基于這些數(shù)據(jù)結(jié)構(gòu)來構(gòu)造數(shù)據(jù)立方體126。
[0042]現(xiàn)在參考圖3,示出了三維數(shù)據(jù)結(jié)構(gòu)(例如數(shù)據(jù)立方體126)的示例性描繪。如圖3中所示,由計(jì)數(shù)器組件122針對源文檔110-114中的詞語所計(jì)算的聚集計(jì)數(shù)值可由主要詞語、時間、以及數(shù)據(jù)源中的至少一者索引。出于解釋目的,圖3中示出的數(shù)據(jù)立方體126被示出為按照主要詞語和時間來索引計(jì)數(shù)值。數(shù)據(jù)立方體126包括在源文檔110-114中標(biāo)識的主要詞語的列302。數(shù)據(jù)立方體126還包括指示所述主要詞語所索引的詞語(例如在感興趣的詞語120中)出現(xiàn)次數(shù)的計(jì)數(shù)值。例如,當(dāng)詞語“PM2.5”是源文檔110-114中的主要詞語時,詞語“PM2.5”出現(xiàn)了935次,詞語“汽車”出現(xiàn)了235次,詞語“工廠”出現(xiàn)了321次,而詞語“風(fēng)”出現(xiàn)了 18 次。
[0043]這些計(jì)數(shù)值可指示:在源文檔110-114中,詞語“PM2.5”和詞語“工廠”之間的關(guān)系比詞語“PM2.5”和詞語“風(fēng)”之間的關(guān)系更強(qiáng)。在另一示例中,當(dāng)詞語“工廠”是源文檔中的主要詞語時,詞語“PM2.5”出現(xiàn)了678次,詞語“汽車”出現(xiàn)了 13次,而詞語“風(fēng)”出現(xiàn)了 34次。圖3中的數(shù)據(jù)立方體126所描繪的計(jì)數(shù)值可以是跨時間的聚集計(jì)數(shù)值。如可查明的,計(jì)數(shù)值還可按照時間來索引。這將允許用戶查明例如當(dāng)詞語“PM2.5”是所定義的時間窗(例如,上個月)的主要詞語時,詞語“汽車”的計(jì)數(shù)值。此外,如上所述,計(jì)數(shù)值可按照源來索引。因此,當(dāng)詞語“PM2.5”是主要詞語時,可針對特定源獲得詞語“汽車”的計(jì)數(shù)值。從而,可基于詞語、主要詞語、閾值計(jì)數(shù)值、源、時間、或其任何適當(dāng)組合來查詢數(shù)據(jù)立方體126。
[0044]現(xiàn)在轉(zhuǎn)到圖4,示出了促成視覺上顯現(xiàn)數(shù)據(jù)集間的關(guān)系的示例性系統(tǒng)400。系統(tǒng)400包括服務(wù)器計(jì)算設(shè)備402和客戶端計(jì)算設(shè)備404,其中服務(wù)器計(jì)算設(shè)備402和客戶端計(jì)算設(shè)備404通過網(wǎng)絡(luò)405(例如,因特網(wǎng))通信??蛻舳擞?jì)算設(shè)備404包括客戶端處理器406和客戶端存儲器408,其中客戶端存儲器408包括客戶端存儲器408能夠訪問的計(jì)算機(jī)可執(zhí)行指令。客戶端計(jì)算設(shè)備404還包括被配置成向用戶呈現(xiàn)圖形數(shù)據(jù)的顯示器409(或與其通信)。
[0045]客戶端存儲器408包括可視化應(yīng)用410,該可視化應(yīng)用通常被配置成可視化數(shù)據(jù)集及數(shù)據(jù)集間的關(guān)系。在一示例中,瀏覽器可包括可視化應(yīng)用110??梢暬瘧?yīng)用410包括指令傳送器組件412,該指令傳送器組件被配置成接收來自客戶端計(jì)算設(shè)備404的用戶的可視化指令??梢暬噶羁砂〝?shù)據(jù)集的身份,其中用戶希望查明并分析關(guān)于數(shù)據(jù)集的關(guān)系(例如,用戶希望標(biāo)識與所標(biāo)識的數(shù)據(jù)集相關(guān)的其它數(shù)據(jù)集)??梢暬噶钸€可包括過濾器參數(shù),其中數(shù)據(jù)集關(guān)系基于過濾器參數(shù)被標(biāo)識并被可視化。如下面將更詳細(xì)地描述的,指令傳送器組件412可通過用戶界面控件(工具)來接收過濾器參數(shù),所述用戶界面控件諸如是滑塊、單選按鈕、下拉菜單等。
[0046]示例性過濾器參數(shù)包括一個或多個時間范圍、源身份、關(guān)系強(qiáng)度閾值等。例如,當(dāng)用戶希望被提供基于在上周所做的社交聯(lián)網(wǎng)帖子的關(guān)于涉及特定數(shù)據(jù)集的關(guān)系的可視化時,用戶可進(jìn)行輸入以使得可視化指令標(biāo)識該特定數(shù)據(jù)集、該社交聯(lián)網(wǎng)站點(diǎn)、以及(上周的)時間范圍。而且,用戶可表達(dá)被提供(基于上面引用的社交聯(lián)網(wǎng)帖子)與所標(biāo)識的數(shù)據(jù)集最相關(guān)的前五個數(shù)據(jù)集的希望,并且可視化指令可包括限制在所返回的可視化中表示的數(shù)據(jù)集的數(shù)量的閾值值。在又一示例中,用戶可請求所得到的可視化僅包括與所標(biāo)識的數(shù)據(jù)集具有某個閾值相關(guān)量的數(shù)據(jù)集的表示,且該希望可用可視化指令來表達(dá)。
[0047]可視化應(yīng)用410還包括顯示組件414,該顯示組件被配置成接收來自服務(wù)器計(jì)算設(shè)備402的可視化。當(dāng)顯示組件414接收來自服務(wù)器計(jì)算設(shè)備402的可視化時,顯示組件414被配置成控制顯示器408,以使得可視化418在該顯示器上被呈現(xiàn)??梢暬?18根據(jù)由指令傳送器組件412發(fā)送的可視化指令來圖形地描繪數(shù)據(jù)集間的關(guān)系。而且,可視化418可隨著用戶陳述過濾器參數(shù)(例如通過上面引用的用戶界面控件)而被實(shí)時更新。
[0048]服務(wù)器計(jì)算設(shè)備402包括服務(wù)器處理器420和服務(wù)器存儲器422,其中服務(wù)器存儲器422能被服務(wù)器處理器420訪問。例如,服務(wù)器存儲器422可包括服務(wù)器處理器420能訪問的數(shù)據(jù),并可進(jìn)一步包括能被服務(wù)器處理器420執(zhí)行的組件。服務(wù)器存儲器422包括被指派給數(shù)據(jù)集以描述數(shù)據(jù)集的內(nèi)容的詞語。例如,所述詞語可以是數(shù)據(jù)集的標(biāo)題、由數(shù)據(jù)集的設(shè)計(jì)者或維護(hù)者指派給數(shù)據(jù)集的標(biāo)簽等。更具體地,服務(wù)器存儲器422包括第一詞語424到第m詞語426,其中詞語424-426被指派給相應(yīng)的第一到第m數(shù)據(jù)集。此外,盡管未示出,然而服務(wù)器存儲器422還可包括指示第一數(shù)據(jù)集到第m數(shù)據(jù)集的大小的數(shù)據(jù)(例如,指示數(shù)據(jù)集中的條目的數(shù)量的數(shù)據(jù))、以及指示該數(shù)據(jù)集被指派給的類別(分類)的數(shù)據(jù)。
[0049]服務(wù)器存儲器422還包括過濾器組件428,該過濾器組件被配置成接收被指令傳送器組件412傳送給服務(wù)器計(jì)算設(shè)備402的可視化指令;過濾器組件428被配置成基于可視化指令來查詢數(shù)據(jù)立方體126。例如,響應(yīng)于接收到可視化指令,過濾器組件428可被配置成在數(shù)據(jù)立方體126上構(gòu)造并執(zhí)行這些指令,其中查詢被配置成根據(jù)可視化指令來過濾數(shù)據(jù)立方體126。
[0050]在一非限制性示例中,過濾器組件428可從客戶端計(jì)算設(shè)備404接收第一數(shù)據(jù)集的身份以及可視化要描繪與第一數(shù)據(jù)集相關(guān)的所有數(shù)據(jù)集(在數(shù)據(jù)集集合中)的指示。過濾器組件428可標(biāo)識被指派給第一數(shù)據(jù)集的第一詞語并可基于該詞語來查詢數(shù)據(jù)立方體126。參考圖3,該詞語可以是PM2.5 ο過濾器組件428可查詢數(shù)據(jù)立方體126以獲得由PM2.5所索弓I的計(jì)數(shù)值(例如當(dāng)PM2.5是主要詞語時)?;诖瞬樵?,過濾器組件428可分別獲得詞語汽車、工廠和風(fēng)的計(jì)數(shù)值235、321和18。在另一示例中,過濾器組件428可聚集計(jì)數(shù)值,以使得按照列索引的計(jì)數(shù)值可被添加到按照行索引的計(jì)數(shù)值(例如,對于汽車為235+234,對于工廠為325+678,而對于風(fēng)為11+18)。
[0051 ] 服務(wù)器存儲器422還包括可視化器組件430,該可視化器組件與過濾器組件428通信并被配置成基于過濾器組件428的輸出來構(gòu)造可視化。繼續(xù)以上示例,可視化器組件430響應(yīng)于接收過濾器組件428的輸出可標(biāo)識向其指派了詞語汽車、工廠和/或風(fēng)的數(shù)據(jù)集。可視化器組件430隨后可構(gòu)造包括多個節(jié)點(diǎn)的可視化,其中第一節(jié)點(diǎn)表示在可視化指令中標(biāo)識的該數(shù)據(jù)集,第二節(jié)點(diǎn)表示向其指派了詞語“汽車”的數(shù)據(jù)集,第三節(jié)點(diǎn)表示向其指派了詞語“工廠”的數(shù)據(jù)集,而第四節(jié)點(diǎn)標(biāo)識向其指派了詞語“風(fēng)”的數(shù)據(jù)集。而且,可視化器組件430可構(gòu)造節(jié)點(diǎn)以使得(在可視化中)其大小分別表示所述節(jié)點(diǎn)所表示的數(shù)據(jù)集中的條目的數(shù)量。在另一示例中,可視化器組件430可構(gòu)造節(jié)點(diǎn)以使得節(jié)點(diǎn)被著色以表示數(shù)據(jù)集的類另IJ。而且,可視化器組件430可構(gòu)造可視化以使得第一節(jié)點(diǎn)通過第一邊耦合到第二節(jié)點(diǎn),第一節(jié)點(diǎn)通過第二邊耦合到第三節(jié)點(diǎn),而第一節(jié)點(diǎn)通過第三邊耦合到第四節(jié)點(diǎn)??梢暬鹘M件430可引起邊的長度和/或線寬指示從數(shù)據(jù)立方體126提取的計(jì)數(shù)值一一因此,邊的長度和/或線寬可指示由被邊耦合的節(jié)點(diǎn)所表示的數(shù)據(jù)集間的關(guān)系的強(qiáng)度。
[0052]服務(wù)器存儲器422還包括傳送器組件432,該傳送器組件被配置成通過網(wǎng)絡(luò)405將由可視化器組件430構(gòu)造的可視化傳送給客戶端計(jì)算設(shè)備404??蛻舳擞?jì)算設(shè)備404響應(yīng)于接收到該可視化可隨后在顯示器409上呈現(xiàn)可視化418。
[0053]現(xiàn)在描述系統(tǒng)400的操作??蛻舳擞?jì)算設(shè)備404的用戶向可視化應(yīng)用410陳述可視化指令。同樣,如同上面指示的,這些可視化指令可包括至少一個數(shù)據(jù)集的身份,以及要被用來從數(shù)據(jù)立方體126獲得計(jì)數(shù)值的過濾器參數(shù)。指令傳送器組件412響應(yīng)于從用戶接收到可視化指令,將該可視化指令通過網(wǎng)絡(luò)405傳送給服務(wù)器計(jì)算設(shè)備402。過濾器組件428接收可視化指令,基于可視化指令構(gòu)造查詢,并在數(shù)據(jù)立方體126上執(zhí)行該查詢。過濾器組件428從而獲得與被指派給由該用戶標(biāo)識的數(shù)據(jù)集的詞語相關(guān)的詞語的計(jì)數(shù)值??梢暬鹘M件430接收由過濾器組件428從數(shù)據(jù)結(jié)構(gòu)126提取的計(jì)數(shù)值,并基于該計(jì)數(shù)值構(gòu)造可視化。傳送器組件432通過網(wǎng)絡(luò)405將該可視化傳送給客戶端計(jì)算設(shè)備404。
[0054]可視化應(yīng)用410接收該可視化,且顯示組件414控制顯示器416來使得可視化418被呈現(xiàn)在顯示器416上。用戶可審閱可視化418來標(biāo)識數(shù)據(jù)集間的關(guān)系。用戶隨后可通過向指令傳送器組件412傳送后續(xù)指令來細(xì)化可視化418。服務(wù)器計(jì)算設(shè)備402隨后可基于這些指令更新該可視化并將經(jīng)更新的可視化傳送回客戶端計(jì)算設(shè)備404。相應(yīng)地,用戶可被提供可視化并與該可視化交互(例如,通過藉由使用用戶界面控件來提供過濾器參數(shù)),且系統(tǒng)400可實(shí)時地更新可視化418,從而允許用戶基于各種過濾器參數(shù)或過濾器參數(shù)組合來探索數(shù)據(jù)集間的關(guān)系。
[0055]盡管系統(tǒng)400是在客戶端-服務(wù)器布置中描繪的,然而應(yīng)當(dāng)理解,被描述為由服務(wù)器計(jì)算設(shè)備402和客戶端計(jì)算設(shè)備404執(zhí)行的功能可由單一計(jì)算設(shè)備執(zhí)行。例如,客戶端存儲器408可包括數(shù)據(jù)集詞語424-426,過濾器組件428,可視化器組件430,以及數(shù)據(jù)立方體126。
[0056]還要理解,過濾器組件428可對數(shù)據(jù)立方體126執(zhí)行任何適當(dāng)過濾。例如,過濾器組件428可按照時間過濾或聚集計(jì)數(shù)值。相應(yīng)地,用戶可基于在上周被指派給數(shù)據(jù)集的詞語的同時出現(xiàn)(co-occurrence)來查明數(shù)據(jù)集間的關(guān)系的強(qiáng)度。在另一示例中,過濾器組件428可按照源過濾計(jì)數(shù)值。例如,用戶可指示用戶相信高度可信并與一數(shù)據(jù)集相關(guān)的數(shù)據(jù)源(例如特定新聞?wù)军c(diǎn)),且過濾器組件428可獲得基于在來自該數(shù)據(jù)源的源文檔中的詞語同時出現(xiàn)的與該數(shù)據(jù)集有關(guān)的計(jì)數(shù)值。
[0057]在又一示例中,過濾器組件428可基于指定閾值從數(shù)據(jù)立方體126提取計(jì)數(shù)值。例如,用戶可陳述一命令,該命令指示:對于被認(rèn)為相關(guān)的兩個數(shù)據(jù)集,表示這兩個數(shù)據(jù)集的內(nèi)容的詞語的計(jì)數(shù)值必須高于一閾值。在又一示例中,過濾器組件428可基于要被包括在可視化中的關(guān)系的閾值數(shù)量來從數(shù)據(jù)結(jié)構(gòu)126提取計(jì)數(shù)值。例如,用戶可指示:可視化要呈現(xiàn)與一數(shù)據(jù)集最相關(guān)的前η個數(shù)據(jù)集,其中η由用戶設(shè)置。
[0058]現(xiàn)在參考圖5,示出了示例性可視化500,其可由可視化器組件430構(gòu)造并由顯示組件414呈現(xiàn)??梢暬?00包括多個節(jié)點(diǎn)502-508,這些節(jié)點(diǎn)分別表示可被指派給數(shù)據(jù)集的四個分類。例如,節(jié)點(diǎn)502可表示“環(huán)境”分類,節(jié)點(diǎn)504可表示“運(yùn)輸”分類,節(jié)點(diǎn)506可表示“商業(yè)”分類,而節(jié)點(diǎn)508可表示“天氣”分類。
[0059]每個分類可被應(yīng)用到多個數(shù)據(jù)集。因此,每個節(jié)點(diǎn)502-508可包括表示被所述分類分類的數(shù)據(jù)集的相應(yīng)的多個節(jié)點(diǎn)。更具體而言,第一節(jié)點(diǎn)502可包括分別表示被分類為屬于“環(huán)境”分類的四個數(shù)據(jù)集的節(jié)點(diǎn)510-516。類似地,節(jié)點(diǎn)504可包括分別表示被分類為屬于“運(yùn)輸”分類的數(shù)據(jù)集的節(jié)點(diǎn)518-524;節(jié)點(diǎn)506可包括分別表示被分類為屬于“商業(yè)”分類的數(shù)據(jù)集的節(jié)點(diǎn)526-532;而節(jié)點(diǎn)508可包括分別表示被分類為屬于“天氣”分類的數(shù)據(jù)集的節(jié)點(diǎn)534-540。
[0060]在一示例中,可視化器組件430可構(gòu)造可視化500,以使得節(jié)點(diǎn)510-540具有表示節(jié)點(diǎn)510-540所表示的相應(yīng)數(shù)據(jù)集中的條目的數(shù)量的大小。繼續(xù)本文陳述的示例,節(jié)點(diǎn)510表示被指派詞語“PM2.5”(例如標(biāo)題為PM2.5)的數(shù)據(jù)集,節(jié)點(diǎn)518表示被指派詞語“汽車”的數(shù)據(jù)集,節(jié)點(diǎn)526表示被指派詞語“工廠”的數(shù)據(jù)集,而節(jié)點(diǎn)534表示被指派詞語“風(fēng)”的數(shù)據(jù)集。
[0061]圖5中示出的可視化500描繪了由節(jié)點(diǎn)502-540所表示的分類和數(shù)據(jù)集的(一個或多個)創(chuàng)建者定義的關(guān)系。相應(yīng)地,用戶可查明,節(jié)點(diǎn)534-540表示關(guān)于天氣的數(shù)據(jù)集。為了發(fā)現(xiàn)數(shù)據(jù)集間的更多關(guān)系,查看顯示器416上的可視化500的用戶可選擇表示可視化500中的感興趣的數(shù)據(jù)集的節(jié)點(diǎn)。如圖5中所示,用戶可采用指向機(jī)構(gòu)542來選擇表示被指派了詞語“PM2.5”的數(shù)據(jù)集的節(jié)點(diǎn)510。如先前指示的,PM2.5可以是該數(shù)據(jù)集的標(biāo)題。用于選擇節(jié)點(diǎn)(以及從而選擇數(shù)據(jù)集)的其它技術(shù)也被構(gòu)想,包括通過姿勢、語音命令等選擇節(jié)點(diǎn)510。對節(jié)點(diǎn)510的選擇擔(dān)當(dāng)被提供給指令傳送器組件412的指令。例如,對節(jié)點(diǎn)510的選擇可被用戶執(zhí)行以指示用戶希望被提供關(guān)于與PM2.5數(shù)據(jù)集相關(guān)的數(shù)據(jù)集的信息。如先前描述的,用戶還可能陳述其它過濾器參數(shù)(例如通過本文描述的用戶界面控件)。
[0062]現(xiàn)在參考圖6,示出了示例性可視化600,該可視化可響應(yīng)于過濾器組件428基于對節(jié)點(diǎn)510的選擇從數(shù)據(jù)立方體126提取計(jì)數(shù)值而被可視化器組件430構(gòu)造。從而,參考圖3,過濾器組件428可從數(shù)據(jù)立方體126提取指示詞語PM2.5和汽車、PM2.5和工廠、以及PM2.5和風(fēng)(例如,當(dāng)PM2.5是主要詞語時)在源文檔110-114中的同時出現(xiàn)的次數(shù)的計(jì)數(shù)值。在一示例中,可視化器組件430可基于用戶所提供的可視化指令來突出顯示表示發(fā)現(xiàn)其與所選擇節(jié)點(diǎn)510所表示的數(shù)據(jù)集相關(guān)的數(shù)據(jù)集的節(jié)點(diǎn)。這種突出顯示可以通過將非相關(guān)數(shù)據(jù)集淡出到背景中或者使得表示相關(guān)數(shù)據(jù)集的節(jié)點(diǎn)在視覺上被增強(qiáng)來實(shí)現(xiàn)。在此示例中,汽車數(shù)據(jù)集(節(jié)點(diǎn)518所表示的數(shù)據(jù)集)、工廠數(shù)據(jù)集(節(jié)點(diǎn)526所表示的數(shù)據(jù)集)以及風(fēng)數(shù)據(jù)集(節(jié)點(diǎn)534所表示的數(shù)據(jù)集)可被突出顯示以指示這些數(shù)據(jù)集與所選擇的PM2.5數(shù)據(jù)集(由節(jié)點(diǎn)510所表示的數(shù)據(jù)集)相關(guān)。
[0063]可視化器組件430還形成邊來進(jìn)一步表示數(shù)據(jù)集間的關(guān)系及數(shù)據(jù)集間的關(guān)系的強(qiáng)度(基于可視化指令)。例如,可視化器組件可構(gòu)造將節(jié)點(diǎn)510與節(jié)點(diǎn)518連接的第一邊602,可構(gòu)造將節(jié)點(diǎn)510與節(jié)點(diǎn)526連接的第二邊604,并可構(gòu)造將節(jié)點(diǎn)510與節(jié)點(diǎn)534連接的第三邊606。從而,分析可視化600的查看者可查明:基于在所標(biāo)識的數(shù)據(jù)集中的詞語的使用,節(jié)點(diǎn)518、526和534所表示的數(shù)據(jù)集各自與由節(jié)點(diǎn)510所表示的數(shù)據(jù)集相關(guān)。
[0064]現(xiàn)在轉(zhuǎn)向圖7,示出了可由可視化器組件430構(gòu)造并被傳送器組件432傳送給客戶端計(jì)算設(shè)備404的另一示例性可視化700。此處,邊602-606的長度被示出為表示可視化700中的節(jié)點(diǎn)所表示的數(shù)據(jù)集間的關(guān)系的強(qiáng)度。相應(yīng)地,節(jié)點(diǎn)518、526和534可在可視化700中移動(相對于可視化600)以向用戶視覺地描繪關(guān)系的強(qiáng)度(基于用戶所陳述的可視化指令)。例如,因?yàn)檫?04的長度短于邊602和606的長度,用戶可確定“PM2.5”數(shù)據(jù)集和“工廠數(shù)據(jù)集之間的關(guān)系的強(qiáng)度大于“PM2.5”數(shù)據(jù)集和“風(fēng)”數(shù)據(jù)集或“PM2.5”數(shù)據(jù)集和“汽車”數(shù)據(jù)集之間的關(guān)系的強(qiáng)度。附加地或替換地,邊602-606的線寬可被形成以表示數(shù)據(jù)集間的關(guān)系的強(qiáng)度(關(guān)系的量)。例如,可視化器組件430可構(gòu)造解說可視化500-700之間的平滑視覺過渡的可視化。
[0065]現(xiàn)在參考圖8,示出可被用戶用來陳述過濾器組件428在從數(shù)據(jù)立方體126提取計(jì)數(shù)值時所使用的過濾器參數(shù)的用戶界面控件800的集合。在此示例中,用戶界面控件800被描繪為滑塊,然而其它類型的用戶界面控件也被構(gòu)想,諸如單選按鈕、撥盤、文本框、下拉菜單等。第一滑塊802允許用戶陳述基于時間的過濾器準(zhǔn)則。例如,將滑塊802從左向右移動可縮短時間窗,其中僅從具有在該時間窗中的時間戳的源文檔提取的計(jì)數(shù)值將被過濾器組件128從數(shù)據(jù)立方體126提取。
[0066]第二滑塊804可被用來控制可視化中示出的關(guān)系的強(qiáng)度。例如,將滑塊804從左向右移動增加閾值值,其中過濾器組件428僅從數(shù)據(jù)立方體126中提取高于該閾值值的計(jì)數(shù)值。類似地,將該滑塊從右向左移動減小閾值值,以使得更弱的關(guān)系被可視化。第三滑塊806可被用來設(shè)置要在可視化中描繪的關(guān)系的數(shù)量。例如,過濾器組件428可被配置成從數(shù)據(jù)立方體126中提取前η個計(jì)數(shù)值,而移動第三滑塊806改變η的值。第四滑塊808可被用來控制過濾器組件428在提取計(jì)數(shù)值時所使用的索引。例如,將第四滑塊808向左移動使得過濾器組件128基于主要關(guān)鍵字從數(shù)據(jù)立方體126中提取計(jì)數(shù)值,而將第四滑塊808向右移動使得過濾器組件128基于一般同時出現(xiàn)(例如,過濾器組件128跨索引聚集計(jì)數(shù)值)來從數(shù)據(jù)立方體126中提取計(jì)數(shù)值。相應(yīng)地,第四滑塊808可擔(dān)當(dāng)二元開關(guān)。
[0067]現(xiàn)在轉(zhuǎn)向圖9,示出了另一示例性可視化900,其可由可視化器組件430構(gòu)造并由顯示組件414呈現(xiàn)??梢暬?00包括表示相應(yīng)的多個數(shù)據(jù)集的多個節(jié)點(diǎn)902-920。節(jié)點(diǎn)902-920通過邊各自彼此耦合,所述邊表示節(jié)點(diǎn)902-920所表示的數(shù)據(jù)集間的關(guān)系。在一示例中,可視化900可在三維中呈現(xiàn)并可旋轉(zhuǎn)來描繪數(shù)據(jù)集間的關(guān)系(例如,由于可視化900中所表示的相對大數(shù)量的數(shù)據(jù)集)。如上所述,連接節(jié)點(diǎn)的每條邊可表示被該邊連接的節(jié)點(diǎn)所表示的數(shù)據(jù)集間的關(guān)系的強(qiáng)度。可視化900還可包括標(biāo)識數(shù)據(jù)集的分類的圖例922。例如,節(jié)點(diǎn)918和節(jié)點(diǎn)920(其表示“損壞的儀表”和“無主的車輛”數(shù)據(jù)集)兩者可均被分類在“交通和停車”分類下。在另一示例中,節(jié)點(diǎn)910可表示“嚙齒動物”數(shù)據(jù)集,其被分類在“公寓”分類下。相應(yīng)地,節(jié)點(diǎn)902-920可被指派指示這些節(jié)點(diǎn)902-920所表示的數(shù)據(jù)集的分類的圖形數(shù)據(jù)。
[0068]可視化900還包括用戶界面控件800,該用戶界面控件允許用戶陳述(以及更新)過濾器參數(shù),以使得可視化900可由用戶“在運(yùn)行中(on the fly)"修改。從而,用戶可初始地被提供可視化900,其中可視化器組件430基于用戶界面控件800中的滑塊802-808的位置來構(gòu)造該可視化。用戶可審閱顯示器409上的可視化900,并可確定,例如,她希望可視化900描繪基于非結(jié)構(gòu)化數(shù)據(jù)源中的最近詞語的使用的數(shù)據(jù)集間的關(guān)系。因此,用戶可將滑塊802向右移動,從而導(dǎo)致經(jīng)更新的過濾器參數(shù)通過網(wǎng)絡(luò)405被提供到過濾器組件428。可視化器組件430基于收到的過濾器參數(shù)動態(tài)地更新可視化,且傳送器組件432傳送經(jīng)更新的可視化以在客戶端計(jì)算設(shè)備404的顯示器408上顯示??梢暬M件430響應(yīng)于接收到經(jīng)更新的過濾器參數(shù)立即更新該可視化一一相應(yīng)地,用戶可交互式地探索數(shù)據(jù)集間的關(guān)系。
[0069]在另一示例中,用戶可通過選擇節(jié)點(diǎn)來過濾在可視化900中描繪的關(guān)系,其中所得到的可視化以所選擇的節(jié)點(diǎn)為中心。例如,用戶可選擇表示“無主的車輛”數(shù)據(jù)集的節(jié)點(diǎn)920(例如使用指針542)。
[0070]現(xiàn)在參考圖10,示出了可被可視化器組件430響應(yīng)于用戶選擇表示“無主的車輛”數(shù)據(jù)集的節(jié)點(diǎn)920(以及設(shè)置工具800中的滑塊)而構(gòu)造的可視化1000。選擇節(jié)點(diǎn)920可導(dǎo)致節(jié)點(diǎn)920被突出地顯示在前景中,而不連接到節(jié)點(diǎn)920的邊被從可視化900移除,由此減少混亂。更改工具800中的滑塊可使得可視化器組件430更新該可視化(例如,添加節(jié)點(diǎn)、移除節(jié)點(diǎn)、更改邊的長度等)。
[0071]圖11-14示出了與顯現(xiàn)數(shù)據(jù)集集合中的數(shù)據(jù)集間的關(guān)系有關(guān)的示例性方法。盡管各方法被表示和描述為順序地執(zhí)行的一系列動作,但要理解,這些方法不受該順序的次序的限制。例如,一些動作能以與本文描述的不同的次序發(fā)生。另外,某一動作可以與另一動作并發(fā)地發(fā)生。此外,在一些實(shí)例中,實(shí)現(xiàn)本文描述的方法并不需要所有動作。
[0072]此外,本文描述的動作可以是可由一個或多個處理器實(shí)現(xiàn)的和/或存儲在一個或多個計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可執(zhí)行指令。計(jì)算機(jī)可執(zhí)行指令可包括例程、子例程、程序、執(zhí)行的線程等。另外,這些方法的動作的結(jié)果可以存儲在計(jì)算機(jī)可讀介質(zhì)中,顯示在顯不設(shè)備上,等等。
[0073]現(xiàn)在參考圖11,示出了促成構(gòu)造數(shù)據(jù)立方體126的示例性方法1100。方法1100開始于1102,且在1104,訪問來自文檔源(例如,文檔源104-108之一)的文檔。在1106,文檔中詞語的出現(xiàn)被計(jì)數(shù)以確定這些詞語出現(xiàn)的次數(shù)。在一示例中,被計(jì)數(shù)的詞語可限于被指派給數(shù)據(jù)集的詞語。在另一示例中,每個詞語的出現(xiàn)(除了在停止列表中的詞語之外)均可被計(jì)數(shù)。
[0074]在1108,基于一詞語在文檔中的出現(xiàn)次數(shù),該詞語被標(biāo)記為該文檔的主要詞語。例如,主要詞語可以是在該文檔中最常出現(xiàn)的詞語。
[0075]在1110,從該文檔提取時間戳且生成標(biāo)識該文檔的源的數(shù)據(jù)。在1112,基于主要詞語、其它詞語在文檔中出現(xiàn)次數(shù)、時間戳、以及數(shù)據(jù)源來更新數(shù)據(jù)立方體。在1114,做出關(guān)于是否存在要考慮的附加文檔的判斷。如果存在要考慮的附加文檔,則方法1100返回1104。如果沒有其它文檔,則方法1100在1116完成。
[0076]現(xiàn)在參考圖12,示出了促成顯現(xiàn)數(shù)據(jù)集間的關(guān)系的示例性方法1200。方法1200開始于1202,并在1204,接收涉及第一詞語或第二詞語中的至少一者的查詢。例如,第一詞語可被指定為描述第一數(shù)據(jù)集的內(nèi)容,而第二詞語可被指定為描述第二數(shù)據(jù)集的內(nèi)容。例如,查詢可基于用戶選擇一數(shù)據(jù)集,其中第一詞語是該數(shù)據(jù)集的標(biāo)題。在1206,訪問數(shù)據(jù)立方體126并基于該查詢從該數(shù)據(jù)立方體提取計(jì)數(shù)值。計(jì)數(shù)值指示第一詞語在來自多個源文檔中的文檔子集中的聚集的出現(xiàn)次數(shù),其中第二詞語在該數(shù)據(jù)結(jié)構(gòu)中被標(biāo)識為該文檔子集中的每個文檔的主要詞語。如同上面所指示的,文檔的主要詞語可以是該文檔中最常出現(xiàn)的詞語。相應(yīng)地,一詞語可以是多個文檔的主要詞語。
[0077]在1208,基于計(jì)數(shù)值來構(gòu)造可視化,其中可視化指示第一數(shù)據(jù)集與第二數(shù)據(jù)集相關(guān)。示例性可視化以在上面被討論。在1210,將該可視化傳送至網(wǎng)絡(luò)可訪問的計(jì)算設(shè)備以在顯示器上呈現(xiàn)。方法1200在1212完成。
[0078]現(xiàn)在參考圖13,示出了用于向用戶描繪數(shù)據(jù)集間的關(guān)系的示例方法1300。方法1300開始于1302,且在1304,向服務(wù)器計(jì)算設(shè)備傳送對于可視化的請求,其中該請求標(biāo)識數(shù)據(jù)集和過濾器參數(shù)。例如,對于可視化的請求可響應(yīng)于用戶標(biāo)識感興趣的數(shù)據(jù)集并陳述查詢數(shù)據(jù)立方體126的準(zhǔn)則而被傳送。在1306,在傳送對于可視化的請求之后,從服務(wù)器計(jì)算設(shè)備接收該可視化。在1308,在顯示器上呈現(xiàn)該可視化以標(biāo)識與由用戶標(biāo)識的數(shù)據(jù)集相關(guān)的關(guān)系。方法1300在1310完成。
[0079]現(xiàn)在參考圖14,示出了促成響應(yīng)于接收用戶輸入而更新可視化的示例性方法1400ο方法1400開始于1402,且在1404,生成可視化,其中該可視化表示實(shí)體間的關(guān)系。例如,如上所述,該可視化可表示數(shù)據(jù)集間的關(guān)系,然而要理解,該可視化可表示其它類型的實(shí)體間的關(guān)系?;谠跀?shù)據(jù)立方體上執(zhí)行的查詢來生成該可視化,其中該數(shù)據(jù)立方體包括指示實(shí)體間的關(guān)系的值。而且,該查詢基于過濾器參數(shù)的值,其中該數(shù)據(jù)立方體被基于過濾器參數(shù)的值過濾(例如,切片或切割)。過濾器參數(shù)的值可由用戶設(shè)置,可以是默認(rèn)值等。如同前面所指示的,過濾器參數(shù)可以是時間、關(guān)系強(qiáng)度等。
[0080]在1406,接收關(guān)于該可視化的用戶輸入,其中該用戶輸入導(dǎo)致該過濾器參數(shù)的值的更新。例如,該用戶輸入可通過與該可視化一起被顯示在顯示器上的用戶界面控件來接收。這樣的用戶界面控件可以是滑塊、單選按鈕、下拉菜單、文本框、撥盤等。
[0081]在1408,響應(yīng)于接收到用戶輸入立即更新該可視化。即,該查詢被更新以反映過濾器參數(shù)的經(jīng)更新的值,且經(jīng)更新的查詢在該數(shù)據(jù)立方體上被執(zhí)行,從而導(dǎo)致從該數(shù)據(jù)立方體提取經(jīng)更新的關(guān)系數(shù)據(jù)。隨后基于從該立方體提取的經(jīng)更新的關(guān)系數(shù)據(jù)來更新該可視化,其中該可視化被在顯示器上顯示給用戶。聯(lián)系顯示經(jīng)更新的可視化,可呈現(xiàn)從先前的可視化到經(jīng)更新的可視化的平滑過渡。用戶隨后具有通過經(jīng)由與該可視化一起被顯示的用戶界面控件來陳述輸入來進(jìn)一步更新該過濾器參數(shù)(或另一過濾器參數(shù))的選詞語。方法1400在1410完成。
[0082]現(xiàn)在陳述涉及本文描述的方面的多個示例。
[0083]示例1:一種被配置成標(biāo)識數(shù)據(jù)集間的關(guān)系的計(jì)算系統(tǒng),所述計(jì)算系統(tǒng)包括:處理器;以及計(jì)算機(jī)可讀存儲,所述計(jì)算機(jī)可讀存儲包括由所述處理器執(zhí)行的組件,所述組件包括:過濾器組件,所述過濾器組件接收標(biāo)識第一詞語或第二詞語中的至少一者的查詢,所述第一詞語被指定為描述第一數(shù)據(jù)集的內(nèi)容,所述第二詞語被指定為描述第二數(shù)據(jù)集的內(nèi)容,所述過濾器組件進(jìn)一步響應(yīng)于接收所述查詢而訪問數(shù)據(jù)立方體并從所述數(shù)據(jù)立方體提取計(jì)數(shù)值,所述計(jì)數(shù)值指示所述第一詞語在來自多個源文檔中的文檔子集中的出現(xiàn)的聚集次數(shù),所述第二詞語在所述數(shù)據(jù)立方體中被標(biāo)識為所述文檔子集中的每個文檔的主要詞語;可視化器組件,所述可視化器組件基于由所述過濾器組件從所述數(shù)據(jù)立方體提取的所述計(jì)數(shù)值來形成可視化,所述可視化指示所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集相關(guān)。
[0084]示例2:如示例I所述的計(jì)算系統(tǒng),當(dāng)所述第二詞語在一文檔中的出現(xiàn)次數(shù)大于或等于所有其它詞語在所述文檔中的出現(xiàn)次數(shù)時,所述第二詞語是所述文檔的主要關(guān)鍵字。
[0085]示例3:如示例1-2中任一者所述的計(jì)算系統(tǒng),所述組件進(jìn)一步包括傳送器組件,所述傳送器組件向發(fā)出所述查詢的客戶端計(jì)算設(shè)備傳送所述可視化,所述客戶端計(jì)算設(shè)備在顯示器上呈現(xiàn)所述可視化。
[0086]示例4:如示例1-3中任一者所述的計(jì)算系統(tǒng),所述可視化器組件形成的所述可視化包括第一節(jié)點(diǎn)、第二節(jié)點(diǎn)、以及將所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)耦合的邊,所述第一節(jié)點(diǎn)表示所述第一數(shù)據(jù)集,所述第二節(jié)點(diǎn)表示所述第二數(shù)據(jù)集,且所述邊指示所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集相關(guān)。
[0087]示例5:如示例4所述的計(jì)算系統(tǒng),由所述可視化組件形成的所述可視化的邊具有一長度,所述長度指示所述計(jì)數(shù)值。
[0088]示例6:如示例4所述的計(jì)算系統(tǒng),由所述可視化組件形成的所述可視化的邊具有一寬度,所述寬度指示所述計(jì)數(shù)值。
[0089]示例7:如示例1-6中任一者所述的計(jì)算系統(tǒng),所述過濾器組件訪問所述數(shù)據(jù)立方體并基于在所述查詢中陳述的所述數(shù)據(jù)立方體的至少一個維度的值來提取所述計(jì)數(shù)值。
[0090]示例8:如示例1-7中任一者所述的計(jì)算系統(tǒng),所述至少一個維度是時間,所述至少一個維度的值指定一時間范圍,所述文檔子集中的每個文檔具有被指派給它的、指示所述文檔在所述查詢中陳述的所述時間范圍內(nèi)創(chuàng)建的相應(yīng)時間戳。
[0091]示例9:如示例8所述的計(jì)算系統(tǒng),所述至少一個維度是文檔的源,所述至少一個維度的值指定特定源,所述文檔子集中的每個文檔被標(biāo)記為已從所述特定源接收。
[0092]示例10:如示例1-9中任一者所述的計(jì)算系統(tǒng),所述組件進(jìn)一步包括:計(jì)數(shù)器組件,所述計(jì)數(shù)器組件訪問所述多個源文檔,并且針對所述多個源文檔中的每個文檔,計(jì)算所述第一詞語在所述文檔中的出現(xiàn)次數(shù)以及所述第二詞語在所述文檔中的出現(xiàn)次數(shù);以及數(shù)據(jù)結(jié)構(gòu)生成器組件,所述數(shù)據(jù)結(jié)構(gòu)生成器組件基于所述第一詞語在每個文檔中的出現(xiàn)次數(shù)和所述第二詞語在每個文檔中的出現(xiàn)次數(shù)來形成所述數(shù)據(jù)立方體。
[0093]示例11:如示例10所述的計(jì)算系統(tǒng),所述數(shù)據(jù)結(jié)構(gòu)生成器組件基于由所述計(jì)數(shù)器組件計(jì)算的所述第二詞語在所述文檔子集中的每個文檔中的出現(xiàn)的次數(shù)來確定所述第二詞語是所述文檔子集中的每個文檔的主要詞語。
[0094]示例12:如示例1-11中任一者所述的計(jì)算系統(tǒng),所述查詢包括過濾器參數(shù)的值,其中所述過濾器組件接收對通過用戶界面控件陳述的所述過濾器參數(shù)的值的更新,并且響應(yīng)于接收對所述過濾器參數(shù)的值的更新:更新所述查詢以包括所述過濾器參數(shù)的經(jīng)更新的值;以及在所述數(shù)據(jù)立方體上執(zhí)行經(jīng)更新的查詢來從所述數(shù)據(jù)立方體提取經(jīng)更新的計(jì)數(shù)值;以及進(jìn)一步其中所述可視化器組件基于所述經(jīng)更新的計(jì)數(shù)值生成經(jīng)更新的可視化,所述經(jīng)更新的可視化描繪在所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集之間的經(jīng)更改的關(guān)系。
[0095]示例13:—種用于可視化數(shù)據(jù)集間的關(guān)系的方法,所述方法包括:生成表示實(shí)體之間的第一關(guān)系的可視化,所述可視化是基于在數(shù)據(jù)立方體上執(zhí)行的查詢中包括的過濾器參數(shù)的值生成的,所述數(shù)據(jù)立方體包括指示所述實(shí)體間的關(guān)系的計(jì)數(shù)值;通過用戶界面控件接收關(guān)于所述可視化的用戶輸入,所述用戶輸入包括所述過濾器參數(shù)的經(jīng)更新的值;以及響應(yīng)于接收所述用戶輸入立即生成經(jīng)更新的可視化,所述經(jīng)更新的可視化是基于所述過濾器參數(shù)的經(jīng)更新的值生成的,所述經(jīng)更新的可視化表示所述實(shí)體之間的第二關(guān)系。
[0096]示例14:如示例13所述的方法,所述實(shí)體是數(shù)據(jù)集。
[0097]示例15:如示例14所述的方法,其中生成所述可視化包括:接收所述查詢,所述查詢標(biāo)識第一詞語或第二詞語中的至少一者,所述第一詞語被指定為描述所述數(shù)據(jù)集中的第一數(shù)據(jù)集的內(nèi)容,所述第二詞語被指定為描述所述數(shù)據(jù)集中的第二數(shù)據(jù)集的內(nèi)容;響應(yīng)于接收到所述查詢而從所述數(shù)據(jù)立方體中提取計(jì)數(shù)值,所述計(jì)數(shù)值指示所述第一詞語在來自多個源文檔中的文檔子集中的聚集的出現(xiàn)次數(shù),所述第二詞語在所述數(shù)據(jù)立方體中被標(biāo)識為所述文檔子集中的每個文檔的主要詞語;以及基于由所述過濾器組件從所述數(shù)據(jù)立方體提取的所述計(jì)數(shù)值來生成所述可視化,所述可視化指示所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集相關(guān)。
[0098]示例16:如示例15所述的方法,其中基于所述計(jì)數(shù)值生成所述可視化包括:形成表示所述第一數(shù)據(jù)集的第一節(jié)點(diǎn);形成表示所述第二數(shù)據(jù)集的第二節(jié)點(diǎn);以及用邊連接所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn),所述邊指示所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集相關(guān)。
[0099]示例17:如示例16所述的方法,其中用所述邊連接所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)包括:基于所述計(jì)數(shù)值計(jì)算所述邊的長度;以及用具有所述長度的邊來連接所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)。
[0100]示例18:如示例16-17中的任一者所述的方法,其中形成所述第一節(jié)點(diǎn)包括基于所述第一數(shù)據(jù)集中的條目的數(shù)量來計(jì)算所述第一節(jié)點(diǎn)的大小,以及其中形成所述第二節(jié)點(diǎn)包括基于所述第二數(shù)據(jù)集中的條目的數(shù)量來計(jì)算所述第二節(jié)點(diǎn)的大小。
[0101]示例19:如示例13-18中任一者所述的方法,其中所述用戶界面控件是滑塊、撥盤、文本框、或單選按鈕之一。
[0102]示例20:—種包括指令的計(jì)算機(jī)可讀存儲介質(zhì),所述指令當(dāng)由處理器執(zhí)行時使得所述處理器執(zhí)行動作,所述動作包括:響應(yīng)于標(biāo)識第一數(shù)據(jù)集或第二數(shù)據(jù)集中的至少一者的查詢的接收而訪問數(shù)據(jù)立方體并從所述數(shù)據(jù)立方體提取計(jì)數(shù)值,所述計(jì)數(shù)值指示文檔集合中包括所述第一詞語和所述第二詞語兩者的文檔的數(shù)量,所述第一詞語被指派給第一數(shù)據(jù)集,所述第二詞語被指派給第二數(shù)據(jù)集;以及基于所述計(jì)數(shù)值構(gòu)造可視化,所述可視化指示所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集相關(guān),所述可視化包括表示所述第一數(shù)據(jù)集的第一節(jié)點(diǎn)、表示所述第二數(shù)據(jù)集的第二節(jié)點(diǎn)、以及具有一長度的邊,所述邊連接所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn),所述長度指示從所述數(shù)據(jù)集提取的計(jì)數(shù)值。
[0103]示例21:—種用于可視化數(shù)據(jù)集間的關(guān)系的計(jì)算系統(tǒng),所述計(jì)算系統(tǒng)包括:用于生成表示實(shí)體之間的第一關(guān)系的可視化的裝置,所述可視化是基于在數(shù)據(jù)立方體上執(zhí)行的查詢中包括的過濾器參數(shù)的值生成的,所述數(shù)據(jù)立方體包括指示所述實(shí)體間的關(guān)系的計(jì)數(shù)值;用于通過用戶界面控件接收關(guān)于所述可視化的用戶輸入的裝置,所述用戶輸入包括所述過濾器參數(shù)的經(jīng)更新的值;以及用于響應(yīng)于接收所述用戶輸入立即生成經(jīng)更新的可視化的裝置,所述經(jīng)更新的可視化是基于所述過濾器參數(shù)的經(jīng)更新的值生成的,所述經(jīng)更新的可視化表示所述實(shí)體之間的第二關(guān)系。
[0104]現(xiàn)在參考圖15,示出了可以根據(jù)本文公開的系統(tǒng)和方法使用的示例性計(jì)算設(shè)備1500的高級圖示。例如,計(jì)算設(shè)備1500可以用在支持構(gòu)造數(shù)據(jù)立方體126的系統(tǒng)中。作為另一示例,計(jì)算設(shè)備1500可被用于支持生成描繪數(shù)據(jù)集間的關(guān)系的可視化的系統(tǒng)中。計(jì)算設(shè)備1500包括執(zhí)行存儲在存儲器1504中的指令的至少一個處理器1502。這些指令可以是例如用于實(shí)現(xiàn)被描述為由上述一個或多個組件執(zhí)行的功能的指令或用于實(shí)現(xiàn)上述方法中的一個或多個的指令。處理器1502可以通過系統(tǒng)總線1506訪問存儲器1504。除了存儲可執(zhí)行指令,存儲器1504還可存儲感興趣的詞語、數(shù)據(jù)立方體的至少一部分等。
[0105]此外,計(jì)算設(shè)備1500還包括可由處理器1502通過系統(tǒng)總線1506訪問的數(shù)據(jù)存儲1508。數(shù)據(jù)存儲1508可以包括可執(zhí)行指令、數(shù)據(jù)集、數(shù)據(jù)立方體126等等。計(jì)算設(shè)備1500還包括輸入接口 1510,輸入接口 1510允許外部設(shè)備與計(jì)算設(shè)備1500通信。例如,輸入接口 1510可被用于從外部計(jì)算機(jī)設(shè)備、從用戶等處接收指令。計(jì)算設(shè)備1500也可包括使計(jì)算設(shè)備1500和一個或多個外部設(shè)備相對接的輸出接口 1512。例如,計(jì)算設(shè)備1500可以通過輸出接口1512顯不文本、圖像等。
[0106]考慮了通過輸入接口1510和輸出接口 1512與計(jì)算設(shè)備1500通信的外部設(shè)備可被包括在提供實(shí)質(zhì)上任何類型的用戶可與之交互的用戶界面的環(huán)境中。用戶界面類型的示例包括圖形用戶界面、自然用戶界面等。例如,圖形用戶界面可接受來自用戶采用諸如鍵盤、鼠標(biāo)、遙控器等之類的(諸)輸入設(shè)備的輸入,以及在諸如顯示器之類的輸出設(shè)備上提供輸出。此外,自然語言界面可使得用戶能夠以無需受到諸如鍵盤、鼠標(biāo)、遙控器等之類的輸入設(shè)備強(qiáng)加的約束的方式來與計(jì)算設(shè)備1500交互。相反,自然用戶界面可依賴于語音識別、觸摸和指示筆識別、屏幕上和屏幕附近的姿勢識別、空中姿勢、頭部和眼睛跟蹤、語音和語音、視覺、觸摸、姿勢、以及機(jī)器智能等。
[0107]此外,盡管被示為單個系統(tǒng),但可以理解,計(jì)算設(shè)備1500可以是分布式系統(tǒng)。因此,例如,若干設(shè)備可以通過網(wǎng)絡(luò)連接進(jìn)行通信并且可共同執(zhí)行被描述為由計(jì)算設(shè)備1500執(zhí)行的任務(wù)。
[0108]本文中描述的各功能可在硬件、軟件或其任何組合中實(shí)現(xiàn)。如果在軟件中實(shí)現(xiàn),則這些功能可以作為一條或多條指令或代碼存儲在計(jì)算機(jī)可讀介質(zhì)上或藉其進(jìn)行傳送。計(jì)算機(jī)可讀介質(zhì)包括計(jì)算機(jī)可讀存儲介質(zhì)。計(jì)算機(jī)可讀存儲介質(zhì)可以是能被計(jì)算機(jī)訪問的任何可用存儲介質(zhì)。作為示例而非限定,這樣的計(jì)算機(jī)可讀介質(zhì)可包括RAM、ROM、EEPROM、⑶-ROM或其他光盤存儲、磁盤存儲或其他磁存儲設(shè)備、或能被用來承載或存儲指令或數(shù)據(jù)結(jié)構(gòu)形式的期望程序代碼且能被計(jì)算機(jī)訪問的任何其他介質(zhì)。如本文中所使用的盤(disk)和碟(disc)包括壓縮碟(CD)、激光碟、光碟、數(shù)字多用碟(DVD)、軟盤和藍(lán)光碟(BD),其中盤通常以磁的方式再現(xiàn)數(shù)據(jù),而碟通常用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。另外,所傳播的信號不被包括在計(jì)算機(jī)可讀存儲介質(zhì)的范圍內(nèi)。計(jì)算機(jī)可讀介質(zhì)還包括通信介質(zhì),該通信介質(zhì)包括促成將計(jì)算機(jī)程序從一地轉(zhuǎn)移到另一地的任何介質(zhì)。連接例如可以是通信介質(zhì)。例如,如果軟件使用同軸電纜、光纖電纜、雙絞線、數(shù)字訂戶線(DSL)、或諸如紅外線、無線電、以及微波之類的無線技術(shù)來從web網(wǎng)站、服務(wù)器、或其它遠(yuǎn)程源傳輸,則該同軸電纜、光纖電纜、雙絞線、DSL、或諸如紅外線、無線電、以及微波之類的無線技術(shù)被包括在通信介質(zhì)的定義中。上述的組合應(yīng)當(dāng)也被包括在計(jì)算機(jī)可讀介質(zhì)的范圍內(nèi)。
[0109]替換地或另選地,此處描述的功能可以至少部分由一個或多個硬件邏輯組件來執(zhí)行。例如、但非限制,可使用的硬件邏輯組件的說明性類型包括現(xiàn)場可編程門陣列(FPGA)、程序?qū)S玫募呻娐?ASIC)、程序?qū)S玫臉?biāo)準(zhǔn)產(chǎn)品(ASSP)、片上系統(tǒng)系統(tǒng)(SOC)、復(fù)雜可編程邏輯器件(CPLD)、等等。
[0110]以上所描述的包括一個或多個實(shí)施例的示例。當(dāng)然,出于描繪前述各方面的目的而描述上述設(shè)備或方法的每個可以想到修改和改變是不可能的,但本領(lǐng)域內(nèi)的普通技術(shù)人員可以認(rèn)識到,各方面的許多另外的組合和置換都是可能的。因此,所描述的各方面旨在包括所有這些屬于所附權(quán)利要求書的精神和范圍內(nèi)的改變、修改和變型。此外,就在詳細(xì)描述或權(quán)利要求書中使用術(shù)語“包括”而言,這一術(shù)語旨在以與術(shù)語“包含”在被用作權(quán)利要求書中的過渡詞時所解釋的相似的方式為包含性的。
【主權(quán)項(xiàng)】
1.一種被配置成標(biāo)識數(shù)據(jù)集間的關(guān)系的計(jì)算系統(tǒng),所述計(jì)算系統(tǒng)包括: 處理器;以及 計(jì)算機(jī)可讀存儲,所述計(jì)算機(jī)可讀存儲包括由所述處理器執(zhí)行的組件,所述組件包括: 過濾器組件,所述過濾器組件接收標(biāo)識第一詞語或第二詞語中的至少一者的查詢,所述第一詞語被指定為描述第一數(shù)據(jù)集的內(nèi)容,所述第二詞語被指定為描述第二數(shù)據(jù)集的內(nèi)容,所述過濾器組件進(jìn)一步響應(yīng)于接收所述查詢而訪問數(shù)據(jù)立方體并從所述數(shù)據(jù)立方體提取計(jì)數(shù)值,所述計(jì)數(shù)值指示所述第一詞語在來自多個源文檔中的文檔子集中的聚集的出現(xiàn)次數(shù),所述第二詞語在所述數(shù)據(jù)立方體中被標(biāo)識為所述文檔子集中的每個文檔的主要詞語; 可視化器組件,所述可視化器組件基于由所述過濾器組件從所述數(shù)據(jù)立方體提取的所述計(jì)數(shù)值來形成可視化,所述可視化指示所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集相關(guān)。2.如權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,當(dāng)所述第二詞語在一文檔中的出現(xiàn)次數(shù)大于或等于所有其它詞語在所述文檔中的出現(xiàn)次數(shù)時,所述第二詞語是所述文檔的主要關(guān)鍵字。3.如權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述組件進(jìn)一步包括傳送器組件,所述傳送器組件向發(fā)出所述查詢的客戶端計(jì)算設(shè)備傳送所述可視化,所述客戶端計(jì)算設(shè)備在顯示器上呈現(xiàn)所述可視化。4.如權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述可視化器組件形成的所述可視化包括第一節(jié)點(diǎn)、第二節(jié)點(diǎn)、以及將所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)耦合的邊,所述第一節(jié)點(diǎn)表示所述第一數(shù)據(jù)集,所述第二節(jié)點(diǎn)表示所述第二數(shù)據(jù)集,且所述邊指示所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集相關(guān)。5.如權(quán)利要求4所述的計(jì)算系統(tǒng),其特征在于,由所述可視化組件形成的所述可視化的邊具有一長度,所述長度指示所述計(jì)數(shù)值。6.如權(quán)利要求4所述的計(jì)算系統(tǒng),其特征在于,由所述可視化組件形成的所述可視化的邊具有一寬度,所述寬度指示所述計(jì)數(shù)值。7.如權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述過濾器組件訪問所述數(shù)據(jù)立方體并基于在所述查詢中陳述的所述數(shù)據(jù)立方體的至少一個維度的值來提取所述計(jì)數(shù)值。8.如權(quán)利要求7所述的計(jì)算系統(tǒng),其特征在于,所述至少一個維度是時間,所述至少一個維度的值指定一時間范圍,所述文檔子集中的每個文檔具有被指派給它的、指示所述文檔在所述查詢中陳述的所述時間范圍內(nèi)創(chuàng)建的相應(yīng)時間戳。9.如權(quán)利要求7所述的計(jì)算系統(tǒng),其特征在于,所述至少一個維度是文檔的源,所述至少一個維度的值指定特定源,所述文檔子集中的每個文檔被標(biāo)記為已從所述特定源接收。10.如權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述組件進(jìn)一步包括: 計(jì)數(shù)器組件,所述計(jì)數(shù)器組件訪問所述多個源文檔,并且針對所述多個源文檔中的每個文檔,計(jì)算所述第一詞語在所述文檔中的出現(xiàn)次數(shù)以及所述第二詞語在所述文檔中的出現(xiàn)次數(shù);以及 數(shù)據(jù)結(jié)構(gòu)生成器組件,所述數(shù)據(jù)結(jié)構(gòu)生成器組件基于所述第一詞語在每個文檔中的出現(xiàn)次數(shù)和所述第二詞語在每個文檔中的出現(xiàn)次數(shù)來形成所述數(shù)據(jù)立方體。11.如權(quán)利要求10所述的計(jì)算系統(tǒng),其特征在于,所述數(shù)據(jù)結(jié)構(gòu)生成器組件基于由所述計(jì)數(shù)器組件計(jì)算的所述第二詞語在所述文檔子集中的每個文檔中的出現(xiàn)次數(shù)來確定所述第二詞語是所述文檔子集中的每個文檔的主要詞語。12.如權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述查詢包括過濾器參數(shù)的值,其中所述過濾器組件接收對通過用戶界面控件陳述的所述過濾器參數(shù)的值的更新,并且響應(yīng)于接收對所述過濾器參數(shù)的值的更新: 更新所述查詢以包括所述過濾器參數(shù)的經(jīng)更新的值;以及 在所述數(shù)據(jù)立方體上執(zhí)行經(jīng)更新的查詢來從所述數(shù)據(jù)立方體提取經(jīng)更新的計(jì)數(shù)值;以及進(jìn)一步其中所述可視化器組件基于所述經(jīng)更新的計(jì)數(shù)值生成經(jīng)更新的可視化,所述經(jīng)更新的可視化描繪在所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)集之間的經(jīng)更改的關(guān)系。13.—種用于可視化數(shù)據(jù)集間的關(guān)系的方法,所述方法包括: 生成表示實(shí)體之間的第一關(guān)系的可視化,所述可視化是基于在數(shù)據(jù)立方體上執(zhí)行的查詢中包括的過濾器參數(shù)的值生成的,所述數(shù)據(jù)立方體包括指示所述實(shí)體間的關(guān)系的計(jì)數(shù)值; 通過用戶界面控件接收關(guān)于所述可視化的用戶輸入,所述用戶輸入包括所述過濾器參數(shù)的經(jīng)更新的值;以及 響應(yīng)于接收所述用戶輸入立即生成經(jīng)更新的可視化,所述經(jīng)更新的可視化是基于所述過濾器參數(shù)的經(jīng)更新的值生成的,所述經(jīng)更新的可視化表示所述實(shí)體之間的第二關(guān)系。14.如權(quán)利要求13所述的方法,其特征在于,所述實(shí)體是數(shù)據(jù)集。15.如權(quán)利要求14所述的方法,其特征在于,生成所述可視化包括: 接收所述查詢,所述查詢標(biāo)識第一詞語或第二詞語中的至少一者,所述第一詞語被指定為描述所述數(shù)據(jù)集中的第一數(shù)據(jù)集的內(nèi)容,所述第二詞語被指定為描述所述數(shù)據(jù)集中的第二數(shù)據(jù)集的內(nèi)容; 響應(yīng)于接收到所述查詢而從所述數(shù)據(jù)立方體中提取計(jì)數(shù)值,所述計(jì)數(shù)值指示所述第一詞語在來自多個源文檔中的文檔子集中的聚集的出現(xiàn)次數(shù),所述第二詞語在所述數(shù)據(jù)立方體中被標(biāo)識為所述文檔子集中的每個文檔的主要詞語;以及 基于由所述過濾器組件從所述數(shù)據(jù)立方體提取的所述計(jì)數(shù)值來生成所述可視化,所述可視化指示所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集相關(guān)。16.如權(quán)利要求15所述的方法,其特征在于,基于所述計(jì)數(shù)值生成所述可視化包括: 形成表示所述第一數(shù)據(jù)集的第一節(jié)點(diǎn); 形成表示所述第二數(shù)據(jù)集的第二節(jié)點(diǎn);以及 用邊連接所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn),所述邊指示所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集相關(guān)。17.如權(quán)利要求16所述的方法,其特征在于,用所述邊連接所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)包括: 基于所述計(jì)數(shù)值計(jì)算所述邊的長度;以及 用具有所述長度的邊來連接所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)。18.如權(quán)利要求16所述的方法,其特征在于,形成所述第一節(jié)點(diǎn)包括基于所述第一數(shù)據(jù)集中的條目的數(shù)量來計(jì)算所述第一節(jié)點(diǎn)的大小,以及其中形成所述第二節(jié)點(diǎn)包括基于所述第二數(shù)據(jù)集中的條目的數(shù)量來計(jì)算所述第二節(jié)點(diǎn)的大小。19.如權(quán)利要求13所述的方法,其特征在于,所述用戶界面控件是滑塊、撥盤、文本框、或單選按鈕之一。20.—種包括指令的計(jì)算機(jī)可讀存儲介質(zhì),所述指令當(dāng)由處理器執(zhí)行時使得所述處理器執(zhí)行動作,所述動作包括: 響應(yīng)于標(biāo)識第一數(shù)據(jù)集或第二數(shù)據(jù)集中的至少一者的查詢的接收而訪問數(shù)據(jù)立方體并從所述數(shù)據(jù)立方體提取計(jì)數(shù)值,所述計(jì)數(shù)值指示文檔集合中包括所述第一詞語和所述第二詞語兩者的文檔的數(shù)量,所述第一詞語被指派給第一數(shù)據(jù)集,所述第二詞語被指派給第二數(shù)據(jù)集;以及 基于所述計(jì)數(shù)值構(gòu)造可視化,所述可視化指示所述第一數(shù)據(jù)集與所述第二數(shù)據(jù)集相關(guān),所述可視化包括表示所述第一數(shù)據(jù)集的第一節(jié)點(diǎn)、表示所述第二數(shù)據(jù)集的第二節(jié)點(diǎn)、以及具有一長度的邊,所述邊連接所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn),所述長度指示從所述數(shù)據(jù)集提取的計(jì)數(shù)值。
【文檔編號】G06F17/30GK106030570SQ201480076137
【公開日】2016年10月12日
【申請日】2014年12月23日
【發(fā)明人】許建志, 廖勤櫻
【申請人】微軟技術(shù)許可有限責(zé)任公司