亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

可實(shí)現(xiàn)多維度自由剖析的流量數(shù)據(jù)處理方法

文檔序號(hào):6599682閱讀:461來源:國(guó)知局
專利名稱:可實(shí)現(xiàn)多維度自由剖析的流量數(shù)據(jù)處理方法
技術(shù)領(lǐng)域
本發(fā)明涉及Web流量分析,尤其涉及一種可實(shí)現(xiàn)多維度自由剖析的流量數(shù)據(jù)處理方法。
背景技術(shù)
目前常用的Web流量分析系統(tǒng),都會(huì)內(nèi)置一些常用的報(bào)表,例如省份報(bào)表,搜索引 擎報(bào)表,關(guān)鍵詞報(bào)表等,這些構(gòu)成數(shù)據(jù)流量的維度,其所采用的數(shù)據(jù)處理方法是每個(gè)報(bào)表就 只需要對(duì)其中一張數(shù)據(jù)庫(kù)表進(jìn)行聚合運(yùn)算即可,報(bào)表與報(bào)表之間是沒有關(guān)聯(lián)的,所以這些 報(bào)表都是“靜態(tài)”的,也就是說,客戶拿到這些報(bào)表之后,他無法進(jìn)行其他操作。他即使對(duì)報(bào) 表中的部分?jǐn)?shù)據(jù)產(chǎn)生疑問,也沒有辦法做什么,因?yàn)樗蟹治鼍S度,都是針對(duì)全部流量數(shù)據(jù) 的,而不是針對(duì)某個(gè)報(bào)表的其中一部分流量數(shù)據(jù)。看起來提供了不少分析的維度,但是維度 之間都是孤立的,所有維度都是基于全部的流量數(shù)據(jù)(當(dāng)然,這里所說的全部的流量數(shù)據(jù), 準(zhǔn)確的說,應(yīng)該是某一段時(shí)間內(nèi)的全部流量數(shù)據(jù))進(jìn)行分析的,此時(shí),客戶只能看到類似圖 1所示孤立的三張報(bào)表??蛻裟玫酱藞?bào)表之后,也只能對(duì)自己的流量有個(gè)粗淺的認(rèn)識(shí),如果 客戶有更高級(jí)的需求,想交叉分析報(bào)表,想對(duì)其中一張報(bào)表中的部分?jǐn)?shù)據(jù)單獨(dú)進(jìn)行分析,例 如,客戶想查看來自“北京”和“廣東”的、并且是通過Google搜索過來的流量中,這些訪客 都搜索了哪些關(guān)鍵詞,以及每個(gè)關(guān)鍵詞最后都購(gòu)買了哪些商品,那么這類工具就無法解決 了。

發(fā)明內(nèi)容
針對(duì)以上缺陷,本發(fā)明的目的是提供一種流量數(shù)據(jù)處理方法,可以實(shí)現(xiàn)流量數(shù)據(jù) 的多維度自由剖析。為實(shí)現(xiàn)上述目的,本發(fā)明通過以下技術(shù)方案實(shí)現(xiàn)一種可實(shí)現(xiàn)多維度自由剖析的流量數(shù)據(jù)處理方法,采用0LAP(OnlineanalytiCal processing聯(lián)機(jī)分析處理)技術(shù),包括以下步驟(1)、將原始流量數(shù)據(jù)進(jìn)行規(guī)范并相應(yīng)的劃分為6個(gè)類別,分別是頁(yè)面訪問數(shù)據(jù)、 會(huì)話訪問數(shù)據(jù)、訪客訪問數(shù)據(jù)、廣告數(shù)據(jù)、電子商務(wù)數(shù)據(jù)和鼠標(biāo)點(diǎn)擊數(shù)據(jù),為這幾個(gè)類別分 別建立OLAP事實(shí)表(FactTable),不同流量數(shù)據(jù)之間通過會(huì)話標(biāo)識(shí)符和訪客身份標(biāo)識(shí)符建 立相應(yīng)的關(guān)聯(lián);(2)、針對(duì)每個(gè)數(shù)據(jù)類別建立適當(dāng)?shù)木S度,將相似的維度歸到一類,建立相應(yīng)的維 度表,表中數(shù)據(jù)生成唯一主鍵,然后分別和上述6大類別的流量數(shù)據(jù)會(huì)話進(jìn)行關(guān)聯(lián);(3)、根據(jù)上述事實(shí)表和維度表建立OLAP數(shù)據(jù)立方體,通過 MDX(Multidimensional Expressions多維表達(dá)式)語(yǔ)言生成最終報(bào)表。本發(fā)明通過對(duì)原始流量數(shù)據(jù)進(jìn)行相應(yīng)的歸類并建立相應(yīng)的關(guān)聯(lián),同時(shí),對(duì)于每個(gè) 類別的流量數(shù)據(jù)和所有維度之間,也建立了相應(yīng)的關(guān)聯(lián)。使所有歸類后的數(shù)據(jù)都共用這些 維度數(shù)據(jù),因此可以使用多維度去逐層剖析數(shù)據(jù),實(shí)現(xiàn)了對(duì)流量數(shù)據(jù)的多維度自由剖析,用戶可以取出報(bào)表中任意一部分流量數(shù)據(jù),使用多個(gè)維度進(jìn)行逐步自由的剖析,不斷的篩選, 直至得到最終想要的數(shù)據(jù)報(bào)表。


下面根據(jù)實(shí)施例與附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明。圖1是現(xiàn)有Web流量分析系統(tǒng)所生成的相互孤立的報(bào)表形式示意圖;圖2是采用本發(fā)明所述方法歸類之后的數(shù)據(jù)之間的相關(guān)關(guān)系圖;圖3是示例中會(huì)話數(shù)據(jù)的流量數(shù)據(jù)和維度之間的關(guān)系圖;圖4-圖6是針對(duì)原始數(shù)據(jù)建立維度表和由維度表生成事實(shí)表的原理圖;圖7是根據(jù)事實(shí)表和維度表所建立的OLAP數(shù)據(jù)立方體。
具體實(shí)施例方式為了實(shí)現(xiàn)多維度自由的剖析流量數(shù)據(jù),我們WebDissector后臺(tái)系統(tǒng)采用了 OLAP(online analytical processing聯(lián)機(jī)分析處理)技術(shù),將原始流量數(shù)據(jù)進(jìn)行規(guī)范并相 應(yīng)的劃分為6個(gè)類別,分別是頁(yè)面訪問數(shù)據(jù)、會(huì)話訪問數(shù)據(jù)、訪客訪問數(shù)據(jù)、廣告數(shù)據(jù)、電子 商務(wù)數(shù)據(jù)和鼠標(biāo)點(diǎn)擊數(shù)據(jù),歸類之后的數(shù)據(jù)并不是孤立的,而是有一定關(guān)聯(lián),關(guān)系圖如圖2 所示。他們之間的關(guān)聯(lián),是通過兩個(gè)核心的標(biāo)識(shí)符來實(shí)現(xiàn)的,其中一個(gè)是會(huì)話標(biāo)識(shí)符,用來 將同一次會(huì)話(我們將同個(gè)訪客相近的頁(yè)面訪問歸結(jié)到一次會(huì)話中)的數(shù)據(jù),包括廣告數(shù) 據(jù),點(diǎn)擊數(shù)據(jù)等串到一起;另外一個(gè)是訪客身份標(biāo)識(shí)符,用來唯一標(biāo)示一個(gè)訪客的,我們用 此標(biāo)識(shí)符來將一個(gè)訪客長(zhǎng)期以來的訪問數(shù)據(jù)串到一起。所有歸類之后的流量數(shù)據(jù)都包含了 這兩個(gè)重要的標(biāo)示符,因此才能建立上圖中的各種復(fù)雜的關(guān)系。針對(duì)每個(gè)數(shù)據(jù)類別建立適當(dāng)?shù)木S度,對(duì)于每個(gè)類別的流量數(shù)據(jù)和所有維度之間, 也是有相應(yīng)的關(guān)聯(lián);舉會(huì)話數(shù)據(jù)為例,如圖3所示。如圖4所示,給出了一個(gè)會(huì)話的原始數(shù)據(jù),其中省份和城市是同一類的,將其歸為 “地理環(huán)境表”作為一個(gè)維度,建立相應(yīng)的維度表,搜索引擎和關(guān)鍵詞是一類的,將其納入 “會(huì)話來源表”作為一個(gè)維度,建立相應(yīng)的維度表,并為每一個(gè)維度表中的數(shù)據(jù)分配一個(gè)主 鍵;通過引用相應(yīng)維度表的主鍵,建立相應(yīng)的OLAP事實(shí)表(FactTable)。即通過建立事實(shí) 表和維度表來組織數(shù)據(jù)之間的關(guān)系,這樣就產(chǎn)生了如圖5所示結(jié)構(gòu)。通過這種方式,后臺(tái)系統(tǒng)的存儲(chǔ)復(fù)雜性就大大降低了,數(shù)據(jù)的一致性得以保證,同 時(shí),可通過引用相應(yīng)維度表中的主鍵,得到流量數(shù)據(jù)生成相應(yīng)的報(bào)表,不同事實(shí)表之間可以 重用相同的維度表,例如電子商務(wù)的數(shù)據(jù)也可以引用同樣的地理維度表和來源維度表,如 圖6所示。由于一個(gè)事實(shí)表直接關(guān)聯(lián)著幾個(gè)維度表,我們就能建立如圖7所示的數(shù)據(jù)倉(cāng)庫(kù)儲(chǔ)存結(jié)構(gòu),它是一個(gè)典型的3維的數(shù)據(jù)立方體,每個(gè)單元格都對(duì)應(yīng)著一批會(huì)話??蛻艨梢园凑?自己的意愿精準(zhǔn)定位出他關(guān)注的流量,例如圖7中深色單元格所示的,是“來自北京”并且 通過“Sogou搜索引擎”搜索“推廣”關(guān)鍵詞來到網(wǎng)站的流量,總共有37次訪問,通過建立這 種OLAP數(shù)據(jù)立方體,進(jìn)一步可利用MDX (Multidimensional Expressions多維表達(dá)式)語(yǔ) 言生成最終報(bào)表。上述例子展示的是3維的剖析過程,我們甚至可以把這個(gè)“流量單元格”取出來,作為一個(gè)新的數(shù)據(jù)立方體,使用新的維度進(jìn)行剖析,最終能達(dá)到采用多維度去逐層剖析數(shù)據(jù),不斷的篩選,直至得到最終想要的數(shù)據(jù)報(bào)表。
權(quán)利要求
一種可實(shí)現(xiàn)多維度自由剖析的流量數(shù)據(jù)處理方法,采用OLAP(onlineanalytical processing聯(lián)機(jī)分析處理)技術(shù),其特征在于包括以下步驟(1)、將原始流量數(shù)據(jù)進(jìn)行規(guī)范并相應(yīng)的劃分為6個(gè)類別,分別是頁(yè)面訪問數(shù)據(jù)、會(huì)話訪問數(shù)據(jù)、訪客訪問數(shù)據(jù)、廣告數(shù)據(jù)、電子商務(wù)數(shù)據(jù)和鼠標(biāo)點(diǎn)擊數(shù)據(jù),為這幾個(gè)類別分別建立OLAP事實(shí)表(FactTable),不同流量數(shù)據(jù)之間通過會(huì)話標(biāo)識(shí)符和訪客身份標(biāo)識(shí)符建立相應(yīng)的關(guān)聯(lián);(2)、針對(duì)每個(gè)數(shù)據(jù)類別建立適當(dāng)?shù)木S度,將相似的維度歸到一類,建立相應(yīng)的維度表,表中數(shù)據(jù)生成唯一主鍵,然后分別和上述6大類別的流量數(shù)據(jù)會(huì)話進(jìn)行關(guān)聯(lián);(3)、根據(jù)上述事實(shí)表和維度表建立OLAP數(shù)據(jù)立方體,通過MDX(Multidimensional Expressions多維表達(dá)式)語(yǔ)言生成最終報(bào)表。
全文摘要
本發(fā)明提供了一種可實(shí)現(xiàn)多維度自由剖析的流量數(shù)據(jù)處理方法,采用OLAP(online analytical processing聯(lián)機(jī)分析處理)技術(shù),通過對(duì)原始流量數(shù)據(jù)進(jìn)行相應(yīng)的歸類并建立相應(yīng)的關(guān)聯(lián),同時(shí),對(duì)于每個(gè)類別的流量數(shù)據(jù)和所有維度之間,也建立了相應(yīng)的關(guān)聯(lián),并使所有歸類后的數(shù)據(jù)都共用這些維度數(shù)據(jù),因此可以使用多維度去逐層剖析數(shù)據(jù),實(shí)現(xiàn)了對(duì)流量數(shù)據(jù)的多維度自由剖析,用戶可以取出報(bào)表中任意一部分流量數(shù)據(jù),使用多個(gè)維度進(jìn)行逐步自由的剖析,不斷的篩選,直至得到最終想要的數(shù)據(jù)報(bào)表。
文檔編號(hào)G06F17/30GK101799830SQ20101013155
公開日2010年8月11日 申請(qǐng)日期2010年3月25日 優(yōu)先權(quán)日2010年3月25日
發(fā)明者吳充, 楊基彬, 祁國(guó)晟, 鐘志龍, 黃勇堅(jiān) 申請(qǐng)人:北京國(guó)雙科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1