亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

大數(shù)據(jù)的篩選分析方法及系統(tǒng)的制作方法

文檔序號:10534865閱讀:763來源:國知局
大數(shù)據(jù)的篩選分析方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種大數(shù)據(jù)的篩選分析方法,包括多輪篩選分析,每一輪篩選分析包括:按照一個未選擇的篩選維度對待篩選數(shù)據(jù)組中的數(shù)據(jù)進行篩選分析;將滿足目標(biāo)要求的、對應(yīng)于篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組;其中,多輪篩選分析的輪數(shù)根據(jù)篩選維度的數(shù)量和目標(biāo)要求來確定。本發(fā)明還提供了相應(yīng)的篩選分析系統(tǒng)。本發(fā)明通過多輪篩選分析對數(shù)據(jù)進行逐步篩選,每輪篩選分析都將上輪的篩選結(jié)果作為本輪的待篩選數(shù)據(jù)組,使得每輪篩選分析都比上輪篩選分析的數(shù)據(jù)量小,與組合篩選相比,不會因數(shù)據(jù)量過大造成系統(tǒng)負(fù)擔(dān)過大從而崩潰的問題,且目標(biāo)要求根據(jù)待篩選數(shù)據(jù)組在該輪篩選分析的參考值設(shè)置,提高了篩選分析的準(zhǔn)確度。
【專利說明】
大數(shù)據(jù)的篩選分析方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及數(shù)據(jù)分析領(lǐng)域,具體涉及一種大數(shù)據(jù)的篩選分析方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著信息化的高速發(fā)展,大數(shù)據(jù)應(yīng)運而生,為了彌補傳統(tǒng)方法無法處理如此量大且非結(jié)構(gòu)的大數(shù)據(jù)的缺陷,人們研究出了云計算,以云計算為基礎(chǔ)的信息存儲、分享和挖掘手段,可以便宜、有效地將這些大量、高速、多變化的終端大數(shù)據(jù)存儲下來,然而如何對這些數(shù)據(jù)進行篩選分析,并且使用篩選結(jié)果從不同維度對企業(yè)決策進行指導(dǎo)已經(jīng)成為熱門話題。
[0003]現(xiàn)有技術(shù)中,對數(shù)據(jù)的篩選分析方法僅是對數(shù)據(jù)在某單一維度下進行展開分析,或者在多個維度下進行組合篩選。單一維度下的篩選缺陷在于如果數(shù)據(jù)信息點隱藏在多個篩選維度下,則很難被找到;組合篩選的缺陷在于確定某一維度子項以進行數(shù)據(jù)分析時,子項的選擇很大程度取決于做出判斷的人的經(jīng)驗,導(dǎo)致容易出現(xiàn)錯誤的判斷情況。無論是單一維度的篩選方式或是組合維度的篩選方式,針對篩選過程中因選擇了錯誤的篩選維度而無法得到最終的篩選結(jié)果時,均需要重新進行篩選,嚴(yán)重影響篩選效率。
[0004]例如,在視頻領(lǐng)域,通常在操作平臺上通過不同篩選維度的組合實現(xiàn)對目標(biāo)信息的流量或者卡頓情況的監(jiān)測分析,篩選維度包括:地域、城市、操作系統(tǒng)、瀏覽器、性別、年齡段等,現(xiàn)有技術(shù)的監(jiān)測方法是根據(jù)先前經(jīng)驗在所有篩選維度中分別選取其子項對目標(biāo)信息進行組合篩選分析,如果該目標(biāo)信息恰好為問題信息點,則完成監(jiān)測,否則重新選取篩選維度子項的其它排列組合進行篩選分析完成監(jiān)測。該方法雖然能實現(xiàn)對視頻流量、視頻卡頓等信息的監(jiān)測,但整個處理過程信息處理量大,導(dǎo)致處理器負(fù)擔(dān)較大,處理效率低,不利于推廣應(yīng)用。并且,即使利用該方法找到了疑似問題的信息點,由于存在大量其他排列組合的可能,因此也很難確認(rèn)該信息點就是最優(yōu)的。

【發(fā)明內(nèi)容】

[0005]本發(fā)明實施例提供一種大數(shù)據(jù)的篩選分析方法及系統(tǒng),用以解決現(xiàn)有技術(shù)中對數(shù)據(jù)在多維度下只能進行組合篩選的缺陷,實現(xiàn)對數(shù)據(jù)的多輪篩選分析以得到更準(zhǔn)確的篩選結(jié)果。
[0006]本發(fā)明實施例一方面提供一種大數(shù)據(jù)的篩選分析方法,包括多輪篩選分析,每一輪篩選分析包括:
[0007]按照一個未選擇的篩選維度對待篩選數(shù)據(jù)組中的數(shù)據(jù)進行篩選分析;
[0008]將滿足目標(biāo)要求的、對應(yīng)于所述篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組;
[0009]其中,所述多輪篩選分析的輪數(shù)根據(jù)篩選維度的數(shù)量和目標(biāo)要求來確定。
[0010]另一方面本發(fā)明實施例提供一種大數(shù)據(jù)的篩選分析系統(tǒng),配置以執(zhí)行多輪篩選分析,所述系統(tǒng)包括:
[0011]篩選分析單元,配置以按照一個未選擇的篩選維度對待篩選數(shù)據(jù)組中的數(shù)據(jù)進行篩選分析;
[0012]目標(biāo)要求確定單元,配置以提供目標(biāo)要求;
[0013]待篩選數(shù)據(jù)組生成單元,配置以將滿足目標(biāo)要求的、對應(yīng)于所述篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組;
[0014]其中,所述多輪篩選分析的輪數(shù)根據(jù)篩選維度的數(shù)量和目標(biāo)要求來確定。
[0015]本發(fā)明提供的篩選分析方法及系統(tǒng),通過多個篩選維度對待處理數(shù)據(jù)進行逐步篩選,形成多輪篩選分析,每一輪篩選分析都是將上一輪的篩選結(jié)果作為本輪篩選分析待篩選數(shù)據(jù)組,使得每輪篩選分析都比上一輪篩選分析的數(shù)據(jù)量小,因此與現(xiàn)有技術(shù)一次性在多個篩選條件下進行組合篩選相比,不容易因數(shù)據(jù)量過大造成系統(tǒng)負(fù)擔(dān)過大從而崩潰的問題,且每一輪篩選分析中要滿足的目標(biāo)要求均根據(jù)其待篩選數(shù)據(jù)組在該輪的篩選子項下的參考值設(shè)置,提高了篩選分析的準(zhǔn)確度。
【附圖說明】
[0016]為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0017]圖1是本發(fā)明一實施方式的篩選分析方法的流程圖;
[0018]圖2是本發(fā)明另一實施方式的篩選分析方法的流程圖;
[0019]圖3是本發(fā)明一實施方式的篩選分析系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0020]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0021]圖1是本發(fā)明一實施方式的篩選分析方法的流程圖。如圖1所示,該篩選分析方法包括多輪篩選分析過程。其中,每一輪篩選分析包括:
[0022]SlOl:按照一個未選擇的篩選維度對待篩選數(shù)據(jù)組中的數(shù)據(jù)進行篩選分析;
[0023]S102:將滿足目標(biāo)要求的、對應(yīng)于該輪篩選分析中篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組。
[0024]該篩選分析方法中多輪篩選分析的輪數(shù)由篩選維度的數(shù)量和目標(biāo)要求確定。
[0025]本發(fā)明實施例中通過對數(shù)據(jù)具有的屬性進行設(shè)定,并把適配的屬性設(shè)定為可篩選的屬性,即得到篩選維度。圖1所示實施例的篩選分析方法通過多個篩選維度對數(shù)據(jù)進行多輪篩選分析得到篩選結(jié)果,每一輪篩選分析都是將上一輪的篩選結(jié)果作為本輪篩選分析待篩選數(shù)據(jù)組,使得每輪篩選分析都比上一輪篩選分析的數(shù)據(jù)量小,因此與現(xiàn)有技術(shù)一次性在多個篩選條件下進行組合篩選相比,不容易因數(shù)據(jù)量過大造成系統(tǒng)負(fù)擔(dān)過大從而崩潰的問題,且每一輪篩選分析中要滿足的目標(biāo)要求均根據(jù)其待篩選數(shù)據(jù)組在該輪的篩選子項下的參考值設(shè)置,提高了篩選分析的準(zhǔn)確度。
[0026]圖2是本發(fā)明另一實施方式的篩選分析方法的流程圖。如圖2所示,該篩選分析方法包括多輪篩選分析過程。其中,每一輪篩選分析包括:
[0027]S201:按照一個未選擇的篩選維度對待篩選數(shù)據(jù)組中的數(shù)據(jù)進行篩選分析;
[0028]S202:將滿足目標(biāo)要求的、對應(yīng)于所述篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組;
[0029]S203:生成和保存相應(yīng)的篩選路徑。
[0030]該篩選分析方法中多輪篩選分析的輪數(shù)由篩選維度的數(shù)量和目標(biāo)要求確定。
[0031]圖2所示實施例的篩選分析方法,在步驟S202將滿足目標(biāo)要求的、對應(yīng)于所述篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組之后,還包括步驟S203:生成和保存相應(yīng)的篩選路徑。通過步驟S203,在每一輪篩選分析過后保存其篩選路徑,可以在以后查詢該待處理數(shù)據(jù)本次的篩選結(jié)果時,將保存好的篩選路徑作為組合查詢的入口,通過一次篩選就得到同樣的篩選結(jié)果,減少系統(tǒng)重復(fù)進行多輪篩選分析的負(fù)擔(dān)。
[0032]圖2所示實施例的篩選分析方法,當(dāng)某一輪的篩選分析未得到滿足目標(biāo)要求的數(shù)據(jù)時,若不再重新選擇篩選維度進行篩選分析,則表明之前的篩選路徑有誤,此時,還包括步驟S204:撤回有誤的篩選分析,刪除撤回的篩選分析下已生成和保存的篩選路徑。在篩選分析過程中,如果發(fā)現(xiàn)某一輪的選擇的維度子項有錯誤,篩選路徑不正確,通過撤回該輪篩選分析并刪除該篩選路徑,使得多輪篩選分析中除去該輪篩選分析得到的數(shù)據(jù)成為下一輪的待篩選數(shù)據(jù)組,可以避免從最初始的數(shù)據(jù)重新選擇刪除了該輪維度子項的篩選維度或其子項進行篩選分析的麻煩。
[0033]作為圖1或圖2所示方法實施例的進一步優(yōu)化,本發(fā)明實施例中的目標(biāo)要求包括:待篩選數(shù)據(jù)組中的數(shù)據(jù)對應(yīng)的數(shù)值最大、待篩選數(shù)據(jù)組中的數(shù)據(jù)對應(yīng)的數(shù)值最小以及最大數(shù)值和最小數(shù)值之差的絕對值大于預(yù)定閾值;或各維度子項下數(shù)據(jù)對應(yīng)的數(shù)值相對于參考值的波動范圍大于預(yù)定范圍。預(yù)定閾值、參考值和預(yù)定范圍根據(jù)歷史數(shù)據(jù)庫中的歷史數(shù)據(jù)來確定。本發(fā)明實施例可以將系統(tǒng)存有的大量的歷史結(jié)果數(shù)據(jù)作為參考,并以此設(shè)定閾值和范圍,利用待篩選數(shù)據(jù)組中在維度子項下的最大值、最小值和預(yù)定閾值或參考值和預(yù)定范圍進行篩選分析,且每次篩選分析得到的篩選結(jié)果均保存在歷史數(shù)據(jù)庫中,為以后的篩選分析作指導(dǎo),歷史數(shù)據(jù)庫不斷被越來越準(zhǔn)確的數(shù)據(jù)擴充和更新,相對現(xiàn)有技術(shù)中根據(jù)個人經(jīng)驗做出的選擇進行篩選分析來說準(zhǔn)確度更高。
[0034]圖3是本發(fā)明一實施方式的篩選分析系統(tǒng)的結(jié)構(gòu)示意圖。本發(fā)明所述的篩選分析方法可以基于本實施例中的篩選分析系統(tǒng)實施。如圖3所示,該篩選分析系統(tǒng)包括篩選分析單元、目標(biāo)要求確定單元和待篩選數(shù)據(jù)組生成單元。
[0035]篩選分析單元用于根據(jù)一個未選擇的篩選維度對待篩選數(shù)據(jù)組中的數(shù)據(jù)進行篩選分析。
[0036]目標(biāo)要求確定單元與篩選分析單元連接,用于提供目標(biāo)要求,提供的目標(biāo)要求包括:待篩選數(shù)據(jù)組中的數(shù)據(jù)對應(yīng)的數(shù)值最大的要求,待篩選數(shù)據(jù)組中的數(shù)據(jù)對應(yīng)的數(shù)值最小的要求,和最大數(shù)值和最小數(shù)值之差的絕對值大于預(yù)定閾值的要求;或各維度子項下數(shù)據(jù)對應(yīng)的數(shù)值相對于參考值的波動范圍大于預(yù)定范圍。
[0037]待篩選數(shù)據(jù)組生成單元與篩選分析單元連接,用于將滿足目標(biāo)要求的、對應(yīng)于該輪篩選分析中的篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪篩選分析的待篩選數(shù)據(jù)組。
[0038]作為圖3所示實施例系統(tǒng)的進一步優(yōu)化,圖3所示實施例中的篩選分析系統(tǒng)還可以包括與待篩選數(shù)據(jù)組連接的篩選路徑處理單元,用于在將滿足目標(biāo)要求的、對應(yīng)于篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組后,生成和保存相應(yīng)的篩選路徑。
[0039]篩選路徑處理單元還可以用于在每一輪篩選分析撤回后,刪除所述撤回的篩選分析下已生成和保存的篩選路徑。
[0040]作為圖3所示實施例系統(tǒng)的進一步優(yōu)化,本發(fā)明實施例的篩選分析系統(tǒng)還可以包括與目標(biāo)確定單元連接的預(yù)定閾值確定單元和歷史數(shù)據(jù)庫。預(yù)定閾值確定單元用于根據(jù)歷史數(shù)據(jù)庫中的歷史數(shù)據(jù)來確定預(yù)定閾值、參考值和預(yù)定范圍,歷史數(shù)據(jù)庫能夠根據(jù)所述多輪篩選分析后的篩選結(jié)果更新。
[0041]本發(fā)明實施例中可以通過硬件處理器(hardware processor)來實現(xiàn)相關(guān)功能模塊。
[0042]下面將以視頻領(lǐng)域中查看用戶的視頻流量的使用情況為例對本發(fā)明做進一步的說明。
[0043]企業(yè)想要在服務(wù)平臺上查看某特定時段內(nèi)用戶觀看視頻使用的流量以發(fā)現(xiàn)隱藏的信息時,先設(shè)置多個篩選維度,如地域、操作系統(tǒng)、瀏覽器等,其中每個篩選條件下都有各自的維度子項,例如,地域包括北京、上海、天津、廣東等中國的部分省份,操作系統(tǒng)包括Windows、Android、1S系統(tǒng),瀏覽器包括360瀏覽器、百度瀏覽器、谷歌瀏覽器。
[0044]執(zhí)行第一輪篩選分析,過程如下。
[0045]將初始數(shù)據(jù)庫中的數(shù)據(jù)即用戶觀看視頻使用的流量作為待篩選數(shù)據(jù)組,隨機選擇一個篩選維度,例如地域,在該篩選維度下進行篩選。目標(biāo)要求確定單元確定該輪篩選分析中目標(biāo)要求是尋找到地域維度的子項下用戶使用流量的最大值和最小值,且最大值和最小值之差大于預(yù)定閾值,預(yù)定閾值由預(yù)定閾值確定單元和歷史數(shù)據(jù)庫確定為1000T。
[0046]通過篩選分析單元得到北京、上海、天津、廣東等地的用戶觀看視頻使用的流量:北京的用戶使用了 568T,上海的用戶使用了 642T,天津的用戶使用了 295T,廣東的用戶使用了 1546T。由此得到最大值為廣東1546T,最小值為天津295T,同時最大最小值之差為1251T,大于預(yù)定閾值1000T。維度子項廣東和天津下的使用流量滿足數(shù)據(jù)要求,因此待篩選數(shù)據(jù)組生成單元將廣東和天津的使用流量保存為下一輪的待篩選數(shù)據(jù)組。并且,如步驟203所示,下一輪的待篩選數(shù)據(jù)組被保存后,篩選路徑處理單元生成和保存相應(yīng)的篩選路徑。
[0047]執(zhí)行第二輪篩選分析。
[0048]待篩選數(shù)據(jù)組已經(jīng)變?yōu)樘旖?、廣東地區(qū)用戶觀看視頻的流量。選擇操作系統(tǒng)作為本輪的篩選維度,目標(biāo)要求確定單元確定該輪篩選分析中目標(biāo)要求是尋找到操作系統(tǒng)維度的子項下用戶使用流量的最大值,同時計算最小值,且最大值和最小值之差大于預(yù)定閾值,本輪篩選分析中預(yù)定閾值由預(yù)定閾值確定單元和歷史數(shù)據(jù)庫確定為50T。
[0049]重復(fù)步驟202和步驟203:通過篩選分析單元得到廣東地區(qū)的用戶使用Windows、Android和1S操作系統(tǒng)觀看視頻使用的流量分別為658T、423T和460T,天津地區(qū)的用戶使用WindoWS、Android和1S操作系統(tǒng)觀看視頻使用的流量分別是132Τ、95Τ和60Τ,由此得到廣東地區(qū)的用戶使用流量的最大值為658T,最小值為423T,最大最小值之差為235T;天津地區(qū)的戶使用流量的最大值為132T,最小值為60T,最大最小值之差為72T。兩個地區(qū)的最大最小值均大于預(yù)定閾值,故廣東地區(qū)下使用Windows系統(tǒng)的用戶的流量和天津地區(qū)下使用Windows系統(tǒng)的用戶的流量滿足目標(biāo)要求。因此待篩選數(shù)據(jù)組生成單元將廣東和天津的用戶在使用Windows系統(tǒng)下觀看視頻使用的流量保存為下一輪的待篩選數(shù)據(jù)組。并且,如步驟203所示,下一輪的待篩選數(shù)據(jù)組被保存后,篩選路徑處理單元生成和保存相應(yīng)的篩選路徑。
[0050]執(zhí)行第三輪篩選分析。
[0051]篩選維度為瀏覽器,子項為360瀏覽器、百度瀏覽器和谷歌瀏覽器。目標(biāo)要求確定單元確定本輪篩選分析中的目標(biāo)要求是尋找到瀏覽器維度的子項下用戶使用流量的最大值,同時計算最小值,且最大值和最小值之差大于預(yù)定閾值,本輪篩選分析中預(yù)定閾值由預(yù)定閾值確定單元和歷史數(shù)據(jù)庫確定為各子項下最小數(shù)值的3倍數(shù)值。
[0052]通過篩選分析單元得到廣東地區(qū)Windows用戶使用360瀏覽器、百度瀏覽器和谷歌瀏覽器觀看視頻使用的流量分別為75T、31T和158T,天津地區(qū)Windows用戶使用360瀏覽器、百度瀏覽器和谷歌瀏覽器觀看視頻使用的流量分別是12T、5T和23T,由此得到廣東地區(qū)Windows用戶使用流量的最大值為158Τ,最小值為31Τ,最大最小值之差為127Τ,大于預(yù)定閾值92T ;天津地區(qū)Windows用戶使用流量的最大值為23T,最小值為5T,最大最小值之差為18T,大于預(yù)定閾值15T。兩地區(qū)的Windows用戶在該輪篩選分析中各自的子項下使用流量的最大最小值均大于預(yù)定閾值,故廣東地區(qū)Windows用戶使用谷歌瀏覽器觀看視頻的流量和天津地區(qū)Windows用戶使用谷歌瀏覽器觀看視頻的流量滿足目標(biāo)要求。此時待篩選數(shù)據(jù)組生成單元將廣東和天津的Windows用戶在谷歌瀏覽器下觀看視頻使用的流量保存為下一輪的待篩選數(shù)據(jù)組。并且,如步驟203所示,下一輪的待篩選數(shù)據(jù)組被保存后,篩選路徑處理單元生成和保存相應(yīng)的篩選路徑。
[0053]通過判斷得到所有篩選維度下的篩選分析均執(zhí)行完畢,故篩選結(jié)果為第三輪篩選分析中得到待篩選數(shù)據(jù)組,即廣東和天津的Windows用戶在谷歌瀏覽器下觀看視頻使用的流量。將該篩選結(jié)果保存在歷史數(shù)據(jù)庫中以更新歷史數(shù)據(jù)庫。第三輪篩選分析中篩選路徑處理單元生成和保存的篩選路徑可以作為下次查詢該特定時間內(nèi)用戶觀看視頻的流量使用情況的組合查詢的入口。
[0054]通過硬件處理器和服務(wù)平臺實現(xiàn)相關(guān)功能并將篩選結(jié)果顯示出來后,企業(yè)可以得出廣東地區(qū)和天津地區(qū)的用戶使用Windows系統(tǒng)觀看視頻產(chǎn)生的流量最多,且在Windows系統(tǒng)下使用谷歌瀏覽器觀看視頻產(chǎn)生的流量最多,并由此得出其他相應(yīng)的結(jié)論,以幫助企業(yè)的相關(guān)決策,例如為了避免廣東地區(qū)和天津地區(qū)使用Windows系統(tǒng)的用戶在高峰時期觀看視頻產(chǎn)生擁堵,為其調(diào)度更多的帶寬。
[0055]本實施例中的目標(biāo)要求也可以是其他參考條件下的要求,例如:各地區(qū)數(shù)據(jù)的排名與歷史數(shù)據(jù)庫中的參考值相比變化兩位以上等。例如,查找某視頻網(wǎng)站的視頻可用率為何偏低時,設(shè)定篩選維度有:地域、運營商、播放器、視頻ID、觀看占比。先選擇地域維度展開,根據(jù)目標(biāo)要求得到北京的視頻可用率與過去相比變化了兩位以上,選擇北京對應(yīng)的數(shù)據(jù)作為下一輪待篩選數(shù)據(jù)組。再選擇觀看占比維度進行篩選,發(fā)現(xiàn)沒有滿足目標(biāo)要求的數(shù)據(jù),故重新選擇運營商維度進行篩選。根據(jù)篩選分析系統(tǒng)選擇中國移動這一維度子項下的數(shù)據(jù)進行視頻ID維度下的篩選,得到經(jīng)過地域(北京)一一運營商(中國移動)一一視頻ID(視頻I和視頻2)篩選的數(shù)據(jù)。此時選擇播放器維度進行篩選,未發(fā)現(xiàn)滿足目標(biāo)要求的數(shù)據(jù),經(jīng)分析知選擇北京的篩選路徑有誤,刪除北京這一路徑,得到經(jīng)過運營商(中國移動)一一視頻ID(視頻I和視頻2)篩選的數(shù)據(jù)。再次選擇播放器維度,得到經(jīng)過運營商(中國移動)一一視頻ID(視頻I和視頻2)—一播放器(flash)篩選的數(shù)據(jù),篩選分析完成。得到結(jié)論:在中國移動網(wǎng)絡(luò)下,用flash打開的視頻I和視頻2的視頻可用率太低,進而拉低了整個網(wǎng)站的視頻可用率。找到拉低整個網(wǎng)站視頻可用率的原因后,可以對其進行相應(yīng)的修復(fù),例如刪除flash格式的視頻I和視頻2,或重新上傳,以提升該網(wǎng)站的用戶體驗。
[0056]以上所描述的實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動的情況下,即可以理解并實施。
[0057]通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實施方式可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件?;谶@樣的理解,上述技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在計算機可讀存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個實施例或者實施例的某些部分所述的方法。
[0058]最后應(yīng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。
【主權(quán)項】
1.一種大數(shù)據(jù)的篩選分析方法,包括多輪篩選分析,每一輪篩選分析包括: 按照一個未選擇的篩選維度對待篩選數(shù)據(jù)組中的數(shù)據(jù)進行篩選分析; 將滿足目標(biāo)要求的、對應(yīng)于所述篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組; 其中,所述多輪篩選分析的輪數(shù)根據(jù)篩選維度的數(shù)量和目標(biāo)要求來確定。2.根據(jù)權(quán)利要求1所述的篩選分析方法,其中,在所述將滿足目標(biāo)要求的、對應(yīng)于所述篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組后,生成和保存相應(yīng)的篩選路徑。3.根據(jù)權(quán)利要求2所述的篩選分析方法,其中,每一輪篩選分析能夠撤回,在撤回后,所述撤回的篩選分析下已生成和保存的篩選路徑被刪除。4.根據(jù)權(quán)利要求1-3中任一項所述的篩選分析方法,其中,所述目標(biāo)要求是所述待篩選數(shù)據(jù)組中的數(shù)據(jù)在各維度子項下對應(yīng)的數(shù)值最大或最小,并且最大數(shù)值和最小數(shù)值之差的絕對值大于預(yù)定閾值;或 各維度子項下數(shù)據(jù)對應(yīng)的數(shù)值相對于參考值的波動范圍大于預(yù)定范圍。5.根據(jù)權(quán)利要求4所述的篩選分析方法,其中,所述預(yù)定閾值、參考值和預(yù)定范圍根據(jù)歷史數(shù)據(jù)庫中的歷史數(shù)據(jù)來確定,并且所述歷史數(shù)據(jù)庫能夠根據(jù)所述多輪篩選分析后的篩選結(jié)果更新。6.—種大數(shù)據(jù)的篩選分析系統(tǒng),配置以執(zhí)行多輪篩選分析,所述系統(tǒng)包括: 篩選分析單元,配置以按照一個未選擇的篩選維度對待篩選數(shù)據(jù)組中的數(shù)據(jù)進行篩選分析; 目標(biāo)要求確定單元,配置以提供目標(biāo)要求; 待篩選數(shù)據(jù)組生成單元,配置以將滿足目標(biāo)要求的、對應(yīng)于所述篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組; 其中,所述多輪篩選分析的輪數(shù)根據(jù)篩選維度的數(shù)量和目標(biāo)要求來確定。7.根據(jù)權(quán)利要求6所述的篩選分析系統(tǒng),其中,還包括篩選路徑處理單元,配置以 在所述將滿足目標(biāo)要求的、對應(yīng)于所述篩選維度下的至少一個維度子項的數(shù)據(jù)保存為下一輪的待篩選數(shù)據(jù)組后,生成和保存相應(yīng)的篩選路徑。8.根據(jù)權(quán)利要求7所述的篩選分析系統(tǒng),其中,所述篩選路徑處理單元還配置以: 在每一輪篩選分析撤回后,刪除所述撤回的篩選分析下已生成和保存的篩選路徑。9.根據(jù)權(quán)利要求6-8中任一項所述的篩選分析系統(tǒng),其中,所述目標(biāo)要求確定單元提供有: 所述待篩選數(shù)據(jù)組中的數(shù)據(jù)對應(yīng)的數(shù)值最大的要求; 所述待篩選數(shù)據(jù)組中的數(shù)據(jù)對應(yīng)的數(shù)值最小的要求;和 最大數(shù)值和最小數(shù)值之差的絕對值大于預(yù)定閾值的要求;或 各維度子項下數(shù)據(jù)對應(yīng)的數(shù)值相對于參考值的波動范圍大于預(yù)定范圍的要求。10.根據(jù)權(quán)利要求9所述的篩選分析系統(tǒng),其中,還包括: 預(yù)定閾值確定單元和歷史數(shù)據(jù)庫, 所述預(yù)定閾值確定單元配置以根據(jù)所述歷史數(shù)據(jù)庫中的歷史數(shù)據(jù)來確定預(yù)定閾值、參考值和預(yù)定范圍,所述歷史數(shù)據(jù)庫配置以根據(jù)所述多輪篩選分析后的篩選結(jié)果更新。
【文檔編號】G06F17/30GK105893408SQ201510779664
【公開日】2016年8月24日
【申請日】2015年11月13日
【發(fā)明人】張幼明, 周猛
【申請人】樂視云計算有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1