亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

熱點(diǎn)數(shù)據(jù)識(shí)別方法和裝置的制造方法_2

文檔序號(hào):9687523閱讀:來源:國知局
031] 在步驟S102中,根據(jù)文件名、文件內(nèi)容、文件訪問順序、文件位置中的至少一項(xiàng)信 息確定被訪問熱點(diǎn)文件的關(guān)聯(lián)文件的一種實(shí)現(xiàn)方法具體如下:
[0032] 步驟S102a,計(jì)算被訪問熱點(diǎn)文件與其他文件之間的文件名關(guān)聯(lián)系數(shù),選取文件名 關(guān)聯(lián)系數(shù)最大的預(yù)設(shè)數(shù)量的文件作為第一關(guān)聯(lián)集合。
[0033] 一種示例性的方法,可W通過Apriori算法(例如k-means算法)計(jì)算被訪問熱 點(diǎn)文件與其他文件之間的文件名關(guān)聯(lián)系數(shù)。具體來說,可W建立文件名關(guān)鍵字索引表(如 表1所示),根據(jù)文件名關(guān)鍵字索引表例如采用W下公式計(jì)算被訪問熱點(diǎn)文件與其他文件 之間的文件名關(guān)聯(lián)系數(shù):
[0034] Ni = support (化,巧)/suppo;rt ({巧)
[0035] 其中,Ni表示被訪問熱點(diǎn)文件F與文件Fi之間的文件名關(guān)聯(lián)系數(shù),suppod (.)表 示相關(guān)數(shù)據(jù)在索引表中出現(xiàn)的次數(shù),例如,suppod({Fi,巧)表示化,巧在文件名關(guān)鍵字索 引表中出現(xiàn)的次數(shù),suppod({F})表示{巧在文件名關(guān)鍵字索引表中出現(xiàn)的次數(shù)。
[0036] 表 1
[0037]
[003引另外,例如可W選取文件名關(guān)聯(lián)系數(shù)最大的m個(gè)文件作為第一關(guān)聯(lián)集合FN,F(xiàn)N = (化1,化2,…,fnm},m值可W根據(jù)熱點(diǎn)文件識(shí)別精度需要進(jìn)行設(shè)置。
[0039] 步驟S102b,計(jì)算被訪問熱點(diǎn)文件與其他文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù),選取文件 內(nèi)容關(guān)聯(lián)系數(shù)最大的預(yù)設(shè)數(shù)量的文件作為第二關(guān)聯(lián)集合。
[0040] -種示例性的方法,可W通過Apriori算法(例如k-means算法)計(jì)算被訪問熱 點(diǎn)文件與其他文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù)。具體來說,可W建立文件內(nèi)容關(guān)鍵字索引表 (如表2所示),根據(jù)文件內(nèi)容關(guān)鍵字索引表例如采用W下公式計(jì)算被訪問熱點(diǎn)文件與其他 文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù):
[0041] 。= support (化,F(xiàn)}) /suppo;rt ({巧)
[0042] 其中,。表示被訪問熱點(diǎn)文件F與文件Fi之間的文件內(nèi)容關(guān)聯(lián)系數(shù),support (.) 表示相關(guān)數(shù)據(jù)在索引表中出現(xiàn)的次數(shù),例如,suppcxrt({Fi,巧)表示化,巧在文件內(nèi)容關(guān)鍵 字索引表中出現(xiàn)的次數(shù),suppod({F})表示{巧在文件內(nèi)容關(guān)鍵字索引表中出現(xiàn)的次數(shù)。
[0043] 表 2
[0044]
[0045] 另外,例如可W選取文件內(nèi)容關(guān)聯(lián)系數(shù)最大的m個(gè)文件作為第二關(guān)聯(lián)集合FC,F(xiàn)C ={fcl,fc2,…,fcm},m值可W根據(jù)熱點(diǎn)文件識(shí)別精度需要進(jìn)行設(shè)置。
[0046] 步驟S102C,獲取在被訪問熱點(diǎn)文件之前最近被訪問的預(yù)設(shè)數(shù)量的文件作為第Η 關(guān)聯(lián)集合。
[0047] 例如,獲取在被訪問熱點(diǎn)文件F之前最近被訪問的m個(gè)文件作為第Η關(guān)聯(lián)集合FA, FA =柏1,化2,…,fam},m值可W根據(jù)熱點(diǎn)文件識(shí)別精度需要進(jìn)行設(shè)置。
[0048] 步驟S102d,獲取與被訪問熱點(diǎn)文件在同一目錄下的文件作為第四關(guān)聯(lián)集合抑, FD 二(fdl,fd2,...,fdm,…}。
[0049] 步驟S102e,將第一關(guān)聯(lián)集合、第二關(guān)聯(lián)集合、第蘭關(guān)聯(lián)集合和第四關(guān)聯(lián)集合中至 少一個(gè)集合中的文件作為被訪問熱點(diǎn)文件的關(guān)聯(lián)文件。例如,可W將四個(gè)集合中的文件作 為被訪問熱點(diǎn)文件的關(guān)聯(lián)文件,也可W選取任意一個(gè)集合、任意兩個(gè)集合或任意Η個(gè)集合 中的文件作為被訪問熱點(diǎn)文件的關(guān)聯(lián)文件。選取的關(guān)聯(lián)集合越多,所確定的關(guān)聯(lián)文件的范 圍也越大,熱點(diǎn)文件的命中率也就越高。
[0050] 通過上述步驟S102a~S102e就可W確定出某一文件的關(guān)聯(lián)文件,本實(shí)施例應(yīng)用 上述方法可W確定被訪問熱點(diǎn)文件的關(guān)聯(lián)文件。
[0051] 在步驟S104中,確定被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度的一種實(shí) 現(xiàn)方法具體如下:
[0052] 步驟S104a,計(jì)算被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù),具體的計(jì) 算方法可W參考前述。另外,如果S102a計(jì)算結(jié)果中已經(jīng)包括被訪問熱點(diǎn)文件與其關(guān)聯(lián)文 件之間的文件名關(guān)聯(lián)系數(shù),則此處無需重復(fù)計(jì)算,可W直接采用S102a中的計(jì)算結(jié)果。
[0053] 步驟S104b,計(jì)算被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù),具體的 計(jì)算方法可W參考前述。另外,如果S10化計(jì)算結(jié)果中已經(jīng)包括被訪問熱點(diǎn)文件與其關(guān)聯(lián) 文件之間的文件內(nèi)容名關(guān)聯(lián)系數(shù),則此處無需重復(fù)計(jì)算,可W直接采用S10化中的計(jì)算結(jié) 果。
[0054] 步驟S104C,根據(jù)各個(gè)關(guān)聯(lián)文件的訪問順序計(jì)算每個(gè)關(guān)聯(lián)文件的文件訪問順序系 數(shù)。
[0055] -種示例性的文件訪問順序系數(shù)計(jì)算方法如下;按照訪問順序?qū)λ械年P(guān)聯(lián)文件 進(jìn)行排序,并設(shè)置訪問值,越近被訪問的文件對(duì)應(yīng)的訪問值越大,然后可W根據(jù)如下公式計(jì) 算文件訪問順序系數(shù):
[0056]
[0057] 其中,Ai表示關(guān)聯(lián)文件FRi的文件訪問順序系數(shù),曰1表示關(guān)聯(lián)文件FRi的訪問值,m 表示被訪問熱點(diǎn)文件的關(guān)聯(lián)文件的數(shù)量。
[0058] 步驟S104d,根據(jù)被訪問熱點(diǎn)文件與關(guān)聯(lián)文件是否在同一目錄下確定關(guān)聯(lián)文件的 文件位置系數(shù)。
[0059] -種示例性的關(guān)聯(lián)文件的文件位置系數(shù)確定方法如下;如果被訪問熱點(diǎn)文件與關(guān) 聯(lián)文件在同一目錄下,則該關(guān)聯(lián)文件的文件位置系數(shù)Di設(shè)置為1,如果被訪問熱點(diǎn)文件與關(guān) 聯(lián)文件不在同一目錄下,則該關(guān)聯(lián)文件的文件位置系數(shù)Di設(shè)置為0。
[0060] 步驟S104e,根據(jù)被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi) 容關(guān)聯(lián)系數(shù)、W及關(guān)聯(lián)文件的文件訪問順序系數(shù)和文件位置系數(shù),使用歐幾里德距離算法 確定被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度。
[0061] 一種示例性的文件關(guān)聯(lián)度計(jì)算方法的公式表示如下:
[0062]
[006引其中,Ri表示被訪問熱點(diǎn)文件F與其關(guān)聯(lián)文件FRi之間的文件關(guān)聯(lián)度,Wn、Wc、Wa、 Wd分別表示文件名關(guān)聯(lián)系數(shù)Ni、文件內(nèi)容關(guān)聯(lián)系數(shù)Ci、文件訪問順序系數(shù)Ai、文件位置系數(shù) Di對(duì)應(yīng)的權(quán)重值。
[0064] 在步驟S106中,根據(jù)被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度W及關(guān)聯(lián) 文件的訪問熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重的一種實(shí)現(xiàn)方法如下:設(shè)置文件關(guān)聯(lián)度和訪 問熱度信息在熱度權(quán)重中所占的熱度系數(shù);根據(jù)被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件 關(guān)聯(lián)度及其熱度系數(shù),并且結(jié)合關(guān)聯(lián)文件的訪問熱度信息及其熱度系數(shù),綜合確定關(guān)聯(lián)文 件的熱度權(quán)重。W訪問熱度信息使訪問時(shí)間和訪問頻率為例,計(jì)算關(guān)聯(lián)文件的熱度權(quán)重的 公式表示如下:
[0065]
[0066] 其中,化表示關(guān)聯(lián)文件F化的熱度權(quán)重,Tf表示被訪問熱點(diǎn)文件F的訪問時(shí)間, Ti表示關(guān)聯(lián)文件F化的訪問時(shí)間,Pm。,表示文件訪問的最大頻率,Pi表示關(guān)聯(lián)文件F化的 訪問頻率,Wr、Wt、Wp分別表示文件關(guān)聯(lián)度、文件訪問時(shí)間、文件訪問頻率的權(quán)重值。
[0067] 在步驟S108中,根據(jù)關(guān)聯(lián)文件的熱度權(quán)重從各關(guān)聯(lián)文件中識(shí)別熱點(diǎn)文件,例如, 可W選取熱度權(quán)重最大的預(yù)設(shè)數(shù)量的關(guān)聯(lián)文件作為熱點(diǎn)文件,也可W選取熱度權(quán)重大于預(yù) 設(shè)權(quán)重闊值的關(guān)聯(lián)文件作為熱點(diǎn)文件。
[0068] 在識(shí)別出熱點(diǎn)文件之后,如果本地緩存中沒有識(shí)別出的熱點(diǎn)文件,從云端下載該 熱點(diǎn)文件,從而提高本地文件訪問速度;和/或,如果本地緩存中存留有非熱點(diǎn)文件(熱點(diǎn) 文件之外的其他文件),從本地緩存中刪除該非熱點(diǎn)文件,從而節(jié)省存儲(chǔ)資源。
[0069] 上述實(shí)施例通過文件名、文件內(nèi)容、訪問順序、文件位置等信息計(jì)算文件關(guān)聯(lián)度, 再結(jié)合訪問時(shí)間、訪問頻度預(yù)判文件熱度,提高用戶所需要的熱點(diǎn)數(shù)據(jù)的命中率,提高本地 文件訪問速度。
[0070] 本發(fā)明實(shí)施例還提出一種熱點(diǎn)數(shù)據(jù)識(shí)別裝置。圖2是本實(shí)施例熱點(diǎn)數(shù)據(jù)識(shí)別裝置 一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。如圖2所示,本實(shí)施例的熱點(diǎn)數(shù)據(jù)識(shí)別裝置包括:
[0071] 關(guān)聯(lián)文件確定單元202,用于根據(jù)文件名、文件內(nèi)容、文件訪問順序、文件位置中的 至少一項(xiàng)信息確定被訪問熱點(diǎn)文件的關(guān)聯(lián)文件;
[0072] 文件關(guān)聯(lián)度確定單元204,用于確定被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān) 聯(lián)度;
[0073] 熱度權(quán)重確定單元206,用于根據(jù)被訪問熱點(diǎn)文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián) 度W及關(guān)聯(lián)文件的訪問熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重;
[0074] 熱點(diǎn)文件識(shí)別單元208,用于根據(jù)關(guān)聯(lián)文件的熱度權(quán)重從關(guān)聯(lián)文件中識(shí)別出熱點(diǎn) 文件。
[0075] 在一個(gè)實(shí)施例中,關(guān)聯(lián)文件確定單元202,具體用于根據(jù)文件名、文件內(nèi)容、文件訪 問順序、文件位置中的至少一項(xiàng)信息確定被訪問熱點(diǎn)文件的關(guān)聯(lián)文件:計(jì)算被訪問熱點(diǎn)文 件與其他文件之間的文件名關(guān)聯(lián)系數(shù),選取文件名關(guān)聯(lián)系數(shù)最大的預(yù)設(shè)數(shù)量的文件作為第 一關(guān)聯(lián)集合;計(jì)算被訪問熱點(diǎn)文件與其他文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù),選取文件內(nèi)容關(guān) 聯(lián)系數(shù)最大
當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1