熱點數(shù)據(jù)識別方法和裝置的制造方法

文檔序號：9687523閱讀：248來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

熱點數(shù)據(jù)識別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及云計算領(lǐng)域，特別涉及一種熱點數(shù)據(jù)識別方法和裝置。
【背景技術(shù)】
[0002] 在云存儲系統(tǒng)中，熱點數(shù)據(jù)多依據(jù)數(shù)據(jù)的訪問頻度、數(shù)據(jù)訪問時間等信息來確定。用戶通常可W將熱點數(shù)據(jù)從云端遷移至本地，從而提高訪問效率。
[0003] 但是，按照目前的熱點數(shù)據(jù)識別方法，識別的各個熱點數(shù)據(jù)之間很可能毫無關(guān)系，受限于存儲資源、網(wǎng)絡(luò)資源等因素，用戶通常很難將全部熱點數(shù)據(jù)從云端遷移至本地，即便可W將全部熱點數(shù)據(jù)從云端遷移至本地，其中大部分熱點數(shù)據(jù)很可能不是用戶需要的，從而造成寶貴的存儲資源和網(wǎng)絡(luò)資源的浪費。
[0004] 因此，有必要改進(jìn)熱點數(shù)據(jù)的識別方案，提高用戶所需要的熱點數(shù)據(jù)的命中率。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明實施例的一個目的是；提出一種新的熱點數(shù)據(jù)識別方案，W提高用戶所需要的熱點數(shù)據(jù)的命中率。
[0006] 根據(jù)本發(fā)明實施例的一個方面，提出一種熱點數(shù)據(jù)識別方法，包括；根據(jù)文件名、文件內(nèi)容、文件訪問順序、文件位置中的至少一項信息確定被訪問熱點文件的關(guān)聯(lián)文件；確定被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度；根據(jù)被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度W及關(guān)聯(lián)文件的訪問熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重；根據(jù)關(guān)聯(lián)文件的熱度權(quán)重從關(guān)聯(lián)文件中識別出熱點文件。
[0007] 在一個實施例中，根據(jù)文件名、文件內(nèi)容、文件訪問順序、文件位置中的至少一項信息確定被訪問熱點文件的關(guān)聯(lián)文件包括：計算被訪問熱點文件與其他文件之間的文件名關(guān)聯(lián)系數(shù)，選取文件名關(guān)聯(lián)系數(shù)最大的預(yù)設(shè)數(shù)量的文件作為第一關(guān)聯(lián)集合；計算被訪問熱點文件與其他文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù)，選取文件內(nèi)容關(guān)聯(lián)系數(shù)最大的預(yù)設(shè)數(shù)量的文件作為第二關(guān)聯(lián)集合；獲取在被訪問熱點文件之前最近被訪問的預(yù)設(shè)數(shù)量的文件作為第Η 關(guān)聯(lián)集合；獲取與被訪問熱點文件在同一目錄下的文件作為第四關(guān)聯(lián)集合；將第一關(guān)聯(lián)集合、第二關(guān)聯(lián)集合、第Η關(guān)聯(lián)集合和第四關(guān)聯(lián)集合中至少一個集合中的文件作為被訪問熱點文件的關(guān)聯(lián)文件。
[0008] 在一個實施例中，通過Apriori算法計算被訪問熱點文件與其他文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)。
[0009] 在一個實施例中，確定被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度包括；計算被訪問熱點文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù)；計算被訪問熱點文件與其關(guān)聯(lián)文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù)；根據(jù)各個關(guān)聯(lián)文件的訪問順序計算每個關(guān)聯(lián)文件的文件訪問順序系數(shù)；根據(jù)被訪問熱點文件與關(guān)聯(lián)文件是否在同一目錄下確定關(guān)聯(lián)文件的文件位置系數(shù)；根據(jù)被訪問熱點文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)、W及關(guān)聯(lián)文件的文件訪問順序系數(shù)和文件位置系數(shù)，使用歐幾里德距離算法確定被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度。
[0010] 在一個實施例中，根據(jù)被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度W及關(guān)聯(lián) 文件的訪問熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重包括：設(shè)置文件關(guān)聯(lián)度和訪問熱度信息在熱度權(quán)重中所占的熱度系數(shù)；根據(jù)被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度及其熱度系數(shù)，并且結(jié)合關(guān)聯(lián)文件的訪問熱度信息及其熱度系數(shù)，綜合確定關(guān)聯(lián)文件的熱度權(quán)重；其中，訪問熱度信息包括訪問時間和/或訪問頻率。
[0011] 在一個實施例中，識別出熱點文件之后，還包括；如果本地緩存中沒有識別出的熱點文件，從云端下載該熱點文件；和/或，如果本地緩存中存留有非熱點文件，從本地緩存中刪除該非熱點文件。
[0012] 根據(jù)本發(fā)明實施例的再一個方面，提出一種熱點數(shù)據(jù)識別裝置，包括：關(guān)聯(lián)文件確定單元，用于根據(jù)文件名、文件內(nèi)容、文件訪問順序、文件位置中的至少一項信息確定被訪問熱點文件的關(guān)聯(lián)文件；文件關(guān)聯(lián)度確定單元，用于確定被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度；熱度權(quán)重確定單元，用于根據(jù)被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度W及關(guān)聯(lián)文件的訪問熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重；熱點文件識別單元，用于根據(jù)關(guān)聯(lián)文件的熱度權(quán)重從關(guān)聯(lián)文件中識別出熱點文件。
[0013] 在一個實施例中，關(guān)聯(lián)文件確定單元，具體用于根據(jù)文件名、文件內(nèi)容、文件訪問順序、文件位置中的至少一項信息確定被訪問熱點文件的關(guān)聯(lián)文件；計算被訪問熱點文件與其他文件之間的文件名關(guān)聯(lián)系數(shù)，選取文件名關(guān)聯(lián)系數(shù)最大的預(yù)設(shè)數(shù)量的文件作為第一關(guān)聯(lián)集合；計算被訪問熱點文件與其他文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù)，選取文件內(nèi)容關(guān)聯(lián) 系數(shù)最大的預(yù)設(shè)數(shù)量的文件作為第二關(guān)聯(lián)集合；獲取在被訪問熱點文件之前最近被訪問的預(yù)設(shè)數(shù)量的文件作為第Η關(guān)聯(lián)集合；獲取與被訪問熱點文件在同一目錄下的文件作為第四關(guān)聯(lián)集合；將第一關(guān)聯(lián)集合、第二關(guān)聯(lián)集合、第Η關(guān)聯(lián)集合和第四關(guān)聯(lián)集合中至少一個集合中的文件作為被訪問熱點文件的關(guān)聯(lián)文件。
[0014] 在一個實施例中，通過Apriori算法計算被訪問熱點文件與其他文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)。
[0015] 在一個實施例中，文件關(guān)聯(lián)度確定單元，具體用于；計算被訪問熱點文件與其關(guān)聯(lián) 文件之間的文件名關(guān)聯(lián)系數(shù)；計算被訪問熱點文件與其關(guān)聯(lián)文件之間的文件內(nèi)容關(guān)聯(lián)系數(shù)；根據(jù)各個關(guān)聯(lián)文件的訪問順序計算每個關(guān)聯(lián)文件的文件訪問順序系數(shù)；根據(jù)被訪問熱點文件與關(guān)聯(lián)文件是否在同一目錄下確定關(guān)聯(lián)文件的文件位置系數(shù)；根據(jù)被訪問熱點文件與其關(guān)聯(lián)文件之間的文件名關(guān)聯(lián)系數(shù)和文件內(nèi)容關(guān)聯(lián)系數(shù)、W及關(guān)聯(lián)文件的文件訪問順序系數(shù)和文件位置系數(shù)，使用歐幾里德距離算法確定被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度。
[0016] 在一個實施例中，熱度權(quán)重確定單元，具體用于；設(shè)置文件關(guān)聯(lián)度和訪問熱度信息在熱度權(quán)重中所占的熱度系數(shù)；根據(jù)被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度及其熱度系數(shù)，并且結(jié)合關(guān)聯(lián)文件的訪問熱度信息及其熱度系數(shù)，綜合確定關(guān)聯(lián)文件的熱度權(quán) 重；其中，訪問熱度信息包括訪問時間和/或訪問頻率。
[0017] 在一個實施例中，熱點數(shù)據(jù)識別裝置還包括：熱點文件處理單元，用于在識別出熱點文件之后，如果本地緩存中沒有識別出的熱點文件，從云端下載該熱點文件；和/或，女口果本地緩存中存留有非熱點文件，從本地緩存中刪除該非熱點文件。
[0018] 本發(fā)明實施例在確定文件熱度時增加對文件相關(guān)性的參考，從而提升熱點文件的預(yù)判能力，提高用戶所需要的熱點數(shù)據(jù)的命中率。并且，將識別出的熱點文件下載到本地緩存，可W提高用戶對本地文件的訪問速度。
[0019] 通過W下參照附圖對本發(fā)明的示例性實施例的詳細(xì)描述，本發(fā)明的其它特征及其優(yōu)點將會變得清楚。
【附圖說明】
[0020] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動性的前提下，還可 W根據(jù)送些附圖獲得其他的附圖。
[0021] 圖1是本發(fā)明熱點數(shù)據(jù)識別方法一個實施例的流程示意圖。
[0022] 圖2是本發(fā)明熱點數(shù)據(jù)識別裝置一個實施例的結(jié)構(gòu)示意圖。
【具體實施方式】
[0023] 下面將結(jié)合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實施例僅僅是本發(fā)明一部分實施例，而不是全部的實施例。W下對至少一個示例性實施例的描述實際上僅僅是說明性的，決不作為對本發(fā)明及其應(yīng)用或使用的任何限制?；诒景l(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護(hù)的范圍。
[0024] 為了提高用戶所需要的熱點數(shù)據(jù)的命中率，本發(fā)明提出一種新的熱點數(shù)據(jù)識別方案，包括熱點數(shù)據(jù)識別方法和熱點數(shù)據(jù)識別裝置。本發(fā)明提出的熱點數(shù)據(jù)識別方案可W應(yīng) 用于云存儲領(lǐng)域，例如公有云和私有云結(jié)合的混合云存儲，還可W應(yīng)用于分層分級存儲。下面分別具體說明熱點數(shù)據(jù)識別方案。
[0025] 圖1是本發(fā)明熱點數(shù)據(jù)識別方法一個實施例的流程示意圖。如圖1所示，本實施例的熱點數(shù)據(jù)識別方法包括W下步驟：
[0026] 步驟S102,根據(jù)文件名、文件內(nèi)容、文件訪問順序、文件位置中的至少一項信息確定被訪問熱點文件的關(guān)聯(lián)文件。
[0027] 步驟S104,確定被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度。
[0028] 步驟S106,根據(jù)被訪問熱點文件與其關(guān)聯(lián)文件之間的文件關(guān)聯(lián)度W及關(guān)聯(lián)文件的訪問熱度信息確定關(guān)聯(lián)文件的熱度權(quán)重。其中，訪問熱度信息例如包括訪問時間和/或訪問頻率等信息。
[0029] 步驟S108,根據(jù)關(guān)聯(lián)文件的熱度權(quán)重從關(guān)聯(lián)文件中識別出熱點文件。
[0030] 本實施例在確定文件熱度時增加對文件相關(guān)性的參考，從而提升熱點文件的預(yù)判能力，提高用戶所需要的熱點數(shù)據(jù)的命中率。
[0

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：龔靖;馮明;秦達(dá);雷俊智;段勇;
技術(shù)所有人：中國電信股份有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

數(shù)據(jù)采集裝置相關(guān)技術(shù)

設(shè)備數(shù)據(jù)接口裝置相關(guān)技術(shù)

跨隔離裝置數(shù)據(jù)交互相關(guān)技術(shù)

無線識別裝置相關(guān)技術(shù)

usb裝置無法識別相關(guān)技術(shù)

裝置開停車風(fēng)險識別相關(guān)技術(shù)

射頻識別裝置相關(guān)技術(shù)

顏色識別裝置相關(guān)技術(shù)

車牌識別裝置相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

熱點數(shù)據(jù)識別方法和裝置的制造方法