
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)
技術(shù)領(lǐng)域:
,具體涉及一種基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法和系統(tǒng)。
背景技術(shù):
:標(biāo)簽(Tag)是一種用戶(hù)/商品特征的符號(hào)表示。例如年齡段標(biāo)簽:25~35歲,地域標(biāo)簽:西安。標(biāo)簽呈現(xiàn)出兩個(gè)重要特征,語(yǔ)義化和短文本。前者表示人能很方便地理解每個(gè)標(biāo)簽含義,后者表示標(biāo)簽本身無(wú)需再做過(guò)多文本分析等預(yù)處理工作。標(biāo)簽管理平臺(tái)則是創(chuàng)建和管理標(biāo)簽的系統(tǒng),它能夠進(jìn)行標(biāo)簽的增加、刪除、更新、查找以及標(biāo)簽權(quán)限管理。用戶(hù)屬性(UserProfile)就是對(duì)用戶(hù)標(biāo)簽化,通過(guò)多個(gè)維度的標(biāo)簽描述用戶(hù)的整體特征,可涵蓋基本屬性、社交屬性、興趣愛(ài)好、消費(fèi)能力、信用等。用戶(hù)屬性系統(tǒng)則是基于不同的維度為每個(gè)用戶(hù)產(chǎn)生一個(gè)標(biāo)簽集合,同時(shí)定期或?qū)崟r(shí)更新這個(gè)標(biāo)簽集合的系統(tǒng)。標(biāo)簽管理平臺(tái)和用戶(hù)屬性系統(tǒng)是數(shù)據(jù)管理平臺(tái)(英文全稱(chēng):DataManagementPlatform,英文簡(jiǎn)稱(chēng):DMP)兩個(gè)核心子系統(tǒng)。用戶(hù)屬性/標(biāo)簽是高附加值的數(shù)據(jù),可以看成數(shù)據(jù)在商業(yè)價(jià)值體系下的重定義,是精確營(yíng)銷(xiāo)和個(gè)性化應(yīng)用的前提。一個(gè)標(biāo)簽實(shí)際上表示了從數(shù)據(jù)挖掘出的知識(shí),不同標(biāo)簽描述數(shù)據(jù)的方面不同,因此標(biāo)簽具有碎片化的特征。隨著標(biāo)簽數(shù)目的增大,如何有效組織和管理標(biāo)簽從而滿(mǎn)足人們使用、查找、更新標(biāo)簽等需求已成為當(dāng)前DMP遇到的瓶頸問(wèn)題之一?,F(xiàn)有的標(biāo)簽系統(tǒng)是通過(guò)標(biāo)簽樹(shù)(Tagtree)組織管理的,標(biāo)簽樹(shù)有時(shí)也稱(chēng)為標(biāo)簽分類(lèi)樹(shù)。這個(gè)樹(shù)結(jié)構(gòu)中葉子節(jié)點(diǎn)表示標(biāo)簽,非葉子節(jié)點(diǎn)表示標(biāo)簽分類(lèi)的維度信息。例如圖1描述一顆標(biāo)簽樹(shù),它包含9個(gè)標(biāo)簽{中低端手機(jī)用戶(hù),中高端手機(jī)用戶(hù),高端手機(jī)用戶(hù),低額度信用卡用戶(hù),中額度信用卡用戶(hù),高額度信用卡用戶(hù),實(shí)用型,時(shí)尚型,體驗(yàn)型};這9個(gè)標(biāo)簽來(lái)自三個(gè)維度{手機(jī)類(lèi)型,用戶(hù)信用卡等級(jí),購(gòu)物消費(fèi)類(lèi)型};這三個(gè)維度的上一層是根節(jié)點(diǎn),表示 標(biāo)簽分類(lèi)的入口。從標(biāo)簽樹(shù)的定義可知,屬于不同維度間的標(biāo)簽是相互獨(dú)立的,不存在關(guān)聯(lián)。實(shí)踐發(fā)現(xiàn),隨著標(biāo)簽樹(shù)目的急劇增大,采用傳統(tǒng)標(biāo)簽樹(shù)組織和管理標(biāo)簽的方法,由于效率不高,已經(jīng)遠(yuǎn)遠(yuǎn)不能滿(mǎn)足人們使用標(biāo)簽的需要。例如標(biāo)簽樹(shù)中可能包含大量的標(biāo)簽,通常一個(gè)人只能記住少量的標(biāo)簽,當(dāng)用戶(hù)需要通過(guò)檢索標(biāo)簽查找特定分類(lèi)的用戶(hù)時(shí),不知道有哪些標(biāo)簽可以表征該特定分類(lèi)的用戶(hù),就需要通過(guò)查看標(biāo)簽樹(shù)來(lái)查詢(xún),但由于屬于不同維度間的標(biāo)簽沒(méi)有關(guān)聯(lián)性,需要花費(fèi)很多的精力才能找到需要的標(biāo)簽,導(dǎo)致查詢(xún)使用的效率很低。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例提供一種基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法和系統(tǒng),以提高標(biāo)簽的使用效率。本發(fā)明第一方面提供一種基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法,該方法主要包括以下內(nèi)容:首先,計(jì)算機(jī)系統(tǒng)例如數(shù)據(jù)管理平臺(tái)(DMP),獲取標(biāo)簽集合和所述標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集,標(biāo)簽集合是指至少兩個(gè)標(biāo)簽構(gòu)成的集合,數(shù)據(jù)集是指至少兩個(gè)樣本的數(shù)據(jù)構(gòu)成的集合,樣本是指用戶(hù)或者商品等,標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集是指標(biāo)簽集合中的至少兩個(gè)標(biāo)簽分別對(duì)應(yīng)的多個(gè)樣本的數(shù)據(jù)構(gòu)成的集合;然后,根據(jù)標(biāo)簽和樣本數(shù)據(jù)的對(duì)應(yīng)關(guān)系,從所述數(shù)據(jù)集中,獲取每個(gè)標(biāo)簽對(duì)應(yīng)的樣本集合,樣本集合是數(shù)據(jù)集的子集,是數(shù)據(jù)集中中對(duì)應(yīng)于同一個(gè)標(biāo)簽的多個(gè)樣本的數(shù)據(jù)構(gòu)成的集合;其次,計(jì)算標(biāo)簽之間的關(guān)聯(lián)度,具體的,本文中采用統(tǒng)計(jì)方法計(jì)算任意兩個(gè)標(biāo)簽分別對(duì)應(yīng)的兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù),該關(guān)聯(lián)系數(shù)可以表示所述兩個(gè)標(biāo)簽間的關(guān)聯(lián)度,關(guān)聯(lián)度越高表示這兩個(gè)標(biāo)簽表征的樣本越趨近于同類(lèi);再次,根據(jù)計(jì)算得到的關(guān)聯(lián)系數(shù)建立標(biāo)簽網(wǎng)絡(luò),具體的,可以在兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù)滿(mǎn)足預(yù)設(shè)條件時(shí),在所述兩個(gè)樣本集合對(duì)應(yīng)的兩個(gè)標(biāo)簽之間建立連接,產(chǎn)生標(biāo)簽網(wǎng)絡(luò);所述標(biāo)簽網(wǎng)絡(luò)表示了標(biāo)簽間的關(guān)聯(lián)度,可被用于在標(biāo)簽查詢(xún)時(shí)獲取一個(gè)或多個(gè)與待查找標(biāo)簽具有一定關(guān)聯(lián)度的標(biāo)簽。其中,產(chǎn)生的標(biāo)簽網(wǎng)絡(luò)可用于提高標(biāo)簽使用效率,例如,由于精確營(yíng)銷(xiāo)或其它需求而需要查找特定的目標(biāo)用戶(hù)群時(shí),可以根據(jù)該標(biāo)簽網(wǎng)絡(luò)進(jìn)行用戶(hù)查 詢(xún),包括:首先,給定用來(lái)表征該目標(biāo)用戶(hù)群的若干個(gè)標(biāo)簽,對(duì)給定的若干個(gè)標(biāo)簽,由于標(biāo)簽網(wǎng)絡(luò)中建立了標(biāo)簽間的連接,可以查詢(xún)得到與所述若干個(gè)標(biāo)簽的關(guān)聯(lián)系數(shù)在一個(gè)預(yù)設(shè)范圍內(nèi)的大量相關(guān)聯(lián)的標(biāo)簽,可以認(rèn)為查詢(xún)得到大量相關(guān)聯(lián)的標(biāo)簽夠也能夠用來(lái)表征所述目標(biāo)用戶(hù)群,于是,根據(jù)給定的標(biāo)簽和查詢(xún)到的相關(guān)聯(lián)的標(biāo)簽,從用戶(hù)數(shù)據(jù)庫(kù)中查詢(xún)用戶(hù),就可以得到對(duì)應(yīng)的目標(biāo)用戶(hù)群,從而滿(mǎn)足精確營(yíng)銷(xiāo)或其它需求。在該查找過(guò)程中,用戶(hù)不需要輸入目標(biāo)用戶(hù)群的全部標(biāo)簽,而是只需要輸入很少的若干個(gè)標(biāo)簽即可,也就是說(shuō),不需要用戶(hù)花費(fèi)很多的精力去查詢(xún)所需要的標(biāo)簽,從而提高了查詢(xún)效率??梢?jiàn),上述技術(shù)方案提供了一種可以高效的組織和管理碎片化標(biāo)簽的機(jī)制,可以有效提高標(biāo)簽的使用和管理效率,包括提高標(biāo)簽的查詢(xún)效率等。本發(fā)明第二方面提供一種基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng),該系統(tǒng)主要包括以下功能模塊:獲取模塊,計(jì)算模塊,以及連接模塊;其中,獲取模塊可用于獲取標(biāo)簽集合和所述標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集,以及,從所述數(shù)據(jù)集中,獲取每個(gè)標(biāo)簽對(duì)應(yīng)的樣本集合;計(jì)算模塊,可用于采用統(tǒng)計(jì)方法計(jì)算任意兩個(gè)標(biāo)簽分別對(duì)應(yīng)的兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù);連接模塊,可用于在所述兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù)滿(mǎn)足預(yù)設(shè)條件時(shí),在所述兩個(gè)樣本集合分別對(duì)應(yīng)的兩個(gè)標(biāo)簽之間建立連接,產(chǎn)生標(biāo)簽網(wǎng)絡(luò)。其中,標(biāo)簽集合是指至少兩個(gè)標(biāo)簽構(gòu)成的集合,數(shù)據(jù)集是指至少兩個(gè)樣本的數(shù)據(jù)構(gòu)成的集合,樣本可以是指用戶(hù)或者商品等,標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集是指標(biāo)簽集合中的至少兩個(gè)標(biāo)簽分別對(duì)應(yīng)的多個(gè)樣本的數(shù)據(jù)構(gòu)成的集合;樣本集合是數(shù)據(jù)集的子集,是數(shù)據(jù)集中中對(duì)應(yīng)于同一個(gè)標(biāo)簽的多個(gè)樣本的數(shù)據(jù)構(gòu)成的集合;關(guān)聯(lián)系數(shù)可以表示兩個(gè)標(biāo)簽間的關(guān)聯(lián)度,關(guān)聯(lián)度越高表示這兩個(gè)標(biāo)簽表征的樣本越趨近于同類(lèi);標(biāo)簽網(wǎng)絡(luò)表示了標(biāo)簽間的關(guān)聯(lián)度,可被用于在標(biāo)簽查詢(xún)時(shí)獲取一個(gè)或多個(gè)與待查找標(biāo)簽具有一定關(guān)聯(lián)度的標(biāo)簽。該系統(tǒng)產(chǎn)生的標(biāo)簽網(wǎng)絡(luò)可用于提高標(biāo)簽使用效率,具體如上文所述。本發(fā)明第三方面提供一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括處理器、存儲(chǔ)器、總線(xiàn)和通信接口;所述存儲(chǔ)器用于存儲(chǔ)程序,所述程序包括計(jì)算機(jī)執(zhí)行指令,所述處理器與所述存儲(chǔ)器通過(guò)所述總線(xiàn)連接,當(dāng)所述計(jì)算機(jī)設(shè)備運(yùn)行時(shí),所述處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的所述程序,以使所述計(jì)算機(jī)設(shè)備執(zhí)行如本發(fā) 明第一方面所述的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法??梢?jiàn),該計(jì)算機(jī)設(shè)備可用于實(shí)施上述方法,并取得上述方法取得的技術(shù)效果。本發(fā)明第四方面提供一種存儲(chǔ)一個(gè)或多個(gè)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述一個(gè)或多個(gè)程序包括指令,所述指令當(dāng)被包括一個(gè)或多個(gè)處理器的計(jì)算機(jī)設(shè)備執(zhí)行時(shí),使所述計(jì)算機(jī)設(shè)備執(zhí)行如本發(fā)明第一方面所述基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法,并取得上述方法取得的技術(shù)效果。本發(fā)明第五方面提供一種基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法,所述標(biāo)簽網(wǎng)絡(luò)是采用本發(fā)明第一方面所述基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法產(chǎn)生的,所述基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法主要包括:首先,計(jì)算機(jī)系統(tǒng)例如數(shù)據(jù)管理平臺(tái)(DMP),接收包括待查找標(biāo)簽的查詢(xún)請(qǐng)求,所述查詢(xún)請(qǐng)求用于查找所述待查找標(biāo)簽表征的目標(biāo)用戶(hù)群;從所述標(biāo)簽網(wǎng)絡(luò)中查找與所述待查找標(biāo)簽間的關(guān)聯(lián)系數(shù)滿(mǎn)足設(shè)定條件的至少一個(gè)關(guān)聯(lián)標(biāo)簽;需要說(shuō)明,所述待查找標(biāo)簽與所述至少一個(gè)關(guān)聯(lián)標(biāo)簽,都用來(lái)表征目標(biāo)用戶(hù)群;然后,就可以根據(jù)所述待查找標(biāo)簽和所述至少一個(gè)關(guān)聯(lián)標(biāo)簽查詢(xún)用戶(hù)數(shù)據(jù)庫(kù),找出對(duì)應(yīng)的目標(biāo)用戶(hù)群,從而滿(mǎn)足精確營(yíng)銷(xiāo)或其它需求。在該查找過(guò)程中,用戶(hù)不需要輸入目標(biāo)用戶(hù)群的全部標(biāo)簽,而是只需要輸入很少的若干個(gè)標(biāo)簽即可,也就是說(shuō),不需要用戶(hù)花費(fèi)很多的精力去查詢(xún)所需要的標(biāo)簽,從而提高了查詢(xún)效率。本發(fā)明第六方面提供一種基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用裝置,所述標(biāo)簽網(wǎng)絡(luò)是采用本發(fā)明第一方面所述基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法產(chǎn)生的,所述基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用裝置主要包括以下功能模塊:接收模塊,標(biāo)簽查找模塊,以及,用戶(hù)查找模塊;其中,接收模塊,可用于接收包括待查找標(biāo)簽的查詢(xún)請(qǐng)求,所述查詢(xún)請(qǐng)求用于查找所述待查找標(biāo)簽表征的目標(biāo)用戶(hù)群;所述標(biāo)簽查找模塊,用于從所述標(biāo)簽網(wǎng)絡(luò)中查找與所述待查找標(biāo)簽間的關(guān)聯(lián)系數(shù)滿(mǎn)足設(shè)定條件的至少一個(gè)關(guān)聯(lián)標(biāo)簽;需要說(shuō)明,所述待查找標(biāo)簽與所述至少一個(gè)關(guān)聯(lián)標(biāo)簽,都用來(lái)表征目標(biāo)用戶(hù)群;所述用戶(hù)查找模塊,可用于根據(jù)所述待查找標(biāo)簽和所述至少一個(gè)關(guān)聯(lián)標(biāo)簽查詢(xún)用戶(hù)數(shù)據(jù)庫(kù),找出對(duì)應(yīng)的目標(biāo)用戶(hù)群,從而滿(mǎn)足精確營(yíng)銷(xiāo)或其它需求。在該查找過(guò)程中,用戶(hù)不需要輸入目標(biāo)用戶(hù)群的全部標(biāo)簽,而是只需要輸入很少的若干個(gè)標(biāo)簽即可,也就是說(shuō),不需要用戶(hù)花費(fèi)很 多的精力去查詢(xún)所需要的標(biāo)簽,從而提高了查詢(xún)效率。由上可見(jiàn),在本發(fā)明的一些可行的實(shí)施方式中,提供了一種可以高效的組織和管理碎片化標(biāo)簽的機(jī)制,可以有效提高標(biāo)簽的使用和管理效率,包括提高標(biāo)簽的查詢(xún)效率等。附圖說(shuō)明為了更清楚地說(shuō)明本發(fā)明實(shí)施例技術(shù)方案,下面將對(duì)實(shí)施例和現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹。圖1是一顆標(biāo)簽樹(shù)的結(jié)構(gòu)示意圖;圖2是本發(fā)明一個(gè)實(shí)施例提供的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法的流程示意圖;圖3是本發(fā)明一個(gè)實(shí)施例中建立的標(biāo)簽網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;圖4是本發(fā)明一個(gè)實(shí)施例中建立的標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)的結(jié)構(gòu)示意圖;圖5a是本發(fā)明一個(gè)實(shí)施例提供的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng)的結(jié)構(gòu)示意圖;圖5b是本發(fā)明另一個(gè)實(shí)施例提供的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng)的結(jié)構(gòu)示意圖;圖6是本發(fā)明一個(gè)實(shí)施例提供的計(jì)算機(jī)設(shè)備的結(jié)構(gòu)示意圖;圖7是本發(fā)明一個(gè)實(shí)施例提供的基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法的流程示意圖;圖8是本發(fā)明一個(gè)實(shí)施例提供的基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用系統(tǒng)的結(jié)構(gòu)示意圖;圖9是本發(fā)明一個(gè)實(shí)施例提供的計(jì)算機(jī)設(shè)備的結(jié)構(gòu)示意圖。具體實(shí)施方式為了使本
技術(shù)領(lǐng)域:
的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)“第一”、“第二”、“第 三”等是用于區(qū)別不同的對(duì)象,而不是用于描述特定順序。此外,術(shù)語(yǔ)“包括”和“具有”以及它們?nèi)魏巫冃?,意圖在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒(méi)有限定于已列出的步驟或單元,而是可選地還包括沒(méi)有列出的步驟或單元,或可選地還包括對(duì)于這些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。貫穿本說(shuō)明書(shū),術(shù)語(yǔ)“標(biāo)簽”是一種樣本(例如用戶(hù)/商品)的特征的符號(hào)表示,或者說(shuō),所述標(biāo)簽是對(duì)所述樣本的屬性的數(shù)據(jù)表示。術(shù)語(yǔ)“標(biāo)簽集合”是指至少兩個(gè)標(biāo)簽形成的一個(gè)集合。術(shù)語(yǔ)“數(shù)據(jù)集”是指大量樣本數(shù)據(jù)的集合。標(biāo)簽集合中的所有標(biāo)簽對(duì)應(yīng)的所有樣本的數(shù)據(jù)的集合,稱(chēng)為該標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集。其中,一個(gè)樣本可以指一個(gè)用戶(hù),當(dāng)然,也可以是指商品或其它物體。術(shù)語(yǔ)“樣本集合”是指一個(gè)標(biāo)簽對(duì)應(yīng)的一個(gè)或多個(gè)樣本的數(shù)據(jù)的集合,樣本集合是數(shù)據(jù)集的子集。術(shù)語(yǔ)“標(biāo)簽樹(shù)(Tagtree)”是按照不同的分類(lèi)對(duì)大量標(biāo)簽進(jìn)行組織形成的一種分類(lèi)樹(shù),也稱(chēng)為標(biāo)簽分類(lèi)樹(shù)??梢圆捎脴?biāo)簽樹(shù)對(duì)標(biāo)簽集合中的所有標(biāo)簽進(jìn)行組織管理。本發(fā)明實(shí)施例技術(shù)方案適用于數(shù)據(jù)管理平臺(tái)(英文全稱(chēng):DataManagementPlatform,英文簡(jiǎn)稱(chēng):DMP)。DMP包括標(biāo)簽管理平臺(tái)(英文全稱(chēng):TagManagementPlatform,英文簡(jiǎn)稱(chēng):TMP)和用戶(hù)屬性系統(tǒng)(英文全稱(chēng):Userprofilingsystem,英文簡(jiǎn)稱(chēng):UPS)這兩個(gè)核心子系統(tǒng)。DMP是無(wú)縫整合跨不同接觸點(diǎn)的消費(fèi)者數(shù)據(jù)的技術(shù),以幫助企業(yè)對(duì)何時(shí)及如何同每個(gè)用戶(hù)互動(dòng)做出更好的決策。DMP能夠幫助企業(yè)實(shí)現(xiàn)統(tǒng)一客戶(hù)信息管理和共享,并與企業(yè)的營(yíng)銷(xiāo)推薦系統(tǒng)有效集成,最終幫助客戶(hù)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)和個(gè)性推薦等差異化的客戶(hù)服務(wù)。DMP可以應(yīng)用在銀行,電信運(yùn)營(yíng)商,網(wǎng)購(gòu)平臺(tái)等各種企業(yè)單位,用作對(duì)大量用戶(hù)數(shù)據(jù)進(jìn)行管理的平臺(tái)。DMP可運(yùn)行在通用的計(jì)算機(jī)系統(tǒng)中。DMP管理的大量標(biāo)簽以及對(duì)應(yīng)的大量數(shù)據(jù)(數(shù)據(jù)集)可以存儲(chǔ)在計(jì)算機(jī)系統(tǒng)的存儲(chǔ)介質(zhì)中,DMP運(yùn)行時(shí)計(jì)算機(jī)系統(tǒng)的處理器可以對(duì)所存儲(chǔ)的大量標(biāo)簽及對(duì)應(yīng)的大量數(shù)據(jù)進(jìn)行組織管理,并可 以通過(guò)顯示裝置顯示出來(lái)或通過(guò)通信接口傳送給其它裝置。標(biāo)簽作為DMP系統(tǒng)最基本的單位,是知識(shí)一種表示。但隨著標(biāo)簽的數(shù)目的急劇增大,采用傳統(tǒng)標(biāo)簽樹(shù)組織和管理標(biāo)簽的方法遠(yuǎn)遠(yuǎn)不能滿(mǎn)足人們使用標(biāo)簽的需要。通常一個(gè)人只能記住少量的標(biāo)簽,需要通過(guò)查看標(biāo)簽樹(shù)來(lái)查詢(xún),但由于屬于不同維度間標(biāo)簽沒(méi)有關(guān)聯(lián)性,需要花費(fèi)很多的精力才能找到需要的標(biāo)簽。例如,通過(guò)標(biāo)簽查找特點(diǎn)的目標(biāo)用戶(hù)群時(shí),需要先找出表征該目標(biāo)用戶(hù)群的大量標(biāo)簽,這就需要用戶(hù)話(huà)費(fèi)很多的精力在標(biāo)簽樹(shù)中進(jìn)行查找。本發(fā)明的一個(gè)思路是通過(guò)建立標(biāo)簽間關(guān)聯(lián)來(lái)提高人們使用標(biāo)簽和管理標(biāo)簽的效率。標(biāo)簽間的關(guān)聯(lián)可以通過(guò)建立語(yǔ)義網(wǎng)絡(luò)(Semanticweb)來(lái)表示。語(yǔ)義網(wǎng)絡(luò)是一個(gè)有向圖,其頂點(diǎn)表示概念,而邊則表示這些概念(詞)間的語(yǔ)義關(guān)系。語(yǔ)義網(wǎng)絡(luò)用來(lái)表達(dá)復(fù)雜的概念及其之間的相互關(guān)系。產(chǎn)生語(yǔ)義網(wǎng)絡(luò)的方法主要有:(1)人工判斷,通過(guò)專(zhuān)家知識(shí)判斷兩個(gè)概念間的關(guān)系;(2)通過(guò)知識(shí)庫(kù),例如通過(guò)近義詞、反義詞,概念層級(jí)等知識(shí)庫(kù),建立兩個(gè)概念間的關(guān)系;(3)統(tǒng)計(jì)方法,通過(guò)從大規(guī)模文本語(yǔ)料中提取詞法模式,生成詞對(duì)-詞法模式矩陣,通過(guò)規(guī)律學(xué)習(xí)方法對(duì)隱含語(yǔ)義關(guān)系相似度進(jìn)行計(jì)算。語(yǔ)義網(wǎng)絡(luò)是基于語(yǔ)義和文本信息建立的,難以實(shí)現(xiàn)自動(dòng)化,且通常需要抓取額外的數(shù)據(jù)。因此,如何自動(dòng)化和批量化建立標(biāo)簽間關(guān)聯(lián)就成為提高使用標(biāo)簽效率的關(guān)鍵。本發(fā)明結(jié)合語(yǔ)義網(wǎng)絡(luò)技術(shù),提出一種基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法以及基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法,以實(shí)現(xiàn)自動(dòng)化和批量化建立標(biāo)簽間關(guān)聯(lián),以及提高標(biāo)簽的使用和管理效率。下面通過(guò)具體實(shí)施例,分別進(jìn)行詳細(xì)的說(shuō)明。(實(shí)施例一、)請(qǐng)參考圖2,本發(fā)明一個(gè)實(shí)施例提供的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法,該方法可包括:210、獲取標(biāo)簽集合和所述標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集。其中,所述標(biāo)簽集合包括至少兩個(gè)標(biāo)簽,所述數(shù)據(jù)集包括所述至少兩個(gè)標(biāo)簽分別對(duì)應(yīng)的多個(gè)樣本的數(shù)據(jù)。本發(fā)明的一個(gè)目的在于,對(duì)一個(gè)已有的標(biāo)簽集合,在其標(biāo)簽間建立關(guān)聯(lián)。 所說(shuō)的標(biāo)簽集合包括至少兩個(gè)標(biāo)簽,產(chǎn)生該標(biāo)簽集合的數(shù)據(jù)構(gòu)成一數(shù)據(jù)集。該標(biāo)簽集合具體可以是標(biāo)簽樹(shù)或者其它任意的標(biāo)簽組織形式。本文中以標(biāo)簽樹(shù)為例進(jìn)行說(shuō)明,但并不對(duì)標(biāo)簽集合的具體形式構(gòu)成限定。例如圖1所示,是一個(gè)標(biāo)簽樹(shù)的示意圖,該標(biāo)簽樹(shù)具有一個(gè)根節(jié)點(diǎn),根節(jié)點(diǎn)下具有多級(jí)節(jié)點(diǎn),其中,每個(gè)葉子節(jié)點(diǎn)表示一個(gè)標(biāo)簽,每個(gè)非葉子節(jié)點(diǎn)表示一個(gè)維度。例如圖1描述的一顆標(biāo)簽樹(shù),它包含9個(gè)標(biāo)簽{中低端手機(jī)用戶(hù),中高端手機(jī)用戶(hù),高端手機(jī)用戶(hù),低額度信用卡用戶(hù),中額度信用卡用戶(hù),高額度信用卡用戶(hù),實(shí)用型,時(shí)尚型,體驗(yàn)型};這9個(gè)標(biāo)簽來(lái)自三個(gè)維度{手機(jī)類(lèi)型,用戶(hù)信用卡等級(jí),購(gòu)物消費(fèi)類(lèi)型};這三個(gè)維度的上一層是根節(jié)點(diǎn),表示標(biāo)簽分類(lèi)的入口。圖1所示的標(biāo)簽樹(shù)樹(shù)一共包括三級(jí)節(jié)點(diǎn),但是,標(biāo)簽樹(shù)并不限于三級(jí)節(jié)點(diǎn),也可以包括四級(jí)乃至更多級(jí)節(jié)點(diǎn),無(wú)論標(biāo)簽樹(shù)節(jié)點(diǎn)級(jí)數(shù)的多少,其葉子節(jié)點(diǎn)(即最低一級(jí)、不再有子節(jié)點(diǎn)的節(jié)點(diǎn))表示標(biāo)簽,非葉子節(jié)點(diǎn)(即自身有子節(jié)點(diǎn)的節(jié)點(diǎn))表示維度,此時(shí),可能有多級(jí)維度。220、從所述標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集中,獲取每個(gè)標(biāo)簽對(duì)應(yīng)的樣本集合。其中,所述樣本集合是所述數(shù)據(jù)集中對(duì)應(yīng)于同一個(gè)標(biāo)簽的多個(gè)樣本的數(shù)據(jù)的集合。由于標(biāo)簽無(wú)論由規(guī)則產(chǎn)生還是算法產(chǎn)生,它都對(duì)應(yīng)著一個(gè)樣本集合,該樣本集合是標(biāo)簽集合對(duì)應(yīng)的全體數(shù)據(jù)集的一個(gè)子集。以針對(duì)一個(gè)用戶(hù)群產(chǎn)生的標(biāo)簽樹(shù)為例,該用戶(hù)群的數(shù)據(jù)集合為該標(biāo)簽樹(shù)對(duì)應(yīng)的數(shù)據(jù)集,其中一個(gè)標(biāo)簽對(duì)應(yīng)的部分用戶(hù)的數(shù)據(jù)集合為該標(biāo)簽對(duì)應(yīng)的樣本集合。具體的,可以根據(jù)每個(gè)標(biāo)簽的產(chǎn)生規(guī)則或產(chǎn)生算法模型,從所述數(shù)據(jù)集中獲取對(duì)應(yīng)的樣本集合,所述樣本集合是所述數(shù)據(jù)集的子集。230、采用統(tǒng)計(jì)方法計(jì)算任意兩個(gè)標(biāo)簽A和B分別對(duì)應(yīng)的兩個(gè)樣本集合DA和DB間的關(guān)聯(lián)系數(shù)ρAB。其中,所述關(guān)聯(lián)系數(shù)ρAB表示所述兩個(gè)標(biāo)簽A和B間的關(guān)聯(lián)度。兩個(gè)標(biāo)簽在語(yǔ)義上的關(guān)聯(lián)性可以表示為兩個(gè)樣本集合的相關(guān)性問(wèn)題。本文中,可以計(jì)算任兩個(gè)標(biāo)簽(例如標(biāo)簽A和B)對(duì)應(yīng)的兩個(gè)樣本集合(例如DA和 DB)間的關(guān)聯(lián)系數(shù)(本文中用ρAB標(biāo)識(shí)),作為所述任兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)。其中,可以通過(guò)統(tǒng)計(jì)方法計(jì)算所述關(guān)聯(lián)系數(shù)。該關(guān)聯(lián)系數(shù)也可以稱(chēng)為關(guān)聯(lián)度。需要說(shuō)明的是,對(duì)于標(biāo)簽樹(shù)中的同一維度下的標(biāo)簽,通常通過(guò)客戶(hù)分群聚類(lèi)產(chǎn)生,即同一維度下的標(biāo)簽一般不會(huì)有重疊的用戶(hù)群,因此,一些實(shí)施例中,可以不計(jì)算標(biāo)簽樹(shù)中的同一緯度下的兩個(gè)標(biāo)簽之間的關(guān)聯(lián)系數(shù)。例如,請(qǐng)參考圖1,可以不計(jì)算在維度“用戶(hù)信用卡等級(jí)”下的三個(gè)標(biāo)簽{普卡用戶(hù),金卡用戶(hù),白金卡用戶(hù)}間的關(guān)聯(lián)系數(shù)。換句話(huà)說(shuō),當(dāng)標(biāo)簽集合是標(biāo)簽樹(shù)時(shí),本步驟中可以?xún)H計(jì)算分屬于不同維度的任兩個(gè)標(biāo)簽A和B分別對(duì)應(yīng)的兩個(gè)樣本集合DA和DB間的關(guān)聯(lián)系數(shù)ρAB。240、在所述兩個(gè)樣本集合DA和DB間的關(guān)聯(lián)系數(shù)ρAB滿(mǎn)足預(yù)設(shè)條件時(shí),在所述兩個(gè)樣本集合DA和DB分別對(duì)應(yīng)的兩個(gè)標(biāo)簽A和B之間建立連接,產(chǎn)生標(biāo)簽網(wǎng)絡(luò)。其中,所述標(biāo)簽網(wǎng)絡(luò)表示了標(biāo)簽間的關(guān)聯(lián)度,被用于在標(biāo)簽查詢(xún)時(shí)獲取一個(gè)或多個(gè)與待查找標(biāo)簽具有一定關(guān)聯(lián)度的標(biāo)簽。所說(shuō)的預(yù)設(shè)條件例如可以是設(shè)定一個(gè)關(guān)聯(lián)系數(shù)閾值,當(dāng)兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)大于設(shè)定的關(guān)聯(lián)系數(shù)閾值時(shí),在所述兩個(gè)標(biāo)簽間建立連接,以表現(xiàn)所述兩個(gè)標(biāo)簽間的關(guān)聯(lián)。所說(shuō)的產(chǎn)生標(biāo)簽網(wǎng)絡(luò)可以是構(gòu)建無(wú)向圖,所述無(wú)向圖由多個(gè)頂點(diǎn)和用于連接頂點(diǎn)的邊構(gòu)成,其中每一個(gè)頂點(diǎn)表示一個(gè)標(biāo)簽,所述的邊為沒(méi)有方向的無(wú)向邊;所說(shuō)的建立連接例如可以是建立一條無(wú)向邊,即,當(dāng)兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)大于設(shè)定的關(guān)聯(lián)系數(shù)閾值時(shí),在所述無(wú)向圖中的表示所述兩個(gè)標(biāo)簽的兩個(gè)頂點(diǎn)間連接一條無(wú)向邊,并以所述兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)作為所述無(wú)向邊的權(quán)重。在所有具有關(guān)聯(lián)的標(biāo)簽間建立連接之后,所述標(biāo)簽集合的標(biāo)簽和標(biāo)簽之間建立的連接構(gòu)成一標(biāo)簽網(wǎng)絡(luò),該標(biāo)簽網(wǎng)絡(luò)的節(jié)點(diǎn)是標(biāo)簽,該標(biāo)簽網(wǎng)絡(luò)的無(wú)向邊表示兩個(gè)標(biāo)簽間存在關(guān)聯(lián),無(wú)向邊上的權(quán)重表示兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)。關(guān)聯(lián)系數(shù)通常可以是一個(gè)介于0到1之間的數(shù)。作為示例,假設(shè)將關(guān)聯(lián)系數(shù)閾值設(shè)為0.2,針對(duì)圖1所示標(biāo)簽樹(shù)中的9種標(biāo)簽,在關(guān)聯(lián)系數(shù)大于0.2的任兩個(gè)標(biāo)簽間建立連接,構(gòu)建起一個(gè)如圖3所示的的標(biāo)簽網(wǎng)絡(luò),其中每一條無(wú)向邊上給出了標(biāo)簽間的關(guān)聯(lián)系數(shù)作為權(quán)重。進(jìn)一步的,若標(biāo)簽集合是標(biāo)簽樹(shù),在構(gòu)建無(wú)向圖的過(guò)程中,可以以所述標(biāo)簽樹(shù)的葉子節(jié)點(diǎn)作為所述無(wú)向圖的頂點(diǎn),從而使所述標(biāo)簽網(wǎng)絡(luò)和所述標(biāo)簽樹(shù)疊加在一起,構(gòu)成標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)。作為示例,圖4示出了一種標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò),它是圖1所示的標(biāo)簽樹(shù)和圖3所示的標(biāo)簽網(wǎng)絡(luò)的疊加,該標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)同時(shí)具有標(biāo)簽樹(shù)和語(yǔ)義網(wǎng)絡(luò)的優(yōu)點(diǎn)。特別的,某些場(chǎng)景中,所述標(biāo)簽集合可以?xún)H包括兩個(gè)標(biāo)簽,此時(shí),本發(fā)明實(shí)施例技術(shù)方案用于計(jì)算該兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù),以確定是否在該兩個(gè)標(biāo)簽間建立連接。產(chǎn)生的標(biāo)簽網(wǎng)絡(luò)可用于提高標(biāo)簽使用效率,例如,由于精確營(yíng)銷(xiāo)或其它需求而需要查找特定的目標(biāo)用戶(hù)群時(shí),可以根據(jù)該標(biāo)簽網(wǎng)絡(luò)進(jìn)行用戶(hù)查詢(xún),首先,給定用來(lái)表征該目標(biāo)用戶(hù)群的若干個(gè)標(biāo)簽,對(duì)給定的若干個(gè)標(biāo)簽,由于標(biāo)簽網(wǎng)絡(luò)中建立了標(biāo)簽間的連接,可以查詢(xún)得到與所述若干個(gè)標(biāo)簽的關(guān)聯(lián)系數(shù)在一個(gè)預(yù)設(shè)范圍內(nèi)的大量相關(guān)聯(lián)的標(biāo)簽,可以認(rèn)為查詢(xún)得到大量相關(guān)聯(lián)的標(biāo)簽夠也能夠用來(lái)表征所述目標(biāo)用戶(hù)群,于是,根據(jù)給定的標(biāo)簽和查詢(xún)到的相關(guān)聯(lián)的標(biāo)簽,從用戶(hù)數(shù)據(jù)庫(kù)中查詢(xún)用戶(hù),就可以得到對(duì)應(yīng)的目標(biāo)用戶(hù)群,從而滿(mǎn)足精確營(yíng)銷(xiāo)或其它需求。在該查找過(guò)程中,用戶(hù)不需要輸入目標(biāo)用戶(hù)群的全部標(biāo)簽,而是只需要輸入很少的若干個(gè)標(biāo)簽即可,也就是說(shuō),不需要用戶(hù)花費(fèi)很多的精力去查詢(xún)所需要的標(biāo)簽,從而提高了查詢(xún)效率??梢?jiàn),采用上述技術(shù)方案,使用標(biāo)簽時(shí),可以通過(guò)標(biāo)簽間的關(guān)聯(lián)方便的查找更多需要的標(biāo)簽,從而提高標(biāo)簽使用效率;基于標(biāo)簽的關(guān)聯(lián),可以對(duì)標(biāo)簽實(shí)現(xiàn)更高效的組織管理;并且,該技術(shù)方案采用數(shù)據(jù)集相關(guān)性來(lái)構(gòu)建標(biāo)簽網(wǎng)絡(luò),不需要抓取額外的數(shù)據(jù),容易實(shí)現(xiàn)自動(dòng)化和批量化處理,進(jìn)一步實(shí)現(xiàn)標(biāo)簽的組織管理及使用效率??梢岳斫?,本發(fā)明實(shí)施例上述方案例如可以在計(jì)算機(jī)設(shè)備具體實(shí)施。為便于更好的理解本發(fā)明實(shí)施例的技術(shù)方案,下面,對(duì)以下幾個(gè)方面:獲取每個(gè)標(biāo)簽對(duì)應(yīng)的樣本集合的方法,計(jì)算任兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)的方法,以及,在兩個(gè)標(biāo)簽之間建立連接的方法,做進(jìn)一步的詳細(xì)說(shuō)明。一、獲取每個(gè)標(biāo)簽對(duì)應(yīng)的樣本集合通常,可以采用產(chǎn)生規(guī)則或產(chǎn)生算法模型對(duì)樣本數(shù)據(jù)進(jìn)行處理,產(chǎn)生用來(lái)表征樣本的標(biāo)簽。本發(fā)明實(shí)施例中,可以根據(jù)每個(gè)標(biāo)簽的產(chǎn)生規(guī)則或產(chǎn)生算法模型,從所述數(shù)據(jù)集中獲取對(duì)應(yīng)的樣本集合。通常,所述數(shù)據(jù)集包含多個(gè)樣本,其中每個(gè)樣本有多個(gè)變量。假定設(shè)數(shù)據(jù)集D有I個(gè)樣本和有J個(gè)變量{X1,…,XJ},I和J均為正整數(shù),則數(shù)據(jù)集D通??梢员硎緸槿缦碌木仃囆问剑簲?shù)據(jù)集D的矩陣表示中,每一個(gè)行表示一個(gè)樣本,每一列表示一個(gè)變量,其中,每個(gè)樣本具有J個(gè)變量(或者說(shuō)維度)。通常標(biāo)簽有兩種方法產(chǎn)生:一種是通過(guò)規(guī)則如if-then(如果-則)規(guī)則產(chǎn)生;另一種是通過(guò)非if-then規(guī)則,通常是一個(gè)產(chǎn)生算法模型例如一個(gè)神經(jīng)網(wǎng)絡(luò)算法來(lái)產(chǎn)生。根據(jù)標(biāo)簽產(chǎn)生方法的不同,有不同的樣本集合獲取方法:(1)、一些實(shí)施例中,對(duì)于通過(guò)產(chǎn)生規(guī)則產(chǎn)生的標(biāo)簽,可以從所述數(shù)據(jù)集中查找所述產(chǎn)生規(guī)則涉及的變量集,遍歷所述數(shù)據(jù)集,找出變量落入所述變量集的所有樣本,得到對(duì)應(yīng)的樣本集合。具體流程可以包括:輸入:整個(gè)數(shù)據(jù)集D某個(gè)標(biāo)簽A的產(chǎn)生規(guī)則輸出:標(biāo)簽A對(duì)應(yīng)的樣本集合DA核心步驟:(1)找到規(guī)則所涉及到的變量集A={A1,…,Am},其中,m是一個(gè)不大于J的整數(shù)。(2)遍歷所有樣本,找到符合規(guī)則的樣本(假如一個(gè)樣本的某個(gè)變量落入上述的變量集A,則認(rèn)為該樣本符合規(guī)則),假設(shè)滿(mǎn)足規(guī)則的樣本數(shù)目為r,不失一般性標(biāo)簽A對(duì)應(yīng)的樣本集合可以表示為:DA是D的一個(gè)子集,其變量集為{A1,…,Am},樣本數(shù)為r。(2)、一些實(shí)施例中,對(duì)于通過(guò)產(chǎn)生算法模型產(chǎn)生的標(biāo)簽,根據(jù)所述產(chǎn)生算法模型,進(jìn)行敏感性分析,計(jì)算出所述數(shù)據(jù)集中每個(gè)變量的重要性指標(biāo),所述敏感性分析用于分析所述變量發(fā)生變化時(shí)對(duì)所述產(chǎn)生算法模型的影響程度,某個(gè)變量對(duì)產(chǎn)生算法模型的影響程度越大,則該變量的重要性指標(biāo)越高;找出重要性指標(biāo)大于設(shè)定的重要性閾值的變量集;遍歷所述數(shù)據(jù)集,找出變量落入所述變量集的所有樣本,得到對(duì)應(yīng)的樣本集合。具體流程可以包括:輸入:整個(gè)數(shù)據(jù)集D某個(gè)標(biāo)簽A的產(chǎn)生算法模型閾值δ∈[0,1],即重要性閾值輸出:標(biāo)簽A對(duì)應(yīng)的樣本集合DA核心步驟:(1)根據(jù)算法模型和敏感性分析計(jì)算出每個(gè)變量的重要性指標(biāo);(2)找出重要性指標(biāo)大于閾值δ的變量集A={A1,…,Am};(3)遍歷所有樣本,找到符合的樣本(假如一個(gè)樣本的某個(gè)變量落入上述的變量集A,則認(rèn)為該樣本符合),假設(shè)符合的樣本數(shù)目為r,不失一般性標(biāo)簽A對(duì)應(yīng)的樣本集合可以表示為:DA是D的一個(gè)子集,其變量集為{A1,…,Am},樣本數(shù)為r。(3)、下面舉例說(shuō)明,假設(shè)有兩個(gè)變量X1和X2,其中:X1:用戶(hù)1個(gè)月訪(fǎng)問(wèn)(運(yùn)營(yíng)商)競(jìng)爭(zhēng)對(duì)手網(wǎng)站使用的流量;X2:用戶(hù)訪(fǎng)問(wèn)(運(yùn)營(yíng)商)競(jìng)爭(zhēng)對(duì)手網(wǎng)站次數(shù);標(biāo)簽:潛在離網(wǎng)用戶(hù);產(chǎn)生標(biāo)簽規(guī)則:如果X1>50MB且X2>30;則標(biāo)簽對(duì)應(yīng)樣本集合例如下表1所示。表1X1X280501003560405648其中,變量集為{X1,X2}。二、計(jì)算任兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)本發(fā)明實(shí)施例中,可以計(jì)算任意兩個(gè)標(biāo)簽例如A和B分別對(duì)應(yīng)的兩個(gè)樣本集合DA和DB間的關(guān)聯(lián)系數(shù),作為所述任兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù),關(guān)聯(lián)系數(shù)用ρAB來(lái)表示。通常,所述樣本集合可以表示為一個(gè)數(shù)據(jù)矩陣,所述樣本集合的的每一行表示一個(gè)樣本,所述樣本集合的每一列表示一個(gè)變量。一些實(shí)施例中,所述計(jì)算任兩個(gè)標(biāo)簽對(duì)應(yīng)的兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù)的步驟,可以包括:根據(jù)任兩個(gè)標(biāo)簽對(duì)應(yīng)的兩個(gè)樣本集合,確定所述兩個(gè)標(biāo)簽對(duì)應(yīng)的兩個(gè)變量集;計(jì)算所述兩個(gè)變量集的交集;獲取所述交集中的任一個(gè)變量在所述兩個(gè)樣本集合中各自對(duì)應(yīng)的列,得到兩個(gè)列;采用統(tǒng)計(jì)方法計(jì)算所述兩個(gè)列的列間關(guān)聯(lián)系數(shù);根據(jù)得到的所述列間關(guān)聯(lián)系數(shù),計(jì)算所述兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù)。具體流程可以包括:假設(shè)有兩個(gè)標(biāo)簽A和B,對(duì)應(yīng)的兩個(gè)樣本集合分別為DA和DB,其變量集分別表示為A={A1,…,Am}和B={B1,…,Bn},樣本數(shù)分別為r和s,變量數(shù)分別為m和n,且m和n均為正整數(shù),對(duì)應(yīng)的樣本集合可分別表示為:和計(jì)算標(biāo)簽A和B的關(guān)聯(lián)系數(shù)過(guò)程如下。輸入:標(biāo)簽A和B對(duì)應(yīng)的樣本集合DA和DB標(biāo)簽A和B對(duì)應(yīng)的變量集合{A1,…,Am}和{B1,…,Bn}輸出:標(biāo)簽A和B間的關(guān)聯(lián)系數(shù)ρAB核心步驟:(1)根據(jù)任兩個(gè)標(biāo)簽對(duì)應(yīng)的兩個(gè)樣本集合,確定所述兩個(gè)標(biāo)簽對(duì)應(yīng)的兩個(gè)變量集;計(jì)算所述兩個(gè)變量集的交集。例如,對(duì)于標(biāo)簽A和B,計(jì)算A和B對(duì)應(yīng)的兩個(gè)變量集A={A1,…,Am}和B={B1,…,Bn}交集,C={C1,…,Cl}={A1,…,Am}∩{B1,…,Bm}。其中,l是所述交集的變量數(shù),且l為正整數(shù)(2)獲取所述交集中的任一個(gè)變量在所述兩個(gè)樣本集合中各自對(duì)應(yīng)的列,得到兩個(gè)列。例如,對(duì)任意變量c∈{C1,…,Cl},獲取c在DA和DB中分別對(duì)應(yīng)的列,記為和(3)采用統(tǒng)計(jì)方法計(jì)算所述兩個(gè)列的列間關(guān)聯(lián)系數(shù),以計(jì)算和的關(guān)聯(lián)系數(shù)為例。●如果c是連續(xù)變量,可根據(jù)所述兩個(gè)列各自的樣本數(shù),平均值和標(biāo)準(zhǔn)方差,計(jì)算列間關(guān)聯(lián)系數(shù),例如,可以采用如下公式:其中且n1,M1,SD1分別為的樣本數(shù),平均值和標(biāo)準(zhǔn)方差;且n2,M2,SD2分別為的樣 本數(shù),平均值和標(biāo)準(zhǔn)方差?!袢绻鹀是分類(lèi)變量,可根據(jù)兩個(gè)列各自的頻數(shù)分布和樣本數(shù),計(jì)算列間關(guān)聯(lián)系數(shù),例如,采用如下算法:計(jì)算和的頻數(shù)分布,分別記為f1,…,fN和g1,…,gN,其中N為變量c的類(lèi)別數(shù);fi和gi分別是和的頻數(shù)分布中的第i個(gè)值,i為不小于1且不大于N的整數(shù);假設(shè)n1和n2分別為和的樣本數(shù),且n1>n2,計(jì)算公式為:其中采用上述算法,可以計(jì)算得到交集中的所有變量在所述兩個(gè)樣本集合中各自對(duì)應(yīng)的列的列間關(guān)聯(lián)系數(shù)。(4)計(jì)算DA和DB的關(guān)聯(lián)系數(shù)ρAB其中,m和n分別是樣本集合DA和DB的變量數(shù),均為正整數(shù)??梢?jiàn),本步驟中,是對(duì)得到的所有的列間關(guān)聯(lián)系數(shù)求和,將求得的和分別除以所述兩個(gè)樣本集合的變量數(shù)得到兩個(gè)均值,所述兩個(gè)均值的和的一半即為所述兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù)。需要說(shuō)明的是,上述步驟(1)-(4)中的具體公式僅為示例,根據(jù)本發(fā)明的思想,可以參考上述公式得到其它公式,均應(yīng)涵蓋在本發(fā)明保護(hù)范圍之內(nèi)。三、在兩個(gè)標(biāo)簽之間建立連接本發(fā)明一些實(shí)施例中,可以用<V,E,W>表示標(biāo)簽網(wǎng)絡(luò),其中V表示標(biāo)簽(節(jié)點(diǎn))的集合,E表示邊(即無(wú)向邊)的集合,W表示邊的權(quán)重。在這一步驟中,可以根據(jù)兩標(biāo)簽間的關(guān)聯(lián)系數(shù)和閾值構(gòu)建標(biāo)簽網(wǎng)絡(luò),其中,若標(biāo)簽集合 為標(biāo)簽樹(shù),還可以結(jié)合標(biāo)簽樹(shù),構(gòu)建標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)。構(gòu)建標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)的算法如下:輸入:任意兩個(gè)標(biāo)簽的關(guān)聯(lián)系數(shù)閾值θ∈[0,1],即關(guān)聯(lián)系數(shù)閾值標(biāo)簽分類(lèi)樹(shù)T輸出:標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)<T,V,E,W>核心步驟:(1)判斷兩個(gè)標(biāo)簽A和B是否有連接:如果ρAB>θ,則標(biāo)簽A和B之間有連接,在標(biāo)簽A和B間連接一條邊,該邊可以是無(wú)向邊,并設(shè)定其權(quán)重為ρAB;否則標(biāo)簽A和B之間沒(méi)有連接,不建立無(wú)向邊。(2)重復(fù)上述過(guò)程,直到完成任意兩個(gè)標(biāo)簽間是否有連接的判斷,以及無(wú)向邊建立和權(quán)重設(shè)定,從而得到標(biāo)簽網(wǎng)絡(luò)<V,E,W>。例如圖3所示。(3)把網(wǎng)絡(luò)<V,E,W>疊加到標(biāo)簽分類(lèi)樹(shù)T,生成標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)<T,V,E,W>。例如圖4所示。疊加方式可以是,以所述標(biāo)簽樹(shù)的葉子節(jié)點(diǎn)表示的標(biāo)簽作為頂點(diǎn),在有連接的葉子節(jié)點(diǎn)之間連接一條邊,從而得到標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)。綜上,對(duì)本發(fā)明實(shí)施例提供的一種基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法進(jìn)行詳細(xì)說(shuō)明。該方法提供了一種組織和管理碎片化標(biāo)簽的機(jī)制,并提供了一種查詢(xún)關(guān)聯(lián)標(biāo)簽的能力。由上可見(jiàn),在本發(fā)明的一些可行的實(shí)施方式中,公開(kāi)了一種基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng),該技術(shù)方案通過(guò)計(jì)算標(biāo)簽間的關(guān)聯(lián)系數(shù),在關(guān)聯(lián)系數(shù)滿(mǎn)足預(yù)設(shè)條件的兩個(gè)標(biāo)簽之間建立連接,產(chǎn)生一標(biāo)簽網(wǎng)絡(luò),該標(biāo)簽網(wǎng)絡(luò)能夠反映標(biāo)簽間的關(guān)聯(lián)關(guān)系,從而提供了一種可以高效的組織和管理碎片化標(biāo)簽的機(jī)制,可以有效提高標(biāo)簽的使用和管理效率,包括提高標(biāo)簽的查詢(xún)效率等。(實(shí)施例二、)為了更好的實(shí)施本發(fā)明實(shí)施例的上述方案,下面還提供用于配合實(shí)施上述方案的相關(guān)裝置。請(qǐng)參考圖5a,本發(fā)明一個(gè)實(shí)施例提供的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng)500,該系統(tǒng)500可包括:獲取模塊510,用于獲取標(biāo)簽集合和所述標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集;以及,從所述標(biāo)簽集合對(duì)應(yīng)的數(shù)據(jù)集中,獲取每個(gè)標(biāo)簽對(duì)應(yīng)的樣本集合;所述標(biāo)簽集合包括至少兩個(gè)標(biāo)簽,所述數(shù)據(jù)集包括所述至少兩個(gè)標(biāo)簽分別對(duì)應(yīng)的多個(gè)樣本的數(shù)據(jù);所述樣本集合是所述數(shù)據(jù)集中對(duì)應(yīng)于同一個(gè)標(biāo)簽的多個(gè)樣本的數(shù)據(jù)的集合;計(jì)算模塊520,用于采用統(tǒng)計(jì)方法計(jì)算任意兩個(gè)標(biāo)簽A和B分別對(duì)應(yīng)的兩個(gè)樣本集合DA和DB間的關(guān)聯(lián)系數(shù)ρAB,所述關(guān)聯(lián)系數(shù)ρAB表示所述兩個(gè)標(biāo)簽A和B間的關(guān)聯(lián)度;連接模塊530,用于在所述兩個(gè)樣本集合DA和DB間的關(guān)聯(lián)系數(shù)ρAB滿(mǎn)足預(yù)設(shè)條件時(shí),在所述兩個(gè)樣本集合DA和DB分別對(duì)應(yīng)的兩個(gè)標(biāo)簽A和B之間建立連接,產(chǎn)生標(biāo)簽網(wǎng)絡(luò);所述標(biāo)簽網(wǎng)絡(luò)表示了標(biāo)簽間的關(guān)聯(lián)度,被用于在標(biāo)簽查詢(xún)時(shí)獲取一個(gè)或多個(gè)與待查找標(biāo)簽具有一定關(guān)聯(lián)度的標(biāo)簽。其中,所述的獲取模塊510,計(jì)算模塊520,以及連接模塊530,可以是軟件模塊,能夠在計(jì)算機(jī)系統(tǒng)的處理器中執(zhí)行;也可以是特定的集成電路。請(qǐng)參考圖5b,一些實(shí)施例中,所述數(shù)據(jù)集有多個(gè)樣本,其中每個(gè)樣本有多個(gè)變量,所述獲取模塊510包括:第一獲取單元5101,用于對(duì)于通過(guò)產(chǎn)生規(guī)則產(chǎn)生的標(biāo)簽,從所述數(shù)據(jù)集中查找所述產(chǎn)生規(guī)則涉及的變量集,遍歷所述數(shù)據(jù)集,找出變量落入所述變量集的所有樣本,得到對(duì)應(yīng)的樣本集合。請(qǐng)參考圖5b,一些實(shí)施例中,所述數(shù)據(jù)集有多個(gè)樣本,其中每個(gè)樣本有多個(gè)變量,所述獲取模塊510包括:第二獲取單元5102,用于對(duì)于通過(guò)產(chǎn)生算法模型產(chǎn)生的標(biāo)簽,根據(jù)所述產(chǎn)生算法模型,進(jìn)行敏感性分析,計(jì)算出所述數(shù)據(jù)集中每個(gè)變量的重要性指標(biāo),所述敏感性分析用于分析所述變量發(fā)生變化時(shí)對(duì)所述產(chǎn)生算法模型的影響程度,找出重要性指標(biāo)大于設(shè)定的重要性閾值的變量集;遍歷所述數(shù)據(jù)集,找出變量落入所述變量集的所有樣本,得到對(duì)應(yīng)的樣本 集合。請(qǐng)參考圖5b,一些實(shí)施例中,所述樣本集合為一個(gè)數(shù)據(jù)矩陣,所述樣本集合的的每一行表示一個(gè)樣本,所述樣本集合的每一列表示一個(gè)變量;所述計(jì)算模塊520包括:確定單元5201,用于根據(jù)任意兩個(gè)標(biāo)簽A和B分別對(duì)應(yīng)的兩個(gè)樣本集合DA和DB,確定所述兩個(gè)標(biāo)簽A和B分別對(duì)應(yīng)的兩個(gè)變量集A={A1,…,Am}和B={B1,…,Bn},m和n分別所述兩個(gè)變量集的變量數(shù),且m和n均為正整數(shù);第一計(jì)算單元5202,用于計(jì)算所述兩個(gè)變量集的交集C={C1,…,Cl}={A1,…,Am}∩{B1,…,Bm},l是所述交集的變量數(shù),且l為正整數(shù);獲取單元5203,用于獲取所述交集中的任一個(gè)變量c在所述兩個(gè)樣本集合DA和DB中各自對(duì)應(yīng)的列和得到兩個(gè)列;第二計(jì)算單元5204,用于采用統(tǒng)計(jì)方法計(jì)算所述兩個(gè)列和的列間關(guān)聯(lián)系數(shù)第三計(jì)算單元5205,用于根據(jù)所述列間關(guān)聯(lián)系數(shù)計(jì)算所述兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù)ρAB。一些實(shí)施例中,所述第二計(jì)算單元5204,具體用于:記所述交集中的任一個(gè)變量c在所述兩個(gè)樣本集合中各自對(duì)應(yīng)的列分別為和記所述兩個(gè)列的列間關(guān)聯(lián)系數(shù)為則:如果c是連續(xù)變量,采用如下公式計(jì)算:其中且n1,M1,SD1分別為的樣本數(shù),平均值和標(biāo)準(zhǔn)方差;且n2,M2,SD2分別為的樣本數(shù),平均值和標(biāo)準(zhǔn)方差;如果c是分類(lèi)變量,采用如下公式計(jì)算:其中其中,N為變量c的類(lèi)別數(shù),n1為的樣本數(shù),n2為的樣本數(shù),且n1>n2,fi和gi分別是和的頻數(shù)分布中的第i個(gè)值,i為不小于1且不大于N的整數(shù)。一些實(shí)施例中,所述第三計(jì)算單元5205,具體用于對(duì)得到的所有列間關(guān)聯(lián)系數(shù)求和,將求得的和分別除以所述兩個(gè)樣本集合的變量數(shù)得到兩個(gè)均值,所述兩個(gè)均值的和的一半即為所述兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù)。一些實(shí)施例中,所述連接模塊530,具體用于采用如下公式計(jì)算所述兩個(gè)樣本集合間的關(guān)聯(lián)系數(shù)ρAB:一些實(shí)施例中,所述連接模塊530,具體用于構(gòu)建無(wú)向圖,所述無(wú)向圖由多個(gè)頂點(diǎn)和用于連接頂點(diǎn)的邊構(gòu)成,其中每一個(gè)頂點(diǎn)表示一個(gè)標(biāo)簽,所述的邊為沒(méi)有方向的無(wú)向邊;當(dāng)兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)大于設(shè)定的關(guān)聯(lián)系數(shù)閾值時(shí),在所述無(wú)向圖中的所述兩個(gè)標(biāo)簽間連接一條無(wú)向邊,以所述兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)作為所述無(wú)向邊的權(quán)重。一些實(shí)施例中,所述標(biāo)簽集合為標(biāo)簽樹(shù),所述標(biāo)簽樹(shù)的葉子節(jié)點(diǎn)表示標(biāo)簽,所述標(biāo)簽樹(shù)的根節(jié)點(diǎn)以外的非葉子節(jié)點(diǎn)表示維度,所述連接模塊530,還用于在構(gòu)建無(wú)向圖的過(guò)程中,以所述標(biāo)簽樹(shù)的葉子節(jié)點(diǎn)作為所述無(wú)向圖的頂點(diǎn),使所述標(biāo)簽網(wǎng)絡(luò)和所述標(biāo)簽樹(shù)疊加在一起,構(gòu)成標(biāo)簽樹(shù)增強(qiáng)的混合標(biāo)簽網(wǎng)絡(luò)。一些實(shí)施例中,所述計(jì)算模塊520具體用于計(jì)算分屬于不同維度的任兩個(gè)標(biāo)簽A和B分別對(duì)應(yīng)的兩個(gè)樣本集合DA和DB間的關(guān)聯(lián)系數(shù)??梢岳斫猓景l(fā)明實(shí)施例的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng)的各個(gè)功能模塊的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過(guò)程可參照上述方法實(shí)施例中的相關(guān)描述,此處不再贅述。由上可見(jiàn),在本發(fā)明的一些可行的實(shí)施方式中,公開(kāi)了一種基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng),該技術(shù)方案通過(guò)計(jì)算標(biāo)簽間的關(guān)聯(lián)系數(shù),在關(guān)聯(lián)系 數(shù)滿(mǎn)足預(yù)設(shè)條件的兩個(gè)標(biāo)簽之間建立連接,產(chǎn)生一標(biāo)簽網(wǎng)絡(luò),該標(biāo)簽網(wǎng)絡(luò)能夠反映標(biāo)簽間的關(guān)聯(lián)關(guān)系,從而提供了一種可以高效的組織和管理碎片化標(biāo)簽的機(jī)制,可以有效提高標(biāo)簽的使用和管理效率,包括提高標(biāo)簽的查詢(xún)效率等。(實(shí)施例三、)請(qǐng)參考圖6,本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)設(shè)備600,可包括:所述計(jì)算機(jī)設(shè)備600可包括處理器610、存儲(chǔ)器620、總線(xiàn)630和通信接口640;所述存儲(chǔ)器620用于存儲(chǔ)程序650,所述程序650包括計(jì)算機(jī)執(zhí)行指令,所述處理器610與所述存儲(chǔ)器620通過(guò)所述總線(xiàn)630連接,當(dāng)所述計(jì)算機(jī)設(shè)備600運(yùn)行時(shí),所述處理器610執(zhí)行所述存儲(chǔ)器620存儲(chǔ)的所述程序650,以使所述計(jì)算機(jī)設(shè)備600執(zhí)行如上文方法實(shí)施例所述的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法。本發(fā)明實(shí)施例二公開(kāi)的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng),可以由計(jì)算機(jī)設(shè)備600實(shí)現(xiàn),標(biāo)簽網(wǎng)絡(luò)產(chǎn)生系統(tǒng)中的獲取模塊510,計(jì)算模塊520,以及連接模塊530,可以由處理器610執(zhí)行程序650中特定的功能單元來(lái)實(shí)現(xiàn)。所述總線(xiàn)630可以是工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(IndustryStandardArchitecture,簡(jiǎn)稱(chēng)為ISA)總線(xiàn)或外部設(shè)備互連(PeripheralComponent,簡(jiǎn)稱(chēng)為PCI)總線(xiàn)或擴(kuò)展工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ExtendedIndustryStandardArchitecture,簡(jiǎn)稱(chēng)為EISA)總線(xiàn)等。所述總線(xiàn)可以分為地址總線(xiàn)、數(shù)據(jù)總線(xiàn)、控制總線(xiàn)中的一種或多種。為便于表示,圖6中僅用一條粗線(xiàn)表示,但并不表示僅有一根總線(xiàn)或一種類(lèi)型的總線(xiàn)。所述存儲(chǔ)器620用于存儲(chǔ)可執(zhí)行程序代碼,該程序代碼包括計(jì)算機(jī)操作指令。所述存儲(chǔ)器620可以包含高速RAM(RamdomAccessMemory)存儲(chǔ)器??蛇x地,所述存儲(chǔ)器620還可以還包括非易失性存儲(chǔ)器(non-volatilememory)。例如所述存儲(chǔ)器620可以包括磁盤(pán)存儲(chǔ)器。所述處理器610可以是一個(gè)中央處理器(CentralProcessingUnit,簡(jiǎn)稱(chēng)為CPU),或者所述處理器610可以是特定集成電路(ApplicationSpecificIntegratedCircuit,簡(jiǎn)稱(chēng)為ASIC),或者所述處理器610可以是被配置成實(shí)施本發(fā)明實(shí)施例的一個(gè)或多個(gè)集成電路??梢岳斫?,本發(fā)明實(shí)施例的計(jì)算機(jī)設(shè)備的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過(guò)程可參照上述方法實(shí)施例中的相關(guān)描述,此處不再贅述。由上可見(jiàn),在本發(fā)明的一些可行的實(shí)施方式中,公開(kāi)了一種計(jì)算機(jī)設(shè)備,該計(jì)算機(jī)設(shè)備可執(zhí)行上文方法實(shí)施例所述的方法,取得該方法實(shí)施例所能取得的技術(shù)效果。(實(shí)施例四、)本發(fā)明實(shí)施例還提供一種存儲(chǔ)一個(gè)或多個(gè)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述一個(gè)或多個(gè)程序包括指令,所述指令當(dāng)被包括一個(gè)或多個(gè)處理器的計(jì)算機(jī)設(shè)備執(zhí)行時(shí),使所述計(jì)算機(jī)設(shè)備執(zhí)行如上文方法實(shí)施例所述的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法。(實(shí)施例五、)本發(fā)明實(shí)施例還提供一種基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法,所述標(biāo)簽網(wǎng)絡(luò)包括多個(gè)標(biāo)簽,其中任意兩個(gè)具有關(guān)聯(lián)的標(biāo)簽之間建立有連接,所說(shuō)的關(guān)聯(lián)是指兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)滿(mǎn)足預(yù)設(shè)條件。請(qǐng)參考圖3,是一種標(biāo)簽網(wǎng)絡(luò)的示意圖,該標(biāo)簽網(wǎng)絡(luò)包括多個(gè)節(jié)點(diǎn)(或稱(chēng)為頂點(diǎn))和多條連接節(jié)點(diǎn)的邊(具體可以是沒(méi)有方向的無(wú)向邊),多個(gè)節(jié)點(diǎn)例如可以包括9個(gè)標(biāo)簽{中低端手機(jī)用戶(hù),中高端手機(jī)用戶(hù),高端手機(jī)用戶(hù),低額度信用卡用戶(hù),中額度信用卡用戶(hù),高額度信用卡用戶(hù),實(shí)用型,時(shí)尚型,體驗(yàn)型},這9個(gè)標(biāo)簽lieu來(lái)自三個(gè)維度{手機(jī)類(lèi)型,用戶(hù)信用卡等級(jí),購(gòu)物消費(fèi)類(lèi)型};標(biāo)簽網(wǎng)絡(luò)的每一條邊上還設(shè)有權(quán)重,權(quán)重是該邊連接的兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)。需要說(shuō)明的是,所述標(biāo)簽網(wǎng)絡(luò)可以是采用本發(fā)明實(shí)施例一所述基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法產(chǎn)生的;關(guān)于標(biāo)簽網(wǎng)絡(luò)的產(chǎn)生流程以及更多的說(shuō)明,請(qǐng)參考前文實(shí)施例一所述的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法,此處不再贅述。如圖7所示,所述基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法可以包括:701、接收包括待查找標(biāo)簽的查詢(xún)請(qǐng)求,所述查詢(xún)請(qǐng)求用于查找所述待查 找標(biāo)簽表征的目標(biāo)用戶(hù)群;702、從所述標(biāo)簽網(wǎng)絡(luò)中查找與所述待查找標(biāo)簽間的關(guān)聯(lián)系數(shù)滿(mǎn)足設(shè)定條件的至少一個(gè)關(guān)聯(lián)標(biāo)簽;703、根據(jù)所述待查找標(biāo)簽和所述至少一個(gè)關(guān)聯(lián)標(biāo)簽查詢(xún)用戶(hù)數(shù)據(jù)庫(kù),找出對(duì)應(yīng)的目標(biāo)用戶(hù)群。可選的,方法還包括:對(duì)找出的所述目標(biāo)用戶(hù)群執(zhí)行特定的管理操作。采用上述技術(shù)方案,由于精確營(yíng)銷(xiāo)或其它需求而需要查找特定的目標(biāo)用戶(hù)群時(shí),可以根據(jù)該標(biāo)簽網(wǎng)絡(luò)進(jìn)行用戶(hù)查詢(xún),包括:首先,給定用來(lái)表征該目標(biāo)用戶(hù)群的若干個(gè)標(biāo)簽,對(duì)給定的若干個(gè)標(biāo)簽,由于標(biāo)簽網(wǎng)絡(luò)中建立了標(biāo)簽間的連接,可以查詢(xún)得到與所述若干個(gè)標(biāo)簽的關(guān)聯(lián)系數(shù)在一個(gè)預(yù)設(shè)范圍內(nèi)的大量相關(guān)聯(lián)的標(biāo)簽,可以認(rèn)為查詢(xún)得到大量相關(guān)聯(lián)的標(biāo)簽夠也能夠用來(lái)表征所述目標(biāo)用戶(hù)群,于是,根據(jù)給定的標(biāo)簽和查詢(xún)到的相關(guān)聯(lián)的標(biāo)簽,從用戶(hù)數(shù)據(jù)庫(kù)中查詢(xún)用戶(hù),就可以得到對(duì)應(yīng)的目標(biāo)用戶(hù)群,從而滿(mǎn)足精確營(yíng)銷(xiāo)或其它需求。在該查找過(guò)程中,用戶(hù)不需要輸入目標(biāo)用戶(hù)群的全部標(biāo)簽,而是只需要輸入很少的若干個(gè)標(biāo)簽即可,也就是說(shuō),不需要用戶(hù)花費(fèi)很多的精力去查詢(xún)所需要的標(biāo)簽,從而提高了查詢(xún)效率。(實(shí)施例六、)本發(fā)明實(shí)施例還提供一種基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用裝置,所述標(biāo)簽網(wǎng)絡(luò)包括多個(gè)標(biāo)簽,其中任意兩個(gè)具有關(guān)聯(lián)的標(biāo)簽之間建立有連接,所說(shuō)的關(guān)聯(lián)是指兩個(gè)標(biāo)簽間的關(guān)聯(lián)系數(shù)滿(mǎn)足預(yù)設(shè)條件,所述標(biāo)簽網(wǎng)絡(luò)可以是采用本發(fā)明實(shí)施例一所述基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法產(chǎn)生的;本發(fā)明實(shí)施例裝置可用于實(shí)施上述實(shí)施例五所述的基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法。如圖8所示,所述基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用裝置800可以包括:接收模塊801,用于接收包括待查找標(biāo)簽的查詢(xún)請(qǐng)求,所述查詢(xún)請(qǐng)求用于查找所述待查找標(biāo)簽表征的目標(biāo)用戶(hù)群;標(biāo)簽查找模塊802,用于從所述標(biāo)簽網(wǎng)絡(luò)中查找與所述待查找標(biāo)簽間的關(guān)聯(lián)系數(shù)滿(mǎn)足設(shè)定條件的至少一個(gè)關(guān)聯(lián)標(biāo)簽;用戶(hù)查找模塊803,用于根據(jù)所述待查找標(biāo)簽和所述至少一個(gè)關(guān)聯(lián)標(biāo)簽查 詢(xún)用戶(hù)數(shù)據(jù)庫(kù),找出對(duì)應(yīng)的目標(biāo)用戶(hù)群??蛇x的,裝置800還可以包括:執(zhí)行模塊804,用于對(duì)找出的所述目標(biāo)用戶(hù)群執(zhí)行特定的管理操作。其中,裝置800的各個(gè)功能模塊,可以是軟件模塊,能夠在計(jì)算機(jī)系統(tǒng)的處理器中執(zhí)行;也可以是特定的集成電路。采用上述技術(shù)方案,由于精確營(yíng)銷(xiāo)或其它需求而需要查找特定的目標(biāo)用戶(hù)群時(shí),可以根據(jù)該標(biāo)簽網(wǎng)絡(luò)進(jìn)行用戶(hù)查詢(xún),包括:首先,給定用來(lái)表征該目標(biāo)用戶(hù)群的若干個(gè)標(biāo)簽,對(duì)給定的若干個(gè)標(biāo)簽,由于標(biāo)簽網(wǎng)絡(luò)中建立了標(biāo)簽間的連接,可以查詢(xún)得到與所述若干個(gè)標(biāo)簽的關(guān)聯(lián)系數(shù)在一個(gè)預(yù)設(shè)范圍內(nèi)的大量相關(guān)聯(lián)的標(biāo)簽,可以認(rèn)為查詢(xún)得到大量相關(guān)聯(lián)的標(biāo)簽夠也能夠用來(lái)表征所述目標(biāo)用戶(hù)群,于是,根據(jù)給定的標(biāo)簽和查詢(xún)到的相關(guān)聯(lián)的標(biāo)簽,從用戶(hù)數(shù)據(jù)庫(kù)中查詢(xún)用戶(hù),就可以得到對(duì)應(yīng)的目標(biāo)用戶(hù)群,從而滿(mǎn)足精確營(yíng)銷(xiāo)或其它需求。在該查找過(guò)程中,用戶(hù)不需要輸入目標(biāo)用戶(hù)群的全部標(biāo)簽,而是只需要輸入很少的若干個(gè)標(biāo)簽即可,也就是說(shuō),不需要用戶(hù)花費(fèi)很多的精力去查詢(xún)所需要的標(biāo)簽,從而提高了查詢(xún)效率。(實(shí)施例七、)請(qǐng)參考圖9,本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)設(shè)備900,可包括:所述計(jì)算機(jī)設(shè)備900可包括處理器910、存儲(chǔ)器920、總線(xiàn)930和通信接口940;所述存儲(chǔ)器920用于存儲(chǔ)程序950,所述程序950包括計(jì)算機(jī)執(zhí)行指令,所述處理器910與所述存儲(chǔ)器920通過(guò)所述總線(xiàn)930連接,當(dāng)所述計(jì)算機(jī)設(shè)備900運(yùn)行時(shí),所述處理器910執(zhí)行所述存儲(chǔ)器920存儲(chǔ)的所述程序950,以使所述計(jì)算機(jī)設(shè)備900執(zhí)行如上文方法實(shí)施例所述的基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法。本發(fā)明實(shí)施例六公開(kāi)的標(biāo)簽應(yīng)用系統(tǒng),可以由計(jì)算機(jī)設(shè)備900實(shí)現(xiàn),標(biāo)簽應(yīng)用系統(tǒng)中的接收模塊801可以由通信接口940實(shí)現(xiàn),標(biāo)簽查找模塊802,用戶(hù)查找模塊803,執(zhí)行模塊804這三個(gè)模塊可以由處理器910執(zhí)行程序950中特定的功能單元來(lái)實(shí)現(xiàn)。所述總線(xiàn)930可以是工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(IndustryStandardArchitecture,簡(jiǎn) 稱(chēng)為ISA)總線(xiàn)或外部設(shè)備互連(PeripheralComponent,簡(jiǎn)稱(chēng)為PCI)總線(xiàn)或擴(kuò)展工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ExtendedIndustryStandardArchitecture,簡(jiǎn)稱(chēng)為EISA)總線(xiàn)等。所述總線(xiàn)可以分為地址總線(xiàn)、數(shù)據(jù)總線(xiàn)、控制總線(xiàn)中的一種或多種。為便于表示,圖9中僅用一條粗線(xiàn)表示,但并不表示僅有一根總線(xiàn)或一種類(lèi)型的總線(xiàn)。所述存儲(chǔ)器920用于存儲(chǔ)可執(zhí)行程序代碼,該程序代碼包括計(jì)算機(jī)操作指令。所述存儲(chǔ)器920可以包含高速RAM(RamdomAccessMemory)存儲(chǔ)器。可選地,所述存儲(chǔ)器920還可以還包括非易失性存儲(chǔ)器(non-volatilememory)。例如所述存儲(chǔ)器920可以包括磁盤(pán)存儲(chǔ)器。所述處理器910可以是一個(gè)中央處理器(CentralProcessingUnit,簡(jiǎn)稱(chēng)為CPU),或者所述處理器610可以是特定集成電路(ApplicationSpecificIntegratedCircuit,簡(jiǎn)稱(chēng)為ASIC),或者所述處理器910可以是被配置成實(shí)施本發(fā)明實(shí)施例的一個(gè)或多個(gè)集成電路??梢岳斫?,本發(fā)明實(shí)施例的計(jì)算機(jī)設(shè)備的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過(guò)程可參照上述方法實(shí)施例中的相關(guān)描述,此處不再贅述。由上可見(jiàn),在本發(fā)明的一些可行的實(shí)施方式中,公開(kāi)了一種計(jì)算機(jī)設(shè)備,該計(jì)算機(jī)設(shè)備可執(zhí)行上文方法實(shí)施例所述的方法,取得該方法實(shí)施例所能取得的技術(shù)效果。(實(shí)施例八、)本發(fā)明實(shí)施例還提供一種存儲(chǔ)一個(gè)或多個(gè)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述一個(gè)或多個(gè)程序包括指令,所述指令當(dāng)被包括一個(gè)或多個(gè)處理器的計(jì)算機(jī)設(shè)備執(zhí)行時(shí),使所述計(jì)算機(jī)設(shè)備執(zhí)行如上文方法實(shí)施例所述的基于標(biāo)簽網(wǎng)絡(luò)的標(biāo)簽應(yīng)用方法。在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳細(xì)描述的部分,可以參見(jiàn)其它實(shí)施例的相關(guān)描述。需要說(shuō)明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其它順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng),裝置和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或 者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲(chǔ)器(RAM,RandomAccessMemory)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上對(duì)本發(fā)明實(shí)施例所提供的基于數(shù)據(jù)集相關(guān)性的標(biāo)簽網(wǎng)絡(luò)產(chǎn)生方法和系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。當(dāng)前第1頁(yè)1 2 3