亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種對(duì)象聚類方法和裝置的制造方法

文檔序號(hào):9249263閱讀:552來源:國知局
一種對(duì)象聚類方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及計(jì)算機(jī)技術(shù)領(lǐng)域,具體設(shè)及一種對(duì)象聚類方法和裝置。
【背景技術(shù)】
[0002] 在數(shù)據(jù)處理過程中,將物理或抽象對(duì)象的集合分成由類似的對(duì)象組成的多個(gè)類的 過程被稱為聚類。由聚類所生成的類(簇)是一組數(shù)據(jù)對(duì)象的集合,該些對(duì)象與同一個(gè)類 (簇)中的對(duì)象彼此相似,與其他類(簇)中的對(duì)象相異。下文使用"類"的概念,需要說明 的是,本文中"類"與"簇"的含義相同。
[0003]而在互聯(lián)網(wǎng)中,存在大量的品牌數(shù)據(jù),需要將該些品牌數(shù)據(jù)進(jìn)行聚類,方便后續(xù)處 理,比如針對(duì)性的推送廣告數(shù)據(jù),在先技術(shù)中存在一種層次聚類的方法,其是各個(gè)類的中屯、 點(diǎn)計(jì)算兩個(gè)類之間的距離,然后將兩個(gè)距離最近的類合并為一個(gè)新的類,但是其對(duì)新的類 的中屯、只是根據(jù)兩個(gè)類中的樣本個(gè)數(shù)去計(jì)算,然后計(jì)算下一輪各個(gè)類之間的距離,循環(huán)聚 類直到達(dá)到結(jié)束條件。
[0004] 但是,上述聚類方法中,其新的類的中屯、點(diǎn)是根據(jù)兩個(gè)類的樣本個(gè)數(shù)計(jì)算的,與實(shí) 際應(yīng)用中樣本的分布重屯、存在較大偏差,因此,聚類得到的品牌分類不夠精確,導(dǎo)致后續(xù)的 處理計(jì)算量大,并且后續(xù)處理結(jié)果偏差更大。

【發(fā)明內(nèi)容】

[0005]鑒于上述問題,提出了本發(fā)明W便提供一種克服上述問題或者至少部分地解決上 述問題的對(duì)象聚類裝置和相應(yīng)的對(duì)象聚類方法。
[0006] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種對(duì)象聚類方法,包括:
[0007]獲取待聚類的樣本和各樣本的訪問權(quán)重;所述訪問權(quán)重為所述樣本被訪問時(shí)的重 要程度,所述樣本包括品牌數(shù)據(jù);
[000引將各樣本劃分為一個(gè)分類對(duì)象,并將相應(yīng)樣本的坐標(biāo)作為所述分類對(duì)象的中屯、 坐標(biāo),并將相應(yīng)樣本的訪問權(quán)重作為所述分類對(duì)象的訪問權(quán)重;
[0009] 根據(jù)每個(gè)分類對(duì)象的訪問權(quán)重和中屯、坐標(biāo),將各分類對(duì)象進(jìn)行聚類,獲得各包括 至少一個(gè)品牌數(shù)據(jù)的品牌分類。
[0010] 優(yōu)選的,所述根據(jù)每個(gè)分類對(duì)象的訪問權(quán)重和中屯、坐標(biāo),將各分類對(duì)象進(jìn)行聚類 的步驟包括:
[0011] 針對(duì)各個(gè)分類對(duì)象,根據(jù)每個(gè)分類對(duì)象的中屯、坐標(biāo),計(jì)算每?jī)蓚€(gè)分類對(duì)象之間的 距離;
[0012] 將距離最近的兩個(gè)分類對(duì)象聚合為一個(gè)新的分類對(duì)象,并根據(jù)每個(gè)分類對(duì)象的中 屯、坐標(biāo)和訪問權(quán)重,計(jì)算所述新的分類對(duì)象的中屯、坐標(biāo)和訪問權(quán)重.
[0013] 判斷是否達(dá)到聚合結(jié)束條件,如果未達(dá)到聚合結(jié)束條件,將新的分類對(duì)象與當(dāng)前 回合中未聚合的分類對(duì)象,一并返回針對(duì)各個(gè)分類對(duì)象,根據(jù)每個(gè)分類對(duì)象的中屯、坐標(biāo),計(jì) 算每?jī)蓚€(gè)分類對(duì)象之間的距離的步驟,直到達(dá)到聚合結(jié)束條件。
[0014] 優(yōu)選的,所述訪問權(quán)重包括:
[0015] 所述樣本在網(wǎng)絡(luò)中被瀏覽的瀏覽權(quán)重;
[0016] 和/或,所述樣本在網(wǎng)絡(luò)中被點(diǎn)擊的點(diǎn)擊權(quán)重;
[0017] 和/或,所述樣本最近被瀏覽時(shí)刻距離基準(zhǔn)時(shí)刻的時(shí)間跨度權(quán)重;
[001引和/或,所述樣本所在網(wǎng)站的網(wǎng)站權(quán)重;
[0019] 和/或,所述樣本最近被瀏覽時(shí),用戶的瀏覽行為所在區(qū)域的區(qū)域權(quán)重;
[0020] 和/或,所述樣本所在被捜索時(shí)的捜索權(quán)重。
[0021] 優(yōu)選的,所述針對(duì)各個(gè)分類對(duì)象,根據(jù)每個(gè)分類對(duì)象的中屯、坐標(biāo),計(jì)算每?jī)蓚€(gè)分類 對(duì)象之間的距離的步驟,包括:
[0022] 針對(duì)每個(gè)分類對(duì)象,根據(jù)中屯、坐標(biāo)構(gòu)建中屯、向量;
[0023] 計(jì)算每?jī)蓚€(gè)分類對(duì)象所對(duì)應(yīng)的兩個(gè)中屯、向量之間的余弦距離。
[0024] 優(yōu)選的,所述獲取初始的各樣本的步驟,包括:
[0025] 針對(duì)每個(gè)樣本,根據(jù)業(yè)務(wù)標(biāo)識(shí)獲取相應(yīng)的訪問權(quán)重。
[0026] 優(yōu)選的,在根據(jù)每個(gè)分類對(duì)象的訪問權(quán)重和中屯、坐標(biāo),將各分類對(duì)象進(jìn)行聚類的 步驟之后,還包括:
[0027] 針對(duì)每個(gè)用戶,根據(jù)用戶對(duì)各個(gè)所述用戶對(duì)各類中的品牌數(shù)據(jù)的訪問行為數(shù)據(jù), 對(duì)所述用戶打上品牌分類標(biāo)簽。
[002引優(yōu)選的,在針對(duì)每個(gè)用戶,根據(jù)用戶對(duì)各個(gè)所述用戶對(duì)各類中的品牌數(shù)據(jù)的訪問 行為數(shù)據(jù),對(duì)所述用戶打上品牌分類標(biāo)簽步驟之后,還包括:
[0029] 根據(jù)所述用戶的品牌分類標(biāo)簽,將對(duì)應(yīng)所述標(biāo)記的第=對(duì)象發(fā)送給所述用戶所在 終端;所述第=對(duì)象包括針對(duì)所述品牌數(shù)據(jù)的廣告數(shù)據(jù)。
[0030] 優(yōu)選的,所述根據(jù)每個(gè)分類對(duì)象的中屯、坐標(biāo)和訪問權(quán)重,計(jì)算所述新的分類對(duì)象 的中屯、坐標(biāo)包括:
[0031] 根據(jù)業(yè)務(wù)標(biāo)識(shí),調(diào)用相應(yīng)的坐標(biāo)計(jì)算函數(shù)計(jì)算所述新的分類的中屯、坐標(biāo)。
[0032] 依據(jù)本發(fā)明的另外一個(gè)方面,還公開了一種對(duì)象聚類裝置,包括:
[0033] 初始對(duì)象獲取模塊,適于獲取待聚類的樣本和各樣本的訪問權(quán)重;所述訪問權(quán)重 為所述樣本被訪問時(shí)的重要程度;
[0034] 劃分模塊,適于將各樣本劃分為一個(gè)分類對(duì)象,并將相應(yīng)樣本的坐標(biāo)作為所述分 類對(duì)象的中屯、坐標(biāo),并將相應(yīng)樣本的訪問權(quán)重作為所述分類對(duì)象的訪問權(quán)重;
[0035] 聚類模塊,適于根據(jù)每個(gè)分類對(duì)象的訪問權(quán)重和中屯、坐標(biāo),將各分類對(duì)象進(jìn)行聚 類。
[0036] 優(yōu)選的,所述聚類模塊包括:
[0037] 距離計(jì)算模塊,適于針對(duì)各個(gè)分類對(duì)象,根據(jù)每個(gè)分類對(duì)象的中屯、坐標(biāo),計(jì)算每?jī)?個(gè)分類對(duì)象之間的距離;
[003引聚合模塊,適于將距離最近的兩個(gè)分類對(duì)象聚合為一個(gè)新的分類對(duì)象,并根據(jù)每 個(gè)分類對(duì)象的中屯、坐標(biāo)和訪問權(quán)重,計(jì)算所述新的分類對(duì)象的中屯、坐標(biāo)和訪問權(quán)重;
[0039] 判斷模塊,適于判斷是否達(dá)到聚合結(jié)束條件,如果未達(dá)到聚合結(jié)束條件,將新的分 類對(duì)象與當(dāng)前回合中未聚合的分類對(duì)象,一并返回針對(duì)各個(gè)分類對(duì)象,根據(jù)每個(gè)分類對(duì)象 的中屯、坐標(biāo),計(jì)算每?jī)蓚€(gè)分類對(duì)象之間的距離的步驟,直到達(dá)到聚合結(jié)束條件。
[0040] 優(yōu)選的,所述訪問權(quán)重包括:
[0041] 所述樣本在網(wǎng)絡(luò)中被瀏覽的瀏覽權(quán)重;
[00創(chuàng)和/或,所述樣本在網(wǎng)絡(luò)中被點(diǎn)擊的點(diǎn)擊權(quán)重;
[0043] 和/或,所述樣本最近被瀏覽時(shí)刻距離基準(zhǔn)時(shí)刻的時(shí)間跨度權(quán)重;
[0044] 和/或,所述樣本所在網(wǎng)站的網(wǎng)站權(quán)重;
[0045] 和/或,所述樣本最近被瀏覽時(shí),用戶的瀏覽行為所在區(qū)域的區(qū)域權(quán)重;
[0046] 和/或,所述樣本所在被捜索時(shí)的捜索權(quán)重。
[0047] 優(yōu)選的,所述距離計(jì)算模塊包括:
[0048] 中屯、向量構(gòu)建模塊,適于針對(duì)每個(gè)分類對(duì)象,根據(jù)中屯、坐標(biāo)構(gòu)建中屯、向量;
[0049] 余弦距離計(jì)算模塊,適于計(jì)算每?jī)蓚€(gè)分類對(duì)象所對(duì)應(yīng)的兩個(gè)中屯、向量之間的余弦 距離。
[0化0] 優(yōu)選的,所述初始對(duì)象獲取模塊包括:
[0化1] 訪問權(quán)重獲取模塊,適于針對(duì)每個(gè)樣本,根據(jù)業(yè)務(wù)標(biāo)識(shí)獲取相應(yīng)的訪問權(quán)重。
[005引優(yōu)選的,還包括:
[0化3] 標(biāo)記模塊,適于針對(duì)每個(gè)用戶,根據(jù)用戶對(duì)各個(gè)所述用戶對(duì)各類中的品牌數(shù)據(jù)的 訪問行為數(shù)據(jù),對(duì)所述用戶打上品牌分類標(biāo)簽。
[0054] 優(yōu)選的,還包括;
[0化5] 對(duì)象發(fā)送模塊,適于根據(jù)所述用戶的品牌分類標(biāo)簽,將對(duì)應(yīng)所述標(biāo)記的第=對(duì)象 發(fā)送給所述用戶所在終端;所述第=對(duì)象包括針對(duì)所述品牌數(shù)據(jù)的廣告數(shù)據(jù)。
[0化6] 優(yōu)選的,所述第一聚合模塊包括:
[0化7] 計(jì)算函數(shù)選擇模塊,適于根據(jù)業(yè)務(wù)標(biāo)識(shí),調(diào)用相應(yīng)的坐標(biāo)計(jì)算函數(shù)計(jì)算所述新的 分類的中屯、坐標(biāo)。
[005引根據(jù)本發(fā)明的對(duì)象聚類方法可W獲取包括訪問權(quán)重的初始品牌數(shù)據(jù),該訪問權(quán)重 指示了所述品牌數(shù)據(jù)被訪問時(shí)的重要程度,然后根據(jù)品牌數(shù)據(jù)的訪問權(quán)重參與聚類過程, 那么在聚類時(shí),訪問權(quán)重高的品牌數(shù)據(jù)參與度高,由此解決了傳統(tǒng)聚類過程中依據(jù)各類中 的品牌數(shù)據(jù)數(shù)量進(jìn)行聚類,而導(dǎo)致品牌數(shù)據(jù)聚合度分散,聚類不夠準(zhǔn)確的問題,從而導(dǎo)致后 續(xù)處理計(jì)算量大,計(jì)算結(jié)果偏差大的問題,取得了聚類結(jié)果精確,使后續(xù)的處理計(jì)算量小, 偏差低的有益效果。
[0059] 上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說明書的內(nèi)容予W實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠 更明顯易懂,W下特舉本發(fā)明的【具體實(shí)施方式】。
【附圖說明】
[0060] 通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通 技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明 的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0061] 圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種對(duì)象聚類方法的流程示意圖;
[0062] 圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種對(duì)象聚類方法的流程示意圖;
[0063] 圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種對(duì)象聚類方法的流程示意圖;
[0064] 圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種對(duì)象聚類裝置的結(jié)構(gòu)示意圖;
[0065] 圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種對(duì)象聚類裝置的結(jié)構(gòu)示意圖;W及
[0066] 圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種對(duì)象聚類裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0067] 下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開 的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可各種形式實(shí)現(xiàn)本公開而不應(yīng)被該里闡述的實(shí)施例 所限制。相反,提供該些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍 完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0068] 本發(fā)明的核屯、思想之一在于;本發(fā)明實(shí)施例針對(duì)的是品牌數(shù)據(jù),該品牌數(shù)據(jù)包括 了用戶訪問數(shù)據(jù),比如各用戶訪問該品牌的瀏覽數(shù)據(jù)、點(diǎn)擊數(shù)據(jù)、購買數(shù)據(jù)、收藏?cái)?shù)據(jù)等用 戶訪問數(shù)據(jù),本發(fā)明實(shí)施例的品牌數(shù)據(jù)是對(duì)包括上述用戶訪問數(shù)據(jù)的一種概括。對(duì)于各品 牌數(shù)據(jù),獲取其訪問權(quán)重,該訪問權(quán)重表示所述品牌數(shù)據(jù)被訪問時(shí)的重要程度。然后W該品 牌數(shù)據(jù)和訪問權(quán)重作為的樣本進(jìn)行聚類過程中,訪問權(quán)重高的品牌數(shù)據(jù)參與度高,使分類 對(duì)象中屯、偏向訪問權(quán)重高的一側(cè),從而使最終的品牌數(shù)據(jù)聚類結(jié)果更精確,降低后續(xù)處理 過程中的計(jì)算量,也降低后續(xù)處理的結(jié)果的偏差。
[00例實(shí)施例一
[0070] 參照?qǐng)D1,其示出了本發(fā)明一種對(duì)象聚類方法的流程示意圖,具體可W包括:
[0071] 步驟110,獲取待聚類的樣本和各樣本的訪問權(quán)重;所述訪問權(quán)重為所述樣本被 訪問時(shí)的重要程度;所述樣本包括品牌數(shù)據(jù)。
[0072] 可W理解,本發(fā)明實(shí)施例需要獲取各個(gè)樣本的信息和相應(yīng)的樣本的訪問權(quán)重。
[0073] 本發(fā)明實(shí)施例針對(duì)的是品牌數(shù)據(jù),該品牌數(shù)據(jù)包括了用戶訪問數(shù)據(jù),比如各用戶 訪問該品牌的瀏覽數(shù)據(jù)、點(diǎn)擊數(shù)據(jù)、購買數(shù)據(jù)、收藏?cái)?shù)據(jù)等用戶訪問數(shù)據(jù),本發(fā)明實(shí)施例的 品牌數(shù)據(jù)是對(duì)包括上述用戶訪問數(shù)據(jù)的一種概括。比如品牌數(shù)據(jù)"海欄之家",其包括用戶 在天貓網(wǎng)站的一個(gè)網(wǎng)頁中瀏覽商品對(duì)象的"2015夏季新品海欄之家男裝正品簡(jiǎn)約印花V領(lǐng) 短袖T恤HNTCJ2A101A"的用戶數(shù)據(jù)。又比如"阿迪達(dá)斯"、"耐克"、"iphoneV'S星"等均是 相應(yīng)商品對(duì)象的品牌數(shù)據(jù)。那么對(duì)于一個(gè)品牌數(shù)據(jù),可W獲取其多個(gè)維度的特征構(gòu)造品牌 數(shù)據(jù)的坐標(biāo)。比如品牌名稱、品牌簡(jiǎn)介、品牌受眾、該品牌下的品牌數(shù)據(jù)的價(jià)格、訪問量、收 藏量等,得到類似A= (al,a2,a3……}的多維坐標(biāo)。在本發(fā)明實(shí)施例中,對(duì)于一個(gè)品牌數(shù) 據(jù),可通過匯總網(wǎng)絡(luò)中展示所述品牌的相關(guān)商品的網(wǎng)頁數(shù)據(jù),進(jìn)行分析提取得到賞識(shí)特征。
[0074] 可W理解,各維度特征的初始的參數(shù)可W為任意字符類型,比如可W為數(shù)字,也可 W為漢字,當(dāng)然也可W為其他類型的參數(shù)。在本發(fā)明實(shí)施例中為則會(huì)將不為數(shù)字的初始
當(dāng)前第1頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1