數(shù)據(jù)挖掘方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種數(shù)據(jù)挖掘方法和裝置,涉及大數(shù)據(jù)領(lǐng)域。其中的方法包括:確定用戶品牌粘度的多項(xiàng)影響因素;通過因子分析確定所述多項(xiàng)影響因素的因子載荷矩陣;根據(jù)所述因子載荷矩陣以及所述多項(xiàng)影響因素確定每個公共因子對用戶品牌粘度的影響力;將各個公共因子對用戶品牌粘度的影響力進(jìn)行加權(quán)求和確定出用戶品牌粘度。從而降低大數(shù)據(jù)分析的復(fù)雜度,能夠更加高效地分析用戶品牌粘度。
【專利說明】
數(shù)據(jù)挖掘方法及裝置
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及大數(shù)據(jù)領(lǐng)域,特別涉及一種數(shù)據(jù)挖掘方法及裝置。
【背景技術(shù)】
[0002] 品牌粘度是指消費(fèi)者在購買決策中,多次表現(xiàn)出來對某個品牌有偏向性的而非隨 意的行為反應(yīng)。品牌粘度的形成不完全是依賴于產(chǎn)品的品質(zhì)、知名度、品牌聯(lián)想及傳播,還 與消費(fèi)者本身的特性,例如消費(fèi)者的產(chǎn)品使用經(jīng)歷,密切相關(guān)。提高品牌的粘度,對于電子 商務(wù)企業(yè)的生存與發(fā)展有著非常重要的意義,品牌粘度對于企業(yè)的價值還體現(xiàn)在擴(kuò)大市場 份額,降低營銷成本,增加利潤,吸引新顧客,提高銷售渠道拓展能力以及提高競爭門檻等 方面。
[0003] 現(xiàn)有技術(shù)通常利用用戶對品牌重復(fù)購買、價格敏感等因素進(jìn)行品牌粘度的度量。 當(dāng)采用數(shù)量較多的因素進(jìn)行衡量時,分析復(fù)雜度較高。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的一個目的是提出一種數(shù)據(jù)挖掘方案,降低多因素業(yè)務(wù)數(shù)據(jù)分析的復(fù)雜 度。
[0005] 根據(jù)本發(fā)明實(shí)施例的一個方面,提供了一種數(shù)據(jù)推送方法,包括:確定用戶品牌粘 度的多項(xiàng)影響因素;通過因子分析確定多項(xiàng)影響因素的因子載荷矩陣;根據(jù)因子載荷矩陣 以及多項(xiàng)影響因素確定每個公共因子對用戶品牌粘度的影響力;將各個公共因子對用戶品 牌粘度的影響力進(jìn)行加權(quán)求和確定出用戶品牌粘度。
[0006] 在一些實(shí)施例中,通過因子分析確定多項(xiàng)影響因素的因子載荷矩陣包括:根據(jù)模 型X = A*F以及X的輸入數(shù)據(jù),采用回歸方法確定出A;其中,X表示多項(xiàng)影響因素組成的p行1 列的矩陣,P為多項(xiàng)影響因素的項(xiàng)數(shù);A表示p行m列的因子載荷矩陣,m為公共因子的數(shù)量;F 表示公共因子組成的m行1列的矩陣。
[0007] 在一些實(shí)施例中,每個公共因子對用戶品牌粘度的影響力的權(quán)重根據(jù)該公共因子 在所有公共因子中的方差貢獻(xiàn)度占比確定。
[0008] 在一些實(shí)施例中,公共因子的數(shù)量根據(jù)各個公共因子在所有公共因子中的方差貢 獻(xiàn)度占比累計值滿足設(shè)定閾值時的數(shù)量確定,其中,各個公共因子按照方差貢獻(xiàn)度占比降 序排列。
[0009] 在一些實(shí)施例中,第j個公共因子的方差貢獻(xiàn)度為因子載荷矩陣第j列數(shù)據(jù)的平方 和,其中j表示1至m的自然數(shù),m為所述公共因子的數(shù)量。
[0010] 在一些實(shí)施例中,根據(jù)因子載荷矩陣以及多項(xiàng)影響因素確定每個公共因子對用戶 品牌粘度的影響力包括:根據(jù)因子載荷矩陣的第j列數(shù)據(jù)分別與每個影響因素輸入數(shù)據(jù)均 值的乘積確定第j個公共因子對用戶品牌粘度的影響力,其中j表示1至m的自然數(shù),m為公共 因子的數(shù)量。
[0011] 在一些實(shí)施例中,數(shù)據(jù)挖掘方法還包括:根據(jù)用戶品牌粘度的最大值和最小值對 各個用戶品牌粘度進(jìn)行標(biāo)準(zhǔn)化處理。
[0012] 在一些實(shí)施例中,用戶品牌粘度的影響因素包括用戶行為類別因素和用戶情感類 別因素中的至少一種;用戶行為類別因素包括:購買品牌數(shù)量、累計購買次數(shù)、累計購買金 額、重復(fù)購買品牌數(shù)量、重復(fù)購買次數(shù)、重復(fù)購買金額、使用品牌時長、用戶從注冊至第一次 購買的時長、品牌迀移概率、優(yōu)惠訂單量、優(yōu)惠訂單金額、推薦品牌次數(shù)、推薦品牌銷量中的 至少一種;用戶情感類別因素包括:用戶好評率、用戶投訴率、用戶退貨率、用戶拒收率中的 至少一種。
[0013] 根據(jù)本發(fā)明實(shí)施例的另一個方面,提供了一種數(shù)據(jù)挖掘裝置,包括:影響因素確定 模塊,用于確定用戶品牌粘度的多項(xiàng)影響因素;因子分析模塊,用于通過因子分析確定多項(xiàng) 影響因素的因子載荷矩陣;因子影響力確定模塊,用于根據(jù)因子載荷矩陣以及多項(xiàng)影響因 素確定每個公共因子對用戶品牌粘度的影響力;用戶品牌粘度確定模塊,用于將各個公共 因子對用戶品牌粘度的影響力進(jìn)行加權(quán)求和確定出用戶品牌粘度。
[0014] 在一些實(shí)施例中,因子分析模塊包括:數(shù)據(jù)輸入單元,用于輸入數(shù)據(jù)X;回歸計算單 元,用于根據(jù)模型X = A*F以及數(shù)據(jù)輸入單元輸入的數(shù)據(jù)X,通過回歸計算確定A;其中,X表示 多項(xiàng)影響因素組成的P行1列的矩陣,P為多項(xiàng)影響因素的項(xiàng)數(shù);A表示p行m列的因子載荷矩 陣,m為公共因子的數(shù)量;F表示公共因子組成的m行1列的矩陣。
[0015] 在一些實(shí)施例中,因子影響力確定模塊包括:公共因子權(quán)重確定單元,用于根據(jù)每 個公共因子在所有公共因子中的方差貢獻(xiàn)度占比確定每個公共因子對用戶品牌粘度的影 響力的權(quán)重。
[0016] 在一些實(shí)施例中,因子影響力確定模塊還包括:公共因子數(shù)量確定單元,用于根據(jù) 各個公共因子在所有公共因子中的方差貢獻(xiàn)度占比累計值滿足設(shè)定閾值時的數(shù)量確定公 共因子的數(shù)量,其中,各個公共因子按照方差貢獻(xiàn)度占比降序排列。
[0017] 在一些實(shí)施例中,第j個公共因子的方差貢獻(xiàn)度為因子載荷矩陣第j列數(shù)據(jù)的平方 和,其中j表示1至m的自然數(shù),m為所述公共因子的數(shù)量。
[0018]在一些實(shí)施例中,因子影響力確定模塊還包括:因子影響力確定單元,用于根據(jù)因 子載荷矩陣的第j列數(shù)據(jù)分別與每個影響因素輸入數(shù)據(jù)均值的乘積確定第j個公共因子對 用戶品牌粘度的影響力,其中j表示1至m的自然數(shù),m為公共因子的數(shù)量。
[0019] 在一些實(shí)施例中,數(shù)據(jù)挖掘裝置還包括:標(biāo)準(zhǔn)化模塊,用于根據(jù)用戶品牌粘度的最 大值和最小值對各個用戶品牌粘度進(jìn)行標(biāo)準(zhǔn)化處理。
[0020] 在一些實(shí)施例中,用戶品牌粘度的影響因素包括用戶行為類別因素和用戶情感類 別因素中的至少一種;用戶行為類別因素包括:購買品牌數(shù)量、累計購買次數(shù)、累計購買金 額、重復(fù)購買品牌數(shù)量、重復(fù)購買次數(shù)、重復(fù)購買金額、使用品牌時長、用戶從注冊至第一次 購買的時長、品牌迀移概率、優(yōu)惠訂單量、優(yōu)惠訂單金額、推薦品牌次數(shù)、推薦品牌銷量中的 至少一種;用戶情感類別因素包括:用戶好評率、用戶投訴率、用戶退貨率、用戶拒收率中的 至少一種。
[0021] 根據(jù)本發(fā)明實(shí)施例的又一個方面,提供了一種數(shù)據(jù)挖掘裝置,包括:
[0022]存儲器;以及耦接至存儲器的處理器,處理器被配置為基于存儲在存儲器中的指 令,執(zhí)行上述的數(shù)據(jù)挖掘方法。
[0023]本發(fā)明通過因子分析確定用戶品牌粘度的多項(xiàng)影響因素的因子載荷矩陣,并根據(jù) 因子載荷矩陣以及多項(xiàng)影響因素確定每個公共因子對用戶品牌粘度的影響力,從而將各個 公共因子對用戶品牌粘度的影響力進(jìn)行加權(quán)求和確定出用戶品牌粘度,進(jìn)而降低了大數(shù)據(jù) 分析的復(fù)雜度,能夠更加高效地分析用戶品牌粘度。
[0024] 通過以下參照附圖對本發(fā)明的示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其它特征及其 優(yōu)點(diǎn)將會變得清楚。
【附圖說明】
[0025] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可 以根據(jù)這些附圖獲得其他的附圖。
[0026] 圖1示出本發(fā)明數(shù)據(jù)挖掘方法的一個實(shí)施例的流程示意圖。
[0027] 圖2示出本發(fā)明數(shù)據(jù)挖掘裝置的一個實(shí)施例的結(jié)構(gòu)示意圖。
[0028] 圖3示出本發(fā)明因子分析模塊的一個實(shí)施例的結(jié)構(gòu)示意圖。
[0029 ]圖4示出本發(fā)明影響力確定模塊的一個實(shí)施例的結(jié)構(gòu)示意圖。
[0030]圖5示出本發(fā)明數(shù)據(jù)挖掘裝置的另一個實(shí)施例的結(jié)構(gòu)示意圖。
[0031 ]圖6示出本發(fā)明數(shù)據(jù)挖掘裝置的又一個實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0032]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。以下 對至少一個示例性實(shí)施例的描述實(shí)際上僅僅是說明性的,決不作為對本發(fā)明及其應(yīng)用或使 用的任何限制。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提 下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0033]圖1示出本發(fā)明數(shù)據(jù)挖掘方法的一個實(shí)施例的流程示意圖。本實(shí)施例能夠降低大 數(shù)據(jù)分析的復(fù)雜度。如圖1所示,該實(shí)施例的數(shù)據(jù)挖掘方法包括:
[0034]步驟S102,確定用戶品牌粘度的多項(xiàng)影響因素。
[0035]基于電子商務(wù)業(yè)務(wù)特點(diǎn),可以針對用戶和品牌間購買特征,確定影響用戶品牌忠 誠度的影響因素指標(biāo)。品牌忠誠度與顧客重復(fù)購買次數(shù)、購物時間長短、價格敏感程度、用 戶對品牌效用評價、用戶對品牌價值判斷、品牌推崇與介紹、情感投入與依賴等因素有關(guān)。 具體而言,用戶品牌粘度的影響因素可以包括用戶行為類別因素和用戶情感類別因素。用 戶行為類別因素例如可以包括:購買品牌數(shù)量、累計購買次數(shù)、累計購買金額、重復(fù)購買品 牌數(shù)量、重復(fù)購買次數(shù)、重復(fù)購買金額、使用品牌時長、用戶從注冊至第一次購買的時長、品 牌迀移概率、優(yōu)惠訂單量、優(yōu)惠訂單金額、推薦品牌次數(shù)、推薦品牌銷量中的至少一種等。用 戶情感類別因素例如可以包括:用戶好評率、用戶投訴率、用戶退貨率、用戶拒收率中的至 少一種等。
[0036]步驟S104,通過因子分析確定多項(xiàng)影響因素的因子載荷矩陣。
[0037]因子分析方法是一種數(shù)據(jù)簡化的技術(shù)?,F(xiàn)有的因子分析方法包括重心法、影像分 析法,最大似然解、最小平方法、阿爾法抽因法、拉奧典型抽因法等等,這些方法本質(zhì)上大都 屬于近似方法,并以因子載荷矩陣為基礎(chǔ)。利用SPSS(Statistical Product and Service Solutions,統(tǒng)計產(chǎn)品與服務(wù)解決方案)等因子分析軟件,輸入影響因素以及公共因子的個 數(shù),可以分析得到因子載荷矩陣。因子分析方法通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探 求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個假想變量來表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個假想 變量能夠反映原來眾多變量的主要信息。原始的變量是可觀測的顯在變量,而假想變量是 不可觀測的潛在變量,稱為因子。
[0038] 例如,假設(shè)X1Q = I,2,···,p)是p個影響因素,則將影響因素組成的矩陣帶入公式
[0039] x=A*F+e (1)
[0040] 其中,X為p行1列的影響因素矩陣,A為p行m列的因子載荷矩陣,F(xiàn)為m行1列的公共 因子矩陣,ε為m行1列的殘差項(xiàng)矩陣,也稱特殊因子,是不能被前m個公共因子包含的部分。 因此,每個影響因素可以被表示為
[0041] Xi = aiiFi+ai2F2+......+aimFm+ei(m^;p) (2)
[0042] 公式(1)采用矩陣的方法可以表示為
[0043]
(3)
[0044]其中,F(xiàn)Kj = I,2, ···,!!〇稱為公共因子,是不可觀測的變量。公共因子矩陣的系數(shù) 稱為因子載荷,比如ay是載荷矩陣中第i行第j列的元素,表示第i個變量影響因素與第j個 公共因子的相關(guān)系數(shù),反映了第i個影響因素變量與第j個公共因子的相關(guān)性。絕對值越大, 相關(guān)的密切程度越高。
[0045] 步驟S106,根據(jù)因子載荷矩陣以及多項(xiàng)影響因素確定每個公共因子對用戶品牌粘 度的影響力。
[0046] 例如,可以根據(jù)因子載荷矩陣的第j列數(shù)據(jù)分別與每個影響因素輸入數(shù)據(jù)均值的 乘積確定第j個公共因子對用戶品牌粘度的影響力。即,./} =為*^,其中^表示影響因 素)^的均值,即將包含影響因素心的各個樣本數(shù)據(jù)進(jìn)行加合后取平均,j表示1至m的自然數(shù), m為公共因子的數(shù)量。
[0047] 步驟S108,將各個公共因子對用戶品牌粘度的影響力進(jìn)行加權(quán)求和確定出用戶品 牌粘度。
[0048] 其中,每個公共因子對用戶品牌粘度的影響力的權(quán)重可以根據(jù)該公共因子在所有 公共因子中的方差貢獻(xiàn)度占比確定,其中第j個公共因子的方差貢獻(xiàn)度為因子載荷矩陣第j 列數(shù)據(jù)的平方和,即
庫中」表示1至m的自然數(shù),m為所述公共因子的數(shù)量。 其中,稱為第j個公共因子對所有影響因素的方差貢獻(xiàn)和,可以用來衡量第j個公共因子的 相對重要性。
[0049] 上述實(shí)施例通過因子分析確定用戶品牌粘度的多項(xiàng)影響因素的因子載荷矩陣,并 根據(jù)因子載荷矩陣以及多項(xiàng)影響因素確定每個公共因子對用戶品牌粘度的影響力,從而將 各個公共因子對用戶品牌粘度的影響力進(jìn)行加權(quán)求和確定出用戶品牌粘度,進(jìn)而降低了大 數(shù)據(jù)分析的復(fù)雜度,能夠更加高效地分析用戶品牌粘度。
[0050] 在本發(fā)明中,公共因子的數(shù)量根據(jù)各個公共因子在所有公共因子中的方差貢獻(xiàn)度 占比累計值滿足設(shè)定閾值時的數(shù)量確定,其中,各個公共因子按照方差貢獻(xiàn)度占比降序排 列。下面結(jié)合表1、表2以及表3描述公共因子數(shù)量的一種確定方法。
[0051] 假設(shè)確定用戶品牌粘度的多項(xiàng)影響因素如表1所示,其中,mpg、cyl、disp、hp、 drat、wt、qsec、vs、am、gear、carb等表示影響因素,η表示多項(xiàng)影響因素的樣本的數(shù)量。
[0052] 表 1
[0054]^基于表1所示的輸入數(shù)據(jù),通過因子分析確定多項(xiàng)影響因素的因子載荷矩陣,表2 中示例性的示出5個因子的因子載荷矩陣。
[0055] 根據(jù)表2所示的因子載荷矩陣,確定出各個公共因子的方差貢獻(xiàn)度以及方差貢獻(xiàn) 度占比如表3所示。
[0056] 其中,因子載荷矩陣以及方差貢獻(xiàn)度占比的計算方法可以參考前述,這里不再贅 述。
[0057] 表 2
[0061] 此時,將各個公共因子按照方差貢獻(xiàn)度占比降序排列。公共因子的最終數(shù)量根據(jù) 各個公共因子在所有公共因子中的方差貢獻(xiàn)度占比累計值滿足設(shè)定閾值時的數(shù)量確定。例 如,從表3累積方差貢獻(xiàn)度占比可以看出,當(dāng)公共因子數(shù)量m = 3時,累積方差占比已經(jīng)達(dá)到 83.5%,而m>3時,公共因子的方差占比已經(jīng)很小,對于累積方差占比的貢獻(xiàn)也越來越小,不 足以提供足夠的信息。此時,可以將公共因子數(shù)量m重新取值為3,并截取因子載荷矩陣的前 3列作為新的因子載荷矩陣,用于計算各個公共因子的方差貢獻(xiàn)度。
[0062] 通過上述方法確定公共因子的數(shù)量,可以進(jìn)一步進(jìn)行維度約減,從而使得計算復(fù) 雜度進(jìn)一步減低。
[0063] 可選的,數(shù)據(jù)挖掘方法還可以包括以下步驟:
[0064]步驟S110,根據(jù)用戶品牌粘度的最大值和最小值對各個用戶品牌粘度進(jìn)行標(biāo)準(zhǔn)化 處理。
[0065] 例如,確定出用戶品牌粘度L之后,可以通過極差標(biāo)準(zhǔn)化的方法將用戶品牌粘度L 換算到0-100之間,極差標(biāo)準(zhǔn)化的公式為:
[0066]
(4)
[0067] 最終用戶品牌粘度值越大越高,則用戶品牌粘度越高,可以據(jù)此對用戶品牌 粘度的等級進(jìn)行細(xì)分。
[0068] 下面結(jié)合圖2描述本發(fā)明一個實(shí)施例的數(shù)據(jù)挖掘裝置。
[0069] 圖2示出本發(fā)明數(shù)據(jù)挖掘裝置的一個實(shí)施例的結(jié)構(gòu)示意圖。本實(shí)施例能夠降低大 數(shù)據(jù)分析的復(fù)雜度。如圖2所示,該實(shí)施例的數(shù)據(jù)挖掘裝置20包括:
[0070] 影響因素確定模塊202,用于確定用戶品牌粘度的多項(xiàng)影響因素。
[0071] 因子分析模塊204,用于通過因子分析確定多項(xiàng)影響因素的因子載荷矩陣。
[0072] 因子影響力確定模塊206,用于根據(jù)因子載荷矩陣以及多項(xiàng)影響因素確定每個公 共因子對用戶品牌粘度的影響力。
[0073]用戶品牌粘度確定模塊208,用于將各個公共因子對用戶品牌粘度的影響力進(jìn)行 加權(quán)求和確定出用戶品牌粘度。
[0074]上述實(shí)施例通過因子分析確定用戶品牌粘度的多項(xiàng)影響因素的因子載荷矩陣,并 根據(jù)因子載荷矩陣以及多項(xiàng)影響因素確定每個公共因子對用戶品牌粘度的影響力,從而將 各個公共因子對用戶品牌粘度的影響力進(jìn)行加權(quán)求和確定出用戶品牌粘度,進(jìn)而降低了大 數(shù)據(jù)分析的復(fù)雜度,能夠更加高效地分析用戶品牌粘度。
[0075]下面結(jié)合圖3描述本發(fā)明一個實(shí)施例的因子分析模塊。
[0076]圖3示出本發(fā)明因子分析模塊的一個實(shí)施例的結(jié)構(gòu)示意圖。如圖3所示,該實(shí)施例 的因子分析模塊204包括:
[0077]數(shù)據(jù)輸入單元3042,用于輸入數(shù)據(jù)X。
[0078]回歸計算單元3044,用于根據(jù)模型X=A*F以及數(shù)據(jù)輸入單元輸入的數(shù)據(jù)X,通過回 歸計算確定A;其中,X表示多項(xiàng)影響因素組成的p行1列的矩陣,p為多項(xiàng)影響因素的項(xiàng)數(shù);A 表示P行m列的因子載荷矩陣,m為公共因子的數(shù)量;F表示公共因子組成的m行1列的矩陣。
[0079]下面結(jié)合圖4描述本發(fā)明一個實(shí)施例的影響力確定模塊。
[0080] 圖4示出本發(fā)明影響力確定模塊的一個實(shí)施例的結(jié)構(gòu)示意圖。如圖4所示,該實(shí)施 例的影響力確定模塊206包括:
[0081] 公共因子權(quán)重確定單元4062,用于根據(jù)每個公共因子在所有公共因子中的方差貢 獻(xiàn)度占比確定每個公共因子對用戶品牌粘度的影響力的權(quán)重。
[0082]公共因子數(shù)量確定單元4064,用于根據(jù)各個公共因子在所有公共因子中的方差貢 獻(xiàn)度占比累計值滿足設(shè)定閾值時的數(shù)量確定公共因子的數(shù)量,其中,各個公共因子按照方 差貢獻(xiàn)度占比降序排列。
[0083]因子影響力確定單元4066,用于根據(jù)因子載荷矩陣的第j列數(shù)據(jù)分別與每個影響 因素輸入數(shù)據(jù)均值的乘積確定第j個公共因子對用戶品牌粘度的影響力,其中j表示1至m的 自然數(shù),m為公共因子的數(shù)量。
[0084] 在一些實(shí)施例中,第j個公共因子的方差貢獻(xiàn)度為因子載荷矩陣第j列數(shù)據(jù)的平方 和。
[0085] 可選的,數(shù)據(jù)挖掘裝置20還可以包括:標(biāo)準(zhǔn)化模塊210,用于根據(jù)用戶品牌粘度的 最大值和最小值對各個用戶品牌粘度進(jìn)行標(biāo)準(zhǔn)化處理。
[0086] 圖5為本發(fā)明數(shù)據(jù)挖掘裝置的一個實(shí)施例的結(jié)構(gòu)圖。如圖5所示,該實(shí)施例的裝置 500包括:存儲器50以及耦接至該存儲器510的處理器520,處理器520被配置為基于存儲在 存儲器510中的指令,執(zhí)行前述任意一個實(shí)施例中的數(shù)據(jù)挖掘方法。
[0087] 其中,存儲器510例如可以包括系統(tǒng)存儲器、固定非易失性存儲介質(zhì)等。系統(tǒng)存儲 器例如存儲有操作系統(tǒng)、應(yīng)用程序、引導(dǎo)裝載程序(Boot Loader)以及其他程序等。
[0088] 圖6為本發(fā)明數(shù)據(jù)挖掘裝置的又一個實(shí)施例的結(jié)構(gòu)圖。如圖6所示,該實(shí)施例的裝 置500包括:存儲器510以及處理器520,還可以包括輸入輸出接口 630、網(wǎng)絡(luò)接口 640、存儲接 口 650等。這些接口 630,640,650以及存儲器510和處理器520之間例如可以通過總線660連 接。其中,輸入輸出接口 630為顯示器、鼠標(biāo)、鍵盤、觸摸屏等輸入輸出設(shè)備提供連接接口。網(wǎng) 絡(luò)接口 640為各種聯(lián)網(wǎng)設(shè)備提供連接接口。存儲接口 650為SD卡、U盤等外置存儲設(shè)備提供連 接接口。
[0089] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計算機(jī)程序 產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí) 施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī) 可用非瞬時性存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實(shí)施的計算 機(jī)程序產(chǎn)品的形式。
[0090] 本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程 圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流 程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序 指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn) 生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí) 現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0091] 這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特 定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
[0092] 這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計 算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實(shí)現(xiàn)的處理,從而在計算機(jī)或 其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個流程或多個流程和/或方框圖一 個方框或多個方框中指定的功能的步驟。
[0093] 以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和 原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種數(shù)據(jù)挖掘方法,其特征在于,包括: 確定用戶品牌粘度的多項(xiàng)影響因素; 通過因子分析確定所述多項(xiàng)影響因素的因子載荷矩陣; 根據(jù)所述因子載荷矩陣以及所述多項(xiàng)影響因素確定每個公共因子對用戶品牌粘度的 影響力; 將各個公共因子對用戶品牌粘度的影響力進(jìn)行加權(quán)求和確定出用戶品牌粘度。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過因子分析確定所述多項(xiàng)影響因素 的因子載荷矩陣包括: 根據(jù)模型X=A*F以及X的輸入數(shù)據(jù),采用回歸方法確定出A;其中, X表示所述多項(xiàng)影響因素組成的P行1列的矩陣,P為所述多項(xiàng)影響因素的項(xiàng)數(shù); A表示p行m列的因子載荷矩陣,m為所述公共因子的數(shù)量; F表示公共因子組成的m行1列的矩陣。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,每個公共因子對用戶品牌粘度的影 響力的權(quán)重根據(jù)該公共因子在所有公共因子中的方差貢獻(xiàn)度占比確定。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,公共因子的數(shù)量根據(jù)各個公共因子 在所有公共因子中的方差貢獻(xiàn)度占比累計值滿足設(shè)定閾值時的數(shù)量確定,其中,各個公共 因子按照方差貢獻(xiàn)度占比降序排列。5. 根據(jù)權(quán)利要求3或4所述的方法,其特征在于,其中,第j個公共因子的方差貢獻(xiàn)度為 因子載荷矩陣第j列數(shù)據(jù)的平方和,其中j表示1至m的自然數(shù),m為所述公共因子的數(shù)量。6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述因子載荷矩陣以及所述多項(xiàng) 影響因素確定每個公共因子對用戶品牌粘度的影響力包括: 根據(jù)所述因子載荷矩陣的第j列數(shù)據(jù)分別與每個影響因素輸入數(shù)據(jù)均值的乘積確定第 j個公共因子對用戶品牌粘度的影響力,其中j表示1至m的自然數(shù),m為所述公共因子的數(shù) 量。7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 根據(jù)用戶品牌粘度的最大值和最小值對各個用戶品牌粘度進(jìn)行標(biāo)準(zhǔn)化處理。8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述用戶品牌粘度的影響因素包括用戶行 為類別因素和用戶情感類別因素中的至少一種; 所述用戶行為類別因素包括:購買品牌數(shù)量、累計購買次數(shù)、累計購買金額、重復(fù)購買 品牌數(shù)量、重復(fù)購買次數(shù)、重復(fù)購買金額、使用品牌時長、用戶從注冊至第一次購買的時長、 品牌迀移概率、優(yōu)惠訂單量、優(yōu)惠訂單金額、推薦品牌次數(shù)、推薦品牌銷量中的至少一種; 所述用戶情感類別因素包括:用戶好評率、用戶投訴率、用戶退貨率、用戶拒收率中的 至少一種。9. 一種數(shù)據(jù)挖掘裝置,其特征在于,包括: 影響因素確定模塊,用于確定用戶品牌粘度的多項(xiàng)影響因素; 因子分析模塊,用于通過因子分析確定所述多項(xiàng)影響因素的因子載荷矩陣; 因子影響力確定模塊,用于根據(jù)所述因子載荷矩陣以及所述多項(xiàng)影響因素確定每個公 共因子對用戶品牌粘度的影響力; 用戶品牌粘度確定模塊,用于將各個公共因子對用戶品牌粘度的影響力進(jìn)行加權(quán)求和 確定出用戶品牌粘度。10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述因子分析模塊包括: 數(shù)據(jù)輸入單元,用于輸入數(shù)據(jù)X; 回歸計算單元,用于根據(jù)模型X=A*F以及所述數(shù)據(jù)輸入單元輸入的數(shù)據(jù)X,通過回歸計 算確定A;其中, X表示所述多項(xiàng)影響因素組成的P行1列的矩陣,P為所述多項(xiàng)影響因素的項(xiàng)數(shù); A表示p行m列的因子載荷矩陣,m為所述公共因子的數(shù)量; F表示公共因子組成的m行1列的矩陣。11. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述因子影響力確定模塊包括: 公共因子權(quán)重確定單元,用于根據(jù)每個公共因子在所有公共因子中的方差貢獻(xiàn)度占比 確定每個公共因子對用戶品牌粘度的影響力的權(quán)重。12. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述因子影響力確定模塊還包括: 公共因子數(shù)量確定單元,用于根據(jù)各個公共因子在所有公共因子中的方差貢獻(xiàn)度占比 累計值滿足設(shè)定閾值時的數(shù)量確定公共因子的數(shù)量,其中,各個公共因子按照方差貢獻(xiàn)度 占比降序排列。13. 根據(jù)權(quán)利要求11或12所述的裝置,其特征在于,其中,第j個公共因子的方差貢獻(xiàn)度 為因子載荷矩陣第j列數(shù)據(jù)的平方和,其中j表示1至m的自然數(shù),m為所述公共因子的數(shù)量。14. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述因子影響力確定模塊還包括: 因子影響力確定單元,用于根據(jù)所述因子載荷矩陣的第j列數(shù)據(jù)分別與每個影響因素 輸入數(shù)據(jù)均值的乘積確定第j個公共因子對用戶品牌粘度的影響力,其中j表示1至m的自然 數(shù),m為所述公共因子的數(shù)量。15. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括: 標(biāo)準(zhǔn)化模塊,用于根據(jù)用戶品牌粘度的最大值和最小值對各個用戶品牌粘度進(jìn)行標(biāo)準(zhǔn) 化處理。16. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述用戶品牌粘度的影響因素包括用戶 行為類別因素和用戶情感類別因素中的至少一種;所述用戶行為類別因素包括:購買品牌 數(shù)量、累計購買次數(shù)、累計購買金額、重復(fù)購買品牌數(shù)量、重復(fù)購買次數(shù)、重復(fù)購買金額、使 用品牌時長、用戶從注冊至第一次購買的時長、品牌迀移概率、優(yōu)惠訂單量、優(yōu)惠訂單金額、 推薦品牌次數(shù)、推薦品牌銷量中的至少一種;所述用戶情感類別因素包括:用戶好評率、用 戶投訴率、用戶退貨率、用戶拒收率中的至少一種。17. -種數(shù)據(jù)挖掘裝置,其特征在于,包括: 存儲器;以及 耦接至所述存儲器的處理器,所述處理器被配置為基于存儲在所述存儲器中的指令, 執(zhí)行如權(quán)利要求1至8中任一項(xiàng)所述的數(shù)據(jù)挖掘方法。
【文檔編號】G06Q30/02GK106056404SQ201610347902
【公開日】2016年10月26日
【申請日】2016年5月24日
【發(fā)明人】劉朋飛, 王曉, 葛勝利, 李愛華
【申請人】北京京東尚科信息技術(shù)有限公司, 北京京東世紀(jì)貿(mào)易有限公司