一種在線評分方法及其系統(tǒng)的制作方法
【技術領域】
[0001 ]本發(fā)明設及數(shù)據(jù)挖掘領域,尤其設及一種在線評分方法及其系統(tǒng)。
【背景技術】
[0002] 在大數(shù)據(jù)時代如何從現(xiàn)有的大數(shù)據(jù)中提取有價值的信息,運對于數(shù)據(jù)極其豐富的 在線系統(tǒng)是非常至關重要的一個問題。在線系統(tǒng)允許大量的用戶進行交互,并提供成千上 萬的電影、書籍等等在線商品。但運也產(chǎn)生了很多不相關的在線商品,為了過濾掉運些不相 關的商品,推薦系統(tǒng)采取很了很多基于相關性的方法,例如協(xié)同過濾方法得到了廣大的應 用。除了對相關性的考慮之外,商品的質量對在線用戶也同樣重要,因此,很多在線的網(wǎng)站 例如Amazon和化tf Iix等引進了所謂的在線評分系統(tǒng)。
[0003] 在運些在線評分系統(tǒng)里,用戶可通過對商品設定的一個評分等級值來評估該商 品。在線評分系統(tǒng)能夠幫助用戶發(fā)現(xiàn)真正的高質量的商品。獲得評分數(shù)據(jù)后,我們需要采用 一些算法對運些商品進行排序。
[0004] 當前多數(shù)電商采用五星評分(例如1至5對應五種不同等級評分)作為主要評分標 準,但運種評分往往不能橫向的體現(xiàn)各商家的服務具體表現(xiàn),也無法具體體現(xiàn)消費者的真 實主觀感受。此外,由于網(wǎng)絡平臺的特殊性,一些商家更是應用網(wǎng)絡等技術通過非正常途徑 來提高自身的評分等級,欺騙消費者。因此,當前評分系統(tǒng)的可信度問題亟待解決。
[0005] 同時,在線信譽系統(tǒng)有一個長時間被忽視的關鍵問題,即大多數(shù)在線信譽系統(tǒng)中 的評分值都是離散并且線性分離的。例如,眾所周知的Amazon和化tflix網(wǎng)站采用的是五星 評分系統(tǒng),用戶通過設定1(最差)到5(最好)運五個整數(shù)來對商品進行評分。然而,用戶對商 品的評分在兩個連續(xù)值之間實際上可能是非線性的。例如五星評分系統(tǒng)中,評分值3和4之 間的差異可能并不等同于4和5之間的差異。基于運點的考慮,因此,亟需提出一種全新的評 分映射方法對評分等級值進行重新的定義,W提高排序算法的準確性。
【發(fā)明內(nèi)容】
[0006] 有鑒于此,本發(fā)明實施例的目的在于提供一種在線評分方法及其系統(tǒng),旨在解決 現(xiàn)有技術中的五星評分系統(tǒng)的準確度不高W及排序算法的準確性較低的問題。
[0007] 本發(fā)明實施例是運樣實現(xiàn)的,一種在線評分方法,包括:
[000引對用戶數(shù)據(jù)和商品數(shù)據(jù)進行預定義處理;
[0009] 輸入一組原始評分數(shù)據(jù);
[0010] 對所述原始評分數(shù)據(jù)進行轉換W形成一組新評分數(shù)據(jù);
[0011] 通過預設算法調整所述一組新評分數(shù)據(jù)中的所有數(shù)據(jù),并利用迭代方式直到達到 穩(wěn)態(tài);
[0012] 在所述穩(wěn)態(tài)下獲取所述所有數(shù)據(jù)的最佳值,并根據(jù)所述最佳值得出所述原始評分 數(shù)據(jù)的偏好設置。
[0013] 優(yōu)選的,所述對用戶數(shù)據(jù)和商品數(shù)據(jù)進行預定義處理的步驟具體包括:
[0014] 標記用戶數(shù)據(jù)W及標記商品數(shù)據(jù),其中,將用戶集標記為U,商品標記為0,用戶i對 商品a的評分標記為ria,用戶i選擇的商品集合標記為化,選擇商品a的用戶集合標記為Ua, 用戶i和商品a的度分別標記為ki和ka,用戶i的信譽和商品a的質量分別標記為Ri和Qa。
[0015] 優(yōu)選的,所述一組原始評分數(shù)據(jù)包括1、2、3、4W及5,分別用于代表用戶對商品評 價的好壞程度,其中,所述對所述原始評分數(shù)據(jù)進行轉換W形成一組新評分數(shù)據(jù)的步驟具 體包括:
[0016] 將評分2和4分別轉換成新評分R2和R4,其中,R2 = l+pi*2,R4 = 3+P2巧,第一參數(shù)Pi e (0,1),第二參數(shù)P2E (0,1),且調整Pi和P2的步長為0.0 l;
[0017]將1、R2、3、R4形成一組新評分數(shù)據(jù)。
[0018] 優(yōu)選的,所述通過預設算法調整所述一組新評分數(shù)據(jù)中的所有數(shù)據(jù),并利用迭代 方式直到達到穩(wěn)態(tài)的步驟包括:
[0019] 根據(jù)預設排序算法調整所述新評分R2和R4中的所述第一參數(shù)Pi和所述第二參數(shù) P2,并利用迭代方式直到達到穩(wěn)態(tài)。
[0020] 優(yōu)選的,所述在所述穩(wěn)態(tài)下獲取所述所有數(shù)據(jù)的最佳值,并根據(jù)所述最佳值得出 所述原始評分數(shù)據(jù)的偏好設置的步驟具體包括:
[0021 ]在所述穩(wěn)態(tài)下獲取所述第一參數(shù)Pi和所述第二參數(shù)P2的最佳值;
[0022] 根據(jù)所述第一參數(shù)Pi和所述第二參數(shù)P2的最佳值來判斷原始評分的偏高或者偏 低。
[0023] 另一方面,本發(fā)明還提供一種在線評分系統(tǒng),包括:
[0024] 預處理模塊,用于對用戶數(shù)據(jù)和商品數(shù)據(jù)進行預定義處理;
[0025] 數(shù)據(jù)輸入模塊,用于輸入一組原始評分數(shù)據(jù);
[0026] 數(shù)據(jù)轉換模塊,用于對所述原始評分數(shù)據(jù)進行轉換W形成一組新評分數(shù)據(jù);
[0027] 數(shù)據(jù)迭代模塊,用于通過預設算法調整所述一組新評分數(shù)據(jù)中的所有數(shù)據(jù),并利 用迭代方式直到達到穩(wěn)態(tài);
[0028] 偏好設置模塊,用于在所述穩(wěn)態(tài)下獲取所述所有數(shù)據(jù)的最佳值,并根據(jù)所述最佳 值得出所述原始評分數(shù)據(jù)的偏好設置。
[0029] 優(yōu)選的,所述預處理模塊具體用于標記用戶數(shù)據(jù)W及標記商品數(shù)據(jù),其中,將用戶 集標記為U,商品標記為0,用戶i對商品a的評分標記為ria,用戶i選擇的商品集合標記為化, 選擇商品a的用戶集合標記為Ua,用戶i和商品a的度分別標記為ki和ka,用戶i的信譽和商品 a的質量分別標記為Ri和Qa。
[0030] 優(yōu)選的,所述一組原始評分數(shù)據(jù)包括1、2、3、4W及5,分別用于代表用戶對商品評 價的好壞程度,其中,所述數(shù)據(jù)轉換模塊,具體用于將評分2和4分別轉換成新評分R2和R4,其 中,R2 = 1+P1巧,R4 = 3+P2巧,第一參數(shù)Pi e (0,1),第二參數(shù)P2 e (0,1),且調整Pi和P2的步長 為〇.〇1;從及將1、32、3、1?4形成一組新評分數(shù)據(jù)。
[0031] 優(yōu)選的,所述數(shù)據(jù)迭代模塊具體用于根據(jù)預設排序算法調整所述新評分R2和R4中 的所述第一參數(shù)Pl和所述第二參數(shù)P2,并利用迭代方式直到達到穩(wěn)態(tài)。
[0032] 優(yōu)選的,所述偏好設置模塊具體用于在所述穩(wěn)態(tài)下獲取所述第一參數(shù)Pi和所述第 二參數(shù)P2的最佳值,并根據(jù)所述第一參數(shù)Pl和所述第二參數(shù)P2的最佳值來判斷原始評分的 偏局或者偏低。
[0033] 在本發(fā)明實施例中,本發(fā)明提供的技術方案對于一個基于5星評分系統(tǒng)來說,評分 映射保留了 1,3,5評分,分別表示最差、中立和最好,并對評分2和4進行了重新的定義,將所 得的評分數(shù)據(jù)重新分配,將評分映射與當前自洽的各個排序算法相結合,從而更加精確的 表達商品的質量,進而極大地提高了五星評分系統(tǒng)的準確度W及提高了排序算法的準確 性。
【附圖說明】
[0034] 圖1為本發(fā)明一實施方式中在線評分方法流程圖;
[0035] 圖2為本發(fā)明一實施方式中在線評分系統(tǒng)結構示意圖。
【具體實施方式】
[0036] 為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,W下結合附圖及實施例,對 本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用W解釋本發(fā)明,并 不用于限定本發(fā)明。
[0037] 本發(fā)明【具體實施方式】提供了一種在線評分方法,主要包括如下步驟:
[0038] S11、對用戶數(shù)據(jù)和商品數(shù)據(jù)進行預定義處理;
[0039] S12、輸入一組原始評分數(shù)據(jù);
[0040] S13、對所述原始評分數(shù)據(jù)進行轉換W形成一組新評分數(shù)據(jù);
[0041] S14、通過預設算法調整所述一組新評分數(shù)據(jù)中的所有數(shù)據(jù),并利用迭代方式直到 達到穩(wěn)態(tài);
[0042] S15、在所述穩(wěn)態(tài)下獲取所述所有數(shù)據(jù)的最佳值,并根據(jù)所述最佳值得出所述原始 評分數(shù)據(jù)的偏好設置。
[0043] 本發(fā)明所提供的一種在線評分方法,提高了五星評分系統(tǒng)的準確度W及提高了排 序算法的準確性。
[0044] W下將對本發(fā)明所提供的一種在線評分方法進行詳細說明。
[0045] 請參閱圖1,為本發(fā)明一實施方式中在線評分方法流程圖。
[0046] 在步驟Sll中,對用戶數(shù)據(jù)和商品數(shù)據(jù)進行預定義處理。
[0047] 在本實施方式中,對用戶數(shù)據(jù)和商品數(shù)據(jù)進行預定義處理的步驟Sll具體包括: [004引標記用戶數(shù)據(jù)W及標記商品數(shù)據(jù),其中,將用戶集標記為U,商品標記為0,用戶i對 商品a的評分標記為ria,用戶i選擇的商品集合標記為化,選擇商品a的用戶集合標記為Ua, 用戶i和商品a的度分別標記為ki和ka,用戶i的信譽和商品a的質量分別標記為Ri和Qa。
[0049] 在步驟S12中,輸