亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

增強(qiáng)推薦系統(tǒng)和方法

文檔序號(hào):6629040閱讀:279來(lái)源:國(guó)知局
增強(qiáng)推薦系統(tǒng)和方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種增強(qiáng)推薦系統(tǒng)和方法。其中,該方法包括根據(jù)消費(fèi)者行為和消費(fèi)者模型發(fā)現(xiàn)消費(fèi)者特征,以及基于消費(fèi)者特征和項(xiàng)目信息生成初始推薦列表。該方法還包括從在線(xiàn)評(píng)論庫(kù)生成用于所述消費(fèi)者行為和消費(fèi)者模型的項(xiàng)目社會(huì)信譽(yù)(ISR),以及基于初始推薦列表和項(xiàng)目社會(huì)信譽(yù)生成最終推薦結(jié)果。
【專(zhuān)利說(shuō)明】增強(qiáng)推薦系統(tǒng)和方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,尤其涉及用于增強(qiáng)推薦系統(tǒng)和方法的技術(shù)。

【背景技術(shù)】
[0002] 推薦系統(tǒng)在今天的商業(yè)和娛樂(lè)行業(yè)中已經(jīng)相當(dāng)普遍。在推薦裝置的幫助下,消費(fèi) 者在搜索他/她想要的產(chǎn)品時(shí)花費(fèi)較少的時(shí)間。然而,從可用的多個(gè)選項(xiàng)中選擇一個(gè)的最 終決定有時(shí)是耗時(shí)的。基于在線(xiàn)購(gòu)物情景的考慮,影響消費(fèi)者在購(gòu)買(mǎi)他們的產(chǎn)品時(shí)的決定 在互聯(lián)網(wǎng)市場(chǎng)中甚至是更重要的,因?yàn)樗c轉(zhuǎn)化率直接相關(guān)聯(lián)。
[0003] 轉(zhuǎn)化率是指訪(fǎng)問(wèn)網(wǎng)站的、采取除偶然的內(nèi)容查看或網(wǎng)站訪(fǎng)問(wèn)之外的行動(dòng)的訪(fǎng)問(wèn)者 的比例。市場(chǎng)調(diào)研已經(jīng)表明,消費(fèi)者出于多個(gè)原因作出決定。知曉促成購(gòu)買(mǎi)決定的因素對(duì) 互聯(lián)網(wǎng)市場(chǎng)來(lái)說(shuō)是關(guān)鍵的。一般來(lái)說(shuō),當(dāng)消費(fèi)者在現(xiàn)實(shí)生活中購(gòu)買(mǎi)一項(xiàng)目時(shí),消費(fèi)者通常會(huì) 考慮產(chǎn)品的價(jià)格、外觀,以及使用該產(chǎn)品的其它體驗(yàn)。
[0004] 模仿人們?cè)诂F(xiàn)實(shí)生活中的購(gòu)買(mǎi)行為,在線(xiàn)購(gòu)物中的因素還來(lái)自元數(shù)據(jù)和評(píng)論。元 數(shù)據(jù)源自產(chǎn)品本身,如,價(jià)格、重量。評(píng)論源自用戶(hù)體驗(yàn),如〃包質(zhì)量很好",〃包作為禮物相 當(dāng)完美"。源自產(chǎn)品的元數(shù)據(jù)自然地用在在線(xiàn)購(gòu)物中,而由于自然語(yǔ)言理解中的技術(shù)困難, 不能容易地利用源自用戶(hù)體驗(yàn)的評(píng)論。
[0005] 圖1示出典型的推薦系統(tǒng)。如圖1所示,首先,消費(fèi)者行為可以被構(gòu)建為消費(fèi)者模 型,其產(chǎn)生消費(fèi)者特征。隨后,項(xiàng)目信息、候選項(xiàng)目和消費(fèi)者特征一起輸入項(xiàng)目推薦模塊,產(chǎn) 生初始推薦列表。在過(guò)濾和重排序之后,產(chǎn)生最終推薦結(jié)果。
[0006] 然而,在這種方法中,用戶(hù)對(duì)項(xiàng)目的反饋被稍微敷衍地處理。例如,在線(xiàn)零售商以 不同的方式使用評(píng)論:多個(gè)地點(diǎn)表示用戶(hù)對(duì)星形評(píng)級(jí)的情感。但這種方法明顯缺少為什么 給予產(chǎn)品該評(píng)級(jí)的因素。一些零售商采用針對(duì)項(xiàng)目的具體的預(yù)設(shè)的特定領(lǐng)域方面,比如包 的價(jià)格、配送、類(lèi)型和顏色。方面是以文本中的詞語(yǔ)的多項(xiàng)式分布表示主題的特定領(lǐng)域概 念,如,包評(píng)論中的〃拉鏈〃。主題是表示該文本的思想的詞語(yǔ)的多項(xiàng)式分布。然而這些方 面是靜態(tài)的,這意味著它不能自動(dòng)地檢測(cè)可以用來(lái)強(qiáng)調(diào)產(chǎn)品的特征的具體地的、有說(shuō)服力 的理由。
[0007] 而且,對(duì)一種方面被評(píng)級(jí)為高或低的理由不存在進(jìn)一步地的說(shuō)明。此外,其它零售 商從高評(píng)級(jí)推薦理由中選擇語(yǔ)句作為推薦理由,或者讓其他人對(duì)評(píng)論進(jìn)行投票。但新的消 費(fèi)者仍然不能獲得人們投票的那些理由的全貌。而且,明顯的是,在評(píng)論中出現(xiàn)普遍的理 由,如〃價(jià)格〃和〃服務(wù)",而一些特定原因是沒(méi)有價(jià)值的特征,如〃防水〃以及〃有風(fēng)天氣 耐用"。這些問(wèn)題,即文本摘要區(qū)域中的集中性和差異性,在這種情況中也需要處理。集中 性是指類(lèi)似于多個(gè)其他人的理由。差異性是指不同于其他人的理由。此外,將從評(píng)論中提 取的所有理由顯現(xiàn)給新的消費(fèi)者是不可行的。
[0008] 所公開(kāi)的方法和系統(tǒng)旨在解決上述的一個(gè)或多個(gè)問(wèn)題以及其它問(wèn)題。


【發(fā)明內(nèi)容】

[0009] 本發(fā)明的一個(gè)方面包括一種增強(qiáng)推薦方法。該方法包括根據(jù)消費(fèi)者行為和消費(fèi) 者模型發(fā)現(xiàn)消費(fèi)者特征,以及基于消費(fèi)者特征和項(xiàng)目信息生成初始推薦列表。該方法還 包括從在線(xiàn)評(píng)論庫(kù)生成用于所述消費(fèi)者行為和消費(fèi)者模型的項(xiàng)目社會(huì)信譽(yù)(Item Social Reputation-ISR),以及基于初始推薦列表和項(xiàng)目社會(huì)信譽(yù)生成最終推薦結(jié)果。
[0010] 本發(fā)明的另一個(gè)方面包括一種增強(qiáng)推薦系統(tǒng)。該增強(qiáng)推薦系統(tǒng)包括消費(fèi)者信息提 取模塊,用于根據(jù)消費(fèi)者行為和消費(fèi)者模型發(fā)現(xiàn)消費(fèi)者特征。該增強(qiáng)推薦系統(tǒng)還包括項(xiàng)目 推薦模塊,用于基于消費(fèi)者特征和項(xiàng)目信息生成初始推薦列表。該增強(qiáng)推薦系統(tǒng)還包括項(xiàng) 目社會(huì)信譽(yù)(ISR)模塊,用于從在線(xiàn)評(píng)論庫(kù)生成用于所述消費(fèi)者行為和消費(fèi)者模型的項(xiàng)目 社會(huì)信譽(yù)。該增強(qiáng)推薦系統(tǒng)還包括推薦生成模塊,用于基于初始推薦列表和項(xiàng)目社會(huì)信譽(yù) 生成最終推薦結(jié)果。
[0011] 本領(lǐng)域技術(shù)人員可根據(jù)本公開(kāi)內(nèi)容的描述,權(quán)利要求書(shū)和附圖來(lái)理解本發(fā)明公開(kāi) 的其它方面內(nèi)容。

【專(zhuān)利附圖】

【附圖說(shuō)明】
[0012] 圖1所示為示例性的當(dāng)前推薦系統(tǒng);
[0013] 圖2A所示為結(jié)合本發(fā)明實(shí)施例的示例性環(huán)境;
[0014] 圖2B所示為與所公開(kāi)的實(shí)施例一致的示例性計(jì)算系統(tǒng);
[0015] 圖3所示為與所公開(kāi)的實(shí)施例一致的示例性的項(xiàng)目社會(huì)信譽(yù)(ISR)增強(qiáng)推薦系 統(tǒng);
[0016] 圖4A所示為與所公開(kāi)的實(shí)施例一致的生成項(xiàng)目社會(huì)信譽(yù)(ISR)的示例性工作流 程;
[0017] 圖4B所示為與所公開(kāi)的實(shí)施例一致的示例性的項(xiàng)目社會(huì)信譽(yù)(ISR)的生成過(guò) 程;
[0018] 圖5所示為與所公開(kāi)的實(shí)施例一致的示例性的具有詞加權(quán)方法的方面和 情感聚集模塊(Aspect and Sentiment Aggregation Model with Term Weighting Schemes-ASAMTWS);
[0019] 圖6所示為與所公開(kāi)的實(shí)施例一致的用于平滑的隱含狄利克雷分布(Latent Dirichlet Allocation-LDA)的不例性圖模型表不法;
[0020] 圖7A和圖7B所示為與所公開(kāi)的實(shí)施例一致的示例性的高品質(zhì)方面排序差異性 (Diversity in Ranking High Quality Aspect-DRHQA)模型;
[0021] 圖8A所示為當(dāng)前推薦;
[0022] 圖8B所示為與所公開(kāi)的實(shí)施例一致的具有項(xiàng)目社會(huì)信譽(yù)(ISR)的增強(qiáng)推薦系統(tǒng) 中的示例性推薦;以及
[0023] 圖8C所示為與所公開(kāi)的實(shí)施例一致的具有項(xiàng)目社會(huì)信譽(yù)(ISR)的增強(qiáng)推薦系統(tǒng) 中的另一個(gè)示例性推薦。

【具體實(shí)施方式】
[0024] 通過(guò)本發(fā)明的實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明,這也將在附圖中進(jìn)行闡述。在任何 可能的情況下,相同的附圖標(biāo)記在整個(gè)附圖中用來(lái)指代相同或相似的部件。
[0025] 圖2A所示為結(jié)合本發(fā)明實(shí)施例的示例性環(huán)境200。如圖2A所示,環(huán)境200包括電 視機(jī)(TV)2102、遙控器2104、服務(wù)器2106、用戶(hù)2108和網(wǎng)絡(luò)2110。還可以包括其它裝置。
[0026] 電視機(jī)2102可以包括任意適當(dāng)類(lèi)型的電視機(jī),如等離子體電視機(jī),液晶電視機(jī), 投影電視機(jī),非智能電視機(jī),或智能電視機(jī)。電視機(jī)2102還可以包括其它計(jì)算系統(tǒng),如個(gè)人 計(jì)算機(jī)(PC),平板或便攜式電腦,或智能手機(jī)等。進(jìn)一步地,電視機(jī)2102可以是能夠在一個(gè) 或多個(gè)頻道中呈現(xiàn)多個(gè)節(jié)目的任意適當(dāng)?shù)膬?nèi)容呈現(xiàn)裝置,可以通過(guò)遙控器2104控制節(jié)目 的呈現(xiàn)。
[0027] 遙控器2104可包括任意適當(dāng)類(lèi)型的遙控器,其可通過(guò)與電視機(jī)2102的通信實(shí)現(xiàn) 對(duì)電視機(jī)2102的控制,例如定制的電視機(jī)遙控器、萬(wàn)能遙控器、平板電腦、智能手機(jī),或者 能夠執(zhí)行遠(yuǎn)程控制功能的任何其他計(jì)算設(shè)備。遙控器2104還可以包括其它類(lèi)型的設(shè)備,如 基于遙控控制的運(yùn)動(dòng)傳感器或深度相機(jī)增強(qiáng)式遙控器,以及簡(jiǎn)單的輸入/輸出裝置,如鍵 盤(pán)、鼠標(biāo)、聲控輸入設(shè)備等。
[0028] 進(jìn)一步地,服務(wù)器2106可以包括用于將個(gè)性化內(nèi)容提供給用戶(hù)2108的任意適當(dāng) 類(lèi)型的服務(wù)器計(jì)算機(jī)或多個(gè)服務(wù)器計(jì)算機(jī)。服務(wù)器2106還可促進(jìn)遙控器2104和電視機(jī) 2102之間的通信、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)處理。電視機(jī)2102、遙控器2104和服務(wù)器2106可以通 過(guò)一種或多種通信網(wǎng)絡(luò)2110,如電纜網(wǎng)絡(luò)、電話(huà)網(wǎng)絡(luò),和/或衛(wèi)星網(wǎng)絡(luò)等,彼此通信。
[0029] 用戶(hù)2108可以采用遙控器2104與電視機(jī)2102交互以觀看各種節(jié)目并進(jìn)行其它 感興趣的活動(dòng),或者如果電視機(jī)2102使用運(yùn)動(dòng)傳感器或深度相機(jī),則用戶(hù)可以簡(jiǎn)單地使用 手或身體姿勢(shì)控制電視機(jī)2102。用戶(hù)2108可以是單個(gè)用戶(hù)或多個(gè)用戶(hù),如正在一起觀看電 視機(jī)的家庭成員。
[0030] 電視機(jī)2102、遙控器2104和/或服務(wù)器2106可以在任意適當(dāng)?shù)挠?jì)算電路平臺(tái)上 實(shí)現(xiàn)。圖2B示出了能夠?qū)崿F(xiàn)電視機(jī)2102、遙控器2104和/或服務(wù)器2106的示例性計(jì)算系 統(tǒng)的框圖。
[0031] 如圖2B所示,該計(jì)算系統(tǒng)可以包括處理器202、存儲(chǔ)介質(zhì)204、顯示器206、通信模 塊208、數(shù)據(jù)庫(kù)214和外圍設(shè)備212。某些設(shè)備可被省略而其他一些設(shè)備也可以包括其中。
[0032] 處理器202可以包括任意適當(dāng)類(lèi)型的處理器或處理機(jī)。進(jìn)一步地,處理器202可 以包括用于多線(xiàn)程或并行處理的多個(gè)內(nèi)核。存儲(chǔ)介質(zhì)204可以包括內(nèi)存模塊,如ROM,RAM, 閃存模塊,以及大容量存儲(chǔ),如CD-ROM和硬盤(pán)等。存儲(chǔ)介質(zhì)204可以存儲(chǔ)計(jì)算機(jī)程序,用于 處理器202執(zhí)行計(jì)算機(jī)程序?qū)嵤└鞣N處理。
[0033] 進(jìn)一步地,外圍設(shè)備212可以包括各種傳感器和其它I/O裝置,如鍵盤(pán)和鼠標(biāo),通 信模塊208可以包括用于通過(guò)通信網(wǎng)絡(luò)建立連接的某些網(wǎng)絡(luò)接口設(shè)備。數(shù)據(jù)庫(kù)214可以包 括用于存儲(chǔ)數(shù)據(jù)的一個(gè)或多個(gè)數(shù)據(jù)庫(kù),并用于對(duì)所存儲(chǔ)的數(shù)據(jù)執(zhí)行特定操作,例如數(shù)據(jù)庫(kù) 搜索。
[0034] 電視機(jī)2102、遙控器2104和/或服務(wù)器2106可以執(zhí)行用于將個(gè)性化項(xiàng)目推薦給 用戶(hù)108的個(gè)性化項(xiàng)目推薦系統(tǒng)。圖3所示為由項(xiàng)目社會(huì)信譽(yù)(ISR)支持的示例性的增強(qiáng) 推薦系統(tǒng)。
[0035] 項(xiàng)目社會(huì)信譽(yù)(ISR)增強(qiáng)推薦系統(tǒng)可分析驅(qū)使之前的消費(fèi)者根據(jù)在線(xiàn)評(píng)論庫(kù)購(gòu) 買(mǎi)項(xiàng)目的理由。如圖3所示,增強(qiáng)推薦系統(tǒng)包括消費(fèi)者信息提取模塊302、項(xiàng)目信息304、推 薦生成模塊306、候選項(xiàng)目308、消費(fèi)者特征312、項(xiàng)目推薦模塊314、初始推薦列表316、在線(xiàn) 評(píng)論庫(kù)318、項(xiàng)目社會(huì)信譽(yù)(ISR)模塊320和最終推薦結(jié)果322。某些設(shè)備可被省略而其他 一些設(shè)備也可以包括其中。
[0036] 消費(fèi)者信息提取模塊302,用于從消費(fèi)者行為和消費(fèi)者模型發(fā)現(xiàn)消費(fèi)者特征。消費(fèi) 者信息提取模塊302還包括消費(fèi)者行為3022、消費(fèi)者模型3024和特征提取3026。消費(fèi)者 行為3022可以包括任何合適的信息,如交易歷史、瀏覽歷史、經(jīng)常訪(fǎng)問(wèn)的網(wǎng)站等。消費(fèi)者模 型3024可以包括任何合適的消費(fèi)者信息,如年齡、地域、教育水平等。
[0037] 項(xiàng)目信息304包括價(jià)格,外觀,服務(wù)和其它信息。例如,外觀信息可以包括類(lèi)型,顏 色,重量和尺寸。
[0038] 項(xiàng)目推薦模塊314,用于基于消費(fèi)者特征和項(xiàng)目信息特征發(fā)現(xiàn)項(xiàng)目并將推薦項(xiàng)目 輸出至初始推薦列表316。
[0039] 推薦生成模塊306還可以被分成三個(gè)子模塊:過(guò)濾和重排序子模塊3062,在線(xiàn)消 費(fèi)者交互子模塊3064,以及推薦說(shuō)明子模塊3066。在線(xiàn)消費(fèi)者交互子模塊3064可以通過(guò) 與消費(fèi)者的個(gè)人設(shè)備進(jìn)行通信、通過(guò)面部識(shí)別、和/或通過(guò)遙控器使用模式等檢測(cè)消費(fèi)者 行為?;趤?lái)自過(guò)濾和重排序子模塊3062的信息,推薦說(shuō)明子模塊3066可以產(chǎn)生最終推 薦結(jié)果。也就是說(shuō),一旦完成個(gè)性化檢測(cè)和說(shuō)明,推薦生成模塊306被用于處理項(xiàng)目選擇并 為用戶(hù)108生成最終推薦結(jié)果322。
[0040] 項(xiàng)目列表由過(guò)濾和重排序子模塊3062和在線(xiàn)消費(fèi)者交互子模塊3064修改和重排 序,沒(méi)有顯示驅(qū)使之前的用戶(hù)購(gòu)買(mǎi)一項(xiàng)目的因素可以用作新的消費(fèi)者作出購(gòu)買(mǎi)決定的有說(shuō) 服力的理由。所述理由是指具有高的方面品質(zhì)的肯定方面。方面品質(zhì)是指通過(guò)方面聚集的 靠前排序的詞語(yǔ)提供條理分明的和一致的含義的能力。如果項(xiàng)目具有可以由新的消費(fèi)者用 作參考的良好信譽(yù)是非常有幫助的。
[0041] 進(jìn)一步地,評(píng)論可以包括關(guān)于方面的不同情感。為了被選擇作為新的消費(fèi)者的購(gòu) 買(mǎi)原因,方面需要與情感價(jià)值配對(duì)。該系統(tǒng)將肯定方面作為理由推薦給新的消費(fèi)者以勸說(shuō) 新的消費(fèi)者做決定是合理的。換句話(huà)說(shuō),方面可能需要與情感關(guān)聯(lián)。
[0042] 項(xiàng)目社會(huì)信譽(yù)(ISR)模塊320,用于從消費(fèi)者對(duì)具體項(xiàng)目的評(píng)論中提取的肯定方 面中選擇的前K個(gè)最能反映項(xiàng)目描述的肯定方面。為了確保公平,評(píng)論是從所有相關(guān)網(wǎng)站 而不是從單個(gè)商店或單個(gè)網(wǎng)站收集的,并被存儲(chǔ)在在線(xiàn)評(píng)論庫(kù)318中。ISR的每個(gè)方面包含 具有與該方面接近的語(yǔ)義的詞列表。每個(gè)詞具有作為該方面的支撐的正面評(píng)論列表。項(xiàng)目 社會(huì)信譽(yù)(ISR)被提取以幫助為消費(fèi)者的喜好提供更好的匹配。而且,項(xiàng)目社會(huì)信譽(yù)(ISR) 可以被視為在最終推薦結(jié)果上添加的特征,為消費(fèi)者發(fā)現(xiàn)他們的喜好提供方便。因此,在提 高轉(zhuǎn)化率方面,該系統(tǒng)在支持消費(fèi)者實(shí)現(xiàn)他/她的目標(biāo)時(shí)實(shí)現(xiàn)期望的性能。
[0043]因此,在多個(gè)實(shí)施例中,提供具有內(nèi)置項(xiàng)目社會(huì)信譽(yù)學(xué)習(xí)機(jī)制的推薦系統(tǒng)。通過(guò)將 項(xiàng)目社會(huì)信譽(yù)(ISR)結(jié)合在本推薦系統(tǒng)中,可以增強(qiáng)消費(fèi)者的用戶(hù)體驗(yàn)。更重要的是,明確 地表示之前的消費(fèi)者的購(gòu)買(mǎi)原因來(lái)幫助當(dāng)前消費(fèi)者快速地發(fā)現(xiàn)他/她的目標(biāo),因此提高轉(zhuǎn) 化率。
[0044] 在操作中,項(xiàng)目社會(huì)信譽(yù)(ISR)增強(qiáng)推薦器可以進(jìn)行某些處理以將個(gè)性化項(xiàng)目推 薦給消費(fèi)者。首先,消費(fèi)者信息提取模塊302可以根據(jù)消費(fèi)者行為和消費(fèi)者模型發(fā)現(xiàn)消費(fèi) 者特征。項(xiàng)目社會(huì)信譽(yù)(ISR)模塊320可以根據(jù)在線(xiàn)評(píng)論庫(kù)生成項(xiàng)目社會(huì)信譽(yù)(ISR)。隨 后,基于消費(fèi)者和項(xiàng)目信息特征生成初始推薦列表。推薦生成模塊306調(diào)整生成的項(xiàng)目并 生成最終推薦結(jié)果。
[0045] 圖4A所示為與所公開(kāi)的實(shí)施例一致的生成項(xiàng)目社會(huì)信譽(yù)(ISR)的示例性工作流 程400。圖4B給出項(xiàng)目社會(huì)信譽(yù)(ISR)的生成過(guò)程的示例。圖4B的左側(cè)部分所示為生成 項(xiàng)目社會(huì)信譽(yù)(ISR)的工作流程400的輸入。它包括存儲(chǔ)在在線(xiàn)評(píng)論庫(kù)中的評(píng)論。圖4B 的右側(cè)部分所示為項(xiàng)目社會(huì)信譽(yù)(ISR)的示例。對(duì)于項(xiàng)目〃HOBO Lauren Clutch",它的項(xiàng) 目社會(huì)信譽(yù)(ISR)是容量和品質(zhì);而對(duì)于項(xiàng)目〃Buxton Heiress Ladies Cardex〃,它的項(xiàng) 目社會(huì)信譽(yù)(ISR)是價(jià)格、質(zhì)量和容量。詞〃容量〃,〃空間〃和〃信用卡〃是項(xiàng)目社會(huì)信 譽(yù)(ISR)中的"容量"方面的詞列表。"它容納用戶(hù)需要的所有東西"給出對(duì)容量的支持。 建立項(xiàng)目社會(huì)信譽(yù)(ISR)和將項(xiàng)目社會(huì)信譽(yù)(ISR)結(jié)合到當(dāng)前推薦系統(tǒng)中幫助影響消費(fèi)者 的購(gòu)買(mǎi)決定。
[0046] 如圖4A所示,首先,在線(xiàn)用戶(hù)評(píng)論可以從所有的相關(guān)網(wǎng)站而不是從單個(gè)商店或單 個(gè)網(wǎng)站被收集,并被存儲(chǔ)在在線(xiàn)評(píng)論庫(kù)318中。
[0047] 在預(yù)處理過(guò)程(S404)中根據(jù)先驗(yàn)知識(shí)生成詞塊和約束條件。在S404中,輸入是 存儲(chǔ)在在線(xiàn)評(píng)論庫(kù)318中的評(píng)論,輸出是詞塊和約束條件。詞塊是指表示細(xì)微區(qū)域的情感 和語(yǔ)義的一組詞語(yǔ)。例如,語(yǔ)句〃特別是關(guān)于扣環(huán),但它是如此地吸引人〃分別傳達(dá)兩種隱 含方面"價(jià)格"和"外觀"。隨后,該語(yǔ)句被分成兩個(gè)詞塊。因此,對(duì)于給定語(yǔ)句,如果不包 含過(guò)渡詞語(yǔ)和短語(yǔ),則該語(yǔ)句用作詞塊。否則,該語(yǔ)句可以由過(guò)渡詞語(yǔ)和短語(yǔ)斷開(kāi)。過(guò)渡詞 語(yǔ)和短語(yǔ)是指用于將詞語(yǔ)鏈接在一起的詞語(yǔ)和短語(yǔ)。如果必要,可以在每?jī)蓚€(gè)連續(xù)詞塊之 間添加 must-link或cannot-1 ink約束條件。
[0048] 評(píng)論是網(wǎng)站內(nèi)的非結(jié)構(gòu)化數(shù)據(jù),網(wǎng)絡(luò)爬行器用于從公共網(wǎng)站中抓取半結(jié)構(gòu)化評(píng) 論。每個(gè)詞語(yǔ)被標(biāo)注一詞類(lèi)(Part of Speech-POS)的值。預(yù)處理包括下述步驟:
[0049] 步驟1:斷開(kāi)語(yǔ)句。
[0050] 步驟2 :如果語(yǔ)句不包含任何限定的過(guò)渡詞語(yǔ)或短語(yǔ),則該語(yǔ)句用作詞塊;否則, 工作流程進(jìn)入步驟3。
[0051] 步驟3 :整個(gè)語(yǔ)句由過(guò)渡詞語(yǔ)或短語(yǔ)斷開(kāi)成兩個(gè)詞塊或兩個(gè)語(yǔ)句。如果任何語(yǔ)句 具有過(guò)渡詞語(yǔ),則工作流程進(jìn)入步驟2。
[0052] 重復(fù)步驟2和3,直到將原始語(yǔ)句分成多個(gè)詞塊,并且所有詞塊不包含任何過(guò)渡詞 語(yǔ)或短語(yǔ)。隨后,工作流程進(jìn)入步驟4。
[0053] 步驟4 :如果兩個(gè)連續(xù)詞塊之間存在過(guò)渡詞語(yǔ)或短語(yǔ),則添加 must-1 ink或 cannot-link ;如果過(guò)渡詞語(yǔ)或短語(yǔ)屬于相反、限制或矛盾類(lèi)別,則建立cannot-link ;否 貝1J,建立must-1 ink ;如果不存在可以建立的must-1 ink或cannot-1 ink,貝U在這兩個(gè)詞塊存 在 n〇-link〇
[0054] 進(jìn)一步地,在預(yù)處理完成之后,在線(xiàn)評(píng)論被視為至具有詞加權(quán)方法的方面和情感 聚集模塊(ASAMTWS)的輸入。
[0055] 假設(shè)p = {Pl,p,…,pj是源自〃包〃領(lǐng)域的一組產(chǎn)品。對(duì)于每個(gè)產(chǎn)Spi,存在一組 評(píng)論r = Ir1, r2,. . . rd}。對(duì)于每個(gè)評(píng)論!Ti,存在一組詞塊c = Ic1, c2,. . .,cj,和評(píng)論中的其 他人的投票信息的非負(fù)值。對(duì)于每對(duì)兩個(gè)連續(xù)詞塊,它具有包括三種可能條件{must-link, cannot-link, no-link}的約束條件。對(duì)于每個(gè)詞塊Ci,存在一組詞語(yǔ)W= {¥^¥2,···,《^}。
[0056] 從數(shù)據(jù)集構(gòu)建約束條件之后,可以從具有詞加權(quán)方法的方面和情感聚集模塊 (ASAMTWS)生成肯定方面(S408)。該方法的主要部分是如何在評(píng)論中找出不同方面以及不 同方面的評(píng)價(jià)是如何表達(dá)其情感的。先驗(yàn)知識(shí)被添加為約束條件以在理論上和實(shí)踐上實(shí)現(xiàn) 更好的結(jié)果。
[0057] 具有詞加權(quán)方法的方面和情感聚集模塊(ASAMTWS)展示了上述評(píng)論的生成過(guò)程: 消費(fèi)者依據(jù)情感分布,寫(xiě)下對(duì)于某個(gè)項(xiàng)目的評(píng)論,例如,60%滿(mǎn)意和40%不滿(mǎn)意。然后,他 /她寫(xiě)出各個(gè)方面所占的比例來(lái)顯示他對(duì)項(xiàng)目的理解,例如,20%服務(wù)、60%顏色和20%品 質(zhì)。隨后他/她決定寫(xiě)下表達(dá)他/她感覺(jué)到什么樣的情感的評(píng)論。如果評(píng)論對(duì)其他人是有 用的,則該評(píng)論獲得肯定投票。
[0058] 對(duì)于每對(duì)情感s和方面z,從狄利克雷分布(β s)中選擇Φ ts。對(duì)于每個(gè)評(píng)論r,從 狄利克雷分布(Y)中選擇情感分布對(duì)于每個(gè)情感s,在情感詞典的約束條件下,從狄 利克雷分布( α)中選擇方面分布Ls。對(duì)于每個(gè)詞塊,基于具有約束條件的其它詞塊從多 項(xiàng)式分布中選擇選擇情感j ;給定情感j,基于具有約束條件的其它詞塊從多項(xiàng)式分 布(θ")中選擇方面k;基于數(shù)據(jù)集中的詞頻和評(píng)論的投票信息從多項(xiàng)式分布(C^ ts)中生 成詞語(yǔ)W。
[0059] 圖5所示為與所公開(kāi)的實(shí)施例一致的示例性的具有詞加權(quán)方法的方面和情感聚 集模塊(ASAMTWS)。如圖5所示,在ASAMTWS的圖形表示中,節(jié)點(diǎn)是隨機(jī)變量,邊是依存關(guān) 系。圖模型是可重復(fù)的。僅帶陰影的節(jié)點(diǎn)是可觀測(cè)的。ASAMTWS中使用的符號(hào)呈現(xiàn)在表1 中。
[0060] 表1 :符號(hào)的含義
[0061]

【權(quán)利要求】
1. 一種增強(qiáng)推薦方法,包括下述步驟: 根據(jù)消費(fèi)者行為和消費(fèi)者模型發(fā)現(xiàn)消費(fèi)者特征; 基于消費(fèi)者特征和項(xiàng)目信息生成初始推薦列表; 從在線(xiàn)評(píng)論庫(kù)生成用于所述消費(fèi)者行為和消費(fèi)者模型的項(xiàng)目社會(huì)信譽(yù)(ISR);以及 基于初始推薦列表和項(xiàng)目社會(huì)信譽(yù)(ISR)生成最終推薦結(jié)果。
2. 根據(jù)權(quán)利要求1所述的方法,還進(jìn)一步包括: 向用戶(hù)顯示最終推薦結(jié)果,該最終推薦結(jié)果包含新的消費(fèi)者推薦信息,該新的消費(fèi)者 推薦信息包括項(xiàng)目推薦種類(lèi)、具有項(xiàng)目社會(huì)信譽(yù)(ISR)的推薦項(xiàng)目、和包括購(gòu)買(mǎi)理由的社 會(huì)評(píng)論。
3. 根據(jù)權(quán)利要求2所述的方法,其中從在線(xiàn)評(píng)論庫(kù)生成項(xiàng)目社會(huì)信譽(yù)(ISR)的步驟包 括: 預(yù)處理在線(xiàn)用戶(hù)評(píng)論; 生成肯定方面; 選擇前K個(gè)肯定方面;以及 輸出所述前K個(gè)方面作為項(xiàng)目社會(huì)信譽(yù)(ISR)。
4. 根據(jù)權(quán)利要求3所述的方法,其中預(yù)處理在線(xiàn)用戶(hù)評(píng)論的步驟還包括: 從多個(gè)相關(guān)網(wǎng)站收集在線(xiàn)用戶(hù)評(píng)論; 將在線(xiàn)用戶(hù)評(píng)論存儲(chǔ)在在線(xiàn)評(píng)論庫(kù)中;以及 生成在線(xiàn)用戶(hù)評(píng)論的詞塊和約束條件。
5. 根據(jù)權(quán)利要求4所述的方法,其中生成在線(xiàn)用戶(hù)評(píng)論的詞塊和約束條件的步驟還包 括: 斷開(kāi)語(yǔ)句,其中,當(dāng)該語(yǔ)句不包含任何限定的過(guò)渡詞語(yǔ)或短語(yǔ)時(shí),該語(yǔ)句用作詞塊,并 且當(dāng)該語(yǔ)句包含過(guò)渡詞語(yǔ)或短語(yǔ)時(shí),將該語(yǔ)句斷開(kāi)成兩個(gè)語(yǔ)句; 重復(fù)所述斷開(kāi),直到將該語(yǔ)句分成不包含任何過(guò)渡詞語(yǔ)或短語(yǔ)的多個(gè)詞塊;以及 基于在所述斷開(kāi)中使用的過(guò)渡詞語(yǔ)或短語(yǔ)生成約束條件。
6. 根據(jù)權(quán)利要求5所述的方法,其中基于在所述斷開(kāi)中使用的過(guò)渡詞語(yǔ)或短語(yǔ)生成約 束條件進(jìn)一步包括: 在兩個(gè)連續(xù)詞塊之間存在過(guò)渡詞語(yǔ)或短語(yǔ)時(shí),則添加 must-link或cannot-link ; 在過(guò)渡詞語(yǔ)或短語(yǔ)屬于相反、限制或矛盾類(lèi)別時(shí)建立所述cannot-link ;以及 在過(guò)渡詞語(yǔ)或短語(yǔ)不屬于相反、限制或矛盾類(lèi)別時(shí)建立所述must-link。
7. 根據(jù)權(quán)利要求3所述的方法,其中生成肯定方面的步驟進(jìn)一步地包括: 通過(guò)采用具有詞加權(quán)方法的方面和情感聚集模塊(ASAMTWS)算法生成肯定方面。
8. 根據(jù)權(quán)利要求3所述的方法,其中選擇前K個(gè)肯定方面的步驟進(jìn)一步包括: 通過(guò)采用高品質(zhì)方面排序差異性(DRHQA)模型選擇前K個(gè)肯定方面。
9. 根據(jù)權(quán)利要求7所述的方法,其特征在于: 假設(shè)P (Wi)是詞語(yǔ)組w = (W1, W2, ... wn}的情感分布;ε指示控制詞典的影響的轉(zhuǎn)儲(chǔ) 值;Si是詞塊i的情感;以及q(Sj = k)是來(lái)自鏈接的詞塊的情感的影響,則詞塊i的情感 j和方面k的重要性由下述等式限定:
10. 根據(jù)權(quán)利要求7所述的方法,其中: 詞加權(quán)是基于頻率和評(píng)論的品質(zhì);并且 對(duì)于被標(biāo)注的情感j和方面k的詞語(yǔ)w,它的詞加權(quán)由下述等式限定:
其中,S是情感的總數(shù)量;T是方面的總數(shù)量;W是詞語(yǔ)的總數(shù)量; 以及C=是被標(biāo)注的情感j和方面k的詞語(yǔ)的總數(shù)量。
11. 一種增強(qiáng)推薦系統(tǒng),包括: 消費(fèi)者信息提取模塊,用于根據(jù)消費(fèi)者行為和消費(fèi)者模型發(fā)現(xiàn)消費(fèi)者特征; 項(xiàng)目推薦模塊,用于基于消費(fèi)者特征和項(xiàng)目信息生成初始推薦列表; 項(xiàng)目社會(huì)信譽(yù)(ISR)模塊,用于從在線(xiàn)評(píng)論庫(kù)生成用于所述消費(fèi)者行為和消費(fèi)者模型 的項(xiàng)目社會(huì)信譽(yù);和 推薦生成模塊,用于基于初始推薦列表和項(xiàng)目社會(huì)信譽(yù)生成最終推薦結(jié)果。
12. 根據(jù)權(quán)利要求11所述的增強(qiáng)推薦系統(tǒng),其中推薦生成模塊進(jìn)一步用于: 向用戶(hù)顯示最終推薦結(jié)果,該最終推薦結(jié)果包含新的消費(fèi)者推薦信息,該新的消費(fèi)者 推薦信息包括項(xiàng)目推薦種類(lèi)、具有項(xiàng)目社會(huì)信譽(yù)(ISR)的推薦項(xiàng)目、和包括購(gòu)買(mǎi)理由的社 會(huì)評(píng)論。
13. 根據(jù)權(quán)利要求12所述的增強(qiáng)推薦系統(tǒng),其中項(xiàng)目社會(huì)信譽(yù)(ISR)模塊進(jìn)一步用 于: 預(yù)處理在線(xiàn)用戶(hù)評(píng)論; 生成肯定方面; 選擇前K個(gè)肯定方面;以及 輸出前K個(gè)肯定方面作為ISR。
14. 根據(jù)權(quán)利要求13所述的增強(qiáng)推薦系統(tǒng),其中,為了預(yù)處理在線(xiàn)用戶(hù)評(píng)論,項(xiàng)目社會(huì) 信譽(yù)(ISR)模塊進(jìn)一步用于: 從多個(gè)相關(guān)網(wǎng)站收集在線(xiàn)用戶(hù)評(píng)論; 將在線(xiàn)用戶(hù)評(píng)論存儲(chǔ)在在線(xiàn)評(píng)論庫(kù)中;以及 生成在線(xiàn)用戶(hù)評(píng)論的詞塊和約束條件。
15. 根據(jù)權(quán)利要求14所述的增強(qiáng)推薦系統(tǒng),其中為了生成在線(xiàn)用戶(hù)評(píng)論的所述詞塊和 約束條件,該項(xiàng)目社會(huì)信譽(yù)(ISR)模塊進(jìn)一步地用于: 斷開(kāi)語(yǔ)句,其中,當(dāng)該語(yǔ)句不包含任何限定的過(guò)渡詞語(yǔ)或短語(yǔ)時(shí),該語(yǔ)句用作詞塊,并 且當(dāng)該語(yǔ)句包含過(guò)渡詞語(yǔ)或短語(yǔ)時(shí),將該語(yǔ)句斷開(kāi)成兩個(gè)語(yǔ)句; 重復(fù)所述斷開(kāi),直到將該語(yǔ)句分成不包含任何過(guò)渡詞語(yǔ)或短語(yǔ)的多個(gè)詞塊;以及 基于在所述斷開(kāi)中使用的過(guò)渡詞語(yǔ)或短語(yǔ)生成約束條件。
16. 根據(jù)權(quán)利要求15所述的增強(qiáng)推薦系統(tǒng),其中為了基于在所述斷開(kāi)中使用的過(guò)渡詞 語(yǔ)或短語(yǔ)生成約束條件,項(xiàng)目社會(huì)信譽(yù)(ISR)模塊進(jìn)一步地用于: 在兩個(gè)連續(xù)詞塊之間存在過(guò)渡詞語(yǔ)或短語(yǔ)時(shí),則添加 must-link和cannot-link ; 在過(guò)渡詞語(yǔ)或短語(yǔ)屬于相反、限制或矛盾類(lèi)別時(shí)建立所述cannot-link ;以及 在過(guò)渡詞語(yǔ)或短語(yǔ)不屬于相反、限制或矛盾類(lèi)別時(shí)建立所述must-link。
17. 根據(jù)權(quán)利要求13所述的增強(qiáng)推薦系統(tǒng),其中為了生成肯定方面,該項(xiàng)目社會(huì)信譽(yù) (ISR)模塊進(jìn)一步地用于: 通過(guò)采用具有詞加權(quán)方法的方面和情感聚集模塊(ASAMTWS)算法生成肯定方面。
18. 根據(jù)權(quán)利要求13所述的增強(qiáng)推薦系統(tǒng),其中為了選擇前K個(gè)肯定方面,該項(xiàng)目社會(huì) 信譽(yù)(ISR)模塊進(jìn)一步地用于: 通過(guò)采用高品質(zhì)方面排序差異性(DRHQA)模型選擇前K個(gè)肯定方面。
19. 根據(jù)權(quán)利要求17所述的增強(qiáng)推薦系統(tǒng),其特征在于: 假設(shè)P (Wi)是詞語(yǔ)組w = (W1, W2, ... wn}的情感分布;ε指示控制詞典的影響的轉(zhuǎn)儲(chǔ) 值;Si是詞塊i的情感;以及q(Sj = k)是來(lái)自鏈接的詞塊的情感的影響,則詞塊i的情感 j和方面k的重要性由下述等式限定:
20. 根據(jù)權(quán)利要求17所述的增強(qiáng)推薦系統(tǒng),其中: 詞加權(quán)是基于頻率和評(píng)論的品質(zhì);并且 對(duì)于被標(biāo)注的情感j和方面k的詞語(yǔ)w,它的詞加權(quán)MjT由下述等式限定:
其中,S是情感的總數(shù)量;T是方面的總數(shù)量;W是詞語(yǔ)的總數(shù)量; 以及是被標(biāo)注的情感j和方面k的詞語(yǔ)的總數(shù)量。
【文檔編號(hào)】G06Q30/00GK104517216SQ201410514292
【公開(kāi)日】2015年4月15日 申請(qǐng)日期:2014年9月29日 優(yōu)先權(quán)日:2013年10月1日
【發(fā)明者】郭立帆, 汪灝泓 申請(qǐng)人:Tcl集團(tuán)股份有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1