一種個(gè)性化微博信息推薦系統(tǒng)和方法
【專利摘要】一種個(gè)性化微博信息推薦系統(tǒng)和方法,它涉及個(gè)性化信息推薦系統(tǒng)和方法,屬于社交媒體信息服務(wù)【技術(shù)領(lǐng)域】。本發(fā)明要解決現(xiàn)有微博平臺(tái)存在用戶獲取信息的質(zhì)量與效率低、信息的有效傳播速度較低的問(wèn)題。本發(fā)明中一種個(gè)性化微博信息推薦系統(tǒng),包括:微博特征抽取模塊、用戶興趣模型模塊、微博信息推薦模塊、微博信息展示模塊及數(shù)據(jù)模塊。本發(fā)明中一種個(gè)性化微博信息推薦方法,主要包括以下幾個(gè)步驟:a、用戶訪問(wèn)系統(tǒng)時(shí),獲取當(dāng)前實(shí)時(shí)的微博列表、用戶的偏好及相關(guān)設(shè)置信息;b、抽取當(dāng)前微博列表中每一條微博的統(tǒng)計(jì)、文本特征;c、按照微博信息推薦模塊所述技術(shù)對(duì)用戶獲取的微博進(jìn)行排序,將相關(guān)度大的微博優(yōu)先排序。本發(fā)明適用于互聯(lián)網(wǎng)交互與共享平臺(tái)。
【專利說(shuō)明】一種個(gè)性化微博信息推薦系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及個(gè)性化信息推薦系統(tǒng)和方法,屬于社交媒體信息服務(wù)【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]近年來(lái),社會(huì)媒體作為互聯(lián)網(wǎng)新興的交互與共享平臺(tái)發(fā)展迅速。大量用戶通過(guò)社會(huì)媒體進(jìn)行信息的消費(fèi)與共享。例如,社交網(wǎng)絡(luò)網(wǎng)站Facebook全球注冊(cè)用戶超過(guò)5億,新浪微博的注冊(cè)用戶超過(guò)2億。
[0003]微博平臺(tái)是最典型的社交媒體之一,如=Twitter和新浪微博。用戶可以同時(shí)關(guān)注微博平臺(tái)上的其他用戶來(lái)讀取其他用戶發(fā)布的信息。在微博平臺(tái),用戶允許發(fā)布長(zhǎng)度不超過(guò)140個(gè)字的短文本。由于微博文本短小,與手機(jī)、即時(shí)通信服務(wù)軟件的連接使得微博發(fā)布門(mén)檻很低,用戶可以隨時(shí)隨地進(jìn)行更新。用戶發(fā)布的信息包含多種主題,可能包括日?,嵤?、心情記錄、產(chǎn)業(yè)資訊等等?,F(xiàn)有的微博服務(wù),通常將用戶關(guān)注的人群發(fā)布的所有信息按照時(shí)間排序返回給用戶瀏覽。隨著關(guān)注人數(shù)的增多,用戶每天將接收到大量的微博信息,已經(jīng)超出用戶可以有效處理的限度,稱之為“信息過(guò)載”的問(wèn)題,即用戶瀏覽到的大量微博并非自己真正需要的、感興趣的,這將嚴(yán)重耗費(fèi)用戶的時(shí)間與精力。因此,十分有必要考慮用戶個(gè)性化因素,自動(dòng)識(shí)別不同用戶的興趣偏好,優(yōu)先呈現(xiàn)用戶最想看到的信息內(nèi)容,提高用戶獲取信息的質(zhì)量與效率,加快信息的有效傳播。
【發(fā)明內(nèi)容】
[0004]本發(fā)明要解決`現(xiàn)有微博平臺(tái)存在沒(méi)有很好地考慮微博信息受眾的興趣偏好差異,致使用戶獲取信息的質(zhì)量與效率低、信息的有效傳播速度較低的問(wèn)題,而提出一種個(gè)性化微博信息推薦系統(tǒng)和方法。
[0005]本發(fā)明中的一種個(gè)性化微博信息推薦系統(tǒng),包括:微博特征抽取模塊4、用戶興趣模型模塊2、微博信息推薦模塊5、微博信息展示模塊7和數(shù)據(jù)模塊,其中:數(shù)據(jù)模塊包括微博信息模塊3、用戶信息數(shù)據(jù)庫(kù)I和用戶瀏覽設(shè)置模塊6 ;
[0006]微博特征抽取模塊4:根據(jù)用戶歷史信息與行為,對(duì)微博進(jìn)行語(yǔ)義分析與建模,每一篇微博被表示為一個(gè)詞向量的形式,記為Vd,其中每一個(gè)詞具有一個(gè)權(quán)重,權(quán)重的計(jì)算公式為:
N
[0007]wcighl{\\\d) = //(ir,t/)log——
?//(Η’)
[0008]其中weight (w, d)表示微博d中詞w的權(quán)重,tf (w, d)表示詞w在微博d中出現(xiàn)的頻率,df (w)表示詞w出現(xiàn)在多少篇不同的微博中,N為微博的總數(shù),df (w)和N的值都基于不斷獲取的微博數(shù)據(jù)進(jìn)行統(tǒng)計(jì);
[0009]用戶興趣模型模塊2:計(jì)算、存儲(chǔ)能體現(xiàn)用戶興趣偏好的特征,并在預(yù)定時(shí)間內(nèi)根據(jù)用戶訪問(wèn)系統(tǒng)的行為更新相應(yīng)用戶的特征信息,用戶模型為一個(gè)具有權(quán)重的詞向量,記為Vu,其中每一個(gè)詞的權(quán)重按照如下公式進(jìn)行計(jì)算:
【權(quán)利要求】
1.一種個(gè)性化微博信息推薦系統(tǒng),其特征在于它包括:微博特征抽取模塊(4)、用戶興趣模型模塊(2)、微博信息推薦模塊(5)、微博信息展示模塊(7)和數(shù)據(jù)模塊,其中:數(shù)據(jù)模塊包括微博信息模塊(3)、用戶信息數(shù)據(jù)庫(kù)(I)和用戶瀏覽設(shè)置模塊(6); 微博特征抽取模塊(4):根據(jù)用戶歷史信息與行為,對(duì)微博進(jìn)行語(yǔ)義分析與建模,每一篇微博被表示為一個(gè)詞向量的形式,記為Vd,其中每一個(gè)詞具有一個(gè)權(quán)重,權(quán)重的計(jì)算公式為:
2.如權(quán)利要求1所述的一種個(gè)性化微博信息推薦系統(tǒng),其特征在于用戶信息數(shù)據(jù)庫(kù)(1),該模塊存儲(chǔ)用戶注冊(cè)系統(tǒng)時(shí)的靜態(tài)屬性;同時(shí),該模塊還存儲(chǔ)用戶使用微博服務(wù)后累積的文本及社交關(guān)系兩個(gè)維度的信息;此外,該模塊還負(fù)責(zé)存儲(chǔ)用戶使用推薦系統(tǒng)以來(lái)的網(wǎng)絡(luò)行為操作。
3.如權(quán)利要求1所述的一種個(gè)性化微博信息推薦系統(tǒng),其特征在于利用用戶瀏覽設(shè)置模塊(6),用戶可自主地選擇推薦算法,從而瀏覽到不同排序的微博內(nèi)容,當(dāng)用戶首次使用推薦系統(tǒng)時(shí),系統(tǒng)可設(shè)置一默認(rèn)選項(xiàng)。
4.一種個(gè)性化微博信息推薦方法,其特征在于它包括以下步驟: a、用戶登入推薦系統(tǒng)時(shí),獲取其關(guān)注者近期發(fā)布的所有微博信息,即實(shí)時(shí)微博列表,同時(shí)獲取用戶偏好信息; b、抽取實(shí)時(shí)微博列表中每條微博的特征; C、計(jì)算用戶偏好信息與實(shí)時(shí)微博列表中每一條微博的相關(guān)度,將相關(guān)度大的微博即用戶最有可能感興趣的微博優(yōu)先展示; d、用戶對(duì)微博進(jìn)行操作時(shí),服務(wù)器記錄其操作行為; e、用戶退出系統(tǒng)后,在預(yù)定時(shí)間內(nèi),更新用戶在文本、社交上的偏好,用于其下一次登入的微博信息推薦。
【文檔編號(hào)】G06F17/30GK103778260SQ201410074943
【公開(kāi)日】2014年5月7日 申請(qǐng)日期:2014年3月3日 優(yōu)先權(quán)日:2014年3月3日
【發(fā)明者】張宇, 宋巍, 劉挺 申請(qǐng)人:哈爾濱工業(yè)大學(xué)