用于特定人群的觀影指數(shù)評價(jià)系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種可獲取特定人群觀影評價(jià)指數(shù)的系統(tǒng),具體說是一種用于特定人群的觀影指數(shù)評價(jià)系統(tǒng)。通過網(wǎng)絡(luò)用戶的身份信息和屬性信息,篩選出目標(biāo)群體,在通過這些目標(biāo)群體做出的電影評論,經(jīng)加權(quán)計(jì)算獲得某一電影的用戶觀影指數(shù)??捎糜谥笇?dǎo)影片的制作、宣傳、發(fā)行等工作。
【專利說明】
用于特定人群的觀影指數(shù)評價(jià)系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及一種可獲取特定人群觀影評價(jià)指數(shù)的系統(tǒng),具體說是一種用于特定人群的觀影指數(shù)評價(jià)系統(tǒng)。
【背景技術(shù)】
[0002]近年來電影市場火爆異常,市場的火爆吸引大量資本進(jìn)入影視行業(yè),大家的注意也隨之而來。為此人們也更多的關(guān)注電影市場未來的發(fā)展,希望能夠迎合市場需要,在當(dāng)下或者未來分得一杯羹。為此就需要有針對性地搜集、整理各種不同群體的觀影數(shù)據(jù),以更加細(xì)致的數(shù)據(jù)分析為電影的創(chuàng)作和市場運(yùn)作提供導(dǎo)向意見。通過近兩年購票人群教育文化程度統(tǒng)計(jì)可以明顯的看出主力觀影人群是??票究萍耙陨蠈W(xué)歷人群。尤其是在校大學(xué)生對未來中國電影市場的發(fā)展和中國觀影群體習(xí)慣的養(yǎng)成具有重要的意義。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是為電影工作者提供一種用于特定人群的觀影指數(shù)評價(jià)系統(tǒng),使其可以指導(dǎo)影片的制作、宣傳、發(fā)行等工作。
[0004]本發(fā)明所述用于特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于包括:
系統(tǒng)數(shù)據(jù)庫,包括用于存儲用戶個(gè)人信息的用戶信息數(shù)據(jù)庫以及用于存儲用戶的屬性信息的用戶屬性信息數(shù)據(jù)庫,用戶信息數(shù)據(jù)庫與用戶屬性信息數(shù)據(jù)庫之間建立映射關(guān)系;非正常用戶的過濾器,用于從用戶屬性信息數(shù)據(jù)庫讀取用戶的屬性,提取其中符合特定群體屬性的數(shù)據(jù),同時(shí)從用戶信息數(shù)據(jù)庫提取與之對應(yīng)的用戶個(gè)人信息,得到特定群體的用戶個(gè)人信息庫;
數(shù)據(jù)抓取處理器,用于從電影網(wǎng)站以及電影社交媒體上抓取該特定群體的用戶個(gè)人信息庫中每一用戶對任何電影的歷史評論數(shù)據(jù),采用正態(tài)分布原則識別正常用戶和非正常用戶,將歷史評論數(shù)據(jù)符合正態(tài)分布原則的用戶識別為正常用戶,否則為非正常用戶,并將非正常用戶從特定群體的用戶個(gè)人信息庫中剔除;
用戶篩選處理器,從網(wǎng)絡(luò)資源中抓取特定群體的用戶個(gè)人信息庫中每一用戶的社交對象的屬性信息,選取其中符合特定群體屬性的社交對象并統(tǒng)計(jì)數(shù)量,當(dāng)統(tǒng)計(jì)的數(shù)量超過設(shè)定閾值的時(shí)候,將該用戶標(biāo)記為入選特定群體用戶,重復(fù)該步驟,直到特定群體的用戶個(gè)人信息庫中的全部用戶篩選完畢;然后從網(wǎng)絡(luò)資源中獲取入選特定群體用戶的活動(dòng)狀態(tài)信息,選擇其中活動(dòng)狀態(tài)符合活動(dòng)規(guī)律的用戶,將其標(biāo)注為特定群體的活躍用戶;對于特定群體的活躍用戶,用戶篩選處理器比對其用戶個(gè)人信息,對于符合一致性判斷標(biāo)準(zhǔn)的用戶,定義為重復(fù)賬號,將重復(fù)賬號對應(yīng)的多個(gè)特定群體的活躍用戶合并為一個(gè),直到全部特定群體的活躍用戶對應(yīng)的用戶屬性信息均符合單一性判斷標(biāo)準(zhǔn),并將這些特定群體的活躍用戶信息存入樣本用戶數(shù)據(jù)庫;
樣本用戶數(shù)據(jù)庫,用于存儲經(jīng)過用戶篩選處理器篩選獲得的符合單一性判斷標(biāo)準(zhǔn)的特定群體的活躍用戶信息; 電影評論信息處理器,用于獲取樣本用戶數(shù)據(jù)庫中每一特定群體的活躍用戶發(fā)布的電影評論信息,并將該電影評論信息的各種指標(biāo)量化,得到該用戶的量化信息表,并將全體特定群體的活躍用戶的量化信息表存入影評量化信息庫;
影評量化信息庫,用于存儲電影評論信息處理器獲得的全體特定群體的活躍用戶的量化信息表。
[0005]評價(jià)指標(biāo)生成器,從量化信息庫中提取活躍用戶的量化信息表制定該用戶的觀影特征模型,所述量化信息庫是符合特定觀影群體特征的一組人群以及與之相關(guān)的電影評論信息的集合;將該用戶的電影評論信息與觀影特征模型比對,利用加權(quán)算法得到該活躍用戶對電影的關(guān)注度數(shù)值,將量化信息庫中全部活躍用戶對同一部電影的關(guān)注度數(shù)值相加,得到特定觀影群體對該電影的關(guān)注度。
[0006]所述電影評論信息的各種指標(biāo)包括但不限于類型、演員、導(dǎo)演、國家、制式、日期,所謂指標(biāo)的量化是指將電影評論中有關(guān)上述指標(biāo)的信息判斷為匹配和不匹配兩種結(jié)果,并將每種結(jié)果給與特定的加權(quán)值。
[0007]所述電影評論信息至少包括類型、演員、導(dǎo)演、國家、制式、檔期幾個(gè)指標(biāo),所述加權(quán)算法是用如下公式獲得該特定群體的活躍用戶對電影的關(guān)注度,
A=(2(g+s+r+c+t+d)-(Gg+Ss+Rr+Cc+Tt+Dd))*X,
其中
A是該特定群體的活躍用戶對電影的關(guān)注度 G表示類型是否匹配,I代表匹配,O代表不匹配^代表權(quán)值 S表示演員是否匹配,I代表匹配,O代表不匹配,8代表權(quán)值 R表示導(dǎo)演是否匹配,I代表匹配,O代表不匹配,r代表權(quán)值 C表示國家是否匹配,I代表匹配,O代表不匹配,c代表權(quán)值 T表示格式是否匹配,I代表匹配,O代表不匹配4代表權(quán)值 D表示檔期是否匹配,I代表匹配,O代表不匹配,d代表權(quán)值 X代表電影評價(jià)的量化分值,正面評論為I,負(fù)面評論為-1,中性評論為O。
[0008]所述用戶的個(gè)人信息是用于識別用戶身份的信息或者代碼,包括用戶名、賬號、登錄地址、IP號、身份識別號碼、電話號碼、稅號、社會保險(xiǎn)號中的一種或多種;所述用戶的屬性信息是指用于區(qū)分用戶人群的特征信息,包括年齡、性別、職業(yè)、愛好、受教育程度、國籍、宗教信仰、黨派團(tuán)體、語種、血型、膚色中的一種或多種。
[0009]所述用戶對任何電影的歷史評論數(shù)據(jù)包括評價(jià)對象的名稱、評價(jià)對象的種類、評價(jià)內(nèi)容、做出評價(jià)的時(shí)間、評價(jià)內(nèi)容的字符數(shù)量、評價(jià)的次數(shù)。
[0010]所述用戶的活動(dòng)規(guī)律是指用戶上網(wǎng)時(shí)間段的分布規(guī)律,以及用戶做出評價(jià)的時(shí)間段的分布規(guī)律。
[0011]所述將其對應(yīng)的多個(gè)特定群體的活躍用戶合并為一個(gè)是指將多個(gè)個(gè)人信息合并后形成新的個(gè)人信息,同時(shí)將多個(gè)屬性信息合并后形成新的屬性信息;所述一致性判斷標(biāo)準(zhǔn)是指用戶個(gè)人信息中用戶名、賬號、登錄地址、IP號、身份識別號碼、電話號碼、稅號、社會保險(xiǎn)號中的一種或多種具有一致性或相關(guān)性。
[0012]由于采用上述技術(shù)方案,本發(fā)明通過網(wǎng)絡(luò)資源獲取大學(xué)生等特定觀影人群的影評數(shù)據(jù),并將該數(shù)據(jù)分析處理得到這一特定人群對影片的關(guān)注度的量化指標(biāo),用于指導(dǎo)影片的制作、宣傳、發(fā)行等工作。
【附圖說明】
[0013]圖1為本發(fā)明一個(gè)實(shí)施例的數(shù)據(jù)提取的流程框圖。
【具體實(shí)施方式】
[0014]如圖1所示,本發(fā)明所述用于特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于包括:
系統(tǒng)數(shù)據(jù)庫,包括用于存儲用戶個(gè)人信息的用戶信息數(shù)據(jù)庫I以及用于存儲用戶的屬性信息的用戶屬性信息數(shù)據(jù)庫2,用戶信息數(shù)據(jù)庫I與用戶屬性信息數(shù)據(jù)庫2之間建立映射關(guān)系;
所述用戶的個(gè)人信息是用于識別用戶身份的信息或者代碼,包括用戶名、賬號、登錄地址、IP號、身份識別號碼、電話號碼、稅號、社會保險(xiǎn)號中的一種或多種;所述用戶的屬性信息是指用于區(qū)分用戶人群的特征信息,包括年齡、性別、職業(yè)、愛好、受教育程度、國籍、宗教信仰、黨派團(tuán)體、語種、血型、膚色中的一種或多種。
[0015]非正常用戶的過濾器,用于從用戶屬性信息數(shù)據(jù)庫讀取用戶的屬性,提取其中符合特定群體屬性的數(shù)據(jù),同時(shí)從用戶信息數(shù)據(jù)庫提取與之對應(yīng)的用戶個(gè)人信息,得到特定群體的用戶個(gè)人信息庫3;
數(shù)據(jù)抓取處理器,用于從電影網(wǎng)站以及電影社交媒體上抓取該特定群體的用戶個(gè)人信息庫3中每一用戶對任何電影的歷史評論數(shù)據(jù)4,采用正態(tài)分布原則識別正常用戶和非正常用戶,將歷史評論數(shù)據(jù)符合正態(tài)分布原則的用戶識別為正常用戶,否則為非正常用戶5,并將非正常用戶從特定群體的用戶個(gè)人信息庫中剔除;正常用戶評論電影的信息會有以下特點(diǎn),對于影片的評分會呈正態(tài)分布趨勢,各種不同類型的評論相對分散,沒有過度集中的情況。僵尸賬號和水軍賬號為代表的非正常用戶發(fā)帖的目的是將影片炒火或者貶低,評分大都集中在高分區(qū)段和低分區(qū)段,中性評論很少。使用這樣的辦法可以過濾掉大部分僵尸和水軍賬號。
[0016]所述用戶對任何電影的歷史評論數(shù)據(jù)4包括評價(jià)對象的名稱、評價(jià)對象的種類、評價(jià)內(nèi)容、做出評價(jià)的時(shí)間、評價(jià)內(nèi)容的字符數(shù)量、評價(jià)的次數(shù)。
[0017]用戶篩選處理器,從網(wǎng)絡(luò)資源中抓取特定群體的用戶個(gè)人信息庫3中每一用戶的社交對象的屬性信息6,選取其中符合特定群體屬性的社交對象并統(tǒng)計(jì)數(shù)量,當(dāng)統(tǒng)計(jì)的數(shù)量超過設(shè)定閾值的時(shí)候,將該用戶標(biāo)記為入選特定群體用戶7,重復(fù)該步驟,直到特定群體的用戶個(gè)人信息庫3中的全部用戶篩選完畢;任何特定群體的社交對象通常都是以相同類型的用戶為主,比如一般大學(xué)生賬號會對同學(xué)、老師、學(xué)校等賬號進(jìn)行關(guān)注。通過這種方法可以進(jìn)一步確認(rèn)用戶的身份,剔除虛假賬號信息的干擾。然后從網(wǎng)絡(luò)資源中獲取入選特定群體用戶7的活動(dòng)狀態(tài)信息,選擇其中活動(dòng)狀態(tài)符合活動(dòng)規(guī)律的用戶,將其標(biāo)注為特定群體的活躍用戶8;所述用戶的活動(dòng)規(guī)律是指用戶上網(wǎng)時(shí)間段的分布規(guī)律,以及用戶做出評價(jià)的時(shí)間段的分布規(guī)律。特定群體往往具有相對固定的活動(dòng)規(guī)律,例如一般大學(xué)生用戶由于作息時(shí)間的限制,上網(wǎng)時(shí)段經(jīng)常出現(xiàn)在晚間或者休息日。馬甲、僵尸、水軍賬號則更多活動(dòng)在工作日的時(shí)間。
[0018]對于特定群體的活躍用戶,用戶篩選處理器比對其用戶個(gè)人信息,對于符合一致性判斷標(biāo)準(zhǔn)的用戶,定義為重復(fù)賬號,將重復(fù)賬號對應(yīng)的多個(gè)特定群體的活躍用戶合并為一個(gè),直到全部特定群體的活躍用戶對應(yīng)的用戶屬性信息均符合單一性判斷標(biāo)準(zhǔn),并將這些特定群體的活躍用戶信息存入樣本用戶數(shù)據(jù)庫;
所述將其對應(yīng)的多個(gè)特定群體的活躍用戶合并為一個(gè)是指將多個(gè)個(gè)人信息合并后形成新的個(gè)人信息,同時(shí)將多個(gè)屬性信息合并后形成新的屬性信息;所述一致性判斷標(biāo)準(zhǔn)是指用戶個(gè)人信息中用戶名、賬號、登錄地址、IP號、身份識別號碼、電話號碼、稅號、社會保險(xiǎn)號中的一種或多種具有一致性或相關(guān)性。
[0019]—般普通用戶只是一個(gè)賬號對應(yīng)一個(gè)手機(jī)號等個(gè)人信息,而多個(gè)賬號對應(yīng)一個(gè)手機(jī)號則很可能屬于馬甲賬號情況,只取其中較合理的一條用戶數(shù)據(jù)即可,重復(fù)數(shù)據(jù)則可以合并處理。
[0020]使用樣本用戶數(shù)據(jù)庫的信息替換用戶個(gè)人信息庫中的信息,并重復(fù)上述步驟,直到無法找到重復(fù)賬號;
樣本用戶數(shù)據(jù)庫,用于存儲經(jīng)過用戶篩選處理器篩選獲得的符合單一性判斷標(biāo)準(zhǔn)的特定群體的活躍用戶信息;
電影評論信息處理器,用于獲取樣本用戶數(shù)據(jù)庫中每一特定群體的活躍用戶發(fā)布的電影評論信息,并將該電影評論信息的各種指標(biāo)量化,得到該用戶的量化信息表,并將全體特定群體的活躍用戶的量化信息表存入影評量化信息庫9;
所述電影評論信息的各種指標(biāo)包括但不限于類型、演員、導(dǎo)演、國家、制式、日期,所謂指標(biāo)的量化是指將電影評論中有關(guān)上述指標(biāo)的信息判斷為匹配和不匹配兩種結(jié)果,并將每種結(jié)果給與特定的加權(quán)值。
[0021 ]影評量化信息庫,用于存儲電影評論信息處理器獲得的全體特定群體的活躍用戶的量化信息表。
[0022]評價(jià)指標(biāo)生成器,從量化信息庫9中提取活躍用戶的量化信息表制定該用戶的觀影特征模型,所述量化信息庫9是符合特定觀影群體特征的一組人群以及與之相關(guān)的電影評論信息的集合;將該用戶的電影評論信息與觀影特征模型比對,利用加權(quán)算法得到該活躍用戶對電影的關(guān)注度數(shù)值,將量化信息庫9中全部活躍用戶對同一部電影的關(guān)注度數(shù)值相加,得到特定觀影群體對該電影的關(guān)注度。
[0023]所述電影評論信息至少包括類型、演員、導(dǎo)演、國家、制式、檔期幾個(gè)指標(biāo),類型標(biāo)簽可以采用各種分類標(biāo)準(zhǔn)將電影分為2D電影、3D電影、武打片、言情片、歷史題材、音樂片、古裝片、動(dòng)畫片等,演員和導(dǎo)演標(biāo)簽分別是演員和導(dǎo)演的姓名,包括中文名和英文名;國家標(biāo)簽是電影制作的國家名稱;制式標(biāo)簽則是拍攝電影的數(shù)據(jù)格式,如寬熒幕、高清晰、HDTV、DTV、PAL制、NTSC制等等;檔期標(biāo)簽是電影上映的時(shí)間段。
[0024]所述電影評論信息至少包括類型、演員、導(dǎo)演、國家、制式、檔期幾個(gè)指標(biāo),所述加權(quán)算法是用如下公式獲得該特定群體的活躍用戶對電影的關(guān)注度,
A=(2(g+s+r+c+t+d)-(Gg+Ss+Rr+Cc+Tt+Dd))*X,
其中
A是該特定群體的活躍用戶對電影的關(guān)注度 G表示類型是否匹配,I代表匹配,O代表不匹配^代表權(quán)值 S表示演員是否匹配,I代表匹配,O代表不匹配,8代表權(quán)值 R表示導(dǎo)演是否匹配,I代表匹配,O代表不匹配,r代表權(quán)值 C表示國家是否匹配,I代表匹配,O代表不匹配,c代表權(quán)值 T表示格式是否匹配,I代表匹配,O代表不匹配4代表權(quán)值 D表示檔期是否匹配,I代表匹配,O代表不匹配,d代表權(quán)值
X代表電影評價(jià)的量化分值,正面評論為I,負(fù)面評論為-1,中性評論為O。當(dāng)然,也可以采用5分制或者其他量化的評價(jià)表達(dá)方式。
[0025]此公式的基本思路是,一部電影的一個(gè)瑋度基本屬于如果和用戶標(biāo)簽相匹配且評論屬于肯定,為影片關(guān)注度增加一倍權(quán)值的觀影指數(shù)數(shù)值。如果不僅匹配而是正面評論,則增加雙倍數(shù)值,如果評論屬于負(fù)面,匹配情況下減去一倍數(shù)值,不匹配情況下減去雙倍數(shù)值。
[0026]通過累加每一個(gè)電影的基礎(chǔ)量化數(shù)值及每一個(gè)用戶對于電影的數(shù)值最后計(jì)算出一部電影的特定觀影群體的觀影指數(shù)。
【主權(quán)項(xiàng)】
1.用于特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于包括: 系統(tǒng)數(shù)據(jù)庫,包括用于存儲用戶個(gè)人信息的用戶信息數(shù)據(jù)庫(I)以及用于存儲用戶的屬性信息的用戶屬性信息數(shù)據(jù)庫(2),用戶信息數(shù)據(jù)庫(I)與用戶屬性信息數(shù)據(jù)庫(2)之間建立映射關(guān)系; 非正常用戶的過濾器,用于從用戶屬性信息數(shù)據(jù)庫讀取用戶的屬性,提取其中符合特定群體屬性的數(shù)據(jù),同時(shí)從用戶信息數(shù)據(jù)庫提取與之對應(yīng)的用戶個(gè)人信息,得到特定群體的用戶個(gè)人信息庫(3); 數(shù)據(jù)抓取處理器,用于從電影網(wǎng)站以及電影社交媒體上抓取該特定群體的用戶個(gè)人信息庫(3)中每一用戶對任何電影的歷史評論數(shù)據(jù)(4),采用正態(tài)分布原則識別正常用戶和非正常用戶,將歷史評論數(shù)據(jù)符合正態(tài)分布原則的用戶識別為正常用戶,否則為非正常用戶(5),并將非正常用戶從特定群體的用戶個(gè)人信息庫中剔除; 用戶篩選處理器,從網(wǎng)絡(luò)資源中抓取特定群體的用戶個(gè)人信息庫(3)中每一用戶的社交對象的屬性信息(6),選取其中符合特定群體屬性的社交對象并統(tǒng)計(jì)數(shù)量,當(dāng)統(tǒng)計(jì)的數(shù)量超過設(shè)定閾值的時(shí)候,將該用戶標(biāo)記為入選特定群體用戶(7),重復(fù)該步驟,直到特定群體的用戶個(gè)人信息庫(3)中的全部用戶篩選完畢;然后從網(wǎng)絡(luò)資源中獲取入選特定群體用戶(7)的活動(dòng)狀態(tài)信息,選擇其中活動(dòng)狀態(tài)符合活動(dòng)規(guī)律的用戶,將其標(biāo)注為特定群體的活躍用戶(8);對于特定群體的活躍用戶,用戶篩選處理器比對其用戶個(gè)人信息,對于符合一致性判斷標(biāo)準(zhǔn)的用戶,定義為重復(fù)賬號,將重復(fù)賬號對應(yīng)的多個(gè)特定群體的活躍用戶合并為一個(gè),直到全部特定群體的活躍用戶對應(yīng)的用戶屬性信息均符合單一性判斷標(biāo)準(zhǔn),并將這些特定群體的活躍用戶信息存入樣本用戶數(shù)據(jù)庫; 樣本用戶數(shù)據(jù)庫,用于存儲經(jīng)過用戶篩選處理器篩選獲得的符合單一性判斷標(biāo)準(zhǔn)的特定群體的活躍用戶信息; 電影評論信息處理器,用于獲取樣本用戶數(shù)據(jù)庫中每一特定群體的活躍用戶發(fā)布的電影評論信息,并將該電影評論信息的各種指標(biāo)量化,得到該用戶的量化信息表,并將全體特定群體的活躍用戶的量化信息表存入影評量化信息庫(9); 影評量化信息庫,用于存儲電影評論信息處理器獲得的全體特定群體的活躍用戶的量化信息表。 評價(jià)指標(biāo)生成器,從量化信息庫(9)中提取活躍用戶的量化信息表制定該用戶的觀影特征模型,所述量化信息庫(9)是符合特定觀影群體特征的一組人群以及與之相關(guān)的電影評論信息的集合;將該用戶的電影評論信息與觀影特征模型比對,利用加權(quán)算法得到該活躍用戶對電影的關(guān)注度數(shù)值,將量化信息庫(9)中全部活躍用戶對同一部電影的關(guān)注度數(shù)值相加,得到特定觀影群體對該電影的關(guān)注度。2.根據(jù)權(quán)利要求1所述特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于:所述電影評論信息的各種指標(biāo)包括但不限于類型、演員、導(dǎo)演、國家、制式、日期,所謂指標(biāo)的量化是指將電影評論中有關(guān)上述指標(biāo)的信息判斷為匹配和不匹配兩種結(jié)果,并將每種結(jié)果給與特定的加權(quán)值。3.根據(jù)權(quán)利要求2所述用于特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于:所述電影評論信息至少包括類型、演員、導(dǎo)演、國家、制式、檔期幾個(gè)指標(biāo),所述加權(quán)算法是用如下公式獲得該特定群體的活躍用戶對電影的關(guān)注度, A=(2(g+s+r+c+t+d)-(Gg+Ss+Rr+Cc+Tt+Dd))*X, 其中 A是該特定群體的活躍用戶對電影的關(guān)注度 G表示類型是否匹配,I代表匹配,O代表不匹配^代表權(quán)值 S表示演員是否匹配,I代表匹配,O代表不匹配,8代表權(quán)值 R表示導(dǎo)演是否匹配,I代表匹配,O代表不匹配,r代表權(quán)值 C表示國家是否匹配,I代表匹配,O代表不匹配,c代表權(quán)值 T表示格式是否匹配,I代表匹配,O代表不匹配4代表權(quán)值 D表示檔期是否匹配,I代表匹配,O代表不匹配,d代表權(quán)值 X代表電影評價(jià)的量化分值,正面評論為I,負(fù)面評論為-1,中性評論為O。4.根據(jù)權(quán)利要求1或2所述特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于:所述用戶的個(gè)人信息是用于識別用戶身份的信息或者代碼,包括用戶名、賬號、登錄地址、IP號、身份識別號碼、電話號碼、稅號、社會保險(xiǎn)號中的一種或多種;所述用戶的屬性信息是指用于區(qū)分用戶人群的特征信息,包括年齡、性別、職業(yè)、愛好、受教育程度、國籍、宗教信仰、黨派團(tuán)體、語種、血型、膚色中的一種或多種。5.根據(jù)權(quán)利要求1或2所述特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于:所述用戶對任何電影的歷史評論數(shù)據(jù)(4)包括評價(jià)對象的名稱、評價(jià)對象的種類、評價(jià)內(nèi)容、做出評價(jià)的時(shí)間、評價(jià)內(nèi)容的字符數(shù)量、評價(jià)的次數(shù)。6.根據(jù)權(quán)利要求1或2所述特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于:所述用戶的活動(dòng)規(guī)律是指用戶上網(wǎng)時(shí)間段的分布規(guī)律,以及用戶做出評價(jià)的時(shí)間段的分布規(guī)律。7.根據(jù)權(quán)利要求1或2所特定人群的觀影指數(shù)評價(jià)系統(tǒng),其特征在于:所述將其對應(yīng)的多個(gè)特定群體的活躍用戶合并為一個(gè)是指將多個(gè)個(gè)人信息合并后形成新的個(gè)人信息,同時(shí)將多個(gè)屬性信息合并后形成新的屬性信息;所述一致性判斷標(biāo)準(zhǔn)是指用戶個(gè)人信息中用戶名、賬號、登錄地址、IP號、身份識別號碼、電話號碼、稅號、社會保險(xiǎn)號中的一種或多種具有一致性或相關(guān)性。
【文檔編號】G06F17/30GK106055657SQ201610386127
【公開日】2016年10月26日
【申請日】2016年6月3日
【發(fā)明人】莫倩, 賈承斌, 蔡錦森, 王果
【申請人】北京網(wǎng)智天元科技股份有限公司