亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別方法與系統(tǒng)的制作方法

文檔序號(hào):9671294閱讀:438來(lái)源:國(guó)知局
基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別方法與系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)?jiān)O(shè)及智能家居領(lǐng)域,尤其設(shè)及一種基于電視觀看日志挖掘的家庭成員結(jié)構(gòu) 識(shí)別方法與系統(tǒng)。
【背景技術(shù)】
[0002] 在當(dāng)今互聯(lián)網(wǎng)時(shí)代,通常一個(gè)個(gè)體身份對(duì)應(yīng)著一個(gè)賬號(hào),如網(wǎng)購(gòu)、銀行安全賬戶、 游戲等領(lǐng)域。但是在某些特殊的領(lǐng)域,一對(duì)一的賬號(hào)將極大地影響用戶的使用及體驗(yàn)效果, 比如一些用戶可能在一個(gè)網(wǎng)站上創(chuàng)建了多個(gè)不同的賬號(hào),也有幾個(gè)用戶共同分享使用同一 個(gè)賬號(hào)的情況。例如,對(duì)于智能家居產(chǎn)品的智能電視等產(chǎn)品,屬于典型的賬戶共享產(chǎn)品,一 個(gè)只能電視的使用家庭中的所有成員一般通過(guò)同一個(gè)賬號(hào)進(jìn)行操作,選擇自己喜歡的電視 節(jié)目,賬戶共享問(wèn)題在互聯(lián)網(wǎng)時(shí)代已經(jīng)遍布在我們的生活周?chē)?。而不同年齡段的家庭成員 往往會(huì)有不同的興趣愛(ài)好,喜歡不同的電視節(jié)目,由于多用戶混合使用一個(gè)賬號(hào),內(nèi)容服務(wù) 提供商無(wú)法依據(jù)賬號(hào)簡(jiǎn)單地評(píng)估用戶的興趣,也無(wú)法依據(jù)賬號(hào)信息推測(cè)用戶的行為習(xí)慣并 為其推薦更好的服務(wù)。
[0003]為解決上述問(wèn)題,有人提出采用用戶登錄時(shí)輸入賬號(hào)和密碼的輸入字符和輸入頻 率來(lái)對(duì)共享賬號(hào)的用戶進(jìn)行聚類(lèi)識(shí)別管理,其認(rèn)為每一個(gè)用戶的輸入字符是連續(xù)的,并且 其輸入頻率是不同于其他人的,因此每一個(gè)用戶的鍵盤(pán)敲擊行為會(huì)形成一個(gè)簇,不同的用 戶的鍵盤(pán)敲擊行為會(huì)形成不同的簇。因此某一個(gè)賬戶是否共享W及共享的子用戶的數(shù)量可 W通過(guò)產(chǎn)生的簇的個(gè)數(shù)來(lái)進(jìn)行大致估計(jì)。如果形成的簇的個(gè)數(shù)大于一個(gè),就可W判定該賬 戶是共享賬戶。但是對(duì)于智能電視運(yùn)種完全不需要使用用戶名和密碼登錄的智能家居設(shè) 備,通過(guò)識(shí)別輸入頻率的方法顯然并不合適。

【發(fā)明內(nèi)容】

[0004]本申請(qǐng)實(shí)施例提供一種基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別方法與系統(tǒng), 用W解決現(xiàn)有技術(shù)中智能電視無(wú)需賬號(hào)輸入而無(wú)法識(shí)別家庭成員及其喜好節(jié)目的問(wèn)題。
[0005]本申請(qǐng)實(shí)施例采用下述技術(shù)方案:
[0006] -種基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別方法,包括:
[0007]獲取用戶觀看電視節(jié)目的日志數(shù)據(jù),所述日志數(shù)據(jù)包括W下數(shù)據(jù)內(nèi)容:用戶操作 時(shí)間、節(jié)目類(lèi)型、節(jié)目類(lèi)型觀看時(shí)間;
[000引按時(shí)間段劃分所述日志數(shù)據(jù);
[0009]提取每段日志數(shù)據(jù)中的節(jié)目類(lèi)型、及該節(jié)目類(lèi)型觀看時(shí)間比例作為一個(gè)家庭成員 的特征;
[0010] 依據(jù)所述家庭成員特征進(jìn)行聚類(lèi);
[0011] 利用聚類(lèi)結(jié)果確定家庭中成員結(jié)構(gòu)的分布情況。
[0012] -種基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別系統(tǒng),包括:
[0013]獲取單元,用于獲取用戶觀看電視節(jié)目的日志數(shù)據(jù),所述日志數(shù)據(jù)包括W下數(shù)據(jù) 內(nèi)容:用戶操作時(shí)間、節(jié)目類(lèi)型、節(jié)目類(lèi)型觀看時(shí)間;
[0014] 分割單元,用于按時(shí)間段劃分所述日志數(shù)據(jù);
[0015] 提取單元,用于提取每段日志數(shù)據(jù)中的節(jié)目類(lèi)型、及該節(jié)目類(lèi)型觀看時(shí)間比例作 為一個(gè)家庭成員的特征;
[0016] 聚類(lèi)單元,用于依據(jù)所述家庭成員特征進(jìn)行聚類(lèi);
[0017] 識(shí)別單元,用于利用聚類(lèi)結(jié)果確定家庭中成員結(jié)構(gòu)的分布情況。
[0018] 本申請(qǐng)實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到W下有益效果:通過(guò)對(duì)一個(gè) 家庭中電視觀看日志數(shù)據(jù)的聚類(lèi)分析處理,識(shí)別該家庭成員之間各自喜好的節(jié)目類(lèi)型,W 此為內(nèi)容提供商提供推薦節(jié)目的依據(jù),解決了現(xiàn)有技術(shù)中無(wú)法通過(guò)唯一賬號(hào)、或賬號(hào)登陸 在智能電視運(yùn)一特殊領(lǐng)域分析用戶喜好的問(wèn)題。
【附圖說(shuō)明】
[0019] 此處所說(shuō)明的附圖用來(lái)提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申 請(qǐng)的示意性實(shí)施例及其說(shuō)明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
[0020] 圖1為本申請(qǐng)實(shí)施例一提供的基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別方法流 程圖;
[0021] 圖2為本申請(qǐng)實(shí)施例二提供的基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別系統(tǒng)示 意圖。
【具體實(shí)施方式】
[0022] 為使本申請(qǐng)的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本申請(qǐng)具體實(shí)施例及 相應(yīng)的附圖對(duì)本申請(qǐng)技術(shù)方案進(jìn)行清楚、完整地描述。顯然,所描述的實(shí)施例僅是本申請(qǐng)一 部分實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做 出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
[0023] W下結(jié)合附圖,詳細(xì)說(shuō)明本申請(qǐng)各實(shí)施例提供的技術(shù)方案。
[0024] 互聯(lián)網(wǎng)的快速發(fā)展,使電視運(yùn)一傳統(tǒng)行業(yè)不再局限于電視臺(tái)的播放內(nèi)容,隨著各 種電視盒的普及,電視作為智能家居的一部分已經(jīng)完全融入互聯(lián)網(wǎng),用戶可W隨意選擇觀 看自己喜好的節(jié)目?jī)?nèi)容,改變了電視臺(tái)播放什么用戶就看什么的傳統(tǒng)模式。
[0025] 實(shí)施例1
[0026] 圖1為本申請(qǐng)實(shí)施例1提供的基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別方法的 流程圖,主要是指通過(guò)對(duì)電視節(jié)目觀看日志的整理分析,識(shí)別出該家庭成員結(jié)構(gòu),并在具體 時(shí)間段內(nèi)給用戶推薦其喜好的節(jié)目?jī)?nèi)容。包括W下步驟:
[0027] SlOl:獲取用戶觀看電視節(jié)目的日志數(shù)據(jù)。
[0028] 本步驟所述觀看電視節(jié)目的日志數(shù)據(jù)是指家庭中用戶在一定時(shí)間內(nèi)觀看電視并 產(chǎn)生的記錄文件,通過(guò)一定的索引規(guī)則從智能電視內(nèi)容服務(wù)提供商的日志文件數(shù)據(jù)庫(kù)中獲 取,或者從電視盒等本地設(shè)備中日志文件數(shù)據(jù)庫(kù)中獲取,所述索引規(guī)則是標(biāo)識(shí)某一家庭地 址的關(guān)鍵檢索詞,如該家庭電視所處IP地址等。
[0029] 所述日志數(shù)據(jù)包括用戶操作時(shí)間、節(jié)目觀看時(shí)間、節(jié)目名稱(chēng)、節(jié)目類(lèi)別等內(nèi)容。一 個(gè)家庭中包括至少一個(gè)家庭成員。
[0030] S102:預(yù)處理所述日志數(shù)據(jù)。
[0031] 本步驟所述預(yù)處理是指保留日志數(shù)據(jù)中有關(guān)用戶操作時(shí)間、節(jié)目觀看時(shí)間、節(jié)目 名稱(chēng)、節(jié)目類(lèi)別的數(shù)據(jù)內(nèi)容,并刪除日志數(shù)據(jù)中其余不相關(guān)的數(shù)據(jù)內(nèi)容。同時(shí),刪除含有W 下情況的日志數(shù)據(jù):含有缺失項(xiàng)及錯(cuò)誤信息的日志數(shù)據(jù)。
[0032] 在其他實(shí)施例中,本步驟也可W省略,如,在步驟SlOl中獲得的日志數(shù)據(jù)已經(jīng)是符 合既定規(guī)則的數(shù)據(jù)時(shí),則本步驟省略。
[0033] S103:按時(shí)間段劃分所述日志數(shù)據(jù)。
[0034] 本步驟是指依據(jù)日志數(shù)據(jù)中有關(guān)用戶操作時(shí)間對(duì)用戶觀看電視節(jié)目的日志數(shù)據(jù) 進(jìn)行時(shí)間段劃分,具體是指依據(jù)用戶打開(kāi)、關(guān)閉電視操作的時(shí)間間隔對(duì)用戶觀看電視節(jié)目 的日志數(shù)據(jù)進(jìn)行時(shí)間段的劃分;將用戶打開(kāi)、關(guān)閉電視的該時(shí)間段內(nèi)用戶觀看電視節(jié)目的 日志數(shù)據(jù)作為家庭中某一個(gè)家庭成員的觀看日志數(shù)據(jù);不同打開(kāi)、關(guān)閉電視操作時(shí)間段內(nèi) 的日志數(shù)據(jù)作為不同家庭成員的觀看日志數(shù)據(jù),且不同時(shí)間段內(nèi)的日志數(shù)據(jù)沒(méi)有任何相關(guān) 性。如此,依據(jù)所述用戶操作時(shí)間將所述日志數(shù)據(jù)劃分成若干段不相互關(guān)聯(lián)的日志數(shù)據(jù),每 段日志數(shù)據(jù)代表一個(gè)家庭成員。
[0035] S104:提取每段日志數(shù)據(jù)中的節(jié)目類(lèi)型、及該節(jié)目類(lèi)型觀看時(shí)間比例作為一個(gè)家 庭成員的特征。
[0036] 具體地,依據(jù)每段日志數(shù)據(jù)中相同節(jié)目類(lèi)型的觀看時(shí)間相加匯總得到某一節(jié)目類(lèi) 型的觀看時(shí)間總和,將所述某一節(jié)目類(lèi)型的觀看時(shí)間總和除W該段日志數(shù)據(jù)的觀看時(shí)間總 和得到該日志數(shù)據(jù)時(shí)間段內(nèi)觀看此類(lèi)型節(jié)目的時(shí)間占比。將該日志數(shù)據(jù)時(shí)間段內(nèi)的節(jié)目類(lèi) 型及該節(jié)目類(lèi)型的觀看時(shí)間比例作為一個(gè)關(guān)鍵詞集合向量表示一個(gè)家庭成員的特征:
[0037] ti={(ei,ni),(e2,n2),...}
[0038] 其中,ei表示節(jié)目類(lèi)型,m是該節(jié)目類(lèi)型在日志數(shù)據(jù)時(shí)間段內(nèi)的的觀看時(shí)間比例。
[0039] S105:依據(jù)所述家庭成員特征進(jìn)行聚類(lèi)。
[0040] 利用詞頻-逆向文檔頻率(TF-IDF)公式計(jì)算出文檔中每個(gè)節(jié)目類(lèi)型的權(quán)重,從而 生成特征向量如下:
[0041] di= {(ei,wi,i), (e2,W2,i), . . .}
[0042] 其中,ei表示電視節(jié)目類(lèi)型,WiJ是電視節(jié)目類(lèi)型ei在文檔d沖對(duì)應(yīng)的權(quán)重。其中:
[0043] WiJ=TFiJ^IDFi
[0044] 其中,TFi,J表示節(jié)目類(lèi)型特征ei在文檔山中出現(xiàn)的頻率;IDFi是一個(gè)詞語(yǔ)普遍重要 性的度量。
[0046]其中,m,康示節(jié)目類(lèi)型特征ei在山中出現(xiàn)的頻數(shù)。
[004引其中,IDI表示節(jié)目類(lèi)型特征的文檔總數(shù);n(i)表示包含節(jié)目類(lèi)型特征ei的文檔數(shù) 目。
[0049]不同家庭成員
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1