存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或 非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(RCM)或閃存(flashRAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的 示例。
[0097]計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動(dòng)和非可移動(dòng)媒體可W由任何方法 或技術(shù)來(lái)實(shí)現(xiàn)信息存儲(chǔ)。信息可W是計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。 計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng) 態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類型的隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除 可編程只讀存儲(chǔ)器化EPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(CD-ROM)、 數(shù)字多功能光盤(DVD)或其他光學(xué)存儲(chǔ)、磁盒式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備 或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可W被計(jì)算設(shè)備訪問(wèn)的信息。按照本文中的界定,計(jì)算 機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號(hào)和載波。
[0098]還需要說(shuō)明的是,術(shù)語(yǔ)"包括"、"包含"或者其任何其他變體意在涵蓋非排他性的 包含,從而使得包括一系列要素的過(guò)程、方法、商品或者設(shè)備不僅包括那些要素,而且還包 括沒(méi)有明確列出的其他要素,或者是還包括為運(yùn)種過(guò)程、方法、商品或者設(shè)備所固有的要 素。在沒(méi)有更多限制的情況下,由語(yǔ)句"包括一個(gè)……"限定的要素,并不排除在包括所述要 素的過(guò)程、方法、商品或者設(shè)備中還存在另外的相同要素。
[0099]W上所述僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員 來(lái)說(shuō),本申請(qǐng)可W有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同 替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別方法,其特征在于,包括: 獲取用戶觀看電視節(jié)目的日志數(shù)據(jù),所述日志數(shù)據(jù)包括以下數(shù)據(jù)內(nèi)容:用戶操作時(shí)間、 節(jié)目類型、節(jié)目類型觀看時(shí)間; 按時(shí)間段劃分所述日志數(shù)據(jù); 提取每段日志數(shù)據(jù)中的節(jié)目類型、及該節(jié)目類型觀看時(shí)間比例作為一個(gè)家庭成員的特 征; 依據(jù)所述家庭成員特征進(jìn)行聚類; 利用聚類結(jié)果確定家庭中成員結(jié)構(gòu)的分布情況。2. 如權(quán)利要求1所述的方法,其特征在于,按時(shí)間段劃分所述日志數(shù)據(jù),包括: 依據(jù)所述日志數(shù)據(jù)中的用戶操作時(shí)間將所述日志數(shù)據(jù)劃分成若干段不相互關(guān)聯(lián)的日 志數(shù)據(jù),所述用戶操作時(shí)間是指用戶打開(kāi)、關(guān)閉電視操作的時(shí)間,每段日志數(shù)據(jù)為用戶打開(kāi) 電視到關(guān)閉電視時(shí)間段內(nèi)的日志數(shù)據(jù); 將每段日志數(shù)據(jù)表示為一個(gè)家庭成員。3. 如權(quán)利要求2所述的方法,其特征在于,提取每段日志數(shù)據(jù)中的節(jié)目類型、及該節(jié)目 類型觀看時(shí)間比例作為一個(gè)家庭成員的特征,包括: 依據(jù)每段日志數(shù)據(jù)中相同節(jié)目類型的觀看時(shí)間相加匯總得到某一節(jié)目類型的觀看時(shí) 間總和,將所述某一節(jié)目類型的觀看時(shí)間總和除以該段日志數(shù)據(jù)的觀看時(shí)間總和得到該日 志數(shù)據(jù)時(shí)間段內(nèi)觀看此類型節(jié)目的時(shí)間占比; 將該日志數(shù)據(jù)時(shí)間段內(nèi)的節(jié)目類型及該節(jié)目類型的觀看時(shí)間比例作為一個(gè)關(guān)鍵詞集 合向量表示一個(gè)家庭成員的特征: t1= {(ei,m),(e2,n2),...},其中,&表示節(jié)目類型,m是該節(jié)目類型在日志數(shù)據(jù)時(shí)間段 內(nèi)的的觀看時(shí)間比例。4. 如權(quán)利要求3所述的方法,其特征在于,依據(jù)所述家庭成員特征進(jìn)行聚類,包括: 利用詞頻-逆向文檔頻率(TF-IDF)公式計(jì)算出文檔中每個(gè)節(jié)目類型的權(quán)重,并生成特 征向量如下: di= {(ei,wi,i),(e2,W2,i),…},其中,ei表示電視節(jié)目類型,Wi,j是電視節(jié)目類型ei在文 檔dj中對(duì)應(yīng)的權(quán)重;其中: Wi, j = TFi, j*IDFi,其中,TFi, j表示節(jié)目類型特征ei在文檔山中出現(xiàn)的頻率;IDFi是一個(gè)詞 語(yǔ)普遍重要性的度量;其中,nu表示節(jié)目類型特征&在山中出現(xiàn)的頻 數(shù);其中,I D I表示節(jié)目類型特征的文檔總數(shù);n( i)表示包含節(jié)目類型特 征ei的文檔數(shù)目; 依據(jù)每個(gè)節(jié)目類型的權(quán)重特征向量通過(guò)余弦相似度計(jì)算出不同家庭成員之間的電視 節(jié)目觀看行為相似度:其中,Wij表示特征向量di與特征向量dj之間的余弦相似度。5. 如權(quán)利要求4所述的方法,其特征在于,利用聚類結(jié)果確定家庭中成員結(jié)構(gòu)的分布情 況,包括: 若聚類結(jié)果Wlj的簇個(gè)數(shù)大于1,則說(shuō)明該家庭中存在不同的電視節(jié)目觀看行為的家庭 成員,簇個(gè)數(shù)視為該家庭中具有不同電視節(jié)目類型觀看喜好的家庭成員數(shù); 若聚類結(jié)果Wlj的簇個(gè)數(shù)等于1,則說(shuō)明該家庭中只有一類家庭成員或只有一個(gè)家庭成 員,他們對(duì)于電視節(jié)目類型觀看喜好相似。6. -種基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別系統(tǒng),其特征在于,包括: 獲取單元,用于獲取用戶觀看電視節(jié)目的日志數(shù)據(jù),所述日志數(shù)據(jù)包括以下數(shù)據(jù)內(nèi)容: 用戶操作時(shí)間、節(jié)目類型、節(jié)目類型觀看時(shí)間; 分割單元,用于按時(shí)間段劃分所述日志數(shù)據(jù); 提取單元,用于提取每段日志數(shù)據(jù)中的節(jié)目類型、及該節(jié)目類型觀看時(shí)間比例作為一 個(gè)家庭成員的特征; 聚類單元,用于依據(jù)所述家庭成員特征進(jìn)行聚類; 識(shí)別單元,用于利用聚類結(jié)果確定家庭中成員結(jié)構(gòu)的分布情況。7. 如權(quán)利要求6所述的系統(tǒng),其特征在于,所述分割單元,用于按時(shí)間段劃分所述日志 數(shù)據(jù),包括: 依據(jù)所述日志數(shù)據(jù)中的用戶操作時(shí)間將所述日志數(shù)據(jù)劃分成若干段不相互關(guān)聯(lián)的日 志數(shù)據(jù),所述用戶操作時(shí)間是指用戶打開(kāi)、關(guān)閉電視操作的時(shí)間,每段日志數(shù)據(jù)為用戶打開(kāi) 電視到關(guān)閉電視時(shí)間段內(nèi)的日志數(shù)據(jù); 將每段日志數(shù)據(jù)表示為一個(gè)家庭成員。8. 如權(quán)利要求7所述的系統(tǒng),其特征在于,所述提取單元,用于提取每段日志數(shù)據(jù)中的 節(jié)目類型、及該節(jié)目類型觀看時(shí)間比例作為一個(gè)家庭成員的特征,包括: 依據(jù)每段日志數(shù)據(jù)中相同節(jié)目類型的觀看時(shí)間相加匯總得到某一節(jié)目類型的觀看時(shí) 間總和,將所述某一節(jié)目類型的觀看時(shí)間總和除以該段日志數(shù)據(jù)的觀看時(shí)間總和得到該日 志數(shù)據(jù)時(shí)間段內(nèi)觀看此類型節(jié)目的時(shí)間占比; 將該日志數(shù)據(jù)時(shí)間段內(nèi)的節(jié)目類型及該節(jié)目類型的觀看時(shí)間比例作為一個(gè)關(guān)鍵詞集 合向量表示一個(gè)家庭成員的特征: t1= {(ei,m),(e2,n2),...},其中,&表示節(jié)目類型,m是該節(jié)目類型在日志數(shù)據(jù)時(shí)間段 內(nèi)的的觀看時(shí)間比例。9. 如權(quán)利要求8所述的系統(tǒng),其特征在于,所述聚類單元,用于依據(jù)所述家庭成員特征 進(jìn)行聚類,包括: 利用詞頻-逆向文檔頻率(TF-IDF)公式計(jì)算出文檔中每個(gè)節(jié)目類型的權(quán)重,并生成特 征向量如下: di = {(ei,wi,i),(e2,W2,i),· · ·},其中,ei表示電視節(jié)目類型,Wi,j是電視節(jié)目類型ei在文 檔dj中對(duì)應(yīng)的權(quán)重;其中: Wi, j = TFi, j*IDFi,其中,TFi, j表示節(jié)目類型特征ei在文檔山中出現(xiàn)的頻率;IDFi是一個(gè)詞 語(yǔ)普遍重要性的度量;其中,mu表示節(jié)目類型特征&在山中出現(xiàn)的頻 數(shù);其中,|D|表示節(jié)目類型特征的文檔總數(shù);n(i)表示包含節(jié)目類型特 征ei的文檔數(shù)目; 依據(jù)每個(gè)節(jié)目類型的權(quán)重特征向量通過(guò)余弦相似度計(jì)算出不同家庭成員之間的電視 節(jié)目觀看行為相似度:其中,Wij表示特征向量di與特征向量dj之間的余弦相似度。10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述識(shí)別單元,用于利用聚類結(jié)果確定家庭 中成員結(jié)構(gòu)的分布情況,包括: 若聚類結(jié)果Wlj的簇個(gè)數(shù)大于1,則說(shuō)明該家庭中存在不同的電視節(jié)目觀看行為的家庭 成員,簇個(gè)數(shù)視為該家庭中具有不同電視節(jié)目類型觀看喜好的家庭成員數(shù); 若聚類結(jié)果Wlj的簇個(gè)數(shù)等于1,則說(shuō)明該家庭中只有一類家庭成員或只有一個(gè)家庭成 員,他們對(duì)于電視節(jié)目類型觀看喜好相似。
【專利摘要】本申請(qǐng)公開(kāi)了一種基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別方法,包括:獲取用戶觀看電視節(jié)目的日志數(shù)據(jù),所述日志數(shù)據(jù)包括以下數(shù)據(jù)內(nèi)容:用戶操作時(shí)間、節(jié)目類型、節(jié)目類型觀看時(shí)間;按時(shí)間段劃分所述日志數(shù)據(jù);提取每段日志數(shù)據(jù)中的節(jié)目類型、及該節(jié)目類型觀看時(shí)間比例作為一個(gè)家庭成員的特征;依據(jù)所述家庭成員特征進(jìn)行聚類;利用聚類結(jié)果確定家庭中成員結(jié)構(gòu)的分布情況,解決了現(xiàn)有技術(shù)中智能電視領(lǐng)域無(wú)法通過(guò)唯一賬號(hào)分析用戶喜好的問(wèn)題。本申請(qǐng)還公開(kāi)了一種基于電視觀看日志挖掘的家庭成員結(jié)構(gòu)識(shí)別系統(tǒng)。
【IPC分類】H04N21/466, H04N21/45
【公開(kāi)號(hào)】CN105430504
【申請(qǐng)?zhí)枴緾N201510852355
【發(fā)明人】付樂(lè)穎, 張涌, 寧立
【申請(qǐng)人】中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院
【公開(kāi)日】2016年3月23日
【申請(qǐng)日】2015年11月27日