亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種確定流媒體中內(nèi)容爆點的方法及裝置的制造方法

文檔序號:10661481閱讀:436來源:國知局
一種確定流媒體中內(nèi)容爆點的方法及裝置的制造方法
【專利摘要】本發(fā)明實施例公開了一種確定流媒體中內(nèi)容爆點的方法和裝置,包括:按照預設的規(guī)則將流媒體劃分多個時間段;針對每個時間段,對該時間段內(nèi)的彈幕進行分詞;統(tǒng)計每個分詞的詞頻,確定該時間段對應的彈幕主題詞;并確定該時間段對應的彈幕主題詞的出現(xiàn)頻率;根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)頻率,及保存的頻率均值,識別出現(xiàn)頻率大于所述頻率均值的時間段;在識別出的時間段中,根據(jù)對應的彈幕主題詞在該時間段內(nèi)每個時間點出現(xiàn)的頻率,將出現(xiàn)頻率最大值對應的時間點確定為內(nèi)容爆點。使用本發(fā)明實施例,能夠提高確定流媒體中內(nèi)容爆點的效率和準確性。
【專利說明】
一種確定流媒體中內(nèi)容爆點的方法及裝置
技術領域
[0001] 本發(fā)明涉及流媒體技術領域,尤其涉及一種確定流媒體中內(nèi)容爆點的方法及裝 置。
【背景技術】
[0002] 現(xiàn)有的流媒體中內(nèi)容爆點的確定如視頻看點等主要依賴人工來編輯打點確定,由 于編輯者對內(nèi)容的敏感度不同,設置的看點與大多數(shù)用戶的關注點可能存在誤差,不能正 確反映出用戶真實感興趣的話題;且單個流媒體的爆點一經(jīng)設定一般不會再持續(xù)進行更 新,當某些時效性的熱點話題發(fā)生變化時相應的爆點內(nèi)容不能有效的展示出來。
[0003] 可見,在現(xiàn)有技術中,這種依賴人工來編輯打點確定流媒體中內(nèi)容爆點的方法,效 率低,誤差大且更新不及時。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明實施例公開了 一種確定流媒體中內(nèi)容爆點的方法及裝置,以提高確定流媒 體中內(nèi)容爆點的效率,提高確定流媒體中內(nèi)容爆點的準確性。
[0005] 為達到上述目的,本發(fā)明實施例公開了一種確定流媒體中內(nèi)容爆點的方法,應用 于服務器,所述方法包括:
[0006] 按照預設的規(guī)則將流媒體劃分多個時間段;
[0007] 針對每個時間段,對該時間段內(nèi)的彈幕進行分詞;統(tǒng)計該時間段內(nèi)每個分詞的詞 頻,確定該時間段對應的彈幕主題詞;并確定該時間段對應的彈幕主題詞的出現(xiàn)次數(shù);
[0008] 根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識別彈幕主 題詞出現(xiàn)次數(shù)大于所述頻率均值的時間段;
[0009] 在識別出的時間段中,根據(jù)對應的彈幕主題詞在該時間段內(nèi)每個時間點出現(xiàn)的次 數(shù),將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。
[0010] 較佳地,所述按照預設的規(guī)則將流媒體劃分多個時間段之前,所述方法還包括:
[0011] 判斷用戶針對流媒體發(fā)送的彈幕數(shù)量是否大于預設的數(shù)量額定值,當所述彈幕數(shù) 量大于預設的數(shù)量額定值時,進行所述按照預設的規(guī)則將流媒體劃分多個時間段的步驟。
[0012] 較佳地,所述對該時間段內(nèi)的彈幕進行分詞之前,所述方法還包括:
[0013] 對該時間段內(nèi)的彈幕進行過濾。
[0014] 較佳地,所述對該時間段內(nèi)的彈幕進行過濾包括:
[0015] 判斷該時間段內(nèi)的每個彈幕與保存的無意義語句詞表中的內(nèi)容是否相同;
[0016] 如果相同,則過濾該彈幕。
[0017] 較佳地,所述對該時間段內(nèi)的彈幕進行分詞之前,所述方法還包括:
[0018] 針對每個時間段,判斷該時間段內(nèi)的彈幕數(shù)量是否大于設定的數(shù)量閾值,如果是, 則進行所述對該時間段內(nèi)的彈幕進行分詞的步驟。
[0019] 較佳地,所述將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點之后,所述方法還 包括:
[0020]將確定的每個內(nèi)容爆點保存在所述流媒體中,并針對每個內(nèi)容爆點保存該內(nèi)容爆 點對應的彈幕。
[0021 ]較佳地,所述方法還包括:
[0022] 將識別出的時間段對應的彈幕主題詞確定為該內(nèi)容爆點的爆點主題詞。
[0023] 為達到上述目的,本發(fā)明實施例還公開了一種確定流媒體中內(nèi)容爆點的裝置,應 用于服務器,所述裝置包括:
[0024] 劃分模塊,用于按照預設的規(guī)則將流媒體劃分多個時間段;
[0025] 處理模塊,用于針對每個時間段,對該時間段內(nèi)的彈幕進行分詞;統(tǒng)計每個時間段 內(nèi)每個分詞的詞頻,確定該時間段對應的彈幕主題詞;并確定該時間段對應的彈幕主題詞 的出現(xiàn)次數(shù);
[0026] 識別模塊,用于根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均 值,識別彈幕主題詞出現(xiàn)次數(shù)大于所述頻率均值的時間段;
[0027] 第一確定模塊,用于根據(jù)對應的彈幕主題詞在該時間段內(nèi)每個時間點出現(xiàn)的次 數(shù),將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。
[0028]較佳地,所述裝置還包括:
[0029] 第一判斷模塊,用于判斷用戶針對流媒體發(fā)送的彈幕數(shù)量是否大于預設的數(shù)量額 定值,當所述彈幕數(shù)量大于預設的數(shù)量額定值時,進行所述按照預設的規(guī)則將流媒體劃分 多個時間段的步驟。
[0030] 過濾模塊,用于在對每個時間段內(nèi)的彈幕進行分詞之前對該時間段內(nèi)的彈幕進行 過濾。
[0031] 較佳地,所述過濾模塊具體用于:
[0032] 判斷該時間段內(nèi)的每個彈幕與保存的無意義語句詞表中的內(nèi)容是否相同;
[0033]如果相同,則過濾該彈幕。
[0034]較佳地,所述裝置還包括:
[0035]第二判斷模塊,用于針對每個時間段,判斷該時間段內(nèi)的彈幕數(shù)量是否大于設定 的數(shù)量閾值,如果是,則進行所述對該時間段內(nèi)的彈幕進行分詞的步驟。
[0036] 保存模塊,用于將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點之后,將確定的 每個內(nèi)容爆點保存在所述流媒體中,并針對每個內(nèi)容爆點保存該內(nèi)容爆點對應的彈幕。
[0037] 第二確定模塊,用于將識別出的時間段對應的彈幕主題詞確定為該內(nèi)容爆點的爆 點主題詞。
[0038] 本發(fā)明實施例提供了一種確定流媒體中內(nèi)容爆點的方法和裝置,該方法中按照預 設的規(guī)則將流媒體劃分多個時間段;針對每個時間段,對該時間段內(nèi)的彈幕進行分詞;統(tǒng)計 每個時間段內(nèi)每個分詞的詞頻,確定該時間段對應的彈幕主題詞;并確定該時間段對應的 彈幕主題詞的出現(xiàn)次數(shù);根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均 值,識別彈幕主題詞出現(xiàn)次數(shù)大于所述頻率均值的時間段;在識別出的時間段中,根據(jù)對應 的彈幕主題詞在該時間段內(nèi)每個時間點出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最大值對應的時間點確定 為內(nèi)容爆點。本發(fā)明實施例是基于用戶彈幕內(nèi)容確定內(nèi)容爆點,這是因為用戶對感興趣的 內(nèi)容輸入的彈幕也會比較多,因此根據(jù)流媒體中每個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù),可 以準確的確定出用戶感興趣的內(nèi)容爆點,從而使確定出的內(nèi)容爆點更加準確,另外,由于本 發(fā)明實施例中該內(nèi)容爆點可以按照上述方式靈活確定,如果彈幕內(nèi)容發(fā)生了變化,也能夠 及時、準確的確定出變化后的內(nèi)容爆點。當然,實施本發(fā)明的任一產(chǎn)品或方法必不一定需要 同時達到以上所述的所有優(yōu)點。
【附圖說明】
[0039] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0040] 圖1為本發(fā)明實施例提供的一種確定流媒體中內(nèi)容爆點的方法流程示意圖;
[0041] 圖2為本發(fā)明實施例提供的另一種確定流媒體中內(nèi)容爆點的方法流程示意圖;
[0042] 圖3為本發(fā)明實施例提供的一種確定流媒體中內(nèi)容爆點的裝置結構示意圖。
【具體實施方式】
[0043]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0044] 本發(fā)明實施例公開了一種確定流媒體中內(nèi)容爆點的方法及裝置,下面進行詳細說 明。
[0045] 圖1為本發(fā)明實施例的確定流媒體中內(nèi)容爆點的方法流程示意圖,應用于服務器, 包括以下步驟:
[0046] 步驟S101:按照預設的規(guī)則將流媒體劃分多個時間段。
[0047] 劃分規(guī)則可以預先自行設定,可以是將流媒體均勻的劃分為多個時間段,或是將 流媒體不均勻的劃分為多個時間段,具體預設劃分規(guī)則如何設定,本發(fā)明實施例不作限定。 [0048]步驟S102:針對每個時間段,對該時間段內(nèi)的彈幕進行分詞;統(tǒng)計該時間段內(nèi)每個 分詞的詞頻,確定該時間段對應的彈幕主題詞;并確定該時間段對應的彈幕主題詞的出現(xiàn) 次數(shù)。
[0049] 彈幕為用戶在觀看流媒體內(nèi)容時針對流媒體發(fā)送的評論內(nèi)容,其能夠正確反映出 用戶真實感興趣的話題。
[0050] 不同的彈幕發(fā)送的時間可能會有所區(qū)別,但是每個彈幕都只會在流媒體上特定的 一個時間點出現(xiàn),因此在流媒體上相同時間點會出現(xiàn)一定數(shù)量的彈幕且出現(xiàn)的彈幕基本上 具有相同的主題。
[0051] 由于用戶發(fā)送的彈幕與流媒體是同步實時更新的,因此彈幕與流媒體有著時間上 的對應關系,即在流媒體上每個時間段內(nèi)會對應積累有一定數(shù)量的用戶針對流媒體發(fā)送的 彈蒂。
[0052]對流媒體上每個時間段內(nèi)的彈幕進行分詞,分詞技術屬于現(xiàn)有技術,本發(fā)明實施 例不贅述。
[0053]對彈幕進行分詞之后,統(tǒng)計每個時間段內(nèi)每個分詞的詞頻,每個分詞的詞頻即為 每個分詞出現(xiàn)的次數(shù),并將出現(xiàn)次數(shù)最多的分詞,即詞頻最大的分詞確定為該時間段對應 的彈幕主題詞,并將所述詞頻最大的分詞的次數(shù)確定為所述彈幕主題詞的次數(shù)。
[0054]步驟S103:根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識 別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率均值的時間段。
[0055] 具體地,保存的頻率均值可以為預先設定的值,或是通過預設的計算方法計算得 出來的數(shù)值。
[0056] 計算頻率均值的預設的計算方法可以為,根據(jù)統(tǒng)計的每個時間段對應的彈幕主題 詞的出現(xiàn)次數(shù),求出該流媒體上各彈幕主題詞的頻率中值,具體如下式所示。
[0057]頻率均值=(第一個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù)+第二個時間段內(nèi)彈幕主題 詞的出現(xiàn)次數(shù)+……+第N個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù))/(時間段的數(shù)量N)。
[0058] 當然,也可以采用其他計算方法計算頻率均值,具體采用何種計算方法計算頻率 均值,本發(fā)明實施例不作限定。
[0059] 根據(jù)預先設定的頻率中值或計算得出的頻率均值,判斷每個時間段內(nèi)的彈幕主題 詞的出現(xiàn)次數(shù)是否大于該頻率均值,若大于,則識別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率 均值的時間段。
[0060] 步驟S104:在識別出的時間段中,根據(jù)對應的彈幕主題詞在該時間段內(nèi)每個時間 點出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。
[0061 ]具體地,識別出的時間段為彈幕主題詞的出現(xiàn)次數(shù)大于保存的頻率均值的時間 段,針對識別出的時間段,確定該時間段內(nèi)的彈幕主題詞在每個時間點出現(xiàn)的次數(shù),并將該 時間段內(nèi)彈幕主題詞出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。
[0062] 為了便于用戶清楚的了解內(nèi)容爆點對應的主題內(nèi)容,將識別出的時間段對應的彈 幕主題詞確定為內(nèi)容爆點的爆點主題詞,這樣用戶就可以通過查看爆點主題詞清楚的了解 該內(nèi)容爆點對應的爆點話題是什么。
[0063] 本發(fā)明實施例是基于用戶主動生成的彈幕內(nèi)容確定內(nèi)容爆點,由于用戶對感興趣 的內(nèi)容輸入的彈幕也會比較多,因此根據(jù)流媒體中每個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù), 可以準確的確定出用戶感興趣的內(nèi)容爆點,從而使確定出的內(nèi)容爆點更加準確,另外,由于 本發(fā)明實施例中該內(nèi)容爆點可以按照上述方式靈活確定,如果彈幕內(nèi)容發(fā)生了變化,也能 夠及時、準確的確定出變化后的內(nèi)容爆點。
[0064] 為了提高確定流媒體內(nèi)容爆點的效率,在上述實施例的基礎上,在本發(fā)明的一個 實施例中,在對流媒體劃分多個時間段之前,該方法還包括:
[0065] 判斷用戶針對流媒體發(fā)送的彈幕數(shù)量是否大于預設的數(shù)量額定值,當所述彈幕數(shù) 量大于預設的數(shù)量額定值時,按照預設的規(guī)則將流媒體劃分多個時間段。
[0066] 具體地,預設的數(shù)量額定值為用戶根據(jù)實際情況自行設定的,其可以是很大的數(shù), 具體數(shù)值范圍本發(fā)明實施例不作限定,當用戶針對流媒體發(fā)送的彈幕數(shù)量小于預設的數(shù)量 額定值時,可以認為根據(jù)此時的彈幕數(shù)量確定出的內(nèi)容爆點可能不夠準確,因此在本發(fā)明 實施例中可以暫時不對其進行確定流媒體內(nèi)容爆點的工作。
[0067]應用本實施例,在確定流媒體的內(nèi)容爆點之前,根據(jù)用戶針對該流媒體發(fā)送的彈 幕數(shù)量先進行判斷,其彈幕數(shù)量是否達到預設的數(shù)量額定值,在不可能出現(xiàn)內(nèi)容爆點時,不 進行確定流媒體內(nèi)容爆點的計算工作,減少了計算工作量,提高了確定流媒體內(nèi)容爆點的 效率。
[0068]為了進一步提高確定流媒體內(nèi)容爆點的效率,在上述實施例的基礎上,在本發(fā)明 的另一個實施例中,在對每個時間段內(nèi)的彈幕進行分詞之前,該方法還包括:
[0069]針對每個時間段,獲取流媒體在該時間段內(nèi)對應的彈幕數(shù)量,判斷所述彈幕數(shù)量 是否大于預設的數(shù)量閾值,如果是,則對該時間段內(nèi)的彈幕進行分詞。
[0070] 具體地,流媒體在每個時間段內(nèi)的彈幕數(shù)量可能會起伏變化,例如在某電視劇結 尾時刻可能只有很少的彈幕,這種情況下可以認為不會出現(xiàn)內(nèi)容爆點,則可以不對該時間 段進行確定內(nèi)容爆點的工作,從而提高流媒體內(nèi)容爆點的確定效率。
[0071] 所述預設的數(shù)量閾值為用戶根據(jù)實際應用情況自行設定的,當該時間段內(nèi)的彈幕 數(shù)量大于預設的數(shù)量閾值時,對該時間段內(nèi)的彈幕進行分詞,當該時間段內(nèi)的彈幕數(shù)量小 于預設的數(shù)量閾值時,認為不會有內(nèi)容爆點,不進行分詞處理。
[0072]應用本實施例,只對彈幕數(shù)量大于預設的數(shù)量閾值的時間段內(nèi)的彈幕進行分詞處 理,對彈幕數(shù)量小于預設的數(shù)量閾值的時間段不予考慮,這樣就避免了對不可能出現(xiàn)內(nèi)容 爆點的時間段做分詞處理工作,減小了分詞工作量,進一步提高了確定流媒體內(nèi)容爆點的 效率。
[0073] 為了提高確定流媒體內(nèi)容爆點的準確性,在上述實施例的基礎上,在本發(fā)明的又 一個實施例中,在對每個時間段內(nèi)的彈幕進行分詞之前,該方法還包括:
[0074] 對每個時間段內(nèi)的彈幕進行過濾。
[0075] 具體地,對每個時間段內(nèi)的彈幕進行過濾包括:判斷該時間段內(nèi)的每個彈幕與保 存的無意義語句詞表中的內(nèi)容是否相同;如果相同,則過濾該彈幕。
[0076] 所述無意義語句詞表為保存在本地的表,無意義語句包括無意義的字、詞、短語以 及詆毀他人等低質量語句等。無意義語句詞表如表1所示,其內(nèi)容可以根據(jù)實際情況進行更 新。
[0077] 表 1
[0079] 應用本實施例,分析彈幕內(nèi)容時,過濾掉了無意義的不能準確反映用戶真實感興 趣的話題的彈幕,只對有效反映用戶真實感興趣的話題的彈幕進行分析,進一步提高了確 定流媒體內(nèi)容爆點的準確性。
[0080] 具體地,對彈幕的過濾工作可以在判斷每個時間段內(nèi)彈幕數(shù)量是否大于預設的數(shù) 量閾值之前,也可以在判斷每個時間段內(nèi)彈幕數(shù)量是否大于預設的數(shù)量閾值之后。
[0081] 為便于用戶查看與內(nèi)容爆點有關的彈幕內(nèi)容,在上述實施例的基礎上,在本發(fā)明 的再一個實施例中,該方法還包括:
[0082] 在確定內(nèi)容爆點后,將確定的每個內(nèi)容爆點保存在所述流媒體中,并針對每個內(nèi) 容爆點保存該內(nèi)容爆點對應的彈幕。
[0083] 應用本實施例,當用戶播放該流媒體時,可以點選內(nèi)容爆點,查看對應的彈幕,并 可以選擇是否播放該時間點對于的彈幕內(nèi)容,便于用戶更清楚的了解該內(nèi)容爆點對應的話 題內(nèi)容。
[0084] 下面以一個具體的實施例對本發(fā)明進行詳細描述,圖2為本發(fā)明實施例提供的另 一種確定流媒體中內(nèi)容爆點的方法流程示意圖,應用于服務器,包括以下步驟:
[0085] 步驟S201:判斷用戶針對流媒體發(fā)送的彈幕數(shù)量是否大于預設的數(shù)量額定值,當 所述彈幕數(shù)量大于預設的數(shù)量額定值時,則按照預設的規(guī)則將流媒體劃分多個時間段。 [0086]假設流媒體時長20秒,在這20秒內(nèi)的彈幕數(shù)量為800條,預設的數(shù)量額定值為500 條,用戶針對該流媒體發(fā)送的彈幕數(shù)量大于預設的數(shù)量額定值,則按照預設的規(guī)則將該流 媒體劃分多個時間段。
[0087]步驟S202:按照預設的規(guī)則將流媒體劃分多個時間段。
[0088] 假設預設規(guī)則為每5秒一個時間段,則可將流媒體劃分為4個時間段,1到5秒劃分 為第一時間段,5到10秒劃分為第二時間段,10到15秒劃分為第三時間段,15到20秒劃分為 第四時間段。
[0089] 步驟S203:針對每個時間段,對該時間段內(nèi)的彈幕進行過濾。
[0090] 劃分時間段之后,判斷這四個時間段內(nèi)的每個彈幕與保存的無意義語句詞表中的 內(nèi)容是否相同;如果相同,則過濾該彈幕。
[0091] 步驟S204:針對每個時間段,獲取該時間段內(nèi)對彈幕進行過濾后的彈幕數(shù)量,判斷 所述彈幕數(shù)量是否大于預設的數(shù)量閾值,若大于,則對該時間段內(nèi)的彈幕進行分詞。
[0092] 假設第一時間段內(nèi)過濾后的彈幕數(shù)量為50條,第二時間段內(nèi)過濾后的彈幕數(shù)量為 250條,第三時間段內(nèi)過濾后的彈幕數(shù)量為400條,第四時間段內(nèi)過濾后的彈幕數(shù)量為100 條,假設預設的數(shù)量閾值為200,則可以得出,第二時間段和第三時間段內(nèi)過濾后的彈幕數(shù) 量大于預設的數(shù)量閾值,對第二時間段和第三時間段內(nèi)的過濾后的彈幕進行分詞處理,而 第一時間段和第四時間段包含的彈幕數(shù)量較少,此時認為其不會出現(xiàn)內(nèi)容爆點,不進行分 詞處理。
[0093] 采用現(xiàn)有的分詞技術對彈幕進行分詞,本實施例不贅述分詞過程。
[0094] 步驟S205:統(tǒng)計每個時間段內(nèi)每個分詞的詞頻,確定該時間段對應的彈幕主題詞; 并確定該時間段對應的彈幕主題詞的出現(xiàn)次數(shù)。
[0095] 對第二時間段和第三時間段的彈幕進行分詞之后,統(tǒng)計這兩個時間段內(nèi)每個分詞 出現(xiàn)的詞頻,即統(tǒng)計這兩個時間段內(nèi)每個分詞出現(xiàn)的次數(shù),并確定出這兩個時間段內(nèi)出現(xiàn) 次數(shù)最多的分詞。
[0096] 假設第二時間段內(nèi)出現(xiàn)次數(shù)最多的分詞是第一分詞,出現(xiàn)次數(shù)為250次,第三時間 段內(nèi)出現(xiàn)次數(shù)最多分詞的是第二分詞,出現(xiàn)次數(shù)為500次,則確定第一分詞為其所對應的第 二時間段內(nèi)的彈幕主題詞,第二分詞為其所對應的第三時間段內(nèi)的彈幕主題詞,且第二時 間段內(nèi)的彈幕主題詞的出現(xiàn)次數(shù)為250次,第三時間段內(nèi)的主題詞的出現(xiàn)次數(shù)為500次。
[0097] 步驟S206:根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識 別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率均值的時間段。
[0098] 判斷第二時間段和第三時間段內(nèi)的彈幕主題詞的出現(xiàn)次數(shù)是否大于保存的頻率 均值,本實施例中保存的頻率均值為根據(jù)下式計算出的頻率中值:
[0099] 頻率均值=(第一個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù)+第二個時間段內(nèi)彈幕主題 詞的出現(xiàn)次數(shù)+……+第N個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù))/(時間段的數(shù)量N) = (250+ 500)/2 = 375
[0100] 則得出第三時間段內(nèi)的主題詞的出現(xiàn)次數(shù)大于頻率均值,則識別第三時間段,并 將第三時間段對應的彈幕主題詞確定為內(nèi)容爆點的爆點主題詞,即將第二分詞確定為爆點 主題詞。
[0101] 步驟S207:在識別出的時間段中,根據(jù)對應的彈幕主題詞在該時間段內(nèi)每個時間 點出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。
[0102] 在第三時間段內(nèi),統(tǒng)計彈幕主題詞在每個時間點的出現(xiàn)次數(shù),假設在第11秒處彈 幕主題詞出現(xiàn)40次,在第12秒處彈幕主題詞出現(xiàn)60次,在第13秒處彈幕主題詞出現(xiàn)300次, 在第14秒處彈幕主題詞出現(xiàn)70次,在第15秒處彈幕主題詞出現(xiàn)30次,在第13秒處彈幕主題 詞出現(xiàn)次數(shù)最多,則最后確定第三時間段內(nèi)的第13秒處為內(nèi)容爆點。
[0103] 步驟S208:將確定的內(nèi)容爆點保存在所述流媒體中。
[0104] 為便于用戶查詢內(nèi)容爆點的話題內(nèi)容,在將第三時間段內(nèi)的第13秒處確定為內(nèi)容 爆點后,將該時間點保存在所述流媒體中,并保存該時間點對應的300條彈幕主題詞,當用 戶使用應用該實施例的服務器時,可以點選內(nèi)容爆點查看爆點話題相關的彈幕,并尋找到 對應的時間點播放。
[0105] 應用本實施例,在對流媒體劃分多個時間段之前以及在對每個時間段內(nèi)的彈幕進 行分詞之前,添加了對彈幕數(shù)量進行判斷的步驟,減少了計算工作量,提高了確定流媒體內(nèi) 容爆點的效率;在對每個時間段內(nèi)的彈幕進行分詞之前,還對每個時間段內(nèi)的彈幕進行了 過濾,進一步提高了確定流媒體內(nèi)容爆點的準確性。
[0106] 本發(fā)明實施例還公開了一種確定流媒體中內(nèi)容爆點的裝置,圖3為本發(fā)明實施例 的一種確定流媒體中內(nèi)容爆點的裝置結構示意圖,應用于服務器,包括:
[0107] 劃分模塊301,用于按照預設的規(guī)則將流媒體劃分多個時間段。
[0108] 具體地,劃分規(guī)則可以預先自行設定,可以是將流媒體均勻的劃分為多個時間段, 或是將流媒體不均勻的劃分為多個時間段,具體預設劃分規(guī)則如何設定,本發(fā)明實施例不 作限定。
[0109] 處理模塊302,用于針對每個時間段,對該時間段內(nèi)的彈幕進行分詞;統(tǒng)計該時間 段內(nèi)每個分詞的詞頻,確定該時間段對應的彈幕主題詞;并確定該時間段對應的彈幕主題 詞的出現(xiàn)次數(shù)。
[0110] 彈幕為用戶在觀看流媒體內(nèi)容時針對流媒體發(fā)送的評論內(nèi)容,其能夠正確反映出 用戶真實感興趣的話題。
[0111] 不同的彈幕發(fā)送的時間可能會有所區(qū)別,但是每個彈幕都只會在流媒體上特定的 一個時間點出現(xiàn),因此在流媒體上相同時間點會出現(xiàn)一定數(shù)量的彈幕且出現(xiàn)的彈幕基本上 具有相同的主題。
[0112]由于用戶發(fā)送的彈幕與流媒體是同步實時更新的,因此彈幕與流媒體有著時間上 的對應關系,即在流媒體上每個時間段內(nèi)會對應積累有一定數(shù)量的用戶針對流媒體發(fā)送的 彈蒂。
[0113] 具體地,對流媒體上每個時間段內(nèi)的彈幕進行分詞,分詞技術屬于現(xiàn)有技術,本發(fā) 明實施例不贅述。
[0114] 對彈幕進行分詞之后,統(tǒng)計每個時間段內(nèi)每個分詞的詞頻,每個分詞的詞頻即為 每個分詞出現(xiàn)的次數(shù),并將出現(xiàn)次數(shù)最多的分詞,即詞頻最大的分詞確定為該時間段對應 的彈幕主題詞,并將所述分詞的次數(shù)確定為所述彈幕主題詞的次數(shù)。
[0115] 識別模塊303,用于根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率 均值,識別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率均值的時間段。
[0116] 具體地,保存的頻率均值可以為預先設定的值,或是通過預設的計算方法計算得 出來的數(shù)值。
[0117] 計算頻率均值的預設的計算方法可以為,根據(jù)統(tǒng)計的每個時間段對應的彈幕主題 詞的出現(xiàn)次數(shù),求出該流媒體上各彈幕主題詞的頻率中值,具體如下式所示。
[0118] 頻率均值=(第一個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù)+第二個時間段內(nèi)彈幕主題 詞的出現(xiàn)次數(shù)+……+第N個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù))/(時間段的數(shù)量N)。
[0119] 當然,也可以采用其他計算方法計算頻率均值,具體采用何種計算方法計算頻率 均值,本發(fā)明實施例不作限定。
[0120] 根據(jù)預先設定的頻率中值或計算得出的頻率均值,判斷每個時間段內(nèi)的彈幕主題 詞的出現(xiàn)次數(shù)是否大于該頻率均值,若大于,則識別彈幕主題詞的出現(xiàn)次數(shù)大于所述頻率 均值的時間段。
[0121] 第一確定模塊304,用于在識別出的時間段中,根據(jù)對應的彈幕主題詞在該時間段 內(nèi)每個時間點出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。
[0122] 具體地,識別出的時間段為彈幕主題詞的出現(xiàn)次數(shù)大于保存的頻率均值的時間 段,針對識別出的時間段,確定該時間段內(nèi)的彈幕主題詞在每個時間點出現(xiàn)的次數(shù),并將該 時間段內(nèi)彈幕主題詞出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。
[0123] 為了便于用戶清楚的了解內(nèi)容爆點對應的主題內(nèi)容,該裝置還包括第二確定模塊 (圖3中未示出),用于將識別出的時間段對應的彈幕主題詞確定為內(nèi)容爆點的爆點主題詞, 這樣用戶就可以通過查看爆點主題詞清楚的了解該內(nèi)容爆點對應的爆點話題是什么。
[0124] 本發(fā)明實施例是基于用戶主動生成的彈幕內(nèi)容確定內(nèi)容爆點,由于用戶對感興趣 的內(nèi)容輸入的彈幕也會比較多,因此根據(jù)流媒體中每個時間段內(nèi)彈幕主題詞的出現(xiàn)次數(shù), 可以準確的確定出用戶感興趣的內(nèi)容爆點,從而使確定出的內(nèi)容爆點更加準確,另外,由于 本發(fā)明實施例中該內(nèi)容爆點可以按照上述方式靈活確定,如果彈幕內(nèi)容發(fā)生了變化,也能 夠及時、準確的確定出變化后的內(nèi)容爆點。
[0125] 為了提高確定流媒體內(nèi)容爆點的效率,在上述實施例的基礎上,在本發(fā)明的一個 實施例中,在對流媒體劃分多個時間段之前,該裝置還包括:
[0126] 第一判斷模塊,用于判斷用戶針對流媒體發(fā)送的彈幕數(shù)量是否大于預設的數(shù)量額 定值,當所述彈幕數(shù)量大于預設的數(shù)量額定值時,按照預設的規(guī)則將流媒體劃分多個時間 段。
[0127] 具體地,預設的數(shù)量額定值為用戶根據(jù)實際情況自行設定的,其可以是很大的數(shù), 具體數(shù)值范圍本發(fā)明實施例不作限定,
[0128] 當用戶針對流媒體發(fā)送的彈幕數(shù)量小于預設的數(shù)量額定值時,可以認為根據(jù)此時 的彈幕數(shù)量確定出的內(nèi)容爆點可能不夠準確,因此在本發(fā)明實施例中可以暫時不對其進行 確定流媒體內(nèi)容爆點的工作。
[0129] 應用本實施例,在確定流媒體的內(nèi)容爆點之前,根據(jù)用戶針對該流媒體發(fā)送的彈 幕數(shù)量先進行判斷,其彈幕數(shù)量是否達到預設的數(shù)量額定值,在不可能出現(xiàn)內(nèi)容爆點時,不 進行確定流媒體內(nèi)容爆點的計算工作,減少了計算工作量,提高了確定流媒體內(nèi)容爆點的 效率。
[0130] 為了進一步提高確定流媒體內(nèi)容爆點的效率,在上述實施例的基礎上,在本發(fā)明 的另一個實施例中,在對每個時間段內(nèi)的彈幕進行分詞之前,該裝置還包括:
[0131] 第二判斷模塊,用于針對每個時間段,獲取流媒體在該時間段內(nèi)對應的彈幕數(shù)量, 判斷所述彈幕數(shù)量是否大于預設的數(shù)量閾值,如果是,則對該時間段內(nèi)的彈幕進行分詞。
[0132] 具體地,流媒體在每個時間段內(nèi)的彈幕數(shù)量可能會起伏變化,例如在某電視劇結 尾時刻可能只有很少的彈幕,這種情況下可以認為不會出現(xiàn)內(nèi)容爆點,則可以不對該時間 段進行確定內(nèi)容爆點的工作,從而提高流媒體內(nèi)容爆點的確定效率。
[0133] 所述預設的數(shù)量閾值為用戶根據(jù)實際應用情況自行設定的,當該時間段內(nèi)的彈幕 數(shù)量大于預設的數(shù)量閾值時,對該時間段內(nèi)的彈幕進行分詞,當該時間段內(nèi)的彈幕數(shù)量小 于預設的數(shù)量閾值時,認為不會有內(nèi)容爆點,不進行分詞處理。
[0134] 應用本實施例,只對彈幕數(shù)量大于預設的數(shù)量閾值的時間段內(nèi)的彈幕進行分詞處 理,對彈幕數(shù)量小于預設的數(shù)量閾值的時間段不予考慮,這樣就避免了對不可能出現(xiàn)內(nèi)容 爆點的時間段做分詞處理工作,減小了分詞工作量,進一步提高了確定流媒體內(nèi)容爆點的 效率。
[0135] 為了提高確定流媒體內(nèi)容爆點的準確性,在上述實施例的基礎上,在本發(fā)明的又 一個實施例中,在對每個時間段內(nèi)的彈幕進行分詞之前,該裝置還包括:
[0136] 過濾模塊,用于對每個時間段內(nèi)的彈幕進行過濾。
[0137] 具體地,對每個時間段內(nèi)的彈幕進行過濾包括:判斷該時間段內(nèi)的每個彈幕與保 存的無意義語句詞表中的內(nèi)容是否相同;如果相同,則過濾該彈幕。
[0138] 所述無意義語句詞表為保存在本地的表,無意義語句包括無意義的字、詞、短語以 及詆毀他人等低質量語句等。無意義語句詞表如表1所示,其內(nèi)容可以根據(jù)實際情況進行更 新。
[0139] 表1
[0141] 應用本實施例,分析彈幕內(nèi)容時,過濾掉了無意義的不能準確反映用戶真實感興 趣的話題的彈幕,只對有效反映用戶真實感興趣的話題的彈幕進行分析,進一步提高了確 定流媒體內(nèi)容爆點的準確性。
[0142] 具體地,對彈幕的過濾工作可以在判斷每個時間段內(nèi)彈幕數(shù)量是否大于預設的數(shù) 量閾值之前,也可以在判斷每個時間段內(nèi)彈幕數(shù)量是否大于預設的數(shù)量閾值之后。
[0143] 為便于用戶查看與內(nèi)容爆點有關的彈幕內(nèi)容,在上述實施例的基礎上,在本發(fā)明 的再一個實施例中,該裝置還包括:
[0144] 保存模塊,用于在確定內(nèi)容爆點后,將確定的每個內(nèi)容爆點保存在所述流媒體中, 并針對每個內(nèi)容爆點保存該內(nèi)容爆點對應的彈幕。
[0145] 應用本實施例,當用戶播放該流媒體時,可以點選內(nèi)容爆點,查看對應的彈幕,并 可以選擇是否播放該時間點對于的彈幕內(nèi)容,便于用戶更清楚的了解該內(nèi)容爆點對應的話 題內(nèi)容。
[0146] 對于裝置實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關 之處參見方法實施例的部分說明即可。
[0147] 需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實 體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存 在任何這種實際的關系或者順序。而且,術語"包括"、"包含"或者其任何其他變體意在涵蓋 非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要 素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備 所固有的要素。在沒有更多限制的情況下,由語句"包括一個……"限定的要素,并不排除在 包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
[0148] 本領域普通技術人員可以理解實現(xiàn)上述方法實施方式中的全部或部分步驟是可 以通過程序來指令相關的硬件來完成,所述的程序可以存儲于計算機可讀取存儲介質中, 這里所稱得的存儲介質,如:R0M/RAM、磁碟、光盤等。
[0149] 以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在 本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍 內(nèi)。
【主權項】
1. 一種確定流媒體中內(nèi)容爆點的方法,其特征在于,應用于服務器,所述方法包括: 按照預設的規(guī)則將流媒體劃分多個時間段; 針對每個時間段,對該時間段內(nèi)的彈幕進行分詞;統(tǒng)計該時間段內(nèi)每個分詞的詞頻,確 定該時間段對應的彈幕主題詞;并確定該時間段對應的彈幕主題詞的出現(xiàn)次數(shù); 根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識別彈幕主題詞 出現(xiàn)次數(shù)大于所述頻率均值的時間段; 在識別出的時間段中,根據(jù)對應的彈幕主題詞在該時間段內(nèi)每個時間點出現(xiàn)的次數(shù), 將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。2. 根據(jù)權利要求1所述的方法,其特征在于,所述按照預設的規(guī)則將流媒體劃分多個時 間段之前,所述方法還包括: 判斷用戶針對流媒體發(fā)送的彈幕數(shù)量是否大于預設的數(shù)量額定值,當所述彈幕數(shù)量大 于預設的數(shù)量額定值時,進行所述按照預設的規(guī)則將流媒體劃分多個時間段的步驟。3. 根據(jù)權利要求1所述的方法,其特征在于,所述對該時間段內(nèi)的彈幕進行分詞之前, 所述方法還包括: 對該時間段內(nèi)的彈幕進行過濾。4. 根據(jù)權利要求3所述的方法,其特征在于,所述對該時間段內(nèi)的彈幕進行過濾包括: 判斷該時間段內(nèi)的每個彈幕與保存的無意義語句詞表中的內(nèi)容是否相同; 如果相同,則過濾該彈幕。5. 根據(jù)權利要求1所述的方法,其特征在于,所述對該時間段內(nèi)的彈幕進行分詞之前, 所述方法還包括: 針對每個時間段,判斷該時間段內(nèi)的彈幕數(shù)量是否大于設定的數(shù)量閾值,如果是,則進 行所述對該時間段內(nèi)的彈幕進行分詞的步驟。6. 根據(jù)權利要求1所述的方法,其特征在于,所述將出現(xiàn)次數(shù)最大值對應的時間點確定 為內(nèi)容爆點之后,所述方法還包括: 將確定的每個內(nèi)容爆點保存在所述流媒體中,并針對每個內(nèi)容爆點保存該內(nèi)容爆點對 應的彈蒂。7. 根據(jù)權利要求1所述的方法,其特征在于,所述方法還包括: 將識別出的時間段對應的彈幕主題詞確定為該內(nèi)容爆點的爆點主題詞。8. -種確定流媒體中內(nèi)容爆點的裝置,其特征在于,應用于服務器,所述裝置包括: 劃分模塊,用于按照預設的規(guī)則將流媒體劃分多個時間段; 處理模塊,用于針對每個時間段,對該時間段內(nèi)的彈幕進行分詞;統(tǒng)計每個時間段內(nèi)每 個分詞的詞頻,確定該時間段對應的彈幕主題詞;并確定該時間段對應的彈幕主題詞的出 現(xiàn)次數(shù); 識別模塊,用于根據(jù)每個時間段對應的彈幕主題詞的出現(xiàn)次數(shù),及保存的頻率均值,識 別彈幕主題詞出現(xiàn)次數(shù)大于所述頻率均值的時間段; 第一確定模塊,用于根據(jù)對應的彈幕主題詞在該時間段內(nèi)每個時間點出現(xiàn)的次數(shù),將 出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點。9. 根據(jù)權利要求8所述的裝置,其特征在于,所述裝置還包括: 第一判斷模塊,用于判斷用戶針對流媒體發(fā)送的彈幕數(shù)量是否大于預設的數(shù)量額定 值,當所述彈幕數(shù)量大于預設的數(shù)量額定值時,進行所述按照預設的規(guī)則將流媒體劃分多 個時間段的步驟。10. 根據(jù)權利要求8所述的裝置,其特征在于,所述裝置還包括: 過濾模塊,用于在對每個時間段內(nèi)的彈幕進行分詞之前對該時間段內(nèi)的彈幕進行過 濾。11. 根據(jù)權利要求10所述的裝置,其特征在于,所述過濾模塊具體用于: 判斷該時間段內(nèi)的每個彈幕與保存的無意義語句詞表中的內(nèi)容是否相同; 如果相同,則過濾該彈幕。12. 根據(jù)權利要求8所述的裝置,其特征在于,所述裝置還包括: 第二判斷模塊,用于針對每個時間段,判斷該時間段內(nèi)的彈幕數(shù)量是否大于設定的數(shù) 量閾值,如果是,則進行所述對該時間段內(nèi)的彈幕進行分詞的步驟。13. 根據(jù)權利要求8所述的裝置,其特征在于,所述裝置還包括: 保存模塊,用于將出現(xiàn)次數(shù)最大值對應的時間點確定為內(nèi)容爆點之后,將確定的每個 內(nèi)容爆點保存在所述流媒體中,并針對每個內(nèi)容爆點保存該內(nèi)容爆點對應的彈幕。14. 根據(jù)權利要求8所述的裝置,其特征在于,所述裝置還包括: 第二確定模塊,用于將識別出的時間段對應的彈幕主題詞確定為該內(nèi)容爆點的爆點主 題詞。
【文檔編號】H04N21/845GK106028176SQ201610373489
【公開日】2016年10月12日
【申請日】2016年5月31日
【發(fā)明人】王晨曦, 汪強, 楊琛
【申請人】北京奇藝世紀科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1