視頻擷取系統及其視頻擷取方法
【技術領域】
[0001]本發(fā)明涉及一種視頻擷取方法,且特別是一種通過智能裝置來感測使用者的動作以擷取目前顯示裝置所播放的特定節(jié)目的視頻片段的視頻擷取方法及使用其的視頻擷取系統。
【背景技術】
[0002]隨著數字時代的來臨,視頻(Video)、音頻(Aud1)等各式各樣的信息可以更方便地存儲、傳輸和流通。在現今的科技中,使用者可以通過顯示裝置(例如電視,或是配備了電視卡的計算機系統的屏幕)觀看各個電視臺所提供的節(jié)目,并錄下喜歡的片段。
[0003]舉例來說,當使用者在觀看特定節(jié)目時發(fā)現了喜歡的片段(例如運動節(jié)目中進球的片段,或是美食節(jié)目中的美食信息),使用者可按壓任一具有視頻擷取程序的智能裝置(或是顯示裝置的遙控器)上的按鈕,使得智能裝置開始錄音并進一步取得一段聲紋數據。接著,第一服務器接收此聲紋數據后,將聲紋數據與第一服務器中存儲的所有節(jié)目的完整音頻做比對,以找出與聲紋數據對應的特定節(jié)目。第一服務器根據聲紋數據建立書簽。書簽中包括使用者欲擷取的視頻片段的開始標記以及結束標記。第一服務器根據此書簽向提供節(jié)目的第二服務器獲取對應的特定節(jié)目的視頻片段。在獲取視頻片段后,第一服務器將視頻片段回傳給使用者。
[0004]然而,現有的取得視頻片段的方法需要使用者先完成幾個動作。首先,使用者要在觀看特定節(jié)目前先開啟智能裝置的視頻擷取程序并指定好所要觀看的特定節(jié)目的頻道。使用者還必須先通過聲紋比對技術使智能裝置與節(jié)目的時間軸同步,才能進行視頻擷取。此夕卜,在視頻擷取的過程中,使用者必須手動控制所要擷取的視頻片段的開始標記與結束標記。換句話說,現有的技術需要使用者執(zhí)行繁雜的動作后才能提供使用者想要的視頻片段。另一方面,第一服務器需要存儲所有節(jié)目的完整音頻,使得第一服務器消耗掉大量的存儲空間。第一服務器在根據聲紋數據建立書簽時,必須將聲紋數據與大量的音頻做比對,才能對應地建立書簽。
[0005]因此,需要一種視頻擷取方法及使用其的視頻擷取系統,能夠自動與節(jié)目同步并提供使用者快速又簡便的視頻擷取服務,同時減少第一服務器所存儲的數據量。
【發(fā)明內容】
[0006]本發(fā)明實施方式提供一種視頻擷取系統。所述視頻擷取系統包括智能裝置以及第一服務器。智能裝置用以感測使用者的特定行為,以記錄感測特定行為的時間戳記,錄下一顯示裝置所播放的特定節(jié)目的音頻,并依據音頻產生聲紋數據。第一服務器用以接收聲紋數據與時間戳記,通過聲紋數據以及電子節(jié)目表(Electronic program guide,EPG)信息從多個節(jié)目中找出與聲紋數據對應的特定節(jié)目。第一服務器通過時間戳記獲得視頻片段開始標記。視頻片段開始標記用以擷取該特定節(jié)目的視頻片段的時間起始點。
[0007]本發(fā)明實施方式提供一種視頻擷取方法。此視頻擷取方法適用于視頻擷取系統,視頻擷取系統包括智能裝置以及第一服務器。所述視頻擷取方法的步驟包括:智能裝置感測使用者的特定行為,以記錄時間戳記以及錄下顯示裝置所播放的特定節(jié)目的音頻,并依據音頻產生聲紋數據。第一服務器接收聲紋數據與時間戳記,通過聲紋數據以及電子節(jié)目表信息從多個節(jié)目中找出與聲紋數據對應的特定節(jié)目。第一服務器通過時間戳記獲得視頻片段開始標記。視頻片段開始標記用以擷取特定節(jié)目的視頻片段的時間起始點。
[0008]根據以上所述,本發(fā)明實施方式所提供的視頻擷取方法及使用其的視頻擷取系統不需要復雜的操作即可讓使用者控制智能裝置產生視頻擷取請求信息,并進一步獲取想要的視頻片段。另一方面,配合使用電子節(jié)目表信息、視頻擷取請求信息中的時間戳記以及聲紋數據,第一服務器能夠快速地找出使用者目前正在觀看的特定節(jié)目,減少使用者等待獲取視頻片段所花費的時間。值得一提的是,第一服務器不需存儲所有節(jié)目的完整音頻,而是僅保留所有節(jié)目的最新N分鐘的音頻(N大于O)即可找出與聲紋數據對應的特定節(jié)目。相較于先前技術的作法,上述視頻擷取方法及使用其的視頻擷取系統更減少了第一服務器存儲所有節(jié)目的音頻所消耗的存儲空間。
[0009]為使能更進一步了解本發(fā)明的特征及技術內容,請參閱以下有關本發(fā)明的詳細說明與附圖,但是此等說明與所附附圖僅是用來說明本發(fā)明,而非對本發(fā)明的權利范圍作任何的限制。
【附圖說明】
[0010]圖1是本發(fā)明實施方式的視頻擷取系統的方塊圖。
[0011]圖2是本發(fā)明實施方式的擷取視頻片段的示意圖。
[0012]圖3A是本發(fā)明實施方式的固定長度擷取規(guī)則的示意圖。
[0013]圖3B是本發(fā)明另一實施方式的智能長度擷取規(guī)則的示意圖。
[0014]圖3C是本發(fā)明再一實施方式的智能長度擷取規(guī)則的示意圖。
[0015]圖4是本發(fā)明另一實施方式的視頻擷取系統的方塊圖。
[0016]圖5是本發(fā)明實施方式的視頻擷取方法中智能裝置產生視頻擷取請求信息的流程圖。
[0017]圖6是本發(fā)明實施方式的視頻擷取方法中第一服務器獲取視頻片段的流程圖。
[0018]圖7是本發(fā)明另一實施方式的視頻擷取方法中智能裝置產生視頻擷取請求信息的流程圖。
[0019]圖8是本發(fā)明另一實施方式的視頻擷取方法中第一服務器獲取視頻片段的流程圖。
【具體實施方式】
[0020]在下文將參看隨附附圖更充分地描述各種例示性實施方式,在隨附附圖中展示一些例示性實施方式。然而,本發(fā)明概念可能以許多不同形式來體現,且不應解釋為限于本文中所闡述的例示性實施方式。確切而言,提供此等例示性實施方式使得本發(fā)明將為詳盡且完整,且將向所屬領域的技術人員充分傳達本發(fā)明概念的范疇。在諸附圖中,可為了清楚而夸大示出層及區(qū)的大小及相對大小。類似數字始終指示類似組件。
[0021]應理解,雖然本文中可能使用術語第一、第二、第三等來描述各種組件或信號等,但此等組件或信號不應受此等術語限制。此等術語乃用以區(qū)分一組件與另一組件,或者一信號與另一信號。另外,如本文中所使用,術語「或」視實際情況可能包括相關聯的列出項目中的任一個或者多個的所有組合。
[0022]請參閱圖1,圖1是本發(fā)明實施方式的視頻擷取系統的方塊圖。視頻擷取系統包括智能裝置11、第一服務器12、第二服務器13以及顯示裝置14。智能裝置11與第一服務器12之間、第一服務器12與第二服務器13之間以及第二服務器13與顯示裝置14之間優(yōu)選是通過無線通信方式建立聯機。需注意的是,智能裝置11與第一服務器12之間、第一服務器12與第二服務器13之間以及第二服務器13與顯示裝置14之間亦可通過有線通信方式建立聯機。另外,甚至可以是視頻擷取系統內的部份裝置之間使用無線通信方式建立聯機,而其另一部份的裝置之間使用有線通信方式建立聯機,總之本發(fā)明并不以裝置的連結方式為限制。
[0023]智能裝置11,例如為智能型手機、平板計算機或是機頂盒,其具備了傳感器以及麥克風,用以感測使用者10的動作。詳細地說,智能裝置11安裝了視頻擷取程序。當智能裝置11的視頻擷取程序感測到使用者作出特定行為后,智能裝置11將記錄對應當下時點的時間戳ETs以及錄下顯示裝置14目前所播放的特定節(jié)目Dp的一段音頻,并依據記錄的音頻產生聲紋數據vp。接著,智能裝置11產生視頻擷取請求信息。視頻擷取請求信息包括時間戳記Ts以及聲紋數據vp。
[0024]上述使用者所做出的特定行為可以為搖晃智能裝置11或是拍擊智能裝置11或使用者10也可對智能裝置11發(fā)出特定聲響,例如拍手三聲或是喊出「視頻擷取」。然而,本發(fā)明并不以特定行為的類型為限制。使用者10可依需求自行設定智能裝置11感測到什么動作或聲響時才記錄對應當下時點的時間戳記Ts以及錄下顯示裝置14目前所播放的節(jié)目Dp的一段音頻,并依據記錄的音頻產生聲紋數據Vp。
[0025]第一服務器12用以接收視頻擷取請求信息,并通過聲紋數據Vp以及電子節(jié)目表(Electronic program guide,EPG)信息找出與聲紋數據Vp對應的特定節(jié)目,也即使用者10目前正在觀看的特定節(jié)目Dp。電子節(jié)目表信息中記錄了目前正在播放的節(jié)目以及未來將播放的節(jié)目的相關信息,例如節(jié)目名稱、播出頻道、播出時間或者節(jié)目類型等等,使得第一服務器12能夠根據電子節(jié)目表信息找到目前正在播放的所有節(jié)目的音頻。
[0026]第一服務器12根據所有節(jié)目的音頻與聲紋數據Vp進行聲紋比對,以找出與聲紋數據Vp對應的特定節(jié)目Dp。若第一服務器12沒有找到與聲紋數據Vp對應的特定節(jié)目Dp,則第一服務器12通知使用者10其未找出與聲紋數據Vp對應的特定節(jié)目Dp。若第一服務器12找到與聲紋數據Vp對應的特定節(jié)目Dp,則第一服務器12通過時間戳記Ts獲得視頻片段開始標記Tstart。接著,第一服務器12通過視頻擷取規(guī)則決定視頻片段結束標記TOTd。在決定視頻片段開始標記Tstart以及視頻片段結束標記TOTd后,第一服務器12將視頻片段開始標記Tstart、視頻片段結束標記TOTd以及特定節(jié)目Dp的相關信息輸出至第二服務器13,以獲取對應的視頻片段Dv。視頻片段開始標記Tstart與視頻片段結束標記Tend分別表示要擷取的特定節(jié)目Dp的視頻片段的時間起始點與時間結束點。
[0027]值得一提的是,第一服務器12僅保留了所有節(jié)目的最新N分鐘的音頻,且N大于
O。第一服務器12利用所有節(jié)目的最新N分鐘的音頻與聲紋數據Vp作