亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

視頻廣告語音交互系統(tǒng)及方法

文檔序號:8434235閱讀:533來源:國知局
視頻廣告語音交互系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明具體設(shè)及一種視頻廣告語音交互系統(tǒng)及方法,屬于互聯(lián)網(wǎng)視頻廣告技術(shù)領(lǐng) 域。
【背景技術(shù)】
[0002] 視頻廣告目前已經(jīng)成為互聯(lián)網(wǎng)中主要的廣告形式,越來越多的視頻廣告給用戶帶 來了很大煩惱,為此,一些網(wǎng)站開始針對一些高級客戶提供可選擇播放的視頻廣告,用戶可 W選擇跳過某些廣告,但該需要用戶注冊并付費(fèi),大多數(shù)用戶都不會選擇注冊并付費(fèi)的形 式,并且簡單的跳過視頻廣告,必然使得廣告主受到損失,失去了宣傳產(chǎn)品的機(jī)會。

【發(fā)明內(nèi)容】

[0003] 因此,本發(fā)明針對現(xiàn)有技術(shù)中用戶對視頻廣告進(jìn)行跳過選擇需要注冊并付費(fèi),大 多數(shù)用戶都不會選擇注冊并付費(fèi)的形式,并且簡單的跳過視頻廣告,必然使得廣告主受到 損失,失去了宣傳產(chǎn)品的機(jī)會的問題,提供一種視頻廣告語音交互系統(tǒng),包括視頻播放客戶 端、廣告投放服務(wù)器、語音識別服務(wù)器,廣告投放服務(wù)器用于根據(jù)視頻播放客戶端的視頻廣 告請求提供視頻廣告代碼給視頻播放客戶端,其特征在于,所述視頻播放客戶端包括語音 監(jiān)聽開關(guān)、語音監(jiān)聽模塊,語音監(jiān)聽模塊用于收集語音信息,提取語音數(shù)據(jù)發(fā)送給語音識別 服務(wù)器,語音識別服務(wù)器用于識別語音數(shù)據(jù)并將結(jié)果文本返回給視頻播放客戶端。
[0004] 所述語音識別服務(wù)器包括語音識別模塊,所述語音識別模塊包括聲學(xué)模型、字典 文件、語言模型,聲學(xué)模型通過對語音庫進(jìn)行特征提取和聲學(xué)模型訓(xùn)練后得到,語言模型根 據(jù)文本庫中提供的文本進(jìn)行語言模型訓(xùn)練后得到,字典文件中存放單詞和音素的映射關(guān)系 表。
[0005] 所述視頻播放客戶端為手機(jī)、平板電腦、筆記本電腦或臺式機(jī)。
[0006] 由上述系統(tǒng)實(shí)現(xiàn)的視頻廣告語音交互方法,其特征在于,所述方法為:視頻播放客 戶端發(fā)送廣告請求給廣告投放服務(wù)器,廣告投放服務(wù)器提供廣告代碼給視頻播放客戶端, 視頻播放客戶端播放視頻廣告,當(dāng)語音監(jiān)聽開關(guān)狀態(tài)為開啟狀態(tài)時(shí),如果用戶進(jìn)行語音輸 入,語音監(jiān)聽模塊會收集到語音信息,并將語音數(shù)據(jù)發(fā)送給語音識別服務(wù)器,語音識別服務(wù) 器將語音數(shù)據(jù)識別的結(jié)果文本返回給視頻播放客戶端,視頻播放客戶端判斷結(jié)果文本中是 否包含指定命令,如果有,則用該些命令來調(diào)用播放器的相關(guān)接口觸發(fā)相關(guān)事件。
[0007] 指定命令包括內(nèi)置命令及非內(nèi)置命令。
[000引每次觸發(fā)事件發(fā)生后,視頻播放客戶端通過調(diào)用廣告投放服務(wù)器提供的日志記錄 接口進(jìn)行日志記錄。
[0009] 本發(fā)明的有益效果在于:采用本發(fā)明的視頻廣告語音交互系統(tǒng)及方法,通過語音 交互技術(shù),實(shí)現(xiàn)了用戶與系統(tǒng)的語音交互,既滿足了客戶不需要注冊付費(fèi)即可跳過廣告的 需求,又可W通過語音交互系統(tǒng)的限定,如客戶需要說出廣告產(chǎn)品名稱等方式,使得廣告主 的產(chǎn)品得到超出預(yù)期的宣傳效果。用戶還可W通過語音交互實(shí)現(xiàn)重播、暫停等其它功能。
【附圖說明】
[0010] 圖1為本發(fā)明視頻廣告語音交互系統(tǒng)的結(jié)構(gòu)示意圖;
[0011] 圖2為視頻播放客戶端的播放控制流程圖;
[0012] 圖3為語音識別服務(wù)實(shí)現(xiàn)流程圖。
[001引 附圖標(biāo)記如下;
[0014] 1、視頻播放客戶端;
[0015] 2、廣告投放服務(wù)器;
[0016] 3、語音識別服務(wù)器。
【具體實(shí)施方式】
[0017] 下面結(jié)合附圖對本發(fā)明的【具體實(shí)施方式】進(jìn)行說明:
[001引如圖1所示,視頻廣告語音交互系統(tǒng),包括視頻播放客戶端1、廣告投放服務(wù)器2、 語音識別服務(wù)器3,廣告投放服務(wù)器2用于根據(jù)視頻播放客戶端1的視頻廣告請求提供視頻 廣告代碼給視頻播放客戶端1,視頻播放客戶端1包括語音監(jiān)聽開關(guān)、語音監(jiān)聽模塊,語音 監(jiān)聽開關(guān)用于開啟和關(guān)閉語音監(jiān)聽模塊,語音監(jiān)聽模塊用于收集語音信息,提取語音數(shù)據(jù) 發(fā)送給語音識別服務(wù)器,語音識別服務(wù)器3用于識別語音數(shù)據(jù)并將結(jié)果文本返回給視頻播 放客戶端1。視頻播放客戶端1的播放控制流程如圖2所示。
[0019] 語音識別服務(wù)器3包括語音識別模塊,語音識別模塊包括聲學(xué)模型、字典文件、語 言模型,聲學(xué)模型通過對語音庫進(jìn)行特征提取和聲學(xué)模型訓(xùn)練后得到,語言模型根據(jù)文本 庫中提供的文本進(jìn)行語言模型訓(xùn)練后得到,字典文件中存放單詞和音素的映射關(guān)系表。語 音識別服務(wù)實(shí)現(xiàn)流程如圖3所示。
[0020] 視頻播放客戶端1為手機(jī)、平板電腦、筆記本電腦或臺式機(jī)。適用于各種平臺。
[0021] 由上述系統(tǒng)實(shí)現(xiàn)的視頻廣告語音交互方法,視頻播放客戶端1發(fā)送廣告請求給廣 告投放服務(wù)器2,廣告投放服務(wù)器2提供廣告代碼給視頻播放客戶端1,廣告代碼是根據(jù)事 先定義好廣告交互協(xié)議來生成的XML或JSON格式的字符串,里面包含了各種與廣告播放相 關(guān)的信息,如;廣告素材的U化、廣告的曝光和點(diǎn)擊計(jì)數(shù)W及播放完成的U化、廣告的曝光和 點(diǎn)擊監(jiān)測U化等等,客戶端會解析XML或JSON串,然后進(jìn)行廣告播放和相關(guān)事件的觸發(fā)。 每個有語音交互效果需求的廣告都會有一個名為"跳過廣告關(guān)鍵詞"的屬性,一般會取該廣 告的品牌名稱作為關(guān)鍵詞,新增語音交互效果日志的記錄,用于統(tǒng)計(jì)用戶對播放的廣告的 一些交互信息,可W提供給廣告主參考。具體方法為在每個廣告對應(yīng)的ad節(jié)點(diǎn)下新增一 個節(jié)點(diǎn)"skipword",其取值為跳過廣告的關(guān)鍵詞,此外再在skipword節(jié)點(diǎn)后新增一個節(jié)點(diǎn) "recurl",其取值為記錄用戶交互行為的日志接口U化,該U化中包含的參數(shù)會被記錄到日 志中,其中有一個actid參數(shù),取值為一個宏;"##ACTI0NID##",在實(shí)際發(fā)送請求的時(shí)候會 根據(jù)用戶實(shí)際觸發(fā)的請求而將其替換成相應(yīng)的值再將此U化對應(yīng)的請求發(fā)送出去。視頻播 放客戶端1播放視頻廣告,當(dāng)語音監(jiān)聽開關(guān)狀態(tài)為開啟狀態(tài)時(shí),如果用戶進(jìn)行語音輸入,語 音監(jiān)聽模塊會收集到語音信息,并將語音數(shù)據(jù)發(fā)送給語音識別服務(wù)器3,語音識別服務(wù)器3 將語音數(shù)據(jù)識別的結(jié)果文本返回給視頻播放客戶端1,視頻播放客戶端1判斷結(jié)果文本中 是否包含指定命令,如果有,則用該些命令來調(diào)用播放器的相關(guān)接口觸發(fā)相關(guān)事件。
[0022] 指定命令包括內(nèi)置命令及非內(nèi)置命令。例如
[002引"重播";內(nèi)置命令,重新播放當(dāng)前廣告;
[0024]"暫停";內(nèi)置命令,暫停播放當(dāng)前廣告;
[0025]"長城";非內(nèi)置命令,對于該種命令,當(dāng)用戶說出了當(dāng)前廣告的廣告跳過關(guān)鍵詞 (Skipword),即當(dāng)前廣告的品牌名稱,所W跳過當(dāng)前廣告。
[0026] 每次觸發(fā)事件發(fā)生后,視頻播放客戶端1通過調(diào)用廣告投放服務(wù)器2提供的日志 記錄接口進(jìn)行日志記錄。
[0027] 如下所示的JS0N片段,為一個客戶端發(fā)送的某次廣告請求時(shí)得到的廣告投放服 務(wù)端的返回結(jié)果,分別是長城和長江兩個品牌的兩個市場推廣廣告。其中"ads"是一個數(shù) 組,里面存放了多個"ad"子節(jié)點(diǎn),每個"ad"子節(jié)點(diǎn)對應(yīng)一個廣告,每個"ad"子節(jié)點(diǎn)中又有 一個"skipword"子節(jié)點(diǎn),當(dāng)用戶開啟語音監(jiān)聽開關(guān)并發(fā)出"長城"的音時(shí),id為123的廣告 就會停止播放,直接跳到下一個id為124的廣告進(jìn)行播放。
[002引客戶端在收集到語音信息后,會檢查下面的recurl節(jié)點(diǎn),如果該節(jié)點(diǎn)存在,則取 出其U化,然后將U化中的"##ACTI0NID##"替換為實(shí)際通過語音識別出來的字符串所觸發(fā) 的事件的編號(編號格式如;1 ;重播、2 ;暫停、3 ;跳過等),然后訪問該個U化,該U化對應(yīng) 于廣告投放服務(wù)端的一個日志收集服務(wù),該服務(wù)接收請求后會解析相關(guān)參數(shù),并完成日志 的記錄。主要JS0N代碼如下:
[0029]
【主權(quán)項(xiàng)】
1. 一種視頻廣告語音交互系統(tǒng),包括視頻播放客戶端、廣告投放服務(wù)器、語音識別服務(wù) 器,廣告投放服務(wù)器用于根據(jù)視頻播放客戶端的視頻廣告請求提供視頻廣告代碼給視頻播 放客戶端,其特征在于,所述視頻播放客戶端包括語音監(jiān)聽開關(guān)、語音監(jiān)聽模塊,語音監(jiān)聽 模塊用于收集語音信息,提取語音數(shù)據(jù)發(fā)送給語音識別服務(wù)器,語音識別服務(wù)器用于識別 語音并將識別結(jié)果文本返回給視頻播放客戶端。
2. 如權(quán)利要求1所述的視頻廣告語音交互系統(tǒng),其特征在于,所述語音識別服務(wù)器包 括語音識別模塊,所述語音識別模塊包括聲學(xué)模型、字典文件、語言模型,聲學(xué)模型通過對 語音庫進(jìn)行特征提取和聲學(xué)模型訓(xùn)練后得到,語言模型根據(jù)文本庫中提供的文本進(jìn)行語言 模型訓(xùn)練后得到,字典文件中存放單詞和音素的映射關(guān)系表。
3. 如權(quán)利要求1所述的視頻廣告語音交互系統(tǒng),其特征在于,所述視頻播放客戶端為 手機(jī)、平板電腦、筆記本電腦或臺式機(jī)。
4. 根據(jù)權(quán)利要求1至3任一項(xiàng)所述的系統(tǒng)實(shí)現(xiàn)的視頻廣告語音交互方法,其特征在于, 所述方法為:視頻播放客戶端發(fā)送廣告請求給廣告投放服務(wù)器,廣告投放服務(wù)器提供廣告 代碼給視頻播放客戶端,視頻播放客戶端播放視頻廣告,當(dāng)語音監(jiān)聽開關(guān)狀態(tài)為開啟狀態(tài) 時(shí),如果用戶進(jìn)行語音輸入,語音監(jiān)聽模塊會收集到語音信息,并將語音數(shù)據(jù)發(fā)送給語音識 別服務(wù)器,語音識別服務(wù)器將語音數(shù)據(jù)識別的結(jié)果文本返回給視頻播放客戶端,視頻播放 客戶端判斷結(jié)果文本中是否包含指定命令,如果有,則用這些命令來調(diào)用播放器的相關(guān)接 口觸發(fā)相關(guān)事件。
5. 如權(quán)利要求4所述的視頻廣告語音交互方法,其特征在于,所述指定命令包括內(nèi)置 命令及非內(nèi)置命令。
6. 如權(quán)利要求4所述的視頻廣告語音交互方法,其特征在于,每次觸發(fā)事件發(fā)生后,視 頻播放客戶端通過調(diào)用廣告投放服務(wù)器提供的日志記錄接口進(jìn)行日志記錄。
【專利摘要】本發(fā)明公開了一種視頻廣告語音交互系統(tǒng)及方法,屬于互聯(lián)網(wǎng)視頻廣告技術(shù)領(lǐng)域。為解決現(xiàn)有技術(shù)中用戶對視頻廣告進(jìn)行跳過選擇需要注冊并付費(fèi),并且簡單的跳過視頻廣告,必然使得廣告主受到損失的問題,提供一種視頻廣告語音交互系統(tǒng),包括視頻播放客戶端、廣告投放服務(wù)器、語音識別服務(wù)器,由上述系統(tǒng)實(shí)現(xiàn)的視頻廣告語音交互方法,視頻播放客戶端播放視頻廣告,用戶開啟語音監(jiān)聽開關(guān),進(jìn)行語音輸入,語音監(jiān)聽模塊收集語音信息,提取語音數(shù)據(jù)發(fā)送給語音識別服務(wù)器,語音識別服務(wù)器將語音數(shù)據(jù)識別的結(jié)果文本返回給視頻播放客戶端,視頻播放客戶端調(diào)用播放器的相關(guān)接口觸發(fā)相關(guān)事件。用于互聯(lián)網(wǎng)視頻廣告播放中實(shí)現(xiàn)語音交互。
【IPC分類】H04N21-233, H04N21-472, H04N21-2668
【公開號】CN104754364
【申請?zhí)枴緾N201510145559
【發(fā)明人】張?jiān)其h, 蔣子俊, 周盛, 姚鍵, 張大偉, 曹磊, 唐端榮, 潘柏宇, 盧述奇
【申請人】合一信息技術(shù)(北京)有限公司
【公開日】2015年7月1日
【申請日】2015年3月30日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1