專利名稱:適用于交互式電視和電話的基于上下文的識別系統(tǒng)的制作方法
技術(shù)領域:
本發(fā)明涉及交互式多媒體領域,特別涉及交互式數(shù)據(jù)庫檢索、存貯和顯示。
人們一直在努力尋找一種途徑為接收視像和聲音傳送的用戶提供越來越多的支持信息。一種正在開發(fā)中的支持手段是向用戶提供交互式服務。例如,交互式電視支持者正在研制多種形式的交互式手段,使觀眾與顯示在電視上的材料之間建立起一種更為溝通的關系。這通常體現(xiàn)在以可見到的或可聽到的信息來滿足用戶的查詢。
緊致盤—交互式的(CD-I)或其它經(jīng)過預編排的多媒體物質(zhì)允許用戶/觀眾瀏覽數(shù)據(jù)庫的內(nèi)容。用戶可以利用其預編排的菜單有選擇地進行查詢。為進行查詢,可使用電子、光電或紅外的直接控制器或遙控器從顯示出的菜單中作出選擇。某些應用使用了聲音識別技術(shù)。這些技術(shù)使用戶可以從一個簡單菜單中,或從諸如目錄、索引、甚至一本完整的書之類的多種選項中進行聲音查詢或聲音選擇。在文本和書刊目錄的數(shù)據(jù)庫查找方面,已有商業(yè)應用存在。此類的例子有D0w Jones,Nexis/Lexis,和Dialog。
對于這類系統(tǒng),要實現(xiàn)聲音或其它識別選擇技術(shù),通常要求該識別系統(tǒng)能夠從一個大容量詞典中匹配用戶輸入。該詞典可能必須包含有關語種的所有單詞、甚至是專有名詞、縮語和術(shù)語。這種識別處理是硬件和軟件密集的,實現(xiàn)起來無論從投資上還是時間上來說代價都較大。即便如此,由于需要查找大容量的目標詞典,這就先天決定了其結(jié)果必然是產(chǎn)生延遲、歧義和錯誤。
本發(fā)明的一個目標是提供一種方法和裝置,使正在觀看和/或收聽節(jié)目的用戶能夠檢索與剛剛看到的某個條目或剛剛聽到的某個單詞相關的輔助信息。該裝置含有一個識別系統(tǒng)用來識別用戶的請求并提供解答。根據(jù)從最近接收到的節(jié)目部分中提取出的條目或關鍵字,創(chuàng)建一個動態(tài)變化的詞典。用戶的請求與該不斷變化的詞典進行匹配。一旦識別出請求,將啟動一個搜索,該搜索訪問可滿足該請求的所需信息,將之導入并傳送給用戶。
本發(fā)明的另一個目標是提供一個系統(tǒng),它從節(jié)目中接收輸入信號,并將該節(jié)目顯示到某種節(jié)目顯示媒體上以呈現(xiàn)給用戶。輸入信號帶有大量信息元素,而一個應用可以為這些元素提供擴展信息。系統(tǒng)含有一個上下文提取器,用以從輸入信號中提取上述大量信息元素中的每一個元素;一個緩沖區(qū),用以接收和保存來自上下文提取器的每個被提取信息元素。它還含有一個用戶界面,以便用戶發(fā)出請求,要求接收與信息元素有關的擴展信息;一個識別處理器,用以接收請求并在請求和被提取信息元素之間識別出匹配。它向應用傳送該匹配信息,由應用將擴展信息顯示到顯示媒體上。
在一個實施例中,系統(tǒng)還含有一個應用媒體,用來為至少一個信息元素提供擴展信息。在另一個實施例中,識別處理器對至少一個被提取信息元素進行預處理。具有一定存貯容量的緩沖區(qū)最好在一旦變滿之后,可以通過覆蓋保存在緩沖區(qū)中最舊的信息元素,繼續(xù)接收另外的信息元素。在另外一個實施例中,信息元素與輸入信號一起包含在封閉字幕正文中,而提取器含有一個機制用以從輸入信號中分離出封閉字幕正文。
本發(fā)明的另一個目標是提供一個實時識別系統(tǒng),該系統(tǒng)包含一種用以從當前信息流中提取目標詞匯的裝置;一個用以保存目標詞匯的緩沖區(qū);一種裝置,使觀看當前信息流的用戶可以要求目標詞匯表中某個條目的有關附加信息;以及一個識別處理器,用來將用戶的請求轉(zhuǎn)換成與目標詞匯匹配的主題。最好,當前信息流具有便于觀看的某種格式,并且,匹配的主題可以被應用識別。系統(tǒng)含有將匹配的主題傳送到應用的裝置、從應用中檢索附加信息的裝置,以及另一種裝置,該裝置能夠?qū)⑦m量的附加信息以可觀看的格式通過檢索到的信號流傳回用戶。
本發(fā)明的另一個目標是提供一個動態(tài)詞典,該詞典含有一個帶有大量可識別信息元素的輸入信息流;一個識別器,用以接收信息流且識別和選擇信息元素;一個緩沖區(qū),用來保存選定的信息元素。該詞典最好含有選定信息元素的索引,將選定信息元素按照字母數(shù)字升序分類保存,并且通過顯示該索引的菜單顯示裝置,使用戶可以訪問上述選定信息元素。
本發(fā)明的另一個目標是提供一種識別方法,用以從節(jié)目中接收輸入信號,并將該節(jié)目顯示到某種節(jié)目顯示媒體上以呈現(xiàn)給用戶。輸入信號帶有大量信息元素,而一個應用可以為這些元素提供擴展信息。該方法含有下面的步驟從輸入信號中提取上述大量信息元素中的每一個元素;將每個被提取信息元素保存在一個緩沖區(qū)中;當用戶要求接收與至少一個信息元素有關的擴展信息時,對此請求作出響應;將該請求與被提取信息元素進行匹配;并將匹配傳送給應用。然后,應用將擴展信息顯示到顯示媒體上。該方法最好含有下面的步驟提供一個應用媒體,用來為至少一個信息元素提供擴展信息。該方法最好還含有下面的步驟對至少一個被提取信息元素進行預處理。同時,具有一定存貯容量的緩沖區(qū)最好在一旦存滿信息元素之后,可以通過首先覆蓋保存在緩沖區(qū)中最舊的信息元素,對另外接收到的信息元素進行保存。
本發(fā)明的另一個目標是提供用以形成實時識別系統(tǒng)的一個方法,一個應用可以向該系統(tǒng)提供大量主題的相關擴展信息。該方法含有下面的步驟從當前信息流中提取目標詞匯,當該詞匯被更新時,將目標詞匯保存在緩沖區(qū)中,當用戶要求目標詞匯表中某個條目的有關附加信息時,對該請求作出響應,并對照保存在緩沖區(qū)中的詞匯表,對該請求進行匹配。最好含有下面的步驟將匹配的主題傳送到應用,該應用為請求檢索附加信息并將檢索到的適量附加信息通過與當前信息流兼容的、經(jīng)檢索得到的信號流傳回用戶。檢索到的信息通常被組織成與當前流相同的格式,以便用戶通過顯示器進行觀看。最好還含有下面的步驟至少顯示緩沖區(qū)內(nèi)容的一部分,以便用戶可以選擇一個有效的請求。
本發(fā)明的另一個目標是提供用以形成動態(tài)詞典的一個方法。該方法含有下面的步驟提供帶有大量可識別信息元素的輸入信息流;識別和選擇上述信息元素;將選定的信息元素保存在緩沖區(qū)中。最好含有下面的步驟對選定信息元素編索引的步驟;將索引按照字母數(shù)字順序排序的步驟;以及/或者通過一個菜單顯示選定信息的步驟。最好還含有下面的步驟利用畫中畫、分隔屏幕、視頻正文和/或可選圖像技術(shù)將附加信息和當前流顯示在一起。最好還含有下面的步驟為每一個被提取信息元素分配一個優(yōu)先級,在一段特定的時間內(nèi)保存上述被提取信息元素。該特定時間可能取決于分配給信息元素的優(yōu)先級。
經(jīng)過進一步參看下面的對本發(fā)明的詳細說明和本發(fā)明的一個實施例的示意框圖,本發(fā)明的上述及其它目的、特征和優(yōu)點將變得顯而易見。
本發(fā)明提供一種方法和裝置,允許正在觀看和/或收聽節(jié)目的用戶,檢索與剛剛看到的一個條目相關、或通常與剛剛聽到的一個單詞或一組單詞相關的輔助信息或輔助娛樂。節(jié)目可以通過包括無線電、電視和電話在內(nèi)的任何傳送手段接收。該裝置含有一個識別系統(tǒng)用來識別用戶的請求并提供解答。其實現(xiàn)方法是利用從最近接收到的節(jié)目部分中提取出的條目和關鍵字創(chuàng)建一個動態(tài)變化的詞典。用戶的請求與該不斷變化的詞典進行匹配。一旦識別出請求,將啟動一個搜索,該搜索訪問可滿足該請求的所需信息,將之導入并傳送給用戶。采用這種方法,一個相對較小的、不斷更新的詞典得到實時地創(chuàng)建。其條目只需包含那些從最近接收到的節(jié)目部分中提取出的條目和/或關鍵字。
本發(fā)明認識到,就交互式而言,一個觀眾最有可能要求得到與剛剛出現(xiàn)的條目和/或單詞相關的信息。因此,本發(fā)明創(chuàng)建一個含有在節(jié)目進程中剛剛出現(xiàn)的條目、關鍵條目、單詞或關鍵字的詞典。這些就構(gòu)成了識別系統(tǒng)中目標詞典的所有表項。這種方法將識別系統(tǒng)進行識別所需的要求減少到只需識別有限的詞匯。在存貯容量、軟件和硬件要求、處理時間、成本、耗電量、準確性和許多其它成功所需因素方面,這種方法實現(xiàn)起來遠非復雜,而是相當簡單。同時,它有可能具有此處說明的高級用途。
正如本申請所用,當提及一個節(jié)目‘條目’或‘單詞’時,指的是要求識別的一個可能目標。這包括,但不限于,諸如口頭用詞、正文、可視或聲音信息之類的節(jié)目‘條目’和/或‘單詞’。這些條目或單詞通常以正文類型格式給出,或被轉(zhuǎn)化成該格式。當提及一個‘詞典’或被存貯的‘詞匯表’時,指的是可用來進行識別匹配的編碼信息的任意數(shù)組。這樣,一個節(jié)目‘條目’或‘單詞’是一個侯選‘詞典’條目,同時是該‘詞典’中‘詞匯表’的一部分。一個‘條目’或‘單詞’被稱為‘最近出現(xiàn)的’,條件是該‘條目’或‘單詞’屬于最近接收到的‘條目’或‘單詞’組,而這個組被保存在一個專用存貯緩沖區(qū)中。這可能取決于存貯緩沖區(qū)的容量和/或識別系統(tǒng)的性能。容量可以是一個實際物理限度、一個用戶定義的限度、或一個應用定義的性能限度。當新的條目和/或單詞被接收到之后,較舊的非重復條目被覆蓋。
示意圖表示的本發(fā)明一個實施例的框圖。它示意了一個上下文提取器102、緩沖詞匯表104、識別處理器106、用戶界面110、和一個信號顯示器108。上下文提取器102含有一個數(shù)據(jù)處理器,用以從聲音、視像或電話信號中提取單詞和/或條目。上下文提取器102采樣輸入信號,識別出‘單詞’并將這些‘單詞’傳送到緩沖區(qū)中供保存在詞典中。選擇條件可以包括對照由應用提供的可用主題列表,匹配所有可接受的‘單詞’。上述信號還不受干擾地輸送到其標準顯示器108,如電視機、收音機或電話機。
緩沖詞匯表104可被實時地更新。保存最近提取的條目和或‘單詞’,并以此定義詞匯表,以便服務可能的識別請求,這是一種可行的方法。緩沖區(qū)104從上下文提取器102接收‘單詞’,并依據(jù)用來設定存貯多少‘單詞’以及將它們存貯多長時間的參數(shù)進行操作。當緩沖區(qū)存滿后,較舊的或優(yōu)先權(quán)較低的單詞被丟棄,而用新的條目替換,這樣一來,此緩沖區(qū)總是包含最近對用戶最相關的信息。該緩沖區(qū)能夠?qū)τ脩粢箫@示其內(nèi)容,或其任意部分的請求作出響應。該緩沖區(qū)也對來自識別處理器要求獲取當前詞匯表的請求作出響應。
識別處理器106是用來接收用戶請求,并能夠匹配口述的或采用其它方式傳至的‘單詞’的裝置。識別處理器可類似于‘IBM語音型口述命令處理’系統(tǒng)。它識別用戶請求的方法是通過對照保存在緩沖區(qū)104中的詞匯表,來匹配請求‘單詞’。當產(chǎn)生一個匹配時,識別處理器106解釋請求的含義,并將該請求傳送到應用112。作為一種選擇,可以提供一種手段來預處理一個匹配請求,其方法是在請求產(chǎn)生之前就傳送已存于緩沖區(qū)中的‘單詞’。當采用這種方法時,應用可以對這些‘單詞’進行預處理,并產(chǎn)生搜索結(jié)果以便隨時傳送給用戶。如果用戶實際發(fā)出的請求是針對一個經(jīng)過預處理的條目時,系統(tǒng)將更加迅速地滿足該請求。
用戶界面110允許正在接收無線電、電視、或電話信號的用戶借助語音或其它輸入請求手段發(fā)出請求,以得到與最近看到或聽到的某個主題相關的、更詳細的視像或聲音信息。該用戶界面使觀眾或聽眾可以直接或遠距離地向某個應用發(fā)出請求,并觀看其響應。作為一種選擇,用戶可以看到或聽到被確定為有效輸入的‘單詞’。作為另外的選擇,可以允許其它形式的請求,如利用按鈕從視像或聲音形式的有效請求菜單中進行選擇。
信號顯示器108是將聲音、視像和/或電話信號送達觀眾或聽眾的裝置。信號顯示器108可以是一個用戶正在收看或收聽的普通收音機、電視機、或電話機。它顯示出用戶通常期望得到的任何信息,還顯示出對上下文觸發(fā)的請求作出的響應。在用戶命令時,該顯示器還用來顯示一個有效請求菜單。在視像顯示的情況下為得到請求響應,可使用可選視像來替代普通視像,或使之與普通視像一起顯示。這一點可以利用包括畫中畫和分隔屏幕在內(nèi)的熟知技術(shù)進行實現(xiàn)。作為一種有用的選擇,可以提供給用戶某種手段以顯示緩沖區(qū)的所有或部分內(nèi)容,使得用戶能夠選擇有效的請求。這可以用目錄詞條菜單的形式實現(xiàn)。
在本發(fā)明一個實施例中,所提供的裝置采用封閉字幕正文作為存貯緩沖區(qū)的輸入。在美國,封閉字幕在NTSC信號垂直消隱間隔的第21行進行傳送。本發(fā)明的裝置和方法最好能夠捕獲并采用其它視像數(shù)據(jù)服務,從而搜索、定位和導入信息用來滿足用戶的請求。這種服務的例子如圖文電視,以及電子工業(yè)協(xié)會標準數(shù)據(jù)服務,該服務采用的是NTSC,EIA-608標準適用于NTSC的21行數(shù)據(jù)服務,1994。
最好允許設定所有‘條目’和/或‘單詞’的優(yōu)先級??梢栽O定優(yōu)先級,使某種應用的相關‘條目’或‘單詞’能夠保持比普通持續(xù)時間更長的一段時間,甚至在節(jié)目的整個觀看過程之中都一直保持。這將取決于被收看的節(jié)目類型,如新聞、體育、音樂、電影等等。高優(yōu)先級可以分配給標識節(jié)目本身的單詞。某些此類信息可以直接從信號的視像或聲音部分中捕獲。也可以從信號的嵌入部分中捕獲,這種嵌入部分的例子可以是在視頻垂直消隱間隔中傳送的封閉字幕正文。任何被存貯的條目和/或單詞只在詞典中出現(xiàn)一次。在某些應用中,某個條目和/或單詞在節(jié)目中出現(xiàn)的次數(shù)可被連續(xù)地更新和記錄。這可以用作決定該條目或單詞優(yōu)先級的依據(jù)。
最好還能夠提供手段對被存貯條目和單詞進行預處理。預處理器可以進行搜索,即為檢索之用完成尋找、標識、準備工作,它甚至從一個或多個特定數(shù)據(jù)庫中檢索信息,而這些數(shù)據(jù)庫與存貯在詞典中的條目或單詞是相關的。在新條目和/或單詞被接收且加入到存貯緩沖區(qū)中的同時,上述處理可以連續(xù)進行。對代表著可能用戶請求的關鍵字進行預處理,在以后作出這種請求時,系統(tǒng)的響應時間將縮短。最好結(jié)合特定條目或單詞的優(yōu)先級進行預處理工作。它可能只搜索那些其優(yōu)先級至少為中高的條目或單詞,而且實際上只為那些其優(yōu)先級比中高優(yōu)先級更高的條目或單詞檢索信息。
本發(fā)明有許多可能的實施例。下面描述了幾個,其中,節(jié)目的用戶看到了和/或聽到了他希望進一步了解的東西。在某個場景,用戶正在收看電視新聞節(jié)目,該觀眾聽到新聞播音員提到某些國家,如‘法國’。用戶甚至可能看到屏幕上顯示出此國家的地圖。對該觀眾來說,顯示出的地圖提供的信息量不夠。然后,新聞播音員轉(zhuǎn)到另一個話題。采用本發(fā)明,該觀眾調(diào)出一個最近被保存關鍵字的菜單,并注意到單詞‘法國’和/或‘法國地圖’的確被保存在字典中。然后,觀眾輸入一個有關‘法國’的請求。輸入的發(fā)出可以通過語音,或通過在顯示出的詞典菜單中作出直接或遙控選擇。識別系統(tǒng)對照其字典對輸入單詞進行匹配,并判斷出該觀眾希望得到有關法國的某些信息。它向應用數(shù)據(jù)庫發(fā)出請求,要求得到有關法國的信息。該應用可以位于本地或遠程的一個含有百科全書的CD-ROM或數(shù)據(jù)庫。該應用檢索百科全書中有關法國的數(shù)據(jù)條目。根據(jù)該應用復雜程度的不同,可將檢索到的數(shù)據(jù)全部顯示出來,或?qū)⒅黝}條目片段顯示給用戶,或?qū)⑦x定主題的信息標題列表顯示給用戶,此處的選定主題即是法國。可以利用畫中畫、分隔屏幕、屏幕下端正文或其它技術(shù)將檢索到的信息覆蓋顯示在電視播送節(jié)目上。甚至可以將一幅法國地圖顯示給用戶。觀眾通常能夠放大或縮小地圖,還可以將新聞中提到的地點添加到透視圖中。
在另一個實施例中,發(fā)明中的裝置應用于可能出現(xiàn)的下面場景。觀眾在看電影時,聽到演員提到了情節(jié)中的一個角色。用戶一旦發(fā)出請求后,由電影節(jié)目制片者、播音員或撥號服務提供者所提供的服務將給出節(jié)目有關的信息。所提供的信息的全部索引可能極為龐大,占用的存貯容量要多于提供給普通用戶的顯示菜單所占容量。它包括的內(nèi)容如節(jié)目統(tǒng)計資料、其角色和/或飾演角色的演員。本發(fā)明減少了顯示給用戶的菜單中需包含的索引信息量。顯示出的菜單中只含有那些與最近向觀眾顯示的條目有關的索引信息。這個有限的索引信息量實際上不超過普通用戶設備的存貯容量。索引信息是動態(tài)的,并且在慢慢地變化,以便包含最近放映的電影片段中所出現(xiàn)的的條目和單詞。觀眾從顯示出的菜單中選擇所需的特定主題。例如,如果用戶輸入某個角色的名字以期望得到其更多的信息,該名字將與菜單詞典進行比較。于是識別處理器將比照顯示菜單中有效名字對該名字進行比較。一旦發(fā)現(xiàn)匹配,處理器把該匹配傳送給數(shù)據(jù)庫應用。所需的信息被檢索出來,并以子標題類型的正文形式顯示出來,而與此同時用戶仍在觀看電影。存貯器信息的第二部分是相對不變的。它包含某些菜單條目,而這些條目通常在節(jié)目的整個過程之中保持不變。它們包括電影名稱,以及其它可用來指點節(jié)目相關數(shù)據(jù)庫部分的信息。
本發(fā)明的另一方面是提供了一個動態(tài)詞典,它含有一個輸入信息流,它帶有大量可識別的信息元素;一個識別器,用來接收該信息流,識別和選擇信息元素;一個緩沖區(qū),它用來存貯選定的信息元素。該詞典最好含有被選定信息元素的索引。被選定信息元素可以經(jīng)排序后存貯,用戶可以利用顯示有該索引的菜單顯示裝置訪問這些被選定信息元素。排序的依據(jù)可以是信息元素的優(yōu)先級、收到的順序、或是字母數(shù)字的升序或降序。
盡管上面的敘述針對的是一個特定的框圖和方案,本發(fā)明的意圖和概念仍然適用其它方案。本領域的技術(shù)人員應該清楚,在不背離本發(fā)明主旨和范圍的前提下,可以對所闡述的實施例進行其它修改。
權(quán)利要求
1.一個系統(tǒng),它從節(jié)目中接收輸入信號,并將所述節(jié)目顯示到某種節(jié)目顯示媒體上以呈現(xiàn)給用戶,所述輸入信號帶有大量信息元素,而一個應用可以為這些元素提供擴展信息,所述系統(tǒng)含有一個上下文提取器,用以從所述輸入信號中提取所述大量信息元素中的每一個元素;一個緩沖區(qū),用以接收和保存來自所述上下文提取器的所述每個被提取信息元素;一個用戶界面,以便所述用戶發(fā)出請求,要求接收與至少一個所述信息元素有關的所述擴展信息;以及一個識別處理器,用以接收所述請求,并在所述請求和被所述上下文提取器提取出的所述信息元素之間識別出匹配,而且向所述應用傳送該所述匹配信息,借此所述應用將所述擴展信息顯示到所述顯示媒體上。
2.按照權(quán)利要求1的一個系統(tǒng),其特征在于它還含有一個應用媒體,用來為至少一個所述信息元素提供所述擴展信息。
3.按照權(quán)利要求1的一個系統(tǒng),其特征在于所述識別處理器對至少一個被提取出的所述信息元素進行預處理。
4.按照權(quán)利要求1的一個系統(tǒng),其特征在于所述請求是所述用戶發(fā)出的一個語音請求。
5.按照權(quán)利要求1的一個系統(tǒng),其特征在于所述緩沖區(qū)具有一定存貯容量,一旦所述接收到的信息元素占滿所述存貯容量后,可以通過覆蓋最舊的所述信息元素,將另外接收到的所述信息元素進行保存。
6.按照權(quán)利要求1的一個系統(tǒng),其特征在于從所述輸入信號中提取出的所述大量信息元素形成一個動態(tài)詞典。
7.按照權(quán)利要求1的一個系統(tǒng),其特征在于所述輸入信號含有封閉字幕正文,而所述提取器含有一種裝置用以從所述輸入信號中分離出所述封閉字幕正文,并且所述封閉字幕正文含有所述大量信息元素中的至少一個。
8.按照權(quán)利要求7的一個系統(tǒng),其特征在于所述輸入信號是NTSC類型的電視信號,并且所述封閉字幕正文位于NTSC第21行。
9.按照權(quán)利要求1的一個系統(tǒng),其特征在于它還含有一種裝置,用來為每個被所述上下文提取器提取出的所述信息元素分配一個優(yōu)先級。
10.按照權(quán)利要求9的一個系統(tǒng),其特征在于每個被提取出的所述信息元素在所述緩沖區(qū)中存貯至少一個預定的時間段,并且所述時間段取決于為每個所述被提取信息元素分配的所述優(yōu)先級。
11.一個實時識別系統(tǒng),該系統(tǒng)包含一個裝置,用以從當前信息流中提取目標詞匯;一個緩沖區(qū),當所述目標詞匯被更新時,用以保存所述目標詞匯;一個裝置,使觀看所述當前信息流的用戶可以要求所述目標詞匯表中某個條目的有關附加信息;以及一個識別處理器,用來將所述用戶的請求轉(zhuǎn)換成與所述目標詞匯表匹配的主題。
12.按照權(quán)利要求11的一個系統(tǒng),其特征在于所述當前信息流具有便于觀看的某種格式,并且所述的匹配主題可以被應用識別,系統(tǒng)還包含一種裝置,用來將所述的匹配主題傳送到所述應用;一種裝置,用來從所述應用中檢索所述附加信息;以及一種裝置,用來將適量的所述附加信息以所述可觀看的格式通過檢索到的信號流傳回所述用戶。
13.按照權(quán)利要求11的一個系統(tǒng),其特征在于它還含有一種裝置,為所述用戶顯示至少一部分緩沖區(qū)內(nèi)容,以便所述用戶能夠選擇一個有效的請求。
14.一個動態(tài)詞典,該詞典包含一個帶有大量可識別信息元素的輸入信息流;一個識別器,用以接收所述信息流且識別和選擇所述大量可識別信息元素;以及一個緩沖區(qū),用來保存由所述識別器選定的所述大量可識別信息元素。
15.按照權(quán)利要求14的一個詞典,其特征在于該詞典還含有由所述識別器選定的所述大量可識別信息元素的一個索引。
16.按照權(quán)利要求15的一個詞典,其特征在于所述索引按照字母數(shù)字升序排序。
17.按照權(quán)利要求15的一個詞典,其特征在于該詞典還含有一個菜單顯示裝置,用以顯示所述索引。
18.按照權(quán)利要求14的一個詞典,其特征在于所述緩沖區(qū)具有一定容量,每個所述大量可識別信息元素在所述緩沖區(qū)中存貯至少一個預定的時間段,先接收到的大量信息元素所存貯的時間要比后接收到的大量信息元素長,一旦所述大量可識別信息元素占滿所述存貯容量后,可以通過在覆蓋所述后接收到的大量信息元素之前覆蓋所述先接收到的信息元素,而保存另外接收到的所述大量可識別信息元素。
19.一個與應用交互作用的實時用戶語音識別系統(tǒng),所述應用能夠為大量主題提供附加信息,所述系統(tǒng)含有一種裝置,用來從具有可觀看格式的當前信息流中提取被更新的目標詞匯;一個緩沖區(qū),在所述被更新的目標詞匯經(jīng)過提取后,它用來保存所述被更新的目標詞匯;一種裝置,使正在觀看所述當前信息流的用戶能夠發(fā)出請求,要求得到有關所述被更新的目標詞匯表中至少一個條目的一定數(shù)量附加信息,而該條目最近在所述當前信息流被引用到;一個識別處理器,用于將所述請求轉(zhuǎn)化成一個在所述被更新的目標詞匯表中存在匹配的主題,并且將所述匹配的主題傳送給所述應用;一種裝置,用于從所述應用的所述大量主題中檢索所述一定數(shù)量的附加信息;以及一種裝置,它通過一個經(jīng)檢索得到的信號流以可觀看的格式將所述一定數(shù)量的附加信息發(fā)送給所述用戶。
20.按照權(quán)利要求19的一個識別系統(tǒng),其特征在于它還含有一個數(shù)據(jù)庫應用,該數(shù)據(jù)庫應用能夠為所述大量主題中的至少一個主題提供附加信息。
21.按照權(quán)利要求19的一個識別系統(tǒng),其特征在于所述識別處理器為所述被更新的目標詞匯表中至少一個條目進行預處理。
22.一種識別方法,用于從節(jié)目中接收輸入信號,并將所述節(jié)目顯示到一個節(jié)目顯示媒體上以呈現(xiàn)給用戶,所述輸入信號帶有大量信息元素,而一個應用可以為這些元素提供擴展信息,所述方法含有下面的步驟從所述輸入信號中提取所述大量信息元素中的每一個元素;將所述大量被提取信息元素一一保存在一個緩沖區(qū)中;當所述用戶要求接收與所述大量被提取信息元素中至少一個有關的所述擴展信息時,對此請求作出響應;將所述請求與所述被提取信息元素進行匹配;以及將所述匹配傳送給所述應用,然后,所述應用將所述擴展信息顯示到所述顯示媒體上。
23.按照權(quán)利要求22的一個方法,其特征在于還含有下面的步驟提供一個應用媒體,以便為所述大量信息元素中至少一個提供所述擴展信息。
24.按照權(quán)利要求22的一個方法,其特征在于還含有下面的步驟對至少一個所述被提取信息元素進行預處理。
25.按照權(quán)利要求22的一個方法,其特征在于所述請求的產(chǎn)生和識別來自于所述用戶的語音請求。
26.按照權(quán)利要求22的一個方法,其特征在于所述緩沖區(qū)具有一定的存貯容量,一旦所述接收到的信息元素占滿所述存貯容量時,通過覆蓋正在保存中的最舊信息元素,將另外接收到的所述信息元素進行保存。
27.按照權(quán)利要求22的一個方法,其特征在于還含有下面的步驟用所述節(jié)目中的所述信息元素組成一個動態(tài)詞典。
28.按照權(quán)利要求22的一個方法,其特征在于含有下面的步驟為每個所述被提取信息元素分配一個優(yōu)先級,并且,每個所述被提取信息元素被存貯一個特定的時間段,而所述特定時間段取決于為所述被分配的優(yōu)先級。
29.用以形成實時識別系統(tǒng)的一個方法,該方法含有下面的步驟從當前信息流中提取目標詞匯;當所述詞匯被更新時,將所述目標詞匯保存在緩沖區(qū)中;當用戶請求所述目標詞匯表中某個條目的有關附加信息時,對該請求作出響應;以及對照保存在緩沖區(qū)中的詞匯表,對所述用戶的請求進行匹配。
30.按照權(quán)利要求29的一個方法,其特征在于所述當前流具有可觀看的格式,所述方法還含有下面的步驟將所述匹配主題傳送到一個應用,該應用為所述請求檢索所述附加信息,并通過一個經(jīng)檢索得到的信號流以所述可觀看的格式將檢索出的一定數(shù)量所述附加信息傳回所述用戶。
31.按照權(quán)利要求29的一個方法,其特征在于還含有下面的步驟利用從畫中畫、分隔屏幕、視頻正文和可選圖像這些技術(shù)中選出至少一種手段,將所述附加信息和所述當前流顯示在一起。
32.按照權(quán)利要求29的一個方法,其特征在于還含有下面的步驟至少顯示所述緩沖區(qū)內(nèi)容的一部分,以便所述用戶可以選擇一個有效的請求。
33.按照權(quán)利要求32的一個方法,其特征在于還含有下面的步驟在菜單中顯示所述被選定信息。
34.用以形成動態(tài)詞典的一個方法,該方法含有下面的步驟提供帶有大量可識別信息元素的輸入信息流;識別和選擇所述信息元素;將所述被選定信息元素保存在緩沖區(qū)中。
35.按照權(quán)利要求34的一個方法,其特征在于還含有下面的步驟對所述被選定信息元素編索引。
36.按照權(quán)利要求35的一個方法,其特征在于對所述索引按照字母數(shù)字升序進行排序。
37.按照權(quán)利要求1的一個系統(tǒng),其特征在于利用從畫中畫、分隔屏幕、視頻正文和可選圖像這些技術(shù)中選出至少一種手段,將所述擴充信息和所述節(jié)目顯示在一起。
全文摘要
本發(fā)明提供了一種方法和裝置,使正在觀看和/或收聽節(jié)目的用戶能夠檢索與剛剛看到的某個條目或剛剛聽到的某個單詞相關的輔助信息或輔助娛樂。該裝置含有一個識別系統(tǒng)用來識別用戶的請求并提供解答。根據(jù)從最近接收到的節(jié)目部分中提取出的條目或關鍵字,創(chuàng)建一個動態(tài)變化的詞典。用戶的請求與該不斷變化的詞典進行匹配。一旦識別出請求,將啟動一個搜索,該搜索訪問可滿足該請求的所需信息,將之導入并傳送給用戶。
文檔編號H04N7/173GK1164801SQ9710280
公開日1997年11月12日 申請日期1997年2月24日 優(yōu)先權(quán)日1996年3月7日
發(fā)明者M·H·布羅斯基 申請人:國際商業(yè)機器公司