專利名稱:基于語音輸入的自然語言處理選擇演示廣告的系統(tǒng)和方法
技術領域:
參考圖3,其中示出了根據(jù)本發(fā)明各方面的用于選擇和演 示基于語音輸入的廣告的示例性方法。所述方法可以從操作305開始, 其中可以在語音用戶界面處接收至少包括用戶話語的基于語音的輸 入。語音用戶界面可以包括任何適合的用于接收話語的機構(例如麥 克風),并且顯而易見的是其可以與任何合適的啟用語音的設備通過界 面連接(interface with),該啟用語音的設備包括個人導航設備、個人 數(shù)字助理、媒體設備、遠程信息設備、個人電腦、手機或其它。
0261 之后,在操作310中可以識別包含在語音輸入中的一個或 多個請求。例如,請求可以包括檢索信息、執(zhí)行任務、調(diào)查或收集信 息或者其它與系統(tǒng)或設備交互的請求。例如,對導航設備的語音輸入 可以包括計算路線或檢索基于位置信息的請求。在另一個示例中,對 手機發(fā)出的語音輸入可以包括設置電話呼叫、購買鈴聲或記錄語音備 忘錄的請求。此外,在各種應用中,語音輸入可以包括多個請求、多 模式請求、跨設備請求、跨應用程序請求或其它類型的請求。例如, 在操作305中接收的話語可以是"給我去Chang的餐館的路線,并 且給他們打電話,這樣我能預定座位。,,因此話語可以包括多個請求, 該多個請求包括跨設備請求(例如利用導航設備計算路線,并且利用 手機打電話),以及跨應用請求(例如利用語音搜索引擎搜索地址和/或電話號碼,并且利用導航應用程序計算路線)。
02" 請求可以是用戶與系統(tǒng)或設備之間的會話式交互的 一部 分,由此在當前話語中的請求的解析可以基于在當前會話中的之前的 話語、之前會話中的話語、基于情境的信息、局部的和/或全局的用戶 描述或者其它信息。例如,可以基于包含在之后的請求中的信息再次 解析之前的請求,可以基于包含在之前的請求中的信息解析當前請求, 等等。此外,會話式交互可以是各種形式,包括基于詢問的會話、教 導會話、探索性會話或其它類型的會話。例如,會話式語言處理器可 以識別會話的類型,并且可以相應地從話語中提取信息,以便在操作 310中識別一個或多個請求。此外,會話式語言處理器可以確定任意 請求是否不完整或模糊,并且可以相應釆取行動(例如系統(tǒng)響應可以 提示用戶澄清不完整的和/或模糊的請求)。因此會話式語言處理器可 以利用各種技術識別會話類型、解析話語、識別請求或執(zhí)行其它任務, 例如在前面提到的共同待審的專利申請中所描述的,其中這些申請被 整體結(jié)合于此作為參考。
028
一旦識別了一個或多個請求,就可以在操作315中基于 識別的請求采取行動,同時可以在操作320中選擇一 個或多個廣告(下 文中將詳細描述)。例如,可以在操作315中調(diào)用一個或多個情境適當 的應用程序以服務所述請求(例如語音搜索引擎、導航應用程序、電 子商務應用程序或其它可以基于請求而調(diào)用的應用程序)。此外,在操 作"0中,信息可以被傳達給廣告服務器,以便選擇與所述請求相關 的一個或多個廣告。因此,如圖3中所示,在操作315中釆取行動和 在操作中選擇廣告可以是相關的操作(例如可以選擇廣告以幫助 解析不完整的和/或模糊的請求)。
029
一旦在操作315中釆取行動(例如服務所述請求)并且在 操作320中選擇一個或多個廣告(例如與所述請求相關),則可以在操 作325中向用戶演示輸出。所述輸出可以指示與操作315相關的行動 的結(jié)果。例如,輸出可以包括被請求的信息、被請求任務是否成功完 成的指示、是否需要額外的信息為請求服務(例如包括對信息的提示)或者其它與基于請求做出的行動相關的信息。此外,所述輸出可以包
括廣告,如在操作320中選擇的。例如,所述輸出可以包括基于文本 的、基于圖像的、基于視頻的、基于音頻的或其它類型的廣告,這對 本領域技術人員來說是顯而易見的。此外,所迷輸出可以包括其它類 型的廣告,包括號召行動(例如基于位置的優(yōu)惠券或購買機會、試用 下載或者其它可操作的廣告或營銷)。
030可以聯(lián)系請求基于各種標準來選擇廣告。例如,可以基于 請求的詞語或其它內(nèi)容、涉及請求的詞語或其它內(nèi)容的相關詞語或內(nèi) 容來選擇廣告,等等。在另一個示例中,可以基于被請求的任務/信息 選擇廣告(例如電影放映的請求可能會導致選擇特定影院的廣告)。在 另一個示例中,可以基于與被請求任務/信息相關的主題或類型選擇廣 告(例如,購買機票的請求可以導致選擇與預定航線相關的目的地的 酒店的廣告)。在另一個示例中,可以基于位置信息(例如可以基于利 用導航設備識別的用戶的地理位置附近來選擇廣告)、用戶特定的和/ 或全局的用戶描述(例如可以基于用戶特定的和/或全局的喜好、廣告 商活動標準等選擇廣告)選擇廣告。
031基于語音的輸入的內(nèi)容可以根據(jù)各種標準確定,包括情境 或概念上的信息(例如語義指示符、限定詞或其它信息)。例如,給定 的概念可以包括各種語義上等價的具有相同意思的指示符。因此,例 如,基于語音的輸入可以是"播放歌曲!"、"播放音樂,,或其它變化形 式,其每一個都可以被解析為與特定主題(或概念)"音樂"相關。因 此,請求中的概念或內(nèi)容信息可以用于選擇廣告。例如,用戶可以請 求計算華盛頓州西雅圖市的路線(例如"我如何到達Space Needle ")?;诒徽埱蟮娜蝿盏那榫?例如"導航","西雅圖"等), 語音搜索引擎可以檢索Space Needle的地址,而導航應用程序可以計 算路線。此外,用戶描述信息可以指示用戶正在從城外訪問西雅圖(例 如所述描述可以顯示出用戶的家在Sacramento),因此,可以選擇西 雅圖的流行景點的廣告。在另一個示例中,用戶可以請求與體育事件 相關的信息(例如"給我周日老鷹隊比賽的開場時間")?;诒徽埱笮畔⒌那榫?例如"搜索"、"體育"、"費城"等),可以對被請求的信息重 新進行搜索,同時可選擇老鷹隊的隊服或紀念品的廣告。
032] 在各實例中,包含在請求中或可以從請求中推斷出的概 念、語義指示符、限定詞或其它信息可以指示出請求的探索性質(zhì)。換 句話說,探索性請求可以識別會話的目標,而不是要執(zhí)行的特殊任務 或要檢索的信息。同樣的,在各種應用中,為了使會話朝向所述目標 發(fā)展,可以在操作320中選擇廣告。例如,探索性請求可以包括導航 路線的請求(例如"我想到博物館去,幫我找出一些有趣的東西,,)?;?于被請求任務的情境(例如"導航","景點"等),可以識別會話的目標, 并且可以在操作315中服務所述請求(例如語音搜索引擎可以基于用 戶優(yōu)選的主題定位附近的景點)。此外,廣告應用程序可以在操作320 中選擇適當?shù)膹V告,其中廣告可選擇成嘗試使得所述會話朝向所述目 標發(fā)展。例如,統(tǒng)計學描述(例如用戶描述、全局描述、基于主題的
計或其它特性的其它用戶之間的密切關系。因此,除了在搮作315中 重新檢索有關博物館的信息,還可以在操作320中選擇用戶可能會感 興趣的博物館的廣告。
033在各種實例中,請求可以包括不完整的、模糊的、未能識 別的或其它不充分的語義指示符、情境、限定詞或其它識別所述請求 所需的信息。換句話說,所述請求可以包括要識別的不充分的信息或 者推斷要執(zhí)行的任務、要檢索的信息或會話的目標。因此,可以基于 共享的知識從所述請求中提取和/或推斷出盡可能多的信息,該共享的 知識為比如情境、用戶或全局描述信息、之前的話語、之前的會話等。 同樣的,服務所述請求可以包括生成響應和/或與廣告應用程序通訊, 以便使會話朝向可服務的請求發(fā)展。例如,在操作315中服務所述請
之后的用戶輸入,從而使會話向前發(fā)展。 例如,所述請求可以包括不完整的、模糊的或未能識別的 信息(例如"你知道[含糊的詞語l西雅圖嗎?")??梢宰R別^C請求的任務的情境(例如"西雅圖"),但是被識別的情境不足以合適地采取行動 以服務所述請求??梢曰跁捴兄暗脑捳Z、描述信息或其它信息 推斷出額外的信息。但是,當額外信息不能提供充足的信息以推斷出
合理的假設時,在操作315中服務所述請求可以包括生成響應以進展 之后的用戶輸入并且使會話向前發(fā)展(例如可以基于用戶的優(yōu)選主題 檢索關于各主題的信息)。此外,在操作320中廣告應用程序可以選擇 廣告,以便使會話向前發(fā)展(例如可以基于反映出與西雅圖有關的特 定廣告和用戶喜好、描迷等之間的密切關系的用戶和/或全局描迷來選 擇廣告)。因此,通過選擇廣告、指出廣告不令人滿意的地方或者與廣 告交互,所述交互可以用于為之后的會話過程建立情境和共享的知識。 例如,用戶可以選擇廣告,并且對之后基于語音的輸入的解析(例如"電 話通知他們","價格范圍是多少?"等)可以用基于語音的輸入所涉及 的廣告的共享知識進行解析。因此,廣告可以以使廣告商向消費者推 銷的方式進行使用,同時改進消費者與設備的交互。其它的優(yōu)點對本 領域技術人員來說是顯而易見的。
035顯而易見的是,操作320可以利用各種技術基于語音輸入 和/或包含于語音輸入中的請求選擇廣告。例如,廣告商可以限定目標 觀眾、營銷標準、活動策略、預算限制、概念、語義指示符、相關主 題、類型和/或與廣告相關的任何其它適當?shù)男畔?。例如,廣告商可以 支付額外費用以使一廣告相對于類似廣告(例如與竟爭者相關的廣告) 處于優(yōu)先位置。在另一個示例中,各種統(tǒng)計學描述可以定義廣告、主 題、用戶等之間的密切關系(例如基于點擊率或轉(zhuǎn)換率、或其它追蹤 信息,如下文中將詳細描述的)。因此,可以在操作320中利用各種技 術包括請求的內(nèi)容、與所述請求相關的行為/行動、用戶描述、用戶喜 好、統(tǒng)計規(guī)格、廣告商特定標準來選擇廣告,以使會話向前發(fā)展、解 決模糊的請求,或者利用其它方式,這是顯而易見的。
036在操作325中向用戶演示的輸出可以以各種方式提供給 用戶。例如,在各種應用中,輸出可以包括基于語音或音頻的響應。 在另一個示例中,當相關設備包括顯示設備時,輸出可以顯示在顯示設備上。顯而易見的是,還可以使用上述方式的許多組合或變形,如 利用顯示設備上的信息增強語音響應。例如,用戶可以請求與餐館有 關的信息,廣告可以基于指示出用戶最喜愛某種類型的餐廳的用戶喜 好進行選擇(例如可以基于指示出用戶喜好中餐的用戶描述來選擇中
餐館)。因此,在一個示例中,在操作325中演示的輸出可以顯示與請 求信息匹配的各個餐館的信息,同時可以向用戶演示中餐館的語音廣 告(例如通過麥克風或其它向用戶播放語音的適當?shù)脑O備)。許多其它 的變形也是顯而易見的(例如,可以在顯示設備上顯示圖形廣告,同 時可以以音頻播放對應的或不同的語音廣告)。 可以在操作345中追蹤用戶廣告交互。例如,操作345可 以追蹤與用戶、會話、主題、情境或其它標準有關的歷史數(shù)據(jù),以便 將信息與所選廣告聯(lián)系在 一 起。因此追蹤信息可以用于建立統(tǒng)計學描 述,該統(tǒng)計學描述定義了密切關系、點擊率或轉(zhuǎn)換率,或者其它與各 廣告、主題相關的信息或其它在用戶特定和/或全局用戶水平上的標 準。因此,可以在廣告、主題、概念、統(tǒng)計或其它基于用戶對廣告的行為的標準(例如用戶是否在操作330中與廣告交互)之間生成組或 圖。 本發(fā)明的各方面和實施方式可以被描述為包括特定特征、 結(jié)構或特性,但每個方面或?qū)嵤┓绞蕉疾皇潜仨毎ㄋ鎏囟ㄌ卣鳌?結(jié)構或特性。此外,當將某特定特征、結(jié)構或特性與某一方面或?qū)嵤?方式結(jié)合在一起描述時,應當認為無論是否清楚地加以描述,該特征、 結(jié)構、或特性與其它方面或?qū)嵤┓绞降慕Y(jié)合都是顯而易見。因此,在 不背離本發(fā)明的范圍和精神的前提下可以做出各種變化和修改。說明 書和附圖
應當認為僅僅是示例性的,本發(fā)明的范圍應當根據(jù)所附權利 要求加以確定。
權利要求
1、一種響應基于語音的輸入選擇和演示廣告的方法,所述方法包括接收基于語音的輸入,所述接收到的基于語音的輸入包括請求;基于所述接收到的請求從至少一個知識源中檢索信息;基于所述接收到的請求和所述檢索到的信息選擇廣告;以及向用戶演示所選擇的廣告。
2、 根據(jù)權利要求1所述的方法,其中所述檢索到的信息涉及所述 基于語音的輸入的內(nèi)容、與所述請求相關的行動、所述用戶的位置、 特定用戶描述或全局用戶描述中的一個或多個。
3、 根據(jù)權利要求1所述的方法,其中選擇所述廣告包括當所述接 收到的輸入所包括的信息不足以解決所述請求時識別與解決所述請求 相關的廣告。
4、 根據(jù)權利要求1所述的方法,還包括追蹤所述用戶與所述被演 示的廣告之間的交互。
5、 根據(jù)權利要求4所述的方法,其中所述追蹤用于建立一個或多 個用戶的統(tǒng)計學描述。
6、 根據(jù)權利要求5所述的方法,其中所述統(tǒng)計學描述識別一個或 多個廣告、概念、類型和/或用戶描述之間的密切關系。
7、 根據(jù)權利要求4所述的方法,其中所述追蹤用來建立用于解析 之后的基于語音的輸入的情境。
8、 根據(jù)權利要求4所述的方法,還包括響應所述交互采取行動。
9、 根據(jù)權利要求8所述的方法,其中所述行動包括基于所述交互 執(zhí)行任務和/或檢索信息。
10、 根據(jù)權利要求1所述的方法,其中所述至少一個知識源包括 用戶的一般公共信息和用戶的特定私人信息。
11、 一種用于響應基于語音的輸入選擇和演示廣告的系統(tǒng),所述 系統(tǒng)包4舌至少一個輸入設備,其接收基于語音的輸入,所述接收到的基于語音的輸入包括請求;以及至少一個處理器,其能夠操作以便基于所述接收到的請求從至少 一 個知識源中檢索信息;基于所述接收到的請求和所述檢索到的信息選擇廣告;以及向用戶演示所選擇的廣告。
12、 根據(jù)權利要求11所述的系統(tǒng),其中所述檢索到的信息涉及所述基于語音的輸入的內(nèi)容、與所述請求相關的行動、所述用戶的位置、特定用戶描述或全局用戶描述中的一個或多個。
13、 根據(jù)權利要求11所述的系統(tǒng),其中選擇所述廣告包括當所述接收到的輸入所包括的信息不足以解決所述請求時識別與解決所述請求相關的廣告。
14、 根據(jù)權利要求11所述的系統(tǒng),還包括追蹤所述用戶與所述被演示的廣告之間的交互。
15、 根據(jù)權利要求14所述的系統(tǒng),其中所述追蹤用于建立一個或多個用戶的統(tǒng)計學描述。
16、 根據(jù)權利要求15所述的系統(tǒng),其中所述統(tǒng)計學描述識別一個或多個廣告、概念、類型和/或用戶描述之間的密切關系。
17、 根據(jù)權利要求14所述的系統(tǒng),其中所述追蹤用來建立用于解析之后的基于語音的輸入的情境。
18、 根據(jù)權利要求14所述的系統(tǒng),還包括響應所述交互采取行動。
19、 根據(jù)權利要求18所述的系統(tǒng),其中所述行動包括基于所述交互執(zhí)行任務和/或檢索信息。
20、 根據(jù)權利要求11所述的系統(tǒng),其中所述至少一個知識源包括用戶的 一般公共信息和用戶的特定私人信息。
全文摘要
本發(fā)明提供一種基于語音輸入的自然語言處理選擇和演示廣告的系統(tǒng)和方法。用戶話語可以在輸入設備處被接收,并且會話式自然語言處理器可以識別話語中的請求?;诒蛔R別的請求可以選擇和向用戶演示至少一個廣告。所述廣告可以演示為自然語言響應,因此使廣告的演示生成一種會話式的感覺。可以追蹤所述請求和用戶隨后與廣告的交互,以便建立用戶統(tǒng)計學描述,從而增強之后對廣告的選擇和演示。
文檔編號G06Q30/00GK101689267SQ200880009312
公開日2010年3月31日 申請日期2008年2月6日 優(yōu)先權日2007年2月6日
發(fā)明者M·肯尼威克, T·弗里曼 申請人:沃伊斯博克斯科技公司