專利名稱:確定數(shù)據(jù)意向并基于該意向響應(yīng)數(shù)據(jù)的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及計(jì)算機(jī)系統(tǒng),尤其涉及接收一個(gè)或多個(gè)數(shù)據(jù)集、分析該數(shù)據(jù)以確定對(duì)應(yīng)的意向、并基于該意向執(zhí)行行動(dòng)的系統(tǒng)和方法。
背景技術(shù):
隨著計(jì)算機(jī)和信息系統(tǒng)以及無線和因特網(wǎng)通信等相關(guān)的網(wǎng)絡(luò)技術(shù)的增長(zhǎng),日益增長(zhǎng)的電子信息得以傳遞、傳輸然后由用戶和/或系統(tǒng)處理。作為示例,電子郵件程序已變?yōu)橛?jì)算機(jī)用戶中用于生成和接收這類信息的流行應(yīng)用程序。例如,隨著因特網(wǎng)的出現(xiàn),交換電子郵件已變?yōu)橛绊憺槭裁丛S多人獲得計(jì)算機(jī)的一個(gè)重要因素。在許多企業(yè)環(huán)境內(nèi),電子郵件已變?yōu)橥麻g交換信息的一個(gè)近乎實(shí)際的標(biāo)準(zhǔn)。然而,隨著電子郵件和其它信息傳輸系統(tǒng)的較高的普及度,對(duì)于管理和處理來自多個(gè)來源的越來越多的信息量也開始出現(xiàn)問題。
在這些問題中,許多用戶現(xiàn)在面對(duì)著電子郵件和/或其它信息泛濫,用戶必須對(duì)這些電子郵件和信息進(jìn)行分類和/或響應(yīng),從而使得能夠發(fā)送、接收和處理信息的能力幾乎變成富有成效的障礙。例如,某些用戶報(bào)告每天接收超過100個(gè)電子郵件消息。由于如此大量的電子郵件和其它電子信息,因此變得很難在實(shí)際上不花費(fèi)相當(dāng)多的時(shí)間來對(duì)重要性作出個(gè)人決策的情況下依照什么重要而什么不重要來管理信息。作為這些決策的一個(gè)示例,用戶可能必須判斷是否應(yīng)當(dāng)立即響應(yīng)消息、忽略消息以在稍后閱讀、或由于不重要(如,垃圾郵件)簡(jiǎn)單地刪除消息。
已作出了嘗試來針對(duì)解決這些信息管理問題。例如,已作出了嘗試來縮減用戶接收到的垃圾郵件或促銷電子郵件(如,兜售信息)的量。另外,某些電子郵件程序提供了支配如何在程序內(nèi)管理電子郵件的規(guī)則的生成。例如,一種規(guī)則規(guī)定,“來自各種地址的所有郵件”被放入特殊的文件夾中。這類嘗試一般不針對(duì)電子郵件和其它信息傳輸/接收系統(tǒng)后面的基本問題。即,常規(guī)系統(tǒng)通常促使用戶手動(dòng)細(xì)讀并核查他們所接收的消息中的某些(如果不是全部的話)的至少一部分,以確定哪些消息應(yīng)當(dāng)被審閱或被進(jìn)一步處理。如上所述,這花費(fèi)了更富有成效的活動(dòng)的時(shí)間。因此,對(duì)于接收到的大量信息,需要一種系統(tǒng)和方法以便于對(duì)電子信息進(jìn)行有效的處理,同時(shí)減輕與其相關(guān)聯(lián)的手動(dòng)干預(yù)的成本。
發(fā)明內(nèi)容
以下提出了本發(fā)明的一個(gè)簡(jiǎn)化概述,以提供對(duì)本發(fā)明的某些方面的基本理解。本概述并非本發(fā)明的廣泛綜述。它并非標(biāo)識(shí)本發(fā)明的關(guān)鍵或決定性元素,也并非描繪本發(fā)明的范圍。其唯一的目的是以簡(jiǎn)化的形式提出本發(fā)明的某些概念,作為后文提出的更詳細(xì)描述的序言。
本發(fā)明涉及基于數(shù)據(jù)的意向響應(yīng)所接收的數(shù)據(jù)(如,電子郵件、語音、圖形……)的系統(tǒng)和方法。一般而言,本系統(tǒng)和方法分析并分類所接收的數(shù)據(jù)、提取涉及意向的數(shù)據(jù)和/或丟棄與意向無關(guān)的任何數(shù)據(jù)、以及根據(jù)所提取的數(shù)據(jù)集確定該意向。如果確定意向證明響應(yīng)是正確的,則進(jìn)一步細(xì)察并重新表達(dá)該數(shù)據(jù)以生成指示該意向的描述。這類描述可以例如可視地或可聽地以不同的方式呈現(xiàn)給用戶。此處描述的新穎系統(tǒng)和方法采用了基于淺語言分析(如,功能單詞頻率、語音三元語法的一部分……)和深語言分析(如,無上下文語法產(chǎn)生頻率和從語義圖表導(dǎo)出的特征)的各種特征組合,以產(chǎn)生將短隨機(jī)文本樣本歸于特定來源的提高的準(zhǔn)確度。
在本發(fā)明的一個(gè)方面中,提供了一種確定意向并基于該意向生成行動(dòng)和/或通知的系統(tǒng)。本系統(tǒng)包括一種數(shù)據(jù)管理器,它可采用各種技術(shù)來確定數(shù)據(jù)的相關(guān)聯(lián)意向。在一個(gè)實(shí)例中,該數(shù)據(jù)管理器使用諸如元數(shù)據(jù)、屬性、內(nèi)容、上下文、關(guān)鍵詞、歷史、啟發(fā)、推論、規(guī)則、分界、外來信息(如,數(shù)據(jù)來源、發(fā)送和/或接收數(shù)據(jù)的時(shí)間和星期幾、處理數(shù)據(jù)的成本/收益等)等信息,以將數(shù)據(jù)分組成具有相似特征的一個(gè)或多個(gè)數(shù)據(jù)集。該數(shù)據(jù)管理器可提取涉及意向的數(shù)據(jù)和/或丟棄與意向不相關(guān)的數(shù)據(jù)。指示意向的數(shù)據(jù)可被分析以確定是否響應(yīng)該數(shù)據(jù)。當(dāng)確定應(yīng)當(dāng)提供響應(yīng)時(shí),相應(yīng)的數(shù)據(jù)可被進(jìn)一步細(xì)化(refine)、重新表達(dá)、并用于生成合適的響應(yīng),如自動(dòng)執(zhí)行行動(dòng)和/或通知用戶。該數(shù)據(jù)管理器可包括各種組件,如執(zhí)行接收數(shù)據(jù)的初始分析的分析器;將數(shù)據(jù)分割成各種分組的語法剖析器;將數(shù)據(jù)縮減到涉及意向的數(shù)據(jù)集的提取器;從縮減的數(shù)據(jù)集生成意向的分類器;確定意向是否證明響應(yīng)是正確的的決策組件(閾值器);以及執(zhí)行相關(guān)的行動(dòng)和/或通知用戶的行動(dòng)引擎。
以下描述和附圖詳細(xì)地陳述了本發(fā)明的某些方面。然而,這些方面僅表明了可采用本發(fā)明的原理的各種方法中的幾種,并且本發(fā)明并不旨在包括所有這樣的方面及其等效方面。當(dāng)結(jié)合附圖考慮時(shí),從以下本發(fā)明的詳細(xì)描述中,本發(fā)明的其它優(yōu)點(diǎn)和新穎特征將變得顯而易見。
圖1示出了接收數(shù)據(jù)、確定數(shù)據(jù)的意向、并生成對(duì)應(yīng)的行動(dòng)和/或通知的示例性系統(tǒng)。
圖2示出了確定意向并生成對(duì)應(yīng)的行動(dòng)和/或通知的示例性數(shù)據(jù)管理器。
圖3示出了與便于確定意向并生成對(duì)應(yīng)的行動(dòng)和/或通知的數(shù)據(jù)管理器相關(guān)聯(lián)的多個(gè)示例性實(shí)體。
圖4示出了確定數(shù)據(jù)意向并自動(dòng)向用戶呈現(xiàn)意向描述的示例性流程圖。
圖5示出了確定數(shù)據(jù)意向并自動(dòng)向用戶呈現(xiàn)所接收的數(shù)據(jù)的意向的描述的示例性方法。
圖6示出了一個(gè)示例性數(shù)據(jù)管理器,它與多個(gè)實(shí)體通信以便于提前(proactive)測(cè)量,來減輕與關(guān)于數(shù)據(jù)的不作為(inaction)相關(guān)聯(lián)的負(fù)面結(jié)果。
圖7示出了采用智能來便于確定意向的示例性數(shù)據(jù)管理器。
圖8示出了基于數(shù)據(jù)意向自動(dòng)響應(yīng)數(shù)據(jù)的示例性方法。
圖9示出了可依照本發(fā)明的一個(gè)方面采用的一個(gè)示例性圖形用戶界面。
圖10示出了依照本發(fā)明的一個(gè)方面的一個(gè)示例性圖形用戶界面,它描述了標(biāo)識(shí)的電子郵件、電子郵件中選擇的文本和與意向相關(guān)的數(shù)據(jù)。
圖11示出了依照本發(fā)明的一個(gè)方面用于選擇要添加到任務(wù)列表的任務(wù)的一個(gè)示例性圖形用戶界面。
圖12示出了一個(gè)示例性意向分析系統(tǒng)。
圖13示出了一個(gè)示例性聯(lián)網(wǎng)環(huán)境,其中可采用本發(fā)明的新穎方面。
圖14示出了一個(gè)示例性操作環(huán)境,其中可采用本發(fā)明的新穎方面。
具體實(shí)施例方式
本發(fā)明涉及確定數(shù)據(jù)意向的系統(tǒng)和方法。這類意向可通過分析和歸類數(shù)據(jù)、從歸類的數(shù)據(jù)中提取特征、以及基于特征分類數(shù)據(jù)來確認(rèn)、推斷或預(yù)測(cè)意向來確定。標(biāo)識(shí)了意向的數(shù)據(jù)然后可被轉(zhuǎn)換成可提供給用戶的一種表達(dá)形式。
如本申請(qǐng)中所使用的,術(shù)語“組件”、“系統(tǒng)”、“引擎”等指的是計(jì)算機(jī)相關(guān)的實(shí)體,無論是硬件、硬件和軟件的組合、軟件還是執(zhí)行中的軟件。例如,組件可以是,但不限于,運(yùn)行在處理器上的進(jìn)程、處理器、對(duì)象、可執(zhí)行碼、執(zhí)行線程、程序和/或計(jì)算機(jī)。作為說明,運(yùn)行在服務(wù)器上的應(yīng)用程序和服務(wù)器都可以是組件。一個(gè)或多個(gè)組件可駐留在進(jìn)程和/或執(zhí)行線程中,并且組件可位于一個(gè)計(jì)算機(jī)上和/或在兩個(gè)或多個(gè)計(jì)算機(jī)之間分布。
另外,術(shù)語“推斷”一般指從一組通過事件和/或數(shù)據(jù)捕捉的觀察中推理或推斷系統(tǒng)、環(huán)境和/或用戶的狀態(tài)的過程。例如,推斷可用于標(biāo)識(shí)特定的上下文或行動(dòng),或可生成狀態(tài)的概率分布。推斷可以是概率性的—即,基于數(shù)據(jù)和事件的考慮計(jì)算感興趣的狀態(tài)的概率分布。推斷也可以指用于從一組事件和/或數(shù)據(jù)組成更高級(jí)事件的技術(shù)。這類推斷導(dǎo)致從一組觀察的事件和/或儲(chǔ)存的事件數(shù)據(jù)構(gòu)造新的事件或行動(dòng),無論事件是否在相鄰的時(shí)間上相關(guān),也無論事件是否來自一個(gè)或若干個(gè)事件和數(shù)據(jù)源。
本發(fā)明參考附圖來描述,貫穿整個(gè)附圖,相同的標(biāo)號(hào)用于指相同的元素。在以下描述中,為解釋目的,陳述了眾多特定細(xì)節(jié)以提供對(duì)本發(fā)明的徹底理解。然而,很明顯,本發(fā)明可以不采用這些特定細(xì)節(jié)來實(shí)施。在其它實(shí)例中,以框圖的形式示出眾所周知的結(jié)構(gòu)和設(shè)備,以便于描述本發(fā)明。
圖1示出了確定意向并基于意向生成行動(dòng)和/或通知的系統(tǒng)100。系統(tǒng)100包括數(shù)據(jù)管理器110和接口組件120。數(shù)據(jù)管理器110通過接口組件120接收數(shù)據(jù)之后,可采用各種技術(shù)來確定數(shù)據(jù)的相關(guān)意向。在一個(gè)實(shí)例中,數(shù)據(jù)管理器110使用與數(shù)據(jù)相關(guān)聯(lián)的信息,如元數(shù)據(jù)、屬性、內(nèi)容、上下文、關(guān)鍵詞、歷史、啟發(fā)、推論、規(guī)則、分界等,以將數(shù)據(jù)分組成一個(gè)或多個(gè)數(shù)據(jù)集,其中,相應(yīng)的集具有相似的特征。這類數(shù)據(jù)集可被進(jìn)一步處理以提高決策分辨率(decision resolution)或粒度。數(shù)據(jù)管理器110可從結(jié)果集中提取信息并使用所提取的信息來對(duì)意向進(jìn)行譯碼。
數(shù)據(jù)管理器110可分析意向來確定是否響應(yīng)該數(shù)據(jù)。當(dāng)確定應(yīng)當(dāng)提供響應(yīng)時(shí),相應(yīng)的數(shù)據(jù)集可被進(jìn)一步細(xì)化并用于生成合適的響應(yīng)。合適的響應(yīng)包括例如自動(dòng)執(zhí)行行動(dòng)和/或通知用戶。自動(dòng)響應(yīng)可包括回答問題、提供請(qǐng)求的信息、激活設(shè)備、調(diào)度會(huì)議、重新組織(recast)工程等等,通知用戶可包括將項(xiàng)目插入到用戶時(shí)間表、向用戶提供要完成的事情、聯(lián)系用戶(如尋呼機(jī)、蜂窩電話、手持式設(shè)備……)等等的清單。另外,用戶通知可被傳送到一消息通信服務(wù)和/或儲(chǔ)存在存儲(chǔ)器中用于排隊(duì)和/或隨后由用戶察看。
接口組件120可用于將數(shù)據(jù)管理器110耦合至本質(zhì)上發(fā)送數(shù)據(jù)的任何實(shí)體。例如,接口組件120可將數(shù)據(jù)管理器110耦合至電子郵件系統(tǒng)、文字處理程序、語音捕捉應(yīng)用程序、電話系統(tǒng)、視頻記錄器/播放器等等。由此,數(shù)據(jù)可以是例如電子郵件、文檔、語音和圖像的形式,并以不同形式被格式化(如結(jié)構(gòu)化和未結(jié)構(gòu)化)。此外,數(shù)據(jù)可被發(fā)送到接口組件120和/或由數(shù)據(jù)管理器110通過接口組件120接收。這類數(shù)據(jù)可被直接傳送到接口組件120和/或被儲(chǔ)存(如,本地或遠(yuǎn)程)并隨后提供給接口組件120。在另一實(shí)例中,接口組件120可從來源檢索數(shù)據(jù)和/或?qū)⑿盘?hào)發(fā)送到來源以指示它可用于接收數(shù)據(jù)。此外,這類傳送可以通過例如硬布線和/或無線網(wǎng)絡(luò)和/或總線通信信道來進(jìn)行。
圖2示出了依照本發(fā)明的一個(gè)方面的數(shù)據(jù)管理器110。如圖所示,數(shù)據(jù)管理器110可包括意向確定組件210、存儲(chǔ)組件220、決策制定組件230和行動(dòng)引擎240。意向確定組件210可接收諸如電子郵件、消息、文檔、音頻、圖形等數(shù)據(jù)。例如,這類數(shù)據(jù)可作為一個(gè)或多個(gè)數(shù)據(jù)字符組(burst)、數(shù)據(jù)流、多個(gè)數(shù)據(jù)分組來提供,并例如在包封(envelope)內(nèi)被加密、編碼、壓縮和/或調(diào)制。另外,這類數(shù)據(jù)可被保存在存儲(chǔ)組件220中。保存的數(shù)據(jù)可用于生成統(tǒng)計(jì)和/或訓(xùn)練集、提供臨時(shí)存儲(chǔ)、和/或維護(hù)副本以便于數(shù)據(jù)誤差校驗(yàn)和誤差恢復(fù)。
意向確定組件210可采用各種技術(shù)來確定數(shù)據(jù)的相關(guān)意向。例如,意向確定組件210可基于元數(shù)據(jù)、數(shù)據(jù)內(nèi)的位置、內(nèi)容、上下文、關(guān)鍵詞、歷史、啟發(fā)、推論、規(guī)則、分界等對(duì)數(shù)據(jù)進(jìn)行歸類。另外,諸如數(shù)據(jù)源、發(fā)送和/或接收數(shù)據(jù)的時(shí)間和/或星期幾、處理數(shù)據(jù)的成本/收益等外部信息可使用以便于歸類數(shù)據(jù)。意向確定組件210可細(xì)察所歸類的數(shù)據(jù)以確定數(shù)據(jù)意向??梢岳斫?,這類意向可以是做某些事情(如,執(zhí)行某些行動(dòng))或不做事情(如,與無關(guān)緊要的信息相關(guān)聯(lián)的數(shù)據(jù))的意向。
在確定了意向之后,數(shù)據(jù)或其子集、分析和/或意向可被保存在存儲(chǔ)組件220,和/或提供給決策制定組件230。意向本質(zhì)上可以用任何已知的格式來表示。例如,意向可作為二進(jìn)制指示符、灰度級(jí)值、百分比、置信度等級(jí)、和/或概率來提供。決策制定組件230可確定意向是否證明響應(yīng)是正確的。例如,決策制定組件230可使用閾值來與意向進(jìn)行比較。閾值可以是用戶定義的、默認(rèn)的和/或基于過去的用戶響應(yīng)自動(dòng)設(shè)置的。另外,閾值可被手動(dòng)和/或自動(dòng)地實(shí)時(shí)(動(dòng)態(tài)地)調(diào)整,以適應(yīng)各種用戶和/或環(huán)境。此外,閾值可基于推論、預(yù)測(cè)、概率等來設(shè)置。
如果在評(píng)估了意向之后確定不需要任何進(jìn)一步的行動(dòng),則數(shù)據(jù)可被丟棄或轉(zhuǎn)發(fā)到其目的地。如果確定需要響應(yīng),則數(shù)據(jù)、意向和/或任何相關(guān)聯(lián)的信息可被傳送到行動(dòng)引擎240。所傳送的信息可被進(jìn)一步分析并被轉(zhuǎn)換成一種語言表示,它可用于生成描述。這類描述可用于自動(dòng)響應(yīng)和/或通過可視和/或可聽通知來通知用戶。
圖3示出了依照本發(fā)明的一個(gè)方面的數(shù)據(jù)管理器110。數(shù)據(jù)管理器110包括意向確定組件210、存儲(chǔ)組件220、決策制定組件230和行動(dòng)引擎240。在本示例中,意向確定組件210包括以下組件分析器310;語法剖析器320、提取器330;分類器340。發(fā)送到數(shù)據(jù)管理器110的諸如電子郵件、消息、文檔、音頻、圖形等的數(shù)據(jù)可由分析器310和/或存儲(chǔ)組件220接收。這類數(shù)據(jù)可通過如上所述的各種技術(shù)和格式來提供。分析器310可細(xì)察和歸類數(shù)據(jù)(如,語法剖析成相應(yīng)的貯存結(jié)構(gòu)(bin))。這一歸類可包括在標(biāo)題、正文、稱呼等之間區(qū)分。分析器310可基于元數(shù)據(jù)、數(shù)據(jù)中數(shù)據(jù)子集的位置、內(nèi)容、上下文、關(guān)鍵詞、歷史、啟發(fā)、推論、規(guī)則、分界、外來信息(如數(shù)據(jù)源、發(fā)送和/或接收數(shù)據(jù)的時(shí)間和/或星期幾、處理數(shù)據(jù)的成本/收益等)等對(duì)數(shù)據(jù)進(jìn)行歸類。
語法剖析器320可細(xì)察歸類的數(shù)據(jù)并將數(shù)據(jù)分割成邏輯結(jié)構(gòu),如串、單詞、句子、段落……。類似于分析器310,語法剖析器320可使用諸如元數(shù)據(jù)、數(shù)據(jù)內(nèi)數(shù)據(jù)子集的位置、內(nèi)容、上下文、關(guān)鍵詞、歷史、啟發(fā)、推論、規(guī)則、分界和/或其它準(zhǔn)則來提高決策分辨率或細(xì)化決策粒度。對(duì)于相應(yīng)的結(jié)構(gòu),提取器330可提取特征。
特征可被傳送到分類器340,它可確定意向。這類意向可以是做某些事情(如,執(zhí)行某些行動(dòng))或不做事情(如,與無關(guān)緊要的信息相關(guān)聯(lián)的數(shù)據(jù))的意向,并可作為例如二進(jìn)制指示符(如,“是”或“否”,“1”或“0”)、滑動(dòng)標(biāo)尺、百分比、置信度等級(jí)和/或概率來提供??梢岳斫?,分類器可以是任一分類器,如支持矢量機(jī)、貝葉斯規(guī)則、經(jīng)驗(yàn)工程師分類器……。訓(xùn)練集可被手動(dòng)和/或自動(dòng)生成,并在訓(xùn)練時(shí)間用于訓(xùn)練分類器。另外,分類器可在運(yùn)行時(shí)間被動(dòng)態(tài)地更新。在本發(fā)明的一個(gè)方面,訓(xùn)練集至少包括涉及數(shù)據(jù)屬性和語言結(jié)構(gòu)的信息。
如上所述,意向可被提供給決策組件230,它可將意向與閾值相比較。對(duì)于非二進(jìn)制標(biāo)記,閾值可被定義并用于呈現(xiàn)諸如響應(yīng)或不響應(yīng)的決策。對(duì)于非二進(jìn)制決策,可考慮各種情況來確定適當(dāng)?shù)慕刂裹c(diǎn)(cut-off point)。例如,一個(gè)用戶可判斷較佳的是選擇謹(jǐn)慎的做法并令系統(tǒng)在具有應(yīng)當(dāng)執(zhí)行行動(dòng)的微小機(jī)會(huì)時(shí)響應(yīng),而另一用戶可判斷響應(yīng)的成本超過了丟棄數(shù)據(jù)的成本。
如果在評(píng)估意向之后確定不需要任何進(jìn)一步的行動(dòng),則數(shù)據(jù)可被丟棄或轉(zhuǎn)發(fā)到其目的地。如果確定需要響應(yīng),則數(shù)據(jù)、意向和/或任何相關(guān)聯(lián)的信息可被傳送到行動(dòng)引擎240,在那里它可被重新表達(dá)。例如,數(shù)據(jù)可被進(jìn)一步處理、轉(zhuǎn)換成邏輯表示、并用于生成描述。這類重新表達(dá)的數(shù)據(jù)可以是單詞、段落、片斷句子等的形式,并用于自動(dòng)響應(yīng)或通過可視和/或可聽通知來通知用戶。
圖4-5分別示出了依照本發(fā)明的流程圖和方法。盡管為解釋簡(jiǎn)明性的目的,流程圖和方法被描述為一系列動(dòng)作,然而可以理解和明白,本發(fā)明不受動(dòng)作的順序所限制,因?yàn)橐勒毡景l(fā)明,某些動(dòng)作可以不同的順序和/或與此處所示出并描述的其它動(dòng)作一起發(fā)生。此外,并非需要所有示出的動(dòng)作來實(shí)現(xiàn)依照本發(fā)明的流程圖和方法。本發(fā)明可以在諸如由一個(gè)或多個(gè)組件執(zhí)行的程序模塊等計(jì)算機(jī)可執(zhí)行指令的通用上下文中描述。一般而言,程序模塊包括例程、程序、對(duì)象、數(shù)據(jù)結(jié)構(gòu)等,它們執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。通常,如各種實(shí)施例中所需要的,程序模塊的功能可被組合或分布。
圖4示出了依照本發(fā)明的示例性流程圖400。在標(biāo)號(hào)410處,確定是否存在數(shù)據(jù)。如果不存在,則系統(tǒng)繼續(xù)等待??梢岳斫猓到y(tǒng)可周期性地輪詢數(shù)據(jù)和/或可在數(shù)據(jù)已準(zhǔn)備好被傳送時(shí)通知系統(tǒng)。如果確定數(shù)據(jù)可用,則在420,從數(shù)據(jù)中獲取一個(gè)或多個(gè)特征集。另外,特征可基于元數(shù)據(jù)、內(nèi)容、上下文、關(guān)鍵詞、歷史、啟發(fā)、推論、規(guī)則、分界、外來信息(如,數(shù)據(jù)源、發(fā)送和/或接收數(shù)據(jù)的時(shí)間和/或星期幾、處理數(shù)據(jù)的成本/收益等)等來提取。
在標(biāo)號(hào)430處,特征可被傳送到一機(jī)器學(xué)習(xí)的分類器以確定意向。這類意向可以是做某些事情(如,執(zhí)行某些行動(dòng))或不做事情(如,與無關(guān)緊要的信息相關(guān)聯(lián)的數(shù)據(jù))的意向。在440,如果確定意向不需要任何進(jìn)一步的行動(dòng),則系統(tǒng)轉(zhuǎn)移回到410處的空閑或等待狀態(tài)。然而,如果在440確定需要進(jìn)一步行動(dòng),則在450重新表達(dá)數(shù)據(jù)。這一重新表達(dá)可包括進(jìn)一步細(xì)化數(shù)據(jù)和生成用于通知用戶的數(shù)據(jù)。在標(biāo)號(hào)460處,可以例如圖形用戶界面和/或音頻信息向用戶呈現(xiàn)這類數(shù)據(jù)。
圖5示出了依照本發(fā)明的一個(gè)方面的示例性方法500。在標(biāo)號(hào)505處,獲取諸如電子郵件、消息、文檔、音頻、圖形等數(shù)據(jù)。在510,細(xì)察并歸類數(shù)據(jù)。這樣歸類可包括基于元數(shù)據(jù)、數(shù)據(jù)內(nèi)數(shù)據(jù)子集的位置、內(nèi)容、上下文、關(guān)鍵字、歷史、啟發(fā)、推論、規(guī)則、分界、外來信息(如數(shù)據(jù)源、發(fā)送和/或接收數(shù)據(jù)的時(shí)間和/或星期幾、處理數(shù)據(jù)的成本/收益等)等在標(biāo)題、正文、稱呼之間區(qū)分。在515,歸類的數(shù)據(jù)被語法剖析成語言結(jié)構(gòu)(如,串、單詞、句子、段落……),并被進(jìn)一步描繪以達(dá)到更大的分辨率。這類細(xì)化可通過元數(shù)據(jù)、數(shù)據(jù)內(nèi)數(shù)據(jù)子集的位置、內(nèi)容、上下文、關(guān)鍵詞、歷史、啟發(fā)、推論、規(guī)則、分界和/或其它準(zhǔn)則來促進(jìn),以提高決策分辨率或細(xì)化決策粒度。
在520,可從相應(yīng)的結(jié)構(gòu)中提取特征。特征可用于訓(xùn)練確定意向的分類器。合適的分類器包括例如支持矢量機(jī)、貝葉斯分類器、經(jīng)驗(yàn)工程師分類器。在標(biāo)號(hào)525處,分類器確定意向。在530,可確定是否存在做某些事情的意向或僅是一空閑意向。這類確定可以基于與預(yù)定閾值的比較。如果在530確定不需要任何進(jìn)一步的行動(dòng),則數(shù)據(jù)可被丟棄或轉(zhuǎn)發(fā)到其目的地。如果在530確定需要響應(yīng),則在535,數(shù)據(jù)、意向和/或任何相關(guān)聯(lián)的信息可用于生成邏輯形式。在540,可基于該邏輯形式生成描述。在545,可通過一用戶界面向用戶呈現(xiàn)該描述。
圖6示出了依照本發(fā)明的一個(gè)方面的數(shù)據(jù)管理器600。數(shù)據(jù)管理器600包括數(shù)據(jù)接收組件610,它接收包括內(nèi)容的項(xiàng)目(例如數(shù)據(jù))以及外來數(shù)據(jù)/證據(jù)。提取組件620例如部分地基于外來數(shù)據(jù)/證據(jù)對(duì)接收的項(xiàng)目進(jìn)行語法剖析。提取組件620為方便數(shù)據(jù)管理器600,移除與項(xiàng)目相關(guān)聯(lián)的無關(guān)特征,以將項(xiàng)目重新表達(dá)為項(xiàng)目意向上的匯聚的一部分。數(shù)據(jù)存儲(chǔ)630可儲(chǔ)存來自接收組件610和/或提取組件620的信息,以及規(guī)則、表格、索引、算法、歷史數(shù)據(jù)、模式等等,以便于依照本發(fā)明確定、推斷和/或預(yù)測(cè)意向,以及采取行動(dòng)、調(diào)度行動(dòng)、不采取行動(dòng)等等。例如,數(shù)據(jù)管理器600可方便采取提前的措施以減輕與項(xiàng)目的無行動(dòng)相關(guān)聯(lián)的負(fù)面結(jié)果。
更具體地,數(shù)據(jù)管理器600可對(duì)與項(xiàng)目相關(guān)聯(lián)的內(nèi)容進(jìn)行語法剖析-內(nèi)容可以是文本、音頻、圖形等—并使用各種技術(shù)(語言處理程序、圖像識(shí)別、語音識(shí)別……)來標(biāo)識(shí)內(nèi)容的無關(guān)特征并移除它們和/或減去它們,作為匯聚在項(xiàng)目意向上的重新表達(dá)過程的一部分。例如,數(shù)據(jù)管理器600可標(biāo)識(shí)或推斷對(duì)應(yīng)于任務(wù)的項(xiàng)目并修剪去無關(guān)特征。作為重新表達(dá)過程的一部分,例如,代名詞可被重寫為名字或其它明確的引用,而隱含日期(“明天”、“下周”)可被重寫為明確日期(“2005年2月20日)。數(shù)據(jù)管理器600理解語言和/或語言的語義,作為執(zhí)行邏輯重建的一部分。數(shù)據(jù)管理器600可包括關(guān)于理解語言和/或內(nèi)容語義的分類器或其它機(jī)器學(xué)習(xí)系統(tǒng)。
由此,數(shù)據(jù)管理器600一種豐富的分析系統(tǒng),它將特征提取與內(nèi)容的語言理解相結(jié)合,以確定、推斷和/或預(yù)測(cè)項(xiàng)目意向。依照數(shù)據(jù)管理器600的一個(gè)具體的示例性實(shí)現(xiàn),可采用一種結(jié)合重新表達(dá)對(duì)項(xiàng)目進(jìn)行語法剖析以匯聚在意向上的真實(shí)自然語言處理程序-邏輯構(gòu)造。重新表達(dá)可用于將意向重新轉(zhuǎn)換成另一語言以及不同的格式,用于傳送意向(如,通過基于圖形的消息)。此外,數(shù)據(jù)管理器600可基于確定的意向采取行動(dòng)(如,優(yōu)先化、日程安排、自動(dòng)化行動(dòng)……)。
數(shù)據(jù)管理器600可使用關(guān)于重新表達(dá)的外來證據(jù)(如,發(fā)送者、時(shí)間、附件、共同接收者、緊急度……)。此外,數(shù)據(jù)管理器600可采用基于n語法(n-gram-based)的分析類型,以及采用相關(guān)特征的分析類型的關(guān)系,并將項(xiàng)目的內(nèi)容精煉成例如單個(gè)語句,并通過單個(gè)語句(如,彈出泡)傳送這樣意向。更具體地,一旦確定了意向,意向可以一種非常精簡(jiǎn)的方式(如,提要、大綱、圖標(biāo)、基于圖形的意向傳送-圖片、顏色……)來傳送。
數(shù)據(jù)管理器600還包括上下文組件640,它提供了結(jié)合本發(fā)明選擇性地確定關(guān)于項(xiàng)目數(shù)據(jù)的上下文。例如,映射組件650方便將意向映射到任務(wù)或行動(dòng)。映射組件650也可通過擔(dān)當(dāng)數(shù)據(jù)的預(yù)過濾器以便于依照本發(fā)明的分類。通知組件660向個(gè)人、計(jì)算機(jī)或系統(tǒng)提供關(guān)于意向分析和數(shù)據(jù)管理器600依照意向分析的推薦的通知。可以理解,數(shù)據(jù)管理器600可與多個(gè)實(shí)體670(如,個(gè)人、組、設(shè)備、計(jì)算機(jī)、系統(tǒng)……)就意向分析進(jìn)行通信,其中,數(shù)據(jù)可從實(shí)體接收以及被發(fā)送到實(shí)體。
圖7示出了依照本發(fā)明具有影響各種功能的組件的數(shù)據(jù)管理器600。人工智能(AI)組件710能夠?qū)崿F(xiàn)依照本發(fā)明的各種自動(dòng)化功能。AI組件710可采用關(guān)于確定、推斷、診斷、預(yù)兆和預(yù)測(cè)的分類器??梢岳斫?,依照本發(fā)明的各方面的分類可采用概率性和/或基于統(tǒng)計(jì)的分析(如,分解成分析效用和成本),以預(yù)測(cè)或推斷用戶希望自動(dòng)執(zhí)行的行動(dòng)。分類器可以是將輸入屬性矢量x=(x1,x2,x3,…,xn)映射到輸入屬于類的置信度的函數(shù)—即,f(x)=conficence(class)。例如,可采用支持矢量機(jī)(SVM)分類器-SVM一般通過找出在多維特征空間中將正例(positive example)從負(fù)例(negative example)中分離出的超平面(hyper plane)來運(yùn)作。包括,例如,單純貝葉斯、貝葉斯網(wǎng)絡(luò)、決策樹以及提供不同獨(dú)立性模式的概率性分類模型的其它專用和非專用模型分類方法也可被采用。此處所使用的分類也包括用于開發(fā)優(yōu)先級(jí)模型的統(tǒng)計(jì)回歸。數(shù)據(jù)管理器600也包括關(guān)于本發(fā)明的各種通信方面的web服務(wù)器720、電子郵件服務(wù)器730和無線收發(fā)器740,以及存儲(chǔ)器750、電源760和處理器770。
圖8示出了依照本發(fā)明的方法800。盡管為解釋的簡(jiǎn)明性目的,方法被示出并描述為一系列動(dòng)作,然而可以理解和明白,本發(fā)明不受動(dòng)作的順序所限制,因?yàn)橐勒毡景l(fā)明,某些動(dòng)作可以不同的順序和/或與此處所示出并描述的其它動(dòng)作一起發(fā)生。此外,并非需要所有示出的動(dòng)作來實(shí)現(xiàn)依照本發(fā)明的方法。本發(fā)明可以在諸如由一個(gè)或多個(gè)組件執(zhí)行的程序模塊等計(jì)算機(jī)可執(zhí)行指令的通用上下文中描述。一般而言,程序模塊包括例程、程序、對(duì)象、數(shù)據(jù)結(jié)構(gòu)等,它們執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。通常,如各種實(shí)施例中所需要的,程序模塊的功能可被組合或分布。
前進(jìn)到圖8,在810,接收數(shù)據(jù)。在820,標(biāo)識(shí)數(shù)據(jù)的相關(guān)特征并對(duì)其進(jìn)行語法剖析。在參考標(biāo)號(hào)830處,分析經(jīng)語法剖析的內(nèi)容,并執(zhí)行內(nèi)容的重新表達(dá)以匯聚在意向上。這一重新表達(dá)可包括例如語言分析以及特征分析。在840,基于重新表達(dá)確定要采取的最優(yōu)行動(dòng)。例如,數(shù)據(jù)可被移動(dòng)到一特定文件夾,或者如果項(xiàng)目對(duì)應(yīng)于任務(wù),則可執(zhí)行進(jìn)一步的重新表達(dá)以確定、推斷和/或預(yù)測(cè)要執(zhí)行的任務(wù)以及要采取的必要行動(dòng)(如,對(duì)會(huì)議進(jìn)行日程安排、發(fā)送電子郵件、通知某人、發(fā)送文檔、取消會(huì)議……)。在參考標(biāo)號(hào)850處,執(zhí)行合適的行動(dòng)。
圖9-11示出了方便此處描述的本發(fā)明的示例性用戶界面。如上文詳細(xì)討論的,在接收數(shù)據(jù)之后,可確定意向并執(zhí)行對(duì)應(yīng)的行動(dòng)。作為示例,在接收電子郵件消息之后,可執(zhí)行電子郵件的表面分析以區(qū)別電子郵件中的各部分。例如,電子郵件可通過以下來描繪標(biāo)題、消息正文和轉(zhuǎn)發(fā)的部分。所標(biāo)識(shí)的消息正文可由句子分隔。對(duì)于相應(yīng)的句子,可提取特征并由機(jī)器學(xué)習(xí)分類器進(jìn)行處理,以獲取對(duì)句子是“任務(wù)”的概率的估算。如果句子是“任務(wù)”,則可分析該句子以產(chǎn)生一邏輯形式。邏輯形式可被轉(zhuǎn)換并用于生成“任務(wù)”描述,它可通過一用戶界面呈現(xiàn)給用戶。這樣呈現(xiàn)可通過將其自動(dòng)添加到用戶任務(wù)列表來發(fā)生。圖9描述了用于這一電子郵件系統(tǒng)的示例性用戶界面900。圖10在1010示出了(如此處所描述)已被標(biāo)識(shí)的各種電子郵件。另外,圖10在1020示出了電子郵件內(nèi)的加亮數(shù)據(jù),并在1030示出了提取并重新表達(dá)的數(shù)據(jù)(如,串)。圖11示出了通過由用戶選擇的重新表達(dá)的數(shù)據(jù)和/或自動(dòng)填充的任務(wù)列表。
圖12提供了示出本發(fā)明的各種訓(xùn)練和運(yùn)行時(shí)間方面的示例。在1200和1210,分別接收電子郵件句子和新電子郵件句子。在1220,通過手動(dòng)和/或自動(dòng)技術(shù)從接收的電子郵件生成已注釋數(shù)據(jù)集。在1230,將訓(xùn)練集饋送到一機(jī)器學(xué)習(xí)算法,它用于構(gòu)造一機(jī)器學(xué)習(xí)分類器。在1240,機(jī)器學(xué)習(xí)分類器采用該算法來提供所接收的數(shù)據(jù)包括任務(wù)的概率(如,P(Task))。如果在1240,概率超出預(yù)定的閾值,則在1270,重新表達(dá)電子郵件并將其自動(dòng)添加到用戶的任務(wù)列表。
以下段落示出了依照本發(fā)明的各方面的示例性訓(xùn)練和運(yùn)行時(shí)間技術(shù)。
示例性特征提取在訓(xùn)練時(shí)間和運(yùn)行時(shí)間,電子郵件消息可被類似地處理。例如,此處所描述的系統(tǒng)可標(biāo)識(shí)電子郵件的標(biāo)題、轉(zhuǎn)發(fā)的部分以及消息正文。在一個(gè)實(shí)例中,標(biāo)題可通過搜索諸如“到(To)”、“抄送(CC)”、“自(From)”和“Subject(主題)”等關(guān)鍵詞來標(biāo)識(shí)。轉(zhuǎn)發(fā)的部分可通過搜索諸如初始行(line-initial)“>”符號(hào)的存在等表達(dá)式,或標(biāo)識(shí)通常在諸如“原始消息(Original Message)”等文本之后的資料來標(biāo)識(shí)。消息正文可通過搜索例如被定義為不是標(biāo)題或轉(zhuǎn)發(fā)的部分的任何內(nèi)容的消息新內(nèi)容來標(biāo)識(shí)。
在接收這類信息之后,可獲得一些特征。例如,可獲得諸如收件人數(shù)量、消息總的大小、消息優(yōu)先級(jí)以及消息是否具有附件等信息。另外,消息正文可使用任一已知的句子分隔器分割成句子。對(duì)于正文中相應(yīng)的句子,可構(gòu)建一特征矢量,其中,該特征矢量可包括所提取的消息級(jí)特征和所標(biāo)識(shí)的句子的顯著特征。這類信息可指示句子是否看似為發(fā)送者名字或發(fā)送者名字的縮寫,以及諸如出現(xiàn)在句子中的單詞等語言特征;出現(xiàn)在句子中的單詞二元語法(bigram);句子中的單詞三元語法(trigram);從語言分析中得到的特征,包括句法結(jié)構(gòu)和屬性以及邏輯形式結(jié)構(gòu)和屬性??梢岳斫猓捎玫奶卣骷梢允侨缦挛脑敿?xì)描述的開放式研究問題。還可以理解,可使用任一合適的機(jī)器學(xué)習(xí)分類器,如支持矢量機(jī)和經(jīng)驗(yàn)工程師組件(如,考慮所提取的特征然后預(yù)測(cè)任務(wù)還是非任務(wù)的手寫代碼)。
示例性訓(xùn)練數(shù)據(jù)和模型訓(xùn)練為創(chuàng)建用于機(jī)器學(xué)習(xí)分類器的訓(xùn)練數(shù)據(jù),人類注釋者可審閱訓(xùn)練集中相應(yīng)消息的消息正文中的相應(yīng)句子。對(duì)于這些句子,注釋者可判斷句子是否應(yīng)當(dāng)被分類為任務(wù)。注釋者的判斷可以被稱為目標(biāo)值或目標(biāo)類。可對(duì)相應(yīng)的句子自動(dòng)提取特征并與目標(biāo)值配對(duì)??捎?xùn)練機(jī)器學(xué)習(xí)分類器,以對(duì)于自動(dòng)提取的特征將任務(wù)從非任務(wù)中區(qū)別開來。
示例性運(yùn)行時(shí)間應(yīng)用程序在運(yùn)行時(shí)間,此處所描述的系統(tǒng)可以此處所描述的方式處理給定的電子郵件消息。對(duì)于消息正文中的相應(yīng)句子,可將關(guān)聯(lián)的特征矢量呈現(xiàn)給機(jī)器學(xué)習(xí)分類器,它產(chǎn)生句子是任務(wù)的概率(如,P(Task))的估算。如果句子被認(rèn)為是任務(wù)(如,P(Task)超出閾值),則可分析該句子以產(chǎn)生一邏輯形式。該邏輯形式可以被重新表達(dá),并用于從該邏輯形式生成任務(wù)描述。所生成的任務(wù)描述可例如通過自動(dòng)將其添加到用戶界面的用戶任務(wù)列表被提供給用戶。
任務(wù)的示例性重新表達(dá)此處所描述的系統(tǒng)可以執(zhí)行所提取的任務(wù)句子的基于規(guī)則的后處理,以將它們重新表達(dá)為類似任務(wù)的命令式(imperative)。例如,句子“Oh,by the way,couldyou just send me a few sentences by EOD Friday?(噢,順便提一句,你能夠在周五的期限之前發(fā)送給我一些句子嗎?)”可以被重新表達(dá)成“Just send Rich a fewsentences by EOD Feb.20(在2月20日的期限之前向Rich發(fā)送一些句子)”。這一重新表達(dá)可涉及各種動(dòng)作。例如,一個(gè)動(dòng)作可包括對(duì)于所提取的句子產(chǎn)生一邏輯形式。另一動(dòng)作可包括標(biāo)識(shí)包括任務(wù)的句子的那一部分。又一動(dòng)作可包括(本質(zhì)上以任何順序)聚焦在所標(biāo)識(shí)的部分上并從邏輯形式中移除無關(guān)資料、歸一化其引用隨發(fā)言者或時(shí)間變化的句子的某些元素、以及在適當(dāng)時(shí)將這些片斷標(biāo)記為命令句子。再一動(dòng)作可包括將所得的結(jié)構(gòu)傳遞到一句子實(shí)現(xiàn)組件,它可從該結(jié)構(gòu)中生成句子。以下小節(jié)更詳細(xì)地討論上述動(dòng)作。
如上文簡(jiǎn)要提到的,一個(gè)行動(dòng)可包括對(duì)提取的句子產(chǎn)生邏輯形式。這可包括產(chǎn)生句子的各個(gè)部分之間的語義和深句法關(guān)系的表示。這一表示可以是圖表,其節(jié)點(diǎn)表示要被分析的句子的部分,其邊表示那些部分之間的關(guān)系。另外,節(jié)點(diǎn)本身可以用與其解釋有關(guān)的額外信息來注釋,例如它是問題還是命令。
包含任務(wù)的句子可以具有非任務(wù)內(nèi)容。由此,在標(biāo)識(shí)對(duì)應(yīng)于任務(wù)的邏輯形式部分時(shí)可使用啟發(fā)。這可包括整個(gè)句子或句子的任何子部分。使用的啟發(fā)可便于查找與任務(wù)相關(guān)的特征,如句子是否為命令式、句子的主題是否為“你”、是否使用了諸如“請(qǐng)”的模態(tài)詞或模態(tài)動(dòng)詞等等??梢栽谒鶚?biāo)識(shí)的邏輯形式上執(zhí)行進(jìn)一步的處理,而剩余部分可被忽略。
被認(rèn)為對(duì)任務(wù)表達(dá)不必要的單詞、短語和/或從句可從邏輯形式中移除。這類信息可包括諸如“請(qǐng)(please)”等模態(tài)單詞和/或諸如“必須(must)”、“能夠(could)”等各種助動(dòng)詞,以及某些從句和狀語。例如,在句子“Oh,by the way,could you just send me a few sentences by EOD Friday?”中,短語“oh,by the way”以及助動(dòng)詞“could”可以從邏輯形式中移除。另外,某些指示元素(即,其引用根據(jù)正在說話的人或者對(duì)其說話的人改變,或在說出或書寫句子之時(shí)或之處改變的單詞或短語)可被歸一化。例如,它們可用具有恒定引用的非指示元素來替換。例如,第一人稱代名詞(對(duì)不同的說話者不同地引用)可用電子郵件發(fā)送者的名字或用明確地指發(fā)送者的第三人稱代名詞來替換。類似地,諸如“Friday(周五)”等指示時(shí)間表達(dá)式可以根據(jù)所說的星期指不同的日期,因此可用具體的日期(如,“Feb.20(2月20日)”來替換。此外,如果邏輯形式具有指示它可以被表達(dá)為命令式(如,命令)句子的的某些特征,則它可被注釋為命令式。
句子可通過將所得的邏輯形式或結(jié)構(gòu)傳遞到句子實(shí)現(xiàn)組件來重新生成。這一組件可使用語法校驗(yàn)器中作為重寫建議的基礎(chǔ)的已知技術(shù)。
示例性定制可向用戶提供定義(如,通過調(diào)整滑動(dòng)塊)精度和任務(wù)回叫之間的權(quán)衡的能力,例如,以指定他們更希望見到所有的任務(wù)(無論任務(wù)有多小),還是僅見到用最高置信度預(yù)測(cè)的任務(wù)。其它定制可包括配置系統(tǒng)以自動(dòng)向用戶的任務(wù)列表添加任務(wù);可視地指示(如,通過顯示一特殊圖標(biāo)或通過對(duì)消息加顏色)電子郵件消息包含一個(gè)或多個(gè)任務(wù),它可以被過濾以僅看到包含任務(wù)的消息;在消息的預(yù)覽中顯示消息中存在的任務(wù)而非顯示前n個(gè)字節(jié);加亮對(duì)應(yīng)于任務(wù)的消息部分;以及,當(dāng)用戶打開消息時(shí),顯示從消息中提取的任務(wù)列表,這允許用戶校驗(yàn)消息以將它們添加到其任務(wù)列表或?qū)⑺鼈円浦凉蚕淼娜蝿?wù)集(如,在共享點(diǎn)(SharePoint)團(tuán)隊(duì)場(chǎng)所或向某一其他人分配任務(wù))。
為提供用于實(shí)現(xiàn)本發(fā)明的各方面的附加環(huán)境,圖13-14及以下討論旨在提供可在其中實(shí)現(xiàn)本發(fā)明的各方面的合適的計(jì)算環(huán)境的簡(jiǎn)要、通用描述。盡管上文在運(yùn)行在本地計(jì)算機(jī)和/或遠(yuǎn)程計(jì)算機(jī)上的計(jì)算機(jī)程序的計(jì)算機(jī)可執(zhí)行指令的通用上下文中描述了本發(fā)明,然而本領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到,本發(fā)明也可結(jié)合其它程序模塊來實(shí)現(xiàn)。一般而言,程序模塊包括例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)等,它們執(zhí)行特定的任務(wù)和/或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。
此外,本領(lǐng)域的技術(shù)人員可以理解,本發(fā)明方法可以其它計(jì)算機(jī)系統(tǒng)配置來實(shí)施,包括單處理器或多處理器計(jì)算機(jī)系統(tǒng)、小型機(jī)、大型機(jī),以及個(gè)人計(jì)算機(jī)、手持式計(jì)算設(shè)備、基于微處理器和/或可編程消費(fèi)者電子設(shè)備等等,其中,每一個(gè)都在操作上與一個(gè)或多個(gè)相關(guān)聯(lián)的設(shè)備通信。本發(fā)明所示的各方面也可以在分布式計(jì)算環(huán)境中實(shí)施,其中,任務(wù)由通過通信網(wǎng)絡(luò)連接的遠(yuǎn)程處理設(shè)備來執(zhí)行。然而,本發(fā)明的某些(如果不是所有)方面可以在獨(dú)立的計(jì)算機(jī)上實(shí)施。在分布式計(jì)算環(huán)境中,程序模塊可以位于本地和/或遠(yuǎn)程存儲(chǔ)器存儲(chǔ)設(shè)備中。
圖13是本發(fā)明可交互的示例計(jì)算環(huán)境1300的示意框圖。系統(tǒng)1300包括一個(gè)或多個(gè)客戶機(jī)1310??蛻魴C(jī)1310可以是硬件和/或軟件(如,線程、進(jìn)程、計(jì)算裝置)。系統(tǒng)1300也包括一個(gè)或多個(gè)服務(wù)器1320。服務(wù)器1320也可以是硬件和/或軟件(如,線程、進(jìn)程、計(jì)算裝置)。例如,服務(wù)器1320可容納線程,以通過使用本發(fā)明執(zhí)行變換。
客戶機(jī)1310和服務(wù)器1320之間的一個(gè)可能的通信可以是適用于在兩個(gè)或多個(gè)計(jì)算機(jī)進(jìn)程之間傳輸?shù)臄?shù)據(jù)分組的形式。系統(tǒng)1300包括可用于便于在客戶機(jī)1310和服務(wù)器1320之間通信的通信框架1340。客戶機(jī)1310操作上連接至可用于儲(chǔ)存對(duì)客戶機(jī)1310本地的信息的一個(gè)或多個(gè)客戶機(jī)數(shù)據(jù)存儲(chǔ)1350。類似地,服務(wù)器1320操作上連接至可用于儲(chǔ)存對(duì)服務(wù)器1320本地的信息的一個(gè)或多個(gè)服務(wù)器數(shù)據(jù)存儲(chǔ)1330。
參考圖14,實(shí)現(xiàn)本發(fā)明的各方面的示例性環(huán)境1400包括計(jì)算機(jī)1412。計(jì)算機(jī)1412包括處理單元1414、系統(tǒng)存儲(chǔ)器1416和系統(tǒng)總線1418。系統(tǒng)總線1418將包括但不限于系統(tǒng)存儲(chǔ)器1416的系統(tǒng)組件耦合至處理單元1414。處理單元1414可以是各種可用處理器的任一種。雙微處理器和其它多處理器體系結(jié)構(gòu)也可用作處理單元1414。
系統(tǒng)總線1418可以是若干種總線結(jié)構(gòu)類型的任一種,包括存儲(chǔ)器總線或存儲(chǔ)器控制器、外圍總線或外部總線、和/或使用各類總線體系結(jié)構(gòu)的局部總線,這些體系結(jié)構(gòu)包括但不限于,工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)、微通道體系結(jié)構(gòu)(MCA)、擴(kuò)展ISA(EISA)、智能驅(qū)動(dòng)電子設(shè)備(IDE)、VESA局部總線(VLB)、外圍部件互連(PCI),插件總線、通用串行總線(USB)、高級(jí)圖形端口(AGP)、個(gè)人計(jì)算機(jī)存儲(chǔ)卡國(guó)際協(xié)會(huì)總線(PCMCIA)、火線(IEEE 1394)以及小型計(jì)算機(jī)系統(tǒng)接口(SCSI)。
系統(tǒng)存儲(chǔ)器1416包括易失存儲(chǔ)器1420和非易失存儲(chǔ)器1422?;据斎?輸出系統(tǒng)(BIOS)包括如在啟動(dòng)時(shí)幫助在計(jì)算機(jī)1412內(nèi)的元件之間傳輸信息的基本例程,通常儲(chǔ)存在非易失存儲(chǔ)器1422中。作為說明而非局限,非易失存儲(chǔ)器1422可包括只讀存儲(chǔ)器(ROM)、可編程ROM(PROM)、電可編程ROM(EPROM)、電可擦除ROM(EEPROM)或閃存。易失存儲(chǔ)器1420包括隨機(jī)存取存儲(chǔ)器(RAM)、它擔(dān)當(dāng)外部高速緩存。作為說明而非局限,RAM以許多形式可用,如同步RAM(SRAM)、動(dòng)態(tài)RAM(DRAM)、同步DRAM(SDRAM)、雙數(shù)據(jù)率SDRAM(DDR SDRAM)、增強(qiáng)SDRAM(ESDRAM)、同步鏈路DRAM(SLDRAM)和直接存儲(chǔ)器總線RAM(DRRAM)。
計(jì)算機(jī)1412也包括可移動(dòng)/不可移動(dòng)、易失/非易失計(jì)算機(jī)存儲(chǔ)介質(zhì)。例如,圖14示出了盤存儲(chǔ)1424。盤存儲(chǔ)1424包括但不限于,諸如磁盤驅(qū)動(dòng)器、軟盤驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、Jaz驅(qū)動(dòng)器、Zip驅(qū)動(dòng)器、LS-100驅(qū)動(dòng)器、閃存卡或記憶棒等設(shè)備。另外,盤存儲(chǔ)1424可單獨(dú)包括存儲(chǔ)介質(zhì)或與其它存儲(chǔ)介質(zhì)組合,其它存儲(chǔ)介質(zhì)包括但不限于,諸如光盤ROM設(shè)備(CD-ROM)、CD可記錄驅(qū)動(dòng)器(CD-R驅(qū)動(dòng)器)、CD可重寫驅(qū)動(dòng)器(CD-RW驅(qū)動(dòng)器)或數(shù)字多功能盤ROM驅(qū)動(dòng)器(DVD-ROM)等光盤驅(qū)動(dòng)器。為便于盤存儲(chǔ)設(shè)備1424連接到系統(tǒng)總線1418,通常使用可移動(dòng)或不可移動(dòng)接口,如接口1426。
可以理解,圖14描述了擔(dān)當(dāng)用戶和合適的操作環(huán)境1400中描述的基本計(jì)算機(jī)資源之間的中介的軟件。這類軟件包括操作系統(tǒng)1428。操作系統(tǒng)1428可儲(chǔ)存在盤存儲(chǔ)1424中,它用于控制并分配計(jì)算機(jī)系統(tǒng)1412的資源。系統(tǒng)應(yīng)用程序1430利用操作系統(tǒng)1428通過儲(chǔ)存在系統(tǒng)存儲(chǔ)器1416或盤存儲(chǔ)1424上的程序模塊1432和程序數(shù)據(jù)1434對(duì)資源的管理??梢岳斫猓景l(fā)明可用各種操作系統(tǒng)或操作系統(tǒng)的組合來實(shí)現(xiàn)。
用戶通過輸入設(shè)備1436向計(jì)算機(jī)1412輸入命令或信息。輸入設(shè)備1436包括但不限于,諸如鼠標(biāo)、跟蹤球、觸針、觸摸墊等定位設(shè)備、鍵盤、麥克風(fēng)、操縱桿、游戲墊、圓盤式衛(wèi)星天線、掃描儀、TV調(diào)諧卡、數(shù)碼相機(jī)、數(shù)碼攝像機(jī)、web相機(jī)等等。這些和其它輸入設(shè)備通過系統(tǒng)總線1418經(jīng)由接口端口1438連接到處理單元1414。接口端口1438包括,例如,串行端口、并行端口、游戲端口、通用串行總線(USB)。輸出設(shè)備1440使用與輸入設(shè)備1436相同類型端口中的某一些。由此,例如,USB端口可用于向計(jì)算機(jī)1412提供輸入,并從計(jì)算機(jī)1412輸出信息到輸出設(shè)備1440。提供了輸出適配器1442以說明存在一些輸出設(shè)備1440,如監(jiān)視器、揚(yáng)聲器和打印機(jī),以及需要特殊適配器的其它輸出設(shè)備1440。輸出適配器1442包括,作為說明而非局限,提供輸出設(shè)備1440和系統(tǒng)總線1418之間的連接裝置的視頻卡和聲卡。應(yīng)當(dāng)注意,其它設(shè)備和/或設(shè)備的系統(tǒng)提供了輸入和輸出能力,如遠(yuǎn)程計(jì)算機(jī)1444。
計(jì)算機(jī)1412可以在使用到一個(gè)或多個(gè)遠(yuǎn)程計(jì)算機(jī),如遠(yuǎn)程計(jì)算機(jī)1444的邏輯連接的網(wǎng)絡(luò)化環(huán)境中操作。遠(yuǎn)程計(jì)算機(jī)1444可以是個(gè)人計(jì)算機(jī)、服務(wù)器、路由器、網(wǎng)絡(luò)PC、工作站、基于微處理器的電器、對(duì)等設(shè)備或其它公用網(wǎng)絡(luò)節(jié)點(diǎn)等等,并通常包括相對(duì)于計(jì)算機(jī)1412所描述的許多或所有元件。為簡(jiǎn)明性目的,僅示出了遠(yuǎn)程計(jì)算機(jī)1444具有存儲(chǔ)器存儲(chǔ)設(shè)備1446。遠(yuǎn)程計(jì)算機(jī)1444通過網(wǎng)絡(luò)接口1448邏輯上連接至計(jì)算機(jī)1412,然后通過通信連接1450物理地連接。網(wǎng)絡(luò)接口1448包含諸如局域網(wǎng)(LAN)和廣域網(wǎng)(WAN)等通信網(wǎng)絡(luò)。LAN技術(shù)包括光纖分布式數(shù)據(jù)接口(FDDI)、銅纜分布式數(shù)據(jù)接口(CDDI)、以太網(wǎng)、令牌環(huán)等等。WAN技術(shù)包括但不限于,點(diǎn)對(duì)點(diǎn)鏈路、諸如綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)及其變體等電路交換網(wǎng)絡(luò)、分組交換網(wǎng)絡(luò)以及數(shù)字訂戶線(DSL)。
通信連接1450指用于將網(wǎng)絡(luò)接口1448連接到總線1418的硬件/軟件。盡管為說明的清晰性,示出通信連接1450在計(jì)算機(jī)1412內(nèi),然而它也可以對(duì)計(jì)算機(jī)1412是外部的。僅為示例性目的,連接到網(wǎng)路接口1448必須的硬件/軟件包括內(nèi)部和外部技術(shù),如包括常規(guī)電話級(jí)調(diào)制解調(diào)器、線纜調(diào)制解調(diào)器和DSL調(diào)制解調(diào)器的調(diào)制解調(diào)器、ISDN適配器和以太網(wǎng)卡。
上文所描述的包括本發(fā)明的示例。當(dāng)然,不可能為了描述本發(fā)明而描述組件或方法的每一可想象的組合,但是本領(lǐng)域的普通技術(shù)人員可以認(rèn)識(shí)到,本發(fā)明的許多另外的組合和置換是可能的。因此,本發(fā)明旨在包含落入所附權(quán)利要求書的精神和范圍中的所有這樣的改變、修改和變化。
具體地,對(duì)于由上文描述的組件、設(shè)備、電路、系統(tǒng)等執(zhí)行的各種功能,用于描述這類組件的術(shù)語(包括對(duì)“裝置的參照”)旨在對(duì)應(yīng)于執(zhí)行所描述的組件(如,功能上等效的組件)的指定功能的任何組件,除非另外指明,即使其結(jié)構(gòu)上不等效于所揭示的結(jié)構(gòu),這些組件執(zhí)行此處所示的本發(fā)明的示例性方面中的功能。在這一點(diǎn)上,也可認(rèn)識(shí)到,本發(fā)明包括系統(tǒng)以及具有用于執(zhí)行本發(fā)明的各方法的動(dòng)作和/或事件的計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì)。
另外,盡管僅參照若干實(shí)現(xiàn)之一揭示了本發(fā)明的特定特征,然而如在任何給定或特定應(yīng)用中希望且有利的,這些特征可與其它實(shí)現(xiàn)的一個(gè)或多個(gè)其它特征相組合。此外,在術(shù)語“包括”用于詳細(xì)描述和權(quán)利要求書的意義上,這類術(shù)語旨在以與術(shù)語“包含”用作權(quán)利要求書中的過渡詞語所解釋的類似的方式為包含性的。
權(quán)利要求
1.一種便于數(shù)據(jù)處理的系統(tǒng),其特征在于,它包括一接收數(shù)據(jù)的組件;以及一數(shù)據(jù)管理器,它確定所述數(shù)據(jù)的意向、基于所述意向重新表達(dá)所述數(shù)據(jù)的至少一個(gè)子集、并自動(dòng)向用戶呈現(xiàn)重新表達(dá)的數(shù)據(jù)。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述數(shù)據(jù)管理器還分析所述數(shù)據(jù)、將所述數(shù)據(jù)分組成具有相關(guān)特征的一個(gè)或多個(gè)集合、并從所述數(shù)據(jù)集中的至少一個(gè)中提取特征以形成所述數(shù)據(jù)子集。
3.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述數(shù)據(jù)管理器使用元數(shù)據(jù)、屬性、內(nèi)容、上下文、關(guān)鍵詞、歷史、啟發(fā)、推論、規(guī)則、分界、日期、星期幾、相關(guān)聯(lián)的處理成本、相關(guān)聯(lián)的處理收益以及所述數(shù)據(jù)的來源中的至少一個(gè)以便于分析所述數(shù)據(jù)。
4.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述特征是至少部分地基于句法結(jié)構(gòu)、句法屬性、語言結(jié)構(gòu)和語言屬性之一來提取的。
5.如權(quán)利要求4所述的系統(tǒng),其特征在于,所述語言特征包括出現(xiàn)在句子中的單詞、出現(xiàn)在句子中的單詞二元語法以及出現(xiàn)在句子中的單詞三元語法中的一個(gè)或多個(gè)。
6.如權(quán)利要求1所述的系統(tǒng),其特征在于,它還包括一分類器,它根據(jù)從所述數(shù)據(jù)中提取的一個(gè)或多個(gè)特征確定所述數(shù)據(jù)的意向。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述分類器是機(jī)器學(xué)習(xí)分類器,它通過手動(dòng)和自動(dòng)生成的數(shù)據(jù)集的至少一個(gè)來訓(xùn)練。
8.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述分類器是支持矢量機(jī)和經(jīng)驗(yàn)工程師組件中的一個(gè)。
9.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述數(shù)據(jù)的重新表達(dá)包括產(chǎn)生所述數(shù)據(jù)的邏輯形式以及基于所述意向從所述邏輯形式中生成行動(dòng)描述。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述邏輯形式包括至少一個(gè)歸一化指示元素。
11.如權(quán)利要求1所述的系統(tǒng),其特征在于,它還包括基于所述意向執(zhí)行行動(dòng),所述行動(dòng)包括以下的至少其中之一自動(dòng)響應(yīng)問題;返回請(qǐng)求的信息;激活設(shè)備;調(diào)度會(huì)議;重新組織工程;可聽地通知用戶;可視地通知用戶;將項(xiàng)目插入到用戶的時(shí)間表中;聯(lián)系用戶;以及將項(xiàng)目添加到用戶的將要完成的事情的列表。
12.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述重新表達(dá)的數(shù)據(jù)表示自動(dòng)被插入到用戶的任務(wù)列表中的用戶任務(wù)。
13.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述數(shù)據(jù)是電子郵件、文檔、音頻文件或圖像。
14.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述意向被表示為概率、置信度等級(jí)、百分比和二進(jìn)制值中的一個(gè)。
15.如權(quán)利要求1所述的系統(tǒng),其特征在于,它還包括一閾值組件,它基于所述意向與默認(rèn)的、用戶定義的和智能生成的閾值之一的比較,確定是否要重新表達(dá),并將所述重新表達(dá)呈現(xiàn)給用戶。
16.一種自動(dòng)響應(yīng)消息的系統(tǒng),其特征在于,它包括一分析器,它細(xì)察接收到的消息,以區(qū)分所述消息的一個(gè)或多個(gè)全異部分;一語法剖析器,它將所述部分分割成相應(yīng)的貯存結(jié)構(gòu);一提取器,它從所述貯存結(jié)構(gòu)中的至少一個(gè)檢索句子;一分類器,它根據(jù)所述句子確定消息意向;以及一重新表達(dá)器,它將所述句子轉(zhuǎn)換成指示所述意向的數(shù)據(jù)集并將所述數(shù)據(jù)集呈現(xiàn)給用戶。
17.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述消息是電子郵件、文檔、音頻和圖像。
18.如權(quán)利要求16所述的系統(tǒng),其特征在于,用于獲取所述特征的所述貯存結(jié)構(gòu)包括所接收的消息的消息正文。
19.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述分類器生成所述消息包括任務(wù)的概率。
20.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述重新表達(dá)器產(chǎn)生所標(biāo)識(shí)的句子的邏輯表示。
21.如權(quán)利要求20所述的系統(tǒng),其特征在于,所述邏輯表示用于生成任務(wù)描述。
22.如權(quán)利要求21所述的系統(tǒng),其特征在于,所述任務(wù)描述被自動(dòng)添加到用戶的任務(wù)列表。
23.如權(quán)利要求16所述的系統(tǒng),其特征在于,指示意向的所述數(shù)據(jù)集是單詞、短語、片斷或句子。
24.如權(quán)利要求16所述的系統(tǒng),其特征在于,指示意向的所述數(shù)據(jù)集包括特征之間的語義和句法關(guān)系。
25.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述分類器是用一已注釋數(shù)據(jù)集來訓(xùn)練的。
26.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述重新表達(dá)器用非指示元素替換指示元素。
27.一種便于數(shù)據(jù)處理的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,它包括接受數(shù)據(jù);分析所述數(shù)據(jù)以確定一相關(guān)聯(lián)的意向;重新表達(dá)所述數(shù)據(jù)的至少一部分以產(chǎn)生所述意向的描述;以及將所述描述呈現(xiàn)給用戶。
28.如權(quán)利要求27所述的方法,其特征在于,它還包括向一機(jī)器學(xué)習(xí)分類器提供所述分析以生成指示是否響應(yīng)所述數(shù)據(jù)的概率。
29.如權(quán)利要求28所述的方法,其特征在于,所述分類器是通過手動(dòng)和自動(dòng)生成的數(shù)據(jù)集的至少一個(gè)來訓(xùn)練的。
30.如權(quán)利要求28所述的方法,其特征在于,所述分類器是支持矢量機(jī)和考慮提取的特征的指令集中的一個(gè)。
31.如權(quán)利要求27所述的方法,其特征在于,所述重新表達(dá)包括生成所述數(shù)據(jù)的邏輯形式,它被變換以生成所述描述。
32.如權(quán)利要求27所述的方法,其特征在于,它還包括至少部分地基于句法結(jié)構(gòu)、句法屬性、語言結(jié)構(gòu)和語言屬性中的一個(gè)從所述數(shù)據(jù)中提取特征。
33.一種便于消息處理的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,它包括將消息分割成類似地相關(guān)部分的組;從所述組的至少一個(gè)中提取顯著特征;根據(jù)所提取的特征計(jì)算意向;基于所述意向產(chǎn)生所述特征的邏輯表示;以及變換所述表示以生成涉及是否響應(yīng)所述數(shù)據(jù)的行動(dòng)的描述,以提供給用戶。
34.如權(quán)利要求33所述的方法,其特征在于,它還包括將所述組歸類為與標(biāo)題、消息正文和消息的稱呼相關(guān)聯(lián)。
35.如權(quán)利要求33所述的系統(tǒng),其特征在于,所述表示包括所述消息文本中成分之間的語義和句法關(guān)系。
36.如權(quán)利要求33所述的方法,其特征在于,重新表達(dá)所述句子以產(chǎn)生指示所述意向的單詞、句子、短語和段落。
37.一種在兩個(gè)或多個(gè)計(jì)算機(jī)組件之間傳輸、以便于基于意向管理消息的數(shù)據(jù)分組,其特征在于,它包括標(biāo)識(shí)消息的一個(gè)或多個(gè)特征;使用所標(biāo)識(shí)的特征來確定所述消息的意向;重新表達(dá)包含所述意向的句子以提供所述意向的描述;以及將所述描述呈現(xiàn)給用戶。
38.一種儲(chǔ)存便于基于相關(guān)聯(lián)的意向處理數(shù)據(jù)的計(jì)算機(jī)可執(zhí)行組件的計(jì)算機(jī)可讀介質(zhì),其特征在于,它包括一接收數(shù)據(jù)的組件;一確定所述數(shù)據(jù)的意向的組件;一基于所述意向重新表達(dá)所述數(shù)據(jù)的至少一個(gè)子集的組件;以及一在用戶界面中向用戶提供重新表達(dá)的數(shù)據(jù)的組件。
39.一種數(shù)據(jù)處理系統(tǒng),其特征在于,它包括用于確定所接收的數(shù)據(jù)的意向的裝置;用于重新表達(dá)所述數(shù)據(jù)以產(chǎn)生所述意向的表示的裝置;以及用于向用戶呈現(xiàn)所述表示的裝置。
全文摘要
本發(fā)明涉及確定所接收的數(shù)據(jù)(如,電子郵件、語音、圖形……)的意向,并基于該意向響應(yīng)數(shù)據(jù)的系統(tǒng)和方法。本系統(tǒng)和方法采用基于淺和深語言分析(如,語義和句法)的特征的各種組合來產(chǎn)生非常高的準(zhǔn)確度。本系統(tǒng)和方法分析并歸類所接收的數(shù)據(jù),以查找可包括意向的數(shù)據(jù)。該數(shù)據(jù)可通過提取涉及意向的特征來進(jìn)一步細(xì)化。特征可由分類器用于確定意向。如果意向證明響應(yīng)是正確的,則數(shù)據(jù)被進(jìn)一步細(xì)察和重新表達(dá),以生成指示該意向的描述。重新表達(dá)和包括以邏輯形式表示特征、變換該形式并生成可以可視和/或可聽地向用戶呈現(xiàn)的意向描述。
文檔編號(hào)G06F7/00GK1664839SQ20051005311
公開日2005年9月7日 申請(qǐng)日期2005年2月28日 優(yōu)先權(quán)日2004年3月1日
發(fā)明者D·R·里德, E·K·林格, M·E·皮爾遜, M·蓋蒙, R·G·坎貝爾, R·G·阿西恩森, S·H·科斯頓 申請(qǐng)人:微軟公司