專利名稱:識別查詢方面的制作方法
技術(shù)領(lǐng)域:
本說明書涉及響應(yīng)于搜索查詢而提供標(biāo)識在搜索查詢中識別出的實(shí)體的方面的信息,以及響應(yīng)于搜索查詢而在呈現(xiàn)信息時(shí)使用這些方面。
背景技術(shù):
因特網(wǎng)搜索引擎提供關(guān)于響應(yīng)于用戶的搜索查詢的因特網(wǎng)可訪問資源(例如網(wǎng)頁、圖像、文本文檔、多媒體內(nèi)容)的信息并且以對用戶有用的方式呈現(xiàn)關(guān)于這些資源的信息。因特網(wǎng)搜索引擎響應(yīng)于用戶所提交的查詢而返回搜索結(jié)果集(例如作為已排名的結(jié)果列表)。搜索結(jié)果包括例如URL以及來自對應(yīng)的資源的信息的摘錄。常規(guī)搜索引擎是在用戶的搜索查詢能夠通過單一結(jié)果得到滿足的假定下實(shí)現(xiàn)的,并且用于幫助用戶發(fā)現(xiàn)結(jié)果。 遺憾的是,用戶并不總是在尋找單一的結(jié)果,而是取而代之使用查詢作為出發(fā)點(diǎn)來探究關(guān)于他們可能以通用的方式初始地指向的某種事物的信息的未知空間。例如,用戶可以提交對實(shí)體命名或指向?qū)嶓w的查詢作為出發(fā)點(diǎn)來探索與該實(shí)體相關(guān)聯(lián)的各種方面。當(dāng)參考信息檢索系統(tǒng)(例如搜索引擎)的操作而使用時(shí),術(shù)語“實(shí)體”是指對某種事物命名或標(biāo)識某種事物的文本。這一事物可以是可以具有相關(guān)聯(lián)的性質(zhì)的任何對象(例如在物理上的、概念上的或者虛幻的世界中的對象)。例如,實(shí)體可以是指位置、 人、虛構(gòu)的人物、狀態(tài)、事物、想法等等。當(dāng)可以從上下文中清楚其含義時(shí),并且為避免不必要的贅述,術(shù)語“實(shí)體”還可以用于指代事物本身。方面是不同的信息軸,沿這些軸能夠獲得關(guān)于實(shí)體的附加信息。例如,對于實(shí)體 “夏威夷”,可能的方面可以包括“海灘”、“旅館”和“天氣”。對于術(shù)語“實(shí)體”,當(dāng)參考信息檢索系統(tǒng)(例如搜索引擎)的操作而使用時(shí),術(shù)語“方面”是指對正在討論的方面命名的文本,相反,當(dāng)可以從上下文中清楚其含義時(shí),該術(shù)語還可以用于指代方面本身。由常規(guī)搜索引擎提供的單一的已排名的結(jié)果列表通常不能為用戶提供實(shí)體的不同的方面的概況。當(dāng)然,單一的已排名列表通常提供指向單一的或少量的方面的很多結(jié)果。 此外,所呈現(xiàn)的結(jié)果通常并不標(biāo)識所代表的方面。
發(fā)明內(nèi)容
本說明書描述了與識別與實(shí)體相關(guān)聯(lián)的方面有關(guān)的技術(shù)?!愕?,在本說明書中描述的主題的一個(gè)方面可以體現(xiàn)為包括以下動(dòng)作的方法 在計(jì)算機(jī)系統(tǒng)中接收查詢,計(jì)算機(jī)系統(tǒng)包括一個(gè)或多個(gè)計(jì)算機(jī),該查詢包括實(shí)體;在計(jì)算機(jī)系統(tǒng)中生成用于實(shí)體的一組候選方面;在計(jì)算機(jī)系統(tǒng)中修改該一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);在計(jì)算機(jī)系統(tǒng)中基于多樣性得分和流行性得分對該一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面排名;在計(jì)算機(jī)系統(tǒng)中將一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與實(shí)體相關(guān)聯(lián);在計(jì)算機(jī)系統(tǒng)中接收一個(gè)或多個(gè)搜索結(jié)果集;以及響應(yīng)于查詢而提供對搜索結(jié)果的呈現(xiàn),該呈現(xiàn)呈遞了根據(jù)與實(shí)體相關(guān)聯(lián)的方面而組織的搜索結(jié)果。這一方面的其他實(shí)施例包括對應(yīng)的系統(tǒng)、裝置以及編碼在計(jì)算機(jī)存儲設(shè)備上的配置為執(zhí)行方法動(dòng)作的計(jì)算機(jī)程序。這些和其他實(shí)施例每個(gè)都可以可選地包括以下特征中的一個(gè)或多個(gè)。該方法可以進(jìn)一步包括根據(jù)方面呈現(xiàn)關(guān)于實(shí)體的信息的概要。該一個(gè)或多個(gè)搜索結(jié)果集可以包括響應(yīng)于查詢的搜索結(jié)果集。該一個(gè)或多個(gè)搜索結(jié)果集中的每一個(gè)可以對應(yīng)于與實(shí)體相關(guān)聯(lián)的相應(yīng)方面。一般地,在本說明書中描述的主題的另一方面可以體現(xiàn)為包括以下動(dòng)作的方法 接收標(biāo)識實(shí)體的數(shù)據(jù);在計(jì)算機(jī)系統(tǒng)中生成用于實(shí)體的一組候選方面,計(jì)算機(jī)系統(tǒng)包括一個(gè)或多個(gè)計(jì)算機(jī);在計(jì)算機(jī)系統(tǒng)中修改該一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);在計(jì)算機(jī)系統(tǒng)中基于多樣性得分和流行性得分對該一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面排名;以及在計(jì)算機(jī)系統(tǒng)的數(shù)據(jù)存儲設(shè)備中存儲一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與實(shí)體的關(guān)聯(lián)。這一方面的其他實(shí)施例包括對應(yīng)的系統(tǒng)、裝置以及編碼在計(jì)算機(jī)存儲設(shè)備上的配置為執(zhí)行方法動(dòng)作的計(jì)算機(jī)程序。這些和其他實(shí)施例每個(gè)都可以可選地包括以下特征中的一個(gè)或多個(gè)。該方法可以進(jìn)一步包括接收包括實(shí)體的查詢;識別與實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)方面;接收響應(yīng)于查詢的搜索結(jié)果;以及基于識別出的方面而呈現(xiàn)搜索結(jié)果。該方法可以進(jìn)一步包括接收包括實(shí)體的查詢;識別與實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)方面;接收一個(gè)或多個(gè)搜索結(jié)果集,每個(gè)集對應(yīng)于識別出的方面之一;以及基于識別出的方面而呈現(xiàn)搜索結(jié)果。該方法可以進(jìn)一步包括接收標(biāo)識一個(gè)或多個(gè)實(shí)體性質(zhì)的數(shù)據(jù),其中生成該一組候選方面包括使用該一個(gè)或多個(gè)實(shí)體性質(zhì);以及該一個(gè)或多個(gè)排名最高的候選方面與實(shí)體和實(shí)體性質(zhì)兩者相關(guān)聯(lián)。該方法可以進(jìn)一步包括將實(shí)體與類別相關(guān)聯(lián),該類別具有包括實(shí)體的一個(gè)或多個(gè)類別成員;并且其中生成該一組候選方面包括生成對應(yīng)于實(shí)體和類別的候選方面。生成該一組候選方面可以包括分析一個(gè)或多個(gè)第一用戶搜索歷史以識別與實(shí)體相關(guān)聯(lián)的查詢;以及分析一個(gè)或多個(gè)第二用戶搜索歷史以識別與實(shí)體以外的類別成員相關(guān)聯(lián)的查詢。組合候選方面可以包括計(jì)算相似度得分,其中每個(gè)相似度得分是對兩個(gè)候選方面之間的相似度的估計(jì);并且基于相似度得分將候選方面組合為單一的經(jīng)修改的候選方面。將每個(gè)候選方面表示為文本,并且兩個(gè)候選方面之間的相似度得分基于對與每個(gè)候選方面相關(guān)聯(lián)的文本的字符串的比較。計(jì)算兩個(gè)候選方面之間的相似度得分可以包括接收針對每個(gè)方面的相應(yīng)搜索結(jié)果集;以及基于對搜索結(jié)果集的比較計(jì)算相似度得分。對搜索結(jié)果集的比較可以包括將搜索結(jié)果集之一中的搜索結(jié)果的路徑與搜索結(jié)果集的另一個(gè)中的搜索結(jié)果的路徑相比較。對搜索結(jié)果集的比較可以包括將搜索結(jié)果集之一中的搜索結(jié)果的標(biāo)題和摘錄與搜索結(jié)果集的另一個(gè)中的搜索結(jié)果的標(biāo)題和摘錄相比較?;谙嗨贫鹊梅纸M合候選方面可以進(jìn)一步包括使用圖劃分算法來確定組合哪些方面。使用一個(gè)或多個(gè)方面類別對候選方面進(jìn)行歸組可以包括將兩個(gè)或更多候選方面與相應(yīng)的方面類別相關(guān)聯(lián);以及基于兩個(gè)或更多候選方面的方面類別將其歸組到單一的經(jīng)修改的候選方面。單一的經(jīng)修改的候選方面是方面類別。基于多樣性得分和流行性得分對一個(gè)或多個(gè)經(jīng)修改的候選方面排名可以包括計(jì)算針對每個(gè)方面的流行性得分;將流行性得分最高的方面排名為最高;以及通過重復(fù)以下步驟一次或多次來對其余方面排名計(jì)算針對每個(gè)未排名的方面的相似度得分,其中相似度得分將未排名的方面與已排名的方面的相似度相比較;以及將下一最高排名指派給其流行性得分除以其相似度得分的結(jié)果為最高的方面??梢詫?shí)現(xiàn)在本說明書中描述的主題的特定實(shí)施例,以便實(shí)現(xiàn)以下優(yōu)點(diǎn)中的一個(gè)或多個(gè)??梢宰R別出搜索查詢中的實(shí)體的方面??梢猿尸F(xiàn)方面以使得用戶容易沿多個(gè)軸探索搜索空間。使用方面使得用戶可以探索超出其原始查詢的范圍的搜索空間。呈現(xiàn)方面還使得用戶可以迅速地得到關(guān)于搜索的可能的軸是什么的概況。呈現(xiàn)方面能夠使得用戶可以例如通過使用分面瀏覽來高效地瀏覽搜索空間。可以將與方面相關(guān)的信息識別和呈現(xiàn)給用戶。這一信息能夠使得用戶可以迅速地得到其所需的關(guān)于實(shí)體的多個(gè)方面的信息。可以將混搭呈現(xiàn)給用戶作為使關(guān)于實(shí)體的方面的信息可視化的方式?;齑畛尸F(xiàn)信息在單一的集成接口中與若干方面相關(guān)聯(lián)。在下面的附圖和描述中闡明了本發(fā)明的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。本發(fā)明的其他特征、方面和優(yōu)點(diǎn)將從描述、附圖和權(quán)利要求中變得顯然。
圖1圖示了用于提供與所提交的查詢相關(guān)的搜索結(jié)果的示例搜索系統(tǒng)。圖2圖示了用于將方面與實(shí)體相關(guān)聯(lián)的示例方法。圖3圖示了組合類似的候選方面的示例。圖4圖示了基于方面的方面類別對方面進(jìn)行歸組的示例。圖5圖示了在給定預(yù)先存在的一組一個(gè)或多個(gè)已排名的方面的情況下對未排名的方面排名的示例。圖6圖示了用于接收包括對應(yīng)于實(shí)體的一個(gè)或多個(gè)詞的查詢并且基于識別出的實(shí)體的方面呈現(xiàn)搜索結(jié)果的示例方法。圖7圖示了在用戶提交搜索查詢之后所顯示的示例混搭(mashup)。圖8圖示了系統(tǒng)的示例體系結(jié)構(gòu)。各圖中的相似的參考標(biāo)號和名稱表示相似的元素。
具體實(shí)施例方式圖1圖示了用于提供與所提交的查詢相關(guān)的搜索結(jié)果的示例搜索系統(tǒng)114,該搜索系統(tǒng)114可以實(shí)現(xiàn)在因特網(wǎng)、內(nèi)網(wǎng)或者另一客戶端和服務(wù)器環(huán)境中。搜索系統(tǒng)114是其中能夠?qū)崿F(xiàn)下面描述的系統(tǒng)、組件和技術(shù)的信息檢索系統(tǒng)的示例。用戶102可以通過客戶端設(shè)備104與搜索系統(tǒng)114交互。例如,客戶端104可以是通過局域網(wǎng)(LAN)或例如因特網(wǎng)的廣域網(wǎng)(WAN)耦合至搜索系統(tǒng)114的計(jì)算機(jī)。在某些實(shí)現(xiàn)中,搜索系統(tǒng)114和客戶端設(shè)備104可以是一個(gè)機(jī)器。例如,用戶可以在客戶端設(shè)備104 上安裝桌面搜索應(yīng)用??蛻舳嗽O(shè)備104將一般地包括隨機(jī)存取存儲器(RAM) 106和處理器 108。用戶102可以向搜索系統(tǒng)114內(nèi)的搜索引擎130提交查詢110。當(dāng)用戶102提交查詢110時(shí),查詢110通過網(wǎng)絡(luò)傳送到搜索系統(tǒng)114。搜索系統(tǒng)114可以實(shí)現(xiàn)為例如運(yùn)行在一個(gè)或多個(gè)位置上的、通過網(wǎng)絡(luò)彼此耦合的一個(gè)或多個(gè)計(jì)算機(jī)上的計(jì)算機(jī)程序。搜索系統(tǒng)114包括索引數(shù)據(jù)庫122和搜索引擎130。搜索系統(tǒng)114通過生成搜索結(jié)果1 來對查詢110進(jìn)行響應(yīng),該搜索結(jié)果128以能夠呈現(xiàn)給用戶102的形式(例如要顯示在運(yùn)行在客戶端設(shè)備104上的web瀏覽器中的搜索結(jié)果網(wǎng)頁)通過網(wǎng)絡(luò)傳送到客戶端設(shè)備104。當(dāng)搜索引擎130接收到查詢110時(shí),搜索引擎130識別與查詢110匹配的資源。搜索引擎130還可以識別與查詢相關(guān)的每個(gè)資源的“摘錄”或部分。搜索引擎130將一般地包括對在資料庫(例如內(nèi)容的集合或存儲庫)中找到的資源(例如因特網(wǎng)上的網(wǎng)頁、圖像或者新聞文章)進(jìn)行索引的索引引擎120,存儲索引信息的索引數(shù)據(jù)庫122,以及用以對與查詢110匹配的資源進(jìn)行排名的排名引擎152(或其他軟件)??梢允褂贸R?guī)方法來執(zhí)行對資源的索引和排名。搜索引擎130可以通過網(wǎng)絡(luò)向客戶端設(shè)備104傳送搜索結(jié)果128,例如, 以便呈現(xiàn)給用戶102。搜索系統(tǒng)114還可以基于其從用戶接收的查詢來維持一個(gè)或多個(gè)用戶搜索歷史。 一般而言,用戶搜索歷史存儲從用戶接收的一系列查詢。用戶搜索歷史還可以包括附加信息,諸如在執(zhí)行了搜索之后選擇了哪些結(jié)果以及所選擇的每個(gè)結(jié)果被查看了多久。在某些實(shí)現(xiàn)中,搜索系統(tǒng)114包括方面確定器(aspector) 140。作為替代,方面確定器140可以實(shí)現(xiàn)在耦合到搜索系統(tǒng)114的一個(gè)或多個(gè)截然不同的系統(tǒng)中。方面確定器 140將方面與特定實(shí)體相關(guān)聯(lián)。此外,方面確定器140可以接收查詢110,并且結(jié)合搜索引擎 130來向用戶102提供基于方面的搜索結(jié)果。下面將更詳細(xì)地描述對方面的識別和使用。圖2圖示了用于將方面與實(shí)體相關(guān)聯(lián)的示例方法200。為方便起見,將參考執(zhí)行方法200的系統(tǒng)來描述示例方法200。該系統(tǒng)可以是例如搜索系統(tǒng)114或單獨(dú)的系統(tǒng)。該系統(tǒng)接收實(shí)體(步驟202)。實(shí)體可以是可以具有相關(guān)聯(lián)的性質(zhì)的任何對象(例如在物理上的或概念上的世界中的對象)。例如,實(shí)體可以是位置、人、事物、想法等。該系統(tǒng)可以從各種各樣的源接收實(shí)體。例如,該系統(tǒng)可以直接從用戶接收實(shí)體,或者響應(yīng)于由系統(tǒng)執(zhí)行的動(dòng)作(例如執(zhí)行處理的動(dòng)作)而接收實(shí)體。例如,通過解析查詢并且將查詢的詞與可能實(shí)體的數(shù)據(jù)庫相比較,可以從接收到的來自用戶或搜索系統(tǒng)114的搜索查詢提取實(shí)體。實(shí)體的其他源也是可能的,例如可以從諸如用戶搜索歷史之類的查詢數(shù)據(jù)提取實(shí)體。在某些實(shí)現(xiàn)中,系統(tǒng)還接收標(biāo)識實(shí)體的一個(gè)或多個(gè)性質(zhì)的數(shù)據(jù)。實(shí)體的性質(zhì)是與實(shí)體相關(guān)聯(lián)的、可以用于進(jìn)一步細(xì)化實(shí)體的附加元素。例如,“旅行”可以是實(shí)體“越南”的性質(zhì),因?yàn)槿藗儠皆侥下眯?。系統(tǒng)生成用于實(shí)體的一組候選方面(步驟204)??梢曰趯?shí)體,或者作為替代,基于與實(shí)體相關(guān)聯(lián)的類別來生成候選方面。類別是實(shí)體的抽象。例如,“巧克力蛋糕”可以與類別“食物”相關(guān)聯(lián),因?yàn)榍煽肆Φ案馐且环N食物。黃水仙可以與類別“花”相關(guān)聯(lián),因?yàn)辄S水仙是一種花。類別可以具有多個(gè)成員。每個(gè)成員也是實(shí)體。例如,類別“花”可以包括很多類型的花,包括“郁金香”、“六出花”、“玫瑰”等等。在某些實(shí)現(xiàn)中,使用基于實(shí)體的方面和基于類別的方面兩者。對基于實(shí)體的方面和基于類別的方面兩者的依賴可能引起更具有魯棒性的方面集。例如,某些實(shí)體非常稀少以至于只有少量數(shù)據(jù)來作為方面的基礎(chǔ)。對于這些實(shí)體,依賴于基于類別的方面能夠增加候選方面的數(shù)量。然而,某些實(shí)體非常流行并且可以具有例如能夠從用戶搜索歷史中識別的、特定于實(shí)體的方面。因此,還包括基于實(shí)體的方面對于這些更流行的實(shí)體來說可以是有用的。在某些實(shí)現(xiàn)中,生成用于實(shí)體的一組候選方面包括分析用于包括實(shí)體的查詢的查詢數(shù)據(jù)??梢苑治霾樵償?shù)據(jù),例如以便識別查詢細(xì)化和查詢超級字符串。當(dāng)用戶第一次發(fā)布針對實(shí)體的查詢時(shí),發(fā)生查詢細(xì)化,然后跟隨該查詢接下來是另一相關(guān)的查詢。例如,如果用戶發(fā)布針對“爆米花”的查詢,接下來是針對“微波爐爆米花” 的查詢,則可以將微波爐爆米花識別為針對爆米花的查詢細(xì)化。查詢細(xì)化不必包括原始查詢。例如,如果用戶發(fā)布針對“計(jì)算機(jī)”的查詢,接下來是針對“筆記本計(jì)算機(jī)”的查詢,則可以將筆記本計(jì)算機(jī)識別為針對計(jì)算機(jī)的查詢細(xì)化。查詢細(xì)化能夠提供關(guān)于實(shí)體的有價(jià)值的信息,這是因?yàn)樗鼈儽砻髁私o定用戶如何進(jìn)行選取以探究用于實(shí)體的搜索空間??梢詫⒉樵兗?xì)化生成如下。能夠識別包括針對實(shí)體的查詢的一個(gè)或多個(gè)用戶搜索歷史。然后,將每個(gè)用戶搜索歷史分為會話,其中每個(gè)會話代表由給定用戶發(fā)布的、針對給定信息找尋任務(wù)的一組查詢。可以用多種方式來度量會話,例如用規(guī)定的時(shí)間段(例如三十分鐘)、用規(guī)定的查詢數(shù)量(例如15個(gè)查詢)來度量,直到規(guī)定的不活動(dòng)時(shí)段(例如十分鐘不執(zhí)行搜索)為止,或者在用戶登錄搜索系統(tǒng)的那段時(shí)間??梢赃^濾掉不包括針對實(shí)體的查詢的會話。在其余會話中對在針對實(shí)體的查詢后面的查詢是查詢細(xì)化。查詢細(xì)化中的每一個(gè)表明潛在的候選方面。例如,候選方面可以是查詢細(xì)化本身,或者不包括實(shí)體的查詢細(xì)化的部分。還可以通過如下方式來識別候選方面,即通過使用語言分析技術(shù)來分析查詢細(xì)化(例如使用詞典或統(tǒng)計(jì)分析來識別查詢細(xì)化中的、 很可能會是方面的詞),或者通過在將查詢細(xì)化與方面相關(guān)聯(lián)的數(shù)據(jù)庫中查找查詢細(xì)化。可以跨用戶而聚合潛在的候選方面,并且可以過濾掉沒有出現(xiàn)多于閾值次數(shù)的候選方面。在某些實(shí)現(xiàn)中,基于查詢中的實(shí)體和實(shí)體的相關(guān)聯(lián)的性質(zhì)(而不僅僅是實(shí)體)、針對查詢生成查詢細(xì)化。一般而言,當(dāng)查詢包括其他查詢時(shí),該查詢是另一查詢的超級字符串。例如,“越南旅行套餐”是“越南旅行”的超級字符串,因?yàn)槠浒宋谋尽霸侥下眯小?。與查詢細(xì)化不同,查詢超級字符串不必在與該查詢超級字符串作為其超級字符串的查詢相同的會話期間發(fā)送。通過考慮一個(gè)或多個(gè)用戶搜索歷史并且識別包括實(shí)體的查詢來生成查詢超級字符串。每個(gè)查詢超級字符串表明潛在的候選方面。例如,候選方面可以是不包括實(shí)體的查詢超級字符串的部分。在某些實(shí)現(xiàn)中,在識別候選方面之前對查詢超級字符串進(jìn)行過濾以移除諸如“一”、“該”之類的常用措辭。如上所述,還可以使用語言學(xué)技術(shù)或數(shù)據(jù)庫來從查詢超級字符串中識別候選方面。可以跨用戶而聚合潛在的候選方面,并且可以過濾掉沒有出現(xiàn)多于閾值次數(shù)的候選方面。在某些實(shí)現(xiàn)中,針對包括對實(shí)體及其性質(zhì)(而不僅僅是實(shí)體)命名的文本的查詢識別查詢超級字符串。在某些實(shí)現(xiàn)中,系統(tǒng)將實(shí)體與類別相關(guān)聯(lián)并且生成用于實(shí)體的基于類別的候選方 在某些實(shí)現(xiàn)中,系統(tǒng)基于將實(shí)體與類別相關(guān)聯(lián)的預(yù)定數(shù)據(jù)庫來將實(shí)體與類別相關(guān)聯(lián)??梢岳缤ㄟ^分析知識庫信息(例如來自由Wikimedia Foundation公司運(yùn)行的 ffikipedia 的信息,或者來自由Metaweb公司運(yùn)行的Freehse 的信息)來生成這一預(yù)定數(shù)據(jù)庫。一般而言,知識庫是用于一個(gè)或多個(gè)實(shí)體的信息的集合。知識庫可以規(guī)定實(shí)體之間的關(guān)系,諸如類別關(guān)系,并且還可以規(guī)定實(shí)體的特征。例如,知識庫可以規(guī)定“加拿大”在稱為“國家”的類別中以及其特征之一是其“GDP”??梢詮闹R庫信息中識別實(shí)體-類別關(guān)系,并且可以將基于關(guān)系的關(guān)聯(lián)存儲在數(shù)據(jù)庫中以供將來使用。還可以通過在搜索系統(tǒng)114 中查詢Hearst模式來生成預(yù)定數(shù)據(jù)庫,例如如果實(shí)體是“波士頓”,則可以向搜索系統(tǒng)發(fā)布針對“諸如波士頓之類的X”的查詢。然后,可以針對包括“諸如波士頓”的句子分析結(jié)果, 并且可以識別所得到的類別。例如,如果若干搜索結(jié)果包括短語“諸如波士頓之類的城市”, 則波士頓可以與類別“城市”相關(guān)聯(lián)。在某些實(shí)現(xiàn)中,實(shí)體不必是與數(shù)據(jù)庫中的實(shí)體的完美匹配,以便識別關(guān)聯(lián)。例如,可以忽略諸如實(shí)體是單數(shù)還是復(fù)數(shù)之類的較小差異。例如,如果數(shù)據(jù)庫中存儲了單數(shù)“玫瑰”,但實(shí)體是復(fù)數(shù)的“玫瑰”,則可以使用用于玫瑰的類別信息。 還可以忽略其他較小的差異,諸如拼寫變化。在某些實(shí)現(xiàn)中,系統(tǒng)通過如下方式將實(shí)體與即時(shí)的類別相關(guān)聯(lián),即通過訪問知識庫信息(例如瀏覽諸如Wikipedia之類的網(wǎng)址)并且識別與所接收的實(shí)體相關(guān)聯(lián)的類別, 或者發(fā)布包括實(shí)體的具有Hearst模式的查詢。用于將實(shí)體與類別相關(guān)聯(lián)的其他技術(shù)也是可能的。例如,可以基于諸如支持向量機(jī)之類的機(jī)器學(xué)習(xí)技術(shù)來對實(shí)體分類。作為替代,用戶可以規(guī)定與實(shí)體相關(guān)聯(lián)的類別??梢酝ㄟ^分析針對包括實(shí)體以外的類別成員的查詢的查詢數(shù)據(jù)來生成基于類別的方面。例如,如果實(shí)體是“黃水仙”并且其類別是“花”,則可以針對包括“玫瑰”的查詢來分析查詢數(shù)據(jù),這是因?yàn)椤懊倒濉笔腔悇e的成員之一。可以分析用于類別成員的查詢數(shù)據(jù)以識別方面,就像如上所述地分析用于實(shí)體的查詢數(shù)據(jù)以識別方面一樣。當(dāng)實(shí)體與一個(gè)或多個(gè)性質(zhì)相關(guān)聯(lián)時(shí),可以將這些性質(zhì)與每個(gè)類別成員一起包括,以便用于識別方面的目的。 在某些實(shí)現(xiàn)中,僅從充分接近實(shí)體(例如在時(shí)間或空間或者實(shí)體之間的距離的另一度量的閾值內(nèi))的類別成員生成基于類別的方面。例如,“加拿大”、“比利時(shí)”和“法國”全都在類別“國家”中。然而,比利時(shí)和法國是鄰國。因此,如果實(shí)體是“比利時(shí)”,則系統(tǒng)可以基于類別成員“法國”而不是類別成員“加拿大”來識別基于類別的方面,這是因?yàn)榧幽么笠策h(yuǎn)離比利時(shí)。閾值可以是若干英里,或者很多天,或者距離的其他度量??梢愿鶕?jù)經(jīng)驗(yàn)確定閾值。生成候選方面的其他方法也是可能的,例如可以通過分析與實(shí)體或其類別成員相關(guān)聯(lián)的知識庫信息來生成候選方面。知識庫能夠提供給定實(shí)體與其特征之間的二元聯(lián)系。 例如,Wikipedia 提供用于某些實(shí)體的“Infobox”。用于柬埔寨的hfobox列出了諸如資本、旗帆、人口、面積和⑶P之類的特征。這些能夠提供用于實(shí)體柬埔寨的附加方面。還可以從將實(shí)體或類別成員與潛在的候選方面相關(guān)聯(lián)的數(shù)據(jù)庫獲取候選方面。在某些實(shí)現(xiàn)中,基于用戶對先前已經(jīng)與實(shí)體相關(guān)聯(lián)并且呈現(xiàn)給用戶的方面的反饋來對候選方面進(jìn)行過濾。用戶反饋可以表明哪些方面是實(shí)體的有用方面,以及哪些方面并非實(shí)體的有用方面。用戶反饋可以用于直接過濾掉用戶已經(jīng)表明并非有用的方面。作為替代,用戶反饋可以用作訓(xùn)練輸入以訓(xùn)練機(jī)器使用機(jī)器學(xué)習(xí)技術(shù)來對候選方面進(jìn)行過濾。系統(tǒng)修改該組候選方面(步驟206)。修改該組候選方面可以包括組合類似的候選方面并且基于一個(gè)或多個(gè)候選方面的類別對候選方面進(jìn)行歸組。這一組合和歸組減小了冗余的方面并且?guī)椭杏谠诟鞣N搜索軸上的方面。經(jīng)常生成類似的方面。例如,對于查詢“越南旅行”,方面“一個(gè)套餐”、“多個(gè)套餐”
14以及“成交”全都能夠生成。所有這些方面指代相同的基本概念一將旅行的各個(gè)方面捆綁到一個(gè)套餐中的產(chǎn)品。因此,可以將這些方面組合為單一的方面。圖3圖示了組合類似的候選方面的示例。初始的一組候選方面302包含四個(gè)方面 方面1、方面1’、方面2和方面3??梢葬槍υ摻M候選方面302中的每對方面計(jì)算相似度得分。例如,方面1和方面 1,具有0. 9的相似度得分304。方面1和方面2具有0. 5的相似度得分306,并且方面1, 和方面2具有0. 3的相似度得分308。在某些實(shí)現(xiàn)中,計(jì)算兩個(gè)方面的相似度得分包括識別對應(yīng)于針對每個(gè)方面的查詢的相應(yīng)搜索結(jié)果集,然后將搜索結(jié)果相比較。可以通過針對每個(gè)方面向搜索引擎(例如圖 1中的搜索引擎130)發(fā)布查詢來生成搜索結(jié)果。然后,選取用于每個(gè)查詢的最前面的η個(gè)搜索結(jié)果作為用于相應(yīng)方面的搜索結(jié)果集(η可以是選取為給定充分的信息量以便進(jìn)行比較的任何整數(shù)(例如8或10))。出于圖示的目的,令Di為對應(yīng)于第一方面的搜索結(jié)果集 Cli e Di,并且令Dj為對應(yīng)于與第一方面相比較的第二方面的搜索結(jié)果集Clj e Djo可以將針對兩個(gè)搜索結(jié)果集的相似度得分,從而可以將兩個(gè)方面計(jì)算如下。針對Di和Dj中的每個(gè)搜索結(jié)果生成特征向量。例如,特征向量可以包括一個(gè)或多個(gè)特征(例如詞)以及特征對用戶的重要性的對應(yīng)統(tǒng)計(jì)度量(例如用于每個(gè)特征的詞頻 (tf)權(quán)重或詞頻逆向文檔(tf-idf)權(quán)重)。詞可以是搜索結(jié)果中的所有措詞,或者搜索結(jié)果的措詞的子集(例如由搜索引擎識別的結(jié)果的標(biāo)題和摘錄)。在某些實(shí)現(xiàn)中,將tf權(quán)重用作特征對用戶的重要性的統(tǒng)計(jì)度量。可以使用tf權(quán)重是因?yàn)樘卣鲗τ脩舻闹匾钥梢愿鶕?jù)特征在文檔的集合中發(fā)生的頻率(例如詞頻)而按比例增加,文檔的集合例如是由搜索系統(tǒng)(例如圖1中的搜索系統(tǒng)114)進(jìn)行索引的所有文檔,或者由搜索系統(tǒng)進(jìn)行索引的、與該詞使用相同語言的所有文檔。搜索結(jié)果中的詞頻是特定詞在搜索結(jié)果中發(fā)生的相對頻率,可以表示為 tf
權(quán)利要求
1.一種方法,包括在計(jì)算機(jī)系統(tǒng)中接收查詢,所述計(jì)算機(jī)系統(tǒng)包括一個(gè)或多個(gè)計(jì)算機(jī),所述查詢包括實(shí)體;在所述計(jì)算機(jī)系統(tǒng)中生成用于所述實(shí)體的一組候選方面;在所述計(jì)算機(jī)系統(tǒng)中修改所述一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);在所述計(jì)算機(jī)系統(tǒng)中基于多樣性得分和流行性得分對所述一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名;在所述計(jì)算機(jī)系統(tǒng)中將一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與所述實(shí)體相關(guān)聯(lián);在所述計(jì)算機(jī)系統(tǒng)中接收一個(gè)或多個(gè)搜索結(jié)果集;以及響應(yīng)于所述查詢而提供對所述搜索結(jié)果的呈現(xiàn),所述呈現(xiàn)呈遞了根據(jù)與所述實(shí)體相關(guān)聯(lián)的方面而組織的搜索結(jié)果。
2.根據(jù)權(quán)利要求1的方法,進(jìn)一步包括 根據(jù)方面呈現(xiàn)關(guān)于實(shí)體的信息的概要。
3.根據(jù)權(quán)利要求1的方法,其中所述一個(gè)或多個(gè)搜索結(jié)果集包括響應(yīng)于所述查詢的搜索結(jié)果集。
4.根據(jù)權(quán)利要求1的方法,其中所述一個(gè)或多個(gè)搜索結(jié)果集中的每一個(gè)對應(yīng)于與所述實(shí)體相關(guān)聯(lián)的相應(yīng)方面。
5.一種方法,包括 接收標(biāo)識實(shí)體的數(shù)據(jù);在計(jì)算機(jī)系統(tǒng)中生成用于所述實(shí)體的一組候選方面,所述計(jì)算機(jī)系統(tǒng)包括一個(gè)或多個(gè)計(jì)算機(jī);在所述計(jì)算機(jī)系統(tǒng)中修改所述一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);在所述計(jì)算機(jī)系統(tǒng)中基于多樣性得分和流行性得分對所述一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名;以及在所述計(jì)算機(jī)系統(tǒng)的數(shù)據(jù)存儲設(shè)備中存儲一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與所述實(shí)體的關(guān)聯(lián)。
6.根據(jù)權(quán)利要求5的方法,進(jìn)一步包括 接收包括所述實(shí)體的查詢;識別與所述實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)方面; 接收響應(yīng)于所述查詢的搜索結(jié)果;以及基于識別出的方面而呈現(xiàn)所述搜索結(jié)果。
7.根據(jù)權(quán)利要求5的方法,進(jìn)一步包括 接收包括所述實(shí)體的查詢;識別與所述實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)方面;接收一個(gè)或多個(gè)搜索結(jié)果集,每個(gè)集對應(yīng)于識別出的方面之一;以及基于識別出的方面而呈現(xiàn)所述搜索結(jié)果。
8.根據(jù)權(quán)利要求5的方法,進(jìn)一步包括接收標(biāo)識一個(gè)或多個(gè)實(shí)體性質(zhì)的數(shù)據(jù),其中 生成所述一組候選方面包括使用所述一個(gè)或多個(gè)實(shí)體性質(zhì);以及所述一個(gè)或多個(gè)排名最高的候選方面與所述實(shí)體和所述實(shí)體性質(zhì)兩者相關(guān)聯(lián)。
9.根據(jù)權(quán)利要求5的方法,進(jìn)一步包括將所述實(shí)體與類別相關(guān)聯(lián),所述類別具有包括所述實(shí)體的一個(gè)或多個(gè)類別成員;以及其中生成所述一組候選方面包括生成對應(yīng)于所述實(shí)體和所述類別的候選方面。
10.根據(jù)權(quán)利要求9的方法,其中生成所述一組候選方面包括分析一個(gè)或多個(gè)第一用戶搜索歷史以識別與所述實(shí)體相關(guān)聯(lián)的查詢;以及分析一個(gè)或多個(gè)第二用戶搜索歷史以識別與所述實(shí)體以外的類別成員相關(guān)聯(lián)的查詢。
11.根據(jù)權(quán)利要求5的方法,其中組合候選方面包括計(jì)算相似度得分,其中每個(gè)相似度得分是對兩個(gè)候選方面之間的相似度的估計(jì);以及基于所述相似度得分將候選方面組合為單一的經(jīng)修改的候選方面。
12.根據(jù)權(quán)利要求11的方法,其中將每個(gè)候選方面表示為文本,并且兩個(gè)候選方面之間的相似度得分基于對與每個(gè)候選方面相關(guān)聯(lián)的文本的字符串的比較。
13.根據(jù)權(quán)利要求11的方法,其中計(jì)算兩個(gè)候選方面之間的相似度得分包括 接收針對每個(gè)方面的相應(yīng)搜索結(jié)果集;以及基于對所述搜索結(jié)果集的比較計(jì)算所述相似度得分。
14.根據(jù)權(quán)利要求13的方法,其中對所述搜索結(jié)果集的比較包括將所述搜索結(jié)果集之一中的搜索結(jié)果的路徑與所述搜索結(jié)果集的另一個(gè)中的搜索結(jié)果的路徑相比較。
15.根據(jù)權(quán)利要求13的方法,其中對所述搜索結(jié)果集的比較包括將所述搜索結(jié)果集之一中的搜索結(jié)果的標(biāo)題和摘錄與所述搜索結(jié)果集的另一個(gè)中的搜索結(jié)果的標(biāo)題和摘錄相比較。
16.根據(jù)權(quán)利要求11的方法,其中基于所述相似度得分組合候選方面進(jìn)一步包括 使用圖劃分算法來確定組合哪些方面。
17.根據(jù)權(quán)利要求5的方法,其中使用一個(gè)或多個(gè)方面類別對候選方面進(jìn)行歸組包括 將兩個(gè)或更多候選方面與相應(yīng)的方面類別相關(guān)聯(lián);以及基于兩個(gè)或更多候選方面的方面類別將其歸組到單一的經(jīng)修改的候選方面。
18.根據(jù)權(quán)利要求17的方法,其中所述單一的經(jīng)修改的候選方面是方面類別。
19.根據(jù)權(quán)利要求5的方法,其中基于多樣性得分和流行性得分對一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名包括針對每個(gè)方面計(jì)算流行性得分; 將流行性得分最高的方面排名為最高;以及通過重復(fù)以下步驟一次或多次來對其余方面排名計(jì)算針對每個(gè)未排名的方面的相似度得分,其中所述相似度得分將未排名的方面與已排名的方面的相似度相比較;以及將下一最高排名指派給其流行性得分除以其相似度得分的結(jié)果為最高的方面。
20.一種編碼有計(jì)算機(jī)程序的計(jì)算機(jī)存儲介質(zhì),所述程序包括指令,所述指令當(dāng)由數(shù)據(jù)處理裝置執(zhí)行時(shí)致使所述數(shù)據(jù)處理裝置執(zhí)行包括以下步驟的操作 接收包括實(shí)體的查詢; 生成用于所述實(shí)體的一組候選方面;修改所述一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);基于多樣性得分和流行性得分對所述一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名;將一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與所述實(shí)體相關(guān)聯(lián); 接收一個(gè)或多個(gè)搜索結(jié)果集;以及響應(yīng)于所述查詢而提供對所述搜索結(jié)果的呈現(xiàn),所述呈現(xiàn)呈遞了根據(jù)與所述實(shí)體相關(guān)聯(lián)的方面而組織的搜索結(jié)果。
21.根據(jù)權(quán)利要求20的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步操作為致使所述數(shù)據(jù)處理裝置執(zhí)行包括以下步驟的操作根據(jù)方面呈現(xiàn)關(guān)于實(shí)體的信息的概要。
22.根據(jù)權(quán)利要求20的計(jì)算機(jī)程序產(chǎn)品,其中所述一個(gè)或多個(gè)搜索結(jié)果集包括響應(yīng)于所述查詢的搜索結(jié)果集。
23.根據(jù)權(quán)利要求20的計(jì)算機(jī)程序產(chǎn)品,其中所述一個(gè)或多個(gè)搜索結(jié)果集中的每一個(gè)對應(yīng)于與所述實(shí)體相關(guān)聯(lián)的相應(yīng)方面。
24.一種編碼有計(jì)算機(jī)程序的計(jì)算機(jī)存儲介質(zhì),所述程序包括指令,所述指令當(dāng)由數(shù)據(jù)處理裝置執(zhí)行時(shí)致使所述數(shù)據(jù)處理裝置執(zhí)行包括以下步驟的操作接收標(biāo)識實(shí)體的數(shù)據(jù);生成用于所述實(shí)體的一組候選方面;修改所述一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);基于多樣性得分和流行性得分對所述一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名;以及存儲一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與所述實(shí)體的關(guān)聯(lián)。
25.根據(jù)權(quán)利要求M的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步操作為致使所述數(shù)據(jù)處理裝置執(zhí)行包括以下步驟的操作接收包括所述實(shí)體的查詢; 識別與所述實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)方面; 接收響應(yīng)于所述查詢的搜索結(jié)果;以及基于識別出的方面而呈現(xiàn)所述搜索結(jié)果。
26.根據(jù)權(quán)利要求M的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步操作為致使所述數(shù)據(jù)處理裝置執(zhí)行包括以下步驟的操作接收包括所述實(shí)體的查詢;識別與所述實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)方面;接收一個(gè)或多個(gè)搜索結(jié)果集,每個(gè)集對應(yīng)于識別出的方面之一;以及基于識別出的方面而呈現(xiàn)所述搜索結(jié)果。
27.根據(jù)權(quán)利要求M的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步操作為致使所述數(shù)據(jù)處理裝置執(zhí)行包括接收標(biāo)識一個(gè)或多個(gè)實(shí)體性質(zhì)的數(shù)據(jù)的操作,其中生成所述一組候選方面包括使用所述一個(gè)或多個(gè)實(shí)體性質(zhì);以及所述一個(gè)或多個(gè)排名最高的候選方面與所述實(shí)體和所述實(shí)體性質(zhì)兩者相關(guān)聯(lián)。
28.根據(jù)權(quán)利要求M的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步操作為致使所述數(shù)據(jù)處理裝置執(zhí)行包括以下步驟的操作將所述實(shí)體與類別相關(guān)聯(lián),所述類別具有包括所述實(shí)體的一個(gè)或多個(gè)類別成員;以及其中生成所述一組候選方面包括生成對應(yīng)于所述實(shí)體和所述類別的候選方面。
29.根據(jù)權(quán)利要求觀的計(jì)算機(jī)程序產(chǎn)品,其中生成所述一組候選方面包括 分析一個(gè)或多個(gè)第一用戶搜索歷史以識別與所述實(shí)體相關(guān)聯(lián)的查詢;以及分析一個(gè)或多個(gè)第二用戶搜索歷史以識別與所述實(shí)體以外的類別成員相關(guān)聯(lián)的查詢。
30.根據(jù)權(quán)利要求M的計(jì)算機(jī)程序產(chǎn)品,其中組合候選方面包括計(jì)算相似度得分,其中每個(gè)相似度得分是對兩個(gè)候選方面之間的相似度的估計(jì);以及基于所述相似度得分將候選方面組合為單一的經(jīng)修改的候選方面。
31.根據(jù)權(quán)利要求30的計(jì)算機(jī)程序產(chǎn)品,其中將每個(gè)候選方面表示為文本,并且兩個(gè)候選方面之間的相似度得分基于對與每個(gè)候選方面相關(guān)聯(lián)的文本的字符串的比較。
32.根據(jù)權(quán)利要求M的計(jì)算機(jī)程序產(chǎn)品,其中計(jì)算兩個(gè)候選方面之間的相似度得分包括接收針對每個(gè)方面的相應(yīng)搜索結(jié)果集;以及基于對所述搜索結(jié)果集的比較計(jì)算所述相似度得分。
33.根據(jù)權(quán)利要求32的計(jì)算機(jī)程序產(chǎn)品,其中對所述搜索結(jié)果集的比較包括將所述搜索結(jié)果集之一中的搜索結(jié)果的路徑與所述搜索結(jié)果集的另一個(gè)中的搜索結(jié)果的路徑相比較。
34.根據(jù)權(quán)利要求32的計(jì)算機(jī)程序產(chǎn)品,其中對所述搜索結(jié)果集的比較包括將所述搜索結(jié)果集之一中的搜索結(jié)果的標(biāo)題和摘錄與所述搜索結(jié)果集的另一個(gè)中的搜索結(jié)果的標(biāo)題和摘錄相比較。
35.根據(jù)權(quán)利要求30的計(jì)算機(jī)程序產(chǎn)品,其中基于所述相似度得分組合候選方面進(jìn)一步包括使用圖劃分算法來確定組合哪些方面。
36.根據(jù)權(quán)利要求M的計(jì)算機(jī)程序產(chǎn)品,其中使用一個(gè)或多個(gè)方面類別對候選方面進(jìn)行歸組包括將兩個(gè)或更多候選方面與相應(yīng)的方面類別相關(guān)聯(lián);以及基于兩個(gè)或更多候選方面的方面類別將其歸組到單一的經(jīng)修改的候選方面。
37.根據(jù)權(quán)利要求36的計(jì)算機(jī)程序產(chǎn)品,其中所述單一的經(jīng)修改的候選方面是方面類別。
38.根據(jù)權(quán)利要求M的計(jì)算機(jī)程序產(chǎn)品,其中基于多樣性得分和流行性得分對一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名包括針對每個(gè)方面計(jì)算流行性得分; 將流行性得分最高的方面排名為最高;以及通過重復(fù)以下步驟一次或多次來對其余方面排名計(jì)算針對每個(gè)未排名的方面的相似度得分,其中所述相似度得分將未排名的方面與已排名的方面的相似度相比較;以及將下一最高排名指派給其流行性得分除以其相似度得分的結(jié)果為最高的方面。
39.一種系統(tǒng),包括 處理器;以及包括指令的計(jì)算機(jī)存儲介質(zhì),所述指令當(dāng)由所述處理器執(zhí)行時(shí)致使所述處理器執(zhí)行包括以下步驟的操作接收包括實(shí)體的查詢;生成用于所述實(shí)體的一組候選方面;修改所述一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);基于多樣性得分和流行性得分對所述一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名;將一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與所述實(shí)體相關(guān)聯(lián); 接收一個(gè)或多個(gè)搜索結(jié)果集;以及響應(yīng)于所述查詢而提供對所述搜索結(jié)果的呈現(xiàn),所述呈現(xiàn)呈遞了根據(jù)與所述實(shí)體相關(guān)聯(lián)的方面而組織的搜索結(jié)果。
40.根據(jù)權(quán)利要求39的系統(tǒng),進(jìn)一步操作為執(zhí)行包括以下步驟的操作 根據(jù)方面呈現(xiàn)關(guān)于實(shí)體的信息的概要。
41.根據(jù)權(quán)利要求39的系統(tǒng),其中所述一個(gè)或多個(gè)搜索結(jié)果集包括響應(yīng)于所述查詢的搜索結(jié)果集。
42.根據(jù)權(quán)利要求39的系統(tǒng),其中所述一個(gè)或多個(gè)搜索結(jié)果集中的每一個(gè)對應(yīng)于與所述實(shí)體相關(guān)聯(lián)的相應(yīng)方面。
43.一種系統(tǒng),包括 處理器;以及包括指令的計(jì)算機(jī)存儲介質(zhì),所述指令當(dāng)由所述處理器執(zhí)行時(shí)致使所述處理器執(zhí)行包括以下步驟的操作接收標(biāo)識實(shí)體的數(shù)據(jù);生成用于所述實(shí)體的一組候選方面;修改所述一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);基于多樣性得分和流行性得分對所述一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名;存儲一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與所述實(shí)體的關(guān)聯(lián)。
44.根據(jù)權(quán)利要求43的系統(tǒng),進(jìn)一步操作為執(zhí)行包括以下步驟的操作 接收包括所述實(shí)體的查詢;識別與所述實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)方面; 接收響應(yīng)于所述查詢的搜索結(jié)果;以及基于識別出的方面而呈現(xiàn)所述搜索結(jié)果。
45.根據(jù)權(quán)利要求43的系統(tǒng),進(jìn)一步操作為執(zhí)行包括以下步驟的操作 接收包括所述實(shí)體的查詢;識別與所述實(shí)體相關(guān)聯(lián)的一個(gè)或多個(gè)方面; 接收一個(gè)或多個(gè)搜索結(jié)果集,每個(gè)集對應(yīng)于識別出的方面之一;以及基于識別出的方面而呈現(xiàn)所述搜索結(jié)果。
46.根據(jù)權(quán)利要求43的系統(tǒng),進(jìn)一步操作為執(zhí)行包括接收標(biāo)識一個(gè)或多個(gè)實(shí)體性質(zhì)的數(shù)據(jù)的操作,其中生成所述一組候選方面包括使用所述一個(gè)或多個(gè)實(shí)體性質(zhì);以及所述一個(gè)或多個(gè)排名最高的候選方面與所述實(shí)體和所述實(shí)體性質(zhì)兩者相關(guān)聯(lián)。
47.根據(jù)權(quán)利要求43的系統(tǒng),進(jìn)一步操作為執(zhí)行包括以下步驟的操作將所述實(shí)體與類別相關(guān)聯(lián),所述類別具有包括所述實(shí)體的一個(gè)或多個(gè)類別成員;以及其中生成所述一組候選方面包括生成對應(yīng)于所述實(shí)體和所述類別的候選方面。
48.根據(jù)權(quán)利要求47的系統(tǒng),其中生成所述一組候選方面包括分析一個(gè)或多個(gè)第一用戶搜索歷史以識別與所述實(shí)體相關(guān)聯(lián)的查詢;以及分析一個(gè)或多個(gè)第二用戶搜索歷史以識別與所述實(shí)體以外的類別成員相關(guān)聯(lián)的查詢。
49.根據(jù)權(quán)利要求43的系統(tǒng),其中組合候選方面包括計(jì)算相似度得分,其中每個(gè)相似度得分是對兩個(gè)候選方面之間的相似度的估計(jì);以及基于所述相似度得分將候選方面組合為單一的經(jīng)修改的候選方面。
50.根據(jù)權(quán)利要求49的系統(tǒng),其中將每個(gè)候選方面表示為文本,并且兩個(gè)候選方面之間的相似度得分基于對與每個(gè)候選方面相關(guān)聯(lián)的文本的字符串的比較。
51.根據(jù)權(quán)利要求49的系統(tǒng),其中計(jì)算兩個(gè)候選方面之間的相似度得分包括 接收針對每個(gè)方面的相應(yīng)搜索結(jié)果集;以及基于對所述搜索結(jié)果集的比較計(jì)算所述相似度得分。
52.根據(jù)權(quán)利要求51的系統(tǒng),其中對所述搜索結(jié)果集的比較包括將所述搜索結(jié)果集之一中的搜索結(jié)果的路徑與所述搜索結(jié)果集的另一個(gè)中的搜索結(jié)果的路徑相比較。
53.根據(jù)權(quán)利要求51的系統(tǒng),其中對所述搜索結(jié)果集的比較包括將所述搜索結(jié)果集之一中的搜索結(jié)果的標(biāo)題和摘錄與所述搜索結(jié)果集的另一個(gè)中的搜索結(jié)果的標(biāo)題和摘錄相比較。
54.根據(jù)權(quán)利要求49的系統(tǒng),其中基于所述相似度得分組合候選方面進(jìn)一步包括 使用圖劃分算法來確定組合哪些方面。
55.根據(jù)權(quán)利要求43的系統(tǒng),其中使用一個(gè)或多個(gè)方面類別對候選方面進(jìn)行歸組包括將兩個(gè)或更多候選方面與相應(yīng)的方面類別相關(guān)聯(lián);以及基于兩個(gè)或更多候選方面的方面類別將其歸組到單一的經(jīng)修改的候選方面。
56.根據(jù)權(quán)利要求55的系統(tǒng),其中所述單一的經(jīng)修改的候選方面是方面類別。
57.根據(jù)權(quán)利要求43的系統(tǒng),其中基于多樣性得分和流行性得分對一個(gè)或多個(gè)經(jīng)修改的候選方面進(jìn)行排名包括計(jì)算針對每個(gè)方面的流行性得分; 將流行性得分最高的方面排名為最高;以及通過重復(fù)以下步驟一次或多次來對其余方面排名計(jì)算針對每個(gè)未排名的方面的相似度得分,其中所述相似度得分將未排名的方面與已排名的方面的相似度相比較;以及將下一最高排名指派給其流行性得分除以其相似度得分的結(jié)果為最高的方面。
全文摘要
用于生成與實(shí)體相關(guān)聯(lián)的方面的方法、系統(tǒng)和裝置,包括計(jì)算機(jī)程序產(chǎn)品。在某些實(shí)現(xiàn)中,一種方法包括接收標(biāo)識實(shí)體的數(shù)據(jù);生成用于實(shí)體的一組候選方面;修改該一組候選方面以生成一組經(jīng)修改的候選方面,包括使用一個(gè)或多個(gè)方面類別來組合類似的候選方面并且將候選方面歸組,每個(gè)方面類別與一個(gè)或多個(gè)候選方面相關(guān)聯(lián);基于多樣性得分和流行性得分對該一組經(jīng)修改的候選方面中的一個(gè)或多個(gè)經(jīng)修改的候選方面排名;以及存儲一個(gè)或多個(gè)排名最高的經(jīng)修改的候選方面與實(shí)體之間的關(guān)聯(lián)。這些方面可以用于響應(yīng)于針對實(shí)體的查詢而組織和呈現(xiàn)搜索結(jié)果。
文檔編號G06F17/30GK102349072SQ201080011911
公開日2012年2月8日 申請日期2010年1月27日 優(yōu)先權(quán)日2009年1月30日
發(fā)明者A·阿萊維, J·馬德哈范, 吳飛 申請人:谷歌公司