獲得對與用戶認識的人員相關的問題的回答。例如,如本文所描述的,系統(tǒng)和/或方法可以利用與用戶認識的人員相關的信息來填充例如索引的數(shù)據結構。信息可以從各種來源獲得,諸如用戶的電話聯(lián)系人、用戶的電子郵件聯(lián)系人、用戶的日程表、用戶所屬的社交網絡等等。信息例如可包括聯(lián)系人信息(諸如地址、電話號碼、電子郵件地址等等)、生日、識別職業(yè)的信息、識別該人員正在就讀或者曾經就讀的學校的信息等等。
[0035]如本文所描述的,系統(tǒng)和/或方法可以從用戶接收諸如“wheredoes Jane live(Jane住在哪里)?”的自然語言、人員相關問題。如本文所描述的,系統(tǒng)和/或方法可以基于自然語言、人員相關問題形成搜索查詢,并且使用索引來獲得回答該問題的人員相關數(shù)據。因此,對于示例問題“where does Jane live(Jane住在哪里)?”,如本文所描述的,系統(tǒng)和/或方法可以在索引中識別名叫Jane的人員,獲得所識別人員的家庭地址,并且向用戶提供用于一個或多個所識別人員的地址。通過這種方式,系統(tǒng)和/或用戶可以允許用戶容易地獲得與用戶認識的人員相關的信息。
[0036]如本文所使用的,術語文檔被廣泛地解釋為包括任何機器可讀和機器可存儲的工作產品。例如,文檔可包括網站、電子郵件、業(yè)務列表、文件、文件的組合、具有到其他文件的嵌入式鏈接的一個或多個文件、新聞組發(fā)布、博客等等。在互聯(lián)網背景下,常見的文檔是網頁。文檔經常包括文本信息,并且可包括嵌入式信息,諸如元信息、圖像、超鏈接等,和/或嵌入式指令,諸如Javascript等等。
[0037]對于所述的系統(tǒng)和方法,用戶可以控制程序或特征是否收集用戶個人信息(例如關于用戶的社交網絡、動作、活動、用戶的偏好、或者用戶的當前位置的信息),或者收集或使用這些信息的程度。此外,在存儲或使用數(shù)據之前可以按照一種或多種方式處理某些數(shù)據,從而為用戶移除、加密、和/或以其他方式保護個人可識別的信息。因此,用戶可以控制怎樣由服務器收集和使用關于用戶的信息。
[0038]圖1A-圖1C是圖示出本文所述的一些實施方式的概覽100的圖。例如,100假定用戶在進行向他的朋友Bob發(fā)送生日卡的處理。但是,用戶不記得Bob的家庭地址。因此,用戶可以在用戶設備上發(fā)起搜索應用。參照圖1A,用戶可以可聽地向用戶設備提供問題“What’sBob’s home address(Bob的家庭地址是什么)?”。
[0039]如圖1B所示,用戶設備可以向搜索系統(tǒng)發(fā)送該問題,作為搜索查詢。該搜索系統(tǒng)可以確定,該搜索查詢涉及獲得與個人相關的信息。因此,基于接收到的搜索查詢,搜索系統(tǒng)可以形成結構化查詢,示出為““NAME: ’BOB’ATTRIBUTE: ’ADDRESS’TYPE: ’HOME(姓名:’BOB’屬性:’地址’類型:’家庭’”)”。搜索系統(tǒng)可以使用包括人員相關數(shù)據的索引來識別用戶認識的名叫Bob的人員,并獲得這些人員的家庭地址。搜索系統(tǒng)可以向用戶提供包括識別被識別人員以及他們的家庭地址中的一個或多個的信息的文檔,如圖1C所示。通過這種方式,用戶可以容易地獲得所期望的他朋友Bob的家庭地址。
[0040]圖2是可以實現(xiàn)本文所述的其中的系統(tǒng)和/或方法的示例環(huán)境200的圖。環(huán)境200可包括經由網絡250連接到多個服務器220-240的用戶設備210。
[0041]用戶設備210可包括能夠與服務器220交互以進行搜索的設備。用戶設備210的示例可包括個人計算機、膝上型計算機、平板計算機、個人數(shù)字助理、移動電話(諸如智能電話)等等。用戶設備210可包括通過一個或多個瀏覽器(例如web瀏覽器)呈現(xiàn)的用戶界面。
[0042]服務器220-240可包括按照本文所述的方式采集、處理、搜索、和/或實現(xiàn)功能的服務器設備。每個服務器220-240可以實現(xiàn)為單一服務器設備,或者是服務器設備的集合,它們可以放在一起,也可以遠程放置。附加地或替選地,可以在單一、公共服務器設備或者單一、公共服務器設備的集合內實現(xiàn)服務器220-240的兩個或多個。雖然將服務器220-240示出為分立組件,但是對于服務器220-240中的一個或多個而言執(zhí)行服務器220-240中的其他一個或多個的功能中的一個或多個是可能的。
[0043]如圖2所示,服務器220可以實現(xiàn)搜索系統(tǒng)225,搜索系統(tǒng)225接收來自用戶設備210的搜索查詢,并且將響應的搜索結果提供給搜索查詢。服務器220可以爬取(crawl)文檔(例如網頁)的語料庫、將文檔編索引、并且存儲與文檔相關聯(lián)的信息。服務器230和240可以存儲或保持文檔,包括可包括人員相關數(shù)據(可被服務器220爬取或分析)的文檔。
[0044]網絡250可包括任何類型的網絡,諸如例如局域網(又稱為“LAN”)、廣域網(又稱為“WAN”)、電話網絡(諸如公共交換電話網絡或蜂窩網絡)、內聯(lián)網、互聯(lián)網、網絡的組合等等。用戶設備210和服務器220-240可經由有線和/或無線連接與網絡250相連接。換言之,用戶設備210和服務器220-240中的任何一個都可經由有線連接、無線連接、或者有線連接與無線連接的組合連接到網絡250。
[0045]雖然圖2示出環(huán)境200的示例組件,但是在一些實施方式中,環(huán)境200可包括與圖2所示組件相比附加的組件、更少的組件、不同的組件、和/或按照不同方式布置的組件。附加地或替選地,環(huán)境200的組件中的一個或多個可以執(zhí)行被描述為由環(huán)境200的其他組件中的一個或多個執(zhí)行的一個或多個任務。
[0046]圖3是根據本文所述的一個或多個實施方式,可以存儲人員相關數(shù)據的示例數(shù)據結構300。在一些實施方式中,數(shù)據結構300可以采用索引的形式。數(shù)據結構300可以存儲在與圖2所示一個或多個設備相關聯(lián)的存儲器中。例如,數(shù)據結構300可由服務器220存儲,或者與其相關聯(lián)地存儲。在一些實施方式中,數(shù)據結構300可由圖2的一個或多個其他組件存儲,或者與其相關聯(lián)地存儲。
[0047]在一些實施方式中,數(shù)據結構300可以排他地與用戶相關聯(lián)。在這種情況下,數(shù)據結構300可包括關于用戶認識的人員的信息。
[0048]數(shù)據結構300可包括字段的集合,例如姓名(Name)字段310和屬性/類型/值(Attributes/Types/Values)字段320。姓名字段310可以存儲識別個人的信息。該信息例如可包括名、中間名、姓、和/或名、中間名和/或姓的組合。在一些實施方式中,信息可包括昵稱。
[0049]屬性/類型/值字段320可以存儲與姓名字段310中識別的對應個人相關的信息。例如,與姓名Bob Smith相關聯(lián)的屬性/類型/值字段320的條目可以存儲與Bob Smith相關的信息。類似地,與姓名Jane Smith相關聯(lián)的屬性/類型/值字段320的條目可以存儲與JaneSmith相關的信息。
[0050]如所示,屬性/類型/值字段320可包括屬性(Attribute)字段322、類型(Type)字段324、以及值(Value)字段326。屬性字段320可以存儲唯一地識別與姓名字段310中識別的對應個人相關聯(lián)的信息的類別的信息。示例類別可包括昵稱、標簽(例如,識別用戶在其中將個人分類的類別,諸如配偶、朋友、同事等)、地址、電話號碼、電子郵件地址、傳真號碼、照片、學校、職業(yè)、生日、當前位置等等。
[0051]類型字段324可以存儲唯一地識別在屬性字段322中識別的類別的子類別的信息。例如,地址類別可包括家庭、工作等等的子類別。電話號碼類別可包括家庭、工作、移動等等的子類別。電子郵件地址類別可包括個人、工作等等的子類別。學校類別可包括高中、大學等等的子類別。在一些實施方式中,類型字段324可包括用于特定類別的類似子類別。例如,假定個人具有多個個人電子郵件地址,則類型字段324可包括個人1子類別、個人2子類別等等。
[0052]對于在屬性字段322和類型字段324中識別的類別和子類別,值字段326可以存儲與姓名字段310中識別的對應個人相關的信息。作為一個示例,數(shù)據結構300可以存儲指示Bob Smith的昵稱為“Smitty”的信息。因此,對于昵稱類別,值字段326可以存儲值Smitty。
[0053]在一些實施方式中,值字段326可以存儲用于特定個人的特定類別/子類別的信息的多個集合。例如,對于地址類別和家庭子類別,值字段326可以連同一個或多個先前的家庭地址一起,存儲用于個人的當前家庭地址。
[0054]雖然圖3示出數(shù)據結構300的示例字段,但是在一些實施方式中,數(shù)據結構300可包括與圖3所示字段相比附加的字段、不同的字段、和/或更少的字段。
[0055]圖4是根據本文所述的一個或多個實施方式,用于產生人員相關數(shù)據結構的示例處理400的流程圖。在一些實施方式中,處理400可由服務器220來執(zhí)行。在一些實施方式中,處理400可由代替服務器220或者有可能與服務器220結合的一個或多個其他設備(諸如用戶設備210)來執(zhí)行。
[0056]處理400可包括識別要從其獲得人員相關數(shù)據的位置(多個)(步驟410)。例如,月艮務器220可以從用戶接收指示要收集人員相關數(shù)據的請求。作為響應,服務器220可以識別可以從其獲得人員相關數(shù)據的一個或多個存儲器位置、一個或多個文件、一個或多個賬戶(諸如電子郵件賬戶或社交網絡賬戶)。
[0057]在一些實施方式中,服務器220可以自動識別位置(多個)。例如,服務器220可以識別用戶與其相關聯(lián)的賬戶的類型,諸如電子郵件賬戶、社交網絡賬戶等等,并且可以識別與這些賬戶相關聯(lián)的存儲人員相關數(shù)據的位置(多個)。在一些實施方式中,服務器220可以從用戶接收識別位置(多個)的信息。在這些實施方式中,服務器220可以向用戶提供用戶界面,允許用戶識別位置(多個)。在一些實施方式中,服務器220可以在沒有用戶輸入的情況下識別位置(多個)。
[0058]示例位置可包括電子郵件賬戶、文本消息賬戶、電話聯(lián)系人文件、日程表、語音通信記錄、社交網絡、互聯(lián)網位置、經由人員相關數(shù)據的手動輸入的用戶、和/或可從其獲得人員相關數(shù)據的其他類型位置。關于電子郵件賬戶,位置(多個)例如可包括電子郵件聯(lián)系人文件、電子郵件內容等等。關于文本消息賬戶,位置(多個)例如可包括文本消息聯(lián)系人文件、文本消息內容等等。關于語音通信記錄,位置(多個)例如可包括識別曾呼叫用戶的人員的語音記錄、曾呼叫用戶的人員的電話號碼等等。語音通信記錄還可包括語音郵件消息的內容。關于社交網絡,位置(多個)例如可包括朋友列表、帖子的內容等等。關于互聯(lián)網位置,位置(多個)例如可包括可從其獲得人員相關數(shù)據的網站(諸如,提供電話號碼查找表的網站、提供地址查找的網站等等)的網絡地址、要用于獲得人員相關數(shù)據的搜索查詢的存儲器位置、和/或允許從網絡獲得人員相關數(shù)據的其他信息。關于手動輸入,服務器220可以向用戶提供用戶界面,允許用戶對于用戶認識的不同人員,手動指定人員相關數(shù)據。
[0059]處理400可進一步包括獲得與在位置(多個)中識別的每個個人相關的信息(步驟420)。例如,服務器220可以從所識別的位置提取人員相關數(shù)據。作為一個示例,服務器220可以解析電話聯(lián)系人文件,并連同其對應的聯(lián)系人信息一起,提取電話聯(lián)系人文件中包括的每個個人的姓名。因此,如果電話聯(lián)系人文件連同Bob的家庭電話號碼555-555-1234、Bob的家庭地址123Villa Street,Fairfax, VA 22030、以及Bob的個人電子郵件地址bsmithOpersonalmail.com—起,包括姓名Bob Smith,則服務器220將連同家庭電話號碼、家庭地址、以及個人電子郵件地址一起,提取姓名。
[0060]在一些實施方式中,可以從所識別位置的不同位置獲得相同的人員相關數(shù)據。例如,用戶可能將Bob Smith的家庭電話號碼和地址存儲在用戶的電話聯(lián)系人中以及用戶的電子郵件聯(lián)系人中。在這些實施方式中,服務器220可以消除重復信息。
[0061]處理400可進一步包括在數(shù)據結構中并且對于每個所識別的個人,將所獲得的信息與識別個人的信息相關聯(lián)(步驟430)。例如,在數(shù)據結構(例如數(shù)據結構300)中,服務器220可以產生條目,并且可以連同用于個人的屬性/類型