專利名稱:用于意圖分析、排序和關(guān)聯(lián)性的對本地和遠程數(shù)據(jù)源的基于客戶端的搜索的制作方法
用于意圖分析、排序和關(guān)聯(lián)性的對本地和遠程數(shù)據(jù)源的基 于客戶端的搜索背景技術(shù)
隨著技術(shù)的不斷發(fā)展,內(nèi)容創(chuàng)建和發(fā)布已經(jīng)變得大眾化,因此通過在因特網(wǎng)和社 交網(wǎng)絡(luò)上發(fā)布內(nèi)容以用于消費,在任何地點和任何設(shè)備上的任何人都可以是內(nèi)容發(fā)布者 (和可能的創(chuàng)建者)。類似地,在相連的企業(yè)環(huán)境中,用戶能通過共享服務(wù)等發(fā)布內(nèi)容以用 于企業(yè)內(nèi)部消費。然而,個人用戶創(chuàng)建和/或發(fā)布的這種能力已經(jīng)顯現(xiàn)為獨立的(分開的) 內(nèi)容可視化,并且提供對于給定主題通用的整個內(nèi)容的片段視圖。此外,數(shù)據(jù)隱含的社會因 素是無法知曉的。缺乏通過它來對接和搜索對應(yīng)范例的數(shù)據(jù)的單個總體的搜索框架。因 此,內(nèi)容消費者需要知道在其下存儲不同的數(shù)據(jù)類型的單獨的內(nèi)容存儲和發(fā)現(xiàn)范例,例如, 用于網(wǎng)頁內(nèi)容的搜索引擎和用于本地/企業(yè)內(nèi)容的操作系統(tǒng)搜索能力。發(fā)明內(nèi)容
以下給出經(jīng)簡化的內(nèi)容提要,以便提供對本文所述一些新穎實施例的基本認識。 該內(nèi)容提要并不是詳盡綜述,并且也不旨在標識關(guān)鍵/必要要素或界定其范圍。其唯一目 的是以簡化的形式提出某些概念,作為之后提出的更詳細描述的序言。
所公開的架構(gòu)包括駐留在本地客戶端設(shè)備(例如計算機、手機等)上的搜索引擎, 其使得能夠?qū)Ρ镜財?shù)據(jù)源和遠程數(shù)據(jù)源兩者的數(shù)據(jù)進行查詢意圖分析、結(jié)果排序和關(guān)聯(lián)性 處理。數(shù)據(jù)源包括但不限于本地數(shù)據(jù),例如,硬盤驅(qū)動器、閃速驅(qū)動器、文檔、用戶配置文件 信息、諸如家庭網(wǎng)絡(luò)的本地網(wǎng)絡(luò)、諸如臺式機、膝上型計算機、手機、平板電腦等的其它本地 用戶機器和設(shè)備;網(wǎng)絡(luò)數(shù)據(jù)源,例如,企業(yè)數(shù)據(jù)儲存庫和企業(yè)用戶機器/設(shè)備;以及基于網(wǎng) 絡(luò)的數(shù)據(jù)源,例如,社交網(wǎng)絡(luò)和網(wǎng)站。本地結(jié)果可以用網(wǎng)絡(luò)結(jié)果來擴充,但本地結(jié)果和網(wǎng)絡(luò) 結(jié)果也可以分開。
該架構(gòu)還采用全局訪問組件,該組件是對不同的數(shù)據(jù)發(fā)現(xiàn)范例的統(tǒng)一接口。全局 訪問組件提供對對應(yīng)的不同的范例數(shù)據(jù)集的訪問以創(chuàng)建信息聚合。本地搜索組件經(jīng)由全 局訪問組件從不同的數(shù)據(jù)集創(chuàng)建信息聚合,并且處理針對該信息聚合的查詢以返回搜索結(jié) 果。本地搜索組件進行用于推斷查詢意圖的查詢意圖分析、搜索結(jié)果排序、以及基于查詢意 圖的搜索結(jié)果關(guān)聯(lián)性處理。
為了完成前述和相關(guān)的目標,本文結(jié)合下面的描述和附圖描述了某些示例性的方 面。這些方面表明的只是本文所公開的原理可被實踐的各種方式,并且本發(fā)明的所有方面 和等同物都旨在包括在要求保護的主題的范圍內(nèi)。根據(jù)結(jié)合附圖時考慮的以下詳細描述, 其它優(yōu)點和新穎特征將變得顯而易見。
圖1示出根據(jù)所公開的架構(gòu)的系統(tǒng)。
圖2示出具有用于查詢處理和因特網(wǎng)分析、排序及關(guān)聯(lián)性處理的本地搜索組件的 更詳細系統(tǒng)。
圖3示出可選提取技術(shù)的搜索系統(tǒng)。
圖4示出根據(jù)所公開的架構(gòu)的搜索系統(tǒng)。
圖5不出用于生成網(wǎng)站建議的系統(tǒng)。
圖6示出根據(jù)所公開的架構(gòu)的方法。
圖7示出圖6的方法的另外的方面。
圖8示出根據(jù)所公開的架構(gòu)的備選方法。
圖9示出圖8的方法的另外的方面。
圖10示出根據(jù)所公開的架構(gòu)的計算系統(tǒng)的框圖,該系統(tǒng)執(zhí)行用于查詢意圖分析、 排序和關(guān)聯(lián)性的本地搜索引擎以及對不同數(shù)據(jù)集的全局訪問。
具體實施方式
所公開的架構(gòu)為駐留在本地設(shè)備(例如計算機、手機、平板電腦等)上的基于客戶 端的搜索引擎,其使得能夠?qū)Ρ镜財?shù)據(jù)源和遠程數(shù)據(jù)源兩者的數(shù)據(jù)進行查詢意圖分析、結(jié) 果排序和關(guān)聯(lián)性處理。數(shù)據(jù)源包括例如客戶端設(shè)備數(shù)據(jù)、基于企業(yè)的數(shù)據(jù)和基于網(wǎng)絡(luò)的數(shù) 據(jù)、以及能從這些源中的一個或多個或在它們中導(dǎo)出的任何社會方面,并且社會方面為做 出諸如用戶意圖的關(guān)于用戶搜索的推斷提供基礎(chǔ)。例如,當(dāng)用戶登入社交網(wǎng)絡(luò)時,數(shù)據(jù)能與 朋友和家人有關(guān)。當(dāng)用戶使用公司憑證登入到公司網(wǎng)絡(luò)時,數(shù)據(jù)能與雇員和專業(yè)交往有關(guān)。
另外,當(dāng)用戶訪問公司網(wǎng)絡(luò)時,可以訪問諸如電子郵件、文本消息、公司搜索歷史、 電話、公司數(shù)據(jù)、工作組成員等的數(shù)據(jù)。實質(zhì)上,可以在至少所有這些網(wǎng)絡(luò)上搜索網(wǎng)絡(luò)圖、社 交圖、以及從人員角度和數(shù)據(jù)角度與企業(yè)有關(guān)的圖。因此,所有這些范疇的數(shù)據(jù)類型(例 如,辦公套件應(yīng)用、通信應(yīng)用、文檔等)具有多種不同的類型。
此外,該架構(gòu)包括這樣的應(yīng)用,其能夠智能地調(diào)用相關(guān)聯(lián)的不同數(shù)據(jù)集的每個實 現(xiàn)范例并為內(nèi)容消費者提供對跨越數(shù)據(jù)豎井(siIo)的內(nèi)容的整體觀。
一般地,可搜索的信息索引被創(chuàng)建和發(fā)布。服務(wù)為用戶聚合信息。提取主項和主 題以便對信息聚合進行歸類、分組和瀏覽。因此,在不同的數(shù)據(jù)范例中提供單個搜索源。
基于信息的關(guān)聯(lián)性在組合索弓I上對搜索結(jié)果分類。用于計算關(guān)聯(lián)性的變量基于使 用環(huán)境而變化。例如,如果用戶正在尋找該用戶最近修改的文件,那么上次修改的日期可能 與該用戶可能已提供的任何搜索查詢一起是最高相關(guān)因素之一。
該架構(gòu)在客戶端系統(tǒng)、企業(yè)和網(wǎng)絡(luò)的信息源以及企業(yè)連接和社交連接中查找所有 內(nèi)容,并且具體而言例如與特定主題有關(guān)的內(nèi)容,從所聚合的信息中識別“熱點”和/或流 行主題,識別用戶興趣,并且分居數(shù)據(jù)網(wǎng)站建議網(wǎng)站。
可以在瀏覽器、網(wǎng)絡(luò)和本地搜索引擎上創(chuàng)建整理過的搜索歷史列表,這使得用戶 能夠快速地再次查找信息。
可以創(chuàng)建(例如通過選擇加入)用戶的可移植搜索配置文件(例如,在社會關(guān)系 方面),使得用戶能隨后使用任何所選設(shè)備。用戶也可以選擇與具有諸如針對在線零售商和 購物網(wǎng)站的推薦服務(wù)的網(wǎng)站共享搜索配置文件。搜索配置文件是這樣的網(wǎng)站可以選擇使用 以改進為其用戶提供的推薦服務(wù)的附加信息。另外,搜索配置文件的共享可通過例如商定 的購物折扣來激勵。
該架構(gòu)可以擴展至在諸如平臺搜索、瀏覽器應(yīng)用和/或網(wǎng)絡(luò)搜索引擎的其它應(yīng)用中使用聚合的信息以用于自動搜索查詢建議。智能分組和搜索能力可用來集成結(jié)果。即時 消息傳送應(yīng)用、電子郵件應(yīng)用、社交應(yīng)用、圖像、視頻、語音應(yīng)用(例如V0IP)或依賴于聯(lián)系 人信息的任何應(yīng)用都可以與合并的聯(lián)系人集成。
此外,通過創(chuàng)建網(wǎng)絡(luò)版本而使跨設(shè)備場景成為可能,該網(wǎng)絡(luò)版本與所有云應(yīng)用集 成以創(chuàng)建用戶信息的統(tǒng)一索引。
現(xiàn)在參考附圖,其中貫穿附圖相同的附圖標記用來表示相同的要素。在以下描述 中,為了說明起見,提出許多具體細節(jié),以便提供對它們的透徹理解。然而,可能顯而易見的 是,新穎實施例可以在沒有這些具體細節(jié)的情況下實施。在其它情況中,以框圖形式示出了 熟知的結(jié)構(gòu)和設(shè)備,以便有利于對它們進行描述。其目的在于涵蓋落在要求保護的主題的 精神和范圍內(nèi)的所有修改、等同物和替換形式。
圖1示出根據(jù)所公開的架構(gòu)的搜索系統(tǒng)100。系統(tǒng)100包括作為不同數(shù)據(jù)發(fā)現(xiàn)范 例104的統(tǒng)一接口的全局訪問組件102。全局訪問組件102提供對發(fā)現(xiàn)范例104的對應(yīng)不 同數(shù)據(jù)集106的訪問。本地搜索組件108經(jīng)由全局訪問組件102而創(chuàng)建來自不同數(shù)據(jù)集 106的信息的聚合110,并且針對信息的聚合110處理查詢112以返回搜索結(jié)果114。本地 搜索組件108進行用于推斷查詢意圖的查詢112的意圖分析、搜索結(jié)果排序、以及基于查詢 意圖的搜索結(jié)果關(guān)聯(lián)性處理。
本地搜索組件108從信息的聚合110創(chuàng)建數(shù)據(jù)的統(tǒng)一索引,其包括與用戶有關(guān)的 社會方面和從不同數(shù)據(jù)集導(dǎo)出的用戶數(shù)據(jù)。不同數(shù)據(jù)發(fā)現(xiàn)范例104包括基于客戶端的(本 地)范例和基于網(wǎng)絡(luò)的范例(例如,企業(yè)、因特網(wǎng)、社交網(wǎng)絡(luò)等)。搜索結(jié)果114包括與用戶 有關(guān)的基于客戶端的(本地)結(jié)果(例如,本地應(yīng)用、本地存儲設(shè)備等的結(jié)果)以及與用戶 有關(guān)的客戶端數(shù)據(jù)及網(wǎng)絡(luò)結(jié)果(例如,來自基于網(wǎng)絡(luò)的數(shù)據(jù)源、企業(yè)數(shù)據(jù)源等)和用戶的基 于網(wǎng)絡(luò)的數(shù)據(jù)。搜索結(jié)果114可分成本地結(jié)果和網(wǎng)絡(luò)結(jié)果,以用于呈現(xiàn)給用戶。不同的數(shù) 據(jù)發(fā)現(xiàn)范例104涉及與例如聯(lián)系人、消息、文檔或網(wǎng)站中的至少一個相關(guān)聯(lián)的數(shù)據(jù)集。本地 搜索組件108 (從聚合110)提取主項和主題以便對數(shù)據(jù)集進行歸類、分組和瀏覽。本地搜 索組件108從信息聚合的統(tǒng)一索引識別流行(和熱點)主題。本地搜索組件108經(jīng)由信息 的聚合110識別用戶興趣并基于用戶興趣建議網(wǎng)站。
圖2示出具有用于查詢處理和因特網(wǎng)分析、排序及關(guān)聯(lián)性處理的本地搜索組件的 更詳細系統(tǒng)200。系統(tǒng)200包括用于聚合來自不同的源的人員信息的人員聚合組件202。
人員信息組件202可包括聯(lián)系人枚舉和合并服務(wù)204,該服務(wù)訪問來自各種本地 和遠程源的聯(lián)系人信息。服務(wù)204聚合來自不同源的所有用戶聯(lián)系人。服務(wù)204調(diào)用不同 源服務(wù)的API (應(yīng)用接口)以獲得聯(lián)系人列表,然后基于諸如電子郵件識別符、名+姓等的 共同因素進行聯(lián)系人的合并。
系統(tǒng)200可包括但不限于與下列對象的集成在本地設(shè)備邊界內(nèi)用于聯(lián)系人的 客戶端通信應(yīng)用206(例如,Lync );用于來自本地設(shè)備邊界內(nèi)的電子郵件程序(例如, Outlook )的聯(lián)系人的套件應(yīng)用208 ;在企業(yè)邊界內(nèi)來自企業(yè)網(wǎng)絡(luò)210的聯(lián)系人信息;以及 來自因特網(wǎng)的諸如SkypeTM、Facebook 、Twitter 等的社交網(wǎng)絡(luò)212 (例如,社交、社交2和 社交3)的聯(lián)系人信息。
系統(tǒng)200可擴展至包括其它企業(yè)級社交網(wǎng)絡(luò)、諸如Google+ 的公用網(wǎng)絡(luò)、諸如 Thunderbird 的電子郵件客戶端、諸如Gmail 的網(wǎng)絡(luò)電子郵件、諸如Yahoo Messenger 的即時消息傳送客戶端,等等。服務(wù)204可以按預(yù)定間隔輪詢API以獲得對聯(lián)系人的任何 添加或更新。因此,服務(wù)204創(chuàng)建來自不同的源的合并的聯(lián)系人的單個數(shù)據(jù)庫214。
系統(tǒng)200還可包括作為人員聚合組件202 —部分的消息枚舉服務(wù)216,以用于聚合 來自不同源的消息信息。這里,系統(tǒng)200示出了對來自例如在本地設(shè)備邊界內(nèi)的電子郵件 程序(例如Outlook )的套件應(yīng)用208的消息以及來自社交網(wǎng)絡(luò)212的消息信息的提取和 處理。服務(wù)216聚合來自不同源的所有消息。服務(wù)216調(diào)用不同源的API以提供消息的列 表。在服務(wù)216下載和創(chuàng)建來自社交網(wǎng)絡(luò)的所有消息的本地副本的同時,出于性能原因,可 以實時鏈接到來自電子郵件程序的電子郵件。
系統(tǒng)200可擴展至包括其它企業(yè)級社交網(wǎng)絡(luò)、諸如Google+ 的公用網(wǎng)絡(luò)、諸如 Thunderbird 的電子郵件客戶端、諸如Gmail 的網(wǎng)絡(luò)電子郵件、諸如Yahoo Messenger 的即時消息傳送客戶端,等等。服務(wù)204可以按預(yù)定間隔輪詢API以獲得對消息的任何添 加或更新。服務(wù)216創(chuàng)建從不同的源獲得的消息的單個數(shù)據(jù)庫218。
系統(tǒng)200還可包括聚合來自不同源的文檔的列表的文檔聚合組件220。文檔聚合 組件220包括文檔枚舉服務(wù)222,該服務(wù)調(diào)用不同源的API以提供文檔的列表。出于性能原 因,服務(wù)222僅保持到文檔位置的指針的列表以及文檔元數(shù)據(jù);然而,這可以擴展至緩存或 索引文檔。這里,文檔枚舉服務(wù)222與本地設(shè)備邊界內(nèi)的套件應(yīng)用208和本地/網(wǎng)絡(luò)驅(qū)動 器224、企業(yè)邊界內(nèi)的企業(yè)文檔儲存庫226、以及因特網(wǎng)上的文檔228接合。服務(wù)222創(chuàng)建 從不同的源獲得的文檔的單個數(shù)據(jù)庫230。服務(wù)222按預(yù)定間隔輪詢API,以獲得對文檔和 文檔元數(shù)據(jù)的任何更新或添加。
系統(tǒng)200還包括經(jīng)由網(wǎng)站聚合組件232的網(wǎng)站信息聚合。網(wǎng)站聚合組件232包括 鏈接枚舉服務(wù)234,該服務(wù)聚合來自不同源的所有鏈接和站點。這里,服務(wù)234接合到本地 設(shè)備邊界內(nèi)的瀏覽器歷史和收藏夾信息236、企業(yè)邊界內(nèi)的企業(yè)文檔儲存庫226、以及因特 網(wǎng)的社交網(wǎng)絡(luò)中的一些。服務(wù)234調(diào)用不同源的API以提取和創(chuàng)建站點及鏈接的列表。服 務(wù)234創(chuàng)建來自不同的源的鏈接的單個數(shù)據(jù)庫238。
出于性能原因,服務(wù)234僅保持到站點的鏈接的列表以及相關(guān)聯(lián)的元數(shù)據(jù);然而, 這可以包括鏈接的緩存或索引。服務(wù)234按一定時間間隔輪詢API,以獲得對鏈接和相關(guān)聯(lián) 的元數(shù)據(jù)的任何更新或添加。
該系統(tǒng)可包括其它服務(wù),例如聚合跨越源的媒體文件的媒體文件聚合組件(未示 出)。該組件包括聚合跨越大量使用的源的所有媒體文件(例如,照片、文本、音樂和電影) 的服務(wù)。服務(wù)調(diào)用不同源的API以提取和創(chuàng)建媒體文件的分組且可瀏覽的列表。
出于性能原因,服務(wù)可配置成僅保持到媒體文件的鏈接的列表以及源所提供的任 何元數(shù)據(jù)。元數(shù)據(jù)屬性用來允許索引以及過濾以用于瀏覽文件。系統(tǒng)200可與媒體播放器、 照片應(yīng)用、繪畫程序、照片增強程序和通常用來存儲照片和視頻的文件夾集成。作為擴展, 可從諸如在線音樂服務(wù)等的其它大量使用的工具提取文件元數(shù)據(jù)。服務(wù)以預(yù)定間隔輪詢源 API,以獲得對于文件及相關(guān)聯(lián)的元數(shù)據(jù)的任何更新或添加。
基于上下文的主導(dǎo)主題而對所有上述內(nèi)容進行歸類和分組,以輔助用戶瀏覽信息 并找到所需內(nèi)容。主題可以是貫穿消息和文檔的主導(dǎo)主題,發(fā)送者可以是消息中的主導(dǎo)主 題,站點類別可以是鏈接中的主導(dǎo)主題,并且新近性可以是貫穿聯(lián)系人、消息、文檔和站點 的主導(dǎo)主題。
圖3示出可選的提取技術(shù)的搜索系統(tǒng)300。在第一提取實施方式(用虛線表示) 中,本地搜索組件108包括可用來提取主項和識別主題以對信息分組的關(guān)鍵詞提取服務(wù) 302和關(guān)鍵詞頻率。分組的信息存儲在數(shù)據(jù)存儲304中。在備選方法中,新創(chuàng)建的實體提取 服務(wù)306或現(xiàn)有的實體提取服務(wù)(本地或基于云的)可用來識別要依據(jù)其分組的主題。
圖4示出根據(jù)所公開的架構(gòu)的搜索系統(tǒng)400。系統(tǒng)400提供用于在信息聚合中搜 索的備選選項使用互連虛線的第一系統(tǒng)選項和使用互連點劃線的第二系統(tǒng)選項。第一系 統(tǒng)選項采用用于本地設(shè)備邊界內(nèi)的人員(聯(lián)系人和消息)、文檔和站點的關(guān)鍵詞提取的本 地搜索組件108來輸出搜索結(jié)果114。第二系統(tǒng)選項采用搜索聚合服務(wù)402來創(chuàng)建搜索聚 合404,搜索聚合404僅從本地設(shè)備邊界內(nèi)的內(nèi)容獲得,但也經(jīng)由企業(yè)邊界內(nèi)的企業(yè)文檔儲 存庫搜索服務(wù)406和因特網(wǎng)邊界內(nèi)的網(wǎng)絡(luò)搜索引擎408而獲得。
相對于在聚合信息中的搜索,本地設(shè)備搜索引擎可以被使用或擴展至搜索聯(lián)系人 和信息的統(tǒng)一的組。搜索文檔和鏈接元數(shù)據(jù)被使能但可以擴展至搜索文檔的內(nèi)容或站點內(nèi) 容。這可以通過多種方式實現(xiàn),其中一些描述如下。
可以創(chuàng)建文檔和站點內(nèi)容的臨時副本,并且使用操作系統(tǒng)的搜索能力(或任何本 地設(shè)備搜索引擎)來在內(nèi)容中進行索引和搜索。這涉及第一系統(tǒng)選項。
備選地或與其結(jié)合,操作系統(tǒng)搜索能力(或任何本地設(shè)備搜索引擎)可用來在本 地內(nèi)容中搜索,與任何現(xiàn)有的企業(yè)搜索引擎集成以在來自企業(yè)儲存庫的內(nèi)容中搜索,并且 使用(多個)網(wǎng)絡(luò)搜索引擎408來在網(wǎng)站的內(nèi)容中搜索。可以使用OpenSearch協(xié)議來實 現(xiàn)這一目的。這涉及第二系統(tǒng)選項。
對于網(wǎng)絡(luò)版本的解決方案來說,可以利用網(wǎng)絡(luò)搜索引擎的索引能力,其中本地搜 索組件108可以是網(wǎng)絡(luò)搜索引擎。這涉及第一系統(tǒng)選項。
相對于從消息、文檔或站點提取實體以查找相關(guān)內(nèi)容,這類似于以上歸類和分類 的描述。當(dāng)用戶選擇項目(例如,電子郵件)時,可使用與圖3相同的系統(tǒng)300來從該項目 (例如,電子郵件)中提取主導(dǎo)的關(guān)鍵詞。然后可采用圖4的系統(tǒng)400來查找所有相關(guān)內(nèi)容。
為方便瀏覽而用來對內(nèi)容歸類、分類或分組的系統(tǒng)300可用來識別由用戶接收的 消息中的首要項和該首要項在消息中的頻率。這有助于識別由用戶接收的消息中討論最多 的“熱點”主題。
圖5示出用于生成網(wǎng)站建議的系統(tǒng)500。聚合的鏈接數(shù)據(jù)庫238和搜索引擎建議 網(wǎng)絡(luò)服務(wù)502可用來建議與用戶的興趣有關(guān)的新站點。
相對于可移植搜索配置文件,本地搜索組件108可基于從用戶的文檔、聯(lián)系人和 用戶經(jīng)常訪問的網(wǎng)站提取的實體而生成基于分類法的用戶屬性的集合。具有針對用戶的具 體值的屬性集合可形成搜索配置文件。每個屬性可具有具體值。例如,諸如性別、年齡、第 一地理位置、第二 /第三地理位置、常去的旅行目的地、與個人網(wǎng)絡(luò)共同/共享且來自本地 媒體文件的音樂興趣、與個人網(wǎng)絡(luò)共同/共享的且來自本地媒體文件的電影興趣、個人音 樂興趣、個人電影興趣等的基本要素。
當(dāng)用戶決定選擇與購物站點(或?qū)⒃谖磥砣魏嗡阉髋渲梦募杏玫娜魏纹渌?別的站點)共享該搜索配置文件時,可以有趣的方式使用個人興趣與共享興趣之間的區(qū) 別。利用個人興趣,購物站點可以進行針對用戶的推薦。利用共享的興趣,購物站點可以作出針對用戶與之共享興趣的人群的推薦。在用戶可能想要為例如在家中晚宴宴請的一群朋 友購買外賣食物的場景下,這可能是有用的。其它場景包括用戶為晚上的約會購票或用戶 想要為晚上的家庭影院體驗租部電影。
搜索配置文件能力還包括使用戶能夠選擇暴露例如用戶興趣、歷史、收藏和熱點 主題。這可以通過用于授權(quán)和安全管理用戶信息的安全組件來提供便利。安全組件允許訂 戶選擇加入和選擇退出跟蹤信息以及可能在簽名時獲得且隨后被利用的個人信息。
本文包括一組流程圖,其表示用于執(zhí)行所公開的架構(gòu)的新穎方面的示例性方法。 雖然為了簡化說明的目的,此處所示一種或多種方法例如以流程圖或流程圖表形式示出和 描述為一系列動作,但應(yīng)當(dāng)理解和知道,這些方法不受動作的順序限制,因為某些動作可以 根據(jù)其以不同的順序發(fā)生和/或與本文示出和描述的其它動作同時發(fā)生。例如,本領(lǐng)域的 技術(shù)人員將理解和知道,方法可以備選地表示為一系列相互聯(lián)系的狀態(tài)或事件,例如在狀 態(tài)圖中。此外,并非方法中示出的所有動作都是新穎實施所需的。
圖6示出根據(jù)所公開的架構(gòu)的方法。在600中,從對應(yīng)數(shù)據(jù)發(fā)現(xiàn)范例的不同數(shù)據(jù)集 在本地創(chuàng)建信息的聚合。在602中,針對信息的聚合在本地處理查詢以返回搜索結(jié)果。在 604中,從搜索結(jié)果導(dǎo)出查詢意圖。在606中,基于結(jié)果的來源對結(jié)果排序。在608中,針對 具體主題的關(guān)聯(lián)性處理排序的搜索結(jié)果。在610中,輸出相關(guān)的搜索結(jié)果。
圖7示出圖6的方法的另外的方面。注意流程顯示,每個框可表示可以單獨或與 其它框組合而包括在內(nèi)的步驟,以作為由圖6的流程圖表示的方法的附加方面。在700中, 在本地索引來自對應(yīng)的不同數(shù)據(jù)范例的不同數(shù)據(jù)集。在702中,從信息的聚合中識別流行 主題。在704中,識別用戶興趣并基于用戶興趣而建議網(wǎng)站。在706中,存儲從瀏覽器、本 地搜索和網(wǎng)絡(luò)搜索收集的整理過的搜索歷史以便隨后用于再次查找搜索信息。在708中, 創(chuàng)建給定用戶的可移植搜索配置文件以便在相關(guān)聯(lián)的用戶設(shè)備上使用。在710中,針對其 它本地應(yīng)用的搜索建議而訪問信息的聚合。
圖8示出根據(jù)所公開的架構(gòu)的備選方法。在800中,在本地從本地數(shù)據(jù)集和基于網(wǎng) 絡(luò)的數(shù)據(jù)集創(chuàng)建信息的聚合。在802中,在本地從信息的聚合提取主導(dǎo)的項和主題,以便對 信息的聚合進行歸類、分組和瀏覽。在804中,針對信息的聚合在本地處理查詢,以返回來 自本地數(shù)據(jù)集和基于網(wǎng)絡(luò)的數(shù)據(jù)集的搜索結(jié)果。在806中,從搜索結(jié)果導(dǎo)出查詢意圖。在 808中,基于結(jié)果的來源對結(jié)果排序。在810中,基于源對排序的搜索結(jié)果進行針對關(guān)聯(lián)性 的處理。在812中,輸出相關(guān)的搜索結(jié)果。
圖9示出圖8的方法的另外的方面。注意流程顯示,每個框可表示可以單獨或與 其它框組合而包括在內(nèi)的步驟,以作為由圖8的流程圖表示的方法的附加方面。在900中, 根據(jù)本地結(jié)果和網(wǎng)絡(luò)結(jié)果將搜索結(jié)果分開。在902中,創(chuàng)建本地數(shù)據(jù)集和基于網(wǎng)絡(luò)的數(shù)據(jù) 集的數(shù)據(jù)發(fā)現(xiàn)范例的單個不同的數(shù)據(jù)集接口,以生成從本地數(shù)據(jù)集和基于網(wǎng)絡(luò)的數(shù)據(jù)集導(dǎo) 出的信息的聚合。在904中,查找與感興趣的具體主題相關(guān)的信息的聚合中的所有內(nèi)容。
如本申請中所用,術(shù)語“組件”和“系統(tǒng)”旨在指與計算機有關(guān)的實體,其是硬件、 軟件與有形硬件的組合、軟件、或執(zhí)行中的軟件。例如,組件可以是但不限于有形組件,例 如,處理器、芯片存儲器、大容量存儲設(shè)備(例如,光學(xué)驅(qū)動器、固態(tài)驅(qū)動器、和/或磁性存儲 介質(zhì)驅(qū)動器)和計算機;以及軟件組件,例如,在處理器上運行的進程、對象、可執(zhí)行文件、 數(shù)據(jù)結(jié)構(gòu)(存儲在易失性或非易失性存儲介質(zhì)中)、模塊、執(zhí)行的線程、和/或程序。舉例而言,在服務(wù)器上運行的應(yīng)用和服務(wù)器均可以是組件。一個或多個組件可以駐留在進程和 /或執(zhí)行的線程內(nèi),并且組件可以位于一個計算機上和/或分布在兩個或更多個計算機之間。詞語“示例性”可以在本文中用來表示充當(dāng)示例、實例或例示。本文描述為“示例性”的任何方面或設(shè)計未必理解為相比其它方面或設(shè)計優(yōu)選或有利。
現(xiàn)在參看圖10,示出了根據(jù)所公開的架構(gòu)的計算系統(tǒng)1000的框圖,該系統(tǒng)執(zhí)行用于查詢意圖分析、排序和關(guān)聯(lián)性的本地搜索引擎以及對不同數(shù)據(jù)集的全局訪問。然而,應(yīng)當(dāng)理解,所公開的方法和/或系統(tǒng)的某些或所有方面可以實現(xiàn)為片上系統(tǒng),其中模擬、數(shù)字、 混合信號和其它功能被制造在單個芯片基板上。為了提供針對其各個方面的附加的上下文,圖10和下面的描述旨在提供對可以在其中實現(xiàn)各個方面的合適計算系統(tǒng)1000的簡要的一般性描述。雖然以上描述是在可以在一個或多個計算機上運行的計算機可執(zhí)行指令的一般背景中,但本領(lǐng)域的技術(shù)人員將認識到,也可以結(jié)合其它程序模塊和/或作為硬件和軟件的組合而實現(xiàn)新穎實施例。
用于實現(xiàn)各個方面的計算系統(tǒng)1000包括計算機1002,其具有(多個)處理單元 1004、諸如系統(tǒng)存儲器的計算機可讀存儲裝置1006、以及系統(tǒng)總線1008。(多個)處理單元 1004可以是各種市售處理器中的任一種,例如,單處理器、多處理器、單芯單元和多芯單元。 此外,本領(lǐng)域的技術(shù)人員將會知道,可以用其它計算機系統(tǒng)配置實施新穎方法,包括微型計算機、大型計算機、以及個人計算機(例如,臺式計算機、膝上型計算機等)、手持計算設(shè)備、 基于微處理器或可編程的消費性電子產(chǎn)品等,其中每一個都能操作性地耦接到一個或多個相關(guān)聯(lián)的設(shè)備。
系統(tǒng)存儲器1006可包括計算機可讀存儲裝置(物理存儲介質(zhì)),例如,易失性 (VOL)存儲器1010 (例如,隨機存取存儲器(RAM))和非易失性存儲器(NON-VOL) 1012 (例如,R0M、EPR0M、EEPR0M等)?;据斎?輸出系統(tǒng)(BIOS)可以存儲在非易失性存儲器1012 中,并且包括基本例程,其有利于例如在啟動期間在計算機1002內(nèi)的組件之間的數(shù)據(jù)和信號的傳送。易失性存儲器1010還可包括用于高速緩存數(shù)據(jù)的高速RAM,例如靜態(tài)RAM。
系統(tǒng)總線1008為包括但不限于系統(tǒng)存儲器1006的系統(tǒng)組件提供到(多個)處理單元1004的接口。系統(tǒng)總線1008可以是若干類型的總線結(jié)構(gòu)中的任一種,其可以使用多種市售總線架構(gòu)中的任一種進一步互連到存儲器總線(帶有或不帶有存儲器控制器)和外圍總線(例如,?(1汴(16、46 、1^(等)。
計算機1002還包括(多個)機器可讀存儲子系統(tǒng)1014和(多個)存儲接口 1016, 存儲接口 1016用于將(多個)存儲子系統(tǒng)1014接合到系統(tǒng)總線1008和其它所需的計算機組件。(多個)存儲子系統(tǒng)1014 (物理存儲介質(zhì))可包括例如硬盤驅(qū)動器(HDD)、磁性軟盤驅(qū)動器(FDD)和/或光盤存儲驅(qū)動器(例如,⑶-ROM驅(qū)動器、DVD驅(qū)動器)中的一個或多個。(多個)存儲接口 1016例如可包括諸如EIDE、ATA、SATA和IEEE 1394的接口技術(shù)。
一個或多個程序和數(shù)據(jù)可存儲在存儲器子系統(tǒng)1006、機器可讀且可移動的存儲器子系統(tǒng)1018 (例如,閃速驅(qū)動器形式因素技術(shù))、和/或(多個)存儲子系統(tǒng)1014 (例如,光學(xué)、磁性、固態(tài)),包括操作系統(tǒng)1020、一個或多個應(yīng)用1022、其它程序模塊1024和程序數(shù)據(jù) 1026。
操作系統(tǒng)1020、一個或多個應(yīng)用1022、其它程序模塊1024和/或程序數(shù)據(jù)1026 可包括例如圖1的系統(tǒng)100的實體和組件、圖2的系統(tǒng)200的實體和組件、圖3的 系統(tǒng)300的實體和組件、圖4的系統(tǒng)400的實體和組件、圖5的系統(tǒng)500的實體和組件、以及圖6-9 的流程圖表示的方法。
通常,程序包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、方法、數(shù)據(jù)結(jié)構(gòu)、 其它軟件組件等。操作系統(tǒng)1020、應(yīng)用1022、模塊1024和/或數(shù)據(jù)1026的全部或部分例 如也可在諸如易失性存儲器1010的存儲器中高速緩存。應(yīng)當(dāng)知道,所公開的架構(gòu)可以用各 種市售操作系統(tǒng)或操作系統(tǒng)的組合(例如作為虛擬機)來實現(xiàn)。
(多個)存儲子系統(tǒng)1014和存儲器子系統(tǒng)(1006和1018)充當(dāng)計算機可讀介質(zhì)以 用于數(shù)據(jù)、數(shù)據(jù)結(jié)構(gòu)、計算機可執(zhí)行指令等的易失性和非易失性存儲。當(dāng)被計算機或其它機 器執(zhí)行時,這樣的指令可促使計算機或其它機器執(zhí)行方法的一個或多個動作。執(zhí)行動作的 指令可存儲在一個介質(zhì)上,或者可存儲在多個介質(zhì)上,從而使得指令可共同出現(xiàn)在一個或 多個計算機可讀存儲介質(zhì)上,而不管所有指令是否都在同一介質(zhì)上。
計算機可讀介質(zhì)可以是任何可用介質(zhì),其能由計算機1002訪問且包括可移動或 不可移動的易失性和非易失性的內(nèi)部和/或外部介質(zhì)。對于計算機1002來說,介質(zhì)適合任 何合適數(shù)字格式的數(shù)據(jù)的存儲。本領(lǐng)域的技術(shù)人員應(yīng)知道,可采用其它類型的計算機可讀 介質(zhì),例如,壓縮驅(qū)動器、磁帶、閃速存儲卡、閃速驅(qū)動器、磁帶盒等,其用于存儲計算機可執(zhí) 行指令以執(zhí)行所公開的架構(gòu)的新穎方法。
用戶可以使用諸如鍵盤和鼠標的外部用戶輸入設(shè)備1028與計算機1002、程序和 數(shù)據(jù)交互。其它外部用戶輸入設(shè)備1028可包括麥克風(fēng)、IR(紅外)遠程控制、操縱桿、游戲 墊、攝像機識別系統(tǒng)、手寫筆、觸摸屏、姿勢系統(tǒng)(例如,眼睛移動、頭部移動等)和/或之 類。用戶可以使用諸如觸摸墊、麥克風(fēng)、鍵盤等的板載用戶輸入設(shè)備1030與計算機1002、程 序和數(shù)據(jù)進行交互,其中計算機1002例如為便攜式計算機。這些和其它輸入設(shè)備經(jīng)由系統(tǒng) 總線1008通過(多個)輸入/輸出(I/O)設(shè)備接口 1032連接到(多個)處理單元1004, 但可通過諸如并行端口、IEEE 1394串行端口、游戲端口、USB端口、IR接口、短距離無線(例 如藍牙)和其它個人局域網(wǎng)(PAN)技術(shù)等的其它接口連接。(多個)I/O設(shè)備接口 1032還 有利于使用諸如打印機、音頻設(shè)備、攝像設(shè)備等的輸出外設(shè)1034,例如聲卡和/或板載音頻 處理能力。
一個或多個圖形接口 1036(通常也稱為圖形處理單元(GPU))在計算機1002和 (多個)外部顯示器1038(例如,LCD、等離子顯示器)和/或板載顯示器1040(例如用于 便攜式計算機)之間提供圖形和視頻信號。(多個)圖形接口 1036也可制造為計算機系統(tǒng) 板的一部分。
計算機1002可以經(jīng)由到一個或多個網(wǎng)絡(luò)和/或其它計算機的有線/無線通信子 系統(tǒng)1042使用邏輯連接在聯(lián)網(wǎng)環(huán)境(例如,基于IP)中操作。其它計算機可包括工作站、服 務(wù)器、路由器、個人計算機、基于微處理器的娛樂電器、對等設(shè)備或其它通用網(wǎng)絡(luò)節(jié)點,并且 典型地包括關(guān)于計算機1002描述的許多或所有的要素。邏輯連接可包括到局域網(wǎng)(LAN)、 廣域網(wǎng)(WAN)、熱點等的有線/無線連接。LAN和WAN聯(lián)網(wǎng)環(huán)境在辦公室和公司中是常見 的,并且有利于企業(yè)范圍的計算機網(wǎng)絡(luò),例如內(nèi)聯(lián)網(wǎng),所有這些都可以連接到諸如因特網(wǎng)的 全球通信網(wǎng)絡(luò)。
當(dāng)用在聯(lián)網(wǎng)環(huán)境中時,計算機1002經(jīng)由有線/無線通信子系統(tǒng)1042(例如,網(wǎng)絡(luò) 接口適配器、板載收發(fā)機子系統(tǒng)等)連接到網(wǎng)絡(luò),以與有線/無線網(wǎng)絡(luò)、有線/無線打印機、有線/無線輸入設(shè)備1044等通信。計算機1002可包括調(diào)制解調(diào)器或用于在網(wǎng)絡(luò)上建立通 信的其它裝置。在聯(lián)網(wǎng)環(huán)境中,與計算機1002有關(guān)的程序和數(shù)據(jù)可存儲在與分布式系統(tǒng)相 關(guān)聯(lián)的遠程存儲器/存儲設(shè)備中。應(yīng)當(dāng)理解,所示網(wǎng)絡(luò)連接為示例性的,并且可以使用在計 算機之間建立通信鏈路的其它裝置。
計算機1002可操作以使用諸如IEEE 802. xx系列標準的無線電技術(shù)與有線/ 無線設(shè)備或?qū)嶓w通信,例如,可操作地設(shè)置成與諸如下列的設(shè)備無線通信(例如,IEEE 802. 11空中調(diào)制技術(shù))的無線設(shè)備打印機、掃描儀、臺式計算機和/或便攜式計算機、個 人數(shù)字助理(PDA)、通信衛(wèi)星、與以無線方式可檢測的標簽相關(guān)聯(lián)的任何一臺設(shè)備或地點 (例如,信息站、報攤、休息室)、以及電話。這至少包括用于熱點的W1-Fi (用來認證無線 計算機網(wǎng)絡(luò)設(shè)備的互操作性)、WiMax和Bluetooth 無線技術(shù)。因此,通信可以是與常規(guī) 網(wǎng)絡(luò)相同的預(yù)定結(jié)構(gòu)或者僅僅是在至少兩個設(shè)備之間的自組織通信。W1-Fi網(wǎng)絡(luò)使用稱為 IEEE 802.1lx (a、b、g等)的無線電技術(shù)來提供安全、可靠、快速的無線連接。W1-Fi網(wǎng)絡(luò) 可用來將計算機連接到彼此、連接到因特網(wǎng)并連接到有線網(wǎng)絡(luò)(其使用與IEEE 802. 3有關(guān) 的媒體和功能)。
以上所描述的包括所公開的架構(gòu)的示例。當(dāng)然,不可能描述組件和/或方法的每 個可想到的組合,但本領(lǐng)域的普通技術(shù)人員可以認識到,許多進一步的組合和排列是可能 的。因此,新穎架構(gòu)旨在涵蓋落在所附權(quán)利要求的精神和范圍內(nèi)的所有這樣的改變、修改和 變型。此外,就術(shù)語“包含”在詳細描述或權(quán)利要求中使用的意義上,這樣的術(shù)語旨在以類 似于術(shù)語“包括”的方式為包括性的,因為“包括”當(dāng)采用時在權(quán)利要求中解釋為過渡詞。
權(quán)利要求
1.一種系統(tǒng)(100),包括 全局訪問組件(102),其是到不同數(shù)據(jù)發(fā)現(xiàn)范例的統(tǒng)一接口,所述全局訪問組件提供到對應(yīng)的不同數(shù)據(jù)集的訪問; 本地搜索組件(108),其經(jīng)由所述全局訪問組件從所述不同數(shù)據(jù)集創(chuàng)建信息的聚合,并且處理針對所述信息聚合的查詢以返回搜索結(jié)果,所述本地搜索組件對所述查詢進行用于導(dǎo)出查詢意圖的意圖分析、所述搜索結(jié)果的排序、以及基于所述查詢意圖的所述搜索結(jié)果的關(guān)聯(lián)性處理;以及 處理器,其執(zhí)行與所述全局訪問組件或所述本地搜索組件中的至少一個相關(guān)聯(lián)的計算機可執(zhí)行指令。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述本地搜索組件從所述信息的聚合創(chuàng)建數(shù)據(jù)的統(tǒng)一索引,所述信息的聚合包括與用戶有關(guān)的社會方面和從所述不同數(shù)據(jù)集導(dǎo)出的用戶數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述不同數(shù)據(jù)發(fā)現(xiàn)范例包括基于客戶端的范例和基于網(wǎng)絡(luò)的范例,并且所述搜索結(jié)果包括與用戶有關(guān)的基于客戶端的結(jié)果和與用戶有關(guān)的基于客戶端的數(shù)據(jù)及網(wǎng)絡(luò)結(jié)果以及所述用戶的基于網(wǎng)絡(luò)的數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述不同數(shù)據(jù)發(fā)現(xiàn)范例涉及與聯(lián)系人、消息、文檔或網(wǎng)站中的至少一個相關(guān)聯(lián)的數(shù)據(jù)集,并且所述本地搜索組件提取主導(dǎo)的項和主題以對所述數(shù)據(jù)集進行歸類、分組和瀏覽。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述本地搜索組件從所述信息的聚合的統(tǒng)一索引中識別流行主題,并且從所述信息的聚合中識別用戶興趣并基于所述用戶興趣建議網(wǎng)站。
6.一種方法,包括以下動作 從對應(yīng)的數(shù)據(jù)發(fā)現(xiàn)范例的不同數(shù)據(jù)集在本地創(chuàng)建信息的聚合¢00); 針對所述信息的聚合在本地處理查詢以返回搜索結(jié)果¢02); 從所述搜索結(jié)果導(dǎo)出查詢意圖(604); 基于所述結(jié)果的源對所述結(jié)果排序(606); 針對與具體主題的關(guān)聯(lián)性處理所述排序的搜索結(jié)果¢08); 輸出所述關(guān)聯(lián)的所述結(jié)果(610);以及 利用執(zhí)行存儲在存儲器中的指令的處理器來進行所述創(chuàng)建、處理、導(dǎo)出、排序、處理或輸出動作中的至少一個。
7.根據(jù)權(quán)利要求6所述的方法,進一步包括在本地索引來自對應(yīng)的不同數(shù)據(jù)范例的所述不同數(shù)據(jù)集。
8.根據(jù)權(quán)利要求6所述的方法,進一步包括存儲從瀏覽器、本地搜索和網(wǎng)絡(luò)搜索收集的整理過的搜索歷史以便隨后用于再次查找搜索信息。
9.根據(jù)權(quán)利要求6所述的方法,進一步包括創(chuàng)建給定用戶的可移植搜索配置文件以便在相關(guān)聯(lián)的用戶設(shè)備上使用。
10.根據(jù)權(quán)利要求6所述的方法,進一步包括針對其它本地應(yīng)用的搜索建議而訪問所述信息的聚合。
11.一種或多種其上存儲計算機可執(zhí)行指令的計算機可讀存儲介質(zhì),所述指令當(dāng)由計算 設(shè)備執(zhí)行時,使得所述計算設(shè)備實現(xiàn)如權(quán)利要求6 — 10中的任一個所述的方法。
全文摘要
一種搜索引擎,其駐留在本地計算機上以能夠進行查詢意圖分析、結(jié)果排序和對本地數(shù)據(jù)源及遠程數(shù)據(jù)源兩者的數(shù)據(jù)進行關(guān)聯(lián)性處理。該架構(gòu)還采用全局訪問組件,該組件是對不同的數(shù)據(jù)發(fā)現(xiàn)范例的統(tǒng)一接口。全局訪問組件提供對對應(yīng)的不同的范例數(shù)據(jù)集的訪問以創(chuàng)建信息聚合。本地搜索引擎經(jīng)由全局訪問組件從不同的數(shù)據(jù)集創(chuàng)建信息聚合,并且處理針對該信息聚合的查詢以返回搜索結(jié)果。
文檔編號G06F17/30GK103049531SQ20121056396
公開日2013年4月17日 申請日期2012年12月24日 優(yōu)先權(quán)日2011年12月22日
發(fā)明者B.麥克唐納, M.萊恩, B.薩里恩, A.D.潘迪, G.普拉賈帕蒂, K.戈帕爾 申請人:微軟公司