亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

利用基于用戶信息和情境自動(dòng)生成的鏈接的增強(qiáng)的文檔瀏覽的制作方法

文檔序號(hào):6656680閱讀:280來(lái)源:國(guó)知局
專利名稱:利用基于用戶信息和情境自動(dòng)生成的鏈接的增強(qiáng)的文檔瀏覽的制作方法
技術(shù)領(lǐng)域
在此所描述的系統(tǒng)與方法總體上涉及信息檢索,更具體而言,涉及用于瀏覽信息的技術(shù)。
背景技術(shù)
萬(wàn)維網(wǎng)(“web”)包含非常大量的信息。Web的一種非常通用的用途是讀取文檔,例如新聞文章或其它出版物。
當(dāng)讀取特定的文檔時(shí),例如新聞文章,已知的是提供對(duì)以某種方式與該特定文檔相關(guān)的其它文檔的鏈接。例如,當(dāng)用戶從新聞搜索引擎或內(nèi)嵌新聞服務(wù)選擇新聞文檔時(shí),web站點(diǎn)可以提供對(duì)與該新聞文檔相關(guān)的其它新聞文章或廣告的鏈接。一般來(lái)說(shuō),這種相關(guān)的文檔是基于正讀取文檔的內(nèi)容確定的并作為顯示在文檔內(nèi)容之外的附加鏈接顯示。通過(guò)提供對(duì)相關(guān)材料的方便鏈接,這些附加文檔可以增強(qiáng)讀者的瀏覽體驗(yàn)。
期望通過(guò)向讀者提供對(duì)相關(guān)信息的自動(dòng)生成的鏈接來(lái)提供用于增強(qiáng)文檔瀏覽的改進(jìn)技術(shù)。

發(fā)明內(nèi)容
根據(jù)一方面,增強(qiáng)文檔瀏覽的方法包括接收與用戶相關(guān)的個(gè)人信息、基于第一文檔的內(nèi)容和個(gè)人信息生成描述信息及基于該描述信息識(shí)別附加文檔。此外,可以生成包括修改成包括對(duì)附加文檔的引用的第一文檔的內(nèi)容的至少一部分的第二文檔。
在另一方面,方法包括定位與第一文檔相關(guān)的至少一個(gè)第二文檔并將第二文檔嵌入到第一文檔中在該處第二文檔具有相關(guān)性的位置。
在另一方面,方法包括從用戶接收對(duì)第一文檔的請(qǐng)求、識(shí)別第一文檔中的命名實(shí)體、定位與該命名實(shí)體相關(guān)的第二文檔及將第一文檔的修改版本呈現(xiàn)給用戶,在第一文檔的修改版本中對(duì)第二文檔的鏈接內(nèi)嵌(in-line)顯示在第一文檔中最靠近與第二文檔相關(guān)的命名實(shí)體的位置。


結(jié)合進(jìn)本說(shuō)明書(shū)并構(gòu)成其一部分的

了本發(fā)明的實(shí)施方式并與描述一起解釋本發(fā)明。在附圖中,圖1A和1B是說(shuō)明可以呈現(xiàn)給用戶的示例圖形界面的圖;圖2是其中與本發(fā)明原理一致的概念可以實(shí)現(xiàn)的網(wǎng)絡(luò)的示例圖;圖3是在圖2網(wǎng)絡(luò)中顯示的客戶端或服務(wù)器的示例圖;圖4是說(shuō)明圖2所示文檔定位器的概念元件的框圖;圖5是說(shuō)明圖4所示搜索組件的示例實(shí)現(xiàn)的圖;圖6是說(shuō)明由圖2所示文檔定位器執(zhí)行的示例操作的流程圖;及圖7是說(shuō)明在內(nèi)容提供web站點(diǎn)情境下文檔定位器的示例實(shí)現(xiàn)的圖。
具體實(shí)施例方式
以下本發(fā)明的具體描述參考附圖。該具體描述不限制本發(fā)明。
概述如在此所描述的,與例如用戶所讀取文檔的原始文檔相關(guān)的附加文檔是自動(dòng)定位的。附加文檔可以根據(jù)其內(nèi)容和/或根據(jù)用戶的個(gè)人信息定位。附加文檔可以與原始文檔一起內(nèi)嵌顯示。因此,可以有效地向用戶呈現(xiàn)與正讀取的原始文檔相關(guān)的附加信息。
圖1A和1B是說(shuō)明可以呈現(xiàn)給用戶的示例圖形界面的圖。圖形界面可以通過(guò)正用于瀏覽web的web瀏覽器100呈現(xiàn)。圖1A和1B中所示的例子文檔105關(guān)于攀登Mt.Everest的徒步旅行者(BillCross)的進(jìn)展。
多個(gè)附加文檔可能與文檔105相關(guān)。例如,在圖1A中,對(duì)三個(gè)附加文章的鏈接110、112和114嵌入到文檔105中。鏈接110可以引用關(guān)于Mt.Everest的文檔,鏈接112可以引用關(guān)于Novolog Peaks和Poles Challenge的文檔,而鏈接114可以引用關(guān)于diabetes的文檔。鏈接110、112和114中的每一個(gè)都引用以某種方式與原始文檔105相關(guān)的內(nèi)容。在這個(gè)例子中,鏈接110、112和114以通知讀者帶下劃線鏈接的內(nèi)容的簡(jiǎn)單摘要文本(例如,“related contentMt.Everest”)顯示。此外,摘要文本是帶下劃線的,指示該摘要文本與鏈接關(guān)聯(lián)。假定圖1A中文檔105的讀者位于California的San Jose。關(guān)于San Jose徒步旅行裝備零售商的廣告115可以附加地顯示。此外,由鏈接110、112和114引用的文檔可以是特別適于San Jose地區(qū)讀者的文檔。
盡管沒(méi)有在圖1A中示出,但其它鏈接,例如甚至更直接地定制成讀者個(gè)人信息的鏈接,也可以顯示。例如,如果讀者先前在搜索引擎中輸入了搜索查詢,例如與照片相關(guān)的搜索查詢,則其它鏈接可以是對(duì)描述“Everest照片”的文檔的鏈接。
圖1B中的文檔105與圖1A中的完全相同。多個(gè)鏈接120、122和124包括在圖1B的文檔105中。在這個(gè)例子中,鏈接120、122和124不是示為鏈接的摘要文本,而是通過(guò)簡(jiǎn)單地修改與文檔105中特定詞或短語(yǔ)相關(guān)的格式或顯示來(lái)實(shí)現(xiàn)。例如,鏈接120通過(guò)給“Mt.Everest”加下劃線,由此向讀者說(shuō)明該鏈接引用關(guān)于Mt.Everest的文檔向讀者顯示。另一鏈接126內(nèi)嵌插入到文檔105中,它包括類似于鏈接110、112和114的摘要文本。對(duì)于這個(gè)例子,假定讀者來(lái)自Seattle而不是San Jose??梢愿鶕?jù)這個(gè)事實(shí)生成的鏈接126引用關(guān)于徒步旅行Mt.Rainer-Seattle附加的一座山峰的文檔。
示例網(wǎng)絡(luò)概述圖2是其中與本發(fā)明原理一致的概念可以實(shí)現(xiàn)的網(wǎng)絡(luò)200的示例圖。網(wǎng)絡(luò)200可以包括通過(guò)網(wǎng)絡(luò)240連接到服務(wù)器220的多個(gè)客戶端210。網(wǎng)絡(luò)240可以包括局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、例如公共交換電話網(wǎng)(PSTN)的電話網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)、因特網(wǎng)或網(wǎng)絡(luò)的組合。為了簡(jiǎn)單,兩個(gè)客戶端210和一個(gè)服務(wù)器220被示出為連接到網(wǎng)絡(luò)240。實(shí)際上,可以有更多客戶端和/或服務(wù)器。而且,在有些情況下,客戶端可以執(zhí)行服務(wù)器的一種或多種功能,而服務(wù)器也可以執(zhí)行客戶端的一種或多種功能。
客戶端210可以包括例如無(wú)線電話、個(gè)人計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、膝上型電腦或其它類型的計(jì)算或通信設(shè)備的設(shè)備、運(yùn)行在這些設(shè)備中一個(gè)上的線程或過(guò)程和/或可以由這些設(shè)備中一個(gè)執(zhí)行的對(duì)象。服務(wù)器220可以包括以與本發(fā)明原理一致的方式處理、搜索和/或維護(hù)文檔與圖像的服務(wù)器設(shè)備??蛻舳?10與服務(wù)器220可以通過(guò)有線、無(wú)線或光連接連接到網(wǎng)絡(luò)240。
服務(wù)器220可以包括附加文檔定位器組件225(在此也簡(jiǎn)單地稱為“文檔定位器225”)。文檔定位器225可以定位并添加對(duì)與輸入文檔相關(guān)的其它文檔的引用,例如添加到文檔105的引用(圖1A和1B)。
作為在此所使用的術(shù)語(yǔ),文檔廣義地解釋為包括任何機(jī)器可讀和機(jī)器可存儲(chǔ)作品。文檔可以是電子郵件、web日志(博克)、文件、文件的組合、具有對(duì)其它文件的嵌入鏈接的一個(gè)或多個(gè)文件、新聞組粘貼等。在因特網(wǎng)情境下,常用文檔是web頁(yè)面,例如HTMLweb頁(yè)面。Web頁(yè)面常常包括內(nèi)容,而且可以包括嵌入的信息(例如元信息、超鏈接等)和/或嵌入的指令(例如Java script等)。在此所討論的文檔通常包括嵌入的圖像。在此作為術(shù)語(yǔ)使用的“鏈接”廣義地解釋為包括從文檔到另一文檔或同一文檔的另一部分的引用/從另一文檔或同一文檔的另一部分到本文檔的任何引用。
示例客戶端/服務(wù)器體系結(jié)構(gòu)圖3是客戶端210或服務(wù)器220的示例圖??蛻舳?服務(wù)器210/220可以包括總線310、處理器320、主存儲(chǔ)器330、只讀存儲(chǔ)器(ROM)340、存儲(chǔ)設(shè)備350、輸入設(shè)備360、輸出設(shè)備370及通信接口380??偩€310可以包括允許在客戶端/服務(wù)器210/220的組件之間通信的導(dǎo)體。
處理器320可以包括解釋并執(zhí)行指令的傳統(tǒng)處理器、微處理器或處理邏輯。主存儲(chǔ)器330可以包括隨機(jī)存取存儲(chǔ)器(RAM)或存儲(chǔ)信息與由處理器320所執(zhí)行指令的另一類型的動(dòng)態(tài)存儲(chǔ)設(shè)備。ROM 340可以包括傳統(tǒng)ROM設(shè)備或存儲(chǔ)靜態(tài)信息與由處理器320使用的指令的另一類型的靜態(tài)存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備350可以包括磁和/或光記錄介質(zhì)及其對(duì)應(yīng)的驅(qū)動(dòng)器。
輸入設(shè)備360可以包括允許用戶向客戶端/服務(wù)器210/220輸入信息的一種或多種傳統(tǒng)機(jī)構(gòu),例如鍵盤(pán)、鼠標(biāo)、筆、語(yǔ)音識(shí)別和/或生物測(cè)量機(jī)構(gòu)等。輸出設(shè)備370可以包括向用戶輸出信息的一種或多種傳統(tǒng)機(jī)構(gòu),包括顯示器、打印機(jī)、揚(yáng)聲器等。通信接口380可以包括使客戶端/服務(wù)器210/220與其它設(shè)備和/或系統(tǒng)通信的任何象收發(fā)器那樣的機(jī)構(gòu)。例如,通信接口380可以包括通過(guò)網(wǎng)絡(luò)(例如網(wǎng)絡(luò)240),與其它設(shè)備或系統(tǒng)通信的機(jī)構(gòu)。
與本發(fā)明的原理一致的服務(wù)器220可以實(shí)現(xiàn)附加文檔定位器225。附加文檔定位器225可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中,例如存儲(chǔ)器330中。計(jì)算機(jī)可讀介質(zhì)可以定義為一個(gè)或多個(gè)物理或邏輯存儲(chǔ)器設(shè)備和/或載波。
定義附加文檔定位器225的軟件指令可以從另一計(jì)算機(jī)可讀介質(zhì)(例如數(shù)據(jù)存儲(chǔ)設(shè)備350),或通過(guò)通信接口380從另一設(shè)備讀到存儲(chǔ)器330中。包含在存儲(chǔ)器330中的軟件指令可以使處理器320執(zhí)行后述處理??蛇x地,硬連線電路或其它邏輯可以代替或與軟件指令組合使用以實(shí)現(xiàn)與本發(fā)明一致的處理。因此,與本發(fā)明原理一致的實(shí)現(xiàn)不限于硬件電路與軟件的任何特定的組合。
文檔定位器225圖4是說(shuō)明文檔定位器225的概念元件的框圖。文檔定位器225可以包括描述信息生成器405、搜索組件410及格式化組件415。描述信息生成器405可以生成描述當(dāng)前文檔并基于用戶個(gè)人信息的描述信息。在一種實(shí)現(xiàn)中,描述信息可以包括搜索查詢。描述信息生成器405可以基于用戶的個(gè)人信息和/或當(dāng)前輸入的文檔(或與當(dāng)前文檔相關(guān)的信息)生成描述信息。
從描述信息生成器405輸出的描述信息可以輸入到搜索組件410,搜索組件410可以使用該描述信息生成附加文檔。對(duì)附加文檔的鏈接或其它引用可以由格式化組件415插入到原始文檔中。
描述信息生成器405、搜索組件410及格式化組件415分別在下面具體描述。
描述信息生成器405如所提到的,描述信息生成器405可以生成描述信息,例如搜索查詢。描述信息通??梢曰谂c用戶當(dāng)前在觀看(或請(qǐng)求觀看)的文檔相關(guān)的信息及用戶的個(gè)人信息。與當(dāng)前文檔相關(guān)的信息可以包括基于當(dāng)前文檔文本的信息。該文本可以處理成包含例如(1)出現(xiàn)次數(shù)超過(guò)某一預(yù)定次數(shù)的所有術(shù)語(yǔ),(2)可以自動(dòng)提取的命名實(shí)體,(3)文檔中的日期,(4)作者和出版物名,和/或關(guān)鍵字或類別提取。
關(guān)于上面的(1),出現(xiàn)次數(shù)超過(guò)某一預(yù)定次數(shù)的術(shù)語(yǔ)可以看做是重要的或者文檔中特別描述的術(shù)語(yǔ),而且可以看作是該文檔的描述信息。例如,選擇成包括在描述信息中的術(shù)語(yǔ)個(gè)數(shù)可以限定為最頻繁出現(xiàn)術(shù)語(yǔ)的預(yù)定個(gè)數(shù)。在這種概念的可能變體中,術(shù)語(yǔ)出現(xiàn)的次數(shù)可以聯(lián)系術(shù)語(yǔ)在文檔語(yǔ)言中出現(xiàn)的總頻率一起考慮。因此,語(yǔ)言中趨于較少出現(xiàn)的術(shù)語(yǔ)可以在文檔中出現(xiàn)多次的通用術(shù)語(yǔ)之前選擇。
預(yù)定命名實(shí)體或其它名詞的列表可以由描述信息生成器405存儲(chǔ)。例如,位置名、名人名字、眾所周知的商品或消費(fèi)品名及公司名可以由手動(dòng)(即,由人操作員輸入)或自動(dòng)技術(shù)預(yù)先產(chǎn)生。如上面所提到的,文檔的文本可以與包括在該文檔的描述信息中的這些命名實(shí)體和匹配進(jìn)行比較。參考圖1A和1B的例子,預(yù)定命名實(shí)體的列表可能已經(jīng)包括了例如“Mt.Everest”和“Novolog Peaks and PolesChallenge”的術(shù)語(yǔ),使得這些術(shù)語(yǔ)包括在文檔105的描述信息中。
文檔中的日期(以上的項(xiàng)(3))、文檔作者及出版物名(項(xiàng)(4))可以包括在描述信息中。這種信息常??梢酝ㄟ^(guò)應(yīng)用到文檔的模式匹配技術(shù)自動(dòng)確定。文檔的日期可以用于定位其它同期出版的文檔。類似地,出版實(shí)體(例如,web站點(diǎn))和文檔作者可以用于定位來(lái)自相同或類似出版社的文檔或同一作者所寫(xiě)的或文檔。文檔日期、作者和出版社在新聞報(bào)道的情境下特別有用。關(guān)于(5),可以分析文檔的關(guān)鍵字,例如基于術(shù)語(yǔ)頻率或通過(guò)命名實(shí)體提取所提取的關(guān)鍵字。
除了基于文檔生成描述信息,描述信息生成器405還可以基于特定于用戶的信息(“個(gè)人信息”)生成描述信息。個(gè)人信息可以包括例如用戶的地理位置(例如,先前搜索查詢提交的或鏈接所選的)、用戶在注冊(cè)賬號(hào)時(shí)提供的個(gè)人信息、基于用戶瀏覽歷史的個(gè)人信息、從用戶所生成文檔或其它個(gè)人信息源提取的個(gè)人信息。用戶的地理位置可以根據(jù)用戶的IP地址估計(jì)。個(gè)人信息還可以包括時(shí)間信息,例如當(dāng)前的日期或季節(jié)。時(shí)間信息可以用于將事件與個(gè)人偏好或文檔內(nèi)容關(guān)聯(lián)。例如,如果正瀏覽的文檔關(guān)于Edinburgh,且當(dāng)前月份是七月或八月,則可以顯示關(guān)于Edinburgh藝術(shù)節(jié)的相關(guān)文檔。
在一種實(shí)現(xiàn)中,個(gè)人信息可以基于由提交到搜索引擎的先前搜索查詢構(gòu)成的用戶簡(jiǎn)檔。類列匹配技術(shù)可以用于從搜索項(xiàng)目推斷用戶的興趣。例如,即使用戶實(shí)際上從來(lái)沒(méi)有輸入搜索項(xiàng)“攝影”,但查詢了術(shù)語(yǔ)“尼康”、“光圈”和“f制光圈”,這些術(shù)語(yǔ)可以用于推斷用戶對(duì)攝影感興趣。
用于從搜索查詢生成類別映射的一種技術(shù)基于收集大量的基于用戶搜索會(huì)話標(biāo)記的歷史用戶搜索查詢?;驹硎撬阉骼纭凹涯堋钡乃阉黜?xiàng)的人很有可能在相同的搜索會(huì)話中輸入與相同類相關(guān)的其它搜索查詢,例如“攝影”或“f制光圈”。通過(guò)分析許多這種搜索查詢會(huì)話,可以進(jìn)行類別推斷(例如,如果有人搜索“尼康”,則有可能他們對(duì)攝影感興趣)。
描述信息生成器405可以將描述信息格式化為搜索查詢。在一種實(shí)現(xiàn)中,搜索查詢可以通過(guò)級(jí)連描述信息(例如,用戶的個(gè)人信息和與文檔相關(guān)的描述信息)以獲得搜索查詢來(lái)獲得。作為例子,考慮圖1A中的文檔105。基于對(duì)文檔和用戶個(gè)人信息的分析,描述信息生成器405可以生成描述信息“Mt.Everest”、“Novolog Peaks and PolesChallenge”、“diabetes”、“San Jose”與“photography”。這些術(shù)語(yǔ)可以組合成單個(gè)搜索查詢“Mt.Everest Novolog Peaks Poles Challengediabetes San Jose photography”。在其它實(shí)現(xiàn)中,可以生成多個(gè)搜索查詢,每個(gè)搜索查詢包括來(lái)自該文檔和用戶個(gè)人信息的術(shù)語(yǔ)子集,其例如搜索查詢“Mt.Everest San Jose”,“hiking San Jose”,“photography Mt.Everest”等等。
本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到用于從所生成的描述信息形成搜索查詢的其它技術(shù)也可以使用。例如,附加信息可以用于確定查詢中是否包括術(shù)語(yǔ),例如術(shù)語(yǔ)在語(yǔ)言中出現(xiàn)的總頻率。此外,在確定在查詢中是否包括特定名、實(shí)體或其它預(yù)定義術(shù)語(yǔ)時(shí),可以賦予它們附加權(quán)重。例如地區(qū)名的有些術(shù)語(yǔ)可以與例如產(chǎn)品名的其它術(shù)語(yǔ)有不同的權(quán)重。產(chǎn)品名可以通過(guò)將其關(guān)聯(lián)的公司名附加到產(chǎn)品名后自動(dòng)限定。此外,描述信息可以與如以上所描述的那些的簇或類匹配技術(shù)一起使用,以便生成可以用在搜索查詢中的其它術(shù)語(yǔ)。
搜索組件410圖5是更具體說(shuō)明搜索組件410的示例實(shí)現(xiàn)的圖。搜索組件410可以包括搜索引擎505和排隊(duì)(rank)組件510。
搜索引擎505可以從描述信息生成器405接收描述信息,并且作為響應(yīng),定位與該描述信息相關(guān)的一個(gè)或多個(gè)文檔。搜索引擎505可以是返回與所輸入搜索查詢相關(guān)的排隊(duì)文檔集合的基于查詢的搜索引擎。搜索引擎505可以是例如基于來(lái)自大集合的所有文檔(例如web上的文檔)的搜索引擎的通用搜索引擎或者例如新聞搜索引擎的更專用的搜索引擎。用于實(shí)現(xiàn)搜索引擎的技術(shù)一般在本領(lǐng)域中是已知的,因此在此將不進(jìn)一步公開(kāi)。
排隊(duì)組件510可以操作成排隊(duì)和/或修剪由搜索引擎505返回的文檔集合。在一種實(shí)現(xiàn)中,排隊(duì)組件510可以基于定義所返回文檔集合中每個(gè)文檔與搜索查詢匹配得多好的查詢匹配得分來(lái)排隊(duì)所返回的文檔集合。與搜索查詢“較好”匹配的文檔,例如包括搜索查詢中多個(gè)術(shù)語(yǔ)例子的文檔,將傾向于比匹配不好的文檔有更高的相關(guān)性得分。排隊(duì)組件510還可以基于其它相關(guān)性或質(zhì)量的測(cè)量值(例如基于基于鏈接的文檔質(zhì)量測(cè)量值)來(lái)排序文檔。前N個(gè)排序文檔(例如,N=3)可以由排隊(duì)組件510選擇呈現(xiàn)給用戶。
用于排隊(duì)或修剪相關(guān)文檔集合的其它技術(shù)也可以由排隊(duì)組件510使用。例如,可以選擇在對(duì)應(yīng)于多個(gè)相關(guān)搜索查詢的多個(gè)文檔集合中出現(xiàn)的文檔,可以選擇那些最新近的文檔,可以選擇那些最受歡迎的文檔(例如,基于文檔鏈接被選擇的次數(shù))。作為其它例子,來(lái)自商業(yè)站點(diǎn)的文檔可以明確地排除(或包括)。
在有些實(shí)現(xiàn)中,可以接收對(duì)應(yīng)于描述信息的多個(gè)可能的搜索查詢,并可以使用返回“最佳”結(jié)果的查詢。“最佳”結(jié)果可以多種方式測(cè)量,例如通過(guò)看對(duì)應(yīng)于響應(yīng)可能的搜索查詢從搜索引擎返回的文檔的目標(biāo)排隊(duì)值。此外,可以使用多種不同的搜索引擎,例如新聞搜索引擎、產(chǎn)品搜索引擎或通用的基于web的搜索引擎。
格式化組件415格式化組件415可以將由搜索組件410定位的附加文檔并到當(dāng)前文檔中(即,用戶當(dāng)前觀看的文檔)或加到包括當(dāng)前文檔的新文檔中。附加文檔可以通知用戶文檔可用的方式與當(dāng)前文檔合并,而不會(huì)過(guò)度干擾用戶對(duì)當(dāng)前文檔的讀取。
在一種實(shí)現(xiàn)中,格式化組件415可以將鏈接(例如,超鏈接)插入到與當(dāng)前文檔的文本內(nèi)嵌的附加文檔中。當(dāng)可能時(shí),對(duì)每個(gè)附加文檔的鏈接可以插入到當(dāng)前文檔中與附加文檔特別相關(guān)的部分中。這個(gè)概念在圖1A和1B中說(shuō)明,其中對(duì)相關(guān)內(nèi)容的鏈接,例如對(duì)關(guān)于Mt.Everest的文檔的鏈接,插入到文檔105中靠近術(shù)語(yǔ)“Mt.Everest”的地方。盡管圖1A和1B中的鏈接示為包括括號(hào)中的摘要信息和示為通過(guò)修改當(dāng)前輸入文檔中詞顯示來(lái)識(shí)別的鏈接,但其它用于圖形顯示鏈接的技術(shù)也可以使用。
除內(nèi)嵌超鏈接以外的技術(shù)可以用于將附加文檔嵌入到當(dāng)前文檔中。例如,可以使用當(dāng)用戶將光標(biāo)放到當(dāng)前文檔中的特定單詞、圖像或其它對(duì)象上時(shí)顯示的“漂浮(float-over)”文本。
文檔定位器225的操作圖6是說(shuō)明文檔定位器225所執(zhí)行的示例操作的流程圖。文檔定位器225可以響應(yīng)用戶請(qǐng)求文檔(例如從web站點(diǎn)或搜索引擎進(jìn)行的請(qǐng)求)而開(kāi)始操作。
文檔定位器225可以接收或定位用戶的個(gè)人信息(動(dòng)作601)。個(gè)人信息可以包括以下信息,例如用戶的地理位置、用戶當(dāng)注冊(cè)賬號(hào)時(shí)(或在其它時(shí)候)所提供的個(gè)人信息、基于用戶瀏覽歷史的個(gè)人信息或從用戶生成的文檔提取的個(gè)人信息。文檔定位器還接收用戶正請(qǐng)求的當(dāng)前輸入文檔(動(dòng)作602)。
可以生成與輸入文檔相關(guān)的描述信息(動(dòng)作603)。如前面所討論的,描述信息可以由描述信息生成器405生成并可以包括包含與當(dāng)前輸入文檔與用戶個(gè)人信息相關(guān)的術(shù)語(yǔ)的搜索查詢。描述信息可以用于定位附加相關(guān)文檔(動(dòng)作604)。如所討論的,這可以由搜索組件410向搜索引擎提交搜索查詢來(lái)執(zhí)行。
附加相關(guān)文檔中的一個(gè)或多個(gè)可以嵌入到當(dāng)前輸入文檔或者與其關(guān)聯(lián)(動(dòng)作605)。如圖1A和1B所示出的,附加相關(guān)文檔可以與當(dāng)前輸入文檔內(nèi)嵌嵌入。然后,包括對(duì)附加相關(guān)文檔的鏈接的當(dāng)前輸入文檔的修改版本可以呈現(xiàn)給用戶(動(dòng)作606)。
文檔定位器225的示例實(shí)現(xiàn)圖7是說(shuō)明在內(nèi)容提供web站點(diǎn)情境下實(shí)現(xiàn)的附加文檔定位器225的示例實(shí)現(xiàn)的圖,其中web站點(diǎn)例如專用于關(guān)于特定嗜好(例如,汽車(chē))的文章的web站點(diǎn)。本領(lǐng)域普通技術(shù)人員將理解文檔定位器225可以在多種附加聯(lián)網(wǎng)環(huán)境中實(shí)現(xiàn),例如在新聞搜索引擎或更通用的搜索引擎的通用情境下實(shí)現(xiàn)。
多個(gè)用戶705可以通過(guò)網(wǎng)絡(luò)715連接到內(nèi)容web站點(diǎn)710。用戶可以從內(nèi)容web站點(diǎn)710請(qǐng)求特定的文檔。在向用戶返回所請(qǐng)求的文檔之前,web站點(diǎn)710向文檔定位器225發(fā)送文檔(或識(shí)別文檔的信息)以及可能的還有發(fā)出請(qǐng)求的用戶的個(gè)人信息。如前面所討論的,文檔定位器225可以向web站點(diǎn)710返回其所請(qǐng)求文檔的修改版本,然后,web站點(diǎn)710可以將文檔轉(zhuǎn)發(fā)到用戶。以這種方式,來(lái)自web站點(diǎn)710的文檔在返回給用戶之前可能被自動(dòng)擴(kuò)張,以增強(qiáng)其期望性。
對(duì)這個(gè)例子的許多變體都是可能的。例如,代替文檔定位器225向web站點(diǎn)710返回增強(qiáng)的文檔,web站點(diǎn)710可以簡(jiǎn)單地將用戶的文檔請(qǐng)求重定向到文檔定位器225,然后文檔定位器225可以向用戶返回增強(qiáng)的文檔。
結(jié)論在此描述了用于自動(dòng)定位與原始文檔和/或用戶個(gè)人信息相關(guān)的附加文檔的技術(shù),其中文檔例如由用戶正讀取的文檔。在一種實(shí)現(xiàn)中,附加文檔是基于用戶的個(gè)人信息及基于與用戶正讀取的文檔相關(guān)的內(nèi)容定位的。例如通過(guò)插入在文檔中特別相關(guān)于附加文檔的位置的鏈接,附加文檔可以與正讀取的文檔內(nèi)嵌呈現(xiàn)。因此,可以有效地向用戶呈現(xiàn)與正讀取的原始文檔相關(guān)的附加信息。
對(duì)本領(lǐng)域普通技術(shù)人員而言,很顯然如上面所描述的本發(fā)明的各方面可以附圖中所說(shuō)明的實(shí)現(xiàn)中的軟件、固件和硬件的許多不同形式實(shí)現(xiàn)。用于實(shí)現(xiàn)與本發(fā)明一致的各方面的實(shí)際軟件代碼或?qū)S每刂朴布幌拗票景l(fā)明。因此,各方面的操作與行為不是參考特定的軟件代碼描述的-應(yīng)當(dāng)理解,本領(lǐng)域普通技術(shù)人員將能夠基于這里的描述設(shè)計(jì)實(shí)現(xiàn)各方面的軟件和控制硬件。
本發(fā)明優(yōu)選實(shí)施方式的以上描述提供了說(shuō)明與描述,但不是窮盡的或者要將本發(fā)明限定到所公開(kāi)的精確形式。按照以上教義,多種修改與變體都是可能的,或者多種修改與變體可以通過(guò)本發(fā)明的實(shí)踐獲得。例如,盡管上述許多操作是以特定順序描述的,但許多操作可以同時(shí)執(zhí)行或者以不同順序執(zhí)行,以獲得相同或等效的結(jié)果。
除非明確地描述了,否則在本申請(qǐng)中所使用的所有元件、動(dòng)作或指令都不應(yīng)當(dāng)看作是對(duì)本發(fā)明關(guān)鍵的或者必需的。而且,如在此所使用的,冠詞“一個(gè)”是要可能允許一個(gè)或多個(gè)項(xiàng)目。此外,除非另外明確申明,否則短語(yǔ)“基于”意思是“至少部分地基于”。
權(quán)利要求
1.一種增強(qiáng)文檔瀏覽的方法,包括接收與用戶相關(guān)的個(gè)人信息;基于第一文檔的內(nèi)容和該個(gè)人信息生成描述信息;基于該描述信息識(shí)別附加文檔;及生成包括第一文檔的內(nèi)容的至少一部分并包括對(duì)附加文檔的引用的第二文檔。
2.如權(quán)利要求1所述的方法,其中對(duì)附加文檔的引用的至少一個(gè)包括內(nèi)嵌嵌入第一文檔的鏈接。
3.如權(quán)利要求2所述的方法,其中鏈接包括描述所述引用的所述至少一個(gè)的文本。
4.如權(quán)利要求2所述的方法,其中鏈接包括漂浮文本。
5.如權(quán)利要求1所述的方法,其中基于第一文檔內(nèi)容的描述信息包括從預(yù)定命名實(shí)體列表匹配出的命名實(shí)體。
6.如權(quán)利要求5所述的方法,其中預(yù)定命名實(shí)體列表包括位置名與消費(fèi)品。
7.如權(quán)利要求1所述的方法,其中基于第一文檔內(nèi)容的描述信息包括在第一文檔中出現(xiàn)次數(shù)多于預(yù)定次數(shù)的術(shù)語(yǔ)。
8.如權(quán)利要求1所述的方法,其中個(gè)人信息包括用戶的地理位置。
9.如權(quán)利要求1所述的方法,其中個(gè)人信息包括由用戶在注冊(cè)賬號(hào)時(shí)提供的信息。
10.如權(quán)利要求1所述的方法,其中個(gè)人信息包括從由用戶生成的文檔提取的信息。
11.如權(quán)利要求1所述的方法,其中個(gè)人信息基于用戶的瀏覽歷史。
12.如權(quán)利要求1所述的方法,其中個(gè)人信息包括時(shí)間信息。
13.如權(quán)利要求1所述的方法,還包括將描述信息格式化為搜索查詢;及通過(guò)向搜索引擎提交該搜索查詢定位附加文檔。
14.一種系統(tǒng),包括用于接收與用戶相關(guān)的個(gè)人信息的裝置;用于基于第一文檔的內(nèi)容和該個(gè)人信息生成描述信息的裝置;用于基于該描述信息定位附加文檔的裝置;及用于生成包括第一文檔的所述內(nèi)容并包括對(duì)附加文檔的引用的第二文檔的裝置。
15.如權(quán)利要求14所述的系統(tǒng),還包括用于將描述信息格式化為搜索查詢的裝置;及用于通過(guò)向搜索引擎提交該搜索查詢定位附加文檔的裝置。
16.一種方法,包括定位與第一文檔相關(guān)的至少一個(gè)第二文檔;及在第一文檔中在該處第二文檔具有相關(guān)性的位置嵌入第二文檔。
17.如權(quán)利要求16所述的方法,其中第二文檔與第一文檔的相關(guān)性基于第一文檔的內(nèi)容并基于第一文檔要發(fā)往的讀者的個(gè)人信息。
18.如權(quán)利要求17所述的方法,還包括基于第一文檔的所述內(nèi)容和個(gè)人信息生成描述信息;及基于描述信息與文檔數(shù)據(jù)庫(kù)的比較定位所述至少一個(gè)第二文檔。
19.如權(quán)利要求18所述的方法,其中描述信息包括從預(yù)定命名實(shí)體列表中匹配出的命名實(shí)體。
20.如權(quán)利要求19所述的方法,其中預(yù)定命名實(shí)體列表包括位置名和消費(fèi)品。
21.如權(quán)利要求18所述的方法,其中描述信息包括在第一文檔中出現(xiàn)次數(shù)多于預(yù)定次數(shù)的術(shù)語(yǔ)。
22.如權(quán)利要求17所述的方法,其中個(gè)人信息包括要發(fā)往的讀者的地理位置。
23.如權(quán)利要求17所述的方法,其中個(gè)人信息包括由要發(fā)往的讀者在注冊(cè)賬號(hào)時(shí)提供的信息。
24.如權(quán)利要求17所述的方法,其中個(gè)人信息包括從由要發(fā)往的讀者生成的文檔提取的信息。
25.如權(quán)利要求17所述的方法,其中個(gè)人信息基于要發(fā)往的讀者的瀏覽歷史。
26.如權(quán)利要求16所述的方法,其中第二文檔作為與第一文檔中的命名實(shí)體關(guān)聯(lián)的超鏈接嵌入到第一文檔中。
27.如權(quán)利要求16所述的方法,其中在第一文檔中在該處第二文檔具有相關(guān)性的位置嵌入第二文檔的步驟還包括在該位置插入包括描述第二文檔的文本的超鏈接。
28.一種方法,包括從用戶接收對(duì)第一文檔的請(qǐng)求;識(shí)別第一文檔中的命名實(shí)體;定位與命名實(shí)體相關(guān)的第二文檔;及向用戶呈現(xiàn)第一文檔的修改版本,在第一文檔的修改版本中對(duì)第二文檔的鏈接在第一文檔中靠近與第二文檔相關(guān)的命名實(shí)體的位置內(nèi)嵌顯示。
29.如權(quán)利要求28所述的方法,其中定位第二文檔的步驟包括接收與用戶相關(guān)的個(gè)人信息;基于第一文檔的內(nèi)容和該個(gè)人信息生成描述信息;及基于描述信息定位第二文檔。
30.如權(quán)利要求28所述的方法,其中對(duì)第二文檔的鏈接通過(guò)修改指示超鏈接的命名實(shí)體的顯示字體來(lái)顯示。
31.如權(quán)利要求28所述的方法,其中對(duì)第二文檔的鏈接通過(guò)在第一文檔中靠近命名實(shí)體的位置添加包括描述第二文檔的文本的超鏈接來(lái)顯示。
32.一種包含指令的計(jì)算機(jī)可讀介質(zhì),所述指令當(dāng)由處理邏輯執(zhí)行時(shí)使處理邏輯執(zhí)行從用戶接收對(duì)第一文檔的請(qǐng)求;識(shí)別第一文檔中的命名實(shí)體;定位與命名實(shí)體相關(guān)的第二文檔;及向用戶提供第一文檔的修改版本,在第一文檔的修改版本中對(duì)第二文檔的鏈接在第一文檔中靠近與第二文檔相關(guān)的命名實(shí)體的位置內(nèi)嵌顯示。
33.一種設(shè)備,包括包含編程指令的存儲(chǔ)器;及耦合到該存儲(chǔ)器并配置成執(zhí)行該編程指令以便執(zhí)行以下的處理器接收與用戶相關(guān)的個(gè)人信息;基于第一文檔的內(nèi)容和個(gè)人信息生成描述信息;基于描述信息定位至少一個(gè)附加文檔;及生成包括修改成包括對(duì)所述至少一個(gè)附加文檔的引用的第一文檔的所述內(nèi)容的第二文檔。
34.一種增強(qiáng)第一文檔的方法,包括接收與用戶相關(guān)的個(gè)人信息;基于第一文檔的內(nèi)容和該個(gè)人信息生成描述信息;將描述信息格式化為搜索查詢;及通過(guò)向搜索引擎提交該搜索查詢定位附加文檔;及生成包括修改成包括引用所述附加文檔的至少一個(gè)的內(nèi)嵌嵌入第一文檔的鏈接的第一文檔的所述內(nèi)容的第二文檔。
全文摘要
自動(dòng)定位與例如由用戶正讀取的文檔的原始文檔相關(guān)以及還可能與用戶的個(gè)人信息相關(guān)的附加文檔。附加文檔可以基于包括用戶個(gè)人信息和正讀取文檔的內(nèi)容信息的描述信息定位。附加文檔或?qū)Ω郊游臋n的鏈接可以并入正讀取的文檔中。在有些實(shí)現(xiàn)中,附加文檔可以例如通過(guò)內(nèi)嵌鏈接或文本浮框內(nèi)嵌呈現(xiàn)在正讀取的文檔中。因此,可以有效地向用戶呈現(xiàn)與正讀取的原始文檔相關(guān)的附加信息。
文檔編號(hào)G06F17/30GK101031915SQ200580028904
公開(kāi)日2007年9月5日 申請(qǐng)日期2005年6月29日 優(yōu)先權(quán)日2004年6月30日
發(fā)明者舒密特·巴魯賈, 維伯胡·米塔爾, 邁赫蘭·薩哈米 申請(qǐng)人:Google公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1