專利名稱:基于關(guān)注度的同源信息搜索引擎聚合顯示方法的獲取網(wǎng)頁用戶關(guān)注度PageFocus的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),特別是利用計(jì)算機(jī)在互聯(lián)網(wǎng)或企業(yè)內(nèi)部網(wǎng)上提供搜索服務(wù)的搜索引擎技術(shù)。本發(fā)明還涉及一種獲取網(wǎng)頁用戶關(guān)注度的系統(tǒng)及網(wǎng)站內(nèi)容風(fēng)格自適應(yīng)裝置與方法。
背景技術(shù):
目前在hternet上存在著大量的“相同(或類似)來源的網(wǎng)頁或網(wǎng)絡(luò)服務(wù)”,例如1由同一個(gè)人或組織寫作的被大量復(fù)制的文章、觀點(diǎn)、信息網(wǎng)頁;2由同一個(gè)人或組織采訪(或發(fā)布)的被大量復(fù)制的新聞報(bào)道網(wǎng)頁;3由同一個(gè)人或組織在BBS論壇發(fā)言帖子的轉(zhuǎn)貼;5由同一個(gè)人或組織產(chǎn)生的不同數(shù)據(jù)格式、壓縮比例的多媒體文件;6由同一個(gè)人或組織產(chǎn)生的可執(zhí)行程序、數(shù)據(jù)、設(shè)計(jì)文件;7其他方式產(chǎn)生的并被廣泛復(fù)制的信息內(nèi)容。這些“相同(或類似)來源的網(wǎng)頁或網(wǎng)絡(luò)服務(wù)”在目前的搜索引擎搜索結(jié)果中被一一列舉,占據(jù)大量篇幅,內(nèi)容卻雷同,不便查詢者的瀏覽。目前各種搜索引擎和網(wǎng)頁排行服務(wù)系統(tǒng),均僅僅采用了點(diǎn)擊流量和網(wǎng)頁停留時(shí)間的方式來衡量網(wǎng)頁的熱門程度,而采取的方法主要1)搜索引擎類依靠查詢者對搜索結(jié)果的點(diǎn)擊來計(jì)算網(wǎng)頁的熱門程度,例如google、百度。2)ALEXA網(wǎng)站排行類依靠內(nèi)嵌在瀏覽器上的工具條軟件,把用戶對超級鏈接的點(diǎn)擊和網(wǎng)頁停留時(shí)間發(fā)送回服務(wù)器(參數(shù)包括當(dāng)前網(wǎng)頁地址、頁面打開時(shí)間),但是不包含其他評估方法。Alexa工作原理可參見http://www. singtaonet. com/it/it sp/t20051110 43674. html,http://www. people, com. cn/GB/it/8219/41552/41597/3109586. html。目前各種網(wǎng)站可以劃分為如下類別類別一全部網(wǎng)站內(nèi)容對任何用戶在同一時(shí)刻均具有同樣風(fēng)格與內(nèi)容(例如新聞網(wǎng)站)。類別二可以根據(jù)用戶的設(shè)定顯示不同的風(fēng)格與內(nèi)容(例如g00gle的新聞網(wǎng)站)O但是這些網(wǎng)站不能在實(shí)時(shí)根據(jù)用戶的不同狀態(tài)給出不同的顯示風(fēng)格與內(nèi)容。
發(fā)明內(nèi)容
為了改進(jìn)上述問題的不足,本發(fā)明提供這樣一種搜索方法,其能把因內(nèi)容相同而對搜索者具有相同使用價(jià)值的搜索結(jié)果聚合成一條記錄,即標(biāo)題搜索結(jié)果,根據(jù)需要再展開查看其他結(jié)果的裝置和方法,從而避免“標(biāo)題搜索結(jié)果”由于頻繁被點(diǎn)擊而導(dǎo)致目標(biāo)服務(wù)器訪問量過大而癱瘓的,把“標(biāo)題搜索結(jié)果”點(diǎn)擊自動分散到其他搜索結(jié)果目標(biāo)上的裝置與方法。本發(fā)明還提供了這樣一種系統(tǒng),其利用能夠和網(wǎng)絡(luò)上的統(tǒng)計(jì)服務(wù)器配合的網(wǎng)絡(luò)瀏覽器,將用戶的全部操作行為換算成對該網(wǎng)頁的評分,并發(fā)送回統(tǒng)計(jì)服務(wù)器,作為對網(wǎng)頁的關(guān)注程度的評分,從而可以作為搜索引擎的排名方法和工具。本發(fā)明還提供這樣一種方法利用各種可能獲得的、有助于判斷用戶所處環(huán)境和狀態(tài)的信息,在同一時(shí)刻、同一個(gè)網(wǎng)站內(nèi)、甚至?xí)r同一個(gè)頁面內(nèi),向不同狀態(tài)的用戶提供不同的顯示風(fēng)格和內(nèi)容。為了實(shí)現(xiàn)上述目的,一種將同源信息站點(diǎn)搜索引擎聚合顯示的搜索方法,其包括下列步驟(1)查詢者通過Web瀏覽器或應(yīng)用軟件訪問搜索引擎,并輸入需要查詢的關(guān)鍵詞;(2)由搜索引擎找到全部符合條件的目標(biāo)站點(diǎn)作為原始搜索結(jié)果;(3)由“同源信息處理模塊”查詢“成為標(biāo)題搜索結(jié)果”的權(quán)力采購者的賬戶信息, 并結(jié)合其他判斷規(guī)則在原始搜索結(jié)果中選取用來作為“標(biāo)題搜索結(jié)果”的對象;(4)由搜索引擎Web服務(wù)器或應(yīng)用服務(wù)器只將選中的“標(biāo)題搜索結(jié)果”作為搜索結(jié)果展示給查詢者,并為其提供一個(gè)帶有“展開查看細(xì)節(jié)或其他信息”含義的“按鈕;(5)查詢者還可按動與之對應(yīng)的“按鈕”,搜索引擎再向其展示在O)中找到的原始搜索結(jié)果。“同源信息處理模塊”有多個(gè)“(相應(yīng)信息種類的)同源信息處理模塊”組成,例如 “同源網(wǎng)頁處理模塊”、“同源多媒體處理模塊”、“同源圖片處理模塊”、“同源文檔處理模塊”、 “同源軟件處理模塊”、“同源數(shù)據(jù)或數(shù)據(jù)庫處理模塊”、“同源GIS信息處理模塊”、“同價(jià)值網(wǎng)絡(luò)服務(wù)處理模塊”、“同價(jià)值商業(yè)信息處理模塊”等。所述“同源信息處理模塊”包括如下步驟(1)首先由“信息種類判斷模塊”對網(wǎng)絡(luò)搜索器收到的信息進(jìn)行種類判斷;(2)將相同種類的信息集中發(fā)送到“(相應(yīng)信息種類的)同源信息處理模塊”;(3)將由“(相應(yīng)信息種類的)同源信息處理模塊”處理后的搜索信息歸檔進(jìn)入“非同源(相應(yīng)信息種類的)結(jié)果信息庫”或“同源(相應(yīng)信息種類的)結(jié)果信息庫”。(4)由系統(tǒng)把“非同源(相應(yīng)信息種類的)結(jié)果信息庫”和“同源(相應(yīng)信息種類的)結(jié)果信息庫”發(fā)布到Web服務(wù)器上,供查詢者查詢。作為另一中實(shí)現(xiàn)方法,也可以根據(jù)這兩個(gè)數(shù)據(jù)庫直接向查詢者提供基于動態(tài)網(wǎng)頁的查詢服務(wù)。所述由“同源網(wǎng)頁處理模塊”處理網(wǎng)頁信息的步驟如下所示(1)在“搜索引擎搜索部分”接收需要查詢的關(guān)鍵詞的時(shí)候,首先由“搜索結(jié)果已經(jīng)發(fā)布在Web服務(wù)器上的判決器”判斷該關(guān)鍵詞是否近期已經(jīng)被其他人查詢過,如果被查詢過,并且結(jié)果已經(jīng)在“搜索引擎搜索結(jié)果Web服務(wù)器”上發(fā)布,則直接返回搜索結(jié)果,該結(jié)果中已經(jīng)將具有相同來源的網(wǎng)頁聚合成一條搜索結(jié)果,點(diǎn)擊“同源網(wǎng)頁”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個(gè)包括全部搜索結(jié)果的搜索結(jié)果網(wǎng)頁,完成整個(gè)查詢過程;(2)如果在“搜索引擎搜索部分”接收需要查詢的關(guān)鍵詞的時(shí)候,由“搜索結(jié)果已經(jīng)發(fā)布在Web服務(wù)器上的判決器”判斷該關(guān)鍵詞近期沒有被其他人查詢過,并且也沒有相應(yīng)的查詢結(jié)果在“搜索引擎搜索結(jié)果Web服務(wù)器”上發(fā)布則A.啟動“網(wǎng)頁搜索器”搜索“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫” 找到符合搜索關(guān)鍵詞的網(wǎng)頁地址,并獲取這些網(wǎng)頁的內(nèi)容;B.如果“網(wǎng)頁搜索器”在“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”中沒有找到符合搜索關(guān)鍵詞的網(wǎng)頁地址,則返回查詢者“沒有符合條件網(wǎng)頁”的結(jié)果,并且將該搜索關(guān)鍵詞加入到下一輪更新“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的任務(wù)中,如果在更新過程中找到了符合條件的網(wǎng)頁地址則根據(jù)其是否具有同源網(wǎng)頁而選擇入 “非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”或“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”,這樣如果再有人搜索同樣的關(guān)鍵詞是就可以找到結(jié)果;(3)由“網(wǎng)頁內(nèi)容分離器”將找到的網(wǎng)頁內(nèi)容及超級鏈接目標(biāo)分解成多媒體、圖片、文字、超級鏈接等種類;(4)分別由各種內(nèi)容判決器產(chǎn)生判決結(jié)果A.由“多媒體內(nèi)容判決器”產(chǎn)生目標(biāo)網(wǎng)頁所含“相同多媒體文件程度SMS(Same Media Score)” ;B.由“圖片內(nèi)容判決器”產(chǎn)生目標(biāo)網(wǎng)頁所含“相同圖片的程度SPS(Same Photo Score),,;C.由“文字內(nèi)容判決器”產(chǎn)生目標(biāo)網(wǎng)頁所含“相同文字的程度STS(Same Text Score),,;D.由“鏈接內(nèi)容判決器”產(chǎn)生目標(biāo)網(wǎng)頁所含“相同超級連接的程度SHS (Same Hyperlinks Score),,;(5)從“同源網(wǎng)頁判決規(guī)則庫”分別獲取“多媒體判決權(quán)重SMP”、“圖片判決權(quán)重 SPP”、“文字判決權(quán)重STP”、“鏈接判決權(quán)重SHP”并分別與第(4)步生成的“相同多媒體文件程度SMS”、“相同圖片的程度SPS”、“相同文字的程度STS”、“相同超級連接的程度SHS” 做數(shù)學(xué)乘法;(6)將第(5)步獲得的數(shù)學(xué)乘法結(jié)果做加法,獲得網(wǎng)頁的“同源程度SSS(SameSourc Score) ”,同源程度 SSS = (SMS*SMP) + (SPS*SPP) + (STS*STP) + (SHS*SHP);(7)判斷該網(wǎng)頁的“同源程度SSS”是否超出門限,如果超出門限則判定為與其它網(wǎng)頁的“同源網(wǎng)頁”,如果沒有超出門限則判定為“非同源網(wǎng)頁”;(8)將第(7)步產(chǎn)生的“非同源網(wǎng)頁”由“非同源網(wǎng)頁處理模塊”入“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”;將第(7)步產(chǎn)生的“同源網(wǎng)頁”由“同源網(wǎng)頁處理模塊”入“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”;(9)由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給查詢用戶;(10)作為第(9)步的另一種實(shí)現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。所述由“同源信息處理模塊”也可包括如下步驟(1)在收到查詢者的搜索關(guān)鍵詞,并通過軟件根據(jù)關(guān)鍵詞內(nèi)容和關(guān)鍵詞語法判斷需要查找的文件或網(wǎng)絡(luò)服務(wù);(2)判斷“要搜索的內(nèi)容已經(jīng)發(fā)布在Web服務(wù)器上嗎? ”,如果搜索的目標(biāo)已經(jīng)發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則直接返回搜索結(jié)果,該結(jié)果中已經(jīng)將符合搜索條件并具有相同來源的文件或網(wǎng)絡(luò)服務(wù)的獲取入口聚合成一條“標(biāo)題搜索結(jié)果”,點(diǎn)擊“同源文件”按鈕后,可以在“搜索引擎搜索結(jié)果Web服務(wù)器”上看到另一個(gè)包括全部搜索結(jié)果的網(wǎng)頁,使查詢者可以看到符合查詢條件的全部搜索結(jié)果,完成搜索過程。如果搜索的目標(biāo)沒有發(fā)布在“搜索引擎搜索結(jié)果Web服務(wù)器”上則從第(3)步開始;
(3)返回查詢者“沒有符合條件的結(jié)果”的提示;(4)將該搜索關(guān)鍵詞加入到下一輪更新“同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的任務(wù)中,并定期啟動兩個(gè)數(shù)據(jù)庫的更新過程;(5) “同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的更新過程A.由搜索器搜索網(wǎng)頁新出現(xiàn)的目標(biāo)文件或服務(wù)入口,通過軟件進(jìn)入該入口獲取該文件或網(wǎng)絡(luò)服務(wù);B.由“內(nèi)容判決器”判斷新找到的信息“與當(dāng)前“同源信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎? ”如果“是”則將它作為一個(gè)新的元素歸入“同源信息索引數(shù)據(jù)庫”的該類別;如果“否”則由“內(nèi)容判決器”判斷它“與當(dāng)前非同源信息索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎? ”C.如果“是”則“為當(dāng)前的信息和與之同源的并已經(jīng)存貯在‘非同源信息索引數(shù)據(jù)庫’中的信息,新建一個(gè)類別并全部轉(zhuǎn)移到‘同源信息索引數(shù)據(jù)庫’”;D.如果“否”則“為當(dāng)前的信息新建一個(gè)類別,并存入‘非同源信息索引數(shù)據(jù)庫,”;(6)由“搜索結(jié)果網(wǎng)頁發(fā)布器”根據(jù)“同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”和“非同源網(wǎng)頁結(jié)果數(shù)據(jù)庫”的內(nèi)容動態(tài)生成搜索結(jié)果的靜態(tài)網(wǎng)頁,發(fā)布到“搜索引擎搜索結(jié)果Web服務(wù)器”,再通過瀏覽器呈現(xiàn)給前來搜索的查詢者;(7)作為第(6)步的另一種實(shí)現(xiàn)方法,也可以通過“動態(tài)網(wǎng)頁Web服務(wù)器”直接通過瀏覽器呈現(xiàn)給查詢用戶。所述由同源信息處理模塊處理文檔時(shí),“同源信息索引數(shù)據(jù)庫”和“非同源信息索引數(shù)據(jù)庫”的更新過程為A.由“文檔搜索器”搜索網(wǎng)頁新出現(xiàn)的文檔文件或鏈接入口,通過軟件進(jìn)入該入口獲取該文件或服務(wù);B.由“文字內(nèi)容判決器”和“圖片內(nèi)容判決器”判斷新找到的文檔內(nèi)容“與當(dāng)前‘同源文檔索引數(shù)據(jù)庫’的內(nèi)容屬于同一內(nèi)容嗎? ”如果“是”則將它作為一個(gè)新的元素歸入“同源文檔索引數(shù)據(jù)庫”的該類別;如果“否”則由“文檔內(nèi)容判決器”判斷它“與當(dāng)前非同源文檔索引數(shù)據(jù)庫”的內(nèi)容屬于同一內(nèi)容嗎? ” ;C.如果“是”則“為當(dāng)前的文檔和與之同源的并已經(jīng)存貯在‘非同源文檔索引數(shù)據(jù)庫’中的文檔,新建一個(gè)類別并全部轉(zhuǎn)移到‘同源文檔索引數(shù)據(jù)庫’”;如果“否”則“為當(dāng)前的文檔新建一個(gè)類別,并存入‘非同源文檔索引數(shù)據(jù)庫’,,;所述相關(guān)內(nèi)容判決器模塊包括如下步驟(1)接收“被判斷對象”可以接收多個(gè)來源的多媒體,并記錄被判斷對象的數(shù)量 InputQuantity ;(2)查找“被判斷對象”既定的可參與比對的屬性,記錄當(dāng)前屬性具有相同值的“被判斷對象”的數(shù)量SameQuantity ;(3)輸入當(dāng)前屬性在判斷過程中的“權(quán)重”值Power ;(4)計(jì)算被全部“被判斷對象”在當(dāng)前屬性上的吻合度PSame = SameQuant i ty^Power ;(5)返回(1)對下一個(gè)“屬性”執(zhí)行(1) (4),得到該屬性的PSame,直至獲得部屬性的PSame值;(6)計(jì)算并返回“被判斷對象”的相同內(nèi)容程度值A(chǔ)ameMediaPower =(全部 Psame值的數(shù)學(xué)累加值)/InputQuantity。內(nèi)容判決器模塊為文字內(nèi)容判決器時(shí),其包括如下步驟(1)找出文字內(nèi)容中具有相同的單詞或句子的部分的總計(jì)長度值SameLenth ;(2)找出輸入的多個(gè)文字內(nèi)容中,長度最短的輸入文字的長度值MinLenth ;(3)返回文字相 1以程度值 SameTextPower = SameLenth/MinLentho內(nèi)容判決器模塊為鏈接內(nèi)容判決器時(shí),其包括如下步驟(1)接收“被判斷對象”多個(gè)超級鏈接的URL地址;(2)統(tǒng)計(jì)“被判斷對象”相似程度=SameURLPower =在被判斷的每個(gè)超級鏈接所指向的頁面上均出現(xiàn)過的目標(biāo)URL地址數(shù)量;(3)返回 SameURLPower。內(nèi)容判決器模塊為商業(yè)信息內(nèi)容判決器時(shí),其包括如下步驟(1)比對參與比對的商業(yè)信息是否是相同的產(chǎn)品或服務(wù),如果“不是”返回“不一致”,如果“是”進(jìn)入第(2)步。(2)判斷參與比對的商業(yè)信息是否具有地理位置敏感性,如果“不是”返回判斷結(jié)果“一致”,如果“是”則進(jìn)行第(3)步。(3)判斷參與比對的商業(yè)信息的提供者是否處于相同的城市或區(qū)域,如果“不是” 返回判斷結(jié)果“不一致”,如果是返回判斷結(jié)果“一致”?!皹?biāo)題搜索結(jié)果”選擇的具體實(shí)現(xiàn)方法如下(1)計(jì)算每個(gè)“同源搜索結(jié)果”成為“標(biāo)題搜索結(jié)果”的概率權(quán)值PWn Pffn = TP^PageFocus/(RespDelay-K)η:該搜索結(jié)果為第η條當(dāng)(RespDelay-K)小于等于零時(shí),(RespDelay-K)應(yīng)取值為1Pagei7Ocus 網(wǎng)頁關(guān)注度值RespDelay 網(wǎng)頁服務(wù)響應(yīng)延遲K 服務(wù)響應(yīng)常數(shù),建議K設(shè)置為50毫秒(ms)。TP 標(biāo)題搜索結(jié)果權(quán)力(2)統(tǒng)計(jì)求和全部原始“同源搜索結(jié)果”的概率權(quán)值PWn的總和=PWall全部概率權(quán)值;(3)計(jì)算每條“同源搜索結(jié)果”成為“標(biāo)題搜索結(jié)果”的概率Pn = Pffn/Pwall ;(4)按照Pn值的概率,隨著搜索者的訪問動作,動態(tài)地隨機(jī)選擇“標(biāo)題搜索結(jié)果”, 呈現(xiàn)給搜索者。所述“標(biāo)題搜索結(jié)果”的概率權(quán)值PWn的計(jì)算方法還可以是a. PWn= (TP+PageFocus) / (RespDelay-K)或,b. Pffn = (TP+PageFocus)/RespDelay/K 或,c. Pffn = TP氺PageFocus/RespDelay/K。所述“同源信息處理模塊”A.可以內(nèi)嵌在搜索引擎中;
B.可以放置在“搜索引擎”和“搜索引擎搜索結(jié)果Web服務(wù)器”之間;C.也可以作為預(yù)處理模塊放置在“搜索引擎”和被搜索站點(diǎn)之間。所述展開查看細(xì)節(jié)或其他信息含義的按鈕可為超級連接或各種軟件界面控件。—種獲取網(wǎng)頁用戶搜索結(jié)果關(guān)注度的系統(tǒng),包括I^gei^ocus網(wǎng)絡(luò)服務(wù)器、 PageFocus網(wǎng)絡(luò)瀏覽器及網(wǎng)頁計(jì)分服務(wù)器,PageFocus網(wǎng)絡(luò)服務(wù)器包括I^agei^cus瀏覽器ID注冊服務(wù)器、 PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器、PageFocus瀏覽器在線升級服務(wù)器及數(shù)據(jù)加解密模塊;PageFocus網(wǎng)絡(luò)瀏覽器包括I^agei^cus瀏覽器ID注冊模塊、關(guān)注分值I^agei^cus 計(jì)算模塊。其工作步驟如下(1)"PageFocus網(wǎng)絡(luò)瀏覽器”,每個(gè)瀏覽器均在安裝時(shí)具備全球唯一的ID標(biāo)識號, 或在使用時(shí)主動尋找網(wǎng)絡(luò)上的“PageFocus瀏覽器ID注冊服務(wù)器”以獲得全球唯一的ID標(biāo)識號;(2) "PageFocus網(wǎng)絡(luò)瀏覽器”具備具有常規(guī)網(wǎng)絡(luò)瀏覽器,并將用戶對瀏覽器的操作和對網(wǎng)頁的操作按照權(quán)重轉(zhuǎn)換成網(wǎng)頁的“關(guān)注分值I^agei^cus”并形成“PageFocus數(shù)據(jù)包”,以加密方式通過網(wǎng)絡(luò)協(xié)議傳遞至本搜索引擎的“I^agei^cusAcckrver網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器”;GyTagei^cusAcckrVer網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器”在收到全球的每一個(gè)“PageFocus 網(wǎng)絡(luò)瀏覽器”發(fā)來的“PageFocus數(shù)據(jù)包”后將其內(nèi)部包含的“關(guān)注分值I^agei^cus”累加到相應(yīng)的網(wǎng)頁上;(4) "PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器”上包含的全球每一個(gè)網(wǎng)頁的“關(guān)注分值I^agei^cus”,這些信息可以通過各種處理方法形成搜索引擎對網(wǎng)頁排行依據(jù)、搜索引擎在具有相同內(nèi)容搜索結(jié)果中選擇可以作為“標(biāo)題搜索結(jié)果”的依據(jù)、也可以直接公布出來作為“網(wǎng)頁熱門程度排行榜”的服務(wù)。所述I^gei^cusAcckrver網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器可以采用數(shù)學(xué)對數(shù)或科學(xué)計(jì)數(shù)法記錄得分。所述I^gei^ocus數(shù)據(jù)包可以在瀏覽器徹底關(guān)閉該網(wǎng)頁時(shí)形成,也可以定時(shí)形成, 也可以累計(jì)到某個(gè)分值時(shí)再形成。所述關(guān)注分值I^agei^cus按照下表所列權(quán)重形成瀏C^MHJ為k'j·.Il1Jii!打開網(wǎng)頁1 (或 1.1、1.3、1.5)用戶有興趣打JT對網(wǎng)頁在網(wǎng)頁停留小于10秒-10 (或 7、8、9)另人討厭的網(wǎng)頁在網(wǎng)頁停留小于30秒-3 (或-5、-4、-2)不興趣或內(nèi)容非常簡單在網(wǎng)頁停留小于1分鐘-1 (或-3、-2、-1.5)沒什么興趣或內(nèi)容非常簡單在網(wǎng)貝停留超過1分鐘3 (或 1、2、5)普通的瀏覽在網(wǎng)頁停留超過5分鐘5 (或 3、4、5)比較認(rèn)真的瀏覽文字閱讀速度100/文字閱讀速度1.“文字閱讀速度”可以通過判斷用戶使用鍵盤、鼠標(biāo)滾輪、“滾動條拖動” 的操作幅度、頻率和網(wǎng)頁內(nèi)容字體大小來計(jì)算。
2.“文字閱讀逨度”=被滾動的文字?jǐn)?shù)量/滾動時(shí)間間隔。
3.“文字閱讀速度”的單位為字/每秒 4.說明1秒看100字說明很不認(rèn)真, 得1分;1秒看一個(gè)字說明很認(rèn)真,得 100 分。網(wǎng)頁內(nèi)容中的圖片被點(diǎn)擊,而圖片1的超級鏈接指向一個(gè)圖片3 (或 1、2、4)說明該圖片可能提供了“放大圖片”,代表該圖片可能是網(wǎng)頁的主體內(nèi)容,并且用戶點(diǎn)擊了它,說明用戶想仔細(xì)看看放大的圖片。網(wǎng)頁內(nèi)容中的圖片被點(diǎn)擊,而圖片上的超級鏈接指向網(wǎng)站內(nèi)一個(gè)網(wǎng)頁1 (或 0.1、0.2、0.9)很可能是個(gè)“廣告”圖片。網(wǎng)頁內(nèi)容中的圖片被點(diǎn)擊,而圖片上的超級鏈接指向網(wǎng)站外一個(gè)網(wǎng)頁0(或 0.1、0.2、0.3)很可能是個(gè)"廣告”圖片。網(wǎng)頁內(nèi)容中的超級鏈接被點(diǎn)擊,而目標(biāo)與當(dāng)前網(wǎng)頁處于同一目求下=2 (或 0.5、1、2.5)很可能是同一篇文章的網(wǎng)頁連載,本網(wǎng)頁和被點(diǎn)擊超級鏈接指向的M頁均可獲得本“權(quán)重”的得分。例如 “ http:/www.yoogol.com/news/01.htm ” 禾口 "http:/www.yoogol.com/news/02.htm"網(wǎng)頁內(nèi)容中的超級鏈接被點(diǎn)擊,而目標(biāo)站外網(wǎng)頁。0 (或-0.5、-0.3、-0.1)和本M頁沒什么關(guān)系網(wǎng)頁內(nèi)容中含有標(biāo)題為 “1 2 3 4"等帶有序號含i的文字,而目標(biāo)均N本網(wǎng)頁和標(biāo)題為“丄2 3 4"等帶有序號含義,并目.目標(biāo)均指Slil—個(gè)URL目錄的網(wǎng)貞通常為同一篇文章的分頁顯示。
權(quán)利要求
1.一種基于關(guān)注度的同源信息搜索引擎聚合顯示方法的獲取網(wǎng)頁用戶關(guān)注度 PageFocus的系統(tǒng),所述系統(tǒng)包括I^agei^cus網(wǎng)絡(luò)服務(wù)器、PageFocus網(wǎng)絡(luò)瀏覽器,其特征在于(1)PageFocus網(wǎng)絡(luò)服務(wù)器包括I^agei^cus瀏覽器ID注冊服務(wù)器、PageFocusAccServer 網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器、PageFocus瀏覽器在線升級服務(wù)器和數(shù)據(jù)加解密模塊;(2)PageFocus網(wǎng)絡(luò)瀏覽器包括I^agei^cus瀏覽器ID注冊模塊、關(guān)注分值I^agei^cus計(jì)算模塊;所述系統(tǒng)的工作步驟如下(1)"PageFocus網(wǎng)絡(luò)瀏覽器”,每個(gè)I^agei^cus網(wǎng)絡(luò)瀏覽器均在安裝時(shí)具備全球唯一的 ID標(biāo)識號,或在使用時(shí)主動尋找網(wǎng)絡(luò)上的“PageFocus瀏覽器ID注冊服務(wù)器”以獲得全球唯一的ID標(biāo)識號;(2)"PageFocus網(wǎng)絡(luò)瀏覽器”具備具有常規(guī)網(wǎng)絡(luò)瀏覽器,并將用戶對I^agei^cus網(wǎng)絡(luò)瀏覽器的操作和對網(wǎng)頁的操作,以及網(wǎng)頁內(nèi)容特征按照權(quán)重轉(zhuǎn)換成網(wǎng)頁的“關(guān)注分值 f^geR)CUS”并形成“PageFocus數(shù)據(jù)包”,以加密方式通過網(wǎng)絡(luò)協(xié)議傳遞至本搜索引擎的 "PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器”;(3)"PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器”在收到全球的每一個(gè)"I^agei7Ocus網(wǎng)絡(luò)瀏覽器”發(fā)來的“PageFocus數(shù)據(jù)包”后將該“I^agei^cusAcckrver網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器” 內(nèi)部包含的“關(guān)注分值I^agei^cus”累加到相應(yīng)的網(wǎng)頁上;(4)"PageFocusAccServer網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器”上包含的全球每一個(gè)網(wǎng)頁的“關(guān)注分值f^geR)CUS”,這些信息可以通過各種處理方法形成搜索引擎對網(wǎng)頁排行依據(jù)、搜索引擎在具有相同內(nèi)容搜索結(jié)果中選擇可以作為“標(biāo)題搜索結(jié)果”的依據(jù)、也可以直接公布出來作為“網(wǎng)頁熱門程度排行榜”的服務(wù)。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述I^gei^ocus數(shù)據(jù)包可以在I^gei^ocus 網(wǎng)絡(luò)瀏覽器徹底關(guān)閉該網(wǎng)頁時(shí)形成,也可以定時(shí)形成,也可以累計(jì)到某個(gè)分值時(shí)再形成,以減少I^agei^cusAcckrver網(wǎng)頁關(guān)注統(tǒng)計(jì)服務(wù)器的計(jì)算壓力。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述關(guān)注分值I^gei^ocus按照下表所列權(quán)重形成
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,所述文字閱讀速度的計(jì)算步驟如下A.鼠標(biāo)滾輪滾動文字閱讀速度=(顯示區(qū)寬度/字體寬度廣每次滾動的文字行數(shù)/ 滾動時(shí)間間隔;B.鍵盤翻頁文字閱讀速度=(顯示區(qū)寬度/字體寬度廣每次翻頁的文字行數(shù)/翻頁時(shí)間間隔;C.窗體滾動條滾動文字閱讀速度=(顯示區(qū)寬度/字體寬度廣每次滾動的文字行數(shù) /滾動時(shí)間間隔。
5.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,所述I^agei^cus數(shù)據(jù)包包括I^agei^cus瀏覽器ID、網(wǎng)頁URL和網(wǎng)頁I^agei^cus得分值字段。
6.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,具備“同源網(wǎng)頁”的每一個(gè)網(wǎng)頁在參與搜索引擎提供的網(wǎng)頁排名過程中,可以使用每一個(gè)“同源網(wǎng)頁”獲得的用戶關(guān)注度PageFocus分值的總和作為排名的依據(jù),即A在“同源網(wǎng)頁”的“標(biāo)題搜索結(jié)果”在參與搜索引擎結(jié)果排名時(shí)可以采用每一個(gè)“同源網(wǎng)頁”獲得的用戶關(guān)注度I^gei^cus的總和作為排名依據(jù); B “同源網(wǎng)頁”內(nèi)的每一個(gè)網(wǎng)頁在參與搜索引擎結(jié)果排名時(shí)也可以采用其從屬的“同源網(wǎng)頁” 的每一個(gè)網(wǎng)頁獲得的用戶關(guān)注度I^gei^ocus的總和作為排名依據(jù)。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述I^gei^cus網(wǎng)絡(luò)瀏覽器還包括 PageFocus瀏覽器在線升級模塊。
8.根據(jù)權(quán)利要求1 7任一所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括網(wǎng)頁計(jì)分服務(wù)ο
全文摘要
本發(fā)明涉及一種基于關(guān)注度的同源信息搜索引擎聚合顯示方法及系統(tǒng)。搜索引擎找到全部符合條件的目標(biāo)站點(diǎn)作為原始搜索結(jié)果;依據(jù)內(nèi)容質(zhì)量、顯示加權(quán)權(quán)力采購者的賬戶信息和服務(wù)質(zhì)量等要素,將原始搜索結(jié)果聚合成一條標(biāo)題搜索結(jié)果;只將標(biāo)題搜索結(jié)果作為搜索結(jié)果展示給查詢者,當(dāng)其需要時(shí)才為其展開查看全部搜索結(jié)果。本系統(tǒng)采用統(tǒng)計(jì)服務(wù)器配合網(wǎng)絡(luò)瀏覽器,將用戶的全部操作行為換算成對該網(wǎng)頁的關(guān)注程度評分值PageFocus,并發(fā)送回統(tǒng)計(jì)服務(wù)器來代表其內(nèi)容質(zhì)量,從而可以作為搜索引擎的選擇“標(biāo)題搜索結(jié)果”和進(jìn)行結(jié)果顯示排名的方法。本發(fā)明還涉及一種能夠自動判斷用戶狀態(tài)并提供恰當(dāng)?shù)木W(wǎng)頁風(fēng)格與內(nèi)容的方法。
文檔編號G06F17/30GK102298621SQ20111022885
公開日2011年12月28日 申請日期2006年2月22日 優(yōu)先權(quán)日2006年2月22日
發(fā)明者王東 申請人:王東