亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

實時搜索引擎的制作方法

文檔序號:7613441閱讀:312來源:國知局
專利名稱:實時搜索引擎的制作方法
背景技術(shù)
搜索引擎,如同他們當(dāng)前存在于國際互聯(lián)網(wǎng)上那樣,由全世界的人使用以發(fā)現(xiàn)和下載所關(guān)心的、駐留在服務(wù)器上的數(shù)據(jù)對象。一般地,這些搜索引擎定期檢查在國際互聯(lián)網(wǎng)上的許多服務(wù)器來查看每個服務(wù)器包含什么數(shù)據(jù)對象。此后,該搜索引擎構(gòu)造每個服務(wù)器內(nèi)容的一個索引,并且連接該內(nèi)容到那個服務(wù)器的位置。
索引的構(gòu)造是一個耗時的任務(wù),而且由于涉及該服務(wù)器和搜索引擎的相對成本,所以索引構(gòu)造不能經(jīng)常進行。為了減少在搜索引擎索引構(gòu)造器和包含被搜索數(shù)據(jù)的服務(wù)器上的負擔(dān),犧牲了由該搜索引擎創(chuàng)建的信息的及時性。
這意味著該搜索引擎索引是很快過時的。對于某些類型的數(shù)據(jù)對象,這不意味著什么,因為該數(shù)據(jù)對象被相對緩慢地創(chuàng)建和修改。然而,對于被相對經(jīng)常地創(chuàng)建和刪除的數(shù)據(jù)對象來說,該搜索引擎索引是不切實際的,而且對于被每天增加和刪除的數(shù)據(jù)對象來說,標準的搜索引擎事實上是沒用的。此外,當(dāng)前的范例假定一個相對靜態(tài)的服務(wù)器環(huán)境,但是在一個其中服務(wù)器相對頻繁地上線和下線、以及數(shù)據(jù)對象被每小時或者更頻繁地增加和刪除的環(huán)境中,標準的搜索引擎方法是完全沒有用的。
因此,能夠看出存在一個維持駐留在當(dāng)前連接到國際互聯(lián)網(wǎng)的服務(wù)器上的數(shù)據(jù)內(nèi)容的一個最新索引的國際互聯(lián)網(wǎng)搜索引擎的需要。
還進一步存在對一個實時搜索引擎的需要,其中該搜索引擎顯著地降低了使用由現(xiàn)有技術(shù)采用的方法構(gòu)造一個搜索引擎的成本。
概述本發(fā)明通過提供一種用于創(chuàng)建一個在國際互聯(lián)網(wǎng)上的實時搜索引擎的方法來滿足這些需要,該實時搜索引擎響應(yīng)于一個接收者客戶端的搜索請求,提供一個包含數(shù)據(jù)對象的數(shù)據(jù)對象描述和服務(wù)器描述34的搜索答復(fù),其中該數(shù)據(jù)對象是當(dāng)前可用于從一個供應(yīng)者服務(wù)器直接傳送到一個接收者客戶端的。該方法包含通過國際互聯(lián)網(wǎng)連接到一個實時搜索引擎的供應(yīng)者服務(wù)器,該供應(yīng)者服務(wù)器向該實時搜索引擎提供駐留在供應(yīng)者服務(wù)器上的數(shù)據(jù)對象的數(shù)據(jù)對象描述,而且該實時搜索引擎索引與該供應(yīng)者服務(wù)器的數(shù)據(jù)對象相關(guān)的數(shù)據(jù)對象描述,其中當(dāng)該供應(yīng)者服務(wù)器從該實時搜索引擎斷開時,則從該實時搜索引擎中清除由該供應(yīng)者服務(wù)器提供的數(shù)據(jù)對象描述。
該方法進一步包含供應(yīng)者服務(wù)器自動地、實時向該實時搜索引擎提供被添加給該供應(yīng)者服務(wù)器的數(shù)據(jù)對象的數(shù)據(jù)對象描述。
更可取地是,該方法進一步包含該供應(yīng)者服務(wù)器自動地、實時通知從該供應(yīng)者服務(wù)器中被刪除了的數(shù)據(jù)對象的實時搜索引擎,其中該實時搜索引擎然后清除該數(shù)據(jù)對象描述。
數(shù)據(jù)對象描述包含任何下列內(nèi)容數(shù)據(jù)對象的標題、數(shù)據(jù)對象的大小、數(shù)據(jù)對象的類型、任何與該數(shù)據(jù)對象相關(guān)的文本、數(shù)據(jù)對象的創(chuàng)建者、數(shù)據(jù)對象的質(zhì)量等級、以及數(shù)據(jù)對象所駐留的供應(yīng)者服務(wù)器。服務(wù)器描述34包含任何下列內(nèi)容該服務(wù)器國際互聯(lián)網(wǎng)協(xié)議地址、由該服務(wù)器允許的同時連接數(shù)目、該服務(wù)器的可靠性、以及該服務(wù)器的名稱。
更可取地是,使用了一個客戶端搜索命令,其中一個接收者客戶端搜索該數(shù)據(jù)對象描述,以查找最好的數(shù)據(jù)對象并選擇駐留有該數(shù)據(jù)對象的最佳供應(yīng)者服務(wù)器。
此外,該接收者客戶端搜索請求進一步包含一個供應(yīng)者服務(wù)器限制標準,其中搜索引擎刪除不滿足該服務(wù)器限制標準的所有供應(yīng)者服務(wù)器的搜索響應(yīng)。
在一個最佳實施例中,該供應(yīng)者服務(wù)器限制標準包含一個帶寬限制,其中搜索引擎刪除具有一個低于該帶寬限制的帶寬容量的供應(yīng)者服務(wù)器的搜索響應(yīng)。
可選的是,該實時搜索引擎清除不能接受附加的接收者客戶端下載請求的供應(yīng)者服務(wù)器的搜索響應(yīng)。
此外在一個最佳實施例中,由該客戶端分類一個自動的搜索響應(yīng)。由該響應(yīng)度值來分類該自動的搜索響應(yīng),其中通過測量一個回聲應(yīng)答消息由該供應(yīng)者服務(wù)器回復(fù)到該接收者客戶端所花費的時間數(shù)量來確定響應(yīng)度值。更可取地,如果該供應(yīng)者服務(wù)器沒有在一個具體的時間期限內(nèi)答復(fù)該接收者客戶端的回聲請求,則從該搜索響應(yīng)中刪除該供應(yīng)者服務(wù)器。
該數(shù)據(jù)對象是從包含一個音頻數(shù)據(jù)對象、一個文本數(shù)據(jù)對象、一個圖像數(shù)據(jù)對象、一個視頻數(shù)據(jù)對象、以及一個軟件可執(zhí)行程序數(shù)據(jù)對象的組中選擇出來的類型。
在一個最佳實施例中,該實時搜索引擎進一步包含接收者在搜索響應(yīng)中選擇一個供應(yīng)者服務(wù)器,然后該接收者客戶端從選擇的供應(yīng)者服務(wù)器中下載該數(shù)據(jù)對象。此外,該接收者客戶端同時作為一個對其他接收者客戶端的供應(yīng)者服務(wù)器進行操作,使已經(jīng)由該接收者客戶端下載的數(shù)據(jù)對象變?yōu)榭梢杂稍谠搰H互聯(lián)網(wǎng)上的其他接收者客戶端得到。
附圖簡要說明

圖1是本發(fā)明中的系統(tǒng)的一個最佳實施例的一個概圖;圖2是具有它的搜索引擎、索引構(gòu)造器以及網(wǎng)關(guān)組件的實時搜索引擎的一個最佳實施例的一個概圖;圖3是當(dāng)從國際互聯(lián)網(wǎng)下載一個新的數(shù)據(jù)對象或者相反一個新的數(shù)據(jù)對象被添加到該供應(yīng)者服務(wù)器中時、或者在登錄過程期間對該數(shù)據(jù)對象集合進行初始掃描時的處理過程的一個實施例的一個流程圖;以及圖4是由一個接收者客戶端構(gòu)造的一個搜索請求的一個實施例的流程圖。
詳細說明本發(fā)明提供了一種用于創(chuàng)建一個在國際互聯(lián)網(wǎng)上的實時搜索引擎的方法,該實時搜索引擎響應(yīng)于一個接收者客戶端的搜索請求,提供一個包含了數(shù)據(jù)對象的數(shù)據(jù)對象描述和服務(wù)器描述34的搜索響應(yīng),其中該數(shù)據(jù)對象是當(dāng)前可用于從一個供應(yīng)者服務(wù)器直接傳送到一個接收者客戶端的。這個發(fā)明的要素是當(dāng)該供應(yīng)者服務(wù)器和該實時搜索引擎斷開時,從該實時搜索引擎中清除由該供應(yīng)者服務(wù)器提供的數(shù)據(jù)對象描述。這向接收者客戶端提供了僅僅包含那些當(dāng)前可以用來提供和傳送任何數(shù)據(jù)到該接收者客戶端的服務(wù)器來源的搜索結(jié)果。
現(xiàn)在轉(zhuǎn)到附圖,圖1中顯示了本發(fā)明的總體結(jié)構(gòu)和它的組件。實質(zhì)上一個實時搜索的組件包含至少一個接收者客戶端16,其連接到該實時搜索引擎10以定位一個期望的數(shù)據(jù)對象24。至少一個供應(yīng)者服務(wù)器12連接到該實時搜索引擎,并且提供一個或多個數(shù)據(jù)對象描述22到該實時搜索引擎。如果該供應(yīng)者服務(wù)器12和該實時搜索引擎斷開,則從該實時搜索引擎中清除該數(shù)據(jù)對象描述22,以指示那些數(shù)據(jù)對象24不再可用于從該供應(yīng)者服務(wù)器下載到該接收者客戶端16。
更可取地是,該供應(yīng)者服務(wù)器自動地、實時向該實時搜索引擎提供被添加給該供應(yīng)者服務(wù)器12的數(shù)據(jù)對象24的數(shù)據(jù)對象描述22。
此外,更可取地是,該供應(yīng)者服務(wù)器還自動地、實時向該實時搜索引擎10通知數(shù)據(jù)對象24從該供應(yīng)者服務(wù)器12中被刪除了,其中該實時搜索引擎然后清除該數(shù)據(jù)對象描述22。
接收者客戶端接收者客戶端連接到該實時搜索引擎10,以查找包含有該接收者客戶端16希望從一個供應(yīng)者服務(wù)器下載的特定數(shù)據(jù)對象的最佳供應(yīng)者服務(wù)器。該接收者客戶端最好使用一個接收者瀏覽器18,用于和該實時搜索引擎10通訊以及用于從該搜索引擎中構(gòu)造搜索請求。這些瀏覽器的實例包含Nescape Communicator或者Microsoft Explorer或者其它的定制界面。
連接一般是提供了一種用于在連接的實體之間傳輸信息的方法的軟件協(xié)議;一個這樣的協(xié)議實例是TCP,它是用于本發(fā)明的最佳連接協(xié)議。然而,其它滿足和TCP具有同樣的基本功能的協(xié)議(諸如具有重發(fā)、以及一個斷開超時的UDP)也將是足夠的。這些協(xié)議在本技術(shù)領(lǐng)域內(nèi)是眾所周知的。
在另一個實施例中,數(shù)據(jù)對象24是一個文本文件,搜索請求包含下列中的任何一個一個部分文件名、關(guān)鍵字、作者、文件大小、類別、以及該文本的描述。
在一個其中數(shù)據(jù)對象24是一個音頻數(shù)據(jù)文件的實施例中,搜索請求包含下列中的任何一個一個部分文件名、一個比特率(bps)、一個數(shù)據(jù)的采樣率(Hz)、該文件的大小、持續(xù)時間、作者或者藝術(shù)家的姓名、歌曲名稱、流派、以及專集名稱。
在另一個其中數(shù)據(jù)對象24是一個圖像或者視頻文件的實施例中,搜索請求包含下列中的任何一個一個部分文件名、壓縮數(shù)量和類型、文件大小、類別、以及該圖像或者視頻的描述。
當(dāng)一個搜索響應(yīng)返回到該接收者時,接收者瀏覽器18顯示該搜索請求的結(jié)果用于由該接收者檢查。
在一個最佳實施例中,接收者客戶端16確定在該搜索響應(yīng)中返回的每一個供應(yīng)者服務(wù)器的一個響應(yīng)時間。通過該接收者客戶端16發(fā)送一個ICMP回送包到每個供應(yīng)者服務(wù)器,并且測量從該供應(yīng)者服務(wù)器接收一個響應(yīng)需要花費的時間數(shù)量,來測量該響應(yīng)時間。該接收者客戶端瀏覽器18使用該響應(yīng)時間來分類數(shù)據(jù)對象描述22,然后按照它們響應(yīng)時間的次序顯示該供應(yīng)者服務(wù)器的數(shù)據(jù)對象描述。
在一個實施例中,接收者可以選擇一個用于該搜索引擎10的搜索參數(shù),以提供一個僅僅包含在具有一個最小數(shù)據(jù)傳送帶寬容量的供應(yīng)者服務(wù)器上的數(shù)據(jù)對象描述的搜索響應(yīng)38。
在另一個實施例中,接收者引導(dǎo)該搜索引擎返回一個僅僅包含用于當(dāng)前不是太忙而不能接受額外的下載請求的供應(yīng)者服務(wù)器的數(shù)據(jù)對象描述的搜索響應(yīng)38。
在一個實施例中,該供應(yīng)者服務(wù)器不是位于一個防火墻后面。該接收者客戶端16通過直接連接到該供應(yīng)者服務(wù)器、請求一個數(shù)據(jù)對象、然后把該數(shù)據(jù)對象存儲在接收者的數(shù)據(jù)對象集合中,從該供應(yīng)者服務(wù)器下載一個數(shù)據(jù)對象24。
在一個實施例中,使用一個計分機制,從至少兩個能提供一個期望的數(shù)據(jù)對象的供應(yīng)者服務(wù)器中自動地選擇出一個最佳供應(yīng)者服務(wù)器。該計分機制包含從該接收者客戶端到供應(yīng)者服務(wù)器的往返響應(yīng)時間、供應(yīng)者服務(wù)器的國際互聯(lián)網(wǎng)連接線速度(數(shù)據(jù)傳送速度)、文件大小、以及該供應(yīng)者服務(wù)器的可靠性。最好的計分通常來自于一個具有一個高的線速度和高的供應(yīng)者服務(wù)器可靠性的供應(yīng)者服務(wù)器。具有最好計分的供應(yīng)者服務(wù)器最好由該接收者客戶端選擇用于下載。
在另一個實施例中,為了確定該最好計分,接收者客戶端或者服務(wù)器把用于每個數(shù)據(jù)對象傳輸?shù)膶嶋H傳輸率上載到該實時搜索引擎,其中該實際傳輸率被用來計算該供應(yīng)者服務(wù)器的有效線速度。
供應(yīng)者服務(wù)器每個供應(yīng)者服務(wù)器都包含可能從該供應(yīng)者服務(wù)器下載的數(shù)據(jù)對象24的一個數(shù)據(jù)對象集合。當(dāng)該供應(yīng)者服務(wù)器準備提供數(shù)據(jù)對象到任何請求接收者客戶端16時,該供應(yīng)者服務(wù)器連接到該實時搜索引擎,并且上載在該數(shù)據(jù)對象集合中的每個數(shù)據(jù)對象的描述。該實時搜索引擎立即進行更新。數(shù)據(jù)對象描述22包含任何下列內(nèi)容該數(shù)據(jù)對象的標題、該數(shù)據(jù)對象的大小、數(shù)據(jù)對象的類型、任何與該數(shù)據(jù)對象相關(guān)的文本、該數(shù)據(jù)對象的創(chuàng)建者、該數(shù)據(jù)對象的質(zhì)量等級、以及該數(shù)據(jù)對象所駐留的供應(yīng)者服務(wù)器。
在該最佳實施例中,在供應(yīng)者服務(wù)器和實時搜索引擎10之間的連接使用TCP協(xié)議實現(xiàn)。在供應(yīng)者服務(wù)器12和實時搜索引擎之間發(fā)送不定期的消息來聲明在兩者之間的連接是有效的。如果沒有從該供應(yīng)者服務(wù)器收到消息持續(xù)幾分鐘時間的話,則該連接被關(guān)閉了,而且到該供應(yīng)者服務(wù)器的連接被中斷了。
在一個實施例中,該供應(yīng)者服務(wù)器在連接到該實時搜索引擎之后,通過傳送一個登錄名和密碼,立即使用一個登錄過程來向該實時搜索引擎驗證它本身。
在另一個實施例中,如果該供應(yīng)者服務(wù)器12由一個防火墻保護的話,則做出一個決定,并且在初始登錄期間把這個決定傳輸?shù)皆搶崟r搜索引擎10。
在又一個實施例中,當(dāng)該供應(yīng)者服務(wù)器掃描在該數(shù)據(jù)對象集合中的數(shù)據(jù)對象時,通過檢查在文件名上的擴展名來確定每個數(shù)據(jù)對象的類型(.mp3、.jpg、.mpg、.doc是其中的一些實例)。沒有擴展名的文件被忽略了。確認每個文件以便正確地格式化包含在其中的數(shù)據(jù)。驗證失敗的數(shù)據(jù)對象不把它們的描述上載到該實時搜索引擎上。
當(dāng)數(shù)據(jù)對象被增加到該供應(yīng)者服務(wù)器上時,該供應(yīng)者服務(wù)器傳送該新的數(shù)據(jù)對象描述到該實時搜索引擎。同樣地,當(dāng)刪除一個數(shù)據(jù)對象24時,該供應(yīng)者服務(wù)器12通知該實時搜索引擎進行刪除。
在一個實施例中,在登錄過程期間,該供應(yīng)者服務(wù)器僅僅傳送自上次連接到該實時搜索引擎以來在它的數(shù)據(jù)對象集合中進行的變化。該實時搜索引擎10和供應(yīng)者服務(wù)器都存儲一份已經(jīng)上載到該實時搜索引擎的數(shù)據(jù)對象描述,而且全部都成功地證實了對那些描述的改變。以這種方法,為大的數(shù)據(jù)對象集合最小化了從該供應(yīng)者服務(wù)器到該實時搜索引擎?zhèn)魉偷某跏夹畔ⅰ?br> 在該最佳實施例中,該數(shù)據(jù)對象集合是在該供應(yīng)者服務(wù)器上的至少一個目錄。做為選擇,數(shù)據(jù)對象集合包含其它的目錄,這些目錄它們自己包含其它的數(shù)據(jù)對象或更多的目錄。
在另一個實施例中,該數(shù)據(jù)對象集合被存儲在一個遠離該供應(yīng)者服務(wù)器12的計算機上,但是可以由該供應(yīng)者服務(wù)器訪問。一個數(shù)據(jù)對象集合是在一個數(shù)據(jù)庫中的可選數(shù)據(jù)對象,在一個目錄中的文件,在存儲器中、在CD-ROM上、在閃速存儲器上的數(shù)據(jù)對象等。
在一個實施例中,該供應(yīng)者服務(wù)器還包含一個服務(wù)器描述,其包含它自己到國際互聯(lián)網(wǎng)的數(shù)據(jù)傳輸線帶寬,而且在到該實時搜索引擎的初始連接期間上載這個服務(wù)器描述。
在一個最佳實施例,供應(yīng)者服務(wù)器和接收者客戶端16都位于同一個可執(zhí)行映像內(nèi)部。因此,每當(dāng)一個接收者運行一個接收者瀏覽器時,他還同時運行一個供應(yīng)者服務(wù)器。
在一個實施例中,由該接收者客戶端從其它供應(yīng)者服務(wù)器下載的數(shù)據(jù)對象馬上被添加到數(shù)據(jù)對象集合中,以讓這些數(shù)據(jù)對象立即可以由在該國際互聯(lián)網(wǎng)絡(luò)上的其他接收者客戶端得到。在這個實施例中,大大地促進了數(shù)據(jù)對象貫穿供應(yīng)者服務(wù)器和接收者客戶端網(wǎng)絡(luò)的快速散播。
在一個最佳實施例中,通過執(zhí)行該數(shù)據(jù)對象的一個校驗和來構(gòu)造一個數(shù)據(jù)對象的指紋。每一個數(shù)據(jù)對象都由該數(shù)據(jù)對象數(shù)據(jù)的指紋唯一地標識。
在一個最佳實施例中,如果該供應(yīng)者服務(wù)器12不在一個隔火墻后面,則接收者客戶端直接連接到該供應(yīng)者服務(wù)器,并且要求一個選擇的數(shù)據(jù)對象從該供應(yīng)者服務(wù)器傳送并且下載到該接收者客戶端16。如果該供應(yīng)者服務(wù)器在一個隔火墻后面,則該接收者客戶端16要求該實時搜索引擎10傳遞該下載請求到供應(yīng)者服務(wù)器。當(dāng)該供應(yīng)者服務(wù)器接收這個下載請求時,它然后連接到該接收者客戶端16,而且然后發(fā)生該下載。如果該供應(yīng)者服務(wù)器12和接收者客戶端都由隔火墻保護,則一個代理服務(wù)器被用來有助于該傳輸。該接收者客戶端向?qū)崟r搜索引擎通知該下載請求,實時搜索引擎?zhèn)魉驮撜埱蟮焦?yīng)者服務(wù)器,接收者客戶端和供應(yīng)者服務(wù)器都連接到代理服務(wù)器,該代理服務(wù)器然后允許數(shù)據(jù)流動,并且因此在該接收者客戶端和供應(yīng)者服務(wù)器之間通過代理服務(wù)器發(fā)生下載。
實時搜索引擎如圖2所示,在一個最佳實施例中,該實時搜索引擎具有下列組件至少一個搜索引擎網(wǎng)關(guān)、至少一個搜索引擎、至少一個搜索引擎索引構(gòu)造器、以及一個搜索引擎索引。
搜索引擎網(wǎng)關(guān)在該最佳實施例中,連接到該實時搜索引擎的每一個供應(yīng)者服務(wù)器連接到該搜索引擎網(wǎng)關(guān)44組件。當(dāng)一個供應(yīng)者服務(wù)器上載有關(guān)它包含的數(shù)據(jù)對象的信息時,該搜索引擎網(wǎng)關(guān)44獲取這個信息,并且把它傳遞到搜索引擎索引構(gòu)造器42,該構(gòu)造器使用它來更新該搜索引擎索引。當(dāng)一個供應(yīng)者服務(wù)器斷開該實時搜索引擎、或者由一個網(wǎng)絡(luò)錯誤斷開該實時搜索引擎、或者相反不能和該實時搜索引擎進行通訊時,該搜索引擎網(wǎng)關(guān)檢測到這個,并且通知該搜索引擎索引構(gòu)造器42,該構(gòu)造器42反過來從該搜索引擎索引中刪除由那個供應(yīng)者服務(wù)器12上載的數(shù)據(jù)對象描述。
做為選擇,當(dāng)一個特定供應(yīng)者服務(wù)器被斷開時,該搜索引擎索引構(gòu)造器42實際上不刪除該數(shù)據(jù)對象,但是相反標記該數(shù)據(jù)對象描述為“不可用的”。當(dāng)那個供應(yīng)者服務(wù)器重新連接時,并不是傳送數(shù)據(jù)對象描述的整個列表,它僅僅傳送在該斷開階段期間也許已經(jīng)發(fā)生的、對它的數(shù)據(jù)對象集合的改變。在搜索期間,該搜索引擎40忽略全部被標記為“不可用的”數(shù)據(jù)對象描述。
在一個實施例中,每一個接收者客戶端16還連接到一個搜索引擎網(wǎng)關(guān)。在這個實施例中,每一個搜索引擎網(wǎng)關(guān)44反過來連接到一個搜索引擎40。所有來自于接收者客戶端的搜索請求被傳輸?shù)皆撍阉饕婢W(wǎng)關(guān),而且該搜索引擎網(wǎng)關(guān)然后傳輸該搜索請求到連接的搜索引擎。該搜索引擎執(zhí)行該搜索請求,并且傳輸該搜索響應(yīng)38返回到搜索引擎網(wǎng)關(guān),該網(wǎng)關(guān)反過來傳輸該搜索響應(yīng)到原有的接收者客戶端。
在另一實施例中,該搜索引擎網(wǎng)關(guān)跟蹤起源于接收者客戶端的數(shù)據(jù)對象下載。該接收者客戶端傳送一個請求以從一個供應(yīng)者服務(wù)器下載一個特定的數(shù)據(jù)對象。如果該下載是成功的話,該接收者客戶端16通知該搜索引擎網(wǎng)關(guān)44該下載完成了。使用這個信息,該搜索引擎網(wǎng)關(guān)記錄該供應(yīng)者服務(wù)器的可靠性,以及從一個特定供應(yīng)者服務(wù)器下載數(shù)據(jù)對象的接收者客戶端的當(dāng)前數(shù)量。
搜索引擎搜索引擎從接收者客戶端接收搜索請求36,執(zhí)行該搜索請求,并且構(gòu)造搜索響應(yīng)。該搜索響應(yīng)被傳送回該接收者客戶端。
在另一個實施例中,該搜索引擎還從搜索引擎網(wǎng)關(guān)接收搜索請求,這就是說簡單地轉(zhuǎn)發(fā)來自于接收者客戶端的搜索請求。
在該最佳實施例中,一個搜索請求包含一部分數(shù)據(jù)對象名稱、一個可選的最小數(shù)據(jù)對象質(zhì)量評定、一個可選的最小供應(yīng)者服務(wù)器連接帶寬、以及一個可選的、要被檢索的數(shù)據(jù)對象描述的最大數(shù)量。
每一個搜索響應(yīng)包含一個數(shù)據(jù)對象描述列表以及一個服務(wù)器描述列表。在該最佳實施例中,在該檢索響應(yīng)中返回在該數(shù)據(jù)對象描述和服務(wù)器描述中的字段的一個子集,包含一個供應(yīng)者服務(wù)器名稱和網(wǎng)絡(luò)協(xié)議(IP)地址、一個供應(yīng)者服務(wù)器帶寬描述(56k調(diào)制解調(diào)器、DSL、T1、等)、一個數(shù)據(jù)對象名稱(在該音頻實施例中的,歌曲授予稱號和藝術(shù)家名稱)、一個數(shù)據(jù)對象指紋、一個數(shù)據(jù)對象大小(以字節(jié)為單位)、以及一個數(shù)據(jù)對象質(zhì)量評定。
為了執(zhí)行該搜索,該搜索引擎使用在該搜索請求中的字段來掃描保存在該搜索引擎索引中的記錄。如果一個特定數(shù)據(jù)對象描述被標記為“不可用”的話,則它由該搜索引擎忽略。
在一個實施例中,該搜索引擎網(wǎng)關(guān)和搜索引擎存在于同一個過程中。在另一個實施例中,該搜索引擎網(wǎng)關(guān)和搜索引擎存在于不同的過程之中,但是在同一個機器上運行。機器、搜索引擎網(wǎng)關(guān)、和搜索引擎的許多配置是可能的。
搜索引擎索引在一個最佳實施例中,該搜索引擎索引具有兩個內(nèi)部表。這些表格包含一個數(shù)據(jù)對象描述表格和一個供應(yīng)者服務(wù)器描述表格。這些表格由該搜索引擎索引構(gòu)造器管理。
該供應(yīng)者服務(wù)器描述表格包含供應(yīng)者服務(wù)器描述34的一個集合。這些字段中的某些由該供應(yīng)者服務(wù)器在初始連接到該搜索引擎網(wǎng)關(guān)期間上載。其它的在事件發(fā)生時被計算出來。在該最佳實施例中,在這個表格中的條目包含下列字段-服務(wù)器名稱& IP地址-密碼-連接帶寬(T1、56k調(diào)制解調(diào)器、DSL、等)-必須把數(shù)據(jù)對象推到接收者客戶端?-用于這個服務(wù)器的數(shù)據(jù)對象描述列表
-由供應(yīng)者服務(wù)器允許的剩余可用連接-站點可靠性(成功傳輸%)該數(shù)據(jù)對象描述表格包含數(shù)據(jù)對象描述22的一個集合。這些由供應(yīng)者服務(wù)器12上載。當(dāng)添加數(shù)據(jù)對象時,上載新的數(shù)據(jù)對象描述。當(dāng)刪除數(shù)據(jù)對象時,刪除現(xiàn)有的數(shù)據(jù)對象描述或者可選地對它們進行標記用于刪除。在一個最佳實施例中,在這個表格中的條目包含下列字段-文件名-元數(shù)據(jù)(在音頻實施例中,為歌曲名稱、藝術(shù)家名稱、歌曲描述)-該數(shù)據(jù)對象指紋-大小(以字節(jié)為單位)-質(zhì)量評定(在音頻實施例中,編碼比特率和取樣頻率)-一個到該供應(yīng)者服務(wù)器描述記錄的連接執(zhí)行過程該系統(tǒng)服務(wù)于五個不同的執(zhí)行過程數(shù)據(jù)對象添加、數(shù)據(jù)對象刪除、搜索請求、供應(yīng)者服務(wù)器連接、供應(yīng)者服務(wù)器斷開。
數(shù)據(jù)對象添加在一個如圖3所示的實施例中,當(dāng)一個新的數(shù)據(jù)對象在一個供應(yīng)者服務(wù)器上被創(chuàng)建時、當(dāng)一個新的數(shù)據(jù)對象從國際互連網(wǎng)下載時、或者在登錄過程期間初始掃描該數(shù)據(jù)對象集合時,發(fā)生下列過程a)計算該數(shù)據(jù)對象指紋,b)給予一個數(shù)據(jù)對象一個名稱、一個來源名稱、大小、和一個質(zhì)量評定,以形成一個數(shù)據(jù)對象描述,c)該數(shù)據(jù)對象描述被上載到搜索引擎網(wǎng)關(guān),而且被傳遞到該搜索引擎索引構(gòu)造器,d)該搜索引擎索引構(gòu)造器在該搜索引擎索引中創(chuàng)建一個新的數(shù)據(jù)對象描述入口,以及e)該搜索引擎索引構(gòu)造器更新用于這個服務(wù)器的供應(yīng)者服務(wù)器描述入口以反映新的數(shù)據(jù)對象描述入口。
數(shù)據(jù)對象刪除在一個實施例中,當(dāng)一個存在的數(shù)據(jù)對象被刪除了時,發(fā)生下列過程a)檢索該數(shù)據(jù)對象指紋,b)該數(shù)據(jù)對象指紋被被傳送到搜索引擎網(wǎng)關(guān),而且被傳遞到該搜索引擎索引構(gòu)造器,c)該搜索引擎索引構(gòu)造器刪除用于那個供應(yīng)者服務(wù)器的數(shù)據(jù)對象描述入口,以及d)該搜索引擎索引構(gòu)造器更新用于那個供應(yīng)者服務(wù)器的供應(yīng)者服務(wù)器描述入口以反映數(shù)據(jù)對象描述的刪除。
搜索請求在如圖4所示的一個實施例中,當(dāng)一個搜索請求由一個接收者客戶端16構(gòu)造時,發(fā)生下列過程a)該搜索請求被上載到該搜索引擎,b)該搜索引擎為所有在該數(shù)據(jù)對象名稱上匹配的對象搜索該數(shù)據(jù)對象描述表格中的名稱欄,c)該搜索引擎使用該供應(yīng)者服務(wù)器帶寬限制和該最小的質(zhì)量評定限制來精減所產(chǎn)生的數(shù)據(jù)對象描述列表,d)如果在任何時候返回的數(shù)據(jù)對象描述數(shù)目超過數(shù)據(jù)對象描述最大數(shù)目限制,則該搜索終止并且不再檢索更多的數(shù)據(jù)對象描述,以及e)產(chǎn)生的數(shù)據(jù)對象描述和相關(guān)的服務(wù)器描述列表被發(fā)送到該接收者客戶端。
供應(yīng)者服務(wù)器連接在一個實施例中,當(dāng)一個供應(yīng)者服務(wù)器第一次連接該實時搜索引擎時,發(fā)生下列過程a)為該供應(yīng)者服務(wù)器創(chuàng)建一個供應(yīng)者服務(wù)器描述記錄,b)用于在該供應(yīng)者服務(wù)器數(shù)據(jù)對象集合中的所有數(shù)據(jù)對象的數(shù)據(jù)對象描述被上載到搜索引擎網(wǎng)關(guān),并且被傳遞到該搜索引擎索引構(gòu)造器,以及c)該搜索引擎索引構(gòu)造器如同一個數(shù)據(jù)對象添加過程那樣,處理每一個上載的數(shù)據(jù)對象描述。
供應(yīng)者服務(wù)器斷開在一個實施例中,當(dāng)一個供應(yīng)者服務(wù)器從該實時搜索引擎斷開時,發(fā)生下列過程
a)該搜索引擎索引構(gòu)造器如同在該數(shù)據(jù)對象刪除過程中那樣,刪除所有涉及這個供應(yīng)者服務(wù)器的數(shù)據(jù)對象描述,以及b)該搜索引擎索引構(gòu)造器刪除該供應(yīng)者服務(wù)器描述記錄,或者把該記錄可選地標記為用于刪除。
替換實施例在一個實施例中,數(shù)據(jù)對象是音頻文件,而且數(shù)據(jù)對象描述包含從該音頻文件本身獲得的文件名、比特率、取樣頻率、以及大小。在這個實施例中,更可取地是該接收者客戶端16還包含一個音頻播放器,用于播放該音頻文件。此外,該供應(yīng)者服務(wù)器包含一個機制用于從一個CD或者其它音頻介質(zhì)來源構(gòu)造一個音頻文件,并且把新創(chuàng)建的聲音文件存放到該數(shù)據(jù)對象集合中。
在另一個實施例中,該數(shù)據(jù)對象是圖像和視頻文件,而且數(shù)據(jù)對象描述包含文件名、壓縮詳情及其它從該.jpg文件本身獲得的信息,以及該圖像的一個簡要描述。在這個實施例中,更可取地是該接收者客戶端16應(yīng)用也包括一個用于顯示該圖像或者視頻文件的裝置,而且該供應(yīng)者服務(wù)器包括一個用于從一張照片或者其它可視圖像來源產(chǎn)生一個圖像或者視頻文件的裝置。
在又一個實施例中,該數(shù)據(jù)對象可以是文本、音頻、圖像、和視頻數(shù)據(jù)對象。示例格式包含HTML文本、MP3音頻、JPEG靜止圖像、和MPEG視頻數(shù)據(jù)。每一個不同類型的數(shù)據(jù)對象然后也通過類型、以及名稱、和先前提及的另一個屬性進行區(qū)分。
當(dāng)新的圖像源、和圖像壓縮及存儲機制變得可用時,用于這些協(xié)議和存儲格式的數(shù)據(jù)對象產(chǎn)生方法能夠被添加到該接收者客戶端和供應(yīng)者服務(wù)器而不背離這個發(fā)明的精神。
權(quán)利要求
1.一種用于創(chuàng)建一個在國際互聯(lián)網(wǎng)上的實時搜索引擎的方法,該實時搜索引擎響應(yīng)于一個接收者客戶端的搜索請求,提供一個包含了數(shù)據(jù)對象的數(shù)據(jù)對象描述和服務(wù)器描述的搜索響應(yīng),其中該數(shù)據(jù)對象是當(dāng)前可用于從一個供應(yīng)者服務(wù)器直接傳送到一個接收者客戶端的,該方法包含a.該供應(yīng)者服務(wù)器通過國際互連網(wǎng)連接到一個實時搜索引擎,該供應(yīng)者服務(wù)器向該搜索引擎提供駐留在該供應(yīng)者服務(wù)器上的數(shù)據(jù)對象數(shù)據(jù)對象描述,以及b.該實時搜索引擎索引與該供應(yīng)者服務(wù)器的數(shù)據(jù)對象相關(guān)的數(shù)據(jù)對象描述,c.其中當(dāng)該供應(yīng)者服務(wù)器從該實時搜索引擎斷開時,則從該實時搜索引擎中清除由該供應(yīng)者服務(wù)器提供的數(shù)據(jù)對象描述。
2.如權(quán)利要求1所述的方法,進一步包含該供應(yīng)者服務(wù)器自動地、實時向該實時搜索引擎提供被添加給該供應(yīng)者服務(wù)器的數(shù)據(jù)對象的數(shù)據(jù)對象描述。
3.如權(quán)利要求1所述的方法,進一步包含該供應(yīng)者服務(wù)器自動地、實時通知該實時搜索引擎從該供應(yīng)者服務(wù)器刪除的數(shù)據(jù)對象,其中該實時搜索引擎然后刪除該數(shù)據(jù)對象描述。
4.如權(quán)利要求1所述的方法,其中該數(shù)據(jù)對象描述包含任何下列內(nèi)容該數(shù)據(jù)對象的標題、該數(shù)據(jù)對象的大小、數(shù)據(jù)對象的類型、任何與該數(shù)據(jù)對象相關(guān)的文本、該數(shù)據(jù)對象的創(chuàng)建者、該數(shù)據(jù)對象的質(zhì)量評定、以及該數(shù)據(jù)對象所駐留的供應(yīng)者服務(wù)器。
5.如權(quán)利要求1所述的方法,其中服務(wù)器描述包含任何下列內(nèi)容該服務(wù)器IP地址、由該服務(wù)器允許的同時連接數(shù)目、該服務(wù)器的可靠性、以及該服務(wù)器的名稱。
6.如權(quán)利要求1所述的方法,進一步包含一條客戶搜索命令,其中一個接收者客戶端搜索該數(shù)據(jù)對象描述,以查找該最佳數(shù)據(jù)對象,并且選擇該數(shù)據(jù)對象駐留在其上的最優(yōu)供應(yīng)者服務(wù)器。
7.如權(quán)利要求1所述的方法,其中該接收者客戶端搜索請求進一步包含一個供應(yīng)者服務(wù)器限制標準,其中該搜索引擎刪除不滿足該服務(wù)器限制標準的所有供應(yīng)者服務(wù)器的搜索響應(yīng)。
8.如權(quán)利要求7所述的方法,其中該供應(yīng)者服務(wù)器限制標準包含一個帶寬限制,其中該搜索引擎刪除具有一個低于該帶寬限制的帶寬容量的供應(yīng)者服務(wù)器的搜索響應(yīng)。
9.如權(quán)利要求1所述的方法,其中該實時搜索引擎清除不能接受新的接收者客戶端下載請求的供應(yīng)者服務(wù)器的搜索響應(yīng)。
10.如權(quán)利要求1所述的方法,進一步包含一個自動分類搜索響應(yīng)的客戶端瀏覽器。
11.如權(quán)利要求10所述的方法,其中由響應(yīng)度值來分類自動的搜索響應(yīng),其中通過測量一個回聲應(yīng)答消息由該供應(yīng)者服務(wù)器返回到該接收者客戶端所花費的時間數(shù)量來確定該響應(yīng)度值。
12.如權(quán)利要求11所述的方法,其特征在于如果該供應(yīng)者服務(wù)器沒有在一個規(guī)定的時間期限內(nèi)答復(fù)該接收者客戶端的回聲請求,則從該搜索響應(yīng)中刪除該供應(yīng)者服務(wù)器。
13.如權(quán)利要求1所述的方法,其中該數(shù)據(jù)對象是從包含一個音頻數(shù)據(jù)對象、一個文本數(shù)據(jù)對象、一個圖像數(shù)據(jù)對象、一個視頻數(shù)據(jù)對象以及一個軟件可執(zhí)行程序數(shù)據(jù)對象的組中選擇出來的類型。
14.如權(quán)利要求1所述的方法,進一步包含該接收者在該搜索響應(yīng)中選擇一個供應(yīng)者服務(wù)器,然后該接收者客戶端從選擇的供應(yīng)者服務(wù)器中下載該數(shù)據(jù)對象。
15.如權(quán)利要求1所述的方法,其中該接收者客戶端同時作為一個用于其他接收者客戶端的供應(yīng)者服務(wù)器進行操作,其中已經(jīng)由該接收者客戶端下載的數(shù)據(jù)對象即刻變?yōu)榭梢杂稍谠搰H互聯(lián)網(wǎng)上的其他接收者客戶端得到。
16.如權(quán)利要求1所述的方法,其中使用一個計分機制,從至少兩個能提供一個期望的數(shù)據(jù)對象的供應(yīng)者服務(wù)器中自動地選擇出一個供應(yīng)者服務(wù)器。
17.如權(quán)利要求16所述的方法,其中該計分機制包含從該接收者客戶端到供應(yīng)者服務(wù)器的往返響應(yīng)時間、供應(yīng)者服務(wù)器的國際互聯(lián)網(wǎng)連接線速度(數(shù)據(jù)傳輸速度)、文件大小、以及該供應(yīng)者服務(wù)器的可靠性的評定。
18.如權(quán)利要求17所述的方法,其中最優(yōu)計分來自于一個具有一個高的線速度和高的供應(yīng)者服務(wù)器可靠性的供應(yīng)者服務(wù)器。
全文摘要
公開了一種用于創(chuàng)建一個在國際互聯(lián)網(wǎng)上的實時搜索引擎的方法,該實時搜索引擎響應(yīng)于一個接收者客戶端的搜索請求,提供一個包含了數(shù)據(jù)對象的數(shù)據(jù)對象描述和服務(wù)器描述的搜索響應(yīng),其中該數(shù)據(jù)對象是當(dāng)前可用于從一個供應(yīng)者服務(wù)器直接傳輸?shù)揭粋€接收者客戶端的。該方法包含通過國際互連網(wǎng)連接到一個實時搜索引擎的供應(yīng)者服務(wù)器,該供應(yīng)者服務(wù)器向該實時搜索引擎提供駐留在該供應(yīng)者服務(wù)器上的數(shù)據(jù)對象的數(shù)據(jù)對象描述,而且該實時搜索引擎索引與該供應(yīng)者服務(wù)器的數(shù)據(jù)對象相關(guān)的數(shù)據(jù)對象描述,其中當(dāng)該供應(yīng)者服務(wù)器從該實時搜索引擎斷開時,從該實時搜索引擎中刪除由該供應(yīng)者服務(wù)器提供的數(shù)據(jù)對象描述。
文檔編號H04L29/08GK1518708SQ00818994
公開日2004年8月4日 申請日期2000年12月14日 優(yōu)先權(quán)日1999年12月15日
發(fā)明者S·范寧, S 范寧, J·范寧, 估斬, E·克斯勒爾 申請人:納普斯特公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1