專利名稱:收集高速緩存web內(nèi)容的多樣化web服務(wù)器活動數(shù)據(jù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及客戶-服務(wù)器計算機系統(tǒng),更具體地,本發(fā)明涉及對全球通信網(wǎng)上Web站點服務(wù)器的信息訪問請求。
所有Web頁面均用超文本標記語言(HTML)編寫。超文本和通用性是HTML的2個必要特征。超文本意味著程序員可以在Web頁面上創(chuàng)建將訪問者引導到任何其他Web頁面或互聯(lián)網(wǎng)上任何地方的鏈接。超文本允許從許多不同方向訪問Web上的信息。通用性意味著由于HTML文檔被保存成ASCII或純文本文件,實際任何計算機均可以讀取Web頁面。HTML允許Web設(shè)計人員為文本加上格式,增加圖形、聲音和視頻,并且將其全部保存在任何計算機均可以讀取的文本或美國信息交換標準碼(ASCII)文件中。HTML的關(guān)鍵在于標簽,標簽是括在小于號(<)和大于號(>)之間、指示后面的內(nèi)容的類型的關(guān)鍵字。雖然任何計算機實際上均可以顯示W(wǎng)eb頁面,然而這些頁面的實際外觀如何取決于計算機的類型,監(jiān)視器,互聯(lián)網(wǎng)連接速度和被用來觀看頁面的瀏覽器軟件。
高級Web設(shè)計人員經(jīng)常使用被稱作JavaScript的腳本語言和由Web頁面中被稱作文檔對象模型(DOM)的命名部分構(gòu)成的系統(tǒng),以及HTML來創(chuàng)建頁面上的動態(tài)內(nèi)容。這種效果有時被稱作動態(tài)HTML或DHTML。HTML標簽是在角括號(<>)之間編寫的、指示瀏覽器如何顯示文本的命令。HTML標簽的例子是BASE、FORM、FRAME、IMG和SCRIPT。許多標簽有開放和封閉版本,并且受影響的文本被包含在2個標簽內(nèi)。開放和封閉標簽使用相同的命令字;封閉標簽傳遞以正斜杠(/)為首的符號。許多標簽具有為包含的文本提供各種選項的特殊屬性。屬性被輸入在命令字和最后的角括號之間。通過按照任何順序、以彼此之間以空格分隔的方式逐個編寫,可以在單個標簽中使用一系列屬性。屬性常常具有數(shù)值。在某些情況下,從較小的選項組中選擇數(shù)值。其它屬性對其能夠接受的數(shù)值的類型的要求更加嚴格。屬性的例子是HREF、SRC、ACCESSKEY和VALUE。
Web頁面只是用HTML標簽編寫的文本文檔。與任何其他文本文檔類似,Web頁面具有文件名,文件名向Web站點設(shè)計人員、Web站點訪問者和訪問者的Web瀏覽器標識文檔。統(tǒng)一資源定位符(URL)包含有關(guān)文件所處的位置,和瀏覽器應(yīng)當對文件進行哪些處理的信息?;ヂ?lián)網(wǎng)的各個文件具有唯一的URL。URL的第一部分被稱作模式。它告訴瀏覽器如何處理其將要打開的文件。一個最常見的Web頁面訪問模式是超文本傳送協(xié)議(HTTP)。URL的第二部分是文件位于的服務(wù)器的名稱后跟指向文件的路徑和文件名。有時URL以結(jié)尾正斜杠結(jié)束,其中沒有提供文件名。在這種情況下,URL指向路徑的最近目錄中的缺省文件(即index.html),缺省文件通常對應(yīng)于主頁。例如,考慮Web地址″census.rolandgarros.org/rc/images/...″。
域名是″census.rolandgarros.org″。這是對應(yīng)Web頁面所位于的具體主計算機。URL的下一段是含有具體Web站點的主計算機上的目錄(″rc″)和子目錄(″images″)。URL中由省略標記表示的最后一段是被請求的具體Web頁面的文件名。URL可以是絕對的,也可以是相對的。絕對URL給出到文件的整個路徑,包含模式、服務(wù)器名、完全路徑和文件名本身。相對URL描述期望文件相對于含有URL本身的文件位置的位置。對于和當前文件處于相同目錄的文件,其相對URL只是文件名和擴展名。
為了觀看單個頁面,客戶端計算機上運行的瀏覽器可以從Web站點服務(wù)器請求和下載許多文件。Web站點服務(wù)器的訪問日志中存儲的對象訪問請求(″點擊″)數(shù)量通常會超過其中客戶端正在訪問Web站點上信息的不同客戶端會話的數(shù)量,從而降低訪問日志的準確度。
數(shù)據(jù)網(wǎng)絡(luò)正在以驚人的速度增長。Web用戶的數(shù)量在今后幾年可望增加5倍。Web訪問需求不受控制的增長迫使人們?nèi)M足帶寬要求。另外,盡管互聯(lián)網(wǎng)上的Web傳輸量令人難以置信,然而大多數(shù)傳輸是冗余的,即任意指定站點上的多個用戶請求大量相同的內(nèi)容。這意味著相當比例的廣域網(wǎng)(WAN)基礎(chǔ)設(shè)施傳遞了相同的內(nèi)容和對其進行日常訪問的相同請求。Web高速緩存對Web內(nèi)容進行本地存儲以便更加快速地為這些冗余用戶請求提供服務(wù),并且不在廣域網(wǎng)上發(fā)送請求和相應(yīng)的內(nèi)容。
高速緩存是在接近請求者的位置保存經(jīng)常訪問的信息的技術(shù)。Web高速緩存在物理或邏輯上接近用戶的存儲設(shè)備上存儲Web頁面和內(nèi)容。這種對存儲的Web內(nèi)容的訪問比Web查找更加接近和快速。通過降低廣域網(wǎng)鏈路和已經(jīng)過載的Web服務(wù)器上的傳輸量,高速緩存對于互聯(lián)網(wǎng)服務(wù)提供商(ISP)、企業(yè)網(wǎng)絡(luò)和終端用戶而言有顯著的益處。Web高速緩存的2個重要益處是因WAN帶寬降低而節(jié)省成本,以及因更快速的訪問而提高終端用戶的效率。ISP可以將高速緩存引擎放在其網(wǎng)絡(luò)的控制關(guān)鍵點上,以提高響應(yīng)時間和降低其干線的帶寬要求。ISP可以將高速緩存引擎配置在關(guān)鍵WAN接入點上,以便從本地存儲而不是遠程或過載Web服務(wù)器伺服Web請求。在企業(yè)網(wǎng)絡(luò)中,Web高速緩存造成的帶寬使用的驚人降低允許通過低帶寬WAN鏈路為用戶群提供服務(wù)??蛇x地,有關(guān)機構(gòu)可以增加用戶或增加更多利用現(xiàn)有WAN鏈路上的空閑帶寬的服務(wù)。對于終端用戶,本地Web高速緩存的響應(yīng)比廣域網(wǎng)上相同內(nèi)容的下載時間幾乎快三倍。因此,用戶注意到響應(yīng)時間的驚人改進,而Web高速緩存的實現(xiàn)對其是完全透明的。
Web高速緩存提供的其它益處包含訪問控制、監(jiān)視和工作日志。高速緩存引擎為網(wǎng)絡(luò)管理員提供簡單、安全的方法以便通過統(tǒng)一資源定位符(URL)過濾實施全站點訪問策略。網(wǎng)絡(luò)管理員可以了解哪些URL接受點擊,高速緩存正在伺服的每秒點擊數(shù)量,從高速緩存伺服的URL的百分比,以及其它相關(guān)的工作統(tǒng)計。從終端用戶訪問互聯(lián)網(wǎng)上的Web頁面開始進行Web高速緩存。在頁面被發(fā)送到終端用戶的同時,高速緩存系統(tǒng)在本地存儲上保存頁面及其所有相關(guān)圖形?,F(xiàn)在頁面內(nèi)容被高速緩存。另一個用戶,或初始用戶以后可以訪問該Web頁面,但不是通過互聯(lián)網(wǎng)向Web服務(wù)器發(fā)送請求,而Web高速緩存系統(tǒng)從本地存儲傳送Web頁面。這種處理減少了用戶的下載時間,并且降低了對WAN鏈路的帶寬要求。可以通過若干種方式更新高速緩存數(shù)據(jù),所述方式取決于Web高速緩存系統(tǒng)的設(shè)計。
Web高速緩存可以是Web內(nèi)容發(fā)布者關(guān)心的主要問題。例如,如果某些訪問者訪問高速緩存服務(wù)器中已有的Web內(nèi)容,發(fā)布者可能收集不準確的點擊數(shù)量。此外,如果高速緩存服務(wù)器不迅速更新內(nèi)容,則會向用戶返回過期或陳舊的內(nèi)容。
發(fā)明內(nèi)容
高速緩存引擎在環(huán)球網(wǎng)中越來越普及。結(jié)果,原始Web服務(wù)器不用伺服或看不見大多數(shù)針對Web站點內(nèi)容的用戶請求。分組探測器不會看見請求,因為互聯(lián)網(wǎng)其它地方的高速緩存引擎已經(jīng)滿足了請求。使用單象素清晰GIF(single pixel clear GIF)(不可高速緩存)的技術(shù)幾年來已經(jīng)被用來保證某些記錄被原始服務(wù)器記錄以用于廣告。然而這個解決方案只記錄有關(guān)針對單象素GIF文件本身的請求的信息。
單象素透明GIF(圖形交換格式)是Web設(shè)計人員的工具箱中最靈活的工具。使用透明GIF是離散控制文本和圖形在Web頁面上的布局的方式。無論透明GIF被放到頁面的哪個位置上,它都會保持不可見,其中所有背景圖形和填充色均不被感知。之前已經(jīng)使用了單象素清晰GIF,但是數(shù)據(jù)尚未被多樣化(enriched),使得單象素清晰GIF可被用作日志記錄的全集的代理(surrogate)。
通過將附加信息追加到單象素清晰GIF上以作為公共網(wǎng)關(guān)接口(CGI)查詢字符串參數(shù),本發(fā)明使不可高速緩存的單象素清晰GIF的Web日志中記錄的信息多樣化。這允許針對單象素清晰GIF的請求所創(chuàng)建日志記錄充當在頁面內(nèi)容尚未高速緩存的情況下已經(jīng)創(chuàng)建的全集日志記錄的″代理″。
通過下列結(jié)合附圖進行的詳細描述可以更好地理解本發(fā)明,其中圖1圖解了全球通信網(wǎng)上Web高速緩存引擎的實現(xiàn)。
圖2圖解了不可高速緩存單象素GIF的示例性實現(xiàn),其中CGI查詢字符串參數(shù)被加到Web日志中記錄的多樣化信息中。
圖3根據(jù)本發(fā)明的優(yōu)選實施例圖解了處理客戶端Web頁面請求的處理邏輯,所述請求使用了單象素透明GIF。
圖4圖解了站點等級分析顯示,根據(jù)本發(fā)明的單象素透明GIF的實現(xiàn)可以產(chǎn)生該顯示。
圖5圖解了指引類別(referral categories)的示例性顯示,根據(jù)本發(fā)明的單象素透明GIF的實現(xiàn)可以產(chǎn)生該顯示。
圖6圖解了搜索引擎和目錄的指引類別的示例性顯示,根據(jù)本發(fā)明的單象素透明GIF的實現(xiàn)可以產(chǎn)生該顯示。
圖7圖解了具體搜索引擎的指引結(jié)果的示例性顯示,根據(jù)本發(fā)明的單象素透明GIF的實現(xiàn)可以產(chǎn)生該顯示。
圖8圖解了各種Web頁面的示例性內(nèi)容類別,根據(jù)本發(fā)明的單象素透明GIF的實現(xiàn)可以產(chǎn)生該內(nèi)容類別。
圖9圖解了主頁的示例性內(nèi)容類別,根據(jù)本發(fā)明的單象素透明GIF的實現(xiàn)可以產(chǎn)生該內(nèi)容類別。
圖10圖解了可用保存報告的示例性顯示,根據(jù)本發(fā)明的單象素透明GIF的實現(xiàn)可以產(chǎn)生該顯示。
圖11A-11M圖解了各種可用保存報告,根據(jù)本發(fā)明的單象素透明GIF的實現(xiàn)可以產(chǎn)生該報告。
具體實施例方式
Web服務(wù)器軟件通常收集和保存涉及各個HTTP請求的信息,包含日期與時間,發(fā)起方網(wǎng)際協(xié)議(IP)地址,被請求對象和請求的完成狀態(tài)。周期性地分析日志,以便根據(jù)各個周期內(nèi)的點擊,服務(wù)的頁面數(shù)量和對感興趣頁面的要求的等級確定通過服務(wù)器的業(yè)務(wù)量。
互聯(lián)網(wǎng)瀏覽器應(yīng)用程序允許單個用戶在其本地硬盤上高速緩存Web頁面。用戶可以配置一定量的磁盤空間以用于高速緩存。當用戶第一次觀看Web站點時,其內(nèi)容被保存成其計算機的硬盤的子目錄中的文件。當下一次用戶指向該Web站點時,瀏覽器從高速緩存得到內(nèi)容,其中并沒有訪問網(wǎng)絡(luò)。頁面中包含按鈕、圖標和圖象的某些單元的出現(xiàn)速度比其在第一次打開頁面時的出現(xiàn)速度快得多。為了限制互聯(lián)網(wǎng)使用的不受控制的增長所導致的帶寬要求,軟件開發(fā)人員開發(fā)出將本地高速緩存擴展到網(wǎng)絡(luò)層次的應(yīng)用程序。當前兩種網(wǎng)絡(luò)層次的高速緩存產(chǎn)品是代理服務(wù)器和網(wǎng)絡(luò)高速緩存。代理服務(wù)器是在通用硬件和操作系統(tǒng)上運行的軟件應(yīng)用。代理服務(wù)器被放到硬件上,該硬件在物理上介于Web瀏覽器客戶端應(yīng)用程序和Web服務(wù)器之間。代理服務(wù)器充當接收所有送往Web服務(wù)器的分組并檢查各個分組以確定其是否可以滿足請求本身的看門人。如果代理不能滿足請求本身,它向Web服務(wù)器轉(zhuǎn)發(fā)請求。代理服務(wù)器可用于過濾請求,例如防止雇員訪問特定Web站點。使用代理服務(wù)器的問題是它們對于高速緩存不是最優(yōu)的,并且在出現(xiàn)沉重網(wǎng)絡(luò)負載時會出現(xiàn)故障。降低傳輸速度以允許代理服務(wù)器檢查各個分組,并且代理軟件或硬件的故障使得所有用戶不能進行網(wǎng)絡(luò)訪問。此外,代理服務(wù)器需要配置各個最終用戶的瀏覽器,這對于ISP和大型企業(yè)而言是不可接受的。由于代理服務(wù)器的這些缺點,建立網(wǎng)絡(luò)高速緩存的應(yīng)用程序變得很普及。通過加強高速緩存軟件并且消除代理服務(wù)器實現(xiàn)中的其它降速特征,這些面向高速緩存的軟件應(yīng)用被用來提高性能。由于代理服務(wù)器在具有非常高的單進程上下文開銷的通用操作系統(tǒng)下運行,它們不能輕松承受大量的同時進程。
網(wǎng)絡(luò)產(chǎn)品提供商提供高速緩存引擎以作為使用高速緩存和檢索算法存儲并檢索內(nèi)容的單用途網(wǎng)絡(luò)設(shè)備。這樣的高速緩存引擎只專用于內(nèi)容管理和傳送。由于只有Web請求被路由到高速緩存引擎,其它用戶傳輸不受高速緩存處理的影響。對于非Web傳輸,路由器完全發(fā)揮其傳統(tǒng)作用。高速緩存控制協(xié)議定義了高速緩存引擎和路由器之間的通信。在這種協(xié)議下,路由器只將Web請求傳送到高速緩存引擎而不是所針對的服務(wù)器。對于高速緩存引擎,客戶端以通常的方式請求Web內(nèi)容。運行高速緩存控制協(xié)議的路由器截取傳輸控制協(xié)議(TCP)端口80的Web傳輸,并且將Web傳輸路由到高速緩存引擎??蛻舳瞬粎⑴c事務(wù)處理,并且不需要改變客戶端或瀏覽器。如果高速緩存引擎不具有所請求的內(nèi)容,高速緩存引擎以通常的方式將請求發(fā)送到互聯(lián)網(wǎng)或內(nèi)部網(wǎng)。內(nèi)容被返回到高速緩存引擎并且在其上存儲。高速緩存引擎向客戶端返回內(nèi)容。當存在對相同內(nèi)容的后續(xù)請求時,高速緩存引擎從本地存儲滿足請求。圖1圖解了諸如互聯(lián)網(wǎng)的全球通信網(wǎng)上Web高速緩存引擎的實現(xiàn)??蛻舳擞嬎銠C12、14、16可以通過路由器18請求Web內(nèi)容。路由器18截取TCP端口80的Web傳輸并且將其路由到本地高速緩存引擎20??蛻舳?2、14、16不參與這個事務(wù)處理,并且不需要改變客戶端計算機或瀏覽器。如果高速緩存引擎20不具有所請求的內(nèi)容,高速緩存引擎20通過路由器18將請求發(fā)送到互聯(lián)網(wǎng)以便訪問互聯(lián)網(wǎng)內(nèi)容服務(wù)器40、42、44。內(nèi)容被返回到高速緩存引擎20并且在其上存儲。高速緩存引擎20接著通過路由器18將所請求的內(nèi)容返回到客戶端計算機12、14、16。若干高速緩存引擎32、34、36可以按照分層方式被放在互聯(lián)網(wǎng)服務(wù)提供商(ISP)站點30的高速緩存集群(cache farm)中。通過路由器18和ISP服務(wù)器30傳送的來自客戶端12、14、16的請求被轉(zhuǎn)移到高速緩存集群32、34、36。以便從其存儲滿足客戶端請求。如果高速緩存引擎32、34、36不能從本地存儲滿足請求,通過互聯(lián)網(wǎng)50上的ISP服務(wù)器30向適當服務(wù)器40、42、44發(fā)出普通Web請求以獲得所請求的互聯(lián)網(wǎng)內(nèi)容。除路由器18之外,圖中的路由器26、46也被連接到ISP服務(wù)器30。路由器18、26、46通常被稱作接入服務(wù)提供點(POP)。POP是互聯(lián)網(wǎng)的接入點位置,并且具有唯一的互聯(lián)網(wǎng)IP地址。POP通常包含路由器、數(shù)字/模擬呼叫匯集器、服務(wù)器和經(jīng)常為幀中繼或異步傳輸模式(ATM)的交換機。圖中高速緩存引擎48被連接到路由器46。高速緩存引擎28和路由器24被連接到路由器26。路由器24被連接到公司內(nèi)部網(wǎng)22。
由于路由器將送往Web服務(wù)器的分組重定向到高速緩存引擎,高速緩存引擎以對客戶端透明的方式工作??蛻舳瞬恍枰獙⑵錇g覽器配置成代理服務(wù)器模式。另外,高速緩存引擎的操作對網(wǎng)絡(luò)是透明的。對于非Web傳輸,路由器完全按照其正常的功能進行操作。Web對象可以含有超文本傳送協(xié)議(HTTP)頭以指示高速緩存服務(wù)器中的瀏覽器如何高速緩存Web對象。對于諸如公司標志的靜態(tài)圖象,過期協(xié)議頭可以被設(shè)置成″沒有過期″,使得高速緩存服務(wù)器可以在高速緩存中始終保存圖象。為了收集例如廣告的指定頁面上的確切點擊數(shù)量,較小的圖象對象可以被加到頁面中并且對象被設(shè)置成立即過期,因此高速緩存服務(wù)器不會高速緩存該對象。于是,每當用戶請求該頁面時,瀏覽器或高速緩存服務(wù)器會從原始Web服務(wù)器檢索對象,并且Web服務(wù)器可以對請求的確切數(shù)量進行計數(shù)。
公共網(wǎng)關(guān)接口(CGI)是以獨立于平臺的方式在信息服務(wù)器下運行外部程序、軟件或網(wǎng)關(guān)的簡單接口(協(xié)議)。CGI只是在服務(wù)器和腳本之間發(fā)送信息的標準化方式。CGI腳本是以標準方式與服務(wù)器通信的程序。當前,所支持的信息服務(wù)器是HTTP服務(wù)器。各個CGI服務(wù)器實現(xiàn)必須定義從服務(wù)器向腳本傳遞有關(guān)請求的數(shù)據(jù)的機制。
Web頁面表格上的各個單元會具有與其相關(guān)的名稱和數(shù)值。名稱標識被發(fā)送的數(shù)據(jù)。數(shù)值是數(shù)據(jù),可以來自Web頁面設(shè)計人員或在字段中輸入該數(shù)值的訪問者。當訪問者點擊提交按鈕時,各個表格單元的名稱-數(shù)值對被發(fā)送到服務(wù)器。CGI腳本通常具有2個功能。第一個功能是得到所有名稱-數(shù)值對并且將其分離成各個可理解的片段。第二個功能是用該數(shù)據(jù)實際做某些事情,例如打印輸出,將字段連接在一起,發(fā)送電子郵件確認,或?qū)⑵浯鎯υ诜?wù)器上。表格具有3個重要部分表格標簽,包含將要處理表格的CGI腳本的URL;諸如字段和菜單的表格單元;和向服務(wù)器上的CGI腳本發(fā)送數(shù)據(jù)的提交按鈕。腳本是增加Web頁面的交互性的小程序。可以編寫簡單腳本以便向Web頁面增加提醒框或某些文本;也可以編寫更加復雜的腳本以便加載基于訪問者的瀏覽器的特定頁面或根據(jù)訪問者的鼠標點擊改變框架的背景顏色。多數(shù)腳本均是使用被稱作JavaScript的腳本語言編寫的,多數(shù)瀏覽器均支持JavaScript,其中包含Netscape的Communicator和微軟公司的Internet Explorer。
JavaScript是面向?qū)ο蟮恼Z言,這意味著JavaScript通過操作Web頁面上諸如窗口、圖象和文檔的對象來進行工作。JavaScript命令被直接放入建立Web頁面的HTML文件中。根據(jù)所運行的腳本,命令可以被放到文件的若干部分中。命令經(jīng)常被放置在接近文件頂端的位置。特殊代碼引發(fā)命令,從而提醒瀏覽器它們是JavaScript命令。如果命令被放在文件頂端的HTML<Body>標簽之前,則腳本會開始執(zhí)行,同時HTML頁面仍然加載。JavaScript是解釋性語言,這意味著瀏覽器按照讀取順序執(zhí)行JavaScript命令。JavaScript利用對象的動作進行操作。這些動作被稱作方法。在JavaScript的基本語法中,對象首先被命名,接著出現(xiàn)一個句點,并且后跟從對象得到的動作,即方法。因此,JavaScript中打開新窗口的命令是window.open。在這種情況下,window是對象而open是方法。這個命令打開新的瀏覽器窗口。在命令之后可以增加其它參數(shù)。所有參數(shù)均被放置在一組括號內(nèi),其中各個參數(shù)位于引號內(nèi),并且參數(shù)被逗號分隔。
當加載Web頁面時,客戶端瀏覽器執(zhí)行自動腳本。Web頁面上可以具有的自動腳本的數(shù)量沒有限制。HTML頁面上腳本的位置決定何時加載腳本。按照其在HTML文檔中出現(xiàn)的順序加載腳本。通過以下HTML代碼將自動JavaScript加到HTML文檔中<SCRIPT LANGUAGE=″JavaScript″>
類型 腳本內(nèi)容</SCRIPT>
某些早期的瀏覽器不能運行腳本并且不理解SCRIPT標簽。為了向訪問HTML頁面的訪問者提供信息,一個提供信息的可選方式是使用NOSCRIPT標簽并且后跟被視作普通文本的信息。早期瀏覽器不理解NOSCRIPT標簽,并且會忽略它,但是會處理后面的文本。以下內(nèi)容被加到HTML文檔中<NOSCRIPT>
類型 信息</NOSCRIPT>
在建立代理日志文件的單象素GIF的實現(xiàn)中,以下面討論的圖2所示的方式使用下面的標簽和屬性IMG是用于在頁面上插入圖象的HTML標簽;ALT是在不顯示圖象的情況下提供用于顯示的可選文本的屬性;SRC是指定圖象的URL的屬性;圖2中還圖解了以下用于IMG標簽的屬性WIDTH,HEIGHT是指定圖象的長度以便可以更加快速地加載HTML頁面的屬性;BORDER是指定邊框(如果有的話)厚度的屬性。BORDER=0省略了邊框,否則瀏覽器會自動在圖象周圍設(shè)置邊框。
在本發(fā)明的一個最優(yōu)實施例中,在顯示頁面時以如下方式將數(shù)據(jù)的CGI字符串附加到單象素GIF的SRC屬性上&pag=xxxxxxx 顯示GIF的頁面的絕對URL;&num=xx 在顯示時頁面上的單元(SRC)的數(shù)量;&ref=xxxxxxxxx請求當前頁的頁面的URL(通過JavaScript完成)。
另外,可以通過如下方式將用戶的站點訪問記錄(也稱作cookie)的固定站點訪問記錄標識附加到數(shù)據(jù)的CGI字符串上&usr=xxxxxxxx用戶站點訪問記錄的固定站點訪問記錄ID(JavaScript)。
圖2圖解了單象素GIF的實現(xiàn)的例子,其中增加查詢字符串參數(shù)以充當在尚未高速緩存頁面內(nèi)容的情況下已經(jīng)建立的日志記錄全集的代理。在圖2中,JavaScript語句被直接嵌入HTML頁面。它包含具有write方法(″document.write″)的文檔對象。文檔對象含有關(guān)于當前文檔的信息,并且提供在指定窗口向用戶顯示HTML表達式的方法。IMG和BR標簽是在窗口中顯示的HTML表達式。BR CLEAR標簽和屬性簡單產(chǎn)生強制換行和停止文字環(huán)繞效果。IMG標簽后面的SRC屬性提供含有單象素清晰GIF的頁面的絕對URL(″uc.GIF″);即,SRC=″http//census.rolandgarros.org/rc/images/uc.GIF?pag=′+location.pathname+`&num=14′+r+`″。
uc.GIF后面的CGI字符串指示HTML頁面上有14個SRC單元。變量″r″指示指引頁面(referrer page)的URL,根據(jù)″if′語句的真值條件(即文檔指引對象非空)將該URL定義成`&ref=′+top.document.referrer。JavaScript top.document.referrer反映了用戶在當前頁之前觀看的調(diào)用文檔(即指引頁面)的URL。
在客戶端瀏覽器不能解釋腳本語言的情況下,NOSCRIPT標簽區(qū)分出被瀏覽器解釋的HTML語句。這包含IMG標簽,其中SRC屬性具有位于″uc.GIF″之后的查詢字符串,該查詢字符串被修改以便包含HTML頁面的缺省URL(即″index.html″)。index.html文件是Web站點的頂層目錄的缺省文件。
為了對Web頁面提供服務(wù),Web站點需要主計算機和在主機上運行的服務(wù)器軟件。主計算機管理通信、協(xié)議并且容留在國際互聯(lián)網(wǎng)絡(luò)建立Web站點所需的頁面和有關(guān)軟件。服務(wù)器軟件駐留在主機上并且為頁面提供服務(wù),或者響應(yīng)客戶端瀏覽器軟件發(fā)送的請求而進行操作。服務(wù)器處理HTTP請求并且與主機操作系統(tǒng)通信,而主機操作系統(tǒng)則處理TCP/IP通信。存在不同類型的服務(wù)器軟件,這些服務(wù)器軟件針對不同類型的客戶端執(zhí)行不同類型的服務(wù)。具體地,Web服務(wù)器是HTTP服務(wù)器,其功能是使用超文本傳送協(xié)議向客戶端軟件(瀏覽器)發(fā)送信息??蛻舳藶g覽器請求服務(wù)器返回HTML文檔。服務(wù)器接收該請求并且回送應(yīng)答。應(yīng)答的頂部包含傳輸信息,而應(yīng)答的其余部分是HTML文件。除了向瀏覽器發(fā)送頁面之外,Web服務(wù)器還向CGI應(yīng)用程序傳遞運行CGI腳本的請求。這些腳本運行外部小程序,例如數(shù)據(jù)庫查找或交互式表格處理。服務(wù)器通過CGI向應(yīng)用程序發(fā)送腳本并且將腳本回送到瀏覽器。服務(wù)器軟件還包含以各種方式保證Web站點的安全和管理Web站點的配置文件和實用程序。
圖3圖解了本發(fā)明的處理邏輯。處理從開始塊300開始。在邏輯塊302中,客戶端瀏覽器軟件請求HTML Web頁面。客戶端瀏覽器在判決塊302中確定所請求的HTML頁面是否已經(jīng)在客戶端高速緩存。如果頁面已經(jīng)在客戶端高速緩存,則如邏輯塊310所示,HTML文件被傳送到瀏覽器。瀏覽器解釋HTML文件并且用源圖象(即來自原始Web服務(wù)器)或高速緩存的圖象建立Web頁面。高速緩存圖象可以從本地、路徑上的ISP、路由器或其它網(wǎng)絡(luò)設(shè)備得到。如果在判決塊304中確定頁面沒有在客戶端高速緩存,則在判決塊306中執(zhí)行另一個測試以確定頁面是否已經(jīng)在ISP高速緩存。ISP高速緩存測試只是為了說明本發(fā)明的一個實施例。從客戶端開始的下一個轉(zhuǎn)發(fā)段可以是到達內(nèi)部網(wǎng)上的服務(wù)器,該服務(wù)器具有TCP/IP地址并且提供直接互聯(lián)網(wǎng)訪問。如果頁面已經(jīng)在路徑上被高速緩存,則如邏輯塊312所示,HTML文件被傳送到客戶端瀏覽器,以便解釋HTML代碼并且用已經(jīng)高速緩存或從原始Web服務(wù)器原始Web服務(wù)器到的圖象建立Web頁面。如果頁面尚未在到達Web服務(wù)器的路徑上高速緩存,則如邏輯塊308所示,針對頁面的請求被發(fā)送到主機,其中在主機中Web服務(wù)器軟件處理請求。如果瀏覽器具有請求HTML文件,則如邏輯塊314所示,Web服務(wù)器檢索原始源HTML文件,將協(xié)議頭附加到文件上,并且向瀏覽器發(fā)送文件。
一旦瀏覽器從邏輯塊310、312或314中的處理接收到HTML文件,則在判決塊318中進行測試以確定HTML文件是否含有不可高速緩存單象素GIF(如本發(fā)明中的uc.GIF所示)。如果不含有,則顯示檢索的高速緩存圖象以完成所請求的Web頁面的建立。接著如結(jié)束塊326所示完成請求的處理。如果在判決塊318中從HTML文件內(nèi)發(fā)現(xiàn)uc.GIF請求,則uc.GIF和CGI查詢字符串被發(fā)送到原始Web服務(wù)器,在原始Web服務(wù)器中對它們進行分析以收集本發(fā)明使之成為可能的多樣化Web服務(wù)器活動數(shù)據(jù)。瀏覽器再次解釋HTML代碼,并且用源圖象或高速緩存的圖象建立頁面。在使用圖2的例子的情況下,針對Web頁面記錄14次點擊,其中一次點擊用于發(fā)送的uc.GIF請求,13次點擊用于根據(jù)HTML文件中的HTML IMG SRC標簽/屬性檢索到的其它源圖象。這表示使用不可高速緩存單象素GIF請求的代理性質(zhì)。14次點擊的指引頁面作為CGI查詢字符串的一部分也被包含進來。在圖2中,這由″r=`&ref=′+top.document.referrer″來表示。這種多樣化Web服務(wù)器活動數(shù)據(jù)的收集和存儲如邏輯塊322所示。如結(jié)束塊324所示,請求處理結(jié)束。
當用戶訪問Web站點時,瀏覽器檢查URL,并且查看客戶端計算機的硬盤上存儲的站點訪問記錄文件。如果瀏覽器發(fā)現(xiàn)與該URL相關(guān)的站點訪問記錄,則向服務(wù)器發(fā)送該站點訪問記錄信息。如果沒有與URL相關(guān)的站點訪問記錄,則服務(wù)器將站點訪問記錄放置在站點訪問記錄文件內(nèi)。某些站點會首先提出一系列諸如姓名和口令的問題,并且接著會將其中含有上述信息的站點訪問記錄放置在硬盤上。需要注冊的站點通常都是這樣。通常情況下,服務(wù)器上的CGI腳本得到用戶已經(jīng)輸入的信息,并且接著將站點訪問記錄寫到客戶端計算機的硬盤上。當用戶離開Web站點時,站點訪問記錄信息仍然保留在硬盤上,使得用戶下一次訪問該Web站點時Web站點可以識別用戶,除非在用戶離開站點時已經(jīng)特別標明該站點訪問記錄過期。
利用通過使用上述單象素GIF得到的收集多樣化信息的能力,更加詳細和精確的涉及Web站點活動的信息可以被收集和存儲在多維數(shù)據(jù)庫中,所述多維數(shù)據(jù)庫包含關(guān)系數(shù)據(jù)庫的多維實現(xiàn)。此外,也可以使用諸如在線解析處理(OLAP)的相對較新的技術(shù)分析所收集的這種數(shù)據(jù),下面會簡要描述在線解析處理技術(shù)。
在線解析處理(OLAP)是一類用于在線專用數(shù)據(jù)訪問和分析的技術(shù)。雖然事務(wù)處理通常依賴于關(guān)系數(shù)據(jù)庫,然而OLAP已經(jīng)等同于企業(yè)數(shù)據(jù)的多維視圖。通過多維數(shù)據(jù)庫技術(shù)支持這些多維視圖。經(jīng)常希望得到數(shù)據(jù)的高級、聚集視圖,例如按產(chǎn)品線、區(qū)域等等合計的總銷售額的分析人員會使用OLAP應(yīng)用程序。通常以批處理模式從多個數(shù)據(jù)源更新OLAP數(shù)據(jù)庫,并且OLAP數(shù)據(jù)庫為多個用戶應(yīng)用程序提供解析后端(backend)。
圖4圖解了示例性的站點等級分析顯示,通過將單象素GIF用作在Web頁面內(nèi)容尚未被高速緩存的情況下已經(jīng)產(chǎn)生的日志記錄全集的代理,可以通過收集精確點擊信息得到所述顯示。該附圖描述了針對選擇的時間間隔可以得到的各種測量,這些測量包含點擊,訪問的頁面,每次頁面查看的秒數(shù),訪問,每次訪問的點擊數(shù),每次訪問的頁面查看數(shù),和每次訪問的秒數(shù)。
圖5圖解了示例性的指引類別顯示,通過將單象素GIF用于涉及Web頁面指引源的日志信息可以得到該顯示。不同的指引類別包含商業(yè),教育,政府,內(nèi)部指引,ISP指引,和其中的搜索引擎和目錄。并且,針對選定時間間隔(例如日歷星期)提供數(shù)據(jù)。各種指引類別被加上下劃線,這表示它們可以被″展開″成圖6所示的子指引類別。
圖6根據(jù)從公共搜索引擎或瀏覽器得到的指引圖解了針對選定時間間隔的搜索引擎和目錄指引類別的分解。例如,在出現(xiàn)頁面指引的峰值數(shù)量的周結(jié)束6月10日期間,超過71%的頁面由Yahoo搜索引擎來指引。此外,可以展開成如加下劃線的子類別所示的搜索引擎指引類別。
圖7圖解了AltaVista指引子類別的展開。例如,該顯示表明在周結(jié)束6月3日期間AltaVista的84%指引來自AltaVista主頁上的CGI查詢字符串。
在這個指引子類別上不能進行進一步的展開。
圖8圖解了按內(nèi)容類別的Web頁面示例性顯示,通過將單象素GIF用作在Web頁面內(nèi)容尚未被高速緩存的情況下已經(jīng)產(chǎn)生的日志記錄全集的代理,可以通過收集精確點擊信息得到所述顯示。內(nèi)容類別包含繪畫,主頁,新聞和圖片,演員,記分牌,商店(禮品商店),以及其它內(nèi)容類別。針對選定時間間隔提供數(shù)據(jù)。各種內(nèi)容類別被加上下劃線,這表示它們可以被展開成更低層次的詳細信息。
圖9圖解了主頁內(nèi)容類別的展開。資源包含可通過支持JavaScript的瀏覽器訪問的英語版本主頁(/en);可通過支持JavaScript的瀏覽器訪問的法語版本主頁(/fr);可通過不支持JavaScript的瀏覽器訪問的英語版本主頁(/en/index.html),等等。對于出現(xiàn)峰值傳輸?shù)闹芙Y(jié)束6月10日,58%的主頁業(yè)務(wù)量針對英語版本頁面,并且由支持JavaScript的瀏覽器產(chǎn)生。略微小于42%的業(yè)務(wù)量針對法語版本頁面,并且由支持JavaScript的瀏覽器產(chǎn)生。
圖10圖解了示例性保存報告的顯示,使用通過本發(fā)明的單象素GIF建立的代理日志記錄的OLAP處理可以產(chǎn)生該報告。保存報告包含站點等級報告,訪問分布報告,業(yè)務(wù)量報告,內(nèi)容報告,域/子域報告等等。列出的各個報告帶下劃線,這表明通過點擊報告名稱可以得到詳細報告。
圖11A-11M圖解了對應(yīng)的示例性保存報告的格式。圖11A示出可用的站點等級報告。在這種情況下,可用的站點等級報告是站點業(yè)務(wù)量報告。報告名稱帶下劃線,這表明結(jié)果通過點擊報告名稱可以展開詳細報告。這種操作會產(chǎn)生與圖4類似的顯示。圖11B的顯示中列出可用的訪問分布報告。圖11C-11K和11M圖解了基本上為″前10″名的各種保存報告。圖11C描述了業(yè)務(wù)量報告,并且允許顯示前10個請求的資源。圖11D描述了內(nèi)容報告,并且允許顯示前10個請求最多的頁面。圖11E描述了子域報告,并且允許顯示按照查看頁面或訪問數(shù)量排列的前10個子域。圖11F描述了域報告,并且允許顯示按照查看頁面或訪問數(shù)量排列的前10個域。圖11G描述了指引報告,并且允許顯示按照查看頁面或訪問數(shù)量排列的前10個指引。圖11H描述了進入頁面報告,并且允許顯示前10個站點進入頁面。圖11I描述了退出頁面報告,并且允許顯示前10個退出頁面。圖11J描述了瀏覽器報告,并且允許顯示按照查看頁面或訪問數(shù)量排列的前10個瀏覽器。圖11K描述了平臺報告,并且允許顯示按照查看頁面或訪問數(shù)量排列的前10個平臺。圖11L描述了使用簇報告,并且允許顯示使用簇訪問。圖11M描述了廣告報告,并且允許顯示按照產(chǎn)生的印象排列的前10個廣告。按照選定時間間隔,例如最近5周提供所有可用保存報告。
后面的任意權(quán)利要求中的對應(yīng)結(jié)構(gòu)、部件、操作和任意裝置加功能要素的等價特征,均被用來包含用于結(jié)合具體要求保護的其它要素而執(zhí)行的功能的任意結(jié)構(gòu)、部件或操作。
雖然前面參照實施例示出和描述了本發(fā)明,然而本領(lǐng)域的技術(shù)人員會理解,在不偏離本發(fā)明的宗旨和范圍的前提下可以在形式和細節(jié)方面進行各種改變。
權(quán)利要求
1.獲得客戶-服務(wù)器通信網(wǎng)絡(luò)中多樣化活動數(shù)據(jù)的系統(tǒng),其中網(wǎng)絡(luò)單元請求的信息被高速緩存在一或多個其它網(wǎng)絡(luò)單元中,該系統(tǒng)包括服務(wù)器網(wǎng)絡(luò)單元,包含用于產(chǎn)生和存儲可被發(fā)出請求的網(wǎng)絡(luò)單元訪問的多個信息文件的服務(wù)器軟件和數(shù)據(jù)庫,信息文件包含被發(fā)出請求的網(wǎng)絡(luò)單元解釋以顯示所請求的信息的文本文件和關(guān)鍵字,信息文件還包含不可高速緩存的單象素圖形圖象格式(GIF)請求;其中在解釋信息文件時,從通信網(wǎng)絡(luò)上發(fā)出請求的單元向服務(wù)器網(wǎng)絡(luò)單元發(fā)送單象素GIF請求,而服務(wù)器網(wǎng)絡(luò)單元讀取和存儲單象素GIF請求中包含的多樣化數(shù)據(jù)。
2.如權(quán)利要求1所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),還包括一或多個被連接到其它網(wǎng)絡(luò)單元中的至少一個的高速緩存引擎,所述高速緩存引擎暫時存儲所請求的信息文件,所述信息文件根據(jù)需要被提供給發(fā)出請求的網(wǎng)絡(luò)單元。
3.如權(quán)利要求1所述的的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中單象素GIF請求包含公共網(wǎng)關(guān)接口(CGI)查詢字符串,所述公共網(wǎng)關(guān)接口(CGI)查詢字符串被附加在單象素GIF請求上并且包含多樣化數(shù)據(jù)。
4.如權(quán)利要求3所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含所請求的信息文件的位置的標識。
5.如權(quán)利要求3所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含信息文件中含有的若干圖象對象。
6.如權(quán)利要求3所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含網(wǎng)絡(luò)單元的標識,所述標識將發(fā)出請求的網(wǎng)絡(luò)單元指引到服務(wù)器網(wǎng)絡(luò)單元。
7.如權(quán)利要求3所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含發(fā)出請求的網(wǎng)絡(luò)單元的固定站點訪問記錄標識。
8.如權(quán)利要求1所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中客戶-服務(wù)器通信網(wǎng)絡(luò)是諸如互聯(lián)網(wǎng)的全球網(wǎng)絡(luò)。
9.如權(quán)利要求1所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中多個信息文件是使用超文本標記語言(HTML)標簽編寫的超文本文檔。
10.如權(quán)利要求9所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中超文本文檔包含源HTML代碼,發(fā)出請求的單元解釋源HTML代碼以產(chǎn)生存儲在服務(wù)器網(wǎng)絡(luò)單元的對應(yīng)Web頁面的顯示。
11.如權(quán)利要求1所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中服務(wù)器網(wǎng)絡(luò)單元是超文本傳送協(xié)議(HTTP)服務(wù)器。
12.如權(quán)利要求1所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中發(fā)出請求的網(wǎng)絡(luò)單元是客戶端瀏覽器應(yīng)用程序。
13.如權(quán)利要求9所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中具有附加的公共網(wǎng)關(guān)接口(CGI)查詢字符串的單象素GIF請求被包含成JavaScript命令的一部分,而JavaScript命令被直接放入HTML文件中。
14.如權(quán)利要求13所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中JavaScript命令是″document.write″命令,該命令將其后的表達式放在文檔窗口中。
15.如權(quán)利要求14所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中表達式包含具有源(SRC)屬性的超文本標記語言(HTML)圖象(IMG)標簽,源(SRC)屬性指定超文本文檔的統(tǒng)一資源定位符(URL)位置。
16.如權(quán)利要求1所述的系統(tǒng),用于獲得多樣化活動數(shù)據(jù),其中其它網(wǎng)絡(luò)單元包含交換設(shè)備、路由設(shè)備、網(wǎng)關(guān)和客戶端計算機設(shè)備中的任意一或多個。
17.獲得客戶-服務(wù)器通信網(wǎng)絡(luò)中多樣化活動數(shù)據(jù)的方法,其中網(wǎng)絡(luò)單元請求的信息被高速緩存在一或多個其它網(wǎng)絡(luò)單元中,該方法包括操作在服務(wù)器網(wǎng)絡(luò)單元上產(chǎn)生和存儲可被發(fā)出請求的網(wǎng)絡(luò)單元訪問的多個信息文件,信息文件包含文本文件和關(guān)鍵字,以及單象素圖形圖象格式(GIF)請求;由發(fā)出請求的網(wǎng)絡(luò)單元解釋包含文本文件、關(guān)鍵字和單象素GIF請求的信息文件以顯示所請求的信息;從通信網(wǎng)絡(luò)上發(fā)出請求的單元向服務(wù)器網(wǎng)絡(luò)單元發(fā)送單象素GIF請求;和在服務(wù)器網(wǎng)絡(luò)單元上讀取和存儲發(fā)送的單象素GIF請求中包含的多樣化活動數(shù)據(jù)。
18.如權(quán)利要求17所述的方法,用于獲得多樣化活動數(shù)據(jù),還包括由一或多個被連接到其它網(wǎng)絡(luò)單元中的至少一個的高速緩存引擎暫時存儲所請求的信息文件的操作,所述信息文件根據(jù)需要被提供給發(fā)出請求的網(wǎng)絡(luò)單元。
19.如權(quán)利要求17所述的方法,用于獲得多樣化活動數(shù)據(jù),還包括將公共網(wǎng)關(guān)接口(CGI)查詢字符串附加到單象素GIF請求上的操作。
20.如權(quán)利要求19所述的方法,用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含所請求的信息文件的位置的標識。
21.如權(quán)利要求19所述的方法,用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含信息文件中含有的若干圖象對象。
22.如權(quán)利要求19所述的方法,用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含網(wǎng)絡(luò)單元的標識,所述標識將發(fā)出請求的網(wǎng)絡(luò)單元指引到服務(wù)器網(wǎng)絡(luò)單元。
23.如權(quán)利要求19所述的方法,用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含發(fā)出請求的網(wǎng)絡(luò)單元的固定站點訪問記錄標識。
24.如權(quán)利要求17所述的方法,用于獲得多樣化活動數(shù)據(jù),其中客戶-服務(wù)器通信網(wǎng)絡(luò)是諸如互聯(lián)網(wǎng)的全球網(wǎng)絡(luò)。
25.如權(quán)利要求17所述的方法,用于獲得多樣化活動數(shù)據(jù),其中多個信息文件是使用超文本標記語言(HTML)標簽編寫的超文本文檔。
26.如權(quán)利要求25所述的方法,用于獲得多樣化活動數(shù)據(jù),還包括由發(fā)出請求的單元解釋超文本文檔中的源HTML代碼,以產(chǎn)生存儲在服務(wù)器網(wǎng)絡(luò)單元的對應(yīng)Web頁面的顯示。
27.如權(quán)利要求17所述的方法,用于獲得多樣化活動數(shù)據(jù),其中超文本文檔被存儲在超文本傳送協(xié)議(HTTP)服務(wù)器上。
28.如權(quán)利要求17所述的方法,用于獲得多樣化活動數(shù)據(jù),其中發(fā)出請求的網(wǎng)絡(luò)單元是客戶端瀏覽器應(yīng)用程序。
29.如權(quán)利要求25所述的方法,用于獲得多樣化活動數(shù)據(jù),還包含將具有附加的公共網(wǎng)關(guān)接口(CGI)查詢字符串的單象素GIF請求包含成JavaScript命令的一部分,其中JavaScript命令被直接放入HTML文件中。
30.如權(quán)利要求29所述的方法,用于獲得多樣化活動數(shù)據(jù),其中JavaScript命令是″document.write″命令,該命令將其后的表達式放在文檔窗口中。
31.如權(quán)利要求30所述的方法,用于獲得多樣化活動數(shù)據(jù),其中表達式包含具有源(SRC)屬性的超文本標記語言(HTML)圖象(IMG)標簽,源(SRC)屬性指定超文本文檔的統(tǒng)一資源定位符(URL)位置。
32.包含用于獲得客戶-服務(wù)器通信網(wǎng)絡(luò)中多樣化活動數(shù)據(jù)的計算機程序的計算機可讀介質(zhì),其中網(wǎng)絡(luò)單元請求的信息被高速緩存在一或多個其它網(wǎng)絡(luò)單元中,該計算機程序產(chǎn)品包括在服務(wù)器網(wǎng)絡(luò)單元上產(chǎn)生和存儲多個可訪問信息文件的程序指令,信息文件包含文本文件和關(guān)鍵字,以及單象素圖形圖象格式(GIF);當發(fā)出請求的單元解釋信息文件的內(nèi)容時從發(fā)出請求的單元接收單象素GIF請求的程序指令;和在服務(wù)器網(wǎng)絡(luò)單元上讀取和存儲發(fā)送的單象素GIF請求中包含的多樣化活動數(shù)據(jù)的程序指令。
33.如權(quán)利要求32所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),還包括將公共網(wǎng)關(guān)接口(CGI)查詢字符串附加到單象素GIF請求上的程序指令。
34.如權(quán)利要求33所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含所請求的信息文件的位置的標識。
35.如權(quán)利要求33所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含信息文件中含有的若干圖象對象。
36.如權(quán)利要求33所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含網(wǎng)絡(luò)單元的標識,所述標識將發(fā)出請求的網(wǎng)絡(luò)單元指引到服務(wù)器網(wǎng)絡(luò)單元。
37.如權(quán)利要求33所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),其中CGI查詢字符串包含發(fā)出請求的網(wǎng)絡(luò)單元的固定站點訪問記錄標識。
38.如權(quán)利要求32所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),其中多個信息文件是使用超文本標記語言(HTML)標簽編寫的超文本文檔。
39.如權(quán)利要求32所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),還包括將超文本文檔存儲在超文本傳送協(xié)議(HTTP)服務(wù)器上的程序指令。
40.如權(quán)利要求38的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),還包括將JavaScript命令直接放入HTML文件的程序指令,所述JavaScript命令包含具有附加的公共網(wǎng)關(guān)接口(CGI)查詢字符串的單象素GIF請求。
41.如權(quán)利要求40所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),其中JavaScript命令是″document.write″命令,該命令將其后的表達式放在發(fā)出請求的網(wǎng)絡(luò)單元上的文檔窗口中。
42.如權(quán)利要求41所述的計算機程序產(chǎn)品,用于獲得多樣化活動數(shù)據(jù),其中表達式包含具有源(SRC)屬性的超文本標記語言(HTML)圖象(IMG)標簽,源(SRC)屬性指定超文本文檔的統(tǒng)一資源定位符(URL)位置。
全文摘要
全球通信網(wǎng)中收集多樣化Web服務(wù)器活動數(shù)據(jù)的方法和系統(tǒng),其中所請求的信息文件被高速緩存在多個網(wǎng)絡(luò)設(shè)備上。隨著Web高速緩存在互聯(lián)網(wǎng)上的流行,原始Web服務(wù)器不再為大多數(shù)針對Web站點內(nèi)容的請求提供服務(wù)。單象素清晰圖形圖象格式(GIF)請求被加入Web頁面的超文本標記語言(HTML)源文件。含有增強Web活動數(shù)據(jù)信息的數(shù)據(jù)的公共網(wǎng)關(guān)接口(CGI)字符串被附加到GIF請求中,其中包含客戶端瀏覽器為建立Web頁面必須檢索的圖象(“點擊”)數(shù)量,和訪問Web頁面時引用的標識符。單象素清晰GIF請求是不可高速緩存的,并且當客戶端瀏覽器解釋HTML文件時導致請求被發(fā)送到原始Web服務(wù)器。多樣化數(shù)據(jù)被存儲在原始Web服務(wù)器上的日志文件中,以便累計Web頁面上的精確點擊數(shù)量。
文檔編號G06F15/00GK1494680SQ01814320
公開日2004年5月5日 申請日期2001年8月11日 優(yōu)先權(quán)日2000年8月18日
發(fā)明者保羅·R·布里斯考, 保羅 R 布里斯考, D 費爾斯塔特, 卡梅倫·D·費爾斯塔特, R 伽尼斯, 馬修·R·伽尼斯, C 漢默, 斯蒂芬·C·漢默, B K 漢森, 加里·B·K·漢森, A 哈珀, 肖恩·A·哈珀, S 尼科爾斯, 邁克爾·S·尼科爾斯, D 佩爾斯利, 赫伯特·D·佩爾斯利, 保羅·里德, 里德, J 斯尼澤, 布賴恩·J·斯尼澤 申請人:國際商業(yè)機器公司