網(wǎng)頁變化監(jiān)控方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及移動互聯(lián)網(wǎng)技術領域,更為具體地,涉及一種網(wǎng)頁變化監(jiān)控方法及裝置。
【背景技術】
[0002]互聯(lián)網(wǎng)以快速迭代著稱,web應用會每周進行多次產(chǎn)品發(fā)布及運營內(nèi)容更新,因此,企業(yè)對產(chǎn)品進行網(wǎng)頁監(jiān)控成為企業(yè)網(wǎng)頁管理的重點之一。
[0003]目前,大多數(shù)企業(yè)對產(chǎn)品進行頁面監(jiān)控及對比的方法都是基于頁面截圖后的圖片像素對比實現(xiàn)的,其誤報率高,也不能針對網(wǎng)頁上的隨機內(nèi)容區(qū)域進行排除,非常的不靈活。因此,對網(wǎng)頁的歷史修改做快照,并對兩次歷史快照間的差異進行對比,標記差異位置,成為企業(yè)對產(chǎn)品進行監(jiān)控的迫切需求。
[0004]因此,如何能夠準確地監(jiān)控、對比同一網(wǎng)頁的變化成為當前企業(yè)網(wǎng)頁監(jiān)控的主要問題。
【發(fā)明內(nèi)容】
[0005]鑒于上述問題,本發(fā)明的目的是提供一種網(wǎng)頁變化監(jiān)控方法及裝置,通過對網(wǎng)頁在不同時刻的頁面數(shù)據(jù)進行結(jié)構(gòu)化記錄和對比,從而找出網(wǎng)頁在不同時刻的差異,同時,將找出的差異標記在網(wǎng)頁的截圖上,從而提高網(wǎng)頁差異對比的準確性,更便于網(wǎng)頁監(jiān)控。
[0006]本發(fā)明提供的網(wǎng)頁變化監(jiān)控方法,包括:
[0007]分別記錄同一網(wǎng)頁在不同時刻加載后的頁面數(shù)據(jù),并對同一網(wǎng)頁不同時刻加載后的頁面進行截圖保存;其中,將同一網(wǎng)頁不同時刻加載后的頁面數(shù)據(jù)記錄為相應地特定數(shù)據(jù)結(jié)構(gòu);
[0008]通過對比不同時刻記錄的特定數(shù)據(jù)結(jié)構(gòu),確定同一網(wǎng)頁在不同時刻加載后的頁面數(shù)據(jù)之間的差異;
[0009]將該差異分別標記在不同時刻的頁面截圖上。
[0010]本發(fā)明提供的網(wǎng)頁變化監(jiān)控裝置,包括:
[0011]頁面數(shù)據(jù)記錄單元,用于分別記錄同一網(wǎng)頁在不同時刻加載后的頁面數(shù)據(jù);其中,將同一網(wǎng)頁不同時刻加載后的頁面數(shù)據(jù)記錄為相應地特定數(shù)據(jù)結(jié)構(gòu);
[0012]頁面截圖單元,用于對同一網(wǎng)頁不同時刻加載后的頁面進行截圖保存;
[0013]差異確定單元,用于對比不同時刻記錄的特定數(shù)據(jù)結(jié)構(gòu),確定同一網(wǎng)頁在不同時刻加載后的頁面數(shù)據(jù)之間的差異;
[0014]差異標記單元,用于將該差異分別標記在不同時刻的頁面截圖上。
[0015]上述根據(jù)本發(fā)明提供的網(wǎng)頁變化監(jiān)控方法及裝置,通過對同一網(wǎng)頁不同時刻加載后的頁面進行截圖,以及將同一網(wǎng)頁不同時刻加載后的頁面數(shù)據(jù)記錄為特定數(shù)據(jù)結(jié)構(gòu),并對任意兩個時刻的特定數(shù)據(jù)結(jié)構(gòu)進行對比,找出差異的部分,將差異的部分對應標記在兩個時刻的截圖上,能夠準確地對比同一網(wǎng)頁在不同時刻發(fā)生的變化,便于網(wǎng)頁監(jiān)控。
[0016]為了實現(xiàn)上述以及相關目的,本發(fā)明的一個或多個方面包括后面將詳細說明并在權(quán)利要求中特別指出的特征。下面的說明以及附圖詳細說明了本發(fā)明的某些示例性方面。然而,這些方面指示的僅僅是可使用本發(fā)明的原理的各種方式中的一些方式。此外,本發(fā)明旨在包括所有這些方面以及它們的等同物。
【附圖說明】
[0017]通過參考以下結(jié)合附圖的說明及權(quán)利要求書的內(nèi)容,并且隨著對本發(fā)明的更全面理解,本發(fā)明的其它目的及結(jié)果將更加明白及易于理解。在附圖中:
[0018]圖1為根據(jù)本發(fā)明實施例的網(wǎng)頁變化監(jiān)控方法的流程示意圖;
[0019]圖2為根據(jù)本發(fā)明實施例的網(wǎng)頁快照存儲的流程示意圖;
[0020]圖3為根據(jù)本發(fā)明實施例的快照對比的流程示意圖;
[0021]圖4a?圖4d分別為根據(jù)本發(fā)明實施例的差異展現(xiàn)結(jié)果圖;
[0022]圖5為根據(jù)本發(fā)明實施例的網(wǎng)頁變化監(jiān)控裝置的邏輯結(jié)構(gòu)圖;
[0023]圖6為根據(jù)本發(fā)明實施例的網(wǎng)頁變化監(jiān)控裝置一個【具體實施方式】的邏輯結(jié)構(gòu)圖;
[0024]圖7為根據(jù)本發(fā)明實施例的設備終端的邏輯結(jié)構(gòu)圖。
[0025]在所有附圖中相同的標號指示相似或相應的特征或功能。
【具體實施方式】
[0026]在下面的描述中,出于說明的目的,為了提供對一個或多個實施例的全面理解,闡述了許多具體細節(jié)。然而,很明顯,也可以在沒有這些具體細節(jié)的情況下實現(xiàn)這些實施例。在其它例子中,為了便于描述一個或多個實施例,公知的結(jié)構(gòu)和設備以方框圖的形式示出。
[0027]對于同一網(wǎng)頁的變化,現(xiàn)有的網(wǎng)頁對比方法是基于頁面截圖后的圖片像素對比實現(xiàn)的,其誤報率高。針對此問題,本發(fā)明將網(wǎng)頁的頁面數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)記錄為特定數(shù)據(jù)結(jié)構(gòu),通過對比特定數(shù)據(jù)結(jié)構(gòu)之間的差異標記出哪些頁面數(shù)據(jù)進行了修改,修改的頁面數(shù)據(jù)即為網(wǎng)頁變化的內(nèi)容,可以降低網(wǎng)頁對比的誤報率。
[0028]其中,頁面數(shù)據(jù)就是網(wǎng)頁元素,也就是指組成網(wǎng)頁內(nèi)容的元素,網(wǎng)頁元素包括,文字、圖片、首頻、動趣、視頻、文字等等。
[0029]以下將結(jié)合附圖對本發(fā)明的具體實施例進行詳細描述。
[0030]圖1示出了根據(jù)本發(fā)明實施例的網(wǎng)頁變化監(jiān)控方法的流程。
[0031]如圖1所示,本發(fā)明實施例提供的網(wǎng)頁變化監(jiān)控方法,包括:
[0032]步驟SllO:分別記錄同一網(wǎng)頁在不同時刻加載后的頁面數(shù)據(jù),并對同一網(wǎng)頁不同時刻加載后的頁面進行截圖保存;其中,將同一網(wǎng)頁不同時刻加載后的頁面數(shù)據(jù)記錄為相應地特定數(shù)據(jù)結(jié)構(gòu)。
[0033]其中,同一網(wǎng)頁是指同一個URL的網(wǎng)頁,頁面數(shù)據(jù)就是指網(wǎng)頁元素,網(wǎng)頁元素的數(shù)據(jù)結(jié)構(gòu)為DOM結(jié)構(gòu)(Document Object Model,文件對象模型),將同一網(wǎng)頁不同時刻加載后的頁面數(shù)據(jù)記錄為相應地特定數(shù)據(jù)結(jié)構(gòu),也就是將網(wǎng)頁元素的DOM結(jié)構(gòu)記錄為特定數(shù)據(jù)結(jié)構(gòu),而將網(wǎng)頁元素的DOM結(jié)構(gòu)記錄為特定數(shù)據(jù)結(jié)構(gòu)的流程與頁面截圖的流程不分先后順序。
[0034]這里,記錄網(wǎng)頁的頁面數(shù)據(jù)的時刻和進行頁面截圖的時刻是一一對應的時刻。例如,分別在第一時刻和第二時刻記錄網(wǎng)頁的頁面數(shù)據(jù),同時對該網(wǎng)頁在第一時刻和第二時刻的網(wǎng)頁分別進行截圖保存。
[0035]另外,網(wǎng)頁元素包括元素樣式、元素屬性信息、元素內(nèi)容、元素標簽及元素占位信肩、O
[0036]由于DOM結(jié)構(gòu)的元素數(shù)據(jù)量大,在進行元素對比時計算量過于龐大,因此本發(fā)明將網(wǎng)頁元素的DOM結(jié)構(gòu)記錄為特定數(shù)據(jù)結(jié)構(gòu),以便減少元素對比時的計算量,本發(fā)明實施例中的特定數(shù)據(jù)結(jié)構(gòu)為JSON結(jié)構(gòu)(Javascript Object Notat1n,輕量級的數(shù)據(jù)交換格式),但也可以將網(wǎng)頁元素的DOM結(jié)構(gòu)記錄成其它的特定數(shù)據(jù)結(jié)構(gòu)。
[0037]由于JSON結(jié)構(gòu)的元素無法存儲在硬盤中,因此需要將JSON結(jié)構(gòu)的元素序列化為硬盤能夠存儲的格式,存儲在硬盤中,本發(fā)明實施例將網(wǎng)頁元素的DOM結(jié)構(gòu)記錄為JSON結(jié)構(gòu)并序列化存儲的過程稱為網(wǎng)頁快照存儲,存儲在硬盤中的元素為快照數(shù)據(jù),其內(nèi)容包括元素樣式的哈希值、元素屬性信息、元素內(nèi)容、元素標簽及元素占位信息。
[0038]步驟S120:通過對比不同時刻記錄的特定數(shù)據(jù)結(jié)構(gòu),確定同一網(wǎng)頁在不同時刻加載后的頁面數(shù)據(jù)之間的差異。
[0039]對比不同時刻記錄的特定數(shù)據(jù)結(jié)構(gòu),就是尋找不同時刻的JSON結(jié)構(gòu)的網(wǎng)頁元素之間不相同的部分,也就是對比不同時刻的快照數(shù)據(jù),從而確定出同一網(wǎng)頁在不同時刻加載后的頁面數(shù)據(jù)之間的差異。
[0040]由于存儲在硬盤中的快照數(shù)據(jù)無法進行對比,所以在對比不同時刻的快照數(shù)據(jù)間的差異之前,需要將不同時刻的快照數(shù)據(jù)反序列化為特定數(shù)據(jù)結(jié)構(gòu),本發(fā)明實施例將對比不同時刻的快照數(shù)據(jù)的過程稱為快照對比。
[0041]不同時刻快照數(shù)據(jù)間的差異包括新增元素、刪除元素、樣式修改和文本內(nèi)容改變,上述四種變化表示不同時刻中同一個網(wǎng)頁的元素間差異,分別為:
[0042]新增元素表示同一個網(wǎng)頁在不同時刻相比增加了一個元素;
[0043]刪除元素表示同一個網(wǎng)頁不同時刻相比刪除了一個元素;
[0044]樣式修改表示同一個網(wǎng)頁在不同時刻相比沒有增加或刪除元素,而是元素樣式發(fā)生了改變;
[0045]文本內(nèi)容改變表示同一個網(wǎng)頁在不同時刻中只有元素的文本內(nèi)容發(fā)生了改變。
[0046]步驟S130:將該差異分別標記在不同時刻的頁面截圖上。
[0047]將不同時刻記錄的網(wǎng)頁數(shù)據(jù)結(jié)構(gòu)對比之后,可以得出該網(wǎng)頁在不同時刻的差異。所述頁面截圖用于直觀地展示所述差異。具體地,可以在所述頁面截圖上標注出差異的類型和所述差異在頁面上發(fā)生的位置。
[0048]為了便于對比不同時刻的頁面截圖,將不同時刻的頁面截圖拼接在一起,再將不同時刻的頁面數(shù)據(jù)間的差異標記在拼接在一起的頁面截圖上,也就是將不同時刻同一網(wǎng)頁中元素之間不相同的部分標記在拼接在一起的頁面截圖上,標記的方式多種多樣,具體地,按照差異的類型用不同顏色標記在拼接在一