亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種網(wǎng)頁關(guān)鍵詞匹配的方法和系統(tǒng)與流程

文檔序號:11133959閱讀:862來源:國知局
一種網(wǎng)頁關(guān)鍵詞匹配的方法和系統(tǒng)與制造工藝

本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種網(wǎng)頁關(guān)鍵詞匹配的方法和系統(tǒng)。



背景技術(shù):

隨著網(wǎng)絡(luò)的迅速發(fā)展,互聯(lián)網(wǎng)成為大量信息的載體,文字、圖片、數(shù)據(jù)庫、音頻、視頻多媒體等不同類型數(shù)據(jù)大量出現(xiàn)于網(wǎng)絡(luò),再加以各式各樣的網(wǎng)頁設(shè)計,人類進入了信息爆炸的時代?;ヂ?lián)網(wǎng)信息呈現(xiàn)了數(shù)據(jù)巨大、內(nèi)容廣泛、形式多樣、增長迅速的特點。截至2014年12月,僅中國的網(wǎng)頁數(shù)量達到1899億個,年增長26.6%。隨著個人博客、自媒體的發(fā)展,以及互聯(lián)網(wǎng)媒體的快速發(fā)展,互聯(lián)網(wǎng)頁的數(shù)量將會以幾何級速的增長。

互聯(lián)網(wǎng)傳播速度快,內(nèi)容共享自由,所以互聯(lián)網(wǎng)成為了一個集各種信息資源為一體的資源網(wǎng),來自各方的人士隨時都可以在網(wǎng)上發(fā)布信息。這就造成了互聯(lián)網(wǎng)信息增長迅速、種類繁多、分布廣泛的特點,也帶來互聯(lián)網(wǎng)信息資源在使用過程中的效率低下,主要表現(xiàn)為:

1、由于接入互聯(lián)網(wǎng)的便捷性,網(wǎng)絡(luò)信息資源幾乎是無所不包,而且類型豐富多樣,覆蓋了不同學(xué)科、不同領(lǐng)域、不同地區(qū)、不同語言的信息,在形式上包括文本、圖像、聲音、軟件、數(shù)據(jù)庫等,是多媒體、多領(lǐng)域、多語種、多類型的信息資源混合體。用戶在使用互聯(lián)網(wǎng)資源的時候,具有較大的選擇余地,能夠在短時間內(nèi)、低成本的獲得大量的信息。在互聯(lián)網(wǎng)搜索引擎上輸入關(guān)鍵詞,同一個主題的檢索結(jié)果就可以達到以萬為單位的數(shù)量。這些龐大的信息資源,能夠滿足使用條件的檢索記錄很少,需要從巨量信息中挑選符合要求的信息記錄。但是,這也帶來了信息過度提供的問題,使用效率低下。

2、互聯(lián)網(wǎng)信息由于信息獲得成本低,而且現(xiàn)代信息技術(shù)的發(fā)展使得信息很容易復(fù)制,造成了互聯(lián)網(wǎng)信息傳播迅速,在網(wǎng)絡(luò)信息環(huán)境下,時間和空間范圍得到了最大程度的延伸和擴展,也造成了重復(fù)性高的特點。用戶使用互聯(lián)網(wǎng)信息,往往面對的是大量的重復(fù)性信息,無法快速的獲得所要求的內(nèi)容。

3、信息質(zhì)量參差不齊,有序與無序并存。由于互聯(lián)網(wǎng)的開放性和自由性,網(wǎng)絡(luò)信息的發(fā)布缺少質(zhì)量控制和管理機制,網(wǎng)絡(luò)上的很多資源并沒有經(jīng)過審核,使得網(wǎng)絡(luò)信息繁雜、混亂,質(zhì)量參差不齊,給用戶選擇帶來困難。

為了加強互聯(lián)網(wǎng)信息利用的效率,關(guān)鍵詞檢索、單詞匹配技術(shù)對于篩選有用信息具有重要的作用。互聯(lián)網(wǎng)環(huán)境下所用到的關(guān)鍵詞匹配大多是多關(guān)鍵詞匹配,也稱為多模式匹配,是經(jīng)典的算法問題。關(guān)鍵詞匹配的技術(shù)根據(jù)處理對象的不同,分為數(shù)據(jù)流的線性處理和靜態(tài)文檔的索引處理?,F(xiàn)有的關(guān)鍵詞檢索技術(shù)不管采取什么處理模式,都是通過循環(huán)和遍歷來實現(xiàn),目標文本中出現(xiàn)的每個單詞和關(guān)鍵詞進行比對的過程都要占用一個循環(huán),完成整個文本中單詞的匹配需要占用大量的計算資源、存儲資源和計算時間。這對于互聯(lián)網(wǎng)環(huán)境下的龐大信息資源的有效利用造成了瓶頸。



技術(shù)實現(xiàn)要素:

本發(fā)明提供一種網(wǎng)頁關(guān)鍵詞匹配的方法和系統(tǒng),利用JavaScript自帶函數(shù)實現(xiàn)關(guān)鍵詞比對,能夠快速實現(xiàn)網(wǎng)頁文本中單詞和關(guān)鍵詞的匹配,大量節(jié)約了計算資源、存儲資源和計算時間,提高了網(wǎng)頁文本信息利用的效率。

本發(fā)明的技術(shù)方案提供了一種網(wǎng)頁關(guān)鍵詞匹配的方法,包括以下步驟:

設(shè)置關(guān)鍵詞;

網(wǎng)頁JavaScript腳本中添加對象retrieval();

網(wǎng)頁自動把所述關(guān)鍵詞設(shè)置為所述retrieval()對象的屬性的值;

網(wǎng)頁JavaScript腳本自動識別目標文本中的每個單詞;

網(wǎng)頁JavaScript腳本將目標文本中的每個單詞與retrieval()對象屬性的值進 行比對;

目標文本中的單詞與retrieval()對象屬性的值相同,則識別該單詞與關(guān)鍵詞匹配。

進一步的,關(guān)鍵詞的數(shù)量為至少1個。

進一步的,關(guān)鍵詞或Retrieval()對象屬性的值是數(shù)字、英文字母、漢字或符號的任意組合。

進一步的,Retrieval()對象屬性的數(shù)量默認為5個。

進一步的,所述目標文本為網(wǎng)頁中的所有文本,JavaScript腳本將網(wǎng)頁中的所有文本進行分析,自動分離出獨立的單詞。

進一步的,目標文本中與關(guān)鍵詞匹配的單詞在網(wǎng)頁中顯示用彩色陰影標識出。

進一步的,目標文本中無匹配單詞,則彈窗顯示無匹配結(jié)果。

本發(fā)明的技術(shù)方案還提供了一種網(wǎng)頁關(guān)鍵詞匹配的系統(tǒng),其特征在于,包括:關(guān)鍵詞輸入單元,網(wǎng)頁單詞獲取單元,匹配單元,顯示單元,其中,

關(guān)鍵詞輸入單元用于獲取關(guān)鍵詞;

網(wǎng)頁單詞獲取單元用于對目標文本進行分析,分離出文本中的每個單詞;

匹配單元用于將所述文本中的單詞與關(guān)鍵詞進行匹配,如果匹配成功,則確定此單詞與關(guān)鍵詞相同,生成一個匹配結(jié)果;

顯示單元用于在網(wǎng)頁上將與關(guān)鍵詞匹配的單詞用彩色陰影標識顯示出來。

進一步的,在網(wǎng)頁JavaScript腳本中添加retrieval()對象,并把關(guān)鍵詞賦值為retrieval()對象的屬性的值。

進一步的,所述匹配單元是將目標文本中分離出的單詞與retrieval()對象的屬性值進行比對,如果相同則確認為匹配成功。

本發(fā)明技術(shù)方案采用JavaScript自帶函數(shù)實現(xiàn)關(guān)鍵詞比對,避免了經(jīng)典的關(guān)鍵詞匹配算法中所需要的大量的對比循環(huán)和遍歷流程,充分利用了計算機編程語言自帶函數(shù)的高效性,大大節(jié)約了對計算資源、存儲資源的占用,節(jié)約了匹配處理流程的時間,為有效利用網(wǎng)頁文本信息提供了有力的工具,提高了對網(wǎng)頁文本信息資源利用的效率。

本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。

下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細描述。

附圖說明

附圖用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:

圖1為本發(fā)明實施例一中網(wǎng)頁關(guān)鍵詞匹配的方法流程圖;

圖2為本發(fā)明實施例一中網(wǎng)頁關(guān)鍵詞匹配的系統(tǒng)結(jié)構(gòu)圖。

具體實施方式

以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應(yīng)當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。

圖1為本發(fā)明實施例一中網(wǎng)頁關(guān)鍵詞匹配的方法流程圖。如圖1所示,該該網(wǎng)頁關(guān)鍵詞匹配的方法的流程包括以下步驟:

步驟101:設(shè)置關(guān)鍵詞。

所設(shè)置的關(guān)鍵詞的數(shù)量為至少1個,不超過5個;

關(guān)鍵詞是數(shù)字、英文字母、漢字或符號的任意組合,可以是純數(shù)字、純字母、純漢字,或者數(shù)字、英文字母、漢字與符號的組合,單純符號不能作為關(guān) 鍵詞。

步驟102:網(wǎng)頁JavaScript腳本中添加對象retrieval()。

JavaScript腳本是以對象為基礎(chǔ)的計算機語言,添加retrieval()函數(shù),作為關(guān)鍵詞匹配的檢索入口。

步驟103:網(wǎng)頁自動把所述關(guān)鍵詞設(shè)置為所述retrieval()對象的屬性的值。

Retrieval()對象屬性的值與關(guān)鍵詞的取值范圍相同,可以是純數(shù)字、純字母、純漢字,或者數(shù)字、英文字母、漢字與符號的組合,單純符號不能作為屬性值;

Retrieval()對象屬性的數(shù)量默認為5個;

關(guān)鍵詞輸入完成后,點擊確認,網(wǎng)頁腳本自動賦值給retrieval()對象屬性,使得retrieval()對象屬性的值等于關(guān)鍵詞。

步驟104:網(wǎng)頁JavaScript腳本自動識別目標文本中的每個單詞。

目標文本為網(wǎng)頁中的所有文本,網(wǎng)頁中所有的文字都會作為關(guān)鍵詞匹配的分析對象;

JavaScript腳本將網(wǎng)頁中的所有文本進行分析,自動分離出獨立的單詞,并剔除掉“的”、“地”、“得”等助詞、“吧”、“嗎”、“啊”等嘆詞。

步驟105:網(wǎng)頁JavaScript腳本將目標文本中的每個單詞與retrieval()對象屬性的值進行比對。

目標文本中分離出單詞后,匹配單元將每個單詞與retrieval()對象屬性的值進行比對。

步驟106:網(wǎng)頁顯示匹配結(jié)果。

根據(jù)步驟105的比對結(jié)果,目標文本中與關(guān)鍵詞匹配的單詞在網(wǎng)頁中顯示用彩色陰影標識出;

相同的單詞用相同的顏色陰影,不同的單詞之間用不同的顏色區(qū)分;

目標文本中無匹配單詞,則彈窗顯示無匹配結(jié)果。

為了實現(xiàn)上述網(wǎng)頁關(guān)鍵詞匹配的流程,本實施例還提供了一種網(wǎng)頁關(guān)鍵詞匹配的系統(tǒng),圖2為本發(fā)明實施例一中網(wǎng)頁關(guān)鍵詞匹配的系統(tǒng)結(jié)構(gòu)圖。

如圖2所示,該系統(tǒng)包括:關(guān)鍵詞輸入單元201,網(wǎng)頁單詞獲取單元202,匹配單元203,顯示單元204,其中,

關(guān)鍵詞輸入單元用于輸入關(guān)鍵詞;

網(wǎng)頁單詞獲取單元用于對目標文本進行分析,分離出文本中的每個單詞;

匹配單元用于將所述文本中的單詞與關(guān)鍵詞進行匹配,如果匹配成功,則確定此單詞與關(guān)鍵詞相同,生成一個匹配結(jié)果;

顯示單元用于在網(wǎng)頁上將與關(guān)鍵詞匹配的結(jié)果顯示出來,與關(guān)鍵詞相同的單詞用彩色陰影標識顯示出來,無匹配結(jié)果則顯示無匹配結(jié)果。

進一步的,在網(wǎng)頁JavaScript腳本中添加retrieval()對象,并把關(guān)鍵詞賦值為retrieval()對象屬性的值,作為文本單詞比對的對象,對象屬性的數(shù)量默認為5個。

進一步的,匹配單元是將目標文本中分離出的單詞與retrieval()對象屬性的值進行比對,如果相同則確認為匹配成功。

上述實施例中的技術(shù)方案由于采用JavaScript自帶函數(shù)實現(xiàn)關(guān)鍵詞比對,避免了經(jīng)典的關(guān)鍵詞匹配算法中所需要的大量的對比循環(huán)和遍歷流程,充分利用了計算機編程語言自帶函數(shù)的高效性,大大節(jié)約了對計算資源、存儲資源的占用,節(jié)約了匹配處理流程的時間,為有效利用網(wǎng)頁文本信息提供了有力的工具,提高了對網(wǎng)頁文本信息資源利用的效率。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。

本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1