本發(fā)明涉及信息檢索技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)頁搜索方法和裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)的普及和發(fā)展,越來越多人利用網(wǎng)絡(luò)進(jìn)行信息的檢索?;ヂ?lián)網(wǎng)發(fā)展至今,網(wǎng)絡(luò)上的信息量非常龐大,人們利用搜索引擎在互聯(lián)網(wǎng)上進(jìn)行信息檢索,搜索引擎對搜索結(jié)果進(jìn)行整理和排序,然后將搜索結(jié)果反饋給用戶。
目前,用戶利用搜索引擎進(jìn)行信息檢索時(shí),搜索引擎與用戶的交互僅停留在用戶輸入的搜索關(guān)鍵詞中,或者部分利用了用戶的瀏覽日志等信息來優(yōu)化搜索結(jié)果。
現(xiàn)有技術(shù)中,搜索引擎呈現(xiàn)給用戶的搜索結(jié)果,往往存在用戶所需的網(wǎng)頁排序較為靠后的情況,導(dǎo)致用戶不能有效定位到所需的網(wǎng)頁,增加了用戶獲取目標(biāo)信息的時(shí)間,降低了用戶的體驗(yàn)度。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的第一個(gè)目的在于提出一種網(wǎng)頁搜索方法,以實(shí)現(xiàn)通過計(jì)算第二網(wǎng)頁和用戶搜索意圖之間的相關(guān)性,對搜索結(jié)果實(shí)現(xiàn)重新排序,以快速定位到用戶需求的信息,解決了現(xiàn)有技術(shù)中因?yàn)闆]有充分考慮用戶的搜索意圖,導(dǎo)致用戶獲取需求信息的時(shí)間較長,用戶體驗(yàn)度差的技術(shù)問題。
本發(fā)明的第二個(gè)目的在于提出一種網(wǎng)頁搜索裝置。
本發(fā)明的第三個(gè)目的在于提出一種計(jì)算機(jī)設(shè)備。
本發(fā)明的第四個(gè)目的在于提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì)。
為達(dá)上述目的,本發(fā)明第一方面實(shí)施例提出了一種網(wǎng)頁搜索方法,包括:
獲取搜索的關(guān)鍵字;
根據(jù)關(guān)鍵字進(jìn)行搜索,得到匹配網(wǎng)頁,以及匹配網(wǎng)頁的排序;
當(dāng)用戶選取匹配網(wǎng)頁中的第一網(wǎng)頁進(jìn)行標(biāo)注之后,獲取第一網(wǎng)頁的標(biāo)注;其中,標(biāo)注,用于指示第一網(wǎng)頁與采用關(guān)鍵字搜索的搜索意圖之間的相關(guān)性;
根據(jù)匹配網(wǎng)頁中的第二網(wǎng)頁與標(biāo)注為相關(guān)的第一網(wǎng)頁之間的相關(guān)程度,和/或根據(jù)第二網(wǎng)頁與標(biāo)注為無關(guān)的第一網(wǎng)頁之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度;
根據(jù)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,對第二網(wǎng)頁進(jìn)行重新排序。
本發(fā)明實(shí)施例的一種網(wǎng)頁搜索方法,其中,獲取搜索的關(guān)鍵字;根據(jù)關(guān)鍵字進(jìn)行搜索,得到匹配網(wǎng)頁,以及匹配網(wǎng)頁的排序;用戶選取匹配網(wǎng)頁中的第一網(wǎng)頁進(jìn)行標(biāo)注;根據(jù)匹配網(wǎng)頁中的第二網(wǎng)頁與標(biāo)注為相關(guān)的第一網(wǎng)頁之間的相關(guān)程度,和/或根據(jù)第二網(wǎng)頁與標(biāo)注為無關(guān)的第一網(wǎng)頁之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與所述搜索意圖之間的相關(guān)程度;根據(jù)該相關(guān)程度,對第二網(wǎng)頁進(jìn)行重新排序。用戶根據(jù)搜索意圖對搜索結(jié)果中的匹配網(wǎng)頁進(jìn)行標(biāo)注,并根據(jù)計(jì)算得到的相關(guān)程度對第二網(wǎng)頁進(jìn)行重新排序,其充分考慮了用戶的搜索意圖,能幫助用戶快速定位到有用的信息,降低了用戶獲取有用信息的時(shí)間,提高了用戶的體驗(yàn)度。
為達(dá)上述目的,本發(fā)明第二方面實(shí)施例提出了一種網(wǎng)頁搜索裝置,包括:
獲取模塊,用于獲取搜索的關(guān)鍵字;
搜索模塊,用于根據(jù)關(guān)鍵字進(jìn)行搜索,得到匹配網(wǎng)頁,以及匹配網(wǎng)頁的排序;
標(biāo)注模塊,用于當(dāng)用戶選取匹配網(wǎng)頁中的第一網(wǎng)頁進(jìn)行標(biāo)注之后,獲取第一網(wǎng)頁的標(biāo)注;其中,所述標(biāo)注,用于指示第一網(wǎng)頁與采用關(guān)鍵字搜索的搜索意圖之間的相關(guān)性;
計(jì)算模塊,用于根據(jù)匹配網(wǎng)頁中的第二網(wǎng)頁與標(biāo)注為相關(guān)的第一網(wǎng)頁之間的相關(guān)程度,和/或根據(jù)第二網(wǎng)頁與標(biāo)注為無關(guān)的第一網(wǎng)頁之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度;
重排序模塊,用于根據(jù)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,對第二網(wǎng)頁進(jìn)行重新排序。
本發(fā)明實(shí)施例的一種網(wǎng)頁搜索裝置,其中,獲取模塊,用于獲取搜索的關(guān)鍵字;搜索模塊,用于根據(jù)關(guān)鍵字進(jìn)行搜索,得到匹配網(wǎng)頁,以及匹配網(wǎng)頁的排序;標(biāo)注模塊,用于當(dāng)用戶選取匹配網(wǎng)頁中的第一網(wǎng)頁進(jìn)行標(biāo)注之后,獲取第一網(wǎng)頁的標(biāo)注;其中,所述標(biāo)注,用于指示第一網(wǎng)頁與采用關(guān)鍵字搜索的搜索意圖之間的相關(guān)性;計(jì)算模塊,用于根據(jù)匹配網(wǎng)頁中的第二網(wǎng)頁與標(biāo)注為相關(guān)的第一網(wǎng)頁之間的相關(guān)程度,和/或根據(jù)第二網(wǎng)頁與標(biāo)注為無關(guān)的第一網(wǎng)頁之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度;重排序模塊,用于根據(jù)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,對第二網(wǎng)頁進(jìn)行重新排序。用戶根據(jù)搜索意圖對搜索結(jié)果中的匹配網(wǎng)頁進(jìn)行標(biāo)注,并根據(jù)計(jì)算得到的相關(guān)程度對第二網(wǎng)頁進(jìn)行重新排序,其充分考慮了用戶的搜索意圖,能幫助用戶快速定位到有用的信息,降低了用戶獲取有用信息的時(shí)間,提高了用戶的體驗(yàn)度。
為達(dá)上述目的,本發(fā)明第三方面實(shí)施例提出了一種計(jì)算機(jī)設(shè)備,包括:存儲器,處理器以及存儲在存儲器中并可在處理器上運(yùn)行的計(jì)算機(jī)程序,當(dāng)處理器執(zhí)行該計(jì)算機(jī)程序時(shí),用于執(zhí)行第一方面所述的網(wǎng)頁搜索方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明第四方面實(shí)施例提出了一種非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí),用于執(zhí)行第一方面所述的網(wǎng)頁搜索方法。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1為本發(fā)明實(shí)施例所提供的一種網(wǎng)頁搜索方法的流程示意圖;
圖2為本發(fā)明實(shí)施例所提供的一種估算網(wǎng)頁和搜索意圖相關(guān)程度的方法的流程示意圖;
圖3為本實(shí)施例提出的一種網(wǎng)頁正文文本提取方法的流程示意圖;
圖4為本實(shí)施例提出的一種去除包含大量鏈接節(jié)點(diǎn)的方法的流程示意圖;
圖5為本發(fā)明實(shí)施例提供的一種網(wǎng)頁搜索裝置的結(jié)構(gòu)示意圖;
圖6為本發(fā)明實(shí)施例提供的另一種網(wǎng)頁搜索裝置的結(jié)構(gòu)示意圖;以及
圖7為本發(fā)明實(shí)施例所提供的提取單元341的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
下面參考附圖描述本發(fā)明實(shí)施例的網(wǎng)頁搜索方法和裝置。
圖1為本發(fā)明實(shí)施例所提供的一種網(wǎng)頁搜索方法的流程示意圖,如圖1所示,該方法包括以下步驟:
步驟s1,獲取搜索的關(guān)鍵字。
具體地,在搜索引擎的用戶輸入界面,用戶根據(jù)需求輸入關(guān)鍵字進(jìn)行信息查詢,搜索引擎識別出用戶輸入的關(guān)鍵字。
步驟s2,根據(jù)關(guān)鍵字進(jìn)行搜索,得到匹配網(wǎng)頁,以及匹配網(wǎng)頁的排序。
具體地,搜索引擎根據(jù)用戶輸入的關(guān)鍵字,在數(shù)據(jù)庫中利用網(wǎng)絡(luò)爬蟲技術(shù)進(jìn)行信息的查詢,查詢到和用戶輸入的關(guān)鍵字匹配的網(wǎng)頁后,計(jì)算出網(wǎng)頁和用戶搜素意圖之間的相關(guān)度,得到匹配網(wǎng)頁的排序,記錄下得到的每一條匹配網(wǎng)頁對應(yīng)的初始排序,并將匹配網(wǎng)頁在用戶的展示界面中按照初始排序展現(xiàn)出來。
其中,搜索引擎根據(jù)獲得的用戶輸入的關(guān)鍵字,利用網(wǎng)絡(luò)爬蟲技術(shù)搜索目標(biāo)網(wǎng)頁,作為一種可能的實(shí)現(xiàn)方式,調(diào)用搜索引擎時(shí)采用查(get)請求方式,在請求統(tǒng)一資源定位符(uniformresourelocator,url)后面以問號(?)的形式加上發(fā)給服務(wù)器的參數(shù),多個(gè)參數(shù)之間用符號&隔開,搜索引擎會基于url中提交的參數(shù)進(jìn)行分析,獲得對應(yīng)的搜索結(jié)果,如使用百度搜索關(guān)鍵詞“清華大學(xué)”,則訪問:“http://www.baidu.com/s?q1=清華大學(xué)”即可。其他用于限定網(wǎng)頁更新時(shí)間等的高級搜索參數(shù),也可在url后面添加相應(yīng)的參數(shù)來實(shí)現(xiàn),例如,使用百度搜索限定要搜索的網(wǎng)頁的時(shí)間和每頁顯示的條數(shù),則訪問:http://www.baidu.com/s?q1=清華大學(xué)&lm=7&rn=5,即搜索清華大學(xué),最近一周內(nèi)的網(wǎng)頁,且每頁顯示的條數(shù)是5條。
步驟s3,當(dāng)用戶選取匹配網(wǎng)頁中的第一網(wǎng)頁進(jìn)行標(biāo)注后,獲取第一網(wǎng)頁的標(biāo)注。
具體地,用戶根據(jù)和搜索需求相關(guān)度大小的原則,對返回給用戶的匹配網(wǎng)頁進(jìn)行標(biāo)注,并將被標(biāo)注的網(wǎng)頁信息返回給搜索引擎,其中被用戶標(biāo)注的網(wǎng)頁被稱為第一網(wǎng)頁。需要說明的是,被用戶標(biāo)注的第一網(wǎng)頁中,有和用戶搜索需求相關(guān)的網(wǎng)頁,也有和用戶的搜素需求無關(guān)的網(wǎng)頁,為了便于區(qū)分,將和用戶搜索需求相關(guān)的匹配網(wǎng)頁命名為相關(guān)的第一網(wǎng)頁,和用戶搜索需求無關(guān)的匹配網(wǎng)頁命名為無關(guān)的第一網(wǎng)頁。
進(jìn)一步,用戶對匹配網(wǎng)頁進(jìn)行標(biāo)注,是在搜索引擎系統(tǒng)生成并顯示的交互頁面中完成的,該交互頁面顯示所有匹配頁面的鏈接,以及用于進(jìn)行標(biāo)注的復(fù)選框。在復(fù)選框中設(shè)置有勾選按鈕,在每一個(gè)匹配頁面旁設(shè)置“相關(guān)”和“無關(guān)”的兩種勾選按鈕,如果該頁面是和搜索需求相關(guān)的頁面,則勾選“相關(guān)”按鈕,將該頁面設(shè)置為相關(guān)的第一網(wǎng)頁;如果該頁面是和搜索需求無關(guān)的頁面,則勾選“無關(guān)”按鈕,將該頁面設(shè)置為無關(guān)的第一網(wǎng)頁。需要說明的是,相關(guān)的第一網(wǎng)頁和無關(guān)的第一網(wǎng)頁是用戶根據(jù)搜索需求由用戶勾選確定的,其數(shù)量可以為一個(gè)或者為多個(gè)。
步驟s4,根據(jù)匹配網(wǎng)頁中的第二網(wǎng)頁與標(biāo)注為相關(guān)的第一網(wǎng)頁之間的相關(guān)程度和/或根據(jù)第二網(wǎng)頁與標(biāo)注為無關(guān)的第一網(wǎng)頁之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度。
具體地,用戶輸入的關(guān)鍵字即對應(yīng)用戶的搜索意圖,而網(wǎng)頁中的正文文本信息是和用戶搜素意圖相對應(yīng)的,從而,計(jì)算網(wǎng)頁和用戶搜索意圖之間的相關(guān)程度,需要提取網(wǎng)頁的正文文本。
首先,提取第一網(wǎng)頁的正文文本,根據(jù)第一網(wǎng)頁的正文文本、標(biāo)題和簡介,生成第一網(wǎng)頁的文檔,其中,第一網(wǎng)頁的文檔包括標(biāo)注為相關(guān)的第一網(wǎng)頁的文檔,以及標(biāo)注為無關(guān)的第一網(wǎng)頁的文檔。
其次,提取第二網(wǎng)頁的標(biāo)題和簡介,生成第二網(wǎng)頁的文檔。
最后,根據(jù)標(biāo)注為相關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,和/或標(biāo)注為無關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度。
需要說明的是,第二網(wǎng)頁一般來說,是搜索得到的匹配網(wǎng)頁中,除第一網(wǎng)頁以外的網(wǎng)頁。本領(lǐng)域技術(shù)人員可以知曉,具體來說,第二網(wǎng)頁可以是匹配網(wǎng)頁中除第一網(wǎng)頁以外的全部網(wǎng)頁,也可是部分網(wǎng)頁,本實(shí)施例中對此不作限定。
步驟s5,根據(jù)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,對第二網(wǎng)頁進(jìn)行重新排序。
具體地,以第二網(wǎng)頁與搜索意圖之間的相關(guān)程度越大,第二網(wǎng)頁進(jìn)行重新排序后的排序越靠前為原則,對第二網(wǎng)頁進(jìn)行重新排序。
本發(fā)明實(shí)施例的一種網(wǎng)頁搜索方法中,獲取搜索的關(guān)鍵字,根據(jù)關(guān)鍵字進(jìn)行搜索,得到匹配網(wǎng)頁,以及匹配網(wǎng)頁的排序;用戶選取匹配網(wǎng)頁中的第一網(wǎng)頁進(jìn)行標(biāo)注;根據(jù)匹配網(wǎng)頁中的第二網(wǎng)頁與標(biāo)注為相關(guān)的第一網(wǎng)頁之間的相關(guān)程度,和/或根據(jù)第二網(wǎng)頁與標(biāo)注為無關(guān)的第一網(wǎng)頁之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與所述搜索意圖之間的相關(guān)程度;根據(jù)該相關(guān)程度,對第二網(wǎng)頁進(jìn)行重新排序。用戶根據(jù)搜索意圖對搜索結(jié)果中的匹配網(wǎng)頁進(jìn)行標(biāo)注,并根據(jù)計(jì)算得到的相關(guān)程度對第二網(wǎng)頁進(jìn)行重新排序,其充分考慮了用戶的搜索意圖,能幫助用戶快速定位到有用的信息,降低了用戶獲取有用信息的時(shí)間,提高了用戶的體驗(yàn)度。
為了進(jìn)一步清楚說明上一實(shí)施例中的步驟s4,作為一種可能的實(shí)現(xiàn)方式,圖2為本發(fā)明實(shí)施例所提供的一種估算網(wǎng)頁和搜索意圖相關(guān)程度的方法的流程示意圖。
如圖2所示,步驟s4包括以下步驟:
步驟s41,提取第一網(wǎng)頁的正文文本。
具體地,網(wǎng)頁中包含有很多文本信息,有和用戶搜索需求相關(guān)的文本信息,也有和用戶搜索需求無關(guān)的文本信息,為了便于區(qū)別,將和用戶需求相關(guān)的文本信息稱為正文文本,將和用戶需求無關(guān),不能反映用戶搜索意圖的文本信息,如導(dǎo)航欄、外鏈接和廣告等信息,稱為噪聲文本。為了更加準(zhǔn)確的表征用戶的搜索意圖,需要將無關(guān)的噪聲文本去除,只保留正文文本。
步驟s42,根據(jù)第一網(wǎng)頁的正文文本、標(biāo)題和簡介,生成第一網(wǎng)頁的文檔。
具體地,對于搜索引擎返回的結(jié)果頁面,分別定義不同的查找方式,將結(jié)果頁面中的標(biāo)題,簡介信息提取出來,和提取出的第一網(wǎng)頁的正本文本,生成第一網(wǎng)頁的文檔。其中,第一網(wǎng)頁的文檔包括標(biāo)注為相關(guān)的第一網(wǎng)頁的文檔,以及標(biāo)注為無關(guān)的第一網(wǎng)頁的文檔。
步驟s43,提取第二網(wǎng)頁的標(biāo)題和簡介,生成第二網(wǎng)頁的文檔。
具體地,對于搜索引擎返回的結(jié)果頁面,分別定義不同的查找方式,將結(jié)果頁面中的標(biāo)題,簡介信息提取出來,生成第二網(wǎng)頁的文檔。
需要理解的是,對應(yīng)第二網(wǎng)頁,沒有提取第二網(wǎng)頁的正文文本信息,僅提取第二網(wǎng)頁的標(biāo)題和簡介,目的是為了減少網(wǎng)絡(luò)連接的發(fā)起次數(shù),從而降低系統(tǒng)后臺的處理時(shí)間,使得系統(tǒng)在保證足夠精度的條件下,可以快速響應(yīng)用戶的搜索需求,提高用戶的體驗(yàn)度。
步驟s44,根據(jù)標(biāo)注為相關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,和/或標(biāo)注為無關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度。
具體地,計(jì)算兩個(gè)文檔之間的相似程度,即相關(guān)程度,最常用的方法是將文檔映射成向量,再用兩個(gè)文檔對應(yīng)的向量之間的相似程度來度量兩個(gè)文檔之間的相似度。
作為一種可能的實(shí)現(xiàn)方式,利用詞袋模型將文檔映射成向量,詞袋模型,是自然語言處理中常用的一種將文檔數(shù)據(jù)映射成向量的方法。假設(shè)詞典中共有n個(gè)詞,所有的文檔均由詞典中的這n個(gè)詞構(gòu)成,利用詞袋模型可以將任意一篇文檔映射成一個(gè)n維的向量,向量的第k維對應(yīng)詞典中第k個(gè)詞在該文檔中的權(quán)重。詞語的權(quán)重可以是該詞語在該文檔中出現(xiàn)的頻率,最常用的權(quán)重判斷方法是根據(jù)該詞語在該文檔中的詞頻-逆向文件頻率(termfrequency–inversedocumentfrequency,tf-idf)值來判斷。其中,詞頻(termfrequency,tf),是指某個(gè)詞在文檔中出現(xiàn)的頻率,出現(xiàn)的頻率越高,說明該詞越重要,權(quán)重越大,tf的值越大;逆向文件頻率(inversedocumentfrequency,idf),是指對于常見的詞賦予較小的權(quán)重,對于不常見的詞賦予較大的權(quán)重,即idf的大小與一個(gè)詞的常見程度是成反比的。一個(gè)詞的tf-idf值即將tf乘以idf,值越大表示該詞在文檔中的權(quán)重越高。
需要理解的是,計(jì)算tf-idf值之前,需要首先對文檔進(jìn)行分詞處理,利用現(xiàn)有的分詞工具將文檔轉(zhuǎn)換成詞語的集合,然后統(tǒng)計(jì)每個(gè)詞語在該文檔中出現(xiàn)的次數(shù),計(jì)算該詞語的tf-idf值,從而得到該文檔的向量化表示。
需要說明的是,在實(shí)際應(yīng)用中,系統(tǒng)中使用的詞典大小約為30萬詞,基本能囊括大部分的中文詞語,但是由于網(wǎng)絡(luò)上不斷出現(xiàn)新詞,加上分詞工具可能存在的分詞錯(cuò)誤,分詞結(jié)果中可能出現(xiàn)少量詞典中不存在的詞,對于這些詞,系統(tǒng)采用直接舍去的策略。
作為另一種可能的實(shí)現(xiàn)方式,利用分布式向量表示模型將文檔映射成向量,詞的分布式表示,俗稱詞向量,是指將詞典中的每個(gè)詞語映射成向量空間中的一個(gè)實(shí)值向量,一般可以通過訓(xùn)練“神經(jīng)語言”模型得到,向量的維數(shù)可以根據(jù)需要在訓(xùn)練時(shí)進(jìn)行調(diào)整設(shè)置。訓(xùn)練得到的“詞向量”能很好的表征詞語的語義信息,語義信息相近的詞在向量空間中“距離”相近。有了詞的向量表示后,可以有多種方法擴(kuò)展到文檔的向量表示。作為一種可能的實(shí)現(xiàn)方式,系統(tǒng)采用將詞的向量表示加權(quán)平均的方法獲得文檔的向量表示,首先使用預(yù)先采集好的語料訓(xùn)練得到詞向量;然后采用分詞工具對文檔進(jìn)行分詞處理,統(tǒng)計(jì)每個(gè)詞的tf-idf值;將這些詞語的詞向量以tf-idf值為權(quán)值加權(quán)平均得到文檔向量。
進(jìn)一步,利用詞袋模型,可以將標(biāo)注為相關(guān)的第一網(wǎng)頁文檔向量化表示為v相關(guān)1,將標(biāo)注為無關(guān)的第一網(wǎng)頁文檔向量化表示為v無關(guān)1,將第二網(wǎng)頁文檔向量化表示為v結(jié)果1;利用分布式向量表示模型,可以將標(biāo)注為相關(guān)的第一網(wǎng)頁文檔向量化表示為v相關(guān)2,將標(biāo)注為無關(guān)的第一網(wǎng)頁文檔向量化表示為v無關(guān)2,將第二網(wǎng)頁文檔向量化表示為v結(jié)果2。
具體地,將第一網(wǎng)頁文檔和第二網(wǎng)頁文檔向量化表示后,即可用文檔向量之間的相似度來度量文檔之間的相似度,作為一種可能的實(shí)現(xiàn)方式,系統(tǒng)采用余弦距離來表示向量之間的相似度,從而,可以利用余弦相似度來計(jì)算v相關(guān)1與v結(jié)果1之間余弦相似度s相關(guān)1;v相關(guān)2與v結(jié)果2之間余弦相似度s相關(guān)2;v無關(guān)1與v結(jié)果1之間余弦相似度s無關(guān)1;v無關(guān)2與v結(jié)果2之間余弦相似度s無關(guān)2。
更進(jìn)一步,根據(jù)得到的第一網(wǎng)頁文檔和第二網(wǎng)頁文檔的余弦相似度,利用公式
其中,α、β、γ為預(yù)設(shè)權(quán)重,n為所述第二網(wǎng)頁在所述匹配網(wǎng)頁中的排序。
最后,根據(jù)計(jì)算得到的第二網(wǎng)頁與搜索意圖之間的相關(guān)程度score的值,對第二網(wǎng)頁進(jìn)行重新排序,并將重新排序后的網(wǎng)頁展現(xiàn)給用戶。其中,score值越大,對應(yīng)的第二網(wǎng)頁進(jìn)行重排序后排序越靠前。
本發(fā)明實(shí)施例中,提取第一網(wǎng)頁的正文文本;根據(jù)第一網(wǎng)頁的正文文本、標(biāo)題和簡介,生成第一網(wǎng)頁文檔;提取第二網(wǎng)頁的標(biāo)題和簡介,生成第二網(wǎng)頁的文檔;根據(jù)標(biāo)注為相關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,和/或根據(jù)標(biāo)注為無關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度。用戶根據(jù)搜索意圖對搜索結(jié)果中的匹配網(wǎng)頁進(jìn)行標(biāo)注,并根據(jù)計(jì)算得到的相關(guān)程度對第二網(wǎng)頁進(jìn)行重新排序,其充分考慮了用戶的搜索意圖,能幫助用戶快速定位到有用的信息,降低了用戶獲取有用信息的時(shí)間,提高了用戶的體驗(yàn)度。
在上一實(shí)施例中,對網(wǎng)頁中包含的文本進(jìn)行提取時(shí),需要將無用的噪聲文本去除,只保留正文文本,但是由于不同的網(wǎng)頁樣式差別較大,沒有統(tǒng)一的文本解析算法,作為一種可能的實(shí)現(xiàn)方式,本實(shí)施例提出了一種網(wǎng)頁正文文本提取方法。
具體地,為了進(jìn)一步清楚的說明上述實(shí)施例中的步驟s41的過程,圖3為本實(shí)施例提出的一種網(wǎng)頁正文文本提取方法的流程示意圖,如圖3所示,步驟s41包括以下步驟:
步驟s411,獲取第一網(wǎng)頁的html文件。
具體地,獲取用戶標(biāo)注的第一網(wǎng)頁的html文件,根據(jù)文檔對象模型(documentobjectmodel,dom),html文件中的每個(gè)成分都是一個(gè)節(jié)點(diǎn),而所有信息均保存在html文件中的不同節(jié)點(diǎn)中。其中,整個(gè)文檔是一個(gè)文檔節(jié)點(diǎn);每個(gè)html標(biāo)簽是一個(gè)元素節(jié)點(diǎn);每個(gè)html屬性是一個(gè)屬性節(jié)點(diǎn);注釋是注釋節(jié)點(diǎn)。
步驟s412,去除html文件中對應(yīng)控制、顯示樣式和/或注釋的節(jié)點(diǎn)。
具體地,提取正文文本時(shí),對應(yīng)控制、顯示樣式和/或注釋的節(jié)點(diǎn)中不包含文本信息,和用戶的搜索需求無關(guān),在提取正文文本時(shí),需要將這些不含正文文本信息的節(jié)點(diǎn)去除,這些需要去除的節(jié)點(diǎn)至少包含以下節(jié)點(diǎn):
去除<script>節(jié)點(diǎn),該節(jié)點(diǎn)用于定義客戶端腳本;
去除<noscript>節(jié)點(diǎn),該節(jié)點(diǎn)用于定義在腳本未被執(zhí)行時(shí)的替代內(nèi)容(文本);
去除<style>節(jié)點(diǎn),該節(jié)點(diǎn)用于為html文檔定義樣式信息;
去除<span>節(jié)點(diǎn),該節(jié)點(diǎn)用于組合文檔中的行內(nèi)元素;
去除<meta>節(jié)點(diǎn),該節(jié)點(diǎn)用于提供有關(guān)頁面的元信息(meta-information),比如針對搜索引擎和更新頻度的描述和關(guān)鍵詞;
去除包含“style=displaynone”屬性的節(jié)點(diǎn),該節(jié)點(diǎn)用于在網(wǎng)頁中隱藏對象,且不為被隱藏的對象保留物理空間;
去除注釋節(jié)點(diǎn),指源代碼中插入的注釋。
步驟s413,根據(jù)html文件中的各節(jié)點(diǎn)所含的鏈接的數(shù)量,確定包含文本內(nèi)容的節(jié)點(diǎn)。
具體地,考慮到頁面的導(dǎo)航欄、廣告等部分一般包含較多的鏈接,而正文文本一般包含較少的鏈接或不含鏈接,因此可以根據(jù)節(jié)點(diǎn)內(nèi)及節(jié)點(diǎn)周圍鏈接節(jié)點(diǎn)的數(shù)量來判斷該節(jié)點(diǎn)的文本內(nèi)容是否屬于正文文本,如果該節(jié)點(diǎn)內(nèi)及節(jié)點(diǎn)周圍包含較多鏈接,則判斷該節(jié)點(diǎn)的文本不是正文文本,需要刪除,否則,判斷該節(jié)點(diǎn)的文本是正文文本,需要保留。
步驟s414,根據(jù)包含文本內(nèi)容的節(jié)點(diǎn),生成第一網(wǎng)頁的正文文本。
具體地,去除html文件中對應(yīng)控制、顯示樣式和/或注釋的節(jié)點(diǎn),以及去除包含鏈接較多的節(jié)點(diǎn)后,刪除html文件中多余的空格、標(biāo)簽,提取出剩余節(jié)點(diǎn)的文本內(nèi)容即得到頁面的正文文本信息。
為進(jìn)一步清楚的解釋步驟s413中去除包含大量鏈接的節(jié)點(diǎn)的過程,作為一種可能的實(shí)現(xiàn)方式,圖4為本實(shí)施例提出的一種去除包含大量鏈接節(jié)點(diǎn)的方法的流程示意圖,包括以下步驟:
步驟s4131,找出html文件中所有的<a>節(jié)點(diǎn)。
其中,<a>節(jié)點(diǎn)是指超鏈接節(jié)點(diǎn)。對于每一個(gè)<a>節(jié)點(diǎn),執(zhí)行如下步驟的操作。
步驟s4132,找出該<a>節(jié)點(diǎn)的父節(jié)點(diǎn),記為parent,并初始化變量temp=null。
具體地,對于每一個(gè)<a>節(jié)點(diǎn)來講,均有一個(gè)唯一的父節(jié)點(diǎn),temp是指臨時(shí)變量。
步驟s4133,找出parent下的所有<a>節(jié)點(diǎn),計(jì)算parent下所有<a>節(jié)點(diǎn)的字符長度總和la,并計(jì)算parent的字符長度lp。
具體地,每一個(gè)parent父節(jié)點(diǎn)下可能有多個(gè)子節(jié)點(diǎn)<a>,多個(gè)子節(jié)點(diǎn)<a>之間是同級的關(guān)系,通過統(tǒng)計(jì)parent父節(jié)點(diǎn)下所有子節(jié)點(diǎn)<a>的字符長度總和,判斷parent節(jié)點(diǎn)是否包含較多超鏈接節(jié)點(diǎn),是否為需要刪除的噪聲節(jié)點(diǎn)。
步驟s4134,判斷l(xiāng)a/lp是否大于一個(gè)預(yù)先設(shè)定好的閾值t,如果是,則執(zhí)行步驟s4135,否則執(zhí)行步驟s4136。
具體地,若la/lp的值大于預(yù)設(shè)的閾值t,則認(rèn)為該parent節(jié)點(diǎn)是包含大量鏈接的節(jié)點(diǎn),屬于需要刪除的噪聲節(jié)點(diǎn),將parent賦值給temp,同時(shí)將指針指向parent節(jié)點(diǎn)的父節(jié)點(diǎn);若la/lp的值小于等于預(yù)設(shè)的閾值t,則認(rèn)為該節(jié)點(diǎn)屬于文本節(jié)點(diǎn),不需要刪除。
步驟s4135,將parent賦值給temp,并令parent指向parent節(jié)點(diǎn)的父節(jié)點(diǎn),同時(shí)返回執(zhí)行步驟s4133。
步驟s4136,若temp不是null,則刪除temp,若temp是null,則保留temp。然后返回步驟s4132。
需要說明的是,無論是否刪除temp,均返回執(zhí)行步驟s4132,處理下一個(gè)<a>節(jié)點(diǎn),直到處理完步驟s4131找出的所有<a>節(jié)點(diǎn)為止。
在圖3和圖4對應(yīng)的實(shí)施例中,從獲得的html文件中提取正文文本信息,得到相關(guān)的第一網(wǎng)頁的文檔和無關(guān)的第一網(wǎng)頁的文檔。另外,提取第二網(wǎng)頁的標(biāo)題和簡介得到第二網(wǎng)頁的文檔,并根據(jù)標(biāo)注為相關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,和/或根據(jù)標(biāo)注為無關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,根據(jù)計(jì)算得到的相關(guān)程度對第二網(wǎng)頁進(jìn)行重新排序,其充分考慮了用戶的搜索意圖,能幫助用戶快速定位到有用的信息,降低了用戶獲取有用信息的時(shí)間,提高了用戶的體驗(yàn)度。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種網(wǎng)頁搜索的裝置。
圖5為本發(fā)明實(shí)施例提供的一種網(wǎng)頁搜索裝置的結(jié)構(gòu)示意圖。
如圖5所示,該網(wǎng)頁搜索裝置包括:獲取模塊31、搜索模塊32、標(biāo)注模塊33、計(jì)算模塊34和重排序模塊35。
獲取模塊31,用于獲取搜索的關(guān)鍵字。
搜索模塊32,用于根據(jù)關(guān)鍵字進(jìn)行搜索,得到匹配網(wǎng)頁,以及匹配網(wǎng)頁的排序。
標(biāo)注模塊33,用于當(dāng)用戶選取匹配網(wǎng)頁中的第一網(wǎng)頁進(jìn)行標(biāo)注之后,獲取第一網(wǎng)頁的標(biāo)注;其中,標(biāo)注,用于指示第一網(wǎng)頁與采用關(guān)鍵字搜索的搜索意圖之間的相關(guān)性。
計(jì)算模塊34,用于根據(jù)匹配網(wǎng)頁中的第二網(wǎng)頁與標(biāo)注為相關(guān)的第一網(wǎng)頁之間的相關(guān)程度,和/或根據(jù)第二網(wǎng)頁與標(biāo)注為無關(guān)的第一網(wǎng)頁之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度。
重排序模塊35,用于根據(jù)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,對第二網(wǎng)頁進(jìn)行重新排序。
其中,作為一種可能的實(shí)現(xiàn)方式,重排序模塊35,具體用于以第二網(wǎng)頁與搜索意圖之間的相關(guān)程度越大,第二網(wǎng)頁進(jìn)行重排序后的排序越靠前為原則,對第二網(wǎng)頁進(jìn)行重新排序。
本發(fā)明實(shí)施例中,獲取模塊,用于獲取搜索的關(guān)鍵字;搜索模塊,用于根據(jù)關(guān)鍵字進(jìn)行搜索,得到匹配網(wǎng)頁,以及匹配網(wǎng)頁的排序;標(biāo)注模塊,用于當(dāng)用戶選取匹配網(wǎng)頁中的第一網(wǎng)頁進(jìn)行標(biāo)注之后,獲取第一網(wǎng)頁的標(biāo)注;其中,所述標(biāo)注,用于指示第一網(wǎng)頁與采用關(guān)鍵字搜索的搜索意圖之間的相關(guān)性;計(jì)算模塊,用于根據(jù)匹配網(wǎng)頁中的第二網(wǎng)頁與標(biāo)注為相關(guān)的第一網(wǎng)頁之間的相關(guān)程度,和/或根據(jù)第二網(wǎng)頁與標(biāo)注為無關(guān)的第一網(wǎng)頁之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度;重排序模塊,用于根據(jù)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,對第二網(wǎng)頁進(jìn)行重新排序。用戶根據(jù)搜索意圖對搜索結(jié)果中的匹配網(wǎng)頁進(jìn)行標(biāo)注,并根據(jù)計(jì)算得到的相關(guān)程度對第二網(wǎng)頁進(jìn)行重新排序,其充分考慮了用戶的搜索意圖,能幫助用戶快遞定位到有用的信息,降低了用戶獲取有用信息的時(shí)間,提高了用戶的體驗(yàn)度。
需要說明的是,前述對方法實(shí)施例的解釋說明也適用于本實(shí)施例的裝置,此處不再贅述。
基于上述實(shí)施例,本發(fā)明實(shí)施例還提供了另一種網(wǎng)頁搜素裝置的可能的實(shí)現(xiàn)方式,圖6為本發(fā)明實(shí)施例提供的另一種網(wǎng)頁搜索裝置的結(jié)構(gòu)示意圖,在上一實(shí)施例的基礎(chǔ)上,網(wǎng)頁搜索裝置還包括:交互顯示模塊36,用于生成并顯示交互頁面,其中,交互頁面顯示有匹配頁面的鏈接,以及用于獲取標(biāo)注的復(fù)選框。
另外,在上一實(shí)施例的基礎(chǔ)上,計(jì)算模塊34包括:提取單元341、生成單元342、提取生成單元343和計(jì)算單元344。
提取單元341,用于提取第一網(wǎng)頁的正文文本。
生成單元342,用于根據(jù)第一網(wǎng)頁的正文文本、標(biāo)題和簡介,生成第一網(wǎng)頁的文檔;其中,第一網(wǎng)頁的文檔包括標(biāo)注為相關(guān)的第一網(wǎng)頁的文檔,以及標(biāo)注為無關(guān)的第一網(wǎng)頁的文檔。
提取生成單元343,用于提取第二網(wǎng)頁的標(biāo)題和簡介,生成第二網(wǎng)頁的文檔。
計(jì)算單元344,用于根據(jù)標(biāo)注為相關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,和/或標(biāo)注為無關(guān)的第一網(wǎng)頁的文檔與第二網(wǎng)頁的文檔之間的相關(guān)程度,估計(jì)第二網(wǎng)頁與搜索意圖之間的相關(guān)程度。
其中,作為一種可能的實(shí)現(xiàn)方式,計(jì)算單元344,具體用于根據(jù)公式
本發(fā)明實(shí)施例中,用戶根據(jù)搜索意圖對搜索結(jié)果中的匹配網(wǎng)頁進(jìn)行標(biāo)注,計(jì)算得到第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,并根據(jù)計(jì)算得到的相關(guān)程度對第二網(wǎng)頁進(jìn)行重新排序,其充分考慮了用戶的搜索意圖,能幫助用戶快遞定位到有用的信息,降低了用戶獲取有用信息的時(shí)間,提高了用戶的體驗(yàn)度。
需要說明的是,前述對方法實(shí)施例的解釋說明也適用于本發(fā)明實(shí)施例的裝置,此處不再贅述。
基于上述實(shí)施例,作為一種可能的實(shí)現(xiàn)方式,圖7為本發(fā)明實(shí)施例提供的提取單元341的結(jié)構(gòu)示意圖,如7所示,提取單元341包括:獲取子單元3411、去除子單元3412、確定子單元3413和生成子單元3414。
獲取子單元3411,用于獲取第一網(wǎng)頁的html文件。
去除子單元3412,用于去除對應(yīng)控制、顯示樣式和/或注釋的節(jié)點(diǎn)。
確定子單元3413,用于根據(jù)html文件中的各節(jié)點(diǎn)所含的鏈接數(shù)量,確定包含文本內(nèi)容的節(jié)點(diǎn)。
生成子單元3414,用于根據(jù)包含文本內(nèi)容的節(jié)點(diǎn),生成第一網(wǎng)頁的正文文本。
其中,作為一種可能的實(shí)現(xiàn)方式,確定子單元3412,具體用于將所述html文件中的各節(jié)點(diǎn)所含的鏈接的數(shù)量低于預(yù)設(shè)閾值的節(jié)點(diǎn),確定為包含文本內(nèi)容的節(jié)點(diǎn)。
需要說明的是,前述對方法實(shí)施例的解釋說明也適用于本實(shí)施例的裝置,此處不再贅述。
本發(fā)明實(shí)施例中,用戶根據(jù)搜索意圖對搜索結(jié)果中的匹配網(wǎng)頁進(jìn)行標(biāo)注,計(jì)算得到第二網(wǎng)頁與搜索意圖之間的相關(guān)程度,并根據(jù)計(jì)算得到的相關(guān)程度對第二網(wǎng)頁進(jìn)行重新排序,其充分考慮了用戶的搜索意圖,能幫助用戶快遞定位到有用的信息,降低了用戶獲取有用信息的時(shí)間,提高了用戶的體驗(yàn)度。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種計(jì)算機(jī)設(shè)備,包括存儲器、處理器和存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,當(dāng)計(jì)算機(jī)程序被處理器執(zhí)行時(shí),執(zhí)行前述實(shí)施例中的網(wǎng)頁搜索方法。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),當(dāng)存儲介質(zhì)中的程序由處理器執(zhí)行時(shí),執(zhí)行前述實(shí)施例中的網(wǎng)頁搜索方法。
在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不必須針對的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)定制邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說明書而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲器(ram),只讀存儲器(rom),可擦除可編輯只讀存儲器(eprom或閃速存儲器),光纖裝置,以及便攜式光盤只讀存儲器(cdrom)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^對紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來以電子方式獲得所述程序,然后將其存儲在計(jì)算機(jī)存儲器中。
應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。如,如果用硬件來實(shí)現(xiàn)和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現(xiàn)場可編程門陣列(fpga)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中。
上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。