亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

搜索方法和系統(tǒng)的制作方法

文檔序號:6489928閱讀:173來源:國知局
搜索方法和系統(tǒng)的制作方法
【專利摘要】一種搜索方法,包括以下步驟:獲取搜索請求;提取所述搜索請求中包含的搜索詞的核心詞;在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站;返回所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息。由于核心詞過濾了搜索詞中包含的冗余信息,可表示搜索詞的關(guān)鍵信息,核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站很可能是用戶需求的目標網(wǎng)站,不需要用戶在搜索結(jié)果中的眾多網(wǎng)頁信息查找較匹配的網(wǎng)頁信息,然后根據(jù)網(wǎng)頁信息查找到目標網(wǎng)站,因此,上述搜索方法可提高搜索結(jié)果與搜索詞之間的匹配精確度。此外,還提供一種搜索系統(tǒng)。
【專利說明】搜索方法和系統(tǒng)
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及計算機網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別涉及一種搜索方法和系統(tǒng)。
【【背景技術(shù)】】
[0002]隨著計算機網(wǎng)絡(luò)技術(shù)的發(fā)展,人們越來越多的從網(wǎng)絡(luò)上搜索自己需要的信息。搜索引擎根據(jù)用戶輸入的搜索詞進行搜索,并向用戶返回與搜索詞匹配的網(wǎng)頁信息。
[0003]傳統(tǒng)的搜索方法,一般查找包含用戶輸入的整個搜索詞的網(wǎng)頁,并查找包含搜索詞中的分詞以及分詞的組合的網(wǎng)頁,在搜索結(jié)果中,優(yōu)先展示包含整個搜索詞的網(wǎng)頁信息,其次按照網(wǎng)頁中包含的分詞從多到少的順序展示網(wǎng)頁信息。例如,用戶輸入的搜索詞為“找工作的網(wǎng)站有哪些”,則搜索引擎有可能返回包含字串“找工作網(wǎng)站有哪些”的網(wǎng)頁信息,以及返回包含字串“工作”和“哪些”以及搜索詞中其它分詞以及分詞組合的網(wǎng)頁信息。 [0004]傳統(tǒng)的搜索方法向用戶返回包含搜索詞以及搜索詞的分詞和分詞組合的網(wǎng)頁信息,一方面,如果用戶輸入的搜索詞較長或者包含較多的冗余信息,則包含整個搜索詞的網(wǎng)頁有可能搜索不到,而包含搜索詞的分詞或分詞組合的網(wǎng)頁與用戶真正需求的網(wǎng)頁相差甚遠,因為搜索詞的分詞或分詞組合有可能不能精確表示搜索詞的主題。例如,包含字串“找工作的網(wǎng)站有哪些”的網(wǎng)頁相對較少,而包含“工作”、“哪些”等分詞的網(wǎng)頁有可能很多,但是與用于找工作的網(wǎng)站之間的關(guān)聯(lián)不大。
[0005]另一方面,即使搜索到包含整個搜索詞或者包含搜索詞中較多分詞的網(wǎng)頁,用戶也需要從返回的眾多網(wǎng)頁信息中分析哪些是最匹配的網(wǎng)頁信息,并進一步從較匹配的網(wǎng)頁信息中獲取目標網(wǎng)站信息。以上述例子為例,由于包含搜索詞“找工作的網(wǎng)站有哪些”或搜索詞分詞的網(wǎng)頁并不是用戶真正想要的用于找工作的網(wǎng)站,因此,用戶需要在搜索結(jié)果中查找包含用于找工作的網(wǎng)站信息的條目,點擊該條目以打開網(wǎng)頁,并在網(wǎng)頁內(nèi)容中查找用于找工作的網(wǎng)站的網(wǎng)址或鏈接,進一步根據(jù)查找到的網(wǎng)站或鏈接打開用于找工作的網(wǎng)站。
[0006]發(fā)明人發(fā)現(xiàn)傳統(tǒng)的搜索方法至少存在如下問題:只返回包含搜索詞以及搜索詞的分詞和分詞組合的網(wǎng)頁信息,由于包含搜索詞或搜索詞分詞的網(wǎng)頁有可能并不是用戶需要查找的目標網(wǎng)站,因此,傳統(tǒng)的搜索方法返回的搜索結(jié)果與搜索詞的匹配精確度不高。

【發(fā)明內(nèi)容】

[0007]基于此,有必要提供一種可提高搜索結(jié)果與搜索詞之間的匹配精確度的搜索方法。
[0008]一種搜索方法,包括以下步驟:
[0009]獲取搜索請求;
[0010]提取所述搜索請求中包含的搜索詞的核心詞;
[0011]在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站;
[0012]返回所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息。[0013]此外,還有必要提供一種可返回搜索詞的主題對應(yīng)的目標網(wǎng)站信息的搜索系統(tǒng)。
[0014]一種搜索系統(tǒng),包括:
[0015]請求獲取模塊,用于獲取搜索請求;
[0016]核心詞提取模塊,用于提取所述搜索請求中包含的搜索詞的核心詞;
[0017]關(guān)聯(lián)網(wǎng)站查找模塊,用于在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站;
[0018]網(wǎng)站信息返回模塊,用于返回所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息。
[0019]上述搜索方法和系統(tǒng),提取搜索請求中包含的搜索詞的核心詞,進一步在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找到核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,并返回關(guān)聯(lián)網(wǎng)站的相關(guān)信息,由于核心詞過濾了搜索詞中包含的冗余信息,可表示搜索詞的關(guān)鍵信息,核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站很可能是用戶需求的目標網(wǎng)站,不需要用戶在搜索結(jié)果中的眾多網(wǎng)頁信息查找較匹配的網(wǎng)頁信息,然后根據(jù)網(wǎng)頁信息查找到目標網(wǎng)站,提高了搜索結(jié)果與搜索詞之間的匹配精確度。
【【專利附圖】

【附圖說明】】
[0020]圖1為一個實施例中的搜索方法的流程示意圖;
[0021]圖2為一個實施例中圖1的步驟S104的流程示意圖; [0022]圖3為一個實施例中構(gòu)建搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系的步驟的流程示意圖;
[0023]圖4為一個實施例中關(guān)聯(lián)網(wǎng)站的展示示意圖;
[0024]圖5為一個實施例中的搜索系統(tǒng)的結(jié)構(gòu)示意圖;
[0025]圖6為一個實施例中核心詞提取模塊的結(jié)構(gòu)示意圖;
[0026]圖7為另一實施例中的搜索系統(tǒng)的結(jié)構(gòu)示意圖;
[0027]圖8為一個實施例中對應(yīng)關(guān)系構(gòu)建|吳塊的結(jié)構(gòu)不意圖;
[0028]圖9為又一實施例中的搜索系統(tǒng)的結(jié)構(gòu)示意圖。
【【具體實施方式】】
[0029]如圖1所示,在一個實施例中,一種搜索方法,包括以下步驟:
[0030]步驟S102,獲取搜索請求。
[0031]在一個實施例中,服務(wù)端可接收瀏覽器提交的包含用戶輸入的搜索詞的搜索請求。
[0032]步驟S104,提取搜索請求中包含的搜索詞的核心詞。
[0033]核心詞為搜索詞中的可表示搜索詞的關(guān)鍵信息的詞。例如,搜索詞“找工作的網(wǎng)站有哪些”的核心詞為“找工作”。服務(wù)端接收到搜索請求后,可提取搜索請求中包含的搜索詞的核心詞。
[0034]如圖2所示,在一個實施例中,步驟S104包括以下步驟:
[0035]步驟S202,提取搜索請求中的搜索詞,將搜索詞進行分詞處理,得到搜索詞中包含的分詞。
[0036]在一個實施例中,可解析搜索請求,提取用戶輸入的搜索詞,按照預(yù)設(shè)規(guī)則將搜索詞進行分詞處理。[0037]步驟S204,計算分詞的重要指數(shù),和/或在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站并獲取上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)。
[0038]在一個實施例中,可基于語義計算分詞的重要指數(shù),包括以下步驟:標注分詞的詞性,詞性包括名詞、動詞、形容詞、數(shù)詞等;根據(jù)分詞的詞性以及分詞在搜索詞中的位置計算分詞的重要指數(shù)。在一個實施例中,可預(yù)先設(shè)置各類詞性以及搜索詞中的分詞位置對應(yīng)的權(quán)值,根據(jù)分詞的詞性對應(yīng)的權(quán)值以及分詞所在搜索詞中的位置對應(yīng)的權(quán)值計算該分詞的重要指數(shù)。一般地,可設(shè)置名詞對應(yīng)的權(quán)值比其它類詞性對應(yīng)的權(quán)值高,并按照分詞位置的先后順序由低到高設(shè)置分詞位置的權(quán)值,分詞位置越靠前,則對應(yīng)的權(quán)值越低。
[0039]在一個實施例中,可預(yù)先計算搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中包含的關(guān)聯(lián)網(wǎng)站的熱門度。網(wǎng)站的熱門度為反映網(wǎng)站受關(guān)注程度的指標,網(wǎng)站越受關(guān)注,則網(wǎng)站的熱門度也越高。在一個實施例中,關(guān)聯(lián)網(wǎng)站的熱門度可根據(jù)關(guān)聯(lián)網(wǎng)站的點擊量計算得到。點擊量越高,則網(wǎng)站的熱門度也越高。進一步的,可根據(jù)分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的熱門度計算分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)。熱門度越高,則重要指數(shù)也越高。
[0040]步驟S206,根據(jù)上述分詞的重要指數(shù)和/或上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)選取分詞為上述搜索請求中包含的搜索詞的核心詞。
[0041]在一個實施例中,可計算分詞的重要指數(shù),選取重要指數(shù)最高的分詞為搜索請求中包含的搜索詞的核心詞。
[0042]在另一個實施例中,可在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,并獲取上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù),選取對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)最高的分詞為搜索詞的核心詞。
[0043]在又一個實施例中,可計算分詞的重要指數(shù),以及在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,并獲取上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù),進一步的結(jié)合上述分詞的重要指數(shù)和上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)選取某一分詞為上述搜索請求中包含的搜索詞的核心詞。在一個實施例中,可選取分詞的重要指數(shù)與分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)的綜合值最高的分詞為搜索詞對應(yīng)的核心詞。
[0044]步驟S106,在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。
[0045]如圖3所示,在一個實施例中,在步驟S102之前,上述搜索方法還包括構(gòu)建搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系的步驟,包括:
[0046]步驟S302,獲取歷史搜索記錄,搜索記錄中包含搜索詞及搜索詞對應(yīng)的命中網(wǎng)站信息。搜索詞對應(yīng)的命中網(wǎng)站為搜索詞對應(yīng)的搜索結(jié)果中被用戶點擊的網(wǎng)頁所屬的網(wǎng)站。
[0047]步驟S304,統(tǒng)計搜索詞對應(yīng)的命中網(wǎng)站的命中率。在一個實施例中,可統(tǒng)計搜索記錄中搜索詞對應(yīng)的各命中網(wǎng)站被選中的次數(shù),進一步計算各命中網(wǎng)站被選中的次數(shù)占搜索詞對應(yīng)的所有命中網(wǎng)站被選中次數(shù)總和的比值,即得到搜索詞對應(yīng)的命中網(wǎng)站的命中率。
[0048]步驟S306,根據(jù)搜索詞對應(yīng)的命中網(wǎng)站的命中率計算搜索詞與命中網(wǎng)站的關(guān)聯(lián)度。命中網(wǎng)站相對于搜索詞的命中率越高,則該搜索詞與該命中網(wǎng)站的關(guān)聯(lián)度也越高。
[0049]步驟S308,根據(jù)搜索詞與命中網(wǎng)站的關(guān)聯(lián)度選取搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,記錄搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系。
[0050]在一個實施例中,可選取與搜索詞的關(guān)聯(lián)度大于預(yù)設(shè)值的命中網(wǎng)站為搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。在另一個實施例中,可按照與搜索詞的關(guān)聯(lián)度從大到小的順序選取預(yù)設(shè)數(shù)量個命中網(wǎng)站為搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。在又一實施例中,可選取與搜索詞的關(guān)聯(lián)度大于預(yù)設(shè)值的命中網(wǎng)站,進一步在選取的命中網(wǎng)站中按照與搜索詞的關(guān)聯(lián)度從大到小的順序選取不超過預(yù)設(shè)數(shù)量的命中網(wǎng)站為搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。
[0051]在一個實施例中,步驟S106可在步驟S302?S308所構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。
[0052]步驟S108,返回核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息。在一個實施例中,服務(wù)端可向瀏覽器返回關(guān)聯(lián)網(wǎng)站的網(wǎng)址、名稱等信息。
[0053]在一個實施例中,上述搜索方法還包括步驟:將上述搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站進行分類;步驟S108返回的核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息中包含關(guān)聯(lián)網(wǎng)站的分類結(jié)果信息。
[0054]在一個實施例中,可預(yù)先設(shè)置搜索詞對應(yīng)的類別,例如,搜索詞為“購物”,可設(shè)置“購物”對應(yīng)的類別包括“綜合”、“服飾”、“數(shù)碼”、“日用”、“導(dǎo)購”和“團購”等。進一步的,可統(tǒng)計各類別在關(guān)聯(lián)網(wǎng)站中的出現(xiàn)次數(shù),設(shè)置出現(xiàn)次數(shù)最多的類別為搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的類別。步驟S108中服務(wù)器可將類別名稱以及屬于該類別的關(guān)聯(lián)網(wǎng)站的相關(guān)信息對應(yīng)返回給瀏覽器。
[0055]在一個實施例中,上述搜索方法還包括步驟:根據(jù)核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息生成關(guān)聯(lián)網(wǎng)站的導(dǎo)航圖表或?qū)Ш綑?;展示?dǎo)航圖表或?qū)Ш綑凇?br> [0056]在一個實施例中,瀏覽器接收到服務(wù)端返回的核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息后,可根據(jù)關(guān)聯(lián)網(wǎng)站的相關(guān)信息生成關(guān)聯(lián)網(wǎng)站的導(dǎo)航圖表或?qū)Ш綑?。在一個實施例中,導(dǎo)航圖表或?qū)Ш綑谥邪ㄒ躁P(guān)聯(lián)網(wǎng)站名稱為鏈接對象、以關(guān)聯(lián)網(wǎng)站地址為鏈接目標的關(guān)聯(lián)網(wǎng)站鏈接。
[0057]如圖4所示,在一個實施例中,搜索詞為“購物有哪些網(wǎng)站”,服務(wù)端提取搜索詞中的核心詞“購物”,查找到“購物”的關(guān)聯(lián)網(wǎng)站“淘寶”、“亞馬遜”等,并將關(guān)聯(lián)網(wǎng)站進行分類,所分類別包括:“綜合”、“服飾”、“數(shù)碼”、“日用”、“導(dǎo)購”和“團購”。瀏覽器接收到服務(wù)端返回的關(guān)聯(lián)網(wǎng)站相關(guān)信息后,生成包含關(guān)聯(lián)網(wǎng)站鏈接的導(dǎo)航欄401并展示,導(dǎo)航欄中關(guān)聯(lián)網(wǎng)站按照上述類別分類展示。
[0058]如圖5所不,在一個實施例中,一種搜索系統(tǒng),包括請求獲取模塊10、核心詞提取模塊20、關(guān)聯(lián)網(wǎng)站查找模塊30和網(wǎng)站信息返回模塊40,其中:
[0059]請求獲取模塊10用于獲取搜索請求。
[0060]在一個實施例中,請求獲取模塊10、核心詞提取模塊20、關(guān)聯(lián)網(wǎng)站查找模塊30和網(wǎng)站信息返回模塊40位于服務(wù)端。請求獲取模塊10可接收瀏覽器提交的包含用戶輸入的搜索詞的搜索請求。
[0061]核心詞提取模塊20用于提取搜索請求中包含的搜索詞的核心詞。核心詞為搜索詞中的可表示搜索詞的關(guān)鍵信息的詞。例如,搜索詞“找工作的網(wǎng)站有哪些”的核心詞為“找
工作”。
[0062]如圖6所示,在一個實施例中,核心詞提取模塊20包括搜索詞提取模塊201、分詞模塊202、重要指數(shù)計算模塊203和核心詞選取模塊204,其中:
[0063]搜索詞提取模塊201用于提取搜索請求中的搜索詞。[0064]分詞模塊202用于將搜索詞進行分詞處理,得到搜索詞中包含的分詞。
[0065]在一個實施例中,搜索詞提取模塊201可解析搜索請求,提取用戶輸入的搜索詞,分詞模塊202可按照預(yù)設(shè)規(guī)則將搜索詞進行分詞處理。
[0066]重要指數(shù)計算模塊203用于計算分詞的重要指數(shù),和/或在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站并獲取上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)。
[0067]在一個實施例中,重要指數(shù)計算模塊203可基于語義計算分詞的重要指數(shù)。在一個實施例中,重要指數(shù)計算模塊203可標注分詞的詞性,詞性包括名詞、動詞、形容詞、數(shù)詞等;根據(jù)分詞的詞性以及分詞在搜索詞中的位置計算分詞的重要指數(shù)。在一個實施例中,重要指數(shù)計算模塊203可預(yù)先設(shè)置各類詞性以及搜索詞中的分詞位置對應(yīng)的權(quán)值,根據(jù)分詞的詞性對應(yīng)的權(quán)值以及分詞所在搜索詞中的位置對應(yīng)的權(quán)值計算該分詞的重要指數(shù)。一般地,可設(shè)置名詞對應(yīng)的權(quán)值比其它類詞性對應(yīng)的權(quán)值高,并按照分詞位置的先后順序由低到高設(shè)置分詞位置的權(quán)值,分詞位置越靠前,則對應(yīng)的權(quán)值越低。
[0068]在一個實施例中,重要指數(shù)計算模塊203可預(yù)先計算搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中包含的關(guān)聯(lián)網(wǎng)站的熱門度。網(wǎng)站的熱門度為反映網(wǎng)站受關(guān)注程度的指標,網(wǎng)站越受關(guān)注,則網(wǎng)站的熱門度也越高。在一個實施例中,關(guān)聯(lián)網(wǎng)站的熱門度可根據(jù)關(guān)聯(lián)網(wǎng)站的點擊量計算得到。點擊量越高,則網(wǎng)站的熱門度也越高。進一步的,重要指數(shù)計算模塊203可根據(jù)分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的熱門度計算分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)。熱門度越高,則重要指數(shù)也越高。
[0069]核心詞選取模塊204用于根據(jù)上述分詞的重要指數(shù)和/或上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)選取分詞為上述搜索請求中包含的搜索詞的核心詞。
[0070]在一個實施例中,重要指數(shù)計算模塊203可計算分詞的重要指數(shù),核心詞選取模塊204選取重要指數(shù)最高的分詞為搜索請求中包含的搜索詞的核心詞。
[0071]在另一個實施例中,重要指數(shù)計算模塊203可在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,并獲取上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù),核心詞選取模塊204選取對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)最高的分詞為搜索詞的核心詞。
[0072]在又一個實施例中,重要指數(shù)計算模塊203可計算分詞的重要指數(shù),以及在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,并獲取上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù),核心詞選取模塊204可結(jié)合上述分詞的重要指數(shù)和上述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)選取某一分詞為上述搜索請求中包含的搜索詞的核心詞。在一個實施例中,核心詞選取模塊204可選取分詞的重要指數(shù)與分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)的綜合值最高的分詞為搜索詞對應(yīng)的核心詞。
[0073]關(guān)聯(lián)網(wǎng)站查找模塊30用于在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。
[0074]如圖7所示,在一個實施例中,上述搜索系統(tǒng)還包括對應(yīng)關(guān)系構(gòu)建模塊50,用于構(gòu)建所述搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系。如圖8所示,對應(yīng)關(guān)系構(gòu)建模塊50包括搜索記錄獲取模塊510、命中率統(tǒng)計模塊520、關(guān)聯(lián)度計算模塊530和對應(yīng)關(guān)系記錄模塊540,其中:
[0075]搜索記錄獲取模塊510用于獲取歷史搜索記錄,搜索記錄中包含搜索詞及搜索詞對應(yīng)的命中網(wǎng)站信息。搜索詞對應(yīng)的命中網(wǎng)站為搜索詞對應(yīng)的搜索結(jié)果中被用戶點擊的網(wǎng)頁所屬的網(wǎng)站。
[0076]命中率統(tǒng)計模塊520用于統(tǒng)計搜索詞對應(yīng)的命中網(wǎng)站的命中率。在一個實施例中,命中率統(tǒng)計模塊520可統(tǒng)計搜索記錄中搜索詞對應(yīng)的各命中網(wǎng)站被選中的次數(shù),進一步計算各命中網(wǎng)站被選中的次數(shù)占搜索詞對應(yīng)的所有命中網(wǎng)站被選中的次數(shù)總和的比值,即得到搜索詞對應(yīng)的命中網(wǎng)站的命中率。
[0077]關(guān)聯(lián)度計算模塊530用于根據(jù)搜索詞對應(yīng)的命中網(wǎng)站的命中率計算搜索詞與命中網(wǎng)站的關(guān)聯(lián)度。命中網(wǎng)站相對于搜索詞的命中率越高,則該搜索詞與該命中網(wǎng)站的關(guān)聯(lián)度也越高。
[0078]對應(yīng)關(guān)系記錄模塊540用于根據(jù)搜索詞與命中網(wǎng)站的關(guān)聯(lián)度選取搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,記錄搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系。
[0079]在一個實施例中,對應(yīng)關(guān)系記錄模塊540可選取與搜索詞的關(guān)聯(lián)度大于預(yù)設(shè)值的命中網(wǎng)站為搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。在另一個實施例中,對應(yīng)關(guān)系記錄模塊540可按照與搜索詞的關(guān)聯(lián)度從大到小的順序選取預(yù)設(shè)數(shù)量個命中網(wǎng)站為搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。在又一實施例中,對應(yīng)關(guān)系記錄模塊540可選取與搜索詞的關(guān)聯(lián)度大于預(yù)設(shè)值的命中網(wǎng)站,進一步在選取的命中網(wǎng)站中按照與搜索詞的關(guān)聯(lián)度從大到小的順序選取不超過預(yù)設(shè)數(shù)量的命中網(wǎng)站為搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。
[0080]在一個實施例中,關(guān)聯(lián)網(wǎng)站查找模塊30可在對應(yīng)關(guān)系構(gòu)建模塊50所構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站。
[0081 ] 網(wǎng)站信息返回模塊40,返回核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息。在一個實施例中,網(wǎng)站信息返回模塊40可向瀏覽器返回關(guān)聯(lián)網(wǎng)站的網(wǎng)址、名稱等信息。
[0082]在一個實施例中,上述搜索系統(tǒng)還包括分類模塊(圖中未示出):將上述搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站進行分類;網(wǎng)站信息返回模塊40返回的核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息中包含關(guān)聯(lián)網(wǎng)站的分類結(jié)果信息。
[0083]在一個實施例中,分類模塊可預(yù)先設(shè)置搜索詞對應(yīng)的類別,例如,搜索詞為“購物”,可設(shè)置“購物”對應(yīng)的類別包括“綜合”、“服飾”、“數(shù)碼”、“日用”、“導(dǎo)購”和“團購”等。進一步的,分類模塊可統(tǒng)計各類別在關(guān)聯(lián)網(wǎng)站中的出現(xiàn)次數(shù),設(shè)置出現(xiàn)次數(shù)最多的類別為搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的類別。網(wǎng)站信息返回模塊40可將類別名稱以及屬于該類別的關(guān)聯(lián)網(wǎng)站的相關(guān)信息對應(yīng)返回給瀏覽器。
[0084]如圖9所示,在一個實施例中,上述搜索系統(tǒng)還包括網(wǎng)站導(dǎo)航生成模塊60和展示模塊70:網(wǎng)站導(dǎo)航生成模塊用于根據(jù)核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息生成關(guān)聯(lián)網(wǎng)站的導(dǎo)航圖表或?qū)Ш綑冢徽故灸K用于展示導(dǎo)航圖表或?qū)Ш綑?;請求獲取模塊10、核心詞提取模塊20、關(guān)聯(lián)網(wǎng)站查找模塊30、網(wǎng)站信息返回模塊40和對應(yīng)關(guān)系構(gòu)建模塊50位于服務(wù)端,網(wǎng)站導(dǎo)航生成模塊60和展示模塊70位于瀏覽器。
[0085]在一個實施例中,導(dǎo)航圖表或?qū)Ш綑谥邪ㄒ躁P(guān)聯(lián)網(wǎng)站名稱為鏈接對象、以關(guān)聯(lián)網(wǎng)站地址為鏈接目標的關(guān)聯(lián)網(wǎng)站鏈接。
[0086]上述搜索方法和系統(tǒng),提取搜索請求中包含的搜索詞的核心詞,進一步在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找到核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,并返回關(guān)聯(lián)網(wǎng)站的相關(guān)信息,由于核心詞過濾了搜索詞中包含的冗余信息,可表示搜索詞的關(guān)鍵信息,核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站很可能是用戶需求的目標網(wǎng)站,不需要用戶在搜索結(jié)果中的眾多網(wǎng)頁信息查找較匹配的網(wǎng)頁信息,然后根據(jù)網(wǎng)頁信息查找到目標網(wǎng)站,提高了搜索結(jié)果與搜索詞之間的匹配精確度。
[0087]本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機程序控制相關(guān)的硬件來完成的,所述的程序可存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機存儲記憶體(Random AccessMemory, RAM)等。
[0088]以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應(yīng)以所附權(quán)利要求為準。
【權(quán)利要求】
1.一種搜索方法,包括以下步驟: 獲取搜索請求; 提取所述搜索請求中包含的搜索詞的核心詞; 在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站; 返回所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息。
2.根據(jù)權(quán)利要求1所述的搜索方法,其特征在于,在所述獲取搜索請求之前,所述方法還包括構(gòu)建所述搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系的步驟,包括: 獲取歷史搜索記錄,搜索記錄中包含搜索詞及搜索詞對應(yīng)的命中網(wǎng)站信息; 統(tǒng)計所述搜索詞對應(yīng)的命中網(wǎng)站的命中率; 根據(jù)所述搜索詞對應(yīng)的命中網(wǎng)站的命中率計算所述搜索詞與所述命中網(wǎng)站的關(guān)聯(lián)度; 根據(jù)所述關(guān)聯(lián)度選取所述搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,記錄所述搜索詞與所述關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系。
3.根據(jù)權(quán)利要求1所述的搜索方法,其特征在于,所述提取搜索請求中包含的搜索詞的核心詞的步驟 包括: 提取所述搜索請求中的搜索詞,將所述搜索詞進行分詞處理,得到所述搜索詞中包含的分詞; 計算所述分詞的重要指數(shù),和/或在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找所述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站并獲取所述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù); 根據(jù)所述分詞的重要指數(shù)和/或所述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)選取分詞為所述搜索請求中包含的搜索詞的核心詞。
4.根據(jù)權(quán)利要求1所述的搜索方法,其特征在于,所述方法還包括:將所述對應(yīng)關(guān)系中搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站進行分類; 返回的所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息中包含所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的分類結(jié)果信息。
5.根據(jù)權(quán)利要求1或4所述的搜索方法,其特征在于,所述方法還包括: 根據(jù)所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息生成所述關(guān)聯(lián)網(wǎng)站的導(dǎo)航圖表或?qū)Ш綑冢? 展示所述導(dǎo)航圖表或?qū)Ш綑凇?br> 6.一種搜索系統(tǒng),其特征在于,包括: 請求獲取模塊,用于獲取搜索請求; 核心詞提取模塊,用于提取所述搜索請求中包含的搜索詞的核心詞; 關(guān)聯(lián)網(wǎng)站查找模塊,用于在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站; 網(wǎng)站信息返回模塊,用于返回所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息。
7.根據(jù)權(quán)利要求6所述的搜索系統(tǒng),其特征在于,所述系統(tǒng)還包括對應(yīng)關(guān)系構(gòu)建模塊,所述對應(yīng)關(guān)系構(gòu)建模塊用于構(gòu)建所述搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系,包括: 搜索記錄獲取模塊,用于獲取歷史搜索記錄,搜索記錄中包含搜索詞及搜索詞對應(yīng)的命中網(wǎng)站信息;命中率統(tǒng)計模塊,用于統(tǒng)計所述搜索詞對應(yīng)的命中網(wǎng)站的命中率; 關(guān)聯(lián)度計算模塊,用于根據(jù)所述搜索詞對應(yīng)的命中網(wǎng)站的命中率計算所述搜索詞與所述命中網(wǎng)站的關(guān)聯(lián)度; 對應(yīng)關(guān)系記錄模塊,用于根據(jù)所述關(guān)聯(lián)度選取所述搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站,記錄所述搜索詞與所述關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系。
8.根據(jù)權(quán)利要求6所述的搜索系統(tǒng),其特征在于,所述核心詞提取模塊包括: 搜索詞提取模塊,用于提取所述搜索請求中的搜索詞; 分詞模塊,用于將所述搜索詞進行分詞處理,得到所述搜索詞中包含的分詞; 重要指數(shù)計算模塊,用于計算所述分詞的重要指數(shù),和/或在預(yù)先構(gòu)建的搜索詞與關(guān)聯(lián)網(wǎng)站的對應(yīng)關(guān)系中查找所述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站并獲取所述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù); 核心詞選取模塊,用于根據(jù)所述分詞的重要指數(shù)和/或所述分詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的重要指數(shù)選取分詞為所述搜索請求中包含的搜索詞的核心詞。
9.根據(jù)權(quán)利要求6所述的搜索系統(tǒng),其特征在于,所述系統(tǒng)還包括: 分類模塊,用于將所述對應(yīng)關(guān)系中搜索詞對應(yīng)的關(guān)聯(lián)網(wǎng)站進行分類; 所述網(wǎng)站信息返回模塊返回的所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息中包含所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的分類結(jié)果信息。
10.根據(jù)權(quán)利要求6或9所述的搜索系統(tǒng),其特征在于,所述系統(tǒng)還包括:` 網(wǎng)站導(dǎo)航生成模塊,用于根據(jù)所述核心詞對應(yīng)的關(guān)聯(lián)網(wǎng)站的相關(guān)信息生成所述關(guān)聯(lián)網(wǎng)站的導(dǎo)航圖表或?qū)Ш綑冢? 展示模塊,用于展示所述導(dǎo)航圖表或?qū)Ш綑凇?br> 【文檔編號】G06F17/30GK103778122SQ201210395247
【公開日】2014年5月7日 申請日期:2012年10月17日 優(yōu)先權(quán)日:2012年10月17日
【發(fā)明者】姚靜 申請人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1