亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于搜索關(guān)鍵詞的推薦方法及系統(tǒng)的制作方法

文檔序號:6626995閱讀:268來源:國知局
一種基于搜索關(guān)鍵詞的推薦方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于搜索關(guān)鍵詞的推薦系統(tǒng)及方法,涉及搜索引擎領(lǐng)域。所述系統(tǒng)包括:關(guān)鍵詞獲取單元,適于根據(jù)用戶輸入獲得搜索關(guān)鍵詞;查找樹存儲單元,適于以樹形數(shù)據(jù)結(jié)構(gòu)存儲漢字,樹中每個數(shù)據(jù)節(jié)點(diǎn)存儲一個漢字,以及包含所述漢字的推薦詞的地址信息;推薦詞詞庫,適于存儲所述推薦詞;地址獲取單元,適于根據(jù)搜索關(guān)鍵詞查詢查找樹存儲單元,獲得推薦詞的地址信息;推薦單元,適于根據(jù)地址信息查詢推薦詞詞庫獲得推薦詞,并將推薦詞推薦給用戶。所述系統(tǒng)及方法,在查找樹存儲單元中,令每個數(shù)據(jù)節(jié)點(diǎn)記錄包含該節(jié)點(diǎn)字符的所有推薦詞的地址信息,從而提高了推薦詞的查詢速度,克服了推薦詞庫容量增大導(dǎo)致查詢速度降低的問題。
【專利說明】一種基于搜索關(guān)鍵詞的推薦方法及系統(tǒng)
[0001]本發(fā)明專利申請是申請日為2012年06月26日、申請?zhí)枮?01210215120.4、名稱為“一種用于搜索輸入的推薦系統(tǒng)及方法”的中國發(fā)明專利申請的分案申請。

【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及搜索引擎【技術(shù)領(lǐng)域】,特別涉及一種基于搜索關(guān)鍵詞的推薦系統(tǒng)及方法。

【背景技術(shù)】
[0003]Suggest (搜索建議)是一種根據(jù)用戶已輸入的查詢詞,提供建議提示的技術(shù)。在互聯(lián)網(wǎng)中,搜索人的責(zé)任就是幫助用戶,以更快的速度,更少的操作,更準(zhǔn)確地獲取待搜索信息。
[0004]用戶在搜索框中進(jìn)行輸入時,往往要輸入很多關(guān)鍵詞,還可能會切換輸入法。而且用戶在輸好關(guān)鍵詞后,還可能面臨輸入錯誤的情況,比如同音別字。最后,用戶也可能并不確定輸入什么樣的關(guān)鍵詞,能夠非常恰當(dāng)?shù)卮碜约旱南敕?。suggest就是為了提升用戶在輸入框中輸入關(guān)鍵詞時的體驗(yàn),其可以縮短用戶的鍵入,對用戶的輸入進(jìn)行糾錯,更重要的是可以推薦出很多貼近用戶想法的關(guān)鍵詞。
[0005]實(shí)現(xiàn)suggest,一般需要中文到拼音的標(biāo)注過程和索引查詢過程兩個環(huán)節(jié)。拼音標(biāo)注,就是把中文短語翻譯成其相應(yīng)的拼音,這個過程的難點(diǎn)在于多音字的處理,其一般只在直接根據(jù)中文關(guān)鍵詞進(jìn)行索引查詢所得推薦詞過少的情況下使用。suggest的索引查詢通常基于hashmap(基于哈希表的Map接口),查詢過程必須性能過硬,因?yàn)橛脩粼谳斎胍粋€關(guān)鍵詞的過程中會多次調(diào)用suggest服務(wù)。
[0006]拼音標(biāo)注環(huán)節(jié)中,對于多音字的處理,通常的做法,是將多音字的讀音進(jìn)行枚舉,比如“音樂”,將其翻譯成“yinyue”和“yinle”,將“樂視網(wǎng)”翻譯成“yueshiwang”和“l(fā)eshiwang”。這種翻譯單純基于單個漢字的讀音,而不考慮其使用環(huán)境。因此,可能會造成冗余的拼音索引,擾亂正確結(jié)果,并且不利于引導(dǎo)用戶認(rèn)識到自己的拼音錯誤。
[0007]在由拼音得到中文查詢串的過程中,由于對多音字的處理不當(dāng),也可能會引入搜索噪音,比如用戶在百度搜索框中輸入“yueshi”,本想查詢月食相關(guān)信息,但此時suggest給出的推薦詞包括“樂視網(wǎng)”和“鑰匙”等明顯無關(guān)的信息,而“月食”幾乎被這些無關(guān)信息所淹沒。
[0008]通常的查詢方式,詞典里的數(shù)據(jù)集越大,需要遍歷的子樹越大,導(dǎo)致查找消耗的時間隨數(shù)據(jù)集的增大而增加,影響用戶的使用體驗(yàn)。


【發(fā)明內(nèi)容】

[0009]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于搜索關(guān)鍵詞的推薦方法及系統(tǒng)。
[0010]依據(jù)本發(fā)明的一個方面,提供了一種基于搜索關(guān)鍵詞的推薦方法,包括步驟:
[0011]A:根據(jù)用戶輸入獲得搜索關(guān)鍵詞;
[0012]B:根據(jù)所述搜索關(guān)鍵詞查詢獲得推薦詞的地址信息
[0013]C:根據(jù)所述推薦詞的地址信息獲得對應(yīng)的推薦詞,并將所述推薦詞推薦給用戶。
[0014]可選地,所述根據(jù)所述搜索關(guān)鍵詞查詢獲得推薦詞的地址信息進(jìn)一步包括:
[0015]根據(jù)所述搜索關(guān)鍵詞查詢查找樹存儲單元,獲得對應(yīng)所述搜索關(guān)鍵詞的一個或多個推薦詞的地址信息,所述查找樹存儲單元,適于以樹形數(shù)據(jù)結(jié)構(gòu)存儲漢字,樹中每個數(shù)據(jù)節(jié)點(diǎn)存儲一個漢字,以及包含所述漢字的推薦詞的地址信息。
[0016]可選地,所述根據(jù)所述推薦詞的地址信息獲得對應(yīng)的推薦詞,并將所述推薦詞推薦給用戶進(jìn)一步包括:
[0017]根據(jù)所述推薦詞的地址信息查詢推薦詞詞庫獲得對應(yīng)的推薦詞,并將所述推薦詞推薦給用戶;所述推薦詞詞庫,適于存儲所述推薦詞。
[0018]其中,所述用戶輸入為中文輸入或者拼音輸入。
[0019]其中,當(dāng)所述用戶輸入為中文輸入時,所述步驟A具體包括:
[0020]Al:接收用戶的中文輸入,并將所述中文輸入直接作為搜索關(guān)鍵詞。
[0021]其中,所述步驟B具體包括:
[0022]B1:查詢查找樹存儲單元,在所述中文輸入的最末字符對應(yīng)的節(jié)點(diǎn)處找到以所述中文輸入為前綴的初級推薦詞的地址信息。
[0023]其中,所述步驟BI后還包括:
[0024]B2:根據(jù)所述初級推薦詞的地址信息判斷相應(yīng)的初級推薦詞的數(shù)量是否大于等于預(yù)設(shè)閾值,如果是,執(zhí)行步驟C ;否則,根據(jù)所述初級推薦詞的地址信息查詢推薦詞詞庫獲得所述初級推薦詞,執(zhí)行步驟B3 ;
[0025]B3:對所述初級推薦詞進(jìn)行擴(kuò)展,得到擴(kuò)展推薦詞的地址信息。
[0026]其中,所述步驟B3具體包括:
[0027]B301:根據(jù)所述初級推薦詞查詢多音詞詞庫,得到所述初級推薦詞對應(yīng)的拼音標(biāo)注;
[0028]B302:根據(jù)所述拼音標(biāo)注查詢所述推薦詞詞庫,得到所述拼音標(biāo)注對應(yīng)的擴(kuò)展中文;
[0029]B303:根據(jù)所述擴(kuò)展中文查詢所述查找樹存儲單元,在所述擴(kuò)展中文的最末字符對應(yīng)的節(jié)點(diǎn)處獲得所述擴(kuò)展中文為前綴的擴(kuò)展推薦詞的地址信息。
[0030]其中,所述步驟B301中,采用正向最大匹配算法查詢所述多音詞詞庫,得到所述初級推薦詞對應(yīng)的拼音標(biāo)注。
[0031 ] 其中,所述多音詞詞庫中以拼音組合的方式對應(yīng)包含多音字的中文短語。
[0032]其中,當(dāng)所述用戶輸入為拼音輸入時,所述步驟A具體包括:
[0033]Al ’:接收用戶的拼音輸入,根據(jù)所述拼音輸入查詢推薦詞詞庫,得到所述拼音輸入對應(yīng)的引導(dǎo)中文,將所述引導(dǎo)中文作為搜索關(guān)鍵詞。
[0034]其中,所述步驟B具體包括:
[0035]BI’:根據(jù)所述引導(dǎo)中文查詢所述查找樹存儲單元,在所述引導(dǎo)中文的最末字符對應(yīng)的節(jié)點(diǎn)處獲得所述引導(dǎo)中文為前綴的引導(dǎo)推薦詞的地址信息。
[0036]其中,所述推薦詞詞庫中以拼音組合的方式對應(yīng)包含多音字的中文短語。
[0037]其中,所述查找樹存儲單元采用Double Array Trie樹結(jié)構(gòu)存儲漢字。
[0038]依據(jù)本發(fā)明的另一個方面,提供了一種基于搜索關(guān)鍵詞的推薦系統(tǒng),其特征在于,所述系統(tǒng)包括:關(guān)鍵詞獲取單元、查找樹存儲單元、推薦詞詞庫、地址獲取單元和推薦單元;
[0039]所述關(guān)鍵詞獲取單元,適于根據(jù)用戶輸入獲得搜索關(guān)鍵詞;
[0040]所述查找樹存儲單元,適于以樹形數(shù)據(jù)結(jié)構(gòu)存儲漢字,樹中每個數(shù)據(jù)節(jié)點(diǎn)存儲一個漢字,以及包含所述漢字的推薦詞的地址信息;
[0041]所述推薦詞詞庫,適于存儲所述推薦詞;
[0042]所述地址獲取單元,適于根據(jù)所述搜索關(guān)鍵詞查詢所述查找樹存儲單元,獲得所述推薦詞的地址信息;
[0043]所述推薦單元,適于根據(jù)所述地址信息查詢所述推薦詞詞庫獲得所述推薦詞,并將所述推薦詞推薦給用戶。
[0044]本發(fā)明的基于搜索關(guān)鍵詞的推薦方法及系統(tǒng),在查找樹存儲單元中,令每個數(shù)據(jù)節(jié)點(diǎn)記錄包含該節(jié)點(diǎn)字符的所有推薦詞的地址信息,從而提高了推薦詞的查詢速度,克服了推薦詞庫容量增大導(dǎo)致查詢速度降低的問題;同時,在推薦詞詞庫和多音詞詞庫中以拼音組合與中文短語相對應(yīng),從而克服了由于多音字而導(dǎo)致的搜索噪音問題,提高了推薦準(zhǔn)確率。

【專利附圖】

【附圖說明】
[0045]圖1是本發(fā)明實(shí)施例一所述基于搜索關(guān)鍵詞的推薦系統(tǒng)的模塊結(jié)構(gòu)示意圖;
[0046]圖2是本發(fā)明實(shí)施例二所述基于搜索關(guān)鍵詞的推薦系統(tǒng)的模塊結(jié)構(gòu)示意圖;
[0047]圖3是本發(fā)明實(shí)施例三所述基于搜索關(guān)鍵詞的推薦方法的處理流程圖;
[0048]圖4是本發(fā)明實(shí)施例三所述查找樹存儲單元和推薦詞詞庫的結(jié)構(gòu)示意圖;
[0049]圖5是本發(fā)明實(shí)施例三所述步驟B3的流程圖;
[0050]圖6是本發(fā)明實(shí)施例三所述多音詞詞庫的結(jié)構(gòu)不意圖;
[0051]圖7是本發(fā)明實(shí)施例四所述基于搜索關(guān)鍵詞的推薦方法的處理流程圖。

【具體實(shí)施方式】
[0052]下面結(jié)合附圖和實(shí)施例,對本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0053]圖1是本發(fā)明實(shí)施例一所述基于搜索關(guān)鍵詞的推薦系統(tǒng)的模塊結(jié)構(gòu)示意圖,如圖1所示,所述系統(tǒng)包括:關(guān)鍵詞獲取單元100、地址獲取單元200、查找樹存儲單元300、推薦詞詞庫400和推薦單兀500。
[0054]關(guān)鍵詞獲取單元100,適于根據(jù)用戶輸入獲得搜索關(guān)鍵詞。所述用戶輸入為拼音輸入或者中文輸入。
[0055]當(dāng)所述用戶輸入為拼音輸入時,所述關(guān)鍵詞獲取單元100,適于根據(jù)所述拼音輸入查詢所述推薦詞詞庫400,得到所述拼音輸入對應(yīng)的引導(dǎo)中文,并將所述引導(dǎo)中文作為搜索關(guān)鍵詞。其中,所述推薦詞詞庫400適于存儲推薦詞,以及所述推薦詞的拼音。并且,所述推薦詞詞庫400中以拼音組合的方式對應(yīng)包含多音字的中文短語。所述引導(dǎo)中文是通過所述推薦詞詞庫400對所述拼音輸入直接翻譯后得到的中文。
[0056]所述地址獲取單元200,適于根據(jù)所述引導(dǎo)中文查詢所述查找樹存儲單元300,得到所述引導(dǎo)中文為前綴的引導(dǎo)推薦詞的地址信息。所述查找樹存儲單元300采用DoubleArray Trie (即雙數(shù)組trie,以下簡寫為datrie)樹結(jié)構(gòu)。所述datrie樹中的每個數(shù)據(jù)節(jié)點(diǎn)(除根節(jié)點(diǎn)之外的節(jié)點(diǎn))記錄一個漢字,以及包含所述漢字的推薦詞的地址信息。所述datrie樹通過所述地址信息與所述推薦詞詞庫400相對應(yīng)。
[0057]所述推薦單元500,適于根據(jù)所述引導(dǎo)推薦詞的地址信息查詢推薦詞詞庫400獲得引導(dǎo)推薦詞,然后推薦給用戶。
[0058]當(dāng)所述用戶輸入為中文輸入時,所述關(guān)鍵詞獲取單元100直接將所述中文輸入作為搜索關(guān)鍵詞。
[0059]所述地址獲取單元200,適于根據(jù)所述中文輸入查詢所述查找樹存儲單元300,得到所述中文輸入為前綴的初級推薦詞的地址信息。
[0060]所述推薦單元500,適于根據(jù)所述初級推薦詞的地址信息查詢所述推薦詞詞庫400直接獲得相應(yīng)的初級推薦詞,并將所述初級推薦詞推薦給用戶。
[0061]圖2是本發(fā)明實(shí)施例二所述基于搜索關(guān)鍵詞的推薦系統(tǒng)的模塊結(jié)構(gòu)示意圖。如圖2所示,本實(shí)施例所述系統(tǒng)與實(shí)施例一所述系統(tǒng)基本相同,其不同之處僅在于,本實(shí)施例所述系統(tǒng)還包括:標(biāo)注單元600和多音詞詞庫700。
[0062]所述標(biāo)注單元600,適于在所述初級推薦詞數(shù)量小于預(yù)設(shè)閾值時,查詢所述多音詞詞庫700以得到對應(yīng)所述中文輸入的拼音標(biāo)注。所述多音詞詞庫700適于存儲中文和所述中文對應(yīng)的拼音標(biāo)注,并且其中以拼音組合的方式對應(yīng)包含多音字的中文短語。
[0063]所述關(guān)鍵詞獲取單元100,還適于根據(jù)所述拼音標(biāo)注再次查詢所述推薦詞詞庫400,得到所述拼音標(biāo)注對應(yīng)的擴(kuò)展中文。所述擴(kuò)展中文是通過所述推薦詞詞庫400對所述拼音標(biāo)注直接翻譯后得到的中文。
[0064]所述地址獲取單元200,還適于根據(jù)所述擴(kuò)展中文查詢所述查找樹存儲單元300,得到所述擴(kuò)展中文為前綴的擴(kuò)展推薦詞的地址信息。
[0065]所述推薦單元500,還適于根據(jù)所述擴(kuò)展推薦詞的地址信息查詢所述推薦詞詞庫400獲得擴(kuò)展推薦詞,然后推薦給用戶。
[0066]圖3是本發(fā)明實(shí)施例三所述基于搜索關(guān)鍵詞的推薦方法的處理流程圖,如圖3所示,所述方法包括步驟:
[0067]Al:接收用戶的中文輸入,并將所述中文輸入直接作為搜索關(guān)鍵詞。本發(fā)明實(shí)施例中,所述用戶輸入為中文輸入或者拼音輸入。實(shí)際應(yīng)用中,用戶輸入還可能包括英文,以及其他的特殊字符等,對于這些用戶輸入的處理,不是本發(fā)明重點(diǎn),在此不再贅述。
[0068]B1:查詢查找樹存儲單元,在所述中文輸入的最末字符對應(yīng)的節(jié)點(diǎn)處找到以所述中文輸入為前綴的初級推薦詞的地址信息。所述查找樹存儲單元可以采用hashmap、trie樹、datrie樹等結(jié)構(gòu)。圖4是本發(fā)明實(shí)施例三所述查找樹存儲單元和推薦詞詞庫的結(jié)構(gòu)示意圖,如圖4所示,本實(shí)施例中,所述查找樹存儲單元優(yōu)選采用datrie樹結(jié)構(gòu),所述datrie樹中的每個數(shù)據(jù)節(jié)點(diǎn)(除根節(jié)點(diǎn)之外的節(jié)點(diǎn))記錄一個漢字,以及包含所述漢字的推薦詞的地址信息。所述datrie樹通過所述地址信息與所述推薦詞詞庫相對應(yīng)。以圖4中“長”字節(jié)點(diǎn)為例,其記錄了包含有“長”字的所有推薦詞的地址信息,這些推薦詞包括:“長個”、“長大”、“長大了”、“長江”、“長江口”、“長城”、“長歌”、“長歌行”。通過這種設(shè)計,當(dāng)搜索關(guān)鍵詞的最末字符為“長”時,通過查詢所述查找樹存儲單元,找到“長”字節(jié)點(diǎn)后,無需再去遍歷以“長”字為根節(jié)點(diǎn)的子樹,而可以直接獲得所有上述包含“長”字的推薦詞。這樣,在線下建立所述查找樹存儲單元時,可能會消耗一些時間;然后在線上查詢時,查詢速度將大幅提升,可以提供每秒百萬次的查詢速度,而且性能不隨數(shù)據(jù)規(guī)模增大而下降。
[0069]B2:根據(jù)所述初級推薦詞的地址信息判斷相應(yīng)的初級推薦詞的數(shù)量是否大于等于預(yù)設(shè)閾值,如果是,執(zhí)行步驟C ;否則,根據(jù)所述初級推薦詞的地址信息查詢推薦詞詞庫獲得所述初級推薦詞,執(zhí)行步驟B3。所述預(yù)設(shè)閾值可以根據(jù)實(shí)際使用情況設(shè)置,比如設(shè)置為3、4或者5。本實(shí)施例中,所述預(yù)設(shè)閾值設(shè)置為3,即當(dāng)所述初級推薦詞的數(shù)量小于3時,認(rèn)為提供的推薦詞過少,需要進(jìn)行擴(kuò)展。
[0070]B3:對所述初級推薦詞進(jìn)行擴(kuò)展,得到擴(kuò)展推薦詞的地址信息。圖5是本發(fā)明實(shí)施例一所述步驟B3的流程圖,如圖5所示,所述步驟B3具體包括步驟:
[0071]B301:采用正向最大匹配算法,根據(jù)所述初級推薦詞查詢多音詞詞庫,得到所述初級推薦詞對應(yīng)的拼音標(biāo)注。圖6是本發(fā)明實(shí)施例三所述多音詞詞庫的結(jié)構(gòu)示意圖,如圖6所示,所述多音詞詞庫適于存儲中文和所述中文對應(yīng)的拼音標(biāo)注,其中以拼音組合的方式對應(yīng)包含多音字的中文短語;對于單個漢字,所述多音詞詞庫中會給出一個默認(rèn)的常用拼音,t匕如“了”字給出的默認(rèn)拼音為“l(fā)e”。通過采用這種設(shè)計,當(dāng)初級推薦詞為“我長大了”時,查詢所述多音詞詞庫,得到拼音標(biāo)注是“wo I zhang | da | le”,而不是“wo | chang | da | le”或者“wo I zhang I dai | le”等,避免了多音字造成的翻譯噪聲。
[0072]在用戶對搜索引擎的實(shí)際使用中,當(dāng)用戶使用中文關(guān)鍵詞進(jìn)行搜索時,可能會由于同音別字而導(dǎo)致輸入有誤,比如用戶想要搜索“唱歌”的相關(guān)信息時,不小心輸入了 “長歌”,這個時候用戶會希望搜索引擎能夠在給出類似“長歌行”這樣的推薦詞之外,還能夠給出“唱歌”相關(guān)的推薦詞,以便用戶直接選取,而無需重復(fù)鍵入;但是,用戶并不希望推薦出“長個”(zhanglge)的相關(guān)信息。因此,在對“長歌”進(jìn)行拼音標(biāo)注時,必須嚴(yán)格的將其只標(biāo)注為“chang |ge”,而不能同時將其標(biāo)注為“zhang I ge”。而現(xiàn)有技術(shù)中以單個字為單位進(jìn)行拼音標(biāo)注的做法顯然無法排除上述多音字帶來的噪聲,本發(fā)明實(shí)施例通過以中文短語為單位進(jìn)行拼音標(biāo)注,有效避免了這種噪聲的干擾。
[0073]B302:根據(jù)所述拼音標(biāo)注查詢所述推薦詞詞庫,得到所述拼音標(biāo)注對應(yīng)的擴(kuò)展中文。參見圖4,在所述推薦詞詞庫中以拼音組合的方式對應(yīng)包含多音字的中文短語,比如“長江”的拼音為“chang| jiang”,而“長大”的拼音為“zhang | da” ;對于單個漢字,所述推薦詞庫中會給出一個默認(rèn)的常用拼音,比如“長”字給出的默認(rèn)拼音為“chang”。
[0074]參見圖4,假設(shè)用戶輸入的中文關(guān)鍵詞為“唱歌”,得到的初級推薦詞過少,通過所述步驟B103后得到的拼音標(biāo)注為“chang |ge”,這時再查詢所述推薦詞詞庫,所得到的擴(kuò)展中文將包括:“唱歌”和“長歌”;而不會包括“長個”(zhanglge)。也就是說,所得到的擴(kuò)展中文與原始輸入的中文關(guān)鍵詞的在當(dāng)前使用環(huán)境下的讀音必須相同(不考慮音調(diào)),而不僅僅是考慮單個字是否存在相同的發(fā)音,從而進(jìn)一步避免了由于推薦詞庫中的多音字而引入噪聲的問題。
[0075]B303:根據(jù)所述擴(kuò)展中文查詢所述查找樹存儲單元,在所述擴(kuò)展中文的最末字符對應(yīng)的節(jié)點(diǎn)處獲得所述擴(kuò)展中文為前綴的擴(kuò)展推薦詞的地址信息。
[0076]假設(shè)根據(jù)步驟B302得到了擴(kuò)展中文“長歌”,進(jìn)而可以擴(kuò)展出新的推薦詞“長歌”“長歌行”,這樣在避免多音字噪聲的情況下增加了推薦詞數(shù)量,便于用戶選擇相應(yīng)的推薦詞。
[0077]Cl:根據(jù)所述初級推薦詞或者擴(kuò)展推薦詞的地址信息查詢推薦詞詞庫獲得相應(yīng)的推薦詞,并將相應(yīng)的推薦詞推薦給用戶。
[0078]圖7是本發(fā)明實(shí)施例四所述基于搜索關(guān)鍵詞的推薦方法的處理流程圖。本實(shí)施例所述方法與實(shí)施例三所述方法基本相同,不同之處僅在于,用戶輸入為拼音輸入。如圖7所示,所述方法包括步驟:
[0079]Al ’:接收用戶的拼音輸入,根據(jù)所述拼音輸入查詢推薦詞詞庫,得到所述拼音輸入對應(yīng)的引導(dǎo)中文,將所述引導(dǎo)中文作為搜索關(guān)鍵詞。以圖4為例,假設(shè)用戶的拼音輸入為“changlge”,這時得到的引導(dǎo)中文包括:“唱歌”和“長歌”。
[0080]BI’:根據(jù)所述引導(dǎo)中文查詢查找樹存儲單元,在所述引導(dǎo)中文的最末字符對應(yīng)的節(jié)點(diǎn)處獲得所述引導(dǎo)中文為前綴的引導(dǎo)推薦詞的地址信息。
[0081]Cl’:根據(jù)所述引導(dǎo)推薦詞的地址信息查詢推薦詞詞庫獲得引導(dǎo)推薦詞,并將所述引導(dǎo)推薦詞推薦給用戶。
[0082]本領(lǐng)域技術(shù)人員容易想到,所述用戶輸入中還可能同時包括拼音和中文,這時可以先對整個用戶輸入進(jìn)行分割得到拼音輸入部分和中文輸入部分,然后再基于上述方法分別進(jìn)行處理。由于其非本發(fā)明重點(diǎn),在此不再贅述。
[0083]本發(fā)明實(shí)施例所述的基于搜索關(guān)鍵詞的推薦系統(tǒng)及方法,在查找樹存儲單元中,令每個數(shù)據(jù)節(jié)點(diǎn)記錄包含該節(jié)點(diǎn)字符的所有推薦詞的地址信息,從而提高了推薦詞的查詢速度,克服了推薦詞庫容量增大導(dǎo)致查詢速度降低的問題;同時,在推薦詞詞庫和多音詞詞庫中以拼音組合與中文短語相對應(yīng),從而克服了由于多音字而導(dǎo)致的搜索噪音問題,提高了推薦準(zhǔn)確率。
[0084]以上實(shí)施方式僅用于說明本發(fā)明,而并非對本發(fā)明的限制,有關(guān)【技術(shù)領(lǐng)域】的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護(hù)范圍應(yīng)由權(quán)利要求限定。
【權(quán)利要求】
1.一種基于搜索關(guān)鍵詞的推薦方法,包括步驟: A:根據(jù)用戶輸入獲得搜索關(guān)鍵詞; B:根據(jù)所述搜索關(guān)鍵詞查詢獲得推薦詞的地址信息 C:根據(jù)所述推薦詞的地址信息獲得對應(yīng)的推薦詞,并將所述推薦詞推薦給用戶。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述搜索關(guān)鍵詞查詢獲得推薦詞的地址信息進(jìn)一步包括: 根據(jù)所述搜索關(guān)鍵詞查詢查找樹存儲單元,獲得對應(yīng)所述搜索關(guān)鍵詞的一個或多個推薦詞的地址信息,所述查找樹存儲單元,適于以樹形數(shù)據(jù)結(jié)構(gòu)存儲漢字,樹中每個數(shù)據(jù)節(jié)點(diǎn)存儲一個漢字,以及包含所述漢字的推薦詞的地址信息。
3.如權(quán)利要求1-2任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述推薦詞的地址信息獲得對應(yīng)的推薦詞,并將所述推薦詞推薦給用戶進(jìn)一步包括: 根據(jù)所述推薦詞的地址信息查詢推薦詞詞庫獲得對應(yīng)的推薦詞,并將所述推薦詞推薦給用戶;所述推薦詞詞庫,適于存儲所述推薦詞。
4.如權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述用戶輸入為中文輸入或者拼音輸入。
5.如權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,當(dāng)所述用戶輸入為中文輸入時,所述步驟A具體包括: Al:接收用戶的中文輸入,并將所述中文輸入直接作為搜索關(guān)鍵詞。
6.如權(quán)利要求1-5任一項(xiàng)所述的方法,其特征在于,所述步驟B具體包括: B1:查詢查找樹存儲單元,在所述中文輸入的最末字符對應(yīng)的節(jié)點(diǎn)處找到以所述中文輸入為前綴的初級推薦詞的地址信息。
7.如權(quán)利要求1-6任一項(xiàng)所述的方法,其特征在于,所述步驟BI后還包括: B2:根據(jù)所述初級推薦詞的地址信息判斷相應(yīng)的初級推薦詞的數(shù)量是否大于等于預(yù)設(shè)閾值,如果是,執(zhí)行步驟C ;否則,根據(jù)所述初級推薦詞的地址信息查詢推薦詞詞庫獲得所述初級推薦詞,執(zhí)行步驟B3; B3:對所述初級推薦詞進(jìn)行擴(kuò)展,得到擴(kuò)展推薦詞的地址信息。
8.如權(quán)利要求1-7任一項(xiàng)所述的方法,其特征在于,所述步驟B3具體包括: B301:根據(jù)所述初級推薦詞查詢多音詞詞庫,得到所述初級推薦詞對應(yīng)的拼音標(biāo)注; B302:根據(jù)所述拼音標(biāo)注查詢所述推薦詞詞庫,得到所述拼音標(biāo)注對應(yīng)的擴(kuò)展中文; B303:根據(jù)所述擴(kuò)展中文查詢所述查找樹存儲單元,在所述擴(kuò)展中文的最末字符對應(yīng)的節(jié)點(diǎn)處獲得所述擴(kuò)展中文為前綴的擴(kuò)展推薦詞的地址信息。
9.如權(quán)利要求1-8任一項(xiàng)所述的方法,其特征在于,所述步驟B301中,采用正向最大匹配算法查詢所述多音詞詞庫,得到所述初級推薦詞對應(yīng)的拼音標(biāo)注。
10.一種基于搜索關(guān)鍵詞的推薦系統(tǒng),其特征在于,所述系統(tǒng)包括:關(guān)鍵詞獲取單元、查找樹存儲單元、推薦詞詞庫、地址獲取單元和推薦單元; 所述關(guān)鍵詞獲取單元,適于根據(jù)用戶輸入獲得搜索關(guān)鍵詞; 所述查找樹存儲單元,適于以樹形數(shù)據(jù)結(jié)構(gòu)存儲漢字,樹中每個數(shù)據(jù)節(jié)點(diǎn)存儲一個漢字,以及包含所述漢字的推薦詞的地址信息; 所述推薦詞詞庫,適于存儲所述推薦詞; 所述地址獲取單元,適于根據(jù)所述搜索關(guān)鍵詞查詢所述查找樹存儲單元,獲得所述推薦詞的地址信息; 所述推薦單元,適于根據(jù)所述地址信息查詢所述推薦詞詞庫獲得所述推薦詞,并將所述推薦詞推薦給用戶。
【文檔編號】G06F17/30GK104268176SQ201410469961
【公開日】2015年1月7日 申請日期:2012年6月26日 優(yōu)先權(quán)日:2012年6月26日
【發(fā)明者】胡毅 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1