亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于Lucence自定義詞庫的全文檢索匹配方法及系統(tǒng)的制作方法

文檔序號:10655270閱讀:477來源:國知局
基于Lucence自定義詞庫的全文檢索匹配方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于Lucence自定義詞庫的全文檢索匹配方法及系統(tǒng),涉及大數(shù)據(jù)搜索領(lǐng)域。該方法包括以下步驟:在Lucence搜索環(huán)境中,實時獲取用戶輸入的搜索詞,檢測是否搜索到結(jié)果,搜索不到,則將搜索詞去掉特殊字符,存入Lucence自定義詞庫;搜索到,則對搜索詞進行分詞,對分詞后的若干詞組繼續(xù)進行搜索,檢測是否搜索到結(jié)果,搜索不到,則將搜索不到結(jié)果的分詞后的詞組去掉特殊字符,存入Lucence自定義詞庫;搜索到,則記錄搜索的時間、分詞后的搜索詞、搜索反饋信息,最終建立支持Lucence全文檢索的Lucence自定義詞庫。本發(fā)明根據(jù)用戶輸入的搜索詞,能夠快速有效地建立自己專用的Lucence自定義詞庫。
【專利說明】
基于Lucence自定義詞庫的全文檢索匹配方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及大數(shù)據(jù)搜索領(lǐng)域,具體是涉及一種基于Lucence自定義詞庫的全文檢索匹配方法及系統(tǒng)。
【背景技術(shù)】
[0002]Apache Lucence是一個開放源代碼的全文檢索引擎工具包,但它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎。
[0003]為了便于讀者理解,下面先對相關(guān)術(shù)語進行簡單說明:
[0004]Apache Lucence:Apache旗下一款開源全文檢索項目;
[0005]全文檢索:不同于傳統(tǒng)的模糊匹配,先對搜索詞按一定規(guī)則分詞后,再將分詞與源數(shù)據(jù)進行匹配,根據(jù)出現(xiàn)分詞次數(shù),分詞鄰近距離,權(quán)重等數(shù)據(jù)進行打分,獲得檢索結(jié)果;
[0006]分詞:全文檢索索引,例如:我是中國人,其分詞可為:我、是、中國、人、中國人等;
[0007]公共詞庫:存放公共分詞規(guī)則的詞庫,例如,常用的:你好、中國等;
[0008]自定義詞庫:根據(jù)自己需求,用于存放自己需要的分詞規(guī)則的字典詞庫;
[0009]搜索反饋:搜索效果反饋,即用戶輸入搜索詞進入搜索頁面后,是否有點擊頁面鏈接亦或在多次翻頁之后點擊鏈接;
[0010]搜索量:某一搜索詞某時段全站搜索量;
[0011]字段:需要搜索的字段,例如:游戲名、主播名、房間名等。
[0012I在Apache Lucence全文檢索中,需要對源數(shù)據(jù)進行分詞索引。若沒有針對特定詞組進行分詞處理,則該詞組無法被檢索到。例如,針對游戲直播領(lǐng)域的搜索,“英雄聯(lián)盟”、“Dota2”、“爐石傳說”等在公共詞庫中基本不會出現(xiàn)的詞匯,將很難被檢索到。因此,如何獲取用戶最需要檢索的詞匯,并生成自定義詞庫是在全文檢索領(lǐng)域一個重要的難點。

【發(fā)明內(nèi)容】

[0013]本發(fā)明的目的是為了克服上述【背景技術(shù)】的不足,提供一種基于Lucence自定義詞庫的全文檢索匹配方法及系統(tǒng),根據(jù)用戶輸入的搜索詞,能夠快速有效地建立自己專用的Lucence自定義詞庫。
[0014]本發(fā)明提供一種基于Lucence自定義詞庫的全文檢索匹配方法,包括以下步驟:
[0015]在基于Lucence全文檢索引擎的搜索環(huán)境中,實時獲取用戶輸入的搜索詞,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的搜索詞去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則對搜索到結(jié)果的搜索詞進行分詞處理,得到分詞后的若干詞組;對分詞后的若干詞組繼續(xù)進行搜索,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的分詞后的詞組去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則記錄搜索的時間、分詞后的搜索詞、搜索反饋信息,最終建立支持Lucence全文檢索的Lucence自定義詞庫。
[0016]在上述技術(shù)方案的基礎(chǔ)上,所述建立支持Lucence全文檢索的Lucence自定義詞庫之后,還包括以下步驟:在建立支持Lucence全文檢索的Lucence自定義詞庫的基礎(chǔ)上,根據(jù)字段的搜索量、搜索反饋信息及自定義權(quán)重變量線性疊加,按照字段權(quán)重動態(tài)分配公式定時計算字段權(quán)重值,再通過Lucence全文檢索引擎的權(quán)重設(shè)置接口,將計算得到的字段權(quán)重值動態(tài)賦值給字段。
[0017]在上述技術(shù)方案的基礎(chǔ)上,所述字段權(quán)重動態(tài)分配公式為:
[0018]boost = (a*n+0*m+3*In(t)+;r)*p,
[0019]其中,boost為某字段權(quán)重值,η為某時段該字段被檢索量,m為某時段該字段被檢索后具有完整搜索反饋的總量,t為某時段該字段被檢索后不完整搜索反饋的總量,r為自定義權(quán)重變量,a為檢索量的系數(shù)因子,β為完整搜索反饋的系數(shù)因子,δ為不完整搜索反饋的系數(shù)因子,P為全局協(xié)調(diào)系數(shù)因子。
[0020]在上述技術(shù)方案的基礎(chǔ)上,所述自定義權(quán)重變量為主播名、主播房間名或房間類型。
[0021]在上述技術(shù)方案的基礎(chǔ)上,當(dāng)系統(tǒng)出現(xiàn)轉(zhuǎn)型或用戶搜索喜好發(fā)生變化之后,所述自定義權(quán)重變量隨之改變。
[0022]本發(fā)明還提供一種基于Lucence自定義詞庫的全文檢索匹配系統(tǒng),該系統(tǒng)包括Lucence自定義詞庫建立單元,所述Lucence自定義詞庫建立單元用于建立支持Lucence全文檢索的Lucence自定義詞庫:在基于Lucence全文檢索引擎的搜索環(huán)境中,實時獲取用戶輸入的搜索詞,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的搜索詞去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則對搜索到結(jié)果的搜索詞進行分詞處理,得到分詞后的若干詞組;對分詞后的若干詞組繼續(xù)進行搜索,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的分詞后的詞組去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則記錄搜索的時間、分詞后的搜索詞、搜索反饋信息。
[0023]在上述技術(shù)方案的基礎(chǔ)上,該系統(tǒng)還包括字段權(quán)重動態(tài)分配單元,所述字段權(quán)重動態(tài)分配單元用于動態(tài)分配字段權(quán)重:在Lucence自定義詞庫的基礎(chǔ)上,根據(jù)字段的搜索量、搜索反饋信息及自定義權(quán)重變量線性疊加,按照字段權(quán)重動態(tài)分配公式定時計算字段權(quán)重值,再通過Lucence全文檢索引擎的權(quán)重設(shè)置接口,將計算得到的字段權(quán)重值動態(tài)賦值給字段。
[0024]在上述技術(shù)方案的基礎(chǔ)上,所述字段權(quán)重動態(tài)分配公式為:
[0025]boost = (a*n+0*m+3*In(t)+;r)*p,
[0026]其中,boost為某字段權(quán)重值,η為某時段該字段被檢索量,m為某時段該字段被檢索后具有完整搜索反饋的總量,t為某時段該字段被檢索后不完整搜索反饋的總量,r為自定義權(quán)重變量,例如:主播名、主播房間名、房間類型;a為檢索量的系數(shù)因子,β為完整搜索反饋的系數(shù)因子,S為不完整搜索反饋的系數(shù)因子,P為全局協(xié)調(diào)系數(shù)因子。
[0027]在上述技術(shù)方案的基礎(chǔ)上,所述自定義權(quán)重變量為主播名、主播房間名或房間類型。
[0028]在上述技術(shù)方案的基礎(chǔ)上,當(dāng)系統(tǒng)出現(xiàn)轉(zhuǎn)型或用戶搜索喜好發(fā)生變化之后,所述自定義權(quán)重變量隨之改變。
[0029]與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點如下:
[0030](I)本發(fā)明在基于Lucence全文檢索引擎的搜索環(huán)境中,建立用于進行Lucence全文檢索的Lucence自定義詞庫,實時獲取用戶輸入的搜索詞,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的搜索詞去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則對搜索到結(jié)果的搜索詞進行分詞處理,得到分詞后的若干詞組;對分詞后的若干詞組繼續(xù)進行檢索,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的分詞后的詞組去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則記錄搜索的時間、分詞后的搜索詞、搜索反饋信息。本發(fā)明根據(jù)用戶輸入的搜索詞,能夠快速有效地建立自己專用的Lucence自定義詞庫,形成符合當(dāng)前搜索環(huán)境的Lucence自定義詞庫,用于Lucence全文檢索,可達到更佳的搜索效果。例如,對于游戲直播,可能用戶更期望搜索關(guān)于“YYF”、“55開”、“安德羅妮”等信息,采用常規(guī)詞庫可能無法滿足這類需求。采用本發(fā)明實施例的方法,在首次搜索時,可能也不會得到最優(yōu)結(jié)果,但是,隨著Lucence自定義詞庫不斷迭代更新,搜索結(jié)果會隨著用戶的搜索量上漲逐漸優(yōu)化。
[0031](2)本發(fā)明在Lucence自定義詞庫的基礎(chǔ)上,動態(tài)分配字段權(quán)重:根據(jù)字段的搜索量、搜索反饋信息及自定義權(quán)重變量線性疊加,按照字段權(quán)重動態(tài)分配公式定時計算字段權(quán)重值,再通過Lucence全文檢索引擎的權(quán)重設(shè)置接口(setboost),將計算得到的字段權(quán)重值動態(tài)賦值給字段,能夠穩(wěn)定有效地動態(tài)分配各字段權(quán)重。當(dāng)系統(tǒng)出現(xiàn)轉(zhuǎn)型或用戶搜索喜好發(fā)生變化之后,自定義權(quán)重變量隨之改變。例如,搜索系統(tǒng)有以下幾個字段:主播名、主播房間名、房間類型。系統(tǒng)一開始需要搜索對主播名的搜索更側(cè)重,則只需要增大自定義權(quán)重,即字段權(quán)重動態(tài)分配公式中的自定義權(quán)重變量。
【附圖說明】
[0032]圖1是本發(fā)明實施例中基于Lucence自定義詞庫的全文檢索匹配方法的流程圖。
【具體實施方式】
[0033]下面結(jié)合附圖及具體實施例對本發(fā)明作進一步的詳細描述。
[0034]參見圖1所示,本發(fā)明實施例提供一種基于Lucence自定義詞庫的全文檢索匹配方法,包括以下步驟:
[0035]S1、建立支持Lucence全文檢索的Lucence自定義詞庫:在基于Lucence全文檢索引擎的搜索環(huán)境中,實時獲取用戶輸入的搜索詞,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的搜索詞去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則對搜索到結(jié)果的搜索詞進行分詞處理,得到分詞后的若干詞組;對分詞后的若干詞組繼續(xù)進行搜索,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的分詞后的詞組去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則記錄搜索的時間、分詞后的搜索詞、搜索反饋信息,最終建立支持Lucence全文檢索的Lucence自定義詞庫;
[0036]S2、動態(tài)分配字段權(quán)重:在建立支持Lucence全文檢索的Lucence自定義詞庫的基礎(chǔ)上,根據(jù)字段的搜索量、搜索反饋信息及自定義權(quán)重變量線性疊加,按照字段權(quán)重動態(tài)分配公式定時計算字段權(quán)重值,再通過Lucence全文檢索引擎的權(quán)重設(shè)置接口(setboost),將計算得到的字段權(quán)重值動態(tài)賦值給字段;
[0037]字段權(quán)重動態(tài)分配公式為:
[0038]boost = (a*n+0*m+3*In(t)+;r)*p,
[0039]其中,boost為某字段權(quán)重值,n為某時段該字段被檢索量,m為某時段該字段被檢索后具有完整搜索反饋的總量,t為某時段該字段被檢索后不完整搜索反饋的總量,r為自定義權(quán)重變量,例如:主播名、主播房間名、房間類型;a為檢索量的系數(shù)因子,β為完整搜索反饋的系數(shù)因子,S為不完整搜索反饋的系數(shù)因子,P為全局協(xié)調(diào)系數(shù)因子。
[0040]自定義權(quán)重變量可以為主播名、主播房間名或房間類型,當(dāng)系統(tǒng)出現(xiàn)轉(zhuǎn)型或用戶搜索喜好發(fā)生變化之后,自定義權(quán)重變量隨之改變。
[0041]本發(fā)明實施例還提供一種基于Lucence自定義詞庫的全文檢索匹配系統(tǒng),該系統(tǒng)包括Lucence自定義詞庫建立單元和字段權(quán)重動態(tài)分配單元,其中:
[0042]Lucence自定義詞庫建立單元用于建立支持Lucence全文檢索的Lucence自定義詞庫:在基于Lucence全文檢索引擎的搜索環(huán)境中,實時獲取用戶輸入的搜索詞,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的搜索詞去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則對搜索到結(jié)果的搜索詞進行分詞處理,得到分詞后的若干詞組;對分詞后的若干詞組繼續(xù)進行搜索,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的分詞后的詞組去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則記錄搜索的時間、分詞后的搜索詞、搜索反饋信息;
[0043]字段權(quán)重動態(tài)分配單元用于動態(tài)分配字段權(quán)重:在建立支持Lucence全文檢索的Lucence自定義詞庫的基礎(chǔ)上,根據(jù)字段的搜索量、搜索反饋信息及自定義權(quán)重變量線性疊加,按照字段權(quán)重動態(tài)分配公式定時計算字段權(quán)重值,再通過Lucence全文檢索引擎的權(quán)重設(shè)置接口(setboost),將計算得到的字段權(quán)重值動態(tài)賦值給字段;
[0044]字段權(quán)重動態(tài)分配公式為:
[0045]boost = (a*n+0*m+3*In(t)+;r)*p,
[0046]其中,boost為某字段權(quán)重值,η為某時段該字段被檢索量,m為某時段該字段被檢索后具有完整搜索反饋的總量,t為某時段該字段被檢索后不完整搜索反饋的總量,r為自定義權(quán)重變量,例如:主播名、主播房間名、房間類型;a為檢索量的系數(shù)因子,β為完整搜索反饋的系數(shù)因子,S為不完整搜索反饋的系數(shù)因子,P為全局協(xié)調(diào)系數(shù)因子。
[0047]自定義權(quán)重變量可以為主播名、主播房間名或房間類型,當(dāng)系統(tǒng)出現(xiàn)轉(zhuǎn)型或用戶搜索喜好發(fā)生變化之后,自定義權(quán)重變量隨之改變。
[0048]本發(fā)明實施例根據(jù)用戶輸入條件,能夠快速有效地建立自己專用的Lucence自定義詞庫,并且形成符合當(dāng)前搜索環(huán)境的Lucence自定義詞庫,用于Lucence全文檢索,可達到更佳的搜索效果。
[0049]例如,對于游戲直播,可能用戶更期望搜索關(guān)于“YYF”、“55開”、“安德羅妮”等信息,采用常規(guī)詞庫可能無法滿足這類需求。采用本發(fā)明實施例的方法,在首次搜索時,可能也不會得到最優(yōu)結(jié)果,但是,隨著Lucence自定義詞庫不斷迭代更新,搜索結(jié)果會隨著用戶的搜索量上漲逐漸優(yōu)化。
[0050]此外,在搜索系統(tǒng)中,權(quán)重往往被賦予為某一常量,這種設(shè)定在某一時期可能會得到良好的搜素結(jié)果。然而,隨著系統(tǒng)的轉(zhuǎn)型,用戶人群口味變更或者源數(shù)據(jù)的變化等因素,這一設(shè)定便將難以獲得準(zhǔn)確的結(jié)果。在多字段檢索中,如何根據(jù)搜索反饋效果,搜索量等因素動態(tài)分配各字段權(quán)重以達到最優(yōu)匹配結(jié)果,也是本領(lǐng)域技術(shù)人員需要重點考慮的。
[0051]例如,搜索系統(tǒng)中的用戶一開始只是對某幾個主播感興趣,則他們對主播名的搜索結(jié)果更加看重,系統(tǒng)中主播名的搜索量變化加大,搜索反饋效果也會最為良好,權(quán)重也會動態(tài)偏向這一字段;然而,隨著用戶對系統(tǒng)的逐漸了解,他們更對房間內(nèi)容關(guān)注更多,則相應(yīng)的其搜索量便會增大,且反饋效果也更為良好,自然,權(quán)重也會偏向到相應(yīng)的房間名及房間類型。
[0052]當(dāng)系統(tǒng)出現(xiàn)轉(zhuǎn)型或用戶搜索喜好發(fā)生變化之后,自定義權(quán)重變量隨之改變。例如,搜索系統(tǒng)有以下幾個字段:主播名、主播房間名、房間類型。系統(tǒng)一開始需要搜索對主播名的搜索更側(cè)重,則只需要增大自定義權(quán)重,即字段權(quán)重動態(tài)分配公式中的自定義權(quán)重變量。
[0053]本領(lǐng)域的技術(shù)人員可以對本發(fā)明實施例進行各種修改和變型,倘若這些修改和變型在本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則這些修改和變型也在本發(fā)明的保護范圍之內(nèi)。
[0054]說明書中未詳細描述的內(nèi)容為本領(lǐng)域技術(shù)人員公知的現(xiàn)有技術(shù)。
【主權(quán)項】
1.一種基于Lucence自定義詞庫的全文檢索匹配方法,其特征在于,包括以下步驟: 在基于Lucence全文檢索引擎的搜索環(huán)境中,實時獲取用戶輸入的搜索詞,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的搜索詞去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則對搜索到結(jié)果的搜索詞進行分詞處理,得到分詞后的若干詞組;對分詞后的若干詞組繼續(xù)進行搜索,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的分詞后的詞組去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則記錄搜索的時間、分詞后的搜索詞、搜索反饋信息,最終建立支持Lucence全文檢索的Lucence自定義詞庫。2.如權(quán)利要求1所述的基于Lucence自定義詞庫的全文檢索匹配方法,其特征在于:所述建立支持Lucence全文檢索的Lucence自定義詞庫之后,還包括以下步驟:在建立支持Lucence全文檢索的Lucence自定義詞庫的基礎(chǔ)上,根據(jù)字段的搜索量、搜索反饋信息及自定義權(quán)重變量線性疊加,按照字段權(quán)重動態(tài)分配公式定時計算字段權(quán)重值,再通過Lucence全文檢索引擎的權(quán)重設(shè)置接口,將計算得到的字段權(quán)重值動態(tài)賦值給字段。3.如權(quán)利要求2所述的基于Lucence自定義詞庫的全文檢索匹配方法,其特征在于:所述字段權(quán)重動態(tài)分配公式為:boost= (α 氺η+β氺 m+δ 氺 In(t)+r)氺P, 其中,boost為某字段權(quán)重值,η為某時段該字段被檢索量,m為某時段該字段被檢索后具有完整搜索反饋的總量,t為某時段該字段被檢索后不完整搜索反饋的總量,r為自定義權(quán)重變量,α為檢索量的系數(shù)因子,β為完整搜索反饋的系數(shù)因子,S為不完整搜索反饋的系數(shù)因子,P為全局協(xié)調(diào)系數(shù)因子。4.如權(quán)利要求3所述的基于Lucence自定義詞庫的全文檢索匹配方法,其特征在于:所述自定義權(quán)重變量為主播名、主播房間名或房間類型。5.如權(quán)利要求4所述的基于Lucence自定義詞庫的全文檢索匹配方法,其特征在于:當(dāng)系統(tǒng)出現(xiàn)轉(zhuǎn)型或用戶搜索喜好發(fā)生變化之后,所述自定義權(quán)重變量隨之改變。6.—種基于Lucence自定義詞庫的全文檢索匹配系統(tǒng),其特征在于:該系統(tǒng)包括Lucence自定義詞庫建立單元,所述Lucence自定義詞庫建立單元用于建立支持Lucence全文檢索的Lucence自定義詞庫:在基于Lucence全文檢索引擎的搜索環(huán)境中,實時獲取用戶輸入的搜索詞,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的搜索詞去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則對搜索到結(jié)果的搜索詞進行分詞處理,得到分詞后的若干詞組;對分詞后的若干詞組繼續(xù)進行搜索,檢測是否搜索到結(jié)果,如果搜索不到結(jié)果,則將搜索不到結(jié)果的分詞后的詞組去掉特殊字符,存入Lucence自定義詞庫;如果搜索到結(jié)果,則記錄搜索的時間、分詞后的搜索詞、搜索反饋信息。7.如權(quán)利要求6所述的基于Lucence自定義詞庫的全文檢索匹配系統(tǒng),其特征在于:該系統(tǒng)還包括字段權(quán)重動態(tài)分配單元,所述字段權(quán)重動態(tài)分配單元用于動態(tài)分配字段權(quán)重:在Lucence自定義詞庫的基礎(chǔ)上,根據(jù)字段的搜索量、搜索反饋信息及自定義權(quán)重變量線性疊加,按照字段權(quán)重動態(tài)分配公式定時計算字段權(quán)重值,再通過Lucence全文檢索引擎的權(quán)重設(shè)置接口,將計算得到的字段權(quán)重值動態(tài)賦值給字段。8.如權(quán)利要求7所述的基于Lucence自定義詞庫的全文檢索匹配系統(tǒng),其特征在于:所述字段權(quán)重動態(tài)分配公式為:boost= (α 氺η+β氺 m+δ 氺 In(t)+r)氺p, 其中,boost為某字段權(quán)重值,η為某時段該字段被檢索量,m為某時段該字段被檢索后具有完整搜索反饋的總量,t為某時段該字段被檢索后不完整搜索反饋的總量,r為自定義權(quán)重變量,例如:主播名、主播房間名、房間類型;α為檢索量的系數(shù)因子,β為完整搜索反饋的系數(shù)因子,S為不完整搜索反饋的系數(shù)因子,P為全局協(xié)調(diào)系數(shù)因子。9.如權(quán)利要求8所述的基于Lucence自定義詞庫的全文檢索匹配系統(tǒng),其特征在于:所述自定義權(quán)重變量為主播名、主播房間名或房間類型。10.如權(quán)利要求9所述的基于Lucence自定義詞庫的全文檢索匹配系統(tǒng),其特征在于:當(dāng)系統(tǒng)出現(xiàn)轉(zhuǎn)型或用戶搜索喜好發(fā)生變化之后,所述自定義權(quán)重變量隨之改變。
【文檔編號】G06F17/30GK106021430SQ201610321306
【公開日】2016年10月12日
【申請日】2016年5月16日
【發(fā)明人】白凡
【申請人】武漢斗魚網(wǎng)絡(luò)科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1