專利名稱:一種應(yīng)用的泛需求檢索方法及系統(tǒng)的制作方法
一種應(yīng)用的泛需求檢索方法及系統(tǒng)
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用領(lǐng)域,尤其涉及一種應(yīng)用的泛需求檢索方法及系統(tǒng)。
背景技術(shù):
目前,應(yīng)用(APP, Application)檢索主要包括泛需求檢索和精確檢索,所述泛需求檢索中,用戶輸入的查詢詞(query )描述的不是一個具體的應(yīng)用,而是一類應(yīng)用;例如,聽歌軟件、賽車游戲等?,F(xiàn)有技術(shù)中,依據(jù)用戶輸入的query進行應(yīng)用檢索的方法是:步驟1,對用戶輸入的query進行切詞,得到對應(yīng)的term列表,term列表包括切詞后得到的一個以上分詞,例如,query為“導(dǎo)航軟件哪個好”,對應(yīng)的term列表為“terml:導(dǎo)航、term2:軟件、term3:哪個、term4:好”;步驟2,依據(jù)term列表中的分詞在索引庫中進行匹配,得到匹配出的應(yīng)用列表;步驟3,依據(jù)匹配出應(yīng)用的名稱或標題計算應(yīng)用與query之間的相關(guān)性,并依據(jù)應(yīng)用的抽象質(zhì)量(如下載量、點擊量等)為應(yīng)用進行打分;步驟4,依據(jù)相關(guān)性和打分得到應(yīng)用的權(quán)重值,依據(jù)權(quán)重值由大到小的順序?qū)ζヅ涑龅膽?yīng)用進行排序,將排序后的應(yīng)用作為query的檢索結(jié)果提供給用戶。上述依據(jù)用戶輸入的query進行應(yīng)用檢索的方法應(yīng)用于精確檢索場景時能夠獲得良好的檢索效果,檢索結(jié)果能夠滿足用戶需求,但是應(yīng)用于泛需求檢索場景時檢索效果較差,例如,對query進行簡單切詞,并依據(jù)應(yīng)用的名稱和標題進行檢索,因而不能依據(jù)query準確定位用戶對某一類應(yīng)用的深層需求,也就不能得到準確的檢索結(jié)果,而且當檢索同一類應(yīng)用時,每個用戶表達query的習(xí)慣存在差異,但是檢索目的相同,如果僅僅依據(jù)query進行切詞和匹配,往往只能提供較少的檢索結(jié)果,檢索結(jié)果比較局限,不能滿足用戶的檢索需求。例如,以query為“導(dǎo)航軟件哪個好”為例,利用目前的方法,當數(shù)據(jù)庫中有百度地圖、高德地圖和凱立德手機導(dǎo)航三個應(yīng)用時,采用標題進行匹配檢索時,即應(yīng)用的名稱中必須明確包含query中的term,這樣只有“凱立德手機導(dǎo)航”能夠被檢索到;但是,對于query為“導(dǎo)航軟件哪個好”,用戶想要得到的其實是導(dǎo)航類應(yīng)用軟件,而不是某個具體的應(yīng)用軟件,因此,這種方式得到的檢索結(jié)果存在局限,不能夠滿足用戶的檢索需求。
發(fā)明內(nèi)容本發(fā)明提供了一種應(yīng)用的泛需求檢索方法及系統(tǒng),能夠提高泛需求檢索場景中檢索結(jié)果的多樣性和相關(guān)性。本發(fā)明的具體技術(shù)方案如下:根據(jù)本發(fā)明一優(yōu)選實施例,一種應(yīng)用的泛需求檢索方法,包括:對泛需求檢索的查詢詞進行解析,得到所述查詢詞的概念標簽或?qū)傩詷撕?;所述概念標簽和屬性標簽分別描述應(yīng)用的類別和屬性;依據(jù)所述查詢詞的概念標 簽或?qū)傩詷撕炘陬A(yù)設(shè)的應(yīng)用標簽體系中進行匹配,得到包含所述概念標簽或?qū)傩詷撕灥膽?yīng)用;依據(jù)所述查詢詞的概念標簽或?qū)傩詷撕灚@得所述應(yīng)用的相關(guān)性分數(shù),并依據(jù)相關(guān)性分數(shù)對應(yīng)用進行排序,將排序后的應(yīng)用作為查詢詞的檢索結(jié)果提供給用戶。上述方法中,該方法還包括:接收用戶輸入的查詢詞,并從所述查詢詞中識別出泛需求檢索的查詢詞。上述方法中,所述對泛需求檢索的查詢詞進行解析具體包括:依據(jù)所述查詢詞中的字在預(yù)設(shè)的單詞查找樹中查找子樹,在找到的子樹上依據(jù)查詢詞的下一個字繼續(xù)查找子樹,直到查詢詞中最后一個字;利用在單詞查找樹中找到的最后一個字、第一個字以及路徑中的字組成標簽;依據(jù)所述標簽的標志位信息進行判斷,標志位信息為概念標識時,所述標簽是概念標簽,標志位信息為屬性標識時,所述標簽為屬性標簽。上述方法中,所述應(yīng)用標簽體系為樹狀結(jié)構(gòu)的應(yīng)用的標簽體系,所述標簽包括應(yīng)用的概念標簽和屬性標簽,每個概念標簽對應(yīng)一個以上屬性標簽。上述方法中,所述應(yīng)用的相關(guān)性分數(shù)等于查詢詞的概念標簽在應(yīng)用中的分數(shù)與查詢詞的屬性標簽在應(yīng)用中的分數(shù)的和值。上述方法中,所述查詢詞的概念標簽在應(yīng)用中的分數(shù)利用如下公式獲得:
權(quán)利要求
1.一種應(yīng)用的泛需求檢索方法,其特征在于,該方法包括: 對泛需求檢索的查詢詞進行解析,得到所述查詢詞的概念標簽或?qū)傩詷撕?;所述概念標簽和屬性標簽分別描述應(yīng)用的類別和屬性; 依據(jù)所述查詢詞的概念標簽或?qū)傩詷撕炘陬A(yù)設(shè)的應(yīng)用標簽體系中進行匹配,得到包含所述概念標簽或?qū)傩詷撕灥膽?yīng)用; 依據(jù)所述查詢詞的概念標簽或?qū)傩詷撕灚@得所述應(yīng)用的相關(guān)性分數(shù),并依據(jù)相關(guān)性分數(shù)對應(yīng)用進行排序,將排序后的應(yīng)用作為查詢詞的檢索結(jié)果提供給用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法還包括: 接收用戶輸入的查詢詞,并從所述查詢詞中識別出泛需求檢索的查詢詞。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對泛需求檢索的查詢詞進行解析具體包括: 依據(jù)所述查詢詞中的字在預(yù)設(shè)的單詞查找樹中查找子樹,在找到的子樹上依據(jù)查詢詞的下一個字繼續(xù)查找子樹,直到查詢詞中最后一個字; 利用在單詞查找樹中找到的最后一個字、第一個字以及路徑中的字組成標簽; 依據(jù)所述標簽的標志位信息進行判斷,標志位信息為概念標識時,所述標簽是概念標簽,標志位信息為屬性標識時,所述標簽為屬性標簽。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于, 所述應(yīng)用標簽體系為樹狀結(jié)構(gòu)的應(yīng)用的標簽體系,所述標簽包括應(yīng)用的概念標簽和屬性標簽,每個概念標簽對應(yīng)一個以上屬性標簽。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述應(yīng)用的相關(guān)性分數(shù)等于查詢詞的概念標簽在應(yīng)用中的分數(shù)與查詢詞的屬性標簽在應(yīng)用中的分數(shù)的和值。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述查詢詞的概念標簽在應(yīng)用中的分數(shù)利用如下公式獲得:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,當查詢詞解析得到標簽中有概念標簽且沒有屬性標簽時,查詢詞中概念標簽的總分數(shù)等于泛需求檢索的總分數(shù);當查詢詞解析得到的標簽中有概念標簽和屬性標簽時,查詢詞中概念標簽的總分數(shù)等于泛需求檢索的總分數(shù)與概念標簽的調(diào)節(jié)因子的乘積;其他情況下,查詢詞中概念標簽的總分數(shù)等于O。
8.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述查詢詞的屬性標簽在應(yīng)用中的分數(shù)利用如下公式獲得:
9.根據(jù)權(quán)利要求8述的方法,其特征在于,當查詢詞解析得到標簽中有屬性標簽且沒有概念標簽時,查詢詞中屬性標簽的總分數(shù)等于泛需求檢索的總分數(shù);當查詢詞解析得到的標簽中有屬性標簽和概念標簽時,查詢詞中屬性標簽的總分數(shù)等于泛需求檢索的總分數(shù)與屬性標簽的調(diào)節(jié)因子的乘積;其他情況下,泛需求檢索的總分數(shù)等于O。
10.據(jù)權(quán)利要求6或8所述的方法,其特征在于,所述查詢詞中概念標簽的重要度以及查詢詞中屬性標簽的重要度的值域范圍是(Ti。
11.一種應(yīng)用的泛需求檢索系統(tǒng),其特征在于,該系統(tǒng)包括:基礎(chǔ)檢索模塊、數(shù)據(jù)分析模塊;其中, 基礎(chǔ)檢索模塊,用于對數(shù)據(jù)分析模塊發(fā)送的泛需求檢索的查詢詞進行解析,得到所述查詢詞的概念標簽或?qū)傩詷撕?;所述概念標簽和屬性標簽分別描述應(yīng)用的類別和屬性;依據(jù)所述查詢詞的概念標簽或?qū)傩詷撕炘陬A(yù)設(shè)的應(yīng)用標簽體系中進行匹配,得到包含所述概念標簽或?qū)傩詷撕灥膽?yīng)用;依據(jù)所述查詢詞的概念標簽或?qū)傩詷撕灚@得所述應(yīng)用的相關(guān)性分數(shù),并依據(jù)相關(guān)性分數(shù)對應(yīng)用進行排序,將排序后的應(yīng)用作為查詢詞的檢索結(jié)果提供給用戶。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,該系統(tǒng)還包括高級檢索模塊;其中, 高級檢索模塊,用于接收用戶輸入的查詢詞,并發(fā)送給數(shù)據(jù)分析模塊; 所述數(shù)據(jù)分析模塊,用于從所述查詢詞中識別出泛需求檢索的查詢詞。
13.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述基礎(chǔ)檢索模塊在對泛需求檢索的查詢詞進行解析時,具體包括: 依據(jù)所述查詢詞中的字在預(yù)設(shè)的單詞查找樹中查找子樹,在找到的子樹上依據(jù)查詢詞的下一個字繼續(xù)查找子樹,直 到查詢詞中最后一個字; 利用在單詞查找樹中找到的最后一個字、第一個字以及路徑中的字組成標簽; 依據(jù)所述標簽的標志位信息進行判斷,標志位信息為概念標識時,所述標簽是概念標簽,標志位信息為屬性標識時,所述標簽為屬性標簽。
14.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于, 所述應(yīng)用標簽體系為樹狀結(jié)構(gòu)的應(yīng)用的標簽體系,所述標簽包括應(yīng)用的概念標簽和屬性標簽,每個概念標簽對應(yīng)一個以上屬性標簽。
15.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述應(yīng)用的相關(guān)性分數(shù)等于查詢詞的概念標簽在應(yīng)用中的分數(shù)與查詢詞的屬性標簽在應(yīng)用中的分數(shù)的和值。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,所述查詢詞的概念標簽在應(yīng)用中的分數(shù)利用如下公式獲得: c_mm weight—concept = Σ 譬_C(m-wei*」x—base—concepi i=0 其中,c_num為應(yīng)用命中查詢詞中概念標簽的個數(shù),i表示應(yīng)用命中查詢詞中第i個概念標簽,q_con_wei_i為查詢詞中第i個概念標簽的重要度,tag_base_concept為查詢詞中概念標簽的總分數(shù)。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其特征在于,當查詢詞解析得到標簽中有概念標簽且沒有屬性標簽時,查詢詞中概念標簽的總分數(shù)等于泛需求檢索的總分數(shù);當查詢詞解析得到的標簽中有概念標簽和屬性標簽時,查詢詞中概念標簽的總分數(shù)等于泛需求檢索的總分數(shù)與概念標簽的調(diào)節(jié)因子的乘積;其他情況下,查詢詞中概念標簽的總分數(shù)等于O。
18.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,所述查詢詞的屬性標簽在應(yīng)用中的分數(shù)利用如下公式獲得:
19.根據(jù)權(quán)利要求18述的系統(tǒng),其特征在于,當查詢詞解析得到標簽中有屬性標簽且沒有概念標簽時,查詢詞中屬性標簽的總分數(shù)等于泛需求檢索的總分數(shù);當查詢詞解析得到的標簽中有屬性標簽和概念標簽時,查詢詞中屬性標簽的總分數(shù)等于泛需求檢索的總分數(shù)與屬性標簽的調(diào)節(jié)因子的乘積;其他情況下,泛需求檢索的總分數(shù)等于O。
20.根據(jù)權(quán)利要求16或18所述的系統(tǒng),其特征在于,所述查詢詞中概念標簽的重要度以及查詢詞中屬性標簽的重要度的值域范圍是(Ti。
全文摘要
本發(fā)明提供了一種應(yīng)用的泛需求檢索方法及系統(tǒng),該方法包括對泛需求檢索的查詢詞進行解析,得到所述查詢詞的概念標簽或?qū)傩詷撕?;所述概念標簽和屬性標簽分別描述應(yīng)用的類別和屬性;依據(jù)所述查詢詞的概念標簽或?qū)傩詷撕炘陬A(yù)設(shè)的應(yīng)用標簽體系中進行匹配,得到包含所述概念標簽或?qū)傩詷撕灥膽?yīng)用;依據(jù)所述查詢詞的概念標簽或?qū)傩詷撕灚@得所述應(yīng)用的相關(guān)性分數(shù),并依據(jù)相關(guān)性分數(shù)對應(yīng)用進行排序,將排序后的應(yīng)用作為查詢詞的檢索結(jié)果提供給用戶。根據(jù)本發(fā)明提供的技術(shù)方案,能夠提高泛需求檢索場景中檢索結(jié)果的多樣性和相關(guān)性。
文檔編號G06F17/30GK103150356SQ20131005628
公開日2013年6月12日 申請日期2013年2月22日 優(yōu)先權(quán)日2013年2月22日
發(fā)明者王亞, 洪庚偉 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司