一種查詢標(biāo)簽的歸一化處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其設(shè)及一種查詢標(biāo)簽的歸一化處理方法和裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,越來越多的app( Application,應(yīng)用程序)在應(yīng)用市 場中被提供給用戶下載安裝使用,app在應(yīng)用市場中會(huì)被設(shè)置對(duì)應(yīng)的查詢標(biāo)簽,運(yùn)些查詢標(biāo) 簽通常是通過類別、功能、適用場景、用戶評(píng)價(jià)、用戶屬性等維度來描述app的詞或短語,從 而用戶可W通過使用包括一個(gè)或多個(gè)的查詢標(biāo)簽的查詢語句在應(yīng)用市場中捜索app,例如 查詢語句"好玩的游戲"中包括查詢標(biāo)簽"好玩"和"游戲"、查詢語句"不花錢的聊天工具"中 包括查詢標(biāo)簽"不花錢"和"聊天工具"?,F(xiàn)有技術(shù)中,通常需要app被設(shè)置的應(yīng)用標(biāo)簽與用戶 輸入的查詢標(biāo)簽完全一致,才能被判定為捜索命中并將命中的app作為捜索結(jié)果返回給用 戶,但是由于漢字可能存在多種表達(dá)方式可W表示相同語義,用戶使用的語義表達(dá)方式與 目標(biāo)app設(shè)置的查詢標(biāo)簽的語義表達(dá)方式經(jīng)常存在偏差,導(dǎo)致用戶輸入的查詢語句無法捜 索到目標(biāo)app。
【發(fā)明內(nèi)容】
[0003] 有鑒于此,本發(fā)明實(shí)施例提供了一種查詢標(biāo)簽的歸一化處理方法和裝置,可將相 關(guān)語義的查詢標(biāo)簽歸一化處理。
[0004] 為了解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了一種查詢標(biāo)簽的歸一化處理方法, 所述方法包括:
[0005] 從查詢?nèi)罩局蟹治龅玫秸Z義相關(guān)的查詢語句對(duì),所述查詢?nèi)罩景ǘ鄠€(gè)查詢會(huì)話 記錄,每個(gè)查詢會(huì)話記錄中包括至少一個(gè)查詢語句;
[0006] 從所述語義相關(guān)的查詢語句對(duì)中抽取語義相關(guān)的查詢標(biāo)簽對(duì),所述查詢標(biāo)簽對(duì)包 括第一查詢標(biāo)簽和第二查詢標(biāo)簽;
[0007] 根據(jù)所述第一查詢標(biāo)簽和所述第二查詢標(biāo)簽分別在所述查詢?nèi)罩局谐霈F(xiàn)的頻次, W及所述第一查詢標(biāo)簽和所述第二查詢標(biāo)簽出現(xiàn)在所述查詢?nèi)罩局型徊樵儠?huì)話記錄的 頻次,確定所述第一查詢標(biāo)簽和第二查詢標(biāo)簽的標(biāo)簽相關(guān)度;
[000引若所述標(biāo)簽相關(guān)度滿足預(yù)設(shè)闊值,則將所述第一查詢標(biāo)簽和第二查詢標(biāo)簽歸一化 處理,所述歸一化處理包括設(shè)置所述第一查詢標(biāo)簽和第二查詢標(biāo)簽相互為對(duì)方的歸一化查 詢標(biāo)簽。
[0009] 相應(yīng)地,本發(fā)明實(shí)施例還提供了一種查詢標(biāo)簽的歸一化處理裝置,所述裝置包括:
[0010] 查詢語句匹配模塊,用于從查詢?nèi)罩局蟹治龅玫秸Z義相關(guān)的查詢語句對(duì),所述查 詢?nèi)罩景ǘ鄠€(gè)查詢會(huì)話記錄,每個(gè)查詢會(huì)話記錄中包括至少一個(gè)查詢語句;
[0011] 查詢標(biāo)簽匹配模塊,用于從所述語義相關(guān)的查詢語句對(duì)中抽取語義相關(guān)的查詢標(biāo) 簽對(duì),所述查詢標(biāo)簽對(duì)包括第一查詢標(biāo)簽和第二查詢標(biāo)簽;
[0012] 相關(guān)標(biāo)簽判斷模塊,用于根據(jù)所述第一查詢標(biāo)簽和所述第二查詢標(biāo)簽分別在所述 查詢?nèi)罩局谐霈F(xiàn)的頻次,w及所述第一查詢標(biāo)簽和所述第二查詢標(biāo)簽出現(xiàn)在所述查詢?nèi)罩?中同一查詢會(huì)話記錄的頻次,確定所述第一查詢標(biāo)簽和第二查詢標(biāo)簽的標(biāo)簽相關(guān)度;
[0013] 歸一化處理模塊,用于若所述標(biāo)簽相關(guān)度滿足預(yù)設(shè)闊值,則將所述第一查詢標(biāo)簽 和第二查詢標(biāo)簽歸一化處理,所述歸一化處理包括設(shè)置所述第一查詢標(biāo)簽和第二查詢標(biāo)簽 相互為對(duì)方的歸一化查詢標(biāo)簽。
[0014] 本發(fā)明實(shí)施例通過從查詢?nèi)罩局谐槿〔樵冋Z句對(duì),進(jìn)而從查詢語句對(duì)中提取語義 相關(guān)的查詢標(biāo)簽對(duì),并根據(jù)查詢標(biāo)簽對(duì)分別在查詢?nèi)罩局械某霈F(xiàn)頻次W及同時(shí)出現(xiàn)在同一 查詢會(huì)話的頻次,判斷查詢標(biāo)簽對(duì)之間的標(biāo)簽相關(guān)度,從而可W將標(biāo)簽相關(guān)度滿足預(yù)設(shè)闊 值的查詢標(biāo)簽對(duì)進(jìn)行歸一化處理,使得后續(xù)在接收到包含相關(guān)查詢標(biāo)簽的查詢語句時(shí),可 W根據(jù)該查詢標(biāo)簽及其歸一化查詢標(biāo)簽返回查詢結(jié)果,就實(shí)現(xiàn)了根據(jù)用戶輸入的查詢標(biāo)簽 向用戶返回的更多相似語義查詢結(jié)果,能夠有效避免因目標(biāo)對(duì)象采用相似語義的查詢標(biāo)簽 而無法根據(jù)用戶輸入的查詢標(biāo)簽查詢命中的情況發(fā)生,即提高了查詢命中率。
【附圖說明】
[0015] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可W 根據(jù)運(yùn)些附圖獲得其他的附圖。
[0016] 圖1是本發(fā)明實(shí)施例中的一種查詢標(biāo)簽的歸一化處理方法的流程示意圖;
[0017] 圖2是本發(fā)明另一實(shí)施例中的查詢標(biāo)簽的歸一化處理方法的流程示意圖;
[0018] 圖3是本發(fā)明另一實(shí)施例中的查詢標(biāo)簽的歸一化處理方法的流程示意圖;
[0019] 圖4是本發(fā)明另一實(shí)施例中的查詢標(biāo)簽的歸一化處理方法的流程示意圖;
[0020] 圖5是本發(fā)明實(shí)施例中的一種查詢標(biāo)簽的歸一化處理裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0021] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0022] 本發(fā)明實(shí)施例中的查詢標(biāo)簽的歸一化處理方法和裝置,可W實(shí)現(xiàn)在計(jì)算機(jī)系統(tǒng) 中,例如網(wǎng)絡(luò)捜索服務(wù)器中,進(jìn)行查詢標(biāo)簽的歸一化處理,進(jìn)而根據(jù)歸一化處理后的查詢標(biāo) 簽向用戶返回查詢結(jié)果。
[0023] 圖1是本發(fā)明實(shí)施例中的一種查詢標(biāo)簽的歸一化處理方法的流程示意圖,如圖所 示實(shí)施例中的查詢標(biāo)簽的歸一化處理方法可W包括W下流程:
[0024] S101,從查詢?nèi)罩局蟹治龅玫秸Z義相關(guān)的查詢語句對(duì),所述查詢?nèi)罩景ǘ鄠€(gè)查 詢會(huì)話記錄,每個(gè)查詢會(huì)話記錄中包括至少一個(gè)查詢語句。
[0025] 具體的,所述查詢?nèi)罩臼潜景l(fā)明的查詢標(biāo)簽的歸一化處理裝置(下文也稱歸一化 處理裝置)在根據(jù)接收到的查詢語句進(jìn)行網(wǎng)絡(luò)捜索過程中記錄得到的,每個(gè)查詢會(huì)話記錄 為歸一化處理裝置為某個(gè)查詢請(qǐng)求對(duì)象在一定時(shí)間段內(nèi)的查詢記錄,例如可W根據(jù)從某個(gè) 用戶開始訪問該歸一化處理裝置,直至該用戶終止本次訪問該歸一化處理裝置(例如退出 登錄、關(guān)閉捜索頁面、退出應(yīng)用等),運(yùn)期間歸一化處理裝置根據(jù)該用戶的查詢請(qǐng)求進(jìn)行查 詢的過程,得到一個(gè)查詢會(huì)話記錄,該查詢會(huì)話記錄可W記錄查詢請(qǐng)求對(duì)象的對(duì)象標(biāo)識(shí)(例 如用戶標(biāo)識(shí)),查詢時(shí)間W及查詢對(duì)象每次提交的查詢語句。所述查詢語句可W例如"益智 類的游戲"、"不花錢的聊天工具"W及"萬能的視頻播放軟件"等。
[0026] 語義相關(guān)的查詢語句,可W為捜索同一目標(biāo)對(duì)象的查詢語句。判斷查詢語句是否 語義相關(guān),進(jìn)而將語義相關(guān)的查詢語句組成查詢語句對(duì),本發(fā)明實(shí)施例提供兩種方式:
[0027] -是可W通過分析查詢?nèi)罩局械牟樵冋Z句的語句結(jié)構(gòu)和語義,判斷兩個(gè)查詢語句 之間是否語義相關(guān),例如根據(jù)預(yù)設(shè)的語義模板,從所述查詢?nèi)罩局刑崛》纤稣Z義模板 的查詢語句,所述符合所述語義模板的查詢語句兩兩組成所述語義相關(guān)的查詢語句對(duì)。所 述語義模板可W例如"***的游戲"、"***的閱讀工具"或"***的瀏覽器"等等,并且可W不限 定除模板外的字符數(shù)一定要與的數(shù)量相同,例如"益智類的棋牌游戲"與"鍛煉大腦的棋 牌游戲"都可W被認(rèn)為符合語義模板"***的棋牌游戲"的查詢語句。
[0028] 二是可W通過分析查詢語句的提交場景的相關(guān)度,并結(jié)合查詢語句的語句結(jié)構(gòu)和 語義的相關(guān)度,判斷兩個(gè)查詢語句之間是否語義相關(guān),例如根據(jù)預(yù)設(shè)的查詢標(biāo)簽集合,判斷 屬于同一查詢會(huì)話記錄中包含所述查詢標(biāo)簽集合中的查詢標(biāo)簽的至少兩個(gè)查詢語句是否 語義對(duì)齊,若是則確定該兩個(gè)查詢語句為相互語義相關(guān)的查詢語句。運(yùn)里提及的查詢標(biāo)簽 集合,不是歸一化標(biāo)簽集合,其包含的查詢標(biāo)簽之間不一定語義相關(guān)或相似。由于用戶在一 定時(shí)間內(nèi)很有可能只是針對(duì)同一目標(biāo)對(duì)象進(jìn)行捜索,因此屬于同一查詢會(huì)話記錄的查詢語 句相關(guān)的可能性較高,進(jìn)而將同屬于一個(gè)查詢會(huì)話記錄的查詢語句比較是否語義對(duì)齊,從 而可W得到兩查詢語句之間是否語義相關(guān)的判斷結(jié)果。所述語義對(duì)齊,可W為首先分別在 兩個(gè)查詢語句中找到其中包含的預(yù)設(shè)查詢標(biāo)簽集合中的查詢標(biāo)簽,進(jìn)而分別在各查詢語句 中除去其包含的查詢標(biāo)簽,剩余部分若基本一致或完全一致,則可W認(rèn)為兩個(gè)查詢語句語 義對(duì)齊。
[0029] 需要說明的是,W上僅為示例說明,不應(yīng)被用于限定本發(fā)明的保護(hù)范圍,本領(lǐng)域技 術(shù)人員基于上述示例和精神,可W得到更多可實(shí)現(xiàn)的實(shí)施例,即可W通過其他方式從查詢 日志中分析得到語義相關(guān)的查詢語句對(duì)。
[0030] S102,從所述語義相關(guān)的查詢語句對(duì)中抽取語義相關(guān)的查詢標(biāo)簽對(duì),所述查詢標(biāo) 簽對(duì)包括第一查詢標(biāo)簽和第二查詢標(biāo)簽。
[0031] 在可選實(shí)施例中,在確定得到語義相關(guān)的查詢語句對(duì)后,可W將查詢語句對(duì)中語 義相同或?qū)R的部分去除,從而從剩余部分得到查詢標(biāo)簽對(duì),例如上述根據(jù)預(yù)設(shè)的語義模 板,從所述查詢?nèi)罩局刑崛》纤稣Z義模板的查詢語句,將查詢語句對(duì)中的查詢語句中 的語義模板部分去除,剩余部分即為語義相關(guān)的查詢標(biāo)簽對(duì);又例如上述根據(jù)預(yù)設(shè)的查詢 標(biāo)簽集合,通過確定屬于同一查詢會(huì)話記錄中包含所述查詢標(biāo)簽集合中的查詢標(biāo)簽的至少 兩個(gè)