亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種地址查詢串解析方法及裝置的制造方法

文檔序號:9304553閱讀:273來源:國知局
一種地址查詢串解析方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及地理位置搜索技術領域,尤其涉及一種地址查詢串解析方法及裝置。
【背景技術】
[0002]現(xiàn)有地址搜索已經(jīng)是人們使用地圖產(chǎn)品的重要業(yè)務。通過地址搜索,人們可以實現(xiàn)對特定目的地、生活類服務、路途規(guī)劃的應用需求。
[0003]然而地址搜索具備自身的特殊性。在地圖搜索引擎中,POI (Point of Interest,興趣點)等數(shù)據(jù)在建立倒排索引時,是以空間來區(qū)分的。找到正確的空間范圍來檢索用戶的需求至關重要。
[0004]通常,在地圖搜索時,用戶不會自己指定出空間范圍。對空間范圍的解析往往需要通過計算機分析用戶的查詢串來得到。在解析出空間范圍之后,還需要從用戶的查詢串中提取出用戶真正想要搜索的POI (或者地址),再能在正確的空間范圍檢索出用戶真實的搜索需求。簡而言之,就是需要計算機分析出用戶“想在什么地方”搜素“什么東西”,又稱之為“where what ”解析問題。
[0005]例如,用戶查詢“北京市朝陽區(qū)阜通東大街方恒國際中心”,用戶是期望在“北京市朝陽區(qū)阜通東大街”的范圍內(nèi)搜索“方恒國際中心”,而現(xiàn)有的地址搜索并不能準確的解析出用戶查詢意圖,通常會在“北京市”的范圍內(nèi)搜索“朝陽區(qū)阜通東大街方恒國際中心”,不能準確的得到搜索結果,用戶體驗不好。亟需要一種可以準確分析出查詢串中的where信息和what信息,從而在正確的空間范圍查詢找正確的內(nèi)容串,以提升搜索質量。

【發(fā)明內(nèi)容】

[0006]本發(fā)明實施例提供一種地址查詢串解析方法及裝置,用以解決現(xiàn)有技術中在地址搜索結果不準確的問題。
[0007]本發(fā)明實施例提供一種地址查詢串解析方法,該方法包括:
[0008]獲取用戶輸入的地址查詢串并通過地理信息系統(tǒng)GEO解析,得到地址串;
[0009]將所述地址串中地址成分和非地址成分通過模式識別進行修正,得到修正地址查詢串;
[0010]根據(jù)所述修正地址查詢串分別構造一級子串和二級子串,作為解析結果。
[0011]所述方法還包括:
[0012]根據(jù)預先設定的過濾詞表,過濾所述一級子串和二級子串中非地址成分,將過濾后的所述一級子串和二級子串作為解析結果。
[0013]所述過濾所述一級子串和二級子串中非地址成分,包括:
[0014]確定所述非地址成分是否命中所述過濾詞表,若是,直接過濾;否則,繼續(xù)如下步驟;
[0015]確定所述非地址成分是否為類別詞,若是,直接過濾;否則,繼續(xù)如下步驟;
[0016]確定所述非地址成分是否為門址類詞,若是,直接過濾;否則,不過濾。
[0017]所述分別構造一級子串和二級子串,包括:
[0018]獲取所述修正地址查詢串中區(qū)縣級別的空間信息和最小地址片段的空間信息;
[0019]在所述區(qū)縣級別的空間信息范圍搜索區(qū)縣級別以下的查詢串片段,作為一級子串;
[0020]在所述最小地址片段的空間信息范圍搜索最小地址片段之后的查詢串片段,作為二級子串。
[0021]所述將所述地址串中地址成分和非地址成分通過模式識別進行修正,包括:
[0022]獲取所述地址成分前的非地址成分mstart和地址成分后的非地址成分mend ;
[0023]通過模式識別,判斷所述mstart和mend是否為重要;
[0024]若所述mstart為重要及所述mend為不重要,則將所述mend加入所述地址成分中的街道片段之后;將所述mstart內(nèi)容寫入所述mend ;將所述mstart內(nèi)容置空;
[0025]若所述mstart和mend均為重要,則將所述mstart內(nèi)容置空;
[0026]若所述mstart為不重要及所述mend為重要,則將所述mstart內(nèi)容置空。
[0027]所述方法還包括:
[0028]若所述mstart內(nèi)容為空,則不進行模式識別。
[0029]所述通過模式識別,判斷所述mstart和mend是否為重要,包括:
[0030]確定所述非地址成分是否為連鎖店名稱詞或品牌詞,若是,判定為重要,否則,繼續(xù)如下步驟;
[0031]確定所述非地址成分是否為類別詞,若是,判定為不重要,否則,繼續(xù)如下步驟;
[0032]對所述非地址成分分詞,確定所述非地址成分為區(qū)域性地址詞加類別詞,若是,判定為重要,否則,判定為不重要。
[0033]一種地址查詢串解析裝置,該裝置包括:
[0034]GEO解析模塊,用于獲取用戶輸入的地址查詢串并通過地理信息系統(tǒng)GEO解析,得到地址串;
[0035]模式識別模塊,用于將所述地址串中地址成分和非地址成分通過模式識別進行修正,得到修正地址查詢串;
[0036]子串構造模塊,根據(jù)所述修正地址查詢串分別構造一級子串和二級子串,作為解析結果。
[0037]所述裝置還包括過濾詞表模塊,用于根據(jù)預先設定的過濾詞表,過濾所述一級子串和二級子串中非地址成分,將過濾后的所述一級子串和二級子串作為解析結果。
[0038]所述過濾詞表模塊,包括:
[0039]過濾詞表判定子模塊,用于確定所述非地址成分是否命中所述過濾詞表;
[0040]類別詞判定子模塊,確定所述非地址成分是否為類別詞;
[0041]門址類詞判定子模塊,確定所述非地址成分是否為門址類詞。
[0042]所述子串構造模塊,包括:
[0043]空間信息獲取子模塊,用于獲取所述修正地址查詢串中區(qū)縣級別的空間信息和最小地址片段的空間信息;
[0044]—級子串構造子模塊,用于在所述區(qū)縣級別的空間信息范圍搜索區(qū)縣級別以下的查詢串片段,作為一級子串;
[0045]二級子串構造子模塊,用于在所述最小地址片段的空間信息范圍搜索最小地址片段之后的查詢串片段,作為二級子串。
[0046]所述模式識別模塊,包括:
[0047]地址劃分子模塊,用于獲取所述地址成分前的非地址成分mstart和地址成分后的非地址成分mend ;
[0048]模式識別子模塊,用于通過模式識別判斷所述mstart和mend是否為重要;若所述mstart為重要及所述mend為不重要,則將所述mend加入所述地址成分中的街道片段之后;將所述mstart內(nèi)容寫入所述mend ;將所述mstart內(nèi)容置空;若所述mstart和mend均為重要,則將所述mstart內(nèi)容置空;若所述mstart為不重要及所述mend為重要,則將所述mstart內(nèi)容置空。
[0049]所述模式識別子模塊,還用于確定所述非地址成分是否為連鎖店名稱詞或品牌詞,若是,判定為重要;確定所述非地址成分是否為類別詞,若是,判定為不重要;對所述非地址成分分詞,確定所述非地址成分為區(qū)域性地址詞加類別詞,若是,判定為重要,否則,判定為不重要。
[0050]本發(fā)明實施例通過獲取用戶輸入的地址查詢串并通過地理信息系統(tǒng)GEO解析,得到地址串;將所述地址串中地址成分和非地址成分通過模式識別進行修正,得到修正地址查詢串;根據(jù)所述修正地址查詢串分別構造一級子串和二級子串,作為解析結果。通過解析結果、在兩層空間內(nèi)做出where what解析,可以更加有益于擴大地址搜索引擎的召回率,得到用戶更加期望的結果;在此基礎上,本發(fā)明實施例做了兩層what的過濾,可以在保證擴大召回率的基礎上,減少無關結果的召回,保證召回的準確度。
【附圖說明】
[0051]圖1為本發(fā)明實施例1提供的地址查詢串解析方法流程圖;
[0052]圖2為本發(fā)明實施例2提供的地址查詢串解析方法流程圖;
[0053]圖3為本發(fā)明實施例5提供的查詢地址串解析裝置結構示意圖;
[0054]圖4為本發(fā)明實施例6提供的過濾詞表模塊34結構示意圖;
[0055]圖5為本發(fā)明實施例7提供的子串構造模塊33結構示意圖;
[0056]圖6為本發(fā)明實施例8提供的模式識別模塊32結構示意圖。
【具體實施方式】
[0057]本發(fā)明實施例通過獲取用戶輸
當前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1