一種未知道路與已知道路關(guān)聯(lián)關(guān)系的分析方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及地理信息技術(shù)領(lǐng)域,特別是涉及一種未知道路與已知道路關(guān)聯(lián)關(guān)系的分析方法和裝置。
【背景技術(shù)】
[0002]目前有許多領(lǐng)域需要用到地址信息,如果地址信息有誤,將直接影響業(yè)務(wù)質(zhì)量。比如在電子商務(wù)領(lǐng)域用戶購(gòu)買貨物時(shí),需要在訂單中填寫訂單地址,如果訂單地址填寫有誤,將會(huì)導(dǎo)致貨物無(wú)法及時(shí)送達(dá)至用戶。
[0003]發(fā)明人在對(duì)現(xiàn)有地址信息進(jìn)行分析的過程中發(fā)現(xiàn),地址信息中的省市等區(qū)域信息一般不易出錯(cuò),最容易出錯(cuò)的是地址信息中的道路信息?,F(xiàn)有技術(shù)采用如下方法分析地址信息中的道路與預(yù)置的道路數(shù)據(jù)庫(kù)中道路(也就是已知道路)的關(guān)聯(lián)關(guān)系:
[0004]對(duì)地址信息進(jìn)行分級(jí),得到區(qū)域信息和道路名稱;將所述道路名稱與預(yù)置的道路數(shù)據(jù)庫(kù)中所述區(qū)域內(nèi)的已知道路的名稱或者名稱的拼音進(jìn)行匹配,如果匹配不到名稱或名稱的拼音一致的道路,則認(rèn)為該道路是未知道路,否則,建立地址中的道路與已知道路的關(guān)聯(lián)關(guān)系。
[0005]現(xiàn)有技術(shù)中的分析方法基于現(xiàn)有的道路數(shù)據(jù)庫(kù)僅能夠識(shí)別出與已知道路的名稱屬于同音錯(cuò)別字的未知道路,并將該未知道路與已知道路關(guān)聯(lián)起來;但針對(duì)地址中與已知道路的名稱相比存在多字、少字、別名、顛倒字詞的道路,現(xiàn)有技術(shù)無(wú)法正確分析出其與已知道路的關(guān)系,而是將其當(dāng)作未知道路,從而使大量的地址信息中的道路無(wú)法被識(shí)別,嚴(yán)重影響具體業(yè)務(wù)的實(shí)施。
【發(fā)明內(nèi)容】
[0006]為了解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了一種未知道路與已知道路關(guān)聯(lián)關(guān)系的分析方法和裝置,能夠提高地址中道路識(shí)別的準(zhǔn)確度,為其他以道路信息為依據(jù)的業(yè)務(wù)打好基礎(chǔ),為用戶提供便利。
[0007]本發(fā)明實(shí)施例公開了如下技術(shù)方案:
[0008]第一方面,本發(fā)明實(shí)施例公開了一種未知道路與已知道路關(guān)聯(lián)關(guān)系的分析方法,包括:
[0009]獲取運(yùn)單數(shù)據(jù)集合;
[0010]根據(jù)所述運(yùn)單數(shù)據(jù)集合中各條運(yùn)單數(shù)據(jù)的地址信息及預(yù)置的道路數(shù)據(jù)庫(kù),得到已知道路集合和未知道路集合;
[0011 ] 針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配,選擇興趣點(diǎn)匹配度最高的已知道路作為未知道路的關(guān)聯(lián)道路。
[0012]優(yōu)選的,所述針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配,選擇興趣點(diǎn)匹配度最高的已知道路作為未知道路的關(guān)聯(lián)道路具體包括:
[0013]針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配;
[0014]選擇與該未知道路關(guān)聯(lián)的興趣點(diǎn)匹配的興趣點(diǎn)的數(shù)目最多的已知道路作為所述未知道路的關(guān)聯(lián)道路。
[0015]優(yōu)選的,所述針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配,選擇興趣點(diǎn)匹配度最高的已知道路作為未知道路的關(guān)聯(lián)道路具體包括:
[0016]針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配;
[0017]按照與該未知道路匹配的興趣點(diǎn)的數(shù)目由高到低的順序,選擇預(yù)設(shè)個(gè)數(shù)的已知道路作為該未知道路的待關(guān)聯(lián)已知道路;
[0018]根據(jù)所述匹配的興趣點(diǎn)的數(shù)目和待關(guān)聯(lián)已知道路關(guān)聯(lián)的興趣點(diǎn)的個(gè)數(shù),得到該未知道路與各待關(guān)聯(lián)已知道路之間的匹配度;
[0019]選擇匹配度最高的待關(guān)聯(lián)已知道路作為所述未知道路的關(guān)聯(lián)道路。
[0020]優(yōu)選的,所述方法還包括:
[0021]判斷未知道路的名稱與該未知道路關(guān)聯(lián)的已知道路名稱的長(zhǎng)度是否相同;
[0022]如果長(zhǎng)度相同,則判斷兩者名稱的文字及其順序是否相同,如果有一字不同,標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的錯(cuò)別字道路;如果文字完全相同但文字順序不完全相同,則標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的文字順序顛倒道路;如果多個(gè)字不相同,查看兩者名稱是否存在于同一個(gè)地址信息中,如果是,標(biāo)記所述未知道路為關(guān)聯(lián)道路的臨近道路;如果否,判斷兩者的興趣點(diǎn)匹配度是否大于預(yù)置的匹配度閾值,如果是,標(biāo)記所述未知道路為關(guān)聯(lián)道路的別名道路;
[0023]如果長(zhǎng)度不相同,判斷兩者名稱的文字是否多一字或者少一字且其他文字完全相同,如果是,則標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的多字或少字道路;如果否,查看兩者名稱是否存在于同一個(gè)地址信息中,如果是,標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的臨近道路;如果否,判斷兩者的興趣點(diǎn)匹配度是否大于預(yù)置的匹配度閾值,如果是,標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的別名道路。
[0024]優(yōu)選的,所述針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配具體為:
[0025]針對(duì)未知道路集合中關(guān)聯(lián)的興趣點(diǎn)的數(shù)目大于等于第一閾值的未知道路,將其關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中關(guān)聯(lián)的興趣點(diǎn)的數(shù)目大于等于第二閾值的已知道路的興趣點(diǎn)進(jìn)行匹配。
[0026]優(yōu)選的,所述根據(jù)所述匹配的興趣點(diǎn)的數(shù)目和待關(guān)聯(lián)已知道路關(guān)聯(lián)的興趣點(diǎn)的個(gè)數(shù),得到該未知道路與各待關(guān)聯(lián)已知道路之間的匹配度具體為:
[0027]根據(jù)所述匹配的興趣點(diǎn)的數(shù)目和待關(guān)聯(lián)已知道路關(guān)聯(lián)的興趣點(diǎn)的個(gè)數(shù),計(jì)算所述匹配的興趣點(diǎn)的數(shù)目與待關(guān)聯(lián)已知道路關(guān)聯(lián)的興趣點(diǎn)的個(gè)數(shù)的比值,將該比值作為未知道路與待關(guān)聯(lián)已知道路的匹配度。
[0028]優(yōu)選的,所述根據(jù)所述運(yùn)單數(shù)據(jù)集合中各條運(yùn)單數(shù)據(jù)的地址信息及預(yù)置的道路數(shù)據(jù)庫(kù),得到已知道路集合和未知道路集合具體包括:
[0029]將所述運(yùn)單數(shù)據(jù)集合中各條運(yùn)單數(shù)據(jù)的地址信息進(jìn)行分級(jí),得到各條地址信息的區(qū)域信息和道路名稱;
[0030]將各條地址信息的道路名稱與預(yù)置的道路數(shù)據(jù)庫(kù)中對(duì)應(yīng)區(qū)域內(nèi)的已知道路的名稱或者名稱的拼音進(jìn)行匹配,得到已知道路和未知道路;
[0031]將所有已知道路中相同的已知道路及其關(guān)聯(lián)的興趣點(diǎn)進(jìn)行合并,將合并處理后得到的所有已知道路及其關(guān)聯(lián)興趣點(diǎn)構(gòu)成已知道路集合;
[0032]將所有未知道路中相同的未知道路及其關(guān)聯(lián)的興趣點(diǎn)進(jìn)行合并,將合并處理后得到的所有未知道路及其關(guān)聯(lián)興趣點(diǎn)構(gòu)成未知道路集合。
[0033]第二方面,本發(fā)明實(shí)施例公開了一種未知道路與已知道路關(guān)聯(lián)關(guān)系的分析裝置,包括:
[0034]獲取單元,用于獲取運(yùn)單數(shù)據(jù)集合;
[0035]分類單元,用于根據(jù)所述運(yùn)單數(shù)據(jù)集合中各條運(yùn)單數(shù)據(jù)的地址信息及預(yù)置的道路數(shù)據(jù)庫(kù),得到已知道路集合和未知道路集合;
[0036]匹配選擇單元,用于針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配,選擇興趣點(diǎn)匹配度最高的已知道路作為未知道路的關(guān)聯(lián)道路。
[0037]優(yōu)選的,所述匹配選擇單元具體包括:
[0038]匹配子單元,用于針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配;
[0039]第一選擇子單元,用于選擇與該未知道路關(guān)聯(lián)的興趣點(diǎn)匹配的興趣點(diǎn)的數(shù)目最多的已知道路作為所述未知道路的關(guān)聯(lián)道路。
[0040]優(yōu)選的,所述匹配選擇單元具體包括:
[0041]匹配子單元,用于針對(duì)未知道路集合中的未知道路,將未知道路關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中已知道路關(guān)聯(lián)的興趣點(diǎn)進(jìn)行匹配;
[0042]第二選擇子單元,用于按照與該未知道路匹配的興趣點(diǎn)的數(shù)目由高到低的順序,選擇預(yù)設(shè)個(gè)數(shù)的已知道路作為該未知道路的待關(guān)聯(lián)已知道路;
[0043]計(jì)算子單元,用于根據(jù)所述匹配的興趣點(diǎn)的數(shù)目和待關(guān)聯(lián)已知道路關(guān)聯(lián)的興趣點(diǎn)的個(gè)數(shù),得到該未知道路與各待關(guān)聯(lián)已知道路之間的匹配度;
[0044]第三選擇子單元,用于選擇匹配度最高的待關(guān)聯(lián)已知道路作為所述未知道路的關(guān)聯(lián)道路。
[0045]優(yōu)選的,所述裝置還包括:
[0046]第一判斷單元,用于判斷未知道路的名稱與該未知道路關(guān)聯(lián)的已知道路名稱的長(zhǎng)度是否相同;
[0047]第二判斷單元,用于當(dāng)?shù)谝慌袛鄦卧袛嘟Y(jié)果為長(zhǎng)度相同時(shí),判斷兩者名稱的文字及其順序是否相同,如果有一字不同,標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的錯(cuò)別字道路;如果文字完全相同但文字順序不完全相同,則標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的文字順序顛倒道路;如果多個(gè)字不相同,查看兩者名稱是否存在于同一個(gè)地址信息中,如果是,標(biāo)記所述未知道路為關(guān)聯(lián)道路的臨近道路;如果否,判斷兩者的興趣點(diǎn)匹配度是否大于預(yù)置的匹配度閾值,如果是,標(biāo)記所述未知道路為關(guān)聯(lián)道路的別名道路;
[0048]第三判斷單元,用于當(dāng)?shù)谝慌袛鄦卧袛嘟Y(jié)果為長(zhǎng)度不相同時(shí),判斷兩者名稱的文字是否多一字或者少一字且其他文字完全相同,如果是,則標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的多字或少字道路;如果否,查看兩者名稱是否存在于同一個(gè)地址信息中,如果是,標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的臨近道路;如果否,判斷兩者的興趣點(diǎn)匹配度是否大于預(yù)置的匹配度閾值,如果是,標(biāo)記所述未知道路為關(guān)聯(lián)的已知道路的別名道路。
[0049]優(yōu)選的,所述匹配子單元具體用于針對(duì)未知道路集合中關(guān)聯(lián)的興趣點(diǎn)的數(shù)目大于等于第一閾值的未知道路,將其關(guān)聯(lián)的興趣點(diǎn)與已知道路集合中關(guān)聯(lián)的興趣點(diǎn)的數(shù)目大于等于第二閾值的已知道路的興趣點(diǎn)進(jìn)行匹配。
[0050]優(yōu)選的