亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

興趣點(diǎn)數(shù)據(jù)融合方法和系統(tǒng)的制作方法_3

文檔序號:9564583閱讀:來源:國知局
[0093]步驟303,確定網(wǎng)格Gi在最底層經(jīng)緯度網(wǎng)格中對應(yīng)的子網(wǎng)格。
[0094]步驟304,將Ρ0Ι集合中與所述子網(wǎng)格相關(guān)聯(lián)的Ρ0Ι信息作為候選Ρ0Ι信息。
[0095]例如,在一個實(shí)施例中,可采用二級hash結(jié)構(gòu),從而可有效解決數(shù)據(jù)稀疏導(dǎo)致的存儲空間浪費(fèi)問題。例如,一級hash為第14層經(jīng)緯度網(wǎng)格中的網(wǎng)格編碼索弓丨,例如11111111111111。若該網(wǎng)格是最底層網(wǎng)格,則直接獲取相關(guān)的Ρ0Ι信息。若該網(wǎng)格不是最底層網(wǎng)格,則繼續(xù)通過二級hash、即最底層(第16層)網(wǎng)格獲取對應(yīng)的Ρ0Ι信息。
[0096]在二級hash結(jié)構(gòu)中,將底層的稀疏網(wǎng)格合并,降低數(shù)據(jù)存儲量。若一級hash條目下的Ρ0Ι總數(shù)小于預(yù)定值N,則將相關(guān)的POI id列表關(guān)聯(lián)存儲在一級hash結(jié)構(gòu)中,二級hash無需存儲空間,總的存儲空間大幅度降低。一二級hash中每一條目的定義都是:
[0097]〈key〉,< (是否是底層網(wǎng)格,id列表)>
[0098]圖4給出了一二級網(wǎng)格hash key的關(guān)聯(lián)關(guān)系。若一級hash key處于第14層經(jīng)緯度網(wǎng)格,則通過增加16種不同后綴,可得到二級hash的16個key。
[0099]在一個實(shí)施例中,上述將目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ融合的步驟包括:對于目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ中的名稱信息,將長度最長的名稱信息作為融合后的名稱信息。對于目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ中的地址信息,將長度最長的地址信息作為融合后的地址信息。艮Ρ,以長度表征數(shù)據(jù)精確度。對于目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ中的電話信息,將兩個電話信息共同作為融合后的電話信息。優(yōu)選的,若存在重復(fù),則將兩個電話字段中重復(fù)的字符串部分作為融合后的電話信息。
[0100]在一個實(shí)施例中,在將目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ融合時,還可記錄目標(biāo)Ρ0Ι數(shù)據(jù)的來源標(biāo)識。從而可用于追溯數(shù)據(jù)的初始來源。
[0101]在出現(xiàn)重復(fù)數(shù)據(jù)時,并不是簡單地直接刪除,而是將相關(guān)屬性信息進(jìn)行融合,從而可確保數(shù)據(jù)的可信度。
[0102]圖5本發(fā)明興趣點(diǎn)數(shù)據(jù)融合系統(tǒng)一個實(shí)施例的示意圖。如圖5示,該系統(tǒng)包括輸入單元501、提取單元502、區(qū)域確定單元503、候選網(wǎng)格確定單元504、候選信息確定單元505、識別單元506和融合存儲單元507。其中:
[0103]輸入單元501,用于輸入新的目標(biāo)興趣點(diǎn)Ρ0Ι數(shù)據(jù)。
[0104]提取單元502,用于當(dāng)輸入單元501獲得目標(biāo)Ρ0Ι數(shù)據(jù)時,提取出目標(biāo)Ρ0Ι數(shù)據(jù)的經(jīng)緯度。
[0105]區(qū)域確定單元503,用于在預(yù)定的第η層經(jīng)緯度網(wǎng)格中,確定以目標(biāo)Ρ0Ι數(shù)據(jù)的經(jīng)緯度為中心的區(qū)域R。
[0106]優(yōu)選的,區(qū)域確定單元具體在預(yù)定的第η層經(jīng)緯度網(wǎng)格中,生成以目標(biāo)Ρ0Ι數(shù)據(jù)的經(jīng)緯度為圓心、以預(yù)定的長度為半徑的圓形區(qū)域,以作為所述區(qū)域R。
[0107]候選網(wǎng)格確定單元504,用于將在第η層經(jīng)緯度網(wǎng)格中被區(qū)域R覆蓋的網(wǎng)格作為候選網(wǎng)格。
[0108]候選信息確定單元505,用于在Ρ0Ι集合中提取出與候選網(wǎng)格相關(guān)聯(lián)的Ρ0Ι信息,以作為候選Ρ0Ι信息。
[0109]識別單元506,用于判斷在候選Ρ0Ι信息中,是否存在與目標(biāo)Ρ0Ι數(shù)據(jù)相重復(fù)的Ρ0Ι信息。
[0110]融合存儲單元507,用于根據(jù)識別單元506的判斷結(jié)果,若在候選Ρ0Ι信息中不存在與目標(biāo)Ρ0Ι數(shù)據(jù)相重復(fù)的Ρ0Ι信息,則將目標(biāo)Ρ0Ι數(shù)據(jù)存入Ρ0Ι集合;若在候選Ρ0Ι信息中存在與目標(biāo)Ρ0Ι數(shù)據(jù)相重復(fù)的Ρ0Ι信息Μ,則將目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ融合,并將融合后的信息存入Ρ0Ι集合,以對Ρ0Ι信息Μ進(jìn)行更新。
[0111]基于本發(fā)明上述實(shí)施例提供的興趣點(diǎn)數(shù)據(jù)融合系統(tǒng),通過篩選與目標(biāo)Ρ0Ι數(shù)據(jù)相近的候選Ρ0Ι信息,在候選Ρ0Ι信息中判斷是否存在與目標(biāo)Ρ0Ι數(shù)據(jù)相重復(fù)的Ρ0Ι信息。若不存在與目標(biāo)Ρ0Ι數(shù)據(jù)相重復(fù)的Ρ0Ι信息,則直接將目標(biāo)Ρ0Ι數(shù)據(jù)存入Ρ0Ι集合,否則將目標(biāo)Ρ0Ι數(shù)據(jù)與相重復(fù)的Ρ0Ι信息融合。從而可有效解決數(shù)據(jù)處理速度慢、數(shù)據(jù)處理準(zhǔn)確性和容錯性不足的問題。
[0112]在一個實(shí)施例中,識別單兀506具體對于候選Ρ0Ι信息中的每個候選Ρ0Ι信息Cj,判斷目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj之間的相似度FinalScore是否大于預(yù)定的閾值,其中1 ( j彡M,M為候選Ρ0Ι信息總數(shù),相似度FinalScore同目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj之間的名稱相似度、電話相似度、距離相似度和地址相似度相關(guān);若目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj之間的相似度FinalScore大于預(yù)定的閾值,則確定目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj重復(fù);若目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj之間的相似度FinalScore不大于預(yù)定的閾值,則確定目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj不重復(fù)。
[0113]優(yōu)選的,識別單元506具體利用下列公式
[0114]FinalScore = (nameScore+phoneScore)*weightl+(distanceScore+addressScore)氺weight2
[0115]計算相似度FinalScore,其中weightl和weight2預(yù)先設(shè)置的權(quán)值,名稱相似度nameScore同目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj的名稱、
[0116]類型相關(guān)聯(lián),電話相似度phoneScore同目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj的電話信息相關(guān)聯(lián),距離相似度distanceScore同目標(biāo)Ρ0Ι數(shù)據(jù)與候選Ρ0Ι信息Cj的經(jīng)緯度相關(guān)聯(lián),地址相似度addressScore同目標(biāo)P0I數(shù)據(jù)與候選P0I信息Cj的地址相關(guān)聯(lián)。
[0117]例如:nameScore、addressScore、distanceScore 可以為:
[0118]nameScore = scoreName (clean (namel),clean (name2),typel, type2)
[0119]addressScore = scoreAddress (clean (addressl)+clean (address2),latitudel, longitudel, latitude2,longitude2)
[0120]distanceScore = 1-distance/threshold
[0121]其中,scoreName為確定兩個POI數(shù)據(jù)1和POI數(shù)據(jù)2的名稱和類型的相似度的函數(shù)addressScore為確定Ρ0Ι數(shù)據(jù)1和Ρ0Ι數(shù)據(jù)2的地址和經(jīng)緯度的相似度的函數(shù);clean為去除附加信息的函數(shù),以便于更好地進(jìn)行相似度計算distance為兩個Ρ0Ι數(shù)據(jù)的距離,threshold為相應(yīng)門限。
[0122]在一個實(shí)施例中,融合存儲單元507具體在將目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ融合時,對于目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ中的名稱信息,將長度最長的名稱信息作為融合后的名稱信息;對于目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ中的地址信息,將長度最長的地址信息作為融合后的地址信息;對于目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ中的電話信息,將兩個電話信息共同作為融合后的電話信息。
[0123]優(yōu)選的,融合存儲單元507具體在將目標(biāo)Ρ0Ι數(shù)據(jù)與Ρ0Ι信息Μ融合時,記錄目標(biāo)Ρ0Ι數(shù)據(jù)的來源標(biāo)識。
[0124]圖6為本發(fā)明候選信息確定單元一個實(shí)施例的示意圖。如圖6所示,上述候選信息確定單元包括識別模塊601、第一信息確定模塊602和第二信息確定模塊603。其中:
[0125]識別模塊601,用于判斷候選網(wǎng)格Gi是否為底層網(wǎng)格,其中1彡i彡N,N為候選網(wǎng)格總數(shù)。
[0126]第一信息確定模塊602,用于根據(jù)識別模塊601的判斷結(jié)果,若網(wǎng)格Gi是底層網(wǎng)格,則將Ρ0Ι集合中與候選網(wǎng)格Gi相關(guān)聯(lián)的Ρ0Ι信息作為候選Ρ0Ι信息。
[0127]第二信息確定模塊603,用于根據(jù)識別模塊601的判斷結(jié)果,若網(wǎng)格Gi不是底層網(wǎng)格,則確定網(wǎng)格Gi在最底層經(jīng)緯度網(wǎng)格中對應(yīng)的子網(wǎng)格,將Ρ0Ι集合中與所述子網(wǎng)格相關(guān)聯(lián)的Ρ0Ι信息作為候選Ρ0Ι信息。
[0128]通過實(shí)施本發(fā)明,可有效降低信息處理數(shù)量,提高數(shù)據(jù)處理效率,并有效提高數(shù)據(jù)的可信度。
[0129]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機(jī)可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0130]本發(fā)明的描述是為了示例和描述起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實(shí)施例是為了更好說明本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計適于特定用途的帶有各種修改的各種實(shí)施例。
【主權(quán)項(xiàng)】
1.一種興趣點(diǎn)數(shù)據(jù)融合方法
當(dāng)前第3頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1