亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于建立地址數(shù)據(jù)庫的設(shè)備及其方法

文檔序號(hào):6468793閱讀:244來源:國知局
專利名稱:用于建立地址數(shù)據(jù)庫的設(shè)備及其方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于建立地址數(shù)據(jù)庫的設(shè)備及其方法。
更具體地,本發(fā)明涉及一種用于從其中分別寫入地址的郵件中提取地址
并使用所提取的地址建立地址數(shù)據(jù)庫的設(shè)備、及其方法。
本發(fā)明受到MIC/IITA的IT R&D規(guī)劃[2006-X-001-02, Development of Element Technology for Real-time Postal Distribution (用于實(shí)時(shí)郵政分發(fā)的基 本技術(shù)的開發(fā))]支持。
背景技術(shù)
地址信息可以與許多不同的對(duì)象一起使用,并且對(duì)自動(dòng)分類郵件的性能 具有很大影響。因此,建立準(zhǔn)確的地址數(shù)據(jù)庫是提高郵件服務(wù)效率的必要條 件之一。
結(jié)果,存在如下的需要收集全國的(countrywide)地址信息、使用所 述地址信息建立地址數(shù)據(jù)庫、并然后連續(xù)管理和充分利用所述數(shù)據(jù)庫。
而且,需要?jiǎng)訂T人力資源和連續(xù)付出努力,并且難以很好地建立地址數(shù) 據(jù)庫。為了這些原因,最近在韓國已經(jīng)實(shí)現(xiàn)了建立郵件地址數(shù)據(jù)庫的嘗試。
在相關(guān)技術(shù)中,郵件地址數(shù)據(jù)庫通過以下方法建立其中由郵政服務(wù)雇 員收集地址,并排列和輸入地址。然而,因?yàn)樵谑占]件地址時(shí)遺漏一些郵 件地址、并且操作者在輸入地址時(shí)可能犯錯(cuò)誤,所以存在降低了地址數(shù)據(jù)庫 可靠性和質(zhì)量的問題。
為了解決所述問題,可能通過利用自動(dòng)分類器來連續(xù)檢查并補(bǔ)充地址數(shù) 據(jù)庫而改善它的質(zhì)量。然而,這由于建立地址數(shù)據(jù)庫的初始處理中的反復(fù)試 驗(yàn)而導(dǎo)致巨大花費(fèi)。
6而且,即使地址數(shù)據(jù)庫最初是完美的,但由于重復(fù)地進(jìn)行郵件地址的創(chuàng) 建和廢棄,所以地址數(shù)據(jù)庫的完美性在一段時(shí)間之后也降低。相應(yīng)地,為了 維持地址數(shù)據(jù)庫的數(shù)據(jù)與國家中的實(shí)際郵件地址之間的對(duì)應(yīng)關(guān)系,沒有選 擇,只有依靠諸如收集郵件地址的郵政服務(wù)雇員和其他人的努力。這連續(xù)地 導(dǎo)致了建立和維持地址數(shù)據(jù)庫的巨大花費(fèi)。
此外,可能通過使用自動(dòng)識(shí)別技術(shù)來從郵件中提取地址信息。然而,在 所提取的地址信息的可靠性方面存在問題。相應(yīng)地,難以將地址信息的提取 應(yīng)用于建立可以依賴的地址數(shù)據(jù)庫。
在這個(gè)背景技術(shù)部分公開的上面信息僅僅是為了增強(qiáng)對(duì)本發(fā)明背景技 術(shù)的理解,并因此它可能包含沒有形成對(duì)于本領(lǐng)域普通技術(shù)人員而言在這個(gè) 國家中已知的現(xiàn)有技術(shù)的信息。

發(fā)明內(nèi)容
已努力做出本發(fā)明以提供用于通過驗(yàn)證從郵件的地址中讀取的地址信 息來建立具有高可靠性的地址數(shù)據(jù)庫的設(shè)備、及其方法。
本發(fā)明的示范實(shí)施例提供了 一種利用包括地址的地址圖像來建立地址
數(shù)據(jù)庫的設(shè)備。所述設(shè)備包括地址讀取單元,用于從地址圖像中讀取地址; 讀取結(jié)果存儲(chǔ)單元,用于存儲(chǔ)所讀取的地址和表示所讀取的地址的讀取次數(shù) 的累積值;有效地址存儲(chǔ)單元,用于存儲(chǔ)包括多個(gè)實(shí)際存在的有效地址的有 效地址數(shù)據(jù)庫;以及有效地址提取單元,用于根據(jù)從讀取結(jié)果存儲(chǔ)單元加載 的所讀取的地址的累積值是否大于預(yù)定閾值,來將所讀取的地址存儲(chǔ)在有效 地址存儲(chǔ)單元中。
本發(fā)明的又一實(shí)施例提供了 一種用于利用包括地址的地址圖像來建立 地址數(shù)據(jù)庫的方法。所述方法包括存儲(chǔ)從地址圖像中讀取的地址和表示所 讀取的地址的讀取次數(shù)的累積值;確定所讀取的地址的累積值是否大于預(yù)定 閾值;以及當(dāng)所讀取的地址的累積值大于預(yù)定閾值時(shí),將所讀取的地址存儲(chǔ) 在有效地址數(shù)據(jù)庫中,其中所述有效地址數(shù)據(jù)庫包括實(shí)際存在的有效地址。
本發(fā)明的又一實(shí)施例提供了 一種用于利用包括地址的地址圖像來建立 地址數(shù)據(jù)庫的設(shè)備。所述設(shè)備包括地址讀取單元,用于從地址圖像中讀取 地址;讀取結(jié)果存儲(chǔ)單元,用于存儲(chǔ)所讀取的地址和表示所讀取的地址的讀 取次數(shù)的累積值;有效地址存儲(chǔ)單元,用于存儲(chǔ)包括多個(gè)在世界上實(shí)際存在
7的有效地址的有效地址數(shù)據(jù)庫;有效地址候選者提取單元,用于根據(jù)從讀取 結(jié)果存儲(chǔ)單元加載的所讀取的地址的累積值是否大于預(yù)定閾值,來將所讀取 的地址設(shè)置為有效地址候選者;和有效地址驗(yàn)證單元,用于輸出有效地址候 選者和與其對(duì)應(yīng)的地址圖像,地址管理員向該有效地址驗(yàn)證單元提供關(guān)于所 述有效地址候選者是否與地址圖像的地址相同的信息,并且基于所述信息在 有效地址數(shù)據(jù)庫中存儲(chǔ)有效地址候選者。
本發(fā)明的又一實(shí)施例提供了 一種用于利用包括地址的地址圖像來建立 地址數(shù)據(jù)庫的方法。所述方法包括存儲(chǔ)從地址圖像中讀取的地址和表示所 讀取的地址的讀取次數(shù)的累積值;當(dāng)所讀取的地址的累積值大于預(yù)定閾值 時(shí),將所讀取的地址設(shè)置為有效地址候選者;輸出有效地址候選者和與其對(duì) 應(yīng)的地址圖像,并被提供從地址管理員輸入的、關(guān)于所述有效地址候選者是 否與地址圖像的地址相同的信息;以及基于所述信息將所述有效地址候選者 存儲(chǔ)在有效地址數(shù)據(jù)庫中,其中所述有效地址數(shù)據(jù)庫包括實(shí)際存在的有效地 址。
根據(jù)本發(fā)明的實(shí)施例,通過驗(yàn)證從郵件的地址中讀取的地址信息、并基 于所述地址信息來建立地址數(shù)據(jù)庫,可能改善地址數(shù)據(jù)庫的可靠性和完整 性。
除了讀取地址信息之外,執(zhí)行維持地址數(shù)據(jù)庫的數(shù)據(jù)以對(duì)應(yīng)于實(shí)際的郵 件地址。結(jié)果,這允許減少建立地址數(shù)據(jù)庫所需要的花費(fèi)和努力。


圖1示出了根據(jù)本發(fā)明第一示范實(shí)施例的、用于建立有效地址數(shù)據(jù)庫的 設(shè)備的構(gòu)造。
圖2示出了根據(jù)本發(fā)明第一示范實(shí)施例的、用于建立有效地址數(shù)據(jù)庫的 方法的流程圖。
圖3示出了根據(jù)本發(fā)明第二示范實(shí)施例的、用于建立有效地址數(shù)據(jù)庫的 設(shè)備的構(gòu)造。
圖4示出了才艮據(jù)本發(fā)明第二示范實(shí)施例的、用于在線實(shí)時(shí)地建立有效地 址數(shù)據(jù)庫的方法的流程圖。
圖5示出了根據(jù)本發(fā)明第二示范實(shí)施例的、用于在線實(shí)時(shí)地建立有效地 址數(shù)據(jù)庫的方法中的步驟S493的詳細(xì)處理的流程圖。圖6示出了根據(jù)本發(fā)明第二示范實(shí)施例的、用于離線地建立有效地址數(shù) 據(jù)庫的方法中的用于存儲(chǔ)讀取結(jié)果的處理的流程圖。
圖7示出了根據(jù)本發(fā)明第二示范實(shí)施例的、用于離線地建立有效地址數(shù) 據(jù)庫的方法中的用于向地址數(shù)據(jù)庫添加有效地址候選者的處理的流程圖。
圖8示出了根據(jù)本發(fā)明第二示范實(shí)施例的、用于離線地建立有效地址數(shù) 據(jù)庫的方法中的用于從地址數(shù)據(jù)庫中刪除無效地址候選者的處理的流程圖。
具體實(shí)施例方式
在接下來的詳細(xì)描述中,簡單通過圖示的方式已經(jīng)僅僅示出并描述了本 發(fā)明的特定示范實(shí)施例。如本領(lǐng)域的技術(shù)人員將實(shí)現(xiàn)的,可以以各種不同的 方式修改所描述的實(shí)施例,而都不脫離本發(fā)明的精神或范圍。相應(yīng)地,附圖 和描述將實(shí)際上被認(rèn)為是圖示性的而不是限制性的。貫穿說明書中,相同的 附圖標(biāo)記指定相同的元件。
另外,除非明確地相反描述,詞語"包括"以及諸如"包含,,或"含有" 的變型將被理解為意指包括所陳述的元件但并不排除任何其它元件。
現(xiàn)在,將詳細(xì)說明根據(jù)本發(fā)明示范實(shí)施例的、用于建立有效地址數(shù)據(jù)庫 的設(shè)備及其方法。
圖1示出了根據(jù)本發(fā)明第一示范實(shí)施例的、用于建立有效地址數(shù)據(jù)庫的 設(shè)備的構(gòu)造。
參考圖1,本發(fā)明第一示范實(shí)施例的有效地址數(shù)據(jù)庫建立設(shè)備100包括 地址圖像提供單元110、地址讀取單元120、讀取結(jié)果存儲(chǔ)單元U0、有效地 址提取單元140、和有效地址存儲(chǔ)單元180。
地址圖像提供單元110掃描在其上寫入地址的郵件,生成地址圖像,并 將它提供到地址讀取單元120。
這里,地址圖像提供單元110可以是類似自動(dòng)郵件分類器的用于自動(dòng)提 供郵件的裝置、或者是用于提供由照相機(jī)或掃描儀掃描的圖像的裝置、以及 其它。
地址讀取單元120對(duì)包括字符或條形碼的地址圖像執(zhí)行預(yù)處理,并識(shí)別 它以生成與該地址圖像對(duì)應(yīng)的地址字符串。而且,地址讀取單元120通過使 用類似條形碼讀取、字符識(shí)別、和地址解譯的技術(shù),來自動(dòng)地從地址圖像提 供單元IIO所提供的地址圖像中讀取地址。這里,由于不能夠通過對(duì)地址數(shù)據(jù)庫的地址執(zhí)行后處理來利用可讀取地
址的識(shí)別裝置從地址數(shù)據(jù)庫獲得新添加的地址信息,所以地址讀取單元120
從地址圖像中讀取地址,而沒有使用地址數(shù)據(jù)庫。
而且,地址讀取單元120不僅讀取包括字符串的地址,還讀取由條形碼 構(gòu)成的地址信息。相應(yīng)地,它可能能夠減少讀取地址中的錯(cuò)誤。
讀取結(jié)果存儲(chǔ)單元130存儲(chǔ)并管理由地址讀取單元120讀取的多個(gè)地址。
在這個(gè)情況下,當(dāng)輸入了與已經(jīng)存儲(chǔ)在讀取結(jié)果存儲(chǔ)單元130中的地址 等同的地址時(shí),讀取結(jié)果存儲(chǔ)單元130生成地址的累積值(accumulated value),并將它存儲(chǔ)為與所述地址匹配。這里,累積值用于提取有效地址。
讀取結(jié)果存儲(chǔ)單元130存儲(chǔ)地址字符串,并照原樣存儲(chǔ)類似住宅門牌號(hào) 碼和街區(qū)編號(hào)或建筑物的房間號(hào)的詳細(xì)信息。
在這個(gè)情況下,在執(zhí)行地址解譯和地址信息的后處理之后,讀取結(jié)果存 儲(chǔ)單元130可使用類似行政區(qū)域的名稱的地址信息。
當(dāng)執(zhí)行地址解譯時(shí),由于根據(jù)地址組織來建立行政區(qū)域名稱數(shù)據(jù)庫相對(duì) 容易,所以執(zhí)行類似街區(qū)編號(hào)和房間號(hào)的詳細(xì)地址信息的提取和分析。
有效地址提取單元140加載并分析所讀取的地址、和作為通過讀取多個(gè) 地址圖像獲得的結(jié)果并被存儲(chǔ)在讀取結(jié)果存儲(chǔ)單元130中的那些地址的累積 值。然后,有效地址提取單元140從所讀取的地址中提取具有高可能性的地 址,所述可能性表示地址可能真實(shí)有效。
這里,有效地址提取單元140檢查累積值,確定高于預(yù)定閾值的累積值 的所讀取的地址作為有效地址,并將該有效地址存儲(chǔ)在有效地址存儲(chǔ)單元 180中。
有效地址存儲(chǔ)單元180存儲(chǔ)并管理包括真實(shí)有效地址的有效地址數(shù)據(jù)
庫。、 「 - a 、 '、
單元120讀取的地址所需要的信息,并且還提供有效地址提取單元MO從在 讀取結(jié)果存儲(chǔ)單元130中存儲(chǔ)的多個(gè)所讀取的地址中提取有效地址所需要的信息。
此外,有效地址存儲(chǔ)單元180存儲(chǔ)被有效地址提取單元MO確定為真實(shí) 存在地址的有效地址。現(xiàn)在,參考圖2,將描述根據(jù)本發(fā)明第一示范實(shí)施例的、用于建立有效 地址數(shù)據(jù)庫的方法。
圖2示出了根據(jù)本發(fā)明第一示范實(shí)施例的、用于建立有效地址數(shù)據(jù)庫的 方法的流程圖。
根據(jù)本發(fā)明第 一 示范實(shí)施例的方法涉及如下的處理當(dāng)輸入地址圖像 時(shí),實(shí)時(shí)地確定地址圖像的地址是否是有效地址,并基于有效地址建立有效 地址數(shù)據(jù)庫。
首先,地址圖像提供單元110通過掃描一封郵件的地址(即,郵件上被 寫入地址的部分)來生成地址圖像,并將所述地址圖像提供到地址讀取單元 120 (S210)。地址讀取單元120從所述地址圖像中讀取地址(S220),并將 所讀取的地址和所讀取的地址的累積值存儲(chǔ)在讀取結(jié)果存儲(chǔ)單元130中 (S230 )。
接下來,有效地址提取單元140加載包括所讀取的地址及其累積值的讀 取地址結(jié)果,并確定所述累積值中的每一個(gè)是否大于預(yù)定的閾值(S240)。
在步驟S240中,當(dāng)累積值大于預(yù)定的閾值時(shí),有效地址提取單元140 通過檢查具有該累積值的所讀取的地址是否處于有效地址存儲(chǔ)單元180的有 效地址數(shù)據(jù)庫中,來確定它是否是新的有效地址(S250)。
在步驟S250中,當(dāng)由于具有該累積值的所讀取的地址沒有處于有效地 址數(shù)據(jù)庫中而確定所述所讀取的地址是新的有效地址時(shí),有效地址提取單元
140將所述所讀取的地址設(shè)置為新的有效地址并將它存儲(chǔ)在有效地址存儲(chǔ)單 元180的有效地址數(shù)據(jù)庫中(S260 )。
然而,當(dāng)在步驟S240中所讀取的地址不具有大于預(yù)定閾值的累積值時(shí)、 或當(dāng)在步驟S250中具有該累積值的所讀取的地址沒有被確定為新的有效地 址時(shí),終止本方法的上面處理。
圖3示出了根據(jù)本發(fā)明第二示范實(shí)施例的、用于建立有效地址數(shù)據(jù)庫的 設(shè)備。
參考圖3,根據(jù)本發(fā)明第二示范實(shí)施例的有效地址數(shù)據(jù)庫建立設(shè)備300 包括地址圖像提供單元310、地址讀取單元320、讀取結(jié)果存儲(chǔ)單元330、 有效地址候選者提取單元340、有效地址驗(yàn)證單元350、無效地址候選者提 取單元360、無效地址驗(yàn)證單元370、和有效地址存儲(chǔ)單元380。
這里,根據(jù)本發(fā)明第二示范實(shí)施例的有效地址數(shù)據(jù)庫建立設(shè)備的結(jié)構(gòu)與根據(jù)本發(fā)明第一示范實(shí)施例的所述設(shè)備的結(jié)構(gòu)類似。因此,將省略與第一示 范實(shí)施例的那些構(gòu)成元件相同的構(gòu)成元件的描述。
有效地址候選者提取單元340加載并分析已經(jīng)累積并存儲(chǔ)在讀取結(jié)果存 儲(chǔ)單元330中的讀取結(jié)果,并然后提取具有高可能性的地址,所述可能性表 示地址可能是真實(shí)有效的。
這里,象第一示范實(shí)施例的有效地址提取單元140—樣,有效地址候選 者提取單元340使用累積的統(tǒng)計(jì)來選擇有效地址。
例如,在地址讀取結(jié)果已經(jīng)累積了有規(guī)則的時(shí)間段之后、或者在地址讀 取結(jié)果的數(shù)量滿足預(yù)定的數(shù)量之后,將在讀取結(jié)果中出現(xiàn)超過閾值次數(shù)的地 址確定為真實(shí)存在的有效地址。當(dāng)被確定為有效地址的地址沒有包括在有效 地址存儲(chǔ)單元3 80的有效地址數(shù)據(jù)庫中時(shí),將該地址設(shè)置為有效地址候選者。
有效地址驗(yàn)證單元350驗(yàn)證有效地址候選者提取單元340所提取的地 址,即,有效地址候選者。這里,有效地址驗(yàn)證單元350輸出有效地址候選 者以及地址圖像,所述地址圖像是通過地址圖像提供單元310掃描郵件獲得 的、并且基于選擇有效地址候選者。而且,有效地址驗(yàn)證單元350被提供有 地址管理員的輸入,該地址管理員用于確定有效地址候選者的有效性,并且 由于有效地址候選者與地址圖像的地址相同,所以有效地址驗(yàn)證單元350在 有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中存儲(chǔ)-波地址管理員確定為有效的 有效地址候選者。
在這個(gè)情況下,有效地址驗(yàn)證單元350輸出基于選擇有效地址候選者的 地址圖像作為視頻場(chǎng)景(scene ),從而地址管理員看見該視頻場(chǎng)景并確定是 否正確地執(zhí)行了地址圖像的讀取。
這里,驗(yàn)證有效地址可被分類為用于確定地址讀取單元320所讀取并 提供的地址是否等同于地址圖像的地址的處理;以及用于確定在一封郵件中 是否真的使用了所提供的地址的處理。
在這個(gè)情況下,可基于對(duì)正被討論的區(qū)域的認(rèn)知來執(zhí)行后面的處理。因 此,需要諸如所述區(qū)域的郵政服務(wù)雇員或市政公務(wù)員的人員。
由于一個(gè)人難以執(zhí)行兩個(gè)處理,所以如偶爾需要的,有效地址驗(yàn)S正單元 350可通過基于地址圖像來確定讀取結(jié)果的有效性并驗(yàn)證將要添加的有效地 址的有效性,來執(zhí)行有效地址的驗(yàn)證。
添加有效地址可通過以下兩種方法來實(shí)現(xiàn)在線實(shí)時(shí)有效地址數(shù)據(jù)庫添加方法,用于只要輸入讀取結(jié)果就確定讀取結(jié)果的地址是否是有效地址;和離線有效地址數(shù)據(jù)庫添加方法,用于通過分析累積的讀取結(jié)果的同時(shí)來提取有效地址。
無效地址候選者提取單元360加載并分析在讀取結(jié)果存儲(chǔ)單元330中已經(jīng)累積的讀取結(jié)果,并從有效地址存儲(chǔ)單元380的地址中提取地址可能實(shí)際不存在的高可能性的地址。
這里,無效地址候選者提取單元360使用累積的統(tǒng)計(jì)來選擇無效地址。
例如,在地址讀取結(jié)果已經(jīng)累積了有規(guī)則的時(shí)間段之后、或者在地址讀取結(jié)果的數(shù)量滿足預(yù)定的數(shù)量之后,將在讀取結(jié)果中出現(xiàn)低于閾值次數(shù)的地址確定為無效地址。當(dāng)凈皮確定為無效地址的地址存儲(chǔ)在有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中時(shí),將該地址設(shè)置為無效地址候選者。
無效地址驗(yàn)證單元370輸出無效地址候選者以及地址圖像,所述地址圖像是通過地址圖像提供單元310掃描郵件獲得的、并且基于選擇無效地址候選者。而且,無效地址驗(yàn)證單元370被提供有地址管理員的輸入,該地址管理員用于確定無效地址候選者的無效性,并且當(dāng)因?yàn)闊o效地址候選者與該地址圖像的地址相同所以該地址管理員確定該無效地址候選者無效時(shí),該無效地址驗(yàn)證單元370從有效地址數(shù)據(jù)庫中刪除該無效地址候選者。
在這個(gè)情況下,無效地址驗(yàn)證單元370輸出基于選擇無效地址候選者的地址圖像作為視頻場(chǎng)景,從而地址管理員看見該視頻場(chǎng)景并確定是否正確地執(zhí)行了讀取地址圖像。
接下來,將參考附圖描述用于建立在線實(shí)時(shí)有效地址的方法和用于建立離線有效地址數(shù)據(jù)庫的方法。
在線實(shí)時(shí)有效地址數(shù)據(jù)庫建立方法當(dāng)通過地址圖像提供單元310輸入地址圖像時(shí)實(shí)時(shí)地確定該地址圖像的地址是否是有效地址,并當(dāng)該地址圖像被確定為有效地址時(shí)將該地址圖^^的地址添加到有效地址it據(jù)庫中。
離線有效地址數(shù)據(jù)庫建立方法在超過預(yù)定數(shù)目的地址圖像被累積在讀取結(jié)果存儲(chǔ)單元330中之后確定所述地址圖像的地址是有效地址,并然后將被確定為有效地址的所述地址圖像的地址添加到有效地址數(shù)據(jù)庫中。
現(xiàn)在,將描述在線實(shí)時(shí)有效地址數(shù)據(jù)庫建立方法。
圖4示出了根據(jù)本發(fā)明第二示范實(shí)施例的在線實(shí)時(shí)有效地址數(shù)據(jù)庫建立方法的流程圖。圖5示出了在線實(shí)時(shí)有效地址數(shù)據(jù)庫建立方法的步驟的流程
13將參考圖4和圖5描述在線實(shí)時(shí)有效地址數(shù)據(jù)庫建立方法。地址圖像提供單元310通過掃描一封郵件的被寫入地址的部分來生成地
址圖像,并將所述地址圖像輸入到地址讀取單元320 (S410)。地址讀取單
元320從地址圖像中讀取地址(S420),并將所讀取的地址存儲(chǔ)到讀取結(jié)果
存儲(chǔ)單元330 ( S430 )。
在這個(gè)情況下,在讀取結(jié)果存儲(chǔ)單元330中存在多個(gè)所讀取的地址和與
每個(gè)所讀取的地址對(duì)應(yīng)的累積值,其中累積值表示讀取并存儲(chǔ)對(duì)應(yīng)的所讀取
的地址的累積次數(shù)。
的地址和其累積值(S440 ),并確定該所讀取的地址的累積值是否小于預(yù)定的閾值(S450)。
當(dāng)所讀取的地址的累積值小于預(yù)定的閾值時(shí),有效地址候選者提取單元340調(diào)整預(yù)定的閾值(S460 )。
這里,4艮據(jù)接下來的等式1和2來調(diào)整所述預(yù)定的閾值。(等式l)
T = max((kxE/P), L)
(k>0, L>0, k和L是常數(shù))(等式2)
T = max((kXN/D), L)(k>0, 1>0, k和L是常數(shù))
這里,T表示作為用于確定有效地址的參考的閾值,N表示所提供的地址圖像的總數(shù),E表示具有有效地址的郵件數(shù)量(E〈-N), D表示在一區(qū)域中的郵政投遞分支機(jī)構(gòu)的數(shù)目,而P表示其中出現(xiàn)有效地址郵件的郵政投遞分支機(jī)構(gòu)的數(shù)目。
而且,N、 E、 D、 P>m。 L表示最小的閾值,而m表示在^:遞郵件時(shí)使用的郵政投遞分支機(jī)構(gòu)的最小數(shù)目。
當(dāng)n(a)表示所讀取的地址的出現(xiàn)積累頻率時(shí),如果n(a)〉二T,則所讀取的地址是有效地址,而如果n(a)〈T,則所讀取的地址是無效地址。
然后,有效地址候選者提取單元340確定是否輸入來自地址圖像提供單元310的新的所讀取的地址并將其存儲(chǔ)在讀取結(jié)果存儲(chǔ)單元330中(S470 ),
其間,在步驟S450中,當(dāng)所讀取的地址的累積值不小于預(yù)定閾值時(shí),有效地址候選者提取單元340確定該所讀取的地址作為有效地址。然后,有效地址候選者提取單元340確定所讀取的地址是否在有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中(S480)。
當(dāng)所讀取的地址不在有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中時(shí),有效地址候選者提取單元340確定當(dāng)前的模式是否是自動(dòng)添加模式,該自動(dòng)添加模式用于當(dāng)確定了有效地址時(shí)自動(dòng)將有效地址存儲(chǔ)在有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中(S491 )。
當(dāng)當(dāng)前模式不是自動(dòng)添加模式時(shí),如圖5所示,有效地址驗(yàn)證單元350輸出有效地址候選者提取單元340所確定的有效地址候選者、以及與該有效地址候選者對(duì)應(yīng)的并且從地址圖像提供單元310 >|是供的地址圖像(S493b )。然后,地址管理員向有效地址驗(yàn)證單元350提供關(guān)于該有效地址候選者是否等同于地址圖像的地址的信息(S493c )。
在這個(gè)情況下,用于按照出現(xiàn)累積頻率的順序來排列有效地址候選者以便改善地址管理員的處置效率的步驟S493a可以插入在步驟S493與步驟S493b之間。
如圖4所示,有效地址驗(yàn)證單元350基于^U也址管理員輸入的信息來確定有效地址候選者是否與地址圖像的地址相同(S494 )。
當(dāng)有效地址候選者與地址圖像的地址相同時(shí),有效地址驗(yàn)證單元350將該有效地址候選者添加到有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中,并前進(jìn)到步驟S460。
然而,當(dāng)有效地址候選者與地址圖像的地址不相同時(shí),執(zhí)行對(duì)在讀取結(jié)果存儲(chǔ)單元330中存儲(chǔ)的有效地址候選者的累積值的補(bǔ)償,并然后執(zhí)行步驟S460。
這里,例如,因?yàn)橛行У刂泛蜻x者不等同于地址圖像的地址,所以有效地址候選者提取單元340從該有效地址候選者的累積值中減去"1"。
其間,在步驟S491中,當(dāng)當(dāng)前模式是自動(dòng)添加模式時(shí),有效地址驗(yàn)證單元350確定由有效地址候選者提取單元340確定的有效地址候選者是否處于有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中(S492 )。當(dāng)由有效地址候選者提取單元340確定的有效地址候選者處于有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中時(shí),有效地址驗(yàn)證單元350前進(jìn)到步驟S460。然而,當(dāng)它不在有效地址數(shù)據(jù)庫中時(shí),有效地址驗(yàn)證單元350前進(jìn)到步驟S495。
接下來,將描述離線有效地址數(shù)據(jù)庫建立方法。
圖6示出了根據(jù)本發(fā)明第二示范實(shí)施例的、離線有效地址數(shù)據(jù)庫建立方法中的用于存儲(chǔ)讀取結(jié)果的處理的流程圖。圖7和圖8分別示出了根據(jù)本發(fā)明第二示范實(shí)施例的、離線有效地址數(shù)據(jù)庫建立方法中的、用于向有效地址數(shù)據(jù)庫添加有效地址候選者的處理的流程圖、和用于從有效地址數(shù)據(jù)庫中刪除無效地址候選者的處理的流程圖。
首先,將參考圖6描述離線有效地址數(shù)據(jù)庫建立方法中的用于存^f諸讀取結(jié)果的處理。
地址圖像提供單元310通過掃描一封郵件的被寫入地址的部分來生成地址圖像,并將所述地址圖像輸入到地址讀取單元320 (S610)。地址讀取單元320從地址圖像中讀取地址(S620),并將所讀取的地址存儲(chǔ)到讀取結(jié)果存儲(chǔ)單元330 ( S630 )。
在這個(gè)情況下,在讀取結(jié)果存儲(chǔ)單元330中存在多個(gè)所讀取的地址和與每個(gè)所讀取的地址對(duì)應(yīng)的累積值,其中所述累積值表示讀取并存儲(chǔ)對(duì)應(yīng)的所讀取的地址的累積次數(shù)。
然后,地址圖像提供單元310確定是否通過掃描一封新郵件而生成了新的地址圖像(S640),并且當(dāng)沒有生成新的地址圖像時(shí)終止處理。
這里,當(dāng)生成了新的地址圖像時(shí),地址圖像提供單元310重復(fù)步驟S610-S640。
接下來,參考圖7,將描述根據(jù)本發(fā)明第二示范實(shí)施例的、離線有效地址數(shù)據(jù)庫建立方法中的用于向有效地址數(shù)據(jù)庫添加有效地址候選者的處理。
當(dāng)已經(jīng)過去預(yù)定的時(shí)間時(shí),例如當(dāng)在開始用于在讀取結(jié)果存儲(chǔ)單元330中存儲(chǔ)讀取結(jié)果的處理之后已經(jīng)過去了預(yù)定時(shí)間時(shí),或者當(dāng)從地址圖像中讀取的讀取結(jié)果的數(shù)目超過預(yù)定的數(shù)目時(shí),有效地址候選者提取單元340從讀取結(jié)果存儲(chǔ)單元330加載讀取結(jié)果(S710),并分析與該讀取結(jié)果的所讀取的地址對(duì)應(yīng)的累積值(S720 )。
有效地址候選者提取單元340從讀取結(jié)果之中選擇如下的地址,該地址具有超過預(yù)定閾值的累積值、并且不在有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中(S730)。
這里,所選擇的地址被設(shè)置為有效地址候選者。
有效地址驗(yàn)證單元350從有效地址候選者提取單元340所選擇的有效地址候選者之中選擇一個(gè),并確定當(dāng)前模式是否是用于在有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中自動(dòng)存儲(chǔ)有效地址候選者的自動(dòng)添加模式(S750 )。
當(dāng)在步驟S750中當(dāng)前模式是自動(dòng)添加模式時(shí),有效地址驗(yàn)證單元350將所選擇的有效地址候選者存儲(chǔ)在有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中(S760),并確定在有效地址候選者提取單元340所選擇的有效地址候選者之中是否存在由于未被選擇而被留下的任何有效地址候選者(S770 )。
當(dāng)存在被留下的有效地址候選者時(shí),有效地址-驗(yàn)證單元350前進(jìn)到步驟S740。
其間,當(dāng)在步驟S750中當(dāng)前模式不是自動(dòng)添加模式時(shí),有效地址驗(yàn)證單元350輸出所選擇的有效地址候選者以及與其對(duì)應(yīng)的地址圖像,以便地址管理員看見。然后,根據(jù)地址管理員的驗(yàn)證向有效地址驗(yàn)證單元"0提供輸入(S780 )。
有效地址驗(yàn)證單元350基于地址管理員的輸入來確定所輸出的有效地址候選者是否與該地址圖像的地址相同(S790)。
當(dāng)所輸出的有效地址候選者等同于該地址圖像的地址時(shí),有效地址驗(yàn)證單元350前進(jìn)到步驟S760,而當(dāng)所輸出的有效地址候選者不同于該地址圖像的地址時(shí),有效地址驗(yàn)證單元350前進(jìn)到步驟S770。
接下來,參考圖8,將描述根據(jù)本發(fā)明第二示范實(shí)施例的、離線有效地址數(shù)據(jù)庫建立方法中的用于從有效地址數(shù)據(jù)庫中刪除無效地址候選者的處理。
當(dāng)已經(jīng)過去預(yù)定的時(shí)間時(shí),例如當(dāng)在開始用于在讀取結(jié)果存儲(chǔ)單元330中存儲(chǔ)讀取結(jié)果的處理之后已經(jīng)過去了預(yù)定時(shí)間時(shí),或者當(dāng)從地址圖#^中讀取的讀取結(jié)果的數(shù)目超過預(yù)定的數(shù)目時(shí),無效地址候選者提取單元360從讀取結(jié)果存儲(chǔ)單元330加載讀取結(jié)果(S810),并分析與該讀取結(jié)果的所讀取的地址對(duì)應(yīng)的累積值(S820 )。
無效地址候選者提取單元360從讀取結(jié)果之中選擇如下的地址,該地址具有小于預(yù)定閾值的累積值、并且處于有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中(S830)。
這里,所選擇的地址被設(shè)置為無效地址候選者。
無效地址驗(yàn)證單元370從無效地址候選者提取單元360所選擇的無效地 址候選者之中選擇一個(gè),并確定當(dāng)前模式是否是用于從有效地址存儲(chǔ)單元 380的有效地址數(shù)據(jù)庫中自動(dòng)刪除無效地址候選者的自動(dòng)刪除模式(S850 )。
當(dāng)在步驟S850中當(dāng)前模式是自動(dòng)刪除模式時(shí),無效地址-驗(yàn)證單元370 將所選擇的無效地址候選者從有效地址存儲(chǔ)單元380的有效地址數(shù)據(jù)庫中刪 除(S860),并確定在無效地址候選者提取單元360所選擇的無效地址候選 者之中是否存在由于未被選擇而被留下的無效地址候選者(S870)。
當(dāng)存在被留下的無效地址候選者時(shí),無效地址驗(yàn)證單元370前進(jìn)到步驟 S8復(fù)
其間,當(dāng)在步驟S850中當(dāng)前模式不是自動(dòng)刪除模式時(shí),無效地址驗(yàn)證 單元370輸出所選擇的無效地址候選者以及與其對(duì)應(yīng)的地址圖像,以便地址 管理員看見。然后,根據(jù)地址管理員的驗(yàn)證向無效地址驗(yàn)證單元370提供輸 入(S880 )。
無效地址驗(yàn)證單元370基于地址管理員的輸入來確定所輸出的無效地址 候選者是否與該地址圖像的地址相同(S890)。
當(dāng)所輸出的無效地址候選者與該地址圖像的地址相同時(shí),無效地址驗(yàn)證 單元370前進(jìn)到步驟S860,而當(dāng)所輸出的無效地址候選者不等同于該地址 圖像的地址時(shí),無效地址驗(yàn)證單元370前進(jìn)到步驟S870。
本發(fā)明的上述示范實(shí)施例并不僅僅通過方法和設(shè)備來實(shí)施??商鎿Q地, 可以通過用于執(zhí)行與本發(fā)明示范實(shí)施例的配置對(duì)應(yīng)的功能的程序、或者在其 上記錄所述程序的記錄介質(zhì)來實(shí)現(xiàn)上述示范實(shí)施例。本發(fā)明所屬領(lǐng)域的技術(shù) 人員可以容易地從上述示范實(shí)施例的描述中導(dǎo)出這些實(shí)施例。盡管已經(jīng)結(jié)合 當(dāng)前凈皮認(rèn)為是實(shí)用示范實(shí)施例的內(nèi)容描述了本發(fā)明,但是要理解,本發(fā)明不 限于所公開的實(shí)施例,而是相反,本發(fā)明意名夂覆蓋在所附權(quán)利要求的精神和 范圍內(nèi)包括的各種修改和等效安排。
權(quán)利要求
1. 一種用于利用包括地址的地址圖像來建立地址數(shù)據(jù)庫的設(shè)備,所述設(shè)備包括地址讀取單元,用于從地址圖像中讀取地址;讀取結(jié)果存儲(chǔ)單元,用于存儲(chǔ)所讀取的地址和表示所讀取的地址的讀取次數(shù)的累積值;有效地址存儲(chǔ)單元,用于存儲(chǔ)包括多個(gè)實(shí)際存在的有效地址的有效地址數(shù)據(jù)庫;以及有效地址提取單元,用于根據(jù)從讀取結(jié)果存儲(chǔ)單元加載的所讀取的地址的累積值是否大于預(yù)定閾值,來將所讀取的地址存儲(chǔ)在有效地址存儲(chǔ)單元中。
2. 根據(jù)權(quán)利要求1的設(shè)備,其中,當(dāng)所讀取的地址的累積值大于預(yù)定 閾值時(shí),有效地址提取單元確定所讀取的地址作為有效地址,并將所讀取的 地址存儲(chǔ)在有效地址存儲(chǔ)單元中。
3. 根據(jù)權(quán)利要求1的設(shè)備,其中,當(dāng)所讀取的地址的累積值大于預(yù)定 閾值、并且在有效 相同的地址時(shí), 中。
4. 一種用于利用包括地址的地址圖像來建立地址數(shù)據(jù)庫的方法,所述 方法包括以下步驟存儲(chǔ)從地址圖像中讀取的地址和表示所讀取的地址的讀取次數(shù)的累積值;確定所讀取的地址的累積值是否大于預(yù)定閾值;以及 當(dāng)所讀取的地址的累積值大于預(yù)定閾值時(shí),將所讀取的地址存儲(chǔ)在有效地址數(shù)據(jù)庫中,其中所述有效地址數(shù)據(jù)庫包括實(shí)際存在的有效地址。
5. 根據(jù)權(quán)利要求4的方法,其中,當(dāng)所讀取的地址的累積值大于預(yù)定定步驟將所讀取的地址存儲(chǔ)在有效地址數(shù)據(jù)庫中。
6. —種用于利用包括地址的地址圖像來建立地址數(shù)據(jù)庫的設(shè)備,所述設(shè)備包括地址讀取單元,用于從地址圖像中讀取地址;讀取結(jié)果存儲(chǔ)單元,用于存儲(chǔ)所讀取的地址和表示所讀取的地址的讀取 次數(shù)的累積值;有效地址存儲(chǔ)單元,用于存儲(chǔ)包括多個(gè)在世界上實(shí)際存在的有效地址的 有效地址數(shù)據(jù)庫;有效地址候選者提取單元,用于根據(jù)從讀取結(jié)果存儲(chǔ)單元加載的所讀取 的地址的累積值是否大于預(yù)定閾值,來將所讀取的地址設(shè)置為有效地址候選 者;以及有效地址驗(yàn)證單元,用于輸出有效地址候選者和與其對(duì)應(yīng)的地址圖像, 向該有效地址驗(yàn)證單元提供關(guān)于所述有效地址候選者是否與地址圖像的地 址相同的信息,所述信息由地址管理員輸入,并且所述有效地址^^證單元基 于所述信息在有效地址數(shù)據(jù)庫中存儲(chǔ)有效地址候選者。
7. 根據(jù)權(quán)利要求6的設(shè)備,其中,當(dāng)所讀取的地址的累積值大于預(yù)定 閾值、并且在有效地址存儲(chǔ)單元的有效地址數(shù)據(jù)庫中不存在與所讀取的地址 相同的地址時(shí),有效地址提取單元將所讀取的地址設(shè)置為有效地址候選者。
8. 根據(jù)權(quán)利要求7的設(shè)備,其中,當(dāng)從地址管理員輸入的信息指明有 效地址候選者與地址圖像的地址相同時(shí),有效地址-瞼證單元將有效地址候選 者存儲(chǔ)在有效地址存儲(chǔ)單元的有效地址數(shù)據(jù)庫中。
9. 根據(jù)權(quán)利要求8的設(shè)備,其中,當(dāng)從地址管理員輸入的信息指明有 效地址候選者不同于地址圖像的地址時(shí),有效地址驗(yàn)證單元補(bǔ)償有效地址候 選者的累積值,所述累積值被存儲(chǔ)在讀取結(jié)果存儲(chǔ)單元中。
10. 根據(jù)權(quán)利要求6的設(shè)備,其中,有效地址提取單元基于地址圖像的 數(shù)目、具有有效地址的郵件的數(shù)目、處于與所提供的地址圖像對(duì)應(yīng)的區(qū)域中 的郵政投遞分支機(jī)構(gòu)的數(shù)目、和其中出現(xiàn)有效地址郵件的郵政投遞分支機(jī)構(gòu) 的數(shù)目,來調(diào)整所述預(yù)定閾值。
11. 根據(jù)權(quán)利要求10的設(shè)備,其中有效地址提取單元基于接下來的等 式之一來調(diào)整預(yù)定的閾值T = max((kXE/P), L)(k>0, L>0, k和L是常數(shù))T = max((kxN/D), L)(k〉0, L>0, k和L是常數(shù)) 其中,地址圖像的數(shù)目為N,具有有效地址的郵件的數(shù)目為E,處于與所提 供的地址圖像對(duì)應(yīng)的區(qū)域中的郵政投遞分支機(jī)構(gòu)的數(shù)目為D,并且其中出現(xiàn) 有效地址郵件的郵政投遞分支機(jī)構(gòu)的數(shù)目為P。
12. 根據(jù)權(quán)利要求10的設(shè)備,其中所述有效地址提取單元還包括 無效地址候選者提取單元,用于當(dāng)所讀取的地址的累積值小于預(yù)定閾值時(shí),將所讀取的地址設(shè)置為無效地址候選者,所述無效地址候選者具有表示 地址可能實(shí)際不存在的可能性;以及無效地址驗(yàn)證單元,用于輸出無效地址候選者和與其對(duì)應(yīng)的地址圖像, 并且當(dāng)從地址管理員輸入關(guān)于無效地址候選者與地址圖像的地址相同的信 息時(shí),從有效地址數(shù)據(jù)庫刪除所述無效地址候選者。
13. —種用于利用包括地址的地址圖像來建立地址^據(jù)庫的方法,所述 方法包括以下步驟存儲(chǔ)從地址圖像中讀取的地址和表示所讀取的地址的讀取次數(shù)的累積值;當(dāng)所讀取的地址的累積值大于預(yù)定閾值時(shí),將所讀取的地址設(shè)置為有效 地址候選者;輸出有效地址候選者和與其對(duì)應(yīng)的地址圖像,并^皮提供從地址管理員輸 入的、關(guān)于所述有效地址候選者是否與地址圖像的地址相同的信息;以及基于所述信息將所述有效地址候選者存儲(chǔ)在有效地址數(shù)據(jù)庫中,其中所 述有效地址數(shù)據(jù)庫包括實(shí)際存在的有效地址。
14. 根據(jù)權(quán)利要求13的方法,其中,當(dāng)所讀取的地址的累積值大于預(yù)述設(shè)置所讀取的地址的步驟將所讀取的地址設(shè)置為有效地址候選者。
15. 根據(jù)權(quán)利要求14的方法,其中,當(dāng)從地址管理員輸入指明有效地 址候選者與地址圖像的地址相同的信息時(shí),所述存儲(chǔ)有效地址候選者的步驟 將有效地址候選者存儲(chǔ)在有效地址數(shù)據(jù)庫中。
16. 根據(jù)權(quán)利要求15的方法,其中,當(dāng)從地址管理員輸入用于指明有 效地址候選者不同于地址圖像的地址的信息時(shí),所述存儲(chǔ)有效地址候選者的步驟補(bǔ)償與有效地址候選者對(duì)應(yīng)的累積值。
17. 根據(jù)權(quán)利要求13的方法,其中,當(dāng)所讀取的地址的累積值不大于 預(yù)定閾值、并且在有效地址數(shù)據(jù)庫中存在與所讀取的地址相同的地址時(shí),所 述設(shè)置所讀取的地址的步驟將所讀取的地址設(shè)置為無效地址候選者。
18. 根據(jù)權(quán)利要求17的方法,還包括基于地址圖像的數(shù)目、具有有效地址的郵件的數(shù)目、處于與所提供的地 址圖像對(duì)應(yīng)的區(qū)域中的郵政投遞分支機(jī)構(gòu)的數(shù)目、和其中出現(xiàn)有效地址郵件 的郵政投遞分支機(jī)構(gòu)的數(shù)目,來調(diào)整所述預(yù)定閾值。
19. 根據(jù)權(quán)利要求18的方法,其中所述調(diào)整預(yù)定閾值的步驟基于接下 來的等式之一 來調(diào)整預(yù)定的閾值T = max((kXE/P), L)(k>0, L〉0, k和L是常數(shù))T = max((kxN/D), L)(k〉0, L>0, k和L是常數(shù)) 其中,地址圖像的數(shù)目為N,具有有效地址的郵件的數(shù)目為E,處于與所提 供的地址圖像對(duì)應(yīng)的區(qū)域中的郵政投遞分支機(jī)構(gòu)的數(shù)目為D,并且其中出現(xiàn) 有效地址郵件的郵政投遞分支機(jī)構(gòu)的數(shù)目為P。
全文摘要
本發(fā)明涉及一種用于建立地址數(shù)據(jù)庫的設(shè)備及其方法。根據(jù)本發(fā)明的設(shè)備包括地址讀取單元,用于從地址圖像中讀取地址;讀取結(jié)果存儲(chǔ)單元,用于存儲(chǔ)所讀取的地址和表示所讀取的地址的讀取次數(shù)的累積值;有效地址存儲(chǔ)單元,用于存儲(chǔ)包括多個(gè)實(shí)際存在的有效地址的有效地址數(shù)據(jù)庫;以及有效地址提取單元,用于根據(jù)從讀取結(jié)果存儲(chǔ)單元加載的所讀取的地址的累積值是否大于預(yù)定閾值,來將所讀取的地址存儲(chǔ)在有效地址存儲(chǔ)單元中。根據(jù)本發(fā)明,通過驗(yàn)證從被寫入在一封郵件上的地址信息中讀取的地址來建立地址數(shù)據(jù)庫,從而改善了地址數(shù)據(jù)庫的可靠性和完整性。
文檔編號(hào)G06Q50/00GK101458702SQ200810186709
公開日2009年6月17日 申請(qǐng)日期2008年12月12日 優(yōu)先權(quán)日2007年12月13日
發(fā)明者張升翼, 樸鐘興, 金湖然 申請(qǐng)人:韓國電子通信研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1