亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

圖像形成裝置、圖像形成系統(tǒng)以及圖像形成方法_5

文檔序號:9238394閱讀:來源:國知局
數(shù)據(jù)200的文字部分如果在文件內偏偏不作為文字信息存在,則無法還原出原來的文檔。
[0172]對此,本實施方式的服務器2由于以由文字識別部110檢測出的文字代碼,與針對字體查詢數(shù)據(jù)220中所包含的所有的字體及文字大小而設定的文字表格進行對照,因此能夠大致可靠地提取出所生成的字體及文字大小。
[0173]此外,比較所檢測出的文字的圖像與圖像數(shù)據(jù)200是否一致,將由文字識別部設定在文檔數(shù)據(jù)210中的文字的描繪位置校正為準確的值。
[0174]通過如此進行構成,從而能夠大致可靠地再現(xiàn)出作為原稿來源的文檔。此外,該經轉換后的文檔數(shù)據(jù)210能夠以成為與作為其來源的文檔相同的狀態(tài)的方式被打印。此時,在文檔數(shù)據(jù)210中,由于文字的屬性被設定在文字屬性數(shù)據(jù)211中,因此來源于掃描的模糊或污點等會減少,從而能夠進行高等級的打印。
[0175]此外,本發(fā)明的實施方式所涉及的服務器2的特征在于,文字屬性數(shù)據(jù)設定部130對應于與由字體查詢部120查詢出的文字相對應地計算出的原點401來計算出下一個描繪出文字的第二原點402,當?shù)诙c402與下一個文字的原點401 —致時,作為同一文章321內的文字設定到文檔數(shù)據(jù)210中。也就是,前一個文字的第二原點402和下一個文字的原點401之間的距離為規(guī)定值以下時,在文檔數(shù)據(jù)210的文字屬性數(shù)據(jù)211中設定其屬于同一文章321。
[0176]通過如此進行構成,即使文字通過OCR等被識別為各自文章的一部分時,也能夠重新結合為統(tǒng)一的文章。因此,易于從文檔數(shù)據(jù)210中提取句子,用戶的易用性更好。
[0177]此外,本發(fā)明的實施方式所涉及的服務器2的特征在于,包括:文字圖像切換部140,對于與圖像數(shù)據(jù)200的區(qū)域301相對應的文檔數(shù)據(jù)210的描繪位置,當通過字體查詢部120查詢出符合多個字體及多個文字大小中的任意一個時,對所識別出的文字的描繪數(shù)據(jù)進行設定,而在未查詢出的情況下,對不包含文字的線條畫或者圖像的描繪數(shù)據(jù)進行設定。
[0178]通過如此進行構成,從而能夠檢測出在文字識別中被誤識別的位置。據(jù)此,通過將轉換后的文檔數(shù)據(jù)210所包含的被誤識別的文字屬性數(shù)據(jù)211刪除,能夠使用戶易于對文檔數(shù)據(jù)210進行編輯,提高用戶的便利性。此外,對于例如公司的標識等被圖案化的數(shù)據(jù)混雜在一起從而文字識別失敗的位置等,能夠刪除文字而生成完美狀態(tài)的文檔數(shù)據(jù)210。
[0179]此外,即使在針對字體及文字大小查詢失敗時,對于文字的位置,通過設定矢量的描繪數(shù)據(jù),也能夠獲取能夠進行高等級打印的文檔數(shù)據(jù)210。此外,即使在文章途中發(fā)生文字識別失敗的情況下,也能夠減少對該位置進行閱覽或打印時的不協(xié)調感。
[0180]此外,在本實施方式中,當文檔數(shù)據(jù)210為PDF時,對于在文字識別中生成的字體的邊界框,以查詢出的字體及文字大小來設定與字體有關的信息。
[0181]通過如此進行構成,能夠使PDF所包含的文字屬性數(shù)據(jù)211的字體或開始位置等信息準確,從而能夠容易地從HF中提取出樣式對應的文字信息。而且,使從HF向文字自動處理機或表格計算軟件等應用的文件轉換變得容易。
[0182]另外,在上述實施方式的字體查詢處理的說明中,在推測文字大小之后再進行查詢。
[0183]然而,控制部20還可以不先推測文字大小,而是以循環(huán)方式檢索字體查詢數(shù)據(jù)220的文字表格。此外,作為字體查詢數(shù)據(jù)220,在僅存儲有矢量數(shù)據(jù)的情況下,當將文字描繪為線性數(shù)據(jù)時,也可以通過計算與圖像數(shù)據(jù)200的區(qū)域301 —致的像素數(shù)的比例等來進行查詢。此外,控制部20也可以使用GPU運算功能等來高速地進行查詢。此外,控制部20還可以在進行查詢時利用在上述文字識別處理中生成的文字的線條畫的矢量等數(shù)據(jù)。
[0184]通過如此進行構成,從而能夠削減存儲部29的存儲容量或者使查詢高速化。
[0185]此外,在上述實施方式中,雖然對轉換為PDF或PS的例子進行了說明,但是并不限于此,能夠轉換為各種文檔格式。
[0186]此外,將圖像文件轉換為文字自動處理機的文檔文件或表格計算軟件的文件或者HTML文件等時,控制部20可以以頁面為單位對修改后的文字描繪位置的信息進行計算,對于標準字體、換行、文字間隔、余白、頁眉/頁腳等的設定也進行計算,并設定到文檔數(shù)據(jù)210中。據(jù)此,能夠還原出與作為原稿來源的文件相同的頁面設定等,易于對文檔文件進行修改,從而能夠提高用戶的便利性。
[0187]此外,在上述的本實施方式中,當查詢失敗時,以從文檔數(shù)據(jù)210中刪除所對應的文字屬性數(shù)據(jù)211的方式進行了記載,但是也可以將其保留下來。
[0188]此外,服務器2還可以具備:文字再識別部,對于通過字體查詢部120未被查詢?yōu)槎鄠€字體及多個文字大小中的任意一個的文字,指定與周圍的被查詢出的文字相同的字體或文字大小,并再次進行文字識別。通過如此進行構成,能夠提高文字識別的精度。此外,即使是劃有下劃線的文字等在以往的文字識別方式中容易識別失敗的位置,也能夠可靠地進行文字識別。
[0189]此外,在上述實施方式中,以文字識別部110先將文字屬性數(shù)據(jù)211輸出到文檔數(shù)據(jù)210中的方式進行了記載,但是并不限于此。也就是,還可以為如下結構,即文字識別部110將文字代碼等作為臨時數(shù)據(jù)輸出到存儲部29,文字屬性數(shù)據(jù)設定部130將文字代碼等設定到文檔數(shù)據(jù)中。
[0190]通過如此進行構成,從而能夠簡化處理,并能夠減少文檔數(shù)據(jù)210的修改,使處理高速化。
[0191]此外,還可以在圖像形成裝置I中執(zhí)行本實施方式的圖像文件化處理。此外,還可以以如下方式構成,即對于圖像文件化處理中的如文字識別處理、查詢處理那樣需要運算性能的處理,在服務器2中執(zhí)行,而除此之外的處理在圖像形成裝置I中執(zhí)行。此外,還可以從用戶終端對這類處理進行指示,并在具備有多個GPU等的所謂的“云端”上的服務器2中執(zhí)行。
[0192]通過如此進行構成,從而能夠削減圖像形成裝置I的控制部10、圖像處理部11以及存儲部19的成本。而且,能夠以短時間完成處理,并且減少功耗。
[0193]此外,本實施方式的圖像文件化處理還能夠應用在不使用圖像形成裝置I的系統(tǒng)中。也就是,還可以為使用網(wǎng)絡掃描儀、以USB等另行連接有掃描儀的服務器2的結構。
[0194]此外,上述實施方式的結構以及動作均為示例,在不脫離本發(fā)明宗旨的范圍內,可以適當?shù)刈兏鼒?zhí)行,這是不言而喻的。
【主權項】
1.一種圖像形成裝置,能夠將圖像數(shù)據(jù)變更為文檔數(shù)據(jù),所述圖像形成裝置包括: 文字識別部,從所述圖像數(shù)據(jù)中識別文字; 字體查詢部,對于所述圖像數(shù)據(jù)的通過所述文字識別部被識別為文字的區(qū)域,查詢所識別出的文字符合多個字體及多個文字大小中的哪一個;以及 文字屬性數(shù)據(jù)設定部,將由所述字體查詢部查詢出的字體及文字大小設定到所述文檔數(shù)據(jù)中,并且以與所述圖像數(shù)據(jù)相對應的方式設定描繪的原點、文字寬度以及側架以作為文字的描繪位置。2.根據(jù)權利要求1所述的圖像形成裝置, 所述文字屬性數(shù)據(jù)設定部進一步對應于與由所述字體查詢部查詢出的文字相對應地計算出的原點來計算下一個描繪出文字的第二原點,當所述第二原點與下一個文字的原點一致時,作為同一文章內的文字設定到所述文檔數(shù)據(jù)中。3.一種圖像形成系統(tǒng),具備在圖像形成裝置中輸入的圖像數(shù)據(jù),以及將所述圖像數(shù)據(jù)變更為文檔數(shù)據(jù)的服務器,在所述圖像形成系統(tǒng)中, 所述服務器包括: 圖像數(shù)據(jù)獲取部,從所述圖像形成裝置中獲取所述圖像數(shù)據(jù); 文字識別部,從通過所述圖像數(shù)據(jù)獲取部獲取的圖像數(shù)據(jù)中識別文字; 字體查詢部,對于所述圖像數(shù)據(jù)的通過所述文字識別部被識別為文字的區(qū)域,查詢所識別出的文字符合多個字體及多個文字大小中的哪一個;以及 文字屬性數(shù)據(jù)設定部,將由所述字體查詢部查詢出的字體及文字大小設定到所述文檔數(shù)據(jù)中,并且以與所述圖像數(shù)據(jù)相對應的方式設定描繪的原點、文字寬度以及側架以作為文字的描繪位置。4.根據(jù)權利要求3所述的圖像形成系統(tǒng), 所述文字屬性數(shù)據(jù)設定部進一步對應于與由所述字體查詢部查詢出的文字相對應地計算出的原點來計算下一個描繪出文字的第二原點,當所述第二原點與下一個文字的原點一致時,作為同一文章內的文字設定到所述文檔數(shù)據(jù)中。5.一種圖像形成方法,將圖像數(shù)據(jù)變更為文檔數(shù)據(jù),在所述圖像形成方法中, 從所述圖像數(shù)據(jù)中識別文字, 對于所述圖像數(shù)據(jù)的被識別為文字的區(qū)域,查詢所識別出的文字符合多個字體及多個文字大小中的哪一個, 將查詢出的字體及文字大小設定到所述文檔數(shù)據(jù)中,并且以與所述圖像數(shù)據(jù)相對應的方式設定描繪的原點、文字寬度以及側架以作為文字的描繪位置。6.根據(jù)權利要求5所述的圖像形成方法,進一步地, 對應于與查詢出的文字相對應地計算出的原點來計算下一個描繪出文字的第二原點,當所述第二原點與下一個文字的原點一致時,作為同一文章內的文字設定到所述文檔數(shù)據(jù)中。
【專利摘要】本發(fā)明提供圖像形成裝置、圖像形成系統(tǒng)以及圖像形成方法。本發(fā)明的圖像形成裝置包括:圖像數(shù)據(jù)獲取部、文字識別部、字體查詢部、文字屬性數(shù)據(jù)設定部。圖像數(shù)據(jù)獲取部獲取用于執(zhí)行光學文字識別(OCR)等的圖像數(shù)據(jù)。文字識別部通過OCR從所獲取的圖像數(shù)據(jù)中識別文字。字體查詢部對于圖像數(shù)據(jù)的被識別為文字的區(qū)域,查詢所識別出的文字符合多個字體及多個文字大小中的哪一個。文字屬性數(shù)據(jù)設定部將查詢出的字體及文字大小設定到文檔數(shù)據(jù)中,并且以與圖像數(shù)據(jù)相對應的方式設定描繪的原點、文字寬度以及側架以作為文字的描繪位置。通過本發(fā)明,提供一種通過將查詢出的字體及文字大小設定到文檔數(shù)據(jù)中,并且對文字的描繪位置進行設定,從而能夠生成與原來的原稿相同的文檔數(shù)據(jù)的圖像形成裝置。
【IPC分類】H04N1/00
【公開號】CN104954605
【申請?zhí)枴緾N201510111871
【發(fā)明人】原博幸
【申請人】京瓷辦公信息系統(tǒng)株式會社
【公開日】2015年9月30日
【申請日】2015年3月13日
【公告號】EP2927843A1, US20150278658
當前第5頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1