的網(wǎng)絡(luò)圖像格式(PNG,Portable Network Graphics)或位圖圖像(BMP,Bitmap Image)或標(biāo)記圖像文件格式(TIFF,Tagged Image File Format)等形式的文件。
[0086]此外,圖像數(shù)據(jù)200也可以為包含從存儲(chǔ)部29的文件夾、所連接的記錄介質(zhì)、外部終端或其他服務(wù)器等獲取的圖像在內(nèi)的JPG或PDF等圖像文件。
[0087]此外,圖像數(shù)據(jù)200為PDF時(shí),還可以包含已經(jīng)過(guò)文字識(shí)別而得到的文字屬性數(shù)據(jù)211。
[0088]此外,圖像數(shù)據(jù)200也可以為傳真接收到的聯(lián)合雙態(tài)成像組(JBIG)等圖像數(shù)據(jù)。
[0089]文檔數(shù)據(jù)210是包含文字的文檔用數(shù)據(jù)。
[0090]文檔數(shù)據(jù)210例如還可以為與HF、頁(yè)面描述語(yǔ)言(PS,PostScript (注冊(cè)商標(biāo)))、圖形描述語(yǔ)言(F1DL, Page Descript1n Language)等的電子文檔或打印數(shù)據(jù)相接近的形式的文件。此外,文檔數(shù)據(jù)210也可以為超文本標(biāo)記語(yǔ)言(HTML,Hyper Text MarkupLanguage)等超文本文件。此外,文檔數(shù)據(jù)210還可以為文字自動(dòng)處理機(jī)、表格計(jì)算軟件、繪圖軟件等各種應(yīng)用軟件(以下稱為應(yīng)用)的文件。在這種情況下,文檔數(shù)據(jù)210例如可以為 “.docx(Microsoft (注冊(cè)商標(biāo))fford(注冊(cè)商標(biāo)))”、“.xlsx(Microsoft (注冊(cè)商標(biāo))Excel (注冊(cè)商標(biāo)))”、向量圖形格式(SVG,Scalable Vector Graphics)的文件等。此外,文檔數(shù)據(jù)210也可以為打印用的頁(yè)面文件等。
[0091]另外,當(dāng)文檔數(shù)據(jù)210為PDF時(shí),既可以包含文字屬性數(shù)據(jù)211和圖像數(shù)據(jù)200,也可以僅包含文字屬性數(shù)據(jù)211。
[0092]此外,在本實(shí)施方式中,對(duì)文檔數(shù)據(jù)210為PDF或PS時(shí)的例子進(jìn)行說(shuō)明。
[0093]文字屬性數(shù)據(jù)211是文檔數(shù)據(jù)210所包含的文字代碼及文字屬性的數(shù)據(jù)。
[0094]在圖像數(shù)據(jù)200通過(guò)文字識(shí)別部110被進(jìn)行文字識(shí)別而生成文檔數(shù)據(jù)時(shí),文字屬性數(shù)據(jù)211也可以僅包含文字代碼和文字的大致描繪位置的數(shù)據(jù)。
[0095]此外,文字屬性數(shù)據(jù)211可以通過(guò)文字屬性數(shù)據(jù)設(shè)定部130設(shè)定有各文字的字體及文字大小、文字的描繪位置等數(shù)據(jù)。文字屬性數(shù)據(jù)211還可以設(shè)定有描繪的原點(diǎn)401 (圖8)、第二原點(diǎn)402、左側(cè)架403以及文字寬度404等以作為文字的描繪位置的數(shù)據(jù)。此時(shí),還可以設(shè)定有除了左側(cè)架403之外的側(cè)架(Side Bearing)。此外,文字屬性數(shù)據(jù)211還可以將作為文字集的文章321 (圖11)這樣的文章的數(shù)據(jù)設(shè)定為邊界框或字體框等。
[0096]此外,文字屬性數(shù)據(jù)211在文檔數(shù)據(jù)210為PS或PDF或PDL等時(shí),還可以包含有字體詞典數(shù)據(jù)的對(duì)象的數(shù)據(jù)。
[0097]字體查詢數(shù)據(jù)220為用于以文字代碼為檢索鍵來(lái)對(duì)所述文字代碼被描繪時(shí)的圖像數(shù)據(jù)200進(jìn)行查詢的數(shù)據(jù)。
[0098]字體查詢數(shù)據(jù)220例如可以包含每隔例如0.1點(diǎn)而生成的多個(gè)字體的各文字的位圖數(shù)據(jù)以作為文字表格等。作為字體查詢數(shù)據(jù)220的各字體,還可以包含標(biāo)準(zhǔn)PC、本公司制造的圖像形成裝置I的設(shè)備、印刷品所用的標(biāo)準(zhǔn)字體等。此外,作為字體查詢數(shù)據(jù)220的文字大小,對(duì)應(yīng)于圖像數(shù)據(jù)200的點(diǎn)每英寸(dpi,dot per inch)等,例如,可以包含8點(diǎn)?96點(diǎn)等大小的數(shù)據(jù)。此外,字體查詢數(shù)據(jù)220對(duì)于各字體的各文字大小,還可以包含有進(jìn)行粗體、斜體、下劃線、底紋等文字修飾時(shí)的數(shù)據(jù)。此外,字體查詢數(shù)據(jù)220對(duì)于各字體、各文字大小,針對(duì)文字表格中的每一個(gè)文字,還可以包含有描繪出文字的邊界框的坐標(biāo)。
[0099]另外,字體查詢數(shù)據(jù)220可以不是位圖數(shù)據(jù),而是多個(gè)字體的矢量(線條畫(huà))數(shù)據(jù)。在這種情況下,對(duì)于圖像數(shù)據(jù)200的區(qū)域,可以分別描繪出變更文字大小后的位圖并進(jìn)行比較。
[0100]在此,服務(wù)器2的控制部20通過(guò)執(zhí)行存儲(chǔ)于存儲(chǔ)部29的控制程序,從而作為圖像數(shù)據(jù)獲取部100、文字識(shí)別部110、字體查詢部120、文字屬性數(shù)據(jù)設(shè)定部130以及文字圖像切換部140來(lái)發(fā)揮功能。
[0101]此外,上述服務(wù)器2的各部成為執(zhí)行本發(fā)明的程序的硬件資源。
[0102]根據(jù)圖6?圖11,對(duì)本發(fā)明的實(shí)施方式所涉及的圖像形成裝置I執(zhí)行的圖像文件化處理進(jìn)行說(shuō)明。
[0103]在本實(shí)施方式的圖像文件化處理中,首先,獲取圖像數(shù)據(jù)200,并執(zhí)行光學(xué)文字識(shí)另|J,生成文檔數(shù)據(jù)210。然后,根據(jù)通過(guò)該光學(xué)文字識(shí)別被輸出的文字代碼,對(duì)圖像數(shù)據(jù)200的被識(shí)別為文字的區(qū)域301是以哪個(gè)字體的哪個(gè)文字大小輸出的進(jìn)行查詢。對(duì)于能夠查詢出的文字的位置,校正文檔數(shù)據(jù)210的文字的描繪位置,并寫(xiě)入與作為圖像數(shù)據(jù)200的來(lái)源的文檔相同的文字信息。此時(shí),對(duì)描繪的原點(diǎn)、文字寬度以及側(cè)架進(jìn)行設(shè)定。對(duì)于無(wú)法查詢出的文字的位置,將文檔數(shù)據(jù)210的文字刪除,置換為矢量的描繪數(shù)據(jù)。
[0104]本實(shí)施方式的圖像文件化處理主要是控制部20與各部協(xié)作并使用硬件資源來(lái)執(zhí)行存儲(chǔ)在存儲(chǔ)部29中的程序。
[0105]圖6是本發(fā)明的實(shí)施方式所涉及的圖像文件化處理的流程圖。圖7是圖6所示的文字識(shí)別處理(SlOl)的概念圖。圖8是圖6所示的文字大小推測(cè)處理(S102)及一致字體計(jì)算處理(S104)的概念圖。圖9是圖6所示的原點(diǎn)計(jì)算處理(S106)及文字描繪位置校正設(shè)定處理(S107)的概念圖。圖10是圖6所示的文字描繪位置校正設(shè)定處理(S107)所涉及的描繪數(shù)據(jù)的概念圖。圖11是圖6所示的同一文章設(shè)定處理(S109)的概念圖。
[0106](步驟S100)
[0107]首先,控制部20作為圖像數(shù)據(jù)獲取部100來(lái)進(jìn)行圖像數(shù)據(jù)獲取處理。
[0108]此外,控制部20經(jīng)由網(wǎng)絡(luò)發(fā)送接收部25從圖像形成裝置I等獲取圖像數(shù)據(jù)200,并存儲(chǔ)于存儲(chǔ)部29。
[0109]此外,控制部20還生成與圖像數(shù)據(jù)200相對(duì)應(yīng)的文檔數(shù)據(jù)210的文件。在該時(shí)點(diǎn),在文檔數(shù)據(jù)210中,雖然還未設(shè)定有文字,但是可以復(fù)制有圖像數(shù)據(jù)200所包含的圖像。
[0110]另外,控制部20可以經(jīng)由網(wǎng)絡(luò)5將遠(yuǎn)程掃描的指令發(fā)送到圖像形成裝置1,使打印有文字的原稿通過(guò)原稿讀取部12被掃描。在這種情況下,圖像形成裝置I的控制部10將掃描到的圖像數(shù)據(jù)200發(fā)送給服務(wù)器2。此時(shí),在書(shū)籍等雙聯(lián)頁(yè)原稿的情況下,控制部10還可以執(zhí)行使端部變形等處理。此外,控制部10還可以除去圖像的污點(diǎn)、除去波紋、提高圖像的清晰度、進(jìn)行DPI轉(zhuǎn)換的處理等。此外,控制部10對(duì)于這些圖像處理,還可以通過(guò)圖像處理部11的GPU等來(lái)高速化地執(zhí)行。
[0111]此外,控制部20還可以從未圖示的記錄介質(zhì)、外部終端或服務(wù)器等獲取圖像數(shù)據(jù)200,并存儲(chǔ)于存儲(chǔ)部29。
[0112]此外,控制部20還可以獲取由圖像形成裝置I的未圖示的FAX發(fā)送接收部接收到的圖像數(shù)據(jù)200,并存儲(chǔ)于存儲(chǔ)部29。
[0113]此外,控制部20可以將所獲取的圖像數(shù)據(jù)200轉(zhuǎn)換為特定形式的數(shù)據(jù)。
[0114](步驟S101)
[0115]接著,控制部20作為文字識(shí)別部110來(lái)進(jìn)行文字識(shí)別處理。
[0116]根據(jù)圖7的(a),控制部20對(duì)圖像數(shù)據(jù)200內(nèi)描繪有文字的位置進(jìn)行檢索,對(duì)于這個(gè)被檢索出的位置,針對(duì)每一個(gè)文字進(jìn)行文字識(shí)別??刂撇?0將所識(shí)別出的文字的文字描繪區(qū)域311這樣的數(shù)據(jù)包含在文字屬性數(shù)據(jù)211中,并設(shè)定到文檔數(shù)據(jù)210中。
[0117]根據(jù)圖7的(b),文字描繪區(qū)域311設(shè)定有描繪位置,所述描繪位置為在文檔數(shù)據(jù)210內(nèi)以大致與圖像數(shù)據(jù)200相同的位置閱覽或打印的位置。文字描繪區(qū)域311例如在文檔數(shù)據(jù)210為PS或PDF或PDL等情況下,可以被定義為字體框410的集合體,所述字體框410包含原點(diǎn)400與UTF8等編碼形式的文字代碼。
[0118]該時(shí)點(diǎn)下的文字描繪區(qū)域311也可以僅設(shè)定有各字體框410的原點(diǎn)400與缺省(既定)的字體。因此,如果對(duì)該時(shí)點(diǎn)的文字描繪區(qū)域311的描繪數(shù)據(jù)進(jìn)行描繪,則成為與作為圖像數(shù)據(jù)200的來(lái)源的原稿不同的描繪結(jié)果。
[0119]此外,控制部20還可以將所識(shí)別出的文字代碼和圖像數(shù)據(jù)200的被識(shí)別為文字的區(qū)域301的坐標(biāo)作為臨時(shí)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)部29中。另外,控制部20還可以將文字識(shí)別時(shí)計(jì)算出的文字的矢量數(shù)據(jù)等也作為臨時(shí)數(shù)據(jù)存儲(chǔ)在存儲(chǔ)部29中。
[0120]此外,控制部20還可以對(duì)除了文字之外的圖形等進(jìn)行識(shí)別。此外,當(dāng)圖像數(shù)據(jù)200中包含有已進(jìn)行了文字識(shí)別而得到的文字屬性數(shù)據(jù)211時(shí),也可以跳過(guò)該文字識(shí)別處理。
[0121](步驟S102)
[0122]接著,控制部20作為字體查詢部120來(lái)進(jìn)行文字大小推測(cè)處理。
[0123]根據(jù)圖8的(a),在本處理?步驟S104的一致字體計(jì)算處理中,控制部20對(duì)于經(jīng)OCR處理的各文字,計(jì)算字體的種類及文字大小。此外,控制部20設(shè)定作為每個(gè)文字的描繪區(qū)域的邊界框411、字體描繪的原點(diǎn)401、作為下一個(gè)文字的原點(diǎn)的第二原點(diǎn)402、作為文字描繪中的左側(cè)留白的左側(cè)架403、文字寬度404等描繪數(shù)據(jù)。此時(shí),控制部20以成為與圖像數(shù)據(jù)200 —致的坐標(biāo)的方式來(lái)計(jì)算原點(diǎn)401、文字寬度404以及左側(cè)架403。為此,首先,在本處理中,控制部20對(duì)文字大小進(jìn)行推測(cè)。
[0124]根據(jù)圖8的(b),控制部20對(duì)字體查詢數(shù)據(jù)220之中的在上述文字識(shí)別處理中計(jì)算出的、圖像數(shù)據(jù)200的被識(shí)別為文字的區(qū)域301的各文字的區(qū)域302的大小與各文字大小中的各字體的邊界框的大小等進(jìn)行比較來(lái)推測(cè)文字大小??刂撇?0在進(jìn)行該比較時(shí),考慮與邊界框411相對(duì)應(yīng)地實(shí)際描繪出文字的坐標(biāo)的大小,來(lái)與區(qū)域302的大小進(jìn)行比較。而且,此時(shí),控制部20還對(duì)進(jìn)行了文字修飾時(shí)的數(shù)據(jù)的邊界框進(jìn)行比較。此外,控制部20在比較時(shí)還可以參照?qǐng)D像數(shù)據(jù)200自身的大小、dp1、分辨率等信息。
[0125]控制部20經(jīng)過(guò)比較將邊界框的大小與區(qū)