亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法與設(shè)備的制作方法

文檔序號(hào):6620492閱讀:159來源:國知局
一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法與設(shè)備的制作方法
【專利摘要】本發(fā)明的目的是提供一種識(shí)別圖像中的目標(biāo)對(duì)象的方法與設(shè)備。具體地,根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像;識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象;根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象。與現(xiàn)有技術(shù)相比,本發(fā)明識(shí)別到的目標(biāo)對(duì)象與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配,即與用戶涂覆的涂覆區(qū)域相匹配,從而實(shí)現(xiàn)了在準(zhǔn)確識(shí)別用戶的真實(shí)需求,并能夠比較精細(xì)的識(shí)別用戶涂覆區(qū)域的同時(shí),提高了對(duì)用戶涂覆的涂覆區(qū)域中的內(nèi)容進(jìn)行識(shí)別的準(zhǔn)確度,相應(yīng)地,也提高了用戶獲取信息的效率,并提升了用戶的識(shí)別體驗(yàn)以及用戶對(duì)識(shí)別結(jié)果的滿意度。
【專利說明】-種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法與設(shè)備

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,尤其涉及一種用于識(shí)別圖像中的目標(biāo)對(duì)象的技術(shù)。

【背景技術(shù)】
[0002] 現(xiàn)有的將紙面文字電子化技術(shù)通常是基于OCR (Optical Character Recognition,光學(xué)字符識(shí)別)實(shí)現(xiàn)的,如通過使用掃描儀或數(shù)碼相機(jī)對(duì)文本資料進(jìn)行掃描 成圖像文件,以對(duì)圖像文件進(jìn)行分析處理,并自動(dòng)識(shí)別獲取文字信息及版面信息,來得到相 應(yīng)的電子版文字。然而,現(xiàn)有技術(shù)對(duì)圖像中的相關(guān)內(nèi)容識(shí)別時(shí),通常將整個(gè)圖像內(nèi)容作為輸 入來進(jìn)行檢測(cè),以識(shí)別圖像中的內(nèi)容如文本等,而當(dāng)用戶僅希望識(shí)別圖像中的部分內(nèi)容時(shí), 現(xiàn)有技術(shù)無法提供給用戶自主選擇圖像中部分文字區(qū)域進(jìn)行識(shí)別和輸出的交互方式,從而 無法準(zhǔn)確確定用戶的真實(shí)需求,降低了用戶對(duì)識(shí)別結(jié)果的滿意度,也影響了用戶的識(shí)別體 驗(yàn)。


【發(fā)明內(nèi)容】

[0003] 本發(fā)明的一個(gè)目的是提供一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法與設(shè)備。
[0004] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法,其中,該 方法包括:
[0005] 根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像;
[0006] 識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象;
[0007] 根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹 配的一個(gè)或多個(gè)目標(biāo)對(duì)象。
[0008] 根據(jù)本發(fā)明的另一方面,還提供了一種用于識(shí)別圖像中的目標(biāo)對(duì)象的識(shí)別設(shè)備, 其中,該識(shí)別設(shè)備包括:
[0009] 用于根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像的裝 置;
[0010] 用于識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象的裝置;
[0011] 用于根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息 相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象的裝置。
[0012] 與現(xiàn)有技術(shù)相比,本發(fā)明的一個(gè)實(shí)施例通過根據(jù)經(jīng)用戶涂覆的第一圖像確定所述 第一圖像中被涂覆的第二圖像,來識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象,以根據(jù)所 述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè) 目標(biāo)對(duì)象,使得識(shí)別到的目標(biāo)對(duì)象與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配,即與用 戶涂覆的涂覆區(qū)域相匹配,從而實(shí)現(xiàn)了在準(zhǔn)確識(shí)別用戶的真實(shí)需求,并能夠比較精細(xì)的識(shí) 別用戶涂覆區(qū)域的同時(shí),提高了對(duì)用戶涂覆的涂覆區(qū)域中的內(nèi)容進(jìn)行識(shí)別的準(zhǔn)確度,相應(yīng) 地,也提高了用戶獲取信息的效率,并提升了用戶的識(shí)別體驗(yàn)以及用戶對(duì)識(shí)別結(jié)果的滿意 度;而且,本發(fā)明的另一個(gè)實(shí)施例在識(shí)別所述第二圖像中的候選對(duì)象時(shí),僅發(fā)送被涂覆的第 二圖像到網(wǎng)絡(luò)設(shè)備,進(jìn)一步減少了資源開銷,降低了流量消耗與資源開銷,相應(yīng)地,也進(jìn)一 步提商了識(shí)別效率。

【專利附圖】

【附圖說明】
[0013] 通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它 特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0014] 圖1示出根據(jù)本發(fā)明一個(gè)方面的一種用于識(shí)別圖像中的目標(biāo)對(duì)象的識(shí)別設(shè)備的 設(shè)備不意圖;
[0015] 圖2示出一個(gè)實(shí)施例的未涂覆的第一圖像的圖像示意圖;
[0016] 圖3示出圖2中的第一圖像經(jīng)用戶涂覆后的圖像示意圖;
[0017] 圖4示出圖3所示的經(jīng)用戶涂覆的第一圖像中被涂覆的第二圖像的圖像示意圖;
[0018] 圖5示出圖4所示的第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息的示意圖;
[0019] 圖6示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的一種用于識(shí)別圖像中的目標(biāo)對(duì)象的識(shí)別 設(shè)備的設(shè)備示意圖;
[0020] 圖7示出根據(jù)本發(fā)明另一個(gè)方面的一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法流程 圖;
[0021] 圖8示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法 流程圖。
[0022] 附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。

【具體實(shí)施方式】
[0023] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0024] 圖1示出根據(jù)本發(fā)明一個(gè)方面的一種用于識(shí)別圖像中的目標(biāo)對(duì)象的識(shí)別設(shè)備1 的設(shè)備示意圖,其中,識(shí)別設(shè)備1包括用于根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像 中被涂覆的第二圖像的裝置(以下簡稱"涂覆圖像確定裝置11")、用于識(shí)別所述第二圖像 中的一個(gè)或多個(gè)候選對(duì)象的裝置(以下簡稱"識(shí)別裝置12")、用于根據(jù)所述一個(gè)或多個(gè)候 選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象的裝置 (以下簡稱"目標(biāo)確定裝置13")。具體地,涂覆圖像確定裝置11根據(jù)經(jīng)用戶涂覆的第一圖 像確定所述第一圖像中被涂覆的第二圖像;識(shí)別裝置12識(shí)別所述第二圖像中的一個(gè)或多 個(gè)候選對(duì)象;目標(biāo)確定裝置13根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng) 的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象。
[0025] 在此,識(shí)別設(shè)備1包括但不限于如用于通過識(shí)別引擎(如OCR引擎、圖像檢測(cè)識(shí)別 引擎等)將紙質(zhì)版文字、圖片等自動(dòng)轉(zhuǎn)換為對(duì)應(yīng)的電子版文字、圖片,或者通過拍照而得到 的電子版圖片,并能夠識(shí)別出用戶在電子版文字、圖片上涂覆的內(nèi)容,從而實(shí)現(xiàn)記錄用戶涂 覆內(nèi)容,還可允許用戶編輯、分享所識(shí)別出的用戶涂覆內(nèi)容的網(wǎng)絡(luò)平臺(tái)或終端平臺(tái),如涂書 筆記客戶端等,其中,所述終端平臺(tái)包括但不限于移動(dòng)終端、PC等用戶設(shè)備。識(shí)別設(shè)備1可 由網(wǎng)絡(luò)設(shè)備、用戶設(shè)備或網(wǎng)絡(luò)設(shè)備與用戶設(shè)備通過網(wǎng)絡(luò)相集成所構(gòu)成的設(shè)備實(shí)現(xiàn)。在此,所 述網(wǎng)絡(luò)設(shè)備包括但不限于如網(wǎng)絡(luò)主機(jī)、單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器集或基于云計(jì)算 的計(jì)算機(jī)集合等實(shí)現(xiàn);或者由用戶設(shè)備實(shí)現(xiàn)。在此,云由基于云計(jì)算(Cloud Computing)的 大量主機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī) 集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī)。在此,所述用戶設(shè)備可以是任何一種可與用戶通過鍵盤、鼠 標(biāo)、觸摸板、觸摸屏、或手寫設(shè)備等方式進(jìn)行人機(jī)交互的電子產(chǎn)品,例如計(jì)算機(jī)、手機(jī)、PDA、 掌上電腦PPC或平板電腦等。所述網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN 網(wǎng)絡(luò)、無線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別設(shè)備1僅為 舉例,其他現(xiàn)有的或今后可能出現(xiàn)的網(wǎng)絡(luò)設(shè)備或用戶設(shè)備如可適用于本發(fā)明,也應(yīng)包含在 本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。在此,網(wǎng)絡(luò)設(shè)備及用戶設(shè)備均包括一種 能夠按照事先設(shè)定或存儲(chǔ)的指令,自動(dòng)進(jìn)行數(shù)值計(jì)算和信息處理的電子設(shè)備,其硬件包括 但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入 式設(shè)備等。
[0026] 例如,當(dāng)識(shí)別設(shè)備1由用戶設(shè)備實(shí)現(xiàn)時(shí),其可通過用戶設(shè)備端安裝的客戶端,或用 戶設(shè)備自身提供的應(yīng)用程序接口(API),獲取用戶在第一圖像中的涂覆操作,然后,根據(jù)經(jīng) 用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像;然后,識(shí)別所述第二圖像中 的一個(gè)或多個(gè)候選對(duì)象,如將所述第二圖像發(fā)送至識(shí)別引擎,并接收識(shí)別引擎返回的所述 第二圖像中的一個(gè)或多個(gè)候選對(duì)象;接著,根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二 圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象,以將所述目標(biāo)對(duì)象提供給用 戶。
[0027] 例如,當(dāng)識(shí)別設(shè)備1由網(wǎng)絡(luò)設(shè)備實(shí)現(xiàn)時(shí),其可接收用戶通過用戶設(shè)備發(fā)送的用戶 在第一圖像中的涂覆操作,以及經(jīng)用戶涂覆的第一圖像,然后,根據(jù)經(jīng)用戶涂覆的第一圖像 確定所述第一圖像中被涂覆的第二圖像;然后,識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì) 象;接著,根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹 配的一個(gè)或多個(gè)目標(biāo)對(duì)象,以將所述目標(biāo)對(duì)象提供至對(duì)應(yīng)用戶設(shè)備,進(jìn)而提供給用戶。
[0028] 具體地,涂覆圖像確定裝置11根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中 被涂覆的第二圖像。在此,所述第一圖像是指用戶對(duì)其涂覆前的原始圖像,其可以是用戶通 過用戶設(shè)備對(duì)諸如紙質(zhì)文檔、圖片等任何物和景進(jìn)行拍攝得到的原始圖像,或者,也可以是 存儲(chǔ)在用戶設(shè)備本地的由用戶通過其他拍攝設(shè)備如攝像機(jī)等對(duì)諸如紙質(zhì)文檔、圖片等任何 物和景進(jìn)行拍攝到的原始圖像。在此,所述第二圖像是指所述第一圖像中包含對(duì)應(yīng)于被用 戶涂覆部分的圖像的圖像子圖,因此,所述第二圖像是原始圖像(即所述第一圖像)中的一 部分內(nèi)容。
[0029] 例如,假設(shè)用戶A讀書時(shí)讀到朱自清的散文《匆匆》時(shí),希望將其中的部分詞句摘 抄下來,其首先通過其用戶設(shè)備如手機(jī)將包含其希望摘抄的詞句的段落拍攝下來,得到如 圖2所示的第一圖像,然后,用戶A在第一圖像上對(duì)其希望摘抄的詞句如:
[0030] "燕子去了,有再來的時(shí)候;楊柳枯了,有再青的時(shí)候;桃花謝了,有再開的時(shí)候。但 是,聰明的,你告訴我,我們的日子為什么一去不復(fù)返呢?"
[0031] 進(jìn)行涂覆操作,如圖3所示,在此,所述涂覆操作是指用戶為選中其希望摘錄的詞 句和/或景和/或物而執(zhí)行的操作,其包括但不限于如涂抹、畫圈等,則涂覆圖像確定裝置 11可通過調(diào)用用戶A的手機(jī)所提供的應(yīng)用程序接口(API),便獲取到用戶A執(zhí)行的涂覆操 作;然后,涂覆圖像確定裝置11可根據(jù)用戶A執(zhí)行涂覆操作的執(zhí)行位置,確定覆蓋該涂覆操 作對(duì)應(yīng)的涂覆區(qū)域的外切區(qū)域,如外切矩形等,以將第一圖像中該外切區(qū)域所對(duì)應(yīng)的圖像 作為第一圖像中被涂覆的第二圖像,如對(duì)于圖3所示的經(jīng)用戶A涂覆后的第一圖像,則涂覆 圖像確定裝置11可將圖3中覆蓋用戶A的涂覆區(qū)域的外切矩形所對(duì)應(yīng)的圖像作為所述第 二圖像,其被涂覆后如圖4所示,即圖4中去掉涂覆即可得到所述第二圖像。
[0032] 在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,用戶的涂覆操作所對(duì)應(yīng)的涂覆區(qū)域的外切區(qū)域 的形狀,應(yīng)與用戶涂覆的對(duì)象的外形是相適應(yīng)的,例如,當(dāng)用戶涂覆的對(duì)象為文字時(shí),可采 用外切矩形、外切正方形等;當(dāng)用戶涂覆的對(duì)象為商品圖像時(shí),可采用外切橢圓形、外切多 邊形、外切圓形等。
[0033] 本領(lǐng)域技術(shù)人員應(yīng)能理解上述確定第一圖像中被涂覆的第二圖像的方式僅為舉 例,其他現(xiàn)有的或今后可能出現(xiàn)的確定第一圖像中被涂覆的第二圖像的方式如可適用于本 發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0034] 優(yōu)選地,涂覆圖像確定裝置11還可根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖 像中被涂覆的第二圖像,以及所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息。在此,涂覆圖像確定裝 置11在確定所述第一圖像中被涂覆的第二圖像時(shí),還可同時(shí)確定所述第二圖像所對(duì)應(yīng)的 涂覆區(qū)域信息,如將所述第二圖像二值化,即可得到后所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信 息。在此,所述涂覆區(qū)域信息是指所述第二圖像中用戶涂覆部分的區(qū)域,可用多種方式來表 示,如可表示為二值圖,或者,也可表示為由若干點(diǎn)圍成的區(qū)域(連通或不連通,封閉或開 放)等,如當(dāng)用戶連續(xù)涂覆時(shí),對(duì)應(yīng)的涂覆區(qū)域信息可以是一個(gè)連通的區(qū)域,如以下圖5中 所示的白色區(qū)域部分,再如,當(dāng)用戶不連續(xù)涂覆時(shí),對(duì)應(yīng)的涂覆區(qū)域信息可以是至少兩個(gè)不 連通的涂覆子區(qū)域,其中,用二值圖表示所述涂覆區(qū)域信息時(shí),所述第二圖像中用戶涂覆部 分的圖像灰度值可設(shè)為1,而用戶未涂覆部分的圖像灰度值可設(shè)為〇,或者,所述第二圖像 中用戶涂覆部分的圖像灰度值可設(shè)為〇,而用戶未涂覆部分的圖像灰度值可設(shè)為1,從而示 出所述第二圖像中用戶涂覆的部分,例如,對(duì)于如圖4所示的被涂覆的第二圖像,其中,用 戶涂覆部分的圖像灰度值設(shè)為1,而用戶未涂覆部分的圖像灰度值設(shè)為〇,得到該第二圖像 經(jīng)二值化后的圖像,如圖5所示,圖5中白色區(qū)域部分即是圖4所示的第二圖像所對(duì)應(yīng)的涂 覆區(qū)域信息。
[0035] 優(yōu)選地,所述涂覆區(qū)域信息包括至少兩個(gè)不連通的涂覆子區(qū)域。在此,所述至少兩 個(gè)不連通的涂覆子區(qū)域可以是用戶連續(xù)涂抹(或者短時(shí)間內(nèi)涂抹)第一圖像中的個(gè)別文字 (如同一文字行/不同文字行中的多個(gè)詞語/單詞)時(shí)所得到的涂覆子區(qū)域,或者也可以是 用戶連續(xù)涂抹(或者短時(shí)間內(nèi)涂抹)第一圖像中的至少兩個(gè)目標(biāo)景物時(shí)所得到的涂覆子區(qū) 域,從而使得本發(fā)明可對(duì)每次涂抹的文字或景物進(jìn)行識(shí)別,也可同時(shí)識(shí)別多次涂抹的文字 或景物,而將最終的識(shí)別結(jié)果提供給用戶時(shí)則同時(shí)提供,從而實(shí)現(xiàn)了用戶可自主選擇圖像 中部分文字和/或景物等目標(biāo)對(duì)象進(jìn)行識(shí)別的有益效果,進(jìn)一步提升了用戶對(duì)圖像中的目 標(biāo)進(jìn)行識(shí)別的識(shí)別體驗(yàn)。
[0036] 接著,識(shí)別裝置12識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象。在此,所述候選 對(duì)象是所述第二圖像中包含的全部文字、景物等內(nèi)容信息。在此,識(shí)別裝置12識(shí)別所述候 選對(duì)象的方式包括但不限于以下至少任一項(xiàng):
[0037] 1)根據(jù)所述第二圖像的內(nèi)容類型信息,將所述第二圖像發(fā)送至對(duì)應(yīng)的識(shí)別引擎, 并接收所述識(shí)別引擎返回的識(shí)別得到的所述第二圖像包含的內(nèi)容信息,即得到所述候選對(duì) 象。在此,所述內(nèi)容類型信息包括但不限于文字、景物等。在此,所述識(shí)別引擎包括但不限 于如僅對(duì)文字進(jìn)行識(shí)別的OCR引擎、圖像檢測(cè)識(shí)別引擎(如僅對(duì)景物進(jìn)行識(shí)別檢測(cè)的景物 識(shí)別引擎、僅對(duì)人物進(jìn)行識(shí)別的人物識(shí)別引擎等)。
[0038] 例如,對(duì)于如圖4所示的被涂覆的第二圖像,其內(nèi)容類型信息為文字,則識(shí)別裝置 12可將圖4所對(duì)應(yīng)的第二圖像(將圖4中去掉涂覆即可得到對(duì)應(yīng)的第二圖像,也就是說,所 述第一圖像中對(duì)應(yīng)于圖4所示的部分的圖像即是對(duì)應(yīng)的第二圖像)發(fā)送至OCR引擎,并接 收OCR引擎返回的識(shí)別得到的所述第二圖像包含的內(nèi)容信息,即得到第二圖像中的文字內(nèi) 容:
[0039] 燕子去了,有再來的時(shí)候;楊柳枯了,有再青的時(shí)候;桃花謝了,有再開的時(shí)候。但 是,聰明的,你告訴我,我們的日子為什么一去不復(fù)返呢?--是有
[0040] 并將其作為所述候選對(duì)象如candidate-objectl。在此,OCR引擎返回該文字內(nèi)容 時(shí),可包含每個(gè)文字在所述第二圖像中的位置信息,其中,所述位置信息可以每個(gè)文字在所 述第二圖像中的坐標(biāo)來示出。
[0041] 再如,假設(shè)涂覆圖像確定裝置11得到的所述第二圖像的內(nèi)容類型信息為文字和 人物的組合,則識(shí)別裝置12可將該第二圖像分別發(fā)送至OCR引擎和人物識(shí)別引擎,并接收 OCR引擎和人物識(shí)別引擎分別返回的識(shí)別結(jié)果,則OCR引擎和人物識(shí)別引擎分別返回的識(shí) 別結(jié)果的組合即是所述候選對(duì)象。
[0042] 2)將所述第二圖像發(fā)送至對(duì)應(yīng)的網(wǎng)絡(luò)設(shè)備;接收所述網(wǎng)絡(luò)設(shè)備所識(shí)別的所述第 二圖像中的一個(gè)或多個(gè)候選對(duì)象。在此,所述網(wǎng)絡(luò)設(shè)備可以是某一種識(shí)別引擎所對(duì)應(yīng)的服 務(wù)器,也可以是具有多種識(shí)別引擎所對(duì)應(yīng)的服務(wù)器。
[0043] 例如,對(duì)于如圖4所示的被涂覆的第二圖像,則識(shí)別裝置12可將圖4所對(duì)應(yīng)的第 二圖像(將圖4中去掉涂覆即可得到對(duì)應(yīng)的第二圖像,也就是說,所述第一圖像中對(duì)應(yīng)于圖 4所示的部分的圖像即是對(duì)應(yīng)的第二圖像)發(fā)送至對(duì)應(yīng)的網(wǎng)絡(luò)設(shè)備,并接收該網(wǎng)絡(luò)設(shè)備返 回的識(shí)別得到的所述第二圖像包含的內(nèi)容信息,即得到第二圖像中的文字內(nèi)容:
[0044] 燕子去了,有再來的時(shí)候;楊柳枯了,有再青的時(shí)候;桃花謝了,有再開的時(shí)候。但 是,聰明的,你告訴我,我們的日子為什么一去不復(fù)返呢?--是有
[0045] 并將其作為所述候選對(duì)象如candidate-object 1。在此,所述網(wǎng)絡(luò)設(shè)備返回該文字 內(nèi)容時(shí),可包含每個(gè)文字在所述第二圖像中的位置信息,其中,所述位置信息可以每個(gè)文字 在所述第二圖像中的坐標(biāo)來示出。
[0046] 在此,本發(fā)明僅發(fā)送被涂覆的第二圖像到網(wǎng)絡(luò)設(shè)備,進(jìn)一步減少了資源開銷,尤其 對(duì)于用戶只想識(shí)別第一圖像中的某個(gè)詞語時(shí),相對(duì)于將整個(gè)第一圖像發(fā)送至網(wǎng)絡(luò)設(shè)備進(jìn)行 識(shí)別的情形,降低了流量消耗與資源開銷,相應(yīng)地,也進(jìn)一步提高了識(shí)別效率。
[0047] 本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象的方 式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象的 方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用的方式包含于此。
[0048] 然后,目標(biāo)確定裝置13根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì) 應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象。優(yōu)選地,與所述第二圖像所對(duì)應(yīng)的涂覆 區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象包括第一目標(biāo)對(duì)象,其中,所述第一目標(biāo)對(duì)象包括 以下至少任一項(xiàng):
[0049] 包含于所述涂覆區(qū)域信息的所述候選對(duì)象;
[0050] 被所述涂覆區(qū)域信息所覆蓋的面積超過面積閾值的所述候選對(duì)象。
[0051] 例如,對(duì)于識(shí)別裝置12得到的對(duì)應(yīng)于如圖4所示的被涂覆的第二圖像的候選對(duì)象 如candidate-objectl,該第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息為圖5中的白色區(qū)域部分,則目 標(biāo)確定裝置13可將第二圖像與圖5進(jìn)行重疊,第二圖像的候選對(duì)象如candidate-objectl 中被圖5中白色區(qū)域部分全部覆蓋的文字即是所述目標(biāo)對(duì)象,即只輸出了前兩行和第三行 開頭的文字,第三行后面的文字被舍棄,得到的目標(biāo)對(duì)象為aim-objectl :
[0052] 燕子去了,有再來的時(shí)候;楊柳枯了,有再青的時(shí)候;桃花謝了,有再開的時(shí)候。但 是,聰明的,你告訴我,我們的日子為什么一去不復(fù)返呢?
[0053] 再如,假設(shè)用戶A對(duì)如圖2所示的第一圖像進(jìn)行涂覆時(shí),對(duì)第一行中的文字"有再 青的"中的"的"字未完全涂覆,假設(shè)該文字被涂覆的面積為80%,而識(shí)別裝置12得到的對(duì) 應(yīng)于如圖4所示的被涂覆的第二圖像的候選對(duì)象如candidate-objectl,則目標(biāo)確定裝置 13也可將第二圖像的候選對(duì)象如candidate-objectl中被圖5中白色區(qū)域部分所覆蓋的面 積超過面積閾值如60%的所述候選對(duì)象(即"的"字)作為所述目標(biāo)對(duì)象。
[0054] 在此,因識(shí)別出的所述候選對(duì)象并不一定是最終提供給用戶的目標(biāo)對(duì)象,如當(dāng)所 述第二圖像中包含用戶涂覆的多個(gè)不連續(xù)的詞語/單詞時(shí),該第二圖像中包含有用戶未涂 覆的文字,因此,需要從識(shí)別得到的候選對(duì)象中確定最終的目標(biāo)對(duì)象,在此,本發(fā)明通過根 據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或 多個(gè)目標(biāo)對(duì)象,即從所述候選圖像中得到與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的 所述目標(biāo)對(duì)象,提高了用戶對(duì)識(shí)別結(jié)果的滿意度。
[0055] 優(yōu)選地,與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象還 包括與所述第一目標(biāo)對(duì)象鄰接且語義相關(guān)的所述候選對(duì)象。
[0056] 例如,假設(shè)對(duì)于另一第一圖像,用戶A用灰色僅對(duì)該第一圖像中的文字"像細(xì)絲, 密密地斜織著"進(jìn)行了涂覆,識(shí)別確定裝置12識(shí)別得到的所述候選對(duì)象為"像細(xì)絲,密密地 斜",則目標(biāo)確定裝置13在確定所述目標(biāo)對(duì)象時(shí),不僅將"像細(xì)絲,密密地斜"作為目標(biāo)對(duì)象, 還可將與候選對(duì)象"斜"鄰接且語義相關(guān)的候選對(duì)象"織"或"織著"也作為所述目標(biāo)對(duì)象。
[0057] 在此,本發(fā)明通過將與所述第一目標(biāo)對(duì)象鄰接且語義相關(guān)的所述候選對(duì)象也作為 所述目標(biāo)對(duì)象,使得確定所述目標(biāo)對(duì)象語義完整,而不至于出現(xiàn)語義斷裂、不通順的現(xiàn)象, 進(jìn)一步提高了用戶對(duì)識(shí)別結(jié)果的滿意度。
[0058] 在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,在具體實(shí)施例中,所述涂覆區(qū)域信息只要在確定 所述目標(biāo)對(duì)象之前確定即可,例如在確定"第二圖像"之前、之后或同時(shí)被確定。
[0059] 識(shí)別設(shè)備1的各個(gè)裝置之間是持續(xù)不斷工作的。具體地,涂覆圖像確定裝置11持 續(xù)根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像;識(shí)別裝置12持續(xù) 識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象;目標(biāo)確定裝置13持續(xù)根據(jù)所述一個(gè)或多個(gè) 候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象。在 此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,所述"持續(xù)"是指識(shí)別設(shè)備1的各個(gè)裝置之間分別不斷地進(jìn) 行經(jīng)用戶涂覆的第一圖像中被涂覆的第二圖像的確定、第二圖像中候選對(duì)象的識(shí)別、目標(biāo) 對(duì)象的確定,直至識(shí)別設(shè)備1在較長時(shí)間內(nèi)停止確定經(jīng)用戶涂覆的第一圖像中被涂覆的第 二圖像。
[0060] 優(yōu)選地,識(shí)別設(shè)備1還包括用于將所述一個(gè)或多個(gè)目標(biāo)對(duì)象中至少一個(gè)提供至所 述用戶的對(duì)應(yīng)應(yīng)用的裝置(以下簡稱"提供裝置",未示出)。具體地,提供裝置通過諸如 http、https等約定的通信方式將所述一個(gè)或多個(gè)目標(biāo)對(duì)象中至少一個(gè)提供至所述用戶的 對(duì)應(yīng)應(yīng)用,以提供給用戶,供用戶瀏覽、保存、轉(zhuǎn)發(fā)、共享之用。在此,所述對(duì)應(yīng)應(yīng)用包括但不 限于具有摘抄功能的客戶端、筆記客戶端等。
[0061] 圖6示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的一種用于識(shí)別圖像中的目標(biāo)對(duì)象的識(shí)別 設(shè)備1的設(shè)備示意圖,其中,識(shí)別設(shè)備1包括涂覆圖像確定裝置11'、識(shí)別裝置12'和目標(biāo)確 定裝置13',其中,涂覆圖像確定裝置11'包括用于根據(jù)經(jīng)用戶涂覆的第一圖像確定覆蓋所 述用戶的涂覆區(qū)域的外切區(qū)域的單元(以下簡稱"第一確定單元11Γ")、用于根據(jù)所述外 切區(qū)域確定所述第一圖像中被涂覆的第二圖像的單元(以下簡稱"第二確定單元112'")。 具體地,第一確定單元11Γ根據(jù)經(jīng)用戶涂覆的第一圖像確定覆蓋所述用戶的涂覆區(qū)域的外 切區(qū)域;第二確定單元112'根據(jù)所述外切區(qū)域確定所述第一圖像中被涂覆的第二圖像;識(shí) 別裝置12'識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象;目標(biāo)確定裝置13'根據(jù)所述一個(gè) 或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì) 象。在此,識(shí)別裝置12'和目標(biāo)確定裝置13'分別與圖1實(shí)施例中對(duì)應(yīng)裝置的內(nèi)容相同或 基本相同,為簡明起見,故在此不再贅述,并以引用的方式包含與此。
[0062] 具體地,第一確定單元11Γ根據(jù)經(jīng)用戶涂覆的第一圖像確定覆蓋所述用戶的涂覆 區(qū)域的外切區(qū)域,如根據(jù)用戶執(zhí)行涂覆操作的執(zhí)行位置,確定覆蓋該涂覆操作對(duì)應(yīng)的涂覆 區(qū)域的外切區(qū)域,或者,根據(jù)所述第一圖像中用戶涂覆部分與其他部分圖像中的色差,來確 定覆蓋所述用戶的涂覆區(qū)域的外切區(qū)域。
[0063] 例如,對(duì)于用戶A對(duì)如圖2所示的第一圖像,用戶A通過其用戶設(shè)備如手機(jī)執(zhí)行了 涂覆操作,涂覆后得到如圖3所示的經(jīng)用戶涂覆的第一圖像,則第一確定單元11??赏ㄟ^ 調(diào)用用戶A的手機(jī)所提供的應(yīng)用程序接口(API),便獲取到用戶A執(zhí)行的涂覆操作;然后, 第一確定單元11Γ可根據(jù)用戶A執(zhí)行涂覆操作的執(zhí)行位置,確定覆蓋該涂覆操作對(duì)應(yīng)的涂 覆區(qū)域的外切區(qū)域,如外切矩形等。
[0064] 接著,第二確定單元112'根據(jù)所述外切區(qū)域確定所述第一圖像中被涂覆的第二圖 像,如將第一圖像中該外切區(qū)域所對(duì)應(yīng)的圖像作為第一圖像中被涂覆的第二圖像。例如,接 上例,對(duì)于圖3所示的經(jīng)用戶A涂覆后的第一圖像,則第二確定單元112'可將圖3中覆蓋 用戶A的涂覆區(qū)域的外切矩形所對(duì)應(yīng)的圖像作為所述第二圖像,其被涂覆后如圖4所示,即 圖4中去掉涂覆即可得到所述第二圖像。
[0065] 優(yōu)選地,第二確定單元112'按預(yù)定比例放大所述外切區(qū)域,并在放大后的所述外 切區(qū)域中確定所述第一圖像中被涂覆的第二圖像。
[0066] 例如,還接上例,則第二確定單元112'還可按預(yù)定比例放大確定的覆蓋用戶A執(zhí) 行的涂覆操作對(duì)應(yīng)的涂覆區(qū)域的外切區(qū)域,并在放大后的所述外切區(qū)域中確定所述第一圖 像中被涂覆的第二圖像,從而可保證所述外切區(qū)域能夠完整覆蓋用戶A要識(shí)別的圖像信 息,避免了不完整覆蓋。
[0067] 圖7示出根據(jù)本發(fā)明另一個(gè)方面的一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法流程 圖。
[0068] 其中,該方法包括步驟S1、步驟S2和步驟S3。具體地,在步驟S1中,識(shí)別設(shè)備1根 據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像;在步驟S2中,識(shí)別設(shè)備 1識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象;在步驟S3中,識(shí)別設(shè)備1根據(jù)所述一個(gè)或 多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象。 [0069] 在此,識(shí)別設(shè)備1包括但不限于如用于通過識(shí)別引擎(如OCR引擎、圖像檢測(cè)識(shí)別 引擎等)將紙質(zhì)版文字、圖片等自動(dòng)轉(zhuǎn)換為對(duì)應(yīng)的電子版文字、圖片,或者通過拍照而得到 的電子版圖片,并能夠識(shí)別出用戶在電子版文字、圖片上涂覆的內(nèi)容,從而實(shí)現(xiàn)記錄用戶涂 覆內(nèi)容,還可允許用戶編輯、分享所識(shí)別出的用戶涂覆內(nèi)容的網(wǎng)絡(luò)平臺(tái)或終端平臺(tái),如涂書 筆記客戶端等,其中,所述終端平臺(tái)包括但不限于移動(dòng)終端、PC等用戶設(shè)備。識(shí)別設(shè)備1可 由網(wǎng)絡(luò)設(shè)備、用戶設(shè)備或網(wǎng)絡(luò)設(shè)備與用戶設(shè)備通過網(wǎng)絡(luò)相集成所構(gòu)成的設(shè)備實(shí)現(xiàn)。在此,所 述網(wǎng)絡(luò)設(shè)備包括但不限于如網(wǎng)絡(luò)主機(jī)、單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器集或基于云計(jì)算 的計(jì)算機(jī)集合等實(shí)現(xiàn);或者由用戶設(shè)備實(shí)現(xiàn)。在此,云由基于云計(jì)算(Cloud Computing)的 大量主機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī) 集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī)。在此,所述用戶設(shè)備可以是任何一種可與用戶通過鍵盤、鼠 標(biāo)、觸摸板、觸摸屏、或手寫設(shè)備等方式進(jìn)行人機(jī)交互的電子產(chǎn)品,例如計(jì)算機(jī)、手機(jī)、PDA、 掌上電腦PPC或平板電腦等。所述網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN 網(wǎng)絡(luò)、無線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別設(shè)備1僅為 舉例,其他現(xiàn)有的或今后可能出現(xiàn)的網(wǎng)絡(luò)設(shè)備或用戶設(shè)備如可適用于本發(fā)明,也應(yīng)包含在 本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。在此,網(wǎng)絡(luò)設(shè)備及用戶設(shè)備均包括一種 能夠按照事先設(shè)定或存儲(chǔ)的指令,自動(dòng)進(jìn)行數(shù)值計(jì)算和信息處理的電子設(shè)備,其硬件包括 但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入 式設(shè)備等。
[0070] 例如,當(dāng)識(shí)別設(shè)備1由用戶設(shè)備實(shí)現(xiàn)時(shí),其可通過用戶設(shè)備端安裝的客戶端,或用 戶設(shè)備自身提供的應(yīng)用程序接口(API),獲取用戶在第一圖像中的涂覆操作,然后,根據(jù)經(jīng) 用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像;然后,識(shí)別所述第二圖像中 的一個(gè)或多個(gè)候選對(duì)象,如將所述第二圖像發(fā)送至識(shí)別引擎,并接收識(shí)別引擎返回的所述 第二圖像中的一個(gè)或多個(gè)候選對(duì)象;接著,根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二 圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象,以將所述目標(biāo)對(duì)象提供給用 戶。
[0071] 例如,當(dāng)識(shí)別設(shè)備1由網(wǎng)絡(luò)設(shè)備實(shí)現(xiàn)時(shí),其可接收用戶通過用戶設(shè)備發(fā)送的用戶 在第一圖像中的涂覆操作,以及經(jīng)用戶涂覆的第一圖像,然后,根據(jù)經(jīng)用戶涂覆的第一圖像 確定所述第一圖像中被涂覆的第二圖像;然后,識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì) 象;接著,根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹 配的一個(gè)或多個(gè)目標(biāo)對(duì)象,以將所述目標(biāo)對(duì)象提供至對(duì)應(yīng)用戶設(shè)備,進(jìn)而提供給用戶。
[0072] 具體地,在步驟S1中,識(shí)別設(shè)備1根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像 中被涂覆的第二圖像。在此,所述第一圖像是指用戶對(duì)其涂覆前的原始圖像,其可以是用戶 通過用戶設(shè)備對(duì)諸如紙質(zhì)文檔、圖片等任何物和景進(jìn)行拍攝得到的原始圖像,或者,也可以 是存儲(chǔ)在用戶設(shè)備本地的由用戶通過其他拍攝設(shè)備如攝像機(jī)等對(duì)諸如紙質(zhì)文檔、圖片等任 何物和景進(jìn)行拍攝到的原始圖像。在此,所述第二圖像是指所述第一圖像中包含對(duì)應(yīng)于被 用戶涂覆部分的圖像的圖像子圖,因此,所述第二圖像是原始圖像(即所述第一圖像)中的 一部分內(nèi)容。
[0073] 例如,假設(shè)用戶A讀書時(shí)讀到朱自清的散文《匆匆》時(shí),希望將其中的部分詞句摘 抄下來,其首先通過其用戶設(shè)備如手機(jī)將包含其希望摘抄的詞句的段落拍攝下來,得到如 圖2所示的第一圖像,然后,用戶A在第一圖像上對(duì)其希望摘抄的詞句如:
[0074] "燕子去了,有再來的時(shí)候;楊柳枯了,有再青的時(shí)候;桃花謝了,有再開的時(shí)候。但 是,聰明的,你告訴我,我們的日子為什么一去不復(fù)返呢?"
[0075] 進(jìn)行涂覆操作,如圖3所示,在此,所述涂覆操作是指用戶為選中其希望摘錄的詞 句和/或景和/或物而執(zhí)行的操作,其包括但不限于如涂抹、畫圈等,則在步驟S1中,識(shí)別 設(shè)備1可通過調(diào)用用戶A的手機(jī)所提供的應(yīng)用程序接口(API),便獲取到用戶A執(zhí)行的涂覆 操作;然后,在步驟S1中,識(shí)別設(shè)備1可根據(jù)用戶A執(zhí)行涂覆操作的執(zhí)行位置,確定覆蓋該 涂覆操作對(duì)應(yīng)的涂覆區(qū)域的外切區(qū)域,如外切矩形等,以將第一圖像中該外切區(qū)域所對(duì)應(yīng) 的圖像作為第一圖像中被涂覆的第二圖像,如對(duì)于圖3所示的經(jīng)用戶A涂覆后的第一圖像, 則在步驟S1中,識(shí)別設(shè)備1可將圖3中覆蓋用戶A的涂覆區(qū)域的外切矩形所對(duì)應(yīng)的圖像作 為所述第二圖像,其被涂覆后如圖4所示,即圖4中去掉涂覆即可得到所述第二圖像。
[0076] 在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,用戶的涂覆操作所對(duì)應(yīng)的涂覆區(qū)域的外切區(qū)域 的形狀,應(yīng)與用戶涂覆的對(duì)象的外形是相適應(yīng)的,例如,當(dāng)用戶涂覆的對(duì)象為文字時(shí),可采 用外切矩形、外切正方形等;當(dāng)用戶涂覆的對(duì)象為商品圖像時(shí),可采用外切橢圓形、外切多 邊形、外切圓形等。
[0077] 本領(lǐng)域技術(shù)人員應(yīng)能理解上述確定第一圖像中被涂覆的第二圖像的方式僅為舉 例,其他現(xiàn)有的或今后可能出現(xiàn)的確定第一圖像中被涂覆的第二圖像的方式如可適用于本 發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
[0078] 優(yōu)選地,在步驟S1中,識(shí)別設(shè)備1還可根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一 圖像中被涂覆的第二圖像,以及所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息。在此,在步驟S1中, 識(shí)別設(shè)備1在確定所述第一圖像中被涂覆的第二圖像時(shí),還可同時(shí)確定所述第二圖像所對(duì) 應(yīng)的涂覆區(qū)域信息,如將所述第二圖像二值化,即可得到后所述第二圖像所對(duì)應(yīng)的涂覆區(qū) 域信息。在此,所述涂覆區(qū)域信息是指所述第二圖像中用戶涂覆部分的區(qū)域,可用多種方 式來表示,如可表示為二值圖,或者,也可表示為由若干點(diǎn)圍成的區(qū)域(連通或不連通,封 閉或開放)等,如當(dāng)用戶連續(xù)涂覆時(shí),對(duì)應(yīng)的涂覆區(qū)域信息可以是一個(gè)連通的區(qū)域,如以下 圖5中所示的白色區(qū)域部分,再如,當(dāng)用戶不連續(xù)涂覆時(shí),對(duì)應(yīng)的涂覆區(qū)域信息可以是至少 兩個(gè)不連通的涂覆子區(qū)域,其中,用二值圖表示所述涂覆區(qū)域信息時(shí),所述第二圖像中用戶 涂覆部分的圖像灰度值可設(shè)為1,而用戶未涂覆部分的圖像灰度值可設(shè)為〇,或者,所述第 二圖像中用戶涂覆部分的圖像灰度值可設(shè)為〇,而用戶未涂覆部分的圖像灰度值可設(shè)為1, 從而示出所述第二圖像中用戶涂覆的部分,例如,對(duì)于如圖4所示的被涂覆的第二圖像,其 中,用戶涂覆部分的圖像灰度值設(shè)為1,而用戶未涂覆部分的圖像灰度值設(shè)為〇,得到該第 二圖像經(jīng)二值化后的圖像,如圖5所示,圖5中白色區(qū)域部分即是圖4所示的第二圖像所對(duì) 應(yīng)的涂覆區(qū)域信息。
[0079] 優(yōu)選地,所述涂覆區(qū)域信息包括至少兩個(gè)不連通的涂覆子區(qū)域。在此,所述至少兩 個(gè)不連通的涂覆子區(qū)域可以是用戶連續(xù)涂抹(或者短時(shí)間內(nèi)涂抹)第一圖像中的個(gè)別文字 (如同一文字行/不同文字行中的多個(gè)詞語/單詞)時(shí)所得到的涂覆子區(qū)域,或者也可以是 用戶連續(xù)涂抹(或者短時(shí)間內(nèi)涂抹)第一圖像中的至少兩個(gè)目標(biāo)景物時(shí)所得到的涂覆子區(qū) 域,從而使得本發(fā)明可對(duì)每次涂抹的文字或景物進(jìn)行識(shí)別,也可同時(shí)識(shí)別多次涂抹的文字 或景物,而將最終的識(shí)別結(jié)果提供給用戶時(shí)則同時(shí)提供,從而實(shí)現(xiàn)了用戶可自主選擇圖像 中部分文字和/或景物等目標(biāo)對(duì)象進(jìn)行識(shí)別的有益效果,進(jìn)一步提升了用戶對(duì)圖像中的目 標(biāo)進(jìn)行識(shí)別的識(shí)別體驗(yàn)。
[0080] 接著,在步驟S2中,識(shí)別設(shè)備1識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象。在 此,所述候選對(duì)象是所述第二圖像中包含的全部文字、景物等內(nèi)容信息。在此,在步驟S2 中,識(shí)別設(shè)備1識(shí)別所述候選對(duì)象的方式包括但不限于以下至少任一項(xiàng):
[0081] 1)根據(jù)所述第二圖像的內(nèi)容類型信息,將所述第二圖像發(fā)送至對(duì)應(yīng)的識(shí)別引擎, 并接收所述識(shí)別引擎返回的識(shí)別得到的所述第二圖像包含的內(nèi)容信息,即得到所述候選對(duì) 象。在此,所述內(nèi)容類型信息包括但不限于文字、景物等。在此,所述識(shí)別引擎包括但不限 于如僅對(duì)文字進(jìn)行識(shí)別的OCR引擎、圖像檢測(cè)識(shí)別引擎(如僅對(duì)景物進(jìn)行識(shí)別檢測(cè)的景物 識(shí)別引擎、僅對(duì)人物進(jìn)行識(shí)別的人物識(shí)別引擎等)。
[0082] 例如,對(duì)于如圖4所示的被涂覆的第二圖像,其內(nèi)容類型信息為文字,則在步驟S2 中,識(shí)別設(shè)備1可將圖4所對(duì)應(yīng)的第二圖像(將圖4中去掉涂覆即可得到對(duì)應(yīng)的第二圖像, 也就是說,所述第一圖像中對(duì)應(yīng)于圖4所示的部分的圖像即是對(duì)應(yīng)的第二圖像)發(fā)送至OCR 引擎,并接收OCR引擎返回的識(shí)別得到的所述第二圖像包含的內(nèi)容信息,即得到第二圖像 中的文字內(nèi)容:
[0083] 燕子去了,有再來的時(shí)候;楊柳枯了,有再青的時(shí)候;桃花謝了,有再開的時(shí)候。但 是,聰明的,你告訴我,我們的日子為什么一去不復(fù)返呢?--是有
[0084] 并將其作為所述候選對(duì)象如candidate-objectl。在此,OCR引擎返回該文字內(nèi)容 時(shí),可包含每個(gè)文字在所述第二圖像中的位置信息,其中,所述位置信息可以每個(gè)文字在所 述第二圖像中的坐標(biāo)來示出。
[0085] 再如,假設(shè)在步驟S1中,識(shí)別設(shè)備1得到的所述第二圖像的內(nèi)容類型信息為文字 和人物的組合,則在步驟S2中,識(shí)別設(shè)備1可將該第二圖像分別發(fā)送至OCR引擎和人物識(shí) 另IJ引擎,并接收OCR引擎和人物識(shí)別引擎分別返回的識(shí)別結(jié)果,則OCR引擎和人物識(shí)別引擎 分別返回的識(shí)別結(jié)果的組合即是所述候選對(duì)象。
[0086] 2)將所述第二圖像發(fā)送至對(duì)應(yīng)的網(wǎng)絡(luò)設(shè)備;接收所述網(wǎng)絡(luò)設(shè)備所識(shí)別的所述第 二圖像中的一個(gè)或多個(gè)候選對(duì)象。在此,所述網(wǎng)絡(luò)設(shè)備可以是某一種識(shí)別引擎所對(duì)應(yīng)的服 務(wù)器,也可以是具有多種識(shí)別引擎所對(duì)應(yīng)的服務(wù)器。
[0087] 例如,對(duì)于如圖4所示的被涂覆的第二圖像,則在步驟S2中,識(shí)別設(shè)備1可將圖4 所對(duì)應(yīng)的第二圖像(將圖4中去掉涂覆即可得到對(duì)應(yīng)的第二圖像,也就是說,所述第一圖 像中對(duì)應(yīng)于圖4所示的部分的圖像即是對(duì)應(yīng)的第二圖像)發(fā)送至對(duì)應(yīng)的網(wǎng)絡(luò)設(shè)備,并接收 該網(wǎng)絡(luò)設(shè)備返回的識(shí)別得到的所述第二圖像包含的內(nèi)容信息,即得到第二圖像中的文字內(nèi) 容:
[0088] 燕子去了,有再來的時(shí)候;楊柳枯了,有再青的時(shí)候;桃花謝了,有再開的時(shí)候。但 是,聰明的,你告訴我,我們的日子為什么一去不復(fù)返呢?--是有
[0089] 并將其作為所述候選對(duì)象如candidate-ob jectl。在此,所述網(wǎng)絡(luò)設(shè)備返回該文字 內(nèi)容時(shí),可包含每個(gè)文字在所述第二圖像中的位置信息,其中,所述位置信息可以每個(gè)文字 在所述第二圖像中的坐標(biāo)來示出。
[0090] 在此,本發(fā)明僅發(fā)送被涂覆的第二圖像到網(wǎng)絡(luò)設(shè)備,進(jìn)一步減少了資源開銷,尤其 對(duì)于用戶只想識(shí)別第一圖像中的某個(gè)詞語時(shí),相對(duì)于將整個(gè)第一圖像發(fā)送至網(wǎng)絡(luò)設(shè)備進(jìn)行 識(shí)別的情形,降低了流量消耗與資源開銷,相應(yīng)地,也進(jìn)一步提高了識(shí)別效率。
[0091] 本領(lǐng)域技術(shù)人員應(yīng)能理解上述識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象的方 式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象的 方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用的方式包含于此。
[0092] 然后,在步驟S3中,識(shí)別設(shè)備1根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖 像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象。優(yōu)選地,與所述第二圖像所對(duì)應(yīng) 的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象包括第一目標(biāo)對(duì)象,其中,所述第一目標(biāo)對(duì) 象包括以下至少任一項(xiàng):
[0093] 包含于所述涂覆區(qū)域信息的所述候選對(duì)象;
[0094] 被所述涂覆區(qū)域信息所覆蓋的面積超過面積閾值的所述候選對(duì)象。
[0095] 例如,對(duì)于在步驟S2中,識(shí)別設(shè)備1得到的對(duì)應(yīng)于如圖4所示的被涂覆的第二 圖像的候選對(duì)象如candidate-objectl,該第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息為圖5中的 白色區(qū)域部分,則在步驟S3中,識(shí)別設(shè)備1可將第二圖像與圖5進(jìn)行重疊,第二圖像的候 選對(duì)象如candidate-objectl中被圖5中白色區(qū)域部分全部覆蓋的文字即是所述目標(biāo)對(duì) 象,即只輸出了前兩行和第三行開頭的文字,第三行后面的文字被舍棄,得到的目標(biāo)對(duì)象為 aim-objectl :
[0096] 燕子去了,有再來的時(shí)候;楊柳枯了,有再青的時(shí)候;桃花謝了,有再開的時(shí)候。但 是,聰明的,你告訴我,我們的日子為什么一去不復(fù)返呢?
[0097] 再如,假設(shè)用戶A對(duì)如圖2所示的第一圖像進(jìn)行涂覆時(shí),對(duì)第一行中的文字"有再 青的"中的"的"字未完全涂覆,假設(shè)該文字被涂覆的面積為80%,而在步驟S2中,識(shí)別設(shè)備 1得到的對(duì)應(yīng)于如圖4所示的被涂覆的第二圖像的候選對(duì)象如candidate-objectl,貝u在步 驟S3中,識(shí)別設(shè)備1也可將第二圖像的候選對(duì)象如candidate-objectl中被圖5中白色區(qū) 域部分所覆蓋的面積超過面積閾值如60%的所述候選對(duì)象(即"的"字)作為所述目標(biāo)對(duì) 象。
[0098] 在此,因識(shí)別出的所述候選對(duì)象并不一定是最終提供給用戶的目標(biāo)對(duì)象,如當(dāng)所 述第二圖像中包含用戶涂覆的多個(gè)不連續(xù)的詞語/單詞時(shí),該第二圖像中包含有用戶未涂 覆的文字,因此,需要從識(shí)別得到的候選對(duì)象中確定最終的目標(biāo)對(duì)象,在此,本發(fā)明通過根 據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或 多個(gè)目標(biāo)對(duì)象,即從所述候選圖像中得到與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的 所述目標(biāo)對(duì)象,提高了用戶對(duì)識(shí)別結(jié)果的滿意度。
[0099] 優(yōu)選地,與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象還 包括與所述第一目標(biāo)對(duì)象鄰接且語義相關(guān)的所述候選對(duì)象。
[0100] 例如,假設(shè)對(duì)于另一第一圖像,用戶A用灰色僅對(duì)該第一圖像中的文字"像細(xì)絲, 密密地斜織著"進(jìn)行了涂覆,識(shí)別確定裝置12識(shí)別得到的所述候選對(duì)象為"像細(xì)絲,密密地 斜",則在步驟S3中,識(shí)別設(shè)備1在確定所述目標(biāo)對(duì)象時(shí),不僅將"像細(xì)絲,密密地斜"作為 目標(biāo)對(duì)象,還可將與候選對(duì)象"斜"鄰接且語義相關(guān)的候選對(duì)象"織"或"織著"也作為所述 目標(biāo)對(duì)象。
[0101] 在此,本發(fā)明通過將與所述第一目標(biāo)對(duì)象鄰接且語義相關(guān)的所述候選對(duì)象也作為 所述目標(biāo)對(duì)象,使得確定所述目標(biāo)對(duì)象語義完整,而不至于出現(xiàn)語義斷裂、不通順的現(xiàn)象, 進(jìn)一步提高了用戶對(duì)識(shí)別結(jié)果的滿意度。
[0102] 在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,在具體實(shí)施例中,所述涂覆區(qū)域信息只要在確定 所述目標(biāo)對(duì)象之前確定即可,例如在確定"第二圖像"之前、之后或同時(shí)被確定。
[0103] 該方法各個(gè)步驟之間是持續(xù)不斷工作的。具體地,在步驟S1中,識(shí)別設(shè)備1持續(xù) 根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像;在步驟S2中,識(shí)別設(shè) 備1持續(xù)識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象;在步驟S3中,識(shí)別設(shè)備1持續(xù)根據(jù) 所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的一個(gè)或多 個(gè)目標(biāo)對(duì)象。在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,所述"持續(xù)"是指識(shí)別設(shè)備1的各個(gè)步驟之 間分別不斷地進(jìn)行經(jīng)用戶涂覆的第一圖像中被涂覆的第二圖像的確定、第二圖像中候選對(duì) 象的識(shí)別、目標(biāo)對(duì)象的確定,直至識(shí)別設(shè)備1在較長時(shí)間內(nèi)停止確定經(jīng)用戶涂覆的第一圖 像中被涂覆的第二圖像。
[0104] 優(yōu)選地,該方法還包括步驟S4 (未示出)。具體地,在步驟S4中,識(shí)別設(shè)備1通過 諸如http、https等約定的通信方式將所述一個(gè)或多個(gè)目標(biāo)對(duì)象中至少一個(gè)提供至所述用 戶的對(duì)應(yīng)應(yīng)用,以提供給用戶,供用戶瀏覽、保存、轉(zhuǎn)發(fā)、共享之用。在此,所述對(duì)應(yīng)應(yīng)用包括 但不限于具有摘抄功能的客戶端、筆記客戶端等。
[0105] 圖8示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法 流程圖。
[0106] 其中,該方法包括步驟SΓ、步驟S2'、步驟S3',其中,步驟SΓ包括步驟S1Γ和步 驟S12'。具體地,在步驟S11'中,識(shí)別設(shè)備1根據(jù)經(jīng)用戶涂覆的第一圖像確定覆蓋所述用 戶的涂覆區(qū)域的外切區(qū)域;在步驟S12'中,識(shí)別設(shè)備1根據(jù)所述外切區(qū)域確定所述第一圖 像中被涂覆的第二圖像;在步驟S2'中,識(shí)別設(shè)備1識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選 對(duì)象;在步驟S3'中,識(shí)別設(shè)備1根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng) 的涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象。在此,步驟S2'和步驟S3'分別與圖7實(shí) 施例中對(duì)應(yīng)步驟的內(nèi)容相同或基本相同,為簡明起見,故在此不再贅述,并以引用的方式包 含與此。
[0107] 具體地,在步驟S11'中,識(shí)別設(shè)備1根據(jù)經(jīng)用戶涂覆的第一圖像確定覆蓋所述用 戶的涂覆區(qū)域的外切區(qū)域,如根據(jù)用戶執(zhí)行涂覆操作的執(zhí)行位置,確定覆蓋該涂覆操作對(duì) 應(yīng)的涂覆區(qū)域的外切區(qū)域,或者,根據(jù)所述第一圖像中用戶涂覆部分與其他部分圖像中的 色差,來確定覆蓋所述用戶的涂覆區(qū)域的外切區(qū)域。
[0108] 例如,對(duì)于用戶A對(duì)如圖2所示的第一圖像,用戶A通過其用戶設(shè)備如手機(jī)執(zhí)行了 涂覆操作,涂覆后得到如圖3所示的經(jīng)用戶涂覆的第一圖像,則步驟S11'中,識(shí)別設(shè)備1可 通過調(diào)用用戶A的手機(jī)所提供的應(yīng)用程序接口(API),便獲取到用戶A執(zhí)行的涂覆操作;然 后,步驟S11'中,識(shí)別設(shè)備1可根據(jù)用戶A執(zhí)行涂覆操作的執(zhí)行位置,確定覆蓋該涂覆操作 對(duì)應(yīng)的涂覆區(qū)域的外切區(qū)域,如外切矩形等。
[0109] 接著,在步驟S12'中,識(shí)別設(shè)備1根據(jù)所述外切區(qū)域確定所述第一圖像中被涂覆 的第二圖像,如將第一圖像中該外切區(qū)域所對(duì)應(yīng)的圖像作為第一圖像中被涂覆的第二圖 像。例如,接上例,對(duì)于圖3所示的經(jīng)用戶A涂覆后的第一圖像,則在步驟S12'中,識(shí)別設(shè) 備1可將圖3中覆蓋用戶A的涂覆區(qū)域的外切矩形所對(duì)應(yīng)的圖像作為所述第二圖像,其被 涂覆后如圖4所示,即圖4中去掉涂覆即可得到所述第二圖像。
[0110] 優(yōu)選地,在步驟S12'中,識(shí)別設(shè)備1按預(yù)定比例放大所述外切區(qū)域,并在放大后的 所述外切區(qū)域中確定所述第一圖像中被涂覆的第二圖像。
[0111] 例如,還接上例,則在步驟S12'中,識(shí)別設(shè)備1還可按預(yù)定比例放大確定的覆蓋用 戶A執(zhí)行的涂覆操作對(duì)應(yīng)的涂覆區(qū)域的外切區(qū)域,并在放大后的所述外切區(qū)域中確定所述 第一圖像中被涂覆的第二圖像,從而可保證所述外切區(qū)域能夠完整覆蓋用戶A要識(shí)別的圖 像信息,避免了不完整覆蓋。
[0112] 在此,在本發(fā)明一個(gè)典型的配置中,終端和服務(wù)網(wǎng)絡(luò)的設(shè)備均包括一個(gè)或多個(gè)處 理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。內(nèi)存可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久 性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存 (flash RAM)。內(nèi)存是計(jì)算機(jī)可讀介質(zhì)的示例。計(jì)算機(jī)可讀介質(zhì)包括永久性和非永久性、 可移動(dòng)和非可移動(dòng)媒體可以由任何方法或技術(shù)來實(shí)現(xiàn)信息存儲(chǔ)。信息可以是計(jì)算機(jī)可讀指 令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計(jì)算機(jī)的存儲(chǔ)介質(zhì)的例子包括,但不限于相變內(nèi)存 (PRAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、其他類型的隨機(jī)存取 存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPR0M)、快閃記憶體或其 他內(nèi)存技術(shù)、只讀光盤只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲(chǔ)、磁盒 式磁帶,磁帶磁磁盤存儲(chǔ)或其他磁性存儲(chǔ)設(shè)備或任何其他非傳輸介質(zhì),可用于存儲(chǔ)可以被 計(jì)算設(shè)備訪問的信息。
[0113] 需要注意的是,本發(fā)明可在軟件和/或軟件與硬件的組合體中被實(shí)施,例如,可采 用專用集成電路(ASIC)、通用目的計(jì)算機(jī)或任何其他類似硬件設(shè)備來實(shí)現(xiàn)。在一個(gè)實(shí)施例 中,本發(fā)明的軟件程序可以通過處理器執(zhí)行以實(shí)現(xiàn)上文所述步驟或功能。同樣地,本發(fā)明的 軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可以被存儲(chǔ)到計(jì)算機(jī)可讀記錄介質(zhì)中,例如,RAM存儲(chǔ)器, 磁或光驅(qū)動(dòng)器或軟磁盤及類似設(shè)備。另外,本發(fā)明的一些步驟或功能可采用硬件來實(shí)現(xiàn),例 如,作為與處理器配合從而執(zhí)行各個(gè)步驟或功能的電路。
[0114] 另外,本發(fā)明的一部分可被應(yīng)用為計(jì)算機(jī)程序產(chǎn)品,例如計(jì)算機(jī)程序指令,當(dāng)其被 計(jì)算機(jī)執(zhí)行時(shí),通過該計(jì)算機(jī)的操作,可以調(diào)用或提供根據(jù)本發(fā)明的方法和/或技術(shù)方案。 而調(diào)用本發(fā)明的方法的程序指令,可能被存儲(chǔ)在固定的或可移動(dòng)的記錄介質(zhì)中,和/或通 過廣播或其他信號(hào)承載媒體中的數(shù)據(jù)流而被傳輸,和/或被存儲(chǔ)在根據(jù)所述程序指令運(yùn)行 的計(jì)算機(jī)設(shè)備的工作存儲(chǔ)器中。在此,根據(jù)本發(fā)明的一個(gè)實(shí)施例包括一個(gè)裝置,該裝置包括 用于存儲(chǔ)計(jì)算機(jī)程序指令的存儲(chǔ)器和用于執(zhí)行程序指令的處理器,其中,當(dāng)該計(jì)算機(jī)程序 指令被該處理器執(zhí)行時(shí),觸發(fā)該裝置運(yùn)行基于前述根據(jù)本發(fā)明的多個(gè)實(shí)施例的方法和/或 技術(shù)方案。
[0115] 對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在 不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無論 從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán) 利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有 變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此 夕卜,顯然"包括" 一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。裝置權(quán)利要求中陳述的多 個(gè)單元或裝置也可以由一個(gè)單元或裝置通過軟件或者硬件來實(shí)現(xiàn)。第一,第二等詞語用來 表示名稱,而并不表示任何特定的順序。
【權(quán)利要求】
1. 一種用于識(shí)別圖像中的目標(biāo)對(duì)象的方法,其中,該方法包括: 根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像; 識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象; 根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配的 一個(gè)或多個(gè)目標(biāo)對(duì)象。
2. 根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像 中被涂覆的第二圖像包括: 根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像,以及所述第二圖 像所對(duì)應(yīng)的涂覆區(qū)域信息。
3. 根據(jù)權(quán)利要求1或2所述的方法,其中,所述涂覆區(qū)域信息包括至少兩個(gè)不連通的涂 覆子區(qū)域。
4. 根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,根據(jù)經(jīng)用戶涂覆的第一圖像確定所 述第一圖像中被涂覆的第二圖像包括: 根據(jù)經(jīng)用戶涂覆的第一圖像確定覆蓋所述用戶的涂覆區(qū)域的外切區(qū)域; 根據(jù)所述外切區(qū)域確定所述第一圖像中被涂覆的第二圖像。
5. 根據(jù)權(quán)利要求4所述的方法,其中,根據(jù)所述外切區(qū)域確定所述第一圖像中被涂覆 的第二圖像包括: 按預(yù)定比例放大所述外切區(qū)域,并在放大后的所述外切區(qū)域中確定所述第一圖像中被 涂覆的第二圖像。
6. 根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其中,該方法還包括: 將所述一個(gè)或多個(gè)目標(biāo)對(duì)象中至少一個(gè)提供至所述用戶的對(duì)應(yīng)應(yīng)用。
7. 根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法,其中,識(shí)別所述第二圖像中的一個(gè)或多個(gè) 候選對(duì)象包括: 將所述第二圖像發(fā)送至對(duì)應(yīng)的網(wǎng)絡(luò)設(shè)備; 接收所述網(wǎng)絡(luò)設(shè)備所識(shí)別的所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象。
8. 根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法,其中,與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域 信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象包括第一目標(biāo)對(duì)象,其中,所述第一目標(biāo)對(duì)象包括以下 至少任一項(xiàng): 包含于所述涂覆區(qū)域信息的所述候選對(duì)象; 被所述涂覆區(qū)域信息所覆蓋的面積超過面積閾值的所述候選對(duì)象。
9. 根據(jù)權(quán)利要求8所述的方法,其中,與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹配 的一個(gè)或多個(gè)目標(biāo)對(duì)象還包括與所述第一目標(biāo)對(duì)象鄰接且語義相關(guān)的所述候選對(duì)象。
10. -種用于識(shí)別圖像中的目標(biāo)對(duì)象的識(shí)別設(shè)備,其中,該識(shí)別設(shè)備包括: 用于根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像的裝置; 用于識(shí)別所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象的裝置; 用于根據(jù)所述一個(gè)或多個(gè)候選對(duì)象確定與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息相匹 配的一個(gè)或多個(gè)目標(biāo)對(duì)象的裝置。
11. 根據(jù)權(quán)利要求10所述的識(shí)別設(shè)備,其中,根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第 一圖像中被涂覆的第二圖像的裝置用于: 根據(jù)經(jīng)用戶涂覆的第一圖像確定所述第一圖像中被涂覆的第二圖像,以及所述第二圖 像所對(duì)應(yīng)的涂覆區(qū)域信息。
12. 根據(jù)權(quán)利要求10或11所述的識(shí)別設(shè)備,其中,所述涂覆區(qū)域信息包括至少兩個(gè)不 連通的涂覆子區(qū)域。
13. 根據(jù)權(quán)利要求10至12中任一項(xiàng)所述的識(shí)別設(shè)備,其中,根據(jù)經(jīng)用戶涂覆的第一圖 像確定所述第一圖像中被涂覆的第二圖像的裝置包括: 用于根據(jù)經(jīng)用戶涂覆的第一圖像確定覆蓋所述用戶的涂覆區(qū)域的外切區(qū)域的單元; 用于根據(jù)所述外切區(qū)域確定所述第一圖像中被涂覆的第二圖像的單元。
14. 根據(jù)權(quán)利要求13所述的識(shí)別設(shè)備,其中,根據(jù)所述外切區(qū)域確定所述第一圖像中 被涂覆的第二圖像的單元用于: 按預(yù)定比例放大所述外切區(qū)域,并在放大后的所述外切區(qū)域中確定所述第一圖像中被 涂覆的第二圖像。
15. 根據(jù)權(quán)利要求10至14中任一項(xiàng)所述的識(shí)別設(shè)備,其中,該識(shí)別設(shè)備還包括: 用于將所述一個(gè)或多個(gè)目標(biāo)對(duì)象中至少一個(gè)提供至所述用戶的對(duì)應(yīng)應(yīng)用的裝置。
16. 根據(jù)權(quán)利要求10至15中任一項(xiàng)所述的識(shí)別設(shè)備,其中,識(shí)別所述第二圖像中的一 個(gè)或多個(gè)候選對(duì)象的裝置用于: 將所述第二圖像發(fā)送至對(duì)應(yīng)的網(wǎng)絡(luò)設(shè)備; 接收所述網(wǎng)絡(luò)設(shè)備所識(shí)別的所述第二圖像中的一個(gè)或多個(gè)候選對(duì)象。
17. 根據(jù)權(quán)利要求10至16中任一項(xiàng)所述的識(shí)別設(shè)備,其中,與所述第二圖像所對(duì)應(yīng)的 涂覆區(qū)域信息相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象包括第一目標(biāo)對(duì)象,其中,所述第一目標(biāo)對(duì)象 包括以下至少任一項(xiàng): 包含于所述涂覆區(qū)域信息的所述候選對(duì)象; 被所述涂覆區(qū)域信息所覆蓋的面積超過面積閾值的所述候選對(duì)象。
18. 根據(jù)權(quán)利要求17所述的識(shí)別設(shè)備,其中,與所述第二圖像所對(duì)應(yīng)的涂覆區(qū)域信息 相匹配的一個(gè)或多個(gè)目標(biāo)對(duì)象還包括與所述第一目標(biāo)對(duì)象鄰接且語義相關(guān)的所述候選對(duì) 象。
【文檔編號(hào)】G06K9/00GK104156694SQ201410342455
【公開日】2014年11月19日 申請(qǐng)日期:2014年7月18日 優(yōu)先權(quán)日:2014年7月18日
【發(fā)明者】丁二銳, 潘屹峰, 韓鈞宇, 陳世佳 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1