基于攝像頭的漢字識別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文字識別技術(shù),特別涉及基于攝像頭的漢字識別方法。
【背景技術(shù)】
[0002]目前通過手機(jī)攝像頭識別漢字的方法大致有兩種,一種是通過攝像頭框取,然后掃描并識別漢字的方法;一種是通過先拍得一張包含所需漢字的圖片,然后通過涂抹所要識別漢字,再將涂抹區(qū)域進(jìn)行識別的方法。第一種需要用戶不斷調(diào)整攝像頭的上下距離和左右位置來框取,并點(diǎn)擊確認(rèn)來獲取所要識別的漢字,其操作不好控制;第二種需要先獲取照片并涂抹,其步驟過多且涂抹位置不好把握。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是為了解決現(xiàn)有的漢字識別方法操作繁瑣不易控制的問題。
[0004]為達(dá)到上述目的,本發(fā)明提供一種基于攝像頭的漢字識別方法,其特征在于,包括如下步驟:
[0005]A.通過攝像頭獲取包含所需要識別漢字的完整畫面;
[0006]B.用戶在屏幕上點(diǎn)擊所需識別的漢字畫面,系統(tǒng)獲取所述畫面的當(dāng)前一幀,同時(shí)記錄用戶點(diǎn)擊的位置的坐標(biāo)(x,y);
[0007]C.通過圖片文字識別技術(shù)得到所獲取的幀上漢字相對于屏幕分辨率下的字體大小d;
[0008]D.計(jì)算得到漢字的識別矩陣范圍,同時(shí)在所述畫面上標(biāo)注所述識別矩陣范圍,所述識別矩陣范圍左上角坐標(biāo)為(x-d,y-d),右下角坐標(biāo)為(x+d,y+d);
[0009]E.在獲取到的幀上截取所述識別矩陣范圍內(nèi)的圖片,通過圖片文字識別技術(shù)識別所截取圖片內(nèi)的漢字,利用互聯(lián)網(wǎng)文字庫獲取漢字的基本信息,連同所識別出的漢字一同在屏幕上進(jìn)行顯示。
[0010]具體地,通過圖片文字識別技術(shù)識別所截取圖片內(nèi)的漢字時(shí),根據(jù)概率在屏幕上依次羅列識別到的漢字。
[0011]具體地,若所羅列的漢字都不是攝像頭所獲取的漢字,則重新進(jìn)入步驟A。
[0012]本發(fā)明中,進(jìn)行操作的設(shè)備可以是任何帶有攝像頭的智能終端設(shè)備,例如智能手機(jī)、智能平板電腦等。本發(fā)明中的圖片文字識別技術(shù)為現(xiàn)有技術(shù),例如百度、谷歌等的圖片文字識別技術(shù)。
[0013]本發(fā)明的有益效果是:本發(fā)明提供的基于攝像頭的漢字識別方法,用戶通過帶有攝像頭的智能終端設(shè)備,在獲取漢字的圖像后,即可以智能地獲取漢字對應(yīng)的基本信息,并通過智能終端的顯示屏幕進(jìn)行顯示。
【具體實(shí)施方式】
[0014]以下通過具體實(shí)例對本發(fā)明的技術(shù)方案作進(jìn)一步詳細(xì)描述。
[0015]本發(fā)明為解決現(xiàn)有的漢字識別方法操作繁瑣不易控制的問題,提供一種基于攝像頭的漢字識別方法,該方法包括如下步驟:
[0016]A.通過攝像頭獲取包含所需要識別漢字的完整畫面;
[0017]B.用戶在屏幕上點(diǎn)擊所需識別的漢字畫面,系統(tǒng)獲取所述畫面的當(dāng)前一幀,同時(shí)記錄用戶點(diǎn)擊的位置的坐標(biāo)(x,y);
[0018]C.通過圖片文字識別技術(shù)得到所獲取的幀上漢字相對于屏幕分辨率下的字體大小d;
[0019]D.計(jì)算得到漢字的識別矩陣范圍,同時(shí)在所述畫面上標(biāo)注所述識別矩陣范圍,所述識別矩陣范圍左上角坐標(biāo)為(x-d,y-d),右下角坐標(biāo)為(x+d,y+d);
[0020]E.在獲取到的幀上截取所述識別矩陣范圍內(nèi)的圖片,通過圖片文字識別技術(shù)識別所截取圖片內(nèi)的漢字,利用互聯(lián)網(wǎng)文字庫獲取漢字的基本信息,連同所識別出的漢字一同在屏幕上進(jìn)行顯示。
[0021]以下對用戶通過智能終端采用本發(fā)明的方法獲取漢字及其基本信息的過程進(jìn)行一示例性說明。
[0022]首先,用戶打開攝像頭,獲取包含所需識別漢字的畫面,在操作時(shí),應(yīng)當(dāng)注意盡量使攝像頭包含整個(gè)漢字。然后,在智能終端的屏幕上點(diǎn)擊所需識別的漢字,同時(shí)獲取當(dāng)前幀與點(diǎn)擊位置。之后,通過圖片識別技術(shù)獲取幀上漢字大小,根據(jù)漢字大小計(jì)算識別范圍。在確定識別范圍后,截取幀上范圍內(nèi)畫面,通過圖片識別技術(shù)得到范圍內(nèi)的漢字。本發(fā)明的方法,識別出漢字之后在屏幕右邊羅列識別到的漢字,同時(shí)在屏幕上方推薦最可能的漢字給用戶,顯示其基本信息。用戶可以點(diǎn)擊一旁的“更多”按鈕獲取推薦漢字的詳細(xì)信息。若推薦漢字不符合,則用戶可點(diǎn)擊屏幕右邊所羅列的漢字,點(diǎn)擊所需漢字,將顯示其詳細(xì)信息。若無一字符合,則可點(diǎn)擊右下角的“重新點(diǎn)擊”按鈕重新點(diǎn)擊要識別的漢字。
[0023]本發(fā)明中,由于需要使用漢字庫獲取漢字及其基本的信息,因此,一般情況下,本發(fā)明的智能終端必須具備網(wǎng)絡(luò)連接功能,只有在智能終端與漢字庫連接之后,才能獲取漢字及其基本信息,否則,智能終端必須具備龐大的數(shù)據(jù)存儲(chǔ)功能用以存儲(chǔ)漢字庫。
【主權(quán)項(xiàng)】
1.基于攝像頭的漢字識別方法,其特征在于,包括如下步驟: A.通過攝像頭獲取包含所需要識別漢字的完整畫面; B.用戶在屏幕上點(diǎn)擊所需識別的漢字畫面,系統(tǒng)獲取所述畫面的當(dāng)前一幀,同時(shí)記錄用戶點(diǎn)擊的位置的坐標(biāo)(x,y); C.通過圖片文字識別技術(shù)得到所獲取的幀上漢字相對于屏幕分辨率下的字體大小d; D.計(jì)算得到漢字的識別矩陣范圍,同時(shí)在所述畫面上標(biāo)注所述識別矩陣范圍,所述識別矩陣范圍左上角坐標(biāo)為(x-d,y-d),右下角坐標(biāo)為(x+d,y+d); E.在獲取到的幀上截取所述識別矩陣范圍內(nèi)的圖片,通過圖片文字識別技術(shù)識別所截取圖片內(nèi)的漢字,利用互聯(lián)網(wǎng)文字庫獲取漢字的基本信息,連同所識別出的漢字一同在屏幕上進(jìn)行顯示。2.如權(quán)利要求1所述的基于攝像頭的漢字識別方法,其特征在于,步驟E中,通過圖片文字識別技術(shù)識別所截取圖片內(nèi)的漢字時(shí),根據(jù)概率在屏幕上依次羅列識別到的漢字。3.如權(quán)利要求1所述的基于攝像頭的漢字識別方法,其特征在于,步驟E中,若所羅列的漢字都不是攝像頭所獲取的漢字,則重新進(jìn)入步驟A。
【專利摘要】本發(fā)明涉及文字識別技術(shù),目的是為了解決現(xiàn)有的漢字識別方法操作繁瑣不易控制的問題。本發(fā)明提供的基于攝像頭的漢字識別方法的步驟如下:打開攝像頭,獲取包含所需識別漢字的畫面。點(diǎn)擊所需識別的漢字,同時(shí)獲取當(dāng)前幀與點(diǎn)擊位置。獲取幀上漢字大小,根據(jù)漢字大小計(jì)算識別范圍。截取幀上范圍內(nèi)畫面,通過圖片識別技術(shù)得到范圍內(nèi)的漢字。在屏幕右邊羅列識別到的漢字,同時(shí)在屏幕上方推薦最可能的漢字給用戶,顯示其基本信息。用戶點(diǎn)擊一旁的“更多”按鈕獲取推薦漢字的詳細(xì)信息。若推薦漢字不符合,則用戶可點(diǎn)擊屏幕右邊所羅列的漢字,點(diǎn)擊所需漢字,將顯示其詳細(xì)信息。本發(fā)明適用于漢字識別。
【IPC分類】G06K9/32
【公開號】CN105488504
【申請?zhí)枴緾N201511005440
【發(fā)明人】汪靖博
【申請人】四川長虹網(wǎng)絡(luò)科技有限責(zé)任公司
【公開日】2016年4月13日
【申請日】2015年12月28日