專利名稱:一種基于紅光檢測的虛擬文字識(shí)別系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型涉及計(jì)算機(jī)視頻數(shù)據(jù)處理、圖像數(shù)據(jù)處理和漢字信息處理技術(shù), 特別是涉及一種虛擬的手寫文字圖像識(shí)別裝置。
技術(shù)背景
盡管計(jì)算機(jī)實(shí)用新型以來,其自身經(jīng)歷過多次的技術(shù)變革,使其越來越人 性化和智能化。然而,傳統(tǒng)的鼠標(biāo)和鍵盤仍然是絕大多數(shù)計(jì)算機(jī)所倚靠的輸入 設(shè)備。正是由于鼠標(biāo)和鍵盤的存在,使得計(jì)算機(jī)的輸入設(shè)備顯得龐大而不方便 移動(dòng),同時(shí)也嚴(yán)重限制了輸入的速度。并且傳統(tǒng)的輸入設(shè)備對于三維或者多自 由度的輸入是無法處理的。
這個(gè)難題不僅限制了 PC機(jī)向智能化的發(fā)展,更對一些常用的便攜式設(shè)備的
進(jìn)一步發(fā)展設(shè)置了障礙。目前各種便攜式設(shè)備,特別是手機(jī),正力求向更小巧、 更便捷、更智能化的方向發(fā)展,但是由于省略不了鍵盤的存在,使得該方向的 發(fā)展很難有革命性的突破。
為了解決這一問題,語音輸入識(shí)別系統(tǒng)和利用觸摸屏和觸摸筆作為輸入設(shè) 備等方法獲得了廣泛的應(yīng)用。但是, 一方面語音輸入的識(shí)別率仍然較低,并且 對使用者的語音標(biāo)準(zhǔn)程度和環(huán)境的安靜程度都有一定要求。另一方面,利用觸 摸屏和觸摸筆作為輸入設(shè)備則會(huì)增加設(shè)備的復(fù)雜度和成本。
另外一些基于視頻圖像作為輸入的方法也開始漸漸得到了一些嘗試。例如
2002年11月公開的公開號(hào)為CN1378171的專利,描述了一套有圖像感應(yīng)裝置和感應(yīng)信息提取裝置構(gòu)成的計(jì)算機(jī)系統(tǒng),該系統(tǒng)通過獲得手或者制定物在空間形
態(tài)信息,并利用該信息產(chǎn)生操作指令。而2003年公開號(hào)為CN03136144.7的專 利對其進(jìn)行了一定程度的補(bǔ)充,將圖像的DSP處理器功能改成軟件實(shí)現(xiàn)。但是 仍然無法擺脫系統(tǒng)復(fù)雜度高,體積較大,成本較高的缺點(diǎn)。2005年9月公開的 公開號(hào)為CN1661455A的專利,描述了一種視頻識(shí)別輸入系統(tǒng),該系統(tǒng)利用兩個(gè) 攝像頭構(gòu)造了一個(gè)虛擬鍵盤來實(shí)現(xiàn)輸入。雖然該設(shè)備有效的解決了常用輸入設(shè) 備復(fù)雜度高,體積大等缺點(diǎn),卻仍然沒有擺脫常規(guī)的"鍵盤"的限制,在輸入 速度,智能性以及便攜性方面還有許多改進(jìn)的空間。
實(shí)用新型內(nèi)容
本實(shí)用新型的目的在于克服現(xiàn)有輸入設(shè)備復(fù)雜、體積較大、識(shí)別率低下、 成本高、智能化程度低等不足,提供了一種基于紅光檢測的文字識(shí)別系統(tǒng),能 夠有效的提高增強(qiáng)系統(tǒng)的智能性和便攜性。
為了實(shí)現(xiàn)上述實(shí)用新型目的,采用的技術(shù)方案如下
一種基于紅光檢測的虛擬文字識(shí)別系統(tǒng),包括可見光發(fā)射設(shè)備與可見光運(yùn) 動(dòng)軌跡攝取及識(shí)別設(shè)備。
上述技術(shù)方案中,所述可見光運(yùn)動(dòng)軌跡攝取及識(shí)別設(shè)備包括攝像設(shè)備以及 圖像處理及識(shí)別設(shè)備,所述攝像設(shè)備與圖像處理及識(shí)別設(shè)備連接,且攝像設(shè)備 設(shè)置在其拍攝范圍包括可見光運(yùn)動(dòng)軌跡的空間位置上。
所述可見光發(fā)射設(shè)備為紅光發(fā)射設(shè)備。
所述紅光發(fā)射設(shè)備為紅色LED燈。
所述圖像處理及識(shí)別設(shè)備采用計(jì)算機(jī)或嵌入式設(shè)備。
所述攝像設(shè)備采用帶有紅光濾鏡的攝像頭。本實(shí)用新型僅僅利用一個(gè)普通的帶紅光濾鏡的攝像頭和一個(gè)簡單的紅光發(fā) 射設(shè)備就可以實(shí)現(xiàn)一個(gè)有效的字符輸入設(shè)備。較之傳統(tǒng)的輸入設(shè)備,不僅設(shè)備 簡單,成本低廉,而且在方便性和智能性發(fā)面也有顯著的優(yōu)勢,并且還很容易 的移植到嵌入式設(shè)備中,大大的擴(kuò)展了應(yīng)用范圍。
圖1是本實(shí)用新型的系統(tǒng)構(gòu)架圖;
圖2是本實(shí)用新型的系統(tǒng)框圖。
具體實(shí)施方式
下面結(jié)合附圖對本實(shí)用新型做進(jìn)一歩的說明。
如附圖1所示,為了正確有效的識(shí)別出用戶輸入的信息,本實(shí)用新型所涉 及到的系統(tǒng)需按照如下步驟執(zhí)行
1、 用戶在攝像頭可以捕捉到的范圍內(nèi)利用紅光輸入設(shè)備在空中書寫字符;
2、 在用戶書寫的同時(shí),攜帶紅光濾鏡的攝像頭不斷捕捉紅光的運(yùn)動(dòng)軌跡圖 像,并記錄下來;
3、 被記錄下來的紅光經(jīng)過數(shù)據(jù)處理設(shè)備(PC或者嵌入式設(shè)備)對圖像數(shù)據(jù) 進(jìn)行處理首先運(yùn)用背景建模算法和除噪算法對攝像頭捕捉到的視頻圖像進(jìn)行 處理,除去噪聲并構(gòu)建背景模型,進(jìn)而能夠準(zhǔn)確有效的檢測和跟蹤紅光的運(yùn)動(dòng) 軌跡。緊接著運(yùn)用軌跡跟蹤算法和字符重構(gòu)算法將一系列的紅光運(yùn)動(dòng)軌跡在二 維平面內(nèi)進(jìn)行重構(gòu),使其成為一個(gè)虛擬的手寫字符。最后對獲得的虛擬字符提 取梯度特征,并運(yùn)用線性判決分析算法進(jìn)行降維,最終用最小距離分類器進(jìn)行分類,得到最終的輸出結(jié)果。
本實(shí)用新型的系統(tǒng)框圖如附圖2所示,本實(shí)用新型所涉及到的系統(tǒng)由背景 建模、軌跡跟蹤和字符重構(gòu)及識(shí)別三大模塊組成。
1、 背景建模模塊
此模塊的功能是對由攝像頭捕捉到的紅光的運(yùn)動(dòng)軌跡圖像進(jìn)行處理,建立 背景模型,從而可以更準(zhǔn)確有效的檢測和跟蹤到紅光的運(yùn)動(dòng)軌跡。
本實(shí)用新型所涉及的系統(tǒng)有以下幾個(gè)特點(diǎn) 一是攝像頭獲得的圖像是二值 圖像,這導(dǎo)致了噪聲的顏色和捕捉到的紅光的運(yùn)動(dòng)軌跡的圖像是相同的(均為白 色);二是在用戶書寫的過程中背景圖像是不穩(wěn)定的,是不斷變化的;第三個(gè)特
點(diǎn)就是同樣在用戶書過程中,攝像頭捕捉到的紅光軌跡圖像的大小和形狀也是 不斷變化的。
正是由于這些特點(diǎn)導(dǎo)致了傳統(tǒng)的背景建模中可以運(yùn)用到的顏色信息、背景 和前景的形狀大小等信息在本實(shí)用新型所涉及到的系統(tǒng)的背景建模中將很難用 到。為了解決這個(gè)問題,本實(shí)用新型提供了一種簡單有效的背景建模方法,具
體實(shí)現(xiàn)的步驟和算法原理如下當(dāng)用戶結(jié)束輸入上一個(gè)字符的時(shí)候,此時(shí)攝像 頭捕捉到的圖像為初始背景模型,而開始輸入當(dāng)前字符是攝像頭捕捉到的圖像 為背景更新模型。而最終的背景模型則是將這兩個(gè)背景模型合并所得。
2、 軌跡跟蹤模塊
攝像頭捕捉到的紅光的運(yùn)動(dòng)軌跡圖像中,紅光軌跡在每幀圖像中并非是以 一個(gè)理想的點(diǎn)的形式出現(xiàn),而是一塊不規(guī)則的區(qū)域。而軌跡跟蹤算法則是從這 塊不規(guī)則的區(qū)域中搜索到一個(gè)有效的軌跡點(diǎn)作為當(dāng)前時(shí)刻紅光的確切軌跡,并 進(jìn)行跟蹤。具體實(shí)施本模塊中的算法又分為以下幾個(gè)步驟
(1) 利用背景消除算法消除背景干擾 本部分的算法主要是消除背景干擾,為了更好的闡述該算法,我背景中的
白色區(qū)域(軌跡區(qū)域和噪聲區(qū)域)中的像素點(diǎn)的值設(shè)置為厶而剩余區(qū)域中的像素 值設(shè)置為仏
傳統(tǒng)的背景消除算法如公式(1)所示,假設(shè)圖像"是由前一個(gè)模塊得到的 背景模型,圖像^是當(dāng)前時(shí)刻捕捉到的一幀運(yùn)動(dòng)軌跡圖像,然后利用公式(1) 就可以得到消除背景后的圖像C,而隨后的軌跡跟蹤算法都是在以圖像C為基礎(chǔ) 來完成的。<formula>formula see original document page 7</formula>
其中cw/ji/表示圖像c中位于第!'行第y列的像素點(diǎn)。
但是這種傳統(tǒng)的背景消除算法需要遍歷圖像a和b中所有的像素點(diǎn),并進(jìn) 行背景消除處理,這樣是十分低效的。特別是涉及到的系統(tǒng)移植到嵌入式設(shè)備 中,這樣的算法復(fù)雜度更是不可接受的。
為了解決這個(gè)問題,本實(shí)用新型提出了一種新的高效的背景消除算法。首 先按照一定的搜索策略(具體算法見下一部分的軌跡檢測和跟蹤算法)對圖像a 進(jìn)行遍歷, 一旦搜索到值為/的像素點(diǎn),則運(yùn)用公式(i)進(jìn)行計(jì)算,來判斷該 像素點(diǎn)是否在紅光的軌跡區(qū)域內(nèi)。又由于在背景消除算法和軌跡檢測和跟蹤算 法是交叉使用的,因此,僅僅對圖像a的部分區(qū)域進(jìn)行了搜索和背景消除處理, 其算法的復(fù)雜度較之傳統(tǒng)的方法簡單很多。
(2) 、軌跡檢測和跟蹤算法
本部分的算法就是在去除了背景的軌跡圖像中搜索到一個(gè)有效的軌跡點(diǎn)作為當(dāng)前時(shí)刻紅光的確切軌跡。為了更清楚的介紹此算法,首先定義以下的一個(gè) 距離度量公式
SCD(M,AO二A:
MIAf軌跡檢測和跟蹤算法如下
a、 粗定位如果當(dāng)前檢測的軌跡點(diǎn)是字符的第一個(gè)點(diǎn),則以圖像的左上角 第一個(gè)像素為搜索算法的起點(diǎn),否則,以上一個(gè)軌跡點(diǎn)為搜算算法的起始點(diǎn)。
如附圖4所示,假設(shè)點(diǎn)Z是搜索起始點(diǎn),然后首先搜索具有較小的6"GVa"的
點(diǎn)尸,再按照第一部分的背景消除算法判斷該點(diǎn)是否屬于軌跡區(qū)域內(nèi)的點(diǎn)。按照 這種搜索算法,可以很快搜索到軌跡區(qū)域內(nèi)的一個(gè)隨機(jī)點(diǎn)(假設(shè)為點(diǎn)s)作為軌 跡點(diǎn)的一個(gè)粗定位點(diǎn)。
b、 精確定位軌跡點(diǎn)根據(jù)粗定位點(diǎn)B,可以畫出一條垂直的線和一條水平
的線,然后可以找到這兩條線與軌跡區(qū)域的4個(gè)交叉點(diǎn)C、從f、凡然后分別 以C、從A f四個(gè)點(diǎn)為搜索起始點(diǎn),分別向左、下、右、上四個(gè)方向搜素,直 到搜索到軌跡區(qū)域的左下右上四個(gè)邊界點(diǎn)為止。然后根據(jù)這四個(gè)邊界點(diǎn)構(gòu)造出 軌跡區(qū)域的外接矩形。然后就設(shè)定這個(gè)外接矩形的中心就是確切的軌跡點(diǎn)。
C、檢測盡管軌跡區(qū)域的形狀和大小在用戶書寫字符的時(shí)候不斷變化,但
是其外接矩形的長寬比也必然在一個(gè)范圍內(nèi)。因此,如果軌跡區(qū)域的外接矩形 的長寬值或者它們的比值超出一個(gè)合理的范圍,則算法將拒絕上一步檢測到的 軌跡點(diǎn),并重新進(jìn)行搜素,如果在整幅圖像中均無法搜索到軌跡點(diǎn),則將上一 個(gè)軌跡點(diǎn)定義為當(dāng)前的軌跡點(diǎn)。
(3)、噪聲消除算法軌跡檢測和跟蹤算法除了可以實(shí)現(xiàn)其本身的功能外,還在一定程度上實(shí)現(xiàn) 了除噪的功能。因?yàn)檐壽E檢測和跟蹤算法僅僅搜索了軌跡附近的一些區(qū)域的像 素點(diǎn),而屏蔽了搜索區(qū)域意外的噪聲干擾。
3、字符重構(gòu)和識(shí)別模塊
此模塊的功能主要是將跟蹤到的紅光運(yùn)動(dòng)軌跡連接起來構(gòu)成虛擬字符,然 后對虛擬字符進(jìn)行特征提取和分類得到輸出結(jié)果。實(shí)現(xiàn)步驟如下 (1)字符重構(gòu)算法
該算法主要功能是將檢測到的十分潦草的紅光的運(yùn)動(dòng)軌跡連接起來構(gòu)成虛 擬字符,并盡可能的使虛擬字符更加工整。整個(gè)算法分為一下幾個(gè)步驟
a、 平滑濾波該算法主要是消除由于用戶在書寫過程中手的無意抖動(dòng)造成 的筆畫形變。算法如下假設(shè)數(shù)組P記錄了所有的經(jīng)過歸一化后的軌跡點(diǎn)的坐 標(biāo),則對于數(shù)組P內(nèi)的每一個(gè)軌跡點(diǎn),運(yùn)用公式(3)對每個(gè)軌跡點(diǎn)的坐標(biāo)進(jìn)行 修改
^ +1 w (3) 其中f《!' S W度,在本實(shí)施例中取2。
b、 連接鄰近點(diǎn)運(yùn)用數(shù)字差分分析(DDA)算法將鄰近的軌跡點(diǎn)用直線連 接起來。
C、重采樣重采樣的目的主要是消除由于書寫速度變化引起的相鄰軌跡點(diǎn)
間距離變化的影響。將經(jīng)過歩驟b處理過的紅光軌跡點(diǎn)按照等距離間隔的規(guī)則
進(jìn)行重采樣(本實(shí)用新型中重采樣間隔取3),得到重采樣后的軌跡點(diǎn)。
d、再次連接鄰近點(diǎn)同樣運(yùn)用DDA算法將重采樣后的軌跡點(diǎn)用直線依次連接起來,將原始的紅光軌跡轉(zhuǎn)換成二維空間中的虛擬字符。 4、特征提取和分類算法
紅光軌跡圖像經(jīng)過字符重構(gòu)算法之后,就可以轉(zhuǎn)換成二維平面空間中的虛 擬字符。而本部分中的算法主要是針對這些虛擬字符,進(jìn)行特征提取和分類。
首先對虛擬字符提8方向128維的取梯度特征,然后用線性判決分析(LDA)算 法將原始維數(shù)降低到40維,最后用最小距離分類器進(jìn)行分類,得到最終的識(shí)別 結(jié)果。
權(quán)利要求
1、一種基于紅光檢測的虛擬文字識(shí)別系統(tǒng),其特征在于包括可見光發(fā)射設(shè)備與可見光運(yùn)動(dòng)軌跡攝取及識(shí)別設(shè)備。
2、 根據(jù)權(quán)利要求
l所述的基于紅光檢測的虛擬文字識(shí)別系統(tǒng),其特征在于 所述可見光運(yùn)動(dòng)軌跡攝取及識(shí)別設(shè)備包括攝像設(shè)備以及圖像處理及識(shí)別設(shè)備, 所述攝像設(shè)備與圖像處理及識(shí)別設(shè)備連接,且攝像設(shè)備設(shè)置在其拍攝范圍包括 可見光運(yùn)動(dòng)軌跡的空間位置上。
3、 根據(jù)權(quán)利要求
1或2所述的基于紅光檢測的虛擬文字識(shí)別系統(tǒng),其特征 在于所述可見光發(fā)射設(shè)備為紅光發(fā)射設(shè)備。
4、 根據(jù)權(quán)利要求
3所述的基于紅光檢測的虛擬文字識(shí)別系統(tǒng),其特征在于 所述紅光發(fā)射設(shè)備為紅色LED燈。
5、 根據(jù)權(quán)利要求
2所述的基于紅光檢測的虛擬文字識(shí)別系統(tǒng),其特征在于 所述圖像處理及識(shí)別設(shè)備采用計(jì)算機(jī)或嵌入式設(shè)備。
6、 根據(jù)權(quán)利要求
4所述的基于紅光檢測的虛擬文字識(shí)別系統(tǒng),其特征在于 所述攝像設(shè)備采用帶有紅光濾鏡的攝像頭。
專利摘要
本實(shí)用新型提供一種基于紅光檢測的虛擬文字識(shí)別系統(tǒng),包括可見光發(fā)射設(shè)備與可見光運(yùn)動(dòng)軌跡攝取及識(shí)別設(shè)備。本實(shí)用新型僅僅利用一個(gè)普通的帶紅光濾鏡的攝像頭和一個(gè)簡單的紅光發(fā)射設(shè)備就可以實(shí)現(xiàn)一個(gè)有效的字符輸入設(shè)備。較之傳統(tǒng)的輸入設(shè)備,不僅設(shè)備簡單,成本低廉,而且在方便性和智能性發(fā)面也有顯著的優(yōu)勢,并且還很容易的移植到嵌入式設(shè)備中,大大的擴(kuò)展了應(yīng)用范圍。
文檔編號(hào)G06K9/20GKCN201229546SQ200820050592
公開日2009年4月29日 申請日期2008年7月11日
發(fā)明者凱 丁, 嚴(yán)漢羽, 金連文 申請人:華南理工大學(xué)導(dǎo)出引文BiBTeX, EndNote, RefMan