基于唇形圖像識(shí)別的文字輸入方法
【專(zhuān)利摘要】本發(fā)明提供一種基于唇形圖像識(shí)別的文字輸入方法。其基本原理是,由計(jì)算機(jī)對(duì)攝像機(jī)拍攝的目標(biāo)人員唇部圖像進(jìn)行自動(dòng)分析,提取唇形的特征值,再將提取的特征值與唇形模型庫(kù)中的唇形模型進(jìn)行匹配,然后由計(jì)算機(jī)根據(jù)匹配的唇形模型對(duì)應(yīng)的文字、語(yǔ)義數(shù)據(jù)庫(kù)完成文字的輸入。該技術(shù)方案為生產(chǎn)車(chē)間現(xiàn)場(chǎng)口頭生產(chǎn)指令的傳遞,提供了一種有效的解決方案。
【專(zhuān)利說(shuō)明】基于唇形圖像識(shí)別的文字輸入方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人機(jī)交互【技術(shù)領(lǐng)域】,具體涉及一種基于唇形圖像識(shí)別的文字輸入方法。
【背景技術(shù)】
[0002]在很多生產(chǎn)車(chē)間,生產(chǎn)環(huán)境中存在較大噪音,這嚴(yán)重的阻礙了現(xiàn)場(chǎng)口頭生產(chǎn)指令的下達(dá)。在刑偵工作中,一些場(chǎng)合也需要根據(jù)視頻錄像來(lái)推測(cè)嫌疑人的說(shuō)話內(nèi)容,這就需要根據(jù)唇形來(lái)推測(cè)獲得相應(yīng)的文字內(nèi)容。
[0003]為實(shí)現(xiàn)上述目的,本發(fā)明提供一種基于唇形圖像識(shí)別的文字輸入方法,用于提升生產(chǎn)現(xiàn)場(chǎng)口頭生產(chǎn)指令的下達(dá)效率、提高刑偵效率。
【發(fā)明內(nèi)容】
[0004]針對(duì)上述問(wèn)題,本發(fā)明通過(guò)采集唇部視頻圖像并利用視頻處理技術(shù)對(duì)唇形特征值進(jìn)行自動(dòng)測(cè)量并與唇形模型進(jìn)行匹配的方式,提供一種基于唇形圖像識(shí)別的文字輸入方法,從而提升生產(chǎn)現(xiàn)場(chǎng)口頭生產(chǎn)指令的下達(dá)效率。
[0005]本發(fā)明提供的具體技術(shù)方案是:
[0006]一種基于唇形圖像識(shí)別的文字輸入方法,其特征在于,該方法包括以下步驟:
[0007]視頻圖像采集,通過(guò)攝像頭采集目標(biāo)人員的唇部視頻圖像;
[0008]視頻分析,由計(jì)算機(jī)根據(jù)圖像分析技術(shù)對(duì)所述唇部視頻圖像進(jìn)行分析,獲得唇形的特征值;
[0009]唇形模型匹配,將所述唇形的特征值與唇形模型庫(kù)中的唇形模型進(jìn)行匹配,得到唇形模型對(duì)應(yīng)的文字;
[0010]語(yǔ)義數(shù)據(jù)庫(kù)修正,利用通用語(yǔ)義數(shù)據(jù)庫(kù)對(duì)由所述唇形模型對(duì)應(yīng)的文字組成的語(yǔ)句進(jìn)行修正;
[0011]文字輸入,完成修正后語(yǔ)句文字的輸入。
[0012]所述唇形模型庫(kù)中的每個(gè)唇形模型,分別對(duì)應(yīng)與之相應(yīng)的文字。
[0013]有益效果:本發(fā)明提供的一種基于唇形圖像識(shí)別的文字輸入方法,由計(jì)算機(jī)對(duì)唇部圖像進(jìn)行自動(dòng)分析、提取唇形的特征值、將唇形特征值與唇形模型進(jìn)行匹配,并利用語(yǔ)義數(shù)據(jù)庫(kù)進(jìn)行修正、完成文字的輸入。該技術(shù)方案為生產(chǎn)車(chē)間現(xiàn)場(chǎng)口頭生產(chǎn)指令的傳遞,提供了一種有效的解決方案。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0014]圖1所示是本發(fā)明工作流程圖。
【具體實(shí)施方式】
[0015]為了更為具體地描述本發(fā)明,下面結(jié)合附圖及【具體實(shí)施方式】對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說(shuō)明。
[0016]如圖1所示,用攝像機(jī)獲取目標(biāo)人員的唇部視頻圖像,然后由計(jì)算機(jī)唇部圖像進(jìn)行自動(dòng)分析,提取唇形的特征值;再由計(jì)算機(jī)將提取的唇形特征值與唇形模型庫(kù)中的唇形模型進(jìn)行匹配。在唇形模型庫(kù)中,每個(gè)唇形分別對(duì)應(yīng)有相應(yīng)的文字。找到相匹配的唇形模型后,由計(jì)算機(jī)根據(jù)匹配的唇形模型對(duì)應(yīng)的文字完成文字的初步輸入。因?yàn)橥糇值拇嬖冢醪捷斎氲奈淖纸M成的語(yǔ)句,并不能直接作為最終結(jié)果,而是由計(jì)算機(jī)利用通用語(yǔ)義數(shù)據(jù)庫(kù)對(duì)初步輸入的語(yǔ)句進(jìn)行修正,完成修正后作為最終結(jié)果輸出。
[0017]作為對(duì)本實(shí)施例的進(jìn)一步優(yōu)化,電腦輸入的文字,在車(chē)間電子顯示屏上進(jìn)行顯示,以方便現(xiàn)場(chǎng)人員及時(shí)獲得相關(guān)生產(chǎn)指令。
[0018]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種基于唇形圖像識(shí)別的文字輸入方法,其特征在于,該方法包括以下步驟: 視頻圖像采集,通過(guò)攝像頭采集目標(biāo)人員的唇部視頻圖像; 視頻分析,由計(jì)算機(jī)根據(jù)圖像分析技術(shù)對(duì)所述唇部視頻圖像進(jìn)行分析,獲得唇形的特征值; 唇形模型匹配,將所述唇形的特征值與唇形模型庫(kù)中的唇形模型進(jìn)行匹配,得到唇形模型對(duì)應(yīng)的文字; 語(yǔ)義數(shù)據(jù)庫(kù)修正,利用通用語(yǔ)義數(shù)據(jù)庫(kù)對(duì)由所述唇形模型對(duì)應(yīng)的文字組成的語(yǔ)句進(jìn)行修正; 文字輸入,完成修正后語(yǔ)句文字的輸入。
2.如權(quán)利要求1所述的方法,其特征在于,所述唇形模型庫(kù)中的每個(gè)唇形模型,分別對(duì)應(yīng)與之相應(yīng)的文字。
【文檔編號(hào)】G06K9/62GK104461057SQ201410829519
【公開(kāi)日】2015年3月25日 申請(qǐng)日期:2014年12月26日 優(yōu)先權(quán)日:2014年12月26日
【發(fā)明者】陳擁權(quán), 李建中, 鄭榮穩(wěn) 申請(qǐng)人:安徽寰智信息科技股份有限公司