細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器的制造方法
【專利摘要】本實用新型提出了細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器,屬于人工智能技術(shù)領(lǐng)域。本實用新型以細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)為核心,細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)芯片連接微處理器,微處理器連接內(nèi)存模塊、攝像頭、通信接口模塊、麥克風(fēng)、揚聲器、觸摸顯示屏和電源等必要的外圍部件,構(gòu)成一個具有模式識別功能的智能視覺支付加速器,對特定標(biāo)識的圖像或語音,提高了識別速度和精度,為用戶和系統(tǒng)提供了更好的安全性和便利性,市場潛力巨大。
【專利說明】
細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器
技術(shù)領(lǐng)域
[0001]本實用新型屬于人工智能技術(shù)領(lǐng)域,具體地說,涉及細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)(Cellular/Convolut1nal Neural Networks,CNN)智能視覺支付加速器。
【背景技術(shù)】
[0002]本實用新型是人工智能技術(shù)在電子支付領(lǐng)域中應(yīng)用。
[0003]迄今為止,人類歷史上已經(jīng)歷了三次工業(yè)革命,分別為機器工業(yè)革命、電汽工業(yè)革命、計算機工業(yè)革命,相對應(yīng)解決了機器動力問題、能源傳輸問題、信息處理及傳輸問題,都為人類社會帶來了生產(chǎn)力的巨大變革。目前,全球仍然在第三次工業(yè)革命的持續(xù)探索中,包括互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)浪潮都?xì)w屬于其一系列衍生現(xiàn)象。下一次工業(yè)革命將是一次能完全替代人角色的人工智能革命。實質(zhì)上,是人類復(fù)制了另一個自己,利用制造出來的機器人完全替代自身從事自主、智能的行為。目前這樣一場轟轟烈烈的第四次工業(yè)革命,正在悄然向我們走來。
[0004]人工智能早在計算機學(xué)伊始時就已經(jīng)產(chǎn)生,它最早是在1956年被作為一門學(xué)術(shù)學(xué)科建立起來。從那時起,科學(xué)界就認(rèn)為每隔十年左右就會在此方面有大的突破性進展。在1940年的神經(jīng)學(xué)研究中,人們就已經(jīng)發(fā)現(xiàn)人類的大腦實際上就是一條神經(jīng)網(wǎng)絡(luò),AlanTuring認(rèn)為基于此概念建造一個電子大腦是可行的。1951年,一個24歲的研究生MarvinMinsky建造了世界第一個神經(jīng)網(wǎng)絡(luò)機,這臺機器也被稱為SNARC,它同時也是史上第一臺人工自我學(xué)習(xí)機器。
[0005]機器學(xué)習(xí)屬于人工智能的一個分支,而神經(jīng)網(wǎng)絡(luò)是機器學(xué)習(xí)的一個分支,是最實用、最有效的一個人工智能的分支。
[0006]早在1988年,楊林博士發(fā)表了如下兩篇產(chǎn)生廣泛影響的“細(xì)胞神經(jīng)網(wǎng)絡(luò)”論文和相關(guān)發(fā)明專利:
[0007]Leon O , Chua ; Lin Yang,“Cel lular Neural Networks: Theory,,,IEEETrans.Circuits and Systems,vo1.35(10)0ct.1988,pp.1257-12720
[0008]Leon 0,Chua ;Lin Yang,“Cellular Neural Networks-Applicat1ns,,,IEEETrans-Circuits and Systems,vo1.35(10)0ct.1988,pp.1273-12900
[0009]Leon 0,Chua;Lin Yang,“Cellular Neural Network”,United States Patent,Patent Number:5,I40,670,Date of Patent:Aug.18,1992。
[0010]在論文中,楊林博士提出了幾個關(guān)鍵的基礎(chǔ)性概念:并行處理、模擬電路、鄰域直接連接、非鄰域間接作用、非線性器件、多層網(wǎng)絡(luò)、卷積算子、參數(shù)重新配置、應(yīng)用于圖像處理等,為神經(jīng)網(wǎng)絡(luò)的發(fā)展奠定了良好的基礎(chǔ),具體的技術(shù)細(xì)節(jié)在后面再描述。
[0011 ] 深度學(xué)習(xí)(Deep Learning)的概念由Hinton等人于2006年提出。深度學(xué)習(xí)領(lǐng)域中的突破引發(fā)了人工智能革命。近年來,微軟、臉書、谷歌、IBM、百度等公司推出了各自的深度學(xué)習(xí)系統(tǒng),運用“深度學(xué)習(xí)”技術(shù)提出了許多語音和圖像的識別、合成算法。這些算法是一種計算機模擬人腦神經(jīng)網(wǎng)絡(luò)的算法。簡單來說,就是用計算機搭建一個人工神經(jīng)網(wǎng)絡(luò),然后通過已有的大量數(shù)據(jù)不斷訓(xùn)練優(yōu)化它。
[0012]人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式是通過向它展示大量的訓(xùn)練范例,然后逐漸對網(wǎng)絡(luò)參數(shù)進行調(diào)整,直至它能夠反饋出令人滿意的分類。一個典型的網(wǎng)絡(luò)是由10-30層(目前最深的達(dá)到了 150層)人工神經(jīng)元堆積架構(gòu)而成的。舉例說明,當(dāng)將一個圖片信息發(fā)送給一個神經(jīng)網(wǎng)絡(luò)時,輸入層接收信息并且進行低層次的處理后將結(jié)果輸出給下一個層級,周而復(fù)始,直到到達(dá)最后一個層級,來決定該圖像的分析結(jié)果。
[0013]為了獲得更好的學(xué)習(xí)結(jié)果,神經(jīng)網(wǎng)絡(luò)的規(guī)模越來越大,層數(shù)越來越多,就成為了深度神經(jīng)網(wǎng)絡(luò),深度神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的一個重要分支。最早Google的深度神經(jīng)網(wǎng)絡(luò)Distblief用了 1000臺機器、16000核處理,網(wǎng)絡(luò)規(guī)模大概是10億個神經(jīng)元,而后Andrew Ng在Stanford大學(xué)用16臺服務(wù)器,總共64個GPU,并且用了一個超級性能的交換機InfiniBand,可訓(xùn)練的網(wǎng)絡(luò)規(guī)模達(dá)到了 112億個神經(jīng)元。最近,百度深度學(xué)習(xí)的網(wǎng)絡(luò)規(guī)模已經(jīng)達(dá)到了200億的節(jié)點。估計不遠(yuǎn)的將來,深度神經(jīng)網(wǎng)絡(luò)的規(guī)模將達(dá)到1000億個神經(jīng)元,規(guī)模越大,對并行架構(gòu)、優(yōu)化算法提出前所未有的挑戰(zhàn),但超大規(guī)模后可能會獲得更多新的認(rèn)知。
[0014]基于上述深度學(xué)習(xí)的新算法和技術(shù)的部分性能已超過了人類大腦。人工智能在深度學(xué)習(xí)領(lǐng)域算法方面獲得了一定突破的同時,國內(nèi)外一些公司就將商業(yè)機會瞄準(zhǔn)了如何用芯片實現(xiàn)這些已優(yōu)化參數(shù)的深度神經(jīng)網(wǎng)絡(luò)算法,獲得人工智能行為。例如,近期麻省理工(MIT)、高通(Qualcomm)、英特爾(Intel)、Nvidia、Movidius等都在研發(fā)深度學(xué)習(xí)芯片。
[0015]麻省理工學(xué)院(MIT)日前在國際固態(tài)電路大會(Internat1nal Solid StateCircuits Conference,ISSCC)發(fā)表一款深度學(xué)習(xí)芯片Eyeriss,用來實現(xiàn)人工神經(jīng)網(wǎng)路。MIT宣稱該芯片的效能是一般常用GPU的10倍,能夠直接在設(shè)備上執(zhí)行人工智能算法,不需要通過網(wǎng)絡(luò)來處理資料。MIT表示,提升Eyeriss效能的關(guān)鍵在于最小化GPU核(Core)和存儲器間交換資料的頻率,而一般GPU核是共享單一的存儲器,但是Eyeriss的每個核有自己的專用存儲器。此外,每一個核都能夠和鄰近的核直接溝通,如果需要共享資料時,就不用透過主要存儲器來傳遞,當(dāng)卷積神經(jīng)網(wǎng)路有很多節(jié)點在處理相同資料時,鄰近的核間能夠直接溝通很重要。而提升芯片效能還有一個關(guān)鍵是跨核心分配任務(wù)的專用電路,可以在不同類型的類神經(jīng)網(wǎng)路重新配置,或是跨核自動配置資料。這些性能提高的關(guān)鍵點符合當(dāng)年楊林博士提出的基本原則。
[0016]隨著互聯(lián)網(wǎng)和無線網(wǎng)絡(luò)技術(shù)的發(fā)展,電子商務(wù)在我國得到了令人矚目的成長,而電子支付是電子商務(wù)的關(guān)鍵環(huán)節(jié),是電子商務(wù)得以順利發(fā)展的基礎(chǔ)。沒有實時的電子支付手段相配合,交易就無法實現(xiàn)。電子支付是交易的當(dāng)事人,包括消費者、商家和金融機構(gòu)之間,使用安全電子手段,通過網(wǎng)絡(luò)進行的貨幣或資金流轉(zhuǎn),即用戶通過支付終端獲得電子現(xiàn)金、信用卡、借記卡、金融卡等的支付信息,通過網(wǎng)絡(luò)安全地傳送到銀行或相應(yīng)的處理機構(gòu)來實現(xiàn)電子支付。
[0017]電子商務(wù)的基本構(gòu)成如圖1所示,其中支付系統(tǒng)通常由以下功能模塊組成:支付終端、客戶端模塊、與業(yè)務(wù)應(yīng)用系統(tǒng)相連的支付服務(wù)器、與銀行專用網(wǎng)相連的支付網(wǎng)關(guān)等。
[0018]客戶端模塊是在支付過程中,支付服務(wù)器根據(jù)用戶的不同選擇而觸發(fā)的相應(yīng)模塊。當(dāng)用戶訪問關(guān)鍵的業(yè)務(wù)數(shù)據(jù),或在用戶提交支付信息時,服務(wù)器端將激活用戶端的安全代理模塊,獲取用戶的證書、私鑰、帳號信息、訂單狀態(tài)等信息,在用戶與支付服務(wù)器之間建立安全鏈路,保障數(shù)據(jù)點對點通信的機密性和完整性。
[0019]支付服務(wù)器是與業(yè)務(wù)應(yīng)用系統(tǒng)相關(guān)聯(lián)的支付模塊,它發(fā)起并控制一個支付流程的運作。通過一組標(biāo)準(zhǔn)的與具體業(yè)務(wù)部不相關(guān)的支付控制應(yīng)用接口,支付服務(wù)器實現(xiàn)對多種業(yè)務(wù)的支持,主要功能包括:認(rèn)證用戶、支付網(wǎng)關(guān)的身份;提供訂單管理服務(wù);提供用戶訪問通道接口,以實現(xiàn)用戶監(jiān)控支付狀態(tài);處理各種支付消息;加解密交易數(shù)據(jù);管理與之相連的業(yè)務(wù)服務(wù)實體的支付信息;管理配制多個支付網(wǎng)關(guān);為上層業(yè)務(wù)應(yīng)用提供標(biāo)準(zhǔn)接口,用于關(guān)聯(lián)業(yè)務(wù)與支付過程。
[0020]支付網(wǎng)關(guān)是連接銀行端的支付模塊,負(fù)責(zé)連接銀行內(nèi)部專網(wǎng)與支付公網(wǎng)的連接,主要功能包括:提供銀行和支付數(shù)據(jù)格式之間的相互轉(zhuǎn)換;管理證書、私鑰;認(rèn)證用戶與業(yè)務(wù)服務(wù)單位的身份;加解密支付數(shù)據(jù);判斷支付服務(wù)器提交的支付數(shù)據(jù)的完整性;提供用戶訪問通道接口,以實現(xiàn)用戶監(jiān)控支付狀態(tài);提供與多個不同銀行內(nèi)部網(wǎng)相連的配置。
[0021]支付終端是用戶在消費時,連接于POS機的各種采集器,完成不同銀行信用卡、借記卡、金融卡、二維碼、特定標(biāo)識等的信息采集和一定的信息識別,送給后端或遠(yuǎn)端的支付服務(wù)器做進一步處理。
[0022]對于傳統(tǒng)信用卡、借記卡、金融卡等的POS機支付流程,大家已經(jīng)習(xí)以為常。二維條碼/二維碼(Dimens1nal Barcode)是按一定規(guī)律用特定的幾何圖形在黑白相間分布的圖形平面(二維方向)上記錄數(shù)據(jù)符號信息,目前最常見的是QR碼(Quick Response,QR)。(?碼由空白區(qū)包圍,分為功能圖形和編碼區(qū)格式兩部分,前者包括位置探測圖形及分隔符、定位圖形和校正圖形;后者包括格式信息、版本信息和數(shù)據(jù)糾錯信息。通過圖像輸入設(shè)備或光電掃描設(shè)備自動識讀,以實現(xiàn)信息自動處理。二維碼生成過程就是條碼的編碼,將可讀信息轉(zhuǎn)換成碼字,再加上必要的附加信息,然后繪制條碼。在現(xiàn)在電子商務(wù)中,可以用手機生成二維條碼或QR碼,然后由掃描槍自動識讀,完成支付。
[0023]銀行卡和QR碼等的電子支付活動給人民的日常金融消費帶來了極大的便捷,但同時帶來了諸多不便,比如銀行卡過多,攜帶不便;忘記攜帶銀行卡或手機,影響正常刷卡或掃QR碼;銀行卡遺失,不但補卡費時費力,而且存在極大的安全隱患。另外,銀行卡或手機的密碼容易被竊取或者被黑客攻擊而破解,比如當(dāng)用戶在ATM終端輸入密碼時,別人只要注意觀察其動作就可以猜測出密碼。
[0024]由于存在這些問題,為了更好地確保系統(tǒng)的安全性和方便性,人們將目光轉(zhuǎn)移到了生物特征或特定標(biāo)識的識別技術(shù)上,因為人體某些生物特征或特定標(biāo)識各不相同并且很難遺失和仿制。目前使用的生物識別技術(shù)主要有指紋、虹膜、視網(wǎng)膜、語音、面部和DNA,以及特定標(biāo)識的識別技術(shù)。特定標(biāo)識是一些具有明顯區(qū)別于其它事物特征的物品或飾品、圖案和生物特征,比如簽名、紋身、領(lǐng)帶、戒指或項鏈等,以及面孔、語音聲紋等,或者更進一步,把圖像、視頻、文字和聲音等多種標(biāo)識組合到一起,構(gòu)成一個多模態(tài)的特定標(biāo)識。
[0025]在這些生物和特定標(biāo)識識別技術(shù)中,指紋識別已經(jīng)得到了實際應(yīng)用,特別是在智能手機中,許多已經(jīng)帶有指紋識別器。指紋可以看作是一種特定標(biāo)識,用于支付身份的鑒權(quán)。指紋支付就是利用每個人所特有的指紋信息,完成電子支付的系統(tǒng)。指紋支付終端會采集用戶的指紋,進行處理后提取特征信息,然后將這些特征信息和消費金額封裝成規(guī)定的協(xié)議格式通過WIFI或網(wǎng)卡發(fā)送到支付服務(wù)器,以完成支付過程。指紋的采集對硬件要求不高,比較容易實現(xiàn),快速可靠的指紋圖像處理、識別算法也迅速發(fā)展,已經(jīng)可以用于支付終端。美國Paybytouch公司將指紋采集設(shè)備放置在連鎖超市,消費者能夠通過指紋進行身份認(rèn)證和支付,減少客戶的等待時間,降低商家的交易成本,這樣方式同樣也適用于電子商務(wù)支付。
[0026]雖然指紋識別支付得到了應(yīng)用,也存在極大的安全隱患,由于每個人的指紋獨一無二且很難發(fā)生變化,在某些場合容易留下指紋而被竊取,而且有的地方已有販賣指紋膜的,這樣就能模仿盜取他人的指紋。
[0027]為了提高系統(tǒng)的安全性,需要更多地采用非固定的特定標(biāo)識,例如簽名、戒指、紋身、飾物、圖案、物品的圖像等,以及面孔、聲紋等生物特征,或者圖像、視頻、文字和聲音等組合到一起,構(gòu)成多模態(tài)特征,更不容易被別人猜測到,而不是諸如指紋、虹膜等面積較少的、固定的生物特征。但采用簽名、紋身、飾物、特定圖案、面孔、聲紋等特定標(biāo)識,需要大量計算來完成特征提取和識別,這對一般計算機或傳統(tǒng)的支付終端來講,是非常困難的。如果攝像頭采集的圖像直接傳給后端做識別處理,對傳輸線路會提出很高的要求,即使采用了數(shù)據(jù)壓縮,以現(xiàn)有的壓縮算法,數(shù)據(jù)量還是很大的。這對市場推廣很不利。
[0028]讓計算機識別和理解圖像,是人工智能最重要的目標(biāo)之一。尤其是在互聯(lián)網(wǎng)時代,攝像頭將人們選定的某個特定物品或圖案捕捉下來,如果能夠讓手機、便攜設(shè)備、支付終端等很好地識別和理解圖像,將對電子商務(wù)產(chǎn)生巨大的應(yīng)用場景。
[0029]但從上面所述看,不管是谷歌、百度等的大規(guī)模深度神經(jīng)網(wǎng)絡(luò),還是MIT等單位的深度學(xué)習(xí)芯片,由于規(guī)模、功耗、體積、成本或計算效率等問題,現(xiàn)階段用于支付終端還存在一定的難度。
【發(fā)明內(nèi)容】
[0030]針對現(xiàn)有深度神經(jīng)網(wǎng)絡(luò)芯片存在的功耗高、芯片面積大和計算速度慢等,不適用于支付終端的問題,本實用新型提出了一種細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器,以蜂窩/卷積神經(jīng)網(wǎng)絡(luò)(Cellular/Convolut1nal Neural Networks,CNN)為核心,由攝像頭(圖像獲取)、內(nèi)存、微處理器MCU和通信接口模塊等組成了一個圖像識別深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)加速器,提高了集成度,降低了功耗,提供了圖像識別速度和精度,能夠?qū)崟r完成圖像識別,并且配置靈活,通過可編程配置可完成不同的圖像識別功能,增強了電子支付的安全性和便利性。
[0031 ]本實用新型提出的細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器,由以下模塊組成:
[0032]攝像頭,用于獲得特定標(biāo)識的圖像或視頻,把得到的圖像或視頻送給機器視覺識別芯片;
[0033]機器視覺識別芯片,按預(yù)置的功能處理攝像頭輸入的圖像信號或麥克風(fēng)輸入的聲音信號,得到相應(yīng)的特征值,送給微處理器;
[0034]微處理器,設(shè)置和檢測機器視覺識別芯片的工作狀態(tài),接收機器視覺識別芯片送來的圖像特征數(shù)據(jù),運行圖像識別和身份確認(rèn)算法,控制顯示屏的顯示;
[0035]內(nèi)存模塊,保存輸入的原始數(shù)據(jù)、中間計算結(jié)果和最終的圖像特征數(shù)值;
[0036]顯示屏,用以顯示機器視覺識別芯片或系統(tǒng)的工作狀態(tài)和系統(tǒng)配置信息,以及展不相關(guān)圖片或視頻資料;
[0037]通信接口模塊,完成加速器內(nèi)部和外部的命令、數(shù)據(jù)交換,使得芯片按配置的方式工作,并輸入輸出計算結(jié)果;
[0038]麥克風(fēng),拾取用戶的聲音信號,經(jīng)微處理器送給機器視覺識別芯片;
[0039]揚聲器,用于播放語音信息;
[0040]電源模塊,為機器視覺識別芯片和系統(tǒng)提供穩(wěn)定的供電;
[0041]其特征在于所述的機器視覺識別芯片連接攝像頭和微處理器,微處理器連接內(nèi)存模塊、顯示屏、通信接口模塊、麥克風(fēng)、揚聲器和電源,構(gòu)成基于智能視覺識別的支付加速器。
[0042]所述的細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器,其特征在于,所述的機器視覺識別芯片是細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)芯片。
[0043]所述的細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器,其特征在于,所述的細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)支付加速器可以內(nèi)置于平板電腦、筆記本電腦,以及兩者二合一的設(shè)備。
[0044]由上述方案可以看出,本實用新型圍繞細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)CNN,和攝像頭、
[0045]由上述方案可以看出,本實用新型圍繞細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)CNN,和攝像頭、內(nèi)存、微處理器和通信接口等,構(gòu)成一個具有模式識別功能的智能視覺支付加速器,提高圖像識別速度和精度,克服了現(xiàn)有大規(guī)模深度神經(jīng)網(wǎng)絡(luò)或深度學(xué)習(xí)芯片的不足,具有集成度高、功耗小、計算速度快、配置靈活等特點。智能視覺支付加速器使得支付終端像人類視覺系統(tǒng)一樣,具有“看懂”世界的能力,使得支付無需密碼,不要要定期更換,沒有記憶負(fù)擔(dān);無需攜帶銀行卡片或手機,就可以隨時支付,避免了銀行卡或手機的丟失、被盜、被復(fù)制等;可以選擇不同的特定標(biāo)識作為多重密碼或登入多個賬戶;網(wǎng)絡(luò)上傳輸?shù)氖悄硞€特定標(biāo)識的圖像特征數(shù)據(jù),具有很好的隨機性,這些都為用戶和系統(tǒng)提供了更好的安全性和便利性。本實用新型適用范圍廣,市場潛力巨大。
【附圖說明】
[0046]圖1是電子商務(wù)系統(tǒng)構(gòu)成框圖。
[0047]圖2是本實用新型提出的CNN智能視覺支付加速器原理框圖。
[0048]圖3是4 X 4兩維蜂窩神經(jīng)網(wǎng)絡(luò)示意圖。
[0049]圖4是單個細(xì)胞等效電路的舉例。
【具體實施方式】
[0050]下面將結(jié)合附圖對本實用新型的具體實施例進行詳細(xì)描述。
[0051]本實用新型以先進的細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)(CNN)芯片為核心,和攝像頭(圖像獲取)、微處理器、內(nèi)存和通信接口等構(gòu)造一個深度學(xué)習(xí)的智能視覺支付加速器,提高支付終端的識別速度和精度,加速器原理框圖如圖2所示。
[0052]細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)(CNN)芯片:用于圖像特征提取,提取出攝像頭送來的圖像或視頻中的所關(guān)注的圖像主要特征。CNN芯片的核心是細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)(CNN),CNN網(wǎng)絡(luò)的原理框圖如圖3所示,CNN網(wǎng)絡(luò)可以構(gòu)建現(xiàn)在正火熱的深度學(xué)習(xí)系統(tǒng)。如同人類的神經(jīng)網(wǎng)絡(luò),CNN由大量非線性模擬電路組成,能夠?qū)崟r處理輸入的信號,當(dāng)然現(xiàn)在這些非線性模擬電路的功能也可以采用數(shù)字電路來實現(xiàn)。這些非線性模擬電路構(gòu)成的單元稱之為細(xì)胞(Cell),達(dá)數(shù)百萬個的細(xì)胞按一定的規(guī)則排列,只有最鄰近的細(xì)胞才直接互相相連,交換信息。遠(yuǎn)端的細(xì)胞通過耦合間接地發(fā)揮影響。每個細(xì)胞由線性電容、線性電阻、非線性的壓控電流源、獨立的電壓源和獨立的電流源等組成,如圖4所示,也可以用數(shù)字電路實現(xiàn)與圖4等效的功能。CNN利用了模擬和數(shù)字兩個世界的優(yōu)勢,它的連續(xù)時間特性可以實時處理信號,本地互聯(lián)特性使得它便于大規(guī)模集成電路實現(xiàn),CNN特別適用于信號平行處理。
[0053]圖3給出的是二維一層CNN網(wǎng)絡(luò)結(jié)構(gòu),可以進一步構(gòu)筑多層的CNN,增加學(xué)習(xí)的深度,如同現(xiàn)在的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)。CNN細(xì)胞的參數(shù)是可以通過事先設(shè)置,并在后面使用過程中通過程序再次設(shè)置。
[0054]不同的CNN細(xì)胞、不同的CNN層可以完成不同的圖像處理功能,比如不同細(xì)胞分別完成圖像降噪、圖像紋理、邊緣檢測、圖像分割、凸凹角檢測、邊界提取、孔洞填充、骨架提取、裁剪等,從而實時地得到圖像的各種特征,便于后續(xù)微處理進一步實現(xiàn)圖像識別、表示和描述。當(dāng)然,圖像的識別、表示和描述同樣可以由不同配置的CNN實現(xiàn)。
[0055]這里描述的CNN主要是從提取圖像特征出發(fā)的,當(dāng)然CNN也可用于語音或聲音的深度學(xué)習(xí),提取語音信號或聲音信號的特征提取,比如聲紋特征,然后用于語音或聲音的識另U,原理和圖像是類似的。
[0056]CNN獲得的圖像特征信號可以直接送給微處理器MCU,兩者連接接口可以是串行或并行數(shù)據(jù)接口。
[0057]關(guān)于CNN更詳細(xì)的原理,請參見前面給出的楊林博士所申請的發(fā)明專利和發(fā)表的學(xué)術(shù)論文?;贑NN原理,已完成集成電路一智能視覺芯片(Smart Vis1n IntegratedCircuit,SViC)的設(shè)計和流片。
[0058]攝像頭:用于拍攝我們所關(guān)注或要處理的特定標(biāo)識的圖像或視頻,把獲得的圖像或者視頻送給CNN芯片。市場上攝像頭非常多,一般都能滿足本實施例的要求,本實施例中采用了索尼頂X135,采用背照式成像傳感器,分辨率為4224X3176。
[0059]微處理器MCU:微處理連接到CNN芯片,和CNN芯片進行通訊,設(shè)置和檢查CNN芯片的工作狀態(tài)。設(shè)置CNN芯片的初始工作模式,在系統(tǒng)運行期間,它可以讀取CNN芯片的工作狀態(tài),并重新設(shè)置CNN中各個細(xì)胞的配置參數(shù),獲得不同的圖像特征。根據(jù)所選用微處理器的能力,讓微處理器依據(jù)CNN獲得的圖像特征,參與部分圖像識別工作,微處理器和CNN芯片配合加速完成不同的圖像識別功能,提高識別速度和識別性能,一起起到圖像識別加速的作用。依靠識別出的圖像內(nèi)容,可以完成用戶認(rèn)證和鑒別;或者微處理器把相關(guān)特征和初步識別結(jié)果通過無線網(wǎng)絡(luò)上傳到云端,由云端進行處理后返回結(jié)果,再進行支付。
[0060]在本實施例中,微處理選用了ARM內(nèi)核的處理器,具有功耗低、運行速度快、種類多等特性,目前占據(jù)市場主導(dǎo)地位,高通、三星、聯(lián)發(fā)科、華為、全志、瑞芯微、晶晨等眾多公司都能提供ARM微處理器。在本實施例中選用了三星公司的S5PV210作為微處理器,S5PV210采用了ARM CortexTM-A8內(nèi)核,ARM V7指令集,主頻可達(dá)IGHZ,64/32位內(nèi)部總線結(jié)構(gòu),32/32KB的數(shù)據(jù)/指令一級緩存,512KB的二級緩存,可以實現(xiàn)2000DMIPS(每秒運算2億條指令集)的高性能運算能力。S5PV210具有強大的硬件編解碼功能,內(nèi)建MFC(Multi Format Codec)和PowerVR SGX5403D圖形引擎和2D圖形引擎,能夠支持DX9,SM3.0,0penGL2.0等PC級別顯示技術(shù)。具備IVA3硬件加速器,內(nèi)建的HDMIvl.3,可以將高清視頻輸出到外部顯示器上。S5PV210的存儲控制器支持LPDDRl,LPDDR2和DDR2類型的RAM,F(xiàn)lash支持Nandf Iash,Norflash,OneNand等。
[0061]內(nèi)存:用于保存CNN芯片和微處理器等涉及到的輸入的原始數(shù)據(jù)、中間計算結(jié)果和最終的圖像特征數(shù)值等。CNN芯片自身也有存儲器,也可以部分保存圖像特征過程中涉及到的數(shù)據(jù)。本實施例中內(nèi)存選用了美光MT47H64M16HR,是DDR2 SDRAM,容量IGbi t。微處理器的Flash擴展采用了三星K9F1G08U0E,屬于NAND Flash,容量為IGb。
[0062]通信接口模塊:完成加速器和外部的命令、數(shù)據(jù)交換,支持串行數(shù)據(jù)接口,包括USB、I2C等,并行數(shù)據(jù)接口,諸如三星S5PV210等,一般ARM處理器本身就具有USB、I2C、并行數(shù)據(jù)接口、0TG等接口。還支持RJ45接口的以太網(wǎng),以及無線網(wǎng)絡(luò)WiFi接口。本實施例中以太網(wǎng)控制器選用了 WIZnet公司的W5500,支持通過有線網(wǎng)與支付服務(wù)器的通信。WiFi模塊選用了安信可ESP8266。
[0063]觸摸液晶顯示屏LCD:微處理器還連接有觸摸液晶顯示屏,用以顯示CNN芯片或系統(tǒng)的工作狀態(tài)和系統(tǒng)配置等信息,以及通過觸摸屏接受用戶的輸入。本實施例的觸摸液晶顯示屏采用了淘晶馳TJC4024T032_011R屏,觸摸方式為電阻式。
[0064]麥克風(fēng):用于將用戶的聲音信號轉(zhuǎn)換為電信號,通過微處理器M⑶送給CNN芯片,進行聲音特征提取,進而完成聲音識別,實現(xiàn)用戶認(rèn)證和基于聲音的支付,也可以和圖像、視覺等組合到一起構(gòu)成多模態(tài)支付。本實施例對麥克風(fēng)沒有特殊要求,一般市場上的麥克風(fēng)都可滿足要求。
[0065]揚聲器:用于播放語音信息,比如提示音。本實施例對揚聲器沒有特殊要求,一般市場上的揚聲器都可滿足要求。
[0066]電源:用于給CNN芯片和系統(tǒng)提供所需的穩(wěn)定供電。
[0067]上述內(nèi)存芯片、通信接口芯片或模塊、麥克風(fēng)、揚聲器以及觸摸液晶顯示屏都通過合適的管腳連接到微處理芯片上。
[0068]本實施例的特征在于所述的細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)(CNN)芯片和攝像頭、內(nèi)存、微處理器、通信接口模塊和電源等構(gòu)成圖像或視頻支付中特征提取和識別加速器。
[0069]本實施例采用了Android操作系統(tǒng),所涉及到軟件,在此就不再贅述了。
[0070]本實用新型以細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)(CNN)芯片為核心構(gòu)成了智能視覺支付終端,可用于商場、超市等,以及網(wǎng)上商店,具有突出的優(yōu)點:無需使用密碼,密碼也不需要定期更換,不怕忘記了,沒有記憶負(fù)擔(dān);無需攜帶銀行卡或手機,也可隨時支付,給人們帶來極大的方便,避免銀行卡丟失、被盜、復(fù)制等不安全行為;可以利用多個特定標(biāo)識構(gòu)成多重密碼,提高系統(tǒng)安全性,或者登入多個賬戶;圖像特征的長度是普通密碼無法比擬的,密碼強度會非常高;網(wǎng)絡(luò)上傳輸?shù)氖悄硞€特定標(biāo)識的圖像特征數(shù)據(jù),具有很好的隨機性,即使得到了這些數(shù)據(jù),破譯難度也很大。這些都為用戶和系統(tǒng)提供了更好的安全性和便利性。
[0071 ]上述實施例中是把CNN芯片內(nèi)置在支付終端里,當(dāng)然,所述的CNN加速器也可以內(nèi)置于除支付終端以外的智能手機和其它便攜設(shè)備里,例如把所述CNN加速器內(nèi)置于平板電腦,像IPAD,和筆記本電腦,以及兩者二合一的筆記本電腦等。
[0072]同樣地,CNN芯片可以做成具有相應(yīng)標(biāo)準(zhǔn)接口的計算機板卡,如同現(xiàn)在大規(guī)模深度神經(jīng)網(wǎng)絡(luò)中普遍采用的GPU板卡,插入個人臺式計算機(PC機)、服務(wù)器、工作站以及大中型計算機等里面,構(gòu)建基于CNN芯片的大規(guī)模深度神經(jīng)網(wǎng)絡(luò)系統(tǒng),完成大數(shù)據(jù)的深度學(xué)習(xí)支付系統(tǒng)。
[0073]上述實施例中涉及到的細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)(Cellular/Convolut1nal NeuralNetWOrkS,CNN)芯片,在實際具體實施中,也可以替換為其它機器視覺識別芯片,例如基于淺度學(xué)習(xí)(Shallow Learning)的機器視覺識別芯片、基于自動編碼器(AutoEncoder)、稀疏編碼(Sparse Coding)、限制玻爾茲曼機(Restricted Boltzmann Machine,RBM)、深信度網(wǎng)絡(luò)(Deep Belief Networks)等算法的深度學(xué)習(xí)(Deep Learning)的機器視覺識別芯片。
[0074]上述【具體實施方式】以較佳實施例對本實用新型進行了說明,但這只是為了便于理解而舉的一個形象化的實例,不應(yīng)被視為是對本實用新型范圍的限制。同樣,根據(jù)本實用新型的技術(shù)方案及其較佳實施例的描述,可以做出各種可能的等同改變或替換,而所有這些改變或替換都應(yīng)屬于本實用新型權(quán)利要求的保護范圍。
【主權(quán)項】
1.細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器,由以下模塊組成: 攝像頭,用于獲得特定標(biāo)識的圖像或視頻,把得到的圖像或視頻送給機器視覺識別芯片; 機器視覺識別芯片,按預(yù)置的功能處理攝像頭輸入的圖像信號或者麥克風(fēng)輸入的聲音信號,得到相應(yīng)的特征值,送給微處理器; 微處理器,設(shè)置和檢測機器視覺識別芯片的工作狀態(tài),接收機器視覺識別芯片送來的圖像特征數(shù)據(jù),運行圖像識別和身份確認(rèn)算法,控制顯示屏的顯示; 內(nèi)存模塊,保存輸入的原始數(shù)據(jù)、中間計算結(jié)果和最終的圖像特征數(shù)值; 顯示屏,用以顯示機器視覺識別芯片或系統(tǒng)的工作狀態(tài)和系統(tǒng)配置信息,以及展示相關(guān)圖片或視頻資料; 通信接口模塊,完成命令、數(shù)據(jù)的交換; 麥克風(fēng),拾取用戶的聲音信號,經(jīng)微處理器送給機器視覺識別芯片; 揚聲器,用于播放語音信息; 電源模塊,為機器視覺識別芯片和系統(tǒng)提供穩(wěn)定的供電; 其特征在于所述的機器視覺識別芯片連接攝像頭和微處理器,微處理器連接內(nèi)存模塊、顯示屏、通信接口、麥克風(fēng)、揚聲器和電源,構(gòu)成基于智能視覺識別的支付加速器。2.根據(jù)權(quán)利要求1所述的細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)智能視覺支付加速器,其特征在于,所述的機器視覺識別芯片是細(xì)胞/卷積神經(jīng)網(wǎng)絡(luò)芯片。
【文檔編號】G06N3/02GK205665729SQ201620177655
【公開日】2016年10月26日
【申請日】2016年3月9日
【發(fā)明人】陳進民, 林建國
【申請人】陳進民, 林建國