一種基于隨機(jī)森林的鈔票鑒偽方法
【專利摘要】本發(fā)明涉及鈔票防偽研究領(lǐng)域,具體涉及一種基于隨機(jī)森林的鈔票鑒偽方法,基于傳感器獲取的鈔票的多光譜圖像,利用嵌入式設(shè)備芯片進(jìn)行處理,包括:由采集到的原始圖像及其梯度圖像截取特定區(qū)域進(jìn)行特征提取,獲得分類所需的多個(gè)特征;創(chuàng)建單棵決策樹,從根節(jié)點(diǎn)開始節(jié)點(diǎn)拆分,直至到達(dá)葉子節(jié)點(diǎn);建立多棵決策樹的隨機(jī)森林。通過(guò)上述方式,建立了可在嵌入式設(shè)備上實(shí)現(xiàn)的隨機(jī)森林分類器,能夠在使用如DSP芯片作為處理器的點(diǎn)鈔機(jī)上實(shí)現(xiàn)鈔票的鑒偽工作,提高了點(diǎn)鈔機(jī)中鈔票鑒偽的性能,能夠準(zhǔn)確鑒別真鈔中混雜的假鈔并分類,而且計(jì)算速度快,能滿足設(shè)備的實(shí)時(shí)性要求??朔藗鹘y(tǒng)的鑒偽方法識(shí)別未知假幣和新幣種的能力較弱的缺陷。
【專利說(shuō)明】
一種基于隨機(jī)森林的鈔票鑒偽方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于鈔票防偽研究領(lǐng)域,特別是涉及一種基于隨機(jī)森林的鈔票鑒偽方法。
【背景技術(shù)】
[0002] 點(diǎn)鈔機(jī)是一種自動(dòng)清點(diǎn)鈔票數(shù)目和識(shí)別假幣的機(jī)電一體化裝置,在現(xiàn)金流通量較 大的辦公處,點(diǎn)鈔機(jī)已經(jīng)成為不可或缺的設(shè)備。偽鈔識(shí)別是點(diǎn)鈔機(jī)至關(guān)重要的功能。紙幣上 有多種防偽信息,傳統(tǒng)的點(diǎn)鈔機(jī)利用磁性分布、紅外線穿透、紙張熒光反應(yīng)等特征來(lái)鑒偽。 隨著印刷技術(shù)、復(fù)印技術(shù)和電子掃描技術(shù)的發(fā)展,偽鈔制造水平越來(lái)越高,點(diǎn)鈔機(jī)傳統(tǒng)的鑒 別技術(shù)已不能滿足。而利用多光譜圖像鑒偽,不但能提高性能跟鑒別能力,并能得到許多其 他鑒偽系統(tǒng)無(wú)法獲取的信息。
[0003] 多光譜圖像檢測(cè)技術(shù)對(duì)鈔票進(jìn)行多個(gè)波段獨(dú)自全幅成像、采集,得到鈔票的紫外 圖像、白光圖像和紅外圖像,分析、記錄而實(shí)現(xiàn)鈔票的真?zhèn)舞b別。鈔票的多光譜圖像鑒偽技 術(shù)是鈔票防偽研究領(lǐng)域的熱門問(wèn)題,它與國(guó)家的金融安全息息相關(guān),具有重要的理論價(jià)值 和廣闊的應(yīng)用前景。傳統(tǒng)的多光譜圖像鑒偽技術(shù)中,利用鈔票圖像的統(tǒng)計(jì)信息如像素直方 圖、均值、方差等進(jìn)行鑒別的方法,應(yīng)用傳統(tǒng)的"以假鑒真"技術(shù),這種鑒偽方法容易受不同 點(diǎn)鈔機(jī)設(shè)備采圖環(huán)境的影響,鑒別結(jié)果受經(jīng)驗(yàn)值設(shè)定的限制,因此識(shí)別未知假幣和新幣種 的能力較弱?;跈C(jī)器學(xué)習(xí)的方法,通過(guò)較低級(jí)的分類器設(shè)計(jì)達(dá)到鈔票分類目的的方法,采 用"以真鑒假"的策略,在每臺(tái)點(diǎn)鈔機(jī)機(jī)器初次使用時(shí)都需要進(jìn)行訓(xùn)練以補(bǔ)償機(jī)器差異造成 的影響,這些方法也容易受不同幣種的不同光照、新舊、噪聲污染等因素的影響。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是提供一種鈔票鑒偽方法,以嵌入式數(shù)字信號(hào)處理器平臺(tái)為基礎(chǔ), 實(shí)現(xiàn)了隨機(jī)森林算法在嵌入式設(shè)備上的應(yīng)用,能實(shí)現(xiàn)"以真鑒真、借假鑒假",避免不同機(jī)器 的差異性造成的影響,該方法只需要進(jìn)行一次訓(xùn)練而無(wú)需對(duì)每臺(tái)新的設(shè)備都進(jìn)行初始化, 能夠可靠地對(duì)紙幣進(jìn)行分類,并穩(wěn)定地檢測(cè)出傳統(tǒng)防偽技術(shù)無(wú)法識(shí)別的假幣、變?cè)鞄乓约?不易流通的紙幣。
[0005] 為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:一種基于隨機(jī)森林的鈔票鑒偽方法, 包括以下步驟:
[0006] SI.鈔票圖像的特征提取:
[0007] 采集鈔票的多光譜圖像,截取特定區(qū)域,采用SSIM方法,得到多個(gè)鑒偽指標(biāo),多個(gè) 鑒偽指標(biāo)通過(guò)線性組合得到真假鈔分類所需的η個(gè)特征;
[0008] S2.樣本訓(xùn)練:
[0009] 依據(jù)所提取的特征F1、F2、···、Fm和待鑒鈔票的訓(xùn)練樣本,采用隨機(jī)森林方法進(jìn)行 訓(xùn)練;創(chuàng)建決策樹,對(duì)訓(xùn)練樣本有放回地隨機(jī)抽樣得到N個(gè)樣本及其響應(yīng),真鈔為1,假鈔為 〇;
[0010] S3.節(jié)點(diǎn)拆分:
[0011] S31.從根節(jié)點(diǎn)開始節(jié)點(diǎn)拆分,拆分的終止條件為樹到達(dá)最大深度或節(jié)點(diǎn)樣本數(shù)到 達(dá)最小,若為根節(jié)點(diǎn),重新計(jì)算正、負(fù)樣本的概率prior,與正、負(fù)樣本數(shù)加權(quán),并歸一化,得 到新的pr i or,計(jì)算每個(gè)節(jié)點(diǎn)的va I ue,
[0012] (1):
[0013] (1)式中Pl為正樣本概率,PO為負(fù)樣本概率,N正為正樣本數(shù),N負(fù)為負(fù)樣本數(shù);
[0014] 隨機(jī)抽取M個(gè)不重復(fù)的特征并確定每個(gè)特征的最佳拆分閾值;具體包括以下步驟:
[0015] S311.對(duì)抽取到的每個(gè)特征,將訓(xùn)練數(shù)據(jù)由小到大排序,從最左邊的數(shù)據(jù)起作為拆 分點(diǎn),計(jì)算分裂質(zhì)量,找出分裂質(zhì)量最高的點(diǎn)并得到拆分閾值,由此選定具有最高分裂質(zhì)量 的特征作為分裂特征;
[0016] S32.對(duì)所述選定的分裂特征,小于其拆分閾值的樣本歸入左節(jié)點(diǎn),大于或等于其 拆分閾值的樣本歸入右節(jié)點(diǎn),遞歸運(yùn)算繼續(xù)進(jìn)行節(jié)點(diǎn)拆分直至達(dá)到終止條件;
[0017] S4.誤差估計(jì):
[0018] -棵樹訓(xùn)練完成后進(jìn)行oob誤差估計(jì),將訓(xùn)練樹時(shí)沒(méi)有被抽到的訓(xùn)練樣本作為oob 樣本,放剎該樹中預(yù)涮分類,
[0019]
[0020] 若oob誤差率太大則丟棄當(dāng)前樹,重新訓(xùn)練一棵樹;
[0021] S5.鈔票鑒偽結(jié)果:
[0022] 所有樹訓(xùn)練完成后,得到隨機(jī)森林,待鑒鈔票的測(cè)試樣本作為輸入,放到隨機(jī)森林 中預(yù)測(cè)分類得到分類結(jié)果,實(shí)現(xiàn)鈔票的鑒偽功能。
[0023] 進(jìn)一步地,實(shí)現(xiàn)步驟Sl中采集鈔票的多光譜圖像,截取特定區(qū)域還包括以下步驟:
[0024] 通過(guò)點(diǎn)鈔機(jī)中的傳感器獲取鈔票的自然光圖像與紅外圖像,由sobel算子進(jìn)行邊 緣檢測(cè)獲取兩幅圖像的梯度圖像,截取以上四幅圖像的特定鑒偽區(qū)域。
[0025] 進(jìn)一步地,所述點(diǎn)鈔機(jī)中傳感器采用CMOS或CIS傳感器。
[0026] 進(jìn)一步地,步驟Sl中所述SSIM為衡量?jī)煞鶊D像相似度的指標(biāo),其值越大相似度越 高,最大為1。
[0027] 進(jìn)一步地,所述鈔票鑒偽方法利用嵌入式設(shè)備芯片進(jìn)行處理,在嵌入式設(shè)備上建 立隨機(jī)森林分類器,實(shí)現(xiàn)真假鈔鑒定分類。
[0028]進(jìn)一步地,在采用DSP芯片作為處理器的點(diǎn)鈔機(jī)上使用所述鈔票鑒偽方法進(jìn)行真 假鈔鑒定分類。
[0029] 更進(jìn)一步地,所述采集鈔票的多光譜圖像,包括采集真鈔和假鈔的多光譜圖像。
[0030] 以下就上述的鈔票鑒偽方法中相關(guān)概念進(jìn)行闡述或者定義:
[0031]定義一:SSIM,一種衡量?jī)煞鶊D像相似度的新指標(biāo),其值越大相似度越高,最大為 Io
[0032] 定義二:〇〇b誤差估計(jì),oob數(shù)據(jù)即袋外數(shù)據(jù),是訓(xùn)練中沒(méi)有被采集到的樣本集合, 它們可以用來(lái)取代測(cè)試集誤差估計(jì)方法。
[0033] 上述的鈔票鑒偽方法由采集到的原始圖像及其梯度圖像截取特定區(qū)域進(jìn)行特征 提取,獲得分類所需的多個(gè)特征;創(chuàng)建單棵決策樹,從根節(jié)點(diǎn)開始節(jié)點(diǎn)拆分,直至到達(dá)葉子 節(jié)點(diǎn);建立多棵決策樹的隨機(jī)森林。通過(guò)以上方式建立了可在嵌入式設(shè)備上實(shí)現(xiàn)的隨機(jī)森 林分類器。
[0034]上述的鈔票鑒偽方法是基于點(diǎn)鈔機(jī)中CMOS傳感器獲取的多光譜圖像,主要是紅外 圖像和自然光圖像,利用DSP芯片進(jìn)行處理得到鈔票鑒偽結(jié)果,能夠在使用DSP芯片作為處 理器的點(diǎn)鈔機(jī)上實(shí)現(xiàn)鈔票的鑒偽工作,提高了點(diǎn)鈔機(jī)中鈔票鑒偽的性能,能夠準(zhǔn)確鑒別真 鈔中混雜的假鈔并分類,而且計(jì)算速度快,能滿足設(shè)備的實(shí)時(shí)性要求。
[0035]上述的鈔票鑒偽方法使用多光譜圖像傳感器得到的高分辨率的自然光圖像和紅 外圖像,自動(dòng)獲取鈔票圖像中具有鑒別性的特征,以同一張鈔票帶有防偽信息的區(qū)域在自 然光下和紅外光下的圖像相似度為衡量指標(biāo),"以真鑒真、借假鑒假",避免了不同機(jī)器的差 異性造成的影響。
[0036] 上述的鈔票鑒偽方法利用獲得的真鈔特征樣本和假鈔特征樣本,訓(xùn)練生成隨機(jī)森 林的決策樹,新的鈔票樣本到來(lái)時(shí),投入已生成的隨機(jī)森林中,即可得到可靠的樣本分類結(jié) 果。由于避免了機(jī)器差異性的影響,該方法只需要進(jìn)行一次訓(xùn)練而無(wú)需對(duì)每臺(tái)新的設(shè)備都 進(jìn)行初始化。
[0037] 上述的鈔票鑒偽方法可以實(shí)現(xiàn)在各類嵌入式設(shè)備包括點(diǎn)鈔機(jī)中的真假鈔鑒定分 類。
[0038] 本發(fā)明的有益效果:上述的鈔票鑒偽方法大大地提升了識(shí)別未知假幣和新幣種的 能力,能夠高可靠地對(duì)紙幣進(jìn)行分類,并且能夠穩(wěn)定地檢測(cè)出傳統(tǒng)防偽技術(shù)無(wú)法識(shí)別的假 幣、變?cè)鞄乓约安灰琢魍ǖ募垘?,保證流通紙幣的安全性和可靠性。提高了點(diǎn)鈔機(jī)中鈔票鑒 偽的性能,能夠準(zhǔn)確鑒別真鈔中混雜的假鈔并分類,而且計(jì)算速度快,能滿足設(shè)備的實(shí)時(shí)性 要求。該鈔票鑒偽方法采用"以真鑒真、借假鑒假",避免了不同機(jī)器的差異性造成的影響; 只需要進(jìn)行一次訓(xùn)練而無(wú)需對(duì)每臺(tái)新的設(shè)備都進(jìn)行初始化。
【附圖說(shuō)明】
[0039] 圖1為本發(fā)明一個(gè)實(shí)施例的圖像鑒偽流程示意圖;
[0040] 圖2為本發(fā)明一個(gè)實(shí)施例的隨機(jī)森林示意圖。
【具體實(shí)施方式】
[0041] 下面結(jié)合附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行詳細(xì)描述。
[0042 ]如圖1、圖2所示,為本發(fā)明的一個(gè)實(shí)施例。
[0043] 實(shí)施例的技術(shù)方案如下:一種基于隨機(jī)森林的鈔票鑒偽方法,包括以下步驟:
[0044] Sl.鈔票圖像的特征提?。?br>[0045] 采集鈔票的多光譜圖像,截取特定區(qū)域,采用SSIM方法,得到多個(gè)鑒偽指標(biāo),多個(gè) 鑒偽指標(biāo)通過(guò)線性組合得到真假鈔分類所需的η個(gè)特征;
[0046] S2.樣本訓(xùn)練:
[0047]依據(jù)所提取的特征F1、F2、···、Fm和待鑒鈔票的訓(xùn)練樣本,采用隨機(jī)森林方法進(jìn)行 訓(xùn)練;創(chuàng)建決策樹,對(duì)訓(xùn)練樣本有放回地隨機(jī)抽樣得到N個(gè)樣本及其響應(yīng),真鈔為1,假鈔為 〇;
[0048] S3.節(jié)點(diǎn)拆分:
[0049] S31.從根節(jié)點(diǎn)開始節(jié)點(diǎn)拆分,拆分的終止條件為樹到達(dá)最大深度或節(jié)點(diǎn)樣本數(shù)到 達(dá)最小,若為根節(jié)點(diǎn),重新計(jì)算正、負(fù)樣本的概率prior,與正、負(fù)樣本數(shù)加權(quán),并歸一化,得 到新的pr i or,計(jì)算每個(gè)節(jié)點(diǎn)的va I ue,
[0050] Cl)
[0051] (1)式中Pl為正樣本概率,PO為負(fù)樣本概率,N正為正樣本數(shù),N負(fù)為負(fù)樣本數(shù);
[0052] 隨機(jī)抽取M個(gè)不重復(fù)的特征并確定每個(gè)特征的最佳拆分閾值;具體包括以下步驟:
[0053] S311.對(duì)抽取到的每個(gè)特征,將訓(xùn)練數(shù)據(jù)由小到大排序,從最左邊的數(shù)據(jù)起作為拆 分點(diǎn),計(jì)算分裂質(zhì)量,找出分裂質(zhì)量最高的點(diǎn)并得到拆分閾值,由此選定具有最高分裂質(zhì)量 的特征作為分裂特征;
[0054] S32.對(duì)所述選定的分裂特征,小于其拆分閾值的樣本歸入左節(jié)點(diǎn),大于或等于其 拆分閾值的樣本歸入右節(jié)點(diǎn),遞歸運(yùn)算繼續(xù)進(jìn)行節(jié)點(diǎn)拆分直至達(dá)到終止條件;
[0055] S4.誤差估計(jì):
[0056] -棵樹訓(xùn)練完成后進(jìn)行oob誤差估計(jì),將訓(xùn)練樹時(shí)沒(méi)有被抽到的訓(xùn)練樣本作為oob 樣本,放到該樹中預(yù)測(cè)分類, 「 ^ C+分奚鐠誤_ O幽樣本數(shù)
[0057] 誒全犖=---_TT;------------------τ二--: 總_論鋅本數(shù)
[0058]若oob誤差率太大則丟棄當(dāng)前樹,重新訓(xùn)練一棵樹;
[0059] S5.鈔票鑒偽結(jié)果:
[0060] 所有樹訓(xùn)練完成后,得到隨機(jī)森林,待鑒鈔票的測(cè)試樣本作為輸入,放到隨機(jī)森林 中預(yù)測(cè)分類得到分類結(jié)果,實(shí)現(xiàn)鈔票的鑒偽功能。
[0061] 在上述的鈔票鑒偽方法中,實(shí)現(xiàn)步驟Sl中采集鈔票的多光譜圖像,截取特定區(qū)域 還包括以下步驟:通過(guò)點(diǎn)鈔機(jī)中的傳感器獲取鈔票的自然光圖像與紅外圖像,由sobel算子 進(jìn)行邊緣檢測(cè)獲取兩幅圖像的梯度圖像,截取以上四幅圖像的特定鑒偽區(qū)域。
[0062] 上述的鈔票鑒偽方法中所述點(diǎn)鈔機(jī)中傳感器采用CMOS或CIS傳感器。步驟Sl中所 述SSIM為衡量?jī)煞鶊D像相似度的指標(biāo),其值越大相似度越高,最大為1。所述鈔票鑒偽方法 利用嵌入式設(shè)備芯片進(jìn)行處理,在嵌入式設(shè)備上建立隨機(jī)森林分類器,實(shí)現(xiàn)真假鈔鑒定分 類。在采用DSP芯片作為處理器的點(diǎn)鈔機(jī)上使用所述鈔票鑒偽方法進(jìn)行真假鈔鑒定分類。所 述采集鈔票的多光譜圖像,包括采集真鈔和假鈔的多光譜圖像。
[0063] 根據(jù)上述實(shí)施例闡述的技術(shù)方案,具體描述如下:一種基于隨機(jī)森林的鈔票鑒偽 方法,基于點(diǎn)鈔機(jī)中CMOS或CIS傳感器獲取的多光譜圖像,主要是紅外圖像和自然光圖像以 及R、G、B圖像等,包括以下步驟:
[0064] 第一步:鈔票圖像的特征提取,通過(guò)點(diǎn)鈔機(jī)中的CMOS傳感器獲取鈔票的自然光圖 像與紅外圖像,由sobel算子進(jìn)行邊緣檢測(cè)獲取兩幅圖像的梯度圖像,截取以上四幅圖像的 特定鑒偽區(qū)域并采用SSIM方法,得到多個(gè)鑒偽指標(biāo),多個(gè)鑒偽指標(biāo)通過(guò)線性組合得到真假 鈔分類所需的η個(gè)特征;
[0065]第二步:依據(jù)提取的特征Fl、F2、…、Fm和鈔票的訓(xùn)練樣本,首先,創(chuàng)建單棵決策樹, 對(duì)訓(xùn)練樣本有放回地隨機(jī)抽樣得到N個(gè)樣本及其響應(yīng);真鈔為I,假鈔為O;
[0066] 第三步:從根節(jié)點(diǎn)開始節(jié)點(diǎn)拆分,拆分的終止條件為樹到達(dá)最大深度或節(jié)點(diǎn)樣本 數(shù)到達(dá)最小,若為根節(jié)點(diǎn),重新計(jì)算正、負(fù)樣本的概率prior,與正、負(fù)樣本數(shù)加權(quán),并歸一 化,得到新的prior,計(jì)算每個(gè)節(jié)點(diǎn)的value,
[0067] ⑴
[0068] (1)式中正樣本概率為Pl,負(fù)樣本概率為PO,N正為正樣本數(shù),N負(fù)為負(fù)樣本數(shù);
[0069] 隨機(jī)抽取M個(gè)不重復(fù)的特征并找到每個(gè)特征的最好拆分閾值,具體為:
[0070] 對(duì)抽取到的每個(gè)特征,將訓(xùn)練數(shù)據(jù)由小到大排序,從最左邊的數(shù)據(jù)起作為拆分點(diǎn), 計(jì)算分裂質(zhì)量,找到分裂質(zhì)量最高的點(diǎn)并得到拆分閾值,由此選出具有最高分裂質(zhì)量的特 征作為分裂特征;
[0071] 第四步:節(jié)點(diǎn)拆分,對(duì)選定的分裂特征,小于其拆分閾值的樣本歸入左節(jié)點(diǎn),大于 或等于拆分閾值的樣本歸入右節(jié)點(diǎn),遞歸運(yùn)算繼續(xù)進(jìn)行節(jié)點(diǎn)拆分直至達(dá)到終止條件;
[0072] 第五步:一棵樹訓(xùn)練完成后進(jìn)行oob誤差估計(jì),將訓(xùn)練樹時(shí)沒(méi)有被抽到的訓(xùn)練樣本 作為oob樣本,放到該樹中預(yù)測(cè)分類, 「 ^ 城.+分類鐵誤_ 樣本數(shù)
[0073 ]·|>!餐煙舉=---------------------------------ΓΓΤ--Τ:--- 總_ 〇說(shuō)5禪本數(shù)
[0074] 若oob誤差率太大則丟棄當(dāng)前樹,重新訓(xùn)練;
[0075] 第六步:所有樹訓(xùn)練完成后,得到隨機(jī)森林,待鑒鈔票的測(cè)試樣本作為輸入,放到 森林中預(yù)測(cè)分類得到分類結(jié)果,實(shí)現(xiàn)鈔票的鑒偽功能;
[0076] 該方法可以實(shí)現(xiàn)在點(diǎn)鈔機(jī)中的真假鈔鑒定分類。
[0077] 本實(shí)施例以同一張鈔票帶有防偽信息的區(qū)域在自然光光下和紅外光下的圖像相 似度為衡量指標(biāo),"以真鑒真、借假鑒假",避免了不同機(jī)器的差異性造成的影響。利用獲得 的真鈔特征樣本和假鈔特征樣本,訓(xùn)練生成隨機(jī)森林的決策樹,新的鈔票樣本到來(lái)時(shí),投入 以生成的隨機(jī)森林中,即可得到可靠的樣本分類結(jié)果。由于避免了機(jī)器差異性的影響,只需 要進(jìn)行一次訓(xùn)練而無(wú)需對(duì)每臺(tái)新的設(shè)備都進(jìn)行初始化。從而大大地提升了點(diǎn)鈔機(jī)識(shí)別未知 假幣和新幣種的能力,能夠高可靠地對(duì)紙幣進(jìn)行分類,并且能夠穩(wěn)定地檢測(cè)出傳統(tǒng)防偽技 術(shù)無(wú)法識(shí)別的假幣、變?cè)鞄乓约安灰琢魍ǖ募垘?,保證流通紙幣的安全性和可靠性。
[0078] 應(yīng)當(dāng)理解的是,本說(shuō)明書未詳細(xì)闡述的部分均屬于現(xiàn)有技術(shù)。
[0079]雖然以上結(jié)合附圖描述了本發(fā)明的【具體實(shí)施方式】,但是本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng) 理解,這些僅是舉例說(shuō)明,可以對(duì)這些實(shí)施方式做出多種變形或修改,而不背離本發(fā)明的原 理和實(shí)質(zhì)。本發(fā)明的范圍僅由所附權(quán)利要求書限定。
【主權(quán)項(xiàng)】
1. 一種基于隨機(jī)森林的鈔票鑒偽方法,其特征在于:包括以下步驟:51. 鈔票圖像的特征提?。?采集鈔票的多光譜圖像,截取特定區(qū)域,采用SSM方法,得到多個(gè)鑒偽指標(biāo),多個(gè)鑒偽 指標(biāo)通過(guò)線性組合得到真假鈔分類所需的η個(gè)特征;52. 樣本訓(xùn)練: 依據(jù)所提取的特征FI、F2、…、Fm和待鑒鈔票的訓(xùn)練樣本,采用隨機(jī)森林方法進(jìn)行訓(xùn)練; 創(chuàng)建決策樹,對(duì)訓(xùn)練樣本有放回地隨機(jī)抽樣得到N個(gè)樣本及其響應(yīng),真鈔為1,假鈔為0;53. 節(jié)點(diǎn)拆分:531. 從根節(jié)點(diǎn)開始節(jié)點(diǎn)拆分,拆分的終止條件為樹到達(dá)最大深度或節(jié)點(diǎn)樣本數(shù)到達(dá)最 小,若為根節(jié)點(diǎn),重新計(jì)算正、負(fù)樣本的概率prior,與正、負(fù)樣本數(shù)加權(quán),并歸一化,得到新 的prior,計(jì)算每個(gè)節(jié)點(diǎn)的value,(1)式中P1為正樣本概率,P0為負(fù)樣本概率,N正為正樣本數(shù),N負(fù)為負(fù)樣本數(shù); 隨機(jī)抽取Μ個(gè)不重復(fù)的特征并確定每個(gè)特征的最佳拆分閾值;具體包括以下步驟: S311.對(duì)抽取到的每個(gè)特征,將訓(xùn)練數(shù)據(jù)由小到大排序,從最左邊的數(shù)據(jù)起作為拆分 點(diǎn),計(jì)算分裂質(zhì)量,找出分裂質(zhì)量最高的點(diǎn)并得到拆分閾值,由此選定具有最高分裂質(zhì)量的 特征作為分裂特征;532. 對(duì)所述選定的分裂特征,小于其拆分閾值的樣本歸入左節(jié)點(diǎn),大于或等于其拆分 閾值的樣本歸入右節(jié)點(diǎn),遞歸運(yùn)算繼續(xù)進(jìn)行節(jié)點(diǎn)拆分直至達(dá)到終止條件;54. 誤差估計(jì): 一棵樹訓(xùn)練完成后進(jìn)行〇〇b誤差估計(jì),將訓(xùn)練樹時(shí)沒(méi)有被抽到的訓(xùn)練樣本作為〇〇b樣 本,放到該樹中預(yù)測(cè)分類,若oob誤差率太大則丟棄當(dāng)前樹,重新訓(xùn)練一棵樹;55. 鈔票鑒偽結(jié)果: 所有樹訓(xùn)練完成后,得到隨機(jī)森林,待鑒鈔票的測(cè)試樣本作為輸入,放到隨機(jī)森林中預(yù) 測(cè)分類得到分類結(jié)果,實(shí)現(xiàn)鈔票的鑒偽功能。2. 如權(quán)利要求1所述的鈔票鑒偽方法,其特征在于:實(shí)現(xiàn)步驟S1中采集鈔票的多光譜圖 像,截取特定區(qū)域還包括以下步驟: 通過(guò)點(diǎn)鈔機(jī)中的傳感器獲取鈔票的自然光圖像與紅外圖像,由sobel算子進(jìn)行邊緣檢 測(cè)獲取兩幅圖像的梯度圖像,截取以上四幅圖像的特定鑒偽區(qū)域。3. 如權(quán)利要求2所述的鈔票鑒偽方法,其特征在于:所述點(diǎn)鈔機(jī)中傳感器采用CMOS或 CIS傳感器。4. 如權(quán)利要求1所述的鈔票鑒偽方法,其特征在于:步驟S1中所述SS頂為衡量?jī)煞鶊D像 相似度的指標(biāo),其值越大相似度越高,最大為1。5. 如權(quán)利要求1所述的鈔票鑒偽方法,其特征在于:所述鈔票鑒偽方法利用嵌入式設(shè)備 芯片進(jìn)行處理,在嵌入式設(shè)備上建立隨機(jī)森林分類器,實(shí)現(xiàn)真假鈔鑒定分類。6. 如權(quán)利要求2所述的鈔票鑒偽方法,其特征在于:在采用DSP芯片作為處理器的點(diǎn)鈔 機(jī)上使用所述鈔票鑒偽方法進(jìn)行真假鈔鑒定分類。7. 如權(quán)利要求2所述的鈔票鑒偽方法,其特征在于:所述采集鈔票的多光譜圖像,包括 采集真鈔和假鈔的多光譜圖像。
【文檔編號(hào)】G07D7/20GK106056752SQ201610352247
【公開日】2016年10月26日
【申請(qǐng)日】2016年5月25日
【發(fā)明人】馮天鵬, 江燕婷, 顏佳, 林金勇
【申請(qǐng)人】武漢大學(xué)