亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

自適應(yīng)提升法和非相關(guān)判別分析的豬肉貯藏時(shí)間判定方法

文檔序號(hào):6380874閱讀:258來源:國知局
專利名稱:自適應(yīng)提升法和非相關(guān)判別分析的豬肉貯藏時(shí)間判定方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種特征提取方法,具體涉及采用自適應(yīng)提升法和非相關(guān)判別分析相結(jié)合的特征提取方法,用于判定豬肉貯藏時(shí)間。
背景技術(shù)
目前國內(nèi)的豬肉檢查手段主要依靠感官和理化分析相結(jié)合的方法,這些方法需要對(duì)樣本進(jìn)行粉碎,肉浸液提取等操作,其檢測(cè)過程不僅繁瑣,而且耗時(shí)較長,難以滿足大批量的檢測(cè)需求。同時(shí)其感官評(píng)價(jià)結(jié)果受人為因素較大,難以保證其檢測(cè)結(jié)果的準(zhǔn)確性。近紅外光譜分析技術(shù)作為最近幾年發(fā)展起來的一種快速無損檢測(cè)手段,因其簡單,非破壞性等優(yōu)點(diǎn),已經(jīng)被廣泛應(yīng)用于農(nóng)產(chǎn)品檢測(cè)領(lǐng)域。對(duì)近紅外光譜數(shù)據(jù)采用主成分分析法統(tǒng)計(jì)(PCA),對(duì)主成分進(jìn)行加權(quán)求和得最終評(píng)價(jià)值,權(quán)數(shù)為每個(gè)主成分的方差貢獻(xiàn)率。線性判別分析(LDA)是一種經(jīng)典的分類特征提取方法,目前已經(jīng)在近紅外光譜數(shù)據(jù)分析領(lǐng)域得到了廣泛應(yīng)用,其基本思想為尋找一組最優(yōu)鑒別矢量,使投影后的特征向量能夠獲得最佳的分離表示。在LDA基礎(chǔ)上,為了進(jìn)一步獲得非相關(guān)的特征向量,Jin Zhong等提出了非相關(guān)判別分析(ULDA)。然而,不管是經(jīng)典LDA還是ULDA特征提取方法,在實(shí)際應(yīng)用中都會(huì)面臨小樣本問題。另外,非相關(guān)判別分析(ULDA)可以提取近紅外光譜數(shù)據(jù)的特征,但是,存在這些特征如何選擇的問題,而這個(gè)問題ULDA是無法解決的。Kearns和Valiant引入了弱學(xué)習(xí)和強(qiáng)學(xué)習(xí)的概念。對(duì)于一個(gè)弱學(xué)習(xí)模型,它降低了學(xué)習(xí)者能夠取得隨機(jī)高準(zhǔn)確度的要求,一個(gè)弱學(xué)習(xí)算法只需要提出一個(gè)比隨機(jī)猜測(cè)性能略好的假設(shè)即可。在學(xué)習(xí)概念時(shí),只需找到一個(gè)比隨機(jī)猜測(cè)略好的弱學(xué)習(xí)算法,就可以將其提升為強(qiáng)學(xué)習(xí)算法,而不必直接去找通常情況下很難獲得的強(qiáng)學(xué)習(xí)算法。1990年,Schapire通過一個(gè)構(gòu)造性方法證明多個(gè)弱分類器可以集成為一個(gè)強(qiáng)分類器,集成學(xué)習(xí)的理論基礎(chǔ)形成。此后,F(xiàn)reund在1991年又提出了更有效的“boost bymajority”算法。兩個(gè)算法都是通過多次調(diào)用給定的弱學(xué)習(xí)算法,每次提供給它一個(gè)不同的分布,最后把提出的所有假設(shè)合并成一個(gè)單一的假設(shè)。但是這兩個(gè)算法在解決實(shí)際問題時(shí)都存在一個(gè)重大的缺陷,就是都必須事先知道弱學(xué)習(xí)算法學(xué)習(xí)正確率的下限,這在實(shí)際中很難做到。隨后,F(xiàn)reund和Schapire提出了自適應(yīng)提升(AdaBoost)算法,自適應(yīng)提升算法最后結(jié)果的準(zhǔn)確度依賴于弱學(xué)習(xí)算法返回的所有假設(shè),而不是只依賴于準(zhǔn)確率最低的那個(gè)假設(shè),因此可以全面開發(fā)弱學(xué)習(xí)的能力。自適應(yīng)提升算法提出后在機(jī)器學(xué)習(xí)領(lǐng)域得到極大的關(guān)注,試驗(yàn)結(jié)果顯示自適應(yīng)提升算法能顯著提高學(xué)習(xí)精度。但是最近的研究也表明,自適應(yīng)提升算法存在某些缺陷,例如它對(duì)噪聲非常敏感。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種將自適應(yīng)提升法(Adaboost)和非相關(guān)判別分析(ULDA)相結(jié)合,利用自適應(yīng)提升法能解決小樣本問題和非相關(guān)判別分析能解決特征選擇問題,用自適應(yīng)提升法進(jìn)行多輪迭代訓(xùn)練,從而得到多個(gè)非相關(guān)判別分析特征提取器,最終采用加權(quán)投票方式重新構(gòu)造了一個(gè)強(qiáng)分類器,用該強(qiáng)分類器實(shí)現(xiàn)豬肉貯藏時(shí)間的判定。本發(fā)明采用的技術(shù)方案包括以下步驟
(1)采集待測(cè)試的近紅外樣本,將樣本數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,初始化所有訓(xùn)練集權(quán)
值;
(2)利用獲得的初始訓(xùn)練集,進(jìn)行自適應(yīng)提升法迭代計(jì)算,自適應(yīng)提升法的每一次迭代過程中,將產(chǎn)生的訓(xùn)練子集映射到非相關(guān)判別分析的特征子空間,其弱分類器由非相關(guān)判別分析特征子空間的最近鄰分類器得到,根據(jù)弱分類器產(chǎn)生的加權(quán)分類誤差更新訓(xùn)練樣本集,從而產(chǎn)生新一輪特征投影向量; (3)對(duì)新一輪特征投影向量通過投票方式產(chǎn)生一個(gè)聯(lián)合特征子空間,構(gòu)造強(qiáng)分類器;
(4)用強(qiáng)分類器進(jìn)行豬肉貯藏時(shí)間的判定。本發(fā)明方法簡單,對(duì)噪聲不敏感,能有效解決非相關(guān)判別分析的小樣本問題和特征選擇問題,具有檢測(cè)速度快,判定準(zhǔn)確率高等優(yōu)點(diǎn),不僅適用于豬肉貯藏時(shí)間的判定,也適用于其他農(nóng)產(chǎn)品和食品近紅外光譜的定性分析。


下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)說明。圖1是67塊豬肉樣品6天的近紅外光譜;
圖2是采用PCA+LDA、ULDA、Adaboost+ULDA、Adaboost+LDA四種特征提取方法的豬肉貯藏時(shí)間的識(shí)別率。
具體實(shí)施例方式本發(fā)明具體實(shí)施步驟如下
步驟一,采集待測(cè)試的近紅外樣本集,初始化每個(gè)樣本的權(quán)值。用保鮮袋將67塊豬肉樣品包裝保存于(Γ 4°C的冰箱內(nèi),在之后的6天時(shí)間里,每隔24小時(shí)進(jìn)行一次近紅外光譜采集,采集過程盡量保持室內(nèi)的溫度和濕度基本一致。采用反射積分球模式采集近紅外光譜,近紅外光譜分析儀掃描每個(gè)樣品32次以獲取樣品的漫反射光譜均值。光譜掃描的波數(shù)為lOOOOlOOOcm—1,掃描間隔為3. 856cm—1,采集到每塊豬肉樣品的光譜是1557維的數(shù)據(jù)。67塊豬肉樣品6天的近紅外光譜如圖1所示。為減少誤差,在6天的采集過程中,每塊豬肉樣本每天采樣三次,然后取其平均值作為最終豬肉近紅外數(shù)據(jù),則每天可獲得67個(gè)光譜樣本數(shù)據(jù)作為I個(gè)類別的樣本數(shù)據(jù),這樣,可得到6個(gè)類別總共402個(gè)樣本數(shù)據(jù)。將6個(gè)類別的樣本數(shù)據(jù)拆分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集樣本數(shù)為270個(gè)豬肉近紅外數(shù)據(jù),即每天45個(gè)樣本;測(cè)試集樣本數(shù)為132個(gè)豬肉近紅外數(shù)據(jù),即每天22個(gè)樣本。(2)初始化所有樣本訓(xùn)練集(訓(xùn)練集樣本數(shù)為270個(gè)豬肉近紅外數(shù)據(jù))權(quán)值 = = ,其中/ = 270為樣本集數(shù)量。
R步驟二,利用獲得的初始訓(xùn)練集,將結(jié)合Adaboost進(jìn)行自適應(yīng)的ULDA特征提取過程。定義弱分類器為ULDA投影向量和最近鄰分類器的結(jié)合。也就是說,對(duì)于每個(gè)訓(xùn)練樣本,將其投影到ULDA特征向量對(duì)于的特征子空間中,然后根據(jù)其最近鄰訓(xùn)練樣本的類別來確定其分類結(jié)果。因此,每一輪得到的ULDA投影向量可以作為候選弱分類器輸入AdaBoost算法。對(duì)于AdBoost算法的每一輪迭代,每個(gè)弱分類器的分類誤差等于被其錯(cuò)分的樣本權(quán)重之和。算法將根據(jù)分類誤差更新新一輪樣本的權(quán)重,產(chǎn)生新的子集S,并構(gòu)造新的ULDA特征子空間。(I)通過自舉獲得一個(gè)新的樣本數(shù)量為=270的子訓(xùn)練集。對(duì)予給定的尺寸η的初始訓(xùn)練樣本集,為了獲得一個(gè)尺寸為的自舉訓(xùn)練集,我們進(jìn)行次隨機(jī)采樣。每次隨機(jī)采樣中將根據(jù)《個(gè)樣本的權(quán)值分布產(chǎn)生一個(gè)隨機(jī)樣本,然后將該樣本加入到子訓(xùn)練集中。(2)對(duì)于一組子訓(xùn)練集,令樣本矩陣A= (A1, k2." · · kk},Ai是第i類子訓(xùn)練樣本集,
左為類別數(shù),左=6。Sw , Ss, S,分別為子訓(xùn)練樣本集的類內(nèi)方差矩陣,類間方差矩陣和總體方差矩陣
權(quán)利要求
1.一種自適應(yīng)提升法和非相關(guān)判別分析的豬肉貯藏時(shí)間判定方法,其特征是具有如下步驟 (I)采集待測(cè)試的近紅外樣本,將樣本數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,初始化所有訓(xùn)練集權(quán)值; (2)利用獲得的初始訓(xùn)練集進(jìn)行自適應(yīng)提升法迭代計(jì)算,自適應(yīng)提升法的每一次迭代過程中,將產(chǎn)生的訓(xùn)練子集映射到非相關(guān)判別分析的特征子空間,其弱分類器由非相關(guān)判別分析特征子空間的最近鄰分類器得到,根據(jù)弱分類器產(chǎn)生的加權(quán)分類誤差更新訓(xùn)練樣本集,產(chǎn)生新一輪特征投影向量; (3)對(duì)新一輪特征投影向量通過投票方式產(chǎn)生聯(lián)合特征子空間,構(gòu)造強(qiáng)分類器; (4)用強(qiáng)分類器進(jìn)行豬肉貯藏時(shí)間的判定。
2.根據(jù)權(quán)利要求1所述的自適應(yīng)提升法和非相關(guān)判別分析的豬肉貯藏時(shí)間判定方法,其特征是步驟(2)具體如下 1)通過自舉獲得個(gè)新的樣本數(shù)量為《的子訓(xùn)練樣本集; 2)令樣本矩陣A=隊(duì),
3.根據(jù)權(quán)利要求1所述的自適應(yīng)提升法和非相關(guān)判別分析的豬肉貯藏時(shí)間判定方法,其特征是步驟(3)中將T個(gè)基于非相關(guān)判別分析特征提取的弱分類器組合產(chǎn)生最終的決 策函數(shù)IfClC) == JT)],迭代T輪后得到了 T個(gè)不同的非相關(guān)判別分析特征提取器,用%作為成員分類器的投票權(quán)值得到強(qiáng)分類器。
全文摘要
本發(fā)明公開一種自適應(yīng)提升法和非相關(guān)判別分析的豬肉貯藏時(shí)間判定方法,采集待測(cè)試的近紅外樣本,將樣本數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,初始化所有訓(xùn)練集權(quán)值;利用獲得的初始訓(xùn)練集進(jìn)行自適應(yīng)提升法迭代計(jì)算,每一次迭代過程中,將產(chǎn)生的訓(xùn)練子集映射到非相關(guān)判別分析的特征子空間,其弱分類器由非相關(guān)判別分析特征子空間的最近鄰分類器得到,根據(jù)弱分類器產(chǎn)生的加權(quán)分類誤差更新訓(xùn)練樣本集,產(chǎn)生新一輪特征投影向量;通過投票方式產(chǎn)生聯(lián)合特征子空間,構(gòu)造強(qiáng)分類器;用強(qiáng)分類器進(jìn)行豬肉貯藏時(shí)間的判定;將自適應(yīng)提升法和非相關(guān)判別分析相結(jié)合,有效解決非相關(guān)判別分析的小樣本問題和特征選擇問題,具有檢測(cè)速度快,判定準(zhǔn)確率高等優(yōu)點(diǎn)。
文檔編號(hào)G06K9/62GK102999765SQ20121044408
公開日2013年3月27日 申請(qǐng)日期2012年11月9日 優(yōu)先權(quán)日2012年11月9日
發(fā)明者武小紅, 孫俊, 唐凱, 武斌 申請(qǐng)人:江蘇大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1