一種基于svm的食物分類識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于物聯(lián)網(wǎng)技術(shù)領(lǐng)域,涉及一種基于支持向量機(jī)(SVM)的食物分類識別方 法,本發(fā)明的目的在于使用該技術(shù)解決現(xiàn)實(shí)生活中食物攝入量測量的問題。
【背景技術(shù)】
[0002] 隨著生活質(zhì)量和水平的不斷提升,年輕人中肥胖病患者的數(shù)量逐步增長是一個巨 大的問題。不幸的是,這種持續(xù)的增長趨勢導(dǎo)致2型糖尿病病人的數(shù)量也持續(xù)增長。在2008 年,肥胖癥患者占世界成人人口的十分之一,而在2012年這個數(shù)字已增長到六分之一,并 且還在以驚人的速度增長。最近的研宄表明,肥胖的人更可能產(chǎn)生嚴(yán)重的健康疾病,如高血 壓、心臟病、2型糖尿病、高血脂、乳腺癌、結(jié)腸癌和呼吸疾病等。肥胖癥的主要原因是食物和 能量的攝入與消耗之間的不平衡。所以,為了用健康的方式減肥并且維持正常人的健康體 重,必須每天測量食物攝取量。事實(shí)上,所有現(xiàn)有的肥胖癥治療技術(shù)要求病人每天記錄食物 的攝入量來對比能量的攝入和消耗。
[0003] 膳食攝入量,即定義某人每天吃什么。膳食攝入量可以為增加干預(yù)方案提供寶貴 意見,從而能夠預(yù)防許多疾病。在營養(yǎng)和健康領(lǐng)域,精確測量膳食攝入量是開放的研宄課 題。通過引入一個新的半自動膳食評估裝置,它有助于營養(yǎng)師監(jiān)測每日營養(yǎng)攝入量。要做 到這一點(diǎn),在食物識別裝置的不同步驟中已經(jīng)采用了各種圖像處理技術(shù)。在肥胖癥患者的 移動設(shè)備上使用這種食物識別裝置,任何人都可以監(jiān)控他/她的食物的攝入量。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是提供涉及一種基于SVM的食物分類識別方法。
[0005] 上述的目的通過以下的技術(shù)方案實(shí)現(xiàn): 考慮到在年輕人群中移動設(shè)備(例如智能手機(jī)和平板電腦)的普及,并且這些通信設(shè)備 普遍存在,它們可以加載飲食相關(guān)的應(yīng)用模塊,例如我們的食物識別模塊。本發(fā)明的目的在 于使用該技術(shù)解決現(xiàn)實(shí)生活中食物攝入量測量的問題。當(dāng)前這一領(lǐng)域的研宄可以分為三 類,即臨床研宄、輔助研宄和半自動化方法研宄。在如24小時膳食回顧(24HR)和食物頻率 問卷這類臨床研宄中,其數(shù)據(jù)是由患者手工記錄,之后再計(jì)算卡路里攝入量。由于這些方法 的數(shù)據(jù)是手工記錄,因此在整個記錄過程中可能產(chǎn)生大量的錯誤。這些方法的另一個缺點(diǎn) 是病人很難將記錄應(yīng)用于治療。最近,一些研宄人員研宄半自動化的方法。本發(fā)明將設(shè)計(jì)開 發(fā)一個簡單而實(shí)用的半自動化的應(yīng)用模塊,人們可以使用應(yīng)用模塊進(jìn)行交互。此外,在這種 情況下,通過使用模塊化的方法來增加如智能手機(jī)這類移動設(shè)備的使用機(jī)會。使用移動設(shè) 備作為用戶接口,并且通過網(wǎng)絡(luò)將自己的食物圖像數(shù)據(jù)發(fā)送給專家來計(jì)算卡路里攝入量。 移動應(yīng)用模塊提供了一個獨(dú)特的機(jī)制來收集飲食信息,由此可降低飲食記錄者的負(fù)擔(dān)。
[0006] 在早期階段,用戶用移動設(shè)備拍攝圖像,隨后進(jìn)行預(yù)處理步驟。然后,在分割步驟 中對每個圖像進(jìn)行分析并提取出各個食物部分。眾所周知,若非具有良好的圖像分割機(jī)制, 該裝置則不能夠適當(dāng)?shù)靥幚韴D像。因此,本發(fā)明將這個步驟分解成了更多的步驟。為此, 我們使用了顏色分割、K均值聚類和紋理分割工具。對于每個檢測到的食品部分,特征提取 過程必須被執(zhí)行。對于每個檢測到的食物圖像,必須執(zhí)行特征提取步驟。在這一步驟中將 會提取出食物的各種屬性,如大小、形狀、顏色和紋理。所提取的特征將被發(fā)送到分類步驟, 分類步驟使用SVM方案將食物識別出來。最后,通過估計(jì)食物部分的面積,并參照營養(yǎng)表, 計(jì)算出食物中卡路里的含量。其中,食物分類識別,本發(fā)明采用了SVM方法,具體如下: 1、 特征的提取和分類 通過使用四種特征的框架,包括顏色、紋理、尺寸和形狀。對于顏色特征,使用了邊緣檢 測和顏色K-均值聚類。對于紋理特征,使用伽柏濾波器。為了尺寸和形狀特征,使用了的 邊緣檢測技術(shù)和圖像的感興趣區(qū)域像素計(jì)算技術(shù)。下一步驟是對提取出的特征進(jìn)行分類, 以便于識別每種食物。SVM算法它是用于數(shù)據(jù)分類的流行技術(shù)之一。一個分類任務(wù)通常包 括訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),數(shù)據(jù)由一些實(shí)例組成。訓(xùn)練數(shù)據(jù)中的每個實(shí)例都包含一個類標(biāo)簽 和幾個特征。SVM的目標(biāo)是構(gòu)架一個模型,該模型能夠僅通過測試數(shù)據(jù)中數(shù)據(jù)實(shí)例的屬性預(yù) 測出該實(shí)例的目標(biāo)值。
[0007] 為了提高準(zhǔn)確性,在SVM模塊已確定每種食物類型后,該裝置與用戶進(jìn)行交互來 驗(yàn)證食物種類。裝置可以對用戶顯示出食物的圖像并注解出裝置認(rèn)為的食物類型,如雞 肉、肉、蔬菜等。然后,用戶可以確認(rèn)或改變食物的類型。雖然這種改變使裝置從自動化 變?yōu)榘胱詣踊?,然而它會增加裝置的準(zhǔn)確度。
[0008] 本模型中使用RBF核,它以非線形方式在更高維度空間映射樣本。與線性核不同, RBF核非常適合于類標(biāo)記和屬性是非線性的情況。
[0009] 在本發(fā)明中,SVM的特征向量包含五個紋理特征、十個顏色特征、三個形狀特征和 六個大小特征。在分割階段提取出各種食物的特征向量,然后成為SVM的訓(xùn)練向量。 2、 支持向量機(jī)訓(xùn)練階段 在使用本食物識別系統(tǒng)的SVM之前,要進(jìn)行一次訓(xùn)練階段,這是為了產(chǎn)生SVM模型。圖 1為實(shí)現(xiàn)的訓(xùn)練階段的框圖。如該圖所示,每種食物的一系列不同的特征是這個階段的輸 入。應(yīng)注意的是,為了提供系統(tǒng)最好的輸出,食物的名稱應(yīng)作為輸入傳入系統(tǒng)。這個階段 的輸出是SVM模型。
[0010] 3、分類 當(dāng)對食物圖像完成分割和提取特征操作,下一個步驟是使用統(tǒng)計(jì)模式識別技術(shù)確定食 物種類。分類器被用于各種模式識別和機(jī)器學(xué)習(xí)方面,應(yīng)用范圍從自動語音識別到人臉識 另IJ。識別過程主要包括兩個步驟。在訓(xùn)練階段,模型被當(dāng)作訓(xùn)練數(shù)據(jù)學(xué)習(xí)。該模型是分類 器未使用過的數(shù)據(jù),從而在測試階段可以對模型的精度進(jìn)行評估。通過訓(xùn)練,分類器學(xué)習(xí) 如何將特征映射到各種類別或標(biāo)記。但是,訓(xùn)練是不完美的,分類器在實(shí)際操作中會出錯, 將一個錯誤的標(biāo)記分配給觀察到的特征矢量。
[0011] 訓(xùn)練分類器有兩個目標(biāo)。一個目標(biāo)是定義如何給觀察到的特征矢量分配標(biāo)記,而 另一個是估計(jì)其性能誤差或分類精度。支持向量機(jī)是一組用于分類和回歸的可管理的學(xué)習(xí) 方法。它們屬于一個系列的球狀線性分類器。換句話說,支持向量機(jī)是一種分類和回歸裝 置,它使用機(jī)器學(xué)習(xí)理論來最大化預(yù)測精度,可以自動整合數(shù)據(jù)到最佳的類別。支持向量機(jī) 可以被定義為在一個高維度特征空間中使用線性函數(shù)假設(shè)空間的系統(tǒng)。
[0012] SVM給出相同的任務(wù)中與神經(jīng)網(wǎng)絡(luò)方法相比更準(zhǔn)確的結(jié)果。它也被用于許多應(yīng) 用,如人臉分析和語音識別,特別是基于模式分類和回歸的應(yīng)用。支持向量機(jī)過去用于解決 分類問題,但最近,它們也已經(jīng)擴(kuò)展到應(yīng)用于解決回歸問題。
[0013] 4、支持向量機(jī)解釋 神經(jīng)網(wǎng)絡(luò)技術(shù)是用于監(jiān)督和無監(jiān)督的學(xué)習(xí)應(yīng)用識別方法之一,它具有良好的效果。一 種神經(jīng)網(wǎng)絡(luò)算法是多層感知器(MLP)算法。MLP采用前饋網(wǎng)絡(luò)和循環(huán)網(wǎng)絡(luò)。該算法包括連 續(xù)非線性函數(shù)的泛逼近能力和輸入輸出模式學(xué)習(xí)。
[0014] 圖2為簡單神經(jīng)網(wǎng)絡(luò)和多層感知器的行為圖。
[0015] 但MLP也有一些問題,因此鼓勵人們發(fā)現(xiàn)并使用其他方法。首先,神經(jīng)網(wǎng)絡(luò)有許多 局部極小值并且很難得到神經(jīng)元的數(shù)目,因此需要測試其他的學(xué)習(xí)方法。此外,即使使用 的神經(jīng)網(wǎng)絡(luò)解決方案有一種傾向性和收斂性,但它不是一個唯一的解決方案。在神經(jīng)網(wǎng)絡(luò) 的方法中,通過嘗試和測試以找出最佳的解決方案,所以實(shí)時性不夠好。
[0016] 許多線性分類器(超平面)可以對數(shù)據(jù)進(jìn)行分離。如果用一個線性超平面去分類數(shù) 據(jù),可能最終得出一組局部最小值而不是全局最小值的數(shù)據(jù)集。因此,可以推出最大間隔分 類器。
[0017] 圖3為最大間隔分類器線性SVM圖。
[0018] 在線性SVM中,最大間隔會被用到。在這里可能會出現(xiàn)的一個問題是為什么要用 最大間隔?其中一個原因是,即使在邊界的位置產(chǎn)生了一個小的誤差,使用最大間隔也可 以將錯誤分類的幾率降到最小。另一個原因是避免了局部極小并最終得到一個更好的分 類。
[0019]SVM的目標(biāo)是用超平面來分離數(shù)據(jù)以及使用核技巧延伸到非線性界限。計(jì)算SVM 的目標(biāo)是要對所有的數(shù)據(jù)進(jìn)行正確的分類。對于數(shù)學(xué)計(jì)算,我們有如下公式。
【主權(quán)項(xiàng)】
1. 一種基于SVM的食物分類識別方法,其組成包括:攝像頭,裝載識別和分析算法的 DSP芯片,無線傳輸模塊,USB接口設(shè)備組成,設(shè)計(jì)實(shí)現(xiàn)了一種基于SVM的食物分類識別方 法。
2. 根據(jù)權(quán)利要求1所述,一種基于SVM的食物分類識別方法,通過使用四種特征的框 架,包括顏色、紋理、尺寸和形狀;對于顏色特征,使用了邊緣檢測和顏色K-均值聚類;對于 紋理特征,使用伽柏濾波器;為了尺寸和形狀特征,使用了的邊緣檢測技術(shù)和圖像的感興趣 區(qū)域像素計(jì)算技術(shù);下一步驟是對提取出的特征進(jìn)行分類,以便于識別每種食物;一個分 類任務(wù)通常包括訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),數(shù)據(jù)由一些實(shí)例組成;SVM的目標(biāo)是構(gòu)架一個模型, 該模型能夠僅通過測試數(shù)據(jù)中數(shù)據(jù)實(shí)例的屬性預(yù)測出該實(shí)例的目標(biāo)值。
3. 根據(jù)權(quán)利要求1和2所述,為了提高準(zhǔn)確性,在SVM模塊已確定每種食物類型后,該 裝置與用戶進(jìn)行交互來驗(yàn)證食物種類;裝置可以對用戶顯示出食物的圖像并注解出裝置認(rèn) 為的食物類型,如雞肉、肉、蔬菜等;然后,用戶可以確認(rèn)或改變食物的類型;雖然這種改變 使裝置從自動化變?yōu)榘胱詣踊?,然而它會增加裝置的準(zhǔn)確度。
4. 根據(jù)權(quán)利要求1和2、3所述,本模型中使用RBF核,它以非線形方式在更高維度空 間映射樣本;與線性核不同,RBF核非常適合于類標(biāo)記和屬性是非線性的情況;RBF核有 C和兩個參數(shù);這一步的目標(biāo)是找到C和,?/的最佳值,以使分類器能夠準(zhǔn)確預(yù)測未知的 數(shù)據(jù)(即測試數(shù)據(jù));分類器的一個常見的策略是將數(shù)據(jù)集分成兩部分,其中一部分被認(rèn)為 是未知的;從未知組獲得的預(yù)測精度能夠更精確的反映出分類器對一個獨(dú)立的數(shù)據(jù)集進(jìn)行 分類的性能;此過程的一個改進(jìn)版本被稱為交叉驗(yàn)證;使用交叉驗(yàn)證的優(yōu)點(diǎn)在于防止過擬 合問題;一個找到C和7的很好的方式是使用"網(wǎng)格搜索";在本發(fā)明中,SVM的特征向量包 含五個紋理特征、十個顏色特征、三個形狀特征和六個大小特征;在分割階段提取出各種食 物的特征向量,然后成為SVM的訓(xùn)練向量。
【專利摘要】用戶啟動移動終端自帶的攝像機(jī)將要吃的食物進(jìn)行錄制,吃完食物后,對剩余食物還要進(jìn)行去除,通過內(nèi)部算法芯片模塊對使用者的食物進(jìn)行分析,再通過設(shè)備的顯示終端顯示出來,并可智能選擇和專家判斷的模式對吃掉的卡路里進(jìn)行綜合測評。通過采用改進(jìn)的SVM,提高了復(fù)雜條件下的食物識別效果。移動應(yīng)用模塊提供了一個獨(dú)特的機(jī)制來收集飲食信息,由此可降低飲食記錄者的負(fù)擔(dān)。對糖尿病患者也可以起到輔助和提醒的作用。設(shè)備小巧,易于攜帶,方便使用,隨時隨地都可用。未來社會,將是一個智慧化城市時代,很多勞作都可以用智能機(jī)器去取代。該產(chǎn)品的研發(fā),將引起一場新的變革。
【IPC分類】G06K9-62
【公開號】CN104809472
【申請?zhí)枴緾N201510217604
【發(fā)明人】王燕清, 王一璞, 石朝俠
【申請人】哈爾濱理工大學(xué)
【公開日】2015年7月29日
【申請日】2015年5月4日