一種基于關(guān)聯(lián)規(guī)則挖掘的食品安全實時預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及到食品的安全領(lǐng)域,具體的說是一種基于關(guān)聯(lián)規(guī)則挖掘的食品安全實 時預(yù)測方法。
【背景技術(shù)】
[0002] 食品安全溯源系統(tǒng)最早是1997年歐盟為應(yīng)對"瘋牛病"問題而逐步建立并完善起 來。它強調(diào)產(chǎn)品的唯一標(biāo)識和過程追蹤,在產(chǎn)品的生產(chǎn)、運輸、存儲、銷售等各個環(huán)節(jié),實行 IS09001等質(zhì)量控制方法進行跟蹤與追溯,一旦發(fā)生食品安全問題,可以有效地追蹤到食品 的去向,及時召回不合格產(chǎn)品,將損失降到最低。
[0003] 現(xiàn)有的食品安全溯源系統(tǒng)功能單一,食品溯源應(yīng)用只能完成對食品及其原料本身 相關(guān)數(shù)據(jù)的收集,以及一些直觀的簡單追溯和信息統(tǒng)計等應(yīng)用。例如,一塊市場出售的豬肉 發(fā)現(xiàn)微生物污染或攜帶有某種病菌,現(xiàn)有的追溯系統(tǒng)可以追查出該塊豬肉來自哪里,但并 不能解釋微生物污染或出現(xiàn)病菌的原因,更不能預(yù)測與該塊豬肉同批次的其它豬肉是否也 存在問題,也無法預(yù)測以豬肉為原料加工的其他食品是否也存在安全問題。豬肉的微生物 污染或攜帶的病菌可能發(fā)生在養(yǎng)殖場、屠宰車間、運輸過程、銷售環(huán)節(jié)等,在此過程中,豬肉 在不同環(huán)節(jié)出現(xiàn)事故對其他食品的影響程度也不一樣?,F(xiàn)有系統(tǒng)無法將與問題食品相關(guān)的 其他食品進行關(guān)聯(lián),更無法預(yù)測其他食品的安全程度。
[0004] 關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘技術(shù)中的一個重要的方向,由Agrawal R.等人首先提 出。最初是為了從交易數(shù)據(jù)庫中發(fā)現(xiàn)數(shù)據(jù)屬性間的聯(lián)系,它的一個典型的應(yīng)用是購物籃分 析。關(guān)聯(lián)規(guī)則挖掘能夠從大量的數(shù)據(jù)中挖掘出有價值的、描述數(shù)據(jù)中屬性之間的相關(guān)聯(lián)系 的知識。
[0005] 由于食品安全檢測數(shù)據(jù)之間有時序關(guān)聯(lián)、因果關(guān)聯(lián)等關(guān)系,所以采用基于關(guān)聯(lián)規(guī) 則挖掘的數(shù)據(jù)挖掘方法。基于關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)挖掘方法,能夠發(fā)現(xiàn)與問題食品相關(guān)的 滿足最小支持度和最小置信度的其他食品。
【發(fā)明內(nèi)容】
[0006] 為了解決現(xiàn)有技術(shù)中食品安全追溯系統(tǒng)不能根據(jù)問題食品的安全性對與之相關(guān) 的其他食品的安全性進行預(yù)測的問題,本發(fā)明提供了一種基于關(guān)聯(lián)規(guī)則挖掘的食品安全實 時預(yù)測方法,可以對系統(tǒng)數(shù)據(jù)庫中的食品安全信息進行實時監(jiān)測、分析、評估,對風(fēng)險因子 的危害程度進行不斷更新,然后根據(jù)衡量食品風(fēng)險的指標(biāo)體系實時預(yù)測食品的風(fēng)險系數(shù), 以圖形和數(shù)字的方式直觀的顯示出來。
[0007] 本發(fā)明為解決上述技術(shù)問題所采用的技術(shù)方案為:一種基于關(guān)聯(lián)規(guī)則挖掘的食品 安全實時預(yù)測方法,包括以下步驟: 1) 收集各種食品的生產(chǎn)流通的安全信息,并將這些信息錄入到系統(tǒng)數(shù)據(jù)庫中; 2) 通過關(guān)聯(lián)規(guī)則挖掘找出與問題食品相關(guān)聯(lián)的食品; 3) 計算相關(guān)食品的風(fēng)險值; 4)根據(jù)計算得到的風(fēng)險值判斷該項食品是否安全,并將信息錄入到系統(tǒng)數(shù)據(jù)庫中。
[0008] 所述步驟2)中通過關(guān)聯(lián)規(guī)則挖掘找出與問題食品相關(guān)聯(lián)的食品分為三個步驟,第 一步找出所有滿足支持度的頻繁集,第二步使用頻繁集生成關(guān)聯(lián)規(guī)則,第三步通過關(guān)聯(lián)規(guī) 則找出滿足最小支持度和可信度的與問題食品相關(guān)的其他食品;具體操作如下: 利用廣度優(yōu)先算法Apriori對系統(tǒng)數(shù)據(jù)庫進行逐層搜索,即利用K-項集探索 (K+1)-項集,找出頻繁1-項集的集合,將該集合記作::|£,用于找頻繁2-項集的集合 ,面美:用于找·,依此類推,直到不能找到頻繁k-項集: 設(shè)淀
是由m個不同的數(shù)據(jù)項目組成的集合,其中元素稱為項,項 的集合稱為項集; 給定一個事務(wù)數(shù)據(jù)庫
,其中每一個事物T是項集I的一個子集, 即?/; _||為D中的總事務(wù)數(shù),X、Y都是T中的項或項集,; 如果事務(wù)T同時包含X和Υ,那么就可以得到關(guān)聯(lián)規(guī)則:
式中,Sg &為滿足條件的事務(wù)T在事務(wù)數(shù)據(jù)庫D中所占的比例,即支持度Support,計 算公式如下:
_絲為D中包含X的事務(wù)中又包含Y的比例,即置信度Confidence,計算公式如下:
根據(jù)公式(2)和公式(3)計算出滿足最小支持度和可信度的與問題食品相關(guān)的其他食 品D
[0009] 所述步驟3)中計算相關(guān)食品的風(fēng)險值的具體操作如下: 首先,將影響食品安全性的風(fēng)險因子分為內(nèi)部因子g.、外部因子1?和附加因 子,分別計算內(nèi)部因子丨、外部因子Ig和附加因子:的權(quán)重,、和g,且
其中,內(nèi)部因子:?的權(quán)重為
其次,分別計算內(nèi)部因子_、外部因子_和附加因子務(wù)的風(fēng)險系數(shù)矣、式i、JI4 ; 其中,內(nèi)部因子麗.的風(fēng)險系數(shù)裹為 ' .-.:.:-i'
式中,f表示第#種配料,Jk表示第I種配料的風(fēng)險值,·為:邏^的權(quán)重,且 外部因子的風(fēng)險系數(shù)為
分別表示食品的 生產(chǎn)、運輸、存儲、銷售環(huán)境的風(fēng)險值,外部因子風(fēng)險值和權(quán)重的計算方法與食品配料風(fēng)險 值和權(quán)重的計算方法類似,采用加權(quán)和的方法;在本發(fā)明中,最后一級風(fēng)險值,即食品風(fēng)險 指標(biāo)體系中有害物的風(fēng)險值,是由食品領(lǐng)域的專家根據(jù)食品有害物的危害程度評估出來 的,包括企業(yè)信譽和消費者反饋所代表的風(fēng)險值。其余各階段的風(fēng)險值是由它下一級的風(fēng) 險值和風(fēng)險因子的權(quán)重計算出來的,每一階段的權(quán)重策在實施例中都已給出計算公式。
[0010] 附加因子#3的風(fēng)險系數(shù)ft:為
式中,藏」表示食品生產(chǎn)企業(yè)的信譽風(fēng)險值,議表示消費者反饋反映出的風(fēng)險值, ,::、:、_、_&的值由食品領(lǐng)域?qū)<揖C合評估設(shè)定; 最后,根據(jù)公式i?二%為+%計算該食品的風(fēng)險值,式中,, 仏分別表示內(nèi)部因子、外部因子、附加因子的風(fēng)險系數(shù),,+?滅__€。
[0011] 本發(fā)明的思路為:當(dāng)某種食品出現(xiàn)安全問題時,首先,使用基于關(guān)聯(lián)規(guī)則的挖掘方 法找出與問題食品相關(guān)的其他食品以及它們之間的相關(guān)度,然后依據(jù)食品風(fēng)險指標(biāo)體系度 量影響這些相關(guān)食品的風(fēng)險因子的權(quán)重值和風(fēng)險系數(shù),最后根據(jù)風(fēng)險因子的權(quán)重值和風(fēng)險 因子的風(fēng)險系數(shù)計算出相關(guān)食品的風(fēng)險值。如果在對食品的某個風(fēng)險指標(biāo)進行度量時,發(fā) 現(xiàn)其超出正常范圍,則直接將該食品定為高風(fēng)險食品。在整個過程中,風(fēng)險因子的權(quán)重和風(fēng) 險系數(shù)在使用前都要重新度量,并將最新值更新到數(shù)據(jù)庫中。
[0012] 由于影響食品安全的因素繁多,所以食品風(fēng)險指標(biāo)也有很多,這些指標(biāo)中大部分 可以量化為一個具體的值。影響食品安全的指標(biāo)中有些是食品配料中的有害物質(zhì),有些是 食品在生產(chǎn)、運輸、存儲、銷售過程中所接觸的環(huán)境中的有害物質(zhì),另外,消費者的反饋和生 產(chǎn)企業(yè)的信譽可以從側(cè)面反映食品的安全程度。在這里把所有對食品安全有影響的因子統(tǒng) 稱為稱為有害物。
[0013] 有益效果:本發(fā)明提出了一種基于關(guān)聯(lián)規(guī)則挖掘的食品安全實時預(yù)測方法,它可 以發(fā)現(xiàn)與某問題食品安全性相關(guān)的其他食品,并可以通過度量歷史數(shù)據(jù)庫中導(dǎo)致某食品出 現(xiàn)安全問題的各種風(fēng)險因子的次數(shù),自動調(diào)節(jié)這些影響食品安全的風(fēng)險因子的權(quán)重,從而 計算出所有風(fēng)險因子對某食品的綜合影響,即食品的安全程度,為消費者提供食品安全參 考,為決策者提供決策依據(jù)等。同時,本發(fā)明也可以對系統(tǒng)數(shù)據(jù)庫中的食品安全信息進行實 時監(jiān)測、分析、評估,對風(fēng)險因子的危害程度進行不斷更新,然后根據(jù)衡量食品風(fēng)險的指標(biāo) 體系實時預(yù)測食品的風(fēng)險系數(shù),以圖形和數(shù)字的方式直觀的顯示出來,從而直觀的看出在 某種食品出現(xiàn)問題時,跟其相關(guān)的食品是否存在安全隱患。
【附圖說明】
[0014] 圖1為本發(fā)明實施例中食品風(fēng)險指標(biāo)體系圖; 圖2為實施例中食品風(fēng)險值的計算流程; 圖3為實施例中食品風(fēng)險預(yù)測曲線圖。
【具體實施方式】
[0015] -種基于關(guān)聯(lián)規(guī)則挖掘的食品安全實時預(yù)測方法,包括以下步驟: 1) 收集各種食品的生產(chǎn)流通的安全信息,并將這些信息錄入到系統(tǒng)數(shù)據(jù)庫中; 2) 通過關(guān)聯(lián)規(guī)則挖掘找出與問題食品相關(guān)聯(lián)的食品; 通過關(guān)聯(lián)規(guī)則挖掘找出與問題食品相關(guān)聯(lián)的食品分為三個步驟,第一步找出所有滿足 支持度的頻繁集,第二步使用頻繁集生成關(guān)聯(lián)規(guī)則,第三步通過關(guān)聯(lián)規(guī)則找出滿足最小支 持度和可信度的與問題食品相關(guān)的其他食品;具體操作如下: 利用廣度優(yōu)先算法Apriori對系統(tǒng)數(shù)據(jù)庫進行逐層搜索,即利用K-項集探索 (K+1)-項集,找出頻繁1-項集的集合,將該集合記作用于找頻繁2-項集的集合 :焉:,而:義:用于找%,依此類推,直到不能找到頻繁k-項集: 設(shè)定/= {?.宅X 是由m個不同的數(shù)據(jù)項目組成的集合,其中元素稱為項,項 的集合稱為項集; 給定一個事務(wù)數(shù)據(jù)庫$1||,其中每一個事物T是項集I的一個子集, 即; :戲為D中的總事務(wù)數(shù),X、Y都是T中的項或項集,:馨為參; 如果事務(wù)T同時包含X和Y,那么就可以得到關(guān)聯(lián)規(guī)則:
式中,III為滿足條件的事務(wù)T在事務(wù)數(shù)據(jù)庫D中所占的比例,即支持度Support,計 算公式如下:
_議|為D中包含X的事務(wù)中又包含Y的比例,即置信度Confidence,計算公式如下:
根據(jù)公式(2)和公式(3)計算出滿足最小支持度和可信度的與問題食品相關(guān)的其他食 品; 3)計算相關(guān)食品的風(fēng)險值,具體操作如下: 首先,將影響食品安全性的風(fēng)險因子分為內(nèi)部因子i|、外部因子Il和附加因 子_|,分別計算內(nèi)部因子1||、外部因子1?和附加因子::??的權(quán)重|%、1%和_:,且
其次,分別計算內(nèi)部因子:?、外部因子::|§和附加因子·!的風(fēng)險系數(shù) 其中,內(nèi)部因子:?的風(fēng)險系數(shù).:應(yīng)為 十·' ..2
式中,I表示第/種配料,表示第/種配料的風(fēng)險值,·、.::為的權(quán)重,且 ?:=:|儀爾料不合格次數(shù)..由配料導(dǎo)致食品不合格次數(shù)); 外部因子|3!的風(fēng)險系數(shù):_為
:分別表示食品的 生產(chǎn)、運輸、存儲、銷售環(huán)境的風(fēng)險值,外部因子風(fēng)險值和權(quán)重的計算方法與內(nèi)部因子風(fēng)險 值和權(quán)重的計算方法相同,均采用加權(quán)和的方法計算; 附加因子_的風(fēng)險系數(shù)Ik為
式中,表示食品生產(chǎn)企業(yè)的信譽風(fēng)險值,表示消費者反饋反映出的風(fēng)險值, ;i:;· '>· ' :鐵翁、 .*·. .命: '''-X1 ' 十.' 七 -*<. 最后,根據(jù)公式:
計算該食品的風(fēng)險值,式中, A分別表示內(nèi)部因子、外部因子、附加因子的風(fēng)險系數(shù),驗; 4)根據(jù)計算得到的風(fēng)險值判斷該項食品是否安全,并將信息錄入到系統(tǒng)數(shù)據(jù)庫中。
[0016] 以上為本發(fā)明的基本事實方式,下面結(jié)合具體實施例對本發(fā)明做進一步的闡述。
[0017] 當(dāng)某種食