亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種數(shù)據(jù)異常檢測方法及終端與流程

文檔序號:11216159閱讀:520來源:國知局
一種數(shù)據(jù)異常檢測方法及終端與流程

本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)異常檢測方法及終端。



背景技術(shù):

隨著科技的日益發(fā)展,我們已步入互聯(lián)網(wǎng)時代,而互聯(lián)網(wǎng)時代的主題是分享,互聯(lián)網(wǎng)發(fā)展的趨勢必然是開放模式。在互聯(lián)網(wǎng)時代,一方面企業(yè)需要將其服務(wù)和數(shù)據(jù)資源封裝成一系列計算機易識別的數(shù)據(jù)接口開放出去,供第三方開發(fā)者使用以提升自身服務(wù)和數(shù)據(jù)資源的利用率,實現(xiàn)增值;另一方面,企業(yè)需要通過數(shù)據(jù)接口對接各種互聯(lián)網(wǎng)服務(wù),連接社會化數(shù)據(jù)資源,融入開放數(shù)據(jù)生態(tài)鏈,避免陷入信息孤島,降低數(shù)據(jù)獲取成本。因此讓數(shù)據(jù)資源得到充分整合成為了越來越多企業(yè)的迫切需求,而數(shù)據(jù)接口正是實現(xiàn)數(shù)據(jù)資源整合的關(guān)鍵。通過開放數(shù)據(jù)接口(特別是api接口)的方式,可以對數(shù)據(jù)源和應(yīng)用進行深挖和再加工,以便能夠創(chuàng)造更多的價值。但是由于業(yè)務(wù)調(diào)整、數(shù)據(jù)接口結(jié)構(gòu)變更、網(wǎng)絡(luò)故障等種種原因,導(dǎo)致數(shù)據(jù)接口傳輸?shù)臄?shù)據(jù)發(fā)生數(shù)據(jù)丟失、亂碼、數(shù)據(jù)類型不合標(biāo)準(zhǔn)等數(shù)據(jù)異常。尤其是面向用戶的客戶端展示數(shù)據(jù),數(shù)據(jù)異常會造成相關(guān)功能不能正常實現(xiàn),甚至導(dǎo)致系統(tǒng)出bug,極大地影響用戶體驗。因此,在數(shù)據(jù)交換與共享愈發(fā)普遍的情況下,數(shù)據(jù)的異常檢測也愈發(fā)重要。

現(xiàn)有的對數(shù)據(jù)接口,例如api接口返回的數(shù)據(jù)的異常檢測手段主要包括以下三種:1.通過對表征錯誤代碼的字段進行判斷以及api接口返回的數(shù)據(jù)進行簡單的非空判斷,若符合判斷條件即認(rèn)為該返回數(shù)據(jù)異常;2.利用大量的api接口返回的數(shù)據(jù)作為原始數(shù)據(jù),從中挖掘出有價值的返回字段之間的相關(guān)關(guān)系,并提取相關(guān)關(guān)系的邏輯特征形成關(guān)聯(lián)規(guī)則,并基于這些關(guān)聯(lián)規(guī)則對該api接口返回的數(shù)據(jù)進行異常檢測;3.通過api接口測試時的數(shù)據(jù)作為訓(xùn)練集學(xué)習(xí)返回數(shù)據(jù)的正常態(tài)數(shù)據(jù)模式,同時應(yīng)用自適應(yīng)學(xué)習(xí)的方法提取異常數(shù)據(jù)的特征,然后基于所提取的信息對api接口在線返回數(shù)據(jù)進行檢測,若新數(shù)據(jù)偏離正常態(tài)模式或具有異常特征則認(rèn)為數(shù)據(jù)異常。以上三種數(shù)據(jù)的異常檢測手段的缺點對應(yīng)如下:1.判斷表征錯誤代碼的字段和數(shù)據(jù)非空,只能檢測到基本的數(shù)據(jù)異常情況,檢測條件機械單一,無法檢測出數(shù)據(jù)類型不合要求、數(shù)據(jù)長度超過范圍等復(fù)雜,隱蔽性較強的數(shù)據(jù)異常,檢測效果不如人意;2.需要大量的原始數(shù)據(jù)作數(shù)據(jù)挖掘,且要求api接口返回數(shù)據(jù)的字段之間有較強的關(guān)聯(lián)性,數(shù)據(jù)之間有層次性,否則所獲取的關(guān)聯(lián)規(guī)則可信性不高或者可用的關(guān)聯(lián)規(guī)則較少,導(dǎo)致容易出現(xiàn)誤判情況;3.要求所建立的正常態(tài)數(shù)據(jù)模式有足夠的可信性,但是選擇不同的數(shù)據(jù)作為訓(xùn)練集會得出多種正常態(tài)數(shù)據(jù)模式,難以確定一個標(biāo)準(zhǔn)的正常態(tài)數(shù)據(jù)模式,在數(shù)據(jù)集訓(xùn)練時所需的迭代次數(shù)和閾值設(shè)置過多,對數(shù)據(jù)獲取頻率高的接口檢測效率較低。



技術(shù)實現(xiàn)要素:

本發(fā)明實施例提供一種數(shù)據(jù)異常檢測方法及終端,能夠提高數(shù)據(jù)異常檢測質(zhì)量,提高數(shù)據(jù)的有效性。

一方面,本發(fā)明實施例提供了一種數(shù)據(jù)異常檢測方法,該方法包括:

從數(shù)據(jù)中提取特征字段;

判斷所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果;

根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率;

根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,以及根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率;

計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值;

判斷所述比值是否大于閾值,若是,則判定所述數(shù)據(jù)為異常數(shù)據(jù)。

另一方面,本發(fā)明實施例提供了一種終端,該終端包括:

提取單元,用于從數(shù)據(jù)中提取特征字段;

判斷單元,用于判斷所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果;

獲取單元,用于根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率;

第一計算單元,用于根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,以及根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率;

第二計算單元,用于計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值;

判定單元,用于若所述比值大于閾值,則判定所述數(shù)據(jù)為異常數(shù)據(jù)。

本發(fā)明實施例的數(shù)據(jù)異常檢測方法及終端,通過判斷不同類型的特征字段是否滿足對應(yīng)的劃分標(biāo)準(zhǔn),獲取與對應(yīng)的劃分標(biāo)準(zhǔn)相關(guān)的正常特征概率和異常特征概率,正常特征概率和異常特征概率皆為一數(shù)據(jù)訓(xùn)練集的統(tǒng)計概率,再利用針對該數(shù)據(jù)訓(xùn)練集得到的該類數(shù)據(jù)為正常數(shù)據(jù)的正常統(tǒng)計概率和為異常數(shù)據(jù)的異常統(tǒng)計概率,最后利用這些統(tǒng)概率計算出接口返回的實時數(shù)據(jù)為正常數(shù)據(jù)的正常數(shù)據(jù)概率,以及為異常數(shù)據(jù)的異常數(shù)據(jù)概率,根據(jù)這兩個概率判斷數(shù)據(jù)是否為異常數(shù)據(jù),通過比較數(shù)據(jù)的正常數(shù)據(jù)概率和異常數(shù)據(jù)概率來判斷數(shù)據(jù)是否異常,從而提高數(shù)據(jù)檢測的質(zhì)量和有效性。

附圖說明

為了更清楚地說明本發(fā)明實施例技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1為本發(fā)明實施例提供的一種數(shù)據(jù)異常檢測方法的示意流程圖;

圖2為本發(fā)明實施例提供的一種數(shù)據(jù)異常檢測方法的另一示意流程圖;

圖3為本發(fā)明實施例提供的一種終端的示意流程圖;

圖4為本發(fā)明實施例提供的一種終端的另一示意性框圖;

圖5為本發(fā)明實施例提供的一種終端的結(jié)構(gòu)示意性框圖。

具體實施方式

下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。

應(yīng)當(dāng)理解,當(dāng)在本說明書和所附權(quán)利要求書中使用時,術(shù)語“包括”和“包含”指示所描述特征、整體、步驟、操作、元素和/或組件的存在,但并不排除一個或多個其它特征、整體、步驟、操作、元素、組件和/或其集合的存在或添加。

還應(yīng)當(dāng)理解,在此本發(fā)明說明書中所使用的術(shù)語僅僅是出于描述特定實施例的目的而并不意在限制本發(fā)明。如在本發(fā)明說明書和所附權(quán)利要求書中所使用的那樣,除非上下文清楚地指明其它情況,否則單數(shù)形式的“一”、“一個”及“該”意在包括復(fù)數(shù)形式。

如在本說明書和所附權(quán)利要求書中所使用的那樣,術(shù)語“如果”可以依據(jù)上下文被解釋為“當(dāng)...時”或“一旦”或“響應(yīng)于確定”或“響應(yīng)于檢測到”。類似地,短語“如果確定”或“如果檢測到[所描述條件或事件]”可以依據(jù)上下文被解釋為意指“一旦確定”或“響應(yīng)于確定”或“一旦檢測到[所描述條件或事件]”或“響應(yīng)于檢測到[所描述條件或事件]”。

也應(yīng)當(dāng)理解,盡管術(shù)語第一、第二等可以在此用來描述各種元素,但這些元素不應(yīng)該受限于這些術(shù)語。這些術(shù)語僅用來將這些元素彼此區(qū)分開。

參見圖1,是本發(fā)明實施例提供的一種數(shù)據(jù)異常檢測方法的示意流程圖,如圖所示,該方法包括以下步驟s101~s106:

s101、從數(shù)據(jù)中提取特征字段。

特征字段為一類型的字段,包括表征數(shù)據(jù)異常的字段、具有格式要求的字段、數(shù)值型的特征字段,字符串型的特征字段、數(shù)組型的特征字段等等,例如:表征數(shù)據(jù)異常的代碼0、一郵箱地址、一版本號等。

s102、判斷所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果。

不同類型的特征字段具有不同的劃分標(biāo)準(zhǔn),例如:表征數(shù)據(jù)異常的字段對應(yīng)的劃分標(biāo)準(zhǔn)為具有代表錯誤類型的代碼;具有格式要求的字段對應(yīng)的劃分標(biāo)準(zhǔn)為相應(yīng)的格式要求(例如特征字段為郵箱地址,劃分標(biāo)準(zhǔn)為郵箱地址對應(yīng)的格式);數(shù)值型的特征字段,以數(shù)值位數(shù)范圍為劃分標(biāo)準(zhǔn);字符串型的特征字段,以編碼類型、字長,不含不可識別的字符等為劃分標(biāo)準(zhǔn);數(shù)組型的特征字段,以對應(yīng)的數(shù)組結(jié)構(gòu),數(shù)據(jù)關(guān)聯(lián)性,允許數(shù)值缺省等為劃分標(biāo)準(zhǔn)。

本發(fā)明實施例從數(shù)據(jù)接口自身的數(shù)據(jù)結(jié)構(gòu)出發(fā),運用貝葉斯分類算法對數(shù)據(jù)接口返回數(shù)據(jù)的各種特征字段進行實時分類,以數(shù)據(jù)接口設(shè)計時所遵循的劃分標(biāo)準(zhǔn)為檢測條件,不同類型的特征字段對應(yīng)不同的劃分標(biāo)準(zhǔn),以相應(yīng)的劃分標(biāo)準(zhǔn)為檢測條件,降低異常數(shù)據(jù)的錯誤檢測結(jié)果,以達(dá)到提高數(shù)據(jù)檢測的質(zhì)量和有效性。

s103、根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率。

在本發(fā)明實施例中,正常特征概率、異常特征概率、正常統(tǒng)計概率和異常統(tǒng)計概率都是通過統(tǒng)計數(shù)據(jù)訓(xùn)練集得到的概率。

預(yù)先獲取該數(shù)據(jù)的數(shù)據(jù)訓(xùn)練集(設(shè)樣本總數(shù)為m),對該數(shù)據(jù)訓(xùn)練集進行特征字段的統(tǒng)計,得到的統(tǒng)計情況如下表1:

表1

表1中q1代表特征字段為正常數(shù)據(jù)的情況,q2代表特征字段為異常數(shù)據(jù)的情況。

在本發(fā)明實施例中,所述正常特征概率包括正常條件概率和正常非條件概率,所述正常條件概率為所述特征字段符合所述劃分標(biāo)準(zhǔn)且為正常數(shù)據(jù)的概率,所述正常非條件概率為所述特征字段不符合所述劃分標(biāo)準(zhǔn)且為正常數(shù)據(jù)的概率。

所述異常特征概率包括異常條件概率和異常非條件概率,所述異常條件概率為所述特征字段符合所述劃分標(biāo)準(zhǔn)且為異常數(shù)據(jù)的概率,所述異常非條件概率為所述特征字段不符合所述劃分標(biāo)準(zhǔn)且為異常數(shù)據(jù)的概率。

根據(jù)表1的統(tǒng)計結(jié)果,可計算數(shù)據(jù)的正常統(tǒng)計概率異常統(tǒng)計概率特征字段pn的正常條件概率正常非條件概率異常條件概率和異常非條件概率其中表示特征字段pn不符合劃分標(biāo)準(zhǔn)tn。

進一步地,步驟s103中的所述根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,包括:若所述特征字段符合對應(yīng)的劃分標(biāo)準(zhǔn),則獲取所述特征字段的正常條件概率和異常條件概率;若所述特征字段不符合對應(yīng)的劃分標(biāo)準(zhǔn),則獲取所述特征字段的正常非條件概率和異常非條件概率。

s104、根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,以及根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率。

進一步地,所述數(shù)據(jù)的特征字段為多條。

所述根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,具體為:將多條所述特征字段分別對應(yīng)的正常特征概率以及所述正常統(tǒng)計概率相乘,得到所述正常數(shù)據(jù)概率。

所述根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率,具體為:將多條所述特征字段分別對應(yīng)的異常特征概率以及所述異常統(tǒng)計概率相乘,得到所述異常數(shù)據(jù)概率。

s105、計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值;

s106、判斷所述比值是否大于閾值,若是,則判定所述數(shù)據(jù)為異常數(shù)據(jù)。。

利用正常特征概率和正常統(tǒng)計概率計算出數(shù)據(jù)的正常數(shù)據(jù)概以及利用所述異常特征概率和異常統(tǒng)計概率計算出數(shù)據(jù)的異常數(shù)據(jù)概率后,比較異常數(shù)據(jù)概和正常數(shù)據(jù)概率,如果二者的比值大于閾值,則說明該數(shù)據(jù)為異常數(shù)據(jù)。

具體地,所述閾值為8-12,本發(fā)明實施例優(yōu)選為10,即若異常數(shù)據(jù)概與正常數(shù)據(jù)概率之比大于10,則判定該數(shù)據(jù)為異常數(shù)據(jù)。

例如,一接口用于獲取app自升級信息,若獲取的獲取app自升級信息異常,會導(dǎo)致自升級失敗甚至app運行崩潰。具體的接口返回數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)及注釋如下:

{"result":0,//是否正常返回數(shù)據(jù),0否,1是

"msg":"success",//備注信息

"content":{//接口返回數(shù)據(jù)主體內(nèi)容

"need_update":1,//是否有更新,0否,1是,若為0則不返回下面的字段

"url":"http://package.mhacn.net/huanju-report-v1.0.1.jar",//更新下載地址

"vcode":"2",//更新后的版本號

"svr":"1.0.1",//更新后的版本名稱

"md5":"99e620972df59e113ca112f56889fbd9",//更新包的md5值

"request_interval":300,//更新請求間隔

"update_on":"1"http://是否開啟自更新,0否,1是

}

}

根據(jù)接口返回數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)及其約定的標(biāo)準(zhǔn)和意思,選擇字段result、url、vcode、svr、md5共5個參數(shù)作為特征字段。同時可知字段result是表征錯誤代碼,設(shè)定字段result的劃分標(biāo)準(zhǔn)tresult是字段result的值等于0;字段url是url地址,以標(biāo)準(zhǔn)的url格式作為劃分標(biāo)準(zhǔn)turl;字段vcode是表示版本號,通常版本號為非零整數(shù),設(shè)定字段vcode的劃分標(biāo)準(zhǔn)tvcode是字段vcode的數(shù)據(jù)類型為整型;字段svr表示版本名稱,版本名稱一般以半角英文狀態(tài)下的句號分割,不含除半角英文狀態(tài)下的句號以外的其它特殊符號,因此設(shè)定字段svr的劃分標(biāo)準(zhǔn)tsvr是字段svr的數(shù)據(jù)不含有其它特殊符號;字段md5表示更新包的md5值,一般是32位字長的字符串,因此設(shè)定字段md5的劃分標(biāo)準(zhǔn)tmd5是字段md5的數(shù)據(jù)字長為32位。

預(yù)先隨機選取1000條接口返回的數(shù)據(jù),統(tǒng)計1000條數(shù)據(jù)中的正常數(shù)據(jù)和異常數(shù)據(jù),分別計算數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率,計算各個特征字段的正常條件概率、正常非條件概率、異常條件概率和異常非條件概率。

假設(shè)數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率分別為p(q1)=0.92,p(q2)=0.08,各個特征字段的正常條件概率、正常非條件概率、異常條件概率和異常非條件概率如下:

p1(tresult|result)=1,p2(tresult|result)=0.02,

p1(turl|url)=0.95,p2(turl|url)=0.1,

p1(tvcode|vcode)=0.92,p2(tvcode|vcode)=0.17,

p1(tsvr|svr)=0.87,p2(tsvr|svr)=0.28,

p1(tsvr|svr)=0.87,p2(tsvr|svr)=0.28,

p1(tmd5|md5)=1,p2(tmd5|md5)=0.24,

現(xiàn)接收到接口返回的上述類型的實時線接口數(shù)據(jù),然后調(diào)用數(shù)據(jù)檢測程序進行檢測,提取實時數(shù)據(jù)的特征字段如下:

result=0;

url=http://package.mhacnnet/report-vl.0.6.jar;

vcode=2;

svr=1.0.1;

md5=5fbc803b084ea0036d30250f93130bc3e2。

根據(jù)各字段的劃分條件,可知字段result、url、vcode、svr均符合對應(yīng)的劃分標(biāo)準(zhǔn),而字段md5不滿足對應(yīng)的劃分標(biāo)準(zhǔn),因此調(diào)用相關(guān)的概率分別計算實時數(shù)據(jù)的正常數(shù)據(jù)概率和異常數(shù)據(jù)概率:

最后計算得到可知本次api接口返回的實時數(shù)據(jù)為異常數(shù)據(jù)。

本發(fā)明實施例的數(shù)據(jù)異常檢測方法,判斷不同類型的特征字段是否滿足對應(yīng)的劃分標(biāo)準(zhǔn),獲取與對應(yīng)的劃分標(biāo)準(zhǔn)相關(guān)的正常特征概率和異常特征概率,正常特征概率和異常特征概率皆為一數(shù)據(jù)訓(xùn)練集的統(tǒng)計概率,再利用針對該數(shù)據(jù)訓(xùn)練集得到的該類數(shù)據(jù)為正常數(shù)據(jù)的正常統(tǒng)計概率和為異常數(shù)據(jù)的異常統(tǒng)計概率,最后利用這些統(tǒng)概率計算出接口返回的實時數(shù)據(jù)為正常數(shù)據(jù)的正常數(shù)據(jù)概率,以及為異常數(shù)據(jù)的異常數(shù)據(jù)概率,根據(jù)這兩個概率判斷數(shù)據(jù)是否為異常數(shù)據(jù),檢測的結(jié)果精度高,檢測質(zhì)量好。

參見圖2,圖2是本發(fā)明實施例提供的一種數(shù)據(jù)異常檢測方法的另一示意流程圖,如圖所示,該方法包括以下步驟s201~s212:

s201、接收api接口返回的數(shù)據(jù)。

s202、從數(shù)據(jù)中提取特征字段。

特征字段為一類型的字段,包括表征數(shù)據(jù)異常的字段、具有格式要求的字段、數(shù)值型的特征字段,字符串型的特征字段、數(shù)組型的特征字段等等。

s203、判斷所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果。

不同類型的特征字段具有不同的劃分標(biāo)準(zhǔn),例如:表征數(shù)據(jù)異常的字段對應(yīng)的劃分標(biāo)準(zhǔn)為具有代表錯誤類型的代碼;具有格式要求的字段對應(yīng)的劃分標(biāo)準(zhǔn)為相應(yīng)的格式要求(例如特征字段為郵箱地址,劃分標(biāo)準(zhǔn)為郵箱地址對應(yīng)的格式);數(shù)值型的特征字段,以數(shù)值位數(shù)范圍為劃分標(biāo)準(zhǔn);字符串型的特征字段,以編碼類型、字長,不含不可識別的字符等為劃分標(biāo)準(zhǔn);數(shù)組型的特征字段,以對應(yīng)的數(shù)組結(jié)構(gòu),數(shù)據(jù)關(guān)聯(lián)性,允許數(shù)值缺省等為劃分標(biāo)準(zhǔn)。

本發(fā)明實施例從數(shù)據(jù)接口自身的數(shù)據(jù)結(jié)構(gòu)出發(fā),運用貝葉斯分類算法對數(shù)據(jù)接口返回數(shù)據(jù)的各種特征字段進行實時分類,以數(shù)據(jù)接口設(shè)計時所遵循的劃分標(biāo)準(zhǔn)為檢測條件,不同類型的特征字段對應(yīng)不同的劃分標(biāo)準(zhǔn),以相應(yīng)的劃分標(biāo)準(zhǔn)為檢測條件,降低異常數(shù)據(jù)的錯誤檢測結(jié)果,以達(dá)到提高數(shù)據(jù)檢測的質(zhì)量和有效性。

s204、根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率。

在本發(fā)明實施例中,正常特征概率、異常特征概率、正常統(tǒng)計概率和異常統(tǒng)計概率都是通過統(tǒng)計數(shù)據(jù)訓(xùn)練集得到的概率。

預(yù)先獲取該數(shù)據(jù)的數(shù)據(jù)訓(xùn)練集,對該數(shù)據(jù)訓(xùn)練集進行特征字段的統(tǒng)計,計算統(tǒng)計概率,統(tǒng)計概率包括正常特征概率、異常特征概率、正常統(tǒng)計概率和異常統(tǒng)計概率。

其中,正常特征概率包括正常條件概率和正常非條件概率,所述正常條件概率為所述特征字段符合所述劃分標(biāo)準(zhǔn)且為正常數(shù)據(jù)的概率,所述正常非條件概率為所述特征字段不符合所述劃分標(biāo)準(zhǔn)且為正常數(shù)據(jù)的概率,異常特征概率包括異常條件概率和異常非條件概率,所述異常條件概率為所述特征字段符合所述劃分標(biāo)準(zhǔn)且為異常數(shù)據(jù)的概率,所述異常非條件概率為所述特征字段不符合所述劃分標(biāo)準(zhǔn)且為異常數(shù)據(jù)的概率。

進一步地,所述步驟s204中的所述根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率步驟,包括:若所述特征字段符合對應(yīng)的劃分標(biāo)準(zhǔn),則獲取所述特征字段的正常條件概率和異常條件概率;若所述特征字段不符合對應(yīng)的劃分標(biāo)準(zhǔn),則獲取所述特征字段的正常非條件概率和異常非條件概率。

s205、根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,以及根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率。

進一步地,所述數(shù)據(jù)的特征字段為多條。

所述根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,具體為:將多條所述特征字段分別對應(yīng)的正常特征概率以及所述正常統(tǒng)計概率相乘,得到所述正常數(shù)據(jù)概率。

所述根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率,具體為:將多條所述特征字段分別對應(yīng)的異常特征概率以及所述異常統(tǒng)計概率相乘,得到所述異常數(shù)據(jù)概率。

s206、計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值。

s207、判斷所述比值是否大于閾值,若是,進行步驟s208,若否,進行步驟s209。

s208、判定所述數(shù)據(jù)為異常數(shù)據(jù)。

利用正常特征概率和正常統(tǒng)計概率計算出數(shù)據(jù)的正常數(shù)據(jù)概以及利用所述異常特征概率和異常統(tǒng)計概率計算出數(shù)據(jù)的異常數(shù)據(jù)概率后,比較異常數(shù)據(jù)概和正常數(shù)據(jù)概率,如果二者的比值大于閾值,則說明該數(shù)據(jù)為異常數(shù)據(jù)。

具體地,所述閾值為8-12,本發(fā)明實施例優(yōu)選為10,即若異常數(shù)據(jù)概與正常數(shù)據(jù)概率之比大于10,則判定該數(shù)據(jù)為異常數(shù)據(jù)。

s209、計算所述正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值。

s210、判斷所述正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值是否大于閾值,若是,進行步驟s211,若否,進行步驟s212。

s211、判定所述數(shù)據(jù)為正常數(shù)據(jù)。

s212、判定所述數(shù)據(jù)為待確認(rèn)數(shù)據(jù)。

如果異常數(shù)據(jù)概與正常數(shù)據(jù)概率之比小于或等于閾值,則計算正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值,如果這個比值大于閾值,則該數(shù)據(jù)為正常數(shù)據(jù),否則,將此數(shù)據(jù)列為待確認(rèn)數(shù)據(jù),由管理員判斷,減少誤判的幾率。

本發(fā)明實施例的數(shù)據(jù)異常檢測方法,判斷不同類型的特征字段是否滿足對應(yīng)的劃分標(biāo)準(zhǔn),獲取與對應(yīng)的劃分標(biāo)準(zhǔn)相關(guān)的正常特征概率和異常特征概率,正常特征概率和異常特征概率皆為一數(shù)據(jù)訓(xùn)練集的統(tǒng)計概率,再利用針對該數(shù)據(jù)訓(xùn)練集得到的該類數(shù)據(jù)為正常數(shù)據(jù)的正常統(tǒng)計概率和為異常數(shù)據(jù)的異常統(tǒng)計概率,最后利用這些統(tǒng)概率計算出api接口返回的實時數(shù)據(jù)為正常數(shù)據(jù)的正常數(shù)據(jù)概率,以及為異常數(shù)據(jù)的異常數(shù)據(jù)概率,根據(jù)這兩個概率判斷數(shù)據(jù)的類型,檢測的結(jié)果精度高,檢測質(zhì)量好。

如圖3所示,圖3為本發(fā)明實施例提供的一種終端100的示意性框圖,該終端100包括提取單元101、第一判斷單元102、獲取單元103、第一計算單元104、第二計算單元105和第二判斷單元106。

提取單元101用于從數(shù)據(jù)中提取特征字段。

第一判斷單元102用于判斷所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果。

特征字段為一類型的字段,包括表征數(shù)據(jù)異常的字段、具有格式要求的字段、數(shù)值型的特征字段,字符串型的特征字段、數(shù)組型的特征字段等等。

不同類型的特征字段具有不同的劃分標(biāo)準(zhǔn),例如:表征數(shù)據(jù)異常的字段對應(yīng)的劃分標(biāo)準(zhǔn)為具有代表錯誤類型的代碼;具有格式要求的字段對應(yīng)的劃分標(biāo)準(zhǔn)為相應(yīng)的格式要求(例如特征字段為郵箱地址,劃分標(biāo)準(zhǔn)為郵箱地址對應(yīng)的格式);數(shù)值型的特征字段,以數(shù)值位數(shù)范圍為劃分標(biāo)準(zhǔn);字符串型的特征字段,以編碼類型、字長,不含不可識別的字符等為劃分標(biāo)準(zhǔn);數(shù)組型的特征字段,以對應(yīng)的數(shù)組結(jié)構(gòu),數(shù)據(jù)關(guān)聯(lián)性,允許數(shù)值缺省等為劃分標(biāo)準(zhǔn)。

獲取單元103用于根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率。

在本發(fā)明實施例中,所述正常特征概率包括正常條件概率和正常非條件概率,所述正常條件概率為所述特征字段符合所述劃分標(biāo)準(zhǔn)且為正常數(shù)據(jù)的概率,所述正常非條件概率為所述特征字段不符合所述劃分標(biāo)準(zhǔn)且為正常數(shù)據(jù)的概率。

所述異常特征概率包括異常條件概率和異常非條件概率,所述異常條件概率為所述特征字段符合所述劃分標(biāo)準(zhǔn)且為異常數(shù)據(jù)的概率,所述異常非條件概率為所述特征字段不符合所述劃分標(biāo)準(zhǔn)且為異常數(shù)據(jù)的概率。

進一步地,所述根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,包括:若所述特征字段符合對應(yīng)的劃分標(biāo)準(zhǔn),則獲取所述特征字段的正常條件概率和異常條件概率;若所述特征字段不符合對應(yīng)的劃分標(biāo)準(zhǔn),則獲取所述特征字段的正常非條件概率和異常非條件概率。

第一計算單元104用于根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,以及根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率。

進一步地,所述數(shù)據(jù)的特征字段為多條。

所述根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,具體為:將多條所述特征字段分別對應(yīng)的正常特征概率以及所述正常統(tǒng)計概率相乘,得到所述正常數(shù)據(jù)概率。

所述根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率,具體為:將多條所述特征字段分別對應(yīng)的異常特征概率以及所述異常統(tǒng)計概率相乘,得到所述異常數(shù)據(jù)概率。

第二計算單元105用于計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值。

第二判斷單元106,用于判斷所述比值是否大于閾值,若所述比值大于閾值,則判定所述數(shù)據(jù)為異常數(shù)據(jù)。

比較異常數(shù)據(jù)概和正常數(shù)據(jù)概率,如果二者的比值大于閾值,則說明該數(shù)據(jù)為異常數(shù)據(jù)。

具體地,所述閾值為8-12,本發(fā)明實施例優(yōu)選為10,即若異常數(shù)據(jù)概與正常數(shù)據(jù)概率之比大于10,則判定該數(shù)據(jù)為異常數(shù)據(jù)。

本發(fā)明實施例的終端100,根據(jù)劃分標(biāo)準(zhǔn)對接口返回的數(shù)據(jù)分類,再利用預(yù)先的各統(tǒng)計概率計算數(shù)據(jù)為正常數(shù)據(jù)和異常數(shù)據(jù)的概率,根據(jù)這兩個概率判斷數(shù)據(jù)是否為異常數(shù)據(jù),檢測的結(jié)果精度高,檢測質(zhì)量好。

如圖4所示,圖4為本發(fā)明實施例提供的一種終端200的另一示意性框圖,該終端200包括接收單元201、提取單元202、第一判斷單元203、獲取單元204、第一計算單元205、第二計算單元206和第二判斷單元207。

接收單元201用于接收api接口返回的數(shù)據(jù)。

提取單元202用于從數(shù)據(jù)中提取特征字段。

第一判斷單元203用于判斷所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果。

特征字段為一類型的字段,包括表征數(shù)據(jù)異常的字段、具有格式要求的字段、數(shù)值型的特征字段,字符串型的特征字段、數(shù)組型的特征字段等等。

不同類型的特征字段具有不同的劃分標(biāo)準(zhǔn),例如:表征數(shù)據(jù)異常的字段對應(yīng)的劃分標(biāo)準(zhǔn)為具有代表錯誤類型的代碼;具有格式要求的字段對應(yīng)的劃分標(biāo)準(zhǔn)為相應(yīng)的格式要求(例如特征字段為郵箱地址,劃分標(biāo)準(zhǔn)為郵箱地址對應(yīng)的格式);數(shù)值型的特征字段,以數(shù)值位數(shù)范圍為劃分標(biāo)準(zhǔn);字符串型的特征字段,以編碼類型、字長,不含不可識別的字符等為劃分標(biāo)準(zhǔn);數(shù)組型的特征字段,以對應(yīng)的數(shù)組結(jié)構(gòu),數(shù)據(jù)關(guān)聯(lián)性,允許數(shù)值缺省等為劃分標(biāo)準(zhǔn)。

獲取單元204用于根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率。

在本發(fā)明實施例中,所述正常特征概率包括正常條件概率和正常非條件概率,所述正常條件概率為所述特征字段符合所述劃分標(biāo)準(zhǔn)且為正常數(shù)據(jù)的概率,所述正常非條件概率為所述特征字段不符合所述劃分標(biāo)準(zhǔn)且為正常數(shù)據(jù)的概率。

所述異常特征概率包括異常條件概率和異常非條件概率,所述異常條件概率為所述特征字段符合所述劃分標(biāo)準(zhǔn)且為異常數(shù)據(jù)的概率,所述異常非條件概率為所述特征字段不符合所述劃分標(biāo)準(zhǔn)且為異常數(shù)據(jù)的概率。

進一步地,所述根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,包括:若所述特征字段符合對應(yīng)的劃分標(biāo)準(zhǔn),則獲取所述特征字段的正常條件概率和異常條件概率;若所述特征字段不符合對應(yīng)的劃分標(biāo)準(zhǔn),則獲取所述特征字段的正常非條件概率和異常非條件概率。

第一計算單元205用于根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,以及根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率。

進一步地,所述數(shù)據(jù)的特征字段為多條。

所述根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,具體為:將多條所述特征字段分別對應(yīng)的正常特征概率以及所述正常統(tǒng)計概率相乘,得到所述正常數(shù)據(jù)概率。

所述根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率,具體為:將多條所述特征字段分別對應(yīng)的異常特征概率以及所述異常統(tǒng)計概率相乘,得到所述異常數(shù)據(jù)概率。

第二計算單元206用于計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值。

第二判斷單元207,用于判斷所述比值是否大于閾值,若所述比值大于閾值,則判定所述數(shù)據(jù)為異常數(shù)據(jù)。

比較異常數(shù)據(jù)概和正常數(shù)據(jù)概率,如果二者的比值大于閾值,則說明該數(shù)據(jù)為異常數(shù)據(jù)。

具體地,所述閾值為8-12,本發(fā)明實施例優(yōu)選為10。

所述第二計算單元206還用于:若所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值小于或等于閾值,計算所述正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值。

所述第二判斷單元207還用于:判斷所述正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值是否大于閾值;若所述正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值大于閾值,則判定所述數(shù)據(jù)為正常數(shù)據(jù);若所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值小于或等于所述閾值,且所述正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值小于或等于所述閾值,則判定所述數(shù)據(jù)為待確認(rèn)數(shù)據(jù)。

另外,如果異常數(shù)據(jù)概與正常數(shù)據(jù)概率之比小于或等于閾值,且正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值小于或等于所述閾值,則將此數(shù)據(jù)列為待確認(rèn)數(shù)據(jù),由管理員判斷,減少誤判的幾率。

本發(fā)明實施例的終端200,根據(jù)劃分標(biāo)準(zhǔn)對api接口返回的數(shù)據(jù)分類,再利用預(yù)先的各統(tǒng)計概率計算數(shù)據(jù)為正常數(shù)據(jù)和異常數(shù)據(jù)的概率,根據(jù)這兩個概率判斷數(shù)據(jù)是否為異常數(shù)據(jù),檢測的結(jié)果精度高,檢測質(zhì)量好。

請參閱圖5,圖5為本發(fā)明實施例提供的一種終端300的結(jié)構(gòu)示意性框圖。該終端300可以包括輸入設(shè)備301、包括有一個或一個以上計算機可讀存儲介質(zhì)的存儲器302、輸出設(shè)備303、收發(fā)設(shè)備304、以及包括有一個或者一個以上處理核心的處理器305等部件。本領(lǐng)域技術(shù)人員可以理解,圖5中示出的終端300結(jié)構(gòu)并不構(gòu)成對終端300的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。

輸入設(shè)備301可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與功能控制有關(guān)的鍵盤、鼠標(biāo)、操作桿、光學(xué)或者軌跡球信號輸入。具體地,在一個具體的實施例中,輸入設(shè)備301可包括觸敏表面以及其他輸入裝置。觸敏表面,也稱為觸摸顯示屏或者觸控板,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸敏表面上或在觸敏表面附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動相應(yīng)的連接裝置??蛇x的,觸敏表面可包括觸摸檢測裝置和觸摸控制器兩個部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點坐標(biāo),再送給處理器305,并能接收處理器305發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實現(xiàn)觸敏表面。除了觸敏表面,輸入設(shè)備301還可以包括其他輸入裝置。

存儲器302可用于存儲應(yīng)用程序和數(shù)據(jù)。存儲器302存儲的應(yīng)用程序中包含有可執(zhí)行代碼。應(yīng)用程序可以組成各種功能模塊。處理器305通過運行存儲在存儲器302的應(yīng)用程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理。存儲器302可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)終端300的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器302可以包括高速隨機存取存儲器,還可以包括非易失性存儲器,例如至少一個磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。相應(yīng)地,存儲器302還可以包括存儲器控制器,以提供處理器305對存儲器302的訪問。

輸出設(shè)備303用于對外輸出終端300的輸出數(shù)據(jù),可包括顯示器、揚聲器等。進一步的,顯示器的顯示面板可覆蓋觸敏表面,當(dāng)觸敏表面檢測到在其上或附近的觸摸操作后,傳送給處理器305以確定觸摸事件的類型,隨后處理器305根據(jù)觸摸事件的類型在顯示面板上提供相應(yīng)的視覺輸出。

收發(fā)設(shè)備304,用于向其他設(shè)備發(fā)送數(shù)據(jù)或者從其他設(shè)備接收數(shù)據(jù)。一般而言,收發(fā)設(shè)備304可包括藍(lán)牙、射頻天線、近場通信模塊等。

處理器305是終端300的控制中心,利用各種接口和線路連接整個終端300300的各個部分,通過運行或執(zhí)行存儲在存儲器302內(nèi)的應(yīng)用程序,以及調(diào)用存儲在存儲器302內(nèi)的數(shù)據(jù),執(zhí)行終端300的各種功能和處理數(shù)據(jù),從而對終端300進行整體監(jiān)控。可選的,處理器305可包括一個或多個處理核心;優(yōu)選的,處理器305可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖牵鲜稣{(diào)制解調(diào)處理器也可以不集成到處理器305中。

盡管圖5中未示出,本領(lǐng)域的技術(shù)人員可以理解,終端300還可以包括攝像頭、藍(lán)牙、無線保真等,在此不再贅述。

具體在本實施例中,終端300的處理器305會按照如下的指令,將一個或一個以上的應(yīng)用程序的進程對應(yīng)的可執(zhí)行代碼或數(shù)據(jù)加載到存儲器302中,由處理器305來運行或操作存儲在存儲器302中的程序代碼或數(shù)據(jù),并執(zhí)行如下操作:

從數(shù)據(jù)中提取特征字段;判斷所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果;根據(jù)判斷結(jié)果獲取所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率;根據(jù)所述正常特征概率和正常統(tǒng)計概率計算所述數(shù)據(jù)的正常數(shù)據(jù)概率,以及根據(jù)所述異常特征概率和異常統(tǒng)計概率計算所述數(shù)據(jù)的異常數(shù)據(jù)概率;計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值,若所述比值大于閾值,則判定所述數(shù)據(jù)為異常數(shù)據(jù)。

進一步地,所述處理器305還執(zhí)行如下操作:

從數(shù)據(jù)中提取特征字段,所述特征字段為多條;分別判斷多條所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果;根據(jù)判斷結(jié)果獲取多條所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率;將多條所述特征字段分別對應(yīng)的正常特征概率以及所述正常統(tǒng)計概率相乘,得到所述正常數(shù)據(jù)概率,將多條所述特征字段分別對應(yīng)的異常特征概率以及所述異常統(tǒng)計概率相乘,得到所述異常數(shù)據(jù)概率;計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值,若所述比值大于閾值,則判定所述數(shù)據(jù)為異常數(shù)據(jù)。

進一步地,所述處理器305還執(zhí)行如下操作:

接收api接口返回的數(shù)據(jù);從數(shù)據(jù)中提取特征字段,所述特征字段為多條;分別判斷多條所述特征字段是否符合對應(yīng)的劃分標(biāo)準(zhǔn),得到判斷結(jié)果;根據(jù)判斷結(jié)果獲取多條所述特征字段的正常特征概率和異常特征概率,以及獲取所述數(shù)據(jù)的正常統(tǒng)計概率和異常統(tǒng)計概率;將多條所述特征字段分別對應(yīng)的正常特征概率以及所述正常統(tǒng)計概率相乘,得到所述正常數(shù)據(jù)概率,將多條所述特征字段分別對應(yīng)的異常特征概率以及所述異常統(tǒng)計概率相乘,得到所述異常數(shù)據(jù)概率;計算所述異常數(shù)據(jù)概率與正常數(shù)據(jù)概率的比值,若所述比值大于閾值,則判定所述數(shù)據(jù)為異常數(shù)據(jù);若所述比值小于或等于閾值,計算所述正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值,判斷所述正常數(shù)據(jù)概率與異常數(shù)據(jù)概率的比值是否大于閾值,若是,則判定所述數(shù)據(jù)為正常數(shù)據(jù),否則判定所述數(shù)據(jù)為待確認(rèn)數(shù)據(jù)。

本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡潔,上述描述的終端和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。

在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的終端和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、裝置或單元的間接耦合或通信連接,也可以是電的,機械的或其它的形式連接。

本發(fā)明實施例方法中的步驟可以根據(jù)實際需要進行順序調(diào)整、合并和刪減。

本發(fā)明實施例終端中的單元可以根據(jù)實際需要進行合并、劃分和刪減。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本發(fā)明實施例方案的目的。

另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以是兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分,或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到各種等效的修改或替換,這些修改或替換都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以權(quán)利要求的保護范圍為準(zhǔn)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1