一種多維無特征碼惡意程序檢測方法

文檔序號：8457505閱讀：1010來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種多維無特征碼惡意程序檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)反病毒領(lǐng)域，具體涉及一種多維無特征碼惡意程序檢測方法。
【背景技術(shù)】
[0002] 隨著信息化在各行各業(yè)應(yīng)用的不斷深入，計(jì)算機(jī)安全問題越來越受到重視。在計(jì) 算機(jī)安全問題中，計(jì)算機(jī)病毒等惡意代碼是一個(gè)最主要的安全威脅。目前，針對計(jì)算機(jī)病毒的定義不同學(xué)者有不同的理解，在1994年2月18日，我國正式頒布實(shí)施了《中華人民共和國計(jì)算機(jī)信息系統(tǒng)安全保護(hù)條例》，在第二十八條中明確指出："計(jì)算機(jī)病毒，是指編制或者在計(jì)算機(jī)程序中插入的破壞計(jì)算機(jī)功能或者毀壞數(shù)據(jù)，影響計(jì)算機(jī)使用，并能自我復(fù)制的一組計(jì)算機(jī)指令或者程序代碼。"這是我國對于計(jì)算機(jī)病毒的正式定義，但隨著計(jì)算機(jī)黑客技術(shù)的不斷發(fā)展變化，新的攻擊手段層出不窮，通常將這些對計(jì)算機(jī)安全構(gòu)成威脅的有別于正常程序的計(jì)算機(jī)程序統(tǒng)稱為惡意程序，如破壞系統(tǒng)的安全、損害系統(tǒng)或未得到用戶許可的情況下獲得用戶的敏感信息等。惡意代碼主要包括傳統(tǒng)計(jì)算機(jī)病毒、宏病毒、惡意腳本、木馬、蠕蟲以及最近幾年出現(xiàn)的僵尸網(wǎng)絡(luò)等。
[0003] 目前，針對惡意程序的檢測主要包括基于特征碼檢測、行為檢測和文件完整性校驗(yàn)檢測三種方法?；谔卣鞔a檢測需要事先構(gòu)建一個(gè)惡意程序特征碼庫，該特征碼庫的構(gòu) 建需要事先捕獲惡意程序樣本，然后進(jìn)行分析提取出最具有代表性的一個(gè)或多個(gè)字符串，添加到惡意程序特征碼庫。對待檢測程序基于構(gòu)建好的惡意程序特征碼庫進(jìn)行掃描匹配，如果成功匹配則說明檢測到一個(gè)惡意程序，否則沒有。因此，基于特征碼檢測方法的一個(gè)前提是有一個(gè)完備的惡意程序特征碼庫，如果特征碼庫不完備，則必然導(dǎo)致漏報(bào)。但在實(shí)際應(yīng) 用過程中，不可能生成一個(gè)絕對完備的惡意程序特征碼庫，同時(shí)新的未知惡意程序的特征碼不可能提前生成，因此對新的未知惡意程序和已知惡意程序的變種無能為力。
[0004] 基于行為的檢測方法利用惡意程序的特有行為特征來進(jìn)行檢測，常見的惡意程序行為包括復(fù)制自身到指定目錄、創(chuàng)建啟動項(xiàng)、關(guān)閉安全軟件、刪除文件等。通過對正在運(yùn)行的程序的行為進(jìn)行監(jiān)測，如果發(fā)現(xiàn)程序具有這些典型惡意程序行為的檢測，則進(jìn)行報(bào)警?；?于行為的檢測方法依據(jù)是程序的行為特征，但惡意程序和合法程序存在一些相同或相似的行為，如刪除文件、復(fù)制文件，因此基于行為的檢測方法，存在很大的誤報(bào)。
[0005] 文件完整性校驗(yàn)檢測方法首先計(jì)算正常文件內(nèi)容的校驗(yàn)和，然后將文件校驗(yàn)和保存起業(yè)，然后在文件使用時(shí)或定期不定期計(jì)算其現(xiàn)在的校驗(yàn)和與原來保存的文件校驗(yàn)和是否一致，如一致則說明文件沒有被感染，否則說明文件被感染。文件完整性校驗(yàn)方法可以檢測已知和未知惡意程序，但與基于行為的檢測方法缺點(diǎn)一樣，存在很大的誤報(bào)，因?yàn)槲募?nèi) 容發(fā)生改變并非文件是由于惡意程序感染的唯一原因，文件內(nèi)容的改變有可能是正常程序引起的，而且這種方法也會影響文件的運(yùn)行速度。
[0006] 隨著Internet的迅速發(fā)展，惡意程序的產(chǎn)生與傳播更加快捷，新型高危惡意程序造成的危害日益增大。加之新型惡意程序構(gòu)建技術(shù)，如會自動進(jìn)行變形、加密、解密等的采用，對傳統(tǒng)惡意程序檢測技術(shù)提出嚴(yán)峻的挑戰(zhàn)，因此，研制新型惡意程序檢測技術(shù)是當(dāng)前應(yīng) 對惡意程序的一個(gè)亟待解決的問題。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明的目的是針對計(jì)算機(jī)系統(tǒng)中惡意程序檢測問題，提供一種多維無特征碼惡意程序檢測方法。本發(fā)明不用建立傳統(tǒng)惡意程序檢測所需要的龐大特征碼庫，通過建立計(jì) 算機(jī)正常程序模型，從而產(chǎn)生覆蓋惡意程序空間的檢測器，實(shí)現(xiàn)對惡意程序的檢測，本發(fā)明不依賴特征碼匹配檢測惡意程序，對待檢測程序不區(qū)分已知惡意程序或未知惡意程序，因此具有良好的未知惡意程序檢測能力。
[0008] 本發(fā)明的多維無特征碼惡意程序檢測方法包括如下步驟：
[0009] 步驟Sl :收集計(jì)算機(jī)中的正常程序訓(xùn)練集BPa、BPb和惡意程序訓(xùn)練集EP，并基于訓(xùn)練集BPa和EP構(gòu)建不同長度正常程序字符串集合庫；
[0010] 步驟S2:基于構(gòu)建的不同長度正常程序字符串集合庫，對正常程序訓(xùn)練集BPb中的每一個(gè)正常程序提取其多維特征，計(jì)算各正常程序的特征向量和泛化值，構(gòu)建正常程序豐旲型；
[0011] 步驟S3 :基于所述正常程序模型，生成覆蓋惡意程序空間的檢測器；
[0012] 步驟S4 :對特檢測程序p進(jìn)行特征提取，生成特檢測程序p的特征向量，計(jì)算特檢測程序P的特征向量與檢測器之間的歐幾里德距離，若所述歐幾里德距離小于或等于檢測器的檢測值，則特檢測程序P為惡意程序，否則為正常程序。
[0013] 由于本發(fā)明采用了以上的技術(shù)方案，因此本發(fā)明可以達(dá)到以下的有益效果：
[0014] 1、本發(fā)明可有效加快檢測速度。由于本發(fā)明不基于傳統(tǒng)特征碼匹配的方法，隨著惡意程序數(shù)量的不斷增加，其特征碼庫也將越來越大，掃描匹配耗時(shí)越來越長；本發(fā)明勿需特征碼，僅需提取程序特征即實(shí)現(xiàn)對程序的檢測，故檢測速度更快。
[0015] 2、本發(fā)明具有檢測未知惡意程序的能力。由于本發(fā)明不基于傳統(tǒng)特征碼匹配的方法，采用通過構(gòu)建計(jì)算機(jī)正常程序模型，生成覆蓋惡意程序空間的檢測器，實(shí)現(xiàn)對惡意程序的檢測，因此本發(fā)明具有檢測未知惡意程序的良好能力。
【附圖說明】
[0016] 圖1為本發(fā)明的系統(tǒng)框架圖；
[0017] 圖2為本發(fā)明【具體實(shí)施方式】中，生成正常程序字符串庫的流程圖；
[0018] 圖3為本發(fā)明【具體實(shí)施方式】中，構(gòu)建正常程序模型的流程圖；
[0019] 圖4為本發(fā)明【具體實(shí)施方式】中，生成檢測器的流程圖；
[0020] 圖5為本發(fā)明【具體實(shí)施方式】中，對待檢測程序判定過程的流程圖。
【具體實(shí)施方式】
[0021] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面結(jié)合實(shí)施方式和附圖，對本發(fā) 明作進(jìn)一步地詳細(xì)描述。
[0022] 如圖1所示，本發(fā)明的一種多維無特征碼惡意程序檢測方法包括如下步驟：
[0023] 步驟Sl :收集計(jì)算機(jī)中的正常程序訓(xùn)練集5Λ,、和惡意程序訓(xùn)練集EP (通常選擇典型的正常程序和惡意程序），基于訓(xùn)練集BPa和EP構(gòu)建不同長度正常程序字符串集合庫；
[0024] 步驟S2 :基于構(gòu)建的不同長度正常程序字符串集合庫，對正常程序訓(xùn)練集BPb中的每一個(gè)正常程序提取其多維特征，計(jì)算該正常程序的特征向量和泛化值，從而構(gòu)建起計(jì) 算機(jī)中正常程序模型；
[0025] 步驟S3,基于所構(gòu)建的正常程序模型，生成覆蓋惡意程序空間的檢測器；
[0026] 步驟S4 :對特檢測程序p首先提取其特征，生成特檢測程序p的特征向量，并計(jì) 算該特征向量與檢測器之間的歐幾里德距離，若該歐幾里德距離小于或等于檢測器的檢測值，則判定特檢測程序P為惡意程序，否則判定特檢測程序P為正常程序。
[0027] 具體的，在上述的步驟Sl中，如圖2所示，進(jìn)行構(gòu)建不同長度正常程序字串集合庫的步驟包括：
[0028] 步驟Sll :從正常程序訓(xùn)練集BPa中的一個(gè)正常程序bp依次提取長度為L的字符串bpy每次滑動一個(gè)字節(jié)，即對每個(gè)正常程序bp，存在多個(gè)長度為L的字符串bp^
[0029] 步驟S12 :計(jì)算字符串bp^在惡意程序訓(xùn)練集EP中字符串出現(xiàn)的次數(shù)Cbp和文件出現(xiàn)的次數(shù)Fbp;
[0030] 步驟S13 :判斷Cbp/Fbp< λ，λ為預(yù)設(shè)閾值，如果滿足則轉(zhuǎn)步驟S15,否則轉(zhuǎn)步驟 S14;由于正常程序和惡意程序可能會擁有相同的功能，如刪除文件操作，因此，通過引入閾值λ選出最能代表正常特征的字符串，其具體取值基于系統(tǒng)環(huán)境根據(jù)經(jīng)驗(yàn)值進(jìn)行設(shè)置，λ 的參考取值范圍為1. 〇~10. 0。
[0031] 步驟S14 :對不滿足步驟S13條件的字符串，則丟棄當(dāng)前字符串bp^
[0032] 步驟S15 :對滿足步驟S13條件的字符串，計(jì)算當(dāng)前字符串bp^在正常程序訓(xùn)練集 BPa中字符串出現(xiàn)的次數(shù)C bp和文件出現(xiàn)的次數(shù)P bp，計(jì)算C bp/P _作為當(dāng)前字符串 bpj勺權(quán)值ω，即定義提取的字符串為一個(gè)二元組〈bp u ω > ;
[0033] 步驟S16 :將字符串bpjl加到長度為L的字符串集合BPS沖，即BPS f {bpsL|bpsL=< bp L, ω > }；
[0034] 步驟S17 :繼續(xù)從正常程序訓(xùn)練集BPa選擇其他正常程序，重復(fù)步驟S21至步驟 S26,將字符串添加到長度為L的字符串集合BPS^中；
[0035] 步驟S18 :將字符串長度L取不同的值，重復(fù)步驟Sll至步驟S17,生成不同長度正常程序字符串集合庫BPS，即BPS = BPS1U BPS2U BPS3 U…，其中下標(biāo)用于標(biāo)識字L取不同值時(shí)所對應(yīng)的正常程序字符串集合庫。
[0036] 具體的，在上述的步驟S2中，如圖3所示，提取程序特征向量，構(gòu)建正常程序模型的步驟包括：
[0037] 步驟S21 :從正常程序訓(xùn)練集BPb中的一個(gè)正常程序bp依次提取字符串長度為L 的字符串bpy每次滑動一個(gè)字節(jié)；
[0038] 步驟S22 :計(jì)算字符串bp^在BPS中字符串長度為L的字符串集合BPS ^中出現(xiàn)的次數(shù)與從正常程序bp中提取長度為L的字符串總數(shù)之比，作為bp的一維的特征值即L 的每個(gè)取值對應(yīng)bp的一維特征值；
[0039] 步驟S23 :在字符串長度L的當(dāng)前取值下，累加正常程序bp在BPS集合中出現(xiàn)的字符串對應(yīng)的字符串權(quán)值，其計(jì)算結(jié)果用I表示；
[0040] 步驟S24:字符串長度L取不同值，重復(fù)上述步驟，得到正常程序bp的多維特征（維數(shù)取決于L的取值個(gè)數(shù)），從而得到一個(gè)表示正常程序bp的特征向量，即bp = < c2, (V> ;將正常程序bp在BPS出現(xiàn)的字符串權(quán)值的累加值除以系數(shù)δ (〇 < δ < 1) 作為正常程序bp的泛化值（假設(shè)L的取值個(gè)數(shù)為Ν，則每個(gè)正常程序的泛化值為：Ν個(gè)I 累加和除以S )，采用泛化值的方法可有效減少訓(xùn)練用正常程序的數(shù)量；進(jìn)一步地，如果前述字符串權(quán)值越大，表明出現(xiàn)次數(shù)越多，正常程序也越多，則可以賦予一個(gè)較大的泛化值，可代表更多未知的正常程序；
[0041] 步驟S25 :對正常程序訓(xùn)練集BPb中的所有正常程序重復(fù)上述步驟，從而構(gòu)建起正常程序模型。
[0042] 具體的，在上述的步驟S3中，如圖4所示，生成檢測器的步驟包括：
[0043] 步驟S31 :隨機(jī)生成一個(gè)檢測器，生成檢測器的維數(shù)與步驟S2中所提取的正常程序特征向量的維數(shù)一致；
[0044] 步驟S32 :計(jì)算隨機(jī)生成的檢測器與正常程序模型中向量的最短歐幾里德距離 dm

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：曾金全;
技術(shù)所有人：電子科技大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

特征碼相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種多維無特征碼惡意程序檢測方法