亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種多維無特征碼惡意程序檢測方法

文檔序號:8457505閱讀:1010來源:國知局
一種多維無特征碼惡意程序檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)反病毒領(lǐng)域,具體涉及一種多維無特征碼惡意程序檢測方法。
【背景技術(shù)】
[0002] 隨著信息化在各行各業(yè)應(yīng)用的不斷深入,計(jì)算機(jī)安全問題越來越受到重視。在計(jì) 算機(jī)安全問題中,計(jì)算機(jī)病毒等惡意代碼是一個(gè)最主要的安全威脅。目前,針對計(jì)算機(jī)病毒 的定義不同學(xué)者有不同的理解,在1994年2月18日,我國正式頒布實(shí)施了《中華人民共和 國計(jì)算機(jī)信息系統(tǒng)安全保護(hù)條例》,在第二十八條中明確指出:"計(jì)算機(jī)病毒,是指編制或者 在計(jì)算機(jī)程序中插入的破壞計(jì)算機(jī)功能或者毀壞數(shù)據(jù),影響計(jì)算機(jī)使用,并能自我復(fù)制的 一組計(jì)算機(jī)指令或者程序代碼。"這是我國對于計(jì)算機(jī)病毒的正式定義,但隨著計(jì)算機(jī)黑客 技術(shù)的不斷發(fā)展變化,新的攻擊手段層出不窮,通常將這些對計(jì)算機(jī)安全構(gòu)成威脅的有別 于正常程序的計(jì)算機(jī)程序統(tǒng)稱為惡意程序,如破壞系統(tǒng)的安全、損害系統(tǒng)或未得到用戶許 可的情況下獲得用戶的敏感信息等。惡意代碼主要包括傳統(tǒng)計(jì)算機(jī)病毒、宏病毒、惡意腳 本、木馬、蠕蟲以及最近幾年出現(xiàn)的僵尸網(wǎng)絡(luò)等。
[0003] 目前,針對惡意程序的檢測主要包括基于特征碼檢測、行為檢測和文件完整性校 驗(yàn)檢測三種方法?;谔卣鞔a檢測需要事先構(gòu)建一個(gè)惡意程序特征碼庫,該特征碼庫的構(gòu) 建需要事先捕獲惡意程序樣本,然后進(jìn)行分析提取出最具有代表性的一個(gè)或多個(gè)字符串, 添加到惡意程序特征碼庫。對待檢測程序基于構(gòu)建好的惡意程序特征碼庫進(jìn)行掃描匹配, 如果成功匹配則說明檢測到一個(gè)惡意程序,否則沒有。因此,基于特征碼檢測方法的一個(gè)前 提是有一個(gè)完備的惡意程序特征碼庫,如果特征碼庫不完備,則必然導(dǎo)致漏報(bào)。但在實(shí)際應(yīng) 用過程中,不可能生成一個(gè)絕對完備的惡意程序特征碼庫,同時(shí)新的未知惡意程序的特征 碼不可能提前生成,因此對新的未知惡意程序和已知惡意程序的變種無能為力。
[0004] 基于行為的檢測方法利用惡意程序的特有行為特征來進(jìn)行檢測,常見的惡意程序 行為包括復(fù)制自身到指定目錄、創(chuàng)建啟動項(xiàng)、關(guān)閉安全軟件、刪除文件等。通過對正在運(yùn)行 的程序的行為進(jìn)行監(jiān)測,如果發(fā)現(xiàn)程序具有這些典型惡意程序行為的檢測,則進(jìn)行報(bào)警?;?于行為的檢測方法依據(jù)是程序的行為特征,但惡意程序和合法程序存在一些相同或相似的 行為,如刪除文件、復(fù)制文件,因此基于行為的檢測方法,存在很大的誤報(bào)。
[0005] 文件完整性校驗(yàn)檢測方法首先計(jì)算正常文件內(nèi)容的校驗(yàn)和,然后將文件校驗(yàn)和保 存起業(yè),然后在文件使用時(shí)或定期不定期計(jì)算其現(xiàn)在的校驗(yàn)和與原來保存的文件校驗(yàn)和是 否一致,如一致則說明文件沒有被感染,否則說明文件被感染。文件完整性校驗(yàn)方法可以檢 測已知和未知惡意程序,但與基于行為的檢測方法缺點(diǎn)一樣,存在很大的誤報(bào),因?yàn)槲募?nèi) 容發(fā)生改變并非文件是由于惡意程序感染的唯一原因,文件內(nèi)容的改變有可能是正常程序 引起的,而且這種方法也會影響文件的運(yùn)行速度。
[0006] 隨著Internet的迅速發(fā)展,惡意程序的產(chǎn)生與傳播更加快捷,新型高危惡意程序 造成的危害日益增大。加之新型惡意程序構(gòu)建技術(shù),如會自動進(jìn)行變形、加密、解密等的采 用,對傳統(tǒng)惡意程序檢測技術(shù)提出嚴(yán)峻的挑戰(zhàn),因此,研制新型惡意程序檢測技術(shù)是當(dāng)前應(yīng) 對惡意程序的一個(gè)亟待解決的問題。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明的目的是針對計(jì)算機(jī)系統(tǒng)中惡意程序檢測問題,提供一種多維無特征碼惡 意程序檢測方法。本發(fā)明不用建立傳統(tǒng)惡意程序檢測所需要的龐大特征碼庫,通過建立計(jì) 算機(jī)正常程序模型,從而產(chǎn)生覆蓋惡意程序空間的檢測器,實(shí)現(xiàn)對惡意程序的檢測,本發(fā)明 不依賴特征碼匹配檢測惡意程序,對待檢測程序不區(qū)分已知惡意程序或未知惡意程序,因 此具有良好的未知惡意程序檢測能力。
[0008] 本發(fā)明的多維無特征碼惡意程序檢測方法包括如下步驟:
[0009] 步驟Sl :收集計(jì)算機(jī)中的正常程序訓(xùn)練集BPa、BPb和惡意程序訓(xùn)練集EP,并基于 訓(xùn)練集BPa和EP構(gòu)建不同長度正常程序字符串集合庫;
[0010] 步驟S2:基于構(gòu)建的不同長度正常程序字符串集合庫,對正常程序訓(xùn)練集BPb中 的每一個(gè)正常程序提取其多維特征,計(jì)算各正常程序的特征向量和泛化值,構(gòu)建正常程序 豐旲型;
[0011] 步驟S3 :基于所述正常程序模型,生成覆蓋惡意程序空間的檢測器;
[0012] 步驟S4 :對特檢測程序p進(jìn)行特征提取,生成特檢測程序p的特征向量,計(jì)算特檢 測程序P的特征向量與檢測器之間的歐幾里德距離,若所述歐幾里德距離小于或等于檢測 器的檢測值,則特檢測程序P為惡意程序,否則為正常程序。
[0013] 由于本發(fā)明采用了以上的技術(shù)方案,因此本發(fā)明可以達(dá)到以下的有益效果:
[0014] 1、本發(fā)明可有效加快檢測速度。由于本發(fā)明不基于傳統(tǒng)特征碼匹配的方法,隨著 惡意程序數(shù)量的不斷增加,其特征碼庫也將越來越大,掃描匹配耗時(shí)越來越長;本發(fā)明勿需 特征碼,僅需提取程序特征即實(shí)現(xiàn)對程序的檢測,故檢測速度更快。
[0015] 2、本發(fā)明具有檢測未知惡意程序的能力。由于本發(fā)明不基于傳統(tǒng)特征碼匹配的方 法,采用通過構(gòu)建計(jì)算機(jī)正常程序模型,生成覆蓋惡意程序空間的檢測器,實(shí)現(xiàn)對惡意程序 的檢測,因此本發(fā)明具有檢測未知惡意程序的良好能力。
【附圖說明】
[0016] 圖1為本發(fā)明的系統(tǒng)框架圖;
[0017] 圖2為本發(fā)明【具體實(shí)施方式】中,生成正常程序字符串庫的流程圖;
[0018] 圖3為本發(fā)明【具體實(shí)施方式】中,構(gòu)建正常程序模型的流程圖;
[0019] 圖4為本發(fā)明【具體實(shí)施方式】中,生成檢測器的流程圖;
[0020] 圖5為本發(fā)明【具體實(shí)施方式】中,對待檢測程序判定過程的流程圖。
【具體實(shí)施方式】
[0021] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合實(shí)施方式和附圖,對本發(fā) 明作進(jìn)一步地詳細(xì)描述。
[0022] 如圖1所示,本發(fā)明的一種多維無特征碼惡意程序檢測方法包括如下步驟:
[0023] 步驟Sl :收集計(jì)算機(jī)中的正常程序訓(xùn)練集5Λ,、和惡意程序 訓(xùn)練集EP (通常選擇典型的正常程序和惡意程序),基于訓(xùn)練集BPa和EP構(gòu)建不同長度正 常程序字符串集合庫;
[0024] 步驟S2 :基于構(gòu)建的不同長度正常程序字符串集合庫,對正常程序訓(xùn)練集BPb中 的每一個(gè)正常程序提取其多維特征,計(jì)算該正常程序的特征向量和泛化值,從而構(gòu)建起計(jì) 算機(jī)中正常程序模型;
[0025] 步驟S3,基于所構(gòu)建的正常程序模型,生成覆蓋惡意程序空間的檢測器;
[0026] 步驟S4 :對特檢測程序p首先提取其特征,生成特檢測程序p的特征向量,并計(jì) 算該特征向量與檢測器之間的歐幾里德距離,若該歐幾里德距離小于或等于檢測器的檢測 值,則判定特檢測程序P為惡意程序,否則判定特檢測程序P為正常程序。
[0027] 具體的,在上述的步驟Sl中,如圖2所示,進(jìn)行構(gòu)建不同長度正常程序字串集合庫 的步驟包括:
[0028] 步驟Sll :從正常程序訓(xùn)練集BPa中的一個(gè)正常程序bp依次提取長度為L的字符 串bpy每次滑動一個(gè)字節(jié),即對每個(gè)正常程序bp,存在多個(gè)長度為L的字符串bp^
[0029] 步驟S12 :計(jì)算字符串bp^在惡意程序訓(xùn)練集EP中字符串出現(xiàn)的次數(shù)Cbp和文件出 現(xiàn)的次數(shù)Fbp;
[0030] 步驟S13 :判斷Cbp/Fbp< λ,λ為預(yù)設(shè)閾值,如果滿足則轉(zhuǎn)步驟S15,否則轉(zhuǎn)步驟 S14;由于正常程序和惡意程序可能會擁有相同的功能,如刪除文件操作,因此,通過引入閾 值λ選出最能代表正常特征的字符串,其具體取值基于系統(tǒng)環(huán)境根據(jù)經(jīng)驗(yàn)值進(jìn)行設(shè)置,λ 的參考取值范圍為1. 〇~10. 0。
[0031] 步驟S14 :對不滿足步驟S13條件的字符串,則丟棄當(dāng)前字符串bp^
[0032] 步驟S15 :對滿足步驟S13條件的字符串,計(jì)算當(dāng)前字符串bp^在正常程序訓(xùn)練集 BPa中字符串出現(xiàn)的次數(shù)C bp和文件出現(xiàn)的次數(shù)P bp,計(jì)算C bp/P _作為當(dāng)前字符串 bpj勺權(quán)值ω,即定義提取的字符串為一個(gè)二元組〈bp u ω > ;
[0033] 步驟S16 :將字符串bpjl加到長度為L的字符串集合BPS沖,即BPS f {bpsL|bpsL=< bp L, ω > };
[0034] 步驟S17 :繼續(xù)從正常程序訓(xùn)練集BPa選擇其他正常程序,重復(fù)步驟S21至步驟 S26,將字符串添加到長度為L的字符串集合BPS^中;
[0035] 步驟S18 :將字符串長度L取不同的值,重復(fù)步驟Sll至步驟S17,生成不同長度正 常程序字符串集合庫BPS,即BPS = BPS1U BPS2U BPS3 U…,其中下標(biāo)用于標(biāo)識字L取不 同值時(shí)所對應(yīng)的正常程序字符串集合庫。
[0036] 具體的,在上述的步驟S2中,如圖3所示,提取程序特征向量,構(gòu)建正常程序模型 的步驟包括:
[0037] 步驟S21 :從正常程序訓(xùn)練集BPb中的一個(gè)正常程序bp依次提取字符串長度為L 的字符串bpy每次滑動一個(gè)字節(jié);
[0038] 步驟S22 :計(jì)算字符串bp^在BPS中字符串長度為L的字符串集合BPS ^中出現(xiàn)的 次數(shù)與從正常程序bp中提取長度為L的字符串總數(shù)之比,作為bp的一維的特征值即L 的每個(gè)取值對應(yīng)bp的一維特征值;
[0039] 步驟S23 :在字符串長度L的當(dāng)前取值下,累加正常程序bp在BPS集合中出現(xiàn)的 字符串對應(yīng)的字符串權(quán)值,其計(jì)算結(jié)果用I表示;
[0040] 步驟S24:字符串長度L取不同值,重復(fù)上述步驟,得到正常程序bp的多維特 征(維數(shù)取決于L的取值個(gè)數(shù)),從而得到一個(gè)表示正常程序bp的特征向量,即bp = < c2, (V> ;將正常程序bp在BPS出現(xiàn)的字符串權(quán)值的累加值除以系數(shù)δ (〇 < δ < 1) 作為正常程序bp的泛化值(假設(shè)L的取值個(gè)數(shù)為Ν,則每個(gè)正常程序的泛化值為:Ν個(gè)I 累加和除以S ),采用泛化值的方法可有效減少訓(xùn)練用正常程序的數(shù)量;進(jìn)一步地,如果前 述字符串權(quán)值越大,表明出現(xiàn)次數(shù)越多,正常程序也越多,則可以賦予一個(gè)較大的泛化值, 可代表更多未知的正常程序;
[0041] 步驟S25 :對正常程序訓(xùn)練集BPb中的所有正常程序重復(fù)上述步驟,從而構(gòu)建起正 常程序模型。
[0042] 具體的,在上述的步驟S3中,如圖4所示,生成檢測器的步驟包括:
[0043] 步驟S31 :隨機(jī)生成一個(gè)檢測器,生成檢測器的維數(shù)與步驟S2中所提取的正常程 序特征向量的維數(shù)一致;
[0044] 步驟S32 :計(jì)算隨機(jī)生成的檢測器與正常程序模型中向量的最短歐幾里德距離 dm
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1