亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法

文檔序號:6541144閱讀:267來源:國知局
基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法
【專利摘要】一種基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法,模擬人工學(xué)習(xí)涉密歸屬過程建立涉密條件數(shù)據(jù)庫和詞歸類數(shù)據(jù)庫,涉密條件依據(jù)保密條例以詞類的組合中的每一個類作為涉密必要條件,與帶分析文章中的詞類組合比較,判斷涉密級別。本發(fā)明通過計算機(jī)分析文章的語句內(nèi)容,忽略語句的語法表達(dá),將語句抽象成為詞類的邏輯組合,并對照保密規(guī)定的組合條件,判定文章涉密信息密級,為客觀、快速的判定涉密文章和涉密級別提供了可行的基礎(chǔ)。
【專利說明】基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及涉密信息的密級歸屬技術(shù),具體說是一種基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法。
【背景技術(shù)】
[0002]傳統(tǒng)的文件定密方式,由于缺乏密級認(rèn)定的有效技術(shù)手段,定密時對密級界限把握不準(zhǔn),定密工作主觀性較強(qiáng)。對于內(nèi)容相似的文件,不同認(rèn)定人的認(rèn)定方式不同、認(rèn)定角度不同、認(rèn)定依據(jù)不同,導(dǎo)致認(rèn)定結(jié)果可能存在差異,嚴(yán)重影響了我軍密級認(rèn)定工作的嚴(yán)肅性和權(quán)威性。
[0003]我國信息化基礎(chǔ)設(shè)施經(jīng)過多年建設(shè),已形成較大規(guī)模,大部分政府、軍隊的部門已建設(shè)了 WWW、FTP、DNS、Email、OA等系統(tǒng)??陀^事實反映出,很多機(jī)關(guān)工作人員已經(jīng)養(yǎng)成了用字處理軟件(如WORD、PPT、TXT等)來撰寫、保存、傳遞文件的習(xí)慣。電子文件已經(jīng)成為軍隊各部門和其它各種組織的重要信息載體和傳輸方法。很明顯,信息化為各部門日常工作帶來了很大便利,同時也大幅度提高了工作效率。但是,在享受到計算機(jī)所帶來的方便性的同時,也出現(xiàn)了目前受到廣泛關(guān)注的信息安全問題。由于政府、軍隊在管理運(yùn)行中涉及到大量密級的信息,為了有效的保證各部門的正常運(yùn)行和信息安全性,有必要對以涉密信息為中心的信息安全實施準(zhǔn)確有效的級別歸屬劃分,以便規(guī)范信息的流通范圍。依靠計算機(jī)技術(shù),解決當(dāng)前密級鑒定方法單一、主觀性強(qiáng)的問題,為密級鑒定工作提供科學(xué)依據(jù),提高密級鑒定工作效率,實現(xiàn)涉密定級數(shù)字化、信息歸類電子化、輔助決策智能化早已經(jīng)成為目前急于解決的課題。

【發(fā)明內(nèi)容】

[0004]本發(fā)明所要解決的技術(shù)問題是解決當(dāng)前密級鑒定方法單一、主觀性強(qiáng)的問題。達(dá)到為密級鑒定工作提供科學(xué)依據(jù),提高密級鑒定工作效率,實現(xiàn)保密定級數(shù)字化、輔助決策智能化的目的。提供一種基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法。
[0005]所述基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法,其特征是:按下述步驟順次進(jìn)行:
[0006]第一步:建立密級條件數(shù)據(jù)庫:
[0007]逐條分析保密條例,并收集與該保密條例相關(guān)的文章,將文章中與條例對應(yīng)的涉密信息歸納為若干必要條件的相關(guān)詞和相關(guān)詞組合,包括相關(guān)詞和相關(guān)詞組合、涉及條件類別、涉及領(lǐng)域、對應(yīng)的條例編號建立邏輯關(guān)聯(lián),錄入密級條件數(shù)據(jù)庫;分別按照“絕密級條件數(shù)據(jù)庫”、“機(jī)密級條件數(shù)據(jù)庫”、“秘密級條件數(shù)據(jù)庫”三個子庫進(jìn)行獨(dú)立收集;
[0008]第二步:建立和豐富詞歸類數(shù)據(jù)庫:
[0009](一)、在與對應(yīng)保密條例相關(guān)的文章中統(tǒng)計所有該條例涉及到的必要條件的組合,并歸納為若干條件大類;
[0010](二)、分析每個條件大類,確定每個條件大類所包含的類的集合;將每一詞歸類再逐級分解為若干類的子集,直至集合不可再分;
[0011](三)、分析每一個末端子集,列出其中具有代表性的詞語或詞組,依照逐級從屬的邏輯關(guān)系建立詞歸類數(shù)據(jù)庫;
[0012](四)、從詞歸類數(shù)據(jù)庫中讀取詞語或詞組,運(yùn)用抓詞技術(shù),根據(jù)代表詞語或詞組,掃描現(xiàn)有密級文章,根據(jù)詞歸類數(shù)據(jù)庫所保存的詞的類抓取具體詞匯,排除錯詞、誤詞,豐富詞歸類數(shù)據(jù)庫;
[0013]第三步:對待定密級文章初定密級:
[0014](一)、掃描文章的段落或語句,利用正則表達(dá)式表述已經(jīng)在詞歸類數(shù)據(jù)庫中歸類的信息,根據(jù)該信息特征將文章語句中符合詞歸類數(shù)據(jù)庫的詞語提取出來;
[0015](二)、索引詞歸類數(shù)據(jù)庫,判斷詞匯所屬的類;
[0016](三)、確定語句或段落中的類的組合;
[0017](四)、判斷語句或段落中類的組合是否完全滿足密級條件數(shù)據(jù)庫中的任一組合條件,滿足則認(rèn)定該語句或段落所屬部分的密級為該組合條件所在數(shù)據(jù)庫的密級,文章的涉密級別按照文章中全部語句或段落之中密級的最高級定義,密級的高低順序依次為絕密〉機(jī)密 > 秘密,如果不滿足任何涉密條件,則文章不涉密;
[0018]第四步:確定密級:文章中出現(xiàn)多處滿足秘密或機(jī)密級的條件時,由下述方式確定是否將文章密級升級:
[0019](一)、在不同領(lǐng)域中,找出涉密領(lǐng)域為i的文章m篇,m3500,分析與該領(lǐng)域直接相關(guān)的涉密信息,發(fā)現(xiàn)密級升高 的情況為k篇,該領(lǐng)域內(nèi)涉密文章密級上升所需要的最少信息數(shù)為bi;
[0020]bi=MIN (集合{ay}),
[0021]表示為涉密領(lǐng)域i中的k篇密級升高文章中每篇涉密信息數(shù)中的最小值,其中au表示涉密領(lǐng)域i中的第j篇文章的涉密信息數(shù),其中j表示I~k之中的一個數(shù);
[0022](二)、對于初步判定為非絕密級的涉密文件,依照公式
【權(quán)利要求】
1.一種基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法,其特征是:按下述步驟順次進(jìn)行: 第一步:建立密級條件數(shù)據(jù)庫: 逐條分析保密條例,并收集與該保密條例相關(guān)的文章,將文章中與條例對應(yīng)的涉密信息歸納為若干必要條件的相關(guān)詞和相關(guān)詞組合,包括相關(guān)詞和相關(guān)詞組合、涉及條件類別、涉及領(lǐng)域、對應(yīng)的條例編號,建立邏輯關(guān)聯(lián),錄入密級條件數(shù)據(jù)庫;分別按照“絕密級條件數(shù)據(jù)庫”、“機(jī)密級條件數(shù)據(jù)庫”、“秘密級條件數(shù)據(jù)庫”三個子庫進(jìn)行獨(dú)立收集; 第二步:建立和豐富詞歸類數(shù)據(jù)庫: (一)、在與對應(yīng)保密條例相關(guān)的文章中統(tǒng)計所有該條例涉及到的必要條件的組合,并歸納為若干條件大類; (二 )、分析每個條件大類,確定每個條件大類所包含的類的集合;將每一詞歸類再逐級分解為若干類的子集,直至集合不可再分; (三)、分析每一個末端子集,列出其中具有代表性的詞語或詞組,依照逐級從屬的邏輯關(guān)系建立詞歸類數(shù)據(jù)庫; (四)、從詞歸類數(shù)據(jù)庫中讀取詞語或詞組,運(yùn)用抓詞技術(shù),根據(jù)代表詞語或詞組,掃描現(xiàn)有密級文章,根據(jù)詞歸類數(shù)據(jù)庫所保存的詞的類抓取具體詞匯,排除錯詞、誤詞,豐富詞歸類數(shù)據(jù)庫; 第三步:對待定密級文章初定密級: (一)、掃描文章的段落或語句,利用正則表達(dá)式表述已經(jīng)在詞歸類數(shù)據(jù)庫中歸類的信息,根據(jù)該信息特征將文章語句中符合詞歸類數(shù)據(jù)庫的詞語提取出來; (二 )、索引詞歸類數(shù)據(jù)庫,判斷詞匯所屬的類; (三)、確定語句或段落中的類的組合; (四)、判斷語句或段落中類的組合是否完全滿足密級條件數(shù)據(jù)庫中的任一組合條件,滿足則認(rèn)定該語句或段落所屬部分的密級為該組合條件所在數(shù)據(jù)庫的密級,文章的涉密級別按照文章中全部語句或段落之中密級的最高級定義,密級的高低順序依次為絕密 > 機(jī)密>秘密,如果不滿足任何涉密條件,則文章不涉密; 第四步:確定密級:文章中出現(xiàn)多處滿足秘密或機(jī)密級的條件時,由下述方式確定是否將文章密級升級: (一)、在不同領(lǐng)域中,找出涉密領(lǐng)域為i的文章m篇,m ^ 500,分析與該領(lǐng)域直接相關(guān)的涉密信息,發(fā)現(xiàn)密級升高的情況為k篇,該領(lǐng)域內(nèi)涉密文章密級上升所需要的最少信息數(shù)為bi, 則 bi=MIN (集合{ajj}), 表示為涉密領(lǐng)域i中的k篇密級升高文章中每篇涉密信息數(shù)中的最小值,其中au表示涉密領(lǐng)域i中的第j篇文章的涉密信息數(shù),其中j表示1~k之中的一個數(shù); (二 )、對于初步判定為非絕密級的涉密文件,依照公式α=ci/bi, 其中,Ci表示文章中在領(lǐng)域i中的涉密信息數(shù),當(dāng)密級升級條件a ≥ 1則判定文章密級升級。
2.根據(jù)權(quán)利要求1所述的基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法,其特征是:在第三步中,如果文章的初定密級與人為設(shè)定不符,則需要在詞歸類數(shù)據(jù)庫中添加新的涉密詞匯或詞歸類的組合,添加時關(guān)聯(lián)新詞、新詞的類和具體的保密條例。
3.根據(jù)權(quán)利要求1所述的基于詞歸類組合判定與概率統(tǒng)計的涉密信息密級歸屬方法,其特征是:在第四步中,當(dāng)α < I時,設(shè)定最優(yōu)誤差率為β,當(dāng)1-β < α < I時,該文章的整體密級為可上升密級,β的計算值為:
【文檔編號】G06F21/60GK103870758SQ201410103973
【公開日】2014年6月18日 申請日期:2014年3月20日 優(yōu)先權(quán)日:2014年3月20日
【發(fā)明者】陳建, 歐陽國華, 楊興, 李楠, 史章軍, 向音, 呂慧芳 申請人:陳建, 歐陽國華, 楊興, 李楠
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1