一種基于位圖分析的字符終端交互狀態(tài)自動(dòng)判定方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息安全、數(shù)據(jù)挖掘等技術(shù)領(lǐng)域,具體的說,是一種基于位圖分析的字符終端交互狀態(tài)自動(dòng)判定方法。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)逐漸普及,人們的生活與工作對(duì)網(wǎng)絡(luò)的依賴日益緊密,而隨之產(chǎn)生的安全問題也越來越受到關(guān)注。網(wǎng)絡(luò)終端是最常用的網(wǎng)絡(luò)交互工具之一。它們主要被分為“字符終端”(比如通過網(wǎng)絡(luò)登錄到一臺(tái)Linux服務(wù)器)與“圖形終端”(比如使用遠(yuǎn)程桌面連接到一臺(tái)Windows個(gè)人電腦)兩大類。
[0003]雖然兩者都是通過網(wǎng)絡(luò)獲取主機(jī)服務(wù)器的控制信息來決定終端顯示器上的顯示內(nèi)容但它們的工作原理完全不同一一前者需要的控制信息最小單位是“字符”,而后者的控制信息最小單位是“像素”。比如要在終端顯示器上顯示一個(gè)字符“A”,字符終端只需要在網(wǎng)絡(luò)中傳輸一個(gè)“A”而圖形終端則需要傳輸很多的像素信息(可以理解為用很多人眼難以分辨的小光點(diǎn)來組成字母“A”)。
[0004]所以字符終端簡(jiǎn)單穩(wěn)定但能夠顯示的內(nèi)容相對(duì)有限而圖形終端能夠顯示的內(nèi)容豐富多彩但對(duì)網(wǎng)絡(luò)帶寬和計(jì)算機(jī)運(yùn)算能力要求更高。所以時(shí)至今日,字符終端被主要運(yùn)用于金融、航空、數(shù)據(jù)維護(hù)等對(duì)穩(wěn)定和可靠性要求很高的領(lǐng)域;而圖形終端則更多地被使用在多媒體、娛樂、個(gè)人電腦等方向。
[0005]字符終端每天會(huì)在網(wǎng)絡(luò)上產(chǎn)生不計(jì)其數(shù)的數(shù)據(jù),這些數(shù)據(jù)中含有大量數(shù)據(jù)分析者所關(guān)注的關(guān)鍵信息,但是更多的則是毫無用處的冗余數(shù)據(jù),怎樣使用自動(dòng)化工具來區(qū)分出這些有效信息已經(jīng)成為一個(gè)亟待解決的問題。
[0006]字符終端的特點(diǎn):它在不同的交互狀態(tài)會(huì)使用對(duì)應(yīng)的交互界面與用戶溝通,如果能夠智能的區(qū)分各個(gè)交互狀態(tài),則能很大程度上過濾掉不需要的冗余數(shù)據(jù)。但卻存在如下難點(diǎn):終端屏幕所顯示的信息是用于給操作人員閱讀從而人工判斷出當(dāng)前終端處于什么樣之狀態(tài)的數(shù)據(jù),計(jì)算機(jī)自動(dòng)化工具對(duì)于這些略微模糊的判定難度很大。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于提供一種基于位圖分析的字符終端交互狀態(tài)自動(dòng)判定方法,通過對(duì)現(xiàn)有網(wǎng)絡(luò)字符終端技術(shù)的創(chuàng)新使用,提供一種準(zhǔn)確、高效、適用范圍廣泛的終端交互狀態(tài)自動(dòng)判定方法。
[0008]字符終端交互狀態(tài),是指終端屏幕通過顯示不同的字符信息來告知屏幕前的使用者當(dāng)前終端處于什么樣的交互狀態(tài),這些狀態(tài)包括但不限于:命令提示狀態(tài)、文本編輯狀態(tài)、消息回顯狀態(tài)以及各種混合狀態(tài)。在進(jìn)行自動(dòng)化數(shù)據(jù)篩選時(shí)這些狀態(tài)能否被準(zhǔn)確高效地判定是非常關(guān)鍵的技術(shù)指標(biāo),因?yàn)檫@涉及到在數(shù)據(jù)提取地早期階段進(jìn)行有效的數(shù)據(jù)過濾,對(duì)數(shù)據(jù)應(yīng)用效率有極大地影響。
[0009]為高效、自動(dòng)化的判斷字符終端交互狀態(tài)的當(dāng)前準(zhǔn)確狀態(tài),本發(fā)明通過下述技術(shù)方案實(shí)現(xiàn):一種基于位圖分析的字符終端交互狀態(tài)自動(dòng)判定方法,通過網(wǎng)絡(luò)監(jiān)控獲取字符終端用戶的客戶端與主機(jī)交互過程中產(chǎn)生的數(shù)據(jù),通過終端模擬對(duì)數(shù)據(jù)進(jìn)行分析,還原客戶端與主機(jī)之間的交互過程;然后在信息提取點(diǎn),固化字符終端的位圖信息,而后根據(jù)位圖信息的特征對(duì)數(shù)據(jù)加以過濾。
[0010]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,所述“通過網(wǎng)絡(luò)監(jiān)控獲取字符終端用戶的客戶端與主機(jī)交互過程中產(chǎn)生的數(shù)據(jù),通過終端模擬對(duì)數(shù)據(jù)進(jìn)行分析,還原客戶端與主機(jī)之間的交互過程;然后在信息提取點(diǎn),固化字符終端的位圖信息,而后根據(jù)位圖信息的特征對(duì)數(shù)據(jù)加以過濾”包括以下具體步驟:
步驟A:數(shù)據(jù)監(jiān)控,通過網(wǎng)絡(luò)監(jiān)控對(duì)字符終端用戶的客戶端與主機(jī)交互過程中所產(chǎn)生的所有數(shù)據(jù)進(jìn)行記錄;
步驟B:數(shù)據(jù)分析,對(duì)所記錄的字符終端用戶的客戶端與主機(jī)交互過程中所產(chǎn)生的所有數(shù)據(jù)進(jìn)行分析,區(qū)分出用戶請(qǐng)求數(shù)據(jù)和主機(jī)響應(yīng)數(shù)據(jù);
步驟C:終端模擬,經(jīng)步驟B后,分析得出的是主機(jī)響應(yīng)數(shù)據(jù)時(shí),主機(jī)發(fā)送給用戶的用于描述字符終端如何描繪和顯示屏幕信息的數(shù)據(jù)經(jīng)過終端模擬還原,重新描繪成人類可以直接閱讀的屏幕信息;
步驟D:生成位圖,在進(jìn)行終端模擬還原時(shí),在用戶操作節(jié)點(diǎn)觸發(fā)時(shí),將終端屏幕的整體顯示內(nèi)容看作一個(gè)位圖,并將該位圖的信息進(jìn)行記錄,所述操作節(jié)點(diǎn)觸發(fā)為用戶使用按鍵觸發(fā)或/和定時(shí)按鍵觸發(fā),用以與需要過濾的特征位圖進(jìn)行比對(duì),從而對(duì)數(shù)據(jù)進(jìn)行有效分類;
步驟E:特征比對(duì),將步驟D所記錄的位圖與特征庫(kù)內(nèi)的位圖樣本進(jìn)行比對(duì);
步驟F:數(shù)據(jù)篩選,經(jīng)步驟E后,當(dāng)符合某位圖樣本的特征時(shí),就可以一定程度上判定當(dāng)前屏幕顯示內(nèi)容的交互狀態(tài),從而進(jìn)一步將該屏幕的數(shù)據(jù)進(jìn)行分類篩選。
[0011]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,所述步驟C、步驟D中的終端模擬還原,為通過解析主機(jī)發(fā)送給客戶端的終端控制序列數(shù)據(jù),將客戶所看到的終端屏幕信息還原到監(jiān)控端,實(shí)現(xiàn)實(shí)時(shí)監(jiān)控用戶屏幕的功能。
[0012]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,在將客戶所看到的終端屏幕信息還原到監(jiān)控端時(shí),用戶使用字符終端的任何時(shí)刻,用戶所看到的屏幕信息都有一份終端模擬還原之后的備份,以備在后續(xù)時(shí)機(jī)恰當(dāng)時(shí)進(jìn)行位圖比對(duì)和/或字符比對(duì),從而自動(dòng)判定字符終端的交互狀態(tài)。
[0013]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,所述步驟E中的特征庫(kù),內(nèi)存儲(chǔ)有根據(jù)字符終端屏幕實(shí)際使用中,長(zhǎng)期操作經(jīng)驗(yàn)總結(jié)出的一系列位圖范例和字符范例所形成的位圖樣本和字符樣本,且將位圖樣本和字符樣本進(jìn)行有效分類。
[0014]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,經(jīng)步驟B后,當(dāng)分析得出的是用戶請(qǐng)求數(shù)據(jù)時(shí),則分析客戶端發(fā)送給主機(jī)的請(qǐng)求數(shù)據(jù),并在需要的時(shí)刻啟動(dòng)位圖比對(duì)動(dòng)作。
[0015]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,所述特征比對(duì)包括位圖比較階段和/或字符比較階段,所述位圖比對(duì)階段指將比對(duì)時(shí)刻的終端屏幕信息轉(zhuǎn)化為位圖格式形成位圖,而后將位圖與提前存儲(chǔ)在特征庫(kù)內(nèi)的位圖樣本進(jìn)行比較;所述字符比較階段指當(dāng)進(jìn)行位圖比對(duì)不能很精確地判斷當(dāng)前狀態(tài)時(shí),進(jìn)一步采用字符比對(duì),利用特征字符位于特征位置的模式進(jìn)行判斷,以準(zhǔn)確確定當(dāng)前字符終端交互狀態(tài)。
[0016]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,在進(jìn)行字符比對(duì)時(shí),所述特征字符位于特征位置的模式包括匹配模式狀態(tài)和/或通配模式狀態(tài),所述匹配模式狀態(tài)為位圖特定位置上的特定字符或字符串與提前存儲(chǔ)在特征庫(kù)內(nèi)的位圖樣本上的特定字符或字符串呈完全匹配狀態(tài),所述通配模式為位圖特定位置上的字符串與提前存儲(chǔ)在特征庫(kù)內(nèi)的位圖樣本上的特定字符串符合某種特定條件狀態(tài)。
[0017]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,根據(jù)位圖信息的特征對(duì)數(shù)據(jù)加以過濾后,還包括自動(dòng)判定字符終端的交互狀態(tài),所述自動(dòng)判定字符終端的交互狀態(tài)為在沒有人為接入的情況下,客戶端自動(dòng)判斷當(dāng)前終端屏幕處于什么狀態(tài)(命令提示符狀態(tài)、文本編輯狀態(tài)等),以決定該屏幕數(shù)據(jù)需不需要保留(例如大多數(shù)敏感設(shè)備的監(jiān)控者只關(guān)心用戶在命令提示符狀態(tài)下的操作內(nèi)容而不關(guān)心文本編輯狀態(tài)下的操作),從而剔除無用的數(shù)據(jù)信息。
[0018]進(jìn)一步的,為更好的實(shí)現(xiàn)本發(fā)明,所述信息提取點(diǎn),為目標(biāo)終端交互狀態(tài)需要被判定的某一個(gè)操作即將被執(zhí)行的前一刻。
[0019]本發(fā)明與現(xiàn)有技術(shù)相比,具有以下優(yōu)點(diǎn)及有益效果:
(I)本發(fā)明通過對(duì)現(xiàn)有網(wǎng)絡(luò)字符終端技術(shù)的創(chuàng)新使用,提供一種準(zhǔn)確、高效、適用范圍廣泛的終端交互狀態(tài)自動(dòng)判定方法。
[0020](2)本發(fā)明采用位圖比對(duì)與字符比對(duì)相結(jié)合的比對(duì)方式,可更加準(zhǔn)確的判斷出當(dāng)前的字符終端交互狀態(tài)是何種交互狀態(tài)。
[0021](3)本發(fā)明能夠根據(jù)所截取的位圖信息自動(dòng)化的確定出當(dāng)前交互狀態(tài)是命令提示狀態(tài)、文本編輯狀態(tài)、消息回顯狀態(tài)或各種混合狀態(tài)中的某一種狀態(tài)。
[0022](4)本發(fā)明具有部署便捷的特性:除了基本的網(wǎng)絡(luò)連接外,部署該發(fā)明所需的軟件模塊時(shí)不需要任何其他工具,操作人員使用任何一種主流終端及客戶端皆可。
[0023](5)本發(fā)明將位圖樣本和字符樣本存儲(chǔ)在同一個(gè)特征庫(kù)內(nèi),可有效提高特征對(duì)比效率。
【附圖說明】
[0024]圖1為本發(fā)明的工作流程圖。
[0025]圖2為本發(fā)明的工作原理圖。
【具體實(shí)施方式】
[0026]本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、信息安全技術(shù)以及數(shù)據(jù)挖掘技術(shù)等多方面內(nèi)容,是計(jì)算機(jī)技術(shù)在上述領(lǐng)域的一種綜合應(yīng)用。在本發(fā)明的實(shí)現(xiàn)過程中,會(huì)涉及到多個(gè)軟件功能模塊的應(yīng)用。申請(qǐng)人認(rèn)為,如在仔細(xì)閱讀申請(qǐng)文件、準(zhǔn)確理解本發(fā)明的實(shí)現(xiàn)原理和發(fā)明目的以后,在結(jié)合現(xiàn)有公知技術(shù)的情況下,本領(lǐng)域技術(shù)人