本發(fā)明涉及復雜網絡技術領域,尤其涉及一種電話通信網絡中節(jié)點敏感性排序的方法。
背景技術:
隨著移動終端設備的發(fā)展,手機已成為人們日常生活交流的重要通信設備,每天有大量的通信數據產生,包括短信和電話記錄,如果把通信的雙方看成節(jié)點,一次通信看作一條連邊,那整個通信網絡就是一個巨大且復雜的網絡系統(tǒng)。如何定量分析通信網絡中節(jié)點的重要程度仍然是一個待解決的問題。
網絡節(jié)點重要性的評價主要有基于網絡拓撲結構和基于節(jié)點屬性兩個方面?;诰W絡拓撲結構的方法有:局部網絡結構、全局網絡結構以及基于網絡位置屬性等指標?;诠?jié)點屬性的重要性排序方法有基于個體行為特征,個體基本信息特征等。
局部網絡結構主要從節(jié)點自身和其鄰居屬性如度來分析,分析局部結構屬性計算復雜度較低,適用于大型網絡。
基于個體基本信息特征的有如facebook上用戶的年齡、性別等屬性,這些屬性左右著用戶的影響力。
在犯罪網絡的研究方法中,有根據罪犯的通信行為建立社會網絡,通過行為動力學分析來判斷和挖掘罪犯;也有對已知罪犯進行標記,根據邊權計算其余節(jié)點的相對重要性,來挖掘犯罪可疑分子。
通過以上研究分析發(fā)現,目前已經有很多關于網絡節(jié)點重要性的研究,但是如何提取節(jié)點特征,如何準確而又高效地提升計算方法,還有待進一步研究。
技術實現要素:
本發(fā)明的目的在于解決現有技術存在的缺陷,提供一種電話通信網絡中節(jié)點敏感性排序的方法,有效挖掘敏感節(jié)點,大大提升了靈活性。
為實現上述發(fā)明目的,本發(fā)明采用如下方案:
一種電話通信網絡中節(jié)點敏感性排序的方法,包括以下步驟:
(1)建立手機機身碼與號碼映射關系,同時統(tǒng)計每個機身碼的通話總次數,用于后續(xù)基于結構的分析和號碼間的相似度計算;
(2)構建重點關注手機號碼、重點關注區(qū)域、重點關注時間的三張表,表名分別為focusnumberlist、focusarealist、focustimelist,為后續(xù)計算號碼敏感指數做準備;
(3)基于結構的敏感性指數計算方法,分別計算一機多號敏感指數、一號多機敏感指數、重點關注號碼敏感指數、重點關注時間敏感指數、重點關注區(qū)域敏感指數、本國通話強度敏感指數、主叫國外通話強度敏感指數、接聽國外通話強度敏感指數和號碼伴隨敏感指數,具體計算方法如下:
①一機多號敏感指數計算
對一個手機使用多個號碼的機身碼進行建模,通過模型計算得到一機多號敏感指數,計算公式如下:
其中i為當前機身碼對應的第i個號碼,call_sumi為第i個號碼的通話次數總和,mobilenum_sumi為第i個號碼使用過的手機數量,k為該機身碼使用過的號碼總數,β為0到1的調節(jié)參數,取0.5;
②一號多機敏感指數計算
對多個手機使用同一號碼的號碼進行敏感指數分析建模,通過模型計算得到一號多機敏感指數,具體的計算公式如下:
其中imei_sum為使用過該號碼的手機數量,call_sum為該號碼的所有通話次數,β為0到1的調節(jié)參數,取0.5;
③重點關注區(qū)域敏感指數計算
首先添加區(qū)域以及關注指數,通過對通話詳單進行分析,統(tǒng)計該區(qū)域內的通話記錄,對出現在關注區(qū)域內的通話進行建模,通過模型計算得到重點關注區(qū)域敏感指數,計算公式如下:
其中contact_sumi為第i個區(qū)域內的通話次數,importancei為該關注區(qū)域的重要性值,k為關注區(qū)域數。
對數值進行平滑處理,使importancearea介于0至1之間,最終的計算公式如下:
其中importancefocusarea為平滑處理后的重點關注區(qū)域敏感指數,α、β為一個小于1并且大于0的調節(jié)參數,α取0.2,β為10-5;
④重點關注時間敏感指數計算
首先添加時間區(qū)間以及對應的敏感值,通過分析通話詳單,統(tǒng)計該時間段內的通話記錄,對出現在關注時間內的通話進行敏感指數分析建模,通過模型計算得到重點關注時間敏感指數,具體的計算公式如下:
其中contact_sumi為第i個時間區(qū)間內的通話次數,importancei為該關注時間段的敏感值,k為關注時間區(qū)間個數;
對數值進行平滑處理,使importancetime介于0至1之間,最終的計算公式如下,
其中importancefocustime平滑處理后的重點關注時間敏感指數,α、β為一個小于1并且大于0的小數,α取0.2,β為10-5;
⑤重點關注號碼敏感指數計算
在構建全局重點關注號碼集后,使用相對重要性計算模型分析重點關注號碼的敏感性對其他號碼的影響;
⑥本國通話強度敏感指數計算;
通過對通話詳單進行分析,統(tǒng)計每個號碼的國內通話次數以及國內通話聯系人數,進而利用國內通話強度敏感指數模型進行計算,得到這個號碼的國內通話強度敏感指數;
具體的計算公式如下:
其中domesticcontact_sum為該號碼的國內聯系人數量,domesticcall_sum為該號碼的所有通話次數,β為0到1的調節(jié)參數,這里取0.5;
⑦主叫國外通話強度敏感指數計算
通過對通話詳單進行分析,統(tǒng)計每個號碼的主叫國外通話次數以及主叫國外的通話聯系人數,進而利用主叫國外通話強度敏感指數模型進行計算,得到這個號碼的主叫國外通話強度敏感指數;
具體的計算公式如下:
其中callforeigncontact_sum為該號碼主叫國外聯系人數量,callforeign_sum為該號碼的所有主叫國外的通話次數,β為0到1的調節(jié)參數,取0.5;
⑧接聽國外通話強度敏感指數計算
通過對通話詳單進行分析,統(tǒng)計每個號碼的被叫國外通話次數以及被叫國外的通話聯系人數,進而利用被叫國外通話強度敏感指數模型進行計算,得到這個號碼的接聽國外通話強度敏感指數;
具體的計算公式如下:
其中calledforeigncontact_sum為該號碼被叫國外聯系人數量,callforeign_sum為該號碼的所有被叫國外的通話次數,β為0到1的調節(jié)參數,取0.5;
⑨號碼伴隨敏感指數計算
包括普通號碼伴隨和重點關注號碼伴隨,通過對通話詳單進行分析,統(tǒng)計總是與當前號碼在同一時間范圍、同一地點范圍出現的其他號碼,利用伴隨敏感指數模型進行計算,得到號碼的伴隨敏感指數;
具體的計算公式如下:
其中accompany_sumi為該號碼與第i個號碼伴隨的次數,call_sum為該號碼通話次數總和,β為0到1的調節(jié)參數,取0.5,k為伴隨號碼數量;
(4)設置權重,計算敏感值
根據需要設置不同權重系數,將步驟(3)中所求得的各項敏感指數值進行加權求和得到最終的敏感值,計算出各個號碼的敏感值,并對各個號碼的敏感值進行排序。由于敏感值與號碼重要性呈正相關,所以敏感值越高,號碼的重要性越高。
進一步,步驟(3)中重點關注號碼敏感值計算過程中,重點關注號碼集的敏感值計算方法如下:
首先,定義關注指數值大于0的號碼為關注號碼,初始關注號碼具有兩種來源:
1)手動配置參與計算的重點關注號碼集,此類型號碼敏感值在擴散過程中不會改變,可定義為importantseednumber;
2)通過關注區(qū)域和關注時間計算得到的重點關注號碼集,此類型號碼重要性在擴散過程中會受到其鄰居節(jié)點的敏感值變化而改變,初始敏感值取關注區(qū)域和關注時間敏感值的算術平均數,計算公式如下:
importancefocusnumber
=(importancefocusarea+importancefocustime)/2
擴散過程中除種子號碼外,其余號碼的敏感值隨著其鄰居節(jié)點敏感值改變,直至擴散到一個極大連通子圖,具體擴散過程如下:
(i)初始,除了標記的重點關注號碼集importantseednumber,還有通過關注區(qū)域和關注時間計算得到的;
(ii)由關注號碼進行擴散,其鄰居敏感值的計算公式為:
其中contact_sumi為與第i個關注號碼的通話次數,importancei為該號碼的敏感值,k為與號碼i通話的號碼數;
對其進行平滑處理,得到如下公式:
受鄰居節(jié)點重要性影響,平滑以后的重要性計算公式為:
公式(1)與(2)中α、β為一個小于1并且大于0的小數,而β通常接近于0;公式(2)中k為號碼鄰居中關注號碼系數大于0.7的個數;
(iii)更新重要性,取公式(1)、(2)中最大值為該號碼新的敏感值;
importancefocusnumber
=max(importancefocusnumber_1,importancefocusnumber_2)
若無增加新的關注號碼,則退出,否則回到步驟(ii)。
進一步,通過統(tǒng)計分析整個通話詳單,建立機身碼與號碼映射關系。
進一步,步驟(3)中,在進行一機多號敏感指數計算前,通過對通話詳單進行分析,統(tǒng)計分析每個號碼的通話次數以及在此手機上使用過的號碼個數,如果手機使用的號碼個數超過1個,則認為此手機為一機多號,進而利用一機多號敏感指數模型進行計算。
進一步,步驟(3)中,在進行一號多機敏感指數計算前,通過對通話詳單進行分析,統(tǒng)計分析每個號碼的通話次數以及所持有的手機數量,進而利用一號多機敏感指數模型進行計算。
進一步,步驟(1)中,建立手機機身碼與號碼映射關系,包括一個機身碼對應多個號碼和一個號碼對應多個機身碼兩種情況。
本發(fā)明的電話通信網絡中節(jié)點敏感性排序的方法,通過對用戶通信的詳單、基站等數據,從結構和屬性兩方面進行建模,對每個號碼統(tǒng)計其一階、二階鄰居、通話時間序列、基站通話次數等屬性,從結構和屬性層面分析號碼相應的敏感指數值;對已經標注的重點關注號碼,將其敏感值擴散至其鄰居節(jié)點中,直至影響到整個連通子圖;對多個參數進行建模,對電話通信網絡中節(jié)點的屬性值進行加權求和,得到最終敏感指數值。這樣不僅從結構上分析敏感節(jié)點的通信傳播,還考慮了各個節(jié)點的通話屬性。這樣,能有效地挖掘敏感節(jié)點,大大提升了靈活性。
附圖說明
圖1是本發(fā)明計算節(jié)點敏感性的流程圖。
圖2是本發(fā)明計算重點號碼敏感值流程圖。
具體實施方式
下面結合附圖對本發(fā)明的具體實施流程進行描述,特別注意的是,敏感數據將用變量名代替。
參考圖1和圖2,本發(fā)明電話通信網絡中節(jié)點敏感性排序的方法,具體步驟如下:
(1)建立手機機身碼與號碼映射關系(機身碼可能對應多個號碼,號碼也可能對應多個機身碼),同時統(tǒng)計每個機身碼的通話總次數,用于后續(xù)基于結構的分析和號碼間的相似度計算;
(2)構建重點關注手機號碼、重點關注區(qū)域、重點關注時間的三張表,表名分別為focusnumberlist、focusarealist、focustimelist,為后續(xù)計算號碼敏感指數做準備;
(3)基于結構的敏感性指數計算方法,分別計算一機多號敏感指數、一號多機敏感指數、重點關注號碼敏感指數、重點關注時間敏感指數、重點關注區(qū)域敏感指數、本國通話強度敏感指數、主叫國外通話強度敏感指數、接聽國外通話強度敏感指數和號碼伴隨敏感指數,具體計算方法如下:
①一機多號敏感指數計算
對一個手機使用多個號碼的機身碼進行建模,通過模型計算得到一機多號敏感指數,計算公式如下:
其中i為當前機身碼對應的第i個號碼,call_sumi為第i個號碼的通話次數總和,mobilenum_sumi為第i個號碼使用過的手機數量,k為該機身碼使用過的號碼總數,β為0到1的調節(jié)參數,本發(fā)明中β取0.5;
②一號多機敏感指數計算
對多個手機使用同一號碼的號碼進行敏感指數分析建模,通過模型計算得到一號多機敏感指數,具體的計算公式如下:
其中imei_sum為使用過該號碼的手機數量,call_sum為該號碼的所有通話次數,β為0到1的調節(jié)參數,本發(fā)明中β取0.5;
③重點關注區(qū)域敏感指數計算
首先添加區(qū)域以及關注指數,通過對通話詳單進行分析,統(tǒng)計該區(qū)域內的通話記錄,對出現在關注區(qū)域內的通話進行建模,通過模型計算得到重點關注區(qū)域敏感指數,計算公式如下:
其中contact_sumi為第i個區(qū)域內的通話次數,importancei為該關注區(qū)域的重要性值,k為關注區(qū)域數。
對數值進行平滑處理,使importancearea介于0至1之間,最終的計算公式如下:
其中importancefocusarea為平滑處理后的重點關注區(qū)域敏感指數,α、β為一個小于1并且大于0的調節(jié)參數,α取0.2,β為10-5;
④重點關注時間敏感指數計算
首先添加時間區(qū)間以及對應的敏感值,通過分析通話詳單,統(tǒng)計該時間段內的通話記錄,對出現在關注時間內的通話進行敏感指數分析建模,通過模型計算得到重點關注時間敏感指數,具體的計算公式如下:
其中contact_sumi為第i個時間區(qū)間內的通話次數,importancei為該關注時間段的敏感值,k為關注時間區(qū)間個數;
對數值進行平滑處理,使importancetime介于0至1之間,最終的計算公式如下,
其中importancefocustime平滑處理后的重點關注時間敏感指數,α、β為一個小于1并且大于0的小數,α取0.2,β為10-5;
⑤重點關注號碼敏感指數計算
在構建全局重點關注號碼集后,使用相對重要性計算模型分析重點關注號碼的敏感性對其他號碼的影響,具體計算方法見權利要求說明第2部分;
⑥本國通話強度敏感指數計算;
通過對通話詳單進行分析,統(tǒng)計每個號碼的國內通話次數以及國內通話聯系人數,進而利用國內通話強度敏感指數模型進行計算,得到這個號碼的國內通話強度敏感指數;
具體的計算公式如下:
其中domesticcontact_sum為該號碼的國內聯系人數量,domesticcall_sum為該號碼的所有通話次數,β為0到1的調節(jié)參數,這里取0.5;
⑦主叫國外通話強度敏感指數計算
通過對通話詳單進行分析,統(tǒng)計每個號碼的主叫國外通話次數以及主叫國外的通話聯系人數,進而利用主叫國外通話強度敏感指數模型進行計算,得到這個號碼的主叫國外通話強度敏感指數;
具體的計算公式如下:
其中callforeigncontact_sum為該號碼主叫國外聯系人數量,callforeign_sum為該號碼的所有主叫國外的通話次數,β的取值同上;
⑧接聽國外通話強度敏感指數計算
通過對通話詳單進行分析,統(tǒng)計每個號碼的被叫國外通話次數以及被叫國外的通話聯系人數,進而利用被叫國外通話強度敏感指數模型進行計算,得到這個號碼的接聽國外通話強度敏感指數;
具體的計算公式如下:
其中calledforeigncontact_sum為該號碼被叫國外聯系人數量,callforeign_sum為該號碼的所有被叫國外的通話次數,β的取值同上;
⑨號碼伴隨敏感指數計算
包括普通號碼伴隨和重點關注號碼伴隨,通過對通話詳單進行分析,統(tǒng)計總是與當前號碼在同一時間范圍、同一地點范圍出現的其他號碼,利用伴隨敏感指數模型進行計算,得到號碼的伴隨敏感指數;
具體的計算公式如下:
其中accompany_sumi為該號碼與第i個號碼伴隨的次數,call_sum為該號碼通話次數總和,β的取值同上,k為伴隨號碼數量。
(4)設置權重,計算敏感值
根據需要設置不同權重系數,將步驟(3)中所求得的各項敏感指數值進行加權求和得到最終的敏感值,計算出各個號碼的敏感值,并對各個號碼的敏感值進行排序。由于敏感值與號碼重要性呈正相關,所以敏感值越高,號碼的重要性越高。
以下通過具體實施例說明本發(fā)明方法:本實施采用的通話記錄數65788條,號碼總數為7787個。
(1)統(tǒng)計機身碼(imei)與號碼映射關系,統(tǒng)計分析整個通話詳單,建立機身碼與號碼映射關系。映射關系可表示為“imei—numberlist”,“numberlist”為號碼數組。得到6組一機多號關系。
(2)配置重點關注號碼、重點關注區(qū)域、重點關注時間三張表,分別為focusnumberlist、focusarealist、focustimelist。為后續(xù)計算號碼的敏感值做準備。
(3)基于結構的敏感指數計算。主要包括一機多號敏感指數、一號多機敏感指數、伴隨影響敏感指數、重點關注號碼敏感指數、重點關注時間敏感指數、以及重點關注區(qū)域敏感指數等。特別需注意的是,此步驟完成后,根據重點關注區(qū)域敏感指數和重點關注時間敏感指數可算出一般號碼(非步驟2中配置的重點關注號碼)的重點關注號碼敏感指數。數據樣例如表1所示。
表1結構敏感值計算結果表
(4)權重配置。將步驟(3)中所求得的各項指標值進行加權求和得到最終敏感指數值。可根據需要為各指標配置不同權重,對各個號碼計算出不同敏感值如表2所示,假設各項權重標注在表頭中。
表2敏感性計算結果表
最后根據實際數據,得出的結果如表3(n1~n5為已知的敏感節(jié)點)所示。
表3計算結果表
最后應說明的是:以上實施例僅用于說明本發(fā)明的技術方案流程,并非限制此方案的使用范圍;對于本技術內的相關技術人員可以對方案中的參數進行替換和對方法進行適當限制。當然,這些替換或者限制若為本發(fā)明的精神和范圍內,任何發(fā)明都應被保護。