標(biāo)注短信類別的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域,特別是一種標(biāo)注短信類別的方法及裝置。
【背景技術(shù)】
[0002]隨著移動(dòng)終端的應(yīng)用發(fā)展,短信已經(jīng)成為人與人之間交流的一種重要的手段,短信在加強(qiáng)彼此聯(lián)系的同時(shí),也出現(xiàn)了諸如中獎(jiǎng)之類的騷擾短信,影響了用戶的正常工作和生活,用戶對(duì)此十分不滿。
[0003]目前,主要由人工對(duì)短信標(biāo)注類別,如中獎(jiǎng)、詐騙、房地產(chǎn)、股票等類別,并利用人工標(biāo)注好的類別對(duì)短信進(jìn)行過(guò)濾,以實(shí)現(xiàn)騷擾短信的攔截。一般人工標(biāo)注時(shí),一天大概能標(biāo)注5000條短信,對(duì)于大量過(guò)去的短信以及每天產(chǎn)生的新短信,通過(guò)人工標(biāo)注的方式顯然費(fèi)時(shí)費(fèi)力且效率較低,因而亟待提供一種有效的標(biāo)注短信類別的方案。
【發(fā)明內(nèi)容】
[0004]鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的標(biāo)注短信類別的方法及裝置。
[0005]依據(jù)本發(fā)明的一方面,提供了一種標(biāo)注短信類別的方法,包括:
[0006]采用預(yù)置的短信分類規(guī)則,構(gòu)造多分類的短信分類器,其中,所述短信分類器中的各個(gè)參數(shù)依據(jù)短信的屬性特征進(jìn)行設(shè)置;
[0007]獲取多種類別的短信,其中,每種類別的短信包含多條;
[0008]將所述多種類別的短信作為訓(xùn)練語(yǔ)料對(duì)所述短信分類器進(jìn)行訓(xùn)練,計(jì)算所述短信分類器中的各個(gè)參數(shù),得到訓(xùn)練后的短信分類器;
[0009]當(dāng)接收到一新短信時(shí),利用所述訓(xùn)練后的短信分類器將所述新短信標(biāo)注為所述多種類別中的一種。
[0010]可選地,所述采用預(yù)置的短信分類規(guī)則,構(gòu)造多分類的短信分類器,包括:
[0011]采用線性分類庫(kù)Liblinear構(gòu)造多分類的短信分類器;或者,
[0012]采用支持向量機(jī)分類庫(kù)Libsvm構(gòu)造多分類的短信分類器。
[0013]可選地,采用線性分類庫(kù)Liblinear構(gòu)造多分類的短信分類器,包括:
[0014]調(diào)用所述Liblinear中的動(dòng)態(tài)分類庫(kù);
[0015]利用調(diào)用的動(dòng)態(tài)分類庫(kù)構(gòu)造多分類的短信分類器。
[0016]可選地,所述獲取多種類別的短信,包括:
[0017]獲取人工標(biāo)注的多種類別的短信;或者,
[0018]接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信。
[0019]可選地,接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信之前,還包括:
[0020]對(duì)各個(gè)客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測(cè);
[0021]當(dāng)監(jiān)測(cè)到陌生電話號(hào)碼發(fā)來(lái)的短信時(shí),生成提示用戶對(duì)陌生電話號(hào)碼進(jìn)行標(biāo)注的提不?目息;
[0022]接收用戶對(duì)短信的標(biāo)注類別。
[0023]可選地,監(jiān)測(cè)到陌生電話號(hào)碼發(fā)來(lái)的短信,包括:
[0024]獲取當(dāng)前接收的短信對(duì)應(yīng)的電話號(hào)碼;
[0025]確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼時(shí),確定電話號(hào)碼為陌生電話號(hào)碼。
[0026]可選地,接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信之前,還包括:
[0027]獲取各個(gè)客戶端所在通信終端的電話號(hào)碼的歸屬地和/或地區(qū)編碼號(hào)段;
[0028]對(duì)所述各個(gè)客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測(cè);
[0029]判斷當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼的歸屬地和/或地區(qū)編碼號(hào)段是否與所述通信終端的電話號(hào)碼的歸屬地和/或地區(qū)編碼號(hào)段相同,如果不相同,則將所述當(dāng)前接收到的短信標(biāo)注為所述多種類別中的指定類別。
[0030]可選地,接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信之前,還包括:
[0031]獲取各個(gè)客戶端所在通信終端當(dāng)前所在地信息;
[0032]對(duì)所述各個(gè)客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測(cè);
[0033]判斷當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼的歸屬地是否與所述通信終端當(dāng)前所在地相同,如果不相同,則將所述當(dāng)前接收到的短信標(biāo)注為所述多種類別中的指定類別。
[0034]可選地,接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信之前,還包括:
[0035]獲取各個(gè)客戶端所在通信終端中保存的通訊錄信息;
[0036]對(duì)所述各個(gè)客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測(cè);
[0037]判斷所述通訊錄中是否存在與當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼具有相同歸屬地和/或地區(qū)編碼號(hào)段的電話號(hào)碼,如果不存在,則將所述當(dāng)前接收到的短信標(biāo)注為所述多種類別中的指定類別。
[0038]可選地,將所述多種類別的短信作為訓(xùn)練語(yǔ)料對(duì)所述短信分類器進(jìn)行訓(xùn)練,包括:
[0039]從所述多種類別的短信中提取屬性特征;
[0040]將提取的屬性特征和對(duì)應(yīng)的短信類別輸入所述短信分類器進(jìn)行訓(xùn)練。
[0041]可選地,利用所述訓(xùn)練后的短信分類器將所述新短信標(biāo)注為所述多種類別中的一種之后,還包括:
[0042]將標(biāo)注的所述新短信的類別下發(fā)給所述新短信的目的地址對(duì)應(yīng)的客戶端。
[0043]可選地,將標(biāo)注的所述新短信的類別下發(fā)給所述新短信的目的地址對(duì)應(yīng)的客戶端之后,還包括:
[0044]接收所述客戶端提交的關(guān)于標(biāo)注的所述新短信的類別的反饋信息;
[0045]根據(jù)所述反饋信息確定是否更新所述訓(xùn)練語(yǔ)料。
[0046]可選地,根據(jù)所述反饋信息確定是否更新所述訓(xùn)練語(yǔ)料,包括:
[0047]若所述反饋信息為所述新短信的類別為不同于標(biāo)注類別的其他類別,則確定根據(jù)所述新短信的其他類別更新所述訓(xùn)練語(yǔ)料。
[0048]依據(jù)本發(fā)明的另一方面,還提供了一種標(biāo)注短信類別的裝置,包括:
[0049]構(gòu)造模塊,適于采用預(yù)置的短信分類規(guī)則,構(gòu)造多分類的短信分類器,其中,所述短信分類器中的各個(gè)參數(shù)依據(jù)短信的屬性特征進(jìn)行設(shè)置;
[0050]獲取模塊,適于獲取多種類別的短信,其中,每種類別的短信包含多條;
[0051]訓(xùn)練模塊,適于將所述多種類別的短信作為訓(xùn)練語(yǔ)料對(duì)所述短信分類器進(jìn)行訓(xùn)練,計(jì)算所述短信分類器中的各個(gè)參數(shù),得到訓(xùn)練后的短信分類器;
[0052]標(biāo)注模塊,適于當(dāng)接收到一新短信時(shí),利用所述訓(xùn)練后的短信分類器將所述新短信標(biāo)注為所述多種類別中的一種。
[0053]可選地,所述構(gòu)造模塊還適于:
[0054]采用線性分類庫(kù)Liblinear構(gòu)造多分類的短信分類器;或者,
[0055]采用支持向量機(jī)分類庫(kù)Libsvm構(gòu)造多分類的短信分類器。
[0056]可選地,所述構(gòu)造模塊還適于:
[0057]調(diào)用所述Liblinear中的動(dòng)態(tài)分類庫(kù);
[0058]利用調(diào)用的動(dòng)態(tài)分類庫(kù)構(gòu)造多分類的短信分類器。
[0059]可選地,所述獲取模塊還適于:
[0060]獲取人工標(biāo)注的多種類別的短信;或者,
[0061]接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信。
[0062]可選地,所述獲取模塊包括:
[0063]監(jiān)測(cè)單元,適于在接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信之前,對(duì)各個(gè)客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測(cè);
[0064]生成單元,適于當(dāng)監(jiān)測(cè)到陌生電話號(hào)碼發(fā)來(lái)的短信時(shí),生成提示用戶對(duì)陌生電話號(hào)碼進(jìn)行標(biāo)注的提示信息;
[0065]接收單元,適于接收用戶對(duì)短信的標(biāo)注類別。
[0066]可選地,所述監(jiān)測(cè)單元還適于:
[0067]獲取當(dāng)前接收的短信對(duì)應(yīng)的電話號(hào)碼;
[0068]確定當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號(hào)碼時(shí),確定電話號(hào)碼為陌生電話號(hào)碼。
[0069]可選地,所述獲取模塊包括:
[0070]第一獲取單元,適于在接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信之前,獲取各個(gè)客戶端所在通信終端的電話號(hào)碼的歸屬地和/或地區(qū)編碼號(hào)段;
[0071]監(jiān)測(cè)單元,適于對(duì)所述各個(gè)客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測(cè);
[0072]第一判斷單元,適于判斷當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼的歸屬地和/或地區(qū)編碼號(hào)段是否與所述通信終端的電話號(hào)碼的歸屬地和/或地區(qū)編碼號(hào)段相同,如果不相同,則將所述當(dāng)前接收到的短信標(biāo)注為所述多種類別中的指定類別。
[0073]可選地,所述獲取模塊包括:
[0074]第二獲取單元,適于在接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信之前,獲取各個(gè)客戶端所在通信終端當(dāng)前所在地信息;
[0075]監(jiān)測(cè)單元,適于對(duì)所述各個(gè)客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測(cè);
[0076]第二判斷單元,適于判斷當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼的歸屬地是否與所述通信終端當(dāng)前所在地相同,如果不相同,則將所述當(dāng)前接收到的短信標(biāo)注為所述多種類別中的指定類別。
[0077]可選地,所述獲取模塊包括:
[0078]第三獲取單元,適于在接收至少一個(gè)客戶端上報(bào)的至少一種類別的短信之前,獲取各個(gè)客戶端所在通信終端中保存的通訊錄信息;
[0079]監(jiān)測(cè)單元,適于對(duì)所述各個(gè)客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測(cè);
[0080]第三判斷單元,適于判斷所述通訊錄中是否存在與當(dāng)前接收到的短信對(duì)應(yīng)的電話號(hào)碼具有相同歸屬地和/或地區(qū)編碼號(hào)段的電話號(hào)碼,如果不存在,則將所述當(dāng)前接收到的短信標(biāo)注為所述多種類別中的指定類別。
[0081 ] 可選地,所述訓(xùn)練模塊還適于:
[0082]從所述多種類別的短信內(nèi)容中提取屬性特征;
[0083]將提取的屬性特征和對(duì)應(yīng)的短信類別輸入所述短信分類器進(jìn)行訓(xùn)練。
[0084]可選地,所述裝置還包括:
[0085]下發(fā)模塊,適于在所述標(biāo)注模塊利用所述訓(xùn)練后的短信分類器將所述新短信標(biāo)注為所述多種類別中的一種之后,將標(biāo)注的所述新短信的類別下發(fā)給所述新短信的目的地址對(duì)