亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種移動終端及其有效過濾垃圾信息的方法和裝置制造方法

文檔序號:6627924閱讀:210來源:國知局
一種移動終端及其有效過濾垃圾信息的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種移動終端及其有效過濾垃圾信息的方法和裝置,屬于移動終端【技術(shù)領(lǐng)域】。該有效過濾垃圾信息的方法包括:接收到消息時,獲取接收到消息的消息內(nèi)容;將消息內(nèi)容中的文字轉(zhuǎn)換成拼音;通過輸入法詞庫對轉(zhuǎn)換成的拼音進行語義分析;根據(jù)語義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過濾消息內(nèi)容。本發(fā)明通過將接收到的消息內(nèi)容轉(zhuǎn)換成拼音,再根據(jù)拼音的語義判斷接收到的消息是否為垃圾消息,能夠有效過濾垃圾消息。
【專利說明】一種移動終端及其有效過濾垃圾信息的方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動終端【技術(shù)領(lǐng)域】,具體涉及一種移動終端及其有效過濾垃圾信息的方法和裝置。

【背景技術(shù)】
[0002]隨著智能移動終端的廣泛普及,移動互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,移動終端中的即時工具經(jīng)常會收發(fā)大量的信息。人們在享受信息浪潮所帶來的便利同時,也需要忍受大量垃圾信息的騷擾,給用戶帶來困擾。
[0003]針對這種狀況,很多移動終端安全軟件應(yīng)運而生,以過濾垃圾信息,給用戶清凈的移動終端使用環(huán)境。常見的過濾方法包括:根據(jù)手機號碼過濾,未知聯(lián)系人信息過濾;黑名單過濾;預(yù)置內(nèi)容的過濾;一定時間預(yù)置內(nèi)接收同一個號碼發(fā)送的信息條數(shù)等。
[0004]雖然目前的安全軟件可以攔截大多數(shù)垃圾信息,但垃圾制造者也在不斷的改進垃圾信息的表達方式。比如:為了防止關(guān)鍵詞的屏蔽,通過將關(guān)鍵詞通過一些特殊字符隔開;對于表達的內(nèi)容通過同音字、諧音字表達。有的垃圾推送者甚至將上述多種方法的組合,導(dǎo)致安全軟件無法有效攔截垃圾信息,從而給用戶帶來煩惱。


【發(fā)明內(nèi)容】

[0005]本發(fā)明提供一種移動終端及其有效過濾垃圾信息的方法和裝置,以達到有效過濾垃圾信息的目的,克服上述現(xiàn)有安全軟件無法識別到垃圾關(guān)鍵字的缺陷。
[0006]本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下。
[0007]根據(jù)本發(fā)明的一個方面,提供的一種有效過濾垃圾信息的方法,該方法包括:接收到消息時,獲取接收到消息的消息內(nèi)容;將消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼音;通過輸入法詞庫對轉(zhuǎn)換成的拼音進行語義分析;根據(jù)語義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過濾消息內(nèi)容。
[0008]優(yōu)選地,針對上述通過輸入法詞庫對轉(zhuǎn)換成的拼音進行語義分析,該方法還包括:根據(jù)輸入法詞庫,將獲取到的拼音翻譯成所有可能的中文語句;對每一種翻譯后的語句進行分詞,獲取所有語句分詞后的所有詞匯;以所有可能的語句的數(shù)量為基數(shù),計算每個詞匯出現(xiàn)的頻率;根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取每個詞匯的權(quán)重,若預(yù)設(shè)的垃圾關(guān)鍵字中沒有對應(yīng)的詞匯,則將該詞匯的權(quán)重記為零;結(jié)合每個詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計算消息內(nèi)容的垃圾相似度。
[0009]優(yōu)選地,針對上述根據(jù)語義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,該方法還包括:當(dāng)計算的垃圾相似度的值超過預(yù)設(shè)的閾值時,判斷消息內(nèi)容為垃圾消息。
[0010]優(yōu)選地,在上述通過輸入法詞庫對轉(zhuǎn)換成的拼音進行語義分析的步驟之前,該方法還包括:提取消息內(nèi)容中所包含的預(yù)設(shè)的字符;剔除提取到的字符。
[0011]優(yōu)選地,在上述將消息內(nèi)容中的文字轉(zhuǎn)換成拼音的步驟之前,該方法還包括:判斷消息內(nèi)容中的文字是否包含有預(yù)設(shè)的字段,若是,則判斷消息內(nèi)容為垃圾消息。
[0012]優(yōu)選地,上述消息內(nèi)容包括郵件消息、短息消息、應(yīng)用程序接收到的消息。
[0013]根據(jù)本發(fā)明的另一個方面,提供的一種有效過濾垃圾信息的裝置,該裝置包括:消息內(nèi)容獲取模塊,用于接收到消息時,獲取接收到消息的消息內(nèi)容;拼音轉(zhuǎn)換模塊,用于將消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼音;語義分析模塊,用于通過輸入法詞庫對轉(zhuǎn)換成的拼音進行語義分析;第一判斷模塊,用于根據(jù)語義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過濾消息內(nèi)容。
[0014]優(yōu)選地,該有效過濾垃圾信息的裝置還包括:翻譯模塊,用于根據(jù)輸入法詞庫,將獲取到的拼音翻譯成所有可能的中文語句;分詞模塊,用于對每一種翻譯后的語句進行分詞,獲取所有語句分詞后的所有詞匯;頻率計算模塊,用于以所有可能的語句的數(shù)量為基數(shù),計算每個詞匯出現(xiàn)的頻率;權(quán)重獲取模塊,用于根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取每個詞匯的權(quán)重,若預(yù)設(shè)的垃圾關(guān)鍵字中沒有對應(yīng)的詞匯,則將該詞匯的權(quán)重記為零;垃圾相似度計算模塊,用于結(jié)合每個詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計算消息內(nèi)容的垃圾相似度;第二判斷模塊,用于當(dāng)計算的垃圾相似度的值超過預(yù)設(shè)的閾值時,判斷消息內(nèi)容為垃圾消息。
[0015]優(yōu)選地,該有效過濾垃圾信息的裝置還包括:字符提取模塊,用于提取消息內(nèi)容中所包含的預(yù)設(shè)的字符;字符剔除模塊,用于剔除提取到的字符。
[0016]根據(jù)本發(fā)明的又一個方面,提供的一種移動終端,該移動終端包括上述一種有效過濾垃圾信息的裝置。
[0017]本發(fā)明提供了一種移動終端及其有效過濾垃圾信息的方法和裝置,將消息內(nèi)容中的特殊字符剔除,并將接收到的消息內(nèi)容轉(zhuǎn)換成拼音,再根據(jù)拼音的語義判斷接收到的消息是否為垃圾消息,使得垃圾推送者通過將消息內(nèi)容中的某些文字編輯成拼音或在消息內(nèi)容中插入特殊字符的方式躲避被檢測到垃圾關(guān)鍵字的意圖無所遁形,給用戶一個清凈的使用環(huán)境。

【專利附圖】

【附圖說明】
[0018]圖1為根據(jù)本發(fā)明的一個實施例的有效過濾垃圾信息的方法的流程圖;
[0019]圖2為根據(jù)本發(fā)明的一個實施例的語義分析方法的流程圖;
[0020]圖3為根據(jù)本發(fā)明的一個實施例的剔除特殊字符的方法的流程圖;
[0021]圖4為根據(jù)本發(fā)明的一個實施例的有效過濾垃圾信息的裝置的示范性結(jié)構(gòu)框圖;
[0022]圖5為根據(jù)本發(fā)明的一個實施例的語義分析模塊的示范性結(jié)構(gòu)框圖;
[0023]圖6為根據(jù)本發(fā)明的一個實施例的移動終端的示范性結(jié)構(gòu)框圖。

【具體實施方式】
[0024]以下結(jié)合附圖對本發(fā)明的原理和特征進行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
[0025]實施例一
[0026]圖1為根據(jù)本發(fā)明的一個實施例的有效過濾垃圾信息的方法的流程圖,下面結(jié)合圖1來描述根據(jù)本發(fā)明的一個實施例的有效過濾垃圾信息的方法,如圖1所示,為了避免垃圾消息推送者將消息中的部分文字編輯成拼音以逃避垃圾關(guān)鍵字的識別,該方法包括以下步驟:
[0027]S10、接收到消息時,獲取接收到的消息的消息內(nèi)容;
[0028]S20、將消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼曰;
[0029]S30、通過輸入法詞庫對轉(zhuǎn)換成的拼音進行語義分析;
[0030]S40、根據(jù)語義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過濾消息內(nèi)容,否則,正常(常規(guī))顯示消息內(nèi)容。
[0031]其中,在上述步驟S20之前,該有效過濾垃圾信息的方法還包括初步過濾,具體的,該初步過濾的方法為:
[0032]判斷消息內(nèi)容中的文字是否包含有預(yù)設(shè)的字段,若是,則判斷消息內(nèi)容為垃圾消息。該預(yù)設(shè)的字段包括但不限于:中獎、折扣、禮包等。
[0033]如果在初步過濾階段就能識別接收到的消息為垃圾消息,就沒有必要進行后續(xù)的拼音轉(zhuǎn)換以及語義識別動作,節(jié)約程序。
[0034]作為可選的,上述初步過濾的方法還可以包括:
[0035]檢測發(fā)來消息的號碼是否為預(yù)設(shè)的黑名單號碼,若是,則過濾所述接收到的消息。
[0036]其中,上述消息內(nèi)容包括但不限于郵件消息、短息消息、應(yīng)用程序接收到的消息。該應(yīng)用程序例如微信、QQ等即時聊天工具。
[0037]作為可選的,該有效過濾垃圾信息的方法還可以包括:
[0038]獲取接收到消息的消息內(nèi)容時,檢測垃圾信息攔截功能是否開啟,若是,則進入步驟S20,并執(zhí)行后續(xù)的步驟,若否,則退出。
[0039]實施例二
[0040]圖2為根據(jù)本發(fā)明的一個實施例的語義分析方法的流程圖,如圖2所示,本發(fā)明在包括上述步驟S10、步驟S20外,上述步驟S30具體包括:
[0041]S31、根據(jù)輸入法詞庫,將獲取到的拼音翻譯成所有可能的中文語句;
[0042]S32、對每一種翻譯后的語句進行分詞,獲取所有語句分詞后的所有詞匯;
[0043]S33、以所有可能的語句的數(shù)量為基數(shù),計算每個詞匯出現(xiàn)的頻率;
[0044]S34、根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取每個詞匯的權(quán)重,若預(yù)設(shè)的垃圾關(guān)鍵字中沒有對應(yīng)的詞匯,則將該詞匯的權(quán)重記為零;
[0045]S35、結(jié)合每個詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計算消息內(nèi)容的垃圾相似度。
[0046]對應(yīng)的,上述步驟S40具體為步驟S41,其中:
[0047]步驟S41、當(dāng)計算的垃圾相似度的值超過預(yù)設(shè)的閾值時,判斷消息內(nèi)容為垃圾消息,過濾消息內(nèi)容,否則,正常顯示消息內(nèi)容。
[0048]其中,上述結(jié)合每個詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計算消息內(nèi)容的垃圾相似度,可以理解的是將垃圾關(guān)鍵字的權(quán)重與該詞匯出現(xiàn)的頻率同時納入判斷垃圾消息的條件,計算消息內(nèi)容的垃圾相似度可以采用乘法來計算,即將權(quán)重乘以對應(yīng)詞匯出現(xiàn)的頻率作為垃圾相似度的值。當(dāng)垃圾關(guān)鍵詞有多個時,可以采用以下計算方法:
[0049]X = a1b1+a2b2+a3b3+""" +anbn
[0050]X表示最終垃圾相似度的值,an表示第η個關(guān)鍵字出現(xiàn)的頻率,bn表示第η個關(guān)鍵字的權(quán)重,η為自然數(shù)。根據(jù)本發(fā)明的一個示例的關(guān)于an的計算方法為:
[0051]an = m/M
[0052]m表示第n個關(guān)鍵字(詞匯)出現(xiàn)的總的次數(shù),M表示可能翻譯成的語句的數(shù)量。
[0053]實施例三
[0054]圖3為根據(jù)本發(fā)明的一個實施例的剔除特殊字符的方法的流程圖,如圖3所示,為了避免由于垃圾推送者編輯消息時插入特殊字符導(dǎo)致垃圾關(guān)鍵字識別不出來,本發(fā)明在包括上述步驟S10、步驟S20、步驟S30、步驟S40外(步驟S40在圖3中未示出),還包括:
[0055]S51、提取消息內(nèi)容中所包含的預(yù)設(shè)的字符;
[0056]S52、剔除提取到的字符。
[0057]作為可選的,上述步驟S51、S52可以如圖所示在步驟SlO和步驟S20之間,也可以將步驟S51、S52置于步驟S20和步驟S30之間。
[0058]其中,上述預(yù)設(shè)的字符包括但不限于空格、“等特殊字符。
[0059]實施例四
[0060]圖4為根據(jù)本發(fā)明的一個實施例的有效過濾垃圾信息的裝置的示范性結(jié)構(gòu)框圖,下面根據(jù)圖4來描述有效過濾垃圾信息的裝置100,如圖4所示,該裝置包括:
[0061]消息內(nèi)容獲取模塊10,用于接收到消息時,獲取接收到消息的消息內(nèi)容;
[0062]拼音轉(zhuǎn)換模塊20,用于將消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼音;
[0063]語義分析模塊30,用于通過輸入法詞庫對轉(zhuǎn)換成的拼音進行語義分析;
[0064]第一判斷模塊40,用于根據(jù)語義分析的結(jié)果,判斷消息內(nèi)容是否為垃圾消息,若是,則過濾消息內(nèi)容,否則,正常顯示消息內(nèi)容。
[0065]其中,為了避免由于插入特殊字符導(dǎo)致垃圾關(guān)鍵字識別不出來,該有效過濾垃圾信息的裝置100還包括:
[0066]字符提取模塊51,用于提取消息內(nèi)容中所包含的預(yù)設(shè)的字符;
[0067]字符剔除模塊52,用于剔除提取到的字符。
[0068]其中,上述預(yù)設(shè)的字符包括但不限于空格、“等特殊字符。
[0069]實施例五
[0070]圖5為根據(jù)本發(fā)明的一個實施例的語義分析模塊的示范性結(jié)構(gòu)框圖,如圖5所示,上述語義分析模塊30具體包括:
[0071]翻譯模塊31,用于根據(jù)輸入法詞庫,將獲取到的拼音翻譯成所有可能的中文語句;
[0072]分詞模塊32,用于對每一種翻譯后的語句進行分詞,獲取所有語句分詞后的所有詞匯;
[0073]頻率計算模塊33,用于以所有可能的語句的數(shù)量為基數(shù),計算每個詞匯出現(xiàn)的頻率;
[0074]權(quán)重獲取模塊34,用于根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取每個詞匯的權(quán)重,若預(yù)設(shè)的垃圾關(guān)鍵字中沒有對應(yīng)的詞匯,則將該詞匯的權(quán)重記為零;
[0075]垃圾相似度計算模塊35,用于結(jié)合每個詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計算消息內(nèi)容的垃圾相似度。
[0076]對應(yīng)的,上述第一判斷模塊40具體包括第二判斷模塊41,該第二判斷模塊41用于當(dāng)計算的垃圾相似度的值超過預(yù)設(shè)的閾值時,判斷消息內(nèi)容為垃圾消息。
[0077]實施例六
[0078]圖6為根據(jù)本發(fā)明的一個實施例的移動終端的示范性結(jié)構(gòu)框圖,如圖6所示的移動終端11,該移動終端11包括上述的有效過濾垃圾信息的裝置100。
[0079]本發(fā)明通過將消息內(nèi)容中的特殊字符剔除,并將接收到的消息內(nèi)容轉(zhuǎn)換成拼音,再根據(jù)拼音的語義判斷接收到的消息是否為垃圾消息,使得垃圾推送者通過將消息內(nèi)容中的某些文字編輯成拼音或在消息內(nèi)容中插入特殊字符的方式躲避被檢測到垃圾關(guān)鍵字的意圖無所遁形,給用戶一個清凈的使用環(huán)境。
[0080]以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種有效過濾垃圾信息的方法,其特征在于,所述方法包括: 接收到消息時,獲取接收到消息的消息內(nèi)容; 將所述消息內(nèi)容中的文字轉(zhuǎn)換成拼音; 通過輸入法詞庫對轉(zhuǎn)換成的拼音進行語義分析; 根據(jù)語義分析的結(jié)果,判斷所述消息內(nèi)容是否為垃圾消息,若是,則過濾所述消息內(nèi)容。
2.根據(jù)權(quán)利要求1所述的有效過濾垃圾信息的方法,其特征在于,針對所述通過輸入法詞庫對所述轉(zhuǎn)換成的拼音進行語義分析,所述方法還包括: 根據(jù)輸入法詞庫,將所述獲取到的拼音翻譯成所有可能的中文語句; 對每一種翻譯后的語句進行分詞,獲取所述所有語句分詞后的所有詞匯; 以所述所有可能的語句的數(shù)量為基數(shù),計算所述每個詞匯出現(xiàn)的頻率; 根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取所述每個詞匯的權(quán)重; 結(jié)合所述每個詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計算所述消息內(nèi)容的垃圾相似度。
3.根據(jù)權(quán)利要求2所述的有效過濾垃圾信息的方法,其特征在于,針對所述根據(jù)語義分析的結(jié)果,判斷所述消息內(nèi)容是否為垃圾消息,所述方法還包括: 當(dāng)所述計算的垃圾相似度的值超過預(yù)設(shè)的閾值時,判斷所述消息內(nèi)容為垃圾消息。
4.根據(jù)權(quán)利要求1所述的有效過濾垃圾信息的方法,其特征在于,在所述通過輸入法詞庫對所述轉(zhuǎn)換成的拼音進行語義分析的步驟之前,所述方法還包括: 提取所述消息內(nèi)容中所包含的預(yù)設(shè)的字符; 剔除所述提取到的字符。
5.根據(jù)權(quán)利要求1所述的有效過濾垃圾信息的方法,其特征在于,在所述將所述消息內(nèi)容中的文字轉(zhuǎn)換成拼音的步驟之前,所述方法還包括: 判斷所述消息內(nèi)容中的文字是否包含有預(yù)設(shè)的字段,若是,則判斷所述消息內(nèi)容為垃圾消息。
6.根據(jù)權(quán)利要求1所述的有效過濾垃圾信息的方法,其特征在于,所述消息內(nèi)容包括郵件消息、短息消息、應(yīng)用程序接收到的消息。
7.一種有效過濾垃圾信息的裝置,其特征在于,所述裝置包括: 消息內(nèi)容獲取模塊,用于接收到消息時,獲取接收到消息的消息內(nèi)容; 拼音轉(zhuǎn)換模塊,用于將所述消息內(nèi)容中的文字轉(zhuǎn)換成拼音,并獲取轉(zhuǎn)換后的消息內(nèi)容所包含的全部拼音; 語義分析模塊,用于通過輸入法詞庫對所述轉(zhuǎn)換成的拼音進行語義分析; 第一判斷模塊,用于根據(jù)語義分析的結(jié)果,判斷所述消息內(nèi)容是否為垃圾消息,若是,則過濾所述消息內(nèi)容。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 翻譯模塊,用于根據(jù)輸入法詞庫,將所述獲取到的拼音翻譯成所有可能的中文語句; 分詞模塊,用于對每一種翻譯后的語句進行分詞,獲取所述所有語句分詞后的所有詞匯; 頻率計算模塊,用于以所述所有可能的語句的數(shù)量為基數(shù),計算所述每個詞匯出現(xiàn)的頻率; 權(quán)重獲取模塊,用于根據(jù)預(yù)設(shè)的垃圾關(guān)鍵字的權(quán)重,獲取所述每個詞匯的權(quán)重; 垃圾相似度計算模塊,用于結(jié)合所述每個詞匯出現(xiàn)的頻率以及該詞匯權(quán)重,計算所述消息內(nèi)容的垃圾相似度; 第二判斷模塊,用于當(dāng)所述計算的垃圾相似度的值超過預(yù)設(shè)的閾值時,判斷所述消息內(nèi)容為垃圾消息。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 字符提取模塊,用于提取所述消息內(nèi)容中所包含的預(yù)設(shè)的字符; 字符剔除模塊,用于剔除所述提取到的字符。
10.一種移動終端,其特征在于,所述移動終端包括上述權(quán)利要求7?9任一項所述的>j-U ρ?α裝直。
【文檔編號】G06F17/27GK104268203SQ201410489999
【公開日】2015年1月7日 申請日期:2014年9月23日 優(yōu)先權(quán)日:2014年9月23日
【發(fā)明者】王賢偉 申請人:深圳市中興移動通信有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1