技術(shù)總結(jié)
一種基于統(tǒng)計(jì)規(guī)律的資訊內(nèi)容異常檢測(cè)方法,包括如下步驟:步驟一、準(zhǔn)備語(yǔ)料;步驟二、將語(yǔ)料進(jìn)行nlp分詞;步驟三、分詞結(jié)果構(gòu)成多維向量;步驟四、多維向量積攢成多維向量庫(kù);步驟五、形成多維向量庫(kù)擴(kuò)展;步驟六、需要檢測(cè)時(shí)準(zhǔn)備目標(biāo)資訊;步驟七、將目標(biāo)資訊進(jìn)行nlp分詞;步驟八、分詞結(jié)果構(gòu)成多維向量;步驟九、在多維向量庫(kù)內(nèi)檢測(cè)目標(biāo)資訊是否正確;步驟十、計(jì)算出詞項(xiàng)的概率大于閾值;步驟十一、檢測(cè)通過;步驟十二、計(jì)算出詞項(xiàng)的概率小于閾值;步驟十三、檢測(cè)不通過;步驟十四、預(yù)警處理。本發(fā)明中提出了一種基于統(tǒng)計(jì)規(guī)律的資訊內(nèi)容異常檢測(cè)方法,相比采用黑白名單,簡(jiǎn)單的過濾敏感詞,本發(fā)明更能高效準(zhǔn)確的檢測(cè)資訊內(nèi)容的錯(cuò)誤。
技術(shù)研發(fā)人員:張勇
受保護(hù)的技術(shù)使用者:天津海量信息技術(shù)股份有限公司
文檔號(hào)碼:201610920198
技術(shù)研發(fā)日:2016.10.21
技術(shù)公布日:2017.05.10