基于反識別渲染的文本內(nèi)容識別率測試方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計算機技術(shù)領(lǐng)域,具體涉及一種基于反識別渲染的文本內(nèi)容識別率測試方法及裝置。
【背景技術(shù)】
[0002]隨著計算機技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)技術(shù)應(yīng)用中,很多場景都需要對文本內(nèi)容進行識別,例如輿情識別,其用于收集各種社交媒體渠道的實時信息,并對信息的文本內(nèi)容進行識別。
[0003]然而,在現(xiàn)有技術(shù)中,缺少對文本內(nèi)容識別算法的測試體系,尤其是對反識別渲染后的文本內(nèi)容識別算法缺少測試體系,導(dǎo)致每次對文本內(nèi)容識別算法優(yōu)化后,無法測試其識別效果是否提升,只能依靠人為的經(jīng)驗對其做出判斷后,不斷嘗試對文本內(nèi)容識別算法進行修改,費時費力。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種基于反識別渲染的文本內(nèi)容識別率測試方法及裝置。
[0005]為實現(xiàn)上述發(fā)明目的之一,本發(fā)明一實施方式提供了一種基于反識別渲染的文本內(nèi)容識別率測試方法,其包括:
[0006]接收關(guān)鍵詞和與所述關(guān)鍵詞對應(yīng)的識別率測試樣本,所述識別率測試樣本為所述關(guān)鍵詞和反識別元素的組合;
[0007]通過文本內(nèi)容識別算法計算所述識別率測試樣本,以獲得所述關(guān)鍵詞對應(yīng)的識別率,其中,所述識別率=成功識別數(shù)/識別率測試樣本的數(shù)量,所述成功識別數(shù)為通過所述算法將識別率測試樣本識別為所述關(guān)鍵詞的數(shù)量。
[0008]“接收關(guān)鍵詞和與所述關(guān)鍵詞對應(yīng)的識別率測試樣本,所述識別率測試樣本為所述關(guān)鍵詞和反識別元素的組合”具體包括:
[0009]接收關(guān)鍵詞;
[0010]根據(jù)反識別模板將所述關(guān)鍵詞渲染為識別率測試樣本,所述反識別模板包括反識別元素及反識別元素與所述關(guān)鍵詞的對應(yīng)關(guān)系。
[0011]作為本發(fā)明一實施方式的進一步改進,所述方法還包括:
[0012]接收與所述關(guān)鍵詞對應(yīng)的誤報關(guān)鍵詞,以及與所述誤報關(guān)鍵詞對應(yīng)的誤報率測試樣本,所述誤報率測試樣本為所述誤報關(guān)鍵詞和反識別元素的組合;
[0013]通過文本內(nèi)容識別算法計算所述誤報率測試樣本,以獲得所述關(guān)鍵詞對應(yīng)的誤報率,其中,所述誤報率=誤識別數(shù)/誤報率測試樣本的數(shù)量,所述誤識別數(shù)為通過所述算法將所述誤報率測試樣本識別為所述關(guān)鍵詞的數(shù)量。
[0014]作為本發(fā)明一實施方式的進一步改進,“接收與所述關(guān)鍵詞對應(yīng)的誤報關(guān)鍵詞,以及與所述誤報關(guān)鍵詞對應(yīng)的誤報率測試樣本,所述誤報率測試樣本為所述誤報關(guān)鍵詞和反識別元素的組合”具體包括:
[0015]接收與所述關(guān)鍵詞對應(yīng)的誤報關(guān)鍵詞;
[0016]根據(jù)反識別模板將所述誤報關(guān)鍵詞渲染為誤報率測試樣本,所述反識別模板包括反識別元素及反識別元素與所述誤報關(guān)鍵詞的對應(yīng)關(guān)系。
[0017]作為本發(fā)明一實施方式的進一步改進,“接收與所述關(guān)鍵詞對應(yīng)的誤報關(guān)鍵詞”具體包括:
[0018]對所述關(guān)鍵詞中的至少一個字進行組詞,以將所述關(guān)鍵詞生成為至少一個誤報關(guān)鍵詞。
[0019]作為本發(fā)明一實施方式的進一步改進,所述方法還包括計算所述反識別渲染文本內(nèi)容的識別有效性,
[0020]所述識別有效性=[識別率+(1-誤報率)]/2。
[0021]為實現(xiàn)上述發(fā)明目的之一,本發(fā)明一實施方式提供了一種基于反識別渲染的文本內(nèi)容識別率測試裝置,其包括:樣本獲取模塊,用于接收關(guān)鍵詞和與所述關(guān)鍵詞對應(yīng)的識別率測試樣本,所述識別率測試樣本為所述關(guān)鍵詞和反識別元素的組合;
[0022]計算模塊,用于通過文本內(nèi)容識別算法計算所述識別率測試樣本,以獲得所述關(guān)鍵詞對應(yīng)的識別率,其中,所述識別率=成功識別數(shù)/識別率測試樣本的數(shù)量,所述成功識別數(shù)為通過所述算法將識別率測試樣本識別為所述關(guān)鍵詞的數(shù)量。
[0023]作為本發(fā)明一實施方式的進一步改進,所述樣本獲取模塊用于:接收關(guān)鍵詞;
[0024]根據(jù)反識別模板將所述關(guān)鍵詞渲染為識別率測試樣本,所述反識別模板包括反識別元素及反識別元素與所述關(guān)鍵詞的對應(yīng)關(guān)系。
[0025]作為本發(fā)明一實施方式的進一步改進,所述樣本獲取模塊還用于:
[0026]接收與所述關(guān)鍵詞對應(yīng)的誤報關(guān)鍵詞,以及與所述誤報關(guān)鍵詞對應(yīng)的誤報率測試樣本,所述誤報率測試樣本為所述誤報關(guān)鍵詞和反識別元素的組合;
[0027]所述計算模塊還用于:通過文本內(nèi)容識別算法計算所述誤報率測試樣本,以獲得所述關(guān)鍵詞對應(yīng)的誤報率,其中,所述誤報率=誤識別數(shù)/誤報率測試樣本的數(shù)量,所述誤識別數(shù)為通過所述算法將所述誤報率測試樣本識別為所述關(guān)鍵詞的數(shù)量。
[0028]作為本發(fā)明一實施方式的進一步改進,所述樣本獲取模塊還具體用于:接收與所述關(guān)鍵詞對應(yīng)的誤報關(guān)鍵詞;
[0029]根據(jù)反識別模板將所述誤報關(guān)鍵詞渲染為誤報率測試樣本,所述反識別模板包括反識別元素及反識別元素與所述誤報關(guān)鍵詞的對應(yīng)關(guān)系。
[0030]作為本發(fā)明一實施方式的進一步改進,所述樣本獲取模塊還具體用于:對所述關(guān)鍵詞中的至少一個字進行組詞,以將所述關(guān)鍵詞生成為至少一個誤報關(guān)鍵詞。
[0031]作為本發(fā)明一實施方式的進一步改進,所述計算模塊還用于:計算所述反識別渲染文本內(nèi)容的識別有效性,所述識別有效性=[識別率+(1-誤報率)]/2。
[0032]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:本發(fā)明的基于反識別渲染的文本內(nèi)容識別率測試方法及裝置,可實時地對文本內(nèi)容識別的有效性算法進行測試評估,以通過該測試結(jié)果對文本內(nèi)容識別算法進行優(yōu)化,不僅提升了文本內(nèi)容識別算法優(yōu)化的及時性,也大大的節(jié)約了人力成本。
【附圖說明】
[0033]圖1是本發(fā)明一實施方式中基于反識別渲染的文本內(nèi)容識別率測試方法的流程示意圖;
[0034]圖2是本發(fā)明一實施方式的基于反識別渲染的文本內(nèi)容識別率測試裝置的模塊示意圖。
【具體實施方式】
[0035]以下將結(jié)合附圖所示的各實施方式對本發(fā)明進行詳細描述。但這些實施方式并不限制本發(fā)明,本領(lǐng)域的普通技術(shù)人員根據(jù)這些實施方式所輕易做出的結(jié)構(gòu)、方法、或功能上的變換均包含在本發(fā)明的保護范圍內(nèi)。
[0036]如圖1所示,在本發(fā)明一實施方式中,所述基于反識別渲染的文本內(nèi)容識別率測試方法包括:
[0037]接收關(guān)鍵詞和與所述關(guān)鍵詞對應(yīng)的識別率測試樣本。
[0038]具體的,接收關(guān)鍵詞;所述關(guān)鍵詞為一些網(wǎng)絡(luò)上的出現(xiàn)的詞匯,例如敏感詞匯,當(dāng)其在網(wǎng)絡(luò)上出現(xiàn)時,可通過網(wǎng)絡(luò)抓取或人為添加獲得該關(guān)鍵詞。例如:所述關(guān)鍵詞為“支付寶” “發(fā)票” “老虎” “迷藥” “辦證” “六四”等。
[0039]在通過網(wǎng)絡(luò)自動獲得關(guān)鍵詞后,可將這些關(guān)鍵詞存儲至關(guān)鍵詞數(shù)據(jù)庫,通常情況下,所述關(guān)鍵詞數(shù)據(jù)庫中存儲的關(guān)鍵詞越多,最終對識別率、誤報率、算法有效性的評測就越精確。
[0040]在本實施方式中,所述識別率測試樣本為所述關(guān)鍵詞和反識別元素的組合。
當(dāng)前第1頁
1 
2 
3 
4