技術(shù)編號(hào):11063579
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒(méi)有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本發(fā)明涉及文本挖掘與機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,尤其涉及一種重要性加權(quán)的文本分類特征選擇方法。背景技術(shù)文本分類問(wèn)題是一類特殊的機(jī)器學(xué)習(xí)問(wèn)題。通常的做法是,采用向量空間模型,將文本表示成多維特征空間上的點(diǎn),然后再借助各種機(jī)器學(xué)習(xí)算法進(jìn)行學(xué)習(xí)以及判別。在一個(gè)文本分類問(wèn)題中,通??梢杂谐汕先f(wàn)的特征可用來(lái)確定這樣一個(gè)語(yǔ)義空間。但不同特征對(duì)類別的區(qū)分能力卻有很大不同,為了獲得理想的分類準(zhǔn)確率以及較高的處理效率,通常需要使用特征選擇技術(shù)來(lái)從可能的候選特征集合中確定一個(gè)相對(duì)精簡(jiǎn)、更有效的一個(gè)特征子集。在過(guò)去幾十年中,...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒(méi)有源代碼,用于學(xué)習(xí)研究技術(shù)思路。