技術(shù)編號(hào):9547220
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒(méi)有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本發(fā)明涉及通信領(lǐng)域,尤其涉及分類方法、查找方法和設(shè)備。背景技術(shù)基于Mahout機(jī)器學(xué)習(xí)平臺(tái)的分布式集群文本分類技術(shù),將任務(wù)切割給多個(gè)從機(jī)并行執(zhí)行,由主機(jī)匯總詞頻。在Mahout平臺(tái)中文本查找使用哈希樹結(jié)構(gòu)來(lái)完成新輸入單詞的詞頻查找過(guò)程,利用哈希函數(shù)對(duì)字符串生成32位(bits)的哈希編碼進(jìn)行尋址。對(duì)于每個(gè)從機(jī),采用雙重哈希線性探測(cè)的方法,來(lái)匹配特定單詞并統(tǒng)計(jì)詞頻。雙重哈希線性探查法使用兩個(gè)哈希函數(shù)在哈希表中形成一個(gè)探查序列??梢匝卮颂讲樾蛄兄饌€(gè)查找,直到找...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒(méi)有源代碼,用于學(xué)習(xí)研究技術(shù)思路。