本申請(qǐng)涉及計(jì)算機(jī)領(lǐng)域,具體而言,涉及一種檢測(cè)關(guān)鍵詞推廣程度的方法和裝置。
背景技術(shù):
現(xiàn)今社會(huì)中,品牌主需要關(guān)注網(wǎng)絡(luò)上的輿情是否與品牌主的品牌、產(chǎn)品定位一致,在現(xiàn)有技術(shù)中,可以通過(guò)在系統(tǒng)中嵌入爬蟲(chóng)的應(yīng)用程序來(lái)爬取輿情內(nèi)容中的部分內(nèi)容,但是無(wú)法自動(dòng)衡量爬取到的輿情內(nèi)容,并與自身產(chǎn)品內(nèi)容進(jìn)行匹配分析,導(dǎo)致品牌主無(wú)法獲知品牌在傳播的過(guò)程中是否出現(xiàn)了品牌傳播途中品牌所實(shí)際希望傳達(dá)的消息和消費(fèi)者認(rèn)知的差異性。若出現(xiàn)了品牌所實(shí)際希望傳達(dá)的消息和消費(fèi)者認(rèn)知的差異性,則該差異性的出現(xiàn)會(huì)導(dǎo)致品牌傳播效率和質(zhì)量的下降,不利于品牌主品牌的推廣。
針對(duì)上述的問(wèn)題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)實(shí)施例提供了一種檢測(cè)關(guān)鍵詞推廣程度的方法和裝置,以至少解決現(xiàn)有技術(shù)中無(wú)法自動(dòng)對(duì)待檢測(cè)關(guān)鍵詞的推廣程度進(jìn)行評(píng)估的技術(shù)問(wèn)題。
根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種檢測(cè)關(guān)鍵詞推廣程度的方法,該方法包括:爬取包括待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本;對(duì)爬取到的所述多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞;將每個(gè)所述關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到所述預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞和所述匹配關(guān)聯(lián)詞的數(shù)量,其中,所述匹配關(guān)聯(lián)詞為所述多個(gè)關(guān)聯(lián)詞中的詞,所述預(yù)設(shè)關(guān)鍵詞為與所述待檢測(cè)關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞;以及計(jì)算所述匹配關(guān)聯(lián)詞的數(shù)量和所述預(yù)設(shè)關(guān)鍵詞數(shù)量的目標(biāo)比值,其中,所述目標(biāo)比值用于表征所述待檢測(cè)關(guān)鍵詞的推廣程度。
進(jìn)一步地,所述預(yù)設(shè)關(guān)鍵詞為多個(gè),將每個(gè)所述關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到所述預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞和所述匹配關(guān)聯(lián)詞的數(shù)量包括:計(jì)算關(guān)聯(lián)詞Ai與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,其中,i取1至n,n為所述關(guān)聯(lián)詞的數(shù)量,j依次取1至m,m為所述預(yù)設(shè)關(guān)鍵詞的數(shù)量;獲取相似度B11至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量;以及根據(jù)獲取到的所述相似度B11至所述相似度Bnm中大于預(yù)設(shè)相似度數(shù)量確定 所述匹配關(guān)聯(lián)詞的數(shù)量。
進(jìn)一步地,根據(jù)獲取到的所述相似度B11至所述相似度Bnm中大于預(yù)設(shè)相似度數(shù)量確定所述匹配關(guān)聯(lián)詞的數(shù)量包括:判斷獲取到的相似度B11至相似度B1m中大于所述預(yù)設(shè)相似度的數(shù)量是否大于或者等于1;在判斷出獲取到的所述相似度B11至所述相似度B1m中大于所述預(yù)設(shè)相似度的數(shù)量大于或者等于1情況下,預(yù)設(shè)參數(shù)的數(shù)量由初始值開(kāi)始累計(jì)增加預(yù)設(shè)數(shù)量,直至判斷獲取到的相似度Bn1至相似度Bnm中大于所述預(yù)設(shè)相似度的數(shù)量是否大于或者等于1;以及確定在判斷出所述相似度Bn1至相似度Bnm中大于所述預(yù)設(shè)相似度的數(shù)量是否大于或者等于1后的所述預(yù)設(shè)參數(shù)的取值作為所述匹配關(guān)聯(lián)詞的數(shù)量。
進(jìn)一步地,對(duì)爬取到的所述多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞包括:基于文本語(yǔ)義對(duì)所述多個(gè)網(wǎng)絡(luò)文本進(jìn)行分詞,得到多個(gè)分詞詞組,其中,不同的所述分詞詞組中所包含的網(wǎng)絡(luò)文本的文本語(yǔ)義不同;依次判斷每個(gè)所述分詞詞組中的網(wǎng)絡(luò)文本是否包含目標(biāo)詞匯;以及刪除目標(biāo)分詞詞組中的所述目標(biāo)詞匯,得到所述多個(gè)關(guān)聯(lián)詞,其中,所述目標(biāo)分詞詞組為判斷出的網(wǎng)絡(luò)文本包含所述目標(biāo)詞匯的所述分詞詞組。
進(jìn)一步地,依次判斷每個(gè)所述分詞詞組中的網(wǎng)絡(luò)文本是否包含目標(biāo)詞匯包括:將每個(gè)所述分詞詞組中的網(wǎng)絡(luò)文本與目標(biāo)詞庫(kù)進(jìn)行對(duì)比,其中,所述目標(biāo)詞庫(kù)為用于存儲(chǔ)所述目標(biāo)詞匯的詞庫(kù);以及當(dāng)對(duì)比出所述分詞詞組的網(wǎng)絡(luò)文本中包含與所述目標(biāo)詞匯相同的詞匯時(shí),確定在所述分詞詞組中的網(wǎng)絡(luò)文本中包含所述目標(biāo)詞匯。
根據(jù)本申請(qǐng)實(shí)施例的另一方面,還提供了一種檢測(cè)關(guān)鍵詞推廣程度的裝置,該裝置包括:爬取單元,用于爬取包括待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本;處理單元,用于對(duì)爬取到的所述多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞;匹配單元,用于將每個(gè)所述關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到所述預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞和所述匹配關(guān)聯(lián)詞的數(shù)量,其中,所述匹配關(guān)聯(lián)詞為所述多個(gè)關(guān)聯(lián)詞中的詞,所述預(yù)設(shè)關(guān)鍵詞為與所述待檢測(cè)關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞;以及計(jì)算單元,用于計(jì)算所述匹配關(guān)聯(lián)詞的數(shù)量和所述預(yù)設(shè)關(guān)鍵詞數(shù)量的目標(biāo)比值,其中,所述目標(biāo)比值用于表征所述待檢測(cè)關(guān)鍵詞的推廣程度。
進(jìn)一步地,所述預(yù)設(shè)關(guān)鍵詞為多個(gè),所述匹配單元包括:計(jì)算模塊,用于計(jì)算關(guān)聯(lián)詞Ai與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,其中,i取1至n,n為所述關(guān)聯(lián)詞的數(shù)量,j依次取1至m,m為所述預(yù)設(shè)關(guān)鍵詞的數(shù)量;獲取模塊,用于獲取相似度B11至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量;以及確定模塊,用于根據(jù)獲取到的所述相似度B11至所述相似度Bnm中大于預(yù)設(shè)相似度數(shù)量確定所述匹配關(guān)聯(lián)詞的數(shù)量。
進(jìn)一步地,所述獲取模塊包括:判斷子模塊,用于判斷獲取到的相似度B11至相似度B1m中大于所述預(yù)設(shè)相似度的數(shù)量是否大于或者等于1;增加子模塊,用于在判斷出獲取到的所述相似度B11至所述相似度B1m中大于所述預(yù)設(shè)相似度的數(shù)量大于或者等于1情況下,預(yù)設(shè)參數(shù)的數(shù)量由初始值開(kāi)始累計(jì)增加預(yù)設(shè)數(shù)量,直至判斷獲取到的相似度Bn1至相似度Bnm中大于所述預(yù)設(shè)相似度的數(shù)量是否大于或者等于1;以及第一確定子模塊,用于確定在判斷出所述相似度Bn1至相似度Bnm中大于所述預(yù)設(shè)相似度的數(shù)量是否大于或者等于1后的所述預(yù)設(shè)參數(shù)的取值作為所述匹配關(guān)聯(lián)詞的數(shù)量。
進(jìn)一步地,所述處理單元包括:分詞模塊,用于基于文本語(yǔ)義對(duì)所述多個(gè)網(wǎng)絡(luò)文本進(jìn)行分詞,得到多個(gè)分詞詞組,其中,不同的所述分詞詞組中所包含的網(wǎng)絡(luò)文本的文本語(yǔ)義不同;判斷模塊,用于依次判斷每個(gè)所述分詞詞組中的網(wǎng)絡(luò)文本是否包含目標(biāo)詞匯;以及刪除模塊,用于刪除目標(biāo)分詞詞組中的所述目標(biāo)詞匯,得到所述多個(gè)關(guān)聯(lián)詞,其中,所述目標(biāo)分詞詞組為判斷出的網(wǎng)絡(luò)文本包含所述目標(biāo)詞匯的所述分詞詞組。
進(jìn)一步地,所述判斷模塊包括:對(duì)比子模塊,用于將每個(gè)所述分詞詞組中的網(wǎng)絡(luò)文本與目標(biāo)詞庫(kù)進(jìn)行對(duì)比,其中,所述目標(biāo)詞庫(kù)為用于存儲(chǔ)所述目標(biāo)詞匯的詞庫(kù);以及第二確定子模塊,用于當(dāng)對(duì)比出所述分詞詞組的網(wǎng)絡(luò)文本中包含與所述目標(biāo)詞匯相同的詞匯時(shí),確定在所述分詞詞組中的網(wǎng)絡(luò)文本中包含所述目標(biāo)詞匯。
在本申請(qǐng)實(shí)施例中,采用爬取包括待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本;對(duì)爬取到的所述多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞;將每個(gè)所述關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到所述預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞和所述匹配關(guān)聯(lián)詞的數(shù)量,其中,所述匹配關(guān)聯(lián)詞為所述多個(gè)關(guān)聯(lián)詞中的詞,所述預(yù)設(shè)關(guān)鍵詞為與所述待檢測(cè)關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞;計(jì)算所述匹配關(guān)聯(lián)詞的數(shù)量和所述預(yù)設(shè)關(guān)鍵詞數(shù)量的目標(biāo)比值,其中,所述目標(biāo)比值用于表征所述待檢測(cè)關(guān)鍵詞的推廣程度的方式。通過(guò)爬蟲(chóng)在目標(biāo)信息庫(kù)中爬取待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本,并根據(jù)獲取到的網(wǎng)絡(luò)文本進(jìn)行提煉出多個(gè)關(guān)聯(lián)詞,并將該關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到匹配關(guān)聯(lián)詞,以及匹配關(guān)聯(lián)詞的數(shù)量,進(jìn)而根據(jù)該數(shù)量和預(yù)設(shè)關(guān)鍵詞數(shù)量計(jì)算待檢測(cè)關(guān)鍵詞的推廣程度的比值,相對(duì)于現(xiàn)有技術(shù)中僅爬取網(wǎng)絡(luò)文本,而無(wú)法自動(dòng)對(duì)爬取到的關(guān)聯(lián)詞進(jìn)行匹配分析,達(dá)到了自動(dòng)檢測(cè)待檢測(cè)關(guān)鍵詞推廣程度的目的,從而實(shí)現(xiàn)了無(wú)需人工分析,通過(guò)自動(dòng)匹配分析即可獲取待檢測(cè)關(guān)鍵詞的推廣程度的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中無(wú)法自動(dòng)對(duì)待檢測(cè)關(guān)鍵詞的推廣程度進(jìn)行評(píng)估的技術(shù)問(wèn)題。
附圖說(shuō)明
此處所說(shuō)明的附圖用來(lái)提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說(shuō)明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
圖1是根據(jù)本申請(qǐng)實(shí)施例的一種檢測(cè)關(guān)鍵詞推廣程度的方法的流程圖;以及
圖2是根據(jù)本申請(qǐng)實(shí)施例的一種檢測(cè)關(guān)鍵詞推廣程度的裝置的示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本申請(qǐng)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分的實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。
需要說(shuō)明的是,本申請(qǐng)的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類(lèi)似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請(qǐng)的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒(méi)有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
根據(jù)本申請(qǐng)實(shí)施例,提供了一種檢測(cè)關(guān)鍵詞推廣程度的方法的實(shí)施例,需要說(shuō)明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
圖1是根據(jù)本申請(qǐng)實(shí)施例的一種檢測(cè)關(guān)鍵詞推廣程度的方法的流程圖,如圖1所示,該方法包括如下步驟S102至步驟S108:
步驟S102,爬取包括待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本。
具體地,通過(guò)爬蟲(chóng)系統(tǒng)在社交媒體和搜索引擎等信息庫(kù)中獲取包括待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本。在本申請(qǐng)實(shí)施例中,待檢測(cè)關(guān)鍵詞為品牌詞或者產(chǎn)品詞等詞匯,例如,“雀巢”、“蘭蔻”和“耐克”等品牌詞匯。
步驟S104,對(duì)爬取到的多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞。
具體地,通過(guò)爬蟲(chóng)系統(tǒng)獲取到的多個(gè)網(wǎng)絡(luò)文本中,包含大量的冗余成分,因此,需對(duì)多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,處理得到高度聚合的待檢測(cè)關(guān)鍵詞的相關(guān)詞匯,即多個(gè)關(guān)聯(lián)詞。
步驟S106,將每個(gè)關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞和匹配關(guān)聯(lián)詞的數(shù)量,其中,匹配關(guān)聯(lián)詞為多個(gè)關(guān)聯(lián)詞中的詞,預(yù)設(shè)關(guān)鍵詞為與待檢測(cè)關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞。
具體地,預(yù)設(shè)關(guān)鍵詞為用戶(hù)預(yù)先設(shè)置與待檢測(cè)關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞。例如,待檢測(cè)關(guān)鍵詞為“蘭蔻”,則預(yù)設(shè)關(guān)鍵詞可以為“美白”、“保濕”、“提亮膚色”和“改善膚質(zhì)”等詞匯,其中,預(yù)設(shè)關(guān)鍵詞的數(shù)量至少為一。
步驟S108,計(jì)算匹配關(guān)聯(lián)詞的數(shù)量和預(yù)設(shè)關(guān)鍵詞數(shù)量的目標(biāo)比值,其中,目標(biāo)比值用于表征待檢測(cè)關(guān)鍵詞的推廣程度。
具體地,通過(guò)計(jì)算匹配關(guān)聯(lián)詞的數(shù)量和預(yù)設(shè)關(guān)鍵詞的數(shù)量的比值,即可計(jì)算得到該待檢測(cè)關(guān)鍵詞的推廣程度,以便品牌主確定網(wǎng)絡(luò)中的輿情是否與該品牌在市場(chǎng)中的定位一致。
本申請(qǐng)?zhí)峁┑臋z測(cè)關(guān)鍵詞推廣程度的方法,通過(guò)爬蟲(chóng)在目標(biāo)信息庫(kù)中爬取待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本,并根據(jù)獲取到的網(wǎng)絡(luò)文本進(jìn)行提煉出多個(gè)關(guān)聯(lián)詞,并將該關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到匹配關(guān)聯(lián)詞,以及匹配關(guān)聯(lián)詞的數(shù)量,進(jìn)而根據(jù)該數(shù)量和預(yù)設(shè)關(guān)鍵詞數(shù)量計(jì)算待檢測(cè)關(guān)鍵詞的推廣程度的比值,相對(duì)于現(xiàn)有技術(shù)中僅爬取網(wǎng)絡(luò)文本,而無(wú)法自動(dòng)對(duì)爬取到的關(guān)聯(lián)詞進(jìn)行匹配分析,達(dá)到了自動(dòng)檢測(cè)待檢測(cè)關(guān)鍵詞推廣程度的目的,從而實(shí)現(xiàn)了無(wú)需人工分析,通過(guò)自動(dòng)匹配分析即可獲取待檢測(cè)關(guān)鍵詞的推廣程度的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中無(wú)法自動(dòng)對(duì)待檢測(cè)關(guān)鍵詞的推廣程度進(jìn)行評(píng)估的技術(shù)問(wèn)題。
預(yù)設(shè)關(guān)鍵詞為多個(gè),將每個(gè)關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞和匹配關(guān)聯(lián)詞的數(shù)量包括如下步驟S1061至步驟S1065:
步驟S1061,計(jì)算關(guān)聯(lián)詞Ai與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,其中,i取1至n,n為關(guān)聯(lián)詞的數(shù)量,j依次取1至m,m為預(yù)設(shè)關(guān)鍵詞的數(shù)量。
步驟S1063,獲取相似度B11至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量。
步驟S1065,根據(jù)獲取到的相似度B11至相似度Bnm中大于預(yù)設(shè)相似度數(shù)量確定匹配關(guān)聯(lián)詞的數(shù)量。
具體地,在本申請(qǐng)實(shí)施例中,通過(guò)計(jì)算計(jì)算關(guān)聯(lián)詞Ai與預(yù)設(shè)關(guān)鍵詞Cj的相似度 Bij,來(lái)確定匹配關(guān)聯(lián)詞的數(shù)量。其中,用戶(hù)可根據(jù)實(shí)際需要選取預(yù)設(shè)相似度的數(shù)值。
假設(shè),關(guān)聯(lián)詞的數(shù)量n的值取3,預(yù)設(shè)關(guān)鍵詞的數(shù)量m的值取2,則計(jì)算出的關(guān)聯(lián)詞A1與預(yù)設(shè)關(guān)鍵詞C1至C2的相似度Bij分別為B11和B12;計(jì)算出的關(guān)聯(lián)詞A2與預(yù)設(shè)關(guān)鍵詞C1至C2的相似度Bij分別為B21和B22;計(jì)算出的關(guān)聯(lián)詞A3與預(yù)設(shè)關(guān)鍵詞C1至C2的相似度Bij分別為B31和B32。
判斷B11和B12中大于預(yù)設(shè)相似度的數(shù)量a,B21和B22中大于預(yù)設(shè)相似度的數(shù)量b,以及B31和B32中大于預(yù)設(shè)相似度的數(shù)量c,進(jìn)而根據(jù)判斷出的a,b和c的值確定匹配關(guān)聯(lián)詞的數(shù)量。
可選地,根據(jù)獲取到的相似度B11至相似度Bnm中大于預(yù)設(shè)相似度數(shù)量確定匹配關(guān)聯(lián)詞的數(shù)量包括如下步驟S1至步驟S5:
步驟S1,判斷獲取到的相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1。
步驟S3,在判斷出獲取到的相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量大于或者等于1情況下,預(yù)設(shè)參數(shù)的數(shù)量由初始值開(kāi)始累計(jì)增加預(yù)設(shè)數(shù)量,直至判斷獲取到的相似度Bn1至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1。
步驟S5,確定在判斷出相似度Bn1至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1后的預(yù)設(shè)參數(shù)的取值作為匹配關(guān)聯(lián)詞的數(shù)量。
具體地,在本申請(qǐng)實(shí)施例中,計(jì)算關(guān)聯(lián)詞A1與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,得到多個(gè)相似度B11至相似度B1m,若計(jì)算得到的多個(gè)相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量大于或者等于1,則確定該關(guān)聯(lián)詞A1為與預(yù)設(shè)關(guān)鍵詞匹配的匹配關(guān)聯(lián)詞,此時(shí),預(yù)設(shè)參數(shù)由初始值開(kāi)始累計(jì)增加預(yù)設(shè)數(shù)量。例如,預(yù)設(shè)參數(shù)的初始值為0,當(dāng)判斷出計(jì)算得到的多個(gè)相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量大于或者等于1的情況下,預(yù)設(shè)參數(shù)進(jìn)行加1運(yùn)算,得到加1運(yùn)算后的預(yù)設(shè)參數(shù),預(yù)設(shè)參數(shù)即為1。
繼續(xù)計(jì)算關(guān)聯(lián)詞A2與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,得到多個(gè)相似度B21至相似度B2m,若計(jì)算得到的多個(gè)相似度B21至相似度B2m中大于預(yù)設(shè)相似度的數(shù)量大于或者等于1,則確定該關(guān)聯(lián)詞A2為與預(yù)設(shè)關(guān)鍵詞匹配的匹配關(guān)聯(lián)詞,此時(shí),預(yù)設(shè)參數(shù)在1的基礎(chǔ)上繼續(xù)累計(jì)增加1,得到預(yù)設(shè)參數(shù)的數(shù)值為2。若計(jì)算得到的多個(gè)相似度B21至相似度B2m中大于預(yù)設(shè)相似度的數(shù)量等于0,則表明該關(guān)聯(lián)詞A2并非是預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞,預(yù)設(shè)參數(shù)不進(jìn)行任何操作。
同樣地,對(duì)關(guān)聯(lián)詞A3至An分別進(jìn)行上述操作,直到判斷最后一個(gè)關(guān)聯(lián)詞An與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bn1至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1,并得到判斷出相似度Bn1至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1后的預(yù)設(shè)參數(shù)的取值,并將該預(yù)設(shè)參數(shù)的數(shù)值作為匹配關(guān)聯(lián)詞的數(shù)量。
在對(duì)爬取到的多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞,并將多個(gè)關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配得到匹配關(guān)聯(lián)詞和匹配關(guān)聯(lián)詞的數(shù)量之后,計(jì)算匹配關(guān)鍵詞的數(shù)量與預(yù)設(shè)關(guān)鍵詞的數(shù)量的目標(biāo)比值,并根據(jù)計(jì)算出的比值確定該待檢測(cè)關(guān)鍵詞的推廣程度。其中,若計(jì)算出的目標(biāo)比值越大,則表明該待檢測(cè)關(guān)鍵詞的推廣程度越大,并且還表明該待檢測(cè)關(guān)鍵詞在網(wǎng)絡(luò)中的輿情與自身品牌的定位一致。
可選地,對(duì)爬取到的多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞包括如下步驟S1041至步驟S1045:
步驟S1041,基于文本語(yǔ)義對(duì)多個(gè)網(wǎng)絡(luò)文本進(jìn)行分詞,得到多個(gè)分詞詞組,其中,不同的分詞詞組中所包含的網(wǎng)絡(luò)文本的文本語(yǔ)義不同。
步驟S1043,依次判斷每個(gè)分詞詞組中的網(wǎng)絡(luò)文本是否包含目標(biāo)詞匯。
步驟S1045,刪除目標(biāo)分詞詞組中的目標(biāo)詞匯,得到多個(gè)關(guān)聯(lián)詞,其中,目標(biāo)分詞詞組為判斷出的網(wǎng)絡(luò)文本包含目標(biāo)詞匯的分詞詞組。
具體地,通過(guò)爬蟲(chóng)系統(tǒng)獲取到的多個(gè)網(wǎng)絡(luò)文本包含大量的冗余成分,因此,首先按照中文語(yǔ)義對(duì)多個(gè)網(wǎng)絡(luò)文本進(jìn)行分詞,得到聚合的多個(gè)分詞詞組。其中,在分詞的過(guò)程中,若一個(gè)分詞詞組中包含相同的網(wǎng)絡(luò)文本,則將相同的網(wǎng)絡(luò)文本合并得到一個(gè)網(wǎng)絡(luò)文本。
多得到的聚合的分詞詞組進(jìn)行進(jìn)一步提煉,提煉出高度聚合的待檢測(cè)關(guān)鍵詞的關(guān)聯(lián)詞匯,即多個(gè)關(guān)聯(lián)詞。其中,通過(guò)刪除目標(biāo)分詞詞組中網(wǎng)絡(luò)文本包含的目標(biāo)詞匯,得到高度聚合的多個(gè)關(guān)聯(lián)詞。目標(biāo)分詞組為系統(tǒng)判斷出的網(wǎng)絡(luò)文本包含目標(biāo)詞匯的分詞詞組。在本申請(qǐng)實(shí)施例中,目標(biāo)詞匯為日常用語(yǔ)和通用語(yǔ)氣詞等日常生活中較為常見(jiàn)的詞匯,例如,“他(她)們都說(shuō)”、“大家的評(píng)價(jià)”和“非常好”等等通用詞匯。
可選地,依次判斷每個(gè)分詞詞組中的網(wǎng)絡(luò)文本是否包含目標(biāo)詞匯包括如下步驟S7至步驟S9:
步驟S7,將每個(gè)分詞詞組中的網(wǎng)絡(luò)文本與目標(biāo)詞庫(kù)進(jìn)行對(duì)比,其中,目標(biāo)詞庫(kù)為用于存儲(chǔ)目標(biāo)詞匯的詞庫(kù)。
步驟S9,當(dāng)對(duì)比出分詞詞組的網(wǎng)絡(luò)文本中包含與目標(biāo)詞匯相同的詞匯時(shí),確定在 分詞詞組中的網(wǎng)絡(luò)文本中包含目標(biāo)詞匯。
具體地,用戶(hù)可預(yù)先將包含目標(biāo)詞匯的詞庫(kù)存儲(chǔ)于數(shù)據(jù)庫(kù)中,然后分別將每個(gè)分詞詞組中的網(wǎng)絡(luò)文本與目標(biāo)詞庫(kù)進(jìn)行對(duì)比。若對(duì)比出分詞詞組中的某一網(wǎng)絡(luò)文本包含與目標(biāo)詞匯相同的詞匯時(shí),則確定該分詞詞組中的網(wǎng)絡(luò)文本中包含目標(biāo)詞匯。其中,用戶(hù)可對(duì)目標(biāo)詞庫(kù)中的目標(biāo)詞匯進(jìn)行更新,以便提煉出聚合程度較高的關(guān)聯(lián)詞。
需要說(shuō)明的是,在本申請(qǐng)實(shí)施例中,對(duì)爬取到的多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理的方法并不限于本申請(qǐng)中所描述的方法,還可以采用其他的方法來(lái)對(duì)多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到高度聚合的關(guān)聯(lián)詞。
本申請(qǐng)實(shí)施例還提供了一種檢測(cè)關(guān)鍵詞推廣程度的裝置,該裝置主要用于執(zhí)行本申請(qǐng)實(shí)施例上述內(nèi)容所提供的檢測(cè)關(guān)鍵詞推廣程度的方法,以下對(duì)本申請(qǐng)實(shí)施例送提供的檢測(cè)關(guān)鍵詞推廣程度的裝置做具體介紹。
圖2是根據(jù)本申請(qǐng)實(shí)施例的一種檢測(cè)關(guān)鍵詞推廣程度的裝置示意圖,如圖2所示,該檢測(cè)關(guān)鍵詞推廣程度的裝置示意圖主要包括爬取單元10、處理單元20、匹配單元30和計(jì)算單元40,其中:
爬取單元10,用于爬取包括待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本。
具體地,通過(guò)爬取單元在社交媒體和搜索引擎等信息庫(kù)中獲取包括待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本。在本申請(qǐng)實(shí)施例中,待檢測(cè)關(guān)鍵詞為品牌詞或者產(chǎn)品詞等詞匯,例如,“雀巢”、“蘭蔻”和“耐克”等品牌詞匯。
處理單元20,用于對(duì)爬取到的多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞。
具體地,通過(guò)爬蟲(chóng)系統(tǒng)獲取到的多個(gè)網(wǎng)絡(luò)文本中,包含大量的冗余成分,因此,通過(guò)處理單元需對(duì)多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,處理得到高度聚合的待檢測(cè)關(guān)鍵詞的相關(guān)詞匯,即多個(gè)關(guān)聯(lián)詞。
匹配單元30,用于將每個(gè)關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞和匹配關(guān)聯(lián)詞的數(shù)量,其中,匹配關(guān)聯(lián)詞為多個(gè)關(guān)聯(lián)詞中的詞,預(yù)設(shè)關(guān)鍵詞為與待檢測(cè)關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞。
具體地,通過(guò)匹配單元將每個(gè)關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配得到多個(gè)關(guān)聯(lián)詞,其中,預(yù)設(shè)關(guān)鍵詞為用戶(hù)預(yù)先設(shè)置與待檢測(cè)關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞。例如,待檢測(cè)關(guān)鍵詞為“蘭蔻”,則預(yù)設(shè)關(guān)鍵詞可以為“美白”、“保濕”、“提亮膚色”和“改善膚質(zhì)”等詞匯,其中,預(yù)設(shè)關(guān)鍵詞的數(shù)量至少為一。
計(jì)算單元40,用于計(jì)算匹配關(guān)聯(lián)詞的數(shù)量和預(yù)設(shè)關(guān)鍵詞數(shù)量的目標(biāo)比值,其中,目標(biāo)比值用于表征待檢測(cè)關(guān)鍵詞的推廣程度。
具體地,通過(guò)計(jì)算單元計(jì)算得到匹配關(guān)聯(lián)詞的數(shù)量和預(yù)設(shè)關(guān)鍵詞的數(shù)量的比值,即目標(biāo)比值,通過(guò)該目標(biāo)比值即可確定該待檢測(cè)關(guān)鍵詞的推廣程度,以便品牌主確定網(wǎng)絡(luò)中的輿情是否與該品牌的定位一致。
本申請(qǐng)?zhí)峁┑臋z測(cè)關(guān)鍵詞推廣程度的裝置,通過(guò)爬蟲(chóng)在目標(biāo)信息庫(kù)中爬取待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本,并根據(jù)獲取到的網(wǎng)絡(luò)文本進(jìn)行提煉出多個(gè)關(guān)聯(lián)詞,并將該關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到匹配關(guān)聯(lián)詞,以及匹配關(guān)聯(lián)詞的數(shù)量,進(jìn)而根據(jù)該數(shù)量和預(yù)設(shè)關(guān)鍵詞數(shù)量計(jì)算待檢測(cè)關(guān)鍵詞的推廣程度的比值,相對(duì)于現(xiàn)有技術(shù)中僅爬取網(wǎng)絡(luò)文本,而無(wú)法自動(dòng)對(duì)爬取到的關(guān)聯(lián)詞進(jìn)行匹配分析,達(dá)到了自動(dòng)檢測(cè)待檢測(cè)關(guān)鍵詞推廣程度的目的,從而實(shí)現(xiàn)了無(wú)需人工分析,通過(guò)自動(dòng)匹配分析即可獲取待檢測(cè)關(guān)鍵詞的推廣程度的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中無(wú)法自動(dòng)對(duì)待檢測(cè)關(guān)鍵詞的推廣程度進(jìn)行評(píng)估的技術(shù)問(wèn)題。
可選地,預(yù)設(shè)關(guān)鍵詞為多個(gè),匹配單元30包括:計(jì)算模塊,用于計(jì)算關(guān)聯(lián)詞Ai與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,其中,i取1至n,n為關(guān)聯(lián)詞的數(shù)量,j依次取1至m,m為預(yù)設(shè)關(guān)鍵詞的數(shù)量;獲取模塊,用于獲取相似度B11至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量;確定模塊,用于根據(jù)獲取到的相似度B11至相似度Bnm中大于預(yù)設(shè)相似度數(shù)量確定匹配關(guān)聯(lián)詞的數(shù)量。
具體地,在本申請(qǐng)實(shí)施例中,通過(guò)計(jì)算模塊計(jì)算關(guān)聯(lián)詞Ai與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,并通過(guò)獲取模塊獲取相似度B11至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量,進(jìn)而通過(guò)確定模塊來(lái)確定匹配關(guān)聯(lián)詞的數(shù)量。其中,用戶(hù)可根據(jù)實(shí)際需要選取預(yù)設(shè)相似度的數(shù)值。
假設(shè),關(guān)聯(lián)詞的數(shù)量n的值取3,預(yù)設(shè)關(guān)鍵詞的數(shù)量m的值取2,則計(jì)算出的關(guān)聯(lián)詞A1與預(yù)設(shè)關(guān)鍵詞C1至C2的相似度Bij分別為B11和B12;計(jì)算出的關(guān)聯(lián)詞A2與預(yù)設(shè)關(guān)鍵詞C1至C2的相似度Bij分別為B21和B22;計(jì)算出的關(guān)聯(lián)詞A3與預(yù)設(shè)關(guān)鍵詞C1至C2的相似度Bij分別為B31和B32。
判斷B11和B12中大于預(yù)設(shè)相似度的數(shù)量a,B21和B22中大于預(yù)設(shè)相似度的數(shù)量b,以及B31和B32中大于預(yù)設(shè)相似度的數(shù)量c,進(jìn)而根據(jù)判斷出的a,b和c的值確定匹配關(guān)聯(lián)詞的數(shù)量。
可選地,獲取模塊包括:判斷子模塊,用于判斷獲取到的相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1;增加子模塊,用于在判斷出獲取到的 相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量大于或者等于1情況下,預(yù)設(shè)參數(shù)的數(shù)量由初始值開(kāi)始累計(jì)增加預(yù)設(shè)數(shù)量,直至判斷獲取到的相似度Bn1至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1;第一確定子模塊,用于確定在判斷出相似度Bn1至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1后的預(yù)設(shè)參數(shù)的取值作為匹配關(guān)聯(lián)詞的數(shù)量。
具體地,在本申請(qǐng)實(shí)施例中,計(jì)算關(guān)聯(lián)詞A1與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,得到多個(gè)相似度B11至相似度B1m,通過(guò)判斷子模塊判斷獲取到的相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1。若判斷出得到的多個(gè)相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量大于或者等于1,則確定該關(guān)聯(lián)詞A1為與預(yù)設(shè)關(guān)鍵詞匹配的匹配關(guān)聯(lián)詞,此時(shí),通過(guò)增加子模塊將預(yù)設(shè)參數(shù)由初始值開(kāi)始累計(jì)增加預(yù)設(shè)數(shù)量。例如,預(yù)設(shè)參數(shù)的初始值為0,當(dāng)判斷出計(jì)算得到的多個(gè)相似度B11至相似度B1m中大于預(yù)設(shè)相似度的數(shù)量大于或者等于1的情況下,預(yù)設(shè)參數(shù)進(jìn)行加1運(yùn)算,得到加1運(yùn)算后的預(yù)設(shè)參數(shù),預(yù)設(shè)參數(shù)即為1。
繼續(xù)計(jì)算關(guān)聯(lián)詞A2與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bij,得到多個(gè)相似度B21至相似度B2m,若計(jì)算得到的多個(gè)相似度B21至相似度B2m中大于預(yù)設(shè)相似度的數(shù)量大于或者等于1,則確定該關(guān)聯(lián)詞A2為與預(yù)設(shè)關(guān)鍵詞匹配的匹配關(guān)聯(lián)詞,此時(shí),預(yù)設(shè)參數(shù)在1的基礎(chǔ)上繼續(xù)累計(jì)增加1,得到預(yù)設(shè)參數(shù)的數(shù)值為2。若計(jì)算得到的多個(gè)相似度B21至相似度B2m中大于預(yù)設(shè)相似度的數(shù)量等于0,則表明該關(guān)聯(lián)詞A2并非是預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞,預(yù)設(shè)參數(shù)不進(jìn)行任何操作。
同樣地,對(duì)關(guān)聯(lián)詞A3至An分別進(jìn)行上述操作,直到判斷最后一個(gè)關(guān)聯(lián)詞An與預(yù)設(shè)關(guān)鍵詞Cj的相似度Bn1至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1,并得到判斷出相似度Bn1至相似度Bnm中大于預(yù)設(shè)相似度的數(shù)量是否大于或者等于1后的預(yù)設(shè)參數(shù)的取值,通過(guò)第一確定子模塊確定該預(yù)設(shè)參數(shù)的數(shù)值即為匹配關(guān)聯(lián)詞的數(shù)量。
在對(duì)爬取到的多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞,并將多個(gè)關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配得到匹配關(guān)聯(lián)詞和匹配關(guān)聯(lián)詞的數(shù)量之后,計(jì)算匹配關(guān)鍵詞的數(shù)量與預(yù)設(shè)關(guān)鍵詞的數(shù)量的目標(biāo)比值,并根據(jù)計(jì)算出的比值確定該待檢測(cè)關(guān)鍵詞的推廣程度。其中,若計(jì)算出的目標(biāo)比值越大,則表明該待檢測(cè)關(guān)鍵詞的推廣程度越大,并且還表明該待檢測(cè)關(guān)鍵詞在網(wǎng)絡(luò)中的輿情與自身品牌的定位一致。
可選地,處理單元包括:分詞模塊,用于基于文本語(yǔ)義對(duì)多個(gè)網(wǎng)絡(luò)文本進(jìn)行分詞,得到多個(gè)分詞詞組,其中,不同的分詞詞組中所包含的網(wǎng)絡(luò)文本的文本語(yǔ)義不同;判斷模塊,用于依次判斷每個(gè)分詞詞組中的網(wǎng)絡(luò)文本是否包含目標(biāo)詞匯;刪除模塊,用 于刪除目標(biāo)分詞詞組中的目標(biāo)詞匯,得到多個(gè)關(guān)聯(lián)詞,其中,目標(biāo)分詞詞組為判斷出的網(wǎng)絡(luò)文本包含目標(biāo)詞匯的分詞詞組。
具體地,通過(guò)爬蟲(chóng)系統(tǒng)獲取到的多個(gè)網(wǎng)絡(luò)文本包含大量的冗余成分,因此,首先通過(guò)分詞模塊按照中文語(yǔ)義對(duì)多個(gè)網(wǎng)絡(luò)文本進(jìn)行分詞,得到聚合的多個(gè)分詞詞組。其中,在分詞的過(guò)程中,若一個(gè)分詞詞組中包含相同的網(wǎng)絡(luò)文本,則將相同的網(wǎng)絡(luò)文本合并得到一個(gè)網(wǎng)絡(luò)文本。
多得到的聚合的分詞詞組進(jìn)行進(jìn)一步提煉,提煉出高度聚合的待檢測(cè)關(guān)鍵詞的關(guān)聯(lián)詞匯,即多個(gè)關(guān)聯(lián)詞。其中,通過(guò)刪除模塊刪除目標(biāo)分詞詞組中網(wǎng)絡(luò)文本包含的目標(biāo)詞匯,得到高度聚合的多個(gè)關(guān)聯(lián)詞。目標(biāo)分詞組為系統(tǒng)判斷出的網(wǎng)絡(luò)文本包含目標(biāo)詞匯的分詞詞組。在本申請(qǐng)實(shí)施例中,目標(biāo)詞匯為日常用語(yǔ)和通用語(yǔ)氣詞等日常生活中較為常見(jiàn)的詞匯,例如,“他(她)們都說(shuō)”、“大家的評(píng)價(jià)”和“非常好”等等通用詞匯。
可選地,判斷模塊包括:對(duì)比子模塊,用于將每個(gè)分詞詞組中的網(wǎng)絡(luò)文本與目標(biāo)詞庫(kù)進(jìn)行對(duì)比,其中,目標(biāo)詞庫(kù)為用于存儲(chǔ)目標(biāo)詞匯的詞庫(kù);第二確定子模塊,用于當(dāng)對(duì)比出分詞詞組的網(wǎng)絡(luò)文本中包含與目標(biāo)詞匯相同的詞匯時(shí),確定在分詞詞組中的網(wǎng)絡(luò)文本中包含目標(biāo)詞匯。
具體地,用戶(hù)可預(yù)先將包含目標(biāo)詞匯的詞庫(kù)存儲(chǔ)于數(shù)據(jù)庫(kù)中,然后通過(guò)對(duì)比子模塊分別將每個(gè)分詞詞組中的網(wǎng)絡(luò)文本與目標(biāo)詞庫(kù)進(jìn)行對(duì)比。若對(duì)比出分詞詞組中的某一網(wǎng)絡(luò)文本包含與目標(biāo)詞匯相同的詞匯時(shí),則通過(guò)第二確定子模塊確定該分詞詞組中的網(wǎng)絡(luò)文本中包含目標(biāo)詞匯。其中,用戶(hù)可對(duì)目標(biāo)詞庫(kù)中的目標(biāo)詞匯進(jìn)行更新,以便提煉出聚合程度較高的關(guān)聯(lián)詞。
需要說(shuō)明的是,在本申請(qǐng)實(shí)施例中,對(duì)爬取到的多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理的方法并不限于本申請(qǐng)中所描述的方法,還可以采用其他的方法來(lái)對(duì)多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到高度聚合的關(guān)聯(lián)詞。
所述檢測(cè)關(guān)鍵詞推廣程度的裝置包括處理器和存儲(chǔ)器,上述爬取單元、處理單元、匹配單元和計(jì)算單元等均作為程序單元存儲(chǔ)在存儲(chǔ)器中,由處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元來(lái)實(shí)現(xiàn)相應(yīng)的功能。
處理器中包含內(nèi)核,由內(nèi)核去存儲(chǔ)器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個(gè)或以上,通過(guò)調(diào)整內(nèi)核參數(shù)來(lái)自動(dòng)檢測(cè)待檢測(cè)關(guān)鍵詞推廣程度,從而實(shí)現(xiàn)了無(wú)需人工分析,通過(guò)自動(dòng)匹配分析即可獲取待檢測(cè)關(guān)鍵詞的推廣程度的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中無(wú)法自動(dòng)對(duì)待檢測(cè)關(guān)鍵詞的推廣程度進(jìn)行評(píng)估的技術(shù)問(wèn)題。
存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性?xún)?nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。
本申請(qǐng)還提供了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時(shí),適于執(zhí)行初始化有如下方法步驟的程序代碼:爬取包括待檢測(cè)關(guān)鍵詞的多個(gè)網(wǎng)絡(luò)文本;對(duì)爬取到的多個(gè)網(wǎng)絡(luò)文本進(jìn)行處理,得到多個(gè)關(guān)聯(lián)詞;將每個(gè)關(guān)聯(lián)詞與預(yù)設(shè)關(guān)鍵詞進(jìn)行匹配,得到預(yù)設(shè)關(guān)鍵詞的匹配關(guān)聯(lián)詞和匹配關(guān)聯(lián)詞的數(shù)量,其中,匹配關(guān)聯(lián)詞為多個(gè)關(guān)聯(lián)詞中的詞,預(yù)設(shè)關(guān)鍵詞為與待檢測(cè)關(guān)鍵詞相關(guān)聯(lián)的關(guān)鍵詞;計(jì)算匹配關(guān)聯(lián)詞的數(shù)量和預(yù)設(shè)關(guān)鍵詞數(shù)量的目標(biāo)比值,其中,目標(biāo)比值用于表征待檢測(cè)關(guān)鍵詞的推廣程度。
上述本申請(qǐng)實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
在本申請(qǐng)的上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過(guò)其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。
所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、移動(dòng)硬盤(pán)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述僅是本申請(qǐng)的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本申請(qǐng)?jiān)淼那疤嵯?,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本申請(qǐng)的保護(hù)范圍。