熱點(diǎn)信息分析方法及設(shè)備的制作方法
【專(zhuān)利摘要】本發(fā)明提供一種熱點(diǎn)信息分析方法及設(shè)備。熱點(diǎn)信息分析方法包括:從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù);對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)與熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,獲得候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,候選熱點(diǎn)數(shù)據(jù)是指熱點(diǎn)數(shù)據(jù)中與業(yè)務(wù)交易有關(guān)的熱點(diǎn)數(shù)據(jù),候選業(yè)務(wù)數(shù)據(jù)是指業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事件有關(guān)的業(yè)務(wù)數(shù)據(jù);根據(jù)候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,對(duì)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并處理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。本發(fā)明技術(shù)方案可以進(jìn)行熱點(diǎn)信息的分析,提高分析出的熱點(diǎn)信息的準(zhǔn)確度。
【專(zhuān)利說(shuō)明】熱點(diǎn)信息分析方法及設(shè)備 【【技術(shù)領(lǐng)域】】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,尤其涉及一種熱點(diǎn)信息分析方法及設(shè)備。 【【背景技術(shù)】】
[0002] 隨著業(yè)務(wù)市場(chǎng)的發(fā)展,越來(lái)越多的業(yè)務(wù)行業(yè)需要進(jìn)行熱點(diǎn)信息挖掘,以便進(jìn)行行 業(yè)分析或者獲取有用的信息。以證券市場(chǎng)為例,證券市場(chǎng)中的熱點(diǎn)行情是此起彼伏。現(xiàn)階 段,股民用戶(hù)主要是基于自己了解到的股票的市場(chǎng)交易數(shù)據(jù)和消息面數(shù)據(jù),憑借業(yè)務(wù)經(jīng)驗(yàn) 進(jìn)行判斷和分析,以獲得證券市場(chǎng)中的熱點(diǎn)信息。目前這種分析熱點(diǎn)信息的方法一方面依 賴(lài)于用戶(hù)的業(yè)務(wù)經(jīng)驗(yàn),另一方面使用用戶(hù)所能了解到的數(shù)據(jù),數(shù)據(jù)量相對(duì)較少,導(dǎo)致分析出 的熱點(diǎn)信息的準(zhǔn)確度較低。 【
【發(fā)明內(nèi)容】
】
[0003] 本發(fā)明的多個(gè)方面提供一種熱點(diǎn)信息分析方法及設(shè)備,用以進(jìn)行熱點(diǎn)信息的分 析,提高分析出的熱點(diǎn)信息的準(zhǔn)確度。
[0004] 本發(fā)明的一方面,提供一種熱點(diǎn)信息分析方法,包括:
[0005] 從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù);
[0006] 對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)與所述熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,獲 得候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,所述候選熱點(diǎn)數(shù)據(jù)是指所述熱點(diǎn)數(shù)據(jù)中與業(yè) 務(wù)交易有關(guān)的熱點(diǎn)數(shù)據(jù),所述候選業(yè)務(wù)數(shù)據(jù)是指所述業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事件有關(guān)的業(yè)務(wù)數(shù) 據(jù);
[0007] 根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,對(duì)所述候選熱點(diǎn)數(shù)據(jù)進(jìn)行合 并處理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0008] 作為本發(fā)明的進(jìn)一步改進(jìn),所述從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述當(dāng)天熱點(diǎn)事件的熱點(diǎn)數(shù) 據(jù),包括:
[0009] 從所述互聯(lián)網(wǎng)數(shù)據(jù)中確定用戶(hù)訪問(wèn)數(shù)據(jù);
[0010] 從所述用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突變率大于第一突變率門(mén)限且短期突變率大于 第二突變率門(mén)限的候選用戶(hù)訪問(wèn)數(shù)據(jù);
[0011] 對(duì)所述候選用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí)性進(jìn)行驗(yàn)證,將通過(guò)真實(shí)性驗(yàn)證的所述候選用戶(hù) 訪問(wèn)數(shù)據(jù)作為描述熱點(diǎn)事件的所述熱點(diǎn)數(shù)據(jù);
[0012] 其中,所述均值突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)從第一時(shí)間點(diǎn)到當(dāng)前一段時(shí)間 內(nèi)的訪問(wèn)量的變化趨勢(shì);所述短期突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)自第二時(shí)間點(diǎn)到當(dāng)前 一段時(shí)間內(nèi)的訪問(wèn)量的變化趨勢(shì),所述第一時(shí)間點(diǎn)早于所述第二時(shí)間點(diǎn)。
[0013] 作為本發(fā)明的進(jìn)一步改進(jìn),所述從所述用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突變率大于第一 突變率門(mén)限且短期突變率大于第二突變率門(mén)限的候選用戶(hù)訪問(wèn)數(shù)據(jù)之前,還包括:
[0014] 獲取所述用戶(hù)訪問(wèn)數(shù)據(jù)自所述第一時(shí)間點(diǎn)到當(dāng)前的第一平均訪問(wèn)量、所述用戶(hù)訪 問(wèn)數(shù)據(jù)自所述第二時(shí)間點(diǎn)到當(dāng)前的第二平均訪問(wèn)量、以及所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn) 量;
[0015] 用所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以所述第一平均訪問(wèn)量,獲得所述均值突變 率;
[0016] 用所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以所述第二平均訪問(wèn)量,獲得短期突變率。
[0017] 作為本發(fā)明的進(jìn)一步改進(jìn),所述對(duì)所述候選用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí)性進(jìn)行驗(yàn)證,包 括:
[0018] 判斷所述候選用戶(hù)訪問(wèn)數(shù)據(jù)是否出現(xiàn)在新聞標(biāo)題的切詞片段中;
[0019] 如果判斷結(jié)果為是,確定所述候選用戶(hù)訪問(wèn)數(shù)據(jù)通過(guò)真實(shí)性驗(yàn)證;如果判斷結(jié)果 為否,確定所述候選用戶(hù)訪問(wèn)數(shù)據(jù)未通過(guò)真實(shí)性驗(yàn)證。
[0020] 作為本發(fā)明的進(jìn)一步改進(jìn),所述對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)與 所述熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,獲得候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,包括:
[0021] 對(duì)于每種所述業(yè)務(wù)數(shù)據(jù),確定所述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的價(jià)格走勢(shì)和每個(gè)所述熱點(diǎn)數(shù)據(jù) 對(duì)應(yīng)的訪問(wèn)量走勢(shì)之間的相似度,并確定所述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的關(guān)鍵詞在每個(gè)所述熱點(diǎn)數(shù)據(jù) 所屬的用戶(hù)訪問(wèn)數(shù)據(jù)中的共現(xiàn)次數(shù),如果存在相似度滿(mǎn)足預(yù)設(shè)的相似度條件、且共現(xiàn)次數(shù) 大于預(yù)設(shè)的共現(xiàn)量門(mén)限的熱點(diǎn)數(shù)據(jù),則建立所述業(yè)務(wù)數(shù)據(jù)和所述存在的熱點(diǎn)數(shù)據(jù)之間的對(duì) 應(yīng)關(guān)系,并確定所述業(yè)務(wù)數(shù)據(jù)和所述存在的熱點(diǎn)數(shù)據(jù)分別作為所述候選業(yè)務(wù)數(shù)據(jù)和所述候 選熱點(diǎn)數(shù)據(jù)。
[0022] 作為本發(fā)明的進(jìn)一步改進(jìn),所述根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān) 系,對(duì)所述候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并處理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目 標(biāo)業(yè)務(wù)數(shù)據(jù),包括:
[0023] 根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定每個(gè)所述候選熱點(diǎn)數(shù)據(jù) 對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù);
[0024] 將所述候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)所述候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選 業(yè)務(wù)數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選業(yè)務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的 重置條件;
[0025] 如果判斷結(jié)果為是,則將所述兩個(gè)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并作為新的候選熱點(diǎn)數(shù) 據(jù),并將所述兩個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)進(jìn)行合并作為所述新的候選熱點(diǎn)數(shù)據(jù) 對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù),并返回執(zhí)行將所述候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)所述 候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選業(yè) 務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的重疊條件的操作,直到所有判斷結(jié)果均為否,獲得所述目標(biāo)熱點(diǎn) 數(shù)據(jù)和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0026] 作為本發(fā)明的進(jìn)一步改進(jìn),在獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo) 業(yè)務(wù)數(shù)據(jù)之后,還包括:
[0027] 計(jì)算所述目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值;
[0028] 輸出所述目標(biāo)熱點(diǎn)數(shù)據(jù)、所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)以及所述目標(biāo)熱 點(diǎn)數(shù)據(jù)的熱度值。
[0029] 本發(fā)明的另一方面,提供一種熱點(diǎn)信息分析設(shè)備,包括:
[0030] 提取模塊,用于從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù);
[0031] 分析模塊,用于對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)與所述熱點(diǎn)數(shù)據(jù)進(jìn) 行關(guān)聯(lián)分析,獲得候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,所述候選熱點(diǎn)數(shù)據(jù)是指所述 熱點(diǎn)數(shù)據(jù)中與業(yè)務(wù)交易有關(guān)的熱點(diǎn)數(shù)據(jù),所述候選業(yè)務(wù)數(shù)據(jù)是指所述業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事 件有關(guān)的業(yè)務(wù)數(shù)據(jù);
[0032] 合并模塊,用于根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,對(duì)所述候選 熱點(diǎn)數(shù)據(jù)進(jìn)行合并處理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0033] 作為本發(fā)明的進(jìn)一步改進(jìn),所述提取模塊包括:
[0034] 第一確定單元,用于從所述互聯(lián)網(wǎng)數(shù)據(jù)中確定用戶(hù)訪問(wèn)數(shù)據(jù);
[0035] 第二確定單元,用于從所述用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突變率大于第一突變率門(mén)限 且短期突變率大于第二突變率門(mén)限的候選用戶(hù)訪問(wèn)數(shù)據(jù);
[0036] 驗(yàn)證單元,用于對(duì)所述候選用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí)性進(jìn)行驗(yàn)證;
[0037] 提取單元,用于將通過(guò)真實(shí)性驗(yàn)證的所述候選用戶(hù)訪問(wèn)數(shù)據(jù)作為描述熱點(diǎn)事件的 所述熱點(diǎn)數(shù)據(jù);
[0038] 其中,所述均值突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)從第一時(shí)間點(diǎn)到當(dāng)前一段時(shí)間 內(nèi)的訪問(wèn)量的變化趨勢(shì);所述短期突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)自第二時(shí)間點(diǎn)到當(dāng)前 一段時(shí)間內(nèi)的訪問(wèn)量的變化趨勢(shì),所述第一時(shí)間點(diǎn)早于所述第二時(shí)間點(diǎn)。
[0039] 作為本發(fā)明的進(jìn)一步改進(jìn),所述設(shè)備還包括:獲取模塊,用于獲取所述用戶(hù)訪問(wèn)數(shù) 據(jù)自所述第一時(shí)間點(diǎn)到當(dāng)前的第一平均訪問(wèn)量、所述用戶(hù)訪問(wèn)數(shù)據(jù)自所述第二時(shí)間點(diǎn)到當(dāng) 前的第二平均訪問(wèn)量、以及所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量;
[0040] 第一計(jì)算模塊,用于用所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以所述第一平均訪問(wèn) 量,獲得所述均值突變率,并用所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以所述第二平均訪問(wèn)量, 獲得短期突變率。
[0041] 作為本發(fā)明的進(jìn)一步改進(jìn),所述驗(yàn)證單元具體用于判斷所述候選用戶(hù)訪問(wèn)數(shù)據(jù)是 否出現(xiàn)在新聞標(biāo)題的切詞片段中;如果判斷結(jié)果為是,確定所述候選用戶(hù)訪問(wèn)數(shù)據(jù)通過(guò)真 實(shí)性驗(yàn)證;如果判斷結(jié)果為否,確定所述候選用戶(hù)訪問(wèn)數(shù)據(jù)未通過(guò)真實(shí)性驗(yàn)證。
[0042] 作為本發(fā)明的進(jìn)一步改進(jìn),所述分析模塊具體用于對(duì)于每種所述業(yè)務(wù)數(shù)據(jù),確定 所述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的價(jià)格走勢(shì)和每個(gè)所述熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的訪問(wèn)量走勢(shì)之間的相似度,并確 定所述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的關(guān)鍵詞在每個(gè)所述熱點(diǎn)數(shù)據(jù)所屬的用戶(hù)訪問(wèn)數(shù)據(jù)中的共現(xiàn)次數(shù),如 果存在相似度滿(mǎn)足預(yù)設(shè)的相似度條件、且共現(xiàn)次數(shù)大于預(yù)設(shè)的共現(xiàn)量門(mén)限的熱點(diǎn)數(shù)據(jù),則 建立所述業(yè)務(wù)數(shù)據(jù)和所述存在的熱點(diǎn)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,并確定所述業(yè)務(wù)數(shù)據(jù)和所述存 在的熱點(diǎn)數(shù)據(jù)分別作為所述候選業(yè)務(wù)數(shù)據(jù)和所述候選熱點(diǎn)數(shù)據(jù)。
[0043] 作為本發(fā)明的進(jìn)一步改進(jìn),所述合并模塊包括:
[0044] 第三確定單元,用于根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定每 個(gè)所述候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù);
[0045] 比較單元,用于將所述候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)所述候選熱點(diǎn) 數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選業(yè)務(wù)數(shù)據(jù)的 數(shù)量滿(mǎn)足預(yù)設(shè)的重疊條件;
[0046] 合并單元,用于在所述比較單元的判斷結(jié)果為是時(shí),將所述兩個(gè)候選熱點(diǎn)數(shù)據(jù)進(jìn) 行合并作為新的候選熱點(diǎn)數(shù)據(jù),并將所述兩個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)進(jìn)行合并 作為所述新的候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù),并觸發(fā)所述比較單元繼續(xù)執(zhí)行將所述候 選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)所述候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存 在相同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選業(yè)務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的重疊條件的操作; [0047] 獲得單元,用于在所述比較單元的所有判斷結(jié)果均為否時(shí),獲得所述目標(biāo)熱點(diǎn)數(shù) 據(jù)和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0048] 作為本發(fā)明的進(jìn)一步改進(jìn),所述設(shè)備還包括:
[0049] 第二計(jì)算模塊,用于計(jì)算所述目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值;
[0050] 輸出模塊,用于輸出所述目標(biāo)熱點(diǎn)數(shù)據(jù)、所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù) 以及所述目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值。
[0051] 本發(fā)明提供的熱點(diǎn)信息分析方法及設(shè)備,從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述熱點(diǎn)事件的熱 點(diǎn)數(shù)據(jù),對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)和上述熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,獲 得熱點(diǎn)數(shù)據(jù)中與業(yè)務(wù)交易有關(guān)的候選熱點(diǎn)數(shù)據(jù)與業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事件有關(guān)的候選業(yè)務(wù) 數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,再根據(jù)所獲得的對(duì)應(yīng)關(guān)系,對(duì)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并處理,最終獲得 目標(biāo)熱點(diǎn)數(shù)據(jù)與目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù),作為業(yè)務(wù)市場(chǎng)中的熱點(diǎn)信息。本發(fā)明 技術(shù)方案不再依賴(lài)用戶(hù)的業(yè)務(wù)經(jīng)驗(yàn),而且采用的是互聯(lián)網(wǎng)數(shù)據(jù)及整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交 易相關(guān)的業(yè)務(wù)數(shù)據(jù),數(shù)據(jù)量較大,因此與現(xiàn)有技術(shù)相比,提高了分析出的熱點(diǎn)信息的準(zhǔn)確 度。 【【專(zhuān)利附圖】
【附圖說(shuō)明】】
[0052] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述 中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí) 施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附 圖獲得其他的附圖。
[0053] 圖1為本發(fā)明一實(shí)施例提供的熱點(diǎn)信息分析方法的流程示意圖;
[0054] 圖2為本發(fā)明一實(shí)施例提供的步驟101的實(shí)施方式的流程示意圖;
[0055] 圖3為本發(fā)明一實(shí)施例提供的候選熱點(diǎn)數(shù)據(jù)合并結(jié)果的示意圖;
[0056] 圖4為本發(fā)明另一實(shí)施例提供的熱點(diǎn)信息分析方法的流程示意圖;
[0057] 圖5為本發(fā)明一實(shí)施例提供的熱點(diǎn)信息分析設(shè)備的結(jié)構(gòu)示意圖;
[0058] 圖6為本發(fā)明另一實(shí)施例提供的熱點(diǎn)信息分析設(shè)備的結(jié)構(gòu)示意圖。 【【具體實(shí)施方式】】
[0059] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是 本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員 在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0060] 圖1為本發(fā)明一實(shí)施例提供的熱點(diǎn)信息分析方法的流程示意圖。如圖1所示,該 方法包括:
[0061] 101、從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù)。
[0062] 本實(shí)施例提供了一種將互聯(lián)網(wǎng)數(shù)據(jù)與業(yè)務(wù)市場(chǎng)中的業(yè)務(wù)數(shù)據(jù)有機(jī)結(jié)合用以分析 業(yè)務(wù)市場(chǎng)中熱點(diǎn)信息的方法。本實(shí)施例使用的互聯(lián)網(wǎng)數(shù)據(jù)可以是搜索引擎使用的數(shù)據(jù)(例 如搜索詞)或者可以是互聯(lián)網(wǎng)全網(wǎng)數(shù)據(jù)?;ヂ?lián)網(wǎng)全網(wǎng)數(shù)據(jù)可以是微博數(shù)據(jù)、頁(yè)面訪問(wèn)數(shù)據(jù) 等。
[0063] 具體的,熱點(diǎn)信息分析設(shè)備從海量互聯(lián)網(wǎng)數(shù)據(jù)中提取出描述熱點(diǎn)事件的數(shù)據(jù)。為 便于描述,本實(shí)施例將描述熱點(diǎn)事件的數(shù)據(jù)稱(chēng)為熱點(diǎn)數(shù)據(jù)。相應(yīng)的,業(yè)務(wù)市場(chǎng)中與熱點(diǎn)事件 相關(guān)的業(yè)務(wù)數(shù)據(jù)被認(rèn)為是業(yè)務(wù)市場(chǎng)中的熱點(diǎn)信息。
[0064] 進(jìn)一步,為了保證分析出的熱點(diǎn)信息的實(shí)時(shí)性,熱點(diǎn)信息分析設(shè)備可以從海量互 聯(lián)網(wǎng)數(shù)據(jù)中提取描述當(dāng)天熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù),并通過(guò)后續(xù)步驟基于描述當(dāng)天熱點(diǎn)事件的 熱點(diǎn)數(shù)據(jù)確定出的業(yè)務(wù)市場(chǎng)中的熱點(diǎn)信息。
[0065] 步驟101的一種可選實(shí)施方式如圖2所示,包括:
[0066] 1011、熱點(diǎn)信息分析設(shè)備從互聯(lián)網(wǎng)數(shù)據(jù)中確定用戶(hù)訪問(wèn)數(shù)據(jù)。
[0067] 這里的用戶(hù)訪問(wèn)數(shù)據(jù)是指用戶(hù)訪問(wèn)互聯(lián)網(wǎng)頁(yè)面使用的數(shù)據(jù),例如可以是輸入搜索 引擎使用的數(shù)據(jù),例如查詢(xún)?cè)~,或者是用戶(hù)訪問(wèn)微博過(guò)程中使用的搜索詞等等。
[0068] 值得說(shuō)明的是,上述用戶(hù)訪問(wèn)數(shù)據(jù)通常會(huì)有多個(gè)。
[0069] 1012、熱點(diǎn)信息分析設(shè)備從上述用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突變率大于第一突變率 門(mén)限且短期突變率大于第二突變率門(mén)限的候選用戶(hù)訪問(wèn)數(shù)據(jù)。
[0070] 具體的,對(duì)每個(gè)用戶(hù)訪問(wèn)數(shù)據(jù),熱點(diǎn)信息分析設(shè)備確定該用戶(hù)訪問(wèn)數(shù)據(jù)的均值突 變率和短期突變率,然后判斷用戶(hù)訪問(wèn)數(shù)據(jù)的均值突變率是否大于第一突變率門(mén)限,并判 斷用戶(hù)訪問(wèn)數(shù)據(jù)的短期突變率是否大于第二突變率門(mén)限,如果用戶(hù)訪問(wèn)數(shù)據(jù)的均值突變率 大于第一突變率門(mén)限,且短期突變率大于第二突變率門(mén)限,則確定該用戶(hù)訪問(wèn)數(shù)據(jù)為候選 用戶(hù)訪問(wèn)數(shù)據(jù)。
[0071] 關(guān)于第一突變率門(mén)限和第二突變率門(mén)限的取值,本實(shí)施例不做限定。舉例說(shuō)明,第 一突變率門(mén)限可以是3. 0。第二突變率門(mén)限可以是5. 0。
[0072] 上述用戶(hù)訪問(wèn)數(shù)據(jù)的均值突變率用于表征用戶(hù)訪問(wèn)數(shù)據(jù)從第一時(shí)間點(diǎn)到當(dāng)前一 段時(shí)間內(nèi)的訪問(wèn)量的變化趨勢(shì);相應(yīng)的,用戶(hù)訪問(wèn)數(shù)據(jù)的短期突變率用于表征該用戶(hù)訪問(wèn) 數(shù)據(jù)從第二時(shí)間點(diǎn)到當(dāng)前一段時(shí)間內(nèi)的訪問(wèn)量的變化趨勢(shì)。其中,第一時(shí)間點(diǎn)早于第二時(shí) 間點(diǎn),也就是說(shuō),均值突變率反應(yīng)的是用戶(hù)訪問(wèn)數(shù)據(jù)在較長(zhǎng)一段時(shí)間內(nèi)的訪問(wèn)量的變化趨 勢(shì);而短期突變率反應(yīng)的是用戶(hù)訪問(wèn)數(shù)據(jù)在近期一段時(shí)間內(nèi)的訪問(wèn)量的變化趨勢(shì)。
[0073] 基于上述,熱點(diǎn)信息分析設(shè)備在執(zhí)行上述步驟1012之前,還需要獲取用戶(hù)訪問(wèn)數(shù) 據(jù)自第一時(shí)間點(diǎn)到當(dāng)前時(shí)間的第一平均訪問(wèn)量、用戶(hù)訪問(wèn)數(shù)據(jù)自第二時(shí)間點(diǎn)到當(dāng)前時(shí)間的 第二平均訪問(wèn)量、以及用戶(hù)訪問(wèn)數(shù)據(jù)的當(dāng)前訪問(wèn)量;利用用戶(hù)訪問(wèn)數(shù)據(jù)的當(dāng)前訪問(wèn)量除以 第一平均訪問(wèn)量作為該用戶(hù)訪問(wèn)數(shù)據(jù)的均值突變率,利用用戶(hù)訪問(wèn)數(shù)據(jù)的當(dāng)前訪問(wèn)量除以 第二平均訪問(wèn)量作為該用戶(hù)訪問(wèn)數(shù)據(jù)的短期突變率。
[0074] 在此說(shuō)明,上述第一平均訪問(wèn)量是自第一時(shí)間點(diǎn)到當(dāng)前時(shí)間用戶(hù)訪問(wèn)數(shù)據(jù)的平均 訪問(wèn)量;第二平均訪問(wèn)量是自第二時(shí)間點(diǎn)到當(dāng)前用戶(hù)訪問(wèn)數(shù)據(jù)的平均訪問(wèn)量。
[0075] 舉例說(shuō)明,假設(shè)本實(shí)施例是以"天"為單位統(tǒng)計(jì)用戶(hù)訪問(wèn)數(shù)據(jù)的訪問(wèn)量,則上述當(dāng) 前即為當(dāng)天,假設(shè)第一時(shí)間點(diǎn)到當(dāng)天一段時(shí)間是當(dāng)天之前五天時(shí)間;第二時(shí)間點(diǎn)到當(dāng)天一 段時(shí)間是當(dāng)天的前一天。則第一平均訪問(wèn)量是指當(dāng)天之前五天內(nèi)用戶(hù)訪問(wèn)數(shù)據(jù)的訪問(wèn)量的 平均值,第二平均訪問(wèn)量是當(dāng)天的前一天用戶(hù)訪問(wèn)數(shù)據(jù)的訪問(wèn)量;用戶(hù)訪問(wèn)數(shù)據(jù)的當(dāng)前訪 問(wèn)量是用戶(hù)訪問(wèn)數(shù)據(jù)的當(dāng)天訪問(wèn)量。
[0076] 1013、熱點(diǎn)信息分析設(shè)備對(duì)上述候選用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí)性進(jìn)行驗(yàn)證,將通過(guò)真 實(shí)性驗(yàn)證的候選用戶(hù)訪問(wèn)數(shù)據(jù)作為描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù)。
[0077] 考慮到互聯(lián)網(wǎng)數(shù)據(jù)中有些數(shù)據(jù)的真實(shí)性無(wú)法保證,本實(shí)施例的熱點(diǎn)信息分析設(shè)備 通過(guò)對(duì)候選用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí)性進(jìn)行驗(yàn)證,選擇通過(guò)真實(shí)性驗(yàn)證的候選用戶(hù)訪問(wèn)數(shù)據(jù)作 為熱點(diǎn)數(shù)據(jù),這樣有利于保證基于熱點(diǎn)數(shù)據(jù)分析出的業(yè)務(wù)市場(chǎng)中與熱點(diǎn)數(shù)據(jù)相關(guān)的業(yè)務(wù)數(shù) 據(jù)的準(zhǔn)確性。
[0078] 可選的,考慮到新聞一般會(huì)對(duì)熱點(diǎn)事件進(jìn)行報(bào)道,因此熱點(diǎn)信息分析設(shè)備可以判 斷上述候選用戶(hù)訪問(wèn)數(shù)據(jù)是否出現(xiàn)在新聞標(biāo)題的切詞片段中;如果判斷結(jié)果為是,則確定 候選用戶(hù)訪問(wèn)數(shù)據(jù)通過(guò)真實(shí)性驗(yàn)證,如果判斷結(jié)果為否,確定候選用戶(hù)訪問(wèn)數(shù)據(jù)未通過(guò)真 實(shí)性驗(yàn)證。
[0079] 值得說(shuō)明的是,上述新聞標(biāo)題可以從互聯(lián)網(wǎng)數(shù)據(jù)中的新聞搜索中獲得,但不限于 此。例如,上述新聞標(biāo)題還可以通過(guò)報(bào)紙或電視等方式獲得并存儲(chǔ)起來(lái)。
[0080] 102、對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)與上述熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分 析,獲得候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系;其中,候選熱點(diǎn)數(shù)據(jù)是指上述熱點(diǎn)數(shù)據(jù) 中與業(yè)務(wù)交易有關(guān)的熱點(diǎn)數(shù)據(jù),候選業(yè)務(wù)數(shù)據(jù)是指上述業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事件有關(guān)的業(yè)務(wù) 數(shù)據(jù)。
[0081] 首先說(shuō)明,上述獲得的熱點(diǎn)數(shù)據(jù)中有些與本實(shí)施例要分析的業(yè)務(wù)市場(chǎng)中的業(yè)務(wù)交 易有關(guān),有些可能與本實(shí)施例所要分析的業(yè)務(wù)市場(chǎng)中的業(yè)務(wù)交易無(wú)關(guān)。同理,本實(shí)施例要分 析的業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)也不是全部都與熱點(diǎn)事件有關(guān)。因此,在獲得 熱點(diǎn)數(shù)據(jù)之后,熱點(diǎn)信息分析設(shè)備對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)與上述熱 點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,獲得熱點(diǎn)數(shù)據(jù)中與業(yè)務(wù)交易有關(guān)的候選熱點(diǎn)數(shù)據(jù)以及業(yè)務(wù)數(shù)據(jù)中與 熱點(diǎn)事件有關(guān)的候選業(yè)務(wù)數(shù)據(jù),并建立候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系。
[0082] 在此說(shuō)明,業(yè)務(wù)市場(chǎng)中的業(yè)務(wù)交易可能有好多種,例如證券市場(chǎng)中通常會(huì)分股票 類(lèi)交易、債券類(lèi)交易,股票類(lèi)交易根據(jù)股票類(lèi)型又可分為多種業(yè)務(wù)交易,債券類(lèi)交易也會(huì)根 據(jù)債券類(lèi)型分為多種業(yè)務(wù)交易,所以本實(shí)施例中的業(yè)務(wù)數(shù)據(jù)可以有多種,一種業(yè)務(wù)交易對(duì) 應(yīng)一種業(yè)務(wù)數(shù)據(jù)。例如,在證券市場(chǎng)中,A股股票的交易是一種業(yè)務(wù)交易,與A股股票的交 易有關(guān)的數(shù)據(jù)是一種業(yè)務(wù)數(shù)據(jù);B股股票的交易也是一種業(yè)務(wù)交易,與B股股票的交易有關(guān) 的數(shù)據(jù)是一種業(yè)務(wù)數(shù)據(jù);國(guó)債的交易也是一種業(yè)務(wù)交易,與國(guó)債交易有關(guān)的數(shù)據(jù)是一種業(yè) 務(wù)數(shù)據(jù);企業(yè)債的交易也是一種業(yè)務(wù)交易,與企業(yè)債的交易有關(guān)的數(shù)據(jù)是一種業(yè)務(wù)數(shù)據(jù)。
[0083] 在一可選實(shí)施方式中,步驟102的實(shí)施方式包括:對(duì)于每種業(yè)務(wù)數(shù)據(jù),熱點(diǎn)信息分 析設(shè)備先確定該業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的價(jià)格走勢(shì)和每個(gè)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的訪問(wèn)量走勢(shì)之間的相似 度,并確定該業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的關(guān)鍵詞在每個(gè)熱點(diǎn)數(shù)據(jù)所屬的用戶(hù)訪問(wèn)數(shù)據(jù)中的共現(xiàn)次數(shù), 如果存在相似度滿(mǎn)足預(yù)設(shè)的相似度條件、且共現(xiàn)次數(shù)大于預(yù)設(shè)的共現(xiàn)量的熱點(diǎn)數(shù)據(jù),則建 立該業(yè)務(wù)數(shù)據(jù)與上述存在的熱點(diǎn)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,并確定該業(yè)務(wù)數(shù)據(jù)與上述存在的熱 點(diǎn)數(shù)據(jù)分別作為候選業(yè)務(wù)數(shù)據(jù)和候選熱點(diǎn)數(shù)據(jù)。需要說(shuō)明的是,熱點(diǎn)數(shù)據(jù)所屬的用戶(hù)訪問(wèn) 數(shù)據(jù)是指包括該熱點(diǎn)數(shù)據(jù)的用戶(hù)訪問(wèn)數(shù)據(jù),熱點(diǎn)數(shù)據(jù)所屬的用戶(hù)訪問(wèn)數(shù)據(jù)可以是多個(gè)。 [0084] 對(duì)于上述相似度條件和共現(xiàn)量門(mén)限的取值,本實(shí)施例不做限定。例如,上述相似度 條件可以是一個(gè)數(shù)值范圍,即要求業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的價(jià)格走勢(shì)和熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的訪問(wèn)量走勢(shì) 之間的相似度在該數(shù)值范圍內(nèi),例如該數(shù)值范圍可以是〇. 4-1。上述共現(xiàn)量門(mén)限可以是大于 10的自然數(shù)。
[0085] 在此說(shuō)明,上述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的價(jià)格走勢(shì)可以預(yù)先獲得并存儲(chǔ)在熱點(diǎn)信息分析設(shè) 備本地,或者可由熱點(diǎn)信息分析設(shè)備從業(yè)務(wù)數(shù)據(jù)中獲取價(jià)格并分析出價(jià)格走勢(shì)。同理,上述 熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的訪問(wèn)量走勢(shì)可以預(yù)先獲得并存儲(chǔ)在熱點(diǎn)信息分析設(shè)備本地,或者可由熱點(diǎn) 信息分析設(shè)備統(tǒng)計(jì)熱點(diǎn)數(shù)據(jù)的訪問(wèn)量并分析其訪問(wèn)量走勢(shì)。值得說(shuō)明的是,確定業(yè)務(wù)數(shù)據(jù) 對(duì)應(yīng)的價(jià)格走勢(shì)和熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的訪問(wèn)量走勢(shì)之間的相似度,需要使用對(duì)應(yīng)于同一時(shí)間段 范圍的價(jià)格走勢(shì)和訪問(wèn)量走勢(shì)。
[0086] 上述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的關(guān)鍵字可以是與該業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的業(yè)務(wù)相關(guān)的信息,例如可 以是業(yè)務(wù)名稱(chēng)、業(yè)務(wù)代碼、業(yè)務(wù)名稱(chēng)的縮寫(xiě)等。該關(guān)鍵字可以預(yù)先存儲(chǔ)到熱點(diǎn)信息分析設(shè)備 本地。
[0087] 在此說(shuō)明,經(jīng)過(guò)步驟102, 一方面建立了候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)之間的對(duì)應(yīng) 關(guān)系,另一方面也對(duì)熱點(diǎn)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)進(jìn)行了篩選,既剔除了熱點(diǎn)數(shù)據(jù)中與本實(shí)施例要 分析的業(yè)務(wù)市場(chǎng)中的業(yè)務(wù)交易無(wú)關(guān)的熱點(diǎn)數(shù)據(jù),又剔除了業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事件無(wú)關(guān)的業(yè) 務(wù)數(shù)據(jù)。
[0088] 103、根據(jù)候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,對(duì)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并處 理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0089] 經(jīng)過(guò)步驟102獲得的候選熱點(diǎn)數(shù)據(jù)可能屬于同一題材,但卻是分散的,即作為獨(dú) 立的候選熱點(diǎn)數(shù)據(jù),也就是說(shuō)此時(shí)獲得的候選熱點(diǎn)數(shù)據(jù)以及其對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)還不能 準(zhǔn)確的表示業(yè)務(wù)市場(chǎng)中的熱點(diǎn)信息,因此需要對(duì)候選熱點(diǎn)數(shù)據(jù)進(jìn)行歸納合并。
[0090] 基于此,熱點(diǎn)信息分析設(shè)備根據(jù)上述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系, 確定每個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù);將候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)?個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選 業(yè)務(wù)數(shù)據(jù)的數(shù)量是否滿(mǎn)足預(yù)設(shè)的重疊條件;如果判斷結(jié)果為是,則將這兩個(gè)候選熱點(diǎn)數(shù)據(jù) (這兩個(gè)候選熱點(diǎn)數(shù)據(jù)是指對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中存在相同的候選業(yè)務(wù)數(shù)據(jù)且相同的候選 業(yè)務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的重疊條件的候選熱點(diǎn)數(shù)據(jù))進(jìn)行合并作為新的候選熱點(diǎn)數(shù)據(jù), 并將這兩個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)進(jìn)行合并作為該新的候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的 候選業(yè)務(wù)數(shù)據(jù),之后返回執(zhí)行將候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)候選熱點(diǎn)數(shù)據(jù) 對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且相同的候選業(yè)務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足 預(yù)設(shè)的重疊條件的操作,直到所有判斷結(jié)果均為否,獲得所述目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目標(biāo)熱 點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0091] 即當(dāng)每?jī)蓚€(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)均不包括相同的候選業(yè)務(wù)數(shù)據(jù),或 者包括相同的候選業(yè)務(wù)數(shù)據(jù)但相同的候選業(yè)務(wù)數(shù)據(jù)的數(shù)量不滿(mǎn)足預(yù)設(shè)的重疊條件時(shí),獲取 此時(shí)的候選熱點(diǎn)數(shù)據(jù)作為目標(biāo)熱點(diǎn)數(shù)據(jù),并將此時(shí)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)作為 目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0092] 上述重疊條件可以是一個(gè)數(shù)值范圍,即要求兩個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù) 據(jù)中相同候選業(yè)務(wù)數(shù)據(jù)的數(shù)量應(yīng)該在該數(shù)值范圍內(nèi)。或者,上述重疊條件也可以是一個(gè)下 限數(shù)值,即要求兩個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中相同候選業(yè)務(wù)數(shù)據(jù)的數(shù)量應(yīng)該大 于該下限數(shù)值。
[0093] 以證券市場(chǎng)為例進(jìn)行說(shuō)明,如圖3所示中的"Nest"、"智能家居概念股"和"谷歌 (Google)收購(gòu)"分別是不同的候選熱點(diǎn)數(shù)據(jù),假設(shè)"Nest"對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)有四川長(zhǎng)虹 的業(yè)務(wù)數(shù)據(jù)(圖3中簡(jiǎn)稱(chēng)為四川長(zhǎng)虹)、安居寶的業(yè)務(wù)數(shù)據(jù)(圖3中簡(jiǎn)稱(chēng)為安居寶)、英唐 智控的業(yè)務(wù)數(shù)據(jù)(圖3中簡(jiǎn)稱(chēng)為英唐智控)和九陽(yáng)股份的業(yè)務(wù)數(shù)據(jù)(圖3中簡(jiǎn)稱(chēng)為九陽(yáng)股 份),"智能家居概念股"對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)有四川長(zhǎng)虹的業(yè)務(wù)數(shù)據(jù)、東軟載波的業(yè)務(wù)數(shù)據(jù) (圖3中簡(jiǎn)稱(chēng)為東軟載波)、英唐智控的業(yè)務(wù)數(shù)據(jù)和九陽(yáng)股份的業(yè)務(wù)數(shù)據(jù),"Google收購(gòu)"對(duì) 應(yīng)的候選業(yè)務(wù)數(shù)據(jù)有四川長(zhǎng)虹的業(yè)務(wù)數(shù)據(jù)、安居寶的業(yè)務(wù)數(shù)據(jù)、英唐智控的業(yè)務(wù)數(shù)據(jù)以及 和晶科技的業(yè)務(wù)數(shù)據(jù)(圖3中簡(jiǎn)稱(chēng)為和晶科技)。
[0094] 按照上述方法進(jìn)行分析可以得出:"Nest"、"智能家居概念股"和"Google收購(gòu)"雖 然字面意思不同但實(shí)際上屬于同一主題(即屬于描述同一熱點(diǎn)事件)的熱點(diǎn)數(shù)據(jù),于是將 三個(gè)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并處理,得到目標(biāo)熱點(diǎn)數(shù)據(jù),即"智能家居概念股",并將"Nest"、 "智能家居概念股"和"Google收購(gòu)"對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)進(jìn)行合并,得到四川長(zhǎng)虹的業(yè)務(wù) 數(shù)據(jù)、安居寶的業(yè)務(wù)數(shù)據(jù)、英唐智控的業(yè)務(wù)數(shù)據(jù)、九陽(yáng)股份的業(yè)務(wù)數(shù)據(jù)、東軟載波的業(yè)務(wù)數(shù) 據(jù)以及和晶科技的業(yè)務(wù)數(shù)據(jù),作為"智能家居概念股"對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0095] 經(jīng)過(guò)上述分析可知,本實(shí)施例提供的方法不再依賴(lài)用戶(hù)的業(yè)務(wù)經(jīng)驗(yàn),而是由熱點(diǎn) 信息分析設(shè)備將互聯(lián)網(wǎng)數(shù)據(jù)和業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)相結(jié)合從而分析出 業(yè)務(wù)市場(chǎng)中的熱點(diǎn)信息,克服了用戶(hù)的主觀因素對(duì)分析過(guò)程的影響,另外,本實(shí)施例提供的 方法采用的是互聯(lián)網(wǎng)數(shù)據(jù)及整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易相關(guān)的業(yè)務(wù)數(shù)據(jù),數(shù)據(jù)量較大,因 此與現(xiàn)有技術(shù)相比,本實(shí)施例提高了分析出的熱點(diǎn)信息的準(zhǔn)確度。
[0096] 圖4為本發(fā)明另一實(shí)施例提供的熱點(diǎn)信息分析方法的流程示意圖。該實(shí)施例可基 于圖1所示實(shí)施例實(shí)現(xiàn),如圖4所示,該方法在步驟103之后,還包括:
[0097] 104、計(jì)算目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值。
[0098] 105、輸出目標(biāo)熱點(diǎn)數(shù)據(jù)、目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)以及目標(biāo)熱點(diǎn)數(shù)據(jù)的 熱度值。
[0099] 其中,熱度值反映了目標(biāo)熱點(diǎn)數(shù)據(jù)的受關(guān)注度,便于用戶(hù)更加直觀的了解目標(biāo)熱 點(diǎn)數(shù)據(jù)及目標(biāo)業(yè)務(wù)數(shù)據(jù)的受關(guān)注度,為用戶(hù)做決策提供更加直觀的判斷依據(jù)。
[0100] 在一可選實(shí)施方式中,熱點(diǎn)信息分析設(shè)備確定目標(biāo)熱點(diǎn)數(shù)據(jù)的當(dāng)前訪問(wèn)量、目標(biāo) 熱點(diǎn)數(shù)據(jù)的均值突變率和短期突變率;對(duì)目標(biāo)熱點(diǎn)數(shù)據(jù)的當(dāng)前訪問(wèn)量、均值突變率和短期 突變率進(jìn)行數(shù)值擬合或回歸分析,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值。
[0101] 對(duì)于目標(biāo)熱點(diǎn)數(shù)據(jù),如果是由多個(gè)候選熱點(diǎn)數(shù)據(jù)合并而成,則將合并成該目標(biāo)熱 點(diǎn)數(shù)據(jù)的多個(gè)候選熱點(diǎn)數(shù)據(jù)的當(dāng)前訪問(wèn)量中最大的作為目標(biāo)熱點(diǎn)數(shù)據(jù)的當(dāng)前訪問(wèn)量,并將 訪問(wèn)量最大的候選熱點(diǎn)數(shù)據(jù)的均值突變率和短期突變率作為目標(biāo)熱點(diǎn)數(shù)據(jù)的均值突變率 和短期突變率。
[0102] 如圖3所示,"智能家居概念股"的熱度值是五顆星,表示受關(guān)注度極高。熱點(diǎn)信息 分析設(shè)備計(jì)算目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值,并輸出目標(biāo)熱點(diǎn)數(shù)據(jù)、其對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)及其 熱度值,有利于用戶(hù)了解不同熱點(diǎn)數(shù)據(jù)及其對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)的受關(guān)注度,便于用戶(hù)做 決策。
[0103] 需要說(shuō)明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列 的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)?依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知 悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明 所必須的。
[0104] 在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部 分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。
[0105] 圖5為本發(fā)明一實(shí)施例提供的熱點(diǎn)信息分析設(shè)備的結(jié)構(gòu)示意圖。如圖5所示,該 設(shè)備包括:提取模塊51、分析模塊52和合并模塊53。
[0106] 提取模塊51,用于從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù)。
[0107] 分析模塊52,與提取模塊51連接,用于對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù) 數(shù)據(jù)與提取模塊51提取的熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,獲得候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的 對(duì)應(yīng)關(guān)系,所述候選熱點(diǎn)數(shù)據(jù)是指所述熱點(diǎn)數(shù)據(jù)中與業(yè)務(wù)交易有關(guān)的熱點(diǎn)數(shù)據(jù),所述候選 業(yè)務(wù)數(shù)據(jù)是指所述業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事件有關(guān)的業(yè)務(wù)數(shù)據(jù)。
[0108] 合并模塊53,與分析模塊52連接,用于根據(jù)分析模塊52獲得的候選熱點(diǎn)數(shù)據(jù)與候 選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,對(duì)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并處理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和目標(biāo)熱點(diǎn)數(shù) 據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0109] 在一可選實(shí)施方式中,如圖6所示,提取模塊51的實(shí)現(xiàn)結(jié)構(gòu)包括:第一確定單元 511、第二確定單元512、驗(yàn)證單元513和提取單元514。
[0110] 第一確定單元511,用于從互聯(lián)網(wǎng)數(shù)據(jù)中確定用戶(hù)訪問(wèn)數(shù)據(jù)。
[0111] 第二確定單元512,與第一確定單元511連接,用于從第一確定單元511所確定的 用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突變率大于第一突變率門(mén)限且短期突變率大于第二突變率門(mén)限 的候選用戶(hù)訪問(wèn)數(shù)據(jù)。
[0112] 驗(yàn)證單元513,與第二確定單元512連接,用于對(duì)第二確定單元512所確定的候選 用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí)性進(jìn)行驗(yàn)證。
[0113] 提取單元514,與驗(yàn)證單元513連接,用于將通過(guò)驗(yàn)證單元513的真實(shí)性驗(yàn)證的候 選用戶(hù)訪問(wèn)數(shù)據(jù)作為描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù)。
[0114] 其中,上述均值突變率用于表征用戶(hù)訪問(wèn)數(shù)據(jù)從第一時(shí)間點(diǎn)到當(dāng)前一段時(shí)間內(nèi)的 訪問(wèn)量的變化趨勢(shì);上述短期突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)自第二時(shí)間點(diǎn)到當(dāng)前一段 時(shí)間內(nèi)的訪問(wèn)量的變化趨勢(shì),第一時(shí)間點(diǎn)早于第二時(shí)間點(diǎn)。
[0115] 在一可選實(shí)施方式中,如圖6所示,該設(shè)備還可以包括:獲取模塊61和第一計(jì)算模 塊62。
[0116] 獲取模塊61,用于在第二確定單元512從用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突變率大于第 一突變率門(mén)限且短期突變率大于第二突變率門(mén)限的候選用戶(hù)訪問(wèn)數(shù)據(jù)之前,獲取用戶(hù)訪問(wèn) 數(shù)據(jù)自第一時(shí)間點(diǎn)到當(dāng)前的第一平均訪問(wèn)量、用戶(hù)訪問(wèn)數(shù)據(jù)自第二時(shí)間點(diǎn)到當(dāng)前的第二平 均訪問(wèn)量、以及用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量。
[0117] 第一計(jì)算模塊62,與獲取模塊61連接,用于用獲取模塊61獲取的用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng) 前的訪問(wèn)量除以獲取模塊61獲取的第一平均訪問(wèn)量,獲得均值突變率,并用獲取模塊61獲 取的用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以獲取模塊61獲取的第二平均訪問(wèn)量,獲得短期突變 率。
[0118] 第一計(jì)算模塊62還與第二確定單元512連接,用于向第二確定單元512提供均值 突變率和短期突變率。
[0119] 在一可選實(shí)施方式中,驗(yàn)證單元513具體可用于判斷候選用戶(hù)訪問(wèn)數(shù)據(jù)是否出現(xiàn) 在新聞標(biāo)題的切詞片段中;如果判斷結(jié)果為是,確定候選用戶(hù)訪問(wèn)數(shù)據(jù)通過(guò)真實(shí)性驗(yàn)證; 如果判斷結(jié)果為否,確定候選用戶(hù)訪問(wèn)數(shù)據(jù)未通過(guò)真實(shí)性驗(yàn)證。
[0120] 在一可選實(shí)施方式中,分析模塊具體可用于對(duì)于每種業(yè)務(wù)數(shù)據(jù),確定該業(yè)務(wù)數(shù)據(jù) 對(duì)應(yīng)的價(jià)格走勢(shì)和每個(gè)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的訪問(wèn)量走勢(shì)之間的相似度,并確定該業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng) 的關(guān)鍵詞在每個(gè)熱點(diǎn)數(shù)據(jù)所屬的用戶(hù)訪問(wèn)數(shù)據(jù)中的共現(xiàn)次數(shù),如果存在相似度滿(mǎn)足預(yù)設(shè)的 相似度條件、且共現(xiàn)次數(shù)大于預(yù)設(shè)的共現(xiàn)量門(mén)限的熱點(diǎn)數(shù)據(jù),則建立該業(yè)務(wù)數(shù)據(jù)和所述存 在的熱點(diǎn)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,并確定該業(yè)務(wù)數(shù)據(jù)和所述存在的熱點(diǎn)數(shù)據(jù)分別作為候選業(yè) 務(wù)數(shù)據(jù)和候選熱點(diǎn)數(shù)據(jù)。
[0121] 在一可選實(shí)施方式中,如圖6所示,合并模塊53的實(shí)現(xiàn)結(jié)構(gòu)包括:第三確定單元 531、比較單元532、合并單元533和獲得單元534。
[0122] 第三確定單元531,與分析模塊52連接,用于根據(jù)分析模塊52獲得的候選熱點(diǎn)數(shù) 據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定每個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)。
[0123] 比較單元532,與第三確定單元531連接,用于將候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以 判斷每?jī)蓚€(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且相同的 候選業(yè)務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的重疊條件。
[0124] 合并單元533,與比較單元532連接,用于在比較單元532的判斷結(jié)果為是時(shí),將兩 個(gè)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并作為新的候選熱點(diǎn)數(shù)據(jù),并將兩個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù) 數(shù)據(jù)進(jìn)行合并作為新的候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù),并觸發(fā)比較單元532繼續(xù)執(zhí)行 將候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存 在相同的候選業(yè)務(wù)數(shù)據(jù)且相同的候選業(yè)務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的重疊條件的操作。
[0125] 獲得單元534,與比較單元532連接,用于在比較單元532的所有判斷結(jié)果均為否 時(shí),獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
[0126] 在一可選實(shí)施方式中,如圖6所示,該設(shè)備還可以包括:第二計(jì)算模塊63和輸出模 塊64。
[0127] 第二計(jì)算模塊63,與獲得單元534連接,用于在獲得單元534獲得目標(biāo)熱點(diǎn)數(shù)據(jù) 和目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)之后,計(jì)算獲得單元534獲得的目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度 值。
[0128] 輸出模塊64,與獲得單元534和第二計(jì)算模塊63連接,用于輸出獲得單元534獲 得的目標(biāo)熱點(diǎn)數(shù)據(jù)、獲得單元634獲得的目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)以及第二計(jì)算 模塊63計(jì)算出的目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值。
[0129] 本實(shí)施例提供的熱點(diǎn)信息分析設(shè)備,將互聯(lián)網(wǎng)數(shù)據(jù)與業(yè)務(wù)市場(chǎng)中的業(yè)務(wù)數(shù)據(jù)有機(jī) 結(jié)合用以分析業(yè)務(wù)市場(chǎng)中熱點(diǎn)信息,不再依賴(lài)用戶(hù)的業(yè)務(wù)經(jīng)驗(yàn),而且采用的是互聯(lián)網(wǎng)數(shù)據(jù) 及整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易相關(guān)的業(yè)務(wù)數(shù)據(jù),數(shù)據(jù)量較大,因此與現(xiàn)有技術(shù)相比,提高了 分析出的熱點(diǎn)信息的準(zhǔn)確度。
[0130] 所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng), 裝置和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
[0131] 在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以 通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件 可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或 討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或單元的間接耦 合或通信連接,可以是電性,機(jī)械或其它的形式。
[0132] 所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè) 網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目 的。
[0133] 另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以 是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單 元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0134] 上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存 儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算 機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā) 明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器 (Read-Only Memory, ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory, RAM)、磁碟或者光盤(pán) 等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0135] 最后應(yīng)說(shuō)明的是:以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡 管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然 可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替 換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精 神和范圍。
【權(quán)利要求】
1. 一種熱點(diǎn)信息分析方法,其特征在于,包括: 從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù); 對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)與所述熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,獲得候 選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,所述候選熱點(diǎn)數(shù)據(jù)是指所述熱點(diǎn)數(shù)據(jù)中與業(yè)務(wù)交 易有關(guān)的熱點(diǎn)數(shù)據(jù),所述候選業(yè)務(wù)數(shù)據(jù)是指所述業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事件有關(guān)的業(yè)務(wù)數(shù)據(jù); 根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,對(duì)所述候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并處 理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述當(dāng)天熱點(diǎn) 事件的熱點(diǎn)數(shù)據(jù),包括: 從所述互聯(lián)網(wǎng)數(shù)據(jù)中確定用戶(hù)訪問(wèn)數(shù)據(jù); 從所述用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突變率大于第一突變率門(mén)限且短期突變率大于第二 突變率門(mén)限的候選用戶(hù)訪問(wèn)數(shù)據(jù); 對(duì)所述候選用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí)性進(jìn)行驗(yàn)證,將通過(guò)真實(shí)性驗(yàn)證的所述候選用戶(hù)訪問(wèn) 數(shù)據(jù)作為描述熱點(diǎn)事件的所述熱點(diǎn)數(shù)據(jù); 其中,所述均值突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)從第一時(shí)間點(diǎn)到當(dāng)前一段時(shí)間內(nèi)的 訪問(wèn)量的變化趨勢(shì);所述短期突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)自第二時(shí)間點(diǎn)到當(dāng)前一段 時(shí)間內(nèi)的訪問(wèn)量的變化趨勢(shì),所述第一時(shí)間點(diǎn)早于所述第二時(shí)間點(diǎn)。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述從所述用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突 變率大于第一突變率門(mén)限且短期突變率大于第二突變率門(mén)限的候選用戶(hù)訪問(wèn)數(shù)據(jù)之前,還 包括: 獲取所述用戶(hù)訪問(wèn)數(shù)據(jù)自所述第一時(shí)間點(diǎn)到當(dāng)前的第一平均訪問(wèn)量、所述用戶(hù)訪問(wèn)數(shù) 據(jù)自所述第二時(shí)間點(diǎn)到當(dāng)前的第二平均訪問(wèn)量、以及所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量; 用所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以所述第一平均訪問(wèn)量,獲得所述均值突變率; 用所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以所述第二平均訪問(wèn)量,獲得短期突變率。
4. 根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述對(duì)所述候選用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí) 性進(jìn)行驗(yàn)證,包括: 判斷所述候選用戶(hù)訪問(wèn)數(shù)據(jù)是否出現(xiàn)在新聞標(biāo)題的切詞片段中; 如果判斷結(jié)果為是,確定所述候選用戶(hù)訪問(wèn)數(shù)據(jù)通過(guò)真實(shí)性驗(yàn)證;如果判斷結(jié)果為否, 確定所述候選用戶(hù)訪問(wèn)數(shù)據(jù)未通過(guò)真實(shí)性驗(yàn)證。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān) 的業(yè)務(wù)數(shù)據(jù)與所述熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,獲得候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān) 系,包括: 對(duì)于每種所述業(yè)務(wù)數(shù)據(jù),確定所述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的價(jià)格走勢(shì)和每個(gè)所述熱點(diǎn)數(shù)據(jù)對(duì)應(yīng) 的訪問(wèn)量走勢(shì)之間的相似度,并確定所述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的關(guān)鍵詞在每個(gè)所述熱點(diǎn)數(shù)據(jù)所屬 的用戶(hù)訪問(wèn)數(shù)據(jù)中的共現(xiàn)次數(shù),如果存在相似度滿(mǎn)足預(yù)設(shè)的相似度條件、且共現(xiàn)次數(shù)大于 預(yù)設(shè)的共現(xiàn)量門(mén)限的熱點(diǎn)數(shù)據(jù),則建立所述業(yè)務(wù)數(shù)據(jù)和所述存在的熱點(diǎn)數(shù)據(jù)之間的對(duì)應(yīng)關(guān) 系,并確定所述業(yè)務(wù)數(shù)據(jù)和所述存在的熱點(diǎn)數(shù)據(jù)分別作為所述候選業(yè)務(wù)數(shù)據(jù)和所述候選熱 點(diǎn)數(shù)據(jù)。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù) 數(shù)據(jù)的對(duì)應(yīng)關(guān)系,對(duì)所述候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并處理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目標(biāo)熱點(diǎn) 數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù),包括: 根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定每個(gè)所述候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng) 的候選業(yè)務(wù)數(shù)據(jù); 將所述候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)所述候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù) 數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選業(yè)務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的重疊 條件; 如果判斷結(jié)果為是,則將所述兩個(gè)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合并作為新的候選熱點(diǎn)數(shù)據(jù),并 將所述兩個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)進(jìn)行合并作為所述新的候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng) 的候選業(yè)務(wù)數(shù)據(jù),并返回執(zhí)行將所述候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)所述候選 熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選業(yè)務(wù)數(shù) 據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的重疊條件的操作,直到所有判斷結(jié)果均為否,獲得所述目標(biāo)熱點(diǎn)數(shù)據(jù) 和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
7. 根據(jù)權(quán)利要求1、2、3、5或6所述的方法,其特征在于,在獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目 標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)之后,還包括: 計(jì)算所述目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值; 輸出所述目標(biāo)熱點(diǎn)數(shù)據(jù)、所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)以及所述目標(biāo)熱點(diǎn)數(shù) 據(jù)的熱度值。
8. -種熱點(diǎn)信息分析設(shè)備,其特征在于,包括: 提取模塊,用于從互聯(lián)網(wǎng)數(shù)據(jù)中提取描述熱點(diǎn)事件的熱點(diǎn)數(shù)據(jù); 分析模塊,用于對(duì)整個(gè)業(yè)務(wù)市場(chǎng)中與業(yè)務(wù)交易有關(guān)的業(yè)務(wù)數(shù)據(jù)與所述熱點(diǎn)數(shù)據(jù)進(jìn)行關(guān) 聯(lián)分析,獲得候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,所述候選熱點(diǎn)數(shù)據(jù)是指所述熱點(diǎn) 數(shù)據(jù)中與業(yè)務(wù)交易有關(guān)的熱點(diǎn)數(shù)據(jù),所述候選業(yè)務(wù)數(shù)據(jù)是指所述業(yè)務(wù)數(shù)據(jù)中與熱點(diǎn)事件有 關(guān)的業(yè)務(wù)數(shù)據(jù); 合并模塊,用于根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,對(duì)所述候選熱點(diǎn) 數(shù)據(jù)進(jìn)行合并處理,獲得目標(biāo)熱點(diǎn)數(shù)據(jù)和所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
9. 根據(jù)權(quán)利要求8所述的設(shè)備,其特征在于,所述提取模塊包括: 第一確定單元,用于從所述互聯(lián)網(wǎng)數(shù)據(jù)中確定用戶(hù)訪問(wèn)數(shù)據(jù); 第二確定單元,用于從所述用戶(hù)訪問(wèn)數(shù)據(jù)中確定均值突變率大于第一突變率門(mén)限且短 期突變率大于第二突變率門(mén)限的候選用戶(hù)訪問(wèn)數(shù)據(jù); 驗(yàn)證單元,用于對(duì)所述候選用戶(hù)訪問(wèn)數(shù)據(jù)的真實(shí)性進(jìn)行驗(yàn)證; 提取單元,用于將通過(guò)真實(shí)性驗(yàn)證的所述候選用戶(hù)訪問(wèn)數(shù)據(jù)作為描述熱點(diǎn)事件的所述 熱點(diǎn)數(shù)據(jù); 其中,所述均值突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)從第一時(shí)間點(diǎn)到當(dāng)前一段時(shí)間內(nèi)的 訪問(wèn)量的變化趨勢(shì);所述短期突變率用于表征所述用戶(hù)訪問(wèn)數(shù)據(jù)自第二時(shí)間點(diǎn)到當(dāng)前一段 時(shí)間內(nèi)的訪問(wèn)量的變化趨勢(shì),所述第一時(shí)間點(diǎn)早于所述第二時(shí)間點(diǎn)。
10. 根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于,還包括: 獲取模塊,用于獲取所述用戶(hù)訪問(wèn)數(shù)據(jù)自所述第一時(shí)間點(diǎn)到當(dāng)前的第一平均訪問(wèn)量、 所述用戶(hù)訪問(wèn)數(shù)據(jù)自所述第二時(shí)間點(diǎn)到當(dāng)前的第二平均訪問(wèn)量、以及所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng) 前的訪問(wèn)量; 第一計(jì)算模塊,用于用所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以所述第一平均訪問(wèn)量,獲 得所述均值突變率,并用所述用戶(hù)訪問(wèn)數(shù)據(jù)當(dāng)前的訪問(wèn)量除以所述第二平均訪問(wèn)量,獲得 短期突變率。
11. 根據(jù)權(quán)利要求9或10所述的設(shè)備,其特征在于,所述驗(yàn)證單元具體用于判斷所述候 選用戶(hù)訪問(wèn)數(shù)據(jù)是否出現(xiàn)在新聞標(biāo)題的切詞片段中;如果判斷結(jié)果為是,確定所述候選用 戶(hù)訪問(wèn)數(shù)據(jù)通過(guò)真實(shí)性驗(yàn)證;如果判斷結(jié)果為否,確定所述候選用戶(hù)訪問(wèn)數(shù)據(jù)未通過(guò)真實(shí) 性驗(yàn)證。
12. 根據(jù)權(quán)利要求8所述的設(shè)備,其特征在于,所述分析模塊具體用于對(duì)于每種所述業(yè) 務(wù)數(shù)據(jù),確定所述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的價(jià)格走勢(shì)和每個(gè)所述熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的訪問(wèn)量走勢(shì)之間的 相似度,并確定所述業(yè)務(wù)數(shù)據(jù)對(duì)應(yīng)的關(guān)鍵詞在每個(gè)所述熱點(diǎn)數(shù)據(jù)所屬的用戶(hù)訪問(wèn)數(shù)據(jù)中的 共現(xiàn)次數(shù),如果存在相似度滿(mǎn)足預(yù)設(shè)的相似度條件、且共現(xiàn)次數(shù)大于預(yù)設(shè)的共現(xiàn)量門(mén)限的 熱點(diǎn)數(shù)據(jù),則建立所述業(yè)務(wù)數(shù)據(jù)和所述存在的熱點(diǎn)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,并確定所述業(yè)務(wù) 數(shù)據(jù)和所述存在的熱點(diǎn)數(shù)據(jù)分別作為所述候選業(yè)務(wù)數(shù)據(jù)和所述候選熱點(diǎn)數(shù)據(jù)。
13. 根據(jù)權(quán)利要求8所述的設(shè)備,其特征在于,所述合并模塊包括: 第三確定單元,用于根據(jù)所述候選熱點(diǎn)數(shù)據(jù)與候選業(yè)務(wù)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,確定每個(gè)所 述候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù); 比較單元,用于將所述候選熱點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)所述候選熱點(diǎn)數(shù)據(jù) 對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存在相同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選業(yè)務(wù)數(shù)據(jù)的數(shù)量 滿(mǎn)足預(yù)設(shè)的重疊條件; 合并單元,用于在所述比較單元的判斷結(jié)果為是時(shí),將所述兩個(gè)候選熱點(diǎn)數(shù)據(jù)進(jìn)行合 并作為新的候選熱點(diǎn)數(shù)據(jù),并將所述兩個(gè)候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)進(jìn)行合并作為 所述新的候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù),并觸發(fā)所述比較單元繼續(xù)執(zhí)行將所述候選熱 點(diǎn)數(shù)據(jù)兩兩進(jìn)行比較,以判斷每?jī)蓚€(gè)所述候選熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的候選業(yè)務(wù)數(shù)據(jù)中是否存在相 同的候選業(yè)務(wù)數(shù)據(jù)且所述相同的候選業(yè)務(wù)數(shù)據(jù)的數(shù)量滿(mǎn)足預(yù)設(shè)的重疊條件的操作; 獲得單元,用于在所述比較單元的所有判斷結(jié)果均為否時(shí),獲得所述目標(biāo)熱點(diǎn)數(shù)據(jù)和 所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)。
14. 根據(jù)權(quán)利要求8、9、10、12或13所述的設(shè)備,其特征在于,還包括: 第二計(jì)算模塊,用于計(jì)算所述目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值; 輸出模塊,用于輸出所述目標(biāo)熱點(diǎn)數(shù)據(jù)、所述目標(biāo)熱點(diǎn)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)業(yè)務(wù)數(shù)據(jù)以及 所述目標(biāo)熱點(diǎn)數(shù)據(jù)的熱度值。
【文檔編號(hào)】G06F17/30GK104063450SQ201410283286
【公開(kāi)日】2014年9月24日 申請(qǐng)日期:2014年6月23日 優(yōu)先權(quán)日:2014年6月23日
【發(fā)明者】王曉元, 陳承澤, 裘皓萍, 王楊, 湯金華 申請(qǐng)人:百度在線(xiàn)網(wǎng)絡(luò)技術(shù)(北京)有限公司