一種用于出版行業(yè)熱點(diǎn)選題的新穎性判斷方法與系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及出版技術(shù)領(lǐng)域,具體地是涉及一種用于出版行業(yè)熱點(diǎn)選題的新穎性判斷方法與系統(tǒng)。
【背景技術(shù)】
[0002]出版業(yè)生存發(fā)展一個(gè)決定因素是出版的內(nèi)容,而高質(zhì)量內(nèi)容的首要條件是高質(zhì)量的選題,離開一流的選題,很難產(chǎn)生出一流的出版內(nèi)容。因此,獲得及時(shí)準(zhǔn)確、具有市場價(jià)值的熱點(diǎn)選題,對(duì)出版物的優(yōu)質(zhì)高效起著至關(guān)重要的作用。
[0003]而目前對(duì)熱點(diǎn)選題的獲取以及其是否具有新穎性的判斷都需要借助編輯人員進(jìn)行,面對(duì)海量的信息去篩選優(yōu)化為具體的選題,工作量巨大,制約選題優(yōu)化的進(jìn)一步發(fā)展,迫切需求計(jì)算機(jī)輔助來進(jìn)行選題優(yōu)化工作。而且人工判斷選題的新穎性時(shí)過分依賴于人的主觀性,同時(shí)缺乏足夠的數(shù)據(jù)支撐,使得其新穎性判斷不夠客觀公正,在指導(dǎo)出版方向時(shí)難免會(huì)出現(xiàn)偏差,不利于出版行業(yè)的快速發(fā)展。
[0004]因此,本發(fā)明的發(fā)明人亟需構(gòu)思一種新技術(shù)以改善其問題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在提供一種用于出版行業(yè)熱點(diǎn)選題的新穎性判斷方法與系統(tǒng),其可以使得選題的新穎性判斷更加準(zhǔn)確和高效。
[0006]為解決上述技術(shù)問題,本發(fā)明的技術(shù)方案是:
[0007]一種用于出版行業(yè)熱點(diǎn)選題的新穎性判斷方法,包括如下步驟:
[0008]S1:設(shè)定多個(gè)主題類別,其設(shè)定方式包括人工預(yù)定義和自動(dòng)聚類生成。
[0009]S2:獲取出版物資源庫中所有出版物的主題,并確定其對(duì)應(yīng)的主題類別,統(tǒng)計(jì)每一主題類別下對(duì)應(yīng)的出版物數(shù)量。
[0010]根據(jù)對(duì)應(yīng)出版物數(shù)量的不同將主題類別進(jìn)行劃分,包括第一主題類別和第二主題類別,其中所述第一主題類別下對(duì)應(yīng)的出版物數(shù)量小于所述第二主題類別下對(duì)應(yīng)的出版物數(shù)量。
[0011]S3:確定熱點(diǎn)選題所在的主題類別,當(dāng)該主題類別為第一主題類別時(shí),判定其具有新穎性,標(biāo)記為新穎選題并推送至出版單位所在的媒體終端。
[0012]進(jìn)一步地,還包括:
[0013]S4:對(duì)新穎選題通過關(guān)聯(lián)挖掘的方法得到與該新穎選題相關(guān)聯(lián)的一個(gè)或者多個(gè)關(guān)聯(lián)選題,而后確定該關(guān)聯(lián)選題所在的主題類別,當(dāng)該主題類別為第一主題類別時(shí),判定其具有新穎性,標(biāo)記為新穎選題并推送至出版單位所在的媒體終端。
[0014]進(jìn)一步地,還包括:
[0015]S5:將所述新穎選題與專家新穎知識(shí)庫中的數(shù)據(jù)進(jìn)行相似度的比較,如果相似度高于預(yù)設(shè)閾值,則判定其新穎性高,標(biāo)記為前沿選題并推送至出版單位所在的媒體終端。
[0016]進(jìn)一步地,所述步驟S5具體包括:
[0017]S51:從所述新穎選題中識(shí)別出關(guān)鍵詞集合,來表征該新穎選題。
[0018]S52:在整個(gè)專家新穎知識(shí)庫中檢索這些關(guān)鍵詞,獲得包含一個(gè)或者若干個(gè)關(guān)鍵詞的句子,形成候選推薦集。
[0019]S53:計(jì)算候選推薦集中的數(shù)據(jù)與所述新穎選題的相似度,如果相似度高于預(yù)設(shè)閾值,則判定其新穎性高,標(biāo)記為前沿選題并推送至出版單位所在的媒體終端。
[0020]進(jìn)一步地,所述步驟S2還包括:
[0021]獲取出版物資源庫中所有出版物的出版時(shí)間,統(tǒng)計(jì)每一主題類別中出版物數(shù)量隨時(shí)間變化的趨勢,該趨勢包括穩(wěn)定、上升和下降。
[0022]所述步驟S3還包括:
[0023]確定熱點(diǎn)選題所在的主題類別,當(dāng)該主題類別中出版物數(shù)量隨時(shí)間變化的趨勢為上升,則判定其具有新穎性,標(biāo)記為新穎選題并推送至出版單位所在的媒體終端。
[0024]一種用于出版行業(yè)熱點(diǎn)選題的新穎性判斷系統(tǒng),包括:
[0025]主題類別設(shè)定模塊,用于設(shè)定多個(gè)主題類別,其設(shè)定方式包括人工預(yù)定義和自動(dòng)聚類生成。
[0026]統(tǒng)計(jì)和劃分模塊,用于獲取出版物資源庫中所有出版物的主題,并確定其對(duì)應(yīng)的主題類別,統(tǒng)計(jì)每一主題類別下對(duì)應(yīng)的出版物數(shù)量。
[0027]根據(jù)對(duì)應(yīng)出版物數(shù)量的不同將主題類別進(jìn)行劃分,包括第一主題類別和第二主題類別,其中所述第一主題類別下對(duì)應(yīng)的出版物數(shù)量小于所述第二主題類別下對(duì)應(yīng)的出版物數(shù)量。
[0028]判定模塊,用于確定熱點(diǎn)選題所在的主題類別,當(dāng)該主題類別為第一主題類別時(shí),判定其具有新穎性,標(biāo)記為新穎選題并推送至出版單位所在的媒體終端。
[0029]進(jìn)一步地,還包括關(guān)聯(lián)挖掘模塊,用于對(duì)新穎選題通過關(guān)聯(lián)挖掘的方法得到與該新穎選題相關(guān)聯(lián)的一個(gè)或者多個(gè)關(guān)聯(lián)選題,而后確定該關(guān)聯(lián)選題所在的主題類別,當(dāng)該主題類別為第一主題類別時(shí),判定其具有新穎性,標(biāo)記為新穎選題并推送至出版單位所在的媒體終端。
[0030]進(jìn)一步地,還包括:
[0031]前沿選題判定模塊,用于將所述新穎選題與專家新穎知識(shí)庫中的數(shù)據(jù)進(jìn)行相似度的比較,如果相似度高于預(yù)設(shè)閾值,則判定其新穎性高,標(biāo)記為前沿選題并推送至出版單位所在的媒體終端。
[0032]進(jìn)一步地,所述前沿選題判定模塊具體包括:
[0033]表征單元,用于從所述新穎選題中識(shí)別出關(guān)鍵詞集合,來表征該新穎選題。
[0034]候選推薦集形成單元,用于在整個(gè)專家新穎知識(shí)庫中檢索這些關(guān)鍵詞,獲得包含一個(gè)或者若干個(gè)關(guān)鍵詞的句子,形成候選推薦集。
[0035]相似度計(jì)算單元,用于計(jì)算候選推薦集中的數(shù)據(jù)與所述新穎選題的相似度,如果相似度高于預(yù)設(shè)閾值,則判定其新穎性高,標(biāo)記為前沿選題并推送至出版單位所在的媒體終端。
[0036]進(jìn)一步地,所述統(tǒng)計(jì)和劃分模塊還包括:
[0037]趨勢分析單元,用于獲取出版物資源庫中所有出版物的出版時(shí)間,統(tǒng)計(jì)每一主題類別中出版物數(shù)量隨時(shí)間變化的趨勢,該趨勢包括穩(wěn)定、上升和下降。
[0038]所述判定模塊還包括:
[0039]趨勢判定單元,用于確定熱點(diǎn)選題所在的主題類別,當(dāng)該主題類別中出版物數(shù)量隨時(shí)間變化的趨勢為上升,則判定其具有新穎性,標(biāo)記為新穎選題并推送至出版單位所在的媒體終端。
[0040]采用上述技術(shù)方案,本發(fā)明至少包括如下有益效果:
[0041]本發(fā)明所述的用于出版行業(yè)熱點(diǎn)選題的新穎性判斷方法與系統(tǒng),將選題分類統(tǒng)計(jì)與專家新穎知識(shí)庫兩種策略進(jìn)行判定,更加準(zhǔn)確和高效,同時(shí)附帶關(guān)聯(lián)選題推薦功能,使得分析更加全面,具有較大的市場應(yīng)用價(jià)值。
【附圖說明】
[0042]圖1為本發(fā)明所述的用于出版行業(yè)熱點(diǎn)選題的新穎性判斷方法的流程圖;
[0043]圖2為本發(fā)明所述的用于出版行業(yè)熱點(diǎn)選題的新穎性判斷系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0044]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0045]實(shí)施例1
[0046]如圖1所示,為符合本實(shí)施例的一種用于出版行業(yè)熱點(diǎn)選題的新穎性判斷方法,包括如下步驟:
[0047]S1:設(shè)定多個(gè)主題類別,其設(shè)定方式包括人工預(yù)定義和自動(dòng)聚類生成。
[0048]S2:獲取出版物資源庫中所有出版物的主題,并確定其對(duì)應(yīng)的主題類別,統(tǒng)計(jì)每一主題類別下對(duì)應(yīng)的出版物數(shù)量。
[0049]根據(jù)對(duì)應(yīng)出版物數(shù)量的不同將主題類別進(jìn)行劃分,包括但不限于第一主題類別和第二主題類別,其中所述第一主題類別下對(duì)應(yīng)的出版物數(shù)量小于所述第二主題類別下對(duì)應(yīng)的出版物數(shù)量。本實(shí)施例中所述第一主題類別優(yōu)選指代為出版物分布數(shù)量較少的主題類另IJ,其可以包括出版物分布數(shù)量較少的主題類別中的一個(gè)或者多個(gè),具體數(shù)量的劃分可以結(jié)合實(shí)際的使用需求進(jìn)行設(shè)定,本實(shí)施例對(duì)此不做限定。
[0050]S3:確定熱點(diǎn)選題所在的主題類別,當(dāng)該主題類別為第一主題類別時(shí),判定其具有新穎性,標(biāo)記為新穎選題并推送至出版單位所在的媒體終端。各個(gè)出版單位的編輯人員可以根據(jù)推薦的新穎選題進(jìn)行選擇和分析,并在該新穎選題的提示下形成出版創(chuàng)意。由于其不是通過人工搜索和分析,沒有添加人的主觀性,分析的更加客觀和全面,有利于出版行業(yè)準(zhǔn)確分析市場動(dòng)態(tài),提高市場競爭力。
[0051]本實(shí)施例在新穎選題分析過程中,需要設(shè)計(jì)出能夠準(zhǔn)確表征出出版