亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種電網(wǎng)設(shè)計(jì)評審指標(biāo)結(jié)構(gòu)信息識別方法

文檔序號:9631531閱讀:382來源:國知局
一種電網(wǎng)設(shè)計(jì)評審指標(biāo)結(jié)構(gòu)信息識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域和電力系統(tǒng)設(shè)計(jì)領(lǐng)域,尤其涉及一種電網(wǎng)設(shè)計(jì)評審指標(biāo) 結(jié)構(gòu)信息識別方法。
【背景技術(shù)】
[0002] 一直以來,在電網(wǎng)工程設(shè)計(jì)評審應(yīng)用領(lǐng)域,存在無法從電網(wǎng)工程設(shè)計(jì)文檔中準(zhǔn)確 提取關(guān)鍵技術(shù)指標(biāo)供評審的問題。導(dǎo)致評審專家需要現(xiàn)場獲取大量關(guān)鍵技術(shù)指標(biāo)信息,評 審標(biāo)準(zhǔn)不統(tǒng)一、評審效率低、評審效果差。通過機(jī)器學(xué)習(xí)方法,可以利用專家知識對電網(wǎng)工 程設(shè)計(jì)評審報(bào)告文檔中的有意義的指標(biāo)值(如新建變電站主變的功率、新建線路工程的曲 折系數(shù))進(jìn)行抽取。然而,由于電網(wǎng)工程設(shè)計(jì)評審文檔中需要抽取的指標(biāo)不僅存在通過電 網(wǎng)工程和指標(biāo)名稱可唯一確定的簡單指標(biāo),而且大量存在電網(wǎng)工程設(shè)計(jì)評審體系中的復(fù)雜 指標(biāo)需要綜合考慮各種文檔結(jié)構(gòu)信息才能夠有效識別,例如對于可行性研究報(bào)告中存在多 個(gè)線路工程的情況,任何一個(gè)線路指標(biāo)均需要確定其所對應(yīng)的線路工程。對于電力設(shè)計(jì)評 審報(bào)告文檔的指標(biāo)識別,需要解析其文檔描述對應(yīng)指標(biāo)的結(jié)構(gòu)信息。
[0003] 經(jīng)過研究發(fā)現(xiàn),電網(wǎng)工程初步設(shè)計(jì)文檔和電網(wǎng)工程可行性研究報(bào)告文檔作為指導(dǎo) 電網(wǎng)工程建設(shè)的設(shè)計(jì)文檔,具有較為復(fù)雜的文檔結(jié)構(gòu),有以下幾大特點(diǎn):
[0004] (1)文檔段落結(jié)構(gòu)復(fù)雜,不同研究院或不同編寫團(tuán)隊(duì)提交的文檔段落結(jié)構(gòu)不一致, 但是一般每個(gè)章節(jié)或小章節(jié)只涉及一類或部分類別指標(biāo)。文檔章節(jié)段落結(jié)構(gòu)信息能夠有效 的排除或初篩一部分指標(biāo),提尚識別效率和性能。
[0005] (2)部分復(fù)雜指標(biāo)具有層級結(jié)構(gòu),如"接線方式",其屬性有"工期"和"電壓等級"。 對于該類復(fù)雜指標(biāo),需要確定其各個(gè)層級屬性的取值。
[0006] (3)往往在電網(wǎng)工程文檔會同時(shí)羅列幾套方案供對比參考,只有一套方案被推薦 采用,而推薦采用的方案內(nèi)的指標(biāo)通常是更應(yīng)該被關(guān)注的內(nèi)容。
[0007] (4)對于電網(wǎng)工程可行性研究報(bào)告,每份報(bào)告中會同時(shí)提及幾個(gè)分工程,一個(gè)報(bào)告 文檔中可能獲得多個(gè)不同取值的指標(biāo),這些指標(biāo)分別對應(yīng)不同的分工程,需要將分工程提 及的指標(biāo)分別對應(yīng)至相應(yīng)的分工程。

【發(fā)明內(nèi)容】

[0008]為解決現(xiàn)有技術(shù)的問題,本發(fā)明的目的在于提供一種電網(wǎng)設(shè)計(jì)評審指標(biāo)結(jié)構(gòu)信息 識別方法。
[0009] 本發(fā)明的目的可通過以下的技術(shù)措施來實(shí)現(xiàn):
[0010] 一種電網(wǎng)設(shè)計(jì)評審指標(biāo)結(jié)構(gòu)信息識別方法,包括如下步驟:
[0011] 段落信息識別:識別文章段落結(jié)構(gòu),對文本切分并按照切分后的段落所涉及的類 別歸并;
[0012] 指標(biāo)對應(yīng)屬性識別:匹配每個(gè)待識別所對應(yīng)屬性的指標(biāo)的多個(gè)屬性值;
[0013]指標(biāo)可選方案匹配:匹配每個(gè)指標(biāo)的所對應(yīng)的備選方案,并確定何種候選方案為 推薦方案;
[0014] 電網(wǎng)分工程識別與指標(biāo)對應(yīng):識別分工程的作用域,匹配每個(gè)指標(biāo)對應(yīng)的分工程 信息。
[0015] 所述段落信息識別包括如下步驟:
[0016] 文檔歸一化處理:將文檔轉(zhuǎn)換為以行為單位的文本流,同時(shí)修正因轉(zhuǎn)換格式帶來 的錯(cuò)誤;
[0017] 章節(jié)識別與去噪:識別正確的章節(jié)目錄信息,去掉錯(cuò)誤的噪音信息;
[0018] 章節(jié)標(biāo)題抽取:抽取得到正確的章節(jié)標(biāo)題和文檔結(jié)構(gòu);
[0019] 章節(jié)信息識別:提供對每一個(gè)章節(jié)標(biāo)題進(jìn)行分類、關(guān)鍵詞抽取、上下文結(jié)構(gòu)對應(yīng)的 功能。
[0020] 所述章節(jié)信息識別步驟包括如下步驟:
[0021] 章節(jié)分類:對章節(jié)按照章節(jié)標(biāo)題進(jìn)行文本分類,分成六類章節(jié);
[0022] 章節(jié)關(guān)鍵詞抽取:對章節(jié)抽取最能體現(xiàn)章節(jié)信息的關(guān)鍵詞;
[0023] 上下為結(jié)構(gòu)對應(yīng):提供任意章節(jié)的父章節(jié)、子章節(jié)列表和兄弟章節(jié)列表。
[0024] 所述指標(biāo)對應(yīng)屬性識別步驟包括如下步驟:
[0025] 屬性歸并:分析指標(biāo)體系結(jié)構(gòu),將同類指標(biāo)的同類屬性進(jìn)行合并;
[0026] 屬性抽?。簩傩园凑諝w并后的指標(biāo)體系進(jìn)行抽??;
[0027] 指標(biāo)屬性對應(yīng):確定指標(biāo)和屬性的對應(yīng)關(guān)系。
[0028] 所述指標(biāo)可選方案匹配包括如下步驟:
[0029] 方案作用域確定:通過查找方案描述關(guān)鍵詞,確定方案作用域;
[0030] 指標(biāo)方案匹配:確定指標(biāo)和方案的匹配關(guān)系;
[0031] 推薦方案確定:識別電網(wǎng)設(shè)計(jì)評審報(bào)告中描述推薦方案的語句,確定推薦方案。
[0032] 所述電網(wǎng)分工程識別與指標(biāo)對應(yīng)中包括如下步驟:
[0033] 電網(wǎng)分工程名稱識別:從電網(wǎng)設(shè)計(jì)評審報(bào)告中抽取其描述的分工程名稱;
[0034] 電網(wǎng)分工程鏈接對應(yīng):通過給定的標(biāo)注分工程名稱,模糊匹配對應(yīng)到電網(wǎng)設(shè)計(jì)評 審報(bào)告抽取的分工程名稱;
[0035] 電網(wǎng)分工程作用域識別:確定任意指標(biāo)其所對應(yīng)的電網(wǎng)評審設(shè)計(jì)報(bào)告抽取的分工 程名稱;
[0036] 指標(biāo)分工程對應(yīng):確定任意指標(biāo)其所對應(yīng)的規(guī)范的工程名稱。
[0037] 本發(fā)明對比現(xiàn)有技術(shù),有如下優(yōu)點(diǎn):
[0038] 本發(fā)明能夠從電網(wǎng)設(shè)計(jì)評審報(bào)告中將技術(shù)指標(biāo)的文檔結(jié)構(gòu)信息進(jìn)行抽取,包括使 用結(jié)構(gòu)信息識別將文本中使用的分工程的簡稱或別稱與分工程的完整規(guī)范名稱進(jìn)行匹配 的方法,并準(zhǔn)確識別每個(gè)分工程的作用域;識別每個(gè)方案的作用域并識別文檔作者推薦的 方案的方法;識別復(fù)雜指標(biāo)值的屬性的方法。識別指標(biāo)結(jié)構(gòu)信息能夠精確指標(biāo)的描述對象, 并有助于提尚指標(biāo)抽取的效果。
【附圖說明】
[0039] 圖1是本發(fā)明的電網(wǎng)設(shè)計(jì)評審指標(biāo)結(jié)構(gòu)信息識別方法的流程圖;
[0040] 圖2是本發(fā)明方法的段落信息識別流程圖;
[0041] 圖3是本發(fā)明方法的章節(jié)信息識別流程圖;
[0042] 圖4是本發(fā)明方法的指標(biāo)對應(yīng)屬性識別流程圖;
[0043] 圖5是本發(fā)明方法的指標(biāo)可選方案匹配流程圖;
[0044] 圖6是本發(fā)明方法的電網(wǎng)分工程識別與指標(biāo)對應(yīng)流程圖。
【具體實(shí)施方式】
[0045] 如圖1所示,本發(fā)明公開了一種電網(wǎng)設(shè)計(jì)評審指標(biāo)結(jié)構(gòu)信息識別方法,包括如下 步驟:
[0046] 步驟100 :段落信息識別,準(zhǔn)確識別文章段落結(jié)構(gòu),將可以實(shí)現(xiàn)文本切分并按照切 分后的段落所涉及的類別歸并。如圖2所示,在段落信息識別中,包括如下步驟:
[0047] 步驟110 :文檔歸一化處理:將文檔轉(zhuǎn)換為以行為單位的文本流,同時(shí)修正因轉(zhuǎn)換 格式帶來的錯(cuò)誤。
[0048] 步驟120 :章節(jié)識別與去噪:識別正確的章節(jié)目錄信息,去掉錯(cuò)誤的噪音信息。
[0049] 步驟130 :章節(jié)標(biāo)題抽取:從文檔中抽取得到正確的章節(jié)標(biāo)題和文檔結(jié)構(gòu)。
[0050] 步驟140 :章節(jié)信息識別:提供對每一個(gè)章節(jié)標(biāo)題進(jìn)行分類、關(guān)鍵詞抽取、上下文 結(jié)構(gòu)對應(yīng)的功能。
[0051] 如圖3所示,在章節(jié)信息識別中,包括如下步驟:
[0052] 步驟141:章節(jié)分類:對章節(jié)按照章節(jié)標(biāo)題進(jìn)行文本分類,分成六類(變電二次、變 電一次、電纜信息、建設(shè)規(guī)模、土建、線路工程)章節(jié)。
[0053] 步驟142:章節(jié)關(guān)鍵詞抽取:對章節(jié)抽取最能體現(xiàn)章節(jié)信息的關(guān)鍵詞。
[0054] 步驟143:上下文結(jié)構(gòu)對應(yīng):提供任意章節(jié)的父章節(jié)、子章節(jié)列表和兄弟章節(jié)列 表。
[0055] 步驟200 :指標(biāo)對應(yīng)屬性識別:準(zhǔn)確匹配每個(gè)待識別所對應(yīng)屬性的指標(biāo)的多個(gè)屬 性值。如圖4所示,指標(biāo)對應(yīng)屬性識別包括如下步驟:
[0056] 步驟210 :屬性歸并:分析指標(biāo)體系結(jié)構(gòu),將同類指標(biāo)的同類屬性進(jìn)行合并。
[0057] 步驟220 :屬性抽?。簩傩园凑諝w并后的指標(biāo)體系進(jìn)行抽取。
[0058] 步驟230 :指標(biāo)屬性對應(yīng):確定技術(shù)指標(biāo)和屬性的對應(yīng)關(guān)系。
[0059] 步驟300 :指標(biāo)可選方案匹配:準(zhǔn)確匹配每個(gè)指標(biāo)的所對應(yīng)的備選方案,并確定何 種候選方案為推薦方案。如圖5所示,指標(biāo)可選方案匹配包括如下步驟:
[0060] 步驟310 :方案作用域確定:通過查找方案描述關(guān)鍵詞,確定方案作用域。
[0061] 步驟320 :指標(biāo)方案匹配:確定指標(biāo)和方案的匹配關(guān)系。
[0062] 步驟330 :推薦方案確定:識別電
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1