亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于領(lǐng)域本體的高準(zhǔn)確率主觀題計算機自動閱卷方法

文檔序號:6638563閱讀:382來源:國知局
一種基于領(lǐng)域本體的高準(zhǔn)確率主觀題計算機自動閱卷方法
【專利摘要】一種基于領(lǐng)域本體的高準(zhǔn)確率主觀題計算機自動閱卷方法,首先構(gòu)建一個適用于主觀題自動閱卷的領(lǐng)域本體的結(jié)構(gòu),并將領(lǐng)域關(guān)系解釋成一個描述領(lǐng)域事件的自然語言的語句;其次構(gòu)建一個基于領(lǐng)域本體與試題描述邏輯的主觀題題庫結(jié)構(gòu),并要求試題符合主觀題題庫結(jié)構(gòu);然后對考生答卷按下述步驟進行閱卷:(1)獲取考生答卷中的單字詞與詞性標(biāo)注;(2)標(biāo)注本體元素;(3)生成基于領(lǐng)域關(guān)系的答卷語義;(4)基于領(lǐng)域關(guān)系的答案與答卷語義相似度計算;(5)計算出該主觀題的考生答卷得分。該方法極大地簡化了考生答卷中自然語言的語義分析與處理流程,更完整地表示出答案領(lǐng)域知識的語義,確保了主觀題自動閱卷的準(zhǔn)確性。
【專利說明】-種基于領(lǐng)域本體的高準(zhǔn)確率主觀題計算機自動閱卷方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及教育【技術(shù)領(lǐng)域】中的考試閱卷自動化,具體是基于領(lǐng)域本體的主觀題自 動閱卷方案,更具體是一種基于領(lǐng)域本體與領(lǐng)域關(guān)系語義相似度的高準(zhǔn)確率主觀題計算機 自動閱卷方案,該方案將計算機作為工具,W鍵盤輸入的考生答卷作為處理對象,幫助教師 實現(xiàn)主觀題高準(zhǔn)確率的自動閱卷,可廣泛應(yīng)用于各個學(xué)科的主觀題計算機自動閱卷系統(tǒng) 中。

【背景技術(shù)】
[0002] 近年來的各類考試中大都采用考生填寫答題卡該一方式,仔細(xì)推敲,我們會發(fā)現(xiàn), 對于試題答案W選項編號表示的單選題、多選題、判斷題等的客觀題,可W由計算機完全代 替人工閱卷,但是對于答案需要使用自然語言表示的主觀題的閱卷仍需由人工耗時耗力地 完成。
[0003] 由于單選題、多選題、判斷題等客觀題目的答案都是W選項編號表示,目前計算機 對于此類題型進行自動閱卷時,只需將標(biāo)準(zhǔn)答案的選項編號與考生答案的選項編號進行簡 單的匹配運算,匹配成功則答案正確,該處理技術(shù)已經(jīng)取得一定的成果,但對于答案采用自 然語言表示的主觀題自動閱卷技術(shù),如:對簡答題、名詞解釋和論述題等自動評分,由于其 受到自然語言理解、模式識別等理論與技術(shù)瓶頸影響,效果不甚理想。
[0004] 主觀題不同于客觀題,不僅需要采用自然語言表示答案,而且具有一定的主觀性, 允許考生在一定的范圍內(nèi)答題,因此答案往往不是唯一的。另一方面,教師在批閱試卷的時 候,還可能會受到主觀因素的影響,W及考生字體是否美觀、卷面是否整潔等的影響,使得 教師在評分時,出現(xiàn)不合理的加分或扣分現(xiàn)象,有失考試的公正性和公平性。而主觀題的計 算機自動閱卷,既減輕了教師人工閱卷的勞動強度,又減少人為因素的影響,保證了閱卷的 客觀性、公正性,因此主觀題計算機自動閱卷技術(shù)的研究,具有重大的意義。然而,由于主 觀題考生答卷的多樣性與隨意性,目前還沒有使用計算機對主觀題進行自動閱卷的成熟技 術(shù)。
[0005] 目前,在各類計算機考試系統(tǒng)中,普遍采用關(guān)鍵字匹配技術(shù)進行主觀題自動閱卷, 即在答案中標(biāo)注出若干關(guān)鍵字或關(guān)鍵詞,將其與考生答卷進行匹配,并根據(jù)匹配成功的多 少對考生答卷進行評分,由于自然語言的多樣性與隨意性,該種方法的評分準(zhǔn)確率非常低。 為提高評卷的準(zhǔn)確率,目前出現(xiàn)了少量的基于領(lǐng)域本體的主觀題自動閱卷方法,但大多仍 簡單地將本體元素標(biāo)注成關(guān)鍵字,由于沒有形成答案的完整語義,該種方法的效果也不理 想。


【發(fā)明內(nèi)容】

[0006] 針對語義分析是自然語言處理的瓶頸,W及主觀題自動閱卷方法中的答案語義不 精確、表達(dá)能力弱與評分準(zhǔn)確度低等弱點,本發(fā)明提出了一種基于領(lǐng)域本體的高準(zhǔn)確率主 觀題自動閱卷方案。本發(fā)明通過本體實現(xiàn)領(lǐng)域知識的形式化,通過所設(shè)計的試題描述邏輯 完成對主觀題的本體元素的標(biāo)注與答案語義的完整表示,更為重要的是,本發(fā)明通過抽取 出試題答案中的本體元素形成領(lǐng)域關(guān)系來表示主觀題答案的語義,從而更加準(zhǔn)確地表示出 答案所包含的領(lǐng)域知識,同時采用基于領(lǐng)域關(guān)系語義相似度的方法評定考生的答卷,確保 了主觀題自動閱卷的準(zhǔn)確性。
[0007] 本發(fā)明的
【發(fā)明內(nèi)容】
包括;一個適用于主觀題自動閱卷的領(lǐng)域本體的結(jié)構(gòu);一個可 提高主觀題答案語義表示的試題描述邏輯系統(tǒng);一個基于領(lǐng)域本體與試題描述邏輯的主觀 題題庫結(jié)構(gòu);一套考生答卷預(yù)處理與答卷自動評閱的工作流程,包括考生答卷本體元素的 標(biāo)注步驟、答卷語義生成步驟,W及基于領(lǐng)域關(guān)系的答案答卷語義相似度與答卷評分算法。
[0008] 本發(fā)明的技術(shù)方案如下。
[0009] -種基于領(lǐng)域本體的高準(zhǔn)確率主觀題計算機自動閱卷方法,首先構(gòu)建一個適用于 主觀題自動閱卷的領(lǐng)域本體的結(jié)構(gòu),并將領(lǐng)域關(guān)系解釋成一個描述領(lǐng)域事件的自然語言的 語句;其次構(gòu)建一個基于領(lǐng)域本體與試題描述邏輯系統(tǒng)的主觀題題庫結(jié)構(gòu),并要求試題符 合主觀題題庫結(jié)構(gòu);然后對考生答卷按下述步驟進行閱卷:
[0010] (1)獲取考生答卷中的單字與單詞并標(biāo)注詞性;
[0011] 似標(biāo)注本體元素;
[0012] (3)生成基于領(lǐng)域關(guān)系的答卷語義;
[0013] (4)基于領(lǐng)域關(guān)系的答案與答卷語義相似度計算;
[0014] (5)計算出該主觀題的考生答卷得分;
[0015] 所述主觀題題庫結(jié)構(gòu)定義成一個半結(jié)構(gòu)的形式,即在同一個試題記錄中可W包含 多個同義題目與答案字段,其BNF定義為:
[0016] <主觀題題庫結(jié)構(gòu)〉::=(<題目〉,{<同義題目〉},<題目標(biāo)注〉,{<答案〉,<答 案標(biāo)注〉,<答案語義〉})
[0017] 其中,< 題目〉與 < 答案〉是直接面向考生的自然語言表達(dá)形式;
[001引 < 同義題目〉是與 < 題目〉具有相同語義的不同表現(xiàn)形式,用于實現(xiàn)題目多種形式 的顯現(xiàn);
[0019] <題目標(biāo)注〉是通過試題描述邏輯標(biāo)注出本體元素(包括本體的概念、實例、屬性 與關(guān)系)的主觀題題目,主要用于通過本體元素的同義詞實現(xiàn)題目顯現(xiàn)的多樣性;
[0020] <答案標(biāo)注〉是標(biāo)注有本體元素的試題答案,主要用于實現(xiàn)答案語義的抽??;
[0021] <答案語義〉通過抽取試題答案中的本體元素形成若干個領(lǐng)域關(guān)系來表示,從而 更準(zhǔn)確地表示出答案所包含的領(lǐng)域知識,< 答案語義〉的結(jié)構(gòu)為:
[0022] <答案語義〉::=<[?]關(guān)系1(定義域,值域)〉[&[?]< 關(guān)系2(定義域,值 域)〉&……&<[?]關(guān)系n(定義域,值域)〉]。
[0023] 本發(fā)明將領(lǐng)域本體形式化為一個五元組:
[0024] 0 = (C,A,R,I,SY}
[0025] (1)C表示與某個領(lǐng)域相關(guān)的所有概念的集合,該集合界定了主觀題的主題范圍;
[002引 似PcCxDT ;是概念的數(shù)據(jù)屬性的集合,表示概念的內(nèi)涵,用于界定主觀題題 庫中概念與個體的特征范圍;
[0027] (3)民C C X C表示概念之間的二元領(lǐng)域關(guān)系集合,反映某個領(lǐng)域中的概念之間所 建立的聯(lián)系,用于界定主觀題題庫中概念之間的聯(lián)系范圍,同時本發(fā)明將領(lǐng)域關(guān)系解釋成 一個描述領(lǐng)域事件的自然語言的語句;
[0028] (4)1代表實例集合,表示某個領(lǐng)域所有概念的具體實體,在主觀題中作為領(lǐng)域?qū)?象使用;
[0029] (5) SY代表同義詞集合。
[0030] 本發(fā)明所述的領(lǐng)域關(guān)系中包括關(guān)系名、定義域和值域;所述關(guān)系名代表一個領(lǐng)域 事件,為句子的動詞,所述定義域表示事件實施者,為句子的主語,所述值域表示事件的內(nèi) 容或接受者,為句子的賓語;
[0031] 并且,在領(lǐng)域關(guān)系規(guī)定關(guān)系名帶介詞的關(guān)系表示被動語態(tài);
[0032] 關(guān)系的形態(tài)分為如下H種類型:
[0033] 1)關(guān)系名不帶介詞的關(guān)系;表示主動語態(tài),關(guān)系對應(yīng)的句子結(jié)構(gòu)為;定義域+關(guān)系 名+值域;
[0034] 2)關(guān)系名帶后綴介詞的關(guān)系;表示被動語態(tài),關(guān)系名在對應(yīng)的事件句子中不用分 拆,關(guān)系對應(yīng)的句子結(jié)構(gòu)為;定義域+關(guān)系名+值域;
[003引扣關(guān)系名帶一個由下劃線"_"連接的前綴介詞的關(guān)系康示被動語態(tài),且關(guān)系名 在對應(yīng)的事件句子中需要分拆使用,并由前綴介詞分隔句子的主語與賓主,關(guān)系對應(yīng)的句 子結(jié)構(gòu)為:定義域+前綴介詞+值域+關(guān)系名。
[0036] 本發(fā)明的試題描述邏輯系統(tǒng)孤LS是一個W領(lǐng)域本體元素為描述對象,對主觀題 題目與答案進行本體標(biāo)注與語義解釋的一種特殊的描述邏輯,定義成如下的H元組:
[0037] 孤LS::=(<描述符〉,< 運算符〉,< 標(biāo)注符〉)
[003引其中;描述符:用于聲明主觀題中本體元素的類型;
[0039] 運算符:將描述邏輯的常規(guī)運算符W更簡潔的符號來表示,W方便運算符的使 用;
[0040] 標(biāo)注符:用于分隔與界定主觀題中的本體元素。
[0041] 本發(fā)明的在步驟(1),考生答卷中的單字與單詞獲取與詞性的標(biāo)注是在本體同義 詞庫與常規(guī)語言詞典的共同支持下進行的。從而最大限度地獲取學(xué)生答卷的語義,確保了 主觀題自動閱卷的準(zhǔn)確性。
[0042] 本發(fā)明步驟(2)的步驟、規(guī)則與格式包括:
[0043] 1)概念標(biāo)注;將答卷中的名詞逐個與領(lǐng)域本體中的概念同義詞進行匹配,若有與 其相同的概念,則將該名詞標(biāo)注為概念,標(biāo)注格式為;<概念名;C〉;
[0044] 2)實例標(biāo)注:將答卷中概念標(biāo)注后剩余的名詞與專用名詞短語逐個與領(lǐng)域本體 中的實例同義詞進行匹配,若有與其相同的實例,則將該名詞標(biāo)注為實例,標(biāo)注格式為;< 實例名;1〉;
[0045] 3)屬性標(biāo)注;將答卷中剩余的名詞逐個與領(lǐng)域本體中的屬性同義詞進行匹配,若 有與其相同的屬性,則根據(jù)該屬性的類型將名詞標(biāo)注為相應(yīng)的屬性類別,標(biāo)注格式為;< 屬 性名;P〉;
[0046] 4)關(guān)系標(biāo)注;將答卷中的動詞逐個與領(lǐng)域本體中的關(guān)系同義詞進行匹配,若有與 其相同的關(guān)系,則將該動詞或名詞標(biāo)注為關(guān)系,標(biāo)注格式為:< 關(guān)系名:R> ;然后進一步判定 關(guān)系動詞前是否有否定副詞或否定動詞,如有則將該否定詞標(biāo)注為否定運算符"?";
[0047] 5)概念集合標(biāo)注;將答卷中多個由連詞或標(biāo)點連接的多個概念組合成概念集合, 標(biāo)注格式為;< {概念集合} ;cs>;
[0048] 6)實例集合標(biāo)注;將答卷中多個由連詞或標(biāo)點連接的多個實例組合成實例集合, 標(biāo)注格式為;<{實例集合} ;IS〉。
[0049] 本發(fā)明的步驟(3)包括:
[0050] 1)掃描已標(biāo)注好本體元素的考生答卷,定位答卷中的第一個領(lǐng)域關(guān)系名;
[0051] 2)若領(lǐng)域關(guān)系名左側(cè)只有一個領(lǐng)域概念,則將該概念處理為領(lǐng)域關(guān)系的定義域, 轉(zhuǎn)步驟5);
[0052] 3)若領(lǐng)域關(guān)系名左側(cè)有多個連續(xù)的領(lǐng)域概念或概念集合,且該多個領(lǐng)域概念由領(lǐng) 域關(guān)系的引導(dǎo)介詞分隔,則將引導(dǎo)介詞左側(cè)的第一個概念處理為領(lǐng)域關(guān)系的定義域,將引 導(dǎo)介詞右側(cè)的多個概念作為概念集合并處理為領(lǐng)域關(guān)系的值域,轉(zhuǎn)步驟9);否則將左側(cè)最 靠近領(lǐng)域關(guān)系的概念處理為關(guān)系的定義域;
[0053] 4)若領(lǐng)域關(guān)系名左側(cè)無任何領(lǐng)域概念,則將領(lǐng)域關(guān)系的定義域處理為空,且用0 表不;
[0054] 5)若領(lǐng)域關(guān)系名右側(cè)只有一個領(lǐng)域概念,則將該概念處理為領(lǐng)域關(guān)系的值域,轉(zhuǎn) 步驟9);
[0055] 6)若領(lǐng)域關(guān)系名右側(cè)有多個連續(xù)的領(lǐng)域概念,則將該多個概念作為概念集合并處 理為領(lǐng)域關(guān)系的值域;
[0056] 7)若領(lǐng)域關(guān)系名右側(cè)無任何領(lǐng)域概念,則將領(lǐng)域關(guān)系的值域處理為空,且用0表 示;
[0057] 8)若在答卷的本體標(biāo)注中,關(guān)系名動詞的左側(cè)緊鄰一個標(biāo)注為否定運算符的否定 詞,則在答卷語義中,在該關(guān)系名的前面加一個否定運算符"?";
[0058] 9)定位答卷中的第二個領(lǐng)域關(guān)系名,轉(zhuǎn)步驟2),直到答卷中所有領(lǐng)域關(guān)系處理完 畢;
[0059] 10)若考生答卷語義中只有一個領(lǐng)域關(guān)系,則將該領(lǐng)域概念名及其定義域與值域, W "[?]關(guān)系名(定義域,值域)"的形式表示答卷的語義;
[0060] 11)若考生答卷中有多個領(lǐng)域關(guān)系,則將該多個領(lǐng)域關(guān)系通過運算符連接處 理為答卷的語義;
[0061] 12)若考生答卷中無任何領(lǐng)域關(guān)系,則將答卷中的所有領(lǐng)域概念通過運算符 連接處理為答卷的語義;
[0062] 13)若考生答卷中無任何領(lǐng)域本體,則該考生答卷語義為空。
[006引進一步,步驟(4)包括:
[0064] 1)定位試題的第一個答案的答案語義;
[0065] 2)若答案語義只有一個關(guān)系,則按公式(1)計算出答案關(guān)系與答卷關(guān)系的語義相 似度,并將該相似度作為答案與答卷的語義相似度,轉(zhuǎn)步驟6);
[0066] 3)取答案語義的第一個關(guān)系,按公式(1)依次與考生答卷語義中的所有未標(biāo)注已 比對的關(guān)系一一計算相似度:
[0067] SUnR =站邏一itnRN 乂如:D + SimRN 義 SimRR …
[0068] 其中,SimRN代表關(guān)系名相似度,SimRD代表定義域相似度,SimRR代表值域相似 度,H者的計算方法為:
[0069] ①若二個關(guān)系名相同或為同義詞且二個關(guān)系名前的否定運算符相同,或答案語義 中只有關(guān)系且關(guān)系名為可省略項,則SimRN = 1 ;否則SimRN = 0 ;
[0070] ②若定義域相同或為同義詞或為可省略項,則SimRD = 1 ;否則SimRD = 0 ;
[OCm] ③若值域相同或為同義詞或為可省略項,則SimRR = 1 ;否則SimRR = 0 ;從所有的 關(guān)系相似度中,取一個最大值作為該答案關(guān)系與答卷關(guān)系的語義相似度,記作SimRi,同時 在答卷語義中將比對成功的關(guān)系標(biāo)注為已比對;
[0072] 4)取答案語義的下一個關(guān)系,按步驟2)計算出該答案關(guān)系與答卷關(guān)系的語義相 似度,記作SimRi,直到計算出所有答案關(guān)系與答卷關(guān)系的語義相似度;
[0073] 5)設(shè)答案語義中的關(guān)系總數(shù)為n,按公式(2),計算出答案與答卷的語義相似度:
[0074]

【權(quán)利要求】
1. 一種基于領(lǐng)域本體的高準(zhǔn)確率主觀題計算機自動閱卷方法,其特征在于:首先構(gòu)建 一個適用于主觀題自動閱卷的領(lǐng)域本體的結(jié)構(gòu),并將領(lǐng)域關(guān)系解釋成一個描述領(lǐng)域事件的 自然語言的語句;其次構(gòu)建一個基于領(lǐng)域本體與試題描述邏輯系統(tǒng)的主觀題題庫結(jié)構(gòu),并 要求試題符合主觀題題庫結(jié)構(gòu);然后對考生答卷按下述步驟進行閱卷: (1) 獲取考生答卷中的單字與單詞并標(biāo)注詞性; (2) 標(biāo)注本體元素; (3) 生成基于領(lǐng)域關(guān)系的答卷語義; (4) 基于領(lǐng)域關(guān)系的答案與答卷語義相似度計算; (5) 計算出該主觀題的考生答卷得分; 所述主觀題題庫結(jié)構(gòu)定義成一個半結(jié)構(gòu)的形式,即在同一個試題記錄中可以包含多個 同義題目與答案字段,其BNF定義為: 〈主觀題題庫結(jié)構(gòu) >:: = (〈題目〉,{〈同義題目>},〈題目標(biāo)注〉,{:〈答案〉,〈答案標(biāo) 注〉,〈答案語義>}) 其中,〈題目〉與〈答案〉是直接面向考生的自然語言表達(dá)形式; 〈同義題目〉是與〈題目〉具有相同語義的不同表現(xiàn)形式,用于實現(xiàn)題目多種形式的顯 現(xiàn); 〈題目標(biāo)注〉是通過試題描述邏輯標(biāo)注出本體元素(包括本體的概念、實例、屬性與關(guān) 系)的主觀題題目,主要用于通過本體元素的同義詞實現(xiàn)題目顯現(xiàn)的多樣性; 〈答案標(biāo)注〉是標(biāo)注有本體元素的試題答案,主要用于實現(xiàn)答案語義的抽?。? 〈答案語義〉通過抽取試題答案中的本體元素形成若干個領(lǐng)域關(guān)系來表示,〈答案語義 >的結(jié)構(gòu)為: 〈答案語義 >::=〈[?]關(guān)系1(定義域,值域)>[&[?]〈關(guān)系2(定義域,值 域)>&……&〈[?]關(guān)系n(定義域,值域)>]。
2. 根據(jù)權(quán)利要求1所述的自動閱卷方法,其特征在于:將領(lǐng)域本體形式化為一個五元 組: O= {C,A,R,I,SY} 1. C表示與某個領(lǐng)域相關(guān)的所有概念的集合,該集合界定了主觀題的主題范圍; 2. Pg:CXDT:是概念的數(shù)據(jù)屬性的集合,表示概念的內(nèi)涵,用于界定主觀題題庫中概 念與個體的特征范圍; 3. RgCXC表示概念之間的二元領(lǐng)域關(guān)系集合,反映某個領(lǐng)域中的概念之間所建立 的聯(lián)系,用于界定主觀題題庫中概念之間的聯(lián)系范圍; 4) 1代表實例集合,表示某個領(lǐng)域所有概念的具體實體,在主觀題中作為領(lǐng)域?qū)ο笫?用; 5. SY代表同義詞集合。
3. 根據(jù)權(quán)利要求1所述的自動閱卷方法,其特征在于:領(lǐng)域關(guān)系中包括關(guān)系名、定義域 和值域;所述關(guān)系名代表一個領(lǐng)域事件,為句子的動詞,所述定義域表示事件實施者,為句 子的主語,所述值域表示事件的內(nèi)容或接受者,為句子的賓語; 并且,在領(lǐng)域關(guān)系規(guī)定關(guān)系名帶介詞的關(guān)系表示被動語態(tài); 關(guān)系的形態(tài)分為如下三種類型: 1) 關(guān)系名不帶介詞的關(guān)系:表示主動語態(tài),關(guān)系對應(yīng)的句子結(jié)構(gòu)為:定義域+關(guān)系名+ 值域; 2) 關(guān)系名帶后綴介詞的關(guān)系:表示被動語態(tài),關(guān)系名在對應(yīng)的事件句子中不用分拆, 關(guān)系對應(yīng)的句子結(jié)構(gòu)為:定義域+關(guān)系名+值域; 3) 關(guān)系名帶一個由下劃線"_"連接的前綴介詞的關(guān)系:表示被動語態(tài),且關(guān)系名在對 應(yīng)的事件句子中需要分拆使用,并由前綴介詞分隔句子的主語與賓主,關(guān)系對應(yīng)的句子結(jié) 構(gòu)為:定義域+前綴介詞+值域+關(guān)系名。
4. 根據(jù)權(quán)利要求1所述的自動閱卷方法,其特征在于:試題描述邏輯系統(tǒng)QDLS是一個 以領(lǐng)域本體元素為描述對象,對主觀題題目與答案進行本體標(biāo)注與語義解釋的一種特殊的 描述邏輯,定義成如下的三元組: QDLS::=(〈描述符〉,〈運算符〉,〈標(biāo)注符>) 其中:描述符:用于聲明主觀題中本體元素的類型; 運算符:將描述邏輯的常規(guī)運算符以更簡潔的符號來表示,以方便運算符的使用; 標(biāo)注符:用于分隔與界定主觀題中的本體元素。
5. 根據(jù)權(quán)利要求1所述的自動閱卷方法,其特征在于:在步驟(1),考生答卷中的單字 與單詞獲取與詞性的標(biāo)注是在本體同義詞庫與常規(guī)語言詞典的共同支持下進行的。
6. 根據(jù)權(quán)利要求1所述的自動閱卷方法,其特征在于:步驟⑵的步驟、規(guī)則與格式包 括: 1) 概念標(biāo)注:將答卷中的名詞逐個與領(lǐng)域本體中的概念同義詞進行匹配,若有與其相 同的概念,則將該名詞標(biāo)注為概念,標(biāo)注格式為:〈概念名:C> ; 2) 實例標(biāo)注:將答卷中概念標(biāo)注后剩余的名詞與專用名詞短語逐個與領(lǐng)域本體中的 實例同義詞進行匹配,若有與其相同的實例,則將該名詞標(biāo)注為實例,標(biāo)注格式為:〈實例 名:1> ; 3) 屬性標(biāo)注:將答卷中剩余的名詞逐個與領(lǐng)域本體中的屬性同義詞進行匹配,若有 與其相同的屬性,則根據(jù)該屬性的類型將名詞標(biāo)注為相應(yīng)的屬性類別,標(biāo)注格式為:〈屬性 名:P> ; 4) 關(guān)系標(biāo)注:將答卷中的動詞逐個與領(lǐng)域本體中的關(guān)系同義詞進行匹配,若有與其相 同的關(guān)系,則將該動詞或名詞標(biāo)注為關(guān)系,標(biāo)注格式為:〈關(guān)系名:R〉;然后進一步判定關(guān)系 動詞前是否有否定副詞或否定動詞,如有則將該否定詞標(biāo)注為否定運算符"?"; 5) 概念集合標(biāo)注:將答卷中多個由連詞或標(biāo)點連接的多個概念組合成概念集合,標(biāo)注 格式為:〈{概念集合} :CS> ; 6) 實例集合標(biāo)注:將答卷中多個由連詞或標(biāo)點連接的多個實例組合成實例集合,標(biāo)注 格式為:〈{實例集合} :IS>。
7. 根據(jù)權(quán)利要求1所述的自動閱卷方法,其特征在于:步驟⑶包括: 1) 掃描已標(biāo)注好本體元素的考生答卷,定位答卷中的第一個領(lǐng)域關(guān)系名; 2) 若領(lǐng)域關(guān)系名左側(cè)只有一個領(lǐng)域概念,則將該概念處理為領(lǐng)域關(guān)系的定義域,轉(zhuǎn)步 驟5); 3) 若領(lǐng)域關(guān)系名左側(cè)有多個連續(xù)的領(lǐng)域概念或概念集合,且這多個領(lǐng)域概念由領(lǐng)域關(guān) 系的引導(dǎo)介詞分隔,則將引導(dǎo)介詞左側(cè)的第一個概念處理為領(lǐng)域關(guān)系的定義域,將引導(dǎo)介 詞右側(cè)的多個概念作為概念集合并處理為領(lǐng)域關(guān)系的值域,轉(zhuǎn)步驟9);否則將左側(cè)最靠近 領(lǐng)域關(guān)系的概念處理為關(guān)系的定義域; 4) 若領(lǐng)域關(guān)系名左側(cè)無任何領(lǐng)域概念,則將領(lǐng)域關(guān)系的定義域處理為空,且用O表示; 5) 若領(lǐng)域關(guān)系名右側(cè)只有一個領(lǐng)域概念,則將該概念處理為領(lǐng)域關(guān)系的值域,轉(zhuǎn)步驟 9); 6) 若領(lǐng)域關(guān)系名右側(cè)有多個連續(xù)的領(lǐng)域概念,則將這多個概念作為概念集合并處理為 領(lǐng)域關(guān)系的值域; 7) 若領(lǐng)域關(guān)系名右側(cè)無任何領(lǐng)域概念,則將領(lǐng)域關(guān)系的值域處理為空,且用O表示; 8) 若在答卷的本體標(biāo)注中,關(guān)系名動詞的左側(cè)緊鄰一個標(biāo)注為否定運算符的否定詞, 則在答卷語義中,在該關(guān)系名的前面加一個否定運算符"?"; 9) 定位答卷中的第二個領(lǐng)域關(guān)系名,轉(zhuǎn)步驟2),直到答卷中所有領(lǐng)域關(guān)系處理完畢; 10) 若考生答卷語義中只有一個領(lǐng)域關(guān)系,則將該領(lǐng)域概念名及其定義域與值域,以 "[?]關(guān)系名(定義域,值域)"的形式表示答卷的語義; 11) 若考生答卷中有多個領(lǐng)域關(guān)系,則將這多個領(lǐng)域關(guān)系通過運算符"&"連接處理為 答卷的語義; 12) 若考生答卷中無任何領(lǐng)域關(guān)系,則將答卷中的所有領(lǐng)域概念通過運算符"&"連接 處理為答卷的語義; 13) 若考生答卷中無任何領(lǐng)域本體,則該考生答卷語義為空。
8.根據(jù)權(quán)利要求1所述的自動閱卷方法,其特征在于:步驟⑷包括: 1) 定位試題的第一個答案的答案語義; 2) 若答案語義只有一個關(guān)系,則按公式(1)計算出答案關(guān)系與答卷關(guān)系的語義相似 度,并將該相似度作為答案與答卷的語義相似度,轉(zhuǎn)步驟6); 3) 取答案語義的第一個關(guān)系,按公式(1)依次與考生答卷語義中的所有未標(biāo)注已比對 的關(guān)系一一計算相似度:
其中,SimRN代表關(guān)系名相似度,SimRD代表定義域相似度,SimRR代表值域相似度,三 者的計算方法為: ① 若二個關(guān)系名相同或為同義詞且二個關(guān)系名前的否定運算符相同,或答案語義中只 有一個關(guān)系且關(guān)系名為可省略項,則SimRN= 1 ;否則SimRN= 0 ; ② 若定義域相同或為同義詞或為可省略項,則SimRD= 1 ;否則SimRD= 0 ; ③ 若值域相同或為同義詞或為可省略項,則SimRR= 1 ;否則SimRR= 0 ;從所有的關(guān)系 相似度中,取一個最大值作為該答案關(guān)系與答卷關(guān)系的語義相似度,記作SimR1,同時在答 卷語義中將比對成功的關(guān)系標(biāo)注為已比對; 4) 取答案語義的下一個關(guān)系,按步驟2)計算出該答案關(guān)系與答卷關(guān)系的語義相似度, 記作SimRi,直到計算出所有答案關(guān)系與答卷關(guān)系的語義相似度; 5) 設(shè)答案語義中的關(guān)系總數(shù)為n,按公式(2),計算出答案與答卷的語義相似度:
6) 定位試題的下一個答案的答案語義,按步驟2)、3)、4)與5),計算出該答案與答卷的 語義相似度,記作Simi(answer,paper),直到計算出所有答案與答卷的語義相似度; 7) 設(shè)該主觀題的答案總數(shù)為m,按公式(3),計算出該試題的答案與答卷的語義相似 度:
其中,MX表示取最大值。
9.根據(jù)權(quán)利要求1所述的自動閱卷方法,其特征在于:在步驟(5),按公式(4)計算出 該主觀題的考生答卷得分: Score=WeightXSim(answer,paper) (4) 其中,設(shè)該主觀題的分值權(quán)重為Weight。
【文檔編號】G06F17/30GK104504023SQ201410768685
【公開日】2015年4月8日 申請日期:2014年12月12日 優(yōu)先權(quán)日:2014年12月12日
【發(fā)明者】朱新華, 李飛, 陳宏朝, 袁鼎榮, 鄧涵 申請人:廣西師范大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1