本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種反饋答案的方法和裝置。
背景技術(shù):
隨著計(jì)算機(jī)以及信息檢索技術(shù)的發(fā)展,人們?cè)絹?lái)越傾向于借助計(jì)算機(jī)來(lái)尋求某個(gè)問(wèn)題的答案,相應(yīng)的,問(wèn)答系統(tǒng)的使用越來(lái)越廣泛。
現(xiàn)有的社區(qū)問(wèn)答系統(tǒng)的實(shí)現(xiàn)一般是:用戶(hù)通過(guò)終端輸入一個(gè)問(wèn)題,服務(wù)器從答案查詢(xún)庫(kù)中獲取預(yù)存的所有答案,確定用戶(hù)輸入的問(wèn)題與其中的某個(gè)答案公有的詞匯,計(jì)算公有的每個(gè)詞匯在該答案中出現(xiàn)的次數(shù)之和,將其作為此答案與用戶(hù)輸入的問(wèn)題的文本接近度,按照此方法,計(jì)算答案查詢(xún)庫(kù)中每個(gè)答案與用戶(hù)輸入的問(wèn)題的文本接近度,將與問(wèn)題文本接近度最大的答案推送給用戶(hù)。
在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問(wèn)題:
基于上述的社區(qū)問(wèn)答系統(tǒng)的實(shí)現(xiàn)方法,服務(wù)器在向用戶(hù)推送答案時(shí),主要是基于問(wèn)題和答案之間的詞匯匹配程度來(lái)計(jì)算問(wèn)題和答案之間的文本接近度,但是用戶(hù)所需要的答案可能與用戶(hù)輸入的問(wèn)題不存在共同的詞匯(即存在詞匯鴻溝),或者共同的詞匯出現(xiàn)的次數(shù)較少,這樣,推送給用戶(hù)的答案與用戶(hù)需求匹配的可能性較低,從而,導(dǎo)致服務(wù)器進(jìn)行答案反饋的準(zhǔn)確率較低。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明實(shí)施例提供了一種反饋答案的方法和裝置。所述技術(shù)方案如下:
第一方面,提供了一種反饋答案的方法,所述方法包括:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值;
當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度;
根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。
第二方面,提供了一種反饋答案的裝置,所述裝置包括:
訓(xùn)練模塊,用于根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值;
確定模塊,用于當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度;
反饋模塊,用于根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。
本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
本發(fā)明實(shí)施例中,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值,當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。這樣,基于語(yǔ)義接近度進(jìn)行答案選取,避免了問(wèn)題和答案存在的詞匯鴻溝問(wèn)題,從而,可以提高針對(duì)問(wèn)題反饋的答案的準(zhǔn)確度。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明 的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的一種反饋答案的方法流程圖;
圖2是本發(fā)明實(shí)施例提供的一種訓(xùn)練過(guò)程的示意圖;
圖3是本發(fā)明實(shí)施例提供的一種反饋答案的裝置結(jié)構(gòu)示意圖;
圖4是本發(fā)明實(shí)施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
實(shí)施例一
本發(fā)明實(shí)施例提供了一種反饋答案的方法,如圖1所示,該方法的處理流程可以包括如下的步驟:
步驟101,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到語(yǔ)義提取參數(shù)的訓(xùn)練值。
步驟102,當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、語(yǔ)義提取公式、以及語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定各答案與目標(biāo)問(wèn)題的語(yǔ)義接近度。
步驟103,根據(jù)各答案與目標(biāo)問(wèn)題的語(yǔ)義接近度,在各答案中選取目標(biāo)答案,對(duì)解答請(qǐng)求進(jìn)行反饋。
本發(fā)明實(shí)施例中,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值,當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。這樣,基于語(yǔ)義接近度進(jìn)行答案選取,避免了問(wèn)題 和答案存在的詞匯鴻溝問(wèn)題,從而,可以提高針對(duì)問(wèn)題反饋的答案的準(zhǔn)確度。
實(shí)施例二
本發(fā)明實(shí)施例提供了一種反饋答案的方法,該方法的執(zhí)行主體可以為服務(wù)器,該服務(wù)器可以是社區(qū)問(wèn)答網(wǎng)站或應(yīng)用的服務(wù)器,該服務(wù)器中可以設(shè)置有處理器、存儲(chǔ)器、收發(fā)器,處理器可以用于對(duì)語(yǔ)義提取參數(shù)的訓(xùn)練和針對(duì)問(wèn)題反饋答案的處理,存儲(chǔ)器可以用于存儲(chǔ)下述處理過(guò)程中需要的數(shù)據(jù)以及產(chǎn)生的數(shù)據(jù),收發(fā)器可以用于接收和發(fā)送數(shù)據(jù),。下面將結(jié)合具體實(shí)施方式,對(duì)圖1所示的處理流程進(jìn)行詳細(xì)的說(shuō)明,內(nèi)容可以如下:
步驟101,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到語(yǔ)義提取參數(shù)的訓(xùn)練值。
其中,在大數(shù)據(jù)處理時(shí),可以對(duì)語(yǔ)句(如問(wèn)題、答案等)的語(yǔ)義進(jìn)行量化,語(yǔ)義提取公式可以是用于提取問(wèn)題或者答案的語(yǔ)義的公式。語(yǔ)義提取參數(shù)可以是語(yǔ)義提取公式中的常數(shù)系數(shù),可以通過(guò)訓(xùn)練過(guò)程確定。語(yǔ)義接近度可以是問(wèn)題與答案在語(yǔ)義(即語(yǔ)句的表達(dá)意思)層面的接近程度。
在實(shí)施中,服務(wù)器可以從互聯(lián)網(wǎng)上獲取一些問(wèn)題及其對(duì)應(yīng)的答案,將其存儲(chǔ)在訓(xùn)練樣本庫(kù)中,例如可以在某些社區(qū)問(wèn)答系統(tǒng)中獲取一些問(wèn)題及對(duì)應(yīng)的答案,其中,對(duì)于訓(xùn)練樣本庫(kù)中的每個(gè)問(wèn)題都對(duì)應(yīng)有一定數(shù)量的答案,其中包括對(duì)應(yīng)于每個(gè)問(wèn)題的最佳答案(一般可以是由提出問(wèn)題的用戶(hù)選出的答案)和其他答案。對(duì)于詞庫(kù)中存在的每個(gè)詞都對(duì)應(yīng)有詞向量(可以稱(chēng)為分布向量),其中,詞向量可以是d維的向量(d可以是50),其中的某一維的數(shù)值可以用來(lái)表示該詞對(duì)應(yīng)某一語(yǔ)義項(xiàng)的取值,例如,寶馬一詞的詞向量可以是[0.5;0.8;……],其中,詞向量的第一維對(duì)應(yīng)的語(yǔ)義項(xiàng)可以是“該詞用于表示動(dòng)物的可能性”,0.5表示該可能性的數(shù)值,第二維對(duì)應(yīng)的語(yǔ)義項(xiàng)可以是“該詞用于表示車(chē)輛的可能性”,0.8表示該可能性的數(shù)值。服務(wù)器可以獲取問(wèn)題和答案中的每個(gè)詞的詞向量。針對(duì)訓(xùn)練樣本庫(kù)中的每個(gè)問(wèn)題及其對(duì)應(yīng)的答案,服務(wù)器可以得到其對(duì)應(yīng)的包含詞向量的矩陣(可稱(chēng)為詞矩陣),詞矩陣的每一列對(duì)應(yīng)詞庫(kù)中的每個(gè)詞的詞向量。例如,目前詞庫(kù)中有V個(gè)詞,詞矩陣的維數(shù)可以是d×V,服務(wù)器獲取到 訓(xùn)練樣本庫(kù)中某個(gè)問(wèn)題或答案后,可以得到獲取的問(wèn)題或答案中出現(xiàn)的詞的詞向量,并將其放在詞矩陣中的對(duì)應(yīng)的位置,詞矩陣的其它位置可以設(shè)置為零(即問(wèn)題或答案中沒(méi)有出現(xiàn)的詞對(duì)應(yīng)在詞矩陣中的列為零),這樣,每個(gè)不同的問(wèn)題或答案都有其對(duì)應(yīng)的詞矩陣。
服務(wù)器可以將訓(xùn)練樣本庫(kù)中的每個(gè)問(wèn)題或答案對(duì)應(yīng)的詞矩陣向量化,得到表征問(wèn)題或答案的向量,可以用Ex表示,下標(biāo)x可以是問(wèn)題(可以用q表示問(wèn)題)或者答案(可以用a表示答案),即Eq表示問(wèn)題對(duì)應(yīng)的詞矩陣向量化后的向量,Ea表示答案對(duì)應(yīng)的詞矩陣向量化后的向量。服務(wù)器得到訓(xùn)練樣本庫(kù)中的每個(gè)問(wèn)題和答案的Eq、Ea后,對(duì)其進(jìn)行一定比例的損毀,即可以將其中的一些值強(qiáng)制設(shè)置為零(可以隨機(jī)的在其中選取一些值),得到E~x,進(jìn)而可以利用下面的語(yǔ)義提取公式提取問(wèn)題或答案所表征的語(yǔ)義:
其中,z可稱(chēng)為語(yǔ)義向量,可以表征問(wèn)題或答案的語(yǔ)義,W可以稱(chēng)為加權(quán)矩陣,用于對(duì)的語(yǔ)義提取和降維,b可以稱(chēng)為偏置向量,與W共同用于提取問(wèn)題或答案所表征的語(yǔ)義,W、b可稱(chēng)為語(yǔ)義提取參數(shù),f()是非線(xiàn)性函數(shù),用于提取問(wèn)題或答案所表征的語(yǔ)義,可以選取為S函數(shù)、雙曲線(xiàn)函數(shù)或者整流函數(shù)等等,本文中f()以整流函數(shù)為例,即f()、W和b共同作用來(lái)提取問(wèn)題或答案所表征的語(yǔ)義。
針對(duì)訓(xùn)練樣本庫(kù)中的每個(gè)問(wèn)題及其對(duì)應(yīng)的答案,服務(wù)器得到向量z后,可以計(jì)算問(wèn)題和答案之間的語(yǔ)義接近度,可以用向量之間的余弦?jiàn)A角來(lái)表示問(wèn)題和答案之間的語(yǔ)義接近度,根據(jù)問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的條件,訓(xùn)練公式(1)中的加權(quán)矩陣和偏置矩陣,得到最終的訓(xùn)練值。
可選的,可以通過(guò)增大問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度減去問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的差值總和的方式,得到上述公式(1)中的語(yǔ)義提取參數(shù),相應(yīng)的,步驟101的處理過(guò)程可以如下:根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于增大問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度減去問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的差值總和的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值。
在實(shí)施中,獲取樣本訓(xùn)練庫(kù)中的一個(gè)問(wèn)題及其對(duì)應(yīng)的最佳答案和其他答案,其中,問(wèn)題對(duì)應(yīng)的最佳答案可以記為a+,問(wèn)題對(duì)應(yīng)的其他答案可以記為aj—,j表示問(wèn)題對(duì)應(yīng)的第j個(gè)其他答案,可以是1到該問(wèn)題對(duì)應(yīng)的其他答案的總數(shù)中的任一整數(shù),例如,問(wèn)題對(duì)應(yīng)的最佳答案之外的其他答案有N個(gè),j=1,2,…N。將獲取的樣本訓(xùn)練庫(kù)中的一個(gè)問(wèn)題及其對(duì)應(yīng)的最佳答案和其他答案作為訓(xùn)練數(shù)據(jù),建立目標(biāo)函數(shù),并對(duì)建立的目標(biāo)函數(shù)進(jìn)行訓(xùn)練,得到語(yǔ)義提取參數(shù)的訓(xùn)練值。
以樣本訓(xùn)練庫(kù)中的一個(gè)問(wèn)題及其對(duì)應(yīng)的最佳答案和其他答案為訓(xùn)練數(shù)據(jù)的訓(xùn)練過(guò)程如下:?jiǎn)栴}和答案按照公式(1)進(jìn)行語(yǔ)義提取得到問(wèn)題對(duì)應(yīng)的語(yǔ)義向量,可分別可以記為zq和za,得到問(wèn)題和其對(duì)應(yīng)的所有答案的語(yǔ)義向量后,可以按照公式(2)計(jì)算答案和問(wèn)題之間的語(yǔ)義接近度,
其中,sim(q,a)表示問(wèn)題及其對(duì)應(yīng)的所有答案的預(yù)計(jì)接近度,本文采用的公式(2)是采用問(wèn)題和答案對(duì)應(yīng)的語(yǔ)義向量之間的余弦?jiàn)A角來(lái)表示問(wèn)題及其對(duì)應(yīng)的所有答案的語(yǔ)義接近度。服務(wù)器可以按照公式(3)建立損失函數(shù),
其中,L(q,a)表示問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度減去問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的差值總和,sim(q,a+)表示問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度,表示問(wèn)題與對(duì)應(yīng)的每個(gè)其它答案的語(yǔ)義接近度,公式(3)即是進(jìn)行訓(xùn)練的第一目標(biāo)函數(shù)。對(duì)公式(3)中包含的語(yǔ)義提取參數(shù)設(shè)置初始值,利用梯度下降法,訓(xùn)練第一目標(biāo)函數(shù),得到公式(3)中包含的語(yǔ)義提取參數(shù)W、b的訓(xùn)練值,此時(shí),將樣本訓(xùn)練庫(kù)中的一個(gè)問(wèn)題及其對(duì)應(yīng)的答案作為訓(xùn)練數(shù)據(jù),對(duì)基于該訓(xùn)練數(shù)據(jù)建立的目標(biāo)函數(shù)的訓(xùn)練過(guò)程結(jié)束,結(jié)束后得到了語(yǔ)義提取參數(shù)W、b的訓(xùn)練值。
服務(wù)器獲取樣本訓(xùn)練庫(kù)中的下一個(gè)問(wèn)題及其對(duì)應(yīng)的最佳答案和其它答案,將其作為訓(xùn)練數(shù)據(jù),并按照上述的訓(xùn)練過(guò)程建立第一目標(biāo)函數(shù),并利用BP算法(Back Propagation,反向傳播)將上述得到的語(yǔ)義提取參數(shù)W、b的訓(xùn)練值,作為訓(xùn)練該第一目標(biāo)函數(shù)的初始值,訓(xùn)練第一目標(biāo)函數(shù),得到此次的語(yǔ)義提取參數(shù)W、b的訓(xùn)練值,將其作為下一次訓(xùn)練的初始值,依次遞推,直到樣本訓(xùn) 練庫(kù)中的所有問(wèn)題及其對(duì)應(yīng)的最佳答案和其它答案訓(xùn)練完畢,整個(gè)的訓(xùn)練過(guò)程結(jié)束,并得到最終的語(yǔ)義提取參數(shù)W、b的訓(xùn)練值,并將其存儲(chǔ)。
另外的,為降低去目標(biāo)函數(shù)的梯度時(shí)的復(fù)雜度,在上述的訓(xùn)練過(guò)程中,目標(biāo)函數(shù)也可以采用公式(4)所示的公式,
其中,公式(4)表示的物理含義與公式(3)近似相同,訓(xùn)練的依據(jù)都是使問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其他答案的語(yǔ)義接近度,
可選的,還可以通過(guò)另一個(gè)訓(xùn)練過(guò)程確定上述訓(xùn)練過(guò)程的初值,相應(yīng)的,訓(xùn)練過(guò)程可以如下:步驟一,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各問(wèn)題和各答案,基于減小對(duì)語(yǔ)句順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的中間訓(xùn)練值;其中,所述語(yǔ)句為問(wèn)題或答案;步驟二,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,將所述語(yǔ)義提取參數(shù)的中間訓(xùn)練值作為初始輸入值,對(duì)所述語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值。
其中,順序執(zhí)行語(yǔ)義提取可以是按照公式(1)所示的公式進(jìn)行語(yǔ)句的語(yǔ)義提取,可以稱(chēng)為是對(duì)語(yǔ)句的編碼過(guò)程,語(yǔ)義提取的逆處理可以是對(duì)公式(1)的逆處理,可以得到與編碼前的Ex具有相同維數(shù)的E’x,此處理可以稱(chēng)作是解碼過(guò)程,可以利用去噪自動(dòng)編碼機(jī)實(shí)現(xiàn)編碼過(guò)程和解碼過(guò)程的整個(gè)過(guò)程,可以將去噪自動(dòng)編碼機(jī)看作是一種特殊的神經(jīng)網(wǎng)絡(luò)。
在實(shí)施中,如圖2所示,步驟一的處理過(guò)程如下:獲取樣本訓(xùn)練庫(kù)中的各問(wèn)題各答案中的某一個(gè)問(wèn)題或答案,得到其對(duì)應(yīng)的Ex,之后對(duì)其進(jìn)行一定比例的損毀,可以將其中的一些值強(qiáng)制設(shè)置為零,得到按照公式(1)對(duì)其進(jìn)行語(yǔ)義提取,得到每個(gè)問(wèn)題和每個(gè)答案的語(yǔ)義向量z,其中z包含語(yǔ)義提取參數(shù)W、b,即對(duì)進(jìn)行編碼后得到相應(yīng)的語(yǔ)義向量z,之后服務(wù)器利用g(z)對(duì)z進(jìn)行逆變換,即對(duì)編碼后得到的語(yǔ)義向量z進(jìn)行逆變換得到g(f()),此過(guò)程為解碼過(guò)程?;跍p小解碼之后得到的E’x與編碼前的Ex的差異度的訓(xùn)練條件,建立如下公式(5)為第二目標(biāo)函數(shù):
L(g(f()),Ex)=||g(f())-Ex||2……(5)
其中,公式(5)表示利用選用的語(yǔ)義提取參數(shù)對(duì)編碼,再對(duì)其解碼,得到的E’x與損毀前的Ex的差異向量的模,公式(5)的值越小,得到的語(yǔ)義提取參數(shù)越能準(zhǔn)確表達(dá)語(yǔ)句的語(yǔ)義,對(duì)公式(5)中包含的語(yǔ)義提取參數(shù)設(shè)置初始值,利用梯度下降法訓(xùn)練第二目標(biāo)函數(shù),得到語(yǔ)義提取參數(shù)的訓(xùn)練值。
服務(wù)器獲取樣本訓(xùn)練庫(kù)中的其它問(wèn)題或答案,將其作為訓(xùn)練數(shù)據(jù),并按照上述的訓(xùn)練過(guò)程建立第二目標(biāo)函數(shù),并利用BP算法將上述得到的語(yǔ)義提取參數(shù)W、b訓(xùn)練值,作為訓(xùn)練該第二目標(biāo)函數(shù)的初始值,訓(xùn)練第二目標(biāo)函數(shù),依次遞推,直到樣本訓(xùn)練庫(kù)中的所有問(wèn)題和答案訓(xùn)練完畢,整個(gè)的訓(xùn)練過(guò)程結(jié)束,并得到最終的語(yǔ)義提取參數(shù)W、b的訓(xùn)練值。
將步驟一得到的語(yǔ)義提取參數(shù)的訓(xùn)練值作為整個(gè)訓(xùn)練過(guò)程的中間訓(xùn)練值,將其作為步驟二的訓(xùn)練過(guò)程的初始值,按照步驟二繼續(xù)訓(xùn)練得到最終的語(yǔ)義提取參數(shù)W、b,并將其存儲(chǔ),其中步驟二的訓(xùn)練過(guò)程可以是上述步驟101中基于增大問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度減去問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的差值和的訓(xùn)練條件進(jìn)行訓(xùn)練的訓(xùn)練過(guò)程,相應(yīng)的處理方式可以參見(jiàn)步驟101中的具體描述,此處不再累述。
可選的,訓(xùn)練語(yǔ)義提取參數(shù)時(shí),可以對(duì)樣本訓(xùn)練庫(kù)中的問(wèn)題和答案分別進(jìn)行訓(xùn)練,得到問(wèn)題和答案各自的語(yǔ)義提取參數(shù),相應(yīng)的,上述步驟一的處理過(guò)程可以如下:根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各問(wèn)題,基于減小對(duì)問(wèn)題順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的問(wèn)題語(yǔ)義提取公式中的問(wèn)題語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述問(wèn)題語(yǔ)義提取參數(shù)的中間訓(xùn)練值;根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各答案,基于減小對(duì)語(yǔ)句順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的答案語(yǔ)義提取公式中的答案語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述答案語(yǔ)義提取參數(shù)的中間訓(xùn)練值;上述步驟二的處理流程可以如下:根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,將所述問(wèn)題語(yǔ)義提取參數(shù)的中間訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的中間訓(xùn)練值作為初始輸入值,對(duì)所述問(wèn)題語(yǔ)義提取公式中的問(wèn)題語(yǔ)義提取參數(shù)和所述答案語(yǔ)義提取公式中的答案語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述問(wèn)題語(yǔ) 義提取參數(shù)的訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的訓(xùn)練值。
在實(shí)施中,在上述步驟一的訓(xùn)練過(guò)程中,樣本訓(xùn)練庫(kù)中的問(wèn)題或答案可以采用不同的W和b,分別按照公式(1)進(jìn)行語(yǔ)義提取,即樣本訓(xùn)練庫(kù)中的問(wèn)題可以采用一對(duì)W和b(可以記為W1、b1)進(jìn)行語(yǔ)義提取,樣本訓(xùn)練庫(kù)中的問(wèn)題對(duì)應(yīng)的答案可以采用另一對(duì)W和b(可以記為W2、b2)進(jìn)行語(yǔ)義提取,并按照步驟一所述的方式分別建立目標(biāo)函數(shù)并訓(xùn)練,得到W1、b1和W2、b2的訓(xùn)練值,作為整個(gè)訓(xùn)練過(guò)程的中間訓(xùn)練值,并將其作為步驟二的初始值,按照步驟二所述的處理流程繼續(xù)訓(xùn)練得到最終的語(yǔ)義提取參數(shù)W1、b1和W2、b2,并將其存儲(chǔ),其中,在步驟二的訓(xùn)練過(guò)程中,計(jì)算問(wèn)題以及對(duì)應(yīng)的最佳答案和其它答案的語(yǔ)義向量,并根據(jù)得到的語(yǔ)義向量按照公式(2)計(jì)算語(yǔ)義相似度時(shí),語(yǔ)義相似度中包含著W1、b1和W2、b2四個(gè)語(yǔ)義提取參數(shù),相應(yīng)的處理方式可以參見(jiàn)步驟一、二中的具體描述,此處不再累述。
步驟102,當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、語(yǔ)義提取公式、以及語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定各答案與目標(biāo)問(wèn)題的語(yǔ)義接近度。
其中,目標(biāo)問(wèn)題可以是用戶(hù)通過(guò)終端輸入的想要獲知答案的問(wèn)題,答案查詢(xún)庫(kù)可以是上述的樣本訓(xùn)練庫(kù),也可以是存儲(chǔ)服務(wù)器從互聯(lián)網(wǎng)上獲取的一些答案的庫(kù),用于服務(wù)器從中選取匹配目標(biāo)問(wèn)題的答案。
在實(shí)施中,用戶(hù)通過(guò)終端輸入目標(biāo)問(wèn)題并向服務(wù)器發(fā)送解答請(qǐng)求后,服務(wù)器會(huì)接收到用戶(hù)發(fā)送的解答請(qǐng)求,進(jìn)而服務(wù)器對(duì)其進(jìn)行解析,獲取其中攜帶的目標(biāo)問(wèn)題,將服務(wù)器存儲(chǔ)的語(yǔ)義提取參數(shù)的訓(xùn)練值代入公式(1)中,可以按照公式(1)計(jì)算目標(biāo)問(wèn)題以及答案查詢(xún)庫(kù)中的各答案的語(yǔ)義向量,得到目標(biāo)問(wèn)題以及答案查詢(xún)庫(kù)中的各答案的語(yǔ)義向量后,可以按照公式(2)計(jì)算答案查詢(xún)庫(kù)中的各答案分別與目標(biāo)問(wèn)題的語(yǔ)義接近度。
可選的,針對(duì)上述問(wèn)題和答案分別進(jìn)行訓(xùn)練的情況;相應(yīng)的,當(dāng)服務(wù)器接收到終端發(fā)送的解答請(qǐng)求時(shí)的處理過(guò)程可以如下:當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述問(wèn)題語(yǔ)義提取公式、所述答案語(yǔ)義提取公式、以及所述問(wèn)題語(yǔ)義提取參數(shù)的訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度。
在實(shí)施中,服務(wù)器獲得問(wèn)題和答案分別的語(yǔ)義提取參數(shù)后,接收到攜帶有 目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),可以根據(jù)問(wèn)題和答案分別對(duì)應(yīng)的語(yǔ)義提取參數(shù),按照公式(1)分別計(jì)算目標(biāo)問(wèn)題以及答案查詢(xún)庫(kù)中的各答案的語(yǔ)義向量,確定了各自的語(yǔ)義向量后,可以按照公式(2)計(jì)算答案查詢(xún)庫(kù)中的各答案與目標(biāo)問(wèn)題的語(yǔ)義相似度。
步驟103,根據(jù)各答案與目標(biāo)問(wèn)題的語(yǔ)義接近度,在各答案中選取目標(biāo)答案,對(duì)解答請(qǐng)求進(jìn)行反饋。
其中,目標(biāo)答案可以是答案查詢(xún)庫(kù)中的各答案匹配于目標(biāo)問(wèn)題的答案,可以是其中的一個(gè)答案,也可以是其中的幾個(gè)答案。
在實(shí)施中,服務(wù)器獲得答案查詢(xún)庫(kù)中的各答案分別與目標(biāo)問(wèn)題的語(yǔ)義接近度后,可以按照從大到小的順序?qū)⒌玫降恼Z(yǔ)義接近度進(jìn)行排序,可以將最大的語(yǔ)義接近度對(duì)應(yīng)的答案選取為目標(biāo)答案,或者將排序后的前幾個(gè)語(yǔ)義接近度對(duì)應(yīng)的答案選取為目標(biāo)答案,選取到目標(biāo)答案后,將目標(biāo)答案通過(guò)終端反饋給用戶(hù)。
可選的,還可以將得到的語(yǔ)義接近度與基于詞匯匹配的一些特征進(jìn)行結(jié)合,相應(yīng)的,步驟103的處理流程可以如下:根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,以及所述各答案與所述目標(biāo)問(wèn)題的文本接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。
其中,文本接近度可以是各答案和目標(biāo)問(wèn)題基于詞匯匹配的接近度。
在實(shí)施中,服務(wù)器獲得答案查詢(xún)庫(kù)中的各答案與目標(biāo)問(wèn)題的語(yǔ)義接近度后,將其存儲(chǔ),并按照公式(6)-(16)所示的公式計(jì)算答案查詢(xún)庫(kù)中的各答案與目標(biāo)問(wèn)題基于詞匯匹配的文本接近度,
其中,c(qi,a)可以是qi在a中出現(xiàn)的次數(shù),df(qi)可以是qi在答案查詢(xún)庫(kù)中的各答案中出現(xiàn)的次數(shù),|a|可以是答案a中包含的詞的數(shù)目,|C|可以是答案查詢(xún)庫(kù)中的各答案包含的詞的數(shù)目,C可以是答案查詢(xún)庫(kù)中的各答案,k1∈[1.2,2.0],b=0.75,avg|C|可以是答案查詢(xún)庫(kù)中的各答案包含的詞的數(shù)目的平均值,得到各答案與目標(biāo)問(wèn)題文本相似度后,將其與上述確定的各答案與目標(biāo)問(wèn)題的語(yǔ)義相似度共同放入學(xué)習(xí)排序框架中,例如是SVM排序算法,得到答案查詢(xún)庫(kù)中各答案與目標(biāo)問(wèn)題的綜合排序,即綜合利用語(yǔ)義相似度特征和上述11個(gè)公式所示的基于詞匯匹配的文本相似度特征而得到的各答案與目標(biāo)問(wèn)題的相似度,其中此12個(gè)特征的權(quán)重可以根據(jù)經(jīng)驗(yàn)值進(jìn)行人為賦值,也可以利用樣本訓(xùn)練庫(kù)中的樣本根據(jù)SVM排序算法進(jìn)行訓(xùn)練得到各個(gè)特征對(duì)應(yīng)的權(quán)重,將最大的相似度對(duì)應(yīng)的答案通過(guò)終端反饋給用戶(hù),也可以將排序中的前幾個(gè)相似度對(duì)應(yīng)的答案通過(guò)終端反饋給用戶(hù)。
本發(fā)明實(shí)施例中,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值,當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。這樣,基于語(yǔ)義接近度進(jìn)行答案選取,避免了問(wèn)題和答案存在的詞匯鴻溝問(wèn)題,從而,可以提高針對(duì)問(wèn)題反饋的答案的準(zhǔn)確度。
實(shí)施例三
基于相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例還提供了一種反饋答案的裝置,如圖3所示,該裝置包括:
訓(xùn)練模塊310,用于根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答 案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值;
確定模塊320,用于當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度;
反饋模塊330,用于根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。
可選的,所述訓(xùn)練模塊310,用于:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于增大問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度減去問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的差值總和的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值。
可選的,所述訓(xùn)練模塊310,用于:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各問(wèn)題和各答案,基于減小對(duì)語(yǔ)句順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的中間訓(xùn)練值;其中,所述語(yǔ)句為問(wèn)題或答案;
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,將所述語(yǔ)義提取參數(shù)的中間訓(xùn)練值作為初始輸入值,對(duì)所述語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值。
可選的,所述訓(xùn)練模塊310,用于:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各問(wèn)題,基于減小對(duì)問(wèn)題順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的問(wèn)題語(yǔ)義提取公式中的問(wèn)題語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述問(wèn)題語(yǔ)義提取參數(shù)的中間訓(xùn)練值;
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各答案,基于減小對(duì)語(yǔ)句順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的答案語(yǔ)義提取公式中的答案語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述答案語(yǔ)義提取參數(shù)的中間訓(xùn)練值;
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,將所述問(wèn)題語(yǔ)義提取參數(shù)的中間訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的中間訓(xùn)練值作為初始輸入值,對(duì)所述問(wèn)題語(yǔ)義提取公式中的問(wèn)題語(yǔ)義提取參數(shù)和所述答案語(yǔ)義提取公式中的答案語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述問(wèn)題語(yǔ)義提取參數(shù)的訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的訓(xùn)練值;
所述確定模塊320,用于:
當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述問(wèn)題語(yǔ)義提取公式、所述答案語(yǔ)義提取公式、以及所述問(wèn)題語(yǔ)義提取參數(shù)的訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度。
可選的,所述反饋模塊330,用于:
根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,以及所述各答案與所述目標(biāo)問(wèn)題的文本接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。
本發(fā)明實(shí)施例中,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值,當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。這樣,基于語(yǔ)義接近度進(jìn)行答案選取,避免了問(wèn)題和答案存在的詞匯鴻溝問(wèn)題,從而,可以提高針對(duì)問(wèn)題反饋的答案的準(zhǔn)確度。
需要說(shuō)明的是:上述實(shí)施例提供的反饋答案的裝置在反饋答案時(shí),僅以上述各功能模塊的劃分進(jìn)行舉例說(shuō)明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將設(shè)備的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實(shí)施例提供的反饋答案的裝置與反饋答案的方法實(shí)施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過(guò)程詳見(jiàn)方法實(shí)施例,這里不再贅述。
實(shí)施例四
圖4是本發(fā)明實(shí)施例提供的服務(wù)器的結(jié)構(gòu)示意圖。該服務(wù)器1900可因配置或性能不同而產(chǎn)生比較大的差異,可以包括一個(gè)或一個(gè)以上中央處理器(central processing units,CPU)1922(例如,一個(gè)或一個(gè)以上處理器)和存儲(chǔ)器1932,一個(gè)或一個(gè)以上存儲(chǔ)應(yīng)用程序1942或數(shù)據(jù)1944的存儲(chǔ)介質(zhì)1930(例如一個(gè)或一個(gè)以上海量存儲(chǔ)設(shè)備)。其中,存儲(chǔ)器1932和存儲(chǔ)介質(zhì)1930可以是短暫存儲(chǔ)或持久存儲(chǔ)。存儲(chǔ)在存儲(chǔ)介質(zhì)1930的程序可以包括一個(gè)或一個(gè)以上模塊(圖示沒(méi)標(biāo)出),每個(gè)模塊可以包括對(duì)統(tǒng)計(jì)服務(wù)器中的一系列指令操作。更進(jìn)一步地,中央處理器1922可以設(shè)置為與存儲(chǔ)介質(zhì)1930通信,在統(tǒng)計(jì)服務(wù)器1900上執(zhí)行存儲(chǔ)介質(zhì)1930中的一系列指令操作。
服務(wù)器1900還可以包括一個(gè)或一個(gè)以上電源1926,一個(gè)或一個(gè)以上有線(xiàn)或無(wú)線(xiàn)網(wǎng)絡(luò)接口1950,一個(gè)或一個(gè)以上輸入輸出接口1958,一個(gè)或一個(gè)以上鍵盤(pán)1956,和/或,一個(gè)或一個(gè)以上操作系統(tǒng)1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM等等。
服務(wù)器1900可以包括有存儲(chǔ)器,以及一個(gè)或者一個(gè)以上的程序,其中一個(gè)或者一個(gè)以上程序存儲(chǔ)于存儲(chǔ)器中,且經(jīng)配置以由一個(gè)或者一個(gè)以上處理器執(zhí)行所述一個(gè)或者一個(gè)以上程序包含用于進(jìn)行以下操作的指令:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值;
當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度;
根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。
可選的,所述根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練, 得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值,包括:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于增大問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度減去問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的差值總和的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值。
可選的,所述根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值,包括:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各問(wèn)題和各答案,基于減小對(duì)語(yǔ)句順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的中間訓(xùn)練值;其中,所述語(yǔ)句為問(wèn)題或答案;
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,將所述語(yǔ)義提取參數(shù)的中間訓(xùn)練值作為初始輸入值,對(duì)所述語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值。
可選的,所述根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各問(wèn)題和各答案,基于減小對(duì)語(yǔ)句順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的中間訓(xùn)練值,包括:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各問(wèn)題,基于減小對(duì)問(wèn)題順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的問(wèn)題語(yǔ)義提取公式中的問(wèn)題語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述問(wèn)題語(yǔ)義提取參數(shù)的中間訓(xùn)練值;
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的各答案,基于減小對(duì)語(yǔ)句順序執(zhí)行語(yǔ)義提取和語(yǔ)義提取的逆處理后得到的語(yǔ)句與語(yǔ)義提取前的語(yǔ)句的差異度的訓(xùn)練條件,對(duì)預(yù)設(shè)的答案語(yǔ)義提取公式中的答案語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述答案語(yǔ)義提取參數(shù)的中間訓(xùn)練值;
所述根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基 于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,將所述語(yǔ)義提取參數(shù)的中間訓(xùn)練值作為初始輸入值,對(duì)所述語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值,包括:
根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,將所述問(wèn)題語(yǔ)義提取參數(shù)的中間訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的中間訓(xùn)練值作為初始輸入值,對(duì)所述問(wèn)題語(yǔ)義提取公式中的問(wèn)題語(yǔ)義提取參數(shù)和所述答案語(yǔ)義提取公式中的答案語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述問(wèn)題語(yǔ)義提取參數(shù)的訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的訓(xùn)練值;
所述當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,包括:
當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述問(wèn)題語(yǔ)義提取公式、所述答案語(yǔ)義提取公式、以及所述問(wèn)題語(yǔ)義提取參數(shù)的訓(xùn)練值和所述答案語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度。
可選的,所述根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋,包括:
根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,以及所述各答案與所述目標(biāo)問(wèn)題的文本接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。
本發(fā)明實(shí)施例中,根據(jù)訓(xùn)練樣本庫(kù)中存儲(chǔ)的問(wèn)題、最佳答案及其它答案的對(duì)應(yīng)關(guān)系,基于問(wèn)題與對(duì)應(yīng)的最佳答案的語(yǔ)義接近度大于問(wèn)題與對(duì)應(yīng)的其它答案的語(yǔ)義接近度的訓(xùn)練條件,對(duì)預(yù)設(shè)的語(yǔ)義提取公式中的語(yǔ)義提取參數(shù)進(jìn)行訓(xùn)練,得到所述語(yǔ)義提取參數(shù)的訓(xùn)練值,當(dāng)接收到攜帶有目標(biāo)問(wèn)題的解答請(qǐng)求時(shí),根據(jù)所述目標(biāo)問(wèn)題、答案查詢(xún)庫(kù)中的各答案、所述語(yǔ)義提取公式、以及所述語(yǔ)義提取參數(shù)的訓(xùn)練值,分別確定所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,根據(jù)所述各答案與所述目標(biāo)問(wèn)題的語(yǔ)義接近度,在所述各答案中選取目標(biāo)答案,對(duì)所述解答請(qǐng)求進(jìn)行反饋。這樣,基于語(yǔ)義接近度進(jìn)行答案選取,避免了問(wèn)題 和答案存在的詞匯鴻溝問(wèn)題,從而,可以提高針對(duì)問(wèn)題反饋的答案的準(zhǔn)確度。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過(guò)硬件來(lái)完成,也可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。