可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0114]以上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種確定語(yǔ)義匹配度的方法,其特征在于,包括: 獲取第一語(yǔ)句和第二語(yǔ)句,其中,所述第一語(yǔ)句和所述第二語(yǔ)句為待匹配的語(yǔ)句,所述第一語(yǔ)句包括a個(gè)詞向量,所述第二語(yǔ)句包括b個(gè)詞向量; 以所述第一語(yǔ)句中的相鄰的k個(gè)詞向量為單位,將所述第一語(yǔ)句劃分成X個(gè)語(yǔ)句片段,其中,所述X個(gè)語(yǔ)句片段中的第i語(yǔ)句片段包括所述第一語(yǔ)句中的第i個(gè)詞向量至第i+k-1個(gè)詞向量,其中X = a-k+Ι ; 以所述第二語(yǔ)句中的相鄰的t個(gè)詞向量為單位,將所述第二語(yǔ)句劃分成y個(gè)語(yǔ)句片段,其中,所述y個(gè)語(yǔ)句片段中的第j語(yǔ)句片段包括所述第二語(yǔ)句中的第j個(gè)詞向量至第j+t-1個(gè)詞向量,其中I = b-t+Ι ; 將所述第一語(yǔ)句的每一語(yǔ)句片段中的詞向量與所述第二語(yǔ)句的每一語(yǔ)句片段中的詞向量進(jìn)行卷積運(yùn)算,得到三維張量,其中,所述三維張量包括X行y列一維向量,所述X行y列一維向量中的第i行第j列一維向量是所述第一語(yǔ)句的第i語(yǔ)句片段中的詞向量和所述第二語(yǔ)句的第j語(yǔ)句片段中的詞向量經(jīng)過所述卷積運(yùn)算后得到的結(jié)果; 將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成一維的目標(biāo)向量; 根據(jù)所述目標(biāo)向量,確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。2.如權(quán)利要求1所述的方法,其特征在于,所述將所述第一語(yǔ)句的每一語(yǔ)句片段中的詞向量與所述第二語(yǔ)句的每一語(yǔ)句片段中的詞向量進(jìn)行卷積運(yùn)算,得到三維張量,包括: 將所述第一語(yǔ)句的每一語(yǔ)句片段中的k個(gè)詞向量中的元素和所述第二語(yǔ)句的每一語(yǔ)句片段中的t個(gè)詞向量中的元素首尾相連,得到Q個(gè)一維的組合向量,其中Q = xXy ; 分別對(duì)所述Q個(gè)一維的組合向量進(jìn)行所述卷積運(yùn)算,得到所述三維張量,其中,所述三維張量中的第i行第j列一維向量是所述Q個(gè)一維的組合向量中的組合向量T1,經(jīng)過所述卷積運(yùn)算后得到的結(jié)果,其中,所述組合向量T1,由所述第一語(yǔ)句的第i語(yǔ)句片段中的詞向量和所述第二語(yǔ)句的第j語(yǔ)句片段中的詞向量中的元素組合而成。3.如權(quán)利要求1或2所述的方法,其特征在于,所述將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成一維的目標(biāo)向量,包括: 將所述X行y列一維向量中的相鄰向量進(jìn)行交替地綜合和篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成所述目標(biāo)向量。4.如權(quán)利要求1或2所述的方法,其特征在于,所述將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成一維的目標(biāo)向量,包括: 將所述X行y列一維向量中的相鄰向量進(jìn)行交替地綜合和篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成目標(biāo)張量; 將所述目標(biāo)張量包含的一維向量中的元素首尾相連,得到所述目標(biāo)向量。5.如權(quán)利要求3或4所述的方法,其特征在于,所述綜合為卷積運(yùn)算,所述篩選為池化運(yùn)算。6.如權(quán)利要求1-5中任一項(xiàng)所述的方法,其特征在于,所述將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成一維的目標(biāo)向量,包括: 將所述X行y列一維向量中的每相鄰的mXn個(gè)一維向量進(jìn)行所述至少一次綜合和/或至少一次篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成所述目標(biāo)向量,其中,m ^ X, n ^ y07.如權(quán)利要求1-6中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述目標(biāo)向量,確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度,包括: 根據(jù)所述目標(biāo)向量,通過神經(jīng)網(wǎng)絡(luò)模型,確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。8.如權(quán)利要求7所述的方法,其特征在于,所述根據(jù)所述目標(biāo)向量,通過神經(jīng)網(wǎng)絡(luò)模型,確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度,包括: 根據(jù)所述目標(biāo)向量,通過多層感知機(jī)MLP模型,得到所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。9.如權(quán)利要求1-6中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述目標(biāo)向量,確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度,包括: 根據(jù)所述目標(biāo)向量中各元素的權(quán)重,對(duì)所述目標(biāo)向量中的各元素進(jìn)行加權(quán)求和,得到所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。10.一種確定語(yǔ)義匹配度的裝置,其特征在于,包括: 獲取單元,用于獲取第一語(yǔ)句和第二語(yǔ)句,其中,所述第一語(yǔ)句和所述第二語(yǔ)句為待匹配的語(yǔ)句,所述第一語(yǔ)句包括a個(gè)詞向量,所述第二語(yǔ)句包括b個(gè)詞向量; 第一劃分單元,用于以所述第一語(yǔ)句中的相鄰的k個(gè)詞向量為單位,將所述第一語(yǔ)句劃分成X個(gè)語(yǔ)句片段,其中,所述X個(gè)語(yǔ)句片段中的第i語(yǔ)句片段包括所述第一語(yǔ)句中的第i個(gè)詞向量至第i+k-Ι個(gè)詞向量,其中X = a-k+Ι ; 第二劃分單元,用于以所述第二語(yǔ)句中的相鄰的t個(gè)詞向量為單位,將所述第二語(yǔ)句劃分成I個(gè)語(yǔ)句片段,其中,所述y個(gè)語(yǔ)句片段中的第j語(yǔ)句片段包括所述第二語(yǔ)句中的第j個(gè)詞向量至第j+t-Ι個(gè)詞向量,其中y = b-t+Ι ; 運(yùn)算單元,用于將所述第一語(yǔ)句的每一語(yǔ)句片段中的詞向量與所述第二語(yǔ)句的每一語(yǔ)句片段中的詞向量進(jìn)行卷積運(yùn)算,得到三維張量,其中,所述三維張量包括X行y列一維向量,所述X行I列一維向量中的第i行第j列一維向量是所述第一語(yǔ)句的第i語(yǔ)句片段中的詞向量和所述第二語(yǔ)句的第j語(yǔ)句片段中的詞向量經(jīng)過所述卷積運(yùn)算后得到的結(jié)果; 合并單元,用于將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成一維的目標(biāo)向量; 確定單元,用于根據(jù)所述目標(biāo)向量,確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。11.如權(quán)利要求10所述的裝置,其特征在于,所述運(yùn)算單元具體用于將所述第一語(yǔ)句的每一語(yǔ)句片段中的k個(gè)詞向量中的元素和所述第二語(yǔ)句的每一語(yǔ)句片段中的t個(gè)詞向量中的元素首尾相連,得到Q個(gè)一維的組合向量,其中Q = xXy ;分別對(duì)所述Q個(gè)一維的組合向量進(jìn)行所述卷積運(yùn)算,得到所述三維張量,其中,所述三維張量中的第i行第j列一維向量是所述Q個(gè)一維的組合向量中的組合向量T1,經(jīng)過所述卷積運(yùn)算后得到的結(jié)果,其中,所述組合向量T1,由所述第一語(yǔ)句的第i語(yǔ)句片段中的詞向量和所述第二語(yǔ)句的第j語(yǔ)句片段中的詞向量中的元素組合而成。12.如權(quán)利要求10或11所述的裝置,其特征在于,所述合并單元具體用于將所述X行y列一維向量中的相鄰向量進(jìn)行交替地綜合和篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成所述目標(biāo)向量。13.如權(quán)利要求10或11所述的裝置,其特征在于,所述合并單元具體用于將所述X行y列一維向量中的相鄰向量進(jìn)行交替地綜合和篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成目標(biāo)張量;將所述目標(biāo)張量包含的一維向量中的元素首尾相連,得到所述目標(biāo)向量。14.如權(quán)利要求12或13所述的裝置,其特征在于,所述綜合為卷積運(yùn)算,所述篩選為池化運(yùn)算。15.如權(quán)利要求10-14中任一項(xiàng)所述的裝置,其特征在于,所述合并單元具體用于將所述X行y列一維向量中的每相鄰的mXn個(gè)一維向量進(jìn)行所述至少一次綜合和/或至少一次篩選,不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù),直到將所述三維張量合并成所述目標(biāo)向量,其中,x,n ^ y。16.如權(quán)利要求10-15中任一項(xiàng)所述的裝置,其特征在于,所述確定單元具體用于根據(jù)所述目標(biāo)向量,通過神經(jīng)網(wǎng)絡(luò)模型,確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。17.如權(quán)利要求16所述的裝置,其特征在于,所述確定單元具體用于根據(jù)所述目標(biāo)向量,通過多層感知機(jī)MLP模型,得到所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。18.如權(quán)利要求10-15中任一項(xiàng)所述的裝置,其特征在于,所述確定單元具體用于根據(jù)所述目標(biāo)向量中各元素的權(quán)重,對(duì)所述目標(biāo)向量中的各元素進(jìn)行加權(quán)求和,得到所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。
【專利摘要】本發(fā)明提供一種確定語(yǔ)義匹配度的方法和裝置,該方法包括:獲取第一語(yǔ)句和第二語(yǔ)句;將第一語(yǔ)句和第二語(yǔ)句分別劃分成x和y個(gè)語(yǔ)句片段;將第一語(yǔ)句的每一語(yǔ)句片段中的詞向量與第二語(yǔ)句的每一語(yǔ)句片段中的詞向量進(jìn)行卷積運(yùn)算,得到三維張量;將x行y列一維向量中的相鄰向量進(jìn)行綜合和/或篩選,直到將三維張量合并成一維的目標(biāo)向量;根據(jù)目標(biāo)向量,確定第一語(yǔ)句和第二語(yǔ)句的語(yǔ)義匹配度。本發(fā)明實(shí)施例中,按照語(yǔ)序?qū)⒋ヅ涞恼Z(yǔ)句劃分成以詞向量為單位的語(yǔ)句片段,兩個(gè)語(yǔ)句中的語(yǔ)句片段之間兩兩求卷積,得到三維張量,該三維張量包含各語(yǔ)句之間的語(yǔ)句片段的局部匹配信息,基于該三維張量得到的語(yǔ)義匹配結(jié)果更準(zhǔn)確。
【IPC分類】G06F17/27, G06F17/30
【公開號(hào)】CN105701120
【申請(qǐng)?zhí)枴緾N201410709568
【發(fā)明人】呂正東, 李航
【申請(qǐng)人】華為技術(shù)有限公司
【公開日】2016年6月22日
【申請(qǐng)日】2014年11月28日
【公告號(hào)】WO2016082406A1