確定語(yǔ)義匹配度的方法和裝置的制造方法_5

文檔序號(hào)：9922032閱讀：來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>確定語(yǔ)義匹配度的方法和裝置的制造方法

可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中，包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī)，服務(wù)器，或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM，Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM，Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0114]以上所述，僅為本發(fā)明的【具體實(shí)施方式】，但本發(fā)明的保護(hù)范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，可輕易想到變化或替換，都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此，本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種確定語(yǔ)義匹配度的方法，其特征在于，包括: 獲取第一語(yǔ)句和第二語(yǔ)句，其中，所述第一語(yǔ)句和所述第二語(yǔ)句為待匹配的語(yǔ)句，所述第一語(yǔ)句包括a個(gè)詞向量，所述第二語(yǔ)句包括b個(gè)詞向量；以所述第一語(yǔ)句中的相鄰的k個(gè)詞向量為單位，將所述第一語(yǔ)句劃分成X個(gè)語(yǔ)句片段，其中，所述X個(gè)語(yǔ)句片段中的第i語(yǔ)句片段包括所述第一語(yǔ)句中的第i個(gè)詞向量至第i+k-1個(gè)詞向量，其中X = a-k+Ι ；以所述第二語(yǔ)句中的相鄰的t個(gè)詞向量為單位，將所述第二語(yǔ)句劃分成y個(gè)語(yǔ)句片段，其中，所述y個(gè)語(yǔ)句片段中的第j語(yǔ)句片段包括所述第二語(yǔ)句中的第j個(gè)詞向量至第j+t-1個(gè)詞向量，其中I = b-t+Ι ；將所述第一語(yǔ)句的每一語(yǔ)句片段中的詞向量與所述第二語(yǔ)句的每一語(yǔ)句片段中的詞向量進(jìn)行卷積運(yùn)算，得到三維張量，其中，所述三維張量包括X行y列一維向量，所述X行y列一維向量中的第i行第j列一維向量是所述第一語(yǔ)句的第i語(yǔ)句片段中的詞向量和所述第二語(yǔ)句的第j語(yǔ)句片段中的詞向量經(jīng)過所述卷積運(yùn)算后得到的結(jié)果；將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成一維的目標(biāo)向量；根據(jù)所述目標(biāo)向量，確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。2.如權(quán)利要求1所述的方法，其特征在于，所述將所述第一語(yǔ)句的每一語(yǔ)句片段中的詞向量與所述第二語(yǔ)句的每一語(yǔ)句片段中的詞向量進(jìn)行卷積運(yùn)算，得到三維張量，包括: 將所述第一語(yǔ)句的每一語(yǔ)句片段中的k個(gè)詞向量中的元素和所述第二語(yǔ)句的每一語(yǔ)句片段中的t個(gè)詞向量中的元素首尾相連，得到Q個(gè)一維的組合向量，其中Q = xXy ；分別對(duì)所述Q個(gè)一維的組合向量進(jìn)行所述卷積運(yùn)算，得到所述三維張量，其中，所述三維張量中的第i行第j列一維向量是所述Q個(gè)一維的組合向量中的組合向量T1,經(jīng)過所述卷積運(yùn)算后得到的結(jié)果，其中，所述組合向量T1,由所述第一語(yǔ)句的第i語(yǔ)句片段中的詞向量和所述第二語(yǔ)句的第j語(yǔ)句片段中的詞向量中的元素組合而成。3.如權(quán)利要求1或2所述的方法，其特征在于，所述將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成一維的目標(biāo)向量，包括: 將所述X行y列一維向量中的相鄰向量進(jìn)行交替地綜合和篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成所述目標(biāo)向量。4.如權(quán)利要求1或2所述的方法，其特征在于，所述將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成一維的目標(biāo)向量，包括: 將所述X行y列一維向量中的相鄰向量進(jìn)行交替地綜合和篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成目標(biāo)張量；將所述目標(biāo)張量包含的一維向量中的元素首尾相連，得到所述目標(biāo)向量。5.如權(quán)利要求3或4所述的方法，其特征在于，所述綜合為卷積運(yùn)算，所述篩選為池化運(yùn)算。6.如權(quán)利要求1-5中任一項(xiàng)所述的方法，其特征在于，所述將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成一維的目標(biāo)向量，包括: 將所述X行y列一維向量中的每相鄰的mXn個(gè)一維向量進(jìn)行所述至少一次綜合和/或至少一次篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成所述目標(biāo)向量，其中，m ^ X, n ^ y07.如權(quán)利要求1-6中任一項(xiàng)所述的方法，其特征在于，所述根據(jù)所述目標(biāo)向量，確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度，包括: 根據(jù)所述目標(biāo)向量，通過神經(jīng)網(wǎng)絡(luò)模型，確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。8.如權(quán)利要求7所述的方法，其特征在于，所述根據(jù)所述目標(biāo)向量，通過神經(jīng)網(wǎng)絡(luò)模型，確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度，包括: 根據(jù)所述目標(biāo)向量，通過多層感知機(jī)MLP模型，得到所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。9.如權(quán)利要求1-6中任一項(xiàng)所述的方法，其特征在于，所述根據(jù)所述目標(biāo)向量，確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度，包括: 根據(jù)所述目標(biāo)向量中各元素的權(quán)重，對(duì)所述目標(biāo)向量中的各元素進(jìn)行加權(quán)求和，得到所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。10.一種確定語(yǔ)義匹配度的裝置，其特征在于，包括: 獲取單元，用于獲取第一語(yǔ)句和第二語(yǔ)句，其中，所述第一語(yǔ)句和所述第二語(yǔ)句為待匹配的語(yǔ)句，所述第一語(yǔ)句包括a個(gè)詞向量，所述第二語(yǔ)句包括b個(gè)詞向量；第一劃分單元，用于以所述第一語(yǔ)句中的相鄰的k個(gè)詞向量為單位，將所述第一語(yǔ)句劃分成X個(gè)語(yǔ)句片段，其中，所述X個(gè)語(yǔ)句片段中的第i語(yǔ)句片段包括所述第一語(yǔ)句中的第i個(gè)詞向量至第i+k-Ι個(gè)詞向量，其中X = a-k+Ι ；第二劃分單元，用于以所述第二語(yǔ)句中的相鄰的t個(gè)詞向量為單位，將所述第二語(yǔ)句劃分成I個(gè)語(yǔ)句片段，其中，所述y個(gè)語(yǔ)句片段中的第j語(yǔ)句片段包括所述第二語(yǔ)句中的第j個(gè)詞向量至第j+t-Ι個(gè)詞向量，其中y = b-t+Ι ；運(yùn)算單元，用于將所述第一語(yǔ)句的每一語(yǔ)句片段中的詞向量與所述第二語(yǔ)句的每一語(yǔ)句片段中的詞向量進(jìn)行卷積運(yùn)算，得到三維張量，其中，所述三維張量包括X行y列一維向量，所述X行I列一維向量中的第i行第j列一維向量是所述第一語(yǔ)句的第i語(yǔ)句片段中的詞向量和所述第二語(yǔ)句的第j語(yǔ)句片段中的詞向量經(jīng)過所述卷積運(yùn)算后得到的結(jié)果；合并單元，用于將所述X行y列一維向量中的相鄰向量進(jìn)行至少一次綜合和/或至少一次篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成一維的目標(biāo)向量；確定單元，用于根據(jù)所述目標(biāo)向量，確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。11.如權(quán)利要求10所述的裝置，其特征在于，所述運(yùn)算單元具體用于將所述第一語(yǔ)句的每一語(yǔ)句片段中的k個(gè)詞向量中的元素和所述第二語(yǔ)句的每一語(yǔ)句片段中的t個(gè)詞向量中的元素首尾相連，得到Q個(gè)一維的組合向量，其中Q = xXy ;分別對(duì)所述Q個(gè)一維的組合向量進(jìn)行所述卷積運(yùn)算，得到所述三維張量，其中，所述三維張量中的第i行第j列一維向量是所述Q個(gè)一維的組合向量中的組合向量T1,經(jīng)過所述卷積運(yùn)算后得到的結(jié)果，其中，所述組合向量T1,由所述第一語(yǔ)句的第i語(yǔ)句片段中的詞向量和所述第二語(yǔ)句的第j語(yǔ)句片段中的詞向量中的元素組合而成。12.如權(quán)利要求10或11所述的裝置，其特征在于，所述合并單元具體用于將所述X行y列一維向量中的相鄰向量進(jìn)行交替地綜合和篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成所述目標(biāo)向量。13.如權(quán)利要求10或11所述的裝置，其特征在于，所述合并單元具體用于將所述X行y列一維向量中的相鄰向量進(jìn)行交替地綜合和篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成目標(biāo)張量；將所述目標(biāo)張量包含的一維向量中的元素首尾相連，得到所述目標(biāo)向量。14.如權(quán)利要求12或13所述的裝置，其特征在于，所述綜合為卷積運(yùn)算，所述篩選為池化運(yùn)算。15.如權(quán)利要求10-14中任一項(xiàng)所述的裝置，其特征在于，所述合并單元具體用于將所述X行y列一維向量中的每相鄰的mXn個(gè)一維向量進(jìn)行所述至少一次綜合和/或至少一次篩選，不斷縮減所述三維張量所包含的一維向量的個(gè)數(shù)，直到將所述三維張量合并成所述目標(biāo)向量，其中，x，n ^ y。16.如權(quán)利要求10-15中任一項(xiàng)所述的裝置，其特征在于，所述確定單元具體用于根據(jù)所述目標(biāo)向量，通過神經(jīng)網(wǎng)絡(luò)模型，確定所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。17.如權(quán)利要求16所述的裝置，其特征在于，所述確定單元具體用于根據(jù)所述目標(biāo)向量，通過多層感知機(jī)MLP模型，得到所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。18.如權(quán)利要求10-15中任一項(xiàng)所述的裝置，其特征在于，所述確定單元具體用于根據(jù)所述目標(biāo)向量中各元素的權(quán)重，對(duì)所述目標(biāo)向量中的各元素進(jìn)行加權(quán)求和，得到所述第一語(yǔ)句和所述第二語(yǔ)句的語(yǔ)義匹配度。
【專利摘要】本發(fā)明提供一種確定語(yǔ)義匹配度的方法和裝置，該方法包括：獲取第一語(yǔ)句和第二語(yǔ)句；將第一語(yǔ)句和第二語(yǔ)句分別劃分成x和y個(gè)語(yǔ)句片段；將第一語(yǔ)句的每一語(yǔ)句片段中的詞向量與第二語(yǔ)句的每一語(yǔ)句片段中的詞向量進(jìn)行卷積運(yùn)算，得到三維張量；將x行y列一維向量中的相鄰向量進(jìn)行綜合和/或篩選，直到將三維張量合并成一維的目標(biāo)向量；根據(jù)目標(biāo)向量，確定第一語(yǔ)句和第二語(yǔ)句的語(yǔ)義匹配度。本發(fā)明實(shí)施例中，按照語(yǔ)序?qū)⒋ヅ涞恼Z(yǔ)句劃分成以詞向量為單位的語(yǔ)句片段，兩個(gè)語(yǔ)句中的語(yǔ)句片段之間兩兩求卷積，得到三維張量，該三維張量包含各語(yǔ)句之間的語(yǔ)句片段的局部匹配信息，基于該三維張量得到的語(yǔ)義匹配結(jié)果更準(zhǔn)確。
【IPC分類】G06F17/27, G06F17/30
【公開號(hào)】CN105701120
【申請(qǐng)?zhí)枴緾N201410709568
【發(fā)明人】呂正東, 李航
【申請(qǐng)人】華為技術(shù)有限公司
【公開日】2016年6月22日
【申請(qǐng)日】2014年11月28日
【公告號(hào)】WO2016082406A1

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第5頁(yè)1 2 3 4 5

相關(guān)技術(shù)