汽車養(yǎng)護(hù)方向的智能溝通方法、裝置、系統(tǒng)及應(yīng)用
【專利摘要】汽車養(yǎng)護(hù)方向的智能溝通方法、裝置、系統(tǒng)及應(yīng)用,屬于智能溝通領(lǐng)域,答案庫中存在問題解答的答案,但是,由于問題的表述問題,卻無法匹配該答案的問題,本發(fā)明提供了一種汽車養(yǎng)護(hù)方向的智能溝通方法、裝置、系統(tǒng)及應(yīng)用,以此實(shí)現(xiàn),問題與答案的高度匹配,加快問題匹配速度。技術(shù)要點(diǎn)是:建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提取得到關(guān)鍵字;汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個近似詞,并計算得到關(guān)鍵字和近似詞的相似度;自動機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取的關(guān)鍵字匹配答案庫中的關(guān)鍵字,匹配成功時返回答案;匹配不成功時,匹配關(guān)鍵字的近似詞,并重新匹配答案庫中的關(guān)鍵字。
【專利說明】
汽車養(yǎng)護(hù)方向的智能溝通方法、裝置、系統(tǒng)及應(yīng)用
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于智能溝通領(lǐng)域,涉及汽車養(yǎng)護(hù)問題的自動機(jī)器問答溝通方法的建立和 應(yīng)用。
【背景技術(shù)】
[0002] 近年來,隨著汽車保有量的日益增多,汽車故障維修咨詢的需求也越來越大,傳統(tǒng) 汽車4S店由于其增長量遠(yuǎn)遠(yuǎn)不及汽車的增長量,導(dǎo)致服務(wù)不能到位,而且一些4S店存在不 誠信的行為,因此弊端日益凸顯。
[0003] 另外,汽車養(yǎng)護(hù)方向問題智能人機(jī)溝通技術(shù)的出現(xiàn),使得客戶問題可以被收集,組 織技術(shù)人員對客戶問題進(jìn)行解答,形成對應(yīng)于客戶問題的答案庫;經(jīng)過大量的調(diào)研,對問題 中的關(guān)鍵字進(jìn)行統(tǒng)計,客戶問題往往集中于幾個方面,大部分的問題,可以在答案庫中尋求 答案,為了可以快速和精確的尋找問題答案,需要對答案庫進(jìn)行分詞和提取關(guān)鍵字;而往往 由于語言系統(tǒng)的龐大,客戶問題與答案庫中的關(guān)鍵字不對應(yīng),或者是用答案庫中關(guān)鍵字的 近似詞表示,這會降低答案的準(zhǔn)確率,存在這樣的情況,答案庫中存在問題解答的答案,但 是,由于問題的表述問題,卻無法匹配該答案。
【發(fā)明內(nèi)容】
[0004] 為了解決上述答案庫中存在問題解答的答案,但是,由于問題的表述問題,卻無法 匹配該答案的問題,本發(fā)明提供了一種汽車養(yǎng)護(hù)方向的智能溝通方法、裝置、系統(tǒng)及應(yīng)用, 以此實(shí)現(xiàn),問題與答案的高度匹配,加快問題匹配速度。
[0005] 為了實(shí)現(xiàn)上述目的,本發(fā)明技術(shù)方案的要點(diǎn)是:
[0006] -種汽車養(yǎng)護(hù)方向的智能溝通方法,包括如下步驟:
[0007] S1.建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提取得到關(guān)鍵 字;
[0008] S2.汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個近似詞,并計算 得到關(guān)鍵字和近似詞的相似度;
[0009] S3.自動機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取的關(guān)鍵字匹配答 案庫中的關(guān)鍵字,匹配成功時返回答案;匹配不成功時,匹配關(guān)鍵字的近似詞,并重新匹配 答案庫中的關(guān)鍵字。
[0010] 有益效果:本發(fā)明可及時有效地回答車主關(guān)于汽車養(yǎng)護(hù)方法的問題,并可擴(kuò)展到 故障及車輛保險方面的問題的回答,問題匹配時,匹配速度快,精度高,還可以在無法匹配 的情況下,進(jìn)行關(guān)鍵詞的近似詞匹配,增加了問題回答的范圍,避免了由于客戶表述問題差 異,導(dǎo)致的具有答案,卻無法匹配的問題。
【附圖說明】
[0011] 圖1是實(shí)施例中自動機(jī)器問答實(shí)施步驟的流程圖。
【具體實(shí)施方式】
[0012] 實(shí)施例1: 一種汽車養(yǎng)護(hù)方向的智能溝通方法,包括如下步驟:
[0013] S1.建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提取得到關(guān)鍵 字;
[0014] S2.汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個近似詞,并計算 得到關(guān)鍵字和近似詞的相似度;
[0015] 其中,優(yōu)選汽車專業(yè)類語料庫作近似詞匹配的步驟是:通過神經(jīng)網(wǎng)絡(luò)的詞向量計 算模型,對汽車專業(yè)類語料庫做近似詞匹配,得到答案庫中關(guān)鍵字的多個近似詞,并通過余 弦相似度方法得到關(guān)鍵字和相似詞的相似度,將相似度最大的詞作為相似詞保留。
[0016] S3.自動機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取的關(guān)鍵字匹配答 案庫中的關(guān)鍵字,匹配成功時返回答案;匹配不成功時,匹配關(guān)鍵字的近似詞,并重新匹配 答案庫中的關(guān)鍵字。
[0017]其中,優(yōu)選自動機(jī)器問答實(shí)施的步驟是:
[0018] 第一步:得到客戶問題,用基于隱馬定理的常規(guī)語言自然方法將客戶問題分詞;
[0019] 第二步:通過TF-IDF方法得到分詞里的關(guān)鍵字;
[0020]第三步:將客戶問題里的關(guān)鍵字與答案庫的關(guān)鍵字匹配,匹配成功則直接得到解 決問題的答案;
[0021] 第四步:第三步?jīng)]有匹配成功,則通過神經(jīng)網(wǎng)絡(luò)的詞向量計算模型得到客戶問題 里的關(guān)鍵字的近似詞再重新匹配答案庫關(guān)鍵字,直到得到解決問題的答案。
[0022] 作為本實(shí)施例優(yōu)選技術(shù)方案,所述客戶問題分詞,并提取關(guān)鍵字的方法是:
[0023]第一步:計算詞頻;
[0024]第二步:計算逆文檔頻率;
[0025] 第三步:計算TF-IDF。
[0026]該上述步驟的具體實(shí)現(xiàn)是:
[0027] 所述的計算詞頻的步驟是:
[0028] -個客戶問題出現(xiàn)了(&1,&2〃^)共 111個詞,每個詞在客戶問題中出現(xiàn)的頻率分別 為(ni,n2,"_nm),則第i(l<i<m)個詞的詞頻TF為
[0030] 所述的計算逆文檔頻率的步驟是:
[0031] 通過汽車專業(yè)類語料庫模擬語言使用環(huán)境,汽車專業(yè)類語料庫中的文檔總數(shù)為q, 包含所述的第i個詞的文檔總數(shù)為P,則詞ai的逆文檔頻率IDF為:
[0033] 所述計算TF-IDF的步驟是:
[0034] TF-IDF(ai)=TF(ai)XIDF(ai) (3.2.3)
[0035] 將TF-IDF算法,用于分詞和關(guān)鍵字提取,并協(xié)同于近似詞匹配,可以在加速匹配的 同時,可以增加問題匹配的寬度;使得問題被解答的可能性增加,且避免了提高速度,卻犧 牲了準(zhǔn)確度的缺陷。
[0036] 實(shí)施例2: -種汽車養(yǎng)護(hù)方向的智能溝通裝置,包括:
[0037] 答案庫建立模塊,建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提 取得到關(guān)鍵字;
[0038] 近似詞匹配模塊,汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個 近似詞,并計算得到關(guān)鍵字和近似詞的相似度;
[0039] 自動機(jī)器問答實(shí)施模塊,自動機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將 提取的關(guān)鍵字匹配答案庫中的關(guān)鍵字,匹配成功時返回答案;匹配不成功時,匹配關(guān)鍵字的 近似詞,并重新匹配答案庫中的關(guān)鍵字。
[0040] 該裝置與實(shí)施例1中任意方法技術(shù)方案相對應(yīng),該裝置可用于執(zhí)行實(shí)施例1中所述 的任意種汽車養(yǎng)護(hù)方向的智能溝通方法的技術(shù)方案。
[0041 ]實(shí)施例3 :本實(shí)施例記載了實(shí)施例1中的方法和實(shí)施例2中的裝置技術(shù)方案的形成 路線:
[0042] 3.1.大數(shù)據(jù)統(tǒng)計結(jié)果
[0043] 在建立上述方法和裝置或者建立系統(tǒng)之前,我們針對幾千名奧迪車主的咨詢問題 做了大量細(xì)致的大數(shù)據(jù)分類研究,發(fā)現(xiàn)車主所提問題主要集中在表1所示的幾個方面:
[0044]
[0046]表 1
[0047]在上述提問中,76%的問題都可以通過技術(shù)經(jīng)理和專門的車險行業(yè)專家所建立的 答案庫得到答案。
[0048] 3.2?建立答案庫
[0049] 通過對上千名車主問題的提取,我們組成了專門的解答團(tuán)隊(duì)做解答,形成了答案 庫,并通過TF-IDF算法提取了問題的關(guān)鍵詞,以方便下一階段機(jī)器自主回答技術(shù)的實(shí)現(xiàn)。如 表2所示:
[0051 ] TF-IDF算法步驟如下:
[0052]第一步:計算詞頻
[0053] 假設(shè)一個車主問題出現(xiàn)了(ai,a2,"_am)共m個詞,每個詞在車主問題中出現(xiàn)的頻率 分別為(111,112,"_1〇,則第1(1<<111)個詞的詞頻1?為
[0055]第二步:計算逆文檔頻率
[0056] 第二步中,我們通過一個汽車相關(guān)的語料庫,來模擬了語言的使用環(huán)境。
[0057] 假設(shè),語料庫中的文檔總數(shù)為q,包含該詞的文檔總數(shù)為p,則詞ai的逆文檔頻率 IDF為
[0059] 通過3.2.2式可知,如果一個詞越常見,那么分母就越大,逆文檔頻率IDF(ai)就越 接近于0。
[0060] 第三步:計算TF-IDF
[0061] TF-IDF(ai)=TF(ai)XIDF(ai) (3.2.3)
[0062] 通過3.2.3式可以看到,TF-IDF與一個詞在文檔中的出現(xiàn)次數(shù)成正比,與該詞在整 個語言中的出現(xiàn)次數(shù)成反比。所以,自動提取關(guān)鍵詞的算法就是計算出文檔的每個詞的TF-IDF值,然后按降序排列,取排在最前面的幾個詞做為關(guān)鍵詞。
[0063] 3.3.語料庫匹配近似詞
[0064]通過神經(jīng)網(wǎng)絡(luò)的詞向量計算模型,我們對汽車專業(yè)類語料庫做了近似詞匹配,得 到了答案庫中關(guān)鍵字的多個近似詞,并通過余弦相似度方法得到了關(guān)鍵字和相似詞的相似 度,將相似度最大的詞作為相似詞保留。如胎壓警告可以得到如表3所示的近似詞表,我們 保留"胎壓異常"作為"胎壓警告"的相似詞
[0066]表 3
[0067] 3.4.自動機(jī)器問答系統(tǒng)實(shí)施步驟
[0068]第一步:得到客戶問題后,用基于隱馬定理的常規(guī)語言自然方法將客戶問題分詞; [0069]第二步:通過TF-IDF方法得到分詞里的關(guān)鍵詞;
[0070]第三步:將客戶問題里的關(guān)鍵詞與答案庫的關(guān)鍵字匹配,如果匹配成功則直接得 到解決方案;
[0071] 第四步:如果第三步?jīng)]有匹配成功,則通過神經(jīng)網(wǎng)絡(luò)的詞向量計算模型得到關(guān)鍵 詞的近似詞再重新匹配答案庫關(guān)鍵字,得到解決方案。
[0072] 具體流程見圖1。針對實(shí)施例1和2的技術(shù)方案,基于大數(shù)據(jù)的統(tǒng)計結(jié)果,將傳統(tǒng)的 面對面問答模式由線下發(fā)展到線上,解決了 76%的客戶所提出的問題,滿足了車主的咨詢 需求,而且以機(jī)器回答為主的方式,也節(jié)省了車主的時間,同時減少了車主的經(jīng)濟(jì)支出。
[0073] 實(shí)施例4: 一種汽車養(yǎng)護(hù)方向的智能溝通系統(tǒng),包括:
[0074] 答案庫,所述答案庫具有汽車養(yǎng)護(hù)問題,答案庫中的客戶問題被分詞,并提取得到 客戶問題的關(guān)鍵字;
[0075] 汽車專業(yè)類語料庫,為答案庫中關(guān)鍵字提供多個近似詞,并計算得到關(guān)鍵字和近 似詞的相似度;
[0076] 匹配庫,用于自動機(jī)器問答實(shí)施,對客戶提出的問題分詞,并提取關(guān)鍵字,將提取 的關(guān)鍵字匹配答案庫中的關(guān)鍵字,匹配成功時返回答案;匹配不成功時,匹配關(guān)鍵字的近似 詞,并重新匹配答案庫中的關(guān)鍵字。
[0077] 該系統(tǒng)與實(shí)施例1中任意方法技術(shù)方案相對應(yīng),該裝置可用于執(zhí)行實(shí)施例1中所述 的任意種汽車養(yǎng)護(hù)方向的智能溝通方法的技術(shù)方案。
[0078]實(shí)施例5:-種TF-IDF算法在汽車養(yǎng)護(hù)方向的智能溝通系統(tǒng)或汽車養(yǎng)護(hù)方向的智 能溝通方法中的應(yīng)用。其應(yīng)用過程,詳見實(shí)施例1-4,另,本實(shí)施例還公開了近似詞匹配和 TF-IDF算法協(xié)同在汽車養(yǎng)護(hù)方向的智能溝通系統(tǒng)或汽車養(yǎng)護(hù)方向的智能溝通方法中的應(yīng) 用。
[0079]以上所述,僅為本發(fā)明創(chuàng)造較佳的【具體實(shí)施方式】,但本發(fā)明創(chuàng)造的保護(hù)范圍并不 局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明創(chuàng)造披露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明 創(chuàng)造的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明創(chuàng)造的保護(hù)范圍之 內(nèi)。
【主權(quán)項(xiàng)】
1. 一種汽車養(yǎng)護(hù)方向的智能溝通方法,其特征在于:包括如下步驟:51. 建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提取得到關(guān)鍵字;52. 汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個近似詞,并計算得到 關(guān)鍵字和近似詞的相似度;53. 自動機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取的關(guān)鍵字匹配答案庫 中的關(guān)鍵字,匹配成功時返回答案;匹配不成功時,匹配關(guān)鍵字的近似詞,并重新匹配答案 庫中的關(guān)鍵字。2. 如權(quán)利要求1所述的汽車養(yǎng)護(hù)方向的智能溝通方法,其特征在于,所述客戶問題分 詞,并提取關(guān)鍵字的方法是: 第一步:計算詞頻; 第二步:計算逆文檔頻率; 第三步:計算TF-IDF。3. 如權(quán)利要求2所述的汽車養(yǎng)護(hù)方向的智能溝通方法,其特征在于, 所述的計算詞頻的步驟是: 一個客戶問題出現(xiàn)了(a^as,一am)共m個詞,每個詞在客戶問題中出現(xiàn)的頻率分別為 (ni,n2,"_nm),則第i(Ki<m)個詞的詞頻TF為所述的計算逆文檔頻率的步驟是: 通過汽車專業(yè)類語料庫模擬語言使用環(huán)境,汽車專業(yè)類語料庫中的文檔總數(shù)為q,包含 所述的第i個詞的文檔總數(shù)為P,則詞ai的逆文檔頻率IDF為:所述計算TF-IDF的步驟是: TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)4. 如權(quán)利要求1或4所述的汽車養(yǎng)護(hù)方向的智能溝通方法,其特征在于,汽車專業(yè)類語 料庫作近似詞匹配的步驟是:通過神經(jīng)網(wǎng)絡(luò)的詞向量計算模型,對汽車專業(yè)類語料庫做近 似詞匹配,得到答案庫中關(guān)鍵字的多個近似詞,并通過余弦相似度方法得到關(guān)鍵字和相似 詞的相似度,將相似度最大的詞作為相似詞保留。5. 如權(quán)利要求1或4所述的汽車養(yǎng)護(hù)方向的智能溝通方法,其特征在于,自動機(jī)器問答 實(shí)施的步驟是: 第一步:得到客戶問題,用基于隱馬定理的常規(guī)語言自然方法將客戶問題分詞; 第二步:通過TF-IDF方法得到分詞里的關(guān)鍵字; 第三步:將客戶問題里的關(guān)鍵字與答案庫的關(guān)鍵字匹配,匹配成功則直接得到解決問 題的答案; 第四步:第三步?jīng)]有匹配成功,則通過神經(jīng)網(wǎng)絡(luò)的詞向量計算模型得到客戶問題里的 關(guān)鍵字的近似詞再重新匹配答案庫關(guān)鍵字,直到得到解決問題的答案。6. -種汽車養(yǎng)護(hù)方向的智能溝通裝置,其特征在于,包括: 答案庫建立模塊,建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提取得 到關(guān)鍵字; 近似詞匹配模塊,汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個近似 詞,并計算得到關(guān)鍵字和近似詞的相似度; 自動機(jī)器問答實(shí)施模塊,自動機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取 的關(guān)鍵字匹配答案庫中的關(guān)鍵字,匹配成功時返回答案;匹配不成功時,匹配關(guān)鍵字的近似 詞,并重新匹配答案庫中的關(guān)鍵字。7. -種汽車養(yǎng)護(hù)方向的智能溝通系統(tǒng),其特征在于,包括: 答案庫,所述答案庫具有汽車養(yǎng)護(hù)問題,答案庫中的客戶問題被分詞,并提取得到客戶 問題的關(guān)鍵字; 汽車專業(yè)類語料庫,為答案庫中關(guān)鍵字提供多個近似詞,并計算得到關(guān)鍵字和近似詞 的相似度; 匹配庫,用于自動機(jī)器問答實(shí)施,對客戶提出的問題分詞,并提取關(guān)鍵字,將提取的關(guān) 鍵字匹配答案庫中的關(guān)鍵字,匹配成功時返回答案;匹配不成功時,匹配關(guān)鍵字的近似詞, 并重新匹配答案庫中的關(guān)鍵字。8. -種TF-IDF算法在汽車養(yǎng)護(hù)方向的智能溝通系統(tǒng)或汽車養(yǎng)護(hù)方向的智能溝通方法 中的應(yīng)用。
【文檔編號】G06F17/30GK106055628SQ201610364478
【公開日】2016年10月26日
【申請日】2016年5月27日
【發(fā)明人】田雨農(nóng), 董向前
【申請人】大連樓蘭科技股份有限公司