亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

語意識別搜索的方法及系統(tǒng)的制作方法

文檔序號:6372735閱讀:358來源:國知局
專利名稱:語意識別搜索的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)搜索的方法,具體的講是用于網(wǎng)絡(luò)的語意識別搜索的方法及系統(tǒng)。
背景技術(shù)
隨著網(wǎng)絡(luò)技術(shù)、電子技術(shù)的進(jìn)步,互聯(lián)網(wǎng)上的信息內(nèi)容越來越龐大。目前的互聯(lián)網(wǎng)用戶對網(wǎng)絡(luò)信息的獲取已經(jīng)很習(xí)慣的于通過互聯(lián)網(wǎng)的搜索引擎進(jìn)行搜索,并在搜索出的條目中找尋與自己真實(shí)搜索目的相關(guān)的內(nèi)容。在互聯(lián)網(wǎng)發(fā)展的早期,以雅虎為代表的網(wǎng)站分類目錄查詢非常流行。網(wǎng)站分類目錄由人工整理維護(hù),精選互聯(lián)網(wǎng)上的優(yōu)秀網(wǎng)站,并簡要描述,分類放置到不同目錄下。用戶 查詢時,通過一層層的點(diǎn)擊來查找自己想找的網(wǎng)站。也有人把這種基于目錄的檢索服務(wù)網(wǎng)站稱為搜索引擎,但從嚴(yán)格意義上講,它并不是搜索引擎。由于互聯(lián)網(wǎng)信息量的增長速度太快,以至于采用由人工整理維護(hù)網(wǎng)站分類目錄的方式不可能繼續(xù)。新一代搜索引擎應(yīng)運(yùn)而生。在數(shù)據(jù)庫維護(hù)上,搜索引擎把以前被搜索的條目進(jìn)行整理匯總形成數(shù)據(jù)庫;搜索引擎主動抓取索引信息對數(shù)據(jù)庫進(jìn)行增補(bǔ),進(jìn)一步提高搜索數(shù)據(jù)庫的覆蓋范圍。當(dāng)用戶發(fā)起搜索請求時,搜索引擎在數(shù)據(jù)庫中檢索“關(guān)鍵詞”并將包含關(guān)鍵詞的HTML鏈接反饋給用戶。目前的各種搜索引擎都是基于這種技術(shù)建立起來的。但無論那種搜索引擎目前都不能對“關(guān)鍵詞”進(jìn)行“語意”的理解,更不能按照“語意”去為用戶搜索所需的內(nèi)容。每種搜索方式的核心都是基于“關(guān)鍵詞”的文字表達(dá)在數(shù)據(jù)庫中的檢索。引擎反饋給用戶的HTML鏈接也只是包含到“關(guān)鍵詞”的特定網(wǎng)頁。然而用戶搜索命令的含義不僅為“關(guān)鍵詞”的文字表達(dá)那么片面,是有其內(nèi)涵并且含有期待的。譬如,搜索“北京”一詞,就有以下若干可能小學(xué)生搜索“北京”,可能希望了解北京的歷史、人文。以豐富知識;在外地搜索“北京”,可能是正在籌劃一次旅行。希望知道的可能是航班、天氣、旅游行程等;工作人員搜索“北京”,可能是有工差需要前往。希望知道的可能是工差地的吃、住、行等信息。那么利用現(xiàn)有的搜索引擎來搜索,得到的結(jié)果是廣泛、無區(qū)別、不具針對性的。隨著互聯(lián)網(wǎng)用戶的增多,用戶的搜索需求也更加復(fù)雜。深入分析不同用戶的潛在需求,縮小搜索結(jié)果范圍、提高搜索精度,是對搜索引擎提出的新要求。

發(fā)明內(nèi)容
針對上述的問題,本發(fā)明提供了一種語意識別搜索的方法及系統(tǒng),能夠準(zhǔn)確理解用戶輸入條目的語意,并根據(jù)語意為用戶用盡少的步驟搜索到用戶真實(shí)關(guān)注的內(nèi)容。并且系統(tǒng)具備知識集升級的功能。
本發(fā)明語意識別搜索的方法,包括客戶端接收搜索關(guān)鍵詞,并將搜索關(guān)鍵詞和用戶信息發(fā)送至語意搜索系統(tǒng)的語意庫;所述語意庫結(jié)合用戶信息中的至少一個屬性,將搜索關(guān)鍵詞解析為與所述屬性相關(guān)的類別關(guān)鍵詞,并通過語意搜索系統(tǒng)將解析后的類別關(guān)鍵詞通過互聯(lián)網(wǎng)發(fā)送到搜索引擎中進(jìn)行搜索;當(dāng)語意庫不能結(jié)合所述屬性對搜索關(guān)鍵詞進(jìn)行解析時,語意搜索系統(tǒng)將搜索關(guān)鍵詞發(fā)送至人工客服處,由人工結(jié)合所述屬性將搜索關(guān)鍵詞的語意解析為相關(guān)的類別關(guān)鍵詞,并將解析后的類別關(guān)鍵詞通過互聯(lián)網(wǎng)發(fā)送到搜索引擎中進(jìn)行搜索;語意搜索系統(tǒng)將搜索引擎搜索的結(jié)果反饋至客戶端進(jìn)行顯示;
人工客服處由人工將本次搜索關(guān)鍵詞、用戶信息和類別關(guān)鍵詞以關(guān)聯(lián)方式存儲到所述語意庫中。對用戶輸入的搜索關(guān)鍵詞先通過計(jì)算機(jī)系統(tǒng)進(jìn)行語意的分析,當(dāng)計(jì)算機(jī)系統(tǒng)不能解析關(guān)鍵詞針對該用戶的具體含義時,計(jì)算機(jī)系統(tǒng)將用戶信息和搜索關(guān)鍵詞發(fā)送到人工客服處,由人工進(jìn)行解析。在人工解析時,可以是客服人員根據(jù)用戶信息和搜索關(guān)鍵詞直接進(jìn)行判斷和理解,也可以是通過和用戶語音交流進(jìn)行判斷,最后將人工解析的結(jié)果和用戶信息存入計(jì)算機(jī)系統(tǒng)的語意庫中,對其進(jìn)行升級,使語意庫以后再遇到類似的用戶信息和搜索關(guān)鍵詞時,可以自行做出相應(yīng)的語意解析。通過這種計(jì)算機(jī)系統(tǒng)和人工結(jié)合的方式,使用戶的真實(shí)搜索需求得到了最大化的正確理解,明顯提高了網(wǎng)絡(luò)搜索的針對性和搜索效率。可選的,所述的搜索關(guān)鍵詞為語音信息,客戶端接收語音信息的搜索關(guān)鍵詞后對其進(jìn)行PCM (脈碼調(diào)制)編碼,并將編碼后的信息發(fā)送至語音識別引擎轉(zhuǎn)換為文本格式,將所述的文本格式信息反饋至客戶端后,由客戶端將文本格式的搜索關(guān)鍵詞和用戶信息發(fā)送至語意搜索系統(tǒng)的語意庫。語音輸入與文字輸入相比明顯更快捷性和方便,但語音輸入后需要在客戶端將輸入的語音轉(zhuǎn)換為文本格式以便于后續(xù)計(jì)算機(jī)和人工的處理。優(yōu)選的,由語意搜索系統(tǒng)自動通過互聯(lián)網(wǎng)的搜索引擎進(jìn)行搜索后,對搜索結(jié)果語意搜索系統(tǒng)根據(jù)用戶信息中的至少一個屬性進(jìn)行篩選,將篩選后的搜索結(jié)果反饋至客戶端。對搜索的結(jié)果再根據(jù)用戶信息進(jìn)行一次篩選一次,能夠進(jìn)一步提高搜索的針對性,篩選的方式可以和之前對語意解析的方法一樣。類似的一種優(yōu)選方式,由人工客服處通過人工對搜索關(guān)鍵詞進(jìn)行互聯(lián)網(wǎng)的搜索引擎搜索后,對搜索結(jié)果再由所述人工根據(jù)用戶信息中的至少一個屬性進(jìn)行篩選,將篩選后的搜索結(jié)果通過語意搜索系統(tǒng)反饋至客戶端。具體的,所述用戶信息的屬性包括有客戶端IP、用戶年齡、用戶職業(yè)、目標(biāo)時間和歷史搜索類別中的至少一項(xiàng),還可以根據(jù)系統(tǒng)的設(shè)置和具體環(huán)境結(jié)合更多的屬性,使語意的理解更準(zhǔn)確。具體的,所述的客戶端為能夠通過Web瀏覽器連接互聯(lián)網(wǎng)的終端設(shè)備。本發(fā)明還提供用于上述方法的語意識別搜索的系統(tǒng),是由客戶端通過網(wǎng)絡(luò)與語意搜索系統(tǒng)的語意庫雙向連接,語意搜索系統(tǒng)的輸出端連接互聯(lián)網(wǎng)的搜索引擎和人工客服處的終端,人工客服處的終端也連接至互聯(lián)網(wǎng)的搜索引擎。為了簡化用戶的輸入方式,可選的一種方式是客戶端還與語音識別引擎進(jìn)行雙向連接,由語音識別引擎對語音輸入進(jìn)行文本轉(zhuǎn)換。具體的,所述的客戶端為能夠通過Web瀏覽器連接互聯(lián)網(wǎng)的終端設(shè)備。本發(fā)明的語意識別搜索的方法及系統(tǒng),能夠準(zhǔn)確理解用戶輸入搜索關(guān)鍵詞的語意,并能夠根據(jù)語意為用戶用盡少的步驟搜索到用戶真實(shí)關(guān)注的內(nèi)容,具有顯著的針對性,提高了網(wǎng)絡(luò)搜索的效率,同時系統(tǒng)還具備知識集升級的功能。以下結(jié)合附圖所示實(shí)施例的具體實(shí)施方式
,對本發(fā)明的上述內(nèi)容再作進(jìn)一步的詳細(xì)說明。但不應(yīng)將此理解為本發(fā)明上述主題的范圍僅限于以下的實(shí)例。在不脫離本發(fā)明上述技術(shù)思想情況下,根據(jù)本領(lǐng)域普通技術(shù)知識和慣用手段做出的各種替換或變更,均應(yīng)包括在本發(fā)明的范圍內(nèi)。


圖I為本發(fā)明語意識別搜索的方法的流程圖。
具體實(shí)施例方式本發(fā)明語意識別搜索的系統(tǒng),由具備Web瀏覽器的客戶端通過網(wǎng)絡(luò)與語意搜索系統(tǒng)的語意庫雙向連接,客戶端還與語音識別引擎進(jìn)行雙向連接,由語音識別引擎對語音輸入進(jìn)行文本轉(zhuǎn)換。語意搜索系統(tǒng)的輸出端連接互聯(lián)網(wǎng)的搜索引擎和人工客服處的終端,人工客服處的終端也連接至互聯(lián)網(wǎng)的搜索引擎。如圖I所示通過上述系統(tǒng)的本發(fā)明語意識別搜索的方法,包括客戶端接收用戶語音輸入的搜索關(guān)鍵詞,對其進(jìn)行PCM (脈碼調(diào)制)編碼,并將編碼后的信息發(fā)送至語音識別引擎轉(zhuǎn)換為文本格式,再將所述的文本格式信息反饋至客戶端后,將文本格式的搜索關(guān)鍵詞和用戶信息一并發(fā)送至語意搜索系統(tǒng)的語意庫;用戶信息中包含了客戶端IP、用戶年齡、用戶職業(yè)、目標(biāo)時間和歷史搜索類別等屬性,也可以根據(jù)系統(tǒng)的設(shè)置和具體環(huán)境結(jié)合更多的屬性。語意庫結(jié)合用戶信息中的至少一個屬性,將搜索關(guān)鍵詞解析為與所述屬性相關(guān)的類別關(guān)鍵詞,如電影、音樂、天氣、對話等,并通過語意搜索系統(tǒng)將解析后的類別關(guān)鍵詞通過互聯(lián)網(wǎng)發(fā)送到搜索引擎中進(jìn)行搜索;當(dāng)語意庫不能結(jié)合所述屬性對搜索關(guān)鍵詞進(jìn)行解析時,語意搜索系統(tǒng)將搜索關(guān)鍵詞發(fā)送至人工客服處,由人工結(jié)合所述屬性將搜索關(guān)鍵詞的語意解析為相關(guān)的類別關(guān)鍵詞,并將解析后的類別關(guān)鍵詞通過互聯(lián)網(wǎng)發(fā)送到搜索引擎中進(jìn)行搜索;由語意搜索系統(tǒng)自動通過互聯(lián)網(wǎng)的搜索引擎進(jìn)行搜索后,對搜索結(jié)果語意搜索系統(tǒng)根據(jù)用戶信息中的至少一個屬性進(jìn)行篩選,將篩選后的搜索結(jié)果反饋至客戶端。對搜索的結(jié)果再根據(jù)用戶信息進(jìn)行一次篩選一次,能夠進(jìn)一步提高搜索的針對性,篩選的方式可以和之前對語意解析的方法一樣。類似的,由人工客服處通過人工對搜索關(guān)鍵詞進(jìn)行互聯(lián)網(wǎng)的搜索引擎搜索后,對搜索結(jié)果再由所述人工根據(jù)用戶信息中的至少一個屬性進(jìn)行篩選,將篩選后的搜索結(jié)果通過語意搜索系統(tǒng)反饋至客戶端;語意搜索系統(tǒng)將搜索引擎搜索的結(jié)果反饋至客戶端進(jìn)行顯示;人工客服處由人工將本次搜索關(guān)鍵詞、用戶信息和類別關(guān)鍵詞以關(guān)聯(lián)方式存儲到所述語意庫中,對其進(jìn)行升級,使語意庫以后再遇到類似的用戶信息和搜索關(guān)鍵詞時,可以自行做出相應(yīng)的語意解析。
通過本實(shí)施例的方法進(jìn)行網(wǎng)絡(luò)搜索時,如用戶IP=四川,年齡=12,日志=常搜索地理、歷史、人文、科教等信息,用戶搜索“北京”,系統(tǒng)反饋為地圖、朝代、名人等信息;如用戶IP=四川,年齡=18,時間=8月等信息,用戶搜索“北京”通過人工或系統(tǒng)分析用戶可能高考完畢,準(zhǔn)備旅游。反饋信息為航班,酒店,旅游路線等信息。
通過這種計(jì)算機(jī)系統(tǒng)和人工結(jié)合的方式,使用戶的真實(shí)搜索需求得到了最大化的正確理解,明顯提高了網(wǎng)絡(luò)搜索的針對性和搜索效率。
權(quán)利要求
1.語意識別搜索的方法,其特征為包括 客戶端接收搜索關(guān)鍵詞,并將搜索關(guān)鍵詞和用戶信息發(fā)送至語意搜索系統(tǒng)的語意庫; 所述語意庫結(jié)合用戶信息中的至少一個屬性,將搜索關(guān)鍵詞解析為與所述屬性相關(guān)的類別關(guān)鍵詞,并通過語意搜索系統(tǒng)將解析后的類別關(guān)鍵詞通過互聯(lián)網(wǎng)發(fā)送到搜索引擎中進(jìn)行搜索; 當(dāng)語意庫不能結(jié)合所述屬性對搜索關(guān)鍵詞進(jìn)行解析時,語意搜索系統(tǒng)將搜索關(guān)鍵詞發(fā)送至人工客服處,由人工結(jié)合所述屬性將搜索關(guān)鍵詞的語意解析為相關(guān)的類別關(guān)鍵詞,并將解析后的類別關(guān)鍵詞通過互聯(lián)網(wǎng)發(fā)送到搜索引擎中進(jìn)行搜索; 語意搜索系統(tǒng)將搜索引擎搜索的結(jié)果反饋至客戶端進(jìn)行顯示; 人工客服處由人工將本次搜索關(guān)鍵詞、用戶信息和類別關(guān)鍵詞以關(guān)聯(lián)方式存儲到所述語意庫中。
2.如權(quán)利要求I所述的語意識別搜索的方法,其特征為所述的搜索關(guān)鍵詞為語音信息,客戶端接收語音信息的搜索關(guān)鍵詞后對其進(jìn)行PCM編碼,并將編碼后的信息發(fā)送至語音識別引擎轉(zhuǎn)換為文本格式,將所述的文本格式信息反饋至客戶端后,由客戶端將文本格式的搜索關(guān)鍵詞和用戶信息發(fā)送至語意搜索系統(tǒng)的語意庫。
3.如權(quán)利要求I所述的語意識別搜索的方法,其特征為由語意搜索系統(tǒng)自動通過互聯(lián)網(wǎng)的搜索引擎進(jìn)行搜索后,對搜索結(jié)果語意搜索系統(tǒng)根據(jù)用戶信息中的至少一個屬性進(jìn)行篩選,將篩選后的搜索結(jié)果反饋至客戶端。
4.如權(quán)利要求I所述的語意識別搜索的方法,其特征為由人工客服處通過人工對搜索關(guān)鍵詞進(jìn)行互聯(lián)網(wǎng)的搜索引擎搜索后,對搜索結(jié)果再由所述人工根據(jù)用戶信息中的至少一個屬性進(jìn)行篩選,將篩選后的搜索結(jié)果通過語意搜索系統(tǒng)反饋至客戶端。
5.如權(quán)利要求I至4之一所述的語意識別搜索的方法,其特征為所述用戶信息的屬性包括有客戶端IP、用戶年齡、用戶職業(yè)、目標(biāo)時間和歷史搜索類別中的至少一項(xiàng)。
6.如權(quán)利要求I至4之一所述的語意識別搜索的方法,其特征為所述的客戶端為能夠通過Web瀏覽器連接互聯(lián)網(wǎng)的終端設(shè)備。
7.用于權(quán)利要求I所述方法的語意識別搜索的系統(tǒng),其特征為客戶端通過網(wǎng)絡(luò)與語意搜索系統(tǒng)的語意庫雙向連接,語意搜索系統(tǒng)的輸出端連接互聯(lián)網(wǎng)的搜索引擎和人工客服處的終端,人工客服處的終端也連接至互聯(lián)網(wǎng)的搜索引擎。
8.如權(quán)利要求7所述的語意識別搜索的系統(tǒng),其特征為客戶端還與語音識別引擎進(jìn)行雙向連接。
9.如權(quán)利要求7或8所述的語意識別搜索的系統(tǒng),其特征為所述的客戶端為能夠通過Web瀏覽器連接互聯(lián)網(wǎng)的終端設(shè)備。
全文摘要
本發(fā)明涉及語意識別搜索的方法及系統(tǒng),包括客戶端將搜索關(guān)鍵詞和用戶信息發(fā)送至語意搜索系統(tǒng)的語意庫;所述語意庫結(jié)合用戶信息中的至少一個屬性,將搜索關(guān)鍵詞解析為類別關(guān)鍵詞后進(jìn)行搜索;當(dāng)語意庫不能解析搜索關(guān)鍵詞時,系統(tǒng)將搜索關(guān)鍵詞發(fā)送至人工客服處,由人工解析類別關(guān)鍵詞后進(jìn)行搜索;客戶端顯示反饋的搜索結(jié)果;人工客服處由人工將本次搜索關(guān)鍵詞、用戶信息和類別關(guān)鍵詞以關(guān)聯(lián)方式存儲到所述語意庫中。本發(fā)明的語意識別搜索的方法及系統(tǒng),能夠準(zhǔn)確理解用戶輸入搜索關(guān)鍵詞的語意,并能夠根據(jù)語意為用戶用盡少的步驟搜索到用戶真實(shí)關(guān)注的內(nèi)容,具有顯著的針對性,提高了網(wǎng)絡(luò)搜索的效率,同時系統(tǒng)還具備知識集升級的功能。
文檔編號G06F17/30GK102831157SQ20121022992
公開日2012年12月19日 申請日期2012年7月4日 優(yōu)先權(quán)日2012年7月4日
發(fā)明者趙勇, 黃誠 申請人:四川長虹電器股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1