信息搜索方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種信息搜索方法及裝置,其中,信息搜索方法包括:獲得當(dāng)前關(guān)鍵詞;以及根據(jù)當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,以用于在搜索結(jié)果頁中展現(xiàn)圖片集合中的圖片。上述信息搜索方法及裝置,根據(jù)獲得的當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,由于圖片集合中的圖片更多、更全,且與當(dāng)前關(guān)鍵詞的相關(guān)性較高,從而可以將符合用戶搜索需求的圖片展現(xiàn)給用戶,提高了用戶的搜索體驗度和滿意度,進(jìn)而方便用戶對相關(guān)圖片進(jìn)行瀏覽、點擊等操作。
【專利說明】信息搜索方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及搜索【技術(shù)領(lǐng)域】,尤其涉及一種信息搜索方法及裝置。
【背景技術(shù)】
[0002]搜索引擎(Search Engine)是指根據(jù)一定的策略、運用特定的計算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),并將檢索到的相關(guān)信息展示給用戶的系統(tǒng)。
[0003]在搜索引擎領(lǐng)域,當(dāng)用戶搜索一個查詢信息(query)時,搜索引擎會展現(xiàn)出一條或者多條搜索結(jié)果,其中,包括廣告信息和自然結(jié)果。
[0004]目前,由于圖片所蘊含的信息量更豐富,用戶從圖片獲取信息的速度相對于文字更快,故可搜索結(jié)果中展現(xiàn)更多的圖片。但是,如果搜索引擎提供的圖片與query的相關(guān)性很差、甚至不相關(guān),將大大降低用戶的搜索滿意度,因此,迫切需要提供一種可以獲得與query相關(guān)的圖片的技術(shù)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此,本發(fā)明的一個目的在于提出一種信息搜索方法,可實現(xiàn)將符合用戶搜索需求的圖片展現(xiàn)給用戶,提高了用戶的搜索體驗度和滿意度。
[0006]本發(fā)明的第二個目的在于提出一種信息搜索裝置。
[0007]為達(dá)上述目的,根據(jù)本發(fā)明第一方面實施例提出了一種信息搜索方法,包括:獲得當(dāng)iu關(guān)鍵詞;以及根據(jù)所述當(dāng)如關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與所述當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,以用于在搜索結(jié)果頁中展現(xiàn)所述圖片集合中的圖片。
[0008]本發(fā)明實施例的信息搜索方法,根據(jù)獲得的當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,由于圖片集合中的圖片更多、更全,且與當(dāng)前關(guān)鍵詞的相關(guān)性較高,從而可以將符合用戶搜索需求的圖片展現(xiàn)給用戶,提高了用戶的搜索體驗度和滿意度,進(jìn)而方便用戶對相關(guān)圖片進(jìn)行瀏覽、點擊等操作。
[0009]為達(dá)上述目的,根據(jù)本發(fā)明第二方面實施例提出了一種信息搜索裝置,包括:第一獲得模塊,用于獲得當(dāng)前關(guān)鍵詞;以及第二獲得模塊,用于根據(jù)所述第一獲得模塊獲得的所述當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與所述當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,以用于在搜索結(jié)果頁中展現(xiàn)所述圖片集合中的圖片。
[0010]本發(fā)明實施例的信息搜索裝置,通過第一獲得模塊獲得當(dāng)前關(guān)鍵詞,通過第二獲得模塊根據(jù)第一獲得模塊獲得的當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,由于圖片集合中的圖片更多、更全,且與當(dāng)前關(guān)鍵詞的相關(guān)性較高,從而可以將符合用戶搜索需求的圖片展現(xiàn)給用戶,提高了用戶的搜索體驗度和滿意度,進(jìn)而方便用戶對相關(guān)圖片進(jìn)行瀏覽、點擊等操作。
[0011]本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
【專利附圖】
【附圖說明】
[0012]圖1a是本發(fā)明一個實施例的信息搜索方法流程圖。
[0013]圖1b是本發(fā)明另一個實施例的信息搜索方法流程圖。
[0014]圖2是本發(fā)明一個實施例建立并保存關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系的流程圖。
[0015]圖3是本發(fā)明一個實施例的信息搜索裝置的結(jié)構(gòu)示意圖。
[0016]圖4是本發(fā)明另一個實施例的信息搜索裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0017]下面詳細(xì)描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0018]下面參考附圖描述本發(fā)明實施例的信息搜索方法及裝置。
[0019]圖1a是本發(fā)明一個實施例的信息搜索方法流程圖,該方法從搜索引擎?zhèn)冗M(jìn)行描述。
[0020]如圖1a所示,該信息搜索方法包括:
[0021 ] SlOl,犾得當(dāng)如關(guān)鍵詞。
[0022]在該實施例中,用戶可以在搜索框中輸入查詢信息,客戶端獲得該查詢信息后,并從該查詢信息中獲得當(dāng)前關(guān)鍵詞,然后向搜索引擎發(fā)送當(dāng)前關(guān)鍵詞,這樣,搜索引擎就可以獲得當(dāng)前關(guān)鍵詞。
[0023]當(dāng)然,客戶端也可以通過其他方式獲得當(dāng)前關(guān)鍵詞,例如用戶在瀏覽網(wǎng)頁時,客戶端可以基于用戶瀏覽的網(wǎng)頁內(nèi)容提取出當(dāng)前關(guān)鍵詞,并向搜索引擎發(fā)送當(dāng)前關(guān)鍵詞等等。本發(fā)明實施例不對當(dāng)前關(guān)鍵詞的獲得方式進(jìn)行限定。
[0024]S102,根據(jù)當(dāng)如關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與當(dāng)ill關(guān)鍵詞相關(guān)的圖片集合,以用于在搜索結(jié)果頁中展現(xiàn)圖片集合中的圖片。
[0025]在該實施例中,在S102之前還可以包括SlOO:建立并保存關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,如圖1b所示。需要說明的是SlOO還可以位于SlOl和S102之間。
[0026]搜索引擎在獲得當(dāng)前查詢詞后,可以根據(jù)當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,并向客戶端返回該圖片集合,客戶端在收到該圖片集合后就可以在搜索結(jié)果頁中展現(xiàn)相關(guān)圖片。
[0027]具體地,建立并保存關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系可以如圖2所示,該實施例是基于獲取的大量樣本完成關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系的建立,該過程包括:
[0028]S201,抓取圖片,并獲取圖片對應(yīng)的文本特征和視覺特征。
[0029]具體地,可以抓取不同統(tǒng)一資源定位符(URL)中的圖片,并可以獲取對應(yīng)圖片的標(biāo)題、圖片描述、子鏈接和上下文信息中的一種或幾種,同時將獲取到的信息作為對應(yīng)的文本特征的一部分。
[0030]另外,還可以采用光學(xué)字符識別(OCR)技術(shù)識別對應(yīng)圖片中的文字信息和實體信息等,并可以將識別出的信息作為對應(yīng)的文本特征的一部分。
[0031]由此可見,圖片的文本特征可以包括對應(yīng)圖片的標(biāo)題、圖片描述、子鏈接、上下文信息以及對應(yīng)圖片中包含的文字和實體信息中的一種或幾種。
[0032]具體地,針對抓取到的每個圖片,可以將其轉(zhuǎn)換為第一向量,即可以用第一向量表示對應(yīng)的圖片,其中,第一向量的維度可以為N維。上述第一向量可以作為對應(yīng)圖片的視覺特征的一部分。
[0033]S202,獲得關(guān)鍵詞及關(guān)鍵詞的相關(guān)圖片,并提取相關(guān)圖片的文本特征和視覺特征。
[0034]在該實施例中,可以獲得關(guān)鍵詞,并搜索獲得該關(guān)鍵詞的相關(guān)圖片,然后提取相關(guān)圖片的文本特征和視覺特征。
[0035]其中,文本特征的提取方式與S201相同,具體的內(nèi)容也是對應(yīng)圖片的標(biāo)題、圖片描述、子鏈接、上下文信息以及對應(yīng)圖片中包含的文字和實體信息中的一種或幾種。
[0036]而對視覺特征的提取過程可以為:將該關(guān)鍵詞的相關(guān)圖片轉(zhuǎn)換為對應(yīng)的第二向量,即用第二向量表示該關(guān)鍵詞的相關(guān)圖片,其中,第一向量和第二向量具有相同的維度,例如均為N維。
[0037]S203,通過計算圖片的視覺特征和相關(guān)圖片的視覺特征間的相關(guān)性來獲得關(guān)鍵詞與圖片間的相關(guān)性。
[0038]在該實施例中,通過計算圖片的視覺特征和相關(guān)圖片的視覺特征間的相關(guān)性來獲得關(guān)鍵詞與圖片間的相關(guān)性,即通過計算第一向量和第二向量之間的相關(guān)性來獲得關(guān)鍵詞與圖片間的相關(guān)性。
[0039]S204,根據(jù)關(guān)鍵詞與圖片間的相關(guān)性以及關(guān)鍵詞的相關(guān)圖片和圖片文本特征之間的相關(guān)性獲得關(guān)鍵詞的相關(guān)圖片集合,并保存關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系。
[0040]需要說明的是,關(guān)鍵詞與圖片間的相關(guān)性僅僅是建立關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系的一個指標(biāo),即除了根據(jù)關(guān)鍵詞與圖片間的相關(guān)性,還可以根據(jù)不同圖片的文本特征之間的相關(guān)性來獲得相關(guān)圖片集合。這樣,保存的與關(guān)鍵詞相關(guān)的圖片更多、更全,且相關(guān)性高,有利于搜索引擎后續(xù)為用戶提高較好的搜索結(jié)果。
[0041]上述信息搜索方法,根據(jù)獲得的當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,由于圖片集合中的圖片更多、更全,且與當(dāng)前關(guān)鍵詞的相關(guān)性較高,從而可以將符合用戶搜索需求的圖片展現(xiàn)給用戶,提高了用戶的搜索體驗度和滿意度,進(jìn)而方便用戶對相關(guān)圖片進(jìn)行瀏覽、點擊等操作。
[0042]為了實現(xiàn)上述實施例,本發(fā)明還提出一種信息搜索裝置。
[0043]圖3是本發(fā)明一個實施例的信息搜索裝置的結(jié)構(gòu)示意圖。
[0044]如圖3所示,該信息搜索裝置包括第一獲得模塊31和第二獲得模塊32,其中:
[0045]第一獲得模塊31用于獲得當(dāng)前關(guān)鍵詞;第二獲得模塊32用于根據(jù)上述第一獲得模塊31獲得的上述當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與上述當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,以用于在搜索結(jié)果頁中展現(xiàn)上述圖片集合中的圖片。
[0046]在該實施例中,用戶可以在搜索框中輸入查詢信息,客戶端獲得該查詢信息后,并從該查詢信息中獲得當(dāng)前關(guān)鍵詞,然后向第一獲得模塊31發(fā)送當(dāng)前關(guān)鍵詞,這樣,第一獲得模塊31就可以獲得當(dāng)前關(guān)鍵詞。
[0047]當(dāng)然,客戶端也可以通過其他方式獲得當(dāng)前關(guān)鍵詞,例如用戶在瀏覽網(wǎng)頁時,客戶端可以基于用戶瀏覽的網(wǎng)頁內(nèi)容提取出當(dāng)前關(guān)鍵詞,并向第一獲得模塊31發(fā)送當(dāng)前關(guān)鍵詞等等。本發(fā)明實施例不對當(dāng)前關(guān)鍵詞的獲得方式進(jìn)行限定。
[0048]另外,為了使第二獲得模塊32可以獲得與當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,在該實施例中需要建立并保存關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系。因此,如圖4所示,該裝置還可以包括:建立保存模塊33,該建立保存模塊33用于在第二獲取模塊32根據(jù)所述當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與所述當(dāng)前關(guān)鍵詞相關(guān)的圖片集合之前,建立并保存所述關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系。
[0049]具體地,建立保存模塊33可以包括第一獲取單元331、第二獲取單元332、計算單元333和保存單元3334,其中:
[0050]第一獲取單元331用于抓取圖片,并獲取上述圖片對應(yīng)的文本特征和視覺特征;第二獲取單元332用于獲得關(guān)鍵詞及上述關(guān)鍵詞的相關(guān)圖片,并獲取上述相關(guān)圖片的文本特征和視覺特征;計算單元333用于通過計算上述圖片的視覺特征和相關(guān)圖片的視覺特征間的相關(guān)性來獲得上述關(guān)鍵詞與圖片間的相關(guān)性;保存單元3334用于根據(jù)計算單元333計算出的上述關(guān)鍵詞與圖片間的相關(guān)性以及上述關(guān)鍵詞的相關(guān)圖片和上述圖片文本特征之間的相關(guān)性獲得上述關(guān)鍵詞的相關(guān)圖片集合,并保存上述關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系O
[0051]具體地,第一獲取單元331可以抓取不同統(tǒng)一資源定位符(URL)中的圖片,并可以獲取對應(yīng)圖片的標(biāo)題、圖片描述、子鏈接和上下文信息中的一種或幾種,同時將獲取到的信息作為對應(yīng)的文本特征的一部分。
[0052]另外,第一獲取單元331還可以采用光學(xué)字符識別(OCR)技術(shù)識別對應(yīng)圖片中的文字信息和實體信息等,并可以將識別出的信息作為對應(yīng)的文本特征的一部分。
[0053]由此可見,圖片的文本特征可以包括對應(yīng)圖片的標(biāo)題、圖片描述、子鏈接、上下文信息以及對應(yīng)圖片中包含的文字和實體信息中的一種或幾種。
[0054]具體地,第一獲取單元331針對抓取到的每個圖片,可以將其轉(zhuǎn)換為第一向量,SP可以用第一向量表示對應(yīng)的圖片,其中,第一向量的維度可以為N維。上述第一向量可以作為對應(yīng)圖片的視覺特征的一部分。
[0055]同樣地,第二獲取單元332可以采用同第一獲取單元33同樣的提取方式獲取關(guān)鍵詞相關(guān)圖片的文本特征,具體的內(nèi)容也是對應(yīng)圖片的標(biāo)題、圖片描述、子鏈接、上下文信息以及對應(yīng)圖片中包含的文字和實體信息中的一種或幾種。
[0056]另外,第二獲取單元332可以將上述相關(guān)圖片轉(zhuǎn)換為對應(yīng)的第二向量;其中,上述第一向量和上述第二向量具有相同的維度,例如均為N維。
[0057]具體地,計算單元333通過計算上述圖片的視覺特征和相關(guān)圖片的視覺特征間的相關(guān)性來獲得關(guān)鍵詞與圖片間的相關(guān)性,即通過計算第一向量和第二向量之間的相關(guān)性來獲得關(guān)鍵詞與圖片間的相關(guān)性。
[0058]需要說明的是,關(guān)鍵詞與圖片間的相關(guān)性僅僅是建立關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系的一個指標(biāo),即除了根據(jù)關(guān)鍵詞與圖片間的相關(guān)性,還可以根據(jù)不同圖片的文本特征之間的相關(guān)性來獲得相關(guān)圖片集合。這樣,保存的與關(guān)鍵詞相關(guān)的圖片更多、更全,且相關(guān)性高,有利于搜索引擎后續(xù)為用戶提高較好的搜索結(jié)果。
[0059]上述信息搜索裝置,通過第一獲得模塊獲得當(dāng)前關(guān)鍵詞,通過第二獲得模塊根據(jù)第一獲得模塊獲得的當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,由于圖片集合中的圖片更多、更全,且與當(dāng)前關(guān)鍵詞的相關(guān)性較高,從而可以將符合用戶搜索需求的圖片展現(xiàn)給用戶,提高了用戶的搜索體驗度和滿意度,進(jìn)而方便用戶對相關(guān)圖片進(jìn)行瀏覽、點擊等操作。
[0060]在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不必須針對的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任一個或多個實施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特征進(jìn)行結(jié)合和組合。
[0061]此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個該特征。在本發(fā)明的描述中,“多個”的含義是至少兩個,例如兩個,三個等,除非另有明確具體的限定。
[0062]流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0063]在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實現(xiàn)在任何計算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說明書而言,"計算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個或多個布線的電連接部(電子裝置),便攜式計算機(jī)盤盒(磁裝置),隨機(jī)存取存儲器(RAM),只讀存儲器(R0M),可擦除可編輯只讀存儲器(EPR0M或閃速存儲器),光纖裝置,以及便攜式光盤只讀存儲器(⑶ROM)。另外,計算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因為可以例如通過對紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時以其他合適方式進(jìn)行處理來以電子方式獲得所述程序,然后將其存儲在計算機(jī)存儲器中。
[0064]應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。
[0065]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
[0066]此外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。
[0067]上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實施例進(jìn)行變化、修改、替換和變型。
【權(quán)利要求】
1.一種信息搜索方法,其特征在于,包括: 獲得當(dāng)前關(guān)鍵詞;以及 根據(jù)所述當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與所述當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,以用于在搜索結(jié)果頁中展現(xiàn)所述圖片集合中的圖片。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述根據(jù)所述當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與所述當(dāng)前關(guān)鍵詞相關(guān)的圖片集合之前,還包括: 建立并保存所述關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述建立并保存所述關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,包括: 抓取圖片,并獲取所述圖片對應(yīng)的文本特征和視覺特征; 獲得關(guān)鍵詞及所述關(guān)鍵詞的相關(guān)圖片,并獲取所述相關(guān)圖片的文本特征和視覺特征; 通過計算所述圖片的視覺特征和相關(guān)圖片的視覺特征間的相關(guān)性來獲得所述關(guān)鍵詞與圖片間的相關(guān)性;以及 根據(jù)所述關(guān)鍵詞與圖片間的相關(guān)性以及所述關(guān)鍵詞的相關(guān)圖片和所述圖片文本特征之間的相關(guān)性獲得所述關(guān)鍵詞的相關(guān)圖片集合,并保存所述關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取所述圖片對應(yīng)的視覺特征,包括:將所述圖片轉(zhuǎn)換為對應(yīng)的第一向量; 所述提取所述相關(guān)圖片的視覺特征,包括:將所述相關(guān)圖片轉(zhuǎn)換為對應(yīng)的第二向量,其中,所述第一向量和所述第二向量具有相同的維度。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述通過計算所述圖片的視覺特征和相關(guān)圖片的視覺特征間的相關(guān)性來獲得所述關(guān)鍵詞與圖片間的相關(guān),包括: 通過計算所述第一向量和所述第二向量之間的相關(guān)性來獲得所述關(guān)鍵詞與圖片間的相關(guān)性。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述文本特征包括對應(yīng)圖片的標(biāo)題、圖片描述、子鏈接、上下文信息以及對應(yīng)圖片中包含的文字和實體信息中的一種或幾種。
7.一種信息搜索裝置,其特征在于,包括: 第一獲得模塊,用于獲得當(dāng)前關(guān)鍵詞;以及 第二獲得模塊,用于根據(jù)所述第一獲得模塊獲得的所述當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與所述當(dāng)前關(guān)鍵詞相關(guān)的圖片集合,以用于在搜索結(jié)果頁中展現(xiàn)所述圖片集合中的圖片。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 建立保存模塊,用于在所述第二獲取模塊根據(jù)所述當(dāng)前關(guān)鍵詞和預(yù)存的關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系,獲得與所述當(dāng)前關(guān)鍵詞相關(guān)的圖片集合之前,建立并保存所述關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述建立保存模塊包括: 第一獲取單元,用于:抓取圖片,并獲取所述圖片對應(yīng)的文本特征和視覺特征; 第二獲取單元,用于:獲得關(guān)鍵詞及所述關(guān)鍵詞的相關(guān)圖片,并獲取所述相關(guān)圖片的文本特征和視覺特征; 計算單元,用于:通過計算所述圖片的視覺特征和相關(guān)圖片的視覺特征間的相關(guān)性來獲得所述關(guān)鍵詞與圖片間的相關(guān)性;以及 保存單元,用于根據(jù)所述關(guān)鍵詞與圖片間的相關(guān)性以及所述關(guān)鍵詞的相關(guān)圖片和所述圖片文本特征之間的相關(guān)性獲得所述關(guān)鍵詞的相關(guān)圖片集合,并保存所述關(guān)鍵詞與相關(guān)圖片集合的對應(yīng)關(guān)系。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第一獲取單元,具體用于:將所述圖片轉(zhuǎn)換為對應(yīng)的第一向量; 第二獲取單元,具體用于:將所述相關(guān)圖片轉(zhuǎn)換為對應(yīng)的第二向量;其中,所述第一向量和所述第二向量具有相同的維度。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述計算單元,具體用于: 通過計算所述第一向量和所述第二向量之間的相關(guān)性來獲得所述關(guān)鍵詞與圖片間的相關(guān)性。
12.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述文本特征包括對應(yīng)圖片的標(biāo)題、圖片描述、子鏈接、上下文信息以及對應(yīng)圖片中包含的文字和實體信息中的一種或幾種。
【文檔編號】G06F17/30GK104462590SQ201410844562
【公開日】2015年3月25日 申請日期:2014年12月30日 優(yōu)先權(quán)日:2014年12月30日
【發(fā)明者】秦首科, 韓友, 張澤明, 陳志揚, 程小華, 徐培治, 馬小林, 文石磊, 江焱, 陳世佳, 李旭斌 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司