本申請涉及計算機
技術領域:
,具體涉及互聯(lián)網(wǎng)
技術領域:
,尤其涉及基于線上到線下(o2o)模式的頁面提供方法和頁面提供裝置。
背景技術:
:o2o(onlinetooffline)是指將線下的實體店鋪與互聯(lián)網(wǎng)結合的一種技術。用戶可以通過o2o模式的在線網(wǎng)絡平臺瀏覽線下實體店及其產(chǎn)品或服務,并查詢滿足自身需求的線下實體店及其產(chǎn)品或服務。然而,當用戶通過在線網(wǎng)絡平臺進行這種查詢時,為了找到符合用戶需求的線下實體店鋪(或其產(chǎn)品、服務),通常需要用戶在網(wǎng)頁上設置各種篩選條件。作為這種查詢的結果,通常會向用戶呈現(xiàn)符合其需求的線下實體店鋪(或其產(chǎn)品、服務)的列表,而不會直接向用戶呈現(xiàn)其需要的線下實體店鋪(或其產(chǎn)品、服務)的頁面。技術實現(xiàn)要素:本申請的目的在于提供一種頁面提供方法和頁面提供裝置,來解決以上
背景技術:
部分提到的問題。在本申請的一個方面,提供了一種頁面提供方法,所述方法包括:接收用戶終端設備發(fā)送的檢索信息;從特征庫中篩選與所述檢索信息匹配的記錄;獲取與所篩選出的記錄對應的頁面;以及向所述用戶終端設備提供所獲取的頁面;其中,所述特征庫中的每條記錄為針對各頁面所提取的o2o特征,所述o2o特征為與線下實體店的產(chǎn)品或服務相關的信息??蛇x地,所述方法還包括:提取頁面上的o2o特征;將針對所述頁面所提取的o2o特征作為記錄存儲在所述特征庫中??蛇x地,所述提取頁面上的o2o特征包括:通過html解析來 提取所述頁面上的o2o特征??蛇x地,所述從特征庫中篩選與所述檢索信息匹配的記錄,包括:提取所述檢索信息中的關鍵詞并建立關鍵詞集;計算所述關鍵詞集與所述特征庫中的每條記錄的相似度;以及基于所計算出的相似度選擇與所述檢索信息匹配的記錄??蛇x地,所述提取所述檢索信息中的關鍵詞并建立關鍵詞集,包括:對所述檢索信息進行分解,以提取所述檢索信息中的所述關鍵詞;對于所提取出的關鍵詞進行擴展以生成擴展關鍵詞;基于所提取出的關鍵詞以及所生成的擴展關鍵詞建立所述關鍵詞集;其中,所述擴展關鍵詞包括所提取出的關鍵詞的同義詞、所提取出的關鍵詞的近義詞或其組合??蛇x地,所述計算所述關鍵詞集與所述特征庫中的每條記錄的相似度,包括:對于所述特征庫中的每條記錄的相應特征分配權重;基于所述權重計算所述關鍵詞集與所述特征庫中的每條記錄的相似度??蛇x地,所述o2o特征包括與所述線下實體店的產(chǎn)品或服務的地理位置、價格、有效期、評價或其組合有關的信息。在本申請的另一方面,提供了一種頁面提供裝置,所述頁面提供裝置包括:存儲單元,被配置成存儲特征庫,所述特征庫中的每條記錄為針對各頁面所提取的o2o特征;接收單元,被配置成接收從用戶終端發(fā)送的檢索信息;篩選單元,被配置成從所述特征庫中篩選與所述檢索信息匹配的記錄;頁面獲取單元,用于獲取與所篩選出的記錄對應的頁面;以及頁面提供單元,被配置成向所述用戶終端設備提供所獲取的頁面,其中,所述o2o特征為與線下實體店的產(chǎn)品或服務相關的信息??蛇x地,所述的頁面提供裝置還包括提取單元,所述提取單元被配置成提取頁面上的o2o特征??蛇x地,所述提取單元通過執(zhí)行html解析來提取所述頁面上的特征??蛇x地,所述篩選單元進一步被配置成包括:關鍵詞提取模塊,被配置成提取所述檢索信息中的關鍵詞并建立關鍵詞集;相似度計算 模塊,用于計算所述關鍵詞集與所述特征庫中的每條記錄之間的相似度;以及選擇模塊,用于基于所述相似度計算單元所計算出的相似度選擇與所述檢索信息匹配的記錄??蛇x地,所述關鍵詞提取模塊進一步被配置成:對所述檢索信息進行分解,以提取出所述檢索信息中的所述關鍵詞;對于所提取出的關鍵詞進行擴展以生成擴展關鍵詞;基于所提取出的關鍵詞以及所生成的擴展關鍵詞建立所述關鍵詞集;其中,所述擴展關鍵詞包括所提取出的關鍵詞的同義詞、所提取出的關鍵詞的近義詞或其組合??蛇x地,所述相似度計算模塊進一步被配置成:對于所述特征庫中的每條記錄的相應特征分配權重,并基于所述權重計算所述關鍵詞集與所述特征庫中的每條記錄的相似度??蛇x地,所述o2o特征包括與所述線下實體店的產(chǎn)品或服務的地理位置、價格、有效期、評價或其組合有關的信息。根據(jù)本申請所述的頁面提供方法和頁面提供裝置通過將用戶輸入的檢索信息與基于o2o頁面特征建立的特征庫中的每條記錄進行比較來直接篩選出用戶期望的頁面,提高了用戶檢索的準確性并且減少了用戶檢索所花費的時間。附圖說明通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優(yōu)點將會變得更明顯:圖1是本申請可以應用于其中的示例性系統(tǒng)架構圖。圖2示出了根據(jù)本申請的一個實施例的頁面提供方法的流程圖。圖3示出了圖2所示的頁面提供方法的子流程圖。圖4示出了根據(jù)本申請的一個實施例的頁面提供裝置的示意圖。圖5示出了圖4所示的頁面提供裝置的篩選單元的配置圖。圖6是適于用來實現(xiàn)本申請實施例的服務器的計算機系統(tǒng)的結構示意圖。具體實施方式下面結合附圖和實施例對本申請作進一步的詳細說明??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋相關發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關發(fā)明相關的部分。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。圖1示出了可以應用本申請的頁面提供方法或頁面提供裝置的實施例的示例性系統(tǒng)架構100。如圖1所示,系統(tǒng)架構100可以包括終端設備101、102、103,網(wǎng)絡104和服務器105。網(wǎng)絡104用以在終端設備101、102、103和服務器105之間提供通信鏈路的介質。網(wǎng)絡104可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。用戶可以使用終端設備101、102、103通過網(wǎng)絡104與服務器105交互,以接收或發(fā)送消息等。終端設備101、102、103上可以安裝有各種通訊客戶端應用,例如網(wǎng)頁瀏覽器應用、購物類應用、搜索類應用、即時通信工具、郵箱客戶端、社交平臺軟件等。終端設備101、102、103可以是具有顯示屏并且支持在線交易的各種電子設備,包括但不限于智能手機、平板電腦、電子書閱讀器、mp3播放器(movingpictureexpertsgroupaudiolayeriii,動態(tài)影像專家壓縮標準音頻層面3)、mp4(movingpictureexpertsgroupaudiolayeriv,動態(tài)影像專家壓縮標準音頻層面4)播放器、膝上型便攜計算機和臺式計算機等等。服務器105可以是提供各種服務的服務器,例如對終端設備101、102、103上顯示的網(wǎng)頁提供支持的后臺網(wǎng)頁服務器。后臺網(wǎng)頁服務器可以對接收到的網(wǎng)頁頁面請求等數(shù)據(jù)進行分析等處理,并將處理結果(例如網(wǎng)頁頁面數(shù)據(jù))反饋給終端設備。需要說明的是,本申請實施例所提供的頁面提供方法一般由服務器105執(zhí)行,相應地,頁面提供裝置一般設置于服務器105中。應該理解,圖1中的終端設備、網(wǎng)絡和服務器的數(shù)目僅僅是示意 性的。根據(jù)實現(xiàn)需要,可以具有任意數(shù)目的終端設備、網(wǎng)絡和服務器。以下參照圖2描述根據(jù)本申請的一個實施例的頁面提供方法。在步驟201中,接收用戶在終端設備的顯示屏上的檢索框內(nèi)所輸入的檢索語句。在步驟202中,從該頁面提供方法運行于其上的電子設備(例如圖1所示的服務器)的存儲單元中所存儲的特征庫中篩選與所接收到的檢索語句匹配的記錄。該特征庫中的每條記錄為針對終端設備上所顯示的各頁面所提取的o2o特征,其中,o2o特征為與線下實體店的產(chǎn)品或服務相關的信息。在本申請的一些實施例中,o2o特征包括與線下實體店的產(chǎn)品或服務的地理位置、價格、有效期、評價等有關的信息。例如,假設頁面上顯示的產(chǎn)品為“***店的雙人套餐”,該頁面上顯示有如下信息:該產(chǎn)品所在店的地理位置為北京市海淀區(qū)五道口華聯(lián)商城;該雙人套餐的價格為rmb200元;該雙人套餐的使用期為2016年1月1日至2016年2月1日;98%的顧客對該雙人套餐給出了好評等。因此,針對該頁面所提取的o2o特征為{雙人套餐、五道口華聯(lián)商城、rmb200、2016/1/1~2016/2/1、98%好評}。在本申請的一個實施例中,可以通過圖3所示的流程來實現(xiàn)步驟202。如圖3所示,在步驟301中,提取用戶輸入的檢索語句中所包括的關鍵詞。在本申請的一個實施例中,可以利用諸如全切分法對用戶輸入的檢索語句進行分解,以提取該檢索語句中所包括的所有關鍵詞。例如,假設用戶輸入的檢索語句為“五道口附近的最好的魯菜館”,則提取出的關鍵詞包括“五道口”、“最好”和“魯菜館”??蛇x地,可以對所提取出的關鍵詞進行擴展以生成擴展關鍵詞。例如,可以對所提取出的關鍵詞進行同義詞、近義詞或關聯(lián)詞擴展。在如上所述的示例中,可以將關鍵詞“魯菜館”擴展成為擴展關鍵詞“山東菜館”,將關鍵詞“最好”擴展成為擴展關鍵詞“最佳”。然后,基于所提取出的關鍵詞以及所生成的擴展關鍵詞建立關鍵 詞集。例如,在上述示例中,關鍵詞集為{五道口,最好,最佳,魯菜館,山東菜館}。接下來,在步驟302中,計算所建立的關鍵詞集與特征庫中的每條記錄的相似度??梢允褂孟蛄靠臻g余弦法(cosinesimilarity)、皮爾森相關系數(shù)(pearsoncorrelationcoefficient)法、jaccard相似系數(shù)(jaccardcoefficient)法等計算關鍵詞集與特征庫中的每條記錄的相似度。以下以jaccard相似系數(shù)法為例計算關鍵詞集與特征庫中的每條記錄的相似度。假定特征庫中存儲有如表1中所示的n個特征f1,f2…,fn-1,fn,用戶輸入的檢索語句為“五道口附近便宜的火鍋”。在此情況下,在步驟301中所提取的關鍵詞為“五道口”、“便宜”和“火鍋”。對關鍵詞“火鍋”進行擴展,獲得擴展關鍵詞“涮肉”、“麻辣燙”。因此,針對用戶輸入的檢索語句建立的關鍵詞集為v{五道口,便宜,火鍋,涮肉,麻辣燙}。特征店家名稱菜品口味地理位置有效期大眾評點f1海底撈火鍋家常牡丹園2016/1/1~2016/2/1服務好f2東來順火鍋家常五道口2016/1/1~2016/2/1好吃…………………fn-1陽坊涮肉家常五道口2016/1/1~2016/2/1便宜fn新辣道魚火鍋麻辣回龍觀2016/1/1~2016/2/1交通便利表1利用jaccard相似系數(shù)法,特征f1與v之間的相似度s1=|f1∩v|/|f1∪v|=1/11;特征f2與v之間的相似度s2=|f2∩v|/|f2∪v|=2/11;特征fn-1與v之間的相似度sn-1=|fn-1∩v|/|fn-1∪v|=3/11;特征fn與v之間的相似度sn=|fn∩v|/|fn∪v|=0/11。接下來,在步驟303中,根據(jù)所計算出的相似度,選擇特征庫中與用戶輸入的檢索語句匹配的記錄。在本申請的一個實施例中,選擇特征庫中與關鍵詞集相似度最高的特征。例如,在如上所示的示例中, 選擇特征fn-1??蛇x地,在步驟302中,可以對于特征庫中的每個特征的相應分量分配權重,并基于所分配的權重計算特征與關鍵詞集之間的相似度。例如,對于“海底撈”、“東來順”、“陽坊”、“新辣道”、“家?!?、“麻辣”、“牡丹園”、“回龍觀”、“服務好”、“便宜”、“好吃”、“交通便利”分配權重1,對于“火鍋”、“五道口”分配權重5,則s1~sn分別為5/15,10/19…,7/15,0。返回參照圖2,在步驟202中篩選出了與所接收到的檢索語句匹配的記錄之后,在步驟203中,獲取與所篩選出的記錄對應的頁面。在以上描述的示例中,獲取與fn-1(陽坊涮肉)匹配的頁面??梢曰趂n-1的各分量(“陽坊”,“涮肉”,“家常”,“五道口”,“2016/1/1~2016/2/1”以及“便宜”)通過使用常用的搜索引擎(諸如,百度搜索引擎或谷歌搜索引擎等)來搜索與fn-1匹配的頁面??蛇x地,為了提高處理速度,可以預先存儲有對應于特征庫中的各特征的頁面,從而使得在篩選出與所接收到的檢索語句匹配的記錄之后,基于該記錄的各分量從預先存儲的頁面中獲取對應于該記錄的頁面。在步驟204中,向用戶終端設備提供所獲取的頁面。在上述示例中,向用戶終端設備提供對應于fn-1(陽坊涮肉)的頁面,以供用戶使用??蛇x地,根據(jù)本申請的頁面提供方法還可以包括提取頁面上的o2o特征并將所提取的o2o特征存儲在存儲單元中所存儲的特征庫中。在本申請的一個實施例中,通過html解析獲得頁面上的o2o特征。然而,應當注意,本領域的技術人員根據(jù)本申請公開的內(nèi)容知道可以使用任何已知的頁面內(nèi)容抓取技術來提取頁面上的o2o特征。接下來,參照圖4描述根據(jù)本申請的一個實施例的頁面提供裝置。如圖4所示,根據(jù)本申請的一個實施例的頁面提供裝置400包括:存儲單元401、接收單元402、篩選單元403、頁面獲取單元404和頁面提供單元405。存儲單元401被配置成存儲特征庫,該特征庫中的每條記錄為針對各頁面所提取的o2o特征,其中,o2o特征為與線下實體店的產(chǎn)品或服務相關的信息,諸如以上表1中所示的特征f1,f2…,fn-1,fn。接收單元402被配置成接收用戶輸入的檢索語句。篩選單元403被配置成從存儲在存儲單元401中的特征庫中篩選與輸入的檢索語句匹配的記錄,即篩選單元403用于執(zhí)行圖2中的步驟202。在本申請的一個實施例中,篩選單元403可以被配置成執(zhí)行如圖3所示的流程。如圖5所示,在這種情況下,篩選單元403被配置成包括關鍵詞提取模塊4031、相似度計算模塊4032和選擇模塊4033。關鍵詞提取模塊4031用于提取用戶輸入的檢索語句中所包括的關鍵詞并建立關鍵詞集。以上已經(jīng)詳細說明了關鍵詞的提取方法和關鍵詞集的建立方法,在此不再贅述。相似度計算模塊4032用于計算關鍵詞集與特征庫中的每條記錄之間的相似度。以上已經(jīng)詳細說明了相似度的計算方法,在此不再贅述。選擇模塊4033用于基于相似度計算單元4032所計算出的相似度,選擇與所述檢索信息匹配的記錄。返回圖4,頁面獲取單元404被配置成基于篩選單元403所篩選出的記錄,獲取與所篩選出的記錄對應的頁面。即頁面獲取單元404用于執(zhí)行圖2中的步驟203。頁面提供單元405被配置成將所獲取的頁面提供給用戶終端設備,即頁面提供單元405用于執(zhí)行圖2中的步驟204??蛇x地,根據(jù)本申請的頁面提供裝置400還可以包括用于提取頁面上的o2o特征的提取單元406。提取單元406例如可以通過執(zhí)行html解析來提取頁面上的o2o特征。根據(jù)以上說明可知,根據(jù)本申請的頁面提供裝置和頁面提供方法通過將用戶輸入的檢索信息與基于o2o頁面特征建立的特征庫中的每條記錄進行比較來直接篩選出用戶期望的頁面,提高了用戶檢索的準確性并且減少了用戶檢索所花費的時間。下面參考圖6,其示出了適于用來實現(xiàn)本申請實施例的服務器的計算機系統(tǒng)600的結構示意圖。如圖6所示,計算機系統(tǒng)600包括中央處理單元(cpu)601,其 可以根據(jù)存儲在只讀存儲器(rom)602中的程序或者從存儲部分608加載到隨機訪問存儲器(ram)603中的程序而執(zhí)行各種適當?shù)膭幼骱吞幚?。在ram603中,還存儲有系統(tǒng)600操作所需的各種程序和數(shù)據(jù)。cpu601、rom602以及ram603通過總線604彼此相連。輸入/輸出(i/o)接口605也連接至總線604。cpu601通過調用存儲部分608中存儲的上述計算機程序,來具體實現(xiàn)本申請的方法中限定的頁面提供功能。以下部件連接至i/o接口605:包括鍵盤、鼠標等的輸入部分606;包括諸如陰極射線管(crt)、液晶顯示器(lcd)等以及揚聲器等的輸出部分607;包括硬盤等的存儲部分608;以及包括諸如lan卡、調制解調器等的網(wǎng)絡接口卡的通信部分609。通信部分609經(jīng)由諸如因特網(wǎng)的網(wǎng)絡執(zhí)行通信處理。驅動器610也根據(jù)需要連接至i/o接口605??刹鹦督橘|611,諸如磁盤、光盤、磁光盤、半導體存儲器等等,根據(jù)需要安裝在驅動器610上,以便于從其上讀出的計算機程序根據(jù)需要被安裝入存儲部分608。特別地,根據(jù)本公開的實施例,上文參考流程圖描述的過程可以被實現(xiàn)為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產(chǎn)品,其包括有形地包含在機器可讀介質上的計算機程序,所述計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分609從網(wǎng)絡上被下載和安裝,和/或從可拆卸介質611被安裝。在該計算機程序被中央處理單元(cpu)601執(zhí)行時,執(zhí)行本申請的方法中限定的上述功能。描述于本申請實施例中所涉及到的單元可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的單元也可以設置在處理器中,例如,可以描述為:一種處理器包括接收單元、篩選單元、頁面提供單元等,其中,這些單元的名稱在某種情況下并不構成對該單元本身的限定。作為另一方面,本申請還提供了一種非易失性計算機存儲介質,該非易失性計算機存儲介質可以是上述實施例中所述裝置中所包含的非易失性計算機存儲介質;也可以是單獨存在,未裝配入終端中的非 易失性計算機存儲介質。上述非易失性計算機存儲介質存儲有一個或者多個程序,當所述一個或者多個程序被一個設備執(zhí)行時,使得所述設備:接收用戶終端設備發(fā)送的檢索信息;從特征庫中篩選與所述檢索信息匹配的記錄;獲取與所篩選出的記錄對應的頁面;以及向所述用戶終端設備提供所獲取的頁面;其中,所述特征庫中的每條記錄為針對各頁面所提取的o2o特征,所述o2o特征為與線下實體店的產(chǎn)品或服務相關的信息。以上描述僅為本申請的較佳實施例以及對所運用技術原理的說明。本領域技術人員應當理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術特征的特定組合而成的技術方案,同時也應涵蓋在不脫離所述發(fā)明構思的情況下,由上述技術特征或其等同特征進行任意組合而形成的其它技術方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術特征進行互相替換而形成的技術方案。當前第1頁12