專利名稱:一種在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明提供了一種在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法及裝置,屬于網(wǎng)頁內(nèi)容聚合技術(shù)領(lǐng)域。
背景技術(shù):
在用戶在上網(wǎng)的時(shí)候,經(jīng)常會(huì)關(guān)注多個(gè)網(wǎng)站的內(nèi)容,如果沒有網(wǎng)頁信息聚合,那么當(dāng)用戶在想要查看他關(guān)注的信息的時(shí)候,只能去瀏覽每個(gè)網(wǎng)站,直到瀏覽結(jié)束,整個(gè)過程如圖1所示。為了解決這個(gè)問題,現(xiàn)在的瀏覽器一般都引入了聚合的功能,通過訂閱網(wǎng)站提供的RSS(Really Simple Syndicatio,簡易信息聚合)或者Atom(基于XML的文檔格式以及基于HTTP的協(xié)議,用于為 站點(diǎn)和客戶工具提供聚合網(wǎng)絡(luò)內(nèi)容),將用戶關(guān)注的信息拉取到本地并組合在一起,聚合的過程如圖2所示。但是通過這種方式去聚合資源時(shí),如果網(wǎng)站沒有提供RSS或者ATOM的訂閱,那么就沒有辦法將這些信息聚合在瀏覽器中,必須訪問相應(yīng)的網(wǎng)站才能瀏覽相應(yīng)的內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明為解決現(xiàn)有的瀏覽器的網(wǎng)頁內(nèi)容聚合技術(shù)中存在的若沒有將訪問的內(nèi)容聚合在瀏覽器中,則必須訪問相應(yīng)的網(wǎng)站才能瀏覽相應(yīng)的內(nèi)容的問題,進(jìn)而提供了一種在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法及裝置。一種在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法,包括:根據(jù)用戶選定的信息源生成信息源標(biāo)識符;通過預(yù)定的方法對所述信息源標(biāo)識符對應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析,提取相應(yīng)的網(wǎng)頁內(nèi)容并保存,當(dāng)用戶打開瀏覽器的信息聚合頁時(shí),讀取并顯示所述相應(yīng)的網(wǎng)頁內(nèi)容。一種在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的裝置,包括:標(biāo)識符生成模塊,用于根據(jù)用戶選定的信息源生成信息源標(biāo)識符;聚合展現(xiàn)模塊,用于通過預(yù)定的方法對所述信息源標(biāo)識符對應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析,提取相應(yīng)的網(wǎng)頁內(nèi)容并保存,當(dāng)用戶打開瀏覽器的信息聚合頁時(shí),讀取并顯示所述相應(yīng)的網(wǎng)頁內(nèi)容。由上述本發(fā)明提供的技術(shù)方案可以看出,通過對網(wǎng)頁內(nèi)容進(jìn)行分析,提取相應(yīng)的網(wǎng)頁內(nèi)容保存及為用戶顯示,即使相應(yīng)的網(wǎng)站沒有提供RSS或者ATOM的訂閱,也能夠?qū)崿F(xiàn)將相應(yīng)的網(wǎng)頁內(nèi)容聚合在瀏覽器,而無需用戶訪問每一個(gè)網(wǎng)站。
圖1是現(xiàn)有技術(shù)中用戶瀏覽每個(gè)網(wǎng)站直至瀏覽結(jié)束的流程示意圖;圖2是現(xiàn)有技術(shù)中通過內(nèi)容訂閱將網(wǎng)頁內(nèi)容聚合的流程示意圖;圖3是本發(fā)明具體實(shí)施方式
提供的在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法的流程不意圖;圖4是本發(fā)明具體實(shí)施方式
提供的騰訊首頁中各個(gè)區(qū)域的標(biāo)識示意圖;圖5是本發(fā)明具體實(shí)施方式
提供的加入爬蟲分析之后的生成聚合頁的流程示意圖;圖6是本發(fā)明具體實(shí)施方式
提供的在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明具體 實(shí)施方式提供了一種在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法,包括根據(jù)用戶選定的信息源生成信息源標(biāo)識符;通過預(yù)定的方法對信息源標(biāo)識符對應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析,提取相應(yīng)的網(wǎng)頁內(nèi)容并保存,當(dāng)用戶打開瀏覽器的信息聚合頁時(shí),讀取并顯示相應(yīng)的網(wǎng)頁內(nèi)容。下面以對某不支持內(nèi)容訂閱的網(wǎng)站的內(nèi)容聚合展現(xiàn)方法為例并結(jié)合說明書附圖對本具體實(shí)施方式
作具體說明,如圖3所示,相應(yīng)的在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法包括:步驟31,根據(jù)用戶選定的信息源生成信息源標(biāo)識符。由于現(xiàn)有的一些網(wǎng)站沒有提供RSS或者ATOM的訂閱,那么就沒有辦法將這些信息聚合在瀏覽器中,當(dāng)用戶在想要查看關(guān)注的信息的時(shí)候,只能去瀏覽每個(gè)網(wǎng)站。例如騰訊首頁的今日新聞,這個(gè)信息由于沒有提供訂閱,所以如果用戶想要查看這個(gè)信息,只有訪問騰訊首頁才可以查看其內(nèi)容。具體的,現(xiàn)有的大部分網(wǎng)頁都由多個(gè)區(qū)域嵌套而成,而這些區(qū)域都會(huì)有一個(gè)自己的名稱或者標(biāo)識,這個(gè)標(biāo)識可以是網(wǎng)頁元素的id、className甚至是在這個(gè)區(qū)域內(nèi)的元素序號。以騰訊網(wǎng)為例,如圖4所示,在騰訊網(wǎng)頁面中每一個(gè)小區(qū)域都有一個(gè)標(biāo)識,所以一旦用戶選定了網(wǎng)頁中一個(gè)自己關(guān)注的網(wǎng)頁區(qū)域,那么就可以通過這個(gè)標(biāo)識來唯一表示這一個(gè)區(qū)域。每個(gè)區(qū)域中都有若干個(gè)包括鏈接或地址的信息源。例如,騰訊網(wǎng)第一行的標(biāo)識是STextNav,第二行搜索的標(biāo)識是#S0S0,左下角新聞中心的標(biāo)識是#NeWSInfo,右側(cè)今日話題的標(biāo)識是#txArea。在用戶選定了騰訊網(wǎng)的某個(gè)信息源之后,例如用戶選定了左下角的新聞中心,騰訊網(wǎng)的服務(wù)器則需要根據(jù)用戶選擇的新聞中心生成一個(gè)網(wǎng)絡(luò)上可以唯一標(biāo)識這個(gè)信息源的標(biāo)識符,即新聞中心的SNewsInf0標(biāo)識,這個(gè)標(biāo)識符可以使用URL加元素路徑來標(biāo)識,但是并不局限于這種方式,這里只是一個(gè)舉例。例如,需要保存新聞區(qū)域時(shí),就可以建立一個(gè)這樣的對應(yīng)關(guān)系:
權(quán)利要求
1.一種在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法,其特征在于,包括: 根據(jù)用戶選定的信息源生成信息源標(biāo)識符; 通過預(yù)定的方法對所述信息源標(biāo)識符對應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析,提取相應(yīng)的網(wǎng)頁內(nèi)容并保存,當(dāng)用戶打開瀏覽器的信息聚合頁時(shí),讀取并顯示所述相應(yīng)的網(wǎng)頁內(nèi)容。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述信息源標(biāo)識符通過URL與元素路徑相結(jié)合進(jìn)行標(biāo)識。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對所述信息源標(biāo)識符對應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析包括: 通過在HTML網(wǎng)頁中相應(yīng)的網(wǎng)頁內(nèi)容的鏈接或列表中查找相應(yīng)的標(biāo)簽,以提取相應(yīng)的網(wǎng)頁內(nèi)容。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對所述信息源標(biāo)識符對應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析包括: 根據(jù)所述信息源標(biāo)識符配置相應(yīng)的網(wǎng)頁內(nèi)容抓取方法,通過所述抓取方法對所述相應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析,以提取相應(yīng)的網(wǎng)頁內(nèi)容。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述讀取并顯示所述相應(yīng)的網(wǎng)頁內(nèi)容包括: 顯示所述相應(yīng)的網(wǎng)頁內(nèi)容,或者,顯示全部網(wǎng)頁內(nèi)容并將所述相應(yīng)的網(wǎng)頁內(nèi)容以外的網(wǎng)頁內(nèi)容隱藏或刪除。
6.一種在瀏覽器中將網(wǎng)頁`內(nèi)容聚合展現(xiàn)的裝置,其特征在于,包括: 標(biāo)識符生成模塊,用于根據(jù)用戶選定的信息源生成信息源標(biāo)識符; 聚合展現(xiàn)模塊,用于通過預(yù)定的方法對所述信息源標(biāo)識符對應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析,提取相應(yīng)的網(wǎng)頁內(nèi)容并保存,當(dāng)用戶打開瀏覽器的信息聚合頁時(shí),讀取并顯示所述相應(yīng)的網(wǎng)頁內(nèi)容。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,在標(biāo)識符生成模塊中,所述信息源標(biāo)識符通過URL與元素路徑相結(jié)合進(jìn)行標(biāo)識。
8.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,在聚合展現(xiàn)模塊中包括: 第一內(nèi)容提取子模塊,用于通過在HTML網(wǎng)頁中相應(yīng)的網(wǎng)頁內(nèi)容的鏈接或列表中查找相應(yīng)的標(biāo)簽,以提取相應(yīng)的網(wǎng)頁內(nèi)容。
9.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,在聚合展現(xiàn)模塊中還包括: 第二內(nèi)容提取子模塊,用于根據(jù)所述信息源標(biāo)識符配置相應(yīng)的網(wǎng)頁內(nèi)容抓取方法,通過所述抓取方法對所述相應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析,以提取相應(yīng)的網(wǎng)頁內(nèi)容。
10.根據(jù)權(quán)利要求1所述的裝置,其特征在于,在聚合展現(xiàn)模塊中還包括: 信息顯示子模塊,用于顯示所述相應(yīng)的網(wǎng)頁內(nèi)容,或者,顯示全部網(wǎng)頁內(nèi)容并將所述相應(yīng)的網(wǎng)頁內(nèi)容以外的網(wǎng)頁內(nèi)容隱藏或刪除。
全文摘要
本發(fā)明提供了一種在瀏覽器中將網(wǎng)頁內(nèi)容聚合展現(xiàn)的方法,包括根據(jù)用戶選定的信息源生成信息源標(biāo)識符;通過預(yù)定的方法對所述信息源標(biāo)識符對應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行分析,提取相應(yīng)的網(wǎng)頁內(nèi)容并保存,當(dāng)用戶打開瀏覽器的信息聚合頁時(shí),讀取并顯示所述相應(yīng)的網(wǎng)頁內(nèi)容。本發(fā)明通過對網(wǎng)頁內(nèi)容進(jìn)行分析,提取相應(yīng)的網(wǎng)頁內(nèi)容保存及為用戶顯示,即使相應(yīng)的網(wǎng)站沒有提供RSS或者ATOM的訂閱,也能夠?qū)崿F(xiàn)將相應(yīng)的網(wǎng)頁內(nèi)容聚合在瀏覽器,而無需用戶訪問每一個(gè)網(wǎng)站。
文檔編號G06F17/30GK103246680SQ20121003148
公開日2013年8月14日 申請日期2012年2月13日 優(yōu)先權(quán)日2012年2月13日
發(fā)明者蔣進(jìn)舟, 滕躍龍 申請人:騰訊科技(深圳)有限公司