亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

網(wǎng)頁內(nèi)容的抓取方法及裝置、電子設(shè)備的制造方法_3

文檔序號:8223562閱讀:來源:國知局
元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本公開方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實施。
[0093]相應(yīng)的,本公開還提供一種網(wǎng)頁內(nèi)容的抓取裝置,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為:獲取對應(yīng)于當(dāng)前目標(biāo)網(wǎng)頁的抓取處理組件的內(nèi)容,并將所述抓取處理組件的內(nèi)容展示于終端屏幕上的第一顯示區(qū)域;調(diào)取第一服務(wù)器中預(yù)存儲的爬蟲引擎,并由所述爬蟲引擎驅(qū)動所述抓取處理組件來抓取所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容;接收所述第一服務(wù)器的返回數(shù)據(jù)并展示于所述終端屏幕上的第二顯示區(qū)域,其中所述返回數(shù)據(jù)包括:對所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容抓取結(jié)果的信息。
[0094]相應(yīng)的,本公開還提供一種終端,所述終端包括有存儲器,以及一個或者一個以上的程序,其中一個或者一個以上程序存儲于存儲器中,且經(jīng)配置以由一個或者一個以上處理器執(zhí)行所述一個或者一個以上程序包含用于進(jìn)行以下操作的指令:獲取對應(yīng)于當(dāng)前目標(biāo)網(wǎng)頁的抓取處理組件的內(nèi)容,并將所述抓取處理組件的內(nèi)容展示于終端屏幕上的第一顯示區(qū)域;調(diào)取第一服務(wù)器中預(yù)存儲的爬蟲引擎,并由所述爬蟲引擎驅(qū)動所述抓取處理組件來抓取所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容;接收所述第一服務(wù)器的返回數(shù)據(jù)并展示于所述終端屏幕上的第二顯示區(qū)域,其中所述返回數(shù)據(jù)包括:對所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容抓取結(jié)果的信息。
[0095]圖8是根據(jù)一示例性實施例示出的一種用于網(wǎng)頁內(nèi)容的抓取的裝置800的框圖。例如,裝置800可以被提供為一服務(wù)器。參照圖8,裝置800包括處理組件822,其進(jìn)一步包括一個或多個處理器,以及由存儲器832所代表的存儲器資源,用于存儲可由處理部件822的執(zhí)行的指令,例如應(yīng)用程序。存儲器832中存儲的應(yīng)用程序可以包括一個或一個以上的每一個對應(yīng)于一組指令的模塊。此外,處理組件822被配置為執(zhí)行指令,以執(zhí)行上述網(wǎng)頁內(nèi)容的抓取方法。
[0096]裝置800還可以包括一個電源組件826被配置為執(zhí)行裝置800的電源管理,一個有線或無線網(wǎng)絡(luò)接口 850被配置為將裝置800連接到網(wǎng)絡(luò),和一個輸入輸出(I/O)接口858。裝置800可以操作基于存儲在存儲器832的操作系統(tǒng),例如Windows ServerTM, MacOS XTM,UnixTM, LinuxTM,F(xiàn)reeBSDTM 或類似。
[0097]本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的公開后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
[0098]應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。
【主權(quán)項】
1.一種網(wǎng)頁內(nèi)容的抓取方法,其特征在于,包括: 獲取對應(yīng)于當(dāng)前目標(biāo)網(wǎng)頁的抓取處理組件的內(nèi)容,并將所述抓取處理組件的內(nèi)容展示于終端屏幕上的第一顯示區(qū)域; 調(diào)取第一服務(wù)器中預(yù)存儲的爬蟲引擎,并由所述爬蟲引擎驅(qū)動所述抓取處理組件來抓取所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容; 接收所述第一服務(wù)器的返回數(shù)據(jù)并展示于所述終端屏幕上的第二顯示區(qū)域,其中所述返回數(shù)據(jù)包括:對所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容抓取結(jié)果的信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取對應(yīng)于當(dāng)前目標(biāo)網(wǎng)頁的抓取處理組件的內(nèi)容,包括: 讀取存儲于本地的所述抓取處理組件的內(nèi)容; 或者,向存儲所述抓取處理組件的第二服務(wù)器發(fā)起訪問請求,并接收所述第二服務(wù)器返回的所述抓取處理組件的內(nèi)容。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 根據(jù)所述第一顯示區(qū)域內(nèi)檢測到的用戶操作,對所述抓取處理組件進(jìn)行編輯處理。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述第一顯示區(qū)域采用WebDAV協(xié)議實現(xiàn)所述編輯處理。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 提取所述返回數(shù)據(jù)中包含的對應(yīng)于所述當(dāng)前目標(biāo)網(wǎng)頁的已抓取內(nèi)容; 將所述已抓取內(nèi)容存儲至數(shù)據(jù)庫。
6.一種網(wǎng)頁內(nèi)容的抓取裝置,其特征在于,包括: 組件展示單元,用于獲取對應(yīng)于當(dāng)前目標(biāo)網(wǎng)頁的抓取處理組件的內(nèi)容,并將所述抓取處理組件的內(nèi)容展示于終端屏幕上的第一顯示區(qū)域; 引擎調(diào)取單元,用于調(diào)取第一服務(wù)器中預(yù)存儲的爬蟲引擎,并由所述爬蟲引擎驅(qū)動所述抓取處理組件來抓取所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容; 數(shù)據(jù)展示單元,用于接收所述第一服務(wù)器的返回數(shù)據(jù)并展示于所述終端屏幕上的第二顯示區(qū)域,其中所述返回數(shù)據(jù)包括:對所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容抓取結(jié)果的信息。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述組件展示單元包括本地讀取子單元或內(nèi)容請求子單元,其中: 所述本地讀取子單元,用于讀取存儲于本地的所述抓取處理組件的內(nèi)容; 所述內(nèi)容請求子單元,用于向存儲所述抓取處理組件的第二服務(wù)器發(fā)起訪問請求,并接收所述第二服務(wù)器返回的所述抓取處理組件的內(nèi)容。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 組件編輯單元,用于根據(jù)所述第一顯示區(qū)域內(nèi)檢測到的用戶操作,對所述抓取處理組件進(jìn)行編輯處理。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第一顯示區(qū)域采用WebDAV協(xié)議實現(xiàn)所述編輯處理。
10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 內(nèi)容提取單元,用于提取所述返回數(shù)據(jù)中包含的對應(yīng)于所述當(dāng)前目標(biāo)網(wǎng)頁的已抓取內(nèi)容; 內(nèi)容存儲單元,用于將所述已抓取內(nèi)容存儲至數(shù)據(jù)庫。
11.一種電子設(shè)備,其特征在于,包括: 處理器; 用于存儲處理器可執(zhí)行指令的存儲器; 其中,所述處理器被配置為: 獲取對應(yīng)于當(dāng)前目標(biāo)網(wǎng)頁的抓取處理組件的內(nèi)容,并將所述抓取處理組件的內(nèi)容展示于終端屏幕上的第一顯示區(qū)域; 調(diào)取第一服務(wù)器中預(yù)存儲的爬蟲引擎,并由所述爬蟲引擎驅(qū)動所述抓取處理組件來抓取所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容; 接收所述第一服務(wù)器的返回數(shù)據(jù)并展示于所述終端屏幕上的第二顯示區(qū)域,其中所述返回數(shù)據(jù)包括:對所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容抓取結(jié)果的信息。
【專利摘要】本公開是關(guān)于網(wǎng)頁內(nèi)容的抓取方法及裝置、電子設(shè)備,包括:獲取對應(yīng)于當(dāng)前目標(biāo)網(wǎng)頁的抓取處理組件的內(nèi)容,并將所述抓取處理組件的內(nèi)容展示于終端屏幕上的第一顯示區(qū)域;調(diào)取第一服務(wù)器中預(yù)存儲的爬蟲引擎,并由所述爬蟲引擎驅(qū)動所述抓取處理組件來抓取所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容;接收所述第一服務(wù)器的返回數(shù)據(jù)并展示于所述終端屏幕上的第二顯示區(qū)域,其中所述返回數(shù)據(jù)包括:對所述當(dāng)前目標(biāo)網(wǎng)頁的內(nèi)容抓取結(jié)果的信息。通過本公開的技術(shù)方案,可以對內(nèi)容抓取結(jié)果進(jìn)行可視化展示,便于用戶查看和管理。
【IPC分類】H04L29-06, G06F3-0481, G06F17-30
【公開號】CN104537040
【申請?zhí)枴緾N201410816040
【發(fā)明人】于勝軍, 馬哲, 譚國斌
【申請人】小米科技有限責(zé)任公司
【公開日】2015年4月22日
【申請日】2014年12月23日
當(dāng)前第3頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1