亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種翻譯網(wǎng)絡(luò)信息的方法及翻譯系統(tǒng)的制作方法

文檔序號:6550932閱讀:244來源:國知局
一種翻譯網(wǎng)絡(luò)信息的方法及翻譯系統(tǒng)的制作方法
【專利摘要】一種翻譯網(wǎng)絡(luò)信息的方法,包括:獲取目標(biāo)元素鏈接的目標(biāo)頁面的源代碼;獲取所述源代碼中的數(shù)據(jù)內(nèi)容;將獲取到的所述數(shù)據(jù)內(nèi)容按照用戶設(shè)定的目標(biāo)語言進(jìn)行翻譯;建立數(shù)據(jù)窗口顯示經(jīng)過所述翻譯后得到的譯文。本發(fā)明還公開了一種翻譯系統(tǒng)。本發(fā)明無需用戶在手動將文本導(dǎo)入到翻譯引擎,實(shí)現(xiàn)自動翻譯,提高用戶瀏覽頁面的效率,簡便的用戶操作,改善了用戶體驗(yàn)。
【專利說明】一種翻譯網(wǎng)絡(luò)信息的方法及翻譯系統(tǒng)

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)信息【技術(shù)領(lǐng)域】,尤其是涉及一種翻譯網(wǎng)絡(luò)信息的方法及翻譯系 統(tǒng)。

【背景技術(shù)】
[0002] 對于現(xiàn)在的網(wǎng)站來說,一個(gè)網(wǎng)頁上加載了大量的各種信息,例如頁面的正文、各種 廣告、相關(guān)新聞等等;但是對于用戶來講許多信息是用戶所不關(guān)注的,因此可以將頁面的正 文作為有效信息,而其他信息則是無效信息,對于一些用戶來說只需要查看有效信息,而無 效信息的存在首先會加大用戶所使用的設(shè)備的工作量,造成設(shè)備處理效率慢的問題,再有 無效信息也會妨礙用戶對有效信息的瀏覽。
[0003] 目前,許多用戶在瀏覽網(wǎng)頁的過程中,由于語言能力導(dǎo)致用戶無法理解,又或者用 戶需要目標(biāo)頁面的譯文時(shí),往往是通過用戶手動將所需查看的內(nèi)容導(dǎo)入到網(wǎng)絡(luò)翻譯引擎中 進(jìn)行翻譯,用戶操作復(fù)雜,影響用戶查看理解瀏覽網(wǎng)絡(luò)信息。


【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的之一是提供一種翻譯網(wǎng)絡(luò)信息的方法,以解決現(xiàn)有技術(shù)中需要用戶 手動將待譯文本導(dǎo)入到網(wǎng)絡(luò)翻譯引擎的問題。
[0005] 在一些說明性實(shí)施例中,所述翻譯網(wǎng)絡(luò)信息的方法,包括:獲取目標(biāo)元素鏈接的目 標(biāo)頁面的源代碼;獲取所述源代碼中的數(shù)據(jù)內(nèi)容;將獲取到的所述數(shù)據(jù)內(nèi)容按照用戶設(shè)定 的目標(biāo)語言進(jìn)行翻譯;建立數(shù)據(jù)窗口顯示經(jīng)過所述翻譯后得到的譯文。
[0006] 本發(fā)明的再一個(gè)目的是提供一種翻譯系統(tǒng)。
[0007] 在一些說明性實(shí)施例中,所述翻譯系統(tǒng),包括:信息收集模塊,用于獲取目標(biāo)頁面 的源代碼中的數(shù)據(jù)內(nèi)容;文本選取模塊,用于選取所述數(shù)據(jù)內(nèi)容中的文本數(shù)據(jù);超文本選 取模塊,用于選取所述數(shù)據(jù)內(nèi)容的超文本數(shù)據(jù);信息展示模塊,用于建立數(shù)據(jù)窗口顯示所述 文本數(shù)據(jù)、所述文本數(shù)據(jù)的譯文、以及超文本數(shù)據(jù);翻譯引擎和翻譯語料庫,用于翻譯所述 文本數(shù)據(jù),并將其譯文傳輸給信息展示模塊;以及,展示配置模塊和基數(shù)數(shù)據(jù)庫,用于接收 并存儲用戶設(shè)置的配置信息;其中,所述配置信息中至少包含有以下之一:所述數(shù)據(jù)窗口 的大小、透明度、顏色樣式、主從窗口,以及所述文本數(shù)據(jù)的目標(biāo)語言。
[0008] 與現(xiàn)有技術(shù)相比,本發(fā)明的說明性實(shí)施例包括以下優(yōu)點(diǎn):
[0009] 自動將用戶所需查看的目標(biāo)頁面中的數(shù)據(jù)內(nèi)容進(jìn)行翻譯,無需用戶手動導(dǎo)入,提 高了用戶查看瀏覽頁面的效率,簡化的用戶操作,改善了用戶體驗(yàn)。

【專利附圖】

【附圖說明】
[0010] 此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā) 明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0011] 圖1是按照本發(fā)明的說明性實(shí)施例的流程圖。
[0012] 圖2是按照本發(fā)明的說明性實(shí)施例的流程圖;
[0013] 圖3是按照本發(fā)明的說明性實(shí)施例的翻譯系統(tǒng)的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0014] 在以下詳細(xì)描述中,提出大量特定細(xì)節(jié),以便于提供對本發(fā)明的透徹理解。但是, 本領(lǐng)域的技術(shù)人員會理解,即使沒有這些特定細(xì)節(jié)也可實(shí)施本發(fā)明。在其它情況下,沒有詳 細(xì)描述眾所周知的方法、過程、組件和電路,以免影響對本發(fā)明的理解。
[0015] 現(xiàn)在參照圖1,圖1示出了在一些說明性實(shí)施例中的流程圖。
[0016] 如圖1所示,在一些說明性實(shí)施例中,公開了一種翻譯網(wǎng)絡(luò)信息的方法,包括:
[0017] S11、獲取目標(biāo)元素鏈接的目標(biāo)頁面的源代碼;
[0018] 其中,元素是指頁面中的標(biāo)題所對應(yīng)的該頁面的源代碼中的相應(yīng)的元素;標(biāo)題對 應(yīng)的元素在源代碼中存在訪問該標(biāo)題的頁面的超鏈接,通過超鏈接對應(yīng)的網(wǎng)絡(luò)地址可以訪 問到目標(biāo)頁面。
[0019] S12、獲取所述源代碼中的數(shù)據(jù)內(nèi)容;
[0020] 其中,數(shù)據(jù)內(nèi)容是指網(wǎng)頁中的標(biāo)題、正文、以及相關(guān)的圖片、圖表等主題相關(guān)的有 效信息。
[0021] S13、將獲取到的所述數(shù)據(jù)內(nèi)容按照用戶設(shè)定的目標(biāo)語言進(jìn)行翻譯;
[0022] S14、建立數(shù)據(jù)窗口顯示經(jīng)過所述翻譯后得到的譯文。
[0023] 自動將用戶所需查看的目標(biāo)頁面中的數(shù)據(jù)內(nèi)容進(jìn)行翻譯,無需用戶手動導(dǎo)入,提 高了用戶查看瀏覽頁面的效率,簡化的用戶操作,改善了用戶體驗(yàn)。
[0024] 在一些說明性實(shí)施例中,將獲取到的所述數(shù)據(jù)內(nèi)容按照用戶設(shè)定的目標(biāo)語言進(jìn)行 翻譯,包括:
[0025] 將獲取到的所述數(shù)據(jù)內(nèi)容作為待譯文件進(jìn)行存儲;
[0026] 將存儲后的所述待譯文件推送給翻譯引擎進(jìn)行翻譯。其中,翻譯引擎可以是機(jī)器 翻譯引擎,也可以是基于譯員的翻譯系統(tǒng);機(jī)器翻譯引擎例如在線翻譯引擎,例如谷歌、有 道等。
[0027] 優(yōu)選地,根據(jù)獲取到的數(shù)據(jù)內(nèi)容建立待譯文件,存儲在數(shù)據(jù)庫中,再將待譯文件從 數(shù)據(jù)庫中提取給翻譯引擎進(jìn)行翻譯
[0028] 在一些說明性實(shí)施例中,在獲取目標(biāo)元素鏈接的目標(biāo)頁面的源代碼之前,還包 括:
[0029] 確定所述當(dāng)前頁面的所有標(biāo)題數(shù)據(jù),以及每個(gè)所述標(biāo)題數(shù)據(jù)在當(dāng)前頁面的源代碼 中對應(yīng)的元素,以及所述元素的超鏈接;其中,標(biāo)題數(shù)據(jù)可以是具有標(biāo)題性質(zhì)的文本數(shù)據(jù)和 超文本數(shù)據(jù),例如具有超鏈接的標(biāo)題或圖片;
[0030] 建立每個(gè)所述標(biāo)題數(shù)據(jù)的區(qū)域數(shù)據(jù);
[0031] 建立每個(gè)所述標(biāo)題數(shù)據(jù)的所述區(qū)域數(shù)據(jù)與該標(biāo)題數(shù)據(jù)的所述元素的超鏈接的關(guān) 聯(lián)關(guān)系。
[0032] 如圖2所示,在一些說明性實(shí)施例中,獲取目標(biāo)元素鏈接的目標(biāo)頁面的源代碼的 過程,包括:
[0033] S21、識別光標(biāo)在當(dāng)前頁面上指示的區(qū)域數(shù)據(jù);
[0034] 當(dāng)用戶拖動光標(biāo)在網(wǎng)頁上移動時(shí),用戶將光標(biāo)停留在用戶所要查看的標(biāo)題上,在 停留時(shí)間超過時(shí)間閾值時(shí),確定當(dāng)前光標(biāo)所處的區(qū)域?yàn)槟繕?biāo)區(qū)域。
[0035] S22、確定所述區(qū)域數(shù)據(jù)關(guān)聯(lián)的目標(biāo)元素;
[0036] 元素是指頁面中的標(biāo)題所對應(yīng)的該頁面的源代碼中的相應(yīng)的元素;標(biāo)題對應(yīng)的元 素在源代碼中存在訪問該標(biāo)題的頁面的超鏈接,通過超鏈接對應(yīng)的網(wǎng)絡(luò)地址可以訪問到目 標(biāo)頁面。
[0037] S23、調(diào)取所述目標(biāo)元素鏈接的目標(biāo)頁面的源代碼。
[0038] 在一些說明性實(shí)施例中,步驟S12中獲取所述源代碼中的數(shù)據(jù)內(nèi)容的過程,過程:
[0039] 從目標(biāo)頁面的源代碼中的特定標(biāo)簽下的數(shù)據(jù)內(nèi)容。
[0040] 其中,特定標(biāo)簽至少包括以下之一:
[0041] 1)、<h>〈/h> ;標(biāo)題標(biāo)簽;用于標(biāo)記文本標(biāo)題;
[0042] 2)、<a>〈/a> ;超文本鏈接標(biāo)簽,用于標(biāo)記超文本數(shù)據(jù)信息的鏈接;
[0043] 3)、<span>〈/span> ;文本標(biāo)簽,用于標(biāo)記文本,例如正文;
[0044] 4)、<img>〈/img> ;屬性標(biāo)簽,用于標(biāo)簽文本或超文本的屬性特征;
[0045] 5)、<p>〈/p> ;段落標(biāo)簽,用于標(biāo)記文本或超文本行號段落。
[0046] 通過特定標(biāo)簽獲取有效信息,可以有效的過濾掉頁面中的無效信息,便于用戶瀏 覽有效信息,并且用戶設(shè)備只需要加載有效信息,并進(jìn)行顯示,大大減小了用戶設(shè)備的工作 量,進(jìn)而可以提供用戶設(shè)備的工作效率。
[0047] 在一些說明性實(shí)施例中,對于與標(biāo)題對應(yīng)的文本信息和圖片信息使用的是一類特 定的標(biāo)簽,例如標(biāo)題標(biāo)簽<h>〈/h>、超文本鏈接標(biāo)簽<a>〈/a>、文本標(biāo)簽〈span>〈/span>、屬 性標(biāo)簽<img>〈/img>和段落標(biāo)簽<p>〈/p>等等;
[0048] 其中,每個(gè)標(biāo)簽具有一個(gè)標(biāo)簽頭和一個(gè)標(biāo)簽尾,位于兩者之間的數(shù)據(jù)即為該標(biāo)簽 所對應(yīng)的數(shù)據(jù)內(nèi)容;例如網(wǎng)頁源代碼片段"〈h2>-笨拙的手,畫下自由而不會流淚的眼睛 </h2>";所采用的是二級標(biāo)題標(biāo)簽<h2X/h2> ;標(biāo)簽頭為<h2>,標(biāo)簽尾為</h2> ;〈h2>……〈/ h2>之間的文本就是該網(wǎng)頁中的二級標(biāo)題"笨拙的手,畫下自由而不會流淚的眼睛";
[0049] 通過采用特定標(biāo)簽檢索目標(biāo)頁面的源代碼,可以找到用戶所關(guān)注的有效信息,再 將檢索到的標(biāo)簽的標(biāo)簽頭和標(biāo)簽尾之間的數(shù)據(jù)內(nèi)容提取出來。
[0050] 在一些說明性實(shí)施例中,提取所述數(shù)據(jù)內(nèi)容的過程,包括:
[0051] 在所述源代碼中建立并記錄每個(gè)所述特定標(biāo)簽的標(biāo)簽頭和標(biāo)簽尾的二維坐標(biāo) (Xn, Yn);
[0052] 其中,二維坐標(biāo)(Χη,Υη)中的橫坐標(biāo)XjP縱坐標(biāo)¥"分別為特定標(biāo)簽η的標(biāo)簽頭或 標(biāo)簽尾在所述源代碼中的列號和行號。
[0053] 例如段落標(biāo)簽找建立坐標(biāo)起始點(diǎn),標(biāo)簽頭<ρ>所在的行號第15行,所在的列號為 第3列,則該標(biāo)簽頭的二維坐標(biāo)為(3,15);標(biāo)簽尾</ρ>所在的行號為第15行,所在的列號 為第20列,則該標(biāo)簽尾的二維坐標(biāo)為(20, 15);記錄下兩個(gè)二維坐標(biāo),通過坐標(biāo)在源代碼中 索引,將二維坐標(biāo)(3, 15)和二維坐標(biāo)(20, 15)之間的數(shù)據(jù)內(nèi)容提取出來。
[0054] 由于網(wǎng)頁源代碼中的特定標(biāo)簽也并不唯一,因此通過建立具有唯一性質(zhì)的坐標(biāo) 系,可以快速的通過坐標(biāo)在源代碼中找到有效內(nèi)容。
[0055] 在一些說明性實(shí)施例中,通過二維坐標(biāo),將提取出來的數(shù)據(jù)內(nèi)容保持在源代碼中 指示的位置一致,顯示在建立的窗口內(nèi)。
[0056] 在一些說明性實(shí)施例中,窗口的大小可以根據(jù)用戶設(shè)定的閾值進(jìn)行調(diào)整,在窗口 中顯示的數(shù)據(jù)內(nèi)容可以根據(jù)窗口大小的改變成比例相應(yīng)改變;將得到的所述譯文在所述數(shù) 據(jù)窗口中與所述數(shù)據(jù)內(nèi)容對照顯示。
[0057] 通過建立二維坐標(biāo)可以確定窗口顯示的數(shù)據(jù)內(nèi)容與目標(biāo)網(wǎng)頁顯示一致,保證用戶 的瀏覽體驗(yàn)與用戶瀏覽頁面的體驗(yàn)一致。
[0058] 現(xiàn)在參照圖3,圖3示出了根據(jù)一些說明性實(shí)施例中翻譯系統(tǒng)的結(jié)構(gòu)示意圖。
[0059] 如圖3所示,在一些說明性實(shí)施例中,公開了一種翻譯系統(tǒng),包括:
[0060] 信息收集模塊1、文本選取模塊2、超文本選取模塊3、信息展示模塊4、翻譯引擎7、 翻譯語料庫8、展示配置模塊5和基礎(chǔ)數(shù)據(jù)庫6。
[0061] 其中,信息收集模塊分別與文本選取模塊和超文本選取模塊連接,文本選取模塊 和超文本選取模塊分別與信息展示模塊連接,信息展示模塊分別與翻譯引擎和展示配置模 塊連接,翻譯引擎與翻譯語料庫連接,展示配置模塊與基礎(chǔ)數(shù)據(jù)庫連接。
[0062] 信息收集模塊,用于獲取目標(biāo)頁面的源代碼中的數(shù)據(jù)內(nèi)容;文本選取模塊,用于從 所述信息收集模塊獲取的數(shù)據(jù)內(nèi)容中選取文本數(shù)據(jù);超文本選取模塊,用于從所述信息收 集模塊獲取的數(shù)據(jù)內(nèi)容中選取超文本數(shù)據(jù);信息展示模塊,用于建立數(shù)據(jù)窗口顯示所述文 本數(shù)據(jù)、所述文本數(shù)據(jù)的譯文、以及超文本數(shù)據(jù);翻譯引擎和翻譯語料庫,用于翻譯所述文 本數(shù)據(jù),并將其譯文傳輸給信息展示模塊;以及,展示配置模塊,用于接收用戶設(shè)置的配置 信息,并將其保存在基礎(chǔ)數(shù)據(jù)庫中。
[0063] 在一些說明性實(shí)施例中,所述配置信息中至少包含有以下之一:所述數(shù)據(jù)窗口的 大小、透明度、顏色樣式、主從窗口,以及所述文本數(shù)據(jù)的目標(biāo)語言、涉及行業(yè)等。
[0064] 在一些說明性實(shí)施例中,文本數(shù)據(jù)存儲在基礎(chǔ)數(shù)據(jù)庫中。
[0065] 在翻譯引擎翻譯文本數(shù)據(jù)時(shí),是根據(jù)基礎(chǔ)數(shù)據(jù)庫中的設(shè)定的文本數(shù)據(jù)、目標(biāo)語言, 以及涉及行業(yè)在翻譯語料庫中選取相應(yīng)的語種、行業(yè)的語料進(jìn)行翻譯。
[〇〇66] 以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本 領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會有改變之處, 綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【權(quán)利要求】
1. 一種翻譯網(wǎng)絡(luò)信息的方法,其特征在于,包括: 獲取目標(biāo)元素鏈接的目標(biāo)頁面的源代碼; 獲取所述源代碼中的數(shù)據(jù)內(nèi)容; 將獲取到的所述數(shù)據(jù)內(nèi)容按照用戶設(shè)定的目標(biāo)語言進(jìn)行翻譯; 建立數(shù)據(jù)窗口顯示經(jīng)過所述翻譯后得到的譯文。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述翻譯的過程,包括: 將獲取到的所述數(shù)據(jù)內(nèi)容作為待譯文件進(jìn)行存儲; 將存儲后的所述待譯文件推送給翻譯引擎進(jìn)行翻譯。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取目標(biāo)元素鏈接的目標(biāo)頁面的源 代碼的過程,包括: 識別光標(biāo)在當(dāng)前頁面上指示的區(qū)域數(shù)據(jù); 確定所述區(qū)域數(shù)據(jù)關(guān)聯(lián)的目標(biāo)元素; 調(diào)取所述目標(biāo)元素鏈接的目標(biāo)頁面的源代碼。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,在確定光標(biāo)在當(dāng)前頁面上指示的區(qū)域數(shù) 據(jù)之前,還包括: 確定所述當(dāng)前頁面的所有標(biāo)題數(shù)據(jù),以及每個(gè)所述標(biāo)題數(shù)據(jù)在當(dāng)前頁面的源代碼中對 應(yīng)的元素,以及所述元素的超鏈接; 建立每個(gè)所述標(biāo)題數(shù)據(jù)的在其所在頁面中的區(qū)域數(shù)據(jù); 建立每個(gè)所述標(biāo)題數(shù)據(jù)的所述區(qū)域數(shù)據(jù)與該標(biāo)題數(shù)據(jù)的所述元素的超鏈接的關(guān)聯(lián)關(guān) 系; 根據(jù)所述關(guān)聯(lián)關(guān)系確定所述區(qū)域數(shù)據(jù)關(guān)聯(lián)的目標(biāo)元素。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述標(biāo)題數(shù)據(jù)包括:文本數(shù)據(jù)和超文本數(shù) 據(jù)。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,獲取所述源代碼中特定標(biāo)簽下的數(shù)據(jù)內(nèi) 容。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述特定標(biāo)簽至少包括以下之一: 標(biāo)題標(biāo)簽、超文本鏈接標(biāo)簽、文本標(biāo)簽、屬性標(biāo)簽和段落標(biāo)簽。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,每個(gè)所述特定標(biāo)簽具有標(biāo)簽頭和標(biāo)簽尾; 所述提取所述數(shù)據(jù)內(nèi)容的過程,包括: 在所述源代碼中建立并記錄每個(gè)所述特定標(biāo)簽的標(biāo)簽頭和標(biāo)簽尾的二維坐標(biāo) (Xn, Yn); 根據(jù)所述二維坐標(biāo)提取每個(gè)所述特定標(biāo)簽下的數(shù)據(jù)內(nèi)容。
9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,在所述數(shù)據(jù)窗口中按照所述二維坐標(biāo)對 應(yīng)的位置格式顯示所述數(shù)據(jù)內(nèi)容; 將得到的所述譯文在所述數(shù)據(jù)窗口中與所述數(shù)據(jù)內(nèi)容對照顯示。
10. -種翻譯系統(tǒng),其特征在于,包括: 信息收集模塊,用于獲取目標(biāo)頁面的源代碼中的數(shù)據(jù)內(nèi)容; 文本選取模塊,用于選取所述數(shù)據(jù)內(nèi)容中的文本數(shù)據(jù); 超文本選取模塊,用于選取所述數(shù)據(jù)內(nèi)容的超文本數(shù)據(jù); 信息展示模塊,用于建立數(shù)據(jù)窗口顯示所述文本數(shù)據(jù)、所述文本數(shù)據(jù)的譯文、以及超文 本數(shù)據(jù); 翻譯引擎和翻譯語料庫,用于翻譯所述文本數(shù)據(jù),并將其譯文傳輸給信息展示模塊;以 及, 展示配置模塊和基數(shù)數(shù)據(jù)庫,用于接收并存儲用戶設(shè)置的配置信息;其中,所述配置信 息中至少包含有以下之一:所述數(shù)據(jù)窗口的大小、透明度、顏色樣式、主從窗口,以及所述文 本數(shù)據(jù)的目標(biāo)語言。
【文檔編號】G06F17/28GK104090869SQ201410292444
【公開日】2014年10月8日 申請日期:2014年6月25日 優(yōu)先權(quán)日:2014年6月25日
【發(fā)明者】江潮, 王杰 申請人:武漢傳神信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1