電子書的存儲檢索方法、電子書管理系統(tǒng)、閱讀系統(tǒng)的制作方法
【專利摘要】針對現(xiàn)有技術(shù)中電子書檢索以及下載/上傳過程中效率低下的缺陷,本發(fā)明公開了一種針對移動智能終端及移動互聯(lián)網(wǎng)上電子書的存儲檢索方法,以及能夠?qū)崿F(xiàn)該方法的電子書管理系統(tǒng)和閱讀系統(tǒng),屬于電子書和互聯(lián)網(wǎng)【技術(shù)領域】。本發(fā)明將書中的具體文字內(nèi)容存儲在數(shù)據(jù)表中,將書中每一頁內(nèi)容中除文字以外的部分存儲在文件中。利用數(shù)據(jù)庫本身檢索優(yōu)于文本檢索的特性,存儲在數(shù)據(jù)庫中的數(shù)據(jù)便于利用成熟的sql語句進行查找,針對檢索關(guān)鍵字進行迅速精準的定位,關(guān)聯(lián)各數(shù)據(jù)表,檢索出相應數(shù)據(jù),有效提升了檢索效率;此外避免了電子書的下載和上傳過程中文件格式的轉(zhuǎn)換,提高下載/上傳效率。
【專利說明】電子書的存儲檢索方法、電子書管理系統(tǒng)、閱讀系統(tǒng)
【技術(shù)領域】
[0001]本發(fā)明屬于電子書和互聯(lián)網(wǎng)【技術(shù)領域】,尤其是涉及一種針對移動智能終端及移動互聯(lián)網(wǎng)上電子書的存儲檢索方法。
【背景技術(shù)】
[0002]電子書即數(shù)字化的書籍,一般以電子文本或者圖片格式存儲文字內(nèi)容,以供人們在電子顯示設備上閱讀。隨著信息產(chǎn)業(yè)的發(fā)展,電子設備和互聯(lián)網(wǎng)的日益普及,作為傳統(tǒng)紙質(zhì)圖書的替代品,電子書逐漸成為人們生活中必不可少的一部分,甚至已經(jīng)漸漸取代了傳統(tǒng)的閱讀方式。隨著互聯(lián)網(wǎng)及3G/4G網(wǎng)絡的高速寬帶服務的推廣,智能移動終端的使用環(huán)境越來越方便,因此在互聯(lián)網(wǎng)及智能移動終端上閱讀電子書的需求也越來越大
現(xiàn)有的電子書格式主要包括txt、html、chm、pdf、epub、mobi等,這些電子書主要是以文件的格式存儲電子書內(nèi)容,其中html、epub、mobi等新興的電子書可以支持多媒體以及章節(jié)版式以及一些圖書基本信息,如圖書編號。但是上述格式都是以文件的形式存儲圖書內(nèi)容,一本電子書存儲為一個文件。因此,在終端上閱讀電子書時,在根據(jù)關(guān)鍵字對書中的內(nèi)容進行檢索時,效率較為低下。目前,網(wǎng)絡上具有由大量電子書形成的網(wǎng)絡電子書庫,這些書庫有些采用數(shù)據(jù)庫形式存儲電子書內(nèi)容,充分利用數(shù)據(jù)庫的存儲和檢索優(yōu)勢,節(jié)約空間,提高效率,但在終端上使用時依然需要先將電子書轉(zhuǎn)化成文件格式。這就造成了,從書庫下載單本的電子書時,需要先經(jīng)過接口從數(shù)據(jù)庫中讀取電子書內(nèi)容,然后再生成電子書文件;相應的,單本電子書存入書庫時也需要通過接口進行轉(zhuǎn)換;這就造成了電子書下載和上傳時需要耗費不少時間,效率低下。
【發(fā)明內(nèi)容】
[0003]為解決上述問題,本發(fā)明充分利用數(shù)據(jù)庫的優(yōu)勢,使用嵌入式數(shù)據(jù)庫存儲電子書內(nèi)容,解決了電子書內(nèi)容精準檢索及數(shù)據(jù)同步等問題,并有效簡化了書庫到單本電子書以及單本電子書到書庫的轉(zhuǎn)換問題。
[0004]為了達到上述目的,本發(fā)明提供如下技術(shù)方案:
與電子書庫中采用數(shù)據(jù)庫形式存儲電子書不同,本發(fā)明存儲電子書主要是為了在客戶端上能夠?qū)崿F(xiàn)更為高效精準地檢索,因此我們建立了一套便于查詢的電子書規(guī)范,針對電子書的檢索特點對需要存儲的數(shù)據(jù)記錄進行優(yōu)化排列,重新規(guī)劃了數(shù)據(jù)庫的格式,提高了檢索效率。
[0005]建立電子書的格式規(guī)范:首先我們整理了檢索時可能用到的關(guān)鍵字,將電子書中與檢索相關(guān)的信息分類,并根據(jù)信息分類建立數(shù)據(jù)庫中的表,將不同類別的數(shù)據(jù)存儲在不同的表中,數(shù)據(jù)表之間通過鍵值關(guān)聯(lián);在下載到客戶端時,電子書并不會轉(zhuǎn)化為現(xiàn)有的電子書格式,而依然以數(shù)據(jù)表的形式下載并存儲入客戶端中,這樣,每一本電子書擁有一個單獨的單本書數(shù)據(jù)庫文件:書中的具體文字內(nèi)容存儲在數(shù)據(jù)表中,另外,我們將書中每一頁內(nèi)容中除文字以外的部分——例如樣式、圖片、視頻、音頻等信息存儲在文件中,文件中包含有與數(shù)據(jù)庫關(guān)聯(lián)的信息。
[0006]我們將圖書相關(guān)信息分為圖書基本信息、章節(jié)數(shù)據(jù)、頁碼數(shù)據(jù)、單頁內(nèi)容,根據(jù)這些信息設計了如下四張數(shù)據(jù)表,包括圖書表、章節(jié)表、單頁表、內(nèi)容表:
圖書表用于記錄圖書基本信息,章節(jié)表用于記錄章節(jié)名稱以及各章節(jié)之間的順序關(guān)系,單頁表用于記錄各章節(jié)下的各頁頁碼以及每頁對應的文件地址,內(nèi)容表中記錄每頁中的文字內(nèi)容,便于查詢;
具體地說,
圖書表中至少記錄ISBN號、圖書的名稱、出版日期、出版社、作者信息;
章節(jié)表中至少記錄所屬章節(jié)id,章節(jié)名稱、次序、上級章節(jié)id,并通過ISBN號與圖書表關(guān)聯(lián);
單頁表中至少記錄頁id、該頁對應的文件地址、頁碼,并通過章節(jié)id與章節(jié)表關(guān)聯(lián);文件地址指向一個記錄該頁中文字以外數(shù)據(jù)的文件包。一般來說,一頁對應有一個文件包,但也可能因為需要對應有多個文件包;
內(nèi)容表中至少記錄內(nèi)容id,每頁對應的文字內(nèi)容,并通過頁id與單頁表關(guān)聯(lián)。優(yōu)選的,內(nèi)容表中的一條記錄中記錄一段文字內(nèi)容,所述一段通常指的是書中的自然分段或分節(jié),段落也可以根據(jù)需要進行劃分。分段存儲能夠?qū)Σ煌温湓O定不同的展現(xiàn)樣式,使圖書的排版可以多樣化;另外,文字分段存儲也有助于搜索內(nèi)容時的檢索速度。
[0007]其次,讀取現(xiàn)有電子書現(xiàn)有的各種格式文件,將其中的數(shù)據(jù)存儲在前述四張數(shù)據(jù)表及文件包中:
首先讀取圖書基本信息、章節(jié)數(shù)據(jù)、頁碼數(shù)據(jù)、單頁內(nèi)容,將ISBN號、圖書的名稱、出版日期、出版社、作者信息存儲在圖書表中,將ISBN號、章節(jié)名稱、次序、上級章節(jié)id存儲在章節(jié)表中,該章節(jié)id、頁對應的文件地址、頁碼存儲在單頁表中,將每頁內(nèi)容存儲在內(nèi)容表中。針對某些無法讀取的信息,可以手動錄入數(shù)據(jù)庫中。獲取圖書中的css樣式、圖片、音視、視頻等數(shù)據(jù)存儲在圖2所示的文件包中,如有無法讀取的css樣式、圖片、音視、視頻等數(shù)據(jù),也可以手動存儲入文件包中。
[0008]每頁內(nèi)容應優(yōu)選分段落存儲,現(xiàn)有的電子書格式中一般通過標識符來劃分段落,通過識別這些標識符來區(qū)分段落并將各段內(nèi)容分別存儲在內(nèi)容表的各條記錄中。對于某些無法區(qū)分段落的電子書,可根據(jù)實際需要在制作電子書時進行手動分段,依據(jù)手動分段結(jié)果將各段落文字存儲在內(nèi)容表中。
[0009]以上述格式存在的單本書數(shù)據(jù)庫文件放在一起即可形成一個新的集合數(shù)據(jù)庫,大量電子書的單本書數(shù)據(jù)庫文件放在一起就構(gòu)成了 一個書庫數(shù)據(jù)庫。書庫數(shù)據(jù)庫應設置于服務器中,與客戶端通過網(wǎng)絡連接,便于電子書的下載。書庫數(shù)據(jù)庫中數(shù)據(jù)表的結(jié)構(gòu)與單本數(shù)據(jù)庫相同。
[0010]客戶端中應具有閱讀軟件,閱讀軟件中具有嵌入式數(shù)據(jù)庫引擎,閱讀軟件用于讀取電子書中的內(nèi)容(可能是書中文字、圖片、與書本身、作者、出版方相關(guān)的信息等等)并將其呈現(xiàn)在用戶界面上。通過客戶端從書庫數(shù)據(jù)庫中下載電子書時,得到的是存儲有電子書數(shù)據(jù)的數(shù)據(jù)表以及關(guān)聯(lián)的文件包形式,通過閱讀軟件中的數(shù)據(jù)庫引擎,客戶端能夠正確地讀取電子書中的各種數(shù)據(jù)并將其顯示在用戶界面上。
[0011]客戶端中提供檢索功能,在檢索時,利用數(shù)據(jù)庫本身檢索優(yōu)于文本檢索的特性,數(shù)據(jù)庫能夠針對檢索關(guān)鍵字進行迅速精準的定位,關(guān)聯(lián)各數(shù)據(jù)表,檢索出相應數(shù)據(jù),有效提升了檢索效率。
[0012]本發(fā)明還提供了一種電子書管理系統(tǒng),包括電子書制作模塊、書庫數(shù)據(jù)庫、書庫文件資源庫,所述電子書制作平臺提供用戶交互界面,并能通過網(wǎng)絡連接,基于該平臺能夠以自動和/或手動方式以本發(fā)明設計的格式制作電子書,電子書中的文字以數(shù)據(jù)表的形式存儲入書庫數(shù)據(jù)庫中,除文字以外的數(shù)據(jù)以文件包的形式存儲入書庫文件資源庫中;用戶能夠通過書庫數(shù)據(jù)庫進行關(guān)鍵字檢索,定位到相應的電子書后下載至客戶端中。
[0013]本發(fā)明還提供了一種閱讀系統(tǒng),安裝在客戶端中,能夠閱讀以本發(fā)明提供的格式規(guī)范生成的電子書。閱讀系統(tǒng)包括用戶界面模塊和數(shù)據(jù)庫引擎,所述用戶界面模塊提供交互式的用戶界面,其中包括顯示窗口,以及一些常規(guī)的閱讀控制按鈕,如翻頁、翻章節(jié)、回到目錄、關(guān)鍵字檢索按鈕等等,閱讀系統(tǒng)能夠讀取單本書數(shù)據(jù)庫文件中的內(nèi)容,將數(shù)據(jù)表中的文字內(nèi)容合并文件包中的存儲的非文字內(nèi)容顯示在用戶界面上;閱讀系統(tǒng)提供本地檢索和/或網(wǎng)絡檢索功能,所述本地檢索功能用于在用戶輸入關(guān)鍵字后,通過用戶界面上的交互按鈕啟動數(shù)據(jù)庫引擎在電子書對應的數(shù)據(jù)表中進行檢索,并將檢索結(jié)果呈現(xiàn)給用戶;當客戶端可以與書庫數(shù)據(jù)庫通過網(wǎng)絡連接時,所述本地檢索功能還可以在服務器端的書庫數(shù)據(jù)庫中進行檢索,檢索到相關(guān)數(shù)據(jù)時將檢索結(jié)果呈現(xiàn)給用戶。
[0014]所述閱讀系統(tǒng)提供多樣化的檢索功能,例如,指定單本書內(nèi)部檢索,或是指定在某幾本書間檢索,或是在客戶端中的所有書中檢索。
[0015]與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點和有益效果:
I.將電子書文字內(nèi)容與樣式分離,通過數(shù)據(jù)表分別存儲單本電子書中的基本信息、章節(jié)數(shù)據(jù)、頁碼數(shù)據(jù)以及單頁文字內(nèi)容,通過文件包存儲電子書中除文字以外的其他內(nèi)容,如頁面樣式及圖片、音視頻等數(shù)據(jù),存儲在數(shù)據(jù)庫中的數(shù)據(jù)便于利用成熟的sql語句進行查找,,數(shù)據(jù)庫能夠針對檢索關(guān)鍵字進行迅速精準的定位,關(guān)聯(lián)各數(shù)據(jù)表,檢索出相應數(shù)據(jù),有效提升了檢索效率。
[0016]2.避免了電子書的下載和上傳過程中文件格式的轉(zhuǎn)換,提高下載/上傳效率。
[0017]3.電子書的樣式遵循h(huán)tml5標準,在未來的主流設備中可以得到很好的支持,可以在不同設備上兼容,支持復雜的排版方式,可以基本上還原原版書籍的排版樣式。
【專利附圖】
【附圖說明】
[0018]圖I為本發(fā)明設計的數(shù)據(jù)表的結(jié)構(gòu)及彼此之間的關(guān)聯(lián)關(guān)系;
圖2為文件包的目錄結(jié)構(gòu);
圖3為html5頁面的格式;
圖4為電子書I的數(shù)據(jù)庫存儲示例;
圖5為電子書2的數(shù)據(jù)庫存儲示例;
圖6為電子書3的數(shù)據(jù)庫存儲示例;
圖7為具有多本電子書的書庫數(shù)據(jù)庫的存儲示例;
圖8為電子書管理系統(tǒng)結(jié)構(gòu)示意圖。
【具體實施方式】[0019]以下將結(jié)合具體實施例對本發(fā)明提供的技術(shù)方案進行詳細說明,應理解下述【具體實施方式】僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。
[0020]實施例一:
本發(fā)明提供的電子書存儲方法,包括如下步驟:
首先,我們需要建立一種全新的電子書存儲格式,通過分析,我們將用戶關(guān)心的檢索數(shù)據(jù)分類如下:
圖書信息:ISBN號、圖書的名稱、出版日期、出版社、作者信息;
章節(jié)信息:章節(jié)名稱及順序;
單頁信息:頁碼順序及每頁中的內(nèi)容;
根據(jù)上述信息,本例中,用于存儲電子書的數(shù)據(jù)庫由四張表組成,如圖I所示,包括: 圖書表〈book〉
以ISBN號(isbn)為索引,分別記錄圖書的名稱(name)、出版日期(pubdate)、出版社(publisher)、作者信息(author)。
[0021]章節(jié)表〈chapter〉,以章節(jié)id為索引,包含字段名稱(name)、次序(corder)、上級章節(jié)(father)、ISBN 號(isbn),通過 ISBN 號與 < book〉表關(guān)聯(lián)。
[0022]頁表〈page〉,以頁id為索引,包含字段對應文件地址(file)、頁碼(porder)、章節(jié)id (chapter_id),通過 chapter_id 與〈chapter〉表關(guān)聯(lián)。
[0023]表〈content〉頁表,以id為索引,包含內(nèi)容、頁id,通過page_id與〈page〉表關(guān)聯(lián)。
[0024]必須指出的是,這四張表的結(jié)構(gòu)及關(guān)聯(lián)關(guān)系僅僅為一種示例,在實際應用中,可能根據(jù)需要改變表之間的關(guān)聯(lián)關(guān)系,也可能增加、刪除或是修改各個數(shù)據(jù)表內(nèi)各字段名稱。
[0025]〈Page〉頁表file字段存儲的文件地址指向一組文件,這組文件可以為文件包或文件夾的形式,文件包目錄結(jié)構(gòu)如圖2所示,文件包中包括該頁面所引用的css樣式,視頻,圖片等文件,文件包中還包含一個標準html5頁面,該頁面具體格式如圖3所示,Html5頁面中〈!一{$c[content, id]}—>為〈content〉表對應id所存儲的內(nèi)容,還包含有樣式文件以及圖片、音頻、視頻文件名稱。通過Html5頁面、結(jié)合內(nèi)容表中分段存儲的文字內(nèi)容、配合文件包中的css樣式以及圖片、音頻、視頻則能夠形成完整的Html5格式的電子書頁面。
[0026] 很顯然,通過上述四張表能夠存儲單本電子書中的基本信息、章節(jié)數(shù)據(jù)、頁碼數(shù)據(jù)以及單頁文字內(nèi)容,通過文件包能夠存儲電子書中除文字以外的其他內(nèi)容,如頁面樣式及圖片、音視頻等。通過上述方式,電子書文字內(nèi)容與樣式分離,電子書書名及章節(jié)信息存儲在數(shù)據(jù)庫中便于利用成熟的sql語句進行查找,而電子書的樣式遵循h(huán)tml5標準,在未來的主流設備中可以得到很好的支持,可以在不同設備上兼容,支持復雜的排版方式,可以基本上還原原版書籍的排版樣式。值得注意的是,html5頁面僅僅為一種示例,根據(jù)需要,我們也可以采用現(xiàn)有技術(shù)中的其他頁面格式。
[0027]其次,根據(jù)上述格式來制作電子書,即將已有的電子書文件轉(zhuǎn)換成本發(fā)明所述的電子書存儲格式,具體地說,是讀取現(xiàn)有電子書現(xiàn)有的各種格式文件,將其中的數(shù)據(jù)存儲在前述四張數(shù)據(jù)表及文件包中:
首先獲取圖書基本信息、章節(jié)數(shù)據(jù)、頁碼數(shù)據(jù)、單頁內(nèi)容,將ISBN號、圖書的名稱、出版日期、出版社、作者信息存儲在圖書表中,將ISBN號、章節(jié)名稱、次序、上級章節(jié)id存儲在章節(jié)表中,該章節(jié)id、頁對應的文件地址、頁碼存儲在單頁表中,將每頁內(nèi)容存儲在內(nèi)容表中。針對某些無法讀取的信息,可以手動錄入數(shù)據(jù)庫中。獲取圖書中的css樣式、圖片、音視、視頻等數(shù)據(jù)存儲在圖2所示的文件包中,如有無法讀取的css樣式、圖片、音視、視頻等數(shù)據(jù),也可以手動存儲入文件夾中。
[0028]每頁內(nèi)容應優(yōu)選分段落存儲,現(xiàn)有的電子書格式中一般通過標識符來劃分段落,通過識別這些標識符來區(qū)分段落并將各段內(nèi)容分別存儲在內(nèi)容表的各條記錄中。例如,普通的傳統(tǒng)的純文字型的圖書是以回車或空行分段的,則識別回車或空行后,將文字按照段落為單位存儲;針對epub等類型電子書,則自動讀取epub書的段落后分段存儲在內(nèi)容表中。
[0029]對于某些無法區(qū)分段落的電子書,例如一以多媒體方式存儲的高端圖書,由于圖文排版較為復雜,可能沒有明確的標識符號來劃分段落,這時可根據(jù)實際需要在制作電子書時進行手動分段,依據(jù)手動分段結(jié)果將各段落文字存儲在內(nèi)容表中。
[0030]我們還提供書庫數(shù)據(jù)庫和書庫文件資源庫來存儲大量的電子書,書庫數(shù)據(jù)庫應設置于服務器中,與客戶端通過網(wǎng)絡連接,便于電子書的下載。書庫數(shù)據(jù)庫中數(shù)據(jù)表的結(jié)構(gòu)與單本數(shù)據(jù)庫一致(圖4為單本電子書I的數(shù)據(jù)庫存儲示例,圖5為單本電子書2的數(shù)據(jù)庫存儲示例,圖6為單本電子書3的數(shù)據(jù)庫存儲示例,圖7為具有上述三本電子書的書庫數(shù)據(jù)庫的存儲示例,該圖僅為示例,并不是實際的數(shù)據(jù)庫樣式),便于單本書與書庫之間數(shù)據(jù)傳輸,多本書集合即快速形成了小型書庫數(shù)據(jù)庫。書庫文件資源庫中用于存儲各電子書對應的文件包。
[0031]考慮到每張表中每條記錄的id應該不能重復(由于ISBN號是唯一的,因此圖書信息表中的索引是唯一索引,但章節(jié)表中的各章節(jié)id、單頁表中的單頁id和內(nèi)容表中的內(nèi)容id如果各自生成序號的話,那么存儲在書庫數(shù)據(jù)庫中時這些id之間就有可能重復),因此我們提供一種電子書制作平臺,該平臺應提供用戶交互界面,并能通過網(wǎng)絡連接,登錄至該平臺之后能夠通過前述制作方法統(tǒng)一制作電子書,平臺提供導入文件接口,通過接口導入現(xiàn)有技術(shù)中已經(jīng)存在的其他電子書格式,這樣各數(shù)據(jù)表的id能夠統(tǒng)一生成唯一的序號,不會重復。上述制作平臺僅僅為一種較為簡便的優(yōu)選方式,在實際應用中可以通過其他方式來保證各記錄id的唯一性,例如可以在客戶端設置電子書制作模塊,該制作模塊能夠通過前述制作方法制作電子書,在制作電子書時該模塊必須通過網(wǎng)絡連接服務器,并通過服務器獲取各表記錄中唯一的id后存儲入客戶端上的本地數(shù)據(jù)庫中,這樣也可以保證各電子書對應的數(shù)據(jù)表記錄中的id不會重復。
[0032]針對制作好的電子書,還可以進行各種信息的管理、修改、刪除,對于電子書基本信息和文字內(nèi)容的管理通過修改數(shù)據(jù)庫文件實現(xiàn),對于電子書樣式和非文字內(nèi)容的管理,通過修改文件包中的文件實現(xiàn)。
[0033]客戶端從書庫數(shù)據(jù)庫中下載電子書時,得到的是存儲有電子書數(shù)據(jù)的數(shù)據(jù)表以及關(guān)聯(lián)的文件包。客戶端中應具有閱讀軟件,閱讀軟件中具有嵌入式數(shù)據(jù)庫引擎,閱讀軟件用于讀取電子書中的內(nèi)容(可能是書中文字、圖片、與書本身、作者、出版方相關(guān)的信息等等)并將數(shù)據(jù)表中的文字內(nèi)容合并文件包中的存儲的非文字內(nèi)容呈現(xiàn)在用戶界面上。通過閱讀軟件中的數(shù)據(jù)庫引擎,客戶端中的電子書即形成了小型的數(shù)據(jù)庫,在檢索時,利用數(shù)據(jù)庫本身檢索優(yōu)于文本檢索的特性,數(shù)據(jù)庫能夠針對檢索關(guān)鍵字進行迅速精準的定位,關(guān)聯(lián)各數(shù)據(jù)表,檢索出相應數(shù)據(jù),有效提升了檢索效率。
[0034]實施例二 :
本發(fā)明還提供了一種電子書管理系統(tǒng),如圖8所示,包括電子書制作平臺、書庫數(shù)據(jù)庫、書庫文件資源庫,所述電子書制作平臺提供用戶交互界面,并能通過網(wǎng)絡連接,基于該平臺讀取現(xiàn)有電子書現(xiàn)有的各種格式文件,該平臺中包括圖書解析模塊,圖書解析模塊用于分析指定格式(如epub)的電子書內(nèi)容,并將圖書基本信息、章節(jié)數(shù)據(jù)、頁碼數(shù)據(jù)、單頁內(nèi)容等信息分類解析出來,將其中的數(shù)據(jù)存儲在前述四張數(shù)據(jù)表及文件包中,形成本發(fā)明提供的電子書格式:將書中的信息和文字以數(shù)據(jù)表的形式存儲入書庫數(shù)據(jù)庫中,除文字以外的數(shù)據(jù)以文件包的形式存儲入書庫文件資源庫中。用戶能夠通過書庫數(shù)據(jù)庫進行關(guān)鍵字檢索,定位到相應的電子書后將相應的數(shù)據(jù)表和文件包下載至客戶端中。
[0035]實施例三:
本發(fā)明還提供了一種閱讀系統(tǒng),安裝在客戶端中,閱讀系統(tǒng)包括用戶界面模塊和數(shù)據(jù)庫引擎,所述用戶界面模塊提供交互式的用戶界面,其中包括顯示窗口,以及一些常規(guī)的閱讀控制按鈕,如翻頁、翻章節(jié)、回到目錄、關(guān)鍵字檢索按鈕等等,
閱讀系統(tǒng)能夠讀取單本書數(shù)據(jù)庫文件中的內(nèi)容,將數(shù)據(jù)表中的文字內(nèi)容合并文件包中的存儲的非文字內(nèi)容呈現(xiàn)在用戶界面上,并按照文件包中存儲的樣式進行顯示。
[0036]閱讀系統(tǒng)提供本地檢索和/或網(wǎng)絡檢索功能,所述本地檢索功能用于在用戶輸入關(guān)鍵字后,通過用戶界面上的交互按鈕啟動數(shù)據(jù)庫引擎在電子書對應的數(shù)據(jù)表中進行檢索,并將檢索結(jié)果呈現(xiàn)給用戶;當客戶端可以與書庫數(shù)據(jù)庫通過網(wǎng)絡連接時,所述本地檢索功能還可以在服務器端的書庫數(shù)據(jù)庫中進行檢索,檢索到相關(guān)數(shù)據(jù)時將檢索結(jié)果呈現(xiàn)給用戶。
[0037]閱讀系統(tǒng)還能夠提供多樣化的檢索功能,例如,指定單本書內(nèi)部檢索,或是指定在某幾本書間檢索,或是在客戶端中的所有書中檢索。通過縮小檢索范圍可以大大提高檢索效率。
[0038]本發(fā)明方案所公開的技術(shù)手段不僅限于上述實施方式所公開的技術(shù)手段,還包括由以上技術(shù)特征任意組合所組成的技術(shù)方案。應當指出,對于本【技術(shù)領域】的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也視為本發(fā)明的保護范圍。
【權(quán)利要求】
1.一種電子書的存儲檢索方法,其特征在于,包括如下步驟: 建立電子書的格式:將電子書中與檢索相關(guān)的信息分類,并根據(jù)信息分類建立數(shù)據(jù)庫中的表,將不同類別的數(shù)據(jù)以及電子書中的文字存儲在不同的表中,數(shù)據(jù)表之間通過鍵值關(guān)聯(lián);將書中每一頁內(nèi)容中除文字以外的部分存儲在文件包中,文件包中包含有與數(shù)據(jù)庫關(guān)聯(lián)的信息; 所述信息分為圖書基本信息、章節(jié)數(shù)據(jù)、頁碼數(shù)據(jù)、單頁內(nèi)容,根據(jù)這些信息設計四張數(shù)據(jù)表: 圖書表用于記錄圖書基本信息;章節(jié)表用于記錄各電子書的章節(jié)名稱以及各章節(jié)之間的順序關(guān)系;單頁表用于記錄各章節(jié)下的各頁頁碼以及每頁對應的文件地址,內(nèi)容表中記錄每頁中的文字內(nèi)容; 制作電子書:獲取現(xiàn)有電子書現(xiàn)有的格式文件,將其中的文字數(shù)據(jù)存儲在前述四張數(shù)據(jù)表及文件包中,將圖書基本信息存儲在圖書表中,將章節(jié)數(shù)據(jù)存儲在章節(jié)表中,將頁碼數(shù)據(jù)存儲在單頁表中,將單頁內(nèi)容儲在單頁表中,獲取圖書中的非文字數(shù)據(jù)存儲在文件包中;所述非文字數(shù)據(jù)包括樣式、圖片、音頻、視頻; 存儲電子書:將大量電子書的單 本書數(shù)據(jù)庫文件集合構(gòu)成書庫數(shù)據(jù)庫和書庫文件資源庫,書庫數(shù)據(jù)庫中數(shù)據(jù)表的結(jié)構(gòu)與單本電子書數(shù)據(jù)庫相同,書庫文件資源庫中用于存儲各電子書中的文件包; 閱讀電子書:通過客戶端從書庫數(shù)據(jù)庫中下載電子書,得到的電子書格式為存儲有電子書數(shù)據(jù)的數(shù)據(jù)表以及關(guān)聯(lián)的文件包;客戶端中具有嵌入式數(shù)據(jù)庫引擎,客戶端通過閱讀軟件讀取電子書中的內(nèi)容,結(jié)合數(shù)據(jù)表中存儲的文字內(nèi)容、配合文件包中的CSS樣式以及圖片、音頻、視頻形成完整電子書頁面;客戶端中提供檢索功能,檢索時數(shù)據(jù)庫引擎在電子書對應的數(shù)據(jù)表中進行檢索,并將檢索結(jié)果呈現(xiàn)給用戶。
2.根據(jù)權(quán)利要求1所述的電子書的存儲檢索方法,其特征在于: 所述電子書的數(shù)據(jù)格式中,單頁內(nèi)容分段落存儲在內(nèi)容表中;制作電子書時區(qū)分段落并將各段文字內(nèi)容分別存儲在內(nèi)容表的各條記錄中。
3.根據(jù)權(quán)利要求1或2或所述的電子書的存儲檢索方法,其特征在于: 在制作電子書時,針對某些無法讀取的信息,手動錄入數(shù)據(jù)庫中;針對無法讀取的CSS樣式、圖片、音視、視頻等數(shù)據(jù),手動存儲入文件包中;對于無法區(qū)分段落的電子書,進行手動分段,依據(jù)手動分段結(jié)果將各段落文字存儲在內(nèi)容表中。
4.根據(jù)權(quán)利要求1~3中任意一項所述的電子書的存儲檢索方法,其特征在于: 圖書表中包括ISBN號、圖書的名稱、出版日期、出版社、作者信息; 章節(jié)表中包括章節(jié)id,章節(jié)名稱、次序、上級章節(jié)id,并通過ISBN號與圖書表關(guān)聯(lián); 單頁表中包括頁id、該頁對應的文件地址、頁碼,并通過章節(jié)id與章節(jié)表關(guān)聯(lián);文件地址指向一個記錄該頁中文字以外數(shù)據(jù)的文件包; 內(nèi)容表中包括內(nèi)容id,每頁對應的文字內(nèi)容,并通過頁id與單頁表關(guān)聯(lián); 所述章節(jié)id、單頁id和內(nèi)容id均是唯一的。
5.根據(jù)權(quán)利要求4所述的電子書的存儲檢索方法,其特征在于:所述文件包中包含標準的html5頁面,html5頁面中包含有內(nèi)容id、樣式文件名稱以及圖片、音頻、視頻文件名稱。
6.—種電子書管理系統(tǒng),其特征在于: 包括電子書制作平臺、書庫數(shù)據(jù)庫、書庫文件資源庫,所述電子書制作平臺提供用戶交互界面,并能通過網(wǎng)絡連接,基于該平臺能夠以權(quán)利要求1~5中任意一項權(quán)利要求中所述的電子書格式規(guī)范制作電子書,電子書中的文字以數(shù)據(jù)表的形式存儲入書庫數(shù)據(jù)庫中,除文字以外的數(shù)據(jù)以文件包的形式存儲入書庫文件資源庫中;用戶能夠通過書庫數(shù)據(jù)庫進行關(guān)鍵字檢索,定位到相應的電子書后下載至客戶端中; 所述制作電子書的步驟包括:獲取現(xiàn)有電子書現(xiàn)有的格式文件,將其中的文字數(shù)據(jù)存儲在數(shù)據(jù)表及文件中,將圖書基本信息存儲在圖書表中,將章節(jié)數(shù)據(jù)存儲在章節(jié)表中,將頁碼數(shù)據(jù)存儲在單頁表中,將單頁內(nèi)容儲在單頁表中,獲取圖書中的非文字數(shù)據(jù)存儲在文件包中;所述非文字數(shù)據(jù)包括樣式、圖片、音頻、視頻。
7.一種閱讀系統(tǒng),安裝在客戶端中,其特征在于: 用于閱讀以權(quán)利要求1~5中任意一項權(quán)利要求中所述的格式規(guī)范生成的電子書;閱讀軟件包括用戶界面模塊和數(shù)據(jù)庫引擎,所述用戶界面模塊提供交互式的用戶界面,閱讀系統(tǒng)能夠讀取單本書數(shù)據(jù)庫文件中的內(nèi)容,將數(shù)據(jù)表中的文字內(nèi)容合并文件包中的存儲的非文字內(nèi)容顯示在用戶界面上,并按照文件包中存儲的樣式進行顯示;閱讀系統(tǒng)提供本地檢索和/或網(wǎng)絡檢索功能,所述本地檢索功能用于在用戶輸入關(guān)鍵字后,通過用戶界面上的交互按鈕啟動數(shù)據(jù)庫引擎在電子書對應的數(shù)據(jù)表中進行檢索,并將檢索結(jié)果呈現(xiàn)給用戶。
8.根據(jù)權(quán)利要求7所述的閱讀系統(tǒng),其特征在于: 所述閱讀系統(tǒng)通過網(wǎng)絡連接至服務器端的書庫數(shù)據(jù)庫中進行檢索,檢索到相關(guān)數(shù)據(jù)時將檢索結(jié)果呈現(xiàn)給用戶。
【文檔編號】G06F17/30GK104035993SQ201410254430
【公開日】2014年9月10日 申請日期:2014年6月10日 優(yōu)先權(quán)日:2014年6月10日
【發(fā)明者】徐宇雷 申請人:江蘇鳳凰優(yōu)閱信息科技有限公司