專利名稱:文本格式化裝置的制作方法
技術領域:
本發(fā)明是關于文本格式化的裝置,適合于用格式限定的方法獲得文本的格式化輸出。
在準備用一種西方語言寫的文本時,通常的做法是,把它格式化成為所希望的式樣,諸如使文本符合打印紙的尺寸要求、進行填補和版面調(diào)整,如此打印出該文本。此種格式化程序的功能、作用和實際執(zhí)行,對于本專業(yè)的技術人員是眾所周知的,并且有不少參考文獻可供利用。因此,對于格式器本身的進一步說明在此省略。作為參考文獻之一,可參閱“軟件工具”一書(“SoftwareTools”)第335至386頁,第七章“文本格式化”(該書由BrianW.Kernighan、P.J.Plauger著,IzumiKimura翻譯,KyouritsuShuppan公司出版)。
先有技術的格式化程序只用于對西方語言寫的文本進行格式化。但是近年來日文文本的處理一直被認為是重要的,因而人們對于格式化程序不僅希望它能適應西文文本,而且希望對包含漢字字符的文本能以同樣方式良好工作。此外,對于格式化程序還希望輸出用非西文語言,除日語外還包括漢語和朝鮮語在內(nèi)的格式化文本。在實施一種支持多種語言的文本格式化裝置過程中,產(chǎn)生了一些新問題。
有關格式限定處理的問題是其中之一。如所周知,格式限定處理是要使某些特定字符不放在文本一行的起始或末尾。例如,當標點符號“?!眮淼揭恍械拈_頭時,通過從前一行擠出一個字符到這一行來,將迫使該符號不位于該行的開頭。
在先有技術用于日文文本處理的各格式化程序中,禁止位于一行開頭或一行末尾的各字符集是固定的,而它們的字符代碼則隱匿于它的程序代碼中。這樣,對于用戶來說,日后修改這些字符集是不可能的。但是,當需要使用不僅適合日語,而且適合漢語、朝鮮語等等的這種程序時,涉及到格式限定處理的一個新問題產(chǎn)生了,這就是,適用于格式限定處理的各字符集在這些語言中是各不相同的,即使有一個共同的字符用于其中,它的字符代碼表示法也可能是不同的。此外,即使用一種語言,其諸多要作格式限定的字符,也會在各別人之間而有所不同。從而,先有的文本格式化裝置不能處理這種情況。
本發(fā)明的一個目的就是要解決上述先有技術的這個問題,和要處置在幾種語言之間以及在各別人之間存在的格式限定處理中的各種差異。
根據(jù)本發(fā)明一個實施例的文本格式化裝置的原理,對于用戶來說,如有需要,更改格式限定處理所適用的各字符集是可能的。為做到這點,本實施例允許用戶為起動填補操作而規(guī)定此類字符集,作為隱匿子文本中的一條命令的各參數(shù)。
圖1是用于表示根據(jù)本發(fā)明的一個實施例的文本格式化裝置結構的框圖。其中12輸入段;
14字生成段;
16.填補命令處理段;
18第一緩沖器;
20第二緩沖器;
24填補段。
圖1是功能方框圖。圖中,要格式化的文本通過輸入段12續(xù)入。用于控制文本格式化裝置的格式化操作以及要格式化的文本正文的一些命令藏匿于該文本中。本實施例中,在這些命令中,有一條用于指示起動填補操作的命令。該命令可以任選地擁有若干參數(shù),以規(guī)定不得位于一行起始的字符集(以下稱作為排頭限定字符集)和規(guī)定不得位子一行末尾的字符集(以下稱作為排尾限定字符集),如下所示.fip′「(〔′S′。、.,」)〕′也就是說,上述該例指明要就該條命令下的文本部分執(zhí)行填補操作。同時,它也規(guī)定那些包含在緊跟p后面的一對撇號內(nèi)的各字符(本例中它們是「(和〔)作為排尾限定字符集以及那些包含在緊跟S后面一對撇號內(nèi)的各字符(本例中它們是。、.,」)和〕)作為排頭限定字符集。
圖1中,當輸入段12檢測出這條命令時,就把它送往填補命令處理段16,以便分析。接著,填補命令處理段16控制轉接段22,使字生成段14的輸出通過填補段24。填補命令處理段16進一步從所給出的為把它們分別貯存在第一緩沖器18和第二緩沖器20中的填補命令中析取排尾限定字符集和排頭限定字符集。當一個或它們中的任一個沒有在該命令中給出時,相應緩沖器的內(nèi)容就不被重寫。這樣,如果填補操作一旦暫停并接著又對不具有上述各參數(shù)的.fi命令敏感而重新起動,那么該格式限定處理將如前一樣完成。
另方面,當輸入段12接收任何并非是命令的目標時(即當它接收文本正文時),后者被送給字生成段14。該段把所給文本分為許多字,并把它們逐個地送往填補段24。當該段裝有用非西文語言例如日語寫的文本時,則把它分為例如漢字或假名眾多字符的同時便對它們象對一種西文語言的詞匯一樣予以處理。用這種方法,本文本格式化裝置可以對西文和非西文的文本一樣處理。因為本說明書的所剩部分只講述非西文文本的處理,因而所作的解釋將假設字生成段14是逐個地輸出各字符的。(當然,以下說明的填補段24可以對任何包含西文句子的文本起作用而不出問題,因為非西文文本的“字符”是被當作西文文本的“字”來處理的。)填補段24從字發(fā)生段14接收字符序列,逐個字符地把它們加到當前正在產(chǎn)生的一行的末尾。當檢測出該行的末尾已越出右邊限界時,填補段24把最后加上的那個字符移到下一行作為它的開頭字符。
此時位于當前行末尾的字符和位于下一行開頭的字符要分別同排尾和排頭限定字符集的內(nèi)容進行比較,如果在這些比較期間,沒有檢測出相一致的地方,那么該當前行就如它現(xiàn)在那樣定下了。如果這些比較中至少有一個顯示一致性,那么該當前行最后一個字符將被擠出而放到下一行的開頭。以后,繼續(xù)進行上述的這些比較,并且,如果必要的話,將重復擠出這些最后的字符。
填補段24接著調(diào)整剛定下的該當前行,以便使該當前行的最后一個字符同右邊限界對齊。如所周知,施行均衡間隔打印或在該行一些適當?shù)牡胤讲迦胍粋€或幾個空格就可以做到這點。
填補段24最終將如上所準備好的當前行傳到作其他處理的段26。該行將由輸出段28在收到需在那里處理的信息后予以打印。
不遵守日文格式限定規(guī)則的日文文本的一個例子是これは日本語の禁則處理にっぃこの、ひとっの例です。
改進后遵守日文格式限定規(guī)則的該文本成為これは日本語の禁則處理にっぃての、ひとっの例です。
本發(fā)明不局限于上述該實施例,當然可以根據(jù)需要廣為修改。例如,可以為貯存排尾或排頭限定字符集設置多個緩沖器,以便在它們中間選擇。而且,填補段24的內(nèi)部操作可以和以上說明不同。此外,輸出設備不局限于是一臺打印機,例如可以使用顯示器。也可能在句號或問號之后選定空格(要在一個單間隔字符或兩個單間隔字符之間作出抉擇),因為該空格方案在各個國家中是不同的。
如上所述,因為根據(jù)本發(fā)明用戶可以自由地設定和更改各限定字符集,因而就可能提供能夠適應各種語言格式限定中的差異的文本格式化裝置。
權利要求
一臺具有為輸入文本、使每一行都格式化以及執(zhí)行格式化限定處理以提供用格式化形式輸出所述文本的填補設備的文本格式化裝置,其特征在于,包括用于為所述格式化限定處理貯備一個符號集的設備,所述設備能夠響應所給出的命令,以更改用于所述格式化限定處理的所述符號集的內(nèi)容。
全文摘要
本發(fā)明通過設置一條命令規(guī)定那些不得位于被格式化文本一行開頭或位于一行末尾的各知號集,使所述文本格式器能適應這些不同的限定規(guī)則。
文檔編號G06K17/00GK1030988SQ8710538
公開日1989年2月8日 申請日期1987年7月31日 優(yōu)先權日1987年7月31日
發(fā)明者青木俊久, 渡邊外治 申請人:惠普公司