亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

多國語文件處理裝置的制作方法

文檔序號:6409399閱讀:203來源:國知局
專利名稱:多國語文件處理裝置的制作方法
技術領域
本發(fā)明涉及多國語文件處理裝置,尤其涉及中文和日文兼用的多國語文件處理裝置。
今后,在新開發(fā)的文件處理裝置處理多國語時,作為文字代碼,采用對應多國語代碼系列(例如Unicode標準或ISO10646)的情況可能會多了。但是,對應多國語代碼系列只是最近才形成標準。因此,原來的文件處理裝置,無論是市售的日文字處理機和中文字處理機,還是今后將要開發(fā)、銷售的改良品都不采用這種標準的多國語代碼系列,而采用一般知道的先有方式的代碼系列。那么,先有的文字代碼系列,例如有用1字節(jié)表現(xiàn)半角的英文、數(shù)字的ASCII代碼系列,用2字節(jié)表現(xiàn)日文文字的JIS代碼系列、SHIFT JIS代碼系列,以及用2字節(jié)表現(xiàn)中文文字的BIG5代碼系列、IBM5550代碼系列。
除此以外,在輸入多國語的場合,文件處理裝置為了不必反復從輔助存儲器中讀取文字處理程序,就必須備有輸入各種語言的設備。在這方面,它已形成按照應處理的語言種類,迅速、高效率讀取文字處理程序的結構和方式。
作為先有的這種多國語信息處理裝置例如有特開平1-213744號公報中發(fā)表的。這種裝置是借鑒于即使作成多國語文件,實際上一種特定的語言占據(jù)了作成文件的大部分,其它語言不僅少,而且其種類也受到限制的情況而開發(fā)的。
下面,說明該裝置。


圖10是結構圖。在此圖中,100是語言處理信息存儲單元,該單元將各國語言的文字輸入程序存儲在輔助存儲媒體(例如硬盤)中。101是系統(tǒng)語言處理信息管理單元,該單元臨時存儲2個國家語言的文字輸入程序。102是語言處理信息登記單元,該單元在語言處理信息存儲單元100中進行檢索,并將各國語言的文字輸入程序存儲到系統(tǒng)語言處理信息管理單元101中。103是使用語言存儲單元,該單元存儲表示系統(tǒng)語言處理管理單元中存儲的文字輸入程序是哪國語言的識別信息(語言指示信息)和最后登記的語言指示信息,即隱含語言指示信息。104是語言指示信息登記單元,該單元對語言處理信息登記單元102輸出語言指示信息,在語言處理信息存儲單元100內進行文字輸入程序的檢索,將檢索得出的文字輸入程序登記在系統(tǒng)語言處理信息管理單元102中,與此同時將語言指示信息登記在使用語言存儲單元103中。105是使各國語言混合起來進行文字輸入的本文編輯單元。106是輸入語言指示信息的語言指示信息輸入單元。
下面以英文和日文混合的文件輸入為例,說明先有例子的工作流程。
假設首先進行了英文輸入。語言處理信息登記單元102在語言處理信息存儲單元100中進行檢索,取出英文文字輸入程序,并存儲在系統(tǒng)語言處理信息管理單元101中。語言指示信息登記單元104將已經(jīng)輸入的識別信息(由于是英文,所以為“E”)登記在使用語言存儲單元103中。在這種場合,由于只登記了英文,所以,最后表示登記內容的隱含語言指示信息是英文。這樣,英文的文件就成了要作成的對象。然后,假設文字輸入者(文件作成人)想要輸入日文。從語言指示信息輸入單元106把用來識別出日文的語言指示信息(由于是日文,所以為“J”)重新輸入。
語言指示信息登記單元104由于已經(jīng)輸入的語言識別信息為J,所以,把該語言指示信息輸出到語言處理信息登記單元102中,在指示更新系統(tǒng)語言處理信息的同時,將語言指示信息J追加登記在使用語言存儲單元103中。這樣,就在使用語言存儲單元103中存儲了E和J這2個語言指示信息。還有,在最后的登記中,作為J的隱含語言指示信息也登記了(所以,后面輸入的是日語文件)。
同時,語言處理信息登記單元102根據(jù)已經(jīng)指示的語言指示信息,從語言處理信息存儲單元100中檢索并讀出日文文字輸入程序,并將它存儲在系統(tǒng)語言處理信息管理單元101中。其結果是,系統(tǒng)語言處理信息管理單元101中存儲了英文文字輸入程序和日文文字輸入程序。
如果根據(jù)上述那種先有的多國語信息處理裝置,就可以減少從輔助存儲媒體中反復讀寫文字輸入程序的次數(shù)。因此,可以提高多國語信息處理的效率。
但是,如果要將上述先有的文件處理裝置挪用于中文處理裝置的話,就會產(chǎn)生下面那樣的問題第1,日文雖然與中文一樣,都是2字節(jié)系列,但是,所使用的字數(shù)大約只有7000個。所以,一般有13比特就足夠了,而且,剩下的3比特(具體地講,就是上位字節(jié)以及下位字節(jié)的MSB等),例如,除了表示字體是粗字或空格等屬性外,還用于其它用途。另一方面,中文字為13053字,不到日文字的2倍。所以,日文和中文不能使用共同的文字代碼結構。然而,文件處理裝置中的應用程序(如編輯軟件)與文字代碼的結構有關。具體地講,日文應用程序將表示上述屬性的比特用于編輯,而在中文中則不能。而且,這意味著在中文和日文中不能共享應用程序。所以,如果原封不動地同時處理中文和日文,這種多國語文件處理裝置則是不可能的(如果僅記為參考,那么,當前的日文字處理機之所以能夠處理英文,是由于英文使用的文字非常少,故此,代碼體系也不重復)。
第2,先有的裝置只是存儲輸入時使用的文字的語言種類,在處理作成中的文件時還不能存儲該語言的種類,所以,在輸出用日文描述的中文入門書等多國語混合的文件時,發(fā)生了各種困難。
第3,先有的裝置對中文和日文使用不同的文字代碼結構,所以,在挪用文件裝置時,產(chǎn)生了各種次要的問題。例如,在將日文字處理機作為中文字處理機使用時,反過來,將中文字處理機作為日文字處理機使用時,必須重新作成與住址名錄、錄影象程序、圖形程序、直排打印等相關的應用程序。
所以,需要許多的工時(雖然也取決于內容,約12人月、2000~3000工時)、資源及經(jīng)費等。
為了解決上述課題,權利要求1的發(fā)明特征在于具有由標準鍵盤等構成的輸入單元、文字代碼結構表、由內部存儲器(ROM)等構成的語言處理存儲單元、輸入語言處理單元、輸入代碼分解單元、本文代碼和語言指示代碼的存儲單元、編輯處理單元、輸出代碼合成單元、文字字形存儲單元和文字輸出控制單元,輸入單元的標準鍵盤輸入語言標志和讀音符號;文字代碼結構表具有對日文文字分配了一個代碼平面、對中文文字至少分配了2個代碼平面的文字代碼欄,根據(jù)代碼平面和文字代碼欄的指定,決定日文或中文兩者之一及該語言的文字;語言處理存儲單元的內部存儲器存儲將已經(jīng)輸入的讀音符號(包括多個讀符號)變換為該中文文字(包括多文字及文章,并且不局限于漢字)的中文文字輸入程序和將已經(jīng)輸入的讀音符號變換為該日文文字(包括混有假名的語句)的日文文字輸入程序(預先存儲、可利用的狀態(tài));輸入語言處理單元根據(jù)已經(jīng)由輸入單元輸入的語言標志,判斷從語言處理存儲單元中讀入的是中文文字輸入程序和日文文字輸入程序兩者中的哪一方,讀入該方的程序,并將已輸入的讀音符號變換成與該語言對應的文字代碼;輸入代碼分解單元把輸入語言處理單元變換產(chǎn)生的文字代碼分解(一種變換,包括根據(jù)語言,文字代碼不變的狀態(tài))為指定在文字代碼結構表上應該特定的文字代碼欄內文字的本文代碼和指定代碼平面的語言指示代碼;文本代碼和語言指示代碼的存儲單元存儲已由輸入代碼分解單元分解的本文代碼和語言指示代碼;編輯處理單元在進行插入、刪除、文字屬性變換等文件編輯時,與該編輯相關的各單元可以同時處理本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼;輸出代碼合成單元根據(jù)本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼,把輸入讀符號中的該中文文字代碼或日文文字代碼合成;文字字形存儲單元通過把已經(jīng)登記在文字代碼結構表中的中文文字及日文文字的字形(字母等)與該語言的文字代碼對應起來,然后予以輸出;文字輸出控制單元根據(jù)輸出代碼合成單元的合成結果,從文字字體存儲單元中取出對應的中文文字或日文文字的字體后,輸出到打印單元及顯示單元上。
權利要求2的發(fā)明特征在于文字代碼結構表具有日文的文字代碼欄;輸入代碼分解單元具有把輸入語言處理單元變換產(chǎn)生的文字代碼分解為語言指示代碼和日文文字代碼的輸入代碼日文代碼分解器;本文代碼和語言指示代碼的存儲單元具有將日文文字代碼作為本文代碼存儲的日文文字代碼存儲器。
權利要求3的發(fā)明特征在于具有輸入單元、文字代碼結構表、語言處理存儲單元、輸入語言處理單元、輸入代碼分解單元、本文代碼和語言指示代碼的存儲單元、編輯處理單元、輸出代碼合成單元、文字字形存儲單元和文字輸出控制單元,輸入單元輸入語言標志和讀音符號;文字代碼結構表具有根據(jù)該國語言的文字數(shù)目對多國語言分配了至少一個代碼平面(Code Plane)的文字代碼欄,根據(jù)代碼平面和文字代碼欄的指定,決定各國語言的種類及其文字;語言處理存儲單元存儲把與文字代碼結構表對應的各國語言用的、并且已輸入的讀音符號變換成與該國語言對應文字的各國語言用的多種文字輸入程序(讀音符號即文字,在變成英語等時,實際上也有不需要的,所以,該輸入程序包括實際上沒有以及兼用這兩種情況);輸入語言處理單元根據(jù)輸入單元輸入的語言標志,從語言處理存儲單元中讀入該國語言用的文字輸入程序,將已輸入的讀音符號變換為與已輸入的國語對應的文字代碼;輸入代碼分解單元把輸入語言處理單元變換(如前面所述,也包括實質未變換的場合)產(chǎn)生的文字代碼分解為指定在文字代碼結構表上應該特定的文字代碼欄內文字的本文代碼和指定代碼平面的語言指示代碼;文本代碼和語言指示代碼的存儲單元存儲已由輸入代碼分解單元分解的本文代碼和語言指示代碼;編輯處理單元在進行插入、刪除、文字屬性變換等文件編輯時,與該編輯相關的各單元可以同時處理文本代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼;輸出代碼合成單元根據(jù)本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼,把輸入語言標志中與該語言讀音符號對應的文字代碼合成;文字字形存儲單元通過把已經(jīng)登記在文字代碼結構表中的多種語言各種文字的字形與該語言的文字代碼對應起來,然后予以輸出;文字輸出控制單元根據(jù)輸出代碼合成單元的合成結果,從文字字形存儲單元中取出并輸出對應的該國語言的文字字形。
根據(jù)上述構成,權利要求1的發(fā)明中,由用戶從輸入單元輸入打算作成的文件等的語言標志和讀音符號。文件代碼結構表在文字代碼欄中對日文文字分配一個代碼平面,對中國文字至少分配2個代碼平面,通過代碼平面和文字代碼欄的指示,就能決定文字。語言處理存儲單元事先存儲把從輸入單元輸入的讀符號應該變換成該中文或日文文字的中文文字輸入程序和日文文字輸入程序。輸入語言處理單元根據(jù)由輸入單元輸入的語言標志,判斷從語言處理存儲單元中讀入的是中文文字輸入程序和日文文字輸入程序中的哪一種,將已輸入的讀符號及構成語句的文字讀符號變換為該語言的文字代碼。輸入代碼分解單元把輸入語言處理單元變換產(chǎn)生的文字代碼分解為指定構成文件等特定文字的文字代碼欄文字的本文代碼和指定代碼平面的語言指示代碼。本文代碼和語言指示代碼的存儲單元存儲已由輸入代碼分解單元分解的本文代碼和語言指示代碼。此時也有把多種文字的文字代碼匯總變換以后存儲的情況。編輯處理單元在進行插入、刪除、文字屬性變換等文件編輯時,在與該編輯相關的各單元可以同時處理本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼。輸出代碼合成單元根據(jù)本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼,把輸入的讀音符號該中文文字或日文文字的代碼合成。文字字形存儲單元具有文字字體ROM等,通過把已經(jīng)登記在文字代碼結構表中的中文文字代碼和日文文字代碼的字形與該語言的文字代碼對應起來,然后予以輸出。文字輸出控制單元根據(jù)輸出代碼合成單元的合成結果,從文字字體存儲單元中取出,并輸出對應的中文文字或日文文字的字形。
權利要求2的發(fā)明中文字代碼結構表具有日文的文字代碼欄。在輸入代碼分解單元中的輸入代碼日文代碼分解器把輸入語言處理單元變換產(chǎn)生的文字代碼分解為語言指示代碼和日文文字代碼。本文代碼和語言指示代碼存儲單元中的日文文字代碼存儲器將日文文字代碼作為本文代碼存儲。
權利要求項3的發(fā)明中從輸入單元輸入語言標志和讀音符號。文字代碼結構表具有根據(jù)該國語言的文字數(shù)目對多國語言分配了至少一個代碼平面(Code Plane)的文字代碼欄,根據(jù)代碼平面和文字代碼欄的指定,可以決定各國語言的種類及其文字。語言處理存儲單元存儲把與文字代碼結構表對應的各國語言用的、并且將已輸入的讀符號變換成與該國語言對應文字的各國語言用的多種文字輸入程序。輸入語言處理單元根據(jù)輸入單元輸入的語言標志,從語言處理存儲單元中讀入該(包括兼用的)文字輸入程序,將已輸入的讀音符號變換為該國語言對應的文字代碼。輸入代碼分解單元把上述輸入語言處理單元變換產(chǎn)生的文字代碼分解為指定在文字代碼結構表上應該特定的文字代碼欄內文字的本文代碼和指定代碼平面的語言指示代碼。本文代碼和語言指示代碼的存儲單元把輸入代碼分解單元分解了的本文代碼和語言指示代碼變換成單獨文字或單詞及文章中的文字之后存儲起來。編輯處理單元在進行插入、刪除、文字屬性變換等文件編輯時,與該編輯相關的各單元可以同時處理本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼。輸出代碼合成單元把從文本代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼輸入的語言標志中該語言的與相同讀符號對應的文字的文字代碼合成。字形存儲單元把通過事先存儲和使用字形生成程序在文字代碼結構表上登記的多種語言的各種文字的字形與該語言的文字代碼對應起來,就能夠輸出。文字輸出控制單元根據(jù)輸出代碼合成單元的合成結果,從文字字形存儲單元中取出并輸出對應的該國語言的文字字形。
圖1是本發(fā)明一個實施例的結構圖;圖2是上述實施例中輸入語言處理單元的工作流程圖;圖3是上述實施例中輸入代碼分解單元的工作流程圖4是上述實施例中編輯處理單元的工作流程圖;圖5是上述實施例中輸出代碼合成單元的工作流程圖;圖6是表示上述實施例中中文文字、日文文字代碼平面內容的圖;圖7是上述實施例中本文代碼和語言指示代碼的存儲單元內存儲的、已輸入的文字語言指示代碼;圖8是上述實施例中處理例的輸出結果;圖9是表示上述實施例中語言標志和語言代碼的圖;圖10是先有的多國語文件處理裝置的結構圖;圖11是一般日文字處理機的結構圖;圖12是擴展的語言標志和語言代碼一例的概念圖。
實施例在說明實施例以前,首先解釋本說明書的術語用法。
(1)日文和中文的名詞等原則上不存在單數(shù)與復數(shù)的區(qū)別。所以,在本說明書中寫為“文字”、“文字代碼”的場合,只要沒有特別注釋“文字串”、“一個文字”,那么既有單數(shù)的場合,也有復數(shù)的場合。進一步講,“存儲文字的本文代碼和語言指示代碼”、“指定文字代碼欄文字的本文代碼和指定代碼平面”等文章中的“文字”也是包含“文章”、“文件”或者“構成文章的各種文字”、“文件中的各種文字”的概念。
(2)“讀音符號”是不限于中文的字音符號等,而是也包括“字母”、“假名”等“表音文字”及“音素文字”等的概念,“文字”不限定于“漢字那樣的表音文字”,也包括“?!钡扔浱?,“假名”以及由多個漢字組成的“成語”等。
(3)“讀音符號”和“文字”間的對應關系也像漢字“?!睂倜哎椁摺薄挨!蹦菢硬痪窒抻?對1的關系。
下面說明作為本發(fā)明前提的技術。
(1)要想用日文字處理機實現(xiàn)顯示、打印中文文字的輸出等,就需要進行某種程度的改裝、附加裝備等。具體地講,按照字形驅動程序,參照文字代碼,把所需字形合成(臺灣Dyna字形的處理方式)或者采用存儲字根(radical)的組合方式的方法(所需存儲器是上述方法之半),按照字形生成程序,生成各種各樣的字形(臺灣文鼎字形處理方式)等。
(2)具有發(fā)揮從讀音符號對應的文字中選擇輸入者所要的文字的功能、或學習功能等所需的構成單元等。
但是,這些都與本發(fā)明的宗旨無關,所以,省略其說明。
下面,根據(jù)實施例說明本發(fā)明。
圖11是一般日文字處理機的結構圖,通過對本字處理機進行必要的最小限度的改造和附加設備,就能發(fā)揮與本發(fā)明有關的作用效果。在此圖中,111是輸入讀音符號或編碼功能符號的輸入單元。112是存儲日文文字輸入程序和英文文字輸入程序的語言處理存儲單元。113是參照已經(jīng)輸入的代碼種類,由語言處理存儲單元選擇了輸入程序后,將讀音符號變換為日文文字代碼的輸入語言處理單元。115是進行文件編輯的編輯處理單元。116是存儲當前制作編輯中文件上文字代碼及游標位置的文字代碼存儲單元。117是根據(jù)文字代碼取出對應的字形后,將已取出的字形向輸出單元118輸出的文字輸出控制單元。118是輸出文字的輸出單元,具有打印機、CRT等。
下面將以上的日文字處理機作為可以處理日文和中文的多國語字處理機,以其所發(fā)揮的功能為例,說明本發(fā)明的基本思想。
為了使字處理機中各種語言的文字代碼結構一致,下面,說明IBM5550代碼中表示中文文字代碼的結構。
如圖6所示,在上面的基礎上將中文的文字代碼劃分為2個代碼平面(CP1欄)。這里之所以劃分為2個代碼平面是由于正如前面所述的那樣,中文使用了大約是日文2倍的文字。在本圖中,橫軸(b2)給出的是文字代碼中的下位字節(jié),縱軸(b1)給出的是文字代碼的上位字節(jié)。再者,表內的數(shù)值表示與日文SHIFT JIS對應的JIS代碼的文字代碼。還有,CP1和CP2表示中文文字代碼的上位字節(jié)是在平面1(CP1欄)和平面2(CP2欄)中指定的。
也就是說,在將日文的JIS代碼作為文字代碼采用時,當出現(xiàn)用16進制表現(xiàn)的文字代碼2121和語言代碼100(由圖9示出)時,表示該文字相當于日文JIS代碼系列中的2121代碼。但是,當語言代碼為010時,表示該文字是相當于中文文字代碼平面2(CP2欄)上D040(D表示以16進制表示的13)代碼的文字。
同樣,當語言代碼為001時,表示該文字是中文文字代碼平面1(CP1欄)上的8140代碼。
由以上看出,根據(jù)日語字處理機的編輯程序,該文字代碼完全是日文JIS代碼本身。但是,通過使用代碼平面,盡管文字代碼是日語的JIS代碼,但是,可以特定中文文字,進而可以將已輸入的讀符號變換為中文文字等。所以,日語的文件編輯程序即使不作修改,也能夠使用?;蛘撸惨子谶M行新程序的編制、變換等。
下面,圖1示出與本發(fā)明有關的、能夠處理日文和中文的多國語文件處理裝置實施例的結構。在本圖中,11是輸入單元。12是輸入語言處理單元。13是輸入代碼分解單元。14是編輯處理單元。15是輸出代碼合成單元。16是本文代碼和語言指示代碼的存儲單元。17是輸出單元。18是文字輸出控制單元。19是語言處理存儲單元。
下面說明各單元的作用、結構等。
輸入單元11具有鍵盤等。語言處理存儲單元19存儲日文文字、英文文字、中文文字等三種文字輸入程序。輸入語言處理單元12參照由輸入單元11輸入的語言標志,從語言處理存儲單元19讀入對應的文字輸入程序后,將已輸入的讀符號變換為文字代碼。輸入代碼分解單元13根據(jù)中文文字代碼平面和日文文字代碼平面間的關系,將文字代碼分解為語言指示代碼和本文代碼。編輯處理單元14參照文本代碼和語言指示代碼的存儲單元16進行編輯處理。本文代碼和語言指示代碼的存儲單元16存儲制作中主文件的本文代碼、對應的語言指示代碼和指定輸入中文字位置的游標位置。輸出代碼合成單元15根據(jù)中文文字代碼平面和日文文字代碼平面的關系,參照語言指示代碼,把從本文代碼和語言指示代碼輸入的語言文字的文字代碼合成。文字輸出控制單元18參照語言指示代碼,利用輸出代碼取出對應的字形,向輸出單元17輸出。輸出單元17具有監(jiān)視器和打印機等,輸出其字形。
圖2示出本實施例中輸入語言處理單元12的工作流程。
下面參照本圖說明其工作。
(S21)由輸入單元11輸入語言標志和讀音符號。
(S22)判斷語言標志是否為漢字語言。如果是漢字語言,就進行到(S23)。如果不是漢字語言,就進行到(S25)。
(S23)參照語言標志,從語言處理存儲單元19中讀入對應的文字輸入程序。上述文字輸入程序例如日文假名變換程序、漢字變換程序等。
(S24)將已輸入的讀音符號變換為文字之后進入(S25)。
(S25)輸出語言標志和文字后,結束處理。還有,在上述(S22)中,如果不是漢字語言,就直接進入(S25),輸出語言標志和文字串后,結束處理。
圖3示出本實施例中輸入代碼分解單元13的工作流程。
下面參照本圖說明其工作。
(S31)由輸入語言處理單元12輸入語言標志和文字之后,進行到(S32)。
(S32)參照語言標志,選擇對應的分解程序,然后進入(S33)。
(S33)判斷語言標志是否是編輯功能符號。如果是編輯功能符號,就結束其處理。如果不是編輯功能符號,就進行到(S34)。
(S34)從已輸入的文字代碼中取出一個文字的文字代碼。
(S35)將上述取出的文字代碼分解為語言指示代碼和文本代碼。
(S36)判斷有無還未處理的文字代碼。如果有,就返回到上述(S34)。如果沒有,就進行到(S37)。
(S37)輸出本文代碼和語言指示代碼后,結束處理。
圖4示出本實施例中編輯處理單元14的工作流程。
下面參照本圖說明其工作。
(S41)由輸入代碼分解單元13輸入語言標志、本文代碼、文言指示代碼。
(S42)從本文代碼和語言指示代碼的存儲單元16中讀入編輯中文件的文件代碼、與其對應的語言指示代碼、表示成為當前編輯對象的文字位置的游標位置。
(S43)判斷語言標志是否是編輯功能符號。如果是編輯功能符號,就進行到(S45)。如果不是編輯功能符號,就進行到(S44)。
(S44)參照游標位置,分別將已輸入的本文代碼和語言指示代碼插入在編輯中的本文代碼和與其對應的語言指示代碼內,然后進行到(S46)。
(S45)根據(jù)功能符號的指示,參照編輯功能和游標位置,對編輯中的文件進行編輯處理。
(S46)將編輯中的文件內的本文代碼和與其對應的語言指示代碼存儲在本文代碼和語言指示代碼的存儲單元16后,進入(S47)。
(S47)將要輸出的本文代碼及其語言指示代碼輸出到輸出單元。
圖5是本實施例中輸出代碼合成單元15的工作流程。
下面說明本圖所示的工作。
(S51)由編輯處理單元14輸入本文代碼和與其對應的語言指示代碼。
(S52)取出一個文字中的本文代碼和與其對應的語言指示代碼。
(S53)參照語言代碼,選擇文字代碼合成程序。
(S54)根據(jù)上述合成程序,將文字中的本文代碼變換成文字代碼。置換原文字中的本文代碼。
(S55)判斷有無還未處理的本文代碼。如果還有,就返回到上述(S52);如果沒有,就進行到(S57)。
(S56)輸出文字代碼和與其對應的語言指示代碼后,結束處理。
關于像以上那樣構成的本實施例多國語文件處理裝置,下面說明其工作。
最初,本裝置的各單元全部設定為初始狀態(tài)。
由輸入單元11將「da4Iu4cceng1“ruan3ti3”uei2」讀音符號和語言標志LC=1(如圖9(b)所示那樣,這指的是,輸入者意圖的文字是中文繁體字的1)輸入到語言處理單元12上。
根據(jù)上述LC的值「1」,從語言處理存儲單元19中讀入中文繁體字的漢字變換程序。
上述漢字變換程序將上述讀符號變換為「大陸稱″軟體″為」的文字代碼。
在輸入代碼分解單元13中,參照上述語言標志LC和文字代碼,將文字代碼分解為語言指示代碼LPS={001,001,001,001,001,001,001,001}和本文代碼TCS={374b,5674…}。
將由上述輸入代碼分解單元13輸出的本文代碼TCS和語言指示代碼LPS送到編輯處理單元14。在編輯處理單元14中,由于此時的本文代碼和語言指示代碼的存儲單元16中未存儲任何內容,所以,直接將上述LPS和TCS的值存儲在本文代碼和語言指示代碼存儲單元16中。這時,游標位置在本文的文末。所以,為了將變換結果輸出到監(jiān)視器,輸出上述LPS和TCS。
在輸出代碼合成單元15中,參照由編輯處理單元14輸出的語言指示代碼和本文代碼,根據(jù)語言指示代碼,選擇適當?shù)暮铣沙绦?,由本文代碼合成文字代碼。
在文字輸出控制單元18中,參照文字代碼和與其對應的語言代碼,取出適當?shù)淖煮w,輸出到輸出單元17。由輸出單元17將取出的字體在監(jiān)視器上顯示出來。
接著由輸入單元100,把表示中文簡體字的語言標志「2」輸出到輸入語言處理單元12上。此時,語言標志LC的值被更新成為2,并且,讀音符號的內容也變成「“ruan3jian4”」。
此時,在輸入語言處理單元12中,通過參照語言標志,從語言處理存儲單元19中讀入中文簡體字的漢字變換程序。
上述漢字變換程序將已輸入的讀音符號變換為“軟件”的文字代碼串。
在輸入代碼分解單元13中,在參照語言標志,將文字代碼分解為語言指示代碼LPS={011,011,011,011}和文本代碼TCS={6624,706f,5880,6624}以后,將上述LPS和TCS送到編輯處理單元14。
在編輯處理單元14中,由于已經(jīng)輸入的語言標志不是編輯功能符號,所以,要參照本文代碼和語言指示代碼的存儲器16中的本文代碼,語言指示代碼和游標位置,將上述本文代碼、語言指示代碼存儲到本文代碼和語言指示代碼的存儲器16中。此時,本文代碼和語言指示代碼的存儲器16中的語言指示代碼為「001,001,001,001,001,001,001,001,001,001,001,001」(圖7中所示的開頭12個),本文代碼為374b,5674,…,6624,706f,5880,6624。
接著,在輸出代碼合成單元15中,由編輯處理單元14輸出的本文代碼、語言指示代碼合成文字代碼。
在文字輸出控制單元18中,根據(jù)上述文字代碼和與其對應的語言代碼,分別取出簡體字繁體字后,輸出到輸出單元17。此時,監(jiān)視器上顯示「大陸稱″軟體″為“軟件”〕」的文字。如果用日文及英文(半角)輸入相同意思的文件,在輸出單元17(監(jiān)視器)上顯示的話,就成為圖8所示的那樣。此時的本文代碼和語言指示代碼存儲單元中的語言指示代碼的內容示于圖7。
在本圖中,示出把3個0和1組合構成的合計為41個語言指示代碼。并且,最初的8個「001」表示「大」,「”」等中文繁體字(圖9中的「繁體字1)。后面的4個「011」表示「件」等中文簡體字。后面的5個「00」表示「,」,「日」等中文繁體字。后面的8個「100」表示 「”」,「ソ」等日文文字。后面的5個「001」表示「,」,「英」等中文繁體字。后面的10個「000」表示「”」,「S」等英文文字(ASCII)。最后的一個「001」表示中文繁體字「?!褂梢陨险f明可知,可將日文字處理機作為中文字處理機使用,進而也可以作為多國語文件處理裝置使用。
以上根據(jù)實施例說明了本發(fā)明,但是,不言而喻,本發(fā)明不限于上述實施例。也就是說,本發(fā)明還包括以下內容。
(1)語言代碼的比特數(shù)可根據(jù)處理對象的語言數(shù)目適當增減。
(2)關于代碼平面的指定,可以根據(jù)處理對象的語言種類變更。
(3)由于語言指示代碼是由0和1構成的數(shù)據(jù),所以,可另項歸納,但是,要在保持文字間對應關系的基礎上存儲到磁盤上等,此時,例如采用以霍夫曼(Hoffman)等方法壓縮的技術。
(4)關于輸入代碼的分解和輸出代碼的合成,可以不參照表,而是使用計算公式進行。
(5)如圖12所示,稍微擴展語言代碼和語言標志,就能同時處理中文、日文、英文、朝鮮文、阿拉伯語、歐洲系語言(英、德、俄等語言因文字字數(shù)少,完全可以放在日文文字代碼欄中)。
或者,使代碼平面1、2、3對應于英文、德文、俄文,也挪用到使用英文、德文文字的德語、俄語。
還有,在英文數(shù)字的場合,由于讀音符號就是該語言形成的文字,所以,文字輸入程序實際上是不需要的。
(6)由于制造等原因,可以把本發(fā)明的一個必不可少的構成要素(主要條件、部分)在物理上、機械上作為多個部件等,反過來,可將多個構成要素進行一體化,或者適當?shù)貙⑺鼈兘M合起來。
(7)改造現(xiàn)有的字處理機等,或者把新程序包括進去,作為具有本發(fā)明的功能的多國語文件處理裝置。
(8)輸出可以輸出到存儲媒體及外部通信線路上。同樣,輸入也可由存儲媒體及外部通信線路來完成。
(9)日文文件為主,為了便于那些還未那樣平凡使用中文文件的制作,只要沒有特別指示,就按日文處理。
(10)其他在不改變本發(fā)明宗旨的范圍內進行的變形有,用語言標志和讀音來代替在實施例中還未使用的“隱含語言指示信息”等。
〔發(fā)明效果〕像上面說明的那樣,與本發(fā)明有關的多國語文件處理裝置完全解除了先有的問題點。具體地講,得到了以下效果。
(1)既便是不使用多國語對應代碼系列的文件處理裝置,也容易作為多國語文件處理裝置使用。例如,雖然應用程序中的信息多少作一些修改,但是,可以大部分原封不動地利用其代碼結構和應用程序,所以,可將日文字處理機作為處理日文和中文雙方的字處理機。
(2)不需要重新制作相關編輯程序。所以,任何一種語言的文件處理裝置,都可以迅速、高效率地作為多國語文件處理裝置。例如,在上述日文處理機也處理中文的場合,由于分解程序、合成程序等能夠挪用,所需的工時減少約1/3。
(3)通過使用語言代碼平面,各種語言的代碼結構可以相同。所以,便于將來系統(tǒng)擴展、改進時的軟件開發(fā)。
由于以上效果,本發(fā)明的實用效果非常大。
權利要求
1.一種中文和日文兼用的文件處理裝置,其特征在于具有輸入單元、文字代碼結構表、語言處理存儲單元、輸入語言處理單元、輸入代碼分解單元、本文代碼和語言指示代碼的存儲單元、編輯處理單元、輸出代碼合成單元、文字字形存儲單元和文字輸出控制單元;輸入單元輸入語言標志和讀音符號;文字代碼結構表具有對日文文字分配了一個代碼平面(CodePlane)、對中文文字至少分配了2個代碼平面的文字代碼欄,根據(jù)代碼平面和文字代碼欄的指定,決定日文或中文兩者之一及其語言的文字;語言處理存儲單元存儲將已經(jīng)輸入的讀音符號變換為該中文文字的中文文字輸入程序和將已經(jīng)輸入的讀音符號變換為該日文文字的日文文字輸入程序;輸入語言處理單元根據(jù)已經(jīng)由所述輸入單元輸入的語言標志,根據(jù)所述語言處理存儲單元中讀入的是中文文字輸入程序和日文文字輸入程序兩者中的哪一方,讀入該方的程序,并將已經(jīng)輸入的讀音符號變換成與該語言對應的文字代碼;輸入代碼分解單元把所述輸入語言處理單元變換產(chǎn)生的文字代碼分解為指定在所述文字代碼結構表上應該特定的文字代碼欄內文字的本文代碼和指定代碼平面的語言指示代碼;本文代碼和語言指示代碼的存儲單元存儲已由所述輸入代碼分解單元分解的本文代碼和語言指示代碼;編輯處理單元在進行插入、刪除、文字屬性變換等文件編輯時,與該編輯相關的各單元可以同時處理所述本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼;輸出代碼合成單元根據(jù)所述本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼,把輸入讀音符號中的該中文文字代碼或日文文字代碼合成;文字字形存儲單元通過把已經(jīng)登記在所述文字代碼結構表中的中文文字及日文文字的字形與該語言的文字代碼對應起來,然后予以輸出;文字輸出控制單元根據(jù)所述輸出代碼合成單元的合成結果,從所述文字字形存儲單元中取出并輸出對應的中文文字或日文文字的字形。
2.按權利要求1所述的中文和日文兼用的文件處理裝置,其特征在于所述文字代碼結構表具有日文文字代碼欄;所述輸入代碼分解單元具有把輸入語言處理單元變換產(chǎn)生的文字代碼分解為語言指示代碼和日文文字代碼的輸入代碼日文代碼分解器;所述本文代碼和語言指示代碼的存儲單元具有將日文文字代碼作為本文代碼存儲的日文文字代碼存儲器。
3.一種多國文件處理裝置,其特征在于,具有輸入單元、文字代碼結構表、語言處理存儲單元、輸入語言處理單元、輸入代碼分解單元、本文代碼和語言指示代碼的存儲單元、編輯處理單元、輸出代碼合成單元、文字字形存儲單元和文字輸出控制單元;輸入單元輸入語言標志和讀音符號;文字代碼結構表具有根據(jù)該國語言的文字數(shù)目對于多國語,分配了至少一個代碼平面(Code Plane)的文字代碼欄,根據(jù)代碼平面和文字代碼欄間的指定,決定各國語言的種類及其文字;語言處理存儲單元存儲把與所述文字代碼結構表對應的各國語言用的、并且已輸入的讀音符號變換成與該國語言對應文字的各國語言用的多種文字輸入程序;輸入語言處理單元根據(jù)所述輸入單元輸入的語言標志,從所述語言處理存儲單元中讀入該國語言用的文字輸入程序,將已輸入的讀音符號變換為該國語言對應的文字代碼;輸入代碼分解單元把所述輸入語言處理單元的變換產(chǎn)生的文字代碼分解為指定在所述文字代碼結構表上應該特定的文字代碼欄內文字的本文代碼和指定代碼平面的語言指示代碼;本文代碼和語言指示代碼的存儲單元存儲已由輸入代碼分解單元分解的本文代碼和語言指示代碼;編輯處理單元在進行插入、刪除、文字屬性變換等文件編輯時,與該編輯相關的各單元可以同時處理所述本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼;輸出代碼合成單元根據(jù)所述本文代碼和語言指示代碼存儲單元中存儲的本文代碼和語言指示代碼,把與已輸入語言標志中與該語言相同的讀音符號對應的文字的文字代碼合成;字形存儲單元通過把已經(jīng)登記在所述文字代碼結構表中的多種語言各種文字的字形與該語言的文字代碼對應起來,然后予以輸出;文字輸出控制單元根據(jù)所述輸出代碼合成單元的合成結果,從所述文字字形存儲單元中取出并輸出對應的該國語言的文字字形。
全文摘要
可以將一種語言用的字處理機用于其它種語言。根據(jù)已經(jīng)輸入的語言標志,讀入要處理的語言文字輸入程序。將已經(jīng)輸入的文字代碼分解成本文代碼和語言指示代碼。對已經(jīng)分解的本文代碼和語言指示代碼同時進行編輯處理。由語言指示代碼和本文代碼合成與其對應的文字代碼。把該對應的字形輸出。
文檔編號G06F17/20GK1153355SQ95119230
公開日1997年7月2日 申請日期1995年11月10日 優(yōu)先權日1994年11月11日
發(fā)明者郭俊桔 申請人:松下電器產(chǎn)業(yè)株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1