專利名稱:華語拼音、單拼輸入統(tǒng)一方案及智能轉(zhuǎn)換翻譯的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種龔碼華語拼音、單拼輸入、譯名統(tǒng)一方案及中文方塊字與拼音文字、中文字編碼之間的轉(zhuǎn)換。本發(fā)明的龔碼華語拼音方案在包括專用標(biāo)調(diào)字母而不超出英文26個(gè)字母的范圍內(nèi),既符合現(xiàn)行拼音方案的使用習(xí)慣,又全面接近英文的常規(guī)字音拼寫規(guī)范,易學(xué)易記,拼式簡單,由漢語拼音的單音節(jié)最多6個(gè)音碼減少到5個(gè)音碼,音節(jié)之間界限分明,既可用于中文字音和聲調(diào)的標(biāo)注,又可獨(dú)立形成與國際語言文字接軌的拼音文字,字、音、碼高度融合,可互顯互轉(zhuǎn)。經(jīng)過分化定型、分詞連寫的全拉丁化龔碼華語拼音文字是具有法律準(zhǔn)確度的完備的拼音體系,是具有中國特色的簡潔生動(dòng)的拼音體系,可與中文方塊字語句直接對(duì)譯,形成“一語兩文”的合理布局。龔碼單拼科學(xué)合理,基于人們已有的知識(shí)儲(chǔ)備,通過科學(xué)地選取22個(gè)音碼和4個(gè)調(diào)碼并有規(guī)律的組合,不用對(duì)中文字進(jìn)行拆解分析,使所需的記憶量降到最低限度;龔碼單拼充分利用第一鍵,實(shí)現(xiàn)了字字分流、字詞分流、詞詞分流,許多字可一鍵輸出,無需記部首即可快速輸出,在降低重碼率和平均擊鍵次數(shù)的同時(shí),通過建立碼位與鍵位字母之間的自然關(guān)聯(lián),有效地解決中文字輸入難學(xué)易忘的問題,給人們提供一種既規(guī)范又簡捷、能即學(xué)即用、優(yōu)于目前各種雙拼輸入的計(jì)算機(jī)中文字快速輸入方法,可有效地結(jié)束目前中文字音輸入“萬碼奔騰”的局面,讓中文字輸入進(jìn)入一個(gè)有序的狀態(tài),并可同時(shí)用于中文方塊字和拼音文字的快速輸入。龔碼譯名方案可科學(xué)地統(tǒng)一簡繁體字使用區(qū)的不同譯名標(biāo)準(zhǔn),并可反譯回原外文名稱的常規(guī)形式。
中文字是世界上最古老的文字之一,已有5000多年的歷史,曾堪稱是舉世無雙、獨(dú)特而偉大的人類智慧展現(xiàn)。每一個(gè)字都有獨(dú)立的形體、獨(dú)自的生命,這種大體依形命意、以筆畫為結(jié)構(gòu)主體的方塊字,具有其他拼音文字所沒有的許多優(yōu)點(diǎn),如方正、整齊、穩(wěn)定、靈活、優(yōu)美、意涵豐富等等。中文字是中國發(fā)明的,然而其優(yōu)點(diǎn)也為他國利用,日本借用了中文字的偏旁部首,韓國和朝鮮借用了中文字的間架結(jié)構(gòu)。前者將音素字母排列成音節(jié)方塊,后者則是由中文字筆劃簡約而來。據(jù)有關(guān)資料統(tǒng)計(jì),目前世界上使用中文字的人口約占總?cè)丝诘?6%以上。除中國大陸、中國臺(tái)灣、中國香港特區(qū)外,日本、韓國、朝鮮、新加坡、馬來西亞、越南等華人社會(huì),也都不同程度地正在使用或使用過中文字。
然而,在世界進(jìn)入知識(shí)爆炸的當(dāng)今時(shí)代,中文方塊字卻遇上了障礙。中文字的缺點(diǎn)是“三多五難”字?jǐn)?shù)多、筆畫多、讀音多,因而難認(rèn)、難讀、難寫、難記、難用。著名教育家呂叔湘先生說學(xué)生們用“十年的時(shí)間、2700多課時(shí),用來學(xué)中國語文,卻是大多數(shù)不過關(guān)”。一個(gè)人從小學(xué)到大學(xué)畢業(yè),歷時(shí)十五、六年,從形、音、義上基本掌握的中文字約為3500個(gè)“常用字和次常用字”,多者為4000多個(gè)字。這樣平均每年只能認(rèn)識(shí)二百多個(gè)字?!缎氯A字典》選收一萬一千多字,說是“供中等文化程度讀者使用的”,但就是具有中文相關(guān)專業(yè)高級(jí)職稱的專家、學(xué)者、教授,大多也認(rèn)不全簡、繁體中文字。過去一直說中文從古到今累計(jì)的字匯量為六萬多字;后來出版的《中文字?!肥珍浗湃f字;近來又有學(xué)者為了證實(shí)中文字的宏博,提出數(shù)據(jù)說遠(yuǎn)超過十萬字;有些機(jī)構(gòu)還在“征求新字”。殊不知將中文字匯量說得越多,越容易嚇跑某些想學(xué)中文的外國人。許多人求師學(xué)藝苦練中文“硬筆書法”,從幼年開始一直練到白發(fā)蒼蒼。一個(gè)民族把如此巨大的精力耗費(fèi)在學(xué)會(huì)寫字上,不能說不是對(duì)人的精力的一種浪費(fèi)。如果把這么多中文學(xué)習(xí)使用者的這么多精力轉(zhuǎn)用于學(xué)習(xí)研究現(xiàn)代科學(xué)知識(shí)上,將會(huì)創(chuàng)造“驚世的”難以衡量的價(jià)值。使用拉丁字母為拼音文字的國家基本上沒有打字行業(yè),因?yàn)楦静恍枰?。以中國現(xiàn)有的情形來看,似乎知識(shí)水平越高的地方,打字員越多。今天的打字成為一種專業(yè)技能,打字行業(yè)及相關(guān)人員的人力浪費(fèi),可以看成是整個(gè)社會(huì)為中文方塊字作為唯一文字形式所付出的成本。
古代羅馬人所用文字為拉丁文,所用字母稱拉丁字母,又稱羅馬字母?,F(xiàn)在的英文、法文、西班牙文所用的是已加以補(bǔ)充的字母,也泛稱拉丁字母。拉丁化的華語拼音文字,數(shù)百年來一直是中文現(xiàn)代化運(yùn)動(dòng)的一個(gè)偉大目標(biāo)。中國自明朝末年海禁大開之后,歐西人士紛紛來華傳教、經(jīng)商或敦睦邦交;為便于學(xué)習(xí)中文,采用拉丁字母拼注中文讀音。萬歷年間天主教耶穌會(huì)傳教士利馬竇著《泰西字母》,天啟年間傳教士金尼閣著《西儒耳目資》,系統(tǒng)漸趨完整。其中1859年清末英國駐華公使威妥瑪(SirThomas Wade)在《語言自邇集》中所制訂的羅馬字譯音流傳尤廣,曾被學(xué)習(xí)華語者競相采用?,F(xiàn)在繁體字使用區(qū)所采用的人地名譯音,仍多為威妥瑪拼法(其后由翟理斯[H.A.Giles]略加修訂)。清末民初,中國的一些仁人志士也已開始研制出《拼音字譜》。1906年,朱文熊在其出版的《湘蘇字母》中指出“與其造世界未有之新字,不如采用世界所通行之字母?!边@開始了中國人自覺地采用世界通行的拉丁字母來代表華語語言信息(語意信息和語音信息)的歷史。后來有了中國人自己設(shè)計(jì)的華語拉丁化語音拼音方案國語羅馬字、拉丁化新文字方案,一直到現(xiàn)在的《漢語拼音方案》及中國臺(tái)灣所試用的《通用拼音方案》。
現(xiàn)行《漢語拼音方案》是在二十世紀(jì)五十年代制訂出來的,是在過去各種注音法的基礎(chǔ)上發(fā)展起來的,是各種華語注音法的總結(jié)和發(fā)展?!稘h語拼音方案》除了可以用來給中文方塊字注音和推廣普通話之外,還用來作為中國各少數(shù)民族創(chuàng)新和改革文字的共同基礎(chǔ),用來幫助外國人學(xué)習(xí)華語,用來音譯人名、地名和科技術(shù)語等。在中國語言文字的發(fā)展進(jìn)程中,尤其是在普及普通話方面,漢語拼音曾作出了卓越的貢獻(xiàn)。
從五十年代起,許多文改專家開展?jié)h語拼音文字的設(shè)計(jì),時(shí)間長達(dá)數(shù)十年,投入了龐大的人力物力,設(shè)計(jì)的方案達(dá)六百余件,最后未能獲得滿意的結(jié)果,才宣告放棄。因此,華語拼音化的課題是眾多專家未能突破的難題。今天,漢語拼音的許多不足之處逐步暴露出來。目前國際上使用較廣泛的語言,除中文外,是英語等印歐語系語言。母語為非英語的人,通常第一外語也是選擇英語。常用的計(jì)算機(jī)鍵盤按英文字母設(shè)計(jì),當(dāng)計(jì)算機(jī)沒有中文操作系統(tǒng)或中文軟件時(shí),韻母ü及漢語拼音的聲調(diào)沒辦法輸入。有關(guān)方面后來曾規(guī)定凡是漢語拼音方案規(guī)定可省略ü上兩點(diǎn)的在通用鍵盤上用鍵位u表示;不能省略兩點(diǎn)仍需寫作ü的,在通用鍵盤上用v替代。但在國際流行語言中,v音與ü音相去較遠(yuǎn)。漢語拼音方案中,q、x、zh、ch、sh、ao等字母與英文的拼寫發(fā)音差別較大。如x在英語中的字音為[ks];sh的字音為[∫],反而近似于漢語拼音的x(西);再如ch在英語中的字音為[t∫],近似于漢語拼音的q(期)。漢語拼音方案還有其他問題,如單音節(jié)拼式過長,標(biāo)調(diào)不方便,拼寫規(guī)則過于繁雜,分化不了同音字,不方便排序、檢索、電子傳輸、信息處理等。目前,拼音方案只剩下為中文方塊字標(biāo)注字音的功能。
英國期刊《經(jīng)濟(jì)學(xué)家》的一篇文章把英語稱作“語言帝國”。在全世界的60多億人口中,3.8億人的母語是英語,有大約2.5億人的第二語言是英語,10億人在學(xué)英語,20億人接觸英語。預(yù)測(cè)至2050年,世界上一半人口的英語將達(dá)到熟練程度。新加坡、日本等國采用中文字,曾使國人感到自豪。遺憾的是,新加坡等國學(xué)習(xí)中文的人數(shù)正逐年減少。與此形成鮮明對(duì)比的是,據(jù)最近中國教育部宣布的統(tǒng)計(jì),在中國大陸有八千五百萬基本不識(shí)字的人,并呈全國每年新增文盲大約五十萬的趨勢(shì)。其中九成分布在農(nóng)村,五成在西部地區(qū)。在農(nóng)村貧窮落后地區(qū),因貧困產(chǎn)生文盲,又由文盲導(dǎo)致貧困,已形成惡性循環(huán)。由于近年輟學(xué)現(xiàn)象嚴(yán)重,全國約二百個(gè)縣尚未普及小學(xué)教育,人口流動(dòng)增加,老文盲未完全掃除,新文盲又不斷產(chǎn)生。
澳大利亞的電視教育節(jié)目中聳人聽聞地預(yù)計(jì)在21世紀(jì)中英語的使用人口將從目前的三億發(fā)展成十二億,而華語的使用人口將從目前的十億減少到三億。有人認(rèn)為,一名知識(shí)分子可以不懂華語,但不能不懂英語,因?yàn)橛⒄Z文獻(xiàn)的內(nèi)容涵蓋了所有的學(xué)術(shù)領(lǐng)域。因而有國際語言學(xué)家提出如果華語能科學(xué)化,充分發(fā)揮其特長,世界語言學(xué)的中心將轉(zhuǎn)移到中國,使全人類在信息的享受數(shù)量以及思維速度上進(jìn)入一個(gè)嶄新的階段,掀起信息社會(huì)的一個(gè)本質(zhì)上的革命。
由于軟件技術(shù)的核心部分均以英語為背景產(chǎn)生的,英語成了軟件的核心語言。時(shí)至今日,其他語言的軟件都以英語為“內(nèi)核”,其他語種只是外殼。因而在國際軟件產(chǎn)業(yè)的競爭中,英語國家總量占有絕對(duì)的優(yōu)勢(shì)。印度的整體國力不如中國,但軟件出口額遠(yuǎn)遠(yuǎn)大于中國,其主要原因就是占了語言優(yōu)勢(shì)。然而,軟件產(chǎn)業(yè)是幾乎所有國家在有能力時(shí)都給予足夠重視的產(chǎn)業(yè),因?yàn)樗粌H是當(dāng)前和今后國際經(jīng)濟(jì)中的一個(gè)長期存在的新型基礎(chǔ)產(chǎn)業(yè),而且軟件產(chǎn)業(yè)的競爭能力本身即直接體現(xiàn)著一個(gè)國家的科技競爭能力。因而華語在國際范圍內(nèi)的推廣,軟件業(yè)對(duì)華語及華語文化的了解,直接關(guān)系到中文軟件產(chǎn)品打進(jìn)國際市場(chǎng)的能力,和與國外軟件競爭和對(duì)接的能力。
外國人為了形容一件事很難,有時(shí)會(huì)說“像學(xué)中文一樣難”(as difficult as learningchinese)。那么,中文究竟難在什么地方呢?中文字和英文字母都是語言文字的最基本單位,用以構(gòu)成詞匯、句子,傳達(dá)一定的信息,是信息的載體。為了對(duì)每一個(gè)中文字和英文字母所負(fù)載的信息進(jìn)行量化分析,現(xiàn)代信息學(xué)用熵來衡量平均信息量,熵表示指定符號(hào)出現(xiàn)的不確定性。英文采用的拼音字母只有26個(gè);華語以方塊字為書寫單位,字?jǐn)?shù)成千上萬,顯然其隨機(jī)出現(xiàn)的不確定程度比英文字母的不確定程度要大得多,由此而言每個(gè)中文字載荷的信息量遠(yuǎn)遠(yuǎn)大于一個(gè)英文字母的信息載荷量。但每個(gè)中文字出現(xiàn)的概率相差很大,生僻字出現(xiàn)的機(jī)率非常小,而每個(gè)英文字母出現(xiàn)的概率相差不大,因此用一種語言中各字符的出現(xiàn)概率為權(quán)數(shù),求得所有字符的熵的加權(quán)平均值,來表示該種語言各個(gè)字符的平均信息載荷量,這個(gè)加權(quán)平均值稱為零階熵值。語言文字的另一種綜合特征統(tǒng)計(jì)參數(shù)是冗余度,用它可以反映由于語言結(jié)構(gòu)的原因造成的句子中冗余符號(hào)的所占比例?,F(xiàn)代華語中的量詞就是冗余的中文字。但冗余的字符并非全無用處,某些字去掉后句子就不符合語法規(guī)范,或者影響到語義的精確性,就像電報(bào)用語冗余度低,卻容易產(chǎn)生歧義。以下將華語與英語作一些比較1.有語言學(xué)家經(jīng)過統(tǒng)計(jì)計(jì)算,得出英語字母的零階熵值為4.03比特,中文字的零階熵值為9.71比特。這表明中文字的字義比英語字母的字義豐富。
2.以詞為單位,可以計(jì)算詞的零階熵值。經(jīng)計(jì)算英語詞的零階熵為10.00比特,華語詞的零階熵為11.46比特。這表明華語的詞義也比英語豐富。
3.英語冗余度的上限為80%,下限為67%,平均值為73%;現(xiàn)代華語冗余度的上限為73%,下限為55%,平均值為63%。冗余度高的語言結(jié)構(gòu)性好,語言信息精確,糾錯(cuò)能力強(qiáng);冗余度低的語言則因?yàn)榫珶捲蛴欣诰幋a,易于信息傳輸,口頭和文字表達(dá)都比較靈活。聯(lián)合國使用的幾種語言,同一份文件,需要幾種版本的材料,中文版的材料比其他語言版本的材料薄得多,此一事實(shí)證明了華語的精煉性。
4.一般英美大學(xué)畢業(yè)生的英語詞匯量在八千左右,而現(xiàn)代華語的常用詞匯有四、五萬,其中所蘊(yùn)含的文化內(nèi)涵可謂博大精深。英文中的詞語義項(xiàng)具有名詞、形容詞、動(dòng)詞、副詞多種詞類形式,也就是說幾個(gè)詞語表達(dá)的是同一義項(xiàng),只是語法功能不同而已,因而英文中常用的義項(xiàng)就更少了。
5.華語組詞方便,用字與字的組合來造詞十分方便,如電,電燈、電話、電視、電線、電扇、電腦、電池、電影、電流、電車、電報(bào)、電梯,易學(xué)易懂;就是生詞,一見便能知其大意,也非常便于記憶。用英文表達(dá)上述各詞,則互不相關(guān),難以記憶。比如alto,華語譯成“女低音”,一看便知其義,在英語中卻必須解釋為The lowest femalvoice。再如“肺炎”一詞,一看便知是肺部發(fā)炎,而英語的肺炎是pneumonia,與肺lung毫無共同之處。
6.有觀點(diǎn)認(rèn)為華語比英語易生歧義,舉出“父在母先亡”與“父在,母先亡”之類的例子。實(shí)際上英語更易產(chǎn)生歧義,如“Albert said the(that)boss is stupid.(艾伯特說老板很笨)”與“Albert,said the(that)boss,is stupid.(老板說艾伯特很笨)”之類的語句,在英語中比比皆是?!癐t’s a cock”,即便根據(jù)上下文,也有難說清的時(shí)候,因?yàn)椤癱ock”作名詞時(shí),可理解為“公雞、雄禽、雄龍蝦、雄蟹、雄鮭、龍頭、旋塞、閥門、擊鐵、風(fēng)信雞、風(fēng)標(biāo)、首領(lǐng)、老兄、伙計(jì)、目標(biāo)、雞鳴、黎明、陽具、草堆、糞堆”等數(shù)十種意思。再如“take care of”,既有“愛護(hù)、照料”,又有“對(duì)付、收拾”的矛盾義項(xiàng)。
由以上比較可知,簡繁體中文字的形、音、義、詞等多方面不統(tǒng)一及中文字形復(fù)雜是華語的普及速度緩慢的重要原因。除了中文的字形比英語的26個(gè)字母復(fù)雜,其他很多方面都不比英文遜色,甚至比英文更科學(xué)。英文并不是音標(biāo)輸入,因而并不是全表音文字,而是以表音為主的文字。中文字有許多超越英文等語言文字的優(yōu)勢(shì),如精煉,言簡意賅,冗余度低,以最少的符號(hào)表達(dá)最豐富的含義。每一種文字都有其強(qiáng)烈的民族特點(diǎn),中文字的顯著特點(diǎn)就是音節(jié)清晰分明,單字獨(dú)立性強(qiáng),組詞位置靈活。那么,華語拼音與英文相比呢?如果能在26個(gè)英文字母的范圍內(nèi)解決包括聲調(diào)在內(nèi)的問題,那么目前普遍認(rèn)為,中文所形成的拼音文字,主要的難點(diǎn)是同音同調(diào)字詞和閱讀速度。而在同音同調(diào)字詞的問題中,焦點(diǎn)又是同音同調(diào)雙音節(jié)詞。
以下本發(fā)明將解決上述各種問題。經(jīng)過分化定型、分詞連寫的全拉丁化龔碼華語拼音文字,將同時(shí)解決閱讀速度問題。國際語言文字的發(fā)展,本來就是一個(gè)從形象向抽象演變的過程。
為了解決以上華語拼音和字音輸入所遇上的各種問題,便于計(jì)算機(jī)“智能”統(tǒng)計(jì)、研究、分析,高效、快速處理華語拼音和字音輸入等信息,使系列統(tǒng)一方案得到科學(xué)的完整的規(guī)范化的結(jié)果,本發(fā)明創(chuàng)造了“聲頻、韻頻、調(diào)頻、碼位均布荷載、音碼、調(diào)碼、首碼、單拼字、雙拼字、雙拼詞、常拼帶調(diào)、異拼略調(diào)”等概念,統(tǒng)計(jì)按綜合字、詞頻和字、詞頻方向平均值的相應(yīng)范圍。
1.無調(diào)音頻華語不帶聲調(diào)的單音節(jié)出現(xiàn)的次數(shù)除以不帶調(diào)單音節(jié)總出現(xiàn)次數(shù)后得到的百分比結(jié)果。
2.帶調(diào)音頻華語帶聲調(diào)的單音節(jié)出現(xiàn)的次數(shù)除以帶聲調(diào)單音節(jié)總出現(xiàn)次數(shù)后得到的百分比結(jié)果。
3.聲頻每一聲母出現(xiàn)的次數(shù)除以聲母總出現(xiàn)次數(shù)后得到的百分比結(jié)果。如聲頻較高的sr為7.7482%,d為7.7292%;聲頻較低的p只有1.3779%,ts為1.2715%。
4.韻頻每一韻母出現(xiàn)的次數(shù)除以韻母總出現(xiàn)次數(shù)后得到的百分比結(jié)果。如韻頻較高的i為8.9289%,u為7.7292%;韻頻較低的uai只有0.4220%,yun為0.3939%。
5.調(diào)頻每一聲調(diào)出現(xiàn)的次數(shù)除以聲調(diào)總出現(xiàn)次數(shù)后得到的百分比結(jié)果。陰平為21.528%,陽平為21.597%,上聲為18.029%,去聲為34.547%,輕聲為4.299%。
6.碼位均布荷載由于在中文的語音輸入方案中,聲、韻母與英文鍵盤上的字母并非一一對(duì)應(yīng),且韻母種類超過英文鍵盤上的字母總數(shù),為了有效減少重碼,根據(jù)聲頻、韻頻等對(duì)碼位分布作合理調(diào)整,以達(dá)到統(tǒng)一和最佳化目的。
7.調(diào)碼在龔碼華語拼音方案中,以q、v、x、z、’五個(gè)鍵位依序表示陰平、陽平、上聲、去聲、輕聲五種聲調(diào),所用字符稱為調(diào)碼,所在鍵位稱為調(diào)鍵。
8.音碼英文鍵盤的26個(gè)字母中,除開四個(gè)調(diào)鍵,其他22個(gè)字母用于字音拼寫和輸入,所用字符稱為音碼,所在鍵位稱為音鍵。
9.首碼即龔碼單拼輸入方案的第一碼。對(duì)于單拼字首碼為唯一音碼,對(duì)于雙拼字首碼為第一音碼。如“?!睘閱纹醋郑琤為“?!钡氖状a也是唯一音碼?!扒f”為雙拼字,w為“莊”的首碼。
10.單拼字首碼即可完成字音輸入的字,如富f、樣l、月g等。若接著輸入調(diào)碼即為帶調(diào)單拼字,如安kq。
11.雙拼字需兩碼完成字音輸入的字,如黃hh、學(xué)cg、里li等。若接著輸入調(diào)碼即為帶調(diào)雙拼字,如城eav。
12.雙拼詞兩碼完成詞音輸入的雙字語詞,由兩個(gè)單拼字組成,如移植iw、世紀(jì)aj等。
13.三拼詞三碼完成詞音輸入的雙字和三字語詞,其中雙字語詞由一個(gè)單拼字和一個(gè)雙拼字組成,三字語詞的首碼與輸入相符,如飄揚(yáng)pml、中國心wgc等。
14.四拼詞四碼完成詞音輸入的雙字、多字(四字以上)語詞,其中雙字語詞由兩個(gè)雙拼字組成,四字語詞的首碼與輸入相符,四字以上語詞的前三字與末字的首碼與輸入相符,如龔碼gima、華語拼音hypo、千里之行始于足下olwc等。
15.常拼帶調(diào)帶調(diào)的常規(guī)拼寫方式,用于為中文方塊字標(biāo)注字音;也是龔碼拼音文字所采用的基本形式。
16.異拼略調(diào)在不改變拼音文字音節(jié)發(fā)音的前提下,合理改變拼寫方式,以使拼音文字中易混淆的同聲同調(diào)字詞分化定型。
目前英語較常用的注音系統(tǒng)有四種IPA,Oxford,KK及Webster。本發(fā)明提及的音標(biāo)均采用IPA注音系統(tǒng)。另外需要說明的是,與任何一種自然形成的民族語言所嚴(yán)格吻合的注音系統(tǒng),都不能準(zhǔn)確標(biāo)注另一種自然形成的民族語言的讀音。因而,本發(fā)明所提及的國際音標(biāo)與華語字音的對(duì)應(yīng)只可視為“近似”。
一、龔碼華語拼音方案(參看說明書附1至圖3)中國大陸使用的《漢語拼音方案》和中國臺(tái)灣試用的《通用拼音方案》,二者的相似性高達(dá)85%以上,對(duì)照請(qǐng)參看附1《龔碼華語拼音方案》。
1.有觀點(diǎn)提出,既然法語、德語等能使用不同于英語的鍵盤,那么華語也可以使用特殊鍵盤,即可以使用26個(gè)英文字母之外的其他字母。但如此一來在國際上推廣就會(huì)增大阻力,我們不可能要求海外所有想學(xué)華語的人都為此準(zhǔn)備一個(gè)特殊鍵盤;并且也有語言學(xué)家提出法語、德語縮小與英語的距離,俄語采用拉丁字母的方案。因而龔碼華語拼音的總體方案是音碼和調(diào)碼不超出26個(gè)英文字母和相關(guān)符號(hào)的范圍。
2.從國際音標(biāo)的清輔音、濁輔音及元音中找出與華語的聲母或韻母發(fā)音最接近的對(duì)應(yīng)關(guān)系;然后,找出選定國際音標(biāo)與英語發(fā)音最接近的“出現(xiàn)頻度最高的”英文常規(guī)拼寫形式——因?yàn)橥粐H音標(biāo)在英文中有時(shí)有多種拼寫形式,并且同一英文音節(jié)在國際音標(biāo)中有時(shí)也有多種讀音。如部分漢語拼音與龔碼拼音的聲、韻母對(duì)照q→ch,x→sh,z→ds,c→ts,ao→au。
3.按照r在華語中的“日”音,將三個(gè)卷舌音聲母調(diào)整為zh→dr,ch→tr,sh→sr。
4.u在英語中有三種讀音[Λ]、[u]和[ju],華語全部采用[u]的讀音。按照[u]的唯一讀音,ong→ung。
5.英語中沒有ü音,較接近的音標(biāo)為[ju],其在音節(jié)起始端的對(duì)應(yīng)形式為yu,在音節(jié)非起始端的對(duì)應(yīng)形式為ju。當(dāng)在音節(jié)非起始端時(shí),英語中y的常規(guī)讀音為[ai]。如nyu(女),英語的讀音為[naju]。有方案用作iu,[i]和[u]兩個(gè)元音字母組合音值較長,英語的常規(guī)讀音為[ju],不如y、j為半元音理想。按照“讀音統(tǒng)一易記、約定俗成”的原則,龔碼將ü音統(tǒng)一用作yu。
6.q,v,x,z四個(gè)字母拼寫時(shí)不用,依序標(biāo)示四聲,輕聲使用撇號(hào)’(注意不是‘),聲調(diào)標(biāo)于每個(gè)單音節(jié)的最后。除輕聲排前外,計(jì)算機(jī)對(duì)同音字自動(dòng)排序時(shí)可符合中文的四聲標(biāo)調(diào)原順序。原符號(hào)標(biāo)調(diào)的方式仍可用于龔碼拼音標(biāo)注方式(不用于龔碼拼音文字方式),二者等效,逐步向字母標(biāo)調(diào)方式過渡。
陰平陽平上聲去聲輕聲q v x z ’- ` (不標(biāo))7.因使用了專用的標(biāo)調(diào)字母,音節(jié)之間界限分明。為了使拼式簡單,所有的聲母與韻母在讀音不會(huì)混淆時(shí)都可獨(dú)立形成音節(jié),如yi→i,wu→u,yin→in,wen→un。在同一單音節(jié)中,當(dāng)元音字母后緊接-ng共同為韻母時(shí),省略為-g,這樣規(guī)律易記且不會(huì)混淆,如ang→ag,eng→eg,ing→ig,ung→ug。
8.字母i與其他字母一樣,只有唯一的一個(gè)發(fā)音“衣”,而普通話語音中并不存在zhi、chi、shi、ri、zi、ci、si音節(jié),因而龔碼華語拼音方案用作zhi→dr,chi→tr,shi→sr,ri→r,zi→ds,ci→ts,si→s。
9.每一個(gè)聲母在單用時(shí),都“視為”相當(dāng)于其在華語字母表中的讀音(表音),這樣既不會(huì)影響華語的拼讀,不會(huì)混淆(有專用標(biāo)調(diào)字母分隔),也不會(huì)增加記憶量。因而b(波)、p(坡)、m(莫)三個(gè)聲母視為已包括o音bo→b,po→p,mo→m。聲母f(弗)視為已包括u音fu→f。d(德)、t(特)、n(呢)、l(勒)四個(gè)聲母視為已包括e音de→d,te→t,ne→n,le→l。g(哥)、k(科)、h(喝)三個(gè)聲母視為已包括e音ge→g,ke→k,he→h。J(機(jī))、ch(其)、sh(西)三個(gè)聲母視為已包括i音,如ji→j,qi→ch,xi→sh,jia→ja,qian→chan,xiang→shag,jiao→jau,qie→che。
10.音節(jié)的界線發(fā)生混淆時(shí),用符號(hào)(^)隔開。
11.為便于記憶,在聲母表中將j、r、s可寫作jh、rr、ss。于是聲母表中即有jh、ch、sh、dr、tr、sr、rr、ds、ts、ss。
12.為了避免字音排序時(shí),相同聲韻母的音節(jié)由于聲調(diào)字母的加入而被分開(如“niq妮”排于“niu牛”之前而“niz逆”排于“niu?!敝?,排序的主要關(guān)鍵字不考慮聲調(diào)字符,次要關(guān)鍵字考慮聲調(diào)字符。
以上的龔碼華語拼音方案,在不超出英文26個(gè)字母的范圍內(nèi),接近英文的常規(guī)拼寫讀音規(guī)范,并使用了專用的標(biāo)調(diào)字母,規(guī)律易學(xué)易記,拼式簡單,音節(jié)之間界限分明,可用于中文字音和聲調(diào)的標(biāo)注。學(xué)過印歐語系某種語言的人,只要花幾個(gè)小時(shí)學(xué)習(xí)龔碼華語拼音方案的讀音規(guī)則,即可讀出相近的字音。龔碼華語拼音方案可廣泛地應(yīng)用于華語中文信息處理的各個(gè)方面,包括全方位建立中文國際信息資料庫、字詞句文排序與檢索系統(tǒng)、圖書排序檢索系統(tǒng)、通用搜索引擎、文字與拼音智能轉(zhuǎn)換系統(tǒng)、中文速記、文本自動(dòng)翻譯、語音識(shí)別系統(tǒng)、同聲傳譯裝置等,可以跨平臺(tái)進(jìn)行網(wǎng)絡(luò)傳輸、收發(fā)、閱讀國際中文E-mail。
中文文字龔碼統(tǒng)一方案的字符集按龔碼華語拼音方案標(biāo)注字音和排序。《龔碼字典》和《龔碼詞典》以龔碼華語拼音標(biāo)注字音。
二、龔碼拼音文字拼音文字使用有限的字母(英文中使用26個(gè)),根據(jù)語言發(fā)音的特點(diǎn),用字母將語音中的基本音素和音節(jié)按不同的拼法表達(dá)出來,并將字母表達(dá)的音素和音節(jié)再拼成單詞。所有這些單詞通過語音和字母的排序彼此有機(jī)地聯(lián)系在一起,構(gòu)成了一個(gè)“拼”出來的文字世界。這個(gè)“拼”的過程是完全符合自然界的由簡入繁的發(fā)展規(guī)律,同時(shí)也符合人類學(xué)習(xí)語言和文字的過程,即先學(xué)說話后學(xué)認(rèn)字,先易后難,先簡單后復(fù)雜這樣的學(xué)習(xí)過程。由于人類彼此主要是通過語言和文字來進(jìn)行交流的,拼音文字自然有機(jī)地將兩者聯(lián)系在一起。拼音文字的特點(diǎn)就是“拼”,它不僅拼語音也拼出了字形和字義。
龔碼華語拼音方案的實(shí)際運(yùn)用形式,分為“龔碼華語拼音標(biāo)注方式”和“龔碼華語拼音文字方式”。拼音標(biāo)注方式除了用于為中文方塊字標(biāo)注字音、華語人地山河名譯出或其他非段落文本形式的標(biāo)注(如各類證件、圖書報(bào)刊封面、路牌、生意招牌、商品標(biāo)貼、華語互聯(lián)網(wǎng)域名)等用途外,也作為初學(xué)者拼音讀物和兒童拼音讀物的拼寫方式。拼音標(biāo)注方式不使用異拼略調(diào)字詞。以下若無特別說明,均指拼音文字方式。
1.龔碼華語拼音的整體方案不采用單拼、雙拼或簡拼形式。歷史的實(shí)踐證明,與現(xiàn)實(shí)國際拼寫規(guī)范距離太遠(yuǎn)的“天書式”的語言文字方案,無論其拼式如何簡單,作為速記等特殊用途并無不妥,但作為一種語言文字全面推廣通常很難。學(xué)習(xí)一種語言文字時(shí),記憶量太大或無規(guī)律會(huì)加大難度,而需要“猜”的比重太高時(shí),也會(huì)嚴(yán)重影響閱讀速度。對(duì)于正式的出版品,平均每個(gè)人輸入的工作量不到閱讀量的1%;有時(shí)一篇文章輸入后,更會(huì)有億萬人閱讀。一種語言,首要考慮是易于學(xué)習(xí)、理解、讀準(zhǔn)、少歧義、記憶量小,符合國際拼寫慣例,其次才是拼式簡單。為了方便閱讀者,順利與國際語言文字接軌,龔碼華語拼音的整體方案采用全拼形式。即便以龔碼單拼方式輸入,也是“輸簡顯全”。
2.以聲調(diào)全標(biāo)為基礎(chǔ)。不標(biāo)聲調(diào)會(huì)引起大量的同音詞問題;部分標(biāo)部分不標(biāo)的困難是標(biāo)不標(biāo)的界限難掌握。不標(biāo)聲調(diào)的方法都是假設(shè)使用者對(duì)音很熟,并未設(shè)想海外華人和外國人學(xué)習(xí)時(shí)的情況。不標(biāo)或部分標(biāo)聲調(diào)的方案是建立在讀者都能講一口標(biāo)準(zhǔn)的華語,并未考慮到學(xué)華語的外國人、海外華人子女以及國內(nèi)眾多講不準(zhǔn)或不會(huì)講標(biāo)準(zhǔn)華語的成年人。比較而言,還是全標(biāo)較好,雖繁瑣一點(diǎn),但有增加同音字詞形體示差性的作用,方便閱讀。在全部標(biāo)調(diào)的基礎(chǔ)上,能夠省掉聲調(diào)的字詞(如異拼略調(diào)的高頻字詞)才“省掉”聲調(diào)。
3.盡量按詞分寫。因?yàn)椤霸~”是思維的基本單位,按詞分寫對(duì)同思維過程較為接近,對(duì)思維的干擾少。其次,按詞分寫可以大大減少同音單位,減少人工選擇過程。凡本方案中未提及的分詞拼寫方式,基本上按《漢語拼音正詞法基本規(guī)則》。對(duì)于詞的劃分有爭議時(shí),四字以內(nèi)的按詞分寫。
4.不用意頭或意尾。有些方案以特定字母作意頭或意尾(或稱語法性詞頭、詞尾)區(qū)分詞類,這樣增加了學(xué)習(xí)記憶量,又加長了拼式。中文字是單音節(jié),采用“盡量按詞分寫”的方式,以語詞輸入的幾率遠(yuǎn)大于按字輸入的幾率,而按語詞輸入時(shí)許多字會(huì)自動(dòng)成為“意頭”或“意尾”,如“電腦、電影、電燈、電話、電車、電表、電動(dòng)機(jī),來電、通電、閃電、停電、無線電”,再如“花盆、花壇、花瓶、花叢、花農(nóng)、花團(tuán)錦簇,菊花、梅花、荷花、桂花、紅花、金銀花”,即相當(dāng)于印歐語系的前綴和后綴。
5.采用略拼略調(diào)字。請(qǐng)參看附4“龔碼異拼略調(diào)字示例”。對(duì)部分有必要分化定型的高頻字,采用略拼形式。略拼略調(diào)字(部分只略調(diào)未略拼)單用或用于詞尾時(shí)用略拼形式不標(biāo)聲調(diào),用于詞頭或詞中,其后無連字號(hào)(-)或(&)等符號(hào)時(shí),用(^)標(biāo)于單音節(jié)之后,以達(dá)到分化定型的目的。略拼略調(diào)字根據(jù)分化定型的必要性和綜合字頻確定,當(dāng)綜合字頻相近時(shí),根據(jù)字頻方向平均值確定。為免混淆,每一種聲、韻母的組合只能有一個(gè)略拼略調(diào)字。如mai音字,按綜合字頻依序?yàn)橘I、賣、麥、埋、脈、邁等,若考慮聲調(diào),在常用和次常用字中“買”沒有同聲同調(diào)字,“賣”則有“麥、脈、邁”,因而略調(diào)字安排“賣”。略拼略調(diào)字和略調(diào)字舉例如下的d,得de,地di,了l,不b,片p,發(fā)f,我w,你n,他t,們m,個(gè)ge,可k,和h,及i,去ch,出tr,是sr,人r,日ri,在ds,次ts,所s,而e,有y,一i,二er,三san,四si,阿a,文u,于yu,因in,應(yīng)ig,安an,恩en,文un,也ye,愛ai,為wei,這dr,那na,對(duì)dui,把ba,還hai,又you,大da,小shau,多duo,少srau,上srag,下sh,前chan,后hou,內(nèi)nei,外wai,里li,國g,公gug,會(huì)hui,給gei,門men,沒mei,山sran,張drag,嗎ma,么me,著dre,學(xué)shue。
由于龔碼輕聲用(’)標(biāo)示,因而不會(huì)與略拼略調(diào)字混淆。
龔碼拼音未單獨(dú)使用c作聲母,特將其用作“中”的略拼略調(diào)字(英語里“中國China”和“中央centre”都是以字母c開始)。
6.采用全拼略調(diào)字和全拼帶調(diào)字。對(duì)部分有必要分化定型的次高頻字,采用單音節(jié)最多不超過五個(gè)音碼的全拼形式。全拼略調(diào)字單用或用于詞尾時(shí)用全拼形式不標(biāo)聲調(diào),用于詞頭或詞中,其后無(-)或(&)等符號(hào)時(shí),用(^)標(biāo)于單音節(jié)之后,以達(dá)到分化定型的目的。全拼帶調(diào)字采用全拼帶聲調(diào)形式。全拼略調(diào)字和全拼帶調(diào)字根據(jù)分化定型的必要性和綜合字頻確定,當(dāng)綜合字頻相近時(shí),根據(jù)字頻方向平均值確定。為免混淆,每一種聲、韻母的組合只能有一個(gè)全拼略調(diào)字和全拼帶調(diào)字。根據(jù)綜合字頻等確定時(shí),選擇優(yōu)先順序?yàn)槁云绰哉{(diào)字—常拼略調(diào)字—全拼略調(diào)字—略拼帶調(diào)字—全拼帶調(diào)字—常拼帶調(diào)字。例如全拼略調(diào)字,波bo,服fu,起chi,子dsi,以yi,務(wù)wu。
7.采用略拼略調(diào)詞。對(duì)少數(shù)在簡繁體字使用區(qū)無爭議的高頻詞,采用統(tǒng)一的略拼形式。略拼詞不標(biāo)聲調(diào)。每一種字母的組合只能有一個(gè)略拼略調(diào)詞,并且不能與其他常拼音節(jié)混淆。普通名詞的制訂參考下述的龔碼單拼輸入方案,如電話dh,傳真nr,分機(jī)(轉(zhuǎn))fj,免費(fèi)熱線電話mfrd,公用電話gd,辦公電話bd,住家電話jd,手提電話st,BB機(jī)bi,上午aw,中午cw,下午lw,早上ru,晚上wn,郵政信箱(P.O.Box)ynl,電子郵箱dyl,電子郵件dyj,網(wǎng)址wr。華語語法用詞名詞m.,動(dòng)詞d.,形容詞sh.,副詞f.,代詞db.,數(shù)詞sr.,介詞j.,連詞l.,助詞dr.,方位詞fw.,嘆詞t.,擬聲詞ng.,量詞lg.;主語dry.,謂語wy.,賓語by.,表語bmy.,狀語why.。另一類的略拼略調(diào)詞是由音節(jié)界線不會(huì)混淆的單字母音節(jié)自然形成的,例如我們wm,你們nm,他們tm,人們r(jià)m,所有sy,中國人cgr。略拼略調(diào)專用名詞只將每個(gè)字的聲母列出,無聲母的只用韻母的第一個(gè)字母。當(dāng)聲母有兩個(gè)字母組成,并需要大寫時(shí),第二個(gè)字母小寫。如專用名詞中國→CG,長城→CrCr,萬里長城→WLCrCr,長江→CrJ,黃河→HH,泰山→TSr。
8.量詞前的數(shù)詞為“一”并處于段首時(shí)用中文數(shù)字的拼音,其他情況一律使用阿拉伯?dāng)?shù)字,并與量詞連寫,如四個(gè)人→4ge r,十三匹馬→13piv ma,七十八臺(tái)電腦→78taiv dianznau。成語和人地山河名中仍采用中文數(shù)字,如三人成虎→san^r^tregvhux,八仙過?!鷅aqshanqguo^hai,王五→Wa Ux,阿三→A San,十里堡→Srvli^puz,一點(diǎn)五米→1.5mi。
9.年月日、點(diǎn)分秒用略音字,與相關(guān)阿拉伯?dāng)?shù)字連寫,如二零零一年三月七日→2001n3y7ri,一九三一年八月→1931n8y,五月十三日→5y13ri,一九八二年→1982n,十一點(diǎn)43分→11d43f,七分二十一秒→7f21m,八點(diǎn)→8d。因在阿拉伯?dāng)?shù)字之后并連寫,不會(huì)與其他略音字混淆。
10.序數(shù)詞前若有“第”省略。序數(shù)詞前加#(需要時(shí)按華語習(xí)慣讀作“diz”),與其后阿拉伯?dāng)?shù)字和量詞連寫,如#7tianq(第七天),#4nian^jiv(四年級(jí)),#33jivtuan^jyun(三十三集團(tuán)軍)。
11.為了便于閱讀和理解,并列關(guān)系用&(不發(fā)音),前后不空格。如fuz&nyux(父女),shug&diz(兄弟),wenz&dav(問答),gagq&tiex(鋼鐵),huanv&bauz(環(huán)?!h(huán)境保護(hù)),gugq&guanq(公關(guān)—公共關(guān)系)8&9tian(八九天),17&8suiz(十七八歲),r&jq duizhuaz(人機(jī)對(duì)話),dr&shau^shue(中小學(xué))luz&haix&kugqjyun(陸??哲?,chanqiyun&wanzma(千軍萬馬)。
12.我們時(shí)而從外文的中譯里讀到譯回的中文名,注有“(譯音)”字樣,卻并不知何為原名的怪事。更有因原中文名不同而音譯名相同,在國外過海關(guān)時(shí)被警察抓錯(cuò)的事發(fā)生。但如果在拉丁字母拼音中插入中文字,會(huì)破壞整個(gè)字母拼音文本的統(tǒng)一,顯得不倫不類,違反人們的心理習(xí)慣。龔碼拼音對(duì)需要加注的人地山河名和引用的古文字句等特定需要明確區(qū)分的專用字詞,采用附加“碼注”(按龔碼字符集的內(nèi)碼標(biāo)注)的方式處理,即注上特定字的編碼。而編碼可及時(shí)顯示,方便查閱。碼注的大小寫和分詞連寫方式與標(biāo)注的原拼音的每個(gè)單音節(jié)嚴(yán)格保持一致。中文姓名的拼寫按中國人的習(xí)慣,姓在前,名在后,多字時(shí)連寫。如拼音標(biāo)注方式Wagv Igq,Leiv Jigzsugq,Sqtuv Shouzhuav。為不影響詞的書寫和拼讀連續(xù)性,詞的碼注全部在詞后。選擇碼注時(shí),雙字詞和三字詞可以短橫線區(qū)分,如(-D335),(-H556-)。有必要確認(rèn)對(duì)應(yīng)中文字時(shí),可及時(shí)將光標(biāo)置于編碼上,利用互顯功能查出中文字;也可利用編碼表查閱。不需要時(shí)可略過。如龔學(xué)勝,龔碼華語拼音標(biāo)注方式加碼注為Gugq Shjuevsregz(E119H224h456)。碼注可廣泛用于護(hù)照、其他各類身分證件及對(duì)外函件及出版品中。在龔碼拼音文字方式中,已分化定型的字不必作碼注。有必要加碼注的同一字詞,在拼音文字中通常只在首次出現(xiàn)時(shí)加注。
13.句首單詞、詩歌各行及論文大綱中各項(xiàng)的首字母大寫,人地山河、機(jī)構(gòu)團(tuán)體等專名首字母大寫。
14.圖書報(bào)刊、影視戲劇、文章詩歌及藝術(shù)品等名稱用斜體,用于強(qiáng)調(diào)或例示的字詞用斜體,法庭案例名稱中的原被告姓名用斜體。
15.盡量采用英文標(biāo)點(diǎn)符號(hào)和書寫格式。正文中的首行一般不縮進(jìn),段落之間空行。
16.電話和傳真號(hào)碼等的區(qū)號(hào)數(shù)字或符號(hào)在括號(hào)內(nèi)時(shí),與前后括號(hào)之間不空格;括號(hào)與括號(hào)外的數(shù)字或符號(hào)之間空一格。連字號(hào)前后不空格。如Dh(010)111-1111Nr(010)111-1112Mfrd1-800-111-111117.貨幣金額的華語大寫數(shù)字(如支票上的大寫)采用全拼帶調(diào)形式,每十進(jìn)位單位之間用連字號(hào),每個(gè)大寫數(shù)字和單位的音碼不少于兩個(gè)字母壹yiq,貳erz,叁sanq,肆ssz,伍wux,陸liuz,柒chiq,捌baq,玖joux,拾srv,佰baix,仟chanq,萬wanz,億yiz,整dregx。如叁仟伍佰貳拾捌元柒角肆分,寫作“Sanqchanq-wuxbaix-erzsrv-baqyuanv-chiqjaux-sszfenq”。
18.非華語的人地山河名,其拼寫在原則上一律還原為原拉丁字母形式,非拉丁字母文字的人地山河名,按照該文字的拉丁字母轉(zhuǎn)寫法拼寫,必要時(shí)將中文字讀音以華語拼音加注于括號(hào)內(nèi)。
三、對(duì)同音同調(diào)字詞分化定型表意文字系統(tǒng)在向表音文字系統(tǒng)轉(zhuǎn)化的過程中,必然出現(xiàn)一定數(shù)量的同音同調(diào)字詞,有必要進(jìn)行適度分化,使拼音中文字詞所代表的方塊中文字詞的數(shù)目保持在一個(gè)合理的范圍,不會(huì)引起使用上的混亂。同音同調(diào)詞中比例較高的是雙字詞,三字詞以上同音同調(diào)的幾率很低。
1.聲調(diào)分化。中文字拼音的聲調(diào)分布不均衡,許多字音的某一聲調(diào)有許多同調(diào)字,而另一聲調(diào)可能一個(gè)字也沒有。聲調(diào)分化按照“原同音同調(diào)字詞中高頻字詞保持原調(diào),次高頻字詞轉(zhuǎn)調(diào),低頻字詞轉(zhuǎn)用法;轉(zhuǎn)音字詞不會(huì)產(chǎn)生新的混淆”的原則處理。優(yōu)先在平聲或仄聲內(nèi)互轉(zhuǎn),如陰平與陽平互轉(zhuǎn),上聲與去聲互轉(zhuǎn)。同音同調(diào)詞中只轉(zhuǎn)換其中一個(gè)易轉(zhuǎn)字的聲調(diào)。如最易混淆的同音同調(diào)字“他、她、它”與“在、再”。中文字中原只有“他”字。1920年,劉半農(nóng)在英國倫敦《她字問題》的文章中表示,“把‘她’字假定為第三位的陰性代詞……第三位除‘她’之外,應(yīng)當(dāng)再取一個(gè)‘它’字,以代無生物”。當(dāng)初并未考慮到同調(diào)所會(huì)引起的問題?,F(xiàn)在按以上原則,他字保留原調(diào),將她字轉(zhuǎn)為陽平,將它字轉(zhuǎn)為去聲。“在、再”二字,在字保留原調(diào),將再字轉(zhuǎn)為上聲。這樣,其相關(guān)高頻詞“他們、她們、它們”與“不在、不再”等也就不會(huì)重調(diào)了。前述的略調(diào)也是一種聲調(diào)分化方法。
2.字音分化。當(dāng)難以進(jìn)行聲調(diào)分化時(shí),原同音同調(diào)字詞中高頻字詞保持原音,次高頻字詞轉(zhuǎn)音,低頻字詞轉(zhuǎn)用法;優(yōu)先在相近字音內(nèi)互轉(zhuǎn);轉(zhuǎn)音字詞不會(huì)產(chǎn)生新的混淆。如相關(guān)卷舌音與平舌音互轉(zhuǎn),相關(guān)清音與濁音互轉(zhuǎn)。在龔碼華語拼音中,s與sr、b與p、in與ig、n與l都是相關(guān)音。如“琵琶”與“枇杷”為同音同調(diào)詞,“琵琶”保留原音,將“枇杷”由pivpa’轉(zhuǎn)為pivba’。
3.異拼略調(diào)分化。即前述的略拼、全拼和略調(diào)字詞,并未改變字音,只是改變了拼寫形式或省略了聲調(diào)。在“每一種單音節(jié)不超過五個(gè)聲碼,拼寫方式易讀,無歧音”的原則下,龔碼拼音對(duì)每一種音節(jié)安排了兩種異拼形式,可對(duì)每一種單音節(jié)常拼帶調(diào)之外的11個(gè)字分化定型,其中3個(gè)字為略調(diào),8個(gè)字為帶調(diào)。如ig(英)為常拼方式,其異拼方式為ing和yig;j(機(jī))的異拼方式為ji和jh;shag(香)的異拼方式為shang和shiag。如有可能混淆的同聲同調(diào)字“相shangz,向shiagz,象,像”。由于異拼方式會(huì)增大記憶量,因而只是在與其他同聲同調(diào)字或相關(guān)語詞產(chǎn)生混淆時(shí)才會(huì)使用。
4.換字詞分化。當(dāng)難以進(jìn)行聲調(diào)和字音分化時(shí),原同音同調(diào)字詞中高頻字詞保持原用,次高頻和低頻字詞轉(zhuǎn)用法;不易轉(zhuǎn)字詞保持原用,易轉(zhuǎn)字詞轉(zhuǎn)用法;優(yōu)先轉(zhuǎn)換為現(xiàn)正使用的字詞;轉(zhuǎn)用字詞不會(huì)產(chǎn)生新的混淆。如“期中”與“期終”易混淆,將“期終”用作“期末”?!俺霭妗迸c“初版”易混,將“初版”用作“第一版”?!敖淮迸c“膠帶”,將“膠帶”用作“塑膠帶”?!蔼{子”與“虱子”不易混淆,不用分化。功課、攻克與公克,“攻克”用作“攻下”,“公克”用作“克”?!俺鞘?、程式、乘勢(shì)、成事”,“城市”保留原用,“程式”按詞義用作“程序”或“格式”,“乘勢(shì)”用作“借勢(shì)”;“成事”在“成事不足,敗事有余”等成語、俗語中不會(huì)混淆,“成事后”改用“事成后”。
5.略字語詞轉(zhuǎn)完整語詞分化。中文方塊文字與拼音文字有一定差別。由于某些不同的方塊字詞在拼音字詞中成了同音字詞,在使用拼音文字時(shí),要盡量避免使用語義不易理解的略字語詞,改用完整語詞。
6.略音略調(diào)字、全音略調(diào)字、全音帶調(diào)字分化。由于龔碼輕聲用(’)標(biāo)示(輕聲的調(diào)頻只有4.3%),不會(huì)與略調(diào)字混淆,而略調(diào)字都是高頻字,可單用或用于詞尾,所以能將大批的高頻詞分化。
7.綜合采用多種方法復(fù)雜分化。
在同音語詞“機(jī)理、肌理、激勵(lì)、極力、吉利、蒺藜、幾粒、祭禮”中,“機(jī)理”與“肌理”同調(diào),“肌理”為低頻詞,用作“肌膚”?!皹O力”與“吉利”同調(diào),但根據(jù)上下文不易混淆。
對(duì)于龔碼基本字符集中已發(fā)現(xiàn)并且有必要分化定型的字詞,《龔碼詞典》已全部進(jìn)行了分化定型。對(duì)于以后新發(fā)現(xiàn)或新創(chuàng)造的語詞,將繼續(xù)分化定型。語言文字的功能是為了交流思想信息,不必刻意讓人不懂以故作高深。只要拼音文字的撰文者都對(duì)其他讀者負(fù)責(zé),現(xiàn)代華語拼音文字的推行應(yīng)當(dāng)沒有解決不了的問題。對(duì)于中文的古文,可仍使用方塊文字。對(duì)于現(xiàn)代中文中引用古文,必要時(shí)可附加“碼注”(按龔碼字符集的內(nèi)碼標(biāo)注)。在對(duì)中文方塊字標(biāo)注字音時(shí),仍按龔碼拼音的常拼帶調(diào)。
經(jīng)過分化定型、分詞連寫的拉丁化華語拼音文字,可以與中文字語句和英文等直接轉(zhuǎn)換對(duì)譯。拼音文字徹底避免了方塊中文字的難學(xué)、難記、難寫,可以直接用于掃盲、打字和電子傳輸,必將成為華語現(xiàn)代化的利器。以表意為主的龔碼統(tǒng)一文字體系和以表音為主的龔碼華語拼音體系雙文并行,單拼輸入,全拼顯示,可全拼也可單拼輸入,拼音與文字之間的及時(shí)轉(zhuǎn)換與查閱。將人類所有的信息華語化,這是歷史賦予華人的使命。
拼音文字是較優(yōu)越的文字形式。借著幾十個(gè)字母的各種排列組合,既能完整地表達(dá)出千變?nèi)f化的語言,且隨著語言的演化,要增加語詞極為容易。龔碼拼音系列方案的使用,能讓使用者快意地奔馳在信息世界里,了無障礙。因此,推廣使用龔碼華語拼音文字能大幅提升國力。龔碼華語拼音方案是全能化、固定化和國際化的通用文字處理系統(tǒng),符合語言的國際化及數(shù)字化,能讓中文的電子傳輸比英文還有效率。龔碼拼音只采用26個(gè)英文字母,不添加或者改換其他符號(hào),有利于中國分享世界最前沿的信息處理技術(shù),有利于中外科學(xué)、文化、教育事業(yè)的交流。
四、拼音相關(guān)智能化互顯互轉(zhuǎn)互譯為了使字詞與拼音、編碼能相互融合,即字(含詞)中有音、碼,音中有字、碼,碼中有字、音,首先要求三者互顯。利用現(xiàn)有公知的編程技術(shù),很容易能做到這一點(diǎn)。當(dāng)需查尋某音節(jié)的字碼信息時(shí),把光標(biāo)置于所選音節(jié),即顯示與該詞拼音聲調(diào)相符的字形、編碼等信息,信息框可為固定形式或隨光標(biāo)移動(dòng)形式,用戶根據(jù)需要選擇,并可點(diǎn)取上屏。有多個(gè)字詞時(shí),按頻度排列。如“pianvdrq胼胝(g530d137)”。反之,把光標(biāo)置于所選字詞,即顯示與該字詞相符的拼音、編碼等信息。如“胼胝pianvdrq(g530d137)”;“g530d137胼胝(pianvdrq)”。用戶可根據(jù)需要將此功能隨時(shí)開啟或關(guān)閉。
現(xiàn)代華語以多音節(jié)詞為主,而同音詞的問題并沒有想象中那么嚴(yán)重;實(shí)行拼音化后,同音詞的問題更可能在實(shí)踐中得到解決。由于盡量按詞輸入,并對(duì)同音同調(diào)字詞進(jìn)行了有效的分化定型,因而中文的文字與拼音之間的轉(zhuǎn)換,以及龔碼拼音文本與外文之間的翻譯將會(huì)非常容易,轉(zhuǎn)換或翻譯結(jié)果可根據(jù)上下文自動(dòng)進(jìn)行智能化檢查、校對(duì)、修正,此功能可運(yùn)用到智能同聲傳譯裝置。所有的中文文本均可轉(zhuǎn)為龔碼拼音并排序,在國際范圍內(nèi)供檢索查閱;所有的外文文本也可輕易譯為龔碼拼音并排序,在國際范圍內(nèi)供檢索查閱。
過去的國際語或世界語方案,大多以印歐語系語言作為母本,并未考慮到世界上使用人數(shù)最多的華語。如較流行的“世界語Esperanto”(原意為“希望者”),即是一種印歐語系的“普通話”,使用了28個(gè)字母(除q、w、x、y以外的22個(gè)英文字母,另有6個(gè)是在拉丁字母上另加符號(hào)),以印歐語系的較通用詞根及前后綴整合規(guī)范而成。由于印歐語系的各種語言(包括使用斯拉夫字母的俄語)有70%以上的詞根相近,因而以其為母語的人,只需要花幾個(gè)小時(shí)學(xué)習(xí)Esperanto的語法規(guī)則,即能看懂一些Esperanto文本的意思;但華人學(xué)起來仍要下很大工夫??梢灶A(yù)期,龔碼華語拼音方案和拼音文字若能推行,將會(huì)改善國際語言的生態(tài)環(huán)境,吸引中國的周邊國家采用華語,并在世界范圍內(nèi)掀起學(xué)華語熱潮。而將來的國際語或世界語即便不是純粹以華語推行,也會(huì)以其作為重要的組成部分。一種最科學(xué)的語言,最終必定以最和平的方式統(tǒng)一世界。
五.龔碼單拼輸入據(jù)有關(guān)報(bào)道,中國約有五十萬人在研究中文輸入法,已公開的有數(shù)千種,形成了“萬碼奔騰”的壯觀局面。這種狀況一方面浪費(fèi)了研究者的精力,另一方面對(duì)使用者造成了困擾。不同的單拼輸入法,使用不同的鍵盤對(duì)應(yīng)方式。“萬碼奔騰”的輸入法使得國人茫然無措,望“碼”生畏。這個(gè)中文字輸入法的瓶頸問題正嚴(yán)重地阻礙著現(xiàn)代華文信息時(shí)代的到來。有報(bào)刊載文“中國已進(jìn)入了全民研究、學(xué)習(xí)輸入法的時(shí)代!”日本在七十年代也曾經(jīng)歷過萬碼奔騰的局面,但進(jìn)入八十年代后便統(tǒng)一為拼音轉(zhuǎn)化輸入方式,萬碼奔騰的時(shí)期也遂告終止。有識(shí)之士疾呼“此碼與彼碼,究竟有何本質(zhì)不同?每當(dāng)看到Windows里只有一種日文輸入法的時(shí)候,我就認(rèn)為我們每個(gè)中國人都應(yīng)感到汗顏!”為了避免這種狀況的出現(xiàn),龔碼單拼使用簡繁體字統(tǒng)一的鍵盤對(duì)應(yīng)方式,請(qǐng)參看附5“龔碼單拼鍵位對(duì)照表”。為了便于記憶,當(dāng)龔碼華語拼音方案中的聲母或韻母只有一個(gè)字母時(shí),優(yōu)先采用與之相同的鍵盤字母,如聲母b、p、m、f、d、t、n、l、g、k、h、j、r、s,韻母a、o、e、i、u。當(dāng)聲母或韻母超過一個(gè)字母時(shí),全部簡化為一個(gè)字母。為使鍵盤擊鍵次數(shù)分布科學(xué)合理,根據(jù)龔碼基本字符集中的用字,將每一個(gè)聲母或韻母出現(xiàn)的次數(shù)加總,除以聲韻母總次數(shù),得出每一聲韻母的特定音頻百分比。在上述優(yōu)先對(duì)應(yīng)的鍵盤字母之外另增簡化聲韻母時(shí),每一字母鍵的總擊鍵次數(shù)應(yīng)相對(duì)均衡(均布荷載),以有效減少重碼。為強(qiáng)化聲調(diào)功能,并將字詞分流,專用聲調(diào)字母保留原用。
龔碼單拼使用了22個(gè)聲母(不含零聲母本為23個(gè),w在單拼中未直接作為聲母),33個(gè)韻母(不含零韻母);而英文鍵盤上有26個(gè)字母鍵,除去4個(gè)聲調(diào)鍵(簡稱調(diào)鍵),剩下22個(gè)字母鍵(簡稱音鍵)供分配。為了均衡,每個(gè)字母鍵安排一個(gè)聲母。每個(gè)字母鍵安排一至二個(gè)韻母。為了便于記憶,每個(gè)字母鍵上所對(duì)應(yīng)的聲母和韻母之間一般都能按華語拼音相拼。這樣也可提高一部分字的輸入速度,如“黃、非、聽、亮”等字音,均可相同兩音鍵輸出。現(xiàn)代華語的詞匯豐富,而詞語可以進(jìn)行整體輸入,這就大大加快了輸入速度。對(duì)詞語進(jìn)行整體輸入是華語輸入的一個(gè)巨大優(yōu)勢(shì),利用詞語、簡碼輸入方式,可減少擊鍵次數(shù),提高輸入速度。英文計(jì)算機(jī)鍵盤輸入雖學(xué)習(xí)簡便,但其在輸入時(shí)詞語的每一個(gè)字母、符號(hào)及詞之間的空格都需要逐一錄入,速度就慢得多了。華語的精煉特點(diǎn)也是其輸入速度快于英文的一個(gè)原因,可以說,面對(duì)計(jì)算機(jī)輸入,華語毫不遜色于其他語言。
(一)字詞模式輸入龔碼單拼能將單拼字、雙拼字、雙拼雙字語詞、三拼雙字語詞、三拼三字語詞、四拼雙字語詞及四拼多字語詞區(qū)分得很清楚,并且鍵鍵有字。當(dāng)輸入調(diào)鍵時(shí)視為字的結(jié)束鍵。輸入時(shí)不必拘泥于語法意義上的詞或短語,盡量采用三字以上的詞或短語、句子形式,長了重碼少,平均擊鍵少,即“能連則連,連多則快”。以下分步說明。
1.當(dāng)輸入首音碼,視為輸入了首碼相關(guān)高頻字(包括單拼字和雙拼字),所有字將會(huì)按綜合字頻列出,每次顯示二十個(gè)(不足部分可選擇以首碼相關(guān)高頻字接后)。前十個(gè)用英文鍵盤前方的數(shù)字鍵選取,第一字也可用空格鍵選取;后十個(gè)用右方小鍵盤的數(shù)字鍵選取,未出現(xiàn)字詞可按([)與(])鍵翻頁。并會(huì)在第一行顯示一個(gè)與此單拼字相關(guān)的高頻雙字語詞(首字相符),用/鍵選取。如第一鍵為d(包括de和iou),包括de、iou單拼字和以d為聲母的雙拼高頻字,提示行顯示為1的2有3大4到5地6道7得8對(duì)9多0都 有的/①當(dāng)②又③動(dòng)④但⑤點(diǎn)⑥定⑦等⑧打⑨電⑩第2.當(dāng)輸入次音碼,視為輸入了雙拼詞(兩個(gè)單拼字組成的雙字語詞),此字音的所有詞將會(huì)按綜合詞頻列出,每次顯示二十個(gè)。并會(huì)顯示一個(gè)與此二鍵相關(guān)的高頻雙拼詞,用/鍵選取。缺省排列為雙拼詞在前,不足部分可選擇以雙拼字接后。如第一鍵為d(包括de和iou),第二鍵為i(包括i、ts和ug),第一行顯示為(以下舉例省略第二行)l得以2得意3得益4有意5有益6優(yōu)異7游藝8尤以9右翼0得此 友誼/次碼若為調(diào)碼,視為完成了帶調(diào)單拼字輸入,這些字將會(huì)按綜合字頻列出,每次顯示二十個(gè)(不足部分可選擇相關(guān)高頻字接后)。并會(huì)顯示一個(gè)與此二碼相關(guān)的高頻雙拼詞(首字為相關(guān)帶調(diào)單拼字),用/鍵選取。如首碼為i(包括i、ts和ug),次碼為調(diào)碼z(去聲),第一行顯示為1意2次3義4議5易6異7藝8億9益0刺 意思/3.當(dāng)輸入第三音碼,視為輸入了三拼詞(三拼雙字、三字語詞),所有相關(guān)詞將會(huì)按綜合詞頻列出,每次顯示二十個(gè)(不足部分可選擇以相關(guān)高頻詞接后)。并會(huì)顯示一個(gè)與此三鍵相關(guān)的高頻三字詞(每字首碼相符),用/鍵選取。如三鍵依序?yàn)閐(包括de和iou)、y(包括y、yu和ou)、p(包括po和ian),第一行顯示為1電影片2電影票3代用品4抵押品5陡坡 第一批/第三鍵若為調(diào)鍵,視為完成了帶調(diào)雙拼字輸入。此含調(diào)字音的所有字將會(huì)按綜合字頻列出,每次顯示二十個(gè)(不足部分可選擇以相關(guān)高頻字接后)。并會(huì)顯示一個(gè)與此三鍵相關(guān)的高頻雙字詞(首字的音與調(diào)均相符),用/鍵選取。如前兩鍵依序?yàn)?(包括l、ia和iag)、i(包括i、ts和ug),第三鍵為v(去聲),組合產(chǎn)生的雙拼帶調(diào)字音為liv和lugv,第一行顯示為1離2龍3隆4黎5籠6莉7攏8朧9梨0瓏 離開/4.當(dāng)輸入第四音碼,視為輸入了四拼詞(四拼雙字、多字語詞),相關(guān)語詞按綜合詞頻列出,每次顯示二十個(gè)(不足部分可選擇以相關(guān)高頻詞接后)。如果有,會(huì)顯示一個(gè)與此四鍵相關(guān)的高頻四字詞(每字首碼相符),用/鍵選取。如四鍵依序?yàn)閍(包括a、sr和eg)、j(包括j和ag)、w(包括dr和uan)、e(包括e、tr和uai),第一行顯示為1傷者 世界之窗/以上的龔碼單拼中,為了提高輸入速度,每一個(gè)輸入步驟的缺省設(shè)定為只顯示“完全符合條件”的字詞,“不足部分可選擇以相關(guān)高頻字詞接后”則由用戶選擇使用。用戶可隨時(shí)自造詞、修改詞,并可按類別分為各類詞庫,據(jù)需要選擇掛接。龔碼單拼輸入法可自動(dòng)調(diào)頻,用戶也可根據(jù)需要手動(dòng)調(diào)頻。輸入時(shí)字可帶調(diào)而詞不帶調(diào)。個(gè)別知形不知音的字可利用筆畫查詢。用戶可充分利用每個(gè)首碼字母對(duì)應(yīng)的20個(gè)高頻字,盡量做到“高頻字不翻頁”。有把握的高頻字一鍵完成,其他單拼字帶調(diào)兩鍵輸入,雙拼字帶調(diào)三鍵輸入。雙字詞根據(jù)其所含字分為三種情況兩個(gè)單拼字兩鍵輸入,一單一雙三鍵輸入,兩個(gè)雙拼字四鍵輸入。三字詞三鍵、四字詞四鍵,只輸入首碼。五字詞以上輸入前三字和末字的首碼,共四鍵。
(二)龔碼單拼拼音文字輸入一方面,龔碼拼音文字只采用了26個(gè)英文字母,沒添加或者改換其他符號(hào),可實(shí)現(xiàn)用英文鍵盤高速盲打。另一方面,若不計(jì)變音略調(diào)的情況,由于每種同聲同調(diào)字只有一種音調(diào)形式,龔碼單拼的拼音文字輸入比方塊字輸入更容易,可作為輸入的另一種選擇。龔碼單拼拼音文字輸入時(shí)“輸簡顯全”,即以單拼方式輸入,顯示完整結(jié)果。根據(jù)標(biāo)點(diǎn)符號(hào)自動(dòng)將句首的第一個(gè)字母大寫,自動(dòng)在單詞之間加空格。華語拼音中沒有的音節(jié)將不會(huì)顯示。以下為龔碼拼音文字方式。
1.當(dāng)輸入首音碼,視為輸入了單拼單音節(jié),所有帶調(diào)或略調(diào)音節(jié)將會(huì)按英文字母順序列出,每次顯示二十個(gè)。前十個(gè)用英文鍵盤前方的數(shù)字鍵選取,第一字也可用空格鍵選?。缓笫畟€(gè)用右方小鍵盤的數(shù)字鍵選取,未出現(xiàn)字詞可按([)與(])鍵翻頁。如第一鍵為d(包括de和iou),第一行顯示為1dq 2dv 3dx 4dz 5youq 6youv 7youx 8youz2.當(dāng)輸入次音碼,視為輸入了雙拼雙音節(jié),所有帶調(diào)音節(jié)將會(huì)按英文字母順序列出,每次顯示二十個(gè)。缺省排列為雙拼雙音節(jié)在前,不足部分可選擇以雙拼單音節(jié)接后。如第一鍵為d(包括de和iou),第二鍵為i(包括i、ts和ug),第一行顯示為(以下舉例省略第二行)1de^iv 2de^i 3de^iz 4y^i 5y^iv 6youqiz 7youviz 8youvi 9youziz 0de^ds以下步驟省略。
(三)智能語句模式輸入龔碼智能語句模式輸入時(shí),無需輸入聲調(diào),將單拼字輸入單碼,雙拼字輸入雙碼即可。如輸入yismudwhrhahaytsomttpdtbyj.
中文方塊字顯示為用我們的智慧和雙手托起明天的太陽。
龔碼拼音標(biāo)注方式顯示為Yugz woxmenv d’drzhuiz hv sruagqsroux tuoqchx migvtianv d’taizyagz.
龔碼拼音文字方式顯示為Yug wm d drzhuiz h sruagqsrou tuoqch mig^tian d tai^yag.
為了提高語句輸入的準(zhǔn)確率,用戶可開啟自學(xué)習(xí)功能,龔碼智能語句模式會(huì)記住用戶在輸入過程中所作的各種修改,并調(diào)整相應(yīng)字詞的出現(xiàn)頻率。語句模式也可智能學(xué)習(xí)用戶指定的整篇文章的風(fēng)格(文風(fēng)學(xué)習(xí)),將原輸入系統(tǒng)中沒有的語詞自動(dòng)保存,即相當(dāng)于自動(dòng)造詞。
龔碼單拼可用于龔碼華語拼音、漢語拼音、通用拼音、注音等各種拼注音體系形成的各種字符集。龔碼單拼輸入法改變了輸入世界中長期以來“學(xué)習(xí)難度與輸入速度成反比”的歷史,優(yōu)于現(xiàn)行的各種雙拼輸入法,真正實(shí)現(xiàn)了中文輸入法的革命性飛躍,為中文信息計(jì)算機(jī)處理奠定了基礎(chǔ)。龔碼拼音輸入法的出現(xiàn),將有效結(jié)束“萬碼奔騰”的奇觀,讓中文信息軟件等方面的研究、使用真正邁上科學(xué)實(shí)用的正確軌道。使用龔碼單拼后,配合音、形、碼的互顯功能,由于輸入時(shí)無需再去思考“形”,知識(shí)工作者從腦中構(gòu)思再直接敲入計(jì)算機(jī)中,直接校正,之后立即可自行排版,從頭到尾一氣呵成,真正“指隨意動(dòng),字隨指出”,敲鍵盤成了思想的輔入,而非負(fù)擔(dān)。而盡量按詞輸入的目的,是為了便于掌握概念,提高可讀性,減少混淆的機(jī)會(huì)。
六.龔碼統(tǒng)一譯名方案目前,簡繁體字使用區(qū)采用不同的譯名方案,因而國名、地名、人名等外文譯名譯成中文時(shí)(譯進(jìn)時(shí))不統(tǒng)一。如中國大陸的譯名“塞拉利昂共和國、波多諾伏、西哈努克”,中國臺(tái)灣譯作“獅子山共和國、新港、施漢諾”。再如加拿大現(xiàn)任總理的lastname是Chrétien,中國大陸譯作克里斯蒂安、克雷蒂安,香港特區(qū)譯作克里靖、克里田、克理廷、麥肯鍚金,中國臺(tái)灣譯作柯瑞松、克瑞強(qiáng)、柯瑞祥、柯提昂、柯雷提昂。
龔碼標(biāo)準(zhǔn)譯名法的準(zhǔn)則是1.名從主人,被名稱的擁有方認(rèn)可的中文名稱不翻譯。如新加坡、日本、韓國等的人地山河名,再如外國人已有其本人認(rèn)可的中文名。
2.無爭議不重譯。被繁簡使用區(qū)共同認(rèn)可、已經(jīng)習(xí)慣且無爭議的名稱不重譯。如德國、多倫多、牛頓等。
3.原文直譯,不轉(zhuǎn)譯。如俄國人名,不通過英文轉(zhuǎn)譯。名稱以所屬國官方公布為準(zhǔn)。
4.對(duì)應(yīng)特定音節(jié)使用發(fā)音最接近的專用中文字,一個(gè)中文字只可對(duì)應(yīng)一種音節(jié);中文譯名字音最接近原語言的標(biāo)準(zhǔn)音,標(biāo)準(zhǔn)音未定者按國際音標(biāo)發(fā)音。
5.譯名在三音節(jié)以上者原文的輕讀音不譯。
6.不同譯者可據(jù)標(biāo)準(zhǔn)譯名法譯出相同結(jié)果。
7.根據(jù)中文譯名可大致反推出原外文名稱。
如前述加拿大現(xiàn)任總理的last name是Chrétien,屬法文人名,按法語的最接近字音,龔碼標(biāo)準(zhǔn)譯名法譯作“克瑞廷”。
為改善目前的譯名不統(tǒng)一狀況,《龔碼詞典》將列出外文國名與較有影響的人地山河名的中文譯名統(tǒng)一規(guī)范形式。
目前世界已進(jìn)入“地球村”的時(shí)代。面對(duì)國際社會(huì)全新的挑戰(zhàn),中華民族在語言文字方面已經(jīng)沒有猶豫的時(shí)間和退縮的借口。競爭是現(xiàn)實(shí)的,因?yàn)橹辉S成功不許失??;改革是要勇氣的,因?yàn)楸仨毟钌嵩械牧?xí)性。無論如何,我們都必須盡早取得進(jìn)入語言文字國際化入口的通行證。與其被國際潮流所“逼”不得不“全民學(xué)英語”,不如使自己的語言文字現(xiàn)代化和科學(xué)化,被國際社會(huì)廣為認(rèn)可和接受,吸引外國人學(xué)習(xí)中文,吸引周邊國家采用中文,力爭在世界范圍內(nèi)掀起學(xué)中文熱潮。兩相比較,后者更能提高民族自信心和民族凝聚力,及大大推進(jìn)中國甚至整個(gè)世界的信息化進(jìn)程。
目前中國大陸、新加坡等地使用中文簡化字,中國臺(tái)灣、中國香港特區(qū)和海外華人社會(huì)使用中文繁體字。簡化字與繁體字之間某些字的字形、字義、字音不一樣,甚而有復(fù)雜的對(duì)應(yīng)關(guān)系;各個(gè)領(lǐng)域的用詞用語、漢語語法與國語文法,標(biāo)點(diǎn)符號(hào)用法,親族師友、中外貨幣、度量衡、歷史年表的稱謂等,也都有很大差異。如簡化字的“臺(tái)”對(duì)應(yīng)繁體字的“臺(tái)、臺(tái)、檯、枱、颱;繁體字的“參”對(duì)應(yīng)簡化字的“叁、參”。簡化字的laqjq(垃圾),繁體字讀作lzsez;簡化字的woqniuv(蝸牛),繁體字讀作guaqniuv。再如以下龔碼拼音標(biāo)注的繁體字的字音,同簡化字的字音有“一對(duì)多”和“多對(duì)多”的復(fù)雜對(duì)應(yīng)關(guān)系什srev,srv,srenv;馮pigv,fegv;和hanz,huv,huo’,huoz,hv,hz;瞿jyuz,chyuq,chyuv;艘sauq,souq;潦laux,lauz,liauv;沈trenv,srenx;啞ez,yax,yaq;圳trouv,dsunz,drenz;癌yanv,aiv;宿shoux,suz。
本發(fā)明配合在前發(fā)明《中文文字龔碼統(tǒng)一方案》,是一組關(guān)于中文語言文字的系列方案。在前的中文文字龔碼統(tǒng)一方案已實(shí)現(xiàn)中文方塊字的字音、字義、用詞用語、語法等多方面的統(tǒng)一。龔碼簡繁形同屬一個(gè)內(nèi)碼,可視為只是字體不同,且簡與繁不會(huì)出現(xiàn)在同一出版品中,因而字形已統(tǒng)一。龔碼單拼輸入法可“一碼打盡天下中文”,那么配合龔碼華語拼音統(tǒng)一方案,已實(shí)現(xiàn)了語同音,書同文,文同字,字同碼,碼同鍵,外同譯。打造夢(mèng)幻華語文字,引導(dǎo)當(dāng)代國際潮流,是龔碼華語文字系列方案的方向。在此基礎(chǔ)上,將迎來中文和華語文化的偉大復(fù)興,使中文全方位進(jìn)入國際領(lǐng)域。
龔碼華語拼音文字并不是力圖全面取代現(xiàn)行中文方塊字,只是希望成為中文與國際語言文字之間的一道橋梁,也就是一種功能較強(qiáng)、學(xué)習(xí)推廣容易、使用方便的輔助文字。我們不必用復(fù)雜感情代替科學(xué)追求,縮小距離、逐步超越是科學(xué)的自然法則,而不是墨守陳規(guī)或試圖另創(chuàng)新案、一步取代。拼音化的宗旨是立足當(dāng)代、面向未來;沒必要、也不應(yīng)該去嘗試將汗牛沖棟的古籍拼音化。對(duì)于古籍的保存、古文與古詩詞的學(xué)習(xí)和欣賞,仍可以通過中文方塊字。
另外,可以在海外華人后代的華語教育中,以學(xué)拼音標(biāo)注啟蒙,其后學(xué)拼音文字,有興趣的再另外教授中文統(tǒng)一文字。與其因?yàn)橹形姆綁K字而割裂他們與中華文化的聯(lián)系,不如在同他們之間架一座拼音文字的橋梁。畢竟,海外華人也是整個(gè)華人社會(huì)的一部份。外國人學(xué)華語也可按此順序,即分為三步龔碼華語拼音標(biāo)注→龔碼華語拼音文字→龔碼中文統(tǒng)一文字(只有六千多字),后一步為選擇項(xiàng)。而國內(nèi)兒童的識(shí)字期可提前一、兩年,兒童的閱讀期及其他各種學(xué)習(xí)也將相對(duì)提前,智力開發(fā)的成效將顯著提升,全民的識(shí)字率將大幅提高。一旦學(xué)會(huì)26個(gè)字母之后,即使還沒學(xué)會(huì)識(shí)方塊字的人,也能把以華語拼音標(biāo)注的店名、商品名,甚至電話簿上的人名拼出。
有語言文字學(xué)家的研究顯示,只要對(duì)英語的拼寫、讀音和語法科學(xué)地加以變通和適當(dāng)規(guī)范,學(xué)習(xí)者即可節(jié)省50%的時(shí)間。若龔碼華語拼音方案和龔碼中文文字統(tǒng)一方案等系列方案能得以推行,從理論上說,華語的平均學(xué)習(xí)時(shí)間將能降至現(xiàn)在的20%以內(nèi)。如果海內(nèi)外的華人把這些節(jié)省的時(shí)間拿來學(xué)習(xí)其他知識(shí),或用于工作或研究,將能創(chuàng)造無法衡量的經(jīng)濟(jì)價(jià)值,大中華的綜合國力、國際地位和國際發(fā)言權(quán)也將得到大幅提升。
以上概略地對(duì)本發(fā)明的龔碼華語拼音、單拼輸入統(tǒng)一方案及智能轉(zhuǎn)換翻譯作了描述。本發(fā)明相關(guān)領(lǐng)域的人員,可以不經(jīng)創(chuàng)造性勞動(dòng)就能對(duì)本發(fā)明作出各種各樣的修改和改進(jìn)。發(fā)明人認(rèn)為,這種修改和改進(jìn)都屬于后面的權(quán)利要求書所定義的范圍之內(nèi)。
本發(fā)明可有效應(yīng)用于中文和華語的信息數(shù)字化輸入、傳輸、識(shí)別、計(jì)算機(jī)處理、機(jī)器翻譯、排序、檢索、速記、文字智能處理、語音識(shí)別系統(tǒng)、同聲傳譯系統(tǒng)等,可用于涉及到中文的各種計(jì)算機(jī)軟件(如操作系統(tǒng)、瀏覽器、文字處理、排版、光學(xué)OCR識(shí)別、翻譯、校對(duì)等軟件),國際互聯(lián)網(wǎng),平面(圖書報(bào)刊等)、多媒體(CD、DVD光碟等)、電子(國際互聯(lián)網(wǎng)頁等)出版品,電子字典等,可支持所有平臺(tái),可用于主機(jī)Server端或客戶Client端,可用于文件、電子郵件、頁面。亦可用于中文字與中國方言文字、少數(shù)民族語言文字,及與日文、韓文等其他亞洲語言文字的輸入、語音拼注及轉(zhuǎn)換翻譯。
附龔碼拼音文稿示例天地垂日月 斯人未云亡 ——張公祠游記Tian^di Truiv Ri^yue Sq R Weiz Yunv Wagv ——Drag^gug^tsv Youvjz(1990年5月16日新華社電訊稿)(1990n5y16ri Shinqhuavsrez dianzshyunz gaux)·龔學(xué)勝··Gugq Shue^sregz·(E119 h456)一個(gè)融融春日,我去瞻仰了張公祠。l^ge chigvlagx d trun^ri,w ch dranqyagxl Drag^gug^tsv(I334).
位于湖北省南漳縣武鎮(zhèn)北郊蟠龍、伏虎二山間的張公祠,是為紀(jì)念抗日戰(zhàn)爭中為國捐軀的張自忠將軍而修建的。祠內(nèi)一九五六年恢復(fù)了南漳縣藎忱中學(xué)。祠的正門向南,門前是清流長碧的藎忱渠,渠水帶著鄂西北父老鄉(xiāng)親的一片深情悠然東去。祠的東、西、北三面環(huán)山,青松挺拔。每每風(fēng)過,松濤陣陣,似有進(jìn)擊的軍號(hào)聲和千軍萬馬的嘶喊,給這多姿綽約的水光山色平添了一層壯嚴(yán)、肅穆的氣氛。Weiz yu Huvbeix Sregx Nanvdragq Shanz Wuxdrenz beixjauq Panvlug Sran h Fuvhux Srandri^janq d Drag^gug^tsv,sr wei jznianz Kagzri-dran^dregq c wei g jyuanqchyuq d DragDszdrugq(D335d219)jag^jyun e shou^janz d.Tsv nei 1956n huiqfuzl Nanvdragq ShanzJinztrenv C^shue.Tsv d dreg^men shagz nanv,men chan sr chigqtrezjan^dix d JinztrenvChyuv,chyuvsrui daizdre Huvbeix shi^beixbu fuzlaushagqchin d 1p srenqchig youqrandugq ch.Tsv d dugq、shi、beix 3mian huanv sran,chigqsugq tigxbav.Meixdag feg guo,sugqtauq drenzdrenz,szhu y trug^fegq d jun^hauzsregq h chanqjun&wanzma d sqhanx,gei dr duo^dsqtruozyueq d srui^guag&sran^se pig^tianql 1tseg druagqyanv、suzmuz dchzfen’.
張公祠占地二十五公頃,芳草鋪地,綠樹長青。當(dāng)年張自忠將軍的三十三集團(tuán)軍總部就設(shè)在這里。祠中心有一面積約九十平方米的正方形陵園,其四周是高約二米的紅磚花墻。陵園門前有兩尊碑刻呈“八”字形立于石階兩側(cè)。右側(cè)石碑上是蔣中正先生的題詞氣壯山河;左側(cè)石碑上是馮玉祥將軍的題詞萬古不朽。我拾級(jí)而上,從拱形園門步入陵園,首先映入眼簾的是張自忠將軍的衣冠冢。一九四零年將軍殉國后,遺體由宜昌運(yùn)往重慶,安葬在重慶北碚梅花山,這里留下了衣冠冢。衣冠冢呈二米方圓的圓形,高約一點(diǎn)五米,座落在陵園正中的鮮花叢中。濃密的青草將衣冠冢嚴(yán)嚴(yán)實(shí)實(shí)地覆蓋住,朵朵小花點(diǎn)綴其間。冢前是兩棵冬青樹護(hù)衛(wèi)的張將軍的青石像,俊眉大眼,英武豪放。像下刻有張將軍決心殉國的手書,狂草奔放,筆力強(qiáng)勁。將軍那救國護(hù)民的赤肝義膽,那磊落坦蕩的凜然正氣,仿佛由酣暢的筆端脫穎而出,震撼著我的心弦。衣冠冢附近還有許多名人、要員的題詞和挽聯(lián)石碑。陵園四周有四個(gè)弧形花壇,每個(gè)花壇旁臥有一棵粗壯的雪松,寶塔似的樹冠猶如在肅立默哀。Drag^gug^tsv dranzdi 25gug^chigx,fagqtsau puq di,lyuzsruz trag qigq.Dag^nian DragDszdrugq jag^jun d #33jvtuan^jyun dsug^bu jou srez ds dr^li.Tsv c^shin y i mian^j’yueq 90pig^fag^mi d dreg^fag^shigv ligvyuanv,chv s^drou sr gau yueq 2mi d hug^druanqhuaqchagv.Ligvyuanv men chan y liag^zun beiqkez trenv“baq”dsz shigv liz yu srvjeqliag^tsez.Youztsez srvbeiq srag sr Jagx C^dreg shanqsreg d tivtsvChzdruagzsran^hev;dsuoxtsez srvbeiq srag sr Fegv Yuzshagv jag^jun d tivtsvWanzguxb^shoux.W srvjve^srag,tsug gugxshigv yuanvmen buz ruz ligvyuanv,srouxshanqigz ruz yan^lianv d sr Drag Dszdrugq jag^jun d iqguanqdrugx.1940n jag^jun shyunzghou,ivti youv lvtragq yun wagx Trugvchigz,an^dsagz ds Trugvchigz Beixbeiz d MeivhuaqSran,dr^lix liuvsh^l iqguanqdrugx.lqguanqdrugx trenv 2mi fag^yuanv d yuanvshigv,gau yueq 1.5mi,zuozluo ds ligvyuanv dreg^c d shanqhuaq tsugv c.Nugvmiz d chigqtsaujag iqguanqdrugx yanvyanv-srvsrv di fuzgaiz druz,duoxduox shau^huaq dian^druizchvjanq.Drugx chan sr liag^kex dugqchigqsruz huzweiz d Dragjag^jun d chigqsrvshagz,junzmeiv&da^yan,igqwux hauvfagz.Shagz sha kez y Drag jag^junq jyuevshin shyunzgd srou^sru,kuagvtsaux benqfagz,bixliz chag^jinz.Jag^jun na jouzg huzmin dtrvdanx&drugqshin,na leixluo tanxdagz d linxran dreg^chz,fagxfo youv hanqtragz dbixduanq tuo^igxe^truq,drendranzdre w d shin^shanv.lqguanqdrugx fuzjinz haivyshyuxduo migvr、yau^yuan d tivtsv h wanxlianv srvbeiq.Ligvyuanv si^drou y si^ghuvshigv huaqtanv,meixge huaqtanv pag woz y lkeq tsuqdruagz d shyuexsugq,bauxtaxsrzd sruzguanz youvru ds suzliz mozaiq.
佇立在張自忠將軍的衣冠冢前,仰慕英雄高風(fēng),我墜入了綿邈的遐思之中……Druzliz ds Drag dszdrugq jag^jyun d iqguanqdrugx chan,yagxmuz igqshugv d gau^sragzfeg^fanz,w druizruzl trag^trag d shavshag dri^c…自忠將軍字藎忱,一八九零年生于山東臨清縣。他自幼聰明好學(xué),熱情正直,后來投筆從戎,立志擔(dān)負(fù)興亡之責(zé)。一九一六年起歷任營、團(tuán)長,陸軍師長、軍長,察哈爾省政府主席,天津市市長,陸軍上將第三十三集團(tuán)軍總司令等職。Dszdrugq jag^jun dsz Jinztrenv(F101i075),1890n sreg yu Sran^dugq Linvchigq Shanz.T dszyouz tsugqmig hau^shue, re^qig dreg^drv, hou^lai touvbix-tsug^rugv,lizdrizdanqfuz chi g^ja shigqwagv d zevren.1916n chi t lizren yigvdragx、tuan^dragx,luzjunsrqdragx、jun^dragx,Tsaqhaverx Sregx sregxdregzfux dru^shv,Tianqjinq Srz srzdragx,luzjun srag^jag #33jvtuan^jun dsug^sqligz deg driv.
一九四零年,侵華日軍總頭目岡村寧次在豫南、鄂北增援了七個(gè)師團(tuán)的兵力,采用希特勒的閃電戰(zhàn)術(shù),大舉進(jìn)攻襄陽、南陽,張自忠將軍率領(lǐng)所部將士誓死抵抗。五月十六日,日軍集中兵力,在飛機(jī)掩護(hù)下從隨縣、鐘祥兩路反撲,張自忠率兩千官兵在湖北宜城同萬余日寇展開了血戰(zhàn)。隨行參謀和蘇聯(lián)顧問勸他迅速離開戰(zhàn)場(chǎng),他堅(jiān)決不下火線。兩軍從清晨激戰(zhàn)到中午,張自忠左臂負(fù)傷后仍疾呼督戰(zhàn)。在身負(fù)六彈重傷倒下后,又囑咐身邊衛(wèi)士“對(duì)國家、對(duì)民族,良心平安,大家要?dú)硤?bào)仇!”說完,壯烈犧牲在宜城南瓜店十里長山陣地上……1940n,chinq huav ri^jun dsug^tou^mu Gagqtsunqninvts ds Hvnanv nanvbu h Huvbeixbeixbu dsegqyuanvl 7ge srqtuan d bigqliz,tsaixyug Hitler(Shqt^lq)d sranxdianz-dran^sruz,da^jux jin^gugq Shagqyag、Nanvyag,Drag Dszdrugq jag^jun sruaizligjag^srzsrzsx dixkagz.5y16ri,ri^jun jvc bigqliz,ds feiqjq yanxhuz sha tsug Suivshanz、Drugqshagq liag^lu fan^puq, Drag Dszdrugq sruaiz liag^chanq guanqbigq ds Huvbeixlvtregv tug wanzyuv ri^kouz dranxkai^l shexdran.Sui^shig tsan^mouv h Suqlianvguzwenz chuanz t shyunzsuz livkai dran^tragx,t janqjyuev b^sha huoxshanz.Liag^juntsug chigqtrenv jqdran dau c^ux,Drag Dszdrugq dsuoxbiz fuzsragq hou reg drxhuiqdran^douz.Ds sren^fuz 6danz drugzsragq dauxsha hou,you druxfuz sren^bian weizsrz“dui g^ja、dui min^dsuv,liagvxin pig^an,da^ja yau sra^div bau^trouv!”Sruowan,druagzliez shqsregq ds lvtregv Nanvguaqdianz Srivli-trag^sran drenzdi srag…“天地垂日月,斯人未云亡?!眮辛⒃趶堊灾覍④姷囊鹿谮G?,我被一股浩然正氣激勵(lì)著,胸中久久回蕩著緬懷之情。驀地,我不敢再挪步了,因?yàn)槲夷_下的每一寸土地,都浸透了烈士的鮮血,都展示著一段永不磨滅的歷史。我深深意識(shí)到,真正偉大的生命進(jìn)行曲是不會(huì)消亡的,即便被擊倒,它也會(huì)在大地母親的懷中繼續(xù)歌唱。“Tian^di truiv ri^yue,Sq r weiz yunv wagv(G764 i567 j063 i526).” Druzliz ds DragDszdrugq jag^jun d iqguanqdrugx chan,w bei lgux hauzran dreg^chz jqlizdre,shugqcjouxjoux huivdagzdre mianxhuai dri chig.Mozdi,w b^ganx dsai dsou^dug l,in^wei wjauxsha d meix ltsunz tu^di,dou jinztouzl liezsrz d shanqshex,dou dranxsrzdre 1duanyugxb^movmie d lizsrx.W srenqsrenq izsr’dau,dren^dreg weixda d sreg^migzjin^shig^chyux sr b^hui shauqsrq d,jzbianz bei daxdaux,taz ye^hui ds da^di muxqind huai^c jzshyuz gqtragz.
瑯瑯的讀書聲,將我從沉思中喚醒。我想,在今曰海峽兩岸的土地上,向著世界,向著未來,已經(jīng)繪了許多既新又美的畫圖,譜了許多動(dòng)聽的樂曲。在“忠誠熱忱”的藎忱精神勉勵(lì)下,一批又一批的人才嶄露頭角。如果自忠將軍的英靈得知,一定會(huì)含笑于九泉的,一定。Lagvlagv d duvsru sregq,jag w tsug trenvsq c huanzshigx.W shag,ds jinqri hai^shav-liag^anz dtu^di srag,shagzdre srzjez,shagzdre weizlai,ixjig huizl shyuxduo shinqigx h meixliz d tuvhuaz,puxl shyuxduo dug^tig d yuezchyux.Ds“Drugqtregv Re^trenv”d Jinztrenv Jigqsrenv mianxliz sha,lpiq you lpiq d r^tsai dranxlouztou^jaux.Ru^guox Dszdrugq jag^jun d igqligv de driq,i^dig huihanvshauz yu jouxchuanv d,i^dig.
權(quán)利要求
1.一種華語拼音統(tǒng)一方案,其特征在于整體方案不超出26個(gè)英文字母和相關(guān)符號(hào)的范圍;從國際音標(biāo)的清輔音、濁輔音及元音中找出與華語的聲母和韻母發(fā)音最接近的對(duì)應(yīng)關(guān)系,然后,找出選定國際音標(biāo)與英語發(fā)音最接近的“出現(xiàn)頻度最高的”英文常規(guī)拼寫形式,如以下漢語拼音與華語拼音的對(duì)照q→ch,x→sh,z→ds,c→ts,ao→au,zh→dr,ch→tr,sh→sr,ong→ung,ü→yu;q,v,x,z四個(gè)字母依序?qū)S米鳂?biāo)示四聲,輕聲標(biāo)為(’),聲調(diào)標(biāo)于每個(gè)單音節(jié)的最后;為了使拼式簡單,所有的聲母與韻母在讀音不會(huì)混淆時(shí)都可獨(dú)立形成音節(jié),如yi→i,wu→u,yin→in,wen→un,zhi→dr,chi→tr,shi→sr,ri→r,zi→ds,ci→ts,si→s;在同一單音節(jié)中,當(dāng)元音字母后緊接-ng共同組成韻母時(shí),省略為-g,如ang→ag,eng→eg,ing→ig,ung→ug;每一個(gè)聲母在單用時(shí),都“視為”相當(dāng)于其在華語字母表中的讀音(表音),b(波)、p(坡)、m(莫)三個(gè)聲母視為已包括o音,聲母f(弗)視為已包括u音,d(德)、t(特)、n(呢)、l(勒)四個(gè)聲母視為已包括e音,g(哥)、k(科)、h(喝)三個(gè)聲母視為已包括e音,i(機(jī))、ch(其)、sh(西)三個(gè)聲母視為已包括i音;音節(jié)的界線發(fā)生混淆時(shí),用符號(hào)(^)隔開;為了避免字音排序時(shí),相同聲韻母的音節(jié)由于聲調(diào)字母的加入而被分開,排序的主要關(guān)鍵字不考慮聲調(diào)字符,次要關(guān)鍵字考慮聲調(diào)字符。
2.一種華語拼音文字統(tǒng)一方案,其特征在于華語拼音方案的實(shí)際運(yùn)用形式,分為“華語拼音標(biāo)注方式”和“華語拼音文字方式”,拼音標(biāo)注方式除了用于為中文方塊字標(biāo)注字音和華語人地山河名譯出或其他非段落文本形式的標(biāo)注外,也作為初學(xué)者拼音讀物和兒童拼音讀物的拼寫方式;華語拼音的整體方案采用全拼形式,以單拼方式輸入時(shí)“輸簡顯全”,在全部標(biāo)調(diào)的基礎(chǔ)上,能夠省掉聲調(diào)的字詞(如異拼略調(diào)字詞)才“省略”聲調(diào),盡量按詞輸入,不用意頭意尾;對(duì)部分有必要分化定型的高頻字,采用略拼略調(diào)字(部分只略調(diào)未略拼),單用或用于詞尾時(shí)用略拼形式不標(biāo)聲調(diào),用于詞頭或詞中,其后無(-)或(&)等符號(hào)時(shí),用(^)標(biāo)于單音節(jié)之后;略拼略調(diào)字根據(jù)分化定型的必要性和綜合字頻確定,當(dāng)綜合字頻相近時(shí),根據(jù)字頻方向平均值確定;為免混淆,每一種聲、韻母的組合只能有一個(gè)略拼略調(diào)字;對(duì)部分有必要分化定型的次高頻字,采用單音節(jié)最多不超過五個(gè)音碼的全拼形式;根據(jù)綜合字頻等確定時(shí),選擇優(yōu)先順序?yàn)槁云绰哉{(diào)字—常拼略調(diào)字—全拼略調(diào)字—略拼帶調(diào)字—全拼帶調(diào)字—常拼帶調(diào)字;對(duì)少數(shù)在簡繁體字使用區(qū)無爭議的高頻詞,采用統(tǒng)一的略拼形式,略拼詞不標(biāo)聲調(diào),每一種字母的組合只能有一個(gè)略拼略調(diào)詞,并且不能與其他常拼音節(jié)混淆;普通名詞的略拼略調(diào)詞制訂參考龔碼單拼輸入方案;音節(jié)界線不會(huì)混淆的單字母音節(jié)可自然形成略拼略調(diào)詞;略拼略調(diào)專用名詞只將每個(gè)字的聲母列出,無聲母的只用韻母的第一個(gè)字母;當(dāng)聲母有兩個(gè)字母組成,并需要大寫時(shí),第二個(gè)字母小寫;量詞前的數(shù)詞為“一”并處于段首時(shí)用中文數(shù)字的拼音,其他情況一律使用阿拉伯?dāng)?shù)字,并與量詞連寫;年月日、點(diǎn)分秒用略音字,與相關(guān)阿拉伯?dāng)?shù)字連寫;序數(shù)詞前若有“第”省略;序數(shù)詞前加#(需要時(shí)按華語習(xí)慣讀作“diz”),與其后阿拉伯?dāng)?shù)字和量詞連寫;為了便于閱讀和理解,并列關(guān)系用&(不發(fā)音),前后不空格;貨幣金額的華語大寫數(shù)字(如支票上的大寫)采用全拼帶調(diào)形式,每十進(jìn)位單位之間用連字號(hào),每個(gè)大寫數(shù)字和單位的音碼不少于兩個(gè)字母;對(duì)需要加注的人地山河名和引用的古文字句等需要明確區(qū)分的特定字詞,采用附加“碼注”(按有關(guān)編碼的內(nèi)碼標(biāo)注)的方式處理,即注上特定字的編碼,而編碼可及時(shí)顯示,方便查閱,碼注的大小寫和分詞連寫方式與標(biāo)注的原拼音的每個(gè)單音節(jié)嚴(yán)格保持一致,有必要確認(rèn)對(duì)應(yīng)中文字時(shí),可及時(shí)將光標(biāo)置于編碼上,利用互顯功能查出中文字;也可利用編碼表查閱,不需要時(shí)可略過;句首單詞、詩歌各行及論文大綱中各項(xiàng)的首字母大寫,人地山河、機(jī)構(gòu)團(tuán)體等專名首字母大寫;圖書報(bào)刊、影視戲劇、文章詩歌及藝術(shù)品等名稱用斜體,用于強(qiáng)調(diào)或例示的字詞用斜體,法庭案例名稱中的原被告姓名用斜體;外來詞,包括非華語的人地山河名,其拼寫在原則上一律還原為原拉丁字母形式,必要時(shí)將讀音以華語拼音加注于括號(hào)內(nèi)。
3.一種對(duì)同音同調(diào)字詞分化定型的方法,其特征在于按照“原同音同調(diào)字詞中高頻字詞保持原調(diào),次高頻字詞轉(zhuǎn)調(diào),低頻字詞轉(zhuǎn)用法;轉(zhuǎn)音字詞不會(huì)產(chǎn)生新的混淆”的原則進(jìn)行聲調(diào)分化,優(yōu)先在平聲或仄聲內(nèi)互轉(zhuǎn),陰平與陽平互轉(zhuǎn),上聲與去聲互轉(zhuǎn),同音同調(diào)詞中只轉(zhuǎn)換其中易轉(zhuǎn)字的聲調(diào);當(dāng)難以進(jìn)行聲調(diào)分化時(shí),原同音同調(diào)字詞中高頻字詞保持原音,次高頻字詞轉(zhuǎn)音,低頻字詞轉(zhuǎn)用法,優(yōu)先在相近字音內(nèi)互轉(zhuǎn),轉(zhuǎn)音字詞不會(huì)產(chǎn)生新的混淆,相關(guān)卷舌音與平舌音互轉(zhuǎn),相關(guān)清音與濁音互轉(zhuǎn);采用全拼、略拼和略調(diào)字詞方式,不改變字音,只改變拼寫形式或省略聲調(diào),在“每一種單音節(jié)不超過五個(gè)音碼,拼寫方式易讀,無歧音”的原則下,對(duì)每一種音節(jié)預(yù)安排兩種異拼形式,可對(duì)每一種單音節(jié)常拼帶調(diào)之外的11個(gè)字分化定型,在與其他同聲同調(diào)字或相關(guān)語詞產(chǎn)生混淆時(shí)才使用;當(dāng)難以進(jìn)行聲調(diào)和字音分化時(shí),原同音同調(diào)字詞中高頻字詞保持原用,次高頻和低頻字詞轉(zhuǎn)用法,不易轉(zhuǎn)字詞保持原用,易轉(zhuǎn)字詞轉(zhuǎn)用法,優(yōu)先轉(zhuǎn)換為現(xiàn)正使用的字詞,轉(zhuǎn)用字詞不會(huì)產(chǎn)生新的混淆;由于某些不同的方塊字詞在拼音字詞中成了同音字詞,在使用拼音文字時(shí),盡量避免使用語義不易理解的略字語詞,改用完整語詞;綜合采用多種方法復(fù)雜分化;對(duì)中文方塊字標(biāo)注字音時(shí),仍按華語拼音的常拼帶調(diào)。
4.一種拼音相關(guān)智能化互顯互轉(zhuǎn)互譯方法,其特征在于為了使字詞與拼音、編碼能相互融合,即字(含詞)中有音、碼,音中有字、碼,碼中有字、音,首先要求三者互顯;當(dāng)需查尋某音節(jié)的字碼信息時(shí),把光標(biāo)置于所選音節(jié),即顯示與該詞拼音聲調(diào)相符的字形、編碼等信息,信息框可為固定形式或隨光標(biāo)移動(dòng)形式,用戶根據(jù)需要選擇,并可點(diǎn)取上屏。有多個(gè)字詞時(shí),按頻度排列;反之,把光標(biāo)置于所選字詞,即顯示與該字詞相符的拼音、編碼等信息;用戶可根據(jù)需要將此功能隨時(shí)開啟或關(guān)閉;;由于盡量按詞輸入,并對(duì)同音同調(diào)字詞進(jìn)行了有效的分化定型,因而中文的文字與拼音之間的轉(zhuǎn)換,以及龔碼拼音文本與外文之間的翻譯將會(huì)非常容易,轉(zhuǎn)換或翻譯結(jié)果可根據(jù)上下文自動(dòng)進(jìn)行智能化檢查、校對(duì)、修正;所有的中文文本均可轉(zhuǎn)為純字母方式并排序,在國際范圍內(nèi)供檢索查閱,所有的外文文本也可輕易譯為拼音文字并排序。
5.一種中文文字和華語拼音的字音輸入統(tǒng)一方案,其特征在于使用簡繁體字統(tǒng)一的鍵盤對(duì)應(yīng)方式;為了便于記憶,當(dāng)華語拼音方案中的聲母或韻母只有一個(gè)字母時(shí),優(yōu)先采用與之相同的鍵盤字母,如聲母b、p、m、f、d、t、n、l、g、k、h、i、r、s,韻母a、o、e、i、u,當(dāng)聲母或韻母超過一個(gè)字母時(shí),全部簡化為一個(gè)字母;為使鍵盤擊鍵次數(shù)分布科學(xué)合理,將所有用字的每一個(gè)聲母或韻母出現(xiàn)的次數(shù)加總,除以聲韻母總次數(shù),得出每一聲韻母的特定音頻百分比;在上述優(yōu)先對(duì)應(yīng)的鍵盤字母之外另增簡化聲韻母時(shí),每一字母鍵的總擊鍵次數(shù)應(yīng)相對(duì)均衡(均布荷載),以有效減少重碼;為強(qiáng)化聲調(diào)功能,并將字詞分流,專用聲調(diào)字母保留原用;明確區(qū)分單拼字、雙拼字、雙拼雙字語詞、三拼雙字語詞、三拼三字語詞、四拼雙字語詞及四拼多字語詞,并且鍵鍵有字,當(dāng)輸入調(diào)鍵時(shí)視為字輸入的結(jié)束鍵;輸入時(shí)不必拘泥于語法意義上的詞或短語,盡量采用三字以上的詞或短語、句子形式,長了重碼少,平均擊鍵少,即“能連則連,連多則快”;當(dāng)輸入首音碼,視為輸入了首碼相關(guān)高頻字(包括單拼字和雙拼字),所有字將會(huì)按綜合字頻列出,每次顯示二十個(gè)(不足部分可選擇以首碼相關(guān)高頻字接后)。前十個(gè)用英文鍵盤前方的數(shù)字鍵選取,第一字也可用空格鍵選取,后十個(gè)用右方小鍵盤的數(shù)字鍵選取,未出現(xiàn)字詞可按([)、(])鍵翻頁,并會(huì)在第一行顯示一個(gè)與此單拼字相關(guān)的高頻雙字語詞(首字相符),用/鍵選??;當(dāng)輸入次音碼,視為輸入了雙拼詞(兩個(gè)單拼字組成的雙字語詞),此字音的所有詞將會(huì)按綜合詞頻列出,每次顯示二十個(gè),并會(huì)顯示一個(gè)與此二鍵相關(guān)的高頻雙拼詞,用/鍵選?。淮未a若為調(diào)碼,視為完成了帶調(diào)單拼字輸入,這些字將會(huì)按綜合字頻列出,每次顯示二十個(gè),并會(huì)顯示一個(gè)與此二碼相關(guān)的高頻雙拼詞(首字為相關(guān)帶調(diào)單拼字),用/鍵選??;當(dāng)輸入第三音碼,視為輸入了三拼詞(三拼雙字、三字語詞),所有相關(guān)詞將會(huì)按綜合詞頻列出,每次顯示二十個(gè)(不足部分可選擇以相關(guān)高頻詞接后),并會(huì)顯示一個(gè)與此三鍵相關(guān)的高頻三字詞(每字首碼相符),用/鍵選??;第三鍵若為調(diào)鍵,視為完成了帶調(diào)雙拼字輸入,此含調(diào)字音的所有字將會(huì)按綜合字頻列出,每次顯示二十個(gè),并會(huì)顯示一個(gè)與此三鍵相關(guān)的高頻雙字詞(首字的音與調(diào)均相符),用/鍵選?。划?dāng)輸入第四音碼,視為輸入了四拼詞(四拼雙字、多字語詞),相關(guān)語詞按綜合詞頻列出,每次顯示二十個(gè)(不足部分可選擇以相關(guān)高頻詞接后);如果有,會(huì)顯示一個(gè)與此四鍵相關(guān)的高頻四字詞(每字首碼相符),用/鍵選?。灰陨系膯纹摧斎胫?,為了提高輸入速度,每一個(gè)輸入步驟的缺省設(shè)定為只顯示“完全符合條件”的字詞,“不足部分可選擇以相關(guān)高頻字詞接后”則由用戶選擇使用;單拼拼音文字輸入時(shí)“輸簡顯全”,即以單拼方式輸入,顯示常拼結(jié)果,根據(jù)標(biāo)點(diǎn)符號(hào)自動(dòng)將句首的第一個(gè)字母大寫,自動(dòng)在單詞之間加空格,華語拼音中沒有的音節(jié)將不會(huì)顯示;充分利用每個(gè)首碼字母對(duì)應(yīng)的20個(gè)高頻字,做到“高頻字不翻頁”,有把握的高頻字一鍵完成,其他單拼字帶調(diào)兩鍵輸入,雙拼字帶調(diào)三鍵輸入;雙字詞若由兩個(gè)單拼字組成兩鍵輸入,一單一雙三鍵輸入,兩個(gè)雙拼字四鍵輸入;三字詞三鍵、四字詞四鍵,只輸入首碼;五字詞以上輸入前三字和末字的首碼,共四鍵;智能語句模式輸入時(shí),無需輸入聲調(diào),將單拼字輸入單碼,雙拼字輸入雙碼即可;用戶可隨時(shí)自造詞、修改詞,并可按類別分為各類詞庫,據(jù)需要選擇掛接;單拼輸入法可自動(dòng)調(diào)頻,用戶也可根據(jù)需要手動(dòng)調(diào)頻;為了提高語句輸入的準(zhǔn)確率,用戶可開啟自學(xué)習(xí)功能;龔碼智能語句模式會(huì)記住用戶在輸入過程中所作的各種修改,并調(diào)整相應(yīng)字詞的出現(xiàn)頻率;語句模式也可智能學(xué)習(xí)用戶指定的整篇文章的風(fēng)格,將原輸入系統(tǒng)中沒有的語詞自動(dòng)保存,即相當(dāng)于自動(dòng)造詞。
6.一種中文文字譯名統(tǒng)一方案,其特征在于外文的國名、人地山河名譯進(jìn)時(shí)采用在簡繁體字使用區(qū)統(tǒng)一的標(biāo)準(zhǔn)譯名法;標(biāo)準(zhǔn)譯名法以國際音標(biāo)的音節(jié),搭配固定的與該音節(jié)發(fā)音最接近的中文用字;不同的譯者將非中文的人地山河名用標(biāo)準(zhǔn)譯名法譯成中文后,能得到相同的結(jié)果;名從主人,被名稱的擁有方認(rèn)可的中文名稱不翻譯,外國人已有其本人認(rèn)可中文名的就不再翻譯;被繁簡使用區(qū)共同認(rèn)可、已經(jīng)習(xí)慣且無爭議的名稱不重譯;原文直譯,不轉(zhuǎn)譯;名稱以所屬國官方公布為準(zhǔn);對(duì)應(yīng)特定音節(jié)使用發(fā)音最接近的專用中文字,一個(gè)中文字只可對(duì)應(yīng)一種音節(jié);中文譯名字音最接近原語言的標(biāo)準(zhǔn)音,標(biāo)準(zhǔn)音未定者按國際音標(biāo)發(fā)音;譯名在三音節(jié)以上者原文的輕讀音不譯;不同譯者可據(jù)標(biāo)準(zhǔn)譯名法譯出相同結(jié)果;根據(jù)中文譯名可反推出原外文名稱的常規(guī)拼寫形式;為改善譯名不統(tǒng)一狀況,統(tǒng)一方案相關(guān)詞典列出外文國名與較有影響的人地山河名之中文譯名統(tǒng)一規(guī)范形式。
全文摘要
本發(fā)明為一種龔碼華語拼音、單拼輸入統(tǒng)一方案及拼音相關(guān)智能轉(zhuǎn)換翻譯。龔碼華語拼音方案含專用標(biāo)調(diào)字母在內(nèi)不超出英文26個(gè)字母的范圍,由漢語拼音的單音節(jié)最多6個(gè)音碼減少到5個(gè)音碼,音節(jié)之間界限分明,既可用于中文字音和聲調(diào)的標(biāo)注,又可獨(dú)立形成與國際語言文字接軌具有法律準(zhǔn)確度的拼音文字。字、音、碼高度融合,可互顯互轉(zhuǎn),可與中文語句與外文直接對(duì)譯。龔碼單拼充分利用第一鍵,實(shí)現(xiàn)了字字分流、字詞分流、詞詞分流,許多字可一鍵輸出,無需記部首即可快速輸出。本發(fā)明可有效應(yīng)用于各種涉及到中文的信息數(shù)字化輸入、排序、傳輸、檢索、識(shí)別、速記、平面與電子出版、計(jì)算機(jī)處理、機(jī)器翻譯等。
文檔編號(hào)G06F3/023GK1414453SQ02108930
公開日2003年4月30日 申請(qǐng)日期2002年4月6日 優(yōu)先權(quán)日2002年4月6日
發(fā)明者龔學(xué)勝 申請(qǐng)人:龔學(xué)勝