华夏文摘第一八三期(一九九四年九月三十日)【电脑世界】
http://www.cnd.org/HXWZ/CM94/cm9409e.hz8.html#7
现在由CND直接发行的是《华夏文摘》GB版。在日本比较流行的可以直接阅读GB文件的环境有:可在UNIX下运行的cxterm、可在英、日文版Windows下运行的“丁当”(DingDang Chinese Word Processor for Windows)、可在苹果机上运行的Chinese Language Kit。许多人使用上述软件直接阅读《华夏文摘》。
那些没有条件直接阅读GB文件,但具备中文环境的读者,可以借助日本的中文软件来阅读《华夏文摘》。
这些软件的特点,是能够同时处理中文和日文。比较通行的设计,是将中文字库放在日文汉字不常使用的地址空间,比如单byte的片假名所占的地址空间。其中最典型的是由日中共同开发的“NiHao2”。该软件具有不须任何特殊硬件的特点。特别是在其废止了copy protect以后,事实上在DOS中文软件的日本市场中占据了主导地位。最近,NiHao2的开发公司〈HGA02127@niftyserve.or.jp〉应我等的要求,为“华夏文摘NiHao2版”提供了一个可在NEC互换机和IBM/PC运行的free软件NHDSP,名叫“读看中文”(中国语みえる见える)。该软件公开在NIFTY-Serve的FGALAP FORUM之中。
将《华夏文摘》的GB版进行适当转换,便可得到“NiHao2版”。另外一个类似的中文软件是“文华”。经过类似的变换,便可以得到《华夏文摘》的文华版。
对于不具备中文环境的人来说,可就有问题了。因为日本的计算机里没有GB编码字库,而只有JIS(日本工业标准)编码字库,所以在日本,一般来说,计算机是不能阅读《华夏文摘》的。
有人会说,将GB编码变换成JIS编码,问题不就解决了吗?
众所周知,中日两国的汉字的大部分是具有一定的对应关系,而一小部分是没有对应关系的。直接在计算机上读GB文件,就会发现汉字中夹杂着不少缺字符号。这些符号则因厂商而异,有人用□,有人用〓,还有人用凵,真可谓八仙过海、各显神通。
如何显示这一小部分日文中所没有的汉字,许多人动了不少脑筋。
一个比较自然的想法是,将这些字用拼音来表示。比如:将“你”用“Ni”或“ni”来代替、将“吗”用“Ma”或“ma”来代替、将“呢”用“Ne”或“ne”来代替……。这样可以减少、或者避免出现没有意义的缺字符号。
可是,拼音法虽然杜绝了JIS文件中的缺字符号,但是对于已经习惯了汉字的人来说是不太方便的,特别是当几个拼音连续出现的时候更是如此。
日本的京都大学的安冈孝一〈yasuoka@kudpc.kyoto-u.ac.jp〉发明了一种名为“双拼”的汉语拼音的两byte编码方案。他和一谷素子编制了名为gb2jis Version 1.3的软件,并已将其源程序在fj.sources中公开。
利用这个软件,可将GB(以及中文EUC和HZ)编码的中文文件,转换成包括双拼在内的JIS编码文件。
双拼法的声母表为:
|B b |P p |M m |F f
|D d |T t |N n |L l
|G g |K k |H h |J j |Q q |X x
|V zh|I ch|U sh|R r
|Z z |C c |S s |
其韵母表为:
|A a |B an |C ang |D ai
|E e |F en |G eng |H ei
|I i |J in |K ing |L ie
|M iao |N iu |O o |P ou
|Q ong |R ao |S uo |T uan
|U u |V un |W ui |X ia
|Y ian |Z iang|
上述声母和韵母的组合所不能表达的例外编码为∶
|AA a |AG ang |AN an
|EE e |EG eng |EN en
|ER er |GX gua |GY guai
|GZ guang |HX hua |HY huai
|HZ huang |IX chua |IY chuai
|IZ chuang |JQ jiong |JW jue
|KX kua |KY kuai |KZ kuang
|LF lu: |LW lu:e |NO nu:
|NW nu:e |NX n |OO o
|QQ qiong |QW que |RX rua
|RY ruai |RZ ruang |UX shua
|UY shuai |UZ shuang |VX zhua
|VY zhuai |VZ zhuang |XQ xiong
|XW xue |YW yue |
其中“u:”为“鱼”的韵母。
其声调则通过双拼音的大小写的组合来区别。大大写的组合为阴平(一声),小大写的组合为阳平(二声),小小写的组合为上声(三声),大小写的组合为去声(四声)。
如将《华夏文摘》169期目录中的“过把瘾不死 谌然”,经上述软件转换后就会变成∶“过把yj不死 iF然”。
双拼法虽可杜绝JIS文件中的缺字符号,而且可以保持原文的格式,但是具有不直观、难于记忆、不能表示轻声的缺点。
还有一些人利用日文汉字来模拟中文汉字,即用JIS汉字的组合来表示JIS汉字中没有的汉字。举几个例子:
汉字 区位 模拟字
你 3667 [イ尔]
您 3690 [イ尔/心]
疙 2477 [疔乞-丁]
闽 3586 [门<虫]
瘾 8111 [疔隐-丁]
在以繁体字为基准而作成的模拟字对应表中,这样的汉字一共有1875个。
其代表作是北原基彦〈TAE02561@niftyserve.or.jp〉等的KCTRANS-GAIJCONV Version 1.10。该软件可在MS-DOS环境中,将GB(以及BIG-5)编码的中文文件转换成包括模拟字的JIS编码文件。
如将《华夏文摘》169期目录中的“过把瘾不死 谌然”,经上述软件转换后就会变成∶“过把[疔隐-丁]不死 [言甚]然”。
这种办法可以使日本的所有计算机显示全部中文汉字,从根本上解决了中日电子数据交换中的编码问题,将对中日文化的交流产生不可估量的影响。当然,现行程序还具有选用括弧欠妥(我认为用[]比较好)、没有以简体字为基准而作成的模拟字对应表、该源程序一般不公开等缺点,需要进行进一步的改善。
利用CND的GB版和上述模拟软件,就可得到没有缺字符号的《华夏文摘》的JIS版。
为了使更多的人了解现代中国,在日本已经有许多人,特别是在各个大学和企业中的华人,默默无闻地以各种方法将《华夏文摘》GB版转换成JIS版,在各种渠道中传播。
在日本最先开始这种服务的是大阪大学的CND成员徐刚博士。他在郭砚和陈谦的帮助下,从1992年2月7日起就开始用E-mail发行JIS版的《华夏文摘》,现拥有一五○多名读者。
在日本流行最广的名为fj.soc.culture.chinese的Newsgroups中,先后有数人定期将《华夏文摘》等中文电子期刊公布其上;在设于庆应大学的名为CHINFO的MAILING LIST上,遍布日本各个角落的中国留学生、就职者及少数日本朋友,用日语就包括《华夏文摘》在内的许多问题进行过极其广泛的议论。遗憾的是该ML现已停办。
由于《华夏文摘》属于电子期刊,这就为使用电脑研究现代中文提供了一个很好的数据样本。日本的某大计算机厂家,不光存有自创刊号始的全部《华夏文摘》,而且还将其中所有单词分离出来,并制作了拼音版。该厂家利用这些数据研究了现代汉语中各个汉字和单词的出现频率,并将研究其成果运用于所生产的中文打字机之中去,产生了巨大的经济效益。
NIFTY-Serve是日本两大BBS之一,其七十一万会员遍布日本全国各地,在日本国内具有数百个access point,设有三百多个各种各样的FORUM。
自第一六五期开始,笔者将每期《华夏文摘》的日、中、英文目录都登录在NIFTY-Serve的外国语FORUM本馆(FLM)的信息中心会议室(MES2)之中,关于《华夏文摘》的讨论则登录在中文会议室(MES6)和中国文化会议室(MES7)之中,《华夏文摘》的全文则登录在其信息馆(DL4)之中。
除此之外,笔者还在日本发起了一个“《华夏文摘》俱乐部”(日语名为HXWZ研究会、英文名为HXWZJP),并已经小范围地开始了用E-mail发行《华夏文摘》(经LHA压缩的)GB版、NiHao2版、文华版、JIS-DOS版和JIS-UNIX版的实验,并计划逐步扩大《华夏文摘》在日本的发行,使更多的人能读到这份大家喜爱的电子杂志。
一九九四年八月 写于大宫
一九九四年九月 改于东京
□ 李扩建寄自日本