人気ブログランキング | 話題のタグを見る
ブログトップ

日中News

sxcn.exblog.jp

通用規範漢字与日文的汉字编码变换新系统

有感于《通用規範漢字表》的公开征求意见

  前几天,大使会见新桥会新班子时,听到教育处孙建明公使衔参赞讲到《通用規範漢字表》之事,我回家马上去查询了有关资料,阅读了有关文件。

  关于日本汉字和中国汉字的关系,在座的大家都是专家,我就不多讲了。我今天想就两种汉字的字形以及编码问题,谈一点自己的看法。

  首先,我们不可否认,日本不但利用了中国的汉字,也对汉字及其文化的发展起了一定的作用。所以我认为,

  第一,中日之间,应该就常用汉字进行一些相互补充的工作。我发现,这次添加的汉字中有一个是大阪的阪字,这个字加得很好。大家知道,日文里没有你好的你。我们应该影响日本有关方面,将中国的高频度汉字加到日文的字库中。

  第二,中日之间,应该就常用汉字进行一些统一字形的工作。比如说,对错的对,日文比我们多一个点,如果将这个点去掉,这个字就可以统一了。还有,笔画的长短,方框的大小等,中日文之间也有微妙的区别,有时候,看着很别扭。如能统一,将会对学习语言的人有很大的帮助。

  第三,中日之间,应该就常用汉字进行统一编码的探索。我作为一个长期在日本企业中工作的IT技术人员,想就这个问题发表一些自己的看法。

  在现今的计算机世界里,在现代的互联网时代里,汉字的编码问题,显得尤其重要。

  我于一九九四年在华夏文摘的【电脑世界】中,就这个问题进行了一些分析,在15年以前的计算机水平下,就如何解决这个问题,提出过一些自己的看法。

  当时,计算机的发展水平还比较差,在日文的计算机里不能显示和输入中文。于是就出现了一个中文GB编码和日文JIS编码之间的编码变换的问题。

  当时,为了使更多的日本人了解现代中国,在日本已经有许多人,特别是在各个大学和企业中的华人,默默无闻地以各种方法将《神州学人》等电子杂志的GB版转换成JIS版,在各种渠道中传播。

  当时,留学生能看到《神州学人》电子版,可是使馆教育处的老师们看不到。高鸿斌老师找到我,让我专门来到这里,为大家讲过课,教给大家如何用使馆教育处的日文电脑来阅读中文文件。

  众所周知,中日两国的汉字的大部分是具有一定的对应关系,而一小部分是没有对应关系的。具有对应关系的汉字,那就比较简单,做一个转换表格就可以了。可是,没有对应关系的汉字,那就很麻烦了。如何显示这一小部分日文中所没有的汉字,许多人动了不少脑筋。

1)干脆不表示的方法

  有对应关系的字多,没有对应关系的字少,这部分字即便就是没有,大概的意思也能懂。直接在计算机上读GB文件,就会发现汉字中夹杂着不少缺字符号。这些符号则因厂商而异,有人用□,有人用〓,还有人用凵,真可谓八仙过海、各显神通。

2)用拼音的方法

  一个比较自然的想法是,将这些字用拼音来表示。比如:将“你”用“Ni”或“ni”来代替、将“吗”用“Ma”或“ma”来代替、将“呢”用“Ne”或“ne”来代替……。这样可以减少、或者避免出现没有意义的缺字符号。

  可是,拼音法虽然杜绝了JIS文件中的缺字符号,但是对于已经习惯了汉字的人来说是不太方便的,特别是当几个拼音连续出现的时候更是如此。

3)用双拼的方法

  汉字是方框字,特别是律诗,需要对整齐。而拼音有长有短,无法对整齐。为了解决这个问题,日本的京都大学的安冈孝一发明了一种名为“双拼”的汉语拼音的两byte编码方案。他和一谷素子编制了名为gb2jis Version 1.3的软件,并已将其源程序在fj.sources中公开。

  利用这个软件,可将GB(以及中文EUC和HZ)编码的中文文件,转换成包括双拼在内的JIS编码文件。

  其声调则通过双拼音的大小写的组合来区别。大大写的组合为阴平(一声),小大写的组合为阳平(二声),小小写的组合为上声(三声),大小写的组合为去声(四声)。

  如将《华夏文摘》169期目录中的“过把瘾不死 谌然”,经上述软件转换后就会变成∶“过把yj不死 iF然”。

  双拼法虽可杜绝JIS文件中的缺字符号,而且可以保持原文的格式,但是具有不直观、难于记忆、不能表示轻声的缺点。

4)有组合字的方法

  还有一些人利用日文汉字来模拟中文汉字,即用JIS汉字的组合来表示JIS汉字中没有的汉字。在以繁体字为基准而作成的模拟字对应表中,这样的汉字一共有1875个。举几个例子:
         汉字     区位   模拟字
          你     3667   [イ尔]
          您     3690   [イ尔/心]
          疙     2477   [疔乞-丁]
          闽     3586   [门<虫]
          瘾     8111   [疔隐-丁]

  其代表作是北原基彦的KCTRANS-GAIJCONV。该软件可在MS-DOS环境中,将GB(以及BIG-5)编码的中文文件转换成包括模拟字的JIS编码文件。

  如将《华夏文摘》169期目录中的“过把瘾不死 谌然”,经上述软件转换后就会变成∶“过把[疔隐-丁]不死 [言甚]然”。

  这种办法可以使日本的所有计算机显示全部中文汉字,从根本上解决了中日电子数据交换中的编码问题,对中日文化的交流产生了一定的促进作用。

5)汉字编码变换的必要性

  《通用規範漢字表》公开征求意见的倒计时还有5天多时间。

  虽然随着计算机容量的增加和技术的进步,现在的计算机已经能够用UNICODE同时显示各国文字,但是,作为一种基础研究,在这批汉字正式开始使用以后,我觉得应该有一个新的汉字编码变换的系统。
by li_japan | 2009-08-26 16:30 | cn(中国) | Comments(2)
Commented at 2009-08-26 11:08
ブログの持ち主だけに見える非公開コメントです。
Commented by at 2009-08-27 09:41 x
全都变成unicode不就结了?
<< 中国大使館でパスポート生年月日の訂正 海归精英文化俱乐部太原分会 >>