[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[b-free: 1690] Re: 国際化コード・多スクリプト。



 ウェルビーンの鈴木でございます。

Ryuichi Naitoh wrote:

> 隆一です。
>   ....
>
> >  ちょっと気になるのが
> >
> >   私はkotoshiの夏休みに”I love you”を告白した。
> >
> > のような文は日本語なのかどうかということで、相手が英語圏
> > の人であれば日記にこのような日本語を書きたい人もいるでしょ
> > うし、相手がドイツ人であれば"Ich leibe dich"と書きたくな
> > ると。ドイツ語だと途端にウムラウトやエスツェットが処理でき
> > る必要が出てきます。
>
> これは、ローマ字で書いた文章は日本語か否かということでしょうか?
> 私は、アルファベットで書いた文章が日本語かどうかというのは、文字コード
> だけでは区別できように思います(つまり、文字セットレベルでは日本語とい
> う分類はできない)。
> 言語を区別するには、文字コード以外の情報を追加する必要があるのではない
> でしょうか?
>
> たとえば、
> >  私はkotoshiの夏休みに”I love you”を告白した。
> ならば、
>
> <LANG=ja>私はkotoshiの夏休みに</LANG><LANG=en>”I love you”
> </LANG><LANG=ja>を告白した。</LANG>
>
> のように、言語を指定する仕掛けを考える必要があると思います(書き方は適
> 当です)。

 引用が入れ子になっている構造がすぐに思い付きますか
ら結構厄介なものになりそうですね。上記の例文がアメリ
カ人の論文の参考文献として言及される状況だと、

 I refferd the text titlede "私はkotoshiの夏休み
 に"I love you"を告白した" which was menthoned earlier.

なんてことになり、全体は英語で部分的に日本語、日本語
の中は部分的に英語。

 これらのテキストとしての表現が可能なこともさること
ながら、入力や表示・印刷を考えると各種の禁則処理がと
ても複雑になりそうです。


> このような仕掛けがないプレインテキストでは、今見ている文字がどの
> 言語で書かれているかは分かりません。
> (文字コードが JIS 漢字だったら、日本語であるという推測はできますけど)
>
> TRON では、言語を指定する方法があるので、この辺の問題はクリアしている
> はずです。ただ、具体的にどうするかというのが表には出てきていないように
> 思います。B-right (BTRON3) で、明らかになってくれるといいんですが。

 文字コードの国際化だけでなく、処理系の開発も不可欠で
すね。BTRONでは、この辺りの機能をオペレーティングシス
テムの中に含めるべきだと考えられているのでしょうか?

----------------------------------
(株)ウェルビーン   鈴木保是
----------------------------------
  E_Mail : suzu@beebee.co.jp
  Tel    : 048-654-3499
  Fax    : 048-654-3520
----------------------------------