[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[b-free: 1689] Re: 国際化コード・多スクリプト。




隆一です。


From: Yasushi Suzuki <suzu@beebee.co.jp>
Subject: [b-free: 1688] Re: 国際化コード・多スクリプト。
Date: Mon, 29 Jun 1998 13:22:39 +0900

>  ウェルビーンの鈴木と申します。
> 
> Kiyotaka Iijima wrote:
> 
> >  飯島です。
> >   ....
> >
> >  うわぁ、振られてしまった(^^;
> > 自分でWebページを作ったり(あのページ書き直したいところがいっぱいあったりして。)
> > していながらよくわかってないんです。
> > 話題を追っていた時期もあったんですけど、非難合戦になっていたりしたのが
> > 嫌でやめてしまいました。
> 
>  ネットニュースだと時に読むに耐えないスレッドが発生しま
> すね。罵倒の応酬に終始する不毛なスレッド。

最近、fj.kanji を 1992 年から読み直していたりします :-)


> >  そうですね・・・、B-Freeとの絡みで言うとやっぱり実装が問題でしょうね。
> > 文字コードとしてはTRONコードを使えばいい(異論ないですよね?)んでしょうが、
> > それを実装するとなるとそれなりのことをしなくてはいけないでしょう。
> 
>  もしご存知でしたら(飯島さんに限らず)教えていただきた
> いのですがTRONコードでは「日本語」に分類される文字セット
> にどんな文字が入っているのでしょうか?
>  漢字と仮名(平・片)と他には?
> 
>  ちょっと気になるのが
> 
>   私はkotoshiの夏休みに”I love you”を告白した。
> 
> のような文は日本語なのかどうかということで、相手が英語圏
> の人であれば日記にこのような日本語を書きたい人もいるでしょ
> うし、相手がドイツ人であれば"Ich leibe dich"と書きたくな
> ると。ドイツ語だと途端にウムラウトやエスツェットが処理でき
> る必要が出てきます。

これは、ローマ字で書いた文章は日本語か否かということでしょうか?
私は、アルファベットで書いた文章が日本語かどうかというのは、文字コード
だけでは区別できように思います(つまり、文字セットレベルでは日本語とい
う分類はできない)。

言語を区別するには、文字コード以外の情報を追加する必要があるのではない
でしょうか?

たとえば、

>	私はkotoshiの夏休みに”I love you”を告白した。

ならば、

<LANG=ja>私はkotoshiの夏休みに</LANG><LANG=en>”I love you”
</LANG><LANG=ja>を告白した。</LANG>

のように、言語を指定する仕掛けを考える必要があると思います(書き方は適
当です)。

このような仕掛けがないプレインテキストでは、今見ている文字がどの
言語で書かれているかは分かりません。
(文字コードが JIS 漢字だったら、日本語であるという推測はできますけど)

TRON では、言語を指定する方法があるので、この辺の問題はクリアしている
はずです。ただ、具体的にどうするかというのが表には出てきていないように
思います。B-right (BTRON3) で、明らかになってくれるといいんですが。


>  同じ事は英語でも言えて、もし聖書を研究しているアメリカ人
> が参考文献を挙げる時には、
> 
>  I referd the text " ....(この中は右から左に記述)"
>    which menthons common peaple customer.
> 
> というようなことにもなります。ダブルコートの中に改行が
> 入ってしまったらどうなるのか、、とか。
> 
>  TRONコードではこのあたりは解決されているのでしょうか?
> 私自身は解決されていることを希望しますが、その場合はむしろ
> 考え方に興味があります。どう考えたら良いのか、についてです。

以前、TRON での文字コードの考え方については、
http://www.personal-media.co.jp/vs/mltp96/index_j.html
に少し説明があったのですが、今は改訂作業中ということで読めないみたいです。

あと、TRONWARE のバックナンバにも解説記事があったと思います。


p----------------------------------------------------------------------q
| FROM R.Night                                                         |
| E-mail:                                                              |
|         rnaitoh@st.rim.or.jp                                         |
| Key fingerprint = 89 EB 77 95 40 C0 3C CC  37 A1 A7 FA 1C 66 FF D0   |
b----------------------------------------------------------------------d