[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[b-free: 1695] Re: 国際化コード・多スクリプト。



こんにちは、落合秀俊です。

/* In [b-free: 1688] Re: 国際化コード・多スクリプト。
   Yasushi Suzuki <suzu@beebee.co.jp> Wrote: */

   | もしご存知でしたら(飯島さんに限らず)教えていただきた
   |いのですがTRONコードでは「日本語」に分類される文字セット
   |にどんな文字が入っているのでしょうか?
   | 漢字と仮名(平・片)と他には?

TRONコードにはJIS第1,2水準、補助漢字が含まれているので、
そこにある記号やアルファベットはそのまま入ってます。

   | ちょっと気になるのが
   |
   |  私はkotoshiの夏休みに”I love you”を告白した。
   |
   |のような文は日本語なのかどうかということで、相手が英語圏
   |の人であれば日記にこのような日本語を書きたい人もいるでしょ
   |うし、相手がドイツ人であれば"Ich leibe dich"と書きたくな
   |ると。ドイツ語だと途端にウムラウトやエスツェットが処理でき
   |る必要が出てきます。

TRONコードだと 16bitコードを切り変えて使うのですが、
「言語の指定」と「スクリプト(文字セット)」の指定は
別にできるようになってます。

スクリプトの指定:
FE 21 システムスクリプト(JIS1,2,補助,中国GB,韓国KS)
FE 22 日本語スクリプト1
FE 23 日本語スクリプト2
FE 24 中国スクリプト1
FE 25 中国スクリプト2
FE 26 中国スクリプト3
FE 27 中国スクリプト4
FE 28 韓国スクリプト1
FE 29 韓国スクリプト2
FE 2A 各国スクリプト(ラテン,アラビア文字,発音記号,...)


言語・スクリプトの指定:
                          言語        スクリプト
FE 40 日本文字属0         日本語      システムスクリプト(JIS1,2,補助)
FE 41 日本文字属1         日本語      日本語スクリプト1
FE 42 日本文字属2         日本語      日本語スクリプト2
FE 43 中国文字属0         中国語      システムスクリプト(中国GB)
FE 44 中国文字属1         中国語      中国語スクリプト1
FE 45 中国文字属2         中国語      中国語スクリプト2
FE 46 中国繁体文字属1     中国語      中国語スクリプト3
FE 47 中国繁体文字属2     中国語      中国語スクリプト4
FE 48 韓国ハングル文字属0 韓国語      システムスクリプト(韓国KS)
FE 49 韓国ハングル文字属1 韓国語      韓国語スクリプト1
FE 4A 韓国文字属0         韓国語      システムスクリプト(韓国KS)
FE 4B 韓国文字属1         韓国語      韓国語スクリプト1
FE 4C 韓国文字属2         韓国語      韓国語スクリプト2
FE 60 英語文字属          英語        各国スクリプト(ラテン)
FE 61 フランス語文字属    フランス語  各国スクリプト(ラテン)
FE 62 ドイツ語文字属      ドイツ語    各国スクリプト(ラテン)
FE mm 中国ピンイン文字属  中国語      各国スクリプト(ラテン)
FE nn 日本ローマ字属      日本語      各国スクリプト(ラテン)
FE xx アラビア文字属      アラビア語  各国スクリプト(アラビア文字)
FE yy 発音記号属          発音記号    各国スクリプト(発音記号)

通常は FE 40 以降の言語・文字属の指定を使うことになります。

鈴木さんの例だと、

[FE 40]私は[FE nn]kotoshi[FE 40]の夏休みに
”[FE 60]I love you[FE 40]”を告白した。

のようになりますね。


ただ、今までに作られた TAD のデータは言語指定が
すべて FE 21 になっているので、言語不詳の文章になってしまいます。

   |というようなことにもなります。ダブルコートの中に改行が
   |入ってしまったらどうなるのか、、とか。

改行やタブのような制御コードはすべてのスクリプトに共通して
入っているので、言語指定の問題はないです。


文章をテキスト表現としてはこれでできますが、
禁則処理やレイアウトまでは OS が世話を焼いてくれないので、
アプリケーション側でどうにか頑張る必要があるみたいです。

%

TRON の多国語環境については TRONWARE 50 に詳しいです。
私がここに書いたのは TRONWARE の受け売りです。
ぜひ読んでみてください。

===
  落合秀俊   名古屋大学工学部情報工学科
  h953046b@ice.nuie.nagoya-u.ac.jp