[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[b-free: 1691] Re: 国際化コード・多スクリプト。




隆一です。


From: Yasushi Suzuki <suzu@beebee.co.jp>
Subject: [b-free: 1690] Re: 国際化コード・多スクリプト。
Date: Tue, 30 Jun 1998 12:02:01 +0900

>  ウェルビーンの鈴木でございます。
> 

...[snip]...

> 
>  引用が入れ子になっている構造がすぐに思い付きますか
> ら結構厄介なものになりそうですね。上記の例文がアメリ
> カ人の論文の参考文献として言及される状況だと、
> 
>  I refferd the text titlede "私はkotoshiの夏休み
>  に"I love you"を告白した" which was menthoned earlier.
> 
> なんてことになり、全体は英語で部分的に日本語、日本語
> の中は部分的に英語。

この場合だとすべて英語の文章ということになるのではないでしょうか?
(文字コードにアルファベット以外のものも含まれているので、ちょっと変で
すが)

私の出した例はかなり極端で、実際には文書の中身全部を一つの言語としてま
とめてしまうことが多くなると思います。

というのも、

>  これらのテキストとしての表現が可能なこともさること
> ながら、入力や表示・印刷を考えると各種の禁則処理がと
> ても複雑になりそうです。

という問題があり、言語としての処理(禁則処理など)は、文書単位でひとつに
まとめた方がいいように思うからです(そうか?)。




> > このような仕掛けがないプレインテキストでは、今見ている文字がどの
> > 言語で書かれているかは分かりません。
> > (文字コードが JIS 漢字だったら、日本語であるという推測はできますけど)
> >
> > TRON では、言語を指定する方法があるので、この辺の問題はクリアしている
> > はずです。ただ、具体的にどうするかというのが表には出てきていないように
> > 思います。B-right (BTRON3) で、明らかになってくれるといいんですが。
> 
>  文字コードの国際化だけでなく、処理系の開発も不可欠で
> すね。BTRONでは、この辺りの機能をオペレーティングシス
> テムの中に含めるべきだと考えられているのでしょうか?

坂村研で、多言語処理用のアプリケーションを作っていたという話は知ってい
ますが、今どうなっているかはわかりません。一応 1B 上で動いているところ
までは見ましたけど……。


p----------------------------------------------------------------------q
| FROM R.Night                                                         |
| E-mail:                                                              |
|         rnaitoh@st.rim.or.jp                                         |
| Key fingerprint = 89 EB 77 95 40 C0 3C CC  37 A1 A7 FA 1C 66 FF D0   |
b----------------------------------------------------------------------d