# あまり文字コード問題にハマると、抜けられなく
# なりそうな気がする今日このゴロです :-)。
Hayashi writes:
> 林です。
>
> In message <9702060730.AA24495@hisoft.soft.hitachi.co.jp>
> "[b-free 196] Re: 準 TAD"
> "naitoh_r@soft.hitachi.co.jp (Naitoh Ryuichi)" wrote:
> > > ASCIIを0x00XX形式で埋め込んだものを英語コードとして扱えても
> > > とりあえず多国語としては良いと思うのですが。
> >これは、やっぱり TRON 仕様にないので良くないのでは?
> >B-Free の独自仕様として出しますか :-)
>
> TRON仕様をそういう風に改定しても良いと思うのですよ。コントロール
> コードについてはやっていることですし、どうせTRONコードをそのまま
> ネットワークに出すわけにはいかないですから。
ネットワークに流すコードは、やっぱりブナンなところで ISO 2022
ですかね?
(Web に限っていえば、コードはまちまちみたいですね)
「とりあえず」ということならば、ASCII を擬似 2 バイトにしても
いいとは思います。サイズの点で利点はないですが、文字コードを
区別するという点では今よりずっとマシです。
> >しかし、準 TAD で 1 バイト系が扱えないということは、Web ページで使われ
> >ている文字のうち扱えないものがあるということでもあるんですよね。。。
> >3B では、Web ブラウザがインプリメントされていて、多国語対応ということ
> >を聞いたことがあります(たしか 2 バイト系の JIS コードと 1 バイト系の文
> >字を混在しても大丈夫という話だったはず)。一体どういう仕組みなのか不思
> >議です。
>
> あれはWebブラウザでコード変換しているのです。ASCIIは1Bの通信と同じく
> 半角付箋付きのTRONコードで、ヨーロッパ系の言語でも文字に限って言えば
> 補助漢字には大抵入りますから、その文字に変換すれば表示にはとりあえず
> 困らないでしょう。
なるほど。。。。
生のコードそのままではなく、JIS コードの同じ(ような)文字に変換している
わけですね。
> そういうわけで「とりあえず多国語環境」の範囲ではTRONコードもUnicode
> とそんなに違わないのです。ある人は「ヨーロッパ系言語を虐待したUnicode
> にみえる」といってましたし。ただTRONにはTADという強力な枠組みがある
> ので、コードだけでは'A'と'A'が区別できなくても、付箋を併用することで
> とりあえず使える形にしてしまえるのですけど。
> # でも半角付箋で文字を区別するのはかなり醜悪。
はい、醜悪です。
結局、1 バイトコードを捨てた時点で準 TAD では「とりあえず」多国語レベ
ルのことしかできないんです。
準 TAD を使う限り本当の多国語はできないと思います。
(でも、本当の TAD ならば、、とは思いますけどね)
-- p----------------------------------------------------------------------q | FROM R.Night | | E-mail: night@b-free.orient.co.jp | b----------------------------------------------------------------------d