このページは福井県立大学の田中求之が2006年1月まで運用していた Mac のサーバ運用に関する会議室 「Web Scripter's Meeting」の記録です。情報が古くなっている可能性がありますのでご注意ください。

日本語の文字化け

発言者:岩下
( Date Tuesday, June 10, 1997 17:30:08 )


岩下と申します.
いつもお世話になります.

この会議室の趣旨とはちょっと違う質問で申し訳有りません.

日本語の文字化けへの質問ですが,
日経BP社のWebページをNetscape2.02jaで見ていて,そのHTML文を
menueの表示→文書のソースで,見たとき,日本語が完璧に化けております.

下記がその1部抜粋です.さらにその下がブラウザでみた文(コピーペーストで貼つけ)です.
--------------ここから------------------------------------------------
<CENTER>
$B!C(B
<A HREF="/biztech/WCS/internet/swcs_top.html">$BA0%Z!<%8(B</A>
$B!C(B
<A HREF="/biztech/WCS/internet/bi970603100.html">$B<!%Z!<%8(B</A>
$B!C(B<A HREF="/biztech/WCS/internet/index.html">$B5-;v0lMw(B</A>
$B!C(B
</CENTER>
<HR SIZE=0 NOSHADE>

<!--Item------------------------------->
<B><FONT SIZE=5>
$BJF(BPGP$B$N(B128$B%S%C%H0E9f%-!<$r;}$D%;%-%e%j%F%#!&%=%U%
H!$JF>&L3>J$,$h$&$d$/M"=P$r5v2D(B
</FONT></B>
(
97/06/04
$B!"(B<A HREF=http://byte.nikkeibp.co.jp/ TARGET="_top">$BF|7P%P%$%H
(B</A>)

| 前ページ| 次ページ|記事一覧| 

     米PGPの128ビット暗号キ
     ーを持つセキュリティ・
     ソフト,米商務省がよう
     やく輸出を許可 ( 97/06/04、
     日経バイト ) 
---------------------ここまで------------------

どうしてこのような事が起きるのでしょうか?
このからくりについて,教えていただきたくよろしくお願い申し上げます.
直,社内LANの内側からアクセスしておりますので,proxyを経由した
アクセスとなっております.
御多忙中恐れ入りますが,宜しくお願い申し上げます.

(会議室に文が掲載されないので,2度目の投稿です)


→  日経BP

重松修 さんからのコメント
( Tuesday, June 10, 1997 17:53:53 )

単にHTMLがSJISでかかれていないだけではないでしょうか?

通常は、JIS(ISO-2022JP)で書きます。また、EUCで書いているサイトも
あります。私はSJISで書いています。(CGIで処理するとき都合がよいから)

Netscapeなどが漢字のコードを度識別する機能を有しているために、普段は
漢字コードについて気にする必要はありません。

大昔には、漢字コードを変換するProxyを経由して利用していましたが今では
昔話です。

その化けたコードを正しく見るためには、Jeditなど漢字コードを改行コードを
変換できるエディタで見てみてください。

田中求之 さんからのコメント
( Tuesday, June 10, 1997 18:08:31 )

重松さんがコメントされているように、日本語が JIS コードで書かれて
いますね。そのため、SJIS のエディタで表示すると、文字化けが起こった
ように見えるわけです。

漢字コードには、Mac で用いられる SJIS のほかに、JIS, EUC があって
これらの間には互換性がありません。

別にブラウザやシステムがおかしくなったわけではありませんので、
ご安心を。

岩下義信 さんからのコメント
( Tuesday, June 10, 1997 19:40:56 )

重松修さん、田中求之さんありがとうございました。

漢字コードは、JISに統一されているわけでは、ないということですか。

マイクロソフトがSJISコードを垂れ流すメールソフトを作って叩かれてますが、
それはメールの世界の話で、

WWWの世界では、どれでもよく、ブラウザが自動でコードを解釈して、
正しく表示してくれているということですね。