1.インターネットで使う日本語コード インターネットのメールやニュース、またはホームページで日本語を使用する場合、多少注意が必要です。日本語はコンピューターの内部ではコードによって表現されています。そして、現在日本語を表現するのに、JIS、シフトJIS、EUCという3種類のコード体系が存在しています。JISは情報交換用という位置付けにあり、シフトJISはパソコンで、EUCはUNIXで利用されています。結果としてインターネットではこれらが混在して使われているわけです。 今のブラウザソフトやメールソフトは、書かれている日本語がどのコードで書かれているのかを自動的に識別して表示してくれますので、あまり意識しなくても済むようになっていますが、日本語コードの判別は意外に難しく、時々正しい表示ができずに文字化けしてしまうことがあります。また、自動判別の機能がついていても自動判別機能をOFFにしている場合は、やはり文字化けとなりますので、相手のコードに手動で合わせて読まなければなりません。これからインターネットを始める方には、時々こういうことがあるという認識を持っていていただければと思います。 このように、一応文字コードは自動判別されて大抵問題なく読めるのですが、実はインターネットでは使ってはいけない文字というのもあります。それは、半角カタカナ、半角記号(・「」、。など)丸付き数字、ローマ数字、単位文字)、数学記号、外字(OSやアプリケーションによる外字)です。外字については当然全く同じ外字設定をしてあるパソコンでしか見れないのはお分かりになると思いますが、その他丸付き数字、ローマ数字、単位文字、数学記号についても機種によって設定コードの違うものですので、正常なコードが届いたとしても、相手方で正しく表示できるとは限りません。また、半角については文字コードとインターネットの構造上、送信途中で多くの場合日本語のコードが壊れてしまいます。ですから、文字化けする可能性が大きいのです。間違って半角カタカナを使ってニュースグループなどに投稿してしまうと非難の嵐を呼んでしまいますので、注意してください。
*半角については、本当はインターネットのルールから言えば、半角文字も壊れずに送信できるような新しいシステムに各ドメインが更新していかなければならないことになっているので、非難を浴びる筋合いはないと言えばないのですが、実状は古いシステムのまま運用しているドメインが多いため、様々なネットワークを経由して世界の果てからやってくるデータは、半角コードが多くの場合壊れてしまうのです。 |