[0040] 文字コード

平成12年度春期 初級システムアドミニストレータ試験より
 現在、コンピュータでは様々な文字コードが使われているが、コード体系のうち、漢字に関する規定がないものはどれか。
ASCII
EUC
Unicode
シフトJISコード

正解

解説

 文字コードに関する問題です。

 英語圏だけであれば、そう悩む必要のない文字コードですが、いまや世界の多くの言語をコンピュータで扱う時代となりました。日本語も、英語圏で発達してきたコンピュータ上でどうやって表現するか、試行錯誤してここまでやってきたところです。日本語にまつわる文字コードもさまざまな問題があり、いまなお研究が続けられています。

 日本語を扱う文字コードをすべて説明する、というのは、あまりに種類が多すぎるため、この問題の選択肢で出された文字コードについてのみ解説をしましょう。いずれも、一般的によく知られた文字コードで、受験者にとっては必須のものといえます。

■ ASCII

 American Standard Code for Information Interchangeの略。1963年ANSI(米国規格協会)により制定され、コンピュータ用の英数字のコード体系としてもっとも普及しています。ASCIIコードでは、7bitで128文字が割り当てられています。英語圏であれば、アルファベットの大文字小文字、数字、その他記号を合わせても、128文字あれば十分に文章を表現できますが、当然ながら日本語では、漢字、ひらがな、カタカナと文字種が多く、ASCIIコードの7bitでは、ほとんど表現できません。


■ EUC

 Extended Unix Code(拡張UNIXコード)の略。UNIXで使用されていた文字コードを、AT&Tベル研究所で世界各国で使用可能なように拡張されたコード体系です。EUCはUNIXでは一般的に利用されている文字コードで、WWWサーバで公開されているHTML文章も、EUC文字コードで作成されているものが数多くあります。


■ Unicode

 Apple社、IBM社、Microsoft社などが提唱する、各国語対応のために制定された2バイトの文字コード体系です。これまでの文字コードは、欧文の1バイトの文字コードに2バイト文字コードを加えることで各国語に対応してきましたが、1バイト文字と2バイト文字が混在するデータでは、正しい文章を表示するために特殊な処理などが必要となってしまいます。そこで、Unicodeでは、こうした特殊な処理が不要となるよう、はじめから各国の文字コードセットを2バイト文字として含めるようにしています。
ただし、2バイトでは、最大65,536文字しか表現できないため、部分的に3バイト以上を使用する体系に変化しています。


■ シフトJISコード

 Microsoft社によって策定された日本語文字コード体系です。文字の1バイト目を見るだけで漢字か1バイト文字(いわゆる半角英数字)か分かるので日本語処理が容易であり、同社のMS-DOSやWindowsなど、日本語を扱うパソコンの標準文字コードとして広く普及しています。(ただしWindowsNT4.0以降は、内部コードはUnicodeで動作しています。)


 よって、ASCIIのアが正解となります。
※ 解説の内容は執筆時点のものであり,含まれている情報の正確性,妥当性について保証するものではありません。ご注意ください・・・

関連する(かもしれない)問題