コンピュータと文字のはじまり ビットからASCIIへ

0
287

ここで言うコンピュータとは電子コンピュータ、パソコンやスマートフォン、タブレットなどのほとんどすべての電子機器のことです。そのコンピュータ自体は文字という概念がありません。
文字を知らないので、コンピュータのOSが、文字という概念もコンピュータに教えて、人が使いやすいようにしています。

文字の概念を教えるというのは、文字の種類や形状を含めてすべてを教えるという事です。現在のコンピュータは電気がオンかオフでしか情報を扱えないので、この中で文字の概念を教えるのは大変です。

電気がオンとオフは2パターンしかありませんが、これを2つ使えば、2倍の4パターン使えます。これでは英語のアルファベット26文字も使えませんが、電気のオンとオフを4つ並べれば16パターンあるので、0から9までの数字は利用出来ます。

これでコンピュータで数字の計算が出来るようになります。

文字を利用するためには5つ並べて、32パターンあればアルファベット26文字は利用出来ますが、数字が利用出来なくなります。6つ並べれば64パターン使えるので、アルファベットの大文字と小文字、数字の62パターンは表せます。これでも良さそうですが、他の記号などを含めると7つ並べた128パターンを使うという方法に行き着いたようです。

これでコンピュータで数字とアルファベットと記号類が利用出来るようになりますが、コンピュータ毎にこの決まりを作っていた場合、どれがどの文字に一致するのかがバラバラで使いにくいです。

これを統一したのがASCIIです。
1963年にオンとオフのどのパターンがどの文字に一致させるかというのを統一させ、ASCII(American Standard Code for Information Interchange)という文字コードで標準化にしました。この時に決まったのは数字、アルファベットの大文字、一部の記号です。
その後、1965年にアルファベットの小文字が対応するなど、記号なども含めてASCII自体が固まるまで数年かかっています。その後、英語以外の文字でも利用出来るように出来るようになっていきましたが、コンピュータで文字のやりとりが自由に利用出来るようになっていったのは、このASCIIが起源としてもおかしくはないです。
実際にどのコンピュータでも世界各国の文字が問題なく表示できるようになっていったのは、2000年代に入った頃からです。各コンピュータでの各言語の文字表示、文字コードのUTF-8での統一などの結果です。そのUTF-8はASCIIと互換性がありながら、世界中の文字に対応できるようになっています。

実際にはこのASCIIから派生した文字コードがすべてで使われるとは限られません。IBMはASCII制定と同時期にEBCDICという文字コードを作り、自社製品で使用していました。
2020年代になってもこのEBCDICは大型コンピュータのメインフレームで使われており、メインフレームと、一般的なコンピュータでのデータやりとりでは、この文字コードを意識する必要があります。