【高校情報】文字コードとは?ASCII・JIS・Unicodeをわかりやすく解説
イリエダ
こんにちは、イルカの妖精イリエダよ。
今日は高校「情報」でよく出てくる
文字コードとは何か?
を、わかりやすく解説していくわね。
文字コードとは何もの??
まず一言でいうと、
文字を数字に変換するルール
これが文字コードよ。
コンピューターの中では、
- 文字
- 記号
- 漢字
もすべて0と1で表されているの。

つまり、
「あ」も「A」も「☆」も全部「数字」なのよ。
なぜ文字を数字にする必要があるの?
コンピューターは、
数字(2進数)しか理解できない
からよ。

だから、コンピューターに文字を伝えるときは「A」って伝えるんじゃなくて、
01000001
みたいなAに対応した文字コードを伝えるのね。
文字を対応する数字に変換しているの。
これが文字コード。
ASCIIとは?
高校情報でまず出てくる文字コードは、
ASCII(アスキー)
ね。
これは、
- 英字
- 数字
- 記号
を7ビットで表すルールよ。
例えば、「A」だったらこんな感じ。
A = 65(10進数) = 01000001(2進数)
JIS8ビットコードとは?
ASCIIをもとに、
日本語の片仮名などを追加したもの
がJIS8ビットコード。
8ビットだから、
2⁸ = 256種類
の文字を表せるわ。
でもね。
漢字は何万字もあるの。
1バイト(8ビット)では足りないのよ。
日本語の文字コード
そこで、日本語を扱うために、
- JISコード
- シフトJISコード
- EUC-JP
- ユニコード
などが作られたの。
例えば、平仮名の「あ」は
- JISコード → 2422
- シフトJIS → 82A0
- ユニコード(UTF-16)→ 3042
つまり、同じ「あ」でも、文字コードが違えば数字も違うの。
ユニコードとは?
注目すべきはユニコードね。
これは、
世界中の文字を統一的に扱うために作られた文字コード
よ。
ユニコードの種類には、UTF-8やUTF-16などがあるわ。
今のインターネットは、ほぼUTF-8よ。
文字化けはなぜ起こる?
ここ、テストに出るわよ。
もし、ユニコードで保存した文章をJISコードとして読み込んだらどうなる??
そう、数字の解釈がズレて、
文字化けが起こる
のよ。おそらく、このようなよくわからない文字が誕生するわ。
�
縺ゅ>
繝�繧ケ
そんな文字たちを見かけたら、
文字化け = 文字コードの読み間違い
を疑いましょうね。
まとめ
- 文字コードとは「文字を数字にするルール」
- コンピューターは数字しか理解できない
- ASCIIは英数字中心
- 日本語は2バイト以上必要
- 文字化けはコードの不一致
イリエダ
文字コードがわかると、「コンピューターは数字で世界を見ている」って実感できるわね
そんじゃあね!