×

tomoロゴ tomo

【高校情報】文字コードとは?ASCII・JIS・Unicodeをわかりやすく解説

イリエダ
イリエダ
こんにちは、イルカの妖精イリエダよ。

 

今日は高校「情報」でよく出てくる

文字コードとは何か?

を、わかりやすく解説していくわね。

 

文字コードとは何もの??

まず一言でいうと、

文字を数字に変換するルール

これが文字コードよ。

 

コンピューターの中では、

  • 文字
  • 記号
  • 漢字

もすべて0と1で表されているの。

 

 

つまり、

「あ」も「A」も「☆」も全部「数字」なのよ。

 

なぜ文字を数字にする必要があるの?

コンピューターは、

数字(2進数)しか理解できない

からよ。

だから、コンピューターに文字を伝えるときは「A」って伝えるんじゃなくて、

01000001

みたいなAに対応した文字コードを伝えるのね。

文字を対応する数字に変換しているの。

これが文字コード。

 

ASCIIとは?

高校情報でまず出てくる文字コードは、

ASCII(アスキー)

ね。

これは、

  • 英字
  • 数字
  • 記号

を7ビットで表すルールよ。

例えば、「A」だったらこんな感じ。

 

A = 65(10進数)
   = 01000001(2進数)

 

JIS8ビットコードとは?

ASCIIをもとに、

日本語の片仮名などを追加したもの

がJIS8ビットコード。

8ビットだから、

2⁸ = 256種類

の文字を表せるわ。

 

でもね。

漢字は何万字もあるの。

1バイト(8ビット)では足りないのよ。

 

日本語の文字コード

そこで、日本語を扱うために、

  • JISコード
  • シフトJISコード
  • EUC-JP
  • ユニコード

などが作られたの。

 

例えば、平仮名の「あ」は

  • JISコード → 2422
  • シフトJIS → 82A0
  • ユニコード(UTF-16)→ 3042

 

つまり、同じ「あ」でも、文字コードが違えば数字も違うの。

 

ユニコードとは?

注目すべきはユニコードね。

これは、

世界中の文字を統一的に扱うために作られた文字コード

よ。

ユニコードの種類には、UTF-8やUTF-16などがあるわ。

今のインターネットは、ほぼUTF-8よ。

 

文字化けはなぜ起こる?

ここ、テストに出るわよ。

もし、ユニコードで保存した文章をJISコードとして読み込んだらどうなる??

そう、数字の解釈がズレて、

文字化けが起こる

のよ。おそらく、このようなよくわからない文字が誕生するわ。

�
縺ゅ>
繝�繧ケ

そんな文字たちを見かけたら、

文字化け = 文字コードの読み間違い

を疑いましょうね。

 

まとめ

  • 文字コードとは「文字を数字にするルール」
  • コンピューターは数字しか理解できない
  • ASCIIは英数字中心
  • 日本語は2バイト以上必要
  • 文字化けはコードの不一致

 

イリエダ
イリエダ
文字コードがわかると、「コンピューターは数字で世界を見ている」って実感できるわね

 

そんじゃあね!

妖精

ここまで読んでくれてありがとう!おつかれさまでした。

「高校情報Iのまとめページ」で他の記事も復習してみてね。

▶ まとめを見に行く