文字の表現と情報量 文字の表現 (Text p.63, 5.5 節 〜 p.65, 5.6 節 ) 「文字集合」を決める ( 要素と[有限な]要素数[M]が決る ) 「文字集合」に整数値を割り当てる ( 0 〜 M-1 ) bit 表現に対応 ( 2^(N-1) < M <= 2^N となる N を選ぶ ) 文字表現の例 ASCII : キーボード上の文字 ( 1 byte = 8 bit で表現 ) JIS Code (JIS:日本工業規格) : 日本語文字(漢字、ひらがな等)を定める ( 2 byte ) Shift JIS Code (Microsoft) : JIS Code と半角カナの両方を含む ( 2 byte ) Windows で利用 EUC (AT&T) : Unix で利用される UTF-8 (ISO) : 世界中で利用されている文字を含む ( 3 byte ) 「1 文字」の情報量 「文字表現」によって異る ( ASCII => 1 byte / UTF-8 => 3 byte ) 情報量 <=> それを表現するために必要な bit 数 「文字化け」の問題 コードが共通でないとおきる問題 ( 対応する文字がない / 解釈が異る )