Компьютер считают универсальным преобразователем информации. Тексты на естественных языках и числа, математические и специальные символы – одним словом все, что в быту или в профессиональной деятельности может быть необходимо человеку, должно иметь возможность быть введенным в компьютер.
В силу безусловного приоритета двоичной системы счисления при внутреннем представлении информации в компьютере кодирование “внешних” символов основывается на сопоставлении каждому из них определенной группы двоичных знаков. При этом из технических соображений и из соображений удобства кодирования-декодирования следует пользоваться равномерными кодами, т.е. двоичными группами равной длины. Это значит, что любой знак, число, символ из условий конкретной задачи кодируется одинаковым числом бит.
Рассмотрим пример равномерного алфавитного кодирования с использованием латинского алфавита (N = 27 = 26 + «пробел»). Согласно формуле Хартли (3), для этого необходимо
I = log2N = log227 =4.755 бит.
Однако 1 бит является минимальной единицей информации. Поэтому, этот результат округляется до ближайшего целого не меньшего, чем само число. Ясно, что это будет 5 бит.
Можно решить эту задачу на основе других рассуждений. Итак:
N = 2I - это количество комбинаций (вариантов), (6)
которые можно закодировать (записать) в I битах.
В таблице 2 приведены варианты кодов в зависимости от количества бит ( двоичных разрядов).
Таблица 2
Количество бит
Значения кодов
№ варианта
Количество бит
Значения кодов
№ варианта
и т.д.
Тогда, исходя из формулы (6), можно сделать вывод: 4 бита дают 16 вариантов, а чтобы закодировать 27 вариантов требуется минимум 5 бит.
В таблице 3 приведены некоторые полезные значения.
Таблица 3
Количество бит:
Количество вариантов:
Количество бит:
Количество вариантов:
25 = 32
211 = 2048
26 = 64
212 = 4096
27 = 128
213 = 8192
28 = 256
214 = 16384
29 = 512
215 = 32768
210 = 1024
216 = 65536
Задача. Автоматическое устройство кодирует значение температуры как целое число в интервале значений 0 50. Определить минимально возможное количество бит для хранения каждого значения температуры.
Из условий задачи следует, что необходимо кодировать 51 вариантов. Таблица 3 показывает, что минимальное количество бит, необходимое для записи любого из этих 51 значений, - это 6. Ответ: для хранения одного значения температуры требуется 6 бит.
В современных персональных компьютерах для хранения и обработки информации применяется большей частью равномерное двоичное кодирование.