Кодирование информации в ЭВМ - одна из задач теории кодирования.
Теория кодирования - один из разделов теоретической информатики. Одна из задач - разработка принципов наиболее экономичного кодирования. Эта задача касается передачи, обработки, хранения информации. Частное ее решение – представление информации в компьютере.
Алфавит, в котором источник информации представляет сообщение, называется первичным.
Алфавит, в котором представлено сообщение после обработки в кодирующем устройстве, называется вторичным.
Код – это соответствие знаков первичного алфавита знакам вторичного алфавита.
Кодирование – перевод сообщения из первичного алфавита во вторичный.
Декодирование – операция обратная кодированию.
Операции кодирования и декодирования называются обратимыми, если их последовательное применение обеспечит возврат к исходной информации без каких-либо ее потерь.
Пример обратимого: слова ↔ телеграфный код.
необратимого: английский ↔ русский – здесь неоднозначно.
Математическая постановка условия обратимого кодирования.
Пусть
первичный алфавит А сост. из N знаков со средней информацией на знак IА
вторичный В – из М знаков со средней информацией на знак I В.
Пусть сообщение в первичном алфавите содержит n знаков, а закодированное – m знаков. Если исходное сообщение содержит IS (A) информации, а закодированное If (B), то условие обратимости кодирования (то есть неисчезновения информации при кодировании) очевидно может быть записано так:
IS (A) ≤ If (B) - то есть операция обратимого кодирования может увеличить количество информации в сообщении, но не может уменьшить ее.
n* I (A) ≤m*I (B) (заменили произведением числа знаков на среднее
информационное содержание знака).
Среднее число знаков вторичного алфавита, который используется для кодирования одного знака первичного назовем длиной кода.
К (А, В)=m/n
К (А, В)≥ I (A) / I (B)
Минимально возможная длина кода: Кmin(А, В)= I (A) / I (B) –это нижний предел длины кода.
При отсутствии помех всегда возможен такой вариант кодирования сообщения, при котором средняя длина кода будет сколь угодно близкой к отношению средних информаций на знак первичного и вторичного алфавитов.
Для двоичного кода М=2.
Кmin(А, В)= I (A) / log2 M= I (A) , здесь I (A) - средняя информация на знак первичного алфавита.