Блочные двоичные коды

При передаче информации в каналах связи возможно появление помех. Передаваемые сигналы могут искажаться. Чтобы обеспечить надежную передачу информации, применяют различные методы кодирования информации. Вместе с основной информацией пересылают некоторую дополнительную, позволяющую судить об искаженности принятых сообщений. Коды делятся на два больших класса: коды с обнаружением ошибок и коды с исправлением ошибок.

Пример.Код, обнаруживающий одиночные ошибки. Пусть сообщения, предназначенные для передачи, представляются двоичными векторами размерности 4. Произвольное сообщение α имеет вид α=(α₁,α₂,α₃,α₄)∈{0,1}⁴. Перед тем как сообщение α будет передано, его кодируют, добавляя бит проверки на четность:

E(α)=(α₁,α₂,α₃,α₄,α₁⊕α₂⊕α₃⊕α₄)∈{0,1}⁵.

По каналу связи пересылается сообщение E(α). В пересылаемом сообщение число единичных битов четно:

α₁⊕α₂⊕α₃⊕α₄⊕(α₁⊕α₂⊕α₃⊕α₄)=0.

Предположим, что при пересылке ошибка может произойти не более, чем в одном бите. Пусть β=(β₁,β₂,β₃,β₄,β₅) – принятое сообщение. Тогда, если ошибка произошла, то β₁⊕β₂⊕β₃⊕β₄⊕β₅=1, если нет – β₁⊕β₂⊕β₃⊕β₄⊕β₅=0.􀀀

Пример.Код Хемминга, исправляющий одиночные ошибки. Сообщение α=(α₁,α₂,α₃,α₄) при кодировании дополняется тремя битами:

E(α)=(α₁,α₂,α₃,α₄,α₅,α₆,α₇),

где

α₅=α₂⊕α₃⊕α₄;

α₆=α₁⊕α₃⊕α₄;

α₇=α₁⊕α₂⊕α₄.

Сообщение E(α)∈{0,1}⁷передается по каналам связи. Пусть β=(β₁,β₂,β₃,β₄,β₅,β₆,β₇) – принятое сообщение. Вычислим следующие суммы:

σ₁=β₄⊕β₅⊕β₆⊕β₇;

σ₂=β₂⊕β₃⊕β₆⊕β₇;

σ₃=β₁⊕β₃⊕β₅⊕β₇.

Если сообщение передано без ошибки, то все три суммы нулевые. В самом деле, при безошибочной передаче β_i=α_iдля i=1,2,…,7. Легко видеть, что после замены α₅, α₆, α₇их выражениями через α₁, α₂, α₃и α₄, каждая из сумм σ₁, σ₂, σ₃содержит четное число слагаемых α_i, i=1,2,3,4, и потому равна 0. Верно и обратное. Если все три суммы нулевые, сообщение передано без ошибки. В противном случае число j, 1≤j≤7, с двоичной записью σ₁σ₂σ₃указывает номер позиции, в которой произошла ошибка. Пусть, например, ошибка произошла в первой позиции. Тогда β₁=1⊕α₁и β_i=α_iпри i=2,3,…,7. Имеем

σ₃= 1⊕α₁⊕α₃⊕α₅⊕α₇=

= 1⊕α₁⊕α₃⊕(α₂⊕α₃⊕α₄)⊕( α₁⊕α₂⊕α₄) = 1.

Так как в вычислении σ₁и σ₂ошибочный бит не участвует, то эти суммы равны 0. Значит, j=001₂=1.

Для исправления ошибки в принятом сообщении β, нужно заменить β_jна 1⊕β_jи отбросить последние три бита. Первые четыре бита исправленного сообщения дают исходное сообщение α. Этот алгоритм реализует функцию декодирования α=D(β).􀀀

В общем случае (n,m)-блочный двоичный код определяется двумя функциями: функцией кодирования E:{0,1}ⁿ→{0,1}^mи функцией декодирования D:{0,1}^m→{0,1}ⁿ, где m≤n. Векторы вида E(α)∈{0,1}^mназываются кодовыми словами. Интуитивно ясно, что код тем лучше приспособлен к обнаружению и исправлению ошибок, чем больше различаются его кодовые слова.

Кодовым расстоянием блочного двоичного кода называется величина d(E), равная наименьшему расстояние между различными кодовыми словами:

d(E) = min{d(E(α),E(β)) | α, β∈{0,1}^m, α≠β }.

Пример.Вычислим кодовое расстояние для (4,5)-кода с проверкой на четность. Имеется 16 кодовых слов:

00000; 00011; 00101; 00110;

01001; 01010; 01100; 01111;

10001; 10010; 10100; 10111;

11000; 11011; 11101; 11110.

Нетрудно проверить, что нет ни одной пары кодовых слов, для которых расстояние равнялось бы 1. В то же время имеются кодовые слова, расстояние между которыми равно 2. Следовательно, кодовое расстояние для рассматриваемого кода равно 2.􀀀

Пример.Найдем кодовое расстояние для рассмотренного ранее (4,7)-кода Хемминга. Имеется 16 кодовых слов (проверочные биты записаны через пробел):

0000 000; 0001 111; 0010 110; 0011 001;

0100 101; 0101 010; 0110 011; 0111 100;

1000 011; 1001 100; 1010 101; 1011 010;

1100 110; 1101 001; 1110 000; 1111 111.

Легко обнаружить кодовые слова, расстояние между которыми равно 3. Несколько сложнее проверяется, что кодовых слов, расстояние между которыми равно 2 или 1, нет. Значит, кодовое расстояние рассматриваемого кода равно 3.􀀀

Теорема.1) Код позволяет обнаруживать ошибки в k (или менее) позициях тогда и только тогда, когда его кодовое расстояние превышает k.

2) Код позволяет обнаруживать и исправлять ошибки в k (или менее) позициях тогда и только тогда, когда его кодовое расстояние превышает 2k.

Доказательство. Мы ограничимся доказательством второй части теоремы. Первая доказывается аналогично.

Необходимость. Предположим, что кодовое расстояние меньше, чем 2k. Тогда найдутся два слова α и γ такие, что d = d(E(α), E(γ)) ≤ 2k. В слове E(α)⊕E(γ) заменим часть единиц нулями: d/2 единиц, если d четно, и (d−1)/2 единиц, если d нечетно, и обозначим полученное так слово через δ. Заметим, что

w(δ)≤k и w(δ⊕E(α)⊕E(γ)) ≤ k.

Положим β=E(α)⊕δ. Тогда

d(E(α),β) = w(E(α)⊕E(α)⊕δ) = w(δ) ≤ k,

d(E(γ),β) = w(E(γ)⊕E(α)⊕δ) ≤ k.

Следовательно, слово β может появиться в результате ошибочной передачи (с числом ошибок, не превосходящим k) как слова α, так и слова β. Такую ошибку исправить невозможно.

Достаточность. Предположим, что при передаче слова E(α) ошибки произошли в r≤k битах и на выходе было получено слово β. Поскольку E(α)⊕β – вектор ошибок, то

d(E(α),β) = w(E(α)⊕β) = r.

Так как кодовое расстояние превышает 2k, то для произвольного кодового слова E(γ), отличного от E(α), имеем d(E(α),E(γ))>2k. Используя неравенство треугольника, получаем

d(E(α),β) + d(β,E(γ)) ≥ d(E(α),E(γ)) > 2k,

d(β,E(γ)) ≥ 2k − d(E(α),β) = 2k−r > k.

Следовательно, слово β может получиться при передаче слова E(γ) только в том случае, когда сделано более k ошибок. Это позволяет по слову β однозначным образом восстановить E(α) как ближайшее к нему кодовое слово, единственное, которое может привести к появлению слова β в результате не более, чем k ошибок.􀀀