Заменив реальный открытый текст его моделью, мы можем теперь построить критерий распознавания открытого текста. При этом можно воспользоваться либо стандартными методами различения статистических гипотез, либо наличием в открытых текстах некоторых запретов, таких, например, как биграмма ЪЪ в русском тексте. Проиллюстрируем первый подход при распознавании позначной модели открытого текста.
Итак, согласно нашей договоренности, открытый текст представляет собой реализацию независимых испытаний случайной величины, значениями которой являются буквы алфавита А={а1,...,аn}, появляющиеся в соответствии с распределением вероятностей Р(А) = (р(а1),...,р(аn)). Требуется определить, является ли случайная последовательность c1,c2,...,ck букв алфавита А открытым текстом или нет.
Пусть Н0 – гипотеза, состоящая в том, что данная последовательность – открытый текст, Н1 – альтернативная гипотеза. В простейшем случае последовательность c1,c2,...,ckможно рассматривать при гипотезе Н1 как случайную и равновероятную. Эта альтернатива отвечает субъективному представлению о том, что при расшифровании криптограммы с помощью ложного ключа получается "бессмысленная" последовательность знаков. В более общем случае можно считать, что при гипотезе Н1 последовательность c1,c2,...,ckпредставляет собой реализацию независимых испытаний некоторой случайной величины, значениями которой являются буквы алфавита А={а1,...,аn}, появляющиеся в соответствии с распределением вероятностей Q(A)=(q(а1),...,q(аn)). При таких договоренностях можно применить, например, наиболее мощный критерий различения двух простых гипотез, который дает лемма Неймана-Пирсона.
В силу своего вероятностного характера такой критерий может совершать ошибки двух родов. Критерий может принять открытый текст за случайный набор знаков. Такая ошибка обычно называется ошибкой первого рода, ее вероятность равна a= р{Н1 /Н0}. Аналогично вводится ошибка второго рода и ее вероятность b=р{h0/h1}. Эти ошибки определяют качество работы критерия. В криптографических исследованиях естественно минимизировать вероятность ошибки первого рода, чтобы не "пропустить" открытый текст. Лемма Неймана-Пирсона при заданной вероятности первого рода минимизирует также вероятность ошибки второго рода.
Критерии на открытый текст, использующие запретные сочетания знаков, например, k-граммы подряд идущих букв, будем называть критериями запретных k-грамм. Они устроены чрезвычайно просто. Отбирается некоторое число s редких k-грамм, которые объявляются запретными. Теперь, просматривая последовательно k-грамму за k-граммой анализируемой последовательности c1,c2,...,ck, мы объявляем ее случайной, как только в ней встретится одна из запретных k-грамм, и открытым текстом в противном случае. Такие критерии также могут совершать ошибки в принятии решения. В простейших случаях их можно рассчитать. Несмотря на свою простоту, критерии запретных k-грамм являются весьма эффективными.
Контрольные вопросы
–Чем отличаются подходы к обеспечению безопасности информации в криптографии и в методах сокрытия информации?