Пусть имеется h - случайная величина, о законе распределения которой выдвигается некоторая гипотеза, Х - множество возможных значений h. Разобьем Х на m попарно непересекающихся множеств Х1, Х2, ¼ ,Хm, таких, что
P { h ÎХj } = pj > 0 при j = 1, 2, ¼, m,
p1 + p2 + ¼ pm = P { hÎХ } = 1.
Выберем N независимых значений h1, h2, ¼ ,hN и обозначим через νjколичество значений h ÎХj. Очевидно, что математическое ожидание νj равно Npj, т.е. М[νj] = Npj.
В качестве меры отклонения всех νj от Npjвыбирается величина
(7)
При достаточно большом N величина хорошо подчиняется закону распределения с ( m - 1) степенью свободы:
P { < } , (8)
где - плотность распределения с (m - 1) степенью свободы. Для распределения составлены специальные таблицы, приведенные в приложении А.
По вычисленному значению и числу степеней свободы с помощью таблиц находится вероятность того, что величина, распределенная по закону , превзойдет это значение. Если эта вероятность превышает некоторой уровень значимости a, то считается, что гипотеза о виде распределения не опровергается результатами эксперимента.
2.1.1. Тесты проверки ²случайности²
На практике обычно применяют два теста проверки ²случайности²: тест проверки серий и тест проверки частот и пар.
Тест проверки серий предусматривает разбиение случайных цифр в исследуемой последовательности на элементы двух родов - первого и второго.
Серией называется любой отрезок последовательности цифр, состоящий из следующих друг за другом элементов одного и того же рода.
Например, если в последовательности цифр
e1, e2, ¼,ek ek + 1, ek + 2, ¼ ,ek + ek ++ 1, ek++2, ¼ ,es
серия 1-го серия 2-го серия 1-го
рода длины k рода длины рода длины s - k -
e1 ¹ e2 ¹ ¼ ¹ ek ¹ ek + 1, ek + 1 = ek + 2 = ¼ = ek +и ek +¹ ek ++ 1 ¹ ¼ ¹ es, то цифры e1, e2, ¼ ,ek образуют серию первого рода длины k, цифры ek + 1, ek + 2, ¼ ,ek + образуют серию второго рода длины и цифры ek ++ 1, ek++ 2, ¼ ,es также образуют серию первого рода длины s - k - . Иногда для удобства элементы серий первого рода обозначают знаками ²-² (минус), а второго рода - знаками ²+² (плюс).
В практике встречается другая разновидность теста проверки серий, когда к элементам серий первого рода относят числа, меньшие 0.5, а к элементам серий второго рода - не меньшие 0.5.
При достаточно большом объеме выборки e1, e2, ¼,eN ( практически при N ³ 20 ) и уровне значимости α = 0.05 нижний предел общего числа серий равен:
(12)
а нижний предел числа серий элементов первого и второго родов равен:
(13)
Максимальная длина серий не должна быть больше, чем