15.1. Основные понятия математической статистики.
О: Выборка -совокупность значений СВ , полученных в результате независимых экспериментов.
О: Статистический ряд:
, ,
, , -относительная частота, -частота появления .
О: Статистический ряд по интервалам
-число значений СВ ,
попавших в . Графическое изображение
О: Эмпирическая функция распределения:
15.2. Определение неизвестных параметров распределения
О: Для выборки среднее арифметическое ,дисперсия ; для статистического ряда: , ;
, -числовые
характеристики СВ с выборкой , .
О: Доверительный интервал , - точность оценки параметра в функции распределения СВ , -коэффициент доверия.
Для нормального распределения с параметрами при . Для двумерной СВ с выборкой
выборочный коэффициент корреляции
.
Основные понятия математической статистики Построение эмпирических законов распределения
Математическая статистика – наука о методах обработки экспериментальных данных, полученных при изучении закономерностей в случайных массовых явлениях. Способ статистической обработки, равно как и ценность её результатов полностью зависит от положенной в основу вероятностной модели, которая должна объяснить вероятностную структуру наблюдений.
О: Генеральной совокупностью называется множество всех возможных значений случайной величины . Выборкой объёма называется совокупность значений , полученных в результате независимых экспериментов.
По исследованию выборки необходимо сделать правильный вывод о СВ . Например, по толщине покрытия 100 деталей из серии необходимо сделать вывод о качестве покрытия деталей. В этом случае классическую вероятность заменяют статистической.
О: Статистическим рядом называется таблица, в которой записываются в упорядоченном по возрастанию виде различные элементы выборки , , и относительные частоты ( - частота появления ):
, . (15.1)
При большом числе измерений анализ такого материала затруднителен. Поэтому поступают следующим образом.
Составляется статистический ряд по интервалам или вариационный ряд. Весь интервал полученных значений величины разбивается на интервалы , ,…, , подсчитываются относительные частоты , где - число значений величины , попавших в , и строится таблица:
(15.2 )
Графическими изображениями статистических рядов являются полигон и гистограмма.
Полигон состоит из отрезков, соединяющих точки , , где в случае ряда по интервалам - срединное значение интервала (рис. 15.1)
Рис 15.1.
Рис. 15.2.
Гистограмма служит для изображения интервального статистического ряда (15.2). По оси откладывают интервалы , варьирования СВ и на этих отрезках строят прямоугольники с высотами (рис. 15.2).
О: Эмпирической функцией распределения СВ , для которой составлен статистический ряд (15.2), называется
При малых , и больших функция близка к теоретической функции распределения .
Определение неизвестных параметров распределения и выборочного коэффициента корреляции
Выборочные числовые характеристики. Оценки параметров
Для выборки СВ и для статистического ряда определяются следующие числовые характеристики.
О: Среднее арифметическое выборки это ,
среднее арифметическое статистического ряда (15.1): . Дисперсия выборки это ,
дисперсия статистического ряда (15.1) ‑ .
Среднее квадратичное отклонение: .
Пусть случайная величина с функцией распределения , где - неизвестный параметр распределения, т.е. неизвестная числовая характеристика СВ . Например, имеет нормальное распределение с неизвестным параметром . Рассмотрим выборок , , этой СВ . Обозначим через оценку величины , её можно представить как случайную величину, зависящую от , , т.е. . Чтобы выбрать в некотором смысле лучшую оценку , рассматриваются свойства оценок: несмещённость, состоятельность, эффективность.
О: Оценка параметра называется несмещённой, если её математическое ожидание , состоятельной, если по вероятности сходится к при , т.е. . Несмещённая оценка называется эффективной, если её дисперсия - наименьшая среди всех дисперсий, вычисляемых для оценок по выборкам одинакового объёма.
Т: Среднее арифметическое выборки СВ , имеющей математическое ожидание и дисперсию , является несмещённой и состоятельной оценкой математического ожидания. В случае нормального распределения СВ эта оценка является эффективной.
Пример. Найти параметры распределения СВ в примере п. 15.1, если имеет нормальный закон распределения.
Решение. Плотность вероятности для нормального закона распределения , неизвестные параметры - , . Т.к. (мкм),
(мкм2), то , .
Доверительные интервалы параметров
Рассмотренные выше оценки параметров являются точечными. При малом объёме выборки, чтобы избежать грубых ошибок, вводят интервальную оценку. Обозначим точность оценки параметра через , т.е. , а через - вероятность , т.е. . Последнее условие означает, что интервал покрывает значение с заданной вероятностью . Он называется доверительным интервалом, - коэффициентом доверия. На практике выбирают достаточно близким к 1.
Величины , и объём выборки связаны между собой. Если определены две из них, то можно определить третью.
Пусть случайная величина имеет нормальное распределение с параметрами , .
В качестве оценки берётся . Все элементы , , выборки случайные и имеют то же распределение, что и с параметрами , . Тогда по (15.6) в силу нечётности функции Лапласа : .
Обозначим , тогда .
Если задано, то находится по таблице функции Лапласа. Интервал с вероятностью покрывает значение и является доверительным для . При этом предполагается, что известно. Если заменить приближённым значением , то коэффициент доверия уменьшится.
Пример. Найти доверительный интервал с коэффициентом доверия 0,95 для и .
Решение. По таблице Лапласа . Так как , , то имеем , доверительный интервал и .