Статистика – это наука, изучающая, обрабатывающая и анализирующая количественные данные о разнообразнейших массовых явлений в жизни.
Экономическая статистика изучает изменение цен, спроса и предложения товаров, прогнозирует рост и падение производства и потребления.
Математическая статистика – это раздел математики, изучающий математические методы обработки и использования статистических данных для научных и практических выводов.
Генеральная совокупность – это вся совокупность однородных объектов, которую изучают относительно некоторого признака, который характеризует эти объекты.
Выборкой называют совокупность случайно выбранных объектов из генеральной выборки.
Статистическим распределением называют перечисление вариант и соответствующих им частот.
Эмпирической функцией распределения называют функцию , которая определяет для каждого х относительную частоту , то есть где - число вариант меньших х, - объем выборки.
Основные числовые характеристики выборки:
Медиана – это так называемое среднее значение упорядоченного ряда значений случайной величины:
Мода – это вариант, который имеет большую частоту, встречается чаще других.
Размах выборки – это разность между наибольшим и наименьшим значениями случайной величины выборки.
Среднее выборочное -
Дисперсия -
Среднее квадратичное отклонение -
Коэффициент вариации -
Подобно тому, как графики всех парабол можно получить с помощью геометрических преобразований одной параболы , так и все кривые нормальных распределений можно получить с помощью геометрических преобразований одной кривой. Эту кривую называют кривой нормального распределения, или гауссовой кривой: .
Правило трех сигм:
68% (или приблизительно ) всех значений нормального распределения случайной величины Х имеют отклонение от среднего значения, по абсолютной величине не превышающее среднее квадратичное отклонение , а 96% всех значений – не превышающее . Почти все значения (точнее, 99,7 всех значений) имеют отклонение от среднего, не превышающего по абсолютной величине утроенное среднее квадратичное отклонение .
Пример 1.Найдите размах, моду, медиану и среднее значение ряда данных некоторой случайной величины 1, 1, 2, 2, 2, 3, 4, 4, 5. Постройте полигон частот значений случайной величины . Укажите на рисунке размах, моду, медиану заданного ряда данных.
Решение.
Размах выборки: .
Среднее значение: .
Мода выборки: , так как число 2 повторяется чаще всего.
Медиана: , так как именно это число стоит в центре ряда.
Постоим полигон частот.
Пример 2.Выигрыши (в грн.), которые приходятся на один билет в каждой их двух лотерей, имеют следующие законы распределения:
1)
Х
Р
0,9
0,06
0,03
0,01
2)
Х
Р
0,85
0,12
0,02
0,01
Какой из этих лотерей вы отдадите предпочтение?
Решение.
Найдем математическое ожидание каждого распределения.
1) .
2) .
Сравним два числа и получим, что вторая выгодней.
Пример 3. Задана генеральная совокупность из 20 элементов. Выполнить задания:
1) построить статистическое распределение и ее эмпирическую функцию распределения;
2) вычислить ее числовые характеристики выборки: среднее, дисперсию и среднее квадратичное отклонению