Ковариация (корреляционный момент), также как и корреляция, является характеристикой степени линейной зависимости двух переменных. Выражением для вычисления ковариации является числитель в формуле для коэффициента корреляции, а это означает, что ковариация и корреляция представляют, в действительности, одну и ту же информацию. Однако значения ковариации сложнее интерпретировать, т.к. ее единицы измерения являются произведением единиц измерения каждой переменной. Например, для цен и жилой площади ковариация выражена в единицах квадратных метров, умноженных на тысячи долларов. Поэтому при анализе обычно предпочитают использовать коэффициент корреляции, не имеющий размерности. Тем не менее, в некоторых ситуациях ковариация используется как самостоятельная характеристика. Так, например, в теории финансов ковариацию применяют для описания зависимости одних курсов акций по отношению к другим.
Задание 4.
Определить ковариацию между размером жилой площади и ценой объекта.
1. Откройте файл Двумерные данные.xls.
2. На Листе2 в ячейку D10 введите Инструмент анализа: Ковариация.
4. В диалоговом окне Ковариация установите параметры как указано ниже на рисунке.
5. Щелкните на кнопке ОК. Результаты будут расположены в диапазоне D11:F13 (см. рисунок ниже).
6. Результатом является матрица попарных ковариаций. На диагонали расположены дисперсии для каждой переменной (квадрат стандартного отклонения). Значение ковариации Цены и Площади (853,2427) указано в левой нижней части матрицы в ячейке E13. Правая верхняя часть матрицы пустая, т.к. ее значения совпадают с соответствующими значениями в левой нижней части.
7. Вычислите ковариацию, используя Мастер функций. Для этого в ячейку D15 введите Функция КОВАР. Выделите ячейку D16, вызовите Мастер функций и выберите статистическую функцию КОВАР. В диалоговом окне Аргументы функции щелкните в поле Массив1, а затем выделите диапазон A2:A16, не включая метку. Теперь щелкните в поле Массив2 и выделите диапазон B2:B16, не включая метку. Щелкните на кнопке ОК.
Замечание. В отличие от инструмента анализа Ковариация статистическая функция КОВАР не статична, т.е. при изменении данных в исходном диапазоне значение ковариации, рассчитанной с помощью функции КОВАР, тоже изменится.
8. Выделите ячейку B2 и введите в нее число 30. Нажмите [Enter].
Обратите внимание!Величина ковариации в ячейке D16 изменилась, а в матрице попарных ковариаций осталось прежнее значение.
9. Щелкните на кнопке Отменить на панели инструментов Стандартная, чтобы вернуться к исходному значению в ячейке B2.
Контрольные вопросы
1. В чем отличие анализа двумерных данных от анализа одномерных данных?
2. На какие вопросы можно ответить, проанализировав двумерные данные?
3. Что такое диаграмма рассеяния? С какой целью она используется для анализа?
4. Что такое коэффициент корреляции?
5. На что указывает знак (положительный или отрицательный) коэффициента корреляции?
6. Если большие значения X вызывают появление больших значений Y, то какой, по вашему мнению, должна быть корреляция – положительной, отрицательной или нулевой? Почему?
7. Для каждого из приведенных ниже равенств укажите типичный вариант интерпретации?
а) r = 1;
б) r = 0,85;
в) r = 0;
г) r = –0,15;
д) r = –1.
8. Поясните как, по вашему мнению, располагаются точки на диаграмме рассеяния в следующих ситуациях.
а) Взаимосвязь между X и Y отсутствует.
б) Линейная взаимосвязь с сильной положительной корреляцией.
в) Линейная взаимосвязь с сильной отрицательной корреляцией.
г) Линейная взаимосвязь со слабой положительной корреляцией.
д) Линейная взаимосвязь со слабой отрицательной корреляцией.
е) Линейная взаимосвязь с корреляцией +1?
ж) Линейная взаимосвязь с корреляцией –1?
9. Что представляет собой ковариация между X и Y?
10. Какую из характеристик легче интерпретировать – корреляцию или ковариацию? Почему?