Регрессией называется односторонняя вероятностная зависимость между случайными величинами. Эта зависимость выражается с помощью функции, которая называется регрессией. Регрессии различают по числу переменных (между двумя переменными – простая, или несколькими – множественная); по форме зависимости (линейная, выражаемая линейной функцией, нелинейная).
Результаты измерений или наблюдений величин и
(случайных) фиксируют в таблице наблюдений, если данные наблюдаются по одному разу.
Эти результаты можно изобразить на координатной плоскости в виде точек, координатами которых являются значения признака и
одного объекта
= 1, 2, …, n. В итоге получаем корреляционное поле. Пусть представление выборки на корреляционном поле следующие (рис. 2).

Рис. 2. Представление выборки
В случае а) видно, что следует искать линейную зависимость, в случае б) – нелинейную зависимость, а в случае в) вряд ли зависимость существует.
Конкретный вид функциональной зависимости между величинами и
называется эмпирической функцией. Простейшим видом эмпирической функции является линейная функция
. Для получения линейной эмпирической формулы самым простейшим является метод «натянутой нити». В этом методе на корреляционном поле надо так провести прямую, чтобы по обе стороны ее оставалось примерно одинаковое количество точек. Выбираем на этой прямой две точки и
(они могут и не принадлежать выборке). Подставляем эти координаты в формулу
, получаем систему линейных уравнений:

Решив эту систему относительно а и b, получаем эмпирическую формулу.
Условным средним
называется среднее арифметическое наблюдений значений , при фиксированном значении переменной
называется функциональная зависимость условной средней
от х, в случае линейной корреляционной зависимости уравнение прямой линии регрессии имеет вид:
= kx + c, где угловой коэффициент k называется выборочным коэффициентом регрессии Y на X и обозначается
.
Параметры и
находятся из системы уравнений (метод наименьших квадратов):

где n – число наблюдений значения параметра.
Уравнение регрессии принято записывать в виде , где
.
Коэффициенты и
можно также найти по формулам:
,

Уравнение регрессии на
имеет вид:
,
где
,
.
Если выборка многочисленна, то одно и то же значение может встретиться
раз, одно и то же значение соответственно
раз.
Поэтому наблюдаемые значения могут быть сгруппированы и записаны в корреляционной таблице:
Здесь Х – количество удобрений, Y – урожайность, на пересечении строки и столбца указано количество участков, в которых при вносимом количестве удобрений получен соответствующий урожай.