При решении этой задачи из множества факторов x1,x2,…,xn выделяют такие факторы, у которых значение коэффициента парной корреляции или корреляционного отношения не менее 0,8. Подобные факторы называются коллинеарными.
Коэффициент парной корреляции rijхарактеризует степень линейной зависимости между двумя факторами xiи xj , а корреляционное отношение – степень нелинейной зависимости. Формулы расчета этих величин приводятся в литературе по математической статистике. Коэффициенты rijи характеризуются следующими соотношениями:
; (2.8)
. (2.9)
Значения rijи , близкие к нулю, указывают на отсутствие взаимосвязи факторов, а близость их к единице – на наличие функциональной связи. Для определения коллинеарных факторов вычисляется матрица коэффициентов парной корреляции rij .
Вследствие симметричности (2.9) анализу подвергается только одна половина матрицы. При наличии пары коллинеарных факторов в модели как независимый целесообразно использовать фактор, имеющий меньшую дисперсию, а значение другого фактора вычислять по выявленной регрессионной зависимости. Если ни один из элементов матрицы не превосходит 0,8, целесообразно вычислить матрицу корреляционных отношений , но их расчет требует более громоздких вычислений.
Далее решается задача выявления взаимосвязи между входными факторами и выходными характеристиками модели и выбора из входных факторов, наиболее существенно влияющих на результаты моделирования.
При решении этой задачи для входных количественных факторов , отобранных на первом этапе, и выходных факторов вычисляют матрицу парных коэффициентов линейной корреляции либо корреляционных отношений . Упорядоченные по значению корреляционных коэффициентов факторы могут служить основой для выбора множества существенных факторов. Однако в ряде случаев изучаемые факторы лишь в косвенной форме отражают наиболее существенные, но не поддающиеся непосредственному наблюдению и измерению внутренние, скрытые свойства объекта, что проявляется в незначительных значениях практически всех парных корреляционных коэффициентов ( ).
В такого рода ситуациях с помощью достаточно сложного математического аппарата факторного анализа пытаются выявить наибольшее число латентных переменных, на базе которых в дальнейшем и строится математическая модель.