При работе с многолетними, в частности, плодовыми культурами исследователю совместно с количественными признаками приходится анализировать большое количество качественных признаков. В таких случаях для сравнения объектов необходимо применять специальные статистические модели и методы.
Для того чтобы правильно применять те или иные модели необходимо учитывать ряд особенностей объектов исследования:
1) Многолетний образ жизни, включающий ювенильный период: а) зависимость выражения признаков и их нормы реакции от возраста растения (фактор вариации – возраст); б) возможность использования года наблюдений как повторения;
2) Годичный морфофизиологический цикл: период покоя и период вегетации, фенофазы и феноинтервалы, зависимость выражения признаков от календарных сроков наблюдения;
3) Широкая норма реакции по большинству хозяйственно-ценных признаков по множеству факторов вариации: возраст, фаза годичного цикла, почвенно-климатические особенности места произрастания, погодные условия текущего и предыдущего года, схема посадки, подвой, агротехника (обрезка, полив, питание, система защиты), случайная вариация.
4) Сильная зависимость выражения признаков от места произрастания растения: необходимость учета признаков у нескольких растений, рандомизировано расположенных на участке.
5) Множество типов признаков: морфологических (корень, ствол, ветви, побеги, почки, листья, цветки, плоды, семена), хозяйственных (урожайность, скороплодность, качество плодов и т.п.), устойчивость (к морозам, болезням) и др.
6) Исследование малых выборок (3-5 растений одного генотипа, гибридные семьи из 10-15 сеянцев).
7) Исследование клонов растений: детальный анализ модификационной изменчивости.
Статистические модели и методы, используемые при исследовании плодовых культур можно подразделить на два типа: одномерные и многомерные.
Одномерные модели (анализ отдельных признаков или их пар): анализ распределения и структуры изменчивости признаков – выяснение достоверности и доли влияния различных факторов, сравнение средних (дисперсионный анализ); анализ сопряженности между признаками (корреляционный и регрессионный анализ).
Многомерные модели и методы (анализ объектов по множеству признаков): классификация по комплексу признаков (кластерный анализ); оценка информативности признаков (метод главных компонент, факторный анализ); прогнозирование выражения признака по косвенным показателям (множественная и пошаговая регрессия, дискриминантный анализ).
Рассмотрим основные этапы статистического анализа исходных данных:
1. Предварительный анализ исследуемой системы: определение цели, объектов, признаков.
2. Составление плана сбора исходной информации.
3. Сбор исходных данных, их формализация и введение в ЭВМ (построение таблицы объект-признак).
4. Первичная статистическая обработка данных: а) отображение переменных в той или иной шкале; б) статистическое описание исходных совокупностей (определение пределов варьирования, построение эмпирических распределений); в) восстановление пропущенных наблюдений; г) унификация типов переменных (перевод признаков в одну шкалу); д) анализ законов распределений.
5. Составление плана вычислительного анализа материала.
6. Вычислительная реализация статистической обработки данных.
7. Подведение итогов исследования (интерпретация результатов статистического анализа).
Рассмотрим типы шкал, которые используются для описания признаков.