Анализ данных — активно развиваемое направление компьютерной информационной технологии. Это обширная область, которая включает совокупность методов и средств извлечения из определенным образом организованных данных информации для принятия решений /Александров В. В. и др., 1990/. Методы анализа данных реализуются на компьютерах различного класса, как правило, в виде пакетов прикладных программ. В состав указанных пакетов входят известные процедуры дисперсионного, корреляционного, регрессионного, факторного, дискриминантного и кластерного анализа, а также другие процедуры многомерной прикладной статистики. Эти процедуры интенсивно эксплуатируются при проведении психодиагностических исследований. В то же время в большинстве таких исследований для изучения психологических феноменов в основном анализируются взаимосвязи результирующих показателей психодиагностических методик (разнообразных диагностических шкал, психологических факторов и т. п.). При этом часто вне внимания исследователей остается сам «механизм» получения результирующих показателей, который в основном ограничен рамками традиционного подхода, ориентированного на «ручное» употребление психодиагностических методик.
Традиционная методология конструирования психодиагностических шкал достаточно детально разработана. На практике широко используется ряд всевозможных коэффициентов надежности и валидности как отдельных элементов тестов, так и тестовых методик в целом, и психометрические дискуссии ведутся по поводу нюансов выбора, например, той или иной меры связи между переменными, того или иного критерия внутренней согласованности теста и т. п. В то же время традиционный психодиагностический эксперимент застыл на одной элементарной схеме. Формальные операции обработки результатов психодиагностического тестирования, как правило, заключаются в анализе совпадений ответов испытуемого с так называемым «ключом», который представляет собой заранее известный список ответов, «работающих» на проявление диагностируемой психологической характеристики. Очень часто просто подсчитывается число таких совпадений, реже они суммируются с определенными весами. Подобные процедуры, в которых ответы испытуемых на пункты теста играют роль исходных дихотомических признаков, а результат вычисляется в виде взвешенной суммы этих признаков, относятся к известному в прикладной статистике классу линейных диагностических правил.
Серьезные вопросы возникают при рассмотрении традиционной практики конструирования психодиагностических тестов. Современный психометрист в процессе создания теста обязательно анализирует два вида статистических связей — связь пунктов теста с критерием внешней валидности или с суммарными результатами теста и попарные связи внутри теста, между пунктами. При этом часто считается, что максимальная валидность теста достигается за счет отбора таких пунктов, которые, обладая значимой корреляцией с внешним критерием, минимально коррелируют между собой. Однако можно привести довольно много аргументов, доказывающих неполноту такого анализа. Ограничимся только одним, но достаточно весомым. Он заключается в том, что пункты теста, каждый из которых по отдельности не коррелирует с внешним диагностическим критерием, способны в совокупности обеспечить полное и четкое разделение диагностируемых групп испытуемых. Используя традиционный психометрический подход, эти пункты будут совершенно напрасно забракованы как неинформативные. Подобные примеры, оппонирующие традиционной методологии, подробно рассматриваются в третьей главе.
Уже в рамках традиционного линейного подхода реализация полномасштабных психометрических исследований требует применения компьютерной техники. В то же время современные компьютеры с их способностью выполнять с высокой скоростью большие объемы счетных и логических операций дают возможность использовать для анализа данных и конструирования психодиагностических тестов более совершенные подходы, позволяющие полнее учитывать сложную структуру психодиагностической информации.
В последнее время все больше исследователей начинают видеть реальную альтернативу сложившимся психодиагностическим подходам в применении методов теории распознавания образов. Разработка процедур принятия решений (диагностики и классификации) является прерогативой этой теории и наиболее изученной ее частью. Если обратиться к истории, то можно заметить, что многие идеи, составляющие основу теории распознавания образов, были стимулированы благодаря исследованию психологических феноменов, с одной стороны, и поисками новых путей анализа сложной экспериментально-психологической информации, с другой. Так, первой работой, положившей начало исследованиям в области обучения распознаванию образов, считается работа Ф. Розенблатта по моделированию распознавания зрительных образов. Многие методы снижения размерности пространства признаков в распознавании образов тесно связаны с инструментарием факторного анализа, зародившегося как один из основных подходов к изучению психологических черт /Spearman С, 1927; Thurstone L., 1957/. В распознавании образов нередко применяются методы многомерного масштабирования, которые также связаны с психометрическими исследованиями в области шкалирования /Torgerson W. S., 1952/.
Теория распознавания образов является синтетической наукой, вобравшей в себя достижения самых различных областей. В начале развития этой теории был определенный период, когда казалось; что многие задачи распознавания могут быть решены за счет способности к обучению перцептрона — распознающей системы, предложенной Ф. Розенблаттом, в основе которой лежала модель нейрона и главный феномен которой состоял в исправлении ошибок распознавания посредством простой процедуры поощрения и наказания распознающей системы учителем — человеком. Однако с появлением теоремы американского математика А. Новикова алгоритм поощрения, реализуемый перцептроном, получил геометрическую интерпретацию, что во многом определило стиль и уровень последующих работ. В дальнейшем М. Минским и С. Пейпертом /1971/ было проведено подробное исследование перцептрона и установлены границы его потенциальных возможностей.
В настоящее время известно большое количество математических моделей, пригодных для решения задач распознавания образов. Все эти модели фактически опираются на геометрическое изображение и истолкование характеристик распознаваемых объектов в пространстве признаков. Распознавание образов предполагает большую свободу в выборе конкретной модели распознающей системы от строго математической до произвольной, эвристической. Главным эффектом распознавания образов является настройка выбранной модели на этапе обучения на максимальное отражение частного и общего распознаваемых объектов.
Большой арсенал алгоритмов теории распознавания образов широко используется в самых различных областях науки и техники. В то же время в психологии, которая сильно повлияла на его развитие, этот арсенал находит чрезвычайно ограниченное применение. Объяснение указанному положению вещей состоит в том, что в психодиагностике, как в фокусе, сконцентрированы многие трудно решаемые проблемы распознавания образов, порождаемые сложной природой объекта исследования — психики человека. Сюда относится номинальный и качественный характер исходных признаков, связанный со специфической функцией активности изучаемого объекта — человека /Суппес П. и др., 1967/. Другая особенность психологических измерений заключается в их высокой размерности в соответствии с основополагающими принципами системности и комплексности психологических исследований /Ломов Б. Ф., 1975, 1990; Ганзен В. А., 1984; Анцыферова Л. И., 1990/. И, наконец, сложность изучаемых объектов отражается в сложной и часто не предсказуемой структуре распределений распознаваемых классов в пространстве признаков. Также следует отметить, что на эту структуру накладывает свой отпечаток размытость и нечеткость психодиагностических критериев.
На ограниченное применение алгоритмов распознавания образов в психодиагностике оказали влияние все приведенные выше причины. Но, конечно, главную роль в этом сыграла высокая размерность пространства признаков, которыми должен оперировать экспериментатор при проведении психодиагностических исследований, так как увеличению размерности сопутствует, как правило, экспоненциальный рост сложности указанных алгоритмов. Поэтому до появления высокопроизводительных персональных компьютеров возможность использования мощного математического аппарата анализа данных не представляла практического интереса для специалистов в области психодиагностики.
Развитие компьютерной информационной технологии дает основание рассматривать использование методов теории распознавания образов в качестве ближайшей реальной перспективы совершенствования психодиагностики. Соединение современных методов анализа с организацией баз психодиагностических данных позволит расширить возможности традиционных психодиагностических методик и конструировать новые процедуры, соответствующие меняющейся структуре потребностей человека и общества.