русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Метод к-средних.


Дата добавления: 2015-08-31; просмотров: 1531; Нарушение авторских прав


В отличие от древовидной классификации, метод к-средних разбивает всю выборку по заданным признакам на указанное количество кластеров. Таким образом, чтобы использовать этот метод нужно знать или предполагать сколько кластеров мы хотим иметь.

 

Итак, мы задаём количество кластеров 4 и первым делом смотрим, действительно ли все переменные (шкалы теста) отличаются во всех 4-х кластерах. Эта проверка осуществляется с помощью дисперсионного анализа (F-критерий), результаты которого отражены в следующей таблице.

 

F р

FPI Невротичность 11,32104 0,000015

FPI Спонтанная агрессивность 17,29933 0,000000

FPI Депрессивность 12,44079 0,000006

FPI Раздражительность 21,78287 0,000000

FPI Общительность 10,04764 0,000043

FPI Уравновешенность 12,79335 0,000005

FPI Реактивная агрессивность 30,89699 0,000000

FPI Застенчивость 16,97276 0,000000

FPI Открытость 10,14094 0,000040

FPI Экстраверс-интроверс 7,21617 0,000536

FPI Эмо. Лабильность 6,40723 0,001163

FPI Маскулинность-феминность 23,27450 0,000000

 

Уровень значимости для всех шкал теста очень высокий, все значения F-критерия значимы. Таким образом, все шкалы теста являются критериями классификации.

 

Далее нам необходимо узнать каковы средние арифметические шкал теста для каждого кластера. Это отображено в следующей таблице.

 

Кластер 1 Кластер 2 Кластер 3 Кластер 4

FPI Невротичность 7,25 4,50 7,00 4,36

FPI Спонтанная агрессивность 7,25 5,50 8,29 3,64

FPI Депрессивность 6,67 4,38 7,57 5,64

FPI Раздражительность 7,08 6,13 8,50 4,45

FPI Общительность 3,67 7,50 4,64 5,64

FPI Уравновешенность 2,75 4,00 5,93 5,45

FPI Реактивная агрессивность 6,75 6,75 8,21 3,82

FPI Застенчивость 6,50 3,00 6,71 5,91

FPI Открытость 5,17 6,63 8,07 4,36

FPI Экстраверс-интроверс 4,17 6,00 6,86 4,91



FPI Эмо. Лабильность 6,67 5,13 6,93 5,55

FPI Маскулинность-феминость 3,08 7,00 6,64 3,82

 

Для наглядности, отобразим средние арифметические на графике.

Последний и самый важный этап кластерного анализа – узнать кто же конкретно входит в кждый из четырех кластеров, а затем описать их характеристики, основываясь на графике или таблице со средними значениями. После этого блюдо можно подавать на стол под названием «Новая классификация».

 

Вывод

Кластерный анализ – красивый метод. Но всегда нужно помнить о его недостатках:

1. Как и факторный анализ, он может давать неустойчивые кластеры. Повторите исследование на других людях и сравните результаты классификации. Скорее всего, они будут отличаться. На сколько – вопрос качества самого исследования.

2. Он реализует индуктивный метод исследования от частного к общему, что чревато антинаучными выводами. В идеале выборка для классификации должна быть очень большая, неоднородная, желательно подобранная методом стратификации или рандомизации. Наука движется по пути проверки гипотез, поэтому не нужно злоупотреблять кластерным анализом. Лучше всего использовать его для проверки гипотезы о наличии каких-либо типов, а не создавать классификацию на голом месте.

3. Как и любой метод многомерного шкалирования, кластерный анализ имеет множество особенностей, связанных с внутренними методами. Каков критерий объединения людей в кластеры, метод поиска различий, количество шагов до завершения алгоритма в методе к-средних и т.д. поэтому результаты могут меняться, хоть и несущественно, в зависимости от «настроек» процедуры.

 



<== предыдущая лекция | следующая лекция ==>
Cluster Membership (Принадлежность к кластеру) | Кластерный анализ в программе Статистика


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.525 сек.