русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Этап 4. Выбор мер сходства и формирование групп сходных объектов.


Дата добавления: 2015-08-31; просмотров: 1199; Нарушение авторских прав


В кластерном анализе объекты представляются точками в координатном пространстве. Размерность пространства определяется числом переменных, используемых для описания объектов. Сходство и различие между точками находятся в соответствии с расстояниями между ними. Считается, что чем меньше расстояние между объектами, тем более схожи они между собой.

Существует большое количество разновидностей методов определения расстояний. Для количественных переменных наиболее часто используется евклидово расстояние:

Квадрат эвклидова расстояния:

X, Y - объекты

Х1, Х2, Х3 … Хm

Значения переменных 1, 2 … m для объектов X и Y

Y1, Y2, Y3 … Ym

Для дихотомических переменных используются меры, основанные на частотах, отражающих возможные сочетания значения двух признаков:

  Признак 2
Признак 1 А B
C D

Евклидово расстояние:

Квадрат евклидова расстояния:

Разность длин:

Существует множество алгоритмов, с помощью которых происходит формирование групп схожих объектов. Разработанные кластерные методы образуют семь основных семейств:

- Иерархические агломеративные методы;

- Итеративные методы группировки;

- Иерархические дивизимные методы;

- Методы поиска модальных значений плотности;

- Факторные методы;

- Методы сгущений;

- Методы, использующие теорию графов.

Первые две группы являются наиболее часто встречающимися. Им соответствуют – иерархический кластерный анализ и кластеризация методом k-средних. Первый алгоритм предпочтительнее использовать при числе наблюдений меньше 200, второй – на больших выборках.

Иерархический КА -агломеративный (объединяющий) тип алгоритма, представляющий собой последовательное объединение наиболее схожих объектов во все крупные кластеры. На начальном этапе все объекты рассматриваются как отдельные кластеры. Далее между объектами попарно вычисляются расстояния, и отбирается та пара, которая наиболее близко расположена друг к другу. Эта пара объектов объединяется в кластер. Затем вновь вычисляются все попарные расстояния для объединения близких объектов. Процедура может повторяться до тех пор, пока все объекты не попадут в один кластер. Однако обычно она останавливается после того, как получено необходимое число кластеров, поддающихся содержательной интерпретации.



Алгоритм кластеризации методом k-среднихотносится к итеративным методом группировки. Процедура начинается с определения необходимого числа кластеров. Затем рассчитываются расстояния от объекта до центра кластера и определяется, насколько близок этот объект к другим объектам этого кластера или является «выбросом». Объекты распределяются по кластерам по следующему принципу: каждый объект относится к кластеру с ближайшим к этому объекту центром. Т.о. происходит распределение всех объектов по k-кластерам. Затем заново вычисляются центры полученных кластеров и объекты перераспределяются. Процедура повторяется до тех пор, пока центры кластеров не стабилизируются.



<== предыдущая лекция | следующая лекция ==>
Этапы кластерного анализа | Этап 5. Проверка достоверности кластерного решения


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.798 сек.