русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Проблема расчета расстояний между группами объектов (кластеров). Возможные алгоритмы. Методы кластерного анализа.


Дата добавления: 2015-08-31; просмотров: 1006; Нарушение авторских прав


 

Непосредственные данные – матрица различий между всеми парами объектов. Результат – дендрограмма.

{ Метод одиночной связи(метод ближайшего соседа) алгоритм начинается с поиска двух наиболее близких объектов, которые образуют первичный кластер, каждый следующие объекты присоединяются к кластеру, к одному из объектов которого он ближе. Метод образует небольшое число крупных кластеров. Результат не всегда даёт возможность определить, как много кластеров находится в данных.

{ Метод полной связи(метод дальнего соседа) Новый объект присоединяется к тому кластеру, самый далёкий элемент которого находится ближе всего к новому объекту, чем самые далёкие элементы других кластеров. Тут наблюдается тенденция к выделению большого числа компактных кластеров, состоящих из наиболее похожих элементов.

{ Метод средней связи(метод межгрупповой связи) На каждом шаге вычисляется среднее арифметическое расстояние между каждым объектом из одного кластера и каждым объектом из другого. Объект присоединяется к кластеру, если среднее расстояние с ним меньше, чем с любым другим кластером. Метод должен давать более точные результаты кластеризации, чем остальные методы.

Опыт и литературные данные свидетельствуют, что метод средней связи даёт наиболее близкую к реальной группировку. Но при этом метод одиночной связи «сжимает» пространство, образуя минимально возможное количество больших кластеров, а метод полной связи расширяет его образуя максимально возможное количество компактных кластеров.

 

 

Общий алгоритм проведения иерархического кластерного анализа. Проблема определения количества кластеров. Интерпретация результатов проведения кластерного анализа. Возможные содержательные результаты, получаемые с помощью этого метода.

v Отбор объектов для кластеризации (испытуемые - объекты, которые оцениваются испытуемыми - признаки измеренные на выборке испытуемых).



v Определение множества переменных, по которым будут различаться объекты кластеризации (набор измеренных признаков – субъекты оценки – испытуемые).

v Определение меры различия между объектами кластеризации.

v Выбор и применение метода классификации для создания групп сходных объектов.

v Проверка достоверности разбиения на классы (не всегда нужен)

 

Сложность определения количества классов состоит в том, что не существет формальных критериев для определения оптимального количества классов. В конечном итоге это определяется самим исследователем. Для предварительного определения числа классов можно обратиться к таблице последовательности агломерации.

 

Кластерный анализ позволяет избавиться от несгруппированных переменных и выявить иерархические кластеры, к которым факторный анализ не чувствителен( или вообще отпадает потребность в факторном анализе, кроме тех случаев, когда искомый результат – переход к новым переменным).
Стоит помнить, что корреляция является мерой сходства, а не различия, и для анализа следует использовать только абсолютные значения корреляций( они бывают так же и отрицательными, что тоже свидетельствует о сходстве)

 

 



<== предыдущая лекция | следующая лекция ==>
Способы измерения расстояний между объектами в двухмерном и многомерном пространстве. Понятие метрики, их разновидности. | 


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 2.067 сек.