Изучались результаты мониторирования ЭКГ во время физических тренировок и нагрузочных тестов (велоэргометрии) у 10 больных, верифицированной методом коронаровентрикулографии. Всем больным проводились велоэргометрия и холтеровское мониторирование ЭКГ. Анализировались частота сердечных сокращений, величины площади волны Р, сегмента PQ, депрессии сегмента ST в динамике. Перечень и методика измерений комплекса регистрируемых на ЭКГ параметров приведены на рис. 2.
Рис 2. Общая схема фиксации показаний ЭКГ с традиционными обозначениями зубцов (А) и методика измерения с целью углубленного изучения и нацеленного применения (Б).
Обозначения: P1 – ширина основания зубца Р (мм); Р2 - ширина вершины зубца Р (мм); РН - высота зубца Р (мм); PQ – продолжительность сегмента PQ (мм); ∆ST – степень депрессии сегмента ST (мм), измеряемая в точке, отстоящей на 0.07 сек от окончания комплекса QRS, HR – частота сердечных сокращений.
Пусть заданы следующие показатели, снятые у 10 пациентов:
Произведем нормирование данных:
В качестве меры расстояния возьмем квадрат евклидовой метрикиdij2. и вычислим матрицу D = {dij2}, где dij2 - квадрат расстояния между Ι i и Ι j:
Найдем минимальное расстояние в матрице: min{dij2, i ¹ j} = 1.47 при i = 1, j = 3. Образуем с помощью Ι i и Ι j новый кластер {Ι i , Ι j}. Построим новую матрицу расстояния:
dij
{1+3}
{1+3}
2.8
3.88
5.36
2.44
3.34
2.72
3.61
3.59
2.26
4.3
3.37
3.77
2.14
2.8
4.29
3.65
3.83
4.66
3.28
1.64
1.8
3.61
4.53
5.29
4.14
4.26
3.28
4.27
3.99
4.03
3.52
4.36
4.63
2.65
2.96
1.52
Расстояние между кластером i + j и некоторым другим кластером k равно минимальному из этих двух расстояний:
di+j,k = min (di k + dj k).
Последующие шаги аналогичны.
Получим следующую последовательность разбиений:
1, 2, 3, 4, 5, 6, 7, 8, 9, 10 min(dij) =1.47
2, 4, 5, 6, 7, 8, 9, 10 min(dij) =1.52
2, 4, 5, 6, 7, 8, min(dij) =1.64
2, , 5, 6, 7, 8 min(dij) =2.14
, , 5, 6, 7 min(dij) =2.26
( ) ( ), 5, 6, 7 min(dij) =2.44
( ) 6, ( ) ( ), 5, 7 min(dij) =2.72
(( ) 6) (( ) ( )),5,7 min(dij) =3.28
((( ) 6) (( ) ( ))) 7, 5 min(dij) =3.61
(((( ) 6) (( ) ( ))) 7) 5
Дендрограмма представлена на рис. 3.
1 3 6 2 8 4 9 10 7 5
Рис. 3
На основании полученной дендрограммы можно разбить исходную выборку примерно на два основных кластера (по значению минимального расстояния min(dij) 2.6): (1, 3, 6) и (2, 8, 4, 9, 10). Это говорит о том, что в данной выборке (из 10 больных) присутствуют два различных заболевания (например, желудочковая экстрасистолия и ишемическая дисфункция левого желудочка).
Пример решения в программе SPSS 11.0
1) Запустите программу SPSS 11.
2) Выберите в меню Fail… (файл) New… (новый) Data… (данные)
3) Заполните матрицу данных предварительно нормированными значениями в соответствии с вариантом. В панели данных введите заданные данные, а в панели вид переменной задайте имя и тип переменной.
4) Выберите в меню Analyze (Анализ) Classify (Классифицировать) Hierarchical Cluster... (Иерархический кластерный анализ). Перенесите значения (p1,p2,ph,pq,hr,st)в поле переменных.
5) В меню статистика поставьте галочку в поле proximity matrix и нажмите кнопку продолжить.
6) В меню графики поставьте галочку в поле dendrogram и выберите положение дендрограммы (вертикальное или горизонтальное) и нажмите кнопку продолжить.
7) В меня метод выберите способ расчета расстояния(в нашем случае евклидово растояние), и метод кластерного анализа (в нашем случае ближайший сосед) и нажмите кнопку продолжить.
8) Ничего больше не меняя, начните расчет нажатием кнопки ОК.
Вывод основных результатов выглядит следующим образом:
_
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *
Dendrogram using Single Linkage
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
Результат соответствует результатам, полученным в программе MathCAD.
Пример решения в программе STATISTICA
1) Запустите программу STATICTICA 6.0
2) Выберите в меню Файл…Новый…создайте таблицу данных.
3) Заполните матрицу данных нормированными значениями, заданными в соответствии с вариантом.
4) Выберите в меню Статистика…Многомерные исследовательские методы…Анализ кластера…Joining(Tree clustering). Далее в меню Variables выделите значения и нажмите кнопку ОК.
5) В меню Advanced выберитеспособ расчета расстояния метод кластерного анализа и нажмите кнопку ОК.
6) В полученном окне выбираем Distance matrix.
И получаем матрицу расстояний:
При нажатии кнопки Horizontal hierarchical tree plots получаем дендрограмму
Результат соответствует результатам, полученным в программе MathCAD и SPSS.