Кластерный анализ с матрицей схожести (частотами) на входе
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 | *(Вопрос) С помощью иерархического кластерного анализа нам нужно кластеризовать около 60 фотографий. Фотографии были предварительно сгруппированы каждым из 100 опрошенных людей по 10 группам по их схожести. В результате мы имеем матрицу схожести, содержащую число раз когда та или иная фотография попала в одну группу с той или иной фотографией. В примере данных ниже фотография A 6 раз определялась участниками в одну группу с фотографией B. Как нам подать эти данные на вход кластерного анализа и получить дендрограмму и таблицу классификации на выходе? *(Ответ) размещён в SPSSX-L 12.10.2001. Автор: Jelani Mandara. DATA LIST FREE /ROWTYPE_(a8) VARNAME_(a8) a b c d e f g h. BEGIN DATA PROX A 0 6 2 7 18 0 1 5 PROX B 6 0 14 3 8 4 19 14 PROX C 2 14 0 30 12 4 6 8 PROX D 7 3 30 0 1 16 3 4 PROX E 18 8 12 1 0 19 13 14 PROX F 0 4 4 16 19 0 5 1 PROX G 1 19 6 3 13 5 0 16 PROX H 5 14 8 4 14 1 16 0 END DATA. EXECUTE. SAVE OUTFILE='C:\\temp\\photoproximities.sav'. * Строка ниже добавлена А.Б. Необходимо пометить значение PROX в матрице схожести ключевым словом SIMILARITY, чтобы указать последующей команде CLUSTER, что матрица содержит меры схожести, а не различий. По умолчанию команда CLUSTER работает с матрицами схожести как с матрицами расстояний. VALUE LABELS ROWTYPE_ 'PROX' 'SIMILARITY'. CLUSTER /MATRIX IN (*) /METHOD BAVERAGE /PRINT CLUSTER(2,8) /PRINT SCHEDULE /PRINT DISTANCE /PLOT DENDROGRAM VICICLE. |
Related pages
...