1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
*(Вопрос) С помощью иерархического кластерного анализа нам нужно кластеризовать около 60 фотографий.
Фотографии были предварительно сгруппированы каждым из 100 опрошенных людей по 10 группам по их схожести.
В результате мы имеем матрицу схожести, содержащую число раз когда та или иная фотография попала в одну группу с той или иной фотографией.
В примере данных ниже фотография A 6 раз определялась участниками в одну группу с фотографией B. 

Как нам подать эти данные на вход кластерного анализа и получить дендрограмму и 
таблицу классификации на выходе?

*(Ответ) размещён в SPSSX-L 12.10.2001. Автор: Jelani Mandara.

DATA LIST FREE /ROWTYPE_(a8) VARNAME_(a8) a b c d e f g h.
BEGIN DATA
PROX     A    0 6 2 7 18 0 1 5
PROX     B    6 0 14 3 8 4 19 14
PROX     C    2 14 0 30 12 4 6 8
PROX     D    7 3 30 0 1 16 3 4
PROX     E    18 8 12 1 0 19 13 14
PROX     F    0 4 4 16 19 0 5 1
PROX     G    1 19 6 3 13 5 0 16
PROX     H    5 14 8 4 14 1 16 0
END DATA.
EXECUTE.

SAVE OUTFILE='C:\\temp\\photoproximities.sav'.

* Строка ниже добавлена А.Б. Необходимо пометить значение PROX в матрице схожести ключевым словом SIMILARITY, чтобы указать последующей команде CLUSTER, что матрица содержит меры схожести, а не различий. По умолчанию команда CLUSTER работает с матрицами схожести как с матрицами расстояний.

VALUE LABELS ROWTYPE_ 'PROX' 'SIMILARITY'.

CLUSTER
  /MATRIX IN  (*)
  /METHOD BAVERAGE
  /PRINT CLUSTER(2,8)
  /PRINT SCHEDULE
  /PRINT DISTANCE
  /PLOT DENDROGRAM VICICLE.