L’analisi dei gruppi
(cluster analysis)
Stefano Nobile
Storia brevissima
• Storia brevissima
• La cluster analysis nasce nel 1939 per opera di Tyron,
che per primo la presentò come una variante dell’analisi
fattoriale.
• Grazie al lavoro di due biologi – Sokal e Sneath – la
cluster analysis riceve un forte impulso negli anni
sessanta.
• Nello stesso periodo, Ward (1963) elabora la sua
tecnica di clustering a partire da un problema di
classificazione di posizioni occupazionali.
• Ancora negli anni sessanta, Johnson lavora alla cluster,
concependola coma una procedura utile per
rappresentare la struttura della matrice di similarità fra i
casi.
Concetti chiave
Similarità e distanza
Sotto il profilo tecnico, i concetti di similarità e di distanza sono centrali per
l'analisi della composizione dei gruppi.
Questi due concetti si trovano in relazione inversa: ad una maggiore similarità
corrisponde una minore distanza.
A rigore, il concetto di distanza può essere impiegato soltanto nel caso di
variabili cardinali. Esso viene riferito alla distanza euclidea.
d = (X1 – X2)2 + (Y1 – Y2)2
Generalizzando, per uno spazio N-dimensionale, essa diventa:
v
dij =  S (Xik - Xjk)2
k=1
Questa distanza è nota anche come distanza di Manhattan.
La distanza tra casi può essere calcolata anche attraverso altre misure, come
la distanza di Mahalanobis e la distanza di Minkovski.
Occorre distinguere le diverse misure di similarità/distanza in ragione del tipo di
variabili impiegate nell’analisi.
Per variabili ad intervalli, le distanze sono:
•la distanza euclidea
•la distanza euclidea al quadrato
•la similarità calcolata col coseno
•la similarità calcolata col coefficiente di correlazione di Pearson
•la distanza di Chebycev
•la distanza assoluta (city-Block o Manhattan)
•la distanza di Minkowski
•la distanza di Minkowski generalizzata (customized)
Per variabili categoriali non ordinate, le distanze sono:
•la distanza del chi-quadrato
•la distanza del phi-quadrato
Per variabili dicotomiche, le distanze sono:
•la distanza euclidea
•la distanza euclidea al quadrato
•la distanza di dimensione (size)
•la distanza di pattern
•la varianza
•la forma
•la distanza di Lance e Williams
Figura 1 - Calcolo della distanza tra due casi rispetto a variabili
aventi metrica diversa – valori non standardizzati
3
Nu
me
ro
di
figl
i
2
30
Età
40
50
60
Figura 2 - Calcolo della distanza tra due casi rispetto a
variabili aventi metrica diversa – valori standardizzati
,8
,6
,4
Zscore: Numero di figli
,2
0,0
-,2
-,4
-,6
-,8
-,8
-,6
-,4
-,2
0,0
,2
,4
,6
,8
Zscore: Età
Quando diverge la metrica delle variabili che si adottano per la cluster, è
necessario standardizzare le variabili, in modo da non introdurre effetti
distorsivi indotti dalla stessa differenza di metrica (Figura 1 e Figura 2).
Il discorso cambia se si fa invece riferimento a variabili categoriali. In
questo caso, non si parlerà più di distanza, ma di dissimilarità.
Anche per la dissimilarità esistono vari indici per poter calcolare la
somiglianza dei profili relativi a due individui.
Partizioni e ricoprimenti
• Una partizione è «una suddivisione dell’insieme
originario in K sottoinsiemi a due a due disgiunti
e tali da esaurire l’insieme originario (ogni
oggetto appartiene ad uno ed un solo
sottoinsieme)» (Ricolfi, 1992, p.31)
• Un ricoprimento, invece, «è una suddivisione
dell’insieme originario in K sottoinsiemi che
esauriscono l’insieme originario ma possono
anche essere più o meno sovrapposti fra loro»
(Ricolfi, 1992, p.31)
Le tecniche di clustering
Le tecniche di Cluster Analysis sono
riconducibili a tre grandi famiglie:
Cluster analysis
Tecniche di
Classificazione
gerarchica
Tecniche basate
sulle
partizioni
ripetute
Tecniche di
overlapping
clustering
Le tecniche di classificazione gerarchica
La famiglia delle tecniche di classificazione
gerarchica si suddivide, a sua volta, in due
generi:
• Quelle basate sugli algoritmi aggregativi
• Quelle basate sugli algoritmi scissori
Le tecniche basate sugli algoritmi aggregativi
Queste tecniche procedono raggruppando i casi ad uno ad uno, fino ad
arrivare ad n-1 aggregazioni.
Le tecniche di aggregazione possono essere diverse e cioè:
La tecnica del legame singolo (nearest neighbor) consiste nel
raggruppare i casi che presentano la minore distanza e
successivamente nell'utilizzare come referente della distanza il caso più
vicino a quello del nuovo caso da aggregare
La tecnica del legame completo (furthest neighbor) riunisce invece i
casi che sono più vicini rispetto ai casi più lontani di ciascuno dei gruppi
che si sono formati
La tecnica del legame medio (waverage linkage) richiede che la distanza tra
due gruppi si computi sulla base della media aritmetica delle distanze tra il caso
da aggregare e i gruppi che sono già stati formati
La tecnica del centroide (centroid clustering) fa riferimento al
baricentro del gruppo. La distanza non è più calcolata in base alla
media (o alla mediana) del caso da tutti i casi del gruppo, bensì in base
al baricentro (centroide) del gruppo.
La tecnica di Ward (Ward’s method) non fa altro che aggregare casi in modo tale
da ottenere, ad ogni passaggio, il minimo incremento possibile della varianza
all'interno di ciascun gruppo.
La trasformazione dei valori
Per la trasformazione dei valori sono disponibili le seguenti alternative:
• Punteggi Z: è la normale procedura di standardizzazione, che genera
punteggi standard z, ovvero: z = (x-Media)/Deviazione Standard;
• Ampiezza massima di 1: la procedura divide il valore della variabile per il
valore massimo, in modo tale che il valore massimo ottenibile sia i ovvero: y
= x/Max;
• Media di 1: la procedura standardizza i valori in modo che la loro media sia
uguale a 1. I valori di una variabile sono divisi per la media della variabile,
ovvero: y = x/Media;
• Deviazione standard di 1: i valori di una variabile sono divisi per la
deviazione standard, ovvero: y = x/Deviazione Standard;
• Intervallo da —1 a 1: la procedura trasforma i valori in modo che l’intervallo
di variazione sia compreso tra —i e i. I valori di una variabile sono divisi per
l’intervallo di variazione della variabile, ovvero: y = x/(Max — Mm);
• Intervallo da 0 a 1: sottrae dal valore di una variabile il valore minimo e
divide il risultato per l’intervallo, ovvero: y = (x — Min)/(Max — Mm).
Cosa accade in matrice
X1
X2
a
1
1
b
1
2
c
6
3
d
8
2
e
8
0
a
a
b
c
d
e
b
0
c
d
e
1
29
50
50
0
26
49
53
0
5
13
0
4
0
ad esempio, infatti, la distanza tra a ed e è:
(1 - 8)2 + (1 - 0)2 = 50
da cui deriva:
X1
X2
(a, b)
1
1,5
c
6
3
d
8
2
e
8
0
e, da questa, la nuova matrice delle distanze:
(a, b)
(a, b)
c
d
e
c
0
d
e
27,25
49,25
51,25
0
5
13
0
4
0
Le tecniche del legame singolo e del legame completo possono fare riferimento
sia a misure di similarità che di distanza. Le tecniche di Ward e del legame medio
possono invece fare riferimento alle sole misure di distanza.
Il confronto tra le diverse tecniche, su un vecchio data-base
elettorale, produce queste visibili differenze:
(legame singolo)
(legame completo)
(legame medio)
(Ward)
Le tecniche basate sugli algoritmi scissori
Queste tecniche, pur essendo più ricche «di proprietà matematiche,
hanno un carattere meno empirico dei metodi aggregativi, basandosi
su note proprietà statistiche della suddivisione della matrice delle
devianze e codevianze» (Rizzi, 1985, p. 89). Tuttavia, esse – a causa
della complessità dei calcoli richiesti – trovano scarso impiego
all’interno della ricerca.
Le tecniche basate sugli algoritmi scissori si distinguono in due classi:
I metodi monotetici, che realizzano la suddivisione dei gruppi
basandosi sui valori assunti da una sola variabile.
I metodi politetici, che prendono in considerazione i valori assunti da
tutte le variabili prescelte per la classificazione.
Il metodo divisivo più noto è quello di Edwards - Cavalli Sforza.
Il criterio seguito è quello di esaminare ad ogni stadio tutte le possibili
suddivisioni in due parti di tutti i gruppi. Verrà operata la divisione che
fa diminuire maggiormente la varianza entro i gruppi.
L’applicazione di questo metodo divisivo
porta a risultati come il seguente:
(legame singolo)
Le tecniche a partizioni ripetute
Rispetto alle precedenti, le tecniche di clustering basate
sulle partizioni ripetute presentano il vantaggio di poter
lavorare su numeri assai elevati di casi. Questo vantaggio
viene controbilanciato dalla necessità di dovere stabilire a
priori il numero di gruppi da formare.
Questo svantaggio può essere parzialmente superato
attraverso lo spostamento – effettuato in ragione di
differenti criteri – dei casi da un gruppo all'altro.
I criteri per lo spostamento dei casi sono tre:
•Le k-medie
•Le nubi dinamiche
•l'ottimizzazione di una funzione obiettivo
Le k-medie
Le k-medie fanno riferimento, per la
classificazione, alle coordinate dei centroidi
dei diversi gruppi.
Le nubi dinamiche
Le nubi dinamiche prendono invece come
riferimento un nucleo iniziale, o "seme",
attorno al quale vanno poi raccogliendosi i
casi con una somiglianza maggiore.
Le funzioni-obiettivo
Le funzioni obiettivo cercano infine di realizzare
gli spostamenti fra un gruppo e l'altro dei singoli
casi senza uno specifico riferimento a
considerazioni geometriche relative ad una
funzione di distanza. Esse tengono piuttosto conto
delle modifiche che si ottengono nei valori di tale
funzione. A partire dalla funzione iniziale, vengono
effettuati solo gli spostamenti di oggetti da un
gruppo all'altro che migliorano (nel senso previsto)
la funzione obiettivo. Il processo termina quando
non si ottengono più miglioramenti significativi
attraverso un intero ciclo di riclassificazione.
Esempi
Classificazione gerarchica: matrice delle distanze
1.1.1.1.1.1.1.1.1.
1.1.1.1.1.1.1.1.2.
Squared Euclidean Distance
1.1.1.1.1.1.1.1.3.
C
1.1.1.1.1.1.1.1.7.
1.1.1.1.1.1.1.1.8.
4
51.1.1.1.1.1.1.1.10.
71.1.1.1.1.1.1.1.12.
1.1.1.1.1.1.1.1.13.
91.1.1.1.1.1.1.1.14.
11.1.1.1.1.1.1.1.15.
11.1.1.1.1.1.1.1.16.
1
1
1.1.1.1.1.1.1.1.19.
1.1.1.1.1.1.1.1.20.
11.1.1.1.1.1.1.1.21.
11.1.1.1.1.1.1.1.22.
1
1.1.1.1.1.1.1.1.4.
1.1.1.1.1.1.1.1.5.
11.1.1.1.1.1.1.1.6.
2
3
1.1.1.1.1.1.1.1.9.
61.1.1.1.1.1.1.1.11.
8
1.1.1.1.1.1.1.1.17.
1.1.1.1.1.1.1.1.18.
1
1
ase
:Dalmaz :Ermann
:Gioacch
:Immaco 0:Lambe 1:Mercu 2:Nestor 3:Osvald
6:Rosari 7:Santin 8:Temist 9:Umber
:Aurora :Beatrice :Ciriaco
:Fatima
:Heather
4:Piera 5:Quinto
io
o
ino
lata
rto
zio
e
o
o
a
ocle
to
1.1.1.1.1.1.1.1.23.
1.1.1.1.1.1.1.1.24.
1
1.1.1.1.1.1.1.1.25.
1.1.1.1.1.1.1.1.26.
21.1.1.1.1.1.1.1.27.
81.1.1.1.1.1.1.1.28.
21.1.1.1.1.1.1.1.29.
51.1.1.1.1.1.1.1.30.
31.1.1.1.1.1.1.1.31.
,1.1.1.1.1.1.1.1.32.
51.1.1.1.1.1.1.1.33.
31.1.1.1.1.1.1.1.34.
51.1.1.1.1.1.1.1.35.
11.1.1.1.1.1.1.1.36.
31.1.1.1.1.1.1.1.37.
11.1.1.1.1.1.1.1.38.
,1.1.1.1.1.1.1.1.39.
61.1.1.1.1.1.1.1.40.
41.1.1.1.1.1.1.1.41.
31.1.1.1.1.1.1.1.42.
5
:Aurora
,656
,331
,388
,362
,773
989
,452
,847
,004
0,249
,708
,098
403
,171
,463
,207
,091
,973
1.1.1.1.1.1.1.1.43.
1.1.1.1.1.1.1.1.44.
2
1.1.1.1.1.1.1.1.45.
21.1.1.1.1.1.1.1.46.
1.1.1.1.1.1.1.1.47.
21.1.1.1.1.1.1.1.48.
71.1.1.1.1.1.1.1.49.
21.1.1.1.1.1.1.1.50.
11.1.1.1.1.1.1.1.51.
21.1.1.1.1.1.1.1.52.
81.1.1.1.1.1.1.1.53.
41.1.1.1.1.1.1.1.54.
31.1.1.1.1.1.1.1.55.
11.1.1.1.1.1.1.1.56.
11.1.1.1.1.1.1.1.57.
,1.1.1.1.1.1.1.1.58.
41.1.1.1.1.1.1.1.59.
81.1.1.1.1.1.1.1.60.
61.1.1.1.1.1.1.1.61.
31.1.1.1.1.1.1.1.62.
9
:Beatrice
,656
,591
,182
,094
0,695
,514
,755
,422
,786
5,871
0,094
778
,515
,580
,464
,077
,779
,594
1.1.1.1.1.1.1.1.63.
1.1.1.1.1.1.1.1.64.
3
1.1.1.1.1.1.1.1.65.
81.1.1.1.1.1.1.1.66.
21.1.1.1.1.1.1.1.67.
1.1.1.1.1.1.1.1.68.
11.1.1.1.1.1.1.1.69.
51.1.1.1.1.1.1.1.70.
11.1.1.1.1.1.1.1.71.
81.1.1.1.1.1.1.1.72.
11.1.1.1.1.1.1.1.73.
61.1.1.1.1.1.1.1.74.
61.1.1.1.1.1.1.1.75.
11.1.1.1.1.1.1.1.76.
11.1.1.1.1.1.1.1.77.
51.1.1.1.1.1.1.1.78.
11.1.1.1.1.1.1.1.79.
81.1.1.1.1.1.1.1.80.
71.1.1.1.1.1.1.1.81.
71.1.1.1.1.1.1.1.82.
1
:Ciriaco
,331
,591
0,669
,554
6,823
,631
0,941
,808
,550
6,048
4,496
,627
0,277
,877
,918
,628
4,844
0,055
1.1.1.1.1.1.1.1.83.
1.1.1.1.1.1.1.1.84.
4
1.1.1.1.1.1.1.1.85.
21.1.1.1.1.1.1.1.86.
71.1.1.1.1.1.1.1.87.
11.1.1.1.1.1.1.1.88.
1.1.1.1.1.1.1.1.89.
11.1.1.1.1.1.1.1.90.
11.1.1.1.1.1.1.1.91.
41.1.1.1.1.1.1.1.92.
11.1.1.1.1.1.1.1.93.
61.1.1.1.1.1.1.1.94.
61.1.1.1.1.1.1.1.95.
21.1.1.1.1.1.1.1.96.
,1.1.1.1.1.1.1.1.97.
51.1.1.1.1.1.1.1.98.
11.1.1.1.1.1.1.1.99.
11.1.1.1.1.1.1.1.100.
41.1.1.1.1.1.1.1.101.
51.1.1.1.1.1.1.1.102.
2
:Dalmazio
,388
,182
0,669
0,088
,256
,156
,976
,555
,503
,896
352
,235
,112
,985
,653
,735
,903
,593
1.1.1.1.1.1.1.1.103.
1.1.1.1.1.1.1.1.104.
5
1.1.1.1.1.1.1.1.105.
51.1.1.1.1.1.1.1.106.
21.1.1.1.1.1.1.1.107.
51.1.1.1.1.1.1.1.108.
11.1.1.1.1.1.1.1.109.
1.1.1.1.1.1.1.1.110.
11.1.1.1.1.1.1.1.111.
21.1.1.1.1.1.1.1.112.
81.1.1.1.1.1.1.1.113.
11.1.1.1.1.1.1.1.114.
11.1.1.1.1.1.1.1.115.
11.1.1.1.1.1.1.1.116.
11.1.1.1.1.1.1.1.117.
11.1.1.1.1.1.1.1.118.
61.1.1.1.1.1.1.1.119.
91.1.1.1.1.1.1.1.120.
11.1.1.1.1.1.1.1.121.
11.1.1.1.1.1.1.1.122.
7
:Ermanno
,362
,094
,554
0,088
1,350
,439
,072
2,177
,193
7,950
2,275
,784
,732
,195
4,547
,049
,789
,221
1.1.1.1.1.1.1.1.123.
1.1.1.1.1.1.1.1.124.
6
1.1.1.1.1.1.1.1.125.
31.1.1.1.1.1.1.1.126.
11.1.1.1.1.1.1.1.127.
11.1.1.1.1.1.1.1.128.
11.1.1.1.1.1.1.1.129.
11.1.1.1.1.1.1.1.130.
1.1.1.1.1.1.1.1.131.
41.1.1.1.1.1.1.1.132.
21.1.1.1.1.1.1.1.133.
11.1.1.1.1.1.1.1.134.
61.1.1.1.1.1.1.1.135.
41.1.1.1.1.1.1.1.136.
,1.1.1.1.1.1.1.1.137.
61.1.1.1.1.1.1.1.138.
11.1.1.1.1.1.1.1.139.
31.1.1.1.1.1.1.1.140.
11.1.1.1.1.1.1.1.141.
51.1.1.1.1.1.1.1.142.
1
:Fatima
,773
0,695
6,823
,256
1,350
,320
,075
2,092
,959
,152
480
,880
,724
,500
0,092
,740
,199
,049
1.1.1.1.1.1.1.1.143.
1.1.1.1.1.1.1.1.144.
7
1.1.1.1.1.1.1.1.145.
,1.1.1.1.1.1.1.1.146.
21.1.1.1.1.1.1.1.147.
81.1.1.1.1.1.1.1.148.
41.1.1.1.1.1.1.1.149.
21.1.1.1.1.1.1.1.150.
41.1.1.1.1.1.1.1.151.
1.1.1.1.1.1.1.1.152.
41.1.1.1.1.1.1.1.153.
71.1.1.1.1.1.1.1.154.
21.1.1.1.1.1.1.1.155.
11.1.1.1.1.1.1.1.156.
51.1.1.1.1.1.1.1.157.
,1.1.1.1.1.1.1.1.158.
11.1.1.1.1.1.1.1.159.
61.1.1.1.1.1.1.1.160.
91.1.1.1.1.1.1.1.161.
,1.1.1.1.1.1.1.1.162.
3
:Gioacchino
989
,514
,631
,156
,439
,320
,853
,849
,261
2,018
,260
529
,377
,380
,049
846
,675
,579
1.1.1.1.1.1.1.1.163.
1.1.1.1.1.1.1.1.164.
8
1.1.1.1.1.1.1.1.165.
51.1.1.1.1.1.1.1.166.
81.1.1.1.1.1.1.1.167.
11.1.1.1.1.1.1.1.168.
11.1.1.1.1.1.1.1.169.
81.1.1.1.1.1.1.1.170.
21.1.1.1.1.1.1.1.171.
41.1.1.1.1.1.1.1.172.
1.1.1.1.1.1.1.1.173.
11.1.1.1.1.1.1.1.174.
31.1.1.1.1.1.1.1.175.
21.1.1.1.1.1.1.1.176.
11.1.1.1.1.1.1.1.177.
61.1.1.1.1.1.1.1.178.
31.1.1.1.1.1.1.1.179.
,1.1.1.1.1.1.1.1.180.
11.1.1.1.1.1.1.1.181.
31.1.1.1.1.1.1.1.182.
,
:Heather
,452
,755
0,941
,976
,072
,075
,853
3,181
,442
,390
,886
,575
,582
464
0,995
,961
885
,112
1.1.1.1.1.1.1.1.183.
1.1.1.1.1.1.1.1.184.
9
1.1.1.1.1.1.1.1.185.
31.1.1.1.1.1.1.1.186.
41.1.1.1.1.1.1.1.187.
61.1.1.1.1.1.1.1.188.
61.1.1.1.1.1.1.1.189.
11.1.1.1.1.1.1.1.190.
11.1.1.1.1.1.1.1.191.
71.1.1.1.1.1.1.1.192.
11.1.1.1.1.1.1.1.193.
1.1.1.1.1.1.1.1.194.
11.1.1.1.1.1.1.1.195.
11.1.1.1.1.1.1.1.196.
91.1.1.1.1.1.1.1.197.
51.1.1.1.1.1.1.1.198.
51.1.1.1.1.1.1.1.199.
11.1.1.1.1.1.1.1.200.
,1.1.1.1.1.1.1.1.201.
11.1.1.1.1.1.1.1.202.
1
:Immacolata
,847
,422
,808
,555
2,177
2,092
,849
3,181
3,214
5,244
,620
,607
,505
1,590
678
1,495
5,521
1,638
1.1.1.1.1.1.1.1.203.
1.1.1.1.1.1.1.1.204.
1
1.1.1.1.1.1.1.1.205.
51.1.1.1.1.1.1.1.206.
31.1.1.1.1.1.1.1.207.
61.1.1.1.1.1.1.1.208.
61.1.1.1.1.1.1.1.209.
11.1.1.1.1.1.1.1.210.
61.1.1.1.1.1.1.1.211.
21.1.1.1.1.1.1.1.212.
31.1.1.1.1.1.1.1.213.
11.1.1.1.1.1.1.1.214.
1.1.1.1.1.1.1.1.215.
11.1.1.1.1.1.1.1.216.
71.1.1.1.1.1.1.1.217.
21.1.1.1.1.1.1.1.218.
51.1.1.1.1.1.1.1.219.
41.1.1.1.1.1.1.1.220.
11.1.1.1.1.1.1.1.221.
,1.1.1.1.1.1.1.1.222.
3
0:Lamberto
,004
,786
,550
,503
,193
,959
,261
,442
3,214
1,054
,718
,678
,030
,497
3,872
408
,503
,476
1.1.1.1.1.1.1.1.223.
1.1.1.1.1.1.1.1.224.
1
1.1.1.1.1.1.1.1.225.
11.1.1.1.1.1.1.1.226.
11.1.1.1.1.1.1.1.227.
11.1.1.1.1.1.1.1.228.
21.1.1.1.1.1.1.1.229.
11.1.1.1.1.1.1.1.230.
41.1.1.1.1.1.1.1.231.
11.1.1.1.1.1.1.1.232.
21.1.1.1.1.1.1.1.233.
11.1.1.1.1.1.1.1.234.
11.1.1.1.1.1.1.1.235.
1.1.1.1.1.1.1.1.236.
21.1.1.1.1.1.1.1.237.
11.1.1.1.1.1.1.1.238.
71.1.1.1.1.1.1.1.239.
11.1.1.1.1.1.1.1.240.
11.1.1.1.1.1.1.1.241.
11.1.1.1.1.1.1.1.242.
4
1:Mercuzio
0,249
5,871
6,048
,896
7,950
,152
2,018
,390
5,244
1,054
,420
3,923
,318
,571
0,859
1,941
,972
,317
1.1.1.1.1.1.1.1.243.
1.1.1.1.1.1.1.1.244.
1
1.1.1.1.1.1.1.1.245.
31.1.1.1.1.1.1.1.246.
11.1.1.1.1.1.1.1.247.
11.1.1.1.1.1.1.1.248.
,1.1.1.1.1.1.1.1.249.
11.1.1.1.1.1.1.1.250.
,1.1.1.1.1.1.1.1.251.
51.1.1.1.1.1.1.1.252.
11.1.1.1.1.1.1.1.253.
91.1.1.1.1.1.1.1.254.
71.1.1.1.1.1.1.1.255.
21.1.1.1.1.1.1.1.256.
1.1.1.1.1.1.1.1.257.
71.1.1.1.1.1.1.1.258.
11.1.1.1.1.1.1.1.259.
21.1.1.1.1.1.1.1.260.
71.1.1.1.1.1.1.1.261.
61.1.1.1.1.1.1.1.262.
2
2:Nestore
,708
0,094
4,496
352
2,275
480
,260
,886
,620
,718
,420
,193
,763
,383
,168
,840
,226
,802
1.1.1.1.1.1.1.1.263.
1.1.1.1.1.1.1.1.264.
1
1.1.1.1.1.1.1.1.265.
11.1.1.1.1.1.1.1.266.
,1.1.1.1.1.1.1.1.267.
51.1.1.1.1.1.1.1.268.
51.1.1.1.1.1.1.1.269.
11.1.1.1.1.1.1.1.270.
61.1.1.1.1.1.1.1.271.
,1.1.1.1.1.1.1.1.272.
61.1.1.1.1.1.1.1.273.
51.1.1.1.1.1.1.1.274.
21.1.1.1.1.1.1.1.275.
11.1.1.1.1.1.1.1.276.
71.1.1.1.1.1.1.1.277.
1.1.1.1.1.1.1.1.278.
21.1.1.1.1.1.1.1.279.
71.1.1.1.1.1.1.1.280.
71.1.1.1.1.1.1.1.281.
11.1.1.1.1.1.1.1.282.
6
3:Osvaldo
,098
778
,627
,235
,784
,880
529
,575
,607
,678
3,923
,193
,257
,412
,357
,424
,238
,103
1.1.1.1.1.1.1.1.283.
1.1.1.1.1.1.1.1.284.
1
1.1.1.1.1.1.1.1.285.
,1.1.1.1.1.1.1.1.286.
41.1.1.1.1.1.1.1.287.
11.1.1.1.1.1.1.1.288.
11.1.1.1.1.1.1.1.289.
61.1.1.1.1.1.1.1.290.
11.1.1.1.1.1.1.1.291.
11.1.1.1.1.1.1.1.292.
31.1.1.1.1.1.1.1.293.
51.1.1.1.1.1.1.1.294.
51.1.1.1.1.1.1.1.295.
71.1.1.1.1.1.1.1.296.
11.1.1.1.1.1.1.1.297.
21.1.1.1.1.1.1.1.298.
1.1.1.1.1.1.1.1.299.
41.1.1.1.1.1.1.1.300.
51.1.1.1.1.1.1.1.301.
31.1.1.1.1.1.1.1.302.
3
4:Piera
403
,515
0,277
,112
,732
,724
,377
,582
,505
,030
,318
,763
,257
,469
,217
,410
,123
,976
1.1.1.1.1.1.1.1.303.
1.1.1.1.1.1.1.1.304.
1
1.1.1.1.1.1.1.1.305.
61.1.1.1.1.1.1.1.306.
81.1.1.1.1.1.1.1.307.
81.1.1.1.1.1.1.1.308.
11.1.1.1.1.1.1.1.309.
91.1.1.1.1.1.1.1.310.
31.1.1.1.1.1.1.1.311.
61.1.1.1.1.1.1.1.312.
,1.1.1.1.1.1.1.1.313.
11.1.1.1.1.1.1.1.314.
41.1.1.1.1.1.1.1.315.
11.1.1.1.1.1.1.1.316.
21.1.1.1.1.1.1.1.317.
71.1.1.1.1.1.1.1.318.
41.1.1.1.1.1.1.1.319.
1.1.1.1.1.1.1.1.320.
91.1.1.1.1.1.1.1.321.
51.1.1.1.1.1.1.1.322.
2
5:Quinto
,171
,580
,877
,985
,195
,500
,380
464
1,590
,497
,571
,383
,412
,469
,049
,454
,597
,453
1.1.1.1.1.1.1.1.323.
1.1.1.1.1.1.1.1.324.
1
1.1.1.1.1.1.1.1.325.
41.1.1.1.1.1.1.1.326.
61.1.1.1.1.1.1.1.327.
71.1.1.1.1.1.1.1.328.
41.1.1.1.1.1.1.1.329.
11.1.1.1.1.1.1.1.330.
11.1.1.1.1.1.1.1.331.
91.1.1.1.1.1.1.1.332.
11.1.1.1.1.1.1.1.333.
,1.1.1.1.1.1.1.1.334.
11.1.1.1.1.1.1.1.335.
11.1.1.1.1.1.1.1.336.
71.1.1.1.1.1.1.1.337.
71.1.1.1.1.1.1.1.338.
51.1.1.1.1.1.1.1.339.
91.1.1.1.1.1.1.1.340.
1.1.1.1.1.1.1.1.341.
11.1.1.1.1.1.1.1.342.
1
6:Rosario
,463
,464
,918
,653
4,547
0,092
,049
0,995
678
3,872
0,859
,168
,357
,217
,049
2,570
3,947
1,065
1.1.1.1.1.1.1.1.343.
1.1.1.1.1.1.1.1.344.
1
1.1.1.1.1.1.1.1.345.
31.1.1.1.1.1.1.1.346.
31.1.1.1.1.1.1.1.347.
71.1.1.1.1.1.1.1.348.
51.1.1.1.1.1.1.1.349.
11.1.1.1.1.1.1.1.350.
51.1.1.1.1.1.1.1.351.
,1.1.1.1.1.1.1.1.352.
31.1.1.1.1.1.1.1.353.
11.1.1.1.1.1.1.1.354.
,1.1.1.1.1.1.1.1.355.
11.1.1.1.1.1.1.1.356.
61.1.1.1.1.1.1.1.357.
11.1.1.1.1.1.1.1.358.
31.1.1.1.1.1.1.1.359.
51.1.1.1.1.1.1.1.360.
11.1.1.1.1.1.1.1.361.
1.1.1.1.1.1.1.1.362.
3
7:Santina
,207
,077
,628
,735
,049
,740
846
,961
1,495
408
1,941
,840
,424
,410
,454
2,570
,198
,142
1.1.1.1.1.1.1.1.363.
1.1.1.1.1.1.1.1.364.
1
1.1.1.1.1.1.1.1.365.
51.1.1.1.1.1.1.1.366.
91.1.1.1.1.1.1.1.367.
11.1.1.1.1.1.1.1.368.
21.1.1.1.1.1.1.1.369.
71.1.1.1.1.1.1.1.370.
11.1.1.1.1.1.1.1.371.
31.1.1.1.1.1.1.1.372.
,1.1.1.1.1.1.1.1.373.
11.1.1.1.1.1.1.1.374.
31.1.1.1.1.1.1.1.375.
41.1.1.1.1.1.1.1.376.
21.1.1.1.1.1.1.1.377.
61.1.1.1.1.1.1.1.378.
31.1.1.1.1.1.1.1.379.
21.1.1.1.1.1.1.1.380.
11.1.1.1.1.1.1.1.381.
31.1.1.1.1.1.1.1.382.
8:Temistocle
,091
,779
4,844
,903
,789
,199
,675
885
5,521
,503
,972
,226
,238
,123
,597
3,947
,198
610
1.1.1.1.1.1.1.1.383.
1.1.1.1.1.1.1.1.384.
1
1.1.1.1.1.1.1.1.385.
21.1.1.1.1.1.1.1.386.
51.1.1.1.1.1.1.1.387.
11.1.1.1.1.1.1.1.388.
21.1.1.1.1.1.1.1.389.
41.1.1.1.1.1.1.1.390.
21.1.1.1.1.1.1.1.391.
11.1.1.1.1.1.1.1.392.
11.1.1.1.1.1.1.1.393.
11.1.1.1.1.1.1.1.394.
11.1.1.1.1.1.1.1.395.
61.1.1.1.1.1.1.1.396.
21.1.1.1.1.1.1.1.397.
31.1.1.1.1.1.1.1.398.
11.1.1.1.1.1.1.1.399.
21.1.1.1.1.1.1.1.400.
11.1.1.1.1.1.1.1.401.
11.1.1.1.1.1.1.1.402.
,
9:Umberto
,973
,594
0,055
,593
,221
,049
,579
,112
1,638
,476
,317
,802
,103
,976
,453
1,065
,142
610
1.1.1.1.1.1.1.1.403.
1
2
5
1
2
4
2
1
1
1
1
6
2
3
1
2
1
1
,
Processo di agglomerazione
Cluster di appartenenza
Grafico a stalattite
Ve rtical Icicle
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
1:Aurora
14:Piera
4:Dalmazio
12:Nestore
6:Fatima
11:Mercuzio
8:Heat her
15:Quinto
18:Temistocle
19:Umberto
2:Beat rice
7:Gioacchino
13:Osvaldo
5:Ermanno
17:Santina
10:Lambert o
Number of clus ters
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
3:Ciriaco
16:Rosario
9:I mmacolata
Case
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
Dendogramma (metodo di Ward)
Rescaled Distance Cluster Combine
C A S E
Label
Dalmazio
Num
4
0
5
10
15
20
25
+---------+---------+---------+---------+---------+

Nestore
Fatima
Temistocle
12
6
18


 
 
Umberto
19

Heather
Quinto
8
15


  


Mercuzio
11


Lamberto
10


Santina
Ermanno
17
5


 




Aurora
1
 


Piera
Gioacchino
14
7

 
 


 
Osvaldo
13
  

Beatrice
2


Immacolata
Rosario
Ciriaco
9
16
3



 

Appartenenza dei casi ai gruppi
Centri finali dei cluster
Final Cluster Centers
Nevroticis mo
Estroversione
Apertura all'es perienza
Amabilità
Cos cenzios ità
1
2,06
2,34
2,56
2,18
1,96
Cluster
2
1,83
2,47
2,71
2,83
2,88
3
2,27
2,04
2,19
2,16
2,83
Numero di casi in ciascun cluster
Number of Cases in each Cluster
Cluster
Valid
Mis sing
1
2
3
10,000
23,000
17,000
50,000
,000
Scarica

L`analisi dei gruppi (cluster analysis)