Metodi Quantitativi per Economia, Finanza
e Management
Lezione n°11
Analisi fattoriale
Quando le variabili considerate sono numerose spesso
risultano tra loro correlate.
Numerosità e correlazione tra variabili porta a difficoltà di
analisi => ridurre il numero (semplificando l’analisi)
evitando, però, di perdere informazioni rilevanti.
L’Analisi Fattoriale è una tecnica statistica multivariata per
l’analisi delle correlazioni esistenti tra variabili quantitative.
A partire da una matrice di dati : X(nxp), con “n” osservazioni e “p”
variabili originarie, consente di sintetizzare l’informazione in un
set ridotto di variabili trasformate (i fattori latenti).
Analisi fattoriale
Le ipotesi del Modello Fattoriale
Variabili Quantitative x1, x2, ......, xi, ......... xp
Info
Var
xi
xi
xi
=
=
=
i = 1, ........., p
k << p
Corr (UFi , UFj) = 0
Corr (CFi , CFj) = 0
Corr (CFi , UFj) = 0
Info condivisa +
Communality +
f(CF1, ....,CFk)
Info specifica
Var specifica
+
UFi
CFi = Common Factori
UFi = Unique Factori
per i ^= j
per i ^= j
per ogni i,j
Analisi fattoriale
Factor Loadings & Factor Score Coefficients
xi
=
li1CF1 + li2CF2 + .... + likCFk + UFi
li1, li2,........,lik
factor loadings
i = 1, ........., p
significato fattori
CFj
=
sj1x1 + sj2x2 + .............. + sjpxp
sj1, sj2,........,sjp
factor score coeff.
j = 1, ....., k << p
costruzione fattori
Analisi fattoriale
Metodo delle Componenti Principali
• I fattori calcolati mediante il metodo delle CP sono combinazioni
lineari delle variabili originarie
CPj = sj1x1 + sj2x2 + .............. + sjpxp
• Sono tra loro ortogonali (non correlate)
• Complessivamente spiegano la variabilità delle p variabili
originarie
• Sono elencate in ordine decrescente rispetto alla variabilità
spiegata
Analisi fattoriale
Metodo delle Componenti Principali
Il numero massimo di componenti principali è pari al numero delle
variabili originarie (p).
La prima componente principale è una combinazione lineare delle p
variabili originarie ed è caratterizzata da varianza più elevata, e
così via fino all’ultima componente, combinazione sempre delle p
variabili originarie, ma a varianza minima.
Se la correlazione tra le p variabili è elevata, un numero k<<p (k
molto inferiore a p) di componenti principali è sufficiente
rappresenta in modo adeguato i dati originari, perché riassume
una quota elevata della varianza totale.
Analisi fattoriale
I problemi di una analisi di questo tipo sono:
a) quante componenti considerare
b) come interpretarle
Analisi fattoriale
Quante componenti considerare?
1.
2.
3.
4.
metodo degli autovalori >1
rapporto tra numero di componenti e variabili (circa 1/3)
percentuale di varianza spiegata (almeno 60%)
lo SCREE PLOT (plot di autovalore vs il numero di fattori)
Se il plot mostra un “gomito” è plausibile ipotizzare l’esistenza di una struttura
latente, se la forma è quasi rettilinea significa che i fattori sono solo una
trasformazione delle variabili manifeste. I fattori rilevanti sono quelli al di sopra del
gomito (a discrezione anche quello in corrispondenza del gomito). Se non ci sono
fattori predominanti il criterio è inadatto.
5.
6.
le comunalità
interpretabilità delle componenti e loro rilevanza nella
esecuzione dell’analisi successive
Analisi fattoriale
Come interpretarle?
1.
rotazione delle componenti
La rotazione ortogonale nello spazio dei fattori non influenza la
validità del modello: sfruttiamo questa caratteristica per ottenere dei
fattori più facilmente interpretabili.
2.
correlazioni tra componenti principali e variabili originarie
Analisi Fattoriale
• Sono stati individuati 20
attributi caratterizzanti il
prodotto-biscotto
• È stato chiesto
all’intervistato di esprimere
un giudizio in merito
all’importanza che ogni
attributo esercita nell’atto di
acquisto
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/Gusto
Caratteristiche Nutrizionali
Attenzione a Bisogni Specifici
Lievitazione Naturale
Produzione Artigianale
Forma/Stampo
Richiamo alla Tradizione
Grandezza della Confezione
(Peso Netto)
Funzionalità della Confezione
Estetica della Confezione
Scadenza
Nome del Biscotto
Pubblicità e Comunicazione
Promozione e Offerte Speciali
Consigli per l’Utilizzo
Prezzo
Notorietà della Marca
Analisi fattoriale
Correlations
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/gusto
Caratteris tiche nutrizionali
Pears on Correlation
Sig. (2-tailed)
N
Pears on Correlation
Sig. (2-tailed)
N
Pears on Correlation
Sig. (2-tailed)
N
Pears on Correlation
Sig. (2-tailed)
N
Pears on Correlation
Sig. (2-tailed)
N
Qualità degli
ingredienti
1
**. Correlation is s ignificant at the 0.01 level (2-tailed).
220
.629**
.000
220
.299**
.000
218
.232**
.001
220
.234**
.001
214
Caratteris tich
Genuinità Leggerezza Sapore/gusto
e nutrizionali
.629**
.299**
.232**
.234**
.000
.000
.001
.001
220
218
220
214
1
.468**
.090
.354**
.000
.181
.000
220
218
220
214
.468**
1
.030
.460**
.000
.657
.000
218
219
219
213
.090
.030
1
-.015
.181
.657
.823
220
219
221
215
.354**
.460**
-.015
1
.000
.000
.823
214
213
215
215
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis .
1. The ratio between
the number of
components and the
variables:
One out of Three
20 original variables
6-7 Factors
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis .
2. The percentage of the
explained variance:
the higher the better!
between 60%-75% is
good
Factor Analysis
3. The scree plot :
The point at which
the scree begins
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis .
4. Eigenvalue:
Eigenvalues>1
Factor Analysis
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis .
Total Variance Explained
Analisi Fattoriale
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis.
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
4.171
20.853
20.853
2.678
13.389
34.241
1.843
9.216
43.457
1.376
6.879
50.336
1.129
5.643
55.979
1.016
5.079
61.057
Communalities
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/gusto
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Lievitazione naturale
Produzione artigianale
Forma e s tampo
Richiamo alla tradizione
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Estetica della confezione
Scadenza
Nome del biscotto
Pubblicità e
comunicazione
Promozioni e offerte
s peciali
Consigli per l'utilizzo
Prezzo
Notorietà della marca
Initial
1.000
1.000
1.000
1.000
1.000
Extraction
.717
.746
.588
.670
.631
1.000
.332
1.000
1.000
1.000
1.000
.674
.762
.689
.600
1.000
.579
1.000
.414
1.000
1.000
1.000
.599
.432
.494
1.000
.717
1.000
.736
1.000
1.000
1.000
.463
.653
.716
Extraction Method: Principal Component Analysis.
5. Communalities:
The quote of
explained
variability for each
input variable
must be
satisfactory
In the example
the overall
explained
variability (which
represents the
mean value) is
0.61057
Factor Analysis
•
6. Interpretation: Component Matrix (factor loadings)
– The most relevant output of a factorial analysis is the
so called “component matrix”, which shows the
correlations between the original input variables and
the obtained components (factor loadings)
– Each variable is associated specifically to the factors
(components) with which there is the highest
correlation
– The interpretation of the each factor has to be guided
considering the variables with the highest correlations
related to single factor
Component Matrixa
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/gusto
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Lievitazione naturale
Produzione artigianale
Forma e s tampo
Richiamo alla tradizione
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Estetica della confezione
Scadenza
Nome del biscotto
Pubblicità e
comunicazione
Promozioni e offerte
s peciali
Consigli per l'utilizzo
Prezzo
Notorietà della marca
1
.418
.383
.426
.163
.410
2
-.513
-.717
-.478
-.079
-.364
Component
3
4
.072
.099
.082
-.080
.136
-.349
.195
.671
.298
-.417
.410
-.220
-.214
-.197
-.032
-.172
.624
.573
.482
.615
-.360
-.339
.320
.046
-.309
-.160
-.272
-.269
.019
.377
.202
.372
-.228
-.374
.430
-.082
-.083
-.109
-.234
-.045
.403
.287
.461
.196
.209
-.197
.483
.131
.162
-.123
.081
-.340
.463
.390
.416
.439
-.158
.306
-.383
.100
-.383
-.026
.088
-.126
.174
-.473
.252
-.118
-.118
.032
.421
.525
-.145
-.331
-.062
.361
.340
.419
.660
-.062
-.025
.073
.629
.429
.413
.123
.265
.434
.093
.594
-.115
-.173
.129
-.121
-.058
-.166
-.305
.104
-.047
.486
Extraction Method: Principal Component Analysis.
a. 6 components extracted.
5
.375
.137
.162
.229
.100
6
.353
.231
.105
.310
-.240
6. Interpretation:
Correlation
between
Input Vars
&
Factors
The new Factors
must have a
meaning based
on the
correlation
structure
Rotated Component Matrixa
Genuinità
Leggerezza
Qualità degli ingredienti
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Promozioni e offerte
s peciali
Prezzo
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Forma e s tampo
Estetica della confezione
Nome del biscotto
Produzione artigianale
Lievitazione naturale
Scadenza
Richiamo alla tradizione
Notorietà della marca
Pubblicità e
comunicazione
Consigli per l'utilizzo
Sapore/gusto
Component
3
4
-.123
.237
-.007
.096
.078
.080
.009
.111
1
.795
.748
.716
.619
2
-.089
.072
-.026
.312
5
-.051
.050
.007
-.127
6
.178
-.104
.437
-.349
.327
-.054
.243
.324
.020
-.239
.002
.799
-.052
-.111
.286
.035
-.015
.764
-.063
.180
.154
.092
.017
.697
.250
.006
-.067
.159
.158
.448
.334
.165
-.028
-.219
-.011
-.096
.071
.158
.369
.066
.023
-.083
.163
.065
-.040
.028
-.103
.211
.082
.108
.799
.704
.624
.083
.224
-.137
.439
.103
.070
.107
.005
.836
.681
.593
.566
.161
-.024
.268
.309
-.023
.094
.078
.132
.811
.137
-.076
-.047
.172
-.065
-.086
.251
.051
-.002
.139
.310
-.055
.764
-.119
.282
.048
.342
.163
.228
.025
.234
.083
.394
-.074
-.064
.793
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kais er Normalization.
a. Rotation converged in 6 iterations.
6. Interpretation:
The correlation
structure
between
Input Vars
&
Factors
In this case the
correlation
structure is well
defined and the
interpretation
phase is easier
Factor Analysis
Issues of the Factor Analysis are the following:
a) How many Factors (or components) need to be considered
6. The degree of the interpretation of the components and how they
affect the next analyses
b) How to interpret
1. The correlation between the principal components and the original
variables
2. The rotation of the principal components
Factor Analysis
•
6. Interpretation: The rotation of factors
– There are numerous outputs of factorial analysis
which can be produced through the same input data
– These numerous outputs don’t provide interpretation
that are remarkably different from one another, as
matter of fact they differ only slightly and there are
areas of ambiguity
Factor Analysis
CF*j
CFj
x1
x4
CF*i
x2
CFi
x3
The coordinates of the graph
are the factor loadings
Interpretation of the
factors
Factor Analysis
•
6. Interpretation: The rotation of factors
– The Varimax method of rotation, suggested by Kaiser, has the
purpose of minimizing the number of variables with high
saturations (correlations) for each factor
– The Quartimax method attempts to minimize the number of
factors tightly correlated to each variable
– The Equimax method is a cross between the Varimax and the
Quartimax
– The percentage of the overall variance of the rotated factors
doesn’t change, whereas the percentage of the variance
explained by each factors shifts
Total Variance Explained
Analisi Fattoriale
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis.
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
4.171
20.853
20.853
2.678
13.389
34.241
1.843
9.216
43.457
1.376
6.879
50.336
1.129
5.643
55.979
1.016
5.079
61.057
Before the rotation step
Total Variance Explained
Analisi Fattoriale
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis.
Rotation Sums of Squared Loadings
Total
% of Variance Cumulative %
2.490
12.448
12.448
2.294
11.468
23.917
2.214
11.068
34.984
2.203
11.016
46.000
1.736
8.680
54.680
1.276
6.378
61.057
After the rotation step
Communalities
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/gusto
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Lievitazione naturale
Produzione artigianale
Forma e s tampo
Richiamo alla tradizione
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Estetica della confezione
Scadenza
Nome del biscotto
Pubblicità e
comunicazione
Promozioni e offerte
s peciali
Consigli per l'utilizzo
Prezzo
Notorietà della marca
Initial
1.000
1.000
1.000
1.000
1.000
Extraction
.717
.746
.588
.670
.631
1.000
.332
1.000
1.000
1.000
1.000
.674
.762
.689
.600
1.000
.579
1.000
.414
1.000
1.000
1.000
.599
.432
.494
1.000
.717
1.000
.736
1.000
1.000
1.000
.463
.653
.716
Extraction Method: Principal Component Analysis.
5. Communalities:
The
communalities
don’t change after
the Rotation Step
Rotated Component Matrixa
Genuinità
Leggerezza
Qualità degli ingredienti
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Promozioni e offerte
s peciali
Prezzo
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Forma e s tampo
Estetica della confezione
Nome del biscotto
Produzione artigianale
Lievitazione naturale
Scadenza
Richiamo alla tradizione
Notorietà della marca
Pubblicità e
comunicazione
Consigli per l'utilizzo
Sapore/gusto
Component
3
4
-.123
.237
-.007
.096
.078
.080
.009
.111
1
.795
.748
.716
.619
2
-.089
.072
-.026
.312
5
-.051
.050
.007
-.127
6
.178
-.104
.437
-.349
.327
-.054
.243
.324
.020
-.239
.002
.799
-.052
-.111
.286
.035
-.015
.764
-.063
.180
.154
.092
.017
.697
.250
.006
-.067
.159
.158
.448
.334
.165
-.028
-.219
-.011
-.096
.071
.158
.369
.066
.023
-.083
.163
.065
-.040
.028
-.103
.211
.082
.108
.799
.704
.624
.083
.224
-.137
.439
.103
.070
.107
.005
.836
.681
.593
.566
.161
-.024
.268
.309
-.023
.094
.078
.132
.811
.137
-.076
-.047
.172
-.065
-.086
.251
.051
-.002
.139
.310
-.055
.764
-.119
.282
.048
.342
.163
.228
.025
.234
.083
.394
-.074
-.064
.793
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kais er Normalization.
a. Rotation converged in 6 iterations.
6. Interpretation:
The correlation
structure
between
Input Vars
&
Factors
improves
after the rotation
step
Rotated Component Matrixa
Genuinità
Leggerezza
Qualità degli ingredienti
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Promozioni e offerte
s peciali
Prezzo
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Forma e s tampo
Estetica della confezione
Nome del biscotto
Produzione artigianale
Lievitazione naturale
Scadenza
Richiamo alla tradizione
Notorietà della marca
Pubblicità e
comunicazione
Consigli per l'utilizzo
Sapore/gusto
Component
3
4
-.123
.237
-.007
.096
.078
.080
.009
.111
1
.795
.748
.716
.619
2
-.089
.072
-.026
.312
5
-.051
.050
.007
-.127
6
.178
-.104
.437
-.349
.327
-.054
.243
.324
.020
-.239
.002
.799
-.052
-.111
.286
.035
-.015
.764
-.063
.180
.154
.092
.017
.697
.250
.006
-.067
.159
.158
.448
.334
.165
-.028
-.219
-.011
-.096
.071
.158
.369
.066
.023
-.083
.163
.065
-.040
.028
-.103
.211
.082
.108
.799
.704
.624
.083
.224
-.137
.439
.103
.070
.107
.005
.836
.681
.593
.566
.161
-.024
.268
.309
-.023
.094
.078
.132
.811
.137
-.076
-.047
.172
-.065
-.086
.251
.051
-.002
.139
.310
-.055
.764
-.119
.282
.048
.342
.163
.228
.025
.234
.083
.394
-.074
-.064
.793
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kais er Normalization.
a. Rotation converged in 6 iterations.
6. Interpretation:
The correlation
structure
between
Input Vars
&
Factors
The variable with
the lowest
communality is
not well
explained by this
solution
Factor Analysis
•
•
•
•
Once an adequate solution is found, it is possible to use
the obtained factors as new macro variables to consider
for further analyses on the phenomenon under
investigation, thus replacing the original variables;
Again taking into consideration the example, we may add
six new variables into the data file, as follows:
– Health,
– Convenience & Practicality,
– Image,
– Handicraft,
– Communication,
– Taste.
They are standardized variables: zero mean and variance
equal to one.
They will be the input for further analyses of Dependence
or/and Interdependence.
Factor Analysis
Indentification of
the input variables
Standardization
P.C. methods first
findings
Number of factors
Rotation
Interpretation
Scarica

factor loadings