Metodi Quantitativi per Economia, Finanza
e Management
Lezioni n°7-8
Lettura di un test statistico (1)
Esempio:
H0:
b1= b2 = ....=bk = 0
1) Ipotesi
H1: bi = 0
2) Statistica test
3) p-value
Statistica F
Rappresenta la probabilità di commettere
l’errore di prima specie.
Può essere interpretato come la probabilità
che H0 sia “vera” in base al valore osservato
della statistica test
Lettura di un test statistico (2)
Se p-value piccolo
RIFIUTO H0
Altrimenti
ACCETTO H0
Produzione artigianale
Età
18-25
26-35
36-50
Over 50
Total
Mean
5.01
5.53
6.00
6.09
5.55
N
78
55
41
47
221
Std. Deviation
2.224
2.609
2.098
2.320
2.352
ANOVA Table
Produzione
artigianale * Età
Between Groups
Within Groups
Total
(Combined)
Sum of
Squares
44.296
1172.356
1216.652
df
3
217
220
Mean Square
14.765
5.403
F
2.733
Sig.
.045
Report
Attenzione a bis ogni s pecifici
Età
18-25
26-35
36-50
Over 50
Total
Mean
4.05
4.53
5.00
5.83
4.73
N
78
53
41
47
219
Std. Deviation
2.772
2.791
2.837
8.168
4.536
ANOVA Table
Attenzione a bisogni
s pecifici * Età
Between Groups
Within Groups
Total
(Combined)
Sum of
Squares
97.921
4387.641
4485.562
df
3
215
218
Mean Square
32.640
20.408
F
1.599
Sig.
.191
Analisi fattoriale
Quando le variabili considerate sono numerose spesso
risultano tra loro correlate.
Numerosità e correlazione tra variabili porta a difficoltà di
analisi => ridurre il numero (semplificando l’analisi)
evitando, però, di perdere informazioni rilevanti.
L’Analisi Fattoriale è una tecnica statistica multivariata per
l’analisi delle correlazioni esistenti tra variabili quantitative.
A partire da una matrice di dati (n x p) con p variabili originarie,
consente di sintetizzare l’informazione in un set ridotto di
variabili trasformate (i fattori latenti).
Analisi fattoriale
Perché sintetizzare mediante l’impiego della tecnica?
Se l’informazione è “dispersa” tra più variabili correlate
tra loro, le singole variabili faticano da sole a spiegare
il fenomeno oggetto di studio, mentre combinate tra
loro risultano molto più esplicative.
Esempio: l’attrattività di una città da cosa è data? Dalle
caratteristiche del contesto, dalla struttura
demografica della popolazione, dalla qualità della vita,
dalla disponibilità di fattori quali capitale, forza lavoro,
know-how, spazi, energia, materie prime,
infrastrutture, ecc.
I fattori latenti sono “concetti” che abbiamo in mente ma
che non possiamo misurare direttamente.
Analisi fattoriale
Le ipotesi del Modello Fattoriale
Variabili Quantitative x1, x2, ......, xi, ......... xp
Info
Var
xi
xi
xi
=
=
=
i = 1, ........., p
k << p
Corr (UFi , UFj) = 0
Corr (CFi , CFj) = 0
Corr (CFi , UFj) = 0
Info condivisa +
Communality +
f(CF1, ....,CFk)
Info specifica
Var specifica
+
UFi
CFi = Common Factori
UFi = Unique Factori
per i ^= j
per i ^= j
per ogni i,j
Analisi fattoriale
Factor Loadings & Factor Score Coefficients
xi
=
li1CF1 + li2CF2 + .... + likCFk + UFi
li1, li2,........,lik
factor loadings
i = 1, ........., p
significato fattori
CFj
=
sj1x1 + sj2x2 + .............. + sjpxp
sj1, sj2,........,sjp
factor score coeff.
j = 1, ....., k << p
costruzione fattori
Analisi fattoriale
Metodo delle Componenti Principali
Uno dei metodi di stima dei coefficienti (i LOADINGS) è il
Metodo delle Componenti Principali.
Utilizzare tale metodo significa ipotizzare che il patrimonio
informativo specifico delle variabili manifeste sia minimo,
mentre sia massimo quello condiviso, spiegabile dai
fattori comuni.
Per la stima dei loadings si ricorre agli autovalori e agli
autovettori della matrice di correlazione R: di fatto i
loadings coincidono con le correlazioni tra le variabili
manifeste e le componenti principali.
Analisi fattoriale
Metodo delle Componenti Principali
• I fattori calcolati mediante il metodo delle CP sono combinazioni
lineari delle variabili originarie
CPj = sj1x1 + sj2x2 + .............. + sjpxp
• Sono tra loro ortogonali (non correlate)
• Complessivamente spiegano la variabilità delle p variabili
originarie
• Sono elencate in ordine decrescente rispetto alla variabilità
spiegata
Analisi fattoriale
Metodo delle Componenti Principali
Il numero massimo di componenti principali è pari al numero delle
variabili originarie (p).
La prima componente principale è una combinazione lineare delle p
variabili originarie ed è caratterizzata da varianza più elevata, e
così via fino all’ultima componente, combinazione sempre delle p
variabili originarie, ma a varianza minima.
Se la correlazione tra le p variabili è elevata, un numero k<<p (k
molto inferiore a p )di componenti principali è sufficiente
rappresenta in modo adeguato i dati originari, perché riassume
una quota elevata della varianza totale.
Analisi fattoriale
I problemi di una analisi di questo tipo sono:
a)-quante componenti considerare
1. rapporto tra numero di componenti e variabili;
2. percentuale di varianza spiegata;
3. le comunalità
4. lo scree plot;
5. interpretabilità delle componenti e loro rilevanza nella
esecuzione dell’analisi successive
b)-come interpretarle
1. correlazioni tra componenti principali e variabili originarie
2. rotazione delle componenti
Analisi Fattoriale
• Sono stati individuati 20
attributi caratterizzanti il
prodotto-biscotto
• È stato chiesto
all’intervistato di esprimere
un giudizio in merito
all’importanza che ogni
attributo esercita nell’atto di
acquisto
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/Gusto
Caratteristiche Nutrizionali
Attenzione a Bisogni Specifici
Lievitazione Naturale
Produzione Artigianale
Forma/Stampo
Richiamo alla Tradizione
Grandezza della Confezione
(Peso Netto)
Funzionalità della Confezione
Estetica della Confezione
Scadenza
Nome del Biscotto
Pubblicità e Comunicazione
Promozione e Offerte Speciali
Consigli per l’Utilizzo
Prezzo
Notorietà della Marca
Analisi fattoriale
Correlations
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/gusto
Caratteris tiche nutrizionali
Pears on Correlation
Sig. (2-tailed)
N
Pears on Correlation
Sig. (2-tailed)
N
Pears on Correlation
Sig. (2-tailed)
N
Pears on Correlation
Sig. (2-tailed)
N
Pears on Correlation
Sig. (2-tailed)
N
Qualità degli
ingredienti
1
**. Correlation is s ignificant at the 0.01 level (2-tailed).
220
.629**
.000
220
.299**
.000
218
.232**
.001
220
.234**
.001
214
Caratteris tich
Genuinità Leggerezza Sapore/gusto
e nutrizionali
.629**
.299**
.232**
.234**
.000
.000
.001
.001
220
218
220
214
1
.468**
.090
.354**
.000
.181
.000
220
218
220
214
.468**
1
.030
.460**
.000
.657
.000
218
219
219
213
.090
.030
1
-.015
.181
.657
.823
220
219
221
215
.354**
.460**
-.015
1
.000
.000
.823
214
213
215
215
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis .
Analisi fattoriale
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis .
Analisi fattoriale
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis .
Total Variance Explained
Analisi Fattoriale
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis.
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
4.171
20.853
20.853
2.678
13.389
34.241
1.843
9.216
43.457
1.376
6.879
50.336
1.129
5.643
55.979
1.016
5.079
61.057
Communalities
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/gusto
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Lievitazione naturale
Produzione artigianale
Forma e s tampo
Richiamo alla tradizione
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Estetica della confezione
Scadenza
Nome del biscotto
Pubblicità e
comunicazione
Promozioni e offerte
s peciali
Consigli per l'utilizzo
Prezzo
Notorietà della marca
Initial
1.000
1.000
1.000
1.000
1.000
Extraction
.717
.746
.588
.670
.631
1.000
.332
1.000
1.000
1.000
1.000
.674
.762
.689
.600
1.000
.579
1.000
.414
1.000
1.000
1.000
.599
.432
.494
1.000
.717
1.000
.736
1.000
1.000
1.000
.463
.653
.716
Extraction Method: Principal Component Analysis.
Analisi fattoriale
•
Aspetti Interpretativi: La matrice delle saturazioni (factor
loadings)
– La parte forse più rilevante dell’output di analisi
fattoriale è costituita dalla cosiddetta “component
matrix”, che riporta le correlazioni tra le variabili
originarie e le componenti individuate (factor loadings)
– Ciascuna variabile viene associata in particolare al
fattore col quale possiede la correlazione più elevata
– Il fattore viene quindi interpretato considerando le
variabili ad esso associate
Component Matrixa
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/gusto
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Lievitazione naturale
Produzione artigianale
Forma e s tampo
Richiamo alla tradizione
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Estetica della confezione
Scadenza
Nome del biscotto
Pubblicità e
comunicazione
Promozioni e offerte
s peciali
Consigli per l'utilizzo
Prezzo
Notorietà della marca
1
.418
.383
.426
.163
.410
2
-.513
-.717
-.478
-.079
-.364
Component
3
4
.072
.099
.082
-.080
.136
-.349
.195
.671
.298
-.417
.410
-.220
-.214
-.197
-.032
-.172
.624
.573
.482
.615
-.360
-.339
.320
.046
-.309
-.160
-.272
-.269
.019
.377
.202
.372
-.228
-.374
.430
-.082
-.083
-.109
-.234
-.045
.403
.287
.461
.196
.209
-.197
.483
.131
.162
-.123
.081
-.340
.463
.390
.416
.439
-.158
.306
-.383
.100
-.383
-.026
.088
-.126
.174
-.473
.252
-.118
-.118
.032
.421
.525
-.145
-.331
-.062
.361
.340
.419
.660
-.062
-.025
.073
.629
.429
.413
.123
.265
.434
.093
.594
-.115
-.173
.129
-.121
-.058
-.166
-.305
.104
-.047
.486
Extraction Method: Principal Component Analysis.
a. 6 components extracted.
5
.375
.137
.162
.229
.100
6
.353
.231
.105
.310
-.240
Analisi fattoriale
•
Aspetti Interpretativi: La rotazione dei fattori
– Esistono infiniti output di analisi fattoriale compatibili
con gli stessi dati di input
– Ovviamente questi infiniti output in generale non
forniscono interpretazioni del fenomeno pesantemente
contrastanti
tra
loro,
ma
differiscono
solo
marginalmente e nelle aree di ambiguità
Analisi fattoriale
CFj
CF*j
x1
x4
CF*i
x2
CFi
x3
le coordinate nel grafico
sono i factor loadings
interpretazione
dei fattori
Analisi fattoriale
•
Aspetti Interpretativi: La rotazione dei fattori
– Il metodo di rotazione Varimax, proposto da Kaiser, ha
come obiettivo la minimizzazione del numero di variabili
che possiedono saturazioni elevate per ciascun fattore,
– Il metodo Quartimax cerca di minimizzare il numero di
fattori fortemente correlati a ciascuna variabile,
– Il metodo Equimax è una combinazione di Varimax e
Quartimax
– La percentuale di varianza complessiva dei fattori ruotati
rimane inalterata, mentre si modifica la percentuale di
varianza spiegata da ciascun fattore
Total Variance Explained
Analisi Fattoriale
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
4.171
2.678
1.843
1.376
1.129
1.016
.937
.881
.781
.751
.682
.592
.568
.550
.453
.386
.376
.324
.270
.236
Initial Eigenvalues
% of Variance Cumulative %
20.853
20.853
13.389
34.241
9.216
43.457
6.879
50.336
5.643
55.979
5.079
61.057
4.684
65.741
4.405
70.146
3.907
74.054
3.756
77.810
3.412
81.222
2.960
84.183
2.838
87.021
2.750
89.771
2.267
92.038
1.930
93.968
1.880
95.848
1.621
97.470
1.352
98.822
1.178
100.000
Extraction Method: Principal Component Analysis.
Rotation Sums of Squared Loadings
Total
% of Variance Cumulative %
2.490
12.448
12.448
2.294
11.468
23.917
2.214
11.068
34.984
2.203
11.016
46.000
1.736
8.680
54.680
1.276
6.378
61.057
Communalities
Qualità degli ingredienti
Genuinità
Leggerezza
Sapore/gusto
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Lievitazione naturale
Produzione artigianale
Forma e s tampo
Richiamo alla tradizione
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Estetica della confezione
Scadenza
Nome del biscotto
Pubblicità e
comunicazione
Promozioni e offerte
s peciali
Consigli per l'utilizzo
Prezzo
Notorietà della marca
Initial
1.000
1.000
1.000
1.000
1.000
Extraction
.717
.746
.588
.670
.631
1.000
.332
1.000
1.000
1.000
1.000
.674
.762
.689
.600
1.000
.579
1.000
.414
1.000
1.000
1.000
.599
.432
.494
1.000
.717
1.000
.736
1.000
1.000
1.000
.463
.653
.716
Extraction Method: Principal Component Analysis.
Rotated Component Matrixa
Genuinità
Leggerezza
Qualità degli ingredienti
Caratteristiche nutrizionali
Attenzione a bisogni
s pecifici
Promozioni e offerte
s peciali
Prezzo
Grandezza della
confezione (peso netto)
Funzionalità della
confezione
Forma e s tampo
Estetica della confezione
Nome del biscotto
Produzione artigianale
Lievitazione naturale
Scadenza
Richiamo alla tradizione
Notorietà della marca
Pubblicità e
comunicazione
Consigli per l'utilizzo
Sapore/gusto
Component
3
4
-.123
.237
-.007
.096
.078
.080
.009
.111
1
.795
.748
.716
.619
2
-.089
.072
-.026
.312
5
-.051
.050
.007
-.127
6
.178
-.104
.437
-.349
.327
-.054
.243
.324
.020
-.239
.002
.799
-.052
-.111
.286
.035
-.015
.764
-.063
.180
.154
.092
.017
.697
.250
.006
-.067
.159
.158
.448
.334
.165
-.028
-.219
-.011
-.096
.071
.158
.369
.066
.023
-.083
.163
.065
-.040
.028
-.103
.211
.082
.108
.799
.704
.624
.083
.224
-.137
.439
.103
.070
.107
.005
.836
.681
.593
.566
.161
-.024
.268
.309
-.023
.094
.078
.132
.811
.137
-.076
-.047
.172
-.065
-.086
.251
.051
-.002
.139
.310
-.055
.764
-.119
.282
.048
.342
.163
.228
.025
.234
.083
.394
-.074
-.064
.793
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kais er Normalization.
a. Rotation converged in 6 iterations.
Analisi fattoriale
•
•
•
Una volta scelta la soluzione ottimale, è possibile
utilizzare i fattori ottenuti come nuove “macro-variabili” da
inserire in ulteriori analisi sul fenomeno indagato, al posto
delle variabili originarie;
Considerando ancora l’esempio proposto, nel file di dati si
potranno aggiungere 6 nuove variabili:
– Salute,
– Convenienza & Praticità,
– Immagine,
– Artigianalità,
– Comunicazione,
– Sapore & Gusto.
Si tratta di variabili standardizzate (ovvero a media nulla
e varianza unitaria), che costituiranno l’input per le analisi
successive (dipendenza e/o interdipendenza).
Analisi fattoriale
Individuazione
variabili di analisi
standardizzazione
metodo c.p.
prime evidenze
numero di fattori
rotazione
interpretazione
Scarica

Lezioni n°7-8