Metodi Quantitativi per Economia, Finanza e Management Lezioni n°7-8 Lettura di un test statistico (1) Esempio: H0: b1= b2 = ....=bk = 0 1) Ipotesi H1: bi = 0 2) Statistica test 3) p-value Statistica F Rappresenta la probabilità di commettere l’errore di prima specie. Può essere interpretato come la probabilità che H0 sia “vera” in base al valore osservato della statistica test Lettura di un test statistico (2) Se p-value piccolo RIFIUTO H0 Altrimenti ACCETTO H0 Produzione artigianale Età 18-25 26-35 36-50 Over 50 Total Mean 5.01 5.53 6.00 6.09 5.55 N 78 55 41 47 221 Std. Deviation 2.224 2.609 2.098 2.320 2.352 ANOVA Table Produzione artigianale * Età Between Groups Within Groups Total (Combined) Sum of Squares 44.296 1172.356 1216.652 df 3 217 220 Mean Square 14.765 5.403 F 2.733 Sig. .045 Report Attenzione a bis ogni s pecifici Età 18-25 26-35 36-50 Over 50 Total Mean 4.05 4.53 5.00 5.83 4.73 N 78 53 41 47 219 Std. Deviation 2.772 2.791 2.837 8.168 4.536 ANOVA Table Attenzione a bisogni s pecifici * Età Between Groups Within Groups Total (Combined) Sum of Squares 97.921 4387.641 4485.562 df 3 215 218 Mean Square 32.640 20.408 F 1.599 Sig. .191 Analisi fattoriale Quando le variabili considerate sono numerose spesso risultano tra loro correlate. Numerosità e correlazione tra variabili porta a difficoltà di analisi => ridurre il numero (semplificando l’analisi) evitando, però, di perdere informazioni rilevanti. L’Analisi Fattoriale è una tecnica statistica multivariata per l’analisi delle correlazioni esistenti tra variabili quantitative. A partire da una matrice di dati (n x p) con p variabili originarie, consente di sintetizzare l’informazione in un set ridotto di variabili trasformate (i fattori latenti). Analisi fattoriale Perché sintetizzare mediante l’impiego della tecnica? Se l’informazione è “dispersa” tra più variabili correlate tra loro, le singole variabili faticano da sole a spiegare il fenomeno oggetto di studio, mentre combinate tra loro risultano molto più esplicative. Esempio: l’attrattività di una città da cosa è data? Dalle caratteristiche del contesto, dalla struttura demografica della popolazione, dalla qualità della vita, dalla disponibilità di fattori quali capitale, forza lavoro, know-how, spazi, energia, materie prime, infrastrutture, ecc. I fattori latenti sono “concetti” che abbiamo in mente ma che non possiamo misurare direttamente. Analisi fattoriale Le ipotesi del Modello Fattoriale Variabili Quantitative x1, x2, ......, xi, ......... xp Info Var xi xi xi = = = i = 1, ........., p k << p Corr (UFi , UFj) = 0 Corr (CFi , CFj) = 0 Corr (CFi , UFj) = 0 Info condivisa + Communality + f(CF1, ....,CFk) Info specifica Var specifica + UFi CFi = Common Factori UFi = Unique Factori per i ^= j per i ^= j per ogni i,j Analisi fattoriale Factor Loadings & Factor Score Coefficients xi = li1CF1 + li2CF2 + .... + likCFk + UFi li1, li2,........,lik factor loadings i = 1, ........., p significato fattori CFj = sj1x1 + sj2x2 + .............. + sjpxp sj1, sj2,........,sjp factor score coeff. j = 1, ....., k << p costruzione fattori Analisi fattoriale Metodo delle Componenti Principali Uno dei metodi di stima dei coefficienti (i LOADINGS) è il Metodo delle Componenti Principali. Utilizzare tale metodo significa ipotizzare che il patrimonio informativo specifico delle variabili manifeste sia minimo, mentre sia massimo quello condiviso, spiegabile dai fattori comuni. Per la stima dei loadings si ricorre agli autovalori e agli autovettori della matrice di correlazione R: di fatto i loadings coincidono con le correlazioni tra le variabili manifeste e le componenti principali. Analisi fattoriale Metodo delle Componenti Principali • I fattori calcolati mediante il metodo delle CP sono combinazioni lineari delle variabili originarie CPj = sj1x1 + sj2x2 + .............. + sjpxp • Sono tra loro ortogonali (non correlate) • Complessivamente spiegano la variabilità delle p variabili originarie • Sono elencate in ordine decrescente rispetto alla variabilità spiegata Analisi fattoriale Metodo delle Componenti Principali Il numero massimo di componenti principali è pari al numero delle variabili originarie (p). La prima componente principale è una combinazione lineare delle p variabili originarie ed è caratterizzata da varianza più elevata, e così via fino all’ultima componente, combinazione sempre delle p variabili originarie, ma a varianza minima. Se la correlazione tra le p variabili è elevata, un numero k<<p (k molto inferiore a p )di componenti principali è sufficiente rappresenta in modo adeguato i dati originari, perché riassume una quota elevata della varianza totale. Analisi fattoriale I problemi di una analisi di questo tipo sono: a)-quante componenti considerare 1. rapporto tra numero di componenti e variabili; 2. percentuale di varianza spiegata; 3. le comunalità 4. lo scree plot; 5. interpretabilità delle componenti e loro rilevanza nella esecuzione dell’analisi successive b)-come interpretarle 1. correlazioni tra componenti principali e variabili originarie 2. rotazione delle componenti Analisi Fattoriale • Sono stati individuati 20 attributi caratterizzanti il prodotto-biscotto • È stato chiesto all’intervistato di esprimere un giudizio in merito all’importanza che ogni attributo esercita nell’atto di acquisto 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. Qualità degli ingredienti Genuinità Leggerezza Sapore/Gusto Caratteristiche Nutrizionali Attenzione a Bisogni Specifici Lievitazione Naturale Produzione Artigianale Forma/Stampo Richiamo alla Tradizione Grandezza della Confezione (Peso Netto) Funzionalità della Confezione Estetica della Confezione Scadenza Nome del Biscotto Pubblicità e Comunicazione Promozione e Offerte Speciali Consigli per l’Utilizzo Prezzo Notorietà della Marca Analisi fattoriale Correlations Qualità degli ingredienti Genuinità Leggerezza Sapore/gusto Caratteris tiche nutrizionali Pears on Correlation Sig. (2-tailed) N Pears on Correlation Sig. (2-tailed) N Pears on Correlation Sig. (2-tailed) N Pears on Correlation Sig. (2-tailed) N Pears on Correlation Sig. (2-tailed) N Qualità degli ingredienti 1 **. Correlation is s ignificant at the 0.01 level (2-tailed). 220 .629** .000 220 .299** .000 218 .232** .001 220 .234** .001 214 Caratteris tich Genuinità Leggerezza Sapore/gusto e nutrizionali .629** .299** .232** .234** .000 .000 .001 .001 220 218 220 214 1 .468** .090 .354** .000 .181 .000 220 218 220 214 .468** 1 .030 .460** .000 .657 .000 218 219 219 213 .090 .030 1 -.015 .181 .657 .823 220 219 221 215 .354** .460** -.015 1 .000 .000 .823 214 213 215 215 Total Variance Explained Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total 4.171 2.678 1.843 1.376 1.129 1.016 .937 .881 .781 .751 .682 .592 .568 .550 .453 .386 .376 .324 .270 .236 Initial Eigenvalues % of Variance Cumulative % 20.853 20.853 13.389 34.241 9.216 43.457 6.879 50.336 5.643 55.979 5.079 61.057 4.684 65.741 4.405 70.146 3.907 74.054 3.756 77.810 3.412 81.222 2.960 84.183 2.838 87.021 2.750 89.771 2.267 92.038 1.930 93.968 1.880 95.848 1.621 97.470 1.352 98.822 1.178 100.000 Extraction Method: Principal Component Analysis . Analisi fattoriale Total Variance Explained Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total 4.171 2.678 1.843 1.376 1.129 1.016 .937 .881 .781 .751 .682 .592 .568 .550 .453 .386 .376 .324 .270 .236 Initial Eigenvalues % of Variance Cumulative % 20.853 20.853 13.389 34.241 9.216 43.457 6.879 50.336 5.643 55.979 5.079 61.057 4.684 65.741 4.405 70.146 3.907 74.054 3.756 77.810 3.412 81.222 2.960 84.183 2.838 87.021 2.750 89.771 2.267 92.038 1.930 93.968 1.880 95.848 1.621 97.470 1.352 98.822 1.178 100.000 Extraction Method: Principal Component Analysis . Analisi fattoriale Total Variance Explained Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total 4.171 2.678 1.843 1.376 1.129 1.016 .937 .881 .781 .751 .682 .592 .568 .550 .453 .386 .376 .324 .270 .236 Initial Eigenvalues % of Variance Cumulative % 20.853 20.853 13.389 34.241 9.216 43.457 6.879 50.336 5.643 55.979 5.079 61.057 4.684 65.741 4.405 70.146 3.907 74.054 3.756 77.810 3.412 81.222 2.960 84.183 2.838 87.021 2.750 89.771 2.267 92.038 1.930 93.968 1.880 95.848 1.621 97.470 1.352 98.822 1.178 100.000 Extraction Method: Principal Component Analysis . Total Variance Explained Analisi Fattoriale Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total 4.171 2.678 1.843 1.376 1.129 1.016 .937 .881 .781 .751 .682 .592 .568 .550 .453 .386 .376 .324 .270 .236 Initial Eigenvalues % of Variance Cumulative % 20.853 20.853 13.389 34.241 9.216 43.457 6.879 50.336 5.643 55.979 5.079 61.057 4.684 65.741 4.405 70.146 3.907 74.054 3.756 77.810 3.412 81.222 2.960 84.183 2.838 87.021 2.750 89.771 2.267 92.038 1.930 93.968 1.880 95.848 1.621 97.470 1.352 98.822 1.178 100.000 Extraction Method: Principal Component Analysis. Extraction Sums of Squared Loadings Total % of Variance Cumulative % 4.171 20.853 20.853 2.678 13.389 34.241 1.843 9.216 43.457 1.376 6.879 50.336 1.129 5.643 55.979 1.016 5.079 61.057 Communalities Qualità degli ingredienti Genuinità Leggerezza Sapore/gusto Caratteristiche nutrizionali Attenzione a bisogni s pecifici Lievitazione naturale Produzione artigianale Forma e s tampo Richiamo alla tradizione Grandezza della confezione (peso netto) Funzionalità della confezione Estetica della confezione Scadenza Nome del biscotto Pubblicità e comunicazione Promozioni e offerte s peciali Consigli per l'utilizzo Prezzo Notorietà della marca Initial 1.000 1.000 1.000 1.000 1.000 Extraction .717 .746 .588 .670 .631 1.000 .332 1.000 1.000 1.000 1.000 .674 .762 .689 .600 1.000 .579 1.000 .414 1.000 1.000 1.000 .599 .432 .494 1.000 .717 1.000 .736 1.000 1.000 1.000 .463 .653 .716 Extraction Method: Principal Component Analysis. Analisi fattoriale • Aspetti Interpretativi: La matrice delle saturazioni (factor loadings) – La parte forse più rilevante dell’output di analisi fattoriale è costituita dalla cosiddetta “component matrix”, che riporta le correlazioni tra le variabili originarie e le componenti individuate (factor loadings) – Ciascuna variabile viene associata in particolare al fattore col quale possiede la correlazione più elevata – Il fattore viene quindi interpretato considerando le variabili ad esso associate Component Matrixa Qualità degli ingredienti Genuinità Leggerezza Sapore/gusto Caratteristiche nutrizionali Attenzione a bisogni s pecifici Lievitazione naturale Produzione artigianale Forma e s tampo Richiamo alla tradizione Grandezza della confezione (peso netto) Funzionalità della confezione Estetica della confezione Scadenza Nome del biscotto Pubblicità e comunicazione Promozioni e offerte s peciali Consigli per l'utilizzo Prezzo Notorietà della marca 1 .418 .383 .426 .163 .410 2 -.513 -.717 -.478 -.079 -.364 Component 3 4 .072 .099 .082 -.080 .136 -.349 .195 .671 .298 -.417 .410 -.220 -.214 -.197 -.032 -.172 .624 .573 .482 .615 -.360 -.339 .320 .046 -.309 -.160 -.272 -.269 .019 .377 .202 .372 -.228 -.374 .430 -.082 -.083 -.109 -.234 -.045 .403 .287 .461 .196 .209 -.197 .483 .131 .162 -.123 .081 -.340 .463 .390 .416 .439 -.158 .306 -.383 .100 -.383 -.026 .088 -.126 .174 -.473 .252 -.118 -.118 .032 .421 .525 -.145 -.331 -.062 .361 .340 .419 .660 -.062 -.025 .073 .629 .429 .413 .123 .265 .434 .093 .594 -.115 -.173 .129 -.121 -.058 -.166 -.305 .104 -.047 .486 Extraction Method: Principal Component Analysis. a. 6 components extracted. 5 .375 .137 .162 .229 .100 6 .353 .231 .105 .310 -.240 Analisi fattoriale • Aspetti Interpretativi: La rotazione dei fattori – Esistono infiniti output di analisi fattoriale compatibili con gli stessi dati di input – Ovviamente questi infiniti output in generale non forniscono interpretazioni del fenomeno pesantemente contrastanti tra loro, ma differiscono solo marginalmente e nelle aree di ambiguità Analisi fattoriale CFj CF*j x1 x4 CF*i x2 CFi x3 le coordinate nel grafico sono i factor loadings interpretazione dei fattori Analisi fattoriale • Aspetti Interpretativi: La rotazione dei fattori – Il metodo di rotazione Varimax, proposto da Kaiser, ha come obiettivo la minimizzazione del numero di variabili che possiedono saturazioni elevate per ciascun fattore, – Il metodo Quartimax cerca di minimizzare il numero di fattori fortemente correlati a ciascuna variabile, – Il metodo Equimax è una combinazione di Varimax e Quartimax – La percentuale di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la percentuale di varianza spiegata da ciascun fattore Total Variance Explained Analisi Fattoriale Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total 4.171 2.678 1.843 1.376 1.129 1.016 .937 .881 .781 .751 .682 .592 .568 .550 .453 .386 .376 .324 .270 .236 Initial Eigenvalues % of Variance Cumulative % 20.853 20.853 13.389 34.241 9.216 43.457 6.879 50.336 5.643 55.979 5.079 61.057 4.684 65.741 4.405 70.146 3.907 74.054 3.756 77.810 3.412 81.222 2.960 84.183 2.838 87.021 2.750 89.771 2.267 92.038 1.930 93.968 1.880 95.848 1.621 97.470 1.352 98.822 1.178 100.000 Extraction Method: Principal Component Analysis. Rotation Sums of Squared Loadings Total % of Variance Cumulative % 2.490 12.448 12.448 2.294 11.468 23.917 2.214 11.068 34.984 2.203 11.016 46.000 1.736 8.680 54.680 1.276 6.378 61.057 Communalities Qualità degli ingredienti Genuinità Leggerezza Sapore/gusto Caratteristiche nutrizionali Attenzione a bisogni s pecifici Lievitazione naturale Produzione artigianale Forma e s tampo Richiamo alla tradizione Grandezza della confezione (peso netto) Funzionalità della confezione Estetica della confezione Scadenza Nome del biscotto Pubblicità e comunicazione Promozioni e offerte s peciali Consigli per l'utilizzo Prezzo Notorietà della marca Initial 1.000 1.000 1.000 1.000 1.000 Extraction .717 .746 .588 .670 .631 1.000 .332 1.000 1.000 1.000 1.000 .674 .762 .689 .600 1.000 .579 1.000 .414 1.000 1.000 1.000 .599 .432 .494 1.000 .717 1.000 .736 1.000 1.000 1.000 .463 .653 .716 Extraction Method: Principal Component Analysis. Rotated Component Matrixa Genuinità Leggerezza Qualità degli ingredienti Caratteristiche nutrizionali Attenzione a bisogni s pecifici Promozioni e offerte s peciali Prezzo Grandezza della confezione (peso netto) Funzionalità della confezione Forma e s tampo Estetica della confezione Nome del biscotto Produzione artigianale Lievitazione naturale Scadenza Richiamo alla tradizione Notorietà della marca Pubblicità e comunicazione Consigli per l'utilizzo Sapore/gusto Component 3 4 -.123 .237 -.007 .096 .078 .080 .009 .111 1 .795 .748 .716 .619 2 -.089 .072 -.026 .312 5 -.051 .050 .007 -.127 6 .178 -.104 .437 -.349 .327 -.054 .243 .324 .020 -.239 .002 .799 -.052 -.111 .286 .035 -.015 .764 -.063 .180 .154 .092 .017 .697 .250 .006 -.067 .159 .158 .448 .334 .165 -.028 -.219 -.011 -.096 .071 .158 .369 .066 .023 -.083 .163 .065 -.040 .028 -.103 .211 .082 .108 .799 .704 .624 .083 .224 -.137 .439 .103 .070 .107 .005 .836 .681 .593 .566 .161 -.024 .268 .309 -.023 .094 .078 .132 .811 .137 -.076 -.047 .172 -.065 -.086 .251 .051 -.002 .139 .310 -.055 .764 -.119 .282 .048 .342 .163 .228 .025 .234 .083 .394 -.074 -.064 .793 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kais er Normalization. a. Rotation converged in 6 iterations. Analisi fattoriale • • • Una volta scelta la soluzione ottimale, è possibile utilizzare i fattori ottenuti come nuove “macro-variabili” da inserire in ulteriori analisi sul fenomeno indagato, al posto delle variabili originarie; Considerando ancora l’esempio proposto, nel file di dati si potranno aggiungere 6 nuove variabili: – Salute, – Convenienza & Praticità, – Immagine, – Artigianalità, – Comunicazione, – Sapore & Gusto. Si tratta di variabili standardizzate (ovvero a media nulla e varianza unitaria), che costituiranno l’input per le analisi successive (dipendenza e/o interdipendenza). Analisi fattoriale Individuazione variabili di analisi standardizzazione metodo c.p. prime evidenze numero di fattori rotazione interpretazione