APPLICAZIONE DELL’ANALISI IN COMPONENTI PRINCIPALI Si considerano 50 questionari di contribuenti, relativi al periodo di imposta 2000, appartenenti al settore dell’abbigliamento, individuato dal codice SM05A comprendente tre categorie di attività: o confezioni per adulti (codice 52421), o confezioni per bambini e neonati (codice 52422) o biancheria personale, maglieria, camicie (codice 52423). Per ristabilire un rapporto tra: o numero di casi (50 numero esiguo dovuto alla difficoltà di reperire questionari per lo stesso settore) e o variabili si è effettuata una selezione ragionata, in alcuni casi raggruppando le variabili, in altri eliminandole. Alla fine, delle 50 variabili iniziali, ne sono state considerate 25. PERSONALE ADDETTO ALL’ATTIVITA’ Le 13 voci previste dal questionario (A01-A13) per il PERSONALE ADDETTO ALL’ATTIVITÀ sono state ridotte a due gruppi. L’elemento selettivo per il raggruppamento è stato ravvisato nell’esistenza o meno di un rapporto di lavoro, che, in caso positivo, porta alla rilevazione delle giornate retribuite. PRIMO GRUPPO (esistenza di un rapporto di lavoro) SECONDO GRUPPO (assenza di un contratto di lavoro) A01-A04 A05-A13 UNITA’ LOCALI Per le UNITA’ LOCALI le variabili prese in considerazione sono: o la potenza impegnata nell’attività (B03), o i locali per la vendita o l’esposizione interna della merce (B04), o i locali destinati a magazzino (B05), o i metri quadri degli uffici (B06), ELEMENTI SPECIFICI DELL’ATTIVITA’ ABB. CLASSICO (D03) TIPOLOGIA DELL’OFFERTA ABB. MODALE (D04) ABB. SPORTIVO (D05) ABB. CASUAL-JEANS (D06) FINE (D18) FASCIA QUALITATIVA DELL’OFFERTA MEDIO -FINE (D19) MEDIA (D20) ECONOMICA (D21) DA INTERMEDIARI del COMMERCIO (D25) MODALITA’ D’ACQUISTO DA COMMERCIANTI ALL’INGROSSO (D26) ACQ. DIRETTO DA PRODUTTORI (D26) ELEMENTI CONTABILI ESISTENZE INIZIALI (F01) RIMANENZE FINALI (F05) COSTI DI ACQUISTO (F09) COSTO per la PRDODUZIONE DI SERVIZI (F10) VALORE DEI BENI STRUMENTALI (F11) SPESE per LAVORO DIPENDENTE (F12) SPESE per ACQUISTI DI SERVIZI (F13) RICAVI (F14) Per l’applicazione dell’ACP Si è costruita la tabella dei dati che presenta sulle righe i 50 contribuenti e sulle colonne le 25 variabili ed al cui interno, in relazione a ciascun contribuente, sono riportati i valori delle variabili. n A01 A05 B03 0B4 B05 B06 D03 D04D05 D06D18 D19 D20 D21 D25 D26 D27 F01 F05 F09 F10 F11 F12 F13 F14 1 318 2 15 80 15 5 70 30 0 0 1 1 0 0 50 50 0 364 545319 786676 0 16600 2098417928 704758 2 0 3 15 70 0 0 0 0 0 100 0 0 0 1 0 100 0 144228 189000 460168 0 21800 0 15431 533598 3 0 3 15 70 0 0 0 0 0 100 0 0 0 1 0 100 0 189000 239000 451782 3908 0 0 17349 526373 4 0 2 3 45 0 0 0 100 0 0 0 0 0 1 0 100 0 25750 68538 72720 0 1300 0 1273 58925 5 0 2 3 45 0 0 0 100 0 0 0 0 0 1 0 100 0 68538 69425 61940 0 1300 0 1002 86033 6 0 3 6 50 50 0 80 0 0 20 0 1 0 0 80 0 20 112000 1150001043249 0 0 0 2422 1135124 7 2495 5 20 80 19 0 50 40 0 10 1 1 0 0 92 0 8 805052 8370432421839 0 157647452723518663332659 8 2476 5 20 80 19 0 50 40 0 10 1 1 0 0 92 0 8 837043 8070322449190 0 141365522025149473393281 9 0 2 10 100 0 0 100 0 0 0 0 1 0 0 100 0 0 664032 847942 756578 0 9604 327 11084 791063 10 0 2 6 30 0 0 60 10 0 30 0 0 0 1 80 10 10 191647 259770 346746 0 22745 0 10587 336808 11 0 2 6 30 0 0 60 10 0 30 0 0 0 1 80 10 10 259770 292036 313529 0 26578 3000 13100 356014 12 0 0 6 35 5 0 20 50 30 0 0 1 0 0 65 18 17 215275 226500 138948 0 41958 0 5115 171503 13 251 2 6 30 0 0 10 70 5 15 0 1 0 0 30 0 70 291188 329737 162455 0 114547 25351 3298 233848 14 0 0 6 80 0 0 0 80 5 15 0 0 0 1 0 95 5 8680 8610 72863 0 41024 0 6153 109347 15 312 2 15 30 20 0 18 41 34 7 0 0 1 0 100 0 0 305140 308212 82244221079 19000 32736136151050370 16 250 2 15 30 40 0 20 30 6 44 0 0 1 0 87 0 13 332840 303140 538889 6224 27212 24115 7583 740950 17 0 0 10 50 5 0 90 0 10 0 0 1 1 0 0 0 100 496364 565080 399293 0 31316 0 16963 471523 38 39 40 41 42 43 44 45 46 47 48 49 50 312 0 0 0 0 208 277 0 0 0 0 0 655 2 2 2 2 2 1 1 1 0 0 1 2 2 10 6 6 6 15 15 15 6 6 6 15 10 20 25 70 35 35 26 38 38 70 36 36 26 54 114 10 0 0 0 10 0 10 0 0 0 12 0 12 0 50 0 25 0 25 0 0 0 50 0 70 12 0 100 100 0 50 50 50 50 100 0 85 0 85 0 70 0 0 72 0 76 100 0 0 0 60 25 0 0 0 0 0 0 15 30 0 0 0 10 10 0 0 0 0 0 15 0 0 28 24 0 90 5 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 1 0 0 1 0 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 1 1 0 0 0 0 100 20 20 0 100 100 100 0 0 0 20 100 10 90 40000 46000 42463 0 0 66564 67595 72570 80 0 120132 162415 165787 80 0 162415 104205 176073 0 100 42521 46755 108666 0 0 345000 380000 203722 0 0 380000 420000 158592 0 0 208700 211470 411420 100 0 307482 293534 96721 100 0 294577 307482 96621 0 100 45570 42521 57008 80 0 159305 174530 198468 0 0 227543825143281825349 0 0 0 0 0 0 0 0 0 0 0 0 0 93775 3500 18537 18537 24249 138465 138465 40849 4216 4216 32101 14617 258855 3787610354 100907 0 2655 131448 0 5241 147999 0 5058 262669 0 6766 145673 2679113923 239872 3542311822 193981 0 16922 530950 0 4866 143870 0 5845 108832 0 11441 84869 0 10524 230000 90485517691865562 STATISTICHE DESCRITTIVE PER CIASCUNA VARIABILE VARIABILI MEDIA VARIANZA A02 0.2088E+03 0.2448E+06 A13 ……….. 0.1860E+01 ………… 0.1360E+01 ………. F12 0.3236E+05 0.9173E+10 F13 0.1188E+05 0.1139E+09 F14 0.5317E+06 0.4815E+12 le variabili contabili presentano la maggiore varianza (in particolare F14, F09, F05, F01). Ciò si verifica in quanto i valori assunti da queste variabili presentano un campo di variazione elevato: si passa dai milioni ai miliardi. MATRICE DELLE CORRELAZIONI A02 A13 B03 B04 B05 B06 D03 D04 D05 D06 D18 D19 D20 D21 D25 D26 D27 F01 F05 F09 F10 F11 F12 F13 F14 A02 1,00 0,59 0,54 0,33 0,15 0,17 0,03 0,11 -0,05 -0,14 0,55 0,33 0,00 -0,28 0,34 -0,28 -0,07 0,42 0,40 0,83 0,02 0,45 0,98 0,53 0,89 A13 0,59 1,00 0,44 0,28 0,10 0,03 0,02 -0,07 -0,18 0,13 0,32 -0,03 0,08 -0,03 0,30 -0,06 -0,22 0,10 0,11 0,51 0,05 0,22 0,58 0,34 0,55 B03 0,54 0,44 1,00 0,40 0,22 0,39 0,26 -0,27 0,06 -0,07 0,40 0,47 0,18 -0,43 0,31 -0,36 0,08 0,51 0,51 0,56 0,16 0,57 0,48 0,66 0,55 B04 0,33 0,28 0,40 1,00 0,39 0,59 0,13 -0,06 0,08 -0,13 0,50 0,31 0,02 -0,08 0,43 -0,10 -0,33 0,61 0,64 0,61 -0,10 0,48 0,32 0,53 0,56 B05 0,15 0,10 0,22 0,39 1,00 0,49 0,10 -0,15 0,23 -0,05 0,25 0,19 0,45 -0,41 0,39 -0,29 -0,12 0,54 0,52 0,42 0,04 0,46 0,11 0,25 0,36 B06 0,17 0,03 0,39 0,59 0,49 1,00 0,09 0,01 0,02 -0,13 0,58 0,29 0,24 -0,18 0,25 -0,11 -0,16 0,80 0,84 0,51 -0,05 0,59 0,09 0,49 0,38 D03 0,03 0,02 0,26 0,13 0,10 0,09 1,00 -0,61 -0,12 -0,58 0,10 0,51 -0,02 -0,42 0,42 -0,70 0,27 0,12 0,14 0,10 -0,18 0,09 0,02 0,09 0,08 D04 0,11 -0,07 -0,27 -0,06 -0,15 0,01 -0,61 1,00 -0,19 -0,22 0,11 -0,28 -0,03 0,21 -0,31 0,36 -0,02 -0,09 -0,09 -0,06 0,05 0,00 0,10 -0,17 -0,04 D05 -0,05 -0,18 0,06 0,08 0,23 0,02 -0,12 -0,19 1,00 -0,02 -0,03 0,14 0,31 -0,34 0,22 -0,15 -0,11 0,20 0,15 0,02 0,32 0,24 -0,06 0,23 0,04 D06 -0,14 0,13 -0,07 -0,13 -0,05 -0,13 -0,58 -0,22 -0,02 1,00 -0,23 -0,41 -0,05 0,45 -0,29 0,57 -0,28 -0,13 -0,14 -0,08 0,05 -0,21 -0,11 -0,01 -0,07 D18 0,55 0,32 0,40 0,50 0,25 0,58 0,10 0,11 -0,03 -0,23 1,00 0,30 -0,08 -0,31 0,26 -0,03 -0,26 0,50 0,53 0,63 -0,09 0,44 0,52 0,43 0,59 D19 0,33 -0,03 0,47 0,31 0,19 0,29 0,51 -0,28 0,14 -0,41 0,30 1,00 -0,25 -0,60 0,36 -0,58 0,18 0,42 0,45 0,44 -0,19 0,43 0,30 0,31 0,40 D20 0,00 0,08 0,18 0,02 0,45 0,24 -0,02 -0,03 0,31 -0,05 -0,08 -0,25 1,00 -0,33 -0,06 -0,20 0,33 0,28 0,26 0,07 0,25 0,32 -0,06 0,23 0,06 D21 -0,28 -0,03 -0,43 -0,08 -0,41 -0,18 -0,42 0,21 -0,34 0,45 -0,31 -0,60 -0,33 1,00 -0,31 0,64 -0,33 -0,28 -0,27 -0,30 -0,08 -0,32 -0,22 -0,29 -0,30 D25 0,34 0,30 0,31 0,43 0,39 0,25 0,42 -0,31 0,22 -0,29 0,26 0,36 -0,06 -0,31 1,00 -0,61 -0,46 0,35 0,37 0,45 0,18 0,27 0,30 0,27 0,41 D26 -0,28 -0,06 -0,36 -0,10 -0,29 -0,11 -0,70 0,36 -0,15 0,57 -0,03 -0,58 -0,20 0,64 -0,61 1,00 -0,36 -0,29 -0,29 -0,30 -0,09 -0,35 -0,24 -0,18 -0,30 D27 -0,07 -0,22 0,08 -0,33 -0,12 -0,16 0,27 -0,02 -0,11 -0,28 -0,26 0,18 0,33 -0,33 -0,46 -0,36 1,00 -0,11 -0,13 -0,19 -0,11 0,10 -0,08 -0,08 -0,15 F01 0,42 0,10 0,51 0,61 0,54 0,80 0,12 -0,09 0,20 -0,13 0,50 0,42 0,28 -0,28 0,35 -0,29 -0,11 1,00 0,98 0,71 -0,02 0,78 0,36 0,62 0,63 F05 0,40 0,11 0,51 0,64 0,52 0,84 0,14 -0,09 0,15 -0,14 0,53 0,45 0,26 -0,27 0,37 -0,29 -0,13 0,98 1,00 0,71 -0,03 0,76 0,34 0,62 0,61 F09 0,83 0,51 0,56 0,61 0,42 0,51 0,10 -0,06 0,02 -0,08 0,63 0,44 0,07 -0,30 0,45 -0,30 -0,19 0,71 0,71 1,00 0,10 0,53 0,81 0,64 0,98 F10 0,02 0,05 0,16 -0,10 0,04 -0,05 -0,18 0,05 0,32 0,05 -0,09 -0,19 0,25 -0,08 0,18 -0,09 -0,11 -0,02 -0,03 0,10 1,00 -0,10 -0,01 0,02 0,11 F11 0,45 0,22 0,57 0,48 0,46 0,59 0,09 0,00 0,24 -0,21 0,44 0,43 0,32 -0,32 0,27 -0,35 0,10 0,78 0,76 0,53 -0,10 1,00 0,40 0,49 0,49 F12 0,98 0,58 0,48 0,32 0,11 0,09 0,02 0,10 -0,06 -0,11 0,52 0,30 -0,06 -0,22 0,30 -0,24 -0,08 0,36 0,34 0,81 -0,01 0,40 1,00 0,47 0,88 F13 0,53 0,34 0,66 0,53 0,25 0,49 0,09 -0,17 0,23 -0,01 0,43 0,31 0,23 -0,29 0,27 -0,18 -0,08 0,62 0,62 0,64 0,02 0,49 0,47 1,00 0,64 F14 0,89 0,55 0,55 0,56 0,36 0,38 0,08 -0,04 0,04 -0,07 0,59 0,40 0,06 -0,30 0,41 -0,30 -0,15 0,63 0,61 0,98 0,11 0,49 0,88 0,64 1,00 La matrice delle correlazioni tra le 25 variabili fornisce una preliminare informazione sull’intensità e la direzione della relazione che c’è tra le variabili. Ad esempio la variabile “rimanenze finali” (F05) è fortemente legata in misura positiva con quella “esistenze iniziali” (F01), infatti il coefficiente di correlazione è pari allo 0,98, invece tra le variabili “valore dei beni strumentali (F11) e “abbigliamento classico” (D04) non c’è relazione lineare, esse hanno una correlazione assai prossima a zero. Componente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 autovalore 8,763 3,277 2,481 1,875 1,772 1,357 1,058 ,821 ,713 ,656 ,532 ,445 ,354 ,234 ,193 ,169 ,117 ,071 ,037 ,031 ,023 ,013 ,006 ,001 -1,03E-16 % di var. 35,051 13,106 9,925 7,500 7,087 5,429 4,232 3,283 2,851 2,624 2,129 1,779 1,418 ,937 ,773 ,675 ,470 ,286 ,149 ,126 ,091 ,052 ,024 ,004 -4,114E-16 % var cumulata 35,051 48,157 58,082 65,582 72,670 78,098 82,330 85,613 88,463 91,088 93,217 94,996 96,414 97,351 98,123 98,799 99,268 99,554 99,704 99,829 99,920 99,972 99,996 100,000 100,000 La tabella degli AUTOVALORI presenta in ordine decrescente, la percentuale di varianza spiegata associata a ciascun fattore. Ad esempio: o il primo autovalore spiega il 35% della variabilità totale, oil secondo il 13%, il terzo il 10%, e così via. Avendo considerato in questo esempio 4 FATTORI, la quota cumulata di variabilità spiegata, è pari al 65,5%; ciò significa che l’informazione che si perde è pari al 34,5%. Grafico decrescente degli autovalori 8 Autovalore 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Numero componente Contributo delle variabili nella definizione dei primi 4 fattori. VARIABILI FATTORI 1 2 3 4 A02 0,54 0,10 0,24 0,04 A13 0,18 0,16 0,17 0,07 B03 0,51 0,00 0,01 0,04 … … … … … D05 0,03 0,05 0,16 0,20 D06 0,07 0,31 0,04 0,05 …. … … … … F01 0,69 0,00 0,18 0,02 F05 0,70 0,00 0,18 0,04 La matrice dei “contributi” misura l’importanza relativa delle 4 componenti per ciascuna delle 25 variabili, ovvero la relazione che ciascuna variabile ha con i 4 fattori. Ad es. per la prima variabile il primo fattore presenta un’importanza pari al 54%, il secondo il 10% il terzo il 24% e il quarto lo 0,04%, ciò significa che la prima variabile apporta un contributo maggiore alla definizione del primo fattore rispetto agli altri tre; invece la variabile A13 presenta un basso contributo per tutti e quattro i Le rappresentazioni grafiche ottenute sono 3 avendo optato per la rappresentazione o delle sole variabili, o degli individui o e contemporaneamente delle variabili e degli individui Per una più agevole lettura dei risultati si è considerato uno spazio a due dimensioni, delimitato dalle prime due componenti Considerando il primo grafico (delle variabili) ricordando che il primo asse, collegato al primo autovalore, spiega il 35% della varianza totale, si effettua proiezione dei punti-variabili su tale asse. GRAFICO DEI CONTRIBUENTI COME LEGGERLO? COME INTERPRETARLO? la VARIABILI classico D03 produttori D27 medio-fine D19 intermediari D25 D20 B05 Beni strumentali F11 D05 B03 F01 F05 F10 B06 F13 B04 Costi di acq. D18 fine F09 F14 ricavi A02 F12 Spese lav. dip A13 D04 Casual-jeans D06 D21 economica D26 ingrosso Dalla proiezione dei punti proiettati si evince la CONTRAPPOSIZIONE o da un lato, delle variabili che rappresentano la “fascia qualitativa dell’offerta” di tipo economico (D21) e “la modalità di acquisto” da commercianti all’ingrosso (D26) o dall’altro delle variabili che si riferiscono alla “fascia qualitativa dell’offerta” di tipo fine (D18) e medio-fine (D19) e quella che si riferisce alla “modalità di acquisto” da intermediari del commercio (D25) Non vi è, invece, contrapposizione tra le variabili contabili, le quali, rispetto a questo asse, si presentano tutte raggruppate nella parte sinistra del grafico. L’elemento che contribuisce maggiormente a fornire una interpretazione di questa prima componente principale è la QUALITÀ DEI PRODOTTI OFFERTI dalle attività in analisi: o da un lato, infatti, si collocano quelle che hanno una vendita di prodotti prettamente economica, che si riforniscono da commercianti all’ingrosso o dall’altro quelle con un commercio di articoli di media ed alta qualità, acquistati tramite intermediari del commercio. Allo stesso modo si procede per l’asse verticale, collegato al secondo autovalore che spiega il 13% della variabilità totale. In questo caso la contrapposizione è: o “tipologia dell’offerta” casual-jeans (D06), la “fascia qualitativa dell’offerta di articoli” economica (D21) e “la modalità di acquisto” da commercianti all’ingrosso (D26) o dall’altro tra “la tipologia di abbigliamento” classico (D03), la “fascia di offerta” medio-fine (D19) e la “modalità di acquisto” diretto da produttori (D27). Su tale asse, si può notare una certa contrapposizione tra le variabili contabili, in particolar modo tra la variabile “valore dei beni strumentali” (F11) e le variabili “costi di acquisto” (F09), “ricavi” (F14) e “spese per lavoro dipendente” (F12). In questo caso, l’elemento che contribuisce ad interpretare la seconda componente principale è la TIPOLOGIA DI ABBIGLIAMENTO: classico, per un verso, modale e casual-jeans, per l’altro. Le restanti variabili (quelle riguardanti il personale addetto all’attività, le unità locali destinate alla vendita e gli altri elementi contabili) incidono poco sulla discriminazione degli assi, posizionandosi nei pressi del baricentro. Il GRAFICO DEI CONTRIBUENTI mostra, con riferimento al primo asse, la contrapposizione tra: o i contribuenti individuati dalle etichette 23, 50, 8, 7, da un lato, o ed i contribuenti 4, 35, 14, 26, 32, dall’altro. CONTRIBUENTI 17 48 19 42 30 32 44 45 25 9 20 43 18 24 12 31 6 28 13 34 37 15 23 21 16 1 10 50 27 29 40 49 14 26 4 35 2 8 7 3 Considerando il SECONDO ASSE, si contrappongono: o da una parte, i contribuenti 17, 48, 19, 24, 32, 30, 44, 45, 20, 43, 18, 24, 12, o dall’altra i contribuenti 2, 3, 7, 8, 14, 26, 4, e 35. Sul terzo grafico sono posizionate SIA LE VARIABILI CHE I CONTRIBUENTI. 17 48 42 19 30 32 44 45 43 25 9 24 31 28 20 18 12 6 D03 D27 23 21 B06 50 1 D19 D25 B03 B04 A02 B05 16 13 34 37 F10 10 A13 D04 D06 29 D21 D26 49 27 40 14 26 8 7 2 3 4 35 L’interpretazione degli assi, in questo caso, è una sintesi dell’interpretazione dei due precedenti. Quindi con riferimento al primo asse, insistono sulla parte dell’offerta di prodotto di qualità più elevata IL GRUPPO DI CONTRIBUENTI 7, 8, 23, E 50, o mentre dalla parte opposta dell’offerta economica sono posizionati i contribuenti 4, 35, 14, 26, 32. Per il secondo asse, che contrappone maggiormente le fonti d’acquisto e la tipologia del prodotto, in aggiunta ad una minima influenza dei valori contabili, si rileva il gruppo dei contribuenti 2, 3, 7, 8, 14, 26, 4, e 35 associato ad una vendita di abbigliamento casual-jeans e modale, di qualità economica e si riforniscono da commercianti all’ingrosso e quello dei contribuenti 17, 48, 19, 24, 32, 30, 44, 45, 20, 43, 18, 24, 12 caratterizzato da una vendita di abbigliamento classico, qualitativamente fine o medio-fine, i quali acquistano o direttamente dalle imprese oppure tramite rappresentanti del commercio.