Trasformazione dei dati: indici - 1
• Come già visto in termini teorici, spesso le proprietà che si intende
rilevare sono molto generali (es. religiosità di un individuo)
• Per questo motivo, la proprietà generale viene scomposta in più
dimensioni specifiche (es. frequenza con cui si prega, impegno
nell’associazionismo religioso, ecc…)
• Per ogni dimensione specifica si costruisce una definizione
operativa e si ricava, infine, una variabile.
• Una volta raccolte le informazioni può essere utile sintetizzare
queste variabili in un’unica nuova variabile, che corrisponderà alla
proprietà più generale (nel nostro esempio, religiosità)
INDICE
Trasformazione dei dati: indici - 2
•
La modalità di costruzione di un indice dipende dal tipo di
variabili che abbiamo a disposizione:
1. Variabili cardinali = indice additivo (costruzione
dell’indice attraverso operazioni aritmetiche). Può essere
usato anche con variabili ordinali trattare cardinalmente.
La nuova variabile sarà cardinale
2. Variabili nominali = indice tipologico (costruzione
dell’indice attraverso operazioni logiche). Può essere
usato anche con variabili ordinali, non trattate
cardinalmente.
La nuova variabile sarà nominale/ordinale
Trasformazione dei dati: indici - 3
L’indice additivo può essere calcolato sommando semplicemente i valori di due
o più variabili.
I = V1 + V2 + V3 + … + Vk
Dove I è l’indice, V1, V2, ecc… sono le variabili cardinali selezionate per
costruire l’indice.
V1 = Quante volte frequenta la messa in un
mese
V2 = Quante volte al mese è impegnato in
associazioni religiose
V1
V2
V3
V1+V2+V3
Caso 1
1
1
3
5
Caso 2
1
2
1
4
Caso 3
4
3
2
9
V3 = Quanto ritiene debba essere importante il
tema della famiglia nella politica italiana
Caso 4
5
5
5
15
V1, V2
Caso 5
1
1
1
3
1 “Mai”, 2 “Raramente”, 3 “Qualche volta”, 4
“Spesso”, 5 “Sempre”
Caso 6
2
1
3
6
V3
1 “Per nulla importante”, 2 “Poco imp.”, 3 “Né
molto né poco imp.”, 4 “Abbastanza imp.”, 5
“Molto imp.”
Indice I = campo di variazione 3÷15
Trasformazione dei dati: indici - 4
Spesso, però, le variabili che vogliamo sommare sono diverse tra loro, specie
per due caratteristiche:
1. Direzione “semantica”. Prima della costruzione dell’indice è
necessario che tutte le variabili abbiano lo stesso ordine “semantico”
e questo coincida con l’ordine che vogliamo dare all’indice. Se ciò
non accade, è necessario invertire i punteggi attraverso una
ricodifica.
2. Campi di variazione. E’ necessario che tutte le variabili condividano
lo stesso campo di variazione. Come sappiamo si può utilizzare la
normalizzazione o la standardizzazione. La prima è più indicata per
variabili con poche modalità (generalmente ordinali trattate come
cardinali – cfr. esempi precedenti); la seconda, invece, è utile per
variabili cardinali con molte modalità
Trasformazione dei dati: indici - 5
V1 = Quante volte frequenta la messa in un mese
5 “Mai”, 4 “Raramente”, 3 “Qualche volta”, 2 “Spesso”, 1 “Sempre”
V2 = Quante volte al mese è impegnato in associazioni religiose
1 “Mai”, 2 “Raramente”, 3 “Qualche volta”, 4 “Spesso”, 5 “Sempre”
V3 = Da 0 a 10, quanto ritiene debba essere importante il tema della famiglia nella politica italiana
• In questo caso sarà necessario ricodificare la variabile V1 (l’ordine “semantico”
delle modalità è diverso da quello delle altre due variabili e dall’orientamenteche
si vuole dare all’indice finale)
• Bisogna successivamente omogeneizzare i campi di variazione delle variabili.
Si può decidere, ad esempio, di normalizzare la V3 per farla variare da 1 a 5,
oppure normalizzare tutte le variabili affinché varino all’interno di una campo di
variazione pari, ad esempio, a 1÷10
Trasformazione dei dati: indici - 6
RICODIFICA
V1 = Quante volte frequenta la messa in un mese
5 “Mai”, 4 “Raramente”, 3 “Qualche volta”, 2 “Spesso”, 1 “Sempre”
 1 “Mai”, 2 “Raramente”, 3 “Qualche volta”, 4 “Spesso”, 5 “Sempre”
V1
V1_r
V2
V3
V1r_n
V2_n
V3_n
I
NORMALIZZAZIONE
Caso 1
5
1
1
4
0
0
2
2
V1, V2
Caso 2
5
1
2
0
0
1.25
0
1.25
5 × (X – 1) / (5 – 1)
Caso 3
2
4
3
6
3.75
2.50
3
6.25
Caso 4
1
5
5
10
5
5
5
15
Caso 5
5
1
1
0
0
0
0
0
Caso 6
4
2
1
3
1.25
0
1.50
2.75
V3
5 × (X – 0) / (10 – 0)
Indice I  0÷15
Trasformazione dei dati: indici - 7
• Si può decidere, infine, di considerare alcune
compongono l’indice, più “importanti” e, quindi, di
computo. Detto in altri termini, è possibile associare
variabile, affinché essa abbia un ruolo più importante
in questo caso, assumerà la seguente formula:
variabili, di quelle che
farle valere “di più” nel
un peso ad ogni singola
nell’indice finale. L’indice,
I = (P1 × V1) + (P2 × V2) + (P3 × V3) + … + (Pk × Vk)
Dove I è l’indice che si intende creare, V1, V2, ecc… sono le variabili che
compongono l’indice, e P1, P2, ecc… sono i pesi assegnati ad ogni variabile.
Il peso può variare da 0 a +. Se il peso è pari a 1, la formula è uguale a quella
presentata in precedenza.
Trasformazione dei dati: indici – 8
Variabili V1, V2 e V3
V1 = Quante volte frequenta la messa in un mese  peso pari a 2
V2 = Quante volte al mese è impegnato in associazioni religiose  peso pari a 3
V3 = Quanto ritiene debba essere importante il tema della famiglia nella politica italiana 
peso pari a 1
I_p = (2 x V1) + (3 x V2) + (1 x V3)
V1
V1_r
V2
V3
V1r_n
V2_n
V3_n
I
I_p
Caso 1
5
1
1
4
0
0
2
2
2
Caso 2
5
1
2
0
0
1.25
0
1.25
3.75
Caso 3
2
4
3
6
3.75
2.50
3
6.25
18
Caso 4
1
5
5
10
5
5
5
15
30
Caso 5
5
1
1
0
0
0
0
0
0
Caso 6
4
2
1
3
1.25
0
1.50
2.75
4
Indice I_p  0÷30
Contatti
Domingo Scisci
Università di Milano-Bicocca
Via Bicocca degli Arcimboldi 8 20126 Milano
Edificio U7/II Piano
Stanza 207
Telefono: 02 64487513
Mail: [email protected]
Quest'opera è stata rilasciata sotto la licenza Creative Commons Attribuzione-Non commerciale-Condividi allo stesso
modo 2.5 Italia. Per leggere una copia della licenza visita il sito web http://creativecommons.org/licenses/by-nc-sa/2.5/it/
o spedisci una lettera a Creative Commons, 171 Second Street, Suite 300, San Francisco, California, 94105, USA.
Scarica

lezione_20080529_stat_soc