Guida alle funzioni base di SPSS
SPSS è un software per certi aspetti molto sofisticato, e riuscire a sfruttare al massimo le sue
potenzialità richiede notevoli competenze sia statistiche sia informatiche. Poiché questa guida è
rivolta principalmente ad utilizzatori non esperti in entrambi i campi, come possono essere degli
studenti universitari di psicologia, si cercherà di semplificare al massimo l'esposizione delle
procedure e delle opzioni, in modo che una conoscenza di base dell'uso del computer sia sufficiente
per apprendere le funzioni fondamentali del software.
1. Come organizzare i dati prima di importarli in SPSS
SPSS richiede innanzitutto che i dati siano organizzati in base alla seguente regola:
Le informazioni relative al singolo soggetto devono comparire sulle RIGHE, quelle relative
alle variabili sulle COLONNE
I dati possono essere inseriti direttamente in un file di SPSS, ma data la limitata distribuzione o
disponibilità del software, spesso i dataset vengono costruiti a partire da fogli di calcolo (ad
esempio, in Excel o in OpenOffice Calc). SPSS è in grado di acquisire dati in una grande varietà di
formati, compreso il .xls che contraddistingue i file di Excel. Se si utilizza OpenOffice Calc occorre
evitare di salvare nel formato di default (.ods), per cui una volta inseriti i dati si consiglia di salvare
il documento nel formato Excel mediante la procedura File→Salva con nome→Scelta dal menu
Salva come del formato .xls (Figura 1).
Durante l'inserimento dei dati è fondamentale accertarsi che vi sia una colonna per ogni
variabile oggetto di studio, e che in ogni cella di ogni colonna sia presente un solo dato. Se questo
può sembrare ovvio per variabili come il genere, o la risposta ad un item di un test, può non esserlo
nel caso in cui il soggetto possa scegliere più di una riposta fra quelle proposte, come nel caso della
seguente domanda:
Quali sono i suoi generi cinematografici preferiti? (è possibile indicare più di una risposta)
Animazione
Drammatico
Horror
Avventura
Erotico
Musicale
Biografico
Fantascienza
Storico
Commedia
Fantasy/Fantastico
Thriller
Documentario
Guerra
Western
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 1 Salvataggio in formato Excel di un file in OpenOffice Calc
Poiché i soggetti possono indicare più di una risposta, e la domanda è una sola, potremmo trovarci
nella scomoda posizione di dover inserire nella stessa cella più di un valore (ad esempio
Animazione; Fantasy/Fantastico). In questi casi occorre allora creare una variabile per ogni
alternativa di risposta possibile (nel caso dell'esempio avremo quindi 15 variabili: Animazione,
Avventura, Biografico. […], Western), e indicare con 1 se è stata scelta e con 0 se non è stata scelta
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
dal soggetto. In questo modo si segue la regola "una sola informazione in ogni cella della matrice
casi × variabili".
Se si trova una risposta mancante (in gergo, missing), occorre inserire il codice stabilito per i
valori mancanti o scrivere direttamente “missing” nella cella. Se il codice stabilito per i missing è
un numero, deve essere un valore non valido, ossia non compreso fra quelli possibili per quella
variabile. Ad esempio, se le risposte da inserire sono punteggi su scala Likert da 1 a 5, i valori
possibili sono solo 1, 2, 3, 4 e 5. Il codice per i missing può essere quindi 0, oppure 9. Non esiste un
codice fisso per i missing, in quanto certi valori possono essere impossibili in alcune variabili ma
non in altre: il valore 0 è impossibile nella scala Likert da 1 a 5, ma non nella variabile “Numero di
figli”, per occorre prestare molta attenzione. Il vantaggio di utilizzare il codice numerico per i
missing è che creerà meno problemi nella lettura dei dati quando il file verrà importato in SPSS.
Se vogliamo che SPSS legga i nomi delle variabili così come le abbiamo inserite nel foglio di
calcolo, dobbiamo attenerci ad alcune regole. In primo luogo, è fondamentale che i nomi delle
variabili compaiano solo sulla prima riga del foglio del calcolo. SPSS, infatti, rileva i nomi delle
variabili solo sulla prima riga, mentre considera le informazioni contenute dalla seconda riga in poi
come dati. In secondo luogo, i nomi delle variabili devono seguire le seguenti indicazioni:
•
Non devono superare gli 8 caratteri
•
Il primo carattere non può essere un numero
•
Devono essere evitati gli spazi e i caratteri speciali1
In base a queste specifiche, il nome "Titolo di studio" non è corretto, in quanto è più lungo di otto
caratteri e contiene uno spazio. Occorrerebbe quindi riscriverlo come, ad esempio, "Tit_stu". Si noti
come l'underscore (o "trattino basso") sia consentito, e possa essere utilizzato al posto dello spazio.
Ogni volta che SPSS trova un nome di variabile che non riesce a "digerire", inserisce un nome
di comodo, come VAR00001, VAR00002, anche se mantiene una traccia del nome originale nella
colonna Label (vedi oltre).
SPSS legge anche dati testuali (ad esempio, M o F nella colonna del genere), ma per quanto
sia possibile eseguire una ricodifica numerica dei dati; è più comodo importarli direttamente come
numerici. In questo senso, è preferibile avere il genere codificato come 0 = F e 1 = M, o il titolo di
studio codificato come 0 = Nessuno, 1 = Licenza Elementare, 2 = Licenza Media, etc. A questo
proposito, però, occorre fare una precisazione. Se i dati vengono inseriti manualmente, e sul
cartaceo non c'è una chiara indicazione di come codificare numericamente la risposta (vedi Figura
1
Per le versioni più recenti di SPSS può non essere necessario rispettare queste indicazioni
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 2 Codifica di dati testuali in caso di caselle numerate e non numerate
2), si eviti di fare la codifica "a mente" nel passaggio dal cartaceo al foglio elettronico, in quanto
questa è una procedura ad alta probabilità di errore. Se la codifica numerica non è riportata nel
cartaceo è quindi preferibile inserire il testo ed eseguire su. SPSS le ricodifiche necessarie.
La prima colonna del dataset dovrebbe contenere il codice che deve essere assegnato al soggetto
da chi inserisce i dati provenienti dai protocolli (che potranno essere questionari, batterie, test, etc.). Se per
ragioni di rispetto della privacy non è possibile inserire nome e cognome del soggetto, occorre generare un
codice anonimo oppure una stringa alfanumerica che non consenta a terzi di identificare con certezza il
soggetto. Nel primo caso è fondamentale che il codice anonimo generato da chi inserisce i dati contenga
un numero progressivo, così da poter mettere successivamente in ordine i protocolli, e una qualunque sigla
che identifichi chi ha eseguito l'inserimento. Il modo più semplice, se chi inserisce si chiama Mario Rossi,
è utilizzare le iniziali seguite da un numero: MR001, MR002, etc. Questa procedura è utile se in futuro ci
sarà bisogno di ri-esaminare il cartaceo e/o interpellare chi ha inserito i dati. Se però le esigenze di ricerca
impongono somministrazioni ripetute nel tempo e c'è necessità di appaiare i dati relativi agli individui,
occorre mettere i soggetti in condizione di generare autonomamente ogni volta il proprio codice. Una
possibile soluzione è quella di chiedere di inserire lettere o numeri relativi a caratteristiche immutabili
(come l'iniziale del nome del padre e/o della madre) o relativamente immutabili (come le ultime tre cifre
del numero di cellulare). Se il procedimento di generazione del codice è noto solo al ricercatore e al
soggetto, chiunque altro possa venire in possesso del materiale non troverà che una sigla che, per quanto lo
riguarda, può significare qualunque cosa. Per esempio, si può costruire una serie di caselle come quella in
Figura 3, chiedendo di inserire nella prima casella l'iniziale del nome della madre, nella seconda l'iniziale
del nome del padre e nelle ultime tre caselle le ultime tre cifre del numero di cellulare. Se quindi il numero
di cellulare del soggetto Antonio Bianchi è 3331234567, suo madre si chiama Alessandra e suo padre
Sergio, il codice sarà AS567. Naturalmente le informazioni su come generare il codice non devono per
nessun motivo essere stampate sul foglio dove vengono inseriti i dati.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 3 Inserimento del codice auto-generato dal soggetto per somministrazioni ripetute. Le
istruzioni su come riempire le caselle non devono essere presenti sul foglio
In questo modo ogni volta che dovremo raccogliere informazioni riguardo ad Antonio Bianchi non
avremo il problema che il soggetto potrebbe non ricordarsi il proprio codice, dato che basta ripetere
la procedura di generazione − sperando che non abbia cambiato numero di cellulare nel frattempo!
Quando si inseriscono molti dati nel foglio elettronico, lo schermo scorre a destra e in basso,
per cui la prima colonna e/o la prima riga, contenenti rispettivamente i codici dei soggetti e i nomi
delle variabili, potrebbero non essere più visibili. Per facilitare l’inserimento mantenendo visibili
queste informazioni, basta bloccare sul file di Excel la prima riga e la prima colonna. Si seleziona la
casella B2, si va al menu Finestra e si seleziona Blocca Riquadri (Figura 4a). A questo punto il
bordo destro della prima colonna e quello inferiore della prima riga saranno neri (Figura 4b),
indicando che la colonna e la riga sono “bloccate”, ossia non scompariranno mai dalla visione anche
quando le altre celle scorreranno. Per togliere il "blocco", basta ripetere la procedura selezionando
questa volta Sblocca Riquadri.
Una volta completato l'inserimento, il file dovrebbe apparire come nella parte di destra di
Figura 11 (vedi oltre). Ricordatevi sempre di salvare il file e di chiudere Excel. A questo punto
siamo pronti per l'importazione in SPSS.
2. Come è fatto SPSS
Prima di illustrare la procedura per importare i nostri dati in SPSS, vediamo le caratteristiche principali del
software. Una volta che avete lanciato il programma, vi si aprirà una finestra come quella in Figura 5.
Lasciando selezionato Open an existing data source, e clickando su OK si aprirà una finestra che
consentirà di rintracciare nelle proprie cartelle il file da aprire. Tutte le altre opzioni al momento non ci
interessano, e di fatto non è necessario interagire con questa finestra per accedere al programma, tanto è
vero che può essere esclusa dall'avvio del programma spuntando Don't show this dialog in the future e
clickando su OK. Si accederà a questo punto alla finestra di editor dei dati.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
a)
b)
Figura 4 Come bloccare le celle di Excel per mantenere visibili prima riga e prima colonna del
dataset durante l'inserimento dei dati.
Figura 5 Schermata di dialogo iniziale di SPSS
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
La finestra di editor dei dati appare come un foglio elettronico con le righe numerate e le
colonne che recano l'intestazione var grigiata (Figura 6a).
In basso a sinistra della finestra notiamo due linguette simili a quelle che identificano i vari fogli di
una cartella di Excel: Data View e Variable View (Figura 6b). Data View è la matrice casi ×
variabili, mentre Variable View è il foglio che contiene le informazioni sulle variabili (Figura 7),
della quale si parlerà più estesamente nella sezione 3.
Ritornando al foglio Data View, notiamo come in alto sia presente il consueto menu di funzioni
di comando.
•
File. In questo menu è possibile creare un nuovo file (New) o aprirne uno già esistente
(Open). Scorrendo semplicemente col mouse si apre un sottomenu che permette di scegliere
quale tipo di file si vuole creare o aprire (Figura 8): nel nostro caso ci interessano soprattutto
le opzioni Data (file di dati, estensione .sav), Syntax (file di sintassi, estensione .sps) e
Output (file di output, ossia quello in cui vengono riportati i risultati delle analisi, estensione
.spo, o .spv nelle versioni più recenti). Si noti che in SPSS l'output viene visualizzato in un
file con un formato diverso da quello dei dati. Per quanto grigiata in Figura 8, dato che il file
vuoto, anche le opzioni di salvataggio Save e Save as.. ci saranno utili, perché ci
consentono, rispettivamente, di salvare il file in formato SPSS (.sav) o in altro formato (ad
esempio, Excel o testo). Recently Used Data permette di accedere più rapidamente ai file di
dati aperti di recente, così come Recently Used Files consente di accedere ai più recenti file
a)
b)
Figura 6 Editor dei dati di SPSS
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 7 Foglio Variable View di SPSS
di output o altri che non siano file di dati.
•
Edit. In questo menu è possibile eseguire le usuali operazioni di annulla (Undo), ripeti
(Redo), taglia (Cut), copia (Copy), incolla (Paste) per le righe e le colonne dell'editor dei
dati, trovare un particolare testo o valore (Find) e accedere al menu per le opzioni del
programma (Options).
•
View. Permette di modificare la barre degli strumenti (Toolbars) e le modalità di
visualizzazione delle variabili.
•
Data. In questo menu sono contenuti i comandi che consentono, in particolare, di definire le
proprietà delle variabili (Define Variable Properties), ordinare i casi in base ad una delle
variabili (Sort Cases), unire più file (Merge Files), creare in base ad una variabile di
Figura 8 Menu File di SPSS
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
riferimento (ad esempio, il genere) sottogruppi di soggetti su cui eseguire separatamente ma
simultaneamente le stesse analisi (Split File), selezionare dei casi in base ad una variabile o
ad un criterio di riferimento (Select Cases), definire una variabile che contenga informazioni
circa la frequenza di una cella in una categoria di una tavola di contingenza (Weight Cases).
•
Transform. Come dice il nome, in questo menu si trovano i comandi per eseguire
trasformazioni sui valori delle variabili. In particolare ci interessano i comandi Compute, che
permette di creare nuove variabili che siano il risultato di operazioni matematiche applicate
ai dati (ad esempio, calcolo del punteggio ad un test come somma dei punteggi negli item),
Recode, che permette di ricodificare i dati di una variabile (ad esempio, per invertire i valori
di un item reverse), e Rank Cases, che ci consente di assegnare un rango ai valori di una
variabile
•
Analyze. Questo è il menu principale, per certi aspetti, dato che contiene i comandi per
realizzare le analisi dei dati presentate successivamente in quest'opera.
•
Graphs. Questo menu contiene i comandi per realizzare i vari tipi di grafici illustrati nei
capitoli successivi.
•
Utilities. Questo menu contiene comandi per la gestione avanzata del database.
•
Window. I comandi di questo menu permettono di spostarsi da una finestra all'altra.
•
?. In questo menu sono contenuti i comandi per ottenere aiuto (tutorial, guide, sintassi, etc.)
3. Importare i dati in SPSS da Excel
Per importare i dati da Excel a SPSS occorre andare al menu File→Open→Data. Si aprirà la
finestra Open File, che di default prevede come Tipo file un file di dati di SPSS, che ha estensione
.sav. Scorrendo il menu a tendina relativo, si può scegliere quali altri tipi di file è possibile
importare in SPSS (Figura 9). Una volta scelta l'opzione Excel (.xls), occorre recuperare il file nella
cartella dove l'abbiamo salvato. Una volta selezionato il file e premuto Apri, si apre la finestra
Opening Excel Data Source (Figura 10).
In questa finestra viene indicata la cartella da dove viene importato il file, e di default
dovrebbe essere spuntata l'opzione Read variable names from the first row of data, che indica al
software di recuperare i nomi delle variabili dalla prima riga di dati del foglio elettronico. Inoltre,
poiché i file di Excel supportano fogli multipli, viene indicato il nome del foglio (Worksheet) dove
sono contenuti i dati. È possibile cambiare il nome del foglio semplicemente attivando il menu a
tendina con il pulsante sulla destra del campo. Una volta clickato OK, il file viene importato.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 9 Finestra Open File di SPSS
Figura 10 Finestra Opening Excel Data Source di SPSS
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Se non si sono verificati problemi, come ad esempio nomi "illegali" delle variabili o formati dei dati
inattesi, dovremmo visualizzare i dati o nel foglio Variable View o in Data View (dipende dalla
versione di SPSS). Se si sono verificati problemi di importazione, si apre automaticamente un
nuovo file di output che riporta la natura dell'errore, come nel seguente esempio:
>Warning. Command name: GET DATA
>(2101) The column contained no recognized type; defaulting to
>"Numeric[8,2]"
>* Column #: 61
>Warning. Command name: GET DATA
>(2103) The variable name (truncated to 8 bytes) conflicts with a previously
>defined variable.
>* Variable Name #: "Specific"
>* Conflicting Column #: 8
>* Duplicate Column #: 10
Il primo messaggio indica che non è stato riconosciuto il tipo di variabile, il secondo che il nome
della variabile è stato troncato perché eccedeva gli otto caratteri alfanumerici e/o conteneva caratteri
non consentiti. Questi problemi sono comunque facilmente correggibili.
Se ritorniamo al file .sav, e scegliamo il foglio Data View, possiamo confrontare l'aspetto del
dataset in SPSS con quello in Excel (Figura 11)
Figura 11 Lo stesso dataset in SPSS (in alto) e in Excel (in basso)
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Ricordatevi sempre di salvare il file, una volta importato, mediante il comando File→Save. Questo
file può a sua volta essere ri-salvato in formato Excel mediante il comando Save as…, scegliendo
nel menu Salva come il formato .xls. Si noti che in questa finestra è presente il pulsante Variables,
che consente di scegliere, semplicemente selezionandole o de-selezionandole, quali variabili
salvare. Questo particolare è importante perché un file di dati di SPSS potrebbe avere più di 256
colonne (variabili), mentre un file di Excel non può eccedere questo limite.
Passiamo adesso ad identificare e definire le caratteristiche delle variabili andando sul foglio
Variable View. Nella Figura 12 vediamo come può apparire un dataset appena importato da Excel.
Nella prima colonna (Name) è contenuto il nome della variabile, che, almeno nelle versioni meno
recenti di SPSS, sottostà ai vincoli già esplorati nella Sezione 1 di questo capitolo. Se però
volessimo avere una descrizione migliore della variabile, come ad esempio inserire per esteso il
testo dell'item test01, possiamo farlo nella colonna Label ("etichetta"), dove non ci sono vincoli di
sorta. Ossia, possiamo inserire spazi, punteggiatura, numeri, etc. Così, possiamo inserire l'etichetta
"Titolo di Studio" per la variabile Tit_stu, o "Stato Civile" per St_Civ. Di default nelle tabelle di
output viene presentata l'etichetta della variabile, se è assente il software fa ricorso al nome.
Figura 12 Foglio Variable View di SPSS
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Nella colonna Label, inoltre, il software inserisce i nomi delle variabili che non riesce a leggere
quando il file viene importato, dopo aver assegnato un nome generico (ad esempio, VAR00001)
nella colonna Name.
La seconda colonna indica il tipo (Type) di variabile. SPSS consente di specificare fino a
otto tipi di variabili, ma quelli che a noi interessano sono principalmente Numeric (numerico) e
String (stringa di testo). Nel caso della Figura 12 notiamo come SPSS abbia letto correttamente
come stringhe le variabili Codice, Genere, Tit_Stu, Profes, St_Civ, ma ci lascia perplessi il fatto che
fra le variabili che rappresentano le risposte gli item del test (test01, test02, etc.) una variabile sia
indicata come stringa (test08). Questo è dovuto probabilmente alla presenza di un dato anomalo
(elemento di testo, o formato irriconoscibile per SPSS e quindi codificato come "?") in quella
variabile. A questo punto, se anche correggiamo il problema, il formato della variabile rimane
invariato. Per cambiarlo, dobbiamo selezionare la cella della colonna Type relativa alla variabile e
clickare sul piccolo tasto con i tre puntini (
) che compare sulla destra della cella una volta
selezionata. Si aprirà a questo punto il menu che permetterà di spuntare l'opzione Numeric.
La colonna Width indica il numero di caratteri massimo che viene utilizzato per visualizzare
la variabile. In questa sede, quindi, non è possibile modificare la larghezza della colonna così come
appare nel foglio Data View: per questo, occorre modificare il valore nella colonna Columns, più a
destra nel foglio.
Nella colonna Decimals è possibile impostare il numero massimo di decimali da visualizzare
− per le variabili indicate come stringhe di testo naturalmente il valore è immodificabile.
Nella colonna Values si possono impostare le etichette per i diversi valori di una variabile
categoriale. Supponiamo di aver codificato il genere come 0 = Femmina e 1 = Maschio, e di avere
un dataset con i dati in formato numerico. In assenza di altre specificazioni, nelle tabelle di output
SPSS riporterà queste categorie come 0 e 1. Se però vogliamo che venga visualizzato il nome della
categoria corrispondente, occorre selezionare la cella della colonna Values corrispondente alla
variabile e clickare sul tastino con i tre puntini. Si aprirà la finestra Value Labels (Figura 13)
Nella finestra occorre inserire il valore numerico corrispondente ad una categoria nel campo
Value e l'etichetta che vogliamo assegnare nel campo Value Label. Ogni volta che abbiamo riempito
i due campi occorre clickare su Add per confermare l'assegnazione dell'etichetta. Se vogliamo
cambiare o correggere un'etichetta, occorre selezionarla dal campo in basso dove sono elencate le
etichette, modificare il valore o l'etichetta, e clickare su Change. Quando abbiamo terminato,
premiamo OK per tornare al foglio con le variabili. A questo punto la cella della colonna Label non
sarà più vuota.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 13 Finestra Value Labels
Nella colonna Missing è possibile indicare quali valori devono essere interpretati come valori
mancanti. Nella Sezione 1 avevamo visto come per un punteggio su scala Likert da 1 a 5 il valore 0,
oppure il valore 9, potessero essere utilizzati come codici per i missing. Se lo abbiamo fatto,
possiamo indicarlo in questa colonna. Selezioniamo la cella corrispondente alla variabile, clickiamo
sul tastino con i tre puntini sulla destra, e si apre la finestra Missing Values (Figura 14).
L'opzione Discrete Missing Values può essere utilizzata sia per variabili numeriche che di
testo, e si possono inserire fino a tre diversi valori che rappresentano i missing. L'opzione Range
plus one optional discrete missing value, invece, è disponibile solo per le variabili numeriche, e
consente di definire come missing un intervallo di valori più un valore discreto. Se non viene
indicato niente vengono considerate missing solo le celle vuote (nel gergo di SPSS sono indicati
come System Missing).
Nella colonna Align è possibile selezionare l'allineamento del testo all'interno delle celle
(Sinstra [Left], Destra [Right] e Centro [Center]), mentre nella colonna Measure è possibile
specificare la scala di misura delle variabile (Nominale [Nominal], Ordinale [Ordinal] e Metrica
[Scale]).
Figura 14 Finestra Missing Values
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Per inserire (Insert) o cancellare (Clear) casi e variabili, basta clickare col tasto destro del mouse
sul numero corrispondente al caso o sul nome della variabile nel foglio Data View e scegliere
l'operazione da compiere.
4. Trattamento preliminare dei dati
Prima di procedere con l'analisi dei dati, spesso sono necessarie alcune operazioni di trasformazione
o ricodifica dei dati. Vediamo le più comuni.
Nel caso del dataset in Figura 11 il genere è una variabile di testo. Supponiamo di volerla
ricodificare in una variabile numerica 0 = Femmina e 1 = Maschio. Per far questo dobbiamo seguire il
percorso Transform→Recode, e scegliere se vogliamo ricodificare i valori nella stessa variabile (Into
same variables) o in una nuova variabile (Into different variables). In generale, per non creare
confusione, è preferibile ricodificare nella stessa variabile, anche se è consigliabile farlo su una copia
del file con la codifica originale, così da poter agevolmente recuperare i dati iniziali in caso di
problemi. Quindi, dopo aver salvato una copia del file originale, procediamo scegliendo
Transform→Recode→ Into same variables. Nella finestra che si apre (Figura 15) dobbiamo spostare
nel campo vuoto di destra le variabili alle quali vogliamo applicare la ricodifica che andremo a
definire: nel caso che stiamo illustrando è una sola (il genere), ma se si tratta di ricodificare gli item
reverse di un test (per cui potremmo voler applicare a tutti la seguente ricodifica: 1=5, 2=4; 3=3; 4=2;
5=1), possiamo selezionare più di una variabile. Per spostare le variabili da un campo all'altro occorre
selezionarle e premere il tastino in mezzo ai due campi (
).
Figura 15 Finestra Recode into same variables
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
A questo punto possiamo eventualmente scegliere se ricodificare tutti i casi o solo alcuni. Se per
assurdo volessimo ricodificare i valori solo per i maggiori di 25 anni, occorrerebbe clikare su If… e
accedere alla finestra Recode into Same Variables: If Cases (Figura 16).
In questa finestra, dopo aver spuntato Include if case satisfies condition, andremo a
selezionare la variabile Età dal campo di sinistra, la sposteremo con il tasto
nel campo di
destra, e aggiungeremo da tastiera la dicitura "> 25". Nel campo Functions sono disponibili
numerose funzioni matematiche per definire condizioni più complesse. Per tornare alla finestra
precedente basta clickare su Continue. Si tenga presente che a questo punto la trasformazione verrà
applicata solo ai casi che soddisfano la condizione. In generale, comunque, si tende sempre a
ricodificare tutti i casi.
Per specificare le regole di ricodifica, nella finestra Recode into same variables dobbiamo
clickare su Old and New Values. La nuova finestra che si apre (Recode into same variables: Old
and New Values, Figura 17) è divisa in due: sulla destra abbiamo i vecchi valori (Old Value), sulla
destra i nuovi (New Value).
In pratica, basta indicare nel campo Value di destra il valore da ricodificare e in quello di
sinistra quello ricodificato, come illustrato in Figura 17, e clickare su Add. La ricodifica comparirà
nel campo indicato come Old-->New. Per i casi più complessi è possibile utilizzare, dopo averle
spuntate, le opzioni Range. Nella prima (through) si può specificare gamma di valori: ad esempio,
ricodificare nella stessa categoria tutti casi con età comprese fra 20 e 25 anni; analogamente, Lowest
Figura 16 Finestra Recode into same variables: If cases
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 17 Finestra Recode into same variables: Old and New Values
through permette di ricodificare con lo stesso valore tutti i valori inferiori a quello indicato, mentre
through highest permette di ricodificare con lo stesso valori tutti i valori superiori a quello indicato.
All other values permette di ricodificare tutti i valori che non soddisfano le condizioni già
impostate. Anche in questo caso è importante ricordarsi di clickare sempre su Add dopo aver
impostato la codifica.
A questo punto basta clickare su Continue per tornare alla finestra iniziale e poi su OK per
ottenere la ricodifica.
I valori nella colonna Genere sono ora tutti 0 e 1. Nondimeno, come già suggerito in
precedenza, occorre andare a modificare nel foglio Variable View il tipo di variabile (da String a
Numeric) e indicare le etichette per ogni categoria (colonna Values).
Per restare nel menu Transform, vediamo la funzione Compute. Questa funzione permette di
applicare funzioni matematiche anche molto complesse ai dati delle variabili. Nel nostro caso, però,
la utilizziamo per calcolare il punteggio totale di un test. In pratica, dobbiamo sommare, soggetto
per soggetto, i valori delle variabili test01, test02, test03 … fino a test18. Per farlo, seguiamo il
percorso Transform→Compute. La finestra che si apre (Compute Variable, Figura 18) è simile a
quella in Figura 16.
Per prima cosa dobbiamo inserire il nome della variabile che rappresenterà il punteggio
totale al test nel campo Target Variable. Clickando su Type & Label è possibile impostare
l'etichetta (Label) della variabile e il tipo Type (Numeric o String). Per definire le operazioni da
compiere, basta selezionare le variabili nel campo di sinistra, spostarle nel campo di destra
(Numeric Expression) col tasto
, e utilizzare la tastiera per inserire le operazioni.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 18 Finestra Recode into same variables: Old and New Values
Nel nostro caso inseriremo una ad una le 18 variabili che rappresentano gli item di un test separate
dal segno di addizione. Per elaborazioni più complesse possono essere impiegate le funzioni nel
campo Function Group. Dopo aver selezionato il gruppo di funzioni, comparirà un elenco nel
campo Functions and Special Variables. Una volta selezionata la funzione sarà possibile spostarla
nel campo Numeric Expression: i suoi argomenti saranno rappresentati da punti interrogativi a cui è
possibile sostituire il nome di una variabile o un valore. Una volta impostata l'espressione numerica,
clickando su OK si ottiene la generazione di una nuova colonna sulla destra del dataset che contiene
per ogni soggetto il risultato dell'operazione matematica impostata − nel nostro caso, il punteggio al
test (attenzione a invertire prima i punteggi degli item reverse se questi sono presenti!). Anche in
questo caso, clickando su If…, è possibile condizionare l'esecuzione del calcolo solo per alcuni
gruppi di soggetti. Si presti attenzione al fatto che se il soggetto presenta un missing o un dato non
valido anche in una sola delle variabili utilizzate nella funzione, la cella corrispondente nella nuova
variabile risulterà vuota. Inoltre, prima di procedere con i calcoli, ci si accerti di aver impostato i
codici missing relativi alle variabili utilizzate nella funzione.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Altri comandi utili possono essere trovari nel menu Data. Ad esempio, il comando Sort Data
permette di scegliere una variabile o più variabili in base ai valori delle quali ordinare, in senso
ascendente o discendente, tutto il dataset.
Il comando Select Cases consente di selezionare solo alcuni soggetti in base a diverse
condizioni. Una volta seguito il percorso Data→Select Cases, si apre la finestra in Figura 19.
Di default è spuntata l'opzione All cases (tutti i casi), ma è possibile specificare anche:
•
una condizione (If condition satisfied) come nel caso della Figura 16 (ad esempio, solo i
maggiori di 25 anni)
•
un campione casuale di soggetti (Random sample of cases), con possibilità di ottenere o una
percentuale approssimata (opzione Approximately dopo aver premuto sul tasto Sample) o il
numero esatto (Exactly) di x casi sui primi n.
•
una gamma specificata di casi (Based on time or case range): ad esempio, dal caso 1 al caso
80 (il numero di ogni caso è il numero della riga su cui compare).
•
una variabile filtro (Use filter variable), per cui vengono selezionati tutti quei casi il cui
valore nella variabile è diverso da zero e non è missing
Nel riquadro Unselected Cases Are è possibile indicare se i casi non selezionati devono essere
filtrati (Filtered), ossia rimangono visibili ma il numero corrispondente della colonna sulla sinistra
Figura 19 Finestra Select Cases
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
della finestra dell'editor dei dati risulterà barrato, oppure cancellati (Deleted), ossia vengono rimossi
dal dataset. E' consigliabile eseguire quest'ultima opzione solo su una copia del dataset originario,
dato che se un nuovo salvataggio del file comporterebbe la perdita definitiva dei dati relativi ai casi
cancellati.
Una volta impostate le condizioni di filtro con l'opzione Filtered per i casi non selezionati e
premuto OK, i numeri corrispondenti ai casi non selezionati risulteranno barrati e in basso a destra
sulla finestra dell'editor dei dati comparirà la dicitura Filter On. Significa che il filtro è attivo e che
le analisi verranno realizzate solo sui casi selezionati (non barrati). Per riselezionare tutti i casi
occorrerà ritornate alla finestra Select Cases e spuntare All Cases.
Se invece si vogliono eseguire simultaneamente le stesse analisi su due o più gruppi di
soggetti ottenendo nell'output risultati separati, occorre utilizzare il comando Data→Split File
(Figura 20).
Supponiamo di volere realizzare le analisi separatamente per maschi e femmine. In questo caso
non abbiamo bisogno di utilizzare la funzione filtro, selezionare i maschi, svolgere le analisi, poi
selezionare le femmine e ripetere le analisi, ma basta seguire la seguente procedura: selezionare Compare
Groups o Organize Output by Groups, e spostare nel campo Groups Based On la variabile che specifica i
gruppi (in questo caso, genere). La differenza fra Compare Groups e Organize Output by Groups è che
nel primo caso i risultati di ogni gruppo vengono presentati giustapposti tabella per tabella, così da
permettere un confronto immediato, mentre nel secondo vengono presentate prima tutte le tabelle del
primo gruppo, poi tutte quelle del secondo e così via. È consigliabile inoltre spuntare l'opzione Sort the file
Figura 20 Finestra Split File
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
by the grouping variables ("ordina i dati in base alla variabile di raggruppamento"), in quanto se si sceglie
l'alternativa (File is already sorted) e i dati non sono effettivamente già ordinati si possono ottenere
risultati molto confusi. Se si attiva una di queste due funzioni, in basso a destra della finestra dell'editor dei
dati compare la scritta Split File On. Anche in questo caso, per rimuovere la suddivisione, occorre
ritornare alla finestra di partenza e selezionare Analyze all cases, do not create groups.
5. Il file di output
Come già accennato, l'output di SPSS viene prodotto in un nuovo file. In questo file vengono
riportare tabelle e grafici, come in Figura 21.
Figura 21 File di output di SPSS
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
La finestra è suddivisa in due parti. Sulla sinistra vi è una sorta di "indice" dell'output nel quale sono
riportati i titoli di tabelle e grafici: selezionando col mouse uno di questi titoli è possibile spostarsi
rapidamente da una parte all'altra dell'output. Se si clicka sulla casella bianca col simbolo del "meno"
sulla sinistra di Frequencies l'indice e l'output sulla destra scompaiono e nella casella compare il
simbolo del "più". Questa operazione può essere utile per gli output molto ricchi, in modo da
visualizzare volta per volta solo ciò che interessa. Facendo un click su una voce dell'"indice" dopo
averla selezionata è possibile modificare il testo contenuto. Per cui, si può cambiare il titolo da inglese
in italiano. La stessa operazione di modifica è possibile su tabelle e grafici nella parte di destra
dell'output, solo che in questo caso occorre un doppio click dopo la selezione. Dopo aver eseguito il
doppio click è possibile modificare qualunque caratteristica di una tabella (anche i risultati, se non vi
piacciono…) facendo doppio click sulla parte che interessa modificare (ad esempio il titolo,
l'intestazione di una colonna o il nome di una variabile) o attivando il menu di modifica col tasto
destro del mouse. (in particolare, le opzioni Table Properties e Cell Properties). Nel caso dei grafici il
doppio click apre una nuova finestra (Chart Editor) con un nuovo menu (Figura 22), per quanto anche
un click del tasto destro del mouse permetta di accedere a tutte le modifiche più avanzate.
Se si vuole modificare una parte specifica del grafico (ad esempio, il colore della barra di un
istogramma, la scala dell'asse verticale, etc.) basta fare doppio click su di essa e interagire col menu
che si apre. Gli elementi dell'output possono essere facilmente copiati e incollati nel file di output
stesso, in altri file di output oppure in altri programmi. Le tabelle vengono incollate come tali in Word
e in Excel, permettendone una facile rielaborazione, e come immagini, quindi non modificabili, in
Power Point, mentre le figure vengono sempre incollate come tali (anche se in Word vale la pena
incollarle seguendo il percorso Modifica→Incolla Speciale, selezionando poi Bitmap, in quanto la
resa grafica è migliore). Il file di output, in alternativa, può essere esportato in vari formati (come
Word o Excel; vedi File Type, Figura 23) mediante il comando File→Export.
Nel menu di Export si può scegliere se esportare tutto (Output Document), solo le tabelle e il
testo (Output Document (No Charts)) o solo le figure (Charts Only). Clickando su Options si accede
ad un menu (HTML Format) nel quale è possibile scegliere un formato particolare per esportare le
immagini (Image Format).
Nel riquadro Export File si può indicare il nome del file e dove salvarlo. Nel riquadro Export
What si può scegliere se esportare tutto (All Objects), solo ciò che è visibile (All Visible Objects) o
solo la parte di output selezionata in quel momento (Selected Objects; questo è possibile anche
direttamente selezionando l'oggetto, clickando col tasto destro del mouse e scegliendo Export). I vari
menu File, Edit, View, etc. offrono sostanzialmente gli stessi comando del file di dati.
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Figura 22 Finestra Chart Editor
Figura 23 Finestra Export Output
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Scarica

scarica la guida