Uso dei Modelli in Statistica
• Modelli come generalizzazione delle
procedure
* Modello Lineare Generale (GLM)
* Regressione Logistica
• Modelli come descrizione di realtà
sperimentali complesse
*
*
*
*
Analisi Fattoriale
MDS
Analisi delle corrispondenze
Modello di Rasch
Analisi dei Modelli
1.
2.
3.
4.
Definizione del modello
Stima dei parametri
Valutazione della bontà del modello
(**Calcolo della significatività**)
Modelli a struttura
PREDETERMINATA
• Definizione della struttura del modello
sulla base di ipotesi a priori
• Stima del valore dei parametri
• Calcolo dei limiti di confidenza dei
parametri
• Calcolo della significatività
* Ipotesi nulla: parametri = 0
* Possibile inferenza
Modelli a struttura
STIMATA
• Stima della struttura del modello sulla base
dei dati sperimentali
• Stima del valore dei parametri
• *Calcolo dei limiti di confidenza dei
parametri
• *Calcolo della significatività (su nuovi dati
sperimentali)
* opzionale: calcolato solo in alcune situazioni
* Ipotesi nulla: valori sperimentali = valori del modello
* Solo valore descrittivo
Ipotesi nulla
• Test statistici creati per la falsificazione
dell’ipotesi nulla
• Asimmetria delle zone di falsificazione
e non-falsificazione dell’ipotesi nulla
• Inadeguatezza dei test per la conferma
dell’ipotesi nulla
Analisi della Regressione Lineare
Analisi della Regressione Polinomiale
100
90
80
70
60
50
40
potenza 1
potenza 3
30
potenza 5
20
0
5
10
15
20
25
30
35
40
Materiali e metodi
• 116 studenti divisi in modo random in
due sottogruppi
• Questionario sulle modalità di utilizzo
di Internet a cinque sottoscale con
punteggi da -4 a +4
• Analisi Fattoriale e Analisi della
Regressione
Analisi Fattoriale
Gruppo 1
Componenti
Sottoscale
1
2
A
0.792
-0.015
B
0.002
0.804
C
0.001
0.825
D
0.608
0.109
E
0.743
-0.109
Sottoscale
A
B
C
D
E
Gruppo 2
Componenti
1
2
0.761
-0.239
0.083
0.884
-0.066
0.197
0.823
0.310
0.461
-0.569
3
0.051
0.247
0.925
-0.073
0.514
Regressione Multipla
Gruppo 1
Model
Gruppo 2
Model
Unstandardized Coefficients
Standardized
t Coefficients
Sig.
B
Std. Error Beta
1 (Constant)
0.971
0.443
2.191
B
0.018
0.117
0.020
0.154
C
-0.014
0.121
-0.015
-0.116
D
0.176
0.118
0.189
1.489
E
0.402
0.147
0.346
2.730
Unstandardized Coefficients
Standardized
t Coefficients
Sig.
B
Std. Error Beta
1 (Constant)
1.388
0.528
2.626
B
-0.033
0.109
-0.044
-0.307
C
-0.043
0.115
-0.051
-0.374
D
0.217
0.109
0.263
1.985
E
0.331
0.162
0.287
2.052
0.033
0.878
0.908
0.142
0.009
95% Confidence Interval for B
Lower Bound
Upper Bound
0.082
1.860
-0.217
0.254
-0.257
0.229
-0.061
0.412
0.107
0.698
0.011
0.760
0.710
0.052
0.045
95% Confidence Interval for B
Lower Bound
Upper Bound
0.328
2.448
-0.252
0.185
-0.274
0.188
-0.002
0.435
0.007
0.655
Conclusione
 Nei modelli a struttura PREDETERMINATA
l’affidabilità dei parametri viene misurata
dalla loro variabilità, dai limiti di confidenza
che delimitano la regione entro cui potrebbe
trovarsi la ‘vera’ relazione, se le ipotesi sul
modello sono corrette
Conclusione
 Nei modelli a struttura STIMATA, la struttura
del modello viene determinata sui dati
sperimentali ma la variabilità del numero dei
parametri non viene fornita. Viene fornita
una misura della loro capacità di
rappresentare in modo ‘ADEGUATO’ i dati
sperimentali
CONFRONTO FRA
MODELLI PARAMETRICI E
NON PARAMETRICI
“Accuracy and certainty are competitors:
The surer we want to be,
the less we must demand”
Basic Ideas of Scientific Sampling di Alan Stuart, Griffin, London 1968
Variabili Qualitative
• In alcuni casi il fenomeno in esame può essere
valutato solo da variabili qualitative (Es.
dipendenza o non dipendenza da droga)
• VANTAGGI: corrispondono a situazioni più
definite (presenza o assenza di una patologia)
• SVANTAGGI: minor precisione nella misura
TEST NON PARAMETRICI
Una serie di dati
- Binomiale
- Chi quadrato
Due serie di dati correlati
- McNemar (proporzioni)
- Segno (distribuzione dei valori)
- Wilcoxon
Più serie di dati correlati
- Friedman
Due serie di dati indipendenti
- Mann-Whitney
- Kolmogorov-Smirnov
Più serie di dati indipendenti
- Kruskall-Wallis
MODELLI NON PARAMETRICI
Misure di associazione
• Tavole di contingenza: associazione fra due
variabili qualitative
• Modelli Log-Lineari: associazione fra più variabili
qualitative
Modelli Regressivi
• Regressione Logistica: modello generale in cui è
possibile esprimere una variabile qualitativa
(dicotomica) come funzione di una o più variabili
sia qualitative che quantitative.
Scarica

Uso dei modelli in statistica