Uso dei Modelli in Statistica • Modelli come generalizzazione delle procedure * Modello Lineare Generale (GLM) * Regressione Logistica • Modelli come descrizione di realtà sperimentali complesse * * * * Analisi Fattoriale MDS Analisi delle corrispondenze Modello di Rasch Analisi dei Modelli 1. 2. 3. 4. Definizione del modello Stima dei parametri Valutazione della bontà del modello (**Calcolo della significatività**) Modelli a struttura PREDETERMINATA • Definizione della struttura del modello sulla base di ipotesi a priori • Stima del valore dei parametri • Calcolo dei limiti di confidenza dei parametri • Calcolo della significatività * Ipotesi nulla: parametri = 0 * Possibile inferenza Modelli a struttura STIMATA • Stima della struttura del modello sulla base dei dati sperimentali • Stima del valore dei parametri • *Calcolo dei limiti di confidenza dei parametri • *Calcolo della significatività (su nuovi dati sperimentali) * opzionale: calcolato solo in alcune situazioni * Ipotesi nulla: valori sperimentali = valori del modello * Solo valore descrittivo Ipotesi nulla • Test statistici creati per la falsificazione dell’ipotesi nulla • Asimmetria delle zone di falsificazione e non-falsificazione dell’ipotesi nulla • Inadeguatezza dei test per la conferma dell’ipotesi nulla Analisi della Regressione Lineare Analisi della Regressione Polinomiale 100 90 80 70 60 50 40 potenza 1 potenza 3 30 potenza 5 20 0 5 10 15 20 25 30 35 40 Materiali e metodi • 116 studenti divisi in modo random in due sottogruppi • Questionario sulle modalità di utilizzo di Internet a cinque sottoscale con punteggi da -4 a +4 • Analisi Fattoriale e Analisi della Regressione Analisi Fattoriale Gruppo 1 Componenti Sottoscale 1 2 A 0.792 -0.015 B 0.002 0.804 C 0.001 0.825 D 0.608 0.109 E 0.743 -0.109 Sottoscale A B C D E Gruppo 2 Componenti 1 2 0.761 -0.239 0.083 0.884 -0.066 0.197 0.823 0.310 0.461 -0.569 3 0.051 0.247 0.925 -0.073 0.514 Regressione Multipla Gruppo 1 Model Gruppo 2 Model Unstandardized Coefficients Standardized t Coefficients Sig. B Std. Error Beta 1 (Constant) 0.971 0.443 2.191 B 0.018 0.117 0.020 0.154 C -0.014 0.121 -0.015 -0.116 D 0.176 0.118 0.189 1.489 E 0.402 0.147 0.346 2.730 Unstandardized Coefficients Standardized t Coefficients Sig. B Std. Error Beta 1 (Constant) 1.388 0.528 2.626 B -0.033 0.109 -0.044 -0.307 C -0.043 0.115 -0.051 -0.374 D 0.217 0.109 0.263 1.985 E 0.331 0.162 0.287 2.052 0.033 0.878 0.908 0.142 0.009 95% Confidence Interval for B Lower Bound Upper Bound 0.082 1.860 -0.217 0.254 -0.257 0.229 -0.061 0.412 0.107 0.698 0.011 0.760 0.710 0.052 0.045 95% Confidence Interval for B Lower Bound Upper Bound 0.328 2.448 -0.252 0.185 -0.274 0.188 -0.002 0.435 0.007 0.655 Conclusione Nei modelli a struttura PREDETERMINATA l’affidabilità dei parametri viene misurata dalla loro variabilità, dai limiti di confidenza che delimitano la regione entro cui potrebbe trovarsi la ‘vera’ relazione, se le ipotesi sul modello sono corrette Conclusione Nei modelli a struttura STIMATA, la struttura del modello viene determinata sui dati sperimentali ma la variabilità del numero dei parametri non viene fornita. Viene fornita una misura della loro capacità di rappresentare in modo ‘ADEGUATO’ i dati sperimentali CONFRONTO FRA MODELLI PARAMETRICI E NON PARAMETRICI “Accuracy and certainty are competitors: The surer we want to be, the less we must demand” Basic Ideas of Scientific Sampling di Alan Stuart, Griffin, London 1968 Variabili Qualitative • In alcuni casi il fenomeno in esame può essere valutato solo da variabili qualitative (Es. dipendenza o non dipendenza da droga) • VANTAGGI: corrispondono a situazioni più definite (presenza o assenza di una patologia) • SVANTAGGI: minor precisione nella misura TEST NON PARAMETRICI Una serie di dati - Binomiale - Chi quadrato Due serie di dati correlati - McNemar (proporzioni) - Segno (distribuzione dei valori) - Wilcoxon Più serie di dati correlati - Friedman Due serie di dati indipendenti - Mann-Whitney - Kolmogorov-Smirnov Più serie di dati indipendenti - Kruskall-Wallis MODELLI NON PARAMETRICI Misure di associazione • Tavole di contingenza: associazione fra due variabili qualitative • Modelli Log-Lineari: associazione fra più variabili qualitative Modelli Regressivi • Regressione Logistica: modello generale in cui è possibile esprimere una variabile qualitativa (dicotomica) come funzione di una o più variabili sia qualitative che quantitative.