MATEpristem
“Matematica in classe/4 – Probabilità e Statistica”
Frascati, 14-16 ottobre 2011
Che cos’è la significatività statistica
(amena conversazione su concetto e uso della significatività in statistica)
Walter Racugno – Università di Cagliari
La statistica
La statistica matematica è buon senso tradotto
in una struttura logica e in un linguaggio
matematico capaci di dare coerenza logica e
algoritmi di calcolo alla conoscenza parziale.
Ma – ahimè! - non sempre il buon senso
conduce a conclusioni sensate:
un trattamento semplicistico dei dati può
portare a risultati ingannevoli.
Significatività statistica
(attraverso esempi)
• i tranci di pizza sono terapeutici per la
varicella?
• il dramma del professore
• l’affondamento del Titanic: naufragio di
statistici
• il dimorfismo sessuale
• tassa sul lusso
La pizza cura le pustole della varicella?
(da:T.E. Bradstreet – The American Statistician, 1996)
Il piano di lavoro
Tesi
La pizza cura le pustole
Ipotesi da verificare
Dopo 5 giorni di trattamento con pizza i pazienti con pustole
presentano una durata delle lesioni inferiore del 40%
rispetto ai non trattati (controlli)
Piano sperimentale
Prove cliniche parallele, randomizzate
Variabili risposta
Durata delle lesioni
Risultati
Conclusione
La pizza cura le pustole della varicella?
I dati sperimentali
15
29% < 40%
la differenza non è significativa
(clinicamente)
10
7.2
29%
5.1
5
0
controllo
pizza
durata media
La pizza cura le pustole della varicella?
Piano di lavoro, risultati e conclusioni
Tesi
La pizza cura le pustole
Ipotesi da testare
Dopo 5 giorni di trattamento con pizza i pazienti con pustole
presentano una durata delle lesioni inferiore del 40%
rispetto ai non trattati (controlli)
Piano sperimentale
Prove cliniche parallele, randomizzate
Variabili risposta
Durata delle lesioni
Risultati
Differenza clinica non significativa
Conclusione
Non c’è evidenza sperimentale a favore dell’ipotesi
che la pizza abbia efficacia terapeutica nel trattamento
delle pustole da varicella
Il dramma del professore
(per spiegare la significatività statistica)
Dramma aperto in VI atti
e un epilogo
Protagonisti: lo studente; il professore
Atto I
(il contesto)
Atto II
(l’azione)
Atto III
(la trama si sviluppa)
Atto IV
(il dilemma)
Atto V
(il fatto)
Atto VI
(il dramma del prof)
Epilogo
• Lo studente deve sostenere un esame
• Può essere preparato o non-preparato
Il professore deve compiere l’azione:
promuovere
bocciare
• Lo studente e il professore si incontrano
• Il prof non sa se lo studente è preparato o no
(forse neppure lo studente lo sa!)
• Non potendo esplorare “tutta” la preparazione dello studente,
il prof ha la possibilità di fare alcune domande (ad es. 5)
Il professore pensa: quante risposte esatte dovrà darmi lo studente
per convincermi d’essere preparato?
(Nota: professore “buono”=2 risposte su 5; “severo” =3 su 5;
“cattivo”=4 su 5; “terribile”=5 su 5).
Lo studente risponde a 3
Lo studente risponde a meno di
domande
il prof lo promuove 3 domande
il prof lo boccia
Ha promosso un non-preparato?
Ha bocciato un preparato?
Il professore si rivolge al suo statistico di fiducia !
(per spiegare la significatività statistica)
• Studente
• Azioni
preparato
Stati di natura  : H 0 , H 1 
non-preparato
H 0 : preparato , H1: non-preparato
promuovere
bocciare
• Regola di decisione
spazio campionario
1
2
3
4
5
bocciare
promuovere
rifiuto H 0
accetto H 0
… in sintesi
promuovo
boccio
H0
H1
preparato
non-preparato
P( pr | H 0 )
  P(b | H 0 )
  P( pr | H1 )
P(b | H1 )
zona di accettazione H 0
zona di rifiuto H 0
valore di soglia


accetto H 0 e rifiuto H1
rifiuto H 0 e accetto H1
 = P(rifiutare H 0 quando è vera) = P(rifiuto| H 0 )
Nella teoria della verifica (test) d’ipotesi di
Neyman-Pearson-Wald
•  livello di significatività del test : livello d’errore
con cui siamo “disposti” a rifiutare l’ipotesi H 0 .
•  è usualmente molto piccolo :
valori standard 0.05; 0.01; anche 0.001.
------------------------------------------------------------------------------• Jerzy Neyman, (1894 – 1981)
• Sir Ronald Aylmer Fisher, (1890 – 1962)
• Egon Sharpe Pearson, (1895 – 1980)
• Abraham Wald, (1902 – 1950)
L’affondamento del Titanic
(S.M. Iacus, G. Masarotto – 2007, 2^ Ed.) ………………………….
Nel suo rapporto ufficiale Lord Mersey il
parlamentare incaricato dell’inchiesta sul
naufragio del Titanic (15 aprile 1912):
“Si era sospettato prima dell’inizio dell’indagine che
i passeggeri di terza classe fossero stati trattati in
modo discriminatorio … e che fu data precedenza ai
passeggeri di prima e seconda classe …
… l’elevata proporzione di perdite non deve essere
ricercata nella discriminazione dei passeggeri di terza
classe. Essi non sono stati discriminati”
L’affondamento del Titanic
Classe
Sesso
Età
Morti
Salvati
uomini
bambini
adulti
0
118
5
57
donne
bambini
adulti
0
4
1
140
uomini
bambini
adulti
0
154
11
14
donne
bambini
adulti
0
13
13
80
uomini
bambini
adulti
35
387
13
75
donne
bambini
adulti
17
89
14
76
uomini
670
192
donne
3
20
1490
711
1
2
3
crew
totale
L’affondamento del Titanic
Una prima domanda:
è stata rispettata la legge marinara “ prima le donne e i bambini” ?
Salvati (%)
N°. imbarcati
bambini
52 %
109
donne
74 %
425
uomini
20 %
1667
32%
2201
L’affondamento del Titanic
Altra domanda:
vi è una relazione tra sopravvissuti e classe di imbarco ?
classe
morti
salvati
1
122
203
325
2
167
118
285
3
528
178
706
crew
673
212
885
1490
711
2201
L’affondamento del Titanic
vi è una relazione tra sopravvissuti e classe di imbarco ?
classe
morti
salvati
classe
morti
salvati
1
122
(38%)
203
(62%)
325
1
202
(62%)
123
(38%)
325
2
167
(59%)
118
(41%)
285
2
177
(62%)
108
(38%)
285
3
528
(75%)
178
(25%)
706
3
438
(62%)
268
(38%)
706
817
(62%)
499
(38%)
1316
817
(62%)
499
(38%)
1316
Tabella reale
Tabella ideale
L’affondamento del Titanic
“distanza” tra tabella reale e tabella ideale (con variabili indipendenti: H 0 )
confronto tra
proporzioni
o percentuali
ipotesi H 0 :
la differenza è
dovuta al caso
Accettare
o rifiutare
l’ipotesi H 0
Test
“Chi-quadrato”

distanza chi-quadro
accetto H 0
rifiuto H 0
L’affondamento del Titanic
“distanza” tra tabella reale e tabella ideale (con variabili indipendenti: H 0 )
I dati rilevati non forniscono un’evidenza sperimentale per poter rifiutare
l’ipotesi H 0 : la distanza della tabella reale dalla tabella ideale non è
statisticamente significativa al livello  = 0.05.
In altri termini:
la differenza è attribuibile al caso e non a un “errore sistematico”
 0,05
distanza chi-quadro
accetto H 0
rifiuto H 0
… ma …
L’affondamento del Titanic
(A. Farcomeni – Convegno SIS, Venezia 6-8 settembre 2007)
NOTA Le interazioni tra fattori (variabili) possono
essere considerate come ulteriori fattori:
esplicativi dell’effetto di interesse.
Es. tabella:
• fattore di riga
• fattore di colonna
• fattore di cella (interazione tra riga e colonna)
tabelle a più di due dimensioni (vedi Titanic)
Come modellizzare l’interazione
Problema
Descrivere il numero (y) di volte in cui un
gruppo di pazienti visita annualmente il proprio
medico di base, in dipendenza dell’età (x1 ).
n° visite
Modello1
Esempio
parametri
y  a  bx1
1
n visite  2 
età
20
età
Come modellizzare l’interazione
n° visite
y  a  bx1
a
x1
età
Domanda:
oltre l’età, il sesso ha qualche influenza sul n° di visite?
Come modellizzare l’interazione
Modello 2
y  a  bx1  cx2
x2
= 0 uomo
= 1 donna
n° visite
y  (a  c)  bx1
c = influenza del sesso sul n° visite
y  a  bx1
a+c
a
x1
età
NOTA: non c’è interazione tra gli effetti dell’età e del sesso
l’effetto del sesso è uguale per tutte le età!
Come modellizare l’interazione
Domanda: come esprimere algebricamente che
le due rette (uomo-donna) non sono parallele?
Risposta: creiamo una nuova variabile
x3  x1  x2
Modello 3
interazione = età-sesso
y  a  bx1  cx2  dx3
uomo x2  0  x3  0
y  a  bx1  cx2  dx3
donna x2  1  x3  x1
y  (a  c)  (b  d ) x1
Come modellizzare l’interazione
n° visite
y  (a  c)  (b  d ) x1
d = effetto età-sesso sul n° visite
y  a  bx1
a+c
a
x1 età
NOTA: il modello considera l’effetto di ciascuna variabile (età, sesso)
e della loro interazione
il n° delle visite dipende dall’età
e dal sesso ma NON con uguale intensità!
L’affondamento del Titanic
Nella prima analisi che abbiamo visto sono state
considerate soltanto interazioni del secondo ordine:
• tra la variabile (fattore) Classe e la variabile
Sopravvivenza (morti/salvati) si è visto che l’interazione
non è statisticamente significativa (mentre c’è “evidenza”
nelle interazioni di Sopravvivenza con Sesso e con Età)
Con un modello più complesso che considera anche le
interazioni del terzo ordine, sono risultate statisticamente
significative le interazioni
- Class:Sex:Age
- Class:Sex:Survived
- Class:Age:Survived
… morale
Il dimorfismo sessuale
Il problema antropologico
statistico
• Consideriamo due variabili X e Y che rappresentano una
stessa dimensione antropometrica relativa ai due sessi.
• In letteratura è spesso considerata soltanto la diversità
tra i valori medi (dimorfismo di media)
x  y oppure
xy
x
N (20, 16)
N (40, 16)
Il dimorfismo sessuale
• La variabilità intrasesso può alterare il dimorfismo di
media: a parità di distanza tra medie, una minore
[maggiore] variabilità intrasesso determina un
aumento [diminuzione] del dimorfismo
N (20, 4)
N (30, 4)
N (20, 36)
N (30, 36)
Il dimorfismo sessuale
• La variabilità intrasesso è dunque anch’essa
una componente del dimorfismo: dimorfismo di
dispersione, (Marini, Racugno et al. 2005, 2007).
Esempio (a parità di medie):
N (30, 4)
N (30,36)
Il dimorfismo sessuale
Due problemi:
1 – di natura antropologica
2 – di natura statistica
1. Dimorfismo di media; di variabilità;
di asimmetria; di … altre componenti?
2. Rilevazione della presenza di dimorfismo;
individuazione e stima delle differenze; misura
dell’evidenza; costruzione di statistiche in
presenza di modelli e non.
Il dimorfismo sessuale
Obiettivi:
1. Proporre una visione globale del dimorfismo
sessuale nei caratteri metrici. Evidenziarne le
varie forme di espressione (componenti).
Sviluppare considerazioni sintetiche sulla sua
natura nelle diverse tipologie di variabili
antropometriche.
2. Considerare l’intero contenuto informativo delle
due (♀,♂) distribuzioni campionarie di frequenza
per ciascuna variabile antropometrica.
Costruire procedure di analisi statistica per
l’applicazione dei test di confronto.
“Tassa sul lusso”
Art. 4 L.R. 4/2006 (imposta sulla nautica)
La politica
• L’articolo 4 della L.R. n. 4 del 2006 ha istituito un’imposta regionale
sulle unità da diporto di lunghezza maggiore o uguale a 14 mt., (scali
tra il 1° giugno e il 30 settembre nei porti del territorio regionale).
Domanda
•
L’imposta causa effetti negativi sullo scalo di unità da diporto nei porti sardi?
Stime errate
•
Stime ottenute confrontando gli scali osservati nel 2006 con quelli osservati
nell’anno precedente.
Definizione di effetto
• L’effetto dell’imposta sugli scali è la differenza tra il numero di scali
osservati nel 2006 e il numero che avremmo osservato nello stesso
periodo del 2005, in assenza dell’imposta.
Tassa sul lusso
Dati disponibili
• 56 gestori che possono accogliere barche oltre i 14 mt
• 15000 posti barca
• da 16 gestori non è stato possibile avere dati (15%)
• dei 40 gestori, 33 hanno collaborato, 19 hanno fornito dati
completi
Si sono analizzati i dati relativi a 57% dei posti barca (6926)
per un totale di 5065 scali (il 77% di cui si è avuta notizia).
• Tra il 2005 e il 2006 si è verificata una riduzione del
numero di scali pari al 15%:
18% di barche soggette a imposta; 8% non soggette.
In particolare una riduzione del 20% delle barche tra 12 e
13 mt (NON assoggettate).
Tassa sul lusso
Aspetti critici
Scali
2005
2006
.2
.1
0
Density
.3
Scali
10
15
20
25
30 10
15
lunghezza
Density
kdensity lunghezza
Graphs by stagione
20
25
30
Tassa sul lusso
Aspetti critici
2006
0
5
10
15
2005
12
13
14
15
16 12
Lunghezza
Graphs by stagione
13
14
15
16
Infine
la rondine … la primavera …
… il reverendo Thomas Bayes …
… sillogismi
La colpa di
• In una classe, alcuni studenti lamentano il
malfunzionamento di WORD.
• Una parte degli studenti usa WINDOWS 2000,
un’altra parte XP.
Domanda:
XP
ha qualche colpa?
La colpa di
male
bene
TOT.
XP
0.15
0,15
0.45
0.60
0.60
No XP
0.05
0.35
0.40
TOT
0.20
0.80
1
I dati
• il 60% usa XP (il 40% altro!)
• il 20% ha problemi con WORD
• il 75% di coloro che hanno
problemi usa XP
 P(male )  P( XP | male )
P(male | XP)  P(male, XP)  0.15  0.25  0.20
P( XP)
0.6
L’informazione aggiuntiva “ sapendo che usano XP ”
fa passare la probabilità da 0.20 a 0.25
Il reverendo e … la rondine
P(male)  P( XP | male)
P(male | XP) 
P( XP)
Teorema di Bayes (1702 – 1761)
Dove si vede che – ovviamente! - P(male | XP )  P( XP | male )
Sillogismi (1)
Domanda:
Qual è la probabilità che WR sia un alieno?
P(WR | U )  1 / 6 mld
P (U )  1
P( A)  0
P(WR )  P(U )  P(WR | U )  P( A)  P(WR | A)
0
P (U | WR )  P(U )  P(WR | U )  1
P(WR )
Sillogismi (2)
Domanda:
Qual è la probabilità che WR sia un bandito?
P( Sardo | Bandito )  0.10
1500000
P( S ) 
 0.028
53000000
P( B)  0.001
P( NB)  0.999
P( S )  P( B)  P( S | B)  P( NB)  P( S | NB)
P ( B | S )  P( B)  P( S | B)  0.001 0.10  0.0036
0.028
P( S )
Risposta:
Alieno no, ma bandito un po’ sì (ma poco!!)
Scarica

Walter Racugno