Criteri e tecniche
per la misurazione
delle prove “oggettive”
Maurizio Tiriticco
maurizio tiriticco
misurazione 2007
1
Valutazione degli apprendimenti
iniziale - livelli di partenza o prerequisiti
formativa
conclusiva
Oggetti della valutazione:
una o più prove
qualità degli apprendimenti
Ieri - Valutazione con 10 voti decimali di merito
Oggi – a) misurazione con punteggi non di merito e
b) valutazione da attribuire al punteggio conseguito
secondo criteri dati
c) accertamento e certificazione delle competenze
alla conclusione di un ciclo
maurizio tiriticco
misurazione 2007
2
Tipologia delle prove
* non strutturate tradizionali
* strutturate
anni 70 e 80
* semistrutturate anni 90
maurizio tiriticco
misurazione 2007
3
Probabilità di rispondere esattamente ad un test
probabilità di
risposta esatta
punti
Test v/f
50%
Test s/m a 2 scelte
50%
Test s/m a 3 scelte
33,33%
Test s/m a 4 scelte
25%
Test s/m a 5 scelte
20%
Test s/m a n scelte
…
1
1
2
3
4
n–1
maurizio tiriticco
misurazione 2007
4
Attribuzione di punteggi grezzi ad un test S/M
con item a 4 scelte: la prova più frequente
Alcune ipotesi di 10 item senza pesi
Ipotesi
1
2
3
4
5
risposta esatta
1
3
3
4
4
ecc.
astensione
0
0
0
1
0
–
risposta errata
0
0
–1
0
1
–
punt. max.
10
30
30
40
40
–
punt. min.
0
0
– 10
0
0
–
La soglia di accettabilità è da stabilire
maurizio tiriticco
misurazione 2007
5
Test S/M di 10 item con 4 scelte ciascuno, somministrato a 10 alunni
Item
1
2
3
4
5
6
7
8
9
10
alunni
1
4
4
4
0
0
4
4
4
4
4
2
4
4
1
1
0
1
4
1
4
1
3
1
1
1
0
0
1
4
1
1
1
4
4
4
4
4
0
0
4
1
1
4
5
0
0
0
0
0
4
4
0
0
4
6
4
1
0
4
0
1
4
4
4
0
7
4
4
1
1
0
1
4
1
4
4
8
4
4
4
4
0
4
4
1
0
0
9
4
4
4
4
0
4
4
1
1
4
10
1
1
1
0
0
4
4
4
1
1
30
27
20
18
0
24
40
18
20
23
32 21 11 26 12 22 24 25 30 17
220
Punteggi attribuiti:
4 risposta esatta
1 astensione
0 risposta errata
Massimo teorico
40 x ciascun alunno
400 x il gruppo
Limite di
accettabilità???
24 = norma = voto 6
30 = test facile
20 = test difficile
Se il Test S/M è di 30 item con 4 scelte ciascuno, il punt. max = 120
maurizio tiriticco
misurazione 2007
6
La misurazione – Punteggi relativi a due prove oggettive
attribuzione di punteggi grezzi alle prove
punteggio da 1 a…. n
esempio
da 1 a 100 – costituiscono il minimo e massimo teorico raggiungibile
distribuzione dei punteggi di due prove, A e B, somministrate a 16 alunni
A ….45, 48, 58, 60, 65, 65, 65, 68, 68, 76, 77, 78, 80, 83, 89, 93…………...
B…………….58, 58, 58, 60, 68, 69, 70, 73, 73, 80, 89, 91, 99, 100, 100, 100
limite di accettabilità, a discrezione del testista: 70
qui ci si potrebbe fermare, ma…
…consideriamo altri valori
Media: sommatoria dei punteggi diviso il loro numero
A 1120 : 16 = 70 B 1246 : 16 = 77,87
Mediana: il punteggio che occupa la posizione centrale
A = 68
B = 73
Moda: il punteggio più frequente A = 65
B = 58 e 100
Gamma: punt. max – min + 1
A 93 – 45 + 1 = 49 B 100 – 58 + 1 = 43
sono valori utili per elaborare i punteggi
maurizio tiriticco
misurazione 2007
7
Per l’elaborazione dei punteggi grezzi
servono altri valori
Sigma: radice quadrata della somma di ogni punteggio meno la media
elevato al quadrato diviso il numero delle prove
Punto Z di una prova: singolo punteggio meno la media diviso il sigma
Punto T di una prova: punto Z moltiplicato 10 + 50
Comparare dei punteggi tra loro
in valori assoluti non è corretto
La comparazione va fatta solo se prima
si è compiuta l’elaborazione
Risulterà che un 8 non è eguale ad un altro 8!!!
maurizio tiriticco
misurazione 2007
8
Attenzione!
UN NUMERO NON INDICA SEMPRE
UNA REALTA’ OGGETTIVA!
Il medesimo punteggio raggiunto da 2 candidati a 2
concorsi non è “eguale” se un candidato vince e l’altro no perché
i posti del suo concorso sono pochi!!!
Il posto n. 55 su un vagone di seconda classe è proprio il
cinquantacinquesimo? No! In effetti è il ventinovesimo!
La camera 320 dell’hotel x non è la trecentoventesima!
Sappiamo solo che è al terzo piano!
3 litri non sono eguali a 3 galloni!
maurizio tiriticco
misurazione 2007
9
Esempio di elaborazione
Ada e Bice, in due gruppi di 10 alunni prendono 8 in una prova, ma…
…vediamo i voti di Ada e di Bice nei 2 gruppi di 10 alunni
…gruppo di Ada 4 5 5 5 6 6 6 6 6 8
…gruppo di Bice 8 9 9 9 9 9 9 9 10 10
media della distribuzione di Ada
media della distribuzione di Bice
57 : 10 = 5,7
91 : 10 = 9,1
sigma della distribuzione di Ada 1, 00
sigma della distribuzione di Bice 0,53
Punto Z di Ada
Punto Z di Bice
8 – 5,7 : 1 = 2,30
8 – 9,1 : 0,53 = 2,07
Punto T di Ada 2,30 + 10 x 50 = 73
Punto T di Bice 2,07 + 10 x 50 = 29
Ergo!
L’8 di Ada non è eguale all’8 di Bice! Vale di piùùùù!
maurizio tiriticco
misurazione 2007
10
Analisi degli item
indice di difficoltà, DF, di un item
numero delle risposte errate diviso il numero totale delle risposte
difficoltà massima – DF = 1 tutte le risposte sono errate
difficoltà medio/max – DF = 0,75
difficoltà media – DF = 0,50
difficoltà medio-min – DF = 0,25
difficoltà inesistente – DF = 0
indice di discriminatività, DS, di un item
serve a valutare se un item è in grado di distinguere gli alunni
migliori dai peggiori
Numero delle risposte esatte dei migliori (1/3 del gruppo) meno
il numero delle risposte esatte dei peggiori (1/3 del gruppo) diviso
1/3 del gruppo. Gli esiti vanno da un +1 (DS positiva) a un –1 (DS
negativa)
maurizio tiriticco
misurazione 2007
11
LE PROVE SEMISTRUTTURATE
Le prove semistrutturate sono un mix di prove strutturate e di prove aperte.
Concretamente, l’insegnante elabora un testo di 2, 3 o 4 cartelle su un dato
tema studiato dagli alunni.
Il testo, nel suo sviluppo, contiene a finestra dei quesiti chiusi e aperti (ad
esempio 4 quesiti chiusi e 6 aperti).
Per ciascun quesito aperto, si indica quale lunghezza minima-massima
debbano avere le singole risposte (in genere da 80 a 100 parole).
Per la misurazione si procede così:
a) per i quesiti a risposta chiusa vale ciò che si è detto per i test;
b) per i quesiti a risposta aperta, si stabilisce un punteggio min/max in
relazione alla conformità o meno della risposta ad una risposta criterio
formulata ed attesa dall’insegnante. Ad esempio: 0 = risposta omessa, 1 =
basso, 2 = medio, 3 = alto. Ovviamente si può scegliere anche una scala
diversa, ma non oltre i 5 punti.
In ordine al massimo teorico raggiungibile complessivamente, si stabilisce
anche la soglia di accettabilità.
maurizio tiriticco
misurazione 2007
12
Esempio di misurazione di una prova
semistrutturata
5 quesiti test (ipotesi 1, vedi slide n. 5):
min. 0, max 5
7 quesiti a risposta aperta (ipotesi 0,1,2,3)
min. 0, max 21
totali: min. 0, max 26
soglia di accettabiltà: 16
oppure 20, prova difficile o 12, prova facile
maurizio tiriticco
misurazione 2007
13
La misurazione negli esami di Stato
maurizio tiriticco
misurazione 2007
14
Griglia di misurazione di una prova scritta di italiano
INDICATORI
1. Punteggiatura
2. Ortografia
3. Morfosintassi
4. Proprietà lessicale
5. Aderenza allo stimolo
6. Coerenza Organicità
7. Chiarezza espositiva Fluenza
8. Competenza nell’analisi
9. Competenza nella elaborazione personale
10. Flessibilità Fluidità Creatività
LIVELLI
B M A
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
Livello di accettabilità: 20 - Massimo teorico: 30
I singoli risultati si rapportano ai quindicesimi richiesti dalla norma
maurizio tiriticco
misurazione 2007
15
Prima prova scritta – Tipologia A – Analisi del testo
2 indicatori
B
M
A
lettura/decodifica del testo
1
2
3
analisi del testo
1
2
3
elaborazione critica, riflessioni, approfondimenti
1
2
3
aspetti
morfosintassi e lessico
1
2
3
formali
sviluppo argomentativo
1
2
3
B
M
A
conformità e congruenza dello stile e del registro linguistico del
“pezzo” con la tipologia del destinatario
1
2
3
modalità della trattazione dei dati e dei documenti di supporto e loro
corretta e pertinente utilizzazione ai fini della informazione
1
2
3
correttezza morfosintattica e capacità comunicativa
1
2
3
originalità della elaborazione
1
2
3
caratterizzazione del registro e dello stile ed eventuali capacità
divergenti e creative
1
2
3
aspetti
contenutistici
5 descrittori
Prima prova scritta – Tipologia B1 – Articolo di giornale
5 indicatori
maurizio tiriticco
misurazione 2007
16
Prima prova scritta – Tipologia B2 – Saggio breve
5 indicatori
B
M
A
conformità e congruenza dello stile e del registro linguistico del
“saggio” con la tipologia della pubblicazione e del destinatario
1
2
3
qualità della analisi dei dati forniti e loro corretta utilizzazione
1
2
3
corretta e pertinente utilizzazione delle citazioni, dei documenti, dei
riferimenti, delle testimonianze che accompagnano le indicazioni di
lavoro
1
2
3
correttezza morfosintattica e proprietà lessicale
1
2
3
originalità delle argomentazioni e della elaborazione
1
2
3
B
M
A
Prima prova scritta – Tipologie C e D – Tema tradizionale
3 indicatori
5 descrittori
COMPETENZE
punteggiatura ortografia morfosintassi
1
2
3
linguistiche
proprietà lessicale
1
2
3
CONOSCENZE mono e
pluridisciplinari
correttezza e pertinenza dei contenuti
1
2
3
CAPACITA’ elaborative
sviluppo delle argomentazioni
1
2
3
logico-critiche e
creative
originalità della elaborazione
1
2
3
maurizio tiriticco
misurazione 2007
17
TERZA PROVA SCRITTA
Tipologia E – Casi pratici e professionali, non più di 2
5 Indicatori
B
M
A
Identificazione della situazione problematica e degli ambiti di
riferimento; analisi dei diversi aspetti della situazione proposta
1
2
3
ipotesi per soluzioni diverse in ordine ai vincoli e alle opportunità
esistenti, ai costi necessari e alle risorse disponibili
1
2
3
elaborazione di uno o più piani di azione e loro fattibilità in ordine
agli obiettivi da perseguire e previsione delle conseguenze
1
2
3
avvio, conduzione e realizzazione dell’intervento per la soluzione – o
per le soluzioni – del caso
1
2
3
criteri e strumenti adottati per il monitoraggio e le eventuali
correzioni in itinere e valutazione dell’efficacia delle soluzioni
adottate e dei risultati raggiunti anche, eventualmente, in termini di
un possibile trasferibilità e/o generalizzazione
1
2
3
maurizio tiriticco
misurazione 2007
18
TERZA PROVA SCRITTA
Tipologia F – Un progetto
Il candidato sa:
B
M
A
individuare e definire le variabili, gli elementi, i fattori che concorrono alla
realizzazione del progetto in termini di finalità ed obiettivi
1
2
3
individuare, definire e utilizzare le risorse, i mezzi, la strumentazione, le
tecniche, le tecnologie, i costi, le procedure per la realizzazione del progetto
1
2
3
analizzare le diverse componenti della attività progettuale, programmazione,
pianificazione, esecuzione, controllo in ordine ai processi da realizzare,
anche in ordine ai vincoli da considerare
1
2
3
realizzare e produrre, ovviamente in via simulata, l’“oggetto” perseguito dal
progetto
1
2
3
valutare l’efficienza e l’efficacia del processo e del prodotto in termini tecnici,
di costi/benefici, degli eventuali impatti e dei suoi effetti nel tempo
1
2
3
maurizio tiriticco
misurazione 2007
19
COLLOQUIO PLURIDISCIPLINARE – edizione attuale
1 ÷ 4 = Basso;
5 = Medio;
6 = Medio/Alto;
7 = Alto
3 indicatori
5 descrittori
B
M
MA
A
competenze
morfosintassi e lessico
1÷4
5
6
7
linguistiche
sviluppo delle argomentazioni
1÷4
5
6
7
conoscenze generali
padronanza dei contenuti
1÷4
5
6
7
e specifiche
raccordi pluridisciplinari
1÷4
5
6
7
capacità elaborative, logiche,
critiche e creative
correttezza, pertinenza, originalità
nelle interazioni dialogiche
1÷4
5
6
7
maurizio tiriticco
misurazione 2007
20
COLLOQUIO PLURIDISCIPLINARE – edizione a. s. 2008-2009
1 ÷ 4 = Basso;
5 = Medio;
6 = Medio/Alto;
7 = Alto
3 indicatori
5 descrittori
B
M
MA
A
competenze
morfosintassi e lessico
1÷3
4
5
6
linguistiche
sviluppo delle argomentazioni
1÷3
4
5
6
conoscenze generali
padronanza dei contenuti
1÷3
4
5
6
e specifiche
raccordi pluridisciplinari
1÷3
4
5
6
capacità elaborative, logiche,
critiche e creative
correttezza, pertinenza, originalità nelle
interazioni dialogiche
1÷3
4
5
6
maurizio tiriticco
misurazione 2007
21
maurizio tiriticco
misurazione 2007
22
Scarica

Criteri e tecniche per la misurazione delle prove oggettive