Istituto Comprensivo “Pacinotti” San Cesario s/P (MO) Metodologia della valutazione decimale: strumenti, tecniche e strategie dott. Barbara Turella San Cesario s/P (MO) – 8-9 settembre 2009 Obiettivi dell’intervento formativo: incrementare la competenza nel costruire prove di verifica degli apprendimenti con particolare riguardo agli aspetti valutativi favorire la costruzione di una metodologia valutativa che consenta di passare dalla valutazione della singola prova alla valutazione complessiva facilitare l’individuazione di obiettivi formativi preventivamente connessi con la necessaria valutazione degli apprendimenti Competenza e compiti Raccolta di un insieme di evidenze osservabili e misurabili che attestino la padronanza del soggetto rispetto alla competenza attesa. Valutazione della competenza Valutazione delle conoscenze Valutazione delle abilità • Prove di verifica (più o meno strutturate) • Compiti autentici • Realizzazione di manufatti o prodotti • Selezione di lavori significativi per testimoniare il percorso di apprendimento e i risultati raggiunti La validità Consiste nel grado di corrispondenza tra la misura (rilevazione quantitativa o qualitativa) e ciò che si vuole misurare (fenomeno, processo, dato). La validità di una misurazione richiede: • un costrutto teorico che definisce e traduce la competenza nelle singole componenti, chiarendo le loro relazioni e la loro ampiezza. • la selezione delle componenti che intendiamo valutare • la definizione dei compiti, delle domande e delle prove che attivano le componenti selezionate • la costruzione di criteri di assegnazione del punteggio e di una scala di misura adatta alla misurazione La validità Validità di contenuto - Riscontro della significatività degli elementi da sottoporre a verifica; dovrebbero essere centrali e utili per la valutazione - Selezione degli elementi da sottoporre a verifica come rappresentativi della competenza da valutare Validità rispetto ad un criterio - Concorrente: misure simultanee degli stessi elementi - Predittiva: se disponiamo di un criterio con cui confrontare la valutazione a distanza di tempo Validità apparente - Controllo degli aspetti qualitativi ed emotivi in relazione all’adeguatezza degli stimoli rispetto ai destinatari L’affidabilità Consiste nel grado di precisione con cui si può effettuare la misurazione (reliable = che dà affidamento) Una misura affidabile presenta alti livelli di: - concordanza tra valutatori [r >.80] (basso livello di interpretabilità) - concordanza tra misurazioni ripetute (forme parallele, test-retest, split-half, ecc.) - precisione (dello strumento e del valutatore) - costanza del valutato (negli allievi si può incrementare aumentando le misurazioni) L’affidabilità Check-list per la valutazione della precisione nella misurazione Precisione dello strumento a) Lo stimolo che propone (consegne, formato, ecc.) è uguale per tutti? b) Gli stimoli offrono diversi livelli di risposta/soluzione? c) La scala di misura permette la registrazione “oggettiva” delle risposte? Precisione del valutatore a) Usa uno strumento strutturato per la verifica/misurazione? b) Nel caso di strumenti non strutturati, la registrazione è sistematica? c) Ci sono livelli interpretativi nella somministrazione o presentazione dello stimolo? d) Ci sono livelli interpretativi nell’attribuzione del punteggio? Costanza del valutato a) Il tipo di stimolo può essere condizionante b) Le modalità di somministrazione possono condizionare la verifica? c) Circostanze casuali che inficiano la rilevazione d) Ci sono dimensioni ambientali o personali che possono condizione la prestazione? L’affidabilità Check-list per la valutazione dei compiti Il compito: richiede l’applicazione di concetti, principi e abilità fondamentali appresi a nuovi concetti? incoraggia un progresso dell’apprendimento? implica processi di livello più elevato della semplice ripetizione della conoscenza appresa? è aperto a più soluzioni possibili? è sfidante? è inserito in un contesto reale? ha un valore significativo in sé? esige lo sviluppo e la ricostruzione della conoscenza appresa? è parte del processo di apprendimento? integra conoscenze e abilità? sviluppa una maggior comprensione di concetti e di principi? fornisce chiare indicazioni riguardo a ciò che deve essere eseguito? è appropriato agli studenti a cui è proposto, è realizzabile in rapporto alle fonti richieste, è chiaro? mantiene un buon equilibrio tra la precisione delle richieste e le diverse possibili alternative? è in linea con gli standard e gli obiettivi del curricolo scolastico? dispone di criteri che rendono possibile e chiara la sua valutazioni? L’oggettività della valutazione Lichtner (2002): l’equivoco risiede nell’equazione “quantitativo=oggettivo”. “Bisogna chiedersi come sono stati generati quei dati che poi elaboriamo. Tutto dipende dalla formulazione dei quesiti, dal tipo di alternative poste, che condizionano il comportamento che rileviamo. E la messa a punto di queste condizioni è satura di elementi soggettivi, frutto di scelte che a volte sono addirittura idiosincratiche. Se l’elaborazione quantitativa dei dati raccolti è “oggettiva”, certamente non è tale la procedura che ha “generato” i dati”. (Lichtner, 2002, pp. 97-98) Misurabili Significativi Non significativi Non misurabili I compiti: prove strutturate (test) Forniscono uno stimolo e modalità di risposte di tipo chiuso Sono oggettive quando è possibile predefinire le risposte corrette per i singoli quesiti Possono essere prove di classe o prove standardizzate Operativamente: 1. Definire la forma del quesito o item: domande a scelta multipla, vero/falso, ecc. o problema, analisi di caso ecc. 2. Strutturare lo stimolo: circoscrivere il campo delle possibili risposte (per es. numero di alternative o serie di punti da seguire nell’esecuzione del compito) 3. Individuare “a priori” la risposta corretta ovvero formulare i criteri di attribuzione del punteggio • • • • • • Tipi di quesiti Soluzione di problemi Analisi di casi Vero/falso Scelta multipla Corrispondenza Completamento I compiti: prove strutturate (test) Esercitazione per disciplina (stabilito il livello) 1) 2) 3) 4) 5) 6) Scegliere la competenza da valutare Individuare prestazioni rappresentative della competenza prescelta Strutturare un test con item che discriminino la presenza/assenza della competenza Assegnare un peso agli item e stabilire i criteri di attribuzione del punteggio Calcolare il punteggio Stabilire il criterio con cui valutare i punteggi ottenuti I compiti: prove non strutturate Come si individuano gli indicatori? Gli indicatori sono validi rispetto a ciò che vogliamo valutare? Gli indicatori consentono un adeguato accordo tra valutatori? Le misurazioni sono affidabili? 1) 2) 3) 4) 5) Definire l’ampiezza/costrutto dell’oggetto della valutazione Selezionare gli indicatori possibili Stabilire l’ampiezza e la ripartizione della scala di punteggi o voti da considerare Prevedere l’uso di aggettivi o espressioni per marcare le singole fasce dei valori di scala Concordare ed usare collegialmente gli insiemi di indicatori per addestrarsi nel loro uso Indici di accordo I = 100 x accordi/ accordi + disaccordi r = 2p – 100 (nei casi di 2 valutatori p = percentuale di accodo) I compiti: prove non strutturate L’elaborazione degli indicatori a) b) c) Metodo intuitivo: i singoli esperti del settore o della competenza possono predisporre una lista di descrittori che può sia essere discussa e condivisa collegialmente sia essere sottoposta a verifica empirica Metodi qualitativi: si procede alla raccolta sistematica di dati per definire ciò che si intende valutare; successivamente si “campionano” i descrittori rispetto alle prestazioni Metodi quantitativi: l’osservazione e l’interpretazione degli indicatori avvengono attraverso l’analisi statistica (molto sofisticata come l’analisi discriminante, lo scaglionamento multidimensionale, ecc.) Esercitazione per disciplina (stabilito il livello) 1) 2) 3) 4) 5) 6) 7) Scegliere la competenza da valutare Individuare prestazioni rappresentative della competenza prescelta Classificare le prestazioni in una scala a 4 punti (pieno, adeguato, parziale, scarso) Riconoscere gli indicatori sottesi Assegnare un peso agli indicatori e stabilire i criteri di attribuzione del punteggio Calcolare il punteggio Stabilire il criterio con cui valutare i punteggi ottenuti I compiti: prove non strutturate Griglia di valutazione del colloquio Indicatori 0-12 pt. 13-21 pt. 22 pt. 23-28 pt. 29-34 pt. 35 pt. Padronanza della lingua Scarsa Incerta Accettabile Sicura Specifica Ricercata Capacità di utilizzare le conoscenze Scarsa Limitata Accettabile Adeguata Significativa Documentata Capacità di collegare le conoscenze Scarsa Approssimativa Accettabile Appropriata Ampia dettagliata Capacità di discutere gli argomenti Scarsa Ripetitiva o meccanica Accettabile Appropriata Ampia Arguta Capacità di approfondire gli argomenti Scarsa Limitata Accettabile Articolata Ampia Originale I compiti: prove non strutturate Griglia di valutazione di quesiti a risposta singola su scala unitaria Indicatori 0-5 pt. 6-9 pt. 10 pt. 11-14 pt. 15 pt. Padronanza della lingua Scarsa Incerta Accettabile Sicura Specifica Esaustività degli argomenti Scarsa Limitata Accettabile Adeguata Ampia Collegamento delle conoscenze Scarsa Approssimativa Accettabile Appropriata Ampia Capacità argomentativa Scarsa Ripetitiva o meccanica Accettabile Appropriata Ampia Griglia di valutazione di quesiti a risposta singola con indicatori ponderati Indicatori Banda di oscillazione Padronanza della lingua 0–2 Esaustività degli argomenti 0–6 Collegamento delle conoscenze 0–4 Capacità argomentativa 0-4 I compiti: prove non strutturate Griglia di valutazione per elaborati scritti Indicatori generali Sottoindicatori Livello 1 Pt. Livello 2 Pt. Competenze linguistiche Morfosintassi Sintassi errata 0 Sintassi elementare 2,0 Lessico Improprio 0 Generico Ortografia Errori diffusi 0 Punteggiatura Scorretta Competenze comunicative Costruzione discorso Competenze testuali Livello 3 Pt. Livello 4 Pt. Sintassi corretta 3,0 Padronanza 4,0 1,0 Appropriato 1,5 Accurato 2,0 Alcuni errori 2,0 Corretta 1,5 Corretta 4,0 0 Incerta 1,0 Corretta 1,5 Appropriata 2,0 Disorganico e sconnesso 0 Coerente con incertezze 1,0 Coerente 1,5 Ben strutturato 2,0 Comprensione significato Nulla 0 Sostanziale 1,0 Generale 1,5 Completa e approfondita 2,0 Sintesi Inefficace 0 Frammentaria 2,0 Efficace 3,0 Efficace e organica 4,0 I compiti autentici Le forme più tradizionali di valutazione, sia con prove strutturate che non strutturate, tendono a essere basate retroattive, basate cioè sull’accertamento di quanto appreso, piuttosto che proattive orientando l’allievo verso il miglioramento dell’apprendimento Le forme tradizioni di valutazione si basano quasi esclusivamente su fattori estrinseci di motivazione (voto, successo, competizione, ecc.) piuttosto che su fattori intrinseci (interesse, curiosità, piacere, ecc.) L’apprendimento accertato con prove tradizionali tende a basarsi su una conoscenza scolastica scarsamente trasferibile e applicabile a contesti di vita reale Si definisce compito autentico un problema complesso e aperto posto agli studenti come mezzo per dimostrare la padronanza di qualcosa Con i compiti autentici possono essere valutate tre dimensioni: le conoscenze dichiarative e procedurali i processi cognitivi (analisi, riflessione, creatività, collaborazione, decisione, ecc.) i processi metacognitivi, motivazionali e attribuzioni I compiti autentici CARATTERISTICHE DEI COMPITI AUTENTICI - Prevedono un contesto di realtà, diretto o simulato - Utilizzano stimoli che sollecitano l’impiego di processi cognitivi complessi e l’integrazione degli apprendimenti - Risultano in grado di favorire l’interesse e di motivare gli studenti ad un impiego efficace del proprio sapere, delle proprie risorse cognitive, sociali ed emotive in relazione al compito Operativamente: I compiti devono essere autentici e significativi L’insieme dei compiti deve rappresentare un campione rappresentativo per effettuare generalizzazioni I criteri di valutazione devono essere centrati sulla natura dei compiti stessi e sull’insieme di conoscenze, abilità e disposizioni che intendono evidenziare per consentire una valutazione autentica Il contesto in cui si inseriscono le prove deve essere realistico e piacevole riducendo le limitazioni di tempo e di accesso alle risorse I compiti autentici Esercitazione per disciplina (stabilito il livello) 1) 2) 3) 4) 5) 6) 7) Scegliere la competenza da valutare Individuare prestazioni rappresentative della competenza prescelta Classificare le prestazioni in una scala a 4 punti (pieno, adeguato, parziale, scarso) Riconoscere gli indicatori sottesi Assegnare un peso agli indicatori e stabilire i criteri di attribuzione del punteggio Calcolare il punteggio Stabilire il criterio con cui valutare i punteggi ottenuti I punteggi e la valutazione 1) Analisi dei quesiti Indice di facilità/difficoltà (buono 0.30< i <0.70) Pc = Nc/N (Pc = proporzione di risposte corrette; Nc = n. risposte corrette; N = n. di risposte totali) Discriminabilità (buono 0.20< d <0.40) d = Esup –Einf /N (Esup = punteggio max; Einf = punteggio min; N = numero di soggetti) 2) Pesi nella correzione a. Calcolo delle risposte giuste senza omissioni b. Calcolo delle risposte considerando la probabilità del caso (penalizzazione dell’errore) P = (E – S/n-1) K (E = n. risposte esatte; S = n. risposte errate; n = n. alternative; K = peso dell’item) 3) Ranghi percentili Rango percentile = (n. stud. con punteggio più basso + ½ stud. stesso punteggio/N stud.) x 100 Suddivisione in quartili (fasce di punteggio) 4) La mediana Collocare i punteggi in ordine decrescente e quantificare le frequenze per punteggio Mediana = (n. soggetti + 1)/2 in corrispondenza di quel soggetto individuare il punteggio I punteggi e la valutazione 5) Calcolo della media e deviazione standard Un test offre prestazioni omogenee quando la deviazione standard è contenuta entro il 20% della media Media della distribuzione x Scarto quadratico medio/dev. standard x i s N x i x N 2 d .s. x i x 2 N 1 6) Standardizzazione dei punteggi Consente di confrontare e valutare le prestazioni dello stesso soggetto in più compiti e tra soggetti z xx s z xx d .s. z = punto standard x = punteggio grezzo x = media della distribuzione S = scarto quadratico medio d.s. = dev. standard Si può utilizzare la standardizzazione in punti T (aggiunge una costante – spesso 50 – per eliminare i valori negativi ( T = 50 + 10 z) I punteggi e i voti Dopo aver calcolato media e deviazione: Distribuire i punteggi in fasce in funzione della distanza (dev. standard) dalla media (es. fasce pentenarie) e poi convertire i giudizi (scala di aggettivi) in voti Es. distribuzione pentenaria A superiori a xm + 1,5 d.s. Ottimo 8 B compresi tra xm + 1,5 d.s. e xm + 0,5 d.s. Buono 7 C compresi tra xm - 0,5 d.s. e xm + 0,5 d.s. Sufficiente 6 D compresi tra xm - 0,5 d.s. e xm - 1,5 d.s. Quasi sufficiente 5 E inferiori a xm – 1,5 d.s. Non sufficiente 4 Trasformare i punteggi grezzi in voti attraverso proporzioni (riferimento a criteri assoluti) xg : xm = voto : media scala dei voti oppure xg : xmax = voto : votomax N.B. La media della scala dei voti è: 6 se si usano i voti dal 4 all’8 5,5 se si usano i voti da 1 a 10 5 se si usano i voti da 0 a 10 Trasformare i punteggi standardizzati in voti (riferimento a norma) (Pgrezzo – xgrezzo)/dev.st. = (voto – media scala voti)/1 Voto = media scala voti + punteggio standardizzato Le scale di misura Scale Ordinale B C Complessivo raggiungimento degli obiettivi; padronanza raggiunta con consapevolezza. Raggiungimento degli obiettivi essenziali; la padronanza è adeguata per lo svolgimento del programma Raggiungimento di obiettivi essenziali in situazioni semplici. D 8 7 6 Parziale raggiungimento degli obiettivi minimi programmati Mancato raggiungimento degli obiettivi minimi programmati Percentili 100 95 90 85 80 75 70 65 60 55 5 Bocciati E 9 INSUFFICIENTE Promossi 10 SUFFICIENTE A Pieno e completo raggiungimento degli obiettivi; padronanza dei contenuti; abilità a trasferirli in altra situazione. Voti in decimi Giudizi Descrizioni verbali BUONO Fasce pentenarie DISTINTO Dicotomica Intervalli OTTIMO Nominale 4 3 2 1 50 45 40 35 30 25 20 15 10 5 I criteri della valutazione - Criteri assoluti (Confronto tra prestazione e obiettivi attesi) In questo caso la valutazione di ciascuna prova è effettuata in modo indipendente dall’andamento generale delle prove svolte dagli allievi. Per esempio si può dare il voto massimo solo se mancano del tutto gli errori o se ve ne sono soltanto in una certa misura; o si dà un giudizio di insufficienza solo per la constatazione di un certo tipo di risposta, o per il fatto che a una certa domanda non è stata data risposta; o ancora si sottrae punteggio per ogni errore accertato. - Criteri relativi (Confronto tra prestazioni di un soggetto e quelle di altri soggetti) In questo caso la valutazione di ciascuna prova è effettuata in modo dipendente dall’andamento generale delle prove svolte dal gruppo di allievi cui si fa riferimento. Per esempio si può attribuire il punteggio ad una prestazione utilizzando una “prestazione criterio” (riferimento approssimativo). Altrimenti si può calcolare la media o la distribuzione dei punteggi attraverso cui “riaggiustare” la misurazione delle singole prove. - Criteri delle possibilità e del cambiamento (Confronto tra prestazioni dello steso soggetto) In questo caso la valutazione di ciascuna prova è effettuata riferendosi alle possibilità del soggetto e alle variazioni del suo rendimento Per esempio si può considerare che in una prova il soggetto non ha reso quanto avrebbe potuto , o che ha fatto quanto nelle sue possibilità. Si possono anche considerare le variazioni (progressi o regressi) rispetto alle prestazioni dello stesso soggetto nel tempo, senza considerare una misura assoluta. La valutazione analitica Si tratta di giudizi per discipline che possono essere costruiti: a) considerando i diversi elementi di misura utilizzati: tipi di verifiche, osservazioni di comportamenti cognitivi, analisi del trend delle prestazioni, ecc.; b) “pesando” i singoli elementi che concorrono alla valutazione rispettandone la specificità; c) definire i livelli della scala prevista per il giudizio Gli elementi considerati per la valutazione possono essere: - risultati centesimali delle verifiche; insieme dei dati, media, moda; - progresso rispetto al livello di partenza; - standard delle prestazioni stabilite in base alle caratteristiche della disciplina; - osservazione dei comportamenti cognitivi. La valutazione globale per disciplina La valutazione globale delle prestazioni risulta più attendibile se: - si aumenta la numerosità delle verifiche - si incrementa la differenziazione delle verifiche - si attribuiscono pesi diversi alle verifiche Operativamente: • Media aritmetica dei punteggi delle verifiche • Media pesata dei punteggi delle verifiche • Riferimento alle prestazioni complessive del gruppo • Riferimento all’andamento delle prestazioni del soggetto La valutazione sintetica Si tratta di un giudizio globale che dovrebbe descrivere il grado di raggiungimenti rispetto a specifici obiettivi e descrittori e che dovrebbe, almeno in parte, poggiare sui singoli giudizi analitici per disciplina. - a) b) c) In genere il giudizio sintetico fa riferimento a: comportamento disciplinare livello di sviluppo emotivo e sociale partecipazione alle attività metodo di studio impegno profitto o livello di apprendimento Per far ciò i docenti dovrebbero collegialmente: individuare e concordare una serie di indicatori comuni; esplicitare la misurabilità degli indicatori individuati in ciascuna delle diverse discipline e fornire il dato analitico al gruppo di colleghi coinvolti; sintetizzare i vari giudizi in una formulazione globale, chiara e comprensibile ai diversi destinatari, capace di esprimere anche le eventuali divergenze di giudizio. Grazie Dott. Barbara Turella Dottore Magistrale in Psicologia dello Sviluppo e dell’Educazione – Psicoterapeuta Dottore di Ricerca in Psicologia Cognitiva – Perfezionata in Psicologia Scolastica Via del Campo, 27 – 00172 Roma Tel. 3393322719 e-mail [email protected]