Criteri e strumenti per la creazione di prove di verifica 1) Testing: tra tecnica e arte Gianfranco Porcelli 26 febbraio 2010 Città del Messico Istituto Italiano di Cultura Premessa • Le condizioni in cui si inquadrano le operazioni di testing negli IIC e in altre sedi non sono ottimali, se comparate con le condizioni nelle quali lavorano gli Enti Certificatori e alcuni Centri Linguistici Universitari • Malgrado ciò, la presa di coscienza rispetto alle strategie e tecniche migliori può essere di valido aiuto. Oggetto dell’esame • Idealmente: tutto • Realisticamente: un campione • Restrizioni a causa di: – limiti di tempo – affaticamento dell’esaminato – (in)disponibilità di strumentazione • P.A.C.E. Campionatura • Il più possibile estesa • il più possibile rappresentativa • Problemi: – le percentuali significative – ciò che non esaminiamo perché non sappiamo come fare Oggettività: un mito? • Prove oggettive – univocità della risposta esatta – predeterminazione del punteggio • Oggettive nella tecnica di risposta, soggettive nella scelta del campione, del livello, dei materiali, della strumentazione… • Obiettivo realistico: riduzione della soggettività Pre- e post-testing • • • • • Il test “una tantum” La banca di quesiti e le analisi post-test - indice di facilità - indice di discriminazione - analisi dei distrattori Facilità e discriminazione • Indice di facilità (IF): percentuale delle risposte corrette sul totale delle risposte attese (G * 100 / N) • Indice di discriminazione: rappresenta la tendenza di un quesito ad ottenere risposte esatte dagli studenti migliori Facilità e discriminazione Riduzione della soggettività • Produzione scritta: • Contenuto – appropriato / fuori tema – originale / banale – consapevole delle differenze interculturali / non… • Forma – lessico • vocaboli • espressioni idiomatiche – – – – sintassi morfologia ortografia … Processi di riduzione • a) attribuzione di un giudizio su ciascuno dei fattori individuati – presuppone l’attribuzione di “pesi” a seconda del rilievo dei fattori • b) attribuzione di un giudizio complessivo tenendo conto della gerarchia dei fattori • Fonti di ponderazione o gerarchizzazione: – il QCER – gli obiettivi locali e/o la politica degli IIC Le risposte a caso • Il Totocalcio • La correzione del “tirare a indovinare” (guessing) Pc = E – S / (A – 1) • superamento della scelta binaria “secca” (V/F) – meglio V/F/ND (non dichiarato, non disponibile, non documentato nel testo) • controllo del funzionamento dei distrattori Ansia da test La bella notizia Clever… Verare e falsare Bleah! Non solo Linus / 1 Non solo Linus / 2 La forza e il movimento Oggettività e realismo • Ciò che si guadagna in oggettività si perde in realismo • Le capacità di interagire nelle reali situazioni di comunicazione si possono osservare solo nelle reali situazioni di comunicazione padronanza / livello Padronanza e livello • “Padronanza” (achievement / attainment) commisurata all’apprendimento di quanto previsto in un determinato programma di studi e/o insieme di materiali didattici; • “livello” (proficiency) commisurato a quadri di riferimento esterni e alla competenza comunicativa in situazione. • Problema: l’altalena a mezz’aria – nessuno dei due bimbi ha i piedi per terra. La verifica del profitto come comunicazione • Tre termini cruciali: – Verifica – Profitto – Comunicazione La verifica del profitto come comunicazione • Verifica e valutazione • La ‘misurazione’ Verifica Valutazione Verifica Valutazione Performance Persona Insegnante Consiglio di classe La verifica… (1: di che cosa?) • Oggetto della verifica è la performance, ciò che lo studente “esterna”, come indice e campione della competence: a) indice, perché può condurre a intuire processi mentali e abilità complesse; b) campione, perché ogni prova di controllo non può che selezionare alcune abilità, competenze, aree lessicali... Input, Intake, Output INPUT INTAKE OUTPUT La verifica… (2: quali parametri?) • La accuracy, in termini di correttezza a livello fonetico, grammaticale e lessicale • La fluency, intesa come capacità di comunicare non necessariamente in modo totalmente accurato • La comprensione interculturale, grande obiettivo di fondo da non dimenticare Coerenza delle verifiche • con il metodo adottato: un testing di matrice strutturalista non è compatibile con approcci comunicativi e/o umanisticoaffettivi; • con gli obiettivi della verifica. • Senza tale coerenza il test è privo di VALIDITA’. Validità dei test • Definizione: capacità di un test di verificare ciò che intende verificare e nient’altro. – Test “di intelligenza” o “di lingua” ? Parametri della validità: – Pertinenza; – Accettabilità; – Comparabilità; – Economia. ...del profitto... CALIBAN: You taught me language, and my profit on’t Is, I know how to curse; the red plague rid you, For learning me your language! W. Shakespeare, The Tempest, I, ii, 363 [Italiano lingua seconda per i colf, 1611] …come comunicazione. a) coerente con un approccio comunicativo; b) come comunicazione operativa di obiettivi. Misurare: si può? • Unità di misura • Lo zero • Gauss e “distanze relative” • Misurare, in senso stretto, non si può. La distribuzione normale delle frequenze • Ovvero, anche il caso ha le sue regole Poligono frequenze 1 dado 1,2 1 0,8 0,6 1 dado 0,4 0,2 0 0 1 2 3 4 5 6 Poligono frequenze 2 dadi 7 6 5 4 2 dadi 3 2 1 0 2 3 4 5 6 7 8 9 10 11 12 Poligono frequenze 3 dadi 30 25 20 15 3 dadi 10 5 0 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Poligono frequenze 3 dadi 30 25 20 15 3 dadi 10 5 0 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Poligono frequenze 4 dadi 160 140 120 100 4 dadi 80 60 40 20 24 22 20 18 16 14 12 10 8 6 4 0 Poligono frequenze 5 dadi 900 800 700 600 500 400 300 200 5 dadi 28 30 26 22 24 18 20 14 16 10 12 8 6 100 0 Poligono frequenze 6 dadi 36 33 30 27 24 21 18 15 12 6 dadi 9 6 5000 4500 4000 3500 3000 2500 2000 1500 1000 500 0 Statica o dinamica? • • • • giovedì: 40° venerdì: 39° sabato: 37° domenica: 36° • lunedì… ? Verifiche statiche e dinamiche • Controllo del prodotto (“fotografia”) • Controllo dei processi (“cinepresa”) – alta definizione, 3D, ecc.: quali speranze per il testing? Norma e Criterio • “Norma”: riferimenti interni. – Il richiamo alla “norma” è un raffronto con i livelli medi di profitto riscontrabili in una classe (è un raffronto possibile, in qualche misura, per lo scolaro). • “Criterio”: riferimenti esterni – Il richiamo al “criterio” è un raffronto con parametri esterni — ad esempio, quelli offerti da Quadro Europeo di Riferimento un raffronto di norma impossibile per lo scolaro). (è La “sufficienza” • Sufficienza “assoluta” o “criteriale” (p. es. con riferimento alle esigenze di un’azienda); – “dieci euro sono sufficienti?” – criterio: il bene o servizio da acquistare • Sufficienza “relativa” o “normale”, ossia scolastica – “mio figlio è sufficiente?” – criterio: le attese dell’insegnante. Conoscenza delle lingue... • • • • Ottima Sufficiente Scolastica Da questo punto di vista l’insegnamento dell’italiano a stranieri in Italia è molto più realistico e attento all’extra-scuola Descrittori Produzione Scritta A • A1 - So scrivere una breve e semplice cartolina, per es. per mandare i saluti dalle vacanze. So riempire moduli con dati personali ad es. il mio nome, la nazionalità e l'indirizzo sulla scheda di registrazione di un albergo. • A2 - So scrivere semplici appunti e brevi messaggi su argomenti riguardanti bisogni immediati. Riesco a scrivere una lettera personale molto semplice, per es. per ringraziare qualcuno. Descrittori Produzione Scritta B • B1 - So scrivere semplici testi coerenti su argomenti noti o di mio interesse. So scrivere lettere personali esponendo esperienze e impressioni. • B2 - Sono in grado di scrivere testi chiari e articolati su un'ampia gamma di argomenti che mi interessano. Sono capace di scrivere saggi e relazioni, fornendo informazioni e ragioni a favore o contro una determinata opinione. So scrivere lettere mettendo in evidenza il significato che attribuisco personalmente agli avvenimenti e alle esperienze. Descrittori Produzione Scritta C • Sono in grado di esprimermi sviluppando analiticamente il mio punto di vista in testi chiari e ben strutturati. Scrivo lettere, saggi e relazioni esponendo argomenti complessi, evidenziando i punti che ritengo salienti. Sono in grado di scegliere lo stile adatto ai lettori ai quali intendo rivolgermi. • Sono in grado di scrivere testi chiari, scorrevoli e stilisticamente adeguati. Scrivo lettere, relazioni e articoli complessi e supporto il contenuto con una struttura logica efficace che aiuti il destinatario a identificare i punti salienti da rammentare. Sono capace di scriver riassunti e recensioni di opere letterarie e saggi professionali Errore e Sbaglio • I termini NON sono sinonimi nemmeno nella lingua italiana corrente: si può fare qualcosa per errore o per sbaglio, tuttavia si può solo indurre in errore ma non *indurre in sbaglio. • Le co-occorrenze • In Glottodidattica... L’errore • a) Si riferisce alla competence e quindi è sistematico; • b) Ha bisogno di interventi esterni e espliciti per essere corretto; • c) L’insieme degli errori rivela il livello di interlanguage raggiunto e, potenzialmente, il grado di fossilizzazione. Lo sbaglio • a) Si riferisce alla performance e quindi è occasionale; • b) Per definizione, può essere corretto da chi l’ha commesso, purché se ne accorga; • c) La frequenza degli sbagli può essere indice di uno stato ansioso in chi parla o scrive. Corollario fondamentale • Qualora un dato elemento venisse esaminato una sola volta in un test: • se la risposta è errata, non sapremo mai se si tratta di un errore o di uno sbaglio; • ma anche una risposta corretta potrebbe nascondere problemi di competence, con una performance “giusta per sbaglio”; – [errore palese e errore nascosto] È accaduto in una Scuola Media • Alcuni studenti hanno meritato un giudizio nettamente positivo sulla base delle risposte date a un questionario ma hanno rivelato gravi lacune nella comprensione del testo quando è stato chiesta la retroversione del brano su cui era basato il questionario. – (segue) C’è poca scelta … • Se si segue l’ordine del brano • la sequenza facilita il ritrovamento delle risposte giuste, “a intuito” • Se non si segue l’ordine del brano • si procede in modo innaturale e si inseriscono difficoltà artificiose La legge del non-reciproco (variante della “legge di Murphy”) • Se un test o una prova strutturata palesano errori, ci sono problemi di apprendimento. • Se invece non palesano errori, i problemi potrebbero esserci ugualmente. Genesi degli errori / 1 • a) transfer interlinguistico errori di “interferenza”: *the goods boys *le chaleur, le méthode *die Fräulein *largo (per “lungo”), *salita (per “uscita”), *aceto (per “olio”), *equipaggio (per “bagaglio”) ecc. ecc. Genesi degli errori / 2 b) transfer di apprendimento errori di ipergeneralizzazione: *who did arrive? *speak you English? • • • • Chi risponde dà una risposta Chi propone fa una proposta …ma chi dispone non dà una *disposta …e soprattutto chi suppone non… osta Genesi degli errori / 3 c) strategie didattiche, strategie di apprendimento della L2, strategie di comunicazione uso eccessivo o scorretto di: – forme rare – un solo genere – forme elementari • Esito generale: FOSSILIZZAZIONE Esempi (inglese LS) • What (happen) ________ there after I had left? • My friend Tom can ski vey well; he’s a small champion • A friend of mine / Un amico dei miei • What was Pepys doing when they woke him up? • You’ve written a romance Osservazione e Consapevolezza • Sono due parole-chiave, sempre più diffuse in Glottodidattica: • Imparare significa sviluppare consapevolezza, e per questo occorre anzitutto accorgersi delle strutture lessicali e grammaticali operanti nella lingua da imparare. Consapevolezza per l’autovalutazione • Perché chi impara una lingua possa autovalutarsi occorrono: • 1) coscienza precisa degli obiettivi e dei livelli desiderati (“criteri”); • 2) strumenti di verifica della correttezza della propria performance (non solo in termini di accuracy). Verifiche comode e verifiche valide • È anche colpa mia? • “Gli studenti sanno mettere le crocette ma non capiscono quello che fanno” • “mettere le crocette” può essere sostituito da: – Riempire i buchi – Abbinare tra due colonne – Riordinare – … altro ancora [che cosa?] Avevo scritto … … ma avevo anche scritto … • “non abbiamo mai affermato che i test debbano soppiantare in toto le prove tradizionali: essi servono invece ad assicurare che tali prove vengano affrontate dagli allievi in condizioni ottimali.” … concludendo così: • “Fare eseguire un riassunto o una composizione dopo aver accertato la padronanza delle strutture linguistiche è assai più produttivo che servirsi delle stesse prove anche per verificare tale padronanza.” – Il Language testing: problemi e tecniche, Bergamo, Minerva Italica, 1975, p. 124. Solo apparenze • 5 risposte esatte a 20 quesiti a scelta quadrupla • da 1 a 10, quanto valgono? • valgono ZERO! – Una scimmia addestrata che lavora a caso ha la stessa probabilità di raggiungere quel risultato, e se è fortunata fa anche meglio! Errori palesi e nascosti • “Maurice? Who's Maurice? What does he do?” • “He's a friend of mine. He's a waiter.” • Due studenti hanno tradotto a friend of mine come: – * un amico di famiglia. – * un amico dei miei genitori. • Sarà ‘giusto’ “un amico dei miei ” ? Una metafora del Language Testing • è quella dei ciechi che si accostano a un elefante: a seconda della parte con cui entrano in contatto (la proboscide, le zanne, le orecchie, la coda, ecc.) ognuno di loro ne avrà una percezione del tutto particolare; ne risulterà una serie di descrizioni che pur essendo in sé veritiere riflettono solo parzialmente un'entità che è qualcosa di più e di diverso della somma delle singole osservazioni. • Non è una metafora nuova ma serve comunque a metterci in guardia contro l'illusione di avere colto nel loro insieme realtà complesse quando invece se ne possiedono solo visioni unilaterali. Un elefante senza la coda L’assioma di Titone sul testing • Non possiamo prendere due piccioni con una fava: • siamo costretti a usare molte fave per prendere un solo piccione Problemi vecchi … • Se si usa una sola delle tante tecniche di testing si privilegiano gli allievi che si trovano bene con esse e si sfavoriscono indebitamente gli altri • Ossia, la pluralità delle tecniche come strumento di equità • Globalisti / serialisti … e problemi attuali • Se ci limitiamo alle verifiche mediante test potremmo non avere il quadro esatto delle (in)competenze degli studenti • Le prove che implicano la redazione di testi richiedono tempi lunghi di esecuzione e di correzione • ma sono indispensabili Grammatica e lessico • Per capire un testo e comunicare la grammatica serve a poco … • … il lessico molto di più! – Il Lexical Approach (1993) • Chi viaggia all’estero si porta una grammatica o un dizionario? • E allora, perché tendiamo a ragionare come se imparare una lingua fosse impararne la grammatica? Grammatica dell’aspettativa e testing pragmatico • Le prove pragmatiche mettono in gioco le competenze testuali – - in particolare la capacità di capire un testo facendo anticipazioni corrette • Oller (1979) cita anzitutto il dettato per l’orale e il cloze test per lo scritto, ma anche la traduzione e altre forme di parafrasi sono incluse tra le prove pragmatiche In linea generale, quindi … • Dettare per verificare la comprensione orale e far tradurre per verificare quella scritta – Sono prove complesse e quindi con un certo grado di difficoltà – Richiedono più tempo e impegno rispetto alle crocette e al tappabuchi • L’alternativa è illudersi di avere insegnato e illudere gli studenti su un profitto che non c’è Il dettato • Non “ortografico”, come prova del saper scrivere – Sistemi alfabetici (o addirittura ideografici) molto diversi da quello latino • ma come prova del saper ascoltare – alternative: dettato di disegni, di azioni … (ascolta e fai) [TPR] La procedura “cloze” I quattro famosi cantanti __1__ attesi da un momento all’altro __2__ una gran folla di giovani fan __3__ era radunata all’aeroporto __4__ accoglierli. Per la polizia fu molto difficile __5__ la folla sotto controllo dopo __6__ i cantanti erano apparsi sula scaletta. __7__ con una maglia rosa a strisce e __8__ azzurri, i capelli tagliati corti e __9__ strumenti musicali a tracolla, i __10__ givanotti si assomigliavano molto. Requisito generale • Lavorare su t e s t i • significativi – > di senso compiuto – > e possibilmente “incisivi” • La dimensione affettiva – Da insegnanti a “giudici” E quindi, per non vanificare il tutto: • Estrema attenzione alle differenze culturali – > la tragedia di perdere la faccia – > i tanti modi di • offendere • creare ansia • o anche “soltanto” disamorare e far perdere l’entusiasmo • Può bastare un giudizio formulato male e certi studenti non li vediamo più! Bibliografia – G. Porcelli, Il Language testing: problemi e tecniche, Bergamo, Minerva Italica, 1975, [p. 124]. – G. Porcelli, Educazione linguistica e valutazione, Torino, UTET-Libreria, 1998 – “Scuola e Lingue Moderne”, ANILS Associazione Nazionale Insegnanti Lingue Straniere, Campobasso [c.c.p. 10441863] Contatti • [email protected] • www.gporcelli.it • www.anils.it SALIDA “Siamo ancora confusi, ma a un livello più elevato.” Scale di valutazione • La “scala di valutazione generale” secondo B.J. CARROLL, Testing Communicative Performance, Oxford, Pergamon, 1980. • Il two-tier system e le certificazioni. 1/0. Non utente. • Può non riconoscere con sicurezza quale lingua si stia usando. 2. Utente intermittente. • Esecuzione ben al di sotto del livello di conoscenza operativa della lingua dell'uso quotidiano. La comunicazione si instaura solo sporadicamente. 3. Utente estremamente limitato. • Non possiede una conoscenza operativa della lingua dell'uso quotidiano, ma è migliore di un principiante assoluto. Né le abilità produttive né quelle ricettive permettono una comunicazione continuativa. 4. Utente marginale. • Manca di stile, scorrevolezza e accuratezza; non è facile comunicare con lui, l'accento straniero e la scarsa padronanza del codice provocano fraintendimenti. In genere se la cava senza gravi intoppi. 5. Utente modesto. • Sebbene in genere riesca a comunicare, spesso usa un linguaggio non accurato o improprio. 6. Utente competente. • Malgrado sappia far fronte alla maggior parte delle situazioni che probabilmente dovrà affrontare, è un po' carente nella scorrevolezza (fluency) e nell'accuratezza e occasionalmente incorrerà in fraintendimenti o errori significativi. 7. Utente buono. • Sa affrontare la maggior parte delle situazioni in un ambiente anglofono. Lapsus occasionali e limitazioni nel linguaggio non impediscono la comunicazione. 8. Utente ottimo. • La presentazione dell'argomento è chiara e logica con buono stile e una chiara percezione degli indicatori di atteggiamento. Si avvicina spesso alla competenza bilingue. 9. Utente esperto. • Comunica con autorevolezza, accuratezza e stile. Completamente a proprio agio nell'inglese idiomatico e specialistico.