ADi Ass. Docenti Italiani Associazione Qualificata per la Formazione dei Docentihome

VALUTAZIONE DEGLI APPRENDIMENTI

di Luisa Benigni   ADI - PERUGIA

INTRODUZIONE

…ma la valutazione può essere oggettiva?

Il nuovo Esame di Stato ha fatto esplodere il problema della valutazione in tutta la  secondaria superiore, fino a quel momento complessivamente meno investita della questione rispetto a elementari e medie.

Ora tutti la vogliono "oggettiva", ma la valutazione può essere oggettiva?

Diciamo subito che l'oggettività in senso vero non è realizzabile ed è perciò necessario imparare ad accettare questo dato senza sentirsi troppo in colpa.

Dobbiamo in ogni caso cercare di raggiungere la massima obiettività possibile, ossia il più alto grado di imparzialità ed equità, lavorando con la soggettività, e non nonostante questa. Solo così potremo peraltro rendere comparabili i risultati.

Dobbiamo aggiungere che ci sono non poche difficoltà nella diffusione di una cultura  della valutazione, sia perché non ci sono ancora in Italia riferimenti nazionali ("standards di contenuto", che cosa gli alunni devono sapere e saper fare, e "standards di prestazione", su quali parametri si deve attestare una preparazione sufficiente, più che sufficiente, ecc..), sia perché non sono stati predisposti supporti seri e capillari per i docenti.  Ma la questione non è certo nuova...

il problema fu posto 80 anni fa

La scienza della valutazione, più propriamente docimologia (dal greco "dokimazein"  "esaminare"), è nata nel 1922 e prese avvio proprio dall'esigenza di analizzare la validità e la coerenza dei giudizi  espressi dagli insegnanti negli esami.

Balzò prepotentemente alla ribalta nel 1931 quando un'indagine condotta negli USA rese noti dati assolutamente allarmanti sull'affidabilità dei risultati degli esami.

La docimologia si è inizialmente concentrata sull'analisi delle ragioni della diversità dei giudizi attribuiti ad una stessa prova, non solo da insegnanti diversi, ma anche dallo  stesso insegnante in tempi diversi.

Gli studi si sono via via approfonditi, attraverso indagini sempre più raffinate sulla validità e attendibilità delle misurazioni e valutazioni delle conoscenze e competenze. In questo quadro hanno assunto grandissima importanza gli strumenti  o prove di verifica.

In Italia, fortemente affezionati alle prove tradizionali, ci stiamo solo ora cimentando, a livello di massa, con  la  vasta gamma delle prove di verifica.

Proviamo allora ad analizzarle insieme, così da affrontare con più serenità e consapevolezza quella parte non secondaria della nostra attività didattica che è la valutazione.

LE PROVE DI VERIFICA

tre requisiti: validità, attendibilità, funzionalità

Le prove di verifica dovrebbero innanzitutto  rispondere a tre requisiti.

  1. Validità. E' riferita agli aspetti qualitativi delle prove.  Le prove sono valide  se spaziano su un campione sufficientemente rappresentativo delle  conoscenze e/o abilità che si intendono indagare. Questo campione deve essere fortemente ancorato al curricolo effettivamente svolto e tenere conto: a) degli obiettivi che ci si è dati, b) dei contenuti che si sono sviluppati, c) del tipo di scuola (la prova di italiano in un istituto professionale non può essere uguale a quella in un liceo), d) della metodologia didattica usata.

  2. Attendibilità. E' riferita alla fedeltà delle misurazioni. Le  prove sono attendibili se utilizzano sistemi di misura stabili ed omogenei e se hanno determinato preventivamente e senza ambiguità i criteri di interpretazione dei risultati.

  3. Funzionalità. E' riferita  agli aspetti pratici dello svolgimento  e della valutazione delle prove. Una prova è funzionale se ciò che si chiede di fare è enunciato in modo chiaro, se la valutazione è espressa in modo altrettanto chiaro e ottenuta  in modo pratico e riconoscibile.

due tipologie o forse tre

In relazione ai momenti della valutazione, le prove si distinguono in  formative  e sommative.

Prove formative

Le prove  formative si svolgono in corso d'opera. Devono fornire informazioni agli insegnanti, ma anche agli alunni, sulla rispondenza fra insegnamento e apprendimento. Sono una guida importante al miglioramento: aiutano a regolare i ritmi, a ricercare alternative, a predisporre attività di rinforzo ecc... Le prove formative verificano tutti gli obiettivi relativi alle  singole  parti del curricolo  svolte.

Prove sommative

Le prove sommative, sono prove conclusive, e intendono verificare i risultati complessivi. Verificano un campionamento degli obiettivi più rappresentativi del curricolo svolto (non consentono obiezioni del tipo "Prof, non può chiedercelo, l'abbiamo fatto nel primo quadrimestre!").

A queste due tipologie classiche, di norma si aggiungono oggi le prove iniziali con valore diagnostico di partenza.

due definizioni preliminari: finalità e obiettivi specifici

Quando predisponiamo prove di verifica dovremmo sempre preliminarmente definire le  finalità e gli obiettivi specifici che ci proponiamo di indagare.

Le finalità esprimono le intenzioni dell'azione formativa che si sottopongono a verifica. Esempio: con questa prova  intendiamo verificare

Gli obiettivi descrivono ciò che nello specifico lo studente deve dimostrare di sapere e saper fare. Gli obiettivi devono essere enunciati con verbi che esprimono azioni il più possibile osservabili e misurabili.

Se diciamo: “Vogliamo accertare se l’allievo conosce i beni artistici e culturali offerti dal territorio”, non abbiamo individuato correttamente l’obiettivo, perché "conoscere" non è né osservabile né misurabile.

Se invece diciamo: “Vogliamo accertare se l’allievo è in grado di elencare i beni artistici e culturali offerti dal territorio”, l'obiettivo è stato correttamente indicato perché è diventato osservabile e misurabile.

Nel caso in cui  vogliamo la descrizione e/o l’inquadramento storico-artistico dobbiamo formulare la  richiesta in modo esplicito e quindi usare il verbo «descrivere» e/o «inquadrare», indicando preferibilmente quantità e tipologia .

I verbi da usare nell'enunciazione degli obiettivi devono quindi essere di tipo operativo.

due vincoli: condizioni e criteri

La prova dovrebbe contenere, secondo Mager[1],  anche due vincoli che aiutano a predeterminare i criteri di valutazione. Sono:

Ad esempio: Eseguire una traduzione dall'inglese all'italiano di un brano di 20 righe di media difficoltà (prestazione) tramite l'uso del vocabolario in non più di 30 minuti (condizioni) senza commettere più di 4 errori di ortografia, lessico o sintassi (criterio).

Talvolta la specificazione di questi due vincoli (condizione e criterio), o di uno di essi, può non essere necessaria se è implicita nell'indicazione della prestazione. Ad esempio l'obiettivo "inserire un filo da cucito nella cruna dell'ago", utilizzabile per verificare il grado di presbiopia di un soggetto, non ha bisogno del criterio, in quanto non esiste una graduazione di livelli di prestazione o si è in grado di eseguirla o non si è in grado, non vi sono valori intermedi. Tutt'al più si potrebbe stabilire una condizione ("in non più di 7 secondi/ a meno di 30 cm").

e  tre classificazioni: non strutturate, strutturate, semistrutturate

Una volta definiti finalità e obiettivi specifici, dobbiamo scegliere le prove più idonee ad accertarli .

Uno dei criteri di classificazione delle prove è il grado di strutturazione che  presentano, in un continuum che va dal minimo di strutturazione, ad esempio del tema e delle interrogazioni tradizionali, al massimo di strutturazione delle così dette "prove oggettive di verifica".

La strutturazione riguarda sia il modo in cui vengono presentati gli "stimoli" (l'enunciazione di ciò che si chiede)  sia le risposte .

u      Prove non strutturate (stimolo aperto, risposta aperta): le risposte non sono univoche e non sono predeterminabili. Sono le prove tradizionali quali l'interrogazione, il riassunto, il tema, la relazione, l'articolo etc.

u      Prove strutturate (stimolo chiuso,  risposta chiusa): le risposte sono univoche e predeterminabili. Le prestazioni possono essere misurate con precisione. Sono anche chiamate prove oggettive di verifica[2]. Sono i quesiti: vero/ falso, corrispondenze, scelta multipla,  completamento.

u      Prove semistrutturate (stimolo chiuso, risposta aperta): le risposte non sono univoche ma sono in grande misura predeterminabili grazie ai vincoli posti negli stimoli. Le tipologie, con alcune eccezioni, sono le stesse delle prove non strutturate.

Esaminiamo ora le tre tipologie, con particolare riferimento a limiti e vantaggi

Prove non strutturate

Limiti

Se ci riferiamo ad almeno  due dei  requisiti fondamentali delle prove di verifica, ossia la validità e l'attendibilità, i limiti delle prove tradizionali o non strutturate sono evidenti. Sono limiti

Sono inoltre noti gli effetti negativi che queste prove producono come ci spiega G. Domenici[3]:

·      effetto alone (condizionamento a valutazioni negative o positive precedenti)

·      effetto contrasto (condizionamento a standard ideali di prestazione)

·      effetto stereotipia (condizionamento ad opinione generalizzata originaria)

·      effetto pigmalione (condizionamento a predizioni)

Vantaggi

Nonostante i limiti che noi tutti riconosciamo alle prove tradizionali, siamo anche consapevoli che sono uno strumento che permette di verificare obiettivi non sempre analizzabili con prove di tipo strutturato.

Si può sicuramente affermare che le prove tradizionali consentono di:

Prove semistrutturate

Vantaggi

Le prove tradizionali possono essere uno strumento insostituibile di valutazione ad alcune precise condizioni,  se valutiamo ciò che abbiamo insegnato, se aumentiamo il grado di strutturazione degli stimoli, se stabiliamo precisi criteri per la valutazione, se definiamo gli standard di misurazione ed i relativi punteggi. In breve se le trasformiamo in prove semistrutturate. Le prove  semistrutturate uniscono i pregi delle prove oggettive e di quelle tradizionali e sono pertanto da preferire come strumento di valutazione.

Qui di seguito è dato un esempio di come un titolo generico di un tema può essere strutturato come trattazione sintetica:[5]

Tema: "Lo sviluppo socio-economico del tuo paese ".

Trattazione semistrutturata: "Descrivi in ordine di importanza le tre cause principali che hanno favorito lo sviluppo socio-economico del nostro paese a partire dal secondo dopoguerra. Confronta gli esiti dello sviluppo economico con i principi stabiliti al Titolo III della Carta Costituzionale riguardante" i Rapporti Economici" ed infine  descrivi gli effetti più immediati dello sviluppo economico sulla organizzazione sociale con particolare riferimento a:

a)     organizzazione dei ruoli all'interno della famiglia

b)     modificazione dei consumi familiari

La prima traccia non consente di predeterminare criteri di valutazione poiché non descrive alcun tipo di prestazione. Nel secondo caso è invece possibile creare una griglia di valutazione con parametri facilmente deducibili dal percorso obbligato dato.

Risposte criterio

Per garantire alla prova semistrutturata un buon livello di validità, attendibilità e funzionalità sarebbe opportuno compilare, contestualmente alla elaborazione della prova, le risposte-criterio.

Si tratta di creare le risposte che un nostro studente in possesso di buona preparazione culturale e/o professionale dovrebbe essere in grado di produrre. In questo modo è possibile da un lato eliminare difetti nella formulazione delle domande o sottodomande, che potrebbero risultare poco chiare o poco pertinenti, dall'altro tarare meglio la prova relativamente alla condizione (tempo concesso, n° di parole, strumenti utilizzabili ecc..) ed al criterio (n° di errori ammessi ecc…).

La creazione di possibili risposte può permettere anche di ottenere un buon grado di obiettività nella fase di correzione della prova e di assegnazione dei punteggi. E' interessante ricordare a questo proposito che la formulazione delle prove per gli esami di maturità in Germania è sempre accompagnata , ad uso dei docenti, dai risultai attesi.

L' esempio che segue mostra alcuni dei quesiti di una prova semistrutturata multidisciplinare preparata per un Istituto Professionale per Operatori Turistici, e le relative risposte criterio.

DESTINAZIONE AUSTRALIA[6]

CARTINA GEOGRAFICA AUSTRALIA 

Geografia turistica

Quesito 1 (P.4)

Individua tre località corrispondenti a tre diverse tipologie turistiche in Australia e per ognuna di esse:

a)     fornisci indicazioni precise sulla localizzazione geografica (nome e posizione) (P.0,5)

b)     descrivi aspetti storici, culturali o naturali delle 3 località prescelte (P.2)

c)     individua il target di riferimento e spiegane brevemente le ragioni. (P.1,5)

Puoi usare un massimo di 100 parole per ogni località.

Inglese
Quesito 2 (P.1,5)

Now refer to your personal knowledge of Australia and describe at least 3 of the main tourist attractions in no more than 60 words.

Matematica

Quesito 3 (p.4)
Paese Numero di arrivi (in migliaia) variazione  %
1987 1991

Australia

1785 2370 +32,7  

Fiji

190   259 +32,7

Polinesia Francese

143 121 -15,4  

Nuova Zelanda

844   963

+14,0

Il flusso turistico in Australia nel quinquennio 1987-1991 ha subito un incremento del 32,7% passando da 1.785 a 2.370 in migliaia di unità.

La funzione matematica che rappresenta il flusso è esponenziale del tipo y=1.785+cx  con c= 3,57628.

Ti viene richiesto:

a)     di tracciare a grandi linee il relativo grafico nel dominio 0£ x £5 intendendo per 0 l’anno iniziale 1987 e per 5 l’anno 1991

b)     di spiegare in non più di 80 parole le caratteristiche della funzione con particolare riferimento a codominio, iniettività, suriettività, biettività e crescenza

c)     di descrivere in non più di 50 parole la funzione esponenziale  y = ax , sia nel caso in cui a>1 sia nel caso in cui a sia compreso tra 0 e 1.

La strutturazione dei quesiti permette di osservare le prestazioni in modo preciso e perciò anche di predeterminare i criteri di misurazione. Essi contengono anche la condizione (i materiali, gli strumenti, il numero di parole etc) .

Possibili risposte criterio

Geografia turistica

Quesito 1

Prima località: Barriera Corallina

a)     La Barriera Corallina si estende per circa 2000 km lungo la costa orientale dell’Australia.

b)     La Barriera Corallina ha un’ampiezza di circa 300 km e comprende un patrimonio ittico unico al mondo. Costituita da formazioni coralline che creano, durante la bassa marea, terre effimere ed ostacolano la navigazione sottocosta, è il regno dei pesci tropicali. La Barriera Corallina  è oggi un parco naturale.

c)     Consigliato ad un turista giovane o di età media che preferisca la vacanza al mare a diretto contatto con la natura.(87 parole)

Seconda località: Ayers Rock

a)     Si trova nella parte centrale dell’Australia, in pieno territorio desertico.

b)     Fa parte di un parco naturale ed è un’importante testimonianza della cultura aborigena, dato che era considerato dagli aborigeni una montagna sacra. E’ una grossa formazione rocciosa che si eleva per circa 200 metri su un terreno completamente spianato e desertico. Al parco è annesso un museo della cultura aborigena.

c)     E’ una visita consigliata a turisti giovani interessati alla cultura locale e in cerca di un tipo di vacanza alternativa (83 parole)

        Terza località: Canberra

a)     E’ la capitale dell’Australia e si trova nel sud-est del paese, sulla costa  dell’ Oceano Pacifico

b)     Questa piccola città, tranquilla e ricca di spazi verdi, fu scelta come capitale in alternativa alle due più popolose città, Sydney e Melbourne. E’ la sede degli uffici governativi, del parlamento e delle ambasciate.

c)     La visita alla città è consigliata a persone di tutte le età interessate alla conoscenza della realtà australiana oppure a turisti di media età che soggiornino nella città per motivi di affari.(85 parole)

Inglese

Quesito 2

Australia boasts a wide variety of tourist attractions. From a natural point of view visitors can admire the longest Coral Reef in the world or Ayers Rock, the largest monolith in the desert heart of Australia. Cities are also favourite destinations. Thousands of holiday makers go to Sydney every year to admire the famous Opera House and Harbour Bridge.(59 parole)

Prove strutturate

Limiti

§       Non sono adatte a verificare livelli alti e complessi di apprendimento

§       Le risposte giuste potrebbero essere dovute al fattore caso

§       I tempi necessari per la costruzione sono lunghi rispetto alle prove tradizionali.

Vantaggi

§       La correzione è semplice e veloce.

§       La misurazione è oggettiva.

§       L'ambiguità interpretativa risulta controllata.

§       Non presentano il rischio dell'effetto  alone, contrasto e stereotipia ( ricordati al punto "prove non strutturate")

§       Lo studente è facilitato nell'autovalutazione.

§       Non comportano situazioni di sfiducia da parte degli studenti.  

L'oggettività consiste nella possibilità di predeterminare l’esattezza delle risposte e nell' attribuzione del punteggio uguale da parte di tutti gli insegnanti. Rimane comunque un dato di soggettività, che sta nelle decisioni relative alla scelta e alla costruzione della prova. Per diminuire tali rischi è opportuno lavorare in gruppo.

Maggiore è il numero di docenti che converge nelle stesse decisioni  minore sarà il livello di soggettività.

In conclusione

In conclusione possiamo dire che non ci sono prove di per sé buone e cattive. Le prove sono buone se sono adatte a verificare con buona approssimazione le finalità e gli  obiettivi posti.

E' in ogni caso bene che tutti noi  prendiamo  familiarità con i diversi strumenti di verifica e che  ne usiamo una  gamma abbastanza ampia, così da  aumentare il grado di attendibilità delle nostre valutazioni. 

Infine, chi di noi continua ad usare le prove tradizionali non strutturate, dovrebbe sempre cercare di definire con  precisione l'enunciazione (stimolo), come abbiamo  cercato di indicare.

 

MISURAZIONE E VALUTAZIONE

Misurare non è valutare

Una tappa determinante nel processo di valutazione è costituita dalla misurazione dei risultati.

Vi è una distinzione fondamentale tra valutazione e misurazione. La misurazione  si riferisce alla rilevazione dei vari livelli di  apprendimento, mentre la valutazione esprime il giudizio qualitativo rispetto ad una determinata misurazione effettuata. Per poter valutare è cioè necessario raccogliere una serie d'informazioni, di effettuare una serie di misurazioni, attraverso le quali giungere alla formulazione del giudizio qualitativo.

Misurazione nelle prove strutturate

Nelle prove strutturate l'attribuzione del punteggio è sicuramente la più oggettiva.

Tuttavia un limite all'oggettività  di queste misurazioni c'è, ed è quello della casualità, cui gli studenti possono ricorrere se non conoscono la risposta.

In altre parole il "caso" può favorire chi non sa quali "pesci pigliare". In effetti mentre chi non sa rispondere ad una domanda orale, manifesta subito i propri limiti rimanendo in silenzio, chi non sa rispondere ad un quesito strutturato ha sempre la possibilità  di segnare una delle possibili risposte e quindi di avvalersi del caso.

Una soluzione è quella di ponderare il punteggio attribuito in relazione alla probabilità di azzeccare la risposta affidandosi al caso. Ancora è possibile attribuire un punteggio negativo alle risposte sbagliate e non penalizzare le risposte non date, anche se secondo A. Quagliata e G. Moretti questa penalizzazione non produce gli effetti sperati.  Infine la casualità delle risposte  può essere ridotta aumentando il numero degli items proposti.

Misurazione nelle prove semistrutturate

L'esperienza personale ci dimostra che è possibile assegnare voti o giudizi differenti ad una medesima prova a seconda che si attribuisca maggiore o minore "peso" all'uno o all'altro degli aspetti che si intendono verificare.

 La prova o parte di prova che intenda, ad esempio, verificare capacità di sintesi o di valutazione avrà un peso sicuramente superiore a quella prova o parte di prova che abbia come scopo la verifica di  conoscenze settoriali.

Sappiamo anche che non abbiamo ancora standard di riferimento nazionali ma soltanto i nostri standard relativi, definiti in base alla media delle prestazioni ottenute in precedenza, e questo aumenta la soggettività.

Ora, pur entro i limiti della situazione data, per  misurare in modo abbastanza attendibile le prove a risposta aperta dovremmo innanzitutto stabilire i parametri di riferimento, ossia gli obiettivi che ci proponiamo di valutare, gli indicatori che intendiamo utilizzare per descrivere gli  aspetti del parametro sottoposti a verifica, le prestazioni, o abilità attese,  per ciascun livello della scala adottata (da 1a 5,  da 1a 10, da 1a 100 ecc..), il tutto, ovviamente, rapportato al grado e ordine di scuola e alla classe.

E' necessario innanzitutto prendere dimestichezza con il linguaggio usato. Come è possibile notare  nei vari manuali sulla valutazione, la lingua utilizzata nelle così dette griglie, è molto varia oltre che spesso "repellente" (nel senso etimologico di re-spingere). Per evitare inutili confusioni e complicazioni è opportuno che  fra colleghi ci si metta d'accordo sul linguaggio da usare, si decida di uniformarlo una volta per tutte, semplificandolo più che si può.

Alcuni esempi

PARAMETRI:  detti anche standard di riferimento, criteri, macro-obiettivi.

Esempio di parametro: padronanza linguistica

INDICATORI: detti anche descrittori

Esempi di indicatori relativi a "padronanza linguistica":

a)     repertorio comunicativo-espressivo

b)     repertorio lessicale,

c)     appropriatezza lessicale ,

d)     correttezza morfo-sintattica,

e)     ecc.

FASCE DI LIVELLO: bande di oscillazione dei punteggi

Esempio di alcune scale

SU 5 livelli

SU 10 livelli

SU 100 livelli

5

9-10

90-100

4

7-8

70-80

3

6

60

2

4-5

40-50

1

1-3

10-30

FASCE DI VALUTAZIONE

Esempio (su scala 1-5) 5-ottimo; 4-discreto/buono; 3-sufficiente; 2-insufficiente; 1-del tutto insufficiente

PRESTAZIONI:  dette anche abilità-obiettivo

Esempio di prestazione riferita al parametro padronanza linguistica, al livello 5 (valutazione ottimo), descritta  sulla base degli indicatori sopra definiti e riferita ad una classe finale di  liceo:

a)     padroneggia  un ampio repertorio linguistico che gli consente di formulare i  pensieri  in modo preciso ed efficace, di enfatizzare, differenziare e eliminare ambiguità

b)     possiede un ricco repertorio lessicale,

c)     usa un lessico appropriato all'argomento trattato

d)     dimostra controllo morfo-sintattico di una lingua complessa.

Alcune considerazioni finali

La scelta di parametri all'interno di una disciplina o area disciplinare può essere soggettiva e variare secondo l'importanza che assegniamo alle prestazioni attese. La variabilità dipende inoltre da molti altri fattori fra cui l'anno di frequenza, gli obiettivi prioritari del profilo professionale, il monte ore assegnato alla disciplina e così via.

Senza volere demonizzare la soggettività, è comunque auspicabile, in una fase di assenza di standards nazionali di contenuto e di prestazione, che nello stesso tipo di scuola, nelle stesse classi  (le prime, le seconde ecc…) e nelle stesse discipline ci si orienti verso parametri e indicatori uniformi e verso un'uniforme corrispondenza fra prestazioni attese  e livelli.



[1] R. Mager, L'analisi degli obiettivi, Giunti & Lisciani, Teramo, 1976.

[2] G. Moretti, A. Quagliata, Le prove oggettive di verifica degli apprendimenti,III Univers. Studi, MPI, Roma,1994

[3] G. Domenici, Manuale della valutazione scolastica, Laterza, Bari 1993

[4] G. Domenici, Manuale della valutazione scolastica, Laterza, Bari 1993.  Secondo Domenici le abilità del pensiero   divergente che presuppone la capacità di effettuare  trasformazioni ed adattamenti in contesti diversi.

[5] G. Domenici, G. Moretti,A. Quagliata, Le prove semistrutturate,Università degli studi, Roma,1995

[6]  Il modello di prova è stato elaborato, nel mesi di ottobre 1998 da docenti dell'Istruzione Professionale durante il corso di aggiornamento indetto dalla Direzione dell' Istruzione professionale di Grosseto con il coordinamrnto dell'Ispettrice M. Mencuccini,   sul  tema " la terza prova nel nuovo esame di stato".