Il condizionamento operante • La “gabbia di Skinner” (Skinner box): gabbia con una leva che consente di accedere al cibo o all’acqua. • La gabbia ha un pavimento elettrificabile (per eventuale somministrazione di stimoli avversativi), e un dispositivo per la registrazione automatica delle risposte. Skinner box © Marina Cosenza Gli esperimenti di Skinner • Soggetti: ratti o piccioni. • All’interno della gabbia venivano create le condizioni affinché l’animale premesse la leva. • Gli animali premevano accidentalmente una leva e ottenevano cibo o acqua. • L’animale affamato o assetato tendeva a ripetere l’operazione (risposta operante) se essa produceva un effetto positivo (cibo = rinforzo). Variabili in gioco • Nel condizionamento operante: L’acquisizione dell’apprendimento avviene se il nuovo comportamento è seguito da un rinforzo. Una risposta non rinforzata tende a diminuire. • L’estinzione della risposta dovrebbe avvenire a seguito di ripetuta assenza di rinforzo. Nel condizionamento operante … • Generalizzazione: il rinforzo dato ad un certo comportamento avrà effetto anche per comportamenti simili. • Discriminazione: i soggetti vengono condizionati e solo la risposta desiderata viene rinforzata. Il concetto di rinforzo • Rinforzo = effetto che segue un certo comportamento e determina la probabilità che quel comportamento venga emesso. Nel condizionamento operante il rinforzo è condizione necessaria e sufficiente per l’apprendimento. • I rinforzi si distinguono in positivi e negativi (valenza del rinforzo). • I rinforzi agiscono su bisogni di varia natura. Pertanto si distinguono in primari e secondari. • La modalità di somministrazione dei rinforzi può variare: i rinforzi possono essere continui o intermittenti (parziali). Valenza del rinforzo • I rinforzi positivi producono un effetto piacevole e agiscono da ricompensa. Essi aumentano la probabilità che un comportamento si manifesti. • I rinforzi negativi aumentano la probabilità di apprendimento di comportamenti che eliminano attivamente una fonte di sofferenza (premere una leva nella gabbia di Skinner per evitare scosse elettriche), oppure consentono di eliminare uno stimolo sgradevole e penoso tramite comportamenti di evitamento e fuga. Evitamento e fuga Luce Scossa elettrica. Il ratto impara a rifugiarsi nella zona non elettrificata appena viene presentato lo stimolo luminoso. Soddisfazione di bisogni • Rinforzi primari e secondari: relativi a bisogni primari o secondari. Modalità di somministrazione • Rinforzi continui (dati a seguito di ogni risposta desiderata) e rinforzi parziali (intermittenti, saltuari) • Efficacia del rinforzo intermittente, basato sul tempo (intervallo fisso o variabile) o sul numero delle risposte (a rapporto fisso o variabile) Schema di rinforzo a intervallo fisso Rinforzo Pausa Rinforzo Pausa Rinforzo Pausa Rinforzo • La risposta viene rinforzata dopo un tempo prefissato che viene mantenuto costante (rinforzo ogni X secondi, indipendentemente dall’attività del soggetto). • L’animale calibra le sue azioni sui tempi del rinforzo. Schema a intervallo variabile • La risposta viene rinforzata lo stesso numero di volte ma a intervalli irregolari. Il soggetto non può fare “previsioni”. • L’apprendimento è più rapido e procede per progressione costante. • Il soggetto lavorerà di più e apprenderà di più. Schema a rapporto fisso • Il rinforzo viene dato dopo un numero prefissato di risposte. • Il ratto di Skinner può essere rinforzato dopo 5 o 10 pressioni della leva. • Il soggetto lavora intensamente (come nel lavoro a cottimo) e può programmare dei periodi di riposo. Schema a rapporto variabile • Il rinforzo viene dato dopo un numero di risposte variabile. • Il soggetto non può fare previsioni. • La risposta viene emessa continuativamente e i tempi di riposo si riducono (gioco d’azzardo). • Per Skinner lo schema a rapporto variabile è il più efficace. La punizione • Punizione Rinforzo. • La punizione riduce la probabilità che un comportamento venga prodotto. La punizione inibisce temporaneamente il comportamento, ma non lo estingue. • La punizione è meno efficace del rinforzo. E’ preferibile utilizzare il rinforzo positivo (premiare) piuttosto che punire. Quando la punizione serve • Comportamento 1 (socialmente non desiderato) • Comportamento 2 (socialmente desiderato) • Ipotesi 1: Il soggetto conosce il comportamento 2 e non lo assume. La punizione è inevitabile. • Ipotesi 2: Il soggetto non conosce il comportamento 2. Si insegna il comportamento 2 e si rinforza il soggetto quando lo assume. Il rinforzo positivo funziona meglio. L’impotenza appresa • Seligman (1976). • L’esperimento: due gruppi di cani ai quali venivano somministrate scosse elettriche. Il primo gruppo (gruppo di scampo) poteva premere una leva e interrompere il flusso elettrico. Il secondo gruppo non aveva questa possibilità. • In sessioni successive i cani di questo gruppo non erano in grado di apprendere comportamenti di fuga e restavano immobili. Variabili nel condizionamento operante • Forza e salienza dei rinforzi o delle punizioni • Intervallo di tempo tra comportamento e rinforzo • Frequenza della conseguenze (tipo di schema di rinforzo) • Il modellamento (shaping) • Rinforzare ogni risposta che si avvicina alla risposta desiderata • Studi sull’uomo • Le macchine per insegnare. • Il principio di Premack, ovvero: premiare a condizione che ... “Un’attività piacevole può agire come rinforzo per un’attività spiacevole”. Il comportamentismo intenzionale di Tolman • Si possono postulare costrutti mentali per spiegare taluni comportamenti? • I teorici S-O-R (Stimolo, Organismo, Risposta) ritengono che ci sia una mediazione mentale tra stimolo e risposta. La teoria di Tolman (1886-1959) • Comportamento = azione o serie di azioni finalizzate ad uno scopo (comportamento intenzionale) • Variabili interferenti (Costrutti ipotetici: caratteristiche dei soggetti, natura e intensità dei bisogni da soddisfare). • Il concetto di mappa cognitiva = la rappresentazione mentale della meta e dello spazio che porta alla meta. La meta sarà raggiunta secondo il percorso più semplice e meno dispendioso (principio del minimo sforzo). Esperimento di Tolman e Honzik • Exp. di Tolman e Honzik (1930a) I ratti agivano sulla base di una rappresentazione dello spazio del labirinto, una mappa cognitiva che veniva “consultata” e favoriva un comportamento parsimonioso Studi recenti sulle mappe cognitive • Uso di un labirinto con piattaforma centrale e otto bracci uguali. • Alla fine di ogni braccio è posto del cibo. • Dopo 20 prove i ratti non tornano più in bracci che hanno già visitato (Olton, 1978; 1979). L’apprendimento latente • Si apprende anche senza rinforzi per fare fronte ad una situazione problematica, ma il comportamento non viene esibito se non si individua uno scopo da realizzare. • Exp. di Tolman e Honzik (1930b) • Tre condizioni sperimentali e tre gruppi di ratti. Tutti i ratti vengono posti una volta al giorno nel labirinto. © Marina Cosenza • Gruppo 1: Nessun rinforzo all’uscita - Risultato: debole riduzione degli errori nel tempo. • Gruppo 2: Rinforzo all’uscita - Risultato: rapida riduzione degli errori nel tempo. • Gruppo 3: Per 10 giorni nessun rinforzo. All’undicesimo giorno rinforzo all’uscita. I soggetti commettevano molti errori per 10 giorni, ma si registrava una drastica riduzione degli errori dopo l’undicesimo giorno. Per i primi 10 giorni il loro comportamento era analogo a quello dei soggetti del gruppo 1, successivamente diventava simile a quello dei soggetti del gruppo 2. Uno sguardo ai risultati Interpretazione dei risultati • La mappa spaziale costruita vagando per il labirinto è stata utilizzata quando si è profilato uno scopo da realizzare. • Il rinforzo è utile perché si manifesti un comportamento e non perché lo si apprenda. • La conoscenza appresa può rimanere latente in mancanza di motivazione specifica. L’apprendimento osservativo • Il contributo dei teorici dell’apprendimento sociale: Bandura • Si apprende anche osservando un modello e cercando di imitarlo. • L’apprendimento imitativo perché sia efficace richiede che siano attivi alcuni processi cognitivi: a) che si presti attenzione al modello b) che ci si rappresenti in memoria la sequenza di azioni che il modello compie c) che si sia in grado di riprodurre la sequenza a livello motorio (riproduzione motoria) d) che vi sia una certa autoconsapevolezza Il ruolo dei rinforzi il rinforzo è necessario per l’esecuzione della risposta più che per l’apprendimento. Il rinforzo crea motivazione. Se il modello riceve rinforzi positivi questi avranno un effetto sull’apprendimento dell’osservatore che vorrà compiere la stessa azione per essere ricompensato. I rinforzi diretti possono consolidare la risposta. La teoria dell’apprendimento osservativo coniuga le istanze del comportamentismo con le posizioni della psicologia cognitivista. L’apprendimento nella teoria della Gestalt • L’apprendimento come soluzione dei problemi: analisi della situazione presente (secondo le leggi dell’organizzazione percettiva) e uso dell’esperienza passata per la risoluzione del problema. • Gli esperimenti di Köhler (18871967) sulle scimmie antropoidi (1913-1917 a Tenerife) L’apprendimento per insight • Per Köhler i tentativi degli animali non erano casuali ma intelligenti (l’animale valutava la situazione, formulava una ipotesi di soluzione del problema e poi verificava la soluzione). • La ristrutturazione cognitiva avveniva all’improvviso per intuizione. Dopo la prima intuizione gli scimpanzé erano in grado di ripetere l’azione (apprendimento per insight). Una sintesi