Il condizionamento operante
• La “gabbia di Skinner” (Skinner box):
gabbia con una leva che consente di
accedere al cibo o all’acqua.
• La gabbia ha un pavimento elettrificabile
(per eventuale somministrazione di stimoli
avversativi), e un dispositivo per la
registrazione automatica delle risposte.
Skinner box
© Marina Cosenza
Gli esperimenti di Skinner
• Soggetti: ratti o piccioni.
• All’interno della gabbia venivano create le
condizioni affinché l’animale premesse la
leva.
• Gli animali premevano accidentalmente
una leva e ottenevano cibo o acqua.
• L’animale affamato o assetato tendeva a
ripetere l’operazione (risposta operante)
se essa produceva un effetto positivo
(cibo = rinforzo).
Variabili in gioco
• Nel condizionamento operante:
L’acquisizione dell’apprendimento avviene
se il nuovo comportamento è seguito da
un rinforzo. Una risposta non rinforzata
tende a diminuire.
• L’estinzione della risposta dovrebbe
avvenire a seguito di ripetuta assenza di
rinforzo.
Nel condizionamento operante …
• Generalizzazione: il rinforzo dato ad un
certo comportamento avrà effetto anche
per comportamenti simili.
• Discriminazione: i soggetti vengono
condizionati e solo la risposta
desiderata viene rinforzata.
Il concetto di rinforzo
• Rinforzo = effetto che segue un certo
comportamento e determina la probabilità che
quel comportamento venga emesso. Nel
condizionamento operante il rinforzo è
condizione necessaria e sufficiente per
l’apprendimento.
• I rinforzi si distinguono in positivi e negativi
(valenza del rinforzo).
• I rinforzi agiscono su bisogni di varia natura.
Pertanto si distinguono in primari e secondari.
• La modalità di somministrazione dei rinforzi
può variare: i rinforzi possono essere continui o
intermittenti (parziali).
Valenza del rinforzo
• I rinforzi positivi producono un effetto
piacevole e agiscono da ricompensa. Essi
aumentano la probabilità che un comportamento
si manifesti.
• I rinforzi negativi aumentano la probabilità di
apprendimento di comportamenti che eliminano
attivamente una fonte di sofferenza (premere
una leva nella gabbia di Skinner per evitare
scosse elettriche), oppure consentono di
eliminare uno stimolo sgradevole e penoso
tramite comportamenti di evitamento e fuga.
Evitamento e fuga
Luce  Scossa
elettrica.
Il ratto impara a
rifugiarsi nella
zona non
elettrificata
appena viene
presentato lo
stimolo luminoso.
Soddisfazione di bisogni
• Rinforzi primari e secondari: relativi a
bisogni primari o secondari.
Modalità di somministrazione
• Rinforzi continui (dati a seguito di ogni
risposta desiderata) e rinforzi parziali
(intermittenti, saltuari)
• Efficacia del rinforzo intermittente, basato
sul tempo (intervallo fisso o variabile) o sul
numero delle risposte (a rapporto fisso o
variabile)
Schema di rinforzo a intervallo fisso
Rinforzo
Pausa
Rinforzo
Pausa
Rinforzo
Pausa
Rinforzo
• La risposta viene rinforzata dopo un tempo
prefissato che viene mantenuto costante
(rinforzo ogni X secondi,
indipendentemente dall’attività del
soggetto).
• L’animale calibra le sue azioni sui tempi
del rinforzo.
Schema a intervallo variabile
• La risposta viene rinforzata lo stesso
numero di volte ma a intervalli irregolari.
Il soggetto non può fare “previsioni”.
• L’apprendimento è più rapido e procede
per progressione costante.
• Il soggetto lavorerà di più e apprenderà di
più.
Schema a rapporto fisso
• Il rinforzo viene dato dopo un numero
prefissato di risposte.
• Il ratto di Skinner può essere rinforzato
dopo 5 o 10 pressioni della leva.
• Il soggetto lavora intensamente (come nel
lavoro a cottimo) e può programmare dei
periodi di riposo.
Schema a rapporto variabile
• Il rinforzo viene dato dopo un numero di
risposte variabile.
• Il soggetto non può fare previsioni.
• La risposta viene emessa
continuativamente e i tempi di riposo si
riducono (gioco d’azzardo).
• Per Skinner lo schema a rapporto variabile
è il più efficace.
La punizione
• Punizione
Rinforzo.
• La punizione riduce la probabilità che un
comportamento venga prodotto. La
punizione inibisce temporaneamente il
comportamento, ma non lo estingue.
• La punizione è meno efficace del rinforzo.
E’ preferibile utilizzare il rinforzo positivo
(premiare) piuttosto che punire.
Quando la punizione serve
• Comportamento 1 (socialmente non
desiderato)
• Comportamento 2 (socialmente desiderato)
• Ipotesi 1: Il soggetto conosce il
comportamento 2 e non lo assume. La
punizione è inevitabile.
• Ipotesi 2: Il soggetto non conosce il
comportamento 2. Si insegna il comportamento
2 e si rinforza il soggetto quando lo assume. Il
rinforzo positivo funziona meglio.
L’impotenza appresa
• Seligman (1976).
• L’esperimento: due gruppi di cani ai quali
venivano somministrate scosse elettriche. Il
primo gruppo (gruppo di scampo) poteva
premere una leva e interrompere il flusso
elettrico. Il secondo gruppo non aveva questa
possibilità.
• In sessioni successive i cani di questo gruppo
non erano in grado di apprendere
comportamenti di fuga e restavano immobili.
Variabili nel condizionamento
operante
• Forza e salienza dei rinforzi o delle
punizioni
• Intervallo di tempo tra comportamento e
rinforzo
• Frequenza della conseguenze (tipo di
schema di rinforzo)
• Il modellamento (shaping)
• Rinforzare ogni risposta che si avvicina
alla risposta desiderata
• Studi sull’uomo
• Le macchine per insegnare.
• Il principio di Premack, ovvero: premiare
a condizione che ...
“Un’attività piacevole può agire come
rinforzo per un’attività spiacevole”.
Il comportamentismo intenzionale di
Tolman
• Si possono postulare costrutti
mentali per spiegare taluni
comportamenti?
• I teorici S-O-R (Stimolo,
Organismo, Risposta)
ritengono che ci sia una
mediazione mentale tra
stimolo e risposta.
La teoria di Tolman (1886-1959)
• Comportamento = azione o serie di azioni
finalizzate ad uno scopo (comportamento
intenzionale)
• Variabili interferenti (Costrutti ipotetici:
caratteristiche dei soggetti, natura e intensità dei
bisogni da soddisfare).
• Il concetto di mappa cognitiva = la
rappresentazione mentale della meta e dello
spazio che porta alla meta. La meta sarà
raggiunta secondo il percorso più semplice e
meno dispendioso (principio del minimo
sforzo).
Esperimento di Tolman e Honzik
• Exp. di Tolman e
Honzik (1930a) I ratti
agivano sulla base di
una rappresentazione
dello spazio del labirinto,
una mappa cognitiva
che veniva “consultata”
e favoriva un
comportamento
parsimonioso
Studi recenti sulle mappe cognitive
• Uso di un labirinto con
piattaforma centrale e otto
bracci uguali.
• Alla fine di ogni braccio è
posto del cibo.
• Dopo 20 prove i ratti non
tornano più in bracci che
hanno già visitato (Olton,
1978; 1979).
L’apprendimento latente
• Si apprende anche senza
rinforzi per fare fronte ad una
situazione problematica, ma il
comportamento non viene esibito
se non si individua uno scopo da
realizzare.
• Exp. di Tolman e Honzik
(1930b)
• Tre condizioni sperimentali e tre
gruppi di ratti. Tutti i ratti vengono
posti una volta al giorno nel
labirinto.
© Marina Cosenza
• Gruppo 1: Nessun rinforzo all’uscita - Risultato:
debole riduzione degli errori nel tempo.
• Gruppo 2: Rinforzo all’uscita - Risultato: rapida
riduzione degli errori nel tempo.
• Gruppo 3: Per 10 giorni nessun rinforzo.
All’undicesimo giorno rinforzo all’uscita. I
soggetti commettevano molti errori per 10 giorni,
ma si registrava una drastica riduzione degli
errori dopo l’undicesimo giorno. Per i primi 10
giorni il loro comportamento era analogo a
quello dei soggetti del gruppo 1,
successivamente diventava simile a quello dei
soggetti del gruppo 2.
Uno sguardo ai risultati
Interpretazione dei risultati
• La mappa spaziale costruita vagando per
il labirinto è stata utilizzata quando si è
profilato uno scopo da realizzare.
• Il rinforzo è utile perché si manifesti un
comportamento e non perché lo si
apprenda.
• La conoscenza appresa può rimanere
latente in mancanza di motivazione
specifica.
L’apprendimento osservativo
• Il contributo dei teorici dell’apprendimento
sociale: Bandura
• Si apprende anche osservando un modello e
cercando di imitarlo.
• L’apprendimento imitativo perché sia
efficace richiede che siano attivi alcuni
processi cognitivi:
a) che si presti attenzione al modello
b) che ci si rappresenti in memoria la sequenza
di azioni che il modello compie
c) che si sia in grado di riprodurre la sequenza a
livello motorio (riproduzione motoria)
d) che vi sia una certa autoconsapevolezza
Il ruolo dei rinforzi
il rinforzo è necessario per l’esecuzione
della risposta più che per l’apprendimento.
Il rinforzo crea motivazione.
Se il modello riceve rinforzi positivi questi
avranno un effetto sull’apprendimento
dell’osservatore che vorrà compiere la
stessa azione per essere ricompensato.
I rinforzi diretti possono consolidare la
risposta.
La teoria dell’apprendimento osservativo
coniuga le istanze del comportamentismo
con le posizioni della psicologia
cognitivista.
L’apprendimento nella teoria della
Gestalt
• L’apprendimento come soluzione dei
problemi: analisi della situazione
presente (secondo le leggi
dell’organizzazione percettiva) e uso
dell’esperienza passata per la
risoluzione del problema.
• Gli esperimenti di Köhler (18871967) sulle scimmie antropoidi
(1913-1917 a Tenerife)
L’apprendimento per insight
• Per Köhler i tentativi degli animali non
erano casuali ma intelligenti (l’animale
valutava la situazione, formulava una
ipotesi di soluzione del problema e poi
verificava la soluzione).
• La ristrutturazione cognitiva avveniva
all’improvviso per intuizione. Dopo la
prima intuizione gli scimpanzé erano in
grado di ripetere l’azione (apprendimento
per insight).
Una sintesi
Scarica

apprendimento condizionamento