Operant inlärning vs klickerträning vs ”traditionell” träning

En missuppfattning jag ibland lägger märker till är att det sätts likhetstecken mellan klassisk betingning och ”traditionell” träning, där ”traditionell” träning innebär träning med mer eller mindre obehag. Dessutom kallas klickerträning ibland för operant inlärning – vilket stämmer – MEN nästa all inlärning är operant! Jag tänkte därför reda ut begreppen lite grann eftersom klassisk inlärning och ”traditionell” träning inte alls är samma sak och operant inlärning kan man säga att nästan all hundträning bygger på.

Klassisk betingning (eller klassisk inlärning) handlar om känslor och reflexer, det vill säga beteenden som inte är viljestyrda. Det var det här Pavlov upptäckte och forskade på, därav att det även kallas Pavlovsk inlärning. Det kallas också associativ inlärning, det vill säga att två tidigare oberoende saker kopplas ihop med varandra. Det är alltså inte själva reflexen som är associationen eller inlärningen utan det är sammankopplingen mellan stimulit (i Pavlovs fall skramlet med matskålarna eller ringandet i klockan) och responsen (i Pavlovs fall salivutsöndringen hos hundarna). När ett obetingat stimuli (som alltså inledningsvis är neutralt för individen) kommer före en obetingad respons (det vill säga en reflex som kommer att utlösas) tillräckligt många gånger blir det obetingade stimulit ett betingat stimuli som då sätter igång den betingade responsen.

Vi har alla lärt oss en massa saker genom klassisk betingning. Om du till exempel tänker på en citron, hur du biter i den och hur sur den är, känner du då hur saliven börjar rinna till? För en person som inte vet vad en citron är skulle det inte hända. Samma sak om telefonen ringer så kan vi antingen bli glada (om det oftast är trevliga personer som ringer) eller ledsna (om det brukar komma tråkiga besked när telefonen ringer) bara av att höra ringsignalen.

Operant inlärning handlar om viljestyrda beteenden. Individen ”opererar” på sin omgivning och lär sig baserat på de konsekvenser som olika beteenden får. En konsekvens kan vara trevlig eller otrevlig för individen, men individen kan alltid välja att utföra beteendet (även om det kan bli väldigt otrevligt att inte göra det). Jämför det med reflexerna jag skrev om tidigare, vi kan aldrig välja att inte utföra en reflex.

Konsekvenserna delas in i positivt och negativt straff samt positiv och negativ förstärkning. Positivt innebär att något läggs till och negativt innebär att något tas bort. Ett straff gör att beteendet minskar och en förstärkning gör att beteendet ökar. Kombinerat med var och en av de fyra konsekvenserna finns dock alltid känslor, som ju hamnar under den klassiska inlärningen. Vi kan därmed aldrig skilja dem helt åt, men vi kan välja vilka känslor vi vill jobba med.

Positiv förstärkning innebär alltså att vi lägger till något som får beteendet att öka, till exempel belönar hunden med en godis då den sätter sig. Känslan förknippat med det är glädje över belöningen. När det gäller människor är tänket ”Gör så här så får du…”
Negativt straff innebär att vi tar bort något som gör att beteendet minskar, till exempel vänder oss bort när hunden hoppar på oss (chansen till belöning försvinner). Känslan förknippat med det är frustration och lite besvikelse över att belöningen försvinner.
Positivt straff innebär att något som får beteendet att minska läggs till, till exempel ett koppelryck då hunden drar i kopplet. Känslan förknippat med det är rädsla för obehaget (eller den som utdelade det).
Negativ förstärkning innebär att något som får beteendet att öka tas bort. Det finns två typer av negativ förstärkning, dels att ett obehag upphör (t ex tvångsapportering där dressören vrider om hundens öra och när hunden griper apportbocken släpper dressören örat) och dels att ett obehag undviks (t ex om hunden lärt sig att om den hoppar upp på bordet så blir husse eller matte väldigt otrevlig, när den då går ner från bordet bara husse eller matte tittar på den har den undvikit obehaget). Känslan förknippat med det är lättnad över att obehaget försvann. När det gäller människor är tänket ”Gör så här, annars…”

I princip all hundträning är därför operant, men använder olika konsekvenser.

”Traditionell” träning fokuserar på positivt straff (straffa fel beteende) och negativ förstärkning (ta bort obehag när hunden gör rätt), med vissa inslag av positiv förstärkning (belöna rätt beteende) (och ibland en viss övertro till flockdynamik och ledarskap som krävs, inte förtjänas, vilket även det handlar om positivt straff/negativ förstärkning – följ mig, annars…).
Klickerträning fokuserar på att använda positiv förstärkning (belöna rätt beteende), men även negativt straff (se till att hunden inte får belöning).

På skalan finns sedan mängd andra träningsmetoder som kombinerar dessa konsekvenser på olika sätt. Det man inte får glömma bort är att alla konsekvenserna fungerar, bara man har två motpoler att jobba med (få belöning/inte få belöning, få straff/inte få straff osv). Vilken man än använder så är tajmingen otroligt viktig för vad individen verkligen lär sig. Kommer straffet eller belöningen för sent har hunden redan gått vidare och gjort andra saker, och då kanske något bra blir straffat eller något dåligt blir belönat. För mig som klickertränar handlar det också om ett etiskt ställningstagande – jag vill att träningen ska vara rolig för både mig och min hund och det blir den inte om jag går runt och straffar hunden fysiskt eller verbalt på ett sätt som den uppfattar som obehagligt. Dessutom, om man nu kan träna vilda delfiner att leta minor och få tinad fryst fisk som belöning, varför skulle det då vara omöjligt att träna hund utan att korrigera den fysiskt eller verbalt på ett sätt som den uppfattar som obehagligt?

Här kan du läsa mer om operant inlärning och klassisk betingning