štvrtok, februára 21

Mini návod ako na to


Učenie koní a princípy operatívneho podmieňovania


Učenie koní - a tzv. teória učenia tu bola rozoberaná už viackrát. Mojím úmyslom je ale nestratiť sa v tom, aké rôzne učenia existujú a prebiehajú, ale rozpitvať ten najefektívnejší. Konkrétne veľmi praktický, ktorým koňa naučíme čokoľvek, čo nás napadne -  zodvihnúť spadnutý bičík zo zeme, lonžovať sa vo voľnosti či pozerať sa na vedro plné ovsa priamo pred nosom.

Ktokoľvek- či je to Záliš alebo Pignon - obaja využívajú princípy operatívneho podmieňovania (=OP), chtiac - nechtiac, tušiac - netušiac. Neľakajte sa prosím tohto termínu a nedovoľte, aby trošku neznáme slovo zamedzilo ďalšiemu čítaniu. Sľubujem, že to bude rýdzo použiteľné a praktické.

Čosi z histórie alebo ako sa patrí na úvod


Otcom operatívneho podmieňovania je F.B.Skinner - psychológ a behaviorista. Ako si Newton uvedomil gravitáciu, Archimedes hydrostaticku vztlakovú silu, tak Skinnerovi dopla jedna dôležitá súvislosť. A to súvislosť medzi správaním a tým, čo prichádza po ňom - dôsledkom. Výsledkom nie je žiaden zákon nesúci prívlastok Skinnerov, ale princípy učenia, ktoré na nás vplývajú dennodenne vo všetkých sférach života bez toho, že by sme si toho boli vedomí. Každý z nás aplikuje princípy OP a každý z nás im podlieha. A spomínané dôsledky správania spôsobujú, či sa bude naše správanie opakovať, alebo práve naopak, či vymizne z nášho repertoáru.

Hovoríme o učení, ale čo to presne je? Učenie je zmena správania - reakciu na nejaký podnet. Základná schéma je :
podnet - reakcia - dôsledok 

Práve dôsledok má za následok to, akým smerom sa naše učenie bude vyvíjať. 
Ak bežnou reakciou môjho koňa pri pohľade na človeka nesúceho vedro ovsa je, že sa na neho vyrúti, prevalcuje ho, udupe a vrhne hlavu do vedra, tak toto jeho správanie môžem zmeniť len a len dvomi spôsobmi.

1) dôsledkom je niečo príjemné, niečo, čo má kôň rád (žrádlo, poškabkanie)
2) dôsledkom je ukončenie niečoho, čomu sa chce kôň vyhnúť (tlak)

Negatívne a pozitívne posilňovanie - dva z piatich prvkov OP, ktoré majú za následok zvýšenie opakovania správania. Sú to naše reakcie na správanie koňa v procese učenia.

Zabudnime na naše konotácie negatívneho a pozitívneho ako niečoho zlého a dobrého, čierneho a bieleho. Keďže kolískou OP je veda, sú to z vedy prameniace termíny bez akéhokoľvek emočného či morálne podtónu.

Pozitívny v zmysle znamienka plus - niečo, čo dám zvieraťu a čo posilní jeho správanie - odpoveď na moju reakciu sa bude sa vďaka tomu v budúcnosti opakovať častejšie. Označuje sa i skratkou R+ ( prevzaté z angličtiny positive reinforcement).

Negatívny v zmysle znamienka mínus - odstránanie, odobratie niečoho nepríjemného, čomu sa zviera chce vyhnúť a má za následok to isté ako v prvom prípade - zvýšenie frekvencie správania. Označuje sa v skratke ako R-.

Okrem posilňovania sú súčasťou OP i tresty. Pozitívny trest P+ a negatívny trest P- .

Pozitívny trest P+ dodám, v tomto prípade skôr spravíme zvieraťu niečo, čo sa mu nepáči, čo mu je nepríjemné a čo má v budúcnosti za následok, že dané správanie sa bude opakovať menej a menej.

Negatívny trest P- odoberiem z prostredia - vezmem zvieraťu niečo, čo má rado a čo vyhľadáva. Opäť to bude mať za následok oslabenie správania, ktoré sa bude vyskytovať menej.

Posledným spôsobom je zánik ( z anglického extinction). Je to veľmi jednoduchý a efektívny spôsob, i keď bežným koniarom veľmi ťažko akceptovateľný. Jeho princípom je, že správanie zoslebené až úplne zanikne práve vďaka tomu, že naň nie je žiadna odozva. Absentuje akýkoľvek R či P. Jednoducho povedané, správanie je ignorované.

Dôležitá vec

Vráťme sa k nášmu "nevychovanému" koňovi, ktorý zbadajúc vedro s ovsom zabúda na všetky svoje dobré vlastnosti. Využijeme tento príklad na dokreslenie ďalšieho dôležitého bodu spojeného s OP a tým sú tri časti, na ktoré je učenie rozdelené:


- stimulus - signál - podnet, ktorý vyprovokuje správanie ( v prípade nášho koňa po ovse bažiaceho je signálom, ktorý vyprovokuje jeho nenažrané správanie vedro).

- samotné správanie, ktoré zviera spraví (vrhne sa na vedro cez ľudské i iné mŕtvoly)

- dôsledky, ktoré prichádzajú po správaní (to sú presne tie erká a péčka)



 Aké sú podľa hore uvedenej teórie možnosti ho tento neduh odnaučiť, resp. preučiť? Kľúčovým bodom sú tu práve tie dôsledky - spomínané posilňovania a trestania. Ako v praxi?

V prvom rade si musíme definovať čo CHCEME aby kôň robil. Je ťažké učiť veci, ktoré nechceme aby robil. V tomto prípade chceme, aby kôň pekne slušne usporiadane a pokojne stál, keď mu nesieme žrádlo. A tu sú možnosti:

R+ - dáme koňovi žrádlo len vtedy, keď pekne slušne usporiadane a pokojne stojí
R- - budeme ho odháňať od vedra dovtedy, kým neostane pekne slušne usporiadane a pokojne stáť

P+ - vezmeme bič a nacápeme mu jednu na prdel za to, že sa vrhá na naše vedro
P- - keď nestojí pekne a usporiadane, tak vedro zoberiem preč z jeho dosahu

Prosím, berte toto ako všeobecný veľmi veľmi zjednodušený príklad. Samozrejme, keby som chcela rozpitvať danú situáciu úplne do hĺbky, potrebovala by som k tomu konkrétneho koňa, jeho konkrétne správanie a konkrétne vedro a ešte konkrétneho človeka, ktorý by ho chcel naučiť pekne usporiadane slušne a pokojne stáť pri pohľade na vedro žranice. Avšak vždy platí, že toto sú naše možnosti, s ktorými môžeme pracovať.

Možno na záver je ešte zaujímavejšie sa pozrieť na to, ako sa to tento kôň naučil správať sa okolo žrania takto nevychovane? Naučil sa to práve cez použitie R+ . Človek prichádzal s vedrom, kôň k nemu prišiel, ešte nepoznajúc, že čo sa vo vedre nachádza - vedro nebol pre neho žiaden signál, nemal skúsenosť, že čo vedro znamená. Kôň prišiel, natiahol krk smerom k vedru - človek mu ho nechal.

Druhý krát kôň prišiel rýchlejšie, nielenže natiahol krk ale i hlavu strčil do vedra a človek mu to vedro zase nechal.

Tretí krát sa dorútil, človek v panike hodil vedro na zem a utekal kadeľahšie.

To všetko znamená jedno:  kôň spravil nejaké správanie - išiel smerom k človeku, načahoval sa za vedrom - a výsledkom tohto správania bolo, že dostal odmenu - to čo má rád. Tento dôsledok tohto jeho správania zapríčinil, že sa dané správanie opakovalo a zosilňovalo. Síce to pochádza z vedy, ale žiadna veda to nie je. Jednoduché ako facka.

Preto Rashidove známe je priam zlatým pravidlom:

Každý moment, ktorý tráviš so svojím koňom, učíš ho byť lepším alebo horším.
(Every time you are with your horse, you are teaching him for better or worse).

Takýmto spôsobom sa mnoho koní naučí byť agresívnych či nepríjemných. Dobrá správa je, že všetko sa dá naučiť resp. odnaučiť. Agresívneho koňa s ušami prilepenými k hlave môžeme naučiť byť pohoďákom, čo má uši stojace ako radary. Koňa vyhýbajúceho sa kontaktu s ľuďmi môžeme naučiť milovať ľudské dotyky.

 O tom, ako funguje OP v tréningovej praxi,  si povieme nabudúce. Povieme si aj, ktoré z týchto princípov OP sú efektívne a ktoré narúšajú dôveru v učiteľa - človeka či ktoré môžu byť nebezpečné a prečo. Ktoré je dobré využívať a ktorým sa radšej vyhýbať. Pretože, skrz poznanie OP môžem koňa, ktorý sa vrhá na vedro a jeho nositeľa človeka naučiť, aby pri stretnutí s človekom a jeho vedrom začal namiesto pohybu vpred vykonávať pohyb vzad či pravobok. Ako na to sa dozviete v ďalších článkoch.