Časopis Myslivost

Jak se psi učí aneb Ještě trochu teorie

Myslivost 1/2021, str. 104  Lucie Kolouchová
V minulých dílech kynologického seriálu jsme si řekli, jak vybrat správné plemeno a jak v něm pak probouzet vlohy, než začneme se samotným výcvikem. Nicméně je dobré zmínit (pravda, poněkud obšírněji) ještě jednu věc – a to je teorie učení, tedy zabrousit do oblasti etologie.
Abychom totiž mohli psa něco učit, je nutné pochopit, jakým způsobem vlastně uvažuje, co si z jaké situace odnese a proč. Co si náš pes myslí, když trhnete vodítkem nebo ho pochválíte za to, že si sednul? Proč nepřijde, když zavoláte? Základní odpověď zní – protože psi jsou jako všechna zvířata a jako my sami oportunisté – dělají to, co se jim vyplácí a co je pro ně nějakým způsobem výhodné. Jenže ne vždy tu výhodnost vnímáme my stejně jako pes.
Bez trochy vědy by to nebylo ono, a tak si něco řekneme o tom, jak se psi (zvířata obecně) učí. V první řadě tu máme klasické podmiňování, které proslavil I. P. Pavlov a jeho na zvoneček slinící psi. Jde totiž o učení pomocí asociací. Jednoduchý příklad: Slovo sedni je spárované s činností sednutí, tedy s tím, že psu původně někdo tlačil zadek k zemi a říkal sedni. Samotné slovo sedni pak psovi asociuje činnost a on ji automaticky provede. Klasické pavlovovské podmiňování je rozšířeně využíváno v tréninku zvířat, na druhé straně se asi od poloviny minulého století, kdy své studie publikovali odborníci jako Thorndike, Skinner anebo Bailey, mluví o podmiňování operantním. Oč jde a jak toho využít v práci se psem?
Operantní podmiňování je na rozdíl od učení asociacemi definováno jako učení důsledky. Cokoliv, co pes udělá, vyvolá nějakou reakci. Pokud je reakce pro psa příznivá, naučí se čin opakovat, aby dosáhl odměny, pochvaly anebo jiného příjemného prožitku (čímž může být leccos, co my lidé jako odměnu vůbec nevnímáme, třeba možnost skočit do vody, jít čmuchat anebo se válet v trávě). Pokud naopak aktivita přinese nepříjemný zážitek nebo na ni není žádná odezva (nulová reakce ze strany vůdce, tj. ignorace chování), toto chování časem samo vyhasne. Vědecky řečeno reakce, které zapříčiní příjemné následky a vedou k uspokojení, jsou posilovány a je velká pravděpodobnost, že se za podobné situace budou opakovat. Naopak reakce, které zapříčiní nepříjemné následky, jsou oslabovány a jejich pravděpodobnost opakování se snižuje.
Zvířata se tedy učí zkušeností – což je jasné. Jak toho využít? Tady přichází další termín, shaping – aneb tvarování požadovaného chování skrze drobné krůčky, které zajistí ony kýžené úspěchy. Tj. například u aportu nejdříve odměníme to, že pes uchopí aport, pak postupně procvičujeme držení, pak například chůzi s aportem v mordě, pak aport odhazujeme – až se nám poskládá cílené chování. Obecně u řetězení chování platí, že pokud některé z použitých kritérií ztěžujeme, u ostatních zase malinko povolíme – tedy například při přechodu ze zahrady do zapachovaného terénu anebo při přechodu z atrapy na zvěř nebudeme tolik tlačit na přesné předání, ale znovu chválíme/odměňujeme i méně zdařilé pokusy a teprve postupně vyžadujeme to, co pes již předvedl s kozlíkem či atrapou.
Operantní podmiňování používá čtyři klíčové pojmy (na základě jejich nepochopení je pak často označováno jako „pozitivka“ a neznalí jej zaměňují za pouhé ládování psa pamlsky). Termíny pozitivní nebo negativní se přitom používají čistě jako technické označení + nebo –. Pozitivní posílení znamená přidání něčeho, za co bude zvíře pracovat usilovněji (zvýší se frekvence tohoto chování). Pokud tedy byl pes odměněn za usednutí, bude si příště sedat s větší chutí. Pozitivní trest pak znamená přidání něčeho, co způsobí, že se tomu zvíře bude snažit vyhnout a chování se potlačí – tedy korekce vodítkem, použití proutku, elektrického obojku a podobně. Ano, i toto je součást operantního podmiňování – pouze je otázka, zda se pes lépe nenaučí pomocí posílení než trestu, ten tu ale je jako možnost okamžité korekce nežádoucího chování.
Negativní posilování je odstranění něčeho, čemu se snaží zvíře vyhnout, a chování se posílí (zvyšuje se frekvence tohoto chování). Například v parforsním výcviku často používaná metoda tahání za slecho, aby pes otevřel mordu a vzal aport. Když pes udělá kýžené – otevře mordu – cvičitel odstraní nepříjemný nátlak. Posledním pojmem je negativní trest, což je odstranění něčeho, oč se pes snaží – například pokud na vás pes skáče a vy se otočíte zády nebo odejdete, sebrali jste mu pozornost.
Další zajímavý termín z operantního podmiňování je princip vyhasínání, tedy slábnutí chování prostřednictvím absence jakéhokoliv druhu posilování – a to bez použití trestu. Pokud tedy pes například nemůže dosáhnout na pamlsek na lince, přestane to nakonec zkoušet. Vyhasínání se používá k odstranění nebo omezení toho nejvíce nežádoucího chování.
Principů operantního podmiňování, které jsme tu pouze lehce nakousli, využívá celá řada psích trenérů, a to již od druhé poloviny minulého století. Pomocí stejných principů cvičí své psy armáda či policie, jsou jimi připravováni psí sportovci, ale používají se například v tréninku v zoologických zahradách nebo oceanáriích, kdy je třeba naučit velké a potenciálně nebezpečné zvíře spolupracovat při manipulaci. Shapingem tvarované chování se používá například u slonů či primátů, kteří si pak dobrovolně nechají například odebrat krev nebo ošetřit kůži.
Jestli si říkáte, co s tím v myslivosti, zkuste si text přečíst znovu – teorie je zde opřena o praxi, tedy o léta zkoušené a ověřené. Často při výcviku používáme pozitivní trest nebo negativní posilování, v lecčems by se nám ale hodila lepší práce s pozitivním posílením a na ni navázaná metoda shapingu, tedy postupná a zvíře nefrustrující metoda tvarování požadovaného výsledku pomocí drobných kroků. Docílíme tak jednak více upevněného cviku, na který si zvíře „přišlo samo“ a proto si ho lépe pamatuje a rychleji a přesněji ho vykonává a za druhé také jiného vztahu se zvířetem, které není frustrováno tím, že nám nerozumí, vydáváme totiž přesně pochopitelné signály.
U aportu ji mnoho výcvikářů již používá i v myslivecké kynologii, dala by se ale použít i v jiných oblastech. Zvlášť v souvislosti s výcvikovou pomůckou zvanou klikr (clicker, anglicky vlastně cvakátko podobné dětské žabce). Pomocí toho přesněji než pochvalou zachytíme okamžik, kdy pes přesně dělá to, co chceme – a rozfázovaný nácvik požadované disciplíny tak bude ještě rychlejší, protože nám pes bude rozumět. O principu tréninku s klikrem se píše leckde, v podstatě jde o to, že psu vytvoříme spojení – zvuk klikru (cvak) rovná se dělám to dobře, dostanu odměnu – přesně ve zlomku vteřiny, kdy to opravdu dělal dobře, tj. dosednul a seděl, ne zrovna se zvedal zpět na nohy nebo se začal drbat. No a pak klikrem tak, jako když hrajeme hru přihořívá hoří, vedeme našeho svěřence k požadovanému chování. Známý německý výcvikář jezevčíků Stefan Fuß takto cvičí spolehlivé oznamovače nebo hlásiče při práci na pobarvené stopě – a má úspěchy i na nejvyšších typech zkoušek. Podobně funguje i platforma zvaná placeboard na upevnění pozice před vůdcem při aportu nebo u nohy při přiřazování se. Naučili jsme se pracovat s GPS a dalšími pomůckami, třeba by náš trénink pomohly zkvalitnit i další, jinde používané pomůcky.
Sportovní či služební kynologie se jiným metodám výcviku psů otevřely už před lety, v zahraničí metodiku operantního podmiňování používají již i ve výcviku loveckých psů, u nás se objevují první vlaštovky, které tuto metodiku aplikují na dílčí disciplíny – není samospásná a nefunguje vždy a na všechno, pomůže ale pochopit, jak pes myslí a jak se učí a využít toho tam, kde potřebujeme. Nebojme se proto inovací, zvlášť když už až tak nové nejsou – a zkusme si o nich přečíst něco víc anebo se podívat na pár videí, než tuto metodu zavrhneme jako pro nás nevhodnou.
 
Lucie KOLOUCHOVÁ
 

Zpracování dat...