2018年06月18日 16:07
報酬を使いこなす
報酬ベースのトレーニングでは、できたら報酬/強化子、を繰り返して、動作を固定していきます。
報酬/強化子と書いたのですが、そう、報酬は、実は「その直前の行動の発生頻度を高める/強化する」働きを持つ「刺激」、強化子なのです。
だって、集中力は行動ではないし、意欲もまた然り。関わり合いたいと思う心/気持ちも、また、行動ではない。だから、強化子でその発生頻度を上げることができるものではないのです。
なので、エンゲイジメントは、報酬を与えているだけでは成り立たない、、、っというのは、また別のお話。
では、報酬/強化子がその威力を最大限に発揮できる分野、「行動の発生頻度を上げる」場面でも、なぜか、必ずしも、「行動の発生頻度を上げ」「行動として定着する」ことがうまくいかない場合がたくさんあるのは、なぜでしょう?
おそらく、多くの場合、報酬の使い方をハンドラーが理解していないことによると私は思います。
報酬は、やってほしい行動に対して出す。
報酬が出てくる位置は、その成功にとても大きく関わっている。
報酬が出てくる位置は、その成功にとても大きく関わっている。
そして、報酬ベースのトレーニングは、小さなかけらの寄せ集め、積み重ね。
この単純な原則を、人がなぜか理解しきれていない。
この単純な原則を、人がなぜか理解しきれていない。
簡単な例として;
「たって」
行進中の「たって」 を教えようとしたら、行進している途中に犬が歩みを止め「たって」の瞬間を切り取り褒める、褒めてその場所で報酬を与える、ハンドラーの動きは徐々に大きくしてゆく、そうすることにより、行進を止め「たって」の行動をとることを強化できる。
行進中の「たって」 を教えようとしたら、行進している途中に犬が歩みを止め「たって」の瞬間を切り取り褒める、褒めてその場所で報酬を与える、ハンドラーの動きは徐々に大きくしてゆく、そうすることにより、行進を止め「たって」の行動をとることを強化できる。
なのに、一番の間違いは「たって」の状態を崩した後に「たって」の行動の報酬を与えることが多く見られる。
これだと、犬は、動いたことに報酬をもらうことになります。
報酬は、犬にとっては報酬です。でも、ハンドラーにとっては、トレーニングにおける、重要な「道具/ツール」です。上手に使いこなしましょう。
これだと、犬は、動いたことに報酬をもらうことになります。
報酬は、犬にとっては報酬です。でも、ハンドラーにとっては、トレーニングにおける、重要な「道具/ツール」です。上手に使いこなしましょう。
このブログにコメントするにはログインが必要です。
さんログアウト
この記事には許可ユーザしかコメントができません。