본문 바로가기
교육이론

스키너(Skinner)의 조작적 조건화 이론(강화와 벌)

by 신박에듀 2020. 4. 27.
반응형

안녕하세요 에듀몬입니다.

지난 시간에 이어서 행동주의 학습이론에 지대한 영향을 미치고, 현재까지도 강화와 벌을 활용하여 실제 학습현장에 응용되고 있는 스키너의 조작적 조건화 이론에 대해 알아보도록 하겠습니다.

 

 

1. 스키너의 조작적 조건화

 

  스키너는 조작적 조건 형성 이론의 대표적 행동주의자이며 손다이크가 제시한 도구적 조건화 대신 조작적 조건화라는 이름을 붙였습니다. 스키너는 쥐, 비둘기와 같은 동물을 대상으로 연구를 하였고 자극과 반응에 대한 강화와 벌 등의 원리를 설명하였습니다. 그는 실험 대상이 수동적으로 반응하는 것만이 아니라 조건 형성에 따라 능동적인 조작을 할 수 있다고 가정하였습니다.

  손다이크가 시행한 초기 실험에서, 잠긴 상자 안에 갇힌 고양이가 이리저리 뛰다가 우연히 문을 잠근 걸쇠를 당기는 반응을 하여 상자 밖으로 탈출하게 되며, 밖에 있던 음식을 먹게 됩니다. 상자 안에 몇 번 갇힌 고양이는 나중에 갇히자마자 걸쇠를 당겨 밖으로 나오게 되었습니다. 이 실험은 시행착오 학습을 제시한 손다이크의 유명한 연구이며, 성공을 위해 도구를 조작하였기 때문에 이러한 학습을 조작적 조건 형성(operantconditioning)이라 부릅니다. 스키너는 손다이크가 실험한 상자보다 더 정교한 장치를 고안한 스키너 상자를 고안하여 연구하였습니다. 스키너는 고양이의 걸쇠를 누르는 것과 같은 적절한 행위를 유발하도록 한 자극은 없으며, 적절한 행위 뒤에 나온 먹이라는 보상에 의해 성공 반응이 강화된다고 보았습니다.
  이와 같이 스키너의 실험은 유기체가 조작을 하고 행동의 결과로 따르는 보상에 의해 강화가 지속되며 외부의 자극을 통한 행동보다는 능동적인 요소와 강화되는 현상을 설명하였습니다. 스키너는 스키너 상자에 훈련된 비둘기를 넣어, 지렛대를 조작하여 먹이를 획득하는 과정을 관찰했습니다. 실험동물인 비둘기는 1일 1회 일정한 시간에 먹이를 주는 상황에 순응시켜 굶주린 시간을 이용해서 실험했습니다. 스키너 상자에 넣은 후에도 처음 전원을 작동시켜 50~200개의 먹이를 방출하여 작동하는 소리와 더불어 먹이 접시 쪽으로 가도록 순응시킨 후, 비둘기가 자발적으로 지렛대를 눌러 먹이를 먹는 동작을 관찰하였습니다. 처음 2~3분에서 20분까지는 지렛대 반응 없이 탐색적인 반응이었으나, 우연한 지렛대 반응으로 먹이를 먹게 되었습니다. 그 후 계속 지렛대 반응으로 먹이를 먹게 되었습니다. 그 이후에도 지렛대 반응은 빠른 속도로 이루어졌습니다. 이때 먹이는 무조건 자극이며, 먹이를 먹으려는 욕구는 무조건 반응입니다. 그리고 조건 자극은 지렛대이며 조건반응은 지렛대를 사용하는 행동입니다. 여기서 자발적 회복 현상의 개념으로 지렛대를 눌러도 먹이가 나오지 않도록 상황을 만들면 비둘기가 반응하는 빈도가 낮아지게 됩니다. 그래서 다시 이전의 조건반응의 행동을 보이는 것입니다.

 

 

<스키너 상자>

출처: https://education-is-power.net/operant-conditioning/

 

 

2. 강화와 벌


  스키너는 강화와 벌, 소거에 대한 조작적 조건화의 원리를 설명하기도 하였는데 성공적인 학습의 행동을 보였을 때 보상적인 의미가 주어지며 변화가 일어나고 특정 반응에 대한 강화가 제공됩니다. 이때의 강화는 적합한 행동에 의해서 자극되어야 하며 행동의 즉각적인 강화가 있어야 하며 이에 반대로 소멸의 작용으로 학습이 이루어지기도 합니다.

  이렇듯이 조작적 조건 형성의 핵심 개념으로 강화와 처벌로 구분하여 설명할 수 있습니다. 강화는 보상에 대한 강화물이 제공되며 탐구 대상은 이러한 작용을 통해 학습의 확률이 높아지게 됩니다. 강화는 정적 강화와 부적 강화가 있는데 정적 강화는 긍정적인 행동의 결과에 의한 보상이 주어지고 부적 강화는 학습자에게 불쾌한 자극을 해소해 줌으로써 강화되는 방식입니다. 이러한 강화는 강화 계획에 따라 명확히 제시되어야 하며 연속적인 성격을 갖기도 한고 간헐적 성격을 갖게 되면서 학습자의 상황을 고려하여 다양한 형태를 취하게 됩니다. 처벌은 바람직하지 못한 행동을 하였을 때 체벌이나 상징적 처벌이 이루어지는 것을 말합니다.
  강화를 통한 조건 형성으로서 학습을 설명하며 유기체는 실험 상황에서 ‘먹이를 얻기 위한’ 능동적인 역할을 하며, 실험자가 바라는 유기체의 반응이 나타나지 않거나 혹은 나타날 때까지 유기체는 보상을 받지 못하거나 벌을 받아야 한다는 의미에서 ‘조작적’이란 용어를 사용합니다. 조작적 조건 형성은 자극, 반응, 강화물이라는 세 가지 중요한 요소로 구성되며, 반응과 그 결과에 강조점을 둡니다. 또한 보상을 얻는 것은 유기체가 어떤 반응을 방출(emit)하는 것과 유관되어 있다는 의미에서 이 과정은 유관 강화의 예를 보여 주고 있습니다. 스키너는 급진적 행동주의자로 분류되기도 하는데 행동주의의 가장 순수한 형태이기 때문입니다. 스키너는 방법론적인 행동주의를 배격하면서 형이상학적 행동주의를 급진적으로 주장하였습니다. 즉 마음과 정신에 대한 논의는 타파되고 없어져야 할 근거 없는 사회적 통념이라는 것입니다.
  핵심 개념들은 그의 실험에서 찾아볼 수 있듯이 먹이에 의한 행동은 강화되며, 조건반응은 보수(먹이)를 얻기 위한 수단, 즉 도구적 역할을 하며 보수가 강화되면 반응행동도 강화되어 간다는 것입니다. 고전적 조건화에서와 같이 강화가 수동적으로 이루어지는 것은 아니며 자극과 반응과의 새로운 결합이 형성되는 것도 아닙니다. 지렛대 반응은 먹이에 수반된 강화가 이루어지기 전에 이미 어느 정도 일어날 가능성을 내포하고 있습니다. 이것을 조작적 수준(operantlevel)이라 부릅니다. 일상생활에서 조작적 행동에 강화가 항상 따르거나 규칙적으로 주어지지는 않습니다. 조작적 조건 형성의 실험에는 간헐 강화 또는 부분 강화에 의한 실험이 많습니다. 스키너와 그의 동료도 쥐와 비둘기를 사용하여 간헐적 강화에 대한 실험 보고를 많이 하고 있습니다.

  행동주의 심리학자인 스키너 또한 왓슨과 마찬가지로 외현적인 행동연구로 심리학을 연구해야 한다고 생각했으며, 환경이 행동에 미치는 영향에 관심을 가졌습니다. 그러나 스키너는 왓슨과 달리 파블로프의 조건 형성이 관심을 두기보다는 유기체의 자유로운 행동을 통해 환경에 영향을 가하는 조작적(operant) 행동에 관심을 가지고 손다이크의 연구를 보다 정교하게 고안하여 진행하였습니다.
  이처럼 스키너는 유기체의 행동에 대한 보상이 효과적으로 적용되어야 하며 학습효과가 커지고 지속되는 방법으로 만족감을 줄 수 있는 강화가 필요하다고 보았습니다. 조작적 조건 형성은 고전적 조건 형성과 여러 면에서 차이가 있지만 어떤 자극에 대해 수동적으로 반응하는 것이 아니라 능동적인 반응의 측면에서 고전적 조건화와 가장 다른 차이점을 보입니다. 행동에 대한 강화가 항상 즉각적으로 자극되어지지 않는다는 점에서 간헐 강화, 부분 강화를 연구하였고 조작적 조건화 원리를 제시하였습니다. 또한 조작적 행동에 대한 체계적이고 과학적인 실험을 계획하여 학습에 대해 효과적인 강화가 필요하다고 설명하고 있습니다.

 

 

3. 강화의 종류

 

 가. 정적 강화

 

  강화는 강화물의 제시방법에 따라 정적 강화와 부적 강화로 나눌 수 있습니다. 정적 강화는 학습자가 만족할만한 강화물을 제공함으로써 원하는 목표 행동의 발생빈도를 증가시키는 것을 의미합니다. 정적 강화를 통해 원하는 행동의 발생 빈도를 증가시키는 방법으로는

첫째, 목표하지 않은 행동보다 목표하는 행동에 관심을 보임으로써 비 목표 행동을 감소시키고 목표 행동을 증가시키는 방법이 있습니다.

둘째, 원하는 행동이 일어난 직후에 학습자가 필요로 하는, 또는 좋아하는 자극을 제시하여 대상의 행동 발생 빈도를 증가시키고 유지시키는 방법입니다. 학업성적이 오르면 부모가 용돈을 올려주거나 선물을 사줌으로써 학생이 학업에 몰두하게 되고, 수업에 집중하며 참여하는 학생에게 칭찬을 해주는 것으로 학생의 수업태도를 계속 유지시키거나, 학생들의 인사에 교사가 반가운 목소리로 화답하자 학생들이 더욱 적극적으로 인사를 하게 되는 것 등이 정적 강화의 예가 될 수 있습니다. 이처럼 좋은 성적, 실질적인 보상, 칭찬, 교사의 웃는 표정과 반가운 목소리 등은 학생들에게 정적 강화물로 작용될 수 있을 것입니다. 그리고 학생들이 보여 주는 성실한 수업 태도나 질문, 학부모나 교장의 인정 등은 교사에게도 정적 강화물이 될 수 있습니다. 따라서 교실에서 일어날 수 있는 정적 강화는 학생과 교사 모두에게 영향을 주게 됩니다.

 

 나. 부적 강화

 

  부적 강화는 학습자가 싫어할만한 것을 제거해줌으로써 원하는 목표 행동의 발생빈도를 증가시키는 것을 의미합니다. 시험문제를 몇 문항 이상 맞춘 학생에게는 숙제를 면제해주거나, 조별과제를 통해 가장 과제를 잘 해온 조는 청소를 면제해 주는 것을 통해 학생들이 개별 학습 및 과제에 집중하고 충실히 참여하게 되었다면 이것은 학생들이 싫어하는 숙제나 청소 등을 제거해 줌으로써 교사가 학생들에게서 원하는 행동을 이끌어낸 부적 강화가 일어난 것입니다.

 

 

4. 강화 계획

 

  부모나 교사가 학생의 적절한 행동을 증가시킬 목적으로 강화를 사용하게 될 경우 목표하는 행동이 무엇인가를 정하고 언제, 어떻게 강화를 줄 것인가를 계획하게 됩니다. 이처럼 적절한 목표 행동을 유도하고 그 행동을 점차 일반화시켜가기 위해서는 그에 맞는 적절한 강화 계획이 필요합니다. 다시 말해 강화 계획은 강화물의 투입 시기와 방법의 계획을 통해 정해진 시기에 강화를 적용함으로써 학습행동을 형성하고, 형성된 학습행동을 유지시키기 위한 행동주의 이론의 원리입니다. 강화가 일어나는 상황과 빈도는 대상의 반응을 결정합니다. 따라서 강화계획은 행동을 형성하고 유지하는 데에 상당한 영향을 미치게 됩니다. 강화계획은 강화물이 제시되는 빈도와 간격, 강화물의 획득에 대한 예측 가능성 등의 다양한 요인에 따라 그 형태를 나눌 수 있습니다.

 

 가. 연속 강화법

 

  연속 강화법 또는 계속 강화법은 목표 행동이 발생한 직후 강화물을 계속 제공하는 방법으로 행동수정 초기에 많이 사용됩니다. 연속강화는 학생이 목표행동을 빠르게 학습하도록 하는 장점이 있으나 강화물의 제공이 중지되면 빠른 소거가 일어나게 되고, 강화물 없이도 목표행동을 하도록 해야 한다는 목적에 있어서 장기적 사용에는 부적합합니다. 따라서 처음 목표행동을 익히도록 하기 위해서는 계속적으로 강화물을 제공하나, 목표행동이 충분히 형성되고 난 이후에는 간헐적인 강화를 실시해야 할 것입니다.

 

 나. 간헐적 강화법

 

  간헐적인 강화법은 목표행동이 적정 수준에 도달한 경우, 강화물에 대한 반응 수준을 유지하기 위하여 강화물의 제공 빈도를 점차 줄여나가는 과정으로 학생의 행동반응 수준을 적절하게 유지시키기 위한 목적으로 사용됩니다. 간헐적 강화법은 상황에 따라 고정비율 강화, 고정 간격 강화, 변동 비율 강화법과 변동 간격 강화법을 사용할 수 있습니다.

 

① 고정비율 강화 계획
  고정비율 강화 계획이란 학생의 적절한 행동이 미리 정해진 일정 횟수만큼 나타났을 때에만 강화물을 제공하는 방법입니다. 줄넘기를 100개 이상 한 학생은 쉴 수 있도록 해준다던지, 자유투를 10개 이상 성공한 학생은 쉴 수 있도록 하는 것 등이 고정비율 강화계획에 속합니다.

 

② 변동비율 강화계획
  변동비율 강화 계획에서 비율이 변동한다는 의미는 강화물의 제공비율이 변화함을 의미합니다. 즉 학생들은 강화물을 획득하기 위해 수행해야 하는 행동이 무엇인지는 알고 있으나 행동의 수행 횟수는 정확히 알지 못합니다. 실생활의 예로 로또복권 당첨을 들 수 있겠습니다.

 

③ 고정 간격 강화법
  고정 간격 강화법은 학생에게 고정된 특정 시간을 기준으로 그 시간이 경과할 때마다 강화물을 제공하는 방법입니다. 교사가 학생이 자리에 앉아있도록 행동수정을 하기 위해 수업 중 학생이 10분 동안 계속해서 자리에 앉아있을 때마다 강화물을 주는 것이 고정간격 강화계획의 예가 될 수 있습니다. 고정간격 강화법에서는 강화가 제공되는 사이의 간격이 길수록 그 효과는 낮아지므로 강화 초기에는 그 간격이 짧아야 합니다.


④ 변동 간격 강화계획
  변동 간격 강화계획에서는 행동수정을 받는 학생들은 어떤 시점에서 강화를 받게 되는지를 예측할 수 없으나 어떤 행동을 하면 강화를 받을 것이라는 것은 알고 있습니다. 교사가 변동간격 강화법을 사용할 경우 학생은 평상시에 강화를 받을 준비를 할 수 있을 것입니다.


  매번 강화를 주는 방법이 학습의 초기단계에서는 도움을 줄 수 있지만 장기적인 사용은 강화물에만 의존하는 학습행동을 나타낼 수 있다는 점에서 부작용을 가져올 수 있습니다. 학생들이 강화물의 제공 없이 스스로 자발적인 학습에 참여할 수 있도록 만들고, 이러한 학습 행동을 유지할 수 있도록 도와주기 위해서는 보다 구체적인 강화 계획의 수립이 필요합니다. 이를 통해 강화물을 활용함에 있어 보다 효과적인 결과를 얻을 수 있을 것입니다.

 

 

5. 벌


  의도한 행동을 유발하고 그 빈도를 증가시키려는 강화와는 달리, 벌(punishment)은 아동이 보이는 부적절한 행동이나 일반적으로 바람직하지 않다고 가정된 행동의 발생빈도를 약화시키거나 감소시기 위해 사용되는 행동 중재법(intervention)입니다. 벌은 바람직하지 않은 행동을 감소시키기 위해 불유쾌한 자극을 제공하는 수여성 벌과 학생들이 좋아하는 것을 제거함으로써 불유쾌한 감정을 경험하게 하여 바람직하지 않은 행동을 약화시키거나 감소시키는 제거성 벌의 두 가지로 나눌 수 있습니다.
  수여성 벌에는 교사의 꾸지람, 청소, 반성문, 나머지 공부 등이 해당되며, 수여성 벌을 사용하는 대부분은 물리적인 경우가 많기 때문에 즉각적으로 효과가 나타난다는 장점이 있습니다. 그러나 물리적인 벌은 장기적으로나 단기적으로 학생들에게 이로울 것이 없습니다. 단기적으로는 학생들에게 고통이나 두려움, 모욕감을 경험하게 하고 나아가 육체적인 상해를 입힐 수 있으며, 장기적으로는 폭력에 대한 무감각, 모든 문제를 물리적으로 해결하려는 습관의 형성, 심지어 정신질환성 스트레스 증상의 원인이 될 수 있기 때문입니다.

  또한 벌의 강도가 너무 약할 경우, 행동을 억제하는데 실패하기도 하고, 행동에 대한 잘못의 정도에 따라서가 아닌, 벌을 주는 사람의 화난 정도에 따라 감정적으로 벌의 강도가 정해지기도 합니다. 뿐만 아니라 교사의 관심을 끌기 위해 벌이 주어질 행동을 반복하는 학습자의 경우에는 의도와는 달리, 벌이 정적 강화로서의 역할을 할 수 있게 됩니다.
  제거성 벌에는 TV 시청 금지, 컴퓨터 사용금지, 외출금지 등이 해당됩니다. 제거성 벌의 사용은 일반적으로 학생들에게 큰 해를 입히지 않으면서도 목표하는 행동수정을 일으킬 수 있는 효과적인 중재법입니다. 이는 간접적인 벌에 해당됩니다. 제거성 벌은 그 내용으로 인해 부적 강화와 혼돈되는 경우가 있는데, 부적 강화는 학생에게서 관찰되는 부적절한 행동의 제거를 통해 이후에 나타나는 행동의 발생 빈도를 높이고자 하는 반면, 제거성 벌은 학생이 기대하고 바라는 행동을 제거함으로써 부적절한 행동의 감소를 의도한다는 점에서 차이가 있습니다.
  벌은 단기적인 행동수정의 목적을 달성하는 것에 있어 분명 효과가 있습니다. 그러나 대부분의 학자와 교사들은 벌의 사용이 그다지 바람직하지 않다는 것에 동의합니다. 벌의 효과는 즉각적인 반면 오랜 시간 지속되지 않으며, 벌을 경험한 학생들은 공격적인 성향을 가지게 되기 때문입니다.
  Skinner는 벌의 효과를 간접적이고 짐작하기 힘든 것으로 취급하였습니다. 벌은 또 다른 역효과를 가져올 가능성이 있으며 장기적으로 벌을 사용하는 것이 원치 않는 행동을 억압하는 것에 별 효과가 없음에도 불구하고 순간 극적으로 성공한 것처럼 보이게 만드는 일시적 효과만 있기 때문입니다. 또한 벌을 받는 학생은 잘못된 행동의 변화에 노력을 기울이기보다는 벌을 주는 사람이나 벌이 사용되는 상황을 회피하려는 경향이 있습니다.
  따라서 학생에게 필요한 바람직한 행동을 가르치고 장기적인 변화를 유도하기 위해서는 벌에 의한 방법이 아닌 행동 소거와 같은 다른 중재 방법이 더 효과적일 것입니다. 벌이 바람직하지 않은 행동의 감소라는 정의에 기초를 두고 있다는 것을 생각해보면 벌을 받음으로써 학생의 부적절한 행동은 감소할 것입니다. 하지만 벌이 처벌된 행동을 반드시 감소시키지는 않습니다.
  또한 대부분 벌을 사용하는 궁극적인 목적은 부적절한 행동의 감소에만 있는 것이 아닙니다. 예를 들어 부모가 게임에만 몰두하고 있는 학생에게 벌을 주는 이유는 공부하는 행동을 증가시키기 위한 것에 있습니다. 여기서 게임하는 행동이 학업에 몰두하는 행동을 방해하는 것은 틀림없습니다. 그러나 방해하는 요인을 제거하는 것이 자동적으로 바라는 행동의 발생 증가로 이어지는 것은 아닙니다. 벌이란 행동의 감소를 위한 것이지, 행동의 증가를 위한 것이 아니기 때문입니다. 이처럼 학생이나 대상에게 바라는 행동의 증가를 원한다면 행동의 방해 요인을 제거하는 것에 초점을 맞추기보다는 바라는 행동 증가에 직접적인 영향을 줄 필요가 있습니다. 즉 벌이 아닌 강화의 사용이 필요하다는 것입니다.

 

 

* 참고문헌: 김현민(2014). Bandura의 사회학습이론을 적용한 미술수업모형 개발

박은경(2016). 체육수업에서의 긍정적 보상 경험과 행동변화

반응형