행동주의 학습이론의 원리와 적용

사실 행동주의 학습이론을 처음 접했을 때는 ‘인간의 행동을 과학적으로 예측한다고?’ 싶어서 조금 낯설었습니다. 그런데 공부하다 보니 생각보다 우리 일상과 굉장히 맞닿아 있는 이론이라는 걸 알게 됐습니다. 행동주의는 마음속에서 일어나는 복잡한 의식의 흐름보다, 눈으로 직접 확인할 수 있는 행동, 즉 어떤 자극에 어떤 반응이 나타나는지에 집중합니다. 환경을 어떻게 구성하느냐에 따라 인간의 행동을 원하는 방향으로 바꿀 수 있다는 게 핵심 주장입니다. 파블로프, 왓슨, 스키너, 손다이크가 각자 어떤 방식으로 이 원리를 밝혀냈는지 하나씩 살펴보겠습니다.

1. 고전적 조건형성: 신호와 반응의 신비로운 결합

파블로프(Pavlov)는 원래 개의 소화 기능을 연구하는 생리학자였습니다. 그런데 연구 도중 뜻밖의 장면을 목격합니다. 개가 먹이를 가져오는 조수의 발소리만 들어도 침을 흘리기 시작한 것입니다. 이 우연한 발견이 학습 연구의 역사를 바꿔놓았습니다.

실험의 원리는 이렇습니다. 개에게 먹이(무조건자극, US)를 주면 당연히 침(무조건반응, UR)이 나옵니다. 여기에 먹이와 전혀 상관없는 종소리(조건자극, CS)를 먹이 직전에 함께 들려주는 과정을 반복합니다. 그러면 나중에는 종소리만 들어도 침(조건반응, CR)이 나오게 됩니다. 원래 아무 관계도 없던 자극과 반응이 새롭게 연결되는 것, 이게 바로 조건형성입니다.

인간에게 적용된 사례 중 가장 유명한 것이 왓슨(Watson)의 실험입니다. 생후 11개월밖에 안 된 아기 알버트에게 흰 쥐를 보여줄 때마다 갑자기 큰 소음을 냈더니, 결국 흰 쥐만 봐도 울음을 터뜨리게 되었습니다. 지금 기준으로 보면 윤리적으로 절대 해서는 안 될 실험이지만, 인간에게도 조건형성이 작동한다는 것을 처음으로 보여준 사례로 남아 있습니다.

반대로 존스(Jones)는 이미 공포 반응이 생긴 아이에게 아이스크림 같은 좋은 자극을 함께 제시하는 방식으로 공포를 없애는 역조건 형성에 성공했습니다. 두려움도 학습되지만, 지울 수도 있다는 것이죠.

고차적 조건형성은 한 발 더 나아간 개념입니다. 종소리에 침을 흘리게 된 개에게 이번에는 종소리와 함께 사각형을 반복해서 보여주면, 나중에는 사각형만 봐도 침을 흘리게 됩니다. 조건형성이 층층이 쌓일 수 있다는 뜻입니다.

2. 소거, 자발적 회복, 일반화와 변별

조건형성이 한번 이루어졌다고 해서 그 반응이 영원히 유지되는 건 아닙니다. 종소리를 들려주면서 먹이를 더 이상 주지 않으면 침 흘리는 반응은 점점 줄어들다 결국 사라집니다. 이를 소거라고 합니다. 그런데 재미있는 건, 며칠 뒤에 다시 종소리를 들려주면 사라졌던 반응이 슬그머니 되살아난다는 점입니다. 이것이 자발적 회복인데, 소거가 완전한 망각이 아니라는 걸 보여주는 현상입니다.

일반화는 조건형성된 자극과 비슷한 자극에도 같은 반응이 나타나는 것입니다. 알버트가 흰 쥐뿐 아니라 토끼나 산타클로스 마스크를 보고도 울었던 것이 바로 이 때문입니다. 반대로 특정 자극에만 선택적으로 반응하도록 훈련되는 것은 변별이라고 합니다.

3. 행동의 결과가 미래를 결정하는 조작적 조건형성

스키너(Skinner)의 이론은 파블로프와는 방향이 조금 다릅니다. 파블로프가 자극이 먼저 오고 반응이 따라오는 구조라면, 스키너는 행동을 먼저 하고 그 결과에 따라 행동이 강화되거나 약해진다는 점에 주목했습니다.

스키너 상자 실험에서 굶주린 쥐는 상자 안을 이리저리 돌아다니다 우연히 지레를 눌렀을 때 먹이가 떨어지는 걸 경험합니다. 한 번, 두 번 반복되면서 쥐는 먹이를 얻으려면 지레를 눌러야 한다는 걸 스스로 터득하게 됩니다. 행동이 결과를 얻기 위한 도구가 된다는 점에서 도구적 조건형성이라고도 부릅니다.

강화의 유형을 살펴보면, 바람직한 행동 뒤에 좋은 것을 주는 방식이 정적 강화, 싫어하는 자극을 없애줌으로써 행동을 늘리는 방식이 부적 강화입니다. 또 음식처럼 그 자체로 가치 있는 일차적 강화물과, 돈이나 칭찬처럼 경험을 통해 가치를 알게 된 이차적 강화물로 나뉩니다.

강화 계획도 흥미롭습니다. 매번 보상을 주는 것보다 가끔씩, 불규칙하게 주는 부분강화가 행동을 훨씬 오래 지속시킨다는 사실이 처음에는 의외였습니다. 생각해 보면 낚시를 하루 종일 해도 포기하지 못하거나, 게임에서 아이템이 언제 나올지 몰라서 계속 하게 되는 것도 같은 원리입니다. 보상이 언제 올지 모를 때 오히려 더 집착하게 되는 것이죠.

4. 손다이크의 시행착오설과 학습의 3대 법칙

손다이크(Thorndike)는 고양이를 문제 상자에 가둬놓고 탈출하는 과정을 반복 관찰했습니다. 고양이는 처음에는 이리저리 마구 움직이다 우연히 탈출구를 발견하지만, 횟수를 거듭할수록 점점 빠르게 탈출하게 됩니다. 그는 이것을 통해 학습이란 수많은 시행착오 끝에 올바른 반응이 점차 강화되는 과정이라는 결합설을 제시했습니다.

그가 정리한 학습의 3대 법칙은 지금 봐도 꽤 설득력이 있습니다. 효과의 법칙은 결과가 만족스러우면 그 행동이 반복되고, 그렇지 않으면 약해진다는 것입니다. 연습의 법칙은 반복할수록 강해지고 쓰지 않으면 약해진다는 원리입니다. 준비성의 법칙은 배울 준비가 된 상태에서 학습이 이루어질 때 효과가 가장 크다는 것으로, 억지로 가르친다고 되는 게 아니라는 점을 잘 보여줍니다.

5. 벌의 원리와 교육적 주의사항

잘못된 행동을 막기 위해 벌을 주는 경우도 있지만, 행동주의 학자들은 그 한계를 분명히 짚습니다. 벌은 특정 행동을 억누를 수는 있어도, 어떻게 행동해야 하는지를 알려주지는 못합니다. 오히려 학습자가 학교나 교사 자체를 부정적으로 느끼게 만들거나, 공격적인 반응이나 회피 행동으로 이어질 수 있습니다. 그래서 벌은 정말 어쩔 수 없을 때, 마지막 수단으로만 써야 한다는 것이 이들의 공통된 입장입니다.

정리하며

솔직히 처음에는 행동주의가 인간을 너무 단순하게 보는 것 아닌가 싶었습니다. 자극을 주면 반응이 나온다는 게 마치 기계를 다루는 것처럼 느껴지기도 했거든요. 그런데 공부하면서 생각이 조금 바뀌었습니다. 강화 계획 하나만 봐도 우리가 얼마나 보상에 민감하게 반응하는지, 그리고 그것이 얼마나 정교한 방식으로 우리 행동을 만들어가는지가 잘 보였습니다.

나쁜 습관이 왜 쉽게 안 고쳐지는지도 이 이론으로 설명이 되었습니다. 다만 역시 인간이 환경에 그냥 끌려다니는 존재만은 아니라는 생각도 듭니다. 그렇기 때문에 오히려 이 이론을 제대로 이해하고, 벌보다 긍정적인 강화로 배움의 즐거움을 만들어가는 방향으로 활용하는 게 교육에서 무엇보다 중요하다는 걸 다시 한번 느꼈습니다.