스키너 박스와 조작적 조건 형성 원리
스키너는 스키너는 1904년 펜실베이니아주 서스쿼해나에서 태어나 어려서부터 엄격한 교육을 받았습니다. 그는 종교 교육이 행동을 강화하는 기제에 불과하다고 생각했으며, 해밀턴 대학교에서 영어를 전공한 뒤 하버드 대학교 대학원에서 심리학을 전공했습니다. 그곳에서 행동과학과 인지심리학에 대한 관심을 가지게 되었고 그는 환경이 행동에 미치는 영향에 대한 연구를 시작했습니다. 이는 그가 조작적 조건형성 이론을 개발하는 배경이 됩니다. 그의 연구는 1990년 백혈병으로 사망하기까지 그는 행동주의 학습이론, 그중에서도 행동치료와 용행동분석의 기초를 마련했습니다. 그는 인간 행동이 환경에 의해 조작될 수 있다고 보았으며 조작적 조건형성 이론을 개발하여 인간 행동이 주로 환경의 영향으로 결정된다는 관점을 제시합니다. 그의 이론은 인간의 자유와 존엄성을 배제할 수 있다는 비판도 받았지만, 여전히 다양한 분야에서 활용되고 있으며, 사회사상가로서도 중요한 평가를 받고 있습니다. 그런 그가 고안해 낸 '스키너 박스'는 그의 이론에서 중요한 장치입니다. 스키너 박스는 스키너라고 하는 심리학자가 만든 연구 장치입니다. 위 사진과 같은 박스에 생쥐나 비둘기 같은 것들이 들어가고 거기에는 지렛대와 먹이가 나오는 장치들이 만들어져 있습니다. 그리고 지렛대를 얼마나 열심히 누르는지를 기록할 수 있는 연구 장치가 있습니다. 스키너 박스로 했던 연구는 무엇일까요? 바로 유기체에게 어떤 방식으로 먹이(강화)를 주면 유기체가 지렛대를 누르는 행동이 일어날 확률을 증가시킬 수 있을까에 대한 연구를 했습니다. 쉽게 말하면, 먹이를 어떻게 줬더니, '지렛대를 열심히 누른다'라는 걸 밝혀낸 연구입니다. 이것이 곧 조작적 조건형성이란 행동과 그 행동에 따른 결과의 연합입니다. 고전적 조건형성은 자극의 연결을 다루지만 조작적 조건형성은 행동과 그 결과의 연결을 강조한다는 점에서 차이가 있습니다.
강화방식
생쥐가 지렛대를 자꾸 누르는 이유는 무엇일까요? 바로 보상 즉 '강화물' 때문입니다. 먹이는 '강화물'이 될 텐데요. 강화방식에는 크게 두 가지 방식이 있습니다. 첫 번제는 정적 강화입니다. 생쥐가 지렛대를 눌렀을 때 좋아하는 먹이를 제공하는 것을 정적 강화라고 합니다. 하지만 생쥐가 지렛대를 열심히 누르게 하는 방법이 하나 더 있습니다. 무엇이냐 하면 생쥐가 있는 스키너 박스에 전기를 흘려주는 것입니다. 생쥐가 발바닥의 전류 때문에 팔짝팔짝 뛰다가 지렛대를 눌렀더니 전류가 안 흐르게 됩니다. 그러면 생쥐는 자기가 싫어하는 전기로부터 벗어나려고 열심히 지렛대를 누르게 될 것입니다. 이것을 부적 강화라고 합니다. 둘 다 강화라는 것에서의 공통점은 생쥐로 하여금 행동의 빈도수를 높여준다는 것입니다. 그러면 어쩐지 부정강화는 처벌과 비슷하게 느껴질 수도 있습니다. 하지만 부적 강화와 처벌은 완전히 다른 개념입니다. 처벌은 혐오자극을 제공해 유기체가 특정 반응을 하지 못하도록 하는 겁니다. 예를 들어 생쥐가 지렛대를 누를 때마다 전기 쇼크를 주는데 이것은 처벌을 하는 거라 볼 수 있습니다. 그럼 생쥐는 더 이상 지렛대를 누르지 않을 거예요. 즉 부적 강화는 특정 행동을 더 많이 하도록 하게 만들지만 처벌은 특정 행동을 못하게 한다는 점에서 차이가 있습니다.
강화물과 강화계획
강화물은 크게 두 종류로 나눌 수 있습니다. 첫 번째는 1차 강화물입니다. 이건 우리가 선천적으로 타고난 욕구를 만족시켜 줄 수 있는 대상입니다. 예를 들어 음식, 물, 공기, 성적인 대상을 포함할 수 있을 것입니다. 반면에 2차 강화물이라고 하는 것은 우리가 경험을 통해서 1차 강화물과 연합을 시킨 것입니다. 예를 들어 칭찬, 돈 같은 것들이 해당이 됩니다. 우리가 돈이나 칭찬을 좋아하는 이유는 칭찬이나 돈이 1차 강화물을 획득할 수 있도록 우리를 도와주기 때문입니다. 자 그럼 스키너 박스 안에 있는 생쥐가 지렛대를 열심히 누르도록 하려면 어떤 방식으로 보상을 제공하면 좋을까요? 이런 것을 강화 계획이라고 합니다. 강화 계획은 크게 두 가지로 나눠집니다. 하나는 간격을 조작하는 것이고, 다른 하나는 비율을 조작하는 것입니다. 먼저 간격을 고정시키는 계획은 일정한 시간 간격마다 강화물을 제공하는 겁니다. 예를 들어 월급은 매달 정해진 날짜에 항상 같은 금액을 받습니다. 매달 같은 시간에 고정적으로 받으니 고정간격강화라고 합니다. 반면에 간격을 변화시킬 수도 있습니다. 예를 들어 낚시를 생각해 보면, 물고기가 어떨 때는 1분 만에 잡히고, 어떨 때는 10분이 지나야 잡힙니다. 이렇게 시간 간격이 변화하는 것을 변화간격 계획이라고 합니다. 다음엔 비율 계획이 있습니다. 비율이라는 건 반응한 횟수에 따라 강화물이 제공되는 것입니다. 고정 비율 계획은 노동자가 하루에 몇 개 이상 생산품을 만들었는지 정해놓고 그 수에 도달하면 무조건 보상을 주는 것입니다. 그런데 변동비율강화계획은 내가 어떨 때는 한 번 눌러도 강화물을 받을 수 있는데, 어떤 경우에는 100번을 눌러야 강화물이 나오는 것을 말합니다. 도박이나 복권 같은 것을 예로 들 수 있겠지요. 몇 번을 해야 당첨될지 모르지만 누구는 2번 만에 되고 누구는 100번 만에 당첨이 됩니다. 그래서 우리는 계속 복권을 계속 사게 됩니다. 연구자들에 따르면 변동비율계획처럼 행동이 습득 돼버리면 그 행동을 아주 오랫동안 유지하게 된다고 합니다. 또 간격 계획보다 비율 계획이, 고정적인 것보다 변화가 있는 계획이 지렛대를 열심히 누르는 경향이 있다고 합니다.조작적 조건 형성이 형성되었던 행동이 사라지게 되는 것을 소거라고 합니다. 만약 생쥐가 지렛대를 눌렀는데 먹이가 안 나오면 생쥐는 더 이상 지렛대를 누르지 않을 것입니다. 그런데 이 소거는 어떤 강화 계획에서 잘 소거가 되냐면 매 시행마다 강화를 준 경우 바로 고정계획에서는 소거가 더 잘 됩니다. 만약 숙제를 할 때마다 칭찬 스티커를 받았는데, 어느 날 숙제를 했는데도 스티커를 안 주면 아이는 숙제를 하려는 동기가 급격하게 떨어질 수 있습니다. 그런데 변화 계획 같이 가끔 강화물을 제공하는 경우에는 그 행동을 사라지게 하는데 오히려 오랜 시간이 필요합니다. 복권, 도박에 중독되면 빠져나오기가 힘든 이유가 바로 이런 변화 비율 계획으로 보상을 받기 때문입니다.
'심리학' 카테고리의 다른 글
반두라의 사회학습이론과 관찰학습 (0) | 2024.01.14 |
---|---|
파블로프의 개, 고전적 조건 형성 원리와 역조건 형성 원리 (0) | 2024.01.11 |
아들러의 개인심리학, 사회적 관심이 중요한 이유, 열등감이 나쁜 게 아니다. 열등 콤플렉스와 우월 콤플렉스 (0) | 2024.01.11 |
무의식을 알아야 하는 이유, 자기(Self) 완성, 무의식을 무시하면 생기는 일, 심리적으로 종교가 있으면 좋은 이유 (0) | 2024.01.10 |
원형 이론이란? 페르소나, 그림자, 아니마와 아니무스, 양성성 개발의 중요성 (0) | 2024.01.10 |