第七节
要训练老鼠压杆取食,并等老鼠压杆后给予强化,并不容易。木杆离地10公分,要老鼠挺身接近木杆,几乎不可能。但可利用食盘发出的声音,作为次级强化媒介,训练老鼠听到食盘声音,就趋向食盘。之后,在老鼠接近木杆的位置,头部稍微向上,才发出食盘的声音,以强化头部稍微向上的反应。接着头向上仰2公分时,才予以强化,由2公分至3公分、5公分,逐步强化头部并接近木杆和触碰木杆,然后强化前爪接触木杆直到最后强化压木杆,由易而难地完成学习目标。这整个过程称为逐次趋近法,又称塑造。
Isaacs等(1960)利用逐次趋近法,使一名19年来从不说话的40岁精神分裂症患者开口说话。他们以口香糖作为强化物,使患者由视线移向口香糖至唇动反应、发声、说要糖、回答简单问题。
斯金纳将8只鸽子分别置于斯金纳箱内,每隔15秒给予谷粒,一段时间后,鸽子竟然重复各种刻板行为,例如按逆时针方向转动、头往后仰、左右两边摇摆等。其实这些反应出现时刚好谷粒出现,因而行为被强化了。当鸽子把头往后仰时,食物出现,往后仰首的反应就会再出现,而被一个15秒时距出现的食物强化的几率也随之提高。尽管食物的出现并非因为鸽子的反应,但鸽子却形成了向后仰首的反应。这种因为偶然强化而建立的刻板行为,称为迷信行为。
偶然的行为带来意外的惊喜就会重复出现,由此成了刻板的迷信行为。有一次穿蓝袜子赢了球赛,穿蓝袜子就被这偶然的巧合强化了,每次比赛一定要穿上蓝袜子。虽然一般人的迷信行为不一定由偶然强化建立,但偶然强化却可维持因传闻建立的迷信。
斯金纳认为,强化是建立行为(操作反应)与刺激(强化媒介)的依随关系。普雷墨克(David Premack)指出,操作条件作用中的强化媒介通常是饮食行为(而不是水和食物)。因此操作条件作用习得的是“反应—反应”的依随关系。
具有强化性质的行为(例如吃、喝、玩、乐)称为“强化性”行为,而要学习的压杆、啄键盘等行为称为“可强化”行为。两者的界定视行为出现的频率而定。频率高的强化频率低的,前者为“强化性”行为,后者为“可强化”行为,这个规律称为普雷墨克原理。
猴子爱好探究和操弄物体,压杆频率最高,拉活塞最低,开门则介于两者之间。普雷墨克在实验进行时,设定其中一项活动为操作反应,另一项为强化媒介。猴子未做出操作反应前,不能从事作为强化媒介的活动。实验分六个阶段进行,测试了各种活动作为操作反应和强化媒介的可能组合。表3—8列出了各阶段的依随条件和测试结果。
表3—8普雷墨克原理的实验程序
由表3—8可见高频行为(压杆)强化了低频行为(开门),但开门又可作为增加拉活塞的强化媒介。故开门是强化性还是可强化行为,要视开门在频率量尺上的相对位置而定。位置较高的为“强化性”行为,较低的是“可强化”行为,故普雷墨克原理又称强化的相对性。
正常情况下动物的各项活动有一定的比率,例如老鼠花较长的时间喝水,转动轮子的时间较少,比率约为1.7∶1.0。这个比率若受干扰,老鼠就会采取行动恢复正常。Mazur(1975)把喝水和转动轮子的比率调整为9.0∶1.0,限定老鼠只有喝水45秒,才有5秒钟转动轮子的时间。结果老鼠为了旋转轮子,增加了喝水的时间(见图3—14)。
图3—14低频活动强化高频活动的现象
资料来源:Mazur,1975.
上述结果表明了受限制的活动强化了不受限制的活动。低频活动(转轮)加强了高频活动(喝水),这个原理称为反应剥夺论,它完善了普雷墨克的强化相对论。