6.2 强化习题详解(略)
第7章 学习与条件反射
7.1 复习笔记
一、学习的概念
(一)学习由经验而产生
经验是个体生活经历中所得信息的累积,学习来自经验。这种信息的获得可以是有计划的练习,也可以是偶发事件或长期潜移默化的影响。
(二)行为(或其潜能)的改变
学习导致的行为改变有显性与隐性之别,隐形学习又称行为潜能。它是学习过程的一个阶段(尚未达到可以表现的水平),也可能是受主客观条件影响而不能表达。
(三)持久的改变
学习是要达到行为的持久改变,这种持久是相对的,与学习的内容和练习时间有关。
(四)学习有多种类型
神经生物学将学习分为非联合型学习与联合型学习。非联合型学习是一类事件的经验,联合型学习是指两个或两个以上事件的联合,即条件反射性学习。
二、巴甫洛夫经典式条件反射与学习
(一)条件反射的形成
1.巴甫洛夫的实验
给狗呈现铃声刺激并不能引起其唾液分泌,但在铃声响起就给以肉食,经几次后便可出现单纯铃声就引起唾液分泌的现象。
2.有关条件反射形成的术语
铃声为无关刺激或中性刺激,肉是非条件刺激(UCS),它引起的唾液分泌则为非条件反射(UCR)。在铃声响起给肉称为强化,经过强化使单独铃声就能引起唾液分泌,此时反应称为条件反应(CR),铃声就从无关刺激转化成为条件刺激(CS),即学习是一种条件反射的建立。
(二)经典式条件反射学习中的普遍特征
1.习得与强化
经典式条件反射形成中的强化是条件刺激物先于非条件刺激或同时给予。UCS在CS后立即给予则CR形成最快,CS与UCS之间的最适延搁为0.5~5秒。
2.高级条件反射
当习得一种CR后,就可用良好习得的反射作强化物去强化另一无关刺激而形成二级或以上,条件反射称为高级条件反射。
3.消退
如果CS不再用UCS强化,CR就会发生消退,即不予强化就可使经典式条件反射减弱。
4.泛化
CR建立后,则与CS相似的刺激也可触发CR,这种效应称为刺激的泛化。
5.分化
CR建立后,用与CS相似的刺激代替条件刺激,但不予UCS强化,几次后个体停止对其作出反应。这种学习就称为分化,即个体学会对不同条件刺激作出不同的反应。
(三)条件反射学习在医学心理学中的例证
1.人类行为中的经典条件反射
经典条件反射在人类及动物行为的许多领域起作用,如唾液分泌这一类简单的反射,以及情绪性反应和内脏反射这类复杂的条件反射。
2.恐怖症
恐怖症是一种对特定事物或情境产生强烈恐惧并伴有回避行为的心理障碍。这种反应称为条件性情绪反应,而且可以由于刺激的泛化而扩大为恐怖症。
3.其他条件性情绪反应
人们生活中的爱、憎与恐惧是作为CERs获得的。
4.焦虑及其他神经症
巴甫洛夫学派认为经典式条件反射也可引起一种普遍的焦虑状态甚至更严重的心理障碍。
三、操作式条件反射学习
(一)桑代克的学习理论
1.迷笼实验
桑代克设计了迷箱实验来研究动物的学习行为。猫被放入箱内时的不成功的动作逐渐减少,打开箱门所需时间随着练习次数增加而缩短,逃出箱外得到食物的奖赏,从而证明了学习的尝试错误说。
2.学习的联结定律
(1)练习律:包括应用律和不用律。应用律指刺激与反应之间的联结因使用而加强;失用律则指刺激与反应间的联结如不应用就会使这个联结减弱。
(2)效果律:指刺激与反应之间的联结,因导致满意的结果而加强,因导致烦恼的结果而减弱。
3.评价
桑代克以刺激—反应的联结解释学习,这种把学习的成功取决于重复的训练和强化来解释,是属于行为主义和尝试错误学习观点,引起一些研究者的质疑。
(二)斯金纳的操作性条件反射
1.操作性条件反射
操作性条件反射的反应是自发的,是获取或延续某种奖赏或者是回避或减少某种惩罚的工具。斯金纳认为有机体的行为分为两类:一类是应答行为,是由已知的刺激引起的反应;另一类是操作行为,是有机体在一定情境中自发的反应。后者适用于操作性条件反射。
2.操作性条件反射的实验
即斯金纳箱实验,箱内有一根突出的杠杆,放入箱内的白鼠会偶然作出按压杠杆的动作,最初几次按压杠杆和食丸的出现之间的关系并未被白鼠注意,但几次之后就形成了饿鼠按压杠杆取得食物的操作性条件反射,或称操作学习。
3.强化作用
斯金纳认为控制强化物就是控制行为,凡能增强反应概率的刺激都是强化物。强化规律主要有以下几点:
(1)一个操作之后出现强化刺激,该操作反应出现的概率增加。
(2)间歇强化比连续强化更有效。
(3)强化程序如采用固定的间隔程序,则反应率与强化间隔时间的久暂有关,间隔越短,反应率越高。
(4)固定比率程序比采用固定的时间间隔训练能产生较高的反应比率。
(5)已形成的条件反射消退的速度,间隔强化比连续强化消退的缓慢。
4.评价
操作性条件反射的规律用于正常儿童和心身失调患者身上,来促进学习或矫正不适宜的习惯则显得过于简单。但他重视用客观方法进行有关学习的研究仍具有一定积极意义。
5.操作性条件反射与经典性条件反射的不同
(1)操作性条件反射是对反应进行强化,是反应型条件反射;经典性条件反射是对刺激进行强化,是刺激型条件反射。
(2)操作性条件反射的反应是机体根据情境而自发的反应;经典性的是事先选定好的某种固有的非条件反射的反应。
(3)经典性条件反射连续强化容易产生和巩固,不强化则易消退;操作性条件反射则以间歇性强化对反应的出现有利的同时也可减缓消退。
四、双因素学习
(一)两种研究方法
1.逃避学习与负性强化
逃避学习的装置是穿梭笼,大鼠需在给予电击时穿入另室以求安全。电击是负性强化物,穿梭反应就是经操作条件反射习得的,即逃避学习。
2.回避学习与双因素学习
回避条件反射学习的实验是在回避学习中加上灯光作为电击信号则是一种经典式的条件反射,电击成为非条件刺激,非条件反射则是恐惧,由恐惧而逃避。回避性条件反射学习可以分解为两个部分,如下:
在同一个反应中包含了两种不同形式的条件反射,因此称为双因素学习。
(二)惩罚与双因素学习
1.惩罚与负性强化
惩罚可以使一种不需要的行为终止或去除;而负性强化是指行为结果使不良刺激减少,从而使行为反应逐渐加强。
2.影响惩罚的参数
(1)时间的选择:应该在所要制止的行为发生时或发生后的即刻;
(2)一致性:施加惩罚于每次发生这种行为时;
(3)强度则要根据对象而定。
3.惩罚的副效应
(1)厌恶(痛苦与不适);
(2)惩罚的厌恶性刺激常导致逃避学习与回避学习;
(3)攻击。攻击是一种最常见的挫折反应,惩罚是习得攻击的有力的环境。
五、认知学习
(一)条件反射理论的不足
条件反射理论不能够解释所有的学习,条件反射只能说明学到了“行”,而对如何学到“知”则无从解释。
(二)顿悟学习实验
科勒对黑猩猩的系列研究发现,在问题解决学习中,黑猩猩可以洞察问题的整个情境中事物的相互关系再采取行动,他将此种学习称为“顿悟”。
(三)方位学习的实验
方位学习是证实认知学习的实验之一,托尔曼的“三路迷宫”实验就是代表(如图7-1所示)。
图7-1 方位学习实验(三路迷宫示意图)
(四)观察学习
观察学习或示范、模仿是班杜拉用来说明许多技能的学习。人们在示范观察中可以学习新的反应、避免或引进一些已往习得的反应,并可以运用于各种场合的一般规律。
(五)延迟学习
延迟学习的发生有时并无明显强化,并且在强化提供之前一直是隐匿的。这种学习可能与高水平的能力有关,如对未来奖励的预期。
六、其他社会学习
社会学习是人们从他人的经验中学习,如观察学习和熟练技巧学习。快速发展各种技巧的训练和实践方法有以下6点:
1.将实践日程分散在较长时期,而不是集中在一起;
2.学习极复杂的技巧用部分作业训练较为容易,将技巧动作分解开来训练,然后再结合起来;
3.技巧发展可以通过两个密切相关的技术进行,它们是适应训练和指引训练。前者是先易后难;后者则是防止学习者中断训练或在技术发展中犯重大错误;
4.不必回避犯错误,但必须及时反馈反应的正确与错误,给予机会纠正;
5.保持技巧的最有把握的方法是掌握之后就付诸实践,重复实践可以使技巧操作自动化;
6.有时学会一种技巧可以有助于第二种技巧学习,条件是后者要与前者相类似。
七、学习过程的复杂性
(一)学习理论的对立统一
行为主义学派倡导条件反射理论,长期在心理学中占统治地位;格式塔的顿悟说演变成认知学习论与社会学习论;而后逐渐生成现代认知心理学派。
(二)学习过程的多因素解释
研究者只能通过外在的行为改变来构想内在的学习过程,而学习的研究者又是来自各个学科领域,以自己的学科知识来理解和解释自己的实验,并由此来构想学习过程。因此产生了学习过程的多种因素并存。