当代教育心理学(第三版):第五章 行为学习理论(学习笔记)
Phoenix-E
编辑于 2025年04月29日 08:15
收录于文集
共6篇

第五章 行为学习理论

第一节 经典性条件作用理论

一、巴甫洛夫的经典性条件作用理论

俄国生理学家伊凡·巴甫洛夫(Ivan Pavlov,1870-1932)是最早提出经典性条件作用的人。他在研究狗的消化现象时发现,如果随着食物反复给一个中性刺激,如摇铃,狗狗会逐渐“学会”在摇铃而没有食物时分泌唾液。 经典条件作用:一个新刺激替代另一个刺激与一个自发的生理或情绪反应建立联系。 第一信号系统:凡是能引起条件反应的物理性的条件刺激叫做第一信号系统。 第二信号系统:凡是能引起条件反应的以语言符号为中介的条件刺激叫做第二信号系统。

无论是巴甫洛夫、经典条件作用还是他的狗,在心理学领域中都占有及其重要的地位。在这里面涉及比较的名词概念,建议和着实验一起记忆,在实验中食物、狗分泌唾液、铃声、灯泡等等内容都可以与上述概念进行一一对应。在这里面(经典)条件作用的概念最为重要。

关于上述内容还有以下补充理解:①条件刺激的形式多种多样,只要能够跟无条件刺激在时间上结合,都可以成为条件刺激。②条件作用的消退不是消失而是暂时受到抑制,消退的快慢与巩固强度有关。③泛化与分化的关系密切,泛化可以看做是一种不成熟的条件作用,而分化是强化后的结果(虽然强化是斯金纳提出来的,但这里已经是强化的表现)。④第一信号系统与第二信号系统都是说的条件刺激和条件反应,只是前者指的是具体的物理刺激,而后者是抽象的语言符号系统,用柠檬举例子,看到柠檬流口水和谈到柠檬流口水就是两者的区别。(看到柠檬流口水这并不是无条件反应刺激哦,它不是先天就有的,是后天我们习得)

二、华生的行为主义

J.B.华生(John B. Waston,1878-1958)是美国第一个将巴甫洛夫的研究作为学习理论基础的心理学家。他提出,学习的实质就是通过建立条件作用,形成刺激与反应(S-R)之间联结的过程,从而形成习惯,习惯的形成遵循频因律和近因律。

华生也做了实验来支撑他的理论——婴儿恐惧实验。华生理论的突出作用就是将巴甫洛夫的经典条件作用,引入了人类行为研究,

1913年华生发表的论文《行为主义者心目中的心理学》标志着行为主义心理学的正式诞生。

频因律指的是,练习越多习惯形成越迅速;近因律则是,最近的反应更容易得到强化,强调学习过程中的“巩固”和“及时巩固”。

第二节 联结主义理论

E.L.桑代克(E.L.Thorndike,1874-1949)是美国第一个系统论述教育心理学的心理学家。他通过“猫开迷箱”的实验提出了联结理论,他认为学习的实质在于形成刺激—反应(S-R)联结,学习的过程是通过盲目试错的渐进过程,联结的形成依赖效果律 桑代克的三大学习律:准备律、练习律、效果律。 准备律是指个体在学习开始时存在预备定势;练习律是指S-R联结在奖励的作用下练习和使用得越多,联结就越强;效果律是指在一定情境下产生满意效果的行为倾向于在这一情景反复出现(核心)

我们先说一说巴甫洛夫、华生和桑代克的关系,首先巴甫洛夫其实不是心理学家,他是一位生理学家,他的经典条件作用是被华生引入心理学从而成为行为主义心理学的重要理论基础,其次桑代克的联结理论是要早于华生的经典条件作用理论的,因此桑代克可以看做是行为主义的先驱。

再来看一看联结主义、经典条件作用和操作条件作用的关系,无论他们怎么解释学习/行为的产生,都是在研究外在的行为,并都注意到了“刺激和行为”的关系,但他们的解释路径存在极大的差异,①联结主义的学习实质是“通过试错建立S-R的联结”,依赖效果律,②经典条件作用的学习实质是“中性刺激与无条件刺激的配对”,是一种被动的条件反射,③操作条件作用则强调“行为后果改变行为频率”,即“R-S”与“S-R”相反,注重强化作用。

此外,联结主义特别强调“奖励”对学习的作用,从这一点看,联结主义与操作行为主义的联系更紧密。

最后需要注意的是,虽然刺激和反应都用到了三种行为主义理论当中,但他们的具体内涵略有区别,在联结主义当中,刺激指环境中的客观条件,反应指个体主动的操作行为;在经典条件作用当中,刺激是激活行为的事件,反应是对刺激的回应行为;在操作条件作用当中,刺激是行为之后的强化,反应是主动的操作行为,本质上刺激是能够诱发行为的外在因素,反应是个体的行为

第三节 操作性条件作用理论

一、斯金纳的操作性条件作用

新行为主义的代表B.F.斯金纳(B.F.Skinner,1904-1990),以严格的动物实验(斯金纳箱)为基础,系统阐述了操作性条件作用,简单来说,操作性条件作用是指个体通过主动行为与环境互动(R),其行为结果(S:强化或惩罚),影响该行为未来出现的频率。 他认为所有的行为可以分为应答性行为和操作性行为,对应应答性条件作用(经典条件作用)和操作性条件作用。 两个一般原则:①任何反应如果随之紧跟着强化刺激,这个反应就有重复出现的趋向。②任何能提高操作反应率的刺激都是强化刺激。

操作条件作用于经典条件作用的实现路径可以说是完全相反,前者是被动的S-R的联结,后者则是主动的R-S强化。

二、强化理论

强化:凡是能增强反应概率的刺激和事件都叫做强化,相反则是惩罚(即降低反应概率)。强化可分为正强化负强化,一级强化和二级强化,惩罚可分为Ⅰ型惩罚Ⅱ型惩罚(见下表)。 一级强化是满足人基本生理需求的强化,如食物,二级强化则是一个中心刺激与一级强化反复结合,获得自身强化效力的强化,如金钱。 在强化时可以使用普雷马克原理也称“祖母原则”,即用高频的活动作为低频活动的强化物,例如吃鸡腿强化吃青菜,玩手机强化做作业。

强化与惩罚的区分已经说得很清楚了,一定要区分,非常重要。这里我们区分一下奖励和强化,他们的共同点都是增强行为发生频率,不同点在于,奖励是一种满意状态,而强化是一个中性刺激,不过在现实情境中,两者在使用频率上相差不大。

其次,强化物的选择和强化的效果因时因人而异,有些时候需要针对性使用。

二、强化程式

强化程式又称强化程序,是指反应受到强化的时机和频次。 强化程式可分为连续强化程式断续强化程式,断续强化程式根据时间和比率、固定和变化两个维度又可分为固定时距程式(定时)固定比率程式(定比)变化时距程式(变时)变化比率程式(变比)

不同的强化程式在行为习得中发挥着不一样的作用:①连续强化程式对于新行为的习得最为有效。②断续强化程式在行为反应率和持续性上表现更好。③定时强化程序由于时间确定,所以很明显具有接近时间点反应率迅速上升,离开时间点反应率迅速衰退的“扇贝效应”。④变比强化则对维持稳定和高反应率最有效。

因此,在强化时应该遵循三个原则:①教授新任务时要进行即时强化,不要断续强化。②对比较正确的反应优先强化,逐渐过渡到断续强化。③确保强化的方向正确,不要强化不希望出现的行为。在班级管理当中这三个原则的体现非常直观。

三、行为的学习

(一)新行为的塑造

行为塑造:斯金纳认为教育就是塑造行为,塑造是指缩小与期望行为差距的强化过程,具体的操作是使用连续接近的方法,一步步强化越来越类似于期望行为,直至强化最终期望行为。 在行为塑造时要遵循这么一条原则:学生必须在他们能力所及的行为范围内得到强化,同时,这些行为又必须能向新的技能延伸。 行为塑造技术包括:顺向连锁和逆向连锁两种。顺向连锁指,行为的塑造过程从第一步开始,每次只训练一步行为,从前往后将所有单步行为连接起来,最终学习者获得整个复杂行为;逆向连锁则相反。

 塑造什么样的人?这其实一直是教育核心问题之一。行为主义特别关注人的行为习得,自然从他们的角度,教育就是交给学生一些值得掌握的行为习惯,即行为塑造。

行为塑造有一个初始状态,即学习者开始学习前的行为(水平)状态,有一个目标状态即最终教育着们想让学习者达到的最终行为(水平)状态,这个塑造过程有顺向塑造,也可以逆向塑造。逆向塑造相比顺向塑造更能一窥最终行为全貌,顺向塑造比逆向塑造可能会在塑造操作上更加简单。

行为塑造的原则包括两方面的内容,第一要关注学生可达到的上限,任务的难度要适中,第二,要保证塑造行为的过程是在前进的,简单的重复达不到行为的塑造结果。

(二)行为的消退和维持

消退:消除强化从而消除或降低某一行为的过程。 维持:减弱甚至停止强化之后行为的持续。

这其实还蛮有意思的,消退或者维持似乎都是由于“强化降低”导致的,其实完全不一样,消退是由于不施加强化而使该行为被忽视从而降低该行为的出现,维持则是由于先前足够的强化,使某行为保持一定的水平,可以说是截然相反,一个不强化,一个是已经强化过了。

先来说说消退,消退从操作上来讲并没有想象中那么容易,一方面不是所有人在看到问题后能管住自己不管的,看到错误-纠错,这是大部分老师的职业通病,其实这是对错误行为的另类强化,因为你强化的不是这个错误行为,而是行为背后的得到(权威和群体)关注,这个要结合社会文化理论来解释;另一方面消退的效果其实没有那么突出,因为环境中不只是老师存在,还包括学生自己的内强化、社会强化、同伴强化、家庭强化等等,对于课堂来讲除了教师自身以外,同伴的力量也是不可忽视的;最后某些行为习惯是很顽强的,不是一次两次或者说单纯靠消退能自然解决的,借助认知调节、班级建设等手段也是很有必要的。

再来说说维持,其实维持没什么好说的,在强化程式那里我们已经了解了各种不同的强化程式所拥有的维持能力,这里主要说两点,第一点是内在强化,即行为本身带来的强化,也就是说学习者在该行为时会受到这个行为强化,无需外在强化(奖励),自己就能强化自己从而维持高水平,第二点是行为水平的维持还受到动机态度情感等方面的影响,最后也是前面在强化程式提到的一点,在新行为的学习中注意各种强化程式的有序使用(抵制消退),从而保持稳定高效的行为水平。

(三)行为的分化和泛化

分化:操作性条件作用的分化是指,知觉先前刺激(s’)的差异并对这种差异做出反应,其中先前刺激也称线索,是行为之前的刺激,这些先前刺激告诉或暗示了个体行为的后果,因此操纵性条件作用的完整公式应该是(s’)-R-S。 泛化:操作性条件作用的泛化是指,将行为、技能、概念从一个情景或任务向另一个情景和任务的迁移。

简单来讲分化就是“见人说人话,见鬼说鬼话”,一些在行为之前的信息、信号、事件等内容,其实就已经在暗示或者明示“这么做的后果”了,例如你的同桌因为下午体育课被占了在哭泣(先前刺激)—你去告诉他周末要补课(你的行为反应)—哭得更厉害了(后果刺激),根本不用走到第二步,第一步我就知道如果我走了第二步,第三部会发生什么。

泛化其实和我们日常口中的“应用”差不多,一般会发生在相同或相似的情境之中,当然泛化的发生不仅仅要依靠自然过程,这也是需要训练的,分化就更是了。

最后区别一下经典条件性作用的消退、分化和泛化,详见上表。

第四节 社会学习理论及行为主义新进展

班杜拉(Bandura,1925.12.4 -2021.7.28),新行为主义的代表人物,社会学习理论的创始人,他的理论接受了大部分行为主义理论的大部分原理的同时,更注重线索对行为、对内在心理过程的作用,强调思想对行为,行为对思想的作用,因为他关注信念、期望、记忆以及自我强化等认知因素在社会学习过程中的作用,后来也被称为社会认知理论,他的理论在行为派和认知派之间架起一座桥梁。

一、社会认知理论

社会认知理论认为,儿童通过观察他们生活中重要人物的行为而习得社会行为,这些观察以心里表象或其他符号表征的形式储存在大脑中,来帮助他们模仿行为。 交互决定观:个体、环境与行为相互影响。 学习与表现:学习与表现,或者说知识的获得与基于知识的可观察的操作表现,是两种不同的过程。人所知道的远比表现出来的多,是否将行为表现出来与动机、兴趣、外在刺激、觉察到的需求、生理状况、社会压力以及社会竞争等因素有关,另行为后果不会直接影响表现和学习,它们影响的是对表现后果的预期,而影响学习的是这种预期。 参与性学习与替代性学习:参与性学习是指通过实际行动并体验行为后果而进行的学习;替代性学习是通过观察别人而进行的学习。

社会认知理论继承了行为主义种的一些理论,例如环境刺激对行为的作用、行为后果对行为的作用,学习是塑造行为等,但是班杜拉并没有用这个理论来解释行为的发生(表现)和行为的习得(学习),而是使用了“认知”这个内在的中间变量,是个人对行为结果的认知影响了学习,从而影响行为。举一个完整的例子,为什么被告知“踢打充气娃娃会获得奖励”,儿童就表现出更多的攻击性呢?不是奖励带给他的,而是认识到“踢打充气娃娃”和“奖励”之间的这种关系、或者获得奖励的预期激发动机,促进学习和行为的产生。

也就是说,人们会学习并表现那些能够带来理想后果的行为。

二、观察学习

班杜拉将观察学习分为了四个过程:注意过程、保持过程、复制过程和动机过程 注意过程:学习者会注意和知觉榜样情景的各个方面。与自身相似、优秀、热门和有力的榜样更容易被观察,有依赖性、自身概念较低或焦虑的观察者更容易产生模仿行为。 保持过程:学习者们记住他们从榜样情境中了解的行为,所观察的行为在记忆中以符号的形式表征—表象和言语。 复制过程:复制从榜样情景中观察到的行为,即将个体的符号表征转为适当的行为。在这个过程中,个体要选择和组织反应要素,还要进行自我观察和矫正反馈。 动机过程:学习者获得表现所观察行为的强化过程。动机过程存在三种强化:直接强化、间接强化和自我强化。间接强化是指观察者看到榜样受到强化而强化;自我强化是指,观察者依照自己的标准对行为做出判断后进行的强化,这依赖于社会传递的结果 自我调节:班杜拉假设,人们能观察他们自己的行为,并根据自己的标准进行判断,并由此强化或惩罚自己。

①在观察学习的过程当中,榜样是及其关键的一个要素,是观察学习的起点。②复制过程即行为表现过程,在这个过程当中学习者要尝试回忆自己在观察情境中学习到的内容,并尝试组织这些要素并还原,学习者观察自己的表现并做出相应地矫正。③动机过程其实就是强化过程,但这种强化不增强行为,而是提供信息和诱因,增强动机。④自我强化依赖于社会传递的结果,是因为个体强化的内在准则来源于社会。

三、观察学习的应用

(一)教授新行为、技能、态度和情感

学生通过观察学习能够学习到新的行为、技能、态度和情感,这意味着:首先要将这内容转换为明确可观察的外显行为方式,其次要树立一个值得模仿的观察榜样,这个榜样由教师担任最为合适,同时不仅仅是行为,还有态度和情感也能传递到学生端。

(二)监控学生习得行为的表现

去抑制效应:个体看到榜样因做出原来自己受到抑制的行为而受到奖励时,加强这种反应的趋向。 抑制效应:个体看到榜样因得到惩罚的结果,减弱这种反应的趋向。 社会促进效应:学习者通过观看榜样行为引发其行为库中已有的反应。

总结成一句话就是“榜样的力量是无穷的”。

四、行为主义新进展

行为主义的新发展就是将认知过程融入行为主义的框架之中。

注意:认知行为主义如果非要划分派别,还是属于行为主义,主要看框架,例如班杜拉的社会认知理论,本质上来看没有脱离行为主义的框架。

(一)自我管理

训练学生监视自己行为并做出评估再改进。

(二)自我言语训练

由于内在的言语影响认知和引导行为,所以个体的行为可以在自己的言语指导下完成。这种言语指导会经历外在—内在,有声—无声的发展阶段。自我言语训练广泛应用于各种行为矫正和认知学习当中。