奖赏的隐蔽代价

有位老人住在靠海边的一座房子里，每天，他都坐在那里享受惬意的海风和迷人的黄昏。刚开始的一段时间里，这里非常安静，但不知道从哪一天开始，住在附近的几个孩子总爱到这里玩乐。他们整天在那里互相追逐打闹，喧哗的吵闹声经常让老人无法好好休息。于是，老人不时的出来阻止，但似乎根本就不管用，每次劝阻之后，他们又会反复前来这里继续打闹。

有一天，老人想到了一个办法，于是，他把孩子们都叫到一起，然后拿出一些零钱，并告诉他们，谁叫的声音越大，谁得到的报酬就越多。于是，这些孩子就在那里拼命的叫著。而老人也根据孩子们每次吵闹的情况，给予他们不同的奖励。

但这种情况一直延续了一周之后，来这里吵闹的孩子们已经习惯了这种获取奖励的方式。这时候，老人开始逐渐减少所给的奖励，有的孩子就不同意了，他们觉得不应该减少自己的奖励。但无论他们怎么说，老人始终不妥协。孩子们没有办法，觉得奖励虽然少点，可也总比没有奖励要强得多了。

结果，又经过了一周左右之后，老人拒绝了向他们支付奖励。最后无论孩子们怎么吵，老人一分钱也不再给了。于是，孩子们全都认为这实在是太可恶了，自己受到的待遇越来越不公平，觉得“不给钱了谁还给你叫，那样不是自己吃亏吗？”从此之后，孩子们再也不到老人所住的房子附近大声吵闹了，即便有时候路过老人住的地方，也全都静悄悄的离开了，他们认为，就应该这样报复老人对自己的不公平。

这个故事有意思吧，故事结局是符合心理学原理的，老人提供了一个虽然说服力并不是很强，但对孩子却有足够吸引力的理由，把这些孩子引进了一个心理学上的一个盲点，使他们如果只用外在理由（得到报酬）来解释自己的行为（吵闹），那么，一旦外在理由不再存在（没有报酬了），这种行为也将趋于终止。这一现象在心理学上有一个专门的名词，叫做“奖赏的隐蔽代价”。

从心理学角度上说，奖赏的本质就是强化。我们看马戏团动物的表演，当动物能够正确的完成任务时，便会得到食物作为奖励，而得到了食物奖励的动物又会更加投入的表演，这道理与给工作中表现出色的人员颁发奖金的道理是一样的。

如果细分的话，强化有两种，一种被称为正强化，或积极强化，它是指在被试已经做出适当的反应之后，呈现奖赏性的刺激，也就是说给予对方想要的或者喜欢的东西：比如：小孩子考试得了满分，给他一份礼物：或者当鹦鹉答对了问题时，给牠一颗糖。呈现奖赏刺激的目的是为了让被试能更多的去做他们正在做的事情，科学的说，就是使反应的频率增加。另一种强化被称为负强化，或消极强化，它是指被试做出适当的反应之后，撤走伤害性的刺激。需要注意的是，这也是带有奖励性质的，比如：一个囚犯在监狱中表现良好获得了减刑。正强化与负强化其实是一致的，它们都是在某一种行为的出现后给予奖赏，达到了鼓励这种行为的发生以及巩固这种行为的作用。

心理学家的实验也证明，来自外部的报酬会削弱一个人的内在动机。一九七一年，德西和他的助手以学生为实验对象者，请他们分别单独解决测量智力的问题。

实验分三个阶段：

第一阶段，每个实验对象者自己解题，不给奖励；

第二阶段，实验对象者分为两组，实验组每解决一个问题就得到一美元的报酬；

第三阶段，自由休息时间，实验对象者可以自由活动。目的存在考察实验对象者是否维持对解题的兴趣。

最终结果显示，与奖励组相比较，无奖励休息时仍继续解题，而奖励组虽然在有报酬时解题十分努力，而在不能获得报酬的休息时间，明显失去对解题的兴趣。

实验说明，人们为了使自己的行为看起来合理，人们总是喜欢为发生过的行为寻找原因。在寻找原因的过程中，还往往是先找那些显而易见的。如果找到的理由足以对行为做出解释，人们也就不再往更深处追寻了。

说完了奖励，我们再谈谈心理学意义上的惩罚。负强化是透过使一个伤害性刺激停止而加强某种行为。惩罚的原理是透过呈现一个伤害性或不愉快的刺激去抑制某一种行为，比如当孩子说脏话时母亲走过去斥责他。但是惩罚技术并不是很容易把握的。譬如：母亲没有意识到母亲的关注（放下手中的工作本身意味著一种关注）对孩子恰恰又是一次奖赏，当奖赏伴随著轻微的惩罚同时出现时，它反而巩固了孩子的不良行为。

还有一个重要的问题是惩罚往往只是把不良行为暂时压制而不是实质性的消退它，当惩罚的影响消失后，它便会再一次出现，而且也许表现得更顽固也更剧烈。此外，严厉的惩罚还伴随著其他的副作用，其中最具破坏性的就是，惩罚会使得行为的控制方与被控制方之间的互动出现裂痕，只是一味的惩罚却没有相对的指导，甚至会引发某些神经官能症。因此，心理学家与教育学家提倡使用一种被称为“对抗性条件作用”的方法，即寻求以一种习惯取代另一种不好的习惯，而不是简单粗暴的谋求消除某一种习惯。

当然，惩罚作为行为控制技术的一种，仍然有著其特殊的效力，心理学家洛根曾为适当的惩罚拟定了几条原则，包括：

惩罚不能太轻，太轻的惩罚无异于鼓励。如果一个杀人犯最后却只被判罚款，显然结果只会适得其反。
如果有可能的话，应该立即惩罚。当然，如果能在不良行为反应的那一瞬间惩罚效果是最好的。比如：在客人面前跷起二郎腿十分不雅观，因此在他正在举动时，就应该马上惩罚以消除反应。
如果不能立即给予惩罚，那么应该重现原来的情况，或者类比当初的情景，并要求被惩罚者做出一个与不良的反应不相容的反应。比如：有的人进屋脱鞋后，喜欢把鞋子乱扔，这个时候就应该让他重新穿好鞋子，离开房间，然后重新进来，脱鞋，并把鞋子放好才行。在这种情况下，简单的训斥或责骂都无助于良好习惯的形成。
不应在惩罚后再次奖赏。有许多人会犯这种错误，结果使惩罚与奖赏之间形成联系，不良习惯更加顽固，难以消退。
不要为了个体不能自己控制的行为而实施惩罚，同时也要注意给受罚者提供一个其他的选择。有许多行为的背后有著种种复杂的原因，比如：尿床、含手指，是青春期以前的儿童很容易发生的不良行为，父母往往会为此而责骂甚至责打孩子。但是有许多孩子是因为无法习得因膀胱紧张而醒来的反应，这时去看一下心理门诊才是上策，单纯惩罚不会有任何效果，反而会引起孩子的焦虑与紧张，同时也更难改掉这一毛病。

知识窗

在日常生活中，奖励与惩罚是我们运用的最为普遍的两种行为控制技术。美国前总统希欧多尔．罗斯福曾把自己的外交政策比喻为“胡萝卜加大棒”，可以说非常形象的道出了奖赏与惩罚交替作用的奥秘。