从此走进深度人生 Deepoo net, deep life.

丹尼尔•卡尼曼《思考,快与慢》35-38

第五部分  两个自我

第35章 体验效用与决策效用的不一致

一直以来,“效用”这个术语有两种不同的含义。杰里米·边沁(Jeremy Bentham)在他的《道德和立法原则引论》(An Introduction to the Principles of Morals and Legislation)中用了这样一句名言作为开头:“大自然让人类处于‘痛苦’和‘快乐’这两者的主宰下。它们指明了我们应该做什么,并决定了我们应该怎样做。”在这本书的脚注中,边沁为用“效用”来表示这些体验而道歉,说自己找不到更好的词了。为了和边沁对这个术语的解释区分开来,我现将称其为体验效用(experienced utility)

在过去的100年里,经济学家总会用同样的词去定义别的东西。经济学家和决策理论家在使用上面那个术语时,想要表达的是“想要能力”(wantability)这层意思,而我对此往往会用“决策效用”(decision utility)来表达。例如,期望效用理论就是控制决策效用的合理性原则,它与快乐体验没有关系。当然,若人们想要的正巧是自己喜欢的,喜欢的也是自己所选择的时候,“效用”的这两种含义就一致了。在经济主体都是理性的总体思路下,这种关于含义一致性的假设是内隐的。人们希望理性的经济行为人知道人们对现在和未来的看法,还希望他们作出将大众利益最大化的正确决定。

如何测量体验效用?

我研究体验效用和决策效用之间可能存在的差异性已经有很长的时间了。当我和阿莫斯致力于前景理论研究的时候,我设计了这样一道测试题:假设某人每天都要接受一次痛苦的注射。原计划注射20天,现减至18天,请问人们对这种减少的感觉与从6天减少到4天一样吗?

若不一样,你能说出理由吗?

我没有收集结果数据,因为结果很明显。你也可以自己验证一下,若能将注射天数减少1/3(即从6天减到4天),而不是1/10(即从20天减到18天),人们往往愿意付出更多。在第一种情况下避免两次注射的决策效用要比在第二种情况下大,并且相较于第二种情况,人们都愿意为第一种情况付出更多。但是,这种区别是荒谬的。如果痛苦每天都是一样的,则按应该注射的次数而言,为两种减少的注射量分配不同的效用又有何道理呢?用我们今天的话说,这个测验题告诉我们:体验效用可以用注射次数来衡量。而且,至少在某些情况下,体验效用可用做评估决策的标准。决策者若想得到同等的体验效用(或免于遭受同样的损失)却分配出不同的效用是种错误。你可能会发现这种情况很明显,但是在决策理论中,判断决策是否错误的唯一标准就是看这个决策和决策人的其他偏向是否一致。我和阿莫斯一起讨论了这个问题,但是我们没有深入研究。多年以后,我又开始思考这个问题。

怎样衡量体验效用?怎样回答像“在治疗过程中,海伦承受了多大的痛苦”或者“她在沙滩上待了20分钟有多享受”这样的问题?英国经济学家弗朗西斯·埃奇沃思(Francis Edgeworth)早在19世纪就对此类问题作了推测,并提出发明“快乐测量仪”的想法,这种仪器可衡量出一个人所经历的快乐或痛苦的大小。

体验效用是会变化的,就像每天的温度或气压那样,其结果将被绘制成时间函数。海伦在治疗过程中或休假期间经受了怎样的痛苦或快乐就像是“曲线下的区域”。时间在埃奇沃思的构想中起到了关键的作用。如果海伦在沙滩上待了40分钟而不是20分钟,并且她很享受,则此时她的总体体验效用就会翻倍。就像注射次数加倍会使治疗时注射的痛苦翻倍一样。这就是埃奇沃思理论,现在我们对于他的理论的构建情景有了更准确的理解。

图15是我和唐·雷德梅尔(Don Redelmeier)为一项研究而设计的,是关于两名病患经历的痛苦的结肠镜检查数据。雷德梅尔是多伦多大学的医生和研究者,早在20世纪90年代,他就将这项实验提出来了。现在,做这个手术时常会辅用麻醉药物和健忘症药物,但是在我们收集数据时,这些药物还未被广泛应用。实验中,每60秒我们就要求这些患者说出他们当前的痛苦程度。这些数据用一个范围的值来表示:零表示“没有任何的痛苦”,10表示“无法忍受的痛苦”。正如你可以看到的,在此过程中,每个患者的体验有很大的改变,患者A的体验持续了8分钟,患者B持续了24分钟。(过程结束时记录的数据则为零)。此实验共有154位患者参加,最短的过程持续了4分钟,最长的有69分钟。

图15

接下来请思考一个简单的问题:假设研究人员使用相似的疼痛范围值对两位患者的疼痛感进行测量,哪一位患者的疼痛感更强呢?无可争议,人们普遍认同患者B会承受更大的痛苦。痛苦程度相同时,患者B不会比患者A所承受的时间短,对于B来说,“曲线下的区域”显然比A的要大。当然,关键因素是B的痛苦过程持续时间更长。这些测量数据都来自瞬时疼痛的“快乐测量值”。

当实验结束时,我们要求受试者评估整个过程中感受到的“痛苦”。图中的文字是为了帮助受试者回想他们感受到的全部痛苦,以及进而产生的快乐测量值。令人惊讶的是,患者没参加过类似的实验。统计分析揭示了两个结果,解释了我们在其他实验中观察到的模式:

·峰终定律(peak-end rule) (指对一件事物的记忆仅限于高峰和结尾,事件过程对记忆几乎没有影响。高峰之后,终点出现得越迅速,这件事留下的印象越深刻):整体的回顾性评级可通过将最糟糕时期和最后时刻的疼痛程度的平均加权而评估出来。
·过程忽视(duration neglect):过程的持续对所有疼痛的评估没有任何影响。

现在你可以将这些规则应用到患者A和患者B的情况中。最糟糕的评估(8~10)对这两位患者来说是相同的,但患者A在过程结束前的最后评估是7,而患者B只是1。因此,对于患者A来说,峰终的平均值是7.5,而患者B只有4.5。正如预期的那样,患者A在此期间比患者B更痛苦。对于患者A来说,结束时也是个糟糕的体验,这真的很不幸,完全没有愉快的记忆。

我们现在陷入了困境:测量体验效用有两种方法,即快乐测量值和回顾性评级,但这两种方法从系统角度而言是不同的。快乐测量值是有观察员从他人不同时刻的体验报告中计算出的数据。我们将这些判断称为过程—权衡,因为在计算“曲线下的区域”时,对各个时刻都作了相等的权衡:在疼痛强度为9时,两分钟的疼痛是一分钟的两倍。然而,本实验和其他研究的成果表明,回顾性评级对过程并不敏感,而且,相比于其他时刻,回顾性评级会权衡两个单一时刻,即高峰和末端。所以,哪一个更重要呢?医生应该怎样做呢?这种选择对医疗实践有所启示,我们注意到:

·如果目的是为了减少患者的痛苦记忆,那降低最为疼痛时的疼痛感就比将疼痛的过程减到最短更为重要。同样的道理,如果患者在过程结束时感到的疼痛相对较轻,他对此过程的记忆就会更好,那么逐渐减轻疼痛比急剧减轻更可取。

·如果想减少实际体验到的痛苦,迅速完成这个过程或许更合适,即使这样做会让患者更疼痛并给患者留下可怕的记忆。

你认为这两个目标哪一个更好?我没有作调查,但我认为会有很多人选择痛苦记忆较少的那个。我觉得将这种困境看做是两个自我之间的利益冲突会更容易理解一点(这与我们所熟悉的两个系统不符合)。经验自我是回答“现在疼吗”这种问题的,而记忆自我则是回答“总体如何”这种问题的。我们只有通过记忆才能保存生活体验,因此,在我们思考生命时,唯一能采取的观点来自于记忆自我。

我曾作过一个关于将记忆和体验区分开的困难的演讲。结束后,我听到了一名观众的评论。他说聚精会神地听唱片中的交响乐时,由于光盘有刮痕,快结束时产生了令人厌恶的声音,糟糕的结尾往往“毁了全部的体验”。但实际上毁的并非是体验,只是对它的记忆而已。经验自我几乎有了完美的经验,糟糕的结尾并不能将其抹去,因为这种体验已经发生了。这位听众将整个体验定义为失败,就因为它的结尾很糟糕,但他却忽略了40分钟的音乐带给他的快乐。实际体验真的毫无价值吗?

混乱的体验以及对此体验的记忆是种认知错觉,而对这种体验的替代让我们相信过去的体验是可以被消除的。经验自我无法表达自己的感受,记忆自我有时又是错的,但记忆自我可以记录体验,并掌控我们从生活中学到的东西,而决策也正是由这个自我做出的。我们从过去的经验中学到的就是储存记忆,这么做未必是为了未来的体验。这就是记忆自我的专制性。

记忆自我夸大了痛苦体验

为了证明记忆自我的决策能力,我和我的同事设计了一个实验,用的是温和却有些残忍的方式,我将这种方式称为冰手方式(正式名称为冷升压试验)。我们要求受试者将手浸入冰冷的水中且让冰水没过手腕,一段时间后可以拿出来,并能得到一条温暖的毛巾。受试者可用另一只手控制键盘上的左右键以不断记录自己所承受的痛苦,这种方法可作为与其经验自我的直接交流。我们选择的水温会让人感觉疼痛,但能忍受。当然,受试者在任何时候都可以自由地移动他们的手,但没有人这么做。

每位受试者都做了两次冰手实验:

短期实验情况就是在14摄氏度的水中浸泡60秒,受试者会感到水特别凉,但还能忍受。60秒结束后,实验者让受试者把手从冷水中拿出来,并给他们一条温热的毛巾。

长期实验情况会持续90秒。其最初的60秒和短期实验的情况一样,在60秒结束时,实验者什么也不会说,但是他会打开一个阀门,让温水流入容器中。在后30秒内,水温大约会上升1摄氏度,刚好可让受试者觉察到疼痛感略有缓解。

受试者被告知会进行3次实验,但事实上,他们只经历了短期和长期两种情况,分别用不同的手。两次实验间隔7分钟。第二次实验结束7分钟后,受试者可选择是否参加第三次实验。而且第三次试验是对前面某次实验的重复,而且使用哪只手可自己决定。当然,一半的受试者用左手做短期实验,一半用右手做;一半选择先做短期实验,一半选择先做长期实验,等等。这是一个被严格控制的实验。

该实验的目的是为了在经验自我和记忆自我间引起冲突,也是在体验效用和决策效用间引起冲突。从经验自我的角度看,长期实验明显更糟糕。我们希望记忆自我会有另一种见解。峰终定律认为短期实验的记忆要比长期实验的记忆更糟,而过程忽视则认为90秒和60秒疼痛之间的区别会被忽略。因此,我们预测受试者将对长期实验会有更好的(或更不好的)记忆并且选择重复此试验。他们也确实这样做了。有80%的受试者(在做长期实验时认为最后一个阶段的痛苦减轻了)选择在第三次实验时重复长期实验,称自己愿意忍受后30秒不必要的痛苦。

那些选长期实验的受试者并不是受虐狂,也不是想使自己置身于更糟糕的体验中,他们只是犯了一个错误。如果我们问他们:“你是喜欢泡90秒,还是只是前60秒?”他们肯定就会选择短期实验了。然而,我们没有这样问,受试者只是选择脑海中自然想到的:他们选择的是记忆中不那么令人厌恶的实验。我在问他们时,他们知道两次所受痛苦哪个时间更长,但他们并没有将这种认识与实际联系起来。他们的决定是出于一种简单的直觉:即选择你最喜欢的或最不喜欢的。记忆规则决定了他们有多不喜欢这两种选择,反过来,这种不喜欢的程度又决定了他们的选择。冰手实验,就像我之前说的注射测验题,都揭示了决策效用和体验效用之间的差异。

在本实验中,我们观察到的偏向是我们在之前讲到的“少即是多”的另一个例子。其他“少即是多”的例子包括奚恺元的实验,即给低于总价值的24个盘子附加上几个盘子,因为附加的盘子中有的是坏的。还有一个例子是琳达问题,即激进的妇女会被认为更像是主张女权主义的银行出纳,而不是普通的银行出纳。其中的相似性并非偶然。系统1同样的操作特点说明了三种情况:系统1是用平均水平、规范和原型来表示集合,而不是用各条件的集合。冰手实验就是多个时刻的集合,而记忆自我会将每个时刻作为典型时刻记下来。这又会导致冲突。对于通过经验自我来评估各个时刻的客观观察者来说,最重要的是“曲线下的区域”,因为它表示的正是这段时间内受试者承受的所有痛苦,这本质上属于总结。相比之下,记忆自我保存的记忆是对代表性的时刻的感受,受到高峰和结束时刻的强烈影响。

当然,动物对整体信息的存储记忆可通过进化而得以加强,某些情况下确实是这样。对于一只松鼠来说,“知道”已储存的食物总量是很重要的,只知道存储坚果的平均量不足以让它安心。然而,一段时间里的痛苦和快乐的总量对身体来讲不是那么重要。例如,老鼠对快乐和痛苦都会表现出过程忽视。在某项实验中,老鼠会先看到一束光,之后会遭电击,老鼠很快就会对光产生恐惧感。恐惧的程度可以通过一些生理反应来测量。实验的主要结论是,电击的持续时间对恐惧没有任何影响,有影响的是电击产生的痛苦程度。

其他的经典研究表明,对老鼠大脑内的特殊区域(老鼠的大脑和人类的大脑相似)进行电刺激会产生强烈的快乐感,这种快乐感很强烈,以至于在某些情况下,老鼠(实验者可通过操纵杠杆刺激其大脑)会很兴奋,连停下来进食都不可能,最终被饿死。实验者可用不同电流强度和持续的电刺激能使大脑产生快乐的区域。需要再次强调的是,只有电流强度会起作用。在一定程度上,增加电刺激的持续时间并不会使动物更能感受到这种快感。支配人类记忆自我的规则有一个漫长的发展史。

记忆没那么可靠

几年前就一直困扰我的注射难题中最有用的一个想法就是:多次使人同样痛苦的注射,其体验效用可用计算注射次数的方法进行测量。如果所有的注射都同样令人厌恶,那么其中20次注射的痛苦程度会是10次注射的2倍,并且从20次注射减少至18次与从6次减少到4次给人们带来的减少痛苦感受的程度是相同的。如果决策效用与体验效用不相符,那么肯定是决策出错了。冰手实验也体现了这样的逻辑:持续90秒浸在冷水里比其前60秒在冷水里更痛苦。如果人们愿意选择忍受较长时间的浸泡,则说明他们的决定是错的。在我之前遇到的难题中,决策和体验之间的差异源于越来越小的敏感度:18次和20次之间的差异并不是很明显,似乎还没有6次和4次注射之间的差异明显。在冰手实验中,这种错误则反映出了记忆的两个原则:过程忽视和峰终定律。这些机制虽然不同,但结果却是一样的:决策与体验不协调。

决策不会产生最有可能的体验,对未来感觉的预测也会是错的,这对于相信选择中是有理性的人来说不是好消息。冰手实验的研究表明,我们不能完全相信我们的偏向会反映出自身的爱好,即使这种偏向是基于个人经验的,甚至那些经验的记忆是刚刚才建立的!品位和决策受记忆影响,但记忆可能是错的。因此,像“人们的偏向不会改变,且知道如何让偏向达到最大值(这是理性代理人模式的基础)”这种说法就会受到质疑。我们的大脑在运作时,常会出现不一致的情况。我们对痛苦和快乐体验的持续时间有着强烈的偏向。我们希望痛苦的时间缩短,而愉快的时间能够延长。然而,我们的记忆(系统1的作用)已变成痛苦和快乐的最强烈感受(高峰时)以及感受结束时的自身感觉。忽视过程的记忆不会为我们的偏向带来长期的愉快和短暂的痛苦。

示例—体验效用“你完全是从记忆自我的角度思考你失败的婚姻的。离婚就像是以刺耳的音符结束的交响乐。事实上,它虽然结束时很糟糕,但这并不意味着整首交响乐都那么糟。”“这是关于过程忽视的一个负面例子。尽管好的体验的时间要比不好的体验时间多10倍,但你还是将好的体验和不好的等同并加以权衡了。”

第36章 人生如戏

在我研究的早期,我看了威尔第的歌剧《茶花女》(La Traviata)。这部歌剧以华丽的音乐著称,讲述了一位年轻贵族与出身风尘的薇奥莉塔之间动人的爱情故事。这个年轻人的父亲因为想要保护家族声誉,不希望薇奥莉塔的出身妨碍到自己女儿的婚姻,便找到薇奥莉塔并劝她离开自己的儿子。于是,薇奥莉塔假装不爱自己的心上人了,拒绝了他。后来,她的肺结核开始复发。在最后一幕中,薇奥莉塔即将死去,她躺在床上,周围有几个朋友。薇奥莉塔的爱人知道了她病危的消息,匆匆赶往巴黎。而她在听到这个消息后,也仿佛看到了希望,感受到了喜悦,尽管她的病情还是在快速恶化。

无论你看了多少次这部歌剧,还是会为这个紧张而危险的时刻揪心:这位年轻的爱人会及时赶到吗?对他来说,在薇奥莉塔死之前与她团聚有着重要的意义。当然,他做到了,美妙的爱情二重唱响起,但薇奥莉塔也在这10分钟美妙的音乐过后死去。

比起整个人生,我们更在意人生的结局

看完歌剧后,在回家的路上我想:我们为什么会那么在意最后的10分钟呢?我很快意识到我忽然感到自己完全没有注意薇奥莉塔活了多长时间。如果我知道她是27岁死去的,而不是我认为的28岁,就算她错过了一年的快乐生活也丝毫不会令我动容,但是,错过了这最后的10分钟却关系重大。另外,就算我知道他们重聚后在一起的时间是一周而不是10分钟,我的情绪也不会有什么改变。然而,如果她的爱人来得太迟,《茶花女》就会是一个完全不同的故事了。故事所关注的应该是其中有意义的事件和值得珍藏的时刻,而不是时间的流逝。过程忽视常出现在故事中,故事的结局也总能将故事的角色定型。我们在叙述的规则以及对结肠镜检查、假期、电影的回忆中都能找到与这则故事相同的主要特征。这也是记忆自我的工作机制:编故事,并将其作为将来的参考保存在记忆中。

我们并非只在歌剧院才会感受到人生如同故事,并希望它会有个好结局。当我们听说一位和女儿疏远多年的妇人逝世时,也想知道她在死前是否已经与女儿冰释前嫌。我们所关心的不只是女儿的心情,而是希望这位母亲的故事更为圆满。关怀某个人通常体现在关心这个人故事的完整性,而不是他的感觉。一些事情还会改变已经去世的人的故事,这些事情也可能使我们深深动容。例如:一个男人到死都深信自己的妻子很爱他。所以,当我们听说他的妻子多年前就有了情夫,与这个男人在一起只是为了他的钱时,就会为这个男人感到悲哀。尽管,这个丈夫一生都很快乐,我们还是会同情他。若某位科学家的某项重要发现在她死后被证实是错误的,我们也会为她感到耻辱,尽管她自己并没有体验过这种耻辱。当然,更重要的是,我们都极度关注自己的人生故事,并希望故事的主角正派,结局完美。

心理学家埃德·迪耶内(Ed Diener)及他的学生们对过程忽视和峰终定律是否会主宰我们对整个人生中所作的评估感到好奇。迪耶内简要地描述了简的一生(简是虚构出来的人物):简从未结婚生子,一场车祸让她丧命,但死的时候并不痛苦。对于简的故事有这么一个版本:她一生都非常幸福(这种幸福可能持续了30年或60年),她将工作视为享受,喜爱度假,花了很多时间与朋友聚会,培养自己的爱好。在故事的第二个版本中,简的寿命被延长了5年,她于35岁或65岁逝世。迪耶内描述说简生命的最后5年很快乐,但不及从前那样快乐。每位受试者在读过其中一份为简设计好的“传记”以后,都需要回答两个问题,“纵观简的一生,你认为她的人生有多圆满”以及“你认为简的一生经历了多大的幸福或不幸”。

研究的结果进一步证实了过程忽视和峰终定律。在组间实验中(不同受试者看到的实验情景不同),将简的寿命延长一倍不会使受试者对她人生的圆满度或是整体的幸福度改变观点。显然,她的一生是由一个典型的时间段代表,与总体的时间无关。因此,她的“总体幸福”是生命中一段典型时期体验到的幸福,而不是整个生命过程中体验到的幸福。

由这个观点可以得知,迪耶内和他的学生们也发现了“少即是多”的效应。这个效应清楚地表明,平均(典型)可替代总体。若给原本一直都非常幸福的生命增加5年“还算幸福”的日子,会导致人们对这个生命总体幸福度的评估大幅降低。

在我的鼓励下,他们还收集了一些组间实验数据,数据是关于增加5年寿命的影响;每一名受试者都必须在实验过后迅速作出判断。尽管我长期研究判断错误,我也不相信理性的人会作出增加5年还算幸福的日子会使生命更加糟糕的判断,然而我错了,增加那令人失望的5年会使整个生命都显得很糟糕。

这种判断模式似乎极为荒谬,所以一开始,迪耶内和他的学生们还认为是这些年轻受试者的问题。然而当这些受试者的父母和较为年长的朋友回答相同的问题时,他们的判断模式也没有发生改变。在评估整个生命以及一些有趣的事时,高潮与结尾很重要,过程通常会被忽略。

人们经常会用工作的劳累和假期的舒适来反驳过程忽视的观点:我们都有直觉,工作24小时肯定会比工作6小时累,工作6小时比工作3小时更累。过程在这些情况中似乎很重要,但实际上是故事的结尾让整个事件过程的长度发生了改变。对于前面提到的那位母亲,等24小时会比等待6小时更为痛苦和绝望;旅游者休息6小时也会比休息4小时感到更为放松。当我们用直觉来评估这些事件时,真正起作用的是现有体验的不断恶化或改善,以及这个人的最终感受。

关于上一次旅行,你还能记起多少?

请思考度假时的选择。你是希望在去年去过且很熟悉的海滩度过愉快的周末,还是想充实新的记忆?为了满足这些不同的选择,两种截然不同的行业随之出现:度假村提供了恢复元气的休闲方式;旅游业则帮助人们构建故事、收集记忆。许多旅行者会近乎疯狂地拍照,这说明储存记忆是人们旅游的重要目的,这个目的会影响我们旅游的计划和体验。照相的人并不认为当时的景色只能供自己欣赏片刻,他们将景色当做未来的记忆来收藏。照片对于记忆自我来说很有用,尽管我们很少会长时间或多次观看这些照片,有的照片我们甚至没再看过,但是拍照并不一定就是旅行者的经验自我欣赏风景的最佳方式。

很多时候我们都通过自己想要储存的故事或记忆来评估旅行。“难忘”这个词常都用来描述旅行中的亮点,明确地阐述旅行的目的。在其他情况下,我们会想到“喜爱”这个词,这是对此刻永生难忘的宣言,尽管这并不总是准确,会随着时间的变化而变化。有自我意识的记忆体验会得到重视、被赋予意义,这是其他体验无法实现的。

埃德·迪耶内及他的团队提供的证据表明,是记忆自我选择了旅行方式。他们要求一些学生记日记,记录下春假期间他们对自己经历的评估。学生在假期结束之时,还需提供自己对整个假期的整体评估。最后,他们还需说明自己是否愿意再次这样度假。统计分析说明,他们是否想要重复假期的意愿完全取决于最后的评估,即使是最后的评分也不能代表他们在日记中描述的经历,他们依然会这样选择。就像冰手实验一样,无论对错,当人们在作是否重复某个经历的决定时,他们都会由记忆作出选择。

有关你下次旅行的思考性实验能使你察觉到你对自己的经验自我的态度。
在假期结束之时,你拍的照片和录像将被全部销毁。
另外,你会服下一剂药,这剂药会消除你关于这次旅行的所有记忆。
以上情况对你的假期计划有多大影响?与普通的旅行相比,你会花多少钱在这次旅行上?

在我还没有正式研究人们对这种情境的反应之前,我曾与他人讨论过,得出的结论是,记忆的消除会大大降低这次体验的价值。有时候,人们对待自己就如对待其他失忆的人一样,他们通过回到曾令自己愉快的地方以增强自己的愉悦感。然而,许多人说他们完全不想去那些地方,这表明他们只关注自己的记忆自我,而且相对于失去记忆的陌生人来说,他们更少关注失去记忆的经验自我。许多人指出他们不会让自己或是失忆的人去爬山或是穿越丛林,因为这些体验在当时大都是痛苦的,只能靠提醒自己达成目标的痛苦与快乐都是值得的才能坚持下去。

另一个思考性实验需要你想象自己正面临一场痛苦的手术,整个手术过程你都是清醒的,别人告诉你你会痛苦地叫出来,还会请求医生停止手术。然而,你事后肯定能得到一颗“忘忧草”,彻底忘掉这件事。你对此有何看法?我无心的观察再次得出这样的结论:大多数人对于他们经验自我遭受的痛苦都是漠然的。许多人说他们毫不在乎。另一些人和我有一样的看法,我为我的经验自我感到遗憾,但遗憾的程度不会比我对痛苦的陌生人的遗憾感受强。我就是自己的记忆自我,也是自己的经验自我,两者主宰我的生活,但它们对我来说就像是个陌生人,这感觉很奇怪。

示例—谈到人生如戏“他一生正直磊落,但生命的最后一段却不得人心,为此,他要竭力维护自己的一生。”“为了能有一晚的相处时间,等多久都愿意的现象就是过程忽视的例子。”“你似乎将整个假期都用在了构建记忆上。也许你应该放下相机,享受这一刻,即使这一刻并不令你感到难忘。”“她是老年痴呆症患者。没有了人生故事,但是她的经验自我对于美与高贵依然敏感。”第37章 你有多幸福?

15年前,在我刚开始对幸福的研究感兴趣时,我发现我们对幸福的认识都是通过让无数人回答一些差别不大的问卷调查得到的,这是被普遍接受的测量幸福的方法。这些问题是为记忆自我而设计的,会使你思考自己的生活:
从各方面考虑,你对自己目前生活的满意程度如何?

在从结肠镜检查以及冰手实验的错误记忆的研究谈到幸福这个话题时,我自然而然地对生活满意度是衡量幸福程度的标准这一观点产生了怀疑。由于记忆自我对实验没有什么帮助,我将注意力集中在了经验自我的幸福感上。我提出这样的说法:“海伦在3月份很快乐。”我认为这种说法是合理的,其前提是:

她将大多数时间用在了她愿意继续、不想停止的活动上,很少将时间用在不想做的事情上。更重要的是,人生苦短,所以她也没将时间花在自己不在乎的事情上。

有许多事是我们愿意继续、不想停止的,包括心理和生理上的愉悦。我想到的海伦想要继续做下去的事情是全身心投入到某项工作中去,这种全身心投入的状态被米哈里称为心流。心流是艺术家在创作时、人们在被电影和书籍或是填字游戏深深吸引住时的一种状态。人们处于这些情境时,往往不愿被打扰。我也有过类似的记忆:我小时候,当我母亲从我手中把玩具拿走,要带我去公园时,我总会哭。在公园里,当她将我从秋千上抱走,带我去玩滑梯时,我也会哭。抗拒中断当前事情表明:无论是玩玩具还是荡秋千,我当时都正玩得愉快。

我建议测量海伦的客观幸福感要和评估两位做结肠镜手术的病人的方法一样,通过海伦对其生活中连续时刻的幸福感来评估。我采用了埃奇沃思在一个世纪以前就提出的快乐测量仪的方法。最初采用这个方法时,我认为海伦的记忆自我对实际的幸福与其经验自我体会到的真实幸福相比会更容易犯错误,因而,对其不予考虑。我怀疑自己的这个观点过于极端,后来证实这果然是极端的,但却是个很好的开始。

测量经验自我的幸福感

我召集了一个“梦之队”,其中包括除我在内的三个不同领域的心理学家以及一位经济学家。我们一起提出了一套测量经验自我的方法。不幸的是,对经验的持续记录难以实现,因为一个人不可能一边不停地报告自己的体验,一边像平常那样生活。最接近于真实情况的选择是使用经验取样法,这是由米哈里发明的方法。自首次使用以后,这个方法已经有了一定的改进。现在,我们可以通过手机来采集经验样本。具体方法是:将某个人的手机设置为在每天任意的时间响或振动,随后,手机会在打断这个受试者后,显示一些关于她正在做什么以及和谁在一起的问题。手机还会显示评定量表,以供受试者报告她各种感受的强度,这些感受有:快乐、紧张、愤怒、担心、投入程度、身体上的疼痛等。

经验取样法成本高且烦琐(尽管没有大多数人一开始觉得的那样令人烦扰,回答这些问题只需很少的时间)。因此我们需要一个更为实际的方法,所以,我们开始采取昨日重现法(Day Reconstruction Method,DRM)。我们希望这个方法可以得到接近于使用经验取样法的结果,并提供关于人们如何利用他们时间的额外信息。我们邀请受试者(在研究早期时都为女性)参与一个两小时的会议。首先,我们请他们将昨天的生活分为如同电影一样的多个片段,然后详细叙述出来。然后,他们还需回答关于每个片段的一些选择题,这些问题是基于经验取样法提出的。他们从一个列表中选择了参与的活动,并说明是哪一个活动吸引了自己最多的注意力。还列出了与他们在一起的人,并将自己几种感觉的强度划分了等级,等级范围为0~6,其中0=没感觉,6=感觉最强烈。这种方法证明,能够详细回忆过去情境的人也能重新感受到过去事情发生时的感受,甚至可以体验到他们先前对这些情绪的生理反应。

我们假设受试者能够非常准确地还原某个场景的典型时刻。几个与经验取样法进行的比对证实了昨日重现法的有效性。由于受试者还说出了各个场景开始与结束的时间,我们还可以计算出他们清醒时感受的过程权重。在对我们每天受到的影响的综合测量中,持续时间较长的场景比稍短的更有价值。我们的调查问卷还包括估测生活满意度,我们将此时的满意度理解为记忆自我的满意度。我们采取了昨日重现法研究决定情绪上的幸福感和生活中满足感的因素,受试者是几千位来自美国、法国和丹麦的女士。

单一的幸福价值很难代表某一时刻或场景的经历。积极感受有很多种,包括喜爱、快乐、投入、希望、乐趣等。消极情绪也有许多种,包括生气、羞愧、忧郁和孤独。尽管积极和消极的情绪可能同时存在,但将生活中大多数时刻区分为完全积极和完全消极还是有可能的。通过比较积极与消极的形容词的等级,我们可以辨别出令人不悦的场景。如若在某个场景中,某种消极感受比所有积极感受都要强烈,我们就认定这个场景是令人不悦的。我们发现,美国女性有19%的时间都处于不愉快的状态,比法国女性(16%)或丹麦女性(14%)都要高。

我们将个人处于不愉快状态的时间比称为U指数。例如,某个人在16个小时醒着的时间内,有4小时处于不愉快状态,其U指数就是25%。U指数并不是基于评定量表,而是基于对时间的客观测评。

各种活动的U指数也可以被测量。例如,我们可以测量出人们在交谈、工作,或是与父母、爱人、孩子交流时处于消极情绪的时间占总时间的比例。对于美国中西部城市的1 000位女士来说,晨间交流的U指数是29%,工作时交流的U指数是27%,

照顾小孩时是24%,做家务时是18%,社交时是12%,看电视时是12%,做爱时是5%。工作日的U指数会比休息日高6%左右,主要是因为人们在周末会更少将时间花在他们不喜欢的事情上,也不用承受与工作相关的紧张和压力。最令我们惊讶的是人们与孩子相处时的情绪经历,美国女性与孩子相处的时候感到比做家务还要无趣一些。法国女性和美国女性的U指数有少许不同的地方,下面是其中一点:法国女性比美国女性与孩子相处的时间少,但是更享受其中,可能是因为她们有更多使孩子受到照顾的方法,而且也不用在中午花太多时间接送孩子去参加各种活动。

人在任何时刻的心情都由他的性情和整体的幸福感决定,但情绪上的幸福也会在一天或一周之内出现巨大的波动。人在某个时刻的心情主要取决于当时的情境。例如,工作时候的心情主要不会受大体上的工作满意度(包括待遇和职位的满意度)的影响。更重要的是情境因素,例如与同事交流的机会、被噪音烦扰、时间压力(这是消极影响的重要来源),以及突然看到老板(在我们的第一项研究中,这一点是唯一一个比孤独更糟糕的因素)。注意力是关键。我们的情绪状态绝大部分取决于我们关注的事情,我们通常都会关注正在进行的活动以及直接环境。也有例外的时候,那时,主观经验的质量是由再现的想法来主导的,而不是由当时发生的事件主导的。处于恋爱中的人即使在堵车的情况下也可能感到快乐,而处于哀悼中的人就算是看搞笑电影也可能会继续悲伤。然而,在正常情况下,我们只因此刻正在发生的事或喜或悲,但前提是我们必须关注这件事。例如,从吃中得到快乐,你必须注意到你正在吃东西。我们发现法国女性和美国女性花在吃东西上的时间大约是相同的,但对于法国女性来说,她们对吃的关注是美国女性的一倍。美国人更有可能在吃的同时兼顾其他事情,所以,她们从吃中得到的快乐也相应减少。

这些观察对于个人和社会而言都是有意义的。对时间的利用是生活的一部分,是人们可以掌控的。少数人可以用意志使自己更为开朗、乐观,但是许多人可能会安排他们的生活,使自己少花些时间交谈,多花些时间做喜欢的事、见喜欢的人。由不同活动产生的感受表明,人们可以用另一种方法提高经验的质量:将消极休闲的时间用在其他事情上,例如将看电视转换为更为积极的休闲方式,包括社交和锻炼。以社会的角度来看,为劳动工人提供更好的交通条件,为职业女性提供照顾儿童的渠道以及为老人提供社交的机会等都是降低社会U指数的有效方法。即使是1%的降低也是显著的成就,因为这可以使人们避免成千上万个受苦的小时。将利用时间的全国性调查和经验自我的幸福感相结合可为社会政策提供多种参考。我们团队的经济学家艾伦·克鲁格(Alan Krueger)就是致力于将这种方法介绍给国家统计局的第一人。

幸福的方法

测量经验自我的幸福感已被普遍应用于美国、加拿大、欧洲等国的全国性测试中,盖洛普世界民意调查还将这种测试应用到了美国及150多个国家成千上万的受试者身上。这些民意调查使受试者回想起前一天所经历的情绪变化,尽管并没有昨日重现法那样详细。这个巨大的样本使得我们可以进行全面的分析,证实了情境因素、生理健康以及社会接触等对于经验自我幸福感的重要性。当然,头痛也会使人痛苦,而某人某天感受的第二个最佳参照点就是这个人是否与朋友和亲人接触。说快乐就是将时间用在你爱的人和爱你的人身上的确有一点儿夸张。

盖洛普获得的数据使我们能对幸福的两方面进行对比:
·人们生活中经历的幸福。
·当人们评估自己的生活时作的判断。

盖洛普的生活总体评价是通过名为坎特里尔自我定位奋斗量尺问题来实现的,具体如下:

请想象有一架阶梯,每级台阶都标有数字,最低一级是零,最高一级是10。最高的台阶代表你最美好的生活,最低的台阶代表你最糟糕的生活。此时此刻,你认为自己站在哪一级台阶上?

比起生活经历,生活中的某些方面会对某个人对生活的估测产生更大的影响。教育程度就是一个例子。若某个人接受过更高的教育,那他对自己生活的评估也会更高,但这并不意味他的经验自我更幸福。的确,至少在美国,教育程度越高的人压力也会越大。另一方面,身体不健康对经验自我幸福的不利影响会比对生活方面的评估大很多。与孩子生活在一起也会给日常感受带来坏的影响—有报告表明,父母普遍感到压力与愤怒,但是这对生活评估的不利影响却不大。参与宗教活动对于积极情绪与压力都有有利影响,对生活评估的影响很大。然而,令人惊奇的是,宗教并不会让人们沮丧或担心的感受有所减少。

钱可以买到快乐吗?这是人们最常问的关于幸福的问题。对45万名受试者回应的盖洛普海斯威斯幸福指数分析以及对1000名美国人的每日调查,为我们提供了惊人而又明确的答案。结论是贫穷使人悲惨,富有可能会提升某个人的生活满意度,但总体来说来却不能提高经验自我的幸福感。

极度的贫穷会增强经验对生活中其他不幸经验的感受。这尤其体现在生病上,生病对于贫穷的人来说会比家道小康的人有更糟糕的感受。位于收入分配前2/3的人中,因为头痛,原本19%说自己忧郁和担忧的个人会增长到38%。而在收入分配最后10%的穷人中忧郁和担心的人则会从38%增加到70%,其基线水平越高,增加的也越多。穷人与其他人的重大区别还体现在离婚和孤独的影响方面。另外,对穷人来说,周末对于经验自我的幸福的有利影响会比其他大多数人小得多。

当某位住在高消费地区的人的家庭收入约为7.5万美元时(此收入标准在低消费地区相应减少),他的经验自我的幸福的满足水平就不会再提升。经验自我的幸福感也会随着收入增加,但超过那个标准后,也就不会再提升了。这令人惊奇,因为更高的收入无疑能使人们获得更多快乐,包括可以在有趣的地方度假、听歌剧、改善生活环境等。为什么这些增加的快乐没有在情绪经验的报告中显示出来呢?其合理的解释为,更高的收入会削弱人们享受生活中小乐趣的能力。有证据支持这个观点:向学生过早地灌输金钱观会影响他们在吃巧克力时的快乐感受!

收入对经验自我的幸福感的影响和对生活满意度的影响有着明显的区别。我们得出的关于幸福的一般结论与结肠镜那个实验的结论一样清晰明了:人们对自己生活的评估与他们的真实体验可能有关,但也有不同。正如我几年前的想法一样,用生活满意度来衡量经验自我的幸福感并没有错。这完全是另外一回事。

示例—幸福感“客观的政策可以减少人们的痛苦。我们以降低社会的U指数为目标,解决沮丧和极端贫穷是首要问题。”“增加幸福感的最简单方法是分配好你的时间。你能抽出更多时间做自己喜欢做的事情吗?”“如果你的收入超过了满意水平,你能够拥有更多使人愉快的经历,但你将会丧失一些享受小乐趣的能力。”第38章 思考生活

德国社会经济小组成员安德鲁·克拉克、埃德·迪耶内和雅尼斯·基尔格里斯每年都会询问同一群受试者有关生活满意度的问题,以及他们在前一年经历了什么大变动。小组成员对受试者的回答进行了分析,图16就是分析的一部分,是这些受试者在每一年回答对自己结婚期间的满意度情况。

图16

生活满意度:一个很难回答的问题

图16肯定会使读者紧张地淡然一笑,这种紧张感也很容易理解:毕竟决定结婚的人不是希望婚姻能使他们更快乐,就是希望建立稳定长久的关系以维持自己目前的幸福状态。丹尼尔·吉尔伯特和蒂莫西·威尔逊引入了情感预测这个有用的名词。而对于许多人来说,作出结婚的决定就反映出了因情感预测而引起的重大错误。

即使在结婚当天,新娘和新郎都知道离婚率很高,对婚姻失望的例子更是数不胜数,但是他们还是不相信自己也会这样。

图16中最令人惊讶的是人们在结婚后的生活满意度陡然下降。这个图被普遍认为是对人们适应过程的追踪记录,在这个适应过程中,由于婚姻生活的反复,人们起初感到的婚姻带来的快乐会很快消逝。然而,以另一种强调直观判断法的方法来追踪适应过程同样可行。我们想知道,当人们正在评估自己的生活时,他们的大脑有什么样的活动。“你对自己生活的整体满意程度如何”以及“最近你有多快乐”等问题并不像“你的电话号码是多少”这个问题那样简单。所有的受试者是怎样在短短几秒内回答这样的问题的呢?结论是:将此问题想成是另一个判断会有助于回答。对于其他问题来说也是如此,有些人可能已经有了现成的答案,这个答案是他们在另一种情况下评估自己的生活时得出的。还有些人,也可能是大多数人,在不能很快想到某个问题的确切答案时,会自动地将答案替换为更为简单的问题的答案。系统1参与到了这个过程当中。当我们以这个观点来看图16时,其意义就会有所不同。

许多简单问题的答案都能由对生活的总体评估替换。你一定还记得这项研究:刚回答过在前一个月有多少次约会的学生在回答他们“最近的快乐程度”时,就会将约会当做他们生活中唯一重要的因素。在另一个基于同样目的的著名实验里,诺伯特。施瓦茨和他的同事邀请了一些受试者来到实验室,并请他们完成一份关于生活满意度的问卷调查。然而,在他们开始调查之前,施瓦茨请受试者们为他复印了一张纸。其中,有一半的受试者会发现复印机上有一个一角的硬币(是实验者预先放在那儿的)。即使是这样小小的幸运却极大地提高了受试者对于他们生活整体满意度的评估。心情启发式是回答生活满意度的一种方式。

与约会有关的调查和机器上有硬币的实验表明了我们应该对关于总体幸福度问题的回答持保留态度。当然,当别人要求你评估自己的生活时,你的大脑并不是只有当前这一种情绪。你很可能会想到最近刚发生或即将要发生的重要事件;会想到反复担心的问题,比如爱人的健康或是经常与你儿子在一起的那些坏伙伴;还会想到重大的成就和使你痛苦的失败。你可能会想到几个与总体幸福度这个问题相关的观点,但多数其他观点你还是想不到的。即使你快速得到的关于自己生活幸福感的评分不会受与之完全无关的事情(例如机器上的硬币)的影响,此评分还是会取决于少数极易想到的观点,而并非取决于对你生活中所有领域的仔细衡量。

刚结婚或马上要结婚的人当被问到对生活的整体评价时,很有可能就会联想到结婚这件事。在美国,绝大部分婚姻都是出于自愿的,几乎所有人在想到自己的婚姻或即将开始的婚姻时都会感到高兴。所以这个问题的关键就是注意力。我们可以从图16中看出当人们被问到自己的生活时,他们想到最近或即将到来的婚姻生活的可能性。这个想法肯定会随时间的流逝而越来越不受重视,因为其新鲜感会有所消退。

图16显示,人们在结婚前后一两年的生活满意度都非常高。然而,如果这种明显的涨幅反映了回答问题时启发式的时间过程,我们从中得到的关于幸福或是对婚姻适应过程的信息就会很少。我们不能由此推断出为何幸福感会在几年内提升但又逐渐下降的趋势。即使是那些在被问到关于他们生活的问题时就会想到婚姻、就会快乐的人在其他时候也未必会感到很快乐。除非他们常想到自己幸福的婚姻,否则婚姻的幸福与否并不能直接影响到他们整体上的幸福感。即使是那些足够幸运,能完全处于享受幸福婚姻状态的新婚夫妇最终也会回归到现实中,他们体验到的幸福感也会像其他人一样,再次依赖于当前自己身处的环境和参与的事情。

在对昨日重现法的研究过程中,有伴侣的女性和无伴侣女性的经验自我的幸福感在大体上并没有不同。这两类女性对时间的分配可以解释这一发现。有伴侣的女性很少独自一人,和朋友在一起的时间也很少。她们会花更多的时间在美妙的性生活上,也会花很多时间做家务或照顾孩子,这些事当然是人们不想做的。当然,对于一部分已婚女性来说,长时间和丈夫在一起会更快乐,而另一部分女性却不这么认为。平均来说,经验自我的幸福感不受婚姻的影响,原因并不是婚姻不能影响幸福感,而是其对于生活某些方面的影响对一些人来说是积极的,而对于另一些人来说却是消极的。

经验自我的幸福感和生活满意度在总体上取决于性情的遗传,这也是个人生活环境与其生活满意度相关性低的原因之一。体验幸福的性情像身高和智力那样,是可遗传的,对出生之后就分开的双胞胎进行的实验就证明了这一点。那些似乎是同样幸运的人却对幸福感的体验有很大差别。在某些情况下,例如由于平衡效应的影响,婚姻与幸福感的相关性低。这是因为,同样的情况对一些人来说是好事,对另一些人来说却是坏事,新的环境对人的影响也是有利有弊。在其他情况下,比如高收入对生活满意度的影响普遍都是积极的,但某些人可能会更在意钱,事情也会因此而变得复杂。

有人出于另一个目的,对高等教育的影响进行了大规模的研究,其研究结果显示了年轻人设定目标对其终身的影响。这些数据是由1995~1997年对近12000人做的调查问卷得来的,这些受试者都在1976年进入名牌大学读书,在十七八岁时填写了一份关于过上“富裕”生活重要性的调查问卷,从“不重要”到“必不可少”共有4个等级可供选择。他们在20年后又填写了一份调查问卷,其中涉及了他们在1995年的收入水平和对自己生活满意度的总体评价。

目标不同,结果也会有很大的不同。在写下抱负的19年后,许多希望能有高收入的人都实现了这个愿望。例如,在597位心理学家和其他医学专家的样本中,他们对金钱重要性的观点每升高一个层次,工资收入就都会增加14 000美元(1995年时的美元价值)!不工作的已婚女性也有可能实现她们对金钱的渴望。对于这些女性来说,她们对金钱的渴望每升高一个级别,就会增加12 000美元的家庭收入,这些钱显然是由她们的丈夫赚的。

人们在18岁时对钱看重的程度同样也预示着他们在成年以后对自己收入的满意程度。我们比较了高收入人群(收入超过20万美元)和低收入人群(少于5万美元)的生活满意度。对于那些认为有钱很重要的人来说,收入对生活满意度的影响更大(总分为5,其影响为0.57分);而对那些认为钱不重要的人来说,收入对其生活满意度的影响则只有0.12分。相对于普通人来说,想要且能得到钱的人对生活明显更为满意;想要却没有钱的人则对生活更为不满。同样的原则也适用于其他目标—对生活不满的成年人,解决这个问题的一个方法就是设定非常难以实现的目标。在20年后对这些受试者生活满意度的调查表明,年轻人最难以实现的目标是“在表演艺术方面功成名就”。年轻人的目标会影响他们将要经历的事、他们的未来,以及对生活的满意程度。

在一定程度上,这些发现改变了我对于幸福的看法。人们为自己设定的目标对于他们要做什么,以及对只关注经验自我的幸福感是难以维持的这一事实的感受都极为重要。幸福不是忽略人们想要得到的。此外,说幸福是忽略自己活着的真实感受而只关注自己对生活的想法也是不成立的。我们必须接受幸福是各个方面的综合体的观点,必须把记忆自我和经验自我的感受都考虑在内。

被放大了的幸福错觉

受试者在评估自己的生活时,并没有仔细思考。这个看法是由受试者回答问题的速度以及他们受当前情绪的影响程度推测出来的。他们肯定会使用启发法(替换和眼见即为事实的例子)。尽管受试者关于生活的看法会受到有关约会的问题或是放在复印机上的硬币的影响,但他们并没有忘记生活不仅仅是约会或走运。幸福的概念并不会随着突然发现一枚硬币而发生改变,但是系统1常会作为生活的一部分替代整个生活。人们所关注的生活的任意方面会在整体评估中被放大。这就是聚焦错觉的实质,下面的这个句子可以描述这一点:

在你思索某件事时,这件事就不会像你想的那样重要了。

这个概念源自一场关于从加州搬到普林斯顿的家庭辩论。在这场辩论中,我的妻子说加州的人比东海岸的人幸福。我反驳道,气候肯定不是决定幸福的重要因素,斯堪的纳维亚人可能是世界上最幸福的人。我还注意到永久的生活环境对幸福的影响也很小,但是我还是没能说服我的妻子,她依然相信加州人更幸福,这是一种情感预测的错误。

不久之后,我参与了一个关于全球变暖的社会科学的研讨会,而那个家庭辩论的话题依然在我的脑海中徘徊。研讨会上,一个同事根据他对下个世纪地球人口幸福度的观点提出了自己的看法。我反驳道,预测在一个更温暖的行星生活是何种情形是荒谬的,因为我们甚至不知道住在加州的感觉会如何。交流不久后,我和我的同事戴维·施卡德(David Schkade)得到了一笔研究资金,主要研究两个问题:住在加州的人比其他地方的人更快乐吗?人们普遍认为加州人相对快乐的程度如何?

我们召集了许多来自加州、俄亥俄州和密歇根州的学生,组成了一个大的样本。在其中一些学生的帮助下,我们得到了关于他们生活各个方面满意程度的详细报告。通过另一些学生,我们得到了关于某个“与你有同样兴趣和价值观”但却住在别处的人会怎样完成同样的调查问卷的预测。

分析了数据以后,我显然赢得了那场家庭辩论。正如预期的那样,两个地区的学生对天气的态度是不同的:加州人很享受当地的气候,而中西部人却厌恶当地的气候。然而,气候并不是决定幸福感的重要因素,甚至加州学生与中西部学生的生活满意度也根本没有任何不同。我们还发现,我的妻子并不是唯一一个认为加州人更为幸福的人。两个地区的学生都犯了和我妻子同样的错误,我们还能追溯到此错误的根源,即他们都夸大了气候的重要性。我们将这种错误称为聚焦错觉。

聚焦错觉的本质是眼见即为事实,就上面例子来看,即是对气候给予过多的权重,却忽略了其他影响幸福的因素。为了理解这种错觉强大的影响力,请花几秒钟思考下面的问题:

你从自己的车上能得到多大快乐?

你能立刻得到答案,因为你知道自己有多喜爱和欣赏自己的车。你将其替换成了另一个不同的问题:“你在什么时候能从车中得到快乐?”这个问题的答案可能会令你惊奇,但也是简单直接的:当你考虑到自己的车时,你就能从车中得到快乐(或不快)。当然,你也不会常想到自己的车。正常情况下,你平时开车时是不会花很多时间思考自己的车的,你会想一些其他的事情,而你的心情也由你所想的事决定。当你尝试评估自己有多喜爱车时,你实际上回答的是另一个更为具体的问题:“当你考虑自己的车时,你能从车中得到多少快乐?”这个替换导致你忽略了自己很少想起车的事实,这是过程忽视的一种形式。其结果就是聚焦忽略。如果你喜欢自己的车,你就有可能夸大从其中得到的快乐,这会使你在想到当前这辆车的优点或是考虑是否要买辆新车时出现错觉。

类似的偏见使得人们对加州人幸福感的判断发生了偏差。当被问到加州人的幸福感时,你可能会想到加州比较特别的活动,例如夏天可以爬山,或是羡慕那里冬天气候温和。但事实上,加州人很少参与那些活动。不仅如此,加州的常驻居民在对自己的生活进行总体评估时,根本没怎么想到气候这个问题。如果你一生都住在加州,而且不怎么去旅游的话,那么加州就像自己的10根脚趾一样,会觉得它们很重要,但却不会时常想到它们。如果生活中任意一方面的想法有很强的可替代性的话,此方面就更有可能被凸显出来。

而搬到加州的人则会有不同的回应。假设某个企业的核心人员搬到了加州,想从这宜人的气候中得到快乐。搬家后的几年内,当问他对自己生活的满意度时,他可能会想到这次搬家,进而会对比搬家前后两州的气候。对比的结果肯定是加州更胜一筹,而对于生活中气候这一方面的关注就会使他对自己真实经验的权重发生偏差。无论这个人在搬家后是否真的更快乐,他都会说自己感到更快乐了,因为关于气候的想法导致他相信自己更快乐。聚焦错觉能使人们对自己当前的幸福状态、他人的幸福感以及自己未来的幸福感判断错误。

半身瘫痪的人一天中有多长时间情绪低落?

这个问题肯定会让你想到某位半身瘫痪的人正在思考自己的身体状况。在这个瘫痪者发生事故后的前几天里,你的这个猜想很可能还是正确的。但是随着时间的流逝,瘫痪者会开始慢慢习惯,对自己身体状况的注意力就会转移到其他新的情况上去(只有少数例子除外),最主要的例外情况包括长时间的疼痛、持续处于吵闹声中以及严重的抑郁。疼痛和吵闹声是吸引注意力的生理信号,抑郁则会使难受的想法不断强化。因此,对于类似情况,人们是不可能完全适应的。半身瘫痪者也并不例外:观测表明,半身瘫痪者在事故发生的一个月内心情大都是相当好的。尽管当他们想到自己的境况时,也肯定会感到悲伤。然而,在大多数时候,这些半身瘫痪者工作、阅读、看笑话、交朋友,在报纸上读到政治新闻时同样也会生气。当他们参与到任意一项活动中时,与其他人并没有多大的差别,我们也可以说,半身瘫痪者的幸福感在大多数时候都是接近于正常水平的。想要适应一个新的环境,无论这个环境是好还是坏,在很大程度上取决于慢慢地不去想这个环境。从这个意义上来看,生活的长期状况(包括半身瘫痪和婚姻)只在部分时间会对人们的状态产生影响,即当人们关注于这些状况的时候。

在普林斯顿大学教书有个好处,即能带聪明的学生完成研究论文。其中,指导波特鲁利亚·科恩(Beruria Cohn)的论文就给我留下了深刻的印象。她的论文数据来自于某家调查公司,这家公司请受试者估测了半身瘫痪者处于坏心情的时间比例,科恩收集并分析了得来的数据。她将受试者分成两组:第一组被告之导致患者瘫痪的事故发生在一个月前,另一组被告知事故发生在一年前。另外,每一个受试者都需要说明自己是否认识半身瘫痪的人。从这一点出发,她又将受试者分成两个组。这两个组对半身瘫痪不久的人的判断非常接近:认识瘫痪者的受试者估测他们有75%的时间处于负面情绪中;需要靠想象才知道瘫痪者是何状况的受试者的估测值是70%。相较而言,这两组受试者对事故一年后瘫痪者情绪的估测则大不相同:认识瘫痪者的人认为他们有41%的时间处于负面情绪中;现实生活中不认识半身瘫痪者的受试者的平均估测值则为68%。很明显,那些认识瘫痪者的人观察到瘫痪者对自己境况的注意力会逐渐转移,而那些不认识瘫痪者的人就不能预测到这种适应性的发生。判断某人赢得彩票一个月后和一年后的心情也是这样的模式。

我们能够预测出,对于那些半身瘫痪者以及有慢性病且难以负荷身体状况折磨的人来说,他们的生活满意度与幸福感关系并不大,因为在要求他们评估自己的生活时,不可避免地会使他们想到其他人的生活以及自己曾经的生活状态。最近关于结肠造口术病人的研究结果也与这个看法一致。此研究结果表明,病人的幸福感与他们对自己生活的评估有着极大的不同。在经验样本中,并没有发现这些病人的幸福感与健康人有何不同。但结肠造口术病人却想要以自己几年的生命换取健康的身体。而没有得结肠造口的人会认为自己若得了这种病情况会很糟糕,因此他们宁愿失去几年的寿命也不愿再次做这个手术。这个时候,记忆自我似乎是受到了聚焦错觉的支配,而聚焦错觉则将焦点放在了经验自我忍受的痛苦上。

丹尼尔·吉尔伯特和蒂莫西·威尔逊引入了错误想法(miswanting)这个词组来描述因情感预测的错误而导致不佳决策的这种情况。这个词组理应成为我们的日常用语。聚焦错觉(丹尼尔·吉尔伯特和蒂莫西·威尔逊称之为过度聚焦)是产生错误想法的主要原因。值得注意的是,错误想法会导致我们易于夸大购买大件商品或变换环境对我们未来幸福感的影响力。

请比较两个会使你的生活某些方面发生改变的决定:买一辆舒适的新车和加入每周都有聚会的小组,有可能是扑克小组或是读书小组。这两种经历在开始时都是新鲜且令人兴奋的体验。其主要的不同在于,买了车后,你对它就会越来越不关注;但加入小组却能常参加社交活动,当然前提是你愿意常去。由于眼见即为事实的关系,你可能会夸大汽车的价值,但不太可能在社交活动或其他需要注意力的活动方面犯同样的错误,这样的活动有打网球或学习拉大提琴等。聚焦错觉会产生一种偏见,这种偏见会导致人们更加看好本身就能令人兴奋的事物或经历,即使这些事物或经历最终也会失去吸引力。人们忽视了时间,致使维持人们长久的注意力价值的经验很少受到关注,至少比这种经验应得到的关注要少。

千万不要忽略时间的作用

本书中不断重复时间的重要性。将经验自我的生活描述为一系列有价值的时刻是符合逻辑的。某个生活阶段的价值(我曾称其为快乐总量)就是这一阶段所有价值的总和。不过,这不是大脑呈现各个阶段的方法。我曾提到过,记忆自我同样也会讲故事和作出选择,而且它讲的故事和作出的选择都不能恰当地表示时间。在讲故事时,一些关键的时刻,特别是开始、高潮和结尾,代表了整个生活阶段,过程因此就被忽略掉了。在冰手试验和薇奥莉塔的故事中,我们可以看到将注意力完全集中在某一特定时刻的情形。

我们在前景理论中看到了另一种不同形式的过程忽视,在这种过程忽视中,状态由其过渡状态所代表。彩票中奖会创造一种新的财富状态,此状态能持续一段时间,但决策效用会随着对彩票中奖这则消息的反应强度的改变而改变。人们忽略了对注意力的减退以及对新状态的适应,只注意到了短暂的时间片段。在对慢性疾病的预测以及聚焦错觉的过程中,都有同样的对过渡到新状态的关注、时间忽略和适应性。人们在聚焦错觉中犯的错误包括关注选定的时刻,忽略其他片段发生的事。大脑善于处理故事,但却似乎不能很好地处理时间。

在过去的10年里,我们了解了许多关于幸福的新发现的事实。我们也明白了,幸福这个词并不只有一个简单的含义,我们也不该将其简单地随意使用。有时,科学的进步会使我们更加困惑。

示例—生活的思考“她认为买一辆豪车会使自己更为快乐,但这其实是个情感预测错误。”“今天早上,他的车在上班途中坏掉了,因此,他的心情非常糟糕。今天并不适合问他关于工作满意度的问题。”“她平时看起来都很开心,但当我们问她是否快乐时,她说自己并不快乐。这个问题肯定使她想到了自己最近离婚这件事。““买一座更大的房子可能不会使我们永远感到快乐。我们可能会因为犯聚焦错觉的错误而遭殃。”“他选择了在两座城市间之间奔波往返。这可能是一个错误想法的典型例子。”结语

我在本书的开头引入了两个虚拟的人物,随后讨论了人类的两种存在形式,最后又介绍了两种自我。两个虚拟人物分别是运用直觉、进行快速思考的系统1和需付出努力、运行更慢的系统2。系统2进行的是慢思考,能监督系统1的运作,并在其自身有限的能力下尽可能地占据控制地位。两个物种分别是活在理论世界的虚拟经济人以及活在现实世界的人类。两个自我指的是感受当下的经验自我以及记录并作出选择的记忆自我。最后一章是对这三组概念的某些应用,我将逆序进行讲解。

两个自我

记忆自我与经验自我相抗争的可能性问题比我最初想象的更加复杂。在早期的冰手实验中,过程忽视和峰终定律的结合会使人们作出明显荒谬的选择。为什么人们愿意承受没有必要的痛苦呢?这是受试者的记忆自我作出的选择,更愿意去回忆那些给他们留下更好记忆的体验,尽管这些选择会使自己承受更多的痛苦。或许在一些极端例子中,以记忆的质量为标准进行选择是恰当的。例如,创伤后产生压力是有可能发生的,但手冰凉的体验并不是一种创伤。客观的旁观者在为别人作选择时,肯定会选择受创期短的那一个,会更加考虑别人经验自我的感受。但人们为自己作的选择,有一半都可被认为是错误的。在像茶花女的歌剧和对简的生活判断的故事中,过程忽视和峰终定律都经不起推敲。以某个生命的最后时刻来评估整个生命,或在判断哪种生命更为理想时,完全忽略其过程都是没有道理的。

记忆自我是系统2的一部分。系统2评估生活中某些情节及生活本身的方法有着显著的特点,这些特点也是我们记忆的特征。由系统1产生的过程忽视和峰终定律并不一定与系统2的评判标准相符合。我们相信过程是重要的,但记忆却告诉我们,过程并不一定重要。规定评估过去事件的原则对决策制定不能起到很好的导向作用,因为时间在其中也起了重要作用。人类的存在有一个核心的事实,即时间最终还是有限的资源,但人类的记忆自我却忽略了这个事实。比起细水长流的幸福来说,人们更偏好享受短暂却强烈的快乐。这种偏见是由结合了峰终定律的过程忽视造成的。与这种偏见相反,另一种偏见使我们更为害怕短期、强烈的疼痛,而对于长时间但较轻微的疼痛却更容易接受。过程忽视还使我们容易接受长期但轻微的不愉快,因为其结局会更好;若某件事的结局不好,即使其过程是长期且快乐的,我们也会忽略掉。以同样的观点来看待不适,请考虑这个普遍的警告,“不要这样做,否则你会后悔的”,这个建议听起来很明智,因为其所能预见的后悔出自于记忆自我的判断,我们也倾向于将这个判断看做是最终结论。然而,我们不应该忘记,记忆自我的观点不总是正确的。一个测量快乐的客观观察者会更注重经验自我,会提供不同的建议。记忆自我对过程的忽略、对峰终和结局的重要性的夸大,以及对后见之明的怀疑共同作用,歪曲地反映着我们真实的体验。

相反,对过程加权的幸福观使我们将生活中的所有时刻都看做是相似的,其将生命中所有时刻都分为值得纪念或不值得纪念两种。有些时刻最终会比其他时刻得到更多的权重,并不是因为它们值得纪念或是很重要。人们花在思考某个值得纪念的时刻的时间应被考虑在内,增加这个时刻的权重。通过改变某个时刻之后时刻的经验也能增强这个时刻的重要性。例如,练习拉一个小时的小提琴可能会增强多个小时的演奏经验或几年后听音乐的鉴赏能力。同样,引起创伤后应激障碍(PTSD)的短暂且可怕的事件应该通过其引起的长时间的痛苦来权衡。从过程加权的角度来看,我们只能在事情发生后才能决定某个时刻是值得纪念的还是毫无意义的。“我会一直记得……”或“这是一个意义非凡的时刻”的说法可以被看做是承诺或是预测,但即使我们在说这些话时是百分之百真诚的,我们还是常常无法实现这些承诺或正确进行预测。我敢打赌,10年后,许多我们曾经说过想要一直记住的事都会被忘记。

过程权重的逻辑具有强迫性,但我们并不能将其视为关于幸福的完整理论,因为人们只认同记忆自我,而且只关心自己的故事。忽略了人们想要的关于幸福的理论是站不住脚的。另外,忽略了真实发生的事并只关注于人们对自己生活的想法的理论同样也站不住脚。我们必须将记忆自我和经验自我都考虑在内,因为它们对生活的诠释不总是一致的。哲学家可能会长时间在这些问题上纠结。

对于这两个自我哪一个更重要的问题,并不是只有哲学家才需要考虑的。这个问题对于某些领域的政策问题都有一定的影响,特别是医药和福利领域。请考虑对治疗不同的病应该作的投资,包括失明、耳聋和肾衰竭。这些投资应该受人们对这些疾病的恐惧程度的影响,还是该受病人真实的痛苦体验的刺激?是受病人想要恢复健康的愿望的强烈程度还是病人为了健康而愿意付出代价的大小来决定?关于失明和耳聋,或结肠造口术和透析的投资意愿强度,可能会因为对痛苦严重程度评估方法的不同而有所不同。当前对此问题还没有简单的解决办法,但这个问题却非常重要,不容忽视。

最近,用对幸福的测量来引导政府决策的可能得到了包括学者和欧洲几个政府机构在内的关注。将来,社会痛苦总量指数可能会和失业、残疾和收入指数一起包含在国家统计数据中。比起几年前,这个想法在现在看来还是有可能实现的。这个项目已经取得了一定的进展。

经济人和人类

如果我们能与某个人进行理性讨论,此人的信念能顺应现实,而且他的倾向也与其兴趣和价值观相符合,我们就可以说这个人是通情达理的。在说到理性这个词时,人们往往会想到审慎、深思熟虑且缺少热情的人物形象,但在日常用语中,一个理性的人肯定是通情达理的。但对于经济学家和决策理论家来说,“理性”这个形容词有着完全不同的意义。判断某个人是否理性的唯一标准并非是看这个人的信念或是偏好是否合理,而是看它们是否一致。一个理性的人可以相信鬼,只要他的其他信念也与世界上有鬼存在这个信念相一致。一个理性的人可以有好恶,但他的偏好要前后一致。理性指的是逻辑上的一致,即合理与否。根据这个定义,经济人就是理性的,但有很多证据表明,人类并不理性。经济人不会受启发式、眼见即为事实、窄框架、内部意见或偏好逆转的影响,但人类却无法避免这些影响。

将理性定义为一致性是会受到限制的。理性要求人们遵守逻辑原则,但我们有限的大脑却不能够实现这一点。从这个定义来看,通情达理的人并不一定就是理性的人,但也不能因此就被认为是非理性的。“非理性”是一个较重的词,包含了冲动、感情用事以及对合理辩护的顽强抵抗等含义。当我与阿莫斯的研究成果被认为证明了人类的选择是非理性的时候,我总想要退缩。因为事实上,我们的研究仅仅表明了人类不应该被描述为处于理性代理模式中。

尽管人类不是非理性的,人类仍然时常需要帮助才能作出更准确的判断和更好的决策。有时,相应的政策和机构就能够提供这种帮助。这样说虽然没什么不对,但实际上却颇具争议。正如比较权威的芝加哥学院派解读的那样,对人类理性的信心和防止人们作出错误选择是没必要甚至不道德的这一观念联系紧密。理性的人应该是自由的,他们应该为自己的选择负责。米尔顿·弗里德曼是芝加哥学院派的主要代表人物,其主要观点在他的一本畅销书的标题上得到了体现—《自由选择》(Free to Choose)

经济人是理性的这一设想为用自由主义的方法制定公共政策的观点提供了思想基础:不要干涉个人选择的权利,除非这些选择对他人有害。将物品分配给愿意付钱最多的人是市场效率的体现,对市场效率的赞叹是对自由主义政策的支持。有一篇《理性成瘾理论》支持芝加哥学院派的这一观点,它解释了对强烈且即时满足有极度偏好的理性代理人会做出理性的决策,把对未来的沉迷当做一个结果。加里·贝克尔是这篇文章的作者之一,也是芝加哥学院派中的一个诺贝尔奖获得者。他曾以轻松但不失严肃的口吻说过,我们应该考虑通过某种信念,即人们能很快找到治愈糖尿病的方法,来解释所谓的肥胖流行病的病因。他提出了一个有价值的观点:当我们观察那些行为看似怪异的人时,应该考虑到一种可能—他们这样做有合理的理由。只有当理由变得不合理时,才会引发心理学上的解释。其中,贝克尔对于肥胖症的解释可能就是不合理的。

在经济人的国度里,政府应该让经济人在对他人不造成危害的前提下自己作选择,不横加干涉。如果骑摩托车的人选择不戴头盔,那么自由主义者就会认为这是他的权利,并支持他这么做。无论是决定不存养老金还是选择吸食毒品,公民们都知道自己正在做什么。不过,往往难以界定这种情况:没有存够养老金的老年人并不会比在餐厅吃完大餐后抱怨价格太高的人得到更多怜悯。因此,在芝加哥学院派与行为经济学家的辩论中,有许多理论都是相互矛盾的。行为经济学家抵制极端的理性代理人模式。辩论的所有参与者都认为自由不是争辩而来的价值。但是相比人类理性的真正信徒,生活对于行为经济学家来说更加复杂。没有行为经济学家会赞同强迫市民均衡膳食,以及只看有益电视节目的规定。然而,对于行为经济学家来说,自由是需要付出代价的,做了不明智决策的个人以及认为有义务帮助这些人的社会都需要付出代价。因此,该不该帮助个人避免错误的决策就成为了行为经济学家的两难。芝加哥学院派的经济学家们不存在这个问题,因为理性代理人不会犯错。对于这个学派的人来说,自由是免费的。

在2008年,经济学家理查德·泰勒和法学家卡斯·桑斯坦合著了《助推》。这本书很快成为了全球畅销书,还被视为行为经济学的《圣经》。书中引入了几个新的词语,包括经济人和人类,还提出了一系列方案来解决在不剥夺人们自由的前提下帮助人们做出良策的难题。泰勒和桑斯坦主张自由家长制的做法,即允许国家和其他机构“推动”人们做决策,并使这些决策服务于该国或该机构的长远利益。将参与养老金计划指定为默认选项就是助推的一个例子。不可否认,人们会因为不自觉地加入了这个计划而觉得自己的自由少了,因为他们在当初填表时,只需确认一个复选框,就可以退出这个计划。在之前已经提过,个人决策的框架(泰勒和桑斯坦将其称为选择架构)对结果有着巨大的影响。助推基于坚实的心理学,我在之前已阐述过。默认选项自然而然地被认为是普通选项。而偏离普通选项是一种委任的行为,需要考虑更多,承担更多的责任,比什么都不做更有可能让人后悔。如果某个人不确定该怎么做时,就会有强大的助推力来引导这个人做出决策。

与经济人相比,人类同样需要保护,以免受那些蓄意利用他们弱点的人的危害—特别是系统1的怪异模式以及系统2懒惰的弱点。理性代理人被认为能谨慎地作重要的决定,并充分利用知道的已有信息。经济人会在签署一份合约之前,阅读并理解所有条文,但是人类通常不那样做。某家不道德的公司设计出的合约在显而易见的地方隐藏着重要的信息,这些信息能使公司在法律范围内有回旋的余地,但人们不经阅读就签下了合约。对理性代理人模式有害的极端解读是:除了确保相关信息公开外,顾客被假定为不需要保护,合约中字体的大小和语言的复杂程度不被认为是相关信息,但是一个经济人知道如何处理小字体的信息。《助推》这本书给出的建议是要求公司提供足够简单的合约以供人类客户阅读和理解。因为顾客得到了更详细的信息,这可能使一些公司的利益受到损害,因此,一些建议遭到了这些公司的强烈反对,但这是一个好的迹象。公司通过提供更好的产品来提高竞争力要比公司独自赢利更为可取。因此,通过提供好产品来提高竞争力的公司更受到人们的青睐,也就是说更受青睐的公司往往是提供的信息不明确的公司。

自由家长制的显著特点是其在广泛的政治方面的吸引力。行为政策的绝佳例子是“为明天储蓄更多”计划,这是由国会中的极端保守主义者和自由主义者联合提出的议案,而这两者的联合并不常见。“为明天储蓄更多”是公司为其员工提供的养老金计划。签了这份合约的员工在加薪时增加一定的存储比率,这样,员工就能为储蓄计划贡献得更多。储蓄率随工资的上涨而自动上升,直至员工注意到存得太多,进而选择退出该计划。现在,这个由泰勒和桑斯坦于2003年提出的伟大革新使储蓄率有了一定的提高,也使成千上万工人的前景更加光明。这个计划有坚实的心理学理论作为基础,本书的读者们对这些理论知识肯定都有所了解了。此计划通过要求非立即改变或尝试来提高存储以支付工资的方法避免了直接损失,将损失转变成了未得收益(foregone gains),也就更容易使人接受。另外,其自动性的特点还将系统2的懒惰与工人的长远利益结合在了一起。当然,所有这些特点都没有强迫任何人做任何他们不想做的事,也不含任何误导或欺诈。

自由家长制在许多国家都得到了认可,包括英国、韩国,还得到了很多政党的认可,包括英国托利党以及奥巴马政府等。的确,英国政府成立了一个新的小部门,这个部门的任务就是将行为科学原则用于帮助政府实现目标。这个部门的正式名称叫做“行为研究小组”,但是,无论是政府内部的人还是政府外部的人,都将这个小组简单地称为“助推小组”。泰勒是这个小组的顾问之一。

继《助推》一书之后的一本书中,奥巴马总统邀请了桑斯坦在政府信息与规制事务办公室任职。这个职位为桑斯坦提供了很多将心理学和行为经济学的课程应用于政府机构的机会。这个任务在管理与政府预算办公室在2010年所作的报告中有所描述。本书的读者应该可以理解一些特定提议背后的逻辑,包括鼓励“清晰、简单、显著及有意义的披露”。读者还需读懂背景陈述“描述非常重要,例如,如果某个可能的结果被构架成一种损失,这种结果会比构架成收益有更大的影响”。

关于助推的例子有很多,比如之前已经提过的关于耗油量公开信息的框架规则,而其他方面的应用还包括自动参加健康保险,用新的膳食指南代替令人费解的膳食宝塔(新的膳食指南是由一个盛满营养均衡的食物的盘子所表示),以及美国农业部门(USDA)所指定的规则,即允许在肉制品标签上写上类似“90%无脂肪”等信息,而“10%的脂肪”也可以说成“接近于瘦肉率颜色的表述方法,即描述出与同脂肪率的肉相同的色泽、大小及种类”。与经济人不同的是,人类需要帮助才能作出好的决定,且这种帮助可以通过告知或不介入的方式得以实现。

两个系统

本书将大脑的运作描述成了两个虚拟人物不稳定的相互作用,这两个虚拟人物就是自动的系统1以及需要付出努力的系统2。现在,你对这两个系统的个性已经相当熟悉了,也能够预测他们在不同情境下可能的回应方式。当然,你也知道这两个系统并不是真正存在于大脑或其他地方中。“系统1做了某事”是“某事自主发生”的简略说法。“系统2被动完成了Y”是“更兴奋,瞳孔扩散,注意力集中,Y活动开始进行”的简略说法。我希望你能和我一样,交谈时使用关于两个系统的语言,这样的话,交谈就会更方便,还能在不知两个系统存在与否的问题时凭直觉判断系统的运作方式。作出这些简要说明后,在后面的内容中,我会继续使用两个系统的说法。

我们对自己的看法就是对系统2的看法。系统2会进行判断和选择,但它会认可系统1形成的观点和感觉,或将这些观点和感觉合理化。你可能没有意识到你对某个项目持乐观态度,只是因为此项目的领导使你想到了自己亲爱的姐姐。或是,你或许会厌恶和你的牙医长得像的人。如果你想寻求一个解释,就要搜寻记忆,寻找一些像样的理由,你最后肯定能找到一些。另外,你还会相信自己编造的故事。系统2不仅是系统1的辩护者,它也能避免许多愚蠢的想法和不当表达而引起的冲动。投入注意力能提升众多活动的表现(试想在思想混乱时在狭窄的路上开车的风险),对于一些任务来说,注意力的集中还是必要的,例如在进行比较、选择和推理时。然而,系统2并不是理性的模范,其能力以及能够掌握的信息都是有限的。我们在推理时,头脑不会总是很清醒,我们犯错也不全是因为突然想到的不恰当的直觉。通常,我们犯错是因为我们(系统2)无法再了解到更多的信息。

我花了更多的时间来描述系统1,也用了很大篇幅描述我源于直觉判断和选择的错误。然而,相对的篇幅并不是评判直觉思考优劣的好指标。系统1是我们许多错误的原因,但也是我们许多正确做法的原因,而且我们也常做正确的事。我们的想法和行动通常由系统1指导,是当机立断的。系统1的一个优点就是储存在我们联想记忆中丰富而详细的世界:在这个世界里,人们能在不到一秒的时间内,从普通事件中区分出令人惊奇的事件;立即对自己所期望的事生成想法,并对令人惊奇之事和正在发生的事自动搜寻有因果关系的解释。

记忆能记录我们一生中习得的技能,因而也会自主产生解决方法来应对不断出现的挑战(比如绕过路上的一块大石头走,避免让顾客挑出错误)。技能的习得要求有固定的环境、练习的机会,以及对自己想法和做法快速且明确的反馈。当这些条件都满足时,就能掌握技能了,且此后快速闪现在大脑中的直觉性判断和选择都会是正确的。这些都是系统1来完成的,也就是说这些是快速且自主发生的。有技能的行为是能快速有效地处理大量信息的能力。

若挑战碰上了有技能的应对方法,这个应对方法就能被唤起。如果没有技能,又会发生什么呢?此时,系统2显然要介入,就如同回答“17×24=?”这个问题,其结果肯定是确定的。但想要系统1对系统2的能力表现出吃惊,不介入进来却不太可能。系统1不会受能力的限制,在计算时不要求确切数值。在搜寻某问题答案时,它能自动生成对相关问题的回答,还可能会将所问问题的答案替换成很容易出现在头脑中的回答。在启发式的概念中,启发式的回答并不一定比原来的问题更简单或需要更少的努力,启发式的回答只是更容易想到,更快、更容易被发现而已。启发式的回答不是随意想出来的,它们“似乎”是正确的答案。不过,有时也错得离谱。

系统1在处理信息时,可能会产生认知放松。当信息不可信时,系统1也不会生成警告信号。人们会快速且自信地进行直觉性回答,不管这些回答是否源于技能或启发式。系统2没有简单的方式来区分有技能的和启发式的回答。唯一的方式是放慢速度、自身构建出一个答案,这个答案可能不会被轻易接受,因为系统2比较懒惰。系统1的很多建议常常没有通过最基本的检验就得到了人们的支持,就像球拍和球的问题。这就是系统1得到“错误和偏见的起源”这个负面称号的原因。系统1的运行特征,包括眼见即为事实、强度匹配和联想一致性等,会产生可预测的偏见和认知错觉,比如锚定效应、回归平均值的预测、过度自信,以及许多其他错觉。

对于偏见我们能做什么呢?我们如何提升判断和决策(这些判断和决策来自我们自身和那些我们为之服务也服务于我们的机构)的质量呢?从自身经验来谈,系统1的运行方式是不能教给别人的。我除了认为年龄会有些影响外,我们的直觉思考就像我之前对这些问题作的研究那样,包括过度自信、极端预测和计划失误的倾向。我只提升了对易犯错误的情境的识别能力,“这个数字会成为一种锚定……”,“如果问题被重新架构,决策会改变……”而我在识别别人错误的过程中,也取得了更多的进步。

避免系统1出错的方法从原则上讲是很简单的:认识到你正处于的认知领域,放缓并要求系统2来加以强化。当再次碰到缪勒–莱耶错觉图时,你会怎么做?当你看到有箭头的线段指向不同的方向时,你会意识到现在你不能相信自己对长度的直觉。不过,这种明智的过程在最需要的时候不会被应用到生活中。我们都希望在自己要犯错时能有个铃声提醒自己,但这是不可能的,认知错觉比感知错觉更难以识别。理性的声音也许比错误的直觉响亮又清晰的声音更微弱。当你面临着重大决策的压力时,质疑自己的直觉会让你感到不愉快。当你处于麻烦中时,最不愿意看到的就是有更多的质疑。这样的结果就是,相比自己要犯错时,你在观察别人是否要犯错时,能更容易辨认出雷区。观察者会比实施者在认知上更为放松,更愿意接收信息。我写本书的一个原因就是指导批评家和传闲言碎语的人,而不是指导决策制定者。

机构要比个人更容易犯规避错误,因为机构的人多,自然就会思考得很慢,也更有能力按规则行事。机构可以制定和有效使用检查表,还可以深入开展,比如参考类别的预测以及“事前验尸”练习。机构能够鼓励其成员形成一种在靠近雷区时互相留意和提醒的文化,而这种文化的形成一部分是通过为其成员提供一些独特的词汇。无论机构是干什么的,都涉及判断和制定决策,就像是工厂生产产品,每个工厂都应该有保障其产品在最初设计、装配及最后检查时的质量的方法。决策产生的相关阶段包括解决框架问题、收集引导决策的相关信息、反馈以及检查。想要提高其决策质量的机构应该经常在每一个阶段里搜寻可提高效率的环节。这个运作的概念是有规律的。持续的质量控制通常是在危机产生后机构采取的对过程的全面回顾。其中一个例子就是明显缺乏主持高效会议必要技能的系统训练。

基本上,更为丰富的语言对于建设性批评来说是必不可少的技能。与医疗相似,辨别判断性错误就像是在诊断病人,需要一些精确的词汇。从某种疾病的名字中,我们希望得到所有关于这一疾病的信息,包括其易感染性、环境因素、症状、预断及治疗等。与其相似的是,如“锚定效应,”“窄框架”、“过度一致性”也能使我们想到关于某个偏见的所有信息,包括其原因、影响以及我们能对其做些什么。

在办公室饮水机旁的闲谈与决策有直接的联系:闲谈越多,所做的决策就可能更好。有时,决策制定者能听到大家当时传的闲言碎语和批评,这比听自己内心疑虑更容易。当他们相信批评自己决策的人经验丰富且公平正直,或当他们希望自己的决策能通过制定的方式而不是结果来评判的话,就会做出更好的决策。

附录A  不确定性下的判断:启发法和偏见

(本文首次刊登于1974年的《科学》杂志上,第185卷。美国国防部高级研究计划局为此项研究提供了支持,海军研究办公室也与位于尤金的俄勒冈研究院签订了合约,监督该研究。另外,该研究还得到了位于以色列耶路撒冷的希伯来大学研究与开发部门的支持。)

我们所做的许多决策都是基于对不确定事件概率的信念,这些不确定事件包括选举结果、被告的内疚感或是美元的未来价值。这些信念通常被表述为“我想……”“概率是……”“它是不可能的……”等。对于不肯定事件的信念有时还能以概率或主观概率等数字形式表现出来。那么,是什么决定了人们的信念?

人们又是怎样评估不确定事件的概率和不确定数量的价值呢?本文将会告知你们,人们依赖于数量有限的启发式原则,而这些原则能将测量概率以及预测价值的任务简化,使其成为更为简单的判断过程。总的来说,这些启发法相当有用,但有时也会导致严重的、系统性的错误。

对概率的主观评估与对距离或大小等物理量的主观测量相类似。这些判断都依赖于效度有限的数据,是根据启发式的规则进行的。例如,某物体的距离取决于其清晰程度。物体看上去越清楚,其距离就显得越近。这条规则有一定的效度,因为在任何给定的情境中,距离较远的物体都会比距离较近的物体更不清楚。然而,对这条规则的信赖会导致我们在测量距离的过程中产生系统性错误。特别是在能见度较低时,物体轮廓就会模糊,而其距离就常常会被高估。另一方面,在能见度较高时,物体轮廓就会清晰,其距离也就会被低估。因此,如果依赖于清晰度,将清晰度作为测量距离远近的标尺的话,就会导致普遍的偏见。这样的偏见在对概率直觉性的判断中也会出现。本文将描述三种应用于判断概率和预测价值的启发式,列出由这些启发式引起的偏见,并讨论这些偏见的实际应用和理论内涵。

代表性

人们考虑的许多概率问题都包含在以下某个类型当中:物体A属于类别B的概率是多少?事件A起源于过程B的概率是多少?过程B引起事件A的概率是多少?人们在回答这些问题时,会典型地依赖于代表性启发法,即通过用A来代表B,也就是通过比较B与A的相似程度来对概率进行评估。例如,如果A能高度代表B,人们就会认为A源自B的概率高。但如果A与B并不相似,人们就会认为A源自B的概率低。

若想通过代表性对判断进行阐述,请考虑下面这个情况,若有某个人被他原来的邻居描述为:“史蒂夫非常腼腆,少言寡语,很乐于助人,却对他人或这个现实世界没多大兴趣。他谦恭有礼,做事井井有条,中规中矩,关注细节。”人们如何从一个可能的职业列表中(例如农民、售货员、飞行员、图书管理员或是医生)评估他从事某个特定职业的概率?又如何根据可能性的大小来将这些职业进行排序呢?在代表性启发法中,例如,史蒂夫是个图书管理员的概率是通过其与典型的图书管理员形象的代表性或相似性来进行评估的。事实上,对于这类问题的研究已经表明,人们对职业概率的排序与对职业相似性的排序方法完全是相同的。而这种关于概率的判断方法会导致严重的错误,因为相似性或代表性不会受到某些因素的影响,而这些因素却能影响对概率的判断。

对结果的先验概率(prior probability)不敏感。 对代表性没有任何影响而对概率有重要影响的其中一个因素是结果的先验概率,或基础比率。例如,在史蒂夫的那个例子中,在我们作出史蒂夫是个图书管理员而不是农民的理性评估时,是应该将农民比图书管理员人数更多的事实考虑在内的。然而,对基础比率的考虑并不会影响史蒂夫与图书管理员以及农民的典型形象的相似性。因此,如果人们通过代表性来评估概率,先验概率就会被忽视掉。我们在运用了先验概率的实验中检验了这个假设。在实验中,我们向受试者简要概述了几个人的性格,这几个人是从100位工程师及律师的样本中随意抽取出来的。而受试者需要通过对每个人的描述来评估其是工程师还是律师。在某个实验情境中,受试者被告知这些被描述的100人中,有70位工程师、30位律师。而在另一个实验情境中,受试者被告知这100人中,有30位工程师、70位律师。在第一种情境下,受试者判断任意一个描述是关于工程师的而不是关于律师的概率都应该高于第二种实验情境。因为第一种情境中工程师更多,第二种情境中律师更多。值得注意的是,我们通过贝叶斯定理还能知道每个描述的概率比率应该是(0.7/0.3)2,或是5.44。然而,这些受试者在这两个实验情境中都得出了同样的概率判断,这严重违反了贝叶斯定理。很明显,受试者认为某个特定的描述是在说工程师而非律师是通过描述对于这两个典型职业的代表程度而来的,而很少或根本就不考虑其所属类别的先验概率。

当这些受试者没有其他信息来源时,他们会正确地利用先验概率。在没有人物描述的情况下,受试者判断某个人是工程师或律师的概率分别是0.7和0.3,这与基础比率正好符合。然而,当某个描述存在,就算这个描述没有任何信息,先验概率还是会被彻底忽略掉。对于以下描述的回应就阐明了这个现象:

迪克是位30岁的男性,已婚,但无子女。他能力强,干劲足,承诺一定要在自己的领域功成名就。他很受同事的欢迎。

这个描述所传达的信息与迪克是工程师还是律师的问题完全没有关系。因此,迪克是工程师的概率应该与工程师占样本总人数的比率相同,就如同我们没有得到任何有关迪克的描述时一样。然而,受试者却将迪克是工程师的概率判断为0.5,并不关注工程师占总人数的比率是0.7还是0.3。很明显,在没有任何证据和得到了一些无用的证据之后,人们的回应是不同的。在没有任何特定证据的情况下,先验概率能够被合理地应用;而在得知一些无用证据的情况下,先验概率就会被忽略。

对样本大小的不敏感。 在某个指定大小的样本中,评估获得某个特定结果的概率时,人们总会应用代表性启发法。即他们会通过某个样本结果与相关参数的相似性来评估这个结果的概率。例如,人们会认为随机抽取的10位男性的平均身高是6英尺,而这个结果就是由与相应参数(这个参数即是男性人口的平均身高)的相似性得来的。某个样本的统计数据与人口参数的相似性并不是由样本的大小来决定的。其结果就是,如果我们通过代表性来评估概率,判断出的某个样本的统计数据实质上就是独立于样本大小的。的确,当受试者评估大小不同样本的平均身高分布时,他们得出的分布是相同的。例如,人们在评估平均高度高于6英尺的概率时,无论样本大小是1 000、100还是10位时,其得出的分布都是相同的。另外,即使样本大小的重要性在问题形成之时就被强调过,受试者还是不能体会其所起的作用。请考虑下面的问题:

某个城镇有两家医院。在较大的那家医院里,每天大约有45个婴儿降生,而在较小的医院里,每天有15个婴儿降生。如你所知,其中50%的婴儿应该是男婴。然而,男婴实际的百分比每天都会有所变化,有时会高于50%,有时会低于50%。

在一年的时间里,每家医院都记录了新生婴儿中男婴比率大于60%的天数。你认为,哪一家医院记录的天数更多?

更大的医院(21)
更小的医院(21)
大致相同(其天数的不同在5%的范围内,53)

括号中的数值表示的是选择该答案的大学生人数。

无论是大医院还是小医院,多数受试者判断出的60%以上新生儿是男婴的概率都是相同的。这可能是因为这些事件都来自于同样的统计资料提供的描述,因此关于总体情况的代表性相同。相反,以样本理论进行分析的话,在小医院里,超过60%的婴儿是男婴的天数肯定应该比大医院的多,因为大样本的男女比率不太可能偏离50%。很明显,这个统计学的基本概念与人类的直觉不相符。

在对后验概率(即从一个整体而不是另一个整体中抽取样本的概率)的判断中,人们对样本大小的问题也不是很敏感。

请考虑下面这个例子:

想象有个装满球的罐子,其中有2/3的球是一种颜色,1/3的球是另一种颜色。某个人从罐子里取出了5个球,发现有4个是红色的,1个是白色的。另一个人取出了20个球,其中有12个是红色的,8个是白色的。这两个人中,谁更会认为罐子里2/3的球是红色的,1/3的球是白色的?每个人给出的概率各是多少?

在这个问题中,假设两次抽取的先验概率相同,那对于4∶1的那个样本来说,其正确的后验概率应为8 ∶1;而对于12∶8的样本来说,其后验概率为16∶1。然而,大多数人却认为第一个样本为罐子里主要是红球的这个假设提供了更为有力的证据,因为第一个样本的红球比例要比第二个样本的高。这再次证明了,直觉性判断由样本比例主导,本质上并不受样本大小的影响。然而,样本大小却对实际的后验概率起着至关重要的作用。此外,对后验概率的直觉性评估比起正确的值来说并没有那么极端。在这类对概率的评估中,低估证据的影响反复出现。这种情况被称为“保守主义”。

误解机会 。人们期望由随机过程产生的事件序列能够代表这个过程的基本特征,即使这个序列很短。例如,人们在考虑抛硬币看正反面的问题时,总会觉得其顺序更可能是正—反—正—反—反—正,而不是正—正—正—反—反—反,因为后者并不能体现出抛硬币的公正性。因此,人们期望过程的基本特征不仅表现在整个序列中,还表现在局部的序列中。然而,局部代表的序列系统地脱离了概率的期望:因为局部代表的序列中选择很多,但可供选择的项却很少。抱有局部代表性这个想法的另一个后果就是有名的赌徒谬误。例如,在看到轮盘赌的指针长时间连续指向红色以后,大多数人就会错误地认为现在该是指向黑色的时候了。这是因为,相比再次出现红色,出现黑色会使序列更具代表性。人们普遍将概率视为可进行自我纠正的过程。在这个过程中,某个方向的偏离能引起其相反方向的偏离,以达到恢复平衡的目的。事实上,在概率的结果揭晓之时,偏离并不是被“纠正”了,而只是融为一体了。

不只是天真的受试者才会误解概率。一项关于统计直觉的研究以有经验的心理学家为受试者,揭示了人们长期抱有的“小数法则”这一信念。这些受试者认为,他们抽取的样本即使很小,也具有很强的代表性。他们这样的回应反映了一个有效的假设:某个具有统计意义的样本结果可以代表样本所属的整个群体的性质,这与样本大小并无关联。因此,研究人员过于信任小样本的结果,高估了这些结果的可复制性。在实际的研究中,这些偏见会导致研究人员选择的样本不够大,并对仅有的发现作过多的阐释。

对可预测性的不敏感。 有时,人们需要作一些数值上的预测,例如,预测某只股票的走势、某种商品的需求量或是某场球赛的最后比分。这样的预测经常是通过代表性作出的。例如,假设有个人在听了关于某家公司的描述之后,需要预测这家公司的未来收益。那么,如果这个人听到的描述是正面的,他就会预测这家公司将有非常高的收益,因为高收益最能代表那个描述;如果描述是普通的,这个人就会觉得公司的表现也会很普通。描述的好坏程度并不受该描述的可信程度以及精确程度的影响。因此,如果人们仅仅依靠描述的好坏来预测,那么他们的预测就会对证据的可靠性和预测的预期精确度不敏感。

这种判断模式违反了标准的统计理论。在标准的统计理论中,出于对可预测性的考虑,极端和预测范围受到了控制。当某件事的可预测性为零时,该预测的结果在任何情况下都应该是相同的。例如,如果在一些公司的描述中,没有听到有关其收益的信息,那么对所有这些公司未来收益的预测都应该是相同的。当然,如果某件事的可预测性非常高,那么预测值就会符合实际值,预测的范围也会等同于实际结果的范围。总之,可预测性越高,预测值的范围就会越广。

一些关于数值预测的研究表明:直觉性预测违反了这条规则,因为受试者很少甚至没有考虑过可预测性的问题。在其中一项研究里,受试者看了几段文字,每段文字都描述了一位实习老师在特定实习课上的表现。一些受试者需要根据那几段文字描述以百分制来评价特定总体的课堂质量,其他受试者则需要预测这些实习老师在5年以后的成就,同样要以百分制来打分。这两种情况下作的判断是相同的,即预测某一未来事件(老师在5年以后的成就)与评估当前事件所依据的信息(实习课的课堂质量)是相同的。作这些预测的人肯定也意识到了用某位老师5年以前的实习课来预测她的教学能力过于局限。不过,他们的预测与评估一样极端。

效度错觉。 前面已经介绍过,人们常会挑选输入信息(例如对某个人的描述)中最具代表性的特点(例如职业)来进行预测。他们在预测时的自信程度主要取决于相关信息代表性的高低(即所选特点与输入信息的吻合程度),与限制预测准确性的因素关系不大。因此,人们在听到与图书管理员的典型形象相符合的性格描述后,就会极有自信地作出所描述的人就是一个图书管理员的预测,即使这个描述是片面的、不可靠的或是过时的。由于预测特点与输入信息非常吻合而产生的没有保证的自信就被称为效度错觉。即使当判断者意识到限制其预测准确性的因素时,这种错觉仍然存在。许多文献已经证实:甄选面谈的出错率很高,但即使心理学家知道这一点,在甄选面谈时,他们还是常会在预测中表现出很大的自信。尽管不断有证据表明甄选面谈是不恰当的,但临床上仍然持续依赖这种访谈方式,这也充分说明了效度错觉强大的影响力。

预测需要依靠输入,而输入模式的内部一致性就是决定人们在预测时自信程度的主要因素。例如,相比某个在一年级得了许多A但也得了许多C的学生来说,人们在预测一年级得了许多B的学生的平均绩点时会更有自信。高度一致的模式最常出现在输入变量过多或相关度高的时候。然而,相关统计学的结果证实,若规定了输入变量的效度,基于几个这种输入的预测会比输入过多或相关情况下的准确性高。因此,输入变量过多虽然可以增加自信程度,但却会降低预测的准确性。而人们在预测时所抱持的信心常会超出他们的能力范围。

误解回归性。 假设让一群儿童做两套等效的能力测试题。如果你挑选出了在其中一套能力测试题中表现最好的10个人,那么他们在另一套测试中的表现通常会让你失望。相反,如果你挑选的是在其中一套能力测试中表现最差的10个人,你就会发现,他们在下一次测试中平均都比前一次测试表现得好。一般来说,假设变量X和Y有相同的分布。如果你挑选的X的平均分数偏离了X的均值K个单位,那么,Y的平均分通常偏离Y的均值的程度就会少于K个单位。这些观察表明了一个普遍的现象,即回归平均值现象。这个现象是高尔顿在100年前首次证明的。

在正常的生命过程中,你会遇到许多回归平均值的例子。例如,在比较父亲与儿子的身高,丈夫与妻子的智力水平或是某个人连续测试的不同表现时。不过,人们没能对此现象产生正确的直觉。首先,人们不能预料一些肯定会发生回归平均值的情境。其次,当他们辨别出回归平均值的发生时,总会捏造出虚假的因果解释。有这样一个信念:预测结果应该最大程度代表输入信息,因此,结果变量的值也应与输入变量的值一样极端。我们提出,回归平均值的现象之所以难以掌握就是因为与上述信念不相容。

未能意识到回归平均值的重要性将会带来严重的后果。下面这个例子就说明了这一点:在一次关于飞行训练的讨论中,有经验的指导员注意到,若赞扬某位飞行员着陆非常平稳,该飞行员下一次着陆就会表现得糟糕;若某位飞行员着陆较差,该飞行员下一次着陆就会有很大进步。这些指导员总结道,口头表扬对学习是有害的,而口头批评却大有益处,这与广为接受的心理学定律相左。由于回归平均值的存在,这个结论是没有根据的。就像其他重复的测试一样,每次表现糟糕以后总会有进步,而表现优异以后又总会变得糟糕,即使指导员没有对学员的第一次表现给予任何回应。指导员形成了惩罚比奖赏更有效这个错误且有潜在危害的结论,因为他们正好在着陆表现优异后表扬了这些学员,在着陆表现糟糕后批评了这些学员。

因此,未能理解回归效应会导致人们高估惩罚的有效性,低估奖赏的有效性。无论是在社会交往中,还是在训练中,表现得好都会有奖赏,表现得差也都会有惩罚。因此,行为最有可能在惩罚之后得到改进,在奖赏之后变得更坏,这其实就是一种回归现象。其结果就是:人们碰巧因为惩罚他人得到了奖赏,因为奖赏他人得到了惩罚。然而,人们通常不会意识到这种偶然性。事实上,难以掌握回归性主要是因为奖赏与惩罚带来的结果非常明显,因此,这个领域的学者也没有注意到它。

可得性

有时候,人们会通过能想到例子或事件的容易程度来评估这类事的频率或概率。例如,你可能会通过回忆自己认识的人中有多少位是心脏病患者来估测中年人患心脏病的风险。同样,你也可能会通过想象某个企业可能会遇到的各种难题来估测其倒闭的概率。这种判断启发式被称为可得性。可得性对于评估频率或概率来说,是个很有用的线索,因为相比频率较低的类别的例子来说,我们可以更好、更快地得到频率较高的类别的例子。然而,可得性并不受频率和概率的影响。因此,依赖于可得性会导致预测的偏见。我接下来将说明其中的一些偏见。

因例子的可提取性导致的偏见。 当用某个类别的例子的可得性来判断该类别的大小时,例子很容易提取的类别会比频率相同但例子较难想到的类别显得更大。在证明此效应的基本研究中,受试者听到了一串知名人士的名字,男女均有。接着,他们需要判断这串名字中男性是否比女性多。不同组的受试者听到的名字并不相同。在一些名单中,男性更有名;而在另外一些名单中,女性则更有名。受试者都错误地判断了所有名单的类别(性别)。他们的判断显示,名人更多的类别,其数目也越大。除了熟悉度以外,显著程度也会影响例子的可提取性。例如,看见房子失火对这类事件主观概率的影响可能会比在报纸上读到失火这件事的影响要大。另外,最近发生的事有可能会比之前发生的事更容易获得。对于交通事故的主观概率会在见到一辆翻倒在路边的车后暂时升高,这很平常。

因搜索集合的有效性导致的偏见。 假设从某个英文文本中随机抽取一个词(含有3个或更多字母的词)。这个词更有可能是以r开头还是以r作为第三个字母?人们在回答这个问题时,会回忆首字母为r的单词(例如road)以及第三个字母为r的单词(例如car),然后通过想到这两个词的容易程度来评估相对频率。因为从记忆中搜寻单词的首字母要比搜寻其第三个字母更为容易,所以大多数人都判断以某个辅音开头的单词要比第三个字母为该辅音的单词多。但实际上,例如r或k的辅音字母,出现在第三个字母的频率都要比出现在开头的频率高。

不同的任务会引发不同的搜索集合。 例如,假设你被要求评估抽象词(比如想法、爱)和具体词(比如门、水)出现在书面英语中的频率。回答这个问题自然而然的方法就是搜寻这些词可能出现的情境。联想起提到抽象概念(爱情故事中的爱情)的情境似乎要比联想起提到具体词(例如门)的情境更为容易。如果用单词出现情境的可得性来判断这些单词的频率,抽象词就会多于具体词。这一偏见在最近的研究中已被发现,此研究表明,判断出抽象词的出现频率比具体词的出现频率高很多,与客观频率相等。相较于具体词,抽象词还会出现在更多的语境中。

想象力的偏见。 有时,你需要评估某类事件发生的频率,这类事件的实例没有储存在你的大脑中,但你可以通过一定的规则构建一些实例。在这样的情况下,你通常会构建几个实例并通过构建这些实例的容易程度来评估其频率或概率。然而,构建实例的容易程度并不总能反映出真实的频率,这种评估模式很容易导致偏见。下面这个例子将会说明这一点:请考虑一个10个人的团体,他们想组成一个有K个成员的委员会(2 ≤k ≤8)。他们可以组成多少个不同的且有K个成员的委员会?这个问题的正确答案是二项式系数(10/ k),当K=5时,达到其最大值252。这明确表明了,K个成员的委员会数量等于(10 – k)个成员的委员会数量,因为任何有K个成员的委员会界定了一个独有的(10 – k)个非成员的团体。

若想不通过计算就回答这个问题,则需要在心里构建有K个成员的委员会,然后通过构建这些委员会的容易程度来评估它们的数量。人数较少的委员会(比如只有两人的委员会)会比人数较多的委员会(比如有8人的委员会)更容易构建。因此,如果通过想象力或是构建的可得性来评估频率的话,规模小的委员会似乎就会比规模大的委员会的数量更多,这与对称的钟形函数正好相反。事实上,在要求天真的受试者评估规模不同的委员会的数目时,他们的估计是委员会规模的单调递减函数。例如,他们评估的有两个成员的委员会的中值是70,有8个成员的委员会的中值是20(正确答案应该是两种情况下都是45)。

在真实情境中,想象力对概率的评估起着重要的作用。例如,通过想象某次探险中无法应对的意外事件来评估这次探险的风险。如果能想到许多这样生动的意外事件,这次探险就会显得尤其危险,尽管想到这些灾难的容易程度并不能反映出它们实际发生的可能性。相反,如果没能想到某些可能的危险,那将要承担的风险就会被低估。

相关性错觉。 L. J.查普曼与J.P.查普曼曾描述过一种有趣的偏见,这种偏见是在判断两个同时发生的事件的频率时产生的。他们向受试者提供了几个假设的精神病患者的信息。信息包括每位病人的临床诊断数据和一幅由病人画的人像画。然后,受试者需评估每个诊断(例如妄想症或疑心病)以及人像画中不同特征(例如奇怪的眼睛)的频率。受试者明显高估了自然的联想物同时发生的频率,例如疑心病和奇怪的眼睛的频率。这种效应被称为相关性错觉(illusory correlation)。受试者错误地判断了得到的数据,“重新发现”了许多普遍但无根据的临床知识,这些临床知识就涉及人像画测试的相关解释。相关性错觉效应极度抗拒相互矛盾的数据。即使在症状与诊断呈负相关的情况下,相关性错觉仍然存在,它使受试者不能察觉到真正存在的关系。

可得性为相关性错觉效应提供了自然的解释。根据两个事件相互关联的强度,可以判断出它们同时发生的频率。当两个事件关联性强的时候,你可能会认为它们经常同时发生。因此,强关联常被判断为经常同时发生。根据这个观点,疑心病与奇怪的眼睛的关联性错觉就是由疑心病常会与奇怪的眼睛而引起的,而不是因与人体其他部位相联系而引起的。

从我们的人生经历可知,总的来说,相比发生频率低的例子,我们更能又好又快地回忆起发生频率高的例子,更容易想到可能发生的事,而不是发生概率不高的事。当事件频繁地同时发生时,这两个事件之间的关联性会得以增强。所以,人们可以自由使用可得性启发式的程序,具体是通过提取、构建和联想等相关大脑运作的容易程度来估测类别的数量、事件的可能性或是事件同时发生的频率。然而,前面的例子已经说明,这个有价值的估测过程会导致系统性错误。

判断与锚定

在许多情况下,人们都会通过初始值来确定最后的答案。初始值或起始点,可能是从问题形成之时得到的提示,也可能是在稍微计算之后得到的结果。但无论是前者还是后者,其调整都不会太过充分。不同的起始点会产生不同的估测,都会偏向于初始值。我们将这个现象称为锚定。

不充分的判断。 在某个证明锚定效应的实验中,受试者需要估测不同的数值,并以百分比来进行评定(例如非洲国家在所有联合国成员国中所占席位的百分比)。在猜测每一个数值的时候,受试者面前一个范围为0~100的幸运转盘都会旋转一次。受试者首先需要说明,转盘指针指向的数值比起实际值来说是高了还是低了,然后,再将转盘的指针拨向自己估计的值。不同的小组面对的是不同的初始数字,而这些随机的数值对估计有着巨大的影响。以非洲国家占联合国成员国的百分比为例,转盘指针指向10的小组估测的中值是25,而指针指向65的小组估测的中值是45,其中,10和65就被受试者视为起始点。对于估计要精确的要求也并没能削弱锚定效应的影响。

锚定不只是在受试者被给予相关起始点的情况下发生,当受试者依赖于未完成的计算结果进行估测时,这种情形也会发生。关于直觉性数值估计的研究就说明了这一效应:在黑板上写出一些算式,让两组高中生在5秒之内估计结果。其中一组学生估计下面这个算式的结果

8×7×6×5×4×3×2×1

另一组学生估计以下算式的结果

1×2×3×4×5×6×7×8

想要快速回答这样的问题,人们可能会先计算几步,然后再通过外推或调整得出结果。由于判断的根据并不充分,这样的过程就会导致低估。另外,就前几步的计算结果而言(从左到右进行计算),降序序列得到的结果肯定会比升序序列的结果大。那么,你就会认为第一个序列的结果大于第二个序列的结果。这两种判断都得到了证实。对于升序序列中值的估计为512,对降序序列估测的中值是2 250,但正确的答案应该是40 320。

评估连续事件与非连续事件的偏差。 在巴希勒最近的一次研究中,受试者需要选两个事件中的一个来打赌。该研究应用了三种类型的事件:(1)简单事件,例如从一半是红球一半是白球的口袋中取出一个红球;(2)连续事件,例如从90%是红球、10%是白球的口袋中连续7次抽取红球;(3)非连续事件,例如从10%是红球、90%是白球的口袋中连续取球7次,至少取出一个白球。在这个问题中,相比简单事件的那个赌(概率是0.50),绝大多数受试者都更愿意打连续事件的那个赌(概率是0.48)。而相比不连续事件(概率是0.52),受试者又更愿意打简单事件的赌。因此,在这番比较中,大多数受试者倾向于打的赌都是相对不太可能发生的事件。这样的选择模式证明了一个普遍的发现。对赌的选择以及对概率的判断的研究表明:人们易于高估连续事件的概率,低估非连续事件的概率。这样的偏见是由锚定效应引起的。基本事件的概率(即任意某个阶段的成功)提供了估测连续事件以及非连续事件概率的自然起始点。因为从出发点进行调整显然不会充分,对于上述两种事来说,最后的估测都会与基本事件的概率相接近。请注意,某个连续事件的整体概率会比其中每个基本事件的概率低,而非连续事件的整体概率会比其中每个基本事件的概率高。由于锚定的影响,在连续的问题中,整体概率会被高估;在非连续问题中,整体概率会被低估。

评估复合事件的偏见在计划的情境中尤其明显。成功完成某个任务(例如推广一个新产品)具有连续的特征:要想某个任务成功,该任务中包含的每一个事件就都必须发生。如果需要发生的事件数量众多的话,即使每个事件都很有可能发生,其整体成功的概率也可能会很低。高估连续事件概率这个普遍的倾向会使人们在评估某个计划成功的可能性或能否按时完成时过度乐观,但却缺乏根据。相反,非连续结构总会遭遇风险性的评估。一个复杂的体系,例如核反应或人的身体,如果其中的某个部分出现问题,整个体系就会出现故障。即使每个部分失败的可能性都很小,但若包含很多部分,那么整体失败的概率也可能会很高。因为锚定效应,人们会倾向于低估复杂系统失败的概率。因此,我们有时可以从事件的结构中推测出锚定偏见的方向。连续事件的链式结构会导致高估,非连续事件的漏斗式结构会导致低估。

评估主观概率分布时的锚定。 在决策分析中,专家时常需要以概率分布的形式来表示他们对某个数值(例如某一天的道琼斯指数)的信念。这样的分布通常是根据专家选择的不同数值构建的,而这些数值与其主观概率分布的百分位相对应。例如,判断者可能会被要求挑选出一个数字X90。这样的话,他认为这个数字将会超过道琼斯指数的主观概率就是0.90。也就是说,他选择数字X90,所以愿意接受道琼斯指数不会超过这个数值的比率是9 ∶1。通过几个这样对应于不同百分位数的判断,我们可以构建出道琼斯平均指数的主观概率分布。

通过搜集多个不同数值的主观概率分布,还有可能测试出判断者的度量或校准是否合适。如果待估量值的真实值有II%分布在某位受试者规定的XII值之下,那么这个受试者就在一系列问题中进行了恰当的(或外部)校准。例如1%的量值,其真实值应该分布在X01之下,即X99之上。因此,98%的问题,真实值应该在X01到X99的置信区间内。

几位研究人员已从大量的判断中观察到许多量值的概率分布。这些分布表明了其与恰当的校准之间巨大且系统的偏差。在多数研究中,30%的问题,其待评估量的真实值或小于X01,或大于X99。也就是说,受试者设定的置信区间过小,与他们关于待估量的知识所能证明的相比,反映出了更大的确定性。经验不足与经验老到的受试者都存在这种偏差,而引入合适的积分规则虽能为外部校准提供刺激,但也不能彻底消除偏差。这种效应至少部分是因锚定引起的。

例如,为了选择X90作为道琼斯指数,人们会首先想到自己对道琼斯指数最佳的估测,然后将这个数值上调。如果这个调整和大多数其他调整一样是不充足的,那么X90就不会是极端的。同样的锚定效应在选择X10时也会发生,这时,人们就会将最佳估测向下调整。所以,X10到X90之间的置信区间将会太小,而待估量的概率分布就会更紧密。一种程序能够系统地改变主观概率分布,使最佳估测值不作为初始值,这也支持了这种解释。

某个给定的量(比如道琼斯指数)的主观概率分布可以通过两种不同的方法得以实现:(1)要求受试者选择与自己的概率分布的特定百分位数相符合的道琼斯指数;(2)要求受试者估测出的真实值超过特定数值的概率。这两种方法在形式上是等同的,因此应该产生相同的分布。然而,这两种方法体现出的是不同锚定下不同的判断模式。在方法(1)中,自然的起始点是人们对变量的最佳估测。此外,在方法(2)中,受试者可能将锚定点定在了问题中给定的数值上。或者,他可能将锚定定位在相等的概率上,即50–50的概率,因为这是估测可能性通常的起始点。无论哪种情况,方法(2)得到的概率应该不会像方法(1)那样极端。

为了对比这两种方法,研究人员给一组受试者24个量值(例如从新德里到北京的空中距离),并要求他们在每一个问题上估计X10或X90。另外一个组的受试者得到的是第一组受试者对24个数值中每个评估结果的中值。他们被要求评估每个给定的数值超过相应量值的真实值的概率。在没有任何偏见的干扰下,第二组受试者应该提取出和第一组相同的概率,即9 ∶1。然而,如果使用50%的概率或给出的数值作为锚定,第二组的概率也应该更不极端,即接近于1 ∶1。事实上,第二组给出的所有问题的概率中值都是3 ∶1。当对两组受试者的判断进行外部校准时,发现第一组的受试者太过极端,这与早前的研究结果相符合。他们估测的发生概率为0.10的事件实际上有24%发生了。相反,第二组受试者太过保守。他们认为平均概率为0.34的事件实际发生的概率只有26%。这些结果说明了校准的程度取决于引导的程序。

讨论

本附录关注的是依赖于判断启发式的认知偏见。我们不能把这些偏见归因于激励效应,比如一相情愿的想法或是因为报酬和罚款而扭曲的判断。实际上,尽管受试者被鼓励应尽量准确,而且答案正确的话还能得到奖赏,但还是会犯前面所提到的严重的判断性错误。

对启发式的依赖性以及偏见的普遍存在,并不局限于普通人。有经验的研究人员在凭直觉进行思考时,同样易于犯偏见的错误。例如,受过广泛训练的人在进行直觉判断时,也会有在没能充分考虑先验概率的情况下预测最能代表数据的结果这一倾向。尽管这些研究人员在统计学方面的经验可以使其避免类似于赌徒谬误的基本错误,但他们的直觉性判断还是容易在更为复杂的问题中犯类似的谬误。

类似于代表性和可得性等有用的启发式可以得以保留,即使它们有时会导致预测或估测的错误。这一点并不会使我们惊奇,而可能会使我们惊奇的是,人们不能从其人生经历中推断出基本的统计学规则,例如回归平均值或是样本大小对样本可变性的影响。尽管在人的生命历程中,每个人都会遇到许多这样的例子,很少有人能独自发现样本和回归性的原则。我们不能从每天的经历中学习到统计学的规则,因为相关的例子不能被恰当地解释。例如,人们不会发现,某文本中连续几行单词的平均词汇长度比连续几页中单词的平均长度变化更大,因为无论是几行或者几页,人们根本就不会注意到单词平均长度的问题。所以,人们不能了解到样本大小和样本可变性的关系,尽管相关数据比比皆是。

缺少恰当的编码也能解释为什么人们在判断概率时通常不能察觉到偏见。人们可以通过在分配的同样概率的事件中保持实际发生事件的比例,来了解自己的判断是否是外在度量的。但是,用判断所得的概率来将事件分组并不合适。那么,在分组缺乏的情况下,某个人就不可能知道他分配的有0.9或更高的概率的预测,有50%会真正发生。

认知偏差的经验分析对于判断的概率理论及应用角色方面都有一定的意义。现代决策理论将主观概率视为某个理想化的人量化的观点。具体来说,对某个给定事件的主观概率可被定义为某个人是否愿意接受有关这个事件的赌注。如果这个人在不同赌注之间的选择满足于特定的规则,比如概率论的公理,那么内在一致或是连贯的主观概率就可以被引申出来。引申出的概率是主观的,原因是不同的人可以对同样的事件作出不同的概率评估。这种方法最主要的贡献是提供了对概率严格主观的解释,这个解释能够应用于独特的事件,也能应用于理性决策的普遍理论中。也许应该注意一点,我们有时可能从对赌注之间的偏好中推断出主观概率,但通常主观概率并不是由此而形成的。某个人愿意给A队下赌注而不是B队,是因为他相信A队更有可能会赢,他并不是从自己对赌注的偏好中推断出这个想法的。因此,在现实中,主观概率会决定我们对赌注的偏好,但我们并不是从这些偏好中推断出主观概率的,就如同理性决策中不证自明的理论一样。

概率内在的主观本质使许多学生相信一致性或内在一致性是判断概率唯一有效的准则。从主观概率的形式理论来看,任何内在一致的可能性判断和其他判断都是一样的。这个准则并不完全令人满意,因为内在一致的主观概率可能和人们抱有的其他信念相抵触。例如某个人对抛硬币游戏所有可能结果的主观概率就反映了赌徒谬误。即他推测硬币更可能是呈反面,因为已经连续出现了多次正面。这样的判断可能是有内在一致性的,因此,根据形式理论,这是一个恰当的主观概率。然而,这样的概率与硬币是没有记忆的这一人们普遍持有的信念不相符,因此不能产生序列依存。若对判断的概率进行充分和理性的考虑,就会发觉对内在一致性的解释并不充分。判断必须与人们持有的所有信念相容。但不幸的是,还没有简单且正式的方法去测评一系列概率的判断与判断者整体信念系统的相容性。不过,理性判断者会努力争取这种相容,即使利用内在一致性能更容易完成判断和评估。特别是,理性判断者会尝试使自己对概率的判断与自己相关的知识、概率的规则以及个人的判断启发式和偏见相容。

结语

本文描述了在不确定的情况下进行判断的三种启发式:(1)代表性。人们通常在需要判断物体A是否属于类别B或是事件A是否属于过程B时,就会使用代表性;(2)事件的可得性。当人们需要估测某类事件发生的频率或是某个特定进展的合理性时,就会使用可得性。(3)通过锚定进行调整。当相关数值可得时,许多预测都会用到锚定。使用这些启发式不仅能节约很多时间,大多数时候也很奏效,但它们也会导致一些系统性的错误。更好地理解这些启发式和它们带来的偏见,能够在不确定的情境下提高判断和决策的质量。

附录B 选择、价值以及框架

(1983年8月,我在美国心理协会大会上发言时用的就是这篇文章,后来因此被授予卓越科学贡献奖。这篇文章最初发表在《美国心理学者》杂志上。)

摘要:我们已经讨论了在风险状况以及无风险状况下,作选择时认知和心理的决定因素。价值的心理物理学会使人们在获利概率大时选择规避风险,在损失概率大时选择冒险。概率中体现的心理物理学使得人们过于重视确定的事情和不可能发生的事(与一般的概率性事件相对)。决策问题可用多种关于不同偏好的方式来进行描述或建构,这与理性选择的不变性准则相矛盾。心理账户过程(人们在此过程中会组织交易的结果)可以解释一些消费行为中的反常现象。是否采取某个选择取决于这个选择可能的负面结果是被评估为一种成本还是无法补偿的损失。我们将讨论决策价值和体验价值之间的关系。

人们总是在做决策,做决策时可能是有意识的,也可能是无意识的,就像是在念散文。如此看来,决策制定也自然会涉及众多学科,包括数学和统计学、经济学和政治科学,以及社会学和心理学。对决策的研究不但解决了规范性问题,也解决了描述性问题。规范性分析涉及理性的本质和决策制定中的逻辑。而描述性分析涉及的却是人们真实的观念和偏好,而不是人们应有的观念和偏好。规范性和描述性考虑问题间的对峙就是判断和决策研究的主要内容。

在分析决策制定时,通常会将有风险的决策和无风险的决策区分开来。是否会去赌钱(赢的概率确定)是具有风险的决策的典型例子,而是否会接受将某件商品或某项服务换成钱或劳力则是没有风险的决策的典型例子。本文第一部分分析了有风险前景价值的认知和心理物理学的决定因素。第二部分介绍的是这种分析在交易和贸易中的运用。

风险性选择

做出类似是否带雨伞或是否参战这种有风险的决策时,人们是不会知道其结果的。因为还有很多不确定因素在里面,比如天气好坏或敌人的强弱。是否会做出某项决策可以被看成是否会打某种赌,当然,是赌就会产生不同的结果,且不同的结果会有不同的概率。因此,对于在一定风险下的决策制定的研究关注的就是在简单的赌钱和确定的概率间的决策,并希望这些简单的问题能对风险和价值的研究有所启示。

我们在研究风险决策问题时提出了一套方案,此方案的许多假设都是从人们对金钱和概率反应的心理物理学分析中得来的。对于决策制定的心理物理学分析最早出现在丹尼尔·伯努利于1738年发表的一篇有重要影响力的文章中。伯努利在这篇文章里试图解释为什么人们总是会选择风险规避,而随着财富增长选择风险规避的意愿却降低了。为了更明白地说明风险规避和伯努利的分析,请思考这样一个问题:我们现在面临两种选择,一种是有85%的概率赢得1000美元(15%的概率什么也得不到),一种是肯定会得到800美元。虽然从数学的角度来看,选择冒险会得到更多的好处,但大多数人还是更愿意选择确定的事。赌钱的结果是经权衡后的平均值,这种平均值在计算时会把每种可能的结果进行权衡。在刚提到的问题中,赌一把的结果可表示为0.85×1000+0.15×0 =850(美元),这比选择确定的事(肯定会得到800美元)所得到的钱要多。选择确定的事就是风险规避。大体来看,选择确定的事而不是赌一把(所得结果更多或同等)被称为风险规避;不选择确定的事,而愿意赌一把(可能性更小或相等)被称为风险追求。

伯努利建议不要通过收益结果来评估前景,而是要通过这些结果的主观价值来评估。某次赌的主观价值也是一种经过权衡后的平均值,但在这里,每种结果的主观价值是通过其发生的可能性来权衡的。为了在这个框架下解释风险规避,伯努利提出主观价值或者说是效用,可用收益的凹函数来表示。例如,在这种函数下,200美元和100美元间效用的不同比1 200美元和1 100美元间效用的差异更明显。从函数凹处可以看出,得到800美元的主观价值比得到1 000美元的价值的80%要大。因此,效用函数的凹处也就意味着是风险规避,人们会选择肯定能得到800美元,而不是有80%的概率得到1 000美元,尽管这两种可能最终得到的钱数一样。

在决策分析中,常用总财富状态来描述决策的结果。例如,一个下20美元赌注的抛硬币游戏,就可以表示成在个人当前的财富状态W和等概率的可能变成W+20美元或W–20美元的财富状态间的选择。这种表示方法在心理学上是不现实的,因为人们通常不会从财富状态出发来考虑概率相对较小的结果,人们常会从收益、损失和中立的结果(比如维持现状)的角度来考虑。如果主观价值的表示方式如我们提出的那样,是财富的变化而不是最终的财富状态,那么对于结果的心理物理学分析就应该应用到获得和损失上来,而不是应用于总财产上。这种假设在对待有风险的选择方面发挥着重要作用,我们称之为前景理论。无论是通过反省还是心理物理学的测量,都表明主观价值是个关于获得多少的凹函数。同样的归纳也适用于描述损失。损失200美元和100美元的主观价值的区别要比损失1 200美元和1 100美元的主观价值的区别要大。当把获得和损失的价值函数结合到一起时,我们就得到了一个S形的函数,如图B–1所示。

图B-1

图中显示的价值函数是由获得和损失来定义的,而不是通过总财富值来定义的。在获得的情况下是凹面,在损失的情况下是凸面,损失情况下的曲线比获得情况下的曲线更陡。该图表示的情况就是损失厌恶,表明了获得某笔钱的吸引力要弱于人们想要规避某笔损失的意愿。损失厌恶解释了为什么人们不愿在抛硬币的游戏中选择有同等概率的赌注:可能的收益的吸引力并不足以抵消可能的损失带来的厌恶。例如,在以大学生为样本的抛硬币实验中,如果赢得的收益不到30美元,大多数受试者都会拒绝冒10美元的风险。

对风险决策的假设在经济理论中占有核心地位。然而,正像收益曲线的凹面表示的是风险规避一样,损失曲线的凸面也表示着风险追求。确实如此,在损失的情况下选择风险追求作用很大,尤其是在损失的概率很大时。例如,人们在有85%的概率损失1000美元(15%的可能性什么也不损失)和肯定会损失800美元间作出选择时,大多数人都愿意选择赌一把而不是选择确定的损失。这就是风险追求。因为赌一把的期望值(–850美元)比确定事件的期望值(–850美元)要低。在损失情况下的风险追求已经得到了一些研究员的证实。即使在结果不涉及钱时,这种结论也得到了证实,比如疼痛时间和生命的损失。在获益的情况下选择风险规避和在损失的情况下选择风险追求是错的吗?这些偏向与对得失的主观价值的强烈直觉相符合,其前提是人们可自由选择对获得和损失的自我价值。然而,我们会看到这条S形价值函数曲线所显示的含义时,从规范的角度来看,它是不被接受的。

为了解决规范的问题,我们从心理学转向决策理论。现代的决策理论最早可追溯到冯。诺依曼和摩根斯顿的研究。他们创建了几条定性原则或公理,而且这些原则和公理能左右理性的决策制定者的偏向。其中的公理包括有传递性(如果A比B更受青睐,B比C更受青睐,那么A就比C更受青睐)、替代性(如果A比B更受青睐,那么赢得A或C青睐的可能性就比赢得B或C青睐的可能性更大),以及其他一些技术性公理。针对理性决策公理的规范化和描述化状态已经有了广泛的讨论。特别是有证据显示,人们不总是遵从替代性公理,而且对于这个公理的规范性优点还有很多反对意见。然而,所有关于理性决策的分析都包含了两条原则:主导性和不变性。

主导性要求如果前景A在各方面和前景B都一样好,但至少A在一方面强于B,那A就应比B更受青睐。不变性要求在众多前景中的偏向不应依从于描述的方式。特别是,如果两种表达方式不同的问题同时出现,能被界定为实质是相同的,那么这两种表达方式不在同一时间出现时,人们也应该对它们持有同样的偏向。现在,我们给出了不变性的要求,这种要求虽然看上去很基础且无关紧要,但人们却不是总能做到。

结果的框架

风险前景的特点表现在它们可能的结果以及产生这些结果的概率方面。然而,同样的选择会以不同的方式来构架或描述。例如,一次赌的可能结果可以被构架成现状的获得或损失,或是包含最初财富的资产状态。不变性要求不能因为对结果描述的不同而改变自己的偏向。下面的这两个问题违反了这个要求。N表示每个问题的受试者总数,括号里是选择每个选项的人数比例。

问题1(N=152):设想美国可能爆发一种异常的亚洲疾病,这种疾病可能导致600人死亡。有两种方案来应对疫情,假设下面是对每种方案结果准确的科学预测:

如果采取方案A,可救治200人。(72%)

如果采取方案B,有1/3的概率救治600人,2/3的概率无人获救。(28%)

你会选择哪种方案?

问题1的表达模式可作为此事件的一个参考状态,即该疾病会夺去600条生命。两种方案的结果包括这种参考状态以及通过被救者的数量而量化得来的收益情况。就像期待的那样,偏好是一种风险规避:绝大多数受试者更愿意选择能保证有200人获救的方案,而不是有1/3的可能性救600人的方案。现在来考虑另一个问题,还是同样的情况,但两种方案用的是另一种方式表述:

问题2(N=155):

如果采取方案C,400人死亡。(22%)

如果采取方案D,1/3的概率没有人死,有2/3的概率600人全部死亡。(78%)

很容易看出问题2中的方案C和D与问题1中的方案A和B在本质上没有差别。然而问题2中假设的参考点是没有人会因为该疾病而死亡。最好的结果是维持该参考状态,其相对的情况是因该疾病致死的人数来量化的损失。用这些参考状态来评估作出的选择可表明,人们会偏向于赌一把(方案D)的风险追求,而不是肯定会丧失400条性命的风险追求。实质上,在第二个问题中的风险追求比在第一个问题中的风险规避代价更大。

没能遵守不变性这一现象非常普遍,且难以克服。这在经验丰富的受试者和初级受试者中都很常见,即使相同的受试者在几分钟内回答这两种问题,也无法消除这一现象。面对两种相互矛盾的回答,受试者也时常不解。但即使再读一遍该问题的陈述,他们也会在“生命拯救”的说法中选择风险规避,在“生命死亡”的说法中选择风险追求。而且他们在两种说法中都希望能遵守不变性,且给出一致的回答。在他们不断地迎合下,框架效应更像是感觉错觉而不是计算上的错误。

下列问题引出了违反理性决策的主要要求的偏向。

问题3(N=86):请在下列选项中作出选择:

E:25%的概率赢得240美元,75%的概率失去760美元。(0)

F:25%的概率赢得250美元,75%的概率失去750美元。(100%)

很容易看出F比E更占优势。实际上,所有的受试者也都是这样选择的。

问题4(N=150):设想你需要同时对下面两个问题做出决策。

先看一下两个决策,之后选出你偏爱的那一项。

决策(1)在下列两者中选择:

A.肯定会得到240美元。(84%)

B. 25%的概率得到1000美元,75%的概率什么也得不到。(16%)

决策(2)在下列两者中选择:

C.肯定会损失750美元。(13%)

D. 75%的概率损失1 000美元,25%的概率什么也不损失。(87%)

通过前面的分析可以看出,在第一个决策中,大多数受试者会对确定的事选择风险规避;更多的受试者在第二个决策中选择风险追求,而不是确定的事。事实上,73%的受试者选择A和D,而只有3%的受试者选择了B和C。同样的结果模式也出现在问题的另一种说法中,在这种说法中,大学生们选择了他们能够真正参与的博一把。

受试者会同时考虑问题4中的两个问题,因此,相对于B和C,他们会偏向于A和D。然而,受试者的偏向(A和D)往往受放弃的选择的控制。若把肯定会得到的收益(选项A)增加到D选项上,会产生有25%的概率赢得240美元和75%的概率失去760美元的结果。这正是问题3中的选项E。同样,把750美元确保的损失(选项C)增加到B选项上,会产生25%的概率得到250美元和75%的概率失去750美元的结果,这也正是问题3中的F选项。因此构架的敏感性以及S形的价值函数在一些需要同时做出决策的事件中与主导因素相违背。

能运用这些结果的地方并不理想:不变性从规范上来看是至关重要的,直觉是很吸引人的,但从心理学角度看却无法实现。我们只设想了保证不变性的两种方式。第一种就是采取可将任何问题、实质等同的表达方式转化成完全一样的常规表述。我在给经济系的学生上课时,常会将这点作为最基本的原理告诫他们,他们应该在思考每一个决策问题时,从总值的角度考虑,而非仅从收益和损失上考虑。这样的表述可避免违背在先前问题中提到的不变性,但执行起来却很难。除了特殊情况,也就是从获得和损失的角度考虑钱财结果比从当前的财富状态考虑更普遍。此外,风险前景的常规表述需要计算同时出现的决策(例如问题4)的所有结果,而计算这些同时出现的决策的难度超过了对简单问题直觉上的计算。在其他条件下用常规表述更困难,这些条件包括安全性、健康性或生活质量。我们是否应该建议人们,通过计算因某种疾病致死的总数,或因研究中某种特殊疾病而致死的人数,去评估公共卫生政策(例如问题1和2)?

另一种可以保证不变性的方法是通过保险精算的结果来评估某项选择,而非通过心理学的结果来评估。在人们的生活中,保险精算的准则有一定的吸引力,但对于涉及钱的决策而言,这样的准则明显不够。应该说,该准则在伯努利时期就被意识到了,而且对于缺少客观量度标准的结果完全不适用。总之,构架不变性很难被预测,而且人们在某个特殊选择中的自信不能确保其在另外一个框架下还会做出同样的决策。因此,用多种方法来构架决策问题的行为来测试偏向的稳定性是个不错的方法。

概率的心理物理学

到目前为止,我们假设伯努利的期望原则所依据的是某种不确定前景的价值或效用,该原则是通过增加每种可能结果的效用而得来的,每个结果的效用又都是通过概率来加以权衡的。为了测试这个假设,我们再从心理物理学角度出发。将当前的状态价值设为零,想象有份价值300美元的收益,我们将这份收益的价值设为1。现在假设你只有一张彩票,且该彩票的单次奖励是300美元。这张彩票的价值会怎样随着赢得奖励的可能性函数而改变?除了赌一把的效用外,这种前景的价值一定会在零(当赢得的概率为零时)和1(确定赢得300美元)之间变化。

按照直觉,彩票的价值并不是获胜概率的线性函数,正如期望原则推导出的那样。从零到5%的增长比从30%到35%的增长有更大的影响力,而相对于从95%到100%的增长,影响就显得小了。综合考虑各方面可得出种类—边界效应:即从不可能到可能,或从可能到确定的变化比变化范围内的变化有更大的影响力。这种假设体现在图B–2的曲线上,该曲线以函数的形式标出了对某事件众多可能性的权重。该图最大的特点是关于规定的可能性,决策权重会成回归状态。除了终点附近,获胜的概率每增加0.05,赢得奖励的价值就会增长不到5%。我们接下来要研究的就是在有风险的选择中,对偏向的心理物理学假设的含义。

在该图中,决策权重在很大的范围内要低于相应的概率。过低权衡确定事件的中等或高概率会降低能得到奖励的赌局的吸引力,从而在会有所得的选择中使人们选择风险规避;同样,在损失的情况下,也会通过减弱对赌局中的损失厌恶而选择风险追求。然而,小概率事件常被过高权衡,且非常小的概率不会被过高权衡或完全忽视,使得这个区域内的决策权重很不稳定。对低概率过高权衡推翻了前面描述的规律模式:它提高了风险大的赌注的价值,提高了对于小概率的严重损失的厌恶值。最终,人们通常在未必有收益的情况下选择风险追求,在未必有损失的情况下选择风险规避。因此,决策权重的特点解释了彩票和保险政策吸引人的原因。

图B-2

决策权重的非线性必然会违背不变性,下列两个问题就说明了这一点:

问题5(N=85):假想有如下两个阶段的游戏。在第一个阶段,有75%的概率在游戏最后什么也得不到,有25%的概率会进入到第二个阶段。如果你进入第二个阶段,可以在下面两个选项中作出选择:

A.肯定会获得30美元。(74%)

B.80%的概率获得45美元。(26%)

你必须在游戏开始前作出选择,也就是说,要在第一个阶段结果出来前选择。

问题6(N=81):请在下面两个选项中作选择:

C.25%的概率获得30美元。(42%)

D.20%的概率获得45美元。(58%)

由于在问题5中有25%的概率进入到第二个阶段,选项A有25%的概率获得30美元,选项B有80%(0.25×0.80 = 0.20)的概率获得45美元。因此,问题5和问题6在概率和结果方面是相同的。不过,这两种说法的偏向却不同:在问题5中,绝大多数人更喜欢获得小数目钱的高概率选择;而在问题6中,情况却正相反。现实和假设的收益(当前,其结果用钱来表示),生命的拯救和丧失,以及概率过程的非连续表示都已经证实了这种与不变性的违背。

我们认为,不变性之所以被证实不成立是由于两种因素的相互作用:即概率的构架和决策权重的非线性。具体说,我们认为,人们会忽略问题5中的第一个阶段(不管是否已经做出决策,都会产生相同的结果),且只专注于进入第二个阶段后会发生什么。当然,在这种情况下,如果人们选择A,肯定会有所获得;但如果人们更愿意赌一把,就会有80%的概率获得收益。的确,在需要作出连续选择的问题中,人们的选择会和在肯定会获得30美元且有85%的概率获得45美元间的选择相同。因为相比有一般或较高概率的事件来说,确定事件会被过高权衡,肯定会获得30美元的选项就比需要连续做出决策的问题选项更具吸引力。我们将这种现象称为虚假确定性效应,因为实际上不确定的事件在被权衡时会被看成是确定的。

可能性范围的低端也出现了类似的现象。假设你嫌保险费太高而不确定要不要买地震保险。就在你犹豫不决的时候,保险代理说你可以有另一个选择:“你可以选择支付一半的保险费,若地震发生的日子是奇数,你就能获得全额的保险金。”但为什么很多人会认为这种保险没有吸引力呢?图B–2给出了答案。在低概率范围内任意处(设为P点)开始,概率从P降低到P/2的决策权重的影响会比从P/2减小到零的影响小得多。因此,风险降低一半不会使得只需一半的保险费更具吸引力。

对概率保险的厌恶主要有三个原因。第一,传统上对保险的解释是从凹线效用函数的角度出发的,而概率保险显然违背了这一点。按照期望效用函数理论,当普通的保险可被接受时,概率保险应该比普通保险更受欢迎。第二,概率保险有多种形式的防御措施,比如做医疗检查、购置新轮胎或安装防盗系统。这些措施没有完全排除所有的危害,却有效地降低了某些危害的可能性。第三,意外事件的构架也会影响人们是否购买保险。例如,火灾保险不包含洪水造成的灾难,这种保险政策就会被评估为是对某种特定危险(比如火灾)的完全防护,或总财产损失的可能性的降低。

从图B–2可以发现,相对于完全消除危险而言,人们过低估计了降低发生危险的可能性。因此,当将保险被描述成可以消除危险而不只是降低危险时,保险会更具吸引力。的确,正如斯洛维克,费斯科霍夫和利希滕斯坦所说的那样,假设某种疫苗可将发病率从20%降低到10%,若这种疫苗被描述成可治愈一半的病人时,与其被描述成对相同症状的病毒的一半完全有效得到的吸引力相比,其对公众的吸引力更小。

公式化效应

我们已经谈到,构架效应可表明不变性也有不成立的时候。现在,我们将目光转移到控制结果和事件框架的过程上。公共卫生问题就体现了公式化效应,若把“生命拯救”的说法换为“生命丧失”,其偏向会从风险规避转变为风险追求。很显然,受试者采用了问题里面给出的关于结果的描述,并将结果评估为收益和损失。麦克尼尔、鲍克、萨班斯和特沃斯基提出了另一种关于公式化效应的例子。他们发现,当用死亡和存活来描述肺癌可能出现的结果时,医生和病人对治疗方法的偏向差异非常大。外科手术不像放射性治疗那样,在治疗期间会有一定的死亡风险。因此,用死亡来描述外科手术的结果比用存活率来描述的吸引力更小。

医生或者总统顾问,可以不用歪曲或隐藏事实,只构架事件发生的结果和可能性就能左右病人或总统的决策。公式化效应可能会偶然发生,人们可能会意识不到框架效应对最终决策的影响。公式化效应也可以被利用起来控制选项的相对吸引力。泰勒指出,信用卡行业的说客总是说,信用卡和现金在购买力上的区别可被表示为现金可打折,而不是信用卡可超额使用。这两种表述通过分配比平常价钱更少或更多的钱,将不同的价钱用获得或损失来构架。由于损失给人们带来的感受比收益带来的感受强烈,相对于放弃折扣,消费者更不愿意额外付费。正如人们所预期的那样,在商界和政界,试图影响框架构架的尝试经常发生。

由于价值函数的非线性,以及人们有从问题的陈述所给出或隐含的参考点去评估某种选择的倾向,因此,对结果的评估易受公式化效应的影响。值得注意的是,在其他情况下,人们会自主地将同样的信息用同样的表达方式来加以转换。对语言理解力的研究指出,人们会将听到的东西迅速地转化为抽象的表述,这种表述不能再区分该想法是用主动还是被动的形式来表达的,且不能再辨别实际所说的和暗指的、假定的或包含的意思。不幸的是,自主地进行这些运作的大脑机制不能完成将公共健康问题或死亡率、存活率的统计问题转化成普通的抽象任务。

交易与贸易

我们可将对框架构架以及价值的分析应用到多属性选择中,比如是否接受某项交易或贸易。为了评估多属性选择,我们作出了这样的假设,人们会建立一个心理账户,并用此说明某个选项的优点和缺点,这与多属性的参考状态相关联。某项选择的总体价值是通过相对于其参考状态的优缺点的平衡状态得以实现的。因此,当某个选项的优点多于其缺点时,这个选项就会被采纳。在作这种分析时,人们会从心理学上(而非从实际角度)将优缺点分开来考虑。该模式没有规定要把不同的特点综合起来,从而形成对优缺点的整体考虑,但在这种模式下考虑问题时需要作出凹面曲线和损失厌恶的假设。

我们对于心理账户的分析得益于理查德。泰勒的研究,他揭示了心理账户的过程和消费者行为之间的相关性。下面的问题来自萨维奇和泰勒曾举过的例子,他们通过这个例子引入了控制心理账户的原则,并表明了从价值曲线到是否接受交易的过渡。

问题7:设想你要买一件125美元的夹克和一个15美元的计算器。去买计算器时,那家商店的销售员告诉你,另一家分店正在搞促销,10美元就可以买到你想要的这款计算器,开车20分钟就能到那家店。你愿意去那家店吗?

这个问题的重点在于你是否接受销售员的提议,这个提议将路程的不便捷和价格上的优惠相结合,可被构架成一个最小限度的涉及主题或全面综合的理论。最小限度的理论只包括两种选项的不同,并忽视这两种选项共有的特点。在最小限度理论中,驱车到另一家店可被构架成有5美元的收益。涉及主题的理论将可能的选择同参考水平联系起来,且参考水平是通过引起决策的情境来确定的。在先前的问题中,相应的主题是购买计算器,因此,去另一家店的意义就被构架成价格降低(从15美元降低到10美元)。由于价格的节省只与计算器有关,夹克的价格就没有包含在涉及主题的理论中。夹克的价格以及其他的花销可以包含在更加全面综合的理论中,在这个理论中,节约与每月消费相联系。

前面的问题模式在最小账户、局部账户或综合账户中处于中立。但我们却表示,人们会自然而然地用局部账户来构架决策,在制定决策时,该账户的作用在感觉上和“好的形式”发挥的作用相似;在认知上,和基本层次范畴相似。局部事件和价值曲线使得为了节省5美元去另一家店买计算器的意愿与计算器的价格相反,与夹克的价格无关。为了验证这个预测,我们用另一种说法来表达这个问题,其中两种商品的价格是可以互换的。某家商店的计算器卖125美元,分店里卖120美元,夹克的售价为15美元。和预期一样,在这个问题的两种说法中,愿意去分店的人数比例大相径庭。结果显示,68%的受试者(N=98)会为了节省5美元(原价15美元的计算器)愿意去分店,但在93名受试者中,只有29%的人愿意为了节省5美元(原价125美元的计算器)跑去分店。这个问题的两种说法在最小账户和综合账户中是相同的,因此,这个发现证明了局部账户的概念。观察发现,一个城市不同商店中同种商品报价的标准偏差与平均值大致成比例,通过这个观察得出,在消费者行为中,局部账户有着重要作用。消费者肯定希望买到物美价廉的商品,这就必然会影响到价格的差别,这些结果表明,相对于为50美元的商品节省5美元来说,消费者对于为了150美元的商品节省15美元没有太大的兴趣。

局部账户使得人们从相关而不是单独的角度来评估收益和损失,导致金钱交换率有很大变动,比如为买到好商品而打电话的次数,或驾车行驶较长距离的意愿。大多数消费者认为相对于买一辆汽车或一幢房子而言,买车载音响或波斯地毯较为容易。当然,这些现象和消费者行为的标准理论背道而驰,消费者行为理论对不变性作出假设,并且意识不到心理账户的影响。

下面的问题是关于心理账户的例子,在这个例子中,某笔账目中的花费受局部账户的左右:

问题8(N=200):设想你想看一场电影,每张票的价格是10美元。入场时,你发现票丢了。座位没有标记,而且票又找不到。

你愿意花10美元再买一张票吗?

愿意。(46%)

不愿意。(54%)

问题9(N=183):设想你打算看一场电影,每张票的价格是10美元。入场时,

你发现丢了10美元。

你现在还愿意花10美元买一张票吗?

愿意。(88%)

不愿意。(12%)

对这两个问题的不同回答很能引起人们的兴趣。为什么很多人在丢了票以后不愿意再花10美元,而丢了与票价相当的钱后却愿意再花10美元?我们将这点不同归因于局部账户。去电影院被看成是种交易,其中买票的钱被交换成看电影。再买一张票提升了看电影的成本,以至于很多受试者都认为这难以接受。相反,丢的钱没有被纳入电影的成本中,这只会使得个人感觉自己的财富减少了一点,从而影响买票的决定。

当将问题的两种说法呈现给同样的受试者时,有趣的事情发生了。若丢钱的说法紧随着丢票的说法出现,人们会更愿意再买张票。相反,丢钱后再买票的意愿没有因为此前另一个问题的出现而受到影响。两个问题的同时出现显然使受试者将丢票视为丢钱是有理可依,但反过来却不是这样。

心理账户作用的规范化状态会被质疑。之前列出的问题,比如公共卫生问题的两种说法只是形式不同,而计算器和电影票问题的两种说法则是本质上的不同。尤其是在购买15美元的商品时,节省5美元很具吸引力;而在较大花销的商品上可以节省5美元时,吸引力就没有这么大了。同时,相对丢了10美元而言,一张电影票花双倍的钱更令人懊恼。后悔、沮丧以及自我满足感都会受到框架效应的左右。如果这样的从属结果被认为是合理的,那么观察到的受试者的偏向也就没有和不变性原则相矛盾,也就不会被视为不一致或因错误而被排除。从另一个角度说,从属结果也会在反思之后发生改变。当人们在购买200美元的商品而无法节省10美元时,从15美元的商品上节省5美元的满足感就会被破坏。我们不建议用相同的方式来解决任何有相同首要结果且有两种解决方案的问题,但我们建议可以将另一种框架效应的系统检测作为一种有效的反思方法,帮助决策制定者评估其决策的首要或次要结果的价值。

损失和成本

许多决策问题都以在维持现状和选择一个替代选项的形式出现。这些替代选项在某些方面是有利的,而在其他方面又是不利的。早期用于线性风险前景的价值分析可运用到这种决策中来,其方法是通过假设现状可定义问题所有因素的参考水平。替代选项的有利点会被评估成收益,而其不利点会被评估为损失。因为损失比收益的影响更大,决策制定者会偏向于维持当前现状。

泰勒用“禀赋效应”这个词来描述人们不愿意分隔属于自己的资产。当放弃资产的痛苦大于获得收益时的愉悦时,购买价格会远低于出售价格。也就是说,人们为了获得某物而付出的最高价钱,会低于使他们放弃已有资产的最低补偿价。泰勒列举了消费者与企业家的行为中一些关于禀赋效应的例子。一些研究发现,在假设和现实交易中,买入价格和出售价格都会有本质的不同。这些结果是对标准经济理论的质疑。在标准经济理论中,除了交易成本和财富效应外,买价和售价应保持一致。我们还发现,在假设的周薪(S)不同和工作地点的温度(T)不同的工作中选择时,受试者也会迟疑。我们让受试者想象他们的工作有特定的周薪和温度(S1,T1),并且他们可以换另一份工作(S2,T2)(这份工作在周薪和温度两者中有一点优于前一份工作,而另一点不如前一份工作)。我们发现,大多数处在(S1,T1)的受试者不愿意换到(S2,T2),而且处于(S2,T2)的受试者也不愿换到(S1,T1)。很显然,在薪水或者工作环境差异相同的情况下,不利点显得比有利点更为突出。

总的来说,损失厌恶偏向于稳定而非改变。假设有一对兴趣相同的双胞胎,他们认为某两种环境对自己的吸引力相同。出于某种原因,两人被迫分开,并分别置身于这两种环境中。他们很快会将自己的环境设为参考点,并据此评价对方环境的优缺点。两人对两种环境都不再漠视了,并且都更愿意待在自己所在的环境中。因此,偏向的不稳定产生了对稳定的偏向。除了偏向稳定而不是变化以外,适应性和损失厌恶的结合通过降低已排除的选项以及他人“禀赋”的吸引力,对悔恨和忌妒产生了有限的保护。

损失厌恶及其禀赋效应在传统的经济交易中发挥的作用不是很大。例如,商店老板不会认为付给供货商的钱是损失,也不会将从顾客那里得到的钱视为收益。而是将一段时期的成本和收益累加起来,仅就平衡状态进行评估。在评估前,相匹配的借款和贷款会被有效地取消。消费者支付的钱不会被评估为损失,而是种购买。在标准经济理论的分析下,我们很自然地认为可以用金钱购买到的商品和服务来代表金钱本身。当某人在头脑中有特定的选择时,如“我能买个新相机或者新帐篷”,该评估模式会被明确制定。在这种分析下,如果相机的主观价值超过了保留买相机的钱的价值的话,人们往往选择买相机。

在某些情况下,不利点可被构架为成本或损失,尤其是当买保险也能被构架为是在肯定的损失和可能的更大损失间的选择时。在这些情况下,成本—损失间的差异会导致违背不变性的情况发生。例如,请在肯定损失50美元和有25%的概率损失200美元间作出选择。斯洛维克、费斯科霍夫和利希滕斯坦指出,80%的受试者选择风险追求,即想赌一把而不是接受确定的损失。不过,只有35%的受试者拒绝花50美元为25%的概率损失200美元上保险。舒梅克尔和昆鲁斯以及赫尔歇和舒梅克尔也得出了类似的结论。我们认为,同样多的钱在第一个问题中被构架为了无法补偿的损失,在第二个问题中被构架为预防损失的花费。相对于消费而言,损失更让人厌恶,因此两个问题中的模式化偏向相颠倒。

在收益的情境下,我们也观察到了相似的结果,如下列问题所示:

问题10:你会接受一个有10%的概率获得95美元、90%的概率损失5美元的赌吗?

问题11:有种抽奖有10%的概率赢得100美元、90%的机会什么也得不到,你愿意花5美元参加这种抽奖吗?

有132个大学生回答了这两个问题,且两个问题间有个填充问题。有一半的受试者看到的问题顺序是调换的。虽然很容易看出这两个问题的选项从客观上看是一致的,但有55名受试者给出了不同的偏向。有42位受试者在问题10中不愿意赌一把,却在与问题10有着相同结果的问题11中选择了参加抽奖。这种看上去似乎是无关紧要的研究说明了消费—损失矛盾和框架效应的力量。相比将5美元看做损失,将这5美元当做支付的钱,使得冒这个险更加容易令人接受。

之前的分析表明,通过将损失的结果构架成消费而不是损失时,人们的主观状态会被提升。我们可以将这种心理改变解释为废弃—损失效用(dead-loss effect)的矛盾行为。泰勒提到过一个例子,在这个例子中,某个人交了网球俱乐部的会费,其技能很快就变得非常棒,即使生病了也坚持去俱乐部,为的是不浪费已交的会费。假设此人如果没有交会费就不去练习,那么问题就出现了:伤病期练习怎么能提高其水平?我们认为,带病训练是将会费评估成一种消费。如果停止练习,则此人就会被迫将会费视为完全的损失,这可能比带病练习更让人厌恶。

结语

效用和价值的概念一般会被用在两个完全不同的意义中:(1)体验价值:高兴或悲伤的程度、对结果真实体验的满足感或痛苦;(2)决策价值:预期结果对某个选项中总的吸引力或厌恶的影响。由于体验价值和决策价值常被假设成是一致的,所以两者的区别在决策理论中并不明显。这个假设是理想化的决策者持有的概念的一部分,理想化的决策制定者能准确地预测未来的事情,并以此来评估自己的决策。但对于普通的决策制定者而言,其体验价值与决策价值的一致性不会太完美。影响体验的某些因素是很难预测的,而且一些影响决策的因素对结果的体验并没有产生与其相当的影响力。

相对于决策制定的大量研究而言,对于这种将享乐体验与主观状态相联系的心理物理学的研究还不是很系统化。享乐的心理物理学最基本的问题就是,测定出能从消极结果中区分出对积极结果的认可或渴望。享乐的参考点在很大程度上是由客观现状决定的,但其也会受期望值和社会比较的影响。例如,在某位员工升职比办公室里其他人慢时,客观进步就会被认为是一种损失。随处境变化而体验到的愉悦或痛苦也依靠于享乐适应的动态变化。布里克曼和坎贝尔就享乐跑步机的概念提出了激进假说,即快速的适应性会使得任何客观进步的影响都很短暂。享乐体验的复杂与微妙使决策制定者很难预测结果的真实体验。很多人选择在非常饿的时候去点菜是很不明智的,当第五道菜端上桌来时,他们就会承认这是个错误的做法。决策价值和体验价值的不匹配引发了很多决策问题中额外的不确定因素。

框架效应的普遍性以及对不变性的违背使决策价值和体验价值之间的关系更加复杂了。结果框架时常引出在实际体验中与之无法对应的决策价值。例如,分别用死亡和生存来构架肺癌治疗方法似乎不会影响到体验,尽管这种方法对决策有很大的影响。然而在其他情况下,决策框架不仅影响了决策,还影响了体验。例如,某笔花费被构架为无法补偿的损失或保险费的话,很可能就会影响到人们对结果的体验。在这些情况下,制定决策时,对结果的评估不仅能预期到体验,还能构架模式。


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注