从此走进深度人生 Deep net, deep life.

分类: 社会分析

  • 理查德·道金斯《自私的基因》1-9

    目录
    前言
    第1章 为什么会有人呢?
    第2章 复制因子
    第3章 不朽的双螺旋
    第4章 基因机器
    第5章 进犯行为:稳定性和自私的机器
    第6章 基因种族
    第7章 计划生育
    第8章 代际之战
    第9章 两性战争
    第10章 你为我搔痒,我就骑在你的头上
    第11章 觅母:新的复制因子
    第12章 好人终有好报
    第13章 基因的延伸
    第14章 基因决定论与基因选择论
    第15章 对于完美化的制约

    前言

    读者不妨把本书当作科学幻想小说来阅读。笔者构思行文着意于引人深思,唤起遐想。然而,本书绝非杜撰之作。它不是幻想,而是科学。“事实比想象更离奇”,暂不论这句话是否有老生常谈之嫌,它却确切地表达了笔者对客观事实的印象。我们都是生存机器——作为运载工具的机器人,其程序是盲目编制的,为的是永久保存所谓基因这种禀性自私的因子。这一事实直至今天仍使我惊叹不已。我对其中的道理虽已领略多年,但它始终使我感到有点难以置信。我的愿望之一是能够凭此使读者惊叹不已。

    在写作过程中似乎有3位假想的读者一直在我背后不时地观望,我愿将本书奉献给他们。第一位是我们称之为外行的一般读者。为了他,我几乎一概避免使用术语。在不得已使用专门术语的地方,我都一一详加说明。我不明白为什么我们不把一些学术性刊物里的大部分术语也删掉呢?虽然我假定外行人不具备专业知识,但我却并不认为他们愚昧无知。只要能做到深入浅出,就能使科学通俗易懂。我全力以赴,试图用通俗的语言把复杂艰涩的思想通俗化,但又不丧失其精髓。我这样尝试的效果如何尚不得而知。我的另一个抱负是,让这本书成为一本引人入胜、扣人心弦的读物,使其内容无愧于题材。但这方面我能取得多大成功,心中也毫无把握。我一向认为,生物学犹如神话故事那样迷人,因为事实上,生物学的内容就是神话故事。本书的题材理应激发读者产生莫大的兴趣并带来启发,但我所能做到的充其量不过是沧海一粟,再多我也不敢奢望了。

    第二个假想的读者是个行家。他是一个苛刻的评论家,对我所用的一些比拟笔法和修辞手段很不以为然。他总是喜欢用这样的短语:“除此之外……”,“但在另一方面……”,“啧!啧!”我细心地听取了他的意见,纯粹为了满足他的要求,我甚至把书中的一章全部重写了一遍。但归根结底,讲述的方式毕竟还是我的选择。这位专家对我的写作方式恐怕不会完全没有微词吧!但我仍极为热切地希望,即使是他也能在拙作中发现一点新内容,也许是对大家所熟悉的观点的一种新见解,甚至受到启发产生出自己的新观点。如果说我的这种心愿太大,那么,我是否可以希望,这本书至少能为他的旅途消愁解闷?

    我心目中的第三位读者是位从外行向内行过渡的学生。如果他至今还没有抱定目标要在哪一方面成为专家,那么我要奉劝他考虑一下我所从事的专业——动物学。动物学固然自有其“实用价值”,且大部分动物又有其逗人喜爱之处,但除此之外,研究动物学有其更为深远的意义:因为宇宙万物之中,我们这些动物当属最为复杂、设计最为完美的“机器”了。既然如此,弃动物学而选择其他学科就令人费解了!对那些已经献身于动物学研究的学生来说,但愿本书能有一定的教育价值,因为他们在学习过程中孜孜不倦钻研的经典理论著作和专业书籍,正是笔者撰写本书的依据。如果他们发现经典理论著作难以理解,那么我的深入浅出的论述,作为入门或辅助材料之类的读物,也许对他们有所助益。

    显然,要同时迎合3种类型的读者的口味势必要冒一定的风险。我只能说,对此我始终是十分清楚的。不过,考虑到我的这种尝试所能带来的种种益处,我甘愿冒这种风险。

    我是个行为生态学家,所以动物行为是本书的主题。我接受过行为生态学的传统训练,从中获得的教益是不言而喻的。特别值得一提的是,在牛津大学我曾在廷贝亨[1]指导下工作过12个年头。在那些岁月里,他对我的影响之深,恐怕连他自己也想不到。“生存机器”这个词语虽非实际出自他口,但说成是他的首创亦不为过。近年来,行为生态学受新思潮的冲击而生机勃发。从传统观点来说,这股思潮的来源不属行为生态学的范畴。本书在很大程度上即取材于这些异军突起的思想。这些新思想的倡导者主要是威廉斯、史密斯、汉密尔顿和特里弗斯,我将分别在有关章节中提及。

    各方人士为本书的书名提出过许多建议,我已将他们建议的名称分别移作有关各章的题目:“不朽的双螺旋”,来自克雷布斯(John Krebs);“基因机器”,来自莫里斯;“基因种族”,来自克拉顿-布罗克(Tim Clutton-Brock)和简·道金斯,为此我向他们表示谢意,另外,特向斯蒂芬·波特(Stephen Potter)表示歉意。

    尽管假想的读者可以作为寄托虔诚希望的对象,但同现实生活中的读者和批评家相比,毕竟无太大实际意义。笔者有一癖好,文章非改上几遍不肯罢休。为此,玛丽安·道金斯不得不付出艰辛的劳动。对我来说,她对生物学文献中渊博知识的掌握,对理论问题的深刻理解,以及她不断给予我的鼓励和精神上的支持,都是我从事此项工作不可或缺的。克雷布斯也阅读了全书初稿。有关本书的议题,他的造诣比我深,而且他毫不吝惜地提出许多意见和建议。格莱尼丝·汤姆森(Glenys Thomson)和沃尔特·博德默(Walter Bodmer)对我处理遗传学论题的方式提出过既诚恳又严厉的批评,而我所做的修改恐怕还不能完全使他们感到满意,但我希望他们会发现修订后的稿子已有所改进。他们不厌其烦地为我花费了大量时间,对此我尤为感激。约翰·道金斯以其准确无误的眼力指出了一些容易使人误解的术语,并提出了难能可贵的修改意见。我不可能找到比马克斯韦尔·斯坦普(Maxwell Stamp)更适合、更有学问的“外行”了。他敏锐地在初稿中发现了一个反复出现的文体缺陷,这对我完成最后一稿助益匪浅。最后,我还要向牛津大学出版社的罗杰斯表示谢忱。他审阅过我的手稿,所提意见富于助益;此外,在安排本书的出版时,他做了许多分外的工作。

    理查德·道金斯 1976年

    第1章 为什么会有人呢?

    行星上的智慧生物开始思索自身存在的道理时,才算真正成熟。如若宇宙空间的高级生物莅临地球的话,为评估我们的文明水平,他们可能提出的第一个问题是:“他们发现了进化规律没有?”30多亿年来,地球上一直存在着各种生命有机体,但对生命存在的道理,它们始终一无所知。后来,有一个人终于弄懂了事实真相,他就是达尔文(Charles Darwin)。说句公道话,其他人对事实真相也曾有过一些模糊的想法,但对我们存在的道理第一个做了有条理、站得住脚的阐述的却是达尔文。好奇的孩子常会问:“为什么会有人呢?”达尔文使我们能够在面对这个问题时,给出一个切合实际的回答。生命有意义吗?人生目的何在?人是什么?我们在面对这些深刻的问题时,无须再求助于怪力乱神。著名动物学家辛普森(G.G.Simpson)在提出上面最后一个问题之后,曾这样说过:“现在我要讲明的一点是,1859年之前试图回答这一问题的一切尝试都是徒劳无益的,如果我们将其全部置于脑后,我们的境遇会更好些。”*

    今天,人们对进化论产生疑问,犹如怀疑地球绕着太阳转的理论,但达尔文进化论的全部含义仍有待人们去了解。在大学里,动物学仍是少数人研究的课题,即使是那些决定选学这门课的人,往往也没有理解其深刻的哲学意义。哲学以及被称为“人文学科”的课程,现在讲授起来,仍好像不曾有过达尔文此人。毫无疑问,这种状况以后将会改变。不管怎样,本书并无意于全面地宣扬达尔文主义,而着眼于探索进化论对一个特定问题所产生的种种影响。我的目的是研究自私行为和利他行为在生物学上的意义。

    除了学术意义,这个主题对人类的重要性也显而易见。它关乎我们人类生活的各个方面,我们的爱与憎、斗争与合作、馈赠与盗窃、贪婪与慷慨。这些本来是洛伦茨(Lorenz)的《论进犯行为》(On Aggression)、阿德里(Ardrey)的《社会契约》(The Social Contract)和埃布埃尔-埃尔布菲尔特(Eibl-Eibesfeldt)的《爱与憎》(Love and Hate)探讨的主题。这3本书的问题在于它们的作者铸下了大错。他们犯错是因为他们误解了进化论。他们错误地假定进化的关键在于物种(或者种群)的利益,而不是个体(或者基因)的利益。可笑的是,阿什利·蒙塔古(Ashley Montagu)批评洛伦茨,说他是“(相信)‘大自然是残酷无情的’的19世纪思想家的‘嫡系’……”。在我看来,洛伦茨和蒙塔古是半斤八两,二人都拒斥丁尼生这个著名短语的含义。与二人不同,我认为这句话极好地概括了我们对自然选择(理论)的现代理解。

    我在开始论证之前,想先扼要地说明一下这是一种什么样的论点,以及不是什么样的论点。如果有人告诉我们,某人在芝加哥黑社会中长期过着荣华富贵的生活,我们就能够对他是什么样的人做一些猜测。我们可以想见,他的性格粗暴鲁莽,动辄开枪,而且能吸引忠贞不贰的朋友。而推论并非是万无一失的。但如果你知道一个人是在什么情况下生活和发迹的,那你就能够对他的性格做出某些推断了。本书的论点是,我们以及其他一切动物都是各自的基因所创造的机器。在一个具有高度竞争性的世界上,像芝加哥发迹的匪徒一样,我们的基因生存了下来,有的存续长达几百万年。这使我们有理由在我们的基因中发现某些特性。我将要论证,成功基因的一个突出特性就是其无情的自私性。这种基因的自私性通常会导致个体行为的自私性。然而我们也会看到,基因为了更有效地达到其自私的目的,在某些特殊情况下,也会滋长一种有限的利他主义。上句中,“特殊”和“有限”是两个重要的词。尽管我们可能觉得这种情况难以置信,但对整个物种来说,普遍的爱和普遍的利益在进化论上简直是毫无意义的概念。

    因此,现在我要讲一下本书所不准备论证的第一点。我并不提倡以进化论为基础的道德观*,我只是讲事物是如何进化的,而不是讲人类应该怎样行动才符合道德准则。我之所以强调这一点,是因为我知道我有被人误解的危险。有些人不能把阐述对事物的认识同提倡事物这两件事区别开来,此类人实在为数太多。我自己也觉得,生活在一个单纯以基因那种普遍的、无情的自私性法则为基础的人类社会中将会令人厌恶至极。然而我们无论怎样感到惋惜,事实毕竟就是事实。本书的主旨在于引起读者的兴趣,如果你想从中引出某种教益,那么阅读时,可以视之为一种告诫。如果你也和我一样希望为了共同的利益,建立一个人与人之间慷慨大度、相互无私合作的社会,那你就不能指望从生物的本性获得什么助益。让我们设法通过教育把慷慨大度和利他主义灌输到人们头脑中去吧!因为我们生来就是自私的。让我们懂得我们自私的基因居心何在,至少可以有机会去打乱它们的计划,而这是其他物种从来没能做到的。

    上述有关教育的议论,必然表明下面的观点是错误的:从遗传学的角度来看,继承下来的特性是明确固定、不容改变的。这是一种极为常见的谬见。我们的基因可以驱使我们的行为自私,但我们也不必终生屈从。如果我们在遗传上生来就是利他性的,再去学利他主义也许不那么困难。在动物中,只有人类受文化也受后天获得的以及继承下来的影响的支配。有人可能会说,文化是如此之重要,以至于不论基因自私与否,它与我们对人类本性的理解毫不相干。另有一些人也会不同意这种说法,这完全取决于在作为人类特性的决定性因素“是天性还是教养”的辩论中,你站在什么立场上。这就使我要讲一讲本书不准备论证的第二点。在“本性和教养”的争论中,本书不支持这一或那一立场。当然我有自己的观点,但我不打算表达出来,只在第13章中,把我的观点融合到了我阐述的文化观点中。如果确实证明基因同现代人的行为毫不相干,如果在动物界中我们在这方面确实是独一无二的,那么至少探究一下我们在如此短期内成为例外的规律,仍将兴味无穷。而假如我们这一物种并不像我们一厢情愿的那样是个例外的话,研究这一规律就更加重要。

    本书不准备论证的第三点是,不对人类或其他某一种动物的行为细节进行描述。只有在举例说明时,我才使用有事实根据的细节。我不会说:“如果你看一下狒狒的行为,就会发现它们的行为是自私的,所以人类的行为也可能是自私的。”我的关于“芝加哥匪徒”的论证在逻辑上与此迥然不同。真实情况是,人和狒狒都是经由自然选择进化而来的。如果你注意一下自然选择进行的方式,似乎可以得出这样的结论:经由自然选择进化而来的任何东西应该都是自私的。因此我们可以预见到,当我们去观察狒狒、人类和其他一切生物的行为时,一定会发现它们的行为是自私的。如果我们发现自己的预见是错误的,如果我们所观察到的人类行为的确是利他性的,我们就会遇到某些令人迷惑不解的事情,需要进行阐明。

    我们需要有一个定义,然后再进一步探讨。如果一个实体,例如狒狒,其行为的结果是牺牲自己的利益,从而增进了另一同类实体的利益,该实体就被认为是具有利他性的。而自私行为的效果恰好相反。我们所谓的“利益”就是指“生存的机会”,即使行为的效果对事实上的生与死所产生的影响小得微不足道。人们现在体会到,对生存概率的影响,在表面上看来,哪怕是极微小的,也能够对进化发生很大的作用。这是对于达尔文学说最新解释所产生的一个令人吃惊的后果,因为这种影响有大量的时间可供其发挥作用。

    上述有关利他和自私的定义是指行为上的,而不是指主观意识上的,弄清这一点至关重要。在这里我的旨趣不在动机的心理学方面,我不准备去论证人们在做出利他行为时,是否“真的”私下或下意识地抱有自私的动机。他们或许是,或许不是,也许我们永远也不可能知道。但无论怎样,这些都不是本书所要探讨的内容。我的定义只涉及行为的效果,是降低还是提高这个假定的利他主义者生存的可能性,以及这个假定的受益者生存的可能性。

    说明行为对生存所产生的远期影响是一件异常复杂的事情。事实上,在把这一定义运用于实际行为时,我们必须用“明显的”这个词来修饰提到的实际行为。一个明显的是利他性的行为表面看去似乎(不管可能性何其小)使利他主义者有较大的可能死亡,而受益者有较大的可能生存下来。更仔细地观察一下,我们常常会发现明显的利他行为实际上是伪装起来的自私行为。我要再次声明,我绝不是说它们的潜在动机都是自私的。我的意思是,这种行为对生存可能性所产生的实际效果,同我们原来的设想正好相反。

    现在我来举一些明显的自私以及明显的利他行为的例子。每当讨论我们自己这一物种时,要避免思想上的主观性习惯是困难的,因此我将以其他动物为例。先举一些具有代表性的有关个体动物的自私行为的例子。

    黑头鸥集群筑巢,巢与巢之间相距仅几英尺,雏鸥刚出壳,娇嫩幼小无防卫能力,易被吞食。一只黑头鸥等到它的邻居转过身去,或许趁它去捉鱼时,便扑上前去将它邻居的一只雏鸥一口囫囵吞下去,这种情况相当普遍。就这样它吃了一顿营养丰富的大餐,而不必再费神去捉鱼了,也不必离开它的巢,使其失去保护。

    雌螳螂那种喜食同类的可怕习性,更是人们所熟知的。螳螂是食肉的大昆虫,它们一般吞食比它们小的昆虫,如苍蝇等。但它们会袭击几乎一切活的东西。交配时,雄螳螂小心翼翼地爬到雌螳螂背上,骑着进行交配。雌螳螂一有机会就把雄螳螂吃掉,首先把头咬掉,这发生在雄螳螂接近时,或在刚一爬上去之后,或在分开之后。按理说,雌螳螂似乎应等到交配完,再开始吃雄螳螂。但脑袋的丢失,似乎并不会打乱雄螳螂身体其余部分进行交配的进程。的确,由于某些神经抑制中心位于昆虫的头部,把头吃掉可能反而会改善雄性的性活动。*如果是这样的话,那倒不失为一种额外收获。主要的收获是雌螳螂饱餐了一顿。

    虽然这些同类相食的极端例子同我们的定义很契合,但“自私”这个词就未免有点轻描淡写了。对于南极洲帝企鹅的那种所谓胆怯的行为,我们也许更能直接地寄予同情。可以看到它们伫立在水边,由于有被海豹吃掉的危险,在潜入水中之前踌躇犹疑。只要有一只先潜入水中,其余的就会知道水中是否有海豹。自然没有哪一个肯当试验品,所以大家都在等,有时甚至相互往水中推。

    更为常见的自私行为可能只不过是拒绝分享某些珍视的东西,如食物、地盘或配偶等。现在举一些明显的利他性行为的例子。

    工蜂的刺蜇行为是抵御蜂蜜掠夺者的一种十分有效的手段。但执行刺蜇的工蜂是一些敢死队队员。在刺蜇这一行动中,一些生命攸关的内脏通常要被拖出体外,工蜂很快就会因此而死去。它的这种自杀性使命可能把蜂群储存的重要食物保存了下来,而它们自己却不能活着受益了。按照我们的定义,这是一种利他性行为。请记住,我们所议论的不是有意识的动机。在利他性行为以及自私性行为的例子中,这种有意识的动机可能存在,也可能不存在,但这些同我们的定义都不相干。

    为朋友献身显然是一种利他性行为,但为朋友冒点风险也是一种利他性行为。有许多小鸟在看到捕食类飞禽,如鹰飞近时会发出一种特有的警告声,鸟群一听到这种警告声,就采取适当的逃避行动。非直接的证据表明,发出这种警告声的鸟使自己处于特别危险的境地,因为它把捕食者的注意力引到了自己身上。这种额外风险并不算大,然而按照我们的定义,乍看之下至少还称得上是一种利他性行为。

    动物利他行为中最普通、明显的例子,是父母,尤其是母亲对其子女所表现的利他性行为。它们或在巢内,或在体内孕育这些小生命,付出巨大代价去喂养它们,冒很大风险去保护它们免受捕食者伤害。在这里只举一个具体例子,许多在地面筑巢的鸟类,当捕食者,如狐狸等接近时,会上演一出“调虎离山计”。雏鸟的母亲一瘸一拐地离开巢穴,同时把一边的翅膀展开,好像已经折断。捕食者认为猎物就要到口,便舍弃那个有雏鸟安卧其中的鸟巢。在狐狸的爪子就要抓到雌鸟时,它终于放弃伪装,腾空而起。这样,一窝雏鸟就可能安然无恙,但它自己却要冒点风险。

    我不准备以讲故事的方式来阐明一个论点。经过选择的例子对任何有价值的概括来说从来就不是重要的证据。这些故事只不过是用来说明在个体水平上,我所讲的利他性行为以及自私性行为是什么意思。本书将阐明如何用我称之为基因的自私性这一基本法则来解释个体自私性和个体利他性。但我首先需要讲一下人们在解释利他性时常犯的一个特别错误,因为它流传很广,甚至在学校里被广为传授。

    这种错误解释的根源在于我已提到过的,生物之进化是“为其物种谋利益”或者是“为其群体谋利益”这一错误概念。这种错误的概念如何渗入生物学领域是显而易见的。动物的生命中有大量时间是用于繁殖的,我们在自然界所观察到的利他性自我牺牲行为,大部分是父母为其下一代而做的。“使物种永存”通常是繁殖的委婉语,物种永存无疑是繁殖的一个必然结果。只要在逻辑推理时稍微引申过头一点,就可以推断,繁殖的“功能”就是“为了”使物种永存。从这一推断再向前迈出错误的一小步,就可得出结论说,动物的行为方式一般以其物种的永恒性为目的,因而才有对同一物种的其他成员的利他主义行为。

    这种思维方式能够以模糊的达尔文主义的语言表达出来。进化以自然选择为动力,而自然选择是指“适者”的有差别的生存。但我们所谈论的适者是指个体,种属,物种,还是其他什么?从某种意义上说,这并无多大关系,但涉及利他主义时,这显然是至关重要的。如果在达尔文所谓的生存竞争中进行竞争的是物种,那么个体似乎可以恰如其分地被认为是这种竞争中的马前卒。为了整个物种的更大利益,个体就得成为牺牲品。用词稍雅一点,一个群体,如一个物种或一个物种中的一个种群,如果它的个体成员为了本群体的利益准备牺牲自己,这样的一个群体灭绝的可能性要比与之竞争的另一个将自己的自私利益放在首位的群体小。因此,世界多半要为那些具有自我牺牲精神的个体所组成的群体所占据。这就是温-爱德华兹(Wynne-Edwards)在其一本著名的书中公之于世的“类群选择”理论。这一理论后为阿德里在其《社会契约》一书中所普及。另一个正统的理论通常叫作“个体选择”理论,但我个人却偏爱使用“基因选择”这一名词。

    对于刚提出的上述争论,“个体选择”论者可以不假思索地这样回答:几乎可以肯定,即使在利他主义者的群体中也有少数持不同意见者拒绝做出任何牺牲。假如有一个自私的叛逆者准备利用其他成员的利他主义,按照定义,它比其他成员更可能生存下来并繁殖后代。这些后代都有继承其自私特性的倾向。这样的自然选择经过几代之后,利他性的群体将会被自私的个体淹没,就不能同自私性的群体分辨开来了。我们姑且假定开始时存在无叛逆者的纯粹利他性群体,尽管这不大可能,但很难看出又有什么东西能够阻止自私的个体从邻近的自私群体中移居过来,然后由于相互通婚,玷污了利他性群体的纯洁性。

    个体选择论者也会承认群体确实会消亡,也承认一个群体是否会灭绝可能受该群体中个体行为的影响。他们甚至可能承认,只要一个群体中的个体具有远见卓识,就会懂得克制自私贪婪,到头来成为它们的最大利益所在,从而避免整个群体的毁灭。但同个体竞争中那种短兵相接、速战速决的搏斗相比,群体灭绝是一个缓慢的过程,甚至在一个群体缓慢地、不可抗拒地衰亡时,该群体中的一些自私的个体,在损害利他主义者的情况下,仍可获得短期的繁荣。

    尽管类群选择的理论在今天已得不到那些了解进化论的专业生物学家多大的支持,但它仍具有巨大的直观感召力。历届动物学学生在进入大学之后,都惊奇地发现这不是一种正统的观点。这不该责怪他们,因为在为英国高级生物学教师编写的《纳费尔德生物学教师指南》一书中,我们可以找到下面这句话:“在高级动物中,为了确保本物种的生存,会出现个体的自杀行为。”这本指南的不知名作者幸而根本没有意识到他提出了一个有争议的问题。在这方面这位作者和诺贝尔奖得主洛伦茨所见略同。洛伦茨在《论进犯行为》一书中讲到进犯行为在物种保存方面的功能时,认为功能之一是确保只有最适合的个体才有繁殖的权利。这是个典型的循环证明。但这里我要说明的一点是,类群选择的观点竟如此根深蒂固,以至于洛伦茨像《纳费尔德生物学教师指南》的作者一样,显然不曾认识到,他的说法同正统的达尔文学说是相抵触的。

    最近我在英国广播公司电视节目中听到一个有关澳大利亚蜘蛛的报道。节目中提到一个同样性质的、听来使人忍俊不禁的例子,如没有这个例子,那倒是一档相当精彩的节目。主持这一节目的“专家”评论说,大部分蜘蛛幼虫最后为其他物种所吞食。然后她继续说:“这也许就是它们生存的真正目的,因为要保存它们的物种,只需要少数几个个体生存就行。”

    阿德里在《社会契约》中用类群选择的理论解释整个社会的秩序。他明确地认为,人类是从动物这条正路偏离出来的一个物种。阿德里至少是个用功的人,他决定和正统的理论唱反调是经过充分论证的。为此,他应受到赞扬。

    类群选择理论之所以具有巨大的吸引力,原因之一也许是它同我们大部分人的道德和政治观念完全相吻合。作为个人,我们的行为时常是自私的,但在我们以高姿态出现的时刻,我们赞誉那些后天下之乐而乐的人,虽然对“天下”这个词所指的范围如何理解,我们仍莫衷一是。一个群体范围内的利他行为常常同群体之间的自私行为并行不悖。从另一个意义来说,国家是我们利他性自我牺牲的主要受益者。青年人作为个体应为国家整体的更大荣誉而牺牲,令人费解的是,在和平时期号召人们做出一些微小的牺牲,放慢他们提高生活水平的速度,似乎比在战争时期要求他们献出生命的号召更难奏效。

    最近出现了一种同民族主义和爱国主义背道而驰的、代之以全人类的物种作为我们同情的目标的趋势。这种把我们的利他主义目标加以人道主义的拔高,带来一个有趣的必然结果——进化论中的“物种利益”这一概念似乎再次得到了支持。政治上的自由主义者通常是物种道德最笃信不疑的代言人,而现在却对那些稍微扩大一些利他主义范围以包括其他物种的人极尽其嘲笑之能事。如果我说我对保护鲸鱼免受捕杀比对改善人类的居住条件更感兴趣,很可能会使我的某些朋友大为震惊。

    同一物种中的成员同其他物种的成员相比,前者更应得到道义上的特殊考虑,这种情感既古老又根深蒂固。非战时杀人被认为是日常犯罪中最严重的罪行。受到我们文明更加严厉的谴责的唯一一件事是吃人(即使是吃死人),然而我们却津津有味地吃其他物种的成员。我们当中许多人在看到那些哪怕是人类最可怕的罪犯被执行死刑时,也觉得惨不忍睹,但我们却兴高采烈地鼓励射杀那些相当温顺的供观赏的动物。我们确实是以屠杀其他无害物种的成员作为寻欢作乐的手段的。一个人类的胎儿,所具有的人类感情丝毫不比一个阿米巴[1]多,但它所享受的尊严和得到的法律保护却远远超过一只成年的黑猩猩。黑猩猩有感情,有思维,而且最近的试验证明,黑猩猩甚至能够学会某种形式的人类语言。就因为胎儿和我们同属一个物种,就立刻被赋予相应的特殊权利。我不知道能否将“物种主义”的道德[赖德(Richard Ryder)用语]置于一个比“种族主义”更合理的地位上,但我知道,这种“物种主义”在进化生物学上是毫无正当依据的。

    在生物学上,按照进化理论,关于利他主义应该在什么程度上表现出来尚存争论。这种争论正好反映出与之平行的,在人类道德中关于利他主义在什么程度上是可取的——家庭、国家、种族、物种以及一切生物——所存在的争论。对于群体成员之间因竞争而相互交恶的情况,甚至连类群选择论者也会觉得不足为奇。但值得一问的是,类群选择论者如何决定哪一级的水平才是重要的呢?如果说可以选择在同一物种的群体之间以及在不同物种之间进行,那么选择为什么就不能在更高一级的群体之间进行呢?物种组成属,属组成科,科组成目,目组成纲。狮子和羚羊与我们一样,同属哺乳纲。难道我们不应该要求狮子“为了哺乳纲的利益”,不要再去杀害羚羊吗?为了不致使这一纲灭绝,毫无疑问,它们应该去捕食鸟类或爬行动物。可是,照此类推下去,为了使脊椎动物这一门全部永恒地存在下去又该怎样呢?

    运用归谬法进行论证,同时揭示类群选择理论无法自圆其说的困境,当然对我很有利,但明显存在的个体的利他行为仍有待解释。阿德里竟然说,对于像汤姆森氏瞪羚(Thomson’s gazelles)的跳跃这种行为,类群选择是唯一可能的解释。这种在捕食者面前夺目的猛跳同鸟的警告声相似,因为这种跳跃似乎是在向其同伴报警,同时明显地把捕食者的注意力吸引到跳跃者自己身上。我们有责任对这种跳跃行为以及类似现象做出解释,这就是我在后面几章中所要探讨的问题。

    在深入讨论之前,我必须为我的信念辩解几句。我认为,从发生在最最低级的水平上的选择出发是解释进化论的最好方法。我的这一信念深受威廉斯的伟大著作《适应与自然选择》(Adaptation and Natural Selection)的影响。我要运用的中心观点,可以追溯到19世纪末20世纪初基因学说尚未出现的日子,那时魏斯曼[2]的“种质的延续性”(continuity of the germ-plasm)理论已预示出今日的发展。我将论证的选择的基本单位,也就是自我利益的基本单位,既不是物种,也不是群体,严格说来,甚至也不是个体,而是遗传单位基因。*对于某些生物学家来讲,这乍听起来像是一种极端的观点。我希望,在他们理解了我的真正意思时,会同意这种观点实质上是正统的,尽管表达的方式与众不同。进行论证需要时间,而我们必须从头开始,以生命起源为其开端。

    第2章 复制因子

    天地伊始,一切单一纯简。即使是简单的宇宙,要说清楚它是怎样开始形成的又谈何容易?而复杂的生命,或能够创造生命的生物是如何突然出现,而且全部装备齐全的,我想,这无疑是一个更难解答的问题。达尔文的自然选择进化论是令人满意的,因为它说明了由单一纯简变成错综复杂的途径,说明了杂乱无章的原子如何能分类排列,形成越来越复杂的模型,直至最终创造人类。人们一直试图揭开人类生存的奥秘,而迄今为止只有达尔文提供的答案是令人信服的。我打算用更为通俗的语言阐明这个伟大的理论,并从进化还未发生以前的年代谈起。

    达尔文的“适者生存”其实是稳定者生存(survival of the stable)这个普遍法则的广义特殊情况。宇宙为稳定的物质所占据。所谓稳定的物质,是指原子的聚合体,它因具有足够的稳定性或普遍性而被赋予这个名称。它可能是一个独特的原子聚合体,如马特霍恩(Matterhorn)[1],它存在的时间之长值得人们为之命名。稳定的物质也可能是属于某个种类(class)的实体,如雨点,它们出现得如此频繁以至于理应有一个集合名词作为名称,尽管雨点本身存在的时间是短暂的。我们周围看得见的以及我们认为需要解释的物质——岩石、银河、海洋的波涛——虽大小不同,却都是稳定的原子模型。肥皂泡往往是球状的,因为这是薄膜充满气体时的稳定形状。在宇宙飞船上,水也稳定成球形的液滴状,但在地球上,由于地球引力的关系,静止的水的稳定表面是水平的。盐的结晶体一般是立方体,因为这是把钠离子和氯离子聚合在一起的稳定形式。在太阳里,最简单的原子即氢原子不断聚变成氦原子,因为在那样的条件下,氦的结构比较稳定。遍布宇宙各处的星球上,其他各种甚至更为复杂的原子正在形成。依照目前流行的理论,早在宇宙大爆炸之时,这些比较复杂的原子已开始形成。我们地球上的各种元素也来源于此。

    有时候,原子相遇后经化学反应会结合成分子,这些分子具有程度不同的稳定性。它们可能很大。一颗钻石那样的结晶体可以视为一个单一分子,其稳定程度是众所周知的,但同时又是一个十分简单的分子,因为它内部的原子结构是无穷无尽地重复的。在现在的生命有机体中,还有其他高度复杂的大分子中,它们的复杂性在好几个方面表现出来。我们血液中的血红蛋白就是典型的蛋白质分子。它由较小的分子氨基酸的链组成,每个分子包含几十个精确排列的原子。在血红蛋白分子里有574个氨基酸分子,它们排列成4条互相缠绕在一起的链,形成一个立体球形,其结构之错综复杂实在使人眼花缭乱。一个血红蛋白分子的模型看起来像一棵茂密的蒺藜,但和真的蒺藜又不一样,它并不是杂乱的近似模型,而是毫厘不爽的固定结构。这种结构在人体内同样地重复60万亿亿次以上,其结构完全一致。血红蛋白这样的蛋白分子,其酷似蒺藜的形态是稳定的,就是说,它的两对由序列相同的氨基酸构成的链,像两条弹簧一样倾向于形成完全相同的立体盘绕结构。在人体内,血红蛋白蒺藜以每秒约400万亿个的速度形成它们“喜爱”的形状,而同时另外一些血红蛋白以同样的速度被破坏。

    血红蛋白是个现代分子,人们通常用它来说明原子趋向于形成某种稳定结构的原理。我们在这里要谈的是,远在地球还没有生命之前,通过一般的物理或化学过程,分子的某种形式的初步进化现象可能就已存在。没有必要考虑诸如预见性、目的性、方向性等问题。如果一组原子受到能量的影响而形成某种稳定的结构,它们往往倾向于保持这种结构。自然选择的最初形式不过是选择稳定的模式并抛弃不稳定的模式罢了,这里面并没有什么难以理解的地方,事物的发展只能是这样。

    可是,我们自然不能因此认为,这些原理本身就足以解释一些结构复杂的实体,如人类的存在。取一定数量的原子放在一起,在某种外界能量的影响下,不停地摇动,有朝一日它们会碰巧落入正确的模型,于是亚当[2]就会降临!这是绝对办不到的。你可以用这个方法把几十个原子变成一个分子,但一个人体内的原子多得不计其数,如果想制造一个人,你就得摇动你那个生化鸡尾酒混合器,摇动的时间之久,就连宇宙存在的漫长岁月与之相比都好像只是一眨眼的工夫。即使到了那个时候,你也不会如愿以偿。在这里,我们必须求助于达尔文学说的高度概括的理论。有关分子形成的缓慢过程的故事只能讲到这儿,其他的该由达尔文的学说去解释了。

    有关生命的起源,我的叙述只能是纯理论的。事实上当时并无人在场。在这方面存在很多观点对立的学说,但它们也有某些共同的特点。我的概括性叙述大概与事实不会相去太远。*

    生命出现之前,地球上有哪些大量的化学原料,我们不得而知。但很可能有水、二氧化碳、甲烷和氨:它们都是简单的化合物。就我们所知,它们至少存在于我们太阳系的其他一些行星上。一些化学家曾经试图模拟地球在远古时代所具有的化学条件。他们把这些简单的物质放入一个烧瓶中,并提供如紫外线或电火花之类的能源——原始时代闪电现象的模拟。几个星期之后,在瓶内通常可以找到一些有趣的东西——一种稀薄的褐色溶液,里面含有大量的分子,其结构比原来放入瓶内的分子来得复杂。值得一提的是研究人员在里面找到了氨基酸——用以制造蛋白质的构件(building block),蛋白质乃是两大类生物分子中的一类。在进行这种试验之前,人们认为天然的氨基酸是确定生命是否存在的依据——如果人们在火星上发现了氨基酸,那么火星上存在生命似乎是可以确定无疑的了。但在今天,氨基酸的存在可能只是意味着在大气层中存在一些简单的气体,还有一些火山、阳光和发生雷鸣的天气。近年来,在实验室里模拟生命存在之前地球的化学条件,结果获得了被称为嘌呤和嘧啶的有机物质,它们是组成遗传分子脱氧核糖核酸(DNA)的构件。

    “原始汤”的形成想来必然是过程与此类似的结果。生物学家和化学家认为“原始汤”就是大约30亿到40亿年前的海洋。有机物质在某些地方积聚起来,也许在岸边逐渐干燥起来的浮垢上,或者在悬浮的微小水珠中。在受到如太阳紫外线之类的能量的进一步影响后,它们就结合成大一些的分子。现今,大的有机分子存在的时间不会太长,我们甚至觉察不到它们的存在,它们会很快被细菌或其他生物吞噬或破坏。但细菌以及我们人类都是后来者。所以在那些日子里,有机大分子可以在稠浓的汤中平安无事地自由漂浮。

    到了某一时刻,一个非凡的分子偶然形成——我们称之为复制因子(replicator)。它并不见得是那些分子当中最大或最复杂的,但它具有一种特殊的性质——能够复制自己。看起来这种偶然性非常之小。的确是这样,发生这种偶然情况的可能性是微乎其微的。在一个人的一生中,实际上可以把这种千年难得一遇的情况视为不可能,这就是为什么你买的足球彩票永远不会中头等奖的道理。但是我们人类在估计什么可能或什么不可能发生的时候,不习惯于将其放在几亿年这样长久的时间内去考虑。如果你在一亿年中每星期都购买一次彩票,说不定你会中上几次头等奖呢。

    事实上,一个能复制自己的分子并不像我们原来想象的那样难得,这种情况只要发生一次就够了。我们可以把复制因子当作模型或样板,把它想象为由一条复杂的链构成的大分子,链本身是由各种类型的起构件作用的分子组成的。在复制因子周围的汤里,这种小小的构件多得是。现在让我们假定每一块构件都具有吸引其同类的亲和力。来自汤里的这种构件一接触到对之有亲和力的复制因子的另一部分,就往往附着在那儿不动了。按照这个方式附着在一起的构件会自动地仿照复制因子本身的序列排列起来。这时我们就不难设想,这些构件逐个地连接起来,形成一条稳定的链,和原来复制因子的形成过程一模一样。这个一层一层逐步堆叠起来的过程可以继续下去,结晶体就是这样形成的。另一方面,两条链也有一分为二的可能,这样就产生了两个复制因子,而每个复制因子还能继续复制自己。

    一个更为复杂的可能性是,每块构件对其同类并无亲和力,而对其他的某一类构件却有互相吸引的亲和力。如果情况是这样的,复制因子作为样板并不产生完全相似的拷贝,而是某种“反象”,这种“反象”转过来再产生和原来的正象完全相似的拷贝,对我们来说,不管原来复制的过程是从正到反还是从正到正都无足轻重;但有必要指出,现代的第一个复制因子即DNA分子,它所使用的是从正到反的复制过程。值得注意的是,突然间,一种新的“稳定性”产生了。在以前,汤里很可能并不存在非常大量的某种特殊类型的复杂分子,因为每一个分子都要依赖于那些碰巧产生的结构特别稳定的构件。第一个复制因子一旦诞生了,它必然会迅速地在海洋里到处扩散它的拷贝,直至较小的构件分子日渐稀少,而其他较大的分子也越来越难有机会形成。

    这样我们到达了一个具有全都一样的复制品的大种群的阶段。现在,我们必须指出,任何复制过程都具有一个重要的特性:它不可能是完美无缺的。它准会发生差错。我倒希望这本书里没有印刷错误,可是如果你仔细看一下,你可能会发现一两个差错。这些差错也许不至于严重地歪曲书中句子的含义,因为它们只不过是“第一代”的错误。但我们可以想象一下,在印刷术尚未问世之前,如福音之类的各种书籍都是手抄的。以抄写书籍为业的人无论怎样小心谨慎,都不可避免地要发生一些差错,何况有些抄写员还会心血来潮,有意“改进”一下原文。如果所有的抄写员都以同一本原著为蓝本,那么原意还不至于受到太大的歪曲。可是,如果手抄本依据的也是手抄本,而后者也是抄自其他手抄本的话,那么谬误就开始流传、积累,其性质也更趋严重。我们往往认为抄写错误是桩坏事,而且我们也难以想象,在人们抄写的文件中能有什么样的错误可以被认为是胜于原文的。当犹太圣典的编纂人把希伯来文的“年轻妇女”误译成希腊文的“处女”时,我想我们至少可以说他们的误译产生了意想不到的后果,因为圣典中的预言变成“看哪!一个处女将要受孕并且要生养一个儿子……”*不管怎样,我们将要看到,生物学的复制因子在其复制过程中所造成的错误确实能产生改良的效果。对生命进化的进程来说,产生一些差错是必不可少的。原始的复制因子在复制拷贝时其精确程度如何,我们不得而知,不过今天,它们的后代DNA分子和人类所拥有的最精密的复印术相比却准确得惊人。然而,差错最终使进化成为可能。原始的复制因子大概产生过极多的差错。不管怎样,它们出过差错是确定无疑的,而且这些差错是积累性的。

    随着复制错误的产生和扩散,原始汤中充满了由好几个品种的复制因子组成的种群,而不是清一色的全都一样的复制品,但都是同一个祖先的“后裔”。它们当中的一些品种会不会比其他品种拥有更多的成员?几乎可以肯定地说:是的。某些品种由于内在的因素会比其他品种来得稳定。某些分子一旦形成就安于现状,不像其他分子那样易于分裂。在汤里,这种类型的分子会相对地多起来,这不仅仅是“长寿”的直接逻辑后果,而且因为它们有充裕的时间去复制自己。因此,“长寿”的复制因子往往会兴旺起来。如果假定其他条件不变,种群中就会出现一种寿命变得更长的“进化趋向”。

    但其他条件可能是不相等的。对某一品种的复制因子来说,它具有另外一个甚至更为重要的、为了在种群中传布的特性,这就是复制的速度或“生育力”。如果A型复制因子复制自己的平均速度是每星期一次,而B型复制因子是每小时一次,显而易见,不需多久,A型因子的数量就要相形见绌,即使A型因子的“寿命”再长也无济于事。因此,汤里面的因子很可能出现一种“生育力”变得更强的“进化趋向”。复制因子肯定会选择的第三个特性是复制的准确性。假定X型因子与Y型因子的寿命同样长,复制的速度也一样快,但X型因子平均在每10次复制过程中犯一次错误,而Y型只在每100次复制过程中犯一次错误,那么Y型因子肯定要变得多起来。种群中X型因子这支队伍不但要失去它们因错误而养育出来的“子孙”,还要失去它们所有现存或未来的后代。

    如果你对进化论已有所了解的话,你可能会认为上面谈到的最后一点似有自相矛盾之嫌。我们既说复制错误是发生进化的必不可少的先决条件,但又说自然选择有利于高精确度的复制过程,如何能把这两种说法调和起来?我们认为,总的说来,进化在某种含糊的意义上似乎是件“好事”,尤其是因为人类是进化的产物,而事实上没有什么东西“想要”进化。进化是偶然发生的,不管你愿意不愿意,尽管复制因子(以及当今的基因)不遗余力地防止这种情况的发生。莫诺在他纪念斯宾塞[3]的演讲中出色地阐明了这一点。他以幽默的口吻说:“进化论的另一个难以理解的方面是,每一个人都认为他理解进化论!”

    让我们再回到原始汤这个问题上来,现在汤里已存在一些稳定品种。所谓稳定的意思是,那些因子要么本身存在的时间较长,要么能迅速地复制,要么能精确无误地复制。朝着这三种稳定性发展的进化趋向是在下面这个意义上发生的:如果你在两个不同的时间分别从汤中取样,后一次的样品一定含有更大比例的寿命长或生育力强或复制精确性高的品种。生物学家谈到生物的进化时,他所谓的进化实质上就是这个意思,而进化的机制是一样的——自然选择。

    那么,我们是否应该把原始的复制因子分子称为“有生命的”呢?那是无关紧要的。我可以告诉你“达尔文是世界上最伟大的人物”,而你可能会说“不,牛顿才是最伟大的”。我希望我们不要再争论下去了,应该看到,不管我们的争论结果如何,实质上的结论都是不受影响的。我们把牛顿或达尔文称为伟大的人物也好,不把他们称为伟大的人物也好,他们两人的生平事迹和成就都是客观存在的,不会发生任何变化。同样,复制因子分子的情况很可能就像我所讲的那样,不论我们是否要称之为“有生命的”。我们当中有太多的人不理解词汇仅仅是供我们使用的工具,字典里面的“有生命的”这个词并不一定指世上某一样具体的东西。不管我们把原始的复制因子称为有生命的还是无生命的,它们的确是生命的祖先,是我们的缔造者。

    论点的第二个重要环节是竞争。达尔文本人也强调过它的重要性,尽管他那时讲的是动物和植物,不是分子。原始汤是不足以维持无限量的复制因子分子的。其中一个原因是地球的面积有限,但其他一些限制性因素也是非常重要的。在我们的想象当中,那个起着样板或模型作用的复制因子浮游于原始汤之中,周围存在大量复制所必需的小构件分子。但当复制因子变得越来越多时,构件因消耗量大增而供不应求,成为珍贵的资源。不同品种或品系的复制因子必然为了争夺它们而互相搏斗。我们已经研究过是什么因素促进那些条件优越的复制因子的繁殖。我们现在可以看到,条件差一些的品种事实上由于竞争而变得日渐稀少,最后它们中的一些品系难逃绝种的命运。复制因子的各品种之间发生过你死我活的搏斗。它们不知道自己在进行生存斗争,也不会因之而感到烦恼。复制因子在进行这种斗争时不动任何感情,更不用说会引起哪一方的厌恶感了。但从某种意义上来说,它们的确是在进行关乎生死存亡的斗争,因为任何导致产生更高一级稳定性的复制错误,或以新方法削弱对手的稳定性的复制错误,都会自动地延续下来并成倍地增长。改良的过程是积累性的。加强自身的稳定性或削弱对手稳定性的方法变得更巧妙,更富有成效。一些复制因子甚至“发现”了一些方法,通过化学途径分裂对方品种的分子,并利用分裂出来的构件来复制自己。这些原始食肉动物在消灭竞争对手的同时摄取食物。其他的复制因子也许发现了如何用化学方法或把自己裹在一层蛋白质之中来保卫自己。这也许就是第一批生命细胞的成长过程。复制因子的出现不仅仅是为了生存,还是为它们自己制造容器,即赖以生存的运载工具。能够生存下来的复制因子都是那些为自己构造了生存机器以安居其中的复制因子。最原始的生存机器也许仅仅是一层保护衣。后来,新竞争对手陆续出现,它们拥有更优良、更有效的生存机器,因此生存斗争随之逐渐激化。生存机器的体积越来越大,其结构也渐臻复杂。这是一个积累和渐进的过程。

    随着时间的推移,复制因子为了保证自己在世界上存在下去而采用的技巧和计谋也逐渐改进,但这种改进有没有止境呢?用以改良的时间是无穷无尽的。1000年的变化会产生什么样的怪诞的自我保存机器呢?经过40亿年,古代的复制因子又会有怎样的命运呢?它们没有消失,因为它们是掌握生存艺术的老手。但在今日,别以为它们还会浮游于海洋之中。很久以前,它们已经放弃这种自由自在的生活方式了。在今天,它们群集相处,安稳地寄居在庞大的步履蹒跚的“机器人”体内*,与外界隔开,通过迂回曲折的间接途径与外部世界联系,并通过遥控操纵外部世界。它们存在于你和我的躯体内,它们创造了我们,创造了我们的肉体和心灵,而保存它们正是我们存在的终极理由。这些复制因子源远流长。今天,我们称它们为基因,而我们就是它们的生存机器。

    第3章 不朽的双螺旋

    我们是生存机器,但这里的“我们”并不单指人,它包括一切动物、植物、细菌和病毒。地球上生存机器的总数很难计算,甚至物种的总数也不得而知。仅就昆虫来说,据估计,现存的物种大约有300万种,而个体昆虫可能有100亿亿只。

    不同种类的生存机器具有千变万化、种类纷繁的外部形状和内脏器官。章鱼同老鼠毫无共同之处,而这两者又和橡树迥然不同。但它们的基本化学结构却相当一致,尤其是它们所拥有的复制因子,同我们——从大象到细菌——体内的分子基本上同属一种类型。我们都是同一种复制因子——人们称之为DNA的分子——的生存机器,但生存在世上的方式却大不相同,因而复制因子制造了大量各种各样的生存机器供其利用。猴子是基因在树上生活的保存机器,鱼是基因在水中生活的保存机器,甚至还有一种小虫,是基因在德国啤酒杯草垫中生活的保存机器。DNA的活动方式真是神秘莫测。

    为简便起见,我把由DNA构成的现代基因讲得几乎和原始汤中的第一批复制因子一样。这对论证影响不大,但事实可能并非如此。原始复制因子可能是一种同DNA近似的分子,也可能完全不同,如果是后一种情况的话,我们不妨说,复制因子的生存机器是在一个较后的阶段为DNA所夺取的。如果上述情况属实,那么原始复制因子已被彻底消灭,因为在现代生存机器中已毫无它们的踪迹。根据这样的推断,凯恩斯-史密斯(A.G.Cairns-Smith)提出了一个饶有趣味的看法,他认为我们的祖先,即第一批复制因子可能根本不是有机分子,而是无机的结晶体——某些矿物和小块黏土等。且不论DNA是否是掠夺者,它是今日的主宰,这是毋庸争辩的,除非像我在第11章中试图提出来的见解那样,一种新的掠夺力量目前正在兴起。

    一个DNA分子是一条由构件组成的长链,这些构件是被称为“核苷酸”的小分子。如同蛋白质分子是氨基酸链一样,DNA分子是核苷酸链。DNA分子因其太小而不能为肉眼所见,但它的确切形状已被人类用间接的方法巧妙地揭示了出来。它由一对核苷酸链组成,两条链相互交织,呈雅致的螺旋形,这就是“双螺旋”或“不朽的螺旋圈”。核苷酸构件仅有4种,可以把它们简称为A、T、C和G。在所有动物和植物中这4种都是一样的,不同的是它们缠绕交织在一起的顺序。人类的G构件同蜗牛的G构件完全相同,但不仅人类构件的序列同蜗牛的不同,而且人类不同个体之间的序列也不相同,虽然在差别程度上略小一些(同卵双胞胎的特殊情况除外)。

    我们的DNA寄居在我们体内。它不是集中在体内的某一特定的位置,而是分布在所有细胞之中。人体平均大约由1000万亿个细胞组成。除某些特殊情况我们可以不予以考虑外,每个细胞都含有该人体的DNA的一套完整拷贝。这一DNA可以被认为是一组有关如何制造一个人体的指令,以核苷酸的A、T、C、G字母表来表示。这种情况就像在一幢巨大的建筑物中,每间房间里都有一个“书橱”,而“书橱”里存放着建筑师建造整幢建筑物的设计图。每个细胞中的这种“书橱”被称为细胞核。人类建筑师的这种设计图共有46“卷”,我们称它们为染色体。在不同的物种中,其数量也不同。染色体在显微镜下是可见的,形状像一条条长线。基因就沿着这些染色体有次序地排列着。但要判断基因之间首尾相接的地方却是困难的,而且事实上甚至可能是无意义的。幸好,本章就要表明,这点同我们的论题关系不大。

    我将利用建筑师的设计图这一比喻,把比喻性的语言同专业的语言适当地混在一起来进行叙述。“卷”同染色体这两个词将交替使用,“页”则同基因暂且互换使用,尽管基因相互之间的界线不像书页那样分明,但我们将在很长的篇幅中使用这一比喻。待这一比喻不能解决问题时,我将再引用其他比喻。这里顺便提一下,当然是没有“建筑师”这回事的,DNA指令是由自然选择安排的。

    DNA分子做的两件重要事情之一是:它们进行复制,也就是进行自我复制。自有生命以来,这样的复制活动就从未中断过。现在DNA分子对于自我复制确已技巧精湛、驾轻就熟了。一个成年人,全身有1000万亿个细胞,但胚胎最初只是一个单细胞,拥有建筑师蓝图的一个原版拷贝。这个单细胞一分为二,两个细胞各自把自己的那卷蓝图拷贝接受了过来。细胞依次再按4、8、16、32等倍数分裂,直到分裂成几十亿个。每次分裂,DNA的蓝图都毫不走样地拷贝了下来,极少发生差错。

    讲DNA的复制只是一个方面。但如果DNA真的是建造一个人体的一套蓝图的话,又如何按蓝图开展工作呢?它们将如何转变成人体的组织呢?这就是我要讲的DNA做的第二件重要事情:它间接地监督制造了不同种类的分子——蛋白质。在前一章中提到过的血红蛋白就是种类极为繁多的蛋白质分子中的一个。以4个字母构成的核苷酸字母表所表示的DNA密码信息,通过机械的简单形式翻译成另一种字母表。这就是拼写出的蛋白质分子的氨基酸字母表。

    制造蛋白质似乎同制造人体还有一大段距离,但它却是向制造人体这一方向前进的最初一小步。蛋白质不仅是构成人体组织的主要成分,还对细胞内一切化学过程进行灵敏的控制,在准确的时间和准确的地点,有选择地使这种化学过程继续或停止。这一过程最后到底如何发展成为一个婴儿说来话长,胚胎学家要花费几十年,也许几世纪的时间才能研究出来。但这一过程发展的最后结果是个婴儿,却是一个确凿无疑的事实。基因确实间接地控制着人体的制造,其影响全然是单向的:后天获得的特性是不能遗传的。不论你一生获得的聪明才智有多少,绝不会有点滴经由遗传途径传给你的子女。新的一代都是从零开始的,人体只不过是基因保持自己不变的一种手段。

    基因控制胚胎发育这一事实在进化上的重要意义在于:它意味着基因对自身今后的生存至少要负部分责任,因为它们的生存取决于它们寄居其中,并帮助建造的人体的效能。很久以前,自然选择是由自由漂浮在原始汤中复制因子的差别性生存构成的。如今,自然选择有利于能熟练地制造生存机器的复制因子,即能娴熟地控制胚胎发育的基因。在这方面,复制因子和过去一样是没有自觉性和目的性的。相互竞争的分子之间那种凭借各自的寿命、生殖力以及精确复制的能力来进行的自动选择,像在遥远的时代一样,仍在盲目地、不可避免地继续。基因没有先见之明,它们事先并不进行筹划。某些基因只是比其他一些基因能力更强。情况就是这样。但决定基因长寿和生殖力的特性远不像原来那样简单。

    近年来(指过去的6亿年左右),复制因子在建造生存机器的工艺学上取得了显著的成就,如肌肉、心脏和眼睛(经历几次单独的进化过程)。在那以前,作为复制因子,它们生活方式的基本特点已有了根本的改变。如果我们要想将我们的论证继续下去的话,需要对此有所了解。

    关于现代复制因子,要了解的第一件事就是,它具有高度群居性。生存机器是一种运载工具,它包含的不只是一个基因,而是成千上万个基因。制造人体是一种相互配合的、错综复杂的冒险事业,为了共同的事业,某一个基因做出的贡献和另一个基因做出的贡献几乎是分不开的。*一个基因对人体的不同部分会产生许多不同的影响。人体的某一部分会受到许多基因的影响,而任何一个基因所起的作用都依赖于同许多其他基因的相互作用。某些基因充当主基因,控制一组其他基因的活动。用比拟的说法,就是蓝图的任何一页对建筑物的许多不同部分都提供了参考内容,而每一页只有作为和其他许多页相互参照的资料才有意义。

    基因的这种错综复杂的相互依赖性可能会使你感到迷惑不解,我们为什么要用“基因”这个词呢?为什么不用像“基因复合体”(gene complex)这样一个集合名词呢?我们认为,从许多方面来讲,这确实是一个相当好的主意。但如果我们从另一个角度去考虑问题,那么把基因复合体想象为分成若干相互分离的复制因子也是讲得通的。问题的出现是由于性现象的存在。有性生殖具有混合基因的作用,就是说任何一个个体只不过是寿命不长的基因组合体的临时运载工具。任何一个个体基因组合(combination)的生存时间可能是短暂的,但基因本身却能够生存很久。它们的道路相互交叉再交叉,在延续不断的世代中,一个基因可以被视为一个单位,它通过一系列个体的延续生存下去。这就是本章将要展开的中心论题。我所非常尊重的同事中有些人固执地拒绝接受这一论点,因此,如果我在论证时好像有点啰唆,那就请原谅吧!首先我必须就其涉及的一些事实扼要地加以阐明。

    我曾讲过,建造一个人体的蓝图是用46卷写成的。事实上,这是一种过分简单化的说法,真实情况是相当离奇的。46条染色体由23对染色体构成。我们不妨说每个细胞核内都存放着两套23卷的可相互替换的蓝图。我们可以称它们为卷1a卷1b,卷2a卷2b……直至卷23a卷23b。当然我用以识别每一卷以及此后每一页的数字是任意选定的。

    我们从父亲或母亲那里接受每一条完整的染色体,它们分别在睾丸和卵巢内装配而成。比方说卷1a、卷2a、卷3a……来自父亲,卷1b、卷2b、卷3b……来自母亲。尽管实际上难以办到,但理论上你能够用一架显微镜观察你任何一个细胞内的46条染色体,并区别哪23条来自父亲,哪23条来自母亲。

    其实成对的染色体并不终生贴在一起,甚至相互也不接近。那么在什么意义上讲它们是“成对”的呢?说它们是成对是指:可以认为原先来自父亲的每一卷都能够逐页地直接代替原先来自母亲的对应的某一卷。举例说,卷13a的第6页和卷13b的第6页可能都是负责设计眼睛的颜色的,也许其中一页说的是“蓝色”,而另外一页说的是“棕色”。

    有时可供替换的两页是完全相似的,但在其他情况下,如在我们举的眼睛颜色的例子中,它们互不相同。如果它们做出了相互矛盾的“推荐”,人体怎么办呢?有各种不同的结果。有时这一页的影响大于另一页。在刚才所举的眼睛颜色的例子中,这个人实际上可能是生了一双棕色的眼睛,因为制造蓝色眼睛的指令可能在建造人体的过程中被置之不理了。尽管如此,这不会阻止制造蓝眼睛的指令继续传递到后代去。这种被置之不理的基因我们称它为“隐性基因”。与隐性基因相对的是显性基因。棕眼基因与蓝眼基因相比,前者处于优势。只有相关页的两个拷贝都一致推荐蓝眼睛,人才会得到一双蓝眼睛。更常见的情况是,两个可供替换的基因不相同时会达成某种类型的妥协——把人体建成“中间态”或一种完全不同的模样。

    当两个基因,如棕眼基因和蓝眼基因争夺染色体上的同一个位置时,我们把其中一个称为另一个的等位基因。在这里,等位基因同竞争对手是同义词。试把建筑师一卷一卷的蓝图想象成一本本的活页夹,其中的活页能够抽出并能互相交换。每一本卷13必然会有一张第6页,但好几张第6页都能进入活页夹,夹在第5页同第7页之间。一个版本写着“蓝色眼睛”,另一个版本可能写着“棕色眼睛”,整个种群中还可能有其他一些版本写出其他的颜色,如绿色。也许有6个可供替换的等位基因占据着分散于整个种群的第13条染色体的第6页的位置。每人只有两卷卷13染色体,因此,在第6页的位置上最多只能有两个等位基因。如一个蓝眼的人可能有同一个等位基因的两个拷贝,也可能在整个种群里的6个可供替换的等位基因当中任选两个。

    当然你不可能真的到整个种群的基因库里去选择自己的基因。任何时候,全部基因都在个体生存机器内紧密地结合在一起。我们每个人还是胚胎时就接受了全部基因,对此我们无能为力。然而从长远角度来讲,把整个种群的基因统称为基因库还是有意义的。事实上这是遗传学家们运用的一个专门术语。基因库是一个相当有用的抽象概念,因为性活动把基因混合起来,尽管这是一个经过仔细安排的过程。

    类似从活页夹中把一页页、一沓沓活页抽出并相互交换的情况的确在进行,我们很快就会看到。我已经叙述了一个细胞分裂为两个新细胞的正常分裂情况。每个分裂出来的细胞都接受了所有46条染色体的一份完整拷贝,这种正常的细胞分裂被称为有丝分裂。但还有一种细胞分裂叫作减数分裂。减数分裂只发生在性细胞即精子和卵子的产生过程中。精子和卵子在我们的细胞中有其独特的一面,那就是它们只有23条,而不是46条染色体。这个数字当然恰巧是46的一半,这对它们受精或受精之后融合在一起制造一个新个体是何等方便!减数分裂是一种特殊类型的细胞分裂,只发生在睾丸和卵巢里。在这个过程中,一个具有完整的双倍共46条染色体的细胞,分裂成只有单倍共23条染色体的性细胞(皆以人体的染色体数目为例)。

    一个有23条染色体的精子,是由睾丸内具有46条染色体的一个普通细胞进行减数分裂产生的。到底哪23条染色体进入了精子细胞呢?精子不应得到染色体中相同的一组,这点显然很重要,即它不可以有卷13的两个拷贝,而卷17却一个拷贝也没有。一个个体可以把全部来自其母亲的染色体赋予他的一个精子(即卷1b、卷2b、卷3b……卷23b),这在理论上是可能的。在这种不太可能发生的情况中,孩子的一半基因是继承其祖母的,而没有继承其祖父的。但事实上这种全染色体分布是不会发生的。实际情况要复杂得多。请不要忘记,一卷卷的蓝图(染色体)是作为活页夹来看待的。在制造精子期间,某一卷蓝图的许多单页或者说一沓一沓的单页被抽出并和可供替换的另一卷的对应单页相互交换。因此,某一具体精子细胞的卷1的构成方式可能是前面65页取自卷1a,第66页直到最后一页取自卷1b。这一精子细胞的其他22卷以相似的方式组成。因此,即使一个人的所有精子的23条染色体都由同一组的46条染色体的片段构成,他所制造的每一个精子细胞却都是独特的。卵子以类似的方式在卵巢内制造,而且它们也各具特色,都不相同。

    实际生活里的这种混合构成法已为人们所熟知。在精子(或卵子)的制造过程中,每条父体染色体的一些片段分离出来,同完全相应的母体染色体的一些片段相互交换位置(请记住,我们在讲的是最初来自制造这个精子的某个个体的父母的染色体,即由这一精子受精最终所生的儿童的祖父母的染色体)。这种染色体片段的交换过程被称为“交换”(crossover)。这是对本书全部论证至关重要的一点。就是说,如果你用显微镜观察一下你自己的一个精子(如果是女性,即为卵子)的染色体,并试图去辨认哪些染色体本来是父亲的,哪些本来是母亲的,这样做将会是徒劳的(这同一般的体细胞形成鲜明对照)。精子中的任何一条染色体都是一种混杂物,即母亲基因同父亲基因的嵌合体。

    以书页比作基因的比喻从这里开始不能再用了。在活页夹中,可以将完整的一页插进去、拿掉或交换,但不足一页的碎片却办不到。然而,基因复合体只是一长串核苷酸字母,并不明显地分为一些各自独立的书页。当然蛋白质链信息的头和尾都有专门的符号,它们同蛋白质信息本身一样,都以同样4个字母表示。这两个符号之间会有制造一种蛋白质的密码指令。如果愿意,我们可以把一个基因理解为头和尾符号之间的核苷酸字母序列和一条蛋白质链的编码。我们用“顺反子”(cistron)这个词来表示这样的单位。有些人将基因和顺反子当作可以相互通用的两个词来使用。但交换却不遵守顺反子之间的界限。不仅顺反子之间可以发生分裂,顺反子内也可发生分裂。就好像建筑师的蓝图是画在46卷自动收报机的纸条上,而不是分开的一页一页的纸上一样。顺反子无固定的长度,只有凭借纸条上的符号,找到信息头和信息尾的符号才能找到前一个顺反子到何处为止,下一个顺反子在何处开始。交换表现为这样的过程:取出相配的父方同母方的纸条,剪下并交换其相配的部分,不论它们上面画的是什么。

    本书书名中所用的基因这个词不是指单个的顺反子,而是某种更细致复杂的东西。我下的定义不会适合每个人的口味,但对于基因又没有一个普遍让人接受的定义,即使有,定义也不是神圣不可侵犯的东西。如果我们的定义下得明确而不模棱两可,按照我们喜欢的方式给一个词下一个适用于自己的目的的定义也未尝不可。我采用的定义来源于威廉斯。*基因的定义是:染色体物质中能够作为一个自然选择的单位对连续若干代起作用的任何一部分。用前面一章中的话来说,基因就是进行高度精确复制的复制因子。精确复制的能力是通过复制形式取得长寿的另一种说法,我将把它简称为长寿。这一定义的正确性还需要进一步证明。

    无论根据何种定义,基因必须是染色体的一部分。问题是这一部分有多大,即多长的自动收报机用纸条?让我们设想纸条上相邻密码字母的任何一个序列,称这一序列为遗传单位。它也许是一个顺反子内的只有10个字母的序列;它也许是一个有8个顺反子的序列;可能它的头和尾都在顺反子的中段。它一定会同其他遗传单位相互重叠。它会包括更小的遗传单位,也会参与构成更大遗传单位。不论其长短如何,为了便于进行现在的论证,我们就称之为遗传单位。它只不过是染色体的一段,同染色体的其余部分无任何实质性差别。

    下面就到重点了:遗传单位越短,它生存的时间——以世代计——可能就越长,因一次交换而分裂的可能性就越小。假定按平均数计算,减数分裂每产生一个精子或卵子,整条染色体就有可能经历一次交换,这种交换可能发生在染色体的任何一段上。如果我们设想这是一个很大的遗传单位,比如说是染色体的一半长,那么每次发生减数分裂时,这一遗传单位分裂的机会是50%。如果我们所设想的这一遗传单位只有染色体的1%那么长,我们可以认为,在任何一次减数分裂中,它分裂的机会只有1%。这就是说,这一遗传单位能够在该个体的后代中生存许多代。一个顺反子很可能比一条染色体的1%还要短得多,甚至一组相邻的顺反子在为交换所分解之前能够活上很多代。

    遗传单位的平均估计寿命可以很方便地用世代来表示,而世代也可转换为年数。如果我们把整条染色体作为假定的遗传单位,它的生活史也只不过延续一代而已。现在假定8a是你的染色体,是从你父亲那里继承下来的,那么它是在你母亲受孕之前不久,在你父亲的一个睾丸内制造出来的。在此之前,世上从未有过它的存在。这个遗传单位是减数分裂混合过程的产物,即将你祖父和祖母的一些染色体片段撮合在一起。这一遗传单位被置于某一精子个体内,因而它是独特的。这个精子是几百万个精子中的一个,它随这支庞大的微型船船队扬帆航行,驶进你母亲的体内。这个精子(除非你是非同卵的双胞胎)是船队中唯一在你母亲的一个卵子中找到停泊港的一条船。这就是你之所以存在的理由。我们所设想的这一遗传单位,即你的8a染色体,开始同你遗传物质的其他部分一起进行自我复制。现在它以复制品的形式存在于你的全身,但在轮到你生小孩时,就在你制造卵子(或精子)时,这条染色体也随之被破坏。一些片段将同你母亲的8b染色体的一些片段相互交换。在任何一个性细胞中将要产生一条新生的染色体8,它比之前的那条可能“好些”,也可能“坏些”。但除非是一个非常难得的巧合,否则它肯定是与众不同的,是独一无二的。染色体的寿命是一代。

    一个较小的遗传单位,比方说是你染色体8a的1%那么长,它的寿命有多长呢?这个遗传单位也是来自你父亲的,但很可能原来不是在他体内装配的。根据前面的推理,99%的可能性是他从父亲或母亲那里完整无缺地接收过来的。现在我们就假设遗传单位是从他的母亲,也就是你的祖母那里接收来的。同样有99%的可能性她也是从她的父亲或母亲那里完整无缺地接收来的。如果我们追根寻迹地查考一个遗传小单位的祖先,我们最终会找到它的最初创造者。在某一个阶段,这一遗传单位肯定是在你的一个祖先的睾丸或卵巢内首次创造出来的。

    让我再重复讲一遍我用的“创造”这个词所包含的颇为特殊的意义。我们设想的那些构成遗传单位的较小亚单位可能很久以前就已存在了。我们讲遗传单位是在某一特定时刻创造的,意思只是说,构成遗传单位的那种亚单位的特殊排列方式在这一时刻之前不存在。也许这一创造的时间相当近,例如就在你祖父或祖母体内发生。但如果我们设想的是一个非常小的遗传单位,它就可能是由一个非常遥远的祖先第一次装配的,它也许是人类之前的一个类人猿。而且在你体内的遗传小单位今后同样也可以延续很久,完整无缺地一代接一代地传递下去。

    同样不要忘记的是,一个个体的后代不是单线的,而是有分支的。不论“创造”你体内染色体8a中特定一段的是你哪位祖先,除你之外,他或她很可能还有许多其他后代。你的一个遗传单位也可能存在于你的第二重堂(表)兄弟或姐妹体内。它可能存在于我体内,存在于首相体内,也可能存在于你的狗的体内。因为如果我们上溯得足够远的话,我们都有着共同的祖先。就是说这个遗传小单位也可能碰巧经过几次独立的装配:如果这一遗传单位是很小的,那么这种巧合不是十分不可能的。但是即使是一个近亲,也不太可能同你有完全相同的一整条染色体。遗传单位越小,同另外一个个体共有的可能性,即以拷贝的形式在世上出现许多次的可能性就越大。

    一些先前存在的亚单位通过交换偶然聚合在一起是组成一个新遗传单位的一般方式。另外一个方式被称为点突变(point mutation)。这种方式虽然少见,但在进化上具有重大意义。一个点突变就相当于书中单独一个字母的印刷错误。尽管这种情况不多,但显而易见,遗传单位越长,它在某点上为突变所改变的可能性就越大。

    另外一种不常见的,但具有重要远期后果的错误或突变叫作倒位(inversion)。染色体把自身的一段在两端分离出来,头尾颠倒后,按这种颠倒的位置重新连接上去。按照先前的类比方法,有必要对某些页码重新进行编号。有时染色体的某些部分不单单是倒位,而是连接到染色体完全不同的部位上,或者甚至和一条完全不同的染色体结合在一起。这种情形如同将一本活页夹中的一沓活页纸换到了另一本中去。虽然这种类型的错误通常是灾难性的,但它有时能使一些碰巧在一起工作得很好的遗传物质片段紧密地结成连锁,这就是其重要性之所在。也许以倒位方式可以把两个顺反子紧密地结合在一起,而它们只有在一起的时候才能产生有益的效果,即以某种方式互相补充或互相加强。然后,自然选择往往有利于以这种方式构成的新“遗传单位”,因此这种遗传单位将会在今后的种群中扩散开来。基因复合体在过去悠久的年代中可能就是以这种方式全面地进行再排列或“编辑”的。

    这方面最好的一个例子是拟态(mimicry)现象。有些“讨厌的”蝴蝶有一种令人厌恶的怪味,它们的色彩通常鲜艳夺目、华丽异常。鸟类就是凭借它们这种“警戒性”标志学会躲避它们的。于是其他一些并无这种怪味的蝴蝶就乘机利用这种现象,模拟那些味道怪异的蝴蝶。于是它们生下来就具有和那些味道怪异的蝴蝶差不多的颜色和形状,但气味不同。它们时常使人类的博物学家上当,也时常使鸟类上当。一只鸟如果吃过真正有怪异味道的蝴蝶,通常就要避开所有看上去一样的蝴蝶,模拟者也包括在内。因此自然选择有助于促进拟态行为基因的传播。拟态就是这样进化来的。

    “怪味”蝴蝶有许多不同的种类,它们看上去并不都是一样的。一个模拟者不可能像所有的“怪味”蝴蝶,它们必须模拟某一特定的蝴蝶种类。任何具体的模拟者一般都善于专门模仿某种具体的味道怪异的蝴蝶,但有些种类的模拟者却有一种非常奇特的行为。这些种类中的某些个体模仿某种味道怪异的蝴蝶,其他一些个体则模仿另外一种。任何个体,如果它是中间型的或者试图两种都模仿,它就会很快被吃掉。但蝴蝶不会生来就这样。一个个体要么肯定是雄性,要么肯定是雌性,同样,一个蝴蝶个体要么模仿这种味道怪异的蝴蝶,要么模仿另外一种。一只蝴蝶可能模仿种类A,而其“兄弟”可能模仿种类B。

    一个个体是模仿种类A还是模仿种类B,看来似乎只取决于一个基因。但一个基因怎么能决定模拟的各个方面——颜色、形状、花纹的样式、飞行的节奏呢?答案是,一个单一顺反子的基因大概是不可能的,但通过倒位和遗传物质其他偶然性的重新排列所完成的无意识的和自动的“编辑工作”,一大群过去分开的旧基因得以在一条染色体上结合成一个紧密的连锁群。整个连锁群像一个基因一样行动(根据我们的定义,它现在的确是一个单一的基因)。它也有一个“等位基因”,这一等位基因其实是另外一个连锁群。一个连锁群含有模仿种类A的顺反子,另一个连锁群则含有模仿种类B的顺反子。每一连锁群很少因交换而分裂,因此在自然界中人们从未见到中间型的蝴蝶。但如果在实验室内大量繁殖蝴蝶,这种中间型偶尔也会出现。

    我用基因这个词来指代一个遗传单位,单位之小足以延续许多代,而且能以许多拷贝的形式在周围散布。这不是一种要么全对要么全错的死板僵化的定义,而是像“大”或“老”的定义一样,是一种含义逐渐模糊的定义。一段染色体越是容易因交换而分裂,或为各种类型的突变所改变,它同我所谓的基因就越不相符。一个顺反子大概可以称得上是基因,但比顺反子大的单位也应算基因。12个顺反子可能会在一条染色体上相互结合得非常紧密,以至于对我们来说这可以算是一个能长久存在的遗传单位。蝴蝶里的拟态连锁群就是一个很好的例子。当顺反子离开一个个体,乘着精子或卵子进入下一代时,它们可能发现小船还载有它们在前一次航行时的近邻。这些近邻可能还是开始于遥远的祖先体内的漫长航行中的伙伴。同一条染色体上相邻的顺反子组成一队紧密联结在一起的旅行伙伴,减数分裂的时机一到,它们经常能够登上同一条船,分开的情况很少。

    严格地说,本书既不应叫作“自私的顺反子”,也不应叫作“自私的染色体”,而应命名为“染色体有点自私的一大部分以及更为自私的一小部分”。但应该说,这样的书名至少不那么吸引人。既然我把基因描绘成能够延续许多世代的一小段染色体,那么我以“自私的基因”作为本书的书名恰如其分。

    现在我们又回到了第1章结尾的地方。在那里我们已经看到,在任何称得上是自然选择的基本单位的实体中,我们都会发现自私性。我们也已看到,有人认为物种是自然选择单位,而另有一些人认为物种中的种群或群体是自然选择单位,还有的人认为个体是自然选择单位。我曾讲过,我宁可把基因看作自然选择的基本单位,因而也是自我利益的基本单位。我刚才所做的就是要给基因下这样的定义,以便令人信服地证明我的论点的正确性。

    自然选择最普通的形式是指实体的差别性生存。某些实体存在下去,另一些则死亡。但为了使这种选择性死亡能够对世界产生影响,一个附加条件必须得到满足,那就是每个实体必须以许多拷贝的形式存在,而且至少某些实体必须有潜在的能力以拷贝的形式生存一段相当长的进化时间。小的遗传单位有这种特性,而个体、群体和物种却没有。孟德尔证明,遗传单位实际上可以被认为是一种不可分割的独立微粒。这是他的一项伟大成就。现在我们知道,这种说法未免有些过于简单,甚至顺反子偶尔也是可分的,而且同一条染色体上的任何两个基因都不是完全独立的。我刚才所做的就是要把基因描绘为一个这样的遗传单位,它在相当大的程度上接近不可分的颗粒这一典型。基因并不是不可分的,但它们很少分开。基因在任何具体个体中要么肯定存在,要么肯定不存在。一个基因完整无损地从祖父母传到孙辈,径直通过中间世代而不与其他基因相混合。如果基因不断地相互混合,我们现在所理解的自然选择就是不可能存在的了。顺便提一句,这一点在达尔文还在世时就已被证实,而且使达尔文感到莫大的忧虑,因为那时人们认为遗传是一个混合过程。孟德尔的发现在那时已经发表,这本来是可以解除达尔文的焦虑的,但天啊,他却一直不知道这件事。达尔文和孟德尔都去世许多年之后,似乎才有人读到这篇文章。孟德尔也许没有认识到他的发现的重要意义,否则他可能会写信告诉达尔文。

    基因颗粒性的另一个方面是,它不会衰老,即使是活了100万年的基因也不会比它仅活了100年的同伴更有可能死去。它一代一代地从一个个体转到另一个个体,用它自己的方式操纵着一个又一个的个体,达成自己的目的;它在一代接一代的个体陷入衰老死亡之前抛弃这些将要死亡的个体。

    基因是不朽的,或者更确切地说,它们被描绘为接近于值得赋予不朽称号的遗传实体。我们作为这个世界上的个体生存机器,期望能够多活几十年,但世界上的基因可望生存的时间,不是几十年,而是以百万年为单位计算的。

    在有性生殖的物种中,作为遗传单位的个体因为体积太大、寿命太短,而不能成为有意义的自然选择单位。*由个体组成的群体甚至是更大的单位。在遗传学的意义上,个体和群体像天空中的云彩,或者像沙漠中的尘暴,它们是些临时的聚合体或联合体,在进化的过程中是不稳定的。种群可以延续很长的一段时期,但因为它们不断地同其他种群混合,从而失去本身的特性。它们也受到内部演化的影响。一个种群还不足以成为一个自然选择的单位,因为它不是一个有足够独立性的实体。它的稳定性和一致性也不足,不能优先于其他种群而被“选择”。

    一个个体在其持续存在时看起来相当独立,但很可惜,这种状态能维持多久呢?每一个个体都是独特的,在每个实体仅有一个拷贝的情况下,在实体之间进行选择是不可能实现进化的!有性生殖不等于复制。就像一个种群被其他种群玷污的情况一样,一个个体的后代也会被其配偶的后代玷污,你的子女只有一半是你,而你的孙子孙女只是你的。经过几代之后,你所能指望的,最多是一大批后代,他们之中每个人只具有你的极小部分——几个基因而已,即使他们有些还姓你的姓,情况也是如此。

    个体是不稳定的,它们在不停地消失。染色体也像打出去不久的一副牌一样,混合以致被湮没,但牌本身虽经洗牌却仍存在。在这里,牌就是基因。基因不会为交换所破坏,它们只是调换伙伴再继续前进。它们继续前进是理所当然的,这是它们的本性。它们是复制因子,而我们是它们的生存机器。我们完成我们的职责后就被弃于一旁,但基因却是地质时代的居民——基因是永存的。

    基因像钻石一样长存,但同钻石长存的方式又不尽相同。长存的一块块钻石水晶体以不变的原子结构存在,但DNA分子不具备这种永恒性。任何一个具体的DNA分子的生命都相当短促,也许只有几个月的时间,但肯定不会超过一个人一生的时间。但一个DNA分子在理论上能够以自己的拷贝形式生存一亿年。此外,一个具体基因的拷贝就像原始汤中的古代复制因子一样,可以分布到整个世界。不同的是,这些基因拷贝的现代版本都有条不紊地被装入了生存机器的体内。

    我所说的一切都是为了强调,基因以拷贝形式存在几乎是永恒的,这种永恒性表明了基因的特性。将基因解释为一个顺反子适用于某些论题,但运用于进化论,定义就需要扩充,扩充的程度则取决于定义的用途。我们需要找到自然选择的一个切合实际的单位。要做到这点,首先要鉴别出一个成功的自然选择单位必须具备哪些特性。用前一章的话来说,这些特性是长寿、生殖力以及精确复制,那么我们只要直截了当地把“基因”解释为一个至少有可能拥有上述三种特性的最大实体就可以了。基因是一个长久生存的复制因子,它以许多重复拷贝的形式存在着。它并非无限地生存下去。严格地说,甚至钻石也不是永恒的,顺反子甚至也能被交换一分为二。按照定义,基因是染色体的一个片段,它要短得使自己能够延续足够长的时间,以便使它作为一个有意义的自然选择单位发生作用。

    到底多长才算“足够长的时间”呢?这并没有严格的规定,取决于自然选择的“压力”达到多大的严峻程度。就是说,这取决于一个“坏的”遗传单位死亡的可能性比它的“好的”等位基因死亡的可能性大到什么程度。这个问题牵涉到因具体情况不同而各异的定量方面的细节。自然选择最大的切合实际的单位——基因,一般介于顺反子同染色体之间。

    基因之所以成为合适的自然选择基本单位,其原因在于它潜在的永恒性。现在是强调一下“潜在的”这个词的时候了。一个基因能生存100万年,但许多新的基因甚至连第一代也熬不过。少数新基因成功地生存了一代,部分原因是它们运气好,但主要是由于它们具有一套看家本领,就是说它们善于制造生存机器。这些基因对其寄居的一个个连续不断的个体的胚胎发育都产生一定的影响,这样就使得这个个体生存和繁殖的可能性要比其处在竞争基因或等位基因影响下的可能性稍大一些。举例说,一个“好的”基因往往赋予它所寄居的连续不断的个体以长腿,从而保证自己的生存,因为长腿有助于这些个体逃避捕食者。这只是一个特殊的例子,不具有普遍意义,因为长腿毕竟不是对谁都有好处的。对于鼹鼠来说,长腿反而是一种累赘。我们能不能在所有好的(即生存时间长的)基因中找出一些共同的特性,而不要使我们自己纠缠在烦琐的细节中呢?相反,什么是能够立即显示出“坏的”即生存短暂的基因的特性呢?这样的共同特性也许有一些,但有一种特性却与本书尤其相关,即在基因的水平上讲,利他行为必然是坏的,而自私行为必定是好的。这是从我们对利他行为和自私行为的定义中得出的无情结论。基因为争取生存,直接同它们的等位基因竞争,因为在基因库中,它们的等位基因是争夺它们在后代染色体上位置的对手。我再啰唆一句,这种在基因库中牺牲其等位基因而增加自己生存机会的基因,按照我们的定义,往往都会生存下去。因此基因是自私行为的基本单位。

    本章的主要内容已叙述完毕,但我一笔带过了一些复杂的问题以及一些潜在的假设。第一个复杂的问题我已扼要地提到过。不论基因在世世代代的旅程中多么独立和自由,但它们在控制胚胎发育方面并不是非常自由和独立的行为者。它们以极其错综复杂的方式相互配合和相互作用,同时又和外部环境相互配合和相互作用。诸如“长腿基因”或者“利他行为基因”这类表达方式是一种简便的形象化说法,但理解它们的含义是重要的。一个基因,不可能单枪匹马地建造一条腿,不论是长腿或是短腿。构造一条腿是多基因的一种联合行动,外部环境的影响也是不可或缺的,因为腿毕竟是由食物铸造出来的!但很可能有这样的一个基因,它在其他条件不变的情况下,往往使腿生长得比在它的等位基因的影响下生长的腿长一些。

    作为对比,请想象一下硝酸盐这种肥料对小麦生长的影响。施用硝酸盐的小麦要比不施硝酸盐的长得大,这是人尽皆知的事实,但恐怕没有哪个傻瓜会宣称,单靠硝酸盐能让小麦生长。种子、土壤、阳光、水分以及各种矿物质显然同样不可缺少,但如果上述的其他几种因素都是稳定不变的,或者甚至在一定范围内有某些变化,硝酸盐这一附加因素就能使小麦长得更大一些。单个基因在胚胎发育中的作用也是如此。控制胚胎发育的各种关系像蜘蛛网一样交织连锁在一起,非常错综复杂,我们最好不要去问津。任何一个因素,不论是遗传上的或环境上的,都不能认为是婴儿某部分形成的唯一原因。婴儿的所有部分都具有几乎是无穷数量的先前因素(antecedent causes),但这一婴儿同另一婴儿之间的差别,如腿的长短差别,可以很容易地在环境或基因方面追溯到一个或几个先前差别(antecedent differences),就是这些差别真正关系到生存竞争和斗争。对进化而言,起作用的是受遗传控制的差别。

    就一个基因而言,它的许多等位基因是它不共戴天的竞争者,但其余的基因只是它的环境的一个组成部分,就如温度、食物、捕食者或伙伴是它的环境一样。

    基因发挥的作用取决于它的环境,而所谓的环境也包括其余基因。有时,一个基因在一个特定基因在场的情况下发挥的是一种作用,而在另一组伙伴基因在场的情况下发挥的又是一种截然不同的作用。一个个体的全部基因构成一种遗传气候或背景,它会调整和影响任何一个具体基因的作用。

    但现在我的理论似乎出现了矛盾。如果孕育一个婴儿是这样一种复杂的相互配合的冒险事业,如果每一个基因都需要几千个伙伴基因配合才能共同完成它的任务,那么我们又怎么能把这种情况同我刚才对不可分的基因的描述统一起来呢?我曾说,这些不可分的基因像永生的小羚羊一样年复一年、代复一代地从一个个体跳跃到另一个个体:它们是自由自在、不受约束地追求生命的自私行为者,难道这都是一派胡言吗?一点儿也不是。也许我为了追求辞藻绚丽的章句而有点儿神魂颠倒,但我绝不是在胡言乱语,事实上也不存在真正的矛盾。我可以用另外一种类比来加以说明。

    在牛津和剑桥的赛艇对抗赛中单靠一个划桨能手是赢不了的,他还需要8个伙伴。每个桨手都是一个专家,他们总是分别在特定的位置上就座——前桨手或尾桨手或艇长等。这是一项相互配合的冒险行动,然而有些人比另一些人划得好。假使有一位教练需要从一伙儿候选人中挑选他理想的船员,这些船员中有的人必须是优秀的前桨手,其他一些人要善于执行艇长的职务,等等。现在我们假设这位教练是这样挑选的:他把应试的船员集合在一起,随意分成3队,每一队的成员也被随意地安排到各个位置上,然后让这3条艇展开对抗赛。每天都是如此,每天都有新的阵容。几周之后将会出现这样的情况:赢得胜利的赛艇,往往载有相同的那几个人,他们被认为是划桨能手。其他一些人似乎总是在划得较慢的船队里,他们最终被淘汰。但即使是一个出色的桨手有时也可能落入划得慢的船队中。这种情况不是由于其他成员技术差,就是由于运气不好,比如说逆风的风力很强。所谓最好的桨手往往出现在得胜的艇上,不过是一种平均的说法。

    桨手是基因。争夺赛艇上每一位置的对手是等位基因,它们有可能占据染色体上同一个位置。划得快相当于孕育一个能成功地生存的个体,风则相当于外部环境,候选人这个整体是基因库。就任何个体的生存而言,该个体的全部基因都同舟共济。许多“好的”基因发现自己与一群“坏的”基因为伍,也就是同一个致死基因共存于一个个体。这一致死基因把这一尚在幼年时期的个体扼杀,这样,“好的”基因也就和其余基因同归于尽。但这仅仅是一个个体,而这个“好的”基因的许多拷贝却在其他没有致死基因的个体中生存了下来。许多“好的”基因的拷贝由于碰巧与“坏的”基因共处一个个体而受累,还有许多由于其他形式的厄运而消亡,如它们所寄居的个体被雷电击中。但按照我们的定义,运气不论好坏并无规律可循,一个一贯败阵的基因不能怪自己运气不好,因为它本来就是个“坏的”基因。

    好桨手的特点之一是相互配合得好,即具有同其余桨手默契配合的能力。对于赛艇来说,这种相互配合的重要性不亚于强有力的肌肉。我们在有关蝴蝶的例子中已经看到,自然选择可能以倒位的方式或染色体片段的其他活动方式无意识地对一个基因复合体进行“编辑”,这样就把配合得很好的一些基因组成紧密连接在一起的群体。但从另外一个意义上说,一些实际上并不相互接触的基因也能够通过选择的过程来发挥其相容性(mutual compatibility)。一个基因在以后历代的个体中将会与其他基因,即基因库里的其他基因相遇,如果它能和这些基因中的大多数配合得很好,它往往会从中得到好处。

    举例说,生存能力强的食肉动物个体要具备几个特征,其中包括锋利的切齿,适合消化肉类的肠胃,以及其他许多特征。但另一方面,一个生存能力强的食草动物却需要扁平的磨齿,以及一副长得多的肠子,其消化的化学过程也不同。在食草动物的基因库中,任何基因,如果它赋予其“主人”以锋利的食肉牙齿是不大可能取得成功的。这倒不是因为食肉对谁来说都是一种坏习惯,而是因为除非你有合适的肠子,以及一切食肉生活方式的其他特征,否则你就无法有效地吃肉。因此,影响锋利的食肉牙齿形成的基因并非本来就是“坏”基因,只有在食草动物种种特征形成的基因所主宰的基因库中,它们才算是“坏”基因。

    这是个复杂而微妙的概念。它之所以复杂,是因为一个基因的“环境”主要由其他基因组成,而每一个这样的基因本身又因它和它的环境中的其他基因配合的能力而被选择。适合于说明这种微妙概念的类比是存在的,但它并非来自日常生活的经验。它同人类的“竞赛理论”类似,这种类比法将在第5章谈到个体动物间进行的进犯性对抗时加以介绍,因此,我把这点放到第5章的结尾处再进一步讨论。现在我回过头来继续探讨本章的中心要义,这就是:最好不要把自然选择的基本单位看作物种,或者种群,甚至个体;最好把它看作遗传物质的某种小单位。为方便起见,我们把它简称为基因。前面已经讲过,这个论点基于这样一种假设:基因能够永存不朽,而个体以及其他更高级的单位的寿命都是短暂的。这一假设以下面两个事实为依据:有性生殖和染色体交换,个体的消亡。这是两个不容否认的事实,但这不能阻止我们去追问:为什么它们是事实?我们以及大多数其他生存机器为什么要进行有性生殖?为什么我们的染色体要进行交换?而我们又为什么不能永生?我们为什么会老死是一个复杂的问题,其具体细节不在本书的探讨范围之内。除各种特殊原因以外,有人提出了一些比较普遍的原因。例如有一种理论认为,衰老标志着一个个体一生中发生的有害的复制错误以及其他种类的基因损伤的积累。另外一种理论为梅达沃(Peter Medawar)爵士首创*,它是按照基因选择的概念来思考进化问题的典范。他首先摈弃了此类传统的论点:“老的个体的死亡对同物种其他成员而言是一种利他主义行为。因为假如它们衰老得不能再生殖却还留恋尘世,它们就会充塞世界,对大家都无好处。”梅达沃指出,这是一种以假定为论据的狡辩,因为这种论点以它必须证实的情况作为假定,即年老的动物衰老得不能再生殖。这也是一种类似于类群选择或物种选择的天真的解释方法,尽管我们可以把有关部分重新讲得更好听一些。梅达沃自己的理论具有极好的逻辑性,我们可以将其大意综述一下。

    我们已经提出了这样的问题,即哪些是“好的”基因最普遍的特性。我们认为“自私”是其中之一。但成功基因所具有的另一个普遍特性是,它们通常把它们的生存机器的死亡至少推迟至生殖之后。毫无疑问,你有些堂兄弟或伯祖父是早年夭折的,但你的直系祖先中没有一个是幼年夭折的。祖先是不会在年幼时就丧生的。

    促使其个体死亡的基因被称为致死基因。半致死基因具有某种使个体衰弱的作用,这种作用增加了由于其他因素而死亡的可能性。任何基因都在生命的某一特定阶段对个体施加其最大的影响,致死和半致死基因也不例外。大部分基因是在生命的胚胎阶段产生作用的,另有一些是在童年、青年、中年,还有一些则是在老年。请思考一下这样一个事实:一条毛虫和由它变成的蝴蝶具有完全相同的一组基因。很明显,致死基因往往被从基因库中清除掉了。但同样明显的是,基因库中的晚期活动的致死基因要比早期活动的致死基因稳定得多。假如一个年纪较大的个体有足够的时间,至少进行过若干次生殖之后致死基因的作用才表现出来,那么这一致死基因在基因库中仍旧是成功的。例如,使老年个体致癌的基因可以遗传给无数的后代,因为这些个体在患癌之前就已生殖,而另一方面,使青年个体致癌的基因就不会遗传给众多的后代,使幼儿患致死癌症的基因就不会遗传给任何后代。根据这一理论,年老体衰只是基因库中晚期活动致死基因同半致死基因的一种积累的副产品。这些晚期活动的致死和半致死基因之所以有机会穿过了自然选择的网,仅仅是因为它们是在晚期活动的。

    梅达沃本人着重指出的一点是,自然选择有利于这样一些基因生存:它们具有推迟其他致死基因活动的作用,能够促进好的基因发挥其作用。情况可能是,基因活动开始时受遗传控制的种种变化构成了进化内容的许多方面。

    值得重视的是,这一理论不必做出任何事先的假设,即个体必须到达一定的年龄才能生殖。如果我们以假设一切个体都同样能够在任何年龄生殖作为出发点,那么梅达沃的理论立刻就能推断出晚期活动的有害基因在基因库中的积累,以及由此导致的老年生殖活动减少的倾向。

    这里就此说几句离题的话。这一理论有一个很好的特点,它启发我们去做某些相当有趣的推测。譬如根据这一理论,如果我们想要延长人类的寿命,一般可以通过两种方式来实现这个目的。第一,我们可以禁止在一定的年龄之前生殖,如40岁之前。经过几世纪之后,最低年龄限制可提高到50岁,依此类推。可以想见,用这样的方法,人类的寿命可提高到几个世纪。但我很难想象会有人去认真严肃地制定这样一种政策。

    第二,我们可以想办法去“愚弄”基因,让它认为它所寄居的个体比实际的要年轻。如果付诸实践,这意味着需要验明随着年纪的增大,发生在个体内部化学环境里的种种变化。任何这种变化都可能是促使晚期活动的致死基因开始活动的“提示”(cues)。仿效青年个体的表面化学特性有可能防止晚期活动的有害基因接受开始活动的提示。有趣的是,老年的化学信号本身,在任何正常意义上讲,不一定是有害的。比如,我们假设偶然出现了这种情况:一种S物质在老年个体中的浓度比在青年个体中来得高,这种S物质本身可能完全无害,也许是长期以来体内积累起来的食物中的某种物质。如果有这样一个基因,它在S物质存在的情况下碰巧产生了有害的影响,而在没有S物质存在的情况下却是一个好基因,那么这样的基因肯定在基因库中自动地被选择,而且实际上它成了一种“导致”年老死亡的基因。补救的办法是,只要把S物质从体内清除掉就行了。

    这种观点的重大变革性在于,S物质本身仅是一种老年的标志。研究人员可能认为S物质是一种有毒物质,他会绞尽脑汁去寻找S物质同人体机能失常之间直接的、偶然的关系。但按照我们假定的例子来讲,他可能是在浪费时间!

    也可能存在一种Y物质,这种物质在青年个体中要比在老年个体中更集中。从这一意义上讲,Y物质是青春的一种“标志”。同样,那些在有Y物质存在的情况下产生好的效果,而在没有Y物质存在的情况下却是有害的基因会被选择。由于还没有办法知道S物质或Y物质是什么东西——可能存在许多这样的物质——我们只能做这样的一般性的推测:你在一个老年个体中越能模仿或模拟青年个体的特点,不论这些特点看来是多么表面化,那个老年个体应该生存得越久。

    我必须强调一下,这些只是基于梅达沃理论的一些推测。尽管从某种意义上说,梅达沃理论在逻辑上是有些道理的,但并无把它说成是对任何年老体衰实例的正确解释的必要。与我们现在的论题密切相关的是,基因选择的进化观点对于个体年老时要死亡这种趋势,能毫无困难地加以解释。对于个体必然要死亡的假设是本章论证的核心,它是可以在这一理论的范围内得到圆满解释的。

    我一笔带过的另一个假设,即存在有性生殖和交换,更加难以解释清楚。交换并不总是一定要发生,雄果蝇就不会发生交换,雌果蝇体内也有一种具有压抑交换作用的基因。假定我们要饲养一个果蝇种群,而这类基因在该种群中普遍存在的话,“染色体库”中的染色体就会成为不可分割的自然选择基本单位。其实,如果我们遵循我们的定义进行逻辑推理直到得出结论的话,就不得不把整条染色体视作一个“基因”。

    还有,性的替代方式是存在的。雌蚜虫能产出无父的、活的雌性后代。每个这样的后代都具有它母亲的全部基因(顺便提一下,母亲“子宫”内的胎儿的子宫内甚至可能有一个更小的胎儿。因此,一只雌蚜虫可以同时生一个女儿和一个外孙女,它们相当于这只雌蚜虫的双胞胎)。许多植物的繁殖以营养体繁殖的方式进行,形成吸根。这种情况我们宁可称其为生长,也不叫它生殖。然而你如果仔细考虑一下,生长同无性生殖之间几乎无任何区别,因为二者都是细胞简单的有丝分裂。有时以营养体繁殖的方式生长出来的植物同“母体”分离开来,在其他情况下,如以榆树为例,连接根出条可以保持完整无损。事实上,整片榆树林可以被看作一个单一的个体。

    因此,现在的问题是:如果蚜虫和榆树不进行有性生殖,为什么我们要费这样大的周折把我们的基因同其他人的基因混合起来才能生育一个婴儿呢?看上去这样做的确有点古怪。性活动,这种把简单的复制变得反常的行为,当初为什么要出现呢?性到底有什么益处?*

    这是进化论者极难回答的一个问题。为了认真地回答这一问题,大多数尝试都要涉及复杂的数学推理。我将很坦率地避开这个问题,但有一点要在这里谈谈,那就是,理论家们在解释性的进化方面所遇到的困难,至少在某些方面是由于他们习惯于认为个体总是想最大限度地增加其生存下来的基因的数目。根据这样的说法,性活动似乎是一种自相矛盾的现象,因为个体要繁殖自己的基因,性是一种“效率低”的方式:每个胎儿只有这个个体基因的50%,另外50%由配偶提供。要是他能够像蚜虫那样,直接“出芽”(bud off),他就会将自己100%的基因传给下一代的每一个小孩,这些孩子是与他自己丝毫不差的复制品。这一明显的矛盾促使某些理论家接受类群选择论,因为他们比较容易在群体水平上解释性活动的好处。用博德默简单明了的话来说,性“促进了在单个个体内积累那些以往分别出现于不同个体内的有利突变”。

    但如果我们遵循本书的论证,并把个体看作由长寿基因组成的临时同盟所构建的生存机器,这一矛盾看起来就不那么紧要了。从整个个体的角度来看,“有效性”无关紧要。有性生殖与无性生殖相对,可以被视作单基因控制下的一种特性,就同蓝眼和棕眼一样。一个“负责”有性生殖的基因为了它自私的目的而操纵其他全部基因,负责交换的基因也是如此。甚至有一种叫作突变子的基因,它们操纵其他基因中的拷贝错误率。按照定义,拷贝错误对错误地拷贝出来的基因是不利的,但如果这种拷贝错误对诱致这种错误的自私的突变基因有利的话,那么这种突变基因就会在基因库里扩散开。同样,如果交换对负责交换的基因有好处,这就是存在交换现象的充分理由;如果同无性生殖相对的有性生殖有利于负责有性生殖的基因,这也就是存在有性生殖现象的充分理由。有性生殖对个体的其余基因是否有好处,比较而言也就无关紧要了。从自私基因的观点来看,性活动也就不那么难以解释了。

    这种情况非常接近于一种以假定为论据的狡辩,因为性别的存在是整个一系列推论的先决条件,而这一系列推论的最后结果认为基因是自然选择单位。我认为是有办法摆脱这一困境的,但本书宗旨不在于探索这一问题。性毫无疑问是存在的,这一点是真实的,我们之所以能将这种小的遗传单位或基因看作最接近于基本的和独立的进化因素,正是性和染色体交换的结果。

    只要学会按照自私基因的理论去思考问题,性这一明显的矛盾就变得不那么令人迷惑不解了。例如有机体内的DNA数量似乎比建造这些有机体所必需的数量来得大,因为相当一部分DNA从未转译为蛋白质。从个体有机体的观点来看,这似乎又是一个自相矛盾的问题。如果DNA的“目的”是建造有机体,那么,一大批DNA并不这样做实在令人奇怪的。生物学家在苦思冥想,这些显然多余的DNA正在做些什么有益的工作呢?但从自私的基因本身的角度来看,并不存在自相矛盾之处。DNA的真正“目的”仅仅是为了生存。解释多余的DNA最简单的方法是,把它看作一个寄生虫,或者最多是一个无害但也无用的乘客,在其他DNA所创造的生存机器中搭便车而已*。

    有些人反对这种在他们看来过分以基因为中心的进化观点。他们争辩说,实际上生存或死亡的毕竟是包括其全部基因在内的完整个体,我希望我在本章所讲的足以表明在这一点上其实并不存在分歧。就像赛艇比赛中整条船赢或输一样,生存或死亡的确实是个体,自然选择的直接形式几乎总是在个体水平上表现出来。但非随机的个体死亡以及成功生殖的远期后果,表现为基因库中变化着的基因频率。对于现代复制因子,基因库起着原始汤对于原始复制因子所起的同样作用。性活动和染色体交换起着保持原始汤的现代对等物的那种流动性的作用。由于性活动和染色体交换,基因库始终不停地被搅混,使其中的基因部分地混合。所谓进化就是指基因库中的某些基因变得多了,而另一些变得少了的过程。每当我们想要解释某种特性,如利他性行为的演化现象时,最好养成这样一种习惯——只要问问自己:“这种特性对基因库里的基因频率有什么影响?”有时基因语言有点乏味,为简洁和生动起见,我们不免要借助于比喻。不过我们要以怀疑的目光注视着我们的比喻,以便在必要时能把它们还原为基因语言。

    就基因而言,基因库只是基因生活于其中的一种新汤,不同的是,现在基因赖以生存的方式是,在不断地制造必将消亡的生存机器的过程中,同来自基因库的一批批络绎不绝的伙伴进行合作。下面一章我们要论述生存机器本身,以及在某个意义上,我们可以说基因控制其生存机器的行为。

    第4章 基因机器

    生存机器最初是作为基因的贮藏器而存在的。它们的作用是消极的——仅仅是作为保护壁使基因得以抵御其敌手所发动的化学战以及意外的分子攻击。在远古时期,原始汤里大量存在的有机分子是它们赖以为生的“食料”。这些有机食物千百年来在阳光有力的影响下滋生繁殖,但随着这些食物的告罄,生存机器一度逍遥自在的生活也至此终结。这时,它们的一大分支,即现在人们所说的植物,开始利用阳光直接把简单分子组建成复杂分子,并以快得多的速度重新进行过去发生在原始汤里的合成过程。另外一个分支,即现在人们所说的动物,“发现了”如何利用植物通过化学作用取得的劳动果实:动物要么将植物吃掉,要么将其他的动物吃掉。随着时间的推移,生存机器的这两大分支逐步获得了日益巧妙的技能,来提高其生活方式的效能。与此同时,新的生活方式层出不穷,小分支以及小小分支逐渐形成,每一个小分支在某一特殊方面,如在海洋里、陆地上、天空中、地下、树上或其他生命体内,取得高人一等的谋生技能。这种小分支不断形成的过程,最终带来了今日给人类以如此深刻印象的丰富多彩的动植物。

    动物和植物经过进化都发展成为多细胞体,每一个细胞都获得全套基因的完整拷贝。这个进化过程始于何时,为什么会发生,整个过程经过几个独立的阶段才得以完成,这一切我们都无从知道。有人以“群体”(colony)来比喻动植物的躯体,把它们说成是细胞的“群体”。我却宁愿把躯体视为基因的群体,把细胞视为便于基因的化学工业进行活动的工作单位。

    尽管我们可以把躯体称为基因的群体,但就其行为而言,各种躯体确实取得了它自己的独特个性。一只动物是作为一个内部协调的整体,即一个单位来进行活动的,同样,我在主观意识上觉得自己是一个单位而不是一个群体。这是意料中的事情。选择的过程有利于那些能同其他基因合作的基因。为争夺稀有资源,为吞食其他生存机器并避免被对方吃掉,生存机器投身于激烈无情的竞争和斗争。

    为了应对这一切竞争和斗争,在共有的躯体内存在一个中央协调的系统必然比无政府状态有利得多。时至今日,发生于基因之间的交错的共同进化过程已经发展到这一地步,以致个体生存机器所表现的集群性(communal nature)实质上已不可辨认。事实上,很多生物学家都不承认存在这种集群性,因此也不同意我的观点。

    就本书在后面章节中提到的种种论点的“可靠性”(新闻工作者用语)而言,幸而这种分歧在很大程度上是学术性的。如果我们在谈论生存机器的行为时反复提到基因,那未免会使人感到厌烦,事实上也没有必要这样做,正如我们谈论汽车的性能时提到量子和基本粒子反觉不便。实际上,把个体视为一个行为者,它“致力”于在未来的世代中增加基因的总量,这种近似的说法在一般情况下自有其方便之处。而我使用的亦将是简便的语言。除非另做说明,“利他行为”与“自私行为”都是指某一个动物个体对另一个动物个体的行为。

    这一章将论述行为,即生存机器的动物分支广泛利用的那种快速动作。动物已经变成活跃而有进取心的基因运载工具——基因机器。在生物学家的词汇里,行为具有快速的特性。植物也会动,但动得异常缓慢。在电影的快镜头里,攀缘植物看起来像是活跃的动物,但大多数植物的活动其实只限于不可逆转的生长。而另一方面,动物发展出种种活动方式,其速度超过植物数十万倍。而且,动物的动作是可逆转的,可以无数次重复。

    动物进化中用以进行快速动作的部件是肌肉。肌肉就是引擎,它像蒸汽机或内燃机一样,以其贮藏的化学燃料为能量产生机械运动。不同之处在于:肌肉以张力的形式产生直接的机械力,而不是像蒸汽机或内燃机那样产生气压。但肌肉与引擎相似的另外一点是,它们通常凭借绳索和带有铰链的杠杆来发挥力量。在人体内,杠杆就是骨骼,绳索就是肌腱,铰链就是关节。关于肌肉如何通过分子进行活动,人们知之甚多,但我却感到下面的问题更有趣:我们如何控制肌肉收缩的时间和速度?

    你有没有观察过构造复杂的人造机器?譬如说,针织机或缝纫机、纺织机、自动装瓶机或干草打包机。这些机械利用各式各样的原动力,如电动马达或拖拉机,但这些机械在运转时如何控制时间和速度却是一个更为复杂的问题。阀门会依次开启和关闭,捆扎干草的钢抓手会灵巧地打结并在最恰当的时刻伸出割刀来切断细绳。许多人造机器的定时操作是依靠凸轮来完成的。凸轮的发明的确是个辉煌的成就。它利用偏心轮或异形轮把简单的运转转变为复杂的、有节奏性的运转。

    自动演奏乐器的原理与此相仿。其他乐器,如蒸汽风琴,或自动钢琴等利用按一定模式打孔的纸制卷轴或卡片来发出音调。近年来,这些简单的机械定时装置有被电子定时装置取代的趋向,数字计算机就是个例子。它们是大型的多功能电子装置,能够用以产生复杂的定时动作。像计算机这样的现代电子仪器,其主要元件是半导体,我们所熟悉的晶体管便是半导体的一种形式。

    生存机器看起来绕过了凸轮和打孔卡片,它使用的定时装置和电子计算机有更多的相同之处,尽管严格说来,两者的基本操作方式是不同的。生物计算机的基本单位是神经细胞或所谓的神经元,就其内部的工作情况看来,是完全不同于晶体管的。神经元彼此之间通讯用的密码确实有点像计算机的脉冲码,但神经元作为一个数据处理单位比晶体管复杂得多。一个神经元可以通过数以万计的接线与其他单位联系,而不仅仅是3个。神经元工作起来比晶体管慢些,但就微型化程度而言,晶体管大为逊色。因此,过去20年来微型化是主宰电子工业的一种倾向。关于这一点,下面这个事实很能说明问题:在我们的脑袋里大约有100亿个神经元,而一个脑壳最多也只能塞进几百个晶体管。

    植物不需要神经元,因为它们不必移动就能存活。但大多数的动物类群都有神经元。在动物的进化过程中,它们可能老早就“发现”了神经元,后来被所有的种群继承了下来;也有可能是分几次重新发现的。

    从根本上说,神经元不过是一种细胞。和其他细胞一样,有细胞核和染色体,但它的细胞膜却形成拉长了的、薄的线状突出部分。通常一个神经元有一条特别长的“线”,我们称之为轴突。一个轴突的宽度狭小到只有在显微镜下才能辨认,但其长度可能长达好几英尺,有些轴突甚至和长颈鹿的颈部一样长。轴突通常是多股集束在一起的,构成我们称之为神经的多心导线。这些轴突从躯体的一部分通向其他部分,像电话干线一样传递消息。其他种类的神经元具有短的轴突,它们只出现于我们称之为神经节的密集神经组织中。如果是很大的神经元,它们也存在于大脑里。就功能而言,我们可以认为大脑和计算机是相似的*,因为这两种类型的机器在分析了复杂模式的输入信号并参考了存贮的数据之后,都能发出复杂模式的输出信号。

    大脑对生存机器做出实际贡献的主要方式在于控制和协调肌肉的收缩。为了达到这个目的,它们需要有通向各个肌肉的导线,也就是运动神经。但对基因的有效保存来说,只有在肌肉的收缩时间和外界事件发生的时间具有某种关系时才能实现。上下颌肌肉的收缩必须等到嘴巴里有值得咀嚼的东西时才有实际意义。同样,腿部肌肉要在出现值得奔跑过去或必须躲避的东西时,按跑步模式收缩才有实际意义。正因如此,自然选择有利于这样一些动物,它们具备感觉器官,能将外界发生的各种形式的有形事件转化为神经元的脉冲码。大脑通过被称为“感觉神经”的导线与感觉器官——眼、耳、味蕾等一一相连。感觉系统如何发生作用尤其使人感到费解,因为它们识别影像的高度复杂的技巧远胜于最优良、最昂贵的人造机器。如果不是这样的话,打字员都要成为冗员,因为他们的工作完全可以由识别言语或字迹的机器代劳。在未来的数十年中,打字员还是不会失业的。

    从前某个时候,感觉器官可能在某种程度上直接与肌肉联系,实际上,今日的海葵还未完全脱离这种状态,因为对它们的生活方式来说,这样的联系是有效的。但为了在各种外界事件发生的时间与肌肉收缩的时间之间建立起更复杂的间接联系,就需要有大脑的某种功能作为媒介。在进化过程中,一个显著的进展是记忆力的“发明”。借助这种记忆力,肌肉收缩的定时不仅受不久以前而且也受很久以前的种种事件的影响。记忆装置,或贮存器,也是数字计算机的主要部件。计算机的记忆装置比我们的记忆力更为可靠,但它们的容量较小,而且在信息检索的技巧方面远逊于我们的记忆力。

    生存机器的行为有一个最突出的特征,这就是明显的目的性。在这里我指的不仅是生存机器似乎能够深思熟虑去帮助动物的基因生存下去(尽管事实的确是这样),还有生存机器的行为和人类的有目的的行为更为类似这一事实。我们看到动物在“寻找”食物、配偶或迷途的孩子时,总是情不自禁地认为这些动物在那时的感受和我们自己在寻找时所体验到的某些感受一样。这些感受可能包括对某个对象的“欲望”,对这个向往的对象形成的“心象”以及存在于心中的“目的”。我们每一个人出于自身的体验都了解到这一事实:现代生存机器之中至少有一种已经通过进化的历程,使这个目的性逐渐取得我们称之为“意识”的特性。我不通晓哲理,因此无法深入探讨这个事实的含义,但就目前我们所讨论的课题而言,幸而这是无关紧要的。我们把机器的运转说成机器好像受某种目的性驱使,而罔顾其是否真的具有意识,因为这样来得方便些。这些机器基本上是非常简单的,而且无意识地追踪目标状态的原理在工程科学中经常应用。瓦特离心调速器便是其中一个典型的例子。

    它所牵涉到的基本原理就是我们称之为负反馈的原理,而负反馈又有多种多样的形式。一般来说,它是这样发挥作用的:这种运转起来好像带有自觉目的的“目的机器”配有某种度量装置,它能测量出事物的当前状态和“要求达到的”状态之间的差距,机器的这种结构方式使它能在差距越大时运转得越快。这样,机器能够自动地减少差距——负反馈的原理就在于此——在“要求达到的”状态实现时,机器能自动停止运转。瓦特调速器上装有一对球,它们借蒸汽机的推动力而旋转。这两只球分别安装在两条活动连接的杆臂的顶端。随着球的转速增大,离心力逐渐抵消引力的结果,使杆臂越来越接近水平。由于杆臂连接在为机器提供蒸汽的阀门上,当杆臂接近水平时,提供的蒸汽就逐渐减少。因此,如果机器运转得过快,蒸汽的馈给量就会减少,机器运转的速度也就慢下来。反过来,如果机器运转得过慢,阀门会自动地增加蒸汽馈给量,机器运转的速度也随之增快。但由于过调量或时滞的关系,这类机器常常发生振荡现象。为了弥补这种缺陷,工程师总是设法添加某种设备以减少这种振荡的幅度。

    瓦特离心调速器“要求达到的”状态是一定的旋转速度。显然,机器本身并非有意识地要求达到这个速度。一台机器所谓的“目的”不过是指它趋向于恢复的那种状态。近代的目的机器把诸如负反馈这样的基本原理加以发展,从而能够进行复杂得多的“逼真的”动作。比方说,导弹好像能主动地搜索目标,并且在目标进入射程之后进行追踪,与此同时,它还要考虑目标逃避追击的各种迂回曲折的动作,有时甚至能“事先估计”到这些动作或“先发制人”。这些细节这里不拟详谈。简单地说,它们牵涉各式各样的负反馈、“前馈”以及工程师们熟知的一些其他原理。我们现在已经知道,这些原理广泛地应用于生命体的运动中。我们没有必要认为导弹是一种具有任何近似于意识的神经反应的物体,但在普通人眼中,导弹那种显然是深思熟虑的、目的性很强的动作叫人难以相信这枚导弹不是由一名飞行员直接控制的。

    一种常见的误解是,认为导弹之类的机器是有意识的人设计和制造的,那么它必然是处在有意识的人的直接控制下。这种误解的另一个变种是:计算机并不能真的下棋,因为它们只能听命于操纵计算机的人。我们必须懂得这种误解的根源,因为它影响到我们对所谓基因如何“控制”行为的含义的理解。计算机下棋是一个很能说明问题的例子,因此我想扼要地谈一下。

    计算机下棋的水平如今还未能达到象棋大师那样的水平,但它足以与一个优秀的业余棋手媲美。更准确的说法是,计算机的程序足以与一个优秀的业余棋手媲美,因为程序本身对使用具体哪一台计算机来表演其技巧是从不苛求的。那么,程序员的任务是什么呢?第一,他肯定不像一个演木偶戏的牵线人那样每时每刻操纵计算机(这是作弊行为)。他编好程序,把它输入计算机内,接着计算机便独立操作:没有人进行干预,除了让对手把他的一着输入机内。程序员是否预先估计到一切可能出现的棋步,从而编好一份长长的清单,列出针对每一种情况的妙着?当然不是这样。因为在棋局中,可能出现的棋步多如恒河沙数,就是到了世界末日也编不出一份完备的清单来。也是出于同样的理由,我们不可能为计算机编制这样一份程序,使它能在“电脑”里事先走一次所有可能出现的棋步,以及所有可能的应着,以寻求克敌制胜的战略。不同的棋局比银河里的原子还要多。这些仅仅是琐碎的问题,说明为下棋的计算机编制程序时面临的难题。事实上这是一个极难解决的难题,即使是最周密的程序也不能和象棋大师匹敌,这是不足为奇的。

    程序员的作用事实上和一个指点他儿子怎样下棋的父亲差不多。他把主要的走法提纲挚领地告诉计算机,而不是把适用于每一种开局的各种走法都告诉它。他不是用我们日常使用的语言逐字地说,例如“象走田”,而是用数学的语言这样说:“象的新坐标来自老坐标,程序是在老坐标X以及老坐标Y上加上同一个常数,但其符号不必相同。”实际上使用的语言当然更简洁些。接着他可以再把一些“忠告”编入程序内,使用的是同样的数学或逻辑语言,其大意如果用我们日常的语言来表达,不外乎“不要把你的王暴露在敌前”,或一些实用的诀窍,如一马“两用”,同时进攻对方两子。这些具体的走法是耐人寻味的,但讲下去未免离题太远。重要的是,计算机在走了第一步棋之后,就需要独立操作,不能指望它的主人再做任何指点。程序员所能做的一切只是事先竭尽所能把计算机部署好,并在具体知识的提供以及战略战术的提示两者之间取得适当的平衡。

    基因也控制它们所属生存机器的行为,但不是像直接用手指牵动木偶那样,而是像计算机的程序员一样通过间接的途径。基因所能做到的也只限于事先的部署,事后生存机器在独立操作时它们只能袖手旁观。为什么基因如此缺乏主动精神呢?为什么它们不把缰绳紧握在手,随时指挥生存机器的行为呢?这是时滞造成的困难。有一本科幻小说通过比拟的手法非常巧妙地说明了这个问题。这本扣人心弦的小说是霍伊尔(Fred Hoyle)和埃利奥特(John Elliot)合著的《仙女座的A》(A for Andromeda)。像一切有价值的科幻小说一样,它有一些有趣的科学论点作为依据。可是,说也奇怪,这本小说对其中一个最重要的科学论点似乎有意避而不谈,而是让读者自己去想象。如果我在这里把它和盘托出,我想两位作者不会见怪吧。

    离我们200光年之遥的仙女座里有一个文明世界。*那里的人想把他们的文化传播到一些远方的世界去。怎样做才是最好的办法呢?直接派人走一次是不可能的。在宇宙中,你从一个地方到另外一个地方的最大速度,理论上不能超过光速这个上限,何况实际上由于机械功率的限制,最高速度要比光速低得多。此外,在宇宙中,可能并没有那么多的世界值得你去走一趟,你知道朝哪一方向进发才会不虚此行呢?无线电波是和宇宙其余部分联系的较理想的手段,因为如果你有足够的能量把你的无线电信号向四面八方播送而不是定向发射的话,能收到你的电波的世界就非常多(其数目与电波传播的距离的平方成正比)。无线电波以光速传播,也就是说,从仙女座发出的信号要经过200年才能到达地球。这样远的距离使两地之间无法进行通话。就算从地球上发出的每一个信息都会被十二代人一代一代地传达下去,试图和如此遥远的人进行通话无论如何也是劳民伤财的。

    这是个我们不久就要面临的实际问题。地球与火星之间,无线电波要走4分钟左右。毫无疑问,太空人今后必须改变谈话的习惯,说起话来不能再是你一句我一句,而必须使用长长的独白,自言自语。这种通话方式与其说是对话,不如说是通信。作为另外一个例子,佩恩(Roger Payne)指出,海洋的音响效果具有某些奇特的性质,这意味着座头鲸发出的异常响亮的“歌声”在理论上可以传到世界各处,只要它们游在海水的某一特定深度上。座头鲸是否真的彼此进行远距离通话,我们不得而知,如果真有其事的话,它们所处的困境就像火星上的宇航员一样。按照声音在水中传播的速度,座头鲸的歌声传到大西洋彼岸然后等对方的歌声再传回来,前后需要两小时左右。在我看来,座头鲸的独唱往往持续8分钟,其间并无重复之处,然后又从头唱起,这样周而复始地唱上好多遍,每一循环历时8分钟左右,其原因就在于此。

    小说中的仙女座人也是这样做的。他们知道,等候对方的回音是没有实际意义的,因此他们把要讲的话集中在一起,编写成一份完整的长篇电文,然后向空间播送,每次历时数月,以后又不断重复。不过,他们发出的信息和鲸鱼的却大相径庭。仙女座人的信息是用电码写成的,它指导别人如何建造一台巨型计算机并为它编制程序。这份电文使用的当然不是人类的语言,但对熟练的密码员来说,几乎一切密码都是可以破译的,尤其是密码设计者本来的意图就是让它便于破译。这份电文首先被班克(Jodrell Bank)的射电望远镜截获,电文最后也被译出。按照指示,计算机终于建成,其程序亦得以付诸实施,结果却几乎为人类带来灾难,因为仙女座人并非对一切人都怀有利他主义的意图。这台计算机几乎把整个世界置于它的独裁统治之下。最后,主人公在千钧一发之际用利斧砸碎了这台计算机。

    在我们看来,有趣的问题是,在什么意义上我们可以说仙女座人在操纵地球上的事务?他们对计算机的所作所为无法随时直接控制,事实上,他们甚至连计算机已经建成这个事实也无从知道,因为这些情况要经过200年才能传到他们耳中。计算机完全独立地做出决定和采取行动,它甚至不能再向它的主人请教一般的策略性问题。由于200年的障碍难以逾越,一切指示都必须事先纳入程序。原则上,这和计算机下棋所要求的程序大致相同,但对当地情况具有更大的灵活性和适应能力。这是因为这样的程序不仅要针对地球上的情况,还要针对具有先进技术的形形色色的世界,这些世界的具体情况仙女座人是心中无数的。

    正像仙女座人必须在地球上建立一台计算机来为他们逐日做出决定一样,我们的基因必须建立一个大脑。但是基因不仅是发出电码指示的仙女座人,它们也是指示本身,它们不能直接指挥我们这些木偶的理由也是一样的——时滞。基因是通过控制蛋白质的合成来发挥作用的,这本来是操纵世界的一种强有力的手段,但必须假以时日才能见到成效。培养一个胚胎需要花上几个月的时间去耐心地操纵蛋白质。另一方面,关于行为的最重要的一点是行为的快速性,用以测定行为的时间单位不是几个月而是几秒或几分之一秒。在外部世界中某种情况发生了:一只猫头鹰掠过头顶,沙沙作响的草丛暴露了猎物,接着在顷刻之间神经系统猛然行动,肌肉跃起,猎物得以死里逃生,或成为牺牲品。基因并没有这样快的反应时间。和仙女座人一样,基因只能竭尽所能事先部署一切,为它们自己建造一台快速执行的计算机,使之掌握基因能够“预料”到的尽可能多的各种情况的规律,并为此提出“忠告”。但生命和棋局一样是变幻莫测的,事先预见到一切是不现实的。像棋局的程序编制员一样,基因对生存机器的“指令”不可能是具体细微的,它只能是一般的战略以及适用于生计的各种诀窍。*

    正如扬(Young)所指出的,基因必须完成类似对未来做出预测那样的任务。当胚胎生存机器处于建造阶段时,它此后一生中可能遇到的种种危险和问题都是未知数。有谁能预言有什么食肉动物会蹲伏在哪一个树丛里伺机袭击它,或者有什么快腿活物会在它面前突然出现,之字形跑过?对于这些问题人类不能预言,基因也无能为力。但某些带有普遍性的情况是可以预见的。北极熊基因可以有把握地预先知道,它们尚未出生的生存机器将会面对一个寒冷的环境。这种预测并不是基因进行思考的结果。它们从不思考:它们只不过是预先准备好一身厚厚的皮毛,因为在以前的一些躯体内,它们一直是这样做的。这也是为什么它们仍然能存在于基因库的原因。它们也预见到大地将为积雪所覆盖,而这种预见性体现在皮毛的色泽上。基因使皮毛呈白色,从而取得伪装。如果北极的气候急剧变化以致小北极熊发现它们出生在热带的沙漠里,基因的预测就错了,它们将要为此付出代价。小熊会夭折,它们体内的基因也随之死亡。

    在一个复杂的世界中,对未来做出预测是有一定风险的。生存机器的每一个决定都是赌博行为,基因有责任事先为大脑编好程序,以便大脑做出的决定多半能取得积极成果。在进化的赌场中,筹码是生存,严格说来,是基因的生存。但为合乎情理,一般近似的说法也可以是个体的生存。如果你向下走到水坑边去喝水,被守候在水坑边的食肉动物吃掉的风险就会增加。如果你不去的话,最后就免不了要渴死。去也好,不去也好,风险都是存在的。你必须做出决定,以便让基因获得最大的生存下去的机会。也许最好的办法是忍着不喝,直到你非喝不可的时候才走下去喝个痛快,以便可以长时间不需要再喝水。这样,你减少了到水坑边去的次数,但是到了最后不得不喝的时候,你得低下头去长时间地喝水。另外一个冒险的办法是少喝多跑,即奔过去喝上一两口,马上就奔回来,这样多跑几次也能解决问题。到底哪一种冒险的策略最好,要取决于各种复杂的情况,其中食肉动物的猎食习惯也是一个重要的因素。食肉动物为了取得最大的效率,也在不断改进其猎食习惯。因此,有必要对各种可能性的得失进行某种形式的权衡。但我们当然不一定认为这些动物在有意识地权衡得失。我们只要相信,如果那些动物的基因建造了灵敏的大脑,使它们在赌注中往往成为赢家,那么,作为直接的后果,这些动物生存下去的可能性就更大,这些基因从而得到遗传。

    我们可以把打赌这个隐喻稍加引申。一个赌徒必须考虑3个主要的参数:赌注、机会、赢款。如果赢款额巨大的话,赌徒是愿意下大赌注的。一个孤注一掷的赌徒准是有机会博取大量赢款的。他当然也有输掉一切的可能,但平均说来,下大赌注的人和其他下小赌注以博取小额赢款的人比起来占不到什么便宜,也不见得会吃亏。交易所里买空卖空的投机商和稳扎稳打的投资者之间也有类似之处。在某些方面,交易所这个比喻比赌场更贴切,因为赌场里的输赢是受到操纵的,庄家到头来总归是赢家(严格说来,这意味着下大赌注的人比下小赌注的人输得多些,而下小赌注的人要比不打赌的人来得穷些。但在某种意义上对目前的论题来说,不打赌的例子是不怎么合适的)。撇开这个不谈,下大赌注和下小赌注似乎各有理由。动物界里有没有下大赌注的,或者比较保守的动物呢?我们将在第9章中看到,人们通常可以把雄性动物视为下大赌注、冒大风险的赌徒,而把雌性动物视为稳扎稳打的投资者,尤其是在雄性动物为得到配偶而相互争夺的一雄多雌的物种中。阅读本书的博物学家可以想到一些能称为下大赌注、冒大风险的物种,以及其他一些比较保守的物种。这里我要言归正传,谈谈基因如何对未来做预测这个带有更大普遍意义的主题。

    在一些难以预见的环境中,基因如何预测未来是个难题,解决这个难题的一个办法是预先赋予生存机器以一种学习能力。为此,基因可以通过对其生存机器发出如下指示的形式来编制程序:“下面这些会带来好处:口中的甜味、情欲亢进、适中的温度、微笑的小孩等。而下面这些会带来不快:各种痛苦、恶心、空空的肚皮、哭叫的小孩等。如果你碰巧做了某件事情之后便出现了不愉快的情况,切勿再做这种事情;在另一方面,重复做为你带来好处的任何事情。”这样编制的程序有一个好处,就是可以大大削减必须纳入原来程序的那些详尽的规则,同时可以应付事先未能预见到其细节的环境变化。在另一方面,基因仍然有必要做出某些预测。在我们列举的例子中,基因估计吃糖和交配可能对基因的生存有利,在这一意义上,口中的甜味以及情欲亢进是“有益的”。但根据这个例子,它们不能预见到糖精和自慰也可能为它们带来满足。它们也不能预见到,在我们这个糖多得有点反常的环境里,糖吃得过多的危险性。

    学习战略已应用于计算机下棋的某些程序中。计算机和人对弈或和其他计算机对弈时,这些程序确实能不断得到改善。尽管它们备有一个规则和战术库,但它们的决定程序里也带有一个预先纳入的小小的随机趋向。它们把以往的种种决定记录下来,每当赢得一局时,它们就稍微增加为这局棋带来胜利的战术的权重,以便计算机下次再度采用同样战术的可能性增加一些。

    预测未来的一个最有趣的方法是模拟。一位将军如果想知道某一项军事计划是否比其他可供选择的计划来得优越,他就面临做出预测的问题。天气、部队的士气以及敌人可能采取的反制措施都是未知数。如果想知道这个计划是否切实可行,一个办法是把该计划试行一下,看看其效果如何。然而,要把所有想象得出的计划都试行一下是不可取的,因为愿意“为祖国”献身的青年毕竟有限,而各种可能的计划实在多得很。进行与假想敌人交锋的演习也可以考验各种计划的实践性,这要比真刀真枪地干一下好。演习可以采取“北国”与“南国”全面交战的方式,使用的是空炮弹。但即使是这样也要耗费大量时间和物资。比较节约一些的办法是用玩具士兵和坦克在大地图上移来移去进行演习。

    近年来,计算机已肩负起大部分模拟的职能,不仅在军事战略方面,而且在诸如经济学、生态学、社会学等必须对未来做出预测的一切领域。它使用的是这样的技术:在计算机内建立一个世界上某种事物的模型。这并不意味着,如果你揭开计算机的盖子,就可以看到一个和模拟对象相同的微型模仿物。在下棋的计算机里,记忆装置内没有任何看得出是棋盘以及马和卒各就各位的“形象”,有的只是代表棋盘以及各种棋子位置的一行行电子编码。对我们来说,地图是世界某一部分的平面缩影。在计算机里面,地图通常是以一系列城镇和其他地点的名字来代表的。每个地点附有两个数字——它的经度和纬度。计算机实际上如何容纳它这个世界的模型是无关紧要的,重要的是容纳的形式允许它操纵这个模型进行操作和试验,并以计算机操作员能够理解的语言汇报运算的结果。通过模拟技术,以模型进行的战役可以得出胜负,模拟的班机可以飞行或坠毁,经济政策可以带来繁荣或崩溃。无论模拟什么,计算机的整个运算过程只需实际生活中极小的一部分时间。当然,这些反映世界的模型也有好坏之分,而且即使是上好的模型也只能是近似的。不管模拟得如何逼真,计算机也不能预测到将要发生的全部实际情况,但好的模拟肯定远胜于盲目的试验和误差。我们本来可以把模拟称为代替性的“试验和误差”,不幸的是,这个术语早被研究老鼠心理的心理学家占用了。

    如果模拟是这样一个好办法,我们可以设想生存机器本该是首先发现这个办法的,毕竟早在地球上出现人类以前,生存机器就已经发明了人类工程学的许多其他方面的技术:透镜和抛物面反射镜、声波的频谱分析、伺服控制系统、声呐、输入信息的缓冲存储器以及其他不胜枚举的东西。这些技术都有长长的名字,其具体细节这里不必赘述。模拟到底是怎么一回事呢?在我看来,如果你自己要做出一个困难的决定,而这个决定牵涉到一些将来的未知量,你也会进行某种形式的模拟。你设想在你采取各种可供选择的步骤之后将会出现的情况。你在大脑里建立一个模型,这个模型并不是世上万物的缩影,它仅仅反映出依你看来是有关的范围内有限的一组实体。你可以在心目中看到这些事物的生动形象,或者看到并操纵它们已经概念化了的形象。无论怎样,你的大脑里不会出现一个实际上占据空间的、反映你设想的事物的模型。但和计算机一样,你的大脑怎样表现这个模型的细节并不太重要,重要的是你的大脑可以利用这个模型来预测可能发生的事。那些能够模拟未来事物的生存机器,比只会在实际的试验和误差的基础上积累经验的生存机器要棋高一筹。问题是实际的试验既费时又费精力,明显的误差常常带来致命的后果,模拟则既安全又迅速。

    模拟能力的演化似乎最终导致了主观意识的产生,在我看来,这是当代生物学所面临的最不可思议的奥秘。没有理由认为电子计算机在模拟时是具有意识的,尽管我们必须承认,有朝一日它们可能具有意识。意识的产生也许是由于大脑对世界事物的模拟已达到如此完美无缺的程度,以至于把它自己的模型也包括在内。*显然,一个生存机器的肢体必然是构成它所模拟的世界的一个重要部分,可以假定,出于同样的理由,模拟本身也可以视为被模拟的世界的一个组成部分。事实上,“自我意识”可能是另外一种说法,但我总觉得这种说法用以解释意识的演化是不能十分令人满意的,部分原因是它牵涉到一个无穷尽的复归问题——如果一个模型可以有一个模型,那么为什么一个模型的模型不可以有一个模型呢……

    不管意识引起了哪些哲学问题,就本书的论题而言,我们可以把意识视为一个进化趋向的终点,也就是说,生存机器最终从主宰它们的主人即基因那里解放出来,变成有执行能力的决策者。大脑不仅负责管理生存机器的日常事务,它也获得了预测未来并做出相应安排的能力。它甚至有能力拒不服从基因的命令,例如拒绝生育它们的生育能力所容许的全部后代。但就这一点而言,人类的情况是非常特殊的,我们在下面将谈到这个问题。

    这一切和利他行为、自私行为有什么关系呢?我力图阐明的观点是,动物的行为,不管是利他的还是自私的,都在基因控制之下。这种控制尽管只是间接的,但仍然是十分强有力的。基因通过支配生存机器和它们的神经系统的建造方式对行为施加其根本影响。但此后怎么办,则由神经系统随时做出决定。基因是主要的策略制定者,大脑则是执行者。但随着大脑日趋高度发达,它实际上接管了越来越多的决策机能,并在决策过程中运用诸如学习和模拟的技巧。这个趋势在逻辑上的必然结果将会是,基因给予生存机器一个全面的策略性指示:请采取任何你认为是最适当的行动以保证我们的存在。但迄今为止还没有一个物种达到了这样的水平。

    和计算机类比以及和人类如何做出决定进行类比确实很有意思。但我们必须回到现实中来,而且要记住,事实上进化是一步一步通过基因库内基因的差别性生存来实现的。因此,为使某种行为模式——利他的或自私的——能够演化,基因库内“操纵”那种行为的基因必须比“操纵”另外某种行为的、与之匹敌的基因或等位基因有着更大的存活可能性。一个操纵利他行为的基因*指的是对神经系统的发展施加影响,使之有可能表现出利他行为的任何基因。我们有没有通过实验取得证据表明利他行为是可遗传的呢?没有。但这也是不足为奇的,因为到目前为止,很少有人对任何行为进行遗传学方面的研究。还是让我告诉你们一个研究行为模式的实例吧!这个模式碰巧并不带有明显的利他性,但它相当复杂,足以引起人们的兴趣。这是一个说明如何继承利他行为的典型例子。

    蜜蜂中有一种叫腐臭病(foul brood)的传染病。这种传染病会侵袭巢室内的幼虫。养蜂人驯养的品种中有些品种比其他品种更易于感染这种病,而且至少在某些情况下各品系之间的差异证明原因是它们行为上的不同。有些俗称卫生品系的蜜蜂**能够找到受感染的幼虫,把它们从巢室里拉出来并丢出蜂房,从而迅速地扑灭流行病。那些易感染的品系之所以易于染病,正是因为它们没有这种杀害病婴的卫生习惯。实际上这种卫生行为是相当复杂的。工蜂必须找到每一患病幼虫所居住的巢室,把上面的蜡盖揭开,拉出幼虫,把它拖出蜂房门,并弃之于垃圾堆上。

    由于各种理由,用蜜蜂做遗传学实验可以说是一件相当复杂的事情。工蜂自己一般不繁殖,因此你必须以一个品系的蜂后和另外一个品系的雄蜂杂交,然后观察养育出来的子代工蜂的行为。罗森布勒(W.C.Rothenbuhler)所做的实验就是这样进行的。他发现第一代子代杂交种的所有蜂群都是不卫生的:它们亲代的卫生行为似乎已经消失,尽管事实上卫生行为的基因仍然存在,但这些基因已变成隐性基因了,像人类遗传蓝眼基因一样。罗森布勒后来以第一代的杂交种和纯粹的卫生品系进行“回交”(当然也是用蜂后和雄蜂),这一次他得到了绝妙的结果。子代蜂群分成三类:第一类表现出彻底的卫生行为,第二类完全没有卫生行为,而第三类是折中的。第三类蜜蜂能够找到染病的幼虫,揭开它们的蜡蜂巢的盖子,但只到此为止,它们并不扔掉幼虫。据罗森布勒的猜测,蜜蜂的基因库可能存在两种基因,一种是进行揭盖的,另一种是扔幼虫的。正常的卫生品系两者兼备,易受感染的品系则具有这两种基因的等位基因——它们的竞争对手。那些在卫生行为方面表现为折中的杂交种,大概仅仅具有揭盖的基因(其数量是原来的两倍)而不具有扔幼虫的基因。罗森布勒推断,他在实验中培育出来的,显然完全是不卫生的蜂群里可能隐藏着一个具有扔幼虫的基因的亚群,只是由于缺乏揭盖基因而无能为力罢了。他以非常巧妙的方式证实了他的推断:他自己动手把蜂巢的盖子揭开。果然,蜡盖揭开之后,那些看起来是不卫生的蜜蜂中有一半马上表现出完全正常的把幼虫扔掉的行为。

    这段描述说明了前面一章提到的若干重要论点。它表明,即使我们对把基因和行为连接起来的各种胚胎因素中的化学连接一无所知,我们照样可以恰如其分地说“操纵某种行为的基因”。事实上,这一系列化学连接可以证明行为甚至包括学习过程。例如,揭盖基因之所以能发挥作用,可能是因为它首先让蜜蜂尝到受感染的蜂蜡的味道。就是说,蜂群会发觉把遮盖病虫的蜡盖吃掉是有好处的,因此往往一遍又一遍地这样做。即使基因果真是这样发挥作用的,只要具有这种基因的蜜蜂在其他条件不变的情况下进行揭盖活动,而不具有这种基因的蜜蜂不这样做,那么,我们还是可以把这种基因称为“揭盖”的基因。

    其次,这段描述也说明了一个事实,那就是基因在对它们共有的生存机器施加影响时是“合作的”。扔幼虫的基因如果没有揭盖基因的配合是无能为力的,反之亦然。不过遗传学的实验同样清楚地表明,在贯穿世代的旅程中,这两种基因基本上是相互独立的。就它们的有益工作而言,你尽可以把它们视为一个单一的合作单位,但作为复制因子,它们是两个自由的、独立的行为者。

    为了进行论证,我们有必要设想一下“操纵”各种不大可能的行为的基因。譬如我说假设有一种的“操纵向溺水的同伴伸出援手的行为”的基因,而你却认为这是一种荒诞的概念,那就请你回忆一下上面提到的卫生蜜蜂的情况吧。要记住,在援救溺水者所涉及的动作中,如综合了一切复杂的肌肉收缩,感觉整合,甚至有意识的决定,等等,我们并不认为基因是唯一的一个前提因素。关于学习、经验以及环境影响等是否与行为的形成有关这个问题我们没有表达意见。你只要承认这一点就行了:在其他条件不变的情况下,同时在许多其他的主要基因在场,以及各种环境因素发挥作用的情况下,一个基因,凭其本身的力量比它的等位基因有更大的可能促使一个个体援救溺水者。这两种基因的差别归根结底可能只是某种数量变数的差异。有关胚胎发育过程的一些细节尽管有趣,但与进化的种种因素无关。洛伦茨明确地阐明了这一点。

    基因是优秀的程序编写者,它们为自身的存在编写程序。生活为它们的生存机器带来种种艰难险阻,在对付这一切艰难险阻时,这个程序能够取得多大成功就是判定这些基因优劣的根据。这种判断是冷酷无情的,关系到基因的生死存亡。下面我们将要谈到以表面的利他行为促进基因生存的方式。但生存机器最关切的显然是个体的生存和繁殖,为生存机器做出各种决定的大脑也是如此。属同一“群体”的所有基因都会同意将生存和繁殖放在首位,因此各种动物总是竭尽全力去寻找并捕获食物,设法避免自己被抓住或吃掉,避免罹病或遭受意外,在不利的天气条件下保护自己,寻找异性伴侣并说服它们同意交配,并将一些和它们享有的相似的优越条件赋予它们的后代。我不打算列举很多例子——如果你需要一个例证,那就请你下次仔细观察一下你看到的野兽吧,但我却很想在这里提一下一种特殊的行为,因为我们在下面谈到利他行为与自私行为时必须再次涉及这种行为。我们可以把这种行为概括性地称为联络(communication)。*

    我们可以这样说,一个生存机器对另一个生存机器的行为或其神经系统的状态施加影响的时候,前者就是在和后者进行联络。这并不是一个我打算坚持为之辩护的定义,但对我们目前正在探讨的一些问题来说,这个定义是能够说明问题的。我所讲的影响是指直接的、偶然的影响。联络的例子很多:鸟、蛙和蟋蟀的鸣唱,狗的摇动尾巴和竖起长颈毛,黑猩猩的“露齿而笑”,人类的手势和语言等。许许多多生存机器的行动,通过间接影响其他生存机器的行为,来提高其自身基因的利益。各种动物千方百计地使这种联络方式取得成效。鸟儿的鸣唱使人们世世代代感到陶醉和迷惘。我在前面讲过的座头鲸的歌声表达出更为高超的意境,同时也更迷人。它的音量宏大无比,可以传到极其遥远的地方,音域广阔,从人类能够听到的亚音速的、低沉的隆隆声到超音速的、短促的刺耳声。蝼蛄之所以能发出洪亮的歌声,是因为它们在泥土中精心挖成双指数角状扩音器一样的土穴,在里面歌唱,唱出的歌声自然得到放大。在黑暗中翩翩起舞的蜂群能够为其他觅食的蜂群准确地指出前进的方向以及食物在多远的地方可以找到。这种巧妙的联络方法只有人类的语言可以与之媲美。

    动物行为学家的传统说法是,联络信号的逐步完善对发出信号者和接收信号者都有益。譬如说,雏鸡在迷途或受冻时发出的尖叫声可以影响母鸡的行为。母鸡听到这种吱吱啁啁的叫声后通常会应声而来,把小鸡领回鸡群。我们可以说,这种行为的形成是由于它为双方都带来好处:自然选择有利于迷途后会吱吱啁啁叫的雏鸡,也有利于听到这种叫声后随即做出适当反应的母鸡。

    如果我们愿意的话(其实无此必要),我们可以认为雏鸡叫声之类的信号具有某种意义或传达了某种信息。在这个例子里,这种呼唤声相当于“我迷路了!”我在第1章中提到的小鸟发出的报警声传递了“老鹰来了!”这一信息。那些收到这种信息并随即做出反应的动物无疑会得到好处。因此,这个信息可以说是真实的。可是动物会发出假的信息吗?它们会说谎吗?

    动物说谎这种概念可能会令人误解,因此我必须设法防止这种误解的产生。我曾经出席过比阿特丽斯(Beatrice)和加德纳(Allen Gardner)主讲的一次讲座,内容是关于他们所训练的遐迩闻名的“会说话的”黑猩猩华舒(“她”以美国手语表达思想。对学习语言的学者来说,“她”的成就可能引起广泛的兴趣)。听众中有一些哲学家,在讲座结束后举行的讨论会上,对于华舒是否会说谎这个问题他们费了一番脑筋。我猜想,加德纳夫妇一定有些纳闷,为什么不谈谈其他更有趣的问题呢?我也有同感。在本书中,我所使用的“欺骗”“说谎”等字眼只有直截了当的含义,远不如哲学家们使用的那么复杂。他们感兴趣的是有意识的欺骗,而我讲的仅仅是在功能效果上相当于欺骗的行为。如果一只小鸟在没有老鹰出现的情况下使用“鹰来了”这个信号,从而把它的同伴都吓跑,让它有机会留下来把食物全都吃掉,我们可以说它是说了谎的。我们并不是说它有意识地去欺骗,我们所指的只不过是,说谎者在牺牲其同伴的利益的情况下取得食物。其他小鸟之所以飞走,是因为它们在听到说谎者报警时做出在真的有鹰出现的情况下的那种正常反应而已。

    许多可供食用的昆虫,如前一章提到的蝴蝶,为了保护自己而模拟其他味道恶劣的或带刺的昆虫的外貌。我们自己也经常受骗,以为有黄黑相间条纹的食蚜蝇就是胡蜂。有些苍蝇在模拟蜜蜂时更是惟妙惟肖。食肉动物也会说谎,琵琶鱼在海底耐着性子等待,将自己隐蔽在周围环境中,唯一暴露出来的部分是一块像虫一样蠕动着的肌肉,它挂在鱼头上突出的一条长长的“钓鱼竿”末端。小鱼游近时,琵琶鱼会在小鱼面前抖动它那像虫一样的诱饵,把小鱼引到自己隐而不见的嘴巴旁。大嘴突然张开,小鱼被囫囵吞下。琵琶鱼也在说谎,它利用的是小鱼喜欢游近像虫一样蠕动着的东西的习性。它在说,“这里有虫”,任何“受骗上当”的小鱼都难逃被吞掉的命运。

    有些生存机器会利用其他生存机器的性欲。蜂兰花(bee orchid)会引诱蜜蜂去和它的花蕊交配,因为这种兰花活像雌蜂。兰花从这种欺骗行为中得到的好处是花粉得到传播,因为一只分别受到两朵兰花欺骗的蜜蜂必然会把其中一朵兰花的花粉带给另外一朵。萤火虫(实际上是甲虫)向配偶发出闪光来吸引它们。每一物种都有其独特的莫尔斯电码一样的闪光方式,这样,不同萤火虫种群之间不会发生混淆不清的现象,从而避免有害的杂交。正像海员期待发现某些灯塔发出的独特闪光模式一样,萤火虫会寻找同一物种发出的密码闪光模式。Photuris属的萤火虫雌虫“发现”,如果它们模拟Photinus属的萤火虫雌虫的闪光密码,它们就能引来Photinus属的萤火虫雄虫。Photuris属的雌虫就这样做了。当一只Photinus属的雄虫受骗接近时,雌虫就不客气地把它吃掉。说到这里,我们自然会想起与此相似的有关塞壬[1]和洛勒莱[2]的故事,但英国西南部的康沃尔人却会回想起那些为打劫而使船只失事的歹徒,后者用灯笼诱船触礁,然后劫掠从沉船中散落出来的货物。

    每当一个联络系统逐渐形成时,这样的风险总会出现:某些生物利用这个系统来为自己谋私利。由于我们一直受到“物种利益”这个进化观点的影响,因此我们自然首先认为说谎者和欺骗者是属于不同的物种的:捕食的动物、被捕食的动物、寄生虫等等。然而,每当不同个体的基因之间发生利害冲突时,不可避免地会出现说谎、欺骗等行为以及用于自私的目的的联络手段等情况。这包括属于同一物种的不同个体。我们将会看到,甚至子女也会欺骗父母,丈夫也会欺骗妻子,兄弟俩也会相互欺骗。

    有些人相信,动物的联络信号原来是为了促进相互的利益而发展的,只是后来为坏分子所利用。这种想法毕竟是过于天真。实际的情况很可能是:从一开始,一切的动物联络行为就掺有某种欺诈的成分,因为所有的动物在相互交往时至少要牵涉某种利害冲突。我打算在下面一章介绍一个强有力的观点,这个观点是从进化的角度来看待各种利害冲突的。

    第5章 进犯行为:稳定性和自私的机器

    本章所要讨论的主要是关于进犯行为这个在很大程度上被误解了的论题。我们将继续把个体作为一种自私的机器加以论述,这种机器的程序编制就是为了完成对作为一个整体的全部基因来说最有益的任何事情。这种说法是为了叙述的简便。本章结尾时我们将再回到以单个基因为对象的说法。

    对于某个生存机器来说,另一个生存机器(不是前者的子女,也不是其他近亲)是它环境的一部分,就像一块岩石、一条河流或一块面包也属于它的环境一样。这个充当环境的生存机器可以制造麻烦,但也能够被加以利用。它同一块岩石或一条河流的一个重要区别在于:它往往会还击。因为它也是机器,拥有寄托着其未来的不朽基因,而且为了保存这些基因,它也不惜赴汤蹈火。自然选择有利于那些能够控制其生存机器并充分利用环境的基因,包括充分利用相同和不同物种的其他生存机器。

    有时,生存机器似乎不大相互影响对方的生活。举例来说,鼹鼠同乌鸫不相互吞食,不相互交配,也不争夺居住地。即使如此,我们也不能认为它们老死不相往来。它们可能为某种东西而竞争,也许是争夺蚯蚓。这并不等于说你会看到鼹鼠和乌鸫为一条蚯蚓而你争我夺,事实上,一只乌鸫也许终其一生也见不到一只鼹鼠。但是,如果你把鼹鼠种群消灭干净,对乌鸫可能产生明显的影响,尽管对于发生影响的细节,或通过什么曲折迂回的间接途径发生影响,我都不敢妄加猜测。

    不同物种的生存机器以各种各样的方式相互影响。它们可能是食肉动物或被捕食的动物,可能是寄生虫或宿主,也可能是争夺某些稀有资源的对手。它们可以通过各种特殊方式被利用,例如,花利用蜜蜂传播花粉。

    属于同一物种的生存机器往往更加直接地相互影响对方的生活。发生这种情况有许多原因。原因之一是,自己物种的一半成员可能是潜在的配偶,而且对其子女来讲,它们有可能是勤奋和可以利用的双亲;另一个原因是,同一物种的成员非常相似,它们都是在同一类地方保存基因的机器,生活方式又相同,因此它们是一切生活必需资源的更直接的竞争者。对乌鸫来说,鼹鼠可能是它的竞争对手,但其重要性却远不及另一只乌鸫。鼹鼠同乌鸫可能为蚯蚓而进行竞争,但乌鸫同乌鸫不仅为蚯蚓,而且还为其他一切东西而相互争夺。如果它们属于同一性别,还可能争夺配偶。通常是雄性动物为争夺雌性配偶而相互竞争,其中道理我们在后文将会看到。这种情况说明,如果雄性动物对与之竞争的另一只雄性动物造成损害的话,也许会给它自己的基因带来好处。

    因此,对于生存机器来说,合乎逻辑的策略似乎是将其竞争对手杀死,然后最好把它们吃掉。尽管自然界会发生屠杀和同类相食的现象,但认为这种现象普遍存在却是对自私基因理论的一种幼稚的理解。事实上,洛伦茨在《论进犯行为》一书中就强调过,动物间的搏斗具有克制和绅士风度的性质。他认为,动物间的搏斗有一点值得注意:它们的搏斗是一种正常的竞赛活动,像拳击或击剑一样,是按规则进行的。动物间的搏斗是一种手持钝剑或戴着手套进行的搏斗,威胁和虚张声势代替了真刀真枪,胜利者尊重降服的示意,它不会像我们幼稚的理论所能断言的那样,会给投降者以致命的打击或撕咬。

    把动物的进犯行为解释成是有克制的而且是有一定规则的行为,可能会引起争论,尤其是把可怜的历史悠久的人类说成是屠杀自己同类的唯一物种,是该隐印记[1]以及种种耸人听闻的此类指责的唯一继承者,显然都是错误的。一个博物学家是强调动物进犯行为暴力的一面还是克制的一面,部分取决于他通常观察的动物的种类,部分取决于他在进化论方面的偏见,洛伦茨毕竟是一个主张“物种利益”的人。即使对动物搏斗方式的描述有些言过其实,但有关动物文明搏斗的观点至少是有些道理的。表面上看,这种现象似乎是一种利他主义的形式。自私基因的理论必须承担对这种现象做出解释的艰巨任务。为什么动物不利用每一个可能的机会竭尽全力将自己物种的竞争对手杀死呢?

    对这一问题的一般回答是,那种破釜沉舟的好斗精神不但会带来好处,也会造成损失,而且不仅仅是时间和精力方面的明显损失。举例来说,假定B和C都是我的竞争对手,而我又正好同B相遇。作为一个自私的个体,按理讲我应想方设法将B杀死。但先别忙,请听我说下去。C既是我的对手,也是B的对手。如果我将B杀掉,就为C除掉了一个对手,我就无形中为C做了一件好事。我让B活着也许更好些,因为这样B就可能同C进行竞争或搏斗,我也就可以坐收渔翁之利。不分青红皂白地去杀死对手并无明显的好处,这个假设的简单例子的寓意即在于此。在一个庞大而复杂的竞争体系内,除掉一个对手并不见得就是一件好事,其他竞争对手很可能从中得到比你更多的好处。那些负责控制虫害的官员们得到的就是这类严重的教训。你遇到了一场严重的农业虫害,你发现了一种扑灭这场虫害的好办法,于是你高高兴兴地按这个办法去做了。殊不知这种害虫的消灭反而使另外一种害虫受益,其程度甚至超过对人类农业的好处。结果是,你的境遇比以前还要糟。

    另一方面,有区别地把某些特定的竞争对手杀死,或至少与其进行搏斗,似乎是一个好主意。如果B是一只象形海豹(elephant seal),拥有一大群“妻妾”(harem),而我也是一只象形海豹,把它杀死我就能够把它的“妻妾”弄到手,那我这样做可能是明智的。即使在有选择的搏斗中会有损失,也是值得冒风险的。进行还击以保卫其宝贵的财产对B是有利的。如果是我挑起一场搏斗的话,我的下场同它一样,很可能以死亡告终,说不定它存我亡的可能性更大。我想同它进行搏斗是因为它掌握着一种宝贵的资源,但它为什么会拥有这种资源的呢?它也许是在战斗中赢来的。在和我交手以前,它也许已经击退过其他的挑战者,说明可能是一个骁勇善战的斗士。就算是我赢了这场搏斗而且得到了这群“妻妾”,但我可能在搏斗的过程中严重受伤,以致不能够享用得来的好处。而且,搏斗耗尽了时间和精力,把时间和精力暂时积蓄起来说不定更好。如果我一门心思进食,并且在一段时间内不去惹是生非,我会长得更大更强壮。最终我是会为争夺这群“妻妾”而同它进行搏斗的,但如果我等待一下而不是现在就匆促上阵,我获胜的机会可能更大。

    上面这段自我独白完全是为了说明:在决定要不要进行搏斗之前,最好是对“得-失”进行一番可能是无意识的,但却是复杂的权衡。尽管进行搏斗无疑会得到某些好处,但并非百利而无一弊。同样,在一场搏斗的过程中,牵涉让搏斗升级还是缓和下来的每一个策略上的决定都各有其利弊,而且这些利弊在原则上都可以进行分析。个体生态学家对这种情况早已有所了解,尽管这种了解还不太清晰明确,但只有史密斯才能有力和明确地表述这种观点,而人们通常并不认为他是一位生态学家。他同普赖斯(G.R.Price)、帕克(G.A.Parker)合作运用数学分支中被称为博弈论(Game Theory)的工具进行研究。他们独到的见解能够用语言而非数学符号表达出来,尽管其精确程度因此而有些损失。

    进化稳定策略(evolutionarily stable strategy,以下简称ESS)*是史密斯提出的基本概念。他追根溯源,发现最早有这种想法的是汉密尔顿和麦克阿瑟(R.H.MacArthur)。“策略”是一种程序预先编制好的行为方式。例如,“向对手进攻,如果它逃你就追,如果它还击你就逃”就是一种策略。我们所说的策略并不是个体有意识地制订出来的,弄清这一点十分重要。不要忘记,我们把动物描绘成机器人一样的生存机器,它的肌肉由一架程序预先编制好的计算机控制。用文字把策略写成一组简单的指令只是为了便于我们思考。由某种难以具体讲清楚的机制作用产生的动物行为,就好像是以这样的指令为根据的。

    凡是种群的大部分成员采用某种策略,而这种策略的好处是其他策略所不及的,这种策略就是进化稳定策略或称ESS。这一概念既微妙又很重要。换句话讲,对于个体来说,最好的策略取决于种群的大多数成员在做什么。由于种群的其余部分也是由个体组成的,而它们都力图最大限度地扩大其各自的成就,因而能够持续存在的必将是这样一种策略:它一旦形成,任何举止异常的个体的策略都不可能与之比拟。在环境的一次大变动之后,种群内可能出现一个短暂的进化上的不稳定阶段,甚至可能出现波动。但一种ESS一旦确立,就会稳定下来:偏离ESS的行为将受到自然选择的惩罚。

    为将这一观点用于解释进犯行为,我们来研究一下史密斯假设的一个最简单的例子。假定有一个特定的物种叫“鹰和鸽子”(这两个名称系人类的传统用法,但同这两种鸟的习性无关:其实鸽子是一种进攻性相当强的鸟)。在这个物种的某个种群中只存在两种搏斗策略。在我们这个假定的种群中,所有个体不是鹰就是鸽子。鹰搏斗起来总是全力以赴、孤注一掷的,除非身负重伤,否则绝不退却;而鸽子却只是以风度高雅的惯常方式进行威胁恫吓,从不伤害其他动物。如果鹰同鸽子搏斗,鸽子就迅即逃跑,因此鸽子不会受伤。如果是鹰同鹰进行搏斗,它们会一直打到其中一只受重伤或死亡才罢休。如果是鸽子同鸽子相遇,那就谁也不会受伤;它们长时间地摆开对峙的架势,直到它们中的一只感到疲劳了,或者感到厌烦而决定不再对峙下去,从而做出让步为止。我们暂且假定一个个体事先无法知道它的对手是鹰还是鸽子,只有在与之进行搏斗时才能弄清楚,而且它也记不起过去同哪些个体进行过搏斗,因此无从借鉴。

    现在,作为一种纯粹是随意规定的比赛规则,我们规定竞赛者“得分”标准如下:赢一场50分,输一场0分,重伤者-100分,使竞赛拖长而浪费时间者-10分。我们可以把这些分数视为能够直接转化为基因生存的筹码。得分高而平均“盈利”也高的个体就会在基因库中遗留下许多基因。在现实中,实际的数值对分析并无多大意义,但却可以帮助我们去思考这一问题。

    鹰在同鸽子搏斗时,鹰是否有击败鸽子的倾向,对此我们并不感兴趣,这一点是重要的。我们已经知道这个问题的答案了:鹰永远会取胜。我们想要知道的是:究竟鹰和鸽子谁是进化稳定策略型?如果其中一种是ESS型而另一种不是,那么我们认为属于ESS型的那种才会进化。从理论上讲,存在两种ESS型是可能的。不论种群大多数成员所采取的碰巧是什么样的策略——鹰策略也好,鸽子策略也好——对任何个体来说,如果最好的策略是随大流的话,那么,存在两种ESS型是可能的。在这种情况下,种群一般总是保持在自己的两种稳定状态中它首先达到的那一种状态。然而我们将会看到,这两种策略,不论是鹰的策略还是鸽子的策略,事实上单凭其自身不可能在进化上保持稳定性,因此我们不应该指望任何一个会得以进化。为了说明这一点,我们必须计算平均盈利。

    假设有一个全部由鸽子组成的种群。不论它们在什么时候进行搏斗,谁也不会受伤。这种比赛都是一些时间拖得很长、按照仪式进行的竞赛,也许是虎视眈眈地对峙,只有当一个对手让步,这种竞赛才宣告结束。于是得胜者因获取有竞争性的资源而得50分,但因长时间的对峙而浪费时间得-10分,因此净得40分。而败方也因浪费时间得-10分。每只鸽子平均输赢各半。因此每场竞赛的平均盈利是40分和-10分的平均数,即15分。所以,鸽子种群中每只鸽子看来成绩都不错。

    但是现在假设在种群中出现了一个突变型的鹰。由于它是周围唯一的一只鹰,因此它的每一次搏斗都是同鸽子进行的。鹰对鸽子总是保持不败纪录,因此它每场搏斗净得50分,而这个数字也就是它的平均盈利。由于鸽子的盈利只有15分,因此鹰享有巨大的优势。结果鹰的基因在种群内得以迅速散布。但鹰却再也不能指望它以后遇到的对手都是鸽子了。再举一极端例子,如果鹰基因的成功扩散使整个种群都变成了鹰的天下,那么所有的搏斗都变成鹰同鹰之间的搏斗,这时情况就完全不同了。当鹰与鹰相遇时,其中一个受重伤,得-100分,而得胜者得50分。鹰种群中每只鹰在搏斗中可能胜负各半,因此,它在每场搏斗中平均可能得到的盈利是50分和-100分的对半,即-25分。现在让我们设想一下一只生活在鹰种群中孑然一身的鸽子的情景吧。毫无疑问,它每次搏斗都要输掉,但它绝不会受伤。因此,它在鹰种群中的平均盈利为0分,而鹰种群中的鹰平均盈利却是-25分,鸽子的基因就有在种群中散布开来的趋势。

    按照我的这种叙述方式,好像种群中存在一种连续不断的摇摆状态。鹰的基因扶摇直上迅速占据优势;鹰在数量上占据多数的结果是,鸽子基因必然受益,继而数量增加,直到鹰的基因再次开始繁衍,如此等等。然而情况并不一定是这样摇摆动荡。鹰同鸽子之间有一个稳定的比例。你只要按照我们使用的任意规定的评分制度计算一下的话,就能得出其结果是鸽子同鹰的稳定比例为∶。在达到这一稳定比例时,鹰同鸽子的平均盈利完全相等。因此,自然选择不会偏袒甲而亏待乙,而会一视同仁。如果种群中鹰的数目开始上升,不再是,鸽子就会开始获得额外的优势,比例会再回复到稳定状态。如同我们将要看到的性别的稳定比例是50∶50一样,在这一假定的例子中,鹰同鸽子的稳定比例是7∶5。在上述的两种比例中,如果发生偏离稳定点的摇摆,这种摆动的幅度也不一定很大。

    这种情况乍听起来有点像类群选择,但实际上与类群选择毫无共同之处。之所以这种情况听上去像类群选择,是因为它使我们联想到处于一种稳定平衡状态的种群,每当这种平衡被打破,该种群往往能够逐渐恢复这种平衡。但ESS较之类群选择是一种远为精细微妙的概念。它同某些群体比另外一些群体获得更大成功这种情况毫无关系。只要应用我们假定的例子中的任意评分制度就能很好地加以说明。在由的鹰和的鸽子组成的稳定种群中,个体的平均盈利被证明为分。不论该个体是鹰还是鸽子都是如此。分比鸽子种群中每只鸽子的平均盈利(15分)少很多。只要大家都同意成为鸽子,每个个体都会受益。根据单纯的类群选择,任何群体,如其所有个体都一致同意成为鸽子,它所取得的成就比停留在ESS比例上的竞争群体要大得多(事实上,纯粹由鸽子组成的集团并不一定是最能获得成功的群体。由的鹰和的鸽子组成的群体中,每场竞赛的平均盈利分。按这个比例组成的群体才是最有可能获得成功的集团。但就目前的论题而言,我们可以不必考虑这种情况。对每一个个体来说,比较单纯的全部由鸽子组成集团,由于每一个个体的平均盈利为15分,它要比ESS优越得多)。因此,类群选择理论认为向全部由鸽子组成的集团进化是发展的趋势,因为鹰占的群体取得成功的可能性要小些。但问题是,即使是那些从长远来讲能为其每一成员带来好处的集团,仍免不了会出现害群之马。清一色的鸽子群体中每一只鸽子的境遇都比ESS群体中的鸽子好些,这是事实。然而遗憾的是,在鸽子集团中,一只鹰单枪匹马就可干出无与伦比的业绩,任何力量也不能阻止鹰的进化。因此这个集团因出现内部的背叛行为而难逃瓦解的厄运。ESS种群的稳定倒不是由于它特别有利于其中的个体,而仅仅是由于它无内部背叛行为之隐患。

    人类能够结成各种同盟或集团,即使这些同盟或集团在ESS的意义上来说并不稳定,但对每个个体来说却是有利的。这种情况之所以可能发生,仅仅是由于每一个个体都能有意识地运用其预见能力,从而懂得遵守盟约的各项规定是符合其长远利益的。某些个体为有可能在短期内获得大量好处而不惜违犯盟约,这种做法的诱惑力会变得难以抗拒。这种危险甚至在人类缔结的盟约中也是始终存在的。垄断价格也许是最能说明问题的一个例子。将汽油的统一价格定在某种人为的高水平上,是符合所有加油站老板的长远利益的。那些操纵价格的集团,由于对最高的长远利益进行有意识的估计判断,因此能够存在相当长的时期。但时常有个别的人会受到牟取暴利的诱惑而降低价格。这种人附近的同行就会立刻步其后尘,于是降低价格的浪潮就会波及全国。让我们感到遗憾的是,那些加油站老板有意识的预见能力这时重新发挥了作用,并缔结垄断价格的新盟约。所以,甚至在人类这一具有天赋的自觉预见能力的物种中,以最高的长远利益为基础的盟约或集团,由于出现内部的叛逆而摇摇欲坠,经常有土崩瓦解的可能。在野生动物中,由于它们为竞争的基因所控制,群体利益或集团策略能够得以发展的情形就更少见。我们所能见到的情况必然是:进化稳定策略无处不在。

    在上面的例子中,我们简单地假定每一个个体不是鹰就是鸽子。我们得到的最终结果是,鹰同鸽子达到了进化上的稳定比例。事实上,我们说的是鹰的基因同鸽子的基因在基因库中实现了稳定的比例。这种现象在遗传学的术语里被称为稳定的多态性(polymorphism)。就数学而言,可以通过下面这个途径来实现没有多态性的完全相等的ESS。如果在每次具体竞赛中每一个个体都能够表现得不是像鹰就是像鸽子的话,这样一种ESS就能实现:所有的个体表现得像鹰一样的概率完全相等。在我们的具体例子中这个概率就是。实际上这种情况说明,每一个个体在每次参加竞赛时,对于在这次竞赛中究竟要像鹰还是像鸽子那样行动,事先已随意做出了决定,尽管决定是随意做出的,但总是考虑到鹰7鸽5的比例。虽然这些决定偏向于鹰,但必须是任意的,所谓任意是指一个对手无法事先猜出对方在任何具体的竞赛中将采取何种行动,这一点是至关重要的。例如,在连续7次搏斗中充当鹰的角色,然后在连续5次搏斗中充当鸽子的角色如此等等是绝对不可取的。如果任何个体采用如此简单的搏斗序列,它的对手很快就会识破这种策略并加以利用。要对付这种采用简单搏斗序列的战略者,当知道它在搏斗中充当鸽子的角色时,你以鹰的行动去应战就能处于有利地位。

    当然,鹰同鸽子的故事简单得有点幼稚。这是一种“模式”,虽然这种情况在现实自然界中不会发生,但它可以帮助我们去理解自然界实际发生的情况。模式可以非常简单,如我们假设的模式,但对理解一种论点或得出一种概念仍旧是有助益的。简单的模式能够加以丰富扩展,使之逐渐形成更加复杂的模式。如果一切顺利的话,随着模式渐趋复杂,它们也会变得更像实际世界。要发展鹰和鸽子的模式,一个办法就是引进更多的策略。鹰和鸽子并不是唯一的可能性。史密斯和普赖斯介绍的一种更复杂的策略被称为还击策略者(Retaliator)。

    还击策略者在每次搏斗开始时表现得像鸽子,就是说它不像鹰那样,开始进攻就孤注一掷,凶猛异常,而是摆开通常那种威胁恫吓的对峙姿态,但是对方一旦向它进攻,它即还击。换句话说,还击策略者当受到鹰的攻击时,它的行为像鹰;当同鸽子相遇时,它的行为像鸽子;而当它同另一个还击策略者遭遇时,它的表现却像鸽子。还击策略者是一种以条件为转移的策略者,它的行为取决于对方的行为。

    另一种有条件的策略者称为恃强凌弱的策略者(Bully)。它的行为处处像鹰,但一旦受到还击,它就立刻逃之夭夭。还有一种有条件的策略者是试探性还击策略者(Prober-retaliator)。它基本上像还击策略者,但有时也会试探性地使竞赛短暂地升级。如果对方不还击,它坚持像鹰一样行动;如果对方还击,它就回复到鸽子的那种通常的威胁恫吓姿态。如果受到攻击,它就像普通的还击策略者一样进行还击。

    如果将我提到的5种策略都放进一个模拟计算机中去,使之相互较量,结果其中只有一种,即还击策略,在进化上是稳定的。*试探性还击策略近乎稳定。鸽子策略不稳定,因为鹰和恃强凌弱者会侵犯鸽子种群。由于鹰种群会受到鸽子和恃强凌弱者的进犯,因此鹰策略也是不稳定的。由于恃强凌弱者种群会受到鹰的侵犯,恃强凌弱者策略也是不稳定的。在由还击策略者组成的种群中,由于其他任何策略也没有还击策略本身取得的成绩好,因此它不会受其他任何策略的侵犯。然而鸽子策略在纯由还击策略者组成的种群中也能取得相等的好成绩。这就是说,如果其他条件不变,鸽子的数目会缓慢地逐渐上升。如果鸽子的数目上升到相当大的程度,试探性还击策略(而且连同鹰和恃强凌弱者)就开始获得优势,因为在同鸽子的对抗中它们要比还击策略取得更好的成绩。试探性还击策略本身不同于鹰策略和恃强凌弱策略,在试探性还击策略的种群中,只有其他一种策略,即还击策略,比它取得的成绩好些,而且也只是稍微好一些。在这一意义上讲,它几乎是一种ESS。因此我们可以设想,还击策略和试探性还击策略的混合策略可能趋向于占绝对优势,在这两种策略之间也许甚至有幅度不大的摇摆,同时占比例极小的鸽子在数量上也有所增减。我们不必再根据多态性去思考问题,因为根据多态性,每一个个体永远是不采用这种策略,就是采用另一种策略。每一个个体事实上可以采用一种还击策略、试探性还击策略以及鸽子策略三者相混合的复杂策略。

    这一理论的结论同大部分野生动物的实际情况相去不远。从某种意义上说,我们已经阐述了动物进犯行为中“文明”的一面。至于细节,当然取决于赢、受伤和浪费时间等等的实际“得分”。对于象形海豹来说,得胜的奖赏可能是让它几乎独占一大群“妻妾”的权利。因此这种取胜的盈利应该说是很高的。这就难怪它们搏斗起来是那样穷凶极恶,而造成重伤的可能性又是如此之高。把在搏斗中受伤所付出的代价与赢得胜利所得到的好处相比,浪费时间所付出的代价应该说是小的。但另一方面,对一只生活在寒冷的气候中的小鸟来说,浪费时间的代价可能是极大的。喂养雏鸟的大山雀平均每30秒钟就需要捕到一个猎物。白天的每一秒钟都是珍贵的。在鹰同鹰的搏斗中,浪费的时间相对来说是短促的,但比起它们受伤的风险,对时间的浪费也许应该看作一件更为严重的事情。遗憾的是,对于在自然界中各种活动所造成的损失以及带来的利益,目前我们知之甚少,不能够给出实际数字。*我们不能单纯从我们自己任意选定的数字中轻易地得出结论。ESS型往往能够得以进化,它同任何群体性的集团所能实现的最佳条件不是一回事。常识会使人误入歧途,上述这些总的结论是重要的。

    史密斯所思考的另一类战争游戏叫作“消耗战”。我们可以认为,这种“消耗战”发生在从不参加危险战斗的物种中,也许是盔甲齐全的一个物种,它受伤的可能性很小。这类物种中的一切争端都是按传统的方式摆摆架势来求得解决的。竞赛总是以参加竞赛的一方让步而告终。你要是想赢得胜利,只要虎视眈眈地注视着对方,坚持到底毫不动摇,直到对方最终逃走。显然任何动物都不能够无限期地进行威胁恫吓,因为其他地方还有重要的事情要做。它为之竞争的资源诚可宝贵,但其价值也并非无限。它的价值只值得花这么多时间,而且正如拍卖一样,每一个人只准备出那么多钱。时间就是这种只有两个出价人参加的拍卖中使用的筹码。

    我们假定所有这些个体都事先精确估计某一种具体资源(如雌性动物)值得花多长时间,那么一个打算为此稍微多花一点时间的突变性个体就永远是胜利者。因此,出价极限固定不变的策略是不稳定的。即使资源的价值能够被非常精确地估计出来,而且所有个体的出价也都恰如其分,这种策略也是不稳定的。任何两个个体按照极限策略出价,它们会在同一瞬间停止喊价,结果谁也没有得到这一资源!在这种情况下,与其在竞赛中浪费时间,倒不如干脆一开始就弃权来得划算。消耗战同实际拍卖之间的重要区别在于,在消耗战中参加竞赛的双方毕竟都要付出代价,但只有一方得到这项资源。所以,在极限出价者的种群中,竞赛一开始就弃权的策略会获得成功,从而也就在种群中扩散开来。其结果必然是,对于那些没有立刻弃权而是在弃权之前稍等那么几秒钟的个体来说,它们可能得到的某些好处开始增长起来。这是一种用以对付已经在种群中占绝对优势的那些不战而退的个体的有利策略。这样,自然选择促进个体在弃权之前坚持一段时间,使这段时间逐渐延长,直至再次延长到有争议的资源的实际经济价值所容许的极限。

    谈论之际,我们不知不觉又对种群中的摇摆现象进行了描述。然而数学上的分析再次表明,这种摇摆现象并非不可避免。进化稳定策略是存在的,它不仅能够以数学公式表达出来,而且能用语言这样来说明:每一个个体在一段不能预先估计的时间内进行对峙,就是说,在任何具体场合难以预先估计,但按照资源的实际价值可以得出一个平均数。举例说,假如该资源的实际价值是5分钟的对峙,在进化稳定策略中,任何个体都可能持续5分钟以上,或者少于5分钟,或者恰好5分钟。重要的是,对方无法知道在这一具体场合中它到底准备坚持多长时间。

    在消耗战中,个体对于它准备坚持多久不能有任何暗示,这一点显然是极为重要的。对任何个体来说,认输的念头一旦流露,哪怕只是一根胡须抖动了一下,都会立刻使它处于不利地位。如果说胡须抖动一下就是预示在1分钟内就要退却的可靠征兆,赢得胜利的一个非常简单的策略是:“如果你的对手的胡须抖动了一下,不论你事先准备坚持多久,你都要再多等1分钟。如果你的对手是胡须尚未抖动,而这时离你准备认输的时刻已不到1分钟了,那你就立刻弃权,不要再浪费任何时间。绝不要抖动你自己的胡须。”因此,抖动胡须或预示未来行为的任何类似暴露形式都会很快受到自然选择的惩罚。不动声色的面部表情会得到发展。

    为什么要面部表情不动声色,而不是公开说谎呢?其理由还是因为说谎行为是不稳定的。假定情况是这样的:在消耗战中,大部分个体只有在确实想长时期战斗下去时才把颈背毛竖起来,那么,能够发展的将是明显的相反策略:在对手竖起颈背毛时立刻认输。但这时说谎者的队伍有可能开始逐渐形成。那些确实无意长时间战斗下去的个体在每次对峙中都将其颈背毛竖起,于是胜利的果实唾手可得。说谎者基因因此扩散开来。在说谎者成为多数时,自然选择就又会有利于那些能够迫使说谎者摊牌的个体,因而说谎者的数目会再次减少。在消耗战中,说谎和说实话同样都不是进化稳定策略,不动声色的面部表情方是进化稳定策略,即使最终认输,也是突如其来和难以预料的。

    以上我们仅就史密斯称之为“对称性”(symmetric)竞赛的现象进行探讨。意思是说,我们所做的假定是,竞赛参加者除搏斗策略之外,其余一切方面的条件都是相等的。我们把鹰和鸽子假定为力量强弱相同,具有的武器和防护器官相同,而且可能赢得的胜利果实也相同。对于假设一种模式来说,这是简便的,但并不太真实。帕克和史密斯也曾对“不对称”的竞赛进行了探讨。举例说,如果个体在体形大小和搏斗能力方面各不相同,而每一个个体也能够对自己的和对手的休形大小进行比较并做出估计的话,这对形成的ESS是否有影响?肯定是有影响的。

    不对称现象似乎主要有三类。第一类就是我们刚才提到的那种情况:个体在大小或搏斗装备方面可能不同;第二类是个体可能因胜利果实的多寡而有所区别。比如说,衰老的雄性动物,由于其余生不会很长,如果受伤,它的损失较之来日方长的、精力充沛的年轻雄性动物可能要少。

    第三类,纯属随意假定而且明显互不相干的不对称现象能够产生一种ESS,因为这种不对称现象能够使竞赛很快见分晓,这是这种理论的一种异乎寻常的推论。比如说,通常会发生这样的情况,两个竞争者中的一个比另一个早到达竞赛地点,我们就分别称它们为“留驻者”(resident)和“闯入者”(intruder)。为了便于论证,我是这样进行假定的,留驻者和闯入者都不因此而具有任何附加的有利条件。我们将会看到,这一假定在实际生活中可能与事实不符,但这点并不是问题的关键。问题的关键在于,纵令留驻者具有优于闯入者的有利条件这种假定无理可据,基于不对称现象本身的ESS也很可能得以形成。简单地讲,这和人类抛掷硬币,并根据硬币的正反面来迅速而毫无争议地解决争论的情况有类似之处。

    “如果你是留驻者,进攻;如果你是闯入者,退却”这种有条件的策略能够成为ESS。由于不对称现象是任意假定的,因此,“如果是留驻者,退却;如果是闯入者,进攻”这种相反的策略也有可能是稳定的。具体种群中到底采取这两种ESS中的哪一种,这要取决于其中的哪一种ESS首先达到多数。个体的大多数一旦运用这两种有条件的策略中的某一种,所有脱离群众的行为皆会受到惩罚,这种策略就因之成为ESS。

    譬如说,假定所有个体都实行“留驻者赢,闯入者逃”的策略,即它们所进行的搏斗将会是输赢各半,那么它们绝不会受伤,也绝不会浪费时间,因为一切争端都按任意做出的惯例迅速得到解决。现在让我们设想出现一个新的突变型叛逆者。假定它实行的是纯粹的鹰的策略,永远进攻,从不退却,那么它的对手是闯入者时,它就会赢;而当它的对手是留驻者时,它就要冒着受伤的很大风险。平均来说,它比那些按ESS任意规定的准则进行比赛的个体得分要低些。如果叛逆者不顾惯常的策略而试图反其道而行之,采取“如身为留驻者就逃,如身为闯入者就进攻”的策略,那么它的下场会更糟。它不仅时常受伤,而且也极少有机会赢得一场竞赛。然而,假定由于某些偶然的变化,采用同惯例相反的策略的个体竟然成了多数,这样它们的这种策略就会成为一种准则,偏离它就要受到惩罚。可以想见,我们如果连续观察一个种群好几代,就能看到一系列偶然发生的从一种稳定状态跳到另一种稳定状态的现象。

    但是在实际生活中可能并不存在真正的任意不对称现象。如留驻者实际上可能比闯入者享有更有利的条件,因为它们对当地的地形更熟悉。闯入者也许更可能是气喘吁吁的,因为它必须赶到战斗现场,而留驻者却是一直待在那里的。两种稳定状态中,“留驻者赢,闯入者退”这种状态存在于自然界的可能性更大,之所以如此的理由是比较深奥的。这是因为“闯入者赢,留驻者退”这种相反的策略有一种固有的自我毁灭倾向,史密斯把这种策略称为自相矛盾的策略。处于这种自相矛盾中的ESS状态的任何种群中,所有个体总是极力设法避免处于留驻者的地位:无论何时与对手相遇,它们总是千方百计地充当闯入者。为了做到这一点,它们只有不停地四处流窜,居无定所,这是毫无意义的。这种进化趋势,除无疑会招致时间和精力上的损失之外,其本身往往导致“留驻者”这一类型的消亡。在处于另一种稳定状态,即“留驻者赢,闯入者退”的种群中,自然选择偏爱努力成为留驻者的个体。对每一个个体来说,就是要坚守一块具体地盘,尽可能少离开,而且摆出“保卫”它的架势。这种行为如大家所知,在自然界中随处可见,大家把这种行为称为“领土保卫”。

    就我所知,伟大的个体生态学家廷贝亨所做的异常巧妙和一目了然的试验,再精彩不过地展示了这种行为上的不对称性。*他有一个鱼缸,其中放了两条雄性刺鱼。它们在鱼缸的两端各自做了巢,并各自“保卫”其巢穴附近的水域。廷贝亨将这两条刺鱼分别放入两个大的玻璃试管中,再把两个试管并排放一起,只见它们隔着玻璃管试图相互搏斗。于是产生了十分有趣的结果。当他将两个试管移到刺鱼A的巢穴附近时,A就摆出进攻的架势,而刺鱼B就试图退却;但当他将两个试管移到刺鱼B的水域时,因主客易地而形势倒转。廷贝亨只要将两个试管从鱼缸的一端移向另一端,他就能指挥哪条刺鱼进攻,哪条退却。很显然,两条刺鱼实行的都是简单的有条件策略:“凡是留驻者,进攻;凡是闯入者,退却。”

    这种领土行为有什么生物学上的“好处”呢?这是生物学家时常要问的问题,生物学家提出了许多论点,其中有些论点稍后我们将会提及。但是我们现在就可以看出,提出这样的问题可能本来就是不必要的。这种领土“保卫”行为可能仅仅是由于抵达时间的不对称性而形成的一种ESS,而抵达时间的不对称性通常就是两个个体与同一块地盘之间关系的一种特点。

    体形的大小和一般的搏斗能力,被人们认为是非任意性不对称现象中最重要的形式。体形大不一定就是赢得搏斗不可或缺的最重要的特性,但可能是特性之一。在两个个体搏斗时比较大的一个总是赢的情况下,如果每一个个体都能确切知道自己比对手大还是小,只有一种策略是明智的:“如果你的对手比你体形大,赶快逃跑。同比你体形小的进行搏斗。”假使体形的重要性并不那么肯定,情况就随之更复杂些。如果体形大还是具有一点优越性的话,我刚才讲的策略就仍旧是稳定的。如果受伤的风险很大的话,还可能有一种“似非而是的策略”,即“专挑比你大的进行搏斗,见到比你小的就逃”!称其为“似非而是”的原因是不言而喻的。因为这种策略似乎完全违背常识。它之所以能够稳定,原因在于:在全部由似非而是的策略者组成的种群中,绝不会有人受伤,因为每场竞赛中,逃走的总是参加竞赛的较大的一个。一个大小适中的突变体如实行的是“合理”的策略,即专挑比自己体积小的对手,他就要同他所遇见的人中的一半进行逐步加剧的严重搏斗。因为,如果他遇到比自己小的个体,他就进攻;而较小的个体拼命还击,因为后者实行的是似非而是策略;尽管合理策略的实行者比似非而是策略的实行者赢得胜利的可能性更大一些,但他仍旧冒着失败和严重受伤的实际风险。由于种群中大部分个体实行似非而是的策略,因而一个合理策略的实行者比任何一个似非而是策略的实行者受伤的可能性都大。

    即使似非而是的策略可能是稳定的,但它大概只具有学术上的意义。似非而是策略的搏斗者只有在数量上大大超过合理策略的搏斗者的情况下才能获得较高的平均盈利。首先,这样的状况如何能出现实在令人难以想象。即使出现这种情况,合理策略者与似非而是策略者的比例也只要略微向合理策略者一边移动一点,便达到另一种ESS——合理的策略——的“引力区域”(zone of attraction)。所谓引力区域即种群的一组比例,在这个例子里,合理策略者处于这组比例的范围内时是有利的:种群一旦到达这一区域,就不可避免地被引向合理的稳定点。要是在自然界能够找到一个似非而是的ESS实例会是一件令人兴奋的事情,但我怀疑我们能否抱这样的奢望[我话说得太早了。在我写完了上面这句话之后,史密斯教授提醒我注意伯吉斯(Burgess)关于墨西哥群居蜘蛛(Oecobius civitas,拟壁钱属)的行为所做的下述描绘:“如果一只蜘蛛被惊动并被赶出其隐蔽的地方,它就会急匆匆地爬过岩石。如岩石上面无隙缝可藏身,就可能到同一物种的其他蜘蛛的隐蔽地点去避难。如果闯入者进来时,这只蜘蛛正在家里,它并不进攻,而是急匆匆爬出去再为自己去另寻新的避难所。因此,一旦第一只蜘蛛被惊动,从一个蜘蛛网到另一个蜘蛛网的一系列替换过程要持续几秒钟,这种情况往往会使聚居区的大部分蜘蛛从它们本来的隐蔽所迁徙到另一只蜘蛛的隐蔽所。”(《群居蜘蛛》,刊载于《科学美国人》1976年3月号)这就是前文所讲的那种意义上的似非而是的现象]。*

    假如个体对以往搏斗的结果保留某些记忆,情况又会是怎样呢?这要看这种记忆是具体的还是一般的。蟋蟀对以往搏斗的情况具有一般的记忆。一只蟋蟀如果在最近多次搏斗中获胜,它就会变得更具有鹰的特点;而一只最近连遭败北的蟋蟀的特点会更接近鸽子。亚历山大(R.D.Alexander)很巧妙地证实了这种情况,他利用一个模型蟋蟀痛击真正的蟋蟀。吃过这种苦头的蟋蟀再同其他真正的蟋蟀搏斗时多数要失败。我们可以说,每只蟋蟀在同其种群中有平均搏斗能力的成员做比较的同时,对自己的搏斗能力不断做出新的估计。如果把对以往的搏斗情况具有一般记忆的动物,如蟋蟀,集中在一起组成一个与外界不相往来的群体,过一段时间之后,很可能会形成某种类型的优势序位(dominance hierarchy)。**观察者能够把这些个体按级别的顺序排列。在这一顺序中级别低的个体通常要屈从于级别高的个体。这倒没有必要让人认为这些个体相互能够辨认。习惯于赢的个体就越是会赢,习惯于输的个体就越是要输。实际情况就是如此。即使开始时个体的胜利或失败完全是偶然的,它们还是会自动归类形成等级。这种情况附带产生了一个效果:群体中激烈的搏斗逐渐减少。

    我不得不用“某种类型的优势序位”这样一个名称,因为许多人只把“优势序位”这个术语用于个体具有相互辨认能力的情况。在这类例子中,对于以往搏斗的记忆是具体的而不是一般的。作为个体来说,蟋蟀相互辨认不出彼此,但母鸡和猴子都能相互辨认。如果你是一只猴子的话,一只过去曾经打败过你的猴子,今后还可能会打败你。对个体来说,最好的策略是,对先前曾打败过它的个体采取相对带有鸽派味道的态度。如果我们把一群过去从未相见的母鸡放在一起,通常会引起许多搏斗。一段时间之后,搏斗越来越少,但其原因同蟋蟀的情况不同。对母鸡来说,搏斗减少是因为在个体的相互关系中,每一个个体都能“安分守己”。这也给整个群体带来好处,下面的情况足以证明:有人注意到,在已确立的母鸡群体中,很少发生凶猛搏斗的情况,蛋的产量就比较高;相比之下,在其成员不断更换因而搏斗更加频繁的母鸡群体中,蛋的产量就比较低。生物学家常常把这种“优势序位”在生物学上的优越性或“功能”说成是出于减少群体中明显的进犯行为。然而这种说法是错误的。不能说优势序位本身在进化的意义上具有“功能”,因为它是群体而不是个体的一种特性。通过优势序位的形式表现出来的个体行为模式,从群体水平上看,可以说是具有功能的。然而,如果我们根本不提“功能”这个词,而是按照存在个体辨认能力和记忆的不对称竞赛中的各种ESS来考虑这个问题,甚至会更好些。

    迄今我们所考虑的竞争都是指同一物种成员间的竞争。物种间的竞争情况又如何呢?我们上面已经谈过,不同物种的成员之间的竞争,不像同一物种的成员之间那样直接。基于这一理由,我们应该设想它们有关资源的争端是比较少的,我们的预料已得到证实。例如,知更鸟保卫地盘不准其他知更鸟侵犯,但对大山雀却并不戒备。我们可以画一幅不同个体知更鸟在树林中分别占有领地的地图,然后在上面叠上一幅个体大山雀领地地图,可以看到两个物种的领地部分重叠,完全不相互排斥,它们简直像生活在不同的星球上。

    但不同物种的个体之间也会发生尖锐的利害冲突,不过其表现形式不同而已。例如,狮子想吃羚羊的躯体,而羚羊对于自己的躯体却另有截然不同的打算。虽然这种情况不是通常所认为的那种争夺资源的竞争,但从逻辑上说,不算竞争资源,则在道理上难以讲通。在这里,有争议的资源是肉。狮子的基因“想要”肉供其生存机器食用,而羚羊的基因是想把肉作为其生存机器进行工作的肌肉和器官。肉的这两种用途是互不相容的,因此就发生了利害冲突。

    同一物种的成员也是肉做的,但为什么同类相食的情况相对来说这样少呢?这种情况我们在黑头鸥中见到过,成年鸥有时要吃自己物种的幼鸥。但我们从未见到成年的食肉动物为吞食自己物种的其他成年动物而主动去追逐它们。为什么没有这种现象呢?我们仍旧习惯于按照“物种利益”的进化观点去思考问题,以致我们时常忘记这个完全有道理的问题:“为什么狮子不去追捕其他狮子?”还有一个人们很少提出的但很有意义的问题:“羚羊为什么见到狮子就逃,而不进行回击呢?”

    狮子之所以不追捕狮子是因为那样做对它们来说不是一种ESS。同类相食的策略是不稳定的,其原因和前面所举例子中的鹰策略相同,遭到反击的危险性太大了。而在不同物种成员之间的竞争中,这种反击的可能性要小些,这也就是那么多的被捕食的动物要逃走而不反击的道理。这种现象可能源于这样的事实:在不同物种的两只动物的相互作用中存在一种固有的不对称现象,而且其不对称的程度要比同一物种成员之间大。竞争中的不对称现象凡是强烈的,ESS一般是以不对称现象为依据的有条件的策略。“如果你比对手小,就逃走;如果你比对手大,就进攻”,这种类型的策略很可能在不同物种成员之间的竞争中得到发展,因为可以利用的不对称现象非常之多。狮子和羚羊通过进化上的趋异过程形成了一种稳定性,而竞争中本来就有的不对称现象也因此变得日益加强。追逐和逃跑分别变成它们各自的高超技巧。一只突变型羚羊如果采取了“对峙并搏斗”的策略来对付狮子,它的命运同那些逃之夭夭的羚羊相比,可能要不妙得多。

    我总是有一种预感,我们可能最终会承认ESS概念的发明是自达尔文以来进化理论上最重要的发展之一。*凡是有利害冲突的地方,它都适用,这就是说几乎在一切地方都适用。一些研究动物行为的学者沾染了侈谈“社会组织”的习惯。他们动辄把一个物种的社会组织看作一个具备作为实体的条件的单位,它享有生物学上的“有利条件”。我所举的“优势序位”就是一例。我相信,混迹于生物学家有关社会组织的大量论述中的那些隐蔽的类群选择主义的各种假定,是能够被辨认出来的。史密斯的ESS概念使我们第一次能够清楚地看到,一个由许多独立的自私实体构成的集合体,如何最终变得像一个有组织的整体。我认为,这不仅对于物种内的社会组织是正确的,而且对于由许多物种所构成的“生态系统”以及“群落”也是正确的。从长远观点来看,我预期ESS概念将会使生态学发生彻底的变革。

    我们也可以把这一概念运用于曾在第3章搁置下来的一个问题上,即赛艇上的桨手(代表体内的基因)需要很好的集体精神这一类比。基因被选择,不是因为它在孤立状态下的“好”,而是由于它在基因库中的其他基因这一背景下工作得好。好的基因应能够和与之长期共同生活于一系列个体内的其他基因和谐共存,相互补充。磨嚼植物的牙齿基因在食草物种的基因库中是好基因,但在食肉物种的基因库中就是不好的基因。

    我们可以设想一个不矛盾的基因组合,它是作为一个单位被选择在一起的。在第3章蝴蝶模拟的例子中,情况似乎就是如此。但现在ESS概念使我们能够看到,自然选择纯粹在独立基因的水平上如何能够得到相同的结果,这就是ESS概念的力量所在。这些基因并不一定是在同一条染色体上连接在一起的。

    其实,赛艇的类比还没达到说明这一概念的程度,它最多只能说明一个近似的概念。我们假定,一艘赛艇的全体船员要能真正获得成功,重要的是桨手必须用语言协调其动作。我们再进一步假定,在桨手库中教练能够选用的桨手,有些只会讲英语,有些只会讲德语。讲英语的桨手并不始终比操德语的桨手好些,也不总是比讲德语的桨手差些。但由于沟通的重要性,混合组成的桨手队得胜的机会要少些,而纯粹讲英语的或纯粹讲德语的桨手所组成的队伍得胜的机会要多些。

    教练没有认识到这一点,他只是任意地调配他的桨手,认为得胜的船上的个体都是好的,认为失败的船上的个体都是差的。如果在教练的桨手库中,英国人碰巧占压倒性优势,那么,船上只要有一个德国人,很可能就会使这支队伍输掉,因为无法进行沟通;反之,如果在桨手库中凑巧德国人占绝对优势,船上只要有一个英国人,也会使这支队伍失败。因此,最理想的一队船员应处于两种稳定状态中任何一种,即要么全部是英国人,要么全部是德国人,而绝不是混合阵容。表面上看起来,教练似乎选择单一语言小组作为单位,其实不然,他是根据个体桨手的能力来进行选择的。而个体赢得竞赛的趋向要取决于候选桨手库中现有的其他个体。属于少数的候选桨手会自动受到惩罚,这倒并非因为他们是不好的桨手,而仅仅是由于他们是少数而已。同样,基因因能相互和谐共存而被选择在一起,这并不一定说明我们必须要像看待蝴蝶的情况那样,把基因群体也看成是作为单位来进行选择的。在单个基因低水平上的选择能给人以在某种更高水平上选择的印象。

    在这一例子中,自然选择有利于简单的行为一致性。更为有趣的是,基因被选择可能由于它们的相辅相成的行为。以类比法来说明问题,我们可以假定由4个右桨手和4个左桨手组成的赛艇队是力量匀称的理想队;我们再假定教练不懂得这个道理,他根据“功绩”盲目进行挑选。那么如果在候选桨手库中碰巧右桨手占压倒优势的话,任何个别的左桨手往往会成为一种有利因素:他有可能使他所在的任何一条船取得胜利,他因此就显得是一个好桨手。反之,在左桨手占绝对多数的划桨手库中,右桨手就是一个有利因素。这种情况就同一只鹰在鸽子种群中取得良好成绩,以及一只鸽子在鹰种群中取得良好成绩的情况相似。不同的是,在那里我们讲的是关于个体——自私的机器——之间的相互作用,而这里我们用类比法谈论的是关于体内基因之间的相互作用。

    教练盲目挑选“好”桨手的最终结果必然是由4个左桨手和4个右桨手组成的一支理想的队伍。表面看起来他好像把这些桨手作为一个完整的、力量匀称的单位选在一起的。我觉得说他在较低的水平上,即在单独的候选桨手水平上进行选择更加简便省事。4个左桨手和4个右桨手加在一起的这种进化上稳定状态(“策略”一词在这里会引起误解)的形成,只不过是以表面功绩为基础在低水平上进行选择的必然结果。

    基因库是基因的长期环境。“好的”基因是作为在基因库中存活下来的基因盲目地被选择出来的。这不是一种理论,甚至也不是一种被观察到的事实,它不过是一个概念无数次的重复。什么东西使基因成为好基因才是人们感兴趣的问题。我曾讲过,建造高效能的生存机器——躯体——的能力是基因成为好基因的标准,这是一种初步的近似说法。现在我们必须对这种说法加以修正。基因库是由一组进化上稳定的基因形成的,这组基因成为一个不受任何新基因侵犯的基因库。大部分因突变、重新组合或自外部出现的基因很快就受到自然选择的惩罚:这组进化上稳定的基因重新得到恢复。新基因侵入一组稳定的基因偶尔也会获得成功,即成功地在基因库中散布开来。然后出现一个不稳定的过渡阶段,最终又形成新的一组进化上稳定的基因——发生了某种细微程度的进化。按进犯策略类推,一个种群可能有不止一个可选择的稳定点,还可能偶尔从一个稳定点跳向另一个稳定点。渐进的进化过程与其说是一个稳步向上爬的进程,倒不如说是一系列从一个稳定台阶走上另一个稳定台阶的不连续的步伐。*作为一个整体,种群的行为就好像是一个自动进行调节的单位,而这种幻觉是由在单个基因水平上进行的选择造成的。基因是根据其“成绩”被选择的,但对成绩的判断是以基因在一组进化上稳定的基因(即现存基因库)的背景下的表现为基础的。

    史密斯集中地论述了一些完整个体之间进犯性的相互作用,从而把问题阐明。鹰的躯体和鸽子躯体之间的稳定比例易于想象,因为躯体是我们能够看得见的大物体,但寄居于不同躯体中的基因之间的这种相互作用只是冰山的一角。而在一组进化上稳定的基因——基因库——中,基因之间绝大部分的重要相互作用是在个体的躯体内进行的。这些相互作用很难看见,因为它们是在细胞内,主要是在发育中的胚胎细胞里发生的。完整的浑然一体的躯体之所以存在,正是因为它们是一组进化上稳定的自私基因的产物。

    但我必须回到完整动物之间的相互作用的水平上来,因为这是本书的主题。把个体动物视为独立的自私机器便于理解进犯行为。如果有关个体是近亲——兄弟姐妹、堂兄弟姐妹、双亲和子女——这一模式也就失去效用,这是因为近亲体内有很大一部分基因是共有的。因此,每一个自私的基因必须同时忠于不同的个体。这一问题留待下一章再加以阐明。

    第6章 基因种族

    自私的基因是什么?它不仅仅是DNA的一个单一的有形片段,正像在原始汤里的情况一样,它是DNA的某个具体片段的全部复制品,这些复制品分布在整个世界上。如果我们可以认为基因似乎具有自觉的目的,同时我们又有把握在必要时把我们使用的过分通俗的语言还原成正规的术语,那么我们就可以提出这样一个问题:一个自私基因的目的究竟是什么?它的目的就是试图在基因库中扩大自己的队伍。从根本上说,它采用的办法就是帮助那些它所寄居的个体编制它们能够赖以生存下去并进行繁殖的程序。不过我们现在需要强调的是,“它”是一个分布在各处的代理机构,同时存在于许多不同的个体之内。本章的主要内容是,一个基因有可能帮助存在于其他一些个体之内的复制品。如果是这样,这种情况看起来倒像是个体的利他主义,但这样的利他主义出于基因的自私性。

    让我们假定有这样一个基因,它是人体内的一个白化基因(albino)。事实上有好几种基因可能引起白化,但我讲的只是其中一种。它是隐性的,就是说,必须有两个白化基因同时存在才能使个体患白化病。大约在两万人中有一个会发生这种情况,但我们当中,每70个人就有一个体内存在单个的白化基因。这些人并不患白化病。由于白化基因分布于许多个体之中,从理论上说,它能为这些个体编制程序,使之对其他含有白化基因的个体表现出利他行为,以此来提高自身在基因库的存在,因为其他的白化体含有同样的基因。如果白化基因寄居的一些个体死去,而它们的死亡使含有同样基因的一些其他个体得以存活下去,那么,这个白化基因理应感到相当高兴。如果1个白化基因能够使它的1个个体拯救10个白化体的生命,那么,即使这个利他主义者因之死去,它的死亡也由于基因库中白化基因数目的增加而得到充分的补偿。

    我们是否因此可以指望白化体相互特别友好?事实上情况大概不会是这样。为了搞清楚这个问题,我们有必要暂时放弃把基因视为有自觉意识的行为者这个比喻。因为在这里,这种比喻肯定会引起误会。我们必须再度使用正规的、即使是有点冗长的术语。白化基因并不真的“想”生存下去或帮助其他白化基因。但如果这个白化基因碰巧使它的一些个体对其他的一些白化体表现出利他行为,那么不管它情愿与否,这个白化基因往往因此在基因库中自然而然地兴旺起来。但为了促使这种情况发生,这个基因必须对它的一些个体产生两种相互独立的影响。它不但要对它的一些个体赋予通常能产生非常苍白的肤色的影响,还要赋予个体一种倾向,使他们对其他具有非常苍白肤色的个体表现出有选择的利他行为。具有这两种影响力的基因如果存在的话,肯定会在种群中取得很大的成功。

    我在第3章中曾强调过,基因确实能产生多种影响,这是事实。从纯理论的角度上说,出现这样的基因是可能的,它能赋予个体以一种明显可见的外部“标志”,如苍白的皮肤、绿色的胡须,或其他引人注目的东西,以及对其他带有这些标志的个体特别友好的倾向。这样的情况可能发生,尽管可能性不大。绿胡须同样可能与趾甲往肉里长或其他特征的倾向有关,而对绿胡须的偏好同样可能与嗅不出小苍兰的生理缺陷同时存在。同一基因既产生正确的标志又产生正确的利他行为,这种可能性不大。可是,这种我们可以称之为绿胡须利他行为效果的现象在理论上是可能的。

    像绿胡须这种任意选择的标志不过是基因借以在其他个体中“识别”其自身拷贝的一个方法而已。还有没有其他方法呢?下面可能是一个非常直接的方法。单凭个体的利他行为就可以识别出拥有利他基因的个体。如果一个基因能“说”类似“喂!如果A试图援救溺水者而自己快要没顶,就跳下去把A救起来”这样的话,这个基因在基因库中就会兴旺起来,因为A体内多半含有同样的救死扶伤的利他基因。A试图援救其他个体的事实本身就是一个相当于绿胡须的标志。尽管这个标志不像绿胡须那样荒诞不经,但它仍然有点令人难以置信。基因有没有一些比较合乎情理的办法“识别”存在于其他个体中的拷贝呢?

    回答是肯定的。我们很容易证明,近亲多半共有同样的基因。人们一直认为,这显然是亲代对子代的利他行为如此普遍存在的理由,费希尔、霍尔丹[1],尤其是汉密尔顿认为,这种情况同样也适用于其他近亲——兄弟、姐妹、侄子侄女和血缘近的堂(表)兄弟或姐妹。如果1个个体为了拯救10个近亲而牺牲,操纵个体对亲属表现利他行为的基因可能因此失去一个拷贝,但同一基因的大量拷贝却得以保存。

    “大量”这种说法很不明确,“近亲”也是如此。其实我们可以讲得更确切一些,如汉密尔顿所表明的那样。他在1964年发表的两篇有关社会个体生态学的论文属于迄今为止最重要的文献之列。我一直难以理解,为什么一些个体生态学家如此粗心,竟忽略了这两篇论文(两本1970年版的有关个体生态学的主要教科书甚至没有把汉密尔顿的名字列入索引)。*幸而近年来有迹象表明,他的观点又重新引起人们的兴趣。他的论文应用了相当深奥的数理知识,但不难仅凭直觉而不必通过精确的演算去掌握其基本原则,尽管这样做会把一些问题过度简单化。我们需要计算的是概率,亦即两个个体,譬如两姐妹共有同一特定基因的机会。

    为了简便起见,我假定我们讲的是整个基因库中一些稀有的基因。**大多数人都共有“不形成白化体的基因”,不管这些人有没有亲缘关系。这类基因之所以普遍存在,是因为自然界里白化体比非白化体更易于死亡。这是由于,譬如说阳光使它们目眩,以致有白化体可能看不清更大的逐渐接近的捕食者。我们没有必要解释基因库中不形成白化体的这类显然是“好的”基因取得优势的理由,我们感兴趣的是,基因为什么因为表现了利他行为而取得了成功。因此,我们可以假定,至少在这个进化过程的早期,这些基因是稀有的。值得注意的是,在整个种群中稀有的基因,在一个家族中却是常见的。我体内有一些对整个种群来说稀有的基因,你的体内也有一些对整个种群来说稀有的基因。我们两人共有这些同样的稀有基因的机会是微乎其微的,但我的姐妹和我共有某一具体的稀有基因的机会是很大的。同样,你的姐妹和你共有同一稀有基因的机会也是很大的。在这个例子里,机会刚好是50%,原因不难解释的。

    假定你体内有基因G的一个拷贝,这一拷贝必然是从你的父亲或母亲那里继承过来的(为了方便起见,我们不考虑各种不常见的可能性——如G是一个新变种,或你的双亲都有这一基因,或你的父亲或母亲体内有两个拷贝)。假如是你的父亲把这个基因传给你,那么他体内每一个正常的体细胞都含有G的一个拷贝。现在你要记住,一个男人产生一条精子时,他把他的半数的基因给了这一精子。因此,培育你姐姐或妹妹的那条精子获得基因G的机会是50%。在另一方面,如果你的基因G是来自母亲,按照同样的推理,她的卵子中有一半的可能性含有G。同样,你的姐姐或妹妹获得基因G的机会也是50%。这意味着如果你有100个兄弟姐妹,其中大约50个会有你体内的任何一个具体的稀有基因。这也意味着如果你有100个稀有基因,你的兄弟或姐妹中任何一个体内都可能共有大约50个这样的基因。

    你可以通过这样的演算方法计算出任何亲缘关系的等级。亲代与子代之间的亲缘关系是重要的。如果你有基因H的一个拷贝,你的某一个子女体内含有这个基因拷贝的可能性是50%,因为你有一半的性细胞含有H,而任何一个子女都是由一个这样的性细胞培育出来的。如果你有基因J的一个拷贝,那么你父亲体内含有这个基因拷贝的可能性是50%,因为你的基因有一半是来自他的,另一半是来自你母亲的。为了计算的方便,我们采用亲缘关系的指数用来表示两个亲属之间共有同一基因有多大的机会。两兄弟之间的亲缘关系指数是,因为他们之间任何一个的基因有一半为另一个所共有。这是一个平均数:由于减数分裂的机遇,有些兄弟所共有的基因可能大于一半或少于一半。但亲代与子代之间的亲缘关系永远是,不多也不少。

    不过,每次计算都要从头算起就未免太麻烦了,这里有一个简便的方法供你计算任何两个个体A和B的亲缘关系。如果你要立遗嘱或需要解释家族中某些成员之间为何如此相像,你就可能发觉这个方法很有用。在一般情况下,这个方法是行之有效的,但在发生近亲相互交配的情况下就不适用了。某些种类的昆虫也不适用于这个方法,我们在下面会谈到这个问题。

    首先,查明A和B所拥有的共同祖先是谁。譬如说,一对第一代堂兄弟的共同祖先是他们的祖父和祖母。找到一个共同祖先以后,他的所有祖先当然也就是A和B的共同祖先,这当然是合乎逻辑的。不过,对于我们来说,查明最近一代的共同祖先就足够了。从这个意义上说,第一代堂兄弟只有两个共同的祖先。如果B是A的直系亲属,譬如说是A的曾孙,那么我们要找的“共同祖先”就是A本人。

    找到A和B的共同祖先之后,再按下列方法计算代距(generation distance)。从A开始,沿其家谱上溯其历代祖先,直到你找到他和B所共有的那一个祖先为止,然后再从这个共同祖先往下一代一代数到B。这样,在家谱上从A到B的世代总数就是代距。譬如说,A是B的叔叔,那么代距是3,共同的祖先是A的父亲,亦即B的祖父。从A开始,你只要往上追溯一代就能找到共同的祖先,然后从这个共同的祖先往下数两代便是B。因此,代距是1+2=3。

    通过某一个共同的祖先找到A和B之间的代距后,再分别计算A和B与这个共同祖先相关的那部分亲缘关系。方法是这样的,每一个代距是,有几个代距就把几个自乘,所得乘积就是亲缘关系指数。如果代距是3,那么指数是××或()3;如果通过某一个共同祖先算出来的代距是g,同该祖先那部分的亲缘关系指数就是(106-)g

    但这仅仅是A和B之间亲缘关系的部分数值。如果他们的共同祖先不止一个,我们就要把通过每一个祖先的亲缘关系的全部数值加起来。在一般情况下,对一对个体的所有共同祖先来说,代距都是一样的。因此,在算出A和B同任何一个共同祖先的亲缘关系后,事实上你只要乘以祖先的个数就行了。譬如说,第一代堂兄弟有两个共同的祖先,他们同每一个祖先的代距是4,因此他们亲缘关系指数是2×()4=。如果A是B的曾孙,代距是3,共同“祖先”的数目是1(即B本身),因此,指数是1×()3=。就遗传学而言,你的第一代堂兄弟相当于一个曾孙。同样,你“像”你叔父的程度[亲缘关系是2×()3=]和你“像”你祖父的程度[亲缘关系是1×()3=]相等。

    至于远如第三代堂兄弟或姐妹的亲缘关系[2×()8=],那就要接近于最低的概率了,即相当于种群中任何一个个体拥有A体内某个基因的可能性。就一个利他基因而言,一个第三代的堂兄弟姐妹的亲缘关系和一个素昧平生的人差不多。一个第二代的堂兄弟姐妹(亲缘关系指数为)稍微特殊一点,第一代堂兄弟姐妹更为特殊一点(),同胞兄弟姐妹、父母和子女十分特殊(),同卵孪生兄弟姐妹(1)就和自己完全一样。叔(伯)父和叔(伯)母、侄子或外甥和侄女或外甥女、祖父母和孙子孙女、异父或异母兄弟和异父或异母姐妹的亲缘关系是。

    现在我们能够以准确得多的语言谈论那些表现近亲利他行为的基因。一个操纵其个体拯救5个堂兄弟或姐妹,但自己因而牺牲的基因在种群中是不会兴旺起来的,但拯救5个兄弟或10个第一代堂兄弟姐妹的基因却会兴旺起来。一个准备自我牺牲的利他基因如果要取得成功,它至少要拯救两个以上的兄弟姐妹(子女或父母),或4个以上的异父异母兄弟姐妹(或叔父、叔母、伯父、伯母、侄子、侄女、祖父母、孙子孙女)或8个以上的第一代堂兄弟姐妹,等等。按平均计算,这样的基因才有可能在利他主义者所拯救的个体内存在下去,同时这些个体的数目足以补偿利他主义者自身死亡所带来的损失。

    如果一个个体能够肯定某人是他的同卵孪生兄弟或姐妹,他关心这个孪生兄弟或姐妹的福利应当和关心自己的福利完全一样。任何操纵孪生兄弟或姐妹利他行为的基因都同时存在于这一对孪生兄弟或姐妹体内,因此,如果其中一个为援救另外一个的生命而英勇牺牲,这个基因是能够存活下去的。九带犰狳(nine-banded armadillos)是一胎4只的。我从未听说过小犰狳英勇献身的事迹,但有人指出它们肯定有某种强烈的利他行为。如果有人能到南美去一趟,观察一下它们的生活,我认为是值得的。*

    我们现在可以看到,父母之爱不过是近亲利他行为的一种特殊情况。从遗传学的观点来看,一个成年的个体在关心自己父母双亡的幼弟时,应和关心自己的子女一样。对他来说,弟弟和子女的亲缘关系指数是完全一样的,即。按照基因选择的说法,种群中操纵个体表现姐姐利他行为的基因和操纵个体表现父母利他行为的基因应有同等的繁殖机会。事实上,从几个方面来看,这种说法未免过分简单化,而且在自然界里,兄弟姐妹之爱远不及父母之爱来得普遍,我们将在下面进一步说明。但我要在这里阐明的一点是,从遗传学的观点看,父母/子女的关系并没有比兄弟/姐妹关系来得特殊的地方。尽管实际上是父母把基因传给子女,而姐妹之间并不发生这种情况,但这个事实与本问题无关。这是因为姐妹两个都是从同一个父亲和同一个母亲那里继承相同基因的全似复制品。

    有些人用亲属选择(kin selection)这个名词来把这种自然选择区别于类群选择(群体的差别性生存)和个体选择(个体的差别性生存)。亲属选择是家族内部利他行为的起因。关系越密切,选择越强烈。这个名词本身并无不妥之处。但不幸的是,我们可能不得不抛弃它,因为近年来的滥用已产生流弊,会给生物学家在今后的许多年里带来混乱。威尔逊[2]的《社会生物学:新的综合》(Sociobiology: The New Synthesis)一书,在各方面都堪称一本杰出的作品,但它却把亲属选择说成是类群选择的一种特殊表现形式。书中一张图表清楚地表明,他在传统意义上,即我在第1章里所使用的意义上,把亲属选择理解为“个体选择”与“类群选择”之间的中间形式。类群选择,即使按威尔逊自己所下的定义,是指由个体组成的不同群体之间的差别性生存。诚然,从某种意义上说,一个家族是一种特殊类型的群体,但威尔逊论点的全部含义是,家族与非家族之间的分界线不是一成不变的,而是属于数学概率的问题。汉密尔顿的理论并没有认为动物应对其所有“家族成员”都表现出利他行为,而对其他的动物表现出自私行为。家族与非家族之间并不存在着明确的分界线。我们没有必要决定,譬如说,第二代堂兄弟是否应列入家族范围之内,我们只是预计第二代堂兄弟接收到利他行为的概率相当于子女或兄弟的。亲属选择肯定不是类群选择的一个特殊表现形式*,它是基因选择产生的一个特殊后果。

    威尔逊关于亲属选择的定义有一个甚至更为严重的缺陷。他有意识地把子女排除在外:他们竟不算亲属!**他当然十分清楚,子女是他们双亲的骨肉,但他不想引用亲属选择的理论来解释亲代对子代的利他性关怀。他当然有权利按照自己的想法为一个词下定义,但这个定义非常容易把人弄糊涂。我倒希望威尔逊在他那本立论精辟的具有深远影响的著作再版时把定义修订一下。从遗传学的观点看,父母之爱和兄弟/姐妹的利他行为的形成都可以用完全相同的原因来解释:在受益者体内存在这个利他性基因的可能性很大。

    我希望读者谅解上面这个有点出言不逊的评论,而且我要赶快调转笔锋言归正传。到目前为止,我在一定程度上把问题过分简单化了,现在开始,我要把问题说得更具体一些。我在上面用浅显易懂的语言谈到了为援救具有一定亲缘关系的一定数目的近亲而准备自我牺牲的基因。显然,在实际生活中我们不能认为动物真的会清点一下它们正在援救的亲属到底有几个。即使它们有办法确切知道谁是它们的兄弟或堂兄弟,我们也不能认为动物在大脑里进行过汉密尔顿式的演算。在实际生活中,必须以自身以及其他个体死亡的统计学风险(statistical risks)来取代肯定的自杀行为和确定的“拯救”行为。如果你自己冒的风险非常微小的话,即使是第三代的堂兄弟也是值得拯救的。再说,你和你打算拯救的那个亲属有朝一日总归都要死的,每一个个体都有一个保险精算师估算得出的“预期寿命”,尽管这个估算可能有误差。如果你有两个血缘关系同样接近的亲属,其中一个已届风烛残年,另一个却是血气方刚的青年,那么对未来的基因库而言,挽救后者的生命所产生的影响要比挽救前者来得大。

    我们在计算亲缘关系指数时,对那些简洁的对称演算还需要进一步加以调整。就遗传学而言,祖父母和孙子孙女出于同样的理由以利他行为彼此相待,因为他们体内的基因有是共同的。但如果孙辈的预期寿命较长,那么操纵祖父母对孙辈利他行为的基因,比起操纵孙辈对祖父母利他行为的基因,具有更优越的选择条件。由于援助一个年轻的远亲而得到的净收益,很可能超过由于援助一个年老的近亲而得到的净收益(顺便说一句,祖父母的预期寿命当然并不一定比孙辈短。在婴儿死亡率高的物种中,情况可能恰恰相反)。

    把保险统计的类比稍加引申,我们可以把个体看作人寿保险的保险商。一个个体可以把自己拥有的部分财产作为资金对另一个个体的生命进行投资。他考虑了自己和那个个体之间的亲缘关系,以及从预期寿命的角度来看该个体同自己相比是不是一个“好的保险对象”。严格地说,我们应该用“预期生殖能力”这个词,而不是“预期寿命”,或者更严格一些,我们可以用“使自己的基因在可预见的未来获益的一般能力”。那么,为了使利他行为得以发展,利他行为者所承担的风险必须小于受益者得到的净收益和亲缘关系指数的乘积。风险和收益必须采取我所讲的复杂的保险统计方式来计算。

    可是我们怎能指望可怜的生存机器进行这样复杂的运算啊!*尤其是在匆忙间,那就更不用说了。甚至伟大的数学生物学家霍尔丹(在1955年发表的论文里,他在汉密尔顿之前就做出了基因由于援救溺水的近亲而得以繁殖的假设)也曾说:“……我曾两次把可能要淹死的人救起(自己所冒的风险是微乎其微的),在这样做的时候,我根本没有时间去进行演算。”不过霍尔丹也清楚地知道,幸而我们不需要假定生存机器在自己的头脑里有意识地进行这些演算。正像我们使用计算尺时没有意识到我们实际上是在运用对数一样。动物可能生来就是如此,以至于行动起来好像是进行过一番复杂的演算似的。

    这种情况其实是不难想象的。一个人把球投入高空,然后又把球接住,他在完成这个动作时好像事先解了一组预测球的轨道的微分方程。他对微分方程可能一窍不通,也不想知道微分方程是什么玩意儿,但这种情况不影响他投球与接球的技术。在某个下意识的水平上,他进行了某种在功能上相当于数学演算的活动。同样,一个人如要做出某项困难的决定,他首先权衡各种得失,并考虑这个决定可能引起的他想象得到的一切后果。他的决定在功能上相当于一系列加权演算过程,有如计算机进行的那种演算一样。

    如果要为一台计算机编制程序,使之模拟一个典型的生存机器如何做出是否表现利他行为的决定,我们大概要这样进行:开列一份清单,列出这只动物可能做的一切行为,然后为这些行为的每一种模式分别编制一次加权演算程序。各种利益都给以正号,各种风险都给以负号。接着进行加权,即把各项利益和风险分别乘以适当的表示亲缘关系的指数。然后再把得出的数字加起来,为了演算的方便,在开头的时候我们不考虑其他方面如年龄、健康状况之类的权重。由于一个个体对自己的亲缘关系指数是1(就是说,他具有他自己的100%的基因——这是不言自明的),对他的一切风险和利益都不需要打折扣,即在演算时给以全部权重。这样,每一种可能的行为模式的总和大体上是这样的:行为模式的净收益=对自己的收益-对自己的风险+对兄弟的收益-对兄弟的风险+对另一个兄弟的收益-对另一个兄弟的风险+对堂兄弟的收益-对堂兄弟的风险+对子女的收益-对子女的风险+……

    这个总和就是那个行为模式的净收益得分。接着,这个“模式动物”算出清单上每一种可供选择的行为模式的得分。最后,它决定按净收益最大的行为模式采取行动。即使所有的得分都是负数,它还是应该按这个原则进行选择,即择害处最小的一种行为模式。应当记住,任何实际行动必然牵涉精力和时间的消耗,这些精力和时间可以用于做其他事情。如果演算的结果表明不做任何事情的净收益最大,那么,这个模式动物就什么也不做。

    下面是个十分简单的例子,以自我独白的形式而不是以计算机模拟的形式来说明问题。我是一只动物,发现了8只长在一起的蘑菇。我心中首先盘算一下它们的营养价值,同时考虑到它们可能有毒的这个不大的风险,我估计每个蘑菇约值6个单位(像前一章一样,这些单位是任意选定的)。由于蘑菇很大,我最多只能吃3个。我要不要发出“有食物”的喊声,把我的发现告诉其他动物呢?谁能听到我的喊声?兄弟B(它和我的亲缘关系是),堂兄弟C(亲缘关系是)和D(并不算亲戚,它和我的亲缘关系指数是如此之小,以至于事实上可以视作0)。如果我不声张,我能吃掉的每个蘑菇都为我带来净收益6,全部吃掉是18。如发出“有食物”的喊声,那么我还有多少净收益可要盘算一下了。8个蘑菇平分4份,对我而言,我自己吃的一份折合净收益12,但我的兄弟和堂兄弟各吃掉的两个蘑菇也会给我带来好处,因为它们体内有和我一样的基因。事实上的总分是(1×12)+(×12)+(×12)+(0×12)=19.5,而自私行为带来的净收益是18。尽管差别不大,但得失是分明的。因此,我将发出“有食物”的喊声。在这种情况下,我的利他行为会给我的自私基因带来好处。

    在上面这个简化的例子里,我假设个体动物能够盘算它的基因的最大收益是什么。实际的情况是,基因库中充满对个体施加影响的基因,由于这种影响,个体在采取行动时好像事先进行过这种演算。

    无论如何,这种演算的结果仅仅是一种初步的第一近似值,它离理想的答案还有一段距离。这种演算方式忽略了许多东西,其中包括个体的年龄等因素。而且,如果我刚饱餐了一顿,现在最多只能吃一个蘑菇,这时发出“有食物”的喊声为我带来的净收益将比我在饥肠辘辘时大得多。针对各种可能出现的情况,这种演算的质量可以无止境地逐步提高。但动物并非生活在理想的环境里,我们不能指望真正的动物在做出最适宜决定时考虑到每一个具体细节。我们必须在自然界里通过观察和试验去发现,真正的动物在进行有关得失的分析时,能够在多大的程度上接近理想的境界。

    为了不致因为举了一些主观想象的例子而离题太远,让我们暂且再使用一下基因语言。生命体是由存活下来的基因为之编制程序的机器。这些存活下来的基因是在一定的条件下这样做的。一般说来,这些条件,往往构成这个物种以前的环境所具有的特征。因此,有关得失的“估计”是以过去的“经验”为依据的,正像人类做出决定时一样。不过,这里所说的经验具有基因经验的特殊意义,或者说得更具体一些,是以前的基因生存的条件(由于基因也赋予生存机器以学习能力,我们可以说,某些得失的估计也可能是以个体经验为基础的)。只要条件不发生急剧变化,这些估计是可靠的,生存机器一般来说往往能做出正确的决定。如果条件急剧变化,生存机器往往做出错误的决定,它的基因要为此付出代价。人类也是一样,他们的基因根据过时的资料做出的决定多半是错误的。

    对亲缘关系的估计也会出现差错和靠不住的情况。在上面一些简化的计算中,生存机器被认为知道谁跟它们有亲缘关系,而且知道这种关系的密切程度。在实际生活中,确切知道这方面的情况有时是可能的,但一般来说,亲缘关系只能作为一个平均数来估计。譬如说,我们假定A和B可能是异父或异母兄弟,也可能是同胞兄弟。他们之间的亲缘关系指数是或,由于我们不能肯定它们的确切关系,可供运用的有效指数是其平均数,即。如能肯定他们都为一母所生,但为一父所生的可能性只是,那么他们是异父兄弟的可能性是90%,而同胞兄弟的可能性是10%,因而有效指数是×+×=0.275。

    但当我们说可能性是90%时,是谁做出这个估计的?我们指的是一位长期从事实地研究的人类博物学家呢,还是指动物本身?如果碰巧的话,两者所做估计的结果可能出入不大。要了解这一点,我们必须考虑一下,动物在实际生活中是怎样估计谁是它们的近亲的。

    我们知道谁是我们的亲属,这是因为别人会告诉我们,*因为我们为他们取了名字,因为我们有正式结婚的习惯,同时也因为我们有档案和良好的记忆力。很多社会人类学家对于他们所研究的社会里的“亲缘关系”感到关切。他们所指的不是遗传学上的真正的亲缘关系,而是主观上的、教养上的亲属概念。人类的风俗和部落的仪式通常都很强调亲缘关系;膜拜祖先的习惯流传得很广,家族的义务和忠诚在人类生活中占有主导地位。根据汉密尔顿的遗传学说,我们很容易解释氏族之间的仇杀和家族之间的争斗。乱伦的禁忌表明人类具有深刻的亲缘关系意识,尽管乱伦禁忌在遗传上的好处与利他主义无关。它大概与近亲繁殖能产生隐性基因的有害影响有关。(出于某种原因,很多人类学家不喜欢这个解释。)**

    野兽怎能“知道”谁是它们的亲属呢?换言之,它们遵循什么样的行为准则便可以间接地获得似乎是有关亲缘关系的知识呢?提出“对亲属友好”这条准则意味着以未经证明的假定作为论据,因为事实上如何辨认亲属这个问题尚未解决。野兽必须从它们的基因那里取得一条简明的行动准则:这条准则不牵涉对行动的终极目标的全面认识,但它却是切实可行的,至少在一般条件下是如此。我们人类对准则是不会感到陌生的,准则具有的约束力是如此之大,以至于如果我们目光短浅的话,就盲目服从这些准则,即使我们清楚地看到它们对我们或其他任何人都无好处。在正常的情况下,野兽可以遵循什么样的准则以便间接地使它们的近亲受益呢?

    如果动物倾向于对外貌和它们相像的个体表现出利他行为,它们就可能间接地为其亲属做一点好事。当然这在很大程度上要取决于有关物种的具体情况。不管怎样,这样一条准则会导致仅仅是统计学上的“正确的”决定。如果条件发生变化,譬如说,如果一个物种开始在一个大得多的类群中生活,这样的准则就可能导致错误的决定。可以想象,人们有可能把种族偏见理解为是对亲属选择倾向不合理地推而广之的结果,即把外貌和自己相像的个体视为自己人,并歧视外貌和自己不同的个体的倾向。

    在一个其成员不经常迁居或仅在小群体中迁居的物种中,你偶然遇到的任何个体都很可能是与你相当接近的近亲。在这样的情况下,“对你所遇见的这个物种的任何成员一律以礼相待”这条准则可能具有积极的生存价值,因为凡能使其个体倾向于遵循这条准则的基因,可能会在基因库中兴旺起来。经常有人提到猴群和鲸群中的利他行为,道理即在于此。鲸鱼和海豚如果呼吸不到空气是要淹死的。幼鲸以及受伤的鲸鱼有时无力游上水面,为了援救它们,鲸群中的一些同伴就会把它们托出水面。有人曾目睹过这种情景。鲸鱼是否有办法识别它们的近亲,我们无从知道,但这也许无关紧要,情况可能是,鲸群中随便哪一条都可能是你的近亲,这种总的概率是如此之大,使利他行为成为一种合算的行为。顺便提一下,曾经发生过这样一件事:一条野生海豚把一个快要淹死的人救了起来。这个传闻据说非常可靠。这种情况我们可以看作鱼群错误地运用了援救快要淹死的成员这条准则。按照这条准则的“定义”,鱼群里快要淹死的成员可能是这样的:“挣扎在接近水面处一条长长的快要窒息的东西。”

    据说成年的狒狒为了保护它的伙伴免受豹子之类猛兽的袭击而甘冒生命危险。一般说来,一只成年的雄狒狒大概有相当多的基因储存在其他狒狒体内。一个基因如果这样“说”:“喂,如果你碰巧是一只成年的雄狒狒,你就得保卫群体,打退豹子的进攻。”那么它在基因库中就会兴旺起来。许多人喜欢引用这个例子,但在这里,我认为有必要补充一句,至少有一个受人尊敬的权威人士提供的事实与此大相径庭。据她说,一旦豹子出现,成年雄狒狒总是第一个逃之夭夭。

    雏鸡喜欢跟着母鸡在鸡群中觅食。它们的叫声主要有两种,除了我上面提到过的那种尖锐的吱吱声外,它们在啄食时会发出一种悦耳的嘁嘁喳喳声。吱吱声可以唤来母鸡的帮助,但其他雏鸡对这种吱吱声却毫无反应。另一方面,嘁嘁喳喳声能引起其他小鸡的注意。就是说,一只雏鸡找到食物后就会发出嘁嘁喳喳声把其他的雏鸡唤来分享食物。按照前面假设的例子,嘁嘁喳喳声就等于是“有食物”的叫声。像那个例子一样,雏鸡所表现的明显的利他行为可以很容易地在亲属选择的理论里找到答案。在自然界里,这些雏鸡都是同胞兄弟姐妹。操纵雏鸡在发现食物时发出嘁嘁喳喳声的基因会扩散开来,只要这只雏鸡由于发出叫声后承担的风险少于其他雏鸡所得净收益的一半就行了。由于这种净收益由整个鸡群共享,而鸡群的成员在一般情况下不会少于两只,不难想见,其中一只在发现食物时发出叫声总是合算的。当然,在家里或农场里,养鸡的人可以让一只母鸡孵其他母鸡的蛋,甚至火鸡蛋或鸭蛋。这时,这条准则就不灵了,但母鸡和它的雏鸡都不可能发觉其中的底细。它们的行为是在自然界的正常条件影响下形成的,而在自然界里,陌生的个体通常是不会出现在你的窝里的。

    不过,在自然界里,这种错误有时也会发生。在群居的物种中,一只怙恃俱失的幼兽可能被一只陌生的雌兽收养,而这只雌兽很可能是一只失去孩子的母兽。猴子观察家往往把收养小猴的母猴称为“阿姨”。在大多数情况下,我们无法证明它真的是小猴的阿姨还是其他亲属。如果猴子观察家有一点基因常识的话,他们就不会如此漫不经心地使用像阿姨之类这样重要的称呼了。收养幼兽的行为尽管感人至深,但在大多数情况下我们也许应该把它视为一条固有准则的失灵。这是因为这只慷慨收养孤儿的母兽并不给自己的基因带来任何好处。它在浪费时间和精力,而这些时间和精力本来是可以花在它自己的亲属身上,尤其是它自己未来的儿女身上的。这种错误大概比较罕见,因此自然选择也认为不必“操心”去修订一下这条准则,使母性具有更大的选择能力。再说,这种收养行为在大多数情况下并不常见,孤儿往往因得不到照顾而死去。

    有一个有关这种错误的极端例子,也许你可能认为与其把它视为违反常情的例子,倒不如把它视为否定自私基因理论的证据。有人看见过一只失去孩子的母猴偷走另外一只母猴的孩子,并抚养它。在我看来,这是双重的错误,因为收养小猴的母猴不但浪费自己的时间,它也使一只与之竞争的母猴得以卸掉抚养孩子的重担,从而能更快地生育另一只小猴。我认为,这个极端的例子值得我们深入探究。我们需要知道这样的情况具有多大的普遍性,收养小猴的母猴和小猴之间的平均亲缘关系指数是多少,这个小猴的亲生母亲的态度怎样——它的孩子被收养毕竟对它有好处,母猴是不是故意瞒哄憨直的年轻母猴,使之乐于抚养它的孩子。(也有人认为收养或诱拐小猴的母猴可以从中获得可贵的抚养小孩的经验。)

    另外一个蓄意背离母性的例子,是由布谷鸟及其他“寄孵鸟”(broodparasites)——在其他鸟窝生蛋的鸟——提供的。布谷鸟利用鸟类因亲代本能而遵守的一条准则:“对坐在你窝里的任何小鸟以礼相待。”且莫说布谷鸟,这条准则在一般情况下是能够产生其预期效果的,即把利他行为的受益者局限在近亲的范围内。这是因为鸟窝事实上都是孤立的,彼此之间总有一段距离,几乎可以肯定在你自己窝里的是你生育的小鸟。成年的鲭鸥(herring gulls)不能识别自己所生的蛋,它会愉快地伏在其他海鸥的蛋上,有些做试验的人甚至以粗糙的土制假蛋代替真蛋,它也分辨不出,照样坐在上面。在自然界中,对蛋的识别对于海鸥而言并不重要,因为蛋不会滚到几码以外的邻居的鸟窝附近。不过,海鸥还是识别得出它所孵的小海鸥。和蛋不一样,小海鸥会外出溜达,弄不好会可能走到黑头鸥的窝附近,常常因此断送了性命。这种情况在第1章里已经述及。

    另一方面,海鸠却能根据蛋上小斑点的式样来识别自己的蛋。在孵蛋时,它们对其他鸟类的蛋绝不肯一视同仁。这大概是由于它们筑巢于平坦的岩石上,蛋滚来滚去有混在一起的危险。有人可能要问,它们孵蛋时为什么要区别对待呢?如果每一只鸟都不计较这是谁家的蛋,只要有蛋就孵,结果还不是一样吗?这其实就是类群选择论者的论点。设想一下,如果一个把照管小鸟作为集体事业的集团得到发展,结果会怎样呢?海鸠平均每次孵一只蛋,这意味着一个集体照管小鸟的集团如果要顺利发展,那么每一只成年的海鸠都必须平均孵一只蛋。假使其中一只弄虚作假,不肯孵它那只蛋,它可以把原来要花在孵蛋上的时间用于生更多的蛋,这种办法的妙处在于,其他比较倾向于利他行为的海鸠自然会代它照管它的蛋。利他行为者会忠实地继续遵循这条准则:“如果在你的鸟窝附近发现其他鸟蛋,把它拖回来并坐在上面。”这样,欺骗基因得以在种群中兴旺起来,而那些助人为乐的代管小鸟的集团最终要解体。

    有人会说:“如果是这样的话,诚实的鸟可以采取报复行动,拒绝这种敲诈行为,坚决每次只孵一只蛋,绝不通融。这样做应该足以挫败骗子的阴谋,因为它们可以看到自己的蛋依然在岩石上,其他的鸟都不肯代劳孵化。它们很快就会接受教训,以后要老实一些。”可惜的是,事情并不是这样。根据我们所做的假设,孵蛋的母鸟并不计较蛋是谁家生的,如果诚实的鸟把这个旨在抵制骗子的计划付诸实施的话,那些无人照管的蛋既可能是骗子的蛋,但同样也可能是它们自己的蛋。在这种情况下,骗子还是合算的,因为它们能生更多的蛋从而使更多的后代存活下来。诚实的海鸠要打败骗子的唯一办法是:认真区分自己的蛋和其他的鸟蛋,只孵自己的蛋。也就是说,不再做一个利他主义者,仅仅照管自己的利益。

    用史密斯的话来说,利他的收养“策略”不是一种进化稳定策略。这种策略不稳定,因为它比不上那种与之匹敌的自私策略。这种自私策略就是生下比其他鸟更多的蛋,然后拒绝孵化它们。但这种自私的策略本身也是不稳定的,因为它所利用的利他策略是不稳定的,因而最终必将消失。对一只海鸠来说,唯一具有进化意义的稳定策略是识别自己的蛋,只孵自己的蛋,事实正是这样。

    经常受到布谷鸟的寄生行为之害的一些鸣禽种类做出了反击。但它们并不是学会了从外形上识别自己的蛋,而是本能地照顾那些带有其物种特殊斑纹的蛋。由于它们不会受到同一物种其他成员的寄生行为之害*,这种行为是行之有效的。但布谷鸟反过来也采取了报复措施,它们所生的蛋在色泽上、体积上和斑纹各方面越来越和寄主物种的相像。这是个欺诈行为的例子,这种行径经常能取得成效。就布谷鸟所生的蛋而言,这种形式进化上的军备竞赛导致了拟态的完美无缺。我们可以假定,这些布谷鸟的蛋和小布谷鸟当中会有一部分被“识破”,但未被识破的那部分毕竟能存活并生下第二代的布谷鸟蛋。因此,那些操纵更有效的欺诈行为的基因在布谷鸟的基因库中兴旺起来。同样,那些目光敏锐,能够识别布谷鸟蛋的拟态中任何细小漏洞的寄主鸟类就能为它们自己的基因库做出最大的贡献。这样,敏锐的、怀疑的目光就得以传给下一代。这是个很好的例子,它说明自然选择是如何提高敏锐的识别力的,在我们这个例子里,另一个物种的成员正竭尽所能,企图蒙蔽识别者,而自然选择促进了针对这种蒙蔽行为的识别力。

    现在让我们回过头来对两种估计进行一次比较:第一种是一只动物对自己与群体其他成员之间的亲缘关系的“估计”;第二种是一位从事实地研究的内行博物学家对这种亲缘关系的估计。伯特伦(B.Bertram)在塞伦盖蒂国家公园[3]研究狮子生态多年。他以自己在狮子生殖习惯方面的知识为基础,对一个典型狮群中个体之间的平均亲缘关系进行了估计。他是根据如下的事实进行估计的:一个典型的狮群由7只成年母狮和2只成年雄狮组成。母狮是狮群中比较稳定的成员,雄狮是流动的,经常由一个狮群转到另一个狮群。这些母狮中约有一半同时产仔并共同抚育出生的幼狮,因此,很难分清哪一只幼狮是哪一只母狮生的。一窝幼狮通常有3只,狮群中的成年雄狮平均分担做父亲的义务。年轻的母狮留在狮群中,代替死去的或出走的老母狮。年轻的雄狮一到青春期就被逐出家门。它们成长后三三两两结成一伙,到处流浪,从一个狮群转到另外一个狮群,不大可能再回老家。

    以这些事实以及其他假设为依据,你可以看到我们有可能算出一个典型狮群中两个个体之间的亲缘关系的平均指数。伯特伦演算的结果表明,任意挑选的一对雄狮的亲缘关系指数是0.22,一对母狮是0.15。换句话说,属同一狮群的雄狮平均比异父或异母兄弟的关系稍为疏远一些,母狮则比第一代堂姐妹接近一些。

    当然,任何一对个体都可能是同胞兄弟,但伯特伦无从知道这一点,狮子自己大概也不会知道。另一方面,伯特伦估计的平均指数,从某种意义上说,狮子是有办法知道的。如果这些指数对一个普通的狮群来说真的具有代表性,那么,任何基因如能使雄狮自然倾向于以近乎对待其异父或异母兄弟的友好方式对待其他雄狮,它就具有积极的生存价值。任何做得过分的基因,即以更适合于对待其同胞兄弟那样的友好方式对待其他雄狮的话,在一般情况下是要吃亏的,正如那些不够友好的,把其他雄狮当作第二代堂兄弟那样对待的雄狮到头来也要吃亏一样。如果狮子确实像伯特伦所讲的那样生活,而且——这一点也同样重要——它们世世代代一直是这样生活的,那么我们可以认为,自然选择将有利于适应典型狮群的平均亲缘关系那种水平的利他行为。我在上面讲过,动物对亲缘关系的估计和内行博物学家的估计到头来是差不多的,我的意思就在于此。*

    我们因此可以得出这样的结论:就利他行为的演化而言,“真正的”亲缘关系的重要性可能还不如动物对亲缘关系做出的力所能及的估计。懂得这个事实就懂得在自然界中,父母之爱为什么比兄弟/姐妹之间的利他行为普遍得多而且真诚得多,也就懂得为什么对动物而言其自身利益甚至比几个兄弟更为重要。简单地说,我的意思是,除了亲缘关系指数以外,我们还要考虑“肯定性”的指数。尽管父母/子女的关系从遗传学的意义上说,并不比兄弟/姐妹的关系来得密切,它的肯定性却大得多。在一般情况下,要肯定谁是你的兄弟就不如肯定谁是你的子女那么容易。至于你自己是谁,那就更容易肯定了。

    我们已经谈论过海鸠之中的骗子,在以后的几章里,我们将要谈到说谎者、骗子和剥削者。在这个世界上,许多个体为了自身的利益总是伺机利用其他个体的亲属选择利他行为,因此,一个生存机器必须考虑谁可以信赖,谁确实是可靠的。如果B确实是我的弟弟,我照顾他时付出的代价就该相当于我照顾自己时付出的代价的一半,或者相当于我照顾我自己的孩子时付出的代价。但我能够像我肯定我的儿子是谁那样去肯定他是我的弟弟吗?我如何知道他是我的弟弟呢?

    如果C是我的同卵孪生兄弟**,那我照顾他时付出的代价就该相当于我照顾自己的任何一个儿女的两倍,事实上,我该把他的生命看作和我自己的生命一样重要。但我能肯定他是我的同卵孪生兄弟吗?当然他有点像我,但很可能我们碰巧有同样的容貌基因。不,我可不愿为他牺牲,因为他的基因有可能全部和我的相同,但我肯定知道我体内的基因全部是我的。因此,对我来说,我比他重要。我是我体内任何一个基因所能肯定的唯一的一个个体。再说,在理论上,一个操纵个体自私行为的基因可以由一个操纵个体利他行为,援救至少一个同卵孪生兄弟或两个儿女、兄弟,或至少4个孙子孙女等的等位基因代替,但操纵个体自私行为的基因具有一个巨大的优越条件,那就是识别个体的肯定性。与之匹敌的以亲属为对象的利他基因可能会搞错对象,这种错误可能纯粹是偶然的,也可能是由骗子或寄生者蓄意制造的。因此,我们必须把自然界中的个体自私行为视为是不足为奇的,这些自私行为不能单纯用遗传学上的亲缘关系来解释。

    在许多物种中,做母亲的比做父亲的更能识别谁是它们的后代。母亲生下有形的蛋或孩子,它有很好的机会去辨识它自己的基因传给了谁。而可怜的爸爸受骗上当的机会就大得多。因此,父亲不像母亲那样乐于为抚养下一代而操劳,那是很自然的。在第9章《两性战争》里,我们将看到造成这种情况还有其他的原因。同样,外祖母比祖母更能识别谁是它的外孙或外孙女,因此,外祖母比祖母表现出更多的利他行为是合乎情理的。这是因为她能识别她的女儿的儿女。外祖父识别其外孙或外孙女的能力相当于祖母,因为两者都是对其中一代有把握而对另一代没有把握。同样舅舅对外甥或外甥女的利益应比叔叔或伯伯更感关切。在一般情况下,舅舅应该和舅母一样表现出同样程度的利他行为。确实,在不贞行为司空见惯的社会里,舅舅应该比“父亲”表现出更多的利他行为,因为它有更大的理由信赖同这个孩子的亲缘关系。它知道孩子的母亲至少是它的异父或异母姐妹,“合法的”父亲却不明真相。我不知道是否存在任何证据,足以证明我提出的种种臆测。但我希望,这些臆测可以起到抛砖引玉的作用,其他的人可以提供或致力于搜集这方面的证据,特别是社会人类学家或许能够发表一些有趣的议论吧。*

    现在回过头来再谈谈父母的利他行为比兄弟之间的利他行为更普遍这个事实。看来我们从“识别问题”的角度来解释这种现象的确是合理的,但对存在于父母-子女关系本身的根本的不对称性却无法解释。父母爱护子女的程度超过子女爱护父母的程度,尽管双方的遗传关系是对称的,而且亲缘关系的肯定性对双方来说也是一样的。一个理由是父母年龄较大,生活能力较强,事实上处于更有利的地位为其下一代提供帮助。一个婴孩即使愿意侍养其父母,事实上也没有条件这样做。

    在父母-子女关系中还有另一种不对称性,而这种不对称性不适用于兄弟/姐妹的关系。子女永远比父母年轻,这种情况常常,如果不是永远,意味着子女的预期寿命较长。正如我在上面曾强调的那样,预期寿命是个重要的变量。在最最理想的环境里,一只动物在“演算”时应考虑这个变量,以“决定”是否需要表现出利他行为。在儿童的平均预期寿命比父母长的物种里,任何操纵儿童利他行为的基因会处于不利地位,因为这些基因所操纵的利他性自我牺牲行为的受益者都比利他主义者自己的年龄大,更近风烛残年。在另一方面,就方程式中平均寿命这一项而言,操纵父母利他行为的基因则处于相对有利的地位。

    我们有时听到这种说法:亲属选择作为一种理论是无可非议的,但在实际生活中,这样的例子却不多见。只能说持这种批评意见的人对何谓亲属选择一无所知。事实上,诸如保护儿童、父母之爱以及有关的身体器官、乳分泌腺、袋鼠的肚囊等等都是自然界里亲属选择这条原则在起作用的例子。批评家们当然十分清楚父母之爱是普遍存在的现象,但他们不懂得父母之爱和兄弟/姐妹之间的利他行为同样是亲属选择的例子。当他们说自己需要例证的时候,他们所要的不是父母之爱的例证,而是另外的例证。应该承认,这样的例子不是那么普遍的。我也曾提出过发生这种情况的原因。我本来可以把话题转到兄弟/姐妹之间的利他行为上——事实上这种例子并不少,但我不想这样做,因为这可能加深一个错误的概念(我们在上面已经看到,这是威尔逊赞成的概念)——即亲属选择具体地指父母-子女关系以外的亲缘关系。

    这个错误概念之所以形成有其历史根源。父母之爱有利于进化之处显而易见,事实上我们不必等待汉密尔顿指出这一点,自达尔文的时代起,人们就开始理解这个道理。当汉密尔顿证明其他的亲缘关系也具有同样的遗传学上的意义时,他当然要把重点放在这些其他的关系上。特别是以蚂蚁、蜜蜂之类的社会性昆虫为例时。在这些昆虫里,姐妹之间的关系特别重要,我们以后还要谈到这个问题。我甚至听到有些人说,他们以为汉密尔顿的学说仅仅适用于昆虫!

    如果有人不愿意承认父母之爱是亲属选择行为的一个活生生的例子,那就该让他提出一个广义的自然选择学说,这个学说在承认存在父母的利他行为的同时却不承认存在旁系亲属之间的利他行为。我想他是提不出这样的学说的。

    第7章 计划生育

    有人主张把父母的关怀同其他类型的亲属选择利他行为区别开来,这种主张的道理是不难理解的。父母的关怀看起来好像是繁殖的组成部分,而诸如对待侄子的利他行为却并非如此。我认为这里确实隐藏着一种重要的区别,不过人们把这种区别弄错了。他们将繁殖和父母的关怀归在一起,而把其他种类的利他行为另外归在一起。但我却希望这样区分:一类为生育新的个体,另一类为抚养现存的个体。我把这两种活动分别称为生育幼儿和照料幼儿。个体生存机器必须做两类完全不同的决定,即抚养的决定和生育的决定。“决定”这个词用在这里是指无意识的策略上的行动。思考是否做抚养的决定的形式是:“有一个幼儿,它同我在亲缘关系上的接近程度如此这般,如果我不喂养它,它死亡的机会如何如何,那么我要不要喂养它?”另一方面,是否做生育的决定的思考形式是这样的:“我要不要采取一切必要的步骤以便生育一个新的个体?我要不要繁殖?”在一定程度上,抚养和生育必然为占用某个个体的时间和其他资源而相互竞争,这个个体可能不得不做出选择:“我抚养这个幼儿好呢,还是再生一个好?”

    抚养和生育的各种混合策略,如能适应物种生态上的具体情况,在进化上是能够稳定的。单纯的抚养策略在进化上不可能稳定。如果所有个体都付出全部精力去抚养现有的幼儿,以至于连一个新的个体也不生产,这样的种群很快就会受到精于生育的突变个体的入侵。抚养只有作为混合策略的一部分,才能取得进化上的稳定——至少需要进行某种数量的生育活动。

    我们非常熟悉的物种——哺乳动物和鸟类——往往都是抚养的能手。伴随着生育幼儿的决定的通常是抚养它的决定。正是因为生育同抚养这两种活动实际上时常相继发生,因此人们把这两件事情混为一谈。但从自私基因的观点来看,生存机器抚养的幼儿是兄弟或者是儿子,原则上是没有区别的。这一点我们在上面已提到过。两个幼儿同你的亲缘关系是相等的,如果你必须在两个要喂养的幼儿之间做出选择的话,没有任何遗传上的理由非要你选择自己的儿子不可。但另一方面,根据定义,你不可能生育自己的弟弟,你只能在其他人生出他之后抚养他。关于个体生存机器对其他已经存在的个体要不要采取利他行为,怎样才能做出理想的决定,我们在前面一章中已有论述。我们在本章要探讨一下,个体生存机器对于要不要生育新个体应如何做出决定。

    我在第1章中提到过关于类群选择的争论,这种激烈争论主要是围绕着这个问题进行的。这是由于温-爱德华兹根据“种群调节”(population regulation)理论提出其类群选择观点,而他又是这个类群选择论的主要鼓吹者。*他认为,个体动物为了群体的整体利益,有意降低其出生率。

    这是一个非常具有吸引力的假设,因为它十分符合人类个体应该实践的行动。人类的小孩太多了。一国人口的多少取决于4种情况:出生、死亡、入境移民和出境移民。如果我们把世界人口作为一个整体,那就无所谓入境移民和出境移民,只有出生和死亡。只要每对夫妻平均有两个以上的小孩存活下来进行繁殖,以后新生婴儿的数目就会以持续的加速度直线上升。每一代人口不是按固定的数量上升,而更可能是在不断增长的人口已达到的基础上按一个固定比率递增。由于人口本身也在增大,因此人口的递增量也越来越大。如果让这样的增长速度继续下去而不加以制止的话,人口的增加会达到天文数字,速度之快令人惊讶。

    顺便提一下,人口的增长不但取决于人们有多少小孩,也取决于何时生小孩,甚至关心人口问题的人有时也认识不到这一点。因为每代人口往往按某种比率增长,因此,如果你把一代和一代之间的间距拉长,人口每年的增长率就低些。我们完全可以把写在横幅上的口号“只生两个”这几个字改为“以30岁为起点”!但无论如何,人口高速增长会招致严重的问题。

    我们大家也许都已看到过这样计算出来的触目惊心的数字,这些数字能够清楚地说明问题。举例说,拉丁美洲目前的人口大约有3亿,而且其中已有许多人营养不良。但如果人口仍按目前的速度继续增长,要不了500年的时间,人口增长的结果就会出现这样一种情况:人们站着挤在一起,可以形成一条遮盖该大陆全部地区的由人体构成的地毯。即使我们假定他们都瘦骨嶙峋——一个并非不真实的假定——情况依然如此。从现在算起,在1000年之后,他们要立在他人的肩膀上,其高度要超出100万人。待2000年之后,这座由人堆起的山将会以光速向上伸展,达到已知宇宙的边缘。

    无疑你会注意到,这是一种根据假设计算出来的数字!事实上,由于某些非常实际的原因,这种情况绝对不会发生。饥荒、瘟疫和战争,或者,如果我们幸运的话,还有计划生育,这些就是其中的一些原因。寄望农业科学的进展——“绿色革命”之类,是无济于事的。增加粮食生产可以暂时使问题缓和一下,但按照数学上的计算,肯定不可能成为长远之计。实际上,和已使危机加剧的医药上的进展一样,粮食增产很可能由于加快人口膨胀的速度,而使这一问题更趋恶化。如果不用火箭以每秒运载几百万人的速度向宇宙空间大规模移民,不加控制的出生率必然导致死亡率的可怕上升,这是一个简单的逻辑事实。就是这样一个简单的事实,那些禁止其追随者使用有效避孕方法的领导人竟然不理解,实在令人难以置信。他们宁愿采用“自然的”方法限制人口,而他们必将见证这种自然的方法:饥饿。

    这种从长远观点计算得出的结果所引起的不安,当然是出于对我们整个物种未来福利的关心。人类(其中有些人)具有自觉的预见能力,能够预见到人口过剩所带来的灾难性后果。生存机器一般为自私的基因所操纵,完全可以肯定,自私的基因是不能够预见未来的,也不可能把整个物种的福利放在心上,这就是本书的基本假定。而温-爱德华兹也就是在这一点上同正统的进化论理论家们分道扬镳的。他认为,使真正的利他性生育控制行为形成的方式是存在的。

    人们对很大一部分事实是认识一致的,不存在分歧,但在温-爱德华兹的著作中,或在阿德里普及持温-爱德华兹的观点的文章中,这一点都没有得到强调。一个明显的事实是,野生动物的数目并不以天文数字的速度增长,尽管在理论上是可以达到这种速度的。有时野生动物的数目相当稳定,出生率和死亡率大体相当。在许多情况下,它们的数目波动很大,旅鼠(lemmings)就是一个很好的例子,它们时而大量激增,时而濒于灭绝。有时波动的结果是种群的彻底灭绝,至少在局部地区是如此。以加拿大山猫为例,其数目的摇摆波动似乎是有节奏的,这从赫德森海湾公司连续几年出售的皮毛数量就可看得出。有一点可以肯定——野生动物的数目是不会无限制地持续增长的。

    野生动物几乎永远不会因衰老而死亡:远远等不到它们老死,饥饿、疾病或者捕食者都可以使它们丧生。直到前不久人类的情况也是如此。大部分动物在幼年时期就死亡,还有许多尚在卵子阶段就结束了生命。饥饿以及其他死亡因素是野生动物不可能无限制增长的根本原因,但正如我们所看到的,我们的物种没有什么理由一定要沦至这样的地步。只要动物能调节其出生率,就永远不会发生饥荒。温-爱德华兹就认为,动物正是这样做的。但即便在这一点上,学界存在的分歧可能没有像你在读他的书时想象的那样大。拥护自私基因理论的人会欣然同意:动物的确会调节自己的出生率。任何具体物种的窝卵数或胎仔数都相当固定:任何动物都不会无限制地生育后代。分歧不在于出生率是否得到调节,而在于怎么得到调节:计划生育是通过什么样的自然选择过程形成的呢?概括地说,分歧在于:动物控制生育是利他性的,为了群体的整体利益而控制生育,还是自私性的,为了进行繁殖的个体的利益而控制生育?我将对这两种理论逐一进行论述。

    温-爱德华兹认为,个体为了群体的整体利益而限制自己生育小孩的数量。他承认,正常的自然选择不大可能使这种利他主义行为得到进化:对低于平均数的生殖率的自然选择,从表面上看,是一种自相矛盾的说法。因此,像我们在第1章所见到的那样,他寄望于类群选择的理论。根据他的说法,凡其个体成员能约束自己出生率的群体,较之其个体成员繁殖迅速以致危及食物供应的群体,前者灭绝的可能性要小些。因此,世界就会为其个体成员能约束自己出生率的群体所占据。温-爱德华兹所说的自我约束行为大体上就相等于生育控制,但他讲得更加具体,事实上他提出了一个极为重要的概念,认为整个社会生活就是一种人口调节的机制。举例说,许多动物物种的群居生活具有两个主要的特征,即领域性(territoriality)和优势序位,我们在第5章已提到过。

    许多动物显然把很多时间和精力花在“保卫”工作上,它们致力于“保卫”博物学家称之为领地的一块地域。这种现象在动物界十分普遍,不但鸟类、哺乳动物和鱼类有这种行为,而且昆虫类,甚至海葵也是如此。这块领地可能是林间的一大片地方,它主要是进行繁殖的一对动物觅食的天然场地,知更雀就是这样。另一种情况可以以鲭鸥为例,它的地盘可能是一小块没有食物的地方,但中间却有一个窝。温-爱德华兹认为,为领地进行搏斗的动物是为了争夺象征性的目的物,而不是为了争抢像食物这样的实物。在许多情况下,雌性动物因雄性动物不拥有一块领地而拒绝同其交配。有时,雌性动物由于其配偶被击败,领地被占领,而很快就委身于胜利者,这些情况的确时常会发生。甚至在明显是忠诚的单配物种中,雌性动物委身的可能是雄性动物的领地,而不是雄性动物本身。

    如果种群的成员过多,有些个体得不到领地,它们就不能进行繁殖。因此,按照温-爱德华兹的观点,赢得一块领地就像是赢得了一张繁殖的证书或许可证。由于能够得到的领地数量有限,就好像颁发的繁殖许可证有限一样。个体可能为取得这些许可证而进行搏斗,但整个种群所能生育的幼儿总数受到所能得到的领地的数量的限制。有时,一些个体初看上去好像表现出自我约束力,例如红松鸡就是如此,因为那些不能赢得领地的个体不仅不繁殖,而且似乎放弃斗争,不想再去赢得领地。它们好像都接受这样的比赛规则:要是竞争季节结束时你还没有得到一张进行生育的正式许可证,你就要自觉地克制生育,在繁殖季节不去惊扰那些幸运的个体,以便让它们能够为物种传宗接代。

    温-爱德华兹也是以类似的方式阐明优势序位形成的过程。在许多动物群体中,尤其是豢养的动物,但有时也包括野生动物,个体能记住对方的特征,它们也知道在搏斗中自己能够击败谁,以及通常谁能够打败它们。我们在第5章中曾讲到,它们“知道”哪些个体大概能击败它们,因此遇到这些个体时往往不战而降。结果,博物学家就能够把优势序位或“啄食等级”(peck order,因最初用以描述母鸡的情况而得名)形象地描绘出来——在这种等级分明的社会里,每一个个体都清楚自己的地位,因此没有超越自己身份的想法。当然,有时也发生真正的全力以赴的搏斗,而且有时有些个体能够赢得升级,取得超过其顶头上司的地位。但正如我们在第5章中所讲的那样,总的说来,等级低的个体自动让步的后果是,真正持久的搏斗很少发生,重伤情况也很少见。

    许多以某种模糊的类群选择观点来看问题的人,认为这是件“好事”温-爱德华兹的解释就更加大胆:比起等级低的个体,等级高的个体有更多的机会去繁殖,这种情况不是由于它们为雌性个体所偏爱,就是因为它们以暴力阻止等级低的雄性个体接近雌性个体。温-爱德华兹认为社会地位高是表示有权繁殖的另一种票证。因此,个体为社会地位而奋斗,而不是直接去争夺雌性个体,如果最终取得的社会等级不高,它们就接受自己无权生育这个事实。凡直接涉及雌性个体时,它们总是自我克制,但这些个体能不时地试图赢得较高的社会地位,因此可以说是间接地争夺雌性个体。但和涉及领地的行为一样,“自觉接受”这条规定,即只有地位高的雄性个体才能生育,根据温-爱德华兹的观点,其带来的结果是,种群的成员数字不会增长太快。种群不会先是生育了过多的后代,然后在吃过苦头以后才发现这样做是错误的。它们鼓励正式的竞赛,让其成员去争夺地位和领地,以此作为限制种群规模的手段,以便把种群的规模保持在略低于饥饿本身实际造成死亡的水平之下。

    炫耀性行为(epideictic behaviour)也许是温-爱德华兹提出的最令人惊讶的观点,炫耀性这个词是他自己杜撰的。许多动物的群居生活占据了它们的很多时间,它们集结成群,在陆地、空中或水里活动。自然选择为什么会有利于这种集体生活,人们对此给出了各种理由,而这些理由或多或少都属于常识范围。我在第10章会谈到其中的一些。温-爱德华兹的观点却迥然不同。他认为大批的欧椋鸟在晚间集聚,或大群的蠓虫在门柱周围飞舞时,它们是在对自己的种群进行“人口”普查。因为他提出的观点是,个体为了群体的整体利益而约束自己的出生率,即当动物个体的密度高时就少生育一些,所以它们理所当然地应该有某种方法去估计动物个体的密度。恒温器需要有温度计作为其机械装置的一个组成部分,上述的情况也正是如此。在温-爱德华兹看来,炫耀性行为就是经过周密安排的群体聚集,以便对动物的数量做出估计。他并不认为动物对其自身数量的估计是一种有意识的行为,但他认为这是一种把个体对于其种群的个体密度的直觉同它们的繁殖系统联系起来的神经或内分泌自动机制。

    我对温-爱德华兹理论的介绍尽管只有三言两语,但尽力做到公正。如果我做到了这一点,现在你应该感到心悦诚服,这一理论表面看来至少是言之成理的。但你以犹疑的口吻说,尽管温-爱德华兹的理论听起来好像很有道理,它的依据最好再充分一些,否则……你所持的这种怀疑态度,是阅读了本书前面几章的结果。遗憾的是,依据并不充分。构成这一理论的大量例子既能用他的方式去解释,但也完全可以以更加正统的“自私的基因”规律加以阐明。

    虽然拉克(David Lack)从未用过“自私的基因”这一名称,但他却是计划生育的自私基因理论的主要创始人,是一位伟大的生态学家。他曾对野生鸟类窝卵数进行过专门研究,但他的学说和结论却具有普遍适用的价值。每一物种的鸟往往都有典型的窝卵数。例如,塘鹅和海鸠每次孵1只卵,东亚雨燕每次孵3只,而大山雀每次孵6只或更多。每次孵卵数并非一成不变:有些东亚雨燕每次只生2只蛋,大山雀也可能生12只。我们有理由设想,雌鸟产蛋孵卵的数目像其他特性一样,至少是部分受遗传的控制,这就是说,可能存在使雌鸟产2只蛋的基因,产3只的与之竞争的等位基因,还有产4只的等位基因,等等,尽管实际情况可能并不如此简单。现在,自私基因的理论要求我们去探究,这些基因中究竟哪一种会在基因库中越来越多。表面上看,使雌鸟产4只蛋的基因毫无疑问会胜过产3只或2只的基因。然而稍加思索就会发现,“越多越好”的论点绝非事实。以此类推的结果就会是,5只比4只好,10只更加好,100只还要好,数量无限最好。换句话说,这样类推,逻辑上就要陷入荒谬。显然,大量生蛋不仅有所得,也有所失。增加生育必然要以抚养欠佳为代价。拉克的基本论点是,任何一定的物种在任何一定的环境条件下,每窝肯定都有其最适度的孵卵数。他同温-爱德华兹的分歧就在于他如何回答这一问题:“从谁的观点来说是最适度的?”温-爱德华兹认为,这种重要的最适度也是对群体作为一个整体而言的最适度,也就是一切个体应力图实现的最适度。而拉克却认为,每一自私个体对每窝孵卵数的抉择以其能最大限度地抚养的数量为准。如果东亚雨燕每窝最适度的孵卵数是3只的话,照拉克的观点来看,意思就是,凡是试图生育4个子女的个体,较之更加谨慎、只试图生育3个子女的竞争对手,其成年子女可能反而更少。这种情况很明显是由于4个幼儿平均得到的食物太少,以致很少能够活到成年。最初对4只蛋的卵黄配给,以及孵化后食物的配给都同样是造成这种情况的原因。因此,拉克认为,个体之所以调节其窝卵数,绝非出自利他性的动机。它们不会为了避免过多地消耗群体的资源而实行节制生育。它们节制生育是为了最大限度地增加它们现有子女的存活数,它们的目标同我们提倡节制生育的本来目标恰好背道而驰。

    育养雏鸟是一件代价高昂的事情。雌鸟在孕育蛋的过程中必须投入大量的食物和精力。为了保存它生下的蛋,它需要付出大量的劳动去筑巢,这也可能是在其配偶的协助下完成的。雌鸟要花几个星期的工夫耐心地去孵化这些蛋。雏鸟出壳后,雌鸟就要累死累活地为它们找食物,几乎得不到喘息的时间。我们已经知道,雌性大山雀在白天平均每30秒就要往鸟巢衔一次食物。哺乳动物,如我们人类本身,进行的方式稍有不同,但繁殖作为一件代价高昂的事情——对母亲来说尤其如此——其基本概念是相同的。显然,如果母亲将有限的食物和精力资源分给太多的子女,结果育成的子女反而更少,倒不如一开始就谨慎一些不要贪多为好。她必须在生育和抚养之间进行合理的平衡。每个雌性个体或一对配偶所能搜集到的食物和其他资源的总量,是决定它们能够抚养多少子女的限制性因素。按照拉克的理论,自然选择对窝卵数(胎仔数等)进行调节,以便最大限度地利用这些有限的资源。

    生育太多子女的个体要受到惩罚,不是由于整个种群要走向灭绝,而是仅仅由于它们自己的子女能存活下来的越来越少。使之生育太多子女的基因根本不会大量地传递给下一代,因为带有这种基因的幼儿极少能活到成年。对现代文明人而言,家庭规模不再受限于父母所能够提供的有限资源。如果一对夫妻生育了过多子女,超出了其抚养能力,国家,即其他人类成员就会介入,使多出的子女得以健康成长。事实上,一对夫妻即便不具备充足的物质资源,也无法阻止其生育、抚养女性身体极限所能允许的最大子女数量。但是福利国家乃是非同寻常之物。在大自然中,生育了超出其抚养能力的子女的父母不会拥有更多的孙辈,它们的基因不会传递给未来的后代。这里不需要对生育率的利他主义做出限制限制,因为大自然里没有福利国家。任何基因过于放纵都会立刻受到惩罚:携带其基因的后代因饥饿而死。既然我们人类不想继续这种旧时的自私之道,让子女过多的家庭因饥饿而死,于是我们不再把家庭作为经济自足的单位,而代之以国家。但是子女获得抚养保障的权利不应被滥用。

    避孕有时被谴责为“非自然的”。确实如此,它非常“非自然”。可问题是:福利国家也是“非自然的”。我想大多数人都认为福利国家是非常令人向往的。但是你不可能拥有一个非自然的福利国家,除非你也拥有非自然的生育控制,否则最终结果就会比自然状态中的更加悲惨。福利国家也许是动物世界里已知的最伟大的利他主义制度。但是福利制度具有内在的不稳定性,因为它容易被自私的人利用,甚至滥用。拥有超出其抚养能力的子女数量的个体大多数是出于愚昧无知才这么做的,而不能斥之为恶意滥用。在我看来,更应该受到质疑的是那些刻意鼓励这种行径的强大的制度和领导人。

    现在再来讲一讲野生动物。拉克关于窝卵数的论点可以推而广之,用于温-爱德华兹所举的其他例子:领地行为、统治集团等等。我们以他和几个同事对红松鸡进行的研究为例来说明。这种鸟食用石楠属植物,它们把石楠丛生的荒原分成一块块领地,而这些领地显然能为其主人提供超过实际需要量的食物。在发情期的早期,它们就开始为争领地而搏斗,但不久,失败者似乎就已认输,不再进行搏斗了。它们变成了流浪者,永远得不到一块领地,在发情期结束时,它们大部分都要饿死。得到繁殖机会的只有拥有领地的动物。如果一个拥有领地的动物被射杀,它的位置很快就会为先前的一个流浪者所填补,新来的主人就会进行繁殖。这一事实说明,不拥有领地的动物生理上是有繁殖能力的。我们已经看到,温-爱德华兹对这种涉及领地的极端行为的解释是,这些流浪者“承认”自己失败,不能得到繁殖的证明书或许可证,它们也就不想再繁殖。

    表面上看,用自私基因的理论似乎很难解释这个例子。这些流浪者为什么不一而再,再而三地想方设法把领地上的占有者撵走,直到它们筋疲力尽为止呢?毕竟它们这样做不会有任何损失。但且慢,也许它们的确会有所失。我们已经看到,领地的占有者一旦死亡,流浪者就有取而代之的机会,从而也就有了繁殖的机会。如果流浪者用这样的方式继承一块领地,比用搏斗的方式取得这块领地的可能性还要大,那么,作为自私的个体,它宁愿等待,以期某一个个体死亡,而不愿在无益的搏斗中浪费哪怕是一点点精力。以温-爱德华兹的观点来说,为了群体的福利,流浪者的任务就是充当替补,在舞台两侧等待,随时准备接替在群体繁殖舞台上死亡的领地占有者的位置。现在我们可以看到,对纯粹的自私个体来说,这种办法也许是它们的最佳策略。就像我们在第4章中所说的那样,我们可以把动物看作赌徒。对一个赌徒来说,有时最好的策略不是穷凶极恶地主动出击,而是坐等良机。

    同样,其他凡是动物显示出逆来顺受地“接受”不繁殖地位的例子,都可以毫无障碍地用自私基因的理论加以解释。而总的解释模式却永远相同:个体的最好赌注是,暂时自我克制,期望更好的时机来临。海豹不去惊动那些“妻妾”占有者的美梦,并非考虑到群体的利益,而是在等待时机,期待着更加适宜的时刻,即使这个时刻永远也不会到来,最终落得无后。在这场赌博中成为赢家的可能性本来还是有的,尽管事后我们知道,对这只海豹而言,这并非是一场成功的赌博。在数以百万计的旅鼠潮水般地逃离旅鼠泛滥的中心地带时,它们的目的不是为了减少那一地区旅鼠的密度!它们是在寻求一个不太拥挤的安身之处,每只自私的旅鼠都是如此。如果它们当中哪一只可能因找不到这样一个安身之处而死去,这是一个事后才可以看到的事实。它改变不了这样一种可能性——留下不走甚至要冒更大的风险。

    大量文献充分证明,过分拥挤有时会降低出生率。有时这种现象被认为是温-爱德华兹理论的依据,但情况完全不是这样。这种现象不仅符合温-爱德华兹的理论,而且和自私基因的理论也完全一致。例如,在一次实验中,研究人员把老鼠放在一个露天的围场里,同时放进许多食物,让它们自由地繁殖。鼠群的数量增长到某一水平,然后就稳定下来。这种稳定原来是由于老鼠太多而使雌鼠生育能力减退:它们的幼鼠少了。这类结果时常被报道。人们常把造成这种现象的直接原因称为“压力”(stress),尽管起这样一个名称对解释这种现象并无助益。总之,不论其直接原因可能是什么,我们还是需要深究其根本的或进化上的原因。鼠群生活在过分拥挤的环境内,为什么自然选择有利于降低自己产仔率的雌鼠?

    温-爱德华兹的回答清楚明了。在群体中,凡其中的雌性个体能估量自己群体的个体数量并且调节其产仔率,以避免食物供应的负担过重,那么,类群选择便有利于这样的群体。在上述那次实验的条件下,碰巧绝不会出现食物缺乏的情况,但我们不能认为老鼠能够认识到这种情况。它们的程序编制就是为了适应野外生活的,而在自然条件下,过分拥挤可能就是一种将要发生饥荒的可靠预兆。

    自私基因的理论又是怎么解释的呢?几乎完全相同,但仍有一个非常重要的区别。你可能还记得,按照拉克的理论,动物往往从其自私的观点出发繁殖最适量的幼仔。假如它们生育得太少或太多,它们最后抚养的幼仔,会比它们应该生育的最适量来得少。“最适量”在这个物种过分拥挤的年份中可能是个较小的数目,而在这种动物变得稀少的年份中可能是个较大的数目。我们都一致认为,动物的数量过剩可能预示着饥荒。显而易见,如果有可靠的迹象显示出一场饥荒就要临头,那么,降低其出生率是符合发现这些迹象的雌性动物的自私利益的。凡是那些不以这种方式根据预兆相应行事的对手,即使它们实际生育的幼仔比较多,最终存活下来的还是比较少。因此,我们最终得出的结论几乎同温-爱德华兹的完全一致,但我们却是通过一种完全不同的进化上的推理得出这一结论的。

    自私基因的理论甚至也能够解释清楚“炫耀性展示”。你应该还记得温-爱德华兹曾做这样的假设,一些动物故意成群地聚集在一起,以便为对所有的个体进行“人口普查”提供方便,并相应地调节其出生率。没有任何证据证明任何这样的聚集事实上是炫耀性的,但我们可以假定找到了这类证据。这会不会使自私基因的理论处于窘境?丝毫不会。

    欧椋鸟大批群栖在一起。不妨这样假定,它们在冬季数量过剩,来年春季繁殖能力就会降低;而且,欧椋鸟倾听相互的鸣叫声也是导致其降低生殖能力的直接原因。这种情况可以用这样的实验加以证明。给一些欧椋鸟个体分别放送两种录音,一种再现了欧椋鸟稠密聚集的栖息地且鸣叫声非常洪亮,另一种再现了欧椋鸟不太稠密的栖息地且鸣叫声比较小。两相比较,前面一种欧椋鸟的产蛋量要少些。这说明,欧椋鸟的鸣叫声构成一种炫耀性展示。自私基因的理论对这种现象的解释,同它对于老鼠的例子的解释几无差别。

    而且,我们是以这样的假定作为出发点的,即如果有些基因促使你生育你无法抚养的子女,那么这样的基因会自动受到惩罚,在基因库中的数量会越来越少。一个效率高的卵生动物作为自私的个体,它的任务是预见在即将来临的繁殖季节里每窝的最适量是多少。你可能还记得我们在第4章中使用的“预见”这个词所具有的特殊含义。那么雌鸟又是如何预见它每窝的最适量的呢?哪些变量会影响它的预见?许多物种做出的预见也可能是固定的,年复一年地从不变化。因此塘鹅平均每窝的最适量是1只蛋,但在鱼儿特别多的年月,一个个体的真正最适量也许会暂时提高到两只蛋,这种可能性是存在的,如果塘鹅无法事先知道某一年是否将是一个丰收年的话,我们就不能指望雌塘鹅甘冒风险,生两只蛋而浪费它们的资源,因为这有可能损害到它们在一般年景中正常的繁殖成果。

    一般来说,可能还有其他物种——欧椋鸟或许就是其中之一——能在冬季预言某种具体食物资源在来年春天是否会获得丰收。农村的庄稼人有许多古老的谚语,例如说冬青果的丰产可能就是来年春季气候好的吉兆。不管这些说法有没有正确的地方,从逻辑上说预兆是可能存在的,一个好的预言者从理论上讲可以据此年复一年地按照其自身的利益调节其每窝的产蛋量。冬青果可能是可靠的预兆,也可能不是,但像在老鼠例子中的情况一样,动物个体的密度看来很可能是一个正确的预报信号。一般来说,雌欧椋鸟知道它在来年春季终于要喂养自己的雏鸟时,将要和同一物种的对手竞争食物。如果它能够在冬季以某种方式估计出自己物种在当地的密度的话,它就具备了有力的手段,能够预计明年春天为雏鸟搜集食物的困难程度。假如它发现冬天的个体密度特别高的话,出于自私的观点,它很可能采取审慎的策略,生的蛋会相对减少:它对自己的每窝最适量的估计值会随之降低。

    如果动物个体真的会根据对个体密度的估计而降低其窝卵数,那么,每一个自私个体都会立即向对手装出个体密度很高的样子,不管事实是不是这样,这样做对每一个自私的个体都是有好处的。如果欧椋鸟是根据冬天鸟群栖息地声音的大小来判断个体密度的话,每只鸟会尽可能地大声鸣叫,以便听起来像是两只鸟而不是一只鸟在鸣叫,这样做对它们是有利的。一只动物同时装扮成几只动物的做法,克雷布斯在另一个场合提到过,并把这种现象称作“好动作效果”(Beau Geste Effect),这是一本小说的书名,书中讲到法国外籍军团的一支部队曾采用过类似的战术。在我们所举的例子中,这种方法用来诱使周围的欧椋鸟降低它们的窝卵数,降低到比实际的最适量还要少。如果你是一只欧椋鸟而且成功地做到这一点,那是符合你自私的利益的,因为你使不含有你的基因的个体减少了。因此,我的结论是,温-爱德华兹有关炫耀性行为的看法实际上也许是一个很正确的看法:除了理由不对之外,他所讲的始终是正确的。从更广泛的意义上来说,拉克所做的那种类型的假设能够以自私基因的语言,对看上去似乎是支持类群选择理论的任何现象都做出充分有力的解释(如果此类现象出现的话)。

    我们根据本章得出的结论是,亲代个体实行计划生育,为的是使它们的出生率保持在最适度的数值上。他们力图让自己的子女尽可能多地存活,这意味着既不能生育过多,也不能生育过少。让个体生育过多后代的基因难以在基因库中长久存续,因为携带此种基因的后代难以存活到成年。

    对于家庭从成员数量上进行的探讨就讲这些。现在我们开始讲家庭内部的利害冲突。做母亲的对其所有的子女都一视同仁是否总是有利?还是偏爱某个子女更有利?家庭是作为一个单一的合作整体来发挥作用,还是我们不得不面对甚至在家庭内部都存在自私和欺骗这一现实?一个家庭的所有成员是否都为创造相同的最适条件而共同努力?在什么是最适条件这个问题上是否会发生分歧?这些就是我们要在下面一章试图回答的问题。关于配偶之间是否可能有利害冲突这个问题,我们放到第9章去讨论。

    第8章 代际之战

    让我们首先解决上一章结束时提出的第一个问题。做母亲的应该不应该有宠儿?她待子女应该不应该一视同仁,不厚此薄彼?尽管说起来可能使人感到厌烦,但我还是认为有必要再唠叨一下,像往常一样做个声明,做到有言在先,免得产生误会。“宠儿”这个词并不带有主观色彩,“应该”这个词也不带有道义上的要求。我把母亲当作一台生存机器看待,其程序的编制就是为了竭尽所能繁殖存在于体内的基因的拷贝。你我之辈都是人类,知道具有自觉的目的是怎么一回事,因此,我在解释生存机器的行为时使用带有目的性质的语言,作为一种比喻,对我是有其方便之处的。

    我们说母亲有宠儿,这句话实际上是什么意思呢?这意味着她在子女身上投资时,资源的分配往往不均等。母亲能够用来投资的资源包括许多东西,食物是显而易见的一种,还包括为取得食物而消耗的精力,因为必须付出一定的代价才能把食物弄到手。保护子女免受捕食者之害而承担的风险也属资源的一种,她可以“花费”也可以拒绝花费这种资源。此外,料理“家务”以及防止风雨侵袭所消耗的能量和时间,在一些物种中为教养子女而花费的时间,都是宝贵的资源。母亲可以“随意”决定如何在其子女间分配这些资源,或均等,或不均等。

    要设想用一种通货作为亲代用以投资的一切资源的计量单位是困难的。正如人类社会使用货币作为可以随时转换为食物、土地或劳动时间的通货一样,我们需要一种通货来衡量这些资源,即个体生存机器用以在另一个个体,尤其是自己孩子身上投资的资源。某种能量的度量单位,如热量,有其可取之处,一些生态学家已将其用于核算自然界里能量消耗的成本。但这种核算方式是不全面的,因为它不能精确地转换成具有实际意义的通货,即进化的“金本位”——基因生存。1972年,特里弗斯提出“亲代投资”(parental investment)的概念,从而巧妙地解决了这个难题[尽管在阅读他的言简意赅的文章时,我们从字里行间获得的印象是,这个提法与20世纪最伟大的生物学家费希尔爵士在1930年提出的“亲代支出”(parental expenditure)在含义上很相近]。*

    亲代投资的定义是:“亲代对子代个体进行的任何形式的投资,从而增加了该个体生存的机会(因而得以成功繁殖),但以牺牲亲代对子代其他个体进行投资的能力为代价。”特里弗斯提出的亲代投资这个概念的优点在于其计量单位非常接近具有实际意义的单位。一个幼儿消耗母体一定数量的乳汁,其数量不是以热量或品脱来计算的,而是以同一母体所哺育的其他幼儿因此受到的损害为计量单位。比方说,如果一个母体有两个幼儿x和y,x吃掉一品脱母乳,而这一品脱母乳所体现的又是亲代投资中的主要部分,那么其计量单位就是y因没有吃到这一品脱母乳而增加的死亡的可能性。亲代投资是以缩短其他幼儿预期寿命的程度为其计量单位的,包括已出生的或尚未出生的幼儿。

    亲代投资并不是一个尽善尽美的计算方式,因为它过度强调亲代的重要性而相对地贬低其他的遗传关系。最理想的应该是利他行为投资(altruism investment)这个概念化的计量单位。我们说个体A对个体B进行投资,意思是个体A增加了个体B的生存机会,但以牺牲个体A对包括其自身在内的其他个体的投资能力为代价,而所付出的一切代价均需按适当的亲缘关系指数进行加权计算。这样,在计算一个母体对任何一个幼儿的投资额时,最好能以对其他个体的预期寿命所造成的损害为计量单位,所谓其他个体不仅指这个母体的其他子女,而且指侄子、外甥、侄女、外甥女以及母体自身等等。不过,就许多方面而言,这个方法过于烦琐,不能解决实际问题。而特里弗斯的计算方法还是有很高的实用价值的。

    任何一个母体在其一生中能够对子女(以及其他亲属、她自己等,但为了便于论证,我们在这里仅仅考虑子女)进行的亲代投资是有一定总量的。这个亲代投资总额包括她在一生中所能搜集或制造的食物、她准备承担的一切风险以及她为了儿女的福利所能够耗费的一切能量与精力。一个年轻的雌性个体在其成年后应如何利用她的生命资源进行投资?什么样的投资策略才是她应遵循的上策?拉克的理论已经告诉我们,她不应把资源分摊给太多的子女,致使每个子女得到的份额过分微薄。这样做她会失去太多基因:她不会有足够的孙子孙女。另一方面,她也不应把资源集中用在少数几个被宠坏了的儿女身上。她事实上可以确保有一定数量的孙子孙女,但她的一些对手由于对最适量的子女进行投资,结果养育出更多的孙子孙女。有关平均主义的投资策略就讲到这里,我们现在感兴趣的是,对一个母亲来说,在对子女进行投资时如果不是一视同仁,是否会有好处,也就是说,她是否应该有所偏爱。

    我们说,母亲对待子女不一视同仁,在遗传学上是毫无根据的。她同每个子女的亲缘关系指数都一样,都是。对她而言,最理想的策略是,她能够抚养多少子女就抚养多少,但要进行平均投资,直至子女自己开始生男育女时为止。但是,正像我们在上面已看到的那样,有些个体与其他个体相比,是更理想的寿险被保险人。一窝幼畜中,个子矮小、发育不良的和同窝其他发育正常的幼畜一样,体内有同等数量的来自母体的基因,但它的预期寿命可要短些。换句话说,如果它要和它的兄弟们一样长寿,它就需要额外的亲代投资。做母亲的可以根据具体情况做出决定,它可能发现,拒绝饲养一个个子矮小、发育不良的幼畜,将其名下应得的一份亲代投资全部分给它的兄弟姐妹反而合算。事实上母亲有时干脆把它丢给其他幼畜作为食料,或自己把它吃掉作为制造奶水的原料,这样也算上策。母猪有时吞食小猪,但它是否专挑小个子的吃,我却不得而知。

    发育不良的小个子牲畜是个特殊的例子。对幼体的年龄如何影响母体的投资倾向,我们可以做出一些更具普遍性的猜测。如果在两个幼儿中母亲只能拯救其中一个,而另一个最终会死去的话,那么它应拯救其中年龄较大的一个。这是因为,如果死亡的是年龄较大的一个而不是另一个年幼的弟弟,那么,它一生付出的亲代投资中较大的那一部分将要付诸东流。也许这样说能更好地说明这个问题:如果它救弟弟,它仍需要耗费一些代价昂贵的资源才能把这个幼儿抚养到哥哥的年龄。

    另一方面,如果这种抉择并不截然涉及生或死的问题,那么对母亲来说,其上策也许是,宁可将赌注压在较年幼的一个孩子身上。我们可以举这样一个例子:母亲因为不知道该把一些食物给小的吃还是给大的吃而感到左右为难。哥哥更有可能凭自己的力量去寻找食物,因此,如果妈妈不喂养它,它不一定会因此死去。另一方面,弟弟因为还很弱小,没有能力自己去找吃的,如果母亲把食物给了哥哥,弟弟饿死的可能性就更大。在这样的情况下,即使母亲宁愿牺牲弟弟,还是可能把食物喂给弟弟,因为哥哥毕竟不太可能会饿死。这正是哺乳动物使幼儿断乳,而不是喂养它们终生的原因。到了一定时候,母亲就停止喂养一个幼儿,而将其资源留给未来的子女,这样做是明智的。有时母亲可能知道它生下的是最后一个幼儿,它会把自己有生之年的全部资源都花费在这个最小的幼儿身上,也许把这个幼儿奶到成年。不过,它应该“权衡一下”,要是把资源花费在孙辈或侄甥之辈身上是否更为合算,因为尽管后者同它的亲缘关系只及子女的一半,但它们从投资中获益的能力可能比它自己这个幼儿大两倍以上。

    在这里似乎应该提一下人们称之为“停经”的令人费解的现象,也就是人类中年妇女的生殖能力突然消失这个现象。在我们未开化的祖先中,这种情况可能比较少见,因为能够活到绝经这个年龄的妇女并不太多。可是,妇女的生理突变与男子生殖力的逐渐消失显然不同,这种不同说明停经现象大概具有某种遗传学上的“目的性”——就是说,停经是一种“适应”。要说清楚这个问题很不容易。乍看之下,我们很可能认为妇女在死亡之前应该不停地生男育女,即使随着年龄的增长,她生下婴儿的存活率会越来越低。至少,她们总应该尽力而为吧?但我们应当记住,她的孙子孙女也是她的后代,尽管亲缘关系只有子女的一半。

    由于各种原因,也许与梅达沃的衰老学说(第3章所讲)有关,处于自然状态的妇女随着年龄的增长而逐渐丧失抚养子女的能力。因此,老年母亲所产幼儿的预期寿命短于青年母亲所产的幼儿。这意味着,如果一个妇女和她的女儿同一天生产,她孙子的预期寿命大概要比她儿子的预期寿命长。妇女到达一定的年龄后,她所生育的每个孩子活到成年的平均机会比同岁的孙子活到成年的平均机会的一半还要小。在这个时候,选择孙子孙女而不选择子女作为投资对象的基因往往会兴旺起来。4个孙子孙女之中只有1个体内有这样的基因,而两个子女之中就有1个体内有它的等位基因。但孙子孙女享有较长的预期寿命,这个有利因素胜过数量上的不利因素,因此,“孙子孙女利他行为”基因在基因库中占了上风。一个妇女如果自己继续生育子女就不能集中精力对孙子孙女进行投资,因此,使母体在中年丧失生殖能力的基因就越来越多。这是因为孙子孙女体内有这些基因,而祖母的利他行为又促进了孙子孙女的生存。

    这可能就是妇女停经现象形成的原因。男性生殖能力之所以不是突然消失而是逐渐衰退的,其原因大概是,父亲对每个儿女的投资额比不上母亲。甚至对一个年迈的男人来说,只要他还能使年轻妇女生育,那么,对子女而不是对孙子孙女进行投资还是合算的。

    迄今为止,我们在本章和上一章里都是从亲代,主要是从母亲的立场来看待一切问题的。我们提出过这样的问题:父母是否应该有宠儿?一般说来,对父亲或母亲而言,最理想的投资策略是什么?不过,在亲代对子代进行投资时,也许每一个幼儿都能对父母施加影响,从而获得额外的照顾。即使父母不“想”在子女之间显得厚此薄彼,难道做子女的就不能先下手为强,攫取更多的东西吗?他们这样做对自己有好处吗?更严格地说,在基因库中,那些促使子女为自私目的而巧取豪夺的基因是否会越来越多,比那些仅仅使子女接受应得份额的等位基因还要多?特里弗斯在1974年一篇题为“亲代与子代间的冲突”(“ParentOffspring Conflict”)的论文里精辟地分析了这个问题。

    一个母亲同其现有的以及尚未出生的子女的亲缘关系都是一样的。我们已经懂得,从纯粹的遗传观点来看,她不应有任何宠儿。如果她事实上有所偏爱,那也是出于因年龄或其他不同条件所造成的预期寿命的差异。就亲缘关系而言,和任何个体一样,做母亲的对其自身的“亲缘指数”是她对其子女中任何一个的密切程度的两倍,在其他条件不变的情况下。这意味着她理应自私地独享其资源的大部分,但其他条件不是不变的。因此,如果她能将其资源的相当一部分花费在子女身上,那将为她的基因带来更大的好处。这是因为子女较她年轻,更需要帮助,因而她们从每个单位投资额中所能获得的好处,必然要比她自己从中获得的好处大。促使对更需要帮助的个体而不是对自身进行投资的基因,能够在基因库中取得优势,即使受益者体内只有这个个体的部分基因。动物表现出亲代利他行为和任何形式的亲属选择行为,其原因就在于此。

    现在让我们以一个幼儿的观点来看一下这个问题。就亲缘关系而言,他同他的兄弟或姐妹之间任何一个的密切程度和他母亲同其子女之间的密切程度完全一样,亲缘关系指数都是。因此,他“希望”他的母亲用其资源的一部分对他的兄弟或姐妹进行投资。从遗传学的角度上看,他和他母亲都希望为他兄弟姐妹的利益出力,而且他们持这种愿望的程度相等。但是我在上面已经讲过,他与自己的关系比与兄弟姐妹中任何一个的关系密切两倍,因此,如果其他条件不变,他会希望母亲在他身上的投资多一些。如果你和你的兄弟同年,又同样能从一品脱母乳中获得相等的好处,那你就“应该”设法夺取一份大于应得份额的母乳,而你的兄弟也应该设法夺取一份大于应得份额的母乳。母猪躺下准备喂奶时,它的一窝小猪尖声呼叫,争先恐后地赶到母猪身旁的情景你一定见过吧。一群小男孩为争夺最后一块糕饼而搏斗的场面你也见过吧。自私贪婪似乎是幼儿行为的特征。

    但问题并不这样简单。如果我和我的弟弟争夺一口食物,而他又比我年轻得多,这口食物对他的好处肯定比对我大,因此把这口食物让给他吃对我的基因来说可能是合算的。哥哥和父母的利他行为可以具有完全相同的基础,前面我已经讲过,两者的亲缘关系指数都是,而且同年长的相比,年纪较轻的个体总是能够更好地利用这种资源。如果我体内有谦让食物的基因,我的弟弟体内有这种基因的可能性是50%。尽管这种基因在我体内的机会比我弟弟大一倍——100%,因为这个基因肯定存在我体内,但我需要这份食物的迫切性可能不到他的一半。一般说来,一个幼儿“应该”攫取大于其应得份额的亲代投资,但必须适可而止。怎样才算适可而止呢?他现存的以及尚未出生的兄弟或姐妹因他攫取食物而蒙受的净损失不能大于他从中所得利益的两倍。

    让我们考虑一下什么时候断乳最适宜这个问题。母亲为了准备生第二胎而打算让正在吃奶的幼儿断乳。另一方面,这个幼儿却不希望这样快就断乳,因为母乳是一种方便的、不费力气的食物来源,而且他还不想为了生活而外出奔波。说得更确切一些,他最终还是想外出谋生的,但只有在他母亲因他走后得以脱身抚养他的弟妹,从而为他的基因带来更大的好处时才这样做。随着年龄的增大,一个幼儿从每一品脱母乳中得到的相对利益越来越小。这是因为他越长越大,一品脱母乳按他的需要而言,其比例相对地越来越小,而且在必要时他也有更大的能力去独立生活。因此,当一个年龄较大的幼儿吃掉本来可以让给一个年龄较小的幼儿的一品脱母乳时,他消耗的亲代投资,相对来说,要大于一个年龄较小的幼儿吃掉这一品脱母乳所消耗的亲代投资。在每个幼儿成长的过程中,这样的时刻必将来到:他的母亲停止喂养他,而把一个新生的幼儿作为更有利的投资对象。即便不是如此,再过一些时候,年龄较大的幼儿也会自动断乳,以便给自己的基因带来最大的好处。这时,一品脱母乳能为可能存在于他弟妹体内的他的基因的拷贝带来的好处,要大于能为事实上存在于他自己体内的基因带来的好处。

    存在于母子之间的这种矛盾不是绝对的,而是相对的。在这个例子里,矛盾只涉及定时的问题。做母亲的打算继续喂养这个幼儿直至为他支出的投资总额达到他“应得”的份额。这个“应得”份额取决于这个幼儿的预期寿命以及已经为他支出的亲代投资额。到这里为止,矛盾尚未产生,同样,幼儿吃奶的日子不宜过长,到了他的尚未出生的弟妹因他继续吃奶而蒙受的损失超过他从中得到的好处的两倍时,他就不应继续吃下去;就这一点而言,母子双方的看法是一致的。但矛盾发生在中间的一段时期,即在母亲眼中,这个幼儿正在取得多于其应得份额的利益,而其弟妹因此蒙受的损失还没有到达两倍于他的利益的时候。

    断乳时间只不过是母子之间引起矛盾的一个例子。我们也可以把这种情况视为一个个体和他所有尚未出生的但受到母亲袒护的弟妹之间的争执。可是,为了争夺亲代投资,更直接的争执可能发生在同代的对手之间,或同巢的伙伴之间。因此,母亲通常总是力图持公平的态度。

    很多鸟类是在鸟窝里哺育幼儿的。雏鸟嗷嗷啾唧,而雌鸟就把小虫或其他食物丢入一张张大嘴里。按理说,雏鸟叫声的大小和它饥饿的程度是成正比的。如果说雌鸟总是先喂叫得最响的雏鸟的话,那么,每只雏鸟早晚都会得到它应得的份额,因为吃饱了的雏鸟是不会再大喊大叫的。这种情况至少在最理想的环境里是会出现的。在这种环境里,大家都循规蹈矩,不弄虚作假。但根据我们提出的自私基因的概念,我们必须估计到个体是会弄虚作假的,是会装出一副饥不可耐的样子的。这种欺骗行为逐步升级,但显然不会得到预期的效果,因为如果所有的雏鸟都大喊大叫,装出快要饿死的模样,这种大喊大叫就要变成一种常规,因而不会达到说谎的效果。不过升级容易降级难,不管哪一只雏鸟带头降低嗓门,它得到的食物就会减少,很可能真的要被饿死。再说,由于种种原因,小鸟也不会漫无止境地提高嗓门大叫。譬如说,过高的喊声要消耗体力,也会引来捕食者。

    我们知道,一窝幼兽中有时会出现一个小个子,它的个子比其他的幼兽小得多。它争夺食物不像其余幼兽那样力量充沛,因而常常饿死。我们已经考虑过在什么条件下母亲让小个子死掉事实上是合算的。如果单凭直觉判断,我们大概总是认为小个子本身是会挣扎到最后一刻的,但这种推断在理论上未必能站得住脚。一旦小个子瘦弱得使其预期寿命缩短到它从同样数量的亲代投资中获得的利益还不到其他幼儿的一半时,它就该体面而心甘情愿地死去。这样,它的基因反而能够获益。就是说,一个基因发出了这样的指令:“喂,如果你个子比你的骨肉兄弟瘦小得多的话,那你不必死捱活撑,干脆死了吧!”这个基因在基因库中将取得成功,因为它在小个子体内活下去的机会本来就很小,而它却有50%的机会存在于得救的每个兄弟姐妹体内。小个子的生命航程中有一个有去无回的临界点。在达到这一临界点之前,它应当争取活下去,但到了临界点之后,它应停止挣扎,宁可让自己被骨肉兄弟或父母吃掉。

    在我们讨论拉克的有关窝卵数的理论时,我没有谈到上面的情况。但如果雌鸟吃不准今年该孵几个卵才是最适量时可以采取下面这个明智的策略。它在孵卵时可以比它事实上“认为”可能是最适宜的数目再多孵一个,这样,如果今年食物收成比原来估计的好,它就额外多抚养一个幼儿,不然的话,它就放弃这个幼儿以减少损失。雌鸟在喂养它的一窝幼儿时总是有意识地按同一次序进行,譬如说,按雏鸟个子的大小依次喂食。这样,它可以让其中一只,也许就是那个小个子,很快就死掉,而不致除了蛋黄或其对等物这第一笔投资之外,在它身上再浪费过多的食物。从雌鸟的观点来看,这说明了小个子现象存在的理由。小个子的生命就是雌鸟打赌的赌注,雌鸟的这种打赌行为在许多鸟类中很普遍,其性质和交易所里那种买现卖期的策略一样。

    我们把动物比作生存机器,它们的行为好像有“目的”地保存它们自己的基因,这样,我们可以谈论亲代与子代之间的矛盾,即两代之间的争斗。这是一种微妙的争斗,双方全力以赴,不受任何清规戒律的约束。幼儿利用一切机会进行欺骗。它会装成比实际更饥饿的样子,也许装得比实际更年幼或面临比实际更大危难的模样。尽管幼儿幼小羸弱,无力欺负其父母,但它却不惜使用一切可以使用的心理战术武器——说谎、哄骗、欺瞒、利用,甚至滥用亲缘关系做出不利于其亲属的行为。另一方面,父母必须对这种欺骗行为保持警觉,尽力避免受骗上当。要做到这点似乎也并不难。雌鸟如果知道它的雏鸟可能装成很饿的样子,它就可以采取定量喂食的策略来对付,即使这只雏鸟继续大叫大喊也不予以理睬。问题是这只雏鸟很可能并未说谎,而是真的饥饿。如果它因为得不到食物而死去,这只雌鸟就要失去它的一些宝贵的基因。野生鸟类只要饿上几个小时就会死掉。

    扎哈维指出,有一种幼儿的讹诈手段特别可怕:它放声大叫,故意把捕食者引来。它在“说”:“狐狸,狐狸,快来吃我!”父母只好用食物塞住它的嘴巴。这样,它就获得了额外的食物,但自己也要冒一定的风险。这种不择手段的战术和劫持班机的人所使用的战术一样。他威胁说,除非付给他赎金,否则就要炸毁飞机,自己也准备同归于尽。我怀疑这种策略是否有利于进化,倒不是因为它过于冷酷无情,而是我认为这种策略到头来会使进行讹诈的雏鸟得不偿失。如果真的引来了捕食者,它的损失可就大了。如果它碰巧是个独生子,那就更不用说了。扎哈维所讲的就是这种情况。不管它母亲在它身上的投资已经有多大规模,它还是应该比它母亲更珍视自己的生命,因为它母亲只有它的一半基因。即使讹诈者不是独生子,而且跟它生活在一起的兄弟姐妹都是脆弱的幼儿,这种策略亦未必有利,因为这个讹诈者在每个受到威胁的兄弟或姐妹身上都有50%的遗传“赌注”,同时在自己身上有100%的赌注。我想,要是这只予取予求的捕食者仅仅惯于把最大的一只雏鸟从巢里抓走,这种策略或许能够取得成效。在这样的情况下,个子较小的雏鸟耍无赖手段,威胁要把捕食者唤来,可能是合算的,因为它自己所冒的风险不会太大。

    初生的布谷鸟如果因运用这种讹诈策略而得到实惠,也许更加合乎情理。大家知道,雌布谷鸟把蛋分别生在几个“收养者”(foster)的鸟巢里,每巢一个,让属于完全不同物种的被蒙在鼓里的养父养母把小布谷鸟养大。因此,一只小布谷鸟在它的同奶兄弟或姐妹身上没有遗传赌注(出于某种阴险的动机,某些种类的小布谷鸟要把它的同奶兄弟或姐妹全部杀掉。我们在下面将要谈到这种情况。现在先让我假定我们讨论的是那些能够和同胞兄弟或姐妹共同生活的布谷鸟)。如果小布谷鸟大声鸣叫,引来了捕食者,它自己可能要送掉性命,但养母的损失更大——也许是失去4个亲生儿女。因此,养母以多于其份额的食物喂它还是合算的,而小布谷鸟在这方面得到的好处可能超过它所冒的风险。

    到了一定的时候,我们应该重新使用正规的基因语言,以免过多地用主观隐喻导致迷惑。这样做是明智的。我们说,小布谷鸟为了“讹诈”其养父母而大喊大叫“捕食者,捕食者,快来吃我和我所有的小兄弟姐妹吧!”这个假设究竟说明什么问题?现在就让我们使用正规的基因语言来进行论述吧。

    使布谷鸟大喊大叫的基因在基因库中数量越来越多,这是因为高声叫喊提高了养父母喂养小布谷鸟的概率。养父母之所以对高声叫喊做出这种积极反应是因为促使对大喊大叫做出反应的基因在收养者物种的基因库中已经扩散开来。这种基因得以扩散的原因是:个别养父母由于没有把额外的食物喂给小布谷鸟而失去越来越多的亲生子女,而情愿把额外食物喂给小布谷鸟的养父母失去亲生子女的概率却小得多,这是因为小布谷鸟的叫声引来了捕食者。尽管不促使布谷鸟大喊大叫的基因被捕食者吃掉的可能性比促使布谷鸟大叫大喊的基因小些,但不高声叫喊的布谷鸟因为得不到额外的食物而受到更大的损失。因此,大喊大叫的基因得以在基因库中扩散开来。

    按照上面这个比较主观的论点,我们可以进行一系列相似的遗传学推理。这种推理表明,尽管我们可以想象这样一个进行讹诈的基因也许能够在布谷鸟基因库中扩散开来,但在一个普通物种的基因库中它却未必能够扩散,至少不会因为它引来了捕食者而扩散开来。当然,在一个普通的物种中,大喊大叫的基因可能由于其他的原因而扩散开来,这一点我们上面已经谈过,而且这些基因有时也会偶然地产生引来捕食者的后果。不过,就这个问题而言,如果能产生任何影响的话,捕食行为的这种选择性影响往往会有减轻这种叫喊声的倾向。在我们假设的布谷鸟例子里,捕食者所产生的实际影响最终使布谷鸟喊得更响。乍听起来,这种说法似乎有点自相矛盾,但事实确是这样。

    没有任何证据表明布谷鸟或其他有类似“寄孵”习惯的鸟类实际上运用了这种讹诈策略,但它们凶狠无情是肯定无疑的。譬如说,有些指蜜鸟(honeyguides)和布谷鸟一样,会在其他物种的鸟巢里生蛋。初生的指蜜鸟生有一副尖锐的钩喙,它出壳时尽管两眼还没有张开,身上光秃无毛,无依无靠的,但它却会把所有的同奶兄弟姐妹都活生生地啄死。因为死掉的兄弟就不会和它争食了!大家熟悉的英国布谷鸟采用的方法稍有不同,但殊途同归。它的孵化期较短,因此它总是比它的同奶兄弟姐妹早出壳,它一出壳便把其他的蛋都摔到巢外,这是一种盲目的、机械的动作,但其毁灭性的后果是毋庸置疑的。它首先蹲到一只蛋的下面,以背部凹下部分托住这只蛋,然后一步一步往巢的边缘后退,同时用两边翅基使这只蛋保持平衡,直至把蛋顶翻到巢外,摔在地上。接着它如法炮制,把剩下的蛋全部处置掉。从此它得以独占鸟巢,它的养父母也可以专心照顾它了。

    在过去的一年中,我所获悉的最值得注意的事实之一是阿尔瓦雷斯(F.Alvarez)、阿里亚斯·德·雷纳(L.Arias de Reyna)和塞古拉(H.Segura)三人从西班牙发出的报告。他们研究那些有可能成为养父母的鸟类——可能受到布谷鸟愚弄的受害者——识破布谷鸟蛋或初生布谷鸟之类的入侵者的能力。在实验过程中,他们曾将布谷鸟的蛋和幼鸟放入喜鹊巢中,为了进行比较,他们同时将其他物种如燕子的蛋和幼鸟放入喜鹊巢中。有一次,他们把一只乳燕放入喜鹊巢里。第二天,他们发现喜鹊巢下面的地上有一只喜鹊蛋。蛋没有跌破,于是他们把它捡起,重新放入巢中再进行观察。他们看到的景象可奇妙呢!那只乳燕的行为简直和布谷鸟一模一样,它把喜鹊蛋丢到巢外。他们再一次把蛋捡起放入巢里,结果完全一样,乳燕又把它摔到外面。和布谷鸟一样,它用两边翅基使喜鹊蛋保持平衡,托在背上,然后向后倒退,把蛋顶上鸟巢边缘,让它翻滚到外面。

    阿尔瓦雷斯和他的合作者并没有试图说明这种令人惊异不止的景象,这可能是明智的。这种行为在燕子的基因库中是如何形成的?它必定同燕子日常生活中的某种东西相一致。乳燕通常是不会出现在喜鹊巢里的。在正常情况下,除自己的巢之外,它们从不光顾其他鸟巢。这种行为是不是体现了一种经过进化而形成的对抗布谷鸟的适应能力?自然选择是不是促进了燕子基因库中的一种反击策略,即促进了以布谷鸟的武器来反击布谷鸟的基因的发展?燕子巢里通常不会出现寄生的布谷鸟,这好像也是事实。也许道理就在这里。根据这个理论,喜鹊蛋在试验时之所以意外地受到同样的待遇也许是因为它们和布谷鸟蛋一样都比燕子蛋大。如果乳燕能够辨别大蛋和正常的燕子蛋,它的母亲也具有这种辨别力自不待言。在这种情况下,为什么把布谷鸟蛋摔掉的不是乳燕的母亲而是体力差得多的乳燕自己呢?有一种理论认为乳燕具有把臭蛋或其他碎屑从鸟巢里清除掉的正常活动能力,但这种理论同样是站不住脚的,因为老燕子能更好地完成这些任务,事实上也正是如此。既然有人曾经目睹孤弱的乳燕熟练地完成这种复杂的摔蛋动作,而同时成年燕子肯定能毫不费力地完成同样的任务,因此这种情况迫使我得出如下的结论:从老燕子的观点来看,乳燕存心不良。

    我认为,真正的答案可能与布谷鸟毫不相干,这是可以推断出的。乳燕是不是这样对待它的同胞兄弟或姐妹的?这种景象确实令人毛骨悚然。由于最先出壳的乳燕必须和它的尚未出生的弟妹争夺亲代投资,因此它一出生就摔掉其他的蛋是合算的。

    拉克关于窝卵数的理论是从亲代的观点来考虑其最适量的。如果我是一只燕子“妈妈”,在我看来,每窝最适量是孵5只蛋,但如果我是一只乳燕,那我就会认为小于5的数目才是最合适的,只要我是其中一个就行!老燕子拥有一定数量的亲代投资,它“希望”在5只乳燕中平均分配。但每一只乳燕都想得到超过的份额。和布谷鸟不一样,它并不想独吞全部投资,因为它和其他的4只乳燕都有亲缘关系。但它确实很想分到多于的份额。它只要能摔掉一只蛋,就能分到。再摔掉一只就能再分到。用基因语言来说,操纵杀兄弟姐妹行为的基因在基因库中是会扩散开来的,因为它有100%的机会存在于表现这种行为的个体内,而存在于它的受害者体内的机会只有50%。

    人们反对这个理论的主要理由是:如果情况果真是这样,那很难使人相信至今竟还没有人见过这种穷凶极恶的行为。我对此没法提出一个令人信服的解释。世界上不同的地方有不同种类的燕子。我们知道,譬如说,西班牙种的燕子在某些方面不同于英国种的燕子,不过人们对西班牙种的燕子还没有像对英国种的燕子那样进行过非常仔细的观察。我认为,这种把兄弟或姐妹置于死地而后快的行为是可能发生的,不过没有受到注意罢了。

    我之所以在这里提出燕子杀兄弟姐妹这种罕见行为的假设,是因为我想说明一个带有普遍意义的问题。就是说,小布谷鸟的残酷行为只不过是一个极端例子,用以说明任何一个鸟巢里都会发生这种情况。同胞兄弟之间的关系比一只小布谷鸟同它同奶兄弟的关系密切得多,但这种区别仅仅是程度问题。即使我们觉得动物之间的关系竟然会发展到不惜对亲兄弟姐妹下毒手这种程度有点难以置信,但情况没有如此严重的自私行为的例子却是很多的。这些例子说明,一个幼儿从其自私行为中得到的好处可以超过它因损害到兄弟姐妹的利益而蒙受损失的两倍有余。在这种情况下,正如断乳时间的例子一样,亲代与子代之间便会发生真正的冲突。

    在这种世代的争斗中,谁将是胜利者呢?亚历山大写过一篇有趣的论文,他认为这样的问题只能有一个普遍答案。按他的说法,亲代总归占上风。*如果情况果真是这样的,那你阅读这一章就算是白费劲了。如果亚历山大是正确的,那就出现了很多有趣的问题,例如,利他行为之所以能进化,并不是因为有利于该个体本身的基因,而仅仅是有利于亲代的基因。用亚历山大的话来说,亲代操纵变成了利他行为的另外一个进化因素,它和直接的亲属选择无关。为此,我们有必要研究一下亚历山大的推理过程,并使我们自己相信,我们是真的懂得他究竟错在哪儿了。为了证明他的谬误,我们实在应该用数学演算的方法,但在本书中,我们一直避免明显地使用数理,而且事实上通过直觉的理解也能看出亚历山大这篇论文的破绽所在。

    他的基本遗传论点包含在下面这段经过删节的引语里:“假定一个青少年个体……使得亲代利益的分配对自己有利,从而减少了它母亲自身的全面繁殖能力。通过这个方式提高处在青少年时代的个体健康水平的基因,肯定会在该个体成年时更大程度地降低其健康水平,因为这种突变型基因将越来越多地存在于这个突变型个体的后代体内。”亚历山大所说的是一个新近发生突变的基因,这个事实并不是这个论点的关键所在。我们最好还是设想一个从双亲一方继承的稀有基因。在这里,“健康水平”具有一种特殊的学术意义——成功地繁殖后代的能力。亚历山大的基本论点可以归纳如下:一个基因在促使其幼年个体搜取额外食物时确实能增加该个体的存活机会,尽管其亲代养育后代的总能力会因此而受到影响。但当这个个体自己成为父母时就要付出代价,因为其子女往往继承了同样的自私基因,从而影响这个个体养育后代的总能力。这可以说是一种既损人又不利己的行为。这样的基因只能以失败告终,因此亲代必定永远在这种冲突中取得胜利。

    这个论点理应立即引起我们的怀疑,因为论据的假设,即遗传学上的不对称性事实上并不存在。亚历山大使用“亲代”与“子代”这样的字眼时好像它们之间存在着根本的遗传学上的不同。我们在上面已经谈过,尽管亲代与子代之间存在实际上的差异,如父母的年龄总比子女大、子女为父母所生等,但两代之间并不存在根本的遗传学上的不对称现象。不管你从哪一个角度看,亲缘关系都是50%。为了阐明我的论点,我想重复一下亚历山大的原话,但把“亲代”“青少年”以及其他有关字眼颠倒过来使用。“假定一个亲代个体有这样一个基因,它使亲代利益得以平均分配。通过这种方式提高作为亲代个体的健康水平的基因,肯定在这个个体还处于青少年时代时更大程度地降低过它的健康水平。”这样,我们就得出和亚历山大完全相反的结论,即在任何亲代—子代的争斗中,子女必然会胜利!这里显然存在某种错误。这两种论点的提法都过于简单。我之所以要把亚历山大的说法颠倒过来,并不是为了证明和亚历山大相反的论点是正确的。我的目的在于表明我们不能以这种主观认为的不对称性作为论据。亚历山大的论点以及我把它颠倒过来的说法都属于因站在个体的观点上看问题而背离真理。亚历山大是从亲代的观点看问题,而我是从子代的观点看问题。我认为当我们使用“健康水平”这个技术性的字眼时,很容易造成错误。我在本书中一直避免使用这个字眼就是这个缘故。只有站在一个实体的观点上看进化现象才是正确的,这个实体就是自私的基因。青少年个体的基因如有胜过亲代个体的能力就被选择;反之,亲代个体的基因如有胜过青少年个体的能力就被选择。同样是这些基因,它们先后存在于亲代个体及青少年个体之内,这并无自相矛盾之处。基因之所以被选择是因为它们能够发挥它们具备的力量:它们将利用可以利用的一切机会。因此,同一个基因,当它存在于青少年个体之内时,它可以利用的机会将不同于它存在于亲代个体之内的时候。因此,在它的个体生命史中,两个阶段的最优策略是不同的。亚历山大认为,后一阶段的策略必然胜过前一阶段的策略,这样的看法是毫无根据的。

    我们可以通过另外一个方式驳斥亚历山大的论点。他心照不宣地在亲代—子代关系与兄弟—姐妹关系之间假定一种虚妄的不对称性。你应当记得,根据特里弗斯的说法,一个自私的幼儿在攫取额外的食物时必须承担丧失其兄弟或姐妹的风险,而这些兄弟或姐妹体内有它的一半的基因。正因为如此,它在攫取食物时会适可而止。但兄弟或姐妹只是各种亲属中亲缘关系指数是50%的一类亲属。对于一个自私幼儿来说,它自己的未来的子女和它自己的兄弟或姐妹同样“可贵”。因此,它在攫取额外资源时应估算一下为此必须付出的全部代价,不能漫无节制;这种自私行为不仅会使它丧失现存的兄弟或姐妹,而且要使它丧失其未来的子女,因为这些子女必然也会以自私行为彼此相待。亚历山大认为,青少年时期的自私性遗传到子女一代从而减少自己的长期繁殖能力是不利的,这一论点是言之成理的。但这仅仅意味着,我们必须将这种不利因素作为一项代价加在方程式里。对一个幼体来说,只要它从自私行为中得到的净利益至少不小于它的近亲因此受到的净损失的一半,那么这种自私行为还是合算的。但“近亲”应该包括的不仅仅是兄弟或姐妹,还包括它自己的未来的子女。一个个体应该视自己的利益比它兄弟的利益可贵一倍,这就是特里弗斯所做的基本假设。但它同时应该认为自己比自己未来子女当中的一个可贵一倍。亚历山大认为,在利害冲突中亲代享有天然的有利条件,他的这一结论是错误的。

    除了这一基本的遗传论点外,亚历山大还有一些比较切合实际的论点。这些论点来源于亲代—子代关系中不可否认的不对称性。亲代个体是采取积极行动的一方,它实际上从事寻找食物等工作,因此能够发号施令。如果父母决定不再供养其子女,子女是没有什么办法的,因为它们幼小,无力还击。父母因此能够无视子女的愿望而要求子女绝对服从。这个论点显然并不错误,因为在这种情况下,它所假设的不对称性是真实的。父母当然比子女大些,强壮些,而且更老于世故。好牌看来都在父母手中,但子女手中也有一两张王牌,譬如说,父母应该知道它们的每个子女到底饿到什么程度,以便在分配食物时有轻重缓急,这一点很重要。它们当然可以搞平均主义,把完全相等的口粮分给每一个子女。但在最理想的环境里,把略多一些的食物分给事实上最能充分利用这份口粮的孩子是能够收获较大利益的。要是每个孩子都能够自己告诉父母它有多饿,对父母来说倒是个理想的制度。我们在上面已经谈过,这样的制度似乎已经形成。但子女说谎的可能性很大,因为它们确切知道它们自己有多饿,而它们的父母最多只能猜测它们是否老实。做父母的很难拆穿小小的谎言,尽管弥天大谎或许瞒不过父母的眼睛。

    另一方面,父母最好能够知道孩子什么时候高兴,孩子如果在高兴的时候能够告诉父母就好了。某些信号,如咕噜咕噜的叫声和眉开眼笑可能被选择是因为这种信号使父母知道它们怎样做才能为子女带来最大的好处。看见子女眉开眼笑或听见子女发出得意的叫声是对父母的最大安慰,正像食物到肚对一只迷路的老鼠同样是莫大的安慰一样。可是,正是由于甜蜜的笑脸和满意的叫声总会带来好处,孩子就能够利用笑脸或叫声来操纵父母,使自己获取额外的亲代投资。

    因此,在世代之间的争斗中到底哪一方有更大的可能取胜是没有一个普遍答案的。最终的结局往往是子代企求的理想条件与亲代企求的理想条件之间的某种妥协。这种争斗同布谷鸟与养父母之间的争斗相似,尽管实际上的争斗不至于那么激烈可怕,因为双方都有某些共同的遗传利益——双方只是在某种程度内或在某种敏感的时节里成为敌人。无论如何,布谷鸟惯用的策略,如欺骗、利用等,有许多也可能为其同胞兄弟或姐妹所使用,不过它们不至于走得太远,做出布谷鸟那种极端自私的行为。

    这一章以及下面一章(我们将讨论配偶之间的冲突)所讨论的内容似乎是有点可怕的讽刺意味的。身为人类,父母彼此真诚相待,对子女又是如此无微不至地关怀,因此这两章甚至可能为天下父母带来难言的痛苦。在这里,我必须再次声明,我所说的一切并不牵涉有意识的动机。没有人认为子女因为体内有自私的基因而故意地、有意识地欺骗父母。同时我必须重申,当我说“一个幼儿应该利用一切机会进行哄骗……说谎、欺诈、利用……”的时候,我所谓的“应该”具有特殊的含义。我并不认为这种行为是符合道德准则的,是可取的。我只是想说明,自然选择往往有利于表现这种行为的幼儿,因此,当我们观察野生种群的时候,我们不要因为看到家属之间的欺骗和自私行为而感到意外。“幼儿应该欺骗”这样的提法意味着,促使幼儿进行欺骗的基因在基因库里处于优势地位。如果其中有什么寓意深刻的地方可供人类借鉴,那就是我们必须把利他主义的美德灌输到我们子女的头脑中去,因为我们不能指望他们的本性里有利他主义的成分。

    第9章 两性战争

    如果说体内有50%的基因是相同的的亲代同子代之间还有利害冲突的话,那么彼此毫无血缘关系的配偶的利害冲突会激烈到何种程度呢?*他们唯一的共有物就是在他们子女身上的50%的遗传投资。鉴于父亲和母亲都关心他们子女身上各自一半的福利,相互合作共同抚养这些孩子可能对双方都有好处。假如双亲的一方在对每一子女进行昂贵的资源投资时付出的份额比另一方少,他或她的景况就会好一些。这是由于他或她有更多的资源用于同其他性配偶所生的其他子女,从而他或她的基因有更多的繁殖机会。因此,我们可以说,每个配偶都设法利用对方,试图迫使对方多投资一些。就个体来说,称心如意的算盘是,“希望”同尽可能多的异性成员进行交配(我不是指为了生理上的享乐,尽管该个体可能乐于这样做),而让与之交配的配偶把孩子抚养大。我们将会看到,有一些物种的雄性个体已经是这样做的了,但还有一些物种的雄性个体,在抚养子女方面承担着同配偶相等的义务。特里弗斯特别强调,性配偶之间的关系是一种相互不信任和相互利用的关系。这种关于性配偶之间的相互关系的观点,对个体生态学家来说是一种比较新的观点。我们过去通常认为,性行为以及在此之前的追求行为,主要是为了共同的利益,或者甚至是为了物种的利益而相互合作共同进行的冒险事业!

    让我们再直接回到基本原理上来,深入探讨一下雄性和雌性的根本性质。我们在第3章讨论过性的特性,但没有强调其不对称现象。我们只是简单地承认,有些动物是雄性的,另有一些是雌性的,但并没有进一步追究雄和雌这两个字眼到底是什么意思。雄性的本质是什么?雌性的根本定义又是什么?我们作为哺乳动物看到大自然以各种各样的特征为性别下定义,诸如拥有阴茎、生育子女、以特殊的乳腺哺乳、某些染色体方面的特性等等。对于哺乳动物来说,这些判断个体性别的标准是无可厚非的,但对于一般的动物和植物,这样的标准并不比把穿长裤作为判断人类性别的标准更加可靠。例如青蛙,不论雄性还是雌性都没有阴茎。这样说来,雄性和雌性这两个词也许就不具有人们普遍所理解的意义了。它们毕竟不过是两个词而已。如果我们觉得它们对于说明青蛙的性别没有用处,我们完全可以不去使用它们。如果我们高兴的话,可以任意将青蛙分成性1和性2。然而,性别有一个基本特性,可以据此标明一切动物和植物的雄性和雌性。这就是雄性的性细胞或“配子”(gametes)比雌性“配子”要小得多,数量也多得多。不论我们讨论的是动物还是植物,情况都是如此。如果某个群体的个体拥有大的性细胞,为了方便起见,我们可以称之为雌性;如果另一个群体的个体拥有小的性细胞,为了方便起见,我们可以称之为雄性。这种差别在爬行动物以及鸟类中尤为显著。它们的一个卵细胞,其大小和总的营养成分,足以喂养一个正在发育成长的幼儿长达数周。即使是人类,尽管卵子小得在显微镜下才能看见,但仍比精子大许多倍。我们将会看到,根据这一基本差别,我们就能够解释两性之间的所有其他差别。

    某些原始有机体,例如真菌类,并不存在雄性和雌性的问题,尽管它们也发生某种类型的有性生殖。在被称为同配生殖(isogamy)的系统中,个体并不能被区分为两种性别,任何个体都能相互交配,不存在两种不同的配子——精子和卵子,所有的性细胞都一样,都称为同形配子(isogametes)。两个同形配子融合在一起产生新的个体,而每一个同形配子是由减数分裂产生的。如果有3个同形配子A、B和C,那么A可以和B或C融合,B可以同A或C融合。正常的性系统绝不会发生这种情况。如果A是精子,它能够同B或C融合,那么B和C肯定是卵子,而B也就不能和C融合。

    两个同形配子相互融合时,各为新的个体提供数目相等的基因,而贡献的食物储存量也相等。精子同卵子为新的个体贡献的基因数目虽然也相等,但卵子在提供食物储存方面却远远超过精子:实际上,精子并不提供任何食物储存,只是致力于把自己的基因尽快输送给卵子而已。因此,在受孕的时刻,父亲对子代的投资,比他应支付的资源份额(50%)少。由于每个精子都非常微小,一个雄性个体每天能够制造千百万个。这意味着他具有潜在的能力,能够在很短的一段时间内利用不同的雌性个体使一大批幼儿出生。这种情况之所以可能成功,仅仅是因为每个受孕的母体都能为新胎儿提供足够的食物。因此,每一雌性个体能够生育的幼儿数量就有了限制,但雄性个体可以繁殖幼儿的数量实质上是无限的,这就为雌性个体带来了利用这种条件的机会。*

    帕克以及其他人都曾证明,这种不对称现象可能是由同形配子的状态进化而来的。在所有的性细胞还可以相互交换而且体积也大致相同的时候,其中很可能有一些碰巧比其他的略大一点。略大的同形配子可能在某些方面比普通的同形配子占优势,因为它一开始就能为胎儿提供大量的食物,使其有一个良好的开端。因此那时就可能出现了一个形成较大的配子的进化趋势。但道路不会是平坦的。其体积大于实际需要的同形配子,在开始进化后会为自私性的利用行为打开方便之门。那些制造小一些的配子的个体,如果它们有把握使自己的小配子同特大配子融合的话,它们就会从中获得好处。只要使小的配子更加机动灵活,能够积极主动地去寻找大的配子,就能实现这一目的。凡能制造体积小、运动速度快的配子的个体享有一个有利条件:它能够大量制造配子,因此具有繁殖更多幼儿的潜力。自然选择有利于制造小的但能主动找到大的并与之融合的性细胞。因此,我们可以想象,有两种截然相反的性“策略”正在进化中。一种是大量投资或“诚实”策略。这种策略自然而然地为小量投资、具有剥削性质的或“狡猾”的策略开辟了道路。这两种策略的相互背驰现象一旦开始,就犹如脱缰之马势必将继续下去。介乎这两种体积之间的中间体要受到惩罚,因为它们不具有这两种极端策略中任何一种的有利条件。狡猾的配子变得越来越小,越来越灵活机动。诚实的配子却进化得越来越大,以补偿狡猾的配子日趋缩小的投资额,并变得不灵活起来,反正狡猾的配子总是会积极主动去追逐它们的。每一个诚实的配子“宁愿”同另一个诚实的配子进行融合,但是,排斥狡猾配子的自然选择压力同驱使它们钻空子的压力相比,前者较弱:因为狡猾的配子在这场进化的战斗中必须取胜,否则损失很大。于是诚实的配子变成了卵子,而狡猾的配子演变成了精子。

    这样看来,雄性个体是微不足道的家伙,而且根据简单的“物种利益”理论,我们可以预料,雄性个体的数量较之雌性个体会越来越少。因为从理论上讲,1个雄性个体所产生的精子足以满足100个雌性个体的需要,因此,我们可以假定,在动物种群中雌雄两性个体的比例应该是100∶1。换言之,雄性个体更具“低值易耗”的性质,而雌性个体对物种来说,其“价值”较大。当然,从物种的整体观点来看,这种情况完全正确。举一个极端的例子,在一项有关海象的研究中,据观察,4%的雄性海象进行的交配占所有交配的88%。在这一例子以及许多其他例子中,有大批剩余的从未交配过的独身雄性个体,它们可能终生得不到交配机会。但这些多余的雄性个体在其他方面过的是正常生活,它们不遗余力地将种群的食物资源吃光,同其他成熟个体相比,毫不逊色。从“物种利益”的角度来看,这种情况是一种极大的浪费;可以说,这些多余的雄性个体是社会的寄生虫。这种现象只不过是类群选择理论遇到的难题中的又一个例子而已。但另一方面,自私基因的理论能够毫无困难地解释这种现象,即雄性个体和雌性个体的数量趋于相等,即使实际进行繁殖的雄性个体可能只占总数的一小部分。第一个做出这种解释的是费希尔。

    雄性个体和雌性个体各出生多少的问题,是亲代策略中的一个特殊问题。我们曾对力图最大限度地增加其基因存活量的亲代个体最适宜的家庭规模进行讨论。同样,我也可以对最适宜的性比率进行探讨。把你的宝贵基因信托给儿子好呢,还是信托给女儿好?假定一个母亲将自己的所有资源全部投资在儿子身上,因而没有任何剩余用于女儿的投资,一般来说,她对未来基因库的贡献,同另一位将其全部资源用于女儿身上的母亲相比,会不会更大一些?偏向儿子的基因是会比偏向女儿的基因变得多起来,还是越来越少?费希尔证明,在正常情况下,最适宜的性比率是50∶50。为了弄懂这个问题,首先我们必须具备一点有关决定性别的机制的知识。

    在哺乳动物中,遗传上是这样来决定性别的:所有卵子既能发育成雄性个体,也能发育成雌性个体,决定性别的染色体的携带者是精子。男性制造的精子,其中一半生育女性,或称为X精子,一半生育男性,或称为Y精子。两种精子表面看上去没有区别,它们只有一条染色体不同。基因如要一个父亲只生女儿,该基因只要他只制造X精子就行了;而基因如要一个母亲只生女儿,该基因只要让她分泌一种选择性的杀精子剂,或者使男性胎儿流产即可。我们所要寻求的是一种同进化稳定策略相等的东西,尽管在这里,策略在更大的程度上说只是一种比喻的讲法(在《进犯行为》一章中我们已使用过这种比喻)。实际上,个体是不能够随意选择自己子女的性别的。但基因倾向于使个体生育一种性别的子女还是可能的。如果我们假定这样的基因,即倾向于不平均性比率的基因存在的话,它们在基因库中会不会在数量上超过其等位基因,即倾向于平均性比率的基因?

    假定在上面提到的海象中出现了一个突变基因,而该突变基因有使父母所生的孩子大部分是女儿这种趋势。由于种群内不缺少雄性个体,因此不存在女儿寻找配偶的困难,制造女儿的基因从而能够散布开来。这样,种群内的性比率也就开始向雌性个体过剩转变。从物种利益的观点出发,这种情况不会发生问题。我们已经讲过,因为只要有几个雄性个体就足以提供一大批过剩的雌性个体所需要的精子,因此,从表面上看,我们可以认为,制造女儿的基因不断地扩散,直到性比率达到极度不平衡的程度,即剩下的少数几个雄性个体搞得筋疲力尽才能勉强应付。但是,试想那些生儿子的为数不多的父母,它们要享有多么巨大的遗传优势!凡是生育一个儿子的个体,就会有极大的机会成为几百只海象的祖父或祖母。只生女儿的个体能确保几个外孙、外孙女是无疑的,但同那些专事生儿子的个体所拥有的那种遗传上蔚为壮观的前景相比,就要大为相形见绌了。因此,生儿子的基因往往会变得多起来,而性比率的钟摆就又会摆回来。

    为简便起见,我以钟摆的摆动来说明问题。实际上,钟摆绝不会向雌性占绝对优势的方向摆动那样大的幅度。因为性比率一旦出现不平衡,生儿子的这股自然选择压力就会开始把钟摆推回去。生育同等数目的儿女的策略是一种进化稳定策略,就是说,偏离这一策略的基因都要遭受净损失。

    我的论述是以儿子的数目对女儿的数目为根据的,目的是为了使其简单易懂。但严格说来,应该根据亲代投资的理论进行解释,就是说以前面一章我们曾讨论过的方法,按亲代一方必须提供的所有食物和其他资源来进行计算。亲代对儿子和女儿的投资应该均等。在一般情况下,这意味着他们所生的儿子和女儿数目应该相等。但是,假如对儿子和女儿的资源投资额不均等的话,那么性比率出现同样程度的不均衡在进化上可以是稳定的。就海象而言,生女儿同生儿子的比例是3∶1,而对每个儿子投资的食物和其他资源却三倍于每个女儿,借以使每个儿子成为超群的雄性,这种策略可能是稳定的。把更多的食物投资在儿子身上,使他既大又强壮,亲代就可能使之有更多的机会赢得“妻妾”这个最高奖赏。但这是一个特殊的例子。通常的情况是,在每个儿子身上的投资同在每个女儿身上的投资数量大致相等,而性比率从数量上说一般也是1∶1。

    因此,一个普通的基因在世代更迭的漫长旅程中,大约要花一半的时间寄居于雄性个体中,另一半时间则寄居于雌性个体中。基因的某些影响只在一种性别的个体中表现出来,这些影响称为性限制基因影响(sex-limited gene effects)。控制阴茎长度的基因仅在雄性个体中表现出它的影响,但它也存在于雌性个体中,而且可能对雌性个体产生完全不同的影响。认为男性不能从其母体继承形成长阴茎的趋势是毫无道理的。

    不论基因存在于两种个体的哪一种中,我们可以认为它都会充分利用该种个体所提供的一切机会。由于个体的性别有所不同,这些机会可能是很不相同的。作为一种简便的近似说法,我们可以再次假定,每一个个体都是一台自私的机器,都竭尽全力维护自己的全部基因。对这样一台自私的机器来说,其最佳策略往往因为其性别的不同而完全不同。为了简洁起见,我们又要用老办法,把个体的行为当作有目的的。和以前一样,我们要记住这不过是一种比喻的说法。实际上,个体是一台其程序由它自己的自私基因盲目编制出来的机器。

    让我们再来探讨一下在本章开始时我们提到的那一对配偶。作为自私的机器,配偶双方都“希望”儿子和女儿数目均等。在这一点上他们是没有争议的。分歧在于,谁将承担抚养这些子女的主要责任。每一个个体都希望存活的子女越多越好。在任何一个子女身上,他或她投资得越少,他或她能够生育的子女就会越多。显而易见,实现这种愿望的方法是诱使你的性配偶在对每一个子女进行投资时付出比他或她理应付出的更多的资源,以便自己脱身同另外的配偶再生子女。这种策略是一种两性都向往的策略,不过对雌性来讲更难如愿以偿。由于她一开始就以其大而营养丰富的卵子付出了比雄性多的投资额,因此母亲从怀孕的时刻起,就对每个幼儿承担了比父亲更大的“义务”。幼儿一旦死亡,她会比父亲蒙受更大的损失。更确切地讲,为了把另一个新的幼儿抚养到同死去的幼儿同样大小,她今后必须比父亲进行更多的投资。如果她耍花招,让父亲照料幼儿,自己却同另一个雄性个体私奔,父亲也可以将抛弃幼儿作为报复手段,而父亲所蒙受的损失,相对来说要小。因此,至少在幼儿发育的早期,如果有这种抛弃行为发生的话,一般是父亲抛弃母亲和孩子,而不是相反。同样,我们可以推断出雌性个体对子女的投资多于雄性个体,这不仅在一开始,而且在子女整个发育期间都是如此。例如在哺乳动物中,在自己体内孕育胎儿的是雌性个体,幼儿降生之后,制造乳汁喂养幼儿的是雌性个体,抚养并保护幼儿的主要责任也落在雌性个体肩上。雌性个体受剥削,而这种剥削行为在进化上的主要基础是卵子比精子大。

    当然,在许多物种中,做父亲的确实也非常勤奋,而且忠实地照料幼儿。但即使如此,我们必须估计到,在正常情况下,会有某种进化上的压力,迫使雄性个体略微减少一点对每个幼儿的投资,而设法同其他配偶生更多的子女。我这样讲指的仅仅是,基因如果说“喂,如果你是雄性个体,那就早一点离开你的配偶,去另外找一个雌性个体吧,不必等到我的等位基因要你离开时才离开”,那么这样的基因往往在基因库中获得成功。这种进化上的压力在实际生活中随着物种的不同而产生大小悬殊的影响。在许多物种中,例如极乐鸟,雌性个体得不到雄性个体的任何帮助,抚养子女完全靠自己。还有一些物种,诸如三趾鸥,结成一雌一雄的配对,是相互忠诚的楷模,它们相互配合共同承担抚养子女的任务。这里,我们必须设想,某种进化上的对抗压力起了作用:对配偶的自私剥削,不仅能得到好处,一定也会受到惩罚。在三趾鸥中,这种惩罚超过了所得利益。不管怎样,只有在妻子有条件不依赖他人抚养幼儿的前提下,父亲抛弃妻子和幼儿才会有好处。

    特里弗斯对被配偶抛弃的母亲可能采取的各种行动方针进行了探讨。对她来说,最好的策略莫过于欺骗另一个雄性个体,使之收养她的幼儿,“以为”这就是他自己的幼儿。如果幼儿还是个尚未出生的胎儿,要做到这点恐怕并不太困难。当然,幼儿体内有她的一半基因,而上当受骗的父亲的基因一个也没有。自然选择会对雄性个体的这种上当受骗的行为进行严厉的惩戒,而且事实上,自然选择又会帮助那些雄性个体,他们一旦同新妻子结为配偶就采取积极行动杀死任何潜在的继子或继女。这种现象很可能说明了所谓布鲁斯效应(Bruce effect):雄鼠分泌一种化学物质,怀孕的雌鼠一闻到这种化学物质,就能够自行流产。而且只有在这种味道同其先前配偶的不同时,雌鼠才流产。雄鼠就是用这种方式把潜在的继子或继女杀死的,并使它的新妻子可以接受它的性追求。顺便提一句,阿德里竟把布鲁斯效应当成一种控制种群密度的途径!雄狮中也有同样的情况发生,它们新到达一个狮群时,有时会残杀现存的幼狮,可能因为这些幼狮不是它们自己亲生的。

    雄性个体不需要杀死继子继女也能达到同样的目的。他在同雌性个体交配之前,可以把追求的时间拖长,在这期间驱走一切向她接近的雄性个体,并防止她逃跑。用这样的方法,他可以看到在她子宫里有没有藏着任何未成形的继子或继女,如果有,就抛弃她。在后面我们将会讲到,雌性个体在交配之前为什么可能希望“订婚”期要长一些。这里我们谈一下,雄性个体为什么也希望“订婚”期长一些。假定他能够使她同其他雄性个体脱离一切接触,这样有助于避免不知不觉地成为其他雄性个体的子女的保护人。

    假如被遗弃的雌性个体不能够欺骗新的雄性个体使之领养她的幼儿,她还有其他办法吗?这在很大程度上要取决于这个幼儿有多大。如果是刚受孕,事实上她已投资了整个卵子,可能还要多些,但将这个胎儿流产并尽快找一个新的配偶,对她仍旧是有利的。在这种情况下,流产对她未来的新丈夫也是有利的,因为我们已经假定她不愿意使他受骗。这一点可以说明,从雌性个体的角度来看,布鲁斯效应是起作用的。

    被遗弃的雌性个体还有一种选择,即坚持到底,尽力设法自己抚养幼儿。如果幼儿已经相当大,这样做对她尤其有利。幼儿越大,在他身上已经进行的投资也就越多,她为了完成抚养幼儿这项任务所要付出的代价就越少。即使幼儿仍旧很幼小,但试图从她初期的投资中保存一些东西,对她可能仍是有利的,尽管她必须付出加倍的努力才能喂养这个幼儿,因为雄性个体已经离去。幼儿体内也有雄性个体的一半基因,她可以在幼儿身上发泄怨恨并把幼儿抛弃,但这样做对她来讲并不是一件愉快的事情。在幼儿身上泄怨是毫无道理的,因为幼儿的基因有一半是她的,而且只有她自己面对目前的困境。

    听起来似乎自相矛盾,对有被遗弃危险的雌性个体来说,恰当的策略是,不等雄性个体抛弃她,她就先离开他。即使她在幼儿身上的投资已经多于雄性个体,这样做对她仍可能是有利的。在某种情况下,谁首先遗弃对方谁就占便宜,不论是父亲还是母亲,这是一个令人不愉快的事实。正如特里弗斯所说,被抛弃的配偶往往陷入无情的约束。这是一种相当可怕但又非常微妙的论点。父母的一方可能会这样讲:“孩子现在已经长得相当大,完全可以由我们当中的一个抚养。因此,假定我能肯定我的配偶不会也离开的话,我现在离开对我来说是有好处的。假使我现在就离开,我的配偶就可以为她或他的基因的最大利益而努力工作。他或她将要被迫做出比我现在正在做出的还要激烈得多的决定,因为我已经离开。我的配偶‘懂得’,如果他或她也离开的话,幼儿肯定会死亡。所以,假定我的配偶要做的决定,对他或她的自私基因将是最有利的话,我断定,我自己的行动方针是,最好我先离开。因为我的配偶可能也正在‘考虑’采取和我完全相同的方针,而且可能先下手为强,随时抛弃我!因此,我尤其应该先离开。”这样的父亲或母亲是会主动抛弃对方的。这种自我独白,和以前一样,仅仅是为了说明问题。问题的关键是,自然选择有利于首先抛弃对方的一方的基因,这仅仅是因为自然选择对随后抛弃对方的一方的基因不利而已。

    我们已经分析了雌性个体一旦被遗弃,她可能采取的一些行动。但所有这些行动总有一点“亡羊补牢,犹未晚矣”之感。到底雌性个体有没有办法减轻由于其配偶首先对她进行剥削而造成损失呢?她手中握有一张王牌:她可以拒绝交配。她是被追求的对象,她掌握主动权。这是因为她的嫁妆是一个既大又富有营养的卵子。凡是能成功地与之交配的雄性个体就可为其后代获得一份丰富的食物储藏。雌性个体在交配之前,能够据此进行激烈的讨价还价。她一旦进行交配,就失去了手中的王牌——她把自己的卵子信托给了与之交配的雄性个体。激烈的讨价还价可能是一种很好的比喻,但我们都很清楚,实际情况并非如此。有没有任何相当于激烈讨价还价的某种实际形式能够借自然选择得以进化呢?我认为主要有两种可能性,一种为家庭幸福策略(the domestic-bliss strategy),一种为大丈夫策略(the he-man strategy)。

    家庭幸福策略的最简单形式是:雌性个体对雄性个体先打量一番,试图事先发现其忠诚和眷恋家庭生活的迹象。在雄性个体的种群中,成为忠诚的丈夫的倾向必然存在程度上的差异。雌性个体如能预先辨别这种特征,她们可以选择具有这种品质的雄性个体,从而使自己受益。雌性个体要做到这点,方式之一是长时间地摆架子,忸怩作态。凡是没有耐心,等不及雌性个体最终答应与之交配的雄性个体大概不能成为忠诚的丈夫。雌性个体以坚持订婚期要长的方式,剔除了不诚心的求婚者,最后只同预先证明具有忠诚和持久的品质的雄性个体交配。雌性忸怩作态是动物中一种常见的现象,求爱或订婚时间拉得长也很普遍。我们讲过,订婚期长对雄性个体也有利,因为雄性个体有受骗上当、抚养其他雄性个体所生幼儿的危险。

    追求的仪式通常包括雄性个体在交配前所进行的重要投资。雌性个体可以等到雄性个体为其筑巢之后再答应与之交配,或者雄性个体必须喂养雌性个体以相当大量的食物。当然,从雌性个体的角度来讲,这是很好的事,但它同时也使人联想到家庭幸福策略的另一种可能形式。雌性个体先迫使雄性个体对它们的后代进行昂贵的投资,然后再交配,这样雄性个体在交配之后再抛弃对方,也就不会有好处了。会不会是这种情况呢?这种观点颇具说服力。雄性个体等待一个忸怩作态的雌性个体最终与之交配,是要付出一定代价的:它放弃了同其他雌性个体交配的机会,而且向该雌性个体求爱时要消耗它许多的时间和精力。到它终于得以同某一具体雌性个体交配时,它和这个雌性个体的关系已经非常“密切”。假使它知道今后它要接近的任何其他雌性个体也会以同样的方式进行拖延,然后才肯交配,那么,对它来说,遗弃该雌性个体的念头也就没有多大诱惑力了。

    我曾在一篇论文中指出过,这里特里弗斯在推理方面有一个错误。他认为,预先投资本身会使该个体对未来的投资承担义务。这是一种荒谬的经济学思想。商人永远不会说:“我在协和式客机上(举例说)已经投资太多,现在把它丢弃实在不合算。”相反,他总是要问,即使他在这项生意中的投资数目已经很大,但为了减少损失,现在就放弃这项生意,这样做对他的未来是否有好处。同样,雌性个体迫使雄性个体在她身上进行大量投资,指望单单以此来阻止今后雄性个体最终抛弃她,这样做是徒劳的。这种形式的家庭幸福策略还要取决于一种进一步的重要假定:即雌性的大多数个体都愿意采取同样的做法。如果种群中有些雌性个体是放荡的,随时准备欢迎那些遗弃自己妻子的雄性个体,那么对抛弃自己妻子的雄性个体就会有利,不论他对她的子女的投资已经有多大。

    因此,这在很大程度上取决于大多数雌性个体的行为。如果我们可以根据雌性个体组成集团的方式来考虑问题的话,就不会存在问题了。但雌性个体组成的集团,同我们在第5章中讲到的鸽子集团相比较,其进化的可能性也不会更大些。我们必须寻找进化稳定策略。让我们采用史密斯用以分析进犯性对抗赛的方法,把它运用于性的问题上。*这种情况要比鹰和鸽的例子稍微复杂一点。因为我们将有两种雌性策略和两种雄性策略。

    同史密斯的分析一样,“策略”这个词是指一种盲目的、无意识的行为程序。我们把雌性的两种策略分别称为羞怯(coy)和放荡(fast),而雄性的两种策略分别称为忠诚(faithful)和薄情(philanderer),这四种策略在行为上的准则是:羞怯的雌性个体在雄性个体经过长达数周而且代价昂贵的追求阶段之后,才肯与之交配;放荡的雌性个体毫不迟疑地同任何个体进行交配;忠诚的雄性个体准备进行长时间的追求,而且交配之后,仍同雌性个体待在一起,帮助她抚养后代;薄情的雄性个体,如果雌性个体不立即同其进行交配,很快就会失去耐心,他们走开并另寻雌性个体,即使交配之后,他们也不会留下承担起做父亲的责任,而是去另寻新欢。情况同鹰和鸽的例子一样,并不是说只有这几种策略,然而对实行这几种策略会带来什么样的命运进行一番研究是富于启发性的。

    同史密斯一样,我们将采用一些任意假定的数值,表示各种损失和利益。为了更加带有普遍性,也可以用代数符号来表示,但数字更容易理解。我们假定亲代个体每成功地抚养一个幼儿可得15个单位的遗传盈利,而每抚养一个幼儿所付出的代价,包括所有食物、照料幼儿花去的所有时间以及为幼儿承担的风险,是-20个单位。代价用负数表示,因为那是双亲的“支出”。在旷日持久的追求中所花费的时间也是负数,就以-3个单位来代表这种代价。

    现在我们设想有一个种群,其中所有的雌性个体都羞怯忸怩,而所有的雄性个体都忠诚不贰。这是一个一雌一雄配偶制的理想社会。在每一对配偶中,雄性个体和雌性个体所得的平均盈利都相等。每抚养一个幼儿,它们各获得15个单位,并共同承担所付出的代价(-20),平均分摊,每方各为-10。它们共同支付拖长求爱时间的代价(罚分-3)。因此,每抚养一个幼儿的平均盈利是:15-10-3=2。

    现在我们假设有一个放荡的雌性个体溜进了这个种群。它干得很出色。它不必支付因拖延时间而花费的代价,因为它不沉湎于那种旷日持久的卿卿我我的求爱。由于种群内的所有雄性个体都是忠诚的,它不论跟哪一个结合都可以为它的子女找到一个好父亲。因此,它每抚养一个幼儿的盈利是15-10=5。同它羞怯忸怩的对手相比较,它要多收益3个单位。于是放荡的基因开始散布开来。

    如果放荡的雌性个体获得很大成功,致使它们在种群内占据了统治地位,那么,雄性个体的营垒中,情况也会随之开始发生变化。截至目前,种群内忠诚的雄性个体占有垄断地位。但如果现在种群中出现了一个薄情的雄性个体,它的景况会比其他的忠诚的对手好些。在一个雌性个体都放荡不羁的种群内,对一个薄情的雄性个体来讲,这类货色比比皆是,唾手可得。如果能顺利地抚养一个幼儿,它净得盈利15,而对两种代价却分文不付。对雄性个体来说,这种不付任何代价指的主要是,它可以不受约束地离开并同其他雌性个体进行交配。它的每一个不幸的妻子都得独自和幼儿挣扎着生活下去,承担起-20个单位的全部代价,尽管它并没因在求爱期间浪费时间而付出代价。一个放荡的雌性个体结交一个薄情的雄性个体,其净收益为15-20=-5,而薄情的雄性个体的收益却是15。在一个雌性个体都放荡不羁的种群中,薄情的雄性基因就会像野火一样蔓延开来。

    如果薄情的雄性个体数得以大量地迅速增长,以至于在种群的雄性成员中占了绝对优势,放荡的雌性个体就将陷于可怕的困难处境。任何羞怯忸怩的雌性个体都会享有很大的有利条件。如果羞怯忸怩的雌性个体同薄情的雄性个体相遇,它们之间绝不会有什么结果。雌性个体坚持要把求爱的时间拉长,而雄性个体断然拒绝并去寻找另外的雌性个体。双方都没有因浪费时间而付出代价,但双方也各无所得,因为没有幼儿出生。在所有雄性个体都是薄情郎的种群中,羞怯忸怩的雌性个体的净收益是0。0看上去微不足道,但比放荡不羁的雌性个体的平均得分-5要好得多。即使放荡的雌性个体在被薄情郎遗弃之后,决定抛弃它的幼儿,但它的一颗卵子仍旧是它所付出的一笔相当大的代价。因此,羞怯忸怩的基因开始在种群内再次散布开来。

    现在让我们来谈谈这一循环性假设的最后一部分。当羞怯忸怩的雌性个体大量增加并占据统治地位时,那些和放荡的雌性个体本来过着纵欲生活的薄情雄性个体开始感到处境艰难。一个个雌性个体都坚持求爱时间要长,要长期考验对方的忠诚。薄情的雄性个体时而找这个雌性个体,时而又找那个雌性个体,但结果总是到处碰壁。因此,在一切雌性个体都忸怩作态的情况下,薄情雄性个体的净收益是0。如果一旦有一个忠诚的雄性个体出现,它就会成为同羞怯忸怩的雌性个体交配的唯一雄性个体。那么它的净收益是2,比薄情的雄性个体要好。所以,忠诚的基因就开始增长,至此,我们就完成了这一周而复始的循环。

    像分析进犯行为时的情况一样,按我的讲法,这似乎是一种无止境的摇摆现象。但实际上,像那种情况一样,不存在任何摇摆现象,这是能够加以证明的。整个体系能够归到一种稳定状态上。*如果你运算一下,就可证明,凡是羞怯忸怩的雌性个体占全部雌性个体的,忠诚的雄性个体占全部雄性个体的的种群在遗传上是稳定的。当然,这仅仅是根据我们开始时任意假定的那些特定数值计算出来的,但对其他任何随意假定的数值,我们同样可以轻而易举地算出新的稳定比率。

    同史密斯所进行的分析一样,我们没有必要认为存在两种不同种类的雄性个体以及两种不同种类的雌性个体。如果每一个雄性个体能在的时间里保持忠诚,其余的时间去寻花问柳,而每一个雌性个体有的时间羞怯忸怩,的时间纵情放荡,那同样可以实现进化稳定状态。不管你怎样看待ESS,它的含义是:凡一种性别的成员偏离其适中的稳定比率时,这种倾向必然受到另一种性别在策略比率方面相应变化的惩罚,这种变化对原来的偏离行为产生不利的影响。进化稳定策略因此得以保持。

    我们可以得出这样的结论,主要由羞怯忸怩的雌性个体和忠诚的雄性个体组成的种群能够进化是肯定无疑的。在这样的情况下,家庭幸福策略对于雌性个体来说,实际上看来是行之有效的。我们就不必再考虑什么由羞怯忸怩的雌性个体组成的集团了,其实羞怯忸怩对雌性个体的自私基因是有利的。

    雌性个体能够以各种各样的方式将这种形式的策略付诸实践。我已经提到过,雌性个体可能拒绝同还没有为它筑好巢,或至少还没有帮助它筑造一个巢的雄性个体交配。在许多单配偶制的鸟类中,情况的确如此,巢不筑好不交配。这样做的效果是,在受孕的时刻,雄性个体对幼儿已经付出的投资远较廉价的精子多。

    未来的配偶必须为它筑造一个巢,这种要求是雌性个体约束雄性个体的一种有效手段。我们不妨说,只要能够使雄性个体付出昂贵的代价,不论是什么,在理论上几乎都能奏效,即使付出的这种代价对尚未出生的幼儿并没有直接的益处。

    如果一个种群的所有雌性个体都强迫雄性个体去完成某种艰难而代价昂贵的任务,如杀死一条龙或爬过一座山然后才同意交配,在理论上讲,它们能够降低雄性个体在交配后不辞而别的可能性。企图遗弃自己的配偶并要和另外的雌性个体交配以更多地散布自己基因的任何雄性个体,一想到必须还要杀死一条龙,就会打消这种念头。然而事实上雌性个体是不会将杀死一条龙或寻求圣杯[1]这样专横的任务硬派给它们的求婚者的,因为如果有一个雌性个体对手,它指派的任务尽管困难程度相同,但对它以及它的子女却有更大的实用价值,那么它肯定会优越于那些充满浪漫情调、要求对方为爱情付出毫无意义的劳动的雌性个体。杀死一条龙或在达达尼尔海峡(Hellespont[2])中游泳也许比筑造一个巢穴更具浪漫色彩,但却远远没有后者实用。

    我提到过的雄性个体做出的具有求爱性质的喂食行动对于雌性个体也是有用的。鸟类的这种行为通常被认为是雌性个体的某种退化现象,它们恢复了雏鸟时代的幼稚行为。雌鸟向雄鸟要食物,讨食的姿态像雏鸟一样。有人认为这种行为对雄鸟具有天然的诱惑力,这时雌鸟不管能得到什么额外的食物,它都需要,因为雌鸟正在建立储存,以便于制造很大的卵子。雄鸟的这种具有求爱性质的喂食行为,也许是一种对卵子本身的直接投资。因此,这种行为能够缩小双亲在幼儿初期投资的悬殊程度。

    有几种昆虫和蜘蛛也存在这种求爱性质的喂食现象。很显然,有时人们对这种现象完全可以做另外的解释。如我们提到过的螳螂的例子,由于雄螳螂有被较大的雌螳螂吃掉的危险,因此只要能够减少雌螳螂的食欲,随便干什么对它可能都是有利的。我们可以说,不幸的雄螳螂是在这样一种令人毛骨悚然的意义上对其子女进行投资的。雄螳螂被作为食物吃掉,以便帮助制造卵子,而且储存在雄螳螂尸体内的精子随之使吃掉它的雌螳螂的卵子受精。

    采取家庭幸福策略的雌性个体如果仅仅是从表面上观察雄性个体,试图辨认它忠诚的品质会容易受骗。雄性个体只要能够冒充成忠诚的爱好家庭生活的类型,而事实上是把遗弃和不忠诚的强烈倾向掩盖起来,它就具有一种很大的有利条件。只要过去被它遗弃的那些妻子能有机会将一些幼儿抚养大,这个薄情的雄性个体比起一个既是忠诚丈夫又是忠诚父亲的雄性对手,能把更多的基因传给后代。使雄性个体进行有效欺骗的基因在基因库中往往处于有利地位。

    相反,自然选择却往往有利于善于识破这种欺骗行为的雌性个体。要做到这一点,雌性个体在有新的雄性个体追求时,要显得特别可望而难即,但在以后的一些繁殖季节中,一旦去年的配偶有所表示,就要毫不犹豫,立刻接受。这样对那些刚开始第一个繁殖季节的年轻的雄性个体来说,不论它们是骗子与否,都会自动受到惩罚。天真无邪的雌性个体在第一年所生的一窝小动物中,体内往往有相当高比例的来自不忠诚的父亲的基因,但忠诚的父亲在第二年以及以后的几年中却具有优势,因为它有了一个可靠的配偶,不必每年都要重复那种浪费时间、消耗精力、旷日持久的求爱仪式。在一个种群中,如果大部分的个体都是经验丰富而不是天真幼稚的母亲的子女——在任何生存时间长的物种中,这是一个合乎情理的假设——忠诚而具模范父亲性格的基因在基因库中将会取得优势。

    为简便起见,我把雄性个体的性格讲得似乎不是纯粹的忠诚就是彻头彻尾的欺诈。事实上,更有可能的是,所有的雄性个体——其实是所有的个体——多少都有点不老实,它们的程序编制就是会使它们利用机会去占配偶的便宜。由于自然选择增强了每一个配偶发现对方不忠诚行为的能力,因此使重大的欺骗行为降到了相当低的水平。雄性个体比雌性个体更能从不忠诚的行为中得到好处。即使在一些物种中,雄性个体表现出很大程度的亲代利他主义行为,但我们必须看到,它们付出的劳动往往比雌性个体要少些,而且随时潜逃的可能性更大些。鸟类和哺乳类动物中通常存在这种情况,这是肯定无疑的。

    但是也有一些物种,其雄性个体在抚养幼儿方面付出的劳动实际上比雌性个体多。鸟类和哺乳动物中,这种父方的献身精神是极少有的,但在鱼类中却很常见。这是为什么呢?*这种现象是对自私基因理论的挑战,为此我长时间以来感到迷惑不解。最近卡莱尔(T.R.Carlisle)小姐在一个研究班上提出了一种很有独创性的解释。由此,我深受启发。她以上面我们提及的特里弗斯的“无情的约束”概念去阐明下面这种现象。

    许多种类的鱼是不交尾的,它们只是把性细胞射到水里。受精就在广阔的水域里进行,而不是在一方配偶的体内。有性生殖也许就是这样开始的。另一方面,生活在陆地上的动物如鸟类、哺乳动物和爬虫等却无法进行这种体外受精,因为它们的性细胞容易干燥致死。一种性别的配子——雄性个体的,因为其精子是可以流动的,被引入另一种性别个体——雌性个体的湿润的内部。上面所说的只是事实,而下面讲的却是概念性的东西。居住在陆地上的雌性动物交配后就承受胎儿的实体,因为胎儿存在于它体内。即使它把已受精的卵子立即生下来,做父亲的还是有充裕的时间不辞而别,从而把特里弗斯所谓的“无情的约束”强加在这个雌性个体身上。不管怎样,雄性个体总是有机会事先决定遗弃配偶,从而迫使做母亲的做出抉择,要么抛弃这个新生幼儿,让它死去,要么把它带在身边并抚养它。因此,在陆地上的动物当中,照料后代的大多数是母亲。

    但对鱼类及生活在水中的其他动物而言,情况有很大的差别。如果雄性动物并不直接把精子送进雌性体内,我们就不一定可以说,母亲易受骗上当,被迫照管幼儿了。配偶的任何一方都可以有机会逃之夭夭,让对方照管刚受精的卵子。说起来还存在这样一种可能性:倒是雄性个体常常更易于被遗弃。对谁先排出性细胞的问题,看来可能展开一场进化上的争斗。首先排出性细胞的一方享有这样一个有利条件——它能把照管新生胎儿的责任推给对方。另一方面,首先射精或产卵的一方必然要冒一定的风险,因为它未来的配偶不一定跟着就产卵或射精。在这种情况下,雄性个体处于不利地位,因为精子较轻,比卵子更易散失。如果雌性个体产卵过早,就是说,在雄性个体还未准备好射精时就产卵,这关系不大。因为卵子体积较大,也比较重,很可能集结成一团,一时不易散失。所以说,雌性鱼可以冒首先产卵的“风险”。雄性鱼就不敢冒这样的风险,因为它过早射精,精子可能在雌性鱼准备排卵之前就散失殆尽,那时雌性鱼即使再产卵也没有实际意义。鉴于精子易于散失,雄性鱼必须等待到雌性鱼产卵后才在卵子上射精。但这样,雌性鱼就有了难得的几秒钟时间可以趁机溜走,把受精卵丢给雄性鱼照管,使之陷入特里弗斯所说的进退两难的境地。这个理论很好地说明,为什么水中雄性动物照料后代的现象很普遍,而在陆上的动物中却很少见。

    我现在谈谈鱼类以外的另一种雌性动物采取的策略,即大丈夫策略。在采取这种策略的物种中,事实上,雌性动物对得不到孩子们的爸爸的帮助已不再计较,而把全部精力用于培育优质基因,于是它们再次把拒绝交配作为武器。它们不轻易和任何雄性个体交配,总是慎之又慎,精心挑选,然后才同意和选中的雄性个体交配。某些雄性个体确实比其他个体拥有更多的优质基因,这些基因有利于提高生育子女的机会。如果雌性动物能够根据各种外在的迹象判断哪些雄性动物拥有优质基因,它就能够使自己的基因和它们的优质基因相结合而从中获益。以赛艇桨手的例子来类比,一个雌性个体可以最大限度地减少它的基因由于与蹩脚的桨手搭档而受到连累的可能性。它可以为自己的基因精心挑选优秀的桨手作为合作者。

    一般来说,大多数雌性动物对哪些才是最理想的雄性配偶不会产生分歧,因为它们用以判断的依据都是一样的。结果,和雌性个体的大多数交配是由少数这几个幸运的雄性个体进行的。它们是能够愉快胜任的,因为它们给予每一个雌性个体的仅仅是一些廉价的精子而已。海象和极乐鸟大概也是这种情况。雌性动物只允许少数几只雄性动物坐享所有雄性动物都梦寐以求的特权——一种追求私利的策略所产生的特权,但雌性个体总是毫不含糊,成竹在胸,只允许最够格的雄性个体享有这种特权。

    雌性动物试图挑选优质基因并使之和自己的基因相结合,按照它的观点,它孜孜以求的是哪些条件呢?其中之一是具有生存能力的迹象。任何向它求爱的个体已经证明,它至少有能力活到成年,但不一定就能够证明,它能够活得更久些。凡选择年老雄性个体的雌性个体,同挑选在其他方面表明拥有优质基因的年轻个体的雌性个体相比,前者生的后代并不见得就多些。

    其他方面指的是什么?可能性很多。也许是体现着能够捕获食物的强韧的肌肉,也许是体现着能够逃避捕食者的长腿。雌性个体如能将其基因和这些特性结合起来,可能是有好处的,因为这些特性在它的儿女身上或许能发挥很好的作用。因此,我们首先必须设想存在这样的雌性动物,它们选择雄性个体的根据是表明拥有优质基因的万无一失的、可靠迹象,不过,这里牵涉达尔文曾发现的一个非常有趣的问题,费希尔对之也进行过有条理的阐述。在雄性个体相互竞争,希望成为雌性个体心目中的大丈夫的社会里,一个母亲能为其基因所做的最大的一件好事是,生一个日后会成为一个令人刮目相看的大丈夫的儿子。如果母亲能保证它的儿子将成为少数几个走运的雄性个体中的一个,在它长大之后能赢得社会里大多数的交配机会,那么,这个母亲将会有许多孙子孙女。这样说来,一个雄性个体所能拥有的最可贵的特性之一,在雌性个体看来只不过是性感而已。一个雌性个体和一个相貌非凡并具有大丈夫气概的雄性个体交配,很可能养育出对第二代雌性个体具有吸引力的儿子。这些儿子将为其母亲生育许多孙子孙女。我们原来认为雌性个体选择雄性个体是着眼于如发达的肌肉这种显然是有实用价值的特性,但是这种特性一旦在某一物种的雌性个体中普遍被认为是一种具有吸引力的东西时,自然选择就会仅仅因为它具有吸引力而继续有利于这种特性。

    雄极乐鸟的尾巴作为一种过分奢侈的装饰,可能是通过某种不稳定的、失去控制的过程进化而来的。*在开始的时候,雌性个体选中尾巴稍长一些的雄性个体,在它心目中这是雄性个体的一种可取的特性,也许是因为长尾象征着健壮的体魄。雄性个体身上的短尾巴很可能是缺乏某种维生素的象征——说明该个体觅食能力差。短尾巴的雄性动物还可能不善于逃避捕食者,因此尾巴被咬掉一截。请注意,我们不必假定短尾巴本身是能够遗传的,我们只需假定短尾巴可以说明某种遗传上的缺陷。不管怎样,我们可以假定,早期的极乐鸟物种中,雌鸟偏爱尾巴稍微长一些的雄鸟。只要存在某种促进雄鸟尾巴长度发生自然变化的遗传因素,随着时间的推移,这个因素就会促使种群中雄鸟尾巴的平均长度增加。雌鸟遵循的一条简单的准则是:把所有的雄鸟都打量一番,并挑选尾巴最长的一只,如此而已。背离这条准则的雌鸟准会受到惩罚,即使尾巴已经变得如此之长,实际上成了雄鸟的累赘。因为如果一只雌鸟生出的儿子尾巴不长,它的儿子就不可能被认为是有吸引力的。只有在尾巴确实已长到可笑的程度,以至于它们明显的缺点开始抵消性感这方面的优点时,这个趋向才得以终止。

    这是个令人难以接受的论点,自达尔文初次提出这个论点并把这一现象称为“性选择”以来,已有不少人对之表示怀疑。扎哈维就是其中之一,他的“狐狸,狐狸”论点我们已经看过了。他提出截然相反的“不利条件原理”(handicap principle)。*他指出,正是因为雌性个体着眼于选择雄性个体的优质基因,才使雄性弄虚作假有了市场。雌性个体看重的发达肌肉可能真的是一个优点,但有什么可以阻止雄性个体卖弄假肌肉呢?这些假肌肉并不比我们人类的棉花垫肩更具实质内容。如果雄性个体卖弄假肌肉反而比长出真肌肉省事,性选择应有利于促使个体长出假肌肉的基因。可是,要不了多久,逆选择(counter-selection)将促使能够看穿这种欺骗的雌性个体进化。扎哈维的基本前提是,雌性个体终将识破虚假的性卖弄。因此他得出的结论是,真正能够成功的是那些从不故弄玄虚的雄性个体。它们掷地有声地表明它们是老老实实的。如果我们讲的是肌肉,那么,装出肌肉丰满的样子的雄性个体很快就要为雌性个体所识破。反之,以相当于举重等动作显示其肌肉真正发达的雄性个体是能够获得雌性信赖的。换句话说,扎哈维认为,一个大丈夫不仅看上去要像一个健全的雄性个体,而且要真的是一个健全的雄性个体,否则不轻信的雌性个体是会嗤之以鼻的。所以,只有是货真价实的大丈夫的炫耀行为才能进化。

    到现在为止,扎哈维的理论还没有什么问题。下面我们要谈的是他理论中使人难以接受的那一部分。他认为,尽管极乐鸟和孔雀的长尾巴、鹿的巨角以及其他的性选择的特性看起来是这些个体的累赘(不利条件),因而始终是不合理的现象,但这些特征得以进化正是因为它们构成不利条件。一只雄鸟长了一条长长的、笨重的尾巴,为的是要向雌性个体夸耀,说明尽管它有这样一条长尾巴,像他这样一个健壮的大丈夫还是能够活下去的。

    这个理论很难使我信服,尽管我所持的怀疑态度已不像我当初听到这个论点时那么坚决。当时我就指出,根据这种理论可以得出这样的逻辑结论:进化的结果应该使雄性个体只有一条腿和一只眼睛。扎哈维是以色列人,他立即反驳我说:“我们最好的将军中有些是独眼的!”不过问题还是存在的。不利条件的论点似乎带有根本性的矛盾。如果不利条件是真实的——这种论点的实质要求不利条件必须是真实的——不利条件本身正如它可能吸引雌性个体一样,肯定同样对该个体的后代是一种惩罚。因此不管怎样,至关重要的是这个不利条件不能传给女儿。

    如果以基因语言来表达不利条件理论,我们大概可以这样说:使雄性个体长出如长尾巴之类的累赘物(不利条件)的基因在基因库里变得多起来,因为雌性个体选择身负累赘物的雄性个体。这种情况的产生是因为,使雌性个体做出这种选择的基因在基因库里也变得多起来的缘故。这是因为对身负累赘物的雄性个体有特殊感情的雌性个体往往会自动地选择在其他方面拥有优质基因的雄性个体。理由是,尽管身负这种累赘物,但这些雄性个体已活到成年,这些拥有“其他”方面优点的基因将使后代具有健壮的体格。而这些具有健壮体格的后代因此得以存活并繁殖使个体生长累赘物的基因,以及使雌性个体选择身负累赘物的雄性个体的基因。倘若促使生长累赘物的基因仅仅在儿子身上发挥作用,就像促使对累赘物产生性偏爱的基因仅仅影响女儿那样,这个理论也许可以成立。如果我们只是用文字对这个理论进行论证,我们就无从知道这个理论是否正确。如果我们能以数学模型来再现这种理论,就能更清楚地看到它的正确程度。但到目前为止,那些试图以模型来表现不利条件原理的数学遗传学家都失败了。这可能是因为这个原理本身不能成立,也可能是因为这些数学遗传学家水平不足。其中有一位失败者便是史密斯。但我总感觉到前者的可能性较大。

    如果一只雄性动物能以某种方式证明它比其他雄性动物优越,而这种方式又无须故意使自己身负累赘,那么它无疑会以这种方式增加自己在遗传方面取得成功的可能性。因此,海象赢得并确保拥有它们的“妻妾”,靠的不是它对雌性个体具有吸引力的堂堂仪表,而是简单的暴力——把妄图接近其“妻妾”的任何雄性海象撵走。“妻妾”的主人大都能击败这种可能的掠夺者,它们之所以拥有“妻妾”显然是因为它们有这样的能力。掠夺者很少能取胜,因为它们如能取胜,它们早该成为“妻妾”的主人了!因此,凡是只同“妻妾”的主人交配的雌性海象,就能使它的基因和健壮的雄性海象相结合,而这只雄性海象有足够的能力击退一大群过剩的、不顾死活的单身雄性海象发动的一次又一次的挑衅。这只雌性海象的儿子如果走运的话,就能继承父亲的能力,也拥有一群“妻妾”。事实上,一只雌性海象没有很大的选择余地,因为如果它有外遇,它就要遭到“妻妾”主人的痛打。不过,跟能在搏斗中取胜的雄性个体结合的雌性个体能为其基因带来好处,这条原理是站得住脚的。我们已经看到这样一些例子,即一些雌性个体愿意和拥有领地的雄性个体交配,另外一些愿意和在统治集团里地位高的雄性个体交配。

    至此本章的内容可以归结为:动物界中各种不同的繁殖制度——一雌一雄、雌雄乱交、“妻妾”等等——都可以理解为雌雄两性间利害冲突所造成的现象。雌雄两性的个体都“想要”在其一生中最大限度地增加它们的全部繁殖成果。由于精子和卵子在大小和数量方面存在根本差别,雄性个体一般来说大多倾向于雌雄乱交,而缺乏对后代的关注。雌性个体有两种可供利用的对抗策略,我在前面曾称之为大丈夫策略和家庭幸福策略。一个物种的生态环境将决定其雌性个体倾向于采取其中的哪一种策略,同时也决定雄性个体如何做出反应。事实上,在大丈夫策略和家庭幸福策略之间还有许多中间策略。我们已经看到,有时候,做父亲的甚至比做母亲的更关心孩子们的生活。本书不打算描述某些具体动物物种的生活细节,因此我不准备讨论是什么促使一个物种倾向于某种繁殖制度而不倾向于另一种繁殖制度。我要探讨的是普遍地存在于雌雄两性之间的差异,并说明如何解释这些差异。因此我不想强调两性间差异不大的那些物种,因为一般来说,这些物种的雌性个体喜欢采取家庭幸福策略。

    首先,雄性个体往往追求鲜艳的色彩以吸引异性,而雌性个体往往满足于单调的色彩。两性个体都力图避免被捕食者吃掉,因此两性个体都会经受某种进化上的压力,使它们的色彩单调化。鲜艳的色彩吸引捕食者,犹如吸引异性伴侣。用基因语言来说,这意味着使个体色彩变得鲜艳的基因比使个体色彩单调的基因更可能被捕食者吃掉而结束生命。另一方面,促使个体具有单调色彩的基因不像促使个体具有鲜艳色彩的基因那么容易进入下一代的体内,因为色彩单调的个体不吸引异性配偶。这样就存在两种相互矛盾的选择压力:捕食者倾向于消灭基因库里色彩鲜艳的基因,而性配偶倾向于消灭色彩单调的基因。和其他许多情况一样,有效的生存机器可以被认为是两种相互矛盾的选择压力之间的折中物。眼下使我们感兴趣的是,雄性个体的最适折中形式似乎不同于雌性个体的最适折中形式。这种情况当然和我们把雄性个体视为下大赌注以博取巨额赢款的赌徒完全一致,因为雌性个体每生产一个卵子,雄性个体就可以生产数以百万计的精子,因此种群中的精子在数量上远远超过卵子,所以任何一个卵子比任何一个精子实现性融合(sexual fusion)的机会要大得多。相对而言,卵子是有价值的资源。因此,雌性个体不必像雄性个体那样,具有性吸引力就能保证它的卵子有受精的机会。一个雄性个体的生殖能力完全可以使一大群雌性个体受孕,生育出一大批子女。即使一只雄性个体因为有了美丽的长尾巴而引来了捕食者或缠结在丛林中而过早死亡,它在死以前可能已经繁殖了一大群子女。一只没有吸引力的色彩单调的雄性个体,甚至可能和一只雌性个体同样长寿,但它子女却很少,因而它的基因不能世代相传。一个雄性个体如果失去了它不朽的基因,那它即使占有了整个世界又将怎么样呢?

    另一个带有普遍性的性区别是,雌性个体在和谁交配的问题上比雄性个体更爱挑剔。不管是雌性个体还是雄性个体,为了避免和不同物种的成员交配,这种挑剔还是必要的。从各个方面来看,杂交行为是不好的。有时,像人和羊交配一样,这种行为并不产生胚胎,因此损失不大。然而,当比较接近的物种如马和驴杂交时,这种损失至少对雌性配偶来说可能是相当大的——一个骡子胚胎可能由此形成,并在它的子宫里待上11个月。骡子消耗母体全部亲代投资的很大一部分,不仅包括通过胎盘摄取的食物,以及后来吃掉的母乳,而且最重要的是时间,这些时间本来可用于抚养其他子女的。骡子成年以后却是没有繁殖力的。这可能是因为尽管马和驴的染色体很相像,能使它们合作孕育一个健壮的骡子躯体,但它们又不尽相像,以致不能在减数分裂方面进行适当的合作。不管确切的原因是什么,从母体基因的观点来看,母体为抚育这只骡子而花掉的非常多的资源全部浪费了。雌驴应当十分谨慎,和它交配的必须是一头驴子,不是一匹马。任何一头驴子基因如果说“喂,如果你是雌驴,那就不管它是马还是驴,只要它是成年的雄性个体,你都可以和它交配”,这个基因下次就可能跑到骡子的体内,结果将是死路一条。母体花在这只幼骡身上的亲代投资将大大降低它养育有生殖力的驴子的能力。另一方面,如果雄性个体和其他不同物种的成员交配,它的损失不会太大,尽管它从中也得不到什么好处。但我们却可以认为,在选择配偶的问题上,雄性个体不致过分苛求。凡是对这种情况进行过研究的人都会发现情况确实是如此。

    即使在同一物种中,挑剔的情况还是会有的。同一血族之间的交配和杂交一样可能产生不利的遗传后果,因为在这种情况下,致命的或半致命的隐性基因会获得公然活动的机会。这种情况再次使雌性个体的损失比雄性个体大,因为母体花在某一幼儿身上的资源总是要大些。凡是禁忌乱伦的地方,我们都可以认为雌性个体会比雄性个体更严格地遵守这种禁忌。如果我们假定在乱伦关系中,年龄较大的一方相对来说更有可能是主动者的话,那么我们应该看到,雄性个体年龄比雌性个体年龄大的乱伦行为一定较雌性个体年龄比雄性个体年龄大的乱伦行为普遍,譬如说,父-女乱伦应该比母-子乱伦更普遍。兄弟姐妹乱伦行为的普遍性介乎两者之间。

    一般来说,雄性个体比雌性个体往往具有更大的乱交倾向。雌性个体只能以比较慢的速度生产有限的卵子,因此,它和不同的雄性个体进行频繁的交配不会有什么好处。一方面,雄性个体每天能够生产数以百万计的精子,如果它利用一切机会和尽量多的雌性个体交配,它只会从中得到好处而不会有任何损失。过于频繁的交配行为事实上对雌性个体的害处并不很大,但好处肯定也是没有的。另一方面,雄性个体却能乐此不疲,不管它和多少个不同的雌性个体交配。“过度”这个字眼对雄性个体来说没有实际意义。

    我没有明确地提到人类,但当我们思考如本章涉及的一些有关进化的论点时,不可避免地要联想到我们自己的物种和我们自己的经验。雌性个体只有在对方在一定程度上表明能够长期忠贞不渝时才肯与之交配,这种做法对我们来说并不陌生。这可能说明,人类的妇女采取的是家庭幸福策略,而不是大丈夫策略。人类社会事实上大多数实行一夫一妻制。在我们自己的社会里,父母双方对子女的亲代投资都是巨额的,而且没有明显的不平衡现象。母亲直接为孩子们操劳,所做的工作比父亲多。但父亲常常以比较间接的方式辛勤工作,为孩子们提供源源不断的物质资源。另一方面,有些人类社会有杂交习俗,有些则实行妻妾制度。这种令人惊讶的多样性说明人的生活方式在很大程度上取决于文化而不是基因。然而,更大的可能性是,男人大多倾向于杂交,女人大多倾向于一夫一妻。根据进化的理论,我们也可以预见到这两种倾向。在一些具体的社会里,哪一种倾向占上风取决于具体的文化环境,正如在不同的动物物种中,要取决于具体的生态环境一样。

    我们人类自己的社会有一个肯定与众不同的特点,这就是性的炫耀行为。我们已经看到,根据进化的理论,凡有不同性别个体存在的地方,喜欢炫耀的应该是男人,女人则喜欢朴实无华。在这一点上,现代的西方男人无疑是个例外。当然,有些男人衣饰鲜艳,有些女人衣饰朴素,这也是事实。但就大多数情况而言,在我们的社会里,像孔雀展示尾巴一样炫耀自己的毫无疑问是女人而不是男人。

    面对这些事实,生物学家不得不感到疑惑,他观察到的社会是一个女人争夺男人而不是男人争夺女人的社会。在极乐鸟的例子里,我们认为雌鸟的色彩之所以朴素是因为它们不需要争夺雄鸟。雄鸟色彩鲜艳华丽,因为雌鸟供不应求,雌鸟可以对雄鸟百般挑剔,因为卵子这种资源比精子稀少。现代的西方男性到底发生了什么变化?男人果真成了被追求的性对象了吗?他们真的因女人供不应求而能对女人百般挑剔吗?如果情况果真如此,那又是为什么呢?

  • 威廉·伯恩斯坦《群体的疯狂》8-15

    8 天启之牛

    时代论如何兴起

    你要对以色列人说,让他们给你牵来一只没有残疾、未曾负轭的红色母牛。 ——《民数记》19:2

    20世纪,一个曾经不为人所知的新教神学分支,突然出现在美国宗教和政治舞台上,发展了一场不仅在美国而且在全球都有影响力的社会运动。毫不夸张地说,这一神学可被称为宗教性群体疯狂——它已经引发了几起小悲剧,并种下了哈米吉多顿的种子。以色列畜牧业中的一个小事件揭示出了它的末日影响力。

    20世纪90年代中期,以色列北部耶斯列山谷的奶牛场主朱比·吉拉德从瑞士进口了一些公牛精液,从而让他的一头荷斯坦母牛怀孕。1996年8月,这头黑白相间的母牛产下了一只纯红色的小母牛梅洛迪。对世界上的少数犹太人和基督教徒来说,小牛的颜色只意味着一件事:末日即将来临。简言之,梅洛迪就是天启之牛。[1]

    与牛有关的灾难就像一条深红色的羊毛线,蜿蜒穿过人类将近3000年的历史。古以色列人认为,凡与死尸接触过的人或是与死尸在同一屋檐下的人,都是不洁净的,因此不能进入耶路撒冷的圣殿。在那个年代,这意味着除了非常小的孩子,几乎所有人都是不洁净的。这种不洁只有通过一种仪式才能消除,正如上文《民数记》中所提到的那样,要通过一个宗教仪式;祭司们祭献一只纯红色皮毛的母牛(一只从未生育过、从未劳作过、没有瑕疵的小母牛),把它与红毛线、香柏木和牛膝草一起烧在火堆上,在能够俯瞰圣殿的橄榄山上举行仪式。在那里,他们把小母牛的骨灰和从西罗亚池中汲取的泉水混合在一起。只有在人死后的第三天和第七天,把灰水洒在不洁的信徒身上,不洁才得以消除。[2]

    但70年,罗马人摧毁了耶路撒冷第二圣殿,使这一复杂的洁净过程不再可行。1000年后,中世纪伟大的犹太智者迈蒙尼德试图理解这一现在看起来毫无意义的净化仪式。

    迈蒙尼德于1135年左右出生于伊斯兰教占主导的西班牙,他在学业上表现出色,从事医师工作,后来在十字军入侵的动荡时期成为埃及开罗犹太社区的首席拉比。他影响最久远的成就是《律法再述》,一部关于道德和犹太律法的汇编作品。但是,这位伟大学者也对净化仪式的逻辑依据感到困惑,他将其归类为一个谜,“不是由一个人的理解所能决定的事情”[3]。但他愿意提供这一仪式的发展历史:

    第一只(神圣的红母牛)是我们的老师摩西带来的,第二只是以斯拉带来的,第二圣殿被毁之前,还出现了另外的(第三至九只)。第十只将会由君王弥赛亚带来;愿他早日出现。阿门,这是神的旨意。[4]

    对某些犹太人和基督徒来说,梅洛迪的意义如此清晰:她是第十只红色小母牛,预示着弥赛亚的到来。有一小部分人相信,一只完美的红色小母牛的诞生,预示着下列事件将依次发生:信徒们即将“被提”至天堂极乐之处;一场可怕的大灾难,包括与反基督者之间的巨大战争、全球混乱和地狱之火;耶稣复临和他千年的统治;上帝的最后审判;世界末日。

    小红牛梅洛迪的故事之所以引起共鸣,是因为它触及了最著名、最危险的群体幻想的核心——末日叙事,这种叙事像一条红线一样贯穿人类历史。进入现代时期,类似这样的末日叙事已经产生了大量悲剧,从灾难性的再洗礼派的疯狂,到更多相对小范围内的悲剧,例如太阳圣殿教的悲剧。

    在过去的半个世纪里,一种新的、极具特色的末日叙事出现,现在已经被大多数福音派新教徒信奉,即“时代论”。它产生了一种遍布美国的信仰体系,并把美国社会分成世界观截然不同的两个阵营。最令人恐慌的是,在某个将来,一个类似于梅洛迪的故事将成为一个灾难性的自我实现的预言,只不过和犹太人、基督徒以及穆斯林想象的方式不同。

    在梅洛迪出生后不久,一位名叫伊斯拉尔·阿里尔的原教旨主义拉比发现了它。在他宣布小母牛符合要求后,它的故事进入主流媒体的视线;然后随着美国和欧洲主要电视网络的播放,这个有趣的故事传遍全球。

    以色列人不高兴:当地一位记者将梅洛迪称为“四足炸弹……其会让整个地区陷入灾难,威力可与伊朗阿亚图拉手中的非常规性武器相比”[5]。幸运的是,梅洛迪的饲养员在它出生后不久就发现它的乳房上有白毛;在它1岁的时候,尾巴上出现了更多白毛,因此拉比们宣布它不符合要求。(它原本应该长到3岁,成为一只成熟小母牛后才有资格参加献祭仪式。)

    梅洛迪的犹太故事背景,与闵采尔起义、疯狂的再洗礼者、第五君主国派以及米勒主义等基督教末日神学之间有非常明显的相似性。从神学角度,这四个基督教插曲中有三个是“前千禧年主义”——耶稣的回归发生在千禧年之前,而千禧年还没有发生。(第四、第五君主国派既有前千禧年信徒,也有后千禧年信徒。)耶稣复临触发了千禧年,这必然是一个戏剧性的、通常是暴力性的事件。

    相反,现代天主教和大多数主流新教教派则主要继承了早期、更传统的圣奥古斯丁的末日神学,淡化了千禧年的概念:耶稣不会戏剧化地复临并统治千年。因此,这种更传统的“非千禧年主义”是一个更为平静的过程,而且“坏消息比好消息强大”这一心理学准则,让这一过程不那么引人注目。

    19世纪后半叶,末日叙事演变为一个更加充满戏剧性、暴力、扣人心弦的版本。这一信条越来越影响普通美国人的生活:世界腐败不堪,仅靠人类自身的努力无法拯救或改进;只有依靠上帝,以极乐、苦难、决战和最终审判的方式进行干预才足够。

    这种末日序列不符合公认的天主教或传统的新教教义。一个多世纪前,大西洋两岸的大部分主流基督教派都抛弃了《圣经》字面真理的概念,它们逐渐离间了相当一部分信徒;但即使在今天,根据美国两大著名调查机构盖洛普和皮尤的民意调查,约25%的美国人仍然相信圣经是上帝的真言。同样有约25%的人相信耶稣会在他们的有生之年回到地球,61%的美国人认为撒旦存在。这些比例在20世纪早期更高。[6]这些美国信徒不愿意放弃《圣经》字面真理的舒适感,不愿意接受现代科学知识,不愿意接受主流教会在是否承认犹太教、天主教或无神派正统性方面的含糊态度。

    其结果就是时代论的出现,它恢复了《圣经》字面真理的舒适感,同时也恢复了大量的老式摩尼教式思想,将世界在善与恶之间进行了明确的黑白分离,信徒们被安稳地放置在原来的阵营中。[7]

    时代论信仰体系已经深植于美国的政治体系之中。至少有一位美国总统,即罗纳德·里根赞同这一体系,像迈克·彭斯、迪克·阿梅、米歇尔·巴赫曼和迈克·哈克比等政治家也赞同这一体系。事实上,它的信条几乎渗透到国家话语的每一个方面,特别是一些社会争议问题,如堕胎和同性恋权利问题,以及外交政策问题,尤其是与充满冲突的中东有关的问题。

    19世纪中期,大概是威廉·米勒的末日论在美国盛行的时期;在英国,一位名叫约翰·纳尔逊·达比的爱尔兰圣公会教徒点燃了一条神学导火索,其经过缓慢燃烧,最终爆发于一个世纪之后。

    与谦逊而不起眼的米勒不同,达比在才智和社交上都很有天赋。1800年,达比出生在一个富商家庭,他的叔叔因在尼罗河河口海战中跟随英国海军少将霍雷肖·纳尔逊而被封为爵士,他也由此获得了纳尔逊这个中间名。他在都柏林圣三一大学获得文学、拉丁语和希腊语的金奖章,并加入了爱尔兰律师公会。1826年,他发现法律不能令他满意,便加入英国国教爱尔兰圣公会。父亲对于他放弃律师职业非常失望,因此剥夺了他的继承权。

    头脑活跃的达比很快就对僵化和等级森严的英国圣公会不再抱有幻想;受命仅仅一年后,他参加了一个关于《圣经》预言的会议,并得出一个像马丁·路德那样的结论:真正的教派可以是任何一组真正相信基督的人组成的,他们是上帝任命的,将人类从耶稣受难带到耶稣的第二次降临。

    在达比的信仰体系中,关键内容是一系列的五个“时代”或者说历史时期,因此神学家给这一体系起了一个正式的名字:时代论前千禧年主义。在这些时期里,上帝考验人类;但达比的上帝显然是按照一条非常严格的曲线[8]来评分的,因此,人类在通往现代的前四个时代中都不及格。和《启示录》的作者一样,达比很聪明,他的著述甚多但晦涩难懂,留待他人去澄清他的每个时代的确切性质。达比后来的追随者将时代数量扩大到今天所使用的7个:[9]

    1.无罪时代,从亚当和夏娃被创造到被逐出伊甸园。

    2.良知时代,从伊甸园到被驱逐到挪亚方舟。

    3.人治时代,从挪亚方舟到亚伯拉罕。

    4.应许时代,从亚伯拉罕到摩西。

    5.律法时代,从摩西到耶稣。

    6.恩典时代,达比真教会的当前时期,从耶稣受难到耶稣第二次降临。

    7.千禧年时代,最后的耶稣统治时代。

    《圣经》里有很多充满矛盾的章节,而达比的时代体系的绝妙之处就在于,它通过将《圣经》内容分成各个独立的时代,消除了许多混乱,从而减少了章节之间的内部冲突。从解经的晦涩和内部章节矛盾的方面来看,许多神学家认为,达比的这种重新排列把《圣经》组织成一个更加连贯的整体,创造了一个绝妙之作。

    所有有组织的教派,除了其神学或信仰体系之外,还有一个“教会学”,即组织结构。达比的教会学被称为福音集会,即一位有魅力的领袖人物组织的小团体,这位领袖主宰着团体的福音真理。达比有意不给聚会命名,但人们非正式地称之为“上帝的教会”,或者更简单的“兄弟会”,其中最著名的是普利茅斯兄弟会。

    与现代美国基督教原教旨主义热烈的教堂仪式形成鲜明对比的是,兄弟会的集会主要专注于一些知识性活动,其方法论与米勒的方法论相似。米勒的方法论会在《圣经》中追踪某个单词,例如“创造”。由于《圣经》中蕴含强大的智慧,但在表述上有大量的含糊其词,因此这场运动很快就变得非常激烈。但是,所有兄弟会成员都同意该运动的基本宗旨,即把世界分为犹太人、基督徒和其他所有人(异教徒)。他们进一步同意保罗写给帖撒罗尼迦人的第一封信[10]的中心地位。这封书信中有两段关键经文:

    因为主必亲自从天降临,有呼叫的声音和天使长的声音,又有神的号吹响,那在基督里死了的人必先复活。

    以后我们这活着还存留的人必和他们一同被提到云里,在空中与主相遇。这样,我们就要和主永远同在。[11]

    对那些接受《圣经》字面真理的人来说,这两段经文的意思很清楚。最后,耶稣半途降下,让所有真基督徒聚集到云中;去往天堂的半途,首先是复活的死者,然后是活人:这就是“被提”。

    达比的普利茅斯兄弟会随后跳转到《启示录》的幻象叙事,大致的顺序:7年不可言喻的恐怖大灾难;耶稣战胜撒旦和他的军队;1000年的和平以及与撒旦的另一场短暂战斗;生者和死者的最终审判。那些在大灾难期间留在地上的人,凭借他们在混乱中的悔改,也有资格获得救赎。(这种叙事被一个多世纪之后的很多原教旨主义小说利用,例如蒂姆·莱希和杰里·詹金斯的《末世迷踪》系列。)[12]

    在就读圣三一大学期间,达比受到皇家神学教授理查德·格雷夫斯的影响。格雷夫斯当时广受欢迎,他讲授的经典著作和神学启发了一代又一代的学生。根据格雷夫斯的说法,犹太人将回到圣地并接受耶稣,然后带着刚刚皈依的热情,引导其他人找到救世主。犹太人的返乡和皈依会加速末日的到来,所以真正的基督徒有责任帮助犹太人返回圣地。和过去以及之后的千禧年派一样,格雷夫斯寻找能够证实圣经预言的当前事件,而土耳其对巴勒斯坦统治的削弱和英国海军力量的崛起就证实了《圣经》预言。[13]格雷夫斯的这种犹太人和基督徒的“联盟”被称为“基督教犹太复国主义”,并将与“犹太复国主义”配合,在接下来的一个半世纪里获得越来越强大的力量。

    与疯狂的再洗礼派以及第五君主国派起事一样,到了20世纪末,千禧年派成为一个潜在毁灭性的自我实现的预言,原因有二:第一,与格雷夫斯、达比和兄弟会一样,千禧年派的叙事以圣地为中心,而这一地区是现代世界的火药桶;第二,在过去的几十年里,时代论者开始影响美国的外交政策,并控制了军事武器,这些武器可以一举焚毁大部分人类,根本不需要《但以理书》和《启示录》里“猛兽”的帮助。

    时代论在美国获得了最热烈的追随和拥护;但它在发源地——不列颠群岛,或者说所有其他发达国家的影响力要小得多。

    19世纪早期至中期,是西方科学发展的重大转折时期。查尔斯·达尔文的《物种起源》在1859年出版;科学家们逐渐意识到,地球的年龄比《圣经》中所述的6000年要多得多。1779年,法国科学家布丰用加热的球体模拟了地球的冷却过程,估计地球的年龄为75000年;1862年,物理学家威廉·汤姆森——受勋后的名字为开尔文男爵——认为地球的年龄是2000万到4亿年。随着实验室技术的不断进步,估计值不断增加,到20世纪中期,对地球年龄的共识为46亿年;而对宇宙年龄的估计值是过去的3倍。这些事实使许多基督教徒感到不安,例如,兄弟会拒绝接受达尔文的观点,并努力将地质时间概念融入对《创世记》的解释中。[14]

    在这些科学发现之前,著名政治家和科学家经常涉足末日论。最值得注意的是,艾萨克·牛顿刊登了一整套研究成果,在他死后,其被整理成一套文集,以阐述《但以理书》和《启示录》的意义。[15]

    约瑟夫·普里斯特利在18世纪中期所接受的教育,和那时几乎所有的高等教育一样,是神学的;他以牧师的身份开始了他的职业生涯,但很快就对自然科学产生了兴趣。在自然科学中,他在电、气体的性质等方面进行了早期的开创性工作,尤其著名的是他发现了氧气。与牛顿一样,普里斯特利也广泛参与了《圣经》预言,其中包括犹太人返回巴勒斯坦的猜测:

    犹太人目前的分散状态是从摩西开始的一系列预言的主题,如果像预言那样,这个杰出的民族能够重回自己的地区并建造一个繁荣的国家,那么,我想,就很少有人会怀疑预言之灵的真实性。[16]

    普里斯特利于1804年去世,是最后一位将预言与科学相结合的备受关注的自然哲学家;在达尔文进化论和地质学繁荣之后,任何一位把《圣经》作为他们对物理或生物科学信仰的基础的主流科学家都将招致同行的嘲笑。同样,这些新的科学知识还摧毁了许多基督教信徒和神职人员对《圣经》字面真理的信念。

    首先在《圣经》真理无误方面改变立场的是德国神学家,他们把《圣经》的叙事看作寓言而不是事实。这一思想流派被称为“高等批判主义”。19世纪,这一运动蔓延到英格兰,逐渐被等级森严、受过高等教育的圣公会神职人员接受;到19世纪末,字面解经的兄弟会发现自己在本国被边缘化了。此外,像达比这样的时代论智者们,当他们投身于模棱两可的《圣经》文本时,会产生一种固有的离心力,这种离心力使英格兰兄弟会分裂成几十个没有影响力的教派,甚至在某些情况下,这些教派成为人们嘲笑的对象。[17]

    在美国基督教的神学自由中,时代论找到了更肥沃的土壤。美国不仅缺乏英国式的等级制国家教会,而且美国人的性格也截然不同。19世纪,是真正的英国人的世纪,是一个极度乐观的时期,在这一时期,英国人对技术进步有几近绝对的信心,他们能够主导全球趋势。这种心态与时代论对人性的灰暗评价不同。尽管美国最初也认为自己是新耶路撒冷,是全人类的灯塔,但内战粉碎了这一信念,这个伤痕累累的国家更容易接受悲观主义的达比和兄弟会。战后,达比和兄弟会在美国巡演了15年。达比本人每次都要花上几个月的时间访问美国主要城市,并在那里和他的同事们传播时代论信条。

    时代论在美国招募的最重要的新成员是德怀特·穆迪、司可福、加尔布莱恩。其中,穆迪是一位狂热的福音派传教士,他在英国旅游时与兄弟会接触过,后来在美国与达比相遇。起初,出身卑微的穆迪和贵族知识分子达比相处得并不好,但随着时间的推移,穆迪的坚毅赢得了达比的赞赏。[18]此外,穆迪还有达比所缺乏的优势:他在大西洋两岸的教堂、体育场和公园聚集了成千上万的信徒。达比死后4年,也就是1886年,穆迪创立了芝加哥福音社(在他死后更名为穆迪圣经学院)。在接下来的几十年里,其培养了几十名美国著名的时代论者。

    之后,超过50所福音社在美国建立,其主要目标是推动基于《圣经》字面真理的预言,并打击主流新教教派中以科学为中心的“高等批判主义”。1924年,一位名叫刘易斯·斯佩里·蔡弗的奥伯林毕业生,创办了著名的福音神学院。12年后,他将学院更名为达拉斯神学院。[19][20]达拉斯神学院是大多数无宗教信仰的美国人未曾听说过但最重要的教育机构。它培养了许多时代论运动的最高领导人,其在福音圈被称为“达拉斯人”,对其他的时代论者影响很大。

    第二个早期美国时代论的关键人物是司可福。他是美国内战时期南方军队的一名退伍军人,在内战结束后从事法律工作,曾担任过堪萨斯州的立法委员和律师。1879年,受到一位名叫詹姆斯·布鲁克斯的时代论领袖的影响,司可福突然皈依了福音教。詹姆斯·布鲁克斯是尼亚加拉圣经会议的组织者,1876—1897年,尼亚加拉圣经会议每年在安大略省的尼亚加拉湖滨小镇举行。司可福还接触了穆迪和早期美国第三位重要的时代论者加尔布莱恩。

    尼亚加拉圣经会议强调了时代论在美国比英国更为盛行的另一个原因,即美国宪法对宗教的不干涉态度鼓励了各色新教教派的发展。布鲁克斯欢迎他们所有人到尼亚加拉湖滨小镇。这避免了英国运动那样的激烈内讧。至今,合一运动精神广泛存在于美国教会中,他们愿意接纳时代论的末日叙事。

    加尔布莱恩比达比更加具有非凡的才智,1879年,18岁的他从德国移民到美国,之后学习了拉丁语、希腊语,尤其是意第绪语[21],试图改变纽约犹太人的信仰,甚至创办了一家意第绪语报社。他还创办了一家英语报社,其报纸提供给包括蔡弗和司可福在内的美国原教旨主义者阅读。加尔布莱恩的才华打动了蔡弗和司可福,司可福开始编写钦定版《圣经》的注释版本,于1909年首次出版了《司可福串注圣经》,这本书又进一步鼓舞了蔡弗创建后来的达拉斯神学院。

    《司可福串注圣经》非常重要。宗教史学家认为它是最有影响力的、独一无二的时代论出版物,至今仍对现代基督教原教旨主义存在影响。1909年版本的销量为300万册,而1967年版本的销量超过1000万册;在过去的一个世纪里,这两个版本指导了大批美国人了解时代论体系。[22]

    加尔布莱恩、司可福和穆迪,这三个人与布鲁克斯的尼亚加拉圣经会议之间的联系,标志着时代论学说开始与地缘政治纠缠。1878年,布鲁克斯创立了“十四点信条”,其在1890年尼亚加拉圣经会议上被正式采纳。十四点中的最后一点:

    我们相信,在当前的宽免下,世界不会皈依,但将很快成熟并等待审判,同时基督教内部会有可怕的变节;因此,主耶稣将亲自主持千禧年时代,届时以色列人将重新回到自己的土地……主耶稣和千禧年前的降临,是福音中摆在我们面前的蒙福,我们要不断寻祈。[23]

    至此,达比及其追随者对犹太人的重返一直保持严格的不干涉立场。基督教徒认为,他们应该最多是对“被提”和“千禧年”进程感兴趣的观察员,但在“被提”和“千禧年”这两个时代之间的“大灾难”时代,他们应该将行为限制在拯救灵魂上。在任何情况下,他们都不会试图通过鼓励或帮助犹太人返回巴勒斯坦来触发这一进程。但是,这一被动的做法随着罗伯特·安德森、威廉·布莱克斯通、亚瑟·贝尔福、奥德·温盖特等基督教犹太复国主义者的出现而改变了。为了使犹太人重返圣地,他们使用了强大的修辞和政治力量,尤其是温盖特,他以英国军官的身份使用武力,以最暴力的方式违反了达比的不干涉政策。

    和达比一样,安德森出身于爱尔兰贵族阶层,曾在都柏林圣三一大学学习法律,在英国内政部拥有卓越的职业生涯。他后来去往苏格兰场[24],指导“开膛手杰克”案件[25]的调查。在那个时代,他能够置身于两个完全不同的群体(一个是时代论阵营,一个是统治贵族阶层),这是非比寻常的。因此,在当时以及后来土耳其统治巴勒斯坦时期,他在英国对巴勒斯坦的外交政策方面有一定的影响。尽管在英国,兄弟会已经是社会和神学上的弃儿,但安德森还是非常钦佩达比,他还认识司可福和穆迪。此外,他在任职于英国内政部的几十年里,还经常与各届首相接触,其中包括格莱斯顿、阿斯奎斯、索尔兹伯里,以及宿命般的贝尔福。[26]

    安德森被普利茅斯兄弟会一位名叫本杰明·威尔斯·牛顿的人写的书迷住了。这本书名为《十大王国的前景》,出版于1863年,并不出名。书中,牛顿把关注点集中在《但以理书》中的10个脚趾上:当时的基督徒将泥足解释为罗马帝国,牛顿进一步认为泥足的10个脚趾代表了罗马帝国的10个民族或王国。牛顿设想,除了犹太人重返巴勒斯坦的古老预言以外,末日的第二个迹象,就是这10个古老的王国重新组成一个新的罗马帝国:

    最后划分为10个王国,用10个脚趾表示,这是末日之前的事件,并且可能与以色列在自己的土地上建立国家同时发生。[27]

    牛顿认为,拿破仑战争和1815年维也纳会议之后,欧洲各地建立的各个现代民族国家,构成了这个新罗马帝国。这些事件无疑预示着末日即将来临,因为:

    英国、比利时、法国、阿尔及利亚、葡萄牙、西班牙、意大利、奥地利和希腊建立的政府,事实上或实际上是民主君主制的政府。君士坦丁堡[28]、埃及和突尼斯的人们对西欧国家的支持表明了这一时期的到来,即泥与铁的混合将恰如其分地代表整个罗马帝国的政府权力特征。[29]

    由反基督者领导的十国组成了复兴的罗马帝国。这一概念是一个极好的确认偏见的例子。这一预言在时代论者中越来越流行,以至于几乎所有包含数字10的《圣经》经文都被视为古罗马重新组合的预言。例如,达比也对《启示录》中的十角兽[30]印象深刻:

    路易·拿破仑是不是反基督者,这个问题引起了人们极大的兴奋,所以我补充一下。我毫不怀疑目前他是拉丁人[31]或十角兽的伟大代理人,他的行动清楚地标志着最后一幕的临近。上帝保佑![32]

    1881年,安德森在牛顿的启发下出版了《将临的君王》,它是一部大胆而富有挑衅性的预言著作,流传至今(所有时期的时代论者都是激进的;在这一点上,牛顿是一个独立的浸信会教徒,他强烈批评时代论)[33]。安德森的社会地位,使他能够自主地发展一个预言体系,并且这一体系成为20世纪晚期杰瑞·法威尔和哈尔·林赛的可怕预言的基础,而同样以此预言体系为基础的蒂姆·莱希和杰里·詹金斯的小说则更为惊悚,且销量惊人。

    19世纪晚期,安德森对时代论的解释,直接源于《但以理书》9:24-27,对于理解今天美国新教原教旨主义的根源至关重要。《但以理书》中的这四节,描述了犹太人从巴比伦流亡归来到弥赛亚降临这两个事件之间的“七十周”(或译作“七十个七”)。令人困惑的是,书中将这段时间细分为三个阶段,分别是7周、62周和最后一周,最后一周又细分为两个半周。(安德森的书名参考的是《但以理书》9:26中的“将要来的君王”,他是领导10国的反基督者。)

    这让人想起千禧年主义对《但以理书》前一章,也就是第八章的关注。第八章提到了圣经中的2300天,也就是从犹太人自巴比伦的归来到末日之间的时间跨度为2300年,因此可以推算出末日时间是1843年或1844年。[34]与此不同,安德森却把注意力集中在70个“周”,也就是以《但以理书》第九章中的490天或年,作为从巴比伦返回到复临之间的时间跨度。从巴比伦结束对犹太人的囚禁到耶稣复临,安德森和千禧年主义对这一时间跨度的估计相差了1810年,这体现出《圣经》预言所固有的棘手性,具体到这里,就是解经者应该如何处理这将近2000年的认知失调。

    处理安德森估计的1810年的缺失需要一个巨大的谎言——把时间暂停。安德森,在耶稣受难的第六十九周按下了末日进程的时间暂停键,此时弥赛亚被“切断”,当反基督者出现时,弥赛亚重新开始。第七十周末日的重新开始时间:

    将会以另一位君主(反基督者)的到来作为预示,他将与犹太人签订7年契约(或条约);在周中(也就是3年半之后),他将违反条约并打压对方的圣殿朝拜和宗教教义。这一切都是那么简单明了,任何聪明的子民都能理解。(原文在括号里。)[35]

    安德森毫不怀疑,目前已经处于这个序列的早期阶段,这一阶段将涉及:

    未来某些欧洲大危机的后果,就是国家联盟得到发展,因此为可怕存在(指末日)的出现预备好了舞台,人类的伟大领袖即将结束外邦人至上的多事之秋时代。[36]

    时代论者已经确定,有两个事件将标志着时间中断的结束(即时间的重启),以及上帝对犹太人的重新关注,并因此带来末日。这两个事件就是犹太人返回圣地、罗马帝国重新组合成反基督者领导的欧洲十国联盟。虽然达比留下了几十卷书,但由于他的散文晦涩难懂,因此读者群体限制在一小部分有文化且信仰坚定的核心真信徒中。而安德森的散文虽然不像红葡萄酒一样流传下来,但是他在《将临的君王》中准确预言了犹太人将返回巴勒斯坦[37],这令此后20世纪的读者们兴奋不已。

    1881年,《将临的君王》出版,这增强了其预言的真诚性。其出版时间比西奥多·赫茨尔出版《犹太国》进而推动第一届世界犹太复国主义大会召开并开创现代犹太复国主义运动早了10多年;比埃德蒙·艾伦比将军从奥斯曼土耳其人手中夺取耶路撒冷早了1/3个世纪。而在这些事件发生之前,在巴勒斯坦建立一个新的犹太国家这一前景看上去很渺茫,甚至安德森写道:

    在许多人看来,以色列复国的预言就像一个世纪前我们的祖先对现在的电力和蒸汽的胜利所做的预言一样令人难以置信。[38]

    即使到今天,安德森关于在巴勒斯坦地区恢复犹太国家这一预言的实现仍然令人震惊。但是,他的新罗马帝国的预言就没有实现,这使得基督教原教旨主义的预言从此陷入困境。例如,理查德·格雷夫斯将1815年后兴起的欧洲君主立宪制国家认定为新罗马帝国;之后的一个半世纪之后,时代论者同样认定欧盟是那个新罗马帝国,但欧盟至今没有产生那个反基督领导者,也没有和以色列结成战略联盟,更不用说入侵以色列了。[39]

    米勒末日预言的失败使人们“大失望”,原教旨主义基督徒吸取其教训,不再进行预言的日期设定。从达比开始,时代论者就被吸引,试图从时事中进行预言,特别是他们把国家集团列为新罗马,把个人列为反基督者。尽管在当时看来,圣经和时事之间的相似性似乎是合理和令人震惊的,但几十年后就能显示出预言家的预言是愚蠢的。

    似乎是觉得这一切还不够复杂。达比具有丰富的时代论想象力,在返回圣地的犹太民族和新罗马帝国之间的最后一场战斗中,他又增添了一个主要角色:北方之王。《但以理书》中反复提到,北方之王是以色列的侵略者。达比认为北方之王是当时的俄国。(达比的计划还包括身份不明的“东方之王”和“南方之王”,后者很可能是埃及。)[40]

    对像达比这样有才智的人来说,找到支持俄国入侵圣地的《圣经》文本很简单。《创世记》10:2中列出了雅弗六个儿子中的两个,也就是米设(Moscow)和土巴(Tobol’sk);在达比狂热的想象中,他们分别代表莫斯科和托博尔斯克,后者位于乌拉尔山脉以东。[41]

    19世纪中后期,强大的沙皇俄国对衰落的奥斯曼土耳其产生威胁,达比断言俄国将从土耳其窃取歌革的土地,然后入侵重建的犹太地区。在20世纪中后期,达比的追随者们继续渲染这个预言:犹太人会与反基督者领导的新罗马帝国结盟,以应对俄国的威胁,反基督者将在三年半后背叛犹太人,结束这个联盟。[42]

    无论这个19世纪的神学推测在今天看来多么复杂、怪异和荒谬,它在近两个世纪中的演变对于理解美国最近的国内政治和外交政策至关重要。从达比、安德森、穆迪、司可福和加尔布莱恩到梅洛迪那只奶牛,再到最近美国时代论信仰的猛增,这条道路漫长而曲折。而接下来会出现一位关键人物,即一位名叫威廉·布莱克斯通的美国商人。

    布莱克斯通可以被看作美国的罗伯特·安德森,他有很广的人脉,是一个热衷于犹太人返回巴勒斯坦地区的时代论者。尽管布莱克斯通出身卑微,但他从岳父那里继承了一大笔遗产,并通过保险业务、节俭、明智的投资以及图书销售,变得更加富有。[43]和安德森一样,他与政府最高层有联系。

    1841年,布莱克斯通出生于纽约州北部,11岁时皈依宗教,后来成为穆迪的亲密伙伴。1886年,他出版了《耶稣来了》,宣扬的核心内容是犹太人回归巴勒斯坦并皈依基督教;这本书最终卖出了100多万册,并被翻译成43种语言。[44]他非常相信时代论者的末日叙事,以至于在1888年左右的某个时候,他把几千本自己的书连同其他希伯来语、意第绪语和亚拉姆语的预言作品,藏在了今天约旦南部佩特拉的周围,这样,“总有一天,在反基督大屠杀中受到惊吓的幸存者们会乐于接受机会,阅读这些上帝的作品”[45][46]

    布莱克斯通致力于数秘主义和历史事件的结合,例如,7年乘以一年360天等于2520天,这个数字与巴比伦占领的时间即公元前606年相加,得出耶稣复临的时间是1914年;而第一次世界大战正是从1914年开始的。但是,正如他在佩特拉周围藏书所表明的那样,他并不反对亲自推动末日时代的到来。

    《耶稣来了》出版若干年后,西奥多·赫茨尔在瑞士巴塞尔组织了犹太复国主义者大会。随后的几十年中,布莱克斯通通过他的芝加哥希伯来人使团谨慎地与犹太复国主义者合作,甚至在他写完《埋葬在约旦》一书后,召集了一次基督教前千禧年主义者和犹太复国主义者的联合会议。在犹太教和基督教所达成的会议协定的基础上,他起草了一封写给美国总统本杰明·哈里森的信,这封信被历史称为《布莱克斯通请愿书》(以下简称《请愿书》)。信中,他简略提及了以西结和以赛亚,然后重点讲述了大屠杀下俄国犹太人的苦难。解决犹太人的苦难有一个显而易见的办法:“为什么不把巴勒斯坦还给他们?”

    带着天真的乐观,《请愿书》建议奥斯曼人自愿放弃那块有价值的土地,条件是西方国家对他们的债务支持。更令人印象深刻的是《请愿书》的413名签名者,其中包括最高法院首席大法官、众议院议长、众议院外交事务委员会主席、众多其他国会议员、著名神学家、记者和行业领袖(如约翰·洛克菲勒、约翰·摩根)。

    哈里森总统向布莱克斯通承诺,他将调查此事,并将信转给国务卿詹姆斯·布莱恩,后者向美国驻君士坦丁堡大使馆进行了问询。正如美国外交官们在那个时代惯常做的那样,他们忽略了犹太人的问题,《请愿书》随后从公众视野中消失;1903年,布莱克斯通把它重新提交给西奥多·罗斯福总统之后,它再次消失。

    1916年,路易斯·布兰代斯被伍德罗·威尔逊任命,成为美国最高法院的第一位犹太人大法官。被任命后不久,布兰代斯偶然发现了这封信。但那时,已经很少有人知道这封信,以至于当布兰代斯在国务院问询时,其官员否认对此有任何了解。用历史学家保罗·查尔斯·默克利的话说:

    (国务院的官员们声称对《请愿书》一无所知)似乎极不应该。很可能,他们只是不愿意让美国总统甚至美国国会花时间来处理“末日论”者提交的小册子。[47]

    在接下来的几十年里,美国国务院提供了大量的证据,证明在大屠杀之前和期间,根深蒂固的反犹太主义阻碍了犹太难民从德国及其占领的欧洲地区逃离,并夺走了无数的生命。但上面的引文指出了美国国务院故意驳回由该国精英们签署的《请愿书》的另一个原因:

    受过良好教育的人(指决策者)对神学单纯的人(指原教旨主义者)的蔑视。决策者们都是在圣公会、公理会、一位论派,偶尔还有长老会等这些圈子里长大的,在他们眼里,没有什么比末日论者的小册子更令人鄙视的了。只要“犹太命运”的唯一坚定拥护者是原教旨主义者,就没有必要在犹太复国主义上浪费时间。与简单、传统的乡村俱乐部式的反犹太主义者相比,受过良好教育的新教徒更加恐惧和厌恶原教旨主义者。[48]

    美国国务院对《请愿书》的忽视令布兰代斯很震惊,他与布莱克斯通建立起友好的联系。1917年,两人重新向一位虔诚的新教教徒威尔逊总统提交了修改过的《请愿书》。但这时,中东的军事和外交形势已经超出了他们的掌控能力。

    布莱克斯通在临死前已经是一个富翁,他送给布兰代斯(他也很富裕)一大笔钱,其中大部分是石油商米尔顿·斯图尔特捐赠、用以支持犹太复国主义工作的。1935年,94岁的布莱克斯通去世。去世前,他告诉布兰代斯,他把钱藏了起来,就像他在佩特拉藏的书一样,这样在他死后“如果被提真的来了,而你不在其中”,那么这些钱将用来支持未被提的犹太人,随后他们会皈依基督,并改变其他异教徒的信仰。(他还进一步劝告美国最伟大的法学家之一布兰代斯,“显然人类法律并没有为这些事件做准备”。)[49]

    比布兰代斯的犹太复国主义和布莱克斯通的基督教时代论复国主义更令人关注的事件发生在亚瑟·贝尔福身上。从小,贝尔福就继承了父母的虔诚,并痴迷于《旧约》。幸亏如此,否则,他将只是一个典型的慵懒、超然的英国贵族,正如他的传记作者所言,他属于“一种容易辨认的类型,英国和法国的一些政治家将他们的名声归功于他们的才智所创造的印象,而不是任何具体的表现”[50]

    贝尔福的父亲是国会议员,父母都是福音派新教教徒,尤其是母亲。贝尔福也受到了一位兄弟会成员的强烈影响,这位成员名叫威廉·凯利,和达比一样,凯利也毕业于圣三一大学,更重要的是,他编辑了全套的《达比文集》,并且像安德森一样,在保守党圈子里人脉很广。

    贝尔福的舅舅索尔兹伯里勋爵曾三次担任英国首相,几乎是理所当然的,贝尔福在1902年接任了舅舅的职务。通常情况下,在英国,卓越的才智和机敏的辩论技巧有助于升职,却并不意味着拥有从政能力。贝尔福3年后辞职,主要原因是贸易问题。[51]

    在他辞职的同时,他遇到了赫茨尔的一位助手,即年轻的犹太复国主义者查姆·魏兹曼,一位刚刚移居英国的化学教授。魏兹曼后来成为以色列第一任总统。据报道,这位年轻的化学家对犹太家园的憧憬让虔诚的贝尔福“感动到落泪”[52]

    在随后的10年里,贝尔福与犹太复国主义者的关系不断加深,1917年11月2日,时任外交大臣的他给英国犹太社区最重要的人物罗斯柴尔德勋爵写了一封信,信的内容在一周后公开发布:

    英王陛下的政府赞成犹太人在巴勒斯坦地区建立一个民族之家,并会尽力促成此目标的实现,但要清楚明白的是,不得有任何可能会伤害已经存在于巴勒斯坦地区的非犹太社群的宗教权利以及犹太人在其他国家享有的各项权利和政治地位的行为。[53]

    《贝尔福宣言》使全世界的犹太复国主义者兴奋不已,并为30年后以色列国的诞生发挥了不小的作用。尽管贝尔福的宗教信仰明显推动了《贝尔福宣言》和随后的英国外交政策,但他与凯利等时代论者的接触是否直接影响了他对巴勒斯坦地区的政策,这一点是值得怀疑的。从那时开始,圣地的命运将不再由满足于站在一旁观察历史的神学家驱动,而将由那些希望自己塑造历史的人驱动。

    9 圣殿山的争夺

    末日叙事如何影响犹太人建国

    犹太人确实回到了圣地,首先是19世纪末的缓慢迁移,然后在东欧大屠杀[1]后随着犹太复国主义影响力的增强而快速迁移,最后是在纳粹大屠杀之后,汹涌回归。

    1948年,以色列建国。其后的几十年里,只有一小部分以色列公民赞同犹太版的末日叙事。犹太版与时代论版本一样,也是以犹太人回归和重建圣殿为特征。由于圣殿山异常的地区敏感性,这一小部分人不断制造内乱,其随时有可能引发地区冲突,甚至全球冲突。

    充满时代论热情的基督教犹太复国主义者在20世纪后半叶如雨后春笋般出现,他们已经证明并将继续证明,无论是在圣地还是在其他地方,冲突危险都同样存在。

    约翰·纳尔逊·达比和他当时的追随者,满足于从旁观者的角度观察事态发展。但20世纪30年代,在一位杰出的英国军官奥德·温盖特身上,时代论理论和现实政治发生了冲突。英国著名的军事历史学家巴兹尔·利德尔·哈特把温盖特描述为“犹太人的劳伦斯[2][3]

    1920年,国际联盟授予英国对圣地的“委任统治权”。[4]1936—1939年,温盖特在英属巴勒斯坦托管地任职。在那里,他的时代论信仰与他的军事技能以及英国资源相结合,推动了千禧年时代的进程;但是他这样做,严重违反了授权中所规定的阿拉伯人和犹太人的平等待遇问题。

    温盖特的外祖父曾经是一名苏格兰上尉,辞去英国军队的职务后,在当地建立了兄弟会分会。温盖特的父母也是兄弟会成员。温盖特从小听着父亲的时代论教会布道而长大,而母亲则更加教条主义。1921年,温盖特参军,1936年,他被宿命般地任命到巴勒斯坦,《旧约》是他的战地指南。著名以色列将军摩西·达扬描述了他们的第一次会面:

    温盖特身材瘦长,中等个子,有一张坚毅而苍白的脸。他带着一把重型左轮手枪走进来,手里拿着一本小小的《圣经》。他的态度真诚而又令人舒适,目光犀利而又热烈。他说话时会直视你的眼睛,像是要把他的信仰和力量灌输给你。我记得,他是在日落前到达的,渐暗的光线给他的到来增添了一种神秘和激动人心的气氛。[5]

    温盖特抵达巴勒斯坦的时候,正值阿拉伯人对犹太人定居点和英国授权部队发动了一系列暴力袭击。其中英国授权部队的主要任务是阻止阿拉伯人和犹太人相互残杀,但温盖特对犹太人的绝对偏袒很快就扰乱了这项任务所需要的本就脆弱的外交。这激怒了他的指挥官们,他们在感情上更倾向于阿拉伯人。

    温盖特认为犹太定居点在防御阿拉伯人的袭击中过于被动,并力劝犹太人开始进攻。他一生都喜欢在敌后进行突击队式的袭击;尽管最初被指派为情报官员,但他很快组建了夜间特种行动队,队伍大约有200人,其中3/4是犹太人,由英国军官指挥;队伍的任务是保护具有战略意义的从伊拉克通往地中海的石油管道。1938年夏,行动队对阿拉伯军队发动了一系列袭击,大部分都是成功的。

    正如摩西·达扬所暗示的,把温盖特称为怪人未免太轻描淡写了。他习惯于赤身裸体或只戴着浴帽向他的部队讲话,讲话时还偶尔擦洗自己。他还生吃大量洋葱,并反复让自己和部队食用受污染的食物和水,因为他相信这会增强抗病能力。

    温盖特家族的时代论神学推动了他在巴勒斯坦的行动。他曾经告诉他的岳母:“犹太人应该在巴勒斯坦有自己的家园,这样,《圣经》预言就会实现。”[6]温盖特也不反对将他的圣经愿望与世俗愿望结合在一起,他认为军事上强大的犹太民族将成为大英帝国的堡垒。

    他对犹太复国主义的偏袒很快就招致阿拉伯人对他的报复和他的上级的不满。军队上级认为他的“打完就跑”策略以及“把犹太人打扮成英国士兵”是不道德的。最后,军方将他限制在耶路撒冷从事办公室工作,然后在1939年5月将他重新分配到英国的防空部队任职。[7]他在英国待了一小段时间,随后第二次世界大战爆发,他被派往苏丹,然后是埃塞俄比亚,领导“基甸军”游击队袭击当地的意大利占领者。太平洋战争爆发后,他被调往缅甸(日占区),在那里他组建了最著名的敌后作战部队——“钦迪特”部队(也称为“温盖特的突袭队”),这支英国军队(由英国空军提供补给)不断突袭日军,以保护次大陆[8]免遭入侵。1944年3月24日,他在印度的一次飞机失事中丧生。[9]

    温盖特不仅扰乱了英国在巴勒斯坦托管地的中立性,而且他通过建立夜间特种行动队,积极主动地推动末日的到来,这严重违反了时代论禁令。在这个过程中,他的战术才华令他的犹太下属们敬畏。他指导过即将到来的1948年独立战争[10]和1967年六日战争中的几乎所有的以色列高级指挥官,包括摩西·达扬、伊加尔·阿隆、伊盖尔·亚丁和伊扎克·拉宾。他还创造了今天中东政治中的“既成事实”——占领土地并建立定居点。[11]用摩西·达扬的话说:“温盖特是我伟大的老师。他教的知识成为我的一部分,并已融入我的血液。”[12]在以色列,到处都是以温盖特名字命名的街道和公共场所,包括国家运动队的训练中心。

    温盖特曾计划在战争结束时辞去英国陆军委员会的职务并回巴勒斯坦;以色列创始人之一、首任总理戴维·本-古里安认为他是指挥以色列军队的“自然选择”。[13]“如果他还活着”无疑是中东历史上最伟大的假设之一:如果温盖特还活着,那么他领导的以色列军队会在1948年独立战争中坚守耶路撒冷旧城吗?他的领袖魅力是否会让军队在那场战争中取得更彻底的胜利并占领约旦河西岸?还是他臭名昭著又反复无常的个人行为会导致新生犹太国家的失败?

    温盖特的影响一直萦绕中东。2000年9月,在近千名武装防暴警察的保护下,在野党利库德集团[14]领导人阿里尔·沙龙坚持访问耶路撒冷圣殿山,由此破坏了《奥斯陆协议》[15],并引发了第二次巴勒斯坦大起义。沙龙在青少年时代便视温盖特为英雄;此外,温盖特曾经训练并指导过的一名年轻士兵阿夫拉哈姆·约菲,后来成为沙龙的导师。

    沙龙的这次重要访问,突出了圣殿山作为世界上最具争议地区的地位。圣殿山是耶路撒冷错综复杂的220英亩旧城区中一块35英亩的土地,它本身就与末日叙事紧密相连,因此也与基督教、犹太教和伊斯兰教的宗教狂热紧密相连。圣殿山可以说是第三次世界大战最有可能爆发的地方,基督教、犹太教和穆斯林的千禧年主义,正是末日剧中的主角。

    耶路撒冷旧城可以粗略地看作一个正方形,圣殿山在正方形的东南角(见图9-1)。从圣殿山顺时针方向沿着旧城周边绕行,你会依次经过犹太区、亚美尼亚区、基督徒区和穆斯林区,最后回到圣殿山。圣殿山是基督教和犹太教的极端分子都想建造第三圣殿的地方,他们有各自的末日版本。

    图9-1 今天的圣殿山

    第一圣殿由所罗门建造并被巴比伦人摧毁,没有人知道它的确切位置。但最常提到的地点是圣殿山上的岩石圆顶清真寺(甚至在犹太人占领迦南之前,岩石圆顶清真寺很可能已经是耶布斯人的礼拜场所,所罗门的父亲大卫曾征服过耶布斯人)。第二圣殿是在公元前6世纪末犹太人从巴比伦流亡归来后,在马加比家族的领导下重建并扩建的,大希律王将其大规模扩建到现在的圣殿山上。70年,第二圣殿被罗马人摧毁。

    阿拉伯人在637年占领了耶路撒冷,并在692年建成了岩石圆顶清真寺。圣殿山的第二大建筑是阿克萨清真寺,其最初只是一个简陋的棚屋,在地震后重建了几次,直到1035年左右才最终定型。这座山对穆斯林的神圣性源自621年先知穆罕默德的一个梦,在梦中,他在一个夜晚骑着他的长翼坐骑布拉克到访了这座山,并登上了云霄。(第二天,穆罕默德“返回”麦加后,向将信将疑的居民讲述了他这段所谓的旅程。)

    根据对当前圣殿山所持的不同观点,犹太教的学者分为三类。第一类是最大的群体,他们认为犹太人可以访问圣殿山,但不能在那里祈祷。第二类的人数少一些,他们认为应该禁止参观,由于献祭的红母牛还没有找到,约柜(至圣所)的确切位置也不确定,因此访问者是不纯洁的,可能会意外地污染这块方舟,无论它实际位于山内的什么地方。第三类是极右翼的一小部分人,他们想立即建造第三圣殿。[16][17]

    抛开神学因素不谈,绝大多数犹太人不想重建圣殿,原因很实际:这将需要拆除岩石圆顶清真寺,可能还需要拆除阿克萨清真寺,犹太人对这些建筑的蓄意破坏将引发灾难性的地区冲突,甚至可能是全球冲突。理解这一点并不需要多么伟大的地缘政治智慧。

    在这个容易引起争议的话题上,兄弟会和早期的时代论者几乎没有发表什么言论,他们有很好的理由:《圣经》各章节之间经常互相矛盾,《旧约》和《新约》对未来的圣殿,更准确地说,对在圣殿进行祭祀的必要性,有一些相互矛盾的建议。一方面,《以西结书》第40~48章描述了未来的圣殿,以及将在其中进行的祭祀;另一方面,《希伯来书》10:1-18认为弥赛亚的祭品已经足够,动物祭品是没有必要的,因此重建圣殿也是没有必要的。[18]

    漫长而纠缠的历史,使现代耶路撒冷这座城市具有爆炸性的地位。70年,罗马人摧毁圣殿并驱逐了大部分桀骜不驯的犹太人,而其余大部分犹太人在135年西蒙·巴尔·科赫巴领导的第二次起义失败后也被驱逐。随后,罗马帝国、拜占庭帝国、萨珊王朝、穆斯林倭马亚王朝、阿拔斯王朝、法蒂玛王朝相继占领这座城市。1099年,十字军驱逐了法蒂玛人,屠杀了该城的犹太人和穆斯林居民;1187年,十字军向萨拉丁投降。随后的几十年里,基督教和穆斯林交替控制这座城市。13世纪后半叶,穆斯林马穆鲁克为争夺城市的控制权而和蒙古帝国开战,大约1300年后,马穆鲁克获胜,耶路撒冷迎来了长达6个多世纪的穆斯林统治。[19]1516年,奥斯曼帝国从马穆鲁克王朝手中接管耶路撒冷,并一直保持控制权,直到1917年12月,埃德蒙·艾伦比将军率领的英国军队进入圣地(见图9-2)。

    图9-2 今天的耶路撒冷旧城

    1929年左右,即国际联盟授予英国在巴勒斯坦的“委任统治权”生效6年后,犹太人和阿拉伯人开始互相残杀,包括对个人的袭击、大规模暴动和恐怖行动。整个20世纪30年代,从德国纳粹屠杀和迫害中逃离的大批犹太新移民受到阿拉伯人的强烈抵制,因此互相残杀不断。1947年,联合国提出巴勒斯坦地区的分治决议(见图9-3),但当犹太人在1948年5月14日午夜宣布建立以色列国时,周围的阿拉伯邻国与这个新国家之间爆发了全面战争。

    图9-3 1947年联合国提出的巴勒斯坦分治决议

    分治决议不仅将巴勒斯坦地区大致一分为二,还设置了一个“独立主体”——耶路撒冷市,其由联合国管理,约占100平方千米,包括旧城、更现代化的西部商业区以及其他周边地区。

    巴勒斯坦人和邻近的阿拉伯国家拒绝分治,他们想彻底摧毁这个新生的犹太国家。1948年5月14日,以色列宣布独立的那一天,阿拉伯人和犹太人分别从多个方向对耶路撒冷发动了袭击。

    在旧城南部入口锡安门的一场关键战役中,22岁的军官大卫·埃拉扎尔[20]指挥犹太部队深入耶路撒冷犹太区,将犹太平民和受伤的军人救出。但这次行动也耗尽了埃拉扎尔的精锐部队,剩余部队被迫放弃并离开这个祖辈已经连续生活了大约3000年的地方,旧城被约旦人占领。[21]即使在穆斯林的统治下,犹太人也可以进入圣殿山,而西墙(哭墙)更是犹太教最神圣的地方。约旦军队开始夷平犹太区。尽管失去了旧城,但这个新生国家幸存了下来,这令国际社会和许多犹太人深感意外。

    美国基督教徒对以色列建国最初的反应充其量是温和的。例如,美国天主教徒追随梵蒂冈[22]的态度,拒绝犹太人对圣地提出的任何要求。1943年,梵蒂冈国务卿宣布不承认《贝尔福宣言》;而在1948年以色列宣布独立的同一天,梵蒂冈报纸《罗马观察报》声称:“现代以色列不是圣经中以色列的继承者。圣地和那些神圣的地点只属于基督教:真正的以色列。”[23]

    主流新教徒的反应也不热情;他们大致同意梵蒂冈的观点,即代表新以色列的是基督教徒,而不是犹太人。此外,圣公会和长老会教徒支持阿拉伯人而不是犹太人,他们有一些其他理由,他们担心美国对新犹太国家的支持会妨碍他们在阿拉伯世界的传教活动以及教育机构的发展,特别是贝鲁特美国大学和开罗美国大学,那时,这些大学已经成为阿拉伯民族主义的温床。[24]最后一点也同样重要,圣公会和长老会教徒已经进入阿拉伯石油公司的管理层,这些石油业务越来越有利可图,对他们来说,具有重要的战略潜力。[25]

    20世纪初,美国新教刊物《基督教世纪》不断发表反对犹太复国主义的社论意见。例如,1929年,它质疑:

    犹太人在很多地区都受到尊崇,因为在那些地区的工业、商业、政治、艺术和文学等领域,犹太人都展现出他们的能力。他们真的想移民到巴勒斯坦这样一个资源贫乏的地方吗?[26]

    最令人震惊的是,希特勒在1933年掌权时,大多数主流新教徒都无视事实。当彻底的种族灭绝代替纳粹种族立法时,《基督教世纪》一再建议不要急于做出判决;编辑们认为需要更多的数据。10年后,该出版物认为,犹太人不信仰耶稣已经有2000多年了,犹太人必须将耶稣带回他们的犹太教堂,从而表明他们对美国的忠诚,“一个简单的举动就是自愿庆祝耶诞节[27][28]

    1942年,关于放逐、集中营和大规模屠杀的一系列故事首次出现在美国报纸上。当美国犹太复国主义拉比斯蒂芬·怀斯开始全面宣传这些故事时,《基督教世纪》质疑他的指控是否有“任何好的目的”。该出版物尤其对怀斯的“犹太人的尸体偶尔被加工成肥皂”[29]这一断言感到愤怒,但是很悲惨的是这一断言后来被证明是真实的。

    并不是所有主流新教徒都如此无视事实。其中最著名的是伟大的美国神学家雷茵霍尔德·尼布尔,和他的许多政治分析一样,他对犹太国家的早期评论经得住考验,对当前的中东局势很有意义。作为一名自由派新教徒,尼布尔拒绝接受《圣经》字面上的真理,并对犹太复国主义问题持有一种更加明智和务实的态度。早在第二次世界大战时期,他就撰文指出,犹太人应该建国,不是为了实现千禧年,而是为了更现实的原因。首先,“每一个民族都有权最终拥有一个家园,这个民族在这个家园里不是‘有差异’的。在家园里,这个民族既不需要受到所谓善良人的庇护,也不会受到坏人的诽谤”。其次,很明显,没有一个国家能够吸纳纳粹压迫下的所有难民,巴勒斯坦应该对这些溢出的难民进行必要的疏导。[30]

    关键在于,与温盖特以及基督教犹太复国主义者不同,尼布尔认识到忽视阿拉伯人民是愚蠢的:

    (美国和英国是第二次世界大战的最终胜利者,它们)能够确保将巴勒斯坦地区留给犹太人,确保取消目前对移民的限制,并确保对阿拉伯人另有补偿。但犹太复国主义的领导者坚持认为犹太移民给巴勒斯坦带来了新的力量,而不会给阿拉伯人民带来“不公正”,这种想法是不切实际的。期望任何人将对其传统财产的主权限制视为“公正”都是荒谬的,不管这种限制会给他们带来多少好处。[31]

    像大多数时代论者一样,说意第绪语的阿尔诺·盖布兰才华横溢。他将犹太人分为两类,他所崇敬的正统犹太人和他对之持有怀疑态度的更世俗的犹太人[32]。作为一名坚定的反纳粹分子,他深入研究反犹太主义欺诈中最臭名昭著的《锡安长老会纪要》。该书传播了很多犹太人控制全球经济、接管国家政府和杀害基督徒的巨大阴谋(最近,阴谋论在当前全球范围内的极右民族主义者中又卷土重来)[33]

    与此同时,在大多数主流新教徒和天主教徒都避犹不及的时候,盖布兰做出了一些关于大屠杀的评论,其具有很强的预见性。早在1932年,他就谴责希特勒反犹太主义的疯狂,并预言“显然他将走向末日,与《以斯帖记》中的哈曼命运相同”[34]。到1942年,他是最早传达欧洲纳粹大屠杀和希特勒灭绝犹太人新闻的人之一;到了第二年,他正确地估计出,那时德国人已经杀死了200万人。[35]

    1948年以色列建国时,哈里·杜鲁门和他的国务卿乔治·马歇尔之间体现出非常明显的宗教界限。前者是浸信会原教旨主义者,后者是主流新教徒。杜鲁门在12岁时已经读了两遍《圣经》,而马歇尔则是一个圣公会教徒。[36]在英国对巴勒斯坦的托管权结束的前两天,杜鲁门会见了马歇尔,以及副国务卿罗伯特·洛维特和年轻的白宫法律顾问克拉克·克利福德。

    那时,杜鲁门已经向时任犹太复国主义组织主席——魏兹曼做出了美国承认以色列的承诺,他让克利福德将他这样做的理由陈述给马歇尔和洛维特。但杜鲁门还没开始,马歇尔就打断了总统的话:“我甚至不知道克利福德为什么会在这里。他是国内顾问,而(我们讨论的)这是一项政策问题。”杜鲁门回应道:“将军,他在这里,是因为我邀请他来。”洛维特是耶鲁大学骷髅会[37]的成员,他的父亲是美国联合太平洋铁路公司的主席,他补充说,承认以色列“显然是为了赢得犹太人的选票”。杜鲁门和马歇尔互相攻击了一会儿后,马歇尔最后宣布:“如果你听从克利福德的建议,那么我会在选举中投你反对票。”[38]

    最终,马歇尔让步了,并承诺对自己的反对承认以色列的立场保密。杜鲁门的父母都是虔诚的浸信会教徒,杜鲁门小时候经常上主日学校,成年后进行了再浸礼;无论他在哪里,他总会参加周日礼拜。在他的个人文章中,他记录道:“我是一名浸信会教徒,我认为这个教派给了普通人最近、最直接的接近上帝的途径。”[39]

    离开白宫后不久,杜鲁门参观了美国犹太神学院,在那里,一位朋友将他介绍为“帮助建立以色列国家的人”。作为回应,杜鲁门提到了从巴比伦囚禁中将犹太人释放的波斯国王:“你说的‘帮助建立’是什么意思?我是居鲁士,我是居鲁士。”[40]

    1949年的停战协定将旧城和约旦河西岸交给了约旦人;在以色列国土最窄的“腰部”地区,约旦军与海相隔的距离仅为9英里。耶路撒冷较新的西部地区仍在以色列的控制之下,但约旦人控制着拉特伦,其距离新城和以色列其他地区的关键连接处的主要道路仅一箭之遥。独立战争期间,以色列人曾在拉特伦进行了一场激烈的战斗,但以失败告终。随后以色列人在南部几英里处修建了一条新公路,使得连接处的脆弱性略有降低。

    美国的时代论者与主流基督教徒算是表亲,但与后者不同,他们对于以色列的建立欣喜若狂。其中最典型的是司可福,他曾就读于菲利普斯学院和普林斯顿大学,会说希伯来语和亚拉姆语,任费城圣经大学校长,后来花了10多年时间编写1967年版的《司可福串注圣经》。1949年,他宣称“弥赛亚时代即将开始”。此外,他认为以色列和英国之间的“迫在眉睫的联盟”,可以看作犹太人和复兴的罗马帝国之间的时代论契约的开始。司可福似乎忘了,此前犹太人一直在攻击英国士兵,英国人可能并不想与犹太复国主义者结盟。还有其他一些时代论者更进一步,他们认为,上帝有意缩短富兰克林·罗斯福的寿命(他与阿拉伯人建立了密切的关系),这样可以使亲以色列的哈里·杜鲁门成为总统。[41]

    虽然以色列的建国确实触动了学究型时代论者的灵魂,但在他们的核心圈子(司可福就是这个核心圈子里的典型代表)之外,引起的共鸣并不多。此外,尽管以色列的建国使犹太人回到了圣地,但犹太人并没有控制圣殿山,事实上,他们甚至都无法进入圣殿山,这是数千年来没有发生过的。因此,他们没有实现时代论的基本要求:在重建的第三圣殿中恢复礼拜和祭祀。

    19年后,这种情况将会改变。1967年5月,阿拉伯暴徒涌上街头,要求摧毁以色列,埃及总统贾迈勒·阿卜杜勒·纳赛尔封锁了以色列进入红海的通道,并将联合国维和部队赶出西奈半岛。(1956年,通过与法国和英国的短期军事同盟,以色列占领了西奈半岛。根据随后达成的协议,西奈半岛又归入了埃及。并且根据该协议,纳赛尔的两次行动均构成战争行为。)关键是,纳赛尔还向拉特伦派遣了两个突击营,直接针对以色列的西耶路撒冷;5月底,他公开宣称要摧毁这个犹太国家。

    纳赛尔估计,这一挑衅将引发以色列的进攻,最终导致这个小国被更强大的阿拉伯军队清洗。但他只估计对了一半。6月5—10日的六天里,以色列武装部队将尚未起飞的埃及空军摧毁在地面上,并占领了西奈半岛、西岸、戈兰高地以及旧城和圣殿山。

    起初,以色列人并不打算攻占旧城。他们认为自己的国家处于毁灭的边缘,埃及对他们的生存威胁已经牵涉他们所有的精力和资源。因此,以色列国家领导人绝不想让约旦人加入战争,因为约旦人可能会在以色列脆弱的“腰部”将以色列一分为二。以色列在耶路撒冷地区的战略利益,主要集中于斯科普斯山飞地[42]内,该地区有一些小型驻军以及废弃的大学和医院,完全被约旦的领土包围。

    以色列向约旦国王侯赛因传话:如果约旦不采取敌对行动,以色列就不会攻击约旦河两岸的军队。侯赛因却说他的答案将通过“空降”到达,很快,约旦通过战斗机和炮弹袭击了以色列。虽然侯赛因的空袭基本无效,但当约旦人炮击耶路撒冷和特拉维夫郊外的国家国际机场时,以色列人别无选择,只能做出回应。即使在那时,国防部长摩西·达扬为应对危机而刚刚上任三周,依然希望谨慎行事;但内阁鹰派,特别是梅纳赫姆·贝京[43],要求军队占领耶路撒冷;在战争的前两天,达扬的克制政策占据了上风。[44]

    能比摩西·达扬更好地应对旧城不断变化的动态的人几乎没有。这位独眼国防部长在一个农场长大,每天都与阿拉伯人打交道,会说阿拉伯语,与阿拉伯的童年伙伴们建立了友谊,并钦佩于伙伴们的父母安静的性格。独立战争期间,年轻的达扬曾作为一名中校,指挥耶路撒冷地区的犹太军队。在那场最终结束1948年冲突的微妙而漫长的停战谈判中,他与约旦谈判方阿卜杜拉·塔勒进行了广泛而越来越热情的接触。达扬非常信任他,在塔勒的陪同下,达扬穿着阿拉伯服装前往安曼[45],并与侯赛因的父亲阿卜杜拉国王进行了谈判;几年后,当塔勒要求以色列的《巴勒斯坦邮报》(《耶路撒冷邮报》的前身)严厉地批评他,从而提高他在安曼的信誉时,达扬回报了他。[46]

    随着埃及和约旦的外部威胁消除,战争即将停火,以色列内阁最终授权占领耶路撒冷旧城;当地的指挥官乌兹·纳尔基斯曾在1948年的旧城战役中失败,他命令伞兵军官莫迪凯·古尔执行最后一次袭击。

    古尔的预备役部队,最初是计划部署到西奈半岛的,但随后其与约旦军队展开了一系列的血腥战斗,从而确保了旧城北部和东部郊区的安全。这些战争的另一个好处,是建立了一条通往斯科普斯山的通道。旧城的约旦驻军紧急请求了支援,但以色列的飞机驱散了这支西行救援纵队,这使古尔的伞兵在6月7日相对容易地由通道进入了耶路撒冷。达扬铭记世界人民的信仰,没有授权对旧城的空中袭击,炮兵部队从圣殿山绕行,并仅向阿克萨宣礼塔内的狙击手进行零散的小型武器袭击。[47]这是幸运的,因为约旦人在圣殿山附近储存了大量弹药,近距离战斗很可能会点燃这些弹药,带来灾难性的地缘政治后果。[48]

    古尔占领了世界上最神圣的地方,用无线电向纳尔基斯发出:“圣殿山在我们手中!”这也许是现代希伯来语中最著名的一句话。纳尔基斯和什洛莫·戈伦跟着古尔登上了山,其中戈伦是独立之后的以色列的军队首席拉比,他欣喜若狂地登上山顶,高呼《圣经》经文,反复吹响他的羊号角(即朔法尔[49])。

    戈伦是想要重建第三圣殿的少数犹太人之一。他把纳尔基斯拉到一边商量。几十年后,就在戈伦去世之前,纳尔基斯向《国土报》提供了这次谈话内容:

    戈伦:纳尔基斯,现在是向岩石圆顶清真寺投放100公斤炸药的时候了,就这样吧。

    纳尔基斯:拉比,住手。

    戈伦:纳尔基斯,这样做将翻开新的历史篇章。你没有领会这样做的重要意义。现在正是机会。明天,可能就什么都做不了了。

    纳尔基斯:拉比,如果你不停下,我就立刻把你送去监狱。[50]

    戈伦默默地离开了。达扬一听说占领旧城的消息,就立即前往耶路撒冷处理圣殿山事务。当时的圣殿山和现在一样,是中东政治炸弹的导火线。

    正如达扬在他的回忆录中所描述的:

    多年来,阿拉伯人一直禁止犹太人进入他们最神圣的场所,包括耶路撒冷清真寺院内的西墙和希伯伦的列祖之墓[51]。现在我们掌握了控制权,我们应该理解其他那些和曾经的我们一样有相同需求的人,允许各种信仰的人在圣地自由参观和朝拜。[52]

    达扬到达圣殿山后,立即命令将岩石圆顶清真寺上的以色列国旗移走。第二天,他咨询了一位希伯来大学的伊斯兰历史学教授,探讨如何更好地接触管理此地的神职官员,也就是瓦克夫[53]。此后不久,他和工作人员登上圣殿山,前往阿克萨清真寺,进行了一次具有决定性意义的会面:

    当我们继续登上圣殿山到达清真寺大院时,我们似乎……进入一处阴沉的寂静之地。清真寺外接待我们的阿拉伯官员庄严地向我们致意,他们的表情反映出对战败感到悲伤,并恐惧于我可能会做的事情。[54]

    达扬命令士兵们把鞋子和武器放在门口。经过瓦克夫的初步介绍后,达扬让官员们谈论未来,但他们沉默了。于是达扬和随从们盘腿坐在地板上,以阿拉伯的风俗和他们聊天。最终,官员们敞开了心扉:他们最关心的是战争期间的水电中断。达扬承诺将在48小时内恢复水电。

    这时,达扬将他来这里的原因告诉了瓦克夫:他要让他的士兵离开圣殿山,圣殿山还将留在瓦克夫的手中。达扬要求他们恢复相关服务,并告诉他们,以色列人不会像约旦人那样审查传统的星期五礼拜;以色列的部队将从外部保卫这座山,但推土机已经将西墙附近的阿拉伯住宅清除;犹太教最神圣的地方——西墙,将继续掌握在以色列人手中。

    达扬后来记录道:“瓦克夫和官员们并不喜欢我说的最后一句话,但他们知道无法改变我的决定。”[55]达扬是一个惊人的好色之徒和考古窃贼,他不是天使。记者格肖姆·戈伦伯格观察到,“如果上帝真的干预了人类历史,那么他在选择圣徒时很有幽默感”[56]。达扬自己做出了这一安排,几乎没有采纳内阁的建议;因为即使是谨慎和持久的妥协,也通常无法达到各方都满意。

    但这种匆忙的安排依然产生了一系列问题,每个问题都可能带来灾难性的后果。几乎从一开始,拉比戈伦就很能制造麻烦。他首先带领一小群追随者到圣殿山祈祷。起初,瓦克夫并没有反对,但在埃波月[57]九日(这一天是犹太人纪念第一和第二圣殿被摧毁的日子),他做出了超越限度的行为。那天是1967年8月15日,这位惹事的拉比带着50个人和一个便携式方舟来到圣殿山,吹响了他的羊号角并祈祷。

    城内的穆斯林开始焦躁愤怒,瓦克夫封锁了圣殿山的主要入口,并开始向犹太人收取进山费用;而戈伦的回应则是宣布下一个安息日会带来1000名追随者。至此,以色列内阁已经厌烦了戈伦的这些危险行为,并做出决定:犹太人可以参观圣殿山,但不能在山上祈祷。而几乎同时,以色列最高宗教委员会的首席拉比直接禁止了犹太人参观圣殿山。虽然并非所有犹太人都承认拉比的权威,但大部分正统犹太人都承认,而且由于他们往往在意识形态上最为极端,因此这项禁令至少在一段时间内遏制了与圣殿山有关的紧张局势。[58]

    少数犹太人想把穆斯林从圣殿山上赶出去,炸毁岩石圆顶清真寺和阿克萨清真寺,重建第三圣殿。他们感到愤怒,并将达扬称为叛徒(甚至还有更恶劣的称谓)。尽管历史证明达扬是正确的,但重建圣殿的狂热者或瓦克夫都不这样认为。

    几乎从一开始,达扬的妥协就在很大程度上否定了古尔那个著名的感叹句[59];圣殿山事实上在穆斯林社区手中,这种控制正是在自1967年战争以来的半个世纪里才得以巩固的,围绕上帝那一小块35英亩土地的政治动荡也随之加剧。

    下一个圣殿山上的重大事件,由一名精神分裂的澳大利亚基督徒丹尼斯·迈克尔·罗恩引发。他充满了由精神病引发的宗教热情,于1967年8月21日进入阿克萨清真寺,将煤油倒在讲坛的楼梯上,并投掷了火柴。大火烧毁了清真寺的大部分室内装饰,还削弱了柱子的支撑力。

    罗恩是赫伯特·阿姆斯特朗的信徒。阿姆斯特朗是美国原教旨主义上帝广播教会的创始人,也是20世纪30年代初最早利用广播新媒介的传教士之一。阿姆斯特朗并不是时代论者,但他相信英国人和美国人是“10个消失的犹太部落”的后裔。尽管如此,时代论的普通信仰,即只有在重建的圣殿中恢复朝拜和祭祀才能使耶稣复临,激发了具有活跃错觉的罗恩,他采取了合乎逻辑的下一步:阿克萨清真寺是第一圣殿的所在地,它必须被摧毁,以便为新圣殿的重建让路(尽管大多数权威人士认为第一圣殿的遗址在岩石圆顶清真寺,而不是附近的阿克萨清真寺)。

    两天后,当以色列警察终于在东耶路撒冷的小旅馆抓住罗恩时,他高兴地承认:既然上帝想让他建造这座圣殿,他就必须先摧毁阿克萨清真寺。最后,罗恩被审判、定罪,并被关押在精神病院,于1974年被驱逐回澳大利亚,一直在医院里住了20年才去世。

    尽管罗恩和犹太人没有什么关系,但阿拉伯世界还是爆发了;纳赛尔和沙特国王费萨尔都向以色列宣布圣战。在这一特殊情况下,以色列人是幸运的,因为纳赛尔和费萨尔都锁定了最有可能接受号召的激进伊斯兰主义者。[60]

    阿克萨清真寺的大火表明,圣殿山政治有最具爆炸性的两大特点。首先,它无处不在,总是充满偏执;尽管罗恩很明显只是个精神病人,并与犹太复国主义无关,但阿拉伯世界的许多人仍然指责犹太人纵火,并认为事实是以色列的消防队员向其泼汽油。而与此相反,以色列内阁部长则指责穆斯林为了挑衅而放火。其次,如果圣殿山的火药桶会点燃世界,那么它很可能伴随着宗教幻想的火焰,这种幻想可能来自犹太复国主义极端分子、激进的伊斯兰主义者、时代论基督徒或者普通的精神分裂症患者。

    将这一原则应用于世界上所有的伟大信仰,并不算过分笼统。主流的犹太教、基督教和伊斯兰教,在落入受骗的真信徒或明显的精神错乱者手中之前,都是和平的宗教。关于精神错乱者,他们的主要症状是幻听,常常听到来自上帝的声音。[61]

    并不是只有基督教徒才有末日错觉。犹太人在这方面领先了500年。伊斯兰教几乎是从穆罕默德本人开始,就有自己的末日错觉版本,这一版本最近在书店和战场上迅速发展。

    绝望是末日叙事生长的沃土。公元前6世纪,被流放到幼发拉底河沿岸为奴后,古犹太人正需要休整。《以西结书》和《但以理书》记载了压迫犹太人的人被毁灭,但神学家们通常认为首次明确提到犹太弥赛亚的是《以赛亚书》。与《但以理书》相似,《以赛亚书》的写作时间是以赛亚生活的公元前8世纪之后的几个世纪,它可能是由一系列作家在巴比伦流亡期间以及回到犹大之后创作的。书中预言了一位救世主的出现,他将结束世界,在耶路撒冷建立一个上帝的普世王国。

    弥赛亚主义是犹太历史上一个持续的主题,它有时像一条细红丝带,有时则像一块展开的能够蒙蔽理性的深红色布。它可能会带来一场全国性的运动,例如罗马时期,70年,奋锐党[62]策划的起义。起义中分裂出西卡里党,其暗杀了拒绝反叛的犹太人;其中一些西卡里人后来在死海之上的梅察达集体自杀。它还可能是某些虽有才能但被骗、偶尔有精神病的个人的作品,比如沙巴蒂·萨维,一位患有躁狂抑郁双相型障碍的塞法迪[63]拉比,他在1648年的狂躁间歇宣称自己是弥赛亚,并成为小亚细亚士麦那地区大型犹太社区的宗教领袖,然后在东地中海四处穿梭,聚集皈依者和会众。17世纪中期的大屠杀使欧洲大陆的犹太人口大量减少,沙巴蒂·萨维的弥赛亚救世承诺吸引了大批追随者,但当他被奥斯曼帝国监禁而面临死亡威胁时,他选择了皈依伊斯兰教,这一承诺也宣告结束。[64]

    大屠杀后,难以控制的以色列独立运动中再次上演了奋锐党和西卡里党之间的戏剧版本。在独立前的冲突中,两个恐怖组织“伊尔贡”和“莱希”(前者一般不会谋杀犹太人同胞,但后者会),都参与了对阿拉伯人和英国官员的暗杀性袭击,最著名的是1944年在开罗暗杀英国副国务大臣莫恩勋爵,以及1946年炸毁耶路撒冷的大卫王酒店,造成91人死亡。

    第二次世界大战爆发时,伊尔贡要求暂时停止对英国人的袭击,这激怒了更激进的成员,他们在亚伯拉罕·斯特恩的领导下联合成立了莱希(就是在英语世界中更为人所知的“斯特恩帮”)。像伊尔贡一样,莱希的目标也是阿拉伯人和英国公民,它们不仅对莫恩遇刺事件负责,而且对1948年的联合国代表福克·伯纳多特伯爵遇刺事件负责,因为当时它们担心伯纳多特会与阿拉伯人达成对它们不利的停战协议。(战争期间,伯纳多特曾帮助数万人从德国集中营获释,其中约有1600名犹太人。)

    除了第二次世界大战期间与英国的临时停火争议之外,还有两个方面的争论使伊尔贡和莱希分裂。与奋锐党和它的分支西卡里党的区别一样,伊尔贡人一般不会杀害他们的犹太人同胞,而莱希人则会这样做。过去的西卡里人和后来的莱希人都谋杀过犹太人的通敌者,偶尔还谋杀与他们仅仅有意识形态分歧的人。更重要的是,和西卡里人一样,莱希人也是热情的弥赛亚主义者,而伊尔贡人则更世俗化。

    莱希的宣言,即《民族复兴原则》,列出了18条,其中最臭名昭著的是向犹太人承诺《出埃及记》中的土地“从埃及河到大幼发拉底河”,以及第三圣殿的重建。[65]在被纳入以色列武装部队和情报机构之前,伊尔贡和莱希的最后领导人分别是梅纳赫姆·贝京和伊扎克·沙米尔。两人后来都成为以色列总理。

    以色列人对弥赛亚主义团体的支持相对较少。那里的民众消息灵通,他们认为在晚间新闻时间给别人打电话是一件非常粗鲁的事情;他们同样非常清楚,重建圣殿类似于一种自杀行为。尽管这个国家仍然是恐怖袭击的目标,最近尤其是伊朗部队打击的目标,但弥赛亚主义的原推动力——一种与巴比伦人、塞琉西王朝、罗马人、国社党或纳赛尔统治下的埃及人等规模相当的威胁——已不复存在;毕竟,以色列已经与埃及和约旦签署了和平协议,而剩下的威胁来源国叙利亚则陷入内乱。

    即便如此,1967年对旧城的占领确实激励了以色列千禧年主义者中的一小部分人,特别是信仰者同盟(即坚信派),他们将《出埃及记》中的最大领土视为信仰:上帝将加沙、西岸、戈兰高地,甚至荒芜的西奈半岛永远留给了犹太人。1967年独立战争刚刚结束,坚信派就开始在约旦河西岸修建定居点,1974年,他们与新总理伊扎克·拉宾因为那里的修建工程发生了冲突;最终,坚信派通过拉宾的对手、建立定居点的支持者——国防部长西蒙·佩雷斯,迂回挫败了拉宾。3年后,梅纳赫姆·贝京成为以色列的领导人,他打开了西岸扩张的闸门。(1978年的《戴维营协议》[66]规定,将西奈半岛归还埃及。坚信派没能阻止该协议的实施。)

    其他的犹太弥赛亚主义者则专注于圣殿的重建。伊斯拉尔·阿里尔就是这样一位圣殿狂热者,他是一位关注梅洛迪小母牛的拉比。1967年,年轻的阿里尔曾在攻占西墙的伞兵旅服役。对他和一小群极端正统的犹太人来说,弥赛亚(第一个也是迄今为止还没有到临过的)在圣殿建成并使用之前是不可能出现的。1988年,阿里尔协助建立了“圣殿研究所”,该研究所不仅致力于重建第三圣殿,而且致力于完成圣殿最精致的细节,包括亚麻长袍、乐器、古犹太教朝拜所用的仪式。

    完成这些细节只不过是时间、技能和金钱问题,阿里尔和他的同事们根本不缺。更难的是要找到祭司主持弥赛亚回归所需的祭祀仪式,而这代表了神学上的一个两难问题,因为祭祀通常只能由用红色小母牛的骨灰洁净后的祭司主持,这本身就需要屠宰这种稀有的牛。

    约瑟夫·埃尔博伊姆是另一个弥赛亚团体“重建圣殿运动”的拉比,他试图通过创造“从未与死尸在同一屋檐下”的洁净祭司,来克服无法找到合格红色小母牛的困难。他从古代祭司种姓科哈尼姆的后裔中挑选出自愿的孕妇,她们将在一个特殊的院子里分娩,那里高于地面,以避免另一个祭司的禁忌,即“不能错误地踩在一块没有标记的坟墓上”。该项目允许家长探访,但男孩们永远不能走出大院;他们可以在一个升高的庭院玩耍。男孩们将接受包括祭祀技术在内的祭司培训,在成年礼后的某一天,他们将成为转基因红母牛的屠宰者。[67]

    1975年,像8年前戈伦和他的追随者做的那样,一小群犹太弥赛亚主义者进入圣殿山,在一扇禁止他们进入的大门内祈祷。[68]阿以联合警察部队将正在祈祷的这群民族主义者赶走,但以色列法庭做出了有利于这群人的裁决。这引发了骚乱,数名阿拉伯人死亡,几十人受伤。阿拉伯国家在联合国发出了抗议,瓦克夫规定,包括西墙在内的整座圣殿山都属于清真寺。以色列高等法院最终废除了允许犹太人在圣殿山祈祷的决定,但随后利库德集团的3位总理梅纳赫姆·贝京、阿里尔·沙龙和本雅明·内塔尼亚胡发誓要改变这一裁定。但最终没有人兑现这一煽动性的承诺。

    1982年,两个犹太极端主义团体分别试图在圣殿山放置炸药;第一个是由拉比梅厄·卡赫纳领导的反阿拉伯种族主义团体,叫作“卡赫运动”,其试图在岩石圆顶清真寺的墙壁附近引爆炸弹。第二个是名为“利夫塔帮”的神秘团体,其试图炸毁岩石圆顶清真寺和阿克萨清真寺。[69]为此,哈佛大学国际事务中心进行了一次地缘政治模拟,并得出“如果岩石圆顶清真寺真的被摧毁,那么这将触发第三次世界大战”的结论。

    更危险的是另一个团体“犹太地下组织”。到20世纪80年代初,其成员已经杀害了希伯伦的5名阿拉伯学生,并企图暗杀约旦河西岸的市长们,炸毁清真寺和阿拉伯公交车。这些行为非常危险。1984年,他们对岩石圆顶清真寺进行了广泛的侦察,并获得了先进的炸药,但后来计划取消。正如后来的一个极端组织的成员所说,30个成员的行动,可以被称为一个地下组织的行动;300个成员的行动,就是一场运动;3000个成员的行动,那就是一场革命。[70]第二年,一家以色列法院判处了27名地下组织成员监禁,监禁时间从几年至终身不等,罪名是对圣殿山有企图并进行了其他恐怖袭击。然而,到1990年,在以色列右翼团体的压力下,他们全部获释。[71]

    直到1994年去世之前,拉比戈伦一直在制造麻烦。从第一次造访圣殿山,他就开始勘测。在他去世前几年,他公布了那些测量数据,并发表了一篇圣经评论,宣称山的南部有一大块土地不受圣殿的洁净限制,因此其适合修建犹太教堂。该评论文章忽略了一个事实,即该地目前被阿克萨清真寺占据。

    与地上的祈祷一样,在圣殿山土层下进行的考古活动也会激起阿拉伯人的愤怒。尽管当时有大量的历史和考古学证据,但穆斯林通常否认第一和第二圣殿曾经存在过,并将任何挖掘圣殿山土层的行为视为犹太人试图为建立第三圣殿找证据。

    几个世纪以来,人类的居住地积累了连续的沉积层,因此考古学家挖掘得越深,能够追溯到的时间就越早。罗马和耶路撒冷等具有悠久历史的古城中,偶尔会有这方面的生动体现。在这些现代城市的街道下方,12~24英尺的地方发现了可追溯到基督时代的挖掘物。

    这意味着,耶路撒冷的考古学家们在挖掘时首先会遇到奥斯曼帝国时期的文物,然后是更早的穆斯林王国的文物,然后是罗马、希腊、犹太人的文物,如果幸运的话,就还有迦南统治者的文物。1967年以色列占领耶路撒冷后,希伯来大学的考古学家本杰明·马扎尔领导的犹太研究人员首次进入了圣殿山周围的地区。

    马扎尔最重要的发现是希律王第二圣殿晚期的一个大型公共区域,那里有大量的房屋、宽阔的街道和毗邻圣殿山的复杂水利系统,以及通往圣殿山的巨大台阶。这可能是考古学家们发现的证明第二圣殿存在过的决定性证据。

    瓦克夫向联合国教科文组织投诉,认为挖掘破坏了圣殿山的稳定性。联合国教科文组织任命了一系列独立调查人员,但没有发现山结构被破坏的证据,还赞扬了考古结果。只有其中一位与会者批评了挖掘工作没有得到阿拉伯土地所有者的许可。[72]

    更严重的问题来自西墙隧道。以色列从1969年开始,沿着圣殿山的西面从地下挖掘,这毁坏了马穆鲁克时期的多个建筑,令瓦克夫很心烦;联合国大会对挖掘进行了谴责,随后对以色列进行了制裁。但美国及其盟国为了抗议联合国的制裁,不再向联合国教科文组织缴纳会费,这差点儿使该组织破产。

    19世纪,英国考古学家查尔斯·沃伦在圣殿山地上和土层下进行了大量挖掘,众多发现之一是西墙地下的一扇古老大门,它通往地下的隧道,然后是一段台阶,其通往岩石圆顶清真寺附近的地面。后来,沃伦写了一本小册子《应许之地》,建议成立一个“类似于过去东印度公司”的欧洲财团,它可以和犹太人一起殖民巴勒斯坦地区。[73]

    1981年,在拉比耶胡达·盖茨的指导下,西墙隧道的工人再次遇到了“沃伦之门”,并发现了其外的东行隧道,盖茨认为这条隧道将通向至圣所,甚至可能通向丢失的约柜。他的团队开始向东、圣殿山下岩石圆顶清真寺的方向挖掘,这显然是在以色列宗教事务部的合作下进行的。盖茨发现东行隧道几个星期后,瓦克夫的卫兵听到地下挖掘传来的声音,便下到蓄水池查看,他们在那里与犹太人发生了冲突。[74]

    果不其然,戈伦宣称,新隧道比西墙还要神圣。而另一方面,阿拉伯人看到了犹太人想要控制圣殿山的赤裸裸的企图。面对阿拉伯人的强烈敌意,以色列人用一堵厚厚的混凝土墙封锁了隧道,永久性地阻止了进一步的调查。

    20世纪80年代中期,西墙隧道完工后不久,以色列人就将其向游客开放。通道很狭窄,游客们必须从靠近哭墙的南部入口进入,参观完后从同一门口走出,这种往返造成的拥挤严重影响了游客的参观。为了解决这个问题,以色列人在隧道北部终点修建了一个出口,这再次激怒了阿拉伯民众,他们认为新出口企图破坏和摧毁圣殿山;愤怒的人群聚集,工程被迫暂停。

    1996年9月23日午夜,以色列人打通了隧道北部的出口,使隧道与地上街道相通,并迅速在那里安置了一扇铁门。两天后,整个巴勒斯坦地区爆发了骚乱,以色列军队和根据《奥斯陆协议》新组建的巴勒斯坦国家安全部队之间爆发了激烈冲突;双方都有几十人丧生,数百人受伤。[75]局势十分紧张。克林顿总统不得不召开了一次国际首脑会议,但会议没有最终结果。随后,骚乱平息,出口仍然敞开;今天,游客走出隧道出口后会惊奇地发现,以色列警卫在那里迎接他们,并将他们护送回哭墙。

    1967年以色列对旧城和约旦河西岸的占领,不仅改变了中东和阿以关系的政治局面,而且给美国和以色列的政治、宗教和文化带来了越来越大的冲击。其影响力是当年事件中的直接参与者无法预测到的。最令人震惊的是,美国的时代论主角将被一个如此幻想的、脱离现实世界事实的信仰体系驱使,让约翰·纳尔逊·达比都自愧不如。

    10 《启示录》的开创者
    畅销书与美国核武政策

    为了深入了解美国当前的文化两极分化,我们可以观看一部美国B级电影《末世迷踪》,尼古拉斯·凯奇在里面饰演航空公司飞行员雷福德·斯蒂尔。在从纽约飞往伦敦的途中,斯蒂尔飞机上的数十名乘客莫名其妙地失踪,且飞机与一架显然无人驾驶的客机相撞,随后在斯蒂尔女儿的引导下,不可思议地在一段废弃公路上紧急迫降。

    影片在飞机上和地面上的混乱场面之间不断转换镜头,观众们可以分成两组:那些认为情节离奇并后悔观看的人,以及那些认为影片讲述了一个有趣的故事的人,其中的故事就像《十一罗汉》或《卡萨布兰卡》中的故事一样。

    没有什么比时代论更明显地分裂了美国的文化:对其中一方来说,它提供了一种能够从末日苦难和永恒诅咒中被拯救的可能性;而对另一方来说,这似乎只是一个信仰体系,就他们所理解的程度而言,就像《末世迷踪》那样杂乱无章。

    2001年10月7日,美国总统乔治·布什向全国发表讲话,宣布在阿富汗采取军事行动。这次讲话可以很好地说明这一文化分歧。在世俗人看来,这次讲话的风格宽容而温和,几乎不包含任何宗教内容,只是在美国真诚认可并给予其近20亿教徒美好祝愿的时候提到了伊斯兰教。

    而另一方面,福音派听众却从一些话语中听出了相当不同的信息,如“孤独之路”(出自《以赛亚书》)、“杀害无辜者”(出自《马太福音》)和“没有和平”(出自《耶利米书》《以西结书》《历代志》《以赛亚书》),它们暗示了犹太-基督教上帝的愤怒。宗教学者布鲁斯·林肯观察到,“留意到这些话语的人很清楚地听到了,但是缺乏《圣经》知识的人可能听不到”[1]。布什的讲话像是一声响亮刺耳的狗哨;正如布鲁斯·林肯发表那些言论之后《今日基督教》所评论的:“可悲的是,我们再也不能在布什讲话时,偷偷地相互点头和眨眼了。”[2][3](布什本人显然对他的时代论信仰保持沉默;官方显示他是卫理公会教徒,大多数观察家将他归类为主流新教徒。)[4]

    时代论幻想的盛行,是美国与其他发达国家的一个很大不同,并埋下了潜在的不幸。

    以色列只有一小部分人是犹太弥赛亚主义者,其他绝大多数人害怕重建第三圣殿,因为他们非常清楚,重建圣殿必须首先摧毁穆斯林的清真寺,而这么做的后果是灾难性的。但是,对美国福音派教徒来说,情况并非如此。由于达比和他的继承者的影响,美国怀有弥赛亚式梦想的基督教徒比犹太人还多,他们希望在重建的圣殿里恢复祭祀。

    这样做的神学理由并不充分。不知道什么原因,时代论者通常会引用繁杂冗余和模棱两可的《帖撒罗尼迦后书》2:4的内容:

    他抵挡神,抬举自己,高过一切被称为神和受人敬拜的,甚至坐在神的殿中,自称为神。

    《穆迪月刊》是穆迪圣经学院的内刊,1967年六日战争后,该刊物的大部分文章都与占领旧城以及重新获取圣殿山的预言意义有关。在确认偏见的一个典型例子中,该刊物上发表了一篇圆桌式文章,其中一位作者将冲突的意义总结如下:

    《圣经》几乎是中东各种事件的百科全书,现在的中东无疑是人们关注的焦点。对我来说,这些事件证实了《旧约》和《新约》预言的字面解释。[5]

    在同一篇文章中,达拉斯神学院院长约翰·瓦沃德讨论了恢复圣殿的动物祭祀问题,指出“许多人由此预测胜利的以色列国家将尽早恢复圣殿活动”,并且“这肯定是神力所致,表明时代的终结”[6]

    瓦沃德并不是一个家喻户晓的名字,与安德森、司可福和盖布兰一样,尽管他的作品非常有名,但他过着简朴、平静的生活。宿命般地,瓦沃德文章的下一页是哈尔·林赛的文章。林赛是一位更不为人所知的达拉斯神学院的毕业生,1958—1962年曾是瓦沃德的门生。[7]

    短短几个段落的引言之后,林赛开始罗列当时的各种“灾难”:越南战争、美国国内种族暴动、第一次洲际弹道导弹发射失败的核悲剧、共产主义中国的崛起、全球人口过多导致的数十亿人挨饿。

    根据林赛的说法,自由新教对《圣经》字面真理的否定和对上帝已死的传播,同样是灾难性的。在他狂热的想象中,地缘政治中的明星国家与《但以理书》和《启示录》完美契合:复兴的罗马帝国/欧盟,“北方之王”苏联,“南方之王”埃及,最后是“东方之王”中国。根据林赛的说法以及《启示录》9:13-21的预言,一个庞大的东方部落(用林赛粗野的措辞,就是“黄祸”[8])将出现:“最近在红色中国境内拍摄的一部电视纪录片说,目前有2亿中国人处于战备状态。这是一个有趣的巧合吗?”[9]

    实际上,《启示录》的章节并没有提到“东方之王”;它的9:16提到了20万来源不明的骑士,而不是2亿。20世纪70年代,处于鼎盛时期的中国人民解放军大约拥有400万士兵。尽管这些与事实不符的点不断出现,但对林赛而言一切都很清晰,据他所说,那个时代一连串无法抗拒的全球恐怖事件:

    是由一块块巨大的拼图碎片组成的,经过许多模糊之后,拼图终于拼好了。我们正生活在一个神圣拼图中的碎片突然回到它们所属位置的时代。当然,最重要的发展是,在经历了近2000年的全球离散之后,以色列在原来的土地上重建了国家,以及自此之后中东发生的事件。[10]

    林赛的这篇文章,暗示了时代论者从被动观察到积极参与末日序列的过程,这一过程是由大规模虚构的、荒谬的地缘政治主张所推动的。林赛提到了一位“以色列历史学家”,当这位历史学家被问及“如果圣殿重建,那么岩石圆顶清真寺怎么办”时,他含糊其词地回答:“谁知道?也许会发生地震。”[11]听到这句话的以色列人可能会大笑:这位被提问的“以色列历史学家”就是伊斯雷尔·埃勒达德,一位莱希党右翼理论家,他起草了该组织的《民族复兴原则》,该原则宣称犹太人有权拥有尼罗河和幼发拉底河之间的所有土地,并主张立即修建第三圣殿。

    《穆迪月刊》在时代论圈子里很有名,但在美国公众中没有多少读者。尽管如此,但林赛对末日审判情景引人入胜的断奏方式展示出他的散文天赋,他将在未来半个世纪里向数千万美国人传递时代论信息。在此过程中,他将获得财富和世界知名度,并改变美国的宗教格局。更令人难以置信的是,他独特的地缘政治幻想会影响到美国的政治团体。

    林赛于1929年出生在休斯敦,从小接受传统的南方原教旨主义教育,但他似乎并不怎么投入;受洗3次之后,他发现宗教无关紧要并令人失望,“所以我就离开了”[12]。他稀里糊涂地完成了得克萨斯大学的商科学习,然后被安排到海岸警卫队做了一段时间的密西西比河拖船船长,还结束了一段失败的婚姻;这些经历让他对世界感到悲观。当他几乎处于自杀边缘的时候,他读了一本基甸版《圣经》,并受到启发:如果他接受了上帝的真理,他就将获得精神上的重生。

    他被吸引了,但仍不确信,于是他自学了希腊语,并沉浸在《圣经》中,而他曾经以为《圣经》充满了历史错误。不久,他遇到了一位名叫杰克·布莱克韦尔的年轻传教士。这位年轻传教士向他介绍了《圣经》预言:“我心中点燃了一团火,从未熄灭。”[13]

    他的新信仰引领他进入了达拉斯神学院,在那里,他获得了神学硕士学位,并再婚。一毕业,这对新婚夫妇就开始了校园传教士的工作,在动荡的20世纪60年代,他们在美国加利福尼亚大学伯克利分校和旧金山分校等学校传播时代论叙事。向持怀疑态度的左翼校园听众布道的经历,将他的修辞技巧磨砺得像一把神学手术刀;一位观察家记录了他让观众席上挤满符合征兵年龄的年轻人的方法:对这群年轻人来说,哈米吉多顿末日并不是一个抽象概念,英俊、有魅力、表达清晰的林赛用黑板上的绘制的地图快速地呈现时事,这让他们非常着迷。[14]

    后来,他和妻子厌倦了大学城的喧嚣,选择在洛杉矶定居,集中精力在加利福尼亚大学洛杉矶分校工作。受《穆迪月刊》成功的鼓励,他决定写一本书。在著名宗教作家卡罗尔·卡尔森(与比利·葛培理共事过)的指导下,他开始了这项工作:

    写书的时候,我会想象自己坐在一个年轻人(一个愤世嫉俗、不信教的人)的对面——我会试图说服他《圣经》预言是真的。如果你能让一个年轻人理解,那么其他人也会理解。年轻人会为了某件事情毫不犹豫地给你打电话,这会迫使你与那些不属于宗教“俱乐部”的人打交道。[15]

    结果,他的《消失的伟大地球》与任何福音派文学作品都不一样:它延续了1967年《穆迪月刊》中的那篇文章的风格,轻松融合了当前的地缘政治学、令人惊叹的未来主义技术和当前的流行文化,并巧妙地覆盖于时代论框架之上。书店没有把它放在发霉的宗教书的架子上,而是把它放在畅销的新纪元板块的架子上,它与《易经》《超觉冥想》《反射疗法》等作品相邻。

    林赛和卡尔森掌握了文学传播的艺术,他们的作品吸引了读者。不到一年,这本书就卖出了1000万册,到现在至少已经卖出了3500万册。罗纳德·里根总统和他的几位内阁秘书手中都有这本书。随后他们又出版了类似的书,销量也达到了数百万。

    这本书的影响力非常大。美国最受尊敬的神学观察家之一,已故的保罗·博耶说:

    我认为,哈尔·林赛实现了一种突破,他使对《圣经》预言感兴趣的人群超出了真信徒的范围,使《圣经》预言成为一种更广泛的文化现象。而那些从来没有关注过预言的人也听说了这本书,于是他们拿起了平装本。当他们看到林赛将时事编织在一起,而《圣经》文本似乎预示着这些事件时,他们说:“哇,这太神奇了。这里面一定有什么道理。”……(林赛)似乎不仅对公众产生了相当大的影响,对政府的一些最高级别官员也产生了相当大的影响。[16]

    该书于1970年首次出版。在这本书中,林赛将达比、安德森、司可福和加尔布莱恩的作品综合成了轻松、流畅的叙事阐述,而且他更擅长推销《圣经》的无误性。他一次又一次地讲述那些几十年甚至几百年后以不可思议的准确性实现了的耶稣和先知的预言。

    确认偏见不仅包括积极寻找有利的证据(无论这些证据多么模糊),而且包括故意对相悖的数据(存在大量没有实现的《圣经》预言)视而不见。仅举几个例子:《圣经》预言埃及将成为永久的荒地、尼罗河将蒸发(《以西结书》29:8-15和30:12);埃及人将使用迦南语(《以赛亚书》19:18);最著名的是,一个犹太王国将出现,从尼罗河向东延伸几百英里到幼发拉底河(《出埃及记》23:25-31)。

    林赛的影响力,从最谦卑的信徒延伸到美国政治的制高点。罗纳德·里根从小就从虔诚的母亲内莉那里传承了虔诚的宗教信仰;虽然大多数美国人都知道里根毕业于尤里卡学院,但很少有人知道他与基督徒教会的关联,那是里根家族的教会。虽然基督徒教会是一个主流新教教派,但该教会深受社会和经济保守主义的影响。

    到成年时,里根已经成为一名福音派新教教徒。在政治生涯的早期,他热情地宣布自己对基督的忠诚;在担任加利福尼亚州长期间,他成为《消失的伟大地球》的书迷。[17]他还定期会见当时最著名的时代论者和福音派人士,包括杰瑞·法威尔、金·贝克、帕特·罗伯逊和比利·葛培理。这些人都记得曾与这位崭露头角的政治家在末日论方面进行过热烈的讨论。在葛培理和里根之间的末日论对话中,一位目击者对这位州长如何“坚持自己的观点”感到惊讶。[18]

    里根不只和福音传道者探讨末日论。1971年,他对加利福尼亚州参议院民主党临时主席詹姆斯·米尔斯说:“有史以来第一次,哈米吉多顿末日之战和基督复临的一切条件都已经准备就绪。”他提高音调,继续说道:
    很快了。以西结说,上帝子民的敌人将遭受烈火和硫黄。那一定是指他们将被核武器摧毁。以前没有核武器,现在有了。[19]
    里根甚至强行和犹太人讨论这个问题。1981年,这位新当选总统与美国以色列公共事务委员会的托马斯·戴恩探讨了末日论:“我看了你们《旧约》中的古老预言[20],以及预言世界末日的迹象,我想知道,我们这一代人是不是将要看到末日到来的那一代人。”此后不久,他向亚拉巴马州参议员豪厄尔·赫福林重申了这一想法,并补充道:“苏联将卷入其中。”[21]

    里根尤其被林赛的时代论叙事中的苏联角色吸引;并非巧合的是,在1983年他向全国福音派协会发表的著名演讲中,他称苏联为“邪恶的帝国”,“圣经和主耶稣要求我们抵制这种邪恶”,使这些邪恶之物不再挡道,他接着说:

    苏联庞大而空前的军事建设将会被施行核武器冻结。然而,让我们祈祷救赎那些生活在极权主义黑暗中的人,祷告他们能发现认识上帝的欢愉。但是,在他们这样做之前,我们要意识到,尽管他们宣扬国家至高无上,宣扬国家利益高于个人利益,并做出最终将统治地球上的所有民族的预测,但他们是现代世界邪恶的焦点。[22]

    人们不禁要问,对于里根这样一个沉迷于“千禧年”时代辉煌、接待厅里谈论的都是核灾难的人,苏联领导人会有何感想。情报报告也会让苏联领导人知道,里根的任职多年的国防部长兼搭档卡斯帕·温伯格也是虔诚的末日信仰者,是哈尔·林赛的狂热支持者,是一名虔诚的圣公会教徒。温伯格对《圣经》的最后一本书印象深刻:“我读过《启示录》,是的,我相信世界将结束——这是上帝之力,我期待,而且每一天我都觉得时间到了。”[23](除了里根和温伯格,当时的内政部长詹姆斯·瓦特和司法部长埃德温·米斯也是林赛的粉丝。)[24]

    里根的时代论影响是双向的。福音派领袖支持里根的末日信仰,里根也反过来为他的福音派盟友提供信息。1983年,他让国家安全委员会为法威尔准备了一份核武器简报,而法威尔则将这些信息进一步简化到道德多数派[25]赞助的报纸广告中:“我们不能在国防上排名第二!但遗憾的是,这就是我们今天的位置,而且这一排名还有继续下降的趋势!”[26][27]

    1983年之后,里根的末日论和鹰派思想都消失了,这对地球来说是一件幸事。总的来说,这位前总统并不是消息灵通的人;他的传记作者之一卢·坎农说:

    1982年初,比尔·克拉克成为里根的第二任国家安全顾问,他发现总统对世界许多角落发生的事情几乎一无所知。他知道总统会对视觉辅助的展示方式做出反应,并推断最容易让总统接受的形式是电影。于是他带里根去看电影。[28]

    美国广播公司制作了一部电视电影[29]《浩劫后》,电影讲述了堪萨斯州劳伦斯市在一次核战争中汽化,这尤其触动了里根。之后他在日记里写道:

    电影效果很好,让我非常失落。到目前为止,该剧还没有做任何广告,我知道这是为什么。我本人的感触是,我们必须尽己所能去阻止,确保永远不会发生核战争。[30]

    里根没有在日记中提及该电影未做广告的原因:杰瑞·法威尔认为该电影是反核活动家的宣传行为,展开了一种抵制核武器潜在赞助商的威胁活动。里根随后在日记里详细记录了与参谋长联席会议主席小约翰·威廉·维西上将的谈话,维西将核战争规划称为“一次最节制的经历”。[31]

    很明显,里根看的电影和军事简报都低估了热核战争[32]的后果。那时,武器专家们已经知道,热核爆炸所产生的火风暴将比最初的冲击波和随后的放射性沉降物产生更大的杀伤力;《浩劫后》播出几个月内,《科学》杂志上发表了一篇具有里程碑意义的文章,文章指出,火风暴产生的平流层烟尘将持续数年,并导致全球气温急剧下降,这可能导致更多的人死亡,甚至比最初爆炸产生的冲击波、火风暴和放射性沉降物造成的死亡人数还要多。[33]

    1984年,在里根的总统连任竞选中,面对对手沃尔特·蒙代尔,里根的末日信仰成为一个颇具争议的话题。10月21日,在总统辩论中,记者乔吉·安妮·盖耶和马文·卡尔布就这一问题向他施压,里根的回复是建议“一些神学家”信仰世界末日,但他不认为任何国家都能够在核战争中获胜,以此低调处理了自己的末日信仰问题。(据说南希·里根[34]听到卡尔布的问题时咕哝了一声“哦,不”。)[35]

    到了第二任期,里根非常惧怕核战争的后果。他的苏联事务顾问、外交官小杰克·马特洛克怀疑里根是否会对核袭击进行报复:“我认为,在他内心深处,即使美国遭到核袭击,他也不会(用核武器)进行报复。他从没有这样暗示过,但我似乎感觉到了。”[36]里根的摩尼教式反苏立场已经消退,甚至在1986年雷克雅未克峰会上,他向米哈伊尔·戈尔巴乔夫提议全面禁止核武器。尽管两位领导人未能实现这一突破,但美苏紧张局势有所缓和,并且一年后他们签署了影响深远的《中导条约》[37]

    神学家们和出版行业都惊叹于林赛的巨大成功,但对林赛书中不断出现的事实性错误并不关注。[38]在某处显眼的段落中,林赛描述了1942年一支庞大的日本侵略军开足马力向西穿越印度洋、向北非挺进,“没有什么能阻止他们”。但幸运的是,山本五十六大将在最后一刻决定改变舰队的方向,转而入侵美国西海岸。美国海军在珊瑚海拦截了这支特遣舰队,并在那里打败了日本人,从根本上扭转了战争局势。[39]

    在真实的第二次世界大战中,日本人没有试图入侵北非,甚至没有入侵美国西海岸的计划。珊瑚海之战是一场规模相对较小也没有决定性的海军行动,如果按细节评估,那么日本应该是战胜方,更何况从印度洋开往美国西海岸的日本联合舰队根本不会到达该片水域。在另一段落中,林赛描述了希特勒在一场“政变”中夺取政权。他将“政变”这个单词大写,其指的是1923年希特勒在奥佩拉·布菲啤酒馆里那场失败的暴动;事实上,在接下来的近10年时间里,希特勒的民族社会主义者[40]并没能通过合法的议会选举而获得权力。这本书还预测,地热资源将给以色列带来巨大的财富,这进一步说明了林赛经常幻想式地理解日常事件:

    我正在和一位著名的洛杉矶工程师谈话……我们讨论了对廉价能源的需求……他确信,在以色列周围的土地上,有足够多的蒸汽被困在众多的断层之下,可以为运行涡轮机提供动力,从而更经济地发电。他将这一新工艺称为地热能。在不久的将来,以色列将发明一种生产廉价能源的方法,以充分利用这座丰富的金矿。[41]

    “一位著名的洛杉矶工程师”这种模糊的引用,是林赛许多断言的典型来源。(他还常爱引用:“一部电视纪录片”、“科学家告诉我们”、“新闻类杂志上的图表”、“一家大型电视台”,或者,只是简单地说,“它告诉我”。)地热发电已经不是一项新技术;几个世纪以来,人类一直在用地面蒸汽为房屋和建筑物供暖,1904年左右出现了地热发电。另外,以色列并没有多少地热喷口,它的财富的真正来源是它的智力资本,而不是林赛反复错误引用的自然资源。以色列奥玛特科技公司确实是世界上最大的地热设备生产商之一,但该国没有足够的地热潜力来支持该公司的任何工厂。[42]

    更为严重的是,从解读《圣经》的角度,林赛反复提到了《但以理书》中公元前550年左右所谓的成功的预言,即该书正确预言了4个世纪之后马卡比人成功地反抗了塞琉西帝国。然而,如本书第一章所述,圣经学者认为,《但以理书》的成书时间比书中所说的要晚,也就是说,成书时间是在马卡比人成功反抗塞琉西帝国之后,而书中虚构说成书时间是流亡初期,是为了增强其预言的真实性。[43]正如达比所做的那样,林赛将《圣经》中米设的位置确定为莫斯科,但现代历史学家认为莫斯科建立于1174年,比《圣经》编写的时间要晚得多。[44]

    林赛在事实依据和分析方法上缺乏严谨性,因此他的预言经不住考验,这并不令人惊讶。在书的一开始,他就强调,由1948年以色列建国所引发的末日迫在眉睫。他引用了耶稣在《马太福音》24:34中的话:“我实在告诉你们,这世代还没有过去,这些事[45]都要成就。”他尽可能地按字面意思解释这段经文:

    哪个世代?显然,根据《圣经》,这个世代将有预兆——最主要的预兆就是以色列的重生。《圣经》中的一代的时间大约是40年。如果这一推论正确,那么在1948年往后的40年左右,所有这些事情都可能发生。许多一生都在研究《圣经》预言的学者相信事实就是这样。[46]

    达比和他的追随者们对米勒的“大失望”记忆犹新,因此他们永远不会做出时间如此精确的预测。一个多世纪后,随着米勒那场混乱远离时代论者的意识,林赛又将时事和《圣经》解读结合起来,预言末日将不晚于1988年到来。

    在这本书中,林赛还预言了一种世界范围内单一宗教的崛起,这种宗教合成了主流新教和天主教的普世主义以及新纪元运动的“占星术、唯灵论甚至还有毒品”。[47]在地球的第七十个“周”(在时代论日历中是七年)开始时,以色列与具有无上权力的欧洲联盟的强大独裁者(反基督者)结盟,并且犹太人在重建的第三圣殿里恢复了祭祀。由于拥有丰富的自然资源,以色列成为地球上最强大、最繁荣的国家之一,但三年半之后,这位欧洲独裁者/反基督者背叛了以色列人,开始屠杀基督教徒。这时,苏联人与因圣殿山被亵渎而愤怒的阿拉伯联盟一起,分两路入侵以色列,一路穿越伊斯坦布尔海峡和地中海进行攻击,另一路穿越高加索地区和土耳其进行陆路远征攻击。林赛用详细的入侵路线图对叙述进行了有益的修饰。

    然后苏联人背叛了他们的阿拉伯盟友,入侵埃及。欧洲独裁者/反基督者对事件的这一转变感到震惊,呼吁“红色中国人”提供帮助,中国人带领上文中提到的2亿人的强大部落行军穿过亚洲,袭击以色列。(林赛通过一份“印度报告”预言了这次袭击,该报告讲述了1.2万名中国军人修建了一条穿越西藏和巴基斯坦的道路,以便于军队的大规模调动。)苏联军队在入侵埃及的战争中分散了精力,于是返回以色列,但在那里被摧毁(不清楚是被上帝还是被欧洲人)。随后,欧洲人和中国人在美吉多(《圣经》中的哈米吉多顿,位于今天的以色列)展开了最后的激战。世界各地的战争回应了这场激战,地球处于毁灭性的大灾难之中;然后耶稣回归,结束世界。这场大屠杀有一个令人兴奋的亮点,即1/3的犹太人皈依了基督教,因此拯救了自我。唉,剩下的2/3被烧死。[48]

    林赛引人入胜的散文风格以及20世纪60年代末时世界末日般的社会和地缘政治氛围,打开了致富的文学之窗。《消失的伟大地球》如此畅销,以至于纽约的互助保险公司开始售卖某类保单,该保单可以让“被提”者的受益人得到补偿。[49]

    很快,其他人也开始争相参与大灾难这一主题。其中一位是林赛曾经的老师、达拉斯神学院院长约翰·瓦沃德。到林赛的书出版时,他已经担任院长近20年,但在大众市场领域的著作相对较少。受林赛的启发,瓦沃德出版了大量畅销书,其中最著名的是《哈米吉多顿、石油和中东危机》。该书于1980年首次出版,在1991年第一次海湾战争后进行了必要的修改,最终售出200多万册,目前仍在印刷中。[50]

    这本书追溯了与《消失的伟大地球》同样的现代时代论叙事:犹太人重返以色列,反基督者领导的新罗马帝国崛起,苏联人和中国人的接连入侵,随后是被提、大灾难、耶稣复临和最终审判。和林赛一样,瓦沃德热情地将一条时事的粗红线编织进他的叙事。在林赛和瓦沃德这两本书出版间隔的4年间,1973年的赎罪日战争[51]引发了阿拉伯国家的石油禁运,进而使世界财富和权力向欧佩克卡特尔组织,特别是阿拉伯国家和伊朗大规模转移。正如时代论作家们惯常做的那样,瓦沃德抓住了“石油禁运”这一引人注目的时事,以作为即将到来的末日故事的导火索。

    透过时代论的有色眼镜,瓦沃德清楚地看到,由于全球经济实力的转变,美国在世界舞台上的地位不可挽回地下降,取而代之的是拥有至高权力的穆斯林联盟,该联盟由逊尼派沙特阿拉伯和什叶派伊朗联合领导,尽管这两个教派在过去14个世纪里一直互相残杀。反基督者将领导欧洲,而欧洲将受到比美国更大的石油禁运威胁,然后穆斯林和欧洲联盟将促成一项包容各方的中东和平计划,该计划也会得到以色列人和阿拉伯人这两个变得和谐的群体的热烈拥护。

    三年半之后,反基督者见利忘义地废除该计划,并引发了完整的时代论场景:苏联人和2亿“红色中国人”入侵、大灾难、耶稣复临和最终末日。和林赛一样,瓦沃德预言了“世界教会”的崛起,这将是撒旦的工具,是一个更荒谬的泛基督教徒、占星家、其他新纪元运动者甚至穆斯林的融合。

    凭借学术研究方向,瓦沃德比林赛更能把握历史事实。例如,他清楚地认识到,哈米吉多顿的小山谷容纳不了2亿中国战士,因此他将战场扩大了数百英里,这是林赛没有做到的。[52]然而,他对历史和地理的更好的理解并没有提高他的预测准确性,也没有限制他的幻想。

    正如多萝西·马丁和她的飞碟一样,当林赛和瓦沃德的预言与未来不符时,他们加倍努力,修改了自己的叙事。林赛利用《消失的伟大地球》的巨大成功,又出版了几本类似的书。[53]他的《20世纪80年代:世界末日倒计时》首次出版于1980年,包含了世界末日级灾难的常见元素:大范围的革命、战争和饥荒。在林赛夸大其词的某个典型例子中,“以色列最杰出、最具侵略性的将军之一”告诉他,赎罪日战争中最可怕的时刻之一,是摩西·达扬向果尔达·梅厄总理建议:“第三圣殿正在倒塌。请准备发射世界末日武器。”[54]以色列人在1967年和1973年的战争中确实考虑过使用核武器,而达扬可能说出了上文中的第一句话,但没有证据证明他还说出了B级电影般的第二句话,尤其是他的回忆录中没有记载。

    《20世纪80年代:世界末日倒计时》的类似的错误出现的频率甚至比《消失的伟大地球》还要多。林赛告诉读者:“自1950年以来,每10年发生的地震数量比上个10年大约翻一番。”[55]如果这是真的,那么到现在地震发生的频率将是1950年的约100倍。毫无意外,权威的全球地震频率研究显示,在过去的一个世纪里,地震频率没有增加。[56]

    正如那句众所周知的谚语:就算一只表停了,它一天都能准确表示两次时间。林赛偶尔也能打中靶心,例如,在《20世纪80年代:世界末日倒计时》中,他正确预言了埃及领导人安瓦尔·萨达特被暗杀的风险。[57](实际上,中东国家的领导人一直处于高风险的位置。)而接下来几年的事件则全部否定了林赛耸人听闻的预言;虽然全球性灾难事件越来越多,这一基本旋律没有变化,但歌词需要修改。1991年苏联解体,意味着苏联东欧社会主义体系消失,这迫使林赛寻找新的妖怪。《地球——公元2000》适时确认了新的世界末日威胁:上文所提到的什叶派和逊尼派的泛伊斯兰联盟,以及可怕的自然灾难,尤其是艾滋病的蔓延。(其中一章的副标题是《没有人能够安全》。)就连电视节目《星际迷航》也成为林赛的操练对象,他猛烈抨击了“进取号”船长詹姆斯·柯克对世俗哲学概念和诸如“轮回”等东方宗教信仰的喜爱。[58]

    如今,建立泛穆斯林联盟似乎像猫王复出一样不可能实现;自“9·11”事件以来,右翼恐怖分子杀害的美国人的数量是伊斯兰恐怖分子杀害数量的两倍,比雷击和窒息致死的数量少了一个数量级。[59]预防和治疗措施的进步基本可以预防和控制艾滋病。(数据统计显示,艾滋病的死亡率和感染率在1996年该书出版时达到顶峰,此后一直在缓慢下降。)[60]到我写这本书时,90多岁的林赛依旧在互联网视频和几乎无人知晓的有线电视频道上宣扬末日论和时代论。[61]

    林赛支持哪个政治阵营,这很少有争议,但他通常避免直接支持;也许他选择了更多地关注未来世界,而不是当下这个世界。不管原因是什么,将时代论信仰注入日常政治的责任落到了其他人身上。其中,最成功的是时代论传教士杰瑞·法威尔。

    法威尔的家族起源于1669年的弗吉尼亚州。他的父亲是一位成功的、不信教的商人,经营着许多家企业,其中一家是公共汽车公司,汽车上非常有特色地安装着电池动力的电影放映机。不过,他的父亲在55岁时因酗酒而死。法威尔追随着他虔诚的母亲,母亲每个周日一大早就开始播放查尔斯·富勒的《昔日广播》节目,声音响彻全屋。

    法威尔在父母身上看到了善恶之争的缩影,在20岁出头的时候,被任命为牧师。他从富勒的广播剧本中借鉴了一页,创作了自己的《昔日福音》电视节目。该节目于1956年首次亮相后,吸引了大量的追随者。尽管他个人反对民权立法,但他坚守那个时代的福音派信条——拯救灵魂,但远离政治。[62]

    1973年1月22日,在美国联邦最高法院宣布罗诉韦德案[63]的判决后,他改变了:

    我永远不会忘记1973年1月23日的早晨……我不敢相信,法庭上的7位法官竟然对人类生命的尊严如此冷漠。他们得到了错误的信息吗?他们被误导了吗?难道他们把这个国家带入了一个黑暗和羞耻的时代,却连自己在做什么都不知道吗?我知道还有很多事情要做,我越来越相信我必须成为做这件事的人之一。[64]

    几年后,法威尔的政治盟友之一保罗·韦里奇对他说:“法威尔,在美国,道德上的大多数人在这些基本问题上的意见是一致的,但他们没有被组织起来。”于是法威尔和韦里奇建立了“道德多数派”,其以反对堕胎和同性恋权利的姿态出现在全美舞台上,他们决心“整肃”电视和电影市场,并热情支持以色列。

    在1980年的选举中,道德多数派为罗纳德·里根和几十位共和党国会候选人的顺利当选做出了重要的贡献。在1984年共和党大会上,法威尔本人做了开篇祝祷,他称赞里根是“自林肯以来最伟大的总统”。[65]

    不到10年,运动失败,“道德多数派”解散。首先,里根总统在任期内似乎没有改善国家的道德问题,相反,电影和电视节目的内容越来越淫秽,而福音布道者吉米·斯瓦加特和金·贝克则以他们肮脏的性丑闻和财务丑闻羞辱了福音派。该运动失败几年后,参议院对比尔·克林顿的无罪判决促使韦里奇写信给他的支持者:也许根本没有“道德上的大多数人”。[66]

    法威尔和他的时代论同僚们带来的这场政治运动,其最持久、最具危险性的影响,可能就是美国对以色列空前狂热的支持。其中,以美国以色列公共事务委员会为代表的强大的亲以色列团体的游说发挥了很大作用,但基督教福音派对美国中东政策的影响很容易超越美国以色列公共事务委员会。正如加利福尼亚大学洛杉矶分校政治学家史蒂文·施皮格尔在2002年《国会季刊》中简洁指出的那样:“在美国对以色列政策的力量方面,如果你只关注(国会的)犹太成员和犹太团体,你就错了。”[67]

    《国会季刊》的这篇文章还引用了美国众议院原教旨主义基督教成员的话。印第安纳州新当选的代表迈克·彭斯说:

    我对以色列的支持很大程度上源于我个人的信仰。在《圣经》中,上帝向亚伯拉罕承诺:“我会祝福那些祝福你的人,我会诅咒那些诅咒你的人。”所以在某种程度上,我并不完全理解(美国的政策)。我相信,我们自己的安全,与我们愿意和以色列人民站在一起的意愿息息相关。[68]

    代表詹姆斯·英霍夫的话则更简洁。当被问及以色列为什么有权占领加沙和约旦河西岸时,他回答:“上帝是这么说的。”[69]文章最后以法威尔的话结束:

    美国大约有200000名福音派牧师,我们通过电子邮件、传真、信件、电话,要求他们走进讲坛,利用他们的影响力支持以色列和它的总理。[70]

    然而,没有人能像帕特·罗伯逊那样成为典型,他将原教旨主义带入具有潜在灾难性的地缘政治舞台。他被外交官兼记者迈克尔·林德称为“美国政治史上最重要的阴谋论传播者”[71]

    罗伯逊出生于一个保守的南方特权家庭,他的父亲是阿布萨隆·威利斯·罗伯逊。为了推动1965年《民权法案》的顺利通过,伯德夫人到弗吉尼亚州访问,但老罗伯逊冷落了她,这惹怒了总统林登·约翰逊,老罗伯逊20年的参议院职业生涯也宣告结束。他又重新参与1966年的参议院初选,并成功击败了对手。[72]

    从耶鲁法学院毕业后,年轻的罗伯逊未能通过纽约律师资格考试,于是进入商业领域。对曼哈顿灯红酒绿的生活大失所望之后,他回到弗吉尼亚州,借了37000美元,并于1960年创办了后来的基督教广播网。这家媒体公司的成功出乎他的意料,在鼎盛时期,是美国的第三大有线电视集团。[73]

    罗伯逊从事各种职业,从滑稽的信仰治疗表演,到控制年收入1.5亿美元的全球媒体和商业帝国,后者使他拥有数亿美元的净资产。[74]他坚持时代论的基督教犹太复国主义基本叙事,但其中重要的两点除外:他不相信被提;他实行“蒙受神恩的福音传道”(这是一种花哨的说法,表示他拥有治愈疾病的能力,能说外语[75],能与上帝交谈,或者至少能听到上帝的声音)。

    20世纪80年代中期,他决定寻求1988年的共和党总统候选人提名。最初,共和党的当权派视他为边缘候选人并将他排除在外,但很快就发现他的电视传教可以产生数千名“帕特兄弟”的志愿者,并能聚集20个州的领薪职员。1987年,当他控制了当年的密歇根州共和党大会、击败了两位领先者——副总统乔治·布什和魅力四射的自由论者、足球明星杰克·坎普时,他令政治观察家们感到震惊。那年晚些时候,他在艾奥瓦州、南卡罗来纳州和佛罗里达州的党团会议和代表会议上表现出色,并将继续赢得夏威夷州、阿拉斯加州、华盛顿州和内华达州的初选。

    然而,最终,罗伯逊的竞选由于三个政治暗礁而搁浅。作为一个不完全赞同时代论时间表的魅力派,他未能统一原教旨主义右翼。尽管他确实获得了法威尔和吉米·斯瓦加特的支持,但金·贝克对他的支持并不热烈,而另一位坚定的时代论作家蒂姆·莱希则坚决抵制他,而支持杰克·坎普。[76]

    他的福音派同僚们没有做到真正团结,而且世俗政治团体的反应也正在减弱。克里斯托弗·希钦斯在1986年罗伯逊的群众集会上报道说:

    愚蠢有点儿可怕;尤其是有组织的群体愚蠢。把罗伯逊介绍给人群的人是哈拉尔德·布里德森。布里德森将自己定义为“福音派-蒙受神恩的基督徒”,具有五旬节派[77]的能力,能说外语。[78]

    此外,他确实从斯瓦加特和金·贝克那里获得了部分福音派的支持,但后来,当这两个人各自的性丑闻和财务丑闻曝光时,他们的支持反而适得其反。斯瓦加特的丑闻的曝光时间非常糟糕,正好在1988年“超级星期二”初选[79]前夕。(两年前,斯瓦加特曝光了一位牧师同事通奸,这正给他自己惹祸上身,这位牧师同事随后就报复性地用长焦镜头监视了斯瓦加特最喜欢的巴吞鲁日市某旅馆。)

    罗伯逊在“超级星期二”两个月后正式暂停竞选活动。但他的总统竞选至少在短期内增强了他在州和地方层面的影响力。他帮助参议员杰西·赫尔姆斯赢得了1990年的连任竞选。在1993年的阿肯色州副州长选举中,他帮助福音派迈克·哈克比开创了政治事业;这对罗伯逊来说是一次特别甜蜜的胜利,因为他鄙视比尔·克林顿,而比尔·克林顿支持哈克比的对手纳特·库尔特。[80]

    在罗伯逊长寿的一生中,最突出的方面就是他在中东政治中的影响力。20世纪60年代,当他的电视网,特别是广受欢迎的《700俱乐部》新闻节目走进美国人的客厅时,福音派已经对中东事务产生了一定的影响力。1977年,以色列议会选举梅纳赫姆·贝京为总理,受此鼓舞的福音派于1980年成立了耶路撒冷国际基督教徒大使馆,历届利库德集团政府都迎合该大使馆。例如,1982年,勤勉的圣经学者贝京接受了美国达拉斯福音教堂的邀请,打算在这个亲以色列集会上发言,但由于妻子去世,集会在最后一刻取消。

    耶路撒冷国际基督教徒大使馆甚至批评1978年《埃及-以色列和平条约》将西奈半岛归还埃及,认为这违反了《圣经》的承诺:根据《圣经》,迦南的所有土地都属于犹太人;耶路撒冷国际基督教徒大使馆还大力支持1982年以色列对黎巴嫩南部的入侵。[81][82]

    每年从圣诞节到新年,罗伯逊都会沉浸在《圣经》中学习,并祈祷:

    在这期间,我恳求主将任何关于下一年的洞察和趋势赐予我。有时,他对我说的话非常准确,随后将令人惊讶地全部实现。另一些时候,要么是我的灵性感知缺失,要么是其他人随后的祈祷或行动,导致了与我预期不同的结果产生。[83]

    如果中东发生了一场灾难性的战争,很可能就是上帝想把不同的事情告诉不同的人。从这一角度看,罗伯逊一直是十分危险的,因为他经常听错上帝的话。例如,上帝告诉他,世界将在1982年结束,海啸将在2006年袭击太平洋西北部,2007年将发生全球范围内的大规模恐怖主义屠杀,米特·罗姆尼将赢得2012年总统选举。[84](他也从除上帝以外的其他地方听到一些奇怪的信息:1984年,在《700俱乐部》节目上,他提到了一些神秘的消息来源,说美国军队刚刚入侵了黎巴嫩。当主流消息来源反驳他这一说法时,罗伯逊险恶地回应说,显然国务院或中央情报局在隐瞒这件事情;1988年,在他的幻想中,苏联在古巴部署了SS-5和SS-24导弹中队。)[85]

    20世纪八九十年代,是罗伯逊影响力最大的时候。那时他在以色列的影响力与在美国的影响力相当;他还与以色列圣殿活跃分子保持密切联系,特别是“圣殿山忠诚者”组织的领导人格申·萨洛蒙,这一组织主张驱逐穆斯林、拆毁清真寺,并在圣殿山重建第三圣殿。罗伯逊会见过八位以色列前总理中的六位,他与强硬派本雅明·内塔尼亚胡的关系尤其密切。[86]

    罗伯逊的由神学驱动的外交政策产生了地缘政治危险,其影响远远超出了中东地区。例如,当一位极具魅力的基督教徒何塞·埃弗拉因·里奥斯·蒙特通过军事政变成为危地马拉总统时,罗伯逊欣喜若狂。即使在里奥斯·蒙特很明显地开始了一场针对该国原住民的血腥种族清洗运动、杀死了几千人并使数十万人流离失所之后,罗伯逊还是视若无睹:“我了解里奥斯·蒙特,他不会允许他的军队官兵杀害、强奸和折磨4000多名男子、妇女和儿童……有些人希望看到(蒙特)被共产党人取代。但我更偏向基督教徒。”[87]

    时代论在美国具有独特而广泛的影响,一个传统的解释是,美国的宗教性比其他国家更强。2012年,当全国民意研究中心调查世界各地公民的宗教信仰时,81%的美国人完全同意“我现在相信上帝,我永远相信上帝”这一强烈而明确的陈述,而英国人的这一比例只有37%,日本人只有25%,法国人只有29%。[88]

    过去几十年里,即使在美国,宗教信仰也在减少,虽然其不如世界其他地方那么明显;例如,1967年,对于盖洛普调查中的“你相信上帝吗?”这一更简单、稍欠明确性的问题,98%的美国人的答案为“是”;到2017年,这一数字已降至87%。[89]

    新教福音派的热情也是如此;2004—2018年,皮尤调查显示,自我认同的福音派教徒(其中大多数是时代论者)的人口比重从23%下降到15%(见图10-1)。但是,尽管他们的人数有所减少,但他们的选举人数比重已从23%增加到26%,实际上影响力更大了。一个必然的结论是,在人数减少和选举参与率增加的情况下,福音派教徒已经不仅仅是维持政治权力这么简单了。

    图10-1 美国的福音派人口

    尽管发达国家的宗教信仰和参与度有所减少,但发展中国家的情况并非如此。社会学家早就知道,随着社会更加富裕以及人们受教育程度的提高,人们的宗教信仰也会减少,这就是所谓的世俗化假说。由于较贫穷的发展中国家的人口出生率高于富裕的发达国家,因此世界上有强烈宗教信仰的人口的比例正在增加,而不是减少。[90]

    宗教信仰随着社会的富有而减少,其原因有很多,包括生存安全的提升,以及国家对社会福利职能的承担(以前是由宗教组织承担的),但就美国而言,发达国家日益世俗化的最重要的驱动力是科学知识的扩展,这取代了对自然现象进行宗教解释的需求。[91]

    人类对自然界有着永不满足的好奇心,特别是对自然界中最可怕的现象,如暴风骤雨、洪水、干旱、瘟疫和地震,对自然界中最神秘的现象,以及对地球生命的起源。今天,受过良好教育的人几乎不再需要神学来解释这些问题。当然,我们对物质世界的认识还存在不足,而且很可能永远存在不足,但是,随着科学不断缩小认知差距,在解释自然世界方面,宗教越来越落后于科学。

    受教育程度较高的人,宗教信仰较少。乍一看这种影响并没有那么大:根据皮尤论坛2014年的另一项调查,66%的没有受过大学教育的美国人绝对相信上帝;在大学毕业生中,这一比例仅略降至55%。[92]

    然而,在顶层人才中,科学教育的影响要大得多,他们对上帝的信仰已经萎缩到少得可怜的程度。1914—1916年,心理学家詹姆斯·路巴调查了500名美国科学家;他的研究结果提供了一个缩影,展示了当普通民众对上帝的信仰近乎普遍时,美国领先的生物学家、化学家和物理学家的宗教信仰会如何。

    路巴根据科学家们的地位和成就,将他们分为“较低”和“较高”两个级别,并分别研究了物理学家和生物科家(见表10-1)。

    表10-1 1914—1916年美国科学家对上帝的信仰

    数据结果令人印象深刻:最有成就的科学家对上帝的信仰最低,特别是精英生物学家,他们对生命起源和生物多样性的宗教解释需求,可能比化学家和物理学家要少。在任何情况下,所有科学家对上帝的平均信仰肯定远远低于同时代的普通人群。

    1998年,两位美国历史学家在著名的国家科学院的员工中重复了这项研究。这些员工相当于路巴实验中的“较高”科学家。在路巴的研究过去了80年之后,此时生物学家中信仰上帝的仅占5.5%,物理学家中占7.5%,最有趣的是,数学家中占14.3%,可能是因为他们对进化和分子生物学的掌握不如生物学家。[93]2013年,一项针对英国皇家学会研究员的研究的结果几乎与此相同,也出现了生物学家和物理学家之间的这种区别:76%的生物学家强烈认为上帝不存在,只有3%的人强烈认为上帝存在;而物理学家的这一比例分别为51%和7%。[94]

    因此,许多美国人能够包容像林赛和罗伯逊这样的人以及时代论的一般信条,是不是因为比起其他发达国家的公民,他们对事实了解得更少?

    美国人对时代论叙事的敏感性,以及与其他发达国家的人相比的高度宗教性,有其复杂的原因。显然,除了缺乏事实性知识之外,其他因素也推动了他们的虔诚,其中最主要的是他们的社会和家庭环境;社会学家早就注意到,信仰体系尤其可以通过与其他信徒之间紧密的社会关系得到很好的传播。[95]但当考虑到社会因素时,一个人储备的一般性知识越多,这个人越不可能接受充斥着林赛或罗伯逊般赤裸裸事实错误的时代论叙事。

    在经合组织的国际教育评估中,美国的排名一直处于发达国家的末尾;与其他发达国家的公民相比,美国人对自己国家和世界其他地区的了解少得可怜。2015年完成的最新国际教育评估显示,美国学生排名第40位,远远落后于斯洛文尼亚、波兰、越南、俄罗斯、葡萄牙和意大利等国家,更落后于新加坡、中国香港、日本和韩国这些排名靠前的国家或地区。[96]

    一项开始于1994年的研究有助于解释这个问题:对于5个有代表性的世界基本事实,37%的美国人错误地理解了所有5个问题,而德国人的这一比重只有3%。(在西班牙人中,32%的人5个问题都错了;墨西哥人,28%;加拿大人,27%;法国人,23%;英国人,22%;意大利人,18%。)没有上过大学的意大利人和德国人的分数超过了上过大学的美国人。[97][98]

    受访人的分数与接触电视新闻的多少呈负相关。正如这项研究的作者所说:“美国电视因其跳动剪辑、广告和断奏风格而导致显著的认知繁忙[99],而认知繁忙使一些人更难吸收信息。”作者指出,美国研究人员“通常不愿意问太多的事实性问题,因为害怕让受访者尴尬,进而导致他们终止采访或由于过于慌乱而无法回答其他问题”。这或许可以解释为什么德国人的表现如此出色:比起其他6个被研究国,德国人更常阅读报纸。[100]

    2009年,另一项研究广泛调查了美国人、英国人、丹麦人和芬兰人。调查显示,美国人对国内和国际时事,甚至国际流行文化知之甚少。最明显的例子是,只有37%的美国人知道《京都议定书》与气候变化有关,相比之下,英国人、丹麦人和芬兰人的这一比重分别是60%、81%和84%。只有在国内流行文化这一领域,美国人的得分与英国人、丹麦人和芬兰人几乎持平,略低于平均水平。[101]

    这项研究的作者还将这种差异归因于媒体结构的国际差异:在美国,媒体的使命更多地集中于娱乐而不是教育,而斯堪的纳维亚[102]政府则大力支持高质量的新闻和信息节目。英国拥有一个享有盛誉并资源渠道充足的公共新闻机构,即英国广播公司,还拥有繁荣的私人媒体部门,其排名处于美国之前,仅次于斯堪的纳维亚国家。

    这项研究的另一个重要发现,是受教育程度高和受教育程度低的美国人之间的知识差距远远大于其他三个受调查国家:受教育程度低的英国人、丹麦人和芬兰人,比受教育程度低的美国人更了解他们周围的世界(见图10-2)。[103]得出的结论:与其他国家相比,那些受教育程度低的美国人,特别容易受到时代论叙事的影响,而在其他发达国家中,即使是受教育程度最低的人也会抵制这种叙事,因为他们对于日常客观事实有更好的理解。

    图10-2 硬新闻知识了解程度和受教育程度

    记者格肖姆·戈伦伯格提出了一个与此相关的观点。20世纪90年代末,时代论者越来越痴迷于电脑的“千年虫”问题(Y2K);许多人认为,当日历指到2000年时,可能会触发世界末日;与往常一样,哈尔·林赛出版了一本如何在2000年末日时生存的书,书名为《面对千禧年子夜》。[104]戈伦伯格评论道:

    我猜想,未来的历史学家将研究那令人讨厌的一天(2000年1月1日)、电脑没有崩溃时的高潮,那是美国文化史而不是技术史的一部分。问题不在于这一小故障,而在于,与西方其他宗教信仰较少的国家相比,在这个充斥着千禧年信仰的国家里,其言论是多么刺耳。[105]

    具有深刻说教性的时代论末日叙事强加了社会成本。自历史学家理查德·霍夫施塔特[106]出版《美国政治中的偏执风格》(The Paranoid Style of American Politics)一书以来,人们就广泛地意识到,美国明显地倾向于阴谋论。两位政治学家J.埃里克·奥利弗和托马斯·伍德最近的研究表明,两个互为相关的因素最能有效地说明美国对阴谋论的敏感性。第一个是末日叙事信仰。第二个是将人类存在视为一种摩尼教式的善恶斗争的倾向,这是福音派,尤其是时代论者典型的神学特征:他们相信,自己和认同自己的人是善良与光明的典范,而那些不认同自己的人则与魔鬼结盟。奥利弗和伍德指出,右翼倾向于支持关于撒旦和上帝的时代论叙事,但是,左翼则更支持关于看不见的世俗力量的叙事,如“9·11”阴谋论。[107]

    人类不仅是一种盲目模仿、偏爱故事而不是事实和数据的猿类。而且,最黑暗的是,人类还是一种会在道德上谴责他人的猿类。有时人类就像一种摩尼教怪兽,构建一种荒唐的复杂神学,以奉承自己、妖魔化他人。这种摩尼教式思想渗透至极右翼和极左翼的政治派系中,并且一端的真信徒会转向另一端,这并不为奇——“串联真信仰”。阿道夫·希特勒指出,尽管他永远无法将工会会员或社会民主党转变为国社党,但他总是可以将一名德国共产党员转变为国社党员:“我已经……下达命令,要求德国共产党员立即加入国社党。”[108]最近,许多著名的新保守主义者,如欧文·克里斯托尔、内森·格雷泽、阿尔伯特·沃尔斯泰特和西德尼·胡克开始信奉马克思主义。

    进化心理学家认为,摩尼教式的思维方式很可能是从早期狩猎社会对部落凝聚力的需求演变而来的。如果部落成员之间彼此无私,与此同时,却以残忍的方式杀害其他部落的成员,那么本部落就会受益。心理学家将这种群体内/群体外的二分法称为“结群性”,它是由这样一种观念促成的,即自己所在的部落体现了各种美德并受到神灵的青睐,而其他部落则体现了邪恶并与邪恶势力(或在一神教社会中是魔鬼)结盟。[109]

    有一个经典的心理学实验,根据高中生的衬衫或头发颜色将他们分为地位高和地位低两组;很快前者就会对后者进行贬损。[110]1954年,社会学家穆扎弗·谢里夫和他的同事以一种更优雅的方式展示了这一现象:著名的(至少在社会学家中是如此)“罗伯斯山洞”实验。

    这个复杂实验的地点设在俄克拉何马州偏远、树木繁茂的罗伯斯山洞州立公园的一个野外训练营地,集聚了22个11岁左右的男孩。谢里夫已经筛除有心理问题的候选人,而且所有被选中的都来自双亲白人新教家庭。这些精选的男孩的平均智商远高于人类平均水平(112);关键是,在他们聚集在公园营地之前,彼此都不相识。

    实验分三个阶段进行。第一阶段,谢里夫将22人配对,使他们在运动、烹饪和音乐等各个领域的技能能够旗鼓相当。为了使每组都能平等地掌握全套技能,他将每对男孩分开,将其随机分到两组中,每组11人。

    在为期一周的时间里,每组分别参加了夏令营活动——游泳、徒步和其他体育活动,也参加了需要广泛讨论、制定战略并合作的问题解决练习,如烹饪,搭建帐篷和绳桥。每一组都不知道另一组的存在,在这一阶段结束时,这两组人分别为自己的队选择了名字:响尾蛇队和老鹰队。谢里夫随后制作了带有这些图案的衬衫和旗帜。

    在第二阶段,响尾蛇队和老鹰队一起参加了为期几天的多项目比赛(就是许多夏令营老兵所熟悉的“色彩争战”)。与普通色彩争战不同的是,实验中获胜的队伍获得了奖牌、奖杯和精美的小刀,所有这些奖励都将在用餐时间展示在非常突出的位置。败队则一无所获。

    几乎立刻,两队人开始互相嘲弄;最早,老鹰队烧毁了响尾蛇队的队旗,又撕碎了其换上的新队旗,接着是响尾蛇队晚上的报复性暴力袭击。当响尾蛇队威胁要用石头攻击对方时,实验人员进行了干预。这两支队伍都用“禁止进入”的标识牌对自己的领地进行了标注,而且几乎每天晚上都会互相偷袭。

    两支队伍几乎立即形成了典型的“外群体歧视”,将对方称为“臭虫”“吹牛者”“娘娘腔”,并反对在同一个食堂用餐。[111]老鹰队在比赛中获胜后,这两个群体仍互不往来,并明确避免混合。当两队人一起吃饭时,老鹰队通常会让位给响尾蛇队,说“女士优先”。谢里夫广泛地调查了男孩们对彼此的看法,毫不奇怪地发现,他们对队内同伴的评价远远高于队外人员。

    第二阶段的比赛结束后,马上进入第三阶段,谢里夫探索了如何减少第二阶段产生的群内/群外行为。虽然两队人聚在一起吃饭,或参加看电影等被动性娱乐活动,但敌对情绪依然存在。然后,他让两支队伍一起完成关键任务,比如恢复营地的供水。营地的供水被故意切断,营员们口渴时发现食堂没有水。完成一系列这样的任务之后,结群性显著减弱,尽管并没有完全消失。例如,在第二阶段结束时,响尾蛇队的朋友选择中只有6%是鹰队成员;到第三阶段结束时,这一比例上升到36%。[112]

    按照衬衫颜色分组以及罗伯斯山洞实验中的这种分组,都是一种随机和无意义的区分,但它们展现出戏剧性的“外群体歧视”。而时代论神学与其他主流宗教有很大的不同,因此,摩尼教式思维渗透到时代论者的意识中也就不足为奇了。

    虽然最初几代的时代论者有意回避参与政治,但到《贝尔福宣言》时,这一约束已经基本消失。到了20世纪70年代,林赛、法威尔和许多时代论作家将那些左倾的偏离他们的人都视为邪恶,在某些情况下视为反基督;他们进一步把耶稣转变成一个摩尼教式、具有鹰派右翼政治思维以及社会保守主义的完美典范。

    1991年苏联解体后不久,林赛猜出俄罗斯和德国已经签订了一项秘密协议,分割了位于两国之间的欧洲土地。林赛一直在寻找撒旦文化的象征,在他的《地球——公元2000》一书中,他将此认定为海底探险家雅克·库斯托,他认为库斯托温暖而舒心的海洋环境保护主义的背后是“世界一体的社会主义”的中坚核心。(时代论的这种散布恐惧的做法并不新鲜;早在20世纪初,原教旨主义基督徒就将世界语[113]视为撒旦全球主义的工具。)[114]

    《地球——公元2000》甚至还猛烈抨击美国社会安全网和环境保护中最无争议的方面。林赛显然没有意识到信鸽、渡渡鸟和世界鱼类种群的命运,他断言:“私人手中的资源总是可以受到最好的保护。”他将地球臭氧层变薄列为预示末日的众多灾难之一。虽然他承认人造氟氯化碳导致了臭氧层的消耗,但他认为限制全球氟氯化碳生产的《蒙特利尔议定书》是政府对个人自由的一种不必要的侵犯。此外,罪魁祸首是火山活动,而不是氟氯化碳,“可怕的是,我们无法采取任何措施修复受损的臭氧层”[115]

    火山爆发确实会减少臭氧层,但只是暂时的。它们已喷发了数亿年,却没有永久性地使臭氧层变薄。臭氧层变薄是一种更现代的现象;最近的数据表明,《蒙特利尔议定书》确实在缓慢地修复臭氧损害。[116]

    多年来,林赛越来越多地鼓吹自己的影响。在他于1980年写的《20世纪80年代:世界末日倒计时》一书中,他未经证实地宣称,自己曾被一名以色列飞行员邀请到美国空战学院讲授预言,并在那里受到了“热情的欢迎”。一年后,他被邀请回国演讲,他继续写道:“我惊讶地发现房间里竟挤满数百人,外面的人也试图挤进来。所有人都想听听先知们关于人类的命运说了些什么。我讲完后,反响非常热烈。”[117]之后,他又为“一个肩负着可怕责任的精英团体”做了一次演讲,但他无权透露那些成员的身份。再一次,这些高层听众明显地被他的预言“感动了”。“在我们见面的前几天,他们用电脑预测出的事件和结果竟然与《但以理书》相同。不用说,他们对此非常惊讶,但我对此并不惊讶。”[118]

    言归正传,在过去的几十年中,福音派越来越多地渗透到美国各级军队中。虽然军队中自称是福音派或五旬节派的总体比例似乎与普通民众中的比例大致相同——约为22%,但其实际影响力远大于该数字所显示的,尤其是在军队牧师和空军高级指挥部里的影响。[119]

    从20世纪50年代开始,福音派的反共言论得到军方高层的青睐。20世纪六七十年代,福音派对越南战争的支持与主流新教教会的反对形成鲜明对比,军队-福音的契合进一步加强。正如历史学家安妮·洛夫兰所说:“军队曾经对福音派持怀疑态度,但后来,福音派因支持兵役、战争和参战的人而在军队中赢得了尊重和影响力。”[120]

    军队牧师本来应该满足遭遇恐怖战争的青年男女的精神需求,但福音派更多地将其视为帮助他们找到耶稣的人。《美国福音派联盟》杂志上的一篇文章指出,一半的应征士兵没有明显的宗教背景,其余的大部分是主流新教徒、天主教徒或犹太人:“军队牧师工作的地方,是收获的禾场。”[121]

    为了避免出现美国宪法所禁止的国教,军方依靠“支持代理”从宗教派别中选取牧师候选人。1987年以前,军队按教派分配牧师;如果5%的应征者是圣公会教徒,那么5%的牧师也是。1987年,调整后的规则不仅将所有新教徒归为一个类别,还允许福音派和五旬节派的支持代理指定牧师。到2009年,大约80%的现役牧师是福音派或五旬节派教徒。[122]

    另外,在过去的几十年中,美国军方文化的核心一直位于梅森-迪克逊线[123]以下。由于南方白人军官和应征士兵强调的种族优越性越来越不被接受,福音派取代了肤色,成为一种主张优越性的方式。[124]美国所有4个武装部队分支都经历过传教丑闻。首先发生在空军学院,位于政治和宗教保守的科罗拉多州的斯普林斯市。早在21世纪初,该学院就已经爆出过性侵犯丑闻;几年后,福音派教官对于公开的反犹太主义视而不见,并告诫学员们自己是为“耶稣队”效力,并公开授权观看梅尔·吉布森的煽动性电影《耶稣受难记》。它是一部暴力、道德说教式电影,因暗含反犹太主义而受到福音派基督徒的盛赞和世俗观众的批评。[125][126]

    令人欣慰的是,20世纪80年代的美国总统放弃了世界末日的信仰体系,但危险仍然存在于其他领导人中;若某位美国、苏联、以色列或巴基斯坦高级军官像圣殿山纵火犯丹尼斯·迈克尔·罗恩那样精神错乱,挥舞的不是煤油而是核武器,那该怎么办?

    11 时代论的灾难

    大卫教派的悲剧

    1964年,核战争策划者丹尼尔·埃尔斯伯格(不久后,他将因未经授权就发布五角大楼文件而出名)与他的兰德智库老板哈里·罗恩“出于职业原因”,一起观看了电影《奇爱博士》。这部电影是导演斯坦利·库布里克的代表作,讲述了苏联的“末日机器”(装在掩埋的“钴钍G”容器中的几枚热核炸弹,将在遭遇敌方第一枚原子弹攻击时自动引爆);以及一位疯狂的美国空军基地指挥官杰克·里珀,他向苏联启动了战略轰炸机。所有启动的轰炸机都被成功召回,除了其中的一架;电影的结尾是,那架轰炸机的飞行员(由斯利姆·皮肯斯扮演)骑着一枚氢弹,像骑着一匹野马一样,从轰炸机的弹舱里飞下。[1]

    与此同时,彼得·塞勒斯饰演的奇爱博士向美国总统和苏联大使解释了他的后末日时代深矿井生存计划。伴随着核爆炸蘑菇云的腾起,“我们会再见面的”的声音响起。埃尔斯伯格写道:“看完电影后,我们走出放映室,站在下午的阳光下,被光线和电影弄得头晕目眩,我们都认为刚才看到的基本上是一部纪录片。”这部电影真实地描绘出了美国当时的绝密核指挥程序,埃尔斯伯格和罗恩对此印象特别深刻;事实上,这部电影是根据一部小说《红色警戒》改编的,该小说由皇家空军军官彼得·乔治撰写,他后来担任了这部电影的编剧之一。

    那时,埃尔斯伯格早已清楚美国核权力分散的危险性;因为早在几年前,他就参观了美国的军事基地。他清楚地知道,核战争可能意味着人类灭绝,然而他很羞愧地发现,一名上将,甚至在有些情况下只要一名少校,就足以自行发动核袭击。[2]

    埃尔斯伯格和罗恩并不是第一批对《奇爱博士》和《红色警戒》印象深刻的核策划者;在这部电影制作的5年前,他们的同事约翰·鲁贝尔向五角大楼远程导弹科学咨询委员会的每一位成员都发送了一份这部小说的副本。

    即使没有这种宗教狂热式的、精神错乱的指挥官,世界上的核武器指挥系统也极不稳定,容易发生事故。几乎从最初的核时代开始,世界上的核武器,也就是现实世界中的“末日机器”,几次将世界带到玉石俱焚的边缘。艾里克·施洛瑟的名著《指挥与控制》,记录了数十起恐怖的核事故,从携带热核武器的飞机和导弹的丢失,到大规模敌方攻击的错误警报。

    1961年,一架载有两枚400万吨级热核炸弹的B-52轰炸机由于机翼油箱漏油而失去平衡,飞机无法控制地剧烈旋转。飞行员扔掉了两个他以为没有安装炸弹的武器;其中一枚氢弹上的降落伞未能打开,坠入美国北卡罗来纳州法罗附近的潮湿地面下70英尺深。引爆装置和“初级”钚核心被回收,但“次级”铀——核威力的来源——从未找到。另一枚氢弹上的降落伞的确打开了,但当撞击到地面时,氢弹机头传感器发送了一个引爆信号,爆炸前需要通过的几个安全装置中,除了其中一个,其他均已打开。

    如果第二枚氢弹被引爆,那么这将形成“触地爆炸”,产生的放射性沉降物将远远超过广岛和长崎原子弹的“空中爆炸”,后者的威力不到B-52所携带氢弹的1%。如果爆炸时正在刮南风,那么致命的沉降物将覆盖东北部的大部分地区,并使北卡罗来纳州大部分地区不再适合居住。[3]

    更令人震惊的是,1962年古巴导弹危机期间,一名过于心急的美国驱逐舰船长向苏联潜艇B-59投下了深水训练炸弹[4],但他不知道这艘潜艇上装备了核鱼雷。作为反击,苏联潜艇的艇长和政委都想向驱逐舰发射一枚核鱼雷,幸运的是,苏联舰队总指挥官瓦西里·阿尔希波夫也在船上,不同意发射。几十年后,当这段插曲公之于众时,阿尔希波夫被大家称为“拯救世界的人”。[5]总体来说,苏联领导层将其核权力链控制得比美国要短得多。普林斯顿大学的布鲁斯·布莱尔是当今核控制领域的权威,“俄罗斯的核控制和安保体系结构比美国的更令人赞赏”[6]

    好消息是,1981年罗纳德·里根就任美国总统后,他的国家安全机构充斥着防守鹰派,他们有意识地、热情地用几乎连续不断的挑衅来扰乱苏联。美国战略空军司令部每周会派出轰炸机飞越北极,或者派出短程轰炸机威胁华约[7]领空或苏联的亚洲边境。当时负责军事援助的副国务卿小威廉·施耐德回忆道:“苏联人不知道这是什么意思。一个美国空军中队直飞苏联领空,苏联的雷达被点亮,部队进入警戒状态。但是最后一分钟,中队撤离并返回美国。”[8]

    在有些情况下,雷达系统会错误地发出大规模导弹袭击的警报。1980年6月3日凌晨2点30分,正值苏联入侵阿富汗、美国抵制莫斯科奥运会的紧张冷战局势,美国国家安全顾问兹比格涅夫·布热津斯基被他的军事助手比尔·奥多姆叫醒,奥多姆向他报告说有220枚导弹来袭。布热津斯基让奥多姆去确认,战略空军司令部警戒小组是否正在冲向他们的B-52并启动引擎,然后给他回电话;他决定不叫醒他的妻子,这样她将会在睡梦中毫无意识地被核武器汽化。几分钟后,奥多姆打电话给布热津斯基,说现在有2200枚导弹来袭。只剩下几分钟的时间激活国家核武器库,布热津斯基当时正要给卡特总统打电话,奥多姆第三次打电话,报告说其他系统未能确认攻击。事实证明,只差一分钟世界就会被焚毁,因为有人错误地将一盒训练磁带插入了计算机指挥系统。[9]

    随着国家核武器规模的扩大,意外事故风险也在增加。政界领导人面临着与军事指挥官之间的艰苦斗争,因为后者更关心的是确保核武器能够发射,而不是防止意外发射;而确保核武器能够发射,会更有可能导致意外发射。例如,许可操作链接(PAL)的引入,使用8位代码和有限进入功能,从理论上防止了未经授权的核武器启动。然而,为了避免错误代码阻碍核武器发射,战略空军司令部的高级指挥部将所有代码都设置为易于记忆的8位数“00000000”,这就消除了这种保护。[10][11]

    与汽车防抱死制动器一样,系统中引入的安全功能通常会增加用户信心,却降低了系统安全性。正如研究复杂系统中“正常事故”的著名理论家查尔斯·佩罗所指出的那样,这些看似有益的变化“往往只会让操控者更快地启动系统,或者在恶劣天气下启动系统,或者以更大的威力启动系统”[12]

    任何指挥官或领导人都会面临一种情况,即那些最重要的决定都必须在几分钟内根据不完整的数据做出。幸运的是,他们不会因为相信自己的选民会在核爆炸前“被提”而使自己的决定受到影响。《奇爱博士》中的精神病将军里珀,出于对氟化供水的担忧,启动了轰炸机袭击苏联,并发表了电影界最著名的独白之一:“我不能再坐视共产主义的渗透、共产主义的灌输、共产主义的颠覆,以及国际共产主义的阴谋逐渐侵蚀和玷污我们珍贵的体液。”如今,氟化水仍然是时代论右翼的一个禁忌,尤其是金·贝克,他的网站重复了一个可笑的说法:“美国人死于氟化水的数量超过了整个国家的军事死亡人数。”[13]

    除了这种由精神错乱的或宗教狂热式的军事指挥官所带来的非常明显的危险之外,时代论叙事也带来一种更微妙、也许更严重的末日危险。林赛和法威尔等时代论者强烈反对任何军备控制,他们支持膨胀的核武器库,这些武器库的增长纯粹是数量扩张,会增加意外毁灭的可能性。

    这非常强烈地体现在林赛的《20世纪80年代:世界末日倒计时》一书中。在林赛看来,《限制战略武器条约》并没有降低核灾难的风险;相反,它摧毁了美国的军事优势,将美国置于致命危险之中,并将允许苏联“横扫欧洲”。美国政府只不过是阴谋论者大恶魔——三边委员会[14](一个高调的非政府组织,以洛克菲勒家族和兹比格涅夫·布热津斯基为主角)的傀儡。更糟糕的是,美国愚蠢地抛弃了它忠实的盟友,如蒋委员长、伊朗末代国王巴列维和实行种族隔离政策的南非政府。[15]林赛想象出以下场景:

    苏联总理可能很快就会给美国总统打电话。总理会说:“我们可以摧毁你们的导弹发射井,我们可以用激光束拦截和摧毁所有来袭的潜射弹道导弹,我们可以用我们的米格-25战斗机和SS-5地空导弹摧毁你们那些过时的轰炸机。所以,总统先生,你会投降吗?还是让我们摧毁你的国家?你有20秒的时间做出决定。”[16]

    林赛在《地球——公元2000》一书中也敲响了主战之鼓,他将已被遗忘很久、位于旧金山普雷西迪奥[17]的戈尔巴乔夫基金会,看作撒旦世界新秩序摧毁美国影响力的证据。不明飞行物不是外星飞船,而是撒旦的恶魔。[18]

    此外,“常态化”的末日风险可能成为一个自我实现的预言。正如末日神学权威观察家保罗·博耶所说:

    我个人的感觉是,如果平民的预言信仰与核武器政策之间有联系的话,那么这也是隐蔽的和间接的联系。1945年后的预言信徒们,很少有意识地主动推动世界末日。相反,他们相信《圣经》已经预言了末日,并确信信徒们将幸免于难,因此倾向于消极地接受核军备竞赛和冷战对抗。[19]

    20世纪80年代初,小说家格雷丝·穆杰塔巴伊前往得克萨斯州的阿马里洛镇,调查这座宗教信仰浓厚的小镇与附近的潘特克斯核武器工厂之间的关系。潘特克斯工厂负责装配和维护美国所有的核武器。最终,穆杰塔巴伊将她的杂志文章改编为一本书《有福的确据》。她是犹太人,最后定居在了阿马里洛镇。

    她发现,时代论信仰如此彻底地渗透到了这座城镇,即使是镇上报纸的出版商,一位受过良好教育的自由民主党人,也认同其信条。20世纪80年代,该工厂的任务广为人知,阿马里洛人立即明白,整个地区已经成为核攻击的主要目标,将在核战争的最初便从地球上消失。该镇的最大教派第一浸信会,本身并不认同时代论;然而其成员都平静地接受了这种风险,甚至感到有些安慰,因为他们认为被瞬间汽化比其他更痛苦的死亡方式更可取。

    该镇较小的教派禧年礼拜堂的领导者罗伊斯·埃尔姆斯牧师的观点则不同。根据穆杰塔巴伊的记录,埃尔姆斯告诉他的教区居民根本不需要害怕核战争,因为教区居民会在其他人被上帝烧死之前“被提”:

    你们知道,他们在太空计划上花了一大笔钱。一大笔钱!看吧,我的朋友们,他们还不如把这个计划全部关闭,然后等待号角之声,那么他们将进入另一个太空计划中!我甚至从来没有想过让我的名字出现在他们正在做的这个小计划的宇航员名单里。但是我的名字,在上帝的恩典和帮助下,已经出现在另一个宇航员计划中……当火箭起飞时……我们将留下一道圣灵之火的痕迹!

    “再见!再见!”这位牧师向即将被氢弹汽化的阿马里洛、休斯敦、达拉斯和洛杉矶喊道。埃尔姆斯所在教区的一位居民相信自己会乘坐同一艘火箭逃离核末日,她为此而感到欣慰,但也为可能会抛下自己的孩子和孙子而感到痛苦。[20](穆杰塔巴伊所著书的书名《有福的确据》指的是信众们将免于面对恐怖的核灾难。)

    和博耶一样,穆杰塔巴伊只是简单地想到了具有宗教狂热的潘特克斯工人可能会通过获得核武器来推动千禧年进程。而且,和博耶一样,她也担心普通居民会和她已经非常了解的阿马里洛人一样,已经接受了摩尼教式的时代论世界观,并且在核战争的风险中麻痹自己。

    如果世界可以区分绝对的善与恶,可以区分上帝的追随者与撒旦的追随者,那么与敌人之间的妥协或谈判就不可能存在。在一个绝对两极分化的世界里,人类和平是无法实现的,战争不可避免。[21]

    在1982年美国宗教学会上,神学家戈登·考夫曼在主席演讲中进一步指出了时代论对人类的威胁。他指出,人类有史以来第一次拥有灭绝整个物种的能力,因此时代论的末日世界观“最终逃避了我们作为人类的责任,恶魔般地援引神的意志作为逃避的理由”。考夫曼进一步将“被提”描述为“切断人类责任的神经”[22]。也就是说,拯救自己免于被灭绝的能力掌握在上帝手中(即使在很小的程度上),这种信仰削弱了我们阻止它的意愿,从而增加了它发生的风险。

    幸运的是,核武器和时代论的交集所固有的危险,迄今为止仍然停留在推想阶段。但是,有一位具有米勒精神的继承人,他的末日信仰将推动他和大量无辜追随者走向悲惨的结局。自有记载的历史出现以来,弗洛伊德的“微小差异的自恋”已经产生了源源不断的宗教变异[23],基督复临安息日会也会在新教繁茂之树上产生一株有毒的分枝。

    20世纪20年代,一个名叫维克多·豪迪夫的基督复临安息日会教徒开始宣扬他对《圣经》的独特解读。他是一个学历只有三年级的推销员,被《启示录》耸人听闻的叙事吸引,特别是,他和之前的许多人一样,关注《启示录》中第七章的144000名信徒,12个各有12000名信徒的希伯来部落,“在我们上帝的仆人们额上盖上了印”。

    基督复临安息日会教徒认为自己就是那144000名信徒;豪迪夫认为,随着该教派的人数远远超过了这个数字,它已经失去了热情和献身精神,这就是问题所在。作为时代论者的典型,他抨击沉迷于“海滩派对和电影放映”等现代罪恶文化活动的基督复临安息日会的兄弟们。[24]正如异端人士惯常做的那样,他编撰了一份教会“可憎之事”清单;在他看来,自己的使命是将基督复临安息日会的信徒减少至144000名,使之达到必要的纯度。

    豪迪夫并不是要建立自己的教派,而是要改革原来的教会。但随着极具魅力的他开始吸引追随者,他那些过去的“兄弟们”感到惊恐,并在1934年将他逐出了教会(就像1845年罗汉普顿的浸信会将米勒逐出教会那样)。

    最初,他的教派被称为“牧羊人之杖”(豪迪夫宣言的题目),或者简称为“杖”。为了表明对古代圣地大卫王国中心地位的信仰,教派更名为大卫基督复临安息日会(简称大卫教)。1935年,随着成员人数的增加,大卫教徒在美国得克萨斯州韦科的迦密山中心建立了总部。尽管该中心只有37名追随者,但豪迪夫预计,世界末日将在一年内到来,届时他将带领144000名追随者前往巴勒斯坦。

    由于他追求虔诚而纯粹的复临主义,因此他和继任者们的传教活动只针对基督复临安息日会的信徒,而不包括那些无法救赎的普通民众。[25]1955年,豪迪夫去世,此时他已经吸引了数千名信徒,但大卫教并没有前往巴勒斯坦(那时该地区已经在以色列的统治之下)。此时,大卫教已经壮大,它向东迁移了9英里到达得克萨斯州的埃尔克,即“新”迦密山。

    《圣经》是历史上被分析和讨论最多的书,数百年来共有几十亿读者。根据概率论,其中一定有几百万读者具有极高的智商,也一定有几十万读者接受过《圣经》解读方面的学术培训。豪迪夫的学历只有三年级,但是,他认为自己发现了一个以前所有读者都没有发现的《圣经》意思,并将自己选为“东方升起的天使”,以在末日带领144000名信徒前往圣地。从豪迪夫开始,大卫教产生了类似的一系列极端自我主义的领袖,他们将在美国联邦执法机构的推动下,带领该教派走向灾难。

    1955年11月5日,豪迪夫死后不久,他的遗孀弗洛伦丝宣布,她进一步解码了《启示录》的末日时间序列:1260天之后,也就是1959年4月22日,耶稣就要来了。[26]她的预言吸引了900名追随者来到迦密山迎接末日,在那里,怀着期待的信徒们再次上演了米勒“大失望”的小规模版本。和1844年的“大失望”一样,该教派随后分裂为各个相互竞争的团体,其中最大的团体由豪迪夫的助手、一位名叫本·罗登的人领导,他接管了迦密山。[27]

    罗登继承了豪迪夫的自我中心主义,并宣称,按照上帝给他的启示,他就是“分支”(《撒迦利亚书》和《约翰福音》用“分支”这个词来描述上帝的仆人),他将带领这个团体迎接耶稣复临,因此这个团体的新名字就是大卫支教。他规劝真信徒们“离开那根枯树枝,到活分支上来”[28]

    1978年罗登去世后,他的妻子洛伊丝(根据上帝的透露,她就是圣灵)和他们精神反复无常的儿子乔治之间发生了一场权力斗争。最终,洛伊丝在一个名叫弗农·豪厄尔的年轻人的帮助下获胜。在此之前,豪厄尔一直过着混乱的生活;他的妈妈14岁时便未婚生下了他,当他还是个孩子的时候,曾转换于不同的家庭,饱受阅读障碍[29]和孤独之苦,最后在读九年级时辍学。

    豪厄尔笨拙但英俊,他只对三件事物有兴趣:他的吉他、他的《圣经》和性。1981年,他让一位15岁的女孩怀孕了,但是他向基督复临安息日会的兄弟们宣布,上帝打算让他娶另一位年轻女子,她是一位牧师的女儿。他总是有“见证”的癖好,有一次打断了一场仪式,登上讲坛布道,这些活动很快将他驱逐。他曾在迦密山做过木工活儿,1983年,他在那里定居。[30]

    在那里,豪厄尔被洛伊丝·罗登的领导职位和半神地位吸引,他找到了自己的家。他是在基督复临安息日会长大的,被迫阅读《圣经》;而洛伊丝被豪厄尔对《圣经》的敏锐理解和外貌吸引。很快,豪厄尔就和这位当时已经67岁的寡妇共享了大卫支教的领导权,以及她的床。

    在大卫支教内,号称拥有神权的女性不会像主流新教教派中的女性那样引起人们的注意;但豪厄尔崇拜基督复临安息日会的创始人之一艾伦·怀特,后者被认为是一位女先知。《圣经》几乎指导了豪厄尔生活的方方面面;他说,他与洛伊丝结合,希望实现《以赛亚书》8:3中的预言,即他去见女先知,然后女先知怀孕了,并生了一个儿子。后来他半开玩笑地说,如果他“让一个70岁的女人怀孕了,那么他一定是上帝”[31]

    如前文所述,历史学家查尔斯将《启示录》描述为“整套《圣经》中最难读的一卷”,并警告说“不仅略读,即使认真研读,读者也依然会觉得困惑”[32]。直到1983年左右,豪厄尔可能也同意这一评估。1983年,这位高中就辍学的24岁的年轻人认为,他和豪迪夫一样,不同于大众识字时代以来几个世纪里的几十亿《圣经》读者,他能够解开7个封印,从而揭开《启示录》的真正含义。豪厄尔认为,《启示录》是掌控《圣经》其余部分的关键。

    1984年1月,豪厄尔与一个大卫支教成员的14岁女儿结婚,也因此与洛伊丝决裂;那年晚些时候,乔治·罗登已经与母亲和好,用枪口指着豪厄尔和他的支持者们,并将他们赶出了大院,将教名改为罗登维尔。豪厄尔和几名追随者在东边100英里处的得克萨斯州帕勒斯坦市的一个条件恶劣的小屋里定居下来。出于空闲和对更好环境的渴望,他去了以色列。

    在以色列期间,他似乎得了“耶路撒冷综合征”。这是一种在以色列游客中很常见的精神错乱,由于终于能够直接接触到一生都在读和听的圣地和圣殿,因此他们过度兴奋,充满宗教热情,常常把自己想象成《圣经》中的人物。[33]其中一个“耶路撒冷综合征”患者是患有精神分裂症的健身游客,他相信西墙位于错误的位置,并试图移动其中一块巨石,这是“参孙综合征[34]”。阿克萨清真寺的纵火犯丹尼斯·迈克尔·罗恩可能当时也处于类似的状态。

    离圣殿山只有几英里的卡法尔·沙乌勒精神病医院,专门研究这种精神错乱。1980—1993年,那里的精神病医生治疗了470名患者,其中的绝大多数患者之前就存在精神机能障碍,例如那个“参孙综合征”患者和罗恩,但另外42名患者(约占研究样本的9%)没有精神病史。有精神病史的人(占91%)广泛分布于犹太人和主流基督教派中,但42名没有精神病史的人中有多达40名是福音派新教徒。不超过10年,悲剧将展现在韦科镇。[35]

    从以色列回来后,弗农·豪厄尔有了明显的变化。在以色列,上帝已经告诉他,他是上帝的仆人;随后,他的布道变得有活力,他开始更善于将《圣经》的各段落联系并融合在一起。如今,每当他阅读《圣经》经文时,立刻会有上帝的声音告诉他这些经文的真正含义。去以色列之前,他曾告诉别人,他希望能尽快收到上帝的“完整信息”,但这一愿望没有实现。从以色列回来后,很可能是受到耶路撒冷综合征的影响,他终于从上帝那里收到了信息。[36]

    从19世纪40年代末的诞生开始,预言便是基督复临安息日会固有的一部分。在豪迪夫和罗登领导下的大卫教,以及在豪厄尔领导下的大卫教,也是这样。大卫教的人努力使本教派或多或少地持续“处于信息中”——接收来自全能者的一连串预言。他们认为,现代的基督复临安息日会已经放弃了预言,因此已经成为叛徒。

    《启示录》14:6-9中描述了3位预言天使,这尤其吸引了豪厄尔的注意,不管出于什么原因,总之豪厄尔认为实际上有7个预言。前两个是威廉·米勒关于末日和巴比伦已经沦陷的开创性信息。第三个是艾伦·怀特关于以星期六为安息日的信息;第四个是维克多·豪迪夫的预言;第五个是本·罗登的;第六个是洛伊丝·罗登的。上帝告诉豪厄尔,他现在是第七个预言的传递者,是即将到来的末日之前的最后一位天使。

    1987年豪厄尔从以色列返回后,发生了古怪的一幕。当时仍控制着迦密山的乔治·罗登挖了一名追随者的坟墓,这名追随者叫安娜·休斯,25年前被埋葬,享年85岁。乔治向豪厄尔发起挑战,要求他参加让休斯复活的比赛;而豪厄尔和7名追随者则突袭了迦密山大院并给休斯的尸体拍了照,想以此指控乔治虐待尸体。双方发生了45分钟的枪战,但没有造成死亡或重伤。1988年,豪厄尔和他的7名同伙因谋杀未遂而受审,陪审团宣布7名共犯无罪,对豪厄尔的控诉也因证据不足而流审。

    这一判决结果使乔治的精神开始错乱,法庭档案中记录了他对豪厄尔发出的各种怪诞的诅咒和威胁,他因犯藐视法庭罪而入狱。乔治被监禁后,豪厄尔支付了大卫教总部的房产欠税并搬回总部。乔治在1989年获释后又用斧头谋杀了室友,因为他怀疑室友是豪厄尔派来杀他的;他被关进精神病院,并多次逃离;1995年再次逃离后不久便死于医院,死因是心脏病发作。

    在接下来的几年里,豪厄尔根据《以西结书》《但以理书》《马太福音》《启示录》提炼出他的末日路线图。随着世界末日(他尚未确定日期)的临近,他将带领追随者们前往以色列,在那里,他的大卫教徒将使犹太人皈依基督教,从而引发一支从北方而来的美国领导的联合国部队,大卫教徒将支持现在已经皈依的以色列人并与之共战共亡。虽然没有记录表明豪厄尔读过哈尔·林赛的书,但考虑到这一时期林赛的书的普遍性,因此这些牵强的叙事可能并不是豪厄尔自己从《圣经》中提取出来的。后来,豪厄尔将末日大灾难的地点从以色列转移到美国迦密山。

    豪厄尔的“耶路撒冷综合征”所激发的《圣经》光辉让听众深受震撼。在美国和其他国家的传教之旅中,他让大约100名信徒加入了迦密山。尽管收获了来自澳大利亚和英国的皈依者,但以色列人对此更持怀疑态度,并对《圣经》感到厌倦,因此他没能让以色列人皈依。

    这是一个兼收并蓄的多种族团体,其中包括24名英格兰皈依者。1990年,豪厄尔在加利福尼亚州提交了法庭文件,合法地将自己的名字改为大卫·考雷什。其中“大卫”源自他想象的由自己领导的圣经王国,而“考雷什”是“居鲁士”的希伯来语,像500年前的扬·博克尔松那样,他通过让其他男性成员单身、自己享受一夫多妻制,来满足自己日益增长的性欲。他另外“娶”了5位年龄从12岁到20岁不等的女性,为了避免被起诉重婚,他的男性追随者们在名义上娶了这些女性。他在澳大利亚旅行期间,一对夫妇如此敬仰他的神性,在双方都愿意的情况下,妻子和19岁的女儿都与他发生了性关系,这样她们就可以“为上帝生孩子”[37]

    为了迎接末日,他要求大院的已婚成员通过性节制来实现净化,并“取消”新迦密山上所有夫妻的婚姻关系,其中可能包括他的5位侧妻和她们的“丈夫们”。另一方面,与考雷什发生性关系成为一项神圣的仪式,在“前夫们”完全同意的情况下,他和许多“前妻们”发生了关系。

    他预言他所生的孩子(至少有12个)将在耶路撒冷的新王国享有优待地位,这使这些追随者很高兴。其中一位“前夫”解释道:“你根本不明白。作为大卫支教的人,我们对性不感兴趣。性如此具有攻击性,如此具有侵略性。考雷什为我们消除了这一负担。”就考雷什而言,他认为,与追随者们生育是他的一项严肃而神圣的责任。不过有时,他的确向他的性伴侣们坦白了自己的性欲,并羞怯地说是上帝使他这样的。

    他解释说,这种恰当的肉体安排源自《启示录》4:4中的一项特别命令,该节描述了24位戴着金王冠的长老,他们向上帝高呼,“让我们成为国民,做祭司,归于神。让我们在地上执掌王权”(5:10)。考雷什在《圣经》解读方面取得了革命性进展:他认为,“让我们成为国民”这几个字意味着《启示录》预言他要成为24位长老的父亲,这24位长老将在千禧年时代统治世界。因此,被选中怀上这24个孩子的妇女是神圣的容器,这就要求考雷什控制她们生活的方方面面,包括她们的饮食。不用说,从来没有哪位著名的圣经学者能够以如此“宜人而时尚的方式”解释《启示录》的第4章。[38]

    考雷什的魅力在于他的“圣经教学”可以持续几个小时,他能准确地回忆和清晰地解释《圣经》。尽管他九年级就辍学了,但他对《圣经》的精彩解释甚至能够吸引那些受过良好教育的人,包括一位哈佛法学院的毕业生和其他几位硕士期间接受过神学培训的人。

    考雷什认为,《启示录》5:1中所提到的7个封印掌握着末日事件和大卫支教通往救赎之路的钥匙:“我看见坐宝座的人的右手中有书卷,其里外都有字,用7个印封严了。”

    考雷什将这本“书”命名为“上帝之意”,它是上帝迄今为止委托给“羔羊”人类的秘密计划。考雷什此时已经将自己认定为“羔羊”,并根据其他《新约》和《旧约》推断出了打开7个印的线索,因此具有向其追随者们揭示“上帝之意”的独特能力。[39](大卫教认为“基督”是上帝在某项任务中指派的,其有多种动态表现形式:有时是耶稣;有时是羔羊;而根据考雷什的说法,有时是他自己。)[40]

    早在1987年,大卫教就引起了瑞克·罗斯的注意。罗斯是一位高调而又备受争议的“邪教破坏者”,几十年来帮助数百人摆脱了邪教的侵害,并在多个关于邪教的案件中出庭作证。在相关亲属的要求下,罗斯在纽约帮助两名考雷什信徒消除了所受的毒化思想,随后他又接到了其他家庭的求助电话。罗斯列举了“危险性邪教”的6个认定标准:绝对而又不负责任的权威人物、对领导人意愿的满足、对外部信息的过滤、“我们反对他们”的心态、对组织之外的人的诋毁,以及以《圣经》或哲学借口为领导人的财富和性贪婪做辩护。[41]虽然考雷什没有过滤外部信息,但他确实符合其他5个标准。

    从20世纪80年代末开始,考雷什和几位追随者囤积了大量武器,并在一些不需要背景审查的枪支展上交易武器,由此筹集资金。到1991年,一位名叫马克·布劳尔特的澳大利亚追随者,其对考雷什囤积武器、浮夸的神学和对年轻女孩的性剥削的不满,引起了媒体的广泛关注,首先是澳大利亚的媒体,然后是在一个监护权程序中,一名儿童被从迦密山带走引起了美国媒体的关注。布劳尔特和罗斯都向BATF(美国烟酒枪炮及爆炸物管理局)转达了他们的担忧,BATF计划于1993年2月底对该大院进行一次突袭。到那时,BATF至少已获得300件武器,包括60支M16、60支AK-47和30支AR-15突击步枪。[42]

    酷爱枪支的考雷什在这次突袭前曾说过:“如果有人来我家,在我的孩子们面前挥舞枪支,那么他一定会被打爆头。”得克萨斯州的法律允许公民向使用“不正当武力”的警官开枪。[43]

    罗斯还联系了《韦科论坛先驱报》,该报于1993年2月27日发表了《罪恶的弥赛亚》系列的第一篇文章,引发了轰动效应,全国媒体很快对此进行了报道。这些文章控诉考雷什虐待儿童、与未成年女孩发生性关系、对其他男人的妻子拥有神授的权利——他至少有十几个这样的侧妻。[44]

    事实上,得克萨斯州的儿童福利机构在上一年已经调查过该大院,发现孩子们都很快乐,且他们得到了很好的照顾,几乎没有受虐迹象,除了偶尔被用勺子打打屁股,而这在得克萨斯州是可以接受的。但《韦科论坛先驱报》对考雷什性行为的指控基本属实。[45]

    第二天,即2月28日上午9点45分,BATF执行了搜查令,其依据不是《罪恶的弥赛亚》中耸人听闻的指控,而是非法持有枪支。当时,在得克萨斯州拥有和使用自动武器是合法的,但这些武器需要在联邦当局进行合法登记;而考雷什没有登记。[46]

    这时,BATF的无能就体现出来了。它将搜查计划透露给了电视记者,电视记者随后向一名邮递员问路,而这名邮递员正是考雷什的姐夫。BATF通过大院内的一名线人知道,计划已经暴露,因此武装冲突不可避免。但BATF仍决定继续突袭。事先得到风声的考雷什首先下令举行祈祷仪式,然后在各个入口处部署了武装人员。后来,不知道是谁先开的枪,但考雷什在前往其中一个入口时曾经告诉追随者,他要出去和特工谈谈。根据随后的财政部调查,考雷什打开门,问特工们“发生了什么事?”他们回答:“别动!”考雷什砰的一声关上了门,子弹穿透门和窗户从里面射出。另一名从大院外观察的特工报告说,他看到考雷什开了两次枪,这意味着考雷什一定打开了门,但他可能并不是第一个开枪的人,也不是BATF后来声称的对他们进行伏击的人。[47]

    持续的枪战席卷了整个大院,4名特工和6名大卫教徒被杀,其中两名分别是考雷什16个月大的孩子以及另一名教徒的婴孩;几十人受伤。BATF的特工们没有为突袭做充分的准备,以至于大卫教徒的火力和武器补给都超过了他们;弹药不足时,他们便撤退了。[48]

    大多数记录者都认为,如果大卫教徒愿意,那么他们可以杀死更多的BATF特工。后来的政府调查特别指出,大卫教对袭击的反应是一种典型的“防御性暴力”,其特征符合“希望从主流文化中退出的群体”[49]。事实上,那天最引人注目的交流是韦恩·马丁——那位毕业于哈佛法学院的教徒给韦科警局办公室打的一个慌乱的电话。他说:“告诉他们,这里有妇女和儿童,让他们停下来!”——这不像是有人执意于末日暴力。[50]更令人痛心的是,BATF在此之前就经常因一些小型武器违规而进行挑衅性的破门袭击,其知道考雷什经常在附近独自慢跑,想趁这个时候发出逮捕令,以轻易地逮捕他。[51]

    惨败之后,FBI(联邦调查局)解除了BATF的职务。在接下来的51天里,FBI与手腕中弹的考雷什进行了谈判。从一开始,FBI就将围攻原因描述为解救人质,但在BATF突袭后不久,20名儿童在几名成年人的陪同下离开了大院,随后有大量证据表明,剩余的大卫教徒都不想要或不需要联邦政府的解救,而联邦政府则以经典的时代论方式,将这里称为“巴比伦”。

    全国都在关注这次行动;遭到BATF袭击后,考雷什立即通过当地广播电台和CNN(美国有线电视新闻网)与公众直接沟通,沟通中他引用了英王钦定版《圣经》中的长篇大论。虽然他的追随者和基督教神学家对这本《圣经》很熟悉,但对世俗观众来说,他仿佛在讲斯瓦希里语[52]。有一次,他对一位深感困惑的电台采访者说:“我们现在在第五个封印中。”

    神学家詹姆斯·泰伯也听到了这次采访,他在1993年之前并不知道考雷什。2月28日晚,他与几百万美国人一起收听CNN,当时CNN中断了常规广播,报道BATF袭击后的情况。这位年轻的大卫教领袖喋喋不休,泰伯的注意力突然被他提到的7个封印吸引。泰伯不仅知道这是《启示录》里的重要内容,而且还知道“考雷什”是希伯来语中“居鲁士”的意思;泰伯快速地查阅了《以赛亚书》第45章,发现居鲁士已经被上帝认定为弥赛亚,弥赛亚的希伯来语“Mashiach”翻译成希腊语就是“Christos”,也就是“基督”。考雷什称自己为“羔羊”,是基督复临主义的表现——泰伯更加确定,考雷什的信仰基础正是《启示录》。

    随着对峙事态的发展,泰伯很清楚地意识到,FBI对考雷什的末日叙事一无所知。泰伯打电话给另一位神学家菲利普·阿诺德,后者联系了FBI特工,特工们承认,他们已经被考雷什的《圣经》独白弄糊涂了。

    一些特工甚至开始阅读他们酒店房间里的基甸版《圣经》中的末日启示类内容,这是一项甚至让专业神学家都无法承受的任务。正如泰伯所说,特工们疯狂翻阅《圣经》的景象“几乎滑稽可笑,但同时也令人恐惧”。泰伯和阿诺德立即意识到,大卫教徒们认为自己在有7个封印的世界中航行;他们还意识到,第5个封印,即考雷什认为大卫教目前居住其中的封印,是7个封印中最暴力、最危险的一个。

    泰伯和阿诺德认为,要想和平解决对峙事件,就必须在考雷什的信仰基础《启示录》上与他交手。政府允许泰伯和阿诺德接触了一位被监禁的大卫教徒,他叫利文斯通·费根,是考雷什派往迦密山代表其公众形象的。费根证实了泰伯和阿诺德的分析:大卫教徒生活在混乱的第5个封印中,但上帝让他们等待。在4月1日的一个电台脱口秀节目中,这两位神学家出现了,他们详细讨论了《启示录》的末日论,并暗示了和平的结局。他们知道考雷什经常收听这个节目,为了确保考雷什能听到,他们还让考雷什的律师发给考雷什一份录音带。

    4月14日,不管是否由于受到电台节目的影响,上帝终于再次向大卫·考雷什发出了指示,考雷什现在明白了一切。那天,他写了一封信给他的律师们,宣布他正在写一封宗教长信,要向全世界通报“7个封印的解码信息”。写完后,他将公布一份副本。“我会出来,然后轮到你们处置这只野兽。”阿诺德和泰伯很高兴;也许终究可以避免这场即将发生的灾难。然而,这将是全世界从考雷什那里听到的最后一次交流。[53]

    不是只有泰伯和阿诺德理解考雷什的虔诚并希望能够和平解决对峙事件;更多的福音派人士也是如此。在围攻初期,美国全国基督教协进会和浸信会联合委员会的要员们给克林顿总统写了一封信,他们在信的开头衷心地恳求:“请让得克萨斯州韦科的冲突非军事化。”这封信指出“复仇的威胁以及军队和坦克的集结,只会向这群‘忠实的信徒’证明世界的力量都在与他们作对”,并有先见之明地指出“如果政府在这场失败的局面中投入了如此多的资金和信誉,却没能彻底铲除犯罪教派,那就更是一场悲剧”[54]

    然而,在7周多的对峙之后,在司法部长珍妮特·雷诺的支持下,FBI中的强硬派获胜。雷诺批准直接出击。

    虽然泰伯和阿诺德能否让考雷什走上正途还未确定,但是FBI内的强硬派认定考雷什是一个骗子,以“对《圣经》的胡扯”作为拖延战术;对没有经过神学训练、已经听考雷什讲了几个小时的《圣经》的特工们来说,似乎情况确实如此。[55]FBI的人嘲笑考雷什4月14日的那封信,尤其嘲笑这名九年级辍学者要写一封“宗教长信”的狂妄,认为这又是一种拖延战术。考雷什的律师们说他们正在拟一项投降协议,但是FBI的人根本不理睬。[56]FBI没有针对“预言”问题与考雷什沟通——这对考雷什来说很重要——而是直接切断了大院的电源,摧毁了信徒们停放的汽车,还开始放震耳的音乐,用强光探照灯照射院子。

    4月19日,FBI结束对峙,开始行动。从那天早上6点左右开始,特工们用装甲车反复撞击大楼,并使用CS催泪瓦斯(一种类似于麦加大清真寺的围攻者们使用的化学武器)。中午过后不久,大院起火了;大火迅速蔓延,吞没了大院,烧塌了屋顶。76名大卫教徒,其中包括两名孕妇,在大火中丧生,只有9人逃脱。大多数人从大火中逃到地下室,被发现时已经被烧死。至少有20名成员死于枪杀,其中包括考雷什,显然是为了避免被直接烧死。

    尽管随后的多项政府调查都得出结论,认定大卫教徒在FBI突袭之前就纵火企图自杀,但幸存的大卫教徒坚决否认任何自杀的说法,因为他们认为自杀是一种罪行。他们还说,当FBI切断电源时,他们使用油灯照明,但装甲车将油灯撞倒。此外,4月19日,风速高达每小时30英里,大风很快就通过打开的窗户和被FBI车辆撞出的洞,使火势从一个房间蔓延到另一个房间。火灾发生后两周,FBI将现场夷为平地,但这也没能提高FBI的可信度。[57]

    其中一名幸存者随身携带了一张数据盘,上面有考雷什4月14日的信中所提到的未完成的手稿,而FBI曾经认为所谓的手稿只是一个拖延时间的诡计。打印出来的信一共包括13页纸,其中包括对第一个封印的介绍和讨论;这封长信可能还需要几个星期才能写完。[58]

    用詹姆斯·泰伯的话说:

    考雷什是一个具有个人色彩的《圣经》解经大师。从大卫支教的神学角度来理解,他的信息具备系统性、一致性和内在的逻辑性。然而,对一个不了解《圣经》预言细节的人来说,他的信息以一种典型的、没有停顿的方式传递,并引用了钦定版《圣经》的长篇大论,似乎毫无意义。[59]

    我们永远无法知道,考雷什是否会如4月14日信中所承诺的那样和平投降,但很明显,FBI从未试图认真处理他所关心的神学问题。灾难发生后6个月,司法部成员向副司法部长提交了一份长篇报告,该报告的修订版长达489页。其对神学知识缺乏关注在目录中就能体现出来。目录中列出了宗教学者们的咨询内容,仅有4页,除了学者们的身份介绍之外,几乎没有传达任何有用的信息。这4页之后是心理咨询师的分析内容(共28页),几乎所有的咨询师都认为考雷什是个骗子。其中一位是FBI国家学院的行为学专家兼讲师皮特·斯梅里克,他甚至反对神学家参与这次事件。[60]

    随着对峙事件的推进,大部分公众与FBI一样,认为大卫·考雷什是一个自私自利的骗子。然而,真相可能更加微妙。与乔治·哈德森、塞缪尔·英萨尔、威廉·米勒以及几乎所有群体错觉的传播者一样,考雷什真诚地相信自己的叙事,这种自欺欺人使他对追随者进行灾难性误导的能力更加强大。

    在过去500年中,人类的模仿倾向和寻找引人入胜故事的倾向都落脚在末日错觉上——这是所有叙事中最让人着迷的一种。由此产生的神学叙事通常将其信徒限定在和平、繁荣的社区中,但这种叙事也会时不时跳出正常行为的护栏,由此产生诸如闵采尔领导的农民战争、博克尔松的疯狂的再洗礼派的暴动、文纳的第五君主国派的暴动和考雷什的大卫支教引发的大屠杀等灾难性后果。

    与一个半世纪前的威廉·米勒及其追随者一样,考雷什怪诞的神学、强烈的性欲和与未成年人发生的性关系,使他被媒体和公众妖魔化——这一妖魔化反过来导致了过度执法的悲剧。如果BATF最初的反应能够更加灵活,如果FBI能更加熟悉末日叙事的细微差别,那么韦科对峙事件可能不会以悲剧告终。

    正如结局所体现的,相当一部分公众都将责任归咎于联邦政府,大卫支教的悲剧并没有就此结束。电视直播了这场大屠杀,但大火最重要的目击者——一位名叫蒂莫西·麦克维的年轻退伍军人——近距离目睹了这场大屠杀。麦克维早已经愤怒于上一年的政府围困鲁比山事件。与韦科围攻事件类似,鲁比山事件起源于美国特种部队老兵、福音派教徒兰迪·韦弗受到的武器指控;这场对峙导致韦弗的儿子萨米和持有强烈末日信仰的妻子维姬的死亡。韦科对峙期间,麦克维正在那里分发枪支权利小册子。当韦科的火焰升起时,他发誓要为无辜死亡的男人、女人以及孩子们报仇。在韦科袭击两周年之际,他和同伙特里·尼科尔斯使用卡车炸弹对俄克拉何马市的联邦大楼进行了袭击,这导致168名无辜者丧生。麦克维之所以选择这个目标,是因为大楼里既有FBI办公室,也有BATF办公室,此外,还有大量其他部门的联邦雇员。[61]

    12 “被提”类小说

    末日文学为何畅销

    到了新千年初,大卫支教的灾难和林赛不靠谱的预言再次让人们意识到,过于精确的预言和日期设定是有风险的,时代论者也越来越倾向于一种不受质疑的类型:末日类小说。

    早在20世纪初,基督教作家就开始创作正义者“被提”、反基督者崛起、大灾难、世界末日和最终审判等主题的小说。1905年,俄亥俄州一位名叫约瑟夫·伯勒斯的医生出版了已知最早的被提类小说《泰坦,土星之子》。书名中的泰坦是一个现在大家很熟悉的反基督者的人物形象,“一个年轻的希腊人,他将联合激进的社会党人,在世界范围内致力于摧毁基督教会”。伯勒斯在序言中说,这部小说不仅仅是他想象力的产物,而且打开了“一盏探照灯,照耀出教会未来即将发生的一连串事件”[1]

    尽管被提之景象和泰坦/反基督者崛起的故事吸引了读者,但整本书的各个章节都在讲述令人腻烦的《圣经》解读。其销量还不错,一共印刷了10次,10年内的销量超过1万本——也很体面,但不能算是一本畅销书。[2]

    但是,这本书展现出了被提类小说和美国福音主义的一般性特征:仇外心理、仇视伊斯兰教以及意识形态和道德上的恐慌。伯勒斯小说中的民族英雄名叫英格兰,孤身一人对抗由反基督者领导的十国联盟。可悲的是,美国因为“2500万在欧洲出生的美国公民”而无法援助母国。美国的“萨克森人”急于帮助英格兰,但被黑暗联盟的势力压倒,现在又被穆斯林“安拉!安拉!安拉!”的高呼声援助。欧洲的穆斯林势力入侵美国,将“萨克森人”文化溶解于外来的社会主义中。[3]

    随后的几十年里,被提类小说家们从时事中提炼出引人注目的叙事,并将其加入小说中,以此改进他们的作品。[4]到20世纪80年代,最重要的时代论小说家是弗兰克·佩雷蒂,他是一位文学巧匠,最有名的著作《当前的黑暗》销量超过200万册。

    这本书首次出版时,正值苏联解体、东欧剧变,时代论者需要找一个新的敌人。他们被迫选定了另一个末日祸根:新纪元运动,尤其是那些散发出一丝撒旦主义气息的运动。

    故事发生在和平美丽的虚构大学城阿什顿,其中出现了两位英雄,虔诚的牧师汉克·布舍和老练的新闻记者马歇尔·霍根,他们与一位极其富有的城市骗子亚历山大·卡瑟夫对抗,后者出于莫名的原因想要控制这座小城镇。

    卡瑟夫的盟友包括一群红眼睛的、鳞片皮肤的长着翅膀并呼吸硫黄的恶魔,他们吸食普通人的意志,但幸运的是,他们特别容易受到虔诚信徒的攻击,尤其是布舍。但这些生物与当地大学的女权主义教授朱琳·兰斯特拉特的撒旦潜力相比,根本不值一提。兰斯特拉特试图通过“神和女神意识入门”等课程破坏霍根女儿的宗教信仰。卡瑟夫密谋陷害布舍和霍根,把他们关进同一间牢房里,但他们联手打败了卡瑟夫及其下属,不管是人类的还是非人类的。[5]

    佩雷蒂所体现的道德恐慌并不是什么新鲜事物。例如,林赛把达尔文、康德、马克思和弗洛伊德的著作看作毁灭现代社会的“思想炸弹”,并引导了一场文化圣战。在撰写《消失的伟大地球》的前一年,他出版了《撒旦好端端地活在地球上》一书,其中有对洛杉矶一位“警察指挥官”的采访,这位指挥官描述了在圣莫尼卡海滩上的一次“接吻行动”,让林赛想起了“非洲野蛮人的宗教仪式”:

    大约有400人紧紧地挤在一起,像一团人,随着鼓声和诡异的音乐晃动……他们中的一些人开始脱衣服。有些人开始沉浸在公开的性行为中,对周围的人视而不见。我们注意到,他们中的大多数人的脖子上戴着饰物。他们信仰精神世界,会欣然承认魔鬼对他们来说是真实存在的。[6]

    历史上,越是在最糟糕的时期,末日运动就越蓬勃发展:巴比伦流亡时期犹太人的被奴役和流亡;两次犹太人反抗罗马的大屠杀和大规模实体破坏;中世纪欧洲宗教战争和俄国大屠杀的恐怖。生活在繁荣、安全、和平的现代国家中的末日信徒,不得不将他们的义愤发泄在不太明显的社会祸患上:占星术、对进化论和地质科学的认知失调、普世主义、性、毒品、摇滚乐和永远存在的撒旦。

    这种末日恐惧的散播远非无害。20世纪七八十年代,时代论者对新纪元的唯灵论和占星术的厌恶,演变成了经典的“道德恐慌”——这是一种群体错觉——对本不存在的撒旦式儿童性侵和大规模谋杀的群体错觉。大量自称撒旦教专家的人,包括重要的执法官员,在全国出名,他们谈到有数万名儿童成为宗教仪式的受害者。据说,撒旦教徒绑架年轻女性,强迫她们成为“生育者”,以此供应婴儿祭品;新生儿在填写出生证明之前就被从医院抱走,这样“他们就不会被怀念”[7]

    泰德·冈德森就是这样一位“专家”,他曾是FBI的官员,参与玛丽莲·梦露自杀案和约翰·肯尼迪总统暗杀案,并领导FBI的洛杉矶、孟菲斯和达拉斯办事处。冈德森认为,美国每年有4000名儿童死于宗教仪式:

    有人告诉我,这些团体从医院、孤儿院、购物中心和远离街道的地方绑架受害者(通常是婴幼儿),这是很常见的事。据我所知,撒旦主义者已经成功地影响了夏令营的孩子们,近年来,他们通过渗透教练团队以及在美国各地建立幼儿园,集中精力招募少年棒球联盟队员……一位博伊西[8]的警察认为,每年有五六万的美国人失踪,他们成为撒旦团体的人类祭品。大多数受害者被焚烧,因此尸体和证据都没有。我知道加利福尼亚州洛杉矶有一家神秘用品店,其出售便携式火葬设备。我已经向FBI、美国司法部和国会议员报告了这些事实,并建议联邦政府对此进行调查,但我的要求没有得到回应。[9]

    1988年,在全国多家电视台播出的《杰拉尔多·瑞弗拉秀》的节目,推出了一个名为《恶魔崇拜:曝光撒旦的地下活动》的纪录片,其讲述了所谓的大规模谋杀;对这一现象的“调查”甚至出现在主流媒体节目中,如《20/20》和美国国家公共电台的《早间节目》。[10]

    1985年的麦克马丁审判案,是现代社会中最臭名昭著的事件。当时,一位年轻的、患有精神病的母亲(这让人联想到患有精神分裂症的丹尼斯·迈克尔·罗恩)向警方报告,她刚学会走路的孩子在幼儿园被鸡奸。她的故事听上去不像真的:孩子们被引诱到飞机上和隧道里,在那里,马被屠杀,教师装扮成女巫在空中飞行;孩子们在仪式中受到性虐待,其被录制成儿童色情作品。

    幼儿园的经营者是一位很不幸运的女士,名叫佩姬·麦克马丁·巴克利。所谓的撒旦虐待“专家”和社会工作者们聚集到学校,他们很快从孩子们那里提取了关于虐待的描述,但这些孩子年龄太小,根本不能准确表述所发生的事情。这场对巴克利和其他6名幼儿园工作人员的审判耗时7年,耗资1500万美元,并毁掉了被告们的生活:在等待审判的过程中,巴克利在监狱里待了两年,她的儿子待了五年。最终,调查人员没有发现任何隧道或儿童色情制品,孩子们的父母也没有看到过所谓的死马,成为证据的一件黑色长袍最后被证明是巴克利女士的毕业礼服。[11]

    这起审判只是20世纪80年代席卷全美的十几起大规模撒旦主义/托儿道德恐慌事件中的一起,最后判定被告无罪。还有许多其他案例,被告被判重刑,但随后的上诉和调查审判表明了这些控诉的虚假性,也突出了道德恐慌的错觉特征。此后福音派偏执狂又转向了其他领域,各种起诉便消失了。《纽约时报》记者玛格丽特·塔尔博特警告说,“犹豫是一种很难维持的心理状态;人们总是急于用更摩尼教式的愿景取代它”,尤其是当反基督者和末日隐约出现时。[12]

    《当前的黑暗》和佩雷蒂的一系列后续书籍只是一个开始,更大的出版业奇迹还在后面,也就是前文提到的蒂姆·莱希和杰里·詹金斯的《末世迷踪》系列。莱希出生于1926年,就读于南卡罗来纳州格林维尔市的鲍勃·琼斯大学,那里的氛围与他的宗教信仰相符。该校的建校与原教旨主义者强烈反对主流新教教会接受现代科学特别是进化论有很大的关联。在1924年的一次圣经会议上,威廉·詹宁斯·布赖恩俯首向福音传道者鲍勃·琼斯说:“如果学校不停止讲授进化论,那么我们的国家将成为无神论者的国家。”[13]布赖恩非常关注世俗邪恶对美国高等教育机构的影响,而琼斯清晰地听出了布赖恩的担忧,并于1927年创立这所大学。而这一年的布赖恩,作为前国务卿、两届总统候选人、著名演讲家,则继续在臭名昭著的“猿猴诉讼案”[14]中起诉斯科普斯。

    20世纪50年代初,刚刚拿到鲍勃·琼斯大学毕业证的莱希,在全国各地奔波,为各种教堂会众服务,最后在加利福尼亚定居。在加利福尼亚,他为耶稣和养家而奋斗,这种热情可能与他9岁时失去父亲有关。他和妻子一起,参加了电视节目《莱希的家庭生活》,他抨击同性恋、世俗主义和女权主义,成为一名老练的文化战士。多年来,他出版了一系列小说和非虚构类书籍,书中明确警告国家妇女组织、联合国和美国公民自由联盟的危险性。[15]

    20世纪80年代中期,在飞往某个预言研讨会的航班上,莱希注意到航班机长正在和空姐调情。机长戴着结婚戒指,而空姐没有。莱希自言自语道:“如果‘被提’发生了,航班上的上百人就会突然消失;这时飞行员意识到,当他回到家时,他的基督教妻子和儿子也会失踪。那不是很有趣吗?”[16]

    事实上,在莱希的作品之前,已经至少有两个被提类叙事中出现过失踪的乘客和机组人员:塞勒姆·柯班的小说《666》和威廉·詹姆斯的文章《当数百万人消失时》。[17]撇开独创性不谈,历史上最成功的宗教性多类媒体尝试——末世迷踪现象已经诞生。

    莱希最初设想了一部“被提三部曲”,但他知道自己缺乏必要的小说叙事技巧,因此文学经纪人为他联系了一位经验丰富的作家、代笔人——时代论者杰里·詹金斯。后者在其漫长的职业生涯中写了190本书。风度翩翩的莱希在年龄上与詹金斯的母亲相仿,两人立即建立了联系。莱希提供该系列的神学框架,詹金斯撰写书的文本。[18]1995年,两人出版了他们的第一本书,名为《末世迷踪》。

    詹金斯以前的作品,从儿童小说到体育新闻报道,无所不包,他对营利性文学艺术的精通体现于该系列作品的每一页,例如书的开头:

    雷福德·斯蒂尔的心里一直想着那个他从未碰过的女人。当满载747名乘客的飞机在大西洋上空自动驾驶,按照预定路线将于第二天早上6点在伦敦希思罗国际机场降落时,斯蒂尔已经从脑海里抹去了自己还有家庭的事实。春假期间,他将会和妻子以及12岁的儿子在一起,他们的女儿也会从大学回来。但现在,他的副机长正在昏昏欲睡。他正想象着哈蒂·德拉姆的微笑,并期待着快点儿见到她。德拉姆是斯蒂尔航班上的资深空姐。他已经一个多小时没见到她了。[19]

    迄今为止,斯蒂尔一直忠实于他的妻子艾琳。艾琳是一名狂热的宗教信徒,她随时都期待着被提。但现在的斯蒂尔已经鼓起了勇气,将飞行控制装置留给昏昏欲睡的副机长,然后漫步走到飞机上的厨房里与德拉姆幽会。令他失望的是,他发现她正在抽泣且情绪异常激动,她告诉他,数十名乘客失踪,他们的座位空着,只留下了衣服。一个接一个地,醒来的乘客尖叫着,因为他们注意到了消失的同伴和仅剩的衣服。德拉姆请求斯蒂尔做出解释,斯蒂尔假装不知道,但“可怕的是他知道一切。艾琳是对的。他和大多数乘客都在末日前被留在了地球上”[20]

    全世界陷入了混乱,无人驾驶的飞机像被击中的野鸡一样垂直落下,无人驾驶的车辆冲出公路路肩;几百万人失踪,更多的人死亡。虔诚的地铁司机突然失踪,造成了撞车事故。纽约市作为世界无信仰者的中心陷入交通瘫痪。欧洲关闭了空中交通,因此斯蒂尔将他的飞机开回美国芝加哥的一个运转正常的机场(不同于电影版中不太真实的高速公路着陆)。

    电视新闻镜头捕捉到了被提的怪异景象。例如,一位临产妇女的肚子突然瘪了,婴儿直接升入天堂,与此同时,护士的衣服掉到了地板上,护士也与婴儿一起升入了天堂。回到家后,斯蒂尔发现他的妻子和年幼的儿子都离开了,而他的持有不可知论的大学生女儿克洛伊被留下了。当然,艾琳所在教堂的所有会众也都离开了;牧师意味深长地为剩下的人留下了一张“我告诉过你”的DVD,DVD制作得非常用心,它影响了雷福德·斯蒂尔,使他立即皈依并获得重生。

    巧合的是,斯蒂尔航班上的一位乘客名叫巴克·威廉姆斯,是一位著名记者,正在调查被提事件。大约一年前,他去以色列采访了一位生物学家,这位生物学家不仅发现了一种能将沙地变成肥沃农田的化学肥料,还掌握着另一个神秘而极具价值的科学秘密,正是这个秘密使以色列成为地球上最富有的地区。威廉姆斯在以色列期间,俄罗斯人试图对该国进行大规模核袭击,但他们所有的导弹和轰炸机都奇迹般地在半空中爆炸。

    小说中的第三位主角是反基督者,即一位名叫尼古拉·卡帕西亚的罗马尼亚人,他精通九种语言,外表英俊,能力出众,极富魅力。在他还是一名政界新星时,威廉姆斯采访过他。他迅速升迁,很快成为联合国首脑,并将联合国安理会改组为时代论者所熟悉的十国联盟。卡帕西亚现在是世界上最强大的人,他建立了全球货币体系和经济联盟,实现了核军备的全球性裁减,与以色列签订了七年和平协议,并将现在拥有至高权力的联合国迁移到了古巴比伦所在地区。通常情况下决策缓慢的世界组织,却在几个小时内同意了卡帕西亚提出的所有要求。卡帕西亚随后宣布成立一个统一的世界性宗教。

    威廉姆斯发现了卡帕西亚的真实身份,并开始与克洛伊联手。克洛伊母亲所在教堂的会众几乎都被提了,与之形成鲜明对比的是,克洛伊所有斯坦福大学的左翼朋友们都被留下承受灾难;克洛伊和威廉姆斯重获新生后结婚,并与她的父亲联合组建了“灾难之光”,该力量利用技术魔力与卡帕西亚作战。[21]

    书中到处都是国际主义者的阴谋。几十年前,一位全能型生物技术金融家乔纳森·斯托纳加尔对卡帕西亚的母亲人工授精,于是能够迷惑人类的卡帕西亚诞生,斯托纳加尔的邪恶野心得到推进。军方故意无视专业飞行员的不明飞行物报告。斯托纳加尔重新安排了世界的领导者,几乎每天都制造高层“自杀”事件,但他自己最后也为卡帕西亚所杀。卡帕西亚洗脑了所有目击者,使他们相信斯托纳加尔是自杀的,除了受到上帝保护的威廉姆斯。

    这本书充斥着莱希的摩尼教式文化战士风格:那些反对堕胎并投票支持共和党的人会被提,而仅仅过着舒适生活或阅读新纪元书籍的人将被烧死。

    威廉姆斯引人入胜的探索过程,将原本难以理解的时代主义末日论分成了容易理解的小部分。这本书保持了一种高度传神的叙述流,通过交替的段落既描述了威廉姆斯对卡帕西亚真实身份的不懈追查,又阐述了如今重获新生的斯蒂尔对时代论末日计划的探索。

    1995年版的《末世迷踪》出版后,在接下来的12年里,莱希和詹金斯又写了15部续集和前传,它们共同涵盖了整个时代论序列,从邪恶的卡帕西亚在基因工程中出生,到(最终的)王国降临。

    前几部书的每一部都售出了几十万册,到了第四部,由于口口相传,该系列已经在《纽约时报》畅销书排行榜上名列前茅。[22]到了第八部,首印总量已经达到250万册。2001年“9·11”事件之后,第十部销量飙升,取代约翰·格里森姆的《油漆的房子》成为全年最畅销小说,这是格里森姆自1995年以来首次失去此殊荣。更值得注意的是,畅销书排行榜一般都不会将宗教性书店的销量计算在内,而这本书在宗教性书店的销量占总销量的1/3。大约1/10的美国人读过该系列的书,1/4的美国人知道这些书。[23]

    《末世迷踪》系列的总销量超过6500万册。2002年,莱希和詹金斯登上了《时代》杂志(以及2004年《新闻周刊》)的封面;随后,两位作者分别推出了各自的系列,莱希也从宗教导向的廷代尔出版社转到主流的兰登书屋,后者支付了4500万美元向他预约了另一个系列的书。[24]

    如此巨大的成功引起了时代论者对它的批判性审查。尼古拉斯·克里斯托夫在《纽约时报》中写道:

    美国最畅销的小说系列《末世迷踪》,热情地描绘了耶稣复临并杀死所有非基督徒的情景。世界上的印度教徒、穆斯林、犹太人和不可知论者,以及许多天主教徒和一神论者,都被扔进了永恒的火焰中……天哪,多么令人振奋的一幕啊!

    克里斯托夫随后将注意力转移到林赛的各种有缺陷的预言上,并得出结论,“明明是错的,却罕见性地获得了如此巨大的成功”[25]。另一位世俗评论家则轻蔑地认为詹金斯融合了“杰瑞·法威尔和汤姆·克兰西[26]”的风格。[27]其他一些评论家认为,被提类小说普遍缺乏同情心,它们以极大的快乐描述被烧死的数亿人。

    杰里·詹金斯展现出一个随和、不带意识形态的平民作家形象。在接受《新闻周刊》采访时,他提道:

    平庸的文字,单薄的人物形象——我接受批评。我就是给平庸的人写的。我也是一个平庸的人。我尽己所能写作。我知道我永远不会被尊为经典作家。我不会自称C.S.刘易斯[28]。对于那些文学类型的作家,我很佩服他们。你们知道吗?我也希望自己能足够聪明,能写出一本难读懂的书。[29]

    詹金斯对C.S.刘易斯的提及并不是随意的;根据神学家马克·沃德的说法,“基督教出版细则要求,每一本基督教书中至少有其中一章的开头要引述C.S.刘易斯的话”。詹金斯也没有吹嘘他的读者群,他提到,有一次他在沃尔玛山姆会员店遇到一位购物者,她买了一本他写的书还有一瓶威士忌,詹金斯得出结论:不管以哪种方式,那天晚上她一定睡得很好。[30]

    相比之下,在《新闻周刊》的同一篇文章中,莱希则表达了强硬的神学确定性和对国家文化精英们和宗教精英们的强烈不满:“我试图接触的数百万人都从字面上理解《圣经》。但神学家们把我们的想法搞得一团糟,他们认为我们必须找到背后的神学原因。知识分子瞧不起我们这些普通人,这让我很烦。”[31]

    莱希所说的“普通人”主要居住在美国南部和中西部,占《末世迷踪》系列读者的71%,而在东北部的占比仅为6%。[32]莱希的核心读者区域正是反堕胎、反同性恋的社会保守主义大本营,这些保守主义为美国时代论者和福音派人士注入了能量。杰瑞·法威尔和帕特·罗伯逊都来自弗吉尼亚州,哈尔·林赛来自得克萨斯州,吉米·斯瓦加特来自路易斯安那州,金·贝克来自密苏里州。

    越来越多的时代论教区居民,其中有很多是林赛、莱希和詹金斯的书迷,涌向以色列,特别是耶路撒冷,沉湎于他们的千年信仰;2017年,以色列的360万游客中,大概有1/8是福音派教徒。许多以宗教为导向的旅行者预订了时代论旅行路线,其中最精彩的是参观耶路撒冷圣殿研究院的游客中心,那里展示了为重建圣殿而建造的器皿和工具。用学者约西·梅克尔伯格的话说,大多数游客“完全无视故事中的巴勒斯坦一方。这可是涉及宗教的;有友如此,何需敌人?[33][34]

    重建第三圣殿的核心环节是出现一只没有杂色、没有瑕疵且没有负轭的红色小母牛。乳房部位长出的白毛,使梅洛迪小牛失去了作为天启之牛的资格,但它的出生启发了一位更认真的时代论者来到以色列。他名叫克莱德·洛特,是美国密西西比州的一名牧场主,1989年,他读到了《民数记》19章中的相关段落,并思考如何才能繁殖出这样一只完全合格的动物祭品。他认为,这并不难,尽管这种小母牛在欧洲和亚洲很少见,但美国的红色的安格斯牛几乎接近这一要求。

    第二年,他访问了密西西比州农业和商业国际贸易办公室,该办公室向一位国务院贸易专员发送了以下备忘录:

    克莱德·洛特打算提供一种红色的安格斯牛作为《圣经·旧约》中的祭品,它不会有任何瑕疵或浅色毛发,遗传性红色使其有红色的眼睛,黑色的鼻子,一只一岁的小母牛的体重约为700磅。这些牛将很快适应中东气候,而且牛肉质量也很好。[35]

    最终,这份备忘录传到了圣殿研究院的拉比们那里,该研究院院长哈伊姆·里奇曼高兴地注意到,有着《圣经》中著名地点——索多玛[36]之称的地方也饲养了牛。[37]在随后的几年里,洛特和里奇曼在以色列互访。1996年,梅洛迪的出生引起了轰动,这鼓励他们制订一项重大计划:他们要在1997年12月,将500只怀孕的母牛运往危险一触即发的约旦河西岸。该计划可能产生一整群真正的天启之牛,但由于陷入繁文缛节和财政困难而未能启动。洛特哀叹道:

    我内心深处认为,上帝希望我成为以色列的福音,但这很复杂。我们只是还没准备好把红母牛送到那里。如果有一位至高无上的神亲自掌管人类事务,那么这将会发生,而且这将是一个关键性的事件。[38]

    在时代论的计划中,一条细细的红线将“关键性事件”和“灾难性事件”分开。梅洛迪、索多玛和里奇曼,这些关键词概括了一种奇怪的神学戏剧,不同的参与者在同一舞台上表演,并阅读几乎完全相同的剧本。在结束之前,参与者们愉快地支持着彼此的演出,但到结束时,他们的命运完全不同。在犹太教的剧本中,弥赛亚第一次出现,并在耶路撒冷建立了永恒的犹太国家和圣殿;而基督教的剧本中增加了几个场景,上帝再临复仇,使1/3的犹太人放弃旧信仰而改信新信仰,并烧死了另外2/3的犹太人。

    不用说,这出戏涉及大量见利忘义的互相利用。以色列极端分子想获取犹大人和撒马利亚人[39]的《圣经》权利并重建圣殿,但无法获得多数选民对他们的支持,于是他们很乐于接受福音派基督教徒在财政和政治上的帮助,而这些基督教徒则相信,这出戏结束时,一定可以通过犹太人的转皈依或被焚烧而实现对他们的新犹太盟友的清洗。用记者格肖姆·戈伦伯格的话说:

    也许这本无所谓,但有些善意的人认为犹太人重建圣殿将导致世界杀戮,他们有时会插手这些极端分子的事务,因为这些极端分子的行动不是出现在神话领域,而是出现在一个真实的国家,真实的冲突是会夺走真实生命的。[40]

    13 资本主义的慈善家

    从环球电讯、安然公司到互联网泡沫

    在克莱德·洛特和哈伊姆·里奇曼沉溺于各自的基督教和犹太教末日幻想时,美国的投资者们在一场金融投机狂欢中丧失了集体智慧。

    2000年初的一个晚上,在曼哈顿市中心的《财富》杂志办公室工作了一天之后,记者杰森·茨威格乘出租车回家。当出租车驶入车流时,被四位身穿昂贵西装的年轻人拦住,其中一人砰砰地敲着司机的车窗,要求搭车前往只有几个街区远的目的地。当出租车司机告知他已经有乘客时,这位年轻人把一张100美元的钞票扔到司机的脸上,说:“把他赶出去,我们给你100美元。”

    出租车司机关上车窗,正如茨威格先生记录的那样:“我们两个像少女逃离匈人阿提拉[1]的帐篷一样快速逃离了现场。”令茨威格这位老纽约人目瞪口呆的不是那些年轻人用100美元撵他下车,而是他们步行完全可以更快地到达目的地。[2]

    像布朗特、哈德森和英萨尔一样,这些盛气凌人的年轻人也沉醉在暴富所带来的狂妄中,或许也有更世俗的心境。他们很富有,根据物质社会的逻辑,他们聪明而且重要,尽管他们的财富很可能来自狗屎运或者欺诈伎俩,或者两者兼而有之。

    这场让这四位年轻人如此陶醉的金融狂热,大致从20世纪90年代中期持续到2005年,然后在随后的两年半时间里缓慢崩溃,所带来的通货紧缩的时间长度基本上与1929年黑色星期四之后的通货紧缩相同。它带来了广泛的破坏力:总计1亿投资者共损失了5万亿美元(约占股市财富的1/3)。其中最激进的股民是数百万美国人,他们被蒙蔽,认为自己在互联网股票和共同基金中找到了年轻人的财富源泉,就像1929年的埃德加·布朗一样,他们在风暴中失去了大部分积蓄。[3]

    与之前的狂热一样,泡沫的病理生理学基础是海曼·明斯基提出的4个因素——技术替代、信贷宽松、对上一次泡沫的健忘以及放弃旧的估值方法,也适用于本次狂热。

    泡沫的原因是互联网。作为那个时代巨大的技术替代,互联网真的改变了一切。[4]1969年,美国国防部高级研究计划局把加州大学的洛杉矶分校和圣巴巴拉分校,以及犹他大学和斯坦福研究院的4个“节点”联系起来,互联网诞生。这种新的“信息高速公路”刺激了投资者。但由于它不仅速度缓慢而且操作困难,再加上第一代个人电脑的昂贵和笨重,因此在最开始的20年中,互联网对日常生活几乎没有什么影响。最初的常用网络,如美国在线和美联网,一开始甚至没有连接到更广域的互联网,即使后来连接上了,它们的功能也只是像围墙内的花园,不允许直接导航到域外网页。

    这种情况在1990年得以改变。当时,位于瑞士和法国边界、研究高能粒子的欧洲核子研究组织[5]的计算机科学家蒂姆·伯纳斯·李,发明了第一款原始浏览器,他预知性地称之为万维网。那时,他只是试图将该设施中无数台不同的计算机连接起来;但是偶然地,他连接了世界。这轰动了金融市场,也改变了我们的生活方式。[6]

    伯纳斯·李的第一款浏览器在满足普通用途时仍需要很多专业技术,但这个问题很快就被其他程序员改善。1993年,美国伊利诺伊大学的NCSA(国家超级计算应用中心)发布了马赛克浏览器,它是一种基于微软操作系统的、相对容易安装和使用的浏览器。马克·安德森领导了NCSA团队,他当时还只是伊利诺伊大学的学生;毕业后,他搬到了加利福尼亚州,并在那里与持有计算机科学博士学位的吉姆·克拉克一起合作。

    那时的克拉克已经于10年前创立了视算公司,其主要制造高性能计算机。在技术术语上,这种设备是一种“计算机工作站”,是为特定任务设计的一种设备,通常需要运行专有的操作系统和软件。20世纪80年代,工作站制造商赚了几十亿美元。但对大多数公司来说,这种盈利能力只是一个黄金陷阱,因为它们的产品很快就会被功能更强大的个人电脑取代。克拉克预见到了这种结果,但他无法说服公司管理层相信这一点,于是他沮丧地离开了视算公司,因为他不仅对自己一手创建的公司偏离方向而感到愤怒,而且不满于自己的股份仅值2000万美元,用他自己的话说:“在一个创造了巨大个人财富的行业里工作了十几年,相对于付出的创造力、领导力和辛勤工作,以及承担的风险,这一股值较少。”[7]他发誓,下次一定要有更多的控制权,得到更好的回报。

    1994年,克拉克和安德森成立了马赛克通信公司。伊利诺伊大学不满于他们使用马赛克这个名字,要求他们换个新的公司名称;于是他们改名为网景通信公司。和马赛克通信公司一样,网景通信公司的浏览器也是免费提供的,并很快传播开来。到1995年中,数以百万计的用户为电脑屏幕右上角带有字母N的地球图标而兴奋不已,这意味着他们在线且可以从全球任何地方访问网页。

    明斯基的第二个病理生理学因素——信贷宽松,为泡沫提供了原始燃料。在现代社会的部分准备金体系中,一国的中央银行——就美国而言是美联储——扮演着货币供应的看门狗角色。美联储的任务是提供充足的货币供应,进而保持经济繁荣,但美联储还有一个任务,用前任主席威廉·麦克切斯尼·马丁那句著名的话说,就是要“在聚会开始时把大酒杯拿走[8][9]

    大多数情况下,美联储委员会关心两个问题:以GDP增长和失业率衡量的整体经济状况,以及控制通货膨胀。股票价格不太受到关注,而且经常成为前两个问题的“无辜旁观者”。

    到了20世纪中期,美联储的主要工具是联邦基金利率,即成员银行之间的隔夜拆借利率,这一利率事实上成为政府证券的短期利率。当作为安全性证券的政府证券的利率比较高时,这会吸引投资者买入,进而导致资金从股票等风险资产中转移出来,并使股票的价格降低;相反,当美联储降低利率时,寻求更高回报的投资者会购买股票,从而提高股票价格。[10]

    20世纪90年代初,一场相对严重的经济衰退导致了两个事件。首先,它使乔治·布什没能连任;正如胜利者比尔·克林顿的竞选口号所言:“笨蛋,关键是经济!”其次,经济衰退引发了美联储大幅放松信贷,这助长了股市泡沫。

    在艾伦·格林斯潘担任主席期间,美联储通过买进美国国债来应对20世纪90年代初的经济衰退,这使联邦基金利率从1990年1月的8.3%降至1992年底的3%左右,并持续了整整两年。降低的利率助长了初始阶段的股市繁荣,投资者们开始谈论“格林斯潘看跌期权”,即美联储主席积极维持一种高股价状态。[11]

    按理说,美联储应该在1997年左右“把大酒杯拿走”,那时经济运转顺利,通货膨胀率下降到3%左右。似乎格林斯潘正打算这么做,但被一系列事件打断。随后发生的事情与20世纪20年代本杰明·斯特朗通过降低利率来保护英镑、不经意间引发了美国股市狂热非常相似。

    1997年和1998年,一系列全球性事件使美国的大酒杯保持满溢。货币危机和债务危机席卷了全球金融市场,从泰国货币——泰铢的崩溃开始,像多米诺骨牌一样蔓延到马来西亚、印度尼西亚和中国香港。最初,不断演变的传染并没有引起格林斯潘的警戒,因为这些亚洲经济体的规模相对较小。但到1997年底,韩国,一个驻有数万美国军队的富裕国家,也陷入金融危机,格林斯潘被迫做出反应。美联储和财政部强有力地支持美国银行以尽可能低的利率保持向韩国贷款,而且不仅对韩国,对其他亚洲国家也是如此。国外较低的利率降低了这些外币的汇率,使美元升值。早在1997年初的经济繁荣时期,美联储已经开始提高利率,但为了防止美元升值,还是维持了相对稳定的低利率;与20世纪20年代一样,持续相对较低的利率助长了当时本已存在的股市狂热。

    国际金融的多米诺骨牌继续倒下;1998年底,俄罗斯经济状况恶化,导致债务违约和卢布贬值。这直接影响到了美国,因为有一家大型知名美国对冲基金公司——长期资本管理公司[12]在俄罗斯国债上下了很大的赌注。该基金公司持有的大量债券价值蒸发,这威胁到了美国金融体系的其他部分,并重创了世界各地的股价(见图13-1)。

    图13-1 1997—2000年的联邦基金利率

    那时,格林斯潘已经获得近乎神话般的“大师”地位,市场把20世纪90年代的经济繁荣归功于他,正如鲍勃·伍德沃德后来将他的畅销书以这位主席的名字命名一样。格林斯潘认为,长期资本管理公司的倒闭可能带来灾难性的后果,威胁他的良好声誉。他组织私人银行对该公司进行救助,还通过大幅降低联邦基金利率放松信贷,并将其维持在低水平整整一年。这又把股票价格推到了最高点。[13]

    到20世纪末,泡沫的第三个病理生理学因素——金融健忘症——已经发展了几十年。1929—1932年的熊市如此猛烈地侵蚀了家庭和机构的财富、灼伤了国民的心理,以至于在此后的几十年里,股票都被看作不稳健的投资;比如,直到1945年,根据可靠的统计数据,个人投资在股票上的平均金额(主要统计富人的储蓄)仅在30美分左右,而且持有大量股票的主要是少数几家企业养老基金。

    1929—1932年股票熊市发生时,虽然只有约10%的美国人持有股票,但是随后的大萧条影响了所有人。[14]几乎所有特定年龄的美国人身上都有大萧条时期留下的阴影(就本文作者而言,即使他母亲在餐馆里用餐后剩下一点儿芦笋,也要仔细包装并拿回家)。对几百万美国人来说,1929—1932年的残酷记忆仍然历历在目,这在一代人的时间甚至更长的时间里削弱了股票的吸引力。

    不过20世纪50年代末至60年代初,确实发生了一场类似的股票泡沫。围绕几十年前物理学家威廉·肖克利领导的贝尔实验室团队发明的半导体晶体管,越来越微型化、功能越来越强大的电子设备开始爆炸式发展。到1959年,在公司名字后加上“tronics”(英文单词“电子”的后七个字母)有助于激发公众的兴趣,并使股价上涨,就像几十年后在公司名字后加上“.com”的做法一样。美国音乐协会是一家专注于留声机和黑胶唱片的制造商,它只需将名字改为“Space-Tone”,就以7倍的价格上市了。还有一些类似的公司名称,包括“Astron”“Vulcatron”,还有几个以“sonics”结尾的名称,最令人印象深刻的是“Powertron Ultrasonics”。[15]投资银行大量配股给内部人士,同时限制广大公众可购买的数量,这更激发了公众的热情。1962年,像所有以前的泡沫那样,狂热的买主都已耗尽,公众热情崩溃。[16]

    电子狂热只涉及股票市场的一小部分,而且由于那个时代持有股票的美国人相对较少,因此它在公众记忆中几乎没有留下什么持久的印象。[17]到20世纪90年代,对普通美国人来说,1929—1932年的全社会股票泡沫已经过去了两代人的时间。当泡沫再一次来临时,只有三类小群体有能力识别:拥有完整记忆的90多岁的老年投资者;经济史学家;那些阅读了《非同寻常的大众幻想》、吸取并保留了前三章教训的人。

    20世纪90年代,泡沫的第四个病理生理学因素,是放弃传统的股票估值标准。20世纪20年代末,不仅最优秀的股票产生了稳定的利润流,而且除了少数几家“高科技”公司(最著名的是美国无线电公司和雷明顿兰德公司)外,其他所有公司都提供了健康的股息。[18]相反,到20世纪90年代,只有少数几家新技术公司的收入足以承担其人员和设备的巨额支出。至于股息,科技类股票投资者认为,那是遥远的马鞭和马车时代的遗留物。微软于1986年首次向公众发行股票,但直到2003年才宣布派息;截至本书撰写之时,互联网的两大赢家亚马逊和谷歌从来没有派过息。20世纪90年代,不知何故,投资者们认为,收益和股息根本不重要;他们认为,公司股票的真正价值在于一种更模糊的衡量标准,即能否博得数百万眼球的关注,或是否有数十亿次点击量。

    正如20世纪那位伟大的投资者约翰·邓普顿所说:“英语中最昂贵的一句话是‘这次不一样’。”20世纪90年代,新兴的数字世界看起来确实不一样,许多曾经听起来最疯狂的承诺都在那时兑现了:几乎覆盖全球的宽带,无处不在、几乎免费的语音和视频电话,以及吞噬了许多传统实体店的高效的在线购物环境。

    遗憾的是,这些技术的普通投资者却并未获利。在20世纪90年代末上市的数百家公司中,只有少数幸存下来。幸存下来的,只有亚马逊一家成为主导性经济力量,但即使是亚马逊,也尚未显示出投资者对其零售业主导地位所期望的收益。[19]

    和英国铁路泡沫以及20世纪20年代的泡沫一样,20世纪90年代的科技繁荣尽管打击了金融投资者,但也给社会留下了宝贵的基础设施。如上文所述,我们根据盈利能力和社会效益构建了一个三级金字塔式结构,以理解这些泡沫公司(见图13-2)。

    图13-2 不同等级的泡沫公司

    金字塔最顶端的公司不仅造福于社会,也让投资者们更富裕了,比如东印度公司或英格兰银行,到目前为止,还有亚马逊和谷歌。金字塔第二层,或许是最重要的一层,是那些让社会受益却让投资者赔钱的公司,比如乔治·哈德森的铁路帝国和塞缪尔·英萨尔的公用事业投资公司。

    美国环球电讯公司是科技泡沫时代的这种公司的典型代表。当今全球50万英里的海底光缆,大部分铺设于1998—2002年的互联网投资热潮时期,其中的近1/3是由加里·温尼克贡献的。

    温尼克曾是一名债券销售员,是“垃圾债券之王”、被判重罪的迈克尔·米尔肯的门徒。他与商业祖先布朗特、哈德森和英萨尔有着同样的天赋:能通过股票和债券从轻信的投资者那里筹集几十亿美元。

    不幸的是,他没有哈德森和英萨尔那样的商业头脑;在1997年成立环球电讯公司之前,正如一位记者所说,他掌握的电信知识并不比“打推销电话的能力”多很多,此外他也从未经营过大型企业。[20]环球电讯公司的失败是由于他的无能和渎职,还是由于运气不好,这仍然没有定论。虽然温尼克倾向于不参与公司的日常事务,但他和其他高级管理人员确实在公司倒闭前有意识地抛售了数亿美元的股票。民事诉讼和监管行动剥夺了他的大部分非法所得,但最终检察官并没有起诉他。

    温尼克的罪责并不是我们讨论的重点。尽管环球电讯公司严重冲击了投资者的财富,但它为当今互联世界的形成做出了不小的贡献。在围绕环球电讯和其他互联网股票的市场狂热达到顶峰时,环球电讯公司的市值超过400亿美元,其中温尼克拥有60亿美元。(1999年的《福布斯》封面大肆宣扬他的“光速致富”。)[21]

    他的项目既没有欺诈也不缺乏远见,因为他对全球网络带宽重要性的评估是正确的。但是,和商业史上许多有远见的人一样,他低估了两个会导致利润降低的问题,而这两个问题会时刻存在。首先,利润会带来竞争,使供应增加,进而压低价格和随后的利润,这和死亡以及税收一样,是必然存在的。例如,温尼克在1997年完成了两条大容量、跨大西洋的光缆的铺设,但随后6年内又出现了10条竞争性电缆。其次,技术进步也增加了商品的供应,进一步压低了价格。就海底电缆而言,在随后的几十年中,“干设备”(即电缆两端的光发射机和光接收机)的改进使原来铺设的电缆的承载能力增加了7~10倍。尽管2003—2014年没有铺设新的跨大西洋电缆,但现在的全球数据流量大约比2002年大1000倍;平均而言,目前世界海底电缆容量的利用率只有不到1/4。[22]

    像泡沫时期总是会发生的那样,投资热情导致环球电讯公司的投资者为自己的行为付出了巨大的代价。2002年1月28日,该公司申请破产,随后两家亚洲公司用2.5亿美元收购了温尼克公司的控股权,这个价格相当于1便士兑1美元。虽然重组后的该公司最终仍然运营着互联网主干网的一大部分,但最初的股东们只获得了法律和解中的一些碎屑,其他什么也没有得到。

    这场巨大损失的波及范围很广:除了个人投资者,养老金和共同基金池损失了几十亿美元。小学教师琳达·洛奇在股票交易中损失了12万美元,在评论温尼克先生适时卖掉他自己的股票时,她说:“我不知道这家公司的管理层为什么能做得这么好,而小股东们却做得这么差。”[23]环球电讯公司的许多员工在他们的401(k)计划[24]中持有本公司的股票,他们比洛奇更悲惨,不仅失去了储蓄,还失去了工作。[25]

    除了环球电讯公司的高管,还有一些人通过适时出售股票而获利。1999年3月,美国前总统乔治·布什向该公司高管发表了演讲;代替8万美元的演讲费,他持有了该公司的股票,并于几个月后以大约450万美元的价格出售了这些股票,据《华尔街日报》推测,这些股票可能用于支付他在肯纳邦克波特镇[26]上公寓的维护费用。[27]

    虽然环球电讯公司严重损害了像洛奇和公司普通员工这类人的金融利益,但它通过提供超量带宽使世界受益。金字塔的最底层就不是这样了,几百家互联网公司消失得无影无踪,不仅践踏了投资者,也没有留下任何社会价值或经济价值。在这些公司徒劳地追求关注度的过程中,可能最精彩的故事就是韦伯万事件了,它是一种1995年之前所无法想象到的大惨败。

    路易斯·博德斯是一个有着古怪想法的20多岁的技术人员。他先是创立了一家同名连锁书店。1997年,从书店领域退出5年后,他成立了一家投资公司。当时,他从网上订购的稀有香料邮包到达他的家门口(当时网购还是很新奇的事物),他脑中闪过一个想法:能不能说服美国人通过这样的方式购买食品?

    博德斯的理想很大。为了向几百万消费者提供生鲜商品,他需要建立一个新颖而庞大的物流系统。他在奥克兰建立了第一个配送设施,其面积是一个标准超市的20倍,铺设了4.5英里长的传送带,可以运送各种各样的生鲜食品,包括700多种肉类和鱼类。[28]然后他聘请了全国最大的建筑公司柏克德工程,以超过10亿美元的总成本,计划打造一个由26个类似建筑群组成的全国性网络,这对一家在上一年还不存在的公司来说,是一个了不起的成就。

    博德斯曾在麻省理工学院学习数学,他预计,每个配送设施每天能完成825份订单,每年收入将达到10亿美元的1/3;人工“挑拣者”们将被策略性地安置在一组装有食品的旋转传送带中间,他们将把顾客购买的东西放在一起,然后通过几英里长的传送带将食品送到空转的冷藏卡车上,这些食品可以在订购后一小时内送到家。由于规模大,预计韦伯万公司只需要将收入的不到1%用于实体仓库,而即将过时的传统超市的这一比例则为6%。博德斯计划在征服零售食品行业之后,转向视频、消费电子产品和干洗行业。[29]

    韦伯万公司吸引了高盛、甲骨文、惠普、奈特·里德等一系列公司的金融支持,同时也引发了一场公众投资狂热。为了继续煽动这场狂热,其在首次股票发行时,只出售了公司的一小部分股票;如果出售的是全部股票的话,那么总市场估值将达到84亿美元,是西夫韦[30]公司的一半,这对最终建成时将以26个超大型超市为中心的运营来说并不差。[31]

    两个问题注定了这是一次冒险。第一,韦伯万并不是第一个互联网食品销售商;它有几个竞争对手,其中包括规模更大、更成熟的家用杂货公司HOMG,HOMG背后的支持者包括亚马逊的杰夫·贝佐斯。第二,系统不好用;这项未经测试的技术被证明不听使唤,而且即使系统运行顺利,消费者也不相信该公司能为他们挑拣出易腐产品并做到按时交付。韦伯万和HOMG都公布了多月的亏损。[32]

    HOMG管理得更好,但韦伯万激发了更多的热情,因此也吸引了更多的资金,这意味着HOMG首先出现资金枯竭。实力较差但资金较多的韦伯万并购了HOMG,但这更加速了新合并的公司的现金消耗;2001年7月,该公司宣布破产,几十亿财富蒸发,3500名员工失业。[33]

    20世纪90年代的三级泡沫金字塔,坐落在渎职和欺诈的泥潭中,就像安然公司那样。作为美国历史上欺诈金额最大的企业之一,安然导致的投资者损失高达700多亿美元。这一事件充分体现出那个时代一夜暴富的氛围。与讨人喜欢、乐善好施又有远见的温尼克不同,安然的管理层有意识地实施了大量制造金融泡沫的犯罪行为,其主角们扮演了典型的恶棍角色,如道貌岸然、有社会野心的肯尼斯·莱,运动机能亢奋的杰弗里·斯基林,还有阴暗、犯盗窃罪的安德鲁·法斯托。

    与环球电讯和互联网公司不同,安然最初从事的是经济中最不起眼的商品之一——天然气的经营[34]。20世纪中期之前,天然气经常被当作废物烧掉。相比之下,该公司的负责人则很耀眼,用记者彼得·埃尔金德和贝萨尼·麦克莱恩精辟而又令人难忘的话来说,他们是“房间里最聪明的人”[35]

    1942年,肯尼斯·莱出生于阿肯色州极度贫困的农村地区,他在11岁之前都没有住过有卫生间的房子。然而,从11岁起,他的好运来了,他跟随父亲搬到密苏里州哥伦比亚市,在那里,家里的3个孩子都以很低的学费进入公立密苏里大学。莱在那里遇到了经济学家平克尼·沃克,后者给他带来了巨大的好运。

    毕业后,莱开始在埃克森公司的前身——亨伯尔石油公司工作,并通过在夜校学习获得了经济学博士学位。接着,他加入海军服兵役,服兵役期间的1969年,沃克帮他在五角大楼获得了一份武器采购工作。此后不久,尼克松总统任命沃克为联邦能源委员会成员,莱作为沃克的助手一同前往。这位年轻的助手给尼克松留下了如此深刻的印象,尼克松任命他担任内政部主管能源事务的副秘书长。

    公用事业贯穿公共通行权。自19世纪末其诞生以来,各州和联邦政府就对该领域进行严格监管。但到了20世纪70年代初,管制开始放松了。依靠在华盛顿的人脉,莱在得克萨斯州和佛罗里达州的能源公司找到了自己的定位,最终,1984年,作为休斯敦天然气公司的CEO,他策划了与内布拉斯加州奥马哈市的著名管道公司北方内陆公司的合并。莱聘请的咨询公司给合并后的公司命名为恩朗(Enteron);令人尴尬的是,《华尔街日报》指出,这个新名字是“胃肠道”的同义词。于是这个名字被缩短为安然(Enron)。[36]

    莱从管制放松中看到了巨大的利润。可悲的是,他身上的某些特征将会使“安然”这个名字变成公司渎职行为的同义词:他热爱奢华和威望,这一弱点使他无法控制他雇用的那些才华横溢而又傲慢自大的年轻人;他具有一种道德上的盲目性,将自己的私利等同于公司和整个社会的利益。由于需要花费更多的时间与华盛顿特区和曼哈顿的高层们交往,他在公司总部休斯敦的时间越来越少,于是他逐渐退出了公司的日常运营。尽管莱获得了丰厚的薪酬(2001年超过1亿美元,包括股票期权和“贷款”),但他的社会和物质野心推动他陷入债务深渊,到安然破产时他的债务超过1亿美元。[37]

    我们从安然公司的喷气式飞机上可以窥见公司的行为。购买公务机本身并不意味着公司管理不善,更不意味着渎职或过度使用。[38]但安然公司中有六辆车被莱的妻子和孩子视为他们的私有财产,即“家庭出租车”,这支车队在公司内部广为人知。在超级富豪中,飞机的大小、航程和速度代表着飞机所有者的权势等级;在20世纪和21世纪之交,私人航空领域的典范是配有三个引擎的猎鹰900。安然公司有两架猎鹰900,莱的家庭优先使用。例如,1999年的某一次,莱的女儿罗宾打算从法国返回时,公司派了一架猎鹰900专门过去接她。2001年,公司即将崩溃,莱热情地拉住即将成为CEO的杰弗里·斯基林,询问他对另一架新订购飞机的内饰的意见。[39]

    莱的家庭车队影响了其他高管的消费行为。高管中的许多人拥有豪华车队、多套豪华度假住宅和位于曼哈顿的公寓。公司也有一个过度消费文化的例外:冷静而能干的高管理查德·金德,其地位仅次于公司CEO。但莱迫使他以个人原因为由辞职。随着1996年金德离开安然,阻止公司崩溃的最后一道防线也随之而去。(金德随后帮助成立了另一家能源公司金德-摩根。该公司没有私人飞机,当金德需要私人飞机时,作为一个亿万富翁,他就自己掏钱租一架。)[40]

    莱的公司愿景远远超出了国内的管道领域;他希望通过雄心勃勃的海外基础设施项目和进军诱人的能源期货交易新领域,扩大公司的业务空间和范围,一旦成功,他就要从头开始创建一个互联网带宽的期货市场。一旦公司征服了这些行业,他就将继续进军钢铁和造纸等大规模工业,以及货物运输等服务业领域。[41]为了实现这一愿景,公司需要借入大量资金,而这又需要证明其早期盈利的能力;由于公司的新项目实际上都遭受了巨大的损失,因此只要制造表面上的利润就足够了。

    接下来杰弗里·斯基林出场了。他在新泽西州和芝加哥郊区长大,在20世纪70年代初就读于南卫理公会大学,学习电气工程。他很快发现,金钱能使他感到兴奋,而电路却不能。在某节课上,他偶然发现了一篇博士学位论文,该论文描述了如何将期货合约“证券化”并使其成为可以销售的金融产品,这种方式类似于后来的次贷危机中抵押贷款被打包出售给轻信的投资者。斯基林发现了一种从数学抽象中赚钱的方法,而他非常擅长数学抽象。此后不久,他进入哈佛商学院,并于1979年以优异的成绩毕业。

    作为哈佛商学院的顶尖毕业生,斯基林顺利进入了麦肯锡公司。在最近的丑闻之前,麦肯锡公司是全球最负盛名的咨询公司,在那里,冷静的抽象推理比其他所有技能都更受重视。不到10年的时间,斯基林就升职为休斯敦办事处的负责人,经常为安然公司提供咨询服务。1990年,安然公司将他从麦肯锡挖了过来。

    和其他大多数公司一样,安然在天然气销售收入入账时才将其计入财务报表。对斯基林这样的高级咨询行业从业者来说,这种似乎过时的、仅仅从销售一种商品中获利的观念是有问题的。例如,他设想,管道公司与其客户之间的长期合同,可以像其他证券一样在金融市场上买卖。更为关键的是,在收入入账时才计入财务报表,这不符合斯基林的智慧。如果客户签订了未来十年购买天然气的合同,他就认为可以将收入提前计入。

    这种被称为“按市值计价”的会计技术,正处于合法性的边缘,因此在使用之前,他请求美国证券交易委员会许可。令人难以置信的是,1992年,委员会竟然给出了许可。斯基林获得了一种最接近印钞许可证的东西:签署长期合同,一次登记所有收入,从而立即报告可观的收入,根据这些虚假的收入,再去借入资金建设天然气输气管道,凭此管道,就可以签订更多的合同,然后立即计入更多的未来收益,并为进一步扩张借入更多的资金。[42]这就好比洛克希德·马丁公司计划在未来10年内以超过1万亿美元的价格向美国武装部队出售2500架F-35战斗机,签署协议后立即登记收入,根据这些预计收入借入资金生产汽车,然后登记汽车未来销售的预计收入,再建立一个全国范围内的连锁医院。

    安然公司已经借入了大量资金拓展公司业务,其经营范围远远超出了普通的天然气输送。在接下来的10年中,其投资项目还包括:在孟买南部的达博尔建造了一座大型燃气发电厂;成立了阿祖里克斯,即一家遍布全球的水务公司,远至罗马尼亚、秘鲁和摩洛哥;建立了天然气交易平台和电力交易平台,其中最诱人的,是为科技投资者建立互联网容量交易平台(最后一个平台意味着,其与温尼克的环球电讯公司有业务联系)。

    和温尼克一样,安然的员工擅长会计骗术,迷惑了那些粗心的股票分析师和小投资者。也和温尼克一样,安然的员工中很少有人懂得如何经营实体企业。安然的每一个项目几乎都损失了大量资金,其中最引人注目的是达博尔发电厂,其发电成本如此之高,以至于当地供电局拒绝使用,随后该发电厂被搁置了5年。安然水务公司的国际业务拓展,由一位名叫丽贝卡·马克的极具魅力的高管负责,但她对于水务事业几乎没有任何经验,该公司最终以更快的速度走向崩溃。最令人难以置信的是,安然公司签订了向全世界2.8万个地点供应电力的合同,这被休斯敦总部的理智者嘲笑为“见鬼的业务”,由于其在电力方面缺乏经验,因此必须雇用技术和管理专家来完成这项工作。尽管斯基林设想了一个高科技的全球宽带交易平台,但据说他对此一窍不通,甚至必须依赖于秘书为他打印电子邮件并为他打开电脑终端。[43]

    斯基林没有向股东坦白公司的损失和债务负担,而是命令28岁的新员工安德鲁·法斯托隐瞒这些损失和债务。为了借入资金,公司不仅需要证明有能力盈利,还需要证明没有背负已经存在的债务。斯基林此前已经通过“按市值计价”的会计技术“解决”了盈利问题;法斯托将通过隐藏公司的大量已存在债务来解决借款难题。

    法斯托的前雇主是大陆银行,他在那里学到了贷款证券化方面的专业知识。证券化涉及贷款和其他债务的组合,这些组合可以出售给买家和交易员。这些高度复杂和模糊的安排,即所谓的SPE(特殊目的实体[44]),承担了安然迅速增加的债务,因此这些债务在理论上已经从安然的账目中消失了;分析师、机构投资者、小投资者,甚至安然自己的董事会,在公司资产负债表上已经看不到债务,这一骗局让人觉得该公司似乎没有负债累累。

    法斯托建立了3500多个这样的SPE公司,名字诸如马林、皮鞭、勇敢的心、猛禽、绝地武士、楚巴卡(以星球大战中长着毛发的角色楚巴卡命名)以及LJM1、LJM2和LJM3(LJM分别是法斯托的妻子以及两个孩子名字的首字母)。还有许多SPE公司专门将资金从股东、贷款人,甚至公司内的较低级别员工那里,转移到法斯托和其他高管的个人账户。[45]

    斯基林和法斯托的会计骗局,将安然的债务垃圾一脚踢开。这些垃圾形成了一个巨大的垃圾堆,最终无法再隐藏。值得注意的是,为什么股东和分析师花了这么长时间才意识到这件本来应该很快就显现的事情?

    最终第一个意识到并采取措施的人是詹姆斯·查诺斯,他运营着一个对冲基金,专门从事所谓的“卖空”交易。在正常情况下,股票购买者希望他们可以低价买入,然后高价卖出,从而获利。与直觉相反,“卖空”交易者可以做相反的事情:先以高价卖出,然后以较低的价格回购股票以获利。为了做到这一点,其必须首先向其他人借股票;股票出借者收取一定的费用,而借入者独自享有卖空操作的回报以及风险。[46]

    查诺斯并不是第一个意识到安然财务报告有问题的分析师;但他的优势在于更好地处理了社会公认的安然叙事与相反的财务数据之间的认知失调,并采取了行动,即做空安然的股票。[47]安然所取得的贷款取决于其信用评级,这又取决于法斯托能否利用各个SPE公司隐藏安然的债务。这些贷款还取决于安然的股票价值,因为股票是贷款的抵押品;当欺诈的消息最终传出时,公司股价下跌,银行收回贷款,纸牌屋倒塌。2001年10月16日,安然终于坦白了自己的损失;而在6周后公司宣布破产之前,肯尼斯·莱一直对公司的前景保持乐观。当他和助手们根据《美国破产法》第十一章的规定,前往纽约提交申请破产保护的文件时,他们乘坐公司的喷气式飞机飞过去,并入住了奢华的四季酒店。[48]

    和查理·米切尔的纽约城市银行的倒闭一样,安然的倒闭打击了内部普通员工,这些员工被鼓励用401(k)计划账户里的资金购买公司的股票;例如,2005年,2万名前安然员工获得了8500万美元的集体诉讼赔偿金,这相当于1美元的实际损失只能收回几分钱。(这笔钱是保险公司和银行出的,而不是从倒闭的安然公司那里收回的。)[49]

    雪上加霜的是,在股价跌幅最大时,员工们在一个月内都无法出售用退休账户购买的股票,名义上是因为账户在不断发生变化。但另一边,安然的高层在股价崩溃前集体抛售了股票,例如,斯基林卖出了高达7100万美元的安然股票。当另一家公用事业公司德能提出并购安然时,安然的高管们要求它承担总额超过1亿美元的奖金和支出,其中大部分是要支付给莱的,于是德能拒绝了并购。[50]

    与布朗特、哈德森和米切尔不同,这一次,正义得到了伸张:包括斯基林和法斯托在内的多名高管都被判入狱(他俩的刑期分别为11年和6年),而莱在宣判前死于心脏病发作。

    安然事件和那个时代的其他类似丑闻,如丹尼斯·科兹洛夫斯基的泰科国际公司和伯纳德·埃伯斯的世界通信公司的丑闻事件,都处于会计操纵监管调整的转折时期。

    1993年,为了控制过高的高管薪酬,美国国税局将CEO薪酬的公司税扣减额限制在100万美元[51];这推动了CEO的报酬形式转向股票期权,随着股价的上涨,股票期权将更有价值。这项政策的出发点是好的,从理论上讲,期权支付使CEO和股东的利益一致;但这是“意外后果定律”[52]的一个经典案例,期权支付也让CEO为使公司显示出持续而可靠的收益增长而伪造季度收益数字。

    在其他情况相同并给定平均收益水平的条件下,将两个季度的收益进行微小调整,就会使股票更有价值。由于现实中的公司收益波动很大,这种对收益报告进行的别有用心的“管理”,对很多CEO来说太有吸引力了。

    这种做法合法但不正派。通用电气就是一个典型,作为一个正常运营而又经营广泛的企业帝国,会不可避免地产生一些损失,通过将损失从一个季度重新安排到另一个季度,就可以产生平稳、可靠的收益增长流。[53]这种伎俩的发明者是杰克·韦尔奇,他没有做什么不同寻常的事情,更不用说欺诈了;相反,金融界和大众媒体都赞颂他,认为他是第二个托马斯·爱迪生。

    尽管如此,但有一点无论怎么强调都不为过,即19世纪的铁路、20世纪初的无线电和汽车等革命技术所产生的股票泡沫,为推动经济发展和提高社会福祉提供了自由流动的资本。

    20世纪90年代的互联网泡沫也是如此。尽管金字塔底部留下的是没什么价值的公司,如韦伯万,以及欺诈性公司,如安然,但将这些都考虑进去,当今不可估量的在线知识、娱乐、购物和网银交易,依然受益于这场泡沫中对技术进行的投资——其中大部分来自遭受损失的投资者。因此,泡沫投资者为了更大的公共利益而无意识地、悲惨地牺牲了自己的财富,把他们称为资本主义不知情的慈善家,这也不算太牵强。

    到了20世纪末,大型投资银行——为新公司和已存在的公司制造股票和债券的机构——已经成为泡沫的主要发起者。早在美国内战期间,金融家杰伊·古尔德就通过出售政府债券为联邦军队融资,成为行业的开创者。1929年大崩盘后,佩科拉委员会揭发了查理·米切尔的纽约城市银行肮脏的投资银行业务,并制定了1933年的《格拉斯-斯蒂格尔法案》,禁止商业银行发行股票和债券,禁止投资银行从事普通公民的存贷款业务,由此将商业银行和投资银行的业务分离。

    随后的几十年里,投资银行的游说逐渐削弱了《格拉斯-斯蒂格尔法案》的执行力。在菲尔·格拉姆(自由市场空想家)等共和党议员的推动下,在实行“三角策略”[54]的民主党总统比尔·克林顿的默许下,该法案最终在1999年泡沫最严重时被废除。

    在这场科技泡沫中,投资银行加快了对新公司股票发行的速度;而通过网景浏览器,公众第一次欣喜若狂地连接到互联网(虽然比今天的宽带连接速度慢一万倍),不需要被劝说就会主动购买这些股票。当网景创始人马克·安德森和吉姆·克拉克意识到巨人微软也在开发浏览器时,他们迅速采取行动,通过IPO融资。

    20世纪20年代,摩根公司一直没有涉事其中,之后的《格拉斯-斯蒂格尔法案》迫使摩根公司将其投资部门剥离出来,使其成为一家投资银行,即摩根士丹利。到20世纪90年代,摩根士丹利成为美国最大的新股发行商,它发行了网络泡沫中最引人注目的网景的IPO。

    到这时,摩根士丹利已经发生了变化;该公司的一位高管弗兰克·夸特罗内,来自意大利移民家庭,说话仍然带有浓重的口音,在此之前已经为互联网核心硬件的主要生产商思科公司进行了公开募股。随着网景公司在1995年8月9日首次募股,夸特罗内也使自己成为阳光查理(与查理·米切尔一样,夸特罗内在一系列审判中险些入狱,其中有一次因妨碍司法和阻拦证人被定罪,但在后来的上诉中,罪名被推翻)。

    困扰着夸特罗内、克拉克、安德森和刚刚被聘为网景公司CEO的吉姆·巴克斯代尔的一个主要问题:投资者应该为公司的股票支付多少?合理定价IPO是一门艺术。在理想情况下,为了保持热情,一只股票在交易首日应该经历发行价格的大幅“弹”起;如果发行价格过高,股价可能就会在首个交易日下跌,从而打击散户投资者的信心;如果发行价格设置得太低,公司及其创始人就会受损。最后他们4个人决定,每股为28美元(在此价格上,公司估值将约为10亿美元)。当天早上市场开盘时,他们都屏住了呼吸。

    对该股票的需求如此之大,导致当纽约证券交易所上午9:30的开盘钟声响起后,摩根士丹利的交易员无法得出合理的价格;某家经纪公司很快增加了一个新的电话提示音:“如果您的电话内容是关于网景公司的,那么请按1。”太平洋时间上午9点(按东部时间的话,证券交易此时已经开始两个半小时),不知所措的克拉克没有意识到这种疯狂,他看了看他的显示器,发现股价持平在28美元。他打电话给摩根士丹利的一位经纪人,经纪人告诉他存在“交易失衡”。克拉克不能完全理解这意味着什么,他想知道IPO是否失败了。

    “交易失衡”根本无法描述出摩根士丹利的纽约IPO服务桌上震耳欲聋的情景。其中心大约有200个工作站,每个工作站上都有一个交易员,每个交易员都拼命地努力接起几个同时响着的分机,而每个分机的通话内容都是关于如何购买网景股票。

    克拉克打电话后不久,经纪人回电告知他,该股票开盘价为71美元,这意味着他的净资产猛然突破了5亿美元,而公司筹集到的资金则更多,正如《克拉克回忆录》中某一章的标题——《10亿美元是最好的报复》。[55]

    “感恩而死”乐队的杰里·加西亚在当天晚些时候死于严重的心脏病发作。他的最后一句话据说是,“网景是什么时候开盘的?”[56]

    14 数字时代暴富梦的推手

    投资分析师、大众、媒体与政治家

    不是每天早上起床时,我们都认为生意不好。 ——罗杰·艾尔斯[1]

    许多人忽略了泡沫的明显迹象,特别是忽略了安然的财务垃圾堆,主要是因为受到“投资银行家”的影响。过去几十年里,这一职位已成为“赚了一大笔钱的人”的代名词。投资银行发行IPO时,它的佣金是进款的5%~7%。网景IPO的佣金是1.3亿美元,韦伯万IPO的佣金是3.75亿美元;之后其他公司的IPO又为投资银行赚了几十亿美元。投资银行的雇员从这块馅饼上分了一大部分。1998年,弗兰克·夸特罗内从摩根士丹利转到瑞士信贷银行,第二年,他分到的个人份额上涨至约1亿美元。[2]

    20世纪90年代之前,股票分析师在投资公司内部属于默默无闻、辛苦劳作的人,所获报酬一般。而互联网时代的一个很奇怪的特征是,曾经地位低下的股票分析师上升为名流阶层,互联网泡沫将其中一些人推向了超级明星运动员和电影演员那样的知名度,因为,热切的公众关注着他们关于这个或那个网络公司前景的每一个公告。其中最著名的两位,是摩根士丹利的玛丽·米克尔和美林证券公司的亨利·布罗吉特。问题在于,这些“分析”股票和债券的家伙,是由发行股票和债券的公司雇用的。

    金融业是美国经济中的一股强大的力量,占全国GDP和股票市值的近1/5。由于投资银行的业务是这一比重的最大来源,因此,正如美林证券公司的安然股票分析师约翰·奥尔森理解的那样,那些没有给出一系列“买入”建议的分析师,可能会承受压力。

    安然的高管们紧盯着公司股价,尤其是法斯托本人,因为他的项目依赖于公司股价。安然的主要投资银行的兴趣则在于债券发行,而债券发行又推动了安然疯狂的全球扩张。这些发行为投资银行带来了巨额收入,安然不断用此事实提醒其投资银行。一位分析师说,该公司曾向他表示:“我们每年的投资银行业务超过1亿美元。如果你(推荐客户)买了很多,那么你也会得到一些收入。”[3]

    但奥尔森没有遵循那个剧本。与詹姆斯·查诺斯不同(查诺斯在卖空安然股票的事件中被怀疑有欺诈行为),奥尔森并没有过分否定安然,他只是报告说,自己不了解安然的会计核算,并在一次媒体采访中指出:“他们对于如何赚钱不太坦率……我没听说过有哪位称职的分析师能认真分析一下安然。”[4]安然的董事长莱鄙视奥尔森,并给奥尔森的上级唐纳德·桑德斯写了一张便条:“唐,约翰·奥尔森对安然的看法10年来一直是错误的,现在仍然是错误的,但他始终坚持己见。”(桑德斯向奥尔森出示这张便条时,奥尔森注意到,莱可能已经老了,不中用了,但他至少知道如何拼写“坚持己见”这个单词。)[5]最终,两位美林的投资银行家向公司总裁赫伯特·艾利森抱怨,后者向莱道歉。美林开除了奥尔森,并继续跟随安然赚大钱。[6]

    20世纪90年代,几千名演员在几百个舞台上上演了不同版本的美林/安然/奥尔森大戏,尽管每个剧本都不一样,但情节始终如一,股票分析师放弃了自己的职责,成为投行同僚的啦啦队长。1997年,一位研究人员仅用一年时间就汇编了15000多份股票报告;只有不足0.5%的报告建议卖出股票。[7]

    除了发起者,投资大众处于金融狂热的第二个解剖学位置。在互联网泡沫爆发前的几年里,越来越多的美国人成为自己的投资经理,一方面,收入和财富的增加推动了这一现象,但另一方面,他们不得不这样做。

    1929年金融危机后的几十年里,美国的经济和社会结构发生了深刻的变化,其中最主要的是预期寿命逐渐延长,随之而来的是退休时期的延长。1889年,当奥托·冯·俾斯麦在德国建立养老金制度时,欧洲成年人的平均预期寿命只有45岁,比70岁的合格年龄少几十年,而且那时,家庭成员通常都会照顾他们的年老成员。到20世纪末,美国人的预计退休时期已经长达30多年,而且随着日益增加的人员地域流动,家庭护理往往很难实现。这些因素都增加了个人为其日益昂贵的退休时期准备资金的压力。

    有一些最幸运的美国人,他们工作的大公司里提供“养老金固定收益计划”,该计划向雇员提供养老金,直到雇员或他们的配偶去世(假设公司没有在他们有资格领取养老金之前解雇他们,这种做法非常普遍)。汽车制造商斯蒂庞克公司就是这么仁慈的雇主,但1963年,当它关闭了在美国的最后一家工厂时,这引发了国会的一系列调查,最终促使1974年的《雇员退休收入保障法案》产生,该法案至今仍在管理养老金的运营。该法案中有一个较为晦涩的部分,其提出建立个人退休账户,这是第一次允许雇员可以以不缴纳所得税的方式积累储蓄,直至退休时取出;1981年,政府放宽了对个人退休账户使用的最初限制,使其对雇主更具吸引力,并可适应于更多的雇员。

    大约在同一时间,一位名叫特德·本纳的养老金福利顾问,对自己的工作越来越不满意,因为他的雇主总会让他回答以下问题:“我怎样才能在法律上获得最大的税收减免?怎样才能给我的员工最少的工资?”[8]这让虔诚而慷慨的本纳很苦恼,他想寻求一种方法,让公司对员工更加慷慨。

    本纳注意到,1978年的《国内税收法》新增了一条模糊的分项——401(k)条款,允许雇主将工人的工资直接递延到退休储蓄中。本纳认为,如果雇主能够提供与工人贡献相匹配的缴费,那么这可以促使更多的工人建立401(k)个人账户。本纳在国税局有关系,国税局批准了这项计划。401(k)个人账户如雨后春笋般涌现;如今,401(k)资产已有数万亿美元,与个人退休账户资产大致相当。[9]

    这些个人账户允许公司放弃传统的固定收益计划[10];随着地域流动增加所带来的代际联系的减少,工人和小商人突然成为自己的养老金经理。但这项工作需要一定的数字量化技巧、历史常识和情绪自律,连金融专业人士都很少能具备,更不用说普通人了。

    很显然,普通投资者无法胜任这项投资工作,这一点可以从共同基金的经营数据上看出。目前最常见的退休账户投资工具是共同基金,其基本上是固定缴款计划[如公司401(k)计划]中唯一可用的选择。如果投资者能胜任,那么他们在这些投资工具上的“内部收益率”(IRR,即所有基金份额的买卖)应该与基金自身的回报率完全相等。但是,研究人员发现,平均而言,员工购买和销售基金的时间安排非常糟糕,以至于他们的内部收益率几乎总是低于基金自身的回报率。[11]换句话说,小投资者往往高买低卖,没能获得某只基金的全部利润。

    互联网泡沫的第三大解剖学视角——媒体,其典型是CNBC(美国全国广播公司财经频道),CNBC在电视商业和投资信息领域的前身是FNN(财经新闻网)。FNN从1981年开始运营,当时正值漫长而残酷的熊市尾声,是一个错误的时间,是公众投资兴趣的低谷;10年后,FNN破产。1989年,急于提高萎靡收视率的NBC(美国全国广播公司)感受到公众对投资的新兴趣,成立了财经频道。

    这一时机再好不过了,因为市场开始转好,数千万人开始关注股市,既是出于需要,也是出于兴趣。最初,该频道的节目令人昏昏欲睡:主播们在牌桌后面对着摄像机,播放一些如何准备晚餐和如何处理孩子们发脾气的节目。[12]1991年,NBC接管了破产的FNN及其大部分人才,命运略有改善,并将频道名称用首字母缩写表示为CNBC。

    1993年,罗杰·艾尔斯接管了CNBC,媒体之神更加眷顾新生的CNBC,而艾尔斯对电视原生情感力量的传奇掌握和利用也达到了顶峰。艾尔斯出生时患有血友病,还有一个喜欢体罚他的父亲——这是一个特别不幸的组合——频繁受伤使他不得不长时间地被监禁在家,他真正的教室是20世纪50年代的电视机,他花了很多时间分析电视节目。不出所料,他在大学里主修媒体研究,毕业后在当地东海岸电视台从事制作工作。[13]随后,他在《迈克·道格拉斯秀》这一在全国播出的节目里担任道具助理;不到3年,他就成为制作人。晋升后不久,1968年,他在节目演播室里遇到了正值第二次总统竞选的理查德·尼克松,尼克松表达了对“一个人必须使用噱头(比如电视)才能当选”的反感,艾尔斯回应说,“电视不是噱头”。那次会面后不久,尼克松的助手伦纳德·加门特雇用了艾尔斯。[14]由此,艾尔斯开启了他20多年的共和党总统媒体顾问生涯。他使1968的尼克松更受欢迎,并在1988年帮助乔治·布什击败了迈克尔·杜卡基斯。

    成为CNBC的总裁后,艾尔斯保留了原FNN的节目格式做法,特别是屏幕底部实时滚动的股票行情信息,这将成为金融泡沫肥皂剧的隐喻背景。除此之外,他从各个方面彻底改造了CNBC的外观和体验感,后来又将同样的技术应用到为国家政客和商业巨头提供的新服务上。他不再简单地用主题音乐宣告新的节目片段,而是通过增加带有主持人小头像的话外音。关于食谱和孩子们发脾气的节目都没有了;取而代之的是杰拉尔多·瑞弗拉[15]和迷人的政治评论员玛丽·马塔林。艾尔斯亲自指导摄像师恰当地塑造企业高管的形象,并让其看起来更具活力,敦促编剧们想出更吸引观众的“不切换频道”模式,并派主持人在证券交易大厅快速报道价格走势。演播室的嘉宾越美艳越好。正如《纽约客》的约翰·卡西迪所说:

    他们理想的演播室嘉宾曾是一位选美比赛冠军,她报道科技股,用简短的陈述句讲述,并与唐纳德·特朗普约会。由于能找到的这种女性的数量不多,制片人通常只能安排那些尊敬艾伦·格林斯潘并尽力说英语的秃顶中年男性。[16]

    艾尔斯教导他的主播和制作人员:要将金融视为一项群众爱看的体育运动。在股票市场经历了一周的异常残酷之后,他用一段广告剪辑将CNBC与竞争对手相比较:“道琼斯指数在大量交易中暴跌。但请先看今天的天气。CNN告诉你,你的衬衫是否会被淋湿;CNBC告诉你,你是否还能买到一件衬衫。”他还将从CNN挖过来的玛丽亚·巴蒂罗姆提升为主播,她同时满足了他对性和金融的需求;凭借酷似索菲亚·罗兰的长相、浓重的布鲁克林口音和露骨的性感,她很快成为大家熟知的“金钱宝贝”。[17]

    1996年,由于艾尔斯对其他员工的欺凌行为,CNBC迫使他离开,这一事件也将困扰他后来的职业生涯。但那时他对CNBC的改造已经证明是有利可图的。到20世纪90年代中期,CNBC已经在欧洲和亚洲开设了电视网,世界资本市场中真实或虚构的大戏从未落幕。

    艾尔斯凭直觉认为,他的观众更喜欢像棉花糖一样的娱乐性新闻,而不是像菠菜一样的信息和分析性新闻;而最棒的是味道像糖果又能带来无限财富的新闻。在艾尔斯的领导下,CNBC掌握了这种体裁,将乏味的主流金融世界转变为极其成功的娱乐世界,掌握了现代文化炼金术的技艺。互联网成为新的聚集场所,利用互联网,小投资者可以通过电子交易和达泰科等在线经纪公司,根据刚刚在CNBC看到的内容,即时买进或卖出。这种方式受到短线投机者的青睐。

    调查性报道被抛弃;它不仅会耗费大量资金,还会得罪极其重要的投资银行,而投资银行是广告份额的最大购买者。最好是在电视节目时段插入那些热情谈论自己公司的企业高管,以及那些谈论股票走向的权威性“市场策略分析师”的采访。最重要的是,这些高管和分析师都是免费出场的,他们乘坐租用的汽车,穿过哈得孙河,到达新泽西州利堡镇的CNBC工作室。

    在节目中,这些公司高管和大多数分析师的谈论内容都体现出一致的乐观,因此,CNBC的节目缺乏批判性审查。2000年和2001年,CNBC主持人马克·海恩斯分别采访了肯尼斯·莱和杰弗里·斯基林。海恩斯毕业于宾夕法尼亚大学法学院,自称是一个敏锐的审问者,但面对历史上最严重的安然欺诈案的肇事者,他只问了一大堆与赞扬和吹嘘有关的问题。[18]

    当IBM(国际商业机器公司)、Sears(西尔斯)和AT&T(美国电话电报公司)等大公司解雇数万名员工时,CNBC为这些公司上浮的利润欢呼,而忽略了大规模解雇的人力成本。当公司犯下明显重罪时,只要由此产生的丑闻没有出现在报纸头版,CNBC就装作没看见。例如,2012年5月,CNBC对摩根大通向股东隐瞒20亿美元交易损失的报道视而不见。[19]

    CNBC对观众的利益也没产生多大好处。两项代表性学术研究密切关注了按照节目嘉宾名单和推荐目录买入股票的结果;它们的结论并不令人鼓舞。第一项研究是关于股票价格对公司CEO出现在CNBC节目上的反应,第二项研究是关于CNBC目前最受欢迎的节目之一《我为钱狂》的选股表现,其节目主持人是狂热而有活力的詹姆斯·克拉默。如图14-1所示,两项研究的结果几乎相同:相对于整个股票市场,被推荐的股票在节目当天或次日的价格上涨达到峰值,然后下跌。尽管之后的价格下跌令人担忧,但之前的上涨意味着,事先知道节目日程安排的参与者与CNBC的观众就像在玩跷跷板。克拉默虽然外表滑稽,但他并不傻,他很了解这种动态。至少有一次,他卖掉了一家在《巴蒂罗姆秀》中被大肆吹捧的公司的股票,几天后又在价格回落时买回。[20]

    图14-1 CNBC与股票价格

    更能说明问题的是那些选择不来凑热闹的CEO。杰夫·贝佐斯是这一时期最成功的IPO公司亚马逊的董事长兼创始人,他喜欢与见多识广的记者们往来,甚至经常接受小型出版物的采访。不过,他认为在CNBC上露面没什么意义,因为他知道CNBC只关注短期的公司股价,他觉得这毫无价值。他认为,只要能照顾好消费者,无论股价如何波动,公司从长远来看都会兴旺繁荣。[21]

    互联网泡沫的第四大解剖学视角,是政治领导人。在密西西比公司、南海公司和英国铁路泡沫事件期间,包括法国和英国君主在内的最高级别领导人都置身其中。从19世纪末开始,由于公众监督和反腐败立法的增加,很少有政客成为杰出的投机者:20世纪20年代,他们对泡沫传播的直接政治参与程度不超过民主党全国委员会主席约翰·J.拉斯科布[22]

    20世纪90年代,数以千万计的401(k)计划和个人退休账户的参与者,每个人都是自己的小资本家,这一前景吸引了保守派[23];受安·兰德、米尔顿·弗里德曼和弗里德里希·冯·哈耶克理论的影响,保守派在新的“所有权社会”中大放异彩。这场科技泡沫没有产生任何重大的政治性法案——一种彻底的贪污和腐败——政治不作为占据了中心舞台,20世纪30年代佩科拉审判之后的各项监管保障措施,没能很好地得到落实;到20世纪80年代,《格拉斯-斯蒂格尔法案》将商业银行和投资银行业务严格分开的做法,也基本处于失效状态,到1999年,该法案被最终废除。

    CNBC从内容和基调上大肆赞美牛市的意识形态基础。主播劳伦斯·库德洛在《库德洛报道》栏目的开场白中说道:“记住,伙计们,自由市场资本主义是通往繁荣的最佳道路!”[24]保守派记者詹姆斯·格拉斯曼或许比其他任何人都更坚信科技泡沫与自由市场意识形态之间的联系。作为一个著有很多投资类书籍的著名作者,他一直都偏爱保守主义阵营,尤其是《华尔街日报》。20世纪90年代,他热情地提到,市场的迅速崛起仅仅是自由市场资本主义丰饶的序幕。因此,当2000年4月股市开始崩盘时,他指责美国政府扼杀了市场。针对一项支持政府对微软提起反垄断诉讼的裁决,他评论道:

    没有人知道为什么一只股票会在某一天下跌,但我对纳斯达克指数暴跌的解释是,投资者们被关于微软的裁决激怒,他们意识到了政府干预的威胁。如果政府没有干预,他们就会更好。(副总统兼总统候选人)艾伯特·戈尔也是如此。克林顿政府喜欢把过去10年里股市翻了两番归功于自己,但其对纳斯达克指数的崩溃也负有责任。[25]

    乔治·吉尔德曾是理查德·尼克松和纳尔逊·洛克菲勒的演讲稿撰写人,他坚定地相信,20世纪90年代大牛市和自由市场优越性之间的关联,是20世纪90年代持有科技热情的最极端例子。2000年1月1日,他在《华尔街日报》上发表了一篇著名社论,认为互联网不仅改变了一切,而且改变了“全球经济的时空网格”。他运用夸张的比喻,提及了原子内部的广袤空间,“对物质内部结构的操纵”,甚至还在杂志编辑们面前悄悄使用了量子力学和“离心力”的内容。他得出结论:只有广泛运用信念、爱和宗教信仰,人类才能在崭新的新数字时代取得胜利。[26]《铁路时报》的编辑们一定会在天堂为他鼓掌。

    吉尔德、库德洛和格拉斯曼,他们都拥有强大的智力,又有常春藤盟校[27]的教育经历,为什么他们却在20世纪90年代末大错特错?从20世纪起,心理学家开始意识到,人们利用分析能力不是为了分析,而是为了合理化——使观察到的事实符合他们先入为主的偏见。(经济学家早就注意到,“如果你折磨数据足够长的时间,那么它们最终会招供”[28]。)人类的这一倾向有两个主要原因,这两个原因正是理解个人和群体幻想的核心。

    我们所有人——不管是聪明的人、愚笨的人还是普通人——都有这种非理性倾向,原因之一是,真正的理性是很难做到的,很少有人能做到。另外,理性能力和IQ(智商)之间没有什么关联。21世纪初,在相对较新的决策科学领域获得博士学位的谢恩·弗雷德里克,提出了一种著名的范式,证明了绝对的严密分析是多么困难。

    获得博士学位后不久,弗雷德里克写了一篇经典论文,描述了一份简单的问卷调查,心理学家称之为“认知反应测试”,它测量的是理性能力的商,即RQ,而不是IQ。问卷调查只有3个问题,其中最著名的(至少在经济学界)是,假设一个棒球和一根球棒的价格加起来是1.1美元,而球棒的价格比棒球贵1美元,那么这个棒球多少钱?大多数人,即使是非常聪明的人,也会很快回答0.1美元。但这不可能,因为这意味着球棒的价格为1.1美元,因此总价格为1.2美元。正确答案是,棒球的价格必须为0.05美元,球棒的价格为1.05美元,两者的总成本为1.1美元。[29]

    如果你认为棒球/球棒问题以及脚注中的另外两个问题很简单,那么你可以试一下另一个更具挑战性的问题,它已经存在了半个世纪,即沃森的四卡片问题测试。测试中有四张一面是字母、另一面是数字的卡片。第一条规则:“如果卡片的字母面是一个元音,那么它的数字面是一个偶数。”四张卡片现在显示:K、A、8和5。你会翻开哪两张卡片来证明或反驳这条规则?

    绝大多数受试者会凭直觉选择A和8,但正确答案是A和5。沃森是“确认偏见”概念的先驱,他用典型的学术性语言低调地陈述道:“这项任务被证明是非常困难的。”要想得出正确答案,首先必须认识到,这一规则并不排斥偶数卡片的另一面可以有元音或辅音,所以,把8这张卡片翻过来是没有用的。要驳斥这条规则,我们必须翻开5这张卡片,如果它的背面是一个元音,我们就能推断出这个规则是错误的;同样地,很简单,翻开A并找到一个奇数,这也将证明原规则是错误的。[30]

    人们需要付出相当多的努力才能拥有理性思维。几乎所有人都是精神上的懒惰者或“认知吝啬鬼”,用心理学语言来说,即他们凭直觉寻找分析捷径,例如使用卡尼曼和特沃斯基所描述的启发式方法。要做到彻底理性,需要强烈的认知努力,这一点儿都不令人愉快,因此大多数人都不这样做。正如一位学者所说,我们“只有在其他一切方法都失败的时候才开动大脑——甚至通常那时都没有开动”[31]

    因此,IQ和RQ分别测量不同的方面。IQ衡量处理抽象语言和定量技术的能力,特别是算法,而RQ则集中在应用这些算法之前的一些问题:在分析事实之前,有没有仔细列出问题的逻辑,并考虑到了其他的替代性分析方法?在得出答案之后,是否考虑到了该答案可能是错误的,并估计出错误的概率,进而预测出这个错误将会导致的后果?事实证明,高智商并不能防止人们掉入这些陷阱。基思·斯坦诺维奇是RQ测试扩展问卷——CART(理性思维综合评估)的提出者,在他的评估中,“理性和智力经常分离”[32]

    我们倾向于非理性行为的第二个主要原因是,我们常常将智力用于合理化,而不是合理性。一般来说,我们合理化的是我们的道德和情感框架,我们的认知过程包括一个快速移动的系统1——位于大脑深处的边缘系统,即我们的“爬虫脑”,以及一个缓慢的系统2——这一系统主宰着CRT(认知反应测试)和CART所需要的理性分析。

    在人类历史的大部分时间里,这两个大脑系统为我们提供了良好的服务。用心理学家罗伯特·查容克的话来说:“一位明智的设计师为我们的每一个过程分别提供一个系统,而不是为我们提供一个多用途系统,就像既能烤肉又能烤面包的机器一样,最后任何一项功能都执行不好。”[33]

    在后工业世界,尤其是在规划周期延伸到未来几十年的金融事务中,我们所面临的选择和我们的祖先在非洲大草原上所面临的生存性问题(需要使用系统1来解决)越来越不同,反而CRT和CART的扭曲思维问题(需要使用系统2来解决)越来越相同。这个问题由于以下事实而更加复杂:我们经常利用系统2对系统1已经得出的情绪化的结论进行合理化。换句话说,或者用丹尼尔·卡尼曼的话来说,被大肆吹嘘的系统2的主要功能是作为系统1的“新闻秘书”。[34]

    这意味着我们需要付出更多的认知努力。但即使是最优秀和最聪明的人,也无法胜任我们所面临的预测性和决策性社会任务。20世纪70年代,卡尼曼、特沃斯基和其他人已经意识到人类在预测方面做得很差,但直到最近,研究人员才开始衡量我们做得到底有多差。

    从20世纪80年代末开始,心理学家菲利普·泰洛克考察了284名专家(来自政治、经济、国内策略研究等领域)所做的2.8万个预测,并对这些所谓“专家”的预测能力进行量化。首先,也是最重要的,他发现专家们的预测能力非常差——竟然落后于“基准概率”这一简单的统计规则。所谓基准概率就是事件过去的发生频率。

    例如,当投资“专家”被问及来年市场崩溃的可能性(比如将崩溃定义为价格下跌超过20%)时,他可能会讲述美联储政策、工业产出、债务水平等如何影响这种崩溃的可能性。泰洛克认为,最好忽略他的这种叙事性推理,只是简单地查找市场崩溃的历史频率。例如,自1926年以来,每年发生股市月平均价格下跌超过20%的概率是3%,这个简单的方法在预测崩溃概率方面比基于叙事的“专家”分析更准确。

    泰洛克还发现,某些专家的表现尤其糟糕。根据社会和政治理论家以赛亚·伯林在著名论文《刺猬与狐狸》中所描述的内容,[35]泰洛克也将专家大致分为刺猬型和狐狸型两类,刺猬型专家是思想家,他们根据统一的世界理论来解释所看到的一切,而狐狸型专家则会有许多相互冲突的解释。狐狸型专家比刺猬型专家更能容忍模棱两可的情况,也较少被迫得出确定的结论。刺猬型专家对自己的预测更有信心,并且会做出更极端的预测;关键是,当面对相悖的数据时,他们改变观点的频率要比狐狸型专家低,这种低频率会腐蚀预测的准确性。

    刺猬型专家的分析也同样适应于政治右翼和左翼:例如,时至今日,激进的环保主义者依然支持保罗·埃利希在20世纪70年代关于迫在眉睫的全球饥饿和自然资源短缺的著名预测,自由主义者也依然支持著名经济学家马丁·费尔德斯坦对比尔·克林顿的预算和社会政策将破坏经济的高调警告。

    自远古祖先开始信仰萨满以来,人们就试图通过咨询专家,在一个不确定的世界中寻求确定性。泰洛克测试了三类群体的预测能力:大学本科生、预测领域的权威人士,以及在某一领域很有见解但在该领域之外进行预测的“业余爱好者”。毫不奇怪,本科生表现最差。更值得注意的是,专家的表现并不比业余爱好者好;此外,当泰洛克把专家分为狐狸型和刺猬型时,发现拥有某领域的专业知识似乎更有利于狐狸型专家的预测,但使刺猬型专家的预测结果更差。

    也就是说,狐狸型的环境科学专家也许能比刺猬型的军事专家更好地预测军事结果,反之亦然。这个结果的原因似乎是,虽然专家和业余爱好者都倾向于高估极端结果的概率,但专家这样做的次数更多,并使他们的总体预测准确率降低。业余爱好者看起来更像狐狸,至少在他们的专业领域之外。因此,用泰洛克的话来说,知识的最佳点似乎位于“《经济学人》《华尔街日报》《纽约时报》等高质量新闻出版物的读者附近,因为很多业余爱好者都报告说,这些出版物是他们获取专业以外话题有用信息的来源”[36]

    泰洛克有一个惊人的发现,即专家们一般会利用自己的知识来合理化数据,使之符合他们先前持有的世界观。刺猬型专家更严格地坚持他们先前的观点,因此他们更坚决地为自己的错误辩护。例如,泰洛克发现“话唠”,即列举大量支持性论据的能力,是预测不佳的标志。泰洛克提出了一个识别专家类型的简单经验法则:刺猬型专家使用“此外”一词多于“然而”一词,而狐狸型专家则相反。[37]

    大多数人都持有强烈的自我肯定倾向,渴望对自我的赞赏,因此会错误地认为自己的预测比实际更准确;相反,我们错误地认为对手的预测不太准确。不过,刺猬型专家有一种特别明显的倾向,泰洛克列举了一些他们所用的最著名的借口:“一个突如其来的晴天霹雳破坏了我的预测”,“我几乎是对的”,“我没有错,我只是太早了”,最后,当其他一切都失败时,“我的正确性还没有被证明”。泰洛克简明扼要地总结了这一倾向:“当他们认为自己对的时候,我们很难问,他们为什么做错了。”[38]

    最后,泰洛克发现了特别有效的预测死亡之吻:媒体名气。就媒体而言,其寻找的是“繁荣派和末日派”;也就是其喜欢极端预测的刺猬型专家,这类专家比模棱两可的狐狸型专家更能吸引观众。进一步地,媒体的关注会使他们过度自信,而过度自信本身会腐蚀预测的准确性。其结果是出现一个媒体-预测的死亡螺旋,即媒体寻找极端的、糟糕的预测者,媒体曝光又会使该预测者的预测更加不准确。泰洛克说道:“三大主角——听上去像权威的专家、关注收视率的媒体和专注的公众——可能因此被锁定在一个共生的三角关系中。”[39]回顾过去,科技泡沫的意识形态啦啦队员库德洛、吉尔德和格拉斯曼,已经击打出泰洛克的三重奏:喜欢极端预测的媒体的宠儿刺猬型专家。

    互联网时代展现出金融泡沫的所有经典迹象和症状:股票投资话题在日常对话中占据主导地位,放弃有保障的工作转而全职从事投机性工作,真信徒对怀疑论者的蔑视和嘲笑,以及极端预测的盛行。

    在电视屏幕以及越来越多的网站上,人们如此密切地观察并实时记录极端的市场繁荣及随后的灾难。市场繁荣感染了高科技产业的神经中枢——硅谷、华尔街,以及位于利堡镇的CNBC工作室,但日常闲聊中感受到的市场热情在主街、社交聚会和投资俱乐部中最为强烈。

    在马萨诸塞州科德角的丹尼斯镇,有一家理发店是男性工人阶层聚集的堡垒。那里上演了一段由狂热所引发的底层故事,令人心酸。在正常情况下,理发店的聊天内容主要涉及体育和政治,如果店里有电视机,电视就一定会转到播放棒球、足球或篮球比赛的频道。但20世纪末并非正常时期,比尔·弗林拥有的这家理发店——弗林理发店,也并不是一家普通的理发店。

    到2000年,弗林已经当了30多年的理发师,对股票市场并不陌生。他的曾祖父也是一名理发师,给了他极好的建议:把收入的10%存起来,然后投资于股票。事实证明,弗林这方面的智慧运用得并不好,因为他和很多人一样,偏爱彩票式的结果。20世纪80年代中期,椰菜娃娃风靡一时,大量儿童和成人“投资”了它们,不顾及它们可以被随意制造的事实。在狂热的顶峰时期,弗林以保证金形式购买股票,也就是说,用借来的钱购买了制造椰菜娃娃的科尔克公司的股票。

    1988年,科尔克公司破产,弗林的积蓄大大减少,但他继续将剩余收入投入股票市场。10年里,他猛砸了10万美元,将其投资于他认为最具魅力的高科技公司:美国在线、雅虎、亚马逊等。到2000年,他的积蓄已增至60万美元。弗林告诉自己,当投资组合达到百万时,他将退休;考虑到自己做得很好,他认为这个目标很快就会实现。[40]

    如果说狂热是一种流行病,那么“互联网改变了一切,它将使我们所有人变得富有”这句话就是病毒,比尔·弗林是科德角的零号病人。到2000年,理发椅上讨论的话题已经从红袜队、凯尔特人队和爱国者队转向了弗林最喜欢的两只股票——EMC(易安信)和安根尼克斯。电视转到了CNBC频道。

    24小时不间断的金融娱乐和即时在线交易,正是弗林理发店上演的毒性组合。弗林编造了引人入胜的故事,并诱导顾客们购买他推荐的公司的股票。[41]2000年冬天,《华尔街日报》记者苏珊·普利亚姆第一次来到这家理发店,当时正值市场触顶之际,大家谈论的话题一直都围绕科技股。弗林向一位顾客推荐了生物技术公司安根尼克斯的股票,店里其他人则主动说起自己购买了Coyote科技公司的股票和NTAP(企业级网络存储解决方案提供商)的股票,或者更低风险的话,杰纳斯资本集团提供的共同基金也可选择。杰纳斯是一家专注于科技投资组合的投资公司。

    弗林最喜欢的是数据存储公司EMC的股票:“我想我已经介绍了100个客户购买EMC。”弗林并没有通过严格的证券分析,而只是通过另一位理发师的推荐,决定购买这家公司的股票,但顾客们似乎都不在乎。到2000年中,股票遭遇了几次严重下跌,但弗林和他的顾客们仍充满信心。正如一位画家/壁纸设计师所说:“即使股票真的下跌30%,也会马上恢复。”弱者受到嘲笑。弗林指着停车场的一个顾客说:“看到那个家伙了吗?他两年前留了5000美元,我让他买EMC。如果他听了,那些股票现在就值18000美元了。”[42]

    3个月后,当普利亚姆女士再次来到理发店时,科技股刚刚从严重下跌中恢复,但仍比峰值低40%左右。弗林说:“我不是只买生物技术或高科技类股票。”但他仍然坚持他的候补选项EMC。他还购买了更多的安根尼克斯,其股价已经强劲反弹,他的投资组合价值也达到了新高。[43]

    2001年2月,他所钟爱的、以保证金购买的EMC股票,跌到了经纪人不得不给他平仓的地步。该只股票在普利亚姆女士第一次来访后不久达到了145美元的峰值,最终在2002年底跌至4美元以下。弗林的理发店曾经是镇上的社交中心,现在一片寂静,空无一人。一个顾客说:“每个人都知道弗林损失了很多钱。他不想谈论太多。”[44]

    并不是所有顾客都被剪羊毛;例如,有一个顾客用卖掉EMC股票所得的现金购买了一套新房子。但总体而言,损失已经造成;2000—2002年的熊市让弗林意志消沉,直到2007年,在一位股票经纪人的建议下,他才开始再次购买股票,当时他购买了伊士曼柯达公司的股票。5年后,伊士曼柯达公司破产了;2013年,73岁的弗林仍在给别人理发。即使在股票崩盘后,EMC的高管们也会在暑假期间顺便来理发。他们越来越喜欢弗林先生了。[45]

    在大多数情况下,弗林和他的顾客们交易的都是单个公司的股票,这是一种历史悠久的做法,经常采用保证金的形式。但20世纪90年代,越来越多的美国人通过另一种途径持有股票,即共同基金。共同基金是20世纪20年代信托投资基金的直系后裔,不仅可以通过拥有大量不同公司的股票轻松实现风险分散,而且还提供了所谓的资深经理人选择股票的机会。1990—2000年,美国的股票共同基金资产增加了近20倍,从2000亿美元左右增加到3.5万亿美元,也就是说,股票共同基金占股票总市值的比重从7%左右增加到23%左右。[46]

    和弗林理发店的常客们一样,共同基金的投资者也越来越倾向于那些排名靠前的基金。雅各布互联网基金是最受欢迎的基金之一,在1998年暴涨了196%。范·瓦格纳新兴增长基金在1999年暴涨了291%。杰纳斯资本集团运营着一系列以科技股为主的国内和国际基金,其中许多基金在那一年也实现了三位数的回报。

    这些基金的强劲表现吸引了更多的资产,特别是迅速增长的401(k)账户中的资产,其发起人意味深长地向参与者提供了基金业绩统计数据,以便后者能从近期回报率最高的基金中做出选择。

    几股交织的逻辑共同推动了人们对科技类基金的狂热。最明显的逻辑是,表现最好的基金吸引了最大的资产流,这进一步推高了股票的价格,也进而提高了基金的表现。这些共同基金公司对其管理的资产按比例支付报酬,并大量发行新的科技基金。最后,投资者的投资期限越来越短,这推动了基金经理们更加狂热地进行交易。1997年,美国公共电视网著名的《前线》节目拍摄了范·瓦格纳新兴增长基金的经理——加勒特·范·瓦格纳向手机发送的近乎连续的交易流。[47]该节目正好说明了媒体是如何附和的,其中包括著名金融记者约瑟夫·诺切拉对范·瓦格纳的热情洋溢的描述:

    竞争非常激烈,顶级共同基金经理就像现代炼金术士,创造了神奇的市场收益。现在,没有人比这个人——加勒特·范·瓦格纳——更能点石成金了,他在旧金山单独运营着一只基金。[48]

    如果你在1997年1月1日买入了10000美元的范·瓦格纳新兴增长基金,那么到2000年3月,该基金将增长到45000美元(回报率为350%),然后,将在2002年9月跌至接近市场底部的3300美元,即从10000美元下降了67%,从45000美元下降了93%(可参考同时期纳斯达克综合指数的表现,见图14-2)。这些令人沮丧的数字也依然低估了损失。尽管属于“前线”类,但1997年时,该基金刚刚起步,了解该基金的投资者相对较少。仅在1999年,基金规模就从1.89亿美元增至15亿美元。因此,更多的投资者承受了93%的损失,而不是令人兴奋的350%的上涨。最后,诺切拉是对的:范·瓦格纳确实是一位炼金术士,但他是将黄金转化为铅的术士;2008年,他最终辞去了以他名字命名的投资组合的经理职务。在所有积极管理的共同基金中,该投资组合的10年业绩表现是最差的,价值损失了66%,而整个股市的收益率为72%。[49]

    图14-2 1995—2003年纳斯达克综合指数的表现

    英国铁路泡沫、20世纪20年代的泡沫以及之后的互联网泡沫中,有一条引人注目的主线:它们背后的核心技术发挥了作用。依赖于新铺设的铁路,哈德森能够迅捷地从办公室、建筑工地、股东大会到达议会;在20世纪20年代的泡沫期间,即使是远洋班轮上的投机者,也可以通过阅读由无线电信号提供的股票价格收报机及外部信号在船上交易台进行交易。互联网聊天室和在线交易扩大了对互联网公司股票的狂热,这些互联网公司的股票就是通过互联网交易的。

    第二个标志性的泡沫症状——放弃舒适体面的职业转而全职从事投机——也在互联网泡沫期间显现出来。20世纪90年代的交易大部分是日内交易,因此,数以百万计的人(绝大多数是男性)请假,甚至完全辞职,坐在电脑显示器前,每天进行数十次甚至数百次的交易。

    日内交易涉及股票的一连串买卖,目的是获取大量微利。在理想的日内交易中,典型的例子是,以的价格购买1000股股票,并在当天(有时在几分钟内)以的价格卖出,由此产生的毛利润为125美元。事实上,大多数日内交易者的平均回报率接近于零,每笔交易都会被扣佣金,在成百上千笔交易中,即使是稳健成功或幸运的参与者,也会被佣金毁掉。

    在上瘾方面,没有什么能与在线交易相媲美。参与者一直盯着自己的终端。正如一位观察家所说:

    我不知道你们中是否有很多人在拉斯维加斯(或任何其他地方)玩过视频扑克。我玩儿过,这让人上瘾。尽管你输了,例如,在一段合理的时间内(玩儿上一个或两个小时,十次中有九次你都输了),但它仍然让你上瘾。现在,想象一场对你有利的视频扑克。也就是说,所有的小铃铛、按钮和蜂鸣器仍然在那里提供即时反馈和乐趣,但你不会赔钱,而是变得更富有。如果拉斯维加斯是这样的话,你就得用救生钳才能把人们从座位上撬下来。人们会随身携带便盆,这样就不用离开座位了。在这种视频扑克面前,强效可卡因都要让位。在我看来,这正是在线交易的现状。[50]

    1997年以前,只有大型机构从事这种日内快速交易,因为小投资者无法从证券交易所获得必要和准确的定价;1997年出现了“二级报价”,电脑屏幕上可以显示限价挂单[51],以供散户投资者参与和使用。

    与弗林理发店的顾客不同,大多数日内交易者都精通技术,有数字天赋,受过高等教育。问题是,当有人购买股票时,意味着有其他人卖出,反之亦然。换言之,证券交易类似于与隐形伙伴打网球;大多数日内交易者没有意识到的是,网络另一端的几乎都是投资界的威廉姆斯姐妹[52],即精明的机构参与者,对他们来说,公司不仅仅是一个可以压倒人类交易者的符号或计算机算法。

    到20世纪90年代末,大约有100个公司开设了“培训项目”。花几千美元,“受训者”就可以参加三天的入职培训和“新兵训练”,然后是一周的“模拟交易”。“培训师”很乐观:只要遵守这些规则,任何人都可以成功。正如一位培训师所言:“这就像打高尔夫一样。如果你对如何放置双脚、如何举起球杆以及如何持球都很小心,那么你将有更好的机会打直线球而不是曲线球。同样的原则也适用于日内交易。”[53]

    到20世纪90年代末,大约有500万美国人在网上交易,尽管全职交易的人数估计要少得多。[54]只要市场行情上涨,日内交易者就有一半的机会,但就像20世纪20年代和铁路泡沫期间的暴跌一样,当海浪汹涌时,大多数人的财富都会被卷走。

    与弗林理发店的顾客或办公桌上痴狂的日内交易者相比,比尔兹敦镇“女士投资俱乐部”的女士们没有很大的不同,但她们的发展轨迹更为壮观,代表一种典型的淘金热氛围,这种氛围让那些缺乏金融专业知识的人相信,她们在这一领域有着光明的前景。

    在任何其他时代,都不会有人注意到这个传统的投资俱乐部。它由伊利诺伊州比尔兹敦镇的中老年家庭主妇组成,遵循相对保守的传统,已经保持了几十年:聚在一起吃饼干、喝咖啡,研究已存在的、收益可靠的公司,并长期持有这些公司的股票。

    她们甚至并不接受重金:会员首先支付100美元,之后每月支付25美元。当她们开始向全国性组织——全国投资者协会——报告回报率时,问题来了。该协会连续6年向她们颁发了“全明星投资俱乐部”奖。1984—1993年的10年间,她们报告了惊人的23.4%的年化回报率,其比股市的年化回报率还高出4%。

    她们击败华尔街的故事,与20世纪90年代那种随意投资便过上舒适生活的故事不谋而合。该俱乐部的成员摆脱了小镇家庭主妇的身份,成为全职金融大师。她们乘坐喷气式飞机环游世界,经常向比她们家乡人数(5766)还多的观众发表演讲,这些观众有时在雨中等票,而她们可以从投资公司赚取丰厚的顾问费,还卖出了80万册《比尔兹敦镇女士投资俱乐部常识性投资指南》,这是一本她们的“秘诀”概要。其中一个成员感慨道:“我在休斯敦下了飞机,豪华轿车司机向我道歉,因为他必须使用一辆特大型轿车。以前,当豪华轿车经过我身边时,我会说‘我想知道里面坐了谁’。好吧,现在是我坐在里面了。”[55]

    她们突然成了名人。但是有一个问题:23.4%的回报率,已经将她们每月的会费计算在内了。如果一个人一开始只有100美元,那么一分钱也赚不到,但半路上又增加了25美元,这时不能说她获得了25%的回报。大约1998年,也就是该书出版两年多后,出版商注意到了这一错误,然后插入了一条免责声明,即“该回报率可能与共同基金或银行计算的回报率有所不同”。

    在牛市期间,新闻从业技巧退化;直到该书的1998年版上架,《芝加哥》杂志的记者沙恩·特里奇注意到并报道了出版商的免责声明。但该杂志并不是投资类报道的前沿阵地。女士们起初很愤怒,她们的出版商亥伯龙公司的一位高管称特里奇先生是“恶意的”,一心想抹黑“人们遇到的最诚实的群体”[56]

    不管是不是无心之过,在这10年里,这些女士的年化回报率并没有达到23.4%,9%更接近事实。最终,亥伯龙公司召回了这本书,并同意用出版社的任何一本书换回它,从而解决了一场官司,而这些女士则消失在人们的视线中。

    尽管存在以上问题,但实际上这些女士的表现并不算糟糕:审计人员经过正确计算后发现,1983—1997年的整整15年间,她们的账户每年有15.3%的收益,仅比指数基金的收益低2%;她们已经很值得尊敬了,当然也比弗林理发店的人和日内交易者做得好。尽管如此,也只有20世纪90年代才会发生类似的事情,即一个数学错误把一群赚取平庸股市回报的普通女性变成文化偶像。

    到了20世纪90年代末,和比尔兹敦镇的女士们、日内交易者以及弗林理发店的顾客一样,数百万美国人认为自己是股市天才。摩根士丹利有学问又有见解的巴顿·比格斯最能捕捉到这种情绪:

    社会迹象非常糟糕。每个人的儿子都想为摩根士丹利工作。没用的姐夫们打算创立对冲基金。我认识一个50岁的人,他什么都没做过。他打算创立对冲基金。他正在向人们散发宣传册。我在某处找到了一个。[57]

    泡沫的第三个症状,是对怀疑者持有激烈的愤怒情绪,这在20世纪90年代中期变得明显。在罗杰·艾尔斯将CNBC打造成媒体巨头的几十年前,多达3000万观众会在每周五晚上观看《与鲁凯瑟讨论华尔街的一周》,这是美国公共电视网在全国播出的一个小组秀节目,主持人是路易斯·鲁凯瑟,他温文尔雅、机智幽默,是一位受人尊敬的金融记者的儿子。

    鲁凯瑟严格编排节目。节目中最令人向往的角色,是由股票经纪人、分析师和时事通信作者轮换组成的小组成员,他们在节目开始时与鲁凯瑟逗乐,然后询问本周的特邀嘉宾是谁。逊色一点儿的角色是荧幕外的“精灵”小组成员,他们声称可以预测未来的市场方向。鲁凯瑟清楚两点:首先,行情看涨不仅让他的品牌受益,其中包括两个时事通信和路易斯·鲁凯瑟海上巡游投资,而且对他的节目有益;其次,对经纪人和分析师来说,有幸获得一个小组中的固定席位,便是一个无价广告。因此,他严格限制专家组成员,特别是在科技泡沫时期。

    20世纪90年代末,瑞银华宝的投资分析师、鲁凯瑟两个节目小组的常客吉尔·杜达克开始觉得不安。她读过查尔斯·金德尔伯格的书,并意识到他的泡沫标准,特别是“技术替代”和信贷宽松,正符合当前的市场情况。她警告她的客户,但其中一人指责她不爱国,就像她的公司创始人保罗·沃伯格在70年前被诽谤那样。因此,她知道了泡沫期间怀疑者是如何被对待的:“你会被鄙视,被恐吓,当泡沫开始破裂时,公众会非常愤怒。这需要一个替罪羊。”1999年11月,即泡沫破裂前5个月,鲁凯瑟以最具敌意的方式解雇了她——在一个她不再出现的节目的夜晚,她的照片上多了一顶高纸帽。鲁凯瑟用一位迷人的达特茅斯前篮球运动员艾伦·邦德代替了她。4年后,邦德因偷窃养老金而被判入狱12年。[58]

    互联网泡沫对“价值型投资者[59]”的打击最严重,他们购买成熟实体公司和制造业工厂的股票,这些股票定价合理,在股票狂热时期落后于大盘。著名的价值导向型对冲基金经理朱利安·罗伯逊被迫关闭了他的老虎基金,该公司在20世纪90年代中期之前创造了令人羡慕的业绩。罗伯逊先生说:“这种方法行不通,我不明白为什么。我已经67岁了,谁还需要这个公司?”罗伯逊先生宣布公司将于2000年3月30日关闭;以科技股为主的纳斯达克在3周前达到了5060点的峰值,但当时罗伯逊并不知道,这是未来15年内都不会达到的水平。[60]

    最后一个泡沫的识别性特征,是一些极端性预测的产生。正常情况下,专家预测的某一年的市场涨跌幅度很少超过20%。超过这个幅度的预测可能会使预测者被认为是疯子,而且大多数预测都是以个位数的幅度上下波动。但泡沫期间并非如此。1999年,詹姆斯·格拉斯曼和凯文·哈塞特合著了一本书,预测道琼斯工业平均指数在几年内将上涨超过2倍,从目前的约11000点上涨到36000点。其他人也不甘示弱,将估计数值提高到100000点。[61]

    格拉斯曼和哈塞特得出的这个上涨超过2倍的预测,说明将泡沫时期的高价进行合理化的努力已经做了很久。他们通过操纵股票和债券所使用的投资折现率来实现这一点。不严格地说,折现率是投资者在承担持有证券的风险之前所要求的回报率;证券的风险越高,购买证券所要求的回报率(折现率)就越高。例如,2019年中,非常安全的长期国债收益率为2.5%,而持有更高风险的股票所需的回报率约是其3倍,而1990年前约为10%。

    长期资产(如30年期国债或股票)的价格与折现率近似成反比:将折现率减半(例如从6%减至3%),价格就会翻番。(因为股票没有到期日,至少在理论上,它甚至比30年期的国债更“长期”。)相反,当经济或全球地缘政治地位恶化时,投资者要求更高的回报率,即持有股票的折现率,因此其价格暴跌。

    格拉斯曼和哈塞特对道琼斯工业平均指数36000点的预测表明,投资者已经演变成一种新型的理性经济人,他们认为股票从长期来看风险不大,因为其总会从价格下跌中恢复过来。因此,这种新型的理性经济人决定对股票采用类似国债的3%的折现率,而不是历史上大约10%的折现率;这在理论上使股票的价格上升了2倍多(10%/3%)。[62]

    格拉斯曼和哈塞特已经忘记了邓普顿所警告的“这次不一样”这句话的高昂代价。几乎在他们的书出版的同时,2000年,互联网泡沫在突然回归的风险中破灭,标志着有史以来最大的金融狂热结束。在不到两年的时间里,美国股市市值损失了6万亿美元,就好像整个国家7个月的经济产出都消失了一样。1929年,只有10%的家庭持有股票,但到2000年,个人经纪业务和共同基金账户、个人退休账户和基于雇佣关系的401(k)计划的扩张,使持有股票的家庭的比例上升到60%。数千万人原本认为自己在经济上很宽裕,但他们现在发现情况并非如此;另有数百万人认为自己的储蓄足以退休,但他们现在被迫延迟退休。

    一个从金融市场诞生之日起便存在的故事重现,2000—2002年,投资者们再次意识到,自己已经陷入遭受突然经济损失时的难以形容的痛苦之中。用幽默作家弗雷德·施韦德的话说:

    有些事情是无法用文字或图片向没有经历过的人充分解释的。我在这里所能提供的任何描述,都无法接近那种失去曾经拥有的一大笔钱的感觉。[63]

    15 伊斯兰国的兴衰

    马赫迪与哈里发

    互联网泡沫拉开了20世纪流行性狂热剧的舞台帷幕。随着21世纪的到来,世界上最年轻的亚伯拉罕宗教,用现已被熟知的末日叙事,吸引了世界各地的信徒,其能力和暴力程度震惊了世界。

    2014年11月16日,伊斯兰国组织斩首了一个名叫彼得·卡西格的美国人以及18名叙利亚俘虏。卡西格是美国陆军前突击队员,一直从事人道主义工作。肇事者公布的录像中,没有显示卡西格被杀的过程;更确切地说,卡西格的断头就放在“圣战者约翰”的脚下。“圣战者约翰”是一个名叫穆罕默德·埃姆瓦兹的英国公民,他带着英国口音缓慢而庄重地说:“我们正在达比克埋葬第一支美国十字军,并焦急地等待其他部队的来临。”[1]

    在过去的一年里,伊斯兰国用巧妙而有效的社交媒体活动,吸引了数千名战士和其他志愿者,很多人甚至是从繁荣和平的西方来到了世界上最糟糕的地方之一。“圣战者约翰”提到的城市达比克,以及同名的伊斯兰国宣传杂志《达比克》,对理解其招募新兵所取得的巨大成功有很大帮助。[2]

    达比克是叙利亚西北部的一座城镇。1516年,奥斯曼土耳其人在那里打败了埃及马穆鲁克人,进而控制了黎凡特。对现代圣战者来说,这标志着哈里发政权的重生——一个由穆罕默德的继任者领导的国家,统治所有的穆斯林,这将持续4个世纪。尽管该镇看上去并不引人注目,战略地位也不重要,但是,与奥斯曼哈里发帝国之间的联系,使该镇处于伊斯兰教末日叙事的前沿和中心。

    犹太教、基督教和伊斯兰教的末日叙事彼此相似。鉴于它们的起源相同,这并不奇怪。中世纪早期,拜占庭人和穆斯林都根据《但以理书》的同一节内容,预测到了对方的作战计划。[3]达比克由于其军事历史,成为伊斯兰教的末日发生地点,在那里,反基督力量(在伊斯兰教中经常被称为“达加尔”)将与代表正义的军队作战。

    这些末日叙事也是有区别的。基督教的末日叙事主要来源于几个很容易界定的《圣经》文本,特别是《以西结书》《但以理书》《启示录》中的文本,而伊斯兰教的末日叙事却来源于更为分散的、不容易界定的圣训,即先知穆罕默德的言行录(对应阿拉伯语中的“传述”或“报道”)。与基督教末日论不同,穆斯林的根本经典——《古兰经》几乎没有什么预言,并且和圣奥古斯丁以及后来的天主教神学传统一样,特别警告不要计算末日时间。

    但是,和基督教徒一样,穆斯林不可抗拒地被末日时间诱惑,他们的末日叙事就像沙漠野花一样从圣训中蹦出来。[4]由于数量众多,伊斯兰教的末日论甚至比基督教的末日论更混乱。例如,逊尼派的传统与大约1万条圣训有关,而不同的观察家对每一条圣训的报道方式往往不同。仅某位中世纪学者,就列出了3万多条圣训。先知[5]于632年去世,之后的几个世纪里,学者们根据真实性对其言论进行了分级和分类,从“真实的圣训”一直到“捏造的圣训”。

    先知没有留下遗嘱,这使事情复杂化了。他的前四位继任者,也就是哈里发——阿布·巴克尔、奥马尔、奥斯曼和阿里,见证了穆斯林的领土迅速扩张,其远远超出了阿拉伯的西部边界,进入拜占庭和波斯。接下来的几个世纪里,阿拉伯帝国与这两个相邻的异教大国之间展开了战斗。此外,第四任哈里发阿里(先知的堂弟,也是女婿)遇刺,随后阿里的小儿子侯赛因及其追随者在现代伊拉克的卡尔巴拉被杀,从而引发了一场血腥的宗派分裂,一直持续到现在。这场伟大的伊斯兰教冲突,一方是侯赛因的追随者——什叶派,他们将先知的继承权限制在血统上;另一方是卡尔巴拉之战的胜利者,他们演变成逊尼派,不承认领导权的血统限制。

    政治学家塞缪尔·亨廷顿在其极具争议的著作《文明的冲突与世界秩序的重建》中,将伊斯兰国家之间大量的武装冲突以及它们与邻国非伊斯兰之间的冲突列成表格,并得出结论:“伊斯兰的边界是血腥的,其内部也是如此。”[6]批评者指责他“东方主义”[7],并指出伊斯兰世界的现代战争源于西方的统治。虽然西方殖民主义在现代中东问题上确实扮演了重要角色,但亨廷顿这句骇人听闻的名言同样适用于中世纪的伊斯兰世界。中世纪时,伊斯兰是世界上最有智力、最富裕、最强大的文明之一的拥有者,那时的西方依然落后无能,基本不会给它造成什么困扰。

    下面开始讨论伊斯兰教末日论的魅力。美国和欧洲的基督教徒生活在相对繁荣、安全和地缘政治稳定的社会中;此外,他们的宗教在文化上占主导地位。因此,西方基督教末日论者只能被迫在一团乱的道德恐慌中挑选其中一些作为危情时刻(末日)的迹象:普遍的性行为、社会主义,以及撒旦主义(或者至少是占星术)。

    相比之下,自1497年瓦斯科·达伽马首次绕过好望角、击败穆斯林主导的极度繁荣的印度洋贸易,之后的伊斯兰在政治和经济上一直相对衰落。因此,对虔诚的穆斯林来说,末日迹象非常明显并令人痛苦,漫长的屈辱和失败需要末日时刻的正义,仅在20世纪的屈辱就包括:1916年,法国和英国之间的《赛克斯-皮科协定》秘密瓜分了穆斯林核心地带;1948年,以色列成立;1967年,以色列占领约旦河西岸和耶路撒冷旧城及其神圣的圣殿山;1979年,以色列和埃及之间达成了和平协议;1990年,第一次海湾战争尴尬地暴露出西方军队在中东地区的存在,尤其是在沙特阿拉伯(该宗教最神圣的圣地守护者)。与基督教徒和犹太人相比,穆斯林更加渴望一场能够颠覆现有世界秩序的末日大灾难。我们不能忽略穆斯林的末日论者及其追随者所感受到的痛苦和愤怒。其中一人写道:

    因此,犹太人在基督教徒脸上的掌掴仍在继续,但后者显然享受并允许这种羞辱。西方国家的十字军继续像一个被施虐的妓女,直到被殴打和羞辱,尤其是被她的皮条客——基督教欧洲的犹太人——殴打和羞辱,她才能从中获得快乐。他们很快就会因为犹太阴谋而被埋在砖瓦之下。[8]

    和所有的末日追寻者一样,穆斯林的末日论者渴望回到赫西俄德的“黄金种族”时代,也就是他们的萨拉菲时代,即穆斯林的前三代,包括先知的伙伴及其后代,他们是伊斯兰教的开国元勋。因此,今天的穆斯林末日论学者和领导人钻研圣训,想从中寻找灵感,使伊斯兰教恢复作为世界主流神学的合理地位,这就不足为奇了。大量的圣训提到了与拜占庭人之间的战争,特别是其中的君士坦丁堡战争,这些战争发生在先知死后的几个世纪,当时他的言行录被首次记录。这就解释了为什么伊斯兰国对叙利亚北部尘土飞扬的达比克小镇如此痴迷,因为最著名、最受尊敬的末日圣训中提到了达比克:“在拜占庭人袭击阿马克或达比克之前,最后的末日不会到来。”[9]

    圣训学者的主要任务是确定传述的出处,使真实的圣训可以追溯到先知时期。这是一个依靠世代口传的游戏。两位波斯学者,艾布·侯赛因·穆斯林和伊斯玛仪·布哈里,在先知死后200年,出版了最受人尊敬的汇编。据报道,布哈里梦见自己拍打先知周围成群的苍蝇,醒来后决定将自己的一生奉献给对不真实圣训的驱逐。在他严格的筛选标准下,只有1%的传述被认为是真实的圣训。[10]穆斯林和布哈里的圣训集录是公认最权威的,任何伊斯兰教神职人员、政治领袖、军事领袖或评论员的权威在很大程度上取决于其对圣训的掌握,特别是这两位学者编写的圣训。

    不用说,即使是最真实的圣训也要经过几代人的口头传播,用阿拉伯学者威廉·麦坎茨的话说:

    末日预言对杜撰者来说,是一个特别诱人的目标。早期,在那些分裂穆斯林团体并自相残杀的战争中,双方都试图通过预言自己的必然胜利和对方的注定失败,来为自己的政治辩护。借先知的嘴把预言说出来,这是最好的办法……几个世纪以来,新政治将赋予剩余部分新的含义,这一现象是基督教《启示录》的读者所熟悉的。[11]

    伊斯兰教的许多末日叙事,都是由那些对卡尔巴拉之战的胜利者——倭马亚族感到不满的人发展的。倭马亚族建立了第一个强盛的穆斯林王朝,并定都大马士革。因此,能将虔诚的教徒从大马士革日益腐败和专制的统治者手中解救出来的核心人物,就是穆斯林的弥赛亚,在阿拉伯语中就是“马赫迪”,其意思是“正确引导的人”。

    反对倭马亚王朝的阿拉伯人和波斯人散布预言:从呼罗珊(大致位于现代的伊朗东部和阿富汗所在地区)升起黑旗的士兵,将从那个方向横扫过来,打败倭马亚人,“如果你看到呼罗珊地区升起了黑色旗帜,那么即使需要爬过冰面,你也要立即前往,因为其中有哈里发马赫迪”[12]。750年,悬挂黑旗的叛军推翻了倭马亚王朝。叛军领袖是先知的叔父阿拔斯的后裔,他建立了以巴格达为首都的帝国——阿拔斯王朝,其统治将持续500年。

    每一则圣训都和上述胜利的阿拔斯叛军所引用的那一句类似,往往残缺而简短,通常是一句话或一段话的长度,很少出现一两页。正如美国最著名的穆斯林末日文学学者戴维·库克所说:

    由于穆斯林的传统没有明显的文本依据,只有后人提供的冗长背景(基本上由学者们将材料按照可利用的时间顺序排列),因此,末日出现之前的各个事件的发生顺序存在相当大的分歧,这并不奇怪。[13]

    换言之,数量众多且内容简短的圣训,使无限多的末日叙事成为可能;将一天的头条新闻倒入面糊中,并添加大量的确认偏见,聪明的伊斯兰学者比他的基督教时代论表亲更容易写出理想的世界末日叙事。

    然而,源自圣训的穆斯林的末日论,确实与基督教的末日论有共同特征:世界将在某个时刻终结。耶稣是一位先知,而不是上帝之子,他返回地球,通常手扶两位白人天使的肩膀,降落于大马士革倭马亚清真寺的东尖塔。他与达加尔作战。达加尔一般都是犹太人,而且常常是犹太人的弥赛亚。与基督教末日论中迷人的反基督者不同,达加尔具有令人厌恶的个性,长相丑陋,有一个巨大的钩状鼻子,一只畸形、鼓起的眼睛和大小不一的双手——这是解剖学上证明对称美感的最好机会。[14]

    反犹太主义是穆斯林末日论的既定组成部分,它甚至包括最具欺骗性的种族主义谣言。已故沙特国王费萨尔经常向外国政要大谈共产主义-犹太世界的阴谋,会面结束时,他总会问礼宾官:“他们拿到书了吗?”他指的是《锡安长老会纪要》。有一次,美国大使向他指出,假定犹太人密谋统治世界的《锡安长老会纪要》这本书,是沙皇的秘密警察伪造的。费萨尔回答:“胡说。”沙特王国用多种语言印刷了这本书,并扩大其发行量。从过去到现在,费萨尔一直不是唯一的反犹太主义者;事实上,对所有的穆斯林末日论者来说,《锡安长老会纪要》就是犹太人背信弃义的头号展品。[15]

    穆斯林的末日论者也和基督教的时代论者一样,从当前事件中寻找预示末日时刻的迹象。这些迹象主要有两种类型。第一种被称为“较小的迹象”,如性开放等,这正符合林赛和莱希的观点。甚至连歌舞、钱财和男性的丝绸服装也被看作一种末日迹象,汽车也是,因为女性可以驾驶。其他较小的迹象包括地震、洪水、干旱和财务不当行为,特别是收取利息和女性雇用男性(最后一个迹象忽略了一个事实,即年轻时候的先知正是被寡居女商人赫蒂彻雇用的,后来赫蒂彻成为先知的妻子和首位追随者)。

    一则特别著名的圣训说,“最后时刻”将会出现“两个人物打起来”,尽管这两个人物宣讲的是同一件事;当30个假弥赛亚出现时;当所有的宗教知识消失时;当杀戮变得频繁时;当每个人都很富有、没有人会接受施舍时;当坟墓如此壮丽,以至于活着的人都希望自己在里面时。

    穆斯林的末日论者也在寻找“更大的迹象”,即更具体的预言事件。在穆斯林早期阶段,位居榜首的预言是穆斯林征服了信奉基督教的君士坦丁堡(但尚未实现)。历任穆斯林统治者利用圣训为屡次的攻城失败做辩护;1453年,奥斯曼帝国最终取得了胜利,但末日并未随之来临,神学家们于是将预言中的末日之战的地点转移到其他地方,最近的预言是在达比克。

    与基督教犹太复国主义者一样,另一个“更大的迹象”是犹太人重返圣地。从犹太人的角度,基督教版本已经令人不快——要么皈依和改变信仰,要么被摧毁。而穆斯林版本则更残酷:安拉将把犹太人送回巴勒斯坦。用一位穆斯林末日论者的话来说,“通过把他们聚集(到巴勒斯坦),来宣布将临上帝的复仇”:这是穆斯林末日版本的最终审判。[16]

    其他“更大的迹象”包括达加尔的出现和太阳从西方升起。圣训中也出现了歌革和玛各,还有一个被称为苏菲亚尼的伊斯兰教特有的人物(在叙利亚横冲直撞的强大的逊尼派暴君)。作为逊尼派,他受到什叶派穆斯林的斥责;但并不是所有人都斥责逊尼派,例如,在巴格达阿拔斯王朝(倭马亚王朝的对手)的哈里发辖地,他受到崇拜。[17]

    苏菲亚尼的最终目标是杀死世界末日的主角马赫迪,但通常他很快就会被地球吞噬。在大多数圣训下,直到耶稣处理了达加尔,马赫迪才带领伊斯兰军队取得胜利,并建立对世界的正义统治。什叶派相信,10世纪时失踪或“隐藏”的第十二任伊玛目[18]穆罕默德·马赫迪,将如他的名字所示,在世界末日时再次出现。[19]

    1978年,安瓦尔·萨达特和梅纳赫姆·贝京签署了《戴维营协议》,这直接导致了1979年的《埃及-以色列和平条约》的签订。伊斯兰教徒憎恶《埃及-以色列和平条约》,尤其是1987年,一位不出名的埃及记者赛义德·阿尤布写了一本书,名为《反基督者》[20],书中传达了一个简单的信息:犹太人背信弃义,毒害了整个人类历史,他们将在一场末日之战中被伊斯兰教势力击败。

    20世纪80年代之前,穆斯林的末日文学是一种沉睡的文学体裁,侧重写马赫迪和千禧年,较少写歌革和玛各,也较少写耶稣与达加尔之间的战争。《反基督者》在伊斯兰世界的影响与哈尔·林赛的书在基督教世界的影响相同。类似于《消失的伟大地球》带来的基督教末日类文学的转变,阿尤布的书强调恐怖、血腥及最终战胜犹太人,并淡化随后的善良和光明,这种做法为该类型的文学体裁注入了活力。[21]

    根据阿尤布的说法,达加尔在地球上的犹太代理人首先是门徒保罗,其次是君士坦丁一世[22],然后是共济会成员、在美国的犹太人阿塔图尔克[23],再次是美国、北约,最后是以色列。阿尤布写道:“地震、火山爆发和干旱将先于反基督者出现,(而且)气温将明显升高。”接下来是一场最后的大战,其中的幻觉性细节让《启示录》和林赛都甘拜下风。末日时刻,以色列被摧毁,占世界主导地位的伊斯兰教将首都从大马士革迁往耶路撒冷。书中,阿尤布还谴责罗马教皇访问犹太教堂,并否认纳粹大屠杀。

    与基督教时代论小说一样,圣殿山在该书中占据主导地位。根据从丹尼斯·迈克尔·罗恩和拉比戈伦那里得到的提示,阿尤布写道:“达加尔的住所在耶路撒冷的圣殿里。由于这个原因,他们有时试图焚烧阿克萨清真寺,试图进行考古发掘,甚至试图通过美国共济会购买土地。”[24]三大亚伯拉罕宗教的末日叙事有着惊人的相似之处,正如以色列记者格肖姆·戈伦伯格所写:

    末日剧场涉及三方,在所有三方的末日论信徒眼中,一场伟大的戏剧已经上演。声音系统是希望和恐惧;每次其中一个演员讲话,都会引起强烈反响。正在上演的有三个剧本。在基督教剧本中,犹太弥赛亚扮演主角;在穆斯林剧本中,犹太人和基督教徒也有自己的角色。一方认为的繁荣修辞可能正是对另一方的战争提示。[25]

    和林赛的书一样,《反基督者》在阿拉伯世界非常畅销,之后阿尤布又写了一系列类似的书,这催生了一大批模仿者。其中的一些书,把几乎每个人(包括马丁·路德)都看作犹太人;模仿者之一法赫德·萨利姆在书中慷慨地承认萨达姆·侯赛因[26]不是犹太人,但侯赛因的一位亲密伙伴的父亲是犹太人,因此他的政权被玷污了。最著名的模仿者是另一位埃及记者穆罕默德·伊萨·达乌德,他为沙特媒体撰稿。

    达乌德显然认为阿尤布的书对犹太人过于冷静和宽容,1991年,他出版了《当心:反基督者从百慕大三角入侵世界》,其中百慕大三角既是达加尔旅居北美的一个中间地点,也是复仇的伊斯兰空军的飞碟基地。[27]

    流行的末日类文学书籍遍布开罗、利雅得、贝鲁特、巴格达[28]和东耶路撒冷的阿拉伯露天市场,摆满了从摩洛哥到印度尼西亚的书店书架。更重要的是,随着社交媒体的出现,这些书籍更加容易获得,影响力也越来越大,为21世纪的圣战主义提供了有效的背景音乐。[29]伊斯兰教学者让-皮埃尔·菲利于描述了该体裁日益反犹和反西方的基调:

    这种愈演愈烈的谵妄并不是无害的,因为它充满了深深的怨恨和报复……第三个千年的救世主们提炼出了具有末日信仰的人的仇恨胆汁。美国对伊斯兰教持有一成不变的敌意以及马基雅维利主义[30],因此注定要惨死;伊斯兰教是真理、不可抗拒的力量和永恒的胜利。[31]

    几个世纪以来,穆斯林将摆脱羞辱和压迫的希望寄托在救世主马赫迪身上。这种叙事和基督教千禧年主义者一样,都关注整数日期。马赫迪主义总会在穆斯林的新世纪之初爆发。

    穆斯林历法始于先知从麦加迁移到麦地那的622年,即“希吉来”元年,而希吉来历的14世纪始于1882年11月12日。[32]希吉来历13世纪末,相当于公历19世纪70年代末,一位名叫穆罕默德·艾哈迈德的苏丹苏非派[33]神职人员被埃及统治者的宗教异端激怒。这些宗教异端虽然向奥斯曼土耳其上交象征性贡金,但事实上更受惠于英国人。艾哈迈德认为,1882年11月12日是末日的预兆,为了给自己足够的时间在喀土穆[34]建立统治,迎接新世纪的到来,他在1881年宣布自己为马赫迪。[35]

    艾哈迈德的起义最初成功了,如果不是后来英国的查尔斯上将——“中国的戈登”[36]——在艾哈迈德围困喀土穆的时候被杀,那么艾哈迈德的政权可能会幸存下来。戈登在英国国内已经是受欢迎的英雄,他试图保卫整个喀土穆城市,这超越了他帮助埃及军队和政府撤离的这一职权,从而惹恼了英国王室和最高指挥部。

    1898年,民众对戈登之死的愤怒,迫使英国不计成本地派遣了一支由霍雷肖·赫伯特·基奇纳领导的远征队,以收复喀土穆。与此同时,艾哈迈德死于斑疹伤寒;基奇纳在恩图曼战役中击败了艾哈迈德的继任者阿卜杜拉·塔希。在恩图曼战役中,英军动用先进武器,屠杀了1.2万名穆斯林士兵,而自己仅有轻微损失。[37](温斯顿·丘吉尔也参加了这场战斗,当时他还只是一名年轻中尉;这场战争以及19世纪晚期的其他殖民地战争的压倒性胜利,激发了诗人希拉尔·贝洛克的创作灵感:“无论发生什么,我们都有马克沁机枪,而他们还没有。”)[38]

    喀土穆是伊斯兰教历14世纪之初的起义地点,在穆斯林地理上是一个边缘地带。伊斯兰教历15世纪初的骚乱事件则发生在伊斯兰的震中——麦加大清真寺。这座清真寺的历史可以追溯到610年伊斯兰教诞生之前,据说,大天使加布里埃尔在其家乡麦加城外的希拉山上,向先知口述了第一段《古兰经》经文,当时这位激动到颤抖的先知还只是一位成功的商人。

    麦加的财富来源于“克尔白”。后者是一座花岗岩建筑,据说是亚伯拉罕建造的,其中嵌的黑石可能是陨石。早在穆罕默德之前,朝圣者就开始朝觐并绕行克尔白和黑石,此地很可能是伊斯兰教创立之前、阿拉伯人的多神信仰中的主要神——安拉的神殿。[39]

    当时,穆罕默德作为一个出身卑微的小商人,是在未来妻子赫蒂彻的护助下才获得成功的。但实际上,他的血统也来自麦加的统治部落古莱西,只不过他出身于该部落的一个小分支而已。他的宗教热情,特别是他致力于清除克尔白360个异教神灵的偶像崇拜图腾,威胁到了麦加的朝圣交易,因此激怒了古莱西的精英们,他们迫使他于622年逃到了耶斯里卜(就是后来的麦地那),这一年就是伊斯兰教历元年,众所周知的“迁移”。630年,当他最终作为胜利的伊斯兰教势力之首返回麦加后,拒绝非信徒进入这两座城市这一禁令一直持续到今天。[40]

    从那时起,阿拉伯半岛就受到富裕和奢侈的商人精英与虔诚和禁欲的信徒之间紧张关系的间歇搅动。18世纪初,一位名叫穆罕默德·伊本·阿卜杜勒·瓦哈比的法学家开始宣扬一种激进的伊斯兰教,其核心围绕着两条原则:回归先知的原始教义,坚决反对巴格达、大马士革、伊斯坦布尔和开罗的贵族们享受奢侈和财富。舞蹈、珠宝甚至烟草都是“哈拉目”(伊斯兰教禁止的);什叶派也是“哈拉目”,什叶派信徒必须在皈依和死亡之间做出选择。

    伊本·阿卜杜勒·瓦哈比与一位可怕的勇士穆罕默德·本·沙特结盟后,法学家的神学才能和勇士的军事力量实现协同增强,他们将“瓦哈比思想”从其诞生地——地处内陆沙漠深处、受太阳炙烤的阿拉伯空旷地带——向外传播,直到几乎控制整个阿拉伯半岛甚至更远的地区。

    随着奥斯曼帝国在19世纪的衰落,穆罕默德·本·沙特的后裔阿卜杜勒·阿齐兹(在西方被称为伊本·沙特)于1902年占领了位于利雅得的奥斯曼要塞,并建立了至今仍存在的沙特王朝。新政权的突击部队,是极端虔诚的“伊赫万”,其字面意思是“兄弟”,由历经几百年沙漠劫掠和战争流血的贝都因人组成。1924年,围攻麦加的伊赫万军队屠杀了邻近城镇塔伊夫的400名居民,包括孕妇,吓得麦加人不战而降(见图15-1)。

    图15-1 伊赫万和麦加起义

    对伊赫万人来说,很不幸的是,第一次世界大战改变了中东政治格局。英国是一战的胜利者,现在英国基督徒隐隐出现在阿齐兹的北部边境,阿齐兹需要安抚他们。此外,要想成为伊斯兰圣地的合法守护者,他需要得到更广泛的伊斯兰世界的认可,不仅包括叛乱的什叶派,还包括苏非派和不太拥护他的逊尼派。因此,阿齐兹开始远离具有“瓦哈比思想”的伊赫万盟友。

    国王阿卜杜勒·阿齐兹热情地接受现代社会产品,特别是汽车和电话,这伤害了他与瓦哈比信徒之间的关系。瓦哈比信徒打算清除东部的什叶派,结果却被阿齐兹镇压。由于被阿齐兹的异端行为激怒,瓦哈比信徒中最保守的伊赫万人叛变;1927年,他们对科威特发动了一次袭击,却被另一个现代社会产品——英国军用飞机——羞辱。两年后,当时已经受够了伊赫万人的阿齐兹,开着装有机枪的汽车,从利雅得出发,向北驶向内陆绿洲斯巴拉。在那里,他要求伊赫万人投降,但骑着马和骆驼的伊赫万人拒绝投降,招致了阿齐兹的屠杀。[41]

    伊赫万叛乱的火焰被抑制,但并未完全熄灭。穆罕默德·本·赛义夫·乌特比是一位在斯巴拉大屠杀中幸存下来的伊赫万人;屠杀发生多年之后,1936年,他有了一个儿子,这个婴儿长着一张似乎总在愤怒的脸。沙特人喜欢粗俗易懂的名字,于是乌特比给他的儿子起名为朱海曼,其意思是“愤怒的脸”,后来的朱海曼也没有辜负这个名字。[42]

    朱海曼出生两年后,美国石油工人就在宰赫兰地区钻出了第一口喷油井,还参观了这个当时贫穷而虔诚的国家。这是一次伟大的自然经济实验,为阿卜杜勒·阿齐兹的后嗣和追随者带来了难以想象的财富。阿卜杜勒·阿齐兹有6个儿子,他们由其不同的妻子所生,自阿卜杜勒·阿齐兹1953年去世后,这些同父异母的兄弟一个接一个地统治着这个王国。

    这些儿子中第二个担任国王的是费萨尔。1962年,他废除奴隶制;1963年,他允许女孩接受教育;1965年,他将电视引入王国。这些都进一步激怒了瓦哈比信徒。10年后,费萨尔被一名王室成员暗杀,暗杀者的理由是他的亲属在引入电视所带来的暴乱中丧生。

    在沙特王国,精英们的儿子都可以加入陆军和空军,但是,更虔诚的伊赫万人被调往声望较低的国民警卫队。朱海曼成年后,在警卫队服了18年兵役,直到1973年才作为下士被调离。虽然平庸的国民警卫队的服役经历并没有提升他的社会或物质地位,但强烈的宗教倾向驱使他研究更卓越的事物,特别是伊斯兰教的末日论。

    从警卫队退役后,他在麦地那定居,并加入了一个瓦哈比组织:“指挥正确、禁止错误”的萨拉菲组织。该组织尤其受到阿卜杜勒阿齐兹·本·巴兹的影响。本·巴兹是一位才华横溢、魅力四射、有野心的伊斯兰教学者,自8岁起就双目失明,他反对沙特王国一头扎进现代社会。

    当时,王室尤其喜爱法国和西班牙的地中海式奢侈生活,这激怒了本·巴兹;本·巴兹还猛烈地抨击烟草、理发店和公共活动中的鼓掌行为。[43]在本·巴兹和其他伊斯兰教徒的精神指引下,萨拉菲组织直接在弗洛伊德的“微小差异的自恋”中建立了一套神学:信徒们开斋[44]不是因为日落,而是因为所有光明的消失。(不过,其允许通过拉上房间窗帘来加快开斋时间。)其祈祷时可以穿凉鞋,这一差别让其他穆斯林感到恼火。另外,他们的清真寺朝向麦加方向的墙上也未设有传统“圣龛”(即阿拉伯语中的“米哈拉布”)[45]。萨拉菲组织在沙特阿拉伯的大部分主要城市建立了分会,在许多地方有自己的专用建筑,并迅速建立了国际声誉,吸引了来自伊斯兰世界,特别是来自埃及和巴基斯坦的信徒。令萨拉菲组织懊恼的是,沙特君主制逐渐选择了本·巴兹,而本·巴兹不断演变的现实主义政治在他和伊赫万之间制造了一个楔子;尽管失明的本·巴兹严厉批评王室的现代化和自由放荡倾向,但他并没有质疑该政权的合法性。最终,政府任命本·巴兹担任著名而又有影响力的机构“高级学者委员会”的主席,其职责是每周都以该委员会主席的身份与国王一起出现在电视上(尽管电视曾使国王同父异母的兄弟遇刺)。从1993年起,本·巴兹还担任沙特大穆夫提[46],直到1999年去世。

    本·巴兹已经去过沙特君主国的首都利雅得,而此时萨拉菲组织的神学怪癖,尤其是它对王室的敌意,使它与本·巴兹曾经友好的关系恶化。1977年夏天,本·巴兹的副手在麦地那某个屋顶上召集萨拉菲组织开会,要求其放弃异端学说。萨拉菲的大多数成员都是20多岁的人,他们拒绝了这个要求,并在年长一点儿而又有魅力的朱海曼的领导下进行重组,他们以瓦哈比祖先的名字命名,成立了伊赫万组织。[47]

    1977年12月,也许是屋顶会议几个月后,政府逮捕了朱海曼的24名追随者;他们逃跑后,向本·巴兹求助。这位盲人教士接见了他们,并要求政府释放他们。[48]

    朱海曼则选择继续逃亡。几千年来,他的祖先一直靠进入沙漠来躲避拜占庭、奥斯曼、波斯和阿比西尼亚[49]的君主,他们依靠的是一种驯养的动物——骆驼,这种动物能够在险恶、几乎无水的环境中生存。自1977年逃脱后的两年里,朱海曼依靠贝都因人的遗传技能,成功地避免了在空旷的半岛内陆被抓。在这一过程中,他成为一个传奇人物,通常与3~5名追随者一起旅行,并安排与其他人的秘密会议;更多的时候,他只是从精神上参加这些秘密会议。有一次,他要去看望妈妈,最后一刻他收到警示,被告知警察正在监视他的家;另一次,他牙痛了很久,最后才找到一位不会向当局泄密的牙医。[50]

    朱海曼对本·巴兹的妥协很不满,并断绝了与他的联系。游历期间,朱海曼将自己沉浸在圣训中,特别是那些涉及马赫迪和末日的圣训。他从先知最著名的末日类圣训中获得灵感:

    末日不会到来,直到拜占庭人攻击阿马克或达比克。一支由地球上最优秀的人组成的穆斯林军队,将从麦地那前来阻止他们……然后战斗就会开始。1/3的(穆斯林)军队将认输;安拉之神永远不会原谅他们。1/3会战死;在安拉眼中,他们将是优秀的殉道者。还有1/3将战胜:他们将永远不会受到考验,他们将(继续)战胜君士坦丁堡。[51]

    达比克是叙利亚的一个城镇,阿马克是土耳其的一个山谷;伊斯兰国组织以前者命名其杂志,以后者命名其通讯社。在朱海曼的末日论中,麦加和麦地那取代了达比克和阿马克。

    为了触发末日,朱海曼需要一个马赫迪。令他高兴的是,他的沙特追随者之一被证明是马赫迪,这位追随者是一位浅肤色的超凡脱俗的诗人,有一双浅棕色的眼睛,名叫穆罕默德·阿卜杜拉·卡赫塔尼。诗人与朱海曼联手后,诗人的妹妹梦见自己的哥哥在大清真寺的院子里通过克尔白接受了拜伊尔(baya,即效忠的誓言)。在标准的伊斯兰教末日叙事中,这个梦是有意义的:和先知一样,卡赫塔尼是浅肤色的古莱西人,这是成为马赫迪所必须具备的条件。卡赫塔尼的左脸颊上也有一个胎记,这是一个意外收获,因为根据一条广为引用的圣训,马赫迪也有。这群人中的其他人,包括朱海曼本人,很快就做了同样的梦。

    梦在伊斯兰教中有特殊的意义,尤其是当集体经历时,因为安拉通过梦向先知传达了他的许多启示。(正如朱海曼的一位追随者所说:“我们做梦,证明我们更虔诚。”[52])卡赫塔尼与朱海曼越来越亲近,朱海曼甚至与自己的妻子离婚,然后娶了卡赫塔尼那位做梦的妹妹。[53]

    正如哈尔·林赛后来所说,这个巨大的拼图终于拼好了。现在,朱海曼不仅拥有了他的马赫迪,而且他对圣训的解读也确认了马赫迪接受拜伊尔(效忠)的精确地点,即在夏甲和以实玛利(分别是亚伯拉罕的妻子和儿子)的坟墓旁,在大清真寺院内的克尔白外面,这正是卡赫塔尼的妹妹所梦到的那样。朱海曼还揭示了接受拜伊尔的日期:根据逊尼派的传统,他预测,一位被称为“世纪更新者”的学者将出现在每个希吉来世纪的第一天:希吉来历1400年开始于1979年11月20日。因此,朱海曼及其追随者必须占领大清真寺,以便马赫迪在确定的日子、在上述克尔白旁边的地点接受拜伊尔。

    在沙漠流亡期间,朱海曼录制了录音带,并创作了《朱海曼的信》。在这些信中,他阐述了自己的神学思想和末日论。(他只接受过四年级教育;虽然不是文盲,但写作能力很差,因此“信”很可能是口述的。[54])沙特没有出版商会碰这些信,但最终一家科威特左翼出版社印制了两本单独的简编,分别是《七封信》和《四封信》,它们在半岛上广为流传。

    本·巴兹建议释放朱海曼的同伙,这是一个严重的错误;希吉来历1400年的第一天,朱海曼和大约300名追随者在大清真寺壮观地重新出现在公众视线中。[55]在过去的几天里,他们已经用由裹尸布(用来承载对死者最后祝福的一种传统)覆盖的担架私运了武器和供给。占领行动几乎没有带来流血事件,只在最初有两名没有武器的警察和一名助理伊玛目被杀。当朱海曼的手下鸣枪庆祝时,朱海曼从伊玛目手中抓起麦克风并大声喊道:“看,马赫迪!看,是正确的引导者!”[56]

    随后,朱海曼在楼上和宣礼塔上部署了狙击手,并让卡赫塔尼的哥哥赛义德出场。赛义德会说流利的古典阿拉伯语,他向人群宣布了马赫迪的存在。赛义德的演技令人印象深刻,特别是他向卡赫塔尼献上了拜伊尔,使一些战俘也加入他的行列,并使至少一名清真寺保安指挥官相信,那位面色苍白的年轻诗人确实是马赫迪。

    朱海曼释放了许多外国人,特别是那些不会说阿拉伯语的人。但是,由于叛军禁止数万名沙特及其他阿拉伯国家的朝圣者人质离开大清真寺,并指示他们拿起武器协助攻击,因此致命的混乱发生了。政府军和警察接近清真寺时,在距离不到半公里的地方,遭到火力攻击。

    叛军占领初期,有两个原因造成了政府的反应迟钝:首先,尽管全副武装的叛军向所有身穿制服的人开枪,但军队不愿还击,因为先知禁止携带武器进入麦加。其次,大量人质和政府军本身也担心卡赫塔尼可能真的是马赫迪。

    只有一个管理机构能够解决这一僵局,即由本·巴兹领导的乌莱玛(意思是宗教学者)或高级学者委员会。由于对王室的不虔诚、道德败坏和挥霍行为感到愤怒,这一威严的机构故意讨价还价:直到叛军占领的第五天,它才宣布卡赫塔尼为骗子,并为反击战祈福。作为交换,沙特国王哈立德同意重塑社会风气,尤其是禁止酒精和女性出现在电视上,这也是朱海曼呼吁的核心内容。

    在获得神学许可后,可怕的攻击开始了。政府军很快用反坦克导弹击退了尖塔狙击手,但主楼的叛军火力依然在,步兵无法进入清真寺。受伊赫万影响的国民警卫队,拒绝向自己的部落和神学兄弟开火,甚至在某些情况下还向对方提供武器,这使情况更糟。

    正规军取代了国民警卫队,但其在城市游击战方面的训练很少。直到军队将轰鸣的装甲运兵车开进清真寺,事情才有了进展。除了双方的损失之外,数百名甚至数千名朝圣者人质在交火中丧生。由于多次被告知是马赫迪,卡赫塔尼认为自己是无坚不摧的,不知怎的竟然真的在暴露的炮火中幸存了下来;他由此更加确定自己是永生的,开始向军队回掷手榴弹,直到运气最终耗尽——对方的一枚手榴弹几乎把他炸成碎片。叛军慢慢撤退到清真寺地下室,装甲车也进入了地下室,但在狭窄的通道里动弹不得。

    围攻陷入僵局。虽然确切数字从未公布,但袭击发生一周后,政府伤亡人数占全国三万军队和两万国民警卫队人员的很大一部分。哈立德国王需要寻求外国援助。约旦是唯一一个既与沙特关系友好又拥有可靠突击部队的阿拉伯国家,它主动提出援助。

    从沙特的角度看,其不能接受约旦的援助。在1924—1925年的战役中,包括1924年对塔伊夫城的残忍袭击,当时仍与哈立德的父亲阿卜杜勒·阿齐兹结盟的伊赫万军队,将现任约旦君主侯赛因的曾祖父哈希姆驱逐出了汉志王国,该王国包含麦加和麦地那;接受他们曾经鄙视的哈希姆人的援助意味着丢脸,因此他们无法接受。[57]

    因此,沙特王国被迫接受了一个不可思议的援助:在伊斯兰最神圣的地方,接受了来自基督教势力的援助。这将是圣训中提到的异教徒“北方军队”;它最终来了,但只是以微小而短暂的形式出现。德黑兰大使馆人质事件[58]发生后,哈立德认为美国卡特总统和中央情报局无能,因此决定向法国情报局寻求帮助。允许非信徒(更不用说基督教军队)进入麦加,这是极其敏感的,因此法国只派出了3名精英特工,他们携带大量的先进武器,其中包括数百磅先进的麻醉气体。

    20世纪60年代,大清真寺进行了大规模翻修和扩建,其建筑平面图在这次袭击计划中发挥了至关重要的作用。该平面图由负责这一庞大工程的建筑大亨穆罕默德·本·拉登绘制。1967年他去世后,他的儿子塞勒姆接管了公司。塞勒姆带着平面图赶往清真寺,和员工一起在清真寺地板上钻了几个洞,通过这些洞把法国毒气罐扔到了叛军所在的地下室里。但这一战术只是暂时有效,因此沙特人最终被迫对叛军所在的地下室发动了一场由法国人设计并协同的直接进攻,其残忍程度难以想象。[59]

    14天后,也就是12月4日,围攻结束。几千名参战人员和人质死亡。至少有100名军人被俘,包括垂头丧气的朱海曼。医生们检查了这些囚犯;如果肩部疼痛或有瘀伤,这就表明其曾经主动开枪。医生们通过这种方式找出了69名囚犯,他们被公开斩首,名列榜首的是朱海曼。其他一部分人被沙特秘密处决,剩余的被判长期监禁。官方公布的叛军、军队和人质的死亡人数是270,但没人相信这一数字。[60]

    朱海曼的行为,主要是由他的末日幻想驱动的。但是,随后对幸存追随者的采访清楚地表明,许多人并不相信他的末日神学,而只是出于对他的尊重、在口头上表示相信;还有一部分人是因为参加该行动可以推动他们的政治目标。无论如何,在围攻的第三天,当他们认为的无坚不摧的卡赫塔尼被手榴弹炸死时,即使是那些相信朱海曼的末日预言的人也丧失了信心。[61]事实仍然是,如果末日信念不存在,大清真寺围攻事件就不会发生。

    和1927—1930年的伊赫万叛乱被镇压一样,沙特人成功镇压了1979年的这场伊赫万叛乱。但事情并没有结束。在未来几十年中,全球冲突之风将把大清真寺围攻事件的余烬带到王国边界之外。这一次,新技术将使朱海曼的继承人有能力将火焰扇得比1979年更强烈、更明亮。甚至在清除清真寺的血迹和碎片之前,这些余烬就开始燃烧得更亮。在沙特军队处理了朱海曼的最后一批叛军3周后,苏联军队入侵了阿富汗。这不是巧合;从美国对1979年德黑兰大使馆人质事件的反应,以及沙特大清真寺围攻事件和半岛东部的一场什叶派叛乱中,苏联人感觉到了美国和沙特君主国的衰落。

    苏联入侵阿富汗被证明是一个灾难性的错误;阿富汗成为吸引新一代圣战者的磁石。其中许多人是朱海曼的支持者和拥护者,朱海曼在阿富汗圣战者营地中具有传奇性地位。美国放弃了对中东的不干预政策,积极支持伊斯兰世界的武装分子涌入阿富汗。其中一名战士是翻修和扩建大清真寺的建筑大亨的儿子,他就是年轻的奥萨马·本·拉登。他的哥哥提供的建筑图,在夺回大清真寺的过程中发挥了重要作用。

    大清真寺围攻事件后,一名居住在科威特的巴勒斯坦人伊萨姆·巴卡维(后来改名为穆罕默德·迈格迪西)发现了朱海曼的信,并找到了该国的萨拉菲组织分支,该分支为该教派的逃犯提供了避难所。随后,迈格迪西去麦地那进行宗教研究,并在随后的几年里周游了沙特阿拉伯和约旦,然后抵达了巴基斯坦的白沙瓦——这里是进入阿富汗(当时已被苏联占领)的主要门户。在每一站,他都寻找朱海曼的追随者。迈格迪西对朱海曼的传说如此着迷,他模仿朱海曼的外貌,留起了长发和乱胡子,并宣称与这位伊赫万英雄没有血缘关系。[62]

    最终,迈格迪西在约旦定居,并在1995—2014年频繁进出监狱。他为今天的圣战奠定了思想基础。在这方面,任何其他的穆斯林思想家都比不上他。圣战学者们最近的一项研究表明,穆斯林末日文学中引用最多的激进伊斯兰主义者就是迈格迪西,他自成年后就将自己沉浸在《古兰经》和圣训中。[63]

    在1995—1999年第一次进入约旦监狱服刑期间,迈格迪西指导了一个名叫阿布·穆萨布·扎卡维的约旦小罪犯。两人都在1999年被释放,之后在空间和神学上都分开了。迈格迪西留在了约旦,虽然他有时批评极端的同伴,但他确信一件事:虔诚的穆斯林有义务前往叙利亚参加即将来临的与达加尔之间的末日之战,如果不去叙利亚,就去也门。他的学生扎卡维则逃往了阿富汗,并发展出一种偏执而凶残的思想意识,尽管后来扎卡维死了,但这种意识形态一直持续到今天。

    扎卡维有一种诡异的本领,他总是能在美国的军事行动发生之前到达该地区,首先是阿富汗,在他从阿富汗逃出后又是伊拉克。在伊拉克,他几乎独自写下了暴力圣战剧本,包括自杀式袭击、绑架和斩首西方人,他还擅长通过网络招募新兵。

    2004年,扎卡维参加了位于法鲁贾[64]的两次战役,并宣布效忠于奥萨马·本·拉登。到此时,迈格迪西已经拒绝了朱海曼的末日论,但扎卡维没有,而且随着萨达姆·侯赛因军队的迅速战败,扎卡维的宣传越来越采用末日论的基调。在早些时候,他已经认识到末日式的宣传能够吸引新兵。这一经验后来被伊斯兰国采用,从而引发了一个恶性循环:战场形势越糟糕,基调就越末日式,就会吸引更多的新兵,从而产生更多的战场伤亡。

    扎卡维从未忘记他的首要目标,即推翻约旦君主国。约旦君主国于1994年与以色列签订了和平条约。扎卡维将约旦人描述为“犹太复国主义者的奴隶”,经常用预言性术语“腐败的统治者”来形容约旦国王阿卜杜拉二世。扎卡维还鄙视什叶派及其伊朗[65]权力中心,他经常引用一些诋毁什叶派的古老预言,特别是与636年阿拉伯军队在卡迪西亚击败波斯萨珊帝国有关的预言,以及将后来的波斯伊斯兰[66]与可恨的蒙古人联系在一起的预言。很明显,扎卡维并没有把犹太人看作达加尔,对他来说,什叶派是达加尔,美国侵略者也是达加尔;谋杀什叶派和美国侵略者,不仅在神学上是必要的,而且还有额外的收获,即可以引发一场教派战争,加速末日的到来。

    末日类文学中有很多关于早期穆斯林与拜占庭人斗争的内容,扎卡维充分利用了这些文学。扎卡维提到美国军队时,使用了古代表示拜占庭人和西罗马人的一个缩写:rum。(相比之下,基地组织对以美国为首的部队使用了同样指责性的标签:“十字军”。)只要有可能,扎卡维就会把先知的战斗比作自己的战斗。他特别喜欢著名的《苏瓦班圣训》,在这部圣训中,先知告诉他的追随者,“各国将从各个方向蜂拥而至,就像饥饿的人们涌向水壶一样”。他认为伊拉克2005年的民主宪法是一场灾难,为了安慰自己,他引用了布哈里圣训,即使正义被击败,“通过这种方式,信使们也受到了考验,然后他们最终会胜利”[67]

    扎卡维的自杀式爆炸、斩首和对无辜生命的漠视,最终甚至使他的组织成员也疏远了他。组织成员可能泄露了扎卡维的“精神导师”谢赫·阿卜杜勒-拉赫曼的所在地,这使满载炸弹的美国F-16战机在2006年6月7日找到了扎卡维。[68]

    扎卡维还谈到了重建哈里发政权的问题。最后一个哈里发政权已经在1924年被土耳其废除。但扎卡维最终放弃了重建哈里发政权这一目标,因为一个合法的哈里发政权需要领土,以及人民的支持。重建哈里发必须要等待;因此扎卡维和奥萨马分别在伊拉克和阿富汗宣布了一个地位稍逊的实体——“酋长国”。

    酋长国和哈里发之间有很重要的差异;酋长国统治有限的领土,而哈里发不仅统治所有穆斯林,还意味着末日的来临。扎卡维认为世界末日即将到来,但他认为世界末日还没有到来。尽管如此,末日的确切日期和哈里发问题,还是使奥萨马在阿富汗的“基地组织中心”的行动与扎卡维在伊拉克的行动分道扬镳。2006年,扎卡维在空袭中丧生之前,命令追随者宣布成立伊拉克伊斯兰国。他的组织在4个月后的2006年10月15日这样做了,这令基地组织目瞪口呆,基地组织认为没有控制领土而宣布成立一个新国家是愚蠢的。

    基地组织和伊拉克伊斯兰国之间的分裂,在某种程度上类似于主流基督教徒和福音派新教徒之间的分裂。高雅而受过良好教育的圣公会教徒和长老会教徒,看不起他们的同宗——时代论教徒,他们认为时代论的末日猜测是未经洗礼的人的胡言乱语;同样,享有特权的奥萨马也蔑视扎卡维愚昧的末日论,认为他是一个几乎不识字的小流氓。尽管奥萨马是个恐怖分子,但他是个贵族。他的父亲穆罕默德·本·拉登是那个地区特有的族长,来自也门,成年后最初在麦加的港口城市吉达做搬运工,最终成为沙特王室的建筑总承揽商;今天,沙特本拉登集团是世界上最大的建筑承包公司之一。老拉登娶了不少于22个女人,有54个孩子,其中第17个是奥萨马,奥萨马的母亲15岁时生下了他。

    奥萨马出生后不久,他的父母就离婚了。老拉登让奥萨马的母亲嫁给了一位公司高管,这位高管成为奥萨马的继父。尽管奥萨马已不在父亲的屋檐下,但他和父亲保持着松散的联系;更重要的是,这个年轻人享受着父亲的庇护,包括在多个私立机构接受精英式教育,最重要的是吉达著名的塔格学校,该学校当时是阿拉伯民族主义和伊斯兰教意识形态的温床,其中的伊斯兰教意识形态正是年轻的奥萨马所接受的。1967年,奥萨马10岁时,他的父亲死于飞机失事;1979年,他从阿卜杜勒阿齐兹国王大学毕业,之后开始参与家族的建筑生意。同年,苏联入侵阿富汗,去阿富汗从事人道主义工作或与圣战者一起作战,成为沙特年轻人中的一种时尚。最初,奥萨马是被公司派往那里的,后来,他把事业从建筑转到圣战。[69]

    对出身高贵、有工程头脑的奥萨马·本·拉登来说,圣战是一件有条不紊、需要冷静头脑的事情,而不是一件救世主式的事情。仅举一个例子,他后来向持有末日思想的索马里青年党发出警告:气候变化对伊斯兰教干旱家园的威胁不亚于外国军队,并建议他们种植耐热树。阿拉伯学者威廉·麦坎茨说:“如果你不知道他管理着世界上最臭名昭著的恐怖组织,那么你会认为他是美国国际开发署的一名官员。”[70]

    奥萨马还有另一个不相信扎卡维的末日论的理由。1979年他毕业那年,他哥哥塞勒姆凭借大清真寺修缮平面图,参与了夺回大清真寺的行动。[71]奥萨马一家目睹了当考虑不周的末日计划与现实世界的地缘政治力量相碰撞时会发生什么,尤其是当末日计划者对地域既没有政治控制也没有军事控制时。

    基地组织的首要任务是打击“远敌”美国,并将其军队赶出沙特阿拉伯和中东。“9·11”袭击导致了恰恰相反的结果。奥萨马·本·拉登对中东“近敌”的战略是推翻其腐朽的领导,这需要一种“心灵与智慧”的方法,需要避免自杀式炸弹袭击、斩首,以及避免对什叶派的大规模屠杀。而他的更狂热的伊拉克追随者们正在犯这些错误。

    近敌和远敌的概念是由埃及伊斯兰教徒穆罕默德·阿卜杜勒·萨拉姆·法拉杰创造的,他认为“近敌”是埃及政府,“远敌”是以色列。埃及外科医生艾曼·扎瓦希里又引用了这两个术语,他后来成为本·拉登的副手。1982年,法拉杰因参与暗杀萨达特被埃及人处决,而2011年奥萨马·本·拉登被杀后,脾气暴躁、缺乏激情的扎瓦希里继承了基地组织的领导权,并和奥萨马·本·拉登一样,蔑视世界末日论。

    伊拉克伊斯兰国没有建立哈里发政权,但在2006年,其名义上的执政机构“圣战者协商委员会”任命了一位没有名气的人担任“忠诚信徒的指挥官”,他就是阿布·奥马尔·巴格达迪。巴格达迪自称是先知的后裔,因此在技术上有资格成为哈里发,但他所谓的先知血统很可能是假的。他的真名是哈米德·扎维,曾是一名警察、电子修理工,是一个没有什么学识或声望的伊玛目。事实上,扎卡维的埃及弟子阿布·阿尤布·马斯里负责运营伊拉克伊斯兰国的机构。

    同年早些时候,伊拉克伊斯兰国选择了黑色旗帜作为其象征,上面有先知的印章和“除了造物主之外,世上没有别的神灵,穆罕默德是造物主的使者”的铭文。由于末日圣训预言中提到了“来自呼罗珊的黑色旗帜”,伊拉克伊斯兰国旗帜的末日征兆再清楚不过了。[72]

    在因冲突和贫困而四分五裂的伊斯兰世界,伊拉克伊斯兰国出现了一条丰富的矿脉。调查数据显示,世界上期望末日来临的穆斯林甚至比基督教徒还要多。皮尤中心的一项研究发现,51%的中东穆斯林相信马赫迪即将回归,这一比例在被入侵后的伊拉克可能更大。[73](与其他宗教信仰的社会学数据一样,国家越贫困,信仰越强烈;南亚穆斯林的这一比例为60%,而巴尔干穆斯林的这一比例仅为18%。)[74]不管是有意还是无意,伊拉克伊斯兰国采用的末日叙事远比奥萨马·本·拉登陈旧的萨拉菲神学以及奥萨马·本·拉登的继承人、缺乏激情的扎瓦希里的神学更有说服力。

    如果还有人相信马赫迪即将到来,这个人就是伊拉克伊斯兰国的实际领导人马斯里。为了加快马赫迪到来的进程,他让部队修建讲坛,供马赫迪在麦地那、耶路撒冷和大马士革的3座著名清真寺之间穿梭。马斯里还需要征服并控制领土,以加速马赫迪的到来。对于怀疑者,他给出了这样一个简单的回答:“马赫迪随时都会来。”[75]

    马斯里用热情和坚定的宗教信仰,为一系列比扎卡维犯下的暴行更严重的暴行辩解。伊拉克伊斯兰国不仅屠杀什叶派教徒,还屠杀任何拒绝效忠的逊尼派教徒;用妇女和儿童做人盾;炸毁房屋和医院。它广泛实行“哈杜德”[76]:用石头砸死通奸者,给偷窃者截肢,对饮酒者施行鞭刑。有一次,伊拉克伊斯兰国斩首了一名8岁的女孩。

    随着伊拉克伊斯兰国杀戮升级的报道传到阿富汗的基地组织,奥萨马·本·拉登和扎瓦希里试图收回他们在伊拉克的控制权,但对方一直拖延。[77]美国官员惊奇地发现了马斯里严重的战略战术错误,并将取他性命的奖金从500万美元降至10万美元;一些分析人士猜测,他只是一名戏剧演员。或许,他的妻子对丈夫的固执、笨拙的暴行所做出的描述最为简洁:“你说的伊拉克伊斯兰国在哪里?我们生活在沙漠中!”2010年4月18日,伊拉克和美国联军在提克里特(萨达姆·侯赛因的家乡)附近联合袭击了马斯里和巴格达迪,将他们逼到了绝境,最后他们引爆了自己。[78]

    尽管失败了很多次,伊拉克伊斯兰国还是再次发现了一个林赛、莱希和詹金斯所熟知的真理:末日叙事很叫座,而且越血腥越好。到了21世纪,通过网站和社交媒体,伊拉克伊斯兰国可以向全世界宣传世界末日。其中最常见的宣传品是简单的新闻稿:

    一个勇敢无畏的兄弟,伊拉克伊斯兰国的英雄之一,殉难者旅的成员……在迪亚拉省马弗里克区的耶路撒冷十字路口,驾驶一辆装满炸药的汽车冲进了美国十字军的指挥场所。我们这个英勇的兄弟高呼“最伟大的真主”并引爆了汽车……杀死11名士兵,摧毁两辆布拉德利装甲战车。[79]

    互联网不仅可以广泛传播文字材料,还可以传播更引人注目的视频。“十字军”部队遭受袭击的视频片段,在中东和西方的伊拉克伊斯兰国的支持者中受到欢迎,这些视频通常从多个角度拍摄;其中的一段美国卡车被简易爆炸装置炸毁的视频,其标题是“他们的最后时刻”。网上还有一些较长的视频,包括“精选”的袭击汇编、殉道者传略、计划-执行纪录片和充满煽动性的剪辑组合。美国和伊拉克军队也不是唯一的对象,事实表明,以处决什叶派囚犯为主题的视频尤其受到欢迎。[80]

    早在2008年,经奥萨马·本·拉登授权的基地组织也门分支——阿拉伯半岛基地组织就已经通过两个杂志《战争的回声》和《激励》推进伊斯兰教的末日宣传。其中《激励》是一本英语杂志,其经营者是萨米尔·汗,是一个在美国北卡罗来纳州长大的巴基斯坦人,他擅长使用一些吸引人的文章标题,如《在你妈妈的厨房里制作炸弹》;2010年左右,他开始为《激励》写一些末日类的文章。

    汗是一位伊玛目的门徒。这位伊玛目极具魅力和影响力,是一位在美国长大的也门裔美国公民,名叫安瓦尔·奥拉基,他在一篇文章中庄重地写道:

    穆贾姆·卡比尔和其他人从伊本·阿拔斯[81]的传述中得知先知的话:“一支12000人的军队将从亚丁-阿比杨(也门)出现。他们将给安拉和他的使者带来胜利。他们是我们中最好的!”

    关于上面那条圣训,可敬的谢赫·苏莱曼·伊本·纳西尔·乌尔万——愿安拉保佑他早日被释放——说,圣训传述链条很好,传述者是可以被认同的。[82]

    奥拉基没有对上述第一段话进行分析,而是在第二段中引用了一位更权威的学者的观点。他是一位享有盛名的、被监禁的沙特伊斯兰神学家,名叫苏莱曼·伊本·纳西尔·乌尔万,他为圣训传述链条的可信度提供了担保。[83]

    奥拉基充满启示性的末日文章、讲座和视频激励了一系列恐怖袭击。其中一些袭击是由与他有过私人接触的门徒,甚至可能是他亲自指导的门徒发动的,比如“内裤炸弹手”奥马尔·法鲁克·阿卜杜勒穆塔拉布。而其他袭击则是远方的人受到他的鼓舞,比如胡德堡枪击案的罪犯纳达尔·马利克·哈桑,哈桑曾是一位与他发过电子邮件的美国陆军精神科医生;还有时代广场的炸弹手费萨尔·沙赫扎德,其自称只是奥拉基的“粉丝和追随者”[84]

    最终,阿拉伯半岛基地组织走上了一条与伊拉克伊斯兰国相同的、毫无意义的暴力之路;这是阿富汗上级基地组织所反对的。此时奥萨马·本·拉登已经被杀,基地组织的指挥权已经移交给扎瓦希里。最终,阿拉伯半岛基地组织未能保护好辖域内的人民。2011年9月30日,美国在也门发动了一次引发争议的无人机袭击,杀害了萨米尔·汗和奥拉基——两个都是美国公民。可悲的是,另一次无人机袭击造成了奥拉基16岁的儿子阿卜杜拉赫曼的死亡,这可能是个意外;2017年1月29日,一次灾难性的海豹突击队袭击又导致一名突击队员和奥拉基8岁的女儿死亡。[85]

    到2010年,伊拉克伊斯兰国似乎已经岌岌可危。但是,当奥巴马政府初期美国从伊拉克撤军、只留下了小部分骨干训练师和顾问时,情况又有所改变。美国支持的伊拉克总理努里·马利基,是一位高度党派化的什叶派政治家,其镇压性策略甚至将温和的逊尼派也推向了伊拉克伊斯兰国的阵营。

    2010年5月,即马斯里和阿布·奥马尔·巴格达迪死后一个月,一位名叫阿布·巴克尔·巴格达迪的机会主义者和伊斯兰学者,担任了伊拉克伊斯兰国的领导人。[86]关于他,几乎没有什么确切的信息,据说他的直系亲属是先知的后裔,但都已经失踪。他似乎是一个富有书卷气的年轻人,由于视力差而无法加入萨达姆的军队,很早就有“信徒”的绰号。他全身心投入《古兰经》和圣训中,目前尚不确定他有没有在巴格达获得萨达姆大学伊斯兰研究专业的博士学位。该大学由独裁者建立,用于拉拢宗教权势。

    除了伊斯兰教经文,“新巴格达迪”还有另外两个爱好:他擅长的足球和公共道德准则的执行。据说他脾气暴躁,可能是因为射门失败或看到不同信仰的夫妻在婚礼上跳舞。

    2003年美国入侵后不久,巴格达迪由于组织了一个不知名的抵抗性组织,于2004年2月在费卢杰被捕,被关进“布卡营”监狱。那里关押着2.4万名囚犯,被一位观察者称为“事实上的恐怖分子大学”,巴格达迪在狱友中很受欢迎。圣战分子们在布卡营交换思想,建立关系,并在拳击短裤的松紧带上写下彼此的联系方式。被释放后,他们会立即脱掉衣服,从短裤上剪下关键信息,并用其来重整和建立组织。

    巴格达迪迷惑了美国人,使自己提前获释,之后他几乎立即与扎卡维的部队取得了联系。作为一名宗教学者,他对伊拉克伊斯兰国来说很有价值。对于伊拉克伊斯兰国的石头砸死通奸者,窃贼截肢,屠杀什叶派和其他叛徒等残暴运动,他可以为其提供神学掩护。2007年,他不再做这些,前往巴格达参加博士论文答辩。

    2010年4月马斯里和阿布·奥马尔·巴格达迪的死亡,为布卡营的校友们空出了领导人的位置,而阿布·巴克尔·巴格达迪凭借其个人魅力、学术声誉、在布卡营的人脉以及所谓的古莱西血统位居榜首。[87]

    在接下来的几年里,美国在伊拉克的影响力不断减弱,巴格达迪得以在全国扩大影响力,其影响力甚至进入了叙利亚。2013年4月,他宣称拥有基地组织在叙利亚的统治权,这让此时由扎瓦希里控制的基地组织中心大吃一惊,扎瓦希里将伊拉克伊斯兰国踢出了组织。在叙利亚内战如火如荼之际,总统巴沙尔·阿萨德实际上站在伊拉克伊斯兰国一边,有选择地轰炸其对手,让伊拉克伊斯兰国几乎不受影响。

    到6月中旬,伊拉克伊斯兰国已经占领了伊拉克第三大城市摩苏尔。巴格达迪发现,自己现在掌控了一个辖域,这一辖域覆盖了叙利亚和伊拉克之间的边界,这一边界是由臭名昭著的1916年《赛克斯-皮科协定》划分的。[88]伊拉克伊斯兰国命运的转变震惊了西方联盟;就在6个月前,奥巴马总统告诉记者戴维·雷姆尼克,“如果业余队的队员穿上湖人队的队服,那么这并不意味着他们就是科比·布莱恩特”。尽管奥巴马特别提到了基地组织袭击美国领土的能力,但他的时机再糟糕不过了。[89]

    正如哈尔·林赛和朱海曼一样,对伊拉克伊斯兰国来说,“大拼图”几乎已经就位:世界处于道德和政治混乱之中,一个由先知后裔统治的无国界王国——哈里发政权,无疑就在眼前。唯一需要的是哈里发的神学基础。

    一位名叫图尔基·比纳利的圣战学者完成了这项任务。这位来自巴林的神学家如此令人敬畏,足以被看作迈格迪西的继承人。和他的老师一样,他频繁进出监狱。2014年初,当伊拉克伊斯兰国在叙利亚集结力量时,他到达叙利亚,见证了哈里发政权的诞生:“已经到达了一个有着史诗般战役和战争的地点——叙利亚,难道我们还会回去吗?……这里是伊斯兰,这里就是我的家;这里是我的住所,我属于这里。”[90]

    但他的导师迈格迪西肯定不相信哈里发政权即将到来。令迈格迪西懊恼的是,比纳利很快就写了一篇题为《伸出你的手,把拜伊尔交给巴格达迪》的文章。[91]

    2014年6月29日,斋月的第一天,巴格达迪宣布重建哈里发政权,他本人就是哈里发易卜拉欣。5天后,这位从未在公众集会上出现过的哈里发,登上了新占领的摩苏尔努里大清真寺的讲坛,戴黑色头巾,身穿黑色长袍,谦卑地接受了领导权,然后要求全世界穆斯林服从他的领导。除了经典的神职装束外,他还戴着一块高级圣战分子钟爱的、显眼而昂贵的手表,该手表除其他功能外,还每天5次提醒祈祷。[92]

    此后,伊拉克伊斯兰国领导层决定将组织简称为伊斯兰国。几周后,伊斯兰国宣传人员出版了第一期《达比克》,文章标题为《哈里发制度的回归》:哈里发重生。《达比克》最初只在暗网[93]上发布,2014—2016年,一共发布了15期,这些内容现在可以从互联网上免费获得。[94]

    到2015年底,约有3万名来自至少86个国家的外国战士前往伊拉克,加入了伊斯兰国,其中约1/6来自西方国家。[95]与奥萨马·本·拉登冗长、晦涩难懂的阿拉伯语公报形成鲜明对比的是,《达比克》初期的英语、法语和德语版本(目标为潜在的西方新兵,特别是那些对伊斯兰教末日论缺乏深刻理解的新兵)。

    其中充满了与西方之间的即将来临的末日大决战预言性典故,从最著名的末日圣训开始(见图15-2)。其中提到,“直到罗马人在阿马克或达比克登陆,末日才会确定”,并且耶稣将回归,在他面前,敌人“会像盐一样在水中融化”。对于那些仍然不理解预言含义的人,杂志提供了一个缩略版本:

    图15-2 伊斯兰末日地标

    根据圣训,在征服君士坦丁堡和罗马之前的战斗中,达比克及其周围地区会扮演重要角色。目前,达比克由十字军支持的萨赫瓦(逊尼派傀儡)控制,靠近其与哈里发之间的战争前线。[96]

    很快,伊斯兰国将通过占领象征性意义重大、战略上次要的达比克城来实现这一预言。按照伊斯兰国的说法,由来自全球各地的战士组成的伊斯兰国军队将重建哈里发政权,并恢复伊斯兰教在世界上的正确地位:“很快,在真主的允许下,穆斯林将以主人的身份自由行走,享有荣誉,受到尊敬,昂首挺胸,保有尊严。”[97]

    虽然英雄和反派的身份不同,但该杂志的摩尼教式世界观与林赛和莱希几乎相同:

    事实上,今天的世界被分为两大阵营和两条战壕:伊斯兰和信仰者的阵营,库夫尔(不信仰者)和伪善者的阵营。目前没有第三阵营。或者说,穆斯林和圣战者的阵营,犹太人、十字军及其盟友,以及库夫尔的其他国家和宗教阵营。其中第二个阵营由美国和俄罗斯领导,并被犹太人鼓动。[98]

    这个预言之后是逊尼派遭受到暴行和处决什叶派肇事者的残忍画面,前一种画面是为了引起支持者的同情,后一种画面是为了在反对者中制造恐惧。随后是人们对哈里发易卜拉欣的热情洋溢的描述。奇怪的是,杂志中还出现了美国国家安全委员会相貌出众的官员道格拉斯·奥利万特的照片,照片中他站在卡托研究所[99]的讲台后面,旁边还有他对伊斯兰国可怕能力的描述性文字。[100]该杂志随后列出了伊斯兰国通往胜利的五步路线图,从“迁移”(即移民到伊斯兰国领土)到“哈里发政权”。

    奇怪的是,马赫迪在大清真寺围攻事件中扮演了如此重要的角色,现在却基本上不被提及。原因并不确定;也许马赫迪的出现需要一个日期,因此很容易让人失望;也许他在1979年围攻中的灾难性结局使他贬值了。因此,伊斯兰国叙事更多地聚焦于先知耶稣[101]战胜达加尔。[102]

    “迁移”到伊斯兰国领土的西方人,通常不会说阿拉伯语,也没有受过军事训练,因此几乎没有什么用处。但有一种例外:那些有媒体经验的人。伊斯兰国制作的一段13分钟的视频中,有多名来自欧洲和澳大利亚的圣战分子赞美哈里发的辖地:“我们没有边界,我们参加了在叙利亚的战争,一段时间后我们将前往伊拉克,在那里战斗,然后回来。我们甚至将前往约旦和黎巴嫩,这都没问题。”另一段视频显示了一名伊斯兰国战士吹嘘攻击以色列,痛惜“我们在费卢杰的姐妹们”所生的畸形婴儿。还有一段视频则传达了一句妙语——放弃你在西方的“肥差事”,“问问自己,是什么阻止了你?是什么让你落后?是你的财富”[103]

    圣战主义媒体专家巧妙地使用了通往大脑边缘系统的捷径——音乐,就像莱尼·里芬斯塔尔的《意志的胜利》或者美国总统竞选广告中那样。由于虔诚的穆斯林回避乐器,因此伊斯兰曲调以催眠般的无伴奏合唱歌曲《纳希德》,来赞颂即将到来的哈里发政权,并规劝信徒殉道。

    《纳希德》在多起伊斯兰恐怖袭击中扮演了重要角色。例如,2013年,察尔纳耶夫兄弟制造了致命的波士顿马拉松爆炸案后,由于他们的苹果手机无法连接所劫持车辆的立体音箱,无法收听激进纳希德的声音,于是他们冒着风险开车返回丢弃的汽车里,取回他们的CD。安瓦尔·奥拉基对于圣战音乐的魅力印象特别深刻:“一个好的纳希德可以传播得如此之广,可以吸引那些你无法通过演讲或书籍接触到的听众。”[104]

    许多年轻人在西方过着与周围格格不入的、没有目标、似乎毫无意义的生活,他们被这场建立在有着1400年历史的末日叙事基础上的大冒险吸引。最近的圣战新兵中有高比例的欧洲新皈依者,这就是明证。[105]正如一名叙利亚逊尼派叛军对路透社记者所说的那样,“如果你认为所有这些圣战者都是从世界各地来攻打阿萨德的,那你就错了。他们都是按照先知的承诺来到这里的。这是先知承诺的战争,一场伟大的战争[106][107]

    正如心理学家蒂莫西·布罗克和梅拉妮·格林指出的那样,叙事越有力,就越能腐蚀人类的批判性思维。对已经厌倦了西方主导的世界、与西方生活格格不入的新兵来说,伊斯兰国的叙事足够强大,足以在种族大屠杀、强奸和奴役等方面为他们提供神学掩护。

    2014年8月,伊斯兰国占领伊拉克北部后,辛贾尔省的很多伊斯兰教雅兹迪派成员发现自己处于伊斯兰国的统治之下。2014年10月11日出版的第四期《达比克》不仅使迫害该教派合理化,还将此迫害美化为鼓励信徒参与种族驱动的大规模奴役、强奸和谋杀的手段。

    雅兹迪人相信安拉把世界托付给了7位天使,其中最重要的是他们特别尊敬的孔雀王。《达比克》中提到,这样的异端邪说使雅兹迪人成为多神教徒或异教徒:“他们的信条如此离经叛道,连基督教徒都认为他们是魔鬼的崇拜者和撒旦教徒。”《达比克》中提到,关于多神论者,《古兰经》中讲得很清楚:

    那么当禁月过去,无论你们在哪里发现多神教徒,都要杀掉他们,俘获他们,包围他们并在各处埋伏等待着他们。但是如果他们悔悟并立行礼拜和完纳天课(穆斯林缴纳的税款),你们就任他们自由。的确,安拉是宽恕的、仁慈的。

    与基督教徒和犹太人不同,伊斯兰教义认为“有经者”[108]可以通过上缴“人头税”(非穆斯林缴纳的税款)而受到保护。伊斯兰国将雅兹迪人视为异教徒。但伊斯兰国的神学家们争论雅兹迪人究竟一直是异教徒,还是最初是穆斯林,后来成为叛徒。这一区别至关重要,因为叛教的妇女必须得到与叛教男子相同的选择——皈依或死亡,而一直是异教徒的妇女可以被奴役。

    《达比克》中提到,伊斯兰国认定雅兹迪人一直是异教徒,因此他们的妇女应该做奴隶。但安拉是仁慈的,不允许他们的性奴与其孩子分离。更妙的是,根据一条圣训,当“奴隶女孩生下她的主人”,这就是末日的标志。对这句话的解释模棱两可,也许是指主人的孩子成了主人,或者奴隶数量的增加本身就是末日的标志,或者是指末日时男人会放弃婚姻、与妾相处。但无论如何,根据《达比克》的说法,带走非信徒的女性“是由伊斯兰教法所确立的,如果有人拒绝或嘲笑,那么他就相当于否认或嘲笑《古兰经》的经文和先知的叙述,背离伊斯兰教”[109]

    因此,伊斯兰国让雅兹迪人皈依;伊斯兰国的士兵经常在拒绝皈依者的家人面前割断他们的喉咙或砍掉他们的头。4/5的妇女和儿童被分配给伊斯兰国的士兵,其余1/5被送到基地,被关押的妇女经常遭受轮奸。许多雅兹迪人设法逃走了,但结果是被饿死。截至2017年,根据联合国估计,伊斯兰国组织已经杀害了3000名雅兹迪人,劫持了7000人。[110]

    从2014年中开始,伊斯兰国在全世界范围内直接或煽动制造了多场袭击。最引人注目的是,2015年11月13日,巴黎巴塔克兰音乐厅和其他地点的屠杀造成130人死亡,530人受伤;2016年7月14日,法国尼斯地区的国庆日卡车袭击事件造成84人死亡,458人受伤。据估计,截至2019年8月,伊斯兰国在叙利亚和伊拉克境外直接或煽动制造的袭击夺走了3800多人的生命。[111]

    2014年中,巴格达迪升级为哈里发易卜拉欣时,基本是伊斯兰国的巅峰时刻。当时的伊斯兰国有约800万人口、大量武器储备以及油田和炼油厂的收入。之后,它在伊拉克和叙利亚的胜利以及在世界范围内开展恐怖活动的能力,引起了西方的军事反应,再加上伊斯兰国的极端残暴以及伊拉克总理马利基被更具调和倾向的海德尔·阿巴迪[112]取代,伊斯兰国对逊尼派的影响有所减弱。从2016年10月起,越来越强大的伊拉克政府军队,在美国领导的空袭和库尔德武装的协助下,逐渐收复了摩苏尔地区,并在2017年1月下旬以灾难性的方式夺回了摩苏尔城市东段。可能有超过10000名平民和大约1000名联军部队成员在袭击中丧生;仅这一次行动中就有多达16000名伊斯兰国战士被杀,至此,伊斯兰国已经大不如从前了;2019年10月26日,美国特种部队在叙利亚西北部突袭,巴格达迪被逼入绝境,他引爆了一件爆炸背心,将自己和他的两个孩子炸死。[113]

    在与伊拉克伊斯兰国/伊斯兰国的整场冲突中,伊拉克政府军和以美国为首的外国军队可能杀害了多达6万名伊斯兰国战士。伊斯兰国在战场上的形势逆转,削弱了它在欧美地区策划和煽动恐怖袭击的能力,尽管它仍然能够在中东和亚洲地区发起一些骇人行动。《达比克》于2016年停止出版,到2018年初,它的宣传流量已经下降了约2/3。

    正如许多伊斯兰末日论的观察家预测的那样,早在2014年中,伊斯兰国就停止了继续扩张;它已经控制了伊拉克和叙利亚的逊尼派腹地,基本不打算进一步征服土耳其、库尔德人控制的领土以及什叶派地区。由于没有任何持续的征服,哈里发政权失去了正统性和征兵能力。[114]

    此外,伊斯兰国最初的胜利引起了伊拉克什叶派民兵组织的强烈抵制,特别是伊玛目穆克塔达·萨德尔领导的部队。2014年底,通常支持和平的伊拉克什叶派最高神职人员大阿亚图拉·阿里·西斯塔尼呼吁战斗人员“保卫国家和人民,保卫公民荣誉和圣地”,这引发了热情的新兵征募潮。这些什叶派民兵组织得到了由传奇指挥官卡西姆·索莱马尼领导的伊朗精英“圣城部队”的资金、人员和物资的大力支持(索莱马尼于2020年死于美国的无人机袭击)。在残酷的后续报复行动中,数千名无辜的逊尼派教徒被杀害。[115]

    由于不再获取更多的领土以及军事形势的迅速逆转,伊斯兰国的末日叙事前景及物质回报和异教徒性奴都在减少;到2016年中,那些没有被炸成废墟的训练营因缺少新兵而关闭。2017年10月17日,伊斯兰国设在叙利亚拉卡市的“首都”,落入由美国特种部队支持的叙利亚反政府军手中。2019年3月下旬,联军占领了最后一块被伊斯兰国占领的土地。[116]

    目前,伊斯兰国在中东地区仍然是一个重要角色,它在欧美地区的追随者仍然能够发动“孤狼袭击”[117],但那个曾经引导了胜利的、不断扩大的哈里发政权的末日叙事已经消失,伊斯兰国也不像以前那样能够吸引来自发达国家的数万名天真的年轻追随者。

    但是,只要整个社会中存在屈辱和失望,启示性末日论就能也必然将蓬勃发展。今天的伊斯兰世界就是这样,尤其是在它从西方那里收到了真实或想象中的失败的情况下。

    此外,基督教末日论在20世纪末的兴起表明,即使在成功、繁荣的社会中,末日类叙事也可以蓬勃发展,而所有三种亚伯拉罕信仰都可以为末日叙事提供肥沃的土壤。人类对引人入胜的故事的渴望(其中末日类故事最具诱惑力)加剧了另一种不幸的倾向,即我们的“群体内/群体外行为”倾向。相当一部分人总会持有一种极具诱惑性的观点,认为自己是被选中的少数人中的一员,将参与建立一个良性新秩序,而这一新秩序要求焚烧非信徒。这种幻想已经驱动了几个世纪的宗教性群体狂热,从明斯特的扬·博克尔松和他的追随者,到美国的威廉·米勒和杰瑞·法威尔,再到被吸引至伊斯兰国地狱的数万人。

    后记

    我们都是生存机器——作为运载工具的机器人,其程序是盲目编制的,为的是永久保存所谓基因这种禀性自私的分子。 ——理查德·道金斯[1]

    如果查尔斯·麦基能够穿越时空来到今天,那么1844年的大失望、20世纪20年代和20世纪90年代的股市泡沫,以及最近兴起的三种亚伯拉罕宗教的末日幻想都丝毫不会让他惊讶。同时,他会被达尔文关于人类进化的论述吸引(这一论述描述了1841年出版《非同寻常的大众幻想》之后的一代人),并思考如何将进化论用于所写的情节。同样,他也会被20世纪的心理学和社会心理学研究吸引。

    首先,也是最重要的一点,麦基会知道我们石器时代的祖先受本能的驱使,依靠相互合作、交流以及最重要的模仿,在缺乏食物,面对各种有毒浆果、毒蛇以及跑得更快、牙齿更大的食肉动物的环境中生存。

    从石器时代末期到现在,我们只是大概第300代人,仍然被这些古老的生存本能驱使。这300代人不仅没有足够长的时间进化出更多的分析性认知,而且在相对更人性化的工业或后工业世界中,这种心智能力的提高会给人类带来生存性优势是值得怀疑的。换句话说,人类可能注定要带着石器时代的思维,在太空时代的星球上蹒跚而行。

    事实上,我们的许多行为都有更古老的根源。我们的许多和蚯蚓相同的基因已经存在了数亿年之久,例如调节食欲的基因。[2]我们对富含能量的甜食和高脂肪食物的偏好可能起源于我们的脊椎动物祖先,这远在人类物种进化之前。但在一个充斥着廉价糖和脂类的现代世界,这一基因已经变得极度不适应。

    从《非同寻常的大众幻想》角度看,模仿可能是我们最重要的进化特征。除了我们先进的认知和语言能力外,模仿制造新工具的能力——北极的皮艇、北美大平原上猎杀野牛的工具和亚马孙盆地的喷枪——让我们能够在地球上的大多数地方生存。但可悲的是,我们也将模仿倾向运用于一些适应性不良、有时令人憎恶的行为。

    证明适应性不良现象的最著名的实验,可能是斯坦利·米尔格拉姆的“服从”实验和菲利普·津巴多的“斯坦福监狱”实验。在米尔格拉姆的实验中,“实验者”经常说服受试者(“教师”)对回答错误的“学生”进行“致命”电击。[3]同样,斯坦福监狱实验将受试者分为“囚犯”和“看守”。几天之内,两组人都模仿并内化了自己的角色,以至于两组人之间爆发了暴力冲突。[4]

    这两项实验都受到了严肃的批评,但道德和知识腐败的传染性问题基本上不是一个理论或实验问题,因为现实世界中的很多更好的例子能够说明异常性行为如何在显然正常、适应良好的人中传播。[5]例如,20世纪90年代的安然丑闻就表明了非理性和道德腐败的传染性。主人公肯尼斯·莱、杰弗里·斯基林和安德鲁·法斯托都不认为自己不道德;毕竟,周围的每个人都认为他们是很好的、非常聪明的人,且他们正给美国经济带来革命性的变化。此外,与心理学家所罗门·阿希的线条长度实验中实验对象受到同桌的误导一样,安然员工接受了周围同事和记者们几乎一致的意见,但这些意见是不正确的。

    也许最极端的道德失范传染的例子表现在强权社会中,比如波尔布特统治下的红色高棉,“文革”时期的中国,当然还有纳粹时期的德国。历史学家劳伦斯·里斯采访了那些在纳粹集中营里担任过警卫和管理人员的人,他发现,当他们的寿命已经所剩无几的时候,他们已经不像几十年前那样对自己曾经的工作闭口不言。里斯惊讶地发现,这些德国人的男女比例大概是1:1,并不是盲目服从命令的邪恶机器,而是外表正常、聪明的个体,他们都认为自己参与了一项有价值而又合乎道德的事业,即消灭世界上的犹太害虫。就像一家精英公司的初级管理人员一样,他们通过竞争和创新,以最高的效率完成可怕的任务。[6]

    即便如此,这些德国人的这种同行驱动的不人道行为还是有局限性的,尤其在机枪一次性射杀数千名犹太人时,即使在强硬的党卫军中,这种行为也会带来心理困扰。因此,索比堡、贝乌热茨、特雷布林卡和比克瑙(奥斯维辛集中营)等最“高效”的纳粹集中营,都依靠非德国俘虏来完成最肮脏的工作,且只需要相对较少的德国人员,例如,贝乌热茨集中营大约只有20个德国人员,却屠杀了60万人。[7]

    由此得出这样一个黑暗结论:如果我们的同行中有足够多的人认为种族灭绝是可取的,那么我们中的许多人(如果不是大多数的话)都会有这样的想法。如果你仍然认为德国例外主义是大屠杀的主要因素,那么你应该考虑英国官员在德占海峡群岛泽西岛和根西岛[8]上的行为,他们愿意配合德国人,将犹太人居民送到纳粹营地。用一位前纳粹官员的话说:“当今世界的问题是,从未受过考验的人总是对受过考验的人做出评价。”[9]或者,更简洁地说,我们永远不要低估人类模仿的倾向,尤其是平常那些有益的、帮助经济和整个社会顺利运转的群体幻想,可能会迅速变异为欺诈性或种族灭绝性的群体幻想。

    麦基也同意这样的观点,即人类是会讲故事的猿猴——麦基本人就是个叙事能手。当我们的远古祖先需要彼此交流才能生存时,他们并没有使用三段论、数字数据或数学公式来交流。他们交流的主要方式过去是、现在仍然是——叙述:“你从右边,我从左边,我们从两边刺杀这头乳齿象。”人类是叙事性动物,无论叙事多么具有误导性,如果它足够令人信服,那么至少在这些事实造成巨大痛苦或伤害之前,它几乎总是会战胜事实。就像中东的伊斯兰国军队和明斯特的再洗礼派一样,这些事实会毁灭信徒们自己。

    此外,我们听故事不仅因为我们喜欢故事本身,而且因为我们想知道故事的结局;任何故事都不如关于世界最终命运的故事更吸引我们,并让我们身临其境。越能让人们感到身临其境的叙事,越能腐蚀人们的分析能力;一个设计巧妙的末日叙事,可以说服男人们放弃所有的世俗财产,或者愉快地把他们的妻子和女儿都送到故事讲述者的床上。

    我们将塑造事实,使之符合我们先前存在的观点,而不是让后者符合前者;对于这一点,麦基是认同的。无论何时何地,我们都会成为确认偏见的牺牲品,坚持那些与我们的信仰最一致的事实,故意忽略那些与我们的信仰不一致的事实。

    从技术角度讲,如果我们真的理性,就应该按照“贝叶斯推理”这种分析方法来阐述我们对世界的看法。“贝叶斯推理”是由18世纪的英国哲学家托马斯·贝叶斯发明的,是一种面对新数据时会改变预测的数学规则。如果一个人不喜欢某个政客,他认为该政客有50%的概率发生犯罪行为,那么根据贝叶斯推理,当一个新的、强有力的开脱罪责的证据出现时,他应该把对该政客犯罪概率的估计下调到50%以下。

    但人们并不是这样做的;当我们对某个话题持有强烈观点时,我们会有意避开与观点相悖的数据;当这些数据和信息不能再被忽略时,这会引发幻想性信仰的改变,就像多萝西·马丁的飞碟教派那样。人类远非理性的“贝叶斯人”,实际上常常是“反贝叶斯人”,这一事实推动了幻想性信仰的传播。

    毫无疑问,麦基知道,一个引人入胜的叙事可以像传染性病原体那样,在一个特定的群体内以指数级增长的方式迅速传播,其速度和一个新冠肺炎病毒超级传播者传染大批接触者的速度一样。此外,正如阿希博士的实验所表明的那样,如果一个错误的信念足够普遍,它就会获得一个临界质量[10]

    当我们周围越来越多的人持有相同的幻想时,我们就更有可能相信这个幻想,所以我们周围的人也更有可能相信它,这是一个缺乏刹车系统的恶性循环。在存在幻想传染、又没有有效防御措施的情况下,失控的狂热越来越有动力,直到最终撞上现实的砖墙。

    最后,麦基一次又一次地描述了人类倾向于以摩尼教式思想看待生活——一场善与恶之间的赤裸裸的泾渭分明之战。如果达尔文的《物种起源》早一代出版的话,麦基就会理解,这是人类石器时代进化的又一个包袱。麦基会进一步意识到,人类近乎普遍的过度自信倾向既有利于我们的生存,也会让我们认为自己站在道德制高点上:这本书和麦基的书都会被宗教群体排斥,因为他们认为那些不认同他们世界观的人来自地狱(在极端的情况下,应该死)。

    伊斯兰国只是这场摩尼教式幻想展览会上的一辆最新花车;在一段时间里,伊斯兰国掌握着一种叙事,这种叙事使那些遭受贫困、战争和压迫的人信服和满足:受苦难者作为正义之士参与了这场正义和邪恶之战,安拉迟早会让他们战胜邪恶的压迫者,从而获得最终和永久的胜利。因此,这种21世纪伊斯兰教末日叙事与16世纪扬·博克尔松的叙事或20世纪哈尔·林赛的叙事几乎没有什么不同。(尽管林赛的后期对手——社会主义者、撒旦主义者和占星家,与哈布斯堡帝国或以色列和西方军队的实力相比确实是弱者。)

    这本书和麦基的书对幻想性金融狂热的描述,与末日描述只是在类别上不同而已。两种叙事都非常令人愉快:当选者都将免去生命的苦难,在末日描述中,是通过神奇的精神手段,而在金融描述中,是通过神奇的经济手段。在这两种情况下,确认偏见和人类模仿都扮演主角。

    金融幻想和宗教幻想的主要区别在于,前者在很大程度上缺乏摩尼教式元素,而后者的前沿和中心就是摩尼教式思想。此外还有其他区别。回想一下,泡沫的诊断性特征之一是对怀疑论者的强烈反应。在我写这段话的时候,围绕着加密货币(比特币就是其中的一个例子)的兴奋,似乎展现出了早期金融狂热的所有迹象和症状。也许最著名的比特币代言人是“杀毒软件之父”约翰·麦卡菲,他认为比特币的价格在3年内能达到50万美元,任何怀疑比特币价值的人,如果不是恶魔,那么至少是个白痴。[11](比特币在2017年底达到20000美元的价格后,到2020年中,其交易价格为11800美元。)

    麦基除了会被现代心理学和进化论关于群体幻想行为的见解吸引之外,也会从海曼·明斯基和查尔斯·金德尔伯格等经济学家针对金融狂热的最新研究中学到很多东西。这些研究清楚地表明,金融狂热事件总是与激动人心的新技术、放松的信贷、健忘症和放弃久经考验的金融分析方法等有关。同样,比特币等加密货币也很有启发性;虽然似乎很少有人通过直接投资这些工具而致富,但它们背后的所谓区块链技术很可能通过彻底改革银行业和政府金融而使整个社会受益。

    麦基是一个完美的故事讲述者,但由于他的时代缺乏关于人类行为、遗传学和自然选择学说的科学知识,他受到一定的阻碍。他对集体幻想的精彩描述虽然极具启发性,但也仅限于此。尽管麦基不知道这些科学知识(现在我们知道了),但他一定想过,人类注定要反复经历金融和宗教领域的这种摧残。

  • 威廉·伯恩斯坦《群体的疯狂》1-7

    前言
    1 末日论的起源 约阿希姆的子民们
    2 滥用末日叙事的悲剧 信徒与无赖
    3 短暂的致富 密西西比泡沫与南海泡沫
    4 资本主义的英雄 英国铁路泡沫
    5 米勒运动的“大失望” 数秘主义与确认偏见
    6 弹性货币政策的灾难 泡沫与崩溃的四个前提
    7 致富空想的破灭 1929年大萧条
    8 天启之牛 时代论如何兴起
    9 圣殿山的争夺 末日叙事如何影响犹太人建国
    10 《启示录》的开创者 畅销书与美国核武政策
    11 时代论的灾难 大卫教派的悲剧
    12 “被提”类小说 末日文学为何畅销
    13 资本主义的慈善家 从环球电讯、安然公司到互联网泡沫
    14 数字时代暴富梦的推手 投资分析师、大众、媒体与政治家
    15 伊斯兰国的兴衰 马赫迪与哈里发
    后记

    前言

    近两个世纪之前,一位年轻的名叫查尔斯·麦基的苏格兰人,以令人难忘的方式同时攻击上帝和玛门[1]。他出生于1814年,是一名颇受欢迎的诗人、民谣作家,还担任过美国内战记者和英国报纸的编辑,在文学生涯中享有杰出的声誉。但后人对他最深刻的印象,是他在1841年撰写了《异常流行幻象与群众疯狂》(Memoirs of Extraordinary Popular Delusions)一书,当时他才27岁。该书讲述了多个历史性群体狂热事件,其中一些与宗教和货币有关。[2]从那以后,这本书为读者不断加印。

    麦基记录了公元1000年前笼罩在欧洲的末日幻想,以及十字军东征时期惊人的宗教疯狂。不过,这本书最著名的内容是17世纪30年代荷兰郁金香投机,以及1719—1720年巴黎和伦敦双股市泡沫中的群体性金融狂热。这些情节使这本书一直享有盛誉[3]。在它出版之后,接连发生的金融狂热的频繁性、规律性及其造成的全球性影响,使得即使在写成近两个世纪之后,这本书依然是金融专业人士的必读经典。[4]

    麦基并不是第一个认识到人类的非理性具有传染性的人。例如,希罗多德写过这样一段话:
    (大流士)担任波斯国王的时候,他召见了统治下的一些希腊人,问付给他们多少钱他们才愿意吃掉自己父亲的遗体。他们回答说,无论给多少钱都不可能做这种事情。然后,当着希腊人的面,大流士又把印度卡拉提亚人(他们愿意吃掉自己双亲的遗体)召来,借助翻译问,付给他们多少钱他们才愿意焚烧自己父母的遗体。这些印度人惊恐地大叫起来,不允许大流士提这么可怕的事情。这个故事显示出习俗的意义。在我看来,诗人品达说得对:习俗乃是“万事之主”。[5]

    希腊人毕竟是古代的智者,大流士一定忍不住想要教育他们。他想传递给希腊人未言明的信息:你们也许是人类中最博学的人,但你们和我们一样具有非理性;你们只是更善于进行合理化解释而已,善于解释尽管有各种反面证据,但你们依然是对的。

    虽然古人和麦基非常熟悉人类的非理性和流行性狂热,但无法得知其中精确的生物学、进化论和社会心理原因。例如,麦基一定问过自己,为什么一群人会时不时地去追逐某种价格高得离谱的投资?

    今天,我们对此有了更好的理解。首先,金融经济学家发现,人类会本能地追求回报非常高但是发生概率非常小的结果。比如彩票,平均来说是赔钱的,但用巨额财富幻觉吸引了买家。此外,在过去几十年里,神经系统科学家已经揭示了贪婪和恐惧背后基本的解剖学和心理学机制——“大脑边缘系统”,其位于大脑左右半球中间的垂直面附近,具有对称分布的结构,包括一对伏隔核(大约位于每只眼睛的后面)和一对杏仁核(位于太阳穴下方)。

    研究人员使用功能性磁共振成像技术后发现,伏隔核不仅会因奖励而被激发,而且会因为对奖励的预期而被激发得更加强烈,无论这种预期是关于烹饪、性、社交还是金融;相反,杏仁核会因厌恶、恐惧和退缩而被激发。例如,如果你喜欢芙洛阿姨的烤宽面条,那么在你去往她家的路上,你的一对伏隔核及两核之间的连接会更快地被激发,并且很可能在你闻到菜肴香味时达到激发率的顶峰。但是,一旦你品尝到第一口,伏隔核的激发率就会下降,如果芙洛阿姨在你到达时告诉你她刚刚烤煳了这道菜,你的伏隔核就不再被激发。[6]

    这种活跃的预期传导有很明显的好处:大自然偏爱那些怀有预期并为之努力奋斗的人,而预期一旦被满足,就几乎没什么进化优势了。周围的人毫不费力地变得富有,这会大大刺激我们的伏隔核,正如经济历史学家查尔斯·金德尔伯格观察到的那样,“没有什么比看到朋友发财更干扰一个人的幸福感和判断力的了”[7]

    几个世纪以来,小说家和历史学家都知道,人类并没有运用强大的智力冷静分析世界,而是对事实进行合理化,使其符合情感上的预期。记者戴维·哈伯斯塔姆的权威著作《出类拔萃之辈》[8],使用反讽方式说明了美国“最杰出”的决策者如何在军事介入越南事件中自欺欺人,对事实进行合理化的倾向明显;而我们最近在国外的军事行动也表明我们还没有吸取教训。[9]

    在过去几十年里,心理学家积累了很多实验数据,分析人类对“合理化”胜于“合理性”的偏好。当面对的事实和数据与我们根深蒂固的信仰相矛盾的时候,我们通常不会重新考虑并适当改变这些信仰,而往往会回避这些事实和数据。而当无法回避时,我们有时会更加强硬地继续进行错误评估。令人惊讶的是,我们甚至可能会教化、改变、使其归附或说服对方。简言之,人类的“理性”构成了一个脆弱的盖子,在麦基所说明的自欺欺人的沸腾的大锅上危险地保持平衡。

    麦基本人的行为表明,即使是最理性、信息最灵通的人也容易受到金融狂热的影响。1841年,他出版《非同寻常的大众幻想》一书后不久,英国经历了一场金融狂热,其围绕当时伟大的高科技产业——铁路,甚至比1719—1720年席卷巴黎和伦敦的双股市泡沫还要严重。投资者们贪婪地购买铁路股票,为英格兰的铁路里程从1843年的2000英里[10]增加到1848年的5000英里提供了资金支持;股市最终崩盘时,还有数千英里的铁路已在计划中但从未建成。如果说应该有人预见到这次崩盘,这个人就是麦基。

    但狂热事件发生时,麦基正担任《格拉斯哥的阿格斯》报纸的编辑,他报道了正在进行的铁路建设,却明显缺乏怀疑态度。1852年,他出版了《非同寻常的大众幻想》第二版,对此只做了一个简短的脚注。

    金融狂热可以被看作一场像《哈姆雷特》或《麦克白》一样的悲剧,有着界定清晰的人物、熟悉的叙事和精心排练的台词。四个戏剧人物控制了故事的叙述:有才华但不择手段的项目发起人,轻信并购买股票的公众,大肆渲染的媒体,以及把手伸进钱柜并无视腐败之火的政客。

    发起人走上了一条经典的莎士比亚悲剧式道路,成为最引人入胜的演员。他们大多数一开始都是才华横溢、努力工作而又有远见卓识的人,凭直觉比别人更早地知道某项新技术将给社会带来财富。在实现愿景的过程中,他们变得富有和强大,在一个以财富判断人的资本社会中,他们成为国家的雄狮。当投机活动走到尽头、泡沫破裂时,他们最终落得不光彩和破产的下场,但通常(并不总是)能够侥幸逃脱牢狱之灾。

    事实证明,公众很容易被那些英雄般的、魅力四射的发起人用花言巧语说服。要想胜任投资工作,必须具备一系列能力,包括数学能力、技术专长以及最关键的经济历史类应用知识。唉,比起数据和事实,人们更喜欢故事;当面对复杂的投资任务时,人类默认进入叙事模式,也许最令人愉快的就是那些通过购买新技术不费吹灰之力获得财富的故事。

    媒体和公众一样成为发起人的受害人。写杰出商人的改革性经营事迹,能非常轻易地损害新闻界的名誉。这些发起人以惊人的频率出现在各大杂志封面上,先是被称作英雄,后来又成为被控重罪者。

    最后,金融狂热席卷了相关政客,他们的声誉和人气曾经因过度投机带来的经济短暂繁荣而得到提升,但最后经常因为把手伸进钱柜而被抓。

    各种金融狂热故事的情节变化不大。大多数投机性事件包含两个因素:预示共同富裕的激动人心的新技术,以及宽松的信贷。在今天的美国,只有大约10%的货币供应由实际流通的纸币和硬币组成;其余部分以信贷形式存在。银行系统可以在一定程度内随意创造信贷,信贷的规模取决于银行、抵押贷款公司和其他贷款人对得到偿还的乐观程度。这个过程是如此违反常理和令人震惊,因此值得我们重复这个概念:银行印钞。事实上,银行与其所服务的公众一样容易狂躁或抑郁,当沉浸在泡沫里极度兴奋时,它们放纵的“赚钱”行为通常更能煽动起投机之火,这在2007—2009年金融危机爆发前最为显著。

    泡沫伴随着四个特征。首先,最重要的是,金融投机开始主导除了最普通的社会互动之外的一切;无论何时何地,人们见面时谈论的不是天气、家庭或运动,而是股票或房地产。其次,原本在其他领域很理智的专业人士,却放弃了可靠、高薪的工作,去参与上述资产的投机。再次,对投机持怀疑态度的人往往会遭到激烈的反对;虽然总有一些年纪够大、记忆够长、以前看过这出戏的人知道它的结局,但他们的警告遭到了鄙视和嘲笑,并在过去几十年里通常被冠以五个字:“你就是不懂”。最后,平时稳重的观察家们也开始做出荒诞的金融预测,他们预计资产价格一年内的上涨幅度,不仅仅是10%、20%或30%,而是一倍、两倍或末尾增加一个零。

    除了关于金融狂热的前三章之外,《非同寻常的大众幻想》还包含三章篇幅较长的关于宗教狂热的内容:分别讲述《圣经》预言、十字军东征和猎杀女巫。虽然宗教狂热和金融狂热看上去没有什么共同点,但它们发生的潜在力量是相同的:希望改善自己今生或来世的福祉。而放大金融和宗教群体幻想传染性的因素也很相似:人类固有的模仿、编造和接受引人入胜的叙事以及追求地位的倾向。

    宗教狂热似乎是人类历史不变的特征,最近的一个例子就是太阳圣殿悲剧。1994年10月4日晚,瑞士切伊里村的居民被镇上一座农舍冒出的火焰吓了一跳,消防队员在那里看到了一幅奇异、可怕的景象:22具尸体,其多数身穿红色、黑色或白色斗篷,还有几个妇女穿着金色斗篷。除了其中3名受害者以外,其他人都是被枪杀的。此外,还有10名受害者头上蒙着塑料袋。被发现时,大多数人躺成一个圈,头朝外;弹壳和空香槟酒瓶散落在地板上。

    这仅仅是开始;接下来的两年半时间里,瑞士和加拿大又发现了74名被谋杀或自杀的受害者,其全部为教派成员或者他们的孩子;所有的死亡事件都发生在春分或秋分、夏至或冬至的前后几天内。

    该教派由两个男子领导:一个叫吕克·茹雷,他是神秘、英俊、有吸引力的46岁比利时医生,1993年受到共谋和武器指控,但从加拿大逃脱;还有一个叫约瑟夫·迪·马布罗,是70岁的法裔加拿大人。最终的受害者里包括法国滑雪名将让·维亚尔内的妻子和儿子。维亚尔内是1960年奥运会滑雪金牌获得者,后来他将自己的名字授权给一家国际太阳镜制造商,此后他的名字成为一个著名的商标。在维亚尔内去世之前,小维亚尔内曾经告诉记者:“从生到死这段路程的主题一次又一次地被提到。茹雷解释说没什么可怕的——但恰恰相反,我开始觉得自己快要殉道了。”[11]

    1997年3月24日,最后一批圣殿教受害者被发现;两天后,在美国圣迭戈附近的兰乔圣菲小镇,警察发现了另一个末日组织——天堂之门的39名成员的尸体,他们也死在那个春分前后。他们相信自己死后将被隐藏在海尔-波普彗星尾部的宇宙飞船里运出地球。[12]

    太阳圣殿和天堂之门只是一系列著名末日组织中的两个例子:1978年,吉姆·琼斯领导的人民圣殿教在圭亚那的集体自杀及谋杀事件夺走了918条人命;1993年,大卫支教在得克萨斯州韦科镇与愚蠢的联邦当局对峙,导致86名教徒被杀;残忍的日本奥姆真理教制造了1995年东京地铁神经麻痹毒气袭击。令人震惊的是,这些组织中的许多成员,如茹雷和维亚尔内,都是受过高等教育、有一定成就的人。

    末日论的群体幻想不是现代世界特有的;中世纪的欧洲就有大量精彩故事——如果我们对它们印象不深刻的话,就可以称之为插曲。现代神经心理学研究揭示了为什么一群神志正常、聪明、能很好适应社会的人,会自欺欺人地认为世界将以一种特定的方式终结,而且往往在某个特定的日期终结。人类是通过叙事来理解世界的:无论我们如何吹捧自己的个人理性,一个好的故事,即使分析起来很有欠缺,也会萦绕在我们的脑海中,使我们在情感上产生共鸣,并且比最具决定权的事实或数据更有说服力。

    最近,心理学家开始意识到,这些引人入胜的叙事是多么有效地腐蚀了我们的分析能力。也许所有故事中最引人入胜的就是末日论的叙事;如果认识到自己存在于叙事中,那么我们都想知道叙事的结局。末日论故事深嵌于世界上的许多宗教中,尤其是亚伯拉罕诸教[13],它如此普遍以至于几乎不被看见,但它潜伏在每天的头条新闻和推特背后,它如此古老以至于至少可以追溯到人类文明的起源。

    想要了解“故事的剩余部分”的渴望深深地侵蚀着我们的意识。此外,末日论故事还有另一种不可抗拒的吸引力:它承诺将使人类摆脱一个被托马斯·霍布斯称为“孤独、贫穷、肮脏、野蛮、短见”,充斥着以牺牲正义为代价而偏袒富人和权贵的腐败的人类存在。很少有故事能像承诺救世主的回归那样让人感到欣慰。救世主会扭转局面,拨乱反正。这种对人类新开端的渴望深深地内嵌在《圣经》中,尤其是《以西结书》、《但以理书》和《启示录》。这些书为几次血腥的末日运动提供了蓝图。

    演化心理学的新兴领域为解释群体狂热的传播提供了令人信服的机制。冰河时期末期,第一批部落从西伯利亚进入北美,之后的大约一万年时间里,人类的足迹从亚北极地区到北美大平原,再到热带亚马孙河流域。人类在如此多变的环境中需要掌握生存所需的各项专门技能,生物本来不可能进化得这么快:比如,要进化出一种会在亚北极海岸制造皮艇的基因天赋,还要进化出在北美大平原上猎杀水牛的天赋,然后是进化出在亚马孙地区制造毒气喷枪的天赋,这些进化需要很长时间。(据估计,北欧成年人的乳糖耐受性和吐蕃人的高海拔耐受性的进化用了3000~10000年,这是已知人类适应性进化最快的时间。)[14]

    但人类做到了。在进化过程中,人类并没有将制造皮艇、猎杀水牛或制造毒气喷枪的独特能力硬连接到基因中,而是编码了一项通用技能——模仿能力。例如,当有足够多的人和足够多的试错时,最终会有人想出如何建造一艘可使用的皮艇,而其他人可以准确地模仿这一过程。[15]

    人类比其他物种更喜欢模仿;一旦有人有所创新,其他人很快就会采纳。然而,我们的模仿倾向也增强了适应不良性行为,其中最主要是幻想性信仰。诚然,在现代后工业社会中,模仿能力确实促进了经济发展,但它对人类生存的促进作用远不及前现代时期在亚北极、大平原或亚马孙流域所起的作用。因此,在现代世界,适应性行为和适应不良性行为之间的权衡使得模仿能力对于人类已不如过去那么有利,我们现在陷入晚更新世时期的模仿倾向中,这一倾向在现代时期的成本越来越高,其中最昂贵和最危险的代价就是对世界末日即将到来这一信仰的传播。

    人类不仅对叙事的反应比对事实和数据的反应更加强烈,而且初步研究表明,越引人入胜的故事越能侵蚀人们的批判性思维能力。[16]此外,研究还表明,叙事的提供者和消费者之间是存在内在利益冲突的:前者希望使消费者信服,并设计出最引人入胜的叙事,而后者如果是理性的,就应有意避开这些叙事,并仅仅依赖数据、事实以及分析的方法。

    人类偏好于引人入胜的叙事,与之密切相关的是,人类还具有自欺欺人的倾向。人类本来很善于发现他人撒谎的真相,但是人类用欺骗自己的能力消除了这些真相,这使人类成为更好的骗子。[17]纵观历史,在各种宗教性群体幻想的主角中,作为局外人的骗子相对较少,更多的是一些被自己的幻想欺骗的受害者。

    大约从150年前开始,基督教新教发展出一种信仰,其专业名称为“时代论前千禧年论”(简称“时代论”),其现代倡导者将其打磨成世界上最引人入胜的末日叙事。尽管其确切的内容因不同的神学风格而异,但基本叙事都是预测犹太人将返回以色列、重建耶路撒冷圣殿,并在那里恢复祭祀。然后,罗马帝国以十国联盟的形式重新组合起来,由一个有魅力、才华横溢、英俊潇洒的人领导,这个人是反基督者,是魔鬼在人间的化身,他与犹太人结成了一个七年联盟,但三年半后,这个反基督者背叛了犹太人,从而促成了外国军人对以色列的入侵。入侵者不仅包括俄国人,还包括穿越喜马拉雅山到达那里的2亿中国人。

    一场灾难性的核战争接踵而至:大决战和其他恐怖事件,统称为大灾难。七年大灾难的最后,耶稣复临,击败反基督者,建立千禧年国家。在这个过程中,数十亿人死亡。信仰耶稣的基督教徒被顺利地从大决战和大灾难中提到天堂——这就是“被提”。犹太人的结局差一些:1/3的犹太人改信了基督教,并规劝其他人也改信,从而在大灾难中幸存下来。另外2/3的犹太人就倒霉了。

    不了解上述时代论叙事,就无法充分理解当前美国社会的两极分化现状。大多数受过良好教育、非宗教取向的公民都认为这是极其怪诞的,但是,对相当一部分美国人来说,这一系列的预言事件就像《罗密欧与朱丽叶》或《教父》一样耳熟能详,像杰瑞·法威尔、金·贝克和吉米·斯瓦加特这样的电视福音布道者,他们对公众的吸引力也完全依赖于他们的时代论资质。

    几个原因决定了对时代论叙事的普遍关注。以色列,尤其是重建圣殿在这一信仰体系中的中心地位,深刻地影响了美国的中东政策。美国对以色列扩大在约旦河西岸定居点的不加批判的支持和对巴以“两国方案”的明显放弃[18],可以直接追溯到福音派,也就是所谓的基督教犹太复国主义者的鼓吹,他们现在的影响力远远超过犹太复国主义[19]者。事实上,2018年5月美国驻耶路撒冷新大使馆落成典礼的开幕式和闭幕式是由两位时代论牧师主持的。其中一位是罗伯特·杰夫里斯,曾经声称希特勒帮助过犹太人返回以色列;另一位是约翰·哈吉,他认为卡特里娜飓风是上帝对新奥尔良罪恶[20]的惩罚。[21]

    在核时代,即使是轻微的“世界末日不可避免”的宿命论也是危险的。2010年美国皮尤基金会的一项民意调查发现,超过1/3的美国人相信耶稣会在他们的有生之年回来,而且大多数人相信“被提”。[22]其中一个有此信仰的美国人就是罗纳德·里根[23]。他可以和杰瑞·法威尔这样的人畅所欲言地谈论时代论神学。福音派占据美国军队的近1/4,其中大部分是时代论者;他们的影响在空军学院尤为突出,所服务的部门控制了美国的大部分核武器。[24]1964年,丹尼尔·埃尔斯伯格和他的兰德公司老板审查完美国的核指挥系统后,放映了电影《奇爱博士》,并评论说这部电影很可能成为一部纪实节目。影片中,一位患精神病的美国空军基地指挥官奇爱博士关注于饮用水的氟化[25]——即使到今天仍然有部分时代论者被饮用水氟化问题困扰——影片中这位指挥官触发了第三次世界大战。[26]

    历史上,基督教徒一直给犹太人贴上反基督的标签,这一概念本身就容易引起暴动。即使在今天,对一些极端福音派教徒来说,把这个标签贴在某人或任何团体身上,都可以为他们的谋杀辩护。

    最后,单是时代论这一信仰就能够而且确实已经引发大规模死亡。1993年,在得克萨斯州的韦科镇,痴迷于《启示录》的大卫·考雷什[27]领导的大卫支教与不理解其信仰体系的联邦官员发生了冲突。

    启示性末日论的起源在《新约》和《旧约》中都有,并且可能更早地起源于肥沃新月地带的多神教,因此,以色列犹太人中的极端主义者和伊斯兰教国家的末日剧本,都与基督教时代论者的末日剧本有很多的相似之处,这不足为奇。它们的不同之处在于谁扮演英雄,谁扮演反派人物。今天的穆斯林末日论者几乎一致认为犹太人是反基督者,而“伊斯兰国”之所以能够从世界各地招募新兵到叙利亚和伊拉克这片杀戮之地,很大程度上依赖于从圣训中直接引用的末日论叙事。

    要想理解金融泡沫和暴力性的末日疯狂等社会潮流是如何产生和传播的,可以先理解它们在什么情况下不会发生,这同样具有指导意义。我们对群体决策智慧的现代理解开始于1906年秋天,当时的先驱博学家弗朗西斯·高尔顿(他是查尔斯·达尔文的表弟)参加了在普利茅斯举行的一年一度的英格兰西部肥畜和家禽展览。在那里,他进行了一次群体理性实验。大约800名参赛者以每个人6便士[28]的价格购买一张“公牛体重竞猜”的票,对公牛净重(即屠宰后去掉头和内脏)猜得最准的人将获得奖品。令人惊讶的是,所有猜测值的中位数为1207磅[29],与实际体重1198磅相差不到1%。所有猜测值的平均数为1197磅,几乎准确,尽管高尔顿在他发表在《自然》(Nature)上的第一篇文章中没有提到平均值这个数字,因为他认为中位数,也就是(按顺序排列后)所有数据中居于中间位置的数,在理论上比平均数更具有吸引力。[30]

    高尔顿关于集体决策准确性的结论已经被反复证实。[31]最近,《纽约客》专栏作家詹姆斯·索罗维基在他的畅销书《群体的智慧》中总结了这一概念,他在书中提出,有效的群体智慧有三个要求:个体分析的独立性,个体经验和技能的多样性,以及收集个体意见的有效方式。[32]

    那么,就我们的目的而言,什么才是“群体”——是弗朗西斯·高尔顿和詹姆斯·索罗维基提到的那些理性的人,还是吕克·茹雷、约瑟夫·迪·马布罗和大卫·考雷什这些不理性的人?

    妄想性群体与智者群体之间的区别在于其成员之间的互动程度。高尔顿的约800名参赛者中的所有人,甚至大部分人,是否真的聚集成一个集体,这是值得怀疑的。他的实验有一个关键的、通常被忽略的细节,那就是它涉及牛的净重。在牛被屠宰前,没有人知道结果,参赛者必须在参赛卡上填写自己的地址,这样获胜者才能接到通知,且参赛者为了让自己的预测结果不对外泄露,在填写卡片之前并没有聚集在一起。

    几年前,金融专家乔尔·格林布拉特对高尔顿实验进行了巧妙的改变,他向哈勒姆地区的一个小学生班级展示了一个装有1776颗果冻糖豆的罐子。和之前的实验一样,学生们独立提交的索引卡上所显示的平均估计值非常准确:1771颗果冻糖豆。然后格林布拉特让每个学生当众说出他们的估计值[33],这破坏了他们总体判断的准确性——新的“开放式”估计结果平均只有850颗果冻糖豆。[34]

    因此,一组人的互动越多,其行为就越像一个真正的群体的行为,评估结果就越不准确。有时候,群体互动变得如此紧密、频繁,就产生了疯狂。用弗里德里希·尼采最简洁的话说,“在个体中,疯狂是罕见的;但在群体、政党、民族以及时代中,疯狂是司空见惯的”[35]。麦基也意识到了这一点;也许他的《非同寻常的大众幻想》中最有名的那一句话就是,“据说,人以群体为单位思考;我们可以看到,他们成群结队地发疯,但非常缓慢地逐个恢复意识”[36]

    因此,实现一组人整体判断的准确性,要求参与者不能像群体那样行动。此外,正如索罗维基所指出的,这还要求这组人中个体的多样性:一组人对于某项估计的观点越多,该估计就越准确。

    观点的多样性也有利于个体;正如弗朗西斯·斯科特·菲茨杰拉德所言:“检验一流智力的标准,就是在头脑中同时存在两种相反的想法但仍保持行动能力。”[37]在过去30年中,心理学家菲利普·泰洛克检验了数百位著名专家预测的准确性;他发现,那些综合考虑各种往往相互矛盾的观点的人比那些从单一理论视角看待世界的人表现得更好。[38]简单一句话:无论是在政治、宗教还是金融领域,都要提防空想家和真信徒。

    索罗维基的书描述了群体决策是如何成功的,而我的书将描述群体决策是如何失败的,以及群体决策失败时会发生什么。在最极端的情况下,不仅群体会疯狂,而且正如20世纪发生的几次事件那样,整个国家都会疯狂。

    麦基做得并不完美,他的很多编写内容甚至都不是原创的;他可能从当时四年前出版的一本理查德·达文波特的书《了解假冒、欺骗和轻信》(Sketches of Imposture,Deception,and Credulity)中获得了灵感甚至摘录了部分内容。达文波特的书涵盖了许多相同领域的内容,但没有那么多细节。[39]另外,麦基对郁金香事件进行了耸人听闻的描述,并将“郁金香狂热”这个术语引入现代词典,也为现代评论家们所不屑,他们认为麦基描述的并不是一个全社会范围的现象。[40]

    此外,麦基的章节、主题和时间顺序是混乱的;关于群体行为的章节(如金融泡沫、十字军东征)中穿插着关于时尚(头发长度、胡须和决斗)、健康和科学困境(磁化、炼金术)的章节。[41]

    也就是说,麦基意识到了,我们的社会特性会如此频繁地干扰我们的理性。在这一事实面前,麦基(以及那个时代的任何其他观察者)的错误、混乱和可能缺乏独创性的问题,都可以忽略。

    我第一次阅读《非同寻常的大众幻想》是在25年前,尽管前三章所描述的金融狂热吸引了我,但我当时认为这种狂热与20世纪90年代初期表现相对良好的资本市场是没有关联的。我错了。让我惊讶的是,在接下来的几年里,随着互联网泡沫的发展,麦基描述的金融狂热景象在现实生活中出现。

    20年后,伊斯兰国及其前身格外擅长向世界各地的信徒传教,其吸引了数千人从安全、繁荣的西方国家到伊拉克和叙利亚的杀戮战场。在很大程度上,其这样做相当于兜售了一种末日叙事,这种叙事与大量基督教徒所信仰的末日叙事非常相似。麦基对这一主题也进行了一些详细的论述。

    对深受《非同寻常的大众幻想》这本书影响的人来说,伊斯兰国的崛起敲响了响亮而清晰的警钟。如果说宗教狂热的现代表现是存在的,那么这就是随着神经科学最近取得的快速发展,审视从中世纪至今的群体幻想的时机已经成熟。

    在本书中,我忽略了几个麦基详细阐述的事件,例如时尚和健康狂热;而且,我并不直接报道政治事件。可能一些读者有疑问,在当今紧张的、两极分化的政治氛围中,我为什么选择这么做。我将这本书局限在金融和宗教群体狂热这两个领域,是为了使本书的主要内容保持在可控篇幅之内,也是因为我个人对金融和宗教群体狂热的共鸣。但是,读者会发现,这本书接下来所描述的事件及其心理学基础,可以与所有种类的狂热相联系,尤其是与20世纪的极权主义和21世纪的病毒阴谋论相联系,这不会有太大困难。

    很显然,21世纪最重要的地缘政治事件是2001年9月11日世贸双子塔和五角大楼的遇袭,这场灾难增强了一种已经确立的现代伊斯兰教末日主义,后者被西方政治和文化的主导地位以及1979年苏联入侵阿富汗重新唤醒。可以说,20世纪美国文化和政治生活中最重要的转变是基督新教福音主义的兴起,这给美国的中东政策以及战略武器的指挥和控制带来了巨大的风险。伊斯兰原教旨主义和基督新教福音主义的兴起,都可以很容易地通过以往的宗教狂热来理解。

    更笼统地说,本书将提供一个心理学框架,用来解释为什么人类有时候会出现各种类型的群体性疯狂。显然,人类是一种会模仿、会讲故事、会寻求地位、会道德性谴责他人、会怀念过去美好时光的猿类,所有这些都意味着,人类的未来必将充满宗教和金融群体狂热。

    任何一个写群体幻想的作者都很快会遇到一个非常不方便的社会学事实。就像大流士故事中的希腊人和印度卡拉提亚人一样,我们每个人都是社会规范的产物,有时,一个社会的圣礼是另一个社会的亵渎。例如,世界上有许多神学(如果不是大多数的话)倾向于将他人的信仰体系视为异端,这甚至会发生在密切相关的教派中,也就是弗洛伊德著名的“微小差异的自恋”[42]。正如那个古老的笑话,几百人共有的幻想被称为“邪教”,而数百万人共有的幻想被称为“宗教”。

    相当一部分美国人相信《启示录》的字面真理:世界将很快遭受一场末日大灾难。非原教旨主义基督徒和非基督徒可能会认为,末日叙事只是一种幻想,这种群体性幻想对信徒或世界上的其他人极少产生强烈危害。但是事实恰恰相反,所有成功的群体都在一定程度上依赖于共有的幻想。无论美国社会存在什么缺陷,我们最大的力量在于我们信仰法治和法律面前的平等;同样,我们的经济运行良好,是因为几乎所有人都相信,纸币和更为缥缈的电子交易货币代表着真实的资产和债务。但归根结底,这些有益的共同信仰只不过是全社会的骗局:只有在大多数人都相信的情况下,它们才是正确的——这就是所谓的“仙子效应”[43]。因此,我选择将注意力集中在那些变坏的群体幻想上,如果你愿意的话,那么也可以将其理解为“极其有害的大众幻想和群体疯狂”。

    本书的讲述基本按照年代顺序,从麦基没有提到过的中世纪末日狂热事件开始,到近期末日狂热最壮观的例子——中东伊斯兰国的崛起。在这两者之间,我按照发生顺序向读者介绍过去这段时间里所发生的各种金融和宗教狂热事件,以及相关的神经科学发展历程。

    我们首先从人类群体幻想的黑暗中心——中世纪的欧洲开始。在那里,一位名不见经传的西多会[44]修道士受《圣经》启示类书卷的启发,发展了一种神学,引发了一系列可怕的新教末日叛乱。

    1 末日论的起源

    约阿希姆的子民们

    老虎去打猎了,
    鸟儿开始飞翔;
    男人坐下来想,“为什么,为什么,为什么?”
    老虎睡着了,
    鸟儿降落了;
    男人不得不告诉自己他明白。
    ——库尔特·冯内古特[1]

    12世纪末,欧洲的国王和王后们踏上了艰苦的旅程,来到遥远的卡拉布里亚山上的一座修道院,沐浴在一位几乎被遗忘的西多会修道院院长——菲奥雷的约阿希姆[2]的传奇智慧中。在1190—1191年第三次十字军东征途中,狮心王理查[3]也经过这里,寻找自己的未来景象。[4]

    这位沉默寡言而又有智慧的修道院院长喜欢数字和历史类比,他将人类历史分为三个时代,并预言一个即将到来的黄金时代。这正是欧洲统治者被吸引到修道院的原因。不幸的是,约阿希姆无意中点燃了预言的导火索。他的未来景象对饱受蹂躏的穷人来说是一种雄辩的诉说,在他们心中激起了革命。在接下来的几个世纪里,他最初的和平模式演变成一种血腥的末日神学,席卷欧洲大片土地。

    要想理解这是如何发生的,需要援引《圣经》的三大末日叙事:《旧约》中的《以西结书》和《但以理书》,以及《新约》的最后一本书《启示录》。虽然这三本书对现代非宗教读者来说可能显得晦涩难懂,但它们有助于解释基督教福音派教徒与其他美国人之间的文化分化,这种分化在过去几个选举周期中变得非常明显。基督教福音派教徒对这三本书的内容像对美国独立战争故事和内战故事一样熟悉,但其他美国人并不太了解这些书。此外,即使是福音派教徒也常常不知道这三本书中故事背后的古代近东[5]历史,特别是埃及人、非利士人、亚述人、巴比伦人、波斯人,以及以色列王国和犹大王国这两个犹太王国之间的复杂关系。

    《以西结书》、《但以理书》和《启示录》为一系列宗教群体的末日幻想提供了背景,这些幻想在许多方面与瑞士切伊里村的悲剧相似。幻想是亚伯拉罕宗教[6]自诞生以来一直具有的特征,最突出的体现包括16世纪的德国明斯特镇,19世纪中期的美国米勒运动,以及随着现代以色列国家的建立、对即将到来的末日进行的各种反复和广泛的预测。

    宗教狂热往往发生在最糟糕的年代。在这样的年代,人类希望摆脱困境,回到美好的旧时代,回到一个神话般和平、和谐和繁荣的时代。现存最早的希腊诗歌之一,约公元前700年赫西俄德[7]的《工作与时日》很好地表达了这一点。当时的希腊极度贫困,作者在雅典西北部维奥蒂亚的一个农场艰难度日,他把这个农场描述为“冬天不好,夏天闷热,任何时候都不好”[8]。赫西俄德想象着,这些事情在过去的年代里肯定会好一些。在他所讲述的神话中,首先出现的是奥林匹斯山上的众神,他们创造了一个“人类的黄金种族”,这个种族:

    像诸神一样生活,没有内心的悲痛,没有劳累和忧愁。他们不会悲惨地衰老,四肢永远有力;除了远离所有的不幸,他们还享受筵宴的快乐。他们的死亡就像熟睡一样安详,他们拥有一切美好的东西。肥沃的土地自动慷慨地产出丰盛又足量的果实。他们和平轻松地生活在富有的土地上,羊群随处可见,诸神眷爱着他们。[9]

    然后是第二代种族,“用白银打造的,到目前为止还不那么高贵”。他们仍然受到祝福,但他们犯了罪而且没有向神献祭。随后是第三代种族,他们的盔甲、房屋和工具都是由青铜打造的。出于某种原因,诸神给了第四代种族比第三代种族更好的平局:一半死于战斗,另一半以半神的身份生活。赫西俄德的第五代种族是“一个铁族,人们白天不停地感到劳累和悲伤,夜晚接二连三地死去,诸神给他们设置了很多麻烦”。赫西俄德预言,他们的孩子会更差——唯利是图,口出恶言,最糟糕的是,他们不愿意赡养年迈的父母。[10]生活确实是孤独、贫穷、肮脏、野蛮和短暂的——赫西俄德的描述比托马斯·霍布斯在《利维坦》中的描述早了2000多年。

    赫西俄德时代的苦难生活尽管凄凉,但至少是当地土地和文化的固有特征——土地的贫瘠、人的贪婪和邻近城邦的侵略。但毕竟,敌对邻邦的人和他们有着相同的宗教和文化,尽管战胜方经常奴役战败的邻居,但在伯罗奔尼撒战争[11]之前,通常不会取战败方的性命。

    犹太人是怎样来到圣地定居的,这仍然是一个谜,因为历史学家质疑摩西和《出埃及记》的真实性。毋庸置疑的是,后来以色列人征服了迦南人,比征服随后凶猛的“海上民族”更容易。迦南人是巴勒斯坦地区文化上更先进但侵略性更弱的原住民,而“海上民族”是一个神秘的种族,不仅侵犯了埃及,可能还消灭了包括迈锡尼在内的几个地中海西岸文明。在所谓的“犹太人逃离埃及”后不久,当地的“海上民族”——非利士人在现代加沙地带和特拉维夫之间建立了一个滩头阵地,并开始向内陆推进。

    非利士人的威胁促进了以色列各个部落的联合。扫罗最终被选为以色列的领袖,并开启了希伯来人联盟的时期。扫罗曾经是非利士人的雇佣兵,他击败了以前的雇主。公元前1000年之后,扫罗的副官大卫在扫罗死后接替了他的职位。大卫也曾是非利士人的雇佣兵,是一位更具军事天赋和魅力的领袖,在他的领导下,他们不仅占领了北部的以色列地区和南部的犹大地区,还占领了一座由迦南人控制的、设有重防的城镇耶路撒冷,其作为大卫的私人领地。

    大卫领导下的犹太人地理版图达到最大,向北延伸到大马士革。但我们今天所说的“大卫王国”并不是一个统一的国家,而是由三个独立的部分组成的:犹大王国、以色列王国和耶路撒冷。其中犹大王国和以色列王国具有独立的王权(见图1-1),由大卫分别占有,而耶路撒冷是大卫的私人财产。

    图1-1 大卫王国的犹大王国和以色列王国

    注:书中地图系原文插附地图。

    他的儿子所罗门统一了这个联盟。所罗门像一名雄心勃勃的建筑师,他修建了一系列宫殿、堡垒和朝圣场所,其中最著名的是耶路撒冷第一圣殿。他还积极开展婚姻外交:娶了一位法老的女儿为妻,根据《列王纪上》[12],他至少拥有700个妻子和300个妃嫔。他在美吉多[13]建立的一个堡垒后来因其希腊名称而更为人所知:哈米吉多顿[14]

    所罗门的建筑计划不仅耗费巨资,而且需要众多的劳役,使民生怨愤。公元前931年,所罗门去世,他的儿子罗波安拒绝北上到以色列首都示剑城参加加冕典礼,至此以色列王国退出联邦[15][16]

    当亚述人成为强大的“军事机器”时,南北分裂对犹太人的独立是致命的。公元前9世纪,北方的以色列王国开始向亚述人进贡。公元前745年,提格拉·帕拉萨三世夺取了亚述王位,他挥师西进开始分割以色列王国。公元前721年,他的继任者撒缦以色五世和萨尔贡二世(又译撒珥根二世)征服了以色列王国,萨尔贡二世的史册记录:“我带走了住在这里的27290人,并挑选了50辆战车给我的皇家军队……我修复了那座城市,使它比以前更加伟大;把被我手征服的土地上的人,迁到这里住。”[17]

    萨尔贡将以色列王国中的精英们(包括贵族、富豪、能工巧匠等)驱逐到底格里斯河和幼发拉底河沿岸;他们逐渐消失在历史的迷雾中,很可能是同化融合到当地的美索不达米亚人中了,从而出现了10个“消失的部落”。亚述人随后将目光转向了南部的犹大王国,并在公元前701年发动了一次进攻,但失败了。此后一个世纪,不知何故,亚述人没有再进犯犹大国,也许是想把该地区作为他们和埃及人之间的缓冲区。这拯救了犹大国和犹太人民,使他们免遭北部以色列王国那样湮灭消失的厄运。

    公元前605年左右,亚述被巴比伦人攻陷,犹太人面临着一股更可怕的征服力量。公元前597年,尼布甲尼撒二世带领巴比伦人攻占了耶路撒冷。据《列王纪下》记载:

    ……犹大王约雅斤和他母亲、臣仆、首领、太监一同出城,投降巴比伦王,巴比伦王便拿住他。那时,是巴比伦王第八年。

    巴比伦王将耶和华殿和王宫里的宝物都拿去了,将以色列王所罗门所造耶和华殿里的金器都毁坏了,正如耶和华所说的。

    又将耶路撒冷的众民和众首领,并所有大能的勇士共一万人,连一切木匠、铁匠都掳了去。除了国中极贫穷的人以外,没有剩下的。[18]

    更可怕的事情还在后面。大约公元前587年,巴比伦人在犹大国扶持的傀儡西底家反叛,作为回应,巴比伦人攻破耶路撒冷的城墙,蜂拥而入。国王逃跑,但在杰里科附近被捉,巴比伦人“在西底家眼前杀了他的众子,然后剜了他的眼睛,用铜镣铐把他绑起来,将他掳到巴比伦去”[19]

    鉴于北方邻国“消失”的经历,犹地亚人[20]非常清楚,尼布甲尼撒二世正以灭绝的方式威胁着他们的文化甚至是生存,因此他们寻找一种极端的解决方式:一场奇迹般的大灾难,将他们从即将被湮灭中解救出来。——这是同时期的希腊诗人赫西俄德所不需要的,因为他的文化并没有受到这种被灭亡的威胁。

    公元前597年,与约雅斤一起被虏到幼发拉底河沿岸的流亡者中,有一位受过圣殿教育的祭司,名叫以西结。《以西结书》是他本人或他人以他的名义写的,书中记录的内容开始于五年后,也就是公元前592年。随着天堂的幻象向他打开,一辆载着上帝的战车出现了,这辆战车有四个幻影般的有翅膀的活物,每个活物都有四张脸:人脸、狮脸、牛脸和鹰脸。

    《以西结书》是《圣经》中第一本重要的末日启示类书籍,不管它的作者是谁[21],写作时间一定是在圣地环境恶化的那几十年里。正如《列王纪下》中所描述的,巴比伦人放逐了犹大王国的王室成员、祭司和富人,留下了大量的下层阶级。起初,被虏往巴比伦的这些贵族乐观地认为他们很快就会回到耶路撒冷,但公元前587年,耶路撒冷和第一圣殿被摧毁,这使他们的叙事文学朝着启示末日的方向演变。

    《以西结书》的作者讲述的故事从被征服的原因(即犹大的不敬),转向上帝的回归和犹太国家的重建。他转向了一个在接下来的几千年中越来越引起共鸣的叙事:人类的堕落,上帝的愤怒,他的回归,以及后来他儿子重建王国,并将不虔诚的人罚入地狱。

    《以西结书》依次包括三个部分:第一,以西结被任命为先知(传达上帝讯息的人);第二,重建大卫王国,并摧毁现实中的敌人,以及摧毁神话中的敌人——可怕的玛各和统治者歌革;第三,新圣殿的辉煌,以及一个复兴并扩大的犹太国家的辉煌。(《圣经》后来的书卷混淆了歌革和玛各,因为两者都可以解释为人或地区。)

    以西结还描述了大卫王国重建之后,以色列人将如何遭受这个神话中的掠夺者的入侵,然后击败他。这是《圣经》中首次实际性地提到歌革这个人物,他最终将演变成《新约》中的反基督者,是现代新教徒启示性末日预言中的主要人物之一。[22]以上三个部分的预言应验过程中包括许多奇妙而可怕的幻象,战胜邪恶力量,以及新世界的荣耀,这些成为随后许多末日叙事的基础。

    《圣经》中的第二本重要的末日启示类书籍是《但以理书》,据说写作时代与《以西结书》相同。它的开篇是征服耶路撒冷,流放巴比伦,以及尼布甲尼撒二世提挈四个聪明的希伯来人沙得拉、米煞、亚伯尼歌和但以理,“国王向他们咨询所有智慧和领悟方面的问题,发现他们比王国里所有术士和占卜师好10倍”[23]

    尼布甲尼撒做了一个几乎记不清楚的梦。他只知道这是一个重大预兆,但不知道其他方面的细节。当宫廷占卜师说他们没有能力把梦的细节和梦的讲解告诉他时,尼布甲尼撒下令,不仅要杀死这些占卜师,还要杀死王国里的所有智者,包括四个希伯来人。

    幸运的是,上帝向但以理展示了国王梦的内容:一个可怕的幽灵,有着金色的头、银色的胸膛和手臂、青铜的腰腹和臀股、铁的腿,以及半铁半泥的脚(因此出现了现代短语“泥足”)。一块石头打碎这个野兽的脚;然后石头变得越来越大,先是变成一座山,然后充满整个天下。[24]

    但以理所描述的野兽的金、银、铜、铁恰好与赫西俄德所讲述的时代相匹配;这可能不是巧合,因为同一时期的波斯文本中也描述过根据这四种金属命名的四个历史时代。[25]

    上帝给但以理讲解了这个梦,但以理将解梦转述给尼布甲尼撒二世:野兽的头是尼布甲尼撒本人,银和铜部分代表未来较小的王国,铁和泥足是一个伟大的联合帝国,但由于铁和泥两种元素不相合,联合帝国很容易破裂。最后,上帝接管了统治权:“当那列王在位的时候,天上的神必另立一国,永不败坏,也不归别国的人,却要打碎灭绝那一切国,这国必存到永远。”[26]

    很多学者根据书中的内容推测,《但以理书》的写作时间并不是巴比伦流亡时期,而是在公元前2世纪。如果这个推测正确的话,那么从尼布甲尼撒二世到这本书的实际写作之间的3个多世纪里,发生了很多事情:居鲁士国王征服了巴比伦人,允许犹太人返回巴勒斯坦地区并建造第二圣殿;但是,公元前332年,巴勒斯坦又被亚历山大占领。在被希腊统治期间,任何一个有文化的犹地亚人[27]都知道叙事中的预言是什么:尼布甲尼撒二世梦中野兽的半铁半泥脚代表了希腊托勒密帝国和塞琉西帝国[28]——亚历山大大帝征服地区的继承国——的衰弱及其最终的毁灭。《但以理书》的作者很可能想让书看起来比实际写得早3个世纪,以增强其预言的可信度。

    希腊人给犹太人带来了另一个生存威胁。公元前167年,位于黎凡特地区的希腊塞琉西帝国统治者安条克四世任命墨涅拉俄斯为犹太大祭司。后者主张对宗教习俗进行彻底改革,其计划包括废除祭祀和摩西律法等。安条克四世还将第二圣殿改造成世俗空间,并用宙斯雕像[29]亵渎它。

    改革派祭司、传统犹太人和安条克之间的冲突逐渐失控;公元前167—前164年,安条克的军队抢劫了圣殿,摧毁了神圣的卷轴,并将任何遵守安息日、割礼和献祭仪式的人处以死刑。他还洗劫了耶路撒冷;杀害、奴役和驱逐成千上万的居民;拆毁了耶路撒冷城墙;在城里驻扎希腊军队。

    这还不是全部:犹太人被要求在圣殿敬拜宙斯雕像,并献祭猪。最终在公元前164年,传统主义者马卡比兄弟领导的起义爆发,他们首先消除了这些可憎的行为,之后建立了一个独立的犹太国家,该国家一直持续到公元前63年被罗马征服。

    《但以理书》的上半部分结束时,男主角(指但以理)被送到狮穴敬拜上帝,并在上帝的保护下奇迹般地幸存下来。在书的后半部分,但以理本人梦见了异象,他自称不理解这些异象,但实际上这些异象只是尼布甲尼撒的梦的一个变体。四头幻影般的野兽依次从海里出来,每一头都比上一头更令人敬畏:一头被拔出翅膀的狮子;一头牙齿间咬着肋骨的熊;一头有四头和四翅的豹子;最后一头挑战动物学分类,“可怕又狰狞”,有着铁牙和铁角,在但以理的注视下,铁牙和铁角的数量不断增加,其中一个角长着眼睛和嘴巴,能说“夸大的话”[30]。上帝出现了,宝座上发出火焰,他征服了第四只野兽。就像尼布甲尼撒的梦一样,这只野兽代表塞琉西帝国。在接下来的居鲁士及其接替者大流士和伯沙撒统治期间[31],但以理又看到了异象,异象以寓言的形式讲述了波斯帝国被亚历山大征服以及波斯帝国的最终解体。这本书的最后一章描述了一个神圣的审判,在这个审判中,死者被复活,一些人享受“永生”,而另一些人在上帝的永久统治下被判“耻辱和永远的蔑视”。[32]

    《圣经》中的第三本末日启示类书籍是《启示录》,95年左右由书中被称为“约翰”的人写作,他是上帝讯息的一个谦卑的接收者。作者很有可能不是当时大约90岁的使徒约翰,而是生活在小亚细亚的帕特莫斯岛上的一名囚犯,是一位更为平庸的先知。这部作品最终被大多数基督教教派编纂成《圣经》的最后一本书。

    大多数现代读者,即使有深厚的宗教背景,也会发现《启示录》是一卷难以理解的、晦涩难懂的书。历史学家R.H.查尔斯说:

    从最早的教会时代开始,人们就普遍承认《启示录》是整套《圣经》中最难读的一卷。不仅略读,即使认真研读,读者也依然会觉得困惑。这从《启示录》的解读史中也可以体现出来。[33]

    《启示录》读起来像是一堆杂乱无章的图像,甚至比《但以理书》中的异象更梦幻。它与《但以理书》的异象有很多相似之处,这可能并非巧合。

    因此,对这本书的解读,需要具备东罗马帝国以及马卡比时期的专业历史知识。查尔斯对这本书进行了细致的文学分析,他认为帕特莫斯岛上的约翰很可能在完成这本书之前就去世了,后人对他未完成的原稿进行了不适当的编辑,造成了这本书的难懂。学识渊博的学者们几乎完全缺乏对该书叙事结构的共识。在过去几个世纪,这种解读困难造成了无穷无尽的伤害和混乱。[34]

    《启示录》由22章组成;前三章是约翰写给罗马帝国东部七教堂的信。接下来两章描述了主的宝座,被24位长老和4只可敬的野兽围绕着;出现了用7个封印封严的书卷,只有犹太大卫国王的后裔才能打开;一只被杀过的七角七眼的羔羊(圣经学者认为羔羊代表耶稣)正符合要求,这只羔羊一个接一个地揭开了封印。

    第六章到第八章描述了接下来会发生什么:前四印打开后出现了四匹颜色分别为白色、红色、黑色和灰色的马,分别象征着战争、国际冲突、饥荒和瘟疫。第五印打开后出现了祭坛下的殉道者,象征着迫害;第六印是地震。接下来是一段插曲,144000名犹太人被“封印”(额上有上帝的印记;12个部落各12000人)。第七印,也是最后一个封印,是由8位天使带来的;前面7位吹号,第8位摧毁世界。

    接下来的三章出现了同样令人困惑的画面:天使们吹响了七个号角,带来类似于七印那样的灾难。中间有个插曲,约翰被一位天使命令吃一本小书,然后天使指示他设计新的耶路撒冷和圣殿。

    书的后半部分描述了一条巨大的红龙,有7个头、7顶王冠和10个角。这条龙被认定为撒旦,他试图吞食一个新生儿,但没有成功。那个新生儿是上帝的儿子,因为寓言中的玛丽即将生下他。[35]

    接着是更多的幻象:第二只7头、10角、戴着10顶王冠的野兽,制造出寻常的混乱;第三只有两个角的复合兽,也在制造混乱;“羔羊”(耶稣)归来,指挥144000名原住犹太人;7个碗(或小瓶,取决于解释版本)倾倒在地上,带来类似于封印和号角的灾难;最后,一个可怕的女性形象,巴比伦的大淫妇出现了,被学者解释为罗马帝国或是耶路撒冷的背叛者。

    在第十九章和第二十章中,一位天使将龙/撒旦抛入火湖1000年,殉道者复活。1000年后,撒旦归来,征募了一支庞大的军队,“人数之多犹如大海之沙”,包括来自玛各的歌革,进行最后的战斗,最后撒旦被永远地扔回火湖。最后的审判将正义者与邪恶者分开,后者将和撒旦一起被封进火湖,连同“死亡与地狱”。最后两章描述了规模宏大的新耶路撒冷城的荣耀,“……12000弗隆[36]。长度、宽度和高度都相等”,并且基督应许说他很快就会回来。[37]

    《启示录》的基本叙事是耶稣回到地球与邪恶做斗争,并最终将邪恶抛入火热的永恒,将正义之人提入天堂,宣判其他人,并毁灭世界。至于确切的细节如何,就只是一个解释方面的问题了。此外,几乎可以肯定的是,它与《旧约》的末日叙事有着共同的起源,特别是与它非常相似的《但以理书》。事实上,《但以理书》和《启示录》的结构和内容并非基督教和犹太教所独有;哲学家、神学历史学家米尔恰·伊利亚德的研究显示,世界各地、不同时期的宗教有许多共同的主题;其中最持久的主题是赦免正义的世界末日之火,他推测这起源于波斯教/琐罗亚斯德教[38][39]

    《启示录》中那些极端的模棱两可的内容,可以有无限的解释。最突出的是,如果人类历史上存在千禧年,那么应该如何理解“1000年”,以及为什么末日发生的时间如此精确。在神学术语中,对这些问题的研究被称为“末日论”:末日时代人类的最终结局。

    模棱两可和难解性更扩大了《启示录》的影响力,因为这为世界何时结束以及与之相关的各种解释性寓言开辟了道路。用宗教历史学家罗伯特·赖特的话说:

    模棱两可、选择性保留和误导性的释义结合在一起,使信徒可以对宗教教义产生重大影响。因为他们只需要巧妙地运用隐喻和寓言,便可抹去文本的字面意思,并用完全不同的东西取代它。而如果原始文本的语义非常清晰,那么无论用什么工具都无法达到这种效果。[40]

    根据2010年的一项国际调查,有35%的现代美国人相信《圣经》代表了上帝的字面意思,同样有35%的人认为耶稣会在他们的有生之年回到地球。[41]我们似乎有理由认为,信仰的回溯时间越久,这种信仰就越普遍。

    从基督教早期开始,神学家们就假定了耶稣回归的三种不同的年表。第一种是教会已经建立了千禧年,耶稣将在千禧年结束时回归。这种时间序列在神学术语上被称为“后千禧年主义”,包括现在或未来的1000年时期,然后是最后审判和耶稣回归。第二种是前千禧年主义,意思是耶稣在千禧年之前回来,然后是最后的审判;换句话说,耶稣回归、最后的审判,以及千禧年本身都在未来。最后一种是所谓的“非千禧年主义”,即千禧年只是一个寓言性的概念,在现实中并不存在。[42]在这三种解释中,前千禧年主义的叙事最引人注目。几乎从《启示录》写完那一刻开始,书中模棱两可的语言以及人类对故事结局的渴望就催生了各种源源不断的前千禧年主义末日故事。

    罗马帝国晚期最著名的基督教神学家,希波的奥古斯丁,抵制住了这种诱惑,发誓不去尝试计算末日时间,“真理之口告诉我们,这件事不是我们应该知道的,因此,我们试图预计并设定这个世界的剩余时间是徒劳的”,更通俗地说,“放松你的手指,让它们休息一下”。[43]之后一段时间里,在教会的末日论立场中,奥古斯丁的这种不干预态度一直占据主导地位,直到约阿希姆的神学继承人登上历史舞台。他们迫不及待地期望末日时代的到来。

    人类在很大程度上是通过叙事来理解世界的,虽然末日预言可能是有史以来最引人注目的,但它的预测屡屡失败。预测研究表明,人类在预测未来方面的能力很差。实际上,只要观察历史上预测事件的正确概率,就会比基于叙事的推理更好地预测未来,而显然,到目前为止,对末日时间预测正确的概率一直是零。

    既然末日预测的准确性为零,为什么我们会被这些叙事影响?更一般地说,为什么基于叙事的推理如此站不住脚?心理学家已经证明,人们是“认知吝啬鬼”[44],他们不愿意进行严格的分析,而是倾向于启发法——一种简单的心理捷径。而一个令人信服的叙事就是最有力的启发法。[45]

    20世纪,神经科学家发现人类有两种不同类型的认知过程:第一种是快速的情绪反应,位于我们大脑深处进化古老的边缘系统,即所谓的“爬虫脑”,第二种是一种缓慢得多的有意识推理,产生于进化上比较新的大脑皮质,位于大脑边缘系统的上方。2000年,心理学家基思·斯坦诺维奇和理查德·韦斯特将这两种大脑系统分别标注为系统1和系统2,自此我们就一直沿用这种最普通的分类方法。[46]

    从进化的角度来看,系统1比系统2更占支配地位是有道理的;数亿年来,早在人类进化出系统2之前,快速反应的系统1就驱动着动物们对危险信号做出行为反应,例如蛇的嘶嘶声或捕食性动物的脚步声。而反应速度较慢的系统2,可能进化时间还不到十万年,因此只能在更古老的系统1的束缚下运作。更简单地说,我们更快的情感机器引领着我们,而我们较慢的“理性”跟随着我们。在自然界中,系统1的优势是显而易见的,它使我们甚至能够在危险的感官信息进入意识之前就做出反应;但在一个相对安全、危险持续时间更长的后工业世界,系统1的优势往往会带来巨大的成本。

    因此,我们越多地依赖叙事,越少地依赖硬数据,就越远离现实世界。你是否曾在一本小说中深深迷失自己,以至于忘记了周围的世界?你有没有听过一个令人着迷的电台广播,以至于你停在车道上10分钟,这样就不会错过结尾?在心理学界,这被称为“运送”。心理学家理查德·格里格将叙事定义为一种装置,其可以暂时在精神上将听众或读者从他们周围的环境中“运送”出去;当“运送”结束时,他们会回到原来的环境中,但此时环境在“运送时有所改变”。[47]

    换句话说,一部小说或非小说、电影、舞台表演或绘画作品能够暂时将读者、观众或听众从现实世界中“运送”出去,当他们回来时,现实世界已经有了一点儿改变。正如艾米莉·狄金森[48]所说:

    没有一艘战舰能像一本书一样,

    带着我们在天地之外翱翔,

    也没有任何一匹骏马能像一页诗篇欢腾奔跳。

    最贫穷的人也能从这里通过,

    没有强迫缴费,

    这是多么廉价的马车,

    它承载着人类的全部灵魂。[49]

    在过去几十年里,研究人员已经证明,人们所掌握的事实很容易受到虚构数据的侵蚀,即使这些数据被清楚地标记为虚构。保罗·罗津和他的同事在宾夕法尼亚大学进行了一项经典实验,他们向受试者展示了两个新买的、相同的玻璃瓶,里面装有蔗糖,并且告诉受试者,这两个瓶子都是首次使用;然后向受试者展示了这两个瓶子上贴的新标签,一个写着“蔗糖”,另一个写着“氰化物”;他们坚定地告诉受试者:“记住,两个瓶子里装的都是糖。”

    然后,他们将两个瓶子里的糖分别搅拌到一些盛水的杯子里;要求受试者说出想从每种杯子中喝多少水,然后受试者从两种杯子里分别喝一小口水。最终50名受试者中的41人选择的是那些蔗糖来自标有“蔗糖”的玻璃瓶的杯子。即使让受试者自己贴上标签,实验效果仍然存在。[50]

    这项研究以及其他类似的研究表明,人类无法将虚构世界和真实世界分开,换句话说,他们无法在文学世界和现实世界之间进行清晰的“切换”。1975年,电影《大白鲨》上映。《时代》杂志报道了那个夏天:

    从前那些勇敢的游泳者,现在只敢挤在离岸几码[51]处游泳,被太阳几乎晒晕的他们紧张地踌躇在水边,出现一点点背鳍靠近海滩的迹象就会让他们很紧张。在加利福尼亚州圣莫尼卡市的冲浪场上,一个孩子对另一个孩子喊道:“你想被吃掉吗?”即使是一条卑微的被称为“海洋猎犬”的狗鲨,由于它是鲨鱼,也被怀疑有杀人意图。“杀了它,杀了它,”一位纽约长岛垂钓者对他的同伴说,“在它长大杀死我们所有人之前,”而他同伴的钓竿上挂着一条仅仅两英尺[52]长、几乎没有牙齿的鱼。[53]

    这种效果是故意的:电影制片人故意将影片上映时间推迟到夏季。正如其中一个制片人所说:“一个游泳者,如果他看过或听说过这部电影,那么当他把脚趾伸进海里时,一定会联想到一条大白鲨。”[54]

    20世纪70年代,心理学家克莱顿·刘易斯和约翰·安德森研究了可识别的错误描述对核对确凿事实的影响。在一个简单的例子中,受试者被告知了一些历史上关于乔治·华盛顿的真实描述,他是美国第一任总统,他横渡了特拉华河,他戴着假发。再把一些虚假描述提供给受试者,诸如华盛顿是《汤姆·索亚历险记》的作者,他至今仍活着,等等。这时,受试者核对真实描述所需要的时间更长,而且每增加一个虚假描述,受试者核对时所犯的错误就越多。[55]

    格里格也进行了一些细致而又专业的实验,他的实验表明,小说内容越遵循历史事实,读者接下来就越难将虚构叙事和真实事件区分开。他举的其中一个例子是《夏洛克·福尔摩斯之谜》,这本书中的历史和地理背景通常是真实的。虽然作者阿瑟·柯南·道尔的读者一开始能清晰区分虚构的19世纪伦敦与真实历史上的伦敦,但格里格发现,道尔对19世纪伦敦的描绘是如此逼真,以至于其虚构部分也侵入读者对于这个现实城市的心理图像中。[56]

    换句话说,文学作品、电影和艺术可以使人们难以区分事实和虚构。正如格里格所说:“沉浸在叙事文学中,会导致与事实和现实世界的隔离。”[57]

    其他研究人员进一步发现,引人入胜的虚构叙事能够侵蚀人类的分析过程。俄亥俄州立大学的两位心理学家,梅拉妮·格林和蒂莫西·布罗克,扩展了格里格的研究。他们通过观察首次发现,叙事很明显比辞藻华丽的争辩更能引起公众关注:

    小说、电影、肥皂剧、音乐歌词,以及报纸、杂志、电视和广播中的故事远比广告、布道、社论、广告牌等更能引起人们的注意。叙事改变信仰的力量从来没有被怀疑过,也一直令人恐惧。[58]

    格林和布罗克根据以下几个指标对“运送”进行了量化:读者构思叙事场景并将自身置于其中的能力、心理和情感的参与程度、对相关叙事的感知、想要知道结局的渴望,以及“叙事中的事件改变了我的生活”的感觉,这些能提高“运送分数”。反之,意识到正在发生的事情,注意力的分散,以及叙事随后被遗忘的容易程度,将降低“运送分数”。

    他们让受试者阅读了一个令人伤心的真实故事,故事里一个名叫凯蒂的小女孩被精神病患者刺死。他们将这个“商场刺杀案”故事以两种形式分别呈现给受试者。第一种是两栏的“非虚构”版本,小字体,看起来像报纸上的报道;第二种是类似于文学杂志的“虚构”版本,以粗体警示文字为标题,“商场刺杀事件是一个短篇故事,发表在1993年12月俄亥俄州小说杂志《阿克伦最佳小说》的专题上,其中与真实人物和地点的相似性当然只是巧合。”

    然后,根据上面讨论的“运送分数”,格林和布罗克将受试者分成两组,低分组和高分组,并询问他们对故事的看法。实验结果是,高分组受试者比低分组受试者更有可能同情故事中的小女孩凯蒂,并认为世界是不公正的,那种商场袭击是常见的,以及精神病患者的自由应该受到限制。值得注意的是,明确地将这个故事标记为虚构并没有减少故事对受试者态度的影响:对于非虚构和虚构两种形式,“运送”影响是相同的。

    接下来,他们要求受试者对一些文本内容进行初步分析,例如,识别有关“匹诺曹”以及有关“四年级练习题”的文本。在测试中,他们要求受试者圈出那些不符合“匹诺曹”内容的文本,或圈出那些四年级学生不理解的单词和短语。结果同样引人注目:两种情况下,高分组识别的内容比低分组的一半还要少。这些实验结果与假设一致,用作者的话来说,“被‘运送’的个体更少地倾向于怀疑、质疑或不信任。‘运送’使人更加倾向于将信息识别为真实。”[59]换句话说,高度的叙事性运送损害了一个人的关键能力。

    格林和布罗克注意到,将叙事明确标注为真实或虚构,对它们“运送”读者的程度没有影响,他们评论道:

    一旦读者开始阅读一篇引人入胜的叙事,那么叙事来源(真实或者虚构)的影响力就会减弱。这样一来,不管故事是不是真实的,读者都可能会采纳故事所体现的信仰。因此,当信息的来源可信度较低或者演讲者缺乏有力论据的时候,叙事的这种优势都可以被利用。[60]

    因此,读者或听众越深入了解一个故事,他们就越会停止怀疑,也就越不关注故事的真实性或虚构性。虽然反向因果关系可能是分析能力较低的人更容易被“运送”,但“运送”会减弱分析能力这个逻辑更有意义,而且叙事越有说服力,其读者就越忘乎所以。

    换句话说,一个好故事通常能胜过最铁的事实。2015年9月16日的共和党初选辩论就是一个很好的例子。当被问及疫苗的安全性时,参选者之一、著名神经外科医生本·卡森简要总结了大量存在的数据,证明疫苗接种与孤独症之间缺乏相关性。而唐纳德·特朗普却回应说“孤独症已经成为一种流行病”,然后讲述了一个被他称为“漂亮的孩子”的雇员接种疫苗后患上孤独症的故事。大多数旁听者在这次辩论中支持特朗普;一位记者写道:“特朗普知道他在做什么,因为他讲的故事比仅仅陈述事实更具感染力和说服力。”[61]如果你想说服某人,就用叙事的方式以其大脑系统1为攻击目标,而不是用事实和数据以大脑系统2为攻击目标。

    音乐比叙事更能刺激系统1。听觉信息通过内耳的毛细胞传递到听神经,然后从下脑干传递到上脑干,再从上脑干传递到丘脑,丘脑将有关声音的信息发送给系统1和系统2(见图1-2)。

    图1-2 听觉信息至系统1和系统2的传递示意图

    一对丘脑位于脑干顶部;它们被认为是大脑接收来自下面的感官信息的主要中继站。丘脑直接与系统1相连,特别是伏隔核和杏仁核,它们分别介导愉悦和厌恶。[62]丘脑还向系统2的听觉部分发送声音信息,这些听觉部分包括一部分被称为赫氏回(也称颞横回)的大脑颞叶,及其以外的大脑皮质联合区,它们负责解释声音并使我们有意识地感受到声音。关键在于,听觉与系统2的连接更为间接,因此与系统1相比连接更慢。

    从丘脑到系统1的传导更直接,这意味着,一首令人兴奋的曲调通过系统2到达我们的意识之前,它可以先通过激活伏隔核使我们产生快感;相反,当我们听到电影中的反派或英雄即将到来的厄运所伴随的黑暗小调时,我们的杏仁核几乎立刻燃烧起来。

    因此,音乐可以看作通往人类情绪的一条进化久远的高速公路。由于音乐可以如此有效地绕过我们的系统2而直接作用于系统1,它的说服力自古以来就得到了充分的体现:旋律很可能在句法上早于复杂的人类语言,母亲们会自发地为婴儿唱歌,世界各地几乎所有的宗教仪式和爱国事件都涉及音乐。

    乔治·奥威尔描述了当猪少校用一首《英格兰牲畜之歌》劝诫其追随者反抗农场主琼斯时,音乐对动物农场中的非理性动物的吸引力:

    唱这首歌使动物们激动不已。少校还没唱完,它们就开始自己唱了。即使是最愚笨的动物也已经学会了曲调和一些单词,至于聪明的动物,比如猪和狗,它们在几分钟内就把整首歌记下来了。几次试唱之后,整个农场惊人地爆发出《英格兰牲畜之歌》。牛哞哞地唱,狗哀叫着唱,羊咩咩地唱,马呜呜地唱,鸭子嘎嘎地唱。它们非常喜欢这首歌,连续唱了5遍,如果没有被打断,那么它们可能整晚都在唱。[63][64]

    现实世界中,也许最著名的具有音乐说服力的例子就是莱尼·里芬斯塔尔执导的纪录片《意志的胜利》,影片记录了1934年的纽伦堡国社党代表大会。这部电影巧妙地将理查德·瓦格纳和纳粹作曲家赫伯特·温特的音乐编排到电影中,除了希特勒和其他纳粹领导人的演讲片段外,没有任何其他口头叙述。《意志的胜利》给好莱坞电影制作人留下了深刻的印象。后来,当美国加入二战时,弗兰克·卡普拉在拍摄《我们为何而战》系列电影时进行了模仿。

    到20世纪80年代中期,音乐开始成为一种政治工具。当时美国的政治竞选广告中开始频繁采用旋律:广告中出现候选人时就在主调上采用欢快振奋的曲调,而出现竞争对手时就采用不祥的黑暗小调(或偶尔采用马戏团小丑即兴表演所用的小调)。

    这类题材的经典之作是2004年乔治·W.布什命名为《狼》的总统竞选广告,伴随着黑暗和沉思的音乐,视频中一群狼蜷缩在草地上,一段旁白开始指责国会民主党人在一个危险的世界里反恐行动不力。音乐学家和传播学学者保罗·克里斯蒂安森评论道:

    虽然图像和旁白增添了广告意义,但它们只是音乐的侍女,音乐传达了大部分情感。这不是普通的音乐,是一种人们在恐怖电影里可以找到的音乐:低沉的嗡嗡声、原始鼓声、刺耳的不和谐和弦声、奇怪的音色,以及别的。[65]

    末日叙事引人入胜的另一个原因是,人类热衷于悲剧。路肩上多辆救护车聚集在一辆被撞得变形的汽车周围,这会引起围观并影响交通;而同样位置上一辆完好的废弃汽车则不会。“数十名矿工在爆炸中丧生”这样的标题会使报纸畅销,而“情况逐渐好转”这样的标题则不会。正如托尔斯泰在《安娜·卡列尼娜》的开头所说,“所有幸福的家庭都是相似的,而每个不幸的家庭则各有各的不幸”[66],很少有小说是通过描写幸福的婚姻和和睦的兄弟姐妹而成功的。

    人类更多地关注坏消息,而不是好消息。这似乎是人性的一个明显特征,因此心理学家们进行了很多实验,以验证我们对悲剧和厄运的关注。在一项研究中,受试者对一场足球比赛下注,一周后返回,结清赌注并与研究人员一起回顾比赛。那些输了赌注的人比赢了赌注的人讨论比赛时所花费的时间要长得多。[67]人类对坏消息的关注如此普遍,以至于“坏消息比好消息强大”已成为实验心理学的基本准则之一;从进化的角度,关注负面结果会使人类更加关注环境风险,从而带来遗传优势。[68]

    和许多生物进化所驱动的心理现象一样,坏消息更加受到关注,这证明了数字时代的功能失调。例如,一项研究发现,那些恐怖、耸人听闻的假新闻报道被转发的可能性比真实新闻高70%。研究人员指出,Bots(自动运行木马病毒)并没有加速虚假新闻的传播,而操作键盘和手机的人类却做到了。YouTube(视频共享网站)上的“三度亚历克斯·琼斯”现象已经成为媒体学者们之间的一个冷笑话:只需点击三下,就可以将一个更换割草机火花塞的视频,切换成琼斯先生愤怒地诉说桑迪·胡克学校大屠杀是一场“恶作剧”的视频。[69]

    鉴于负面新闻对人类的吸引力,《启示录》能够具有持久的影响力也就不足为奇了。

    菲奥雷的约阿希姆是最早构建末日之路的基督教神学家之一。他于1135年出生在意大利的脚趾地区卡拉布里亚[70],和他的父亲一样,接受过教育并担任公证人。之后,他在快30岁的时候去圣地朝圣,在那里经历了神灵启示。从圣地回到西西里岛后,他作为隐士在埃特纳火山上生活了一阵子,然后重新穿越墨西拿海峡,在卡拉布里亚地区做了一名漫游布道士。有段时间,他静下心来研究《圣经》,并在科拉佐的一所本笃会[71]修道院担任职位。他一定是个政治老手,因为他得到了教皇路爵三世[72]的鼓励和支持,成为修道院的院长,并成功地将修道院转为西多会。[73]随后,他与另外两位教皇进行了商谈,并获得了他们在思想体系上的认可。

    他被数字迷住了,尤其是7和12:圣奥古斯丁的七国时期,创世的7天,以及《启示录》里的7个封印和7个碗;以色列的十二使徒和十二部落。更妙的是,12可以分为7和5,代表小亚细亚的7个教会和5种感官。他认为,如此强大的数字命理学无疑可以应用于《圣经》解读,不仅可以用来揭示历史或伦理,还可以用来预测未来。

    他也喜欢数字3。他认为,圣三位一体[74]是关键:它将历史分为三个时代:圣父时代,从亚伯拉罕到基督诞生;圣子时代,从基督诞生到约阿希姆时代;最后一个是包括了现在和未来的圣灵时代,这个时代将由一位手持宝剑的天使引领。

    偏好数学的约阿希姆还将经文组织成几何图式,他在图式中将历史排列成各种形状,其中包括与历史“侧枝”相连的圆圈和树木。他在《图像书》(Book of Figures)中对此进行了描述。[75]

    现代读者可能会嘲笑这种不科学的数字命理——也就是数学家埃里克·坦普尔·贝尔所称的“数秘主义”——但中世纪的神学家有一个借口:希腊数学家毕达哥拉斯就是从纯数学中推导出自然界的规律的,其卓越成就在几千年的历史中熠熠生辉,他应该说过“万物皆数字”这样一句话。在弗朗西斯·培根提出以观察为基础的科学方法之前,数字在自然哲学中占据着重要地位,不仅在科学中是这样,在神学中也是。[76]

    用心理学术语来说,我们都是寻求“模式”的灵长类动物。这并不是一个新概念:1620年左右,培根观察到人类“具有自己的本性,倾向于假设世界上存在更多的秩序和规律”[77]。也就是说,我们天生就想寻找各种往往不存在的关联。这种倾向被科学作家迈克尔·舍默称为“模式化”。约阿希姆富有幻想的数字图式就符合人类的这一倾向。[78]

    人类为什么倾向于幻觉模式呢?进化论中的物竞天择提供了现成的解释。在遥远的人类历史中,如果人类错过了危险来临的线索,例如模糊的嘶嘶声或周边视线中黄黑色相间的条纹动物,付出的代价就会非常高昂,而如果出现幻觉,到处都听到蛇或看到老虎,那么人类也需要付出一定的代价,但这种代价与被蛇咬死或被老虎吃掉的代价相比并不高。因此,不仅在人类身上,而且在任何具有正常神经系统的生物体上,进化论都支持过度解释数据。[79]

    《圣经》的内容很多,大概有783000个单词,标准印刷版有2000多页,描述了无数的参与者及其活动事件,为那些寻求模式和关联的人提供了一个宝库,特别是偏爱数学的约阿希姆,他的历史图式结束在欢乐、自由和丰富的第三时代(即圣灵时代),在这个时代,所有信徒都可以直接获得上帝的真理,而不需要以教会为媒介,这种幸福状态将一直持续到最后的审判。[80]

    约阿希姆不会用上帝的信息煽动群众,因此他并不是一个革命性的或号召性的先知,而是一个令人困惑的圣经解释者。他认为第三时代(圣灵时代)中具有完善的人性和原始共产主义,能够战胜人类的一切恶习,特别是拥有物质财富的欲望,但他不愿意提供有关第三时代的细节信息。他的预言显得有些笼统:“每个人都将以这样一种方式被给予:别人所得会比自己所得更令他高兴;比起自己所拥有的,他更在意自己能够给予别人什么”[81]。约阿希姆描述的景象会在地球上逐渐显现,中间不需要插入《启示录》中可怕的异象,因此三任教皇都支持他。约阿希姆认为未来的第三时代最终将修正当前第二时代的缺陷,但是,受第二时代封建社会压迫的群众没有约阿希姆那样的耐心。他们想要采取更积极主动的方式推动第三时代的早日到来。

    约阿希姆的数学既具有公众吸引力,又能够运用于各种圣经派别和数秘主义,因此能够以这样或那样的形式一直持续到今天。例如,在他的继承者中,新近崛起了一个方济各会的属灵派,其被日益成功的教会物质主义排斥。对他们来说,数学很简单:《马太福音》1:17[82]清楚地指出,亚伯拉罕和大卫之间隔了14代人,大卫和巴比伦囚禁之间隔了14代人,巴比伦囚禁与基督诞生之间隔了14代人。因此,第一时代持续了42代,每代持续30年,总共1260年。当前的第二时代同样持续1260年,因此将在公元1260年结束,那时将开始出现持续1000多年的第三时代。

    随着中世纪的发展,衰落的封建主义、逐渐兴起的贸易和货币经济带来了经济的增长,但经济增长又导致了极端的收入不平等。这时产生了大量恶毒的反犹主义末日叙事,其中一个就是与马丁·路德[83]的宗教异端几乎同时出现的德语版本《百章全书》(The Book of a Hundred Chapters)。

    这本书的开始是天使长米迦勒向匿名作者转达来自上帝的讯息:人类激怒了全能者[84],他即将带来可怕的毁灭,但他决定暂缓;上帝希望作者聚集信徒,等待“黑森林皇帝”的到来;“黑森林皇帝”将带来血腥的启示录式的末日时代,以及丰富的食物和酒。信徒大部分来自受苦受难的穷人,他们参与了一系列广泛的谋杀,尤其对贵族和神职人员。这本书的弥赛亚并没有容忍,而是规定在4年半的时间里每天要谋杀2300名神职人员。[85]

    教会的腐败早就引起了人们的厌恶:早在马丁·路德和约阿希姆之前,神职人员,尤其是教皇的肆意挥霍和肉欲之罪早已震惊了基督教世界。路德只是在正确的时间、正确的地点成了正确的人。谷登堡大约在70年前发明的印刷机,将复印小册子或书籍的成本降低至原来的约1/30,而维滕贝格[86]的印刷机处于新技术的前沿,不仅可以打印拉丁字母,还可以打印希腊和希伯来字母。

    路德需要贵族支持他的宗教改革,因此他将宗教分歧严格限制在神学上而避开政治。这位伟大的改革者从《罗马书》和《彼得前书》中得到忠告,恺撒的法律仍然必须遵守:“看在主的分儿上,你们要服从人类的每一条法律。”[87]

    虽然路德反对那些寻求社会改革的人,但那些人确实运用了路德的方法。路德不仅摧毁了教会对《圣经》解释权的强大垄断,而且还向所有人展示了印刷机的强大力量。当被质疑布道很少的时候,他回答:“我们用我们的(印刷)书来做(布道)。”[88]

    16世纪初,歉收的庄稼、贪婪的贵族和狂热的路德教徒共同点燃了血腥的民众起义。据说,1523年6月23日,在路德将他的《九十五条论纲》钉在维滕贝格城堡教堂的门上6年后,在德国施瓦本地区,位于现代瑞士中部的北方,女伯爵卢芬斯特林根命令1200名农民为她收集蜗牛壳,她可能有大量的线需要蜗牛壳做线轴。而这时农民正忙于农收,女伯爵为了蜗牛壳而进行的逼迫激怒了他们,引发了一场席卷欧洲大部分德语区、持续两年的农民起义。[89]

    1524—1525年,农民军队与当地贵族的雇佣兵展开了一系列战争,其统称为德意志农民战争(俗称蜗牛战争),这些缺乏训练和武器的农民叛军遭到大规模屠杀,最终大约有10万农民被杀戮。

    在整个起义过程中,德意志农民叛军主要关注的是社会问题而非宗教问题,而这场起义的血腥结局却与宗教有关,主要发起者是一位名叫托马斯·闵采尔的千禧年传教士以及被他迷惑的疯狂的追随者。

    1525年3月,叛军在施瓦本的梅明根镇上集会,提出了12条要求,也就是《十二条款》,并印刷了至少2.5万份副本。只有第一条要求是明显关于神学的:每个城市都可以选出自己的传教士,他们将“简单地宣讲福音”,这大概是为了排除拉丁天主教的弥撒仪式。接下来的十条要求更是关于经济而非宗教的:包括如何支付传教士的报酬,废除农奴制,降低地租,狩猎和捕鱼的权利,以及归还最近私有化的公共土地等。最后一条要求谦恭地指出,如果上述十一条要求中的任何一条后来被证明与圣经背道而驰,那么它们都是无效的。[90]

    但是,起义后期,闵采尔成了农民军领导人。闵采尔至少阅读并解释过约阿希姆的一篇著作,但人们对他的出身知之甚少。最可接受的猜测是,他生于德意志亚琛城外的施托尔贝格镇,其位于现代比利时、德国和荷兰的交会地带;他是工匠家庭出身,教育背景也很模糊,几乎没有留下学业记录,有人说他父亲就死在一个腐败贵族的绞刑架上,因此他具有反独裁的末日倾向。唯一可以确认的信息是他大约于1514年被任命为农民军领导人,虽然这种任命不需要大学教育背景,但他的文笔表明他接受过先进的学业教育。

    三年后,路德的宗教改革运动在维滕贝格爆发,闵采尔前往那里,在革命的激情中畅饮。他可能见过路德,甚至在他的讲坛上讲过道;他当然遇到过路德的杰出同事菲利普·梅兰希顿。起初,闵采尔与路德派并肩作战,对抗教皇的支持者;1520年,路德推荐他接替约翰内斯·西尔维于斯·伊格拉努斯做茨维考的传教士。当时伊格拉努斯要去进修,和鹿特丹的伊拉斯谟等人文主义学者一起学习。

    在茨维考,闵采尔充分表现出他在神学上偏执的冲动和对建立“千年王国”的狂热。和路德一样,他将天主教神父和修道士称为“庞大的怪物”和“撕裂肉体的女妖”,并开始鼓吹,通过与上帝直接沟通也可以实现救赎,而与圣经无关。[91]这种说法对路德和伊格拉努斯来说都太过分了。伊格拉努斯当时已返回茨维考,并将闵采尔降职到该镇一个较小的教堂。在那里,闵采尔可能受到了茨维考“先知”的影响,这些先知分享给他一些神秘的信仰,包括理想的重要性,以及救赎与圣经的无关性。

    闵采尔进行了煽动性的布道并分发小册子,这导致他被驱逐,先是从茨维考被驱逐,然后是从布拉格和其他多个城市;最后,他落脚在萨克森人居住的阿尔施泰特镇上。在被驱逐的路上,他发展了自己的天启末日主题。1524年,他对萨克森州的约翰公爵进行了一次著名的布道,其主要围绕《但以理书》中的尼布甲尼撒之梦;公爵不可能不理解这个典故,但是他回应说,罗马教堂和那些支持它的贵族已经取代了但以理的希腊塞琉西帝国;闵采尔更加清楚地向公爵指出,有理想的先知们,通常是那些没有受过正规宗教教育的平教徒[92],但是他们在解释《圣经》方面起到了主要作用,他们现在都生活在末日前最后的日子中。最令人震惊的是,闵采尔宣称自己是新的但以理,他的追随者是“被选者”,他们理解末日的紧迫性,他们的出现不仅是为了观察,而且是为了积极实现它。

    闵采尔布道后,公爵愤而不发地离去。闵采尔继续出版了更多的反教权主义小册子,这进一步恶化了他和公爵之间脆弱的关系。最终,公爵受够了,他强制关闭了闵采尔的印刷机,并将闵采尔传唤到他在魏玛的城堡里,使其接受审讯。由于担心自己会被杀,闵采尔离开了阿尔施泰特镇,又在几个动荡的地方逗留后,他成为农民战争的高潮——弗兰肯豪森战役——的叛军领导人之一。

    至此,闵采尔已经说服了自己以及许多追随者,他们相信上帝让闵采尔开启末日。他不仅用自己的“千年王国”理想来说服民众,还引用了多段圣经经文来支持自己。他似乎对《马太福音》第24章印象深刻,这一章讲述了耶稣预言圣殿将被摧毁,随后发生饥荒、瘟疫、战争、地震等全球性灾难。上帝还用基甸之剑武装闵采尔,让他和他的军队战胜处于优势地位的贵族军队,据一位观察者说,他“用他的外套袖子抓住了敌人的所有子弹”[93]

    受此鼓励,1525年5月14日,农民叛军冲向贵族雇佣军(见图1-3)。但雇佣军仅以6人的伤亡为代价,屠杀了90%的叛军部队,约6000人被杀。[94]闵采尔仓皇逃离战场,但很快被抓获并被带到贵族面前,经过长时间的审讯后,他被斩首。[95]

    图1-3 1525年农民战争的地标

    闵采尔及其追随者的悲惨死亡,只是拉开了这场血腥的世界末日论的序幕而已。在繁荣的波罗的海海上贸易航线上,末日论将在接下来的10年里席卷欧洲西北部。

    2 滥用末日叙事的悲剧

    信徒与无赖

    1534年2月,威斯特法伦州的明斯特城的气氛狂热,居民们报告说,看见天空中出现了三个太阳,这在那个时代很容易被认为与尤利乌斯·恺撒死后出现的预兆相同,预示着将出现像屋大维、马克·安东尼和雷必达那样的后三头同盟[1]

    这一愿景尤其激励了一个被称为再洗礼派的新教教派,该教派反对天主教传统的婴儿洗礼做法,而是对新皈依者施行成年再洗礼。有一位名叫赫尔曼·冯·克森布罗克的天主教徒,他小时候目睹了1534年事件,后来他记录到:“天空似乎张开了嘴,出现长长的裂缝,可怕的火焰从裂缝中闪烁……(农民们)看到这座城市似乎着火了,但当他们赶来调查时,发现火焰不仅没有伤害城市,而且完全消失了。”[2]

    年轻的冯·克森布罗克对街头的疯狂事件感到惊讶,并将再洗礼派描述为:

    ……如此错乱,如此失常,如此被疯狂驱使,他们超越了诗歌中描述的愤怒。他们没廉耻地在市场上跑来跑去,有的头发蓬乱,有的衣服松散,有的头巾在风中飞舞。有些人跳起疯狂的舞蹈,仿佛要在狂躁中飞翔。有些人脸朝下趴在地上,伸出手臂,身体摆成十字架的形状……有些人躺在松软的泥浆里,一遍又一遍地翻滚。有些人跪下来大声喊叫。有些人睁着闪光的眼睛号叫。有些人口吐白沫。有些人摇头咬牙地做出威胁的表情,有些人捶胸顿足、招摇过市。有人哭,有人笑。从另一个角度看,与其说我们嘲笑他们的疯狂,不如说是为他们而悲伤。[3]

    托马斯·闵采尔短暂、血腥、笨拙的起义后不到10年,约阿希姆的另一批能力更强的子民在明斯特城企图实现他们狂热的末日愿景,这被称为再洗礼派的疯狂。1533—1535年,他们一度控制了市政当局,后来又在后者的最后攻击下失败。

    德意志农民战争惨败之后,群体疯狂的中心逐渐向北移动,到了今天的德国西部和荷兰所在地(见图2-1)。几十年来,这个地区在汉萨同盟[4]的推动下出现日益繁荣的局面。汉萨同盟是一个松散的贸易联盟,沿波罗的海和北海延伸,大致从今天的爱沙尼亚共和国到比利时的佛兰德。上一章所提到的德意志农民战争主要源于对社会的不满,但这一场德国和荷兰的民间叛乱是由一种新的宗教教义——再洗礼主义——所驱动的。

    图2-1 再洗礼派疯狂事件的地标

    8世纪末,查理曼[5]已经占领了明斯特城,该地区位于今荷兰东部、德国埃姆登城南部。他派了一位名叫卢德格尔的传教士去改变该地区的宗教信仰,并强迫当地居民皈依基督教。卢德格尔在当地某处河岸上建造了一座修道院,该城由此得名[6]。随着明斯特在汉萨同盟经济中日益繁荣,该地区富丽堂皇的主教堂和众多的礼拜教堂使城市景象更加繁荣。

    明斯特城基督教会的繁荣是有代价的:用于支持教会的沉重的什一税落在教徒身上,而神职人员却不需要纳税;修道士们耕种土地,修女们在织布机上工作,他们与当地农民和布料生产商产生了竞争。如此贪婪的教会并不是明斯特城所独有的:在整个欧洲,教会行为点燃了宗教冲突和公众愤怒的火焰。[7]

    再洗礼派本身起源于10年前在瑞士苏黎世开展的一系列晦涩难懂的神学讨论。1519年,一位名叫乌尔里希·茨温利[8]的天主教牧师建立了一座改革宗教堂。茨温利参加了一系列由市议会发起的正式教义辩论,被宣布为获胜者。他们在市议会面前辩论的议题之一就是洗礼时间。从逻辑上讲,只有成年人才能按照自己的自由意志行事,才能有意义地服从于基督,《新约》中的福音书也是这样描述的。但是,婴儿洗礼是从3世纪就已经确立了的,到马丁·路德和茨温利时期,几乎已经是一种普遍的、毫无疑问的教会做法。

    茨温利在这次辩论中的反对者之一,一位名叫康拉德·格列伯的商人,反对婴儿洗礼——“洗孩子”,因为这些神学后裔长大后可能会轻视它。辩论之后,格列伯为他的一个朋友乔治·布劳罗克施行了再洗礼,然后他们两人开始为其他成年人施行再洗礼。

    当时,这并没有引起什么。茨温利本人也评论说,他和格列伯之间只有很少的神学时间,只讨论了一些“不重要的周围事件,比如应该对婴儿还是成人进行洗礼,基督徒是否可以担任地方法官”[9]

    但再洗礼派的导火索已经点燃,或者更准确地说,是两条导火索:一条穿过波罗的海和低地国家(今荷兰、比利时,以及莱茵河、埃姆斯河、斯海尔德河和默兹河的河口),另一条穿过明斯特。这两条导火索分别燃烧,直到1534年,在明斯特合并,点燃了历史上最混乱的群体幻想之一。

    梅尔基奥·霍夫曼是一位德国毛皮贸易商,经常来往于汉萨同盟的城市间(可以带来丰厚利润),他点燃了波罗的海和低地国家的导火索。他比路德小10岁,在1523年左右获得维滕贝格大学的教授职称,并在来往行程中传播主张改革的异端教义。几年后,他对《启示录》念念不忘,开始背离路德的教义,宣扬一场即将来临的末日式善恶大战。

    和之前以及之后的启示性末日论者一样,他热衷于应用自造的末日数学。霍夫曼计算出,基督死于33年,使徒时期[10]持续了100年,直到133年。他认为,由于犹太人的罪行,人类受到了三年半的惩罚;由于巴比伦时期的邪恶,惩罚时间增加了20倍;由于教会对耶稣的疏离堕落,惩罚时间又增加了20倍,总共增加了1400年。因此,世界末日将发生在1533年,这一预言在波罗的海的多个贸易城市引发了暴动和混乱,包括吕贝克、斯德哥尔摩和一些丹麦港口。由于制造了这一系列混乱,霍夫曼被逐出这些城市。[11]

    就其性质而言,再洗礼主义是一种有吸引力但组织分散的神学,其信徒仅仅因为相信成人洗礼而被统一。最终,再洗礼派在整个西欧,尤其是汉萨同盟贸易路线上蓬勃兴起。霍夫曼的启示性再洗礼在低地国家取得了最大的成功,尤其是在东弗里西亚最大的城市埃姆登,其位于德国沿海地区,今荷兰边境以东。

    15世纪末,哈布斯堡人接替勃艮第人开始统治低地国家。此时,这些城市已成为欧洲大陆最繁荣的城市。在路德摧毁教会对《圣经》解释的垄断权以及谷登堡发明的印刷机的支持下,当地居民在一种被称为“秘密集会”的小型非官方组织下聚集。这种“秘密集会”是各种宗教派别的温床。

    1530年左右,霍夫曼经过当时宗教改革活动的密集之地——斯特拉斯堡,这座城市是再洗礼派中比较温和的瑞士版本的发源地,他将其嫁接到他的末日信条中。1531年,与《启示录》相呼应,他将斯特拉斯堡定为《启示录》提到的144000名神圣信使聚集的地方,并将在该城战胜邪恶势力的大规模围困。他向斯特拉斯堡市议会请愿建立自己的教堂,但这再一次导致他被驱逐,于是他回到了低地国家,对大量成年人进行再洗礼,仅在埃姆登主教堂的一次就有300人。[12]

    1531年12月,神圣罗马帝国当局——低地国家实际上的统治者,抓获了扬·沃克茨,他是霍夫曼的一个门徒,曾在阿姆斯特丹对50名皈依者施行了再洗礼。他们邀请他逃跑,但他选择了殉道,并与9名追随者一起被斩首。为了保护教徒,霍夫曼把宗派的教义改为禁止成人洗礼。[13]1533年,霍夫曼返回斯特拉斯堡,这很不明智。在那里,教会判定他犯有异端罪,罪行相对次要,并将他囚禁在一些条件恶劣的牢房中。他平静地接受了阴冷的新环境,因为他认为世界末日即将来临,自己不会在那里待太久。但是,这个很乐观的推测被证明是错误的。他在狱中度过了10年,其间,下面街道的市民偶尔会听到他轻轻地吟唱圣歌,并不断重复:“你们斯特拉斯堡的不敬上帝的经书家们有祸了!”[14]

    霍夫曼入狱后,他的追随者,一位名叫扬·马提斯的面包师来到阿姆斯特丹,宣称自己是先知以诺。令信徒们高兴的是,他又开始了成人洗礼。以诺是《旧约》中在生前就被上帝带到天堂的仅有的两个人物之一,另一个是以利亚,而霍夫曼在此之前已经盗用了以利亚的身份。此外,一些再洗礼派成员以《启示录》11:3~11:12的内容作为证据,证明以诺和以利亚是两个未言明的“被提”见证人。随着时间从1533年进入1534年,世界末日并没有到来,低地国家的信徒被迫将末日时间推迟到1535年,并将地点从斯特拉斯堡北移到宗教上更具宽容性的明斯特。

    1534年3月,至少3000名阿姆斯特丹的再洗礼派教徒试图穿越须得海[15]去往明斯特。哈布斯堡军队阻止了他们,并处决了大约100名异教徒,其余的被当作无辜受骗者放走。在那个时代,哈布斯堡军队的这种做法被认为是温和的。第二天,几个“使徒”激动地挥舞着刀,在阿姆斯特丹的街道上游行,警告说最后的审判将会在复活节前到来;他们被抓住并被杀死。那一年,(荷兰)海牙的哈布斯堡当局已经部署了“飞行纵队”,围捕这些低地国家的再洗礼者,对抓捕到的信徒施行酷刑,让他们在认罪和被处决之间做出选择。[16]

    1535年2月的一个寒冷夜晚,一群再洗礼者赤身裸体地跑过阿姆斯特丹高呼:“对神不敬者有祸了!”公开裸体象征着在上帝面前忠贞不渝,在明斯特也很常见。最后,拒绝穿衣服的男人被处死,拒绝穿衣服的女人被淹死。(刀和裸行者在荷兰语中留下了两个新词:zwaardlopers和naaklopers。)

    荷兰的许多其他城市也出现了再洗礼派暴动,这导致了更多的处决。到1535年中,多达20%的阿姆斯特丹人可能经历过成人洗礼,许多受洗礼者(如果不是大部分)都是无辜的局外人,他们是不断升级的镇压和抵抗(包括几场大规模的激战)下的难民。5月11日,携带武器的再洗礼者占据了该市的一个主要集市,在失败被捕之前,他们大声喊道:“爱上帝的人,加入我们吧!”3天后,当局挖掉了11名头目的心脏。当年夏天,当局割断了一位再洗礼派领袖的舌头,因为他用舌头来布道;然后,当局砍掉了他的右手,因为他用右手洗礼;最后,当局砍了他的头。[17]

    即使对于那个时代,这场对再洗礼者的镇压也显得很残酷,肯定比路德和茨温利的追随者遭受的镇压要残酷。路德和茨温利废除了教会对《圣经》解释权的垄断,这已经够糟糕的了,但至少他们尊重私有财产,尊重世俗化的政府权威。而在大多数情况下,再洗礼派却主张没收集中的财富,特别是集中在教会手中的财富,并否认现有政府的合法性。再洗礼者还在煽动性的言论中掺入了即将来临的末日这种信念;很多时候,行动会加速灭亡。

    尽管荷兰的再洗礼者众多,但由于哈布斯堡家族对荷兰控制得过于严格,他们无法成功;他们需要更温和的政治土壤,这意味着,一个事实上不受哈布斯堡家族控制的城市。他们发现了明斯特,并在那里点燃了再洗礼派疯狂的第二条导火索。

    许多汉萨同盟的城镇,如但泽和吕贝克,都是所谓的“自由城市”,基本上独立于遥远而日益衰落的神圣罗马帝国皇帝,只在名义上效忠。这些几乎独立的城镇大多由当地贵族统治,例如明斯特由一位“亲王主教”统治。被选为“亲王主教”的代价通常非常昂贵,其需要由当地大教堂挑选并必须经过教皇确认,他们更多的是以封建主的身份进行统治,而不是政教合一的身份。

    1525年,明斯特的亲王主教弗雷德里克·冯·维德由于害怕农民战争,将权力下放给一个由24名成员组成的委员会,其中包括两名共同市长。与低地国家政府不同,该委员会基本不受哈布斯堡的影响。近10年后,该委员会将成为再洗礼派实施疯狂暴力破坏的楔子。[18]

    再洗礼派将滩头阵地定在明斯特,大多数历史学家将这归因于贝尔纳德·罗特曼。他于1495年左右出生在一个铁匠家里,与他的祖先一起被指控犯有巫术罪。小罗特曼被描述为具有“变化无常的、小丑的气质”。由于太穷,他没有上学。他叔叔在明斯特圣莫里斯教堂担任教区牧师,在叔叔的指导下,他成为唱诗班男童,后来以唱歌谋生。到青春期结束声乐生涯时,他已经赚得了在美因茨市学习所需要的钱,并在那里获得了硕士学位。1529年,他回到了圣莫里斯教堂。[19]

    1530年左右,罗特曼已经成为一名有说服力的传教士,得到了富有布商贝尔纳德·克尼佩尔多林的资助。克尼佩尔多林还担任协会会长、市议会议员,首先皈依了路德教,后来在罗特曼的影响下成为一名秘密的再洗礼派教徒。克尼佩尔多林印刷了罗特曼的小册子。不仅在明斯特,而且在低地国家,这些作品都点燃了再洗礼的火焰。

    现代社会对疯狂的再洗礼派的了解在很大程度上归功于两位观察者,一位是前面提到的赫尔曼·冯·克森布罗克,另一位是海因里希·格雷斯贝克。后者是一位皈依再洗礼派的木匠,参与了整个过程,并在最后扮演了一个小而关键的角色。冯·克森布罗克和格雷斯贝克都留下了详细的书面记录,他们在记录中所体现出的个人偏见表明,这些记录看上去是可信的。[20]

    根据冯·克森布罗克的描述,最初罗特曼忠实地传授天主教教义,但后来:

    渐渐地,他开始将那些看上去与天主教教条背道而驰的教义融入他的布道中。他开始煽动平民对神职人员的愤怒,这吸引了一些渴望新奇事物的市民。[21]

    他在圣莫里斯教堂的上级决定保护他们的信众不受日益激进的观点的影响,因此借给他20个金弗罗林[22]供他去科隆深造学习。他既没有去也没偿还借款;相反,他直接前往了维滕贝格。路德和梅兰希顿的家就在那里。

    1531年,这位年轻的牧师回到了圣莫里斯教堂。他作为一位坚定的路德宗教徒,陶醉于作为煽动者的快乐之中,非常善于吸引人群到城墙外的小教堂里。根据冯·克森布罗克的记录:

    许多人,特别是那些被债务压得喘不过气来的人,像尊敬上帝一样尊敬他,听信他说的每一句话,并深信他的行为都是奉上帝之灵。即使官方明令禁止,他们还是成群结队地从城里跟着他,因为他们渴望听到他讲话,他们的渴望如此强烈,以至于他们认为除了他之外没有其他传教士了,他们蔑视、谴责和诅咒其他人以及所有的神职人员。[23]

    作为一名忠诚的天主教徒,冯·克森布罗克对罗特曼的布道不屑一顾,“与其说是有确凿的论据,不如说是拙劣的诽谤”。然而,无知的平民们无法区分什么是雄辩,什么是夸夸其谈,他们认为他说得很好。[24]

    此时,罗特曼已被圣莫里斯教堂免去牧师职务,他带领一伙暴徒来到教堂,砸碎了神像,推倒了祭坛,砸碎了一个银杯,焚烧了圣母玛利亚的画像。当局再次驱逐了他,他又一次到了维滕贝格,在那里,他给路德和梅兰希顿留下了深刻的印象,据说他们俩很有先见之明地评论道:“罗特曼要么非常好,要么非常坏。”[25]

    1532年,罗特曼再次回到明斯特,他开始公开支持再洗礼派的观点。这是一把双刃剑。成人洗礼不仅获得了听众的认可,也得到了教会的许可。到那时,对于曾经把再洗礼者绑在木桩上焚烧,以及曾经将石头绑在再洗礼者的脖子上并将他们抛入水中,教会已经表现出一丝内疚。用再洗礼主义学者克里斯托弗·麦基的话说,“有点儿像一个神学笑话”[26]

    此时,亲王主教冯·维德仍然控制着这座城市,并强迫罗特曼停止亵渎神明的行为。罗特曼遵从了几个星期,但随后又不顾一切地给冯·维德写信说:“我问心无愧,因此我毫不怀疑我可以依靠上帝的怜悯。他会保护我,把我从危险中解救出来。”[27]

    1532年2月,罗特曼在该市的一个主要教堂——圣兰伯特教堂的院子里布道,公众被他动摇了,自发地选择以他作为自己的牧师。更重要的是,他在市议会中赢得了足够的支持,他不会再被驱逐。明斯特的宗教热情不仅限于再洗礼;全城的教堂中都有激进的路德派传教士,除罗特曼以外,他们都来自其他城市。

    在使城市皈依方面,罗特曼的成功与低地国家的霍夫曼和马提斯不相上下。罗特曼在圣兰伯特教堂的布道结束后不久,冯·维德在失意中辞职,他的继任者在被祝圣[28]之前就去世了;6月,没有多少基督教会背景的一位伯爵的儿子,弗朗西斯·冯·瓦尔德克,升任亲王主教。下半年,他封锁了这座城市,而作为回应,再洗礼派成功地突袭了城墙外冯·瓦尔德克的总部,这样明斯特就完全处于叛逆的再洗礼者的控制之下了。1533年2月,他们达成了一项妥协:教区教堂可以实行路德教,而大教堂将保持天主教。[29]

    尽管达成了妥协,但明斯特的天主教徒和路德教徒的时间已经不多了。罗特曼的小册子,由富有的布商克尼佩尔多林承销,已经渗透到了低地国家。这些小册子将私有财产列为邪恶的根源:“上帝所造的万物都是共有的,就像今天仍然可以共同享受空气、火、雨和太阳一样,任何东西都不能让某些偷窃者抓在他们自己手里。”罗特曼将明斯特描绘成一座富足的城市,它张开双臂欢迎信徒,数百名来自低地国家的可怜人南行至明斯特——再洗礼者口中所谓的新耶路撒冷城——去朝圣。

    1533年初,天主教徒、传统的路德派教徒和再洗礼派教徒不稳定地混杂在这座城市,其中的再洗礼派不想遵守与亲王主教之间的协议。与此同时,从低地国家涌入很多再洗礼者,引发了3月份的特别委员会选举,选举结果是激进的路德派占多数,相当多的再洗礼者占少数,没有天主教徒。[30]市议会对那些在基督大教堂给婴儿洗礼的家庭处以罚款,标志着新的统治开始。

    与此同时,在低地国家,扬·马提斯为一个来自莱顿市的名叫扬·博克尔松[31]的人施行再洗礼。和霍夫曼一样,马提斯是一个冲动、暴躁的传教士,而扬·博克尔松则利用自己的戏剧表演技巧和精于算计的能力塑造出一股强大的政治力量。

    作为一名镇长和一名农奴妇女的私生子,博克尔松一出生就面临着痛苦和失望,父母安排他接受了初级教育,并让他在裁缝店做学徒,但他并不擅长于此。他的一些其他天赋,很快就在明斯特显现出来:金发碧眼的英俊外表,优雅、狡黠、富有演讲造诣和表演天赋。用千禧年学者诺曼·科恩的话说,他利用这些天赋“将现实生活塑造成一部戏剧,以自己为主角,以整个欧洲为观众”[32]

    1533年末,马提斯派了几名使者前往明斯特,他们于次年1月抵达。其中包括博克尔松,他在前一年夏天来过这座城市。一到那里,他们就发现罗特曼及其追随者已经为城里的大概1/5的成年人施行了再洗礼,该城有多达1/3的人相信世界末日即将来临。马提斯本人于1534年2月9日来到这里。[33]马提斯和博克尔松的到来标志着两位再洗礼者融合在一起:罗特曼具有说服力的土生土长的明斯特再洗礼主义,以及梅尔基奥·霍夫曼从低地地区衍生的催眠般的末日幻觉。对双方来说,他们抵达明斯特的意义非常明确。用学者拉尔夫·克勒策尔的话说:

    先知派遣使者施洗被解读为上帝正在准备世界末日。在此背景下,战争、瘟疫和通货膨胀,以及帝国的改革,突然成为末日的预兆。[34]

    事情从这里开始发展迅速。再洗礼派让使者到邻近的城市传达信息:到1534年复活节,上帝会回来惩罚恶人,很少有人能活下来;只有在新耶路撒冷城明斯特才能获得平安和救赎。世界末日即将来临。

    1534年2月6日,罗特曼为河对岸女修道院的修女们表演了一场滑稽戏剧:

    他发表了一场赞美婚姻的布道,并用他演讲中神奇的击槌声打开了修女们童贞的营房。他似乎在敦促修女们去繁殖人类,而修女们对此并不十分反感。接下来,为了让修女们进一步从愚蠢过渡到彻底疯狂,他告诉她们修道院的塔楼及房屋结构将在第二天午夜倒塌,连同所有住在里面的人。他的神谕带给修女们的与其说是痛苦,不如说是欢乐,因为她们的灵魂充满了欲望,憎恨修女的生活。[35]

    这些年轻的修女无处可去,她们认为罗特曼是上帝派来的人,于是带着自己的财产跑去了他的家。整个城市的市民都无眠,迎接末日的到来。

    但是末日没有到来,为了挽回面子,罗特曼利用了一个正符合时机的圣经例子——约拿的故事,约拿错误地预言了亚述首都尼尼微的沦陷,全能者出于怜悯而没有责罚他。两个早晨后,再洗礼派的其他成员担心罗特曼的预测能力会使教派受损,于是滑稽地冲过街道,用“可怕的喊叫和疯狂的怒吼”大声宣讲,让不信教的人忏悔,试图以此来维护他们的信誉。那天下午,扬·博克尔松和克尼佩尔多林也加入了进来,一次又一次地大喊:“忏悔!忏悔!忏悔!”他们的疯狂感染了其他人,所有人一起以各种各样的姿态跳上跳下,摇着头,还有的扑通一声倒在泥里。一位再洗礼者骑马疾驰而过,宣布结束,并告诉所有人,他看见了成千上万的天使,所有人都将听到天使们的声音。[36]

    这种疯狂激励了再洗礼者,当天晚些时候,500名再洗礼教徒占领了城市市场,后来被主流路德派教徒阻止。但路德教的阻止是短暂的;在2月23日的选举中,再洗礼派最终完全控制了市议会。2月底,武装的再洗礼派向非教徒发出最后通牒:选择接受再洗礼或被驱逐,“从这里滚开,你们这些不虔诚的人!上帝会惩罚你们!”[37]

    再洗礼派摧毁了教堂的祭坛,并花费数天时间掠夺教堂里的金银,还焚烧雕像。他们还收取刻有“DWWF”的铜币,以允许行人通过戒备森严的城门。到了月底,亲王主教的军队开始围攻明斯特城,博克尔松告诉信徒,圣经要求,当末日来临时,上帝准许基督徒不再容忍,并准许他们全副武装去防御。

    第一批被驱逐的天主教徒被允许带走他们的财产,但短缺的食物除外;最后一批离开的人只能带衣服,但衣服上的纽扣和金钩都被没收了。[38]再洗礼派教徒对政变中路德教对他们的反击记忆犹新,他们把愤怒集中在男人身上。而路德教徒和天主教男子预测亲王主教能够夺回这座城市,因此留下他们的女人来守卫他们的房屋和财产。这造成城墙内女人数量过多,很快将产生可怕的后果。[39]

    1月,再洗礼者自愿捐出所有的物质财产——因为世界将会在复活节终结,但是到了3月,市议会开始禁止私人持有财产;罗特曼和博克尔松要求所有的金银和纸币都要上交到市政厅。为了鼓励捐赠,博克尔松宣扬,信徒有三种分类:完全放弃自我的好基督徒;保留部分财产的人,他们需要向上帝祈祷,但是上帝会心存报复;只为了方便而受洗的人,他们什么也指望不上,在末日将会被烧死。

    马提斯和博克尔松把镇上所有人都聚集在大教堂广场上,向他们大声喊道,仁慈之门已经关上,上帝很生气。那些已经受洗的人被聚拢在一边,剩余的人,总共大约300人,被解除武器,被迫俯伏在地,祈求怜悯一个小时,这期间随时都可能被杀死。然后,他们被带进大教堂,被迫跪祈上帝3个多小时。最后,教堂门外的博克尔松戏剧性地打开门宣布:“亲爱的兄弟们,看在上帝的分儿上,我要告诉你们,你们得到了上帝的怜悯,你们将与我们同在,成为圣人。”第二天,他对镇上2000名未受洗礼的妇女重复了这个过程。[40]

    到3月底,这座城市已经经历完一次宗教清洗;大约有2000名天主教徒和未受洗礼的路德教徒被驱逐,人数与从荷兰和东弗里西亚迁移来的再洗礼者人数大致相等,因此人口基本保持不变,约为9000。但是,该镇的宗教结构以及心理结构已经发生变化。不易受到他人影响的天主教徒被更易受到影响的再洗礼者取代,这加剧了已经变得明显的群体幻想行为。此外,对不敬虔者的驱逐和信徒的迁移只会加强“新先知”罗特曼、马提斯和博克尔松所说的“大灾难”的确定性,即末日真的要来了。

    再洗礼者不仅要拥抱未来,还要毁灭过去,因此他们下令销毁所有市政记录,特别是债务分类账簿。狂热者们焚烧路德和阿奎那[41]的书籍;一些家庭和教堂里只剩下《圣经》。最终,博克尔松还对城市的门和街道进行一般性重命名,例如,圣路德门被简称为南门,他还按照字母顺序指派姓名给新生儿。[42]

    这些“新先知”开始残酷地惩罚持不同政见者。一位名叫胡贝特·吕舍的铁匠,在2月份的选举中失去了议会席位,还对市政记录被毁感到不满。于是他被带到博克尔松面前,先是戏剧性地被赦免,然后戏剧性地被释放,他哭着求饶,但是被一把戟刺中背部。这位身体强壮、肌肉结实的铁匠还没有死,于是博克尔松朝他的背部开了一枪;吕舍被痛苦折磨了8天才死去。[43]

    复活节前不久,马提斯参加了一些朋友的婚礼;他预言了自己的死亡,格雷斯贝克对此做了记录:

    他在那里坐了一个小时,拍打着双手,上下点着头,沉重地叹着气,就好像快要死了。最后,他又醒了过来,叹了口气说:“哦,亲爱的父亲,不要照我的意思,只要照你的意思。”他站起来,把一只手伸向每一个人,并亲吻他们的嘴唇。他说:“上帝的平安与你们同在。”然后他和妻子一起走了。(那时,再洗礼者还没有很多妻子。)[44]

    1534年,复活节在4月5日到来,但耶稣没有出现,世界也没有结束。那天,马提斯和十几名追随者离开城门,骑着马走向亲王主教的雇佣兵,后者开始屠杀他们。格雷斯贝克记录说,围城者将马提斯的尸体切成100块,玩耍似的用血淋淋的碎片相互撞击,并用一根长矛挑着他的头,然后向城内喊话:居民们应该找回他们的市长。[45]马提斯可能是想吸引耶稣回来,或者,为了完成《启示录》11章中的一段话,即以诺(他自己)和以利亚(霍夫曼,仍被扔在斯特拉斯堡监狱中)的死亡将标志着耶稣的回归。

    博克尔松在乡村传教多年,还在上一年夏天到过明斯特,传教经历磨炼了他戏剧般的间谍技巧。在附近的舍平根镇,据说他通过洗礼治愈了一个生病的女孩,到1534年初他再回到明斯特时,已经很有名气了。他很可能一直在为这一时刻做准备。在此之前,他在明斯特一直保持着相对低调的姿态,马提斯去世后,他站在教堂的上层窗户处俯瞰人群,身穿白色长袍,沐浴在烛光中,右边是克尼佩尔多林,左边是迪沃——马提斯美丽而神秘的妻子,历史只记载了她的教名。

    博克尔松告诉群众,马提斯应该被处死,因为他虚荣并贪婪,这让群众大为震惊。博克尔松指了指克尼佩尔多林,并告诉人们,当他住在克尼佩尔多林家时,看到了马提斯血淋淋地剖开了一名雇佣兵的肠子。这名雇佣兵告诉博克尔松不要害怕:马提斯将受到上帝的审判,而他,博克尔松,必须迎娶他的遗孀迪沃。之后,博克尔松再次指向克尼佩尔多林,让他证明雇佣兵说这话的时候他也在场。人群对这一神圣景象感到兴奋,不少人脱下衣服跳舞,所有人都知道了,博克尔松继承了马提斯的职位。[46]

    马提斯和罗特曼还遗留了一个问题,那就是为什么耶稣又一次没有出现,博克尔松必须向信徒解释这个问题。他预言,耶稣现在不会回来,直到新耶路撒冷城清除所有不洁的元素。

    博克尔松不仅是一位杰出的煽动家,而且还是一位有能力的军事指挥官。他加强了该市本就很强大的防御警戒线,包括双墙、护城河和石制圆形大门。9000名公民面对的是数量大致相等的雇佣兵,因此不允许有累赘:妇女不仅在火药厂协助男子,而且还将亚麻花环浸入沸腾的沥青和生石灰锅中,从城墙上扔到突袭的雇佣兵身上。晚上,博克尔松的人溜进雇佣兵帐篷,割断他们的喉咙,并给幸存者留下纸条,鼓励他们皈依再洗礼派。

    5月25日,博克尔松的部队轻松击退了亲王主教军队的进攻,其中许多人投奔进城(尽管其中6人不久就因酗酒闹事而被处死)。[47]这场胜利极大地鼓舞了再洗礼者;当然,上帝是站在他们这一边的,亲王主教军队的失败巩固了再洗礼者对城市的控制。

    7月,博克尔松宣布所有以前的婚姻无效,并命令所有成年人再婚。此时,路德教和天主教留下的女性加剧了男女比例失调,女性的数量几乎是男性的三倍。因此再洗礼派鼓励一夫多妻制。起初,再洗礼派中那些富有攻击性的男性疯狂地在城市里四处寻找年轻女性和童女,他们基于一个理论,用格雷斯贝克的话说,“拥有的妻子越多,这样的基督徒就越好。”很快,领导层意识到,由此产生的自由放任的雄性激素已经破坏了城市的稳定。为了遏制这些疯狂男性的行为,他们规定,新娶必须经过主妻的同意,并允许各方当事人都可以提出离婚。但即便如此,第一任妻子也对他们新扩大的家庭感到不满,这是可以理解的,她们经常虐待这些新添的妻子。为了鼓励人们遵守一夫多妻制,领导层将最顽固的妻子监禁起来,并斩首了不少人。[48]

    婚姻法引发了一场暴动。大约120名男人抓获了博克尔松和克尼佩尔多林,并指认他们为刽子手,但是一场反击战将这二人又营救了出来。大多数叛乱者都祈求到了宽恕,但博克尔松枪杀、斩首了47名叛乱者,还有少数叛乱者被砍死。除此之外,博克尔松还处决了更多抵制一夫多妻婚姻的妇女。

    8月,亲王主教又进行了一次袭击,他们几乎冲破了内墙,但最终被击退。袭击者遭受了可怕的损失,因为当他们爬向城墙抬起头的时候,发现迎接他们的死亡形式是煮沸的大锅、木柱和树木,一旦木桩和树木掉落,会立即将他们其中的几个人从爬梯上带下。他们中的幸运儿从破裂的外墙逃了回来。之后,亲王主教的军队几乎解散。[49]

    这场胜利鼓舞了博克尔松的精神和气势;他认为自己是大卫王转世,也是这个星球唯一合法的统治者。他还英明地推断,这样一个惊人的说法最好是出自他人之口。那年夏初,一位名叫扬·杜森舒尔的跛行金匠从附近一个小镇来到明斯特,他自称拥有预言能力。果然不出所料,在亲王主教第二次袭击失败后,他宣布上帝已为博克尔松施了涂油礼,任命他为国王。[50]

    作为君主,博克尔松宣布明斯特的旧宪法不适合新的神圣秩序,废除了市议会和两个市长职位,并以皇家法庭取而代之。“新耶路撒冷”被重新命名为“上帝的子民”。

    在击退亲王主教的第二次进攻后,邻近的亲王加强了封锁,并任命了一名新指挥官。因此,食物和供应品很难偷运到市里;这位新国王的臣民们衣衫褴褛,慢慢被饿死。博克尔松却一点儿也不担心,他对戏剧和戏服的热情开始高涨。格雷斯贝克这样描述博克尔松:

    他为自己做了一件天鹅绒外套,用华丽的丝织布制作成华丽的紧身裤和紧身短上衣,还有华丽的金帽子、一顶带天鹅绒细绳的皇冠、一把配有金鞘的刀、一把配有金鞘的匕首、戴在脖子上的许多金项链……他把世界挂在链子上,就像在他的盾形纹章上挂着的那个金色圆球一样。这像他的盾形纹章一样闪烁着蓝色斑点。[51]

    博克尔松的奢华感还延伸到为他的骑兵装备华丽的衣服,用华丽的丝绸,“制作成半身服装,一只手臂没有袖子,胸部镂空,因此他们在马背上能给人留下深刻印象”,并为他的家仆穿上红色外套,配上灰色或金色戒指,以戒指大小显示仆人等级。[52]

    10月,杜森舒尔将预言中博克尔松的统治权扩展到整个地球,并宣布上帝将吹响三次号角,这标志着该城通往上帝应许之地的旅程开始。1534年10月31日日出前,瘸腿金匠杜森舒尔爬上圣兰伯特教堂的塔楼,吹响了牛角。然后他下楼,继续在街上吹喇叭,其他人则吹奏其他乐器。成千上万的居民费力地走向大教堂广场,男人们扛着武器,女人们抱着小孩和她们最珍贵的财产。更多的号角吹响了,博克尔松骑着一匹白色的种马,全身行头,在20个护卫的簇拥下来到这里;后面跟着的是坐在马车里的迪沃王后,她由仆人侍奉着,还有他的另外15位妻子。

    此时,博克尔松已经把没有到来的末日提升到了高级剧场。他命令一位受尊敬的贵族,格拉赫·冯·武伦,带领自杀式冲锋队冲向围攻部队。然后,这位国王让冯·武伦宣布,这只是一次旨在测试他们意志的演练,他很高兴地通知他们,他们已经通过了。博克尔松脱下他的猩红色长袍,摘下王冠,放下君主权杖,和他的“长老们”一起为饥饿的群众提供了一场盛宴。除了给他们供应食物,博克尔松和长老们还与男人们开了一个轻松的玩笑——谈论他们妻子的数量。格雷斯贝克写道:

    只有一位妻子的市民羞愧地坐着。这样的人还不算信徒,不算一个真正的基督徒……他们坐着吃喝,兴高采烈。在大教堂广场上,这些人看上去并不像马上要死的人,每个兄弟都坐在妻子们旁边,到晚上可以选一位他渴求的人和他一起上床睡觉。[53]

    市民们饱足后,博克尔松站起身来,声泪俱下地宣称,他辜负了人民的期望,将退位。博克尔松刚说完,杜森舒尔就转达了上帝那里传来的消息:上帝命令他和其他26个人一起前往附近的4个城镇传播消息,以加速末日的到来。

    此外,杜森舒尔透露,博克尔松应该恢复其国王的职责,其中最主要的职责就是惩罚明斯特城中的不虔诚行为。然后,这位金匠把王冠重新戴在国王的头上,并把他的猩红色长袍和君主权杖还给了他。

    这戏剧性的一幕也许就是博克尔松本人的杰作;他在27名信使及其134位妻子面前,一举提升了自己的权威,摆脱了潜在的竞争对手。然后,国王和他的妻子以及宫廷人员,吃了一顿丰盛的晚餐;每上一道菜前,他的仆人都会大吹大擂。晚餐结束时,博克尔松沉默地坐了一会儿,然后告诉在场的人,他从上帝那里得到了启示,上帝命令他把刀和一个被俘的雇佣兵带来。他命令俘虏坐下,被拒绝后,他威胁俘虏说要把其腰斩,而不仅仅是斩首,俘虏未反抗。完成了上帝的旨意后,博克尔松结束了这顿饭。[54]

    27名信使离开了;然后26名信使被抓获并被雇佣兵处决了,除了一个名叫海因里希·格拉斯的人,他因会说拉丁语而没有被杀。这也引起了亲王主教的注意,使格拉斯有机会叛变。[55]

    格拉斯回到明斯特,讲述了他戏剧性地从亵渎上帝的人手中逃脱的故事,然后离开了这座城市,将无价的情报送给了亲王主教:食物和武器已经短缺,这座城市已经分裂,一边是曾经忠诚但现在饥肠辘辘、士气低落的民众,另一边是再洗礼派的精英们,他们的特权使他们能够保持精气和幻想。

    格拉斯离开这座城市之前给镇上的人留下一封谴责信:“现在明斯特正在进行的行为都是一场骗局,因此,我谦卑地祈祷你们最终睁开眼睛——是时候了!注意你们的行为,你们显然违背了上帝和他神圣的话语。”[56]尽管信使们已经被杀,但博克尔松安慰信徒们,信使死亡是上帝的意愿,他派遣了更多的信使到更远的低地国家去招募新的再洗礼者来守卫城镇。为了迎接增援部队的到来,他下令制造装甲车,以穿越封锁线回到城镇。

    但增援没有到来,第二批信使也杳无音信。这些持续出现的不幸事件,再加上邻近亲王向亲王主教支援了更多的雇佣兵,使他们没有机会再取得军事胜利。罗特曼告诉市民,虽然他们不能依靠外部世界,但上帝会拯救他们。随着食物和资源的日益匮乏,博克尔松削减了军队,转而专注于神学研究。

    1535年1月1日,博克尔松发表了一份宣言,其中规定,“只有那些以上帝的话语为导向的政府才能得到保护”,“做出法律决定是国王、他的摄政者以及法官的特权”,“一个不受非基督胁迫的政府不应该受到干涉,即使它还没有接受信徒的洗礼”[57]

    一群年仅10岁的儿童因偷窃食物或涉嫌叛国而被处决。一位名叫图尔班·比尔的丹麦贵族离城后不久被发现是间谍,三个知情妇女在大教堂广场被斩首。其中一个是克尼佩尔多林的情妇,她没有被纳为妻子,因为她是妓女。被带到断头台上时,她公然谴责克尼佩尔多林的背叛行为;愤怒的克尼佩尔多林抓起一把刀砍了她的头。[58]

    到了复活节,低地国家的救援部队还没有出现,博克尔松宣称,他一直以来都是从精神意义而不是军事意义上定义“胜利”的。当镇上的流浪猫狗都已经被吃掉的时候,饥饿的市民们才被允许离城。

    博克尔松给予民众三四天的离城期限。离城民众的衣服被交换为破布;那些在期限之外离开明斯特的人被抓获并被处以绞刑。还有少数按照期限离城的民众被城外的雇佣兵屠杀,他们的头被挂在木桩上。格雷斯贝克将此解释为“霍布森选择”[59]:“他们仍然选择从城市叛逃,因为他们在城市里遭受了如此巨大的饥饿。他们宁愿被杀,也不愿在巨大的饥饿中受苦。”[60]

    几周后,为了节省食物,博克尔松允许男人与他们的某些次要妻子以及孩子断绝关系,这样他们就可以离开;博克尔松也和他的妻子以及孩子断绝了关系。格雷斯贝克观察到,“如果有人出一块面包,那么肯定有一些再洗礼者愿意用一位妻子换回一块面包。当没有面包的时候,法庭就没什么存在意义”[61]

    这时,雇佣军每天都要将50名男性逃犯斩首,让逃犯中的妇女和儿童挤在围墙外的一块几百码宽、周长4英里的地狱般的土地上,其在一个多月的时间里都没有食物和住所。后来雇佣军允许其中的外国妇女和儿童回家,明斯特当地人被拘留,一直到城市沦陷。[62]

    大约5月23日,格雷斯贝克和其他几个人也逃离了这座城市。和以前大多数逃离者一样,他们被抓获了,但幸运的是没有被杀;就格雷斯贝克而言,由于他年轻、个性讨人喜欢以及抓获他的雇佣兵心地善良,他只是被判入狱。[63]他的成功逃离鼓励了数百人逃离明斯特,但最后几乎所有人都被杀了。

    格雷斯贝克在牢房的泥土地上为雇佣兵画了一张地图,勾画出军队应该如何进入城市。6月22日晚,一位名叫“朗斯特里特的小汉斯”的人(曾是围攻者,后来叛变到明斯特,然后又和格雷斯贝克一起逃离明斯特)和格雷斯贝克通过一个小型浮动桥游到一个能够穿过护城河的地方,35名雇佣兵从那里迅速穿过护城河,杀死了熟睡的哨兵,用小汉斯的钥匙打开了大门。在防御者最终关闭城门之前,至少还有300多名雇佣兵沿着又短又细的堤道进入(比起格雷斯贝克,围攻者们更信任小汉斯,也许是因为小汉斯最初是他们中的一员,所以小汉斯带领他们进攻,格雷斯贝克则留在桥上)。重新关闭城门后,困在城墙内的入侵者本来几乎就要被博克尔松的部队消灭了,但他们狡猾的指挥官威廉·施特丁用假谈判拖延了一段时间,直到后来亲王主教的主力兵团涌入该城,并在残酷的肉搏战中扫荡剩余的再洗礼者。[64]

    雇佣兵屠杀了600名居民,当他们发现每个人分到的战利品份额为50荷兰盾(相当于今天的1600美元)时,可能存在的任何罪恶感都消失了。再洗礼派护城河首领克里斯蒂安·克尔克林克很快被处决,一起被处决的可能还有迪沃王后。但博克尔松、克尼佩尔多林和另一名副手布伦德·克雷切丁克因各种神学犯罪、盗窃和谋杀的罪名而被慢慢审讯。博克尔松被捕几天后,亲王主教悲伤地问道:“你是国王吗?”博克尔松傲慢地回答:“你是主教吗?”[65]上层领导中可能只有罗特曼逃脱了,而且人们再也没有听说过他的消息。

    1536年1月22日是对博克尔松行刑的日子。按照帝国新刑法规定的程序,两名刽子手用一根木桩附着一个铁圈,圈住博克尔松的脖子使他不能动弹,并用灼热的钳子把他的肉撕下来。根据冯·克森布罗克的记录,“当被灼热的钳子触碰时,肌肉会发出明显的火焰,并因此散发出强烈的恶臭,使旁边的人感到恶心”[66]

    看到这一幕,克尼佩尔多林试图用脖子上的项圈让自己窒息,但刽子手们用绳子把他张大的嘴牢牢地固定住,并把他捆在木桩上,然后又回到博克尔松身边继续钳肉,博克尔松默默地经受着这种折磨。之后克尼佩尔多林和布伦德·克雷切丁克也经历了这种折磨。然后刽子手用刀划开三个人的喉咙,最后刺中心脏。刽子手把他们直立的尸体塞进铁笼里,然后把铁笼挂在圣兰伯特教堂的塔楼上,让所有人都能看到。[67]他们的骨头在那里保存了50年,街上仍然有这三个笼子[68]

    明斯特再洗礼派的继承者从他们的经历中吸取了教训;今天,成人洗礼的教义主要存在于阿米什和门诺派中,它们既安静又和平。

    第三个大规模的中世纪末日事件发生在17世纪中期的英格兰,当时整个英格兰都处于混乱之中。17世纪早期,议会与斯图亚特国王之间存在冲突,后者继续宣称国王的神圣权利;而议会不满于查理一世对安立甘宗[69]的支持,其更亲近天主教。

    不过,他们的冲突主要围绕财政问题。查理一世由于无法筹集到必要的资金支持他的军事行动,试图用一些非法手段结束议会的财政权力,尤其是筹集“船款”的权利。这是一项古老的皇家税,只在战时适用,而且只适用于沿海城镇。查理一世在和平时期收取议会外税收,并将其推广到内陆社区,引发了三场独立的冲突,其统称为英国内战,最终国王于1649年被斩首。奥利弗·克伦威尔建立了短暂的联邦和保护国制。克伦威尔的统治,以及他能力较弱、参与政治较少的儿子理查德的继任,被证明是灾难性的,使查理二世的君主制统治又在1660年得以恢复。

    动荡催生了两大派别:一个是平等派,主张法治、民主改革和宗教宽容;另一个是第五君主国派,是一个千禧年主义团体,其末日论支持“圣徒”统治,自认为是正义的骨干,但是和明斯特的再洗礼派一样,一点儿也不民主、不宽容甚至不谦逊。第五君主国派统治英国后,正义者将无法得到休息,因为它颁布了一项神圣法令,授权随后征服欧洲大陆。尽管这两个派别都没有完整地幸存下来,但第五君主国派在1653年短暂存在的“贝尔朋议会”(以一名成员的名字命名)中几乎掌握了政府大权。“贝尔朋议会”是克伦威尔令人眼花缭乱的一系列议会之一。[70]

    自约阿希姆以来,困难时期就会产生大量的数秘主义和末日论算术。英国外交官约翰·佩尔在1655年写道:

    有些人认为,395年是异教终结的时代,因为当时罗马帝国中不存在任何一座异教徒圣殿。在此年上加上著名的数字1260,也就是1655年,是末日的新纪元。另一些人则认为是1656年,因为他们将《创世记》第五章中先辈们的生活时间进行加总,发现从创世到洪水一共经历了1656年,并由此推断,耶稣一定和挪亚一样,在第二年到来。还有一些人认为应该再等三四年,认为1260这个数字必须从狄奥多西死后、他的儿子们分裂罗马帝国时开始算起。甚至还有一些人认为需要再等11年,我们不必惊讶,这是由数字666推算出来的。(也就是说,末日时间将在1666年。)[71]

    第五君主国派中一个叫阿里塞·埃文斯的人轻易地做出了最愚蠢的估计。《但以理书》中的“小号角”在书中代表希腊塞琉西帝国统治者安条克四世,那么它在当前时期又代表了谁,这是第五君主国派末日论中的关键要素之一。大多数信徒认为当前的小号角是国王查理一世,这让埃文斯很生气,因为他是已故国王及其大主教威廉·劳德的坚定支持者。对埃文斯来说,大主教的名字正标注着世界末日的时间:VVILLIaM LaVD中的罗马数字加起来是1667年[72]

    在另一领域,物理学家艾萨克·牛顿写了大量文章解释《启示录》经文(在他死后,其结集成一本《对但以理预言和圣约翰启示录的考察》),但是他很明智,并没有预测耶稣复临的日期。[73]

    也许最有影响力的末日推算,当属一位名叫亨利·阿彻的传教士了。他在1642年出版了《基督亲临统治全地》,一部仅58页的著作,将但以理梦中被石头打碎的野兽重新解释为四个君主国:亚述/巴比伦、地中海/波斯、希腊和罗马。他认为即将到来的第五个君主国将由耶稣亲临统治,第五君主国派的名称由此而来。阿彻的计算表明,耶稣将会在1666年或1700年复临。这种模式完全属于新教神学范畴。路德认为第四君主国和野兽都是教皇制的隐喻。[74]

    许多第五君主国派成员都是英国内战以及克伦威尔议会和护国政体的主要参与者,他们认为自己是即将到来的基督复临和最后审判事件的被动观察者。在英国内战期间,该派别中最杰出的人物是托马斯·哈里森,他官至少将,表现出极大的勇气和极强的能力。他还担任议会议员,主张进行改革。

    大多数第五君主国教徒都主张通过法律手段寻求变革,例如哈里森。但是也有少数人并不认同,特别是一位名叫克里斯托弗·费克的煽动性传教士,他敦促公众进行一场暴力革命,去迎接一个由“圣徒”——也就是他们这些虔诚的精英——组成的千禧年神权政体。[75]

    第五君主国教徒一开始很顺利,他们(包括哈里森)都参加了战争并在新模范军中担任高级职位,也是1648年克伦威尔清除“长期议会”事件的参与者。但随着时间的推移,克伦威尔要么不愿意,要么无法接受第五君主国教徒的政治和神学要求,他们之间的联盟开始破裂。1653年,第五君主国派在贝尔朋议会中达到了权力的顶峰,但维持时间不长,随着议会的解散和随后独裁护国政体的建立,克伦威尔和第五君主国派之间的关系恶化。克伦威尔断断续续地拘留了包括哈里森在内的许多第五君主国派成员,但他通常会谨慎对待这些老盟友,没有因为他们的千禧年信仰而处决他们。例如,1654年,那时的哈里森可能已被多达8个不同选区选中进入新议会,他提交了一份请愿书,敦促恢复“一个完全自由的国家”。克伦威尔发表了反对意见,拘留了哈里森,然后“温和”警告了他;几天后,又释放了他。[76]

    用历史学家罗杰斯的话说,克伦威尔对待第五君主国派成员“就像对待自己顽皮的、被误导的孩子一样,虽然他们违背了他的意愿,但他不希望他们被监禁的天数太多,哪怕多一天也不行”。[77]

    随着1660年4月查理二世复辟,第五君主国派的幸运终于耗尽。新国王对这群人怀有偏见和仇视。哈里森不仅曾经是查理一世被监禁时的看守,而且在判处查理一世死刑的司法程序中也扮演了重要角色,因此他尤其受到查理二世的仇视。6个月后,国王审判哈里森和他的同僚们(弑君者),其中有一些是第五君主国派的成员。大多数人都被判有罪,而哈里森发现自己是第一个被判有罪的人,并被告知:

    在囚车上被拖到行刑地点;在那里,你将被吊起来,活人剖腹,你的内脏将在活着的你面前燃烧,然后你的头将被砍掉,身体将被肢解为4块,由国王陛下随意处置。[78]

    曾经目睹过查理一世被斩首的日记作者塞缪尔·佩皮斯,记载了10月13日对哈里森的行刑:

    我到查令十字街,去看哈里森少将被拖行、绞死并被肢解为4块;就在那里,观看的人都很高兴。他很快就被砍成块,头和心被展示给人群,这时人群发出巨大的欢呼声。[79]

    在这次事件中,哈里森的头和4块身体在城里被四处展示,这令国王很高兴。两天后,佩皮斯又目睹了另一位著名的第五君主国派弑君者约翰·卡鲁的死刑执行仪式,他“在查令十字街被绞死并被肢解为4块,但是,幸运的是,他的身体各块没有被吊起来展示”[80][81]

    第五君主国派中的一个小派系,其领导者是一位名叫托马斯·文纳的制桶工匠。他们一直幻想自己的民众支持率很高,足以通过武装暴动实现耶稣复临。尽管第五君主国派的其他一些更清醒的成员,如哈里森等人认为他们是鲁莽的,但文纳还是在1657年4月策划了一场暴动,不过暴动还没开始,就被揭发了,这证明他确实鲁莽。

    奥利弗·克伦威尔对文纳及其同伙非常宽容,只是将他们囚禁在伦敦塔;克伦威尔死后,他的儿子理查德释放了这些无能的策划者,他们只被监禁了不到两年。随着查理二世的复辟以及哈里森和其他参与弑君的第五君主国派成员的死亡,刚刚获释的文纳团队感到绝望,决定采取行动。1660年12月,文纳的一个喝醉的同伙向一个名叫霍尔的人吹嘘他即将参加一个“光荣的事业”。霍尔问是什么,他回答:“我们会把查理从王位上拉下来。因为国家应该由圣徒来统治。”霍尔迅速向当局报告了谈话内容,然后被带到国王面前,国王下令逮捕第五君主国派中的其他不满者。

    文纳和他的大约50个同伙没有被逮捕,因此他们继续执行他们的计划。1661年1月6日晚上(选择这个日期是因为他们认为第十二夜狂欢结束时城市的看守人都会喝醉),他们闯入圣保罗大教堂,并在教堂外面派了一个守卫,结果这个卫兵很快开枪打死了一位路人,因为当被问及忠于谁的时候,这位路人宣称自己忠于国王。密谋就这样暴露了,文纳那支可怜的小部队在伦敦的街道上被不断壮大的“火车队”追赶,这些“火车队”由城市民兵构成,后来国王的军队也来增援。在接下来的三天里,文纳的士兵从人数上远逊于对方,他们进行了一系列越来越绝望的殊死反抗。

    塞缪尔·佩皮斯在1月10日的日记中,简洁地描述了这群人:

    这些狂热分子击溃了他们遇到的所有火车队,把国王的近卫兵赶跑,杀死了大约20人,两次闯入城门;而这一切发生在白天,当全城武装起来的时候,他们总共不超过31人。然而我们却认为他们至少有500人(因为他们几乎在全城的每个地方都出现过,而且他们在海格特地区还待了两三天,还在其他几个地方待过)。闻所未闻,如此少的人竟敢做如此多的坏事。他们的口号是“耶稣国王和城门上的头颅”。最终,他们中很少有人会被分尸,因为他们在暴力中很难活下来:期待耶稣降临这里,并在此刻统治世界吧。[82]

    最后,文纳的追随者中大约有一半死在追杀中,其余大部分后来被绞死,但国王对文纳和他的副手执行了全套的半活剖腹刑,就像对之前的哈里森和卡鲁那样。[83]

    16世纪和17世纪,北欧人通过引人入胜的末日叙事,寻求逃离这个世界的苦难,去往一个美好的舒适世界。在施瓦本农民战争中,托马斯·闵采尔只是把末日神学附加在世俗平民起义的基础上,造成了灾难性的后果;而在疯狂的再洗礼派和第五君主国派的暴动中,从一开始到悲惨结束,都是一场末日事件。

    从18世纪开始,随着一系列金融群体幻觉席卷欧洲,整个国家不再寻求上帝的援助,而是开始寻求玛门的援助。从表面上看,宗教和金融事件似乎属于不同现象,但它们是由相同的社会和心理机制驱动的:叙事的诱人力量;人类倾向于幻想本不存在的“模式”;领袖和追随者的过于自负和过度自信;而且最重要的是,人类有一种压倒性的倾向,即模仿周围人的行为,尽管这种行为毫无根据或是一种自我毁灭。

    3 短暂的致富

    密西西比泡沫与南海泡沫

    在这片广阔的土地上,人们的思想都集中于同一个主题。这一主题吞并了政党政治:辉格党和托利党停止了争吵,雅各布斯派也停止了阴谋。在全国各地的每一家旅店、每一条道路上,谈论的内容都是一样的。在阿伯里斯特维斯,在特威德河畔贝里克,在布里斯托尔和圣戴维斯,在哈里奇和朴次茅斯,在切斯特和约克,在埃克塞特和特鲁罗,几乎在陆地的尽头,人们谈论的只是南海公司的股票——只谈论南海公司的股票!

    ——威廉·哈里森·安斯沃思,1868[1]

    18世纪初,聪明的苏格兰金融家约翰·劳留下了一条可怕的金融混乱足迹,这对20世纪90年代那些在互联网泡沫破裂中幸存的人来说非常熟悉。互联网股票只会伤害数百万投资者;但劳损害了整个法国对银行业的信心,这是更严重的打击。

    劳是苏格兰人,出生于一个有着数百年历史的著名的爱丁堡金匠世家,他的父亲、叔叔和三个兄弟都是金匠。到他1671年出生时,古老的“金匠”职业已经演变并伪装成了一个完全不同的东西:银行业。

    劳的直系祖先生活在苏格兰岛,但当时的苏格兰与未来那个雄伟、贸易自由的不列颠岛完全不同(当时,苏格兰仍然独立于英格兰)。17世纪初,英国人口仅为法国的1/3,比1348—1349年黑死病暴发前的人口还要少。劳时代的英格兰弱小、不发达,当时还卷入了一场弑君性国内战争。当时英格兰在公海上的业务不仅涉及商业,还涉及海盗和走私。随着1600年左右大型贸易组织的建立,大规模国际贸易开始缓慢出现,其中最著名的是东印度公司的贸易。

    当东印度公司的船只拉着从新兴香料贸易中赚得的金银驶入伦敦时,商人们遇到了一个后勤问题:英国没有银行系统,因此没有可靠的地方存放财富。金匠们的职业就是对客户的贵重物品进行安全储存,他们提供了最合理的替代物,即证书。商人们将贵重物品交给金匠后,会收到金匠的证书。关键是这张纸质证书可以用来交换商品和服务,换句话说,它起着货币的作用。此外,金匠们意识到,他们可以创造出超过他们所持有金银(铸币)数量的纸币。

    也就是说,金匠可以印钞。

    只有最虚伪、目光最短浅的金匠才会只制作和颁发证书给储户;大部分金匠都制作纸质证书并以高利率借出。即使是借给信用最好的人,借款年利率也常常会超过10%(尤其当英国处于战争状态时),在那10年里,借出证书比发放证书给储户更赚钱,而且只要金匠仍有偿付能力,这种情况就会一直存在。

    只有在证书持有者没有一次性全部赎回的情况下,这条菊花链才能正常运转。假设金匠的保险箱里有10000英镑的金币,他发行了价值30000英镑的证书,1/3的证书颁发给金币的主人,2/3的证书颁发给借款人。如果持有证书的人要求取出价值10001英镑的黄金或白银,那么不管他们是借款人还是最初的储户,金匠都可能被毁掉。更糟糕的是,如果证书持有者怀疑会发生这种情况,那么金匠办公室不断壮大的队伍将足以引发挤兑,从而推翻整个纸牌屋。在本例中,证书与铸币的比率为3:1;该比率越高,运行崩溃的可能性就越大。即使是最谨慎的金匠/银行家也可能陷入崩溃;1674—1688年,发生了四次有记录的“金匠挤兑”;1677—1694年英格兰银行成立期间,伦敦金匠/银行家的数量从44人下降到12人左右。

    实践当中,金匠/银行家们发现2:1的比率——每接收1英镑存款,向借款人发放1英镑贷款——是相当安全的。这一体系的重要性不容低估,因为它预示着弹性货币供应的诞生,而弹性货币供应量可以根据借款人对贷款的渴望和债权人的放贷意愿进行调整。当借贷双方情绪高涨时,货币供应量就会扩大;当他们感到恐惧时,货币供应量就会收缩。这种纸币数量扩张的现代金融术语是“杠杆”,即纸质资产总额与硬资产的比率。[2]

    银行的杠杆推动了现代金融狂热。在欧洲,它产生于17世纪,导致各种过山车般的泡沫和泡沫的破灭。在接下来的4个世纪里,金融创新产生了各种令人眼花缭乱的投资工具,每一种都只是在稍微不同的伪装下进行杠杆操作,并成为接连出现的各种过度投机的导火线。

    作为英国金匠的继承者,约翰·劳从小生活在一种英国式的银行体系中,纸张可以像稀有铸币一样发挥货币的作用。但即使在今天,许多人仍然抵制纸币的概念;在17世纪之交,纸币让很多普通人觉得可笑。

    到了1694年,年轻的劳厌倦了肮脏、贫穷、处于中世纪晚期的爱丁堡,来到伦敦。他改名为博·劳,在城市里尤其是经常在赌桌上游荡。他与一位名叫博·威尔逊的人为了一个他们都感兴趣的年轻女人而展开决斗,最终他杀死了博·威尔逊。经过审判,劳被判绞刑,然后获得缓刑,然后再次被判绞刑后,逃跑了。1695年初的《伦敦公报》写道:

    约翰·劳上尉,苏格兰人,王座法庭囚犯,最近犯有谋杀罪,26岁,瘦高个,皮肤黝黑,身材匀称,身高6英尺以上,脸上长着麻子,大鼻子,声若洪钟,从上述监狱逃跑。无论是谁能够控制并将他送回上述监狱,都将立即获得由王座法庭支付的50英镑。[3]

    17世纪末,囚犯们比今天更容易“逃跑”,而劳的朋友,可能是得到了国王威廉三世的默许,安排了他的逃跑。[4]上述身体特征描述属于故意误导,因为劳的鼻子并不大,肤色白皙。

    最初,他去了法国,在那里,他的数学能力震惊了周围的人,在赌桌上受到欢迎。但是,把劳称为赌徒,对他的能力来说并不公正。即使在今天,定量能力和专注能力在二十一点的牌桌上也很有用。300年前的赌场的效率较低,冷静计算的回报更为丰厚。这吸引了一些欧洲最聪明的数学家参加这种机会主义游戏,其中最著名的是亚伯拉罕·棣莫弗,他的机会学说构成了现代统计学的重要基础。[5]一位熟悉劳的人写道:

    如果你问我劳的消息,那么我只能说他从早到晚只和玩纸牌的人在一起。他赌博时总是很开心,每天都会提议不同的游戏。他向所有能连续投6个6的人出价10000块亮片,但如果他们投不到,那么他们每次都要给他一块亮片。[6]

    由于连续投6个6的概率是1/46656(1/66),劳的出价一定会获胜(在第10000轮6次投球之前,他输球或付款的概率为19%)。此外,只要有机会,劳都会充当纸牌的“银行家”,他可以扮演赌场而不是客户的角色,无论什么样的特定游戏规则,他都能利用一点儿统计方面的优势。[7]

    据经济历史学家安托因·墨菲估计,当劳离开法国时,他从赌场赢来的钱总计几十万英镑,这在当时是一笔巨大的财富。[8]然后他去往荷兰,在那里,他研究了阿姆斯特丹银行和该城市新证券交易所的尖端业务。他还访问了热那亚和威尼斯,熟悉了那里具有数百年历史的银行体系。

    那个时代的法国人不信任国家管理机构,因此法国几乎不存在银行体系。攒下来的里弗尔(法国古代货币)放在床垫下或袜子里,而不是放在银行里,经济急缺资金。[9]劳赞叹于意大利和荷兰的先进金融体系,并努力使之为法国带来好处;在大约10年的欧洲大陆游历中,劳将自己从职业赌徒转变为经济学家。尽管当时经济学家这一术语还没有出现。

    劳直观地认识到以稀缺金银为基础的货币供应不足是如何扼杀欧洲经济的,而充足的货币供应又是如何刺激欧洲经济的。他早已熟悉私人发行纸币的概念,但以他在荷兰银行业的经验,他认为由中央国家银行发行纸币才能解决货币基础不足的问题。

    劳的这种充足的纸币供应能够刺激经济的直觉,可以通过3个世纪后华盛顿特区出现的婴儿合作社的著名故事(至少在经济学家中非常著名)来理解。这种合作社涉及婴儿保育服务的交易。最流行的方案之一是使用“代金券”:一种票证,每张代表半小时的婴儿照顾时间;因此,一对想要看三个小时电影的夫妇需要使用六张票证。

    此类代金券/票证方案的成功在很大程度上依赖于流通中票证的精确数量。20世纪70年代早期,华盛顿特区有一家这样的合作社,由于它印制的票证数量不多,因此家长们就把它们收藏起来。许多人愿意照看孩子以赚取票证,但愿意花票证请人照顾自己孩子的人很少,因此每个人晚上出去的时间都比自己原本想要的少。

    在华盛顿特区,许多父母都是律师,正如律师们惯常做的那样,为了解决问题,他们通过立法强制要求个人花这些票证。但在经济领域,通过立法解决问题往往会失败,本案也是这样。于是一对经济学家夫妇说服合作社印刷并分发更多的票证。家长们有了充足的票证,所以晚上会出去玩儿更长时间。[10]

    同样,劳的金匠/银行业背景和经验告诉他,欧洲经济停滞的原因是铸币短缺,除了其他措施,印刷纸币可以弥补铸币的短缺。劳并不是第一个意识到这一点的人;几乎从17世纪初金匠/银行家发明弹性信贷开始,他们中的一些人就认识到,扩张纸币可以刺激经济。1650年,也就是在约翰·梅纳德·凯恩斯将以黄金为基础的货币体系称为“野蛮遗迹”的3个世纪之前,王室官员威廉·波特就指出,流通中有限的铸币数量意味着:

    尽管世界上的仓库从来没有像现在这样装满商品,但是你将会看到,由于支付能力不足,商人们进货的速度慢于他们为商品找到销路的速度,而接下来,如果人们由于极度贫困而无法从商人手中买走商品,那么贸易的大门将会关上,其结果就是财富的大门会关上……反之,如果所有人手中的货币(或者类似货币的东西)增加,那么(商人们就不需要囤积货币,只要一有货币,他们就会买进商品,并将其摆在货架上),随着货币供应量的增加,人们手中的钱越多,商品贸易就越多;而这种贸易的增加将增加财富……因此,财富的关键在于增加货币,或者类似货币的东西,而不是囤积货币。[11]

    法国以及劳的祖国苏格兰的银行体系远比荷兰和意大利更为原始,因此,法国和苏格兰的经济运行不佳。罗讷河谷纺织业的恶劣状况给劳留下了特别深刻的印象,他制订了一项通过发行纸币为工厂、托儿所、面包房和作坊融资的计划。1703年底,他认识的一位法国驻都灵大使,将他的建议转述给法国财政大臣沙米亚尔侯爵,但后者婉拒了他。

    新年前后的某个时间,劳回到了苏格兰,那里的情况更加变化无常。早些时候,在1695年,苏格兰议会将该国的远洋贸易垄断权授予苏格兰非洲和东西印度群岛贸易公司(更广为人知的名字是“达里恩公司”)。公司计划在巴拿马地峡的达里恩建立一个贸易前哨站,以缩短从欧洲到亚洲的贸易路线。该公司向达里恩派出了两支探险队,第一支探险队由于计划和供应不善而遭遇失败,而第二支探险队的成员则被西班牙人屠杀。

    1699年,该哨站落入西班牙人手中,苏格兰银行不得不暂停营业。银行的经营困难使劳感到悲痛,他进一步完善了他的经济思想,写成了两本作品:《土地银行》和《论货币和贸易》。前者提出发行以土地为担保的纸币;后者是一本详细而精辟的书,为亚当·斯密的《国富论》一书中的许多概念埋下了70年的伏笔。

    劳开始以一种非常现代的方式深入思考货币的本质。他认为,真正的货币应该有7个基本特征:价值的稳定性、同质性(也就是说,它可以以固定单位交易)、易于运输性、各地统一性、易储存而不损失价值性、可分割成更小或组合成更大的货币量,以及拥有一个关于其价值的印章或标识。[12]

    劳认为土地正符合这些标准,与土地挂钩的纸币将优于锚定白银的传统货币。在今天看来,这种以土地为单位的货币概念似乎很奇怪,但在18世纪早期,它是有道理的。大约从1550年开始,白银从秘鲁和墨西哥的巨大矿场涌入欧洲,这导致其价值贬值。相反,表示一块土地的证书可以根据其未来粮食、水果或动物产量的总和进行估价。此外,白银只有少数几个限定用途:货币、珠宝和器皿或工业用途。相比之下,土地在支持纸币的同时,还有各种广泛的农业用途。[13]正如劳所写,“土地产生了一切,但白银只是产品。土地的数量不会增加或减少,白银或其他任何产品的数量可以增加或减少。因此,土地的价值比白银或其他任何产品更为确定”[14]

    劳逐渐将他的货币概念扩展到了土地之外,包括了那个时代最伟大公司的股票,特别是英国和荷兰东印度公司以及英格兰银行,他认为,这些公司的利润应该比白银更稳定。这是一个合理的假设;但劳没有预见到的是,他的体系本身会给那些价格带来致命的不稳定性。

    作为卡尔·马克思的先驱,劳提出了社会发展的三个阶段。在第一个阶段,货币是不存在的,易货是交换的主要形式,这时,大规模的生产制造几乎是不可能的,因为那需要前期大量的货币开支。用劳的话说,“这种易货状态下几乎没有贸易,也很少有手工生产者”。[劳的“贸易”一词具有现代GDP(国内生产总值)的意义:指消费的商品和服务总量。我们现在认为,劳认为货币时代之前是易货阶段,这种说法是不正确的,因为在原始社会,交换是通过互相赠送和积攒记号来完成的,这些做法的经济效率比易货更低。][15]

    在第二个阶段,经济在金属货币的基础上运行,但金属货币太少。虽然从理论上讲,如果货币短缺,人们就可以在较低的工资下工作,但这会妨碍制造业发展:

    人们会问,如果各国的管理良好,那么为什么它们不自己加工羊毛和其他原材料?是因为在货币短缺的地方,工人的工资很低吗?答案是,没有货币就没有人愿意工作;而且,在货币很少的地方,其几乎不能满足国家的其他需要,因为人们不能同时在不同的地方使用同一枚铸币。[16]

    在第三个阶段,当货币和信贷充裕时,国家繁荣。英国就是一个典型的例子,它在10年前刚刚成立了英格兰银行,以发行钞票。[17]银行周期性地增加和减少钞票供应;劳观察到,“随着英国货币的增加,(国民收入的)年均值也增加了;随着货币的减少,年均值也随之减少”[18]

    劳首次描述了一个被称为“循环流动”模型的经济概念(他的理论核心),这在他的《论货币和贸易》中有数页解释。该模型可以想象为两个同心圆,货币从一个所有者向另一个所有者以顺时针方向流动,而商品和服务则逆时针流动。

    劳设想了一个孤岛,它由一位领主拥有,该领主将自己的土地出租给1000名农民,这些农民种植农作物并饲养动物,其产出占岛上产出的100%。但制成品不能在当地生产,而是通过出口多余的谷物以换取制造品进口。

    此外,岛上还有300名没有工作的贫民,他们靠上帝和农民的施舍生存。为解决这种悲哀状况,劳让领主印刷足够多的货币,用于建立工厂并雇用300名贫民,工人的工资将用于购买农民的粮食。这将增加农民交给领主的租金,领主可以继续用租金支付工人工资。

    正如现代任何一个凯恩斯主义者都会做的那样,劳将他的例子做了概括:

    贸易(也就是现代术语中的GDP)和货币相互依赖:当贸易衰退时,货币减少;而当货币减少时,贸易就会衰退。权力和财富依赖于人的数量以及国内外商品的储存数量;而这些又依赖于贸易,贸易又依赖于货币。因此,贸易和货币两者之间会产生直接和必然的影响;损害其中任何一方都将损害双方,权力和财富都将是不稳定的。[19]

    劳提出一个由苏格兰银行发行纸币的方案,但这个方案被苏格兰议会于1705年投票否决了。两年后,苏格兰通过了《联合法案》,根据该法案,苏格兰与英格兰合并,这样劳在苏格兰就面临着生命危险,因为他本应在伦敦被监禁和处决。劳请求安妮女王的赦免,但被拒绝,于是他逃回了欧洲大陆,在荷兰、意大利和法国之间辗转10年,然后于1715年在巴黎定居。[20]

    那时,他又一次被法国财政大臣沙米亚尔拒绝,他的另一个在都灵开设银行的计划也被萨伏依公爵否决。接下来,他大胆地寻求路易十四的支持。到1715年夏天,路易十四已经统治法国72年,这是欧洲君主至今的最高纪录(伊丽莎白女王必须活到98岁,也就是2024年,才能超过路易十四的在位时间)。路易十四正打算批准劳的建议时却患上了坏疽,他明确地告诉摄政王奥尔良公爵:“我的侄子,我让你成为王国的摄政王。你将目睹一个国王在坟墓里,而另一个在摇篮中;你要永远记住前者的记忆和后者的利益。”[21]英俊、迷人和富有的劳获得了摄政王的支持,并最终说服摄政王进行了一次大规模的金融尝试。

    1715年9月路易十四去世时,法国已经因参与西班牙王位继承战争而濒临破产。劳曾试图组建一家大型国有银行,但受到摄政王的限制。1716年,他成立了“私人通用银行”,正如其名所示,这是一家私人企业,总部设在劳的家里,劳成为一位新加入的法国公民。

    当时,只有5个国家——瑞典、热那亚、威尼斯、荷兰和英格兰——发行了纸币,但其不能用于日常小规模交易,因此法国人对私人通用银行的纸币持怀疑态度。[22]新银行成立之初,劳就立即规定,新纸币可以与流通中的黄金和/或白银一对一兑换。由于当时的法国长期资不抵债,经常发行不足值的金属铸币,因此新纸币的价值比当时流通中的金属铸币要高。为了吸引富有的客户并增强信心,他将存款准备金率保持在较低水平,并开展了一些“亏损业务”,包括免费兑换外币和按银行纸币面值兑换铸币业务,而不是按低得多的(高折扣的)普通的政府纸币价格进行兑换。[23]

    由于票面价值得到了保证,劳的银行纸币和服务所具有的优势引起了人们的注意。正如劳预测的那样,纸币供应的增加提振了王国经济。

    劳的下一个目标是密西西比公司。该公司最初于1684年获得特许经营权,后来通过与其他公司合并而获得法属美洲的贸易垄断权,但由于未能成功利用这些垄断权,其经营者安托万·克罗扎于1717年将特许经营权交还给了国王。现在,由于私人通用银行的成功,劳声名鹊起,他承诺通过让密西西比公司买断王室的巨额债务来拯救国家财政。在这个过程中,劳通过投机买卖公司股票,本已惊人的赌博财富更是成倍增加。

    为了使密西西比公司承担起王室的债务,他让王室扩大他的垄断权,垄断与中国、东印度群岛和“南海”(赤道以南的所有海域)的贸易。但几乎所有的相关贸易路线都已在英国、西班牙、葡萄牙的控制之下。[24]因此,密西西比公司对于这些新大陆贸易的“垄断”毫无价值。但是,这一点儿也没有减少劳的新金融体系的魅力。

    密西西比公司承担了王室的巨额债务,主要是以公民国库券的形式,国库券当时的利率为4%。由于王国的财政状况很脆弱,国库券的交易价格大大低于其面值;劳承诺,他的计划将使国库券的交易价格达到面值,这对王室来说是一个不可抗拒的诱惑。1718年12月,劳成功地使他的私人通用银行升级为国家银行,即“皇家银行”,该银行完成了货币流转链条:新银行将发行纸币,以支付密西西比公司的股票;纸币将用于购买国库券,从而减轻国王的战争债务。难以理解的是,国库券也可以直接用于购买公司股票;由于国库券是债务,公民用国库券购买股票意味着国库券的消失,这进一步改善了王室的财政状况。[25]

    劳的权力使他沉溺于与银币的斗争,他将银币视为国家的经济锁链。硬币被抛弃,纸币被引进。早在私人通用银行存续期内,政府就已经允许公众用私人银行发行的纸币支付税款。1719年初,皇家银行在法国各大城市设立分行,在这些城市,高于600里弗尔的白银交易必须用银行纸币或黄金进行;禁止使用银币支付。到1719年底,皇家银行已经买进了大部分的国库券,国家债务的消失进一步鼓舞了这个国家的动物精神。

    随着密西西比公司股价的上涨,银行印制了更多的纸币以满足对股票的需求,这进一步推高了股票价格,从而导致更多的纸币发行。很快,第一个记载翔实的全国性股市泡沫正在形成。冒失的货币扩张并不完全是劳一个人的作品,也受到了摄政王的影响。劳理解螺旋型通货膨胀的特点,但摄政王并不理解这一风险,他只是被该计划的成功鼓舞。

    以所谓的“永久资本”运营的现代公司,这只是一种花哨的说法,实际上就是,如果某个项目需要10亿美元,那么将通过销售股票来筹集大部分资金;如果费用预测准确,那么该项目将随后完成。

    密西西比公司的股票并非如此。该公司的股票不需要以全价直接购买,而是以认购的方式,以现金支付10%的股价。也就是说,为了获得股份,购买者只需支付10%的股价和20个月的分期付款(或“催缴股款”,每笔5%)中的第一笔,即只需要支付股价的15%。催缴机制是金融杠杆的一种早期形式,如果价格上涨15%,投资者的首期付款价值就翻了一番,它会放大收益和损失;如果价格下跌15%,那么投资者将被清出市场。因此,催缴机制可以被认为是保证金债务的祖先,而保证金债务是随后出现许多金融崩溃的原因,最明显的一次是在1929年。[26]

    为了满足对公司股票的需求,劳的银行发行了更多的股票;查尔斯·麦基描述了接下来发生的事情:

    至少有30万人申购这5万份新股,劳在坎康普瓦大街的住宅从早到晚都挤满了热切的申购者。由于不可能满足所有的申请人,新股东名单只能在几周后才公布,在此期间,公众的焦急情绪达到了疯狂的程度。公爵、侯爵、伯爵以及他们的夫人每天都要在劳家门前的街道上等待数小时,以了解结果。最后,成千上万的人挤满了整条大街。为了避免平民人群的推挤,贵族们在邻近的房子里租了公寓,这样他们就可以一直住在这位新财神爷散播财富的神庙附近(见图3-1)。[27]

    图3-1 约翰·劳的巴黎

    人们很少谈论其他事情,几乎所有有幸拥有股票的贵族都忙于买卖股票。坎康普瓦大街的租金上涨了15倍。

    劳对拥挤的人群感到厌倦,于是逃到他在旺多姆更宽敞的住所,但那里也很快挤满了人。这引起了议长的愤怒,因为议长的法庭就在旺多姆广场上。最后,劳搬到了苏瓦松酒店,那里有一个足够大的花园,花园可以容纳几百个帐篷;拥有该房产的幸运贵族以每月500里弗尔的价格出租每一个帐篷。

    麦基回忆说:“如果在某次会面中,摄政王让贵族们等了半个小时,那么他们会被激怒,但他们愿意等6个小时得到一次与劳见面的机会。”[28]一位女士巧妙地利用了劳对女士的殷勤,她故意让马车在劳面前翻车,劳不出所料地过来救助:她很快就承认了这是她的小伎俩,劳被她逗笑,于是给她签发了股票。拘谨的麦基提到了另外一个会让读者“微笑或脸红”的情节,但没有描述它,只是害羞地提到了一封奥尔良公爵夫人写的信:

    劳太忙了,日夜不得休息。一位公爵夫人在众人面前吻了他的手;如果公爵夫人吻了他的手,那么其他女士会如何?[29]

    其他观察者也证实了麦基的描述。1719年9月,英国大使馆的一名办事员向伦敦报告说:

    坎康普瓦大街是他们的交易场所,从清晨到深夜,这里挤满了亲王和王妃,公爵、贵族和他们的夫人等,总之,这里在法国非常有名。他们出售房地产、典当珠宝,以购买密西西比公司的股票。

    一周后,这名办事员又写道:“这个镇上的所有新闻都是关于股票买卖的。目前,法国人的脑子不会转向任何其他事情。”[30]巴黎成为一个繁荣的城市。泡沫期间,人口膨胀,城市不可避免地受到食品、服务和房地产价格飙升的负面影响。这种气氛高涨的环境下产生了“百万富翁”一词,其被普遍用来形容幸运的股东。[31]另一份大使馆报告写道:“昨天有人告诉我,一家商店在不到3周的时间里出售了80万里弗尔的蕾丝和亚麻布,主要是卖给一些以前从未穿过蕾丝的人;诸如此类的报道每天都如此令人意想不到,其他国家的人根本就难以相信。”[32]

    泡沫通常结束于看似很小的扰动,然后迅速崩塌。震动发生在1720年初,当时孔蒂亲王因没有买到足够多的公司股票而被激怒,为此,他派出了三辆马车,去皇家银行(卖出纸币)换取铸币,这些铸币本应是银行发行新纸币的基础。劳当时担任法国财政部长,不能在公众面前拒绝这一糟糕的请求,因此他做了次好选择:他向摄政王抱怨,摄政王强迫孔蒂撤销这一要求。敏锐的投资者意识到亲王所提要求和摄政王默许拒绝背后的含义:银行发行的纸币数量大大超过了其黄金和白银储备。随后发生了对该银行的全面挤兑。

    劳现在面临着一个危急的选择。他可以通过减少印刷纸币来保护货币币值,但这将损害股价;或者他可以通过印制更多的纸币来保护股价,而这将加剧本已猖獗的通胀。前一种做法将保护法国;后一种做法将保护贵族投资者。

    起初,劳选择保护货币,从而保护国家,或者他认为是这样。1720年2月底,陷入绝望的劳和摄政王开始禁止使用铸币进行交易,并将私人拥有的铸币限制在500里弗尔以内;此外,还禁止囤积银制器皿和珠宝,并招募告密者和经纪人来强制执行这些可恶的新规定。随着仆人背叛主人,父亲背叛儿子,国家的社会关系网开始瓦解。

    由于社会如此混乱,两周后,劳转而保护股价,从而保护富人,他提出每股出价9000里弗尔,这意味着需要印刷更多的银行纸币。到那时,里弗尔贬值带来的通货膨胀已经非常明显,到5月份,他通过两个步骤让里弗尔贬值了50%。1720年后期,为了控制通货膨胀,他宣布大面额纸币价值为零,抹去了国家的大部分财富;经济历史学家安托因·墨菲估计,包括密西西比公司股票和纸币在内的整个系统经通胀调整后的价值下降了约87%。对纸币和密西西比公司股票的最后一击是在那年秋天,瘟疫肆虐马赛,并威胁到巴黎,这进一步动摇了金融信心(见图3-2)。[33]

    图3-2 1719—1720年密西西比公司的股票价格

    至此,劳不仅耗尽了银行资本,也耗尽了他的政治资本。为了避免进一步的尴尬,摄政王允许他体面地离开巴黎,即先去巴黎郊区,然后出国。此时,他谋杀博·威尔逊的罪名已经获得王室的赦免。生命的最后几年里,劳在英格兰和欧洲大陆四处奔波,逃避债权人,其中最著名的债权人是伦敦德里勋爵。1719年9月,劳与伦敦德里勋爵下注,他认为密西西比公司将损害英格兰东印度公司股票的价值,因此承诺未来将向伦敦德里交付大量EIC(东印度公司)股票,这有效地“做空”了EIC的股票(“做空”就是押注股价下跌)。但是,南海泡沫(密西西比泡沫的伦敦孪生兄弟)期间,EIC的股价飙升,同时劳的体系又使法国货币相对于英国货币大幅贬值,这个赌注对劳来说成为一个灾难性的赌注。[34]

    尽管劳已经成为奥尔良公爵的政治负担,但这位摄政王仍然珍视他的才华,如果摄政王没有在1723年去世的话,那么可能会将劳重新召回巴黎。最终,劳于1729年在他深爱的威尼斯病逝,遗留下的主要财产是大量艺术收藏品,几乎没有其他东西。但总的来说,他是幸运的;而未来的泡沫主角往往会有更悲惨的结局。[35]

    密西西比公司确实拥有过一片美洲土地,就是后来的路易斯安那州。但在18世纪早期,该地区人口不足,而且流行疟疾病。为了给这片领土招募定居者,为公司的新大陆经营做准备,劳制作了欺骗性的小册子,将该地区描述为人间天堂。广告宣传失败后,劳又开始征募数千名男女白人囚犯以及非洲奴隶。

    违反纪律的士兵、名门中的害群之马、乞丐、妓女以及任何毫无戒心误入巴黎的农民都被强行运到了墨西哥湾沿岸。那些自愿去的人可以得到免费的土地、饮食和前往新领土的免费交通。[36]

    路易斯安那州所谓的“首府”,在现代的比洛克西和莫比尔[37]之间交替,不过是一处仅有几百名定居者的恶臭营地,他们中的大多数人在1721年公司倒闭后逃往新首府新奥尔良。[38]

    两个世纪以来,劳一直被描绘成一个无赖。最典型的是丹尼尔·笛福[39](以“迷雾先生”的笔名写作)写给那些希望获得巨大财富的人的建议:

    迷雾先生说,如果你已经下定决心了,除了这样做,没有什么别的办法,那么你必须做什么?很简单,你必须佩剑,杀一两个花花公子,被关进纽盖特监狱,被判绞刑,然后越狱,假如你能做到的话,记住,顺便去一个陌生的国家,转做股票经纪人,发行一支密西西比公司的股票,搅动一个国家的泡沫,那么你可能很快就会成为一个伟人;如果你有好运气,那么根据一句古老的英国格言——一旦你敢做一个记录在案的流氓,你可能很快就有希望成为一个贵族。[40]

    经济史学家们对他更为宽容。在劳的时代,经济运行中的货币不以黄金和白银为基础,这种想法在当时似乎是革命性的,甚至是可笑的。但今天的绝大多数经济学家认为,将货币供应量建立在矿山或珠宝盒中的金属量的基础上更加愚蠢。例如,金本位制的权威经济历史学家巴里·埃森格林发现,各国从大萧条中复苏的顺序与它们放弃硬通货(指金属硬币)的顺序恰好一致。[41]从本质上说,我们生活在一个叮当仙子[42]的经济中,因为每个人都相信纸币幻觉,所以它运转良好。就像穿越海格力斯之柱[43]航行、死于地中海之外的远古水手一样,劳的体系——一种群体幻想——由于缺乏经验而走向了失败,但也照亮了未来的路。

    密西西比泡沫传染了整个欧洲大陆。狂热时期,顽固的威尼斯人不再反对合股公司[44];有一些合股公司开始热情地发行股票,但后来随着巴黎灾难的消息南下而消失。荷兰也不愿落后于法国,紧随其后,进行了44次股票发行,其中有30次的价格几乎立即翻了一番。在稍欠发达的欧洲地区,贸易公司像野花一样遍地开花,然后迅速消失;18世纪欧洲股票发行中有整整40%的比重发行于1720年。[45]

    法国泡沫在伦敦最响亮的共鸣来自约翰·布朗特爵士,他出生在正确的时代。1689年,他25岁,英国在这一年继1688年光荣革命之后确立了君主立宪制。这一年,荷兰政权持有者威廉三世应英格兰新教势力的邀请进入英格兰,并以国王的身份登上王位,结束了英格兰斯图亚特君主制时代。

    在此之前,英格兰没有“国家债务”,只有国王及其家人的私人债务。1685年查理二世去世时,他和他的兄弟以及侄子欠了伦敦银行家约100万英镑,没有偿还一分钱的利息或本金。[46]由于王室不偿还贷款的风险一直存在,银行家们就理所当然地收取高利率,这压制了英国经济的发展。光荣革命之后,君主立宪制建立,国王放弃了原有的神圣权利,权利不受限制的问题得以解决,这立即使政府债务对银行家来说更具有吸引力。这反过来又更普遍地降低了利率;由于相对安全的债券不能获得高回报,投资者寻找风险更大的投资机会。这引发了未来10年合股公司的繁荣。

    布朗特是一位浸信会鞋匠的儿子,曾当过撰稿人(也就是从事法律和金融文件的写作,是一个传授房地产和金融活动内幕知识的职业)。借着这个职业,他进入一家小型商业企业集团,该集团包括一家亚麻布企业和一家伦敦供水公司。随后,他又受雇于一家最具野心的新合股公司——剑锋公司。

    起初,该公司生产先进的法式剑杆,但很快就将业务扩展到土地投机和政府债务交易。(商业模式的彻底改变,是与泡沫有关的金融诈骗的一个特征;近3个世纪后,安然公司也从一家枯燥沉闷的管道公司和发电厂蜕变为一家期货交易巨头,直至风险暴露。)

    1710年,布朗特的商业头脑引起了英国财政部长罗伯特·哈雷的注意,他请布朗特帮助解决国家巨额债务问题。与法国一样,英国的巨额债务也是从西班牙王位继承战争中遗留下来的。布朗特确实有那么一两个办法。他对债务的解决方案就是利用人们的投机心理,这也将成为他的招牌方法:政府将发行利率为6%的传统债券,债券中含有彩票,奖金从20英镑到高达12000英镑不等。债券的发行非常成功,这推动了一项更具吸引力的计划——“200万人的冒险”:一种复杂的分层彩票,起价100英镑,连续五次抽奖,最高奖金不断增加,分别为1000英镑、3000英镑、4000英镑、5000英镑,最后是20000英镑;每次抽奖,都有可能实现更大的回报,以此让输家留在游戏中。

    这些投机项目的成功使哈雷更加大胆,他于1711年成立了南海公司,目的是接管英格兰的所有巨额债务,他本人担任董事,董事会中有很多剑锋公司的人,包括布朗特。[47]作为承担政府债务的交换条件,南海公司与密西西比公司一样,获得了南美洲贸易的垄断权,但事实上当时西班牙和葡萄牙已经控制了南美洲,而且该公司董事会中没有一个人有与西属美洲贸易的经验。作为获得这项“垄断”权的部分交换条件,该公司承担了1000万英镑的政府债务。

    具有讽刺意味的是,英国南海泡沫正是在对法国体系的恐惧和嫉妒中产生的,它与巴黎泡沫几乎同时发生。但1717年密西西比公司承担法国国债,这种做法实际上是学习了此前南海公司对英国国债的承担。自1711年南海公司获得经营权的8年里,用承担政府债务换取新大陆贸易的“垄断”权,这种交换规模一直很小;但到了1720年,飞速发展的法国密西西比公司以及数千人涌入的坎康普瓦大街,让英国人羡慕不已。当年法国泡沫吹得最大时,丹尼尔·笛福在巴黎街头写道:

    你们,英格兰的迷雾先生们,在伦敦的你们是一群迟钝、冷漠的家伙;而在巴黎的我们喝着勃艮第酒和冒泡的香槟。你们连巴黎人民的一半聪明都没有。我们这里有清新的空气与柔和的火焰。100可以积累到2000,现在的股息为40%。[48]

    由于担心英格兰会被法国波旁家族所设计的金融永动机压倒,南海公司和议会设计了一个类似的体系,由南海公司承担更多的国家债务(约3100万英镑),这些债务的主要形式是年金。有人提议,这些债务的持有人,即年金受益人,应该自愿将这些政府债券转换为公司股票。

    当然,年金主要持有人是英国公民,他们从中获得收入。年金持有人必须得到一个有吸引力的报价才肯卖出,而最简单的方法就是刺激他们的大脑边缘系统,让他们相信公司的股票价格会上涨。

    南海公司出售了各种形式的股票。最典型的一种,是卖出一份票面价值(签发时的价格)为100英镑的股票,从年金持有者那里换取100英镑的年金。股票价格越高,公司越受益,因为这使公司能够为自己保留更多的股票。例如,如果股票价格上涨至200英镑,公司就只需卖出比100英镑价格时少一半的股票,并保留剩余的一半股票;如果价格上涨到1000英镑,公司就将保留90%的股票。随着股价的上涨,股票更受欢迎,这是一个正反馈循环,是所有泡沫的核心特征。

    现在,差不多3个世纪后,布朗特和哈雷对心理学的掌控的本质变得更加清晰。他们偶然发现了一种强大的方法,利用了非常古老的人类现象:人类偏好于“正偏态结果”——概率很低但是回报丰厚,即使所有回报的均值为负。例如,任何一个理性的人都不会买一张价值2美元的彩票,这张彩票的结果是50%的概率获得3美元,50%的概率什么都得不到,即它会产生1.5美元(0美元和3美元的平均数)的回报,平均损失率为25%。然而,许多人会买另一张价值2美元的彩票,它有1/2000000的机会获得3000000美元,这意味着平均赔付额也是1.5美元(3000000/2000000),平均损失率也是25%。[49]

    换句话说,哈雷和布朗特找到了一条通往人类贪婪之地的道路:大脑边缘系统强大的奖励预期电路。这是一种本能,这种本能曾经让远古狩猎者获利,但在金融领域是有害的。

    正如我们所知,在南海的垄断权几乎没有价值,但这并不妨碍该公司散布最捕风捉影的谣言。麦基写道:

    他们提到了英国和西班牙之间的条约,根据这些条约,所有西属殖民地可以自由贸易;从波托西-拉巴斯[50]矿中开采的丰富的白银将被运到英国,英国的白银将几乎与铁一样充足……与南海进行贸易的商业公司将成为有史以来最富有的公司,每投资100英镑,将为股东带来每年数百英镑的收入。[51]

    为了确保议会同意该计划,南海公司向议员们贿赂股票,该计划通过后,这些股票大幅升值。1720年4月14日,首次允许以现金形式出售股票;两周后,首次允许公众用年金换取股票;此时股价已从年初的120英镑上涨至约300英镑;到了6月,达到1000英镑以上的峰值。布朗特设计了极其复杂的细节,将这场200万人参加的冒险活动提升到了一个新的水平:公司部署了不同级别的股票连续认购,旨在吸引公众的注意力。最后,如前所述,股价越高,公司买进政府债务时向持有人提供的股票数量就越少,从而更多股票掌握在布朗特及其同僚们手中。[52]

    与法国泡沫相比,英国泡沫有四个特征。首先,法国泡沫几乎完全围绕一家公司的股票,但英国泡沫中,受当时普遍的乐观情绪所鼓励,还存在很多其他企业的上市股票。麦基列出了不少于86家被称为“泡沫公司”的英国企业,而随后的历史学家们确定的数量更是翻了一番。虽然大多数企业筹资都是为了实体经济,例如修建公路、房屋以及建立进口商品贸易,但也有很多计划是不切实际的:“头发贸易”、“永远转动的车轮”、“热风烘干麦芽”以及“将水银转化为可锻性精炼金属”。当代现存的一些资料列出了各种各样的筹资项目,其中有许多可能是虚构的,比如一个“大脑的空气泵”,或者“抽干红海的水,找到犹太人离开后遗弃在埃及的宝藏”,或者,最著名的是“为了一项大有裨益的事业;但没人知道这项事业是什么”。[53]

    南海泡沫的第二个显著特征是英国泡沫公司的杠杆程度极高。与密西西比公司股票需要15%的首付类似,南海公司股票的首期付款仅为10%~20%,其余部分将在后续催缴中缴纳。而泡沫公司的杠杆率则高于南海公司,也就是说,它们的初始认购价格较低;有时,一先令[54]可以认购一股价值1000英镑的股票(占规定购买价格的0.005%)。因此,泡沫公司的资金非常匮乏,经常会快速破产。但是,仍有少数公司资本充足,管理良好,得以生存,其中包括两家保险公司:伦敦保险公司和皇家交易所。

    股东们的财富疯狂增加,对公众产生了诱惑。麦基写道:“公众的思想处于一种不健康的发酵状态。人们不再满足于谨慎而具有可靠利润的行业,因为这些行业赚钱缓慢。明天将拥有无限财富的希望,使人们今天的行为无所顾忌,挥霍无度。”[55]

    18世纪早期的伦敦可以看作两个独立的部分:西面是威斯敏斯特区,是政府所在地,有议会大厦、圣詹姆斯宫和为白金汉公爵新建的白金汉宫;东部是商业中心,即“伦敦金融城”,其就是皇家交易所,首都的商业精英们也在这里从事各种形式的国内外商业活动:交易羊毛、木材、谷物和无数其他商品(见图3-3)。

    图3-3 南海泡沫时期的伦敦地标

    股票经纪人受到商业人士的鄙视,在皇家交易所大厅里不受欢迎,被赶到一条聚集了很多咖啡馆的狭窄小巷,这条小巷夹在伦巴第街和康希尔街形成的锐角中,被称为“交易巷”。

    通常情况下,“金融家”们在咖啡馆兜售股票,投机者在那里排队。股票的认购价格通常非常低,然后,买到股票的投机者匆忙来到附近的“交易巷”,通过股票经纪人的斡旋,他们把股票卖给更大的傻瓜。1720年春夏之交,这里的景象和巴黎坎康普瓦大街一样疯狂:哈克尼出租车供不应求,人们即使打到了车,也可能被堵在狭窄的街道上。卖咖啡的商人挤在像乔纳森、加洛韦和山姆这样的咖啡馆,小偷们也很猖獗;在巷子里比在王宫里更容易找到国王和他的宫廷人员。一位律师将此过程描述为“更像是所有疯子同时从疯人院逃了出来”[56]

    和巴黎一样,投机助长了普遍的价格膨胀。乔治一世国王举办了全国有史以来最奢华的生日聚会,公司的董事们拆除了豪宅以建造更大的豪宅。在现代金融史的大部分时间里,房地产价格都是年租金的5~20倍;而1720年,伦敦房地产的出售价格是年租金的45倍,这一比例和21世纪初的房地产泡沫期间的比例接近。[57]南海的热情也见证了泡沫的另一个特征的诞生:证券投机成为一种时尚。在投机活动达到高潮时,伦敦的社交场合从圣詹姆斯宫和威斯敏斯特宫(即议会大厦)向东转移到伦敦金融城;在那里,一群贵族女士在“交易巷”附近租了一家商店,“闲暇时间里,当经纪人外出时,她们追捧中国瓷器”[58]。这种兴奋也不仅仅限于贵族:
    还有德鲁里巷的年轻妓女,
    她们通过在豪华马车里的交易,
    通过放荡,
    骗走他们赚得的金子。[59]

    这种氛围不利于理性决策。投机在贵族中最为热烈;6月,接近顶峰时,忧心忡忡的财政大臣约翰·艾斯拉比建议乔治国王将价值8.8万英镑的公司股票兑现为现金,这位粗鲁的国王将艾斯拉比称为懦夫,但艾斯拉比坚持己见,最终国王将其持有的约40%的股票转换为安全资产。[60]

    南海泡沫的第三个显著特征是肇事者越来越狂妄;密西西比事件中的肇事者约翰·劳一直保持了他与生俱来的礼节,但他的英国同行不是这样。虽然我们可以将布朗特或艾斯拉比形容为轻信的或虚伪的人,但这只是一个起点。从一开始,商业社会便将财富等同于智慧和正直;拥有财富的人喜欢听到别人说他们具有卓越的智力和道德品质。伴随着在金融领域内的成功,他们获得的财富和奉承不可避免地让他们产生一种侵蚀自我意识的自负。更糟糕的是,巨额财富往往更多地来源于欺诈,而不是智慧和实体经济。在这种情况下,奉承会腐蚀灵魂,正如布朗特身上所发生的那样,他这时已经演变为现代狂妄自大CEO(首席执行官)的原型。有一本作者不详的小册子,可能是作者在布朗特倒台后不久写的,描述了南海公司崩溃前不久,布朗特去往时尚度假胜地坦布里奇韦尔斯:布朗特去往坦布里奇韦尔斯的装备多么华丽,那里对他有多么尊重,他在那里表现得有多么傲慢,他和他的家人在谈到这个项目时怎样称之为“我们的项目”[61]。小册子的作者描绘了一幅经典画面:

    (布朗特)在他任期的前几个月里,除了他自己,从未允许任何人就(公司交易)做出提议;法庭记录中也没有任何与此有关的会议记录,而只有他口述的内容。他明显地塑造了一个先知的形象,用一种强调和异常激烈的语气说话;他习惯于摆出威严的姿态,斥责那些对他所说的任何话有一点点反对的人,并竭力教导人们。他所说的好像都是出于心血来潮,说的话类似于:“先生们,不要惊慌,你们必须坚定、果断、勇敢地行动。我告诉你们,在你们面前的不是一件普通的事情。世界上最伟大的事情和你们有关。欧洲所有的钱都将集中在你们这里。世界上所有的国家都要向你们缴纳贡金。”[62]

    正如历史学家爱德华·钱塞勒所指出的,从南海泡沫到互联网泡沫,都常常会唤醒其主要人物的狂妄自大:

    伟大金融家所做的计划可能会成为投机狂热的催化剂,金融家自己也会受到影响。其野心变得无限大。一方面,其获得大众面前的成功和普遍的奉承;另一方面,私人事务管理越来越混乱甚至出现欺诈;这两者之间出现鸿沟。[63]

    布朗特策划了对南海公司股票的操纵,包括从认购金中借出部分资金以购买股票。他不仅通过在价格上涨到接近最高值时卖出股票而获利,而且还秘密地向自己、朋友和许多议员增发股票,其中一些是欺诈性的。

    正如通常发生的那样,一个意想不到的事件引发了结局。1720年6月,密西西比公司股价暴跌,布朗特害怕英国其他泡沫公司会抢占南海公司的资金,于是在南海股价达到峰值时推动议会通过了《泡沫法案》。该法案要求新企业必须经过议会批准才能成立,并将新企业的股东数量限制为5名;布朗特还让法院起诉了3家现存的泡沫公司,因为它们违反了公司章程。

    就像在巴黎一样,布朗特的狂妄也蔓延至其他人。如麦基所写的,一位导演,“十分骄傲的无知富人,曾说过要用金子喂他的马”[64]。普通民众也是这样:“通过成功的赌博而暴富的无知的人,他们傲慢专横,让真正有教养和思想的人尴尬,黄金竟然有能力在社会中提拔不值得被提拔的人。”[65]布朗特对其他竞争性泡沫公司采取的行动,使自己反受其害,不仅刺破了泡沫公司,还刺破了南海公司;截至10月底,其股价已从峰值1000英镑跌至210英镑,到1721年底,跌至150英镑以下(见图3-4)。[66]

    图3-4 1719—1721年南海公司股票价格

    第四个特征,也是最后一个特征,就是南海和密西西比泡沫的区别在于它们的格局和范围。约翰·劳不是禁欲主义者,但他并没有只关注自己的私利;他真正希望通过革命性的信贷扩张刺激和推动法国经济的发展。但是,布朗特的计划很狭隘,他想通过南海公司把信贷塞进自己的口袋;当信贷扩张从南海公司扩展到其他企业时,他开始努力限制信贷,目标达到了,但这不仅摧毁了其他企业,也摧毁了南海。但从国家的角度看,布朗特计划的狭隘性使金融部门受到的损害相对短暂,这也成为南海泡沫仅有的优势,区别于法国那样灾难性的银行业崩溃、全国性的通货膨胀以及随后长期持续的对银行的恐惧。[67]

    此外,与密西西比公司不同,南海公司并没有给出一个完全空洞的承诺。即使在18世纪早期,其内在价值也可以做出合理估计。首先,它持有年金受益人(现在是公司股东)提供给它的年金,这些资产的价值大约为每股100英镑,也大约是泡沫破裂后的结算值。

    南海公司的另一个特点是,它继承了1707年西班牙授予安妮女王的西属殖民地(《阿西恩托[68]条约》)奴隶贸易垄断权,这在其假定的业务量中占据了最大份额,而根据与西班牙的条约,授权仅限于一艘装有500吨货物的“年度船舶”,这实际上排除了新大陆产品贸易。然而,新大陆产品贸易几乎对南海公司没有意义,因为公司专门从事于金融,而不是国际商业;可恶的是,其中一名董事为了自己的利益,私自使用公司500吨年限额中的60吨,被当场抓获。到了1714年,也就是泡沫破灭的6年前,由于实际贸易业务没有利润,因此公司退出贸易业务;40年后,该公司以仅仅100000英镑的价格出售了其《阿西恩托条约》的权利。[69]最后,公司的新大陆投资价值已经无关紧要,因为投机者关心的不是奴隶贸易或糖贸易中的利润,而是那些股票买卖的利润,这些股票的价格似乎涨到了天价。

    一位名叫阿奇博尔德·哈奇森的律师兼议员进行了当时最复杂的股价计算,他发表了一系列关于该公司股票的报告。幸运的是,其中一个报告写于1720年6月,正好在繁荣达到顶峰之前;报告建议,股票市值应该是该公司年金资产价值的两倍,也就是200英镑。而当时,股价已经是740英镑;他预言“现在就应该停止当前的这种疯狂”。结果,疯狂又持续了几个月;7月,股价已经达到每股1000英镑,哈奇森以这个价格估算出该公司的总价值几乎已经是英格兰所有土地价值的两倍。[70](20世纪80年代的东京房地产泡沫也是如此,当时东京皇宫的泡沫价格能买下整个美国加州的土地。)[71]

    第二年,在受害选民以及被骗议员的推动下,议会开始调查股价崩溃以及布朗特、他的同僚和政府内部人员积累的巨额财富。财政大臣艾斯拉比成为替罪羊,他被迫辞职,被关进伦敦塔,还有另外6名议员被驱逐。南海公司一直运作到1853年,不是作为贸易公司,只是作为政府债务的持有人。国王成为人们嘲笑的对象,但是没有被制裁。[72]

    一些人提出要监禁甚至绞死南海公司的董事,但董事们在被短暂监禁后勉强避免了这种命运。议会没收了他们的财产,用以补偿项目受害者;布朗特保留了他18.7万英镑资产中的5000英镑,悄悄地退休并到了巴斯[73],在那里建立起一个杰出的后代宗系,其产生了包括主教和维多利亚女王的牧师在内的很多虔诚的后裔。[74]

    《泡沫法案》是在狂热达到顶峰时通过的,该法案不仅阻止了其他公司的进一步投机,而且也无意中导致了南海公司的沉没。该法案存在了一个多世纪。但未来,对狂热及其崩溃的记忆将不可避免地逐渐消失,在激动人心的新技术和宽松信贷的鼓舞下,在发起人、公众、媒体和政客的推动下,市场的动物精神将再次崛起,从而再次产生一波狂热,使这场18世纪初的狂热也相形见绌。

    4 资本主义的英雄

    英国铁路泡沫

    20世纪50年代初,斯沃斯莫尔学院的一位社会心理学家所罗门·阿希进行了一系列开创性的实验,对中世纪群体末日幻想和18世纪金融狂热的传染性进行了研究。

    阿希让大约6个男性参与者围坐在一张长方形的桌子旁,他们正在接受视觉感知测试。他给所有人看了一张卡片,上面有一条固定长度的直线,比如说英寸[1]。然后他给他们看了第二张卡片,上面有三条线,其中一条线的长度也是英寸,另外两条线的长度稍有不同,比如3英寸和英寸(见图4-1)。参与者被要求在第二张卡片上选出与第一张卡片上长度相同的线条。这项任务需要一定的专注力,但也很容易,正常情况下受试者选错的概率是1%,连续参加12组配对实验全部正确的概率是95%。

    图4-1 阿希实验中所用的卡片

    许多(如果不是大多数的话)心理学实验都需要对受试者撒个小谎。这项测试根本不是关于视觉感知的,每组只包含一个真实的受试者。其他参与者实际上是阿希博士的助手;真正的受试者坐在桌子中间附近,这样尽量缩短他与陪试者们的平均距离。

    测试中这个真正的受试者要么最后一个回答,要么倒数第二个回答,因此在回答问题之前,他已经听到来自陪试者们的多个答案。当陪试者们答案正确时,受试者的表现与单独参加测试时相似,所有12组卡片的正确率为95%。但是,当陪试者们故意回答错误时,受试者的表现结果会急剧变差。他们中只有25%的人在12组配对中选择正确,令人难以置信的是,5%的人在12组卡片配对中全部错误。[2]此外,受试者在各组实验中表现一致:如果一个受试者在前6组实验中深受陪试者错误的影响,那么他在后6组实验中也将受到类似的影响。也就是说,其中一些受试者确实比其他人更容易受到影响。

    实验结束后,阿希博士采访了这些受试者,他们的回答发人深省。容易被影响的人担心他们的视力或心理处理能力正在衰退;其中一个受试者说:“我知道这群人不会错。”[3]即使是那些不易被影响的人也对自己与大多数人的分歧感到不安,并感觉到可能别人是对的,其中很少有人能对自己的答案完全确定。

    引人瞩目的社会科学实验往往会成为街谈巷议的话题,阿希博士的例子就是如此。在他的实验之后的几十年里,其结论越来越多地出现在大众媒体、教科书甚至学术文献中,这也恰恰表明了大多数人的随波逐流。[4]

    实际上,这些数据也呈现出一些细微差别。在存在误导性陪试者的情况下,超过一半的受试者的答案是正确的,即非一致性。此外,即使只存在一个答案正确的陪试者,也能显著降低受试者的错误率。对阿希实验的更精准的总结是,一些人比其他人更容易被影响,但25%的受试者没有受到任何影响。那么,很容易想到的是,阿希已经找出了那些最容易受到金融泡沫或世界末日信条影响的人。

    阿希博士的结果尤其显著,因为估计线长这种实验几乎不会受到情感因素的影响。打哈欠也是这样,人们对这种话题往往没有什么情感驱动的想法。当然,正如我们大多数人知道的,并且已经被实验证明,打哈欠是有传染性的。在正常、完全清醒的受试者中,传染性打哈欠不仅可以通过其他人的哈欠诱发,还可以通过打哈欠的视频诱发,即使打哈欠的人的嘴巴已经被遮住。奇怪的是,只显示嘴巴的视频并不能引起打哈欠。[5]

    在情绪饱满的时候,人们的从众性会提高。查尔斯·金德尔伯格发出了一个警告,即目睹别人的变富会产生有害影响,这一警告也适用于阿希博士的实验:在实验室里成功地抵抗了社会压力的人,在现实中却可能无法抵抗充满情绪的群体幻想。

    模仿不仅仅是一种最真诚的恭维,它对我们的生存也至关重要。在人类进化过程中,我们的物种必须要适应各种各样的环境。这种适应有两种形式。第一种是身体上的,一个明显的例子是非洲人的皮肤比北欧人更黑,因为深色皮肤可以保护底层组织免受热带阳光的伤害;相反,浅色皮肤可以在阳光较少的北纬度地区更有效地生成维生素D。

    第二种适应是文化和心理上的,正如进化心理学的先驱罗伯特·博伊德和彼得·理查森指出的那样,在亚马孙河雨林生存所需的技能与在北极生活的人所需的技能大不相同,他们:

    必须知道如何制作几十种基本的工具——皮艇、保暖衣、倒钩鱼叉、油灯、用皮毛和雪搭建的住所、防止雪盲症的护目镜、狗拉雪橇以及制作这些工具的工具……虽然我们是相当聪明的动物,但我们做不到这一点,因为我们还不够聪明。皮艇是一种由各种不同部分组成的高度复杂的物体,设计一艘好的皮艇,意味着需要找到一种极为罕见的各部分组合。[6]

    换句话说,如果你以前从未见过北极人用当地存在的原材料制作皮艇,那么你几乎不可能会制作皮艇。亚马孙本地人所需要的各种其他技能也都是如此。人类从白令海峡迁移到亚马孙河只用了不到1万年的时间,这意味着我们在此之前一定进化出了准确模仿的能力。用博伊德和理查森的话说,能够在如此不同的环境中生存,意味着人类不得不:

    进化(文化上)对当地环境的适应能力——北极的皮艇和亚马孙河流域的喷枪——这是一种适应更新世时期的混乱、快速变化世界的高超能力。然而,创造这种好处的心理机制必然伴随着内在成本。为了获得社会学习的好处,人类必须是轻信的……我们以低廉的价格获得了橡皮艇和喷枪这样奇妙的改编作品。问题在于,对这种容易适应的传统的贪婪,很容易导致不适应的情况以某种方式出现。[7]

    在过去的大概5万年里,人类物种已经从非洲诞生地传播到地球的几乎每一个角落,从北极海岸到热带,再到广阔太平洋中的各个孤岛。晚更新世时期,人类物种从北极之地向麦哲伦海峡迁徙,在这期间能够适应如此多样的环境,这依赖于人类精确模仿的能力。但是,人类在石器时代的许多适应性已经不适合于现代世界,一个经典的例子就是富含能量的脂肪和糖对我们的吸引力,在我们的进化史上,脂肪和糖曾经是稀缺的,可以帮我们维持生命,但现在作为廉价垃圾食品存在,并威胁人类健康。同样地,我们某些古老的模仿倾向也常常不适合于现代,用麦基的名言来说,会给现代社会带来“非同寻常的大众幻想与群众性癫狂”。

    群体幻想的传播还助长了另一种古老的心理冲动,即人类具有压制与日常信仰相矛盾的事实和数据的倾向。1946年,心理学家弗里茨·海德提出了所谓的“平衡状态”范式,以解释人们在日常生活中如何处理大量复杂且往往相互矛盾的数据。想象一下,你认识一个叫鲍勃的人,你和他都对某种能带来一定情感分量的物品有自己的看法,比如说安卓手机与苹果手机相比,哪一款更加高级。

    如果你很欣赏鲍勃,并且你俩都认为苹果手机更好,那么你就会感到很舒服;你现在就处于海德所说的“平衡状态”。类似地,如果你认为苹果手机更好,但是鲍勃喜欢他的安卓手机,并且你认为鲍勃是个无知的浑蛋,那么你也处于“平衡状态”,因为你对鲍勃的负面评价能够使你驳斥他的相反观点。[8]但是,如果你欣赏鲍勃但在手机问题上不同意他的观点,那么你就处于一种让自己不舒服的“不平衡状态”。

    如果你对鲍勃的欣赏只有一点点,或者如果你对手机不太在乎,那么你可以忽略自己的不适。但如果鲍勃是你最亲密的朋友,而你在一些更具情感分量的事情上(比如特朗普的总统任期问题)与他存在强烈分歧,那么你就必须采取行动解决欣赏鲍勃和政治分歧之间的不平衡。神经科学家最近发现,这种不平衡状态会增加背内侧前额叶的活跃性。背内侧前额叶是位于额头中部上方两个脑半球的大脑区域。此外,这种活跃性预示着人们对鲍勃或唐纳德·特朗普的看法将发生变化。换句话说,如果你想让你的背内侧前额叶停止烦扰你,你就必须改变对其中一个人的看法。[9]与此相反,当受试者得知专家同意他的观点,即达到平衡状态时,大脑的另一个部分,腹侧纹状体,位于两个脑半球深处的成对结构,就会被激活。[10]这一区域能接收多巴胺神经元的密集性输入,而多巴胺是一种让我们感到快乐的神经递质。

    在《非同寻常的大众幻想》1841年的初始版本中,麦基写到了南海泡沫:

    企业,像伊卡洛斯一样,飞得太高,融化了翅膀上的蜡;和伊卡洛斯一样,她也掉进了海里,当她在海浪中挣扎时,她认识到她最适合的地方是坚实的地面。从那以后,她没再尝试过这么高的飞行。[11]

    但写下这些话后的几年内,金融市场证明麦基是错的,因为投机的伊卡洛斯将再次飙升,这一次将围绕第一条蒸汽铁路的兴奋和混乱,相应的金融狂热将使1719—1720年的南海泡沫也相形见绌。很少有作家能比历史学家斯蒂芬·安布罗斯更好地描述蒸汽机爆发前的人类状况:

    1801年,一个关键事实是,世界上没有什么能比马的速度更快。没有任何人、制造品、蒲式耳小麦、大块牛肉,信件、信息,以及任何形式的想法、订单或指示能够移动得更快。没有什么能够比马更快了,就杰斐逊[12]的同时代人所知,没有什么将会比马更快。[13]

    1851年,英国历史学家约翰·弗朗西斯的经典记录见证了英国的铁路网建设。他将近代交通状况描述如下:

    用来运送农产品的机器,结构粗陋,既沉重又笨拙。即使道路状况还可以,移动(这些机器)也很困难。如果道路状况不好,那么它们要么被沼泽吞没,要么掉进堤坝中:有时,它们陷入泥泞的道路中太深了,根本无法逃脱,必须要等到温暖的天气和炙热的太阳到来才可以。几个月以来,产品都无法进入市场,水果在产地腐烂,而在几英里之外的市场上却远远供不应求……人们发现,出口到国外要比把农产品从英格兰北部运到南部的成本更低。将商品从伦敦运送到葡萄牙比从诺里奇[14]运送到伦敦更容易。[15]

    用蒸汽动力代替人力、牲畜和水车的想法,可以追溯到2000年前的托勒密希腊人,据说他们用蒸汽动力来打开和关闭一座亚历山大神庙的门。1712年左右,英国发明家托马斯·纽科门制造了第一台蒸汽机,该机体积庞大,效率低下,只能用于煤矿的排水,因为煤矿的燃料非常丰富。因此,詹姆斯·瓦特并没有像人们通常认为的那样在1776年发明蒸汽机,而是完成了一件更巧妙、更有效的事情:通过在纽科门的设计中增加一个外部冷凝器,制造出一种燃料效率高的装置,其可以在远离煤矿的地方使用。这一创新让瓦特的合伙人马修·博尔顿说出了那句名言:“先生,我这里卖的是全世界都渴望拥有的——动力。”[16]

    在接下来的25年里,瓦特首先使用笨重的发动机驱动船桨,然后不断缩小发动机体积,到1801年,发动机已经缩小到足以让理查德·特雷维西克将之安装到陆地马车上;到1808年,他已经在伦敦尤斯顿广场附近提供了价格为5先令的乘车服务。早期的装置由软铁制成,非常脆弱,那时一位技师的妻子不仅必须在凌晨4点醒来给发动机加燃料,还必须用她强壮的肩膀使发动机运转。[17]

    18世纪之交,乔治·斯蒂芬森,诺森伯兰(位于英格兰北部)一个不识字的蒸汽机看管人的儿子,继承了父亲的职业,但与父亲不同,他在夜校学会了阅读、写作和数学技能,而且将自己的天赋用于逐渐提高早期蒸汽装置的效率。拿破仑战争让英国付出了高昂的代价,干草价格的高昂暂时推动了蒸汽动力对马力拉动矿车的代替,但直到1818年,斯蒂芬森才说服纽卡斯尔地区附近达灵顿的矿主,修建了一条通往25英里外的蒂斯河畔斯托克顿的蒸汽轨道线,于1825年9月开始使用。尽管轨道线非常短,但是后来在经济上非常成功。[18]

    新铁路技术震惊了世界:1825—1845年,英格兰经历了至少三次铁路泡沫。第一次泡沫紧随斯托克顿—达灵顿铁路线的建成。斯蒂芬森早期的发动机并不可靠,运营的最初几年,煤炭车和客车经常需要马来牵引。但随着发动机的改进,多达59条铁路线列入修建计划。[19]

    第一批项目在议会中遭到了不小的反对,因为《泡沫法案》(南海事件的遗留法案,此时已经有百年历史)规定,所有的公司组建都必须由议会批准。最积极的反对者是运河和收费公路的经营者,他们认识到铁路运输会对自身利润造成损害。他们及其爪牙告诉公众,发动机的烟雾会杀死鸟类;发动机的重量会使其无法移动;发动机的火花会把货物烧成灰烬;老人们会被碾死;受惊的马会伤害骑马的人;马会灭绝,燕麦和干草种植户将会破产;狐狸会消失;而且,被噪声干扰的奶牛将停止产奶。[20]

    1825年,议会废除了《泡沫法案》,但普遍存在的金融恐慌以及落后的发动机技术,阻碍了更多项目的开展,经过1825—1826年的一番议会波折,斯蒂芬森的利物浦—曼彻斯特铁路花了4年时间才建成,于1830年9月15日正式通车。它长35英里,是当时的工程奇迹,需要建造64座桥梁并挖掘300万立方码[21]的土壤。

    这项非凡的新技术有望改变人们的日常生活,这激起了那些想要先下手为强的人的贪婪。这种刺激在1836—1837年达到顶峰。一位记者写道:“我们的语言开始受到(铁路)影响。人们用‘加蒸汽’表示‘打起精神’,用‘铁路速度’表示‘很快的速度’,并以小时和分钟估计距离。”[22]新闻报道提到,一位商人在早晨坐上从曼彻斯特到利物浦的火车,当天就能运回150吨棉花,并以巨大的利润出售,然后重复这种做法。“不是支持者,而是铁路的反对者被认为是疯子。如果这是一种狂热,那么这种狂热就像我们呼吸的空气一样。”[23]约翰·弗朗西斯写道:“1836—1837年的这几个月将长久地被商业人士铭记。数千人关注并将资本投入计划中的公司。”[24]

    和其他泡沫事件一样,利率下降进一步增强了新技术的吸引力,因为利率下降能使投资资本更加充裕。25年前,拿破仑战争引起的借贷需求提高了利率;1815年利率达到顶峰时,一个富有的英国人通过购买政府债券使其索维林金币[25]的收益率接近6%。在接下来的30年里,利率下降到3.25%。[26]当投资者不满于安全资产的超低利率时,他们就会抬高那些潜在收益更高的风险资产的价格。著名记者(也是《经济学人》的编辑)沃尔特·白芝浩在描绘英国铁路泡沫破裂后的一代人时写道:“约翰·布尔可以忍受很多事情,但他忍受不了2%的利率。”[27]换句话说,低利率是泡沫萌芽的沃土。

    低利率,加上这一时期斯蒂芬森的利物浦—曼彻斯特铁路的成功,重新点燃了铁路投机:“媒体支持这种狂热,政府也做出了许可,而人民为此付出了代价。铁路立刻成为一种时尚和狂热。英格兰规划了各条铁路。”[28]

    每一种泡沫里都有自我毁灭的种子。就这个事件而言,廉价资本催生的重复铁路线过度竞争就是种子。利物浦和曼彻斯特的股东们吃到了牛排,而那些跟随频繁的人则比不频繁的人吃到了更多酸臭的食物。1836年的《爱丁堡评论》指出:“事实上,两个比较大的地方之间(无论距离多么遥远),几乎都会有一条被某个公司占据的可行性铁轨线,通常会同时启动两条、三条或四条竞争性路线。”约翰·弗朗西斯写道:“一个大都会区的某个教区,有16项铁路计划,计划拆除的房屋超过1200栋。”[29]

    这些只是最可信的计划。在达勒姆,某位企业家同时工作于三条平行的铁路线上。第一条是成功的,另外两条,很自然地,失败了。而其他发起人的设想包括:由帆或火箭驱动的火车头,能以每小时数百英里的速度运行;高架木轨线;另外一个,根据弗朗西斯的记录,广告说法是“把残疾人抬到床上去”。[30]

    无论何时何地,免费获得的信贷和轻信的投资者都是无赖发起人的垫脚石。当时一位评论家指出,通常:

    一个穷困潦倒的冒险家突然想到,从A镇到B镇的一条铁路线是一项巨大的公共事业,他从中可以获取巨大的利益。因此,他购买了一份军用地图,布鲁克县的或者是哪个地方的地名词典,以及一份名录。首先,他在两个城镇之间画了一条线,在阴暗的山丘之间的这里或那里画了一些漂亮的曲线,目的是使它有一种真实的感觉,他称此为调查报告,尽管他和他的人根本没有去过这个地方。地名词典、名录以及支付给一个无赖或马车夫的一罐啤酒,构成了他收入来源的所有原材料。幸运的是,年收入从未低于15%、20%或30%。收入经常如此之多,他都不好意思去欺骗更多的人了。[31]

    据说埃德蒙·德·罗斯柴尔德说过,“有三种赔钱的主要方式:葡萄酒、女人和发动机。前两种更令人愉悦,而第三种迄今为止(在赔钱问题上)更为确定。”[32]随着越来越多的铁路轨道进入施工阶段,可聘用的合格工程师和劳动力数量不足,导致工期延误、成本大量超支、无法解决发动机难题等,这最终导致不可避免的破产潮。

    和南海泡沫期间的状况一样,英国的合股公司最初只筹集到所需资本的一小部分。投资者最初只需要支付股票面值的一小部分,对接下来铁路建设所需要筹集的资本承担分期缴纳的义务——这是一种干柴式“杠杆”结构,不可避免地会遇到烈火。

    回应马上就来了。钱变得稀缺;人们已经看清楚了这些人的愚蠢;各种类型的股票都下跌了。然后是可怕的不安,毁灭降临到社区,悲伤使家庭不再温暖。那些曾经因为假想的财富而趾高气扬的男人为他们的鲁莽而悲伤,而女人们则因为无法阻止而哭泣。[33]

    至19世纪30年代的泡沫破灭时,议会已经批准了2285英里的铁路修建计划,但是截至1838年,实际动工还不足1/4。其余的里程通常是不盈利的,还需要几年时间才能完成;正在进行中的则需要投资者追缴大量资金。1836—1837年暴跌之后,股票价格确实又有所回升,因此那些坚持持有股票的人也没有很差;在此之前一直稳定的股票价格,在1836年上涨了约80%,然后又迅速回落到实际上略高于泡沫前的水平。[34]到1841年,从伦敦到纽卡斯尔近300英里的旅程在17个小时内就可以实现:“一个理性的人,还能要求什么呢?”《铁路时报》为此报道。[35]

    事实上,截至1844年,普通股东对前10年的投资回报非常满意。这推动了19世纪40年代后期更大的泡沫,相关代表人物是乔治·哈德森。哈德森出生于1800年,是约克郡一个小农场主的儿子,由于被假定为会继续耕种土地,因此接受了很少的正规教育。在他9岁时,父亲去世,他被送到约克的一家亚麻布店当学徒,他也由此因祸得福。哈德森的精力、魅力和才智很快在布店里显现出来,而这些是在耕犁中无法体现的。他最终通过婚姻关系加入雇主家庭,并接管了布店。1827年,好运继续光顾这个年轻的店主,他从一个叔父那里继承了30000英镑的遗产,叔父临终时,他正好在现场(叔父遗嘱的受益人可能在最后一刻被更改为他)。[36]

    新获得的财富使他得以进入政治和银行业,1833年,他被任命为约克铁路委员会的司库,负责一条通过发行股票筹集建设资金的地方性铁路。哈德森聘请约翰·雷尼爵士勘测路线,但这位著名工程师建议采用马拉系统,这令委员会很失望。幸运的是,在某次参观叔父留给他的不动产时,哈德森遇到了乔治·斯蒂芬森,后者当时已经是一位非常著名的工程师。哈德森充分展示了自己的魅力和远见,斯蒂芬森同意建造约克—北米德兰铁路。该铁路由一家合股公司出资,第一段仅14.5英里长,于1839年开通。

    在接下来的10年里,哈德森成为公众所熟知的“铁路之王”,创建了一个由十几家铁路公司组成的帝国,其中四家是全国最大的铁路公司。他领导几家公司的董事会,经常一会儿出现在这里勘测一条新路线,一会儿又出现在那里指责一家失败公司的股东大会,并四处筹集新资本。他的生活围绕着两个权力中心展开:一个是约克,他在那里担任过几届市长,慷慨而又受人爱戴;另一个是威斯敏斯特,国家的政治中心。

    哈德森能把沙子卖给贝都因人[37]。即使是最坚定的对手,他也能扭转局面。他的标志性胜利是说服了威廉·尤尔特·格莱斯顿。格莱斯顿也许是19世纪最令人敬畏的政治家,他在1832年22岁时进入议会,在1843年成为贸易委员会主席,该委员会是议会的铁路立法部门。他先后担任了四届英国财政大臣,又于1868—1894年四次出任英国首相。

    这两个人简直有天壤之别:哈德森充满活力而未受教育,是约克郡农民的儿子,而格莱斯顿毕业于伊顿公学和牛津大学,是奴隶主的儿子。两人在当时最关键的问题上存在分歧;哈德森是正统的保守党,是一个反对废除《谷物法》的贸易保护主义者;格莱斯顿虽然名义上是保守党,但实际上是一位热诚的自由贸易者。

    不过,假如在今天,哈德森将被称为自由主义者,因为他反对政府干预商业,尤其是他所珍爱的铁路,而格莱斯顿很早就认为技术日益发达的经济领域需要政府监管。比约翰·洛克菲勒降低油价还要早几十年,格莱斯顿就预见到,实力最强的铁路公司可以通过大幅减价将竞争对手赶出市场,垄断市场后,公众将越来越受其摆布——格莱斯顿认为,哈德森的某个公司就是这样。

    1844年3月,哈德森在贸易委员会作证时,老练地强调了他与格莱斯顿的一致意见:为了公众的利益,应该限制对竞争性路线的许可(但没有提到自己的公司)。委员会推迟了这个话题,追问哈德森是如何确定票价的。委员会想知道,议会定期调整票价有什么错?哈德森一如既往地做好了充分准备,他回答说,他不反对由政府规定票价,但要求议会限制竞争性路线的许可证发放。

    委员会对哈德森的回答感到些许宽慰,提出了相对比较温和的铁路立法,规定“议会级”票价为每英里1便士。[38]但该法案使议会能够修改铁路公司的票价,这些铁路公司曾经利润如此丰厚,可以发放超过10%的股息分红;该法案通过后,对于任何已经获得许可并运营超过20年的铁路公司,政府都将有权购买。

    这令哈德森很焦虑,他给格莱斯顿写了一封公开信,信中用最悦耳、最恭维的语气对该法案中降低票价以及政府的购买选择权表示反对。他组织了一个由铁路公司所有权人组成的代表团,他们一起前往唐宁街10号的首相官邸。首相罗伯特·皮尔对此印象深刻,于是在下议院发表了一些对铁路公司有利的意见。

    格莱斯顿接受了公开信的暗示,私下会见了哈德森,会面中,哈德森把坦白直率的魅力发挥到了极致,把这位委员会主席感动了。格莱斯顿评论道:“将哈德森看作一个投机者是一个巨大的误会,他是一个非常有辨别力的人,拥有很大的勇气和很强的进取心——一个非常大胆但非常明智的设计师。”格莱斯顿基本废除了法案:只在法案中保留了低级三等车票的票价限制。[39]

    哈德森意识到,他差点儿忽略了议会的潜在监督职能,他需要更积极地参与政治。假如在今天,强大的实业家可能会为自己雇用一大群说客;但19世纪的英国具有更宽松的道德环境,有一个更直接的办法:哈德森只需要给自己买一个下议院的席位。1845年中,机会出现了。在冷清的沿海小镇森德兰,他接管了当地一条失败的铁路以及码头,作为交换条件,那里的官员们提名他为保守党的席位候选人。他于8月14日正式当选,比较类似于现代社会中同时在美国参议院任职的高盛公司董事长。

    那天晚上,一辆专列将他当选的消息从森德兰送到伦敦,第二天,另一辆专列将伦敦《晨报》对这一事件的报道带回森德兰。在胜利庆典的狂欢中,哈德森将报纸扔进人群,欢呼道:“看,看智慧的进军!”[40]两个月后,在森德兰的一次宴会上,他鼓吹自己码头公司的股票,再次激发了当地人的热情:“我不明白,为什么你们不能让圣彼得斯堡的棉花、中国和世界其他地区的产品运到森德兰港,只要你们提供设施……让我们想象一下,我们将成为世界的利物浦和曼彻斯特。”[41]

    他似乎很少睡觉;例如,1846年5月2日至3日的晚上,他在下议院工作到凌晨2:30,打了个盹儿,然后坐上开往德比(英格兰中部城市)的早班火车,其大约在伦敦、约克以及他的其中一个公司——米德兰铁路公司总部三者中间的位置(见图4-2、图4-3)。在那里,他向股东们解释他的26项提案的精髓,这些提案通过修建一些新的、扩展一些已经存在的铁路和运河,将铁路和运河系统相融合。该计划需要300万英镑的投资资本;他向心存疑惑的人坦率地承认,的确许多新线路将失败,但总的来说,它们将打造一个坚不可摧的地区铁路系统。他已经拥有大量支持者,很轻易地排除掉了那些分散的持反对意见的股东,然后通过了所有26项公司提案。[42]一位当时的评论家写道:

    资料来源:The Railway King,by Richard S.Lambert,London,George Allen & Unwin Ltd,©1964,p.57.Copyright ©1934 HarperCollins Publishers.All rights reserved.

    图4-2 1840年的英国铁路系统(粗体部分是哈德森公司建的铁路)

    资料来源:The Railway King,by Richard S.Lambert,London,George Allen & Unwin Ltd,©1964,p.238.Copyright ©1934 HarperCollins Publishers.All rights reserved.

    图4-3 1849年的英国铁路系统(粗体部分是哈德森公司建的铁路)

    似乎从来没有什么事情能让他烦乱,也没有什么事情会让他疲劳。他在议会委员会中斗争,一天又一天;他以一种认真的态度争辩和恳求,从目的上看几乎没有失败过。他今天在镇上哄骗一个委员会,明天说服一位大主教;早上,在一个不起眼的办公室里说服一些持对立主张的人,下午,以某种大胆的突袭政策震惊了证券交易所。[43]

    他的专注力和计算能力令人敬佩。人们经常看到他把头往后一仰,遮住眼睛,然后准确地预测出尚未建成的铁路线的红利,他还能同时参与两场激烈的对话。商业伙伴们发现,如果他们的分析没有抓住要点,马上就会被他打断,但很容易又会被他原谅,他对员工和陌生人非常宽宏大量。但是,他处理数字和疯狂交易的能力也伴随着一个缺点:他过分依赖口头指令,没有保存交易的账簿或记录,只是简单地认为他的愿望会实现。[44]

    1843年的英格兰铁路线还不到2000英里,但是到1848年底已经超过5000英里;哈德森控制了其中大约1450英里的路线,并对英格兰东北部拥有实际的垄断权。[45]更多的铁路线正在计划中:议会在1844年批准了800英里,在1845年批准了2700英里,在1846年批准了4500英里。以少量首期付款认购股票,然后在很久之后完成全部购买,是哈德森和大多数其他发起人的经营手段。在工程尚未开工、连运营和收入都没有的时候,新股通常就会公布每年接近10%的股息;大多数投资者被高收益吸引,却没有注意到收入的缺失意味着最初投资者的股息必须来自新投资者的资本,这在现在被称为“庞氏骗局”。在庞氏骗局下,后来股东的股息是无法获得支付的。哈德森故意泄露他的铁路项目即将被议会批准的消息,以此推动这种狂热。就像蛋糕上的糖霜,直到泡沫的最后阶段,哈德森稠密的东北部铁路网还在阻碍竞争性路线的股票发行。

    19世纪40年代,除了布朗特和哈德森这样的发起者、公众和政客外,泡沫剧场的第四个主角——媒体出现了。概括来说,那个时代有两类媒体:以《泰晤士报》为代表的“旧媒体”和以《铁路时报》为代表的铁路专报“新媒体”;前者坚持高度正统的怀疑主义,而后者则煽动投机的火焰。在泡沫最严重的时候,市面上至少有20种铁路出版物,铁路公司每周都要慷慨地花费1.2万~1.4万英镑发布广告,这些资金成为媒体的主要收入来源,而这些钱本可以更明智地用于建设。关于新提案的吹嘘文章比比皆是。一位评论家讽刺道:“委员会为绅士和男爵们高兴,下议院通过新提案的前景是肯定的。它的工程师是斯蒂芬森(此时已经是乔治的儿子罗伯特·斯蒂芬森);它的当权者是哈德森;它的银行家是格林。广告还谦虚地补充说,利润不会超过15%。”[46]一篇文章夸张地说,铁路是环绕全球的新世界奇迹:

    不满足于让利物浦成为他们的铁路中心……他们的目标是全球。遥远的印度跨越河海对铁路表示期盼,中国正在倾听这神奇的声音。古希腊被毁坏的山丘和破碎的祭坛将很快与火车头的汽笛声相呼应,或者被转变为商业圣地。通过这些宏伟的工程,河流得以跨越,领土得以穿越,商业得以特许,联邦得以巩固;通过它们,金刚石可以被分割,人类在时间和空间上拥有主宰权。[47]

    直到1843年,英国经济依旧在消化1836—1837年的泡沫,但在1844年秋天,银行的贷款利率已经降为2.5%;更为不祥的是,银行普遍认为铁路证券“像房子一样安全”,并乐于将其作为抵押品。股票认购名单会让21世纪初房地产泡沫中的美国抵押贷款经纪人都脸红:一个年收入54英镑的半薪军官在多个名单上的总收入为41500英镑;两个住在阁楼里的清洁工的儿子,其中一个认购了12500英镑的股票,另一个25000英镑,所包含的追缴金是他们无法承担的;更多的追缴金来自虚构联系方式的股东。[48]

    一位不知姓名的观察者这样描述,英国公众:

    看到整个世界都在为铁路疯狂。铁路在公众集会上受到赞扬;它是公众崇拜的对象;人们在交易所里谈论它;在参议院为它立法;在舞台上暗喻它。它渗透到每一个阶层;渗透到每一个家庭;所有人都被它诱惑。那些说话与契约一样可靠的人,现在也加入追逐铁路的行列,被旋涡带走了。[49]

    商人兼议员詹姆斯·莫里森观察到:

    不易觉察的贪婪之毒在每个阶层蔓延,不仅影响了高贵的大殿主人,也影响了简陋农舍里的合居者。公爵夫人们甚至会在众人面前用凭证弄脏手指,老女仆们会发抖地急切询问股票的价格。年轻的女士们抛弃了婚礼清单而专注于股票行情表,询问她们的爱人有关牛市、熊市操作的问题,这吓到了她们的爱人。时尚人士频繁地出现在经纪人那里,而不是出现在俱乐部。商人不再关注生意而去打理他的股票,但最终,他的股票和生意都将离开他。[50]

    按照贸易委员会的规定,每年11月30日是提交新路线计划的截止日期。1845年11月30日傍晚,当800个铁路计划发起人聚集在白厅(指英国政府)办公室时,一股狂潮席卷了首都:铁路公司允许通过的快递列车以每小时80英里的速度驶向伦敦,但那些运载竞争性路线计划书的列车被铁路公司阻止通过;一位设计师将路线计划书装进一个装饰齐全的灵柩内,然后将其运到列车上,才绕过了铁路公司的障碍。[51]

    如约翰·弗朗西斯所写的,就像南海泡沫期间一样,交易巷里挤满了人,交通堵塞,“几乎无法通行”,周围的街区“像集市一样”。他继续写道:

    谨慎的商人和敏锐的制造商都没有抵制住投机的诱惑。它像麻风病一样在他们中间传播。它不仅毁灭了无辜者,也毁灭了有罪者。它不仅毁坏了很多简陋的农舍,也扰乱了许多亲王的住所。人们急于致富,却被毁灭。他们大量购买;他们踊跃认购;他们抛弃了自己公司的存账室;如果成功了,他们就会继续买入;如果失败了,那么他们往往会自毁,使本已凄凉的家园更加悲惨。[52]

    斯蒂芬森在威斯敏斯特乔治大街的办公室比首相在唐宁街的办公室更受欢迎;铁的价格翻了一番;勘测员的工资很高,特别是那些在军械局工作的人,经常未经许可非法进入私人土地。一份议会报告表明,157名议员的股票认购额超过2000英镑;到1845年夏天,“全国出现了前所未有的对所有生意的忽视;几个月里,柜台上找不到卖货的商人,办公室里也找不到批发商,全国各地都是这样。如果你去拜访商家,那么你肯定会得到‘去城里了’这样的答复”。就连勃朗特[53]一家也参与了:艾米莉和安妮拥有约克和北米德兰的股票,而更脚踏实地的夏洛蒂则持怀疑态度。[54]

    虽然哈德森的许多商业行为,特别是他对公司治理的保密和高压手段,放在今天可能会让他坐牢,但在那时还不是非法的。再过80年,查尔斯·庞兹[55]在初始资本支付股息的操作中不会使用自己的名字;在19世纪40年代早期,这些做法不会引起法律审查(但这种情况很快就会改变)。哈德森的终结不是来自欺诈或欺骗,而只是来自过度建设和监管改革。

    与18世纪的双泡沫不同,这次事件中铁路公司的倒闭过程比较缓慢。到19世纪40年代末,哈德森的铁路网(大致从伦敦延伸到爱丁堡)越来越被东西部的竞争性路线包围。为了进一步延长铁路线来突破包围圈,他冒险性地从个人投资者那里筹集了大量资金;但与此同时,议会于1847年建立了新的监管制度,在此制度下,用新收购的资本支付旧股东的股息,这种类似庞氏骗局的做法被认定为非法。[56]

    1847年初,英格兰银行将贴现率从3.5%提高到5%,这阻碍了股票认购之后所需追缴金的资本流动。1846年的马铃薯歉收和1848年欧洲大陆的革命动乱加剧了英国的经济困境,迫使哈德森和其他铁路经营者降低股息:惊慌失措的投资者开始抛售股票,到1848年10月,股票价格从1845年的峰值下跌了60%(见图4-4)。[57]

    图4-4 英格兰铁路公司的股票价格(1830—1850年)

    虽然股价下跌的绝对数小于南海泡沫时期,甚至小于20世纪的大熊市时期,但认购机制固有的极端杠杆带来了大面积的破坏:

    很多家庭完全被毁。一个不太起眼的英格兰镇上,发生了一些悲惨的自杀事件。原本被精心培育的女儿们现在需要出去寻找面包,儿子们被迫停止学业,很多家庭被分离:房子被法院强制执行。每一个社会纽带都被破坏。那些以前过着舒适独立生活的人突然发现自己欠了大量无力支付的钱。有的放弃了一切,重新开始;有的离开英国去往欧洲大陆的其他国家,蔑视并逃避债权人的追赶。一位绅士收到了400张法院令状。还有一位贵族承受了15000英镑的债务压力,于是他坐上游艇去往美丽的地中海,在那里,他忘却了与自己有关的所有难题。[58]

    此时,即使是哈德森所犯的小过失也会引致仔细审查,而这样的小过失在过去是很容易被原谅的。证券交易所的两个对手仔细检查了买卖记录,发现哈德森的某家公司以高于市场的价格购买了另一家公司的股票,而这另一家公司恰好也归哈德森个人所有;也就是说,他诈骗股东的行为被发现了。很快,他更严重的违规行为也被发现,尽管还没有上升到需要承担刑事责任的高度,但也让他面临严重的民事判决。

    哈德森还有最后一张王牌:森德兰地区的选民依然非常感激他,这使他在议会又待了10年,只要下议院还在开会,他就不会因债务问题而被捕。随后他会以一种滑稽歌剧式的状态往返于英国和欧洲大陆之间:议会开会时,他可以安全地待在英国,并拼命挽回他的财产;休会后,他逃往巴黎。1859年,他在选举中落败,游戏结束了;朋友们离他而去,只有债权人关注他,他剩下的大量财产被没收。最后,他靠仰慕者给他购买的年金维生。[59]

    1863年的一天,查尔斯·狄更斯[60]即将乘坐“福克斯通”号船返回英格兰,遇到了他的朋友查尔斯·曼比。狄更斯写道:

    曼比向一位衣衫褴褛的人告别,我对这个人有印象,但想不起来他是谁。当我们驶离港口时,那人正站在码头边上,凄凉地挥舞着他的帽子。我对曼比说:“我肯定认识那个人。”“我想你认识,”他说,“哈德森!”哈德森住在巴黎,是曼比带过去的。临别时哈德森对曼比说:“在你回来之前,我再也吃不到一顿丰盛的晚餐了。”[61]

    后两轮铁路泡沫毁掉了英国投资者,但为英国提供了必要的基础设施。1838—1848年,铁路里程增加了10倍,直到今天,英国的铁路地图还和1848年非常相似。1848年之后的将近一个世纪里,这个数字才又翻了一番。

    事实上,不幸的铁路投资者们为英格兰提供了宝贵的公共物品——首个高容量、高速度的运输网络。19世纪初之前的英格兰,人均GDP几乎没有增长;而在此之后,它以每年约2%的速度增长——每一代人大约能翻一番,不仅在英格兰,在其他西方发达国家也是如此。这一转变在很大程度上是由蒸汽驱动的陆海运输效率带来的。[62]这种损害了技术投资者但为国家经济增长提供了必要基础设施的例子,还将继续出现。

    1841年,查尔斯·麦基出版了《非同寻常的大众幻想》第一版,正是在铁路狂热达到高潮之前,因此麦基应该会比其他任何人都更清楚地意识到这种狂热。作为一名记者和受欢迎的作家,他完全应该对此提出警告。

    但是他没有,在1852年出版的该书第二版中,他只在一个两句话的脚注中提到了这一事件。[63]19世纪30年代,青年时期的麦基曾为两份伦敦报纸《太阳报》和《晨报》撰稿并编辑;1844年,就在铁路泡沫破裂之前,他开始担任《格拉斯哥的阿格斯》报纸的编辑,并在这个职位上干了3年,这3年正是铁路从繁荣走向萧条的3年。该报纸,特别是“头条”专栏,经常转载其他报纸的文章。这些文章表明,麦基对铁路发展的总体态度是适度热情,这很可能只是对当时经济基调的一种反应。自由放任是当时的经济基调,其核心是废除《谷物法》,因为《谷物法》使地主、贵族受益,导致粮食价格过高,城市贫民挨饿。而铁路只是麦基及其圈子的次要关注点。[64]

    在麦基担任编辑期间,该报的头条确实转载了《泰晤士报》关于泡沫的可怕警告,但该报也转载了其他报纸中对铁路公司有利的文章。尽管在今天,麦基的名字几乎是“狂热”的同义词,但在当时,他似乎完全错过了他正在经历的那场浩劫。在1845年10月的一篇头条文章中,他直言不讳地说,铁路股的热情与南海泡沫没有什么共同点,南海泡沫“没有什么坚实的基础,完全是虚构的”,而铁路热情的基础:

    宽阔而安全。铁路是这个时代的必需品。其本身就是一种不动产和有形资产……沉默的哲学家和活跃的商界人士都能看出,没有什么能比英国资本用于这些项目更高尚、更有利的了。[65]

    虽然没有什么证据表明麦基也在铁路狂热中赔过钱,但作为那个时代最敏锐的观察者,他没有看到人类的金融非理性,这更证明了金融泡沫的诱惑力。到了19世纪,有这样一条旧新闻:一个世纪前,艾萨克·牛顿的例子说明,即使是具有非凡知识和智慧的人,也无法免受投资泡沫的影响。牛顿不是金融新手,南海泡沫时期,他已经担任英国皇家造币厂厂长20多年了。他在1712年购买的南海股票获得了丰厚的回报,1720年初,他以可观的利润卖出了这些股票,但那年晚些时候,他失去了理智,以更高的价格回购了这些股票。他损失了大约20000英镑,并认识到:“我能计算天体的运动,但不能计算人类的疯狂。”[66]

    英国铁路泡沫可以看作一场许诺改变人们日常生活的技术动乱。几乎与此同时,远离欧洲大陆的美国,产生了一种与之截然不同的极端末日狂热。

    5 米勒运动的“大失望”

    数秘主义与确认偏见

    20世纪50年代中期,一位名叫利昂·费斯汀格的心理学家走运了。

    费斯汀格的父亲是一位政治激进的无神论者,也是自苏联移民至美国的刺绣师。在长期杰出的学术生涯中,费斯汀格将自己的才智运用到社会心理学的新兴领域。他幸运地潜伏到美国中西部的一场飞碟狂热事件中,其正好属于他的研究领域。他的研究对象,即“情感”群体,由一位名叫多萝西·马丁的女性领导,她声称已经向人类传达了神灵们有关大地震和洪水的警报:神灵们告诉她,这两个大灾难将于1954年12月21日吞噬北美。[1]

    社会心理学家们都理解所罗门·阿希的线条长度实验,他们早就知道,社会压力通常会磨灭个体之间的观点差异,因此各个小群体和整个社会都会演化出各自的文化、道德和宗教价值观。此外,他们还知道,这些价值观的转变往往是爆炸性的,其快速扩散类似于传染病。

    20世纪20年代以来,流行病学家对疾病传播进行了数学建模,认为疾病传播主要取决于两个关键参数:病原体的传播率或传染性,以及治愈率或死亡率。社会学家发现,他们可以用同样的方法理解思想和信仰的传播。费斯汀格意识到,马丁及其信徒为他提供了一个实验室,让他能够实时观察这一传播过程。更重要的是,马丁团队提供了一个难得的机会,让他可以观察到末日预言不可避免地失败之后会发生什么。

    假如在今天,任何一个机构审查委员会都不会批准费斯汀格的这项研究。在研究中,他的助手“在没有经过马丁团队知情或同意的情况下”潜伏进了马丁的圈子。[2]费斯汀格的项目也违反了实验和伦理规定,即现场研究人员不应干预受试者的决策。当不知情的马丁及其追随者要求费斯汀格的潜伏者们就意见和建议畅所欲言时,他们被迫屡次违反了这项不干预的规定。

    作为早期的山达基[3]信徒,马丁对于“来世”并不陌生,她经历了该组织对她的“审计”过程,能够回忆起自己的受孕、出生和之前的各次转世。她的主要合作者查尔斯·劳赫德博士,则是一位更传统的末日信仰者。他是密歇根州立大学学生健康服务处的一名医生,为一个主流新教团体做国外医药的宣传工作;后来他的妻子患上失能性的神经症,他开始努力为她求医,无意中遇到了一些飞碟狂热者,他们把他介绍给了马丁女士。

    在预言大灾难的大约前一年,马丁成为一名女先知。她醒来时感到右臂一阵刺痛:“我感觉有人在试图引起我的注意。”[4]她拿起一支铅笔,很快发现自己的手非常陌生,不由自主地写字。与《圣经》中的先知们不同,她最初传达的并不是来自上帝的信息,而是来自更亲近的人的信息:当她向肢体的指挥者询问时,对方透露说自己是她去世的父亲。

    她的通灵技巧很快得到了提高;她疼痛的右臂和铅笔开始传递来自地位更高者的信息:一个叫“兄长”的人,向她提供了一些关于她死去父亲的精神需求方面的建议;其次是来自“塞勒斯”号行星和“号角”号行星的生物,其中最重要的是萨南达,他说自己是耶稣本时代的肉体化身。

    萨南达是一位完全现代化的弥赛亚,当时正在美国境内进行高级侦察,并已与马丁女士以及其他人取得了联系。萨南达及其被称为“卫士”的同伴被这个国家的某些东西(后来被德怀特·艾森豪威尔称为军事-工业综合体)激怒;作为报复,他们将把陆地撕成碎片,并在年底前用一场大洪水淹没它。1954年8月1日晚上,卫士们指示马丁及其11名追随者(其中没有费斯汀格的潜伏者)去见他们的飞碟,但马丁一行人什么也没看到,只看到一个相貌平平的男人。马丁给了那个男人果汁和三明治,但他礼貌地拒绝了,然后走开了。

    飞碟没有出现,这给马丁的团队带来了第一次动摇,有7名成员立即离开了她。马丁和其余4名坚持信仰的人没有等很久:两天后,萨南达就通知马丁,那天是他拒绝了茶点,并表示对她和其他同伴的道德品质感到满意;还告诉她,大灾难发生之前,飞碟将拯救少数人,而他们是部分被选中的人。[5]

    像几乎所有的千禧年主义者和启示性末日论者一样,马丁是一个真诚的傻瓜,而不是一个无赖。她将自己的时间和财富奉献给了她的追随者,为信仰付出了沉重的代价。当芝加哥郊区橡树公园的孩子们从父母那里听到即将到来的大灾难后开始做噩梦时,警方指控她“煽动暴乱”,并对她进行精神治疗,随后她逃离了芝加哥的家。劳赫德也因为与这一事件有关而失业。[6]

    1954年底,当救命飞碟和随后的大灾难几乎确定不会出现时,信徒们的信仰体系被证明与事实不一致,即所谓的信仰“失验”,这是费斯汀格研究的主要目标:他想精准地确定,当事实和数据与根深蒂固的观点不一致时人们会如何行动。其研究成果《当预言失败时》成为心理学家、社会学家、经济学家和政治学家公认的经典之作。[7]费斯汀格后来创造了现在人们很熟悉的术语“认知失调”,用来描述信仰和事实之间,或者更微妙地说,叙事和数据之间的情感冲突。当令人信服的叙事和客观事实发生冲突时,叙事往往会幸存下来,这种结果自远古以来就存在于人类社会。

    多萝西·马丁后来的行为体现出很多人处理认知失调的方式。她并没有根据那些与自己信仰不一致的证据修改自己的信仰体系,她和她的团队在此之前对自己的信仰相对保密,但后来他们反而加倍努力,开始就飞碟的到来进行传教。离开芝加哥地区后,她的余生一直从事于通灵研究,先是在南美、北加利福尼亚,最后在亚利桑那州的塞多纳。在1954年的信仰失验事件过去将近半个世纪后,她以德拉修女的化名在塞多纳去世。[8]

    虽然我们很容易将多萝西·马丁的预言讽刺为一种21世纪的胡编乱造,但在某种程度上,我们都是费斯汀格所说的恶魔的奴隶。马丁及其追随者们所表现出的“加倍努力”似乎是人类行为的一个近乎恒定的现象。当明斯特的再洗礼主义者反复看到博克尔松的末日预言被事实推翻时,他们的信仰,至少在一段时间内,变得更加坚定,他们也加倍努力改变周围城镇居民的信仰。同样的情况也将发生在19世纪中期众多福音派新教徒的末日预言事件中。

    这种反常行为具有某种执拗的意义。信仰失验会带来严重的精神痛苦,而缓解这种痛苦的最好方式,就是和新赢得的信徒在一起。正如费斯汀格所说:“如果越来越多的人相信信仰体系是正确的,那么显然,它终究是正确的。”[9]

    从1620年开始,与第五君主国派关系密切的英国清教徒将第一批殖民者送往北美马萨诸塞州。10年后,马萨诸塞海湾殖民地的新领导人约翰·温斯罗普向他的追随者们宣扬,他们即将看到“一个山巅之城”,该城的成功和上帝的宠爱将受到全世界的热切关注。[10]从马萨诸塞殖民地演变而来的美国,没有国教,宗教和意识形态的自由程度前所未有,这为神启性运动的扩散和发展提供了肥沃的土壤。

    18世纪初和19世纪初,分别出现了第一次和第二次“大觉醒”,即席卷美国和英国的宗教复兴;两者都催生了各种各样的非正统神学,就像之前的宗教改革一样,重视个人神灵主义,贬低有组织的宗教等级制度。

    美联储所发行的20美元纸币上那个轮廓分明、眼神锐利的面孔,总统安德鲁·杰克逊,直接促成了第二次大觉醒,这不失为一种历史讽刺。杰克逊反对建立中央银行,并于1837年美国第二合众国银行许可证到期时拒绝了它的延期申请。他这样做的时机非常糟糕:几乎同时,美国经历了一场壮观的泡沫,泡沫事件非常复杂,其特点是大量政府土地被出售、房地产投机以及棉花价格从繁荣到萧条。后来,泡沫破裂,由于没有一家中央银行能够充当救市的最后贷款人,由此造成的货币短缺使美国陷入持续近10年的萧条,并带来约25%的失业率。那个时代并没有留下什么详细的经济数据,但杰克逊的鲁莽行为给美国造成的损失可能与一个世纪后的大萧条一样严重。英国小说家弗雷德里克·马里亚特在1837年恐慌之后访问了纽约,他写道:

    猜疑、恐惧和不幸弥漫了这座城市。如果我不知道原因的话,我就会以为瘟疫正在肆虐。但笛福已经告诉我原因了。来往的人群中,人们脸上没有一丝笑容;匆忙的脚步,疲惫的脸庞,快速打招呼,或者匆忙地交流着在太阳落山之前会发生的预期损失……被解雇的机械师们像饥饿的狼群一样踱来踱去。这种剧烈的震荡像电一样传播开来,传播到数百英里以外的地方。运河、铁路和所有公共工程都已中断,一位爱尔兰移民靠着他的棚屋,手里拿着闲置的铁锹,饥饿着,他想念他的绿宝石岛[11][12]

    第二次大觉醒运动当时已经开始,于1837年恐慌之后加速进行。觉醒运动中的“助产师”们产生了宗教分裂,例如摩门教和各种公然的欺骗性通灵运动。所谓福克斯姐妹与死者沟通的欺骗性,不亚于伟大作家和政治家霍勒斯·格里利[13]的欺骗性。[14]

    最为壮观的是,多达10万的美国人开始相信世界将在1844年10月22日结束,这个集体幻想起源于威廉·米勒,他是一个谦逊、不爱出风头、深思熟虑的人,本来最不可能成为米勒派领导人。

    米勒出生于1782年,是父母的16个孩子中的长子。他们家位于纽约州最东北部的罗汉普顿镇(见图5-1),是一个虔诚的浸信会农业家庭,家中极度贫困,子女几乎无法接受正规教育。像那个时代的许多农家子弟一样,从9岁到14岁,他只在除了收获期和种植期之外的其他3个月里上学。在家里,这个热爱书籍的男孩只能阅读他父亲的《圣经》、《赞美诗》和《诗篇》;慷慨的邻居借给他《鲁滨孙漂流记》等通俗作品的复印本。他的文学兴趣惹恼了父亲,因为父亲注意到,这些兴趣分散了他的注意力,使他无法做农活,所以小米勒会在深夜偷偷溜到壁炉旁,在燃烧着的松树结的昏暗光线下看书。[15]

    图5-1 美国东北部的米勒主义地标

    21岁时,他结婚了,向东进入佛蒙特州几英里,搬到妻子位于波尔特尼附近的家中耕种。波尔特尼镇正是自然神论的温床。自然神论假定一个超然的至高无上的存在,即一个“神圣的钟表匠”只在远处观察他的创造物,自然神论将《圣经》视为一本纯粹的书,而不是神灵的启示——最多只不过是一本关于古代历史的有用手册。

    镇上的大量图书馆藏书反映出这种自由:伏尔泰的,休谟的,潘恩的,以及其他许多人的书,米勒津津有味地读着,并逐渐成为一名自然神论者。在波尔特尼,米勒还受到最著名的市民马修·里昂的影响。马修·里昂是国会议员、美国独立战争的退伍军人、伊桑·艾伦[16]的煽动性伙伴,还是一个臭名昭著的不可知论者。[17]

    米勒读的启蒙哲学的书越多,就越反感《圣经》:为什么上帝创造了一本完全不可理解的书,然后让那些无法正确解读这本书的不幸灵魂遭受死亡、折磨、流放和饥饿?在米勒看来,人类也有错:

    我读得越多,就越发现人类性格中的严重缺陷。我找不到人类过去历史上有什么亮点,那些世界征服者和历史英雄显然都只是人类形态的恶魔。世界上所有的悲伤、痛楚和苦难,似乎都随着他们对同伴的控制权的增强而增加。我开始对所有人都感到不信任。[18]

    波尔特尼镇上打破旧俗的氛围非常适合这位年轻的农民;他终于从家里的令人窒息的宗教氛围中解脱了,他反叛了,当着大家的面,毫不留情地模仿他祖父的华丽布道,滑稽地模仿他们的假虔诚。[19]

    米勒也确实找到了他的家庭值得称赞的地方:他的父亲曾参加过独立战争,因此作为儿子,他在爱国主义和兵役方面得到了庇护。1810年,当与英国之间的战争临近时,佛蒙特州的民兵组织授予他中尉职位;1812年美国对英宣战后,民兵组织将他提升为上尉,第二年他又调任美国正规军中尉。虽然军衔更低了,但这次调任被视为升职。不管怎样,到1814年初,他已经重新获得了上尉军衔。夏末,他来到尚普兰湖畔的普拉茨堡,在那里,人数和武器装备都处于劣势的美国军队,在一场海陆一体战中决定性地击败了英国侵略者。

    这场战争令米勒感到震惊又害怕,9月11日,他写信告诉妻子,一艘美国船只上的300名士兵和水手中,只有25人幸存。“船上的一些官员说,血是及膝深的。”第二天,他再次写信给妻子:

    天哪!到处都是屠杀。我无法向你描述这种普遍的兴奋……日落时分,在一首扬基小调[20]中,我们军营鸣放了礼炮。在一两英里范围内,1.5万~2万人同时参与海陆交战,这超过了以前我见过的任何一场战争。多么宏伟,多么高尚,但又多么可怕![21]

    这场战争不仅摧毁了英国入侵部队,还摧毁了米勒的自然神论:一支在拿破仑战争中身经百战的15000人的精锐英军,却被一支合并了1500人的正规军和4000人的志愿军的杂乱无章的美军打败,除非有一个主动支持美国的上帝,否则还有什么能够解释美军胜利的原因?“在如此困难的情况下,出现如此令人惊讶的结果,在我看来确实像是一个比人类更强大的力量所做的事情。”[22]

    战争结束后不久,他回到了罗汉普顿的农场。在那里,作为一名受人尊敬的退伍军人和小镇官员,他即将在家族的浸信会中扮演更重要的角色。

    战时的经历和回到童年时保守的宗教环境引发了他的信仰冲突,也就是他先前对上帝的不信仰和战争中看到的超自然之力之间的冲突。基于对阅读的热爱,他使用经文来分析解决这种冲突。大约在1816年的某个时候,他开始对《圣经》进行艰难的逐字逐句分析。例如,如果他遇到“野兽”这个词,且这个词在《但以理书》或《启示录》中象征着异教徒帝国,他就会强迫性地在《圣经》的其余书卷中寻找其他的“野兽”。

    经过几年的努力,通过查阅《圣经》,他找到了之前的不信仰和战争经历之间矛盾的解决办法。在《但以理书》中的四个王国中,只有以天主教会为代表的罗马仍然存在。他被《但以理书》8:14打动:“他对我说,到二千三百日,圣所就必洁净。”

    对米勒来说,一切都很清晰了:《以斯拉记》第7章中,波斯皇帝阿尔塔薛西斯在其当政的第七年发布了返回犹大并建造礼拜场所的命令,当时的历史学家估计这一年是公元前457年。根据米勒的末日论,末日时钟从这一年开始倒计时。鉴于圣经学者所假定的圣经日和时间年的等价性,世界将在2300年后,也就是1843年结束。

    米勒继承了悠久的“数字神秘主义”传统。数秘主义曾经为约阿希姆所迷恋,直至今天人们对它的迷恋还有增无减。最引人注目的现代例子是约翰·泰勒和查尔斯·皮亚齐·史密斯在19世纪末的研究成果。他们注意到金字塔结构中的一些数学巧合,例如,金字塔底部周长的两倍与高度之比接近π值,底部周长与框架石长度之比是365,以及从地球到太阳的距离几乎正好是金字塔高度的10亿倍。接着,史密斯写了一本畅销书《伟大金字塔的遗产》(Our Inheritance in the Great Pyramid),详细描述了这些惊人的发现。[23]

    一个世纪后,一位名叫埃里希·冯·丹尼肯的瑞士人在另一本畅销书《众神的战车》中,利用类似的观察结果证明,外星人曾来过地球。[24]近千年来,神学怪人利用类似的数学巧合和圣经年表来预测世界末日。就在2011年,一位名叫哈罗德·坎普的基督教广播名人,预测世界将在10月21日结束。2012年,他承认了自己的错误,谦卑地接受了《马太福音》24:36的告诫:“那日子、那时辰,没有人知道。”[25]

    杰出的数学作家、趣味数学之王、社交网站策划人马丁·加德纳这样评价史密斯的《伟大金字塔的遗产》:“这一类的经典作品就是我们的遗产。很少有一本书,能如此优美地展现出一个对某种理论深信不疑的聪明人(指作者)轻而易举地掌控着整本书的主题,使其精确地契合他的观点。”[26](具有讽刺意味的是,加德纳正是在米勒神学的直系后裔——基督复临安息日会中长大的。)[27]已故“文学坏小子”克里斯托弗·希钦斯针对那些幻想的圣经日期设定,创造了一个更一针见血的术语:“白痴的里程表”[28]

    圣经的数秘主义源于“模式”现象。《圣经》是一部包含大量数字、叙事和各种往往阐述不清的历法的汇编,勤奋的千禧年主义者几乎可以将未来的任何一个日期视为世界末日。米勒并不是第一个运用圣经数秘主义将1843年定为世界末日的人;1946年,一位名叫勒罗伊·埃德温·弗鲁姆的基督复临安息日会牧师出版了《我们祖先的预言信仰》(The Prophetic Faith of our Fathers),它是一本关于末日计算的历史书,包括四卷。其中记录的几十种末日计算时间集中在1843年。但没有任何一个人能像威廉·米勒那样使数秘主义发挥出如此毁灭性的影响。[29]

    数秘主义的影响不可避免地被另一个著名心理现象“确认偏见”放大。在“确认偏见”现象中,人类一旦确定了一个假说或信仰体系,就会只关注支持其信仰的数据,而避免使用与之相悖的数据。

    “确认偏见”这个词与心理学家彼得·沃森有关。在20世纪50年代后期的一个经典实验中,他向受试者展示了一个由三个数字组成的序列,如2-4-6,并要求他们推导出产生该序列的规则,然后让他们用另一个序列对该规则进行测试。[30]

    受试者根据上述序列推出的最明显的规则是“连续偶数”,因此他们最有可能再提出诸如8-10-12这样的序列进行测试,然后他们被告知这一序列与答案规则一致。然后,受试者可能会提出24-26-28这样的序列,然后也被告知这一序列符合规则。

    在多次连续“确认”他们的“连续偶数”规则后,受试者可能会合理地得出结论,认为这就是正确的规则。

    问题是,这三个序列还符合其他多种规则,例如“数字不断增加”或“只有正增长的数字序列”。换句话说,受试者只是试图确认自己的假设,而事实上更有效的策略是测试一些推翻假设的三数字序列,例如5-7-9,如果考官回答说这个序列也符合规则,那么他们就会知道“连续偶数”规则是不正确的,但“数字不断增加”或“每次增加二的数字序列”规则可能仍然成立。

    大多数受试者通常只测试符合其假设规则的三数字,而不是不符合其规则的三数字。这种只寻找支持假设的证据的做法,使得很少人能够推导出正确的规则。

    作为一名科学家,沃森知道,科学方法的核心是试图推翻假设,但作为一名心理学家,他怀疑人类的自然倾向是要确认这些假设。[31]心理学家很快拓展了沃森的研究,并进行了大量的实验,证明人类物种更倾向于寻找和接受确认的证据,而忽视相反的证据。正如那句老话:“一个违背自己意愿被‘说服’的人还会持有不变的看法。”[32][33]

    在20世纪70年代末的一项经典研究中,斯坦福大学的一组研究人员调查了151名大学生对死刑等争议话题的看法,并从中选出48人,其中24人强烈赞成死刑,24人强烈反对死刑(分别被称为支持者/反对者)。然后,他们向两组人展示了两组不同的研究成果,他们说这些研究成果是真实的,但实际上是虚构的。其中一组“研究”表明,死刑州的谋杀率较低,而另一组“研究”则表明,死刑州的谋杀率较高(赞成威慑/反对威慑)。

    支持者们认为,赞成威慑的研究在方法论上比反对威慑的研究更可靠,他们更加相信赞成威慑的研究;而反对者们则认为反对威慑的研究更为合理和令人信服。最具启发性的是,在实验的最后,在参与者阅读并评估了两组相互矛盾的研究结果后,每组都强化了其原来的支持及反对观点。[34]

    威廉·米勒,以及他后来的追随者们,正患上了长期的“确认偏见”病症。计算出1843年这个时间后,米勒专注于寻找确认性的证据,因此他能够说服自己,认为自己的预测是准确的。米勒得出了1843年世界末日的惊人结论:基督将出现在云端,火焰将吞噬大地。正义之人——那些信仰上帝的人——将会被提升天并获得永生,而邪恶之人不仅会被上帝毁灭,而且他们的灵魂将永远被上帝囚禁。[35]

    在近10年的时间里,米勒没有公开这个令人不安的预言,只和周围认识的人讨论。[36]但他的羞怯和内向更加提高了可信度,特别是在卫理公会、浸信会和长老会神职人员中,他们对米勒的这种同时具有学术性和非教派歧视性的方法印象深刻:任何新教派别的成员都有资格获得救赎。米勒的朋友们被他的末日论征服,但不理解他为什么不愿意布道。这其实是因为米勒害怕成为笑柄,这种恐惧可能源于他的社交拘谨和卑微的教育经历。[37]

    1831年夏,他的浸信会妹妹和妹夫邀请他从罗汉普顿去往佛蒙特州的德累斯顿演讲,那里离尚普兰湖只有16英里。虽然他以前读过传教士写的布道,但他从未发表过自己的布道。此时,他已经快50岁了,身体不好。就在普拉茨堡战争之前,他差点儿死于斑点热,此后,他经常受到各种皮肤感染的折磨。

    历史上并没有他那次演讲内容的记录,但他说的话可能与后来的书面布道没有什么太大不同:基督将出现在天空并复活死去的圣徒,正义之人将“在空中遇见主,在那里他们将把自己完全地交给主”。然后基督会把注意力转向有罪之人:

    看哪,天空布满了乌云,太阳蒙上了面纱;月亮苍白而被遗弃,挂在半空中;冰雹降下,七个号角高声吹响;闪电将硫黄火焰的鲜活光芒洒向远方;这个国家的伟大城市将永远不再崛起。[38]

    他的表现让德累斯顿的浸信会教徒们如此着迷,他们一直留他到星期日。在接下来的8年里,他应邀在新英格兰、纽约和加拿大的农村地区演讲。当无法满足远方教徒的演讲邀请时,他给他们提供了书面传单,后来产生了一系列小册子和书籍,而这又引发了更多的演讲邀请。

    有一位目击者似乎对“确认偏见”有直观理解,他对米勒既钦佩又怀疑,他描述了讲坛上的米勒:

    他本人高大魁梧,宽大的脑袋,高高的额头,一双温柔而富有表现力的眼睛,他声音里所有的抑扬顿挫都表明了他最真诚的敬拜。他的想象力相当丰富,从一个有缺陷的前提中得出的结论对他来说就是一个真正的事实。在这种精神状态下,他开始讲课,用大图表说明但以理和约翰的异象。无数的人前来听他演讲,许多心胸开阔的牧师和非宗教人士也乐于接受他的观点,全国东北部的所有地区都弥漫着极大的兴奋。[39]

    米勒所用的圣经数秘主义早已经有数百年历史,同样,他充满活力的布道风格也缺乏独创性。从约1825年开始,一位长老会牧师、第二次大觉醒的主角查尔斯·格兰迪森·芬尼在听众的参与下完善了后来大家都熟悉的“地狱之火和硫黄”的福音讲演。他的布道带来了大量皈依;一位观察家指出,芬尼经过一座城镇后,“宗教情感深深地渗透其中,人们再也无法组织舞会,而马戏团也无利可图”[40]。米勒本人并不赞成这种新的复兴主义布道方式,但是,毫无疑问他已经掌握了芬尼的技巧,而且邀请米勒演讲的许多人都认为他是芬尼技巧的有效实践者。[41]

    和许多早期福音派教徒一样,芬尼是一位坚定的废奴主义者和社会活动家。早期,米勒也有这些信念:罗汉普顿是“地下铁路”运动[42]的一个停靠站,米勒至少庇护过一名奴隶。但1840年,当他参加完一个废奴协会会议时,他确信腐败在人类社会中如此普遍,必须寻求神灵的干预来解决许多弊病,特别是奴隶制:“如果人类是罪魁祸首的话,那么可怜的奴隶的大赦之年还很遥远。但是上帝能够并将释放被俘之人。我们必须也只能向上帝寻求帮助。”[43]

    米勒华丽的演讲风格让普通听众着迷,而且,他对其他新教派别的宽容和对《圣经》文本的熟悉,也让教会的圣职人员着迷。一位持怀疑态度的教会长老想让他难堪:

    我在他房间里见到了他,提出了一大堆为难他的反对意见。令我惊讶的是,他对这些问题几乎都不陌生,而且他回答这些问题的速度和我提出问题的速度一样快。然后他提出了他的异议和问题,这难倒了我,并推翻了我所依赖的那些解释。我回家时已经筋疲力尽,感觉自己有罪,感到卑微,并下定决心要回答这些问题。[44]

    米勒的受欢迎源于他振奋人心的布道,但这是有代价的:让教徒们所感动的远不是米勒的复临主义神学,而是他演讲内容中的地狱之火和硫黄。米勒是为了从地狱之火中救赎灵魂,而邀请他演讲的人则是为了让教堂的长椅上坐满人。当然,到19世纪30年代末,他已经吸引了一大批传播他信息的支持者。例如,1838年,波士顿《每日时报》的编辑发表了一系列米勒的布道;几乎同一时间,一位名叫约西亚·利奇的牧师写了一本名为《午夜呼声!》(The Midnight Cry!)的支持米勒的小册子,其在新英格兰广泛传播;一位名叫查尔斯·菲奇的波士顿牧师,是废奴主义者威廉·劳埃德·加里森的助手之一,连续几次重读了利奇的作品。利奇、菲奇和其他几位米勒的助手将在未来几年内支持米勒运动,并最终鼓励他做出那个最失败的世界末日预测。[45]

    起初,这些支持并没有使米勒受到鼓舞;到1839年,由于年龄增长和健康状况不佳,他已经步履蹒跚;没有几个人相信4年之后的末日,他因此而沮丧并认为自己是个失败者。他不断收到演讲邀请,但他知道,分散在农村的布道只能拯救少数灵魂免遭即将到来的末日大灾难。[46]

    虽然追随者们认为他是先知,但从技术上说,他不是,因为他坚决否认与全能者(上帝)有任何交流。他只是声称自己有能力从《圣经》中领悟未来。不管他如何看待自己,他显然低估了自己富有说服力的安息日神学对美国东北部神职人员的影响力。例如,1838年,他拒绝了波士顿牧师约书亚·海姆斯和加里森的助手菲奇的演讲邀请。

    与米勒的谦虚和不谙世故不同,海姆斯儒雅而圆滑,在波士顿的改革派圈子里人脉很广。第一基督教会对他来说过于保守,因此他建立了自己的教会,并很自然地命名为第二基督教会。在海姆斯的领导下,第二基督教会发展迅速,不得不在波士顿沙登大街另建了一个有500个座位的小教堂。坚强、外向、有号召力的海姆斯丝毫没有因为米勒的羞怯而退缩。1839年秋天的某个时候,他说服米勒向会众布道,而米勒的表现也给他留下了深刻的印象,于是他将自己相当多的精力、组织能力和当时他所掌握的印刷媒介都投入米勒运动中,并有效地接管了这一事业。

    海姆斯不仅将米勒送往冷清的乡村教堂,还送往拥挤的纽约市和奥尔巴尼市大教堂。他重新出版了米勒的小册子和书籍,创办了一份非常成功的报纸《时兆》,它最初是双周报,很快就成了周报。海姆斯还与其他受米勒末日论影响的人建立了广泛的联系,那些人也出版了他们自己的米勒系报纸。其中最著名的是纳撒尼尔·索瑟德,他后来编辑了最著名的复临主义出版物《午夜呼声!》(容易混淆的是,它与利奇的小册子同名)。

    从各种最小的集会到最大的讲座,海姆斯凭直觉领悟到出版物和布道之间的协同增效作用。以引人入胜的复临主义末日叙事为特色的小册子、报纸和书籍引发了对布道的需求,而布道又引发了更多的出版物销量。信徒们到处传播米勒的话语,他们在港口付款,将一捆捆的小册子留在远洋海船和运河驳船上,或者在火车车厢里悬挂海报。[47]

    从1840年开始,海姆斯组织了几次全体大会,汇集并协调米勒的复临运动,不仅包括传统的教堂集会,还涉及大规模的“野营集会”。

    野营集会并不是海姆斯发明的;第一批野营集会在美国建国后不久就产生了,到1840年,已成为一个组织。其成员一部分是奋兴派[48]教徒,一部分是社交俱乐部成员,他们吸引了很多南卡罗来纳州、田纳西州和肯塔基州边境地区原本孤立的农民。这些农民迫切需要社交活动。通常,他们的浸信会和卫理公会组织者会清理出一片森林土地,将砍伐的树木做成粗糙的长凳和小讲坛,作为流动教堂。(另一方面,圣公会教徒和公理会教徒对野营集会及其传教活动嗤之以鼻。[49]

    米勒的追随者于1842年6月下旬举行了前两次野营集会:一次在新罕布什尔州的东金斯顿,另一次在魁北克的哈特利。新罕布什尔州的集会取得了惊人的成功:多达1万名浸信会教徒和卫理公会教徒前来参加,还有少量自然神论者和不信仰耶稣的“异教徒”,其大概是被无宗教派别歧视的伙伴关系吸引而来的。这次集会证明,海姆斯是一位后勤高手:这些聚会地点都很容易通过铁路到达,根据一位历史学家的说法,还有“大量纯净的凉水,高大的铁杉树和凉爽的树荫,以及僻静的小树林来做祈祷和敬拜”[50]。大、中型城市赞助了帐篷用来住宿,铁路建立了临时车站,为信徒们降低了票价,并让传教士免费乘车。最后,每个帐篷的“主人”都提供了一张记录表,记录着从永恒之火中救赎的灵魂。

    新罕布什尔州的集会非常成功,因此海姆斯和他的同事决定购买一个“大帐篷”,它高55英尺,直径为120英尺,可容纳4000人,过道中还可容纳数千人。在天气恶劣时,它可以在室内提供服务,并可以配备炉灶,以便在寒冷天气举行集会;这个帐篷吸引了纽约州罗切斯特市以及西至俄亥俄州的数千人。在随后的两年中,海姆斯和他的同事组织了125次野营集会,约50万人参加。[51]

    每次野营集会结束时,牧师们都会安排一场祈祷或一首告别的歌曲,其中最受欢迎的是歌曲《永不分离》。

    我们正穿过以马内利[52]的地盘,

    我们很快就将听到号角声,

    很快我们将与耶稣一起统治,

    永不,永不分离。

    什么?永不分离?

    是的,永不分离。

    因为我们很快就会和耶稣一起统治,

    永不,永不分离。[53]

    牧师随后带领会众排成一队走出帐篷,队伍螺旋排列,每个人都能与其他人握手。由于世界末日即将来临,信徒们期待着他们在“天堂野营”的下一次会面。[54]

    米勒为自己的成功付出了高昂的个人代价。起初他的身体就不太好,据他估计仅在1841年就做了627次90分钟的激情演讲。[55]在这期间,由于米勒的皮肤疾病和劳累状况,不止一次,健康问题迫使他早早回到罗汉普顿。他的助手们非常热情地接替了他,因此他对运动的影响力有所减弱。[56]

    若得不到精心管理,情绪满满的群众事件很可能会失控,后来的野营集会就发生了这样的事情。由于海姆斯忙于传播米勒的信息,他让副手查尔斯·斯塔克韦瑟负责管理沙登大街小教堂,但事实证明,斯塔克韦瑟特别善于煽动会众进入疯狂状态。由于害怕他的这种影响,海姆斯最终解雇了斯塔克韦瑟,但无法阻止他参加野营集会。在野营集会上,斯塔克韦瑟的布道使信徒相信他是圣灵的宿主,并拥有“天赋”,包括能够停止蒸汽机或在水上行走。此外,在另一次集会上,一位与会者声称读懂了一位信徒的性格和内心,然后号召追随者们联合起来反对他的怀疑者,以消除永恒诅咒的痛苦。当怀疑者们反抗时,他讲着不为人知的语言并连续击打他们,周围的人试图干预,但也被他谴责下地狱。[57]

    更重要的是,米勒和海姆斯开始失去对日益强大的复临主义传播媒介的控制。信徒们开始出版自己的报纸,名称诸如《真理之声》《将临王国的喜讯》《降临纪事》《帐篷通信》《朱比利号角》《西部午夜呼声》等。其中最后一份报纸是由卫理公会牧师乔治·斯托尔斯创办的,他曾经因为废奴活动而被关押在新罕布什尔州,又以同样的热情追求复临事业,最终落得惨痛的结局。

    1842年12月31日,新年前夕,全国各地的复临主义者聚集在沙登大街迎接1843年的到来,这将是世界的最后一年。海姆斯和斯塔克韦瑟(后者那时还没有被解雇)在拥挤的小教堂里布道。日渐虚弱的米勒向信徒们发出了一封信:

    根据我们的信仰,今年是撒旦统治我们地球的最后一年。耶稣基督会来,并打破他的头……地球上的王国将被粉碎。那有权做王的,必夺取国,得为业,直到永远。[58]

    到了2月,米勒已经从疾病中恢复到可以前往费城,在那里,巨大的中国式博物馆大厅被租来进行他的布道。兴奋之情是如此明显,等待在外面的人群也是如此不守规矩,以至于市政府因为担心市民混乱而取消了2月9日的第一次布道。第二天,米勒的布道效果很好,意外事件也没有发生。随后不久,应市长的邀请,他在特伦顿市进行了布道。在回家的路上,米勒生病了,直到那年秋天一直留在罗汉普顿。海姆斯和几位同僚将国家划分为几个区域,并在各地的教堂布道,租用大厅,还将宣传资料分发,西至威斯康星州和密苏里州,南至北卡罗来纳州和南卡罗来纳州。

    这场运动的中心在波士顿的沙登大街,想听海姆斯布道的人的数量大大超过了教堂的座位数,因此他们计划在霍华德街修建一个更大的、能容纳3000人的场地。根据城市法令的要求,这样规模的建筑需要用砖把四面都围起来,而世界末日已近,因此霍华德街地段非常理想——已经有三面墙,只需要在第四面修建一堵12英尺高的墙。

    这场运动早已引起广大公众的怀疑和奚落,此时,收到了公开的敌意。报纸上充满了警告和蔑视,认为这个信仰体系不仅危险而且极度鲁莽:如果世界末日即将来临,那么不仅在波士顿,而且在辛辛那提和克利夫兰建造会堂都毫无用处。尽管公众的反对声越来越大,但信徒们还是在1843年5月4日为霍华德街的会堂举行了落成仪式。

    正如大多数闭关自守的信仰体系那样,米勒利用确认偏见来支持他们的神学;与往常一样,《圣经》再次成为支持性数据的来源宝库:

    第一要紧的,该知道在末世必有好讥诮的人,随从自己的私欲出来讥诮说:主要降临的应许在哪里呢?因为从列祖睡了以来,万物与起初创造的时候仍是一样。(《彼得后书》,第3章,第3—4节)

    为了鼓舞因日益受到公众蔑视而灰心丧气的队伍,《午夜呼声!》开设“骗徒”和“嘲笑者角落”两个固定专栏。[59]

    米勒一直没有指明末日的确切日期。他将《但以理书》8:14中的2300年加在了波斯皇帝阿尔塔薛西斯允许犹太人返回耶路撒冷重建圣殿的那一年(公元前457年)上,这个简单的算术确定了耶稣复临的时间是1843年。随着这一年平淡无奇地过去,米勒开始敷衍:由于《圣经》中的事件是按照犹太拉比的历法计算的,3月或4月才是一年的开始,根据这一计算调整,犹太人的“1843年”直到1844年3月21日才结束,因此时间仍然充足。[60]

    1844年初,米勒重返战场,在波士顿和纽约市向广大听众布道。随着那个重大日期的临近,他与约西亚·利奇和海姆斯一起,在华盛顿特区举行了一次压轴布道。但是,被米勒称为“恺撒之家”的首都似乎更关注当年的总统选举,而不是即将到来的天启末日,这让他烦恼不已:

    我们的统治者和政治家还没有准备好放弃他们的权力,他们正在为下一任总统而进行政治斗争,就好像他们小小的“短暂权力”将永存一样。但是在上帝的话语、圣灵和历史的帮助下,我将向他们展示,一场重要的革命即将发生,这将取代选择总统的必要性。[61]

    到了3月3日,米勒已经在首都发表了19次布道,然后在返回罗汉普顿的路上又发表了几次。回到罗汉普顿的他精疲力竭,等待3月21日的末日。

    这一天,又平安无事地过去。米勒通过私人邮件写给海姆斯一些充满希望的话语,又通过复临主义的报纸将一些信息发给信徒们:他的计算从来都不精确,所以如果计算偏离了一周或一个月或两个月会怎么样?上帝仍会降临。至于海姆斯,他警告读者:“因此,我们只在心中把事件推迟一个小时是不安全的,应该要生活在不断的期待中,随时准备与我们的大法官(指耶稣)见面。有了这样的想法,我们无法为未来做出确定的安排。”[62]

    实际上还有很多回旋余地。例如,海姆斯旗下的一份报纸《时兆》在上一年发表过一篇未署名的文章,其指出了米勒的计算错误:因为基督教历法中没有0年,所以公元前457年和1843年之间仅相隔2999年,而不是3000年。因此,末日应该发生在“犹太年”的1844年,而不是1843年。

    这篇文章进一步对米勒使用的犹太教历法提出了异议。罗马人将犹太人驱逐到各地后,犹太的大麦收割(赎罪节的日期以大麦收割为基础)再也无法观测到,因此几乎所有犹太人都采用了拉比历法,这是一种精确的数学测年系统,以19年为一个周期。然而,这种较新的历法直到4世纪才开始使用。这篇文章的作者认为,更好的做法是观察圣经时代所使用的“卡拉”历法体系,该历法以最接近犹太大麦收割时间的新月出现时间为一年的开始。通过这种方法计算,天启末日将发生在1844年4月29日。[63]

    但是,那一天也安然无恙地过去了。公众的嘲笑声越来越大,米勒很容易从他的邻居那里听到一些类似的话:“什么?!还没升天?我们以为你已经升天了!不是被你妻子丢下等待被烧吧?”[64]

    《圣经》再次被挖掘出来,以解释为什么末日没有到来。《旧约》中最晦涩难懂的《哈巴谷书》2:3中有这样一段话:“因为这默示有一定的日期,快要应验,并不虚谎。虽然迟延,还要等候。因为必然临到,不再迟延。”《圣经》其他地方也出现过“迟延”一词,最重要的是《马太福音》25章中的一个寓言,10个童女等待“新郎”,新郎代表耶稣。第5节和第6节解释说,“新郎迟延的时候,他们都打盹儿睡着了。半夜有人喊着说,新郎来了,你们出来迎接他”(利奇的小册子和最著名的复临报纸《午夜呼声!》即由此得名)。这种解释使失望的信徒安心了:耶稣的工作基本上完成了,他只是在迟延。

    米勒派遵循了多萝西·马丁的追随者在飞碟首次未能出现时的剧本。一些追随者离开了,但那些留下来的人则加倍努力向周围的人传教。野营集会仍在继续,春季失望之后所产生的不信任,在降低信徒人数的同时,也为更热情的信徒带来了机会。狂热的斯塔克韦瑟被逐出沙登大街后,带走了许多追随者。另一个狂热分子卡尔文·弗伦奇宣称,信徒们不仅可以避免地狱之火,还可以实现“圆满”(一种他们所做的任何事情都可以被宽恕和被祝福的状态),包括可以在婚姻界限之外拥有很多“精神妻子”,这是所有时代的末日论领导人经常享有的特权。斯塔克韦瑟也热情地宣扬这一点。

    1844年8月,在新罕布什尔州埃克塞特市举行的野营集会上,失望与狂热交织。在一次枯燥无味的演讲中,演讲者约瑟夫·贝茨中途被米勒的一位助手打断,助手说一位以前不知名的人物塞缪尔·斯诺有紧急消息。

    斯诺告诉人们,他对《旧约》和《新约》进行了详尽的调查,并取得惊人的发现:4个犹太教圣日和4个基督教圣日之间有一对一的一致性。那一年已经庆祝了3个基督教圣日,而第4个对应着犹太赎罪日的基督教圣日还没有庆祝。赎罪日是犹太教中最神圣的节日,发生在犹太历法的第7个月(提市黎月)的第10天。

    对于1844年的赎罪日在9月23日,斯诺不同意这个日期,他觉得使用古代的卡拉历法更准确,这种历法比犹太教历法晚一个月;因此,末日时间将在10月22日。(即使如此“精确”也有一些不确定性。因为在那个时代,耶路撒冷的新月出现在数千英里之外,新大陆无法观测到,有一些信徒认为实际日期可能会延长至10月24日。)[65]

    斯诺的消息震惊了整个营地,甚至连被打断演讲的贝茨也吓了一跳,贝茨写道:

    这个消息开始发酵,传遍了整个营地。集会结束时,新罕布什尔州的花岗岩山上回响着呼喊声:“看,新郎来了,你们出去迎接他。”当满载的马车、舞台和火车驶过新英格兰地区的各个州、城市和村庄时,呼喊声仍然响亮,“看,新郎来了!”基督,我们可称颂的主,将在第7个月的第10天降临!准备好!准备好![66]

    引用的“新郎”一词再次指向《马太福音》25章。模仿海姆斯的做法,斯诺创办了名为《真正的午夜呼声》的新报纸。斯诺的计算并不是原创:早些时候,米勒本人曾有过“第7个月的第10天”的提法。1844年夏天,饱受批评的米勒派因认知失调和确认偏见而变得狂热,正好可以利用斯诺的构想。充满激情的乔治·斯托尔斯也支持这一构想。

    斯诺和斯托尔斯都是适应能力强的人:斯诺一开始自称为“异教徒”,为一家公开的无神论报纸《波士顿调查》撰稿;和那个时期的许多非信徒一样,他在阅读了米勒的著作后皈依了基督复临主义。而斯托尔斯一开始是卫理公会教徒,有一次他应邀在教堂进行废奴主义的布道;为了阻止他,逮捕他的人将他从教堂拖了出来。

    复临主义的高层们,就像所罗门·阿希的线条测试实验中更易受别人影响的受试者一样,一个接一个地,接受了“第7个月的第10天”,也就是当时日历的10月22日这个末日日期。9月下旬,该运动的旗舰报纸《午夜呼声!》的编辑内森·索瑟德在该报上刊登并支持10月22日这个末日日期。海姆斯一直是一个讲究实效的组织者,他察觉到队伍里的日期改变并提醒米勒,因为米勒以前也提过第10天/第7个月的说法;于是两人都于10月6日确认末日日期是10月22日。现在离末日大概只有两周了。[67]

    米勒在《午夜呼声!》中写道:

    我在第7个月看到了我从未见过的荣耀。虽然主在一年半前向我展示了第7个月的特殊担当,但我没有意识到这类担当的力量(《新约》和《旧约》在圣日问题上的一致性)。现在,称颂主的名字,我在《圣经》中看到了美丽、和谐和一致,我一直在为此祈祷,但直到今天才看到。——我的灵魂啊,感谢主。斯诺兄弟、斯托尔斯兄弟和其他人打开了我的眼睛,他们应该受到祝福。我快回家了。荣耀!荣耀!!荣耀!!![68]

    信徒们大致接受了斯诺的计算;10月12日,守旧者中最持怀疑态度的约西亚·利奇也开始与末日步调一致:

    我的困难全都消失了,我现在在《旧约》中上帝话语所闪耀的光芒里感到愉悦……我感到自卑,服在神大能的手下,现在我抬起头,满怀喜悦地期待10天内见到万王之王。[69]

    霍华德街的会堂里挤满了人,《午夜呼声!》和《复临通报》最先进的蒸汽印刷机24小时不停地疯狂运转,试图在耶稣关上救赎之窗前从地狱之火中拯救出尽可能多的灵魂。

    这时,信徒们已经强烈地意识到,世界上的其他人都认为他们疯了,因此他们面临着一个可怕的选择:要么继续他们的日常活动和生意,被贴上伪君子的标签;要么停止所有这些活动,被指责为狂热分子。领导层一直注意运动的公众形象,建议采取前一种做法:信徒们要过正常的生活,直到末日。

    《午夜呼声!》的最后一期报纸,在预期末日之前的10月19日出版。这期报纸包含了很多由衷的信念表达。也许最令人印象深刻的是威廉·尼古拉斯,他刚刚拜访了他的复临派邻居巴克斯特夫人:

    这是她能够吃点儿东西的第29天。但显然她身体很好,看起来很健康,邻居们说她的体力最近有所增强。她说她没有生病,身体很好。昨天和今天早上,她都出了趟门。[70]

    米勒非常谦虚,他估计有5万人相信耶稣将会在1844年复临,而其他人则认为这个数字是美国总人口2000万中的100万;受人尊敬的美国古文物学会将这场运动的信徒人数定为15万~20万。[71]10月22日,他们中的大多数人沉着自信地迎接末日,与家人在家中或教堂静静地聚集,并告别那些他们认为无法避免地狱之火的人。海姆斯从波士顿前往罗汉普顿,与米勒一起迎接救世主。

    米勒和海姆斯劝诫他们的追随者,要按照圣经的指令“你们去做生意,直等我回来”(《路加福音》19:13)进行日常活动。尽管有这样的建议,但1844年春天,许多人并没有播种庄稼,或者有的播种了但没去收割,以此表达他们的信仰。有些人结束了自己的生意,敲响了公共警报,并不再让孩子们去学校。有些人更进一步,把自己商店和面包店的东西都送给了别人。还有一些人把自己的大部分钱和世俗财产都送给了别人。[72]复临主义的报纸报道说,有几十个人在野营集会上供认了自己的罪行;当信徒们试图把钱送人时却没有成功,钞票散落在讲坛上。信徒们放弃了自己数千美元的债权;纽约立法机构宽恕了一名议员,以便他能为世界末日做准备;在罗切斯特,一名妇女供认了几年前在英国犯下的谋杀罪,并要求被送回那里受审。[73]根据一部19世纪的费城综合历史:

    米勒教堂位于伍德和卡洛希尔之间的朱利安娜街上,在那里,米勒的追随者们日夜相聚,望着星星和太阳,祈祷并警告执迷不悟者“审判日就在眼前”。他们中的许多人开始以很低的价格出售土地和房屋。其他人则捐出个人物品,结束生意或腾空房屋。在第五街的一家商店里,栗子树的上方有一块标语牌,上面写着:“这家商店为了致敬王中之王而关闭,他将在10月20日左右出现。准备好,朋友们,给他加冕万王之王!”[74]

    主流米勒派非常平静地等待10月22日的到来,他们对末日神学所产生的狂热感到忧虑:

    随着日期的临近,受骗的人们放弃了所有事情,只给自己安排各种集会,在附近的私人住宅里日日夜夜地集会。他们几乎完全忽略了自己的世俗事务,有些人甚至让幼儿自己照顾自己,或者由那些不那么痴迷于集会的人来照顾。[75]

    预期的复临日对整个社会的影响大大超过了对信徒的影响,因为每一个坚定的米勒派肯定会面对几个不信仰的人,随着10月22日的临近,每当起风或天色变暗时,这些不信仰者就会想,他们是不是不应该下这个赌注。在纽约的伊萨卡,一名男子被“着火”的喊声惊醒,他经过调查发现,起火的源头是一个基督复临派的会议厅,他对于“米勒派圣殿着火了,而不是全世界着火了”表示宽慰。[76]

    这次事件之后,20世纪20年代初,一位名叫克拉拉·恩迪科特·西尔斯的接受私人家庭教育的美国北方贵族,对米勒运动感兴趣,并通过在报纸上发布广告来征求这一事件的第一手资料。她收集了大约160个故事,将其编入一本名为《幻想的日子》(Days of Delusion)的书中,这本书极大地加深了现代人对米勒运动的疯狂的印象,尽管历史学家已经得出结论,其中的许多故事(如果不是大多数的话)通过父母、祖父母、阿姨和叔叔80年的滤化,可能已经被渲染,或者显然是不真实的。

    尽管如此,西尔斯收集的故事中仍有几个主题始终如一:许多米勒信徒在山顶上等待,还有少数信徒在墓地等待。许多故事也确实像是真实的:西尔斯的一位上了年纪的联系人,在1844年时还是一个小女孩,她记得曾向一位邻居女孩求助,这位女孩的父母都是米勒信徒,她想请这位女孩帮忙做饭。这位女孩的父母告诉她,女孩正在为被提做准备,她问:“若这没有发生,她能在一周后过来吗?”她后来回忆说:“尽管我很小,但我永远不会忘记她脸上的恐惧表情,以及她那双蓝色大眼睛里充满的泪水。”

    西尔斯的另一个故事来自一个热心的米勒信徒,他讲述了唯一神教派的牧师西奥多·帕克和诗人拉尔夫·沃尔多·爱默生的对话。爱默生说:“世界末日不会影响我;没有它,我可以继续生活。”帕克回应说:“这与我无关,因为我住在波士顿。”[77]

    西尔斯的书中最令人难忘的一个故事,描述了米勒信徒们穿着白色“升天长袍”等待升天的情景,以及他们从树上跳起后掉下来摔断脖子和四肢,有时还使用了自制翅膀的情景。这些情节虽然看似可信,但很可能是复临派反对者宣传的结果。

    批评家们还指责米勒主义导致精神病院住满了精神病患者,但这也可能是虚构的:宗教思想经常会带一点儿精神分裂症特征,它是一种常见的紊乱症,但新英格兰地区的精神病院记录本上,只在少数情况下提到了米勒主义。[78]此外,一位米勒信徒将自己所有的世俗财产都送给了别人,他的亲人很合理地试图把他关起来。1843年,一个叫普尔的信徒,为了支付从波士顿到西部说服别人皈依和传播圣经的旅费而花掉了自己的财产,他的一个兄弟把他骗到家中并试图将他送进精神病院,但他被他的复临派旅伴救了出来。[79]

    10月22日是个硬目标,10月的失望比春天的失望更强烈地打击了信仰者。他们的集体绝望压倒了一切。据米勒所说:“似乎所有的恶魔都从无底深渊中释放在我们身上。”[80]据该运动的一位长老路易斯·鲍特尔观察:

    10月22日过去了,那些忠实和渴望的信徒感到难以言表的悲伤;那些不信仰的人和恶人却在欢喜。一切都依旧。复临前兆没有了;以前的集会没有了。每个人都感到孤独,几乎不想和任何人说话。大家像是在寒冷的世界里!上帝不会来的!任何语言都无法表达出一个真正的复临派信徒的失望之情。只有那些经历过的人才能加入这个话题。这是一件丢脸的事,我们都有同感。除了询问“我们在哪里”和“下一步怎么办”以外,大家都在沉默。[81]

    救赎失败受到了广泛的鄙视。许多复临派教徒都是废奴主义者威廉·劳埃德·加里森的追随者,而加里森却说他们患有“一种可悲的大脑幻想,现在已经清楚地证明是这样的”,这格外令人感到刺痛。(加里森另有企图,他认为米勒运动抢走了废奴运动的人员和资源。)[82]

    信徒们受到了大大小小的侮辱,从小男孩们嘲讽“你还没有上升吗?”到对海姆斯的严重欺诈指控(波士顿的一家报纸建议他避免在街上露面)。

    在这些指控中,海姆斯是无辜的。他主动提出,如果有人有任何关于他欺诈的证据,那么他将提供4倍的还款(但没有找到任何证据);他找到了一些证人,这些人撤回了之前对他渎职的错误陈述;他还让银行证明他的私人财产很少。[83]随后,海姆斯积极组织对那些在复临中疏忽个人和经济事务的人进行经济救济。“大失望”[84]的直接后果是,暴徒洗劫并烧毁了会堂,闯入集会并挥舞枪支挑衅。1845年1月29日,米勒被罗汉普顿浸信会逐出了教会,这对米勒本人是一种极大的侮辱。

    与多萝西·马丁的追随者一样,复临派教徒对这种强烈的认知失调做出了各种各样的反应。斯诺与马丁女士以及她最忠实的追随者们一样,加倍努力,坚持认为末日即将到来。斯诺的顾问乔治·斯托尔斯则恰恰相反,他否认了自己之前的信仰。

    其他人有两种应对方式。第一种,最终成为最重要的一种,是“灵化”论,由来自纽约州北部的一位名叫海勒姆·埃德森的米勒派人士提出。埃德森声称基督在10月22日采取了行动,不过是以簿记模式,而不是以末日模式。他没有回到地球,而是进入了“至圣所”,正辛苦地将人类分为粗俗和善良两类。最终,他将完成名单设定,然后才回到地球做最后的判决。

    10月22日“大失望”的第二种应对认知失调的方式是“闭门”论。持这种观点的人认为耶稣还没有复临,但已经在10月22日那天,对那些没有看到光明的人关闭了极乐城之门,耶稣只会拯救选民,也就是他们。而且,作为选民,他们的“圆满”赋予他们各种性特权,从“淫乱的洗脚礼”到“圣洁的亲吻”,再到精神婚姻的最终肉体回报。[85]

    米勒,就像他经常做的那样,采取了一种微妙的、界限不清的方式,躲躲闪闪、支支吾吾,最后将责任归咎于现有历史数据不精确;末日肯定会到来,但由于计算的不精确性,它可能发生在长达数年之后。

    此时,他已经精疲力竭、病入膏肓。他徘徊了5年后最终死去。精力充沛、精明强干的约书亚·海姆斯试图将这场运动凝聚起来。10月22日的承诺对他来说只是一个务实事件,而不是神学信仰,因此他很快就改变了立场。他拒绝进一步做任何日期设定,并试图压制他所鄙视的“灵化”论和“闭门”论。这激怒了诸如斯诺那样的“闭门”人,斯诺谴责米勒和海姆斯将会因叛教而下地狱。[86]

    海姆斯不可避免地失败了;米勒派会众萎缩,报纸订阅量急剧下降,运动分裂得无法修复。斯诺的正统派很快就消失了;以海姆斯和米勒为代表的主流群体承认了他们的预测错误,但仍然相信即将发生的耶稣复临。海姆斯本人逐渐远离了这场运动,最终回归到童年时代的信仰——主教制度主义。

    和16世纪的再洗礼派一样,一小部分的“灵化”者幸存下来,并发展出一个和平的现代教派——基督复临安息日会。今天的基督复临安息日会是一个温和的现代主流团体,交际保守,鼓励素食主义,遵守严格的安息日禁令。该教派依然宣扬耶稣复临,但并不确定复临日期,这是可以理解的。[87]

    但幻想的复临派末日论余烬从未熄灭。“大失望”一个半世纪后,一个脱离复临安息日会的小教派,大卫·考雷什的大卫支教,引发了美国宗教史上最悲惨的事件。

    正如心理学家利昂·费斯汀格描述的那样,日期设定会产生一种内在的不稳定动态。预言越精确,就越有说服力;前几次的预言没有实现,由此产生的认知失调鼓励信徒们以更大的活力和精准度宣讲自己的信仰,从而吸引了更多的信徒;最后,一个大胆而精确的预言出现了,这个预言肯定会失败,然后动摇大多数追随者,只留下一小部分顽固的信徒。费斯汀格的研究解释了米勒事件,但他的描述不仅适用于宗教信仰,还适用于政治和文化信仰:

    尽管有一个限度,超过这个限度,信仰的失验将很难被承受,但很明显,引入相反的证据有助于增加信仰者的信念和热情。[88]

    主流基督教派再也不会犯错去进行日期设定了。正如宗教历史学家欧内斯特·桑登所说:

    米勒事件几乎摧毁了整整一代的美国前千禧年主义者……但把注意力集中于1843年时,米勒也引入了一个可能会摧毁这场运动的因素……米勒在1844年之前越成功,就意味着1844年之后的千禧年主义者传道越困难。美国人花了很长时间才忘记威廉·米勒。[89]

    但是,仍有一些人无法抗拒将《圣经》的模糊语言转化为精确预言的冲动。20世纪,米勒的神学继承人学会了对末日发生日期含糊其词,但事实证明他们依然过分地热衷于末日的发生;正如米勒及其追随者忍不住要从《圣经》中推出一个确定日期一样,他的现代追随者们总是尝试做一件事,即将当天的报纸头条事件外推到看似合理的末日叙事中,但不可避免地都失败了。正如多萝西·马丁的飞碟一样,每一次的认知失验都会产生更多的信仰归附和更离奇的叙事。

    令人担忧的是,这些叙事将对那些控制世界末日机器的人[90]产生巨大的影响。

    6 弹性货币政策的灾难

    泡沫与崩溃的四个前提

    人们在最快乐的时候,都是最轻信的;当人们刚刚赚了很多钱,当一些人真的在赚钱,当大多数人认为他们在赚钱,此时就是人们最快乐的时候,也是捏造谎言的最巧妙时机。人们在这样一小段时间里几乎会相信任何事情。 ——沃尔特·白芝浩[1]

    1929年初秋,温斯顿·丘吉尔在加拿大进行了一次悠闲的私人火车旅行。10月24日,黑色星期四,他抵达纽约,正值那个秋天第一次股市大暴跌,他在那里看到,“就在我房间的窗户下,一位绅士从15层纵身跳下,摔得粉身碎骨,引起一场严重混乱,消防队也赶来了”。第二天,丘吉尔被邀请进入纽约证券交易所的访客大厅,他在那里注意到:

    我以为我会看到混乱;但眼前的平静和有序出人意料。(证券经纪人)被最严格的规则约束,不能奔跑或提高说话的音量。于是,他们就在那里,来回走动,就像一段被扰乱的蚂蚁群的慢镜头影像一样,以旧价格的1/3和现值的1/2互相提供大量的证券。凑在一起较长时间后,他们发现没有人能买得起他们被迫卖出的股票。[2]

    此后不久,他乘船回家,没有意识到4年前他在财政上的一窍不通[3]与眼前发生的重大事件之间的联系。不过,这次股票崩盘事件确实影响了丘吉尔,摧毁了他的投机性投资组合,使他负债累累。他个人的不幸却给后世带来了一线希望:为了偿还债主,他开始依赖自己最可靠的饭票——他的笔。在接下来的10年里,他创作了一些优秀的书籍、许多文章,甚至还有一部剧本。

    将丘吉尔1929年之前的政治生涯形容为“起起落落”未免有些轻描淡写。作为第一次世界大战期间的海军大臣,他曾大力支持加利波利之战,之后的惨败导致数千人死亡,他也被降级。10年后,首相斯坦利·鲍德温没有意识到丘吉尔对财政一窍不通,任命他为财政大臣(相当于英国的财政部长)。(丘吉尔是这样描述他与财政部专家的互动的:“如果他们是士兵或将军,我就会理解他们在说什么了。但好像他们说的都是波斯语。”)[4]

    经济学家在讨论金融泡沫时,最常提到的名字是海曼·明斯基。20世纪50—80年代,明斯基在经济学界扮演了一个奇怪的角色——一个长头发的反传统主义者,他认为资本主义从根本上是不稳定的,他是一个现代的、更理智的卡尔·马克思。他比任何一个20世纪的观察家都更好地理解和描述了泡沫及其破灭的病理生理学,认为泡沫及其破灭需要具备两个必要条件:利率下降带来的信贷宽松,以及激动人心的新技术的出现。

    首先是利率。第一次世界大战前,英镑纸币可以以每盎司4.86美元的价格自由兑换成黄金主权硬币,纸币持有人相信有足够数量的黄金满足任何需求。由于英镑似乎坚挺,因此将英镑兑换为黄金的人相对较少;毕竟,持有一大块黄色金属有什么用呢?但是,当英国开动印刷机、用印钞的方式来支付战争费用时,不断增加的纸币数量侵蚀了人们对纸币的信心,持有者越来越希望将纸币兑换成黄金。

    战争结束后,由于英国的黄金数量几乎不足以支付纸币,英国不得不暂停兑换,以免贬值纸币的持有者耗尽国家的黄金储备。但是,1925年,丘吉尔按照旧价格恢复金本位制,这一举措是灾难性的。被高估的英镑使英国国内商品更加昂贵,从而减少了出口;此外,人为的高汇率也使外国商品更便宜,从而鼓励了进口;到1926年,英国的黄金储备下降了惊人的8000万英镑(占其总量的10%)。[5]

    自美国诞生以来,美国和英国的政府官员就建立了密切的私人友谊,而在这个关头,这种关系——世界上两位最重要的央行行长美联储主席本杰明·斯特朗和英格兰银行行长蒙塔古·诺曼之间的友谊,却被证明是特别不幸的。

    提高英镑价值和阻止黄金外流的最可靠方法是降低美国利率,这可以使以英镑计价的资产相对更具吸引力。1927年,斯特朗这样做了,从而帮助诺曼摆脱了困境,但这只是暂时的。当时的美国已经处于经济繁荣时期,在丘吉尔即将结束其北美之行、到达纽约之际,低利率引发了一股投机热。

    到了1929年,发达国家已经习惯了周期性的金融动荡。漫不经心的观察家和历史学家经常将这些繁荣和萧条称为疾病,而医学模式确实有助于了解该类事件中的患者和疾病,不管是个人事件还是社会事件。

    医生从三个基本视角来理解疾病:病理生理学视角,即疾病过程的生物化学和生理学基础;解剖学视角,即受影响的身体部位;症状和体征视角,即病人的感觉和医生看到的情况。

    我们可以用同样的方式理解泡沫和崩溃。例如,它们的病理生理学,涉及人类心理的反复无常和现代银行系统信贷供应的不稳定性。它们的解剖结构由“4P”组成,即发起人(promoters)、公众(public)、政客(politicians)和媒体(press)。最后,它们的症状和体征包括对几乎不劳而获的财富的迷恋——一种具有社会传染性的迷恋,发起人的傲慢,以及公众对他们的崇拜。[6]

    根据海曼·明斯基的理论,泡沫膨胀不仅需要1927年本杰明·斯特朗降低利率所产生的那种信贷宽松,还需要激动人心的新技术的出现。这样的技术进步出现在科学或工程领域,比如19世纪的铁路;或者出现在金融领域,比如17世纪和18世纪的合股公司。[7]新技术或金融产品可以是股票、房地产或者其他工具,投资者为它们的出现而激动,开始向它们投入资金。由于这些资产也可以成为贷款的抵押品,因此资产价格的上涨意味着投机者可以以资产作为抵押品,借更多的钱继续购买这些资产,这进一步抬高了价格,然后他们又能够借更多的钱——这是一个自我强化的“良性循环”,但只限于上升时期。因此,狂热、恐慌和崩溃从1600年左右开始成为西方生活中长期反复出现的一部分,这绝非偶然,因为那个时候首次出现“技术替代”和弹性纸币信贷。

    今天,技术替代可以采取多种形式。令人目眩的科技进步速度似乎是现代生活的一个永恒特征:仅仅在20年前,如果人们被告知世界范围内的个人视频通信将无处不在且几乎免费,那么人们会难以置信。就在20世纪40年代,即使是年富力强的人也经常受到霍乱、伤寒、细菌性肺炎和脑膜炎等常见细菌性疾病肆无忌惮的折磨,这与他们财富的多少和社会阶层的高低无关。但在发达国家,在青霉素等抗生素出现后,这些灾难极其罕见。

    相比之下,在1600年之前,缺乏技术是一个被接受的事实。在印刷机出现之前,许多技术进步都轻易地丢失了,因为手工抄写文档如此费力和昂贵,没有足够的副本流传下来。此外,低识字率意味着工匠们往往无法记录他们的技术,这些技术也随着工匠的消失而消失。例如,罗马人发明了混凝土,但混凝土的使用实际上随着帝国的灭亡而消失;直到1756年,约翰·斯梅顿才重新揭示了波特兰水泥的秘密。

    1450年左右,谷登堡发明了批量生产的可移动式印刷机,消除了技术进步的这一特殊障碍,但其他障碍仍然存在;1600年以前,西方的人均GDP几乎没有增长,东方也是直到很久之后才有增长。

    1620年,哲学家弗朗西斯·培根出版了他的《新工具》[8]一书。在培根之前,科学家被称为“自然哲学家”,他们通过亚里士多德的“演绎”法,从公理出发发展自己的模型,所有进一步的推理是以不可置疑的公理为基础的。在这一体系中,可观察到的事实几乎是事后补充上的。

    《新工具》本身就是一种技术替代,它有双重作用。首先,它认识到旧的亚里士多德式的演绎推理体系压制了人类进步;其次,它提出一个可行的替代方案——一个“归纳”过程,即仔细收集经验性数据,然后将数据与理论相匹配——这才是现代科学方法的本质。接下来几代人的时间里,培根那些有才智的继承者,如胡克、博伊尔和牛顿(仅举几个例子)成立了伦敦皇家自然知识促进学会(现在简称为英国皇家学会)。这催生了整个欧洲的类似群体,科学发现开始惊人地加速。[9]

    17世纪不仅诞生了科学方法,还有第二次社会革命,即弹性货币的出现。大多数美国人误解了一个概念,以为货币就是由政府颁发的绿色纸张,一种“可以支付所有债务,包括公共债务和私人债务的法定货币”,或者,在过去是一种印有字样的金银小圆片。但是,在古代,几乎任何东西都可以是货币:一定标准的小麦、油,或者随着时间的推移,白银出现。一直到公元前7世纪中期,小亚细亚的吕底亚人才铸成第一枚琥珀金币,那是一种金银的混合币。

    今天,我们生活在一个完全不同的世界。在美国,只有1/10的货币是流通纸币和硬币;政府和银行计算机的按键输入创造了其余部分的货币。例如,银行发放抵押贷款时,不会采用运动包里装满印有亚历山大·汉密尔顿、本杰明·富兰克林和各种已故总统照片的绿色亚麻布[10]的形式;相反,它会向贷款公司发送一个电子包。这些支票或电子包肯定没有相应数量的纸币和硬币作为支持,更不用说金、银或牛作为支持了。

    这种信用体系在今天被称为“部分准备金银行体系”,由17世纪的金匠们创立,在之后的几个世纪里变得越来越有弹性。早期银行如果发行远高于2:1的存款准备金率的凭证,就有可能遭到储户挤兑,被要求归还资金。随着银行联盟和政府运营的中央银行的发展,商业银行的这一比率增长到约10:1,投资银行的这一比率可能会更高。存款准备金率上升的幅度取决于消费者和投资者想借多少钱,银行愿意贷多少钱,以及越来越多地取决于政府监管机构允许多少杠杆。[11]扩大准备金率的一个恰当的比喻就是橡皮筋:1913年美国国会立法规定,建立联邦储备银行就是要完成“提供弹性货币”的任务。[12]

    21世纪初的房地产市场是一个完美的海曼·明斯基范式案例。2000年之前,房地产市场相当平静、稳定和沉闷,银行只向最安全的借款人提供抵押贷款,即那些信用记录良好、收入稳定、几乎没有其他债务、所需贷款额远低于房屋市值的借款人。因此,这样的借款人几乎总是能按时还清抵押贷款,违约率很低,银行也获得了适中的利润。

    然而,银行经理们开始注意到,一些竞争性银行机构的贷款要求比较宽松,其可以为更多的借款人提供服务,从而赚更多的钱;最终,几乎所有银行都效仿了这一做法。大约在同一时间,另一种现象开始流行:银行向华尔街公司出售抵押物,这些公司将抵押物打造成越来越冒险的组合,如债务抵押债券。这就是所谓的贷款证券化,它将房主抵押贷款违约的风险从最初比较了解初始借款人情况的银行,转移到容易上当受骗的机构和世界各国政府,而这些机构和政府并不了解最初的借款人情况。

    贷款标准的降低蔓延到整个银行系统,违约率开始上升。起初,抵押品标的房屋的价值上升,银行和抵押贷款证券的持有人基本没有遭受过损失,因为他们可以将违约人的抵押物没收并转售获利。但从约2007年开始,不断增加的被迫出售的房源压低了房价,银行和证券持有人开始亏损;最终,有的破产,有的得到了联邦政府救助。最后,所有银行都收紧了贷款标准。银行贷款的收缩进一步降低了房价,迫使房主抵押贷款违约。

    这一过程不仅发生在美国,而且发生在全球。在房地产泡沫的前五年,大约在2002—2007年,似乎一个人只要活着,就有资格抵押贷款;而泡沫破灭后,银行恨不得数一下贷款申请人有几颗金牙,以确定贷款资格。类似地,消费者、投资者和潜在房主对偿还债务的兴趣比对获得贷款的兴趣大得多,因此信贷供应和货币供应量都下降了。

    明斯基于1996年去世。他告诉我们,上述周期是弹性货币体系的必然结果。在弹性货币体系中,不管是政府的中央银行(例如美联储)还是私人银行,都可以扩张和收缩货币供应。此外,他认为,这种货币扩张和收缩几乎发生在市场经济的所有领域,不仅发生在住房领域,也发生在企业管理以及股票和债券市场。

    明斯基著名的“金融不稳定假说”指出,当金融环境比较安全稳定时,资金必然将逐渐从安全的借款人处转移到风险越来越高的借款人处。最终事情将失去控制,导致上述那样的风险爆发,这使得放款人和投资者更加谨慎,循环重新开始,这一过程大概每十年发生一次。简言之,稳定带来不稳定,不稳定带来稳定,放款人的周期性恐惧和贪婪循环着经济系统。[13]当然,这还要有间歇性贪婪的借款人,否则贪婪的放款人将缺乏客户。

    虽然明斯基没有明确指出,但他的直觉告诉他,除了“技术替代”和信贷宽松之外,另外两个因素也必须满足:对以往繁荣和萧条的遗忘,以及对传统和审慎的投资方法的放弃。

    记忆缺失是金融不稳定假说的隐性因素。金融危机过后,损失惨痛的记忆依然历历在目,银行家和投资者都回避风险;前者只提供最安全的贷款,而后者不愿购买股票。随着市场慢慢复苏,不愉快的记忆逐渐消失,参与者又愿意面对风险,不稳定周期重新开始。

    引发金融狂热的最后一个因素,是放弃头脑冷静的金融计算,转而采用引人入胜的叙事。当人类面临困难或不可能完成的分析任务时——比如评估一家从未产生过利润更不用说股息的公司——他们默认回到更简单的分析方法,也就是心理学家用“启发式”一词所表示的心理捷径。

    当人类面对具有挑战性的或不可能解决的难题时,就会采取“启发式”方法。过去几十年中,心理学家把对这种方法的理解扩展到金融领域,尤其是金融狂热。20世纪40年代,密歇根大学的匈牙利心理学家乔治·卡托纳开始研究经济学和人类心理的交叉领域,开创了与经济(行为)相关的心理学测度。他不仅创立了现在正广泛使用的消费者情绪指数,还取得很多其他方面的成就,密歇根大学也成为心理学研究的温床。

    密歇根大学的另一个开拓性研究领域是决策理论。这引起了以色列研究员阿莫斯·特沃斯基的注意[14],特沃斯基特别聪明,认识他的人喜欢拿他的智力开玩笑:“你越快地意识到特沃斯基比你聪明,你就越聪明。”[15]密歇根大学的研究人员认为,人类是熟练的直觉统计专家——直至今天也有很多经济学家这样认为;就像我们毫不费力就可以掌握语法和句法规则一样,人类也很好地掌握了统计和概率。

    起初,特沃斯基也认为上述说法是合理的,但当他与来自耶路撒冷希伯来大学的院士丹尼尔·卡尼曼辩论时,他被对方说服。1970年前后,两人进行了一系列著名的实验,彻底改变了经济学家和心理学家看待决策的方式。他们证明,不仅普通人具有糟糕的统计直觉,甚至心理学家也是这样。[16]在一项经典研究中,他们这样介绍了他们的目标主体:

    史蒂夫非常害羞和内向,乐于助人,但对人或现实世界不感兴趣。他有一个温顺整洁的灵魂,要求秩序和结构,对细节感兴趣。

    然后,卡尼曼和特沃斯基询问受试者,史蒂夫最有可能是农民、推销员、飞行员、图书管理员还是医生?大多数人选择图书管理员,因为上面的描述最符合人们对图书管理员的刻板印象。然而,现实中农民的人数比图书管理员多20倍,而且有很多害羞的农民,因此史蒂夫更可能成为他们中的一员,而不是图书管理员。[17]

    他们还发现,人类存在广泛的系统性分析错误,有些甚至是由最聪明的人犯的,仅举几个例子:无视基础频率(例如,没有意识到农民比图书管理员多得多);没有意识到大样本比小样本更可靠;对人类从随机数据中感知不存在模式的倾向估计不足;没有理解在连续多次尝试时、任务结果通常都会趋向于一般水平。[18]实验结束时,他们对人类可悲的理性状态深感失望:

    也许令人惊讶的是,人们未能从一生的经验中推断出基本的统计规则,如趋向平均值的回归,或样本大小对抽样变异性的影响。尽管在普通生活里,每个人都会接触到许多可以归纳出这些规则的例子,但很少有人能自己发现抽样和回归的原理。[19]

    他们的实验揭示出人类天生的认知懒惰性。与其停下来严格分析史蒂夫最有可能从事五种职业中的哪一种,不如回到以下捷径:史蒂夫符合图书管理员的刻板形象——这就是故事的结尾。[20]

    很显然,卡尼曼和特沃斯基的发现与金融泡沫相关。1720年的南海公司、1928年的美国无线电公司、1999年的Pets.com[21]或今天的特斯拉,这些公司的投资者没有尝试对高预期未来收益的股票价值进行估计,因为这几乎无法估计,而是默认回到了简单的启发式方法:“南海/美国无线电/Pets.com/特斯拉是一家伟大的公司,它将改变世界,因此人们几乎值得为此支付任何价格。”

    卡尼曼、特沃斯基和其他研究人员还发现,最有力的启发法之一是人类对显著性事件的敏感性,即过分强调引人注目的事件。“9·11”袭击是一个极端例子,它是过去半个世纪中具有决定性意义的美国事件,造成近3000人死亡。“9·11”后,即使是只导致一人死亡的恐怖袭击也会成为头条新闻,但媒体基本上没有注意到普通枪支暴力、类鸦片或车祸导致的个人死亡事件,尽管在美国,这三类事件每年都导致3万多人丧生。[22]美国人死于恐怖袭击的概率远远小于死于雷击的概率,然而,美国在反恐问题上投入的资源远远多于防止因枪支、车祸和毒品造成的十几万人的死亡而投入的资源。(类似地,任何打算去以色列旅游的游客都可能会被朋友或家人问到是否担心恐怖主义,尽管自2005年以来,以色列人死于交通事故的平均概率是死于恐怖袭击的20倍。)[23]

    卡尼曼和特沃斯基将上述的显著性谬误称为“可用性启发式”;人们更有可能在地震或洪水发生后立即购买保险。很自然地,他们将之称为“近因启发式”。

    简言之,人类是显著性事件的俘虏,这以各种不同的形式适用于金融狂热。一项新技术能给人们带来激动人心的新鲜感,比如能够以每小时数百英里的速度环绕地球飞行,或者能够瞬间将娱乐活动或时事带入家庭,这种新鲜感非常显著——直到这种新鲜感消失。

    近因启发式扭曲了投资者对长期事实的看法:如果股票价格在过去几年一直上涨,他们就会认为它会永远上涨;随着股价攀升,股票变得更具吸引力,从而推动股价进一步上涨。这将成为一个自我持续的“良性循环”,可以将股价推向高位。当然,在长期熊市期间,情况正好相反。

    和大多数经济学家一样,明斯基对心理学不太感兴趣,但他清楚地认识到人类对叙事的偏好超过对定量推理的偏好。人们都喜欢好故事;当被泡沫控制时,当面临不愉快或难解的计算时,一个引人入胜的叙事可以轻松地绕过严格缜密的分析。把这些叙事看作导致泡沫疾病扩散至整个社会的病原体,并不算过度简单化。

    我们只需要稍微扩展一下上文中弹性货币的比喻,便很容易理解泡沫是如何破灭的。想象一根直径一英寸、长几百英尺的橡皮筋。橡皮筋周围聚集着数百名观察家,他们中的大多数人只是在闲逛。不过,他们中有几十人正在努力把橡皮筋拽长。继续想象,橡皮筋长度的不断增加给拽动的人带来了财富;随着时间的推移,这吸引了更多闲散的人群。他们中更天真的成员相信橡皮筋可以一直被拽长;但很多人知道它迟早会剧烈收缩,计划在第一次出现收缩迹象时就放手,并相信自己知道什么时候该放手;也就是说,他们已经准备好松开它。

    最终,一些人松手了,这增加了剩下的人的压力。然后,那些准备好放手的人也匆忙放手,很快,橡皮筋不仅恢复到它的自然长度,而且卷曲成一个紧密的线圈。最后,一些聪明的观察家发现,皱巴巴的线圈很容易被再次拉长,于是循环又开始了。

    到20世纪20年代,海曼·明斯基的4个条件都已经确立。

    第一次世界大战后,五项技术进步震撼了人类生活。19世纪末的内燃机是其中第一项发明,并促进了另外两项发明:莱特兄弟发明的飞机和汽车的普及。汽车的普及使人们可以随意长途旅行,到1925年,超过1/3的美国家庭拥有汽车。[24]

    第四项发明是无线电。1895年,古列尔莫·马可尼在意大利农村地区成功将莫尔斯电码字母“s”传输至几公里外。随后20年里,这项昂贵的新技术被私人保留,用于传输私人敏感信息和有价值的信息;在美国,无线电甚至主要用于一个领域——海上通信,因为事实证明,海上通信比在陆地上以及通过海底电缆在大陆之间通信更可靠、更便宜。

    1915年,马可尼电报公司的一名雇员戴维·萨诺夫写了著名的《广播音乐盒备忘录》,建议公司向公众开放广播媒介,“通过无线方式将音乐带入家庭”。萨诺夫做了一些努力才让马可尼将他颇有利润的私人媒介向公众开放。1919年,马可尼电报公司和通用电气公司合并成立美国无线电公司,到1920年,匹兹堡的KDKA和底特律的WWJ这两个最早的无线电台开始运营。音乐会、体育赛事和突发新闻有史以来第一次实现现场直播;毫无疑问,在改变日常生活方式上,无线电所起到的作用与电报和互联网的发明和传播并驾齐驱。

    将乔治·伯恩斯和格雷西·艾伦[25]的表演,或1921年杰克·邓普西和乔治·卡彭蒂耶之间的重量级拳王争霸赛的消息带进美国各个家庭的客厅,这比20世纪90年代初互联网的出现更让人震惊。美国无线电公司开始成为投资者的宠儿,到20世纪20年代末,当有人提到“无线电”这个词时,它最可能指的是股票的昵称,而不是媒介或硬件。

    第五项技术进步涉及电力公司的快速扩张,这些公司越来越多地为美国家庭提供照明,为工厂提供动力。尽管约翰·摩根和他的同事们在一代人之前就已经合并了通用电气公司[26],但通用及其竞争对手们用了几十年的时间才使国家完全通电。

    所有这五项“技术替代”——内燃机、飞机、汽车、无线电和广泛可用的电力——刺激了20世纪20年代经济的蓬勃发展。此外,亨利·福特的批量生产技术和弗雷德里克·温斯洛·泰勒的影响也是如此。泰勒是一位机械工程师,从19世纪末开始,领导了“效率运动”,将秒表转变为工人生产力和企业收益的驱动力[27]。1922—1927年,美国的工人产出以每年3.5%的速度增长,公司股东很高兴;但公司员工的反应不那么热情。[28]由于泰勒带来了很大的影响,“泰勒主义”进入了英语词汇;具有讽刺意味的是,它得到了列宁和斯大林的支持,但在美国并不总是得到称赞,特别是在迅速发展的工会运动中。

    20世纪20年代,美国出现了第二个明斯基因素——信贷宽松。明斯基知道,技术替代不仅可以是技术方面的,也可以是金融方面的。20世纪20年代产生了大量金融杠杆方面的“进步”,如经纪人贷款、投资信托和控股公司,它们都提供了新的、强大的资金来源。这些资金可以被借入,然后被配置到股市。在越来越多的美国人看来,这些资金更像是能喷出财富的源泉。正如经济学家约翰·肯尼斯·加尔布雷思所说:“金融界一遍又一遍地欢呼这一类似于车轮发明的伟大创新,但其版本往往不太经受得起考验。”[29]

    20世纪以前,股票市场杠杆的主要形式是以较少的初始认购金购买股票,之后以追缴金的方式完成剩余资金额的追加。贪婪的投机者认为,他们可以通过出售这些部分持有、正在升值的股票去支付之后的追缴金;少数幸运者做到了,但大多数没有做到,而且许多人破产了。

    相比之下,20世纪20年代的投机者则是全款购买股票,不过是用借入资金购买的,有时借入资金高达股票价值的90%。举个例子,投资于价值为1000美元的股票,需要用100美元的自有资金和900美元的“经纪人贷款”支付。如果这些股票的价值增加10%,现在值1100美元,那么偿还贷款后留给投机者的是200美元,从而使他原来的100美元投资翻了一番。但是,如果股票的价值下降10%至900美元,债权人就会向借款人发出“追加保证金通知”,要求借款人提交更多的资金来保护其900美元的贷款。如果资金不到位,那么贷款合同允许债权人出售头寸,以保护其900美元的贷款。经纪人贷款并不便宜;随着股票价格的上涨,对贷款的需求也随之增加,到1929年,贷款年利率已提高到15%,从而逐渐增加了股票购买者的负担。

    除了最乐观的投机者,其他人都至少隐约意识到了股票投机的风险。但对银行来说,经纪人贷款本身似乎是100%安全的,银行以5%的利率从美联储获得资金,并以该利率的两倍或三倍向投机者发放贷款,这是一种简单且利润丰厚的操作。金融资本的主要功能是将资金有效地从资金过剩的人手中转移到需要资金的人手中,泡沫会扭曲这种流动,从而腐蚀一个国家的经济;20世纪20年代,不少大公司将维持和发展业务所需的资金转移到保证金贷款市场,这正是一种扭曲。[30]

    我们从经纪人贷款的高利率,可以清楚地看出美联储要安全刺破已形成的泡沫有多难。即使在今天也很难。1929年,在理论上,美联储是可以阻止经纪人贷款流动的,只要把再贷款利率提高就可以;但由于银行和企业的贷款利率已经达到两位数,如果美联储将再贷款利率提高到几乎和贷款利率一样高,那么这在经济上将会是灾难性的。即使政府要求经纪人贷款提高利率,这也不会对热情的投机者产生太大影响,因为他们的净资产(至少在账面上)正在以更高的速度增长,在一个自我维持的循环里,昨天的价格上涨推动了明天继续上涨。美联储发现,自己就像从山上飞驰而下无法自控的滑板手,只有两种选择:故意撞到树上,或者继续深蹲向前,然后以更高的速度撞树。美联储选择了后者。(1929年10月的最初崩盘确实抑制了对经纪人贷款的需求,使经纪人贷款利率降至7%。)

    20世纪20年代,金融狂热也感染了当时已经稳定运行的投资信托机构。18世纪末,荷兰商人亚伯拉罕·范·凯特维奇创建了大概是世界上的首个共同基金——“团结创造力量”[31],它是一个可对公众发行的投资集合,汇集了欧洲各地和新大陆种植园的企业股份。[32]在接下来的一个世纪里,投资信托的概念传遍了整个欧洲,特别是苏格兰。到了1893年,随着波士顿个人财产信托的成立,投资信托的概念又传到了美国。这些保守运作的基金通常可以像股票那样交易,按需买进和卖出。在20世纪20年代创立的信托投资公司中,有几个至今仍存在:美国通用投资公司、三角洲公司、亚当斯快递公司和中央证券公司。

    另一个信托公司——高盛交易公司却没能幸存。高盛公司是直到泡沫后期才涉足投资信托业务的,1928年12月,它出资成立了高盛交易公司。最初,交易公司比较谨慎;它直接持有所有的股票和债券,也就是说,没有杠杆;此外,母公司高盛保留了该交易公司90%的股票所有权,只向公众出售了其中的10%。用今天的术语来说,高盛交易公司可以被认为是由先锋或富达[33]建立并持有几乎所有股票的简单的共同基金。

    高盛交易公司很快就不再保守。几个月后,它与高盛旗下的另一个公司——金融实业公司合并。市场如此泡沫化,1929年2月,就在合并后几天,新组建的高盛交易公司的价值就达到其持有证券价值的两倍;相当于将一美元的钞票以两美元的价格向公众出售。

    大多数公司都会对这样的结果感到高兴,但高盛公司还不满足,随后它回购了自己的股票,这进一步提升了其股票价值。此时,高盛公司开始以极度膨胀的价格向公众出售其持有的交易公司股票。接着,交易公司迅速投资成立了一个新的信托公司——谢南多厄公司;而谢南多厄公司在荒谬层上又堆起了一层荒谬,它发起成立了第三级信托公司——蓝山公司。正如加尔布雷思所说:

    该信托公司的优点在于,它使公司发行在外的证券数量与现有公司资产数量几乎完全分离。前者可以是后者的两倍、三倍或任意倍数。[34]

    在著名的高盛大厦内,谢南多厄和蓝山各自发行了普通股和“可转换优先股”,后者本质上与债券相同,每年需要向其持有者支付6%的利息。这两个信托公司事实上利用其可转换优先股为自己提供经纪人贷款,根据加尔布雷思的描述,这种“乘数”放大了普通股的价格波动。

    按照普通标准,杠杆作用并没有那么大:谢南多厄的股票中只有约1/3是债券式可转换优先股,这一比重在蓝山的股票中不到1/2。但这两个公司杠杆的乘数,以及高盛交易公司处于上层所有权结构的乘数,破坏了局势的稳定。谢南多厄控股蓝山,但只有在蓝山的可转换优先股持有人获得6%的利息支付后,谢南多厄才获得支付;同样,交易公司控股谢南多厄,但只有在谢南多厄的可转换优先股持有人获得利息支付后,交易公司才能获得支付。因此,当沿着金字塔向上方的交易公司移动时,价格波动幅度成倍增加。而同时,交易公司也承担着自己的股息债务。例如,谢南多厄只向其普通股股东支付了一小笔股息,到1929年12月便永久停止了支付。

    高盛公司的信托船队是为风平浪静的海洋设计的,只要价格上涨,航行就会顺利。但几乎就在这三个信托公司成立后不久,天就变了,这些公司按照与创建相反的顺序陆续倒闭:首先是蓝山,然后是谢南多厄,最后是交易公司。

    杠杆结构产生了毁灭性的影响。1929年底,道琼斯工业指数已经从10月的崩盘中有所回升,比9月的峰值“仅”下跌了35%。但相比之下,这三个信托公司的股票下跌了75%左右。到1932年中期的市场低点,道琼斯工业指数下跌了89%,信托指数下跌了99%,仅在高盛的这三个信托公司中,公众承担的总损失就约为3亿美元。就在1929年8月和9月,美国各大公司发行了价值超过10亿美元的类似的投资信托基金,这在那个时代是一个惊人的数字,其中大部分基金到1932年已经蒸发。[35]此时大萧条已经开始,并将持续,直到第二次世界大战。第二次世界大战作为一个巨大的公共工程项目,推动了经济活力的恢复。[36]

    到1929年,第三个因素——对上一次泡沫的健忘——也已牢固确立。上一代人确实经历了两次市场下跌。第一次是1907年的恐慌,是一次相当奇怪的事件。它的触发事件其实是一次失败的股票投机,但其规模非常小。两兄弟、铜矿巨头奥托·海因策和奥古斯塔斯·海因策,试图操作一桩复杂的计谋,即尝试对他们的联合铜业公司的股票进行轧空操作,但彻底失败了。[37]

    奥古斯塔斯·海因策还拥有蒙大拿州的一家小银行——比尤特储蓄银行,该银行也随着失败的轧空操作而破产。1837年,安德鲁·杰克逊总统对第二合众国银行实施了“安乐死”[38],使得美国在私人贷款枯竭时没有“最后贷款人”来提供急需的资本。由于各大银行之间相互借贷,其中一个银行的失败会像多米诺骨牌一样蔓延;如果没有央行出面救助,那么温和的衰退可能会演变成全面的恐慌和萧条。19世纪30年代末就发生了这样的金融危机,那是美国历史上最严重的金融危机之一。

    1907年,海因策的银行的倒闭拖垮了规模更大的银行,并最终将股价压低了约40%,直到约翰·摩根“画出一条线”——在这条线之上的银行是他认为有偿付能力的银行,因此值得支持,在这条线之下的是允许倒闭的银行,此时,恐慌才停止。出于历史巧合,摩根生于1837年,也就是美国最后一个中央银行关闭的那一年;1913年,随着重建中央银行的《联邦储备法》通过,摩根去世。在世76年的大部分时间里,他都扮演了美国央行行长的角色。1893年经济萧条耗尽美国财政部黄金储备时,正是他策划挽救了美国的金本位制。

    1929年之前的第二次市场衰退发生在第一次世界大战结束时。这场战争提振了美国股市,但随着农产品价格的下跌,股市投机很快被绝望替代:1919年夏天,股票市场达到顶峰,之后的一年里,股票价格逐渐下降了约1/3,当然这一时期产生的丰厚股息可以抵销一部分的价格下跌损失。[39]因此市场的下跌相对温和。

    在第一次世界大战之前的美国,只有富人才拥有股票,因此1907年恐慌和1919年股价下跌都没有给公众留下太多持久的印象。到1929年,新的投资者被内燃机、飞机、汽车、无线电和电力带来的奇迹吸引,忘记了之前的泡沫。

    产生泡沫的第四个因素是对保守的传统股票估值方法的放弃。美国在第一次世界大战中所需要的资金,部分来源于数十亿美元的自由债券发行,收益率为3.5%~4.5%。在这一过程中,普通的美国人被引入证券市场。自由债券充当了公众投资的“训练轮”,并提供了安全而适度的回报率。

    政府债券可以被视为安全资产的基准,或者说,政府债券的收益率是金融经济学家所谓的“无风险利率”。几个世纪以来,投资者购买股票完全是为了股息,而由于股票有风险,为了吸引买家,股息收益率必须高于相对安全的政府证券的收益率。例如,乔治·哈德森必须向其铁路股票的买家承诺,股息收益率远远高于英国政府债券3%~4%的收益率。与英国同行一样,理性的美国投资者不要求也不期望从股价上涨中获益,但他们希望获得比安全的政府债券更高的平淡但稳定的股息流;第一次世界大战前,美国的平均股票收益率在5%左右。[40]到了20世纪20年代,人们普遍认为,股票应该以年收益的10倍左右卖出,以便轻松地收回成本。

    今天,不管是不是明智的投资者,都认为公司利润和股价的长期上涨是理所当然的,因此可以容忍低得多的股息支付。但在20世纪之前,很少有持续的股价上涨,除非是最成功的公司。即使在最顺利的情况下,股价涨幅也很小。例如,英格兰银行和东印度公司是英国早期最成功的两家合股公司,即使是这两家精心挑选的公司,1709—1823年,其股价平均每年也仅上涨0.7%和0.6%。[41]

    那么,那些最有成就的投资者是如何评价美国无线电公司的?到1929年金融危机时,美国无线电公司还没有产生任何股息,而且,它在1937年之前都没有产生股息。[42]到20世纪20年代末,投资者显然认为该公司前景光明,但他们没有工具为它估计一个合适的价格,以支付该公司未来的预期利润。再过10年,欧文·费雪、约翰·伯尔·威廉姆斯和本杰明·格雷厄姆等金融经济学家就会推导出计算股票或债券内在价值的复杂数学方法,特别是那些具有高度投机前景的股票或债券的内在价值的计算方法。这种估计未来所有股息价值并将其“贴现”到即期的技术,就是所谓的“股利贴现模型”。这种模型即使到今天也很难被普通投资者理解,此外,其准确性也非常有限,甚至连专业人士也经常抵制它。[43]

    20世纪20年代,随着无线电、汽车和飞机的发展,技术环境的不断完善,公众很容易相信旧的证券评估规则不再适用。正如20世纪伟大的投资者约翰·邓普顿所说:“英语中最昂贵的一句话是‘这次不一样’。”[44]

    本杰明·格雷厄姆在记述那段时间时说:
    按照股市繁荣前的标准,股票的销售价格是其平均年收益的10倍;而现在,如果公用事业公司的一只股票的销售价格达到其最高年纪录收益的35倍,那么大家不会认为该价格太高,而会认为仅仅是估值标准提高了……因此,所有的价格上限都消失了,股票的价格不是取决于它能够卖出的价格,而是取决于它值得卖出的价格……这个原则将得出一个诱人的推论:在股票市场中赚钱是现在世界上最容易的事情。[45]

    到了1929年,卡尼曼和特沃斯基的各种启发式,特别是那个时代新技术的显著性、证券价格的飙升以及信贷的宽松,已经压倒了对证券价格的理性分析。

    经济学家马克斯·温克勒说得最简单。股市崩盘后,在提到最新的股利贴现模型时,他敏锐地观察到,20世纪20年代的股市不仅贴现了远期,也贴现了未来。[46]

    7 致富空想的破灭

    1929年大萧条

    和密西西比公司、南海公司和英国铁路泡沫等事件一样,对1929年美国股票崩盘事件的剖析也涉及“4P”:发起人、公众、政客和媒体。

    20世纪早期,塞缪尔·英萨尔继承了约翰·劳和乔治·哈德森的衣钵,创建了一个工业巨人企业,为美国的大型工厂提供动力,为数百万家庭提供照明。

    他出生于1859年的伦敦,父亲是一名中产阶级平教徒传教士和禁酒旅馆店主。英萨尔十几岁时主要忙于文员和速记员的工作,和那个时代许多雄心勃勃的年轻人一样,他崇拜托马斯·爱迪生。在失去一家伦敦拍卖行的工作后,他看到爱迪生旗下的一家英国电话公司的招聘广告,非常高兴,并成功地应聘到那里。

    他的上司很快就发现,英萨尔的办公技能远远超过了速记和簿记。几年后,公司选中英萨尔去美国总部工作,他回应说:“如果能成为爱迪生本人的秘书,我就去。”为了看起来比实际的21岁成熟,他开始留鬓角。1881年初,他横渡大西洋到了爱迪生身边,在那里工作了11年,并在公司的各个职位上一路晋升。

    越来越多地,英萨尔的命运不仅与爱迪生捆绑,还与支持爱迪生的约翰·摩根捆绑。那时,正值摩根在社会影响力和对技术的敏锐性方面达到了个人顶峰,作为一名早期电力爱好者,他在麦迪逊大道219号的家里安装了爱迪生的第一个白炽灯泡。在当时没有电网的情况下,这是一项不小的成就。后来摩根资助建设了曼哈顿第一座大型发电厂和输电线路,弥补了没有电网这一缺陷。

    对爱迪生来说很不幸的是,由于低压直流系统不适合长途传输,爱迪生通用电气公司的市场份额逐渐被汤姆森-休斯敦电气公司占据(其建造了交流高压电网)。汤姆森-休斯敦电气公司由电气工程师伊莱休·汤姆森和埃德温·休斯敦于1882年创建,是爱迪生通用电气公司的竞争对手。从1883年开始,爱迪生通用电气公司逐渐走向终结,因为当时英国发布了一项变压器专利,该变压器能够“降低”住宅用长距离交流输电线路中的高压电流。美国西屋电气公司很快采用了这项专利,并在公司里部署了汤姆森-休斯敦公司的交流电系统。

    1892年,在摩根投资公司的推动下,爱迪生通用电气公司与汤姆森-休斯敦电气公司合并,这巧妙地避免了爱迪生的公司的倒闭。但爱迪生本人从未承认过交流电的优越性;他一气之下卖掉了他在通用电气的股票,后来,当有人提醒他这些股票会值很多钱时,他说:“好吧,都卖没了,但我们花钱时很开心。”[1]

    英萨尔是经营电力设施的天才。在公司被合并前的10年里,他逐渐帮助爱迪生吞并了竞争对手,并取得芝加哥地区的垄断地位。[2]但1892年公司合并之后,他不再经营芝加哥公司,也开始无所事事。第二年,他自己接管了爱迪生在芝加哥孤立的各项业务,在那里,他熟练地收购、管理小型公用事业公司,并将其合并为大型公司。到了1905年,他将业务扩展到芝加哥以外的中西部地区;他游刃有余地经营自己的公司,而且那时是为了公众的利益。不断扩大的规模经济使他能够逐步降低行业价格,并引入非高峰低定价策略。由于电力服务对社会日益重要,他支持政府的法定监管,甚至有一次他还建议,如果他的公司无法为客户提供适当的服务,那么这个工作应该由政府来做。[3]

    如果他将自己的目标仅专注于为工业和城市照明提供电力,那么他仍将被人们铭记。遗憾的是,他对用电客户审慎而正直的关心并没有延伸到公司股东身上。英萨尔早期金融阴谋的典型例子是1912年中西部公用事业公司的上市,其主要目的不是发电,而是为其他业务筹集资金。英萨尔复杂金融阴谋的核心是他以个人身份以360万美元的价格购买了中西部公用事业公司所有的优先股和普通股,然后,转身以360万美元的价格向公众出售了所有优先股和1/6的普通股,这样实际上他自己免费获得了公司5/6的普通股。

    和哈德森一样,英萨尔也热心于公益,工作起来像特洛伊人。也和哈德森一样,他慷慨地资助市政项目和艺术项目,包括芝加哥的市民歌剧院,其被当地人称为“英萨尔的王座”。他在芝加哥北部的利伯蒂维尔建造了一个占地4445英亩[4]的庄园,居民们“在英萨尔的庄园里建房子,将出生在英萨尔医院的孩子们送到英萨尔学校上学,使用英萨尔灯,用英萨尔煤气烹饪,在英萨尔公路上行驶,在英萨尔银行存钱,在英萨尔高尔夫球场上打高尔夫”[5]。该镇代表了他庞大帝国的缩影。在鼎盛时期,该帝国由很多公司组成,这些公司的发电厂雇用了72000名工人,为1000万个客户服务。他是65家公司的董事会主席或成员,并担任11家公司的董事长。[6]

    早在1898年,英萨尔就凭直觉认为,在公用事业领域,国家机构的监管比城市运营的竞争更为可取。到第一次世界大战时,公用事业公司完全在政府监管之下,主要归功于英萨尔本人对该行业的引领。[7]政府监管限制了公司的利润,但就像之前的哈德森一样,英萨尔明白,最大的财富不在于提供商品和服务,而在于为商品和服务提供资金。

    英萨尔控股公司的复杂性超出了大多数观察者的理解能力,甚至可能超过了英萨尔本人的理解能力。他将数百家公司层层叠加,底层公司有时又部分地控股顶层公司。历史学家兼记者弗雷德里克·刘易斯·艾伦的一小段描述可以展现英萨尔的鲁布·戈德堡机械[8]般的复杂结构:

    缅因州的小安德罗斯科金电力公司由安德罗斯科金公司控制;而安德罗斯科金公司由缅因州中部电力公司控制;缅因州中部电力公司由新英格兰公共服务公司控制;新英格兰公共服务公司又由国家电力公司控制,国家电力公司又由中西部公用事业公司控制。[9]

    当时,代表公司所有权和控制权的中西部公用事业公司普通股,由英萨尔的私人公司公用事业投资公司持有,因此共7个层级的公司。于是,杠杆作用呈多倍增加,不仅仅是撇奶油[10],用艾伦的话来说,还有来自多个组织层级的“超级富豪奶油”和“超超级富豪奶油”。[11]到1928年,英萨尔的这种拜占庭式的公司结构几乎已经不是个例,而是规则。当年,在纽约证券交易所上市的573家公司中,92家为纯控股公司,395家为控股和经营性公司,只有86家为纯经营性公司。[12]

    为了以虚高的价格向公众出售公司股票,必须创造盈利的幻觉。英萨尔有一套与布朗特和哈德森相当的金融骗术,其中最著名的就是让他的公司以不断上涨的价格相互购买资产,然后将每笔购买业务的利润都入账。就好像丈夫以1500美元的价格将之前1000美元入手的雪佛兰汽车卖给妻子,而妻子则以同样的方式将她的福特汽车卖给丈夫,这样每人都获得了500美元的收益。

    与之前的布朗特和哈德森,以及之后的互联网巨头一样,英萨尔受到公众和媒体的崇拜。20世纪20年代,他威严的照片两次登上《时代》杂志封面;与他在大陆银行前见一面据说价值100万美元。[13]英萨尔的销售员们推动了这场杠杆式闹剧最后一幕的出现。1929年初,经过专门训练的销售队伍开始首次向公众出售其顶层公司英萨尔的公用事业投资公司的股票,最初的售价是英萨尔为其资产支付的价格的10倍,后来随着人们对该公司的热情高涨,其售价超过了30倍。英萨尔的公司结构就像高盛信托一样,是为繁荣时期设计的。任何经济波动都会削弱电力公司支付债券利息和优先股(对公司收入享有优先权)分红的能力,而这又将严重影响其普通股的股息和价格。普通股股东通常以保证金形式认购股票,他们的净资产也将受到影响。这一过程随着英萨尔控股公司的金字塔结构逐层加速。

    这正是1929年以后发生在英萨尔和他的60万股东中的大部分人身上的故事。与哈德森一样,英萨尔始终对自己的计划坚信不疑,公司股价在漫长而艰难的1929—1932年熊市中缓慢跌落直至崩溃。他借了数百万美元,试图用他的多层公司结构来抬高公司股价,但徒劳无功。1932年4月,就在股市最终触底前的3个月,他的银行家们把他召集到纽约的一家办事处并告诉他,他们将不再支持他。“这意味着公司要进入破产管理吗?”他问道。“是的,英萨尔先生,恐怕是这样。”[14]这对投资大众产生了巨大的损害;一份会计报告估计,到1946年,一场围绕中西部证券公司破产的持久法律争论终于结束时,公众损失数额会达到6.38亿美元。[15]而到那一年,股票市场已基本恢复;因此1932年股市崩盘时,在接近市场最低点的时候,公众遭受的损失肯定达到了数十亿美元。

    英萨尔最后的经历和他的控股公司一样错综复杂,与哈德森的垮台过程遥相呼应。在破产数月后,他因与出售公用事业公司股票有关的邮件欺诈而被起诉,逃往法国,当政府试图将他带回受审时,他又逃往希腊,因为希腊与美国的引渡条约已经商定但尚未签字生效。但雅典当局忽略了这一瑕疵,无论如何还是把他经由土耳其送回了美国。[16]回到美国,他再次出现在《时代》杂志封面上,这一次帽子遮住了他的脸。他被剥夺了大部分财富,但仍然可以组织起强有力的法律辩护团队,对他的多项指控最终被击败了。回到法国时,已是78岁高龄的他痛苦而虚弱,瘦得不成样子。1938年7月16日,在巴黎的一个地铁站,当他把手伸向售票员时,突然心脏病发作而死去,口袋里只有几个法郎。由于他心脏不好,他的妻子曾一再警告他不要乘坐地铁。[17]

    在巨大的债务规模中,英萨尔的控股公司的债务只占相对较小的一块。正如密西西比、南海和铁路事件那样,20世纪20年代末的美国股票狂热以一种极端的乐观情绪感染了民众和商界,导致其过度借贷。[18]1922—1929年,美国的全国总债务增长了68%,但全国总资产仅增长20%,收入仅增长29%。[19]在崩盘之前,债务的增长速度可能一直快于经济的其他方面。私人债务增长尤其迅速;与政府不同的是,个人和公司不能通过征税或印钞来消除债务,而且由于个人和公司是20世纪20年代债务的主要引擎,因此,当事件爆发时,其债务承担带来的负面影响也尤其大。

    20世纪20年代泡沫事件的另一个主要发起人是股票池,它通常是一个由经纪人和金融家组成的特设小组,他们按照精心设计的顺序相互买卖股票,操纵特定公司的股价,旨在引起小投资者的注意。他们聚集在券商大厅的股票报价器和黑板前,得出某只股票已“被控制”的结论,也跟随买入,进一步推高价格。

    股票池的关键人物是股票交易所的场内“专家”:他是在交易所场内为公众买卖股票的经纪人,保存着一本珍贵的客户买卖“订单簿”,这能够预测未来的股票走向。当订单簿上的公开购买订单列表足够庞大时,股票池的参与者就会将自己的股票出售给那些由股价暴涨引来的投资者,并获得数百万美元的利润。

    最臭名昭著的股票池集中在无线电领域,例如众所周知的美国无线电公司,其参与者似乎是美国政界和商界的名人:杜邦和通用汽车公司的财务主管约翰·J.拉斯科布,美国钢铁公司的最高领导者查尔斯·施瓦布,沃尔特·克莱斯勒,佩尔西梅·洛克菲勒,伍德罗·威尔逊总统的前助手约瑟夫·塔马尔蒂。内线交易在20世纪20年代并不违法。对现代读者来说,另一个名字很突出:戴维·萨诺夫夫人,美国无线电公司总裁的妻子。

    然而,有史以来最伟大的股票池经理应该是约瑟夫·P.肯尼迪[20]。经常有一些传说,将肯尼迪家族的财富与私酒交易联系在一起。不过,没有可靠证据支持这一点,而且无论如何,非法制造烈酒对一个哈佛经济学毕业生来说并不是一个理性的职业选择。他的血统更适合华尔街。在那里,他通过传奇般的股票池操作积累了一笔财富,后来又将这笔财富扩展到好莱坞和房地产等领域。

    正如19世纪40年代乔治·哈德森在铁路领域的庞氏骗局式融资——用新股东的资本支付旧股东的股息——在那时是可以接受的,也是合法的,20世纪20年代的股票池行为也是如此,在1933年和1934年的相关证券法[21]通过之前,这种公然操纵股价的行为没有被禁止。

    金融狂热的第三个和第四个解剖位置是政客和媒体,这两个部分巧妙地集中在约翰·J.拉斯科布身上。拉斯科布的父亲是一个雪茄制造商(经营规模中等),于1898年去世。之后的拉斯科布与英萨尔一样好运,成为工业巨头皮埃尔·S.杜邦的私人秘书,并最终成为这家大型化工公司的财务主管。1920年,杜邦拯救陷入困境的通用汽车,拉斯科布接管了通用汽车的财务。20世纪20年代后期,拉斯科布成为股票爱好者,参与了一些最成功的股票池。[22]1928年,民主党任命他为全国委员会主席。

    然而,拉斯科布最让人印象深刻的是一次臭名昭著的采访,采访文章名为《人人都应该富有》,并发表在《女性家庭杂志》1929年8月刊,当时该杂志的订户已超过200万。其中最臭名昭著的一段话正解释了文章标题的主旨:

    假设一个男人23岁结婚,并开始每月定期储蓄15美元——几乎任何一个有工作的人都可以做到,只要他足够努力。如果他投资于优质普通股,并将股息和股权进行再投资,那么20年后他将至少有8万美元,以及每月约400美元的投资收入,这样他会很富有。任何人都能做到这一点,所以我坚信任何人不仅可以富有,而且应该富有。[23]

    拉斯科布的这段话,是泡沫时代媒体对不费吹灰之力的财富的经典赞歌,巧妙地说明了即使是两大著名公司的首席财务官也会采取启发式捷径。如今,我们只要借助资产负债表或财务计算器,并且具备一定的能力就能计算出,20年里将每月15美元的储蓄转化为8万美元需要25%的年平均回报率;但1929年,这一计算更加困难。虽然拉斯科布可能拿出了他的铅笔、纸和复利表,但事实上他没有提到25%这一隐含的长期投资回报率(这一数字即使在1929年也高得离谱),很可能他只是凭空说出了这些数字。

    像拉斯科布这样的政客,在泡沫及其破灭中扮演着双重角色。首先,和其他人一样,他们也陶醉于追求不费吹灰之力的财富,就像1719—1720年的乔治一世国王和奥尔良公爵以及铁路泡沫时期的大部分议会成员一样。之后的几十年,现代政治廉洁和立法遏制了这种腐败,至少在发达的西方国家是如此,这让政治领导人有了更为神圣的责任,即要保证经济基本健康发展:在经济扩张时期,没有过度投机,而在经济收缩时期,国家领导人能够平稳地避免任何担忧或恐慌。

    20世纪20年代时也是如此。在1928年共和党大会上,赫伯特·胡佛在提名演讲中庄严地吟诵道:“今天,我们美国比以往任何时候都更接近于最终战胜贫困。贫困家庭正在从我们中间消失。”[24]经济崩溃后,胡佛和他的财政部长安德鲁·梅隆一再向公众保证经济“基本上是健康的”。胡佛还开创了一种在面临经济危机时的反应,其将成为现代世界各国领导人的标准反应,被约翰·肯尼斯·加尔布雷思称为“无事由会议”:在这种会议上,国家的政治、金融、经济领袖都被召入白宫,“不是因为有事要做,而是因为有必要给人留下正在做事的印象”[25]

    有可能实时发现泡沫吗?

    现代金融的伟大进步之一,是芝加哥大学的尤金·法玛提出的有效市场假说。20世纪60年代,尤金·法玛认识到,金融市场能够快速将新信息——市场变故——转化为价格。但市场变故是无法被预测到的,因为我们也不可能预测到未来的价格方向。

    而且,有效市场假说认为,当前市场价格能够准确反映现有信息,因此狂热不应该出现。正如法玛尖锐地指出:“坦率地说,‘泡沫’这个词让我发疯。”[26]

    有效市场假说的支持者对泡沫的厌恶是可以理解的;现代金融学的核心是构建和测试市场行为模型。艾萨克·牛顿所谓的“我能计算天体的运动,但不能计算人类的疯狂”很容易被理解,但它揭示了一个更深层次的事实:牛顿是有史以来世界上最伟大的数学建模者之一,如果连他都不能用数学术语来描述泡沫,那么也许没有人能做到。

    耶鲁大学的罗伯特·席勒与法玛共同获得了2013年诺贝尔经济学奖。席勒认为,当上涨的价格能够实现自我维持时,泡沫就会出现,用他的话说就是,“当价格也被狂热传染的时候”[27]。尽管所有泡沫都是如此,但仅凭这一现象无法识别泡沫,因为投资者一直在到处追逐当前高回报的资产。然而,像1719—1720年、19世纪40年代和20世纪20年代那样的大规模泡沫是罕见的,因此仅仅靠每天自我维持的价格上涨这一判断标准,会产生很高的误报率。

    最高法院大法官波特·斯图尔特在审理雅各贝利斯诉俄亥俄州案[28]时遇到了同样的难题。虽然它所涉及的领域不是金融业,但他的方法提供了考虑泡沫的另外一种方式:

    根据宪法第一和第十四修正案,这一领域的刑法犯罪仅限于“硬核色情物品”。今天,我将不再试图用寥寥几笔就对我所理解的这类物品做进一步的界定,也许我永远无法成功地做到这一点。但是,当我看到它的时候,我就知道是它。[29]

    正如牛顿无法模拟人类的疯狂一样,也如法玛教授讨厌“泡沫”这个词一样,斯图尔特大法官这段著名的话表明,尽管他无法从语言学角度描述什么是硬核色情物品,但他知道它是什么样子的。这同样适用于金融业:即使我们不能对泡沫进行建模,但现在我们肯定已经知道它们是什么样子了。

    到目前为止,密西西比公司、南海公司、英国铁路和20世纪20年代的美国股票市场都呈现出4个极具特色的特征。第一个特征是,金融投机成为日常对话和社会互动的主要话题,从坎康普瓦大街和交易巷的人群,到20世纪20年代美国券商大厅的人群。据弗雷德里克·刘易斯·艾伦回忆,在20世纪20年代:

    一夜之间发财的故事挂在每个人嘴边。一位金融评论员报告说,他的医生发现病人在谈论股票市场时不关心其他任何事情,他的理发师不止一次地用热毛巾打断客户对蒙哥马利·沃德股票前景的描述。妻子们问她们的丈夫为什么这么慢,为什么他们不参与这一切,结果她们的丈夫在当天早上已经买了100股美国亚麻籽公司的股票。[30]

    泡沫的第二个特征是,相当一部分通常情况下能力强、头脑清醒的人,现在却放弃了安全、高薪的职业,全职从事金融投机。例如,如果没有当时的金融刺激,那么布朗特和哈德森都会继续成为相对成功的亚麻布经销商。艾伦描述过一位女演员,她把自己在公园大道的住所装修成一家小型经纪公司,“周围摆满了表格、图表和财务报告,越来越多地通过电话进行市场操作,而且越来越沉迷于此”,而另一位艺术家“曾经口若悬河地说,只有高更[31]才会一边画画,一边宣扬国家贝拉斯·赫斯(一家现已不复存在的邮购商行)的股票价值”[32]

    泡沫的第三个也是最持久的特征是,信徒对怀疑论者的猛烈抨击。20世纪20年代末,如果说有人能够以血统和历史感来表达怀疑并警告公众的话,这个人就是保罗·莫里茨·沃伯格。沃伯格于1868年出生于一个德国犹太家庭,其家族具有中世纪威尼斯的银行背景。在1911年入籍美国之前,他在欧洲金融机构中迅速崛起;1914年,他作为创始成员宣誓就职美国联邦储备委员会。

    沃伯格在移民之前曾经见过类似的欧洲泡沫,他知道泡沫的结局。1929年3月,在担任国际承兑银行行长期间,他注意到,股票价格已经完全脱离了合理范围内的估值,并惊恐地指出,贷款数量的激增已经导致“无限制的投机狂欢”,这最终不仅会损害投机者,而且“还会导致整个国家的经济萧条”。[33]

    这一惊人准确的预测却遭到了公众的强烈谴责。最温和的方式是批评他“过时”;还有愤怒的观察家指责他“粗暴抨击美国的繁荣”,这些语句几乎与两代人之后抨击互联网泡沫怀疑论者的语句一模一样。[34]

    著名投资顾问罗杰·巴布森也有同样的遭遇。他在10年前创办了巴布森学院,1929年9月5日,在该学院举办的一次人数众多的商业会议上,他发表演讲:“迟早会有一场崩盘,而且它可能会很可怕。”与沃伯格一样,他预测会有一场严重的萧条。正是在那天,市场急剧下跌,即所谓的“巴布森崩盘”。沃伯格很容易受到本土主义和反犹太主义的攻击,而巴布森则更容易成为被攻击的目标,因为他之前已经证明了自己是个怪人:他的作品中有一份名为《重力——我们的头号敌人》的宣言,他还成立了重力研究所,其主要目的是发明一种保护盾来抵御重力的致命力量。

    如果是在正常时期,那么巴布森的预言顶多会受到温和的质疑。但当时并不是正常时期。报纸讽刺地称他为“韦尔斯利[35]的圣人”,并指出他先前预言的不准确之处。一家投资公司警告其客户,“我们不能因为某位著名统计学家对市场的不利预测而仓促抛售股票”[36]

    明斯基的健忘症因素通常揭示了泡沫时期的代沟现象;只有年龄足以回忆起上一次繁荣和萧条的参与者才可能持怀疑态度。而他们更年轻、更热情的伙伴会嘲笑他们是守旧派,与经济和金融市场的新现实脱节。简言之,泡沫主要集中在记忆短暂的年轻人领域。

    无论是由于何种机制,这些激烈反应都可以理解为弗里茨·海德理论中的平衡和不平衡状态。正如末日信徒的期望那样,没有什么信仰能比不劳而获和无限财富的承诺更令人愉快,信徒也不会轻易放弃这样一个令人安慰的概念。对忠实的信徒来说,阻力最小的方法就是给怀疑论者贴上“不理解”的标签,从而达到平衡状态。

    泡沫的第四个也是最后一个特征是极端预测内容的出现,比如南海事件中预测西班牙奇迹般地将其新大陆贸易的垄断权转让给英国、投资100英镑可以获得数百英镑的年度分红,英国铁路事件中预测即将“主宰时空”,美国股票泡沫中拉斯科布隐含预测的25%的市场年回报率。

    1929年,耶鲁大学的欧文·费雪做出了结束所有预言的预言。也许费雪是那个时代最伟大的金融经济学家,他发展了许多现代数理金融学的理论基础,至今仍受到尊敬。但是,人们更记得他于1929年10月15日在曼哈顿采购代理协会说的话,那是在黑色星期四的9天前:“股票价格已经达到了一个看似永久的高峰状态。”[37][38]

    没有“阳光查理”米切尔的故事,1929年的崩盘历史就不完整。英萨尔和哈德森至少为子孙后代提供了重要的基础设施,这些遗产减轻了他们的罪恶。但是,查理·米切尔,这个时代的伟大的金融发起人——和掠夺者——无法得到任何救赎。

    和英萨尔一样,米切尔出身卑微。1907年,他成为总部位于纽约的美国信托公司的总裁奥克利·索恩的助手。米切尔就职时正赶上当年的大恐慌,美国信托公司正处于这场风暴的中心,索恩领导这家公司化解了银行挤兑危机。30岁的米切尔作为助手,在整个危机期间投入了大量的时间,经常晚上不回家,睡在老板办公室的地板上。1911—1916年,他开始经营自己的证券经纪公司,随后被纽约城市银行(花旗银行的前身)聘请,为其管理小型股票和债券销售部门——纽约城市公司。

    商业银行家履行3项近乎神圣的职能,其对任何资本主义社会都至关重要:保护他人的货币;向企业提供营运资本,否则经济将无法运转;创造货币。相比之下,投资银行家却向公众出售股票和债券,这是一种风险更大、在道德层面更模棱两可的行为。

    银行监管机构早就明白它们之间的区别。事实上,监管机构禁止商业银行拥有投资银行。但不能拥有也并不意味着无法控制。通过控制的方式,米切尔和他的银行的律师们设法构建了与纽约城市公司的关系。[39]简言之,查理·米切尔是一名伪装成女王的军官的海盗,在纽约城市银行旗下航行。纽约城市公司收取了大量费用,成为一家投资银行,其主要职能是向公众出售新发行的股票和债券,进而为公司创造资本。不幸的是,该公司出售的许多股票和债券都是不可靠的,这些证券出售给了那些毫无戒心的纽约城市银行的客户,这加剧了银行的渎职行为。之后,纽约城市公司和银行承销了外国政府发行的更加不可靠的债券。

    米切尔在1916年接管纽约城市公司时,该公司在银行总部只占用了一间办公室,只有4名员工。发起人不仅需要公众和客户,还需要媒体。繁荣时期的媒体能带来一大群轻信的新兵。20世纪20年代,杂志专栏作家布鲁斯·巴顿是典型的媒体骗子,他的父亲是一位传教士,曾将耶稣描述为“A-1推销员”。1923年,他写了一篇关于米切尔的吹捧文章,题为《这里有什么其他人做不到的吗?》。在一次采访中,米切尔向巴顿讲述,当他的年轻推销员遇到萧条期时,他会带推销员到银行家俱乐部的顶层去看看下面的人群。“下面有600万人,他们的收入有成千上万美元。他们正在等待有人告诉他们如何使用自己的储蓄。你应该好好看看,吃一顿丰盛的午餐,然后去那里告诉他们。”[40]

    米切尔的魅力和干劲、媒体的热情以及20世纪20年代股市的狂热,这些因素都推动了纽约城市公司不断扩大其经营规模;到1929年,该公司雇用了1400名销售和支持人员,他们分散在58个分支机构中,所有这些人员都通过11000英里的私人电话线与纽约总部相连(因此现代社会将提供全方位服务的证券经纪公司蔑称为“电线屋”)。面对指责,米切尔发出了几乎不间断的规劝:“我们希望能够完全做到,除了童工之外,我们所有的销售人员都是正式员工。”该公司实现了这一抱负,并且实现了更多目标,在20世纪20年代每年承销了超过15亿美元的股票和债券,比任何其他投资银行都多。[41]

    该银行向轻信的客户大力推销纽约城市公司的投资银行“专长”。这些客户得到的建议是,购买具有诱人优惠券的债券,以及价格不断上涨的更诱人的股票,以取代传统的低收益但安全的储蓄。

    米切尔可能不是证券经纪行业销售大赛的最早发起人,但他将此细化为一门艺术,向获胜的“员工”提供高达25000美元的奖金(“员工”这个术语并不讨人喜欢,但仍然很自然地用在金融业中)。米切尔的公司非常成功,其卖光了所有的债券。通常情况下,公司和外国政府会争取由投资银行发行其债券,但纽约城市公司通过主动鼓励公司发行更多债券,扭转了这种局面。更为离奇的是,米切尔将销售人员分散到不稳定的巴尔干和南美洲国家,为那些贫困的政府提供廉价资本。

    尽管销售人员汇报了秘鲁和巴西的米纳斯吉拉斯州等外国政府的无能和数据造假,而且其几乎肯定会违约,但米切尔和纽约城市公司仍继续向银行的轻信客户出售这些外国债券。

    1921年,他从纽约城市公司总裁升任银行总裁,这为他的销售大业扫清了最后一道障碍。文学评论家埃德蒙·威尔逊最好地捕捉到了米切尔的精神,他描述了米切尔派出的推销员,他们“敲开农村各户房屋的门,像那些推销吸尘器或刷子的人一样”;20世纪20年代早期和中期,纽约城市公司主要销售债券;慢慢地,随着市场牛市势头增强,该公司将销售重点从债券转向股票,不仅销售负债的亚纳康达铜业等公司的高风险股票,甚至销售银行自己发行的股票,而如果没有该公司与银行合法分离的遮羞布,那么这样的股票本来就是非法的。[42]

    1958年,威尔逊描述了米切尔:

    在10年的时间里,他向美国公众出售了价值超过150亿美元的证券。他向公众出售汽车公司的股票,这些股票现在打了水漂;他向公众出售濒临破产的南美洲共和国的债券;他向公众出售自己银行的股票。1929年10月后,这些股票的价格在3周内从572美元下跌到220美元,最近它们只值20美元。[43]

    在这次股票崩盘事件中,米切尔让他的客户财富归零。公众对这一事件的印象集中在10月戏剧性的“黑色日子”上。24日,黑色星期四,摩根大通领导的财团上演了戏剧性的救援,到这天中午,恐慌基本消除。但到了黑色星期一和黑色星期二,即28日和29日,曾在24日拯救了股市的财阀们——米切尔、摩根大通的托马斯·拉蒙特和大通国民银行的阿尔伯特·威金——已经耗尽了勇气和资金。连续两天,股市分别下跌13.5%和11.7%。[44]

    到10月29日收盘时,股票价格已从9月的峰值下跌了39.6%:可以肯定的是,价格下跌幅度比1973—1974年、2000—2002年和2007—2009年的价格下跌幅度还要大。此外,到1930年4月中旬,股票市场又挽回了2/5以上的损失。[45]

    在1907年的金融危机期间,只有少数美国人拥有股票,即使到了1929年,也只有10%的美国人拥有股票,因此,1929年的最初下跌对普通民众的直接经济影响相对较小。[46]但在接下来的几年中,腐败蔓延到了商业活动的心脏——银行系统,经济陷入混乱。到1932年中,股票价格从1929年的峰值水平暴跌了近90%。1931年12月11日,距离1932年中最终触底还有6个月(见图7-1)。一位小投资者本杰明·罗思在日记中写到了投资者的贫困:

    图7-1 1925—1935年的道琼斯工业股票平均价格指数

    一位非常保守的年轻已婚男子告诉我,在过去的10年里,他成功偿还了房子的抵押贷款。几周前,他又将房子进行了抵押,获得的5000美元贷款用于投资优质股票,且他打算长期投资。我认为两三年后,他将获得可观的利润。人们普遍认为,现在可以以非常有吸引力的价格购买优质股票和债券。困难在于人们手头没有资金。[47]

    没有资金的公众是愤怒的公众,就像在1720年和1848年那样,公众想要证明自己的成功。金融幽默作家弗雷德·施韦德用最简洁的语言描述:“赔光钱的客户当然更愿意相信自己是被抢了,而不愿意承认自己是在傻瓜的建议下做了傻瓜。”[48]截至1929年,银行拥有23万名客户;目前尚不清楚具体有多少客户开立了纽约城市公司的证券经纪账户,但估计至少有数万人,而且可能会更多。[49]与其他证券经纪人的客户(自愿走进门购买证券)不同,米切尔的客户原本打算找一家安全的商业银行存钱,结果却像是跌跌撞撞地走进了一家妓院。

    一个最不可能的人物命中注定地成为查理·米切尔的复仇天使:一位直言不讳的意大利裔美国律师,名叫费迪南·佩科拉,他的父亲是一名制鞋厂工人,因工伤致残,他的受教育时间也因此被缩短。19世纪90年代末,十几岁的佩科拉从大学辍学,以供养父母和兄弟姐妹,但他设法攻读了法律学位。随后的很长一段时间里,他担任纽约市的地方检察官助理,并成功起诉了许多起金融案件。

    崩盘和随后的熊市促使美国参议院的银行货币委员会展开了对证券业的调查。委员会从1932年开始举行听证会,审问了米切尔和其他许多人。前两名律师的审问毫无效果,于是委员会解雇了他们。

    佩科拉在审问工作中的出色表现引起了班布里奇·科尔比的注意。班布里奇·科尔比是一位杰出的律师,曾在伍德罗·威尔逊时期担任国务卿,他向即将离任的共和党委员会主席彼得·诺贝克推荐了年轻的佩科拉。那时,诺贝克正在拼命寻找人来替代他之前解雇的律师。[50]

    佩科拉从1933年1月24日开始担任首席律师;他必须全力以赴,因为一开始就远远落后于形势。就在他被聘用3周后,他第一次与英萨尔信托公司的人打交道,没占到优势。因此,1933年2月21日,当身材高大、颇有气场、皮肤黝黑、极度自信的米切尔大步走进委员会会议室时,这位新任首席律师看上去不可能是他的对手。

    但佩科拉很快就找到了自信,主导了听证会并彻底摧毁了起诉目标,历史上将这场诉讼称为“佩科拉听证会”。正如我们见过的,巨额财富的拥有者将受到极大的奉承,这反过来腐蚀了他们的自我意识,当涉及犯罪行为时,这是一个致命缺陷。此外,犯罪企业通常会给其员工洗脑,使员工们认为自己的行为是正常的,甚至是值得赞扬的。

    同样的事情也经常发生在金融公司的欺诈行为上。在这些公司里,员工们学着用“符合客户最佳利益”这一借口来合理化自己的行为。有魅力和成功的企业领导者尤其会这样培训员工;正如老话所说,鱼从头开始向下腐烂。打击犯罪的行家佩科拉很快就认识到,米切尔正是这种典型的企业精英,纽约城市公司的作案手法在法律上或道德上没有任何问题,因此,起诉他的最有效方法,是让他解释他是如何领导他的销售人员的。在8天的证词中,佩科拉以礼貌、低调的方式,有条不紊地引导着傲慢的米切尔穿过了纽约城市公司销售机构的道德沼泽,并彻底摧毁了米切尔。

    米切尔需要支付多少钱才能说服他的销售人员将股票和债券出售给客户?米切尔回答说,不多,每年只有大约25000美元——此时一个美国工人的年均收入只有800美元。纽约城市公司如何支付其高管薪酬?根据出售证券的利润,而不是根据这些证券给客户带来的收益。这一体系支付给米切尔多少钱?每年超过100万美元——即使是对于那个时代的最高级的管理者,这也是一个闻所未闻的工资水平。

    更糟糕的是,1929年,米切尔以低于成本的价格将纽约城市公司的股票卖给了自己的妻子,然后立即又从她那里买回,没有缴纳个人所得税;他还对纽约城市银行的股票进行了典型的股票池操纵;向高级管理人员发放奢侈的可免除“贷款”,但粗暴地对待普通员工,强制性地要求普通员工购买银行的股票,以远高于市场的价格抵销员工的未来工资。当他的普通员工最终付清高价购买的股票时,他便解雇了他们。[51]

    当骇人听闻的工资和贷款、逃税把戏和员工受虐充斥着头条新闻时,最初自信的米切尔慢慢意识到自己已经陷入很大的麻烦中。然而,佩科拉的目标更高:他想揭露鼓动客户用借来的钱购买大量风险证券的销售人员(不仅仅是纽约城市公司的销售人员)扭曲的动机,这是让成千上万辛勤工作的美国人破产的原因。他在听证会的第4天开始做这项任务,并展示了该公司如何在有充分的机会接触普通银行存款人名单的情况下,按照销售指导书的措辞,“无情地”向公众出售股票和债券。[52]

    听证会的第六天,即2月28日,佩科拉再次转换关注点,关注对个人投资者造成的损害。在听证会之前,委员会已经收到数百封纽约城市公司的破产客户的来信。他们的共同点是谨慎和节俭,购买了政府债券,生活终于可以较为舒适,然后被纽约城市公司的销售人员说服,反复购买高风险股票和债券,最后陷入贫困。

    佩科拉挑选了其中最让人同情的一位,即来自宾夕法尼亚州波茨维尔的埃德加·布朗。布朗最近卖掉了一家连锁剧院,出于健康原因想搬到加利福尼亚州,他想寻找一家全国性的金融机构,以获得财务和后勤方面的建议和支持。在一家全国性的杂志上,他看到了这则广告:

    您在考虑一次长途旅行吗?如果答案是肯定的,那么我们将支付您与我们机构联系的费用,因为您将不再需要当地银行家的建议,而是将与我们密切联系,我们将指导您的投资。[53]

    关键是,该广告是由纽约城市银行发布的,但是纽约城市公司的弗雷德·拉梅尔联系了布朗,要帮助他投资10万美元。布朗积蓄中的大部分是卖剧院所得,其中的1/4已经购买了债券,主要是美国政府债券。布朗对拉梅尔只提出了一个要求:避开股票。

    在布朗的准许下,拉梅尔为他购买了各种国内外债券,远远超过了布朗10万美元的储蓄,因此布朗又从包括纽约城市银行在内的多家银行贷款,总计18万美元。当他的债券投资组合甚至在市场崩盘之前就暴跌了的时候,布朗抱怨道:

    布朗:然后(拉梅尔)说“好吧,那是你坚持只买债券的错。你为什么不让我卖给你一些股票?”。嗯,股票市场一直在上涨。于是我完全相信了,说“好,那买股票”。

    佩科拉:你告诉他买什么股票了吗?

    布朗:从来没有。

    佩科拉:那他为你买股票了吗?

    布朗:我可以开玩笑地回答一下吗——他买股票了吗?

    听证会的书记员尽职地记录了一句话:“长时间的大笑”。[54]

    布朗随后向听证会出示了一份大量购入股票的记录,佩科拉为了减轻书记员的负担,并没有让其记录。布朗讲述了他如何前往纽约城市公司总部,抱怨拉梅尔的账户交易过于激进,以至于尽管股市不断上涨,但他的投资组合的价值一直在下降。他被告知,公司将调查此事,他将得到答复。

    布朗确实收到了拉梅尔的回信,但他建议布朗购买更多的股票,包括纽约城市银行的股票;到1929年10月4日,他的投资组合的价值进一步下降。布朗前往纽约城市公司的洛杉矶办事处,要求出售自己的所有仓位[55],但接下来,“他们好似把我看作一个想把自己的母亲赶出家门的人,我立刻被那里所有的销售员包围,他们让我知道出售仓位是非常非常愚蠢的”。

    该公司终于在10月29日黑色星期二卖出了布朗的股票,当时布朗的保证金已经用完,他一无所有。此外,该公司以最虚假的方式——远低于市场的价格购买了布朗的证券。

    布朗,两年前的身价为10万美元(约可折合为今天的150万美元),现在成了贫民。令人惊讶的是,布朗此时想再贷款25000美元以进一步投机亚纳康达铜业公司的股票,而银行拒绝了,理由是布朗失业又破产。[56]

    1929年以前,那些成功的商界人士几乎具有被膜拜的地位,成为国家利益的最终仲裁者;但1933年后的一段时间里,佩科拉听证会将华尔街列为头号公敌,还将“银匪”[57]一词引入了美语词汇中。这个词在两代人之后的2007—2009年全球金融危机中又死灰复燃。

    听证会于3月2日结束,也就是富兰克林·罗斯福就职典礼的前两天。现代经济史学家认为罗斯福的竞选口号是银行大规模倒闭的重要原因,特别是他威胁要让美元相对黄金贬值的言论,而他最终也实施了这一政策。[58]公众渴望报复,听证会后的两个月内,米切尔因涉嫌欺诈而受审。与布朗特和哈德森一样,米切尔可能没有做任何违犯证券法的事情,那时的法律比较宽松,因此所有的指控都不成立,他被无罪释放。当然他必须与政府解决补税问题。在接下来的20年里,他甚至重新获得了一些财富以及体面的社会地位;他最后的住所在第五大道,现已成为法国领事馆。

    正如两个世纪前南海股票崩溃后发生的那样,相关法律的修改姗姗来迟。在听证会之后的15个月内,罗斯福签署了一整套受佩科拉委员会启发的证券立法的文件,包括严格区分投资银行和商业银行的《格拉斯-斯蒂格尔法案》;1933年和1934年的相关证券法,分别规范证券的发行和交易;1940年的《投资公司法》,主要监管金融顾问和投资信托(当今共同基金的前身)。

    美国证券交易委员会是根据1934年的《证券交易法》设立其规定的机构。金融界最大的讽刺之一是,美国证券交易委员会的第一任专员正是曾经股票池的完美操纵者约瑟夫·P.肯尼迪。当有人向罗斯福指出肯尼迪不适合担任此职位时,罗斯福调侃道:“只有小偷才能抓住小偷。”[59]

    弗雷德·施韦德以其特有的幽默,从当代视角对此次崩盘事件进行了解释:

    1929年,有一列火车的奢华车厢,每周早上都会到达宾夕法尼亚车站。当火车停下来时,一直在打桥牌、读报纸、攀比财富的百万富翁们从车厢前端走了出来。靠近车厢门的地方放着一个银碗,里面有很多硬币。那些需要5美分换乘市区地铁的人会拿走一枚。他们不需要用任何东西来交换硬币;这根本不算钱,就像羽毛牙签一样免费提供。只是5美分而已。

    1929年10月的突然崩盘有很多解释。我更喜欢的解释是耶和华之眼,愤怒的上帝正好在10月碰到了那个碗,在可以理解的突然恼怒中,耶和华踢翻了美国的金融结构,结果就是碗里的硬币永远消失了。[60]

    阿尔伯特·爱因斯坦有一句名言,复利是宇宙中最强大的力量(实际上这句话并不是爱因斯坦说的)。事实并非如此。健忘才是宇宙中最强大的力量。佩科拉听证会后短短两年,弗雷德里克·刘易斯·艾伦就预见性地观察到了这一点:

    圣乔治攻击巨龙,受到热烈的赞扬[61];但总有一天,圣乔治死了,观众散去,圣乔治的继任者发现龙是一个非常有说服力的家伙,开始怀疑为什么会有屠龙这样的事情发生,时代是否改变了,以及是否有必要让龙受到最温和的约束。[62]

    随着佩科拉委员会逐渐淡出人们的记忆,圣乔治不仅失去了警惕,还躺在路边流血不止,无法保护一群几乎忘记了拉斯科布、英萨尔和米切尔的公众,新的发起者又将诞生。

  • Torsten Dennin《From Tulips to Bitcoins_ A History of Fortunes Made and Lost in Commodity Markets》31-42

    31 Wheat: Working in Memphis 2008

    The price of wheat speeds from record to record. Trader Evan Dooley bets on the wrong direction, juggling 1 billion USD and dropping the ball. This results in a loss of 140 million USD for his employer, MF Global, in February 2008.

    “I simply do not know where the money is.” —Jon Corzine, CEO of MF Global

    Less than a month after Jérôme Kerviel’s catastrophic bet on European equity indices, which resulted in losses of nearly 5 billion USD to French investment bank Société Générale, another trader caused difficulties for his employer.
    This time it was through speculation on wheat futures. At the end of February 2008, MF Global, one of the world’s largest futures and options brokers, had to admit that one of its traders in Memphis, Tennessee, had speculated on wheat futures with corporate accounts. Within hours, a loss of about 140 million USD occurred.

    Spun out of Man Financial Group in 2007, MF Global was a commodity brokerage house that offered clearing and execution services. It had ambitions to become a financial services firm on the order of a Goldman Sachs or JPMorgan, and its CEO was Jon Corzine, former chairman of Goldman Sachs and onetime governor of New Jersey. Although it was a niche player on Wall Street, MF Global was a force on the Chicago Mercantile Exchange (CME), with 3 million futures and options positions open with a face value of more than 100 billion USD. Its customers made up almost 30 percent of the trading volume on the CME.

    Trading Wheat

    After corn, wheat is the second-biggest agricultural crop in the world, and it is traded worldwide on commodity futures exchanges. On the Chicago Board of Trade (CBOT), wheat is traded under the symbol W and the current contract month (e.g., W Z0 for wheat December 2020). One contract refers to 5,000 bushels of wheat, and each bushel is equivalent to 27.2 kilograms.
    Priced at 7.50 USD per bushel in November 2007, US wheat was already trading above 8 USD by the beginning of 2008. In part this was due to a tightening supply, but the increase was also increasingly driven by speculative capital, along with a weak US currency. The price broke through 9 and 10 USD per bushel within days, and at the end of February the situation had really gotten out of hand. On February 27, wheat contracts close to delivery experienced price movements of as much as 25 percent within a day. Although trading opened positive, by noon the price had fallen to 10.80 USD.

    Trader Evan Dooley speculated on falling
    prices of 2 million tons of wheat.

    In the afternoon, however, the price jumped again, to 13.50 USD per bushel. The news that Kazakhstan, one of the largest exporters of wheat, wanted to introduce export taxes to reduce sales was boosting the US wheat price. It was the strongest intraday price movement in wheat ever observed.
    However, there was also another explanation for the price swings: Evan Dooley, who had been a trader at MF Global since November 2005, had quickly entered significant positions in wheat futures on his own account in the morning hours of February 27. With these unauthorized actions, the 40-year-old trader exceeded his limits by far.
    Betting on a falling wheat price, Dooley is said to have traded around 15,000 futures—2 million metric tons of wheat. The value of the position varied between 800 million and 1 billion USD. However, as the wheat price continued to rise sharply, the company was forced to close the position with losses, that is, to buy further futures contracts. This led to a further price jump to a level that the market would not reach again, despite continuing strength, for several years.

    Figure 28. Wheat prices in US cents/bushel, 2007–2008, Chicago Board of Trade. Data: Bloomberg, 2019.

    MF Global shares lost more than 25 percent in value on that day. The losses came to approximately 140 million USD and represented four times the previous quarter. Concerned about the extent of the loss, MF Global promised to revise its internal policies and risk management. Dooley was fired immediately, and MF Global was fined 10 million USD for lack of supervision of its traders. Dooley himself was sentenced to five years in federal prison and had to make restitution of 140 million USD.
    On a side note, MF Global collapsed in 2011 when the company reported a 192 million USD quarterly loss. Client funds disappeared in the aftermath, which became a huge scandal. However, the failure of MF Global, with more than 40 billion USD in assets—the eighth-biggest bankruptcy in US history—was modest compared with the chaotic 2008 failure of Lehman Brothers, which had a 691 billion USD balance sheet. Regulators were eager to show that not all Wall Street firms were too big to fail. They happily let MF Global go under.

    Key Takeaways
    •Less than a month after Jérôme Kerviel’s catastrophic bet on European equity indices in 2008, another trader caused trouble for his employer: Evan Dooley of MF Global speculated on falling wheat prices and built up a short position of almost 1 billion USD.
    •Wheat prices kept climbing higher and higher, however, from 7.50 USD per bushel in late 2007 to more than 10 USD per bushel in January 2008.
    •On February 27, 2008, the price of wheat traded in Chicago fluctuated in the course of the day by 25 percent—falling back to 10.80 USD per bushel, then jumping again to 13.50 USD in the afternoon. MF Global accumulated a loss of about 140 million USD within hours.

    32 Crude Oil: Contango in Texas 2009

    The price of West Texas Intermediate (WTI) crude oil collapses, unsettling commodity traders around the world. A 10,000-person community in Oklahoma becomes the center of world attention. The concept of “super-contango” is born, and investment banks enter the tanker business.

    “Super-Contango is a state in which a forward price of a commodity is higher than the spot price to a greater extent than can be explained by the interest and storage costs that explain the usual state of contango.” Moneyterms.co.uk

    Cushing is a small town in Oklahoma with fewer than 10,000 residents: There’s a Wal-Mart, some fast-food restaurants, and a few gas stations. Only massive tanks, pipes, and refineries hint that the town is somehow special. In the south of the city is a complex for the strategic oil reserves of the United States, with a capacity of 35 million barrels—one of the largest in the country.
    Suddenly, at the beginning of 2009, Cushing—the only delivery location for West Texas Intermediate (WTI), the US benchmark for crude oil—became the focus of the world’s attention. In the oil market, big-time inventory building had begun. And it began on a large scale.

    Trading in Crude

    Because of the many different types and qualities of crude oil, market participants have agreed to trade in a few local varieties for reference: At the New York Mercantile Exchange (NYMEX), this is US West Texas Intermediate (WTI) oil, at the Intercontinental Exchange (ICE) in London it’s North Sea Brent, and in Singapore the Asian reference is Tapis. Additionally, there is an OPEC basket price, which calculates the average price of seven different types of crude: Sahara Blend (Algeria), Minas (Indonesia), Bonny Light (Nigeria), Arab Light (Saudi Arabia), Dubai (United Arab Emirates), Tia Juana Light (Venezuela), and Isthmus (Mexico). On commodity futures markets, WTI and Brent are the primary references for the price of oil, which is traded in 1,000 barrels per contract under the abbreviations CL (WTI) and CO (Brent) as well as the corresponding contract months (e.g., Z9 for December 2019).
    In the wake of the financial market crisis and the deteriorating economic outlook, the price of crude oil had come under massive pressure in the second half of 2008. That summer, crude oil had briefly traded at more than 145 USD for a short time. But then, the price dropped to less than 45 USD. The withdrawal of investment capital (“deleveraging”) also contributed significantly to the price decline. This became obvious through an analysis of the short-term crude oil contracts in which financial investors are typically invested, and which were now much more affected than long-term contracts.

    Figure 29. Crude Oil (WTI) Term Structure in USD/barrel, 2008. Data: Bloomberg, 2019.

    The forward term structure, which tracks the price of future crude oil deliveries over a period of several years, was still nearly flat in summer 2008, but from there, the contango structure of crude oil (WTI) increased. Contango refers to the situation in which spot prices are below the level of futures prices. This could be due to warehousing costs, including insurance and interest, for example, although those can be superseded by the effects of supply and demand.
    Between October and December 2008, the contango became extreme. The price decline at the short end of WTI contracts led to a record price difference (the spread)—in excess of 20 USD—between contracts for WTI January 2009 and WTI December 2009. Commodity traders introduced the term “super-contango” to describe what was happening, and commodity analysts called the price distortion of crude oil “absurd.” WTI decoupled completely from other crude oil reference prices such as Brent and, as a barometer for international crude oil markets, was “as useful as a chocolate oven glove,” noted a commodity analyst of Barclays, the British investment bank. What led to this situation? And, more importantly, what were the implications?

    Super-contango! Front-end WTI traded as low as 35 USD, while later crude contracts with later dates stayed above 50 USD.

    The world’s attention turned to Cushing, the world’s “pipeline crossroads” and the only source of WTI crude oil. Contango favors stockpiling, because instead of a low current price, oil can be sold for more at a later date. The only obstacle is that the owner of the crude needs to have appropriate storage facilities. At Cushing, due to the increasing contango, the storage level of oil was steadily increasing.

    Figure 30. Price spread of crude oil January (CLF9) and December 2009 (CLZ9) in USD/barrel. Data: Bloomberg, 2019.

    In January, oil inventories counted more than 33 million barrels (1 barrel equals 159 liters), and the remaining capacity literally was disappearing like ice in sunshine. The super-contango led to “super-storage,” because every holder of crude oil futures without the appropriate capacity had to sell crude oil, if needed, regardless of price. At its low, US crude oil was trading below 35 USD.
    It’s hard to know whether the super-contango was merely an expression of the short-term oversupply of the crude oil market due to the economic slowdown, or whether this was the effect of disinvestment of index and hedge fund capital in the forward contracts. In any case, the steepness of the crude oil forward curve continued to increase.

    Figure 31. Baltic Dirty Tanker Index, 2002–2010. Data: Bloomberg, 2019.

    An additional factor, apart from the price differences, distinguished this situation from past events: The economic slowdown and the effects of the credit crunch had put international freight rates under extreme pressure. At the beginning of 2009, freight rates for oil tankers were around 85 percent below their highs in summer 2008.

    The crude oil super-contango, combined with low freight rates, provided a lucrative business for investment banks.

    For a short while early in 2009, the price difference between a current crude oil contract and a December 2009 contract exceeded 30 percent. The combination of super-contango and the low crude oil tanker freight rates opened up a new field not only for crude oil traders but also for investment banks, since it was possible to store crude oil in oil tankers on the high seas.
    With sufficient inventories, it made no sense to sell oil at prices below 40 USD, if you could sell above 55 USD risk-free through a futures contract. January crude oil prices were trading 20 USD below December contracts, while the cost of storage aboard on a supertanker in January 2009 averaged around 90 US cents a barrel. Assuming that transportation, insurance, and financing were secured, there was an opportunity for immense profit for oil companies and traders.

    Tanker Talk

    The Baltic Exchange is a global marketplace for shipbrokers, shipowners, and charterers. The various indices of the stock exchange offer an important overview of freight rates differentiated according to cargo types, ship sizes, and shipping routes. The Baltic Clean Tanker Index tracks tankers carrying clean cargo, such as oil products (petrol, diesel, fuel oil, or kerosene); the Baltic Dirty Tanker Index is for tankers that carry cargo such as crude oil. In 2009, freight rates for bulk carriers—summarized in the Baltic Dry Index—had fallen by 94 percent since the previous summer, due to the economic slowdown and the credit crunch during the international financial crisis. In comparison, the freight rates for tankers lost a little less. Freight rates for crude oil fell by around 85 percent.
    Tanker lease periods between three and nine months were particularly sought after.
    In February 2009, Frontline, the world’s largest owner of supertankers, reported that 25 tankers had been chartered, and there were still open inquiries about 10 more ships. Any tanker that held less than 2 million barrels of oil was not statistically recorded, but industry experts estimated that there were as many as 80 million barrels on the water at the time, more than twice as much oil as was in official storage in Cushing. The profitable business had also taken on a new dimension. The new customers were no longer BP or Exxon, but Merrill Lynch, Morgan Stanley, Goldman Sachs, Citibank, Barclays, and Deutsche Bank.
    Ship brokers around the globe were surprised by the extent of storage inquiries. After all, 35 supertankers accounted for roughly 10 percent of crude oil tanker capacity worldwide. Due to additional demand, tanker freight rates recovered slightly from their lows. However, the floating inventories prevented a significant spike in oil prices during the year, despite any improvement in underlying economic data. After a nearly 75 percent drop in crude oil prices in just one year, the supply surplus of floating stock unsettled the market. For 2008, the International Energy Agency (IEA) reported a decline in oil demand for the first time since 1983.

    Key Takeaways
    •Cushing, a small town in Oklahoma, is the pipeline capital of the world—the only delivery point for WTI, the most important benchmark for crude oil.
    •In the summer of 2008, crude oil was trading above 145 USD. But then the price collapsed to less than 45 USD, and WTI switched from backwardation into a deep contango. A super-contango was born.
    •In combination with low freight rates due to the economic crisis, the oil super-contango provided a lucrative business for investment banks, which could physically buy oil, store it in supertankers, and sell it on futures exchanges, locking in a secure profit.
    •The super-contango led to a massive supply glut in crude oil for a number of years.

    33 Sugar: Waiting for the Monsoon 2010

    A severe drought threatens India’s sugar harvest, and the world’s largest consumer becomes a net importer on the world market. Brazil, the largest exporter of sugar, has its own problems. As a result, international sugar prices rise to a 28-year high.

    “The peacocks are not dancing.
    It will not rain.”

    —P. K. Dubey in Monsoon Wedding (2001)

    June 2009 was the driest summer month in India for more than 80 years, and the dry season was nowhere near ending. In the first week of August, rainfall was only one-third of its normal level. In the main agricultural areas in the north of the country, the weather phenomenon called El Niño had practically stopped the monsoon, whose season on the subcontinent usually lasts from the beginning of June to the end of September.
    One consequence of El Niño in India is significant crop failures, but India’s frequent experience of drought and famine has historically led to large storage facilities. According to the US Department of Agriculture, about 20 million metric tons of rice and about 30 million tons of wheat were stored in 2009. For sugar, however, the situation was quite different.
    Crop failures were so severe, especially in the state of Uttar Pradesh, that India—the second-largest sugar producer in the world—changed from being a net exporter of the crop to becoming a net importer. After producing more than 26 million metric tons of sugar the year before, the country was initially expected to consume 22 million tons of sugar in 2009. However, in August, the Indian Ministry of Agriculture revised the harvest estimates downward, first to 17 million tons and later to 15 million tons. It was not until 2011 that the Indian authorities expected a harvest of around 25 million metric tons of sugar.

    Sweet!

    Almost three-quarters of the sugar produced in more than 100 countries comes from sugarcane, grown primarily in tropical and subtropical regions. Sugar beets come mainly from the European Union and Russia. Brazil, the largest sugar producer and exporter, is responsible for about 16 percent of the world’s sugar, followed by India (14 percent), China (6 percent), and the United States (5 percent). In Brazil, more than half of the sugar harvest is processed into fuel (ethanol).
    Sugar is traded on multiple futures exchanges in different classifications. The most liquid trading is in Sugar No. 11 (ticker SB) on the New York Board of Trade (NYBOT), where futures contracts are traded in US cents per pound and comprise approximately 50 metric tons of sugar (112,000 pounds). Together with wheat, corn, and soybeans, sugar is the most liquid traded agricultural commodity.

    In 2008, the global trading volume of sugar was about 45 million tons, which equates to almost one-third of the quantity produced worldwide. Two-thirds of total sugar production is consumed directly in producer countries and is excluded from global trade. If other trade barriers, such as quotas and trade agreements, are taken into account, only about 25 percent of the world’s sugar is available to the global market, and about 40 percent of that comes from Brazil, which has quadrupled its sugar production since the early 1990s.

    With severe weather in India and Brazil, the price of sugar shot up.

    Like India, Brazil also had to cope with severe weather conditions in 2009. The problem there was not drought, however, but too much water.

    Figure 32. Sugar prices in US cents/lb, 1970–2010. Data: Bloomberg, 2019.

    Over the past 40 years, the price of sugar has been very volatile. Starting with prices as low as 1 US cent per pound in 1967, the price exploded in the mid-1970s to more than 60 US cents. Then, in 2004, the price of sugar slipped below 6 US cents—levels that had not been seen for more than 20 years.
    In 2010, however, there was a sugar rush! Massive imports from India and weather-related delivery delays in Brazil pushed the raw sugar price to a 28-year high. Futures contracts closed at 29.90 US cents per pound on January 29, 2010, a premium of more than 150 percent compared to the previous year. The situation calmed down only after the March contracts expired on February 26, 2010. At that point positive data from Brazil signaled that the worst scarcity was over.

    Key Takeaways
    •The three most important sugar producers worldwide are Brazil, India, and China, and the latter two mostly produce the crop for their own use.
    •The summer of 2009 was the driest summer in India for more than 80 years. El Niño caused significant crop failures, India became a net importer of sugar on the world market, and Brazil had weather-related problems as well. The price of sugar spiked around the globe.
    •Sugar prices rose to just under 30 US cents per pound by the end of January 2010—more than 150 percent over the previous year. Compared to prices in 2004, when sugar traded below 6 US cents, it represented a staggering increase of 500 percent and the highest price in almost 30 years.

    34 Chocolate Finger 2010

    Due to declining harvests in Côte d’Ivoire (the Ivory Coast)—the largest cocoa exporter on the world market—prices are rising on the international commodity futures markets. In the summer of 2010, cocoa trader Anthony Ward, “Chocolate Finger,” wagers more than 1 billion USD on cocoa futures.

    “Of course they are people. They’re Oompa Loompas.“ —Willy Wonka in the movie Charlie and the Chocolate Factory

    Cocoa, native to Central and South America, was considered by the Maya and the Aztecs to be a gift from the gods and therefore sacred. The seeds of the cacao tree also served as a means of payment. In the treasuries of Aztec king Moctezuma II, the Spanish conquistadors discovered, in addition to gold, more than 1,200 tons of cocoa—tax revenues and a huge currency reserve.
    Today cocoa is an important cash crop, an export commodity for many developing countries, and the raw material for the production of chocolate. (In Germany, one of the countries with the highest per capita consumption of chocolate worldwide, every person eats an average of around 9 kilos per year.) Production costs for chocolate depend on the cocoa content, cocoa quality, and processing time, so that for a normal chocolate bar, the price of cocoa accounts only for about 10 percent of the cost of production.
    Cocoa is traded in New York on the New York Board of Trade (NYBOT) and in London on the London International Financial Futures Exchange (LIFFE) in contracts of 10 tons each in USD and GBP, respectively.

    The 10 largest cocoa producers account for more than 90 percent of the world’s crop. Côte d’Ivoire dominates global production with a market share of more than a third of world production.

    In July 2010, market rumors in London suggested that the Armajaro hedge fund had placed a 1 billion USD bet in the cocoa market. Fund manager Anthony Ward was said to have bought around 240,000 tons of cocoa in an attempt to corner the market. This would have accounted for about 7 percent of global cocoa production and the majority of the available quantities. While some traders saw this as a bet that cocoa prices would continue to rise due to a declining supply, others argued that Ward was creating an artificial shortage and manipulating the market through his massive purchases just before the start of the annual cocoa harvest in October.

    Where’s the Cocoa?

    Cocoa’s main growing areas have shifted in recent years from Central America to Africa. The 10 largest producer countries account for more than 90 percent of the global cocoa harvest. Of these, Côte d’Ivoire is the largest supplier of cocoa in the world, with a market share of more than 33 percent. Indonesia, Ghana, Nigeria, Brazil, and Cameroon follow far behind. By 2010, however, cocoa production in Côte d’Ivoire had fallen by more than 15 percent over the previous five years, largely due to poor crop maintenance and pest infestation. Cocoa production in 2008–2009 was the smallest harvest in the previous five years, at just 1.2 million metric tons, a trend that market participants expected for the 2009–2010 crop as well.
    At age 50, Anthony Ward was considered a genius in trading cocoa. His attempt to corner the market for cocoa was spectacular but not an isolated event. In 2002, Ward had purchased more than 200,000 tons of cocoa—the equivalent of 5 percent of the world’s cocoa market—through futures contracts. That was not the biggest cocoa transaction, however. The cocoa trading desk at Phibro, Salomon Smith Barney’s commodity trading business, had taken a position of 300,000 tons of cocoa in 1997. The head of the cocoa trading desk at that time? Anthony Ward.

    Anthony Ward had been a cocoa trader and industry expert since 1979. In the first months of 2010, the price rose more than 20 percent because of his trades.

    Anthony Ward gained his first trading experiences in 1979 with tea, rice, cocoa, and rubber. In 1998 he co-founded Armajaro with Richard Gower, initially focusing on cocoa, then adding coffee and, later, other agricultural goods. Today Armajaro manages 1.5 billion USD and, with a local presence in Côte d’Ivoire, Indonesia, and Ecuador, is one of the largest cocoa suppliers to the world market. After Ward’s trades in July 2010, the British press dubbed Ward “Willy Wonka,” after the character in Charlie and the Chocolate Factory, and “Chocolate Finger,” in homage to a James Bond villain.

    Figure 33. Cocoa prices in USD/ton, 1990–2012. Data: Bloomberg, 2019.

    In 2009 and 2010, increasing demand, declines in production, and price speculation by hedge funds caused cocoa prices to rise more than 150 percent within two and a half years and to reach their highest level since 1977. A ton of cocoa in mid-July cost more than 3,600 USD. Because of Armajaro’s purchases, the short-term price of cocoa rose: A July contract carried a 300 USD premium compared to a December 2010 contract. Customers had to pay a premium of around 15 percent compared to a later delivery (backwardation).

    In a letter to the NYSE and LIFFE, 16 companies and trading houses complained about market manipulation of the cocoa market. However, LIFFE declared that “indications for a market manipulation are not recognized.”

    Key Takeaways
    •The cocoa market is relatively small and highly concentrated: Côte d’Ivoire dominates global cocoa production with a market share of more than a third of world production. The 10 largest cocoa-producing countries account for more than 90 percent of the world’s crop.
    •During the summer of 2010, rumors spread that hedge fund Armajaro had placed a bet of 1 billion USD in the cocoa market. Fund manager Anthony Ward, nicknamed “Willy Wonka” and “Chocolate Finger,” is said to have bought around 240,000 tons of cocoa in an attempt to corner the market.
    •Compared to price levels in early 2009, cocoa prices in London and New York rose by more than 150 percent and reached their highest level since 1977. A ton of cocoa cost more than 3,600 USD in July 2010—an increase of more than 500 percent compared to 2002. It was a successful bet for Chocolate Finger.

    35 Copper: King of the Congo 2010

    The copper belt of the Congo is rich in natural resources, but countless despots have looted the land. Now Eurasian Natural Resources Corporation (ENRC) is reaching out to Africa, and oligarchs from Kazakhstan aren’t shy about dealing with shady businessmen or the corrupt regime of President Joseph Kabila.

    “The West exploited Africa and now it wants to save it. We have been living with this hypocrisy for too long. Africa can only be saved by Africans.” —Joseph Kabila, President of the Democratic Republic of the Congo
    “We bought an asset from the Democratic Republic of Congo that was for sale.” —Sir Richard Sykes, ENRC

    On Friday, August 20, 2010, investors in the city of London listened closely as Eurasian Natural Resources Corporation (ENRC), a 12 billion USD, London-listed Kazakh mining company, took over the majority stake in Camrose Resources, which held the Kolwezi mining licenses recently expropriated by the government of the Congo. The previous owner of the extremely lucrative licenses? The Canadian mining company First Quantum Minerals. This was explosive news!

    All of a sudden, after decades of colonialism, dictatorship, and warfare, the Democratic Republic of the Congo (DRC) was once again the focus of media attention and the international mining industry. The Congo, one of the poorest countries in the world, nevertheless has an immense wealth of natural resources. The African copper belt stretches from the Congolese mining province of Katanga to northern Zambia. Here lies around 10 percent of the world’s copper reserves. And in 2010, copper was scarcer and more expensive than ever before: Based on its 52-week low, the price of the metal had increased that year alone by 50 percent. For the first time, copper traded above 9,000 USD per metric ton on the London Metal Exchange (LME).

    An Introduction to the Congo

    The Democratic Republic of the Congo, formerly Zaire, is the third-largest country in Africa, after Sudan and Algeria. Neighboring countries—the (formerly French) Republic of the Congo, the Central African Republic, Sudan, Uganda, Rwanda, Burundi, Zambia, Tanzania, and Angola—are all much smaller. With its wealth of natural resources, such as cobalt, diamonds, copper, gold, and other rare minerals, the Congo is a prime example of the “resource curse” thesis: The 70 million inhabitants of the Democratic Republic of the Congo are among the world’s poorest. Only Zimbabwe has a lower per capita GDP.
    The Congo, whose capital is Kinshasa, gained independence from Belgium in 1960 under President Kasavubu and the popular Prime Minister Patrice Lumumba. A period of instability and military intervention followed, beginning in 1965, under the long dictatorship of Mobutu Sese Seko, during which Mobutu and the elite of the country (now called Zaire) systematically looted the wealth of the nation.
    The system collapsed in 1997, when Mobutu was ousted by Laurent-Désiré Kabila. In January 2001, L.-D. Kabila was murdered by one of his bodyguards under unclear circumstances, and the presidency passed to his son, Joseph Kabila. The latter stayed in power until the end of 2018. In January 2019, opposition leader Felix Tshisekedi was declared the fifth president of Congo-Kinshasa since its independence of Belgian colonial supremacy.
    Despite the official end of the second Congo war in July 2003 (the first took place in 1997–1998), conflicts still persisted in the country up until today. In the course of this “African World War,” which involved eight African states and 25 armed groups, more than 5 million people died. It was the bloodiest armed conflict since World War II.
    The Kamoto Mine near the town of Kolwezi is in the heart of the Congo’s mining district, where more than 3 million tons of copper and more than 300,000 tons of cobalt are believed to be in the ground. The current market value of copper reserves alone exceeds 30 billion USD. When the mine was still in operation, the machines of state-owned mining company Gécamines, once the largest company in Africa, moved about 10,000 tons of rock each day. In September 1990, however, the central part of the mine collapsed, burying many miners. The operation came to a standstill. Under the Mobutu dictatorship, reinvestments were neglected, and the largest mines fell into decay. In the late 1990s, Gécamines sold most of its projects to international mining corporations.

    Figure 34. Copper and share price of First Quantum Minerals, 2009–2010. Data: Bloomberg, 2019.

    Beginning in 2007, the Congolese government undertook a review of more than 60 foreign mining agreements in order to increase state involvement and ownership in the mining sector. Since then, the revision of mining licenses has created multiple sources of conflict.

    The government was aiming for at least 35 percent government ownership in future mining projects. In addition, newer regulations called for a signing bonus of 1 percent of the project value, a 2.5 percent license fee on the gross income, and a stipulation that the mine would go into production within two years.

    The value of the mineral reserves of the African copper belt between the DRC and Zambia exceeded the GDP of half the African continent.

    In August 2009, after a 2½-year review by the government, Canadian First Quantum Minerals’ Kolwezi license was terminated. The government accused First Quantum of breaching the 2002 mining regulations, though First Quantum denied it. One of the contentious issues was the increase of the Gécamines’ share by 12.5 percent—for zero costs involved.
    The situation for the Canadian company was precarious, since it had already invested more than 700 million USD in expanding Kolwezi. Moreover, after First Quantum couldn’t come to an agreement with the Kabila government, the Congolese Supreme Court also revoked the company’s licenses for the Frontier and Lonshi mines in favor of the state mining company Sodimico—another bitter blow to First Quantum.

    Sly Foxes

    The wealth of natural resources in the Katanga province of the Congo smoldered into a power struggle among the three craftiest businessmen on the continent: George Forrest, Billy Rautenbach, and Dan Gertler. Sixty-seven-year-old Forrest, head of the Forrest Group, had been born in the Congo and was the old man of the Congolese mining industry. In early 2004, a few months after the end of the war in the Congo, Forrest and Kinross Gold entered into a joint-venture agreement with the government over the Kamoto Copper Company (later Katanga Mining).
    Rautenbach, founder of Wheels of Africa, the largest transport company in southern Africa, was a friend of Zimbabwean president Robert Mugabe. He went after the jewel, Katanga Mining, through the British company Camec. However, after a short takeover battle, the Congolese government announced a review of those mining licenses, and Rautenbach took the hint. He pulled back in September 2007. Rautenbach had previously been the manager of Gécamines but was replaced by Forrest, which accounted for the hostility between the two men.
    Meanwhile, Gertler was laughing on the sidelines. Just 30 years old, he closed a joint-venture contract with the government of the Congo in 2004 for the development of KOV (Kamoto-Oliveira Virgule, later the company Nikanor). KOV was the only mine in Katanga with more resources than Kamoto Copper Company. More than 6.7 million metric tons of copper and 650,000 tons of cobalt—twice as much as in Kamoto—were estimated to be in the ground. According to market prices in 2018, the value of these resources alone exceeds half the GDP of Africa.
    During the takeover battle for Katanga, Gertler bought shares in that mine through Nikanor. Camec finally lost its bid at the beginning of 2008, and Nikanor and Katanga Mining merged. In addition to his financial resources, Gertler had excellent connections: He is the grandson of the founder of Israel’s diamond exchange, a friend of then-Israeli prime minister Ariel Sharon, and the same age as Congo president Joseph Kabila, whom he considered a close friend.
    In January 2010 the newly established Highwinds Properties, owned by Dan Gertler, was awarded the Kolwezi license in a shady deal. A few months later came the bombshell. On August 20, 2010, ENRC confirmed that it had secured the licenses to Kolwezi through its 50.5 percent acquisition of Camrose Resources for 175 million USD. The company said it intended to cooperate with Cerida Global, another Dan Gertler–controlled company. With the acquisition of Camrose, ENRC was also committed to a 400 million USD loan for Highwinds and a loan guarantee of another 155 million USD for Cerida’s debts.

    The Kazakh company ENRC aggressively expanded its business in Africa and was not shy about dealing with African despots like Joseph Kabila.

    Camrose also offered a majority stake in its subsidiary Africo to ENRC, whose copper and cobalt projects were located near its Camec properties. This was of high strategic importance for the Kazakh company, since ENRC had acquired the Central African Mining and Exploration Company (Camec) for 955 million USD in 2009. This is where Dan Gertler came into play, as Camec was 35 percent owned by the Israeli investor, who quickly unified the three Kazakh oligarchs—Alexander Mashkevitch, Patokh Chodiev, and Alijan Ibragimov—who owned 40 percent of ENRC.
    The deals between Camec and Camrose were important milestones for ENRC’s aggressive expansion policy in Africa, along with a 12 percent stake in Northam Platinum in South Africa that ENRC acquired in May 2010. Regardless of pending possible expropriations and a skeptical attitude by many institutional investors, only time would show whether ENRC would have a more favorable outcome in Congo than its Canadian rival, First Quantum.
    Sometimes time flies. In November 2013, ENRC delisted its shares from the London stock exchange. The following April, an official investigation into bribery and sanction-busting began in England, and the founding partners decided to take the company private again. In February 2014, news spread that the company needed to sell all its international assets—including the copper mines in the Democratic Republic of the Congo—to repay debts. President Kabila, however, stayed in power until the end of 2018.
    In January 2019, the opposition leader Felix Tshisekedi was declared the fifth president of Congo-Kinshasa. Leader of the opposition, Martin Fayulu, complained that Kamila, despite officially stepping down from office, would with his associates most likely continue controlling the levers of powers. Presidential elections had been due for more than two years, but elections had been postponed several times despite forceful protests. Since the end of Belgian colonial supremacy in 1960, the country had never seen a peaceful transfer of power.

    Key Takeaways
    •The African copper belt that runs between the Congo and Zambia holds an incredible wealth of natural resources. In 2010 it became the focus of upheaval when President Kabila revoked the mining license of Canadian firm First Quantum Minerals.
    •Copper was now big business, as copper prices traded at record highs of more than 9,000 USD per ton on the London Metal Exchange (LME).
    •The Kazakh (but London-listed) resource company Eurasian Natural Resources Corporation (ENRC) began to massively expand its footprint in Africa. The firm’s leaders were willing to deal with shady businessmen as well as with President Kabila’s corrupt regime.
    •In a murky transaction involving Dan Gertler’s Highwinds Properties, the expropriated assets of First Quantum were sold to ENRC. International investors were shocked, and the company went private a couple of years later.

    36 Crude Oil: Deep Water Horizon and the Spill 2010

    Time is pressing in the Gulf of Mexico. After a blowout at the Deepwater Horizon oil rig, a catastrophe unfolds—the biggest spill of all time. About 780 million liters of crude oil flow into the sea. Within weeks BP loses half its stock-market value.

    “This well did not want to be drilled . . . it just seemed like we were messing with Mother Nature.” —Daniel Barron, survivor of the Deepwater Horizon disaster
    “I would like my life back.” —Tony Hayward, CEO of BP

    Deepwater Horizon was one of the world’s most advanced deepwater rigs. Installed in 2001, it was 121 meters long, 78 meters wide, and 23 meters high and cost 350 million USD. In April 2010, the giant lay about 40 miles off the coast of Louisiana in the Gulf of Mexico. Since February, the platform had been busy in the Mississippi Canyon Block 252, drilling in the Macondo reservoir about 4,000 meters below sea level.
    April 20, 2010, promised to be a successful day, because the drill hole identified as API Well No. 60-817-44169 was about to be completed. The well would be sealed and prepared for production by a production platform. Every day counted because platform operators like Transocean charged oil companies on a daily basis. And in this case, BP was already concerned because Deepwater Horizon had been behind schedule for 43 days. The delays had already cost the big oil company more than 20 million USD.

    Twenty years after the Exxon Valdez oil spill, an even bigger environmental catastrophe was looming on the horizon.

    The Exxon Valdez—A Past Catastrophe

    Shortly after midnight on March 24, 1989, the most severe environmental disaster in the history of the United States occurred. The 300-meter-long oil tanker Exxon Valdez was on its way from the oil-loading station of the Trans-Alaska Pipeline, in the port city of Valdez, Alaska, when it collided with Bligh Reef in Prince William Sound. The accident caused a spill of almost 40,000 tons of crude oil. Around 2,000 km of coastline were contaminated, and hundreds of thousands of fish, seabirds, and marine animals died. Captain Joseph Hazelwood was drunk in his room at the time of the accident, and third officer Gregory Cousins had the bridge.
    Despite an extensive cleanup, the ecosystem remains severely disturbed three decades later.
    That morning, four BP managers arrived by helicopter to monitor the completion of the drilling. Only a few hours before, experts from the oil services company Halliburton had cemented the drill hole closed, but employees of Schlumberger, who were about to test the cement seal, were sent back to shore by the BP managers before they had accomplished their task.

    Deepwater Horizon drilled for black gold in the Gulf of Mexico on behalf of BP.

    To accelerate completion of the work, BP urged rapid replacement of the drilling mud in the well with seawater to prepare for early production. This decision precipitated an argument between BP and the Transocean managers, who considered that step premature. Unlike seawater, drilling mud holds back rising gas and oil. However, the managers of BP prevailed, and the work began.
    The decision would prove disastrous. The hole had a leak, and drilling mud and gas bubbles began to spill out. The cement plug also appeared to be leaking. Work continued into the night, until suddenly a sharp hiss of methane was heard and a fountain of mud shot out of the derrick, signaling a blowout.
    As the methane ignited, a huge column of flame rose into the sky. Suddenly the entire derrick was on fire, and four workers on the drilling deck were dead.
    The alarm sensors designed to warn of fire and a concentration of toxic or exploding gases had been turned off to keep workers from being disturbed by false alarms in the middle of the night. Now, below deck, it was chaos. Workers, some of them barely awake and dressed in little more than a life jacket, were jumping off the platform into the water, trying to save themselves. But with the Deepwater Horizon in flames, the oil on the water’s surface had caught fire as well. Chaos also reigned in the rig’s two lifeboats.

    Around 11 pm, the Damon B. Bankston, an 80-meter-long supply ship, rescued the survivors. Eleven people had died in the explosion. Two days later, the oil platform sank in the Gulf of Mexico.
    The demise of the platform marked the beginning of the biggest environmental disaster in the history of the United States, an event that would provide the plot for a Hollywood blockbuster movie, starring Mark Wahlberg, in 2016.

    The Macondo drilling ended in disaster. In the largest oil spill in the United States, nearly 780 million liters of crude oil ran out, and the market value of BP fell by half.

    When fire broke out on the deck of the Deepwater Horizon, engineer Christopher Pleasant pressed the emergency button for the blowout preventer (BOP), a series of shut-off valves mounted directly above the well bore to interrupt the flow of oil into it. Like huge pliers, the massive shear jaw of the BOP was supposed to cap and close the well in case of disaster. The automatic emergency system was activated, but nothing happened.
    A commission of inquiry later found that the Deepwater Horizon blowout preventer was poorly maintained, the hydraulic system was leaking, and the safety instructions had not been properly maintained. In addition, the ring valve of the device had been damaged weeks before. Not only was the blowout preventer in poor condition, as early as September 2009, BP had reported almost 400 defects on the rig to Transocean. However, maintenance had been delayed, and more than 26 systems were in poor condition. There were even problems with the ballast system.
    After the platform sank, an oil slick formed. Approximately 1.5 km by 8 km at first, it expanded to almost 10,000 square kilometers within a few days. Between 5 and 10 million liters of crude oil were flowing out every day, and Louisiana, Florida, Mississippi, and Alabama all declared a state of emergency. According to the US Department of the Interior’s Flow Rate Technical Group (FRTG), the amount of oil that flowed out every 8 to 10 days matched the total amount of oil from the Exxon Valdez disaster. BP estimated that there were around 7 billion liters of crude oil in the source. Thus, it would take another two to four years until the entire amount of oil had oozed into the sea.
    Shortly after the platform sank, BP initiated two independently made side-to-side relief wells (called the “bottom-kill method”), but the drilling would have taken about three months. Meanwhile, the capture of the oil with the aid of large steel domes was failing.

    The depth of the seabed—around 1,500 meters—complicated the work. At the end of May 2010, several attempts were made to plug the leak with mud and cement (the “top- kill method”), but they, too, were unsuccessful. In the middle of July, BP succeeded in significantly reducing the oil flow with a new sealing attachment—a temporary closure was successful. As a result, on August 6, the leak was finally sealed permanently using a modified variant of the top-kill method (“static-kill”)—pumping in liquid cement through side relief holes. On September 19, five months after the Deepwater Horizon sank, BP declared the well “officially dead.”

    It took five months to seal the oil leak.

    It was estimated that nearly 5 million barrels of oil, around 780 million liters, had run out, and BP’s stock-market value fell by half in the course of the disaster. The company announced that it would divest 10 billion USD worth of assets to defer the cost of the spill.

    Figure 35. BP, share price fluctuation during first half of 2010. Data: Bloomberg, 2019.

    At that point only about 3 billion USD in costs had accumulated. But BP also set up a trust fund of more than 20 billion USD for the future consequences of the catastrophe. Still unanswered is the question of who bears the responsibility for the disaster. Undoubtedly, BP took high risks, applied non-industry-compliant practices to save costs, and, as the principal, bears the financial responsibility. Transocean’s role as operator of the oil platform also needs to be clarified, especially since the platform was in relatively poor condition. For Halliburton, the questions revolve around the doubtful completion of the cement seal of the well, and initial claims have also been made to BP’s partner companies Mitsui and Anadarko.
    The disaster heightened public awareness of the risks associated with deepwater drilling, both in the Gulf of Mexico and in planned projects off Brazil and Africa. As a direct result of the catastrophe, the US government passed a deep-sea moratorium, temporarily banning all new deep-sea drillings. Although this was later repealed, no new licenses have been awarded. As a further consequence, President Barack Obama fired the head of the Minerals Management Service, Elizabeth Birnbaum. The agency, now renamed the Bureau of Ocean Energy Management, Regulation and Enforcement, had grossly and negligently violated its oversight responsibilities.
    It is impossible to estimate the economic consequences of the disaster, let alone the environmental consequences, which include not only the direct effects of the oil pollution but also the burning of oil and the use of toxic chemicals like Corexit, which have been used to combat the oil spill. BP said in 2018 that it would take a new charge over the Deepwater Horizon spill after again raising estimates for outstanding claims, lifting total costs to around 65 billion USD. The story of the disaster in the Gulf of Mexico will play out for decades in the future.

    Key Takeaways
    •At the Deepwater Horizon oil rig in the Gulf of Mexico, the Macondo drilling, at about 4,000 meters below sea level, ended in disaster. Nearly 780 million liters of crude oil ran out, and the market value of BP, the oil and gas company in charge, fell by half within weeks.
    •The oil spill caused the biggest environmental catastrophe in the history of the United States, far more devastating than the oil spill of the Exxon Valdez 20 years earlier.
    •As a consequence, US authorities temporarily froze all deepwater drilling licenses. BP is estimating a price tag of more than 65 billion USD.

    37 Cotton: White Gold 2011

    The weather phenomenon known as La Niña causes drastic crop failures in Pakistan, China, and India due to flooding and bad weather conditions. Panic buying and hoarding drive the price of cotton to a level that has not been reached since the end of the American Civil War 150 years ago.

    “It’s not something you’re going to see again in your lifetime.” —Sharon Johnson, senior cotton analyst
    “I think there’s still hope for prices to go higher.” —Yu Lianmin, Chinese cotton farmer

    In ancient Babylon, cotton was known as “white gold,” and the fabric has remained popular throughout history, woven by hand for hundreds of years. At the end of the 18th century, however, spinning and weaving mills began to produce fabrics and clothing at a much lower cost than could be done by hand. By the 19th century, the cotton business was booming, due to recent inventions such as the steam engine, the cotton gin, the spinning jenny, and mechanical looms.
    The textile industry of the United Kingdom required ever larger quantities of the raw material, which was produced in its colonies or elsewhere abroad, especially in the southern United States, where cotton had expanded tremendously in the early 1800s. The crop thrived everywhere that was moist and warm, and labor was cheap in the American South. For about 250 years enslaved Africans had toiled on southern plantations, and cotton production grew from just 10,000 bales a year to more than 4 million until slavery was abolished after the end of the American Civil War in 1865. During that war, the price of cotton rose to dizzying heights that would only be reached again in spring 2011, almost 150 years later.

    The last time cotton reached almost 2 USD per pound was after the American Civil War.

    Since 1995, cotton had traded mostly between 0.40 and 0.80 USD, but at the end of September 2010, for the first time in 15 years, the price of cotton broke the 1 USD/lb level. A few months earlier, in May, the German magazine Der Spiegel had bemoaned “the end of cheap jeans,” as it noted the price explosion in cotton. But that was only the beginning. By November, cotton prices had increased another 40 percent. A sharp correction followed, but by the end of December cotton was up to 1.40 USD. And, beginning in January 2011, the market was unstoppable. The price spiked to more than 2.15 USD in March 2011—four times the level of early 2000 and a 480 percent increase over the November 2008 price.
    It was the highest price ever paid for cotton since the introduction of cotton trading on the New York Cotton Exchange in 1870.

    Figure 36. Cotton prices in US cents/lb, 2005–2013. Data: Bloomberg, 2019.

    The price had actually been rising for several years. At the end of 2009, the global textile industry had forecast robust growth of around 3 percent for the following year. However, flooding and bad weather conditions in several important producer countries such as China, India, Pakistan, and Australia led to significant crop losses. Because of the falling inventory, high premiums were paid for material that was available in the short term.

    Once again, severe weather conditions influenced agriculture prices.

    In Pakistan, the world’s fourth-largest cotton-producing country, floods hit more than 14 million people in 2010, according to UN estimates. The exceptionally heavy monsoon season was considered the strongest in more than 80 years, and rain destroyed more than 280,000 hectares of cotton. According to the Pakistan Cotton Ginners Association, the flood destroyed 2 million bales of cotton. The All Pakistan Textile Mills Association also reported a worrying shortage of cotton. Only 30 percent of the mills had raw material in stock for the next 90 days, and Pakistan would soon stop exporting cotton.

    A few weeks later, India, the second-largest cotton producer in the world, followed suit. The Indian Ministry of Textiles stopped exports, since without the ban the Indian textile industry would not have been guaranteed an adequate supply of cotton. Indian exports dropped to 0.5 million metric tons, having exceeded 1.5 million tons in the 2007–2008 season.
    There were several reasons for the shortage beyond the dynamic growth of the domestic Indian textile industry. The world’s largest cotton producer and importer, China, was also enduring a shrinking cotton harvest for the second year in a row, due to low temperatures and too much rain. China Cotton Association statistics in December 2010 showed monthly imports doubling year over year.

    Cotton Basics

    Most cotton species and varieties are cultivated as annual plants and have high requirements for heat and water. In the Northern Hemisphere, sowing takes place from the beginning of February to the beginning of June, depending on the location.
    China, India, the United States, Pakistan, Brazil, and Uzbekistan together account for around 85 percent of the world’s cotton production, with China and India producing more than half of the global market volume. In the 2009–2010 harvest, the amount of cotton grown worldwide reached 25 million metric tons.
    Cotton is used mainly in textiles, accounting for about one-third of the world’s textile fibers. These can be categorized into natural fibers—such as vegetable fibers (e.g., cotton or linen) and animal fibers (e.g., wool, hair, and silk)—or artificial (synthetic) fibers. Synthetic fibers actually dominate the industry, accounting for almost 60 percent. They can be divided into cellulosic fibers (e.g., viscose) and those derived from petroleum. The most important synthetic fibers are polyester, polyamide, and polyacrylic fibers.
    Cotton is traded on the commodity futures exchanges in the United States under the symbol CT and the respective contract month in a contract size of 50,000 lb per contract.
    In late 2010 and early 2011, flooding and Cyclone Yasi caused severe damage in Australia, which ranked eighth among the top 10 cotton producers worldwide. The Australian Cotton Shippers Association, which had predicted a bumper harvest of more than 4 million bales, reduced its forecast by more than 10 percent.

    Blocks on cotton exports worsened the situation, and panic buying and hoarding were the result.

    Cotton processors in the region reacted in panic. Willing to pay any price for raw material, they pushed prices ever higher. Cotton farmers who still had inventory continued to aggravate the situation. The China National Cotton Information Center estimated that around 2 million tons of available material never reached the market in China. For example, in Huji, in Shandong province, about 220 kilometers from Beijing, growers held back more than 50 percent of their harvest at the end of January, expecting prices to continue to rise. Because of the short shelf life of cotton, that strategy could only be maintained until April or May.
    In any case, the price boom in cotton was short lived. The International Cotton Advisory Committee in Washington estimated that the acreage for the 2011–2012 season would increase to 36 million hectares, the most in 17 years. It was a natural response to record prices. In the short term, however, most processors had no choice but to mix cheaper synthetic fibers with the more expensive cotton.

    Key Takeaways
    •If you thought that the exciting times of trading cotton took place more than 100 years ago, events in 2010 proved you wrong.
    •The first impacts of global climate change were evident in a series of extreme weather events. Flooding and bad weather conditions caused by La Niña accounted for significant crop losses in several important cotton-producing countries, such as China, India, Pakistan, and Australia.
    •Cotton processors in the region reacted in panic, driving prices higher. Cotton farmers who still had stocks held back their supply in expectation of even higher profits.
    •As a consequence, cotton prices shot through the roof. Cotton, which once traded at 40 US cents per pound in 2009, doubled in value within a year to 80 US cents and skyrocketed to 2 USD in 2011. This was an increase of 500 percent in two years!
    •Because of short supplies, export restrictions, panic buying, and hoarding, the price of cotton rose to a level not reached since the end of the American Civil War 150 years ago.

    38 Glencore: A Giant Steps Into the Light (2011)

    In May 2011, the world’s largest commodity trading company—a conspicuous and discreet partnership with an enigmatic history—holds an IPO. The former owners, Marc Rich and Pincus Green, have been followed by US justice authorities for more than 20 years. Without mandatory transparency or public accountability in the past, they were able to close deals with dictators and rogue states around the world.

    “Glencore is Marc Rich’s legacy.” —Daniel Ammann, author of The King of Oil
    “My business is my life.” —Marc Rich

    It was the week before the Easter holidays in 2011, on a warm, sunny day in the banking metropolis of Frankfurt am Main, Germany. For the first time that year, temperatures climbed above 72 degrees Fahrenheit, and the city was full of people enjoying the sun’s warm rays. It was also the first week of “investor education” concerning the biggest IPO of the year, for Glencore.
    Equity sector specialists were explaining corporate strategy and the business model of the world’s largest commodity trading house and the reasons why institutional investors should participate in its initial public equity offering. In a meeting room in one of the bank towers, high above the city center, 11 people nibbled on light snacks. The analyst was late, however, thanks to too many meetings and telephone conferences. And much of the information about corporate returns remained unclear. It seemed that Glencore was not being completely transparent. How exactly did the commodity giant—whose value was estimated at between 60 and 80 billion USD by the banks in the consortium and whose management team was known only to industry insiders—earn its money? Until the IPO, the Switzerland-based company had cherished one thing above all: secrecy.
    Glencore (the name was derived from Global Energy Commodity Resources) was one of the world’s leading commodity players. Its business activities included the production, processing, and trading of aluminum, copper, zinc, nickel, lead, iron ore, coal, and crude oil as well as agricultural products. In terms of sales, the company was the largest in Switzerland and the largest individual shareholder, with 33 percent, of the multinational mining company Xstrata. Before the IPO, Glencore was completely owned by its management and employees, but until 1993 it had had a turbulent history determined by only one man: Marc Rich, nicknamed “The King of Oil.”

    Marc Rich was the world’s most successful commodity trader. Together with Pincus Green, he broke the Seven Sisters cartel, the dominant oil companies until the 1970s.

    Within commodity markets, Marc Rich was a legend. No commodity trader before or after him has ever been so successful. As a son of German-speaking Jews, Rich began his career in 1954 with Philipp Brothers, then the world’s largest commodity trader. Strong economic growth in Europe, the United States, and Asia made the 1960s a boom decade for commodity trading. But in 1973, when the company earned a record profit in which Marc Rich and Pincus Green played a decisive role, a dispute about future payments arose.
    Rich and Green left Philipp Brothers and convinced Jacques Hachuel, Alexander Hackel, and John Trafford to follow them. Together they founded Marc Rich + Co AG in Zug, Switzerland, on April 3, 1974.

    Rich and Green revolutionized commodity trading, breaking the multinational Seven Sisters oil companies cartel and becoming major players in international petroleum trading. In the early 1980s Rich was the world’s largest independent oil trader. Marc Rich + Co generated more profit than UBS, the biggest bank in Switzerland, and Rich’s private wealth was estimated to total more than a billion USD.
    Initially, the company focused on the physical trading of iron, nonferrous metals, and minerals. Crude oil and coal marked an expansion into energy. With the acquisition of an established Dutch grain distribution company in 1982, Rich + Co also entered the agricultural sector. Through further acquisitions in mining, smelting, refineries, and processing, the company continued to grow in the 1980s and 1990s.

    Who Was Marc Rich?

    Marc Rich, born Marcell David Reich on December 18, 1934, in Antwerp, Belgium, was the son of German-speaking Jews. Fleeing war and persecution, the family immigrated to the United States and changed the family name to Rich. As a young man, Rich studied at New York University but left after two semesters to join Philipp Brothers in 1954, then the largest commodity trading company in the United States. He started his career under Ludwig Jesselson, and between 1964 and 1974 he worked as a manager of the Philipp Brothers offices in Spain. In 1974 Rich left the company and with Pincus Green and others founded Marc Rich + Co AG.
    Within the next two decades, the new commodity trading company would become the most successful in the industry. But because of business ties to Iran—despite American political and economic sanctions and the US abolition of diplomatic relations in April 1980—Rich and Green became the focus of the US Justice Department. Accused of organized crime and tax fraud, Rich avoided prosecution by fleeing to Switzerland, where for 20 years he and Green proceeded with business as usual, while they were pursued by US justice.
    After a management buyout in 1993, Rich separated from the firm, and the group was renamed Glencore. At the time, Forbes magazine estimated his private assets at more than 1.5 billion USD.
    Rich never went to trial, and on his last day of office, January 20, 2001, President Bill Clinton granted full and unconditional pardons to Rich and Green in a still-controversial act.
    In June 2013, Rich died of a stroke at a hospital in Lucerne, Switzerland, at the age of 78.
    As it hunted for the next source of profits, the company was not picky. The list of its business partners read like a “Who’s Who” of international rogue states and dictatorships. The company traded commodities with Iran during the hostage crisis and with Fidel Castro’s Cuba, as well as with Slobodan Milosevic’s Yugoslavia, North Korea, Muammar Gaddafi’s Libya, the Soviet Union under Brezhnev, South Africa’s apartheid regime, and Nigeria and Angola in the late 1970s.
    In the 1990s, though, the tables turned. Pincus Green and Alexander Hackel resigned, and the press relentlessly excoriated the company’s business behavior. Finally, after heavy trading losses, Rich lost the support of other senior managers.
    In November 1993, the 39 most important employees of Marc Rich + Co met at the Parkhotel in Zug to discuss the future of the company without Rich. Led by Willy Strothotte, they agreed on a management buyout, and by the following November, Rich had gradually sold his shares of the firm to management and senior employees, about 200 people in all. The value of the company—an industry leader in trading crude oil, metals, and minerals—was estimated to be between 1 and 1.5 billion USD. The new owners renamed the company Glencore, eliminating all traces of the Marc Rich name after 20 years.
    Strothotte took over as chairman of the board of directors of Glencore but also moved into a top position at Schweizerischer Südelektra, which was renamed Xstrata in 1999 and was 33 percent owned by Glencore. The two companies maintained a close relationship. While Xstrata concentrated on commodity production, Glencore focused on marketing and trading raw materials. Xstrata, listed in London, offered transparency for investors. However, Glencore’s business continued to play out behind the scenes.

    Figure 37. Glencore (GBP). Equity price performance since IPO on May 19, 2011. Data: Bloomberg, 2019.

    As Glencore reached the limits of growth within its corporate structure, it badly needed fresh capital, a situation exacerbated by the fact that some of the management team had to be reimbursed within the next couple of years. The initial public offering, which raised 12 billion USD, satisfied that hunger for cash. On May 19, 2011, shares of Glencore were listed for the first time in London at 5.27 GBP. In February 2012, the company announced a merger with Xstrata that would be concluded almost a year later under CEO Ivan Glasenberg. The CEO of Glencore since 2002, Glasenberg had been with the company since 1984 and, with an estimated 5 billion USD net wealth, he became one of the top 10 richest people in Switzerland.
    It turned out that Glencore’s management had cashed out at the peak of the cycle: The share price of the initial IPO has never been reached again. Instead, during a commodity sell-off, shares plunged to 67 GBP on September 28, 2015, a loss of 87 percent since the IPO. In January 2019, however, Glencore’s share price had recovered to 3 GBP, which shows that its business model as a listed company was working.

    Key Takeaways
    •The commodity trading company Glencore had a turbulent history that, until 1993, was determined by one man—Marc Rich, nicknamed “The King of Oil.” Rich had founded Glencore’s predecessor company, Marc Rich + Co AG, in Zug, Switzerland, in 1974.
    •With private wealth of more than 1 billion USD, Rich became the most famous commodity trader by breaking the Seven Sisters cartel, and by becoming the world’s largest independent oil trader. His list of business partners read like a “Who’s Who” of international rogue states and dictatorships.
    •Glencore and other commodity trading companies generally maintain an aura of secrecy, since they prefer to strike their deals in private. However, to overcome financing constraints, Glencore, which was completely owned by its management and employees after 1993, raised 12 billion USD in its initial public offering in May 2011. It merged with mining giant Xstrata one year later and became a leader in both mining and commodity trading.
    •In May 2011, shares of Glencore were listed for the first time in London at 5.27 GBP. In hindsight, that was the top of the cycle; during the following bear market in commodities, the shares plunged to 0.67 GBP in September 2015. Today, shares of Glencore have recovered to 3 GBP.

    39 Rare Earth Mania: Neodymium, Dysprosium, and Lanthanum 2011

    China squeezes the supply of rare earths, and high-tech industries in the United States, Japan, and Europe ring the alarm bell. But the Chinese monopoly can’t be broken quickly. And the resulting sharp rise in rare earth prices lures investors from around the globe.

    “The Middle East has oil. China has rare earths.” —Deng Xiaoping, 1992

    In 2013, geologist Don Bubar bought 4,000 hectares of land in the wilderness of Canada for less than half a million USD, hoping that in a few years the area would be worth billions. Bubar and his company, Avalon Resources, planned to develop a mine for rare earths and to start production by 2015. Gold fever had seized the mining industry. Almost 300 companies worldwide were exploring for rare earths and other exotic metals like lithium, indium, or gallium. Investors were happy to spend their money on these projects, because the supply of rare earths is limited, demand was high, and prices were soaring, reflected in press headlines almost every day.
    Rare earths have become indispensable for modern high-tech applications—in computers, mobile phones, or flat screens, for example, and the growth of regenerative energy can’t be achieved without rare earths in electric/hybrid cars or in wind power plants. But these metals have been at the center of a trade conflict between the main producer, China, and the industrialized countries, a situation that has been worsening over the past few years.

    What Are Rare Earths?

    Rare earths consist of 17 metals: scandium, yttrium, and the lanthanides group of lanthanum, cerium, dysprosium, europium, erbium, gadolinium, holmium, lutetium, neodymium, praseodymium, promethium, samarium, terbium, thulium, and ytterbium. In most deposits, light rare earths (cerium, lanthanum, neodymium, and praseodymium) are found in large quantities, while the occurrence of heavy rare earths (yttrium, terbium, and dysprosium among others) is considerably lower.
    One of the most extensively used metals is neodymium, which is indispensable for the production of permanent magnets, that is, magnets that do not discharge. Neodymium is used in mobile phones and computers, wind turbines, and electric/hybrid cars. Each megawatt of power from a wind generator requires between 600 and 1,000 kg of permanent magnets made of iron-boron-neodymium alloys. Moreover, in every wind turbine, there are several hundred kilos of neodymium and dysprosium.
    Lanthanum is also used in many high-tech applications. For example, about one kg of neodymium is needed for the hybrid engine of a Toyota Prius, but the batteries contain about 15 kg of lanthanum. The German Federal Institute for Geosciences and Natural Resources expects the demand for rare earths to rise to 200,000 metric tons a year. At current prices, this means a market size of 2 billion USD. Compared to other metal markets, such as that for copper, with an annual production volume of almost 20 million metric tons and a market value of almost 140 billion USD, rare earths are a tiny but profitable segment.
    China has dictated world market prices of rare earths, since its production accounts for about 97 percent of the global volume of 120,000 tons per year. China also has almost 40 percent of the world’s reserves, while other significant reserves are located in Russia, the United States, Australia, and India.
    Similar to OPEC’s actions during the oil crises of the 1970s, China has been manipulating exports for years, and the United States, Japan, and Europe have all complained about export restrictions and high export duties. In 2005, exports were around 65,000 metric tons per year, but the volume has shrunk dramatically since then. As a result, prices for rare earths rose sharply from 2005 to 2008, and there was another price push in the third quarter of 2009. For the first half of 2011, the Chinese government announced exports of just 14,500 metric tons, and prices rose again. A kilogram of neodymium in May 2011 cost almost 300 USD, compared to just 40 USD 12 months earlier.
    China also used its dominance in rare earth production as a political weapon. When Japan detained a Chinese ship captain, China banned rare earth exports to Japan in September 2010.

    Figure 38. Rare earth carbonate, neodymium, dysprosium, and lanthanum, 2010–2013. Chinese onshore prices in RMB, indexed 30.12.2009=100. Data: Bloomberg, 2019.

    Over the past 20 years, industrialized nations have maneuvered themselves into this economic dependency. In the mid-1960s, the United States began producing rare earths in the Mountain Pass Mine, in the Mojave Desert of California. Until the late 1990s, this mine alone covered the world’s demand for these metals. Within the industry, this time period is known as the “Mountain Pass era.”

    However, due to environmental constraints and low prices for rare earth metals, the mine closed in 2002. Since the beginning of the 1990s, the Chinese—able to produce the rare earths more cheaply and without worrying about environmental requirements—have begun to flood the world market.
    The main Chinese production comes from Mongolia, where only a few kilometers away from the city of Baotou, with its multimillion population, is Bayan Obo, one of the world’s largest open-air mines.

    It is estimated that up to 35 million metric tons of rare earths—more than half of total Chinese production—come from Bayan Obo. Another large segment of the Chinese supply derives from the southern provinces, where there are numerous small illegal projects in addition to official government mines. Production has its price, however. Processing rare earths generates large amounts of poisonous residues, which leads to heavy pollution by thorium, uranium, heavy metals, acids, and fluorides. Thus, untreated sewage has turned the nearby 12-kilometer-long drinking-water reservoir at Baotou into a waste dump enriched with chemicals and radioactive thorium.

    Bayan Obo in China is the world’s largest mine for rare earth minerals.

    Such heavy environmental damages are ironic, since these rare earths are indispensable to the clean energy industry, especially wind turbines and electric/hybrid cars. There’s no short-term, easy way out of the West’s self-inflicted scarcity. Development of an independent production capacity without environmental problems is a very capital-intensive undertaking. Exploration and exploitation of rare earth deposits is somewhat less problematic; despite their name, rare earths are not really scarce. Even the rarest metal in the group is around 200 times more common than gold.

    Skyrocketing prices of rare earths have attracted many adventurers.

    Skyrocketing prices in 2011 attracted investors and adventurers around the globe, as small mining companies began to search for rare earths and other exotic metals, and investors looked for attractive rare earth deposits to invest in. However, the majority of new rare earth deposits will never be developed or even have the slightest chance to go into production.
    The two most promising companies were Molycorp and Lynas. Molycorp, which had an IPO in 2010, planned to reactivate the Mountain Pass Mine, while Lynas aimed to start production at the Mount Weld Mine in Australia in 2011. All other projects were looking at a planning horizon of at least five years. Meanwhile, the absence of a processing infrastructure was an even greater obstacle than the need for capital-intensive funding.
    In 2015, Molycorp filed for bankruptcy after facing challenging competition and declining rare earth prices. The company was then reorganized as Neo Performance Materials. Lynas successfully got into production and made a first shipment of concentrate in November 2012. Today it operates a mining and concentration plant at Mount Weld and a refining facility in Kuantan, Malaysia. In September 2018, however, the processing facilities in Malaysia came under government review because of environmental concerns, and shares of Lynas began to tumble.
    China will continue to be the dominant source of rare earths, which perfectly fits into the strategic plan issued by Chinese premier Li Keqiang and his cabinet in May 2015: Made in China 2025.

    Key Takeaways
    •The group of 17 rare earth metals, with exotic names like neodymium, dysprosium, or lanthanum, have become indispensable for modern high-tech applications like wind turbines and e-mobility.
    •In 2011, China squeezed the supply of rare earths, using its dominance in rare earth production as a political weapon. Because its production accounts for more than 90 percent of global supply, China has been able to dictate world market prices.
    •High-tech industries in the United States, Japan, and Europe sounded the alarm, but it was impossible to break the Chinese monopoly on the supply of rare earths in the short term. As a consequence, rare earth prices increased sharply, an average of 10 times between 2009 and 2011. Prices of neodymium and dysprosium, which are in the highest demand, increased even more drastically. This price spike attracted global investors who were eager to invest in rare earth deposits.

    40 The End? Crude Oil Down the Drain 2016

    A perfect storm is brewing for the oil market. There is an economic slowdown and too much storage because of contango. The world seems to be floating in oil, whose price falls to 26 USD in February 2016. But the night is always darkest before dawn, and crude oil and other commodities find their multiyear lows.

    “Everybody be cool. You—be cool.” —Seth Gecko in From Dusk till Dawn
    “The crude oil supply glut is gone.” —Nick Cunningham, www.oilprice.com

    The Armageddon of the global financial crisis had been stopped by the massive bailouts and unconventional monetary policy of central banks around the world. As for oil, WTI crashed from almost 150 USD/barrel in June 2008 and traded temporarily below 33 USD during spring 2009. By the end of that year, crude prices had recovered to 80 USD, and between 2011 and 2014 the reference point for crude oil was 100 USD.
    But in hindsight, the summer of 2014 proved to be just the quiet before a massive storm: WTI fell from almost 110 USD to less than 26 USD—a drop of 76 percent, even lower than it had been during the financial crisis. (Actually it was the lowest level for crude prices since 2003.)
    Crude oil was not the only victim. The year 2016 began as an ugly one for all commodities as the Chinese domestic stock market plunged, and many other equity indices around the world followed in a case of Asian contagion. Demand in China was of fundamental importance for commodities because of demographics, growth, and the country’s immense raw material purchases. The US dollar retreated massively from highs of 100 on the Dollar Index, and raw material prices dropped further.

    Figure 39. Crude oil (WTI): recovery and bear market, 2008–2016. Data: Bloomberg, 2019.

    The massive price drop during the financial crisis had caused the term structure for crude oil to flip into contango, in which spot prices are below those of future delivery dates. It made more sense to store oil than to sell it, but the glut in supply overtaxed existing holding facilities, eventually leading to the use of supertankers as floating storage.
    By the end of summer 2015, crude inventories were still rising and prices had started to crash. In early 2016, storage levels had barely declined from their 80-year highs of 490 million barrels in the United States alone, leading to pessimism about the future.
    The International Energy Agency (IEA) noted that crude oil markets could “drown in over-supply” because of rising storage levels around the world. The agency said that the world had added 1 billion barrels of oil in storage in 2015, and storage levels were still rising. Even in the fourth quarter, normally when stocks are drawn down, inventories continued to climb.

    Crude oil crashed because of a massive global supply glut. Oil prices fell to less than 26 USD.

    There were dire warnings that the world could soon run out of storage space for oil, which would depress prices even further. Oil tumbled to its lowest level in more than 12 years, as the crude stockpiled at the delivery point for New York futures reached a record.
    On February 11, 2016, when the S&P 500 index posted a 12 percent loss on the year, the Baltic Dry Index—which measures the shipping activity of dry bulk cargos around the world—fell to an all-time low of 290. The activity in commodity markets came to a halt, and the Bloomberg Commodity Index posted a 30 percent loss on the year. However, February 11 marked the lows for many assets, and the markets began to improve in the weeks and months that followed.

    OPEC and Russia agreed to a joint production cut to fight the supply glut. Finally prices started to recover.

    Capitulation Price Levels

    In early February 2016, the S&P Goldman Sachs Commodity Index and Bloomberg Commodity Index, two important commodity market references, posted double-digit losses. Investors were devastated since 2015 had already been a bloodbath for commodities. Crude oil traded as low as 26 USD/barrel, copper below 2 USD/lb, and even gold traded as low as 1,050 USD/oz. Cryptocurrencies weren’t given much attention from investors at that time. Bitcoins, for example, had a bad year in 2015, trading below 200 BTC/USD, and started to recover in 2016.
    Gold was the first among the group of more than 20 commodities to indicate a turnaround, as prices started to climb, and exceeded its 200-day moving average rather quickly, a strong technical indicator for bullish markets.
    In the face of the massive supply glut, OPEC and Russia agreed to a joint cut in production. It was OPEC’s first agreed cut since 2008, when oil prices collapsed late in the year after hitting record levels during the summer. And it had the potential to restore some longer-term stability to the global oil market. The wild card was renewed production in the United States, pushed by shale oil and fracking on the back of rising prices. Some feared that this could simply end up prolonging the glut and pushing prices back down.
    But there was also evidence that the massive inventories of raw materials were declining, and demand was finally picking up. And demographic trends continued to support the rationale that more people in the world would require more commodities in the years ahead. Both classic economic theory and common sense dictate that as demand rises, inventories fall and prices rise.

    Figure 40. Commodity performance in 2016. Data: Bloomberg, 2019.

    Meanwhile commodity prices were rising, with gold leading the way. The precious yellow metal traded to more than 1,380 USD in the wake of Britain’s Brexit vote, and silver shot up above 21 USD. Crude oil rose from just above 26 USD per barrel in February to more than 50 USD at the beginning of October. The price of sugar increased from 10 US cents per pound in August 2015 to more than 24 US cents on September 29, 2016. The prices of iron ore, zinc, tin, nickel, and lead all posted double-digit gains in 2016. In perhaps the most optimistic signal for commodity markets, the Baltic Dry Index rose from 290 in February to 915 in early October, an increase of more than 215 percent.

    Crude oil prices doubled from their lows in 2009, and commodities started to shine again.

    It appeared that prices for raw materials had reached a significant bottom. Commodities as an asset class posted impressive gains, rising by more than 20 percent from its lows in 2016 to the end of the year. WTI more than doubled in that period to above 55 USD/barrel.
    Production cuts that had been in place since the start of 2017 helped halve the excess of global oil stocks, although, according to OPEC, those remained above the five-year average, at 140 million barrels. It was not until May 2018 that OPEC said the global oil supply surplus had nearly been eliminated.

    Key Takeaways
    •“Super-contango” had caused a massive supply glut in crude oil, during which storage facilities for WTI in Cushing, Oklahoma, reached maximum capacity: The world seemed to be floating in oil, and WTI crashed from almost 110 USD to less than 26 USD in February 2016—a drop of 76 percent and the lowest level for crude oil prices since 2003.
    •During 2016, the Chinese domestic stock market plunged, and many other equity indices around the world followed, leading commodity markets lower as well. However, in spring 2016, commodity markets found a bottom, and commodities as an asset class posted impressive gains over the full year, rising by more than 20 percent. The price of WTI more than doubled in that period to more than 55 USD/barrel.
    •Nevertheless, it would take until May 2018 until OPEC confirmed that the global oil supply surplus had nearly been eliminated.

    41 Electrification: The Evolution of Battery Metals 2017

    Elon Musk and Tesla are setting the pace for a mega trend: electrification! Demand from automobile manufacturers, utilities, and consumers pushes lithium-based battery usage to new heights. For commodity markets, it is not only lithium and cobalt but also traditional metals like copper and nickel that are suddenly in high demand again. Electrification might prove to be the “new China” for commodity markets in the long term.

    “Tesla is here to stay and keep fighting for the electric car revolution.” —Elon Musk

    The year 2016 issued a wake-up call for the automotive and oil industries. OPEC, the mighty oil cartel, massively revised its growth expectations for electric vehicles (EVs) upward by 500 percent. Instead of the 46 million EVs by 2040 it had envisioned in 2015, OPEC was now looking at a forecast of 266 million EVs.
    If those projections turn out to be correct, by 2040 demand for oil could fall by 8 million barrels a day. That is about what the United States currently produces in a day, or roughly 8 percent of global consumption. (The world consumes almost 100 million barrels of crude oil every day, of which 75 percent is related to the transportation sector.)

    Elon Musk and Tesla

    Elon Musk, founder and CEO of SpaceX, Tesla, and Neuralink, was born in Pretoria, South Africa, in 1971. As of February 2018, Musk had a net worth in excess of 20 billion USD and was listed by Forbes as the 53rd-richest person in the world. In December 2016, he was ranked 21st on the Forbes list of “The World’s Most Powerful People.” Musk also founded PayPal, which was bought by eBay for 1.5 billion USD in October 2002.
    Tesla, based in Palo Alto, California, specializes in electric vehicles (EVs), lithium-ion battery energy storage, and solar-panel manufacturing through its subsidiary company SolarCity. Tesla operates multiple production and assembly plants near Reno, Nevada, while its main vehicle-manufacturing facility is in Fremont, California. The Gigafactory in Reno primarily produces batteries and battery packs for Tesla vehicles and energy storage products. According to Bloomberg, over the past 12 months Tesla has been burning money at a clip of about 8,000 USD a minute (roughly 500,000 USD an hour).
    In 2017 Tesla produced and sold 100,000 cars. It might be the beginning of a revolution, but so far EVs are hardly making a dent. German automakers BMW, Mercedes, and Audi together sold 6.6 million cars, and for these traditional car companies, the electric catchup has just started. In Germany, new car registrations of EVs reached 55,000, half of which were plug-in hybrids. This represented 1.6 percent of the new car market, based on 3.4 million new cars in Germany. Compared to 43.8 million total cars in use in that country, it was basically a grain of sand in the desert.

    EVs made up 1.6 percent of new car registrations in car-crazy Germany in 2017. However, Bloomberg New Energy Finance estimates that by 2040, EVs will make up to 40 percent of global new car registrations—tremendous growth!

    Currently China makes up half of the global EV market, according to the International Energy Agency’s Global EV Outlook 2018. In 2017, China sold 579,000 EVs, a 72 percent increase compared to 2016. Meanwhile, the global stock of electric passenger cars exceeded 3 million last year.
    But compared to the bigger picture, that’s merely a drop of water in the ocean, since according to BMI Research, the global car fleet can be estimated at around 1.2 billion cars. And global sales of passenger cars are forecast to exceed 81 million vehicles in 2018. Along with China, the United States is among the largest automobile markets worldwide, in terms of both production and sales.
    Therefore, it is all about the future as automakers start to expand their business into the electric mobility sector. Bloomberg New Energy Finance (BNEF) estimates that by 2040, global EV penetration of new car registration could reach 35 to 40 percent.

    Figure 41. Cobalt prices, 2012–2018. Data: Bloomberg, 2019.

    For commodity markets, this might signal the beginning of an avalanche, as electric cars demand additional raw materials. For example, studies done by the investment bank UBS and BNEF suggest that by 2040 there will be a significant surplus demand for graphite, nickel, aluminum, copper, lithium, cobalt, and manganese. Other commodities, like crude oil, steel, as well as platinum and palladium, would be negatively affected.

    For commodity markets, the mega trend of electrification could turn out to be an enormous new source of demand.

    Prices for cobalt and lithium, which are both essential for different types of batteries, are experiencing a bull market. Lithium-based batteries first had commercial applications a couple of years ago. Now we have them in almost all mobile devices: laptops, smartphones, electric tools, and cars. Gigafactories have been ramped up in the United States and China, and battery prices are falling because of economics of scale and scope. That, in turn, triggers new applications.

    Figure 42. Benchmark Lithium Index, 2012–2018. Data: Benchmark Mineral Intelligence, 2019.

    Tesla might lose its leadership in electric cars, but Elon Musk kicked off a revolution in electrification and energy usage—a revolution that works to the good of humanity and, as a side benefit, will be good for commodity markets as well.
    The electrification of the automobile industry is a gigantic step, but only the tip of an iceberg. The ability to store energy is the missing link in growing alternative (wind, solar, and water) energy production. By 2025, power banks and power walls—instruments for decentralized energy storage at home, for example—might exceed sales for lithium-based batteries for the car industry. And this market is much bigger and promises much higher growth!

    Key Takeaways
    •There is a bull market for battery metals like lithium and cobalt, as battery-producing facilities shoot up like mushrooms. Prices for cobalt quadrupled from 25,000 to 100,000 USD per ton in 2017.
    •Elon Musk and Tesla are at the forefront of a mega trend in electrification. Although sales of electric vehicles today are minuscule, industry estimates peg them at 40 percent of global new car registrations by 2040. We might be witnessing the beginning of a revolution.
    •E-mobility is the first step, but energy storage is the missing link to alternative energy production by wind, sun, and water.
    •Together, e-mobility and energy storage might prove to be the “new China” for commodity markets in the long term, since demand is climbing not only for lithium and cobalt, but also for traditional metals like copper and nickel.

    42 Crypto Craze: Bitcoins and the Emergence of Cryptocurrencies 2018

    Bitcoins, the first modern cryptocurrency, emerged in 2009, described in a white paper the previous year by the pseudonymous Satoshi Nakamoto. The value of bitcoins explodes in 2017 from below 1,000 to above 20,000 USD, attracting worldwide attention. This stellar price rise, followed by a crash of almost 80 percent in 2018, makes bitcoins the biggest financial bubble in history, dwarfing even the Dutch tulip mania of the 17th century. Despite the boom and bust, the future looks bright, as underlying blockchain technology reveals its potential and starts to revolutionize daily life.

    “[Bitcoin/Blockchain] is the next major IT revolution that is about to happen.” —Steve “Woz” Wozniak, co-founder of Apple
    “With all of the calls of ‘bubble,’ it’s worth remembering that we’re in the early stages of global adoption as well as the early stages of development of the technology.” —Ari Paul, Forbes

    The punch came fast. Before boarding a flight to leave the country on April 1, 2018, Robert Farkas, co-founder of Centra Tech, was arrested by local criminal authorities in the United States. Half a year earlier, in September 2017, celebrity boxer Floyd Mayweather had posted happy pictures of himself living la dolce vita, spending money in expensive shops in Beverly Hills with his cryptocurrency-based Centra card.
    Farkas and his Centra Tech co-founder Sohrab “Sam” Sharma had claimed to offer a debit card, backed by Visa and Mastercard, that would allow people to convert cryptocurrency to US dollars to spend on everyday goods. The Securities and Exchange Commission alleged that Centra had no relationship with either card company. Sharma and Farkas had created fake biographies of fictional executives and paid celebrities to tout the upcoming initial coin offering (ICO)—an unregulated process by which a company can issue a new digital coin in exchange for real money—and the promise of quick riches on social media. Sharma and Farkas had swindled about 32 million USD from investors.
    Centra Tech is just one example of multiple scams and frauds in the crypto and ICO market in 2018, but it was dwarfed by other ICO scams like Modern Tech, which had made off with more than 660 million USD.
    It is still pioneer days in the technology sector, where ICOs are more popular and better known than companies’ traditional initial public offerings (IPOs). ICOs have quickly become a more important source of project funding than endless discussions with venture capital companies. There’s a dark side, however. The opportunities of a fast-developing market always attract fraud and black sheep. That is part of the game.

    The bitcoin was born in 2009. Today, more than 2,000 alternative coins exist.

    December 2018 is still the Wild West in an industry that is barely 10 years old. Bitcoins (BTC), described in a white paper in November 2008 and first released as open-source software in January 2009 by the pseudonymous Satoshi Nakamoto, are generally considered the first decentralized cryptocurrency. It was originally created as an alternative, decentralized payment method. Since then, more than 2,000 alternative coin variants have been created. Like Napster 10 years earlier, the system works without a central bank, as a peer-to-peer network in which transactions take place directly between users, without an intermediary. Blockchain is the technology behind cryptocurrencies, and it is fast becoming a platform for a vast number of innovations in peer-to-peer transactions.
    A blockchain is a cryptographically protected distributed ledger. It’s what protects you or anyone else from making a copy of that bitcoin you just bought. In fact, anything that you can make a mental list of, you can manage with blockchains—everything from tracking land and real estate ownership to the way we distribute medicine and how we grant certificates and diplomas. Some of these ideas are brilliant, while others are ridiculous.

    Digital Assets, Cryptocurrencies, and Tokens

    A digital asset is anything that exists in a binary format and comes with the right to use it, while the term “cryptocurrency” refers to coins that fulfill the characteristics of standard paper-based money (fiat money). The characteristics are its function as a store of value, a unit of account, and fungibility. Examples include bitcoin, ethereum’s ether, and ripple’s XRP. Note that ethereum and ripple refer to the underlying blockchain and not to their cryptocurrencies. Crypto tokens are similar to cryptocurrencies in that they are built on blockchains.
    Cryptocurrencies are the most common form of tokens, but crypto tokens are broader representations of a blockchain’s value. That value is manifested across a diverse range—from cryptocurrencies to loyalty points and even to assets built on the blockchain.
    Ethereum, for example, is the underlying blockchain for several tokens that use its platform to develop services and products. The difference between cryptocurrencies and crypto tokens becomes important within the context of investment. For example, cryptocurrency valuation is derived from a coin’s success in adhering to the characteristics of money. On the other hand, crypto token valuations depend on a different set of factors, such as protocol adoption and robustness.
    Originally, cryptocurrencies were designed to offer a decentralized alternative to traditional fiat currencies. Even at peak valuation in December 2017, bitcoins—plus the sum of all other cryptocurrencies a decade after their invention—represented just a fraction of physical money in US dollars, euros, pound sterling, or yen in terms of value. In volume, bitcoins are still by far the biggest cryptocurrency, followed by ether, ripple, and dash. In 2018, the 500 biggest coins had a combined market capitalization of 500 billion USD, of which bitcoins made up two-thirds. Physical US dollar notes in circulation are valued at 1.5 trillion USD, and that is only a minor fraction of the total US dollar supply. Next in line is physical gold, whose circulating value is estimated at 8 trillion USD, before taking the whole currency market into consideration. All fiat currencies together add up to a value of 83 trillion USD, which includes all physical money in circulation and electronic, that is, virtual money.
    Another important factor is the concentration of holdings. About 40 percent of bitcoins are held by perhaps 1,000 users. The top 100 bitcoin addresses control 17.3 percent of all the issued currency, according to Alex Sunnarborg, co-founder of the crypto hedge fund Tetras Capital. That’s important, since the cryptocurrency was designed to reach a maximum of 21 million bitcoins. Bitcoins are added by “mining,” a process by which transactions are verified and added to the public ledger. Currently, one bitcoin is added approximately every 10 minutes. With ether, the top 100 addresses control 40 percent of the supply, and with smaller currencies top coin holders control more than 90 percent because many of them are members of the teams running these projects.
    Bitcoins were first explained to the public as a form of digital money, and that is how its successors and competitors like litecoin and ether have been framed as well. Each of these currencies resembles traditional money in certain ways: They are abstractions of economic value and can be traded. But none of them offers the most basic role of a currency as a relatively stable medium of exchange. There is too much friction involved. Each transaction takes too long, uses too much energy, and involves too many risks.

    Bitcoins are more than digital money.

    The biggest problems with bitcoins have emerged because the mechanics of buying and holding them are so inscrutable that nearly everyone pays third parties to handle them. Those wallet-service middlemen become points of failure for the whole system. They get hacked, their systems go down, and they are ordered by governments and regulators to report transactions that users thought would be anonymous.

    The Mt. Gox Heist

    Launched in 2010 by Jed McCaleb, who later founded ripple, Mt. Gox, by 2013, had become the largest bitcoin exchange in the world. Based in Shibuya, an area in Tokyo, Japan, at that point Mt. Gox was handling more than 70 percent of all bitcoin transactions worldwide. In June 2011, when Mt. Gox was acquired by Mark Karpelès, the company was hacked the first time, and 2,000 bitcoins were stolen. As a consequence, a number of security measures were initiated, including arranging for a substantial number of bitcoins to be taken offline and held in cold storage. As a result of an investigation by the US Department of Homeland Security regarding the company’s license, the US government seized more than 5 million USD from Mt. Gox, and the company had to announce a temporary suspension of US dollar withdrawals. But that was not the biggest problem. As it turned out, the company had been the victim of an ongoing hack for more than two years.
    In February 2014, Mt. Gox suspended trading, closed its website and exchange service, filed for bankruptcy protection in Japan and the United States, and began liquidation proceedings soon after. The crypto exchange announced that approximately 850,000 bitcoins belonging to customers and the company were missing (valued today at 4.2 billion USD). Although 200,000 bitcoins were eventually recovered, the remaining 650,000 have never been found.
    CEO Mark Karpelès was arrested in August 2015 in Japan and charged with fraud and embezzlement and manipulating the Mt. Gox computer system to increase the balance in an account. US authorities followed the trail of money, and in July 2017 Alexander Vinnik was arrested in Greece and charged with playing a key role in the laundering of bitcoins stolen from Mt. Gox. Vinnik is alleged to be associated with BTC-e, an established bitcoin exchange, which was raided by the FBI as part of the investigation. The BTC-e site has been shut down, and the domain has been seized by the FBI. But no money has been found so far.
    What is a fair price for a bitcoin? Is it 1 or 100,000 USD? Some financial analysts today emphasize that bitcoins have no intrinsic value at all, and some economists refer to the Fisher equation, which pins the current value of a bitcoin to 20 to 25 USD in regard to the total available number of bitcoins, transaction speed, and trading volume. But it’s important to note that for this equation it is not the status quo but the future potential of the technology and application that is relevant for a bitcoin’s value. And it is hard to see limits to the application of blockchain technology.

    In May 2010 Laszlo Hanyecz bought two pizzas in Jacksonville, Florida, for 10,000 BTC. It was the first real-world bitcoin transaction.

    Bitcoins became a hot topic in 2017 in the financial mainstream because of tremendous price fluctuations. Let’s take a step back: Prices initially were measured in US cents and single-digit US dollars in the land of Dungeons and Dragons or World of Warcraft. But on May 22, 2010, Laszlo Hanyecz made the first real-world bitcoin transaction by buying two pizzas in Jacksonville, Florida, for 10,000 BTC, valuing one bitcoin at 0.003 USD. One year later, in spring 2011, bitcoins were traded at parity with US dollars. And six years after that, on December 17, 2017, bitcoins surpassed 20,000 USD for the first time.

    Bitcoins traded at 0.03 USD in May 2010 and above 20,000 USD in December 2017.

    That same month, in December 2017, the Chicago Mercantile Exchange (CME) introduced and listed futures contracts on bitcoins in the commodity segment, allowing a hot speculative bubble to unfold. Bitcoins became commoditized and open to new investors and the mainstream, beyond the niche of electronic wallets. Until then, bitcoin and other cryptocurrency trading had been limited to specialized exchanges like Bitfinex, Kraken, or OKCoin, where you had to exchange US dollars or euros into bitcoins with your electronic wallet, though bitcoins were exchangeable into any other cryptocurrency. From its high in December, bitcoins crashed to below 6,000 USD within two weeks.

    Figure 43. Price of bitcoins surpassed 1,000, 5,000, 10,000, and finally 20,000 USD in 2017. Data: Bloomberg, 2019.

    In December 2018, bitcoins tumbled below 3,500 USD to a 13-month low before stabilizing. The slide fueled a sell-off among rival tokens ether, litecoin, and XRP. After months of stability at around 6,000 to 6,500 USD, bitcoins and other cryptocurrencies had lost more than 700 billion USD in market capitalization since their peak in December 2017.
    Regulatory concerns played a role, as the US Securities and Exchange Commission announced penalties against two companies that hadn’t registered their initial coin offerings as securities. Also, the US Justice Department was in the process of investigating whether the previous year’s rally was fueled by market manipulation.
    As Robert Shiller noted in his book Irrational Exuberance, it is impossible to spot a bubble and time its burst if you are part of it. That is possible only in hindsight. But after the stellar rise from less than 1 USD before 2011 and the crash by almost 80 percent from its December 2017 peak, the verdict is official: The bitcoin craze is the biggest financial bubble in history! It even dwarfs the tulip mania of the 17th century, which had previously exceeded every historic financial market bubble, including the Mississippi or South Sea Bubble, the run-up in equity prices before the busts of the Great Depression and Black Friday, or—more recently—the dot-com bubble and the rally before the world financial crisis hit in 2008.

    It may comfort investors that an 80 percent crash is not a unique event in the crypto space. In the past five years, the value of bitcoins was cut in half three times, and crashed by more than 25 percent 16 times, only to rise to new highs until 2018. Think back . . . how many years did it take to recover your losses from the dot-com bubble? Measured by the NASDAQ Composite, on average that took about 15 years! In the past, recoveries in the crypto universe have been much faster.

    The year 2013 was a rough ride for bitcoins. And the Mt. Gox heist almost became an extinction event for the cryptocurrency.

    In percentage terms, the bitcoin crashes of 2013 were almost as bloody as 2018. Prices ran up from a couple of US dollars to more than 1,200 USD, before plummeting. In April 2013, bitcoin prices fell from 230 to 67 USD overnight, a massive 70 percent drop in 12 hours. It took seven months to recover. After April, bitcoin prices hovered around 100 to 120 USD until later in the year, when prices suddenly skyrocketed to 1,200 USD in late November. However, in December the price tumbled back to less than half of that.
    Adding to the long road of recovery after the collapse in December 2013 was the Mt. Gox scandal. Bitcoins steadily increased in price through January and February, when they suddenly dropped by nearly 50 percent from 880 to below 500 USD because of the Mt. Gox heist.

    Figure 44. Historic bitcoin price corrections, 2013–2017. Data: Coindesk.com.

    One of the results of the erratic price swings of 2013–2014 is the emergence of an active cryptocurrency trading scene with its own slang, a special language established by crypto enthusiasts. The term “HODL” is probably the best known. During a massive price crash in 2013, someone called “GameKyuubi,” apparently drunk, posted “I AM HODLING” in a Bitcoin Talk forum. What the user in the post wanted to convey was the fact that despite the sharp drop in price, he was choosing to hold on to his bitcoins. The post went viral, and #HODL has been interpreted as “Hold On for Dear Life,” which corresponds to “Buy & Hold,” an investment strategy every long-term investor can relate to.

    #HODL. Hold On for Dear Life.

    Crypto slang today is very colorful, with a multitude of new terms and phrases whose meanings go way beyond their traditional definitions. There are words and abbreviations such as “mooning,” “fudding,” ADDY, JOMO, BTFD, and DYOR—the list goes on and on. HODL, however, is by far the most popular of these terms, and one that almost all cryptocurrency investors can identify with.

    Anti-money-laundering measures and the Chinese ban on cryptocurrencies and ICOs weighed heavily on bitcoins in 2018.

    How does one account for the extraordinary bitcoin rally and its bust? Originally, bitcoins were founded to redistribute value and move money away from banks and other financial institutions to people. Anyone could become a bank, a payment service, or a lender. But bitcoins and other cryptocurrencies also became a loophole for money laundering and capital flight. Because of the low level of legal regulation, the use of cryptocurrency spread into the shadow economy. The implementation of an automatic exchange of information in 2017 led to last-minute panic as a new global standard on the automatic exchange of information targeted tax evaders. The new system provides for the exchange of non-resident financial account information with the tax authorities in the account holders’ country of residence. Data was exchanged for the first time in September 2017, but the majority of the 100-plus jurisdictions had implemented the system by January 1, 2018.

    The Top 5 Crypto Billionaires in 2018

    1.Chris Larsen (57), co-founder of ripple, owns 5.2 billion XRP, the token launched by ripple, whose current value is 8 billion USD.
    2.Joseph Lubin (53), co-founder of ethereum, has an estimated wealth of 1–5 billion USD.
    3.Changpeng Zhao (41), founder and CEO of Binance, the world’s largest cryptocurrency exchange, has an estimated wealth of 1–2 billion USD.
    4.Cameron and Tyler Winklevoss (36) were early investors in bitcoins and the founders of Gemini in 2015. Their estimated wealth is 0.9–1.1 billion USD.
    5.Matthew Mellon (45), an early investor in ripple’s XRP, has an estimated wealth of 0.9–1 billion USD.
    Source: Business Insider, 2018.

    Capital flight has also worried the government of China. By buying bitcoins, the Chinese have been able to move funds abroad. In September 2017, renminbi-to-bitcoin trades made up more than 90 percent of all bitcoin transactions. The government outlawed fiat money from being used in cryptocurrency purchases and even imposed travel bans on Huobi and OKCoin executives, two of the nation’s largest crypto exchanges. Chinese regulatory authorities also imposed a ban on ICOs and finally termed them illegal in China in September 2017. Huobi was forced to move its operations to Singapore, while OKCoin, renamed OKEx, was embraced by Malta. Many Chinese simply transferred their bitcoins to the now-offshore exchanges and carried on trading—until February 2018.
    That February, the People’s Bank of China (PBOC), which is the central regulatory authority, issued a statement that “it will block access to all domestic and foreign cryptocurrency exchanges and ICO websites,” basically shutting down all cryptocurrency activities in the country. And the authorities were not bluffing: In April 2018, police stormed a large-scale bitcoin mining operation in the city of Tianjin and confiscated 600 computers in the raid

    For bitcoins and blockchains, 2018 was like 1992 for the internet—early days. To reveal the cryptocurrency’s full potential, another 10 years are needed.

    The Chinese government has been successful in imposing stricter capital controls, banning bitcoin trading and ICOs, and shielding its people from bad influences by its Great Firewall. But China will not be able to turn back time for blockchain technology and its applications.
    The blockchains and cryptocurrencies will achieve their full potential in a decade, said Steve Wozniak, co-founder of Apple, in 2018, and according to Jack Dorsey, CEO of Twitter, bitcoins will become the world’s “single currency.” Previously, from 2014 to 2017, Jamie Dimon, CEO of JPMorgan Chase, was regularly quoted about his views of bitcoins: “Bitcoin is a fraud,” he said, as well as “Bitcoin will not survive,” and “Bitcoin is going nowhere.” In 2018, Jamie Dimon regretted that he had called bitcoin a fraud but still remained bearish. Meanwhile, earlier in that year, overwhelmed by client demand, JPMorgan Chase’s top rival, Goldman Sachs, announced the setup of a cryptocurrency trading desk.
    As for a distributed ledger technology like blockchain, its situation today is like that of the internet in 1992, with immense potential but a steep and messy learning curve. Every successful new technology undergoes an explosion of growth in which we try to use it for everything, until time reveals what the best applications and limitations are. Investing in dot-com stocks in the late 1990s was a roller-coaster ride, and many of the pioneers in that field ultimately failed. The real impact of the internet has taken decades to unfold, but the future of e-commerce and society has been changed forever.

    Blockchain technology has the potential to be just as impactful over time. Just as with the dot-com bubble, backing any single player in the crypto craze is like placing a bet on 27 red in a game of roulette. It is too early and the outcomes are too uncertain to identify potential winners. However, with the digital revolution we are experiencing right now, the economic landscape will be transformed in drastic ways. And, despite its sins of adolescence and the irrational exuberance of crypto trading’s early years, crypto tokens and blockchain technology have already begun to revolutionize our world. The applications in real estate, property, banking and financial services, and health care, just to name a few, are limitless and can only be compared with the development of the internet or the rise of smartphone applications. It might be that we are witnessing the first glimpse of a tokenized and coin-based economy. The future looks bright.

    Key Takeaways
    •Bitcoins were introduced in 2009 as an alternative, decentralized payment method using blockchain technology. Today more than 2,000 alternative coins (“altcoins”) exist.
    •Over 10 years the price of bitcoins rose from 0.003 USD in 2010 to 1 USD in 2011, to more than 1,000 USD in 2017. It exceeded 20,000 USD in December 2017, but within weeks, bitcoins dropped by almost 80 percent to below 3,500 USD in December 2018.
    •This tremendous boom and bust has made bitcoins the biggest financial bubble in history, greater even than the Dutch tulip mania of 1637.
    •The boom and bust of 2017–2018 has been associated with the Chinese ban on cryptocurrencies and ICOs, as well as anti-money-laundering measures like the implementation of automatic exchange of financial information in more than 100 countries. The beginnings of new disruptive technologies often attract black sheep and fraud, and many of the ICOs did turn out to be scams.
    •For bitcoins and blockchain applications, it is still early days. To reveal their true potential, another decade is needed. But from today’s perspective, the applications seem limitless.

    Outlook: The Dawn of a New Cycle and a New Era

    We are at the dawn of the 2020s and the commodity and crypto markets are in the starting blocks for a new rally. At the beginning of 2016, commodity investors looked back on five painful bear market years. In 2015, the Bloomberg Commodity Index, which measures the performance of 22 commodities like crude oil, gold, copper, wheat, and corn, lost 25 percent of value. And it got worse: In January 2016, commodity markets traded down an additional 7 percent. The Bloomberg Commodity Index was trading at its lowest level since its inception in 1991. Since spring 2014, investors had lost almost half of their invested funds. Investors in gold and silver mining companies, in particular, were hit hardest. The Arca Gold BUGS Index and Philadelphia Gold and Silver Index, both representing the biggest gold and silver mines, traded down to levels last reached at the beginning of 2000, when a troy ounce of gold was 260 USD.

    From summer 2011 to the beginning of 2016, investors saw 80 percent of their principal vanish into thin air, while gold in the same period traded down from above 1,900 USD to 1,050 USD (–45 percent). Mining in general suffered greatly. Market capitalization of companies included in the MSCI World Metals & Mining Index dropped by more than 80 percent since their peak valuation during the commodity super cycle in 2008. Shares of Glencore, the biggest mining and commodity trading company in the world, traded down to 67 GBP at the end of September 2015. From its highest prices in 2011, investors lost more than 80 percent of their capital. Compared to its closing price of 527 GBP for its initial public offering in May 2011, this represented a loss of shareholder value of almost 90 percent!
    Market exaggerations drove credit default swaps for mining companies into the stratosphere. For example, Glencore’s 2.5 percent yielding bond, maturing in 2019, dropped by 25 percent within three months to 75 US cents per dollar, offering a yield to maturity of more than 17 percent per year for investors. The same held true, for example, for bonds of Freeport-McMoRan, Teck Resources, First Quantum, or Lundin Mining, all large cap mining companies. Investors anticipated the bankruptcy of a whole industry.

    Figure 45. 50 years of commodity markets ups and downs. Did we see the beginning of a new bullish cycle in 2016? Data: Bloomberg, 2019

    .In retrospect, we witnessed capitulation levels at the beginning of the year 2016. However, bold investors were able to make a killing in commodities during an early recovery. Compared to January 2016, gold mines tripled in value in just half of a year while gold gained 30 percent. Shares of Glencore approached 300 GBP, quadrupling in value compared to its lows just a couple of months before.
    While commodity markets crumbled and value in mining evaporated, world equity and bond markets celebrated the time of their life. MSCI World increased steadily after its drop by almost 60 percent during the financial crisis of 2008–2009. In the United States, the Dow Jones and S&P 500 were both trading at all-time highs in late 2016 and continued their path of success until January 2018. At the same time, yields of 10-year bonds in the United States fell below 1.5 percent, while in Europe, German 10-year bonds dropped into negative territory. Bond investors woke up every day believing their party would never stop.
    Looking at the long-term relationship between equities and commodities by taking the ratio of S&P Goldman Sachs Commodity Index versus the S&P 500, one fact is striking: Relative valuation is extreme. Compared to equities, commodities have been stuck in the penalty box since the China-fueled commodity super cycle burst. Similar to the tech bubble 15 years ago, Alphabet (Google) today is valued equal to the aggregated market capitalization of all companies included in MSCI World Metals & Mining Index (more than 180 companies, including mining giants like BHP Group, Rio Tinto, Glencore, Vale, Barrick Gold, and Newmont Mining)! One has to ask: What is cheap, and what is expensive?

    Figure 46. Relative valuation of commodities versus equities. Buy commodities! Data: Bloomberg, 2019.

    Therefore, it is no surprise that after a severe five-year bear market, a 15 percent rise in commodity markets in 2016 passed the majority of investors unnoticed. From their intra-year lows, commodity market indices like the Bloomberg Commodity Index (BCOM), S&P Goldman Sachs Commodity Index (S&P GSCI), and Rogers International Commodity Index (RICI) all gained more than 25 percent and surpassed equity-index performance. Furthermore, metals and mining as well as oil and gas led the equity-index sector performance in the United States and Europe, but fund manager surveys show that investors continued to be massively underweighted in resources equities.
    Recent history aside, investors can refer to several commodity markets that are still in oversupply. But in terms of supply-demand imbalances following the boom of the commodity super cycle, the worst is behind us. Slashes of industry investments in mining, as well as in oil and gas, will have brutal results in 2020–2030, when natural depletion will combine with and outweigh reduced exploration and development expenditures. With fundamental market data for commodities just starting to improve, commodity prices reached a technical bottom. A shift of the 200-day moving average to the upside in April 2016 was a first positive sign for a bullish market environment in commodities in the future.
    In conclusion, 2016 might prove to have been the dawn of a new cycle for commodity investors, a multiyear period of rising prices, which also reflects healthy prospects for the global mining industry. In the coming years, new trends like battery metals for electrification, e-mobility, and the megatrend of digitalization, which includes cryptocurrencies, will become an important and enormous driver for productivity, growth, and commodity markets. Electric vehicles might not need gasoline or diesel, but demand for gold, copper, nickel, cobalt, lithium, and rare earths increases drastically. If this scenario holds true, we witnessed the beginning of a new cycle which can only be compared to the awakening of the Chinese economy almost 20 years ago. It is also the beginning of a more mature stage in blockchain and bitcoins, as the exuberance of the early years is gone and opens the path to future applications.

    Epilogue

    “Commodities tend to zig when the equity markets zag.” —Jim Rogers, commodity expert and co-founder of the Quantum Fund

    Let us take a short time trip back to the year 2001. The average price for a barrel of crude oil was 26 USD. In the course of the year, the price of a ton of copper dropped from 1,800 to below 1,400 USD. Gold traded between 255 and 293 USD per troy ounce and made its first serious attempt in modern times to jump above 300 USD.

    Prices for wheat and corn averaged 2.70 and 2.08 USD per bushel. The terror attacks of 9/11 on the World Trade Center and the Pentagon, which killed about 3,000 people, were the most traumatizing events in 2001. Although the head of Al-Qaeda, Osama bin Laden, was shot in an elite U.S military mission in 2011, the war against global terrorism still has not been won today, almost 20 years later. But at least a military victory against the Islamic State seems imminent. In the White House, Democrat Bill Clinton was replaced by Republican George W. Bush; 15 years later Republican Donald Trump took over the presidency from charismatic Democrat Barack Obama. Cynical observers note that 9/11 has been replaced by 11/9, the date Donald Trump’s election was announced.

    In 2001, commodities as a professionally recognized and investable asset class were still in their infancy. The Bloomberg Commodity Index, as a measure of commodity market performance, had been launched just a few years earlier, in 1998, as the Dow Jones AIG Commodity Index. Alternative investments in addition to traditional investments in equities and bonds have since become more fashionable, thanks to the investment strategies of endowment funds such as those at Yale and Harvard Universities. In 2005, Gary Gorton and K. Geert Rouwenhorst published “Facts and Fantasies about Commodity Futures,” which also helped anchor commodities as an integral part of a global asset allocation.

    At the end of 2001, China entered the World Trade Organization (WTO), an event that marked the beginning of rapid growth of the Chinese economy and caused massive turbulence for global commodity markets. Within a few years, China had evolved as a dominant factor in global commodity demand, and the commodity super cycle was born.

    Crude oil reached 147 USD per barrel, copper traded above 10,000 USD per ton, gold surpassed 1,900 USD per troy ounce, and wheat and corn shot up to 9.50 and 8.40 USD per bushel. But depression followed euphoria in the form of years of sluggish growth in the aftermath of the global financial and economic crisis. The year 2008 was an annus horribilis for global capital markets, as equity and commodity markets dropped by more than 50 percent. A period of deleveraging and sluggish growth followed a nonsustainable recovery. Thereafter, commodity markets faced five years of a severe bear market.
    Today, approaching 2020, we are witnessing the starting point of a new commodity bull market and a maturing of the market for cryptocurrencies. The exuberance of the commodity super cycle is gone, invested assets are rising again for the first time in years, and commodity market performance is up ahead of equities. The price of a barrel of oil tested a low of 26 USD during spring 2016 but has since nearly tripled from that level. Copper traded in excess of 6,000 USD per ton. Gold rose above 1,300 USD per troy ounce. In the agricultural sector, wheat and corn prices averaged 4.80 and 3.60 USD per bushel. From a technical perspective, bottom building was completed in 2016, as commodities went above their 200-day moving average and created a bullish chart pattern in 2017. Nevertheless, even at the start of 2019 the majority of commodities still traded way below their medium- to long-term average prices, and bitcoins are in a phase of bottom-building.
    In hindsight, 2016 proved to be the turning point for commodities, as fundamentals started to improve, prices recovered, and the way was cleared for a new market cycle.
    The 42 chapters of this book show, on the one hand, that commodity market speculation was not invented in this decade. On the contrary, in the 1980s and 1990s commodities had only disappeared from investors’ radar screens, while the 1970s also saw tremendous commodity price spikes. Many of the episodes described here—from the Dutch tulip mania in the 17th century to the fantastic rise and fall of bitcoins in the 21st century—show how dramatically temporary imbalances on the supply or demand side can affect individual commodity markets. The real economic consequences should not be underestimated, as unlike stocks, bonds, or currencies, commodities are real assets. Political unrest and failing governments because of high food prices in Africa, which led to the Arab Spring, or current instabilities in Venezuela and Brazil due to low oil prices, are only two examples.
    Tulips and bitcoins are linked as the two biggest financial bubbles in history, despite nearly 400 years between them. Meanwhile markets and events have given rise to 40 fantastic stories from the commodity world. The wheel of time continues to turn, and due to the cyclical nature of commodity markets, extreme events are doomed to repeat themselves, albeit in a modified form. Each market is determined in its extreme phase by greed and fear; and the short memory of capital markets is proverbial anyway.
    The episodes summarized in this book are meant to highlight the booms and busts of commodity and crypto markets. Besides extreme price fluctuations, this book aims to show an insider’s perspective on speculation, gains, and losses that determine individual fates. The extent and velocity of price spikes are stunning, even for long-term investors. Linking commodity market events over several hundred years demonstrates the parallels among events in the past and prepares us for future developments including blockchain and bitcoins.

    Glossary of Terms

    AddyShort version of “address,” usually meaning your public key or the address of your crypto wallet. A bitcoin address is used to send and receive bitcoin transactions. The address is made up of a sequence of letters and numbers but can also be represented as a QR code.
    AgflationA period of rising food prices caused by increased demand for agricultural commodities, as was seen for both food and biofuels in 2007–2008. The word is a combination of the terms “agriculture” and “inflation.”
    AltcoinAltcoins or coins are alternative cryptocurrencies launched after bitcoins. Today there are more than 4,000 altcoins, which differ from bitcoins in various ways. An example of an altcoin is litecoin.
    Backwardation and ContangoIn finance, the difference between a spot (or cash) price and future prices defines the term structure. Backwardation occurs when the price for future delivery is lower than the spot price (e.g., the price of crude oil delivered in 3 months is 60 USD/barrel and the spot price is 70 USD/barrel). Contango occurs when the price for future delivery is higher than the spot price (e.g., the price of gold delivered in 1 year is 1,400 USD/oz and the spot price is 1,300 USD/oz). Contango is common for financial futures and gold, whereas backwardation is often seen in commodity markets and implies a positive carry for investors.
    BlockchainA blockchain is a growing list of records, called blocks, that are linked using cryptography. Blockchain is a form of Distributed Ledger Technology (DLT), which is a consensus of replicated, shared, and synchronized digital data geographically spread across multiple sites, countries, or institutions. There is no central administrator or centralized data storage.
    Bull and Bear MarketIn finance, the terms bull and bear market describe the general direction of a market. The use of “bull” and “bear” derives from the way the animals attack their opponents. A bull thrusts its horns up into the air, while a bear swipes its paws downward. These actions are metaphors for the movement of a market. If the trend is up, it’s a bull market. If the trend is down, it’s a bear market. A bear market usually is defined when prices drop to 20 percent or more below their recent top, while a smaller price decline is considered to be a correction.
    BTCBitcoin (BTC, or). A cryptocurrency, a form of electronic money, 1 bitcoin is divided into 1,000 millibitcoins and 100,000,000 satoshis. A bitcoin is currently worth about 4,000 USD.
    BTFDAn abbreviation for “Buy The Fucking Dip,” a stock market term to buy stocks or other assets during a price correction.
    Cornering a MarketIn finance, cornering a market consists of obtaining sufficient control of an asset—for example, a stock, currency, or commodity—in an attempt to manipulate the market price. Control usually means to have a dominant share in ownership.
    (Market) CrashA crash in stocks, commodities, or cryptocurrencies is a sudden dramatic decline of prices across a significant cross-section of the market, resulting in a significant loss of paper wealth. Crashes are driven by panic as much as by underlying economic factors. They often follow speculative stock market bubbles.
    CryptocurrencyA cryptocurrency is a digital asset designed to work as a medium of exchange that uses a high level of cryptography to secure financial transactions, control the creation of additional units, and verify the transfer of assets. Cryptocurrencies are an alternative and digital currency, which use decentralized control as opposed to the centralized digital currency and central banking systems of fiat currencies. The most popular cryptocurrency is bitcoin. The most common categorization of cryptocurrencies are alternative cryptocurrency coins (altcoins) and tokens (which are not meant to be a medium of exchange).
    DYORAn abbreviation for “Do Your Own Research.” It is used often in internet forums and blogs as a reminder for readers to do their own research on a subject, rather than take everything they read at face value.
    Fiat CurrencyA “regular” or “normal” currency today, such as the US dollar, euro, or pound sterling. Fiat money is a currency without intrinsic value that has been established as money, often by government regulation, and is backed by the government. (The term fiat comes from the Latin for “let it be done.”) This approach differs from money whose value is underpinned by some physical good such as gold or silver (the “gold standard”) or economic value like some cryptocurrencies.
    FOMO / JOMOAn abbreviation for “Fear of Missing Out.” It is defined as a fear of regret, which may lead to a compulsive concern that one might miss an opportunity for social interaction, a novel experience, a profitable investment, or other satisfying events. FOMO perpetuates the fear of having made the wrong decision. JOMO, on the other hand, describes the “Joy of Missing Out,” the antithesis of FOMO.
    FUDThis describes the spreading of “Fear, Uncertainty, and Doubt,” typically through the media. It’s a disinformation strategy broadly used in politics, public relations, sales, marketing, and investing. Generally, FUD is a strategy to influence perception by disseminating negative or false information and a manifestation of the appeal to fear.
    Gold and SilverGold (symbol AU, from the Latin aurum) and silver (symbol AG, from the Latin argentum) are precious metals that have been used for thousands of years as a measure of value. Since the sixth century BCE, gold and silver have been minted as coins. In the past, a gold or silver standard was often implemented as a base of monetary policy. Officially, the world gold standard was abandoned for a fiat currency system after 1971 (the “Nixon Shock”).
    Gold StandardThe gold standard is a monetary system where a country’s currency or paper money has a value directly linked to gold. (Variations include the silver standard or bimetallic standard.) Most nations abandoned the gold standard as the basis of their monetary systems at some point, although many hold substantial gold reserves. After World War II, a system similar to a gold standard was established by the Bretton Woods Agreements. Under this system, many countries fixed their exchange rates relative to the US dollar, and central banks could exchange dollar holdings into gold at the official exchange rate of 35 USD per ounce. All currencies pegged to the US dollar thereby had a fixed value in terms of gold. In August 1971, President Nixon ended the convertibility of US dollars into gold, which marked the beginning of the fiat currency system of floating exchange rates.
    HODLAn abbreviation for “Hold On for Dear Life.” HODL was originally a typo, originated in a December 2013 post on the Bitcoin Forum during a price crash. It became very popular within the cryptocurrency community as encouragement for holding the cryptocurrency rather than selling it (buy and hold).
    ICOAn Initial Coin Offering (ICO) is a type of funding using cryptocurrencies. In an ICO, a quantity of cryptocurrency is sold in the form of tokens to investors in exchange for legal tender or other cryptocurrencies such as bitcoins or ether. ICOs can be a source of capital for startup companies and can usually avoid regulatory compliance and intermediaries such as venture capitalists, banks, and stock exchanges.
    Long and ShortIn trading, an investor can take two types of positions: long and short. An investor can either buy an asset (going long), or sell it (going short). In a long (buy) position, the investor is hoping for the price to rise. In a short position, the investor hopes for and benefits from a drop in the price of the asset. Entering a short position is a bit more complicated than purchasing the asset.
    MooningIn the cryptocurrency world, mooning refers to an instant surge in pricing in a positive way. If someone says, “the bitcoin is mooning,” it means the price of a bitcoin has surged instantly for a certain time.
    Pump and DumpThis is a form of securities fraud that involves artificially inflating the price of an owned stock through false and misleading positive statements, in order to sell the cheaply purchased stock at a higher price. Once the operators of the scheme dump—that is, sell—their overvalued shares, the price falls and investors lose their money. False or misleading information can be spread by spam email, social media, internet forums, or blogs. The scheme is most common with small cap cryptocurrencies and very small exchange listed corporations, that is, microcaps.
    Rare Earth Metals or Rare Earth ElementsA set of 17 elements, specifically 15 lanthanides as well as scandium and yttrium. These are: cerium, dysprosium, erbium, europium, gadolinium, holmium, lanthanum, lutetium, neodymium, praseodymium, promethium, samarium, scandium, terbium, thulium, ytterbium, and yttrium. A common distinction differentiates between light rare earth elements and heavy rare earth elements. Rare earth elements are used in many high-tech applications, like electric motors of hybrid vehicles, wind turbines, hard disc drives, portable electronics, microphones, and speakers.
    SatsShort for “satoshi,” the smallest fraction of a bitcoin. There are 100,000,000 satoshis in a bitcoin. The term derives from the pseudonym of bitcoin inventor Satoshi Nakamoto. Currently, 10,000 sats are equivalent to 65 US cents.
    Strong and Weak HandsIn finance, strong hands refer to well-financed investors or speculators, typically long-term holders who are unlikely to exit their position based on small market movements. Weak hands refer to the opposite.
    Rogue TraderA trader who makes unauthorized trades, often in the gray area between civil and criminal transgression. A rogue trader may be a legitimate employee of a company yet enter into transactions on behalf of his or her employer without permission.
    Tokens(Crypto) tokens are a digital representation of a particular asset or utility and a category of cryptocurrencies. Tokens can represent basically any asset that is fungible and tradeable, such as property or real estate, commodities, loyalty points, or even other cryptocurrencies.
    USDThe US dollar (USD, or $) is the official currency of the United States of America and its territories. Dollar is also the name of more than 20 currencies, including those of Canada, Australia, and New Zealand. One US dollar is generally divided into 100 US cents.
    WalletIf you want to store bitcoins or any other cryptocurrency, you will need to have a digital wallet. A cryptocurrency wallet is a software program that stores private and public keys and interacts with various blockchains to enable users to send and receive digital currency and monitor their balance. There are various forms of wallets: online, offline, hardware, and paper, all with varying levels of security.
    WhaleThe term “whale” is frequently used to describe a very big player or a very big investor in the market. The ocean is a metaphor for the market, since one can then extend it to include big fish and small fish, sharks, waves as the market moves, and so forth.

    List of Abbreviations

    BMOBank of Montreal
    BTCBitcoin
    CADCanadian Dollar
    CBOTChicago Board of Trade
    CHFConfoederatio Helvetica Franc, or for short, Swiss Franc
    CMEChicago Mercantile Exchange
    ct.Carat
    DOEDepartment of Energy
    EURThe euro is the official currency of 19 of 28 member states of the European Union (EU).
    EVsElectric Vehicle(s)
    FAOFood and Agricultural Organization
    GBPPound Sterling (Great Britain Pound)
    ICEIntercontinental Exchange
    IEAInternational Energy Agency
    kgKilogram
    lbPound
    LIFFELondon International Financial Futures Exchange
    LMELondon Metal Exchange
    LNGLiquefied Natural Gas
    LTCMLong-Term Capital Management
    NOKNorwegian Krona
    NYMEXNew York Mercantile Exchange
    MMBtuMillion British Thermal Units
    OECDOrganisation for Economic Co-operation and Development
    OPECOrganization of the Petroleum Exporting Countries
    ozTroy Ounce
    RBCRoyal Bank of Canada
    USDUS Dollar
    USDAUS Department of Agriculture
    WTIWest Texas Intermediate (crude oil)

    List of Figures

      Figure 1.Rice. Candlestick chart in USD/cwt 2016, Chicago Board of Trade (CBOT). Data: Bloomberg, 2019.
      Figure 2.Crude oil prices 1861–2018, in USD/barrel (real prices of 2015). Data: BP Statistical Review of Energy, 2019.
      Figure 3.Prices for soybean oil, 1960–1964, in US cents/lb, Chicago Board of Trade. Data: Bloomberg, 2019.
      Figure 4.Wheat prices, 1970–1977, in US cents/bushel, Chicago Board of Trade. Data: Bloomberg, 2019.
      Figure 5.Gold-silver ratio, 1973–2013. Data: Bloomberg, 2019.
      Figure 6.Crude oil prices, 1965–1986, in USD/barrel. Data: Datastream, 2019.
      Figure 7.Diamond prices, 2003–2016. Prices indexed over different sizes and qualities. Data: PolishedPrices.com, Bloomberg, 2019.
      Figure 8.Silver prices, 1970–1982, in USD/troy ounce. Data: Bloomberg, 2019.
      Figure 9.Crude oil prices, 1989–1991, in USD/barrel. Data: Bloomberg, 2019.
    Figure 10.Crude oil future term structure in 1993/1994, in USD/barrel. Data: Bloomberg, 2019.
    Figure 11.Silver prices, 1994–2008, in USD/troy ounce. Data: Bloomberg, 2019.
    Figure 12.Silver, Pan American Silver, and Apex Silver, 1998–2009. Performance indexed 1998. Data: Bloomberg, 2019.
    Figure 13.Copper in US cents/lb, 1995–1997. Data: Bloomberg, 2019.
    Figure 14.Share price of Bre-X, 1992–1997, in Canadian dollars (CAD). Data: Bloomberg, 2019.
    Figure 15.Palladium in USD/ounce, 1998–2004. Data: Bloomberg, 2019.
    Figure 16.Copper prices in USD/ton, 2003–2007, London Metal Exchange (LME). Data: Bloomberg, 2019.
    Figure 17.Zinc prices in USD/ton, 2003–2006, London Metal Exchange (LME). Data: Bloomberg, 2019.
    Figure 18.Natural gas prices in USD/MMBtu, 2003–2007, New York Mercantile Exchange. Data: Bloomberg, 2019.
    Figure 19.Price spread between natural gas March and April 2007 delivery, in USD/MMBtu, New York Mercantile Exchange. Data: Bloomberg, 2019.
    Figure 20.Future term structure of natural gas in USD/MMBtu, 2010, New York Mercantile Exchange. Data: Bloomberg, 2019.
    Figure 21.Frozen orange juice concentrate prices in US cents/lb, 2002–2006.Data: Bloomberg, 2019.
    Figure 22.Norwegian salmon prices in NOK/kg, 2000–2011. Data: Bloomberg, 2019.
    Figure 23.Steel prices in USD/ton, 2000–2010. Data: Bloomberg, 2019.
    Figure 24.Wheat prices in US cents/bushel, 2005–2008, Chicago Board of Trade. Data: Bloomberg, 2019.
    Figure 25.Natural gas prices in USD/MMBtu, 2003–2007, New York Mercantile Exchange. Data: Bloomberg, 2019.
    Figure 26.Platinum prices in USD/troy ounce, 2004–2009. Data: Bloomberg, 2019.
    Figure 27.Rice prices in US cents/cwt, 2000–2010, Chicago Board of Trade. Data: Bloomberg, 2019.
    Figure 28.Wheat prices in US cents/bushel, 2007–2008, Chicago Board of Trade. Data: Bloomberg, 2019.
    Figure 29.Crude oil (WTI) term structure in USD/barrel, 2008. Data: Bloomberg, 2019.
    Figure 30.Price spread of crude oil January (CLF9) and December 2009 (CLZ9) in USD/barrel. Data: Bloomberg, 2019.
    Figure 31.Baltic Dirty Tanker Index, 2002–2010. Data: Bloomberg, 2019.
    Figure 32.Sugar prices in US cents/lb, 1970–2010. Data: Bloomberg, 2019.
    Figure 33.Cocoa prices in USD/ton, 1990–2012. Data: Bloomberg, 2019.
    Figure 34.Copper and share price of First Quantum Minerals, 2009–2010. Data: Bloomberg, 2019.
    Figure 35.BP share price fluctuation during first half of 2010. Data: Bloomberg, 2019.
    Figure 36.Cotton prices in US cents/lb, 2005–2013. Data: Bloomberg, 2019.
    Figure 37.Glencore (GBP). Equity price performance since IPO on May 19, 2011. Data: Bloomberg, 2019.
    Figure 38.Rare earth carbonate, neodymium, dysprosium, and lanthanum, 2010–2013. Chinese onshore prices in RMB, indexed 30.12.2009=100. Data: Bloomberg, 2019.
    Figure 39.Crude oil (WTI): recovery and bear market, 2008–2016. Data: Bloomberg, 2019.
    Figure 40.Commodity performance in 2016. Data: Bloomberg, 2019.
    Figure 41.Cobalt prices, 2012–2018. Data: Bloomberg, 2019.
    Figure 42.Benchmark Lithium Index, 2012–2018. Data: Benchmark Mineral Intelligence, 2019.
    Figure 43.Price of bitcoins surpassed 1,000, 5,000, 10,000, and finally 20,000 per USD in 2017. Data: Bloomberg, 2019.
    Figure 44.Historic bitcoin price corrections, 2013–2017. Data: Coindesk.com.
    Figure 45.50 years of commodity markets ups and downs. Did we see the beginning of a new bullish cycle in 2016? Data: Bloomberg, 2019.
    Figure 46.Relative valuation of commodities versus equities. Buy commodities! Data: Bloomberg, 2019.

    References

    1.Tulip Mania: The Biggest Bubble in History (1637)

    Dash, M. Tulpenwahn. Die verrückteste Spekulation der Geschichte. München: Claasen Verlag, 1999.

    Friedmann, J. “Tulpen-Wahn in Holland—Wie die große Gartenhure Investoren verrückt machte.” www.spiegel.de, 1 August 2009.

    von Petersdorff, W. “Eine Blumenzwiebel für 87.000 Euro.” www.faz.net, 18 March 2008.

    2.The Dojima Rice Market and the “God of Markets” (1750)

    Mattheis, P. “Der Reishändler.” SZ-Serie: Die großen Spekulanten 39. www.sueddeutsche.de, 28 October 2008.

    Needham, J. “Samurai trader!” www.financialsense.com, 20 January 2008.

    3.The California Gold Rush (1849)

    Bojanowski, A. “Neuer Goldrausch in Kalifornien—‘Es ist wie 1849.’” www.sueddeutsche.de, 17 June 2008.

    “Going to California—49ers and the Gold Rush.” http://americanhistory.about.com, 2008.

    “Gold Rush.” The California State Library, www.library.ca.gov/goldrush, 2007.

    4.Wheat: Old Hutch Makes a Killing (1866)

    “B. P. Hutchinson dead—once leading grain speculator in this country.” The New York Times, 17 March 1899.

    Ferris, W. G. The Grain Traders. The Story of the Chicago Board of Trade. East Lansing: Michigan State University Press, 1988.

    Geisst, Charles. Wheels of fortune—The history of speculation to respectability. Hoboken, NJ: John Wiley & Sons, 2002.

    “The great speculator fails—Mr. Hutchinson leaves Chicago and his trades closed out.” The New York Times, 30 April 1891.

    Teweles, R. J., and Jones, F. J. The Futures Game—Who Wins? Who Loses? And Why? New York: McGraw-Hill, 1987.

    5.Rockefeller and Standard Oil (1870)

    King, B. W. “John D. Rockefeller und das Zeitalter des Öls.” http://finanzen.coart.de/BrsenKnowHow/Geschichtliches, 18 August 2006.

    Kunz, M. “Reichster und meistgehasster Mann der Welt.” www.focus.de, 23 May 2008.

    6.Wheat: The Great Chicago Fire (1872)

    Ferris, W. G. The Grain Traders: The Story of the Chicago Board of Trade. East Lansing: Michigan State University Press, 1988.

    Geisst, C. Wheels of fortune—The history of speculation to respectability. Hoboken, NJ: John Wiley & Sons, 2002.

    “The wheat corner—sudden collapse of the grain gamblers’ schemes in Chicago loss of the clique over USD 1,000,000.” The New York Times, 23 August 1872.

    7.Crude Oil: Ari Onassis’s Midas Touch (1956)

    “Aristoteles Onassis—Reicher Mann ganz arm.” www.stern.de, 13 January 2006.

    “Kalkuliertes Risiko.” Der Spiegel 29(1978), www.spiegel.de.

    Seebach, W. “König Saud und Aristoteles Onassis.” Die Zeitwww.zeit.de, 17 June 1954.

    8.Soybeans: Hide and Seek in New Jersey (1963)

    Food and Agriculture Organization of the United Nations (FAO), www.fao.org, December 2008.

    “The man who fooled everybody.” www.time.com, 4 June 1963.

    Miller, N. C. The Great Salad Oil Swindle. Baltimore: Penguin Books, 1965.

    “Wall Street: spreading the losses.” www.time.com, 6 December 1963.

    9.Wheat: The Russian Bear Is Hungry (1972)

    “Another Soviet grain sting.” www.time.com, 28 November 1977.

    The Food and Agriculture Organization of the United Nations (FAO), www.fao. org, December 2008.

    Mattheis, P. “Der Turtle-Chef.” SZ-Serie: Die großen Spekulanten (33), www.sueddeutsche.de, 29 January 2008.

    Peters, M., Langley, S., and Westcott, P. “Agricultural commodity price spikes in the 1970s and 1990s.” United States Department of Agriculture (USDA), March 2009, www.ers.usda.gov.

    10.The End of the Gold Standard (1973)

    Schulte, T. “Silber—das bessere Gold.” Kopp Verlag, 2010.

    “Die Silber-Panik” (1893). http://zeitenwende.ch.

    “US-Bundesstaaten wollen einen Gold- und Silberstandard.” www.bullion-investor.net, 7 March 2010.

    11.1970s—Oil Crisis! (1973 & 1979)

    “Die Ölkrise 1973.” http://zeitenwende.ch, 2009.

    Organization of the Petroleum Exporting Countries (OPEC), www.opec.org, 2008.

    US Department of Energy, www.eia.doe.gov, 2008.

    12.Diamonds: The Crash of the World’s Hardest Currency (1979)

    Grill, B. “Herr der Diamanten.” www.zeit.de, 2 October 2003.

    “Im Griff des Syndikats.” Der Spiegel 44 (1989), www.spiegel.de.

    Kühner, C. “A diamond’s best friend—Antwerpen, Weltzentrum des Diamantenhandels.” NZZ Folio, December 1993.

    Schulz, B. “Nicholas Oppenheimer—Der Diamantenkönig.” www.faz.net, 22 October 2006.

    13.“Silver Thursday” and the Downfall of the Hunt Brothers (1980)

    Boehringer, S. “Aufstieg mit Öl, Absturz mit Silber.” SZ-Serie: Die großen Spekulanten 17, www.sueddeutsche.de, 14 May 2008.

    “Die Gebrüder Hunt verzocken sich am Silbermarkt.” www.faz.net, 26 February 2004.

    14.Crude Oil: No Blood for Oil? (1990)

    “Fünf Jahre Irak-Krieg—Chronik eines umstrittenen Feldzugs.” www.spiegel.de, 17 March 2008.

    “Der Golfkrieg 1991.” www.faz.net, 24 February 2001.

    Pollack, K. “Der gefährlichste Mann der Welt.” Der Spiegel 6 (2003), www.spiegel.de.

    Pollack, K. The Threatening Storm—The Case for Invading Iraq. New York: Random House, 2002.

    Thumann, M. “Trotz Blut kein Öl.” www.zeit.de, 16 June 2009.

    15.The Doom of German Metallgesellschaft (1993)

    Knipp, T. Der Machtkampf. Der Fall Metallgesellschaft und die Deutsche Bank. Düsseldorf: Econ Verlag, 1998.

    Landler, M. “Spotlight: Heinz Schimmelbusch’s comeback.” www.nytimes.com, 10 August 2007.

    ”Metallgesellschaft reports talks with ex-chief fail.” New York Times, 5 April 1996.

    “Missmanagement bei Metallgesellschaft.” www.manager-magazin.de, 28 August 2001.

    16.Silver: Three Wise Kings (1994)

    Chasan, E. “Apex Silver Mines files for bankruptcy protection.” www.reuters.com, 14 January 2009.

    Fuerbringer, J. “Buffett likes silver; Soros, a silver mine.” www.nytimes.com, 26 March 1998.

    Morgenson, G. “Gates putting some money in silver miner.” www.nytimes.com, 29 September 1999.

    The Silver Institute, www.silverinstitute.org.

    Weitzman, H. “Morales pledges to nationalize mining industry in Bolivia.” www.ft.com, 9 May 2006.

    17.Copper: “Mr. Five Percent” Moves the Market (1996)

    Bastian, N. “Kupferfinger sucht einen neuen Job.” www.handelsblatt.com, 12 December 2005.

    www.kupferinstitut.de.

    Neidhart, C. “Hamanaka—der Vorstadt-Spießer.” SZ-Serie: Die großen Spekulanten 2. www.sueddeutsche.de, 29 January 2008.

    18.Gold: Welcome to the Jungle (1997)

    Behar, R. “Jungle Fever.” Fortune, 9 June 1997.

    BHP Billiton, Minerals Companion, 2006

    “Goldenes Grab.” Der Spiegel 16 (1997), www.spiegel.de.

    Goold, D., and Willis, A. The Bre-X Fraud. Toronto: McClelland & Stewart, 1997.

    19.Palladium: More Expensive Than Gold (2001)

    Frank, R. “Eine Seltenheit: Palladium-Münzen.” www.moneytrend.at, January 2001.

    United Nations Conference on Trade and Development (UNCTAD), Market Information in the Commodities Area (InfoComm), www.unctad.org/infocomm.

    Wolf, C. “Palladium—Rasante Rekordjagd.” www.focus.de, 18 January 2001.

    20.Copper: Liu Qibing Disappears Without a Trace (2005)

    “Bad bets in the copper market.” www.economist.com, 18 November 2005.

    Busch, A. “China treibt den Kupferpreis von allen Seiten in die Höhe.” www.handelsblatt.com, 12 December 2005.

    Hoffbauer, A. “Die diskreten Kontrakte des Herrn Liu.” www.handelsblatt.com, 12 December 2005.

    Mortished, C. “City gripped by mystery of the phantom copper dealer.” The Times, 15 November 2005.

    Powell, B. “Buy! Sell! Run!” www.time.com, 20 November 2005.

    21.Zinc: Flotsam and Jetsam (2005)

    BHP Billiton, Minerals Companion, 2006.

    International Lead and Zinc Study Group, www.ilzsg.org, 2009.

    London Metal Exchange, www.lme.co.uk, 2009.

    “A user guide to commodities.” Deutsche Bank, September 2008.

    “Zinc in New Orleans flooded warehouses.” Reed Business Information, 2009.

    “Zinc price soars after New Orleans supply freeze.” www.telegraph.co.uk, 7 September 2005.

    “Zinc under supply tightness.” Metalworld, September 2005.

    22.Natural Gas: Brian Hunter and the Downfall of Amaranth (2006)

    “Amaranth trading led to MotherRock loss.” Bloomberg, 25 June 2007.

    Energy Information Administration, www.eia.doe.gov, 2009.

    “Hedge-Fonds hat angeblich fünf Milliarden Dollar verwettet.” www.handelsblatt. com, 19 September 2006.

    “Hedge-Fonds MotherRock schließt.” www.handelsblatt.com, 7 August 2006.

    “In sieben Tagen 4,5 Milliarden Dollar Verlust.” www.manager-magazin.de, 19 September 2006.

    “Milliardenverlust von Hedge-Fonds läßt Märkte kalt.” www.fazfinance.net, 20 September 2006.

    US Department of Energy, www.energy.gov, 2009.

    Copeland, R. “Ten years after blowup, Amaranth investors waiting to get money back.” Wall Street Journalwww.wsj.com/articles/ten-years-after-blowup-amaranth-investors-still-waiting-for-money-back-1451524482, 1 January 2016.

    23.Orange Juice: Collateral Damage (2006)

    “Orange juice falls.” The New York Times, 22 January 2004.

    “Orange juice rises.” The New York Times, 14 August 2004.

    www.flcitrusmutual.com.

    www.nws.noaa.gov.

    US Department of Agriculture (USDA). Situation and Outlook for Orange Juice. www.fas.usda.gov, February 2006.

    24.John Fredriksen: The Sea Wolf (2006)

    Bomsdorf, B. “John Fredriksen—Milliardär und Tankerkönig.” www.welt.de/wirtschaft/article1799093/John-Fredriksen-Milliardaer-und-Tankerkoenig.html, 14 March 2008.

    “Kathrine und Cecilie Astrup Fredriksen Schnappen sich diese schönen Milliardärs-Töchter TUI?” www.bild.de/politik/wirtschaft/kaufen-diese-schoenen-milliardaers-toechter-tui-11713918.bild.html, 2 July 2010.

    “Lachsfieber: Brisante Recherchen über einen Nahrungsmittelgiganten.” www.ardmediathek.de.

    OECD-FAO: Agricultural Outlook 2011–2012. www.fao.org.

    25.Lakshmi Mittal: Feel the Steel (2006)

    Feel the Steel is the logo of Pittsburgh Steelers (www.steelers.com).

    “Arcelor und Mittal. Stahl-Giganten einigen sich auf Fusion.” www.spiegel.de/wirtschaft/arcelor-und-mittal-stahl-giganten-einigen-sich-auf-fusion-a-423475.html, 25 June 2006.

    “Der größte Stahlproduzent der Welt entsteht.” http://www.faz.net/aktuell/wirtschaft/rohstoffe-der-groesste-stahlproduzent-der-welt-entsteht-1192255.html, 25 October 2004.

    James, J. “Steel’s new spring.” Time magazine, www.time.com, 31 October 2004.

    Kanter, J., Timmons, H., and Giridharadas, A. “Arcelor agrees to Mittal takeover.” www.nytimes.com/2006/06/25/business/worldbusiness/25iht-steel.html, 25 June 2006.

    Kroder, T. “Lakshmi Mittal: Der Stahlbaron aus Indien.” www.ftd.de, 25 October 2004.

    www.arcelormittal.com.

    “Lakshmi Mittal ‘Stahl-Maharadscha’ mit Familiensinn.” www.stern.de/wirtschaft/news/lakshmi-mittal–stahl-maharadscha–mit-familiensinn-3498140.html, 27 January 2006.

    “Mittal/Arcelor Fusion perfekt.” http://www.manager-magazin.de/unternehmen/artikel/a-428605.html, 26 July 2006.

    Zitzelsberger, G. “Fusion der Stahlgiganten. Ein moderner Maharadscha.” www.sueddeutsche.de/wirtschaft/fusion-der-stahlgiganten-ein-moderner-maharadscha-1.819924, 5 December 2008.

    26.Crude Oil: The Return of the “Seven Sisters” (2007)

    Hoyos, C. “The evolution of the Seven Sisters.” www.ft.com/content/2103f4da-cd8e-11db-839d-000b5df10621, 11 March 2007.

    Hoyos, C. “The new Seven Sisters: oil and gas giants dwarf western rivals.” www.ft.com/content/471ae1b8-d001-11db-94cb-000b5df10621, 12 March 2007.

    “Petro-China—Das teuerste Unternehmen der Welt.” www.faz.net, 5 November 2007.

    “The Seven Sisters still rule.” www.time.com, 9 September 1978.

    Vardy, N. “The new Seven Sisters: today’s most powerful energy companies.” https://seekingalpha.com/article/30922-the-new-seven-sisters-todays-most-powerful-energy-companies, 28 March 2007.

    27.Wheat and the “Millennium Drought” in Australia (2007)

    “Dried up, washed out, fed up.” The Economist, 4 October 2007.

    “Dramatische Dürre.” www.spiegel.de, 20 April 2007.

    “Dürre in Australien.” www.faz.net, 10 November 2006.

    “Dürre in Australien.” www.stern.de, 2 January 2007.

    “Dürre treibt Bauern in den Selbstmord.” www.stern.de, 24 October 2006.

    “Extremwetter—Jahrtausend-Dürre in Australien.” www.spiegel.de, 7 November 2006.

    International Grains Council (IGC), www.igc.org.uk, 2009.

    “Der Weizenpreis läuft von Rekord zu Rekord.” www.faz.net, 26 February 2008.

    28.Natural Gas: Aftermath in Canada (2007)

    “BMO Financial hikes commodity-trading loss view.” Reuters, May 2007.

    “BMO says commodity-trading losses to dent profit.” Reuters, April 2007.

    “Ex-BMO trader gets fine.” www.thestar.com, 7 November 2009.

    “How did BMO’s USD450M loss just materialize?” Financial Post, April 2007.

    29.Platinum: All Lights Out in South Africa (2008)

    Cotterill, J. “S Africa power monopoly too big to fail.” Financial Times, 6 February 2019.

    “Eskom says SA needs ‘at least’ 40 new coal mines.” www.mg.co.za, 8 August 2009.

    Johnson Matthey, www.matthey.com, 2009.

    London Platinum and Palladium Market, www.lppm.org.uk, 2009.

    “Stromausfall in Südafrika erreicht Rohstoffmärkte.” www.fazfinance.net, 25 January 2008.

    30.Rice: The Oracle (2008)

    Müller, O. “Angst vor Hungersnot—Hoher Reispreis macht Asien nervös.” www.handelsblatt.com, 9 April 2008.

    “USA rechnen mit mehr als 100.000 Toten.” www.focus.de, 7 May 2008.

    31.Wheat: Working in Memphis (2008)

    “Rohstoffmärkte sind spekulativ überhitzt.” www.faz.net, 6 March 2008.

    “Rogue trader rocks firm—Huge wheat futures loss stuns MF Global.” www.chicagotribune.com, 29 February 2008.

    32.Crude Oil: Contango in Texas (2009)

    Baskin, B. “Oil stored at sea washes out rallies.” http://online.wsj.com, 5 February 2009.

    Bayer, T. “‘Super-Contango’—Unternehmen bunkern Öl.” www.ftd.de, 8 December 2008.

    Hecking, C., and Bayer, T. “Abgeschmiert in der Prärie.” www.ftd.de, 19 January 2009.

    33.Sugar: Waiting for the Monsoon (2010)

    Abraham, T. K. “World sugar shortage to extend a third year.” Bloomberg, 29 January 2010.

    Hein, C. “Indien betet für einen stärkeren Monsun.” www.faz.net, 12 August 2009.

    Kazim, H. “Dürre bedroht Indiens Wirtschaft.” www.spiegel.de, 18 August 2009.

    Lembke, J. “Der Zuckerpreis ist kaum zu stoppen.” www.faz.net, 7 August 2009.

    Mai, C. “Zuckerpreis erreicht 25-Jahres-Hoch.” www.ftd.de, 3 August 2009.

    Merkel, W. “In Indien und Australien wird die Dürre noch größer.” www.welt.de, 24 September 2009.

    Stern, N. “Ernteausfälle in Indien treiben Zuckerpreis.” http://diepresse.com, 16 August 2009.

    34.Chocolate Finger (2010)

    “Kakao als Spielball der Spekulation.” www.faz.net, 20 July 2010.

    Marron, D. “The cocoa corner: Is Choc Finger down USD 150 million?” http://seekingalpha.com, 26 July 2010.

    Murugan, S. “What’s driving cocoa?” http://seekingalpha.com, 4 August 2010.

    “Sweet dreams. A hedge fund bets big on chocolate.” www.economist.com/finance-and-economics/2010/08/05/sweet-dreams, 7–13 August 2010.

    Werdigier, J., and Creswell, J. “Trader’s cocoa binge wraps up chocolate market.” www.nytimes.com, 24 July 2010.

    35.Copper: King of the Congo (2010)

    “Congo—Africa’s disaster.” www.independent.co.uk/voices/editorials/leading-article-congo-africas-disaster-2013789.html, 30 June 2010. “Kongo will mehr von eigenen Rohstoffen profitieren.” www.gtai.de, 24 June 2010.

    MacNamara, W., and Johnson, M. “Disquiet over ENRC’s purchase of Congo assets.” www.ft.com/content/19fe6f94-b791-11df-8ef6-00144feabdc0, 3 September 2010.

    MacNamara, W., and Thompson, C. “Congo seizes First Quantum Minerals’ assets.” www.ft.com/content/27d6e104-b530-11df-9af8-00144feabdc0, 31 August 2010.

    Thompson, C., and MacNamara, W. “ENRC buys into disputed Congo project.” www.ft.com/content/870a8b2a-acda-11df-8582-00144feabdc0, 21 August 2010.

    36.Crude Oil: Deep Water Horizon and the Spill (2010)

    “780 Millionen Liter—die bisher größte Ölpest aller Zeiten.” www.zeit.de/wissen/umwelt/2010-08/bp-oelloch-leck-verzoegerung, 3 August 2010.

    Bethge, P., and Meyer, C. “Die Alptraum-Bohrung.” www.spiegel.de/spiegel/a-713063.html, 23 August 2010.

    “Ölkatastrophe im Golf von Mexiko Alarm auf Bohrinsel war offenbar abgeschaltet.” www.spiegel.de/wissenschaft/natur/oelkatastrophe-im-golf-von-mexiko-alarm-auf-bohrinsel-war-offenbar-abgeschaltet-a-708247.html, 24 July 2010.

    “Ölpest im Golf von MexikoAuch BP macht die Katastrophe jetzt Angst.” www.stern.de/panorama/wissen/natur/oelpest-im-golf-von-mexiko-auch-bp-macht-die-katastrophe-jetzt-angst-3284936.html, 30 May 2010.

    “Ölpest im Golf von Mexiko BP-Experten durchtrennen leckendes Öl-Rohr.” www.spiegel.de/wissenschaft/natur/oelpest-im-golf-von-mexiko-bp-experten-durchtrennen-leckendes-oel-rohr-a-698597.html, 3 June 2010.

    “‘Static Kill’ erfolgreich. BP stopft Öl-Bohrloch.” www.stern.de/panorama/wissen/natur/-static-kill–erfolgreich-bp-stopft-oel-bohrloch-3537142.html, 4 August 2010.

    37.Cotton: White Gold (2011)

    Cancryn, A., and Cui, C. “Flashback to 1870 as cotton hits peak.” www.wsj.com/articles/SB10001424052748704300604575554210569885910, 16 October 2010.

    Cui, C. “Chinese take a cotton to hoarding.” www.wsj.com/articles/SB10001424052748704680604576110423777349298, 29 January 2011.

    Industrievereinigung Chemiefaser e.V. (IVC), www.ivc-ev.de.

    National Cotton Council of America, www.cotton.org.

    Pitzke, M. “Preisexplosion bei Baumwolle Das Ende der Billig-Jeans.” http://www.spiegel.de/wirtschaft/unternehmen/preisexplosion-bei-baumwolle-das-ende-der-billig-jeans-a-696579.html, 25 May 2010.

    United States Department of Agriculture, www.usda.gov.

    White, G. “Cotton price causes ‘panic buying’ as nears 150-year high.” www.telegraph.co.uk/finance/markets/8301886/Cotton-price-causes-panic-buying-as-nears-150-year-high.html, 4 February 2011.

    Wollenschlaeger, U. “Baumwolle: Auf Rekordpreise folgt Rekordproduktion.” www.textilwirtschaft.de/business/unternehmen/Baumwolle-Auf-Rekordpreise-folgt-Rekordproduktion-69081?crefresh=1, 9 March 2011.

    38.Glencore: A Giant Steps into the Light (2011)

    Ammann, D. “King of Oil.” Orell Füssli Verlag, Zurich, 2010.

    Ammann, D. “Marc Rich: Der mann, der seinen Namen verlor.” www.weltwoche.ch, 23 May 2007.

    Honigsbaum, M. “The Rich list.” In The Observerwww.guardian.co.uk, 13 May 2001.

    “Rohstoffhändler Marc Rich gestorben.” www.srf.ch/news/wirtschaft/rohstoffhaendler-marc-rich-gestorben, 27 June 2013.

    Schärer, A. “Die Erben des Marc Rich.” www.woz.ch, 13 December 2001.

    “Warum Marc Rich bei Madoff rechtzeitig ausstieg.” www.tagesanzeiger.ch/wirtschaft/unternehmen-und-konjunktur/Warum-Marc-Rich-bei-Madoff-rechtzeitig-ausstieg/story/30815433, 27 January 2011.

    39.Rare Earth Mania: Neodymium, Dysprosium, and Lanthanum (2011)

    Quote from: J. Perkowski, Behind China’s Rare Earth Controversyhttp://www.forbes.com/sites/jackperkowski/2012/06/21/behind-chinas-rare-earth-controversy/#e5aaecd16b82, 21 June 2012.

    Blank, G. “Wichtiger Rohstoff Seltene Erden. Knappheit made in China.” www.stern.de/digital/computer/wichtiger-rohstoff-seltene-erden-knappheit-made-in-china-3874186.html, 29 December 2010.

    “Chinas schwere Hand auf den seltenen Erden.” www.nzz.ch/chinas_schwere_hand_auf_den_seltenen_erden-1.8096711, 22 October 2010.

    Geinitz, C. “Streit mit China um seltene Erden spitzt sich zu.” www.faz.net/aktuell/wirtschaft/rohstoffe-streit-mit-china-um-seltene-erden-spitzt-sich-zu-13091.html, 25 October 2010.

    Jung, A. “Rohstoffe. Wettlauf der Trüffelschweine,” www.spiegel.de/spiegel/print/d-75159727.html, 15 November 2010.

    Liedtke, M., and Elsner, H. “Seltene Erden,” Bundesanstalt für Geowissenschaften und Rohstoffe.” www.bgr.bund.de, 20 November 2009.

    Lohmann, D. “Kampf um Seltene Erden. Hightech-Rohstoffe als Mangelware.” www.scinexx.de/dossier-540-1.html, 13 May 2011.

    Mayer-Kuckuk, F. “Strategische Metalle China verknappt Molybdän-Förderung.” www.handelsblatt.com/finanzen/maerkte/devisen-rohstoffe/strategische-metalle-china-verknappt-molybdaen-foerderung/3579078.html?ticket=ST-1201086-huIl3W7cP5RSMLdwDNFj-ap3, 1 November 2010.

    40.The End? Crude Oil Down the Drain (2016)

    Cunningham, N. “OPEC: the oil glut is gone.” https://oilprice.com/Energy/Crude-Oil/OPEC-The-Oil-Glut-Is-Gone.html, 14 May 2018.

    Cunningham, N. “The world is not running out of storage space for oil.” https://oilprice.com/Energy/Energy-General/The-World-Is-Not-Running-Out-Of-Storage-Space-For-Oil.html, 21 January 2016.

    Dennin, T. “The dawn of a new cycle in commodities.” Research Paper, Tiberius Asset Management AG, April 2016.

    EIA. “Crude oil prices to remain relatively low through 2016 and 2017.” www.eia.gov/todayinenergy/detail.php?id=24532, 13 January 2016.

    El Gamal, R., Lawler, A., and Ghaddar, A. “OPEC in first joint oil cut with Russia since 2001,” Saudis take ‘big hit.’” www.reuters.com/article/us-opec-meeting-idUSKBN13P0JA, 30 November 2016.

    Raval, A. “‘Oil market glut will persist through 2016,’ says IEA.” www.ft.com/content/e27ff724-717e-11e5-9b9e-690fdae72044, 13 October 2015.

    Shenk, M. “WTI crude falls to 12-year low at $26.14 per barrel.” www.bloomberg.com/news/articles/2016-02-10/oil-holds-losses-near-3-week-low-amid-record-cushing-supplies, 11 February 2016.

    41.Electrification: The Evolution of Battery Metals (2017)

    Autoverkäufe 2017. “Mercedes fährt BMW und Audi davon.” cwww.abendblatt.de/wirtschaft/article213089441/BMW-verkauft-so-viele-Autos-wie-nie.html, 12 January 2018.

    BNEF New Energy Outlook, https://about.bnef.com/new-energy-outlook, 16 August 2018.

    Hull, D., and Recht, H. “Tesla doesn’t burn fuel, it burns cash.” www.bloomberg.com/graphics/2018-tesla-burns-cash, 3 May 2018.

    Kraftfahrtbundesamt, www.kba.de.

    42.Crypto Craze: Bitcoins and the Emergence of Cryptocurrencies (2018)

    Akolkar, B. “China officially bans all crypto-related commercial activities.” 22 August 2018, https://bitcoinist.com/china-officially-bans-crypto-activities/.

    “Comparing 25 of the biggest cryptocurrencies.” World Economic Forum, March 2018, www.weforum.org/agenda/2018/03/comparing-the-25-most-notable-cryptocurrencies.

    “Cryptoprimer.” www.investopedia.com/tech/crypto-primer-currencies-commodities-tokens/#ixzz5HfVcEWBS.

    Kharif, O. “The bitcoin whales: 1,000 people who own 40 percent of the market.” https://www.bloomberg.com/news/articles/2017-12-08/the-bitcoin-whales-1-000-people-who-own-40-percent-of-the-market, 8 December 2017.

    Kharpal, A. (2017): “Founders of a cryptocurrency backed by Floyd Mayweather charged with fraud by SEC.” www.cnbc.com, 3 April 2017.

    Lee, J. “Mystery of the $2 billion bitcoin whale that fueled a selloff.” https://www.bloomberg.com/news/articles/2018-09-13/mystery-of-the-2-billion-bitcoin-whale-that-fueled-a-selloff, 13 September 2018.

    Meyer, D. “China enlists its ‘great firewall’ to block bitcoin websites.” http://fortune.com/2018/02/05/bitcoin-china-website-ico-block-ban-firewall/, 5 February 2018.

    Paul, A. “It’s 1994 In cryptocurrency.” www.forbes.com/sites/apaul/2017/11/27/its-1994-in-cryptocurrency/#7a81d58eb28a, 27 November 20017.

    Potter, S., and White, T. “No end in sight for crypto sell-off as bitcoin breaches $4,250.” www.bloomberg.com/news/articles/2018-11-20/no-end-in-sight-for-crypto-sell-off-as-tokens-take-fresh-hit.

    Shiller, R. “Irrational exuberance.” Crown Business, 9 May 2006.

  • Torsten Dennin《From Tulips to Bitcoins_ A History of Fortunes Made and Lost in Commodity Markets》16-30

    16 Silver: Three Wise Kings 1994

    Warren Buffett, Bill Gates, and George Soros show their interest in the silver market in the 1990s—investing in Apex Silver Mines, Pan American Silver, and physical silver. It is silver versus silver mining. Who would lead and who would lag?

    “The financial markets generally are unpredictable.” —George Soros

    At the beginning of May 2006, Bolivia’s leftist president Evo Morales practiced a little saber rattling as he threatened to nationalize the country’s domestic mining industry. A lot of silver was at stake, given Bolivia’s two important mines, San Cristóbal (part of Apex Silver Mines) and San Bartolomé (Coeur d’Alene Mines). (Morales had already implemented nationalization of the natural gas industry a week earlier.) In reaction, the stock prices of Apex Silver fell dramatically. From a price of 26 USD in April, the stock plunged to below 13 USD by June. It was a demonstration of how risky investments in mineral resources can be because of politics.

    Some Facts About Silver

    Silver is about 20 times more common than gold, with the most significant deposits found in North and South America. According to industry figures, there are only 25 relevant silver mines worldwide, and half of their sales are generated by precious metal production. The overwhelming share of global silver production is coupled to the extraction of other metals, especially lead, zinc, copper, or gold. According to the Silver Institute, industrial applications account for about 50 percent of total demand, followed by jewelry and photography.
    For standardized silver trading on commodity exchanges, the ticker XAG stands for the price of a troy ounce of silver in USD. The center of physical silver trade is the London Bullion Market, and the London Bullion Market Association (LBMA) fixes an official price once a day. COMEX, part of the New York Mercantile Exchange, is the largest trading place for futures and options on silver. There silver futures are traded under the symbol SI, followed by the contract month and year (e.g., SIH0, Silver March 2020 Futures).
    It’s not always clear, however, where the best investments lie. In the mid- and late 1990s, Warren Buffett, George Soros, and Bill Gates all entered the silver market as major professional investors, and their actions attracted attention within the international financial community. Like the three kings in the Bible, these men inspired private and institutional investors to follow their lead. However, though Soros, Buffett, and Gates all invested in silver, they used different instruments—physical silver and equity investments in silver-mining companies.

    Figure 11. Silver prices, 1994–2008, in USD/troy ounce. Data: Bloomberg, 2019.

    George Soros, born in Hungary in 1930, is known for the success of his Quantum Fund—a hedge fund founded by him and Jim Rogers—and for his bets in 1992 against the pound sterling, which forced the Bank of England to depreciate its currency. Today his net worth is estimated by Forbes to be around 14 billion USD. At the end of 1994, Soros invested in Apex Silver Mines and, together with his brother Paul, temporarily held more than 20 percent of the company. Founded in 1993, Apex owned 65 percent of San Cristóbal, a silver-zinc-lead mine in southwestern Bolivia that was estimated to contain 450 million ounces of silver. Apex also was active in Argentina, Bolivia, Mexico, and Peru.
    Warren Buffett, also born in 1930, is the third-richest man in the world, with an estimated net private wealth of about 47 billion USD. As CEO of Berkshire Hathaway, an investment holding company he founded, he has demonstrated outstanding investment success over decades. The annual general meetings of the firm are reported to be a “Woodstock for investors,” with more than 20,000 people following every statement by the “Oracle of Omaha,” as Buffett is known.

    In the mid- and late 1990s, Warren Buffett, George Soros, and Bill Gates all got involved in the silver market.

    William “Bill” Henry Gates III, born in 1955, founded the Microsoft Corporation together with Paul Allen in 1975 and has a fortune of 53 billion USD, which made him the second-richest man in the world before he began to donate large amounts to charitable causes. In 1999 Gates got involved in Pan American Silver as the third big investor in the silver market after Soros and Buffett.
    Buffett tried a different strategy. In 1998, before official publication of its annual financial statements, Berkshire Hathaway announced that the company had acquired a total of 130 million troy ounces of silver between July 25, 1997, and January 12, 1998. That was about 4,000 metric tons of silver, which accounted for about 20 percent of the global annual mine production. For Berkshire Hathaway, however, this represented a mere 2 percent of its total invested capital.
    The investment in the physical metal surprised the international financial community, as Buffett had always been known for his value-oriented equity investment style. In this case his rationale was based on the discrepancy between supply and demand in the metal over the previous few years and a significant decline in inventories. The increase in silver price that followed proved him right. His investment was very profitable.
    As for Bill Gates, it became public in September 1999 that through Cascade Investment LLC he had purchased more than three million shares of Pan American Silver at an average price of about 5.25 USD. This represented 10 percent of the company, which was founded in 1994 and which now had a portfolio of silver-mining projects in Mexico, Peru, Bolivia, and Argentina.
    Looking at the price performance of silver versus share price performance of Apex Silver and Pan American Silver since 1997, an interesting picture emerges.

    Figure 12. Silver, Pan American Silver, and Apex Silver, 1998–2009. Performance indexed 1998. Data: Bloomberg, 2019.

    By the end of 2008, silver was performing the best, followed by the share price of Pan American Silver. Although Apex Silver shares first traded in line with silver and with Pan American Silver, it later crashed: It fell 90 percent between its IPO in 1997 and the end of 2008. Bankruptcy followed. What had happened?

    When Bolivian president Morales threatened mining companies with nationalization, investors panicked.

    President Morales’s threat to nationalize Bolivian mining projects unsettled investors. Actually, in place of a direct nationalization, the tax burden in Bolivia was heavily increased. Nevertheless, Apex Silver was forced to a sell part of its flagship asset to Sumitomo. Developing the San Cristóbal Mine became more and more expensive, as the cost of energy exploded. In order to obtain credit, Apex Silver had to sell futures in high quantities of silver, zinc, and lead. As commodity prices rose, these hedges led to increasing losses, and in January 2009 the company announced bankruptcy.

    So which investment was better? The share price of both Apex Silver and Pan American Silver temporarily outperformed silver, because annual production and the value of total mineral resources in the ground had a leverage effect. But leverage is the price investors pay for entrepreneurial and market risk. And when compared to Apex Silver, an investment in physical silver proved to be the much safer bet.

    Key Takeaways
    •Warren Buffett, Bill Gates, and George Soros became interested in the opportunities offered by the silver market in the 1990s.
    •Over a decade, the price of silver climbed from below 4 USD to more than 8 USD in 1997. It reached 22 USD in 2008.
    •Silver mining companies seemed to offer a much higher return than a direct investment in silver, but this higher expected return came with a price.
    •Because of the rising silver price, Bolivian president Evo Morales threatened to nationalize his country’s domestic mining industry. Shares of Apex Silver crashed by more than 90 percent from its IPO in 1997, followed by bankruptcy.

    17 Copper: “Mr. Five Percent” Moves the Market 1996

    The star trader of Sumitomo, Yasuo Hamanaka, lives two lives in Tokyo, manipulating the copper market and creating record earnings for his superiors but also carrying on risky private trades. In the end, Sumitomo endures a record loss of 2.6 billion USD, and Hamanaka is sentenced to eight years in prison.

    “Who is Mr. Copper?” Investopedia

    For years Yasuo Hamanaka was the head trader at Sumitomo Trading in Tokyo, the commodity trading subsidiary of Japanese conglomerate Sumitomo. In insider circles he was known by his nicknames—“Copper Fingers” or “Mr. Five Percent,” because he controlled as much as 5 percent of the global copper market. He earned huge profits for his company. However, on June 5, 1996, Hamanaka revealed that he’d lost 1.6 billion USD of his company’s money. Since then, the Sumitomo scandal has been considered one of the biggest financial frauds in recent history.

    Some Copper Basics

    The global production of copper, which is used mainly in construction and electrical and mechanical engineering, is around 20 million metric tons. Chile is the largest producer, with about one-third of the world’s output, followed by Indonesia, the United States, and Australia. Copper can be recycled and reprocessed almost without loss of quality, and along with aluminum, it is the most frequently traded industrial metal. The two most important exchanges are the London Metal Exchange (LME) and the New York Mercantile Exchange (NYMEX). At LME copper trades in US dollars per ton; at NYMEX, in US cents per pound. In the United States, the ticker symbol is HG, followed by the contract month and year (e.g., HGZ9, for copper with delivery in December 2019). Currently copper costs 2.80 USD per pound, or 5,600 USD per ton.
    In 1985 Yasuo Hamanaka, a 37-year-old expert in copper trading on the commodity futures markets, was hired by the Sumitomo Corporation in Tokyo. His department suffered a considerable loss in the mid-1980s, but the head of trading, and later Hamanaka himself, managed to conceal it with secret trades. Contrary to company tradition in which a trader changed position after a certain period of time, Hamanaka remained at his post for 11 years, because he generated such high profits.

    The Japanese trader Yasuo Hamanaka was a dominant factor in global copper. But he lost his bet against China.

    Any allegations about market manipulation and fraud from the LME went unheeded, while Hamanaka’s influential comments about rising copper demand and the occurrence of an artificial shortage were often published in the financial press. Even as Sumitomo’s star trader was making a modest impression, however, he was actually living a double life, professionally and privately. During the day he officially traded for Sumitomo; secretly at night he traded for himself on the LME and NYMEX. He lived with his family of four in a small house in Kawasaki, an unattractive Tokyo suburb, and drove a small car. But he enjoyed expensive trips with a lover from the Ginza entertainment district and—of course—had a Swiss bank account.
    Beginning in 1993, Hamanaka recognized that the Chinese economy was developing an enormous demand for copper due to its fast industrialization, and he bet that prices would rise. However, the Chinese put the market under pressure by talking down the price. Hamanaka’s losses started to pile up. He faked balance sheets, trading reports, and his superiors’ signatures in order to obtain additional credit lines to increase his positions and move the market in the “right” direction. But the Chinese seemed in no hurry to buy. By the end of 1995 and the beginning of 1996, the situation was slowly becoming critical. Now mentally unstable, Hamanaka was drinking heavily.
    In June 1996, the star trader had no choice but to admit the extent of his losses: Uncovered futures positions came to 1.8 billion USD. Shocked, Sumitomo dismissed Hamanaka, and in a panic it liquidated all positions. This caused another 800 million USD in losses for the company, as the price of copper dropped by 27 percent in a single day due to the sheer volume of the sales orders. In the end, the Sumitomo Corporation realized a loss of 2.6 billion USD, the biggest ever for a single company in the international financial markets.

    By liquidating copper futures positions it could not cover, the Sumitomo Corporation faced a loss of 2.6 billion USD.

    Figure 13. Copper in US cents/lb, 1995–1997. Data: Bloomberg, 2019.

    Afterward, reporters wondered how a single trader could have concealed such an unprecedented loss from his superiors. Obviously, internal audits, risk management, and supervision at Sumitomo had failed because, despite the immense transaction volume, none of Hamanaka’s superiors knew about his deals in detail. As for Hamanaka himself, the public considered him a criminal offender. He admitted his guilt in court and was sentenced to eight years’ imprisonment in 1998.

    Key Takeaways
    •Yasuo Hamanaka began trading copper for the Japanese conglomerate Sumitomo in 1985. Because of the size of his orders, and his control of up to 5 percent of the global copper market, Hamanaka earned the nicknames “Copper Fingers” and “Mr. Five Percent.”
    •After 1993, Hamanaka bet on rising copper prices caused by increasing Chinese demand, but when prices continued to fall, he lost money. Hoping that prices would recover, Hamanaka continued to hide his cumulative losses through secret trades.
    •In 1996, however, Hamanaka was forced to reveal a loss of 1.8 billion USD. Shocked, his superiors ordered all positions to be sold immediately, which caused a 27 percent drop in copper prices in a single day and resulted in an additional loss for Sumitomo of 800 million USD.
    •The Sumitomo copper scandal in Japan of 1996 was one of the biggest financial frauds in history; a single person caused a loss of 2.6 billion USD.

    18 Gold: Welcome to the Jungle 1997

    In the jungle of Borneo, the Canadian firm Bre-X supposedly finds a gold deposit with a total estimated value of more than 200 billion USD. Large mining companies and Indonesian president Suharto all want a piece of the pie, but in March 1997 the discovery turns out to be the largest gold fraud of all time.

    “Geologically, it’s the most brilliant thing I’ve ever seen in my life! It’s so big, it’s scary. It’s f***ing scary!” —John Felderhof, Bre-X
    “This can’t be a scam! Do some more tests! Figure it out! I know it’s there, okay?” —Peter Munk, Barrick Gold

    St. Paul is a remote community with roughly 5,000 inhabitants northeast of Alberta, Canada. Its only tourist attraction has been a landing platform for UFOs that was erected on June 3, 1967. In the middle of the 1990s, however, the tiny town became the focus of international media: Every 50th resident was a shareholder of the mining company Bre-X, whose value had increased 500-fold within just three years. As a result, the number of millionaires in St. Paul had suddenly shot up dramatically. At the center of attention was John Kutyn, an employee of the local savings bank, who had sold everything, including his car and his motorcycle, to invest in Bre-X early on.

    St. Paul, a small Canadian community of 5,000, recorded a sudden surge in resident millionaires.

    Kutyn spread the news about the gold discovery of the century among his neighbors and customers. He would be one of the few who managed to exit the company before it collapsed. A wealthy man, he went on to settle in New Zealand.

    Where’s the Gold?

    Based on industry estimates of the World Gold Council, around 190,000 metric tons of gold have been produced throughout history, of which one-fifth is stored in central bank vaults. The main gold-producing countries are China, Australia, Russia, the United States, and Canada, followed by Peru, Indonesia, South Africa, Mexico, and Ghana. Together, these 10 countries account for around 75 percent of global mine production. Former number-one gold producer South Africa now barely makes the top 10. Though it dominated gold mining for more than 30 years, the country’s production peaked in the 1970s.
    The center of global gold trading is the London Bullion Market, and most of the demand comes from the jewelry industry, followed by investors and industrial applications. The largest gold-producing companies in terms of volume are Barrick Gold, Newmont Mining, and Goldcorp.
    In the 1980s Canada had witnessed a boom in exploration companies, which searched the world for crude oil, gold, and other commodities. Among them was Bre-X, founded by former stockbroker David Walsh late in the decade. From an initial 0.30 Canadian dollar (CAD), the value of Bre-X shares fell to a few cents in 1993. But that would change after Walsh and a geologist named Felderhof bought exploration rights for Busang in the jungle of Borneo, Indonesia. Together with his colleague Mike de Guzman, Felderhof had explored Busang for another company in the mid-1980s, and the two men had found small traces of gold. On May 6, 1993, Bre-X announced that it had acquired a license for Busang. At that point the share price was around 0.50 CAD. But drilling samples validated gold levels of more than 6 grams per ton of rock. Since 3 grams are considered an excellent result, this caused a sensation.

    Was Busang home to the biggest gold treasure of all time?

    It wasn’t long before analysts picked up the Bre-X story. In March 1994 the stock rose to 2.40 CAD. By September, after a year of exploration and testing, the management of Bre-X estimated that Busang’s ore resources were between 3 and 6 million ounces of gold. As Bre-X’s drill results got better and better, gold experts and analysts published ever more optimistic forecasts.
    In November 1995 Busang’s gold resources were estimated at more than 30 million ounces, and toward the end of the year the stock price of Bre-X shares climbed above 50 CAD! At the annual general shareholders’ meeting in May 1996, the company was valued at 200 CAD per share, which then split by 1:10. The estimates kept rising: Bre-X reported more than 39 million ounces of gold in June 1996, 47 million ounces in July, 57 million ounces in December, and 71 million ounces in February 1997. Shortly afterward, Felderhof publicly speculated about resources of more than 100 million ounces. This would have made Busang the richest gold deposit of all time. Market rumors even doubled the estimate: Some 200 million ounces, about 6,000 tons, were supposed to lie hidden in the jungle of Borneo!

    Though the company had not produced a single ounce of gold, Bre-X shares rose 500-fold.

    At the beginning of September 1996, the stock reached its highest price—28 CAD (which corresponded to a price of 280 CAD before the stock split) and a market capitalization of more than 4 billion USD. In just three years the value of Bre-X shares had increased by more than 500 times, even though not a single ounce of gold had been commercially produced!

    In the meantime, the industry’s big names—Placer Dome, Newmont Mining, Barrick Gold, and Freeport-McMoRan—were also taking part in the race for Busang. Indonesian president Haji Muhammed Suharto wanted his share of the treasure, too. In December 1996 the Indonesian government, Bre-X, and Barrick Gold agreed to divide Busang among themselves. The following February, Freeport joined the group.
    But then things began to fall apart. On March 19, 1997, Mike de Guzman committed suicide by jumping from a helicopter. During the due-diligence process, independent drill holes had revealed only negligible amounts of gold. A week later, lab results showed that Bre-X had manipulated the initial samples. It was a personal disgrace for Peter Munk, the head of Barrick Gold, and the news caused investors to panic. The share price of Bre-X collapsed, and the stock was suspended from trading. Later Bre-X had to declare bankruptcy, and the stock became worthless.

    Figure 14. Share price of Bre-X, 1992–1997, in Canadian dollars (CAD). Data: Bloomberg, 2019.

    The Bre-X fraud remains one of the biggest capital market scandals in Canada and the biggest mining scandal ever recorded, causing serious lingering damage to the reputation of the Canadian stock market. Major investors who were hurt included the Ontario Municipal Employees Retirement Board, the Quebec Public Sector Pension Fund, and the Ontario Teachers Pension Plan. In addition, many small investors, including some 200 residents of St. Paul, saw their money vanish into thin air.

    Bre-X crashed. The stock was worthless.

    Not everyone suffered. David Walsh capitalized 35 million USD by selling Bre-X shares before the collapse and moved to the Bahamas. John Felderhof was able to sell nearly 3 million Bre-X shares, with a total value of almost 85 million CAD, between April and September 1996. He found a new home in the Cayman Islands. The Bre-X scandal was finally settled in 2002. However, legal disputes continue today.

    Key Takeaways
    •The Bre-X scandal remains the biggest corporate mining scandal in Canada to date.
    •In 1993 David Walsh and John Felderhof claimed to find the gold deposit of the century in Borneo. Their company, Bre-X, rose from a penny stock, trading below 30 Canadian cents, to 4 billion USD in market capitalization. From mid-1993 to mid-1996, the value of Bre-X shares increased by a multiple of 500. Indonesian president Haji Muhammed Suharto and large multinational gold companies all wanted a piece of the pie.
    •But in March 1997 the discovery was unmasked as the largest gold fraud of all time. Lab results confirmed that the company had manipulated its gold samples. Bre-X declared bankruptcy; its stock was worthless.

    19 Palladium: More Expensive Than Gold 2001

    In 2001 palladium becomes the first of the four traded precious metals—gold, silver, platinum, and palladium—whose price breaks the psychological mark of 1,000 USD per ounce. That represents a tenfold increase in just four years. The reason lies in continuing delivery delays by the most important producer: Russia.

    “The actual level of Russian stockpiles of palladium is a closely guarded state secret.” —United Nations Conference on Trade and Development

    Russia is the epicenter of the global palladium market, due to its high share of world annual production and its strategic inventories, which were built up through overproduction in the 1970s and 1980s. Since palladium is mainly a by-product of the production of other metals such as platinum or nickel, the production of palladium continues even when the supply of the metal is sufficient and prices are low.

    Russia dominated global palladium production and held significant inventories.

    The majority of palladium comes from Russia—and from a single spot, the Norilsk nickel deposit in northern Siberia. If supplies of Norilsk nickel are unable to keep pace with demand, stocks held by the Russian precious metals authority Gokhran, which is under the supervision of the Ministry of Finance, and the Russian Central Bank, fill the gap.

    A Palladium Primer

    Together with platinum, ruthenium, rhodium, osmium, and iridium, palladium is part of the platinum group of metals (PGM). More than 50 percent of the market for the metal depends on automobile catalysts and other industrial processes, though palladium is also used in jewelry. On average over the past five years, just over 50 percent of the annually mined palladium has come from Russia. Other important producer countries are South Africa, which accounts for just under one-third of global production, and the United States, with 15 percent of the global supply. With an annual production volume of around 220 metric tons, the market for palladium is significantly smaller than, for example, gold or silver. (For comparison, around 3,000 metric tons of gold and 24,000 of silver are produced each year.)
    The London Bullion Market Association’s (LBMA) twice-daily price fixing is the most internationally recognized price reference, and futures in palladium are traded in the United States (NYMEX) and Japan (TOCOM).

    Figure 15. Palladium in USD/ounce, 1998–2004. Data: Bloomberg, 2019.

    In the late 1990s the development of automobile catalysts made palladium an important industrial metal, and it was increasingly used instead of platinum because of the relatively low price at the time. But lack of deliveries from Russia started to drive the price up.
    In 1997 palladium deliveries from Russia halted for seven months. The next year deliveries stopped again. Moreover, analysts began to question the actual physical availability of the metal. It seemed that a large share of the palladium inventory had been collateralized by Western banks for credits in the aftermath of the Russian Financial Crisis of 1997.

    The price of palladium rose from 120 USD to more than 1,000 USD, making the metal more valuable than gold, silver, and platinum.

    The price of palladium rose from 120 USD per ounce in early 1997 to more than 200 USD in 1998. In April of that year, the price of the metal surpassed the gold price for the first time since 1971, due to continued supply disruptions in Russia. And the prices for palladium continued to climb: to 400 USD, then to 600 USD. In February 2000 the price of palladium skyrocketed to more than 800 USD, while the price of gold averaged just under 300 USD during that period. It seemed as though the price would consolidate, but instead it rose again to 1,000 USD.
    At the beginning of 2001, palladium broke through the psychological barrier of 1,000 USD, the first of the four traded precious metals—the others are gold, silver, and platinum—to do so. The shortage pushed the price up to almost 1,100 USD at the end of January 2001. The value of palladium had increased almost tenfold in just four years!
    It didn’t last. Subsequently, the value of palladium fell as low as 200 USD, after Russia announced long-term supply contracts with Japan, which were expected to start in January 2001. Then, during the commodity boom in the first decade of the new millennium, the price of palladium once again reached 600 USD before consolidating. Still this represented only a triple rise, compared with a multiple of 10 in 2001.
    In 2015 a major emissions scandal in the car industry (“Dieselgate”) fueled another palladium rally. In September of that year, the US Environment Protection Agency (EPA) issued a notice of violation of the Clean Air Act to the Volkswagen Group. The German car manufacturer had intentionally manipulated data and software in its diesel engines to meet emissions limits. The scandal spread to other manufacturers and raised awareness of the higher levels of pollution emitted by diesel-powered vehicles. The price of palladium, which was used in catalysts for gasoline cars, more than doubled, from less than 500 USD in mid-2015 to more than 1,100 USD at the end of 2018. At the beginning of 2019, Palladium was trading at 1,320 USD, once again higher than gold. Investors are wondering how long the rally will last this time . . .

    Key Takeaways

    •More than 90 percent of palladium reserves are found in Russia and South Africa. The metal (together with platinum) is predominantly used in automobile catalyst systems and related industrial applications.
    •In January 2001 palladium prices rose to 1,100 USD, 10 times the value of four years before.
    •Palladium became more valuable than gold, silver, or platinum, as Russia, the biggest producer and exporter of the metal, withheld shipments.
    •Dieselgate, the global diesel-related emissions scandal, fueled a new rally in palladium, whose prices have more than doubled again since 2015.

    20 Copper: Liu Qibing Disappears Without a Trace 2005

    A trader for the Chinese State Reserve Bureau shorts 200,000 tons of copper and hopes for falling prices. However, when copper prices climb to new records, he disappears and his employer pretends never to have heard of him. What sounds like the plot of a thriller shocks metal traders all over the world.

    “It’s one thing to have a rogue trader on your staff—that happens. But I’d be amazed if China wanted a reputation as a rogue nation in these markets, where it has become such an important player.” —Anonymous trader

    Most people even have trouble pronouncing the name Liu Qibing, but in November 2005 the Chinese copper trader was the number-one topic of conversation on the commodity futures exchanges in London, New York, and Shanghai. Rumors were circulating about a massive, speculative short position in the copper market: Liu Qibing, in his capacity as a trader for the Chinese State Reserve Bureau (SRB), was said to have shorted futures contracts on the London Metal Exchange (LME) amounting to 100,000 to 200,000 tons.
    Unlike Yasuo Hamanaka in Japan almost ten years earlier, Liu Qibing was speculating on falling copper prices. However, prices continued to rise, and the talk of a massive short position temporarily drove London’s three-month-forward copper contracts to a record high of nearly 4,200 USD per metric ton.

    Starting at 1,500 USD, the copper price bounced up to 9,000 USD per ton.

    Copper prices had started to climb since the turn of the millennium. In December 2003 the price of copper broke the 2,000 USD per ton mark for the first time, while the average price of previous years was only slightly above 1,500 USD. Just a few months later, the price breached the 4,000 USD level. The trigger for this development lay in the growing demand of the Chinese economy, which required more and more of the red metal for its infrastructure and housing industry. Although the OECD countries (members of the Organisation for Economic Co-operation and Development) collectively consumed about 80 percent of the world’s copper output at that time, China’s growth was more dynamic. Copper consumption in OECD countries increased on average by 2.5 percent per year over the previous five years. However, China’s demand grew by about 15 percent per year over the same period, while supply growth proved inflexible. At peak times China’s demand growth accounted for more than 80 percent of global demand growth.

    China was sucking global copper markets dry.

    At that time China alone accounted for a quarter of the world’s copper consumption. Meanwhile, the prices for industrial metals continued to rise, because producers were slow to respond with an increased supply. There were several reasons for their reluctance: First, the development of new mines usually takes several years until the first ton of copper can be produced. Second, many producers didn’t trust the high price level to last and therefore delayed long-term investment projects. By 2004, however, the extension of existing projects and the activation of new mines were entering a decisive phase. Experts—including the world’s largest copper producer, Chilean Codelco, and the Chinese State Reserve Bureau—expected the supply to increase at the end of 2005, and the rise in copper prices should have come to an end. As it turned out, that was a misperception for which China paid dearly.
    Contrary to expectations, almost all major producers had problems with production. Costs increased; high oil prices, strikes, and even earthquakes all had a lasting effect. The projected additional supply in the copper market was lagging, and demand, continually fueled by China’s dynamic economic growth, was jumping ahead. As a consequence, the price rose steadily. The rumors surrounding Liu’s positions created additional momentum, as copper inventories on commodity futures exchanges in London, New York, and Shanghai reached their lowest levels in 30 years.

    Figure 16. Copper prices in USD/ton, 2003–2007, London Metal Exchange (LME). Data: Bloomberg, 2019.

    The newspaper China Daily reported that 130,000 metric tons of copper were sold by Liu Qibing for the SRB at an average price of 3,300 USD per ton. As the price of copper rose above 4,000 USD, Liu broke off contacts with other traders in London and China and disappeared. His cell phone remained silent, the door of his apartment on the 10th floor of a Beijing building never opened, and he was absent from his job in Shanghai.

    The Chinese trader broke off all contacts, never answered his cell phone, and his employer denied his existence.

    At first Liu’s employer denied he existed. Later, the SRB claimed that the trader was acting solely on his own behalf. The SRB, which was founded in 1953, was supposed to stabilize prices and secure supplies through commodity trading, not earn profits through speculation. Industry experts considered the 36-year-old trader, who was under house arrest according to Chinese sources, more a pawn than a perpetrator.
    Liu, the son of a farming family from Hubei Province, had been with the SRB since 1990 and had been trained for futures and options trading at the London Metal Exchange (LME). Between 2002 and 2004, Liu is said to have generated more than 300 million USD in risky copper trades for the SRB. Now, the Chinese state was facing losses of hundreds of millions of dollars. In response, the government in Beijing tried to push down the world market price through copper auctions. In a first tranche, 50,000 tons were sold. Another tranche of a similar size was to follow, and the leadership in Beijing spread the word that the country had 1.3 million tons of copper in reserve. However, market participants estimated that the amount of copper available was just half that. The Chinese government’s actions were unsuccessful, as more and more market participants took counter-positions to force China to make physical delivery of the metal in late December.
    Hedge funds—called “crocodiles” in China—particularly saw an opportunity to generate short-term profits. The copper price climbed above 5,000 USD in January 2006, to 6,000 USD in early April, and to 7,000 USD at the end of that month. It rose to the dizzying heights of nearly 8,800 USD a ton in May, before normalizing again over the coming months.

    Key Takeaways
    •Like the Japanese trader Yasuo Hamanaka almost 10 years before, Chinese trader Liu Qibing was caught on the wrong side of the copper market. He speculated on falling prices and lost a great deal.
    •Liu was working for the Chinese State Reserve Bureau (SRB), which handled the Chinese economy’s rising demand for the commodity. Market intelligence estimated Liu’s short position at about 100,000 to 200,000 tons of copper.
    •Copper prices climbed from 1,500 USD per ton in 2003 to almost 9,000 USD in 2006, and Liu, labeled as a rogue trader, vanished.

    21 Zinc: Flotsam and Jetsam 2005

    The city of New Orleans, called The Big Easy, is well known for its jazz, Mardi Gras, and Creole cuisine. Less well known, however, is that about one-quarter of the world’s zinc inventories are stored there. Hurricane Katrina’s flooding makes the metal inaccessible, and concerns over damage cause the price of zinc to rise to an all-time high.

    “It’s totally wiped out . . . it’s devastating.” —President George W. Bush

    Zinc, which is traded on the London Metal Exchange (LME) in US dollars per metric ton, is the third-largest metal market, after copper and aluminum. But in the first years of the new millennium, zinc and lead were considered the ugly sisters of copper and aluminum, because of years of low prices and low margins for mining companies. Global supply was stagnating.

    What Happens at the LME?

    At the London Metal Exchange (LME), copper, aluminum, zinc, lead, nickel, and tin, as well as molybdenum, cobalt, and steel are traded. To capture the opportunities of electrification and electronic vehicles, LME plans to introduce lithium, manganese, and graphite futures contracts in the near future. Trading takes place in two rounds, in the morning and afternoon, in an open ring (“open pit”) during which the daily official trading price is determined. In 2012 the 137-year-old LME agreed to a 1 billion GBP takeover from the Hong Kong Exchange and Clearing (HKEx) after a nine-month auction battle that included ICE, CME, and Nasdaq. With an annual turnover of more than 12 trillion USD, the London Metal Exchange is the world’s largest trading place for metals, followed by metal exchanges in Singapore and New York.
    LME forward contracts are physically deliverable, and inventories of corresponding metals are stocked in LME-approved warehouses. Delivery takes place against LME delivery notes, which provide the owner with the right to a specified quantity of metal at a designated storage location. Currently, there are more than 400 warehouses in 32 locations, from the United States and Europe to the Middle East and Asia.
    Even as interest in industrial metals increased in 2003 as a result of the rapid growth of the Chinese economy, zinc’s price rise lagged behind those of other industrial metals. Nevertheless, China played a major role in the metal’s shortage: In 2004 the country became a net importer of zinc, bringing in about 67,000 tons in the first seven months of 2005, after only 15,000 tons were imported in the entire previous year. The International Lead & Zinc Study Group forecast a market deficit of 200,000 metric tons by the end of 2005, though there had been an excess of 50,000 tons in the first five months.
    Even though global inventories continued to decline, many producing companies remained skeptical about increasing the supply. “At this point, nobody in our business is rushing to build new zinc mines,” explained Greig Gailey, managing director of Zinifex, the world’s third-largest producer of zinc (after Xstrata and Teck Cominco), in 2005. “We’re certainly not, nor are Teck Cominco or Falconbridge.”

    Figure 17. Zinc prices in USD/ton, 2003–2006, London Metal Exchange (LME). Data: Bloomberg, 2019.

    By this time the price of zinc was hovering around 1,200 USD per metric ton. It had broken through 1,000 USD at the beginning of 2004, after moving in a narrow range between 750 and 850 USD over the two previous years.

    About 25 percent of global zinc inventories were concentrated in warehouses in and around New Orleans.

    In a nutshell, that was the situation until August 2005. Then Katrina hit New Orleans like an atomic bomb. The Level 5 hurricane caused devastating damage in the southeastern United States but particularly affected the city, whose urban area was almost completely below sea level.
    Twenty-four official LME warehouses had been sited in and around the city at the Mississippi Delta, due to its geographical location and attractive economic conditions. In addition to 250,000 tons of zinc, there were also 1,200 tons of aluminum and 900 tons of copper locked away. Global zinc inventories were estimated by the International Lead & Zinc Study Group to be just over 1 million metric tons at that point—the equivalent to a 35-day global supply. The inventories in New Orleans therefore accounted for around a quarter of global stocks and about half of the zinc traded at the LME. Due to the flood damage in New Orleans, however, access to the zinc was suddenly severely limited.
    Stephen Briggs, a metal analyst at Société Générale, summarized the situation: “We have a potentially serious development . . . the market is assuming that the metal is damaged and will be inaccessible for a lengthy period of time.”

    Who Needs Zinc?

    Zinc is mainly used as corrosion protection for other metals or metallic alloys such as iron or steel, and most of the demand for it is based on infrastructure, construction, and transport. Zinc is commonly produced as a co-product with lead, and worldwide mined production is around 11 million metric tons. The largest producer countries are China, Australia, Peru, the United States, Australia, and Canada; the latter two are also the largest exporters of the metal. Unlike the more concentrated markets for copper or nickel, the 10 largest companies produce less than 50 percent of the world’s zinc.
    Consumers assumed the worst. On September 2, zinc prices rose to a five-month high, as speculators foresaw delays in the delivery of zinc from the New Orleans warehouses. On September 6, the LME decided to temporarily suspend the supply of zinc from its stocks, though it had confirmed delivery of the metal just a week before. Accordingly, the price of zinc in London increased exponentially to 1,454 USD per metric ton, the highest since 1997. Two days later the LME’s CEO, Simon Heale, confirmed that suspension of deliveries could last until 2006 because of lack of access to the port of New Orleans.
    At the end of the year, zinc prices broke through 1,900 USD and, just under two weeks later, reached 2,400 USD in London. But that was only the beginning: The worsening situation eventually drove the value of the metal to 4,000 USD in the first half of 2006 and marked a new high of just under 4,600 USD per ton in November of that year.
    By 2007 the scare was over: Beginning in August, the price dropped continuously over the next 12 months, from 3,500 USD to less than 1,500 USD.

    Key Takeaways
    •Only market insiders were aware that warehouses in the city of New Orleans held around a quarter of global zinc stocks and about half of the zinc traded at the London Metal Exchange, the biggest physical metal market in the world.
    •In August 2005 Hurricane Katrina devastated New Orleans, causing extensive flooding in the area and making zinc inventories inaccessible.
    •As a consequence of this shortage of material, the price for zinc climbed from nearly 1,200 USD per ton during summer 2005 to a record of 4,600 USD in November 2006.

    22 Natural Gas: Brian Hunter and the Downfall of Amaranth 2006

    In the aftermath of the closure of MotherRock, an energy-based hedge fund, the bust of Amaranth Advisors shakes the financial industry, as it is the largest hedge fund failure since the collapse of Long-Term Capital Management in 1998. The cause? A failed speculation in US natural gas futures. Brian Hunter, an energy trader at Amaranth, loses 6 billion USD within weeks.

    “The market can stay irrational longer than you can stay solvent.” —John Maynard Keynes

    The news shook financial markets like an earthquake in September 2006: Amaranth Advisors, a 10 billion USD American hedge fund, erased around two-thirds of its capital in two weeks by betting on natural gas and was about to close. Only a few weeks before, MotherRock, another hedge fund that specialized in natural gas futures, had collapsed as well. Some of the causes for these events date back to previous years. Following the record hurricane seasons of 2004 and 2005, many hedge funds had become interested in the energy markets. Hurricanes Ivan, Katrina, Rita, and Wilma had all damaged crude oil and natural gas production facilities in the Gulf of Mexico, resulting in a significantly reduced supply.

    Weather and hedge fund speculation drove up natural gas prices from 6 to above 15 USD.

    These extreme weather events, as well as relatively constant demand during the winter months, led to increasing price volatility and, in some cases, substantial price spikes for energy, especially natural gas. While the price of gas traded between 6 and 7 USD during 2004 and the first half of 2005, the hurricane season drove up gas prices to more than 15 USD in December. Production disruptions dragged on for months, but the warm winter, the absence of major storms, and a greater number of imports dampened the effect on the price level of natural gas in 2006.
    Compared to their all-time high that year, benchmark natural gas prices in New York lost around two-thirds of their value. In September natural gas was trading near 4 USD. The huge fluctuations in price made natural gas interesting for short-term-oriented traders, but natural gas’s future contract curve offered an even more interesting investment opportunity. Speculation on the change of price differences between different contract maturities is a popular trading strategy, especially by hedge funds: Traders enter long and short positions in the same commodity simultaneously, and the trade is based on an expansion or narrowing of the price differences, that is, a change in the steepness of the term structure.

    Some Thoughts on Natural Gas

    Natural gas is one of the most important sources of energy in the United States, with a market share of almost 25 percent. Home heating, electricity generation, and other industrial applications together make up nearly 80 percent of its use. But the need for heat, which accounts for 20 percent of total demand, is very seasonal: There’s high demand in the winter months, less during the summer.

    Natural gas production in the United States is focused in Texas, the Gulf of Mexico, Oklahoma, New Mexico, Wyoming, and Louisiana. Texas and the Gulf region together contribute more than 50 percent of domestic output. Another 15-plus percent of total US natural gas consumption is imported from Canada or imported in the form of liquefied natural gas (LNG).

    Natural gas is traded on NYMEX under the symbol NG and the current contract month in USD per 10,000 MMBtu (1 MMBtu equals 26.4 cubic meters of gas, based on an energy content of 40 megajoules/m3).
    In 2006 the two top hedge fund investors in the US natural gas market were Brian Hunter, head of energy trading at Amaranth Advisors, a fund worth 9 billion USD, and Robert “Bo” Collins, chief executive of MotherRock, which oversaw about 400 million USD. The Mother Rock Energy Master Fund, which launched in December 2004, returned 20 percent to its investors in 2005.

    Figure 18. Natural gas prices in USD/MMBtu, 2003 to 2007, New York Mercantile Exchange. Data: Bloomberg, 2019.

    Some investors at the time were aware that Collins and Hunter held opposing positions in March–April and October–January natural gas contracts. In July 2006 the price difference between the gas futures for March and April 2007 reached 2.60 USD. Hunter’s investment decisions assumed that the difference would increase due to the upcoming cold season. In contrast, MotherRock was betting on a correction in the price spread.

    Who Is Brian Hunter?

    Born in 1975, Brian Hunter is a Canadian mathematician and hedge fund manager. From 2001 to 2004, he worked at Deutsche Bank in New York. There, in 2001 and 2002, he achieved a profit of 17 and 52 million USD by trading natural gas futures. However, after losses of more than 50 million USD in just one week, Hunter was released from his job. He moved on to Amaranth.
    Hunter became a legend on Wall Street by earning more than 1 billion USD speculating on natural gas prices after Hurricanes Katrina and Rita. By August 2006 he had achieved a profit of about 2 billion USD. Within a week, however, he had lost three times that, causing serious problems for Amaranth. After his separation from the company, Hunter went on to found a new hedge fund in 2007.
    Amaranth, with about 360 employees, had begun as a company that focused on convertible arbitrage. As those profit opportunities dwindled, it moved on to the energy sector. The firm dominated US natural gas trading on financial markets such as the NYMEX and the Intercontinental Exchange (ICE), as it bought and sold thousands of contracts, sometimes even tens of thousands, on a daily basis. Amaranth held about 100,000 natural gas contracts in one month, which accounted for about 5 percent of the total annual gas consumption of the United States. On the New York Stock Exchange alone, Amaranth controlled 40 percent of all outstanding contracts for the 2006–2007 winter season (October–March) and more than three-quarters of all outstanding November futures contracts.

    Amaranth Advisors and MotherRock had opposite guesses on which way the market would move.

    In June and July 2006, erratic natural gas price movements caused massive losses in the MotherRock Energy Master Fund. Earlier, the US Department of Commerce had reported a 12 percent increase in gas inventories. As a result, the gas price dropped by 12 percent within a week. The redemption of shares by investors aggravated MotherRock’s distress, which increased its losses to more than 200 million USD. However, the hedge fund’s high losses were not primarily due to a “normal” price decline. A subsequent Senate investigation confirmed that the sheer volume of Amaranth purchases of March contracts and sales of April contracts had distorted the price spread of natural gas, which moved up by more than 70 percent by July 31, 2006. MotherRock’s position worsened to the point where the fund was unable to meet its margin requirements. The fund collapsed, and positions were wound up in August 2006. Brian Hunter had triumphed, but his victory would be short lived.

    In late summer, natural gas prices began a downward spiral. The price of natural gas on the NYMEX, with delivery in October, dropped from 8.45 USD in July to below 4.80 USD in September, the lowest price of the previous two and a half years. The difference between futures contracts maturing in March 2007 and April 2007 moved from a high of nearly 2.50 USD in June to below 50 US cents in September—a plunge of around 75 percent!

    Figure 19. Price spread between natural gas March and April 2007 delivery, in USD/MMBtu, New York Mercantile Exchange. Data: Bloomberg, 2019.

    At the end of August, Amaranth held approximately 100,000 contracts in both the September and October futures on the long and short sides. Taken together, these represented enormous positions, because the movement of only 1 US cent on 100,000 contracts meant a change in value of about 10 million USD. The sheer size of the trades caused significant price movements in natural gas and its future term structure, that is, the price relationship of the different maturities.

    Figure 20. Future Term Structure of natural gas in USD/MMBtu, 2010, New York Mercantile Exchange. Data: Bloomberg, 2019.

    The total positions of the fund added up to approximately 18 billion USD. The 60-cent increase in September contracts and the associated drop in the October–September price spread meant a huge loss for Amaranth.
    On August 29 the profit-and-loss calculation showed a one-day depreciation of natural gas valuation of just under 600 million USD. The next day’s margin obligations would be even worse: They rose to 944 million USD, due to further price depreciation. Two days later Amaranth’s margin commitments were in excess of 2.5 billion USD. A week later, on September 8, the hedge fund’s obligations exceeded 3 billion USD.

    Amaranth’s total positions added up to 18 billion USD. In September the fund’s margin commitments rose to more than 3 billion USD.

    With the price volatility of energy markets remaining high, and because of the cumulative losses, concerns were mounting at Morgan Stanley (one of Amaranth’s important investors, along with Credit Suisse and Deutsche Bank), which forced the fund to return money.
    Funds under management at Amaranth fell from 9 to 4.5 billion USD in just a week. Founder Nicholas Maounis told his investors in a letter that the company would drastically reduce its positions due to the price fluctuations in the US gas market, and that investors could anticipate losses of 35 percent by the end of the year, even though four weeks earlier the fund had posted a 26 percent profit.
    Amaranth got its name from the Greek word for “imperishable,” but it was now painfully clear that the firm’s profits were anything but. In addition to individual investors, injured parties included umbrella hedge funds of Credit Suisse, Morgan Stanley, and Deutsche Bank. On July 25, 2007, the Commodity Futures Trading Commission condemned Amaranth and Brian Hunter for attempted price manipulation of the natural gas market. Hunter, who had left Amaranth, had already established a new hedge fund—Solengo Capital Advisors.
    When Amaranth collapsed in September 2006, investors were told redemptions would be temporarily suspended. Ten years after the blowup, in 2016, Amaranth investors were still waiting to get their money back.

    Key Takeaways
    •Energy markets were a hot topic in 2005–2006. The price of natural gas climbed from 6 to more than 15 USD, but in late summer the market turned sour and a downward spiral began. In September 2006 natural gas fell below 5 USD.
    •Brian Hunter built a position of 18 billion USD in natural gas. By August 2006 his trades had earned him 2 billion USD. But then the market turned against him. Within weeks he had lost 6 billion USD, and Amaranth Advisors collapsed in September 2006.
    •The demise of Amaranth Advisors shook the financial industry. It was the biggest hedge fund collapse since the downfall of Long-Term Capital Management in 1998 and investors haven’t been paid back yet.

    23 Orange Juice: Collateral Damage 2006

    “Think big; think positive. Never show any sign of weakness. Always go for the throat. Buy low; sell high.” That’s the philosophy of Billy Ray Valentine, played by Eddie Murphy in the 1983 movie Trading Places. The film’s final showdown has Murphy and Dan Aykroyd cornering the orange juice market. In reality, the price of frozen orange juice concentrate would quadruple between 2004 and 2006 on the New York Mercantile Exchange—a consequence of a record hurricane season.

    “My God! The Dukes are going to corner the entire frozen orange juice market!” —Dan Aykroyd, as Louis Winthorpe III in Trading Places

    The blockbuster movie Trading Places, from 1983, stars Eddie Murphy and Dan Aykroyd and culminates in a chaotic scene at the New York commodity exchange over trades of orange juice that hinge on data from the US Department of Agriculture. This was not really farfetched, as trading in orange juice, or more precisely frozen orange juice concentrate, on the New York Mercantile Exchange (NYMEX) is dominated by the effects of weather. Hurricanes, frosts, or droughts in Florida and the region around São Paulo, Brazil—the main places where oranges are grown—can lead to major price fluctuations that vary with the seasons and also affect other agricultural commodities: High prices are due to risk premiums in May (frost in Brazil) and November (hurricane season in Florida), and lows are more common in February and September. Even light storms can lead to a loss of fruit.

    Some Juicy Facts

    Oranges are cultivated in almost all parts of the world with tropical or subtropical climates, but two countries dominate orange juice production. More than 50 percent of the world’s harvest comes from Brazil (the São Paulo region) and Florida in the United States. At harvest, oranges are typically packaged in boxes of 90 pounds or 40.8 kilograms. Processing fruit into concentrate offers advantages, compared to oranges and orange juice, when it comes to storage, shelf life, and transportation.
    Orange juice is traded in the form of frozen concentrated orange juice futures in New York. A futures contract refers to 15,000 pounds of concentrate, the equivalent of 2,300 to 2,500 boxes of oranges. Under normal conditions, an orange harvest in Florida provides about 200 million boxes, worth about 1.2 billion USD.

    The hurricane seasons of 2004 and 2005 were the most active since weather records were kept in the United States.

    Heavy storms can destroy entire plantations and, at worst, result in lower harvests for several years, because new crops do not bear fruit for three to four years and are most productive only after about eight years. Storms can also make a difference in the spread of pests and diseases, which can greatly impact harvests on monoculture plantations. The years 2004 to 2006 created a “perfect storm” for the price of orange juice, overshadowing even the price spike of crude oil during the 2005 hurricane season.

    Storms to Remember

    The Atlantic hurricane season typically lasts from June 1 to November 30, and an average season sees just six hurricanes. There are exceptions: The year 2004 was one of the most active and costly hurricane seasons since records began. Winds and floods were responsible for at least 3,000 deaths and property damage of approximately 50 billion USD. The most significant storms—Charley, Frances, Ivan, and Jeanne—all crossed the United States. And all four hit Florida.
    But the hurricane season of 2005 stands out even more. It emerged as the most active hurricane season since weather records began, with 28 storms, including 13 hurricanes, of which 4 were Category 5 storms! Category 5 on the Saffir-Simpson scale means a hurricane with wind speeds in excess of 251 km/h. The storms in 2005 cost some 2,300 lives and caused damages amounting to 130 billion USD. Hurricanes Dennis, Emily, Katrina, Rita, and Wilma were responsible for the worst of the devastation that year. Katrina caused massive damage in the southeastern United States in August 2005, hitting the city of New Orleans particularly hard. However, Wilma broke all records and is now considered the strongest storm in history.

    Florida’s orange industry generally has suffered from subsidized overproduction. As a result, in times of good harvests income levels are low. The orange harvest in 2004 was very productive, and consequently in May 2004 the price of orange juice was about 35 percent lower than in the previous year. The US Department of Agriculture was estimating a harvest of 245 million cases in 2004, which would have been well above the crop level of the previous year (203 million cases) and would even have topped the record harvest of the 1997–1998 season (244 million cases). In addition, the Atkins diet, which advocated avoiding carbohydrates (including the sugar in orange juice), was particularly popular in the United States at the time and causing noticeably lower demand. At the end of May 2004, orange juice was trading at only 0.54 USD/lb in New York.

    Figure 21. Frozen orange juice concentrate prices in US cents/lb, 2002–2006. Data: Bloomberg, 2019.

    But then parameters started to change. The Atkins diet lost popularity, and demand began to pick up. And four hurricanes in 2004–2005—Charley, Frances, Jeanne, and Wilma—would affect the supply of Florida oranges. According to the Florida Citrus Mutual industry association, Hurricane Wilma alone caused a crop loss of around 35 million boxes, or about 17 percent of unharvested fruit.

    From a base of 0.55 USD, the price for frozen orange juice concentrate rose to more than 2 USD. A quadruple increase!

    In 2005 the US Department of Agriculture predicted a harvest of only 135 million boxes, that is, a decline of almost 10 percent compared to the already-below-average harvest of the previous year. Market observers expected the lowest harvest level in the previous 17 years due to storm damage and pest infestation. Starting at just under 0.55 USD in May 2004, the price of orange juice concentrate in New York continued to rise, quadrupling within two and a half years.

    The prices for orange juice rose to levels unmatched since 1990.

    In October 2005 the price rose above 1 USD, breaking a psychological barrier, and the upward momentum continued. Orange juice rose to levels that had not been reached since January 1990, when the price topped 2 USD after a severe frost. In December 2006 the price of orange juice was again trading above 2 USD.
    The orange crop in 2005–2006 began to recover slightly in both the United States and Brazil compared to the previous year. But the supply remained about 30 percent below the 2003–2004 level. Finally, in 2007, the price for orange juice fell back to between 1.20 and 1.40 USD, and in 2008, the price normalized to levels below 1 USD again.

    Key Takeaways
    •Prices of agricultural commodities are very sensitive to extreme weather. As a consequence of a record Atlantic hurricane season, the price of frozen orange juice concentrate quadrupled between 2004 and 2006.
    •In October 2005 prices surpassed 1 USD and continued to climb. In December 2006, the price of orange juice traded above 2 USD, a level that had not been reached since January 1990.
    •A notable fictional cornering of the market for frozen orange juice concentrate—whose plot hinged on weather information from the US Department of Agriculture’s Crop Report—took place in the movie Trading Places (1983), starring Eddie Murphy and Dan Aykroyd.

    24 John Fredriksen: The Sea Wolf 2006

    John Fredriksen controls a corporate empire founded on transporting crude oil. Among the pearls of that empire is Marine Harvest, the largest fish-farming company in the world.

    “You stand on dead men’s legs. You’ve never had any of your own. You couldn’t walk alone between two sunrises and hustle the meat for your belly . . .” —Jack London, The Sea Wolf

    Acomparison with socialite Paris Hilton is inevitable: The twin sisters Kathrine and Cecilie, 26, are young, beautiful, and rich. In the list of Forbes magazine’s “Hottest Billionaire Heiresses,” the twins are next to Ivanka Trump and Holly Branson. The sisters have so far kept their names out of scandals, but they are already following in the business footsteps of their father, John Fredriksen. Forbes rates the private wealth of the 74-year-old Norwegian shipowner—by far the richest Norwegian—at more than 8 billion USD. Due to high taxes in Norway, however, Fredriksen lives in London and holds Cypriot citizenship.
    Fredriksen, born May 11, 1944, near Oslo, became rich in the crude oil business, as have many before him. He was already working in the shipping business when he set up his own company during the oil crises of the 1970s and built up a tanker fleet, today one of the largest in the world. He earned money on risky ventures during the Iran-Iraq War in the 1980s and delivered crude oil to the apartheid regime in South Africa.
    Today Frederiksen heads a huge corporate empire, directly or through its investment firms. He is the largest shareholder of the Bermuda-registered shipping company Frontline, which controls a fleet of Liquefied Natural Gas (LNG) tankers with Golar LNG, and is involved in the oil rig operator SeaDrill and the shipping companies Golden Ocean Group and Overseas Shipholding Group. In Germany, Fredriksen is known as a major shareholder of the TUI Group and an advocate of selling the container shipping division Hapag-Lloyd, in order to promote the consolidation of the industry. Prior to 2010 John Fredriksen held the largest stake in TUI Travel and had a significant influence upon its direction and strategy. The Norwegian had already made a name for himself in the world of fish farming and today controls the largest fish-farming company in the world—Marine Harvest.

    Figure 22. Norwegian salmon prices in NOK/kg, 2000–2011. Data: Bloomberg, 2019.

    In the 1971 German TV adaptation of Jack London’s famous adventure novel The Sea Wolf, Raimund Harmstorf, in his role as Wolf Larsen, crushes a raw potato to illustrate his worldview—eat, or be eaten. It’s an apt metaphor for the dealings of John Fredriksen, the Norwegian Sea Wolf.
    In the first years of the new millennium, the Norwegian fish-farming industry was experiencing financial difficulties due to low prices for fish. In particular, the company Pan Fish, founded in 1992, had been struggling since 2000.

    What’s the Catch?

    By far the world’s largest fishing nations are China, Peru, India, and Japan. In Europe, Norway, Denmark, and Spain haul in the largest harvests. The value of world exports of fish and fishery products in 2015 reached 96 billion USD. Aquaculture deals with the controlled cultivation of fish, mussels, crabs, and algae, and there’s a rapidly growing global market for these products: According to figures from the UN’s Food and Agriculture Organization (FAO), slightly more than a third of the almost 150 million metric tons of fish caught come from aquaculture—and the number is rising. The Organisation for Economic Co-operation and Development (OECD) and FAO estimate that by 2020 the proportion of farmed fish will account for almost 50 percent of the total fishery.
    Farmed fish have the advantage of lower prices, and some argue that fish farms can also counteract the overfishing of the oceans; according to FAO estimates, more than 70 percent of the fishing grounds are already considered “overfished.” However, others point out some disadvantages: Aquaculture’s carnivorous fish, such as salmon and trout, consume many times the body weight of wild-caught fish; and there are particularly negative consequences to keeping fish in unnaturally large and dense pens, especially in countries with low ecological standards, such as in Southeast Asia or South America, because of over-fertilization or the use of antibiotics.
    Fredricksen controlled an almost 50 percent stake in Pan Fish through his investment company Greenwich Holding and the two vehicles Geveran Trading and Westborough Holdings. In June 2005, he bid successfully for the remaining shares of the company. In the second quarter of 2005, Fredriksen also acquired 24 percent of Fjord Seafood through Geveran Trading. His shares would soon amount to nearly 50 percent of the company. Then, in October 2005, Fjord Seafood made an offer to the state fish-farming company Cermaq, but the bid failed due to opposition from the Norwegian government.
    Fredricksen made his next big move in March 2006: Nutreco, today the largest manufacturer of fish feed worldwide, sold 75 percent of Marine Harvest—which had been involved in Chilean fish farming since the mid-1970s—to Geveran Trading for nearly 900 million euros. The remaining 25 percent was acquired by the Norwegian firm Stolt-Nielsen.

    On December 29, 2006, Pan Fish, Fjord Seafood, and Marine Harvest merged to form the new Marine Harvest Group. What was by far the largest fish-farming corporation in the world was now under the control of John Fredriksen.

    Key Takeaways
    •John Fredriksen, a modern version of Jack London’s Sea Wolf, made his fortune in the crude oil market, then became active in oil drilling, the transport of crude oil, shipping, and liquified natural gas. Today he controls an extensive corporate empire.
    •During the first years of the new millennium, the Norwegian fish-farming industry experienced severe financial difficulties due to low salmon prices.
    •By active industry consolidation over two years, Fredriksen built the Marine Harvest Group in 2006. Today it’s the world leader in fish farming and aquaculture.

    25 Lakshmi Mittal: Feel the Steel (2006)

    The dynamic growth of the Chinese economy and its hunger for raw materials rouses the suffering steel industry from near death. Through clever takeovers and the reorganization of rundown businesses, Lakshmi Mittal rises from a small entrepreneur in India to the largest steel tycoon in the world, a position he crowns with the acquisition of his main competitor and the world’s second-largest steel producer—Arcelor.

    “I want to be the Ford of Steel.” —Lakshmi Mittal
    “Aim for the highest.” —Andrew Carnegie

    It was a dream wedding, with a setting akin to the court of ancient maharajahs in India or a tale from 1001 Nights. On June 22, 2004, fireworks illuminated the night sky in Paris, Bollywood stars Aishwarya Rai and Shah Rukh Khan entertained the guests, pop star Kylie Minogue performed, and more than 5,000 bottles of Mouton-Rothschild 1986 were served. The evening festivities were the main attraction of the six-day celebration of the wedding of 23-year-old Vanisha Mittal and London investment banker and founder of Swordfish Investments Amit Bhatia, age 25. Twelve Boeing jets had been chartered to bring more than 1,500 guests from India to France, where they visited the Jardin des Tuileries, Versailles, and the Château de Vaux-le-Vicomte. The silver-wrapped wedding invitations included five-star accommodations at the Hotel Le Grand and the InterContinental, whose 600 rooms had been fully booked. Presents for the guests featured designer handbags filled with jewelry. It is estimated that the cost of this extravaganza was around 60 million USD. The check was signed by the proud bride’s father, Lakshmi Mittal.
    Who is this tycoon who could arrange a fairytale wedding for his daughter and that same year acquire a princely residence in London’s posh Kensington district from the chief executive of the Formula One Group, Bernie Ecclestone, for the equivalent of around 130 million USD?
    Lakshmi Mittal’s father had run a small steel plant in the Rajasthan province of India. The family later moved to Calcutta, where the father took over a major factory and where Lakshmi learned the steel business from scratch.
    After studying business administration in Calcutta, in 1976 Lakshmi was put in charge of modernizing a rundown steelwork in Indonesia that the family had previously acquired for 1.5 million USD. That pattern would continue throughout the Indian mogul’s life, as he bought money-losing or underutilized steel producers and restructured their business through cost reductions, sales orientation, layoffs, and closures. When a steel industry boom was triggered by rapid economic growth in China, Lakshmi Mittal would become one of the richest men in the world in just a few years.

    Lakshmi Mittal forged the world’s largest steel company.

    Gradually he added larger and larger acquisition targets. In 1989 Mittal bought a derelict steel plant in Trinidad and Tobago and renovated it. He had a major success in Mexico in 1992: The state had invested 2.2 billion USD in state-of-the-art steel-production equipment, but the end of the oil boom was forcing the government to sell. Mexican president Carlos Salinas awarded the Indian entrepreneur the contract for just 220 million USD, of which Mittal only had to raise 25 million in cash. He then renamed the company Ispat Mexicana. (Ispat is Hindi for “steel.”)
    The year 1995 marked another turning point for the businessman. After the collapse of the Soviet Union, the giant Karmetwerk, which included coal mines, was up for privatization in Kazakhstan. Although Western corporations did not dare invest, Mittal paid 400 million USD, dismissed a third of the workforce, and made the company profitable within a year. Mittal also bought Sidex in Romania after that company was privatized, though it was a controversial deal because of a letter of recommendation written by British prime minister Tony Blair to Romanian president Adrian Năstase after Mittal’s donation to Blair’s party (“Mittalgate”).

    Mittal Steel was created in the spring of 2005.

    In October 2004 Mittal announced the merger of privately held LNM Holding and publicly listed Ispat International with the American International Steel Group (ISG). (ISG arose from the assets of LTV Steel and the assets of former industrial titans Acme Steel and Bethlehem Steel.) In the spring of 2005, the deal—worth 4.5 billion USD—was concluded. Mittal Steel, based in the Netherlands, was born.

    Steel Ups and Downs

    Carnegie and Vanderbilt in USA, or Thyssen and Krupp in Germany—these family names ring a bell in the history of the steel industry. Compared to other industries, the steel industry today is highly fragmented; the 10 largest steelmakers produce less than a third of the world’s supply, compared to a market share of more than 90 percent by the world’s 10 largest carmakers. ArcelorMittal is the industry leader. Nippon Steel, Baoshan Iron & Steel, POSCO, and JFE Steel follow at some distance.
    The 1990s were dark years for steel producers from Western countries. Specifically, the US steel industry slipped into a severe crisis due to overcapacity and cheap imports, and since the late 1990s, more than 30 companies have had to apply for bankruptcy and creditor protection. The situation changed dramatically with the rapid growth of the Chinese economy. The Chinese demand for steel increased from around 15 percent of the world’s market in 2000 to almost 50 percent a decade later. This unbalanced the markets for raw materials like iron ore and metallurgical coal and caused prices for crude steel to rise significantly. At the beginning of the millennium, the price for a metric ton of steel was around 200 USD; by 2008, it had risen to 1,100 USD.
    Mittal had created the world’s largest steel producer, with more than 70 million tons of production capacity. About 90 percent of the company was owned by the family. But Mittal, who wanted to outdo magnates like Andrew Carnegie and Bethlehem Steel’s Charles Schwab, was not yet satisfied.
    In October of the same year, Mittal Steel acquired Ukrainian steel producer Kryvorizhstal at an auction for 4.8 billion USD, after the Ukrainian president decided against a consortium headed by the son-in-law of the former Ukrainian president. But behind the scenes a much larger deal was looming that would profoundly change the steel industry.

    Figure 23. Steel prices in USD/ton, 2000–2010. Data: Bloomberg, 2019.

    In January 27, 2006, Mittal announced a takeover bid to the shareholders of Arcelor, which was the industry’s second-biggest company. He offered a premium of 27 percent on the closing price of the previous day, a purchase price of nearly 20 billion USD. Arcelor itself had been created by the merger of French, Spanish, Luxembourg, and Belgian steelworks, and in 2005 it had produced almost 50 million metric tons of crude steel. The attempt at the hostile takeover provoked Arcelor’s corporate leadership; the governments of Luxembourg, France, and Belgium also opposed the merger.
    “L’India”—the Indian—“does not fit in with our great culture,” said Guy Dollé, the French head of Arcelor. And, in fact, the takeover battle turned into a war of cultures, during which Arcelor sought to save itself through a merger with Russian steelmaker Severstal. It played out like high-stakes poker. In the course of a month, Arcelor rejected two offers from Mittal as too low. Then, in June 2006, the Arcelor board of directors called for a marathon nine-hour negotiation. For almost 34 billion USD, a further premium of 15 percent on the stock closing price of the previous day—about 45 percent above the original offer—Arcelor finally agreed to the sale.

    With the merger of Arcelor and Mittal, the world’s largest steel producer was created, with a combined production volume of just under 120 million tons of crude steel, a global market share of around 12 percent, 60 billion USD in sales, and more than 320,000 employees. Number two in the industry, Nippon Steel, had less than one-third of ArcelorMittal’s production capacity.
    With the acquisition of Arcelor, the Mittal family reduced its stake in the new company to around 45 percent. Nevertheless, with estimated private assets of around 25 billion USD, Lakshmi Mittal is considered the fifth richest person in the world.

    Key Takeaways
    •The awakening of the Chinese economy, with its dynamic growth and enormous lust for resources, shook up a moribund global steel industry. Between 2000 and 2008, global steel prices increased more than fivefold. One entrepreneur noticed this industry trend faster than others.
    •Lakshmi Mittal became the “man of steel.” The Indian tycoon created Mittal Steel in 2005 by buying ISG and the remaining assets of former US industry giants Acme Steel and Bethlehem Steel. But that was not enough. After a bidding frenzy, in summer 2006 Mittal bought Arcelor and forged the world’s biggest steel company, ArcelorMittal.
    •After the transaction was complete, Lakshmi Mittal was considered the fifth richest person in the world, with estimated private assets topping 25 billion USD.

    26 Crude Oil: The Return of the “Seven Sisters” (2007)

    An exclusive club of companies controls oil production and worldwide reserves. But its influence diminishes with the founding of the Organization of the Petroleum Exporting Countries (OPEC) and the rise of state oil companies outside the Western world.

    “There is no business like oil business.“ —C. C. Pocock, Chairman of Shell

    In 2007 the Financial Times created the term the “New Seven Sisters” to describe the world’s seven most influential energy companies outside the Organisation for Economic Co-operation and Development (OECD). The original Seven Sisters, a term coined in the 1950s, referred to a consortium of predominantly successor companies to the Standard Oil Company: Standard Oil of New Jersey, Standard Oil Company of New York, Standard Oil of California, Gulf Oil, Texaco, Royal Dutch Shell, and the Anglo-Persian Oil Company.

    For a long time, the Seven Sisters were regarded as the dominant force in the oil business, since, thanks to a framework agreement with the Iranian government, they held a demand cartel over oil producers in the Third World. Producer countries were forced to sell the majority of their production on the basis of long-term contracts and fixed prices to the oligopoly, which also controlled trade and distribution.
    The Seven Sisters were able to set the rules, because until the 1970s the group controlled about 85 percent of global oil reserves. However, early in that decade, more and more important producer countries began to nationalize their oil industry: Algeria was the first country to do so, in 1971, followed shortly thereafter by Libya. In the following year, Iraq nationalized the concessions of Western companies. In 1973 Iran also nationalized its domestic oil industry. The power of the Seven Sisters was dwindling, and OPEC—founded in 1960 and the cartel’s counterpart on the supply side—was gaining in importance.

    The Seven Sisters controlled 85 percent of the world’s oil reserves until the 1970s.

    Today, OPEC countries supply about 40 percent of the world’s crude oil, and according to their own data, member countries together account for about 75 percent of global crude oil reserves, while oil production in Western countries has declined over recent years.

    Four of the Seven Sisters still exist today—ExxonMobil, Chevron, Royal Dutch Shell, and BP.

    To counter strong price fluctuations and a continuous drop in oil prices below 10 USD, the large oil companies used mergers and acquisitions. For example, Exxon (Standard Oil of New Jersey) and Mobil Oil (Standard Oil Company of New York) merged in 1999 to create ExxonMobil, the world’s largest oil company, whose annual revenue exceeds the economic power of many small countries.
    From Standard Oil of California came Chevron, which took over US Gulf Oil in 1985 and in 2001 incorporated Texaco as well. The British Anglo-Persian Oil Company first became the Anglo-Iranian Oil Company and then British Petroleum. Following the acquisition of Amoco (the former Standard Oil of Indiana) and Atlantic Richfield, the company finally changed its name to BP in 2000. As a result, four of the original seven dominant companies were left: ExxonMobil, Chevron, Royal Dutch Shell, and BP.

    Big Oil today is made up of BP, Chevron, ConocoPhillips, ExxonMobil, Royal Dutch Shell, and Total.

    Further mergers, such as Total and Petrofina (1999), Total and Elf Aquitaine (2000), and Conoco and Phillips Petroleum (2002), have put the US firm ConocoPhillips and the French company Total into the same category as the other four. There are now six super-majors—BP, Chevron, ConocoPhillips, ExxonMobil, Royal Dutch Shell, and Total—all often referred to as “Big Oil” in the financial press. However, their influence today is significantly lower than that of the Seven Sisters 50 years ago. Together, Big Oil today controls less than 10 percent of global oil and gas production, and the group’s share of global reserves is again significantly lower.
    In contrast, the “new Seven Sisters” of the oil industry together control about a third of global oil and gas production and global reserves: These include Saudi Aramco (Saudi Arabia), Gazprom (Russia), China National Petroleum Corporation (China; CNPC), National Iranian Oil Company (Iran), Petróleos de Venezuela (Venezuela), Petrobras (Brazil), and Petronas (Malaysia).

    The “new Seven Sisters” are Saudi Aramco, Gazprom, CNPC, National Iranian Oil, Petróleos de Venezuela, Petrobras, and Petronas.

    Aramco, based in Dhahran, Saudi Arabia, is the most important of the group. As the world’s largest oil company, it produces 12 million barrels of crude oil daily and has reserves of approximately 260 billion barrels of crude oil—almost a quarter of global reserves. With its Ghawar oil field, Saudi Aramco also operates the largest oil field in the world. After a dramatic drop in oil prices in 2015–2016, the kingdom of Saudi Arabia speculated about an IPO of Saudi Aramco to raise money. But plans have not yet been realized.
    At the end of 2006, Russian Gazprom and Petro China, a subsidiary of CNPC, had left the market value of most Western energy companies far behind. CNPC, the China National Offshore Oil Corporation (CNOOC), and Sinopec are China’s three largest oil companies.
    The power of the former Russian state-owned company Gazprom—the world’s largest producer of natural gas—was felt in Europe in late 2005 due to the gas dispute with Ukraine. (The enterprise also holds a monopoly on the export of gas from Russia.)
    The state-owned National Iranian Oil Company (NIOC), based in Tehran, is part of the Iranian Ministry of Petroleum and is also active worldwide. Petróleos de Venezuela (PDVSA) was the instrument of power of former Venezuelan president Hugo Chávez. Established as part of the nationalization of the country’s oil industry, PDVSA is today the largest oil company in Latin America. In the Campos Basin, the semipublic Petrobras (formally Petróleo Brasileiro) accounts for more than 80 percent of Brazil’s oil production. The company is also a leader in offshore drilling and deep drilling. With the Tupi field, the Brazilians have probably discovered the third-largest oil field in the world. Petronas (full name Petroliam Nasional Berhad), a state-owned petroleum company known for its landmark Petronas Towers in Kuala Lumpur, is one of the largest international oil and gas companies, with more than 100 subsidiaries and representations in more than 30 countries.

    Key Takeaways
    •After the breakup of Rockefeller’s Standard Oil empire, a consortium known as the “Seven Sisters” emerged. Included were Standard Oil of New Jersey, Standard Oil Company of New York, Standard Oil of California, Gulf Oil, Texaco, Royal Dutch Shell, and the Anglo-Persian Oil Company. This consortium controlled 85 percent of global crude oil reserves until the mid-1970s.
    •The influence of the Seven Sisters diminished with the founding of OPEC and the rise of state oil companies outside the Western world. OPEC today controls about 40 percent of global oil and gas production.
    •The legacy of the Seven Sisters lives on in a group of super-majors, six integrated oil and gas companies also referred to as “Big Oil”: BP, Chevron, ConocoPhillips, ExxonMobil, Royal Dutch Shell, and Total. Compared to the original Seven Sisters, they control less than 10 percent of global oil and gas production.
    •The “new Seven Sisters” are Saudi Aramco, Gazprom, CNPC, National Iranian Oil, Petróleos de Venezuela, Petrobras, and Petronas. Together these seven companies control about a third of global oil and gas production and reserves.

    27 Wheat and the “Millennium Drought” in Australia 2007

    After seven lean years for Australia’s agricultural sector, a Millennium Drought drives the price of wheat internationally from record to record. Thousands of Australian farmers expect a total failure of their harvest. Is this a preview of the effects of global climate change?

    “This is more typical of a 1 in a 1000-year drought, or possibly even drier, than it is of a 1 in a 100-year event.” —David Dreverman, Head of the Murray-Darling Basin Authority

    The Aboriginal term uamby means “where the waters meet,” except that on the Uamby farm, 50 kilometers northwest of the Australian wine-making and sheep-breeding city of Mudgee, no more water was flowing. The year 2006 was one of the hottest since weather records began on this continent and also one with the least rainfall.

    Though the extreme drought had already affected the farm severely, it was only the beginning of the worst summer months—which fall between December and March in Australia. Water reserves were running low, and the animals could no longer find food. The pastures were bare and parched, necessitating purchases of water and food. Of the original 4,800 sheep on the farm, only 2,800 were left; the remainder had to be sold for 5 USD per animal, though the owners had expected about 40 USD.

    The World’s Wheat

    With an annual production of just under 600 million tons, various wheat varieties, together with corn and rice, are among the most widely cultivated cereals in the world. Wheat accounts for around one-fifth of the world’s calorie needs. It’s an important food for livestock and is also used to produce biofuels like ethanol. The average yield per hectare is just under 3 tons worldwide (1 hectare = 10,000 square meters, comparable to a soccer field). Large parts of the harvest are consumed by the producer countries themselves, so that only about 100 million tons of the total amount produced reach the world market—a factor that can affect price fluctuations in times of shortages.
    More than 400,000 people were working in Australia’s agriculture sector, one of the country’s most important industries, and the situation was dire. At the beginning of 2007, due to the adverse circumstances, a farmer was taking his own life every four days. At the beginning of the next year, more than 70 percent of the agricultural land, about 320 million hectares, was affected by lack of rain and high temperatures.

    The “granary” of Australia, the Murray-Darling Basin, produces 40 percent of the country’s wheat.

    The situation was especially tense in the Murray-Darling Basin. The river system spans thousands of kilometers, an area about the size of France and Spain combined, supplying some 15 percent of Australia’s water. Officially, the rivers supplied around 50 percent less water in 2007 than the previous year, and 2006 itself had been a record low-water year. The basin is considered the granary of Australia, because this area alone grows 40 percent of the food on the continent. Meanwhile, small towns like Dimboola, about 330 kilometers from Melbourne, in the Australian wheat belt, were becoming ghost towns.
    For the international market, Australia’s role as the second-largest exporter of wheat was of particular importance. In “normal” times, Australia exports 25 million tons every year. But normal times had not existed in Australia for seven years, making the drought the country’s longest. The year 2006 was the third-driest year since records began in 1900, and the Australian Bureau of Agricultural and Resource Economics (ABARE) was estimating the 2006–2007 winter harvest at just 26 million metric tons, 36 percent less than the previous year. Even so, 2007 proved to be hotter, and experts began talking about a Millennium Drought. Australian prime minister John Howard declared it “the worst drought in living memory.” The direct cause was the phenomenon known as El Niño—a rise in Pacific Ocean temperature that affects weather patterns, and a phenomenon whose frequency and intensity has increased significantly through global climate change, according to environmental and weather experts.

    El Niño Acts Up

    El Niño (“the boy” in Spanish, referring to the Christ Child, since El Niño usually occurs around Christmastime) describes a weather phenomenon in which the sea surface temperature in the equatorial Pacific rises, wind systems over the Pacific change, and as a result, the cold Humboldt current west of South America weakens. A layer of warm water travels through the tropical East Pacific from Southeast Asia to South America, and water temperatures off Australia and Indonesia drop. The result is a change in global weather patterns: There are usually heavy rains on the South and North American West Coasts and drought, crop failures, and bush fires in Australia, India, and Southeast Asia.
    In contrast, La Niña (“the girl”) is an exceptionally cold current in the equatorial Pacific, whose effects are excessive rain in Indonesia and drought in Peru.
    The Australian harvest was crucial because the global 2006–2007 wheat harvest, at 598 million metric tons, was also significantly lower than the previous year’s 621 and 628 million tons. The 15 largest producing countries provided about 80 percent of that total. Australia, the second-largest exporter after the United States at the time, accounted for about 16 percent of global wheat exports.

    The harvest came at a time of increasing demand, growing prosperity, and robust economic growth. For global wheat consumption, the forecast for this period was 611 million metric tons.
    The collapse of Australian wheat production first hit Asia and the Middle East, since these countries traditionally imported grain from Australia. They were now looking for wheat in the United States and Canada. The Europeans were also affected by the heat. In Ukraine, the 2006 crop had shrunk by half.

    In February 2008 the price for wheat more than tripled, compared to 2006, to almost 13 USD per bushel.

    The price of wheat on the Chicago Board of Trade (CBOT) soon began an unprecedented rally. The typical trading band for wheat in the years before 2006 was between 2.50 USD and 4 USD. At the beginning of 2004, however, inventories fell to their lowest levels since 1980. Bad harvests in Europe and China meant that the Middle Kingdom had to import wheat for the fourth year in a row. The price of grains was picking up dynamically.
    In October 2006, wheat broke through the 5 USD mark for the first time and remained there. Then, in June 2007, wheat prices rose to 6 USD, climbed to 7 USD in August, 8 USD at the beginning of September, 9 USD at the end of that month, and rose to 9.50 USD at the beginning of October.
    Meanwhile, global inventories continued to fall and reached a 26-year low. In addition, in Canada—another major wheat exporter on the world market—grain reserves plunged 29 percent year-on-year at the end of July, while Egypt, Jordan, Japan, and Iraq placed buying orders for large quantities of wheat.

    Figure 24. Wheat prices in US cents/bushel, 2005–2008, Chicago Board of Trade. Data: Bloomberg, 2019.

    After this fast-paced rally, international wheat prices took a breather, but in hindsight that turned out to be just a short break. At the beginning of February 2008, wheat prices broke through the 10 USD barrier, and the price momentum continued. The closing price on February 27, 2008, was 12.80 USD, a dramatic tripling since early 2006!
    The devastating drought had caused losses of around 50 percent in the recent Australian harvest. The situation began to relax slightly with the 2007–2008 harvest of 609 million tons, as the rapid increase in wheat prices had proved an incentive for many farmers to plant previously fallow land. A harvest of 688 million tons worldwide was estimated for 2008–2009. By then the unprecedented Australian drought finally had come to an end. However, weather experts painted a bleak picture for the country’s agriculture in the future.

    Key Takeaways
    •The year 2006 was the third driest in Australia since weather records started in 1900, but 2007 topped it. That year turned out to be the hottest year in history.
    •After several lean years, the Millennium Drought caused devastating damages to Australian agriculture. The national wheat harvest dropped by 50 percent, and global grain markets panicked, since Australia was the biggest global exporter of wheat after the United States.
    •In October 2006, wheat topped 5 USD for the first time. In summer 2007, the rally in wheat prices intensified. In February 2008, wheat prices broke the psychological barrier of 10 USD and closed the month at 12.80 USD. Prices had tripled since early 2006.
    •The Millennium Drought in Australia was caused by El Niño, a weather phenomenon whose strength and frequency could be directly linked to global climate change, according to environmental and weather experts.

    28 Natural Gas: Aftermath in Canada 2007

    The new CEO of the Bank of Montreal, Bill Downe, must report a record loss for the second quarter of 2007 due to failed commodity price speculation. Half a year after Amaranth’s bankruptcy, another natural gas trading scandal shakes market participants’ confidence.

    “How all of a sudden does a USD 450 million loss just materialize like this? Was it a lack of control from a risk perspective or was somebody hiding trades in a desk drawer?” —Leigh Parkinson, Risk Advisory

    It was the middle of April when three of the directors of Optionable, a New York commodity broker, unloaded a share package worth nearly 30 million USD. Just days later, the auditor Deloitte and Touche released a report to its principal, the Bank of Montreal (BMO), stating that there was a 350 to 450 million CAD loss in its natural gas portfolio. This came as a nasty surprise for CEO Bill Downe, who had been in his position for only a month and who was about to announce BMO’s quarterly figures.

    A Canadian Institution

    Founded in 1817, the Bank of Montreal (BMO) is the fourth-largest bank in Canada in terms of deposits and has played a major role in the development of the country, having financed the construction of the first transcontinental railroad in the 1880s. Today BMO’s business activities are divided into private and commercial clients (retail banking), investment banking (BMO capital markets), and wealth management. Tony Comper served as CEO from 1990 to 2007, and during his leadership, in 2000, a small trading scandal occurred in futures trading of natural gas, causing damage of around 30 million CAD. Seven years later, Bill Downe took over.
    The responsible trader at BMO was David Lee, who dealt in natural gas options both on the New York Mercantile Exchange (NYMEX) and over the counter. Lee had joined BMO in his mid-20s, coming from the Bank of New York, where he had been involved in building the commodity derivatives business from scratch. Beginning as an analyst, he soon switched to trading and specialized in natural gas options.
    At BMO, Lee handled a large portion of his trades via Optionable. For a broker like Optionable with fewer than 20 employees, these trades represent almost 30 percent of his total revenue. It was no wonder that Lee and Kevin Cassidy, the CEO of Optionable, were close friends.

    BMO’s commodity trading achieved a huge profit in 2006.

    Trading in natural gas delivered an attractive additional income for BMO. Its commodity trading was 15 to 20 times larger than that of the Canadian market leader, the Royal Bank of Canada (RBC). BMO’s energy-trading business had grown to 25 traders. The bank had offices in Houston, New York, and Canadian energy metropolis Calgary, where in March 2006, at BMO’s annual general meeting, Tony Comper had announced excellent results in the investment banking segment, driven primarily by trading profits in oil and gas.

    The commodity business was booming. Due to the damage caused by Hurricane Katrina in 2005, the price of natural gas was rising. In 2004 and the first half of 2005, the price hovered between 6 and 7 USD, but after the hurricane season, corporate clients increasingly were interested in price-hedging transactions. In December 2005, the price of US natural gas went over 15 USD/MMBtu.
    This trend did not go on forever, though. Within weeks benchmark gas prices in New York had lost around two-thirds of their value. A mild winter ensured a sufficient supply of the commodity, which this time was unaffected by hurricanes. Customer interest cooled down significantly, but energy trading at BMO continued to grow.

    The BMO team around David Lee was betting on a rebound in prices.

    BMO’s star trader David Lee got it massively wrong with natural gas options.

    Market participants could see that someone was building massive options positions on the NYMEX and over the counter, but prices continued to fall and volatility declined. The value of call options imploded.
    The trading positions in Lee’s team were getting out of balance, but he was able to disguise his losses with the help of Optionable. Later the law firm Schatz Nobel Izard would accuse Optionable of having helped the BMO trader falsify his book and, among other things, of confirming incorrect trading prices. When Deloitte and Touche examined the upcoming quarterly figures, the loss could no longer be concealed. The auditors estimated the deficit came to 350 to 450 million CAD. BMO canceled collaboration with Optionable immediately, and Optionable stock lost almost 90 percent of its value.

    Figure 25. Natural gas prices in USD/MMBtu, 2003–2007, New York Mercantile Exchange. Data: Bloomberg, 2019.

    At the end of April 2007, just days before the announcement of its quarterly figures, BMO announced a profit warning and pointed to the bank’s deferred trading positions in the commodity market, namely positions in natural gas, that would weigh heavily on quarterly profits. Companies such as Goldman Sachs and Citadel, a major Chicago hedge fund manager, showed interest in taking over the portfolio. However, BMO’s managers were convinced that they could handle the situation themselves. It turned out, though, that publicizing the trading positions before they could be reduced was the wrong strategy. The losses continued to increase.
    When the quarterly figures came out in May, BMO had upped the losses on its commodity trading book to 680 million USD, the equivalent of about 12 percent of its total annual profit. Gritting his teeth, Downe reported the biggest trade loss of any Canadian bank in history, blaming market illiquidity and lower volatility. His rationale was not wrong, but market participants were skeptical, and analysts asked some unpleasant questions, about both the bank’s business strategy and the quality of its risk management. Bob Moore, executive managing director for commodity products, and David Lee had to leave the company. Lee was fined 500,000 USD and was banned from working in the banking industry. The total cost of the BMO trade scandal added up to around 850 million USD.

    Key Takeaways
    •Half a year after Amaranth Advisors’ bankruptcy, another natural gas trading scandal shook the commodity markets in 2007.
    •David Lee was a celebrated star trader at BMO, and he and his team bet on a rebound of natural gas prices, after prices had declined from a record high of 15 USD due to damages from a record hurricane season.
    •But prices declined further. Natural gas even traded temporarily below 4 USD again. For a while, Lee could disguise his loss of 350 to 450 million USD with the help of his broker Optionable. But auditors uncovered the problem.
    •After earning record profits the year before, Lee’s energy trading imploded. Losses from the trading scandal added up to more than 800 million USD.

    29 Platinum: All Lights Out in South Africa 2008

    Due to ongoing supply bottlenecks of electricity from Africa’s largest energy provider, Eskom, South Africa’s major mining companies restrict their production, and the price of platinum explodes.

    “South Africa needs at least 40 new coal mines to prevent shortages over the long term.” —Brian Dames, Eskom

    “Restoring energy security for the country is an absolute imperative.” —Cyril Ramaphosa, president of South Africa in 2019

    Two years before the World Cup kickoff in June 2010 in South Africa, the country faced its worst electricity supply bottleneck in decades. In spring 2008 the government declared an energy emergency. The national utility company Eskom—the largest electricity provider in Africa—shut down power for several hours every day for weeks, since its capacity lagged far below demand. For 20 years the country’s economy had been growing at a rapid pace. Electricity demand had risen 50 percent since the end of apartheid in 1994, but the South African government and Eskom had failed to provide additional capacity. The electricity company had repeatedly stressed that the nation’s power plants would have to be overhauled and new power plants built, but government agencies ignored these warnings.

    Because there was not enough power available, electricity was rationed at various intervals and in different zones, resulting in two- to three-hour power outages every day. Particularly affected were Johannesburg and the Gauteng region, the center of gold and platinum production. Around half of the mining companies’ energy demand was needed just to maintain infrastructure. Without electricity, the water could no longer be pumped out of the mines, and getting sufficient oxygen several kilometers deep became critical. The impact on actual production was even more dramatic. The Miners’ Union said that the companies sent tens of thousands of workers home or for training. At the end of January, the situation worsened. The energy company operated the world’s largest coal-fired power plant, the Kendal power plant, and Eskom’s coal reserves were being soaked by rainfall. At this point international precious metal prices began to react.

    Eskom turned off the power for the mining companies.

    Precious Platinum and Palladium

    The group of platinum metals (PGMs) includes platinum, palladium, rhodium, iridium, osmium, and ruthenium, but the economically important metals in this group are platinum and palladium, whose trading is overseen by the London Platinum and Palladium Market (LPPM). South Africa and Russia together account for around 90 percent of the world’s platinum metals production. Smaller producer countries are Canada, the United States, and Zimbabwe. The major companies are Anglo American Platinum (Amplats), Impala Platinum (Implats), Lonmin in South Africa, and Norilsk Nickel in Russia. In recent years, Sibanye has also grown into a new player through takeovers and acquisitions.
    Platinum is mainly used for catalysts (50 percent) and jewelry (25 percent); while for palladium, in addition to those applications, dentistry and electronics are important. Price-determining factors for both metals are Russian and South African production, Russian inventories, and global growth rates.
    South Africa had been the center of global gold production since the end of the 19th century, though it had fallen back over the past 30 years to eighth place. However, South Africa still has a dominant position in producing platinum. Around 80 percent of the world’s production comes from that country, with the overwhelming majority being produced in the Bushveld complex. The prices for platinum are correspondingly sensitive to any negative news from South Africa.
    Prices for platinum had been rising steadily since mid-2005, but the momentum increased significantly in late 2007 and early 2008. For the first time in seven years, the multinational firm Johnson Matthey, the world market leader in auto catalysts and thus the largest customer of platinum, expected falling shipments for the entire year.

    Figure 26. Platinum prices in USD/troy ounce, 2004–2009. Data: Bloomberg, 2019.

    At the end of January 2008, the news that the three largest gold producers in South Africa and the largest platinum producer were reducing production in all mines caused prices to jump. Amplats, with a 40 percent market share, expected production losses of 9,000 ounces per day. The number-two firm, Impala Platinum, claimed to lose about 3,500 ounces per day. Overall, South Africa’s platinum miners feared a 2008 production loss of 0.5 million ounces.

    By March 2008 the price of platinum rose to more than 2,200 USD/oz.

    In addition to gold, the price of platinum in particular rose overnight by almost 100 USD to more than 1,700 USD. At the beginning of March 2008, the price of a troy ounce of platinum closed at more than 2,250 USD, a temporary price maximum.
    Electricity supplier Eskom slowly began to regain control of the situation, but industry production was still running at only 90 percent capacity, and the company predicted that supply problems would continue until at least 2020.
    And the years of mismanagement and corruption continued. In February 2019 the situation escalated again, as Cyril Ramaphosa, the president of South Africa following Jacob Zuma, declared Eskom to be “too big and too important to fail” during the Indaba mining conference in Cape Town. Besides its aging coal-fired plants, the company suffers from a debt level of more than 30 billion USD. A breakup, a government rescue plan, as well as a 15% increase in its tariffs to its industrial customers are in the cards for 2019. At the same time, an ounce of platinum costs 800 USD—a new price rally is about to unfold!

    Key Takeaways
    •In 2008, South Africa faced its worst electricity supply bottleneck in decades, and the government declared an energy emergency. Eskom, the national utility company and the largest electricity provider in Africa, shut down power for several hours every day.
    •Although South Africa’s golden days of gold mining were over, it remained the dominant force in platinum group metals, with about 80 percent of the world’s production.
    •At the end of January 2008, the three largest gold producers and the largest platinum producers all reduced their mine production as a result of continuing power outages.
    •That development spurred prices for platinum, which had been rising steadily since mid-2005 and had already reached 1,000 USD. By March 2008, the price of platinum climbed above 2,200 USD per troy ounce, its highest price ever!

    30 Rice: The Oracle 2008

    The Thai “Rice Oracle,” Vichai Sriprasert, predicts in 2007 that rice will increase in price from 300 USD to 1,000 USD, and he becomes a figure of ridicule and mockery. However, a dangerous chain reaction affecting the rice harvest is about to start in Asia and, with Cyclone Nargis, culminates in a catastrophe.

    “National hoarding really doesn’t help the market.” —Robert Zeigler,
    International Rice Research Institute

    At 65, Vichai Sriprasert was one of Thailand’s largest rice exporters, nicknamed the “Rice Oracle.” Years of experience with the interrelationship between supply, demand, and price development had earned Vichai a lot of money as well as the honorary chairmanship of the Thai Association of Rice Traders. As the world’s largest exporter of rice, Thailand was a determining factor in international trade.
    Disbelief and ridicule were the initial reactions to Vichai’s prediction, in 2007, that rice prices were likely to exceed 1,000 USD per ton in the following year. At the time Thai export rice was priced at around 300 USD per ton. After a rapid increase in the price of oil and dramatically higher prices for wheat and corn, however, the laughter disappeared. In spring 2008, the price of rice actually broke Vichai’s targeted 1,000 USD mark. And it would continue to rise. For Vichai, the situation was comparable to the 1970s, when in the shadow of the oil crisis, rice prices rose to around 2,700 USD per metric ton.

    Rice Realities

    According to figures from the Food and Agriculture Organization (FAO), rice—along with corn and wheat—is one of the most widely cultivated cereals in the world, with an annual production of around 650 million metric tons. The largest producer countries are China, India, Indonesia, Bangladesh, Vietnam, and Thailand. Due to its predominantly wet cultivation, between 3,000 and 5,000 liters of flowing water are needed per kilogram of rice. On the one hand, this has a positive effect in terms of lower pest and weed infestation; on the other hand, this can lead to serious crop failures in periods of dry weather.
    Despite the importance of rice, futures trading is insignificant, with less liquidity than the wheat or corn market. The most important trading place for rice is the Chicago Board of Trade (CBOT) in the United States. Traded contracts are quoted in US cents per American centner or hundredweight (1 cwt equals 100 lb equals 45.359 kg), with one contract covering 2,000 hundredweights.
    What had happened? Driven by the rising price of crude oil, the prices of many agricultural goods rose sharply in 2007, a condition called “agflation.” The food price index, calculated by the FAO, had risen by 57 percent within just one year, from March 2007 to March 2008. Wheat and soybean prices also doubled, and the price of corn had increased by 66 percent since autumn 2007.

    Figure 27. Rice prices in US cents/cwt, 2000–2010, Chicago Board of Trade. Data: Bloomberg, 2019.

    However, the price of rice was still well above that of other agricultural goods and was developing its own momentum in spring 2008. From June 2007 to April 2008, rice prices rose by around 75 percent—even more in Asia. Prices increased from 400 USD per metric ton to more than 1,000 USD.
    The price spike had widespread consequences. Rice is a staple food for around three billion people, and in many countries nearly half of household income is spent on nutrition. The rise in prices threatened political stability in several countries and caused serious unrest around the world. In Haiti several people were killed in protests, and uprisings were reported in Egypt, Burkina Faso, Cameroon, Indonesia, Côte d’Ivoire, Mauritania, Mozambique, and Senegal. How did all this happen?

    The globally traded rice volume of 30 million tons was very low compared to the total production of 650 million tons.

    The rice market is generally subject to structural deficits. The average amount of rice traded on the world markets per year—around 30 million metric tons—is very low compared to global production of around 650 million tons. This makes global prices extremely vulnerable to short-term fluctuations in supply and demand. Urbanization, demographics, and the demand for alternative energies and weather conditions all are influential factors and also apply to other agricultural goods to some extent.
    For example, rapid urbanization in Asia has destroyed more and more agricultural acreage, and increasing prosperity on that continent has also led to more meat consumption, increasing the amount of grain needed to feed livestock. The consumption of meat in China alone increased by about 150 percent in the past 30 years. Furthermore, the rice fields of Asia have had to absorb an annual birth rate of about 80 million babies in the region. Indirectly, the high price of oil and a related increase in demand for biofuels are also driving up the price of rice, as many farmers switch to the more profitable cultivation of corn, wheat, and oilseeds.
    Some countries recorded significant losses in their rice harvest due to weather in 2007–2008. Thunderstorms and floods destroyed more than 20 million hectares of fields within one year, twice the total acreage of Thailand. Bangladesh, generally a major exporter of rice, suffered significant crop losses in 2007 from floods and Tropical Storm Sidr, which destroyed almost the entire crop. The rice harvest in Vietnam was also hampered by severe pest infestation and disease. As a result, the price of rice continued to rise, and the situation gradually worsened.
    With panic buying and export restrictions, the dominoes were falling: In Asia, supplies continued to be stretched. The rice-exporting countries of Vietnam and India issued restrictions on the export of rice, while India slowed exports to stabilize prices at home. Other exporting countries, such as China, Egypt, and Cambodia, joined in with quotas and taxes. China was so worried about supplying its own population that it waived exports until further notice, while in Thailand, farmers, traders, and rice mills began to hoard their rice.

    In Asia, hoarding and export restrictions worsened the already tight supply.

    Everywhere in the region there was panic buying. Even in the United States, Wal-Mart rationed its sales to customers. The world’s largest importer, the Philippines, announced massive purchases to forestall further supply shortages. Importing countries like Bangladesh, Indonesia, and Iran were also affected. And then, on the night of May 3, a catastrophe occurred.
    Cyclone Nargis hit the coast of Myanmar, devastating the rice supply region in the middle of the harvest season and leaving between 50,000 and 100,000 people dead. The price of rice shot up again, and the risk of famine and revolts caused by hunger rose. As the price of rice quadrupled, many regions were threatened by unrest. In addition to the tight supply and the unfavorable weather, export restrictions and hoarding had created an artificial shortage, dramatically exacerbating the situation. Even Vichai did not foresee how bad the situation would become.
    In May 2008, however, the supply situation eased. Pakistan, one of the largest rice producers, loosened its export restrictions, and the crop in India was more than 2 million metric tons larger than expected. However, the structural problems of the rice market would remain. Given a comparatively small international market, repeated supply bottlenecks in Asia are to be expected in the future.

    Key Takeaways
    •In the beginning of 2007, Vichai Sriprasert, the “Rice Oracle” of Thailand, predicted a massive increase in the price of rice, a ridiculous thought at that time.
    •Later in 2007, however, prices of many agricultural goods rose sharply, driven by increasing crude oil prices (“agflation”). The situation in the rice market was especially critical.
    •From June 2007 to April 2008, rice prices in Asia increased from 400 USD to more than 1,000. Hoarding and export restrictions worsened an already tight supply.
    •When Cyclone Nargis hit Myanmar in May 2008, it devastated that country’s rice harvest and left as many as 100,000 people dead.
    •The price of rice quadrupled, and many regions were threatened by unrest, causing difficulties that even the Rice Oracle did not foresee.

  • Torsten Dennin《From Tulips to Bitcoins_ A History of Fortunes Made and Lost in Commodity Markets》1-15

    “The Wheel of Time turns and, Ages come and pass, leaving memories that become legend. Legend fades to myth, and even myth is long forgotten when the Age that gave it birth comes again.”—Robert Jordan (1948–2007), The Wheel of Time

    “Wall Street people learn nothing and forget everything [. . .] to give way to hope, fear and greed.” —Benjamin Graham (1894–1976)

    Contents

    Introduction
    1.Tulip Mania: The Biggest Bubble in History (1637)
    In the Netherlands in the 17th century, tulips become a status symbol for the prosperous new upper class. Margin trading of the flower bulbs, which are weighed in gold, turns conservative businessmen into reckless gamblers who risk their homes and fortunes. In 1637 the bubble bursts.
    2.The Dojima Rice Market and the “God of Markets” (1750)
    In the 18th century, futures contracts on rice are introduced at the Dojima rice market in Japan. The merchant Homma Munehisa earns the nickname “God of Markets” for his market intelligence, and he becomes the richest man in Japan.
    3.The California Gold Rush (1849)
    Gold Rush! Some 100,000 adventurers stream into California in 1849 alone, lured by the vision of incredible wealth. The following year, the value of gold production in California exceeds the total federal budget of the United States. Because of this treasure, California becomes the 31st state in the Union in 1850.
    4.Wheat: Old Hutch Makes a Killing (1866)
    The Chicago Board of Trade is established in 1848, and Benjamin Hutchinson, known as “Old Hutch,” later becomes famous by successfully cornering the wheat market. He temporarily controls the whole market and earns millions.
    5.Rockefeller and Standard Oil (1870)
    The US Civil War triggers one of the first oil booms. During this time, John D. Rockefeller founds the Standard Oil Company. Within a few years, through an aggressive business strategy, he dominates the oil market, from production and processing to transport and logistics.
    6.Wheat: The Great Chicago Fire (1872)
    The Great Chicago Fire of October 1871 leads to massive destruction in the city and leaves more than 100,000 residents homeless. The storage capacities for wheat are also significantly reduced. Trader John Lyon sees this as an opportunity to earn a fortune.
    7.Crude Oil: Ari Onassis’s Midas Touch (1956)
    Aristotle Onassis, an icon of high society, seems to have the Midas touch. Apparently emerging out of nowhere, he builds the world’s largest cargo and tanker fleet and earns a fortune with the construction of supertankers and the transport of crude oil. Onassis closes exclusive contracts with the royal Saudi family, and he is one of the winners in the Suez Canal conflict.
    8.Soybeans: Hide and Seek in New Jersey (1963)
    Soybean oil fuels the US credit crisis of 1963. The attempt to corner the market for soybeans ends in chaos, drives many firms into bankruptcy, and causes a loss of 150 million USD (1.2 billion USD in today’s prices). Among the victims are American Express, Bank of America, and Chase Manhattan.
    9.Wheat: The Russian Bear Is Hungry (1972)
    The Soviet Union starts to buy American wheat in huge quantities, and local prices triple. Consequently, Richard Dennis establishes a groundbreaking career in commodity trading.
    10.The End of the Gold Standard (1973)
    Gold and silver have been recognized as legal currencies for centuries, but in the late 19th century silver gradually loses this function. Gold keeps its currency status until the fall of the Bretton Woods system in 1973. The current levels of sovereign debt are causing many investors to reconsider an investment in precious metals.
    11.The 1970s—Oil Crisis! (1973 & 1979)
    During the 1970s the world must cope with global oil crises in 1973 and 1979. The Middle East uses crude oil as a political weapon, and the industrialized nations— previously unconcerned about their rising energy addiction and the security of the supply—face economic chaos.
    12.Diamonds: The Crash of the World’s Hardest Currency (1979)
    Despite the need for individual valuation, diamonds have shown a positive and stable price trend over a long period of time. In 1979, however, monopolist De Beers loses control of the diamond market; “investment diamonds” drop by 90 percent in value.
    13.“Silver Thursday” and the Downfall of the Hunt Brothers (1980)
    Brothers Nelson Bunker Hunt and William Herbert Hunt try to corner the silver market in 1980 and fail in a big way. On March 27, 1980, known as “Silver Thursday,” silver loses one-third of its value in a single day.
    14.Crude Oil: No Blood for Oil? (1990)
    Power politics in the Middle East: Kuwait is invaded by Iraq, but Iraq faces a coalition of Western countries led by the United States and has to back down. In retreat, Iraqi troops set the Kuwaiti oil fields on fire. Within three months the price of oil more than doubles, from below 20 to more than 40 USD.
    15.The Doom of German Metallgesellschaft (1993)
    Crude oil futures take Metallgesellschaft to the brink of insolvency and almost lead to the largest collapse of a company in Germany since World War II. CEO Heinz Schimmelbusch is responsible for a loss of more than 1 billion USD in 1993.
    16.Silver: Three Wise Kings (1994)
    Warren Buffett, Bill Gates, and George Soros show their interest in the silver market in the 1990s—investing in Apex Silver Mines, Pan American Silver, and physical silver. It is silver versus silver mining. Who would lead and who would lag?
    17.Copper: “Mr. Five Percent” Moves the Market (1996)
    The star trader of Sumitomo, Yasuo Hamanaka, lives two lives in Tokyo, manipulating the copper market and creating record earnings for his superiors but also carrying on risky private trades. In the end, Sumitomo endures a record loss of 2.6 billion USD, and Hamanaka is sentenced to eight years in prison.
    18.Gold: Welcome to the Jungle (1997)
    In the jungle of Borneo, Canadian firm Bre-X supposedly finds a gold deposit with a total estimated value of more than 200 billion USD. Large mining companies and Indonesian president Suharto all want a piece of the pie, but in March 1997 the discovery turns out to be the largest gold fraud of all time.
    19.Palladium: More Expensive Than Gold (2001)
    In 2001 palladium becomes the first of the four traded precious metals—gold, silver, platinum, and palladium—whose price breaks the psychological mark of 1,000 USD per ounce. That represents a tenfold increase in just four years. The reason lies in continuing delivery delays by the most important producer: Russia.
    20.Copper: Liu Qibing Disappears Without a Trace (2005)
    A trader for the Chinese State Reserve Bureau shorts 200,000 tons of copper and hopes for falling prices. However, when copper prices climb to new records, he disappears and his employer pretends never to have heard of him. What sounds like the plot of a thriller shocks metal traders all over the world.
    21.Zinc: Flotsam and Jetsam (2005)
    The city of New Orleans, called The Big Easy, is well known for its jazz, Mardi Gras, and Creole cuisine. Less well known, however, is that about one-quarter of the world’s zinc inventories are stored there. Hurricane Katrina’s flooding makes the metal inaccessible, and concerns over damage cause the price of zinc to rise to an all-time high.
    22.Natural Gas: Brian Hunter and the Downfall of Amaranth (2006)
    In the aftermath of the closure of MotherRock, an energy-based hedge fund, the bust of Amaranth Advisors shakes the financial industry, as it is the largest hedge fund failure since the collapse of Long-Term Capital Management in 1998. The cause? A failed speculation in US natural gas futures. Brian Hunter, an energy trader at Amaranth, loses 6 billion USD within weeks.
    23.Orange Juice: Collateral Damage (2006)
    “Think big; think positive. Never show any sign of weakness. Always go for the throat. Buy low; sell high.” That’s the philosophy of Billy Ray Valentine, played by Eddie Murphy in the 1983 movie Trading Places. The film’s final showdown has Murphy and Dan Aykroyd cornering the orange juice market. In reality, the price of frozen orange juice concentrate would quadruple between 2004 and 2006 on the New York Mercantile Exchange—a consequence of a record hurricane season.
    24.John Fredriksen: The Sea Wolf (2006)
    John Fredriksen controls a corporate empire founded on transporting crude oil. Among the pearls of that empire is Marine Harvest, the largest fish-farming company in the world.
    25.Lakshmi Mittal: Feel the Steel (2006)
    The dynamic growth of the Chinese economy and its hunger for raw materials rouses the suffering steel industry from near death. Through clever takeovers and the reorganization of rundown businesses, Lakshmi Mittal rises from a small entrepreneur in India to the largest steel tycoon in the world, a position he crowns with the acquisition of his main competitor and the world’s second-largest steel producer—Arcelor.
    26.Crude Oil: The Return of the “Seven Sisters” (2007)
    An exclusive club of companies controls oil production and worldwide reserves. But its influence diminishes with the founding of the Organization of the Petroleum Exporting Countries (OPEC) and the rise of state oil companies outside the Western world.
    27.Wheat and the “Millennium Drought” in Australia (2007)
    After seven lean years for Australia’s agricultural sector, a Millennium Drought drives the price of wheat internationally from record to record. Thousands of Australian farmers expect a total failure of their harvest. Is this a preview of the effects of global climate change?
    28.Natural Gas: Aftermath in Canada (2007)
    The new CEO of the Bank of Montreal, Bill Downe, must report a record loss for the second quarter of 2007 due to failed commodity price speculation. Half a year after Amaranth’s bankruptcy, another natural gas trading scandal shakes market participants’ confidence.
    29.Platinum: All Lights Out in South Africa (2008)
    Due to ongoing supply bottlenecks of electricity from Africa’s largest energy provider, Eskom, South Africa’s major mining companies restrict their production, and the price of platinum explodes.
    30.Rice: The Oracle (2008)
    The Thai “Rice Oracle,” Vichai Sriprasert, predicts in 2007 that rice will increase in price from 300 USD to 1,000 USD, and he becomes a figure of ridicule and mockery. However, a dangerous chain reaction affecting the rice harvest is about to start in Asia and, with Cyclone Nargis, culminates in a catastrophe.
    31.Wheat: Working in Memphis (2008)
    The price of wheat speeds from record to record. Trader Evan Dooley bets on the wrong direction, juggling 1 billion USD and dropping the ball. This results in a loss of 140 million USD for his employer, MF Global, in February 2008.
    32.Crude Oil: Contango in Texas (2009)
    The price of West Texas Intermediate (WTI) crude oil collapses, unsettling commodity traders around world attention. A 10,000-person community in Oklahoma becomes the center of the world. The concept of “super-contango” is born, and investment banks enter the tanker business.
    33.Sugar: Waiting for the Monsoon (2010)
    A severe drought threatens India’s sugar harvest, and the world’s largest consumer becomes a net importer on the world market. Brazil, the largest exporter of sugar, has its own problems. As a result, international sugar prices rise to a 28-year high.
    34.Chocolate Finger (2010)
    Due to declining harvests in Côte d’Ivoire (the Ivory Coast)—the largest cocoa exporter on the world market—prices are rising on the international commodity futures markets. In the summer of 2010, cocoa trader Anthony Ward, “Chocolate Finger,” wagers more than 1 billion USD on cocoa futures.
    35.Copper: King of the Congo (2010)
    The copper belt of the Congo is rich in natural resources, but countless despots have looted the land. Now Eurasian Natural Resources Corporation (ENRC) is reaching out to Africa, and oligarchs from Kazakhstan aren’t shy about dealing with shady businessmen or the corrupt regime of President Joseph Kabila.
    36.Crude Oil: Deep Water Horizon and the Spill (2010)
    Time is pressing in the Gulf of Mexico. After a blowout at the Deepwater Horizon oil rig, a catastrophe unfolds—the biggest oil spill of all time. About 780 million liters of crude oil flow into the sea. Within weeks BP loses half its stock-market value.
    37.Cotton: White Gold (2011)
    The weather phenomenon known as La Niña causes drastic crop failures in Pakistan, China, and India due to flooding and bad weather conditions. Panic buying and hoarding drive the price of cotton to a level that has not been reached since the end of the American Civil War 150 years ago.
    38.Glencore: A Giant Steps into the Light (2011)
    In May 2011, the world’s largest commodity trading company—a conspicuous and discreet partnership with an enigmatic history—holds an IPO. The former owners, Marc Rich and Pincus Green, have been followed by US justice authorities for more than 20 years. Without mandatory transparency or public accountability in the past, they were able to close deals with dictators and rogue states around the world.
    39.Rare Earth Mania: Neodymium, Dysprosium, and Lanthanum (2011)
    China squeezes the supply of rare earths, and high-tech industries in the United States, Japan, and Europe ring the alarm bell. But the Chinese monopoly can’t be broken quickly. And the resulting sharp rise in rare earth prices lures investors around the globe.
    40.The End? Crude Oil Down the Drain (2016)
    A perfect storm is brewing for the oil market. There is an economic slowdown and too much storage because of contango. The world seems to be floating in oil, whose price falls to 26 USD in February 2016. But the night is always darkest before dawn, and crude oil and other commodities find their multiyear lows.
    41.Electrification: The Evolution of Battery Metals (2017)
    Elon Musk and Tesla are setting the pace for a mega trend: electrification! Demand from automobile manufacturers, utilities, and consumers pushes lithium-based battery usage to new heights. For commodity markets, it is not only lithium and cobalt but also traditional metals like copper and nickel that are suddenly in high demand again. Electrification might prove to be the “new China” for commodity markets in the long term.
    42.Crypto Craze: Bitcoins and the Emergence of Cryptocurrencies (2018)
    Bitcoins, the first modern cryptocurrency, emerged in 2009. The value of bitcoins explodes in 2017 from below 1,000 to above 20,000 USD, attracting worldwide attention. This stellar price rise, followed by a crash of almost 80 percent in 2018, makes bitcoins the biggest financial bubble in history, dwarfing even the Dutch tulip mania of the 17th century. Despite the boom and bust, the future looks bright, as underlying blockchain technology reveals its potential and starts to revolutionize daily life.

    Introduction

    “The price of a commodity will never go to zero . . . you’re not buying a piece of paper that says you own an intangible piece of company that can go bankrupt.” —Jim Rogers

    Commodities came into vogue with the beginning of the new millennium, as investing in crude oil, gold, silver, copper, wheat, corn, or sugar was introduced and marketed massively as an “investment theme” and a “new” asset class by banks and other financial intermediaries. The first investable commodity indices—the S&P Goldman Sachs Commodity Index and the Dow Jones AIG Commodity Index—were developed in the early 1990s, but after the turn of the millennium, every major investment bank offered its own commodity index and index concept. This development opened up a new and attractive asset class for institutional investors and wealthy individuals. We witness today the same development in the cryptocurrency world, making an exotic new asset class investable for the public.
    The rapid growth of the Chinese economy is the key parameter of the commodity boom, which has been evident since around the year 2000, when the “workbench of the world” developed a gigantic hunger for raw materials: Imports of iron ore, coal, copper, aluminum and zinc began soaring, and China became the dominant factor in worldwide demand. The dynamic growth of the Chinese economy catapulted commodity prices sky-high. Like a gigantic vacuum cleaner, China swept up the markets for energy, metals, and agricultural goods, and prices kept rising, since supply growth couldn’t keep up with rising demand.
    At least temporarily, the collapse of Lehman Brothers and the worsening financial crisis caused a break in the skyrocketing prices. Crude oil crashed from its high at 150 USD/barrel during the summer of 2008 to below 40 USD in the spring of 2009. In the course of the year, prices recovered again, to above 80 USD. Industrial metals also benefited from the economic recovery. In the aftermath of the financial crisis, and amid worries about rising public debt as well as the stability of the financial system, the interest of investors in gold rose substantially. In 2009, with the European debt crisis looming, gold surpassed the level of 1,000 USD for the first time, but it climbed as high as 1,900 USD per troy ounce in 2011.
    Exotic agricultural products such as sugar, coffee, and cocoa were also among the goods that experienced significant price increases in 2009, as the ghost of “agflation” returned and spooked markets. Market recovery after the financial market meltdown of 2008/2009 proved not to be sustainable, however. After April 2011, commodity markets entered a severe five-year bear market. A period of sluggish growth, deleveraging, and a slower economy in China worsened a massive imbalance of demand and supply for raw materials. A supply glut caused crude oil to fall back to 26 USD early in 2016. But since then, commodity markets have turned around. In 2016, for the first time in five years, they closed positive.

    The Commodity Market and Cryptocurrencies—Some Basics

    A commodity is any raw or primary economic good that is standardized. Organized commodity trading in the United States dates back almost 200 years, but commodity trading has a much longer history. It goes back several thousand years to ancient Sumerians, Greeks, and Romans, for example. In comparison to commodity trading, the history of the stock market—where you exchange pieces of ownership in companies—is much younger. In 1602 the Dutch East India Company officially became the world’s first publicly traded company on the Amsterdam Stock Exchange in Europe. In the United States, the first major stock exchange was the New York Stock Exchange, created in 1792 on Wall Street in New York City.

    Commodities can be categorized into energy, metals, agriculture, livestock, and meat. You can also differentiate between hard commodities like metals and oil, which are mined, and soft commodities that are grown, like wheat, corn, cotton, or sugar.

    By far the most important commodity sector is crude oil and its products like gasoline, heating oil, jet fuel, or diesel. With the world consuming more than 100 million barrels of crude oil every day, that comes to a market value in excess of 6 billion USD per day, or 2.2 trillion USD per year! About three-quarters of crude oil goes into the transportation sector, fueling cars, trucks, planes, and ships.

    Metal markets are usually divided into base and precious metals. By tonnage, iron ore is the biggest metal market, with more than 2.2 million tons of iron ore mined globally. Nearly two-thirds of global exports go to China; that’s around 1 billion metric tons! At 70 USD per ton, the market value of iron ore, on the other hand, is rather small. The biggest metal market, in value of US dollars, is gold. Around 3,500 tons are mined per year, an equivalent of 140 billion USD. The total aboveground stocks of gold are estimated at around 190,000 tons; that makes gold a physical market of nearly 8 trillion USD. In value terms, copper, aluminum, and zinc are next, whereas other precious metal markets—silver, platinum, or palladium—are rather small.

    In agriculture and livestock, the biggest markets are grains like wheat and corn as well as oil seeds like soybeans, and sugar.

    Bitcoins were released as the first cryptocurrency in January 2009. Since then, more than 4,000 alternative coins (“altcoins”) have been invented. The website coinmarketcap.com tracks prices of about 2,000 of them on a daily basis. After massive price corrections in 2018, the total market capitalization of all cryptocurrencies dropped below 200 billion USD. Bitcoins remain the dominant cryptocurrency, with a market capitalization of almost 70 billion USD and a market share of 40 percent. The next five most traded cryptos are ripple, ethereum, stellar, bitcoin cash, and litecoin. Together these five cryptos amount to a market capitalization of 30 billion USD, less than half of bitcoins.

    Organized commodity trading by itself has a longer history than equity markets, a fact often overlooked in the focus on the dramatic price swings over the past decades. For example, the Chicago Board of Trade (CBOT) was founded in 1848 to provide a platform for trading agricultural products such as wheat and corn. But trade and the speculation in commodities is much older than that. Around 4000 BCE, Sumerians used clay tokens to fix a future time, date, and number of animals, such as goats, to be delivered, which resembles modern commodity future contracts. Peasants in ancient Greece sold future deliveries of their olives, and records from ancient Rome show that wheat was bought and sold on the basis of future delivery. Roman traders hedged the prices of North African grains to protect themselves against unexpected price increases.

    The history of commodity and crypto trading is colorful and instructive, and my aim with this book is to bring to life the most important episodes from the past up to the present. Some of these are spectacular boom-and-bust stories; others are examples of successful trading. All are worth paying attention to.

    The first six chapters cover major events from the 17th to the 19th century. The Dutch tulip mania of the 1600s is considered one of the first documented market crashes in history and is still a topic of university lectures. In the 18th century, rice market fortunes were earned and lost in Japan, and in the process candlestick charts—which are used today in the financial industry—were invented. In the 1800s, J. D. Rockefeller’s strategies and the rise of Standard Oil marked the beginning of the oil age. At nearly the same time in the midwestern United States, two men were trying to accumulate a fortune by manipulating wheat markets, while in California the Gold Rush broke out, with momentous consequences.

    The episodes of commodity trading in the 20th century read like a “Who’s Who” of business history: Aristotle Onassis, Warren Buffett, Bill Gates, and George Soros are just some of the major players. Meanwhile, crude oil was playing an increasingly important role.

    The 1970s saw a real boom in commodity markets. After a shortfall in its wheat harvest, the Soviet Union went shopping for US agricultural goods, reinforcing an already positive price trend in wheat, corn, and soybeans. It’s no overstatement to say that the rapid rise of crude oil prices during two oil crises in 1973 and 1979 changed the existing world order; the 1990 Gulf War was, in part, an attempt to reverse the clock. During this period the price of oil doubled. Among the collateral damage, the German conglomerate Metallgesellschaft was driven to the brink of insolvency by its crude oil-trading activities.

    In the years that followed, a boom in gold, silver, and diamond prices was followed by a crash, and the Hunt brothers lost their oil-based family fortune because of the collapsing silver price. Warren Buffett, Bill Gates, and George Soros later were also involved in the silver market. And in the jungles of Borneo, the biggest gold scam of all time culminated in the bankruptcy of Bre-X. Another huge speculation in 1996 was caused by the Japanese trader Hamanaka in the copper market. That was repeated almost ten years later by Chinese copper trader Liu Qibing, which also signaled the shift of economic forces from Japan to China.

    The emerging commodity boom of the new millennium attracted additional speculators and led to other boom-and-bust episodes. The collapse of Amaranth Advisors, which accumulated a loss of 6 billion USD within a few weeks by betting on natural gas, hit news headlines worldwide.

    Weather often has played a role. The flooding of New Orleans by Hurricane Katrina led to a price spike in zinc in London, as the majority of zinc warehouses licensed by the London Metal Exchange became inaccessible. An active Atlantic hurricane season in 2006 not only caused oil prices to rise due to damage in the Gulf of Mexico but also pushed the price of orange juice concentrate to new heights.

    A “millennium drought” threatened Australia, resulting in record high wheat prices worldwide. A few years later, a drought in India drove the price of sugar to levels that had not been observed for 30 years. Shortly before that, Cyclone Nargis in Asia caused a human catastrophe. Rice had to be rationed, and the rising prices led to unrest in several countries.

    These fateful events often contrast with individual speculations, in which huge sums of money were involved. For example, trader Evan Dooley lost more than 100 million USD in wheat futures, just a few weeks after the loss of billions by Jérôme Kerviel, in the proprietary trading of French banking giant Société Générale, made world headlines. In 2011, the heritage of Marc Rich, “The King of Oil,” was cashed in: Glencore celebrated its initial public offering, catapulting its CEO Ivan Glasenberg into the list of the top 10 richest people in Switzerland.

    As a new decade began, the trendy themes of commodity markets shifted first to rare earths like neodymium and dysprosium, then to “energy metals” like lithium and cobalt, which are essential for energy storage and the electrification of transportation in the future. Since 2009 blockchain and bitcoins have caught the attention of traders. With tradeable bitcoin futures introduced at COMEX in 2017, the cryptocurrency has now become a commodity. With prices starting the year below 1,000 USD, bitcoins rose to 20,000 USD in 2017; then the cryptocurrency crashed by 80 percent in the first weeks of 2018. In the history of the biggest financial bubbles of mankind, tulip mania was pushed to second place after 400 years at the top.

    The chapters in this book are framed by the biggest and the second biggest financial bubbles in financial history: tulips and bitcoins. In between are the stories of 40 major commodity market events over four centuries. These episodes were accompanied by extreme price fluctuations and individual outcomes, and they demonstrate that each market can be subject to a boom-and-bust cycle due to a change in supply, demand, or other external factors. This holds true for South African–dominated platinum production, sudden frost in coffee or orange harvests, unrest in Côte d’Ivoire that affected the price of cocoa, strikes by Chilean mine workers that pushed copper prices up, and the fluctuation of bitcoin and other cryptocurrency prices because of financial woes.
    Commodity and cryptocurrency markets are now at the crossroads of investment mega trends like demographic revolution, climate change, electrification, and digitalization. Investing in commodities, blockchain, and its applications will remain a thrilling ride.

    1 Tulip Mania: The Biggest Bubble in History 1637

    In the Netherlands in the 17th century, tulips become a status symbol for the prosperous new upper class. Margin trading of the flower bulbs, which are weighed in gold, turns conservative businessmen into reckless gamblers who risk their homes and fortunes. In 1637 the bubble bursts.

    “Like the Great Tulip Mania in Holland in the 1600s and the dot-com mania of early 2000, markets have repeatedly disconnected from reality.” —Tony Crescenzi, Pimco

    At the beginning of the 17th century, the Netherlands were on the threshold of a golden age, a period of economic and cultural prosperity that would last for about a hundred years. The country’s religious freedom attracted a great diversity of people who were persecuted elsewhere because of their faith. At this time, the small and recently founded Republic of the Seven United Netherlands was rising to the rank of world power, becoming one of the leading nations in international trade, while the rest of Europe stagnated.
    As the Hanseatic League (a dominant mercantile confederation in Europe in the Middle Ages) declined in power, the young maritime nation built colonies and trading posts around the world, including New Amsterdam (today’s New York), Dutch India (Indonesia), and outposts in South America and the Caribbean, such as Aruba and the Netherlands Antilles. In 1602 merchants founded the Dutch East India Company (Vereenigde Oostindische Compagnie—VOC), which was endowed with sovereign rights and commercial monopolies by the government. The VOC was the first multinational corporation and one of the largest trading companies of the 17th and 18th centuries. Merchants from Haarlem and Amsterdam experienced an unprecedented economic boom.
    The new class of rich merchants eagerly imitated the lifestyle of noble lords and ladies by building large estates with gigantic gardens. Tulips—which had arrived in Leiden from Armenia and Turkey in the 16th century by way of Constantinople, Vienna, and Frankfurt am Main—quickly became a luxury good and a status symbol of the wealthy. Upper-class women wore the exotic flowers as hair ornaments or on their clothes for social occasions.

    Tulip Mania on the Silver Screen

    Tulip mania is not only an important topic in economics and finance, but it also frequently surfaces in modern pop culture. In the movie Wall Street: Money Never Sleeps (2010), Michael Douglas explains to Shia LaBeouf what happened during the Dutch tulip mania, and a painting of tulips in his apartment is a mocking reminder of that bubble.
    In 2017 Alison Owen and Harvey Weinstein produced the movie Tulip Fever, whose plot is set against the backdrop of the 17th-century tulip wars. In the movie a married noblewoman (Alicia Vikander) switches identities with her maid to escape the wealthy merchant she married, and has an affair with an artist (Dane DeHaan). She and her lover try to raise money by investing what little they have in the high-stakes tulip market.
    The supply of tulip bulbs, however, grew very slowly since a bulb produced only two to three offspring every year, and the “mother” bulb actually faded away after a few seasons. Thus the supply lagged behind demand, and prices rose, opening up a lucrative niche for intermediaries. Tulips were now no longer sold by growers to wealthy clients but at auctions. And instead of occurring at organized exchanges, trading initially took place in pubs and inns. Later, groups gathered to form trading clubs, or informal exchanges, and they organized auctions according to fixed rules.
    Initially the tulip bulbs were traded only during the planting season. However, as demand rose, traders sold bulbs that were still in the ground: It wasn’t the flowers that were sold anymore, but the rights to buy tulip bulbs. By this time, in the 1630s, tulip trading had become a speculative business because no one knew what the flowers would actually look like. Around 400 painters were commissioned to produce pictures that would entice potential buyers.

    Tulips quickly advanced to become a status symbol. Prices skyrocketed, rising to 50 times the original level between 1634 and 1637.

    Flower experts tried to satisfy their demanding clients with newer and ever more gorgeous creations characterized by particularly uniform petals and striking color patterns. The appearance of the mosaic virus, a plant infestation transmitted by aphids, actually created an extremely rare specimen, a surprising plant with flamed, two-color petals.
    At the height of the boom, tulip contracts changed hands as many as 10 times. Prices skyrocketed and between 1634 and 1637 multiplied by a factor of 50. In individual cases, for example the variety Semper Augustus, buyers paid as much as 10,000 guilders for a single tulip bulb, about 20 times a craftsman’s annual salary. In January 1637 alone, prices doubled in a short period of time. An entire house in Amsterdam could be bought for just three tulip bulbs. The speculative bubble reached its climax on February 5, 1637. Traders from all over the region met in Alkmaar, and 99 tulip bulbs changed hands for 90,000 guilders, the equivalent of one million US dollars today. The excess carried the seeds of the tulip’s downfall since the crash had already begun two days earlier in Haarlem. There for the first time, at a simple pub auction, no buyer was found. The reaction spread rapidly. Suddenly all market participants wanted to sell, resulting in the collapse of the entire tulip market in the Netherlands.

    In 1637, the bubble burst: Prices fell by 95 percent, and trading ceased.

    On February 7, 1637, trading stopped entirely. Prices had fallen by 95 percent, and the number of open contracts referring to tulip bulbs exceeded existing bulb supply by a huge multiple. Both buyers and sellers were hoping for a solution from the Dutch government. In the end, futures trading was prohibited, and buyers and sellers were forced to agree among themselves.
    Large parts of the Dutch population had been infected by tulip fever, from nobles and merchants to farmers and casual workers. Most participants, knowing nothing about the market, started their trading with the tulip bulbs and mortgaged their house or farm to increase their initial capital. However, the booming economy in the Netherlands did dampen the negative economic impact of this speculative bubble.
    Dutch tulip mania is the first documented market crash in history, and the analysis of the process can be applied to the dot-com bubble of 1998–2001 or any other financial bubble. In the decades following the tulip fever, the flower changed from an upper-class status symbol to a widespread ornamental plant, which it still is today, almost 400 years later. And almost 80 percent of the world’s tulip crop still comes from the Netherlands.

    Key Takeaways
    •During the Dutch economic boom of the Golden Age, during the 17th century, tulips became an exclusive status symbol of the new, wealthy upper class.
    •Prices skyrocketed, rising by more than 50 times between 1634 and 1637. Wide segments of the Dutch population were gripped by the speculative fever.
    •Before the bust, tulip bulbs traded for as much as the value of a house in Amsterdam. Then, in February 1637, the bubble burst. Prices fell by 95 percent.
    •The tulip mania is the first well-documented market crash in history. And for almost four centuries, it was known as the biggest financial bubble in history, much larger than the dot-com crash of 2000.

    2 The Dojima Rice Market and the “God of Markets” 1750

    In the 18th century, futures contracts on rice are introduced at the Dojima rice market in Japan. The merchant Homma Munehisa earns the nickname “God of Markets” for his market intelligence, and he becomes the richest man in Japan.

    “After 60 years of working day and night I have gradually acquired a deep understanding of the movements of the rice market.” —Homma Munehisa

    During Japan’s Edo period, which began in 1603, the country enjoyed its longest uninterrupted period of peace, and during this time domestic trade and the agriculture sector strengthened. The Dojima rice market was established in Osaka toward the end of the 17th century, and the city became the center of Japanese rice trading in the hundred years that followed. At the Dojima market, rice was traded for other goods, such as silk or tea. A common currency had not yet been established, but rice was generally accepted as payment (for taxes, for example).
    Due to the financial needs of the country’s feudal lords, warehouses started to accept warrants, which promised future delivery instead of the actual goods, and many landowners pledged their harvests for years in advance. Soon trading warrants were uncoupled from trades of physical rice at Dojima; a lively trade in so-called rice coupons evolved. Over time the rice coupons surpassed rice production levels by far. In the middle of the 18th century, almost four times the quantity of rice produced was traded in rice coupons.

    In 1749 around 100,000 bales of rice were traded in Osaka, but at the same time, there were only about 30,000 physical bales of rice in Japan.

    What Is a Rice Coupon?
    Rice coupons are a standardized form of a promise for the future delivery of rice, in which the price, quantity, and delivery date are fixed. If the market price is above the agreed price, the buyer makes a profit. If the price of rice is lower than the contract price, the buyer suffers a loss. Rice coupons are the first known standardized commodity futures in the world, and the Dojima rice market can be regarded as the first modern futures exchange, predating the introduction of trading in Amsterdam, London, New York, and Chicago.
    In 1750, at the age of 36, Homma Munehisa took over his family’s rice-trading company. As the owner of large rice fields in the northwest of Japan, Homma specialized in grain trading. At first he concentrated his activities in Sakata, where his family was located. Later he moved to Osaka.
    There Homma began to trade rice coupons, and in order to be informed as quickly as possible about the actual harvest in Sakata, he built up his own communication system, which covered about 600 kilometers. His family’s rice fields offered him valuable insider information. But in addition, Homma was probably the first to use analyses of historic price movements. He invented a graph, later known as a candlestick chart, that is still in use today. In contrast to a line chart, the “candles” not only show the opening and closing prices in the course of a day but also track the intraday high and low prices. Homma was convinced that by analyzing historic price movements, it was possible to recognize repetitive patterns that would allow him to make a profit.

    Figure 1. Rice. Candlestick chart in USD/cwt 2016, Chicago Board of Trade (CBOT). Data: Bloomberg, 2019.

    The following episode is legendary: Over several days Homma, who seemed to have more background information than his competitors, bought more and more rice from local farmers at the rice exchange in Dojima. Again and again he drew a paper out of his pocket and peered at symbols that remotely looked like candles. On the fourth day, a messenger from the countryside arrived in Osaka with reports of harvest losses because of a storm. The price for rice in Dojima jumped up, but there was hardly any rice for sale.
    In just a few days Homma had gotten control of Japan’s entire rice market, and he became rich beyond description. After his success at the Dojima exchange, Homma moved to Edo (Tokyo) and continued his ascent, acquiring the nickname “God of Markets.” Raised to the aristocracy, he served as a financial advisor to the Japanese government. He died in 1803. It was almost 200 years before his invention, the candlestick chart, was rediscovered and popularized by investors and traders alike.

    Key Takeaways
    •The trader Homma Munehisa cornered the Japanese rice market in 1750, buying physical supplies of rice and acquiring rice coupons on the basis of his superior market intelligence.
    •Earning the nickname “God of Markets,” he became the richest man in the country.
    •Homma invented candlestick charts, which are still used today in financial and technical analysis.

    3 The California Gold Rush 1849

    Gold Rush! Some 100,000 adventurers stream into California in 1849 alone, lured by the vision of incredible wealth. The following year, the value of gold production in California exceeds the total federal budget of the United States. Because of this treasure, California becomes the 31st state in the Union in 1850.

    “Gold! Gold! Gold from the American River!” —Samuel Brannan

    It’s hard to imagine today, but before 1848 California was an inhospitable and remote place, populated mainly by Mexicans, descendants of Spaniards, and Native Americans. Among the few European settlers was the Swiss-German émigré John Augustus Sutter, who had left his wife and children in Switzerland after the bankruptcy of his company and moved to the American West. By this time he owned a large piece of land in the Sacramento Valley, a settlement he called Nueva Helvetica. Sutter built a fort at the confluence of the American and Sacramento Rivers, and on the southern arm of the American River, near the village of Coloma, he started to put up a sawmill. It was there, on the morning of January 24, 1848, that one of the workers, carpenter James Wilson Marshall, found a gold nugget in the riverbed. Sutter and Marshall tried to keep the find secret while they gradually bought up more land. But the news of the spectacular discovery couldn’t be concealed for long when Sutter’s employees began to pay for goods with the gold they had found.
    Things soon got out of control. Samuel Brannan, a Coloma shopkeeper, filled a bottle with gold nuggets and traveled to San Francisco. There he rode through the streets, waving the bottle and shouting, “Gold, gold from the American River,” to gain attention for his business, which just happened to include prospecting equipment. The California Gold Rush was on.
    In 1848 only 6,000 people came to search for gold. But the following year gold fever truly took hold. As news of the finds spread, adventurers from all over the world hurried to California. Almost 100,000 people traveled to California in search of wealth and fast fortune in the boom year of 1849. They came from Asia as well. More and more Chinese arrived at Gum San, the “mountain of gold,” as they called California.
    The numbers are staggering. In 1848 California had fewer than 15,000 people. In 1852, four years after the first gold discovery, the population exploded tenfold. San Francisco grew from fewer than 1,000 inhabitants in 1848 to about 25,000 residents in 1850. By 1855 more than 300,000 adventurers were searching for gold, and there were plenty of merchants to service—and take advantage of—them.

    The Gold Rush in the Movies

    With No Country for Old Men, directed by the Coen brothers, and The Hateful Eight, by Quentin Tarantino, recent years have seen a comeback of the Western as a movie genre. The concept of a gold rush was a popular theme in these movies in the past. Perhaps the most prominent is The Gold Rush (1925), a classic silent movie with Charlie Chaplin in his Little Tramp persona participating in the Klondike Gold Rush. Re-released in 1942, the movie remains one of Chaplin’s most celebrated works. More recent is Gold, made in 2013 by Thomas Arslan: The plot focuses on a small group of German compatriots who head into the hostile northern interior of British Columbia in the summer of 1898, at the height of the Klondike Gold Rush, in search of the precious metal.
    Prices for prospecting gear multiplied by 10. In Coloma, Sam Brannan’s business took in 150,000 USD per month. Still, the promise of great wealth kept miners panning for gold in the riverbeds. Success meant they’d earn about 20 times as much as a worker on the East Coast in one day. In many cases six months of hard work in the goldfields earned adventurers the equivalent of six years of “normal” work. Annual gold production in California rose to 77 tons in 1851.
    The value of that amount of gold exceeded the total US gross domestic product at that time. Many miners, though, had a hard time holding on to their earnings. Far from civilization, merchants charged fantastic prices for their goods, while saloonkeepers profited greatly on alcohol and gambling. In truth, the actual winners of the gold rush were businessmen and merchants like Samuel Brannan. The most famous of these is probably entrepreneur Levi Strauss. Born in Germany, he set up shop in San Francisco, and when he realized prospectors needed sturdy trousers to work in, he trimmed tent fabric to meet the demand. Jeans were born.

    Almost 100,000 people came to California in 1849 alone. By 1855 there would be more than 300,000 new migrants.

    With its growth in wealth and population, California’s political weight also increased. In 1850 the “Golden State” was incorporated into the United States. The boom didn’t last forever, though. Around 1860 the easily accessible gold reserves had been depleted, and many cities were abandoned. The population of Columbia, founded just 10 years earlier, dropped from 20,000 people to 500. Boom towns became ghost towns.
    The pattern of the California Gold Rush would be repeated in other places over the next half century. Within a decade, the population of Australia multiplied by 10 in the aftermath of the 1851 gold rush on that continent, which evolved from a British convict colony to a more or less civilized state. In 1886 gold was found on the Witwatersrand south of Pretoria in Transvaal, South Africa. In a few years, Transvaal became the largest gold producer in the world. And in 1896, gold was discovered on the Klondike River in Alaska, leading to boom towns such as Dawson City at the confluence of the Klondike and the Yukon Rivers, which grew from 500 to 30,000 inhabitants within two years.
    As for California, Sutter’s settlement eventually developed into Sacramento, the capital of the state. The huge wave of 19th-century gold seekers is recalled in the name of San Francisco’s football team—the 49ers. And what about John Augustus Sutter? He died in poverty in 1880.

    Key Takeaways
    •The discovery of gold by Swiss-German immigrant John Augustus Sutter and James Wilson Marshall triggered a true global gold rush. More than the prospectors, however, it was the merchants who generally became rich selling equipment and services.
    •The California Gold Rush of 1849 kicked off a huge wave of immigration—with 100,000 new arrivals in that year alone.
    •The discovery of gold accelerated California’s development, leading to statehood in 1850.
    •The pattern of gold rush booms was followed in Australia, South Africa, and the Yukon.

    4 Wheat: Old Hutch Makes a Killing 1866

    The Chicago Board of Trade is established in 1848, and Benjamin Hutchinson, known as “Old Hutch,” later becomes famous by successfully cornering the wheat market. He temporarily controls the whole market and earns millions.

    “Did you hear what Charlie said? Charlie said we were philanthropists! Why bless my buttons, we’re gamblers! . . . You’re a gambler! and I’m a gambler!” —Benjamin Hutchinson

    ACorner in Wheat is a short silent American film, made in 1909, that tells of a greedy tycoon who tries to corner the world market on wheat, destroying the lives of the people who can no longer afford to buy bread. The classic movie, set in the wheat-speculation trading pits of the Chicago Board of Trade building, was adapted from a novel and a short story by Frank Norris, titled The Pit and “A Deal in Wheat,” respectively. In 1994 A Corner in Wheat was selected for preservation in the US National Film Registry by the Library of Congress as being “culturally, historically, or aesthetically significant.”
    Chicago had become the hub for agricultural products in the American Midwest in the 19th century, as large quantities of grains entered the city and more and more warehouses were built to better coordinate supply and demand. Prices regularly came under pressure, and in 1848 the Chicago Board of Trade (CBOT) was founded.
    Benjamin Peters Hutchinson, nicknamed “Old Hutch,” is famous for being the first person to corner the wheat market. Born in Massachusetts in 1829, he moved to Chicago at the age of 30, started trading in grain, and became a member of the CBOT.
    In 1866 Hutchinson was betting on a poor wheat harvest. From May to June of that year, he grew his position, both in the spot market and in futures contracts. His average realized price was reported to be 88 US cents per bushel. Then, in August, the price began to rise steadily because of below-average harvests in Illinois, Iowa, and other states that delivered grain to Chicago. On August 4, the price of wheat ranged between 90 and 92 US cents per bushel. Short sellers soon realized that there would not be enough wheat to meet their delivery obligations. (The strategy of short sellers is to sell contracts at the beginning of the season; they assume that prices during harvest season will come under pressure, and they’ll be able to close their positions with a profit.)
    By August 18, Hutchinson’s control of the tight physical market had driven wheat prices up to 1.87 USD. He had become a rich man. As a consequence, however, the CBOT declared illegal the practice of acquiring futures contracts and trying to prevent physical delivery at the same time.

    What Is a Commodity Futures Exchange?

    The Chicago Board of Trade, established in 1848, is one of the oldest organized commodity futures exchanges in the world. The function of every futures exchange is to provide liquidity and a central marketplace for buyers and sellers to handle standardized contracts (futures and options) that are subject to physical delivery in the future. At the CBOT, these are mainly agricultural products such as wheat, corn, or pork bellies. In 1864 the CBOT introduced the first standardized exchange-traded futures contracts. In 2007 the CBOT and the Chicago Mercantile Exchange (CME) merged into the CME Group. Ten years later, the CME introduced bitcoin futures in the commodity segment of the exchange.
    In 1888 Hutchinson saw another opportunity for lucrative speculation. During the spring, he bought wheat in the spot market and acquired more and more futures contracts for maturity and delivery in September. The storage capacity in the city was around 15 million bushels, and Hutchinson controlled most of the wheat available in Chicago through the spot market.

    On September 22 the wheat price broke the psychological level of 1 USD.

    As a few years before, his average realized price was below 90 US cents per bushel. But this time Old Hutch was facing a powerful group of short sellers who included John Cudahy, Edwin Pardridge, and Nat Jones; they would challenge him over future deliveries in September.
    Until August, the price of wheat remained at around 90 US cents per bushel. But Old Hutch again had the right instincts. Frost destroyed a large part of the local crop. And European demand for wheat imports also grew because of an unexpectedly large crop deficit. The price started to rise, and on September 22 it broke the psychologically important mark of 1 USD.

    One day before maturity of the futures contracts, prices climbed to 1.50 USD. Hutchinson set the final settlement price at 2 USD.

    On September 27, three days before the contracts for September expired, wheat prices rose to 1.05 USD, then increased further to 1.28 USD. Market participants caught on the wrong side began to panic, and short sellers were forced to cover their positions in what’s known as a “short squeeze.” With his positions in the physical market, Old Hutch controlled the price. The day before maturity, on September 29, he offered 1.50 USD to the big short sellers and raised the settlement price to 2 USD. Based on his average realized price, Hutchinson must have realized a profit of around 1.5 million USD.
    He wasn’t done speculating, however. Within the next three years, Hutchinson had given up his profit. Later he lost his entire fortune.

    Key Takeaways
    •Benjamin Peters Hutchinson, nicknamed “Old Hutch,” was a grain trader who bought wheat on the spot market and acquired contracts for future delivery at the Chicago Board of Trade (CBOT). By cornering the wheat market in Chicago in 1866 and 1888, he was able to double his investments within weeks, earning a fortune.
    •The CBOT was established in 1848 and is today one of the oldest organized commodity futures exchanges in the world. The exchange later declared illegal the practice of cornering a market by buying harvests physically and financially at the same time.
    •The CBOT and the Chicago Mercantile Exchange (CME) merged in 2007 to become the CME Group.

    5 Rockefeller and Standard Oil 1870

    The US Civil War triggers one of the first oil booms. During this time, John D. Rockefeller founds the Standard Oil Company. Within a few years, through an aggressive business strategy, he dominates the oil market, from production and processing to transport and logistics.

    “Competition is a sin.” —John D. Rockefeller

    The production of petroleum from coal or crude oil as an inexpensive alternative to whale oil for lamp fuel is commonly regarded as the beginning of the modern petroleum industry. On August 27, 1859, Colonel Edwin Drake discovered a lucrative deposit of crude oil near Titusville, Pennsylvania. The onset of the American Civil War two years later sparked the first oil boom in that state. The price of oil rose to more than 100 USD per barrel (measured in today’s prices). Drilling rigs soon spread across farms in northwestern Pennsylvania, as hundreds of small refineries were created near the oil wells and along the transport routes to Pittsburgh and Cleveland, Ohio, cities that were home to major railroad crossroads: The New York Central and Erie Railroad led to Cleveland, while Pittsburgh served as an important east-west junction on the Pennsylvania Railroad. The majority of freight on these railways still consisted of grains and industrial goods, but the volume of oil products was growing rapidly.
    In 1863 John Davison Rockefeller, age 24, founded a small oil refinery in Cleveland together with his brother William. The son of penniless German immigrants, John worked as a dishwasher during his school years and graduated as an accountant. Rockefeller’s company was successful and prospered, despite fluctuations in the market. The oil boom had led to a spike in production, and the price of the commodity fell from 20 USD per barrel in 1861 to only 10 US cents. In 1866, one year after the end of Civil War, however, the price had risen again to more than 1.50 USD.

    Figure 2. Crude oil prices 1861–2018, in USD/barrel (real prices of 2015). Data: BP Statistical Review of Energy, 2019.

    With William, Rockefeller founded a second refinery in 1866, then, in 1870, he reorganized his company, naming it the Standard Oil Company. A year later, Rockefeller and other refinery owners formed an alliance to obtain discounts from railway operators. In addition, this alliance was responsible for railway operators raising prices for competitors, which led to an oil war in 1872.
    At the end of that year, Rockefeller took over the presidency of the National Refiners Association, which represented 80 percent of all American refineries. He would continue to aggressively grow Standard Oil, and by 1873 he had managed to acquire or to control almost all refineries in Pennsylvania.

    From Crude Oil to the Plastic-Wrapped Cucumber at Your Supermarket

    A refinery splits crude oil into its various components, such as light and heavy fuel oil, kerosene, and gasoline. With additional steps, a variety of alkanes and alkenes can also be produced from petroleum. Petroleum remained the most important use of crude oil until the rapid spread of automobiles in the 1920s. Although Henry Ford had intended ethanol to fuel his cars, the Rockefeller family, as founders of the Standard Oil Company, pushed for gasoline to power automobiles and succeeded.
    Today, oil is still by far the most important source of energy, at the core of every industrial society, and the base for numerous chemical products, such as fertilizers, plastics, and paints. Although three-quarters of crude oil production is used in transportation, it will take e-mobility further decades at least to challenge the supremacy of crude oil.
    Between 1875 and 1878, Rockefeller traveled throughout America to convince the owners of the 15 largest refineries to become part of his Standard Oil Company. Smaller companies had to follow suit or perish: For example, the plant of the Vacuum Oil Company, founded in 1866, went up in flames. Other entrepreneurs sold Rockefeller their companies for well below half of their market value. As early as 1882, Standard Oil controlled more than 90 percent of the refinery business in the United States.
    Next, the company turned to pipeline and distribution networks. Rockefeller built his own sales channels, forcing other trading networks out of the market. In late 1882, the National Petroleum Exchange opened in New York to facilitate the trading of oil futures.
    In the end, Standard Oil had a hold over virtually the whole crude oil value chain in the United States—from oil production to processing, transport, and logistics—and began to extend its dominance to the global oil market as well.

    Accumulating a fortune of around 900 million USD by 1913, Rockefeller represented the American Dream, the richest man of all time.

    By transforming his enterprise, Rockefeller was able to postpone the destruction of his empire. But his aggressive company strategy eventually prompted the first antimonopoly legislation in the United States. In 1911, the Supreme Court ordered the dismantling of Standard Oil. As a result, the company’s share price fell like a stone. Rockefeller, nevertheless, was able to buy back large quantities of the stock, which only increased his fortune in the years that followed. World War I, increasing motorization, and advances in the industrialization process all resulted in a rapid increase in the demand for oil.
    Eventually Standard Oil was broken up into 34 individual companies, from which today’s ExxonMobil and Chevron have emerged. Other sections of the original firm were liquidated over time or were absorbed by other oil and gas companies.
    Back in 1913, the total wealth of John D. Rockefeller was estimated at 900 million USD, the equivalent of 300 billion USD today. This is more than twice the private wealth of Jeff Bezos, founder and CEO of Amazon and, according to Forbes, the wealthiest man in the world today (before his divorce).
    The son of John D. Rockefeller, Nelson, almost became president of the United States, but instead served as vice president from 1974 to 1977. David Rockefeller, the last grandson of John D. Rockefeller, died in 2017. Even today, the name Rockefeller is a symbol of vast wealth and also of philanthropy.

    Key Takeaways
    •The American Civil War fueled the first crude oil boom in history. Prices in 1861 soared above 100 USD (in today’s currency).
    •John D. Rockefeller founded the Standard Oil Company, a corporation that not only came to control the US market for crude oil but also dominated the global market.
    •The rise of the automotive industry and industrialization in general propelled all developing countries into the oil age.
    •John D. Rockefeller personified the American Dream par excellence, rising from a dishwasher to a multibillionaire. Even in 2019 his surname remains a synonym for immeasurable wealth.
    •Though Standard Oil was broken up, successor companies like Exxon-Mobil and Chevron are still operating today.

    6 Wheat: The Great Chicago Fire 1872

    The Great Chicago Fire of October 1871 leads to massive destruction in the city and leaves more than 100,000 residents homeless. The storage capacities for wheat are also significantly reduced. Trader John Lyon sees this as an opportunity to earn a fortune.

    “Being a firefighter is not something you do; it’s something you are.” —the TV show Chicago Fire

    The sun burned hot in the American Midwest during the summer of 1871. In and around Chicago, only 3 centimeters of rain fell between July and October. Water resources were nearing depletion, and small fires sprang up regularly. On October 8, a fire broke out in a barn, initiating a disaster that became known as the “Great Chicago Fire.”

    Winds from the southwest fanned the flames and set neighboring houses on fire. Traveling quickly, the fire spread toward the city center and crossed the Chicago River. It took two days to get the conflagration under control, and by then an area of more than 8 square kilometers and 17,000 buildings had been destroyed. Every third inhabitant of the city lost his home. The damage has been estimated at more than 200 million USD. In addition to large parts of the city, the fire destroyed 6 out of the 17 warehouses approved by the Chicago Board of Trade (CBOT). The city’s total storage capacity decreased from about 8 to 5.5 million bushels. John Lyon, a large-scale wheat trader, saw the opportunity to make a profit. He joined with another trader, Hugh Maher, and CBOT broker P. J. Diamond, to manipulate the wheat market.

    What’s What with Wheat

    Different types of wheat are traded on futures exchanges. In the United States, wheat is traded on the Chicago Board of Trade (CBOT) and the Kansas City Board of Trade (KCBT), with the volume of Chicago Soft Red Winter Wheat (soft wheat) outweighing Kansas Hard Red Winter Wheat (hard wheat). Chicago wheat is mainly grown in an area that extends from Central Texas to the Great Lakes and the Atlantic Ocean. Kansas wheat grows primarily in Kansas, Nebraska, Oklahoma, and parts of Texas.

    At CBOT, wheat is traded in US cents per bushel and designated with the abbreviation W plus a letter and number that stands for the current contract month (e.g., W Z9 for wheat delivered in December 2019). A contract refers to 5,000 bushels of wheat, with one bushel corresponding to 27.2 kilograms. Therefore, one contract refers to around 136 metric tons of wheat.

    In the spring of 1872, the group began to buy wheat in the spot and futures market. Wheat prices rose continuously through early July, and contracts specifying delivery in August traded between 1.16 and 1.18 USD per bushel. At the beginning of July an average of just 14,000 bushels of wheat a day reached the city; by the end of the month, prices had climbed to 1.35 USD. In response, however, wheat deliveries to Chicago increased.

    By the beginning of August, 27,000 bushels a day were coming in. But luck was still with Lyon. Another warehouse burned to the ground, and the city’s already stretched storage capacity was reduced by another 300,000 bushels. Rumors about a below-average harvest due to bad weather pushed up prices even more. On August 10 these two factors combined to push wheat contracts for August up to 1.50 USD. On August 15 prices climbed to above 1.60 USD. But then the wheel of fortune started to turn.

    As more and more wheat reached the city of Chicago, Lyon was forced to give up.

    The high prices incentivized farmers to speed up their harvest: Crops were picked into the night. In the second week of August, about 75,000 bushels of wheat reached Chicago each day; a week later that figure had risen to 172,000 bushels. For the rest of the month, daily deliveries increased to nearly 200,000 bushels.

    Wheat that had already been shipped from Chicago to Buffalo returned to the Windy City, because of the high local prices. Newly opened warehouses also added to the storage capacity in the city, bringing it to more than 10 million bushels—two million bushels more than before the Great Fire!

    To secure their profits and stabilize prices, Lyon and his partners had to buy all the wheat coming into Chicago. But they were already leveraged by local banks, and the additional funds they needed soon exceeded the group’s financial options.

    On Monday, August 19, Lyon had to admit defeat. He could no longer afford to buy wheat in the spot market. The price of wheat with delivery in August fell by 25 US cents. The following day prices dropped another 17 US cents. The crash ruined John Lyon, who was unable to meet his margin calls. His attempt at market manipulation ended in financial disaster and bankruptcy.

    Key Takeaways
    •The Great Chicago Fire of 1871 led to massive destruction and left more than 100,000 people homeless.
    •With the number of grain warehouses drastically reduced, a group of speculators around John Lyon saw a big opportunity in the wheat market. Together they tried to corner the wheat market, but rises in price also resulted in increased shipments of wheat to the city. After initially increasing to 1.60 USD, the price of wheat crashed.
    •Lyon and his friends were unable to meet their margin calls. Their attempt at cornering the market ended in bankruptcy and financial disaster.

    7 Crude Oil: Ari Onassis’s Midas Touch 1956

    Aristotle Onassis, an icon of high society, seems to have the Midas touch. Apparently emerging out of nowhere, he builds the world’s largest cargo and tanker fleet and earns a fortune with the construction of supertankers and the transport of crude oil. Onassis closes exclusive contracts with the royal Saudi family, and he is one of the winners in the Suez Canal conflict.

    “The secret of business is to know something that nobody else knows.” —Aristotle Onassis

    At the beginning of December 2005 the youngest billionaire in the world, Athina Roussel, age 20, celebrated her wedding to 32-year-old Brazilian equestrian Álvaro Alfonso de Miranda Neto. A thousand bottles of Veuve Clicquot were ordered for the 1,000 guests at the São Paulo nuptials. Athina was the only heiress to the Onassis fortune, the last of her clan. Her grandfather, Aristotle “Ari” Socrates Onassis, would have been almost 100 years old.

    A central figure in the high society of the 1950s, ’60s, and ’70s, Aristotle Onassis earned his fortune by constructing supertankers and transporting crude oil. Like Rockefeller, Onassis became synonymous with wealth and fortune. But his rise to fame was not a straightforward one.

    The Onassis family initially became wealthy through the tobacco trade. Based in the city of Smyrna, Ari’s father had a fleet of ten ships. Ari himself enjoyed a good education. At 16 he already spoke four languages—Greek, Turkish, English, and Spanish. In 1922, however, when the Turks retook Smyrna (Izmir), which had been under Greek rule since World War I, the family had to flee. They were forced to leave everything behind. Virtually penniless, Onassis migrated to Argentina and earned money by importing tobacco. He also kept himself afloat with occasional jobs.

    In the 1930s the world economic crisis offered Onassis an attractive business opportunity in the form of large-scale transport of crude oil.

    The economic crisis of the 1930s offered Onassis the opportunity to get into the crude oil transport business on a large scale. There were rumors that the Canadian National Steamship Company was in serious financial difficulties and that several of its freighters were for sale. Onassis took all the money he’d accumulated and purchased six rundown ships for 120,000 USD, one-tenth of their value at the time.

    With that bold move, Onassis laid the foundation of his empire. The purchase quickly paid off during the economic recovery that followed. At the beginning of World War II, Onassis’s fleet had grown to 46 freighters and tankers, and he leased them to the Allied forces on profitable terms.

    Ari and the Women

    Aristotle Onassis married into another family of successful Greek shipowners when he wed Athina “Tina” Livanos. They divorced in the 1950s, however, after he began a long relationship with celebrated opera diva Maria Callas, who separated from her husband for Onassis. In 1968 Onassis married Jacqueline Kennedy, widow of President John F. Kennedy. At the time, Onassis was 62 years old; Jackie was 23 years younger. Because of her spending on travel and shopping, Onassis nicknamed her “supertanker,” since he said she cost him just as much as a ship.

    During the war, Onassis’s ships changed their flags to neutral Panama and remained undisturbed by naval battles. As more and more freight ships were lost to the conflict, his own fleet’s rates rose higher, creating a gold mine for Onassis. After the war, he expanded the number of his ships into the largest private commercial fleet in the world, and in 1950, he commissioned the biggest tanker in the world, 236 meters long, to be completed at the German Howaldt shipyard.

    But it was not until spring 1954 that the 48-year-old Onassis made a definite breakthrough. Through shady contacts and friendships, he struck a lucrative agreement with the royal family of Saudi Arabia. Onassis not only received the exclusive right to transport crude oil for King Saud, but he also was to produce a new supertanker for the country almost every month and would participate in the sale of crude oil. Together Onassis and Saudi Arabia set up the Saudi Arabian Tanker Company, with a goal of having 25 to 30 ships that could transport about 10 percent of the country’s crude oil.

    By royal decree the Arabian American Oil Company (Aramco) would have had to use Saudi Arabian ships for the tonnage previously shipped in charter ships. Aramco—a joint venture among Standard Oil (New Jersey), Standard Oil of California, Socony Vacuum, and Texas Co.—had had a concession agreement with King Ibn Saud since 1933 and was responsible for nearly 10 percent of the world’s oil production. About half of the oil produced in Saudi Arabia went by pipeline to Lebanon; the other half was transported by tankers. Of the tanker market, 40 percent of crude was shipped in Aramco’s own tankers; for the remaining 60 percent, the company used charters.

    The Suez Canal conflict resulted in enormously profitable opportunities for Onassis.

    By breaking into this system, Onassis made some powerful enemies. The United States tried to block the agreement to safeguard its own influence, and Europe—which in the 1950s derived 90 percent of its oil supply from the Middle East, whose largest producer was Saudi Arabia—was also unenthusiastic. The deal with Saudi Arabia ultimately fell through, and without the new freight orders, Onassis’s ships sat idle in shipyards around the world. The Greek magnate’s empire began to crumble. But he was rescued by the Suez crisis in 1956.

    With the growing economic importance of crude oil, European nations increasingly were dependent on the use of the Suez Canal to bring fuel from the producing countries. But the nationalist policies of the new Egyptian president, Gamal Abdel Nasser, were intensifying conflicts with Israel as well as with France and Great Britain, which controlled the canal. Egypt blocked the Gulf of Aqaba and Suez Canal to Israeli shipping; then on July 26, 1956, Nasser nationalized the Suez Canal.

    Britain’s prime minister, Anthony Eden, responded together with Israel and France with Operation Musketeer. On October 29, Israel invaded the Gaza Strip and the Sinai Peninsula and quickly pushed toward the canal. Two days later Britain and France began bombing Egyptian airports. Although the Egyptian army was quickly beaten and the war was over by December 22, 1956, sunken ships continued to block the Suez passage until April 1957.

    The crisis brought salvation to Aristotle Onassis. No other shipowner had the transport capacity to move the oil. With more than 100 idle tankers and virtually no competition, he was able to double his rates, once again earning a fortune. The Six-Day War in 1967 offered a similar opportunity, and later, during the oil crisis in 1973, Onassis’s Olympic Maritime Company posted a profit of more than 100 million USD.

    Aristotle Onassis earned his fortune through the transport of crude oil. He became a society icon through his extravagant lifestyle and his marriage to Jackie Kennedy.

    By then, Onassis’s total private wealth was estimated at more than 1 billion USD. Throughout his career he had diversified into other businesses: He bought banks in Geneva, founded Olympic Airways, built the Olympic Tower on Fifth Avenue in New York, and acquired the Greek island of Skorpios. Onassis became enamored of Monaco, which had been a dull, sleepy little place until he transformed it. In Monte Carlo, Onassis bought beautiful hotels and dozens of houses and villas, built public facilities and beach clubs, and renovated the port and the casino. He held legendary gatherings on his yacht, inviting guests who included President John F. Kennedy and his wife, Winston Churchill, Ernest Hemingway, and other members of high society from business, politics, and Hollywood. Onassis even brought together Prince Rainier of Monaco and American actress Grace Kelly, helping establish Monaco as a paradise for the rich and beautiful in Europe.

    Key Takeaways

    •Aristotle “Ari” Socrates Onassis earned a fortune by transporting crude oil in his huge tanker fleet and through his excellent relationships with the Saudi family.
    •He profited massively from the Suez crisis in 1956 and the oil crises of the 1970s.
    •Onassis was an icon of the international jet set, thanks to his relationship with opera star Maria Callas, and his second marriage to Jacqueline Kennedy, the widow of John F. Kennedy.
    •With his private wealth of more than 1 billion USD, Onassis supported Prince Rainer of Monaco and established the principality as the place to be for the rich and beautiful.

    8 Soybeans: Hide and Seek in New Jersey 1963

    Soybean oil fuels the US credit crisis of 1963. The attempt to corner the market for soybeans ends in chaos, drives many firms into bankruptcy, and causes a loss of 150 million USD (1.2 billion USD in today’s prices). Among the victims are American Express, Bank of America, and Chase Manhattan.

    “You have caused terrific loss to many of your fellow Americans!US federal judge Reynier Wortendyke

    At first glance, it seemed like a plot for a Hollywood movie: Workers deceived warehouse inspectors using oil tanks filled with water to hide one of the largest credit frauds in US history. It was all part of an attempt to corner the soybean market, a fragile house of cards whose collapse caused a loss of more than 150 million USD (the equivalent of about 1.2 billion USD today) and whose effects rippled throughout corporate America.
    At the center of the debacle were Allied Crude Vegetable Oil, a New Jersey company, and its owner Anthony (“Tino”) De Angelis. In the end the unraveling of the scheme was analogous to the bankruptcy of Lehman Brothers in 2008: On a November evening in 1963, a group of employees of the Wall Street brokerage firm Ira Haupt & Co., including managing partner Morton Kamerman, sat in a conference room and spoke on the phone with Anthony De Angelis. As the conversation heated up, De Angelis accused Kamerman of ruining his company. Kamerman was not responsible for his firm’s commodity trading, but he was aware that De Angelis was one of his biggest customers. The Haupt & Co. partners were desperately looking for someone willing to buy soybean oil in large quantities, but they had no success. The next morning Kamerman understood a lot more about his company’s commodity business. However, the knowledge went hand in hand with the fact that Haupt & Co. was bankrupt due to the insolvency of Allied Crude.

    Some Background About Soybeans

    Soybeans, which are predominantly crushed for soybean oil and soybean meal, are produced and exported mainly by the United States “Corn Belt” (Illinois and Iowa), Brazil, and Argentina. Together these countries account for about 80 percent of the world’s soybean harvest of around 215 million metric tons. In most of the world’s production, the oil is extracted first, and the residual mass is used primarily as a feedstock. Soybeans, soybean meal, and soybean oil are traded on the Chicago Board of Trade (CBOT) with the symbol S, SM, and BO and the respective contract month (for example, S F0 = Soybean January 2020).

    Figure 3. Prices for soybean oil, 1960 – 1964, in US cents/lb, Chicago Board of Trade. Data: Bloomberg, 2019.

    Anthony De Angelis had founded Allied Crude Vegetable Oil in 1955 to buy subsidized soybeans from the government, process them for soybean oil, and sell the product abroad. Born in 1915, he was the son of Italian immigrants and grew up in the Bronx in New York. As a commodity trader, he dealt in cotton and soybeans, and between 1958 and 1962, he built a refinery in Bayonne, New Jersey, and leased 139 oil tanks, many as high as a five-story building. American Express Warehousing, a subsidiary of American Express, was paid by Allied Crude for storage, inspection, and certification of the oil volume. In 1962 De Angelis was responsible for about three-quarters of the total soybean and cottonseed oils in the United States. But in order to finance the rapid growth of the company in a highly competitive industry, he increased leverage by taking more and more credit, which was largely collateralized by the oil he produced.

    And that is where the fraud began: Allied Crude Vegetable Oil never had as much oil as was necessary to secure its loans. A close investigation by American Express Warehousing would have revealed that De Angelis needed to store more oil than was available in the entire United States, according to the US Department of Agriculture’s monthly data. At its peak, De Angelis’s credit volume represented more than three times the amount of oil that could be stored in the tanks in Bayonne. But De Angelis was American Express’s largest customer. And his employees deceived the inspectors who were sent to check the collateral by pumping oil from tank to tank or filling the tanks mainly with water and only a small amount of oil. In this way the company continued to receive new credit lines.
    Instead of expanding operations, however, the company used the credit lines for speculation in soybean futures at Chicago’s commodity exchange. De Angelis placed huge bets on rising prices for soybeans; he had to deposit only about 5 percent of the future purchase sum as a margin. Nevertheless, in his attempt to corner the entire market through further positions, De Angelis needed an even higher credit line.
    He was already trading in futures contracts with Wall Street brokers Ira Haupt and J. R. Williston & Beane, and they agreed to further credit against stockpiles of the nonexistent oil. Both institutions were financed on the basis of their warrants by commercial banks Chase Manhattan and Continental Illinois.
    By mid-1963, De Angelis had accumulated soybean positions equaling about 120 million USD or 1.2 billion pounds. A tick of only 1 US cent in the price of soybeans meant that De Angelis gained or lost 12 million USD. For a while his trades were profitable. In just six weeks in autumn 1963, the price of soybean oil climbed from 9.20 USD per pound to 10.30 USD. But on November 15 the market collapsed because of Russian plans to buy more US grain and the negative reaction to this. Allied Crude Vegetable Oil collapsed with it.

    De Angelis deceived his creditors and caused losses of more than 1 billion USD in today’s prices.

    Within four hours soybean oil had fallen to 7.60 USD per pound, and the Chicago Board of Trade called for additional margins from Ira Haupt, which the company was unable to provide because its main customer, De Angelis, was not in a position to do so. Even another 30 million USD borrowed by American and British banks was not enough to rescue Ira Haupt. Williston & Beane was also forced to merge with Walston & Co. because of dwindling equity.

    The soybean market tumbled and took Allied Crude down with it.

    Allied Crude went into bankruptcy, and as creditors reviewed the company’s tanks more carefully, they confirmed there were just 100 million pounds of soybean oil there instead of 1.8 billion pounds. This difference was worth about 130 million USD.
    Affected by the debacle were banks, brokers, oil traders, and warehouses, huge firms like Bank of America, Chase Manhattan, Continental Illinois, Williston & Beane, Bunge Corp., and Harbor Tank Storage Co., to name just a few. The main loser was the parent company of American Express Warehousing: American Express faced legal suits by 43 companies, to the tune of more than 100 million USD. The share price of American Express dropped by more than 50 percent after the fraud hit the news. The scandal, however, received only limited attention, because two days later President Kennedy was shot in Dallas.
    For Ira Haupt & Co., liabilities amounted to almost 40 million USD, which they were not able to meet, affecting more than 20,000 brokerage customers. Even worse than these financial claims was the damage to the reputation of the US economy. As for Anthony De Angelis, in 1965 he was sentenced to 10 years’ imprisonment for fraud.

    Key Takeaways
    •In 1963 Anthony (“Tino”) De Angelis and his company Allied Crude Vegetable Oil were at the epicenter of one of the biggest corporate credit crises before the collapse of Lehman Brothers in 2008.
    •By cheating on inventories and in a bold pattern of fraud, Allied Crude received immense credit lines for its business and heavily speculated on the rise of soybean and soybean oil futures in Chicago. Eventually the market for soybeans crashed in November 1963 and took Allied Crude Vegetable Oil with it.
    •Affected by the fraud were several banks, brokers, oil traders, and warehouse companies, including prominent names like American Express, Bank of America, and Chase Manhattan.
    •The huge scandal, however, was overshadowed by the assassination of President John F. Kennedy two days later.

    9 Wheat: The Russian Bear Is Hungry 1972

    The Soviet Union starts to buy American wheat in huge quantities, and local prices triple. Consequently, Richard Dennis establishes a ground-breaking career in commodity trading.

    “If you live among wolves you have to act like a wolf.” —Nikita Khrushchev

    In the history of capital markets, 1972 is known as the year of “The Great Russian Grain Robbery.” Because of harvest shortages, Soviet commissioners were traveling all over the United States, buying as much wheat as they could. Their actions affected not only the grain market but also the career of a young commodity trader named Richard Dennis.
    At the beginning of the 1970s, the United States was beginning to abolish the gold standard, and as a result the US currency subsequently weakened. At the same time, wheat was trading close to 1 USD—historically low levels. That was not a surprise, since wheat production was massively subsidized by the government. But the weakening dollar gradually made American products, including many agricultural goods, more competitive. As a result, exports rose, and hand in hand with export volume, prices began to rise as well: That included grain prices, which were slowly awakening from their slumber.

    In the history of capital markets, 1972 is known as the year of “The Great Russian Grain Robbery.”

    Weather is always a key factor for agricultural prices, and after years of good harvests, the world’s grain production started to decline in 1972. Poor weather conditions were responsible for lower yields in important producer nations like the United States, Canada, Australia, and the Soviet Union. In comparison to 1970–1971, wheat stocks in 1973–1974 fell by 93 percent in Australia, 64 percent in Canada, and 59 percent in the United States. Inventories approached critically low levels.

    Figure 4. Wheat prices, 1970–1977, in US cents/bushel, Chicago Board of Trade. Data: Bloomberg, 2019.

    In July and August 1972, the Soviets bought nearly 12 million metric tons of US wheat—approximately 30 percent of the country’s production—amounting to a net value of about 700 million USD. Because farmers were already facing problems meeting demand, prices increased sharply, from below 2 USD at the beginning of the decade to more than 6 USD in February 1974. Corn spiked at the same time, from less than 1.5 USD to nearly 4 USD, while soybean prices more than tripled, reaching their highest level of more than 12 USD in June 1973.

    Weather Woes

    The harvest of Kansas wheat (Hard Red Winter Wheat), which is mainly exported, can be threatened by climatic fluctuations three times during the year: in late autumn, when it is too hot and dry or too cold and humid for germination; during winter, when sudden temperature changes threaten growth; and finally, in spring, when rain prevents pollination. For these reasons crop quality, quantity, and price are all subject to huge fluctuations.

    The rapid price spike favored young Richard Dennis, who had studied in Chicago and at Tulane University in Louisiana and had worked as a student at the Chicago Mercantile Exchange (CME) in 1966 at the age of 17. He began speculating with 2,000 USD in initial capital from his family, first with small contracts on the MidAmerica Exchange, and later on the CME.

    In 1972 the 23-year-old Dennis recognized the new agricultural market trend. He bet on rising wheat prices and won. A year later, in 1973, his initial capital increased to 100,000 USD as he took advantage of a trend-following system, aggressively increased his positions, and remained invested. In 1974 he made a profit of 500,000 USD on soybeans alone, and by the end of the year, he’d become a millionaire at the age of 25.

    The Soviet shopping spree of 1972 was repeated in 1977 after another bad harvest in Eastern Europe.

    Three years later history repeated itself. In 1977 Soviet president Brezhnev announced a national wheat harvest of less than 200 million tons, which took the markets by surprise as the US Department of Agriculture and US intelligence both were forecasting a good harvest.
    By this time Soviets had already bought 18 to 20 million tons of wheat from the United States, Canada, Australia, and India. Although worldwide production of wheat was around 600 million metric tons, according to data from the Food and Agriculture Organization (FAO), only a small fraction of that quantity was globally traded. Because large amounts are consumed by the producer countries themselves, world market prices can fluctuate dramatically based on relatively small changes in global trading.
    Meanwhile, Dennis’s career continued to soar. At the beginning of the 1980s, his capital rose to around 200 million USD. At 35 he was known as the “Prince of the Pit” and was one of the most recognized commodity traders in the world.
    In 1983 and 1984 Dennis recruited and trained 21 men and two women in commodity trading. The group later became known as “Turtle Traders,” thanks to an often-quoted comment by Dennis, who said, “You can breed traders like turtles in a laboratory.” Five years later the group had earned him a profit of 175 million USD.

    Key Takeaways
    •After a bad harvest, agents of the Soviet Union quickly and secretly purchased 30 percent of the total US wheat crop. Therefore, 1972 became famous as the year of the “Great Russian Grain Robbery.”
    •Grain shortages and the Soviet actions caused a spike in prices: Wheat prices that traded at 2 USD in 1970 shot up above 6 USD in February 1974, a threefold increase within 24 months. Corn also rose from 1.50 USD to nearly 4 USD, while soybean prices surpassed 12 USD during the summer of 1973.
    •Richard Dennis, age 23, recognized the new trend in agricultural markets and bet on rising wheat prices. He became a millionaire two years later, After a decade he was making a profit of 200 million USD, earning the nickname “Prince of the Pit.”

    10 The End of the Gold Standard 1973

    Gold and silver have been recognized as legal currencies for centuries, but in the late 19th century silver gradually loses this function. Gold keeps its currency status until the fall of the Bretton Woods system in 1973. The current levels of sovereign debt are causing many investors to reconsider an investment in precious metals.

    “Gold and silver, like other commodities, have an intrinsic value, which is not arbitrary, but is dependent on their scarcity, the quantity of labour bestowed in procuring them, and the value of the capital employed in the mines which produce them.” —David Ricardo

    “You have to choose . . . between trusting to the natural stability of gold and the natural stability of the honesty and intelligence of the members of the government. And, with due respect to these gentlemen, I advise you, as long as the capitalist system lasts, to vote for gold.” —George Bernard Shaw

    “Only gold is money. Everything else is credit.” —J. P. Morgan

    In June 2011 the US Mint announced a 30 percent increase in silver coin sales compared to the previous month. With more than 3.6 million silver eagles sold, the US Mint reached its limit of production, so great was the interest of investors in silver coins. Similar figures were reported by the Royal Canadian Mint, the Australian Mint in Perth, and also by the Vienna-based Mint Austria, producer of the Vienna Philharmonic Coin. In March 2011 newspaper headlines proclaimed that the state of Utah was considering once again accepting gold and silver as legal currencies. Utah was not an isolated case in the United States; Colorado, Georgia, Carolina, Tennessee, Vermont, and Washington were also looking to return to the stable value of gold.
    What seems curious at first glance made many investors thoughtful. After all, the use of a paper currency without a tie to precious metals like gold or silver is a relatively recent experiment. Only in the early 1970s, when President Nixon abolished gold convertibility in 1971, and with the collapse of the Bretton Woods system of fixed exchange rates and the convertibility of all currencies into gold in 1973, was the gold standard abolished and replaced by fiat money.
    Fiat money is a currency without intrinsic value that has been established as money, often by government regulation. Thus, the fiat money experiment has been tested in international financial markets for less than 50 years.

    The international monetary system—detached from gold and silver—has existed in this form for less than 50 years.

    The gold standard was the prevailing monetary system until World War I. Under a pure gold standard, the money supply equals the gold possession of a country. In the wake of the Great Depression in 1929 and the subsequent banking crisis in 1931, however, the gold standard came increasingly under pressure. In Britain, the suspension of sterling’s gold convertibility in September 1931 (the Sterling Crisis) heralded the collapse of the international gold standard. The United States also began to break away from the gold standard as it gradually devalued the US dollar. In 1933 President Franklin D. Roosevelt declared private gold ownership illegal so the government could print more paper money as a way to overcome the Great Depression.

    Gold or Silver?

    In the historical context, the gold standard was just a short transitional period for global financial markets. For many centuries silver was the dominant currency. Most countries used a silver standard or a bimetallic standard. Similar to the gold standard, under a silver standard the total amount of money in circulation is hedged by silver, while a bimetallic standard additionally prescribes a fixed exchange ratio between silver and gold. For many years in the United States, that was 1:16. The gold-silver ratio indicates how many units of silver are needed to buy one unit of gold.
    After both the silver and gold standards ended, the range of this ratio has fluctuated between 1:10 and 1:100. At the beginning of the 1980s, the ratio dropped below 1:20. In the early 1990s, it peaked at just under 1:100. In the years 2009 and 2010, the price of silver rose much more sharply than the price of gold. While 80 ounces of silver had to be paid for 1 troy ounce of gold by the end of 2008, it was just 40 ounces in mid-2011 and fell further to 1:50 by the beginning of 2019. Considering the natural resources and the amount of each metal mined annually, it would imply a long-term ratio of 1:10.
    After World War II the world’s economic and political center shifted toward the United States. The Bretton Woods system reorganized the international monetary system, and the US dollar, backed by gold, became the new global reserve currency.

    Figure 5. Gold-silver ratio, 1973–2013. Data: Bloomberg, 2019.

    All central banks were obligated to other central banks to exchange currency for gold at a fixed rate of 35 USD per ounce. But since the 1960s, US gold reserves have been shrinking, due to increasing account deficits. Social welfare entitlements and the growing financial burden of the Vietnam War accelerated the US current account deficit, raised inflation, and lowered international confidence in the US dollar. For the first time in 1970, the US money supply exceeded the amount of gold reserves. A year later, in August, President Nixon stopped the conversion of US dollars to gold (an event known as “Nixon shock”), but it was not until 1973 that the Bretton Woods system was officially overruled and replaced by a system of floating exchange rates. After that, the gold standard faded into history.
    Today, central banks and supranational organizations like the International Monetary Fund (IMF) hold 33,000 metric tons of gold, almost 20 percent of all known aboveground stocks of the precious metal.

    Silver Gives Way to Gold

    Silver gradually lost its official payment function in the late 19th century due to several factors. On the one hand, the United Kingdom, as a leading economic nation, was able to prevail with its gold standard against the French-dominated Latin coinage based on the silver standard. On the other hand, gold discoveries in California and Australia led to a tenfold increase in worldwide gold production and thus to lower gold prices. This made the gold standard more attractive. In 1871 Germany also switched to the gold standard. The transition from the silver or bimetallic standard to a pure gold standard led to an oversupply of silver and weighed on the price of silver for several decades.How
    ever, attention again has been focused on the solvency of many countries, including the United States, Japan, and some European economies. Measures taken to combat the financial and economic crisis that started in spring 2007 with the US real estate crash caused the national debt and the money supply to explode.
    Global debt accelerated to 320 trillion USD, whereas global GDP only rose to 80 trillion USD, and the dollar’s purchasing power declined by more than 90 percent since 1971. In addition to some European countries—Portugal, Ireland, Greece, and Spain (known as “PIGS countries”)—the United States was also temporarily threatened by a downgrade of its creditworthiness by international rating agencies. In the face of all this, it is not surprising that gold and silver bullion and coins, even if they are no longer legal tender, are popular with investors, and that bitcoins have emerged as an alternative currency. Gold-backed cryptocurrencies offer another alternative to fiat money. It seems like the gold standard is rising from its ashes through private initiatives instead of by government institutions.

    A sovereign crisis and a lack of trust are attracting investors to gold, silver, and cryptocurrencies.

    Key Takeaways
    •In 1933 President Franklin D. Roosevelt issued Executive Order 6102, which declared private possession of gold bars and coins illegal and punishable by up to 10 years in prison. All private gold holdings had to be turned over to the Federal Reserve in exchange for paper money at 20.67 USD per troy ounce. This prohibition against gold ownership wasn’t lifted until 1975 by President Gerald Ford.
    •After World War II, the US dollar was declared the world reserve currency, pegged to gold at a fixed exchange ratio. All other currencies were then pegged to the US dollar (the “Gold Standard”).
    •As US debt spiraled out of control, President Nixon ended the convertibility of US dollars into gold in 1971 (the “Nixon Shock”).
    •With the end of the Bretton Woods system in 1973, one of the greatest economic experiments began: a system of free and floating exchange rates for currencies that are not backed by any collateral other than the faith in national governments.

    11 The 1970s—Oil Crisis! 1973 & 1979

    During the 1970s the world must cope with global oil crises in 1973 and 1979. The Middle East uses crude oil as a political weapon, and the industrialized nations—previously unconcerned about their rising energy addiction and the security of the supply—face economic chaos.

    “Peak oil is the point in time when the maximum rate of global petroleum extraction is reached, after which the rate of production enters terminal decline.” —“Peak Oil,” Wikipedia

    “Just like global warming, the rationale for peak oil sounds great, it makes sense, but there is just one small problem, the facts don’t support it . . . it is a myth.” seekingalpha.com

    On Sunday, November 25, 1973, highways in Germany were emptied by a driving ban! The same day almost no cars moved in Denmark, the Netherlands, Luxembourg, or Switzerland. A week earlier, on November 19, Germany had introduced a general “Sunday driving ban” for four weeks, combined with a speed limit of 100 km/h on motorways and 80 km/h on ordinary roads. This was noteworthy: Germany—home to Mercedes, BMW, and Audi—is one of the few countries in the world today that does not have a general speed limit on its highways. Germans generally are in love with their cars! But the ban was the reaction of the German government to a sudden spike in energy prices caused by an oil crisis.
    The crisis was due to a conflict in the Middle East, between the Arab countries and Israel, that had been intensifying since the beginning of the 1970s. During the Six-Day War in 1967, Israel had conquered the Golan Heights and the Sinai Peninsula and occupied the Gaza Strip, the West Bank, and East Jerusalem. The Arab countries called for an immediate withdrawal from the occupied territories, and international pressure on Israel increased. But warnings about possible retaliation were ignored, as was the Egyptian offer of a peace treaty if the Sinai Peninsula were to be returned. On October 6, 1973, during the Jewish holy day of Yom Kippur, Egypt and Syria together attacked Israel.
    At first Syria achieved some success in the Golan Heights, and Egypt was prevailing on the Sinai Peninsula. However, the United States supported Israel with substantial military resources, and the small country finally changed the course of the war. Subsequently, the Arab countries pursued a different option.

    On October 17, 1973, OPEC decided to limit the supply of crude oil as a political weapon.

    On October 17, 1973, all Arabian crude oil–producing nations retaliated by reducing oil supply by 5 percent compared to September 1973 levels. They also imposed a complete supply boycott for crude oil against the United States and the Netherlands, which were considered Israel’s close allies. The league of exporting countries then announced that they would continue to restrict oil production until all occupied areas were “liberated” and the rights of Palestinian people were restored. The first oil crisis had begun.

    What Is OPEC?

    The Organization of the Petroleum Exporting Countries (OPEC) was established in 1960 in Baghdad by five founding members: Iraq, Iran, Kuwait, Saudi Arabia, and Venezuela. The development of new oil fields and a global oversupply had resulted in steady price declines in the 1950s. In response OPEC’s objective was to establish a common crude oil production level by joint agreement of all OPEC member countries, so that the world market price for crude oil stayed within a defined target corridor. OPEC has also been a driving force to break the power of the “seven sisters,” a group of Western oil companies. As of March 2019 the cartel consisted of 14 members—Algeria, Angola, Ecuador, Equatorial Guinea, Gabon, Iran, Iraq, Kuwait, Libya, Nigeria, Republic of the Congo, Saudi Arabia, Venezuela, and the United Arab Emirates, representing about 44 percent of global oil production and about 80 percent of the world’s “proven” oil reserves. Saudi Arabia is by far the largest crude oil producer among all OPEC members, responsible for about 12 million barrels per day in 2018. According to figures from the Energy Information Administration (EIA), the largest non-OPEC producing countries include Russia, the United States, China, Mexico, Canada, Norway, and Brazil.
    Up to this point, Western industrialized countries had been living with the illusion that global energy reserves were inexhaustible and that they needn’t be concerned with the security of the supply. Their addiction to crude oil kept rising, so the sudden embargo triggered an economic shock in many industrialized countries. Germany, for instance, sourced more than 50 percent of its energy demand from imported oil, about three-quarters of which came from the Middle East. It turned out that even with reduced consumption, reserves would have lasted only for three months, which caused people to panic. To limit the use of oil and reduce the degree of dependence, European countries began implementing energy-saving measures. They intensified negotiations with alternative crude oil suppliers, started to develop domestic sources of oil as well as alternative energy sources, and implemented strategic oil reserves.

    Economic Ripples

    In Germany and other industrialized countries, the first oil price shock triggered stagflation, which is economic stagnation combined with rising prices (inflation). Rising energy prices fueled an inflation spiral and at the same time slowed economic growth: Gross domestic output shrank from 5.3 percent in 1972 to 0.4 percent in 1974 and –1.8 percent in 1975. Many industries recorded a massive decline in production; construction fell 16 percent, and the automotive industry declined 18 percent. The stock market value of German companies dropped drastically and recorded a loss at the end of September 1974 of almost 40 percent, compared to July 1972. Unemployment rose from almost-full employment to 2.6 percent in 1974 and 4.8 percent in 1975.
    The impact of the cuts in the crude oil supply was visible immediately: Prices started to rise. At the end of 1972, US crude oil was trading at 3.50 USD per barrel; in September 1973 it rose to 4.30 USD, and at the end of 1973 oil prices traded above 10 USD. Sales in OPEC countries grew from about 14 billion USD in 1972 to more than 90 billion USD in 1974.

    During the first oil crisis in 1973 oil prices spiked from 3.50 USD to more than 10 USD.

    Using oil as a weapon brought quick political results: On November 5, 1973, the European foreign ministers called for Israel to evacuate the areas it had occupied since 1967. OPEC responded by gradually loosening the supply restrictions.
    But the world had changed. Even after the initial relaxation, prices for crude oil remained high. In 1974 alone, the value of German oil imports increased by more than 150 percent compared to the previous year.

    With the second oil crisis in 1979, oil prices jumped from under 15 USD to almost 40.

    Over the following years, crude oil prices stagnated, but they started to rise rapidly again in 1979–1980. After the Iranian Revolution and Iraq’s attack on neighboring Iran, industrialized countries once more became concerned about oil supply security. At the beginning of 1979, crude oil was trading at less than 15 USD per barrel. Within 12 months, prices had risen to nearly 40 USD, causing a second oil crisis. As a side effect, both oil crises marked the most prosperous years in the Soviet Union after discovery of oil in western Siberia and the rise of non-OPEC Western offshore oil production.

    Figure 6. Crude oil prices, 1965–1986, in USD/barrel. Data: Datastream, 2019.

    OPEC raised their basket price—an average of the prices of petroleum blends that are produced by OPEC members—to 24 USD per barrel; Libya, Algeria, and Iraq even asked 30 USD for their crude oil. In 1980 OPEC’s prices reached their peak when Libya demanded 41 USD, Saudi Arabia 32 USD, and the other countries 36 USD per barrel. In the following year, however, sales volume declined due to weaker economic development in the Western industrialized countries.
    As investments in alternative energy sources bore fruit, global crude oil consumption between 1978 and 1983 dropped by 11 percent. OPEC’s global market share of crude oil production fell back to 40 percent and continued to decline because of a lack of cartel discipline. US president Ronald Reagan made an agreement with Saudi Arabia to increase oil production in the 1980s, putting crude oil prices into a slide until the late 1990s. In the late 1980s, oil prices briefly dropped below 10 USD per barrel, bringing the Soviet Union to the brick of insolvency. OPEC’s market share fell during that time to 30 percent of world production.

    Key Takeaways
    •In 1973, because of tension in the Mideast, the Organization of the Petroleum Exporting Countries (OPEC) used its oil exports to Western industrialized countries as a political weapon and limited the supply, precipitating the first oil crisis. Crude oil prices soared from 3.50 USD at the end of 1972 to more than 10 USD just 12 months later.
    •The oil crisis came as a shock to most involved nations, strongly affecting economic growth and leading to rising unemployment.
    •During the second oil crisis, in 1979, oil prices jumped from less than 15 USD to almost 40.

    12 Diamonds: The Crash of the World’s Hardest Currency 1979

    Despite the need for individual valuation, diamonds have shown a positive and stable price trend over a long period of time. In 1979, however, monopolist De Beers loses control of the diamond market; “investment diamonds” drop by 90 percent in value.

    “Diamonds are a girl’s best friend.” —Marilyn Monroe,
    as Lorelei Lee in Gentlemen Prefer Blondes

    Precious stones such as diamonds, rubies, sapphires, emeralds, and opals are mainly known for their use in jewelry. Of these, diamonds are by far the largest market segment, and many individual gemstones—for example, the Blue Hope, the Cullinan, the Millennium Star, the Excelsior, the Koh-i-Noor, and the Orlov—have famous histories.

    Global production of rough diamonds generally ranges between 20 and 25 metric tons per year. This represents 100 to 130 million carats and is worth approximately 10 billion USD.

    Only about 20 percent of all diamonds are used in the jewelry industry, however. Industrial diamonds make up a huge market, and within this segment of smaller stones, artificially produced (industrial) diamonds also play an important role. The largest diamond production sites are in Russia, Australia, Canada, and Africa—in particular South Africa, Namibia, Botswana, Sierra Leone, and the Democratic Republic of the Congo.

    The Four Cs in Diamonds

    Unlike other commodities, diamonds do not have a standardized fixed value per unit weight. A diamond’s value is determined by various criteria, of which the “4 Cs” are the best known: color, clarity, cut, and carat. Sometimes, a fifth “C” is included. It stands for certification, which confirms the physical characteristics of a particular stone as certified by an official institution.
    Color grading depends on how close a stone is to colorless. The classification begins at D—which corresponds to very fine white or almost colorless diamonds—and continues through E, F, G, H (simple white), and so on. Colored diamonds (e.g., yellow, red, blue, or green) are particularly rare, so these so-called fancy diamonds are very precious.
    The clarity (purity) of a diamond is determined by the degree of inclusions in the stone. The higher the clarity, the rarer it is. The scale begins with IF (internally flawless) and continues through small to clear and coarse inclusions. Cut refers to the angles and proportions of a diamond. The most popular is the brilliant cut. Finally, traditionally a diamond’s weight is given in carats (1 ct = 0.2 gram).

    The largest diamond exchanges are located in Antwerp, Amsterdam, New York, Ramat Gan (Israel), Johannesburg, and London. Antwerp is the most important market; 85 percent of rough diamonds and about half of global cut stones are traded in the Diamond Quarter of that Belgian city.
    The value chain begins with mining and includes purchasing agents, processing, wholesalers, traders, intermediaries, jewelers, and other retailers, but a valuation is not simply a linear correlation to size: Larger stones are much rarer and thus exponentially more precious. In addition, prices fluctuate from one size class to the next. For example, the price can vary by more than 1,000 USD from a 0.49-carat diamond to a 0.5-carat diamond, though the difference is only 100 mg or less. In December 2018 prices for 1-carat diamonds ranged from 500 USD to 10,000 USD, depending on the degree of purity and colorlessness.
    By far the most important player in the diamond industry—analogous to OPEC in the global oil market—is De Beers. The South African company, part of the Anglo American mining group, is the largest diamond producer and trader in the world.

    Figure 7. Diamond prices, 2003–2016. Prices indexed over different sizes and qualities. Data: PolishedPrices.com, Bloomberg, 2019.

    De Beers has long dominated the global diamond market, similar to the way OPEC dominates global oil.

    De Beers controls about 30 percent of the world’s diamond production, and its influence in marketing and sales is even stronger. The company determines the volume and quality of rough diamonds that traders are able to buy. The Diamond Trading Company (DTC), which is controlled by De Beers, buys most of the world’s raw diamond production, allocates production quotas to mining companies, and manages sales through the Central Selling Organization (CSO), which is also an extended arm of the DTC. The CSO regularly organizes “sights” in London where about 150 authorized sightholders are offered compilations of rough diamonds for sale.
    For years the De Beers Syndicate guaranteed stable prices. At the end of the 1970s, however, the company lost control of the diamond market.

    A De Beers Primer

    De Beers, the largest diamond producer and trader in the world, has been active in the diamond market for more than 100 years. The company’s name goes back to the first mine in Kimberley, which was located on the farm of brothers Johannes Nicolaas and Diederik Arnoldus de Beer. After diamonds were found there in 1871, a group of adventurers transformed the remote place into the world capital of diamonds. British businessman Cecil Rhodes gradually bought up all the mining licenses and founded De Beers in 1888. Today, the company is 45 percent owned by the Anglo American Corporation, with 40 percent owned by the Oppenheimer family.
    Ernest Oppenheimer was born in Friedberg, Germany, near Frankfurt am Main, in 1880, and at age 32 he was pulling the political strings in Kimberley. In 1916, Oppenheimer founded Anglo American, which quickly became one of the most successful mining companies in the world. In 1926, he took over the majority of De Beers.
    De Beers’s entire production was always bought by the London Diamond Syndicate, which was established in 1890. The syndicate was the cornerstone of the Diamond Corporation, precursor to the Central Selling Organization (CSO). In the 1930s, during the Great Depression, Oppenheimer bought up massive quantities of diamonds in order to stabilize prices. Since then, De Beers and CSO have formed an exclusive diamond cartel.
    During that decade the US dollar depreciated significantly against other currencies, due to rising inflation in the United States and a search by investors for nontraditional investment opportunities. Interest in diamonds as a “hard” currency and a stable store for wealth increased, leading to greater demand for high-quality stones. De Beers, however, only moderately expanded the supply at the time, which resulted in further price increases that, in turn, attracted more and more potential investors.

    Diamond hysteria took hold. In 1979, the value of investment diamonds doubled, and prices for a 1-carat diamond of the best quality increased tenfold.

    Meanwhile, in Israel, rough diamonds were also becoming a favorite investment. In order to support Tel Aviv as an emerging center of diamond processing, the government granted large loans to banks under favorable conditions. As a result, a number of diamond investment companies were set up, which were able to sell diamonds directly to private investors.
    The hysteria over investment diamonds fueled a vicious circle. In 1979 the average price for diamonds doubled. Prices for a 1-carat, best-quality diamond multiplied by 10 and for a while traded at around 60,000 USD!
    De Beers attempted to gradually cool the market by expanding the supply, but the strategy was unsuccessful. The result was complete market chaos. The inevitable bust finally began in Japan, where it was common practice to accept diamonds as collateral for loans. When the first bank considered the market overheated and stopped accepting diamonds as collateral, the house of cards collapsed. The first drop in prices kicked off a race to sell stones. As speculators disposed of their stock, more and more borrowers fell below their collateral limits and were forced to raise money. Diamonds flooded the market, which was already oversaturated by De Beers’s efforts to cool it down. Even a cessation of sales and a buyback of diamonds by the cartel didn’t help. Prices crashed, and investors’ net wealth decreased, a downtrend accelerated by global recession.

    Within a year, the prices of investment diamonds fell from 60,000 to 6,000 USD.

    Within 12 months, the price of investment diamonds fell from 60,000 to 6,000 USD, approximately the level before the hysteria started. After that diamond prices recovered slowly, although in the early 1980s, the CSO withdrew diamonds worth more than 6 billion USD from the market, while De Beers cut mining quotas and closed one of its mines in South Africa. De Beers took similar actions to stabilize the price of diamonds after the global financial crisis in 2009, which had lessened the demand for luxury goods.

    Key Takeaways
    •South African company De Beers, today part of the Anglo American mining group, has long dominated international diamond production and sales.
    •In 1979 the company lost control of the diamond market after a market frenzy, during which average diamond prices doubled within a year, and prices for a 1-carat best-quality diamond rose tenfold, only to crash by 90 percent after the bubble burst.

    13 “Silver Thursday” and the Downfall of the Hunt Brothers 1980

    Brothers Nelson Bunker Hunt and William Herbert Hunt try to corner the silver market in 1980 and fail in a big way. On March 27, 1980, known as “Silver Thursday,” the metal loses one-third of its value in a single day.

    “The U.S. government has a technology, called a printing press, that allows it to produce as many U.S. dollars as it wishes.” —Ben Bernanke, Chairman of the Federal Reserve, 2006–2014

    The Hunt clan is one of the most glamorous families in the United States. They have a colorful history. In the 1920s Haroldson Lafayette Hunt (1889–1974), adventurer and professional poker player, won a drilling license in El Dorado, Arkansas, during a round of poker. Hunt, also known as “Arkansas Slim,” struck oil with his initial drilling exploration. With the first profits from El Dorado, he purchased additional drilling licenses in Kilgore, Texas, and discovered the world’s biggest known oil field to that date. In 1936 he founded the Hunt Oil Company, which became the largest independent oil producer in the United States. Fortune magazine estimated his net wealth at between 400 and 700 million USD in 1957, placing Hunt among the top 10 richest Americans. The Hunts also possessed large segments of Libyan oil fields until Muammar Gaddafi expropriated them in the early 1970s.
    H. L. Hunt’s private life was equally notorious: He had six children with his first wife, Lyda Bunker, including Nelson Bunker, Lamar, and William Herbert. Later, he started an affair with Frania Tye, whom he married and with whom he had four children before the couple separated in 1942. Hunt had another four children with one of his secretaries, Ruth Ray, whom he finally married in 1957.
    Unlike the Rockefellers, whose surname has always been associated with wealth, crude oil, and the Standard Oil Company, the name Hunt is forever tied to the largest failed speculation in silver.

    A Precious Metal Primer—A Recap

    The two most significant factors in the past 50 years for precious metals have been the prohibition of private gold holdings in the United States and the collapse of the Bretton Woods system, which was created in 1944. In 1933 President Franklin D. Roosevelt declared private possession of gold of more than 100 USD illegal, and the ban remained in place for more than 40 years. With the Nixon Shock of 1971, the United States declared an end to the official convertibility of the US dollar into gold, due to massive increases of government debt, expansion of the money supply, and rising inflation. In 1973 the Bretton Woods system—the international currency system that established the US dollar as the leading currency, backed by gold (“the Gold Standard”)—fell apart. With the abolition of the silver and gold standards, both metals lost their economic importance, and large quantities became available on the market. As a result, silver fell to 2 USD per troy ounce. But this price level also has had a lasting negative effect on silver production, as only a few countries are able to produce it at this low price level.
    The Hunt brothers’ speculation, which culminated in the collapse of the silver market in 1980, became a legend in commodity trading.
    William Herbert and Nelson Bunker Hunt were the first big investors to recognize the rare opportunities offered by the silver market in the 1970s: There was constant industrial demand, low incentives for subsidies due to low prices, and a small market of available silver.
    Nelson Bunker had made no secret of his aversion to “paper money” after the gold standard was abandoned. “Every moron could buy a printing press, and everything might be better than paper money,” he said. To preserve the family fortune, the Hunt brothers focused their investments on real estate and the silver market.
    Between 1970 and 1973 Nelson Bunker and William Herbert bought about 200,000 troy ounces of silver. Within these three years, the price of silver doubled from 1.5 USD to 3 USD per troy ounce.
    Encouraged by this success, the brothers expanded their activities to futures exchanges and acquired, at the beginning of 1974, futures contracts representing 55 million ounces of silver. Then they waited for physical delivery. Physical delivery was as unusual at that time as it is nowadays, and with constant purchases on the spot markets, the Hunts generated an artificial shortage of silver. Keeping in mind how the United States had appropriated private gold holdings 40 years before, they had the bulk of the precious metal delivered to banks in Zurich and London, where they thought their silver stocks would be safe from US authorities.
    In spring 1974 the price of silver rose to more than 6 USD. Rumors spread that the Hunts—who by now possessed about 10 percent of the world’s silver supply—were targeting a dominant market position. Before 1978 another 20 million ounces of silver were delivered to Nelson Bunker and William Herbert, who tried to convince more investors to partner with them. Together with two Saudi sheikhs, they founded the International Metal Investment Group, and by 1979 they had acquired additional futures contracts for more than 40 million ounces of silver at the Commodity Exchange (COMEX) and the Chicago Board of Trade (CBOT). Over almost a decade, the Hunts and their partners had amassed some 150 million ounces of silver, about 5,000 tons.
    This was equivalent to half of US silver reserves, about 15 percent of the world’s total. In addition, the Hunt brothers possessed around 200 million ounces of silver in the form of exchange-traded futures contracts. Global demand for silver rose to around 450 million ounces, while output remained below 250 million ounces, due to the low price level of just a few years earlier.
    In the meantime, the price of silver had risen to 8 USD, then it doubled to 16 USD in just two months, due to a growing physical shortage of silver. The CBOT and COMEX combined were able to deliver only 120 million ounces of silver, since the Hunts’ strategy concerning physical delivery was now being imitated by an increasing number of market participants.

    Figure 8. Silver prices, 1970–1982, in USD/troy ounce. Data: Bloomberg, 2019.

    At the end of 1979, the CBOT announced that no investor would be allowed to hold more than three million silver contracts. All contracts above that limit had to be liquidated. Nelson Bunker interpreted this as a sign of an imminent scarcity; he continued to buy silver, while Lamar joined him and invested 300 million USD. At that point Nelson Bunker held 40 million ounces of silver abroad and—together with the partners of the International Metal Investment Group—an additional 90 million ounces of silver. The International Metal Group in turn held futures contracts for an additional 90 million ounces, with a delivery date of March 1980.

    At the end of 1979 the price of silver rose to 34.50 USD; in the middle of January 1980 the price jumped above 50 USD (about 120 USD in today’s prices). The Hunt family’s silver stocks surpassed 4.5 billion USD in value!

    The wheel of fortune was about to turn, however. Once COMEX accepted only liquidation orders, prices started to fall. The US Federal Reserve System increased interest rates, and the stronger US dollar began to negatively affect prices for gold and silver. By mid-March 1980, silver prices had fallen to 21 USD. The crash was accelerated by panic selling on the part of smaller speculators who had followed the Hunts’ example. Others cashed in private silver stocks of jewelry and coins because of the record prices, further increasing physical supply of the metal.

    As March 1980 came to an end, the Hunts could no longer meet the margin requirements of their futures positions and were forced to sell more than 100 million USD worth of silver. On March 27, 1980, silver opened at 15.80 USD and closed at 10.80 USD. The day went down in history as “Silver Thursday.”

    On “Silver Thursday,” March 27, 1980, silver opened at 15.80 USD per troy ounce and closed at 10.80 USD. It was a daily loss of more than 30 percent!

    For the Hunts, whose volume-weighted average entry price in silver futures was 35 USD, this meant a debt of 1.5 billion dollars!
    Many investors, including COMEX officials who held short positions, significantly reinforced the downward spiral in silver prices. Although the metal recovered to about 17 USD by the mid-1980s, the Hunts had to file for bankruptcy and were accused of conspiracy to manipulate the market.
    The downfall of the Hunts was caused by extensive leverage. Otherwise they would have been able to weather the crash in silver prices without having to liquidate massive positions in the market. In the media the Hunts became a symbol of market manipulation, and their speculation and the collapse of silver prices, which caused huge losses for private investors, weighed down the reputation of the silver market for decades.

    Key Takeaways
    •Haroldson Lafayette Hunt, known as “Arkansas Slim,” founded the family fortune on oil. Subsequently the Hunts were among the top 10 wealthiest families in the United States.
    •Brothers Nelson Bunker and William Herbert Hunt tried to preserve the family wealth by investing in silver. They attempted to corner the silver market by buying the metal physically and building up large futures contract positions.
    •The price of silver skyrocketed from below 2 USD per troy ounce to above 50 in January 1980. By then, the Hunt family fortune surpassed 4.5 billion USD. But on March 27, 1980—“Silver Thursday”—silver crashed 30 percent. The Hunts had to file for bankruptcy and were accused of conspiracy to manipulate the silver market.

    14 Crude Oil: No Blood for Oil? 1990

    Power politics in the Middle East: Kuwait is invaded by Iraq, but Iraq faces a coalition of Western countries led by the United States and has to back down. In retreat, Iraqi troops set the Kuwaiti oil fields on fire. Within three months the price of oil more than doubles, from below 20 to more than 40 USD.

    “Once [Saddam Hussein] acquired Kuwait . . . he was clearly in a position to be able to dictate the future of worldwide energy policy, and that gave him a stranglehold on our economy and on that of most of the other nations of the world as well.” —Richard “Dick” Cheney, US Secretary of Defense, 1990

    During the Iran-Iraq War of the 1980s, Iraq had enjoyed good relations with the United States and Europe. The Western countries supported Iraq, especially militarily, in order to counteract the Khomeini regime in Tehran and the further spread of Islamic and Soviet influence.
    In 1980 Iraq was producing about six million barrels of crude oil per day, and Iran about five million barrels, most of which came from the oil-rich southwestern province of Khuzestan. Combined, crude oil production in the two countries accounted for about 20 percent of the world’s daily consumption. But the eight-year war, which killed a million people on both sides, greatly affected the economy of Iraq, whose main funding came from the Arab states, in particular Saudi Arabia and Kuwait. After the war, the country was heavily in debt to them.
    In addition, Iraq had always denied the legitimacy of Kuwait’s independence, considering it part of Iraqi territory. Conflicts had been smoldering around the border since its independence from the United Kingdom in 1961. Meanwhile Iraq was working to cancel or renegotiate its debt burden with Saudi Arabia and Kuwait and also trying to lower its debt by reducing crude oil production (thus leading to higher prices and higher profits). But Kuwait counteracted that move by increasing its quota and lowering its export price to increase its own market share.
    On July 17, 1990, Iraq accused its neighbors and the United Arab Emirates of producing far more oil than was agreed within OPEC, thereby pushing prices down and resulting in losses of 14 billion USD to Iraq alone. Iraq also accused its neighbors of stealing oil from Iraqi oil fields along their common border.
    Negotiations to ease tensions between Iraq and Kuwait failed on July 31, and Iraq deployed its forces along Kuwait’s border. During a meeting with Iraqi president Saddam Hussein, the US ambassador affirmed that the United States would not take any position in domestic Arab disputes or concerning the border conflict between Iraq and Kuwait. There were no specific defense or security agreements between the United States and Kuwait either. The Iraqi president interpreted this as a toleration of further action: On August 2, 1990, 100,000 Iraqi soldiers marched into Kuwait. The Gulf War had begun.

    A Quick Primer to Three Persian Gulf Wars

    The Iran-Iraq War (1980–1988) was originally referred to as the Gulf War until the Persian Gulf War of 1990–1991 (the Iraq-Kuwait conflict), after which the latter was known as the First Gulf War. Consequently, the Iraq War of 2003–2011 has been called the Second Gulf War.
    In September 1980 Iraq, headed by Saddam Hussein, invaded Iran, triggering an eight-year war that destabilized the region and devastated both countries. The United States supported Iraq during that war, because America was nervous about the potential spread of the Islamic Iranian Revolution by Ayatollah Khomeini, and Iraq longed to replace Iran as the dominant Persian Gulf state.
    The Gulf War of 1990 was waged by coalition forces from 35 nations led by the United States against Iraq, still headed by Saddam Hussein, in response to Iraq’s invasion and annexation of Kuwait. By that annexation, Iraq doubled its known oil reserves to 20 percent of global reserves, and was threatening Saudi Arabia, which controlled another 25 percent of global crude oil reserves, a situation that the United States could not tolerate.

    But it took another Gulf War to overthrow the government of Saddam Hussein. In 2003 a United States–led coalition invaded Iraq on the pretext that Iraq had weapons of mass destruction.

    Today Iran and Saudi Arabia are fighting for regional hegemony in a renewed cold war that is also an Islamic conflict of Sunni against Shiite. The Sunni-Shia conflict has been 1,400 years in the making. The arguments are complicated but essentially boil down to who is the rightful leader of Muslims following the prophet Mohammed after his death. With as much as 90 percent, the majority of the world’s Muslims are Sunni. Iran, Iraq, Azerbaijan, and Bahrain, however, have a majority Shia population.

    Figure 9. Crude oil prices, 1989–1991, in USD/barrel. Data: Bloomberg, 2019.

    The effect on oil prices was obvious. Oil prices marked a low in June 1990 of around 15 USD per barrel, having bounced between 15 and 25 USD in the previous months. At the end of July, on the eve of the war, the price of crude oil was already back at 20 USD. On August 3, West Texas Intermediate (WTI, a trading benchmark for crude oil) was just below 25 USD. Crude closed the month above 30 USD, then, at the end of September, oil traded at 40 USD for the first time. In October 1990 the price of crude oil marked a new high—more than 40 USD per barrel.

    Together, Iraq and Kuwait accounted for about 20 percent of the world’s oil reserves.

    Strategically, Kuwait was extremely valuable to Iraq. Although it is only 20,000 square kilometers, Kuwait has a 500-kilometer coastline, far exceeding the 60-kilometer coastline of much larger Iraq, whose area is almost 450,000 square kilometers. During the invasion, Iraq captured gold worth more than 500 million USD and, more importantly, gained access to Kuwaiti oil resources.
    Saddam Hussein had counted on the United States not to interfere in internal Arab affairs, but he now faced a completely different reaction from President George H. W. Bush. It seemed that US interests not only concerned Kuwaiti oil fields; they touched indirectly on Iraqi oil fields as well. Iraq controlled 10 percent of the world’s oil reserves; the annexation of Kuwait added another 10 percent.
    Moreover, as US Secretary of Defense (and later CEO of Halliburton, a major oil company) Richard “Dick” Cheney noted a few weeks after the Iraqi invasion, “Iraqi troops are only a few hundred kilometers away from another 25 percent of the world’s oil reserves in eastern Saudi Arabia.”
    Just a few hours after the beginning of the invasion, the UN Security Council adopted Resolution 660, which called for the withdrawal of the Iraqi troops. Within a week, the Security Council had imposed an economic and financial ban against Iraq (Resolution 661), which was designed to put an end to Iraqi crude oil exports. Meanwhile, the United States formed a military alliance of 34 countries against Iraq under the leadership of General Norman Schwarzkopf. Of the more than 900,000 soldiers deployed, about 75 percent were American troops. On August 8, two US Navy aircraft carriers arrived in the region, and President Bush initiated Operation Desert Shield to protect Saudi Arabia from an invasion.

    The invasion of Iraq began with Operations Desert Shield and Desert Storm. Oil prices spiked from 15 USD to more than 40 USD per barrel in October 1990.

    By Resolution 662, the UN Security Council declared the annexation of Kuwait by Iraq void and called for the restoration of its sovereignty. On August 25, the UN Security Council sanctioned the coalition’s embargo under Operation Desert Shield. By then 70 warships were deployed in the Gulf region.
    In occupied Kuwait arrests, abductions, torture, and executions were the order of the day, and the Iraqi government used foreign hostages as human shields. On September 5 Saddam Hussein invoked holy war against the United States in the Persian Gulf and called for the fall of the Saudi Arabian king Fahd. The Kuwaiti royal family had already fled.
    On November 29 the UN Security Council presented Iraq with an ultimatum for withdrawal from Kuwait by January 15, 1991. The US Congress approved military measures on January 12, and five days later, in the early morning hours, coalition forces began a massive air strike against Iraq. Within the first 24 hours of Operation Desert Storm, there were approximately 1,300 attacks.

    It took another Gulf War, in 2003, to overthrow the regime of Saddam Hussein.

    After a further ultimatum expired, the United States initiated a ground war on February 24. Two days later, the war was essentially over, as Iraqi troops officially began a withdrawal from Kuwait. In doing so, however, they set fire to Kuwaiti oil fields and opened the locking bars of many oil terminals to let the oil flow out into the sea. According to Kuwait, about 950 fields were set on fire or were mined by the Iraqi forces. In addition, oil production was interrupted until summer 1991. Only after the last fires were extinguished in November of that year did production increase again.
    Despite the war, American and British aims to eliminate the military power of Iraq, and its claims to supremacy in the region, remained unfulfilled. It took another Gulf War in 2003 to overthrow the regime of Saddam Hussein.

    Key Takeaways
    •The president of Iraq, Saddam Hussein, aspired to hegemony in the Middle East, the most oil-rich region of the world, but he failed to overthrow Iran during eight years of war in the 1980s.
    •Kuwait, despite its small geographic size, was of strategic importance to Iraq, because of its oil resources and its coastal access and harbor.
    •The Gulf War of 1990–1991 began with the invasion of Kuwait by Iraq and ended because of the intervention of the United States with Operations Desert Shield and Desert Storm. As a consequence of supply insecurity and burning oil fields, oil prices shot up from 15 USD to more than 40 USD.
    •After 9/11, Saddam Hussein was accused of possessing weapons of mass destruction; his regime in Iraq was finally overthrown in 2003.

    15 The Doom of German Metallgesellschaft 1993

    Crude oil futures take Metallgesellschaft to the brink of insolvency and almost lead to the largest collapse of a company in Germany since World War II. CEO Heinz Schimmelbusch is responsible for a loss of more than 1 billion USD in 1993.

    “We’re back, we’ve made it.” —Kajo Neukirchen, CEO of MG

    He was one of the stars of the German business scene: In 1989 Heinz Schimmelbusch became the youngest CEO in German history, the head of German Metallgesellschaft (MG), a huge industrial conglomerate founded in 1881 with a focus on mining and commodity trading. With Schimmelbusch’s arrival, a new wind was blowing through the company. Its traditional dependence on the metal business, which accounted for almost two-thirds of group sales and profit, was about to be reduced. The new growth areas would be engineering, environmental technology, and financial services.
    Schimmelbusch went on a shopping spree, acquiring Feldmühle Nobel, Dynamit Nobel, Buderus, and Cerasiv and creating an empire, valued at 15 billion USD, that included more than 250 subsidiaries. In 1991 Manager Magazine named him “Manager of the Year.” But four years after Schimmelbusch joined MG, his realm would end in disaster.

    The subsidiary of the MG Group in the United States was engaged in risky bets on crude oil prices.

    Under Schimmelbusch the MG Group was not only getting bigger but also more complicated to manage. At the beginning of the 1990s, the German economy cooled down. There was pressure from cheap Eastern European competitors, the car industry weakened, and Metallgesellschaft’s high debt levels began to drag on the company. But the firm’s Sword of Damocles was actually hovering above its subsidiary in the United States.
    Metallgesellschaft Refining and Marketing (MGRM) in New York sold fuel oil, gasoline, and diesel to large customers at long-term fixed rates; the company dealt in contracts of five- to ten-year maturity that promised delivery of a certain quantity of oil at a fixed price every month. MGRM’s customers were hedging against rising crude oil prices. However, MGRM did not have oil through its own sources or inventories. It had to buy the oil itself.

    Understanding the Oil Market

    From 1984 to 1992, the oil market was dominated by what traders refer to as “backwardation.” This means that price of crude oil to be delivered in the future will be traded at a discount to the current (cash) price. For the buyer of oil contracts this means, in addition to interest gained on the capital invested, there’s a gain from the difference between the future price and the spot price. Thus, MGRM’s rollover hedging strategy generated a continuous profit in addition to its hedging fees.
    Due to the volatile price of crude oil, MGRM was facing a market price risk of more than 600 million USD, which corresponded to one-tenth of the balance sheet of the parent company. This market price risk was hedged by futures.
    The company entered into a growing volume of crude oil futures whose sizes would be adjusted just before maturity to the contract volume of its customers and which would be rolled forward into the next contract month.

    A massive price decline in crude oil flipped the future term structure from backwardation into contango, which resulted in massive losses in MGRM’s hedging strategy.

    However, in 1993, these conditions changed as a massive decline in crude oil prices reversed the future term structure from backwardation to “contango,” in which future prices are higher than current ones. While the current oil price was below 18.50 USD per barrel, prices for a year ahead were more than 1 USD per barrel higher. The monthly gain for MGRM was converting into a widening loss. And there was another factor neglected by MGRM: rising cash-flow risks during contract maturity.
    While its delivery obligations matched delivery requirements at maturity, MGRM was now faced with increasing margin payments in the future. This had a direct impact on the balance sheet for MGRM, since realized losses would not be offset by potential future profits.

    Figure 10. Crude oil future term structure in 1993/1994, in USD/barrel. Data: Bloomberg, 2019.

    The situation continued to worsen as MGRM suffered from liquidity problems and poor credit ratings. In the context of declining oil prices, MGRM was caught in a vicious circle.
    Local management staked everything on a single throw of the dice and continued to carry out additional contracts with customers. At the low point of the crisis, MGRM alone was responsible for between 10 and 20 percent of all outstanding one-month-forward transactions in crude oil.

    By terminating all crude oil futures positions, the MG Group realized a loss of more than 1 billion USD.

    Meanwhile, German Metallgesellschaft’s fortunes had also been plunging. As a result of the economic slowdown and a high debt burden, the company could only pay a dividend in 1991–1992 by writing down hidden reserves. The following year the deficit had climbed to almost 350 million Deutschmarks, about 200 million USD. Then the bad news from the United States hit. Under pressure from creditors, MGRM was forced to file for bankruptcy with a loss of 1.5 billion USD. That brought the entire group to the brink of insolvency.

    In February 1993 Schimmelbusch launched an extensive divestment program to redeem 600 million USD. But the US subsidiary’s losses continued to grow and soon exceeded 1 billion USD. Schimmelbusch now had to ask for additional funding by the company’s major shareholders, Deutsche Bank and Dresdner Bank. Startled by the imminent loss, Ronaldo Schmitz, a member of Deutsche Bank’s executive board and chairman of MG’s supervisory board, pulled the trigger. The MG Group realized losses of more than 1 billion USD as a result of the termination of all crude oil contracts, and the group’s total liabilities grew to almost 5 billion USD.
    On December 17, 1993, Schimmelbusch and CFO Meinhard Forster were dismissed by the supervisory board without notice, and Kajo Neukirchen was hired by Schmitz to save the company. With a bailout of 2 billion USD, rigorous cost savings, and the dismissal of 7,500 employees, Neukirchen restructured the MG Group, which now focused on trading, plant construction, chemicals, and construction technology. In February 2000 the company was renamed MG Technologies, and it became the GEA Group in 2005. The MG Group had met an inglorious end.

    Key Takeaways
    •CEO Heinz Schimmelbusch became the youngest CEO in Germany when he headed German Metallgesellschaft (MG Group), a large and venerable industrial conglomerate. Manager Magazine named him “Manager of the Year” in 1991.
    •MGRM—the company’s crude oil refining and marketing subsidiary—followed practices that would adversely affect the entire conglomerate.
    •MGRM was selling petroleum products at a fixed price to customers, hedging its exposure on the futures market. During normal market conditions, the backwardation term structure of crude oil provided a comfortable markup.
    •Things changed when crude oil dropped from more than 40 USD in 1991 to below 20 USD in 1993, and the term structure flipped into contango. Losses mounted to a total of more than 1 billion USD and brought the MG Group to the brink of bankruptcy.

  • 丹尼尔•卡尼曼《思考,快与慢》35-38

    第五部分  两个自我

    第35章 体验效用与决策效用的不一致

    一直以来,“效用”这个术语有两种不同的含义。杰里米·边沁(Jeremy Bentham)在他的《道德和立法原则引论》(An Introduction to the Principles of Morals and Legislation)中用了这样一句名言作为开头:“大自然让人类处于‘痛苦’和‘快乐’这两者的主宰下。它们指明了我们应该做什么,并决定了我们应该怎样做。”在这本书的脚注中,边沁为用“效用”来表示这些体验而道歉,说自己找不到更好的词了。为了和边沁对这个术语的解释区分开来,我现将称其为体验效用(experienced utility)

    在过去的100年里,经济学家总会用同样的词去定义别的东西。经济学家和决策理论家在使用上面那个术语时,想要表达的是“想要能力”(wantability)这层意思,而我对此往往会用“决策效用”(decision utility)来表达。例如,期望效用理论就是控制决策效用的合理性原则,它与快乐体验没有关系。当然,若人们想要的正巧是自己喜欢的,喜欢的也是自己所选择的时候,“效用”的这两种含义就一致了。在经济主体都是理性的总体思路下,这种关于含义一致性的假设是内隐的。人们希望理性的经济行为人知道人们对现在和未来的看法,还希望他们作出将大众利益最大化的正确决定。

    如何测量体验效用?

    我研究体验效用和决策效用之间可能存在的差异性已经有很长的时间了。当我和阿莫斯致力于前景理论研究的时候,我设计了这样一道测试题:假设某人每天都要接受一次痛苦的注射。原计划注射20天,现减至18天,请问人们对这种减少的感觉与从6天减少到4天一样吗?

    若不一样,你能说出理由吗?

    我没有收集结果数据,因为结果很明显。你也可以自己验证一下,若能将注射天数减少1/3(即从6天减到4天),而不是1/10(即从20天减到18天),人们往往愿意付出更多。在第一种情况下避免两次注射的决策效用要比在第二种情况下大,并且相较于第二种情况,人们都愿意为第一种情况付出更多。但是,这种区别是荒谬的。如果痛苦每天都是一样的,则按应该注射的次数而言,为两种减少的注射量分配不同的效用又有何道理呢?用我们今天的话说,这个测验题告诉我们:体验效用可以用注射次数来衡量。而且,至少在某些情况下,体验效用可用做评估决策的标准。决策者若想得到同等的体验效用(或免于遭受同样的损失)却分配出不同的效用是种错误。你可能会发现这种情况很明显,但是在决策理论中,判断决策是否错误的唯一标准就是看这个决策和决策人的其他偏向是否一致。我和阿莫斯一起讨论了这个问题,但是我们没有深入研究。多年以后,我又开始思考这个问题。

    怎样衡量体验效用?怎样回答像“在治疗过程中,海伦承受了多大的痛苦”或者“她在沙滩上待了20分钟有多享受”这样的问题?英国经济学家弗朗西斯·埃奇沃思(Francis Edgeworth)早在19世纪就对此类问题作了推测,并提出发明“快乐测量仪”的想法,这种仪器可衡量出一个人所经历的快乐或痛苦的大小。

    体验效用是会变化的,就像每天的温度或气压那样,其结果将被绘制成时间函数。海伦在治疗过程中或休假期间经受了怎样的痛苦或快乐就像是“曲线下的区域”。时间在埃奇沃思的构想中起到了关键的作用。如果海伦在沙滩上待了40分钟而不是20分钟,并且她很享受,则此时她的总体体验效用就会翻倍。就像注射次数加倍会使治疗时注射的痛苦翻倍一样。这就是埃奇沃思理论,现在我们对于他的理论的构建情景有了更准确的理解。

    图15是我和唐·雷德梅尔(Don Redelmeier)为一项研究而设计的,是关于两名病患经历的痛苦的结肠镜检查数据。雷德梅尔是多伦多大学的医生和研究者,早在20世纪90年代,他就将这项实验提出来了。现在,做这个手术时常会辅用麻醉药物和健忘症药物,但是在我们收集数据时,这些药物还未被广泛应用。实验中,每60秒我们就要求这些患者说出他们当前的痛苦程度。这些数据用一个范围的值来表示:零表示“没有任何的痛苦”,10表示“无法忍受的痛苦”。正如你可以看到的,在此过程中,每个患者的体验有很大的改变,患者A的体验持续了8分钟,患者B持续了24分钟。(过程结束时记录的数据则为零)。此实验共有154位患者参加,最短的过程持续了4分钟,最长的有69分钟。

    图15

    接下来请思考一个简单的问题:假设研究人员使用相似的疼痛范围值对两位患者的疼痛感进行测量,哪一位患者的疼痛感更强呢?无可争议,人们普遍认同患者B会承受更大的痛苦。痛苦程度相同时,患者B不会比患者A所承受的时间短,对于B来说,“曲线下的区域”显然比A的要大。当然,关键因素是B的痛苦过程持续时间更长。这些测量数据都来自瞬时疼痛的“快乐测量值”。

    当实验结束时,我们要求受试者评估整个过程中感受到的“痛苦”。图中的文字是为了帮助受试者回想他们感受到的全部痛苦,以及进而产生的快乐测量值。令人惊讶的是,患者没参加过类似的实验。统计分析揭示了两个结果,解释了我们在其他实验中观察到的模式:

    ·峰终定律(peak-end rule) (指对一件事物的记忆仅限于高峰和结尾,事件过程对记忆几乎没有影响。高峰之后,终点出现得越迅速,这件事留下的印象越深刻):整体的回顾性评级可通过将最糟糕时期和最后时刻的疼痛程度的平均加权而评估出来。
    ·过程忽视(duration neglect):过程的持续对所有疼痛的评估没有任何影响。

    现在你可以将这些规则应用到患者A和患者B的情况中。最糟糕的评估(8~10)对这两位患者来说是相同的,但患者A在过程结束前的最后评估是7,而患者B只是1。因此,对于患者A来说,峰终的平均值是7.5,而患者B只有4.5。正如预期的那样,患者A在此期间比患者B更痛苦。对于患者A来说,结束时也是个糟糕的体验,这真的很不幸,完全没有愉快的记忆。

    我们现在陷入了困境:测量体验效用有两种方法,即快乐测量值和回顾性评级,但这两种方法从系统角度而言是不同的。快乐测量值是有观察员从他人不同时刻的体验报告中计算出的数据。我们将这些判断称为过程—权衡,因为在计算“曲线下的区域”时,对各个时刻都作了相等的权衡:在疼痛强度为9时,两分钟的疼痛是一分钟的两倍。然而,本实验和其他研究的成果表明,回顾性评级对过程并不敏感,而且,相比于其他时刻,回顾性评级会权衡两个单一时刻,即高峰和末端。所以,哪一个更重要呢?医生应该怎样做呢?这种选择对医疗实践有所启示,我们注意到:

    ·如果目的是为了减少患者的痛苦记忆,那降低最为疼痛时的疼痛感就比将疼痛的过程减到最短更为重要。同样的道理,如果患者在过程结束时感到的疼痛相对较轻,他对此过程的记忆就会更好,那么逐渐减轻疼痛比急剧减轻更可取。

    ·如果想减少实际体验到的痛苦,迅速完成这个过程或许更合适,即使这样做会让患者更疼痛并给患者留下可怕的记忆。

    你认为这两个目标哪一个更好?我没有作调查,但我认为会有很多人选择痛苦记忆较少的那个。我觉得将这种困境看做是两个自我之间的利益冲突会更容易理解一点(这与我们所熟悉的两个系统不符合)。经验自我是回答“现在疼吗”这种问题的,而记忆自我则是回答“总体如何”这种问题的。我们只有通过记忆才能保存生活体验,因此,在我们思考生命时,唯一能采取的观点来自于记忆自我。

    我曾作过一个关于将记忆和体验区分开的困难的演讲。结束后,我听到了一名观众的评论。他说聚精会神地听唱片中的交响乐时,由于光盘有刮痕,快结束时产生了令人厌恶的声音,糟糕的结尾往往“毁了全部的体验”。但实际上毁的并非是体验,只是对它的记忆而已。经验自我几乎有了完美的经验,糟糕的结尾并不能将其抹去,因为这种体验已经发生了。这位听众将整个体验定义为失败,就因为它的结尾很糟糕,但他却忽略了40分钟的音乐带给他的快乐。实际体验真的毫无价值吗?

    混乱的体验以及对此体验的记忆是种认知错觉,而对这种体验的替代让我们相信过去的体验是可以被消除的。经验自我无法表达自己的感受,记忆自我有时又是错的,但记忆自我可以记录体验,并掌控我们从生活中学到的东西,而决策也正是由这个自我做出的。我们从过去的经验中学到的就是储存记忆,这么做未必是为了未来的体验。这就是记忆自我的专制性。

    记忆自我夸大了痛苦体验

    为了证明记忆自我的决策能力,我和我的同事设计了一个实验,用的是温和却有些残忍的方式,我将这种方式称为冰手方式(正式名称为冷升压试验)。我们要求受试者将手浸入冰冷的水中且让冰水没过手腕,一段时间后可以拿出来,并能得到一条温暖的毛巾。受试者可用另一只手控制键盘上的左右键以不断记录自己所承受的痛苦,这种方法可作为与其经验自我的直接交流。我们选择的水温会让人感觉疼痛,但能忍受。当然,受试者在任何时候都可以自由地移动他们的手,但没有人这么做。

    每位受试者都做了两次冰手实验:

    短期实验情况就是在14摄氏度的水中浸泡60秒,受试者会感到水特别凉,但还能忍受。60秒结束后,实验者让受试者把手从冷水中拿出来,并给他们一条温热的毛巾。

    长期实验情况会持续90秒。其最初的60秒和短期实验的情况一样,在60秒结束时,实验者什么也不会说,但是他会打开一个阀门,让温水流入容器中。在后30秒内,水温大约会上升1摄氏度,刚好可让受试者觉察到疼痛感略有缓解。

    受试者被告知会进行3次实验,但事实上,他们只经历了短期和长期两种情况,分别用不同的手。两次实验间隔7分钟。第二次实验结束7分钟后,受试者可选择是否参加第三次实验。而且第三次试验是对前面某次实验的重复,而且使用哪只手可自己决定。当然,一半的受试者用左手做短期实验,一半用右手做;一半选择先做短期实验,一半选择先做长期实验,等等。这是一个被严格控制的实验。

    该实验的目的是为了在经验自我和记忆自我间引起冲突,也是在体验效用和决策效用间引起冲突。从经验自我的角度看,长期实验明显更糟糕。我们希望记忆自我会有另一种见解。峰终定律认为短期实验的记忆要比长期实验的记忆更糟,而过程忽视则认为90秒和60秒疼痛之间的区别会被忽略。因此,我们预测受试者将对长期实验会有更好的(或更不好的)记忆并且选择重复此试验。他们也确实这样做了。有80%的受试者(在做长期实验时认为最后一个阶段的痛苦减轻了)选择在第三次实验时重复长期实验,称自己愿意忍受后30秒不必要的痛苦。

    那些选长期实验的受试者并不是受虐狂,也不是想使自己置身于更糟糕的体验中,他们只是犯了一个错误。如果我们问他们:“你是喜欢泡90秒,还是只是前60秒?”他们肯定就会选择短期实验了。然而,我们没有这样问,受试者只是选择脑海中自然想到的:他们选择的是记忆中不那么令人厌恶的实验。我在问他们时,他们知道两次所受痛苦哪个时间更长,但他们并没有将这种认识与实际联系起来。他们的决定是出于一种简单的直觉:即选择你最喜欢的或最不喜欢的。记忆规则决定了他们有多不喜欢这两种选择,反过来,这种不喜欢的程度又决定了他们的选择。冰手实验,就像我之前说的注射测验题,都揭示了决策效用和体验效用之间的差异。

    在本实验中,我们观察到的偏向是我们在之前讲到的“少即是多”的另一个例子。其他“少即是多”的例子包括奚恺元的实验,即给低于总价值的24个盘子附加上几个盘子,因为附加的盘子中有的是坏的。还有一个例子是琳达问题,即激进的妇女会被认为更像是主张女权主义的银行出纳,而不是普通的银行出纳。其中的相似性并非偶然。系统1同样的操作特点说明了三种情况:系统1是用平均水平、规范和原型来表示集合,而不是用各条件的集合。冰手实验就是多个时刻的集合,而记忆自我会将每个时刻作为典型时刻记下来。这又会导致冲突。对于通过经验自我来评估各个时刻的客观观察者来说,最重要的是“曲线下的区域”,因为它表示的正是这段时间内受试者承受的所有痛苦,这本质上属于总结。相比之下,记忆自我保存的记忆是对代表性的时刻的感受,受到高峰和结束时刻的强烈影响。

    当然,动物对整体信息的存储记忆可通过进化而得以加强,某些情况下确实是这样。对于一只松鼠来说,“知道”已储存的食物总量是很重要的,只知道存储坚果的平均量不足以让它安心。然而,一段时间里的痛苦和快乐的总量对身体来讲不是那么重要。例如,老鼠对快乐和痛苦都会表现出过程忽视。在某项实验中,老鼠会先看到一束光,之后会遭电击,老鼠很快就会对光产生恐惧感。恐惧的程度可以通过一些生理反应来测量。实验的主要结论是,电击的持续时间对恐惧没有任何影响,有影响的是电击产生的痛苦程度。

    其他的经典研究表明,对老鼠大脑内的特殊区域(老鼠的大脑和人类的大脑相似)进行电刺激会产生强烈的快乐感,这种快乐感很强烈,以至于在某些情况下,老鼠(实验者可通过操纵杠杆刺激其大脑)会很兴奋,连停下来进食都不可能,最终被饿死。实验者可用不同电流强度和持续的电刺激能使大脑产生快乐的区域。需要再次强调的是,只有电流强度会起作用。在一定程度上,增加电刺激的持续时间并不会使动物更能感受到这种快感。支配人类记忆自我的规则有一个漫长的发展史。

    记忆没那么可靠

    几年前就一直困扰我的注射难题中最有用的一个想法就是:多次使人同样痛苦的注射,其体验效用可用计算注射次数的方法进行测量。如果所有的注射都同样令人厌恶,那么其中20次注射的痛苦程度会是10次注射的2倍,并且从20次注射减少至18次与从6次减少到4次给人们带来的减少痛苦感受的程度是相同的。如果决策效用与体验效用不相符,那么肯定是决策出错了。冰手实验也体现了这样的逻辑:持续90秒浸在冷水里比其前60秒在冷水里更痛苦。如果人们愿意选择忍受较长时间的浸泡,则说明他们的决定是错的。在我之前遇到的难题中,决策和体验之间的差异源于越来越小的敏感度:18次和20次之间的差异并不是很明显,似乎还没有6次和4次注射之间的差异明显。在冰手实验中,这种错误则反映出了记忆的两个原则:过程忽视和峰终定律。这些机制虽然不同,但结果却是一样的:决策与体验不协调。

    决策不会产生最有可能的体验,对未来感觉的预测也会是错的,这对于相信选择中是有理性的人来说不是好消息。冰手实验的研究表明,我们不能完全相信我们的偏向会反映出自身的爱好,即使这种偏向是基于个人经验的,甚至那些经验的记忆是刚刚才建立的!品位和决策受记忆影响,但记忆可能是错的。因此,像“人们的偏向不会改变,且知道如何让偏向达到最大值(这是理性代理人模式的基础)”这种说法就会受到质疑。我们的大脑在运作时,常会出现不一致的情况。我们对痛苦和快乐体验的持续时间有着强烈的偏向。我们希望痛苦的时间缩短,而愉快的时间能够延长。然而,我们的记忆(系统1的作用)已变成痛苦和快乐的最强烈感受(高峰时)以及感受结束时的自身感觉。忽视过程的记忆不会为我们的偏向带来长期的愉快和短暂的痛苦。

    示例—体验效用“你完全是从记忆自我的角度思考你失败的婚姻的。离婚就像是以刺耳的音符结束的交响乐。事实上,它虽然结束时很糟糕,但这并不意味着整首交响乐都那么糟。”“这是关于过程忽视的一个负面例子。尽管好的体验的时间要比不好的体验时间多10倍,但你还是将好的体验和不好的等同并加以权衡了。”

    第36章 人生如戏

    在我研究的早期,我看了威尔第的歌剧《茶花女》(La Traviata)。这部歌剧以华丽的音乐著称,讲述了一位年轻贵族与出身风尘的薇奥莉塔之间动人的爱情故事。这个年轻人的父亲因为想要保护家族声誉,不希望薇奥莉塔的出身妨碍到自己女儿的婚姻,便找到薇奥莉塔并劝她离开自己的儿子。于是,薇奥莉塔假装不爱自己的心上人了,拒绝了他。后来,她的肺结核开始复发。在最后一幕中,薇奥莉塔即将死去,她躺在床上,周围有几个朋友。薇奥莉塔的爱人知道了她病危的消息,匆匆赶往巴黎。而她在听到这个消息后,也仿佛看到了希望,感受到了喜悦,尽管她的病情还是在快速恶化。

    无论你看了多少次这部歌剧,还是会为这个紧张而危险的时刻揪心:这位年轻的爱人会及时赶到吗?对他来说,在薇奥莉塔死之前与她团聚有着重要的意义。当然,他做到了,美妙的爱情二重唱响起,但薇奥莉塔也在这10分钟美妙的音乐过后死去。

    比起整个人生,我们更在意人生的结局

    看完歌剧后,在回家的路上我想:我们为什么会那么在意最后的10分钟呢?我很快意识到我忽然感到自己完全没有注意薇奥莉塔活了多长时间。如果我知道她是27岁死去的,而不是我认为的28岁,就算她错过了一年的快乐生活也丝毫不会令我动容,但是,错过了这最后的10分钟却关系重大。另外,就算我知道他们重聚后在一起的时间是一周而不是10分钟,我的情绪也不会有什么改变。然而,如果她的爱人来得太迟,《茶花女》就会是一个完全不同的故事了。故事所关注的应该是其中有意义的事件和值得珍藏的时刻,而不是时间的流逝。过程忽视常出现在故事中,故事的结局也总能将故事的角色定型。我们在叙述的规则以及对结肠镜检查、假期、电影的回忆中都能找到与这则故事相同的主要特征。这也是记忆自我的工作机制:编故事,并将其作为将来的参考保存在记忆中。

    我们并非只在歌剧院才会感受到人生如同故事,并希望它会有个好结局。当我们听说一位和女儿疏远多年的妇人逝世时,也想知道她在死前是否已经与女儿冰释前嫌。我们所关心的不只是女儿的心情,而是希望这位母亲的故事更为圆满。关怀某个人通常体现在关心这个人故事的完整性,而不是他的感觉。一些事情还会改变已经去世的人的故事,这些事情也可能使我们深深动容。例如:一个男人到死都深信自己的妻子很爱他。所以,当我们听说他的妻子多年前就有了情夫,与这个男人在一起只是为了他的钱时,就会为这个男人感到悲哀。尽管,这个丈夫一生都很快乐,我们还是会同情他。若某位科学家的某项重要发现在她死后被证实是错误的,我们也会为她感到耻辱,尽管她自己并没有体验过这种耻辱。当然,更重要的是,我们都极度关注自己的人生故事,并希望故事的主角正派,结局完美。

    心理学家埃德·迪耶内(Ed Diener)及他的学生们对过程忽视和峰终定律是否会主宰我们对整个人生中所作的评估感到好奇。迪耶内简要地描述了简的一生(简是虚构出来的人物):简从未结婚生子,一场车祸让她丧命,但死的时候并不痛苦。对于简的故事有这么一个版本:她一生都非常幸福(这种幸福可能持续了30年或60年),她将工作视为享受,喜爱度假,花了很多时间与朋友聚会,培养自己的爱好。在故事的第二个版本中,简的寿命被延长了5年,她于35岁或65岁逝世。迪耶内描述说简生命的最后5年很快乐,但不及从前那样快乐。每位受试者在读过其中一份为简设计好的“传记”以后,都需要回答两个问题,“纵观简的一生,你认为她的人生有多圆满”以及“你认为简的一生经历了多大的幸福或不幸”。

    研究的结果进一步证实了过程忽视和峰终定律。在组间实验中(不同受试者看到的实验情景不同),将简的寿命延长一倍不会使受试者对她人生的圆满度或是整体的幸福度改变观点。显然,她的一生是由一个典型的时间段代表,与总体的时间无关。因此,她的“总体幸福”是生命中一段典型时期体验到的幸福,而不是整个生命过程中体验到的幸福。

    由这个观点可以得知,迪耶内和他的学生们也发现了“少即是多”的效应。这个效应清楚地表明,平均(典型)可替代总体。若给原本一直都非常幸福的生命增加5年“还算幸福”的日子,会导致人们对这个生命总体幸福度的评估大幅降低。

    在我的鼓励下,他们还收集了一些组间实验数据,数据是关于增加5年寿命的影响;每一名受试者都必须在实验过后迅速作出判断。尽管我长期研究判断错误,我也不相信理性的人会作出增加5年还算幸福的日子会使生命更加糟糕的判断,然而我错了,增加那令人失望的5年会使整个生命都显得很糟糕。

    这种判断模式似乎极为荒谬,所以一开始,迪耶内和他的学生们还认为是这些年轻受试者的问题。然而当这些受试者的父母和较为年长的朋友回答相同的问题时,他们的判断模式也没有发生改变。在评估整个生命以及一些有趣的事时,高潮与结尾很重要,过程通常会被忽略。

    人们经常会用工作的劳累和假期的舒适来反驳过程忽视的观点:我们都有直觉,工作24小时肯定会比工作6小时累,工作6小时比工作3小时更累。过程在这些情况中似乎很重要,但实际上是故事的结尾让整个事件过程的长度发生了改变。对于前面提到的那位母亲,等24小时会比等待6小时更为痛苦和绝望;旅游者休息6小时也会比休息4小时感到更为放松。当我们用直觉来评估这些事件时,真正起作用的是现有体验的不断恶化或改善,以及这个人的最终感受。

    关于上一次旅行,你还能记起多少?

    请思考度假时的选择。你是希望在去年去过且很熟悉的海滩度过愉快的周末,还是想充实新的记忆?为了满足这些不同的选择,两种截然不同的行业随之出现:度假村提供了恢复元气的休闲方式;旅游业则帮助人们构建故事、收集记忆。许多旅行者会近乎疯狂地拍照,这说明储存记忆是人们旅游的重要目的,这个目的会影响我们旅游的计划和体验。照相的人并不认为当时的景色只能供自己欣赏片刻,他们将景色当做未来的记忆来收藏。照片对于记忆自我来说很有用,尽管我们很少会长时间或多次观看这些照片,有的照片我们甚至没再看过,但是拍照并不一定就是旅行者的经验自我欣赏风景的最佳方式。

    很多时候我们都通过自己想要储存的故事或记忆来评估旅行。“难忘”这个词常都用来描述旅行中的亮点,明确地阐述旅行的目的。在其他情况下,我们会想到“喜爱”这个词,这是对此刻永生难忘的宣言,尽管这并不总是准确,会随着时间的变化而变化。有自我意识的记忆体验会得到重视、被赋予意义,这是其他体验无法实现的。

    埃德·迪耶内及他的团队提供的证据表明,是记忆自我选择了旅行方式。他们要求一些学生记日记,记录下春假期间他们对自己经历的评估。学生在假期结束之时,还需提供自己对整个假期的整体评估。最后,他们还需说明自己是否愿意再次这样度假。统计分析说明,他们是否想要重复假期的意愿完全取决于最后的评估,即使是最后的评分也不能代表他们在日记中描述的经历,他们依然会这样选择。就像冰手实验一样,无论对错,当人们在作是否重复某个经历的决定时,他们都会由记忆作出选择。

    有关你下次旅行的思考性实验能使你察觉到你对自己的经验自我的态度。
    在假期结束之时,你拍的照片和录像将被全部销毁。
    另外,你会服下一剂药,这剂药会消除你关于这次旅行的所有记忆。
    以上情况对你的假期计划有多大影响?与普通的旅行相比,你会花多少钱在这次旅行上?

    在我还没有正式研究人们对这种情境的反应之前,我曾与他人讨论过,得出的结论是,记忆的消除会大大降低这次体验的价值。有时候,人们对待自己就如对待其他失忆的人一样,他们通过回到曾令自己愉快的地方以增强自己的愉悦感。然而,许多人说他们完全不想去那些地方,这表明他们只关注自己的记忆自我,而且相对于失去记忆的陌生人来说,他们更少关注失去记忆的经验自我。许多人指出他们不会让自己或是失忆的人去爬山或是穿越丛林,因为这些体验在当时大都是痛苦的,只能靠提醒自己达成目标的痛苦与快乐都是值得的才能坚持下去。

    另一个思考性实验需要你想象自己正面临一场痛苦的手术,整个手术过程你都是清醒的,别人告诉你你会痛苦地叫出来,还会请求医生停止手术。然而,你事后肯定能得到一颗“忘忧草”,彻底忘掉这件事。你对此有何看法?我无心的观察再次得出这样的结论:大多数人对于他们经验自我遭受的痛苦都是漠然的。许多人说他们毫不在乎。另一些人和我有一样的看法,我为我的经验自我感到遗憾,但遗憾的程度不会比我对痛苦的陌生人的遗憾感受强。我就是自己的记忆自我,也是自己的经验自我,两者主宰我的生活,但它们对我来说就像是个陌生人,这感觉很奇怪。

    示例—谈到人生如戏“他一生正直磊落,但生命的最后一段却不得人心,为此,他要竭力维护自己的一生。”“为了能有一晚的相处时间,等多久都愿意的现象就是过程忽视的例子。”“你似乎将整个假期都用在了构建记忆上。也许你应该放下相机,享受这一刻,即使这一刻并不令你感到难忘。”“她是老年痴呆症患者。没有了人生故事,但是她的经验自我对于美与高贵依然敏感。”第37章 你有多幸福?

    15年前,在我刚开始对幸福的研究感兴趣时,我发现我们对幸福的认识都是通过让无数人回答一些差别不大的问卷调查得到的,这是被普遍接受的测量幸福的方法。这些问题是为记忆自我而设计的,会使你思考自己的生活:
    从各方面考虑,你对自己目前生活的满意程度如何?

    在从结肠镜检查以及冰手实验的错误记忆的研究谈到幸福这个话题时,我自然而然地对生活满意度是衡量幸福程度的标准这一观点产生了怀疑。由于记忆自我对实验没有什么帮助,我将注意力集中在了经验自我的幸福感上。我提出这样的说法:“海伦在3月份很快乐。”我认为这种说法是合理的,其前提是:

    她将大多数时间用在了她愿意继续、不想停止的活动上,很少将时间用在不想做的事情上。更重要的是,人生苦短,所以她也没将时间花在自己不在乎的事情上。

    有许多事是我们愿意继续、不想停止的,包括心理和生理上的愉悦。我想到的海伦想要继续做下去的事情是全身心投入到某项工作中去,这种全身心投入的状态被米哈里称为心流。心流是艺术家在创作时、人们在被电影和书籍或是填字游戏深深吸引住时的一种状态。人们处于这些情境时,往往不愿被打扰。我也有过类似的记忆:我小时候,当我母亲从我手中把玩具拿走,要带我去公园时,我总会哭。在公园里,当她将我从秋千上抱走,带我去玩滑梯时,我也会哭。抗拒中断当前事情表明:无论是玩玩具还是荡秋千,我当时都正玩得愉快。

    我建议测量海伦的客观幸福感要和评估两位做结肠镜手术的病人的方法一样,通过海伦对其生活中连续时刻的幸福感来评估。我采用了埃奇沃思在一个世纪以前就提出的快乐测量仪的方法。最初采用这个方法时,我认为海伦的记忆自我对实际的幸福与其经验自我体会到的真实幸福相比会更容易犯错误,因而,对其不予考虑。我怀疑自己的这个观点过于极端,后来证实这果然是极端的,但却是个很好的开始。

    测量经验自我的幸福感

    我召集了一个“梦之队”,其中包括除我在内的三个不同领域的心理学家以及一位经济学家。我们一起提出了一套测量经验自我的方法。不幸的是,对经验的持续记录难以实现,因为一个人不可能一边不停地报告自己的体验,一边像平常那样生活。最接近于真实情况的选择是使用经验取样法,这是由米哈里发明的方法。自首次使用以后,这个方法已经有了一定的改进。现在,我们可以通过手机来采集经验样本。具体方法是:将某个人的手机设置为在每天任意的时间响或振动,随后,手机会在打断这个受试者后,显示一些关于她正在做什么以及和谁在一起的问题。手机还会显示评定量表,以供受试者报告她各种感受的强度,这些感受有:快乐、紧张、愤怒、担心、投入程度、身体上的疼痛等。

    经验取样法成本高且烦琐(尽管没有大多数人一开始觉得的那样令人烦扰,回答这些问题只需很少的时间)。因此我们需要一个更为实际的方法,所以,我们开始采取昨日重现法(Day Reconstruction Method,DRM)。我们希望这个方法可以得到接近于使用经验取样法的结果,并提供关于人们如何利用他们时间的额外信息。我们邀请受试者(在研究早期时都为女性)参与一个两小时的会议。首先,我们请他们将昨天的生活分为如同电影一样的多个片段,然后详细叙述出来。然后,他们还需回答关于每个片段的一些选择题,这些问题是基于经验取样法提出的。他们从一个列表中选择了参与的活动,并说明是哪一个活动吸引了自己最多的注意力。还列出了与他们在一起的人,并将自己几种感觉的强度划分了等级,等级范围为0~6,其中0=没感觉,6=感觉最强烈。这种方法证明,能够详细回忆过去情境的人也能重新感受到过去事情发生时的感受,甚至可以体验到他们先前对这些情绪的生理反应。

    我们假设受试者能够非常准确地还原某个场景的典型时刻。几个与经验取样法进行的比对证实了昨日重现法的有效性。由于受试者还说出了各个场景开始与结束的时间,我们还可以计算出他们清醒时感受的过程权重。在对我们每天受到的影响的综合测量中,持续时间较长的场景比稍短的更有价值。我们的调查问卷还包括估测生活满意度,我们将此时的满意度理解为记忆自我的满意度。我们采取了昨日重现法研究决定情绪上的幸福感和生活中满足感的因素,受试者是几千位来自美国、法国和丹麦的女士。

    单一的幸福价值很难代表某一时刻或场景的经历。积极感受有很多种,包括喜爱、快乐、投入、希望、乐趣等。消极情绪也有许多种,包括生气、羞愧、忧郁和孤独。尽管积极和消极的情绪可能同时存在,但将生活中大多数时刻区分为完全积极和完全消极还是有可能的。通过比较积极与消极的形容词的等级,我们可以辨别出令人不悦的场景。如若在某个场景中,某种消极感受比所有积极感受都要强烈,我们就认定这个场景是令人不悦的。我们发现,美国女性有19%的时间都处于不愉快的状态,比法国女性(16%)或丹麦女性(14%)都要高。

    我们将个人处于不愉快状态的时间比称为U指数。例如,某个人在16个小时醒着的时间内,有4小时处于不愉快状态,其U指数就是25%。U指数并不是基于评定量表,而是基于对时间的客观测评。

    各种活动的U指数也可以被测量。例如,我们可以测量出人们在交谈、工作,或是与父母、爱人、孩子交流时处于消极情绪的时间占总时间的比例。对于美国中西部城市的1 000位女士来说,晨间交流的U指数是29%,工作时交流的U指数是27%,

    照顾小孩时是24%,做家务时是18%,社交时是12%,看电视时是12%,做爱时是5%。工作日的U指数会比休息日高6%左右,主要是因为人们在周末会更少将时间花在他们不喜欢的事情上,也不用承受与工作相关的紧张和压力。最令我们惊讶的是人们与孩子相处时的情绪经历,美国女性与孩子相处的时候感到比做家务还要无趣一些。法国女性和美国女性的U指数有少许不同的地方,下面是其中一点:法国女性比美国女性与孩子相处的时间少,但是更享受其中,可能是因为她们有更多使孩子受到照顾的方法,而且也不用在中午花太多时间接送孩子去参加各种活动。

    人在任何时刻的心情都由他的性情和整体的幸福感决定,但情绪上的幸福也会在一天或一周之内出现巨大的波动。人在某个时刻的心情主要取决于当时的情境。例如,工作时候的心情主要不会受大体上的工作满意度(包括待遇和职位的满意度)的影响。更重要的是情境因素,例如与同事交流的机会、被噪音烦扰、时间压力(这是消极影响的重要来源),以及突然看到老板(在我们的第一项研究中,这一点是唯一一个比孤独更糟糕的因素)。注意力是关键。我们的情绪状态绝大部分取决于我们关注的事情,我们通常都会关注正在进行的活动以及直接环境。也有例外的时候,那时,主观经验的质量是由再现的想法来主导的,而不是由当时发生的事件主导的。处于恋爱中的人即使在堵车的情况下也可能感到快乐,而处于哀悼中的人就算是看搞笑电影也可能会继续悲伤。然而,在正常情况下,我们只因此刻正在发生的事或喜或悲,但前提是我们必须关注这件事。例如,从吃中得到快乐,你必须注意到你正在吃东西。我们发现法国女性和美国女性花在吃东西上的时间大约是相同的,但对于法国女性来说,她们对吃的关注是美国女性的一倍。美国人更有可能在吃的同时兼顾其他事情,所以,她们从吃中得到的快乐也相应减少。

    这些观察对于个人和社会而言都是有意义的。对时间的利用是生活的一部分,是人们可以掌控的。少数人可以用意志使自己更为开朗、乐观,但是许多人可能会安排他们的生活,使自己少花些时间交谈,多花些时间做喜欢的事、见喜欢的人。由不同活动产生的感受表明,人们可以用另一种方法提高经验的质量:将消极休闲的时间用在其他事情上,例如将看电视转换为更为积极的休闲方式,包括社交和锻炼。以社会的角度来看,为劳动工人提供更好的交通条件,为职业女性提供照顾儿童的渠道以及为老人提供社交的机会等都是降低社会U指数的有效方法。即使是1%的降低也是显著的成就,因为这可以使人们避免成千上万个受苦的小时。将利用时间的全国性调查和经验自我的幸福感相结合可为社会政策提供多种参考。我们团队的经济学家艾伦·克鲁格(Alan Krueger)就是致力于将这种方法介绍给国家统计局的第一人。

    幸福的方法

    测量经验自我的幸福感已被普遍应用于美国、加拿大、欧洲等国的全国性测试中,盖洛普世界民意调查还将这种测试应用到了美国及150多个国家成千上万的受试者身上。这些民意调查使受试者回想起前一天所经历的情绪变化,尽管并没有昨日重现法那样详细。这个巨大的样本使得我们可以进行全面的分析,证实了情境因素、生理健康以及社会接触等对于经验自我幸福感的重要性。当然,头痛也会使人痛苦,而某人某天感受的第二个最佳参照点就是这个人是否与朋友和亲人接触。说快乐就是将时间用在你爱的人和爱你的人身上的确有一点儿夸张。

    盖洛普获得的数据使我们能对幸福的两方面进行对比:
    ·人们生活中经历的幸福。
    ·当人们评估自己的生活时作的判断。

    盖洛普的生活总体评价是通过名为坎特里尔自我定位奋斗量尺问题来实现的,具体如下:

    请想象有一架阶梯,每级台阶都标有数字,最低一级是零,最高一级是10。最高的台阶代表你最美好的生活,最低的台阶代表你最糟糕的生活。此时此刻,你认为自己站在哪一级台阶上?

    比起生活经历,生活中的某些方面会对某个人对生活的估测产生更大的影响。教育程度就是一个例子。若某个人接受过更高的教育,那他对自己生活的评估也会更高,但这并不意味他的经验自我更幸福。的确,至少在美国,教育程度越高的人压力也会越大。另一方面,身体不健康对经验自我幸福的不利影响会比对生活方面的评估大很多。与孩子生活在一起也会给日常感受带来坏的影响—有报告表明,父母普遍感到压力与愤怒,但是这对生活评估的不利影响却不大。参与宗教活动对于积极情绪与压力都有有利影响,对生活评估的影响很大。然而,令人惊奇的是,宗教并不会让人们沮丧或担心的感受有所减少。

    钱可以买到快乐吗?这是人们最常问的关于幸福的问题。对45万名受试者回应的盖洛普海斯威斯幸福指数分析以及对1000名美国人的每日调查,为我们提供了惊人而又明确的答案。结论是贫穷使人悲惨,富有可能会提升某个人的生活满意度,但总体来说来却不能提高经验自我的幸福感。

    极度的贫穷会增强经验对生活中其他不幸经验的感受。这尤其体现在生病上,生病对于贫穷的人来说会比家道小康的人有更糟糕的感受。位于收入分配前2/3的人中,因为头痛,原本19%说自己忧郁和担忧的个人会增长到38%。而在收入分配最后10%的穷人中忧郁和担心的人则会从38%增加到70%,其基线水平越高,增加的也越多。穷人与其他人的重大区别还体现在离婚和孤独的影响方面。另外,对穷人来说,周末对于经验自我的幸福的有利影响会比其他大多数人小得多。

    当某位住在高消费地区的人的家庭收入约为7.5万美元时(此收入标准在低消费地区相应减少),他的经验自我的幸福的满足水平就不会再提升。经验自我的幸福感也会随着收入增加,但超过那个标准后,也就不会再提升了。这令人惊奇,因为更高的收入无疑能使人们获得更多快乐,包括可以在有趣的地方度假、听歌剧、改善生活环境等。为什么这些增加的快乐没有在情绪经验的报告中显示出来呢?其合理的解释为,更高的收入会削弱人们享受生活中小乐趣的能力。有证据支持这个观点:向学生过早地灌输金钱观会影响他们在吃巧克力时的快乐感受!

    收入对经验自我的幸福感的影响和对生活满意度的影响有着明显的区别。我们得出的关于幸福的一般结论与结肠镜那个实验的结论一样清晰明了:人们对自己生活的评估与他们的真实体验可能有关,但也有不同。正如我几年前的想法一样,用生活满意度来衡量经验自我的幸福感并没有错。这完全是另外一回事。

    示例—幸福感“客观的政策可以减少人们的痛苦。我们以降低社会的U指数为目标,解决沮丧和极端贫穷是首要问题。”“增加幸福感的最简单方法是分配好你的时间。你能抽出更多时间做自己喜欢做的事情吗?”“如果你的收入超过了满意水平,你能够拥有更多使人愉快的经历,但你将会丧失一些享受小乐趣的能力。”第38章 思考生活

    德国社会经济小组成员安德鲁·克拉克、埃德·迪耶内和雅尼斯·基尔格里斯每年都会询问同一群受试者有关生活满意度的问题,以及他们在前一年经历了什么大变动。小组成员对受试者的回答进行了分析,图16就是分析的一部分,是这些受试者在每一年回答对自己结婚期间的满意度情况。

    图16

    生活满意度:一个很难回答的问题

    图16肯定会使读者紧张地淡然一笑,这种紧张感也很容易理解:毕竟决定结婚的人不是希望婚姻能使他们更快乐,就是希望建立稳定长久的关系以维持自己目前的幸福状态。丹尼尔·吉尔伯特和蒂莫西·威尔逊引入了情感预测这个有用的名词。而对于许多人来说,作出结婚的决定就反映出了因情感预测而引起的重大错误。

    即使在结婚当天,新娘和新郎都知道离婚率很高,对婚姻失望的例子更是数不胜数,但是他们还是不相信自己也会这样。

    图16中最令人惊讶的是人们在结婚后的生活满意度陡然下降。这个图被普遍认为是对人们适应过程的追踪记录,在这个适应过程中,由于婚姻生活的反复,人们起初感到的婚姻带来的快乐会很快消逝。然而,以另一种强调直观判断法的方法来追踪适应过程同样可行。我们想知道,当人们正在评估自己的生活时,他们的大脑有什么样的活动。“你对自己生活的整体满意程度如何”以及“最近你有多快乐”等问题并不像“你的电话号码是多少”这个问题那样简单。所有的受试者是怎样在短短几秒内回答这样的问题的呢?结论是:将此问题想成是另一个判断会有助于回答。对于其他问题来说也是如此,有些人可能已经有了现成的答案,这个答案是他们在另一种情况下评估自己的生活时得出的。还有些人,也可能是大多数人,在不能很快想到某个问题的确切答案时,会自动地将答案替换为更为简单的问题的答案。系统1参与到了这个过程当中。当我们以这个观点来看图16时,其意义就会有所不同。

    许多简单问题的答案都能由对生活的总体评估替换。你一定还记得这项研究:刚回答过在前一个月有多少次约会的学生在回答他们“最近的快乐程度”时,就会将约会当做他们生活中唯一重要的因素。在另一个基于同样目的的著名实验里,诺伯特。施瓦茨和他的同事邀请了一些受试者来到实验室,并请他们完成一份关于生活满意度的问卷调查。然而,在他们开始调查之前,施瓦茨请受试者们为他复印了一张纸。其中,有一半的受试者会发现复印机上有一个一角的硬币(是实验者预先放在那儿的)。即使是这样小小的幸运却极大地提高了受试者对于他们生活整体满意度的评估。心情启发式是回答生活满意度的一种方式。

    与约会有关的调查和机器上有硬币的实验表明了我们应该对关于总体幸福度问题的回答持保留态度。当然,当别人要求你评估自己的生活时,你的大脑并不是只有当前这一种情绪。你很可能会想到最近刚发生或即将要发生的重要事件;会想到反复担心的问题,比如爱人的健康或是经常与你儿子在一起的那些坏伙伴;还会想到重大的成就和使你痛苦的失败。你可能会想到几个与总体幸福度这个问题相关的观点,但多数其他观点你还是想不到的。即使你快速得到的关于自己生活幸福感的评分不会受与之完全无关的事情(例如机器上的硬币)的影响,此评分还是会取决于少数极易想到的观点,而并非取决于对你生活中所有领域的仔细衡量。

    刚结婚或马上要结婚的人当被问到对生活的整体评价时,很有可能就会联想到结婚这件事。在美国,绝大部分婚姻都是出于自愿的,几乎所有人在想到自己的婚姻或即将开始的婚姻时都会感到高兴。所以这个问题的关键就是注意力。我们可以从图16中看出当人们被问到自己的生活时,他们想到最近或即将到来的婚姻生活的可能性。这个想法肯定会随时间的流逝而越来越不受重视,因为其新鲜感会有所消退。

    图16显示,人们在结婚前后一两年的生活满意度都非常高。然而,如果这种明显的涨幅反映了回答问题时启发式的时间过程,我们从中得到的关于幸福或是对婚姻适应过程的信息就会很少。我们不能由此推断出为何幸福感会在几年内提升但又逐渐下降的趋势。即使是那些在被问到关于他们生活的问题时就会想到婚姻、就会快乐的人在其他时候也未必会感到很快乐。除非他们常想到自己幸福的婚姻,否则婚姻的幸福与否并不能直接影响到他们整体上的幸福感。即使是那些足够幸运,能完全处于享受幸福婚姻状态的新婚夫妇最终也会回归到现实中,他们体验到的幸福感也会像其他人一样,再次依赖于当前自己身处的环境和参与的事情。

    在对昨日重现法的研究过程中,有伴侣的女性和无伴侣女性的经验自我的幸福感在大体上并没有不同。这两类女性对时间的分配可以解释这一发现。有伴侣的女性很少独自一人,和朋友在一起的时间也很少。她们会花更多的时间在美妙的性生活上,也会花很多时间做家务或照顾孩子,这些事当然是人们不想做的。当然,对于一部分已婚女性来说,长时间和丈夫在一起会更快乐,而另一部分女性却不这么认为。平均来说,经验自我的幸福感不受婚姻的影响,原因并不是婚姻不能影响幸福感,而是其对于生活某些方面的影响对一些人来说是积极的,而对于另一些人来说却是消极的。

    经验自我的幸福感和生活满意度在总体上取决于性情的遗传,这也是个人生活环境与其生活满意度相关性低的原因之一。体验幸福的性情像身高和智力那样,是可遗传的,对出生之后就分开的双胞胎进行的实验就证明了这一点。那些似乎是同样幸运的人却对幸福感的体验有很大差别。在某些情况下,例如由于平衡效应的影响,婚姻与幸福感的相关性低。这是因为,同样的情况对一些人来说是好事,对另一些人来说却是坏事,新的环境对人的影响也是有利有弊。在其他情况下,比如高收入对生活满意度的影响普遍都是积极的,但某些人可能会更在意钱,事情也会因此而变得复杂。

    有人出于另一个目的,对高等教育的影响进行了大规模的研究,其研究结果显示了年轻人设定目标对其终身的影响。这些数据是由1995~1997年对近12000人做的调查问卷得来的,这些受试者都在1976年进入名牌大学读书,在十七八岁时填写了一份关于过上“富裕”生活重要性的调查问卷,从“不重要”到“必不可少”共有4个等级可供选择。他们在20年后又填写了一份调查问卷,其中涉及了他们在1995年的收入水平和对自己生活满意度的总体评价。

    目标不同,结果也会有很大的不同。在写下抱负的19年后,许多希望能有高收入的人都实现了这个愿望。例如,在597位心理学家和其他医学专家的样本中,他们对金钱重要性的观点每升高一个层次,工资收入就都会增加14 000美元(1995年时的美元价值)!不工作的已婚女性也有可能实现她们对金钱的渴望。对于这些女性来说,她们对金钱的渴望每升高一个级别,就会增加12 000美元的家庭收入,这些钱显然是由她们的丈夫赚的。

    人们在18岁时对钱看重的程度同样也预示着他们在成年以后对自己收入的满意程度。我们比较了高收入人群(收入超过20万美元)和低收入人群(少于5万美元)的生活满意度。对于那些认为有钱很重要的人来说,收入对生活满意度的影响更大(总分为5,其影响为0.57分);而对那些认为钱不重要的人来说,收入对其生活满意度的影响则只有0.12分。相对于普通人来说,想要且能得到钱的人对生活明显更为满意;想要却没有钱的人则对生活更为不满。同样的原则也适用于其他目标—对生活不满的成年人,解决这个问题的一个方法就是设定非常难以实现的目标。在20年后对这些受试者生活满意度的调查表明,年轻人最难以实现的目标是“在表演艺术方面功成名就”。年轻人的目标会影响他们将要经历的事、他们的未来,以及对生活的满意程度。

    在一定程度上,这些发现改变了我对于幸福的看法。人们为自己设定的目标对于他们要做什么,以及对只关注经验自我的幸福感是难以维持的这一事实的感受都极为重要。幸福不是忽略人们想要得到的。此外,说幸福是忽略自己活着的真实感受而只关注自己对生活的想法也是不成立的。我们必须接受幸福是各个方面的综合体的观点,必须把记忆自我和经验自我的感受都考虑在内。

    被放大了的幸福错觉

    受试者在评估自己的生活时,并没有仔细思考。这个看法是由受试者回答问题的速度以及他们受当前情绪的影响程度推测出来的。他们肯定会使用启发法(替换和眼见即为事实的例子)。尽管受试者关于生活的看法会受到有关约会的问题或是放在复印机上的硬币的影响,但他们并没有忘记生活不仅仅是约会或走运。幸福的概念并不会随着突然发现一枚硬币而发生改变,但是系统1常会作为生活的一部分替代整个生活。人们所关注的生活的任意方面会在整体评估中被放大。这就是聚焦错觉的实质,下面的这个句子可以描述这一点:

    在你思索某件事时,这件事就不会像你想的那样重要了。

    这个概念源自一场关于从加州搬到普林斯顿的家庭辩论。在这场辩论中,我的妻子说加州的人比东海岸的人幸福。我反驳道,气候肯定不是决定幸福的重要因素,斯堪的纳维亚人可能是世界上最幸福的人。我还注意到永久的生活环境对幸福的影响也很小,但是我还是没能说服我的妻子,她依然相信加州人更幸福,这是一种情感预测的错误。

    不久之后,我参与了一个关于全球变暖的社会科学的研讨会,而那个家庭辩论的话题依然在我的脑海中徘徊。研讨会上,一个同事根据他对下个世纪地球人口幸福度的观点提出了自己的看法。我反驳道,预测在一个更温暖的行星生活是何种情形是荒谬的,因为我们甚至不知道住在加州的感觉会如何。交流不久后,我和我的同事戴维·施卡德(David Schkade)得到了一笔研究资金,主要研究两个问题:住在加州的人比其他地方的人更快乐吗?人们普遍认为加州人相对快乐的程度如何?

    我们召集了许多来自加州、俄亥俄州和密歇根州的学生,组成了一个大的样本。在其中一些学生的帮助下,我们得到了关于他们生活各个方面满意程度的详细报告。通过另一些学生,我们得到了关于某个“与你有同样兴趣和价值观”但却住在别处的人会怎样完成同样的调查问卷的预测。

    分析了数据以后,我显然赢得了那场家庭辩论。正如预期的那样,两个地区的学生对天气的态度是不同的:加州人很享受当地的气候,而中西部人却厌恶当地的气候。然而,气候并不是决定幸福感的重要因素,甚至加州学生与中西部学生的生活满意度也根本没有任何不同。我们还发现,我的妻子并不是唯一一个认为加州人更为幸福的人。两个地区的学生都犯了和我妻子同样的错误,我们还能追溯到此错误的根源,即他们都夸大了气候的重要性。我们将这种错误称为聚焦错觉。

    聚焦错觉的本质是眼见即为事实,就上面例子来看,即是对气候给予过多的权重,却忽略了其他影响幸福的因素。为了理解这种错觉强大的影响力,请花几秒钟思考下面的问题:

    你从自己的车上能得到多大快乐?

    你能立刻得到答案,因为你知道自己有多喜爱和欣赏自己的车。你将其替换成了另一个不同的问题:“你在什么时候能从车中得到快乐?”这个问题的答案可能会令你惊奇,但也是简单直接的:当你考虑到自己的车时,你就能从车中得到快乐(或不快)。当然,你也不会常想到自己的车。正常情况下,你平时开车时是不会花很多时间思考自己的车的,你会想一些其他的事情,而你的心情也由你所想的事决定。当你尝试评估自己有多喜爱车时,你实际上回答的是另一个更为具体的问题:“当你考虑自己的车时,你能从车中得到多少快乐?”这个替换导致你忽略了自己很少想起车的事实,这是过程忽视的一种形式。其结果就是聚焦忽略。如果你喜欢自己的车,你就有可能夸大从其中得到的快乐,这会使你在想到当前这辆车的优点或是考虑是否要买辆新车时出现错觉。

    类似的偏见使得人们对加州人幸福感的判断发生了偏差。当被问到加州人的幸福感时,你可能会想到加州比较特别的活动,例如夏天可以爬山,或是羡慕那里冬天气候温和。但事实上,加州人很少参与那些活动。不仅如此,加州的常驻居民在对自己的生活进行总体评估时,根本没怎么想到气候这个问题。如果你一生都住在加州,而且不怎么去旅游的话,那么加州就像自己的10根脚趾一样,会觉得它们很重要,但却不会时常想到它们。如果生活中任意一方面的想法有很强的可替代性的话,此方面就更有可能被凸显出来。

    而搬到加州的人则会有不同的回应。假设某个企业的核心人员搬到了加州,想从这宜人的气候中得到快乐。搬家后的几年内,当问他对自己生活的满意度时,他可能会想到这次搬家,进而会对比搬家前后两州的气候。对比的结果肯定是加州更胜一筹,而对于生活中气候这一方面的关注就会使他对自己真实经验的权重发生偏差。无论这个人在搬家后是否真的更快乐,他都会说自己感到更快乐了,因为关于气候的想法导致他相信自己更快乐。聚焦错觉能使人们对自己当前的幸福状态、他人的幸福感以及自己未来的幸福感判断错误。

    半身瘫痪的人一天中有多长时间情绪低落?

    这个问题肯定会让你想到某位半身瘫痪的人正在思考自己的身体状况。在这个瘫痪者发生事故后的前几天里,你的这个猜想很可能还是正确的。但是随着时间的流逝,瘫痪者会开始慢慢习惯,对自己身体状况的注意力就会转移到其他新的情况上去(只有少数例子除外),最主要的例外情况包括长时间的疼痛、持续处于吵闹声中以及严重的抑郁。疼痛和吵闹声是吸引注意力的生理信号,抑郁则会使难受的想法不断强化。因此,对于类似情况,人们是不可能完全适应的。半身瘫痪者也并不例外:观测表明,半身瘫痪者在事故发生的一个月内心情大都是相当好的。尽管当他们想到自己的境况时,也肯定会感到悲伤。然而,在大多数时候,这些半身瘫痪者工作、阅读、看笑话、交朋友,在报纸上读到政治新闻时同样也会生气。当他们参与到任意一项活动中时,与其他人并没有多大的差别,我们也可以说,半身瘫痪者的幸福感在大多数时候都是接近于正常水平的。想要适应一个新的环境,无论这个环境是好还是坏,在很大程度上取决于慢慢地不去想这个环境。从这个意义上来看,生活的长期状况(包括半身瘫痪和婚姻)只在部分时间会对人们的状态产生影响,即当人们关注于这些状况的时候。

    在普林斯顿大学教书有个好处,即能带聪明的学生完成研究论文。其中,指导波特鲁利亚·科恩(Beruria Cohn)的论文就给我留下了深刻的印象。她的论文数据来自于某家调查公司,这家公司请受试者估测了半身瘫痪者处于坏心情的时间比例,科恩收集并分析了得来的数据。她将受试者分成两组:第一组被告之导致患者瘫痪的事故发生在一个月前,另一组被告知事故发生在一年前。另外,每一个受试者都需要说明自己是否认识半身瘫痪的人。从这一点出发,她又将受试者分成两个组。这两个组对半身瘫痪不久的人的判断非常接近:认识瘫痪者的受试者估测他们有75%的时间处于负面情绪中;需要靠想象才知道瘫痪者是何状况的受试者的估测值是70%。相较而言,这两组受试者对事故一年后瘫痪者情绪的估测则大不相同:认识瘫痪者的人认为他们有41%的时间处于负面情绪中;现实生活中不认识半身瘫痪者的受试者的平均估测值则为68%。很明显,那些认识瘫痪者的人观察到瘫痪者对自己境况的注意力会逐渐转移,而那些不认识瘫痪者的人就不能预测到这种适应性的发生。判断某人赢得彩票一个月后和一年后的心情也是这样的模式。

    我们能够预测出,对于那些半身瘫痪者以及有慢性病且难以负荷身体状况折磨的人来说,他们的生活满意度与幸福感关系并不大,因为在要求他们评估自己的生活时,不可避免地会使他们想到其他人的生活以及自己曾经的生活状态。最近关于结肠造口术病人的研究结果也与这个看法一致。此研究结果表明,病人的幸福感与他们对自己生活的评估有着极大的不同。在经验样本中,并没有发现这些病人的幸福感与健康人有何不同。但结肠造口术病人却想要以自己几年的生命换取健康的身体。而没有得结肠造口的人会认为自己若得了这种病情况会很糟糕,因此他们宁愿失去几年的寿命也不愿再次做这个手术。这个时候,记忆自我似乎是受到了聚焦错觉的支配,而聚焦错觉则将焦点放在了经验自我忍受的痛苦上。

    丹尼尔·吉尔伯特和蒂莫西·威尔逊引入了错误想法(miswanting)这个词组来描述因情感预测的错误而导致不佳决策的这种情况。这个词组理应成为我们的日常用语。聚焦错觉(丹尼尔·吉尔伯特和蒂莫西·威尔逊称之为过度聚焦)是产生错误想法的主要原因。值得注意的是,错误想法会导致我们易于夸大购买大件商品或变换环境对我们未来幸福感的影响力。

    请比较两个会使你的生活某些方面发生改变的决定:买一辆舒适的新车和加入每周都有聚会的小组,有可能是扑克小组或是读书小组。这两种经历在开始时都是新鲜且令人兴奋的体验。其主要的不同在于,买了车后,你对它就会越来越不关注;但加入小组却能常参加社交活动,当然前提是你愿意常去。由于眼见即为事实的关系,你可能会夸大汽车的价值,但不太可能在社交活动或其他需要注意力的活动方面犯同样的错误,这样的活动有打网球或学习拉大提琴等。聚焦错觉会产生一种偏见,这种偏见会导致人们更加看好本身就能令人兴奋的事物或经历,即使这些事物或经历最终也会失去吸引力。人们忽视了时间,致使维持人们长久的注意力价值的经验很少受到关注,至少比这种经验应得到的关注要少。

    千万不要忽略时间的作用

    本书中不断重复时间的重要性。将经验自我的生活描述为一系列有价值的时刻是符合逻辑的。某个生活阶段的价值(我曾称其为快乐总量)就是这一阶段所有价值的总和。不过,这不是大脑呈现各个阶段的方法。我曾提到过,记忆自我同样也会讲故事和作出选择,而且它讲的故事和作出的选择都不能恰当地表示时间。在讲故事时,一些关键的时刻,特别是开始、高潮和结尾,代表了整个生活阶段,过程因此就被忽略掉了。在冰手试验和薇奥莉塔的故事中,我们可以看到将注意力完全集中在某一特定时刻的情形。

    我们在前景理论中看到了另一种不同形式的过程忽视,在这种过程忽视中,状态由其过渡状态所代表。彩票中奖会创造一种新的财富状态,此状态能持续一段时间,但决策效用会随着对彩票中奖这则消息的反应强度的改变而改变。人们忽略了对注意力的减退以及对新状态的适应,只注意到了短暂的时间片段。在对慢性疾病的预测以及聚焦错觉的过程中,都有同样的对过渡到新状态的关注、时间忽略和适应性。人们在聚焦错觉中犯的错误包括关注选定的时刻,忽略其他片段发生的事。大脑善于处理故事,但却似乎不能很好地处理时间。

    在过去的10年里,我们了解了许多关于幸福的新发现的事实。我们也明白了,幸福这个词并不只有一个简单的含义,我们也不该将其简单地随意使用。有时,科学的进步会使我们更加困惑。

    示例—生活的思考“她认为买一辆豪车会使自己更为快乐,但这其实是个情感预测错误。”“今天早上,他的车在上班途中坏掉了,因此,他的心情非常糟糕。今天并不适合问他关于工作满意度的问题。”“她平时看起来都很开心,但当我们问她是否快乐时,她说自己并不快乐。这个问题肯定使她想到了自己最近离婚这件事。““买一座更大的房子可能不会使我们永远感到快乐。我们可能会因为犯聚焦错觉的错误而遭殃。”“他选择了在两座城市间之间奔波往返。这可能是一个错误想法的典型例子。”结语

    我在本书的开头引入了两个虚拟的人物,随后讨论了人类的两种存在形式,最后又介绍了两种自我。两个虚拟人物分别是运用直觉、进行快速思考的系统1和需付出努力、运行更慢的系统2。系统2进行的是慢思考,能监督系统1的运作,并在其自身有限的能力下尽可能地占据控制地位。两个物种分别是活在理论世界的虚拟经济人以及活在现实世界的人类。两个自我指的是感受当下的经验自我以及记录并作出选择的记忆自我。最后一章是对这三组概念的某些应用,我将逆序进行讲解。

    两个自我

    记忆自我与经验自我相抗争的可能性问题比我最初想象的更加复杂。在早期的冰手实验中,过程忽视和峰终定律的结合会使人们作出明显荒谬的选择。为什么人们愿意承受没有必要的痛苦呢?这是受试者的记忆自我作出的选择,更愿意去回忆那些给他们留下更好记忆的体验,尽管这些选择会使自己承受更多的痛苦。或许在一些极端例子中,以记忆的质量为标准进行选择是恰当的。例如,创伤后产生压力是有可能发生的,但手冰凉的体验并不是一种创伤。客观的旁观者在为别人作选择时,肯定会选择受创期短的那一个,会更加考虑别人经验自我的感受。但人们为自己作的选择,有一半都可被认为是错误的。在像茶花女的歌剧和对简的生活判断的故事中,过程忽视和峰终定律都经不起推敲。以某个生命的最后时刻来评估整个生命,或在判断哪种生命更为理想时,完全忽略其过程都是没有道理的。

    记忆自我是系统2的一部分。系统2评估生活中某些情节及生活本身的方法有着显著的特点,这些特点也是我们记忆的特征。由系统1产生的过程忽视和峰终定律并不一定与系统2的评判标准相符合。我们相信过程是重要的,但记忆却告诉我们,过程并不一定重要。规定评估过去事件的原则对决策制定不能起到很好的导向作用,因为时间在其中也起了重要作用。人类的存在有一个核心的事实,即时间最终还是有限的资源,但人类的记忆自我却忽略了这个事实。比起细水长流的幸福来说,人们更偏好享受短暂却强烈的快乐。这种偏见是由结合了峰终定律的过程忽视造成的。与这种偏见相反,另一种偏见使我们更为害怕短期、强烈的疼痛,而对于长时间但较轻微的疼痛却更容易接受。过程忽视还使我们容易接受长期但轻微的不愉快,因为其结局会更好;若某件事的结局不好,即使其过程是长期且快乐的,我们也会忽略掉。以同样的观点来看待不适,请考虑这个普遍的警告,“不要这样做,否则你会后悔的”,这个建议听起来很明智,因为其所能预见的后悔出自于记忆自我的判断,我们也倾向于将这个判断看做是最终结论。然而,我们不应该忘记,记忆自我的观点不总是正确的。一个测量快乐的客观观察者会更注重经验自我,会提供不同的建议。记忆自我对过程的忽略、对峰终和结局的重要性的夸大,以及对后见之明的怀疑共同作用,歪曲地反映着我们真实的体验。

    相反,对过程加权的幸福观使我们将生活中的所有时刻都看做是相似的,其将生命中所有时刻都分为值得纪念或不值得纪念两种。有些时刻最终会比其他时刻得到更多的权重,并不是因为它们值得纪念或是很重要。人们花在思考某个值得纪念的时刻的时间应被考虑在内,增加这个时刻的权重。通过改变某个时刻之后时刻的经验也能增强这个时刻的重要性。例如,练习拉一个小时的小提琴可能会增强多个小时的演奏经验或几年后听音乐的鉴赏能力。同样,引起创伤后应激障碍(PTSD)的短暂且可怕的事件应该通过其引起的长时间的痛苦来权衡。从过程加权的角度来看,我们只能在事情发生后才能决定某个时刻是值得纪念的还是毫无意义的。“我会一直记得……”或“这是一个意义非凡的时刻”的说法可以被看做是承诺或是预测,但即使我们在说这些话时是百分之百真诚的,我们还是常常无法实现这些承诺或正确进行预测。我敢打赌,10年后,许多我们曾经说过想要一直记住的事都会被忘记。

    过程权重的逻辑具有强迫性,但我们并不能将其视为关于幸福的完整理论,因为人们只认同记忆自我,而且只关心自己的故事。忽略了人们想要的关于幸福的理论是站不住脚的。另外,忽略了真实发生的事并只关注于人们对自己生活的想法的理论同样也站不住脚。我们必须将记忆自我和经验自我都考虑在内,因为它们对生活的诠释不总是一致的。哲学家可能会长时间在这些问题上纠结。

    对于这两个自我哪一个更重要的问题,并不是只有哲学家才需要考虑的。这个问题对于某些领域的政策问题都有一定的影响,特别是医药和福利领域。请考虑对治疗不同的病应该作的投资,包括失明、耳聋和肾衰竭。这些投资应该受人们对这些疾病的恐惧程度的影响,还是该受病人真实的痛苦体验的刺激?是受病人想要恢复健康的愿望的强烈程度还是病人为了健康而愿意付出代价的大小来决定?关于失明和耳聋,或结肠造口术和透析的投资意愿强度,可能会因为对痛苦严重程度评估方法的不同而有所不同。当前对此问题还没有简单的解决办法,但这个问题却非常重要,不容忽视。

    最近,用对幸福的测量来引导政府决策的可能得到了包括学者和欧洲几个政府机构在内的关注。将来,社会痛苦总量指数可能会和失业、残疾和收入指数一起包含在国家统计数据中。比起几年前,这个想法在现在看来还是有可能实现的。这个项目已经取得了一定的进展。

    经济人和人类

    如果我们能与某个人进行理性讨论,此人的信念能顺应现实,而且他的倾向也与其兴趣和价值观相符合,我们就可以说这个人是通情达理的。在说到理性这个词时,人们往往会想到审慎、深思熟虑且缺少热情的人物形象,但在日常用语中,一个理性的人肯定是通情达理的。但对于经济学家和决策理论家来说,“理性”这个形容词有着完全不同的意义。判断某个人是否理性的唯一标准并非是看这个人的信念或是偏好是否合理,而是看它们是否一致。一个理性的人可以相信鬼,只要他的其他信念也与世界上有鬼存在这个信念相一致。一个理性的人可以有好恶,但他的偏好要前后一致。理性指的是逻辑上的一致,即合理与否。根据这个定义,经济人就是理性的,但有很多证据表明,人类并不理性。经济人不会受启发式、眼见即为事实、窄框架、内部意见或偏好逆转的影响,但人类却无法避免这些影响。

    将理性定义为一致性是会受到限制的。理性要求人们遵守逻辑原则,但我们有限的大脑却不能够实现这一点。从这个定义来看,通情达理的人并不一定就是理性的人,但也不能因此就被认为是非理性的。“非理性”是一个较重的词,包含了冲动、感情用事以及对合理辩护的顽强抵抗等含义。当我与阿莫斯的研究成果被认为证明了人类的选择是非理性的时候,我总想要退缩。因为事实上,我们的研究仅仅表明了人类不应该被描述为处于理性代理模式中。

    尽管人类不是非理性的,人类仍然时常需要帮助才能作出更准确的判断和更好的决策。有时,相应的政策和机构就能够提供这种帮助。这样说虽然没什么不对,但实际上却颇具争议。正如比较权威的芝加哥学院派解读的那样,对人类理性的信心和防止人们作出错误选择是没必要甚至不道德的这一观念联系紧密。理性的人应该是自由的,他们应该为自己的选择负责。米尔顿·弗里德曼是芝加哥学院派的主要代表人物,其主要观点在他的一本畅销书的标题上得到了体现—《自由选择》(Free to Choose)

    经济人是理性的这一设想为用自由主义的方法制定公共政策的观点提供了思想基础:不要干涉个人选择的权利,除非这些选择对他人有害。将物品分配给愿意付钱最多的人是市场效率的体现,对市场效率的赞叹是对自由主义政策的支持。有一篇《理性成瘾理论》支持芝加哥学院派的这一观点,它解释了对强烈且即时满足有极度偏好的理性代理人会做出理性的决策,把对未来的沉迷当做一个结果。加里·贝克尔是这篇文章的作者之一,也是芝加哥学院派中的一个诺贝尔奖获得者。他曾以轻松但不失严肃的口吻说过,我们应该考虑通过某种信念,即人们能很快找到治愈糖尿病的方法,来解释所谓的肥胖流行病的病因。他提出了一个有价值的观点:当我们观察那些行为看似怪异的人时,应该考虑到一种可能—他们这样做有合理的理由。只有当理由变得不合理时,才会引发心理学上的解释。其中,贝克尔对于肥胖症的解释可能就是不合理的。

    在经济人的国度里,政府应该让经济人在对他人不造成危害的前提下自己作选择,不横加干涉。如果骑摩托车的人选择不戴头盔,那么自由主义者就会认为这是他的权利,并支持他这么做。无论是决定不存养老金还是选择吸食毒品,公民们都知道自己正在做什么。不过,往往难以界定这种情况:没有存够养老金的老年人并不会比在餐厅吃完大餐后抱怨价格太高的人得到更多怜悯。因此,在芝加哥学院派与行为经济学家的辩论中,有许多理论都是相互矛盾的。行为经济学家抵制极端的理性代理人模式。辩论的所有参与者都认为自由不是争辩而来的价值。但是相比人类理性的真正信徒,生活对于行为经济学家来说更加复杂。没有行为经济学家会赞同强迫市民均衡膳食,以及只看有益电视节目的规定。然而,对于行为经济学家来说,自由是需要付出代价的,做了不明智决策的个人以及认为有义务帮助这些人的社会都需要付出代价。因此,该不该帮助个人避免错误的决策就成为了行为经济学家的两难。芝加哥学院派的经济学家们不存在这个问题,因为理性代理人不会犯错。对于这个学派的人来说,自由是免费的。

    在2008年,经济学家理查德·泰勒和法学家卡斯·桑斯坦合著了《助推》。这本书很快成为了全球畅销书,还被视为行为经济学的《圣经》。书中引入了几个新的词语,包括经济人和人类,还提出了一系列方案来解决在不剥夺人们自由的前提下帮助人们做出良策的难题。泰勒和桑斯坦主张自由家长制的做法,即允许国家和其他机构“推动”人们做决策,并使这些决策服务于该国或该机构的长远利益。将参与养老金计划指定为默认选项就是助推的一个例子。不可否认,人们会因为不自觉地加入了这个计划而觉得自己的自由少了,因为他们在当初填表时,只需确认一个复选框,就可以退出这个计划。在之前已经提过,个人决策的框架(泰勒和桑斯坦将其称为选择架构)对结果有着巨大的影响。助推基于坚实的心理学,我在之前已阐述过。默认选项自然而然地被认为是普通选项。而偏离普通选项是一种委任的行为,需要考虑更多,承担更多的责任,比什么都不做更有可能让人后悔。如果某个人不确定该怎么做时,就会有强大的助推力来引导这个人做出决策。

    与经济人相比,人类同样需要保护,以免受那些蓄意利用他们弱点的人的危害—特别是系统1的怪异模式以及系统2懒惰的弱点。理性代理人被认为能谨慎地作重要的决定,并充分利用知道的已有信息。经济人会在签署一份合约之前,阅读并理解所有条文,但是人类通常不那样做。某家不道德的公司设计出的合约在显而易见的地方隐藏着重要的信息,这些信息能使公司在法律范围内有回旋的余地,但人们不经阅读就签下了合约。对理性代理人模式有害的极端解读是:除了确保相关信息公开外,顾客被假定为不需要保护,合约中字体的大小和语言的复杂程度不被认为是相关信息,但是一个经济人知道如何处理小字体的信息。《助推》这本书给出的建议是要求公司提供足够简单的合约以供人类客户阅读和理解。因为顾客得到了更详细的信息,这可能使一些公司的利益受到损害,因此,一些建议遭到了这些公司的强烈反对,但这是一个好的迹象。公司通过提供更好的产品来提高竞争力要比公司独自赢利更为可取。因此,通过提供好产品来提高竞争力的公司更受到人们的青睐,也就是说更受青睐的公司往往是提供的信息不明确的公司。

    自由家长制的显著特点是其在广泛的政治方面的吸引力。行为政策的绝佳例子是“为明天储蓄更多”计划,这是由国会中的极端保守主义者和自由主义者联合提出的议案,而这两者的联合并不常见。“为明天储蓄更多”是公司为其员工提供的养老金计划。签了这份合约的员工在加薪时增加一定的存储比率,这样,员工就能为储蓄计划贡献得更多。储蓄率随工资的上涨而自动上升,直至员工注意到存得太多,进而选择退出该计划。现在,这个由泰勒和桑斯坦于2003年提出的伟大革新使储蓄率有了一定的提高,也使成千上万工人的前景更加光明。这个计划有坚实的心理学理论作为基础,本书的读者们对这些理论知识肯定都有所了解了。此计划通过要求非立即改变或尝试来提高存储以支付工资的方法避免了直接损失,将损失转变成了未得收益(foregone gains),也就更容易使人接受。另外,其自动性的特点还将系统2的懒惰与工人的长远利益结合在了一起。当然,所有这些特点都没有强迫任何人做任何他们不想做的事,也不含任何误导或欺诈。

    自由家长制在许多国家都得到了认可,包括英国、韩国,还得到了很多政党的认可,包括英国托利党以及奥巴马政府等。的确,英国政府成立了一个新的小部门,这个部门的任务就是将行为科学原则用于帮助政府实现目标。这个部门的正式名称叫做“行为研究小组”,但是,无论是政府内部的人还是政府外部的人,都将这个小组简单地称为“助推小组”。泰勒是这个小组的顾问之一。

    继《助推》一书之后的一本书中,奥巴马总统邀请了桑斯坦在政府信息与规制事务办公室任职。这个职位为桑斯坦提供了很多将心理学和行为经济学的课程应用于政府机构的机会。这个任务在管理与政府预算办公室在2010年所作的报告中有所描述。本书的读者应该可以理解一些特定提议背后的逻辑,包括鼓励“清晰、简单、显著及有意义的披露”。读者还需读懂背景陈述“描述非常重要,例如,如果某个可能的结果被构架成一种损失,这种结果会比构架成收益有更大的影响”。

    关于助推的例子有很多,比如之前已经提过的关于耗油量公开信息的框架规则,而其他方面的应用还包括自动参加健康保险,用新的膳食指南代替令人费解的膳食宝塔(新的膳食指南是由一个盛满营养均衡的食物的盘子所表示),以及美国农业部门(USDA)所指定的规则,即允许在肉制品标签上写上类似“90%无脂肪”等信息,而“10%的脂肪”也可以说成“接近于瘦肉率颜色的表述方法,即描述出与同脂肪率的肉相同的色泽、大小及种类”。与经济人不同的是,人类需要帮助才能作出好的决定,且这种帮助可以通过告知或不介入的方式得以实现。

    两个系统

    本书将大脑的运作描述成了两个虚拟人物不稳定的相互作用,这两个虚拟人物就是自动的系统1以及需要付出努力的系统2。现在,你对这两个系统的个性已经相当熟悉了,也能够预测他们在不同情境下可能的回应方式。当然,你也知道这两个系统并不是真正存在于大脑或其他地方中。“系统1做了某事”是“某事自主发生”的简略说法。“系统2被动完成了Y”是“更兴奋,瞳孔扩散,注意力集中,Y活动开始进行”的简略说法。我希望你能和我一样,交谈时使用关于两个系统的语言,这样的话,交谈就会更方便,还能在不知两个系统存在与否的问题时凭直觉判断系统的运作方式。作出这些简要说明后,在后面的内容中,我会继续使用两个系统的说法。

    我们对自己的看法就是对系统2的看法。系统2会进行判断和选择,但它会认可系统1形成的观点和感觉,或将这些观点和感觉合理化。你可能没有意识到你对某个项目持乐观态度,只是因为此项目的领导使你想到了自己亲爱的姐姐。或是,你或许会厌恶和你的牙医长得像的人。如果你想寻求一个解释,就要搜寻记忆,寻找一些像样的理由,你最后肯定能找到一些。另外,你还会相信自己编造的故事。系统2不仅是系统1的辩护者,它也能避免许多愚蠢的想法和不当表达而引起的冲动。投入注意力能提升众多活动的表现(试想在思想混乱时在狭窄的路上开车的风险),对于一些任务来说,注意力的集中还是必要的,例如在进行比较、选择和推理时。然而,系统2并不是理性的模范,其能力以及能够掌握的信息都是有限的。我们在推理时,头脑不会总是很清醒,我们犯错也不全是因为突然想到的不恰当的直觉。通常,我们犯错是因为我们(系统2)无法再了解到更多的信息。

    我花了更多的时间来描述系统1,也用了很大篇幅描述我源于直觉判断和选择的错误。然而,相对的篇幅并不是评判直觉思考优劣的好指标。系统1是我们许多错误的原因,但也是我们许多正确做法的原因,而且我们也常做正确的事。我们的想法和行动通常由系统1指导,是当机立断的。系统1的一个优点就是储存在我们联想记忆中丰富而详细的世界:在这个世界里,人们能在不到一秒的时间内,从普通事件中区分出令人惊奇的事件;立即对自己所期望的事生成想法,并对令人惊奇之事和正在发生的事自动搜寻有因果关系的解释。

    记忆能记录我们一生中习得的技能,因而也会自主产生解决方法来应对不断出现的挑战(比如绕过路上的一块大石头走,避免让顾客挑出错误)。技能的习得要求有固定的环境、练习的机会,以及对自己想法和做法快速且明确的反馈。当这些条件都满足时,就能掌握技能了,且此后快速闪现在大脑中的直觉性判断和选择都会是正确的。这些都是系统1来完成的,也就是说这些是快速且自主发生的。有技能的行为是能快速有效地处理大量信息的能力。

    若挑战碰上了有技能的应对方法,这个应对方法就能被唤起。如果没有技能,又会发生什么呢?此时,系统2显然要介入,就如同回答“17×24=?”这个问题,其结果肯定是确定的。但想要系统1对系统2的能力表现出吃惊,不介入进来却不太可能。系统1不会受能力的限制,在计算时不要求确切数值。在搜寻某问题答案时,它能自动生成对相关问题的回答,还可能会将所问问题的答案替换成很容易出现在头脑中的回答。在启发式的概念中,启发式的回答并不一定比原来的问题更简单或需要更少的努力,启发式的回答只是更容易想到,更快、更容易被发现而已。启发式的回答不是随意想出来的,它们“似乎”是正确的答案。不过,有时也错得离谱。

    系统1在处理信息时,可能会产生认知放松。当信息不可信时,系统1也不会生成警告信号。人们会快速且自信地进行直觉性回答,不管这些回答是否源于技能或启发式。系统2没有简单的方式来区分有技能的和启发式的回答。唯一的方式是放慢速度、自身构建出一个答案,这个答案可能不会被轻易接受,因为系统2比较懒惰。系统1的很多建议常常没有通过最基本的检验就得到了人们的支持,就像球拍和球的问题。这就是系统1得到“错误和偏见的起源”这个负面称号的原因。系统1的运行特征,包括眼见即为事实、强度匹配和联想一致性等,会产生可预测的偏见和认知错觉,比如锚定效应、回归平均值的预测、过度自信,以及许多其他错觉。

    对于偏见我们能做什么呢?我们如何提升判断和决策(这些判断和决策来自我们自身和那些我们为之服务也服务于我们的机构)的质量呢?从自身经验来谈,系统1的运行方式是不能教给别人的。我除了认为年龄会有些影响外,我们的直觉思考就像我之前对这些问题作的研究那样,包括过度自信、极端预测和计划失误的倾向。我只提升了对易犯错误的情境的识别能力,“这个数字会成为一种锚定……”,“如果问题被重新架构,决策会改变……”而我在识别别人错误的过程中,也取得了更多的进步。

    避免系统1出错的方法从原则上讲是很简单的:认识到你正处于的认知领域,放缓并要求系统2来加以强化。当再次碰到缪勒–莱耶错觉图时,你会怎么做?当你看到有箭头的线段指向不同的方向时,你会意识到现在你不能相信自己对长度的直觉。不过,这种明智的过程在最需要的时候不会被应用到生活中。我们都希望在自己要犯错时能有个铃声提醒自己,但这是不可能的,认知错觉比感知错觉更难以识别。理性的声音也许比错误的直觉响亮又清晰的声音更微弱。当你面临着重大决策的压力时,质疑自己的直觉会让你感到不愉快。当你处于麻烦中时,最不愿意看到的就是有更多的质疑。这样的结果就是,相比自己要犯错时,你在观察别人是否要犯错时,能更容易辨认出雷区。观察者会比实施者在认知上更为放松,更愿意接收信息。我写本书的一个原因就是指导批评家和传闲言碎语的人,而不是指导决策制定者。

    机构要比个人更容易犯规避错误,因为机构的人多,自然就会思考得很慢,也更有能力按规则行事。机构可以制定和有效使用检查表,还可以深入开展,比如参考类别的预测以及“事前验尸”练习。机构能够鼓励其成员形成一种在靠近雷区时互相留意和提醒的文化,而这种文化的形成一部分是通过为其成员提供一些独特的词汇。无论机构是干什么的,都涉及判断和制定决策,就像是工厂生产产品,每个工厂都应该有保障其产品在最初设计、装配及最后检查时的质量的方法。决策产生的相关阶段包括解决框架问题、收集引导决策的相关信息、反馈以及检查。想要提高其决策质量的机构应该经常在每一个阶段里搜寻可提高效率的环节。这个运作的概念是有规律的。持续的质量控制通常是在危机产生后机构采取的对过程的全面回顾。其中一个例子就是明显缺乏主持高效会议必要技能的系统训练。

    基本上,更为丰富的语言对于建设性批评来说是必不可少的技能。与医疗相似,辨别判断性错误就像是在诊断病人,需要一些精确的词汇。从某种疾病的名字中,我们希望得到所有关于这一疾病的信息,包括其易感染性、环境因素、症状、预断及治疗等。与其相似的是,如“锚定效应,”“窄框架”、“过度一致性”也能使我们想到关于某个偏见的所有信息,包括其原因、影响以及我们能对其做些什么。

    在办公室饮水机旁的闲谈与决策有直接的联系:闲谈越多,所做的决策就可能更好。有时,决策制定者能听到大家当时传的闲言碎语和批评,这比听自己内心疑虑更容易。当他们相信批评自己决策的人经验丰富且公平正直,或当他们希望自己的决策能通过制定的方式而不是结果来评判的话,就会做出更好的决策。

    附录A  不确定性下的判断:启发法和偏见

    (本文首次刊登于1974年的《科学》杂志上,第185卷。美国国防部高级研究计划局为此项研究提供了支持,海军研究办公室也与位于尤金的俄勒冈研究院签订了合约,监督该研究。另外,该研究还得到了位于以色列耶路撒冷的希伯来大学研究与开发部门的支持。)

    我们所做的许多决策都是基于对不确定事件概率的信念,这些不确定事件包括选举结果、被告的内疚感或是美元的未来价值。这些信念通常被表述为“我想……”“概率是……”“它是不可能的……”等。对于不肯定事件的信念有时还能以概率或主观概率等数字形式表现出来。那么,是什么决定了人们的信念?

    人们又是怎样评估不确定事件的概率和不确定数量的价值呢?本文将会告知你们,人们依赖于数量有限的启发式原则,而这些原则能将测量概率以及预测价值的任务简化,使其成为更为简单的判断过程。总的来说,这些启发法相当有用,但有时也会导致严重的、系统性的错误。

    对概率的主观评估与对距离或大小等物理量的主观测量相类似。这些判断都依赖于效度有限的数据,是根据启发式的规则进行的。例如,某物体的距离取决于其清晰程度。物体看上去越清楚,其距离就显得越近。这条规则有一定的效度,因为在任何给定的情境中,距离较远的物体都会比距离较近的物体更不清楚。然而,对这条规则的信赖会导致我们在测量距离的过程中产生系统性错误。特别是在能见度较低时,物体轮廓就会模糊,而其距离就常常会被高估。另一方面,在能见度较高时,物体轮廓就会清晰,其距离也就会被低估。因此,如果依赖于清晰度,将清晰度作为测量距离远近的标尺的话,就会导致普遍的偏见。这样的偏见在对概率直觉性的判断中也会出现。本文将描述三种应用于判断概率和预测价值的启发式,列出由这些启发式引起的偏见,并讨论这些偏见的实际应用和理论内涵。

    代表性

    人们考虑的许多概率问题都包含在以下某个类型当中:物体A属于类别B的概率是多少?事件A起源于过程B的概率是多少?过程B引起事件A的概率是多少?人们在回答这些问题时,会典型地依赖于代表性启发法,即通过用A来代表B,也就是通过比较B与A的相似程度来对概率进行评估。例如,如果A能高度代表B,人们就会认为A源自B的概率高。但如果A与B并不相似,人们就会认为A源自B的概率低。

    若想通过代表性对判断进行阐述,请考虑下面这个情况,若有某个人被他原来的邻居描述为:“史蒂夫非常腼腆,少言寡语,很乐于助人,却对他人或这个现实世界没多大兴趣。他谦恭有礼,做事井井有条,中规中矩,关注细节。”人们如何从一个可能的职业列表中(例如农民、售货员、飞行员、图书管理员或是医生)评估他从事某个特定职业的概率?又如何根据可能性的大小来将这些职业进行排序呢?在代表性启发法中,例如,史蒂夫是个图书管理员的概率是通过其与典型的图书管理员形象的代表性或相似性来进行评估的。事实上,对于这类问题的研究已经表明,人们对职业概率的排序与对职业相似性的排序方法完全是相同的。而这种关于概率的判断方法会导致严重的错误,因为相似性或代表性不会受到某些因素的影响,而这些因素却能影响对概率的判断。

    对结果的先验概率(prior probability)不敏感。 对代表性没有任何影响而对概率有重要影响的其中一个因素是结果的先验概率,或基础比率。例如,在史蒂夫的那个例子中,在我们作出史蒂夫是个图书管理员而不是农民的理性评估时,是应该将农民比图书管理员人数更多的事实考虑在内的。然而,对基础比率的考虑并不会影响史蒂夫与图书管理员以及农民的典型形象的相似性。因此,如果人们通过代表性来评估概率,先验概率就会被忽视掉。我们在运用了先验概率的实验中检验了这个假设。在实验中,我们向受试者简要概述了几个人的性格,这几个人是从100位工程师及律师的样本中随意抽取出来的。而受试者需要通过对每个人的描述来评估其是工程师还是律师。在某个实验情境中,受试者被告知这些被描述的100人中,有70位工程师、30位律师。而在另一个实验情境中,受试者被告知这100人中,有30位工程师、70位律师。在第一种情境下,受试者判断任意一个描述是关于工程师的而不是关于律师的概率都应该高于第二种实验情境。因为第一种情境中工程师更多,第二种情境中律师更多。值得注意的是,我们通过贝叶斯定理还能知道每个描述的概率比率应该是(0.7/0.3)2,或是5.44。然而,这些受试者在这两个实验情境中都得出了同样的概率判断,这严重违反了贝叶斯定理。很明显,受试者认为某个特定的描述是在说工程师而非律师是通过描述对于这两个典型职业的代表程度而来的,而很少或根本就不考虑其所属类别的先验概率。

    当这些受试者没有其他信息来源时,他们会正确地利用先验概率。在没有人物描述的情况下,受试者判断某个人是工程师或律师的概率分别是0.7和0.3,这与基础比率正好符合。然而,当某个描述存在,就算这个描述没有任何信息,先验概率还是会被彻底忽略掉。对于以下描述的回应就阐明了这个现象:

    迪克是位30岁的男性,已婚,但无子女。他能力强,干劲足,承诺一定要在自己的领域功成名就。他很受同事的欢迎。

    这个描述所传达的信息与迪克是工程师还是律师的问题完全没有关系。因此,迪克是工程师的概率应该与工程师占样本总人数的比率相同,就如同我们没有得到任何有关迪克的描述时一样。然而,受试者却将迪克是工程师的概率判断为0.5,并不关注工程师占总人数的比率是0.7还是0.3。很明显,在没有任何证据和得到了一些无用的证据之后,人们的回应是不同的。在没有任何特定证据的情况下,先验概率能够被合理地应用;而在得知一些无用证据的情况下,先验概率就会被忽略。

    对样本大小的不敏感。 在某个指定大小的样本中,评估获得某个特定结果的概率时,人们总会应用代表性启发法。即他们会通过某个样本结果与相关参数的相似性来评估这个结果的概率。例如,人们会认为随机抽取的10位男性的平均身高是6英尺,而这个结果就是由与相应参数(这个参数即是男性人口的平均身高)的相似性得来的。某个样本的统计数据与人口参数的相似性并不是由样本的大小来决定的。其结果就是,如果我们通过代表性来评估概率,判断出的某个样本的统计数据实质上就是独立于样本大小的。的确,当受试者评估大小不同样本的平均身高分布时,他们得出的分布是相同的。例如,人们在评估平均高度高于6英尺的概率时,无论样本大小是1 000、100还是10位时,其得出的分布都是相同的。另外,即使样本大小的重要性在问题形成之时就被强调过,受试者还是不能体会其所起的作用。请考虑下面的问题:

    某个城镇有两家医院。在较大的那家医院里,每天大约有45个婴儿降生,而在较小的医院里,每天有15个婴儿降生。如你所知,其中50%的婴儿应该是男婴。然而,男婴实际的百分比每天都会有所变化,有时会高于50%,有时会低于50%。

    在一年的时间里,每家医院都记录了新生婴儿中男婴比率大于60%的天数。你认为,哪一家医院记录的天数更多?

    更大的医院(21)
    更小的医院(21)
    大致相同(其天数的不同在5%的范围内,53)

    括号中的数值表示的是选择该答案的大学生人数。

    无论是大医院还是小医院,多数受试者判断出的60%以上新生儿是男婴的概率都是相同的。这可能是因为这些事件都来自于同样的统计资料提供的描述,因此关于总体情况的代表性相同。相反,以样本理论进行分析的话,在小医院里,超过60%的婴儿是男婴的天数肯定应该比大医院的多,因为大样本的男女比率不太可能偏离50%。很明显,这个统计学的基本概念与人类的直觉不相符。

    在对后验概率(即从一个整体而不是另一个整体中抽取样本的概率)的判断中,人们对样本大小的问题也不是很敏感。

    请考虑下面这个例子:

    想象有个装满球的罐子,其中有2/3的球是一种颜色,1/3的球是另一种颜色。某个人从罐子里取出了5个球,发现有4个是红色的,1个是白色的。另一个人取出了20个球,其中有12个是红色的,8个是白色的。这两个人中,谁更会认为罐子里2/3的球是红色的,1/3的球是白色的?每个人给出的概率各是多少?

    在这个问题中,假设两次抽取的先验概率相同,那对于4∶1的那个样本来说,其正确的后验概率应为8 ∶1;而对于12∶8的样本来说,其后验概率为16∶1。然而,大多数人却认为第一个样本为罐子里主要是红球的这个假设提供了更为有力的证据,因为第一个样本的红球比例要比第二个样本的高。这再次证明了,直觉性判断由样本比例主导,本质上并不受样本大小的影响。然而,样本大小却对实际的后验概率起着至关重要的作用。此外,对后验概率的直觉性评估比起正确的值来说并没有那么极端。在这类对概率的评估中,低估证据的影响反复出现。这种情况被称为“保守主义”。

    误解机会 。人们期望由随机过程产生的事件序列能够代表这个过程的基本特征,即使这个序列很短。例如,人们在考虑抛硬币看正反面的问题时,总会觉得其顺序更可能是正—反—正—反—反—正,而不是正—正—正—反—反—反,因为后者并不能体现出抛硬币的公正性。因此,人们期望过程的基本特征不仅表现在整个序列中,还表现在局部的序列中。然而,局部代表的序列系统地脱离了概率的期望:因为局部代表的序列中选择很多,但可供选择的项却很少。抱有局部代表性这个想法的另一个后果就是有名的赌徒谬误。例如,在看到轮盘赌的指针长时间连续指向红色以后,大多数人就会错误地认为现在该是指向黑色的时候了。这是因为,相比再次出现红色,出现黑色会使序列更具代表性。人们普遍将概率视为可进行自我纠正的过程。在这个过程中,某个方向的偏离能引起其相反方向的偏离,以达到恢复平衡的目的。事实上,在概率的结果揭晓之时,偏离并不是被“纠正”了,而只是融为一体了。

    不只是天真的受试者才会误解概率。一项关于统计直觉的研究以有经验的心理学家为受试者,揭示了人们长期抱有的“小数法则”这一信念。这些受试者认为,他们抽取的样本即使很小,也具有很强的代表性。他们这样的回应反映了一个有效的假设:某个具有统计意义的样本结果可以代表样本所属的整个群体的性质,这与样本大小并无关联。因此,研究人员过于信任小样本的结果,高估了这些结果的可复制性。在实际的研究中,这些偏见会导致研究人员选择的样本不够大,并对仅有的发现作过多的阐释。

    对可预测性的不敏感。 有时,人们需要作一些数值上的预测,例如,预测某只股票的走势、某种商品的需求量或是某场球赛的最后比分。这样的预测经常是通过代表性作出的。例如,假设有个人在听了关于某家公司的描述之后,需要预测这家公司的未来收益。那么,如果这个人听到的描述是正面的,他就会预测这家公司将有非常高的收益,因为高收益最能代表那个描述;如果描述是普通的,这个人就会觉得公司的表现也会很普通。描述的好坏程度并不受该描述的可信程度以及精确程度的影响。因此,如果人们仅仅依靠描述的好坏来预测,那么他们的预测就会对证据的可靠性和预测的预期精确度不敏感。

    这种判断模式违反了标准的统计理论。在标准的统计理论中,出于对可预测性的考虑,极端和预测范围受到了控制。当某件事的可预测性为零时,该预测的结果在任何情况下都应该是相同的。例如,如果在一些公司的描述中,没有听到有关其收益的信息,那么对所有这些公司未来收益的预测都应该是相同的。当然,如果某件事的可预测性非常高,那么预测值就会符合实际值,预测的范围也会等同于实际结果的范围。总之,可预测性越高,预测值的范围就会越广。

    一些关于数值预测的研究表明:直觉性预测违反了这条规则,因为受试者很少甚至没有考虑过可预测性的问题。在其中一项研究里,受试者看了几段文字,每段文字都描述了一位实习老师在特定实习课上的表现。一些受试者需要根据那几段文字描述以百分制来评价特定总体的课堂质量,其他受试者则需要预测这些实习老师在5年以后的成就,同样要以百分制来打分。这两种情况下作的判断是相同的,即预测某一未来事件(老师在5年以后的成就)与评估当前事件所依据的信息(实习课的课堂质量)是相同的。作这些预测的人肯定也意识到了用某位老师5年以前的实习课来预测她的教学能力过于局限。不过,他们的预测与评估一样极端。

    效度错觉。 前面已经介绍过,人们常会挑选输入信息(例如对某个人的描述)中最具代表性的特点(例如职业)来进行预测。他们在预测时的自信程度主要取决于相关信息代表性的高低(即所选特点与输入信息的吻合程度),与限制预测准确性的因素关系不大。因此,人们在听到与图书管理员的典型形象相符合的性格描述后,就会极有自信地作出所描述的人就是一个图书管理员的预测,即使这个描述是片面的、不可靠的或是过时的。由于预测特点与输入信息非常吻合而产生的没有保证的自信就被称为效度错觉。即使当判断者意识到限制其预测准确性的因素时,这种错觉仍然存在。许多文献已经证实:甄选面谈的出错率很高,但即使心理学家知道这一点,在甄选面谈时,他们还是常会在预测中表现出很大的自信。尽管不断有证据表明甄选面谈是不恰当的,但临床上仍然持续依赖这种访谈方式,这也充分说明了效度错觉强大的影响力。

    预测需要依靠输入,而输入模式的内部一致性就是决定人们在预测时自信程度的主要因素。例如,相比某个在一年级得了许多A但也得了许多C的学生来说,人们在预测一年级得了许多B的学生的平均绩点时会更有自信。高度一致的模式最常出现在输入变量过多或相关度高的时候。然而,相关统计学的结果证实,若规定了输入变量的效度,基于几个这种输入的预测会比输入过多或相关情况下的准确性高。因此,输入变量过多虽然可以增加自信程度,但却会降低预测的准确性。而人们在预测时所抱持的信心常会超出他们的能力范围。

    误解回归性。 假设让一群儿童做两套等效的能力测试题。如果你挑选出了在其中一套能力测试题中表现最好的10个人,那么他们在另一套测试中的表现通常会让你失望。相反,如果你挑选的是在其中一套能力测试中表现最差的10个人,你就会发现,他们在下一次测试中平均都比前一次测试表现得好。一般来说,假设变量X和Y有相同的分布。如果你挑选的X的平均分数偏离了X的均值K个单位,那么,Y的平均分通常偏离Y的均值的程度就会少于K个单位。这些观察表明了一个普遍的现象,即回归平均值现象。这个现象是高尔顿在100年前首次证明的。

    在正常的生命过程中,你会遇到许多回归平均值的例子。例如,在比较父亲与儿子的身高,丈夫与妻子的智力水平或是某个人连续测试的不同表现时。不过,人们没能对此现象产生正确的直觉。首先,人们不能预料一些肯定会发生回归平均值的情境。其次,当他们辨别出回归平均值的发生时,总会捏造出虚假的因果解释。有这样一个信念:预测结果应该最大程度代表输入信息,因此,结果变量的值也应与输入变量的值一样极端。我们提出,回归平均值的现象之所以难以掌握就是因为与上述信念不相容。

    未能意识到回归平均值的重要性将会带来严重的后果。下面这个例子就说明了这一点:在一次关于飞行训练的讨论中,有经验的指导员注意到,若赞扬某位飞行员着陆非常平稳,该飞行员下一次着陆就会表现得糟糕;若某位飞行员着陆较差,该飞行员下一次着陆就会有很大进步。这些指导员总结道,口头表扬对学习是有害的,而口头批评却大有益处,这与广为接受的心理学定律相左。由于回归平均值的存在,这个结论是没有根据的。就像其他重复的测试一样,每次表现糟糕以后总会有进步,而表现优异以后又总会变得糟糕,即使指导员没有对学员的第一次表现给予任何回应。指导员形成了惩罚比奖赏更有效这个错误且有潜在危害的结论,因为他们正好在着陆表现优异后表扬了这些学员,在着陆表现糟糕后批评了这些学员。

    因此,未能理解回归效应会导致人们高估惩罚的有效性,低估奖赏的有效性。无论是在社会交往中,还是在训练中,表现得好都会有奖赏,表现得差也都会有惩罚。因此,行为最有可能在惩罚之后得到改进,在奖赏之后变得更坏,这其实就是一种回归现象。其结果就是:人们碰巧因为惩罚他人得到了奖赏,因为奖赏他人得到了惩罚。然而,人们通常不会意识到这种偶然性。事实上,难以掌握回归性主要是因为奖赏与惩罚带来的结果非常明显,因此,这个领域的学者也没有注意到它。

    可得性

    有时候,人们会通过能想到例子或事件的容易程度来评估这类事的频率或概率。例如,你可能会通过回忆自己认识的人中有多少位是心脏病患者来估测中年人患心脏病的风险。同样,你也可能会通过想象某个企业可能会遇到的各种难题来估测其倒闭的概率。这种判断启发式被称为可得性。可得性对于评估频率或概率来说,是个很有用的线索,因为相比频率较低的类别的例子来说,我们可以更好、更快地得到频率较高的类别的例子。然而,可得性并不受频率和概率的影响。因此,依赖于可得性会导致预测的偏见。我接下来将说明其中的一些偏见。

    因例子的可提取性导致的偏见。 当用某个类别的例子的可得性来判断该类别的大小时,例子很容易提取的类别会比频率相同但例子较难想到的类别显得更大。在证明此效应的基本研究中,受试者听到了一串知名人士的名字,男女均有。接着,他们需要判断这串名字中男性是否比女性多。不同组的受试者听到的名字并不相同。在一些名单中,男性更有名;而在另外一些名单中,女性则更有名。受试者都错误地判断了所有名单的类别(性别)。他们的判断显示,名人更多的类别,其数目也越大。除了熟悉度以外,显著程度也会影响例子的可提取性。例如,看见房子失火对这类事件主观概率的影响可能会比在报纸上读到失火这件事的影响要大。另外,最近发生的事有可能会比之前发生的事更容易获得。对于交通事故的主观概率会在见到一辆翻倒在路边的车后暂时升高,这很平常。

    因搜索集合的有效性导致的偏见。 假设从某个英文文本中随机抽取一个词(含有3个或更多字母的词)。这个词更有可能是以r开头还是以r作为第三个字母?人们在回答这个问题时,会回忆首字母为r的单词(例如road)以及第三个字母为r的单词(例如car),然后通过想到这两个词的容易程度来评估相对频率。因为从记忆中搜寻单词的首字母要比搜寻其第三个字母更为容易,所以大多数人都判断以某个辅音开头的单词要比第三个字母为该辅音的单词多。但实际上,例如r或k的辅音字母,出现在第三个字母的频率都要比出现在开头的频率高。

    不同的任务会引发不同的搜索集合。 例如,假设你被要求评估抽象词(比如想法、爱)和具体词(比如门、水)出现在书面英语中的频率。回答这个问题自然而然的方法就是搜寻这些词可能出现的情境。联想起提到抽象概念(爱情故事中的爱情)的情境似乎要比联想起提到具体词(例如门)的情境更为容易。如果用单词出现情境的可得性来判断这些单词的频率,抽象词就会多于具体词。这一偏见在最近的研究中已被发现,此研究表明,判断出抽象词的出现频率比具体词的出现频率高很多,与客观频率相等。相较于具体词,抽象词还会出现在更多的语境中。

    想象力的偏见。 有时,你需要评估某类事件发生的频率,这类事件的实例没有储存在你的大脑中,但你可以通过一定的规则构建一些实例。在这样的情况下,你通常会构建几个实例并通过构建这些实例的容易程度来评估其频率或概率。然而,构建实例的容易程度并不总能反映出真实的频率,这种评估模式很容易导致偏见。下面这个例子将会说明这一点:请考虑一个10个人的团体,他们想组成一个有K个成员的委员会(2 ≤k ≤8)。他们可以组成多少个不同的且有K个成员的委员会?这个问题的正确答案是二项式系数(10/ k),当K=5时,达到其最大值252。这明确表明了,K个成员的委员会数量等于(10 – k)个成员的委员会数量,因为任何有K个成员的委员会界定了一个独有的(10 – k)个非成员的团体。

    若想不通过计算就回答这个问题,则需要在心里构建有K个成员的委员会,然后通过构建这些委员会的容易程度来评估它们的数量。人数较少的委员会(比如只有两人的委员会)会比人数较多的委员会(比如有8人的委员会)更容易构建。因此,如果通过想象力或是构建的可得性来评估频率的话,规模小的委员会似乎就会比规模大的委员会的数量更多,这与对称的钟形函数正好相反。事实上,在要求天真的受试者评估规模不同的委员会的数目时,他们的估计是委员会规模的单调递减函数。例如,他们评估的有两个成员的委员会的中值是70,有8个成员的委员会的中值是20(正确答案应该是两种情况下都是45)。

    在真实情境中,想象力对概率的评估起着重要的作用。例如,通过想象某次探险中无法应对的意外事件来评估这次探险的风险。如果能想到许多这样生动的意外事件,这次探险就会显得尤其危险,尽管想到这些灾难的容易程度并不能反映出它们实际发生的可能性。相反,如果没能想到某些可能的危险,那将要承担的风险就会被低估。

    相关性错觉。 L. J.查普曼与J.P.查普曼曾描述过一种有趣的偏见,这种偏见是在判断两个同时发生的事件的频率时产生的。他们向受试者提供了几个假设的精神病患者的信息。信息包括每位病人的临床诊断数据和一幅由病人画的人像画。然后,受试者需评估每个诊断(例如妄想症或疑心病)以及人像画中不同特征(例如奇怪的眼睛)的频率。受试者明显高估了自然的联想物同时发生的频率,例如疑心病和奇怪的眼睛的频率。这种效应被称为相关性错觉(illusory correlation)。受试者错误地判断了得到的数据,“重新发现”了许多普遍但无根据的临床知识,这些临床知识就涉及人像画测试的相关解释。相关性错觉效应极度抗拒相互矛盾的数据。即使在症状与诊断呈负相关的情况下,相关性错觉仍然存在,它使受试者不能察觉到真正存在的关系。

    可得性为相关性错觉效应提供了自然的解释。根据两个事件相互关联的强度,可以判断出它们同时发生的频率。当两个事件关联性强的时候,你可能会认为它们经常同时发生。因此,强关联常被判断为经常同时发生。根据这个观点,疑心病与奇怪的眼睛的关联性错觉就是由疑心病常会与奇怪的眼睛而引起的,而不是因与人体其他部位相联系而引起的。

    从我们的人生经历可知,总的来说,相比发生频率低的例子,我们更能又好又快地回忆起发生频率高的例子,更容易想到可能发生的事,而不是发生概率不高的事。当事件频繁地同时发生时,这两个事件之间的关联性会得以增强。所以,人们可以自由使用可得性启发式的程序,具体是通过提取、构建和联想等相关大脑运作的容易程度来估测类别的数量、事件的可能性或是事件同时发生的频率。然而,前面的例子已经说明,这个有价值的估测过程会导致系统性错误。

    判断与锚定

    在许多情况下,人们都会通过初始值来确定最后的答案。初始值或起始点,可能是从问题形成之时得到的提示,也可能是在稍微计算之后得到的结果。但无论是前者还是后者,其调整都不会太过充分。不同的起始点会产生不同的估测,都会偏向于初始值。我们将这个现象称为锚定。

    不充分的判断。 在某个证明锚定效应的实验中,受试者需要估测不同的数值,并以百分比来进行评定(例如非洲国家在所有联合国成员国中所占席位的百分比)。在猜测每一个数值的时候,受试者面前一个范围为0~100的幸运转盘都会旋转一次。受试者首先需要说明,转盘指针指向的数值比起实际值来说是高了还是低了,然后,再将转盘的指针拨向自己估计的值。不同的小组面对的是不同的初始数字,而这些随机的数值对估计有着巨大的影响。以非洲国家占联合国成员国的百分比为例,转盘指针指向10的小组估测的中值是25,而指针指向65的小组估测的中值是45,其中,10和65就被受试者视为起始点。对于估计要精确的要求也并没能削弱锚定效应的影响。

    锚定不只是在受试者被给予相关起始点的情况下发生,当受试者依赖于未完成的计算结果进行估测时,这种情形也会发生。关于直觉性数值估计的研究就说明了这一效应:在黑板上写出一些算式,让两组高中生在5秒之内估计结果。其中一组学生估计下面这个算式的结果

    8×7×6×5×4×3×2×1

    另一组学生估计以下算式的结果

    1×2×3×4×5×6×7×8

    想要快速回答这样的问题,人们可能会先计算几步,然后再通过外推或调整得出结果。由于判断的根据并不充分,这样的过程就会导致低估。另外,就前几步的计算结果而言(从左到右进行计算),降序序列得到的结果肯定会比升序序列的结果大。那么,你就会认为第一个序列的结果大于第二个序列的结果。这两种判断都得到了证实。对于升序序列中值的估计为512,对降序序列估测的中值是2 250,但正确的答案应该是40 320。

    评估连续事件与非连续事件的偏差。 在巴希勒最近的一次研究中,受试者需要选两个事件中的一个来打赌。该研究应用了三种类型的事件:(1)简单事件,例如从一半是红球一半是白球的口袋中取出一个红球;(2)连续事件,例如从90%是红球、10%是白球的口袋中连续7次抽取红球;(3)非连续事件,例如从10%是红球、90%是白球的口袋中连续取球7次,至少取出一个白球。在这个问题中,相比简单事件的那个赌(概率是0.50),绝大多数受试者都更愿意打连续事件的那个赌(概率是0.48)。而相比不连续事件(概率是0.52),受试者又更愿意打简单事件的赌。因此,在这番比较中,大多数受试者倾向于打的赌都是相对不太可能发生的事件。这样的选择模式证明了一个普遍的发现。对赌的选择以及对概率的判断的研究表明:人们易于高估连续事件的概率,低估非连续事件的概率。这样的偏见是由锚定效应引起的。基本事件的概率(即任意某个阶段的成功)提供了估测连续事件以及非连续事件概率的自然起始点。因为从出发点进行调整显然不会充分,对于上述两种事来说,最后的估测都会与基本事件的概率相接近。请注意,某个连续事件的整体概率会比其中每个基本事件的概率低,而非连续事件的整体概率会比其中每个基本事件的概率高。由于锚定的影响,在连续的问题中,整体概率会被高估;在非连续问题中,整体概率会被低估。

    评估复合事件的偏见在计划的情境中尤其明显。成功完成某个任务(例如推广一个新产品)具有连续的特征:要想某个任务成功,该任务中包含的每一个事件就都必须发生。如果需要发生的事件数量众多的话,即使每个事件都很有可能发生,其整体成功的概率也可能会很低。高估连续事件概率这个普遍的倾向会使人们在评估某个计划成功的可能性或能否按时完成时过度乐观,但却缺乏根据。相反,非连续结构总会遭遇风险性的评估。一个复杂的体系,例如核反应或人的身体,如果其中的某个部分出现问题,整个体系就会出现故障。即使每个部分失败的可能性都很小,但若包含很多部分,那么整体失败的概率也可能会很高。因为锚定效应,人们会倾向于低估复杂系统失败的概率。因此,我们有时可以从事件的结构中推测出锚定偏见的方向。连续事件的链式结构会导致高估,非连续事件的漏斗式结构会导致低估。

    评估主观概率分布时的锚定。 在决策分析中,专家时常需要以概率分布的形式来表示他们对某个数值(例如某一天的道琼斯指数)的信念。这样的分布通常是根据专家选择的不同数值构建的,而这些数值与其主观概率分布的百分位相对应。例如,判断者可能会被要求挑选出一个数字X90。这样的话,他认为这个数字将会超过道琼斯指数的主观概率就是0.90。也就是说,他选择数字X90,所以愿意接受道琼斯指数不会超过这个数值的比率是9 ∶1。通过几个这样对应于不同百分位数的判断,我们可以构建出道琼斯平均指数的主观概率分布。

    通过搜集多个不同数值的主观概率分布,还有可能测试出判断者的度量或校准是否合适。如果待估量值的真实值有II%分布在某位受试者规定的XII值之下,那么这个受试者就在一系列问题中进行了恰当的(或外部)校准。例如1%的量值,其真实值应该分布在X01之下,即X99之上。因此,98%的问题,真实值应该在X01到X99的置信区间内。

    几位研究人员已从大量的判断中观察到许多量值的概率分布。这些分布表明了其与恰当的校准之间巨大且系统的偏差。在多数研究中,30%的问题,其待评估量的真实值或小于X01,或大于X99。也就是说,受试者设定的置信区间过小,与他们关于待估量的知识所能证明的相比,反映出了更大的确定性。经验不足与经验老到的受试者都存在这种偏差,而引入合适的积分规则虽能为外部校准提供刺激,但也不能彻底消除偏差。这种效应至少部分是因锚定引起的。

    例如,为了选择X90作为道琼斯指数,人们会首先想到自己对道琼斯指数最佳的估测,然后将这个数值上调。如果这个调整和大多数其他调整一样是不充足的,那么X90就不会是极端的。同样的锚定效应在选择X10时也会发生,这时,人们就会将最佳估测向下调整。所以,X10到X90之间的置信区间将会太小,而待估量的概率分布就会更紧密。一种程序能够系统地改变主观概率分布,使最佳估测值不作为初始值,这也支持了这种解释。

    某个给定的量(比如道琼斯指数)的主观概率分布可以通过两种不同的方法得以实现:(1)要求受试者选择与自己的概率分布的特定百分位数相符合的道琼斯指数;(2)要求受试者估测出的真实值超过特定数值的概率。这两种方法在形式上是等同的,因此应该产生相同的分布。然而,这两种方法体现出的是不同锚定下不同的判断模式。在方法(1)中,自然的起始点是人们对变量的最佳估测。此外,在方法(2)中,受试者可能将锚定点定在了问题中给定的数值上。或者,他可能将锚定定位在相等的概率上,即50–50的概率,因为这是估测可能性通常的起始点。无论哪种情况,方法(2)得到的概率应该不会像方法(1)那样极端。

    为了对比这两种方法,研究人员给一组受试者24个量值(例如从新德里到北京的空中距离),并要求他们在每一个问题上估计X10或X90。另外一个组的受试者得到的是第一组受试者对24个数值中每个评估结果的中值。他们被要求评估每个给定的数值超过相应量值的真实值的概率。在没有任何偏见的干扰下,第二组受试者应该提取出和第一组相同的概率,即9 ∶1。然而,如果使用50%的概率或给出的数值作为锚定,第二组的概率也应该更不极端,即接近于1 ∶1。事实上,第二组给出的所有问题的概率中值都是3 ∶1。当对两组受试者的判断进行外部校准时,发现第一组的受试者太过极端,这与早前的研究结果相符合。他们估测的发生概率为0.10的事件实际上有24%发生了。相反,第二组受试者太过保守。他们认为平均概率为0.34的事件实际发生的概率只有26%。这些结果说明了校准的程度取决于引导的程序。

    讨论

    本附录关注的是依赖于判断启发式的认知偏见。我们不能把这些偏见归因于激励效应,比如一相情愿的想法或是因为报酬和罚款而扭曲的判断。实际上,尽管受试者被鼓励应尽量准确,而且答案正确的话还能得到奖赏,但还是会犯前面所提到的严重的判断性错误。

    对启发式的依赖性以及偏见的普遍存在,并不局限于普通人。有经验的研究人员在凭直觉进行思考时,同样易于犯偏见的错误。例如,受过广泛训练的人在进行直觉判断时,也会有在没能充分考虑先验概率的情况下预测最能代表数据的结果这一倾向。尽管这些研究人员在统计学方面的经验可以使其避免类似于赌徒谬误的基本错误,但他们的直觉性判断还是容易在更为复杂的问题中犯类似的谬误。

    类似于代表性和可得性等有用的启发式可以得以保留,即使它们有时会导致预测或估测的错误。这一点并不会使我们惊奇,而可能会使我们惊奇的是,人们不能从其人生经历中推断出基本的统计学规则,例如回归平均值或是样本大小对样本可变性的影响。尽管在人的生命历程中,每个人都会遇到许多这样的例子,很少有人能独自发现样本和回归性的原则。我们不能从每天的经历中学习到统计学的规则,因为相关的例子不能被恰当地解释。例如,人们不会发现,某文本中连续几行单词的平均词汇长度比连续几页中单词的平均长度变化更大,因为无论是几行或者几页,人们根本就不会注意到单词平均长度的问题。所以,人们不能了解到样本大小和样本可变性的关系,尽管相关数据比比皆是。

    缺少恰当的编码也能解释为什么人们在判断概率时通常不能察觉到偏见。人们可以通过在分配的同样概率的事件中保持实际发生事件的比例,来了解自己的判断是否是外在度量的。但是,用判断所得的概率来将事件分组并不合适。那么,在分组缺乏的情况下,某个人就不可能知道他分配的有0.9或更高的概率的预测,有50%会真正发生。

    认知偏差的经验分析对于判断的概率理论及应用角色方面都有一定的意义。现代决策理论将主观概率视为某个理想化的人量化的观点。具体来说,对某个给定事件的主观概率可被定义为某个人是否愿意接受有关这个事件的赌注。如果这个人在不同赌注之间的选择满足于特定的规则,比如概率论的公理,那么内在一致或是连贯的主观概率就可以被引申出来。引申出的概率是主观的,原因是不同的人可以对同样的事件作出不同的概率评估。这种方法最主要的贡献是提供了对概率严格主观的解释,这个解释能够应用于独特的事件,也能应用于理性决策的普遍理论中。也许应该注意一点,我们有时可能从对赌注之间的偏好中推断出主观概率,但通常主观概率并不是由此而形成的。某个人愿意给A队下赌注而不是B队,是因为他相信A队更有可能会赢,他并不是从自己对赌注的偏好中推断出这个想法的。因此,在现实中,主观概率会决定我们对赌注的偏好,但我们并不是从这些偏好中推断出主观概率的,就如同理性决策中不证自明的理论一样。

    概率内在的主观本质使许多学生相信一致性或内在一致性是判断概率唯一有效的准则。从主观概率的形式理论来看,任何内在一致的可能性判断和其他判断都是一样的。这个准则并不完全令人满意,因为内在一致的主观概率可能和人们抱有的其他信念相抵触。例如某个人对抛硬币游戏所有可能结果的主观概率就反映了赌徒谬误。即他推测硬币更可能是呈反面,因为已经连续出现了多次正面。这样的判断可能是有内在一致性的,因此,根据形式理论,这是一个恰当的主观概率。然而,这样的概率与硬币是没有记忆的这一人们普遍持有的信念不相符,因此不能产生序列依存。若对判断的概率进行充分和理性的考虑,就会发觉对内在一致性的解释并不充分。判断必须与人们持有的所有信念相容。但不幸的是,还没有简单且正式的方法去测评一系列概率的判断与判断者整体信念系统的相容性。不过,理性判断者会努力争取这种相容,即使利用内在一致性能更容易完成判断和评估。特别是,理性判断者会尝试使自己对概率的判断与自己相关的知识、概率的规则以及个人的判断启发式和偏见相容。

    结语

    本文描述了在不确定的情况下进行判断的三种启发式:(1)代表性。人们通常在需要判断物体A是否属于类别B或是事件A是否属于过程B时,就会使用代表性;(2)事件的可得性。当人们需要估测某类事件发生的频率或是某个特定进展的合理性时,就会使用可得性。(3)通过锚定进行调整。当相关数值可得时,许多预测都会用到锚定。使用这些启发式不仅能节约很多时间,大多数时候也很奏效,但它们也会导致一些系统性的错误。更好地理解这些启发式和它们带来的偏见,能够在不确定的情境下提高判断和决策的质量。

    附录B 选择、价值以及框架

    (1983年8月,我在美国心理协会大会上发言时用的就是这篇文章,后来因此被授予卓越科学贡献奖。这篇文章最初发表在《美国心理学者》杂志上。)

    摘要:我们已经讨论了在风险状况以及无风险状况下,作选择时认知和心理的决定因素。价值的心理物理学会使人们在获利概率大时选择规避风险,在损失概率大时选择冒险。概率中体现的心理物理学使得人们过于重视确定的事情和不可能发生的事(与一般的概率性事件相对)。决策问题可用多种关于不同偏好的方式来进行描述或建构,这与理性选择的不变性准则相矛盾。心理账户过程(人们在此过程中会组织交易的结果)可以解释一些消费行为中的反常现象。是否采取某个选择取决于这个选择可能的负面结果是被评估为一种成本还是无法补偿的损失。我们将讨论决策价值和体验价值之间的关系。

    人们总是在做决策,做决策时可能是有意识的,也可能是无意识的,就像是在念散文。如此看来,决策制定也自然会涉及众多学科,包括数学和统计学、经济学和政治科学,以及社会学和心理学。对决策的研究不但解决了规范性问题,也解决了描述性问题。规范性分析涉及理性的本质和决策制定中的逻辑。而描述性分析涉及的却是人们真实的观念和偏好,而不是人们应有的观念和偏好。规范性和描述性考虑问题间的对峙就是判断和决策研究的主要内容。

    在分析决策制定时,通常会将有风险的决策和无风险的决策区分开来。是否会去赌钱(赢的概率确定)是具有风险的决策的典型例子,而是否会接受将某件商品或某项服务换成钱或劳力则是没有风险的决策的典型例子。本文第一部分分析了有风险前景价值的认知和心理物理学的决定因素。第二部分介绍的是这种分析在交易和贸易中的运用。

    风险性选择

    做出类似是否带雨伞或是否参战这种有风险的决策时,人们是不会知道其结果的。因为还有很多不确定因素在里面,比如天气好坏或敌人的强弱。是否会做出某项决策可以被看成是否会打某种赌,当然,是赌就会产生不同的结果,且不同的结果会有不同的概率。因此,对于在一定风险下的决策制定的研究关注的就是在简单的赌钱和确定的概率间的决策,并希望这些简单的问题能对风险和价值的研究有所启示。

    我们在研究风险决策问题时提出了一套方案,此方案的许多假设都是从人们对金钱和概率反应的心理物理学分析中得来的。对于决策制定的心理物理学分析最早出现在丹尼尔·伯努利于1738年发表的一篇有重要影响力的文章中。伯努利在这篇文章里试图解释为什么人们总是会选择风险规避,而随着财富增长选择风险规避的意愿却降低了。为了更明白地说明风险规避和伯努利的分析,请思考这样一个问题:我们现在面临两种选择,一种是有85%的概率赢得1000美元(15%的概率什么也得不到),一种是肯定会得到800美元。虽然从数学的角度来看,选择冒险会得到更多的好处,但大多数人还是更愿意选择确定的事。赌钱的结果是经权衡后的平均值,这种平均值在计算时会把每种可能的结果进行权衡。在刚提到的问题中,赌一把的结果可表示为0.85×1000+0.15×0 =850(美元),这比选择确定的事(肯定会得到800美元)所得到的钱要多。选择确定的事就是风险规避。大体来看,选择确定的事而不是赌一把(所得结果更多或同等)被称为风险规避;不选择确定的事,而愿意赌一把(可能性更小或相等)被称为风险追求。

    伯努利建议不要通过收益结果来评估前景,而是要通过这些结果的主观价值来评估。某次赌的主观价值也是一种经过权衡后的平均值,但在这里,每种结果的主观价值是通过其发生的可能性来权衡的。为了在这个框架下解释风险规避,伯努利提出主观价值或者说是效用,可用收益的凹函数来表示。例如,在这种函数下,200美元和100美元间效用的不同比1 200美元和1 100美元间效用的差异更明显。从函数凹处可以看出,得到800美元的主观价值比得到1 000美元的价值的80%要大。因此,效用函数的凹处也就意味着是风险规避,人们会选择肯定能得到800美元,而不是有80%的概率得到1 000美元,尽管这两种可能最终得到的钱数一样。

    在决策分析中,常用总财富状态来描述决策的结果。例如,一个下20美元赌注的抛硬币游戏,就可以表示成在个人当前的财富状态W和等概率的可能变成W+20美元或W–20美元的财富状态间的选择。这种表示方法在心理学上是不现实的,因为人们通常不会从财富状态出发来考虑概率相对较小的结果,人们常会从收益、损失和中立的结果(比如维持现状)的角度来考虑。如果主观价值的表示方式如我们提出的那样,是财富的变化而不是最终的财富状态,那么对于结果的心理物理学分析就应该应用到获得和损失上来,而不是应用于总财产上。这种假设在对待有风险的选择方面发挥着重要作用,我们称之为前景理论。无论是通过反省还是心理物理学的测量,都表明主观价值是个关于获得多少的凹函数。同样的归纳也适用于描述损失。损失200美元和100美元的主观价值的区别要比损失1 200美元和1 100美元的主观价值的区别要大。当把获得和损失的价值函数结合到一起时,我们就得到了一个S形的函数,如图B–1所示。

    图B-1

    图中显示的价值函数是由获得和损失来定义的,而不是通过总财富值来定义的。在获得的情况下是凹面,在损失的情况下是凸面,损失情况下的曲线比获得情况下的曲线更陡。该图表示的情况就是损失厌恶,表明了获得某笔钱的吸引力要弱于人们想要规避某笔损失的意愿。损失厌恶解释了为什么人们不愿在抛硬币的游戏中选择有同等概率的赌注:可能的收益的吸引力并不足以抵消可能的损失带来的厌恶。例如,在以大学生为样本的抛硬币实验中,如果赢得的收益不到30美元,大多数受试者都会拒绝冒10美元的风险。

    对风险决策的假设在经济理论中占有核心地位。然而,正像收益曲线的凹面表示的是风险规避一样,损失曲线的凸面也表示着风险追求。确实如此,在损失的情况下选择风险追求作用很大,尤其是在损失的概率很大时。例如,人们在有85%的概率损失1000美元(15%的可能性什么也不损失)和肯定会损失800美元间作出选择时,大多数人都愿意选择赌一把而不是选择确定的损失。这就是风险追求。因为赌一把的期望值(–850美元)比确定事件的期望值(–850美元)要低。在损失情况下的风险追求已经得到了一些研究员的证实。即使在结果不涉及钱时,这种结论也得到了证实,比如疼痛时间和生命的损失。在获益的情况下选择风险规避和在损失的情况下选择风险追求是错的吗?这些偏向与对得失的主观价值的强烈直觉相符合,其前提是人们可自由选择对获得和损失的自我价值。然而,我们会看到这条S形价值函数曲线所显示的含义时,从规范的角度来看,它是不被接受的。

    为了解决规范的问题,我们从心理学转向决策理论。现代的决策理论最早可追溯到冯。诺依曼和摩根斯顿的研究。他们创建了几条定性原则或公理,而且这些原则和公理能左右理性的决策制定者的偏向。其中的公理包括有传递性(如果A比B更受青睐,B比C更受青睐,那么A就比C更受青睐)、替代性(如果A比B更受青睐,那么赢得A或C青睐的可能性就比赢得B或C青睐的可能性更大),以及其他一些技术性公理。针对理性决策公理的规范化和描述化状态已经有了广泛的讨论。特别是有证据显示,人们不总是遵从替代性公理,而且对于这个公理的规范性优点还有很多反对意见。然而,所有关于理性决策的分析都包含了两条原则:主导性和不变性。

    主导性要求如果前景A在各方面和前景B都一样好,但至少A在一方面强于B,那A就应比B更受青睐。不变性要求在众多前景中的偏向不应依从于描述的方式。特别是,如果两种表达方式不同的问题同时出现,能被界定为实质是相同的,那么这两种表达方式不在同一时间出现时,人们也应该对它们持有同样的偏向。现在,我们给出了不变性的要求,这种要求虽然看上去很基础且无关紧要,但人们却不是总能做到。

    结果的框架

    风险前景的特点表现在它们可能的结果以及产生这些结果的概率方面。然而,同样的选择会以不同的方式来构架或描述。例如,一次赌的可能结果可以被构架成现状的获得或损失,或是包含最初财富的资产状态。不变性要求不能因为对结果描述的不同而改变自己的偏向。下面的这两个问题违反了这个要求。N表示每个问题的受试者总数,括号里是选择每个选项的人数比例。

    问题1(N=152):设想美国可能爆发一种异常的亚洲疾病,这种疾病可能导致600人死亡。有两种方案来应对疫情,假设下面是对每种方案结果准确的科学预测:

    如果采取方案A,可救治200人。(72%)

    如果采取方案B,有1/3的概率救治600人,2/3的概率无人获救。(28%)

    你会选择哪种方案?

    问题1的表达模式可作为此事件的一个参考状态,即该疾病会夺去600条生命。两种方案的结果包括这种参考状态以及通过被救者的数量而量化得来的收益情况。就像期待的那样,偏好是一种风险规避:绝大多数受试者更愿意选择能保证有200人获救的方案,而不是有1/3的可能性救600人的方案。现在来考虑另一个问题,还是同样的情况,但两种方案用的是另一种方式表述:

    问题2(N=155):

    如果采取方案C,400人死亡。(22%)

    如果采取方案D,1/3的概率没有人死,有2/3的概率600人全部死亡。(78%)

    很容易看出问题2中的方案C和D与问题1中的方案A和B在本质上没有差别。然而问题2中假设的参考点是没有人会因为该疾病而死亡。最好的结果是维持该参考状态,其相对的情况是因该疾病致死的人数来量化的损失。用这些参考状态来评估作出的选择可表明,人们会偏向于赌一把(方案D)的风险追求,而不是肯定会丧失400条性命的风险追求。实质上,在第二个问题中的风险追求比在第一个问题中的风险规避代价更大。

    没能遵守不变性这一现象非常普遍,且难以克服。这在经验丰富的受试者和初级受试者中都很常见,即使相同的受试者在几分钟内回答这两种问题,也无法消除这一现象。面对两种相互矛盾的回答,受试者也时常不解。但即使再读一遍该问题的陈述,他们也会在“生命拯救”的说法中选择风险规避,在“生命死亡”的说法中选择风险追求。而且他们在两种说法中都希望能遵守不变性,且给出一致的回答。在他们不断地迎合下,框架效应更像是感觉错觉而不是计算上的错误。

    下列问题引出了违反理性决策的主要要求的偏向。

    问题3(N=86):请在下列选项中作出选择:

    E:25%的概率赢得240美元,75%的概率失去760美元。(0)

    F:25%的概率赢得250美元,75%的概率失去750美元。(100%)

    很容易看出F比E更占优势。实际上,所有的受试者也都是这样选择的。

    问题4(N=150):设想你需要同时对下面两个问题做出决策。

    先看一下两个决策,之后选出你偏爱的那一项。

    决策(1)在下列两者中选择:

    A.肯定会得到240美元。(84%)

    B. 25%的概率得到1000美元,75%的概率什么也得不到。(16%)

    决策(2)在下列两者中选择:

    C.肯定会损失750美元。(13%)

    D. 75%的概率损失1 000美元,25%的概率什么也不损失。(87%)

    通过前面的分析可以看出,在第一个决策中,大多数受试者会对确定的事选择风险规避;更多的受试者在第二个决策中选择风险追求,而不是确定的事。事实上,73%的受试者选择A和D,而只有3%的受试者选择了B和C。同样的结果模式也出现在问题的另一种说法中,在这种说法中,大学生们选择了他们能够真正参与的博一把。

    受试者会同时考虑问题4中的两个问题,因此,相对于B和C,他们会偏向于A和D。然而,受试者的偏向(A和D)往往受放弃的选择的控制。若把肯定会得到的收益(选项A)增加到D选项上,会产生有25%的概率赢得240美元和75%的概率失去760美元的结果。这正是问题3中的选项E。同样,把750美元确保的损失(选项C)增加到B选项上,会产生25%的概率得到250美元和75%的概率失去750美元的结果,这也正是问题3中的F选项。因此构架的敏感性以及S形的价值函数在一些需要同时做出决策的事件中与主导因素相违背。

    能运用这些结果的地方并不理想:不变性从规范上来看是至关重要的,直觉是很吸引人的,但从心理学角度看却无法实现。我们只设想了保证不变性的两种方式。第一种就是采取可将任何问题、实质等同的表达方式转化成完全一样的常规表述。我在给经济系的学生上课时,常会将这点作为最基本的原理告诫他们,他们应该在思考每一个决策问题时,从总值的角度考虑,而非仅从收益和损失上考虑。这样的表述可避免违背在先前问题中提到的不变性,但执行起来却很难。除了特殊情况,也就是从获得和损失的角度考虑钱财结果比从当前的财富状态考虑更普遍。此外,风险前景的常规表述需要计算同时出现的决策(例如问题4)的所有结果,而计算这些同时出现的决策的难度超过了对简单问题直觉上的计算。在其他条件下用常规表述更困难,这些条件包括安全性、健康性或生活质量。我们是否应该建议人们,通过计算因某种疾病致死的总数,或因研究中某种特殊疾病而致死的人数,去评估公共卫生政策(例如问题1和2)?

    另一种可以保证不变性的方法是通过保险精算的结果来评估某项选择,而非通过心理学的结果来评估。在人们的生活中,保险精算的准则有一定的吸引力,但对于涉及钱的决策而言,这样的准则明显不够。应该说,该准则在伯努利时期就被意识到了,而且对于缺少客观量度标准的结果完全不适用。总之,构架不变性很难被预测,而且人们在某个特殊选择中的自信不能确保其在另外一个框架下还会做出同样的决策。因此,用多种方法来构架决策问题的行为来测试偏向的稳定性是个不错的方法。

    概率的心理物理学

    到目前为止,我们假设伯努利的期望原则所依据的是某种不确定前景的价值或效用,该原则是通过增加每种可能结果的效用而得来的,每个结果的效用又都是通过概率来加以权衡的。为了测试这个假设,我们再从心理物理学角度出发。将当前的状态价值设为零,想象有份价值300美元的收益,我们将这份收益的价值设为1。现在假设你只有一张彩票,且该彩票的单次奖励是300美元。这张彩票的价值会怎样随着赢得奖励的可能性函数而改变?除了赌一把的效用外,这种前景的价值一定会在零(当赢得的概率为零时)和1(确定赢得300美元)之间变化。

    按照直觉,彩票的价值并不是获胜概率的线性函数,正如期望原则推导出的那样。从零到5%的增长比从30%到35%的增长有更大的影响力,而相对于从95%到100%的增长,影响就显得小了。综合考虑各方面可得出种类—边界效应:即从不可能到可能,或从可能到确定的变化比变化范围内的变化有更大的影响力。这种假设体现在图B–2的曲线上,该曲线以函数的形式标出了对某事件众多可能性的权重。该图最大的特点是关于规定的可能性,决策权重会成回归状态。除了终点附近,获胜的概率每增加0.05,赢得奖励的价值就会增长不到5%。我们接下来要研究的就是在有风险的选择中,对偏向的心理物理学假设的含义。

    在该图中,决策权重在很大的范围内要低于相应的概率。过低权衡确定事件的中等或高概率会降低能得到奖励的赌局的吸引力,从而在会有所得的选择中使人们选择风险规避;同样,在损失的情况下,也会通过减弱对赌局中的损失厌恶而选择风险追求。然而,小概率事件常被过高权衡,且非常小的概率不会被过高权衡或完全忽视,使得这个区域内的决策权重很不稳定。对低概率过高权衡推翻了前面描述的规律模式:它提高了风险大的赌注的价值,提高了对于小概率的严重损失的厌恶值。最终,人们通常在未必有收益的情况下选择风险追求,在未必有损失的情况下选择风险规避。因此,决策权重的特点解释了彩票和保险政策吸引人的原因。

    图B-2

    决策权重的非线性必然会违背不变性,下列两个问题就说明了这一点:

    问题5(N=85):假想有如下两个阶段的游戏。在第一个阶段,有75%的概率在游戏最后什么也得不到,有25%的概率会进入到第二个阶段。如果你进入第二个阶段,可以在下面两个选项中作出选择:

    A.肯定会获得30美元。(74%)

    B.80%的概率获得45美元。(26%)

    你必须在游戏开始前作出选择,也就是说,要在第一个阶段结果出来前选择。

    问题6(N=81):请在下面两个选项中作选择:

    C.25%的概率获得30美元。(42%)

    D.20%的概率获得45美元。(58%)

    由于在问题5中有25%的概率进入到第二个阶段,选项A有25%的概率获得30美元,选项B有80%(0.25×0.80 = 0.20)的概率获得45美元。因此,问题5和问题6在概率和结果方面是相同的。不过,这两种说法的偏向却不同:在问题5中,绝大多数人更喜欢获得小数目钱的高概率选择;而在问题6中,情况却正相反。现实和假设的收益(当前,其结果用钱来表示),生命的拯救和丧失,以及概率过程的非连续表示都已经证实了这种与不变性的违背。

    我们认为,不变性之所以被证实不成立是由于两种因素的相互作用:即概率的构架和决策权重的非线性。具体说,我们认为,人们会忽略问题5中的第一个阶段(不管是否已经做出决策,都会产生相同的结果),且只专注于进入第二个阶段后会发生什么。当然,在这种情况下,如果人们选择A,肯定会有所获得;但如果人们更愿意赌一把,就会有80%的概率获得收益。的确,在需要作出连续选择的问题中,人们的选择会和在肯定会获得30美元且有85%的概率获得45美元间的选择相同。因为相比有一般或较高概率的事件来说,确定事件会被过高权衡,肯定会获得30美元的选项就比需要连续做出决策的问题选项更具吸引力。我们将这种现象称为虚假确定性效应,因为实际上不确定的事件在被权衡时会被看成是确定的。

    可能性范围的低端也出现了类似的现象。假设你嫌保险费太高而不确定要不要买地震保险。就在你犹豫不决的时候,保险代理说你可以有另一个选择:“你可以选择支付一半的保险费,若地震发生的日子是奇数,你就能获得全额的保险金。”但为什么很多人会认为这种保险没有吸引力呢?图B–2给出了答案。在低概率范围内任意处(设为P点)开始,概率从P降低到P/2的决策权重的影响会比从P/2减小到零的影响小得多。因此,风险降低一半不会使得只需一半的保险费更具吸引力。

    对概率保险的厌恶主要有三个原因。第一,传统上对保险的解释是从凹线效用函数的角度出发的,而概率保险显然违背了这一点。按照期望效用函数理论,当普通的保险可被接受时,概率保险应该比普通保险更受欢迎。第二,概率保险有多种形式的防御措施,比如做医疗检查、购置新轮胎或安装防盗系统。这些措施没有完全排除所有的危害,却有效地降低了某些危害的可能性。第三,意外事件的构架也会影响人们是否购买保险。例如,火灾保险不包含洪水造成的灾难,这种保险政策就会被评估为是对某种特定危险(比如火灾)的完全防护,或总财产损失的可能性的降低。

    从图B–2可以发现,相对于完全消除危险而言,人们过低估计了降低发生危险的可能性。因此,当将保险被描述成可以消除危险而不只是降低危险时,保险会更具吸引力。的确,正如斯洛维克,费斯科霍夫和利希滕斯坦所说的那样,假设某种疫苗可将发病率从20%降低到10%,若这种疫苗被描述成可治愈一半的病人时,与其被描述成对相同症状的病毒的一半完全有效得到的吸引力相比,其对公众的吸引力更小。

    公式化效应

    我们已经谈到,构架效应可表明不变性也有不成立的时候。现在,我们将目光转移到控制结果和事件框架的过程上。公共卫生问题就体现了公式化效应,若把“生命拯救”的说法换为“生命丧失”,其偏向会从风险规避转变为风险追求。很显然,受试者采用了问题里面给出的关于结果的描述,并将结果评估为收益和损失。麦克尼尔、鲍克、萨班斯和特沃斯基提出了另一种关于公式化效应的例子。他们发现,当用死亡和存活来描述肺癌可能出现的结果时,医生和病人对治疗方法的偏向差异非常大。外科手术不像放射性治疗那样,在治疗期间会有一定的死亡风险。因此,用死亡来描述外科手术的结果比用存活率来描述的吸引力更小。

    医生或者总统顾问,可以不用歪曲或隐藏事实,只构架事件发生的结果和可能性就能左右病人或总统的决策。公式化效应可能会偶然发生,人们可能会意识不到框架效应对最终决策的影响。公式化效应也可以被利用起来控制选项的相对吸引力。泰勒指出,信用卡行业的说客总是说,信用卡和现金在购买力上的区别可被表示为现金可打折,而不是信用卡可超额使用。这两种表述通过分配比平常价钱更少或更多的钱,将不同的价钱用获得或损失来构架。由于损失给人们带来的感受比收益带来的感受强烈,相对于放弃折扣,消费者更不愿意额外付费。正如人们所预期的那样,在商界和政界,试图影响框架构架的尝试经常发生。

    由于价值函数的非线性,以及人们有从问题的陈述所给出或隐含的参考点去评估某种选择的倾向,因此,对结果的评估易受公式化效应的影响。值得注意的是,在其他情况下,人们会自主地将同样的信息用同样的表达方式来加以转换。对语言理解力的研究指出,人们会将听到的东西迅速地转化为抽象的表述,这种表述不能再区分该想法是用主动还是被动的形式来表达的,且不能再辨别实际所说的和暗指的、假定的或包含的意思。不幸的是,自主地进行这些运作的大脑机制不能完成将公共健康问题或死亡率、存活率的统计问题转化成普通的抽象任务。

    交易与贸易

    我们可将对框架构架以及价值的分析应用到多属性选择中,比如是否接受某项交易或贸易。为了评估多属性选择,我们作出了这样的假设,人们会建立一个心理账户,并用此说明某个选项的优点和缺点,这与多属性的参考状态相关联。某项选择的总体价值是通过相对于其参考状态的优缺点的平衡状态得以实现的。因此,当某个选项的优点多于其缺点时,这个选项就会被采纳。在作这种分析时,人们会从心理学上(而非从实际角度)将优缺点分开来考虑。该模式没有规定要把不同的特点综合起来,从而形成对优缺点的整体考虑,但在这种模式下考虑问题时需要作出凹面曲线和损失厌恶的假设。

    我们对于心理账户的分析得益于理查德。泰勒的研究,他揭示了心理账户的过程和消费者行为之间的相关性。下面的问题来自萨维奇和泰勒曾举过的例子,他们通过这个例子引入了控制心理账户的原则,并表明了从价值曲线到是否接受交易的过渡。

    问题7:设想你要买一件125美元的夹克和一个15美元的计算器。去买计算器时,那家商店的销售员告诉你,另一家分店正在搞促销,10美元就可以买到你想要的这款计算器,开车20分钟就能到那家店。你愿意去那家店吗?

    这个问题的重点在于你是否接受销售员的提议,这个提议将路程的不便捷和价格上的优惠相结合,可被构架成一个最小限度的涉及主题或全面综合的理论。最小限度的理论只包括两种选项的不同,并忽视这两种选项共有的特点。在最小限度理论中,驱车到另一家店可被构架成有5美元的收益。涉及主题的理论将可能的选择同参考水平联系起来,且参考水平是通过引起决策的情境来确定的。在先前的问题中,相应的主题是购买计算器,因此,去另一家店的意义就被构架成价格降低(从15美元降低到10美元)。由于价格的节省只与计算器有关,夹克的价格就没有包含在涉及主题的理论中。夹克的价格以及其他的花销可以包含在更加全面综合的理论中,在这个理论中,节约与每月消费相联系。

    前面的问题模式在最小账户、局部账户或综合账户中处于中立。但我们却表示,人们会自然而然地用局部账户来构架决策,在制定决策时,该账户的作用在感觉上和“好的形式”发挥的作用相似;在认知上,和基本层次范畴相似。局部事件和价值曲线使得为了节省5美元去另一家店买计算器的意愿与计算器的价格相反,与夹克的价格无关。为了验证这个预测,我们用另一种说法来表达这个问题,其中两种商品的价格是可以互换的。某家商店的计算器卖125美元,分店里卖120美元,夹克的售价为15美元。和预期一样,在这个问题的两种说法中,愿意去分店的人数比例大相径庭。结果显示,68%的受试者(N=98)会为了节省5美元(原价15美元的计算器)愿意去分店,但在93名受试者中,只有29%的人愿意为了节省5美元(原价125美元的计算器)跑去分店。这个问题的两种说法在最小账户和综合账户中是相同的,因此,这个发现证明了局部账户的概念。观察发现,一个城市不同商店中同种商品报价的标准偏差与平均值大致成比例,通过这个观察得出,在消费者行为中,局部账户有着重要作用。消费者肯定希望买到物美价廉的商品,这就必然会影响到价格的差别,这些结果表明,相对于为50美元的商品节省5美元来说,消费者对于为了150美元的商品节省15美元没有太大的兴趣。

    局部账户使得人们从相关而不是单独的角度来评估收益和损失,导致金钱交换率有很大变动,比如为买到好商品而打电话的次数,或驾车行驶较长距离的意愿。大多数消费者认为相对于买一辆汽车或一幢房子而言,买车载音响或波斯地毯较为容易。当然,这些现象和消费者行为的标准理论背道而驰,消费者行为理论对不变性作出假设,并且意识不到心理账户的影响。

    下面的问题是关于心理账户的例子,在这个例子中,某笔账目中的花费受局部账户的左右:

    问题8(N=200):设想你想看一场电影,每张票的价格是10美元。入场时,你发现票丢了。座位没有标记,而且票又找不到。

    你愿意花10美元再买一张票吗?

    愿意。(46%)

    不愿意。(54%)

    问题9(N=183):设想你打算看一场电影,每张票的价格是10美元。入场时,

    你发现丢了10美元。

    你现在还愿意花10美元买一张票吗?

    愿意。(88%)

    不愿意。(12%)

    对这两个问题的不同回答很能引起人们的兴趣。为什么很多人在丢了票以后不愿意再花10美元,而丢了与票价相当的钱后却愿意再花10美元?我们将这点不同归因于局部账户。去电影院被看成是种交易,其中买票的钱被交换成看电影。再买一张票提升了看电影的成本,以至于很多受试者都认为这难以接受。相反,丢的钱没有被纳入电影的成本中,这只会使得个人感觉自己的财富减少了一点,从而影响买票的决定。

    当将问题的两种说法呈现给同样的受试者时,有趣的事情发生了。若丢钱的说法紧随着丢票的说法出现,人们会更愿意再买张票。相反,丢钱后再买票的意愿没有因为此前另一个问题的出现而受到影响。两个问题的同时出现显然使受试者将丢票视为丢钱是有理可依,但反过来却不是这样。

    心理账户作用的规范化状态会被质疑。之前列出的问题,比如公共卫生问题的两种说法只是形式不同,而计算器和电影票问题的两种说法则是本质上的不同。尤其是在购买15美元的商品时,节省5美元很具吸引力;而在较大花销的商品上可以节省5美元时,吸引力就没有这么大了。同时,相对丢了10美元而言,一张电影票花双倍的钱更令人懊恼。后悔、沮丧以及自我满足感都会受到框架效应的左右。如果这样的从属结果被认为是合理的,那么观察到的受试者的偏向也就没有和不变性原则相矛盾,也就不会被视为不一致或因错误而被排除。从另一个角度说,从属结果也会在反思之后发生改变。当人们在购买200美元的商品而无法节省10美元时,从15美元的商品上节省5美元的满足感就会被破坏。我们不建议用相同的方式来解决任何有相同首要结果且有两种解决方案的问题,但我们建议可以将另一种框架效应的系统检测作为一种有效的反思方法,帮助决策制定者评估其决策的首要或次要结果的价值。

    损失和成本

    许多决策问题都以在维持现状和选择一个替代选项的形式出现。这些替代选项在某些方面是有利的,而在其他方面又是不利的。早期用于线性风险前景的价值分析可运用到这种决策中来,其方法是通过假设现状可定义问题所有因素的参考水平。替代选项的有利点会被评估成收益,而其不利点会被评估为损失。因为损失比收益的影响更大,决策制定者会偏向于维持当前现状。

    泰勒用“禀赋效应”这个词来描述人们不愿意分隔属于自己的资产。当放弃资产的痛苦大于获得收益时的愉悦时,购买价格会远低于出售价格。也就是说,人们为了获得某物而付出的最高价钱,会低于使他们放弃已有资产的最低补偿价。泰勒列举了消费者与企业家的行为中一些关于禀赋效应的例子。一些研究发现,在假设和现实交易中,买入价格和出售价格都会有本质的不同。这些结果是对标准经济理论的质疑。在标准经济理论中,除了交易成本和财富效应外,买价和售价应保持一致。我们还发现,在假设的周薪(S)不同和工作地点的温度(T)不同的工作中选择时,受试者也会迟疑。我们让受试者想象他们的工作有特定的周薪和温度(S1,T1),并且他们可以换另一份工作(S2,T2)(这份工作在周薪和温度两者中有一点优于前一份工作,而另一点不如前一份工作)。我们发现,大多数处在(S1,T1)的受试者不愿意换到(S2,T2),而且处于(S2,T2)的受试者也不愿换到(S1,T1)。很显然,在薪水或者工作环境差异相同的情况下,不利点显得比有利点更为突出。

    总的来说,损失厌恶偏向于稳定而非改变。假设有一对兴趣相同的双胞胎,他们认为某两种环境对自己的吸引力相同。出于某种原因,两人被迫分开,并分别置身于这两种环境中。他们很快会将自己的环境设为参考点,并据此评价对方环境的优缺点。两人对两种环境都不再漠视了,并且都更愿意待在自己所在的环境中。因此,偏向的不稳定产生了对稳定的偏向。除了偏向稳定而不是变化以外,适应性和损失厌恶的结合通过降低已排除的选项以及他人“禀赋”的吸引力,对悔恨和忌妒产生了有限的保护。

    损失厌恶及其禀赋效应在传统的经济交易中发挥的作用不是很大。例如,商店老板不会认为付给供货商的钱是损失,也不会将从顾客那里得到的钱视为收益。而是将一段时期的成本和收益累加起来,仅就平衡状态进行评估。在评估前,相匹配的借款和贷款会被有效地取消。消费者支付的钱不会被评估为损失,而是种购买。在标准经济理论的分析下,我们很自然地认为可以用金钱购买到的商品和服务来代表金钱本身。当某人在头脑中有特定的选择时,如“我能买个新相机或者新帐篷”,该评估模式会被明确制定。在这种分析下,如果相机的主观价值超过了保留买相机的钱的价值的话,人们往往选择买相机。

    在某些情况下,不利点可被构架为成本或损失,尤其是当买保险也能被构架为是在肯定的损失和可能的更大损失间的选择时。在这些情况下,成本—损失间的差异会导致违背不变性的情况发生。例如,请在肯定损失50美元和有25%的概率损失200美元间作出选择。斯洛维克、费斯科霍夫和利希滕斯坦指出,80%的受试者选择风险追求,即想赌一把而不是接受确定的损失。不过,只有35%的受试者拒绝花50美元为25%的概率损失200美元上保险。舒梅克尔和昆鲁斯以及赫尔歇和舒梅克尔也得出了类似的结论。我们认为,同样多的钱在第一个问题中被构架为了无法补偿的损失,在第二个问题中被构架为预防损失的花费。相对于消费而言,损失更让人厌恶,因此两个问题中的模式化偏向相颠倒。

    在收益的情境下,我们也观察到了相似的结果,如下列问题所示:

    问题10:你会接受一个有10%的概率获得95美元、90%的概率损失5美元的赌吗?

    问题11:有种抽奖有10%的概率赢得100美元、90%的机会什么也得不到,你愿意花5美元参加这种抽奖吗?

    有132个大学生回答了这两个问题,且两个问题间有个填充问题。有一半的受试者看到的问题顺序是调换的。虽然很容易看出这两个问题的选项从客观上看是一致的,但有55名受试者给出了不同的偏向。有42位受试者在问题10中不愿意赌一把,却在与问题10有着相同结果的问题11中选择了参加抽奖。这种看上去似乎是无关紧要的研究说明了消费—损失矛盾和框架效应的力量。相比将5美元看做损失,将这5美元当做支付的钱,使得冒这个险更加容易令人接受。

    之前的分析表明,通过将损失的结果构架成消费而不是损失时,人们的主观状态会被提升。我们可以将这种心理改变解释为废弃—损失效用(dead-loss effect)的矛盾行为。泰勒提到过一个例子,在这个例子中,某个人交了网球俱乐部的会费,其技能很快就变得非常棒,即使生病了也坚持去俱乐部,为的是不浪费已交的会费。假设此人如果没有交会费就不去练习,那么问题就出现了:伤病期练习怎么能提高其水平?我们认为,带病训练是将会费评估成一种消费。如果停止练习,则此人就会被迫将会费视为完全的损失,这可能比带病练习更让人厌恶。

    结语

    效用和价值的概念一般会被用在两个完全不同的意义中:(1)体验价值:高兴或悲伤的程度、对结果真实体验的满足感或痛苦;(2)决策价值:预期结果对某个选项中总的吸引力或厌恶的影响。由于体验价值和决策价值常被假设成是一致的,所以两者的区别在决策理论中并不明显。这个假设是理想化的决策者持有的概念的一部分,理想化的决策制定者能准确地预测未来的事情,并以此来评估自己的决策。但对于普通的决策制定者而言,其体验价值与决策价值的一致性不会太完美。影响体验的某些因素是很难预测的,而且一些影响决策的因素对结果的体验并没有产生与其相当的影响力。

    相对于决策制定的大量研究而言,对于这种将享乐体验与主观状态相联系的心理物理学的研究还不是很系统化。享乐的心理物理学最基本的问题就是,测定出能从消极结果中区分出对积极结果的认可或渴望。享乐的参考点在很大程度上是由客观现状决定的,但其也会受期望值和社会比较的影响。例如,在某位员工升职比办公室里其他人慢时,客观进步就会被认为是一种损失。随处境变化而体验到的愉悦或痛苦也依靠于享乐适应的动态变化。布里克曼和坎贝尔就享乐跑步机的概念提出了激进假说,即快速的适应性会使得任何客观进步的影响都很短暂。享乐体验的复杂与微妙使决策制定者很难预测结果的真实体验。很多人选择在非常饿的时候去点菜是很不明智的,当第五道菜端上桌来时,他们就会承认这是个错误的做法。决策价值和体验价值的不匹配引发了很多决策问题中额外的不确定因素。

    框架效应的普遍性以及对不变性的违背使决策价值和体验价值之间的关系更加复杂了。结果框架时常引出在实际体验中与之无法对应的决策价值。例如,分别用死亡和生存来构架肺癌治疗方法似乎不会影响到体验,尽管这种方法对决策有很大的影响。然而在其他情况下,决策框架不仅影响了决策,还影响了体验。例如,某笔花费被构架为无法补偿的损失或保险费的话,很可能就会影响到人们对结果的体验。在这些情况下,制定决策时,对结果的评估不仅能预期到体验,还能构架模式。

  • 丹尼尔•卡尼曼《思考,快与慢》25-34

    第四部分 选择与风险

    第25章 事关风险与财富的抉择

    20世纪70年代早期的某一天,阿莫斯给了我一篇打印好的文章,其作者是瑞士的经济学家布鲁诺·弗雷(Bruno Frey),文章讨论的内容是经济理论的心理学假设。
    我对这篇文章的深红色封面仍然记忆犹新。尽管布鲁诺·弗雷本人几乎已经忘了写过这篇文章,但我仍能记起文章的第一句话:“经济理论的传播者(即经济学家)是理性且自私的,其倾向性没有发生变化。”我对这种说法感到很吃惊。在我隔壁那栋房子里工作的一些同事就是经济学家,但我却未曾发现我们在理智方面存在什么本质差异。对于心理学家来说,人不会是完全理性或完全自私的,而且其品位也不可能一成不变,这一点不言自明。我们两个学科似乎在研究不同物种,行为经济学家理查德。泰勒后来将这两个物种称为经济人和人类。
    心理学家所了解的经济人与人类不同,他们认为人类拥有系统1。人类的世界观受制于眼见即为事实的原则,因此他们不能像经济人那样有一致性和逻辑性。他们有时很慷慨,经常愿意为自己所在的团队作出贡献,而且他们对于自己明年甚至明天会喜欢什么都没有什么想法。那时我们有机会进行一次跨学科的有趣交谈,没想到那次交谈会确定了我的职业生涯。

    面对风险,我们不是理性的经济人

    给我看过弗雷的文章后不久,阿莫斯就建议我们将下一个研究项目定为决策制定。对于这个课题,我几乎没有一点概念,但阿莫斯是这个领域的专家和领军人物,他说他会教我。在他还在读研究生时,就曾和别人合著了一本《数学心理学》(Mathematical Psychology),他指定了几个章节让我看,说这些章节可以帮助我入门。

    我很快就了解到,我们的主要课题是研究人们在作有风险的选择时的态度,而且我们要找到一个特定问题的答案,这个问题就是:在不同的简单风险之间和在有风险与确定的事情之间,究竟是什么规则操控了人们的选择。

    简单的风险问题(比如“有40%的概率赢得300美元”)对于制定学习决策的学生而言,就像是果蝇之于遗传学家的意义一样。对简单风险进行的选择提供了一个简单的模式,这个模式和研究者想要了解的更复杂的决策问题有着相同的重要特点。各种风险表明,这些选择的结果永远不会是确定的,即使表面看上去很确定的结果也是不确定的:在签订购房合同时,你不知道将来自己卖掉这所房子时价钱会是多少,也不知道邻居的儿子很快就会学吹大号。我们在生活中作出的每个重要选择都会带有一定的不确定性—正因如此,学习决策制定的学生才希望在模拟情景中学到的课程中有一些知识可以在更加有趣的日常问题中得到应用。当然,某些决策理论家之所以研究简单的风险问题,其主要原因是因为其他的决策理论家就是这样做的。

    这一领域过去有个理论,即期望效用理论(expected utility theory),这个理论正是理性代理模式的基础,时至今日依旧是社会科学中最重要的理论。期望效用理论并不是按照心理学模式设计的,它是基于理性的基本原则(原理)作出的逻辑选择。

    请看下面这个例子:

    如果你对苹果的好感多于香蕉,那么,你也愿意以10%的概率赢得一个苹果,而不是以同样的概率赢得一根香蕉。

    这里的苹果和香蕉代表任意选择对象(包括风险),10%的概率代表任何的可能性。20世纪最伟大的知识分子之一、数学家约翰·冯·诺依曼(John von Neumann)和经济学家奥斯卡·摩根斯顿(Oskar Morgenstern)从几个原理中推导出了风险的理性选择理论。经济学家赋予了期望效用理论双重角色:作为一种规定决策制定方式的逻辑,作为对经济人决策方式的描述。尽管同为心理学家,阿莫斯和我却是从那时才开始明白人类究竟是如何作出风险选择的,而且我们对人们的理性没有作任何假设。

    我们保留着每天进行若干小时交流的习惯,有时在我们的办公室里,有时在餐厅,最常见的方式是步行走过耶路撒冷那些静谧的街道,边走边谈。就像在研究判断问题时所做的那样,我们仔细审视了自己的直觉性偏见。我们花时间设计出简单的决策问题,并自问要如何作出选择。例如:

    你愿意选择哪一项?
    A.抛硬币决定。如果是正面,你会得到100美元;如果是背面,你就什么都得不到。
    B.肯定会得到46美元。

    我们并没有试图找出最理性或获利最大的选择。我们想找到一个直觉性选择,一个一看就想选的选项。我们几乎总会选择同样的选项。在这个例子中,我们两个都会选B选项,而且很可能你也会这么选。当我们自信地达成一致时,我们都相信—结果证明我们这种想法几乎总是正确的—大多数人都会作出跟我们一样的选择,而且我们持有这种想法仿佛有可靠的证据一般。当然,我们知道此后还需要对自己的直觉加以证实才行,但通过扮演实验者和受试者的双重角色,我们就能顺利推进实验。

    在风险研究进行了5年之后,我们终于完成了一篇文章—《前景理论:风险下的决策分析》。我们的理论仿照了期望效用理论,但两者还是存在着根本上的不同。最重要的是,我们的模式是纯描述性的,而且我们提出这个模式的目的是要用文件证明并解释对不同风险进行选择时对理性原理的系统违背现象。我们把这篇文章投给了《计量经济学》(Econometrica),这份杂志刊登的都是经济学和决策理论方面的重要理论文章。事实证明,对杂志社的选择也很重要。如果我们将完全相同的文章发表在一份心理学杂志上,它对经济学的影响很可能就微乎其微了。然而,我们当时作出那样的投稿决定并不是希望对经济学产生影响,只是决策制定问题的顶级论文过去都是刊发在这份杂志上,于是我们也跃跃欲试。就这个选择和许多其他选择而言,我们是很幸运的。事实证明,前景理论是我们做过的最有意义的工作,而且我们的文章在社会科学文章中是被引用最多的文章之一。两年后,我们在《科学》杂志上发表了一篇论文解释了框架效应(framing effect):由无关紧要的措辞变化引起的巨大偏好变化。

    在研究人们如何做决策这一问题的前5年里,我们对人们在有风险的选项中进行选择的许多情形作了情况记录,其中有几次记录与期望效用理论截然相反。以前有人曾经观察过这些记录情况,有些是全新的情况。随后我们在对期望效用理论进行全面改进的基础上创立了一个理论,这个理论足以解释我们记录的所有观察结果,这个理论就是前景理论。

    我们将心理学中的心理物理学作为解决这一问题的方法,心理物理学是由德国心理学家、神秘主义者古斯塔夫·费希纳(Gustav Fechner)创建并命名的。费希纳对思维和事件之间的联系非常着迷。一边是可以变化的物理量,比如光能、音频或一笔钱;另一边是对亮度、音量或价值的主观体验。不可思议的是,物理量的变化竟然能够引起主观体验的变化。费希纳的研究是要找到将观察者思维中的主观量和物质世界中的客观量联系在一起的心理学规则。他提出,对于众多维度来讲,其功能是对数的—这就明显意味着如果某个给定因素(比方说,乘以1.5或乘以10)的刺激强度增加,在心理上也总会产生等量的增值。如果将声音的物理强度从10个单位提升至100个单位,心理强度就会增强4个单位,那么,刺激强度若进一步增强,比如将100个单位提升至1 000个单位,心理强度的增幅也是4个单位。

    伯努利的财富效用理论错在哪里?

    费希纳并不是第一个试图找到一个函数将心理强度和刺激大小联系起来的人,他自己对此很清楚。1738年,瑞士科学家丹尼尔·伯努利(Daniel Bernoulli)预先采用了费希纳后来的推理论证,并将其运用到对心理价值或钱的欲望(现在称其为“效用“)和钱的实际数量之间关系的研究当中。他认为,10达克(从前流通于欧洲各国的钱币)对于已经有100达克的人的效用和20达克对于有200达克的人的效用是相同的。伯努利当然是正确的,因为我们通常用百分比来表示收入的变换,比如,我们会听到”她工资涨了30%“这样的说法。他认为30%的上涨率在富人和穷人中会唤起非常相似的心理回应,而涨了100美元却未必会有这样的效果。费希纳规则表明对财富变化的心理反应和已积累的财富值成反比,进而得出结论:效用是关于财富的对数函数。如果这个函数是正确的,则10万美元和100万美元间的心理距离与1 000万美元与1亿美元间的心理距离是一样的。

    伯努利将自己的心理学知识运用到财富效用中,借以对风险评估问题给出一个全新的方法,这一问题对当时的数学家而言是一项很重要的研究课题。在伯努利之前,许多数学家就曾假设可以根据预期值对风险进行评估:预期值即对每个可能结果的概率进行加权后,得到的所有可能结果权重的平均值。例如,下面这个问题的预期值:

    80%的概率赢得100美元和20%的概率赢得10美元的预期值为82美元,即0.8×100+0.2×10=82(美元)。

    现在请自问下面这个问题:我是想接受上面这个风险收益还是想得到确定的80美元?几乎所有的人都想要得到确定数目的钱。如果人们在预期值的作用下估计不确定的前景的话,会更愿意尝试赌一把,因为82美元比80美元多。伯努利指出,人们实际上是不会用这种方式去评估风险的。

    伯努利观察到,大多数人都不喜欢冒险(即不喜欢接受最不可能的结果),而且,如果在期望值相同的风险收益和确定收益中作选择,他们就会选择确定收益。事实上,一个规避风险的决策制定者会选择一件低于预期值的确定事情,实际上就是拿出一笔额外费用以避免不确定的事情发生。伯努利用心理物理学来解释这种风险规避现象的时间比费希纳提前了100年。他的想法简单明了,即:人们的各种选择并非基于金钱价值,而是基于各种结果的心理价值,即它们的效用。如此说来,一个风险的心理价值就不是对可能会得到的金钱收益量的平均加权,而是这些收益效用的平均值,每项收益都要乘上自身的概率。

    财富值(百万达克)1 2 3 4 5 6 7 8 9 10
    效用值10 30 48 60 70 78 84 90 96 100

    上面是伯努利计算出来的一个效用函数版本。从中我们可以看出从100万达克到1 000万达克之间不同财富水平的效用。你会发现,在100万达克的基础上加100万达克就会增加20个点的效用值,但是,在900万达克的基础上加100万达克增加的效用值就只有4个点。伯努利指出,财富的边际价值递减现象(在现代术语中)可以解释风险规避问题—人们一般愿意选择确定事件而非具有相同或稍高预期值的风险收益。请看下面这个选择:
    获得100万达克和700万达克的概率相同效用:(10+84)/2=47
    或者
    肯定会得到400万达克效用:60

    就金额来说,风险收益的预期值和“确定事件”是相同的(都是400万达克),但两种选择的心理效用是不同的,其原因就是财富的效用递减,即从100万达克到400万达克的效用增值是50个单位,但从400万达克到700万达克同样增量的财富效用的增值就只有24个单位。风险的效用是(10+84)/2=47(其两种结果的效用,每种结果都乘以其概率的1/2),400万达克的效用是60。由于60比47大,根据这一效用函数,人们就会选择效用值更大的确定事件。伯努利认为,决策制定者在看到财富的边际效用递减时,就会规避风险。

    伯努利的文章言简意赅,他用自己的新概念“期望效用”(他称之为“道德期望”)来计算下列问题:圣彼得堡的某位商人“很清楚在每年的这个时候,从阿姆斯特丹开往圣彼得堡的商船中每100艘通常会损失5艘”。那么,如果这位商人要想从阿姆斯特丹装运香料的话,他愿意给商船买多少钱的保险。他的效用函数解释了为什么是穷人买保险、富人卖保险。你可以从上述函数效用版本中看出,对于有1000万达克的人来说,损失100万达克会损失4个点的效用值(从100到96);而对于只有300万达克的人来说,损失的效用值会更大,有18个点(从48到30)。穷人当然愿意花点钱将风险转嫁给富人,而这就是保险的背后原因。伯努利还对著名的“圣彼得堡悖论“提出了一个解决方案,在该悖论中,风险的期望值(用达克表示)无限大时,人们愿意只花几达克来赌一把。给人印象最深的一点是,伯努利从财富偏好的角度对风险态度的分析经受住了时间考验,在300年后的今天,这一分析方法在经济分析中仍未过时。

    伯努利理论令人尤为关注的地方在于它的经久不衰,尽管这个理论存在着严重缺陷。我们很少能从一种理论明确主张的部分中发现错误,这些错误往往隐藏在该理论忽视或假设的内容中。下面这种情况就是一例:

    如今,杰克和吉尔每人都有500万美元的财富。
    从前,杰克有100万美元,而吉尔有900万美元。
    他们如今是不是一样高兴?(他们的财富效用相同吗?)

    从伯努利理论的角度来看,杰克和吉尔的财富效用是使人们更快乐或更不快乐的原因。两人如今拥有同样的财富,因而,伯努利理论认为他们应该同样快乐,然而就算从来没有学过心理学,你也知道如今的杰克非常高兴,而吉尔却非常失望。其实我们知道,即使杰克如今只有200万美元而吉尔仍有500万美元,杰克也会比吉尔更高兴。所以伯努利的理论肯定是错误的。

    杰克和吉尔体验到的快乐是由他们财富的近期“变化”决定的,而不是由界定其参照点(杰克100万美元,吉尔900万美元)的不同财富现状决定的。这种参考依赖普遍受感觉和知觉影响。同样的声音,如果你在它之前听到的是低声耳语,就会感觉这个声音很大;而若在它之前听到的是大声吼叫,就会感到这个声音很小。要预估(声音)音量的主观体验,只知道声音的绝对音量还不够,你还需要知道听者进行自主比较的参照声音的大小。同样,在判断一张纸上的灰点是深还是浅时,你也需要知道这张纸的颜色如何。在预测一笔财富的效用之前,你同样需要了解其参考值。

    为说明伯努利理论的缺陷,我们再来看下面这个关于安东尼和贝蒂的例子:

    安东尼目前的财富是100万美元。
    贝蒂目前的财富是400万美元。
    现在,安东尼和贝蒂都要在风险和一个确定事件中作出选择。
    风险:拥有100万美元和400万美元的概率相等
    或者
    确定选项:肯定能拥有200万美元

    根据伯努利的解释,安东尼和贝蒂面临着同样的选择:如果选择赌一把,他们的预期财富将会是250万美元;如果他们选择确定选项,其预期财富则会是200万美元。据此,伯努利就会预期安东尼和贝蒂会作出同样的选择,但这样的预测是不正确的。之所以再度失败,还是因为这个理论在安东尼和贝蒂考虑自己的选择时并未给两人提供不同的参照点。如果站在安东尼和贝蒂的角度考虑一下,你很快就会发现目前的财富非常重要。他们也许会这样想:

    安东尼(目前拥有100万美元):“如果选择确定选项,我的财富肯定会翻倍。这是相当有吸引力的。同样我也可以选择赌一把,那样我的财富要么翻4倍,要么什么也得不到。“

    贝蒂(目前拥有400万美元):“如果选择确定选项,我肯定会损失一半财富,这将是非常可怕的。同样我也可以选择赌一把,那样我的财富要么会损失3/4,要么一点也不损失。“

    你能感觉到安东尼和贝蒂很可能会作出不同的选择,因为那个拥有200万美元的确定选项会使安东尼高兴,却会让贝蒂痛苦。还有一点需要注意,那个“最糟糕”的结果与那个“确定的”结果有何不同:对于安东尼来说,这种不同是财富翻倍或什么也得不到;而对于贝蒂来说,这种不同则是损失一半财富和损失3/4财富之间的不同。贝蒂更有可能会选择碰碰运气,就像其他人在面对非常糟糕的选择时所做的一样。在我讲述关于安东尼和贝蒂的故事时,他们都没有想到自己的财富状态:安东尼想的是得到,而贝蒂想的是损失。尽管他们面对的可能财富状态是相同的,但他们的心理过程却完全不同。

    因为伯努利的模式没有考虑到参照点,因此期望效用理论并没有体现出对安东尼而言的好结果对贝蒂来说却是坏结果这一明显事实。他的模式能解释安东尼的风险规避,却不能解释贝蒂对风险收益的偏好。这种冒险赌一把的做法在企业家和指挥官们束手无策时总会成为他们的不二选择。

    所有这一切都很明显,不是吗?人们很容易认为是伯努利本人构建了类似的例子并建立了一个更为复杂的理论来解释这些例子,但由于某种原因,他没有这样做。人们也可能认为与伯努利同时代的业界同仁并不同意他的观点,或者说后世学者在读到他的文章时会反对他的观点,但由于某种原因,他们也没有这样做。

    令人费解的是,结果效用这一概念在这些明显的反例面前如此不堪一击,却为何存在了这么长时间?我只能通过我常在自己身上发现的学者思维的一个弱点来解释这一现象。我称这个弱点为理论诱导的盲区(theory-induced blindness),即一旦你接受了某个理论并将其作为一个思考工具,就很难注意到其错误。如果你碰到一个似乎和这个模式不相符的例子,就会认为肯定有一个非常合理的解释,只是不知为什么你没有发现这个解释而已。你认为这个理论无可指摘,而且很信任认同这个理论的那群专家。很多学者都曾有那么一刻想起安东尼和贝蒂或杰克和吉尔这样的例子,而且偶尔会注意到这些例子与效用理论并不吻合。不过,他们没有继续深究,没有说“这个理论严重错误,因为它忽略了效用不仅仅依赖于某人目前的财富,而是依赖其财富的来源这一事实”。正如心理学家丹尼尔·吉尔伯特所观察到的那样,怀疑是件苦差事,而且运用系统2很容易令人疲惫。

    示例—伯努利理论的错误“3年前,他有2万美元的奖金,他对此已经很满意了,但他的薪水自那以后只涨了20%,所以他需要更多的奖金来获得同样的效用。”“两个人都愿意接受自己拿到的薪水,但他们对这份薪水的满意度不一样,因为他们的参照点是不同的。她目前的薪水更高。”“她在申请离婚赡养费。实际上她愿意调解,但他更愿意上法庭。这种分歧是意料之中的—她只能稳赚,所以要规避风险;而他面对的却都是糟糕的结果,所以他更愿意冒险。”

    第26章 更人性化的前景理论

    我和阿莫斯半是凭借能力半是因为无知,在无意中发现了伯努利理论的主要缺陷。我听从阿莫斯的建议,读了他书中的一章。这一章描述了一些实验,在这些实验中,一些著名学者测试了财富的效用,他们让受试者对一些风险作出选择,这些受试者可能会因选择不同而赢得或输掉几便士。实验者将测量的财富量限定在1美元之内,依此来测试财富的效用。这项实验进而引发了一些问题:人们通过财富间的细微差别对风险进行评估这一假设合理吗?人们怎么会通过对区区几便士的得失反应研究就理解了财富心理物理学呢?心理物理学理论的最新进展表明,如果想研究财富的主观价值,你应该问一些与财富直接相关的问题,而不是关于财富变化的问题。我不太明白为何效用理论会让人们因为敬畏而盲从,对此我感到很迷惑。

    第二天和阿莫斯见面时,我告诉他在阅读中我遇到了一些难题,这些难题只是一个笼统的想法,算不得什么新发现。我非常希望他能给我指明方向,解释一下一直困扰着我的这项实验究竟有什么意义,但他既没给我指明方向,也没向我解释,却对现代心理物理学的相关性问题觉得豁然开朗了。他想起经济学家哈里·马科维茨(Harry Markowitz)—后来因其对金融领域作出的贡献而获得诺贝尔奖—曾经提出过一个理论,即效用是伴随财富的变化出现的,而不是伴随财富的各种状态出现的。马科维茨的理论存在了近25年,但并没有引起过多关注,我们却很快得出结论:就应该朝着这个方向发展,而且我们酝酿提出的理论会把最终结果界定为盈与亏,而不是财富的状态。关于决策论的感知力和无知对我们的研究都具有推动作用。

    我们很快就知道自己已经成功规避了一桩由理论诱导的盲目性引发的严重事件,因为我们刚刚摒弃的想法看起来不仅是错误的,而且非常荒谬。我们很高兴地意识到,在数以万计的财富区间内,自己其实根本无法评估目前的财富效用。从财富效用中推理对细小变化的态度这一想法现在看来也是行不通的。在自己再也无法解释为何这么久都不能看到明显的结果时,你就应该知道自己已经取得了进展。然而,我们还是用了很多年的时间来探索结果是盈还是亏的界定。

    面对财富,你会选择规避风险还是冒险一搏?

    在效用理论中,对“盈”的效用评估是通过对两种财富状态的效用进行对比来实现的。例如,如果你有100万美元,额外再得到500美元,这500美元的效用就是100.05万美元的效用和100万美元的效用差。而且如果你拥有数目较大的那笔钱的话,损失500美元的负效用仍然是两种财富状态的效用差。在这种理论下,盈亏的不同效用只是在符号上有所不同(正号或者负号)。没有哪种方式可以表明损失500美元的负效用会大于获得同样数目的钱的效用这一事实,尽管事实确实如此。正如在理论诱导存在盲目性的情况下可能出现的问题一样,我们既不能对盈亏之间可能存在的各种区别进行预测,也无法对其进行研究。盈亏之间的区别被认为是无关紧要的,因此研究这一点也没有意义。

    我和阿莫斯没有立即发现我们对财富变化的关注为我们开辟了一条新论题的探索之路。我们主要关注了成功概率不同(或高或低)的风险之间的区别。有一天,阿莫斯随便作了一番假设:“亏损的情况又如何呢?”我们很快就发现,当我们变换焦点时,我们所熟悉的风险规避做法就会被冒险的做法取代。请看下面这两个问题:
    问题1:你会选择哪一个?
    肯定会得到900美元,还是有90%的可能性会得到1000美元?
    问题2:你会选择哪一个?
    必定会损失900美元,还是有90%的可能性会损失1000美元?

    你很可能会在问题1中选择规避风险,大多数人都会这样。得到900美元的主观价值肯定比有90%的可能性得到1000美元的价值要大。这个问题中的风险规避情况不会让伯努利感到惊讶。

    现在来看你对问题2的选择。如果与其他大多数人一样,你在这个问题中就会选择风险答案。这次选择冒险的理由与在问题1中选择规避风险的理由如出一辙,即损失900美元的(负面)价值比有90%的可能性损失1000美元的(负面)价值要大。必然的损失肯定会令人反感,也会使你愿意冒险一试。我们以后就会发现,对可能性的评估(90%对应100%)会导致问题1中的风险规避和问题2中的选择冒险这两种不同做法。

    在没有理想的选择时,人们更愿意碰运气,我们不是最先注意到这一现象的人,但由理论误导的盲目性其实早就是普遍现象了。因为占主导地位的理论并未提供一个看似合理的方法来协调人们对盈亏风险的不同态度,于是人们只能忽略态度并不统一这一事实。相反,我们将各种结果视为盈余或者亏损,于是便格外关注这种差异。对是否愿意冒险的不同态度的观察很快便取得了一项重大进展:我们找到了一个论证伯努利理论主要缺陷的方法。请看:

    问题3:不管你有多少钱,有人额外又给了你1000美元。现在请从下列两个选项中作出选择:是选有50%的概率赢得1000美元,还是选择肯定会得到500美元?
    问题4:不管你有多少钱,有人额外又给了你2000美元。现在请从下列两个选项中作出选择:
    是选有50%的概率失去1000美元,还是选择肯定会失去500美元?

    你很容易就能确定,就财富的最终状态(伯努利理论中最重要的因素)而言,问题3和问题4并没有什么不同。在两种情况下,你都得就相同的两个选项作出选择:你可以选择得到1500美元,这样你肯定会比现在更有钱;或者你可以冒一次险,这样你得到1 000美元或2 000美元的机会是相同的。因此在伯努利理论中,这两个问题应该引出相似的选择。凭直觉你就可以猜出其他人会作何选择。

    。在第一个选择中,大多数调查对象都选择确定的选项。。在第二个选择中,大多数调查对象则更倾向于那个冒险选项。

    问题3和4的选择有所不同,这一发现是伯努利理论核心观点的绝对反例。如果财富效用至关重要,那么对相同问题的等义陈述就应产生同样的选择。对这几个问题的对比凸显了对选择进行评估时所选的参照点有着十分重要的作用。问题3中的参照点比当前财富多出1000美元,而问题4中则多出了2000美元。所得增至1500美元在问题3中是赢利500美元,在问题4中却是亏损500美元。显然,相同类型的其他例子也很容易发生,安东尼和贝蒂的故事便与此类似。

    在选择之前,你对得到1000美元或2000美元这样馈赠的关注程度如何呢?如果你和大多数人一样,那么你几乎都注意不到这一点。的确,你没理由去注意这一点,因为这笔馈赠包含在参照点中,而参照点通常会被忽略掉。你对自己的选择有所了解,而效用理论却并不了解这些—如果你的净资产高至几千美元或低至几千美元(除非你很穷),你对风险的态度就会不同。你还知道自己对盈亏的态度并非源自对所拥有财富的自我评估。你想得到100美元而不想失去100美元,其原因并非因为这些钱使你的财富状态有了变化。你只是喜欢得到,不喜欢失去—几乎可以肯定地说,你对失去的厌恶程度远大于你对得到的喜欢程度。

    这4个问题凸显了伯努利理论的弱点。他的理论太过简单,缺少令人信服的因素。这个缺失的变量就是参照点,它是得失评估所依据的初始状态。在伯努利理论中,你只需要了解财富的状态就可以决定其效用,但在前景理论中,你还需要知道参考状态,因此前景理论比效用理论更复杂。在科学中,复杂性被视为一种成本,要想厘清其中原理,就必须有一套足够丰富、新颖且(最好是)有趣的预测来解释已有的理论往往解释不了的事实。这曾是我们过去必须要面对的挑战。

    尽管我和阿莫斯那时并没有研究大脑的双系统模式,但现在我们已经明确地知道,前景理论的核心内容有三个认知特征,这三个特征在金融状况评估工作中扮演着非常重要的角色,在感知、判断和情感等许多自动过程中也很常见,它们应该被看做是系统1的运行特征。

    ·评估与一个中性参照点相关,这个参照点有时也被视为“适应水平”。你可以很轻松地对这一原则作出令人信服的论证。在你面前放上3碗水,左边的碗中放冰水,右边的碗中放温水,中间碗中的水温则与室温相同。把你的双手分别浸在冰水和温水中约一分钟,然后再浸到中间的碗中。虽然一手凉一手热,但两只手对中间碗中水的温度的感觉是一样的。对金融状况而言,最常见的参照点就是现状,但也可能是你期待的那个结果,或者是你感觉实至名归的结果,比方说,你的同事获得晋升或者得到奖金。高于参照点的结果就是所得,低于参照点的结果就是损失。

    ·一种降低敏感度的原则在感觉维度和财富变化评估活动中都是适用的。在漆黑的房间里,即使灯光再微弱,效果也会很明显。而同等亮度的灯在非常明亮的房间里也许都令人难以察觉到。同样,900美元和1000美元之间的主观差别也比100美元和200美元之间的差别小得多。

    ·第三个原则是损失厌恶。当我们对盈亏进行直接比较或权衡时,亏似乎比盈影响更大。积极和消极的期盼或体验之间的力量不对称状况由来已久,将各种威胁当成“危”而不是“机”的有机体的存活和繁殖的概率更大。

    图10阐释了掌控结果价值的三项原则。如果前景理论有一面旗帜的话,上面画的肯定是图10.这幅图表明了盈与亏的心理学价值,而盈与亏正是前景理论中的价值“载体”(这一点与伯努利理论不同,在伯努利理论中,财富状态才是价值载体)。这个图有明显不同的两个部分,中性参照点的右边和左边。这个图的明显特征就是它是S形的,这表明人们对盈与亏的敏感度都降低了。最后,图中S形的两条曲线并不对称。在参照点处函数的斜率突然发生改变,即对亏损的反应比对同等数量盈余的反应要强烈得多。这就是所谓的损失厌恶。

    图10

    损失厌恶:人们对亏损的反应比对盈余的反应大得多

    我们在生活中面对的很多选择都是喜忧参半的:既有损失的风险也有获利的可能,我们必须要决定是接受这个风险还是拒绝它。对新成立的企业进行评估的投资商,思忖是否上诉的律师,定夺是否出击的战时将军,以及必须决定自己是否参加竞选的政治家们,都要面对胜利或失败的各种可能性。如果要找一个前景喜忧参半的例子,请看看你对下面问题的反应。

    问题5:现在,用抛硬币来打赌。
    如果是背面,你会输掉100美元。
    如果是正面,你会赢得150美元。
    这个赌局吸引人吗?你想参加吗?

    为了作出选择,你必须平衡得到150美元时的满足感和失去100美元时的失落感。你有何想法?尽管这个赌局的预期值显然是有利的,因为你坐收的赢利铁定比你可能遭受的亏损小,但你可能还是不愿下这个赌注—大多数人都不会愿意这样做。拒绝这个赌局是系统2的行为,但那些关键的输入信息是由系统1产生的情感反应。对于大多数人来说,对失去100美元的恐惧比得到150美元的愿望更强烈。我们从众多此类观察中得出结论,即“失去比得到给人的感受更强烈”,因此人们往往会规避损失。

    问自己一个问题,你就能测量出自己能在多大的程度上规避损失,这个问题就是:要想平衡100美元的可能损失,我需要得到的最少收益是多少?对很多人来说,这个问题的答案是约为200美元,是损失的2倍。有几个实验曾对“损失厌恶系数”作出估计,这个系数通常在1.5~2.5之间。当然,这是个平均值。有些人规避损失的能力比别人更强。金融市场中的专业风险投资者更能容忍损失,可能是因为他们不会对每一次经济波动都产生情绪上的反应吧。当实验人员要求参与实验的受试者“像商人那样思考“时,他们对损失的规避感就不那么强烈了,他们对损失的情绪反应(通过情感激励的心理指数来测量)也大大减弱了。

    为了检测你对不同风险的损失厌恶率,请思考下面的问题。忽略所有社会因素,不要试图表现得胆大无礼或者谨小慎微,只关注可能的损失和抵消盈余的主观影响即可。

    ·来看一个赌局,在这个赌局中你有50%的可能性会损失10美元。你最少需要得到多少钱才会觉得这个赌局能吸引你呢?如果你说10美元,那就说明你对风险根本就不在意;如果你给出的答案不到10美元,那就说明你在寻求冒险;如果你的回答超过10美元,这就说明你有损失厌恶的概念。

    ·要是在抛硬币的赌局中你可能会损失500美元,又会怎样呢?你需要多少钱才能抵消这一损失?

    ·要是会损失2000美元,又会怎样呢?

    在做这个实验时,你可能会发现自己的损失厌恶系数在风险增大时也会提高,但并不是急速提高。当然,如果这种可能的损失具有潜在的破坏性,或者你的生活方式受到了威胁,所有的赌注也就荡然无存了。在这些情况下,损失厌恶系数会非常大,甚至也许会无穷大—如果你很幸运,非常有可能赢钱,但不管赢得几百万美元,

    你总有不想承担的风险。

    再来看一下图10,也许它能帮你避免常见的困惑。在第1章中我曾两次断言,有些读者也许会认为这两种说法是矛盾的:

    ·在得失都可能出现的赌局中,损失厌恶会产生极力规避风险的选择。

    ·在肯定会有损失和有可能会损失更多的选择中,降低敏感度会引发冒险之举。

    两者之间并不矛盾。在得失都可能出现的赌局中,可能的损失是可能的获利的2倍,从比较得失的价值功能线形图的倾斜度就可以看出这一点。在肯定会有损失的情况下,价值曲线(降低敏感度)的弯曲度会导致冒险之举。必定损失900美元的痛苦比有90%的可能失去1 000美元的痛苦要强烈。这两种见解是前景理论的精髓。

    图10显示出价值功能曲线的突变,在这个曲线图中,获利变成了损失,因为即使相对于你现有的财富而言,风险系数很小,但它引起的损失厌恶数目却是很大的。对财富状态的态度可以解释人们对小风险的极端规避,这样的说法可信吗?伯努利理论这个明显的缺陷在250多年里都未能引起学者的注意,这的确可以算做理论导致盲目性的典型案例了。2000年,行为经济学家马修·拉宾(Matthew Rabin)最终从数学角度证明了通过财富效用来解释损失厌恶是荒谬的,注定会失败,他的证明引起了广泛的关注。拉宾的原理显示,从数学角度来看,任何拒绝低风险的有利赌局的人,都是为了获得更大的赌注从而坚决将风险规避推向一个荒谬的水平。例如,他注意到大多数人都排斥下面这种赌法:
    有50%的概率损失100美元,有50%的概率得到200美元。

    他之后表明,根据效用理论,排斥这种赌法的人最终也会拒绝下面这种赌法:
    有50%的概率损失200美元,有50%的概率得到20000美元。

    当然,思维正常的人都不会拒绝这种赌法!在某篇文章中,马修·拉宾和理查德·泰勒记录了这些证据,他们评论说,这个更大的赌局“有9900美元的预期收益—损失绝对不会超过200美元。如果你拒绝了这个赌局,即使是最差劲的律师也会认定你就是法律意义上的精神病患者”。

    也许是被热情冲昏了头,他们竟然以回顾著名的“巨蟒”小组的幽默短剧作为文章的结束语,短剧中一位倍感挫败的顾客想把一只死掉的鹦鹉送回宠物店去。顾客用了一长串短语来描述这只鹦鹉的状态,高潮部分说的是“这就是那只前鹦鹉”。拉宾和泰勒继续说道:“经济学家应该认识到预期效用是一种‘过气的假设’。”很多经济学家认为这种草率的说法颇有些亵渎神明的意味。然而,认为财富效用可以解释人们对小损失的态度堪称受伯努利理论引导的盲目做法,这种盲目做法正是幽默评论理所应当抨击的目标。

    前景理论无法应对令人失望的事

    在本书这一部分中,我已经赞扬了前景理论的优点,批评了理性模式和期望效用理论。现在应该平衡一下两者了。

    大多数经济学研究生都曾听说过前景理论和损失厌恶,但在经济学书籍的索引中不会出现这些术语。有时候,这种缺失让我有些伤心,但事实上这也是合理的,因为基础经济学理论中理性扮演着主要角色。那些研究生学到的大多数标准概念和理论在经济人不会犯下愚蠢错误的前提下很容易理解。这个假设的确没有什么必要,而且也会随着人们对前景理论的逐渐了解而瓦解,它对各种结果的评估总是太过目光短浅。

    经济学的基本概念都是重要的智力工具,这些工具掌握起来并不容易,即便是利用那些简化了的且不切实际的假设(这些假设都是关于在市场中相互作用的经济动因的本质的)来解释这些概念也是很困难的。在引入阶段就对这些假设提出种种问题的做法的确令人费解,也许还会使人泄气。把帮助学生掌握这一学科的基本工具作为首要任务才是硬道理。此外,前景理论中的理性缺失通常与经济理论的相关预测并不相干,这些预测在某些情况下会很精确,在其他许多情况下还会提供令人满意的近似值。然而在有些情况下,有所区别变得很重要:在前景理论的描述中,对人类产生直接情绪影响的是得与失的情绪,而不是财富和普遍效用的长期前景。两个多世纪以来,在我谈到伯努利理论的缺陷并强调其中因理论诱导而产生的盲目性之前,没有人质疑过伯努利理论。当然了,因理论诱导而产生的盲目性并不仅限于期望效用理论。前景理论自身也有缺陷,而且这些缺陷中存在的因理论诱导而产生的盲目性使得这一理论成为效用理论的主要攻击对象。

    试想前景理论的假设(即参照点),通常就是现状,其价值就是零。这个假设看来是合理的,但它却导致了一些荒唐的后果。请看下面的各项预测,有了这些预测之后会是什么样子呢?

    A.有百万分之一的概率赢得100万美元。

    B.有90%的概率赢得12美元,有10%的概率什么也得不到。

    C.有90%的概率赢得100万美元,有10%的概率什么也得不到。

    “什么也得不到”在三种情况下都是可能会出现的结果,前景理论在这三种情况下给这种结果分配了相同的价值。“什么也得不到”是个参照点,且其价值是零。这些说法和你的经历相符吗?当然不是。“什么也得不到”在前两种情况下是被期望但未能实现的事,没有给其分配价值也是讲得通的。相反,在第三种情况下,没能获利就会让人非常失望。这就好比私下里向你保证会给你加工资,赢得一大笔钱的可能性那么大,这就建立了一个新的暂时参照点。相对于你的期望而言,“什么也得不到”无异于一种巨大的损失。前景理论无法应对这种情况,因为在结果(在这里是指“什么也得不到”)出现的可能性很小或另外一种选择很有价值时,前景理论是不会允许这种结果的价值发生改变的。简而言之,那就是前景理论无法应对令人失望的事。失望和对失望的预感都是真实的感觉,而人们不能承认这种感觉的情形正好印证了我在批判伯努利理论时提出的那些反例。

    前景理论和效用理论没有给我们留下回旋的余地。这两种理论都有这样的假设,即某种选择中选项都是分开的,需要独自评估的,价值最大的选项就会被选中。这种假设显然是错的,请看下面的例子。

    问题6:选择有90%的机会赢得100万美元,还是选择肯定会得到50美元?
    问题7:选择有90%的机会赢得100万美元,或者选择肯定会得到15万美元?

    请比较一下两种情况下选择赌一把却赢不了的痛苦孰大孰小。在两种情况下,不能赢都会带来失望,但在问题7中,潜在的痛苦是多重的,因为知道如果选择赌一把又输了的话,你会后悔自己“贪婪的”决定,后悔放弃了拿到15万美元的机会,后悔这种体验依赖于你本应该采取却没有采取的意见。

    有些经济学家和心理学家依据对后悔和失望的情感提出了决策制定的模式。如果说这些模式没有前景理论那样有影响力的话也是说得通的,且其中的原因也很有启示意义。后悔和失望的情感是真实的,做出决策的人当然在做决策时会预测到这些情感。问题是后悔理论会产生一些惊人的预言,使得前景理论中这些情绪的作用变弱,这也就使问题变简单了。前景理论的复杂度在与期望效用理论进行对比时容易被大家接受,因为它确实预言了期望效用理论无法解释的一些现象。

    更丰富且更切实际的假设还不足以使一种理论获得成功。科学家把理论作为工具,但他们很难接受新的工具,除非这个新工具非常有用。前景理论为众多学者所接受不是因为它是“真实的”,而是因为它在效用理论基础上增加了一些概念,比如说参照点和损失厌恶等,这些都值得大家花费时间和精力来研究。它们产生的新预测最后都被证实是真实的。所以说我们是很幸运的。

    示例—前景理论“他是损失厌恶的典型例子,因而连非常有利的机会也被他拒绝了。”“她非常有钱,因而她对微不足道的所得反应那么强烈着实让人费解。”“他把损失看得比所得要重一倍。不过这也很正常。”

    第27章 禀赋效应与市场交易

    图11

    (禀赋效应是指当个人一旦拥有某个物品,那么他对该物品价值的评价要比未拥有之前大大提高)

    即使没学过经济学的课程,你可能也看到过图11或与之类似的图形。这个图形展示了面对两种好处(收入和休假时间)时,不同的人表现出的“无差异曲线图”。

    在经济学入门课程中,学生们会了解到:图中每一个点都代表了收入与休假天数的特殊结合。每条“无差异曲线”都与两种情况的结合相关联,收入和休假都是大家想要的,都有同样的效用。如果人们不管自己有多少收入、有多少休假时间,只想以同样的价格“出卖”休假时间以换取更多收入的话,这些曲线就会变成平行的直线了。凸出的部分表明边际效用递减,即你的休假天数越多,就越不会在意自己是否还想多休息一天,而且每多一天,这一天的意义就比前一天更小。同样,你的收入越高,就越不关心自己是否会额外再得到一美元,而且为换取一天的额外休假,你愿意放弃的钱数也会有所增加。

    每条“无差异曲线”上所有的位置都同样吸引人,这也正是“无差异”三个字的真实体现:你并不在意自己到底处在“无差异曲线”上的哪个位置。所以,如果A和B都在你的无差异曲线上,你对它们的位置并不在意,而且也不需要刻意在两点之间来回移动。在过去100年里出版的所有经济学教科书中都曾出现过这个图的不同版本,数百万学生都曾仔细研究过这个曲线图,却很少有人注意到图中缺失了什么。理论模式的影响和简洁再一次蒙蔽了这些学生和学者,使得他们没有看到这个曲线图的严重缺陷。

    图中缺失的是对个人当前收入和休假天数的标示。如果你是个雇员,劳动待遇便说明了你应得的薪水和休假日,这在图中也有对应的点。这个点就是你的参照点、你的现状,但图中并没有显示这个点。画这个图的那些理论家没能展示出这一点,所以你便相信参照点并不重要,但现在你知道参照点是很重要的。这又是一个不折不扣的伯努利式错误。无差异曲线的表现含蓄地给出了假设,即所有时间点的效用完全是由当前的情况决定的,与过往毫不相干,而且你对一项可能的工作的评估并不依赖于自己当前的工作待遇。在这种情形以及其他许多情形下,这些假设完全是不切实际的。

    忽略无差异曲线图中的参照点这一做法正好印证了由理论导致的盲目性,堪称一个令人惊讶的案例,因为我们常碰到一些参照点非常重要的案例。在劳资谈判中,双方都清楚其参照点是现行合同,而且谈判关注的是就参照点作出让步时双方的共同要求是什么。在讨价还价时,损失厌恶的作用也很容易理解:作出让步让人很痛心。

    你对参照点的作用肯定有很深刻的亲身感受。如果你曾换过工作或职位,哪怕是曾想过要换一换,你就会以自己现在的情况作为参照点,看看新的工作和职位的特点是更好了还是更差了。你也许还会注意到,在评估中不利之处比有利之处更加突出,这说明损失厌恶发生了作用。人们很难接受比原来还糟糕的改变。例如,想要得到新工作的失业人员能接受的最低工资平均来看是其之前工作的90%,在一年的时间内下降不到10%。

    为了弄明白参照点对选择的影响,请看艾伯特和本这两位的例子,他们是“快乐双胞胎”,有相同的品位,第一份工作也是一样的,这份工作工资低、假期短。他们当前的状况和图11中点1的情况相同。公司给他们提供了两个更好的位置A和B,并让他们自己选择谁要1万美元的加薪(位置A),谁要每月带薪休假一天的机会(位置B)。由于他们两人对这两种选择都无所谓,便用抛硬币的方式来决定。于是艾伯特获得了加薪机会,而本则得到了额外的每月一天带薪假期。一段时间过后,这对双胞胎习惯了各自的位置。现在公司告诉他们,如果他们愿意,可以互换位置。

    图11中体现的标准理论给出的假设为:人们的选择偏好很稳定,不会随时间推移发生改变。位置A和B对这对双胞胎来说具有相同的吸引力,而且他们几乎没有或者根本就不会产生想要改变的想法。前景理论的断言则截然相反,该理论认为两人肯定会留在自己当前位置上的原因是他们想规避损失。

    现在让我们来看看艾伯特。他刚开始在图中的位置1,在那个参照点上,他发现了两个同样吸引人的选择:
    选择A:加薪1万美元
    或者
    选择B:得到12天的额外假期

    选择位置A改变了艾伯特的参照点,当他想要换到位置B时,他又有了新的选择:
    停留在A点上:无所得也不损失
    或者换到B点:获得12天的额外假期,少赚1万美元

    你刚刚对损失厌恶有过主观体验,能感受到:少赚1万美元是个非常糟糕的消息。即使获得12天额外假期和得到1万美元同样令人惊喜,多出来的假期也不足以补偿损失的1万美元。艾伯特之所以会留在A点上是因为移动的不利之处大于有利之处。对本来说同样如此,他也想保住自己当前的职位,因为失去眼前这宝贵的假期比损失额外的收入更划不来。

    这个例子凸显了“无差异曲线”的标准模式没有预见到的选择的两个方面。第一,人们的偏好并不是一成不变的,它们会随着参照点发生变化。第二,改变的不利之处比有利之处更突出,其有利之处包括对倾向于现状的偏见。当然,损失厌恶并不是说你从未想过要改变自己的处境;一次机会带来的益处也许会超过甚至大大超过损失。损失厌恶只能表明我们的选择总是强烈偏向趋近参照情形的选项(而且通常情况下会偏向较小而不是较大的改变)。

    传统的无差异曲线和伯努利用财富状态来表示结果的做法有一个共同的错误假设,即拟定各项事务状态的效用只依赖于该状态本身,并不受你过往的影响。对这一错误的修正已经成为行为经济学的成就之一。

    人们为什么不愿意割舍自己已拥有的东西?

    一项决策何时付诸实施或一项行动何时开始,这个问题通常很难回答,但我们却可以准确而详尽地追溯到今天所说的行为经济学的发端。20世纪70年代早期,罗彻斯特大学的经济学系还非常保守,理查德·泰勒当时还是那里的研究生,他那时就有一些异端想法。泰勒总是很睿智,言辞犀利,作为学生,他常常乐于观察记录别人的行为,而这些行为只有理性经济行为模式才可以解释。他也很乐于在教自己的那拨教授身上发现他们理财不合理的情况,他发现有一种情况尤其突出。

    R教授(现在已被证实是理查德·罗塞特,他后来成为芝加哥大学商学院的院长)对标准经济理论深信不疑,还对葡萄酒难以割舍。泰勒发现R教授非常不愿意卖掉自己收藏的葡萄酒,即使对方出价高达100美元(当时可是1975年)一瓶也不行。R教授也会从拍卖会上买葡萄酒,但无论质量如何,他出价从不会高过35美元一瓶。若价格在35美元~100美元,他就既不买也不卖。这个巨大的价格差在经济理论上看是相互矛盾的,人们希望这位教授能在这个价格区间为某瓶酒定一个值。如果在他看来某瓶酒值50美元,那么只要出价超过50美元,他就应该会卖掉它;如果这瓶酒本来不是他的,那么他也应该愿意花50美元买下它。这个可以接受的卖价和可以接受的买价应该相同,但事实上,最低卖价(100美元)比最高买价(35美元)高出很多,拥有这件物品似乎会提升它的价值。

    理查德·泰勒发现了很多禀赋效应的例子,那些没有用做定期交易的商品尤其会出现这一效应。你很容易就可以想象自己处于一个类似的情景中。假设你手里有一张票已售罄的演唱会门票,这是一个著名乐队的演唱会。这张票你是以200美元的价格买下的,而你又是个狂热的粉丝,即便是以500美元买下这张票,你也愿意。后来你从互联网上看到有更有钱或更狂热的粉丝愿意花3000美元买下门票。你现在手里有票,你愿意卖吗?如果像票已售罄的各种重大活动中的大多数观众一样,你就不会卖。你的最低卖价也要在3000美元之上,而你的最高买价只是500美元。这就是禀赋效应的一个例子,而一个坚信标准经济理论的人则会对此感到迷惑。泰勒当时正在寻求一种解释来破解这类难题。

    泰勒在一次会议上遇到了我们以前的学生并拿到了前景理论的早期手稿,这才使得上述难题得到破解。他说他非常激动地读完了这份手稿,因为他很快就意识到前景理论中的损失厌恶能够对禀赋效应和其他一些难题作出解释,其解决方法就是摒弃标准理论,即R教授“拥有”某瓶特定葡萄酒的状态具有独特的效用。前景理论表明,是愿意买还是愿意卖这瓶酒取决于参照点,即教授当时是否拥有这瓶酒。如果拥有这瓶酒,他就会考虑“放弃”这瓶酒时的痛苦;如果还没拥有这瓶酒,那他考虑的就是“得到”这瓶酒的乐趣。因为存在损失厌恶,所以两者的价值并不相等,即放弃一瓶好酒的痛苦比得到同一瓶酒所得到的快乐更深刻。我们可以回想一下前一章中的那幅得失图。在对称轴左侧的函数曲线更陡,人们对损失的反应比对相应的所得的反应更强烈。这正是泰勒一直在寻找的对禀赋效应的解释。在今天看来,应用前景理论来解决经济难题的做法应该算做行为经济学发展过程中的里程碑式事件了。

    在泰勒得知阿莫斯和我将会到斯坦福大学工作时,他也计划在那里待上一年。这段时间我们都收获颇丰,我们相互学到了很多知识,也成了好朋友。7年后,我和泰勒又有机会在一起工作一年,继续就心理学和经济学中的问题进行交流。长期以来一直作为行为经济学主要赞助方的拉塞尔·塞齐基金会拨给泰勒一笔钱,目的是让我们两人能在温哥华共事一年。在这一年里,我们和当地的一位经济学家杰克·尼奇(Jack Knetsch)密切合作,他和我们一样,都对禀赋效应、经济公平原则和中国的辛辣食品很感兴趣。

    我们调查研究的起点是禀赋效应并不具有普遍性。如果有人想让你把面值5美元的钞票换成5张1美元的零钞,你递过去5张1美元纸钞时不会有损失感。在商店买鞋时你也不会有损失厌恶,卖鞋赚钱的商人当然也不会感到有什么损失。的确,从他的角度来看,递出去的鞋一直就是钱的代表,钱正是他想要从顾客那里拿来的东西。此外,你付给商家钱也不会感到是种损失,因为你把钱看做是你想要买的鞋的代表。这些日常交易与把面值5美元的钞票换成零钞有相同之处。日常交易中的双方都不存在损失厌恶。

    上述这些市场交易与R教授不情愿出售自己的葡萄酒有什么区别?就像那些持有美国橄榄球超级杯大赛门票的人,即便有人出一个非常高的价格也不愿转让这种做法又有什么区别?这一区别性特征就是,商家要卖给你的鞋和你从预算中拿出来的买鞋钱都是用来“作交换”的。人们想用它们来交易以换取其他商品。其他商品,比如葡萄酒和橄榄球超级杯大赛的票,都是拿来“使用”的,或者说都是用于消费或享受的。你的闲暇时光和收入也都不是用来出售或交换的。

    尼奇、泰勒和我打算设计一个实验来表明用来使用的商品和用来交换的商品之间的不同。我们实验设计的部分内容借鉴了实验经济学的奠基人费农·史密斯(Vernon Smith)的做法,多年以后,我和他共同获得了诺贝尔奖。利用这种做法,在某个“市场”中,我们向受试者发放了少量代币。实验结束时,所有手里还有代币的受试者都可以可将其兑换成现金。为了体现市场中用来交易的商品对某些人来说比对其他人更有价值,不同的人得到的补偿价值不同。同样的代币对你来说可能值10美元,对我来说却价值20美元,在这两种价值之间以任何一种价格进行交换对我们双方而言都是有利的。

    史密斯对供求的基本机制进行了生动的展示。个人会对买卖代币给出连续的公开报价,其他人会对报价做出快速回应。每个人都会关注这些交易,会看到代币的成交价。这些结果和一项物理学实证研究的结果一样合乎规范。那些代币持有者(代币于他们而言价值微乎其微,因为它们的补偿价值很低)为获利最终会将自己的代币卖给某个对代币估值更高的人,这种交易就好比水往低处流那样必然会发生。交易结束后,所有代币都集中到那些能从实验人员那儿拿到最多钱的受试者手中。市场魔力显神威!此外,经济理论还对市场平稳时的最终价格和转手的代币数量作出了正确预测。如果实验人员将这些代币随机分配给市场中的半数受试者,这个理论就会预测有半数代币会被转手。

    我们在实验中用到了史密斯方法的一个变量。每一次实验开始时都会进行几轮代币交易,这种做法完美重现了史密斯的发现。实验预计的交易数量与利用标准理论预测的数量非常接近甚至完全相同。当然,代币之所以有价值只是因为它们能用来交换实验人员的现金,它们没有任何使用价值。随后我们又模拟了一个相似的市场,目的是想让人们关注使用价值:一个好看的咖啡杯,杯子上印有大学校徽,我们在哪所大学做实验,杯子上就印着哪所大学的校徽。这个杯子当时价值6美元(今天这个杯子的价值可能是当时价值的两倍了吧)。我们随机将这些杯子发放给半数受试者。卖方将自己的杯子摆在面前,却热情地让买方去看旁边卖家的杯子;所有杯子都明码标价。要想得到一个杯子,买方必须自己花钱去买。实验结果很有戏剧性:平均卖价接近平均买价的两倍,而且实验预计的交易数量还不到利用标准理论预测数量的一半。市场的魔力对于那些想使用某件商品的所有者(卖家)而言根本就不起作用。

    我们用同一过程的不同变体进行了一系列实验,总是得到相同的结果。在我最喜欢的一项实验中,我们在“买方”和“卖方”之外加入了第三个小组—“选择者”。与那些不得不花自己的钱买东西的“买方”不同,“选择者”可选择是接受一个杯子还是一笔钱,而且他们的选择表明那笔钱和得到那样东西一样吸引人。下面就是实验结果:

    卖方    7.12美元

    选择者  3.12美元

    买方    2.87美元

    “卖方”和“选择者”之间的差距很大,因为他们实际上面对的是同一种选择!如果你是“卖方”,你能拿回家的要么是一个杯子要么是钱;而如果你是个“选择者”,也有完全相同的两个选项。这个决定的长期效应对于两组人来说是完全相同的,唯一不同的是当时的情绪。卖方标注的高价反映出他们在放弃自己已经拥有的物品时很不情愿,这种不情愿与婴儿在自己特别看重的某件玩具被拿走时表现出的焦虑一样。损失厌恶是系统1自主评估必然包含的内容。尽管“买方”只能花钱买杯子,而“选择者”却可以免费得到这个杯子,但两者却设定了相似的现金值。如果“买方”不觉得花钱买下这个杯子是种损失的话,这个相似的现金值便与我们的预期正相吻合。大脑成像的证据也证实了这种不同。出售自己常用的商品会激活大脑中与厌恶和痛苦有关的区域,购买行为也会激活这些区域,但只有在(买方)认为价钱太高,即当你觉得卖方的要价超过了交换价值时才会这样。大脑记录还表明以特别低的价格购买商品是件令人愉快的事。

    “卖方”给杯子设定的现金价值比“选择者”和“买方”设定的高出两倍多,这个比例与有风险选择的损失厌恶系数非常接近,不管决策是否有风险,只要运用赚钱和赔钱两种结果中相同的价值功能/函数,我们就能预测到这个比例。在不同经济领域的研究中都出现过大约2∶1的比例,包括许多家庭对价格变动的反应。正如经济学家所预测的那样,在价格下降时,顾客往往会增加蛋、橙汁或鱼等商品的购买量;而价格上涨时,他们就会减少其购买量。然而,与经济理论预测不同的是,价格上涨的效应(基于参照价格的相对损失)竟然是收益效应的两倍。

    杯子实验延续了禀赋效应的标准实证研究,这个实验与杰克·尼奇负责的一项更为简单的实验基本上是同期进行的。尼奇让两个班的学生填写了调查问卷,并且给他们每人一份礼物作为回报,这份礼物在实验期间一直放在受试者面前。其中一个班的学生得到的礼物是昂贵的钢笔,而另外一个班的礼物则是一块瑞士巧克力。快下课时,实验人员拿出了另外一份备选礼物,并且告诉学生可以用他们手里的礼物来交换这份礼物。结果只有约10%的受试者选择交换礼物,大多数得到钢笔的人仍然保留了钢笔,那些拿到巧克力的人也没有改变自己的选择。

    像商人那样思考和交易

    前景理论的基本概念是参照点是存在的,而且一定量的损失比等量的所得影响更大。过去这些年在真正的市场中进行的观察表明,这些概念有着很强的影响力。经济衰退期间,对波士顿的公寓大厦市场进行的一项研究调查给出了尤为清晰的结果。参与该项目的人员对那些曾以不同价格购买了相似房产的业主行为进行了对比。对于理性的代理人来说,从前的买价与自己根本就不相干—当前的市场价值才是最重要的。然而对于那些处于住房市场低迷时期的业主来说,情况却并非如此。那些参照点较高同时也面临着较大损失的业主对私有住宅的标价更高,他们会花更多的时间尽量以高价卖掉自己的房子,最终得到更多的钱。

    对卖价和买价之间(更确切地说,是买卖之间)的不对称性最初进行的实证研究,在人们接受参照点和损失厌恶这些概念的早期发挥了非常重要的作用。然而,我们都知道参照点是不稳定的,在不同寻常的实验环境中尤其如此,而且禀赋效应可通过改变参照点而消除。

    当那些业主将其商品看做未来交换中的价值载体时,他们就不想看到禀赋效应出现,这种态度在日常商务活动和金融市场上非常普遍。曾通过各种棒球卡大会研究贸易的实验经济学家约翰·李斯特(John List)发现贸易新手不愿割舍自己手中的球员卡,但这种不情愿会随着贸易经验的增多而最终消失。更令人惊讶的是,李斯特发现,就新商品来说,贸易经验对禀赋效应的影响很大。

    在某次大会上,李斯特贴出了一张通告,邀请人们参与一个小调查,而且他们可得到一份小礼物,这份小礼物可能是一个咖啡杯或一块同等价值的巧克力。这些礼物是随机分给大家的。在那些自愿参加调查的人即将离开时,李斯特告诉大家说:“我们给了你一个杯子或一块巧克力,但如果你愿意,你可以用它来换块巧克力或换个杯子。”在完整再现杰克。尼奇的早期实验时,李斯特发现那些缺乏经验的商人中只有18%的人愿意和别人交换礼物。与之形成鲜明对比的是,那些经验丰富的商人并没有表现出任何禀赋效应的迹象:他们中有48%的人进行了交易!至少在一个以交易为基准的市场环境中,他们在交易时没有表现出任何不情愿。

    杰克·尼奇还做了一些实验,在这些实验中只要进行一些细微的操作就可以使禀赋效应消失。在实验人员提到受试者手头的商品有可能用来交易之前,只有在真正拥有该商品一段时间的前提下,他们才会表现出禀赋效应。经济学家也许会说尼奇和心理学家待在一起的时间太久了,因为他的实验操作表现出对一些变量的关注,而这些变量正是社会心理学家认为很重要的因素。的确,实验经济学家和心理学家对方法论的不同关注点在关于禀赋效应的持续辩论中体现得越来越明显。

    经验丰富的商人显然已经学会了正确提问,即“与可以得到的其他东西相比,那个杯子真的是我特别想‘得到’的吗”。经济学家会问这个问题,有了这个问题,禀赋效应就不复存在了,因为得到的快乐和放弃的痛苦之间的不对称性没有关联。

    对“在贫困境遇中做决策”的心理进行的最新研究表明,我们并没有希望从这些贫困的人的身上发现禀赋效应。在前景理论中,贫困就意味着一个人的生活水平低于自己的参照点。有些商品是穷人买不起的,因此他们总是“处于损失中”。他们会觉得自己得到的那一小笔钱算是减少了的损失,而不是所得。这些钱可以帮助一个人向参照点再靠近一点,但穷人却总是徘徊在价值函数坡度最大的地方。

    穷人可以像商人那样思考,但其原动力却有着很大的不同。与商人不同,穷人对获得和放弃之间的区别很在意。他们的问题在于,他们只能在不同的损失之间作出选择。花在某件商品上的钱对于本来可以购买的另外一件商品而言就是损失。对于穷人来说,花钱就意味着损失。

    我们都认识一些认为花钱很痛苦的人,尽管客观来讲他们其实很富裕。对花钱的态度,尤其是对一时兴起买的东西或者一些较小奢侈品(例如买个有装饰的杯子)的态度,常带有文化差异的因素。这种差异也许可以解释美英两国分别进行的“杯子研究”的结果之间存在的重大分歧。在美国,对学生样本所做的实验中买价和卖价存在很大差异;但在英国的学生中,这些差距则要小得多。因此,对禀赋效应的研究还有待深入。

    示例—禀赋效应“她不在意自己能得到两个职位中的哪一个,但公告发布一天之后,她就不再想换了。这就是禀赋效应!”“这些协商不会有任何进展,因为双方都发现很难作出让步,即使自己能得到补偿也不行。损失的比得到的更多。”“他们一涨价,需求量就下降。”“他只是不想以低于自己买房的价格卖掉自己的房子。损失厌恶起作用了。”“他是个吝啬鬼,只要花钱就觉得赔了。”

    第28章 公平性—经济交易的参照点

    损失厌恶这一概念绝对是心理学对行为经济学最重要的贡献。这很奇怪,因为人们虽然通过这个概念将众多结果评估为得和失,而且损失显得比获得更突出,但这个概念并没有让人们感到惊讶。阿莫斯和我经常开玩笑说,我们正在研究一项连我们的祖母那辈人都耳熟能详的课题。然而事实上,我们比那辈人了解得更多,而且能将损失厌恶与大脑双系统模式相结合进行研究,还特别将一种生理学和心理学观点应用到这些研究中,即相比于积极与靠近而言,消极与规避更能占据主导地位。我们还能通过数量惊人的各种观察研究来探索损失厌恶的结果:当商品在运输中丢失时,只有需现款支付的那部分损失才能得到补偿;大范围的改革通常会失败;职业高尔夫球手短打标准杆比短打小鸟球(高尔夫中某洞的杆数低于标准杆一杆)更精准。就算我的奶奶很有智慧,但如果我们能从她认为平淡无奇的观点中得出精准的预测的话,她应该也会感到惊奇的。

    图12

    在看到图12左面的图时,你的心跳会加速,也许在你还不清楚那张图有何怪异之处之前,心跳就已经加速了。过了一会儿,你也许就会认出那是双受到惊吓的人的眼睛。右面的图则表达了一种愉悦之感,微笑的脸颊上扬使眼睛变小了—当然这双眼睛还没有达到兴奋的程度。我们把这两幅图拿给做脑CT的人看。每幅图展示的时间都不到0.02秒,之后会被“视觉噪声”掩盖,这个“视觉噪声”是随机展示的黑白图片。这些观看者中没有人意识到自己曾看过那幅眼睛的图片,但他们大脑的一个部分显然意识到了:这个部分即为小脑扁桃核,尽管它在其他情绪状态下也会被激发起来,但其主要角色是担任大脑的“风险中心”。脑部影像显示,小脑扁桃核对观看者无法识别出来的有威胁性的图片有强烈的反应。关于威胁的感觉很可能是通过一个非常快的神经通道传递的,这种感觉会直接传到大脑处理情感的区域,绕过产生“视觉”意识的视觉皮质。同样的通道还会使得生气的面孔(一种潜在威胁)比快乐的面孔更快、更有效地得到处理。有些实验人员描述道,生气的面孔在众多快乐的面孔中会“凸显出来”,但快乐的面孔在众多生气的面孔中却不会很突出。人类的大脑和其他动物的大脑都包含一种机制,这种机制总会优先考虑不好的消息。将察觉掠食者所需的时间减少百分之几秒,通过这种做法,提高了动物的生存概率,使其得以繁衍生息。系统1的自动运行便体现了这种进化史。然而,人们至今尚未找到能够同样快速检测到好消息的机制。当然,我们人类和动物都对交配或进食的信号反应很机敏,因此广告商才会设计许多广告牌。不过,威胁仍然优先于机遇,而且也应该是这样。

    即使是对纯粹象征性的威胁,大脑的反应也很迅速。充满情绪的字眼会引起注意,而不好的字眼(战争、犯罪)比好的字眼(和平、爱)能更快地引起注意。其实并没有真正的威胁,但只是提一下不好的字眼对系统1来说就是一种威胁。之前我们曾提到“呕吐”这个词,只是看到这个词就会自然联想起很多对真实事情的反应,包括生理上的情感流露,甚至有规避或接近、畏缩或向前的趋向。对威胁的敏感性还会延伸到对自己强烈反对的那些意见陈述的处理上来。例如,基于你对安乐死的态度,你的大脑用不到1/4秒的时间就可以在“我认为安乐死是一种可以/不可以接受的……”这句话中识别出“威胁”的意味。

    保罗·罗津(Paul Rozin)是位对厌恶很有研究的心理学家,他观察到一只蟑螂可使一碗樱桃不再诱人,而一个樱桃对一碗蟑螂却不会起任何作用。他指出,负面情况在众多方面都可战胜正面情况,而且损失厌恶是负面占优势的典型例子之一。其他学者在一篇题为“坏消息比好消息强”的文章中将原因总结为以下几点:“负面情绪、不负责任的父母和糟糕的反馈比好的情况更具影响力,且人们处理坏消息时比处理好消息更彻底,我们会更在意避开负面的自我定义,而不是追求正面的自我定义,不好的印象和不好的模式比好的情况更容易形成,且不易消失。”他们引用了研究婚姻关系的著名专家约翰·葛特蒙(John Gottman)的话,他观察到长期健康的婚姻关系不仅仅依赖于寻求幸福,更在于避免负面的情况出现。葛特蒙预测一种稳健的关系需要良好的互动与不好的互动间的比例至少为5 ∶1。其他社会方面的不协调则更吸引人,我们都知道,也许一件事就会毁掉数年时间培养的友谊。

    我们生来就能对好与坏的某些区别进行分辨。婴儿来到这个世界上,就知道苦是不好的,(某种程度的)甜是好的。然而在很多情况下,好和坏之间的界限是种参照点,会随着时间的改变而改变,而且依赖于当时的情况。假设你在一个寒冷的晚上来到乡村,适逢大雨,而身上的衣服又不足以挡雨,衣服都湿透了。不凑巧的是,冷风又起,这下真的是糟糕透顶。就在你不知如何是好时,发现了一大块岩石可暂时挡风避雨。生物学家米歇尔·卡巴纳克(Michel Cabanac)说这种体验会令人非常快乐,因为这种体验与我们平时可能感到快乐的原因相似,都指明了生理状况的重要改善方向。当然,这种感到获救的快乐感不会持续很长时间,不一会儿你就会在岩石后面冻得哆嗦起来。新遭受的痛苦又会驱使你去寻找更好的庇护之所。

    目标就是参照点

    损失厌恶系数指的是两种动机的相对强度:我们想要规避损失的动机要强于获得利益的动机。参照点所关注的是现状,但它还会是将来的目标,即没有实现的目标就是种损失,超过了目标就是种所得。正如我们从消极主导中可能推断出来的那样,这两种动机的影响程度并不形同。对没能实现目标的损失厌恶比想要超过目标的愿望更为强烈。

    人们通常会设定一些短期目标,对于这些目标他们会努力去实现,但并不是必须去超越。人们在实现一个最接近的目标后往往不再那么努力,而这样做有时候会违背经济逻辑。例如,纽约市的计程车司机对月收入或年收入有个目标,但能控制他们努力程度的目标则是每天的收入目标。当然,每天的目标有时容易实现(或超过),而有时则难以实现。下雨天时,纽约市的计程车是不会长时间空车的,司机很快就可以实现自己的目标;而在天气晴好时,情况则大不相同,此时那些计程车只能在大街小巷逡巡,希望能载到客人,时间都浪费在路上了。经济逻辑表明,计程车司机应该在下雨天多干几个小时,晴天时则要多休息,因为晴天时能以较低价格“买”到轻松闲暇。损失厌恶背后的逻辑却正相反:每天有固定目标的司机会在客人少的日子多干几个小时,在浑身湿透的客人巴望打到车的日子里,他们也早早回到家里。

    宾夕法尼亚大学的经济学家德文·波普(Devin Pope)和马利斯·施韦泽(Maurice Schweitzer)认为,高尔夫球对参照点给出了很好的说明,即标准杆数。高尔夫球场上每个洞都有许多击球数,标准杆数给好球(而不是相当出色的球)提供了一个基准点。对于职业高尔夫球员来说,小鸟球(即低于标准杆的一击)即是所得,而超过标准杆数的球则是种损失。经济学家比较了一个球员在球洞附近时可能会碰到的两种情形。

    ·避免击超过标准杆数的球
    ·打出小鸟球

    在打高尔夫时,每一击都算数,在职业高尔夫球比赛中更是如此。然而依据前景理论,有几次击球要比其他击球更重要。没能达到标准杆是种损失,但没有击中小鸟球则是种可预知的所得,不是损失。波普和施韦泽从损失厌恶中推断出球员击标准球(避免超过标准杆数)时会比击小鸟球时更努力。他们仔细分析了250多万次击球以验证这个预测。

    他们是正确的。不论击球是易还是难,不管离球洞有多远,球员在击标准球(而不是小鸟球)时会更成功。在击标准球(避免超过标准杆数)或击小鸟球时,他们成功概率之间的区别是3.6%。这个区别不算小。老虎伍兹是他们的一个“受试者”。在伍兹成绩最好的那几年里,如果他的小鸟球和标准杆都击得那么好的话,他联赛的平均绩点就会提高1杆,而且他的收入每个季度都会增加100万美元。这些激烈的竞争者当然不会轻视小鸟球,但他们对超过标准杆的规避显然会使他们对当前的任务格外关注。

    对击球的研究说明理论概念的力量可协助思考。谁会认为花几个月的时间去研究击标准球和小鸟球是值得的呢?除了一些经济学家以外,大多数人都不会对损失厌恶的概念感到惊讶。但是,损失厌恶形成了一个精确且非直觉性的假设,还引导研究者得出了一个让所有人都震惊的发现。当然,这里的所有人也包括职业高尔夫球运动员。

    我们为什么不愿意改变现状?

    避免损失的动机和获得收益的动机强度并不对称,这一点在许多情况下都有体现。在商务谈判中,尤其是在对现有合同的重新商谈中、在典型的劳动商议和在贸易或限制军备的国际谈判中,这种不对称是长期存在的一个特征。现有的条款确定了参照点,协议中任何方面拟定的变更都会被看成是一方对另一方作出的让步。损失厌恶会产生一种不对称,使得双方难以达成共识。你对我作出的让步是我的所得,但它们却是你的损失;损失使你产生的痛苦会比它们给我带来的快乐更多。因此,你对这种让步的价值会比我赋予它的价值高。当然,你要求我作出的让步对于我来说也会是这样,你对我作出的让步也不会给予足够的价值评价!对越来越小的蛋糕进行商讨非常困难,因为即使损失,也要将其分配出去。人们在蛋糕越来越大时,显得更随和。

    在讨价还价时,双方交换的信息都是想找到一个参照点并给对方提供一个锚定。这些信息并不都是真实的。商议双方对有些利益(也许是商谈裁军问题时提到的某一特定类型的导弹)假装很在意,尽管他们实际上是将这种利益看成讨价还价的筹码并最终想要将其交换出去。因为商议双方都受互惠原则的影响,一个看似令人痛心的让步就需要对方作出同样使他们痛心(可能这种痛心也是伪装的)的让步。

    所有动物(包括人)都想有所得,但他们会更努力地避免有所失。在这样一个所有动物都想有自己地盘的世界中,这项原则解释了防御者成功的奥秘。一位生物学家观察到,“拥有领地的动物受到对手的挑战时几乎总会获胜—往往就是几秒钟的事“。对于人类来说,同样简单的原则也能解释社会机构的改革问题,公司的”重组“和“调整”行为就是如此,官僚主义的合理化、简化免税代码以及降低医疗费用等方面的努力同样如此。起初我们认为,在改革计划中,总体的提升会产生赢家和输家。如果受影响的一方有某种政治影响力,可能成为输家的人就会变得比赢家更积极、更有决心,结果也会更倾向于输家,也一定会比起初计划的代价更高、作用更小。改革通常包括保护利益相关者的不追溯条款,例如以下情形:劳动力减少是由于(退休、辞职、死亡等原因造成的)人员缩减而不是开除;工资或福利的缩减只会在将来的工人身上施行。损失厌恶是一种强大而保守的力量,它偏爱机构或个人对当前生活的细小改变。这种保守主义做派使得我们在邻里间、婚姻中和工作中保持一个稳定的状态,是引力作用让我们的生命无限靠近参照点。

    商人提价或降低员工工资的行为公平吗?

    理查德·泰勒、杰克·尼奇和我一起在温哥华工作的那一年,我们三人对经济交易中的公平性研究产生了兴趣,这不仅是因为我们对这个话题很感兴趣,还因为我们每周都可以(也可以说是必须)制定一份新的调查问卷。加拿大的渔业及海洋部针对多伦多市失业的专业人员制订了一项计划,他们让这些专业人员负责电话调查,并且会支付他们一些薪酬。这一大群调查者每晚都要工作,因而我们也需要不断为他们供应新的问卷调查。由于杰克·尼奇的原因,我们同意每周设计一份调查问卷,用4种颜色印刷。我们什么都可以问,唯一的一个限定条件是问卷应至少提到一次鱼,这样也好跟渔业及海洋部扯上点儿关系。这项工作进行了几个月,这几个月里我们疯狂地收集数据。

    是什么造成了商人、雇主以及房主的不公平交易行为?我们研究了公众对这一问题的看法。问卷中的首要问题是:因为这种不公平行为招来的骂名是否会使他们追逐利润的行为收敛些?我们的发现是:会。而且我们还发现,公众评估哪家公司也许真的(不)会收敛时所依照的道德原则可以明鉴得失。其基本原则是,当前的工资、价格或租金设定了一个参照点,不可违背这个参照点。有些公司将自身的损失强加给顾客或工人,使自己回到交易参照点,这样做是不公平的,除非这样做是为了保护自身的权利。请思考下面的例子:
    一家五金店一直以15美元的价格出售雪铲。某日下了大雪,第二天早上店主就将雪铲的价格提高到了20美元。

    你认为这种行为:完全公平可以接受不公平很不公平

    按标准的经济行为模式来看,这家五金店的行为是公平的:通过提高价格来回应需求的增加。而调查对象却不这么认为,82%的人选择了不公平或很不公平。他们显然是将大雪前的雪铲价格看成了参照点,而将提升的价格看成是店主强加给顾客的损失,因为这家店并不是不得已才这样做的,而是因为它选择这样做。我们发现公平性的一条基本原则是:不可利用市场的力量将损失强加给他人。下面的例子在另一个情境下(因为这些数据是1984年收集的,所以美元的价值应该调至约100%的通货膨胀状态)说明了这条原则:

    有一家小型复印店,店里只有一位雇员,他在这里工作有6个月了,每小时赚9美元。店里的生意还算景气,但当地一家工厂倒闭了,失业人数上升。现在其他小商店里雇用的可靠员工工资都是每小时7美元,工作量和复印店里那位雇员的工作量相似。之后,这家复印店店主也将其雇员的工资降到了7美元。

    那些调查对象不赞成这种做法,83%的人觉得这种行为不公平或很不公平。然而,略微变动一下这个问题就可以澄清雇主的责任。同样是在高失业率的地区,同样是一家赢利的商店,但情况是:

    现在的雇员辞职了,雇主决定支付新的雇员每小时7美元的工资。

    大多数人(73%)觉得这种行为是可以接受的。这表明雇主并没有支付每小时9美元的道德义务。这种权利是个人的:即使市场允许雇主降低工资,雇员也有权利维持自己的工资。新雇员没有权利以之前雇员的工资作参考,因而雇主可以降低其工资,这样做不应该被看做不公平。

    这家公司有其自身的权利,即保持当前的收益。如果该公司面临损失的危险,也可以将损失转嫁给别人。大多数调查对象认为,在收益下降时降低工资是不公平的。我们称这种原则是公司和与公司有关联的个人之间的典型双向权利。受到威胁时,公司的自私行为可被看做是公平行为。人们甚至认为这家公司连部分损失也不必承担,它完全可以将这种损失转嫁给个人。

    不同的原则制约着公司追求利益或避免利益损失的行为。当公司生产成本低时,公平性原则就不会限制公司将财富分给顾客或雇员。当然,若公司分摊赢利,我们的调查对象就会更喜欢这家公司,并觉得这家公司更公平;若不分摊,他们也不会认为该公司做法失当。他们只会在公司利用权力违背与雇员或顾客间的非正式合同时,或者在公司为自身赢利而将损失强加给别人时才会表现出愤怒。研究经济公平性的学生们不应该去评判公司最应该有的举措,而应该找到区分遭人厌恶、应得到惩罚的行为和可接受的行为之间的分界线。

    在把这篇研究报告提交给《美国经济评论》(American Economic Review)时,我们当时并不是很乐观。我们的文章是对当时经济学家们公认的知识的挑战,即经济行为是受自身利益驱使的,而与是否公平无关。我们的研究依赖于调查结果,而经济学家对此并无多大兴趣。杂志的编辑把我们的文章送给两位经济学家评估,这两位经济学家并没有受到传统观念的束缚(我们后来才知道他们的身份,他们是编辑能找到的最和善的人了)。编辑的做法是明智的。这篇文章如今常被引用,而且其结论也经受住了时间的考验。最近有很多研究都支持这个以参照点为基础的公平性实验的结果,而且这些研究还表明公平性在经济学中是很重要的,关于这一点我们过去曾经怀疑过,但没有得到验证。违背了公平原则的雇主会受到生产力下降的惩罚,标价不合理的商人也会失去一部分销售市场。以较低价格卖出近期以较高价格购进的商品会使这位商人此后从这家商品供应商进货的量减少15%,即每位顾客都会分摊到90美元的损失。顾客显然将低价位看成了参照点,而且由于多付了钱,他们会认为自己也遭受了损失。尽管反应最强烈的顾客是那些以较高价钱买了更多商品的人,而且新价目表中较低的价格增加了产品销量,但按底价购物的那些顾客的损失其实远远超过他们所得的。

    如果认为自己遭遇了不公平的人想反抗,那么这种将损失强加给别人的行为就会有风险。实验表明,不公平行为的旁观者也常会被卷入惩罚当中。神经经济学家(将经济学和大脑研究联系起来进行研究的科学家)使用核磁共振成像仪检测了人们的大脑,这些人惩罚某人对他人做出的不公平行为。令人惊讶的是,利他惩罚会伴有大脑“快乐中心”的活动加强的情形出现。这表明保持社会秩序和公平原则的做法会通过利他惩罚而得到回报。利他惩罚能将这个社会凝聚到一起。然而,我们的大脑在奖赏无私慷慨行为时不能像在惩罚自私吝啬行为时那样实在。我们在这里又发现了得失间的不对称。

    损失厌恶和权利的影响远不只存在于金融交易领域中。法官很快就能看出它们对法律和司法行政的影响。在一项研究中,戴维·科恩(David Cohen)和杰克·尼奇发现,在法律决策中真正的损失和可预测的所得之间有着明显区别。例如,在运输中丢失货物的商人可得到实际损失的赔偿,但损失的利润却不可能得到补偿。90%的财产起诉存有的相似原则也证实了参照点的道德地位。在近期的一场讨论中,埃亚尔·扎米尔(Eyal Zamir)提出了一个颇具挑衅性的论点,即法律对挽回损失和补偿失去的所得之间的区分,也许可以凭借其对个人幸福的不对称影响使自身的行为合理化。如果遭受损失的人比没能赢利的人遭受更大的损失,他们也许应该得到更多的法律保护。

    示例—损失问题“这项改革肯定无法通过。那些必然受损的人会比那些必然获利的人更加强烈地反对这种做法。”“他们都认为对方作出让步时不会感到痛心。当然,他们都错了。这正是损失的不对称性的表现。”“如果他们觉得利益的蛋糕的确在变大,就会发现再次商议更容易。因为他们不是在分配损失,而是在分配所得。”“这儿的租赁价格直线上涨,但房客认为我们不应该提高租金。他们觉得自己有权利享受当前的利益。”“我们的客户对价格上涨并无抱怨,因为他们知道我们的成本也上涨了。他们尊重我赢利的权利。“第29章 对结果可能性的权衡

    对于你要买的汽车、你的女婿或者不确定的形势这样复杂的对象,你会形成一个总体评估,而在作这个评估时,你会对这个对象的特征加以权衡。这么说有些烦琐,简单来讲就是,某些特征比其他特征更容易对你的评估产生影响。这种权衡在发生时你可能意识不到,这是系统1在起作用。评估一辆车时多少会权衡其燃油情况、舒适程度或外观等。评估女婿也多少会考虑他的经济状况、相貌或是否可靠等。同样,对于不确定形势的评估也会权衡其可能出现的结果。权衡时,你肯定会考虑到这些结果的可能性:有50%的概率赢得100万美元当然要比只有1%的概率更吸引人。权衡有时是有意识的,有时是经过深思熟虑的。然而,大多情况下,这些总体评估都是由系统1作出的。

    可能性效应与确定性效应

    在研究决策制定时,我们以打赌为例,效果不错,其中一个原因是打赌是对预期结果加以权衡的一种很自然的方式:结果的可能性越大,就越应该受到关注。一个赌局的预期值即为其结果的平均值,而每个结果又要靠其可能性来权衡。例如,如果“有20%的概率赢得1000美元和有75%的概率赢得100美元”,这种情况的预期值就是275美元。在伯努利开始研究前,赌注是通过其预期值加以评估的。伯努利也使用了这一方法来权衡结果,人们将这一方法称为预期原理,但却将其应用到研究结果的心理价值中去了。在伯努利理论中,打赌的效用是其结果效用的平均值,每个结果都是通过其可能性来加以权衡的。

    预期原理没有正确地描述你对有风险的可能性是怎么想的。若在以下4种情况中,得到100万美元的概率都提升了5%,你认为这个消息给人的感觉是一样的吗?

    A.从零提升到5%。
    B.从5%提升到10%. 
    C.从60%提升到65%。
    D.从95%提升到100%。

    依据预期原理来看,每种情况下你得到100万美元的效用都提升了5%。但这么说与你的经验相符吗?当然不相符。

    大家都知道:从零提升到5%和从95%提升到100%要比从5%提升到10%或从60%提升到65%更具诱惑力。从零提升到5%意味着情况完全转变,从无到有,产生了赢得奖金的希望,这是一种实质性改变;而从5%到10%只是一种数量上的提升,是将赢得奖金的可能性翻倍,但这种情况下的心理价值并没有翻倍;从零到5%的巨大转变表明了“可能性效应”(possibility effect),这一效应会是我们高估那些出现可能性极低的结果的发生频率。大量买彩票的人表明,他们愿意花超出预期价值的钱来换取赢得大奖的渺茫机会。

    从95%提升到100%是另一种实质性改变,也会产生巨大的影响,是“确定性效应”(certainty effect)。那些几乎可以确定会出现的结果受到的重视程度要小于其理应受到的重视程度。为了更好地理解确定性效应,假设你继承了100万美元,但你那同母异父的妹妹不甘心,在法庭上对这份遗嘱提出了质疑。判决结果明天就会出来,你的律师向你保证你赢得官司的概率很大,有95%,但他又煞费苦心地提醒你法律判决并不都是尽如人意的。现在,有个风险调整(校正)公司找到了你,想立即以91万美元与你交易,接不接受是你的事。公司的报价比等待判决的预期价值(95万美元)要少(少了4万美元),但你确定你会拒绝这个提议吗?如果这样的事在你的生活中确确实实发生了,你应该知道“结构性和解”( 结构性和解,又被称为结合式和解(Structured Settlement),是有关赔偿金和解的一种,被告同意在受害原告的有生之年向其分期支付赔偿金。一般包括首期一次总付的赔偿金和将来以年金方式分期支付的赔偿金)这个大产业是以不菲的价格来提供保障的,他们充分利用了确定性效应。

    可能性和确定性在损失研究方面具有同样强大的效应。当心爱的人被推进手术室时,即使截肢的可能性只有5%,也是个噩耗—这个5%的风险带来的痛苦要远大于10%的可能性带来的痛苦的一半。这是由于可能性效应,即我们往往看重轻风险,更愿意花比预期价值更多的钱将其排除掉。在可能性效应中,有95%的可能性会遭受灾难和必然会遭受灾难两者间的心理差别甚至更大;虽然“一切都会没事的”这样的希望很渺茫,但人们却总是将这种希望无限放大。过于看重很小的概率,使得风险和保险政策更具诱惑力。

    结论很明显:与预期原理相反,人们对结果的重视程度和对结果可能性的重视程度不同。可能性效应会重视不大可能的结果,而几乎肯定的结果相对于确定的结果来说,受到的重视程度要小。预期原理通过可能性来判定价值,这是一种不可取的心理。

    然而这个问题却越来越复杂,因为有个有力的论点指出:想变得理性的决策制定者“一定”要遵从预期原理。这也是冯·诺依曼和摩根斯坦恩在1944年提出的公理版效用理论的主要观点。冯·诺依曼和摩根斯坦恩指出,有些不确定结果与可能性并不相符,对这些结果的权衡会导致不一致性和其他恶果。他们由理性选择的公理推出的期望效用理论当时立即就被视为一项重大成果,也使得期望效用理论成为经济和其他社会科学理性模式的核心内容。30年后,阿莫斯带着一种敬畏把他们的研究介绍给我,当时他还向我介绍了一项针对这个理论的著名挑战。

    著名经济学家也难逃阿莱斯悖论的陷阱

    1952年,即冯·诺依曼和摩根斯坦恩的效用理论发表几年后,在巴黎召开的一次大会讨论了风险经济学的问题。很多当时著名的经济学家都参加了这次会议。来自美国的与会者中包括了后来的诺贝尔奖得主保罗·萨缪尔森(Paul Samuelson)、肯尼斯·阿罗(Kenneth Arrow)、米尔顿·费里德曼(Milton Friedman)和统计学界的带头人吉米·萨维奇(Jimmie Savage)等人。

    巴黎大会的一位组织人莫里斯·阿莱斯(Maurice Allais)几年后也获得了诺贝尔奖。阿莱斯准备了几个关于选择的问题来问与会嘉宾。那次大会与本章内容相关的问题就是,阿莱斯想要表明那些嘉宾容易受确定性效应的影响,因此才违背了期望效用理论和该理论所依据的理性选择的公理。以下的一套选择是对阿莱斯构建的难题的简单表示。在问题A和问题B中,你会选择哪一个?

    A. 61%的概率赢得52万美元或者63%的概率赢得50万美元
    B. 98%的概率赢得52万美元或者100%的概率赢得50万美元

    如果你和其他人一样,便会在问题A中偏向前面的选项,在问题B中偏向后面的选项。如果你的确是这样选择的,就说明你犯了逻辑上的错误,并且违背了理性选择的原则。这些齐聚巴黎的著名经济学家在“阿莱斯悖论”中也犯了同样的错误。

    为了弄明白为什么这些选择有问题,我们可以将其看成是从罐子里随意抓取弹珠的游戏,即若罐子里装有100颗弹珠,抽到红色的弹珠就算赢,抽到白色的就算输。在问题A中,几乎所有人都偏向前面的选项,我们可以将其看成左边的罐子,即使里面所含的红弹珠少,赢的概率也小,但奖品的大小比赢得奖品的概率更吸引人。在问题B中,大多数人都选择能确保得50万美元的那个罐子。且人们对自己作的两个选择(即问题A选左边,问题B选右边)都感到很满意,不过在他们了解了问题背后的逻辑之后,就不这么认为了。

    比较一下这两个问题,你会发现问题B中的两个罐子比问题A中的两个罐子更具吸引力,因为问题B的两个罐子中有37个白球替换成能赢的红球了。左边那个罐子的改进明显比右边的大,因为左边的罐子中每个红球都有能使你赢得52万美元的机会,而选右边的罐子只能赢得50万美元。你本会对左手边的罐子感兴趣,毕竟这个罐子作了改进,情况比右手边的好,但是,现在你喜欢的却是右手边的!这个选择的模式没有什么逻辑意义,但却可以从心理上作出解释:确定性效应起了作用。在问题B中,100%的概率和98%的概率之间虽然就差两个百分点,但相比于问题A中63%和61%之间相差的两个百分点来说,这个差距的影响则要大得多。

    正如阿莱斯所预测的那样,那些经验老到的与会者并没有注意到自己的偏向已经违反了效用理论,直到大会快结束了他们才注意到这个事实。阿莱斯本想向外界公布这个情况,制造一条爆炸性新闻:那些世界上顶尖的决策理论学家也存在偏好,这种偏好和他们自己对理性的见解完全背道而驰!阿莱斯显然相信众位来宾会接受劝说,放弃那种他蔑称为“美国式”的分析方法,转而采取另一种由他提出的选择逻辑。不过,当时的情况令他极为失望。

    那些对决策理论不是很热衷的经济学家大都忽视了阿莱斯提到的问题。当某个为人们广泛采纳并被认为非常有用的理论遭到挑战时,都会出现类似的情况:他们将阿莱斯提出的这个问题视为非常规问题,仍旧使用期望效用理论来解决这一问题,就像什么事都没发生过一样。相反,那些决策理论专家—包括统计学家、经济学家、哲学家和心理学家等各路高人在内—对阿莱斯的挑战却非常重视。在阿莫斯和我开始我们的工作时,我们的初衷就是对阿莱斯悖论给出令人满意的心理学解释。

    大多数决策理论家—当然也包括阿莱斯在内—坚定地相信人类的理性,他们还试图改变理性选择的规则以使阿莱斯模式可以为人们所接受。过去这些年中,他们为找到一个似乎合理的理由来解释确定性效用一直在进行各种各样的尝试,但所有的理由都无法令人信服。阿莫斯对这些人的努力几乎失去了耐心,他将那些试图使违背效用理论做法合理化的理论家称为“为举措失当的人辩护的律师”。我们没有步他们的后尘。我们将效用理论看成是理性选择的逻辑基础,但并不认为人们都是非常棒的理性选择者。我们承担了一项建立一种心理学理论的任务,不管人们作出的选择是否是理性的,这一理论要能够对其进行描述。在前景理论中,决策的权重和可能性的权重不可同日而语。

    决策权重的大小取决于人们的担忧程度

    在我们发表前景理论多年以后,阿莫斯和我进行了一项研究,在这项研究中,我们衡量了决策权重,这个权重解释了人们在打赌时为什么会选择保守的赌注。下面的表格显示的是对所得的评估信息。

    (%)可能性——决策权重

                      0 ——0

                      1 ——5.5

                      2 ——8.1

                      5 ——13.2

                     10——18.6

                     20——26.1

                     50——42.1

                     80——60.1

                     90——71.2

                     95——79.3

                     98——87.1

                     99——91.2

                    100——100

    你会发现,在极端情况下,决策权重和相应的可能性是相同的:当结果不可能出现时,两者都是零;当结果肯定会出现时,两者都是100。但是,在这些点附近,决策权重却明显与可能性拉开了距离。在距离最远处,我们发现了可能性效应:不可能出现的事往往受到重视。例如,相对于可能性为2%的决策权重是8.1。如果人们遵从理性选择的公理,决策权重将会是2—罕见事件被过分看重了。因此对罕见事件偏重的程度增加了4倍。可能性范围右端的确定性效应更显著。“无法”得奖的2%的风险使得风险效用从100降低到87.1,降低了13%。

    想要理解可能性效应和确定性效应之间的不对称性,先假设你有1%的概率能赢得100万美元,明天就会揭晓结果。现在,再假设你几乎确定自己能赢得100万美元,但还是有1%的可能性赢不了,同样是明天揭晓结果。第二种情况中的焦虑情绪显然比第一种情况下的期望心理更明显。如果结果是手术失败而不是钱财得失,确定性效应就要比可能性效应更显著。与对1%的风险的担忧相比,你对一项成功希望渺茫的手术(这项手术几乎可以确定会致命)的关注程度又如何呢?

    在可能性变化范围的两端,确定性效应和可能性效应的双重作用不可避免地会伴随着对中间概率不够敏感的情形出现。从上表中可以看出,从5%到95%之间的可能性和范围更小的决策权重(从13.2到79.3)之间密切相关,约占理性期望的2/3。神经科学家已经证实了这些观察结果,发现了对得奖可能性的不同变化做出反应的大脑区域。大脑对可能性变化的反应和从选择中估测出来的决策权重惊人地相似。

    极小或极大的可能性(低于1%或高于99%)都是特殊的情况。权衡极罕见的情况是很难的,因为这些情况常常会被彻底忽视,事实上人们赋予它们的决策权重为零。另一方面,在没有忽视这些罕见的情况时,你肯定又会过于重视它们。大多数人很少有时间去关心核能外泄问题,也几乎不会幻想从素未谋面的亲戚那里继承到大笔遗产。然而,当不大可能出现的事情成为关注的焦点时,我们对它的重视程度就要超过其本身出现的概率应该引起的关注度。此外,人们对于可能性较小的各种风险几乎完全是迟钝的。人们很难说出0.001%的癌症风险与0.000 01%的癌症风险之间的区别,尽管前者是指美国人口中有3 000人罹患癌症,而后者则说明只有30个美国人患癌症。

    当你关注某种威胁时,你就会担忧,而且决策权重会反映出你的担忧程度。根据可能性效应,这种担忧和威胁出现的可能性并不相符。仅仅减少或降低风险还不够;若想消除这种忧虑,必须将其出现的可能性降低为零。

    下面的问题改编自对消费者评估健康风险时所体现的理性的研究。1980年,一个由经济学家组成的团队公布了这项研究,并把调查结果交给了小孩子的家长们。

    假设你正在使用一种杀虫剂,每瓶要10美元,每使用10000瓶杀虫剂就可使15个人吸入中毒和15个孩子中毒。

    你了解到有一种更昂贵的杀虫剂,它可使以上两种风险降低,即每使用10000瓶出现上述两种风险的人数分别为5人。你愿意花多少钱买这瓶杀虫剂呢?

    这些父母愿意多花平均2.38美元的钱来降低2/3的风险(从15/10 000降低到5/10 000)。他们愿意花8.09美元去完全排除风险,这个价钱是2.38美元的3倍多。其他的问题表明这些父母将这两种风险(吸入中毒和儿童中毒)视为不同的烦恼,只要能完全消除其中任何一种风险,他们都愿意支付一定数额的钱。这个数额与担忧的心理很吻合,但和理性模式并不相符。

    四重模式:可能性与决策权重的关系模型

    阿莫斯和我在研究前景理论时,很快就得出了两个结论:相对于现有财富来说,人们更看重得失,而且关于结果的可能性和决策权重方面,表现大不相同。这并不是全新的观点,但它们一旦结合起来,就可以对一种偏好的特殊模式作出解释,我们将这一特殊模式称为四重模式。名字是固定的,具体阐述如下。

    图13

    ·每栏中的第一行都对前景作了解释。

    ·第二行对前景引起的情绪作了特征描述。

    ·第三行表明,在风险和与期望价值相符合的必然获得(或损失)之间作选择时(例如在“有95%的概率赢得10000美元”和“肯定能赢得9500美元”之间作出选择),大多数人是如何表现的。

    ·第四行描述了在被告和原告讨论民事案件的解决方法时可能会出现的态度。

    偏好的“四重模式”被视为前景理论的核心成果之一。上面四栏中有三栏是相似的;只有第四个(右上角)是新的,是完全出乎意料的。

    ·左上角一栏是伯努利曾讨论过的:当人们觉得未来获得一大笔收益的概率很大时,会选择风险规避。人们在打赌时愿意接受比预期价值少的赌注,以确保肯定能有所得。

    ·左下角一栏的可能性效应解释了为什么人们都愿意买彩票。若头彩很大,人们会疯狂地买,会忽视赢的概率很小这一事实。买彩票是可能性效应最好的例子。没有彩票,就不能赢,有了彩票就有了机会,概率小不小并不重要。彩票能获得的东西要比赢得的概率更重要,梦想赢是人们的权利。

    ·右下角一栏说明了什么时候应该买保险。人们愿意支付比期待价值更高的价格去买保险,保险公司就是这样支付成本、获得利益的。有些灾难不太可能发生,但人们更愿意买个保障。他们消除了自己的忧虑,买个心里踏实。

    刚开始时,右上角那一栏的内容着实让我们惊讶了一番。除了左下角那栏,其他几栏都会让我们习惯性地想到风险规避,而在左下角一栏的情况中,人们往往会选择碰运气。在审视自己的选择是否错误的时候,我们在处于损失的情况下会选择冒险;处于赢利的情况下会选择规避。我们不是用负面前景的观点观察研究冒险的开先河者—至少有两位作者曾经提到这一事实,但他们的讲述不是很详尽。不过我们对冒险的研究有个理论框架作支撑,这样研究就会更容易些,这也是我们思想发展的里程碑。我们已经找到两点来解释这个效应了。

    第一,敏感性不断降低。人们对损失900美元的反应比损失1000美元的90%的反应程度更强烈,这也说明了为什么人们会避免必然的损失。第二个原因也许更有说服力:90%这一可能性的相应决策权重只有71,比可能性小很多。出现这种情况的结果是,当你在必然的损失和很可能会承受很大损失之间做决策时,降低敏感度可使你更愿意规避必然的损失,而且确定性效应也降低了对赌注的规避。这两个相同的因素,在结果是正面时,加强了确定性事件的吸引力,使赌注的吸引力得以削弱。

    价值函数和决策权重的曲线共同促成了图13中首行所描述的模式。然而,在底行描述的模式中,这两个因素却背道而驰:降低敏感度会使得你在所得面前选择规避,在损失面前选择冒险,但对较小可能性的过分看重则会战胜这种效应,产生我们前面所观察到的那种模式,即为收益愿冒风险,对损失保持谨慎。

    人类的很多不幸处境都在右上角那栏中得到了体现,也就是说人们在面临的抉择比较糟糕时会孤注一掷,尽管希望渺茫,他们也宁愿选择使事情更糟的较大可能性以换取避免损失的希望,这种做法常会使可控制的失误变成灾难。一想到即将会有一大笔损失就很痛苦,完全的解脱也很吸引人,因而我们难以做出明智的决策,难以相信时间可以使人摆脱损失所带来的痛苦。这也正是那些屈从于高科技的企业浪费了自己的剩余资产却什么也没有得到的原因。失败总是难以让人接受,所以失败的一方常会保持战斗力,即使在知道对方的胜利只是时间问题的情况下,输的这一方还是会作无谓的挣扎。

    可能性效应影响下的风险决策

    法学家克里斯·格思里(Chris Guthrie)将四重模式应用到两种情况中,在这两种情况中,民事诉讼的原告和被告都认为这一模式可能会解决双方存在的问题。这两种情况在原告案例中体现的强度有所不同。

    就像我们之前看到的情况那样,假设你是一起民事诉讼案件中的原告,你要求一大笔损失赔偿。这个案件进行得非常顺利,你的律师给出了他的专业见解,说你有95%的概率会赢,但也不能掉以轻心,“在陪审团出庭前,你永远都不会知道结果”。你的律师劝你接受庭外调解,但你只能得到90%的赔偿金。你正处于四重模式左上角的一栏中,你脑中的问题是:“即便什么也得不到的概率不算大,可我真的愿意冒险打官司吗?即便得到90%的赔偿金也是一大笔钱了,而且我又能马上拿走。”这种情景引发了两种情绪,而且两种情绪都向相同的方向发展:对必然所得(一大笔钱)的渴望以及拒绝庭外和解又输了官司的极度失望与后悔。你能感受到在这种情况下,有种压力使人们的行为更谨慎。若原告打赢官司的可能性很大,则更趋向于风险规避。

    现在从被告的角度审视一下这个案件。尽管为了自己的利益没有完全放弃决策的希望,但你会发觉这个案件的进展非常糟糕。原告的律师提出庭外和解,即只需提供给原告所要赔偿金的90%(显然原告不会接受更少的金额)。你会接受这种解决方案吗?还是更愿意打官司?要记住你遭受损失的可能性较大,情况属于右上角一栏。你希望能再搏一搏,因为庭外和解与你将要面对的最糟结果几乎同样令你痛苦,而且毕竟打赢官司的希望还是有的。于是,两种情绪再一次被唤起:人们不愿面对必然的损失,而且能在法庭上赢的可能性还是很有吸引力的。案件前景不乐观的被告更愿意采取冒险手段,更愿为打赌作好准备,而不是接受对自己不利的解决方案。在规避风险的原告和冒险的被告的对峙中,被告有更多的掌控机会。被告更高的谈判地位应该反映在协议解决中,原告则满足于能通过法庭获得更少的钱。通过四重模式作出预测的模式已经由法律系的学生和执业法官所做的实验和民事案件中的实际谈判证实了。

    若原告胜算不大却索赔一大笔钱的话,请思考一下“无意义诉讼”问题。双方都意识到可能性的大小,也都知道在商讨解决方案时,原告只能得到索赔的一小部分。商谈是受最下面一行中那个四重模式引导的。原告的情况属于左侧的类型,赢得一大笔钱的概率很小。无意义诉讼的索赔就像是买一张会中大奖的彩票一样。过分看重成功的较小概率在这种情况下是很自然的,原告也会在商谈中变得厚颜无耻或咄咄逼人。对于被告来说,起诉是件很烦人的事,但结果不好的风险很小。有些损失虽大,但概率较小,过分看重这样的损失会导致风险规避,而且选择用合适的索赔解决这个案子就像是买了份保险,以防判决对自己不利。现在换一个角度:原告愿意赌一次,而被告想要保险之策。作出无意义诉讼的原告很可能会接受一个比这个案件应该付出的钱更多的解决方法。

    这些通过四重模式来描述的决策并非不合理。你可以在每种情况下都体会一下原告和被告的心情,这些心情会使得他们采取或挑战或顺从的立场。然而,从长远角度来看,期望值的偏差代价可能会很大。试想一个大型组织,比如纽约市,它每年要处理200起“无意义”案件,每个案件都有5%的可能花掉这个城市的100万美元。再假设:对于每个案件,这个城市都能用10美元解决。这个城市认为有两种政策能用于所有的案件,即自己解决或法庭上见。(为了方便起见,我在此忽略了诉讼费。)

    ·如果这个城市同意受理200起诉讼案件,就会输掉10起,总计损失达1000万美元。
    ·如果这个城市处理每个案件都要花10万美元,那么总共的损失就会高达2000万美元。

    若要对相似的决策从长计议的话,你就可以看到,支付额外费用以避免不大可能出现的大笔损失代价就太高昂了。相似的分析适用于四重模式中的任何一栏:从长远来看,期望值的系统偏差的代价还是很高的—这个原则适用于风险规避和冒险之举。一贯看重不大可能会出现的结果—这也是直觉性决策制定的一个特征—最终会导致不好的结果出现。

    示例—四重模式“他试图用庭外和解的手段来解决这个无意义的诉讼案件,以避免损失,然而却不大可能。这是过分看重较小可能性的结果。既然会面对很多相似的问题,他最好还是不要放弃。”“我们从不在最后一秒才享受自己的假期,我们愿意为了确定性而付出努力。”“只要有可能不赚不赔,损失就不会减少。这就是损失中的冒险。”“他们知道瓦斯爆炸的可能性很小,但他们想要消除这种可能性。这是可能性效应,而且他们想要的是再无后患。”

    第30章 被过分关注的罕见事件

    在以色列巴士遭遇自杀式炸弹袭击相对频繁的那段期间,我去了那里几趟。当然,如果按绝对值计算的话,这样的袭击是相当罕见的。2001年12月至2004年9月,以色列总共发生了23起炸弹袭击事件,造成236人死亡。而在这期间,以色列境内每天乘巴士的人大约有130万。对于每一位乘客来说,遭遇袭击的概率是极小的,但人们并不这样认为,大家都尽量不乘巴士,而不得不乘巴士的人则会焦虑地扫视邻座乘客的行李或其宽松的衣服,害怕里面藏有炸弹。

    我在以色列开的都是租来的车,很少乘巴士,但即便如此,也受到了炸弹袭击的影响,这着实令我懊恼。在等红灯时,我不愿停在巴士旁,绿灯一亮,我会用比平时更快的速度将车开离。为此,我感到很惭愧,因为我比其他人更清楚遇袭的概率其实很小。遇袭的风险真的可以被忽略掉,但其对我行为的影响使这个极小的概率有了极大的决策权重。实际上,与把车停在巴士旁(而遭遇爆炸事件的概率)相比,我更有可能在车祸中受伤。但并不是出于对活命的理性考虑我才躲避巴士,而是当时的体验驱使我这样做:在巴士旁边停车使我联想到了炸弹,而且这些想法令我很不愉快。我躲避巴士是因为我想要思考别的事。

    我的经历说明了恐怖主义是如何产生影响的,也解释了为什么人们这么害怕恐怖主义:因为它降低了效用层叠。极其生动的死亡或爆炸画面的影响因媒体的关注以及人们的频繁交谈而不断加强,在身处具体的情境时,尤其如此,例如看见了一辆巴士时。此类情绪一触即发、身不由己且无法控制,会使人们本能地想要保护自己。系统2可能“知道”发生危险的概率很小,但即使知道也无法消除人们内心的不安和躲避危险的冲动。我们无法停止系统1的运行。情绪的紧张程度不仅和概率不相符,对概率的估测也不够敏感。假设有两座城市都被警告有自杀式炸弹袭击者出没,其中一座城市的居民被告知有两名袭击者准备袭击该城市,而另一个城市的居民被告知只有一名袭击者。后一座城市的风险降低了一半,但那里的人们会感到更安全吗?

    纽约市有很多商店都卖彩票,生意也不错。其实,中彩票大奖的心理与对恐怖主义事件抱持的心理是类似的。能赢大奖必然令人激动,整个社区也会为之兴奋,而且人们在工作场合和家里聊到此事时,会更兴奋。买彩票之后会有一种愉快的幻想,就像躲避巴士之后恐惧会减轻一样。这两个例子的实际发生概率其实都非常小,人们更在意的是可能性。人们对前景理论的最初构想包括这样的观点:“罕见事件不是被忽视就是被过度重视。”不过,这个说法并没有详细说明在什么情况下事件会被忽视,什么情况下会被过度重视,也没有从心理学上对此作出解释。对决策制定过程中情感和生动性作用的最新研究影响了我对决策权重的看法。过高权衡不太可能的结果是系统1的特点,我们对此已经很熟悉了。情感和生动性会影响顺畅性、可得性以及对概率的判断—因此也就解释了人们为什么过分关注那些没有被自己忽略掉的罕见事件。

    你认为一支三流球队获得NBA总冠军的可能性有多大?
    你认为下一届美国总统是第三党派候选人的概率有多大?
    如果下一届美国总统是第三党派候选人,你会得到1000美元;如果不是的话,你将一分钱也得不到。你准备下多大的赌注?

    这两个问题虽不同,但明显有关联。第一题要求你评估罕见事件的概率,第二题想让你通过下赌注来权衡第一题那件事的决策权重。

    人们是怎样作出判断,怎样确定决策权重的呢?让我们先来看两个简化的回答,然后再对答案进行证实。以下就是这两个十分简单的答案:

    ·人们高估了罕见事件的概率。

    ·人们在做决策时过高权衡了罕见事件。

    尽管过高估计和过高权衡是两个不同的现象,却有着同样的心理机制,即集中注意力、证实性偏差以及认知放松。

    明确的描述激发了系统1的联想机制。当你想到第三党派候选人胜出的可能性不大时,你的联想机制会像平时那样在验证性模式下工作,会有选择地提取使表述正确的信息、事例以及画面。这个过程有偏见存在,但并不是在幻想下进行的。你寻找的是符合现实条件制约的可能情况,你不会天真地想象是“西方的仙女”任命了一位第三党派的总统。你对概率的判断最终总是由认知放松或顺畅性决定的,因此你的脑海中总会出现貌似正确的情形。

    你并不总是关注要求你作出评估的事件。如果目标事件发生的可能性很大,你就会关注这个事件的其他可能性。请思考下面这个例子:

    在你们当地医院里出生的新生儿在3天内就出院的概率有多大?

    你现在要估测婴儿出院回家的概率,但你肯定会关注造成婴儿不能在正常期间出院的事件。我们的大脑有个有用的机能,它会不由自主地去关注奇怪、不同或是不寻常的事。你很快就会意识到,在美国(不是所有国家都设有同样的标准),婴儿于分娩后的两三天出院是很正常的。所以,你将注意力转移到反常的情况上去了。罕见事件成了焦点,这些事件很可能唤起可得性启发模式:你的判断可能由你所制造的许多医疗问题的发生场景以及想起这些问题时的感受决定。因为你处于确定性模式下,你对医疗问题出现频率的估计很有可能会非常高。

    当某件事的其他可能不太明确的时候,罕见事件的概率就很容易被高估。我常爱引用的一个例子是心理学家克雷格·福克斯(Craig Fox)的一项研究。开始这项研究的时候,他还是阿莫斯的学生。福克斯召集了一些职业篮球赛的球迷并引出了几个关于NBA季后赛冠军的判断与决策。他特别要求受试者分别估计参与季后赛的8支篮球队取得最后胜利的概率。因此,每支球队的胜利都成了焦点事件。

    你肯定可以猜到发生了什么,但福克斯所观察到的影响程度可能会令你感到惊讶。假设某个球迷被要求去估计芝加哥公牛队赢得联赛的概率。此时焦点事件已经确定,但其他情况—其他7支球队中的某支球队赢得比赛—往往会被忽略。球迷在肯定性模式下的记忆和想象都在努力构建公牛队胜利的情况。还是这个受试者,在被问到湖人队的胜算时,相同的选择性激活又会偏向支持湖人队。这8支美国最好的职业篮球球队都很优秀,所以设想其中一支相对较弱的球队成为冠军也是有可能的。结果是:把相继对这8支球队进行判断的概率相加,得到了240%!这样的结果当然是荒谬的,因为这8支球队的胜算相加结果应该是100%.当裁判被问到冠军是出自西部联盟还是东部联盟时,这种荒谬就不存在了。因为在这个问题中,焦点事件及其他情况同样详细,他们判断的概率相加就是100%。

    在评估决策权重时,福克斯请了球迷对联赛结果下注。他们对每个赌局都标明了金额(金额大小与赌局的风险大小相匹配)。赢得赌局的人可获得160美元。而这8支球队的现金标价总额为287美元。也就是说,如果某个受试者对8支球队都下了注,他肯定会损失127美元!受试者肯定知道联赛有8支球队,对8支球队都下注的平均回报不可能超过160美元,尽管如此,他们还是过高地估计了结果的可能性。球迷不仅高估了他们所关注的事件的可能性,还更愿意对它们下注。

    这些发现对规划谬误以及其他乐观主义的表现形式作出了新的阐述。当某个人努力预测某个方案的结果时,就可以切实且轻松地成功执行某项方案。相反,失败的可能性则会被忽略,因为事情出问题的情况错综复杂。对自己职业前景进行评估的那些企业家与投资者很容易高估自己的机会,也喜欢过高权衡自己的估值。

    画面感越强,决策权重越大

    正如我们所看到的那样,前景理论与效用理论的不同体现在概率与决策权重的关系上。在效用理论中,概率与决策权重是相同的。对已经确定的事情的决策权重是100,某件事有90%的概率,说明人们对这件事的决策权重是90,是概率为10%的事件的决策权重的9倍。在前景理论中,各种概率对决策权重的影响较小。我早前提到的一项实验发现,概率为90%的事件的决策权重是71.2;概率为10%的事件的决策权重是18.6。两个概率的比率是9,但其决策权重的比率只有3.83,这说明在那个范围内人们对概率的敏感度不够。在这两个理论中,决策权重只依赖于概率,与结果无关。两种理论都认为,概率为90%的事件的决策权重与赢得100美元、收到一束玫瑰花或是遭到一次电击的权重相同。这个理论预测后来被证实是错误的。

    芝加哥大学的心理学家们发表了一篇文章—《钱、吻与电击:对待风险的情感心理》,他们发现,人们评估风险时,如果(假想的)结果与情感相关(“碰见了你最爱的明星并亲了他一下”或“遭受了一次疼痛但没有危险的电击”),这种评估对概率的敏感度要低于有关金钱得失的结果。这并不是一个孤立的发现。通过生理检测(比如心跳)的手段,其他研究者发现,对将要遭受的电击的恐惧与遭到电击的概率从本质上说是毫不相关的。仅仅是电击的可能性便会让人心生恐惧。芝加哥的这个团队提出“满溢意象”(affect-laden imagery)完全盖过了对可能性的回应。10年后,普林斯顿大学一个心理学家团队对这个结论发起了挑战。

    普林斯顿的这个团队说,他们已经观察到人们对与情感相关的结果的出现概率的敏感度很低,这种情况很正常。赌钱属于例外情况。赌钱时,人们对概率的敏感度相对较高,因为他们有确切的预期值。

    下面两个赌局的吸引力与多少现金的吸引力是等价的?
    A.有84%的概率赢得59美元。
    B.有84%的概率赢得一束装在玻璃瓶里的玫瑰花。

    你注意到了什么?其中显著的不同在于A问题比B问题更为简单。你不用停下来去估算这个赌金的预期值,就能很快知道其价值在50美元左右(事实上其价值为49.56美元),在你寻找一个具有同样吸引力的现金等价物时,这个大概的估算已足以提供一个有帮助的锚定。问题B却不存在这样的锚定,因此也就更难回答。调查对象还对两个赌局的等价现金进行了评估,认为同时赢得两个赌局中的等价现金的概率为21%。不出所料,高概率的赌博与低概率的赌博之间的不同在于,进行高概率赌博的人更可能是为了金钱,而不会是为了玫瑰。

    普林斯顿团队认为,对概率不敏感并非因为情绪原因。为了支持这个观点,他们比较了人们花钱避开风险的意愿:

    利用某个周末粉刷某人的三居室公寓的概率为21%(或84%)。

    打扫使用了一周的一座公寓厕所中的三个小隔间的概率为21%(或84%)。

    第二个结果肯定比第一个更能引发情感,但这两个结果的决策权重并无不同。显然,情感强烈程度不会影响概率。

    另一个实验产生了一个惊人的结果。在这个实验中,受试者得到了奖品的明确价格以及文字描述信息。例如:

    有84%的概率可以赢得一束装在玻璃花瓶里的玫瑰花,价值59美元。

    有21%的概率可以赢得一束装在玻璃花瓶里的玫瑰花,价值59美元。

    对这些赌注预期的货币价值进行评估很简单,但增加一个具体的货币价值并不会改变其结果:即使在那样的情况下,评估依然对概率不敏感。想到奖品是玫瑰花的人不会将奖品信息作为评估风险的锚定。正如科学家有时说的那样,这是一个令人惊喜的发现,它想告诉我们一些事情。那么,现在这个实验想要告诉我们什么呢?

    我认为,这种说法体现了结果的丰富性和生动性,无论结果是否会激发情感,它都会降低概率在评估不确定的前景时本应起到的作用。这个假设提出了一种预测(我对这一预测信心满满):若对货币形式的结果附上毫不关联但却非常生动的细节描述,同样也会影响估算结果。比较一下你对下面这些结果的现金等价物的估值:

    有21%(或84%)的概率在下个周一收到59美元。

    有21%(或84%)的概率在下个周一上午收到一个内含59美元的蓝色大信封。

    新的假设为,在第二个案例中,对概率的敏感度会更低,因为与“一笔钱”这个抽象的概念相比,蓝色信封能唤起更为丰富的想象。你在脑中构建这个事件时,即使知道赢的概率很小,但奖品的生动画面仍然会浮现出来。认知放松同样也对确定性效应产生了影响:当你脑海中闪现关于某个事件生动的画面时,这个事件不发生的可能性所带来的影响同样也很生动,因此就会被过度权衡。增强的可能性效应与增强的确定性效应相结合以后,决策权重很难在21%的概率和84%的概率之间发生改变。

    对风险的表述方式不同,所做决策可能截然相反

    顺畅性、生动性以及想象的轻松程度等因素会影响决策权重,这个观点已得到许多其他观察实验的支持。一个著名的实验要求受试者从两个罐子中选一个,从里面拿球,若拿到红球,则有奖励:

    A罐中有10个球,其中有1个是红色的。

    B罐中有100个球,其中有8个是红色的。

    你会选哪个罐子呢?因为选A罐的胜算是10%,选B罐是8%,所以作出正确选择应该不难,但实际并非如此:大约有30%~40%的学生选择了红球数量较多的那个罐子,而不是胜算率高的那一个。希莫·爱泼斯坦(Seymour Epstein)说,这个结果说明的是系统1(他称为经验系统)表面的运作特点。

    正如你可能想到的那样,人们在这种情况下作出的愚蠢选择已经引起众多研究者的关注。他们对这种偏见也有不同的命名,而我使用的是保罗。斯洛维克的命名“分母忽视”。如果你将注意力集中在能使你胜利的球上,就不会去关注那些不能使你赢的球。生动的画面也是产生分母忽视的原因,至少我有过这样的经历。当我想到小罐子时,我看到的是一个小红球在一片白色的背景中;当我想到大罐子时,我看到的是8个红球在一堆白球当中,这样的画面增强了我对胜利的信心。能使我胜利的生动画面增强了我对那个事件的决策权重,增强了可能性效应。当然,对确定性效应来说也是同样原理。如果我有90%的概率赢得奖品,那么相较于10个球中有一种“不能制胜”的情况而言,100个球中那10个“不能制胜”的球更会突出输的可能性。

    分母忽视这个观点有助于解释为什么不同的风险表达方式所造成的效果会有这么大的不同。如果你看到“能使儿童免受某种疾病侵袭的疫苗有0.001%的风险将导致终身瘫痪”这样的说法时,就会觉得这个风险看似很小。现在,请考虑用另外的方式描述这一风险:“在10万名接种疫苗的儿童中,有一个将会终身瘫痪。”第二种说法使你产生了一些第一个说法不会引起的想法:它唤起了某个儿童因接种疫苗而终身瘫痪的画面;而另外99999名安全接种疫苗的儿童则被完全忽视了。正如分母忽视原则预测的那样,与抽象术语相比,例如“风险”或是“概率”(多大可能),用相对频率(有多少)来描述会使小概率事件得到更大的权重。我们已经知道系统1更善于处理独立事件,而不是整个范畴的事件。

    频率格式(frequency format)的影响很大。在一项研究中,看到“每10 000个人中有1 286人因某种疾病而死亡“的人比看到”某种疾病导致24.14%的人口死亡“的人更有可能认为此疾病的危害性很大。尽管患第一种疾病的风险只是第二种的一半,但第一种却看似比第二种更危险!在一个更为直接的分母忽视的例子中,某种疾病会“使100人中的24.4人死亡”,与之相比,“每10 000人中有1 286人因某种疾病而死亡“这种说法听上去更危险。若要求受试者对这两种表述作一个直接的对比(系统2肯定会参与到这个任务当中),这种效果肯定会削弱或是消除。然而,生活就像是受试者的组间实验,你一次只能看到一种表述。系统2只有在格外活跃的情况下才会对你看到的那个说法有另外的表述,才会发现这些说法能引发不同的回应。

    有经验的法庭心理学家和精神病学家也不能避免因对风险的不同表述而带来的影响。在一个实验中,有关专业人员需评估让一位精神病患者出院的安全性。这个精神病患者叫琼斯,有暴力倾向。他们收到的信息包括某位专家对风险的评估,但同样的统计数据是用两种方式表述出来的:

    评估那些与琼斯类似的病人,专家发现他们在出院后最初的几个月里对他人使用暴力的概率是10%。在100个类似琼斯的病人中,大约有10个人在出院后的前几个月里对他人使用暴力。

    看到第一种描述的专业人员让病人出院的概率几乎是看到第二种描述的专业人员的2倍(概率分别为41%和21%)。对相同的可能性,更加生动的描述产生了更高的决策权重。

    不同的表述使人们做出不同的决策,使他们对该怎么做生成不同的意见。斯洛维克与他的同事引用了某篇文章的一段话:“一年之中,全美有接近1 000起谋杀事件是由没有服用药物的严重精神病患者制造的。“有一种表达同一事实的说法是”每年每2.73亿美国人中,有1000人是被精神病患者杀死的“。另外一种说法是,”每年,(我们)被这样(患有精神病)的人杀死的概率接近0.000 36%“。还有一种说法是:”每年死于严重精神病患者之手的美国人有1 000人,比自杀人数的1/30还少,是因喉癌而死亡的人数的1/4左右。“斯洛维克指出,”这些说法使得他们的动机很明显,他们想要通过强调精神病患者的暴力来造成大众恐慌,进而使有关部门增加心理卫生服务业的资金注入“。

    如果一名优秀的律师想要引起法官对DNA证据的怀疑,他不会说,“DNA不匹配的概率是0.1%”,反而会说“1 000起死刑案件中就有一起案件的DNA会出现不匹配”,这样更有可能使法官产生怀疑。听到这个陈述的陪审团会想到坐在他们对面审判室里的人可能会因为错误的DNA证据而被误判。当然,检察官会更偏爱抽象框架,希望陪审团的大脑中充满小数点。

    罕见事件又为何会被人忽视?

    有证据支持下面这个假设:主要注意力和显著性会导致人们过高评估罕见事件的发生概率,也会过高权衡低概率的结果。单纯提及某个事件,通过对其进行生动性以及特有的概率描述模式就会增强其显著性。当然也有例外情况,即人们对某一事件的关注并没有提高它的出现概率:那些含有一个荒谬的论调使你想起它就觉得不可能发生的事件,或是因不能想象结果会怎样而使你认为它根本不会发生的事件都属于此类事件。对显著事件的过高估计或过度权衡这种偏见不是绝对的规则,但其影响却很普遍,也是根深蒂固的。近年来,对“根据经验作出选择”这一课题的研究引起了人们的广泛兴趣,其遵循的原则与前景理论中分析的“根据描述作出选择”的研究原则不同。在一个典型实验中,受试者面前有两个按钮。按下按钮有可能会得到金钱奖赏,也有可能什么都得不到。结果是根据前景理论随机出现的(例如,“有5%的概率赢得12美元”或“有95%的概率赢得1美元”)。这个过程是真正随机的,所以不能保证某位受试者所见的样本完全符合统计设置。这两个按钮的预期值几乎是相当的,其中一个比另一个风险更大、更多变(例如,一个按钮的结果可能是有5%的概率得到10美元,另一个按钮则是有50%的概率得到1美元)。通过为受试者提供多次按按钮的机会,使她可以观察到一次又一次按按钮后的结果,这样她就能够凭经验作出选择。通过描述性文字作选择可通过给受试者提供关于每个按钮的预期风险的文字描述(例如“5%的概率赢得12美元”),并让她选择其中一个来实现。根据前景理论可知,通过描述性文字作选择会产生可能性效应—低概率结果的可能性被过高权衡。与之形成鲜明对比的是,凭经验作选择不会出现过高权衡的情况,而较低权衡的情况却较为普遍。

    凭经验作选择的实验情景旨在代表许多情境,在这些情境中,我们会接触到来源相同结果却各不相同的许多情况。一间较普通的餐厅会偶尔做出一道超级美味或很难吃的菜。你的朋友通常很好相处,但有时也会变得喜怒无常、咄咄逼人。加州容易发生地震,但实际却很少发生。许多实验的结果表明,当我们做类似于选择餐厅或是固定好水壶以应对地震这样的决策时,罕见事件不会被过高权衡。

    现在仍然没有能够阐释凭经验选择的方法,但无论在实验中还是在现实世界里,大家都普遍认同一点,即对罕见事件的决策权重较低有一个绝对主要的原因:许多受试者从未经历过罕见事件!大多数加州的市民从未体验过大地震,2007年时也没有银行家切身经历过大规模的金融危机。拉尔夫·赫特维希(Ralph Hertwig)和伊多·伊雷夫(Ido Erev)注意到“根据它们的主观可能性,罕见事件的概率(例如房贷泡沫破灭)受到的影响比它们应得的影响更小”。他们指出,公众对长期威胁的回应很冷淡就是这样一个例子。

    这些关于忽略的例子很重要,也很好解释,但当人们真正经历罕见事件时,低权重的情况也会出现。假设你有一个复杂的问题,与你同楼层的两个同事可能会回答这个问题。你认识他们俩很多年了,也有很多机会观察或是在接触中了解他们的个性。阿黛尔做事持之以恒,也乐于助人,尽管有时也帮倒忙;布莱恩并不特别友好,和阿黛尔一样爱帮助人,但有时候又表现得过于热情。你会找谁帮忙?

    考虑关于这个决定两个可能的观点:

    ·你在两种风险中作出选择。阿黛尔更可靠;对布莱恩的期望更可能会导致一个稍逊一筹的结果,产生好的结果的概率较小。罕见事件可能会因为可能性效应而被过高权衡,所以最好选布莱恩。

    ·你在对阿黛尔的总体印象和对布莱恩的总体印象之间作出选择。你与他们之间或好或坏的经历都会影响你对他们日常行为的看法。除非这个罕见事件非常极端,你才单独想起了这件事(布莱恩曾有一次辱骂了向他求助的同事),因而标准会偏向于典型事例及最近发生的事,所以该选阿黛尔。

    在一个双系统的大脑里,第二种阐述似乎更为合理。系统1产生了对阿黛尔和布莱恩的总体印象,包括对他们的情感态度以及靠近或是回避他们的倾向。你的选择就取决于对这些倾向的比较。除非你明确地想到了某个罕见事件,否则就不会出现过高权衡。将相同观点应用到凭经验选择上很简单。因为他们对结果有长时间的观察,这两个按钮似乎也形成了情感回应所依附的综合“人格”。

    与前景理论刚被廓清之时相比,现在我们可以更好地了解罕见事件被忽视或是被过高权衡的情况了。由于记忆存在证实偏差,罕见事件的概率会(经常但不总是)被高估。当想起某个事件时,你会尽可能地将其视为真实的。当某个罕见事件特别吸引你的注意力时,这个事件就会被过高权衡。当前景得到明确描述时(例如“有99%的概率赢得1 000美元,1%的概率什么也得不到”),注意力就一定会分散。过多关注(耶路撒冷的大巴)、生动的画面(玫瑰花)、具体的表述(1 000中的1个),以及明确的提醒(以描述为基础作出选择)都是引起过高权衡的原因。没有过高权衡,就会存在忽视。就罕见事件而言,我们的大脑并不能总是作出正确判断。碰上一些任何人都未曾经历过的事情,这可不是什么好消息。

    示例—罕见事件“即使在日本,海啸也很少发生,但是海啸在我们头脑中的画面非常生动形象,游客也因此会高估海啸发生的可能性。”“这是我们都熟悉的灾难循环,即先是言过其实,之后作出过高权衡,最后忽视此事件。”“我们不应该将注意力集中在单一情境中,否则我们会高估它的可能性。想想其他的选择吧,然后将所有选择的概率相加,得到100%。““他们想让人们意识到风险是存在的。这也就是他们会使用‘每1 000人中有1人死亡’这个说法的原因,这种做法利用了分母忽视效应。”第31章 能带来长远收益的风险政策

    设想你需要做下列两组决策。首先查看全部决策,然后作出选择。

    决策(1):从A、B中作出选择:

    A.肯定能赚到240美元

    B.有25%的概率得到1 000美元,75%的概率什么也得不到

    决策(2):从C、D中作出选择:

    C.肯定会损失750美元

    D.有75%的概率损失1 000美元,25%的概率没有损失

    这一对选择题在前景理论的发展历程中有着重要的地位,它们使我们重新理解了理性的含义。看到这两个问题时,你对确定事件(A和C)的第一反应肯定是被A吸引,排斥C。对“肯定获得”和“肯定损失”的情感评估是系统1的自动反应,肯定会发生在估计两种风险的预期值(分别为获得250美元和损失750美元)之前,因为这样的估计需要付出更多努力(作更多选择)。大多数人的选择都与系统1的预测一致,绝大多数人都会选A不选B,选D不选C。在其他一些可能性中等或较大的选项出现时也一样,人们在收益状态下更倾向于规避损失,在亏损状态下更倾向于承担风险。我与阿莫斯所做的实验的结果是,有73%的受试者在决策(1)中选了A,在决策(2)中选了D,只有3%的人选择了B、C选项。

    按照要求,你在首次作出选择后要再次查看所有选项,你可能也这样做了,但有一件事你肯定没有做,即你没有估计4种不同选项组合的可能结果(A和C,A和D,B和C,B和D),以推测哪一种组合是你最想选的。直觉上,你只会分别考虑这两个问题,分开选择,并且不会觉得这样做比较麻烦。此外,综合考虑两个决策性问题需要费些劲儿,你可能需要笔和纸才能完成。所以,你并没有这样做。现在,请思考下面的选项问题:

    AD. 25%的概率获得240美元,75%的概率损失760美元

    BC. 25%的概率获得250美元,75%的概率损失750美元

    这个问题很容易!BC选项明显比AD选项更“占优势”(某个选项明显优于其他选项时使用的专业术语)。你已经知道我接下来要说什么了吧?在第一组决策问题中有压倒性优势的选项AD(在第二个决策问题中)是不被看好的那两个,只有3%的受试者一开始就选择了它们,而现在却有73%的受试者选择(上次)概率不理想的选项BC。

    宽框架还是窄框架?

    这些选择题使我们意识到人类理性的局限性。这些选项首先让我们了解到人类偏好的逻辑一致性—无论人们偏好的是什么,甚至是永远到达不了的海市蜃楼。再看一下最后那个简单的问题,你是否曾想过将这个答案明显的问题进行分解之后,会有很多人选择比较不理想的选项呢?每个有关得失的简单问题都可以通过无数方法分解为选项组合,而分解后的选择很可能和最初的选择不一致。一般来说,这是个事实。

    这个例子还说明处于收益状态时规避损失、处于亏损状态时承担风险是需要付出代价的。这些态度会使你不愿冒险,而愿付出额外的费用去得到肯定可获得的赢利,还会使你愿意付出额外费用(包含在预期价值中)以避免肯定的亏损。两种情况下付出的这些钱来源都一样,在同时面临这两种问题时,你的矛盾态度就不会很乐观。

    决策(1)和决策(2)有两种解释方式:

    ·窄框架:分别思考两个简单的决策问题。

    ·宽框架:一个有4个选项的综合决策问题。

    在这个例子中,选择宽框架明显更好。的确,在任何情况下,将多种决策综合考虑都会更有优势。假设同时考虑5个简单的(二选一)决策问题。宽(综合)框架需要考虑的是包含32个选项的综合选择,窄框架需要考虑的则是一连串5个简单的选择。5个连续的选择会是宽框架中32个选择的一部分。利用宽框架是最好的做法吗?有可能,但人们却不太可能这样做。一个理性的经纪人当然会利用宽框架进行考虑,但人们天生喜欢用的却是窄框架。

    这个例子说明,我们有限的大脑很难达到逻辑一致性的理想状态,因为我们易受眼见即为事实原则的影响,不愿动脑筋。另外,即使有人告诉我们应该综合考虑问题,我们自己还是倾向于在问题刚出现的时候立刻做出决策。我们既没有意愿也没有精力去增强偏好的一致性,我们的偏好也不会自动变得一致,它们处于理性代理模式。

    聪明的投资者不会每天都看股票行情表

    保罗·萨缪尔森是20世纪著名的经济学家。他曾问过他的某个朋友是否愿意玩一个抛硬币的游戏,玩这个游戏可能会损失100美元,也可能会获得200美元。他的朋友答道:“我不会接受,因为我觉得获得200美元的满足感无法抵消我损失100美元的痛苦。但如果你保证将硬币抛100次的话,我就和你玩这个游戏。“除非你是决策理论家,否则,你就不会有萨缪尔森的朋友的那种直觉:反复打一个有趣却也有风险的赌可以降低主观风险。萨缪尔森觉得他朋友的回答很有意思,便继续进行分析。他证明,在一些特定情况下,最注重效用的人拒绝了一次赌局,也会拒绝多次。

    值得注意的是,萨缪尔森的证明虽然是有效的,但这个证明引出的结论却有违常识—打100次赌当然是个吸引人的提议,心智正常的人都不会拒绝—可他本人似乎并没有意识到这个事实。马修·拉宾(Matthew Rabin)和理查德·泰勒指出,“在100个赌局中,输100美元和得200美元的比率是50 ∶50,因此,期望回报是5 000美元。另外,只有1/2 300的概率会输钱,会输掉超过1 000美元的钱的概率仅为1/62 000“。当然,他们想要说明的是,如果效用理论在任何情况下都与如此愚蠢的偏好相一致的话,这个理性选择模式肯定出什么问题了。拉宾对一些小额赌注严重的规避损失做法的荒谬结果进行了证明,但萨缪尔森没有看到这些证明,即便他看到过也不会感到惊讶。他甚至很愿意考虑很有可能被理性的人拒绝的交易的发生概率,这一意愿证实了理性模式的强大影响力。

    假设用非常简单的价值函数来描述萨缪尔森的朋友(我们称之为山姆)的偏好。为了表明自己规避损失的程度,山姆首先改变了赌注,将亏损金额改为原来的2倍。然后,他开始计算这个改变后的赌局的预期值。下面是他抛一次、两次、三次硬币的结果。做这些工作肯定需要极为专注。

     [image file=Image00016.jpg]

    从上表中可以得知,这个赌注的预期值是50。然而第一次掷硬币对山姆来说毫无价值,因为他感到输掉1美元的痛苦程度是赢得1美元的满足程度的2倍。改变赌注来体现自己的损失厌恶之后,山姆就会发现这个赌局的价值为零。

    现在,请考虑抛两次硬币的情况。输钱的概率降低到25%。两个极端结果(损失200美元或赢得400美元)在价值上相互抵消,它们的概率相同,且输的痛苦程度是赢的满足程度的2倍。但中间结果(一次输,一次赢)是积极的,所以抛两次硬币可以视为赌一次。现在,你就能看到窄框架的成本和多次打赌的奇妙之处了。当山姆分开来看的时候,就会认为它们毫无价值。如果在不同的场合中分别问他是否愿意打这两个赌,他都会拒绝。然而,当它们同时出现时,它们的共同价值就是50美元!

    若抛3次硬币的话,这个赌局就更有利了。极端结果仍然相互抵消,而且也不那么重要了。第三次抛硬币,尽管单独来看没什么价值,但却为整个赌注增加了62.5美元的价值。当山姆打的赌变为抛5次硬币时,这个赌局的期望价值就会是250美元,而山姆输钱的可能性是18.75%,他的现金等价物是203.125美元。这个例子中值得注意的一点是山姆的损失厌恶度从未改变过。然而,随着抛硬币次数的增多,输的可能性很快就降低了,损失厌恶对其偏好的影响也就相应减弱了。

    现在,如果山姆拒绝只赌一次的话,我已经准备好了一套说辞。如果你和山姆一样,也有不合理的损失厌恶的话,这套说辞也同样适用于你:

    我理解你对赌输的反感情绪,但这种情绪会让你损失很多钱。请考虑一下这个问题:你已经活不长了吗?这是你这辈子需要考虑的最后一个小赌注吗?当然,你不太可能再碰到和这个完全一样的赌局,但你会有很多机会碰到吸引人但赌注相对你的财产来说很小的赌局。如果你能将这些赌局看做一个整体的一部分,并重复念咒语:有赚有赔。这样,你在经济上就会更理性,也能在无形中帮自己赚到一大笔钱。那句咒语的主要目的是在你输的时候帮助你控制你的情感反应。如果你相信自己这样做是有效的,在你在决定是否该承担某个有正面预期值的小风险时,就应该用这句咒语提醒自己。在说这句咒语时,还需记住以下几个条件:

    ·当所有赌局都真正相互独立时,它才适用;它不适用于同一行业的多种投资,因为这些投资可能会同时遭遇失败。

    ·只有在可能的损失不会使你的全部资产处于危险时它才有效。如果你不想某一次损失成为影响你经济前景的重要阻碍的话,就请注意!

    ·若一个赌局中每次下注赢的可能性都非常小,就不该将咒语用在这个风险大的赌注上。

    如果你有这条规则所要求的情绪戒律,就永远不会孤立地考虑一个小的赌注,或是在小的赌注上规避损失,直到你快要进入棺材的那一刻(或许在那个时候还是不会这样做)。

    遵循这条建议不是没有可能的。金融市场中有经验的交易者每天都以此建议为生,他们通过宽框架来减轻亏损带来的痛苦。正如书中已提及的那样,我们知道可以通过引导受试者“像商人那样思考”,使他们不去规避损失,这就正如有经验的棒球卡商人不会像新手那样受到禀赋效应的影响一样。学生在不同的指导下可能会做出有风险的决策(接受或拒绝他们有可能会输掉的赌局)。在窄框架的情况下,他们被告知在做决策时应该“将每一个决策都当做你唯一需要做的决策”,并且要体会这些决策带给自己的情绪反应。在宽框架的情况下做决策的建议,包括“将自己想象为商人”,“你总是做这样的事”,以及“将它看做众多财政决策中的一个,这样一个决策会在将来一起被并入‘证券投资组合’中”。实验者通过心理学方法评估了受试者对盈与亏的情绪反应,方法包括测谎时用的测试皮肤电导率等。正如人们期望的那样,宽框架缓解了人们对损失的情绪反应,增强了他们承担风险的意愿。

    损失厌恶和窄框架的结合是一个代价更大的祸端。个人投资者可以通过降低查看自己投资结果的频率来避免这一祸端,并在获得宽框架带来的情感收益的同时节约时间、减轻痛苦。时刻关注每日的经济波动是种亏本的对策,因为频繁的低额损失带来的痛苦比同样频率的低额收益带来的快乐程度更为强烈。一个季度查看一次就足够了,对于个人投资者来说,这样的频率还要高一些。刻意避免查看短期结果,除了可使投资者的心情更为愉快以外,还可以提升决策和结果的品质。对坏消息典型的短期反应就是加剧损失厌恶。查看总体反馈的投资者很少能得到类似的坏消息,就更有可能不规避损失,结果也会赚得更多。如果你不知道每只股票每天(每周甚至每月)的情况,也就不会对你的证券投资组合进行无效的变动。在几个周期内都不改变某个投资的承诺(“锁定”投资的相同说法)可以改善财务状况。

    风险政策可以抵消风险厌恶的偏见

    善于使用窄框架的决策制定者在每次面临风险决策时都会带有偏见。每当相关问题出现时,他们就会使用风险政策,而风险政策确实可以改善他们的表现。我们熟悉的风险政策有“在买保险时,总是选择最高的免赔额”以及“绝不要买延长保险”等。风险政策是一种宽框架。在保险的例子中,你期望偶尔的损失是完全免额的,或是无保险产品损坏的频率别太高。与之相关的问题是,你设想自己接触的这个风险政策从长远来看肯定会为你带来收益,而你减少或是消除偶尔的损失所引起的痛苦的能力如何呢?

    风险政策与我前面提到的外部意见类同。外部意见将注意力从当前情境的特性转移到类似情境结果的数据上。外部意见是思考计划的宽框架。风险政策在一组类似的选项中嵌入了一个特别有风险的选项,也利用了宽框架。

    外部意见和风险政策是补救两种不同偏见的方法,而这两种偏见会影响许多决策的制定:规划谬误中的过度乐观以及损失厌恶中的过度谨慎。这两种偏见相互对立。过度乐观使个人和组织免于损失厌恶的不好影响;损失厌恶使人们不会产生过度自信的乐观主义。这样的结果对于决策制定者来说是有益的。乐观主义者认为他们做决策时比在实际情况下更为谨慎,而损失厌恶者则会正确地拒绝危险的提议(在没有外部意见的情况下,他们是可能接受这些提议的)。当然,我们不能保证这些偏见会在所有情况下都相互抵消。能够同时消除过度乐观以及过度规避风险的机构应该采取这种做法,将外部意见与风险政策结合来考虑应该可以实现其目的。

    理查德·泰勒曾与一家大型企业的25名部门总经理进行过有关决策制定的讨论。他请他们考虑一个有风险的选择,作这一选择,他们可能赔掉自己的大量资金或是使那笔资金翻倍,其中赔和赢的可能性是相当的。没有一位经理愿意接受这个如此大风险的赌局。泰勒又询问了这家企业执行总裁的意见,他当时也在场。这个执行总裁毫不犹豫地回答道:“我想要他们所有人都冒险。”在这个谈话的情境之下,这位执行总裁很自然地采用了宽框架,这个框架综合权衡了所有25个赌注。就像面对100次抛硬币机会的山姆一样,这位总裁可以依靠统计结果来使整体风险降低。

    示例—风险政策“告诉她应该像商人那样思考!有赚,当然也有赔。”“我决定每个季度查看一次我的证券投资组合。我总是选择规避损失,因此在面对每天价格波动的情况下总是不能做出理性的决策。”“他们从不买延长保险,这是他们的风险政策。”“我们公司每个部门经理在其所在领域都采取损失厌恶的做法。这很正常,但造成的后果是,这个机构不敢冒险。”第32章 心理账户是如何影响我们的选择的?

    除了那些非常穷、要靠收入来养家糊口的人以外,绝大多数人赚钱都未必是出于经济动机。亿万富翁再赚几亿美元不是出于经济原因,实验经济学项目的参与者获取额外的赞助也不是出于经济原因,钱是衡量一个人自身利益与自我成就感的标尺。

    奖励与惩罚、承诺与威胁,都在我们的脑中,我们谨慎地将其记录下来。这些因素如同社会环境中的诱因一样影响着我们的偏向,激发我们的行为。于是,我们拒绝减少损失,因为有时这样做就相当于承认失败;我们对可能使人后悔的行动存有偏见;我们虽然不能界定对玩忽职守和拿人钱财之间的区别,却也能够将两者区分开来;我们不会不停地做事,因为责任感总是因人而异的。奖励和惩罚带来的最终价值通常会使人有情绪反应,这是一种精神上的自我交易,而当个人成为某个机构的代理人时,就不可避免地会与该机构发生利益冲突。

    你会卖掉赢利的股票还是亏损的股票?

    理查德·泰勒多年来一直对会计行业与心理账户的类似之处很感兴趣。心理账户是我们用于组织和经营生活的账户,它有弊也有利,并且有多种来源。现实生活中,我们可能会将自己的钱存在不同的银行账户里,而有时我们仅仅是将钱存在了不同的心理账户中。我们有零用钱和普通存款,也有支付孩子教育费用或急诊的预留存款。该用哪些存款来满足现在的资金需求,我们有明确的先后顺序。就像为家庭开支作预算、限制每天喝黑咖啡的数量或是增加锻炼时间一样,存款也是为了自我控制。通常我们会为了自我控制而付出代价,例如,一面把钱存入储蓄账户,一面却透支信用卡。理性代理模式下的经济人并不依赖心理账户:他们对结果的看法是经过综合分析得来的,是受外部诱因驱使的。对于人类来说,心理账户是窄框架的一种形式;他们通过有限的大脑使所有事情都得到掌控,易于管理。

    心理账户在记录得分上应用广泛。回想职业高尔夫球手在避免击出超过标准杆的球而不是小鸟球时,往往打得更出色。我们可以得出的结论是,优秀的高尔夫球手会为球场上的每个球洞都创立账户,他们不会将整体的成功押在唯一的账户上。泰勒在此前的一篇文章中阐述的一个颇具讽刺意义的例子就很好地说明了心理账户是怎样影响行为的:

    两个狂热的球迷计划到离他们约64公里远的地方看篮球赛。其中一个人买了门票;另一个人在买票的途中遇见了一个朋友,免费得到了票。现在,有预报称比赛当晚会有暴风雪。这两位持票的球迷谁会更愿意冒着暴风雪去看比赛?

    答案很明显,我们知道买了票的那个球迷更有可能会去。心理账户也为此提供了解释。假设两个球迷都为这场比赛开设了账户,而错过比赛就是在负差额(逆差)的情况下关闭了这两个账户。那么无论是怎样得到门票的,他们都会很失望。但是,关闭账户对于买票的那个人来说影响更为消极,因为现在他的钱没有了,还不能看比赛。对这个人而言,待在家里是个更糟糕的选择,所以他更愿意去看比赛,也就更可能会冒着暴风雪开车去看比赛。这是系统1自动对情绪平衡作出的内在分析。在标准的经济学理论中,人们由心理账户引发的情绪并没有得到普遍认可。经济人可能会意识到这张票已经付了钱,而且已经不能退换。票的成本已经“沉没”了,这位经济人不会再在意这张球赛门票是自己买的还是朋友赠的(如果该行为人有朋友的话)。想要实施这个理性行为,系统2应该会考虑反事实的(指在不同条件下有可能发生但违反现存事实的)可能性:“如果我的票是从朋友那儿得来的,我还会冒着暴风雪驾车吗?”但只有积极的、受过相关训练的大脑才会想到提出这样的难题。

    当个人投资者将他们的证券投资组合中的一些股票卖掉时,犯一个错误也会使他们痛苦不堪:

    你需要钱来操办女儿的婚礼,所以想卖掉一些股票。你记得自己每一只股票的买进价,也能分辨出某只股票是“赢利股”(即当前价值高于你的买进价的股票),或是亏损股。在你所有的股票中,蓝莓牌瓷砖是一只赢利股;如果你在今天将其售出,就会得到5000美元的收益。你持有蒂芙尼电机相同的股份,现值是5000美元,但低于你的买进价格。你更有可能出售哪一只股票?

    作出这个选择的可行方法是:“我会关闭蓝莓牌瓷砖股票账户,记录下一笔成功的投资。或者,我可以关闭蒂芙尼电机股票账户并记下失败的一笔。我更愿意怎么做?”如果将这个问题看做是在给你带来的快乐和给你造成的痛苦中作选择,你肯定会卖掉蓝莓牌瓷砖,以享受成功投资的乐趣。可以预料,金融研究中已经记录了大量人们售出自己的赢利股、保留亏损股的偏好—这被视为一种偏见,关于此还有一个晦涩难懂的名字:处置效应。

    处置效应是窄框架的一个例子。投资者为她买的每一只股票都开设了账户,并想在关闭每一个账户时都能获利。理性的代理人会对证券投资组合有一个整体的看法,会售出最无可能在未来赢利的股票,而不是去考虑它是赢利股还是亏损股。阿莫斯跟我说了他与一名财务顾问的谈话。这名顾问询问阿莫斯他的证券投资组合中所有股票的相关信息,包括每只股票的买入价格。当时阿莫斯温和地问:“难道这个问题很要紧吗?”这个顾问当时看起来非常吃惊,他显然一直认为心理账户的状态是值得考虑的因素。

    阿莫斯对这个财务顾问的观念的猜测可能是对的,但他将买入价视为无关紧要的却是错误的。即使对经济人来说,买入价也很重要,应该将其考虑在内。处置效应是需要付出代价的偏见,因为对于售出赢利股还是亏损股这个问题,答案很明确,但并不是说选择卖哪只股票都无关紧要。如果你在意的是自己的财富,而不是直观感受,就会售出蒂芙尼电机这只亏损股,保留蓝莓牌瓷砖这只赢利股。至少在美国,税收能给人很大的刺激:你会意识到,卖掉亏损股可以减免税赋,而卖掉赢利股就必须得纳税。全美国的投资者都知道这个金融方面的基本事实,这个事实还决定了他们所做的一个决策—投资者会在12月卖掉更多的亏损股,因为这个月的税赋一直令他们忧心忡忡。一年中每个月都有税收优惠,但是在其他11个月份中,心理账户在人们心中的分量都重于金融常识。另一个反对出售赢利股的论据是对市场反常现象的详细记录,即最近升值的股票有可能还会继续升值至少一小段时间。这个净效应很大:预计卖掉蒂芙尼股而非蓝莓股的税后额外回报率在第二年是3.4%。在赢利的情况下关闭心理账户会令人心情愉悦,但这种愉悦是你花钱买来的。一个经济人不会犯这样的错误,在这一点上,那些运用系统2的经验丰富的投资者比新手更容易犯这种错误。

    理性的决策者只会对当前投资的未来结果感兴趣,经济人不会去考虑纠正先前的错误。当有更好的投资项目时,对亏损账户进行额外投资的决策被称为“沉没成本悖论”,这是一个代价高昂的错误决策,在大大小小的许多决策中都能看到其身影。由于买了门票而冒着暴风雪开车去看演出就是一种沉没成本悖论。

    设想一家公司已经在某个项目中投入了5000万美元。现在,这个项目误了工期,其最终回报的预计收益也没有最初计划的那样好。如果想要实现这个项目的最初目标,则需要6000万美元的额外投资。另一个提议是将同样的资金投入到一个新的项目中,且这个项目似乎可以带来更高的回报。这家公司会怎么做呢?通常的情况是,像冒着暴风雪开车那样,受到沉没成本影响的公司会继续将钱砸在那个不好的项目上,因为关闭这个项目的账户就相当于承认自己的失败,这是一种耻辱。这个情景属于四重模式中右上角那一栏的情况:在这种情况下,我们需要在必然的损失和不利的风险中作出选择,这样做通常是不明智的。

    从公司的角度来看,向失败的尝试增加投入是个错误做法,但对“拥有”这个前景并不明朗的项目的高管来说,却未必如此。撤销这个项目会给这个高管的履历上留下难以抹掉的污点,只能依靠该组织的资源再赌一把才能最大限度地保住个人利益,才有希望收回投资成本—至少可以尝试着延长清算日期。在沉没成本的状态下,高管的动机与公司的目标以及股东的利益都会不一致,这就是我们所说的代理问题中常见的类型。董事会非常清楚这样的冲突,所以当某位执行总裁因受困于先前的决策影响而不愿避免再造成损失的话,董事会就会将其替换掉。董事会成员不见得认为新的执行总裁比原先的更有能力,但他们知道新的总裁不会有与原总裁一样的心理账户,在评估当前机会的选择时,他也就更容易忽视过去投资的沉没成本。

    沉没成本悖论导致人们在不被看好的事情上浪费了太多时间,例如不幸福的婚姻、没有希望的研究项目等。我常注意到,一些年轻的科学家宁愿苦苦挣扎于注定会失败的项目,也不会选择放弃,重新开始。不过,好在有研究表明这样的悖论至少在某些情况下是可以克服的。在经济学和商贸学的课堂上,沉没成本悖论也被视为一种错误理论。这样做显然会产生积极影响,有证据表明,这些领域的毕业生比其他人更有可能放弃会失败的项目。

    哪种选择会让你更后悔?

    后悔是一种情绪,也是一种自我惩罚。人们做出的许多决策都是因为不想后悔(“不要这样做,否则你会后悔的”是个非常常见的警告),现实生活中我们也有很多后悔的事。有两位荷兰的心理学家对这种情绪状态作了很好的描述,他们注意到,后悔“总是与一个人本该更加了解的情感、不祥的预感以及对做错的事或失去的机会念念不忘等情绪形影相随,与严厉自责和改正错误的倾向形影相随,与‘此事如果没有发生该多好’或是‘如果再有一次机会该多好’之类的想法形影相随”。当你想象自己正在做某事而不是在想曾经做过的事情时,就会感到强烈的悔意。

    后悔是由替代现实的可用性引发的反事实情绪。每架飞机失事后,都会有关于一些乘客“本不应该”在那架飞机上的特别报道—他们有的是在最后几秒才订到的位子,有的是从另一条航线转机过来的,还有的理应早飞一天,但不幸延迟了才上了这架飞机。这些令人痛苦的事例有个共同特点,即它们都属于反常规事件。与正常事件相比,人们更容易凭想象搞砸这些反常规事件。联想机制包含了正常世界的典型及其规则。反常规事件会吸引人的注意力,还会使人们认为在相同情况下这些事件也应该是正常的。

    为了理解后悔与常态的关系,请思考下列情境:

    布朗先生几乎从不让旅行者搭便车。昨天他让一个男人搭了便车,然后他被抢了。
    史密斯先生经常让旅行者搭便车。昨天他让一个男人搭了便车,然后他被抢了。
    这两个人谁更可能感到后悔?

    答案不出我们所料:有88%的受试者认为布朗先生会更后悔,12%的受试者认为是史密斯先生。

    后悔与责备并不是一回事。实验人员问了其他受试者与上述事件相关的一个问题:
    谁会受到他人更严厉的责备?
    结果是:认为是布朗先生的占23%,认为是史密斯先生的占77%。

    与常态的对比可引起后悔和责备,但相关的常态是不相同的。布朗先生和史密斯先生体验到的情绪主要是由他们平时对待旅行者的方式决定的。让旅行者搭便车对于布朗先生来说是一件反常规事情,因此,大多数人认为他会更后悔。然而,带有批判性的观察者会将这两个人的行为与合理行为的传统常态相比较,更可能会批评史密斯先生,因为他总是习惯性地承担这种不可预知的风险。我们会忍不住说,史密斯先生是自食其果,布朗先生是走了霉运。但布朗先生更应被指责,因为他在这件事上的做法与他平时的性格不符。

    决策制定者容易感到后悔,而痛苦的情绪则对很多的决策制定都有影响。后悔的直觉非常一致,而且还很明显,下面这个例子就说明了这一点。

    保罗在A公司持有股份。在过去一年里,他想要将股份转移到B公司,但最终决定还是不那样做。现在,他了解到,如果他当时将股份转到了B公司的话,可以多赚1200美元。

    乔治在B公司持有股份。在过去一年里,他将股份转移到了A公司。现在,他了解到,如果他当时坚持保留B公司股份的话,可以多赚1200美元。

    谁会更后悔呢?

    结果很明显:8%的受试者说是保罗,92%的受试者说是乔治。

    这很令人好奇,因为从客观上来说,这两位投资者的情况是一样的。他们现在都拥有A股,而且如果拥有B股可多赚同样多的钱。唯一的区别在于,乔治没能赚更多钱是因为他采取了行动,而保罗则是因为没有采取行动。这个小事例说明了一个大道理:人们对由于不采取行动而导致的结果,会比因行动而产生的结果有更为强烈的情绪反应(包括后悔)。这个观点在赌博的情境下也得到了证实:人们下注并赢了钱会比其不赌但得到同样多的钱更快乐。这种不对称至少对于损失来说是强烈的,还可用来解释责备和后悔的原因。问题的关键并不在于玩忽职守和拿人钱财的不同,而在于默认选择和偏离默认的行动间的区别。你在偏离了默认情况之时,会很容易联想到常态,想知道默认情况是否会导致糟糕的结果。如果真会这样,那你的偏离和常态就可能成为自己痛苦的来源。当你持有一只股票时,你默认的选择不是卖,但当你早上碰见某个同事时,你默认的选择又变成了同意他的观点,即卖掉股票。出售一只股票与违背你同事意愿都是对默认选择的违背,也都可能让你后悔或招来责骂。

    在一个证明默认选择的影响力的实验中,受试者在计算机上模拟了21点游戏。一些玩家被问道:“你想要拿牌吗?”而另一些人则被问道:“你想要停牌吗?”无论问题是什么,如果结果并不理想的话,说“是”肯定会比说“不”更令人感到后悔。很显然,这个问题表明了一个默认的回答,即“我们有很强的意愿这样做”。另一个默认行动的例子是说球队在决赛中惨败与教练有关。这个教练理应对人员和战术进行调整,但他却没有这样做,因此,他被人责备,他自己也感到后悔。

    后悔的风险是不平衡的,其不平衡性体现在偏向于常规的、厌恶风险的选择这种偏见存在于许多情境中。如果某位顾客在购物时被提醒,他可能就会因为自己的选择而后悔,这名顾客在选择时就会偏向于常规选项,即更看好品牌。接近年末时,财务经理的行为也显示出了预期评估的影响:他们易于清理那些并非传统投资组合或是让人质疑的股票。另外,即使是关乎生死的决策都能被预期的评估所影响。

    设想有个医治重病患者的医生,某个治疗手段是正常且标准的,另一个则是不同寻常的。这个医生有理由相信这个非传统的治疗手段可提高病人的康复概率,但证据不足。使用这个与众不同的治疗手段的医生可能会面对极度的悔恨、严厉的责备,还可能被人起诉。以后见之明来看,医生很容易想到常规的选择,总是希望自己没有作非常规的选择。如果结果是好的,这个敢于冒险的医生就会得到好的名声。这是事实。但是,这种可能的利益小于可能的成本,因为成功通常是比失败更为正常的结果。

    因为害怕将来后悔而作出不理性的选择

    在许多情境中,损失的痛苦是获得的快乐的两倍,例如下赌注、禀赋效应以及对物价变动的反应等。损失厌恶系数在某些情况下会更高。你更容易在生活中比钱更加重要的方面产生损失厌恶,例如健康。另外,当“卖掉”重要的基金可能使你承担可怕的后果时,你会更加不愿卖掉这些基金。理查德。泰勒早期在消费者行为方面的经典实验就用了一个著名的例子,我将这个例子作了细微调整:

    你接触到了一种疾病,感染这种病会使你在一星期内快速且没什么痛苦地死去。得这种病的概率是十分之一。在此病尚未出现任何症状之前,有一种疫苗是有效的。你愿意付多少钱来打这种疫苗?

    大多数人都愿意付钱,但钱不是很多。面对死亡的可能令人不安,但是死亡的概率很低,所以想要躲避死亡而花掉大量积蓄是不合理的。

    现在,请考虑下面这个作了细微调整的例子:

    研究上面这种疾病需要一些志愿者。对志愿者的唯一要求是必须接触这种病,也就是说,你会有十分之一的概率会感染上这种病。那么,要是去做志愿者,你最低要多少钱?(你不能购买疫苗。)

    正如你可能预料的那样,人们当志愿者要的薪水会比他们买疫苗的最高定价高很多。根据泰勒的非正式报告,其常规比率大约是50 ∶1。极高的售价说明了这个问题的两个特点。首先,你不会“出售”健康。这种交易不是合法的,高的定价反映了人们并不愿意参与其中,而可能因此而承担的不好结果或许也是你不愿“出售”健康的最重要因素。如果你在某天早上起床的时候,发现自己有了疾病的症状并将在不久后死去,你就会觉得去当志愿者比起没买疫苗更会令你后悔。因为你本可以拒绝“出售”自己的健康的,甚至是能在完全不考虑可以得多少钱的情况下拒绝。你本来可以坚持自己的默认选择,什么都不做。现在,这种与事实相反的情况会让你的余生都不得安宁。

    前面提到过的关于家长对有潜在危险的杀虫剂的反应也存在着是否愿意冒险的问题。受试者需回想自己正在使用的某种杀虫剂,且这10000瓶杀虫剂里有15瓶可能造成误吸和儿童中毒。另外,还有一种稍便宜的杀虫剂,但其导致中毒的风险也有所增加:10000瓶中有16瓶可使人中毒。实验者问家长,第二种杀虫剂(更不安全)要比第一种便宜多少时,他们才会去买?超过2/3的受试者回应,无论这种新的杀虫剂定价多少,他们都不会买。他们显然反对拿自己孩子的健康做交易。若第二种杀虫剂与第一种的价格差额足够大的话,也有少数人是愿意买的,但愿意接受较小的折扣而买第二种杀虫剂的少数人会要求得到一笔钱,这笔钱比他们愿意为提高产品安全而支付的钱更多。

    任何人都明白也理解,为什么家长不愿为了钱而让孩子承担风险,哪怕只是增加一点风险。值得注意的是,这种态度对于我们想保护的人的安全来说,是不合逻辑且有潜在危害的。即使是最慈爱的父母,他们用来保护自己孩子的时间和金钱也是有限的(保护孩子安全的心理账户预算有限),因此,使这些资源的作用发挥到极致似乎很合理。通过买稍差的杀虫剂可以节约一小笔钱,但会增加孩子中毒的风险。然而,节约的这笔钱却可以更好地用在消除其他威胁孩子健康的事情上,例如买一个更为安全的儿童汽车座椅或是插座罩。禁忌权衡反对任何增加风险的可能,但这并不是利用健康预算的有效方法。事实上,相较于想要保障孩子安全的愿望,这种抗拒可能更多的是出于害怕自己会后悔。任何在考虑后接受了这种交易的家长都会假设,想到杀虫剂带来危害时他们后悔和羞愧的画面。

    人们极度厌恶为得到其他好处而以增加风险为代价的交易,监管风险的法律与规章充分体现了人们的这种厌恶。这种趋势在欧洲特别强劲。在欧洲,防止一切可能造成危害行为的预警原则是一个被普遍接受的学说。在监管的体制下,预警原则将安全检测的全部目标都放在了可能会做出对他人和环境有害行为的人的身上。多个国际组织都已说明,潜在危害的科学证据的缺失并不是承担风险的充分理由。正如法学家卡斯·桑斯坦指出的那样,预警原则代价高,而且对它作严格解读的话,它是经不起考验的。他提到了一连串无法通过预警原则考验的创新发明,包括“飞机、空调、抗生素、汽车、氯气处理、麻疹疫苗、心脏手术、收音机、电冰箱、天花疫苗以及X射线”。强势的预警原则明显是站不住脚的,但加强的风险规避却根植于我们强烈且普遍的道德直觉中,它源于系统1。强烈的风险规避意识与有效的风险管理形成的两难问题,还没有一个简单而又令人信服的解决方案。

    我们花了很多时间预测,并尝试去回避由我们自身造成的情感创伤。我们该怎样对待那些难以捉摸的结果,以及当我们记录自己生活时的那些自我惩罚(或偶尔的奖励)?经济人不应有这些情绪,而这些情绪对于人类来说却代价沉重。这些情绪会导致人们做出损害个人财富、政策力度以及社会福利的行为。后悔情绪与道德责任是真实存在的,没有后悔情绪和道德责任的经济人也许与这样的行为并无关联。

    因为害怕将来后悔而影响了你的选择,这样合理吗?对后悔的预感就像对自己快要昏厥的预感一样,是生活中的事实,并且需要在发现以后作出调整。如果你是位富有又谨慎的投资者,你也许可以支付某个昂贵的投资组合,这个组合即使不能够使你的财富收益达到最大,也可将你可能会感到的后悔程度降至最轻。

    你还可以采取一些预防措施,以防止将来后悔。也许最有效的方法就是做到对可能会后悔的事心中有数。如果你能够在情况变糟糕时,先仔细考虑自己是否会后悔再作决定,那么你将来的遗憾也就可能会更少一些。你应该也知道,后悔总是伴随着后见之明的偏见而来,所以,任何你能做的、防止后见之明的措施都有可能是有益的。我个人躲避后见之明的方法是:在做有长远影响的决策之时,不要太过周密,但也不要完全凭偶然行事。如果你考虑到了一点点,你可能在事后说,“我本可以作出更好的选择”,这种后见之明就更会令你很不甘心。

    丹尼尔·吉尔伯特与他的同事们说,人们预见的后悔感觉往往会比实际体验的程度深,因为他们会低估自己的心理防御能力,即“心理免疫系统”。对此,吉尔伯特和他同事们的建议是,不应该过于关注自己是否会后悔,即使你有些后悔,其令你痛心的程度也绝对会比你想象中的程度轻。

    示例—心理账户“他对现金支付和信用卡支付有不同的心理账户。我不断地提醒他,钱就是钱,并没有多大区别。”“他一直保留着那只股票,只是因为不想在关闭心理账户时处于损失状态。这就是处置效应。““我们在那家餐馆里发现了一道极其美味的菜,因为害怕会后悔,所以我们就不愿意再尝试别的菜了。”“售货员给我看了最贵的儿童汽车座椅,还说它是最安全的,我就不敢买比较便宜的了。这似乎是禁忌权衡在作祟。”

    第33章 评估结果的逆转

    假设,某人走进了附近的一家便利店,里面恰巧发生了抢劫案,他不幸中弹。你认定他是因中弹而导致右臂残疾。你的任务就是给这起抢劫案中的受害者设定赔偿金额。

    此人住所附近有两家商店,其中一家是这个人常去的。请思考以下两种情况:

    ·抢劫案发生在此人常去的那家商店。
    ·此人常去的那家商店的店主要去参加一个葬礼,商店不营业,这个人就去了另一家商店,而就在那家商店里,他中弹了。
    此人中弹的那家商店是否会对此人的赔偿有影响?

    你会通过联合评估对此作出判断,即将两种情况同时考虑在内并进行对比。你可以有自己的一套原则。如果你认为第二种情况会得到更高的赔偿,你就会给这种情况分配更高的美元价值。

    大家都会认同这个答案,即在这两种情况下,赔偿金应该相同。赔偿针对的应该是受害者受到的重创伤害,而抢劫案发生的地点对赔偿会有何影响呢?对这两种情况的联合评估会使你对赔偿过程中的相关情况产生同情。对于大多数情况来说,地点不是相关情况中的一个。在其他需要鲜明对比的情况中,思考较慢,且系统2也参与其中。

    这两种情况最初是由心理学家戴尔·米勒(Dale Miller)和凯茜·麦克法兰(Cathy McFarland)设计的,他们将这两种情况展示给不同的人看,并请他们作出评估。在他们这一跨学科的实验中,每位受试者都只看到了一种情况,并用金钱来衡量这个人的受害程度。他们发现(你肯定也猜到了)如果受害者受伤的商店是他不常去的那家而不是他常去的那家,他得到的赔偿会更多。人们自然会想“要是他去的是常去的那家店就……”正是这种想法引起了心酸这种与事实相反的感觉。系统1的替代和强度匹配机制将用金钱来表达对某件事的情感反应强度,使得金钱价值有了很大的不同。

    两项实验对比鲜明。几乎所有将两种情况放到一起来看(受试者包括在内)的人都同样认为悲痛不是合理的想法这一原则。不幸的是,只有在将两种情况放到一起看时,才能得出这个原则,而现实生活中,这两种情况不可能同时发生。我们通常用受试者组间模式体验生活,在这种模式中,可能会改变你的想法且有鲜明对比的方案并不存在,当然了眼见即为事实。因此,你的道德观不一定能支配你的情感反应,并且从内心角度看,在不同情况下大脑中生成的道德直觉都不是一致的。

    抢劫案中单一评估和联合评估的不一致属于判断和抉择中的逆转。偏好逆转(preference reversals)是在19世纪70年代被首次提出来的,此后几年,其他方面的逆转也相继被提出来。

    开启经济学与心理学的跨界交流

    偏好逆转在心理学家和经济学家间的对话中有着重要的地位。引起注意的逆转是由萨拉。利希滕斯坦和保罗。斯洛维克提出的,他们都是心理学家,在密歇根大学做毕业设计时,他们和阿莫斯是同一届的。他们就赌注的偏好逆转做了项实验,关于此实验,我会做简要说明。

    将有36个格的轮盘转两次,你可以在两个赌注中选择一个。
    赌注A:11/36的概率赢得160美元,25/36的概率损失15美元。
    赌注B:35/36的概率赢得40美元,1/36的概率损失10美元。
    你可以在无风险和有风险的赌注间选择:一个几乎肯定会赢,但赢得不多;另一个是赢的概率小,但可以赢一大笔,还有很大可能会输钱。

    现在请单独考虑每个赌注:如果你是该赌注的持有者,你最低会以多少钱卖掉它?记住,你不是在和别人讨价还价,你的任务是决定你真的愿意放弃这一赌注时,可以接受的最低价钱是多少。你来尝试一下。你可能会发现,在这项任务中,赢得的钱数尤为突出,你对赌注的评估被锚定在了其价值上。A赌注中支撑这一猜想的结论和卖价都要比B赌注的好。这就是偏好逆转,即人们会选择B而不是A。不过,如果他们只能在其中选一个的话,他们会认为A比B有更高的价值。就像是抢劫案中的那种情况,偏好逆转之所以会发生是因为联合评估将注意力集中到了情况的一个方面上,即A赌注没有B更稳妥,而这点在单一评估中则没那么突出。当选择联合评估时,致使单一评估中产生不同观点判断的特征就会受到克制或认为不相关,这种特征包括第一个例子中走错商店的受害者的悲痛和第二个例子中锚定奖品的心酸。系统1的情绪反应很可能会决定单一评估;而联合评估中出现的对比也常需要更仔细、更需要付出努力的评估,这其中需要系统2的参与。

    偏好逆转可在受试者间(within-subject)的实验中得到证实。在这个实验中,受试者对很多商品作出两套定价并从中作出选择。受试者都没有意识到自己选择时的不一致性,而且在面对这种不一致性时,他们的反应很好笑。1968年,萨拉·利希滕斯坦曾采访该实验中的一名受试者,这次采访堪称业界经久不衰的经典。萨拉和这个困惑的受试者(该受试者后来又愿意花一笔钱放弃自己刚选择的赌注,选择自己刚放弃的赌注,而且他多次改变主意)进行了详细的交谈。

    理性的经济人当然不易受偏好逆转的影响,因而偏好逆转现象被看成是对理性因素模式以及建立在理性因素模式之上的标准经济理论的一种挑战。这种挑战本可以被忽略,但却没有。就在偏好逆转现象被报道的前几年,有两位知名的经济学家戴维·格雷瑟(David Grether)和查尔斯·普莱特(Charles Plott)在《美国经济评论》上发表了一篇文章,其中就对利希滕斯坦和斯洛维克所描述的现象谈了自己的研究。这也许是实验心理学家第一次作出了引起经济学家关注的发现。对于学术论文来说,

    格雷瑟和普莱特的文章简介部分写得有些夸张,他们的意图很明确:“经济学家应该对心理学感兴趣,而且正是在心理学领域中构建起了数据和理论体系。从表面价值的角度来看,数据与偏好理论并不一致,而且会就研究重点生成更多经济学上的含义启示……“该论文指出了心理学研究成果不适用于经济学领域而设计的一系列实验。

    格雷瑟和普莱特列出了13种理论来解释最初的发现,并指出了精心设计的、可测试这些理论的实验。他们提出了很多假设,其中一种(当然心理学家会认为这种假设有些做作)是实验的结果本应该是心理学家得出来的!最后只有一种假设经受住了检验:即心理学家是正确的。格雷瑟和普莱特承认,从标准的偏好理论来看,这种假设是最不令人满意的,因为“如此一来,个人选择可依赖作出选择时的环境”,这显然与一致性学说相悖。

    你可能会觉得这一惊人结果使得经济学家们的理论基础假设受到了质疑,会引起经济学家的自我反思。但在社会科学领域中,包括心理学和经济学,事情不应该是这样发展的。理论基础应该是强有力的,而且要质疑某一既定的理论,只有一项发现是不够的。事实上,格雷瑟和普莱特那篇直言不讳的文章对认定经济学家(也可能包括格雷瑟和普莱特)的疏忽有着直接的影响。不过,这篇文章却对经济学家们正视心理学的研究起到了促进作用,而且促进了两个学科间的跨界交流。

    联合评估引发偏好逆转

    “约翰高吗?”如果约翰高5英尺,你的回答就会取决于他的年龄。如果他6岁,他自然是很高;如果他16岁,这个身高就算矮的了。你的系统1会自动检索相关信息,同时,你对高的概念也会随之调整。你还会根据类别来匹配各项参数,比如回答:“在餐馆里吃饭,多少钱的一顿饭可以和约翰的身高相匹配?”你的回答会取决于约翰的年龄,即如果他16岁,这顿饭就比他6岁时更便宜。
    但是,请看下面的说法:
    约翰6岁,他身高5英尺。
    吉姆16岁,他身高5.1英尺。

    在单一评估中,由于每个人的参照标准不一样,大家都会觉得约翰很高,而吉姆不高。如果你需要对比,比如“约翰是和吉姆一样高吗”,你会回答不是。这个问题不会引起疑问,也没有模糊不清的地方。不过,在其他情况下,即事物和事件在它们各自的情境中进行比较时,会造成对重要事情的选择不一致。

    你不应该形成单一评价和综合评价总是不一致的印象,也不应该认为判断完全是混乱的。我们生活的这个世界有多个范畴,因为我们有标准,例如,6岁的孩子或者桌子。判断和偏好在同一种类中是一致的,但当事物从属于不同的种类时,就是不一致的了。例如以下3个问题的答案:
    你喜欢苹果还是桃?
    你喜欢牛排还是炖菜?
    你喜欢苹果还是牛排?

    第一个问题和第二个问题中的事物属于同一个种类,你能立即回答出自己喜欢哪一个。此外,你可以从单一评估(“你有多喜欢苹果”和“你有多喜欢桃子”)中得到自己的喜好评价,因为苹果和桃子都是水果。由于不同的水果是通过相同的标准进行对比的,在单一评估和联合评估中,每种水果都可以直接进行对比,因而也就不存在偏好逆转了。与种类内的问题不同的是,苹果和牛排的对比没有固定的回答。

    苹果和牛排与苹果和桃子不同,从本质上讲,它们是不可以相互替换的,它们也不能满足同样的需求。有时你会想吃牛排,有时又想吃苹果,但你很少会在想吃苹果时说吃牛排也一样,或者在想吃牛排时说吃苹果也一样。

    假设你收到一封自己信赖的组织发来的电子邮件,要求你对某一事业作出贡献:

    很多繁殖海豚的地方都受到了污染的威胁,这导致海豚的数量减少。一个由私人捐献的特殊基金会成立了,并给海豚提供无污染的繁殖区。

    这个问题能引发什么样的联想呢?你是否意识到脑中闪现了相关事业的想法和记忆?你很可能会想起保护濒危动物的工程。你的系统1会自动评估其好坏,并对海豚在濒危动物中的排名生成一个大致的印象。海豚要比白釉、蜗牛或鲤鱼这样的动物更惹人喜爱—也就是说海豚比大脑自动进行对比的动物更受欢迎。

    你必须要回答的问题不是你是否更喜欢鲤鱼,你需要对此进行美元价值评估。当然,你可以从以往的经验中知道你从没有对这种要求做出过回应。设想你就是对这种要求作出贡献的人。

    和其他难题一样,对美元价值的评估可以用替代和强度匹配来解决。美元的问题是很难,但可以通过更简单的问题来回答。因为你喜欢海豚,你很可能会觉得拯救海豚是项善举。下一步(也正是自动进行的一步),你会将你对海豚的喜爱用贡献的大小来表达。你对以前对环境事业作出的贡献大小有意识,这份贡献与对政治或母校足球队的贡献有所不同。你知道对自己来说多大的贡献是份“巨大的贡献”,多大的贡献是“大贡献”或“一般贡献”,又或是“小贡献”。你对不同动物的态度也有所不同(从“非常喜欢”到“一点也不喜欢”)。因此你也能将自己的态度用美元价值来表达,自动从“非常大”到“较大”再到几美元。

    在另一种情况下,你接手了另一种诉求:

    雇农要在阳光下暴晒多个小时,他们患皮肤癌的概率要比一般人高很多。定期体检可以降低其风险。现要建立一个基金会支持面临患皮肤癌风险的雇农的体检项目。

    这是个紧急的问题吗?你在评估紧急事件的时候,这件事属于哪种类别呢?如果你自主地将这件事归为公共卫生问题,你很可能会发现雇农患皮肤癌的风险在这些公共卫生问题中排名不是很靠前—它的排名相对于濒危动物中海豚的排名来说,肯定会靠后。若将皮肤癌问题的相关重要性用美元价值来表示的话,你对其作出的贡献就会比对濒危动物的贡献要小。在实验中,海豚在单一评估中吸引到的贡献量要比雇农吸引到的多。

    其次,思考联合评估中的这两个例子。在这两种例子中,是海豚还是雇农应该得到更大的那笔捐款呢?联合评估中关注了单一评估中没有被注意到的一点特征,但其在被发现时,却被认为是有决定性的因素:雇农是人,海豚不是。你当然认识到了这一点,但这点在单一评估中判断时是不相关的。“海豚不是人”这一事实没有引起注意,是因为在脑中被激活的所有事情都具备这一特点。“雇农是人”这一事实没有在脑中浮现是因为所有的公共卫生问题涉及的都是人。单一评估的窄框架使得海豚有更高的强度得分,通过强度匹配,海豚会得到相应更多的捐款。联合评估改变了事情的表述:这一“人Vs.动物”的特点只有在将两者综合在一起看时才会凸显出来。在联合评估中,人们对雇农表现出偏好,并愿意捐献更多,比保护可爱的动物要捐得多。在打赌和抢劫案射杀人的例子中,单一评估和联合评估是不一致的。

    芝加哥大学的奚恺元对下面这个同等类型中的偏好逆转例子作出了贡献。被评估的对象是二手音乐词典。

                      词典A     词典B

    出版年份          1993      1993

    词条数            10 000    20 000

    情况              较新      封皮已毁,其他的地方很新

    在单一评估时,词典A要更有价值,当然,偏向在联合评估中会改变。其结果正好表明了奚恺元的可评价性假设(evaluability hypothesis),即词条数在单一评估中没有价值,因为数量自身是没有价值的。而在联合评估中,这一点则显然使词典B更具吸引力,而且词条数比封皮状况更重要。

    同类案件判罚的力度为何不一样?

    我们有理由相信公正的管理在不同领域中受可预测的不一致性的影响。其中的证据部分可从实验中获得,比如对模拟陪审团的研究;部分可从对立法、管理和诉讼模式的观察研究中获得。

    在一项实验中,从得克萨斯州的陪审团中挑出了模拟陪审员,并要求他们去评估几起民事案件的惩罚性赔偿。这些案件是两个为一组呈上来的,其中一个案件提出人身赔偿,另一个案件是经济损失。模拟陪审员首先评估了其中一个案件,然后给他们看了同组中的另一个案件,并要求他们进行对比。下面是关于一组案件的总结:

    案例1:某个孩子在玩火柴时不小心点着了自己的睡衣,造成中度烧伤。生产这种睡衣的公司没有将这种睡衣制成耐燃的。

    案例2:由于某家银行的不慎处理,另一家银行损失了1000万美元。

    一半的受试者在将两个案例进行联合评估时,会先评判案例1(用单一评估)。其他的受试者在评估时,会将案件的顺序颠倒过来。在单一评估时,陪审员判给诈骗银行的惩罚性赔偿要比判给烧伤孩子的高,很可能是因为诈骗银行的案例中涉及的金额要大,是个高锚定。

    然而综合来看案件时,对受害个体的同情心会比锚定效应占更大的影响比重,因而陪审员判给孩子的赔偿金要比判给诈骗银行的高。平均来看几组这样的案件,联合评估中人身伤害的受害者所得的赔偿是单一评估中得到的赔偿的2倍。只看到孩子烧伤案件的陪审员作出的决定和他们的感觉相匹配。他们不能预测到给那家金融机构的大笔赔偿金会使给孩子的赔偿金显得不够。在联合评估中,关于银行的惩罚性赔偿金仍然锚定在损失上,而给烧伤孩子的赔偿金却有所提升,这其中反映出了陪审员对因疏忽而导致孩子受伤的愤怒。

    我们可以看到,理性通常会受到更广泛、更综合的框架的限制,而且联合评估显然比单一评估更广泛。当然,当能控制你所看到的人对你的选择有既定的兴趣时,你应该在联合评估时谨慎些。售货员很快就意识到改变购物环境能影响顾客的偏好。除了故意的改变外,你可以设想判断时用对比的方法(一定会包括系统2)会比单一评估更稳定,单一评估常会反映出系统1的情绪反应强度。我们希望任何想要得出周全判断的机构都能在评估单个案件时,为所作的判断提供更广泛的背景。我从卡斯。桑斯坦那儿了解到评估惩罚性赔偿的陪审员明显未能考虑到其他案例,这让我很惊讶。法律体系和心理学常识不同,法律判决更倾向于单一评估。

    在法律体系另一项关于不一致性的研究中,桑斯坦对比了不同美国政府部门实施的行政处罚,包括职业安全与保健管理总署和环境保护局。他总结道:“在范畴内,惩罚似乎是理智的,至少更严重的伤害会受到更严厉的惩罚。对于违背职业安全与保健的行为,最重的惩罚是针对不断的违反行为,其次的惩罚是针对蓄意且严重的违反行为,最轻的惩罚是针对未能保持其良好记录的行为。”然而,如果不同部门惩罚的力度不一样,你也不会感到惊讶,因为不同部门的惩罚反映了其特有的政治和历史,而不是所有地方都关心的公正。工人“严重违反”安全原则最多罚款7 000美元;而违反野生鸟类保育行动可导致最高25 000美元的罚款。每个部门制定的罚款与该部门制定的其他罚款相比都是明智的,但将不同部门的罚款相对比就显得很奇怪了。就像此章中的其他例子那样,只有将两个案例放在一个大框架下时,你才能看出其中的奇怪之处。同种类间的行政处罚系统是具有一致性的,但与其他种类综合在一起来看,却是不一致的。

    示例—逆转“我对英国的热量单位没有什么概念,但在看到空调装置的改变后,我对此就有所了解了。联合评估非常重要。”“你认为这个演讲非常成功,这是因为你将这个演讲和她的其他演讲作了对比。要是和其他人对比的话,她仍然不怎么样。”“当你将框架放大时,你就会做出更明智的决策,事实往往如此。”“当你单独看某件事时,你很容易受系统1的情感反应的支配。”第34章 善用框架效应,让生活更美好

    2006年世界杯总决赛是意大利队和法国队之间的较量。“意大利队赢了”,“法国队输了”,两个句子描述了这场比赛的结果,这两句含义相同吗?回答要看怎么理解“含义”这个词了。

    从逻辑推理的角度来看,这两个描述比赛结果的句子是可以互换的,因为它们所指的状况相同。正如哲学家曾说的,它们的真值条件是相同的:如果其中一个句子是正确的,另一个也是正确的。这正是经济人理解事情的办法。经济人的观点和偏好都是基于现实的,尤其是他们选择的对象—都是对这个世界的陈述,而且他们不会受到陈述所用字眼的影响。

    含义还有另一层观念,在这层观念中“意大利队赢了”和“法国队输了”的意思并不相同。在这层观念中,对某个句子含义的理解发生在你的联想机制中。这两个句子引发了不同的联想。“意大利队赢了”让人们想起了意大利队,以及该队为了赢得比赛所作的努力。“法国队输了”会让人们想起法国队,还有法国队为什么会失败,包括法国队的球星齐达内用头撞了意大利队队员。这两句话引起大脑的联想,即系统1如何对此反应,这确实有不同的“含义”。逻辑上相同的陈述引发了不同的反应,这一事实使得人们无法像经济人那样可靠且有理性。

    情感的框架效应很难抵挡

    阿莫斯和我将框架效应运用到了研究构想对信念和偏好的不公平影响中。以下就是我们曾使用的一个例子:

    若某赌注有10%的概率赢得95美元,有90%的概率损失5美元,你会接受这个赌注吗?

    若某彩票有10%的概率赢得100美元,有90%的概率什么也得不到,你愿意花5美元买这张彩票吗?

    首次,要花点时间弄明白这两个问题是相同的。在这两个问题中,你都要决定是否愿意接受某一不确定的可能,即拿到95美元或损失5美元。有人作选择会基于理性,他们会给出两个相同的答案,但这样的人是少数。事实上,其中有一个问题引起了很多正面的答复,这个问题是第二个。一个不好的结果如果被架构为不会赢的彩票的成本,比被简单地描述成输掉一个赌注更易被接受。我们对以下这个说法不应该感到惊讶:损失能比成本引起更强烈的负面感觉。选择不是基于现实的,因为系统1就不是基于现实的。

    从理查德·泰勒那儿学到的东西影响了我们构建的问题。泰勒告诉我们当他还是个研究生时,他就在一块木板上钉一张卡片,上面写着:成本就是没有损失。他在早期研究消费行为的文章中讲了一次争辩,那次争辩是关于加油站是否可以向用现金或信用卡付款的人收取不同的价钱。用信用卡支付的人强烈坚持不同的价格是不合法的,但也有可商量的余地:只要价钱上的不同是现金折扣,而不是信用卡附加费。他们的心理信念是合理的:相对于附加费来说,人们更容易放弃折扣。附加费和折扣也许在钱数上来看是相等的,但它们在情感上是不等的。

    在某项实验中,伦敦大学的一组神经科学家将框架效应的研究和大脑不同位置的活动记录相联系。为了得到大脑反应的可靠测量值,实验作了很多次的尝试。图14表明了其中一次尝试的两个阶段。

    图14

    第一,要求受试者想象自己收到了一笔钱,在此例子中是50英镑。

    然后要求受试者在肯定的结果和在轮盘赌中作出选择。如果轮盘指针停在了白色区域,她就会“得到”全部的钱;如果指针停在黑色区域,她就什么也得不到了。赌博的预期值当然是确定的结果,在这个例子中就是得到20英镑。

    正如图14所显示的那样,同样的确定结果可以被构架成两种不同的方式:即得到20英镑或损失30英镑。客观的结果在两个框架下完全相同,而且基于现实的经济人会以相同的方式对这两个结果做出反应(不管框架的限制,只是选择确定的事情或赌一把),但我们已经知道人类大脑不会受限于现实。是接近还是逃避是经由文字引起的,而且当获得是确定的时候,系统1便会偏向于获得;若损失是确定的时候,系统1便又会规避损失。

    实验人员作了很多尝试,而且每位受试者都需要在获得和损失的框架内解决几个选择问题。正如所预期的那样,20位受试者都表现出了框架效应:在获得的框架下,他们更愿意选择确定的事;在损失框架下,他们更愿意选择赌一把。但是,受试者不都是这个样子的。有些人易受到问题框架的影响;而有些人不管框架,但他们作出的选择几乎和基于现实的人作出的选择一样。实验者相应地对20位受试者进行排序,并给这个排序一个惊人的标签:合理指数。

    受试者做每个决策时,大脑活动都被记录了下来。然后,所作的尝试被分为两组:

    1.受试者的选择遵从框架的尝试。

    ·在获得时,偏向确定的事

    ·在损失时,偏向赌一把

    2.受试者的选择不遵从框架的尝试

    惊人的结果让人们看到了神经经济学这一新兴学科的潜质,即研究在人们做决策时的大脑活动。神经经济学学家做了上千种这样的实验,而且他们了解到:大脑特定区域的“活跃”(表明氧气需求量增大,即神经活动加强)取决于任务本身。在个人专心于某一视觉对象、在幻想中踢足球、识别一张脸或思考一所房子时,大脑的不同区域会变得活跃。当个人有某种情感共鸣、情感冲突或注意力集中于解决某个难题时,大脑的其他区域会变得活跃。尽管神经科学家出于谨慎,没有使用“大脑的这种模式会……”这种说法,但他们对于不同大脑区域的“个性”已经很了解了,而且知道大脑活动对心理解释的分析已经大有进展。对框架的研究产生了三个主要的发现:

    ·在受试者的选择和框架相一致时,与情绪激发相联系的大脑区域(大脑扁桃体)会很活跃。这正是可引发情绪反应的词,如获得或损失产生趋向于确定事件(当该确定事件被构架成获得时)或避免确定事件(当该确定事件被构架成损失时)的动力时我们所预测的那样。因为情绪刺激词的缘故,大脑扁桃体可被快速访问—这点很可疑,很有可能是因为系统1的参与。

    ·在受试者没有顺从自己的意识时(即他们在已知确定的事是损失时,依然选择确定的事),和矛盾以及自我控制相联系的大脑区域(前扣带)会更活跃。拒绝系统1参与其中,显然会产生矛盾。

    ·最“理性的”受试者,即那些最不易受框架效应影响的人,大脑额叶区的活动会加强,该区域可将情绪和引导做出决策的理性联系起来。我可以从中明显地看出来,“理性的”个体不会都显示出强有力的神经冲突。似乎这些理性的受试者都是(经常,或不总是)基于现实做出决策的,少有冲突。

    这项研究通过把对真实选择的观察和神经活动的测量联合起来,对文字如何引起情绪反应,并“泄露”出最后的选择作出了很好的说明。

    阿莫斯和他的同事在哈佛医学院做的一项实验是情感框架一个经典的例子。受试者都是医生,实验者给受试者看了两种肺癌治疗结果的数据,分别是手术治疗和放射治疗。手术治疗可保证有5年的存活时间,因此,大家都愿意选择手术,但在短期内,手术要比放射治疗的风险更大。一半的受试者读到了关于存活率的数据,其他人收到了关于死亡率的相关信息。对手术短期结果的两种描述是:

    第一个月的存活率是90%。

    在第一个月里,有10%的死亡率。

    你已经知道了结果:在第一个框架下(84%的医生选择了它),手术治疗要比在第二个框架下(50%的受试者选择放射治疗)更受欢迎。两种描述的逻辑等价很明显,而且基于现实的决策制定者会作出同样的选择,不管她看到的是哪种描述。不过,我们都知道,系统1对于引起情绪的文字很敏感,在第二个描述中,死亡率就是会引起负面情绪的词,而存活率是引发正面情绪的词;90%的存活率听上去让人心安,而10%的死亡率却让人感到恐惧。这项研究的一个重要发现是医生和对医学涉猎不深的人(比如病患和商学院的研究生)一样,也容易受到框架效应的影响。显然,医学培训也阻挡不了框架效应的出现。

    “获得—损失”研究和“存活率—死亡率”的研究没有什么本质的不同。脑部造影研究中的受试者作的很多尝试时也碰到了不同的框架。他们能够认识到框架有分散注意力的作用,而且可通过采用一个共同的框架,或将“损失”转换成等量的“所得”,可使问题变得简单些。聪明的人(和机警的系统2)也需要学一学,而且有专长的几位受试者也会出现在实验者发现的“理性的”人中。相反,在存活率框架下读到关于两种治疗数据的医生没理由怀疑自己若在死亡率框架下读到相同的数据会作出不同的选择。重新构架是要付出努力的,而且系统2通常很懒惰。除非有明显的理由需要这样做外,否则,大多数人都会被动地接受在框架下的决策问题,因此很少有机会发现我们的偏好受框架约束而不是现实约束的程度。

    用框架性政策助推人们作出更好的选择

    阿莫斯和我通过一个例子来引入我们对框架问题的讨论,这个例子被认为是“亚洲病害问题“。

    假设美国正为一场来自亚洲的异常疾病作准备,这场疾病估计会夺取600人的性命。为战胜这一疾病,我们提出了两种方案。假设对方案结果准确的科学估测如下:

    如果采用了方案A,200人会获救。

    如果采用了方案B,有1/3的可能会救600人,有2/3的可能一个人也救不了。

    很多受试者都会选择方案A:他们更愿意选择确定的选项,而不想赌一把。

    方案的结果在第二种说法中有了不同的框架,如:

    如果采用了方案A’,400人会死。

    如果采用了方案B’,有1/3的可能没人会死,而有2/3的可能有600人都会死。

    请仔细看并对比两种说法:方案A和A’的结果是相同的,方案B和B’的结果也是相同的。然而在第二个框架下,很多人都选择赌一把。

    两种框架下不同的选择都符合前景理论。在前景理论中,根据结果的好坏,我们对打赌还是确定的事的选择也会不同。当结果是正面的时候,决策制定者更愿意选择确定的事(他们是风险规避者);当结果都是负面的时候,他们更愿意拒绝确定的事,愿意赌一把(他们会冒险)。这些结论在钱的问题上是选择赌还是确定的事时很适用。疾病问题显示出,当结果关乎生命时,同样的原则也适用。在这个情况下,框架实验显示:对风险规避或冒险的偏向都不是基于现实的。在同样客观的结果中,做出的偏向会随着不同的制定情况而反转。

    阿莫斯曾跟我说过他的某次体验,这次体验使得我们的故事更值得关注。阿莫斯受邀为一组公共卫生专家作演讲,这些专家要对疫苗和其他项目做出决策。他利用这个机会让这些医生们关注“亚洲病害问题”:一半的人看的是“拯救生命”的那个说法,而其他人回答的是关于“失去生命”的说法。如一般人一样,这些专家也易受到框架效应的影响。制定关于健康决策的专家也会被表面现象所左右,这的确让人焦虑,但我们必须适应重要的决策也受系统1影响(而不是掌控)的事实。

    更让人苦恼的是,人们在面对自身不一致时所发生的事情:“你在一种指定情况下选择肯定能拯救200条性命的选项;在另一种情况下,选择赌一把而不是接受丢失400条性命的事实。现在,你知道这些选择是不一致的,你要怎么抉择呢?“回答常是让人窘迫的沉默。作出原始选择的直觉来自系统1,而且并没有比偏爱获得20英镑而规避损失30英镑存在更多的道德偏见。确定能拯救的性命当然是好事,死亡是大家都不愿看到的。大多数人都发现他们的系统2在回答这些问题时没有道德直觉。

    我对伟大的经济学家托马斯·谢林心存感激,他为框架效应提供了一个很好的例子,他在《选择与结果》(Choice and Consequence)一书中描述了这个例子。在我们开始对框架进行研究前,谢林的书就已出版了,框架效应并不是他主要讨论的问题。他提到了在哈佛大学肯尼迪学院授课的经验,他授课的内容是税法中儿童的免征额问题。谢林告诉他的学生们说,每个孩子都应有标准的免征额,而且免征总额和纳税人的收入是不相关的。他问学生们对下面这个问题有何看法:

    富人的生育免税额是不是应该比穷人的更高?

    你的直觉会和谢林的学生们的直觉很相似,即认为给富人更大的免税额是不可接受的。谢林之后指出,税法的制定是恣意的。现有税法认定没有孩子的家庭是默认情况,每多生一个孩子,就多享有一些免税额。当然,税法也可以将另一种情况视为默认值,比如设定一个有两个孩子的家庭为默认情况。在这种情况下,有比默认情况中的孩子数量少的家庭就要额外缴纳免税额了。谢林又问他的学生们对于另一情况的看法:

    没有孩子的贫穷家庭是否要和没有孩子的富人家庭缴纳同样多的附加费?

    对此问题,你可能还会有和谢林的学生同样的反应,即和对第一个问题的反应一样,持强烈否定态度。但谢林告诉他的学生们,从逻辑上讲,他们不应该对这两个问题都持否定态度。纵观这两种情况,对于第一个问题来说,与没有孩子的家庭相比,有两个孩子的家庭相当于是在减税。但对于第二个问题来说,与没有孩子相比,有两个孩子相当于是在增税。如果在第一个问题中,你想要穷人因为多生孩子而享受到与富人多生孩子相同(或更大)的好处,那你就也该认为,穷人必须因为没有孩子而付出至少与没有孩子的富人相同的金钱。

    我们能看到,系统1在其中发挥了作用。它能对贫富问题产生快速的反应:在怀疑时,你会倾向于穷人。谢林的问题中令人意外的一点是,道德原则在其中没有发挥作用。对于同样的问题,受问题框架影响,道德原则往往会生成相互矛盾的回答。当然,你已经知道下一个问题会是什么了。你已经了解到你对问题的反应受到框架的影响,那么对于这个问题:应如何公平处理贫富两种家庭中儿童的免税问题?

    现在,你一定已经瞠目结舌了。对于穷人和富人间的不同,你有道德直觉,但这些直觉依赖于任意的参照点,而且它们并不是真正的问题所在。关于世界上真实情况的问题是每个家庭应该缴纳多少税,以及如何填写免税代码。你没有能指导你解决这些问题的强有力的道德直觉。你的道德感觉与框架相联系,与对实际情况的描述相联系,而不是实际情况本身。关于框架本质的描述是很刻板的:框架不应该被看成是种掩饰或曲解了潜在偏向的干预。至少在这个例子中(以及亚洲病害问题和是手术治疗肺癌还是辐射治疗的问题中),没有被框架掩饰或曲解的潜在偏向。我们的偏向是关于被架构的问题,且我们的道德直觉是关于描述的,而不是关于其实质的。不是所有的框架都是平等的,而且有些框架显然比其他对相同问题的描述(或思考)的方式要好。请看下面这组问题:

    一位女士买了两张价格为80美元的电影票。当她到了电影院时,打开钱包却发现票不见了。她会再买两张票吗?

    一位女士到了电影院,本想要买两张80美元的票,但排到时,她打开钱包却发现用来买票的160美元不见了。她可以用信用卡买票,但你觉得她会买吗?

    基于框架效应,看到此问题不同版本的受试者会得出不同的结论。大多数人都会认为:第一个故事中的那位女士如果丢了票会回家,不看电影了。而且大多数人相信,如果她丢了钱,她就会赊购票看电影。

    其中的解释大家应该已经很熟悉了,这个问题涵盖了心理账户和沉没成本悖论。不同的框架会触发不同的心理账户,且损失的严重性如何要看其指向的账户。若看某场表演的票丢了,人们很自然地会将损失指向“表演”这个账户。损失显然已经翻倍了,且远超过其应有的价值。相反,丢掉的钱会被记在“一般收入”的账户上:她会想电影院的常客比自己更穷,而且她会自问,自己可支配财富的减少是否会改变自己买票的决定。多数受试者都认为不会。

    对丢钱的规避可得到更合理的决策,产生更好的框架,因为损失已经(即使票丢了)“沉没”了,且沉没成本应该被忽略。已发生的事是不相关的,唯一要紧的事是电影院常客现有的选择及其可能的结果。无论她损失什么,相关事实是她在打开钱包前损失了些钱。如果丢票的人要问我的意见的话,我会说:“如果你丢了同等价值的钱,你还会再买票吗?如果会,就请再去买票吧。“广泛的框架和包括情况多的账户往往会导致更理性的决策。

    在下面这个例子中,两种框架引起了不同的数学直觉,其中一个比另一个更好。在2008年《科学》杂志中《每加仑汽油所跑英里数的错觉》的文章中,心理学家理查德·拉里克(Richard Larrick)和杰克·索尔(Jack Soll)确定一个案例,其中被动地接受错误的框架会产生高昂的成本和严重的政策后果。很多买车的人都列出了每辆车每英里所需的汽油量,并将其看成是影响他们决策的一个因素。他们知道高里程车的成本都较低。但美国常用的框架,即每加仑汽油能跑的英里数,却将个人和政策制定者引向了一个糟糕的方向。请看下面这两位想要降低其成本的车主:

    亚当原来的车耗油,每加仑汽油能跑12英里,现在他换了一辆更省油的车,每加仑汽油能跑14英里。

    贝斯爱护环境,她把原来每加仑汽油跑30英里的车换成了每加仑汽油跑40英里的车。

    假设这两位司机一年中的行程是相同的。换了车之后,谁的车更省油?你的直觉可能会和大多数人一样,几乎会肯定地认为贝斯比亚当更省油:她每加仑汽油多跑10英里,而不是2英里,也就是说她省了1/3(从30英里提升到40英里)而不是1/6(从12英里提升到14英里)。现在,请启动你的系统2算一算。如果两位车主都行驶了10 000英里,亚当就是从833加仑减至714加仑,共省了119加仑。贝斯的耗油量就会从333加仑降到250加仑,只省了83加仑。每加仑汽油行驶的英里数的框架是错误的,应该被每英里耗油量框架(或每100英里耗油量框架,这在其他国家应用得较广泛)来代替。正如拉里克和索尔提出的,由每加仑行驶路程引起的错误直觉很容易误导政策制定者和买车的人。

    卡斯·桑斯坦在奥巴马政府中任信息与规制事务办公室主任。和理查德·泰勒一起合著了《助推》一书,该书是将行为经济学应用到政策中的基本手册。恰巧,从2013年开始,每辆新车上都会贴上“节约燃料和环保”的标志,而且此标志还包含每英里耗油量,这在美国尚属首次。不过,正确的构想框架都是用小字体排印的,而我们所熟悉的每加仑耗油量的信息却用大字体排印,但无论如何,大致的方向还是正确的。在《每加仑汽油所跑英里数的错觉》的发表和实施部分正确改革的5年内,也许是将心理科学应用于公共政策的重要时期。

    在很多国家,意外死亡后是否愿意捐献器官会在此人的驾照上标注。这则标注的构想又是另一回事了,在此,一种框架要比另一种框架更优越。很少有人会质疑是否愿意捐献器官的决定是不重要的,但有证据显示,大多数人会草率地作出决定。这个证据来自欧洲各个国家器官捐献率的对比(此对比显示出临近的且文化相似的国家有着惊人的不同)。2003年发表的一篇文章中表示,器官捐献率在奥地利接近100%,在德国有12%,在瑞典有86%,而在丹麦只有4%。

    这些巨大的不同就是种框架效应,是由这个关键问题的模式引发的。高捐献率的国家要填决定不捐献的表格,不想捐献的人一定要填上某一项,如果他们不这么做了,则被认为是自愿的捐献者。低捐献率的国家要填决定捐献的表格,你必须填上某一项,才能成为捐献者。这就足够了。预言人们是否会捐献自己器官的最好且唯一的标志是默认选项的设计,这个设计不用勾选某项内容就可被采用。

    器官捐献效应与系统1控制下的框架效应不同,它可用系统2的懒惰给出很好的解释。若人们已经决定自己想干什么,会勾选这一项;如果他们还没有想好,则要想想是否要勾选这一项。我认为,人们要填的这张是否愿意捐献的表格与他们的决定相对应。我将器官移植表想象成要求人们解决算术问题:2+2=?另一项中又有另一个问题:13×37=?捐献率当然会受到这些数字的影响。

    当构想的作用得到认可后,一个政策问题产生了:应该采用哪种构想呢?在这个问题中,回答很明显。如果你相信大量捐献器官对于这个社会有好处,你就不会在有100%捐献率的情形和有4%的司机的捐献率的情形间保持中立立场。

    从这些例子中我们能反复看到,某个重要的决定是受该情况下完全无关紧要的特征的控制的。这似乎令人困窘—这不是我们想要的作出重要决定的办法。而且,这也不是我们想要体验到的大脑的工作方式,但这些认知错觉的实例确实是不容诋毁的。

    讨论的事项有理由与理性代理理论相抗衡。一个名副其实的理论可确定某些事件是不可能的—如果理论是正确的,某些事件就不会发生。当观察到“不可能”事件发生时,该理论就是被伪造的。有确切证据证明理论是虚假时,理论也还会存在很长时间,理性代理理论模式当然也能经受住我们看到的和许多其他证据的检验。

    器官捐献的例子表明了人类理性对现实世界有很大的影响。理性代理模式的信从者和怀疑者之间的一个重要不同是信从者只会理所当然地认为关于选择的构想不能决定对重要问题的偏向。即使在探讨这个重要问题时,他们也不会感到有兴趣,因此我们的决策常会有不好的结果。

    对此,对理性持怀疑态度的人不会感到惊讶。他们对无关紧要的因素会成为偏向的决定因素比较敏感,我希望读到本书的人能有这种敏感。

    示例—框架和现实“如果他们能对自己会得到多少钱而不是会损失多少钱有个框架的话,就会对将要发生的事有心理准备。”“通过改变参照点来重新架构问题吧,假想我们没有拥有过某个东西,我们会认为它值多少钱呢?”“对于损失,要在大脑中将其引入‘一般收入’,这样你就会感觉好一点!”“他们要你在他们的邮件列表中勾选以表明不加入他们。如果他们要你在他们的邮件列表中勾选表明参与的话,他们的邮件列表就会很短。”

  • 丹尼尔•卡尼曼《思考,快与慢》19-24

    第三部分 过度自信与决策失误

    第19章 “知道”的错觉

    纳西姆·塔勒布身兼商人、哲学家、统计学家等多种角色,还被视为心理学家。他在自己的著作《黑天鹅》中,引入了“叙事谬误”的概念,用来描述存有缺憾的往事是如何影响我们的世界观和我们对未来的预期的。我们不断试图去了解这个世界,在这个过程中难免就会产生“叙事谬误”。能够吸引人们眼球的那些说法往往很通俗易懂,那些说法具体而不抽象,它们认为天资、愚蠢和意图的作用都要超过运气的作用,它们关注的是少数几件已经发生的重大事件,而不是无数件并没有发生的事。任何新近发生的有影响的事都可能成为一个存在因果关系的故事的核心情节。塔勒布指出,我们人类常会为过去的憾事编造牵强的解释,并信以为真,以此来蒙蔽自己。

    好的故事为人们的行为和意图提供了简单且合乎逻辑的解释。你总是喜欢将行为看成是一般习性和个性特征的外在表现—你可以很轻松地找到这些结果的原因。此前讨论的光环效应是思维连贯性形成的部分原因,因为这一效应使我们更有可能将自己对某人所有品质的看法和对其特别重要特质的判断匹配起来。例如,如果觉得这位棒球投手又帅又强壮,那我们也很容易会认为他投球水平一定很高。光环效应也可能是负面的:如果觉得一位运动员很丑,我们就很可能会低估他的竞技能力。光环效应通过夸大评估的一致性来保持简单和连贯的特点:好人只做好事,坏人全都很坏。“希特勒喜欢狗和小鸡”这种说法,不论你听过多少次,无论如何都不会相信。因为根据光环效应,如此坏的人是不会有任何善意的,而这句话却违背了这一点。一致性使我们的想法有些固执,感觉模糊不定。

    引人入胜的故事会使人产生某种必然性错觉。谷歌变身为科技产业巨人的故事就是一例。斯坦福大学计算机科学系有两位极富创造力的研究生,他们想出了一个在互联网上搜寻信息的好方法,于是便筹集资金创建了一家公司,此后又连续做出很多行之有效的决策。几年后,他们创建的公司成为美国股票市场上最有价值的一家,这两位研究生也跻身全球顶级富豪之列。不同寻常的机遇再加上好运气使得这个故事引人入胜。谷歌上市一年后,他们就想以不到100万美元的价格卖掉公司,但买方却说太贵了。

    虽然详尽的历史更能详细说明谷歌创始人当时的决定,但我们前面的叙述已足以说明两位创始人当时所作的每一个决定几乎都为他们带来了美好的结局。一个更完整的故事还可以描述谷歌打败的那些公司所采取的行动,这些倒霉的竞争者似乎很盲目,它们行动迟缓,而且没有足够的能力来对抗谷歌的威胁。

    尽管我在讲述上述故事时刻意采用了平淡的口吻,但你仍然会有这样的想法:这个故事非常棒。如果加上更多细节,这个故事就会让你觉得自己明白谷歌成功的秘诀。它还会使你感觉自己学到了颇具价值的重要一课,了解了企业成功的秘诀。但不幸的是,我们有足够的理由相信,你对谷歌这个例子的理解和认识大都是错觉。想知道一个解释是否行得通,可以对它作一个最终测试,看它能否使这个事件事先就能被预测到。谷歌成功的故事就符合这样的测试,因为这其中没有哪一个故事会包含无数个可能会导致不同结果的事件。人类的大脑无法妥善处理没有发生的事情。事实上,很多实实在在发生过的重要事件中包含着众多抉择,这些抉择会诱导你夸大技能的作用并低估运气对最终结局的影响。因为每一个重要决策都有好的结果,上述故事堪称一个几乎毫无瑕疵的预言—但坏运气本来极有可能扰乱这些成功的步伐。光环效应还有最后一个阶段,即给该故事的主角戴上不可战胜的光环。

    如同看着一位技能娴熟的筏夫沿激流而下时巧妙地躲过一个又一个暗礁险滩一般,阅读谷歌的故事之所以令人振奋也是因为故事中艰难风险接连不断。然而,两者间有着很大的不同。技能熟练的筏夫有过上百次顺激流而下的经验,他能通过观察眼前的激流预测哪里有障碍,他学过如何对姿势进行微调来保持正确的方向。但对于年轻人来说,却没有多少机会去学习如何创建一家大型公司,更极少有机会学习如何避开潜在的风险—比如说他们的竞争公司推出了一款超级棒的新品。当然,谷歌公司的案例也包含了大量的技能,但运气在公司的实际运作中发挥的作用远远超出了故事中所讲述的那个水平。运气的成分越多,从中能学到的就越少。

    此处发生作用的就是强大的眼见即为事实原则。你会不由自主地去处理手头有限的信息,好像这些信息就是全部事实了。根据这些可得信息,你构建出最可能的故事,如果这个故事还不错,你就会相信它。然而自相矛盾的是,在自己所知甚少或是谜题的答案只是初露端倪时,我们却更容易构建出一个连贯的故事。我们满心相信这个世界是有意义的,这份信心建立在一个稳妥的基础之上:我们最大限度地忽略自己的无知。

    我曾听说太多人“在2008年金融危机发生前就知道这场危机不可避免”。这个句子中含有一个极有可能引发异议的词,在讨论重大事件时,这个词本不该出现在我们的词汇当中。这个词当然就是“知道”。有些人事前清楚地意识到可能会发生危机,但他们却并不“知道”究竟是什么危机。而他们现在却说他们当初就知道这场危机,那是因为危机确实发生了。这是对一个重要概念的误用。在日常生活中,只有在所了解的事情属实且其表现也真实的情况下,我们才会用“知道”这个词。但是那些当初认为会有危机的人(当初本没有那样多的人这样想,而如今却有更多人声称记得自己当时就是这样认为的)在当时并不能十分确定地指出危机是什么。很多聪明且见多识广的人对经济前景怀有浓厚的兴趣,并不相信灾难已经迫近。我从这个事实推论:危机是不可知的。在这个情境中运用“知道”一词很反常,并不是因为有些人因为这种预知能力获得了本不应属于他们的赞赏,而是这个词给人一种暗示,使人觉得这个世界比事实上更可知。这个词使得人们心中存有一种致命的错觉。

    这个错觉的核心是我们认为自己了解过去,这也表明未来也应该是可知的,但事实上,我们对过去的了解比我们自认为能够了解的要少。“知道”不是唯一一个会引起错觉的词。“直觉”和“预感”等词一般也可用来形容过去的想法变成了现实。“我预感这段婚姻不会长久,但我错了”这句话听上去有些奇怪,而类似“一种直觉最终被证实是错误的“这样的说法听来也很奇怪。为了想清楚未来,我们需要清除自己过去曾经用来表明信念的语言。

    后见之明的社会成本

    将从前的事编成叙事故事的大脑区域是构建意义的器官。当一件不可预知的事情发生时,我们会立即调整自己的世界观以适应这种意外。试想自己正在看一场足球赛,比赛双方的输赢记录相同。现在比赛结束了,其中一方击败了另一方。在你修正过的世界观里,赢得比赛的球队比输掉比赛的球队更加强大,你对过去和将来的看法也已经被这种新感觉改变了。从各种意外事件中积累经验的做法值得一试,但这样做也可能会导致一些危险后果。

    人类大脑的常规局限使它没有足够的能力重构过去的知识结构或信念。一旦接受了一种新的世界观(或对世界某一方面的看法发生了变化),你就会立即丧失很大一部分回忆能力,无法回想起自己观点改变之前的那些想法了。

    很多心理学家曾经研究过人们观念发生改变时究竟发生了什么这一问题。实验人员选了一个尚无定论的话题,比如说死刑,之后他们仔细测试了受试者的态度。接下来,受试者们会看见或听见一则颇具说服力的信息,这则信息对所选话题持或赞同或否定的态度。然后实验人员再次测试受试者的态度,受试者往往倾向于他们看到或听到的那个观点。最后,受试者要说出自己在实验前的观点。这项任务也许很难。受试者被问到之前的观点时,说的往往就是现在的观点,这便体现了替代理论,而且很多人都无法相信他们之前的观点与现在的不同。

    你无法重构过去的想法,这种情况会不可避免地导致你低估自己受往事影响的程度。巴鲁克。费斯科霍夫率先揭示了“我早就知道”效应,或者说“后见之明”现象,当时他还在耶路撒冷读书。在尼克松1972年访问中国和苏联之前,费斯科霍夫和鲁斯。贝斯(我们的另一名学生)作了一项调查。受试者需要对尼克松此次外交破冰之行中可能出现的15种结果的可能性作出评估。毛泽东会同意与尼克松会面吗?美国会在外交上承认中国吗?眈眈相向几十年之后,美国还会和苏联就重大问题达成共识吗?

    尼克松访问结束后,费斯科霍夫和贝斯让这些人回想他们对15个可能出现的结果的预测。结果很明显。如果一个事件果真发生了,人们就会夸大自己此前作出的预测的可能性;如果可能的事件并未发生,受试者就会错误地回忆说自己当初一直都认为此事发生的可能性不大。接下来的多次实验表明,人们不仅会高估自己最初的预测,还会高估其他人作出的预测。引起公众注意的其他事件中也出现了相似结果,例如辛普森谋杀案和比尔。克林顿总统的弹劾事件。根据发生过的事来改变个人的想法会产生深刻的认知错觉。

    后见之明的偏见对决策者的评估行为有着恶劣影响,它导致观察者不是根据判断过程的合理性来评估一个判断的好坏,而是以结果的好坏作为判断标准。假设有一个低风险的外科手术,手术期间发生了一件始料未及的事故,病人因此死亡。事后,陪审团更倾向于相信手术本来就存在风险,而且主刀医生应该比其他人更清楚这一点。即使在制定决策时其想法是合理的,这一结果偏见也会使人们几乎不可能对他的决策作出正确评估。

    后见之明对那些决策制定者而言尤其无情,他们的工作就像是为他人做代理人,这些人包括医生、金融顾问、三垒教练、执行总裁、社工、外交家以及政治家等。好的决策如果产生了坏的结果,我们就会责备那些决策制定者;而对那些只是在事后才能明确看出是正确的决策而言,其制定者也不会因此得到什么赞扬。这便是典型的“结果偏见”。若结果很糟糕,客户常会责备代理人没有看清墙上的笔迹—却忘了这笔迹原是用隐形墨水写成的,只有在事后才能变得清晰可辨。事前原本感觉很是谨慎的行动在事后也会被看成是不负责任的过失。曾经有一项以一个真实法律案例为基础的实验,实验人员问加利福尼亚大学的学生,明尼苏达州的德卢斯市是否应该花一大笔钱租用一个全天候大桥监控器来监视桥体,防止出现瓦砾阻塞河流的风险。其中一组学生只是看了该市做决策时的已有材料,其中24%的学生就认为德卢斯市应该承担租用洪水监控器的花销。第二组受试者则被告知瓦砾已经阻塞了河流,并引起了重大洪灾。尽管实验人员已经明确告诉他们不要让后见之明妨碍自己的判断,但这组中仍有56%的学生认为该市应该租用监控器。

    结果越糟糕,后见之明的偏见就越严重。遇有重大灾难发生时,比如“9•11”恐怖袭击事件,我们尤其容易相信那些没能预见到这场灾难的官员玩忽职守,置公民安全于不顾。2001年7月10日,中央情报局得到消息:基地组织可能正在谋划一次针对美国的重大袭击。时任中央情报局局长的乔治·特尼特(George Tenet)并没有把这则消息传达给总统乔治·W·布什,而是告知了国家安全顾问康多莉扎·赖斯(Condoleezza Rice)。当事实浮出水面之后,《华盛顿邮报》的传奇编辑本·布莱德里(Ben Bradlee)表示,“如果你对即将主宰历史的事件有所了解的话,也许就有机会直接登上总统宝座了,我认为就是这么简单”。但在7月10日这天,没有人知道—或者说有可能知道—这则消息最终会在历史上留下重重的一笔。

    很难在事后评论人们是否严格依照标准运作过程行事,因此那些希望自己的决定能经受住后见之明检测的决策制定者只好采用官僚的做派—极不情愿冒风险。由玩忽职守引起的起诉变得越来越常见,内科医生们以多种方式改变了自己的诊疗程序:要求患者作更多检查,请教专家更多病例,采用保守疗法,即使这些方法未必奏效也要用。这些行为与其说对病人有益,倒不如说是保护了医生,埋下了利益冲突的隐患。不断增强的责任可谓福祸参半。

    尽管后见之明和结果偏见总会有滋生风险之嫌,却也会给那些不负责任的冒险者带来不应得的回馈,例如某位将军或企业家一次疯狂的冒险举动竟然成功了。那些一直很幸运的领导者不但从未因冒太大的风险而受到惩罚,相反,人们总会相信他们有很强的鉴别力和先见之明,能够预见成功;而那些曾经怀疑过他们的明智的人事后也会被视为平庸、胆小、懦弱之辈。几次幸运的冒险便会给一个不顾后果的领导人罩上耀眼的光环:极富远见、英勇果敢。

    真的存在能让企业基业长青的秘诀吗?

    系统1的意义构建体系会让我们认为这个世界比现实中的更整洁、更简单、更可预知,且更富逻辑性。认为人类对过去了然于心这一错觉会带来更深层次的错觉—以为人类可以预知并控制未来。这些错觉会让人感到安适,如果我们允许自己充分接受世间事物的不确定性,这些错觉还会减轻自己将要体验的焦虑。我们都需要一颗定心丸,想知道我们的行动会有恰当的结果,想知道智慧和勇气一定会带来成功。很多商业书籍都是因此而应运而生的。

    领导者和管理措施是否会影响上市公司的最终成绩呢?回答是:当然会,而且其影响已被系统研究证实了,这些研究客观评估了众多执行总裁的个性特征及其决策,并将这些评估结果与公司后来的业绩联系在一起。在一项研究中,各位执行总裁的性格特征常常会受到他们之前所在公司的策略的影响,在现公司走马上任后,还会受到公司管理规定和程序的影响。诸位执行总裁的确会影响公司业绩,但这种影响远比商业书籍中所宣称的小得多。

    研究人员运用相关系数测量了上述(总裁个性与公司业绩之间)的相关系数,这个值在零到1之间变化。此前定义过了相关系数(和回归平均值的关系),即看共有因素在多大程度上对两种测量方式发生作用。公司成功和执行总裁特性之间的相关系数的最高值可能高达0.30,这就表明两者间有30%的重叠部分。为了充分了解这个数字的意义,请思考下面的问题:

    假设你要考虑很多组公司的情况。每组的两个公司情况大致相同,但其中一个公司的执行总裁比另一个优秀,那么你多久才能发现那个执行总裁比较优秀的公司会是这组中较强的?

    在一个秩序良好且可预知的世界中,相关系数会很高,而且你会发现每组中能力较强的执行总裁百分之百会领导那个更成功的公司。如果相似企业的相对成功完全是由其执行总裁控制不了的因素决定的(你也可以将这些因素称为运气),你就会发现,更成功的公司有50%的概率是处在较弱的执行总裁的领导之下的。0.30的相关系数表明你会找到那个能力更强的执行总裁来领导所有小组中60%较强的公司,这比随意猜想提高了10个百分点,这个结果充分印证了我们常常见到的对执行总裁英雄崇拜的现象。

    如果你曾经希望这个数值更高—我们中的大多数人都这么希望—就应该将这种想法视为自己容易高估现实世界的可评估性的标志。不要犯错:将成功概率从1∶1提高到3∶2是非常重要的,无论是在跑道上还是在商界中,都是如此。然而,在大多数经济书籍的作者看来,一位对公司业绩几乎没有什么控制能力的执行总裁是不会给人留下特别深刻的印象的,即使这家公司运行良好,人们也不会对他有什么印象。很难想象人们会在机场书店排起长队去买一本满怀热情描述商界领袖管理经验的书,因为这些领导的表现一般而言也就比仅凭运气强那么一点。消费者亟须对决定企业成功与失败的因素有个明确的了解,他们需要一些信息帮助自己了解这些因素,哪怕这些信息有多虚假都无妨。

    身为瑞士一所商学院教授的菲利普·罗森茨威格(Philip Rosenzweig)曾写过一本书—《光环效应》(The Halo Effect),该著作颇有见地。他在书中表明,有两种类型的商业书籍很受欢迎,能够满足人们对虚幻确定性的需求。这两种类型包括:描写特别的个人和企业(常见的)成功与(偶尔)失败的历史;分析成功与比较成功企业之间的区别。他总结道,成功和失败的故事常会夸大领导风格和管理措施对公司业绩的影响,因此这些故事基本上都没什么用。

    为了理解正在发生的事情,我们假设一些商业专家,比如说其他公司的首席执行官,应邀对某家公司的执行官进行声誉评估。这些首席执行官非常清楚该公司最近是在走上坡路还是下坡路。与此前了解的谷歌案例一样,本例中产生了一种光环效应。人们很可能认为一家成功公司的执行总裁必定是头脑灵活、讲究方法、行事果断的人。假使一年过后事情变得很糟糕,人们又会将同一位总裁描述成稀里糊涂、僵化死板、独断专行的人。两种描述当时听上去都是正确的:看起来说一位成功的领导者僵化死板、稀里糊涂是很荒唐的,而说一位苦苦挣扎的领导者头脑灵活、讲究方法似乎也很奇怪。

    明明是同一个人和同样的行为,在事情进展顺利时就是讲究方法,而事情进展不顺利时就成了死板,光环效应的影响的确太大了,因此你也许会发现自己对前述想法十分抵触。由于光环效应,我们将因果关系抛到脑后:我们很容易相信公司的失败是因为其执行总裁僵化死板,而真实情况是其执行总裁之所以显得死板是因为这家公司正每况愈下。错觉就是这样产生的。

    在对成功企业的系统研究中寻求其经营之道的书籍为什么格外有吸引力?将光环效应和结果偏见结合起来就可以对这个现象作出解释了。这种类型的书中知名度最高的有那么几本,其中一本是吉姆·柯林斯(Jim Collins)和杰里·波勒斯(JerryI. Porras)合著的《基业长青》 (Built to Last)。这本书包含了关于18组相互竞争的公司的全部情况分析,每组中都有一家公司比另一家更为成功。这些对比数据包括对企业文化、经营策略和管理措施等众多方面的评估。两位作者在书中宣称:“我们认为世界上每一位执行总裁、经理和企业家都应该读读这本书,读过之后你就能建造一家梦想的公司。”

    《基业长青》和其他类似书籍的基本概念是:良好的管理措施会得到认同,而执行这些措施会带来丰厚的回报。这两点都有些言过其实了。公司是非常成功还是不怎么成功,其间的区别在很大程度上要看这家公司是否幸运。知道了运气的重要性,看到非常成功和不怎么成功的公司在对比过程中体现的高度一致的模式,你就尤其应该持怀疑态度。因为存在不可测性因素,我们根本就不可能建立什么有规律的模式。

    因为运气起到很大的作用,所以我们无法通过对成功的预测推断出领导水平高低和管理措施优劣。即使你的预测非常准确,知道总裁有绝佳的洞察力和超群的能力,你还是不能预测这家公司会如何运转,你的预测比抛硬币的结果强不了多少。《基业长青》一书中对卓越的企业和不怎么成功的企业的对比研究显示,总体上讲,在该研究过后的一段时间里,两类企业在企业效益和股票收益等方面的差距几乎趋近于零。在《追求卓越》 (In Search of Excellence)这本著作中提到的各家公司的平均赢利额也在很短的时间内大幅下降。《财富》月刊做了一项关于“最受推崇的公司”的调查,调查发现,在过去20年里,评级最差的公司比最受推崇的公司的股票收益更高。

    你可能会试图用因果关系来解释这些观察到的结果:也许成功的公司变得自满了,不怎么成功的公司则更努力。然而,这么想是错的。必须缩小这个平均差距,因为最初的差距大都是因为运气所致,是运气使顶尖公司成功,使其他公司落后。我们已经遭遇过实实在在存在的统计学事实:回归平均值。

    通过提供人类大脑所需,企业成败的故事与读者实现了共鸣,这里的所需指的是关于成败的简单信息,其中明确表明了原因,忽略了运气的决定性力量和回归的不可避免性。这些故事引起并维持了关于了解的错觉,同时给读者上了一些没有什么持久价值的课,但这些读者却偏偏愿意相信这些内容。

    示例—后见之明“这个错误很明显,但这不过是后见之明,你事前根本无法知道。”“他从这则关于成功的故事中学到了太多,多得有些过头了,他现在已经陷入了叙事谬误的误区。”“她说这家公司经营不善,真是无稽之谈。她并不了解这家公司,只知道其股票在下跌。这是结果偏见,其中一部分是后见之明,一部分是光环效应。”“我们不要带有结果偏见。尽管结果偏见有时也很管用,但这个决定是很愚蠢的。”

    第20章 未来是不可预测的

    系统1在信息有限的情况下也能得出结论,但我们却无从得知得出这个结论的过程有多复杂。因为有了眼见即为事实原则,所以只有眼前的条件才是最重要的。逻辑上的连贯性能给人信心,而我们在观点中表现出的主观自信也反映出系统1和系统2所构建的情景的连贯性。证据的数量和质量并不那么重要,因为即使证据十分苍白也能构建一个非常连贯的故事。对于一些最重要的信念,我们其实根本就没有什么证据来证明其合理性,我们怀有这些信念仅仅是因为我们所爱的人和所信任的人也持有同样的信念。由于所知甚少,我们对自己信念的信心是毫无缘由的—但这种信念也很重要。

    士兵测评的有效性错觉

    几十年前,我在以色列军队服兵役。当时我已经拿到了心理学学士学位。做了一年的步兵军官后,我被派到部队的心理科,有时候我需要对士兵进行测评,看其是否完成了军官培训科目。我需要在炎炎烈日下站很长时间,观察几组汗流浃背的士兵是如何解决问题的。我们使用的测评方法是英军在“二战”时开创的方法。

    其中一项实验名为“挑战无领导小组”,这项实验是在障碍训练场上进行的。参加实验的有8个士兵,他们之间互不相识,军衔都被摘掉了,身上只贴数字标签以作鉴别,他们的任务是将地上的原木拖过6英尺高的墙。全组所有人都必须翻过墙且原木既不能碰到地也不能碰到墙,而且任何人都不许碰到墙。一旦出现了任何一种违规情况,他们就必须报告并从头再来。

    解决这个难题的办法有很多种。其中一个普通的办法就是让几个人像拿钓鱼竿一样按照一个角度把住原木,其他人通过原木攀缘而爬过墙。或者让一些士兵踩着他人的肩膀跳过墙去。到最后一个人时,其他人就要按照一个合适的角度把住原木,此时原木的一端是悬空的。待他跳上原木后,翘起原木,让他滑过去,最后安全地跳到墙的另一面。在这一环节中,失败是常有的事,他们需要不断从头再来。

    我和另一位同事看着他们训练,记录下是谁在指挥其他人,是谁想要领导却被断然拒绝,还要关注每位士兵的合作精神对整个小组能力的影响情况。我们发现有人固执,有人顺从,有人自负,有人脾气暴躁,有人执著,而有人其实就是个逃兵。有些人的想法一旦被小组否定了,他们就不再那么努力了。然而,从这些人身上我们有时也能看出些斗志来。我们还观察了这几位士兵面对危机时的反应:有人会斥责那个导致整组沦陷的人,有人在这个精疲力竭的小组还需从头再来时打头阵。在这个测验的压力下,我们感到其中每个人都展现了自己的天性。我们对参加实验的每位士兵性格的印象就如同天空的颜色那样真切、那样深刻。

    观察过这些士兵完成的几次测试之后,我们就要对他们的领导能力和决策能力进行总结,而且要用分数表示谁在军官训练中是合格的。我们深入讨论了每一次测试,回顾了我们对他们的印象。这项任务并不难,因为我们感觉自己已经看到了每位士兵的领导能力。有些人像是强势的领导;有些人则比较懦弱,或是自大愚蠢;还有的人虽然平庸但并非无药可救。有几个人看上去非常软弱,只能将他们从军官候选人行列淘汰出去。在将对每位士兵的多角度观察汇集成连贯的情况时,我们对自己的评估很有信心,感觉我们所看到的一定是他们未来的发展。当小组遇到麻烦时,敢于担当并带领团队翻过障碍墙的士兵当时就是整个队伍的领导者。那么,他在训练中或战场上会如何表现呢?显然大家都会猜测他会像在翻墙训练中表现的那样非常高效,其他的推测都不太可能,因为现实情况就摆在我们眼前。

    因为对每位士兵表现情况的印象总体来看是清晰且明确的,所以我们在正式预测时也没有任何迟疑,脑海中通常只会出现一个分数,几乎不会有心生疑虑的情况,也极少有自相矛盾的情形。我们很愿意这样断言:“这个士兵根本不行”,“这个比较平庸,但还算可以吧”,或者说“他将来肯定是个人才”。我们觉得没必要质疑自己的预测,也没有必要过低预测或者只说些模棱两可的话。但如果有人对这份测评结果提出质疑,我们也愿意承认,会说“当然了,什么都可能发生”。之所以愿意承认这一点,是因为不管我们对参与测试的每位士兵的印象如何,都十分确信这份预测在很大程度上是无效的。

    事实表明,我们根本就无法对参与测试的士兵的表现进行准确的预测。每隔几个月我们就会召开一次反馈会议,会上我们会了解这些新兵在军官训练学校的表现,并将我们(对他们)的评估和管理过他们一段时间的教官的意见进行对比。每次得到的结果几乎总是相同的:我们对这些士兵在军官学校的表现进行预测的能力弱到完全可以被忽略掉。我们的预测也就比凭空猜想强点,但也强不了多少。

    得知这个令人气馁的消息后,我们颇沮丧了一段时间。但这里毕竟是军队,无论管不管用,都要按程序办事,都要服从命令。第二天又来了一批士兵。我们把他们带到障碍训练场地,看着他们面对着墙,抬起原木,几分钟后他们的真正本性就暴露无遗,和之前那些士兵一样明显。我们预测的质量虽低,但这个事实对于我们怎样评估士兵完全没有影响,对于我们在判断和预测士兵能力时的信心也影响甚微。

    这一切都很令人关注。之前预测失败的主要原因本应动摇我们对士兵进行评判的信心,然而我们的信心并未因此受到影响。这个原因本来也可能使我们适度调低自己的评价,但我们却并未受其影响降低评价。其实我们知道自己的预测只比随意乱猜强一点,一般情况下都是这样,但我们仍然感觉自己所作的每一项预测都是有根据的,而且我们还会按照自己的预测行事。这让我想起了缪勒–莱耶错觉,我们都知道图中的线段是等长的,但一眼看过去仍然觉得它们长度不同。我对这种类推非常感兴趣,所以特意为我们的这种体验创造了一个术语:有效性的错觉。

    我曾经发现了自己的第一个认知错觉。

    几十年后的今天,我仍能从那个旧时的故事中看到自己思考的许多中心问题,这些问题也是本书的写作主题。我们对这些士兵未来表现的期望是替代问题的一个典型实例,更堪称典型性启发式的经典案例。我们曾经在一个模拟情景下观察一个士兵的行为,一小时后我们感觉自己能判断该士兵在面对军官训练和无领导作战的挑战时会有何表现。我们的预测是完全不能回归的,我们仅仅根据非常薄弱的证据就推测失败或者大获全胜,没给自己留一点余地。这也正是“眼见即为事实”的典型实例。

    我们对观察到的行为印象深刻,对最终决定这些人作为军官表现的因素却知之甚少,而且没有什么好办法来体现这种无知。

    回顾我们所做的一切,其中最值得注意的就是我们对一般原则的认识,即我们无法作出预测,这种认识对我们对个体案例的信心没有什么影响。现在我明白了,我们的反应与尼斯贝特和博吉达的学生们在得知大多数人不会去帮助疾病发作的陌生人时的反应相似。他们当然会相信自己看到的统计数字,但在判断视频中看到的某人会不会去帮一个陌生人时,基础比率并没有影响他们的判断。就像尼斯贝特和博吉达说的那样,人们通常不愿从一般情况中推断特殊情况。

    对某个判断的主观自信并不是对这个判断正确概率的合理评估。自信是一种感觉,它能反映出某条信息和处理该信息时所体现的认知放松的一致性。由衷地承认不确定性乃明智之举,但如果有人声称自信满满,只能说明他在脑海里已经构建了一个连贯的情节,当然这个情节未必是真实的。

    投资股票的技能错觉

    1984年,我和阿莫斯以及我们的朋友理查德。泰勒访问了华尔街的一家公司。接待我们的是该公司的高级投资经理,他请我们来是要讨论判断偏见在投资中的作用。我对金融了解不多,都不知道要问他什么,但我还记得我们之间的一次交流。“你售出一只股票后谁会买?”他大致朝窗户那边挥了一下手,表示他希望买方会是像自己一样的人。这就奇怪了:是什么东西使得有人买有人卖呢?是什么使得卖方觉得他们知道买方一无所知的事情呢?

    自那时起,我对股票市场的问题就越来越迷惑:一个重要产业在很大程度上似乎是建立在“技能错觉”的基础上的。每天都有数十亿笔股票交易,很多人会买同一只股票,而其他人则将这只股票出售给他们。一只股票一天当中有一亿多的股份转手是常有的事。大多数买方和卖方都知道他们享有相同的信息,之所以进行股票交易主要是因为他们有不同的想法。买方觉得股价太低,很有可能会升值;而卖方认为股价过高,极有可能下跌。问题在于为什么买卖双方都觉得当前的股价有问题,为什么他们认为自己比市场更了解股价?对于他们中的大多数人来说,这种想法其实是种错觉。

    总的来看,股票市场运行的标准理论是为业内所有人士所接受的。投资行业中的每个人都读过波顿·麦基尔(Burton Malkiel)的著作《漫步华尔街》(A Random Walk Down Wall Street)。麦基尔的核心理念是,一只股票的价格包含了关于公司价值和对股票前景的最佳预测的所有信息。如果有人相信某只股票的价格明天会上涨,他们今天就会买进更多该股票。而这种大量买进该股票的行为也会反过来导致股价上涨。如果市场上所有资产的标价都是正确的,就没有人能通过交易来预测会赚还是赔了。最佳价格使得聪明无处施展,但它们也会保护不聪明的人免受自身愚钝的损害。然而,我们现在知道这个理论并不完全正确。很多投资者在交易过程中一直在赔钱,连会扔飞镖的黑猩猩都能比他们做得更好。这个令人惊讶的结论是由特里·奥登(Terry Odean)首次提出来的,他是加州大学伯克利分校的一名金融学教授,也曾是我的学生。

    奥登对一万名投资者的收益账目中体现出来的长达7年间的交易记录进行了研究,他分析这些投资者通过那家公司进行的每一笔交易,总共有接近16.3万笔交易。凭着这组丰富的数据,奥登便能确定为什么一位投资者会卖掉自己所持的某只股票的一些股份,随后很快又买进另外一只股票。通过这些行为,投资者透露了他(大多数投资者都是男性)对两只股票前景的明确想法:他希望自己要买的股票比自己要卖的股票走势更好。

    为了确定这些想法是否能站得住脚,奥登对投资者卖掉的股票收益和买进的股票收益进行了对比,这项对比是在交易完成一年后进行的。结果明显很糟糕。平均来说,个体交易者卖掉的股份比他们买进的走势要好,而且赢利空间相当大:每年约有3.2个百分点,远远超过两种交易的执行成本。

    当然这只是平均水平,记住这点很重要:有些投资人做得很好,而有些投资者则做得差得多。然而,显然对于个人投资者中的大多数人来说,冲个澡,然后什么事也不做也会比践行脑中出现的想法更好。后来,奥登和他的同事布莱德·巴布尔(BradBarber)在研究中也支持这个结论。在一篇题为“交易有损你的财富”的论文中,他们表示,总体来看,最积极的交易者往往会得到最糟糕的结果,而交易最少的投资者却赢得了最高的收益。在另一篇题为“男儿本色”的论文中,他们提到男性比女性更常按照自己无用的想法行事,而女性在投资中的收益比男性取得的收益更多。

    当然,每笔交易总是会涉及第三方的某个人。一般来讲,这第三方就是金融机构和专业投资者,他们善于利用个人投资者在选择卖出哪只股票和买进哪只股票的过程中所犯的错误。巴布尔和奥登的深入研究对这些错误作了解释。个人投资者常会抛售“赢利股”以保持自己的收益,“赢利股”即为买进后增值的股票,是涨是跌要看“亏损股”了。不幸的是,近期的赢利股比近期的亏损股在短期内走势更好,所以这些个人投资者卖错了股票,也买错了股票。可以预见,个人投资者都集中到那些吸引他们注意力的公司那儿去了,因为媒体在宣传那些公司。职业投资者往往会更有选择地接收消息。这些发现让我们晓得,金融专业人员所推崇的“掌握内情下赌注”的说法有一定道理。

    尽管专业人员能够从业余人员身上赚到数目可观的一笔财富,但几乎鲜有哪个炒股的人拥有可以年复一年地在股市上始终立于不败之地的能力。专业投资者,包括基金经理,在一项基础能力测试中失败了,这项测试即为持久性成就。对所有技能的研究结果都表明:个体成就的差异具有一致性。其中的逻辑很简单:如果任何一年中的个体差异完全是由于运气,那么关于投资者和基金的排位就会不规律地改变,年与年之间的相关系数就为零。但是,涉及技能因素时,排位就会更稳定一些。个体差异的持久性是一种测量方式,通过这种方式我们就能确定高尔夫球员、汽车推销员、牙齿整形医生或者公路收费员是否拥有这种技能。

    对冲基金是由经验丰富且工作努力的专业人士管理的,这些专业人士买卖股票是为了给他们的客户赢得最佳效益。然而,从50多年的研究中得来的证据还是很具决定性的:对于大多数基金管理者来说,选择股票更像是掷骰子,而不像是玩扑克。任何一年中,往往每3只对冲基金中至少有两只的表现要比整个市场的整体表现差。

    更重要的是,对冲基金收益的年度相关系数非常小,也就比零稍高那么一点点。每年成功的基金差不多都是靠运气,或者说他们骰子掷得好。众多研究者有一个普遍认同的观点,那就是几乎所有炒股的人,不管他们对股票是否了解(很少人了解股票),都在玩碰运气的游戏。交易者的主观经验只不过是他们在很不确定的情况下作出的看似明智的猜测而已。然而在高效率的市场中,明智的猜测比瞎猜也准不了多少。

    几年前,我得到一次非同寻常的机会,可以近距离调查金融技能中的错觉问题。我应邀到一家公司为一组投资顾问作报告,这家公司为非常富有的客户提供金融建议和其他服务。我向他们要了一些数据用于准备报告,还有一个小收获:一张电子表格中有25位匿名的财富顾问连续8年来的投资收益。每位顾问(大多数顾问都是男性)每年所得的分数直接与他的年终奖金挂钩。按照每位顾问每年的表现进行排序,并决定他们中是否一直存在技能差异,以及同一个财富顾问为他的顾客赢得的收益是否一年更比一年多,这些都是非常简单的事。

    为了回答这个问题,我以两年为一组计算了排序的相关系数:第一年和第二年,第一年和第三年……一直到第七年和第八年。每两年会有一个相关系数,总共就会有28组相关系数。我知道其中的理论,也希望能找到能够表明技能持久性的些许论据。我仍然惊讶地发现28组关联值的平均值仅为0.01。换句话说,就是零。我们并未能发现技能差异的持久关联性。这样的结果和你在掷骰子比赛时所期待的如出一辙,却与技能比赛大相径庭。

    这家公司中似乎没有人注意到这场游戏的本质,即股票玩家在操控一切。顾问们感觉自己在这份严肃的工作中是有能力的专业人士,而且他们的上级也同意这一点。在研讨会召开的前一个晚上,我和理查德。泰勒与该公司的一些主管共进晚餐,这些主管是决定年终红利多少的人。我们让他们猜猜每位顾问不同年份间的排名有什么关联。他们觉得自己似乎知道我们的意图了,笑着回答道“关联不大”或说“表现当然会有波动”。然而我们很快明白了,没有人希望平均相关系数为零。

    我们向这些主管传达了这样一个信息,至少在构建证券投资组合时,该公司是凭借运气得到的回报,而不是技能。这一点本应让他们感到吃惊,但却没有。他们完全没有表露出不相信我们的迹象。为什么会这样?毕竟我们已经分析了他们的业绩,虽然措辞谨慎,但他们经验老到,肯定看得出来其中的含义。大家继续安静地吃饭,

    我确信我们的发现及其含义都被他们刻意掩盖了,这家公司又回到了以前的运行状态。对技能的错觉不仅是个人的失误,它还深深植入了这个产业的文化中。许多对这一基本假设提出挑战的事实—因此也威胁着人们的生计和自尊心—还远远没有为人们所接受,人类大脑还没有消化这些事实。对绩效的统计研究尤其如此,这种统计研究提供了基础比率信息,当这一信息与自己从经验中得来的印象互相冲突时,人们一般就会忽视它。

    第二天早晨,我们把各项发现告知这些顾问,他们的反应都非常冷漠。他们是对复杂问题进行仔细判断的人,这种经验对他们来说比一个陌生的统计结果更深入人心。活动结束后,昨晚一起吃过饭的一位主管把我送到机场。他用一种带着戒备的口吻跟我说:“我在这个公司做得非常好,没人可以否认这一点。”我笑了笑,什么也没说。我想:“我今早已经否认这一点了。如果你的成功主要是靠运气,那你又能将多少成绩归功于自己呢?”

    主观自信与专业文化为认知错觉提供了生存的土壤

    认知错觉比视觉错觉更顽固。缪勒–莱耶错觉虽然告诉你线段长度是相同的,但这没有改变你看线段的方式,却改变了你的行为。现在你知道不能相信自己对末端有箭头的线段长度的印象,而且你还知道在一般的缪勒–莱耶错觉中不能相信自己的眼睛。如果有人问起线段的长度,你会说出别人告诉你的长度,而不是你将看到的错误长度。与此相反,当我和同事们在以色列军队中得知领导能力评估实验的有效性很低时,我们很理智地接受了这一事实,但这并未影响我们的感觉及此后的行动。我们在金融公司得到的反应结果更是极端。我现在相信泰勒和我传达给那些主管与投资经理的信息立即就被放到记忆中的黑暗角落里去了,因为放到那里就不会对自己产生什么危害了。

    不管是业余投资者还是专业投资者,都会固执地认为他们能比市场做得更好,与自己曾经接受的经济理论背道而驰,与自己从他人对自身经历公正客观的评价中学到的东西背道而驰,这是为什么呢?为什么金融界中的技能错觉可以长盛不衰?要解释这个问题,我们需要提及此前几章中的很多主题。

    产生错觉最有说服力的心理学原因当然是玩股票的人拥有的都是高水平的技能。他们要查询经济数据和各种预测,查看损益表和资产负债表,评估高层管理的质量,还要对竞争对手进行估量。所有这些都是严肃的工作,需要经过大量训练。当然,从事这项工作的人也有直接(且正当)的机会来运用这些技能。不幸的是,光有评估公司商业前景的技能还不足以确保在股票交易中取得成功,因为股票交易中的关键问题是关于该公司的这些信息是否已经包含在股价里了。交易者显然缺少回答这一关键问题的能力,但他们貌似又对自己的无知一无所知。通过在障碍训练场上观察新兵,我发现交易者的主观自信是一种感觉,不是一种判断。我们对认知放松和联想一致性的理解将这种主观自信深深地植入了系统1。

    最后,有效性错觉和技能错觉是由一种强大的专业文化来支撑的。我们知道,在任何情况下,当身边的人都跟自己持同样的想法时,不论这种想法有多么荒唐,人们都能保持一种不可动摇的信念。如果处于金融领域中的专业文化之中,那么该领域中很大一部分人就会相信自己是能做到别人做不到的极少数人之一。这种想法不足为奇。

    专家预测的准确度比不上扔飞镖的猴子

    人们想当然地从对过去的解读中预测未来,总是忽视“未来是不可预知的”这一观点。正如纳西姆·塔勒布在《黑天鹅》一书中指出的那样,我们更愿意构建和相信对过往的连贯叙述,这种叙述使我们很难接受自己的预测能力的限度。我们都知道后见之明这个道理,金融专家也是在仔细研读每份晚报之后才对当天的大事作出令人信服的解释的。今天的后见之明中有价值的部分,其实昨天就可以预见到,我们不能抑制这种强烈的直觉。我们理解过去所产生的错觉会使我们对自己预测未来的能力过于自信。

    人们常用的“历史的征程”这一意象暗含秩序和方向之意。征程与漫步或者走路不同,不是随意的。我们认为自己应该能通过关注声势浩大的社会运动、文化科技发展,或者几位伟人的意向及能力来解释过去。重大历史事件是由运气决定的,尽管这一说法显然是正确的,却依旧令人震惊。提到20世纪的历史—包括其中的重大社会运动—就很难不提到希特勒、斯大林。在孕育希特勒这个生命的卵子受精后,这个受精卵将来发育为女性的概率为50%。将两件“大事”综合来看,20世纪就有1/8的可能性不会出现这两位掌权人,而一旦缺少了这两个人物,整个历史几乎就会被改写。这两个卵子的受精过程有着重大意义,也是对“长期发展是可以预测的”这一观点的巨大讽刺。

    然而有效预测的错觉仍然没有受到丝毫影响,做预测生意的人充分利用了这一事实,这里所说的从事预测生意的人,不仅有金融专家,还有商界和政界的权威。电视台、电台和各家报纸都有自己的专家团,他们的工作就是对新近发生的事件进行评论,对未来进行预测,而观者和读者就会感觉自己在接受为自己量身定做的或者至少是极有见地的信息。当然,诸位专家和助推者也发自内心地认为他们提供的就是这样的信息。宾夕法尼亚大学心理学家菲利普·泰特罗克(Philip Tetlock)在一项长达20年的里程碑式的研究中解释了所谓的专家预测现象,这项研究发表在他2005年出版的《专家的政治判断:有多好?我们如何得知?》(Expert Political Judgment:How Good Is It? How Can We Know?)一书中。泰特罗克为此话题的进一步讨论设定了一些术语。

    泰特罗克采访了284位以“评论政治和经济走向或提出建议”为职业的人。他让这些人对某些大事在不久的将来的发生概率进行评估,这些事件既涉及他们的专业领域,也涉及他们所知甚少的领域。戈尔巴乔夫在政变中会遭到驱逐吗?美国会参加波斯湾战争吗?哪个国家会成为下一个大型新兴市场?泰特罗克一共搜集了8万份预测。他还问过这些专家是如何得出结论的,若结论是错的,他们会有何种反应,以及他们对不能支持自己立场的论据要如何评估等问题。受试者需要对每件事的3种可能结论的出现概率作出评估:例如在政治自由或经济发展方面,是会维持现状、有所增长还是有所下降。

    结果令人震惊。这些专家表现得很糟糕,如果他们简单地将这3种潜在结果出现的概率平均一下的话,可能会做得更好。换句话说,那些花时间以研究某一特别课题为生的人作出的预测还不如扔飞盘的猴子预测得准确,因为猴子能平均对待每种可能。即使在自己最了解的领域中,专家的预测也比非专业人士好不到哪儿去。

    那些了解更多的人比了解少的人作出的预测强不了多少。知识最丰富的人反而常常不大可靠,原因是学到更多知识的人对自己的技能产生了一种无限放大的错觉,进而变得不切实际、过于自信。泰特罗克写道:“为了获取知识,我们匆忙而草率地预测出利润回馈缩减的临界点。在这个理论高度专门化的时代,没有理由假设顶级期刊的投稿人—著名的政治科学家、各领域研究专家以及经济学家—比记者或《纽约时报》的细心读者强多少。”泰特罗克发现预言者名气越大,他们的预言就越夸张,他写道“那些受欢迎的专家比他们那些远离聚光灯大肆评论的同事更自信”。

    泰特罗克还发现,这些专家不愿承认自己过去错了,非要他们承认错误时,他们就会有一大堆借口,比如我的失误在于时机不好,突发意外之事,或者就说“我错了,但我有正当理由”。专家毕竟也是人,他们被自己的荣耀蒙蔽了,而且还痛恨错误。泰特罗克说,专家犯错误不是因为他们的思考内容,而是因为他们的思考方式。

    他引用了赛亚·柏林所写的关于托尔斯泰的文章中的术语,“刺猬与狐狸”。刺猬“知道一件大事”,对这个世界有它们自己的一套理论,它们在一个清晰的框架下说明某些特殊事件,对不按自己的方式看待事情的人往往没有耐心,而且对自己的预测很有信心,它们尤其不愿承认错误。对于刺猬来说,错误的预测常是由于“时机不佳”或“就差一点儿”。它们固执己见,没有罪过,而这一点正是电视制片人喜欢在节目中看到的。两只刺猬对一个问题各执己见,每只都想攻击对方的愚蠢观点,这真是一场好戏。

    而狐狸却相反,它们是更复杂的思想者。它们不相信仅凭一件大事就可以推动历史的进程(例如,他们不可能接受罗纳德。里根与苏联强硬对抗,仅凭个人力量结束冷战的观点)。相反,这些狐狸认识到,很多不同因素和作用力的相互作用导致了这一结果,这些因素中也包括纯运气因素,而这一结果往往会导致更大、更不可预知的结果。尽管狐狸的表现仍旧很差劲,但在泰特罗克的研究中,它们的得分却最高。谈及请谁参加电视辩论,可能刺猬被选中的概率会大些。

    本章的主要观点并不是说那些企图预测未来的人会犯很多错误,即使不说也是如此。我们应该了解的第一点是,预测错误不可避免,因为这个世界就是不可预知的;我们应该了解的第二点是,我们不应该相信高度主观的自信就是准确性的指示器(低度自信可能更有益处)。

    短期内的走向是可以预测的,且人们的行为和成就能从以往的行为和成就中得到较为准确的预测。不过,我们不应该根据士兵在障碍训练场上的行为来推测他们在军官训练和战场上的行为,测试和现实世界中的行为是由特定情况下的很多因素共同决定的。从有8个新兵的小组中调走一个坚定且自信的,其他人的个性特征也会改变。狙击手的子弹会偏移几厘米,军官的行为也会有所改变。我不否认这些测试的正确性,如果一项测试对重要结果的预测的正确性达到0.20或0.30,这项实验就应该得到推广应用。不过,你不应再有更多奢望了。你应该降低对华尔街炒股人的期望,或者干脆就不相信他们,这些玩股票的人就是些希望自己比市场预测未来股价更准确的人。你也不应该对专家们作出的长期预测抱有很高期望,尽管他们关于不远的将来可能会有有价值的见解。目前,还没有划定分开可预测的未来和不可预测的长远未来的界限。

    示例—有效性错觉与技能错觉“他知道这份记录表明这种疾病的变化几乎是不可预知的,他怎么会对这个病例表现得这么自信?听起来像是有效性错觉。”“她能通过一个富有逻辑连贯性的情景来解释自己所知道的一切,这种连贯性让她感觉很好。”“是什么让他觉得自己比市场更聪明呢?是技能错觉吗?”“她就像只刺猬,有一个可以解释所有事情的理论,这让她产生一种错觉,那就是她了解这个世界。”“问题不在于这些专家是否训练有素,而在于他们的世界是否是可预测的。”第21章 直觉判断与公式运算,孰优孰劣?

    保罗·米尔(Paul Meehl)是个性格奇特而又超凡脱俗的人,是20世纪最有才华的心理学家之一。他曾在明尼苏达大学的心理学系、法学系、精神病学系、神经病学系以及哲学系任教,同时写了宗教、政治科学方面的文章,还曾经研究过老鼠。米尔习惯用统计数字说话,经验丰富,曾对临床心理学的空洞言论大加批评,在精神分析方面有过实践。他写过一些论述心理学研究的哲学基础的文章,这些文章很有思想,我在读研究生时几乎能把它们全部背下来。我从来没见过米尔,但自从我读了他的那本《临床与统计的预测:理论分析与事实回顾》(Clinical vs. Statistical Prediction:A Theoretical Analysis and a Review of the Evidence)后,他便成了我心目中的一位英雄。

    在这本他后来称为“让我烦恼的小书”的薄册子里,米尔回顾了20项研究结果,这些结果分析了以经过训练的专业人士主观印象为基础的“临床预测”,是否比按某种规则将一些分数或等级评定结合在一起作出的“统计”预测更准确。在一项典型的研究中,经过训练的辅导员预测了新生在学年末的成绩。他们与每个学生进行了45分钟的谈话,还参考了他们高中时的成绩、几次能力测试加上一份4页长的学生的个人陈述。数据统计的方法则只采用了其中的一小部分信息,即高中成绩和能力测试。然而,应用数据统计方法得出的结果要比14名辅导员中11个的预测都准确。米尔综合其他多种预测结果得出了相似的结论,这些预测包括违反假释程序、飞行员的成功训练以及刑事累犯情况等。

    不出所料,米尔的著作在临床心理学家中引起了震惊和质疑,这一争议引发了一股研究大潮,自该书出版至今50余载,这股大潮还在继续。将临床预测和统计预测进行对比的研究报告大约已有200篇,然而两者的对峙依然没有分出胜负。大约60%的研究指出,运算手法更准确。其余的比较研究认为两者准确性相近,但似乎数据统计方法更胜一筹,因为它比人工判断的成本低。至今还没有令人信服的例外情况记录在案。

    预测结果的范围已经延伸到了医学的可变因素,比如癌症病人的寿命、住院时间、心脏病的诊断以及婴儿对猝死综合征的敏感性;经济措施,比如新企业的成功前景、银行对信用危机的评估、员工对未来职业的满意度;政府机构所关心的问题,比如收养人的适合条件评估、少年累犯的可能性以及其他暴力行为发生的可能性;还有一些混合结果评估,比如科学报告的评估、橄榄球比赛的胜负预测以及波尔多酒的价格预测。这些领域都有很强的不确定性和不可预见性。我们将其称为“有效性低的环境”。在这些情况下,专家预测的准确性与简单的运算得到的结果相当,甚至还要低于简单运算的结果。

    在该书出版30年后,米尔自信而骄傲地说:“在社会科学中,还没有哪一项研究像这项一样,众多研究虽定性不同,结果却都一致地指向同一个方向,这一点是毫无争议的。”

    专家预测比不上简单运算准确

    奥利·阿申菲尔特(Orley Ashenfelter)是普林斯顿大学的经济学家,爱喝葡萄酒。对于简单的统计学方法的力量可以胜过世界著名学者的观点,阿申菲尔特曾经作过一个引人注目的论证。他想通过波尔多酒生产年所提供的相关信息来预测该酒的未来价值。这个问题之所以重要,是因为优质葡萄酒要想达到质量的顶峰需要很多年。出自同一个酒窖的酒,因其年份不同,在价格上有很大差异。生产时间相差12个月的酒,其价值会相差10倍或更多。预测未来价格的一项因素是它的本质价值,因为投资者买酒就像买艺术品一样,都希望它能够增值。

    人们通常认为葡萄酒酿造期之所以能够决定酒的好坏是受生长期间天气多样性的影响,温暖干燥的夏季会酿就最好的葡萄酒,因此全球变暖貌似会惠及葡萄酒产业。湿润的春天也会使这一产业受益,这样的天气会在不影响质量的情况下增产。阿申菲尔特通过天气的三个特征—夏季生长期的平均温度、丰收期的降水量以及上一个冬季的总降水量—来估测出葡萄酒的特质及特定的年份,再将这些常识性知识转化成数据公式来预测葡萄酒的价格。他的公式给出了未来几年甚至几十年后的准确价格预测。事实上,他的公式所预测的葡萄酒期货价格比新酒的市价更准确。这个新的“米尔模式”向那些为前期价格定位提供建议的专家的估价能力发起了挑战。它还对经济理论发起了挑战,根据这些理论,价格应该能够反映出所有有用信息,包括天气因素。阿申菲尔特的公式非常精确,预测价格与真实价格的相关系数超过了0.9。

    为什么专家预测不如简单运算准确?米尔猜测其中一个原因是这些专家试图变得聪明,总想跳出思维的框框,在预测时会考虑将不同特征进行复杂的结合。复杂化对稀奇古怪的事情是有影响的,但十有八九会降低其正确性,将这些特征简单地整合在一起反而会更好。有几项研究已经表明,即使人们知道公式给出的建议分数,人类决策制定者在面对预测公式时也会自叹弗如。他们认为自己比公式强大,因为人们拥有关于这一问题的其他信息,但他们往往是错的。在米尔看来,在极少数情况下,我们可以利用主观判断,其他时候用判断替代公式并不是个好主意。在一个著名的思维实验中,他描述了一个能够预测某人今晚会不会去看电影的公式,他指出,如果知道此人今天摔断了腿,不用这个公式也罢。于是就有了“断腿原则”。当然,关键问题是断腿的概率太小了,但一旦腿断了,结论也就很明确了。

    专家判断不可取的另一个原因,是人们对复杂信息的最终判断很难达成一致。如果有人要求这些专家对同一信息进行两次评估,他们通常会给出不同的答案。这些不一致之处往往正是真正令人关切的地方。一个经验丰富的放射科医师在两个不同的场合看到同一张片子,这两次检查结果在“正常”与“异常”之间会有20%的偏差。一项让101名审计员独立评价企业内部审计业务可靠性的实验也反映出类似的不一致程度。此前曾有过对不同专业人士判断可靠性的41项研究,研究要求审计员、病理学家、心理学家、组织管理者等专业人士回顾自己原来的判断。尽管他们对每个案例的再次评估在几分钟内就完成了,但实验结果还是说明了判断的不一致性非常典型。不可靠的判断使人们对任何事物都不可能作出有效预测。

    这种普遍的不一致性很有可能是由于系统1对极端条件的依赖所致。我们从那个主要实验可以得知,在我们的环境中有一种不被注意的刺激物在本质上影响着我们的思想和行为。这种影响会从这一时刻波及下一时刻。在炎热的天气里,短暂的凉风会使你感到心情舒畅,这个时刻无论评估什么都会相对更积极一些。对于一个将要获得假释的犯人来说,在假释审核期间的每一顿饭之间,他都会有很大的变化。由于我们对我们思想中的东西没有一个清晰的认识,我们永远不会知道在周围环境有微小的变化时,我们会作出不一样的判断。公式却不会有这样的问题,输入不变,输出也不会改变。可预见性很差—这是米尔和他的后继者们在研究中得出的—不一致性会破坏任何预测的有效性。

    这项研究得出了一个惊人的结论:要提升预测的准确度,最终的结果应由公式给出,在低效的情况下尤其如此。例如,在医学院的学生录取工作中,最终决定一般由面试候选人的老师来做。这一依据是片面的,但他们的推测也有可靠的证据:如果面试官也参与最终的录取工作,面试的过程很可能会降低选拔过程的准确性。这是因为面试官过于相信自己的直觉,他们会很重视个人的喜好而忽略很多其他信息,从而降低了有效性。同样,专家在评估新酒的价格时会品尝酒,这种信息的反面作用大于正面。当然,即使清楚天气对酒质的影响,专家们也无法保证公式那样的一致性。

    继米尔的最初研究之后,促进该领域最重要发展的要数罗宾。道斯所发表的著名论文《决定中非正当线性模型的稳定之美》了。社会科学中常用的数据统计分析是按照某一运算法则评估不同的预测因素,这叫做多次回归,且已经被运用于常用软件中。多次回归中体现的逻辑很有说服力:它找到了将各种预测因素权衡后再整合到一起的最理想公式。然而,道斯发现,这种复杂的数据运算没什么用处,人们也可以通过选取一组对于预测结果以及提升价值都很有效的数据作出类似的判断(使用标准数据或者是等级)。一个公式与这些预测因素以同样的权重结合起来预测新事物才有可能像使用多次回归处理原始样本一样取得理想的预测效果。更新研究则更深入地指出:均衡考虑各项预测因素的公式更有优势,因为它们不受样本突变的影响。

    这种基于等权原则的计算方案的成功有着重要的实践意义:它可以在不作任何事前统计研究的基础上就能开发出有用的运算方法。这种基于现有数据或者常识的简单等权公式通常可以预测出意义重大的结果。在一个令人难忘的例子中,道斯指出了婚姻的稳定性可以通过一个公式来预测:

    做爱的频率减去争吵的频率
    你应该不会希望得到的结果是负数。

    这个研究的重要结论是,在信封背面构思的一个运算公式通常可以和理想化的公式媲美,与专家的言论相比肯定更胜一筹了。这种逻辑适用于很多领域,从证券投资组合经理对股票的选择,到医生和病人对治疗方式的选择。

    一项拯救了千万婴儿的简单运算法堪称对于这项研究的经典应用。妇产科医生清楚地知道,如果婴儿在出生后的几分钟内无法正常呼吸的话,他/她就会有很大的脑损伤甚至夭折的风险。在1953年麻醉学家弗吉尼亚·阿普加(Virginia Apgar)介入之前,内科医生和接生人员一直在用他们的临床经验来判断婴儿是否处于危险状态,不同人员的依据也不尽相同。一些人侧重于观察孩子的呼吸情况,另一些人则观察婴儿的啼哭频率。由于没有一个标准,人们经常错过危险信号,导致许多新生儿不幸夭折。

    一天早饭后,一个住院医生问阿普加医生如何对新生儿作系统评估。她回答道:“这很简单,你可以这样做。”阿普加快速写下了5个变量(心率、呼吸、反应、肌肉强度和颜色)以及3个分数(0、1、2分别代表各个变量的稳健度)。阿普加意识到自己可能会有所突破,而且这一突破还可能被应用到所有的产房中,她便开始用这种方法评估每一个出生一分钟的婴儿。一个得到8分以上的婴儿一般是肤色粉红、蠕动、啼哭、面部扭曲并拥有100次以上的脉搏,这样的婴儿外形很好。低于4分的婴儿一般是浑身青紫、肌肉松弛、不爱动且心跳微弱,这样的婴儿需要立即救治。应用了阿普加的评分原则后,产房的护士们终于在判断婴儿情况是否危险的问题上有了一套标准,人们认为这个公式对减少婴儿的夭折率起到了很重要的作用。现在,阿普加的方法依然应用于每一个产房中。阿图尔·甘德(Atul Gawande)近期的著作《一份清单宣言》(A Checklist Manifesto)也介绍了一些其他案例,以说明列表以及简单原则的优点。

    让许多业内人士烦恼的运算法

    从一开始,很多临床心理学家就不认同米尔的观点,对此持怀疑态度。他们显然幻想过自己有长远预测的能力。我们在深思熟虑后,不难发现这种幻想是如何产生的,也可以理解临床医生为何反对米尔的研究。

    证明临床统计可信度低的统计证据与临床医师对自己判断质量的日常体验相悖。经常接触患者的医生对每一个疗程都有其直觉,他们可以预测病人对干预治疗会有什么反应,并猜测下一步会发生什么。很多推测都得到了证实,这显示出临床医师真实的临床诊断能力。

    问题是在整个治疗期间,这些正确的判断涉及的都是短期预测,而且是在当面诊疗后作出的预测,这项技能是治疗师经过长期实践得来的。他们失败的任务往往需要对病人的病情作长远的预测。想要做到这一点尤为困难,因为即使是最好的公式也只能是有个大概,临床医师也不可能完全了解,这需要患者多年的反馈,而不仅仅是当时短暂的治疗反馈。然而,临床医师可以出色完成的任务与他们完全不能做的事情之间没有绝对的界限,当然他们自己也是如此认为。他们知道自己有医术,但却不一定知道医术的终极。当然,认为机械地将几个变量整合到一起就会超过人工判断微妙的复杂性的想法对有经验的临床医师来说显然也是错误的。

    这场关于临床预测与数据统计预测孰优孰劣的辩论总会涉及伦理道德的范畴。米尔写道,统计方法被那些临床医师批评为“机械化、自动化、附加物、模式化、人工化、不真实、表面化、武断、不完善、无生机、迂腐、片面、无关紧要、武断、数据化、表面化、死板、无前景、学术化、伪科学且很盲目”。相反,临床方法被它的支持者称赞为“灵活、全球化、有意义、正统、精细、统一、机构完整、有规律可循、系统化、丰富、深邃、真实、科学、成熟、准确、生动、正确、自然、可行,以及可以被理解”。

    这种观点我们都可以理解。无论是约翰·亨利(John Henry)在山顶上挥锤,还是国际象棋天才盖瑞·卡斯帕罗夫(Garry Kasparov)与计算机“深蓝”的对决,我们总会同情我们人类自己。对通过数理统计来作决定的厌恶情绪影响着人类,这种厌恶源于我们本身对自然事物的偏好以及对人工合成产物的否定。选苹果时,如果有人问我们喜欢有机的苹果还是商业种植的,大多数人都会倾向于“全天然”的那个。即使被告知两者的口味相同、营养相同而且同样卫生,很多人还是会选择有机水果。商人们甚至发现,标签上印有“全天然”或者“不添加防腐剂”时,销量就会增加。

    欧洲葡萄酒协会对阿申菲尔特推测波尔多酒价格这一公式的反应表明,业内人士对揭秘专业知识有着强烈的抵触情绪。阿申菲尔特的公式对公众而言是一种福祉:我们原本以为各地的葡萄酒爱好者都会感谢阿申菲尔特,他提出的公式提高了这些人辨别葡萄酒质量的能力,使他们能够分辨哪些葡萄酒多年后会有上乘的品质。然而事实却并非如此,据《纽约时报》报道,法国葡萄酒界对此的表现是在“愤怒和歇斯底里之间”。阿申菲尔特指出一个品酒专家认为他的发现“荒唐可笑”,还有一个人也嘲笑他“就像没有亲自看过电影却对这部电影评头论足”。

    作重要决定时,对运算法的偏见就会被放大。米尔指出:“有些临床医师会因一个‘盲目的、机械化的’公式而耽误了可以治疗的病例,这是很可怕的,但我也没有什么好办法来缓和这种令人恐惧的情形。”相反,米尔和其他的运算法支持者激烈争论,如果说运算法在作出重大决定的时候可以减少错误,那么仍旧凭直觉判断就是不道德的。他们的论述有理有据,但却与一个心理学事实背道而驰:对大多数人来说,错误的原因最重要。由于运算法导致婴儿死亡的案例比人为因素造成的悲剧更让人感到悲痛。这种情感强烈程度已经上升到道德取向的层面了。

    值得庆幸的是,随着运算法在生活中适用范围的不断扩大,人们也在慢慢接受它。我们在寻找喜欢的书籍或音乐时,会接受软件推荐的选项;我们理所当然地认为人为因素并没有影响信贷限额的决定;我们也越来越习惯那些以简单的运算法形式出现的指导方针,比如说我们应该努力将有益和有害的胆固醇水平维持在什么比例。公众现在已经意识到,在体育界公式能比人做得更好:一个职业球队该给新队员开多少薪水,或者在第四节的什么时候该踢凌空球。随着运算法使用范围的扩大,大多数人第一次接触米尔在他那本“让我烦恼的小书”中提到的结果模式时,他们的不适应感最终必将会降低。

    “闭上眼睛”的直觉判断比主观判断更可取

    1955年,作为以色列国防军中一个21岁的陆军中尉,我接受指派为全军建立一套测试系统。你也许会惊讶为什么会将如此重任交给我这么年轻的人,但请记住,以色列当时建国才7年,国内所有的机构都在筹建当中,必须有人去建设。今天听来有些奇怪,我的心理学学士学位竟然能够证明我有能力成为军中最训练有素的心理学家。我的顶头上司是一个才华横溢的研究者,他拥有化学学士学位。

    当我接到任务时,例行面试已经准备就绪。每一个入伍的士兵都要完成一系列心理素质测试,对那些有作战任务的士兵要进行个性评估。我们的目标是要给这些新兵对作战适应性打一个分,并在步兵、炮兵、装甲兵等兵种中给他们选择一个最适合他们个性的兵种。面试官们本身也是新兵,之所以被选中做面试官是因为她们智商高,喜欢与人打交道,她们中的大多数人是当时不必参战的女兵。经过几周培训后,她们学会如何安排一个15~20分钟的面试,培训人员还鼓励她们要覆盖多个话题,而且要尽量对被测试者日后在军中的表现情况形成一个整体的印象。

    不幸的是,接下来的评估已经显示这种测试过程对预测新兵日后成功与否毫无用处。于是他们要求我设计一个更有用但不会更耗时的测试。他们还要求我设计新的面试方法,并评估这个方法的准确性。从专业角度来讲,这些任务的难度与让我建一座横跨亚马孙河的大桥差不多。

    幸运的是,我读过保罗·米尔那本一年前出版发行的“小书”。我很相信书中的论证,认为简单的运算法优于临床的直觉判断。我总结出,当前的面试之所以失败,部分原因是它允许面试者按照个人的喜好作决定,这个决定会因面试者的心理活动而发生一些变动。相反,我们应该用限时的项目来获得受试者在正常环境下更具体的信息。我从米尔那里还学到了我们应该摒弃这种用面试者的整体评估来给新兵打分的方法。米尔的书中指出这种评估不值得相信,而运算法从分散的评价中得出的结果则更有价值。

    我决定采用这样的过程,面试者要评估几项相关个性特征,为每项单独打分。最后的作战适应性结果由计算机根据一个特定的公式给出,面试者不干预。我列了一个表格,其中包含与作战表现相关的6个特点,包括责任心、社交能力以及男子气概等。之后我再针对每个特点整理出一系列关于他们入伍之前生活的问题,例如之前做过几份工作、工作和学习时是否准时、和朋友交往的频率,以及他的兴趣爱好和参加过的运动等。这便使我能尽量客观地从每个角度对新兵进行评估。

    通过这些标准化的真实问题,我希望能够排除光环效应,排除人们喜好的第一印象对判断结果的影响。为了进一步预防各种光环的影响,我要求面试官依照固定的顺序去测试这6个特点,在测试下一个特点之前要对前一个特点按5分制打分。我告诉他们不要为新兵在部队的未来发展操心。他们唯一的工作就是找出与新兵的过去相关的信息并以此来给每一个特性打分。“你们的作用就是提供可靠的测定值,”我说,“处理预测有效性的工作让我来。”我这句话的意思是我要用公式来整合他们的具体得分。

    面试官们齐声抗议这种安排。这些优秀的年轻人对我这个和他们差不多大的中尉的命令有点不情愿,毕竟这样的要求禁止他们运用直觉,将注意力完全放在一些无聊的真实问题上。其中一个人抱怨说:“你在把我们变成机器人吧!”所以我妥协了,“按照要求进行测试吧,”我说,“请完全按照要求来进行测试,测试完后,就像许愿那样闭上眼睛,将新兵想象成一个战士,并给他打分。

    我们对几百次面试都采用了这个新方法。数月之后,我们收集了新兵指挥中心对他们表现的评价,这使我们很欣喜。正如米尔的书中提到的那样,新的测试过程比原来的过程有质的飞跃。虽然离完美还有一定差距,但6项指标整合起来作出的预测比之前的整体评估要准确得多。我们已经从“徒劳”进步到了“有效”。

    面试官“闭上眼睛”后的直觉判断也很准确,甚至和整合6项指标得到的运算结果一样准确,这是我最为惊喜的地方。我从这一发现中学到了毕生难忘的一课:即使是不那么正规严肃的遴选面试,直觉也会起到积极作用,当然前提是按照规定收集客观信息并对不同特性进行独立评分。我建立了一个给予“闭眼”评估和整合6项指标同等权重的公式。从这件事中我学到一个普遍规律:不要简单地相信直觉判断—无论是你自己的还是他人的—但也不要完全抛开它。

    45年后,我获得了诺贝尔经济学奖,在以色列一时间也小有名气。在一次访问中,一些人想带我看看旧时服役的军事基地,那里依然矗立着测试新兵的房子。有人把我介绍给心理组的司令部官员,她向我介绍了目前的测试方法,和我当时设计的没有什么两样。在那里,大量研究显示该测试依然有效。最后在介绍如何引导面试官时,她补充道:“我们告诉他们,‘闭上你们的眼睛’。”

    本章的内容已经在部队人力测试以外的项目中也得到了应用。按照米尔和道斯的原则进行的测试过程相对来说不怎么费力,但却相当严格。设想你要为你的公司招聘一名销售人员。如果真的想选择最合适的人选,那么你应该这样做:首先,选择一些这个岗位要求的先决条件(比如技能熟练程度、个性稳重程度、可靠性等)。不要列太多,6个左右即可。这些条件最好相对独立,同时要保证你通过一个问题就能够对这几个条件进行评估。下一步就是为每个条件都列出一些问题,并想好如何对其进行评估,分数为1~5分。你应该清楚什么情况“最弱”,什么情况“最强”。

    作这些准备大约需要半个小时,这种很小的投入能保证你招聘到的员工的质量。为了避免光环效应,你必须在一定时间内完成某一个特性的信息采集并对其打分,之后才能测试下一个。不要越过某个特性去测其他项目。评估每个候选者时,要将这6项评分累加起来。由于你要负责作出最终决定,那就不要“闭眼”测试了。即使你认为其他候选人更合适,也一定要雇用那个得分最高的人—请尽量克制自己创造“断腿”机会改变排位的想法。大量的研究可以向你保证:只要按照该过程操作,你就能找到最合适的人选。这比人们通常用的那些没有准备就开始面试,并依靠“我看到了他深邃的眼神,我喜欢自己看到的一切“这类主观判断要好得多。

    示例—人工判断和公式运算“不管何时,只要公式能替代人工判断,我们至少应该考虑一下(运算法)。”“他认为自己的判断既缜密又微妙,但实际上把一些分数简单地整合在一起也许会更胜一筹。”“我们应该事先考虑清楚自己有多重视这些候选者以往的表现,否则,对他们的第一印象会对我们产生过多的影响。”第22章 什么时候可以相信专家的直觉?

    专业人士的争论暴露了学术界最为糟糕的一面。科学杂志上偶尔会有一些交流文章,开始是某人对他人研究的批判性评论,接着就是被批判专家的回复和反驳。我一直认为写这种文章是在浪费时间。最初的那篇批判若言辞犀利,其回复和反驳便尤其激烈,我将其称为对始作俑者的讽刺和深度讽刺。回复很少会对尖锐的批判作出任何让步,而且也没听说过某个反驳者会承认开始的那篇批判性文章有任何误导性或者错误。只有在少数情况下,在我认为批判具有严重的误导性时,我才会做出回应。这是因为,此时不回复可能会被视为对错误的默认,但我从来没有发现这些不友善的批判有什么指导意义。为了寻求另一种方式来化解分歧,我曾参与了几次“对手合作”活动,在这一活动中,对某项科学研究见解不同的学者需要就他们的不同观点共同撰写一篇论文,有时还要一起进行研究。在争论特别激烈的情况下,这项研究则由裁决者主持。

    我与加里·克莱因进行的对手合作是我最为满意也是最有成效的一次。加里·克莱因是某个协会的优秀领导,他所在协会的学者和成员都不看好我做的工作。此协会的人称他们自己为自然主义决策学者,他们中的大多数人都在各类组织里工作,在那里他们经常研究专家们是怎样工作的。他们坚持反对在研究启发式和偏见时关注偏见。他们认为这种研究模式过于关注失败,并且是通过仿真实验进行研究,而不是通过真人真事。他们高度怀疑以严谨的计算来代替人工判断的价值,所以,他们并不推崇保罗·米尔。多年来,加里·克莱因一直保持着明确的立场。

    我们的合作几乎没有奠定什么美好友谊的基础,但整个过程中却有很多值得铭记的东西。过去我从不认为直觉总会产生误导。自从读过克莱因于20世纪70年代撰写的一篇论文的草稿之后,我曾一度非常推崇他关于消防员专业技能的研究,他的著作《力量的源泉》也给我留下了深刻的印象。这本书用很大篇幅分析了经验丰富的专家是如何开发出直觉能力的。我邀请克莱因一起参与直觉成败界限的划分工作。他对这个想法很感兴趣,虽然我们并不肯定这项工作会成功,但还是一起开始了这项工作。

    我们首先要回答一个具体的问题:什么时候你可以相信那些声称自己有直觉能力的经验丰富的专业人员?很明显,克莱因更容易相信这些专业人员的直觉,而我则更容易对此心存质疑。不过,我们在回答这个一般性问题时是否可以遵从一定的原则呢?在七八年的时间里,我们有过多次讨论,解决了许多分歧,也发生过不止一次的争执。我们写过很多稿件,成了朋友,最终还联合发表了一篇文章,文章的标题见证了我们的经历—“相信专家直觉的条件:达成一致”。的确,我们并没有遇到真正存有分歧的问题,但我们也没有真正达成一致。

    直觉就在眨眼之间

    当我和克莱因进行上述项目的研究时,马尔科姆·格拉德威尔(Malcolm Gladwell)的畅销书《眨眼之间》(Blink)问世了。这本书使我们更加确信我们对共同研究的问题的观点是一致的。格拉德威尔这本书开篇的故事令人印象深刻:一些艺术名家鉴赏雕像中的杰作—一个阔步行走的男孩雕像。有些专家本能地认为这个雕像是仿冒品,但也说不清楚是什么让自己有这种感觉的。读了这本书的人(有数百万人读过)都认为直觉在其中起了作用。这些专家知道雕塑是仿冒的,却不知道自己为什么知道—这正是对直觉的定义。这个故事好像在暗示,对引导这些专家的线索进行系统调查应该会失败。不过,我和克莱因却并不这样认为,我们觉得,这样的调查很有必要,而且,如果方法得当(克莱因知道该怎么做),是有可能成功的。

    读过这个故事的读者会对专家近乎神奇的直觉啧啧称奇,但格拉德威尔本人却并不那样认为。在随后一章中,他讲述了一个因相信直觉而造成的巨大失败:美国总统哈丁之所以当选是因为他符合总统的相貌特征:高个子、宽下巴,是典型的强硬而果断的领导者形象。人们把票投给他没有其他理由,只是因为他的外表看起来强硬和果断,就认为他是这样的人。之所以出现了哈丁作为总统表现会如何的直觉预测是因为选民替换了问题。本书的读者会期待自己也能拥有这种信心满满的直觉。

    克莱因形成其直觉观点的早期经历与我的不同。我的观点是通过观察自己的有效性错觉以及阅读保罗。米尔关于临床预测缺点的实证研究而形成的。克莱因的观点是在他对火场指挥官(消防队的领导)的早期研究的基础上形成的。在指挥官对抗火灾时,他进行了跟踪调查并在火灾扑灭后对指挥官当时做决策的想法进行了采访。克莱因在我们合作的文章中写道,他和他的合作者:

    调查指挥官们是怎样不加选择就做出正确决策的。最初的假设是指挥官会将其分析限制在两个选项中,但这个假设已被证实是错误的。事实上,指挥官只萌生了一个选项,且这个选项也正是他们所需要的。他们花了超过10年的时间进行真实和虚拟的演练,以识别出合适的选项作为首选,而在有真实需要时,他们就可以利用这个累积了多年的指令库。他们评估某个选项的方法是在脑部模拟这个选项,看它是否适用于当时的情况……如果他们考虑的这个做法大概可行,他们就会这样做;如果这样做不太好,他们就会对其进行调整;如果不易调整,他们就会选择下一个最有可能的选项。然后,重复上面所说的过程,直到找到一个合适的做法。

    克莱因将上面的描述定义为一种决策制定理论,他称之为预认知决策模式。预认知决策模式可以用来解释消防员的专业技能,也可用来解释其他领域的专业技能,包括下象棋。系统1和系统2同时参与了这个过程。在第一阶段,暂定计划通过联想记忆(即系统1)的自主功能呈现在大脑中。下一阶段是一个需要深思熟虑的过程,大脑会对这个计划进行模拟以检测其是否有效,这是在系统2的运作下进行的。不久前,赫伯特·西蒙提出将直觉性决策制定模式视为从认知模式中提出想法,而且,赫伯特·西蒙可能是唯一一个被各路决策研究者公认为英雄和创始人的学者。我在本书的序言部分曾引用了赫伯特·西蒙对直觉的定义,现在重复一下会更有意义:“这个棋局已经给了我们提示,根据这个提示我们可以搜寻到大脑存储的信息,而这个信息就能给出答案。直觉只不过是人们的认知而已。”

    这个有力的陈述用日常经验的记忆解释了直觉的不可思议。消防员凭借其对危险的直觉(“尽管不知道自己是如何拥有这种直觉的”)能在房屋塌陷前逃脱的故事的确令人称奇,然而,我们也不知道自己为什么立刻就知道一进屋看到的那个人就是我们的朋友彼得。西蒙这番话的寓意是,人们在不知情的情况下就能知道,其中的奥秘并非直觉的显著特征,而是大脑的常规活动。

    专家型直觉的习得

    构成直觉的信息是怎样“储存在记忆中”的呢?某些类型的直觉能够快速习得。我们从祖先那里继承了一个重要机制,学会何时应该感到恐惧。的确,“一朝被蛇咬,十年怕井绳。”我们中的许多人都有过这样深刻的记忆,记得有家餐厅有一道自己不喜欢的菜,于是我们就一直不愿再进那家餐厅了。在接近曾发生过令人不快的事件的地点时,我们都会感到紧张,即使当时根本不可能再次发生同样的事情也会感到紧张。对我来说,前往旧金山机场的斜坡就是这样的一个地点。多年前,有个怒路症司机从上高速公路之后就一直跟在我后面,他还摇下车窗,骂了我几句脏话。我一直都不明白他为何会发怒,但我每次经过那个斜坡时,总能记起他的声音。

    我对于这件事的记忆是有意识的,这也充分解释了我当时的情绪。但在许多情况下,你会在去到某个特别的地方或是听到某个特别的说法时感到不自在,即使这个地方或这个说法并没有触发记忆中的某个事件时也是如此。如若事后真有什么不好的事发生,你的后见之明就会将那种不自在看做是直觉。这种情绪学习的模式与巴甫洛夫著名的条件反射实验密切相关。在那个实验中,狗学会了识别食物到来时的铃声。巴甫洛夫的狗所学到的可以称为习得的希望,而习得的恐惧则更容易被感知。

    恐惧可以被感知,事实上也很容易被感知,因为无须亲身经历只需通过语言就能感知。对危险有着“第六感”的消防员肯定有很多机会讨论及思考多种他并没有亲自参与的火灾,并在脑中对会有什么样的线索出现以及该怎样反应进行演练。我还记得,一名没有作战经历的年轻排长在带领部队穿越峡谷时会很紧张,因为他曾经学习过这样的地形很可能会有埋伏。学习需要一定的反复强化。

    情感学习可能很快,但学习我们所说的“专业技能”通常需要很长时间。学习专业技能,例如高水平的国际象棋、职业篮球以及消防技能,很复杂也很缓慢,因为某个领域的专业技能涉及的不仅是一项单一的技能,还包含了很多小技巧。象棋就是一个很好的例子。一名专业棋手一眼就能看清一个复杂的棋局,但达到那样的能力水平却需要很多年。对象棋大师的各项研究表明,想要达到高水平需要至少10000个小时的专注练习(大约需要在6年的时间里每天练习5小时)。在注意力高度集中的这若干个小时内,一个谨慎的棋手会熟悉数以千计的棋局,且每个棋局中的棋子都有攻守关系。

    学习高水平象棋好比学习阅读。一个一年级的学生需要努力学习单个字母,再将这些字母组合成音节和单词,但一个成年人则可以掌握所有从句。一个精于阅读的人还可以将熟悉的成分组合在一个新的句型中,并能快速“识别”且正确读出一个她从未见过的单词。重复出现且相互关联的棋子如同字母,而棋局则像一个长的单词或是句子。

    技能过硬的读者第一次看到刘易斯·卡罗尔(Lewis Carroll)所作的《隐语重重》(Jabberwocky)的开篇诗句,就能够以完美的节奏和音调读出来,且朗朗上口:

    是滑菱鲆在缓慢滑动,时而翻转,时而平衡;

    所有的扭捏作态展示了,蠢人的早熟、懒人的平庸。

    掌握下棋的技巧要比学习朗读更难也更慢,因为象棋的“字母表”含有更多的字母,每个“单词”也包含许多字母。然而,经过上千小时的练习以后,象棋大师能够一眼就“读”出棋局。他想出的那几步棋通常也都很高明,有时还会令对手措手不及。他们可以处理自己从未遇到过的“单词”,还能找到一个新的方法去解释一个熟悉的“单词”。

    环境有规律可循,直觉才可相信

    我和克莱因很快就发现,我们对直觉技能的本质和习得的观点一致,但还需就我们的关键问题达成共识,即什么时候可以相信一个自信的专业人士的直觉。

    最终,我们推断我们之间出现分歧的一部分原因是由于我们的专业不同。克莱恩花了很多时间研究消防指挥官、临床护士以及其他真正具有专业技能的职业。我的大多数时间则用在了对临床医生、股票投资者以及政治学者等人的研究上,这些人普遍都在做毫无依据的长期预测。克莱因则更愿意相信那些称自己有直觉的专家,据他说,这是因为真正的专家知道自己知识的局限。我与他争辩道,也有许多伪专家并不清楚他们其实并不知道自己正在做什么(有效性错觉),总的来说,人们的主观自信普遍过高而且通常毫无根据。

    早些时候,我研究过人们自信的来源,认为以下两点与之相关:认知放松和一致性。如果我们能很轻松地想到自己想要的那个故事,且各个情节之间并无矛盾时,我们就会很有自信。但是放松和一致并不能保证我们充满自信的观点就是正确的。联想机制会抑制怀疑并引发与当前情况相符合的想法与信息。遵从眼见即为事实原则的大脑可通过忽略自己所不知道的事而变得过于自信。因此,许多人容易对没有事实根据的直觉怀有高度的自信也就不足为奇了。我和克莱因最终就一个重要的原则达成了共识:人们对直觉的自信心不能作为他们判断的有效性的可靠指标。换句话说,当有人告诉你你应该相信他们的判断时,不要相信他们,也不要相信自己。

    如果主观自信不可信的话,我们该怎样评估直觉判断的有效性呢?判断在什么时候才能反映出真实的技能水平呢?什么时候会显现出有效性错觉呢?回答这些问题需考虑到技能习得的两个基本条件:

    ·一个可预测的、有足够规律可循的环境。

    ·一次通过长期训练学习这些规律的机会。

    当满足以上两个条件时,就可以培养出直觉来了。象棋这个活动就需要在极具规律的环境下进行,桥牌和扑克也提供了有力的、能支撑技能的统计学规律。医生、护士、运动员以及消防员面对的都是复杂但却基本有序的情境。尽管系统2并没有学会如何给它们命名,但事实上专家的系统1学会使用的那些高度有效的线索才是引发加里。克莱因所描述的准确的直觉的原因。相反,作长期预测的股票投资者以及政治学者是在有效性为零的环境中进行的。他们的失败反映了他们尝试预测的事物基本是不可预见的。

    有些环境毫无规律可言。罗宾·霍格思(Robin Hogarth)曾描述过一些“恶劣的”环境,在这些环境中,专业人员可能会从自己的经历中得到错误的信息。他借鉴了刘易斯·托马斯(Lewis Thomas)那个关于医生的例子。在20世纪初,某位医生总能凭直觉来预测哪位来就诊的人会染上伤寒。不幸的是,他是通过咽部触诊来证实自己的预测的,但在诊断两名门诊病人的间隙并没有洗手。于是,来看病的人接二连三地病了,医生也开始认为自己的诊断不会有错。他的预测是准确的,但这并不是因为他有专家型直觉。

    米尔提到的那些临床医生并不是无能,他们的失败也不是因为能力不够。他们表现不佳是因为其任务没有简单的解决方案。临床医生的窘境并没有在零效度环境下作出的政治方面的长期预测极端,但也是基于低效度的情境,准确性也就不会很高。我们知道事实就是如此,因为虽然最好的运算法的准确率是高于人工判断的,但也不会非常准确。的确,米尔及其追随者的这些研究从未提供过“确凿的证据”,这些证据被临床医生完全忽略了,但能被运算法察觉到。这类情况的极端失败案例不可能出现,因为人类的学习能力通常是高效的。若存在有助于猜测的有力线索,人们一旦得到机会就一定能发掘出来。在毫无章法的环境下,运算法远远优于人工判断有两个原因:运算法比人工判断更可能观察到不怎么有效的线索,还可能通过利用这样的线索将正确性保持在适度水平上。

    在这样一个不可预知的世界里,人们出现预测错误也是无可厚非的。但是,若专业人士认为自己可以成功预测不可能的任务,我们就可以对其进行指摘。在一个不可预知的环境下声称自己有正确的直觉至少也会被称做自我妄想,有时则更难听。如果缺乏有效的线索,直觉的“准确性”不是因为巧合就是在撒谎。如果这个结论让你惊讶,那说明你仍然相信直觉是不可思议的。请记住这条规则:在环境缺乏牢靠的规律时,不要相信直觉。

    环境中的某些规律会比其他规律更容易察觉并容易加以利用。想想你是如何形成自己的刹车方式的。当你学习转弯时,你渐渐学会了何时放油门以及用多大力气踩刹车。现在,弯道改变了,但多次转弯的经历已使你能在任何弯道上在恰当的时间以恰当的力度踩刹车。学习这项技能的条件是很理想的,因为你在每次遇到弯道时都能收到及时、清楚的反馈:转弯顺畅时你会感到很舒服,但如果刹车没有踩到底,你就会感到车子有些难以控制。港口引航员调动大型船舶的情境也有一定的规律,但只凭借经验是很难学到这项技能的,因为行动之间可能会有长时间的推迟,这样的推迟还会带来显著的后果。专业人员是否有机会培养直觉性专业技能主要取决于反馈的质量和速度,以及是否有足够的时间进行练习。

    专业技能不是一项单一的技能,而是由许多技能组成的。同一个专业人员可能在她的领域中是个行家,但在别的领域是个新手。等到象棋新手成为专家的时候,他们就已经“看清所有的棋局(或大部分棋局)”了,就这点而言,象棋是个例外。外科医生在有些手术中表现得比其他人更为专业。另外,专业技能的某些方面可能会比其他方面更容易学。精神治疗医师有很多机会观察患者对他们所说的话的即时反应,回馈使他们培养了相关的直觉性技能,使他们可以使用能平息怒火、增强信心以及使患者集中注意力的语言和音调。另一方面,治疗师没有机会判断对不同的病人应该使用哪一种治疗方法才最有效。他们收到的反馈是病人长期的治疗结果,这种反馈量少且滞后,还有可能根本没有反馈,无论哪种情况都无法运用他们从经验中学到的知识。

    在医学专业中,充分的反馈可以使麻醉师受益,因为他们的行为很快就会见效。相反,放射科医生就不怎么了解他们诊断的准确性了,也不知道他们是否有漏诊。因此,麻醉师更能培养出有用的直觉性技能。如果一个麻醉师说:“我感到有些不对劲儿。”手术室的人就应该开始准备应急计划。

    像主观自信的那个例子一样,专家可能不知道他们专业技能的局限性。一位有经验的精神治疗师知道自己擅长揣测患者的想法,并对患者接下来要说些什么有一定的直觉。她很容易就能预测出患者明年的康复状况,但这个结论并不十分正确。短期预测和长期预测不同,治疗师有足够的机会去接触其中一个患者,却不能了解其他患者。同样,财务专家对他所在公司多方面的贸易情况都比较熟悉,但对如何选择股票就不那么熟悉了。中东的某位专家知道许多事,但却无法知道未来。临床心理学家、股票投资者以及经济学者都掌握了各自领域的直觉性技能,但他们却不能够鉴别出因直觉导致错误的情境和任务。这些未能识别的专业技能的局限性解释了专家总是过分自信的原因。

    直觉的对错评估

    在我们的实验快结束时,我和加里·克莱恩就上面提及的那个问题给出了一个一般性答案:什么时候可以相信有经验的专业人士的直觉?我们的结论是,大多数情况下,我们还是可以将可能是有效的直觉与可能是无效的直觉区分开来的。这就好比判断一件艺术作品的真假一样,关注这件作品的出处通常比关注作品本身的判断准确率更高。如果环境有足够的规律性,并且在判断时有机会掌握这些规律,联想机制就会识别这些情境并做出快速且准确的预测与决策。这些条件若得到满足,你就可以相信某个人的直觉。

    不幸的是,联想机制同样会产生主观的强迫性直觉,这种直觉是错误的。如果我们观察有天赋的年轻人在象棋方面取得的进步,就会非常清楚完美的技能不是短时间就能练就的。在接近完美的过程中,他会犯错误,而且对这些错误还信心十足。当评估专家的直觉时,你应该时刻考虑到该专家是否有足够的机会挖掘线索,即使是在有规律的环境下。

    在一个不够规律或效度较低的环境中,判断启发式就会被激活。系统1通常会用另一个问题快速替换掉难题,创造出并不存在的关联。此时回答的问题并不是预期的那一个,但这个答案会很快出现在人们的脑海中,会通过系统2宽松的审查。你可能想预测某个公司的商业前景,并相信这就是你正在判断的事,但实际上,你对这家公司高管能力的印象主宰了你的评估。因为替代是自动发生的,你通常并不清楚自己(你的系统2)赞同并采纳的判断源自何处。如果这是唯一出现在大脑里的判断,你可能就无法将它与你根据专业直觉得来的有效判断进行主观上的区分。这就是主观自信不能作为直觉准确性指标的原因:即使判断的是错误的问题,在作出这一判断时仍可能有高度的自信。

    你可能会问:为什么我和加里。克莱因立即想到了通过评估环境规律和专家学习经历的方法来估测专家的直觉能力,而不是通过专家的自信程度来评判,还会问我们答案可能是什么。其实解决方案一开始就很明显。我们先前就知道火场指挥官和儿科护士的直觉是有效的,而米尔研究的那些专业人士以及股票投资者和经济学者的直觉则不准确。

    很难说清是什么使我们的实验经年累月进行这么久,是长时间的讨论、不断交换演示稿、数以百计的商谈邮件,还是不止一次想要放弃的想法,我们真的不清楚。但如果某个项目完成得相当好,就常会有这样的事情发生:一旦你明白了主要结论,这个结论就总是看似很明显。

    正如我们那篇文章的标题所示,我和克莱因所持的观点并不像我们预期的那样不同,对于我们提出的实质性问题,我们采用了一些联合方案。然而,我们发觉我们前期的分歧不单单是观念上的不同,还有态度、情感和品位上的不同,而且这些分歧多年来都没有太大变化,这一点在我们认为最有趣和最感兴趣的事情上体现得最明显。当有人提到“偏见”这个词时,克莱恩的脸部仍然会有轻微抽搐,他仍然会嘲笑由于运算或是正式程序导致的明显荒谬的决策;而我则会将这些偶尔由运算导致的错误视为提高的方法。另一方面,看到在零效度的情况下一些自负的专家仍声称自己有很准的直觉时,我比克莱因更喜欢看好戏。然而,从长远来看,尽可能多地发现两个人观念方面的共识肯定比寻找我们在情感方面的分歧更加重要。

    示例—专家型直觉“对这个特别任务,她有多少专业技能?做过多少练习?”“他真的相信这些新成立的公司的环境有足够的规律来证明与基础比率背道而驰的直觉吗?”“她对自己的决策非常自信,但主观自信并不是评估准确性的标准。”“他真的有机会学习吗?对他判断的反馈他接受得有多快、多彻底?”第23章 努力养成采纳外部意见的决策习惯

    在和阿莫斯合作几年之后,我说服了以色列教育部的一些官员在高中开设有关判断与决策的课程。我组建了一支团队,其中包括几位经验丰富的老师,我教授的心理学专业的一些学生,以及希伯来大学教育学院的院长希莫·福克斯(Seymour Fox)。我们设计了课程内容,还编写了教材。

    我们每周五下午都开一次例会,这一惯例维持了约一年,我们制定出内容详细的教学大纲,完成了教材几个章节的编写任务,还在教室里上了几节示范课。大家都感到取得了一定的进展。一天,在讨论估测不确定参量的流程时,我突然想到可以进行一次现场操练。于是,我便请在场的所有人预测我们将完整的教材文稿提交给教育部所需的时间,并将预测结果写下来。我遵循了我们已经计划好要纳入课程体系的流程:从一个团队获取信息的合理方法并不是通过公开讨论,而是通过私下收集大家的观点来完成。这个流程与常规的公开讨论不同,它更加充分地利用了每个成员的相关知识。我收集了大家的预测,并将结果记录在黑板上。在场的各位对完稿时间的预估集中在两年左右,最低估值为一年半,最高估值则为两年半。

    随后我又有了一个主意。我问课程编制专家希莫是否能想到还有哪些和我们类似的团队曾经草拟过课程计划。那段时间,有几项类似“新数学”这样的教学革新在以色列得到引介。希莫说他能想到很多这样的团队。我又问他是否知道这些团队更详尽的情况,事实证明他对其中几个团队的情况还是较为熟悉的。我又请他回想这些团队在取得与我们当前进展相当的成绩时的状况。根据这一点,我又问他是否记得这些团队用了多长时间编完教材的。

    他陷入了沉默。当他终于张口说话时,我觉得他脸红了,在为自己的回答感到尴尬,他说道:“你知道吗,我过去从未意识到这一点,但事实上,并非所有取得与我们当前进展相当的团队都能完成任务。没完成任务的团队还是占了很大一部分的。”

    他的话让人很不安。我们从未考虑过自己可能会失败。我越发不安了,于是想请他估测失败的团队占多大比例。他说:“大约40%。”此时,整个房间仿佛笼罩在一片阴霾之中。我立刻又提了一个问题:“那些完成了任务的团队用了多长时间呢?”他答道:“没有一个团队是少于7年的,最多用了10年时间。”

    我如同抓住了救命稻草一般,说:“与其他团队的技能和资源相比,我们的团队怎么样?在这些团队中,我们团队大概处于什么位置呢?”这次,希莫并没太多犹豫,说道:“我们在平均水平以下,但也没差太多。”他的回答让我们感到震惊,甚至包括希莫自己,他先前的估测受到整个团队所持的乐观心态的影响。如果没有我的提示,他就不会将自己对其他团队过去经历的了解与对我们团队未来的预测联系在一起。

    听了希莫的话,我们当时的思想状态远非“我们都清楚了”这句话能够描述的。诚然,我们所有人当时都“清楚”与几分钟前我们写在纸上的预测时间相比,最少7年、失败概率为40%才是对项目未来更合理的预测。我们并没有承认自己清楚的事实。这个新的预测似乎仍然不真实,因为我们不能想象为何一个看似操作非常简单的项目会耗时这么久。我们没有水晶球,无法看到未来。我们能看见的,只是一个合理的计划,这个计划会使我们在大约两年的时间里完成一本书,而这与那些显示其他团队不是失败了就是用了很长时间完成任务的统计数据是互相冲突的。我们所听到的是基础比率信息,依据这个信息,能推断出一个因果关系,即如果有这么多的团队失败,或是用了很长时间才取得成功,那么编写一门课程就应该比我们想象中的难得多。但这样的推断又与我们对现阶段取得的重大进展的直接体验相左。我们对希莫提供的数据的处理就像平时对待基础比率一样:注意到其存在,但立刻选择忽略。

    我们理应在那一天选择放弃项目的。我们都不愿意为一项失败概率为40%的项目再多投入6年的时间。尽管我们认为坚持做下去并不是理性的选择,但这不足以成为我们放弃的缘由。在几分钟断断续续的争辩之后,我们达成了一种默契,那就是当做什么事都没发生,继续工作。这本书最终在8年以后才编写完成!那时,我早已搬离以色列,离开了团队。也就是说,这本书的编写经历了许多不可预知的变化。教育部对这个想法所持的热情也在等待这本书交稿的漫长时间里消退了,因此这本书从未被使用过。

    这个令人尴尬的插曲成了我职业生涯中一段最具启发性的经历。我从中悟出了三点,第一点是显而易见的,我偶然得到了两种截然不同的预测方法。后来,这两种方法被我和阿莫斯称为内部意见和外部意见。第二点是我们最初的预测,即完成项目需要大约两年的时间,体现出一种规划谬误。我花了很长的时间才悟出第三点,我将这一点称为非理性坚持,一如我们那天做的荒唐事:没有终止那个项目。面对选择时,我们因为事业心而丢掉了理性。

    比起外部意见,我们更偏向内部意见

    在很久以前的那个周五,我们的课程专家对同一个问题作出了两种判断,并得到了截然不同的结果。我们所说的“内部意见”是指包括希莫在内的所有人自发采取的对我们项目的未来进行预测的方法。我们注重具体环境,在各自的经历中寻找证据。我们有一个粗略的计划:知道要写多少章,了解已经完成的两章所用的时间。我们之中有些人会谨慎些,可能会在预测所用时间的基础上多加几个月,以免出现预测误差。

    外推法是错误的。我们根据眼前的信息进行预测,但我们写出的前几章有可能比其他章节简单,而且在写那几章时,我们对这个项目的投入程度很可能正处于最高点。然而,最主要的问题在于我们没有考虑到由唐纳德·拉姆斯菲尔德(Donald Rumsfeld)提出的著名观点:“未知的未知数。”那天,我们没能预见到接下来发生的事会导致这个项目拖延这么久。离婚、生病、与官员的协调等事情导致工作一再延迟,这些事情都是意料之外的。这样的事情不仅会减慢教材的编写速度,还会导致任务在长时间内没有任何进展或进展非常缓慢。当然,对希莫知道的那几个团队来说,情况也是一样的。那些团队的成员清楚自己的项目是切实可行的,所以他们也想象不到各种事的发生会使他们历时7年才完成一个他们曾经认为可行性很强的项目,或者最终根本就没能完成任务。他们像我们一样,并不知道自己的胜算有多少。任何计划失败的原因都有很多,尽管大多数原因人们可能无法预见,但一个大项目中“某件事”出差错的概率却是很高的。

    我向希莫提出的第二个问题将他的注意力从我们团队转移到了一些类似的团队上。他估测那些团队成功的基础比率是:40%的失败率和7~10年的完成时间。希莫的话虽然没有经过正式调查,也没有科学根据,却为基准预测奠定了合理的基础。如果你对一个事件的了解仅限于其所属类别,其他情况一概不知,此时作出的预测就是基准预测。正如前文所述,基准预测应该是进一步调整的锚定。如果你只知道某位女士住在纽约,却被问到她的身高的话,你的基准预测就是你对纽约女性平均身高的合理猜测。如果得到了与案例相关的特定信息,例如那位女士的儿子是他所在高中篮球队的首发中锋,你就会将预测转向一个合理的方向。希莫将我们团队与其他团队的对比说明,我们所作的预测较基准预测而言更糟糕,而基准预测已经是糟糕透顶了。

    在我们的这个问题中,外部意见的预测有着出奇的准确性。然而,这种准确性只是侥幸产生的,并不能作为外部意见有效性的证据。关于外部意见有效性的论证是在一般理由下构建的:如果参考类别选择适当,外部意见就会给出预测的大致范围,我们的那个项目就是如此,这就表明内部预测与事实相去甚远。

    对一个心理学家而言,希莫作出的两种判断的差异是令人诧异的。他头脑中有相应的知识,本应该能够估测出适当的数据,但他在最初估测时,却完全没有应用那部分知识。希莫由内部意见得出的预测并不是根据基准预测得到的判断。他并没有进行基准预测,他的预测只是基于我们所营造的特殊的努力氛围。正如汤姆实验中的受试者那样,希莫知道相关的基础比率,但却没想过应用它。

    与希莫不同的是,我们其他人并没有外部意见的来源,也就不能作出合理的基准预测。然而值得注意的是,我们并不认为自己需要其他团队的信息作为自己预测的参考。我寻求外部意见的举动让所有人都颇为诧异,甚至包括我自己在内!这是一个常见模式:了解个别案例的人很少会认为他们有必要了解与这个案例同类别的其他案例。

    当我们最终了解到这一外部意见时,却集体忽略了它。我们知道到底发生了什么,这与解释“教授心理学是徒劳的”那个实验有相似之处。当他们在掌握很少信息(一个简短乏味的采访)的情况下对个别案例作出预测时,尼斯贝特和博吉达的学生完全忽略了他们刚刚了解到的全局解。当“苍白无力的”统计学信息与某个人对案例的印象相冲突时,这些信息总会被舍弃。在与内部意见的竞争中,外部意见丝毫没有取胜的机会。

    偏向内部意见常带有道德的意味。我的堂兄是一位出色的律师。我曾经问过他一个与参考类别相关的问题:“被告赢得与这个案子类似的官司的可能性有多大?”他立马回答:“每一个案例都是独特的。”这位堂兄说这话时的眼神表明他当时肯定认为我的问题既不得体又很浅薄。特别强调案例的独特性在医学领域也很普遍,尽管证据型医学的最新进展指向其他方向,但案例独特性仍不可忽视。医学统计学和基准预测由医患间越来越频繁的交流催生而来。然而,医学界对外部意见依旧抱有矛盾情绪,因为整个医疗过程都由数据和清单主导,缺乏人情味。

    规划谬误:过于乐观的计划随处可见

    按照外部意见及最终结果来看,我们在当初的那个星期五午后所作的最初预测几乎是一种妄想。对下面这种说法我们也不会感到惊讶:对项目成果过于乐观的预测随处可见。我和阿莫斯创造了“规划谬误”这个新词来描述下列计划和预测:
    ·不切实际地接近理想状况(的计划和预测)。
    ·可通过参考类似案例的数据得到提高(的计划和预测)。
    关于规划谬误的例子在个人、政府、企业的计划和预测行为中皆不鲜见。骇人的事例也不胜枚举。
    · 1997年7月,爱丁堡规划中的新苏格兰议会大楼预计的最高预算是4000万英镑。到了1999年6月,建楼的预算就变成了1.09亿英镑。2000年4月,规划者将“成本上限”修改为1.95亿英镑。到2001年11月,他们又将“最终成本”预估为2.41亿英镑。这个最终成本在2002年年末的时候又上涨了两次,成为2.946亿英镑。到2003年6月,预算又增加了3次,达到3.758亿英镑。这栋大楼最终在2004年建成,最终耗资约为4.31亿英镑。。 
    ·2005年的一项研究对1969~1998年全球范围内的铁路项目进行了检测。其中,超过90%的项目都高估了新线路的乘客数量。尽管这些乘客的差额曾被广而告之,这30年间对乘客数量预测的准确度却没有什么提高。设计者对新铁路项目的乘客量的平均高估率达106%,平均成本超支45%。尽管收集了越来越多的证据,那些专家却并没有利用这些证据。
    · 2002年,针对改造厨房的美国有房者进行的一项调查发现,他们预估的厨房改造费用平均为18658美元,但实际上他们最后的平均花费是38769美元。

    规划者与决策者的乐观心态并不是造成超支的唯一原因。厨房改造和武器系统的承包人都承认(尽管不是对他们的客户承认),他们都会通过扩充最初计划而获取最大利益。客户们无法想象他们的意愿会随时间的推移而逐渐增多,而没能预测到这些情况的事实也恰好反映出这一点。如果他们制订一个较为现实的计划并严格按计划进行,最终就不会花掉这么多钱了。

    最初预算的误差并不总是无知的。制订计划的人都希望自己的计划能得到上级和顾客的认可。通常也正是这种愿望的驱使,他们才制订出了不切实际的计划。他们这样做还因为仅仅由于超支或超时不太可能会导致项目被中途叫停。在这些例子中,避免规划谬误的最大责任落在了批准计划的决策者身上。如果这些决策者没有意识到外部意见的必要性,他们就会犯下规划谬误的错误。

    减少决策错误的有效方法

    自多年前那个星期五的下午以来,判断和避免规划谬误的方法并未发生过变化,但这一理念的实施却有了很大进展。现任教于哈佛大学的丹麦籍著名规划专家本特·弗林夫伯格(Bent Flyvbjerg)曾经有过颇有说服力的总结:

    看轻或是忽略分布信息的普遍趋势可能是预测产生错误的主要原因。因此,计划者应该尽力划分出预测问题的类别,这样才能充分利用所有能够获取的分布信息。

    如何通过改进的方法提高预测的准确性?上面的说法可算做唯一一条最为重要的建议了。在预测时使用相似团队的分布信息被称为采纳“外部意见”,它是避免规划谬误的有效方法。

    对规划谬误的修正如今也有了对应的专业术语,叫做“参考类别预测”。弗林夫伯格已将此术语运用到几个国家的交通运输项目中。外部意见通过使用更大的数据库来实施,此数据库提供了全世界范围内数以百计的项目信息,包括其计划与结果的信息,能提供可能发生的超支和超时的统计学信息以及各类不尽如人意的项目信息。

    弗林夫伯格使用的预测方法与为克服对基础比率的忽视而采取的建议非常相似:
    1.识别对应的参考类别(例如厨房改建和大型铁路项目等)。
    2.获取参考类别的统计数据(每英里铁路的造价或是支出超过预算的百分比),利用这些数据作出基准预测。
    3.如果有特别的原因说明这个项目多少会比同类项目的乐观偏差更为明显,则可使用此例的具体信息对基准预测进行调整。

    弗林夫伯格的分析旨在通过提供类似项目超出预算的统计数据,为委任公共事业工程项目的官员提供指南。决策者在批准某个提议之前,需要先了解其成本和利益的实际评估。他们还希望估测出为超出预算而准备的预备金,即使这样的预防措施通常会成为自我应验的预言。正如一位官员告诉弗林夫伯格的那样,“预备金与承包者的关系就像牛羊肉与狮子的关系,狮子会吞食牛羊肉,承包者也会私吞预备金”。

    高管们为了抢占资源很容易会提出过于乐观的计划,因此,各个组织面临着控制高管这种倾向的挑战。运转良好的组织会奖励规划师,因为他们提出的方案精准而又切实可行;当然也会处罚规划师,因为他们没能对遇到的困难作出预测或是没能考虑到他们本可以规避的困难,即未知的未知数。

    而今距离那个星期五的下午已经过去了30年,但每一年我都会想起它,在演讲中也会提到它。有些朋友已经对那个故事感到厌倦了,但我还在不断从中吸取经验。大约在我第一次和阿莫斯作关于规划谬误报告的15年后,我又与丹·洛瓦洛(Dan Lovallo)一起提到了这个话题。我们一起草拟了一个关于决策的理论,即乐观偏差是人们愿意承担风险的重要原因。在经济学标准的理性模式下,人们愿意冒险是因为胜算大—他们之所以现在能承受有代价的失败,是因为他们相信最终成功的概率很大。这是替代的一个观点。

    在我们预测风险项目的结果时,高管们很容易会掉入规划谬误的陷阱。在规划谬误的支配下,他们根据脱离现实的乐观心态来做决策,而不是根据对利益得失以及概率的理性分析做决策。他们高估了利益,低估了损失。他们设想了成功的场景,却忽略了失败和误算的可能性。因此,他们所追求的行动方案不太可能在预算之内完成,也不大可能按时完成,这个方案可能也无法实现预期的回报—甚至都无法完成。

    由此看来,人们之所以经常(但不是总是)承担风险项目是因为他们对成功率过于乐观。我将在本书中反复提到这一点,因为它可能有助于解释为什么人们会对簿公堂、发起战争或者急于创业。

    多年来我一直认为关于课程那件事的主要意义就是我从希莫那里学到了一些东西:他对我们项目未来的最佳猜测并没有参考他所知道的相似项目的信息。我原以为自己很会叙述事情,而且在那件事中我还是一个聪明的询问者、机敏的心理学家。但是,直到最近我才意识到,那时的我其实是个笨蛋,是个无能的领导者。

    那个项目是由我发起的,因此我的主要责任就是赋予这个项目意义,而其他主要的问题则由团队进行讨论,但我却失职了。当我听到希莫的统计分析后,就改正了那个谬误。如果是在迫不得已的情况下,我会承认我们的项目从一开始就是错的,我们至少应该认真考虑承认失败并打包回家这个选择。但是没有人向我施压,也没有人和我讨论过这个问题,我们默许了这个项目继续下去,根本就不考虑到底需要多长时间。这样做很容易,因为我们在最开始时并没有作出这样的预测。如果在开始做这个项目时就有了合理的基准预测,那么我们就不会再将项目进行下去了,但我们已经投入了大量精力—这是一个沉没成本悖论的例子,我们将在本书后半部分重点关注这个问题。放弃这个项目会令我们很尴尬,尤其是我,而且我也没有直接的理由这样做。在危急时刻转变方向比较容易,但这并不是一个危急时刻,因为我们得到的只是一些不相干的人的实例。与我们在自身努力后得到不好的结果相比,外部意见更容易被忽略。我将我们的状态形象地描述成嗜睡症的一种形式—不愿思考发生的事情。所以我们继续进行项目。在余下这段时间里,作为团队一员的我也没有进一步尝试制订理性规划—这是作为一个致力于宣扬理性的团队尤为大意的疏忽。我希望我现在能更明智一些,自己也形成寻求外部意见的习惯。但是,这种做法永远都不是自然而然发生的。

    示例—外部意见与内部意见“他正在采纳内部意见,他应该忽略自己案例的情况,去看看其他案例是什么情况。”“她掉进了规划谬误的陷阱。她设想了一个最为理想的情景,但有多种原因可能导致计划失败,她无法预见所有原因。”“假设你除了知道某个特定的案件是针对一名外科医生的医疗纠纷以外,其他什么也不了解。你的基准预测会是怎样的呢?法庭上成功的案例有多少?有多少案件是已经结案的?这类案件的总量是多少?我们正在谈论的这个案件与其他相似的案件相比是更严重还是较为轻微?”“我们又加大了投资,因为我们不想承认失败。这是一个沉没成本悖论的例子吗?”第24章 乐观主义是一柄双刃剑

    规划谬误只是普遍存在的乐观偏见的一种表现形式。我们中的大多数人都认为世界是美好的,但世界却没有想象般美好;我们觉得自己的贡献很大,但事实上并没有那么大;我们认为自己设定的目标很容易实现,但其实实现的可能性也没有那么大。我们还容易夸大自己预测未来的能力,进而导致乐观的过度自信,这可能会影响到决策。乐观偏见也许是认知偏见中最重要的一种。如果你性情乐观,就应该既乐观又谨慎,因为乐观偏见可能有益,也可能带来风险。

    乐观主义者过度自信的代价

    抱有乐观心态很正常,但一些幸运儿比其他人更为乐观。如果你天生就有乐观偏见,无须别人告知,你就知道自己是个幸运儿,因为你已经感到幸运了。乐观心态大多是遗传下来的,是人类普遍存在的一种性情,偏向于看到事物积极的一面。

    如若让你为自己的孩子求个愿望,你应该真心希望他或她有个乐观的心态。乐观主义者通常都是开朗快乐的,也因此颇受欢迎。他们对失败和困难的承受力都比较强,患抑郁症的概率低,免疫系统良好,也更注重身体健康。他们感觉自己比别人健康,事实上他们的确更长寿。有些人会夸大自己的预期寿命,认为自己的寿命会超过保险界的统计数据。而对这些人的研究表明,他们的工作时间较长,对自己未来的收入更有信心,离婚之后更容易再婚(典型的“精神胜利法”),也更容易投资个股。当然,只有那些带有轻微偏见并且能在不脱离实际的前提下“强调积极因素”的人才能享受乐观主义带来的益处。

    乐观主义者对塑造生活起到了或大或小的作用。他们的决策产生了一定的影响。这些乐观主义者是发明家、企业家、政治和军事领导人—总之不是普通人。他们寻求挑战,承担风险,最终获得了成功。他们有天赋,也一直很幸运,几乎可以肯定地说他们比自己认为的还要幸运。他们很可能天生就是乐观派。一项对小型企业创始人的调查总结道,企业家对待生活的态度普遍比中层主管乐观。他们成功的经历印证了他们对自己的判断和掌控能力的信心。他们的自信因别人的崇拜而增强。这条推理使我们得出一个假说:对他人生活影响巨大的人可能是乐观和过度自信的,这种人承担的风险远大于自己所能意识到的水平。

    这一证据表明,当个人或是机构自愿承担重大风险时,乐观偏见都发生了作用,甚至起到了主导作用。通常冒险家经常会低估胜算,还投入了大量精力去寻求胜算。由于误算了风险,即使他们其实并不谨慎,那些乐观的企业家也会认为自己是谨慎的。他们相信自己将来会成功,因而也保持着积极的心态,这会促使他们广泛搜集资源,鼓舞员工士气,进而增加获胜的机会。当需要采取行动时,即使略带妄想,乐观主义也是件好事。

    在美国,小型企业能够生存5年以上的概率是35%,但创立此类企业的人并不认为这些数据适用于自己。调查显示,美国企业家容易相信他们的事业正处于上升期:他们对“任何类似你们企业”的成功概率的平均估值为60%—几乎是正确数值的一倍。当他们评估自己企业的胜算时,偏见就更为明显了。有81%的小型企业创办人认为他们的胜算达到70%甚至更高,有33%的人甚至认为他们失败的概率为零。

    有偏见并不奇怪。如果最近某人开了家意大利餐厅,你在采访他时就不要期待她会低估自己成功的概率或说自己缺乏经营餐馆的能力。但你肯定会纳闷儿:如果她通过一些渠道得知了胜算率,还会继续投入金钱和时间吗?或是她在得知胜算率(有60%的新餐厅3年后会歇业)以后,会考虑胜算率吗?答案是,她可能不会考虑采纳外部意见。

    性情乐观的一个好处是它使我们在困难面前坚持不懈,但是这种坚持可能需要付出很高昂的代价。托马斯·阿斯特布罗(Thomas Astebro)曾经作过一系列令人印象深刻的研究,阐明了乐观主义者收到坏消息时会发生的事。他从一家加拿大机构—发明家援助计划—中得到了所需数据,这项计划对发明家的点子的商业前景进行客观评估,这一业务收取很少的费用。这些评估按照37种标准对每项发明进行比对排名,其中包括产品用途、生产成本以及预估的需求趋向等。分析师用字母表示排名,D和E表示失败—在分析师分析的各项发明中,70%都是D或E,他们对失败的预测非常准确:411个项目中仅有5项达到了商业化的最低标准,且没有一项算得上非常成功。

    在收到自己那份意味着失败的评级结果时,约有一半发明家选择了退出。然而,即使在得知自己的项目毫无希望之后,他们之中仍有47%的人选择继续努力。这些坚持的(或是固执)人的损失平均会是放弃发明所遭受损失的两倍。值得注意的是,在乐观测试中得分较高(普遍比一般人群高)的发明家中,收到这个令人气馁的建议后仍然选择坚持的状况比较常见。总的来说,个人发明的回报很小,要“低于私募基金和高风险证券的回报“。一般说来,个体经营的财务收益属于中等:同等条件下,人们通过向雇主出售自己的技能得到的平均回报要比经营自己的企业更高。这表明乐观主义是普遍、执拗且代价昂贵的。

    心理学家已经证实,大部分人都相信自己比别人有着更为理想的特质—他们愿意为这些实验室中的信念下一笔小赌注。当然,觉得自己很优越的想法在市场中具有重大意义。大型企业的领导有时会在投资巨大的并购上下很大赌注,因为他们错误地以为自己可以比该公司现任管理层更好地管理其资产。股市一般也会对此做出反应,兼并公司的价值会降低,因为经验表明,兼并大型企业的努力失败的概率往往大于成功的概率。“自负假说”(Hubris Hypothesis)已经解释了这种被误导的兼并:那些兼并公司的高管们只是没有他们想象中那么有能力罢了。

    经济学家乌尔里克·马尔门迪尔(Ulrike Malmendier)和杰弗里·塔特(Geoffrey Tate)通过执行总裁在公司的股份持有量来鉴别他们是否是乐观主义者。他们还观察到,过于乐观的领导者承担了过多的风险。他们猜测更容易导致这些高层“向并购目标支付过高的溢价并承接毫无价值的兼并”的是债务而非股权发行或是其他方面的因素。值得注意的是,按这两位经济学家的观察结果来说,如果兼并公司的高管过于乐观,该公司的股票在公司并购中就会受到更大的影响。股票市场明显能够鉴别出过度自信的高管。观察得出,虽然对管理层的过度自信无可指摘,但他们还有其他的问题,比如:爱下不妥当赌注的企业领导之所以没有过度自信,是因为他们在拿别人的钱下赌注。相反,如果他们个人持有较多股份就会冒更大的风险。当商业媒体将过度自信的执行总裁标榜为名人时,他们造成的损失就会加重。这表明媒体界冠予执行总裁的声誉对于股东来说是代价高昂的。两位作者写道:“我们发现,若公司总裁曾被授予荣誉,则该公司的股票表现就不会很好。与此同时,执行总裁的报酬会增加,他们也会花更多的时间参与公司事务以外的活动,比如写书以及列席董事会等,还极有可能参与盈余管理。”

    多年以前,我和妻子曾去温哥华岛度假。我们找到了一家漂亮、舒适的汽车旅馆,但它位于森林中部,这条路少有人走,不免有荒凉之感。旅馆是对年轻而又漂亮的夫妻开的。在我们的鼓励下,这对夫妻讲述了他们的经历。他们曾是亚伯达省的教师,后来决定改变自己的生活现状,遂用所有积蓄买下了这座12年前建成的汽车旅馆。他们说:“在我们之前的六七位老板都没能将这家旅馆妥善经营。”所以他们才能用这么便宜的价格买下这家旅馆。他们说这话完全是无意识的,口气没有任何讥讽之感。他们还说自己有贷款修缮旅馆的计划,在旅馆旁再建个餐厅,如此一来,整个旅馆就更具吸引力了。他们觉得没必要解释为何前几位老板都失败了而自己则成功了。无论是旅馆老板还是公司高管,他们都具备勇气和乐观的精神。

    即使大多数风险承担者最终总是收获失望,但那些因乐观而承担的风险企业家毫无疑问都会为激发资本主义社会的经济活力作出贡献。来自伦敦经济学院的马尔塔·科埃略(Marta Coelho)曾经指出,小型企业的创办者要求政府在决策方面支持自己时(这些决策多半会失败),就会带来让人挠头的政策问题。政府会向这些几年后就会破产的企业家提供贷款吗?许多行为经济学家比较赞同“温和的家长式作风”,因为“温和的家长”管理可以提高他们的储蓄率。政府是否应该支持小型企业,如果应该,又该怎样支持小型企业,这些问题至今也没有令人满意的答案。

    竞争忽视:为何大片会扎堆上映?

    人们倾向于用愿望思维来解释企业家身上的乐观主义,但是情感只是乐观主义产生的一部分原因。认知偏见起了很重要的作用,特别是系统1的其中一个特征,即眼见即为事实。

    ·我们将注意力集中在目标上,锚定我们的计划,却忽视了相关的基础比率,导致规划谬误。

    ·我们只关注自己想做的和能做的,却忽视了他人的计划和技能。

    ·在解读过去和预测未来时,我们强调了技能的因果角色,却忽视了运气的影响。因此,我们产生了“控制错觉”。

    ·我们只重视自己已知的,却忽视自己未知的,因此我们对自己的信念过度自信。

    “90%的司机都相信自己的车技要高于平均水平”这一心理学发现已得到了证实,也已成了文化的一部分,还成了普遍存在的高于均数效应的主要例子。然而,对这个发现的解读在近几年发生了改变,原来认为这是一种自我膨胀,现在则认为这是一种认知偏见。请考虑下面两个问题:

    你是一个好司机吗?

    你是一个高于平均水平的司机吗?

    第一个问题很简单,人们很快就可作答,且多数司机都会答“是”。第二个问题要难很多,大多数受试者几乎都不可能谨慎而又正确地作答,因为这需要对司机的平均水平进行评估。读到这里,对于人们会用简单答案回答难题这一观点你已有所了解。虽然受试者将自己的水平与平均水平进行比较,却从未考虑过平均水平究竟是什么水平。对高于均数效应的认知解释有一项证据,即当人们被要求完成一项困难的任务时(对我们大多数人来说,这个任务可能是“你发起与陌生人交谈的技巧高于平均水平吗”),他们会不假思索地将自己划在平均水平以下。结果,只要表现还说得过去,人们就总是喜欢表现得过于乐观。

    我曾经有过几次机会询问新成立的创新型公司的创办者及其合作人一个问题:公司取得的成绩在多大程度上取决于你在公司的作为?这明显是个简单的问题;人们很快就能回答出来,而且在我所抽取的小样本中,认为自己与公司成功的关联度没有低于80%的。即使他们并不肯定此时自己是否成功,这些有胆量的人也都认为自己的命运完全掌握在自己手中。他们肯定错了:新公司的成绩更多取决于其竞争者、市场的变化以及自身的调控。然而,眼见即为事实的原则也起到了一部分作用,企业家会自然而然地将注意力放在他们最为了解的地方—他们的计划、行为、最直接的威胁和机遇等,例如筹资能力。他们对竞争者所知较少,也就自然地认为竞争者与公司未来没多大关系。

    科林·卡莫若(Colin Camerer)和丹·洛瓦洛创造了“竞争忽略”这个概念,并用迪士尼制片厂董事长的一段话阐述了这一概念。当有人问为什么有这么多高投资的大制作会同期上映时(例如《世纪大毁灭》和《独立日》),他回答道:

    一切都是因为自负。如果只关心自己的生意,你就会想:“我有一个优秀的编辑部,还有个很棒的市场部,我们会做好电影的。”你还认为其他人肯定都不会这样想。但是在一年中的某个周末,你可能就会发现竟然有5部电影同时公映,那么来看你那部电影的人肯定就不会很多。

    这个坦率的回答提到了自负,但这种自负不是指傲慢或比其他制片厂更有优越感。人们只是在决策时没有将竞争因素考虑在内,因为困难的问题再次被简单的问题替代了。这里需要解决的问题是:想想别的人会怎么做,有多少人会看我们的电影。诸位制片厂的主管考虑的问题则更为简单,无须多虑:我们的电影怎么样,有强大的部门为其作推广吗?我们熟知的系统1的眼见即为事实原则以及替代原则都引起了竞争忽略和高于均数效应的预测。竞争忽略的结果是产生了许多额外入口:众多竞争者进入市场,导致市场不能保证赢利,所以平均下来,其结果就是亏损。对于新进入市场的公司来说,这样的结果会令其失望,但是这对总体经济的影响却可能是积极的。事实上,一些创新型企业的失败标志着新的市场需要更有能力的竞争者。乔瓦尼·多西(Giovanni Dosi)和丹。洛瓦洛称这些创新型企业为“乐观主义烈士”,对经济有益,对投资者有害。

    是你太糟糕,而不是我太笨拙

    杜克大学的教授们用了几年的时间作了一项调查,调查内容为大型企业的财务总监对次年的标准普尔指数作出的估测。杜克大学的学者们搜集了11 600份这样的预测并检验了它们的准确性。结论非常明显:大型企业的财务主管对股票市场的短期走向一无所知,他们估测出的值与真实值的相关系数接近零!当他们说股市走低时,股市多半可能会上扬。这些发现并不令人吃惊。真正糟糕的消息是,这些财务总监似乎并不知道他们的预测是没有价值的。

    除了对标准普尔指数的估测外,受试者还提供了另外两项估测值:其中一项他们有90%把握的值太高,而另一项他们有90%把握的值又太低。这两个值的范围差被称为“80%的置信区间”,若结果在这个区间之外,我们则称其为“意外”。一个人在多种条件下设置的置信区间预计会有20%的可能出现意外,但通常在多种条件下进行的预测会有67%的意外发生,比预期高出两倍多。这说明财务总监过度相信自己预测市场的能力了。“过度自信”是眼见即为事实的一种表现:在估测质量时,我们会依赖大脑呈现的信息并构建一个使估测合理的、具有逻辑的解释。一个人不可能采用自己没有想到的那些信息,也许是因为他从来就不知道这些信息吧。

    两位作者计算了一下,发现置信区间可将意外的发生率降至20%。这样的结果令人惊讶。想要将意外率保持在理想水平,财务总监就应该年复一年地说:“明年标准普尔回报率在–10%和30%之间的可能性有80%。”这个置信区间恰当地反映了财务总监的知识(更确切地说是他们的无知)比他们实际阐述的区间的4倍还要多。

    此处涉及社会心理学范畴,因为一个诚实的财务总监提供的答案明显是荒谬的。

    如果一个财务总监告诉他的同事“明年标准普尔回报率很可能在–10%和30%之间”,整个办公室的人很可能都会嘲笑他。设置这么大的置信区间无异于承认了自己的无知,社会不会认同一位靠提供资金相关知识拿工资的人的这种做法。虽然这些主管知道自己所知甚少,但承认这一点将会受到处罚。杜鲁门总统就曾发表过著名的言论,说他想找一个立场明确的“独臂经济学家”(one-armed economist),他对那些总是说“另一只手……”的经济学家烦透了。 ①

    有些机构相信了过度自信的专家的言论,就要承受代价高昂的后果。关于财务总监的调查说明,对标准普尔指数最为自信和乐观的人也会对他们自己公司的前景过度自信和乐观,也就愿意比别人承担更大的风险。纳西姆。塔勒布说过,对环境的不确定性了解不足必然会导致经济行为人承担本可以避免的风险。然而,无论在社会生活中还是在股票市场中,乐观主义极其重要。个人及企业会奖励那些提供了冒险且有误导性信息的人,而不是说真话的人。我们从造成大萧条的金融危机中学到的是:总有一段时间,专家间和企业间的竞争会造成大家对风险和不确定性视而不见。

    青睐过度自信的专家的领域并不仅限于金融预测。其他专业人士必须面对这样一个事实:一位实至名归的专家需要表现出很高的自信程度。菲利普。泰特罗克的观察表明,最为过度自信的专家更有可能代表全体员工出现在新闻节目中。过度自信也会像医学上的传染病那样具有传染性。有项研究,是将在重症加护病房死亡的人的验尸报告和医生在死者生前提供的诊断进行对比。医生也表现了他们的自信,结果是:对病人临死前的诊断“完全确定”的临床医生中有40%的诊断是错误的。同样,过度自信的专家也间接受到了病人的影响:“通常,临床医生显现出的不确定是一种懦弱的表现。自信的人比对事情持不确定态度的人更受人推崇。医生将自己的不确定透露给病人会遭到大家的指责。”完全认识到自己无知的专家可能会被更自信、更能获得病人信任的竞争者取代。对不确定性的无偏见评价是理性的基石,但这并不是个人或机构想要的。在危机中,极度的不确定会造成严重后果,而且在风险高的时候承认自己只是在猜测的做法特别不易被接受。所以,假装知道通常是首选的解决方式。

    当支持夸张的乐观主义情感因素、认知因素以及社会因素共同作用时,有时就会导致人们承担一些风险,且这些风险在他们知道胜算的情况下是可以避免的。没有证据表明经济领域的风险承担者对于孤注一掷的赌博有特别大的兴趣,只是他们不像胆小的人那样有风险意识罢了。我和丹。洛瓦洛杜撰了“无谓的预测和胆小的决策”这个短语来描述风险承担的背景。

    对决策高度乐观带来的影响是好坏参半的,但乐观对顺利进行的影响肯定是积极的。乐观的主要益处是使人有了从受挫中复原的能力。正像积极心理学创始人马丁·塞利格曼(Martin Seligman)认为的那样,“乐观的解释风格”通过捍卫自我形象使人产生了复原力。从本质上来说,乐观风格包括对成功进行嘉奖和对失败少加责备。至少在某种程度上,这种风格是可以被训练出来的。塞利格曼记录了多个高失败率行业的训练效果,例如上门推销保险(网络时代以前的普遍做法)。当某个人被一个愤怒的主妇当面摔门拒之门外时,这个人肯定会想“她是个糟糕的女人”,而不是“我是个笨拙的销售员”。我一直认为,在科学研究这一领域,乐观对成功而言同样不可或缺:我遇到的成功的科学家都会夸大他或她正在进行的研究的重要性。我还相信,不爱夸大自己重要性的人在反复面对挫折和失败时会一蹶不振,这种情况也是大多数研究人员的结局。

    “事前验尸”:部分克服乐观偏见的方法

    可以通过训练克服过度自信的乐观偏见吗?对此,我并不乐观。训练人们设定置信区间的多次尝试表明了他们的判断并不精确,只有几个人是相对成功的。利用许多已经知道结果的以往案例进行训练以后,荷兰皇家壳牌公司的地质学家在估测可能的钻井场时,就变得不那么自信了。人们经常会引用这个例子。在其他情况下,在人们判断时鼓励他们考虑相互竞争的假设可降低(但不会消除)他们过度自信的程度。然而,过度自信是系统1特性的直接结果,可被驯服但不能被彻底改变。问题的主要障碍在于,主观自信是由人们构建的连贯的故事决定的,而不是由支持它的信息的质量和数量决定的。

    各个组织也许比个人更能抑制乐观主义情绪,而抑制这一情绪的最佳方法是由加里。克莱恩提出的。加里是我的“对抗性合作者”,他推崇直觉型决策,反对偏见的说法,对运算法的反对态度也很明确。他将自己的提议称为“事前验尸”。流程十分简单:当一个机构即将做出一个重要决策但还没有正式下达决议时,克莱恩提议召集对这个决策有所了解的人开一次简短的会议。在会议之前有一个简短的演说:“设想我们在一年后的今天已经实施了现有计划,但结果惨败。请用5~10分钟简短写下这次惨败的缘由。”

    加里·克莱恩关于事前验尸的观点立刻引起了巨大反响。当我在某场达沃斯会议上偶然谈到这个观点时,一个坐在我身后的人低语道:“就为这一点,来参加这次达沃斯论坛值了!”(后来,我注意到这个说话的人是一家大型跨国公司的执行总裁。)事前验尸观点有两个主要优点:决策快要制定好时,许多团队成员会受到集体思考的影响,而事前验尸则扼制住了这种影响。另外,它还激发了那些见多识广的个人的想象力,并将他们的想法引导到最需要它们的方向。

    当一个团队将注意力集中在决策上,特别是当领导宣布他的意图时,人们对计划好的步骤的可行性的疑虑就会渐渐减弱,到最后,这样的怀疑还会被认为是对团队和领导的不忠诚。如果某个团队中只有支持决策的人才有发言权,那么对怀疑的抑制就会造成这个团队的过度自信。事前验尸的主要优点是它引发了怀疑。另外,它还助长了支持决策的人去探寻他们先前没有考虑到但却可能存在的威胁。事前验尸并不是灵丹妙药,也不能提供完整措施使我们避免恼人的意外,但这一方法在一定程度上可以减少计划的损失。而这些损失一般都是因眼见即为事实的偏差以及盲目的乐观主义导致的。

    示例—乐观偏见与过度自信“他们有控制错觉,他们严重低估了障碍。”“他们好像因为竞争忽略而遭了殃。”“这是一个过度自信的例子,他们似乎认为自己知道的比实际的多。”“我们应该开一个事前验尸会议,有人也许能想到一个被我们忽略了的威胁。”

    ① 此处为双关,在英语中,人们总喜欢说“on the one hand……on the other hand……”,意为“一方面……另一方面……”。杜鲁门总统认为这样讲话表明一个人立场不明,所以他说我不喜欢总说两方面的人,此处“one-armed economist”并不是真正独臂的经济学家,而是只说“一只手”(即一方面)的人,不要再讲“另一只手”(另一方面)了。

  • 丹尼尔•卡尼曼《思考,快与慢》10-18

    第二部分 启发法与偏见

    第10章 大数法则与小数定律

    一项研究对美国3141个县的肾癌发病率进行了调查,调查显示该病的分布模式很值得注意。发病率最低的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。对此,你有何看法?

    刚刚过去的几秒钟里,你的大脑处于非常活跃的状态,这主要是因为系统2在运行。你谨慎地在记忆中搜寻着并作出假设。在这个过程中你也付出了一定的努力,你的瞳孔会扩张,心跳会适度加快。系统1也没有闲着,因为系统2的运行需要从联想记忆中获取事实和建议。你很可能会否认共和党的政策提供了肾癌防控方法这个想法,却会关注肾癌发病率低的县大多是乡村这个事实。这个例子是我从机智的统计学家霍华德·维纳(Howard Wainer)和哈里斯·泽维林(Harris Zwerling)那儿得到的,他们对这一案例的评论是:“人们很容易作出推断,认为肾癌发病率低主要是由于乡村的生活方式很健康—没有空气污染和水污染,食品没有添加剂,保证新鲜。”这一点完全说得通。

    现在,考虑一下肾癌发病率最高的县的情况吧。假设这些易发病的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。霍华德·维纳和哈里斯·泽维林半开玩笑地评论道:“人们可以很容易作出推断,导致肾癌高发病率的直接原因是乡村生活的贫困—医疗条件差、高脂肪饮食、酗酒、嗜烟等。”当然这种说法肯定有问题,因为乡村生活方式不可能既是肾癌发病率高的原因又是其发病率低的原因。

    问题的关键并不在于这些县处在乡村地区或是由共和党掌管,而在于乡村地区人口少。我们通过这个例子学到的不是流行病学知识,而是我们的大脑和统计数据之间的复杂关系。系统1非常擅长一种思维模式—自动且毫不费力地识别事物之间的因果联系,即使有时这种关系根本就不存在,它也会这样认定。当听到肾癌高发地区的情况时,你立刻会想当然地认为这些县与其他县不同是有原因的,一定有个理由可以解释这种不同。然而,正如我们所见,当系统1面对“纯统计学”的数据时是束手无策的,因为这些数据虽然可以改变结果出现的概率,却不能直接导致结果的发生。

    根据定义,一个随机事件是不需要解释的,但一连串的随机事件就有规律可循。想象有一个装有大理石弹球的瓮,其中有一半的弹球是红色的,另一半弹球是白色的。然后,再想象有一个非常有耐心的人(或一个机器人)随意从瓮中取出4个大理石球,记录其中的红球数,再把球放回去,重复这样的做法数次。总结记录结果时,你会发现“2红2白”的结果出现的次数(几乎刚好)是“4个全红”或“4个全白”这种结果的6倍。这一倍数关系是个数学事实。你可以对这种从瓮中反复抽样的结果作出自信的预测,就像你能预测到用锤子砸鸡蛋的结果一样。尽管你无法预见蛋壳破碎的具体细节,但大概结果还是很确定的。两件事的不同之处在于:你想到锤子砸鸡蛋时感受到的那种明确的因果联系,在瓮中取样的设想中是找不到的。

    相关的统计学事实与癌症那个例子也有联系。两个耐心的计数者轮流从瓮中取大理石球,杰克每次拿出4个球,吉尔拿出7个。他们都记录了每次拿到相同颜色弹球的次数—要么全白,要么全红。如果他们取球的做法持续的时间足够长,杰克拿到同颜色大理石的次数会是吉尔的8倍(两人的预期概率分别为12.5%和1.56%)。这个结果与锤子无关,也与因果联系无关,这仅仅是一个数学上的事实:一次拿4个弹球与一次拿7个相比,出现极端结果的概率更大。

    现在,将美国人口想象成一个巨大的瓮中的弹球。有些球上标有KC(即Kidney Cancer的简称)字样,表示肾癌。你抽取弹球样本,并依次按照所在县摆放,你会发现乡村地区的样本要比其他地区的少。如同杰克和吉尔所做的那个游戏一样,极端的结果(非常高或非常低的癌症发病率)容易出现在人口稀少的县,这个故事告诉我们的就是这些。

    我们从一个令人费解的事实说起:肾癌的发病率在各县有所不同,且是有规律的,我用统计学理论对此作了解释:相比于大样本,极端的结果(高发病率和低发病率)更容易出现在小样本中。这样的解释不存在因果联系。某县的人口稀少既不会引发癌症,也不能避免癌症,只会使癌症的发病率比人口稠密地方的发病率更高(或更低)。这就是真相,没什么可解释的。在某个人口稀少的县,癌症发病率并非真的比正常情况更低或更高,只是这个县正好在某个特殊的年份赶上了抽样调查罢了。如果我们在第二年重复这样的分析,也能预测到在小样本中出现极端结果的一般模式,但在前一年癌症发病率高的县,这一年发病率并不一定高。如果是这样的话,则人口稠密或稀少的因素就无法对发病率作出解释了:这些表面因素就是科学家眼中所谓的假象,即观察结果完全依赖于调查方法的某一方面,在这个案例中,则依赖于样本大小。

    我刚才说的例子也许会令你惊讶,但这并不是真相初次大白于天下。你早就知道应该更相信大样本,并且即使是对统计学一无所知的人也听说过大数法则。但是“知道”并非是非抉择问题,你可能会发现下列陈述放在自己身上很合适:

    ·当你阅读这个关于流行病学的例子时,并没有立刻注意到“人口稀少”这一特点与此次调查有何关联。

    ·对于采用4个样本还是7个样本所产生的不同结果,你至少会感到有一点惊讶。

    ·即使是现在,想要确定下面两个陈述句所说的完全是一回事,你也要费些脑力:

    (1)大样本比小样本更精确。

    (2)小样本比大样本产生极端结果的概率大。

    第一个表述清晰地陈述了一个事实,但直到感受到第二个表述传达给你的意思,

    你才意识到自己并没有真正理解第一个表述的意思。

    上述内容概括起来就是:没错,你知道大样本的结果更精确,但你现在可能才意识到你并不清楚为什么它们更精确。不仅你一人如此,阿莫斯与我在一起进行的第一个研究表明,即使是经验丰富的研究人员对样本效应也缺乏直觉,要么就是理解不到位。

    小样本的出错风险可能高达50%

    没有接受过统计学方面训练的人是出色的“直觉性统计学家”。我与阿莫斯在20世纪70年代早期的合作便始于对这个观点的讨论。他对我(在大学)的研究班及我本人讲过,密歇根大学的一些研究人员对直觉性统计抱有乐观态度。我个人对那个观点有种强烈的感觉:那段时间我发现自己并不是一个出色的直觉性统计学家,但是我也不相信别人会比我好多少。

    对于一个研究型心理学家来说,样本变差没有什么特别的。它是个烦人且损失又大的麻烦事,会把每项实验都变成一场赌博。试想你希望证明6岁女孩的平均词汇量比同龄男孩的词汇量更丰富的假设。这个假设从整体来说是成立的,女孩的平均词汇量确实要比男孩的丰富一些。然而,尽管男孩与女孩差别很大,但你很可能会抽取到男女相差不太明显的样本,甚至会抽到一个男孩比女孩词汇测试成绩还要好的样本。如果你是那个研究者,这个结果对于你来说代价就太高了,因为它浪费了你的时间和精力,却无法证实一个实际正确的假设。使用一个足够大的样本是降低这种风险的唯一方法。选择小样本的研究者只能看自己是不是能选对合适的样本了。

    想要对样本错误的风险作出评估,只需通过一个相当简单的步骤就可以实现。然而按照惯例来看,心理学家并不是通过计算来选定样本大小的。他们听从自己的判断,但这些判断往往是错的。在与阿莫斯发生意见分歧不久之前,我读过一篇文章,文章通过生动的观察结果展示了研究人员所犯的错误(他们现在仍在犯这种错误)。该文作者指出心理学家选择的样本通常都很小,致使他们有50%的风险不能够证实其正确的假设,而任何研究人员都不会在头脑清醒的情况下接受这种风险。对此有一个貌似正确的解释,即心理学家对于样本大小的决定反映了他们普遍存在的一个直觉性错误观念,即对于样本变差范围的错误看法。

    这篇文章令我十分震惊,因为我在自己的研究中碰到了一些问题,却在这篇文章中找到了相关解释。与大多数研究型心理学家一样,我也墨守成规地选择了一些过小的样本,因此得到的实验结果毫无意义。现在,我知道了原因:那些奇怪的结果实际上就是我这种研究方法的典型产物。我的错误特别令人尴尬,因为我教过统计学,也知道该怎样计算样本的大小,以便将风险降至可以接受的程度。但是,我从未通过计算来确定样本大小。和我的同事一样,我被传统所禁锢,相信自己设计实验的直觉,也从未认真考虑过样本选择会带来的那些风险。阿莫斯来参加研讨会时,我已经意识到自己的直觉是错误的。在研讨会中,我们很快达成共识—密歇根的那些乐观派是错误的。

    我与阿莫斯开始调查一个问题:只有我自己这么愚蠢还是我只是众多愚蠢的人之一,我们通过一项测试来证实这个问题,测试对象为一些数学家,想看看这些人是否也会犯类似的错误。我们设计了一份调查问卷,其中描述了真实的研究情境,包括一些成功实验的复制。问卷要求研究人员选择样品大小,对其决定可能带来的失败风险进行评估,并为那些正在设计自己实验的研究生提供建议。在“数学心理学协会”的一次会议上,阿莫斯收集了一组资深受试者(包括两本经济学著作的作者)的反应。结果很明显:我并不是唯一一个愚蠢的人。大多数受试者都会犯和我一样的错误。显然,即使是专家,在选择样品大小时也无法充分集中注意力。

    我和阿莫斯将我们合写的第一篇文章命名为“对小数定律的盲信”。我们半开玩笑地解释道,“对于随意取样的直觉似乎符合小数定律,由此可以断言大数法则对于小数定律同样适用”。在文章中,我们还收录了一个措辞有力的建议,即研究人员认为他们“对于统计直觉应抱有一些怀疑,只要条件允许,都应采用计算方法来确定样本规模,而不是依靠直觉印象作决定”。

    信任多于质疑的普遍性偏见

    在一次面向300名老年人的电话民意调查中,有60%的人支持总统。

    如果你只能用三个词来总结这句话,该怎么说呢?几乎可以肯定的是,你会说“老年人/支持/总统”。这些词概括了这句话的要点。这次民意调查被省略掉的细节—媒介为电话,样本为300人—本身意义不大,它们提供的背景信息并不怎么引人注意。即使样本数量变了,你的结论也不会发生变化。当然,一个完全荒谬的数字倒可能会引起你的注意。(例如一项对6名或6亿名老年选民的电话民意调查……)除非你是专业人员,否则不管样本是150还是3000,你都不会有什么不同的反应。这就是“人们对样本大小没有足够的敏感性”这一表述的意义。

    这项民意调查包含了两方面的信息:新闻本身和新闻的来源。当然,你关注更多的是新闻本身,而不是其结果的可信度。但当可信度明显很低时,新闻所包含的信息也就不足为信了。如果得知“某党派小组操纵一项错误且带有偏见的民意调查,使结果显示老年人支持总统……”你当然会排斥这项调查的结果,不会相信这条新闻,这项由某党派进行的民意调查以及其错误结果不但没有令你信服,反而会成为另一条关于政治骗局的新闻。在这样清晰的案例中,你可以选择不相信其中的信息。但是你能把“我在《纽约时报》读到……”和“我在办公室闲聊中听到……”这两种说法完全区分开来吗?你的系统1能够区分出信息的可信度吗?眼见即为事实的原则表明:不能。

    如前所述,系统1并不善于质疑。它抑制了不明确的信息,不由自主地将信息处理得尽可能连贯。除非该信息被立刻否定,不然,它引发的联想就会扩散开,仿佛这条信息就是千真万确的。系统2能够提出质疑,因为它可以同时包含不相容的多种可能性。然而,保持这种质疑会比不知不觉相信其真实性更加困难。小数定律是普遍性偏见的一种表现,即对事物的信任多于质疑。类似这样的偏见在下面的章节中还会出现。

    相信小样本能反映调查对象的整体情况,这一强烈偏见也是一个较大问题的一部分。这个问题就是,我们常夸大所见事物的相容性和连贯性。许多研究人员过于相信通过有限的几次观察得出的结果,这一现象与光环效应紧密相连。我们常常会觉得自己对某个人很熟悉也很了解,但事实上,我们对他却知之甚少。系统1在了解事实之前就根据零散的证据拼凑了一个饱满的形象。如果相信小数定律,急于下结论的机制就会运作起来。通常情况下,它会建构一个言之成理的说法使你相信自己的直觉判断。

    对随机事件作出因果解释必然是错的

    联想机制会搜寻原因。在统计规则方面,我们面对的困难是这些规则要求使用不同的方法处理问题。依据统计学观点,我们不应关注当前事件的成因,而应当关注其未来走向。这件事的发生并没有什么特殊原因,一切只是机缘而已。

    因为偏好进行因果思考,我们在估测真实的随机事件的随机性时就会犯严重的错误。以在某家医院依次出生的4个婴儿的性别为例,男女出生次序明显是随机的。每个婴儿的出生是各自独立的。在前几个小时内出生的男婴女婴数量并不会影响到下一个出生婴儿的性别。现在,请考虑一下可能的序列:

    男男男女女女

    男男男男男男

    男女男男女男

    出现这些序列的可能性是一样的吗?人们的第一反应都是“肯定不一样啊”。但是,这样的反应是错误的。因为每个婴儿的出生都是独立的事,并且生男生女的概率也几乎相等,6个婴儿任何一种可能的性别顺序都与别的顺序概率相等。即使是现在,你仍然认为这个结论是正确的,但它实际上是反直觉的,因为只有第三种顺序是随机的。如我们所料,“男女男男女男”比其他两种顺序更有可能发生。我们追求模式,相信所处的是一个各方面都相互联系的世界。在这个世界里,规律(例如6个女婴的顺序)并不只是偶然发生的,它还是机械的因果联系或是人的意志的结果。我们并不期待在一个随机的过程中找到规律。但当探寻到一个可能的规则时,我们就会抛开这个过程是真正随机的想法。随机过程会产生许多序列,以使人们相信这个过程完全是不随机的。如此你就可以看出来为什么假设的因果关系有进步发展的优势。它是我们从先辈那里继承的一般警觉性的一部分。我们会习惯性地搜寻环境变化的可能性。狮子可能随时都会出现在平原上,但注意到狮子出现频率的明显增长并采取行动则会安全许多,即使这种增长只是由于随机过程的波动而发生的。

    对于随机性的广泛误解有时会带来重大影响。在我和阿莫斯合作的一篇代表性文章中,我们引用了统计学家威廉·费勒(William Feller)的阐述,他说,人们很容易在根本没有模式的情况下创建模式。“二战”期间,火箭弹在伦敦密集地轰炸。人们普遍相信爆炸不可能是随机的,因为地图显示,爆炸点在各地的分布有明显区别。一些人猜测没有被炸的地点住有德国的间谍。一份严谨的统计分析显示,爆炸点的分布是随机程序的一个典型代表,同样也是令人产生它并不是随机的这一强烈印象的典型代表。费勒评论道:“在没受过专业训练的人看来,这一连串轰炸行动就好像具有某种规律或趋势了。

    “很快,我得到一次机会可以把我从费勒那儿学到的知识派上用场。1973年爆发的赎罪日战争中,我作出的唯一一项重大贡献就是建议以色列空军的高级官员停止一项调查。一开始,由于埃及地对空导弹表现出色,空战对于以色列来说很不利。以色列方面人员伤亡惨重,其人员分布也不均衡。有人告诉我说,有两支来自同一基地的空军中队,其中一支被击落了两架飞机,而另一支一架也没有被击落。为了弄明白那支不幸的空军中队到底做错了什么,相关人员对此展开了调查。我们没有理由认为其中一支空军中队比另一支更有效率,也并未发现他们在操作上有何不同。当然,飞行员的生活在很多方面会有所不同,据我回忆,其差异包括他们在任务之间回家的次数以及报告任务的执行情况等。我当时给出的建议是,司令部应该明白之所以出现不同结果仅仅只是因为他们运气不同而已,应该停止对飞行员的调查。我推断这次事件很可能是由于运气不佳,对不明显的原因进行随机调查必定是劳而无功的。与此同时,空军中队不断有人员损失,没有必要再给他们增加额外的负担,让他们觉得那些去世的伙伴做错了什么。

    几年以后,阿莫斯和他的同学汤姆·季洛维奇(Tom Gilovich)、罗伯特·瓦隆(Robert Vallone)对篮球随机性的错误直觉所作的研究引起了轰动。运动员有时投篮顺手的“事实”普遍被运动员、教练和球迷们所接受。这样的推断是顺理成章的:如果一个运动员连续进了三四个球,你就会不由自主作出判断:这个运动员正处于“投篮顺手”的状态,得分率暂时增加。两队队员都持这种判断—队员也更爱将球传给打得顺手的人,对方球队则会用两位防守球员防卫这位进攻球员。然而,对上千个投篮动作的分析结果却十分令人失望:在职业篮球比赛中,无论球是从球场上投出还是从罚球线投出的,根本没有“投篮顺手”这回事。当然,一些球员会比其他球员投篮更准,但进球与投篮未中都只是随机的。“投篮顺手”完全只是旁人所见,而且他们太快作出评判了,以至于感知不到随机事件中的顺序和因果关系。“投篮顺手”是一个影响深远的认知错觉。

    公众对于这项研究的反应也是这项研究的一部分。这个发现令人惊讶,很快就受到了媒体关注,而大家普遍的反应都是不相信。当著名的波士顿凯尔特人队教练瑞德·奥尔巴赫(Red Auerbach)听说了季洛维奇及其发现(研究)时,他回应道:“这人是谁呀?他做了个实验是吧?不过我对他的观点不敢苟同。”在随机性中发现规律的想法往往不可逆转,肯定比某个人作了一项研究更有说服力。

    对规律的错觉在方方面面影响着篮球赛场。你要用多少年的观察才能肯定一个投资顾问是有真才实学的?一个执行总裁实现多少次成功的兼并,董事会才能确定他对这项工作有着非凡的才能?简单说来,如果你听从自己的直觉,就常常会因为把随机事件看做是有规律的事件而犯错。我们都非常愿意相信生活中大多数事情并不是随机的。

    在本章开头,我引用了一个美国癌症发病率的例子。这个例子本来是有意写给统计学老师看的,我是从前文中提到的两位统计学家霍华德。维纳和哈里斯。泽维林所写的一篇有趣的文章中看到这个例子的。他们写这篇文章得到了盖茨基金会17亿美元的赞助,用以调查那些最成功的院校有哪些特点。许多研究人员在那些名声显赫的院校中作调查,希望发现这些学校的与众不同之处,从而寻求成功教学的秘密。这项研究的结论之一是,这些著名院校规模普遍较小。例如在宾夕法尼亚州对1 662所院校的调查中,排名前50的院校里有6所规模都较小,是(普通院校)的3倍多。这个数据使得盖茨基金会积极投入大量资金建立小规模的院校,有时会采取将大的院校拆分成小的院校的方法。另外,其他著名的机构中至少有一半也采取了同样的做法,例如爱林伯格基金会和皮尤慈善机构也采取了同样的做法,美国教育部还启动了“小型学习社区计划”。

    你可能会觉得上述做法很有道理。我们很容易从因果关系角度去解释小规模的院校为什么可以提供优质的教学。我们认为,比起大规模院校,小规模院校可以给予学生更多的关注及鼓励,因此能培养出成就卓越的学者。但不幸的是,这样的因果分析是无意义的,因为得到的结论都是错误的。如果那些向盖茨基金会提交报告的统计学家们调查过最差学校的特点,他们会发现那些较差的学校也比水平一般的学校的规模小一些。事实上,规模小的学校办学水平并一定更高,他们只不过更懂得变通而已。维纳和泽维林说,如果真有什么区别的话,那就是大规模院校可以提供多种多样的课程,所以容易收到好的效果,特别是学生能拿到高分。

    多亏了几年来认知心理学的发展,我们现在才能清楚地知道阿莫斯和我所瞥见的不过是冰山一角:小数定律包含在大脑工作的两个重要部分中。

    ·夸大对小样本的信任只是众多错觉中的一种—比起信息的可靠度,我们会更加注重信息本身的内容,其结果就是我们会将周围的世界变得比数据所能证明的更加简单和统一。在想象的世界中过早下结论比在现实中更有把握。

    ·统计学家的很多观察研究都可归结到因果关系的解释上,但他们却不承认是这样的。许多事实其实只是巧合,包括事件的采样。对偶发事件作出因果关系的解释必然是错误的。

    示例—小数定律“没错,自从这个新执行总裁接手后,电影制片厂已经制作了3部优秀电影。不过,现在说他老练还为时过早。”“统计学家能够估算出这个交易新手表现出来的强劲势头是否是偶然的,所以在咨询统计学家之前,我不会相信他就是个天才。”“观察的样本太小,所以不能作出任何推断。我们不要遵从小数定律。”“在我们有足够大的样本之前,我计划对实验结果暂时保密。否则,我们会有过早下结论的风险。”第11章 锚定效应在生活中随处可见

    阿莫斯和我曾临时赶制过一个幸运轮盘,上面刻有零到100的标记,但我们对它进行了改装,使指针只能停在10或65的位置上。我们从俄勒冈大学招募了一些学生做这项实验。我们两人中有一个会站在一个小组前面,转动这个幸运轮盘,并让小组成员记下转盘停下时指向的数字,当然了,这些数字只可能是10或65之后,我们问了他们两个问题:

    你刚才写下的关于非洲国家占联合国(所有成员国)的百分比的数字大还是小?

    你认为联合国中非洲国家所占的比例最有可能是多少?

    幸运轮盘的转动根本不可能为任何事情提供有用信息,即使没有经过改装的轮盘也不可能,实验的受试者应该忽略它的影响,但他们没有做到这一点。那些看到10和65的人的平均估值分别为25%和45%。

    我们研究的现象在日常生活中很普遍也很重要,因此你应该记住它的名字:锚定效应。人们在对某一未知量的特殊价值进行评估之前,总会事先对这个量进行一番考量,此时锚定效应就会发生。这一效应是实验心理学中最可靠也最稳健的结果,即估测结果和人们思考的结果很相近,就好比沉入海底的锚一样。如果有人问你甘地死时年龄是否大于114岁,你在估测他的死亡年龄时会比锚定问题是35岁(死亡)时更高。你在考量买房要花多少钱时,也会受到要价的影响。同样的房子,如果市场价格高,它就显得比市场价格低时更有价值,即使你决心抵制价格的影响也没有用。此类事例不一而足,锚定效应的事例不胜枚举。一旦你要考虑某个数字是否会成为一个估测问题的可能答案,这个数字就会产生锚定效应。

    我们不是最先观测锚定效应的人,但我们的实验是第一个揭示其荒谬性的实证研究:人们的判断明显受到没有任何信息价值的数字的影响。若想解释轮盘的锚定效应是合理的,这似乎不太可能。阿莫斯和我在《科学》杂志上发表的论文中提到了我们的实验,我们在这份杂志上发表的所有研究成果中,这是最著名的一个。

    但唯一的问题是:阿莫斯和我对锚定效应体系中的心理学现象的认识并不完全一致。他支持一种解释,我则偏向另外一种,而且我们从来没有找到解决这个分歧的方法。几十年后,无数研究者通过努力终于解决了这个问题。现在问题明确了:阿莫斯和我都是正确的,是两个不同的机制共同作用产生了锚定效应,即一个系统对应一个机制。锚定有一种形式,即它是在进行刻意调整时发生的,这也是系统2的一种运行模式。还有一种是由启发效应产生的锚定,是系统1的一种自主显示模式。

    对锚定值的调整常常是不足的

    阿莫斯喜欢将调整—锚定的启发式想法作为估测不确定值的策略:从锚定的数字开始,然后估测它是过高还是过低,接着让大脑从锚定数值上“转移”并逐渐调整你的估值。调整通常会过早结束,因为当人们不再确定他们是否应该继续移动时就会停止移动。在我和阿莫斯意见出现分歧的几十年后,也就是阿莫斯去世的几年后,两位心理学家分别提出了有关这个(调整—锚定)过程令人信服的证据,这两位心理学家在其职业生涯早期曾和阿莫斯一起共事过,他们就是埃尔德·沙菲尔(Eldar Shafir)和汤姆。季洛维奇,参加研究的还包括他们的学生—阿莫斯的“徒孙”们!

    为了验证这个想法,请拿出一张纸,从纸的底端由下而上画一条2.5英寸长的线,徒手画,不用尺子。现在请拿出另一张纸,从纸的顶端开始由上而下画一条线,在距顶端2.5英寸处停笔。比较这两条线。你很可能会估测第一条2.5英寸长的线比第二条短,因为你并不确切地知道这样的一条线究竟该是什么样的。这种估测有很多不确定的因素。你若从纸的下端开始画起,就会停在下面的不确定区域;如果你从纸的上端开始画起,就会停在上面的不确定区域。罗宾·勒伯夫(Robyn LeBoeuf)和沙菲尔在日常经历中发现很多关于这种机制的例子。为什么你在开车下了高速公路驶入城市街道时还会开那么快—如果是边聊天边开车,速度尤其容易快。调整不足就是对这一现象的最好解释。孩子在房间里喜欢把音乐开得很大声,父母却很恼火,两代人关系紧张,其原因也是调整不足。勒伯夫和沙菲尔注意到“家长要求孩子应将音乐调到‘适当’的音量,但听着特别大声音乐的孩子即使想这样做也难,还会认为家长忽视了他们真心作出的让步,这是因为他们无法从充分的高锚定值中调整过来”。这里提到的司机和孩子都有意地(将数值)向下调整,但两者都没有(将这个值)调整到位。

    请看下面的问题:

    乔治·华盛顿是何时当选总统的?

    珠穆朗玛峰峰顶上的沸点是多少?

    在思考这些问题时,最先发生的事就是你的脑海中出现了锚定数字,你知道这样是不对的,而且还知道正确答案的大致方向。你马上就知道乔治·华盛顿是1776年后成为总统的,你也知道珠穆朗玛峰峰顶上的沸水温度比100摄氏度低。你不得不去寻找从这个锚定值上移开的论据,将其调整到合适的数值。就像前文提到的那个线段的例子那样,在那个不确定区域的边缘,你不确定是否应该继续进行时就会停止。

    尼克·艾普雷(Nick Epley)和汤姆·季洛维奇发现,调整就是刻意去寻找离开锚定数字的理由:按照要求一听到锚定值就摇头的人仿佛对此有些排斥,他们会离锚定值更远。而点头则会增强他们对锚定值的概念。艾普雷和季洛维奇也证实说调整是一项需要付出努力的活动。人们在自己的大脑资源耗尽时调整较少(离锚定较近),因为他们的记忆中存储着一些数字或是因为他们有些醉了。调整不足是软弱或懒惰的系统2的一种失误。

    我们现在知道阿莫斯至少对一些锚定效应的例子的理解是正确的,这些例子中包含了系统2为离开锚定值进行的具体调整。

    暗示就是一种锚定效应

    当阿莫斯和我就锚定效应进行争论时,我同意(他说的)有时会出现调整现象,但其实心里很不服气。调整是一个审慎且有意识的行为,但锚定效应的大多数例子中并没有相应的主观经验。请看下面两个问题:

    甘地去世时比144岁大还是小?

    甘地去世时多少岁?

    你是否会把144岁向下调整来得出自己的评估?也许不会,但这个大得离奇的数字仍然会影响你的估测。我的直觉告诉我,锚定就是一种暗示。如果有人只是提起某件事,而他的话却促使我们去看、去听或是去感受这件事,此时的情形就可以用锚定来形容。例如,“你的左腿现在是否微微麻木了”这个问题常会使相当多的人回答说他们的左腿确实感到有些异样。

    阿莫斯对直觉的研究比我更谨慎,他一针见血地指出,关注暗示对我们理解锚定效应没有什么帮助,因为我们不知道如何解释暗示作用。我不得不同意他是对的,但我不同意调整不足是锚定效应的唯一原因。我们为理解锚定效应做过很多实验,但是都以失败告终,最终我们放弃了进一步研究这一课题的想法。

    现在,那个打败我们的难题得到解决了,因为暗示的概念已经明确了:暗示即一种启动效应,它会有选择地找出相应的证据。你完全不会相信甘地活到了144岁,但你的联想机制却会对一位逝去的老人产生印象。系统1理解句子的方式就是尽量相信其内容的真实性,它对相应想法的选择性激活会产生一系列的系统性误差,这些误差会使我们更容易受骗,更加坚定地相信自己的想法。我们现在明白为什么阿莫斯和我从前没有意识到锚定效应有两种类型:研究手法和理论观念,我们研究这个问题时很需要这两种类型但它们却没有出现。后来,其他人极大地发展了这两种类型。

    在很多情况下,我们都需要一个类似暗示的过程发生作用:系统1试图建立一个将锚定数字视为真实数值的世界。这是我在本书第一部分描述的联想一致性的一种表现。

    德国心理学家托马斯·穆斯魏勒(Tomas Mussweiler)和弗里茨·斯特拉克(Fritz Strack)对锚定效应中联想一致性的作用所作的实证研究最令人信服。在一项实验中,他们问了一个关于温度的锚定问题,“德国每年的平均温度是高于20摄氏度还是低于20摄氏度”,或者“德国每年的平均温度是高于还是低于5摄氏度”?

    研究人员让所有受试者快速扫过一些单词,然后让他们去识别这些词。研究人员发现,受试者看到20摄氏度后更容易识别和夏天相关的词(比如“太阳”和“沙滩”),看到5摄氏度后则能更加轻松地识别出关于冬天的词汇(比如“冰冻”和“滑雪”)。对相应记忆的选择性激发解释了锚定效应:大小不同的数字能激发起记忆中不同的观念体系,而这些带有偏见的观念则成为(受试者)估测年度平均温度的依据,据此作出的估测值也因此带有一定偏见。在另一个基于同一目的的简单实验中,研究人员让受试者估测德国汽车的平均价格。高锚定值的受试者会选择性地让奢华品牌(比如奔驰、奥迪)的汽车最先出现在脑海中,而低锚定值则会使人最先想到一些销售量大的汽车品牌(比如大众)。此前我们就知道任何启发都会唤起与之相应的信息。暗示和锚定效应都通过相同的系统1的自主运行得到了解释。尽管当时并不知道如何证实这一观点,但我对锚定效应和暗示之间存在联系这一直觉最终被证实是正确的。

    作为这幢房子的主人,你能接受的最低售价是多少?

    很多心理学现象可以通过实验得到证实,但事实上这些现象中几乎没有哪种是可以测量的。锚定的影响是一个特例,锚定效应可以测量,测量结果证实这一效应影响超大。有人曾经问过那些参观“旧金山探索馆”的游客下面两个问题:

    最高的那棵红杉树是高于1200英尺还是低于1200英尺?

    你认为那棵最高的红杉树有多高?

    这个实验中的“高锚定值”是1200英尺。而另外一组受试者看到的第一个问题则用了一个180英尺的“低锚定值”。两个锚定值相差1020英尺。

    不出所料,(关于那棵最高的红杉树有多高)两个组给出了完全不同的平均评估:844英尺和282英尺。两者的差距有562英尺。锚定指数就是两个不同答案的比率55%(562/1020)。对于那些在评估过程中过度运用锚定的人而言,锚定效应的测量结果将是100%,对于那些能够忽略锚定的人而言,锚定效应的测量结果则是零。这项实验中观察到的55%的锚定指数非常典型,在其他许多问题中也观察到了相似的锚定指数。

    锚定效应在实验室中司空见惯,在现实世界中其影响同样毫不逊色。几年前的一个实验中,实验人员让一些房地产经纪人对一幢待售房子的价值进行评估。这些经纪人亲自去看了这所房子,还仔细研究了一本小册子,里面包括这幢房子的全面信息和售价。其中一半经纪人评估的售价比标价高很多,另一半评估的售价则比标价低很多。每位经纪人都给出了自己认为合理的售价,同时(假定自己是这幢房子的房主)她们还给出了自己能够接受的最低售价。实验人员随后问这些经纪人哪些因素影响了她们的决策。出乎意料的是,售价并非影响因素之一。这些经纪人十分得意,因为她们没有被这个因素所左右。她们坚称标价没有影响到她们对这一问题的回应,但实际上她们错了:锚定指数是41%。事实上,专业人士和对房地产一无所知的商学院学生一样,都受到了锚定效应的影响。后者的锚定指数是48%。两者的唯一区别是,学生承认他们受到了锚定效应的影响,而专业人士则否认这一点。

    在人们对钱的问题所作的决定中同样体现出了强大的锚定效应,人们选择对一项事业投入多少时就会受锚定效应的影响。为了证实这一影响,我们告诉探索馆研究中的受试者,太平洋中的油管引起了环境污染,问他们是否愿意每年都捐钱“使5万只近太平洋海岸的海鸟不致受小面积海上溢油的影响,直到找到防止泄漏的方法或要求油罐所有者支付运行费用为止”。这个问题需要强度相匹配:实际上,我们是在要求调查对象预估应该捐献多少钱才能与自己对海鸟困境的感受程度相匹配。对其中一些游客,实验人员并没有直截了当地问她们愿意捐多少钱,而是先问了一个锚定问题,比如“你是否愿意花5美元来……”

    若没有提到锚定问题,这些对环境都很敏感的探索馆参观者会说他们愿意拿出的钱平均为64美元。当锚定金额只有5美元时,平均捐款则是20美元。当锚定金额达到400美元时,人们的捐款平均数就达到了143美元。

    高锚定金额和低锚定金额之间相差123美元。锚定指数高于30%,表明增长100美元的初始要价就能带来平均值为30美元的回报。

    许多估测和捐款意愿的研究都曾体现出相似甚至更大的锚定效应。例如,有人曾问过那些在法国马赛重度污染地区居住的居民,如果能住在一个污染程度较低的地方,他们能接受生活开销提高多少。锚定指数在该研究中超过了50%。在网上购物过程中也很容易观察到锚定效应,网上相同的产品经常标出不同的“立购”价。“估测”在艺术品拍卖行业中是影响第一次竞拍的锚定价格。

    锚定效应在某些情形下看起来也是合理的。毕竟,那些被问到难题的人肯定会去抓住这根救命稻草的,况且这个锚定值也是根貌似合理的稻草。如果你对加利福尼亚的树所知无几,却又被问到红杉树是否高于1200英尺,此时你可能就会认为这个数字与真实数字相差不远。因为是那些知道这种树真实高度的人想出的这个问题,所以这个锚定值也许是个有价值的提示。但是,锚定效应研究有一个重要发现,即锚定值显然是任意的,它也许和可能有信息价值的锚定值一样有效。当我们用轮盘来估测联合国中非洲国家所占的比例时,锚定指数是44%,还算是处在看似正确且能作为提示的锚定效应的影响范围内。有些实验已观察到大小相似的锚定效应,在这些实验中,受试者社保号的最后几个数字被用做锚定值(比如为估测他们城市中医生的数量)。结果很明确:锚定值没有影响,因为人们认为这些数字没有什么信息价值。

    随机锚定的影响以一些令人不安的方式出现在生活中。一些任职经历平均为15年的德国法官先是读了一份案例,讲到一个妇女在商店顺手牵羊被捉住的案例,然后他们开始掷一副骰子,这副骰子被人提前做过手脚。因此,每次掷骰子的结果不是3就是9。骰子一停,实验人员就问这些法官是否会将那位妇女送进监狱,且其服刑的时间应该比骰子上的数大还是小。最后,实验人员问这些法官,他们给这个行窃的妇女判定的服刑期具体是多少。平均来看,那些掷了9的法官说他们会关她8个月,而掷了3的法官说他们会关她5个月,锚定指数是50%。

    锚定效应何时适用,何时不适用?

    到现在为止,你已经相信锚定效应无处不在,有时是由于启发效应,有时则是因为调整不足。产生锚定效应的心理机制使我们比自己预想的更容易受影响。当然,有些人愿意且能够利用我们的轻信。

    例如,锚定效应解释了为什么限量购买是一种有效的营销策略。几年前,在艾奥瓦州的苏城的超市里,购物者遇到了坎贝尔汤罐头在作促销的情形,降价10%。有那么几天货架上写着“每人限购12罐”,而在其他几天里则写着“不限量”。购物者在限购时平均会购买7罐,是不限购时购买量的2倍。锚定效应不是唯一的解释,配给也显示货物很快就下架了,购物者应该对货物储存量感到有些紧张。但我们也知道12罐的可购买量会成为一种锚定,即使这一数字是通过轮盘产生的也不例外。

    同样的策略在商讨购房价上也适用。在许多其他的活动中也是这样,在协商中率先出击的一方往往会占有优势,例如,当价钱是买方和卖方唯一要协商的事时就会出现锚定效应。第一次在集市上讨价还价也是这样,先发锚定有着重大的影响。我在教学生谈判时,给他们的建议是如果你认为是对方作出了无礼的提议,你就不应该提出同样无礼的提议,因为两者之间有距离的话会使此后的商谈难以进行。你应该大吵大闹,夺门而出,或者威胁对方说自己也会这样做,要让对方明白以这个数字为基准的话,谈判将难以继续。

    心理学家亚当·加林斯基(Adam Galinsky)和托马斯。穆斯魏勒提出了更好的方法来抵制商谈中锚定效应的影响。他们告诉谈判者,在商谈中要集中注意力搜寻大脑记忆来抵制锚定效应。激活系统2的做法会很奏效。例如,在第二个提议人将其注意力集中在对方能接受的最低值或对方无法接受的费用上时,锚定效应就会削弱或消除。大体来讲,有意地“为对方着想”的策略也许是抵制锚定效应的好方法,因为它否定了能产生这些效应的带有偏见的想法。

    最后,试试看你能不能弄清楚锚定效应对公共政策问题的影响,即人身伤害案件的损害程度的裁定。这类案件的判决有时是很严厉的。类似医院和化工企业等单位常常是这类诉讼案件的被告,这些单位曾经游说各方为此类判决设置了一个上限。

    读本章之前你可能想过,给这些判决设置上限绝对是有利于潜在被告的,但现在你就不会这么确信了,如果上限是100万美元,其结果会怎样?这条规则会消除所有的严厉判决,但锚定也会阻止法官将许多较轻罪行的量刑判得更轻。这对违法者和大公司都有好处,比给小公司带来的好处多。

    随机锚定效应还会使我们更加了解系统1和系统2之间的关系。人们一直利用判断与选择的案例来研究锚定效应,而判断与选择最终总是由系统2完成的。但是,系统2对从记忆中提取的数据进行加工,并由系统1进行自主的、无意识的运行,因此很容易受锚定效应的影响,而这种影响会使某些信息更容易让人回想起来。此外,系统2对这种影响一无所知,也无法控制。看到随机或荒谬的锚定值(比如甘地死时144岁)的那些受试者会自信地说,这个明显无用的信息并没有对他们的估测行为产生影响。事实上,他们错了。

    在讨论小数定律时我们发现,如果一则消息没有马上被视为谎言,那么不管其可靠性如何,它都会对联想系统产生同样的影响。这个消息的重点是故事,随便根据什么信息编造的都无所谓,即使这则消息的信息量很少,质量很差劲也无所谓,因为眼见即为事实。当你读到一个拯救受伤登山客的人的英勇故事时,这个故事对你的联想记忆产生的影响和一篇新闻报道或电影简介大体差不多。锚定效应是由这个联想激发引起的。这个故事是否真实、是否可信一点都不重要。随机锚定的强大影响是锚定效应的极端例子,因为随机锚定显然没有提供什么信息。

    我在前文中讨论了启发效应纷繁复杂的表现类型,在启发效应下,你的思想和行为也许会被完全不曾留意的刺激所影响,甚至会被你完全没有意识到的刺激所影响。启发实验的主要寓意是我们的思想和行为会受当时的环境影响,且这种影响比我们了解或想象的要大。很多人发现启发效应的结果令人难以置信,因为它们和主观经验相去甚远。另外很多人则发现其结果令人不安,因为它们威胁着我们对中介和自主性的主观感受。如果不相关的大脑屏保能在你意识不到的情况下影响你对陌生人的帮助,那你到底有多自由呢?锚定效应也以相似的方式威胁着你。你总能意识到锚定,甚至会对它格外关注,但你不知道它是如何引导和限制你的思考的,因为你不能想象如果锚定改变(或不存在)你会如何思考。但是,你应该假设任何一个公开谈判时的数字都对你有锚定效应,如果概率大,你应该抵制(你的系统2)该效应。

    示例—锚定“我们想要收购的公司给我们看了他们的商业计划,其中包括他们希望得到的收益。我们不应该让那个数字影响到我们的思路。将其放置一边。”“计划是为最佳情况设计的方案。当我们预计实际结果时,要避开计划的锚定效应。想想计划出现失误的各种方式也不失为执行计划的一个方式。”“我们商谈的目标是让他们锚定在这个数字上。”“我们要清楚一点,如果那就是他们的提案,那么商谈就此结束吧,我们不想那样开展工作。”“被告律师提出一个微不足道的证明,证明中提到了一个荒谬的小损失,这些律师就是想让法官们拿这个损失做锚定。”第12章 科学地利用可得性启发法

    1971~1972年,阿莫斯和我在俄勒冈州的尤金度过了我们最为高产的研究时期。我们在俄勒冈研究院做客,在我们研究的领域—判断、决策制定和直觉性预测—中该研究院后来诞生了很多未来之星。主要负责接待我们的是保罗。斯洛维克,他曾是阿莫斯在安阿伯市时的同学,也是他一辈子的朋友。保罗当时即将成为风险心理学领域中的领军人物,他独领风骚几十年,也获得了很多荣誉。保罗和他的妻子洛兹带我们感受尤金的生活,很快我们也开始效仿尤金人,常去跑步、烧烤,带孩子去看篮球赛等。我们非常努力地工作,做了很多关于启发法的实验,也写了很多文章。晚上的时候,我就写那本《注意与努力》,那段时间我非常忙。

    我们的项目中有一项是对“可得性启发法”进行研究。我们问自己,人们在想要估计某类事件的出现频率时到底是怎么做的,这些事件包括“人在60岁之后的离婚概率”或“(是否是)危险的植物”等。我们认为这种自问就是启发法。这些问题的答案很简单:从记忆中搜寻这类问题的实例,如果搜寻过程既轻松又顺畅,这些事的发生概率就会被判断为很大。我们将可得性启发法定义为通过“实例呈现在脑中的轻松程度”来判断概率的过程。我们的系统阐述似乎已经给出了这一方法的明确定义,但可得性这一概念此后仍在不断得以精炼。我们在研究可得性的时候还没有阐发两个系统的方法,而且我们并没有费尽心思去确定启发法是可以解决问题的主观策略,还是一个自主运行的无意识行为。现在我们知道启发法其实涉及两个系统。

    我们之前思考的问题是,到底需要在大脑中搜寻多少实例才算是轻松回忆,以获得某一印象。我们现在知道了答案:一个也不用。例如,请考虑下面两组字母可以组成多少个单词。

    XUZONLCJM 

    TAPCERHOB

    你几乎不必去想什么实例,一打眼就知道其中一组字母比另一组组成单词的可能性更大,可能会多10个或者更多。同样,想要清楚地了解不同国家去年出现在新闻中的相关频率(比利时、中国、法国、刚果、尼加拉瓜、罗马尼亚等)你也无须回想具体的新闻报道。

    意识到自己的偏见有利于团队关系融洽

    与其他判断启发法一样,可得性启发法就是用一个问题替代另一个问题:你希望估测某一范畴的大小或某一事件的(发生)频率,但你却会提到自己想到相关实例的轻松程度。问题的替代必然会产生系统性错误。你会发现启发法是如何通过一个简单的过程导致偏见的,不直接说出(事件发生的)频率,而是列举那些使你轻松想起相关实例的因素,其中的每个因素都会成为偏见的潜在来源。试举几例:

    ·你可以很轻松地回想起引起自己注意的突出事件。好莱坞明星的离婚事件和政客的性丑闻事件格外引人注目,想到这些实例并不难。因此,你很容易夸大好莱坞离婚事件和政客性丑闻事件的频率。

    ·一个大事件会暂时提高此类事件的可得性。飞机失事事件会有媒体来报道,这也会暂时改变你对飞行安全的看法,接着你又看到路旁有辆汽车着火了,于是这些事故会暂时盘踞在你的脑海中,你会觉得这个世界此时充满更多难以预料的事。

    ·亲身经历、生动的图片和鲜活的例子比发生在别人身上的事、单纯的文字或是统计数据更容易让人回想起来。一个与你相关的判决错误会逐渐削弱你对司法体系的信任度,其影响程度比你在报纸上读到类似事件的影响更深。

    你可以尽可能地抵制如此之多的潜在的可得性偏见,但那样做会令你身心俱疲。你必须通过自问一些问题努力重新审视自己的印象和直觉,比如“我们是否会因为小区内最近发生了几起偷盗事件就认为青少年盗窃是个严重问题”或者“我认识的人去年没有得感冒的,我是不是就没必要打免疫针了呢”。时刻对偏见保持警惕是件累人的事—但由此便可避免一个代价高昂的错误,因此付出努力也是值得的。

    有个很著名的可得性实验表明,意识到自己的偏见可以使夫妻和睦相处,而且很可能在其他的合作计划中与他人的关系也很融洽。在一项广为人知的研究中,研究人员问夫妻双方的问题是:你为保持此地整洁作了多大贡献?用百分比来表示。此外,夫妻俩还回答了如“倒垃圾”、“发起社交互动”等类似问题。那么这两位自我估测的贡献率合计能达到100%吗,是更多或者更少?不出所料,他们自我估测的贡献率合计超过了100%。一个简单的可得性偏见就可以对此作出解释:夫妻二人记自己的努力和贡献比记对方的清楚得多,而且可得性的不同导致了对频率判断的不同。偏见不一定是自私的:这对夫妻还过多地将两人的争执归因于自己,尽管这一比例比两人在那些积极正面的事件中的自评比例小得多,但也是难能可贵了。同样的偏见对常见的观察同样适用,很多合作团队成员感觉他们做的事超出了自己的分内工作,还感到其他人并不感激自己作出的贡献。

    我通常对人们控制偏见的潜能不是很乐观,但这次例外。成功去除偏见的案例还是存在的,即我们可以很轻松地识别出功劳分配问题是何时出现的,尤其当几个人同时感到他们的努力没有得到足够的认同时更是如此。自己周围的那些人通常也会付出超出100%的努力工作,只要你看到这一点有时就足以缓和这种(心理失衡)情形。任何情况下,每个人都该牢记这一点。你做的事情偶尔会超出自己的分内事,但你应该知道,当你有可能有这种感觉的时候,你的团队里的每个成员也都可能有同感。

    可得性偏见会影响我们对自己或他人的看法

    20世纪90年代早期,人们对可得性启发法的理解有了重大进展。那时,由诺伯特·施瓦茨(Norbert Schwarz)领导的一组德国心理学家提出了一个有趣的问题:人们对某件事发生频率的印象是如何受到列举实例的具体数目这一要求的影响的?

    设想你自己就是那个实验的受试者:

    首先,列出6个你果断行事的例子。

    接下来评判一下你有多果断。

    假如有人要求你列12件自己表现得果断的事(大多数人都会觉得很难列出这么多件事)。你对自己果断程度的判定会有所不同吗?

    施瓦茨和他的同事观察到列举事件的任务可能会通过两种不同方式加强对特点的判断:

    ·能回想起的事例数量。

    ·事件在脑中呈现的轻松程度。

    列举12个例子的要求使得两个决定因素相互排斥。一方面,你刚想起了几件自己做得很果断的事;另一方面,你想起前三四件果断的事可能很轻松,可说出12件就要挖空心思了,回忆起来也没有那么顺畅。哪个更重要呢,提取的数量还是提取的轻松感和顺畅性?

    两个因素间的较量谁是赢家一目了然:那些列举了12件事的人认为和只列举了6件事的人相比,自己不够果断。而且,列举出自己表现不够果断的12件事的那些受试者最终却认为自己非常果断!如果无法轻松地想起懦弱的事例,你可能就会说自己一点也不懦弱。自我评估是由事件呈现在脑海中的轻松度来衡量的。轻松地想起某件事的体验比想起事情的数量更重要。

    同一个小组的另外一些心理学家对顺畅性的作用作了一个更为直接的实证研究,实验中所有的受试者都按要求列出了6件果断(或不果断)行事的例子,同时还保持着特定的面部表情。“微笑者”要收缩颧肌,露出浅浅的微笑:“皱眉者”要皱着眉头。如你所知,皱眉通常伴有认知紧张,且其影响是对称的:执行任务时被要求皱眉的人付出的努力更多,体验到的认知紧张也更强烈。研究者预计皱眉者在提取果断行为时会有难度,因此会估计自己缺少果断性。结果也的确如此。

    心理学家喜欢产生悖论的实验,他们怀着极大的兴趣运用了施瓦茨的发现。例如,人们:

    ·在回忆起自己多次骑自行车的经历后,依然相信他们自己不经常骑自行车。

    ·在被要求用更多的论据支撑自己的选择时自信心下降。

    ·在列出多个避免某种问题的方法后,却对避免此问题显得更加不自信。

    ·在列出某辆车的优点后,对该车变得没那么感兴趣了。

    加州大学洛杉矶分校的一位教授发现了一个利用可得性偏见的巧妙方法。他让不同组的学生列出改进课程的方法,要求不同组列出不同数量的方法。正如他所预料,列出较多改进方法的学生对这一课程的评价也更高。

    也许这个有悖论的实验中最有趣的发现就是悖论不一定会被发现:人们有时依照提取到的内容而非提取的轻松程度来作出判定。你真正了解行为模式的证据就是你知道如何让其发生逆转。施瓦茨和他的同事们接受了这一挑战,去探索在何种情况下会发生这种逆转。

    受试者想到那些行事果断的例子的轻松程度在任务实施过程中是不断变化的。前几件事情提取时很容易,但很快就变得越来越难。当然,受试者的思考顺畅性也会慢慢下降,但在列举6~12件事中顺畅性的下降速度显然要超出受试者的预料。结果表明受试者作出了推理:如果我在回想能体现自己果断行事的例子时遇到了超乎想象的困难,那说明我根本就不是个果断行事的人。请注意,这个推理建立在受试者未曾料到的情况之上—顺畅性比预期的更糟糕。此例中受试者运用的可得性启发法被叫做“无法解释的不可得性”启发法才更合适吧。

    施瓦茨和他的同事们论证道,他们为受试者解释其在回想相关经历的流畅性(发生变化的问题),由此可以干扰启发法。他们告诉受试者在回想事件时他们会听到背景音乐,而且音乐会对他们完成记忆任务产生影响。实验人员告诉一些受试者音乐能帮助他们回想起相关例子,却告知其他受试者听音乐其回忆会不那么顺畅。不出所料,那些对顺畅性有所认识的受试者没有将音乐看成是一种启发法;而那些得知音乐会使回忆更困难的受试者无论完成提取6件还是12件的任务,对自己果断程度的估测没什么两样。其他的主要实验也得到了同样的结论:若通过展示曲线或直线的文本框,或屏幕的背景颜色,又或其他与实验预期不相关的因素对体验到的顺畅性作出虚假解释的话,判断便不再受提取轻松程度的影响。

    诚如我所述,用可得性来判断的过程包括了一个复杂的推理链。受试者会体验到,他们在提取事件时,顺畅性会逐渐降低。他们显然对顺畅性的下降率事先有过预计,但那些预计是不准确的:想起新事例的困难增速远远超出了他们的预计。正是这种超出预期的低顺畅性使那些被要求列举12个事例的人将自己描述成优柔寡断之人。了解个中缘由,低顺畅性也就不会再影响判断了。这个过程看似由一套复杂的推理组成。自主的系统1能胜任这项任务吗?

    回答时其实根本就不需要复杂的推理。在系统1的基本特征中,其中一点就是这一系统具有设定预期的能力,当现实与预期相悖时它就会感到惊讶。该系统还会提取造成惊讶情绪的可能原因—通常是在近期所经历的各种惊讶体验中找到一个可能的原因。此外,系统2在运行中会重塑系统1的预期,因此一件本该令人惊讶的事就变得正常了。假设有人事先告诉过你那个住在隔壁的3岁大的小男孩经常戴着一顶礼帽坐在小推车里,那么当你真的看到他戴着礼帽时就不会像事先并不知道(这件事)那么惊讶了。在施瓦茨的实验中,受试者事先知道背景音乐可能是影响他们回想具体事例的一个原因,因此他们对提取12件事的难度也就不再那么吃惊了,这种难度也就不大可能影响他们对自己果断行事程度的判断。

    施瓦茨及其同事发现,判断涉及自身情况的人往往更有可能关注他们从记忆中提取的事件数量,对顺畅度则不大关注。他们请两组同学参加对心脏健康风险的研究,其中一半学生有心脏病家族史,他们应该比其他没有这种家族病史的人更注重这个研究。所有的学生都要回想自己日常生活中可能会影响心脏健康的3种或8种行为(按照要求,有些学生需要回想的是危险行为,其他学生需要回想的是保护性行为)。没有心脏病家族史的学生对这项任务较随意,遵循的是可得性启发法。觉得想起8件危险行为很难的学生觉得他们相对安全,而那些努力回想安全做法的学生却感觉自己处于危险中。有心脏病家族史的学生则表现出相反的模式—他们在想起很多安全做法时觉得很安全,在想起很多危险行为时感到很危险。他们还更有可能觉得自己将来的行为会受到自己对危险做法评估的影响。

    由此可见,事件在脑海中呈现的轻松程度体现出系统1的启发作用,然而当系统2越来越多地参与其中时,受试者关注的就不再是提取记忆的轻松度,而是回忆起来的若干事例的内容了。各种各样的证据都指向统一结论,即那些跟着系统1走的人更容易受可得性偏见的影响,比那些警惕性更高的人受影响的程度更大。在下面这些情况中,人们都在“跟着感觉走”,提取轻松度对他们的影响要大于其回想事例内容带给他们的影响:

    ·当他们同时忙于另一件需要付出努力的任务时。

    ·因他们刚刚想起生命中的一个快乐片段而心情大好时。

    ·如果他们在抑郁量表中得分很低的话。

    ·尽管对这项任务所给话题的了解达不到专家级水准,但他们也算是对此领域了解颇多的新手了。

    ·他们跟着感觉走却拿了高分时。

    ·如果他们(或别人令他们感到)很强大时。

    我认为最后一个发现尤其有趣。几位作者引用一句名言来介绍自己的文章:“我没有满世界做民意调查来告诉自己怎样做才对,知道自己的感受就够了。”他们进一步表明,对直觉的依赖只是个人品行特征的一部分。他们只想提醒人们,能力可以提升我们对自己直觉的信任。

    示例—可得性“因为上个月发生了两架飞机相撞事件,她现在更愿意坐火车。这真是愚蠢,风险其实并没有真正降低,这就是可得性偏见。”“他低估了室内污染的风险,因为媒体对此报道极少。这是可得性的影响。他应该看些统计数据。““她最近看的间谍电影太多了,因此她看什么都觉得有阴谋。”“这位执行总裁连续多次成功,因此失败不会轻易在她的脑海中出现。可得性偏见使得她过于自信。”第13章 焦虑情绪与风险政策的设计

    有风险意识的学生可以迅速发现可得性效应与自己的担忧不无关联。在我们的作品发表前,经济学家霍华德·昆路德(Howard Kunreuther)就已经注意到,可得性效应能够对买保险的行为模式和灾后的保护性行为模式作出解释。当时,昆路德对风险和保险的研究正处于起步阶段。受害者和近似受害者在灾后往往心存焦虑。

    每次影响巨大的地震发生之后,加利福尼亚的居民都会去买保险,采取充分的自我保护和减少损失的措施。他们固定好暖壶以防止其在地震中破碎,将地下室的门封死以抵抗洪水,还要确保紧急备用电源能正常工作。但是,随着时间的推移,对灾难的记忆就会变得模糊,担忧和防备的努力程度也会减弱。记忆的动态变化为灾难、担忧和越来越松懈的心理这一循环作出了解释。昆路德还观察到,不论是个人的还是政府的保护性行为,都能应对最糟糕的灾难。早在法老时代的埃及,人们就为周期泛滥的河水的最高水位作出标记,找出相应的治水对策,当时的人们显然认为河水不会比标记的最高水位更高,因此他们很难想到还会有更大的洪灾。

    被闪电击中与食物中毒,哪种意外致死率更高?

    对可得性偏见最具影响力的几项研究,是由我们那些身在尤金的朋友完成的,保罗·斯洛维克和他的长期合作者萨拉·利希滕斯坦(Sarah Lichtenstein)以及我们以前的学生巴鲁克·费斯科霍夫(Baruch Fischhoff)等人共同完成了这些研究。他们关于公众对风险看法的研究具有奠基意义,包括一项如今已成为可得性偏见的标准案例的调查。他们让受试者思考两组死亡原因:糖尿病和哮喘,中风和意外事故。

    每组原因中,受试者要指出更常出现的原因并估测两种可能性的比率,然后将作出的判断与当时的健康统计数据进行比较。以下是他们发现的一个样例:

    ·中风致死的数量几乎是所有意外事故致死总数的2倍,但80%的受试者却判断意外事故致死的可能性更大。

    ·人们认为龙卷风比哮喘更容易致死,尽管后者的致死率是前者的20倍。

    ·人们认为被闪电击中致死的概率比食物中毒要小,不过,前者致死率却是后者的52倍。

    ·得病致死是意外死亡的18倍,但两者却被认为概率相等。

    ·意外死亡被认为是糖尿病致死率的300倍,但真正的比率却是1∶4.

    这其中的道理很明显:对死亡原因的估测因媒体报道而有所改变。报道往往偏向新鲜和尖锐的事。媒体不仅影响了公众的兴趣,也受到公众兴趣的影响。编辑不可能忽略公众的需求,就对某些话题和观点进行大量报道。不同寻常的事件(比如腐肉中毒)会格外引人注意,人们常会低估此类事件的发生概率。我们脑海中的世界并不是真实世界的准确反映;我们对事件发生频率的估测也会受到自己接触这些信息和频率与个人情感强烈程度等因素的影响。

    对致死原因的估测几乎是联想记忆中观点激发的直接反应,也是替代效应的极佳例子。但斯洛维克和他的同事们有了更深层次的发现。他们发现,人们想到不同风险的轻松程度与其对这些风险的情感反应是紧密相连的。我们总是特别容易想起那些骇人的想法和画面,而那些流畅生动的骇人印象又会加深我们的恐惧。

    如前所述,斯洛维克最后对情绪启发式的概念作了详细探究,认为人们在作判断和决策时会受情绪的影响:我喜欢它吗?我恨它吗?我对它的感觉有多强烈?斯洛维克说,在生活的很多领域中,人们形成的观点和作出的选择直接表达出其情感和取舍的基本倾向,而这些行为完全是在毫无意识的情况下作出的。情绪启发是替代的一种,即将简单问题(我对它感觉如何)的答案当做较难问题(我对它评价如何)的答案。斯洛维克及其同事将他们的观点与神经学家安东尼奥·达马西奥(Antonio Damasio)的研究成果联系起来。达马西奥曾指出人们对结果的情感反应、身体状态,以及与之对应的取舍抉择在决策制定中都发挥了重要作用。达马西奥和他的几位同事发现,在做决策前没有表现出适当情感的人可能是因为他的大脑有损伤,也可能是因为他对做出较好决策存有障碍。无法接受糟糕结果的“健康畏惧”导向是个灾难性缺陷。

    关于情绪启发式的运作问题有一项十分令人信服的实证研究,斯洛维克的研究小组对人们对各种技术的看法进行了调查,其领域涉及饮用水氟化、化工厂、食品防腐剂和汽车等,要求受试者列举每项技术的优缺点。他们发现受试者对该技术的优势和风险的估测值存在非常大的负相关性。当人们更青睐于某项技术时,他们就会认为此项技术更有优势、风险更小;如果他们不喜欢某项技术,则只会想到其缺点和寥寥几个优点。因为几项技术刚好是从好到次排列起来的,因此无须作艰难的权衡。当研究人员要求受试者在规定时间内对风险和优点作出估测时,这两项估值会更接近。值得注意的是,英国毒物学会几位会员的反应是相似的:他们在自认为危险的物质和技术中发现的优点很少,反之亦如此。一致影响是我所提到的联想一致性的一项基本要素。

    接下来是该实验最精彩的部分。完成最初的调查后,受试者读了几篇支持不同技术的小短文。有些短文关注的是某项技术的众多优点,其他短文则强调其风险低。这些短文有效地改变了受试者对这些技术的感性认识。实验结果令人关注,那些读到对某项技术多有褒奖的短文的人,对此项技术存在的风险也有了不同认识。尽管没有佐证,但他们现在却认为自己更喜欢这项技术了,感觉其风险没那么大。同样,那些只知道某项技术风险较小的受试者也会对其优点越发青睐。其中的道理很明显:正如心理学家乔纳森·海特(Jonathan Haidt)在另一篇文章中所说的那样:“感性细节掌控理性大局。”情绪启发式通过创造一个比现实更明了的世界来简化我们的生活。好的技术在我们的虚拟世界中成本较小,不好的技术没有利益,所有的决策在这里都变得很简单。当然,在现实世界中我们常要在利益和成本中作出权衡。

    如何避免小概率的风险事件演变成公共危机?

    保罗·斯洛维克可能比其他人更加了解人类作出风险判断的特性。他的著作描述了不卑不亢的普通人形象:感性而非理性,易被琐碎细节左右,并且对较小的可能性和极微小的可能性之间差别的感知力不够敏锐。斯洛维克还对专家进行了研究,显然专家在处理数字和数量的问题时更权威。专家同普通人一样,也以衰减的形式表现出同样的偏见,但他们对风险的判断和偏见往往与普通人有所不同。

    非专业性判断中存在的偏见可以对专家和公众之间的不同之处作出一定的解释,但斯洛维克提请人们注意能反映不同价值间真实矛盾的情况。他指出专家经常通过判断死亡人数(或寿命)来测定风险,而公众的区分则更加细致,例如,“善终”和“非善终”,是意外死亡还是在类似滑雪这样的自愿活动中死亡等。这些合理的区别经常被只计数事件的统计学所忽略。斯洛维克通过这些观察报告得出结论:公众对风险的认识比专家更深刻。因此,他强烈反对专家或权威的观点,若专家与其他公民的观点和希冀相矛盾时,人们就不应该完全接受专家的观点。他说,当专家和公众对各自的优先权意见分歧时,“双方必须尊重对方的见解和智慧”。

    斯洛维克想摆脱专家对风险判断的绝对控制,因此他对专家的理论根据—风险是客观的—发起了挑战。

    “风险”并不是脱离我们的思想和文化而独立存在的,不会老老实实等着我们去测量。人类发明“风险”这个概念是为了帮助自己理解和应对生活中的危险和不确定情况。尽管这些危险是真实存在的,但却没有“真正风险”或“客观风险”这回事。

    为了阐述自己的观点,斯洛维克列举了9种界定死亡风险的方式,从“每100万人的死亡”到“每生产价值100万美元的产品造成的死亡”,这种死亡风险与向空气中释放有毒物质的做法相关联。他的观点是:风险评估依赖测试方法的选择—这种选择极有可能是在人们心中期望得到这样或那样结果的情况下作出的。他进一步总结道,“因此,风险界定是一种权利运作”。也许你从未想过竟然会有人将判断心理的实验研究与棘手的政策问题联系起来!但是,政策最终还是与人相关的,它关乎人们想要什么和什么对他们是最有利的问题。每个政策问题都包括对人性的假设,尤其是人们可能作出的抉择和他们为自己和社会作出抉择所带来的后果。

    我特别敬仰的另外一位学者兼好友卡斯·桑斯坦(Cass Sunstein)对专家和公众的看法与斯洛维克截然不同,他认为专家就是抵制“平民”越轨的壁垒。桑斯坦是美国最知名的法学家之一,与同领域的其他领军人物一样,他身上具有一种大无畏的精神。他知道自己能快速且完整地掌握任何知识体系,而且他已经掌握了很多知识体系,包括判断和决策心理学、管理问题、风险政策等。他认为美国现行的监管体系暴露出优先处理事件不明确的糟糕状况,这一体系更多的是对公众施压做出反应,而不是谨慎客观地分析具体情况。桑斯坦认为,为降低风险而采取的风险监管和政府干预手段,应该以成本和利益间的理性权衡为指导。对具体情况的谨慎而客观的分析,其自然单位是拯救生命的数量(或者是寿命,用寿命做自然单位可能会更注重对年轻人的拯救)和钱财的数量。监管不力会造成生命和金钱的浪费,两者都可以进行客观测量。斯洛维克认为风险及其测量都是主观的,桑斯坦对此并不信服。风险评估的许多方面都还有待商榷,但他对风险的客观性抱有信心,也许通过科学、专业知识和审慎的思考可以拥有这样的信心吧。

    桑斯坦越来越相信,对风险带有偏见的反应是导致公共政策中优先处理权不稳定和错位的重要原因。立法者和监管人员对民众的无理要求可能会反应过度,因为他们有着很强的政治敏感性,也因为他们和其他民众一样容易抱有同样的认知偏见。

    桑斯坦和一位合作者—法学家蒂默尔·库兰(Timur Kuran)为偏见植入政策这一机制起了个名字“效用层叠”(availability cascade) ① 。他们评论道,在社会大背景下:“所有的启发式都是平等的,但可得性相比而言更平等。”他们了解广义的启发式概念,在这个概念中,可得性为判断(而不是概率)提供了启发,尤其是我们通过想到某个概念的轻松程度(和情感的释放)来判断其重要性时,这种启发的作用就体现出来了。

    效用层叠是一连串自持事件,它可能开始于对相对次要的事件的媒体报道,然后会引起公众恐慌和大规模的政府行动。有些情况下,关于某一风险的媒体报道能抓住部分公众的注意力,这部分注意力进而会变成激愤和焦虑。这种情感反应本身就是一种宣扬,会推动媒体跟进报道,继而会令人产生更大的焦虑,波及面也更大。通过“可得性倡导者”,这个循环有时候会因为那些“可得性专业户”—专门负责连续不断地散布扰乱民心消息的个人或组织—的刻意操纵而加速运行。媒体竞相制造吸引人眼球的头条新闻,危险也随之升级。一些科学家和其他领域的人士试图抑制这种日益增长的恐惧和厌恶情绪,然而收效甚微,非但没有达成初衷,反而激起了不少敌意:所有宣称危险有些夸大其词的人都有“欲盖弥彰”的嫌疑。这是一个重要的政治问题,因为每个人对此都很上心,政治体系的回应也会受公众情感强烈程度的影响。此时效用层叠就要重新设定优先考虑的事件。其他风险和关乎公众利益的资源利用方式也都显得不那么重要了。

    库兰和桑斯坦曾经关注过两个案例,这两个案例直至今日仍备受争议:(纽约州)拉夫运河事件和所谓的艾拉恐慌(Alar scare)。拉夫运河中掩埋的有毒垃圾在1979年的雨季中显露出来,引起了水井污染超标,还散发出恶臭。当地居民当时既气愤又害怕,他们中的洛伊丝·吉布斯(Lois Gibbs)对这个问题的反应尤为活跃,一心想要维护自身利益。官方消息触发了效用层叠。在这一事件最受关注的时候,每天都会有很多拉夫运河的相关报道,当时一些科学家试图告诉公众他们夸大了危险的程度,但是这一论调不是被人们忽略就是被相反的声音淹没了。当时美国广播公司新闻档播出了一个名为“杀戮场”的节目,视频中的人们抬着婴儿用的空棺材行经立法机关门前。众多居民由政府出资迁往外地。对有毒垃圾的治理成了当地20世纪80年代的重大环境问题,当地政府出台了《环境保护赔偿责任法》,要求清理有毒地点,设立超级基金,这项立法被视为环境立法史上的重大成就。这些措施花费自然不菲,有人还说同样数额的钱如果用在其他重要的事情上可以拯救更多的生命。拉夫运河事件的真相究竟是怎样的,直至今日人们仍旧各执一词,没有人能拿出实实在在的证据证实这一事件对健康造成了实质性的损害。库兰和桑斯坦对拉夫运河事件的报道像是条假新闻,不过环保人士今天仍旧会一再提到“拉夫运河灾难”。

    关于库兰和桑斯坦用来说明效用层叠概念的第二个例子,人们的观点至今仍然存有分歧。这个例子就是1989年的艾拉事件,也就是环境问题批评者口中的“艾拉恐慌”。艾拉是种化学品,喷洒到苹果上用以调节苹果的生长周期并改善其外观。有报道称该化学品用量大,可导致大老鼠和家鼠得癌症,恐慌便由此引发。报道自然可以吓到众人,而且这些恐慌情绪也促使媒体争相报道,这就是效用层叠的基本机制。这一主题对新闻形成引导作用,进而引发了重大的媒体事件,例如梅丽尔·斯特里普(Meryl Streep)在国会前的证词。由于苹果和苹果产品引起人们的恐慌,苹果产业损失巨大。库兰和桑斯坦引用了一位打来电话的居民的话,此人问道:“是把苹果汁倒进下水道更安全,还是扔到有毒废物垃圾场更安全?”生产商回收了苹果杀虫剂产品,美国食品药品管理局也对此产品颁布禁令。此后的研究证实这种物质致癌的可能性很小,艾拉事件显然是对一个小问题做出的过激反应。这件事对公众健康的最终影响可能是致命的,因为人们吃到的好苹果越来越少了。

    艾拉事件说明,我们的大脑解决小风险的能力有一个基本限度:我们要么完全忽视风险,要么过于重视风险,没有中间地带。每位等待晚归女儿的家长都能体验到这种感觉。你也许知道真的是(几乎是)没有什么可担心的,但你的大脑会不自觉地闪现危险的景象。正如斯洛维克所言,焦虑对伤害的可能性还不够敏感。你想到了分子(即你在新闻中看到的悲惨新闻),却没有想到分母。桑斯坦发明了“概率忽视”这一短语来描述这一模式。概率忽视和效用层叠两种社会机制的组合必然会导致对小威胁的夸大,有时还会引发严重后果。

    当今世界,将效用层叠发挥到极致的人最有可能是那些恐怖分子。除了几次可怕的事件,比如“9·11”事件,恐怖袭击导致的死亡人数与其他死亡原因相比是非常小的。即使在恐怖活动猖獗的国家,比如以色列,每周的死亡人数也远不及交通事故死亡的人数多。概率忽视和效用层叠间的不同在于两种发现的可得性和呈现到脑中的轻松度和概率。媒体不断重复的可怕画面可使每个人都处于崩溃的边缘。我们都有这样的体验:想要劝自己完全冷静下来是非常难的。恐怖主义是直接和系统1对话的。

    在和朋友辩论的过程中,我是从何时开始处于下风的呢?效用层叠是真实的,它无疑扰乱了公共资源分配的重点。卡斯。桑斯坦会探索将决策制定者从公众压力中隔离开来的机制,让资源的分配由公正的专家来决定,这些人对所有风险都了如指掌,还知道可利用哪些资源来降低风险。公众比桑斯坦更相信专家,但保罗。斯洛维克却不怎么相信这些专家,他指出,将专家从公众情感中隔离出来会产生公众排斥的政策,这种情形不可能发生在民主制的国家中。两人的观点都非常有见地,他们的说法我都赞同。

    我同桑斯坦一样,对非理性的恐惧和应对风险的公共政策的效用层叠都感到不适。不过,我也认同斯洛维克的观点,即政策制定者不应该忽略普遍存在的恐惧情绪,即使这些情绪是毫无缘由的也不该忽略。不管理性与否,恐惧都是令人痛苦且身心俱疲的。政策制定者必须努力保护公众不受恐惧情绪的影响,而不是只保护其不受真实存在的危险的伤害。

    斯洛维克强调公众对那些不代表民意的不靠谱专家做出的决策心存抵制情绪,这一点的确不错。此外,效用层叠也会通过呼吁人们关注风险和增加降低风险预算总额的措施来创造长期效益。拉夫运河事件可能会使过剩资源分配到有毒垃圾的治理上,但这一事件在提升公众对环境问题的关注程度方面发挥了更大作用。民主难免无秩序,其中部分原因是引导民众信仰和态度的可得性及情绪启发式难免有失偏颇,即使这些因素都指向正确的方向也难以达成完美结局。心理学应该助风险政策的设计一臂之力,使之集专家知识、公众情感及直觉于一身。

    示例—效用层叠“她对一项创意大为赞赏,说它收益大,无成本。我认为这就是种情绪启发式。”“这是一个效用层叠的例子:被媒体和公众大肆宣扬的事还没发生,电视上就满是关于此事的报道,每个人都在谈论这件事。”

    ① 效用层叠,即集体信念形成的自我增强过程。经由该过程表示的认知触发一连串的反应。它通过在公共话语中增强影响效用而增强此感知的合理性,这一过程的驱动机制包含信息的、名声的动机:个人通过部分了解他人的外在想法,为了保持社会认可的利益而通过部分扭曲自己的公开反应而支持上述认知。效用野心家—操纵公共话语内容的行动主义分子—总是力图触发效用层叠以推进其计划。 —译者注

    第14章 猜一下,汤姆的专业是什么?

    请看下面这个简单的问题:

    汤姆是你们国家一所著名院校的研究生。请预测汤姆就读于以下9个专业的概率,并对专业进行排序。用1表示最有可能就读的专业,9表示最无可能的。

    工商管理

    计算机科学

    工程学

    人文与教育

    法学

    医学

    图书馆学

    自然科学与生命科学

    社会科学和社会工作

    这个问题很简单,你马上就知道不同专业的招生规模是解决问题的关键。就你所知,汤姆是从这所大学里随机挑选出来的一名研究生,好比从罐子里随意拿出来的一个弹球一样。想要知道这个弹球是红色的还是绿色的,你必须清楚罐子里两种颜色的弹球各有多少。某一特定种类的弹球所占比率被称为基础比率。同样,在这个问题中,人文与教育专业的基础比率指的就是这个专业的学生人数占全体学生总数的比率。在缺乏与汤姆相关的具体资料的情况下,你可能会根据基础比率进行猜测,相比计算机科学和图书馆学,汤姆更有可能被人文与教育专业录取,因为人文与教育专业的招生规模比另外两个专业的招生规模大。在没有其他信息可供参考时,采取基础比率的方法最容易。

    接下来的这个任务与基础比率并无关联。

    一位心理学家在汤姆高三时对他进行了一系列不定效果的心理测试,大体推断出他的个性,其描述如下:

    尽管缺乏创造力,但汤姆智商很高。他喜欢按部就班的简单生活,喜欢干净整洁的环境,屋子里的物件要摆放得规规矩矩。他写的文章枯燥,偶尔会写一些老掉牙的双关语,或者迸发出类似科幻小说的火花,文章还显得有那么点生动。他颇具竞争意识。此外,汤姆待人冷淡,缺乏同情心,也不愿与他人接触。尽管他总是以自我为中心,但却有强烈的道德观念。

    现在,请拿出一张纸来,按照上文对汤姆的性格描述,预测他与某个专业典型学生的相似度并进行排序。用1表示最相像的专业,9表示最不像的。

    如果能够很快完成这个任务的话,你就会从本章学到更多东西。很有必要读读汤姆的相关报告,这会帮助你对不同专业的研究生特质作出判断。

    下面这个问题同样很直接。它需要你重新获得或构建一个不同专业领域的研究生的典型形象。在20世纪70年代早期,实验刚开始进行时,平均结果所呈现的专业顺序如下所示。这与你的排序可能并没有多大不同:

    1.计算机科学

    2.工程学

    3.工商管理

    4.自然科学与生命科学

    5.图书馆学

    6.法学

    7.医学

    8.人文与教育

    9.社会科学和社会工作

    由于会想到书呆子(因为描述中有“老掉牙的双关语”这一条),你有可能将计算机科学排在首位。实际上,汤姆的性格特征就是按照计算机科学专业学生的典型形象来描述的。另一个大多数人都排在前面的专业是工程学(描述中有“规规矩矩”这一条)。你可能认为汤姆并不适合社会科学和社会工作专业(因为他“待人冷淡,缺乏同情心”)。但该专业人员的典型形象似乎在我设计描述汤姆实验后的40年内发生了少许变化。

    给这9个专业排序是一项复杂的任务,肯定需要系统2有规则、有秩序地组织,只有这一系统才能完成这项任务。然而,描述所给的提示(老掉牙的双关语及其他一些提示)很容易激活关于典型形象的联想,这是系统1控制下的自主活动。

    这项寻找相似点的任务要求我们对汤姆的描述和不同专业学生的典型形象进行比较。描述的准确性—无论这是不是对汤姆的真实写照—与任务的目的没有关系。另外,你对每个专业基础比率的了解也与任务无关,因为某个个体与某个组织典型人员的相似性并不受这个组织大小的影响,甚至在大学里根本没有图书馆系的情况下,你都可能会将汤姆的性格描述与图书馆学专业的研究生形象进行比较。

    如果你再次审视汤姆,会发现他很适合人数少的专业(计算机科学、图书馆学、工程学),并不适合人数多的专业(人文与教育、社会科学与社会工作)。的确,受试者也几乎都将人数多的两大专业排在了最后。汤姆被刻意设计成了“反基础比率”的角色,适合于人数少的专业,不适合人数多的专业。

    依据典型性作出预测是下意识的行为

    第三个排序的任务是由心理学专业的研究生完成的。这项任务尤其重要,同样是根据汤姆就读专业的概率对9个专业进行排序。不过进行这次预测的人了解相关的统计学事实:他们对不同领域的基础比率都很熟悉,也知道对汤姆的性格描述并不十分可信。然而,我们希望他们只关注描述与典型特征的相似性(我们将其称为典型性),而忽略掉基础比率以及对描述的准确性的怀疑。他们将人数少的计算机科学专业排在了最前面,因为这个专业最典型。

    在尤金工作的那一年,我与阿莫斯十分卖力,我有时还会在办公室里通宵达旦地工作。彻夜工作的任务之一就是将典型性和基础比率之间的冲突描述出来。汤姆的形象就是我努力的结果,我是在清晨时分完成了对他的描述。那天早晨第一个来上班的是我的同事兼好友罗宾·道斯(Robyn Dawes)。他是一个富有经验的统计学家,也是直觉判断有效性的怀疑者。如果说有人能意识到基础比率的话,这个人一定是罗宾。我将罗宾叫过来,给他看了我刚打出来的问题,并让他猜测汤姆的专业。我至今仍然记得他试着回答时露出的狡黠笑容,他说道:“计算机科学吗?”那是一个令人开心不已的时刻,我心想:你也有失算的时候啊。当然,我一提到“基础比率”,罗宾很快就更正了他的错误,但他开始并没有自主地想到这一点。尽管他比任何人都清楚基础比率在预测中的作用,但当他看到某个人的性格描述时,就会忽略掉这些比率。不出所料,他用对典型性的判断替代了对概率的评估。

    随后,我和阿莫斯搜集了3所重点院校里114名心理学研究生对这个问题的答案。这些学生都上过几门统计学课程。结果确实没让我们失望。他们对9个专业概率的排序与和典型形象相似程度的排序并无太大差别。在这个实例中,替换起了很大作用:并无迹象表明除了判断典型性以外,受试者还用了别的方法。因为关于概率的问题较难回答,而关于相似性的问题就比较简单,所以在回答时受试者就置换了问题。这是一个严重的错误,因为对相似性和概率的判断所遵守的并不是同一个逻辑规律。我们对相似性的判断可以完全不受基础比率的影响,不受可能会出现的不当描述的影响,但是在判断概率时,如果忽略基础比率和证据的可靠性的话,就注定会犯错误。

    “汤姆是学计算机科学的概率”并不是一个简单的概念,逻辑学家和统计学家对它的意义各执己见,还有一些人认为它根本就没有意义。对于很多专家而言,概率是信念主观程度的评估手段。有些事你确信无疑,例如今天早晨出太阳了;而另外一些事是你认为根本不可能的,例如太平洋突然结冰了。还有许多事会令你半信半疑,例如你隔壁的邻居是一个计算机科学家—这便是此事在你眼中的概率。

    逻辑学家和统计学家相互争论,提出了多个关于概率的定义,全都非常精确。然而,对于外行人来说,概率(在日常生活中和“可能性”是同义词)是一个相对含糊的概念,与不确定性、倾向性、貌似正确以及出乎意料等词紧密相关。模糊性和令人不爽的感觉不都是这个概念所特有的特性。当我们使用“民主”或“美丽”这样的词时,我们或多或少明白自己究竟要表达什么意思,我们的谈话对象也或多或少能明白我们究竟想要说什么。在我潜心研究事件的概率问题的这些年来,从来没有人举手问过我:“先生,请问概率指的是什么?”如果我问他们的是一个奇怪的概念,例如适应全球化的能力,他们肯定就会举手问问题了。尽管每一个人都表现出他们知道该怎样回答我的问题,但我们都明白要求他们去解释这个词的含义有些难。

    被要求作概率评估的人并不会感到很困惑,因为他们对概率的判断与统计学家或是哲学家的判断不同。关于概率或可能性的问题引起了思维的发散性,让人想起比较简单的问题的答案。其中一个简单的答案就是对典型(代表性)的自动评估—在我们理解语言时这种现象很常见。“猫王埃尔维斯·普雷斯利(Elvis Presley)的父母曾希望他成为一名牙医”,这一(错误的)陈述听起来有些好笑,因为我们会自动把猫王的形象与牙医联系在一起,然而这两者的形象实在相差太大。系统1能使人产生相似的印象,虽然它并没有刻意这样做。“她会赢得竞选,你明白她肯定会赢”,“他学习成绩好不了,看那一身文身吧”,听到有人这样说时,他们一定是受到了典型性启发式的影响。如果我们通过某个下巴的轮廓或铿锵有力的演讲来判断这个职位候选人是否具有领导才能,此时我们依赖的就是典型性。

    尽管通过典型性作出预测的做法很普遍,但是在统计学上这一做法并不是最优选择。迈克尔·刘易斯(Michael Lewis)的畅销作品《魔球》(Moneyball)说的就是这种预测方式的低效性。职业棒球球探在预测某个选手是否会成功时,他们大体上看的是球员的体格和相貌。这本书的主角是奥克兰“运动家棒球队”的经理比利·比恩(Billy Beane)。他作出了一个大家都不愿接受的决定:否决球探们的建议,通过选手过去表现的统计数据来挑选球员。“运动家棒球队”挑选出来的选手都以低会费入队,因为其他球队都因为没有想到用数据来判断,因而拒绝了这些选手。“运动家棒球队”很快就以低成本达成了最佳结果。

    典型性启发的两宗罪

    用典型性来判断概率有一些重要的优点,它所带来的初始印象通常比乱猜一气更为精确。

    ·在大多数情况下,表现得很友好的人实际上也很友好。

    ·又高又瘦的职业运动员很有可能是打篮球的而不是踢足球的。

    ·获得哲学博士学位的人比只读完高中的人更有可能订阅《纽约时报》。

    ·年轻的男性会比年老的女性更不要命地踩油门。

    在这些例子及其他更多例子中,典型的形象特征左右着我们对典型性的判断,受这种典型性启发得到的预测有可能是对的,这样的说法在某种程度上就是事实。然而在其他情况下这种典型形象却是错误的,因而典型性的启发也会造成误导,尤其会使人们忽略基础比率信息、找错预测方向。即使启发性具有一定的真实性,但绝对依赖启发效应就是违背统计学逻辑,是有严重“罪过”的。

    典型性的第一宗罪就是,它过于喜爱预测不可能发生的(低基础比率的)事件。

    下面就是一个例子:如果你看见一个人在纽约地铁里阅读《纽约时报》,下面哪种情况与读报者更吻合?

    她有博士学位。

    她没有大学文凭。

    典型性会告诉你应该选有博士学位那位,但这样做并不一定是明智的。你应该充分考虑第二个选项,因为纽约地铁里更多的是没有大学文凭的人,而不是有博士学位的人。如果猜测一个被描述为“羞涩的诗歌爱好者”的女士学的是中国文学还是工商管理,你也应该选择第二个答案。因为虽然学习中国文学的女学生都害羞且爱好诗歌,但几乎可以肯定的是有更多工商管理专业的学生同样也是害羞的诗歌爱好者。

    在某些情况下,没有受过统计学训练的人也会使用基础比率来进行预测。在本章开头关于汤姆的第一个问题中,我们没有提供关于他的细节,对于每一个人来说,汤姆读某个专业的概率就是那个专业招生规模的基础比率。然而,得知汤姆的个性特征后,人们再也不会将基础比率纳入考虑范围了。

    在前期证据的基础上,我和阿莫斯原本以为在了解了具体信息后,基础比率的信息“总会”被忽略,但是这样的结论太过绝对了。心理学家做过许多实验,在这些实验中,所给问题都明确地提供了基础比率信息,尽管关于个人特征的信息比单纯的数据分量更重,许多受试者还是受到了这些特征信息的影响。诺伯特。施瓦茨和他的同事表示,引导人们“像统计学家那样思考”就能够促使他们使用基础比率信息,引导人们“像临床医生”那样思考则会起到相反的效果。

    几年前,我和哈佛大学的学生做了一项实验,让我有了一个令我十分惊讶的发现:增强系统2的激活状态能有效提高回答汤姆问题的准确率。这项实验将旧问题与认知顺畅性的现有形式结合了起来。在实验过程中,我们要求一半学生鼓腮帮,另一半学生皱眉头。前文中已经提过,皱眉通常可以增强系统2的警觉性,降低对直觉的过分相信和依赖。鼓起腮帮(与感情无关的表情)的学生的预测结果与原实验结果一样:他们只依赖于典型性,而忽略了基础比率。然而不出作者所料,那些皱眉头的同学的确对基础比率表现得很敏感。这是一个具有启发性的发现。

    一旦人们作出一个错误的直觉判断,系统1和系统2都脱不了干系。系统1引起了错误的直觉,系统2采纳了这个直觉,并将其运用在判断当中。然而,造成系统2犯下此类错误的原因有两个——忽视与懒惰。许多人忽视了基础比率,因为在有个人信息的情况下他们认为基础比率与问题并无关联。另一些人犯下同样的错误则是因为他们没有将注意力集中在任务上。如果皱眉能带来不同结果的话,这说明懒惰也许是人们忽视基础比率的合理解释,至少对于哈佛大学的学生来说是这样。当具体信息缺失时,他们的系统2“知道”基础比率与问题相关,但是只有在任务中付出特别努力时,才能将基础比率的知识应用于其中。

    典型性的第二宗罪是它对证据质量不够敏感。请回想系统1的眼见即为事实的原则。在汤姆的问题中,激活你联想机制的是对汤姆的描述,且这个描述不一定是真实的。对汤姆“对人冷淡,缺乏同情心”的表述也许能让你(以及许多其他读者)相信他不太可能是社会科学与社会工作专业的学生。然而,彼时你已经清楚地知道这样的描述是不可信的。

    原则上讲,你当然知道不值得信任的信息就相当于没有信息,但是眼见即为事实使你难以遵循那条原则。除非你决定立刻否定证据(例如,你坚信的信息是从一个骗子口中得来的),否则你的系统1会自动将这一信息视为真实的。当你怀疑信息的可靠性时,可以做一件事:作概率判断时,往基础比率那方面想。别期望遵循这条原则会很容易—它需要在付出很多努力的情况下,才能实现自我监督和自我控制。

    想要得出汤姆问题的正确答案,你应该遵从最先出现在自己脑海中的想法,若认为某招生人数多的专业(人文与教育、社会科学与社会工作)被选中的概率高,则稍微降低其概率;若认为某招生人数少的专业(图书馆学、计算机科学)被选中的概率低,则稍微提高其概率。如果你对汤姆一无所知,你作出的抉择就不是你的初衷了,你手头上的那点信息也不能相信了。所以,你应该让基础比率在预测时起主导作用。

    用贝叶斯定理来约束直觉

    你认为明天会下雨的概率只不过是你的臆测,你不应该相信头脑里出现的所有想法。你的信念必须受限于概率逻辑。所以,如果你相信明天某个时候会下雨的概率是40%,就该相信不会下雨的概率是60%,那么明天早晨下雨的概率就一定不会是50%。如果你相信某个候选人当选总统的概率是30%,并且相信他在首次竞选成功后再次当选的概率是80%,你就必须相信他连任的概率是24%。

    贝式统计学(Bayesian statistics)提供了类似汤姆等相关问题的“定理”。这个研究统计学的定理影响深远,是以18世纪英国一位名为瑞福伦德。托马斯。贝叶斯神甫的名字命名的,因为人们认为他是为一个重大问题作出重要贡献的第一人,这个问题就是:如何推断人们是怎样根据证据改变自己的想法的。贝叶斯定理详细说明了最强烈的信念(在本章的实例中指的是基础比率)应该与证据分析相结合,这样才能更接近假设而不是偏离到其他方向上。例如,如果你相信有3%的研究生是被计算机科学专业录取的(基础比率),你还相信汤姆是该领域研究生的可能性是其他领域的4倍,贝叶斯定理就会认为,你必须相信汤姆是计算机科学家的概率是11%。此外,如果基础比率是80%,那你眼中的新概率就应该是94.1%,以此类推。

    数学问题与本书并无关联。关于贝叶斯定理,有两点我们要铭记在心,要知道我们总是喜欢把事情搞得一团糟。第一,基础比率十分重要,即便是在手头的案例已有证据的情况下依然如此;第二,通过分析证据得到的直观印象通常都会被夸大。

    眼见即为事实与联想一致性的结合易使我们相信自己编纂的故事。以下是对贝叶斯定理关键点的总结:

    ·以相对合理的基础比率对结果的可能性作出判断。

    ·质疑你对证据的分析。

    这两个理念都是直接明了的。当我意识到自己从未学习过怎样运用它们时,我感到非常震惊,即使是现在,我仍旧觉得自己在践行这两个理念时总有些不自然。

    示例—典型性与基础比率“草坪修整得很好,接待员看起来很能干,家具也十分抢眼,但这并不意味着这是一家经营状况良好的公司。我希望董事会不要依照典型性启示作出判断。”“这家新成立的企业看起来好像不会倒闭,但是这个行业的成功基础比率非常之低。我们又怎么能知道这家企业就是个特例(一定能成功)呢?”“他们一直在重复犯同样的错误:用并不充分的证据来预测罕见的事件。当证据不充分时,我们应该以基础比率作为判断依据。““我知道这份报告绝对是具有毁灭性意义的,也许它的证据十分确凿,但我们凭什么相信呢?我们必须在做计划时保持一定的怀疑态度才行。”第15章 琳达问题的社会效应

    我们的实验中最著名也最受争议的地方是设计了一位虚拟的女士,名叫琳达·阿莫斯和我拟造了琳达问题,用以说明启发式在判断中的作用以及它与逻辑相悖的地方。以下是我们对琳达的描述:

    琳达,31岁,单身,一位直率又聪明的女士,主修哲学。在学生时代,她就对歧视问题和社会公正问题较为关心,还参加了反核示威游行。

    20世纪80年代听到这个描述的人常常会笑出声来,因为他们马上就知道琳达曾在加州大学伯克利分校上过学,因为这个学校以有一批热衷政治的激进学生而著称。

    在一项实验中,我们给受试者看了一张单子,上面列有琳达可能会出现的8种情况。

    在汤姆问题中,有些人通过典型性对汤姆的专业进行排序,而其他人则通过概率做出排序。琳达问题也是如此,但有些新的变化。

    琳达是小学老师。

    琳达在书店工作,她还在学瑜伽。

    琳达积极参与女权运动。

    琳达是妇女选民联盟成员。

    琳达是银行出纳。

    琳达是保险推销员。

    琳达是银行出纳,还积极参与女权运动。

    这个问题从几个方面透露出年代的信息。“妇女选民联盟”如今的地位已经不再像从前那样突出了,“女权运动”虽说见证了过去30年里女性地位的变化,但这种说法今天听来也已经很陌生了。然而即使在当今这个“脸谱”时代,我们仍然很容易猜到人们会对这位女士作出高度一致的判断:琳达非常适合当一个激进的女权主义者,也相当符合在书店工作且学习瑜伽的身份特征,不过却不怎么适合做银行出纳或是保险推销员。

    琳达不可能只是一名普通的银行出纳吧?

    现在请注意这张单子上有一点很重要:琳达更像一名(普通的)银行出纳,还是更像一名积极参与女权运动的银行出纳?所有人都认为琳达更像是“主张女权主义的银行出纳”,而不是普通的银行出纳。普通的银行出纳不会热衷女权主义,加上这个细节,整个描述便更像是一个有条理的故事了。

    但是在判断概率的过程中会让人有些纠结,因为上述两种情况之间存在一种逻辑关联。按照维恩图解来说,积极参与女权主义的银行出纳的集合包含在银行出纳的集合之中,因为每个持女权主义理念的银行出纳本身还是银行出纳。因此,琳达是位积极参与女权主义的银行出纳的概率,就一定比她只是个(普通的)银行出纳的概率低。当你想更加详尽地说明某个可能的事件时,只能降低其概率。因此这个问题使典型性直觉和概率逻辑两者对立起来。

    我们的首次实验是一次受试者组间实验(between-subjects)。每位受试者都看到一组列有7个结果的单子,其中只包括几个重要结果中的一个(“银行出纳”或“积极参与女权主义的银行出纳”)。有些人通过相似度来排序,而其他人则通过概率排序。就像汤姆问题出现的结果那样,通过相似度和概率得出的平均排序结果是相同的。在两种情况下,“积极参与女权主义的银行出纳”都比“银行出纳”的排序要靠前。

    然后我们运用受试者组内设计(within-subject)对此项实验作了更深入的研究。我们设计了你此前看到的那份调查问卷,其中“银行出纳”排在第六位,“女权主义银行出纳”位于最末。我们相信受试者会注意到两个结果之间的关系,而且他们的排列也应该会符合逻辑。事实上,我们对此非常有把握,不必再专门做个实验来证实这个想法。我的助手当时正在实验室里做另一项实验,她让受试者一边在报酬表上签名(临走前要领报酬),一边完成这项关于琳达的问卷。

    后来我随意一瞥,看到助手书桌上的文件盒里已经放了10份调查问卷了,而且所有的受试者都认为(琳达是)“积极参与女权主义的银行出纳”比“银行出纳”的可能性更大。当时我太惊讶了,因为自己有了一个重大发现,因此我至今对那张灰色金属质地的书桌以及当时每张表的位置仍记忆犹新。当时我兴奋极了,赶紧给阿莫斯打电话,告诉他我们有了重大发现:我们让逻辑与典型性互相竞争,结果典型性赢了!

    我们还观察到系统2的一个缺点:既然两种结果都包含在同一列表中,受试者就有很大机会发现逻辑规则中的关联性,但他们却没有把握好这次机会。当我们把实验的规模扩大时,发现样本中89%的研究生都违背了概率的逻辑。我们相信,从统计学角度作出复杂应答的受试者表现会更好些,因此我们给斯坦福大学商学院决策科学项目的博士生发了同样的调查问卷,所有的博士生都学过概率论、统计学和决策论等学科的高级课程。我们又一次惊奇地发现:85%的博士生也认为(琳达是)“积极参与女权主义的银行出纳”比“银行出纳”的可能性更大。

    为了消除这个错误—后来我们认为“这个希望越来越渺茫”—我们让很多人了解琳达,并且问了他们下面这个简单的问题:

    下面两种情况哪种可能性更大?

    琳达是银行出纳。

    琳达是银行出纳,同时她还积极参与女权运动。

    这个直截了当的问题使琳达这个人物在某些领域中小有名气,也引起了数年的争议。几所重点大学中85%~90%的大学生选择了第二个选项,这一选择有悖逻辑,但却没有人因此感到羞耻。我曾经有些愤怒地问自己教的那些大学本科生:“难道你们没有注意到自己违背了基本的逻辑原则吗?”当时后排有些学生大喊:“那又怎样?”还有个犯了同样错误的毕业生解释道:“我还以为你只不过是问问我的看法罢了。”

    通常,当人们没能运用明显相关的逻辑原则时,就会出现“谬误”。阿莫斯和我引入了“合取谬误”(conjunction fallaly)这个想法,通过直接比较,人们总会认为两个事件(在此即为银行出纳和女权主义者)的联合出现比只出现其中一件事(银行出纳)的可能性要大,此时就出现了合取谬误。

    正如缪勒·里亚的错觉图所示,即使你对谬误有了真切的了解,也仍然难以避免这种错误。生物学家斯蒂芬·杰·古尔德(Stephen Jay Gould)曾描述他自己在琳达问题上的纠结反应。他当然知道这个问题的正确答案,然而他还是写道:“我脑中有个小人,跳上跳下的,还对着我喊:”她不可能只是个银行出纳,看看那描述就知道了。‘“这个喋喋不休的小人当然就是古尔德的系统1了。(在他写这些文字时还没有引入两个系统的说法。)

    琳达问题简短版本的正确答案只是对我们众多研究中的一项的多数回应:斯坦福大学和伯克利大学的社会科学专业大学生组中有64%的学生正确地判断出(琳达是)“女权主义的银行出纳”比“银行出纳”的可能性更小。起初列有8个结果的版本中,相似的大学生组中只有15%的人作出了正确选择,其区别颇具启发性。问题的较长版本通过在不同结果中穿插其他结果(保险推销员)来区别开两个重要结果,读者要分别判断每个结果,因此不会对所有结果进行比较。相反,(琳达)问题的较短版需要有能启动系统2的明确对比,允许多数有统计学知识的学生避免谬误。不过遗憾的是,我们没有对这组知识渊博的受试者中选择错误的少数人(36%)的推论进行探究。

    我们的受试者在汤姆问题和琳达问题中提供的概率判断与典型性判断(与原型判断类似)正相吻合。典型性属于一连串可能同时发生且联系紧密的基本评估,最具典型性的结果与特性描述结合在一起就会生成最有条理的信息。而这些最具条理的信息却不一定就是可能性最大的,但它们“貌似正确”,稍有疏忽,我们就很容易混淆有条理、貌似正确和概率这三者的概念。

    如果我们将具体描述用做预测的工具,那么不加批判地用貌似合理的判断来替代概率就会严重影响我们的判断结果。请思考下列一组问题中的两个描述,并对其可能性作出评估。

    明年北美某地将有一次洪灾,1000多人将被淹死。

    明年加利福尼亚某时将有一次地震,此次地震将导致洪水,1000多人将被淹死。

    加利福尼亚地震的情节要比北美洪灾的情节更合乎情理,尽管加利福尼亚地震的概率非常小。不出所料,人们对更详细、更丰富的描述作出的概率判断更高,这一点有违逻辑。预言家总会给其客户设下陷阱:对情节加以详述会使其更可信,却更不可能成为现实。

    为了体会“貌似合理”的作用,请看下面的问题:

    下面两个论述哪个可能性更大?

    马克长有头发。

    马克长有金色的头发。

    以及

    下面两个论述哪个可能性更大?

    简是位老师。

    简是位老师,她走路去上班。

    这两个问题与琳达问题一样,有相同的逻辑结构,但它们却没有引起谬误,因为更详细的结果只是更详细而已,不会更让人信服,或更有连贯性,或更讲得通。对貌似合理和连贯性的评估不会产生概率问题的答案。在与之相矛盾的直觉缺位时,逻辑就会起作用。

    少即是多的逻辑悖论

    芝加哥大学的奚恺元(Christopher Hsee)让人们在当地一家商店清仓大甩卖时为几套餐具标价,当地餐具的价位一般在30~60美元。他将受试者分成三个小组,其中一个组看了下面的标价,奚恺元将这组标价标注为“综合评估”,因为受试者可以对两套餐具进行对比。另外两组只看了其中一组的标价,此谓“单一评估”。综合评估是组内实验,而单个评估则是组间评估。

     [image file=Image00011.jpg]

    假设A、B两套餐具质量相当,那么哪套更值钱呢?这个问题很简单。你可以看到A套包括B套所有的餐具,另外还多出7件完好无损的餐具,所以A套“必然”更值钱。的确,综合评估组的受试者宁愿多花点钱买A套餐具也不愿买B套,A套标价为32美元,B家标价为30美元。

    在单一评估组中则出现了完全相反的结果,其中B套标价(33美元)比A套(23美元)高很多,我们都知道为何会出现这一结果。用具组合(包括餐具)通过标准和原型展示出来,因为没有人想买破损的餐具,于是你立即感觉到A套组合的平均价值比B套组合的平均价值低。如果以平均价值引导估测,人们认为B套更值钱也就不足为奇了。奚恺元将这样的结果模式称为“少即是多”。从A套中拿走16件餐具(有7件是完好无损的),它的价值就会提升了。

    实验经济学家约翰·李斯特(John List)对奚恺元的发现进行了复制,他在真正的市场上拍卖两套相同的高价值棒球卡片,每套各为10张,但其中一套附赠3张普通价值的卡片。就像餐具的例子一样,在综合评估中,数量多的组合会比少的更有价值,但在单一评估中则正好相反。从经济理论的角度来看,一套餐具或一套棒球卡片的经济价值是一种总体变量,给任何一套加上一个有价值的物件只能提升它的价值。如果是这样,这个结果就有些令人烦恼了。

    琳达问题和餐具问题的结构完全相同。概率就像是经济价值,是一种总体变量,我可以通过以下这个例子加以说明:

    概率(琳达是个出纳)=概率(琳达是个女权主义出纳)+概率(琳达是个非女权主义出纳)

    这就是为什么琳达问题的单一评估产生了一种“少即是多”的模式,这一点与奚恺元的餐具实验一样。系统1会取价值的平均值而不是累加值,因此,当我们将非女权主义的银行出纳从银行出纳的大集合中移除后,主观(判定)的概率就会加大。然而,变量的总体性对概率判断的影响要小于其对金钱的影响。因此,综合评估只是消除了奚恺元的实验中出现的错误,却无法消除琳达实验中出现的错误。

    琳达不是唯一一个在综合评估中得以存在的合取谬误,我们在其他许多判断中也发现了有悖逻辑的类似情况,其中一项研究的受试者被要求从高到低排列下一届温布尔登网球赛的4个可能结果,比约•伯格(Björn Borg)是研究进行当日的主要网球比赛运动员。以下即为结果:

    A.伯格会赢得比赛。

    B.伯格会输掉首局。

    C.伯格会输掉首局,但会赢得比赛。

    D.伯格会赢得首局,但会输掉比赛。

    上述结果中B和C两项比较重要。B囊括的内容更多,其概率“一定”比自身所包含的一个事件发生的概率大。受试者给出的答案与逻辑相悖,却顺应了典型性和貌似合理性,72%的人认为B选项比C选项的可能性更小—又一个通过直接比较得出“少即是多”的例子。这一次受试者选出的可能性最大的描述无疑貌似更合理,更符合当今世界一流网球运动员身上所具有的所有公认的特质。

    合取谬误是因为对概率的误解,为阻止可能会出现的异议,我们设计了一个需要作出概率判断的问题,但在这个问题中,事件不是用文字来描述的,而且“概率”这个词一次也没有出现过。我们告诉受试者有一个标准的六面骰子,其中四面是绿色的,两面是红色的,此骰子可被投掷20次。我们给他们看了三组预设的结果,都是绿色(G)和红色(R)的任意排列,并让他们选一组。如果他们选择的那组正好出现,他们会(假想)得到25美元。这三组是:

    1. RGRRR

    2. GRGRRR 

    3. GRRRRR

    因为这个骰子绿色面的数量是红色的2倍,第一组就很不具代表性—就像琳达是个银行出纳这一选项一样。第二组包括6次投掷结果,与预期投骰子结果更为符合,因为它有两个G。但是这个结果在设计时只是在第一种序列的开头加了个G,所以它比第一组更不可能,只是相当于“琳达是个积极参与女权主义的银行出纳”的非言语表达。与琳达的研究一样,典型性主导着上例的结果。几乎2/3的受试者更愿意在第二组上下注,而不愿赌第一组。然而,当人们看到支持两种选择的理由时,大多数人发现正确的理由(偏向第一组的)更可信。

    下一个问题是个突破,因为我们终于找到了可以降低合取谬误的条件。两组受试者看到同一个问题,但其变量稍显不同:

    不列颠的哥伦比亚省针对成年男子样本作了一个健康调查,这些男子年龄不同,职业也不同。请对以下价值给出最佳评估:在被调查的男子中,有几成人有过一次甚至多次心脏病发作的经历?在被调查的男子中,有几成人既超过了55岁又有过一次甚至多次心脏病发作的经历?不列颠的哥伦比亚省对一个由100名成年男性构成的样本进行了调查,这些男性年龄不同,职业也不同。请对以下价值给出最佳评估:100名受试者中有多少位有过一次甚至多次心脏病发作的经历?100名受试者中有多少超过55岁又有过一次甚至多次心脏病发作的经历?看左栏问题的小组的错误率为65%,而看右栏的小组的错误率仅为25%。

    为什么“在100名受试者中有多少……”的问题比“有几成人……”更容易回答?有一个可能的解释是“100名”这个参考值给大脑一种空间上的暗示。假使有很多人按照指示把自己归到一间屋子里的不同小组中去:“名字首字母是A到L之间的人到房间的左前方角落去。”然后这个小组中的人再按照指示进一步分组。这种包含的关系现在已经很明显了,你会看到名字以C字母开头的人是左前方角落中那群人的一分子。在这个医学调查问题中,心脏病患者最终会走到屋子的某个角落,他们中有些人不足55岁。不是每个人都能想象出这一场景的,但很多后续实验显示,人们所熟知的典型频率会使人们更容易理解一个组完全被另一个组包含的概念。上述问题中的“多少”使你想到了个体,但“几成”就不会使你有这种联想,从这点来看,这个难题的答案就不难理解了。

    关于系统2的工作机制,我们从这些研究中能窥见多少?有一个已经不算新鲜的说法是,系统2并非时刻处于警惕状态。参与我们那些合取谬误实验的大学生和研究生当然都“知道”维恩图解中的逻辑,但即使所有的相关信息都摆在面前,他们也没有对此加以运用。“少即是多”模式的荒谬在奚恺元的餐具实验中表现得淋漓尽致,在“多少”的事例中也非常容易识别出来,但对那些在最初的琳达问题以及其他相似问题中也犯了合取谬误的数千人来说,这一模式还不够明显。在所有这些例子中,合取谬误显得貌似合理,而且也获得了系统2的认可。

    系统2的惰性也是导致判断失误的部分原因。如果这些受试者的下一次休假要根据此次调查结果来决定,而他们又有足够的时间,被告知要遵循逻辑,直到确定答案正确才能说出来,我相信大多数受试者都是可以避开合取谬误的。然而,(事实是)他们的休假并不取决于一个正确的答案,他们几乎没费什么时间就得出了答案,而且他们也愿意用随意的方式来回答这个问题。系统2的惰性是生活中存在的一个重要事实,而对典型性会阻碍明显的逻辑原则运用的相关观察也至关重要。

    琳达问题值得注意的一个方面是:它与餐具实验的结果形成了对比。这两个问题有着相同的构造,但却产生了不同的结果。那些看到成套餐具中有破损餐具的人会给这套餐具标低价,他们的行为是直觉反应。其他能看到两套餐具并进行对比的人则能运用逻辑原则,得出多出来的餐具只是为了增加价值的结论。在组间研究情况下作判断时,直觉就会起作用,逻辑原则则在综合评估中起作用。而在琳达问题中却不是这样,直觉常会推翻逻辑,即使在综合评估中也会如此,虽然我们确定有些场合下逻辑会占主导地位,但大胆的直觉也会将其推翻。

    我们在一些明确的问题中观察到了概率公然违背逻辑的现象,阿莫斯和我都认为这种有悖逻辑的现象非常有意思,值得和同事们分享。我们还相信这些结果能进一步加强我们关于判断启发式强大作用的论证,这会让怀疑者哑口无言。然而在这一点上,我们是大错特错了,琳达问题竟然成了争论规范的研究案例。

    琳达问题引起了广泛的关注,它也引发了众人对我和阿莫斯关于判断的研究方法的批评。一些研究人员发现将指示和提示结合起来可以减少谬误的发生,这跟我们已有的发现没什么两样。有些人争论道,在琳达问题中,受试者将“概率”理解为“貌似合理”完全是合情合理的。这些争论有时波及我们的整个研究,说我们的所有结论都在误导公众:如果一种显著的认知错觉能被削弱或解释清楚,其他的系统功能也会如此。这个理论忽视了合取谬误是直觉和逻辑间的矛盾冲突这一特殊性。我们通过设计组间实验对启发式进行论证的论据没有受到质疑,简单地说就是没有被讨论过,而且因为过于重视合取谬误,这个证据的突出性也被掩盖了。琳达问题的净效应是我们的工作对于普通民众来说更透明了,而在此领域的学者中,我们的研究方法的可信度有了一点欠缺。当然我们绝不会料到事情会这样。

    如果你去法庭就会看到律师们往往采用两种批评风格:要想推翻某个案件,他们往往会去质疑支持此案的最有力证据,他们会找准证词中最薄弱的地方,让目击证人变得不值得相信。关注弱点在政治辩论中也很常见。我认为在科学争论中这是不恰当的,但我越来越相信一个事实,那就是社会科学中的辩论规则无法阻止政治辩论的风格,尤其在紧要关头的重大问题的讨论上—人类判断中普遍存在的偏见就是个重大问题。

    几年前,我和拉尔夫·赫特维格(Ralph Hertwig)有过一次友好的交流。他对琳达问题一直都持批评态度,而我想通过琳达问题解决我们之间的分歧,不过结果证明这只是徒劳之举。我问他为什么和其他人只关注合取谬误,而不关注其他可支持我们立场的更强有力的发现。他笑着说:“这个问题更有意思啊。”他说琳达问题引来了众多关注,我们没有理由抱怨什么。

    示例—少即是多“他们构建了一个非常复杂的情节,还坚持说这个情节出现的可能性很大。这不是真的,这只是个貌似合理的故事而已。”“对于贵重的产品他们还附赠一个便宜的小礼物,这样的话,整套产品就不那么吸引人了。少即是多就是这个意思。”“很多情况下,直接的比较使得人们更谨慎也更有逻辑性。不过,也不常是这样。有时即使正确的答案就在眼前,直觉也会打败逻辑。”第16章 因果关系比统计学信息更具说服力

    请考虑下列情境,凭直觉写出答案。

    一辆出租车在夜晚肇事后逃逸。

    这座城市有两家出租车公司,其中一家公司的出租车是绿色的,另一家是蓝色的。

    你知道以下数据:

    ·这座城市85%的出租车是绿色的,15%是蓝色的。

    ·一位目击证人辨认出那辆肇事出租车是蓝色的。当晚,警察在出事地点对证人的证词进行了测试,得出的结论是:目击者在当时能够正确辨认出这两种颜色的概率是80%,错误的概率是20%。

    这场事故的出租车是蓝色而不是绿色的概率是多少?

    这是“贝叶斯定理”的一个标准问题。我们可以从中得到两条信息:一个基础比率以及不完全可靠的目击者证词。若没有目击者,肇事出租车是蓝色的概率(即蓝色出租车的基础比率)为15%。若两家出租车公司规模一样大的话,基础比率就会变成无用信息,你就只需考虑目击者的证词,因而这个问题的概率就是80%。我们可以用贝叶斯定理将这两个信息源结合起来,得出正确答案是41%。然而,你可能会想到当人们面对这个问题时是怎样做的:他们会忽略基础比率,只考虑目击者的因素。因此,最普遍的答案是80%。

    因果关系基础比率与思维定式

    现在,请考虑一下上述问题的另一种表述方式,在这个表述中,只有基础比率发生了变化。

    你得到的数据如下:

    ·两家公司拥有数量相同的出租车,但是在出租车造成的事故中,绿色出租车占85%。

    ·关于目击证人的信息与上例相同。

    同一问题的两种表述从数学角度来看并没有区别,但从心理学角度来看则有很大不同。看了第一种表述的人并不知道怎样运用基础比率,通常会忽略它。相反,看到第二种表述的人会对基础比率给予一定重视,他们的平均判断与运用贝叶斯定理解决该问题得出的答案相差不多。这是为什么呢?

    在第一个表述中,蓝色出租车的基础比率是关于这座城市出租车的统计学事实。大脑极其渴望找到其中的因果关系,但却一筹莫展:这座城市绿色和蓝色出租车的数量与出租车司机肇事后逃逸到底有什么因果关系呢?

    而在第二个表述中,开绿色出租车的司机比开蓝色出租车的司机肇事率高5倍。于是你会马上得出结论:开绿色出租车的司机是一群莽撞的疯子!现在,你认为绿色出租车司机是莽撞的,并对这家公司所有你并不认识的司机都抱有这种印象,我们称之为思维定式。我们很容易将这样的思维定式设定在因果关系里,因为莽撞是使出租车司机与肇事逃逸产生因果联系的相关事实。在这个表述中,有两个因果关系需要放在一起考虑。第一个是肇事后逃逸,这件事使人很自然地认为莽撞的绿色出租车司机难脱干系;第二个是目击者的证词,证词特别强调肇事出租车是蓝色的。根据这两个因果事件对出租车颜色作出的推断是相互矛盾的,因此如果其中一个成立就相当于另一个被推翻。这两种颜色的概率大致相同(用贝叶斯定理估计出的概率是41%,这说明与目击者确信出租车为蓝色的概率相比,绿色出租车的基础比率略为极端了些)。

    这个出租车的实例阐明了两种基础比率。“统计学基础比率”(statistical base rates)是指某一事件所属类别的事实总量,与单独事件无关;而“因果关系基础比率”(causal base rates)则会改变你对单独事件的看法。对两种基础比率,人们往往会区别对待:

    ·统计学基础比率普遍受到轻视,当人们手头有与该事件相关的具体信息时,有时还会完全忽略这一比率。

    ·因果关系基础比率被视为个别事件的信息,人们很容易将这一比率与其他具体事件的信息结合起来考虑问题。

    与因果关系相关的那个出租车问题存在一种思维定式:绿色出租车的司机是危险的。思维定式是指人们会(至少暂时会)将自己对某个团体的看法延伸到这个团体中每一个成员的身上(团体存在某些问题,其中的成员无一例外也都会有这些问题)。下面有两个例子:

    这所位于市中心的学校的绝大多数毕业生都能考上大学。

    自行车风靡整个法国。

    这些陈述很容易被理解为某个团体中每个个体都具有某种倾向,符合因果关系。这所位于市中心的学校的许多毕业生都想要上大学,他们也有这个能力,原因可能是这所学校的校园生活有利于学生身心发展的特点。法国文化及社会生活中蕴涵着使法国人对骑自行车感兴趣的推动力。当你想到某学校毕业生进入大学的可能性或考虑是否与一个刚认识的法国人谈论环法自行车比赛时,你就会联想到这些事实。

    思维定式在我们的文化中是个贬义词,但我把它当成一个中性词来用。系统1的基本特征之一就是它代表了范畴规范和原型范例。这样的规范和范例决定了我们怎样看待马、冰箱及纽约市的警察,因为我们会在记忆里存储与所有这些范畴的事物或人相关的一个或多个“规范的”典型形象。当这些范畴具有社会性时,这些典型形象就被称为思维定式。有些思维定式的错误是致命的,负面的思维定式可能会产生可怕的后果,但这样的心理学事实无法避免:不管是对是错,思维定式都是我们对不同范畴事物的看法。

    你可能发现了其中的讽刺之处。在出租车问题的情境中,忽略基础比率信息是一个认知错误,是贝叶斯定理的失败;依赖因果关系基础比率才能获得令人满意的答案,形成对绿色出租车司机的思维定式便会提高判断的准确度。然而,在其他情境中,例如涉及雇佣问题或整体概述时,社会规则与思维定式会发生强烈冲突,在法律当中同样有所体现。事实就是如此,无须大惊小怪。在敏感的社会情境中,我们不想根据某个团体的相关统计数据对个人做出可能是错误的结论。我们认为应该将基础比率视为与整体相关的统计学事实,而不是与个人相关的假设性事实。换句话说,我们反对利用因果关系基础比率。

    社会规范往往反对思维定式,包括对整体概述这一做法的否定,这对于建立一个更加文明平等的社会大有益处。然而,我们也应该知道,忽略有根据的思维定式会不可避免地妨碍我们的判断。打破思维定式是值得称道的道德主张,但是如果简单地认为打破这种印象不用付出任何代价,那就错了。为了建立一个更美好的社会,付出这些代价都是值得的;然而如果只顾满心欢喜和正确的政治立场,却否认代价的存在,这种态度是经不起科学推敲的。在政治分歧中依赖情绪启发是很常见的,我们赞同的某些立场无须成本,我们反对的某些立场也没有益处。我们应该有能力可以做得更好。

    我和阿莫斯设计了许多出租车问题的衍生实验,但并没有发明因果关系基础比率这一强大概念,我们是从心理学家埃塞克·阿杰恩(Icek Ajzen)那里借用了这一概念。阿杰恩在他的实验中给受试者简单描述了一些学生在耶鲁大学参加考试这件事,然后要求受试者判断其中每个学生通过考试的概率。因果关系基础比率的影响是非常明显的:阿杰恩告诉一组受试者,那些考生中有75%的人通过了考试;而告诉另一组受试者,考生考试的通过率是25%。这项测试的困难自然在于,受试者需要用众多因果关系中的一个来判断每一个学生的考试结果。不出所料,阿杰恩的受试者都对因果关系基础比率非常敏感,在高成功率的情境中,受试者估测出的每个学生通过考试的概率都要高于在高失败率的情境中那些受试者的估测值。

    阿杰恩运用一个颇具独创性的方法指出了一个非因果关系的基础比率。他告诉受试者,那群学生是从一个样本中抽取的,而且这个样本是从已得到考试结果的学生中抽取的。例如,处于高失败率情境的那一组所看到的信息如下所示:

    研究者主要是对考试失败的原因很感兴趣,所以选取的样本中有75%的学生是没通过考试的。

    请注意其中的不同。这个基础比率是一个关于选取示例整体的纯统计学事实。这与所问的问题(即个别学生是否通过考试)并无关联。正如人们所料,这个阐述明确的基础比率对判断产生了一定影响,但相对于统计学上的因果关系基础比率而言,其影响则要小很多。系统1处理的事件中各项因素是有因果关系的,但是在统计推理中这样的关系很薄弱。当然,对于一个以贝叶斯定理为模式进行思考的人来说,所有这些表述方式都是相同的。我们很容易认为自己已经得到了一个令人满意的结论:因为我们使用了因果关系基础比率;我们只不过(或多或少)忽略了统计学上的事实而已。下面这个研究是我一直以来最中意的一项,它表明了情境是非常复杂的。

    我们并没有自己想的那样乐于助人

    莽撞的出租车司机以及高难度的考试阐明了两个从因果关系基础比率中得出的推论:一是我们容易赋予个人以典型特征,二是情境的一个重要特点就是能影响个人的思考结果。实验的受试者做出了正确的推论,他们的判断力也有所提高。可事情并不总是那么顺利。我即将要描述的典型实验表明,人们不会从基础比率信息中得到与他们的观点相冲突的推论。这个实验还证实了一个让人苦恼的结论:教授心理学纯粹是在浪费时间。

    社会心理学家理查德·尼斯贝特(Richard Nisbett)和他的学生尤金·博吉达(Eugene Borgida)很早之前就在密歇根大学做了这个实验。他们向学生描述了前几年在纽约大学进行的那个著名的“帮助实验”。他们将实验受试者分别带入房间,并要求他们对着麦克风谈论自己的生活和烦恼。他们轮流叙述两分钟,每个房间的麦克风只有在受试者讲述时才会出声。每一组有6位受试者,其中一位是我们派去扮演受试者的工作人员。这位工作人员是第一个叙述的人,他是按照研究人员准备的稿子说的。他说他很难适应纽约的生活,并十分尴尬地承认自己很容易抽搐,在紧张的时候尤其如此。接着,所有受试者都依次叙述。当那位工作人员再次对着麦克风讲述时,他变得焦虑和不连贯,他说他感到一阵抽搐,希望有人能帮助他。他最后几句说的是“有没有人……能……救救我……(喘气声)我……我要……死了,我要……死了(气哽声,然后安静了下来)”。此时,下一位受试者的麦克风被自动打开,人们再也听不到那位有可能濒临死亡的人的动静了。

    你认为这个实验的其他受试者会做些什么呢?到现在为止,受试者知道他们中的一员癫痫发作并希望得到帮助,然而他们觉得可能已经有几个人冲出去并提供了帮助,所以自己可以安然地待在隔间中。实验结果是:15个受试者中,只有3个人立刻对请求做出了反应。6个人没有踏出过房间,另外5个人在“癫痫患者”明显气哽时才冲出房间。这项实验说明当某人知道其他人也听到了同样的求救信息时,就会感到自己肩上的责任变小了。

    这样的结果令你惊讶吗?很有可能。我们大多数人都认为自己十分正直,在那样的情况下,都会义无反顾地提供帮助。当然,这项实验的意义就是去证实那样的期望是错误的。即使是普通、正直的人也不会冲过去提供帮助,因为他们希望别人能够处理这种令人不快的癫痫发作情况。这是不是意味着你也会这样做呢?

    你赞同下面的说法吗?“当我阅读帮助实验的流程时,我想我会立刻对那个陌生人施予援手,就如同当时只有我和这个癫痫病患者一样。然而,我有可能错了,如果发觉自己所处的环境中还有许多人有可能去提供帮助,我可能就不会走出去了。别人的存在会削弱我最初的责任感。“这是一个心理学老师希望你学到的。你自己也做过相同的推理吗?

    描述这项帮助实验的心理学教授希望学生能将基础比率看做是有因果关系的,就如前面提到的那个虚拟的耶鲁大学测试一样。他希望学生可由这两个例子得到推论,即高失败率意味着测试很难。学生应该懂得这个情境的显著特点,例如责任感的淡化。这个特征会引起包括这些学生在内的普通人和高尚的人意外地没有向他人伸出援手。

    改变一个人对人性的看法很难,改变一个人对自身阴暗面的看法就更难了。尼斯贝特和博吉达怀疑学生很有可能会对这项任务和不快的感觉产生抵触情绪。当然,学生能够也愿意在实验中叙述“帮助实验”中的细节,甚至会重复实验方对责任传播的“正面”解释。他们对人性的看法真的发生改变了吗?为了弄清这一点,尼斯贝特和博吉达给受试者播放了一些简短访谈的视频,被访者是在纽约所作的那项研究中的受试者。访问简短而平淡,受访者看上去都是友好而正直的普通人。他们描述了各自的爱好、课余活动以及对未来的计划,这一切完全是老生常谈了。在看过其中一个采访视频后,学生们需要猜测那个受试者会在多长时间后为陌生的发病者提供帮助。

    要想将贝叶斯推论应用到这项指派给学生的任务中,你应该先问问自己如果你并没有看过那两人的视频,你会作出怎样的猜测。这个问题可以运用基础比率得以解决。我们知道,在患病者发出第一次请求后,15个受试者中只有4个冲出去提供了帮助。所以某个受试者立刻伸出援手的概率是27%。因此,当被问到某个特定的受试者是否会立刻提供帮助时,你的第一反应是不会。接着,贝叶斯逻辑要求你通过该受试者的相关信息对自己的判断进行调整。然而,视频是经过精心设计的,不会提供什么信息。他们并没有提供任何理由以便让你推测出某个受试者的热心程度。因此,这样推测出来的结果并不比乱猜的准确率高多少。在缺乏有用新信息的时候,可同时运用贝叶斯定理与基础比率来解决问题。

    尼斯贝特和博吉达叫两组学生看了这些视频并要求他们判断两名受试者的反应。第一组学生只了解到“帮助实验”的流程,并不知道实验的结果。这组受试者的预测结果反映了他们对于人性的看法以及对情境的理解。正如你可能猜到的那样,他们作出的预测是两位受试者立刻都冲出去帮忙了。第二组学生对实验的流程和结果都有所了解。对两组受试者作出的预测进行比较,可以回答一个非常重要的问题:这组学生是否从“帮助实验”的结果中得到了一些信息,从而显著地改变了自己的思考方式?答案很明显:他们其实什么信息也没得到。第二组学生对这两位受试者所作的预测与并没有见过实验统计结果的第一组学生所作的预测没什么区别。尽管知道视频中被抽到的这个受试者所属小组的基础比率,他们还是相信自己在视频中看到的人会很快为陌生的患病者提供帮助。

    对心理学老师来说,这项研究的隐含信息无疑是令人沮丧的。在为学生讲授“帮助实验”中受试者行为的相关知识时,我们希望他们能够有新的收获;希望改变他们在某个特定情境中对于人的行为的看法。这个目标并没有在尼斯贝特和博吉达的实验中得到实现,而我们也没有理由相信假如他们选择的是另一个令人惊奇的心理实验,实验结果就会有所不同。的确,尼斯贝特和博吉达在给学生呈现另一项研究结果时,汇报了类似的发现,此发现表明轻微的社会压力会增强人们对令人痛苦的电击的承受力,且这样的承受力超出了我们大多数人的想象。如果学生没有对社会环境的影响力形成一个新的认识,他们就没有从实验中学到任何有价值的东西。他们对陌生人或是自己的行为作出的推测说明,他们并没有改变原本的想法。以尼斯贝特和博吉达的话来说,学生“默默地将自己(以及他们的朋友和熟人)排除在外”,认为实验的结果并没有令他们惊讶。然而,各位心理学老师不应感到绝望,因为尼斯贝特和博吉达想出了一个能让学生充分理解“帮助实验”内涵的方法。他们找了一组新的学生,向他们描述了“帮助实验”的流程,但没有告诉他们实验的结果。他们播放了那两个视频,然后只是简单地告诉学生视频中的两个人没有帮助那个陌生患者,然后,他们要求学生对所有受试者的行为进行猜测。实验结果是出乎意料的:学生们的猜测十分精确。

    在教授学生全新的心理学知识时,你必须得令他们感到惊讶,但什么样的惊讶才会有效果呢?尼斯贝特和博吉达发现,当他们向学生展示令人惊讶的统计学事实时,学生什么也学不到;但当学生惊讶于个体案例时,例如知道两个友好的人对求救的人袖手旁观时,他们会立刻归纳并推断出帮助他人似乎比自己想象的要困难。尼斯贝特和博吉达将结论总结为耐人寻味的一句话:

    这些受试者不愿从普遍现象中推导出特殊性,这一点与他们愿意从特殊现象中归纳出普遍性如出一辙。

    这是一个影响深远的重要结论。有些人的行为令人惊讶,了解这些行为的统计学事实的人也会将这些事实告诉别人,就在这种转述的过程中,他们的印象得以加深,但这并不意味着他们的世界观也会随之改变。学习心理学面临的考验是,你对所处环境的理解是否发生了改变,而不是你是否了解到一个新的事实。我们对于数据的想法以及我们对于个体案例的想法存在很大的差距。相较于非因果关系的信息来说,用因果关系进行解释的统计学结果对我们的想法影响更大。但即使是具有说服力的因果关系统计数据也不会改变我们在个人经历中形成的长期坚守或是根深蒂固的信念。此外,令人惊讶的个体案例影响甚大,是教授心理学更为有效的手段,因为个案与统计数据的分歧需要调解,并被嵌入一种因果关系里,正因如此,本书才包含种种直接向各位读者提问的问题。与从别人那儿听到令人惊奇的事实相比,你更有可能因为从自己的行为中发现惊人的事实而学到知识。

    示例—原因和数据“我们不能假设仅仅通过统计数据他们就能真正学到知识,需要再给他们一两个有代表性的个体案例来影响他们的系统1(作出判断)。”“不需要担心这个统计学信息会被忽略掉。相反,它会立刻被应用到形成陈规的过程中。”第17章 所有表现都会回归平均值

    我曾经为以色列空军的飞行教练们讲授过关于高效训练的心理学课程,那次经历为我带来了职业生涯中最引以为豪的发现。当时我告诉他们关于技能训练的一条重要原则:对良好表现的嘉奖比对错误的惩罚更有效。不管是对鸽子、老鼠、人类,还是其他什么动物的研究,都给这个说法提供了证据。

    就在我结束了激情洋溢的演说之后,经验最为丰富的一位教练举手示意,发表了一番自己的意见。他先是承认奖励对鸟确实管用,但他认为这不是训练飞行学员的最佳选择。他说道:“在很多情况下,我会赞许那些完美的特技飞行动作。不过,下一次这些飞行员尝试同样飞行动作的时候,通常都会表现得差一些。相反,对那些没执行好动作的学员我会大声怒吼,但他们基本上都会在下一次表现得更好。所以说,别告诉我们嘉奖有用而惩罚没用,因为事实恰恰相反。”

    这条统计学原则我已经讲授了很多年,而这一次我从一个新的角度重新认识了它,这的确是一个顿悟的时刻。那个飞行教练是正确的,但同时他也彻彻底底地错了。他的观察是精明且到位的:被他表扬之后,很多学员很有可能会表现得很糟糕;惩罚反而会促使他们进步。但是就他的推断而言,奖励和惩罚之间是毫无关系的。他所观察到的就是众所周知的“回归平均值”现象,这种现象与表现质量的随机波动相关。一般来说,只有学员的表现远远超出平均值时才能得到这位教练的表扬。但也许学员只是恰巧在那一次表现得很好,而后又变差,这与是否受到表扬毫无关系。同样,或许学员某一次非同寻常的糟糕表现招来了教练的怒吼,因此接下来的进步也和教练没什么关系。这个教练把不可避免的随机波动与因果解释联系起来了。

    这个提议确实引起了反响,不过这些教练对概率预测的代数方法没什么兴趣。所以,我用粉笔在地上画了一个靶子。我请房间里的每一位教练都转过身去,背对着靶子向里面接连扔两枚硬币。接着我们分别测量了靶子到两枚硬币的距离,并写在黑板上。然后,我们又将这些数据按第一次投掷的距离远近排列。很明显,第一次投掷得比较好的人第二次大都做得不好,而第一次没有投掷好的人第二次大都有了进步。我告诉这些教练,他们在黑板上看到的数据其实和飞行员的表现是一致的:糟糕的表现常常会有提高,而好的表现则会变得糟糕,这跟表扬与惩罚都没有关系。

    那天,我的发现是,那些飞行教练陷入了一个偶然性困局之中:因为当飞行学员表现差时,他们就会受到惩罚,而接下来的进步则很可能为他们带来嘉奖,事实上惩罚根本就没有发挥什么作用。而且,处于这种窘境之中的不仅仅是那些教练。我曾无意中发现了人类环境中一个意义重大的事实:生活给予我们的反馈常常违背常理。因为当别人取悦我们时,我们也会对他好;当别人对我们不好时,我们也会对他产生厌恶之情。然而从统计学角度来看,我们却是因为对人友好而受到惩罚,因为举止无礼而得到嘉奖。

    第二次的表现与第一次并无因果联系

    几年之前,在线杂志《边缘》(Edge)的编辑约翰·布鲁克曼(John Brockman)请一些科学家讲述他们“最喜爱的公式”。以下是我提供的信息:

    成功=天赋+运气巨大的成功=更多的天赋+更多的运气

    运气常常会促成成功,然而当我们把这个并不令人吃惊的想法用到高水平高尔夫锦标赛前两天的比赛中时,却出现了令人惊讶的结果。为了简单说明这个问题,我们假设这两天中参加比赛的选手平均绩点为72标准杆。我们关注了一位在第一天表现非常不错的选手,他在当天比赛结束时得分为66杆。我们从这个得分中能推断出什么?最直接的推断就是这个球员要比锦标赛中其他选手有更高的天赋。成功公式告诉我们另一个推断同样成立:第一天表现很好的高尔夫选手很可能在那一天有着非比寻常的运气。如果你能接受天赋和运气都能带来成功这种想法,那么“这个成功的高尔夫球手很幸运”这个结论肯定和“他很有天赋”这个结论一样可信了。

    同样,如果你关注一个当天的成绩超过标准杆5杆的球员,就可以推测他技术很糟,而且那天运气也不好。当然,你也清楚这些推测不一定都成立。某个打了77杆的运动员很可能非常具有天赋但却遭遇了极其不走运的一天。下面的推测是根据第一天的得分作出的,尽管不确定,但这种推测通常是正确的。

    第一天高于一般水平的成绩=高于一般水平的天赋+第一天的好运气

    第一天低于一般水平的成绩=低于一般水平的天赋+第一天的坏运气

    现在,假设你已经知道某个高尔夫球手第一天的得分,并且要对其第二天的得分进行预测。你希望这个选手第二天仍旧能够延续前一天的优异表现,所以你给出的最佳猜测就是第一个选手得分“高于平均水平”,而第二个选手得分则“低于平均水平”。当然,运气就很难说了。我们没办法预测出一名选手在第二天(或是任意一天)的运气如何,因此我们能作的最佳推测就是采用其平均值—既不好也不坏。也就是说,在没有其他任何相关信息的情况下,对于某选手在第二天的得分情况,我们能作出的最好推测就是:第一天的表现不会重演。你很有可能会这样说:

    ·在第一天表现很好的高尔夫选手在第二天也会表现得不错,但还是会比第一天稍差一点,因为他在第一天碰到的好运气不一定能在第二天再次碰到。

    ·在第一天表现不佳的高尔夫选手在第二天也许得分还会低于平均水平,但是会有些提升,因为他第一天的霉运不一定会持续。

    尽管我们会猜测第一名选手在第二天的表现还是会优于第二名选手,但是他们之间的差距会缩小。

    事实上,对选手第二天的表现最准确的预测通常是最保守、最接近平均值的,而不是基于第一天分数的预测。我的学生每次听到这样的结论都很惊讶。正因为如此,这种模式被称为“回归平均值”。原始数据越极端,我们所期待的回归就越明显,因为极好的分数常常表明这一天的运气很不错。这种回归式的预测是很合理的,但是准确度却得不到保证。有些高尔夫选手在第一天得了66杆的高分,如果第二天运气更佳的话,得分甚至更高。当然大部分人的表现都会变差,因为他们的运气不再处于平均值之上了。

    现在我们将时间轴反过来,将选手按第二天的得分情况排序,来看看他们第一天的表现。我们仍旧会发现同样的模式—回归平均值。第二天表现出色的选手很可能是因为当天运气好,而最好的猜测就是他们第一天的运气不佳。当你根据后期的表现来推测早期表现时,也会发现回归平均值的现象,此时你便会相信这种回归并非巧合。

    回归效应无处不在,很多可以说明这一效应的误导性因果事件同样司空见惯。有一个经典的例子,那就是“体育画报的诅咒”—凡是登上《体育画报》(Sports Illustrated)这本杂志封面的运动员都会在接下来的赛季中表现欠佳。一般来说,人们会认为过度自信以及人们对其期望过高的压力造成了这些人表现不佳。不过,这个诅咒可以用更简单的方式来解释:能够成为《体育画报》封面人物的运动员在前一赛季一定表现极为出色,也许这种出色的表现在很大程度上源于运气—运气是善变的,接下来他就没那么走运了。

    当年和阿莫斯正在撰写一篇关于直觉预测法的文章时,我碰巧看了冬奥会的男子高空滑雪比赛。在这项比赛中,每个运动员都有两次机会,最终结果由两次得分决定。每当一名选手进行第二轮时,解说员常常会说“挪威选手第一轮表现很好,现在他一定很紧张,因为想要保持领先地位,估计他在第二轮会表现欠佳”,或者“瑞典选手第一轮表现很糟糕,他明白自己已别无选择,因此也没有什么压力,大概第二轮就会做得更好”。所有这些评论都令我感到很吃惊。很明显,这个评论员已经觉察到了回归平均值的概念,而且还在没有任何依据的情况下编出了一个有理有据的故事。也许他的解释是正确的,如果我们测一下运动员的心跳,可能会发现不佳的表现之后确实会放松,当然也可能不会。有一点我们要记住,运动员第一跳和第二跳的表现之间不存在因果关系。这只是一个数学问题,其中运气起了很大的作用。这个说法不太令人满意—我们都想得到一个有因果关系的解释—但事实的确如此。

    回归现象的意义不亚于发现万有引力

    无论是没有察觉还是解读错误,这种回归现象对人类而言总是很陌生的,因此直到万有引力和微积分理论出现两百年后,这种现象才为人们所理解。而且,是19世纪英国最伟大的科学家之一经过艰苦卓绝的努力才探索出这一重要规律的。

    弗朗西斯·高尔顿(Francis Galton)爵士是19世纪英国著名的学者,也是达尔文的表兄。他发现并命名了回归平均值的现象。1886年,他发表了《在遗传的身长中向中等身长的回归》,其中涉及对连续子代的种子大小的测量以及对子代株高和母本株高的比较。在对种子的研究中,他写下了如下的话:

    实验结果看上去十分值得关注,在1877年2月9日的一次演讲中,我就先于皇家科学院将这些结果用做一次演讲的基本内容了。从这些实验可以看出,子代的高度和母本高度似乎并不相关,但似乎前者比后者更趋于平均。如果母本较高,那么子代就会变矮;如果母本较矮,则子代就会变高。实验显示,子代向平均值的回归与母本高矮的差异是成比例的。

    皇家科学院是世界上最古老的独立研究机构,高尔顿很期待该机构中博学的院士们也会对他那“值得关注的实验观察”感到惊讶。但真正值得关注的是,他为之惊讶的统计规律不过是像我们呼吸的空气一样稀松平常。回归效应随处可见,但是我们却无法识别它们的真面目。高尔顿以子代高度的回归现象为起点,逐渐发现当两个测量值之间的关联不是那么完美时,此时也会出现这种回归。他借助了当时最杰出的几位统计学家的帮助,且历时多年才得出这一结论。

    当按不同的标准衡量两个变量时—例如体重和钢琴技艺—如何测量这两个变量之间的回归是高尔顿要攻克的重大难题之一。要解决这一问题需要以人口作为参照标准。假设我们对某小学所有年级的100名儿童的体重和钢琴技艺进行测量,然后将两者按从高到低的顺序分别进行排列。比如说,简在钢琴技艺中排第三名,但按体重则排第27名,那么我们就可以说她弹钢琴的水平比她的体重排名靠前。我们来作些假设,这样就可以使这一现象更容易理解。

    不管年龄几何,

    ·钢琴技艺高低仅仅取决于每周练习的时长。

    ·体重多少仅仅取决于冰激凌的摄入量。

    ·冰激凌摄入量和每周练习钢琴的时长并不相关。

    现在通过排行(按统计学家的说法是“标准分”),我们可以得出更多的等式:

    体重=年龄+冰激凌消耗量

    钢琴技艺=年龄+每周练习时长

    你会发现,当我们通过体重预测钢琴技艺或通过钢琴技艺预测体重时,就会出现回归平均值的现象。如果知道汤姆在体重中排第12位(远高于平均值),我们就可以(从统计学上)推测他比平均年龄要大,而且可能比其他孩子吃更多的冰激凌。如果知道芭芭拉的钢琴技艺排第85位(远低于平均值),我们就可以推测她应当比大多数孩子年龄小,而且每周练习的时间也少。

    两个值之间的“相关系数”指的是两个值共有因素的相对比重。这个值在零和1之间浮动。我们拥有父母各一半的基因,对于像身高这种受环境因素影响很小的特征来讲,父母和子女的相关系数在0.5左右。下面的例子能帮助我们更好地了解相关系数:

    ·一个物体的型号用英制单位精确测量的结果与用公制单位精确测量的结果之间的相关系数为1。任何影响其中一个值的因素都会影响另一个。两者享有同样的决定性因素。

    ·美国成年男性自报的身高和体重之间的相关系数为0.41。如果将女性和儿童也包括进去,那么相关度就会更高,因为性别和年龄都会影响身高和体重,这便使得共有因素所占比例增加。

    ·学术能力评估考试成绩(SAT)和平均绩点(GPA)之间的相关系数大约是0.6。然而,研究生的潜能测试与成功之间的相关性则小得多,这在很大程度上是因为这一群体的潜能差异比较小。如果每个人都有相似的潜能,那么在衡量成功时,潜能的因素就不会占太大的比重。

    ·美国人收入和教育程度的相关系数约为0.4。

    ·家庭收入和他们电话号码后4位之间的相关系数为零。

    弗朗西斯·高尔顿用了好几年的时间才确定相关性和回归性并非两个概念—它们只是从不同视角对同一个概念作出的阐释。这个概念的原则很简单,但是影响却很深远:只要两个数值之间的相关度不高,就会出现回归平均值的情况。为了阐释高尔顿的卓见,我们来看一个例子,很多人都认为这个例子很有趣:

    聪明的女人常常会嫁给不如她们聪明的男人。

    如果你在朋友聚会时挑起这个话题,一定会引起热烈讨论,大家肯定都愿意分享自己的看法。即使有些对统计学有所了解的人也会很自然地用因果关系去解释这个现象。一些人认为高智商的女人为了避免和同样高智商的男人竞争才这么做;或者是在择偶之时不得不妥协,因为同等智商的男人不愿意与这些女人竞争……也许还会有其他更牵强的解释。现在我们来看看下面的表述:

    夫妻二人智商之间的相关性并不是绝对的。

    这个观点显然是正确的,而且很无聊。谁会期待这样一种相关性是绝对的呢?那就没有什么好解释的了。不过,你认为有趣的观点和你认为毫无意义的观点又是等值的。如果夫妻二人智商之间的相关性并不是绝对的(如果男人和女人在平均智商上没有差异),那么从数学上来讲,高智商女人嫁给那些不如她们智商高的男人是顺理成章的(反之也成立)。对于这一现象,用回归平均值效应来解释要比用并不绝对的相关性来解释更通俗,也更有说服力。

    你也许很同情高尔顿这样绞尽脑汁地解释回归的概念。统计学家戴维·弗里德曼(David freedman)曾说过,如果把回归的概念用在民事或刑事审判中,那么试图对陪审团解释“回归”的一方一定会输掉官司。为什么会这样呢?其中主要的原因也是本书中反复出现的主题:我们的思维常会对因果关系的解释带有很强的偏见,而且不善于处理统计数据。当我们把注意力集中在某一事件上时,相关的记忆就开始探寻其原因—更确切地说,我们会对所有早已存在于记忆中的原因进行自动搜索。当发现有回归效应时,因果关系解释就会被激活,但事实上这些解释都是不对的,因为回归平均值虽然可以用来解释现象,却无法找出其中原因。在高尔夫锦标赛中,那些第一天成功的选手通常在第二天发挥都很糟糕,而这场比赛总会吸引我们的注意力。对于这种现象最好的解释就是,那些选手第一天出奇地走运,不过这种解释缺乏我们的大脑所认可的因果关系因素。事实上,那些能够为回归效应提供巧妙解释的人往往赚得盆满钵满。如果一个商业评论员声称“今年的生意比去年要好,因为去年太糟了”,尽管他说得没错,但也很有可能很快就被电台噤声。

    我们理解“回归”概念存在很多困难,这些困难皆源自两个系统—系统1和系统2。在相当数量的案例中,即便提供了一些统计数据,若无特殊说明,“相关”与“回归”的关系还是相当模糊的。因此,系统2认为理解这种关系很难。因为从某种程度上讲,这是由于我们总是要求对事物进行因果关系解释,这也是系统1的一个特征。

    抑郁儿童喝了某种功能饮料,他们的情况在3个月内得到很大改善。

    这个新闻标题是我杜撰的,但这则新闻所报道的内容却是真实的:如果给一群抑郁儿童喝了某种功能饮料的话,一段时间后,他们的病情会有很大的好转。如果抑郁儿童每天都花一段时间倒立,或是把一只猫抱在怀里20分钟,这些举动也可以使病情好转。多数读者读了这则新闻之后会不由自主地认为:喝功能饮料和抱猫的行为的确使抑郁儿童的病情得到了改善,但这个结论却无法得到证实。抑郁儿童是一个极端群体,他们比大多数其他儿童要压抑得多—这些极端群体在一段时间之后会回归平均水平。一连串的测试反映出来的不同压抑程度之间并无绝对的相关性,因此回归平均值(或者更确切地说是回归平均水平)这种现象又会出现:即使他们不抱猫,也不喝功能饮料,一段时间之后这些抑郁儿童的病情同样会有所缓解。为了证明喝功能饮料或是其他治疗方法是有效的,我们必须要对两组患病儿童进行比较—实验组接受了治疗(比如喝过功能饮料),对照组没接受过治疗(或只是服用过安慰剂)。我们期望的是对照组仅通过回归就能改善病情,而该实验的目的在于判定接受治疗的病人是否恢复得更快。

    对回归效应作出错误因果解释的不仅仅是大众读者。统计学家霍华德。维纳曾经列出一长串杰出研究者的名字,他们也犯过同样的错误—将相关性和因果性混淆在一起。回归平均值是科学研究中的常见问题,有经验的科学家都会小心提防这种毫无缘由的因果推论所形成的陷阱。

    在我最喜欢的那些关于直觉产生预测错误的例子中,有一个是根据马克斯·巴泽曼(Max Bazerman)的《管理决策中的判断》(Judgment in Managerial Decision Making)一书中的内容改编而来的:

    假设你为一家连锁百货公司作销售预测。所有连锁店的规模和商品种类都非常相似,但是其地理位置、竞争状况以及其他随机因素使这些商品的销量有所不同。下列数据为2011年的营业额,请你对2012年的营业额进行预测。你已经知道自己可以接受经济学家所作的总体预测—销售额总体会增长10%。那么你将如何完成下列表格?

     [image file=Image00012.jpg]

    读过本章,你就知道将每家店的销售额增加10%显然是不对的。你应当使自己的预测具有回归性:对于业绩不好的店,预测增长率应高于10%;对于业绩较好的店,预测值应低于这个值(甚至是负值)。不过如果你咨询其他人的话,很有可能会碰钉子:这么显而易见的问题还有什么好问的?正如高尔顿历经艰难才发现的那样,回归的概念从来就不是显而易见的。

    示例—回归平均值“她说经验教会她一个道理,批评比赞扬更有用。不过她不明白这是回归平均值在发挥效用。”“也许由于惧怕让众人失望,所以他的第二次面试没有第一次那样令人印象深刻,他第一次的表现太优秀了。”“我们的筛选过程并不是很完美,所以我们会考虑回归性。有些极其优秀的候选人也会让我们失望,对此我们并不感到惊讶。”第18章 如何让直觉性预测更恰当有效?

    生活中,许多场合都会用到预测。经济学家预测通货膨胀和失业率,财务分析师预测收益,军事专家预测伤亡人数,风险资本家预测利润率,出版商和生产商预测读者和消费人群,承包商预测项目完成所需的时间,工程师预测建造某建筑需要的水泥量,火场指挥员预测扑灭大火所需的消防车数量。一些私人问题同样需要用到预测,我们预测恋人在自己求婚时的反应,预测在新工作中需要作的自我调节。

    有些预测判断,比如那些工程师所作的预测,主要就是通过查找表格、精确计算以及对类似项目的结果进行仔细分析得来的。还有一些预测则需要直觉和系统1的共同参与,主要有两种类型。有些直觉主要依靠反复训练得来的技能和经验。加里·克莱因在《力量的源泉》(Source of Power)一书中及其他场合曾提到过象棋高手、火场指挥员和内科医生所作的快速自动判断及选择,用以阐释这种经验性直觉,即由于识别出熟悉的线索,大脑中快速呈现出当前问题的解决方案。

    还有些直觉有时从一开始就难以从主观上进行区分。这种直觉受启发法的影响,通常会用简单的问题来替代难以回答的问题。即使证据很不充分,决定亦不可更改,人们依此作出直觉性判断时往往也会信心十足。当然,许多判断,特别是专业领域的判断,受到了分析与直觉的共同影响。

    偏离预测方向的直觉

    让我们再来看看下面这个老问题:

    朱莉现在是一名州立大学4年级的学生。她4岁就能流畅地进行阅读。她的平均绩点(GPA)是多少?

    熟悉美国教育体制的人很快就能得出一个数字,且这个数字通常在3.7或3.8左右。为什么呢?原因在于,系统1的几个机制共同参与了预测。

    ·人们会探寻证据(朱莉的阅读能力)与预测目标(她的平均绩点)之间是否存在因果关系。这种关系可能不是直接的。在这个例子中,很小就能阅读与较好的平均绩点都是学术天分的表现,必然会存在某种联系。你(你的系统2)可能会否定朱莉在高中曾经赢得钓鱼比赛或是在举重比赛中表现良好的说法。这个过程被有效地一分为二。系统1能够摒弃那些无关或是错误的信息,但却无法弥补证据中相对较小的瑕疵。因此,直觉性预测对证据的实际预测结果几乎毫无感觉。一旦发现某种关联,例如朱莉很小时就能阅读,眼见即为事实原则就会发挥作用:你的联想记忆会快速自动地运用可利用信息编出最恰当的故事。

    ·另外,证据的评估与相关规范联系紧密。4岁时阅读能力就很强的孩子早熟吗?什么样的名次或者说百分制下得多少分才能与这样的能力相符?与这个孩子作比较的人群(我们称之为参照人群)也没能明确说明这一点,但与我们平时说话所遵循的规则相同。如果即将毕业于这所大学的某个人被赞为“相当聪明”,你几乎不必问:“当你说他‘相当聪明’时,脑子里想到的是哪些参照人群呢?”

    ·下一部分包括替代和快速配对。对于儿童时期认知能力这个并不周密的证据进行评估的问题被替换成关于她大学平均绩点问题的答案。朱莉的平均绩点和她小时候就能阅读这项能力的百分比值是相同的。

    ·这个问题明确规定答案必须在平均绩点的范围内,这也就要求另一个强度匹配的运作,即将你对朱莉的学术成就的总体印象与能证明她本人天赋的平均绩点这一证据匹配起来。最后的步骤是转化,将你对朱莉学术水准的印象转化为相应的平均绩点。

    通过强度匹配得到的预测结果与支持这个预测的证据一样极端,会导致人们面对两个不同的问题却给出相同的答案:

    朱莉的早期阅读能力成绩是多少(百分制)?

    朱莉的平均绩点是多少(百分制)?

    到目前为止,你应该很容易就能看出所有这些运作都是系统1的特点,我按照不同步骤依次将它们列在这里,当然联想记忆的大量激活并不遵循这一顺序。你应该将这种记忆大量激活的过程想象为以下几步:由信息和问题激发起联想记忆,然后自我反馈,最后选定最具连贯性的合理性方案。

    我与阿莫斯曾经在一个实验中要求受试者对8位大学新生的相关描述作出判断,这个描述是由一名辅导老师根据对新班级的访谈而写成的。每个描述由5个形容词组成,如下例所示:

    聪明、自信、笃学、勤奋、好问

    我们问了受试者下面两个问题:

    这个描述对你关于学术能力的想法有多大影响?

    你认为这些关于新生的描述令你印象深刻的可能性有多大(百分制)?

    这两个问题要求你根据自己的标准对新生进行描述,将自己的描述与辅导老师的描述进行对比,进而评估上述描述。你自身的评判标准存在着重大影响。虽然你根本不知道自己如何形成这一评判标准的,但你对这条描述承载的热情程度非常清楚:辅导老师认为这个学生是优秀的,但还算不上是最棒的,因为我们还有很多比“聪明”程度更深的形容词(杰出、有创造力),也有很多比“笃学”程度更深的词(博学的、渊博的),更有许多程度超过“勤奋”的形容词(积极的、力求完美的)。由此可以推测,(该生)成绩很有可能在前15%,但不太可能在前3%。人们在类似的判断中得到的结果出奇地一致,至少在相同文化背景的人群中是这样。

    我们问了实验中另一组受试者不同的问题:

    你估计这个学生的平均绩点是多少?

    新生中取得较高平均绩点的学生占多大比例?

    你需要再三思考才能看出这两组问题的微小差别。这种不同本该很明显,但事实却并非如此。第一组问题只要求你作出评估,第二组问题则与第一组不同,包含了很大的不确定性。这个问题指的是在大学一年级期末的真实表现。自访谈后,这一年发生了什么呢?你怎样才能以5个形容词来预测这个学生在大学第一年的真实表现呢?如果这只是辅导老师本人通过与该生的访谈而作出的平均绩点预测,那么她的预测会准确无误吗?

    这项研究旨在比较两个判断结果(百分比成绩):受试者通过评估一个案例中的描述做出的判断结果(百分比成绩)和另一个案例中的最终预测结果。结论很明显:两个判断结果完全相同。尽管两组问题不同(一组关于该生的描述,另一组关于该生未来的学术表现),但受试者将这两个问题看成了一个。与朱莉的例子相同,受试者并没有将对未来的预测和对当前信息的估测区别开来—预测与估测相匹配。这也许是我们得到的能证明替换存在的最佳证据。当人们按要求预测时,他们总会将预测替换为对所描述问题的估测,而且没有意识到他们回答的问题并不是那个被问到的问题。这个过程证明预测时会存在系统偏见;他们完全忽略了一点,即应该回归到平均值上来。

    在以色列国防军队服役期间,很长时间我都待在一支部队里,这支部队通过一系列面试及实战测试来挑选后备实训军官。成功预测的特定标准为这些人在军官学校的最终成绩。这些等级评定的效度非常低(我会在后面的章节详细说明)。若干年后,这支部队仍旧存在,而彼时我已成为一名教授,并且正与阿莫斯合作研究直觉性判断问题。我一直与这支部队的工作人员保持着密切联系,于是便请他们帮个忙。除了他们通常使用的评估候选人的评分系统以外,我还让他们猜测每个学员将来在军官学校中可能得到的分数。他们搜集了几百份这样的预测。所有作出这些预测的军官都知道学校给学员评分时用的是字母评分系统,也知道所有学员得到的A、B、C各等级的近似比例。实验结果令人惊讶:预测出来的A和B的频率几乎与学校的结业成绩中的A、B等级的频率等同。

    这些发现提供了一个引人注目的例子,这个例子涉及替代和强度匹配两个方面。作出预测的军官完全将这两个任务混淆在一起了:

    ·他们平时的任务是对候选人在该部队的表现作出评价。

    ·我让他们执行的任务是对候选人的未来成绩作出切实预测。

    他们运用强度匹配将自己的评级简单地转换为军官学校的评分结果。由于无法解决预测中存在(相当大)的不确定性,他们的预测又一次完全无法回归(平均值)。

    对直觉性预测的偏见进行修正

    我们回过头再来看朱莉,那个儿时阅读能力就很强的阅读者。前一章已经介绍过预测她平均绩点的正确方法。我在前一章中还为连续两天打高尔夫球的例子以及体重和弹钢琴的例子分别写了一个原理公式,在这里我也要为阅读年龄和大学成绩的决定因素写一个公式:

    阅读年龄=共同因素+决定阅读年龄的特殊因素=100%

    平均绩点=共同因素+决定平均绩点的特殊因素=100%

    共同因素包括由遗传决定的潜能、家庭支持学业的程度,以及能够造成人们在孩童时期成为出色的阅读者、青年时期又在学术上有所建树的所有其他因素。当然,许多因素只会影响到其中的某个结果,却不会对其他结果产生影响。朱莉可能是因为父母对她期望过高强迫女儿读书才这么早学会阅读的,也有可能因为一段不愉快的感情经历,她的大学成绩才那么糟糕,还可能在少年时滑雪出了事故导致脑部轻微受损等。

    回想一下上面两个测量公式的关联,即当前阅读年龄和平均绩点这两个公式,你会发现两者所考虑的共同因素在决定因素中所占的比例是一样的。你对这个比例能作出的最贴近的估测是多少?我给出的答案是最多30%。有了这个估测,我们就完全有条件作出不带偏见的预测了。按照以下4个简单步骤来做,我们就可以进行无偏见预测:

    1.先估测出平均绩点的平均值。

    2.根据你对证据的印象算出与之相匹配的平均绩点。

    3.对你的证据和平均绩点的关联作出估计。

    4.如果关联度是0.3,则从估算出的平均绩点的平均值中抽出30%,放到与之匹配的平均绩点里。

    步骤1为你提供了基准线,即在你除了知道朱莉是个快毕业的大学生之外什么也不知道的情况下,预测她的平均绩点。在没有信息的情况下,你很有可能预测其为一般水平。(这一点与你对汤姆的预测相似,在对他一无所知的情况下,你便将企业管理专业毕业生的基础比率放在了他的身上。)步骤2是你的直觉性预测,这个预测将你的估计和证据进行了匹配。步骤3使你离开基准线靠向自己的直觉,但你能离开的距离取决于你对关联性的估测。在步骤4中,尽管你最终作出的预测还是受到了直觉的影响,但是这个影响力已经小很多了。

    这种预测方法很常见。在你需要预测一个定量数值时,就可以运用这个方法,例如在预测平均绩点、投资效益、公司发展的业绩时,这个方法就可以派上用场。这个方法以你的直觉为基础,但是削弱了直觉的影响,使它回归到平均值上了。当你有充分的理由对自己的直觉性预测的准确性充满信心时,即证据和预测之间联系非常紧密,进行调整的余地就会很小。

    直觉性预测需要校正是由于它并不具有回归性,因此是带有偏见的。假设我预测每一位高尔夫球员在一场锦标赛上第二天的得分与第一天的得分相同,那么这个预测并没有考虑到回归平均值的问题:第一天发挥得好的高尔夫球员第二天比赛时水平都会有所下降,而那些头天状态不佳的球员则大多会在第二天有所提高。当我们最后将预测值与实际结果进行比较时,我们会发现,缺失回归性的直觉确实带有偏见。

    这些预测普遍对第一天发挥得好的人过于乐观,对开始就发挥得不怎么样的人则过于悲观。预测与证据一样极端。同样,如果不使预测回归到平均值上来,而是根据儿童时期的成就来预测其大学时期的分数,那么你多半会对孩提时代阅读能力强的人在大学时代取得的学术成绩颇感失望,而那些较晚开始阅读的孩子的大学成绩反而会给你带来惊喜。修正过的直觉性预测消除了这些偏见,所以预测(过高或过低)高估真实值或低估真实值的可能性大致是相等的。当你不带偏见地预测时仍然会犯错,但这时的错误较小,也不会导致过高或过低的估值。

    两位教授候选人,应该选择哪一位?

    前文中,我向大家介绍了汤姆的情况,用以说明不连续结果的预测问题,比如对其所属的专业领域或者一次考试的成功概率进行的预测,这些预测是通过评估某一特定事件的可能性(或者按照结果出现的可能性大小排序)来表达的。我还曾描述过抵制不连续预测中的常见偏见的步骤,比如忽略基础比率,对信息的优劣不敏感。

    有些预测偏见是通过一个数值范围来表达的,例如某学生的平均绩点或某公司的收益,这些偏见与我们在判断结果的可能性的过程中所持偏见相似,而两种偏见的修正过程也十分相似:

    ·都包含一种基准线预测,如果你对手头这个案例的情况一无所知,便会作出这种预测。在绝对的情况下,这个基准线是基础比率;在有数字的情况下,这个基准线就是相关结果的平均值。

    ·都包含一种直觉预测,无论是可能性或是平均绩点,这种预测会将呈现在大脑中的数值通通表达出来。

    ·在上述两种情况中,你的目的都是要作出一种预测,这种预测可在基础比率和直觉性反应之间充当媒介。

    ·在没有什么有价值的信息的情况下,你会坚守基准线。

    ·在其他极端情况下,你还会坚守自己最初的预测。当然,只有在对支持自己最初预测的证据进行过严格验证之后,你才会信心十足地坚持那个预测。

    ·在大多数情况下,你会发现自己有理由怀疑自己的直觉判断和真理之间的关联其实并不完美,而你最终会给出介于两者之间的判断。

    这个过程很接近一个恰当的统计分析可能会出现的结果。如果成功的话,这个过程就会使你作出的预测偏见越来越少,作出的可能性评估越来越合理,对各种数值作出的预测也越来越适度。前述两个过程意在解决同一种偏见,即直觉性预测总是过于自信或过于极端。

    修正你的直觉性预测的偏见是系统2的任务。要想找到相关的参照物、对基准预测作出估测或者对证据的质量进行评估,往往需要付出很大的努力。只有在风险很高而你又特别渴望避免犯错误时,这种努力才显得合乎情理。此外,你应该知道纠正你的直觉也许会使你的生活变得复杂。无偏见预测的一个特征就是,只有在信息非常有效时才允许人们对罕见或极端的事件作出预测。如果你期待自己作出恰当有效的预测,那么你的预测结果就永远不会太离谱或者偏离平均值太多。而如果你的预测不存在偏见,你也就永远不会有极端事件的“愉快体验”了。当你在法学院最得意的学生成为最高法院的法官时,或者当你曾经很看好的那家新成立的公司成为商界新秀时,你永远不会说“我早就知道会这样”。如果信息量有限,你也无法预测到一个出色的高中生会成为普林斯顿大学的优等生;同理,一个风险资本家永远不会认为新创立的公司在起步阶段时成功的概率会“很高”。

    一定要严肃对待那些反对适度的直觉性预测原则的意见,因为摆脱偏见并非总是头等大事。如果不问具体情况,对所有预测的错误都同样对待,那么对无偏见预测的偏爱就是合理的了。然而总有那么一些时候,一种错误比另一种错误更糟糕。若一位风险投资家只为寻找“下一件大事”,那么他错过下一个谷歌或脸谱网的风险就会远远大于对刚刚创立的公司(最终破产)进行适度投资带来的风险。风险投资家的目标是正确判断极端情况,甚至以高估其他许多风险为代价也在所不惜。对于借出大笔贷款的保守银行家来说,某一位借款人破产带来的风险会比拒绝几位可能会履行债务的潜在客户带来的风险更大。在这种情况下,即使作出这些判断所依据的信息效度只是适中,使用极端的语言(“前景非常好”,“违约的严峻风险”)也可能会为其带来舒适感。

    对于一个理性的人来说,无偏见且适度的预测不应该引发问题。毕竟一个理性的风险投资家知道,即便是最有前景的新建公司,其成功概率也只是中等水平而已。她将自己的工作视为从所有赌注中找到的前景最好的赌注,而且关于要投资的那家新建公司的发展前景问题,她觉得没有必要欺骗自己。同样,预测某家公司收益的理性个体不会受到某个数字的束缚—他们应该考虑到最有可能出现的那个结果的不确定性。如果成功的回报足够大,一个理性的人就会考虑向一家极有可能倒闭的企业投资一大笔钱,而不会自欺欺人地抬高其成功概率。然而,我们并不都是理性的,我们中的一些人也许还需要歪曲判断作为保护来掩盖自己的无能为力。如果选择接受极端的预测来蒙蔽自己,你就会清楚地意识到自己对自己的纵容。

    也许我提出来的那几个修正步骤最难能可贵的贡献就是这些步骤会要求你思考自己对事情到底了解多少。接下来我会运用一个学术界尽人皆知的例子,其他生活领域中的例子亦可依此类推。一个部门要雇用一位年轻的教授,他们希望这位教授未来的学术能力能够达到最高水平。该部门的调查委员会最后将候选人圈定为两个:

    金最近完成了毕业设计。她的推荐信中都是对她的溢美之词,而且面试时她说得也很好,给在场的每个人都留下了深刻的印象。不过她没有什么实质性的科研成果。

    简经过过去3年的学习取得了博士后头衔,学术成果颇丰,研究也做得非常出色,但她在面试时表现得不如金出色。

    我们直觉会选择金,因为她给人的印象更深刻,而且眼见即为事实。但与简的信息相比,金的相关信息则少很多。我们可以回想一下小数原则。事实上,你从关于金的描述中得到的信息样本比简的要小,而且在小样本中更容易发现极端的结果。小样本的结果往往有更多的运气成分,因此在判断金将来的表现时,更应该回归平均值。若觉得金更有可能退步,最终你就会选择简,尽管你对她的印象并不深刻。如果按照学术能力来选人,我会投给简一票,但我得先努力克服自己对金的直觉印象—金更有希望。跟着我们的直觉走比违背直觉感觉更自然、更亲切。

    你很容易就能想象出不同情境下的相似问题,例如某位风险投资家要在位于不同市场中的两家新建公司之中选出一家进行投资,他可以相当精确地预估其中一家公司的产品需求量,而另一家是一派欣欣向荣的景象,让人觉得更有希望,但其发展前景却并不是很确定。如果把这种不确定因素考虑在内的话,你对第二家公司前景的最佳猜测是否还会优于第一家公司呢?这个问题值得认真思考。信息不足时,极端预测和预测罕见事情的愿意都源于系统1。联想机制会很自然地将极端预测和作出这些极端预测所依据的可察觉的信息极端性匹配在一起—这也正是替代的运行机制。而且系统1形成过于自信的判断也是正常的,因为自信是由你根据可得信息提炼出来的最合理故事的连贯程度决定的,这一点我们都明白。但要注意:你的直觉会产生极端预测,而你也很容易对这种极端信心满满。

    回归性也是系统2的一个问题。回归平均值这一概念很新奇,沟通和理解皆非易事。高尔顿在弄懂这一概念之前也颇费了一番心思。很多统计学老师在讲到这一问题时,心中也很没底,学生们最后对这个重要概念也是似懂非懂,只有个很模糊的概念。这个例子说明系统2需要经过特殊训练。将预测和信息匹配起来不仅是我们的直觉行为,这样做似乎也是很合理的。我们无法根据经验理解回归性。即使我们对回归性已经有了明确认识—就像我们在飞行教练员的故事中看到的那样—也只会用因果关系来解释这一特性,而这个解释往往又是错的。

    示例—直觉性预测“那家新成立的公司已经深入人心了,但我们不能指望他们将来也能做得这么好。他们的营销之路很长,回归的空间也很大。”“我们的直觉性预测的确令人鼓舞,但这个预测可能离现实太远了,还是让我们再看看手中的信息资料,让预测回归到平均状态吧。”“即使这次投资极有可能失败,我们还是觉得这项投资可能是个不错的想法。咱们还是别说什么这就是下一个谷歌这样的话吧。”“我读过关于那个品牌的一篇评论,评价极高,然而这很可能只是侥幸成功。我们应该这样想:对这个品牌的评论很多,而我们看到的这个正巧是评价最高的。”

  • 丹尼尔•卡尼曼《思考,快与慢》1-9

    目录
    序言
    第一部分 系统1,系统2
    第1章 一张愤怒的脸和一道乘法题 第2章 电影的主角与配角第 3章 惰性思维与延迟满足的矛盾 第4章 联想的神奇力量第 5章 你的直觉有可能只是错觉 第6章 意料之外与情理之中 第7章 字母“B”与数字“13” 第8章 我们究竟是如何作出判断的? 第9章 目标问题与启发性问题形影不离
    第二部分 启发法与偏见
    第10章 大数法则与小数定律 第11章 锚定效应在生活中随处可见  第12章 科学地利用可得性启发法 第13章 焦虑情绪与风险政策的设计 第14章 猜一下,汤姆的专业是什么? 第15章 琳达问题的社会效应 第16章 因果关系比统计学信息更具说服力 第17章 所有表现都会回归平均值 第18章 如何让直觉性预测更恰当有效?
    第三部分 过度自信与决策错误

    第19章 “知道”的错觉第 20章 未来是不可预测的 第21章 直觉判断与公式运算,孰优孰劣? 第22章 什么时候可以相信专家的直觉? 第23 章 努力养成采纳外部意见的决策习惯 第24章 乐观主义是一柄双 刃剑
    第四部分 选择与风险
    第25章 事关风险与财富的抉择 第26章 更人性化的前景理论 第27章 禀赋效应与市场交易 第28章 公平性—经济交易的参照点 第29章 对结果可能性的权衡 第30章 被过分关注的罕见事件 第31章 能带来长远收益的风险政策 第32章 心理账户是如何影响我们的选择的?第33章 评估结果的逆转 第34章 善用框架效应,让生活更美好
    第五部分 两个自我
    第35章 体验效用与决策效用的不一致 第36章 人生如戏 第37章 你有多幸福? 第38章 思考生活
    结语
    附录A 不确定性下的判断:启发法和偏见
    附录B 选择、价值以及框架

    序言

    我想每位作者都会在脑海中勾勒读者因为读自己的书而受益的情形。我的这本书就像是办公室饮水机旁的闲谈一样,读者对它不会感到陌生。人们在饮水机旁或交流,或闲谈,很随意。我希望这本书能丰富人们的词汇,这样大家在谈论别人的判断与决策、公司的新政策或是同事的投资时,这些新词汇就能派上用场了。书中为何还会涉及闲谈的内容呢?因为利用闲谈来发现和分析别人犯的错误比分析自己的错误更容易,也更有意思。在人生最辉煌的时候,我们很难对自己的信念和需求产生怀疑,越是在最需要质疑自己的时候越难做到这一点,但我们可以从他人的真知灼见中受到启迪。很多人都会不由自主地推想朋友和同事会对自己的选择作何评价,而这些预先推断的中肯程度和内容都是十分重要的。对别有见地的闲谈有所期待是进行严厉的自我批评的强大动力,其作用比新年计划更大,更能提升我们在工作和生活中的决策能力。

    一名内科医生要想成为优秀的诊断专家,就必须掌握多种疾病的大量特征,每种疾病都有其病理和症状,有其自身可能出现的发病前兆及病因、病情发展、结果和治疗或干预手段等。学医,当然也包括对医学用语的学习。要想对他人的判断和决策有更深入的了解,就要有更丰富的词汇,日常生活用语中的词汇还远远满足不了这一要求。我们很可能在闲谈中发现人们出错的方式各不相同,而一再出错就会令人印象深刻,而且我们可以预料到这种情况在特定环境中会再次发生。例如,一个潇洒自信的演讲者刚踏上舞台,观众往往就会对其大加赞赏,他可能并没有那么优秀,但这好评如潮的结果在他踏上舞台的一刹那便可预见。这种先入为主的情形是有据可依的,即光环效应,这一效应使我们更容易预测结果,更容易赏识和理解这位演讲者。

    当别人问你正在想什么时,你一般都能回答上来。你觉得自己知道脑子里在想什么,通常就是一种意识自然而然导出另一种来,但这不是大脑工作的唯一方式,也不是其典型的工作方式。大多数印象和想法都是从意识经验中得来的,而人们是感知不到这一过程的。你无从知道自己是如何晓得面前的书桌上有盏灯,无从知道己如何能通过电话听出爱人有些不耐烦,也无从知道自己如何毫无意识地成功规避了一场车祸。印象、直觉、决策,所有这些脑力活动都在无声地进行着。

    本书讨论的很多内容都与直觉的成见相关。然而,对过失的关注并不意味着我们在诋毁人类智慧,这就如同关注疾病并非否定健康一样。大多数人在通常情况下都是身体健康的,他们做出的决策、采取的行动往往也是恰当的。生活中,我们往往跟着印象和感觉走,凭直觉引导行事,而且我们觉得这种直觉和偏好很可靠,这种自信通常也是正当合理的。不过,也不尽然。我们经常在自己出现失误的时候还信心满满,此时,旁观者往往比我们自己更容易发现这些失误。

    因此,我和大家一起在“饮水机旁交谈”,其目的就是:给读者提供更丰富精确的语言来讨论他人乃至自己在判断和决策上的失误,提升发现和理解这些失误的能力。至少有些例子表明,正确的判断能有效地干预错误,以降低错误的判断和决策经常造成的损失。

    关于判断与决策的有趣研究

    本书展现了我对判断和决策的理解,这种理解受到近几十年来心理学领域新发现的影响。然而,本书中心思想的形成还要追溯到1969年那个幸运的日子。当时我在耶路撒冷希伯来大学的心理学系教书,那天有个研讨会,我请我的一位同事阿莫斯•特沃斯基(Amos Tversky)在会上发言。他当时被视为决策研究领域的一颗新星,不过我觉得在其涉足的任何领域中,他都是耀眼的新星,因此我知道我们那天一定会交谈甚欢。很多认识阿莫斯的人都认为,在自己所见过的人中他是最聪明的。他才华横溢,十分健谈,魅力非凡。他有着超强的记忆力,记得很多有趣的笑话。他还拥有一种超常的能力,那就是利用记住的那些笑话阐明自己的观点。有阿莫斯在,你永远也不会感到沉闷。那时,他32岁,我35岁。
    那天,阿莫斯给同学们讲了密歇根大学正在研究的一个项目,这个项目试图回答这样一个问题,即人是否是优秀的直觉型统计者。我们都知道人是优秀的直觉型文法家:4岁的孩子虽然对世界上存在语法这件事完全没有概念,但她在说话时会努力遵循语法规则。人们对统计的基本原则是否也有这种直觉感受呢?阿莫斯指出,研究得出的结论是附条件的肯定(肯定,但是附有一定条件)。我们在研讨会上进行了激烈的讨论,最终认为较为稳妥的结论应当是附条件的否定(否定,但是附有一定条件)。

    阿莫斯和我很喜欢这种交流活动,我们认为直觉型统计者是个很有意思的话题,要是一起探索的话会很有意思。那个周五,我们在里蒙餐馆吃午餐,那里是波西米亚人和耶路撒冷的教授们最中意的去处。我们两人打算对一些经验丰富的研究人员的统计直觉进行一番研究。在此前那场研讨会上我们曾得出结论:人的直觉是有缺陷的。虽然这些年来一直在教书,在运用统计学原理,但我们也没能培养出一种直觉,无法利用这种直觉感知从小样本中观察到的统计结果的可靠性。我们的主观判断是存在成见的:我们特别容易相信在没有足够证据的基础上得出的研究结果,而且研究中对观察样本的收集也不足。我们两人此番研究的目的,就是要看看其他研究人员是否也和我们一样有着同样的苦恼。

    我们准备了一项调查,其中包括一些研究中出现的实际统计问题。阿莫斯收集了数学心理学协会与会的专家小组的回复,包括曾出版两本统计学教科书的几位作者的问卷。不出所料,我们发现那些专家同行也跟我们一样,总是夸大其词,他们认为一个实验的原创性结果可以被成功复制的概率很大,即使用一个小样本也可以做到这一点。关于实验要收集多少观察数据的问题,他们给一个假定的毕业生的建议也很糟糕。如此看来,即使是统计学家,也算不上是出色的直觉型统计者。

    在撰写这些发现时,阿莫斯和我都觉得我们在一起工作是件很享受的事。阿莫斯总是很风趣,有他在的时候,我也变得幽默了,所以我们总会在轻松愉快的气氛中度过几个小时连续不间断的工作时光。工作中的乐趣使我们变得格外有耐心,人在放松惬意的情况下,更容易取得完美的结果。也许最重要的是,我们把批评的态度都抛在门外了吧。我和阿莫斯都是爱挑剔、好辩论的人,甚至比我更甚,但在我们合作的这些年里,我们从没有不假思索地否定对方。事实上,我发现我们在合作时,阿莫斯总能更清楚地看出我模糊的观点中要表达的意思。我们两人中,阿莫斯的逻辑思考能力更强,他的意见总是有据可依,言之凿凿,令人信服。我则凭直觉走,深受心理学的影响,我的很多观点也都是从心理学中得来的。我们俩有很多相似之处,因此很容易理解对方;我们也有很多不同的地方,这些差异常常令对方吃惊。我们重新安排各自的日程,这样就有很多工作日可以在一起工作,工作之余,我们常会一起散步。此后的14年里,共同合作就成了我们生活的中心,对我们两人而言,那些年里所作的研究是我们一生中最精彩的篇章。

    我们很快便形成了固定的工作模式,并且一直多年保持这一模式。我们的研究采用的是对话形式,对话中的问题是我们自拟的,那些凭直觉做出的答案也是经过我们两人共同检验过的。研究中的每个问题都是一个小实验,仅一天中就会做很多实验。我们并没有刻意寻求自己提出的那些统计问题的正确答案,只是想确认和分析直觉的回答 —大脑中最先出现的、即使知道是错的我们也愿意拿来分析的回答。当时,我们认为其他人也会有我们两个人都有的直觉,事实也正是这样。如此说来,直觉对判断的影响便显而易见了。

    我们曾经很高兴地发现,我们俩对几个认识的孩子的未来职业的预想竟如出一辙。我们确信那个3岁大却善辩的孩子将来会做律师,那个有点呆板的孩子可能成为教授,那个体谅他人、循循善诱的孩子可以做个心理咨询师。当然,这些预测都是荒谬的,不过却很有意思。我们都清楚一点,那就是我们对这些孩子的直觉,来自他们自身的特点与特定职业特点的相似度。这种有趣的做法使我们当时就在脑海中创立了一种理论,即预测角色的相似度。此后我们做了许多实验来验证和详细阐述这个理论,下面便是一例。

    在你思考下文中的问题时,请记住史蒂夫是从一个有代表性的样本库中被随机挑选出来的:

    邻居如此描述这个孩子:“史蒂夫非常腼腆,少言寡语,很乐于助人,却对他人或者这个现实世界没有兴趣。他谦恭有礼,做事井井有条,中规中矩,关注细节。”请问史蒂夫更可能从事哪种职业,图书管理员还是农民?

    很显然,史蒂夫的个性和典型的图书管理员有着惊人的相似,但这些与职业密切相关的统计学因素却很少有人关注。你们是否注意到,在美国,农民与图书管理员的比例超过20∶1.由于农民数量要多得多,所以那些“谦恭有礼,做事井井有条”的人也常常只能成为坐在拖拉机上的农民,而不可能是坐在图书馆咨询台后的管理员。但是,我们发现实验对象往往忽略这些相关的统计数据,而仅仅依赖于相似度来作出判断。于是,我们提出如下观点:人们把相似度当成一种简单的启发手段(简单地说就是经验法则)来作艰难的判断。对这种启发性手段的依赖必然会造成其预测带有成见(系统性失误)。

    还有一次,阿莫斯和我想知道我们这所大学的教授们的离婚率是多少。我们注意到这个问题立即勾起了我们脑海中的记忆,我们俩不由想起自己知道或听说的那些离了婚的教授。于是我们就凭着脑海中这些事例对这个离婚率问题作出判断。我们把这种依靠记忆作出判断的方法称为可得性法则。在一项研究中,我们让调查对象回答一个简单的问题,这个问题与指定的一篇英语课文中的单词相关:

    请思考字母 K.

    请问字母 K是更多地出现在单词的首字母位置上还是第三个字母位置上?

    玩拼字游戏的人都知道,想起以某个字母开头的单词要比想起它在第三个字母位置上的单词容易得多。字母表中任何一个字母都适用于此法则。因此我们料到,尽管有些字母(比如K、L、N、R、V)出现在第三个字母位置上的频率更高,但是被调查对象的回答肯定会夸大所有字母出现在单词首字母位置上的频率。这种情形再一次表明,对经验法则的依赖必然会导致人们判断时的成见。例如,我曾一度认为通奸在政客中较普遍,在医生或律师中则没那么多见,但我最近对此产生了怀疑。我甚至曾为原来的那个“事实”作出若干解释,包括权力的催情效果、出门在外受到的诱惑等。而我最终意识到,政客的过错只不过更容易被曝光而已,而医生和律师的过错却少有人报道。我的直觉印象可以完全归咎于记者对主题的选择和我对可得性法则的依赖。

    阿莫斯和我用几年的时间来研究并记录在不同任务中体现的直觉思考所存在的成见,这些任务包括对事件的概率赋值、对未来进行预测、对假设进行评估,以及对频率进行预估等。在合作的第五年,我们撰文将这项研究的主要发现发表在《科学》杂志上,这份杂志的读者包括很多领域的学者。那篇文章(本书的最后附有全文)描述了直觉思考的简单快捷,列出了在启发法中表现出的大约 20种成见,还包括启发法在判定中的作用。

    科学史学家常指出,某一特定领域的学者在任何时候都愿意和他人分享关于本学科的观点。社会科学家也是如此。他们把一切问题都归结为人性,认为大多数关于人类特有行为的讨论都应以此为背景,这一观点几乎从未受到质疑。关于人性,20世纪70年代的社会科学家广泛接纳了两种观点。第一,人大体而言都是理性的,其想法通常也是合理的。第二,恐惧、喜爱和憎恨这样的情感能够为人们失去理智的大部分情形作出解释。我们这篇文章虽然没有直接讨论上述观点,却是对这两种观点的挑战。我们记录下正常人思考时出现的系统性失误,认为这些失误是由认知机制的构造造成的,并非由情感引起的思想腐化导致的。

    这篇文章所受到的关注远远超出了我们的预期,而且它至今仍是社会科学著作中被引用次数最多的文章之一( 2010年有300多篇学术文章参考了这篇文章)。其他学科的学者也觉得这篇文章很有用处,启发法和成见等概念被广泛应用于众多领域中,包括医学诊断、法律判决、情报分析、哲学、金融、统计学和军事战略等。

    例如,学习政策的学生就曾注意到,可得性法则能解释为什么有些事人们记得很清楚,而有的却被遗忘了。人们是根据从记忆中提取信息的容易程度来估测事情的重要程度的,而这往往也与媒体报道的广泛程度有关。常被提到的话题就在脑中变得鲜活,而其他的则会慢慢被遗忘。也就是说,媒体选择报道的内容和人们脑中存在的信息不谋而合,所以专制政体对独立媒体施压的现象也不是偶然的了。因为重大事件和名人很容易引起公众的兴趣,媒体能借此煽动狂潮也就见怪不怪了。例如,在迈克尔 .杰克逊死后的几周里,电视台几乎未报道别的事。相反,媒体对那些带有批评性的、不能引起公众兴趣、掀不起大波澜的事往往很少报道,比如说去年日趋下滑的教育标准,还有医疗资源的投资过剩等。(我在写这篇文章的时候发现自己选择的“很少报道”的例子都是受可得性限制的。我选为例子的话题经常被提到,那些同等重要却不常被提到的事我往往想不到。)

    有一点我们当时并没有充分意识到,即“启发法和成见”这样的心理学概念在其他领域中也具有广泛的启发作用,这便是我们这项研究的一个附带成果:我们总是把为自己和被调查者设计的全部问题都写进文章里,这些问题可以为读者提供范例,使其认识到自己的想法是如何受认知性成见牵绊的。我希望你在读到“史蒂夫是个图书管理员”这样的问题时能有切身的体验,这样能帮助你更好地体会到相似度在引导可能性上的力量,并且能体验到我们多么容易忽略相关事实的统计。

    这些实证材料的使用可为不同领域的学者(主要是哲学家和经济学家)提供一次不寻常的机会,使他们关注自己在思考时可能出现的纰漏。看到自己的纰漏,这些学者才更有可能质疑当时普遍存在的那种武断想法,即人类很理性、很有逻辑性。方法的选择很重要:如果我们只报道传统实验的结果,这篇文章就不会那么令人关注,也不会令人如此难忘了。而且,那些持怀疑态度的读者会将自己的判断失误归咎于参与这些心理学研究的大学生,认为是这些学生一贯不负责任的做法使他们不愿相信实验结果。当然,我们摒弃传统的实验方法,采用事例展示的方式,并非只为影响那些哲学家和经济学家。我们采用这种方法,是因为将事例展示出来更有思。我们很幸运,因为我们选择了正确的方法,其他各方面的选择也做对了。本书重复出现的一个主题就是,幸运在每个成功的事例中都扮演重要角色。我们总能很容易地发现,这个事例中一个小小的改变就会将伟大的成就变得平淡无奇。我们展示的这些事例也不例外。

    对我们研究的反馈也不全是正面的。我们对成见予以关注的做法受到非常多的批评,反对者认为我们过分否定了人类的思维能力。与对常规科学的反应一样,有些研究者对我们的观点加以改进,有些人则另外提出了一些貌似合理的见解,但有一个观点如今是得到普遍认可的,即我们的大脑容易受系统性误差的影响。我们关于判断(能力)的研究对社会科学产生的影响远远超出我们当时的预料。

    研究完判断这一论题后,我们马上将目光转向面对不确定因素时的决策过程。我们的目标是创立一种心理学理论,研究人们在简单的赌博中如何作决定。例如:投硬币时如果是正面朝上你就能得到130美元,背面朝上就输掉100美元,你愿意打这个赌吗?这些简单的选择很久以来一直被用来检验各种与决策相关的问题,例如人们如何在确定的事物和不确定的结果之间进行权衡。我们的研究方法没有变:还是花很多天设计一些选择题,而后分析我们根据直觉进行的选择是否与通过逻辑判断作出的选择一致。在作判断时,我们会观察自己做出决策时出现的系统性成见,还会对一贯违背理性选择规律的直觉性选择进行观察。在《科学》杂志刊出那篇文章5年之后,我们又发表了《前景理论:风险下的决策分析》一文,据统计,该文中提出的决策理论比我们此前对判断的研究更具影响力,该理论也为行为经济学奠定了一定的基础。

    在合作过程中,阿莫斯和我经常交流思想,两个人的智慧总要胜过一个人的想法,良好的关系也使我们的工作有趣且高效,这段时光是我人生中宝贵的财富。后来,我和阿莫斯离得远了,很难继续共同研究这一课题。我们在判断和决策制定方面的研究使我在2002年获得了诺贝尔经济学奖。如果阿莫斯没有于1996年去世(时年59岁)的话,他应该和我一起去领这个奖。

    本书并非为展示我和阿莫斯共同合作的早期研究,过去几年里很多作者已经出色地完成了这项工作。我的主要目标是,在认知心理学和社会心理学最新发展的基础上展示大脑的工作机制,在这些发展中有一些内容比较重要,其中一项就是我们认为瑕瑜互见的直觉思维。

    阿莫斯和我没有对直觉下准确的定义,只简单说明了判断启发法“很有用,但有时也会导致严重的系统性误差”。我们的重点放在成见上,因为在人们的大脑高速运转时研究成见非常有意思,而且成见为启发性判断提供了研究依据。我们没有自问在面对不确定因素时所有的直觉性判断是否都是通过我们研究的启发法而产生的。

    不过现在我们知道事实并非如此。专家们的直觉往往很准确,这种准确性与其说是启发法在发生作用,还不如说是长期实践的结果。我们现在可以描绘一幅更加美好、更加和谐的画面,在这幅画面里,熟练和启发法皆可成为直觉性判断和决策的选择依据。心理学家加里•克莱因(Gary Klein)曾讲过一个故事:一支消防队进入一座房屋,屋子里的厨房着火了。他们刚开始用水管浇厨房,指挥官喊道:“全部撤离!”其实他自己也不知道为什么要这样做。在消防员全部撤离的一刹那,厨房的地板轰然塌陷。事后指挥官才回想自己曾意识到这场火并不大,但他的耳朵特别烤得慌。这些他所谓的“对危险的第六感”闪进他的脑海,虽然不知道哪里不对劲儿,但他知道情况不妙。最后大家才知道这场火灾的火源根本不是厨房,而是消防员脚下的地下室。我们都听过一些关于专家的直觉的故事:比如某位象棋大师路过街边棋局,无须驻足观看就知道“白方三步之内将杀”;又如某位医生只需一瞥便能作出全面的诊断。专家式直觉像谜一样吸引着我们,但它们不是谜。我们每个人每天都会多次表现出很强的直觉能力。大多数人在接电话时听到第一个词就能感知对方是否生气了;刚进门就能发现自己是大家谈论的对象;对细微的信号能迅速做出反应,断定旁边车道上的汽车司机正处于危险中。我们日常的直觉能力并不逊于一位经验丰富的消防员或者医生,只是无处施展罢了。

    魔法不属于准确的直觉心理的范畴。也许对此有最精辟论述的人要数伟大的赫伯特•西蒙(Herbert Simon)了,他对多位象棋大师进行过研究,发现在练习数千个小时之后,这些大师看到的棋盘上的棋子和我们眼里的棋子是不一样的。西蒙写道:“这个棋局已经给了我们提示,根据这个提示我们可以搜寻到大脑存储的信息,而这些信息就能给出答案。直觉只不过是人们的认知而已。”看到这种说法,你也许就能感受到西蒙对神化专家直觉的做法不以为然了。一个两岁的小孩看到一只狗时会说“小狗狗”,这没什么好大惊小怪的,因为我们已经对孩子认识事物并叫出很多事物名字这种“奇迹”习以为常了。西蒙认为灵性的直觉所创造的“奇迹”也是如此,不值得大惊小怪。如果专家在新情境中能察觉熟悉的因素,并且采取十分得体的做法来顺应这种情境,这便是正确的直觉。在喊出“小狗狗”的同时,孩子的大脑中就会出现正确的直觉性判断。

    不幸的是,专业的直觉并非全部是从真实的经验中得来的。很多年前,我采访了一家大型金融公司的首席投资官,他告诉我他刚刚买了福特汽车公司上千万美元的股票。我问他是如何做出这样的决策的,他回答说他刚参加了一个车展,感觉很好。他的解是:“这还用问,他们生产的汽车太霸道了!”他非常明确地说,他相信自己的感觉,他对自己和自己的决定都很满意。我很吃惊地发现,他忽视了一个任何经济学家都会注意到的相关问题,特公司的股票最近不是走低吗?而他反而在跟着自己的直觉行事:他喜欢汽车,喜欢福特公司,也喜欢持有其股票的感觉。按照我们的理解,买入股票要谨慎,这位仁兄恐怕根本不知道自己在做什么。

    关于这位投资官投资福特公司股票的问题,阿莫斯和我所研究的特定启发法恐怕是解释不了了,但现在关于启发法还有一种更宽泛的概念,这种概念能对上述行为作出更好的解释。这一宽泛的概念是一个重大进步,即情感因素在我们对直觉判断和决策的理解上发挥了比以往更大的作用。这位投资官的决策在今天可能会被视为受启发法的影响,而判断和决策是直接受好恶这样的情感所左右的,没有什么思忖和推理可言。

    当碰到像走哪步棋或决定是否投资股票这样的问题时,直觉思维机制就会充分发挥其作用。如果某个人有相关的专业知识,她就能更好地认清情况,头脑中形成的直觉性解决方案也很可能是正确的。象棋大师看到复杂的棋局时大脑会迅速反应:刹那间想到的那几步棋一定是好棋。要是问题很难,一时也想不到巧妙的主意,直觉就可能会发挥作用:脑海里可能马上会有个答案,但这个答案却不一定是原题的答案。这位投资官所面对的问题(我是否要投资福特公司股票)就很难,但更简单且相关的问题(我喜欢福特汽车吗)却很快在他的脑海中形成了答案,并且让他就是否作出投资这个问题也作出了相应的选择。这就是直觉启发法的核心观点:当面对难题时,我们往往会对相对简单的问题进行回答,却忽略了自己已经置换了原始问题这个事实。

    有时,我们无法自然地凭直觉找出问题的解决方案——不论是专业的解决方法还是启发式的答案。在这种情况下,我们往往想要找到一种更慢、更严谨、需要投入更多脑力的思考形式,这就是本书中提到的慢思考。快思考既包括直觉思维的不同形式,比如专家式的和启发式的,也包括感觉和记忆等所有无意识的大脑活动,这些活动会让你知道桌上有盏台灯或者想起俄罗斯首都的名字来。

    在过去的25年里,已经有很多心理学家对快思考和慢思考的区别进行了研究。我用两个因素来描述人的思维活动,即系统1和系统2,在后文中我将对分类原因进行更详细的阐述。系统1和系统2分别产生快思考和慢思考。我认为直觉和严谨思考的特点就像是大脑中两种性格的特征和性情。在近期的研究中,系统1的直觉性作用比我感觉到的还要大,它是做出的决策和判断的幕后主使。本书大部分内容是关于系统1的运作以及系统1和系统2间的相互影响的。

    主要内容

    本书共分为五部分,第一部分讲述的是通过双系统进行判断与做出决策的基本原理。这部分内容详细说明了系统 1的无意识运作和系统2受控制运作的区别,并且说明了系统1的核心,即联想记忆是如何不断对世界上所发生的事作出连贯的解释的。关于直觉性思考的自主且无意识过程的复杂性和丰富程度,以及这些自主过程如何能解释判断的启发法等问题,我试图说出自己的见解,目的是要引入一套用于思考和表达思想的语言。
    第二部分对判断启发法的研究作了更新,还探索了一个难题,即为什么很难具备统计型思维。我们思考时总是会把多种事情联系起来,会将一件事情比喻成另一件,会突然想起一件事来,但统计学要求同一时间把多件事情串联起来,而这一点系统1是做不到的。
    本书第三部分描述了我们大脑有说不清楚的局限:我们对自己认为熟知的事物确信不疑,我们显然无法了解自己的无知程度,无法确切了解自己所生活的这个世界的不确定性。我们总是高估自己对世界的了解,却低估了事件中存在的偶然性。当我们回顾以往时,由于后见之明,对有些事会产生虚幻的确定感,因此我们变得过于自信。我对这个问题的看法受《黑天鹅》(The Black Swan)的作者纳西姆·塔勒布( Nassim Taleb)的影响。我希望我这“饮水机旁的闲谈”能明智地借鉴以往经验, 同时抵制后见之明和虚幻的确定之感的诱惑。
    第四部分的重点是在决策制定的性质和经济因素为理性的前提下讨论经济的原则。1979年,阿莫斯和我发表了关于前景理论的决策模式,此部分在双系统下对前景理论的重要概念提出了新的看法。余下的几章讲的是人们从理性角度出发做出决策的几种方式。可悲的是,人们总是孤立地看待问题,表现出框架效应,即决策的制定往往因为对所回答问题不合逻辑的选择而受到影响。系统1的特征完全能解释这些观察结果,这对标准经济学所倾向的理性假设发起了很大的挑战。
    第五部分是近期研究中关于两个自我的区别性描述,即经验自我和记忆自我,两者间没有共性。例如,我们可以让人们体验两种痛苦。其中一种比另一种要更痛苦,因为体验的时间更长。系统1有一大特点,即记忆的自主形成是有其原则的,如此一来,较为痛苦的那段体验会留下更深刻的记忆。所以,此后当人们选择要回想哪段经历时,他们自然会受记忆自我的引导,将其自身(即经验自我)处于不必要的痛苦中。两种自我间的区别被用来测试人的幸福感,而我们发现使经验自我快乐的事不一定会让记忆自我满足。两种自我同时存在的个体要如何去追求幸福,这一问题引起了把居民的幸福看做政策目标的个人和社会的众多思考。

    最后的章节是按倒叙来探索本书所述的三个区别的:经验自我和记忆自我的区别,古典经济学和和行为经济学(从心理学借鉴而来)的区别,以及自主的系统1和需费脑力的系统2的区别。书中还谈及了有价值的闲谈的好处,以及哪些内容有助于提升判断和自行决策的效能。

    在最后,我附上了我和阿莫斯一起写的两篇文章,第一篇是我早期写的关于在面对不确定性因素时作出判断的评论。第二篇发表于1984年,总结了前景理论和我们关于框架效应的研究成果。文章中有被诺贝尔委员会引用的投稿,你可能会惊讶地发现这些投稿是多么简单。读这些能让你明白我们早期的知识有多少,也能让你知道我们这几十年来的进步有多大。

    第一部分 系统1,系统2

    第1章 一张愤怒的脸和一道乘法题

    想要观察你在自动模式下的大脑活动,请看图1.

    图1

    审视这位女性的脸时,你正在很自然地将我们平时所说的观察和直觉思考结合在一起。你可以确定且迅速地判断这位年轻女性的头发是黑色的,你还知道她正在生气。此外,你还可以根据自己的观察对其行为进行推测。你感觉到这位女性正要说一些刻薄话,也许声音又大又刺耳。推测被观察对象即将做出的举动并不难,这种活动是无意识的,而且毫不费力。你并非有意评论她的情绪或是推测她可能要做的事,你对这张照片的反应跟你做过的事情没有丝毫关系,一切都是自然而然发生的。这就是快思考的一个例子。

    现在,请看下面的问题:

    17×24

    你能立刻知道这是一道乘法题,也许你还会想到若有纸笔,就能算出答案。你还会对答案的大体范围有个模糊的直观认识,能很快知道12 609和123不可能是答案。但如果不花点时间来计算的话,你就无法确定568不是正确答案。由于想不出一个准确的答案,你认为自己得想想是不是要做这道题。如果你还没有做这道题的话,就该试着做一做,哪怕完成其中的一部分也好。

    按部就班的运算过程便是慢思考。首先,你会从记忆中重新提取读书时所学的乘法相关知识,然后加以运用。这个过程不容易,你得记住很多内容,你要知道自己算到哪一步了,知道下一步该怎样做,同时还要记住已得到的结果。这个计算过程是脑力工作,需要刻意、努力并且有序地进行——这也是慢思考的一个特征。这种计算不仅是大脑活动,身体也会参与其中,在计算时你的肌肉会紧张,血压会上升,心跳会加速。若在你解决这个问题时,有人在近处看你的眼睛,他会发现你的瞳孔也会扩大。结束计算时——得出正确答案(顺便提一下,答案是408)或是放弃计算都被视为结束计算——你的瞳孔便会恢复到正常大小。

    行为与注意力

    近几十年来,许多心理学家对人的两种思维模式一直保持着浓厚的兴趣,这两种思维模式是由一张愤怒女性的照片和一道乘法题所引发的,他们还指出了两种模式的许多特征。这里我且采用由心理学家基思·斯坦诺维奇(Keith Stanovich)和理查德·韦斯特(Richard West)率先提出的术语,用以说明大脑中的两套系统,即系统1和系统2.

    ·系统1的运行是无意识且快速的,不怎么费脑力,没有感觉,完全处于自主控制状态。

    ·系统2将注意力转移到需要费脑力的大脑活动上来,例如复杂的运算。系统2的运行通常与行为、选择和专注等主观体验相关联。系统1和系统2的定义广泛应用于心理学领域,但我在本书中所作的阐释更加深入,读者可将此书视为有两个人物的心理剧。

    我们在审视自己时,往往更容易采用系统2,认为自己头脑清醒,富有逻辑,抱有信仰,善作抉择,能够决定自己想要什么和该做些什么。尽管系统2的运行体现在行动中,但自主运行的系统1才是本书的重点。我将系统1描述成自主而初始的印象和感觉,这种印象和感觉是系统2中明确信念的主要来源,也是经过深思熟虑后作出抉择的主要依据。系统1的自主运作诱发了极其复杂的理念模式,但只有相对缓慢的系统2才能按部就班地构建想法。我还描述了继而发生的系统2的环境条件,在此条件下,系统1中随性的冲动及其诱发的联想都会受到抑制。读过此书后,你会觉得这两种系统各有千秋,各司其职。

    依据复杂性进行粗略预估,试举以下系统1引发的自主行为的例子:

    ·确定两件物品孰远孰近。

    ·确定突然出现的声源。

    ·将短语“面包和……”补充完整。 

    ·看到恐怖画面后做出厌恶的表情。

    ·察觉语气中的不友善。

    ·回答2+2=?

    ·读大型广告牌上的字。

    ·在空旷的道路上驾车行驶。

    ·下象棋时看出一步好棋(前提是你是位象棋大师)。

    ·理解简单的句子。

    ·听到“畏首畏尾,追求完美”的说法时,知道其意指古板的员工。

    上述所有思维活动都和那位愤怒的女性相关——这些活动都是自主发生且毫不费力的。系统1的诸多能力当中包括一些与生俱来的能力,这些能力与其他动物的本能一样。我们生来就能感知周围的世界,能够认识事物,可以集中注意力,会规避风险,会害怕蜘蛛,思维时快时慢。大脑的其他思维活动也因长期的训练而变得快速自主。系统1除了能将我们已有的知识(比如法国的首都是哪里)联系起来之外,还能使我们掌握一些技能,比如看出并理解一些社交场合的细微差别。有些技能只有专家才能掌握,比如象棋中出奇制胜的那几招;而其他的技能,普通人都能掌握。例如,要想看出刻板员工的个性有哪些相似之处,还需要我们掌握大量的语言及文化知识,而大多数人都具备这些知识,这些知识就储存在我们的记忆中,不必刻意也无须努力便可随意存取。

    以上列出的大脑活动是完全无意识的。你不必刻意学习便可领会一些母语中的简单句子;听到突然的一声响后会自发地确定声源;看到“2+2”就知道等于4;提到法国的首都时会不由自主地想到巴黎。其他一些行为可能会受到大脑的控制,比如咀嚼的动作,但大体上还是无意识的。系统1和系统2这两个系统都对注意力有控制作用。确定声源位置通常是在系统1控制下的无意识活动,随后系统2会立即被激发,产生有意识的注意力。拥挤的派对上,你也许会对大声而无礼的谈话置之不理,不过,即使你的头没转过去,你的注意力也已经转移过去了,哪怕只有一会儿。但是,要想将注意力从不想关注的对象上转移开来也容易,去关注另一个目标即可。

    系统2的运作是高度多样化的,但所有这些运作方式都有一个共同特征:所有运作都需要集中注意力,如若注意力分散,运作也会随之中断。以下是一些例子:

    ·赛跑时随时作好起跑准备。

    ·关注马戏团里的小丑。

    ·在一间嘈杂、拥挤的屋子里关注某个人的声音。

    ·寻找某位白头发的妇女。

    ·搜寻大脑记忆,判定声音是否表达惊喜。

    ·保持比平常快的步行速度。

    ·观察自己在社交场合的做法是否得体。

    ·数出文章中某页字母a的出现次数。

    ·告诉某人你的电话号码。

    ·在狭小的空间里停车(除车库管理员外,大多数人停车的车位都很狭窄)。

    ·比较两款洗衣机的总体功效。

    ·填纳税申报表。

    ·检验一个复杂的逻辑论证的有效性。

    在上述各种场景中,你都必须集中注意力。若是没有准备好或者没有将注意力集中到正在做的事情上,你的表现就会差强人意,甚至是一塌糊涂。系统2具有某些改变系统1运作方式的能力,通过控制注意力和记忆力的一般自主运行功能的方法可以实现这些改变。例如,在繁忙的火车站等亲戚时,你若是刻意去找某位头发花白的妇女或是长着胡子的人,即使隔着一段距离你也很可能发现自己的亲戚;你也可以在记忆中搜寻哪些国家的首都是以字母N开头的,或者法国有哪些存在主义小说;而当你在伦敦希斯罗机场租车时,地勤人员很有可能会提醒你“在我们国家是右驾左行”。

    在上述所有事例中,没有哪件事情是水到渠成的,你会发现始终如一地保持某种状态需要付出持之以恒的努力,至少要一直耗费精力。

    “注意力要集中”,这个耳熟能详的短语是很有道理的,如果你将原本应分配给某些活动的注意力分散开来,如果分散掉的注意力有限,还可以接受;但是如果你想透支你的注意力,将其过度分散到其他事情上,结果就会失败。这证明了有些费脑力的活动会相互影响,也说明了为什么同时进行几项活动很难,甚至是不可能的。就如同你不能一边向左转入路线复杂的道路,一边计算“17×24”这道乘法题的结果一样,两者无法兼做。当然了,最好还是不要尝试。你可以同时做几件事情,但前提是这些事简单易懂,你可以在空旷的高速公路上一边开车一边和别人交谈而不出事故。有些家长可能会感到有些愧疚,因为他们在给孩子读故事时,脑子里还在想别的事。

    每个人都能多多少少地意识到注意力是有限的,在社会生活中我们也会为此作出妥协。例如,当司机正在一条匝道上赶超一辆卡车时,车上的成年乘客会明智地停止与司机攀谈,因为他们清楚地知道,在这个时候让司机分心并不是什么好事,而且他们会认为司机此时会屏蔽掉别人的话语,仿佛暂时性失聪一般。

    当人们太过专注于某件事时,就会屏蔽掉其他事情,即使是平时很感兴趣的事也不例外。在《看不见的大猩猩》(The Invisible Gorilla)一书中,克里斯托弗 ·查布里斯(Christopher Chabris)和丹尼尔 ·西蒙斯(Daniel Simons)两位作者为我们提供了一个最具戏剧性的证明。他们设计了一部两队传篮球的短片,其中一队穿的是白色球衣,另一队穿的是黑色球衣。观看短片的人需要数出白衣球队的传球次数,忽略掉另一队传的球。这个任务比较困难,需要完全投入才行。短片播到一半时,一个套着大猩猩服装的女人出现了,她穿过球场,捶着胸,然后继续走动。这只“猩猩”出现了9秒钟。上万人看了这部短片,其中约有一半人并未注意到有什么异。之所以这样,是因为这个计数任务——尤其是那个忽略黑衣球队的要求——造成了这种屏蔽。若没有那项任务,所有观看短片的人都会注意到那只“猩猩”。观看和定位是系统1的自动功能,但在执行时需要将一些注意力分配给相关的刺激物。该书的两位作者提到,在这项研究中,最值得注意的是人们在知道结果后的吃惊反应。那些没有看到“猩猩”的观众刚开始就确信场上没有“猩猩”——他们很难想象自己会错过这件吸引人眼球的事。这个关于“猩猩”的研究阐述了与我们大脑相关的两个重要事实:我们会忽视显而易见的事,也会忽视自己屏蔽了这些事的事实。

    系统1遇到麻烦,系统2会出面解决

    本书紧扣两个系统相互作用这一主题,其内容与结构简洁明了。在书中我将指出,当我们醒着时,系统1和系统2都处于活跃状态。系统1是自主运行,而系统2则通常处于不费力的放松状态,运行时只有部分能力参与。系统1不断为系统2提供印象、直觉、意向和感觉等信息。如果系统2接收了这些信息,则会将印象、直觉等转变为信念,将冲动转化为自主行为。通常情况下,一切都会顺利进行,系统2会稍微调整或是毫无保留地接受系统1的建议。因此,你一般会相信自己的最初印象,并依自己的想法行动。通常情况下,这样也挺好的。

    当系统1的运行遇到阻碍时,便会向系统2寻求支持,请求系统2给出更为详细和明确的处理方式来解决当前问题。系统2在系统1无法提供问题答案时,就会被激活,这好比你碰到了“17×24”这样的乘法题,系统1无法给出答案,系统2便被激活来解决问题。当你遇到令人吃惊的事情时,同样会感到自己有意识的那部分注意力会瞬间激增。另外,在系统1所设定的世界里,电灯不会跳,猫不会像狗一样汪汪叫,“猩猩”也不会穿过篮球场。如若事物违反了系统1所设定的关于世界的模式,系统2同样会被激活。

    “猩猩”的实验表明,想要察觉到令人惊讶的刺激物,就要对其予以关注。然后,那种惊讶会激发并引导你的注意力:你会将目光集中在令你瞠目的对象身上,并在记忆中搜寻此事令人惊讶的原因。系统2还会起到持续监督你自身行为的作用——有了它,你在生气时也能保持应有的礼节;有了它,你在夜晚开车时也能保持警惕。

    当你就要犯错时,系统2就会受到刺激,加速运作。回想一下,在冒犯别人的话即将脱口而出时,想把话咽回去是多么困难。总的来说,你(或你的系统2)所想所做的大多数事情都是由系统1引起的,但当事情变得困难时,系统2便会接手难题,系统2出马,所有事情都会迎刃而解。

    系统1和系统2的分工是非常高效的:代价最小,效果最好。通常情况下,这种分工很有效,因为系统1很善于完成自己的本职工作:它在熟悉情境中采取的模式是精确的,所作出的短期预测是准确的,遇到挑战时做出的第一反应也是迅速且基本恰当的。然而,系统1存在成见,在很多特定的情况下,这一系统易犯系统性错误。

    你会发现这个系统有时候会将原本较难的问题作简单化处理,对于逻辑学和统计学问题,它几乎一无所知。系统1还有一个更大的局限,即我们无法关闭它。如果看到屏幕上显示一个你认识的单词,你就能读出这个词—除非你的心思完全不在它上面。

    冲突与自我控制

    图2是由一个经典的实验演变而来的,说明了两个系统之间的冲突。你可以先试着做做下面这个练习,然后再接着往下读。

    你的第一个任务是先浏览一下下面这些文字,说出哪些字较小,哪些字较大。完成第一个任务后,再看一遍这些字,说出每一个字的位置。如若字的位置偏左,则说(默默自语)“左”;如若字的位置偏右,则说“右”。

    图2

    图2在这两个任务中,你几乎可以正确无误地读出所有字,并且还会发现,两项任务中各有一部分要求比其他要求简单些。当你确认字的大小时,会发现左边一栏相对简单,而在指出右边一栏的字号大小时,速度则会变慢,甚至还会出现不确定的情形。而当你确定单词位置时,确定左边一栏时比较困难,右边一栏相对简单些。

    这些任务都需要系统2的参与,因为读出“高 /低”或是“左 /右”和平时由上到下看一列字根本就是两回事。要完成这项任务,你所做的事情中要包括为记忆编程,使相关的字(例如第一个任务中的高和低)能够“脱口而出”。浏览右边一栏文字的时候,你能很快读出该任务所选文字,不大可能将其读成其他文字。但左边一栏文字却有所不同,因为其中所包含的文字与任务所设定的要求是重叠的。你无法忽略掉这样的干扰。通常情况下,你能做出正确的回应,但战胜脑中两种相互冲突的反应会给你造成压力,使你的速度减缓。这便如同经历了一场斗争,斗争双方分别是你打算完成的任务和影响任务完成的自主反应。自主反应和控制这种反应的意图之间存在冲突,这种冲突在生活中极为普遍。我们差不多都有过这样的经历:在餐厅里,自己的邻座是一对穿着怪异的夫妻,但我们会尽量不去盯着他们看。我们也清楚,如果看书时老是重读不知所云的内容,这就说明我们在强迫自己去读一本无聊的书。在冬季严寒的地区,许多司机都有着这样的记忆:当他们的车在冰上滑行失去控制时,他们必须放弃平时的做法,竭力去按照已反复演练过的指示进行操作:“如果车打滑,做什么都行,就是别踩刹车!”另外,每一个人都有强忍着不诅咒别人去死的经历。系统2的众多任务中就包括抑制系统1产生的这些冲动。换句话说,系统2负责人们的自我控制。

    看上去不等长实际上等长的两条线

    为了理解系统1的自主性以及印象和信念的区别,请你仔细看看图 3。

    图3

    这幅图没有什么特别之处:两条不同长度的水平线,两端有朝向不同方向的箭头,并且下面一条线明显比上面那条线长。这是我们看到的所有内容,而且我们肯定相信自己的眼睛。但是,如果你曾经见过这幅图,就会认出这便是那幅著名的缪勒 –莱耶错觉图,要证实这一错觉很简单,只需要找把尺子量一量,你就会发现其实两条水平线是等长的。

    既然测量了这两条线的长度,你——你的系统2,即你称为“自我”的意识体—就会有一个新的信念:你知道这两条线是等长的。当被问及它们的长度时,你也会如实说。然而,你肉眼所见的依然是下面那条线比较长。你选择相信测量的结果,但无法控制住系统1带给你的直观感受,即使你知道这两条线长度相同,但是仍然无法把它们视为等长的线。想要消除这种错觉,唯一能做的就是当你再看到两条平行线,并且线的两端有朝向不同方向的箭头时,必须学会怀疑自己的感觉。要贯彻这一规则,你必须具备识别这种错觉模式的能力,能够回忆起你所了解的相关知识。如果可以做到这一点,你就再也不会掉入缪勒 –莱耶错觉的陷阱了。但是,你眼中所见的两条线肯定还是一条长一条短。

    不是所有错觉都是视觉上的,还有思维方面的,我们将其称为认知错觉。我读研究生的时候,选修了一些与心理疗法的艺术及科学相关的课程。记得有一次上课时,老师跟我们分享了一些坐诊艺术。他告诉我们:“有时,你会碰到一两个这样的病人—他会像说故事一样,讲述自己以前遭遇的误诊,这些诊断五花八门,让人担心。他看过几个临床医生,但都没多大效果。这个病人还能清楚地描述医生是如何误解他的,但他很快就观察到,你和其他医生是不一样的,你能感同身受,充分理解他,并可以为他提供帮助。”此时,我的老师提高了音量,继续讲道:“千万别有接收这个病人的想法!将他赶走!他很有可能是位精神病患者,而且你也帮不了他。”

    多年以后,我才知道那位老师当时是在提醒我们,要提防病态的假象。精神病研究领域的权威也证实了我们那位老师所给的建议是合理的。这与缪勒–莱耶错觉类似。没人教过我们如何体会患者的心情。所以我们的老师断言,我们对那位患者的同情心是不由自主的,这种同情心可能源自系统1.此外,也没有人教过我们不要总是相信自己对患者的感情。有人告诉我们,过多关注一个有数次治疗失败经历的病人是一种危险的信号—正如平行线两端的箭头一样,会让人产生错觉。这是一种认知错觉。我的老师教过我(系统2)如何识别这种错觉,也曾告诉我切莫相信这种感觉,更不要依照感觉行事。

    提到认知错觉,最常被问及的问题就是能否避免这种错觉。上述各例传达的信息不容乐观。因为系统1是自主运行的,我们无法随意使其停止,因此直观思维所导致的错误常常难以避免。我们不可能一直没有成见,因为系统2可能对系统1产生的错误毫无所知。即使对可能发生的错误有所察觉,也需要系统2进行强有力的调控和积极的运作才有可能避免。然而,作为一种生活方式,时刻保持警觉性并不是一件好事,想要这样做也并不实际。总是质疑自己的想法会使我们的生活非常枯燥乏味,因为系统2在代替系统1进行日常抉择时总是耗时很长且非常低效。最好的解决办法就是妥协:学会区别常会出现重大错误的情境,在风险很高的时候,尽力避免这些错误。前文中曾提到过,发现别人的错误总比发现自己的错误更容易。

    两个虚拟出来的角色

    你可以将上述两个系统想象为大脑内部的两个人,他们有着各自不同的特征、能力和局限性。在书中我常会将这两个系统当做一些句子的主语,例如“系统2统计产品数量”。

    在我所在的职业圈子中,使用这样的语言被视为一种过错,因为这种说法貌似通过一个人头脑中那两个小人的思维和行为去解释这个人的思维和行为。从语法上讲,这个关于系统2的句子与“管家监守自盗”的句型类似。我的同事指出,管家的行为实际上就解释了现金的丢失原因,由此他们也很怀疑关于系统2的那个句子同样解释了算错产品数量的原因。我的回答是,这个短小的主动句认为统计是系统2所为,而且这个句子是一种描述而不是一种解释。这样的描述只有在你已经对系统2有一定的了解后才有意义。看看下面这段让人纠结的话吧:“心算是一个需要作出努力的自主活动,人在心算时总会瞳孔放大,心跳加速,因此你绝对不能一边开车左转,一边心算得出结果。”

    同样,“通常情况下,在高速路上行驶的任务要留给系统1来完成”这句话说明驾驶这辆车转弯是自主行为,不用费脑力,也意味着一个驾车新手能够一边与别人攀谈,一边轻松地在空旷的高速路上行驶。最后,“系统2防止了詹姆士因为受到侮辱而做出愚蠢的举动”这句话则表明,如果其努力自控的行为受到干扰(比如他喝醉了),詹姆士就应该会有过分的举动。

    尽管系统1和系统2是本书的主题,但我必须要澄清一个事实,即两个系统并不是真实存在的,它们只是我杜撰出来的角色。系统1和系统2不是标准意义上的实体,没有错综复杂的组成部分,也不是大脑中某个固定的部位。你有可能会问:为什么要在如此严谨的一本书中引进两个名字并不漂亮的虚拟角色呢?答案很简单,这两个角色很重要,因为我们每个人都会有些奇特的想法无法解释。一个句子若是讲一个客体(系统2)做什么,则要比对这个客体及其特征进行描述更容易理解。换句话说,“系统2”比“心算”更适合当句子的主语。我们的大脑,特别是系统1,似乎拥有一些特别的能力,能够构想和领会施动者的故事。这些施动者有其特有的特征、习惯和能力。你很快就会对那个监守自盗的男管家产生坏印象,认为他还会继续偷盗,

    而且你暂时无法忘掉这个人。这也是我对这两个系统语言所寄予的希望。

    为什么将两个系统命名为系统1和系统2,而不是“自主系统”和“耗力系统”呢?原因很简单:说出“自主系统”比说出“系统1”所需的时间长,因此会占用更多大脑工作记忆(短时记忆)的空间。这一点很重要,因为任何事物占用了大脑的工作记忆,都会削弱你的思考能力。你可以将“系统1”和“系统2”当做昵称,就像鲍勃和乔一样,用这种拟人的方式去了解整本书中出现的各种角色。有了这两个虚拟的系统,我便能更从容地思考有关判断与决策的问题,而你也能更轻松地读懂我的文字。

    示例—系统1和系统2“他有印象,只是其中一部分是幻象。”“这纯粹是系统1的反应,她在意识到危险之前就果断采取了行动。”“这是你系统1的想法,放慢速度,听听系统2的看法吧。”第2章 电影的主角与配角

    虽说不太可能,但假设本书真的被拍成电影的话,自视为主角的系统2一定只能做个配角。在这个故事中,系统2的典型特征表现在其各项活动都需要努力,但其自身却很懒惰,除了必需的努力外,它不愿多付出,哪怕是一点点。因此,虽然系统2认为是自己选择了人们的想法和行为,可实际上,这些选择都是在系统1的引导下完成的,系统1才是这个故事的真正主角。然而,一些至关重要的任务却只有系统2才能执行,因为这些任务需要付出努力和控制自我,由此方可抑制系统1产生的直觉和冲动。

    瞳孔是人类思维活动的灵敏指示器

    如果想让你的系统2全力运转,你可以做做下面的练习。这个练习会让你在5秒钟之内达到认知能力的极限。首先,编一串不同的4位数数字,并将这些数字写在一张索引卡上。然后,在桌上放一张空白的卡片。你即将要执行的任务叫做加1,以下是其具体做法:

    敲打出稳定的节奏(最好是有一个节拍器,并将其设定为一秒一拍)。移动空白卡纸,大声读出数字。然后等待两个节拍,说出一个新的数字(这个数字是将原来那个数字的每一位都加1得来的)。例如:卡片上的数字是5294,新的数字就应该是6305。另外,跟上节奏很重要。

    很少有人在加1任务中能胜任超过4位数的数字,但如果你想挑战一下自己,可以尝试一下加3的任务。

    如果想知道大脑在快速运转时身体正在干些什么的话,你可以这样做:在书桌上堆两摞书,将你的下巴放在其中一摞上,将一台摄像机放在另一摞上。打开摄像机,在你做加1或加3任务时,盯着摄像机的镜头看。然后,你可以通过摄像机真实的记录发现,你的瞳孔大小会随着你的努力程度而变化。

    很久以前,我就开始练习加1任务了。在我职业生涯的早期,作为研究催眠实验的访问学者,我在密歇根大学待了一年。在寻找有意义的研究课题时,我在《科学美国人》(Scientific American)杂志中看到了心理学家埃克哈特·赫斯(Eckhard Hess)的一篇文章。该文章指出,瞳孔是人类心灵的窗户。最近,我又读了一遍这篇文章,备受启发。赫斯在文章的开头说道,他的妻子注意到当他在观赏美丽的风景图片时,瞳孔会扩大。文章结束处有两张吸引人的照片,照片是同一个漂亮女人,但其中一张照片中的她显得比另一张中的更加漂亮。造成这种不同的唯一原因是:在更漂亮的那张照片中,女人的瞳孔比较大,而另一张的瞳孔比较小。赫斯在文章中还提到了颠茄(belladona)—一种使人瞳孔变大的物质,曾作美瞳之用。作者还提到,一些常去赶集的人常常戴着墨镜,因为这样就能隐藏自己对商品的兴趣了。

    赫斯的一个发现让我特别感兴趣。他发现瞳孔就像是大脑运转情况的灵敏指示器—它们在人们进行乘法运算时会扩散,在人们解决更为困难的问题时扩散得更大。他的观察还表明,对脑力工作的回应与唤起情感是不同的。赫斯的这篇文章与催眠关系不大,但我认为,“大脑活动是可以看见的”这一想法是个值得研究的课题。杰克逊·比提(Jackson Beatty)是实验室里的一个研究生,他对这个课题同样很感兴趣。于是,我们一起展开了研究。

    比提和我设计了一个类似于验光仪器的装置,受试者可将头倚在可固定住下巴和前额的支架上,然后一边盯着镜头,一边听事先录好的问题,并跟着节拍器的节拍回答这些问题。每一个节拍都会触发红外闪光拍照。在每期实验结束时,我们都会很快把照片冲洗出来,并将它们投影到屏幕上,然后用尺子测量瞳孔大小。这种方法对年轻人和没有耐心的研究者而言都很适用:我们能很快知道实验的结果,而且这些结果总能说明一些问题。

    比提和我很关注有节奏的任务,例如在加1任务中,我们能准确地了解受试者每时每刻的大脑活动。我们记录了跟着节拍器说出的一串数字,并指示受试者在保持节奏的情况下,逐一重复或是转换这些数字。我们很快发现,瞳孔的大小会逐秒发生变化,这也就反映了任务的难度在不断变化。瞳孔随时间变化的曲线图最后呈倒V字形。如果去做加1和加3任务,你会发现每听到一个新数字,任务难度就会加大一些,最后达到一个几乎令人难以接受的极限。那时,你会在节拍中或停顿时极快地说出转换后的数字,这就相当于“释放”了自己的短时记忆,然后,你才渐渐感到放松了一些。瞳孔大小的数据与受试者的体验非常吻合:数字位数越多,瞳孔扩散得越大;任务的难度与付出的努力相符合;瞳孔扩散到最大的时候也正是付出努力最多的时候。与立刻重复一个7位数相比,4位数的加1任务会使瞳孔扩散得更大。加3任务则更为困难,这项任务是我所观察到的要求最高的任务。仅仅在前5秒钟,瞳孔就扩散了50%,心跳每分钟增加了7拍。这是一个人能达到的最大工作极限—如果超过这个极限,人们就会自动放弃。当我们给实验受试者的数字超过他们所能承受的范围时,他们的瞳孔就会停止扩散或是收缩。

    我们在宽敞的地下室套间里工作了几个月,套间里有相关闭路系统,可以将受试者的瞳孔投影在走廊的屏幕上;我们同时还可以听到实验室里的情况。投射出来的瞳孔直径大约是一英尺;观察受试者工作时的瞳孔变化是件非常有趣的事,引得那些来我们实验室参观的人纷纷驻足。我们预测受试者何时会放弃任务,自娱的同时也给参观者留下了深刻的印象。在心算一道乘法题时,受试者的瞳孔会在几秒之内变大并保持那样的大小,直到她算出答案或是放弃。我们在走廊里观察这些瞳孔时,时常会让受试者和参观者感到惊讶。我们会问受试者:“为什么你刚才停下来了呢?”

    实验室里的人经常会问:“你是怎么知道的?”我们回答:“因为我们看见了你心灵的窗户。”

    我们在走廊里随意的观察有时和正式的实验一样能说明问题。在两个任务的间隙,我随意看了一下某位女性的瞳孔。她把头放在了装置上,所以当她与实验人员进行例行谈话时,我能够观察到她的瞳孔变化。我惊讶地发现,她的瞳孔并没有伴随谈话和倾听而发生明显的扩散或收缩。与我们研究的任务不同的是,平常的谈话明显只需要一点努力或是完全不费力—不会比记住两位或三位数需要的精力多。这是灵感迸发的时刻:我意识到我们选择研究的任务全都是需要付出特别多努力的。我的脑中闪现一个想法:我们大脑的生活步调(现在我爱用系统2的生活步调来代替)大多像是在悠闲地散步,有时候会变成慢跑,只有在极少数的情况下,才会如短跑冲刺。

    执行加1和加3任务时,大脑就像是在短跑冲刺;而平时随意的聊天,大脑就如同在漫步。

    我们发现,如果人的大脑正处于冲刺的状态,就有可能(对次要信息)产生有效的屏蔽。前文提到的《看不见的大猩猩》一书的作者就是通过让观察者持续专注于数传球次数而对那只“猩猩”视而不见的。我们通过加1任务提供了一个不那么夸张的例子。当受试者在执行加1任务时,我们会给他们看一串快速闪过的字母。我们要求受试者对加1的数字任务给予充分的重视,但是在这个任务即将结束时,他们也需要说出字母K是否在整个实验中出现过。这个实验的主要发现是,人们锁定和报告指定字母的能力在执行任务的10秒钟内发生了变化。如果字母K出现在加1任务的开始或结尾,几乎所有观察者都不会错过,但如果字母K出现在大脑活动最为频繁的中间时段,就算彼时他们正睁大眼直直地盯着这个字母,也会生生错过它。没能发现字母K的线形图与瞳孔大小变化所呈现的倒V形是一致的,这种一致性再次证明:瞳孔是衡量与思维活动形影不离的生理刺激的标尺,我们可以通过瞳孔了解大脑的运行状况。

    就像是你家或公寓外安装的电表一样,瞳孔提供了一个关于你大脑使用率的参数。这个类比还可以有更深入的解释。你的用电量取决于你用电来做什么,是开灯还是烤面包。当你打开电灯或是烤面包机时,你就会获得所需要的电量。同样,我们也能决定自己要做什么,但做成这件事得花多少精力我们就说不准了。假设你见到一个4位数,比如9462,然后被告知,你的性命就取决于是否能在10秒内记住这个数字。无论你多想活下去,付出的努力也不会比用同样数字执行加3任务时付出的多。

    系统2和你家里的电表能力都有限,但它们对超负荷的负载反应不同。当用电超负荷时,断路器会跳闸,致使那条线路上的所有电器都断电。相反,如果大脑的使用超负荷,其处理则是有选择性且精确的:系统2会偏向最重要的活动,因此这个活动会得到其所需的注意力,其他“多出来的”注意力再慢慢被分配到其他任务中去。

    我们所做的猩猩实验要求受试者更加关注数字任务。我们确信他们按要求完成了任务,因为可视目标(指“猩猩”)出现的时候并没有对主要任务造成影响。如果那个关键字母K是在大脑活动量最大的时刻闪现的,受试者往往会将其屏蔽掉。而当数字转换任务要求并不那么高时,受试者就更有可能觉察到这个字母。

    注意力这种精细的分配是在大脑漫长的进化过程中形成的。快速判断最严重的困难或者快速锁定最佳时机并做出迅速反应能提高生存概率。当然,这种能力并不专属于人类。即使在现代人中,系统1也会承担起应对突发情况的任务,完成自我保护的最高使命。试想在开车时,车意外地滑到了一大片油区,你会发现,在充分意识到这一点之前,你就已经采取了躲避危险的行为。

    比提和我在一起工作的时间只有一年,但我们的合作对于各自今后的职业生涯都产生了很大的影响。他最终成为“认知瞳孔测量法”的权威,而我则写了《注意与努力》(Attention and Effort)一书。这本书在很大程度上是以我们此前的共同研究为基础而写的,与我后来在哈佛大学所作的后续研究也密不可分。通过类型多样的任务来测量瞳孔大小,我们知道了许多关于大脑工作的知识(现在我都把工作中的大脑视为系统2)。

    当你对执行一个任务越来越熟练时,需要付出的努力程度就会降低。对大脑的各项研究证明,与行动相关的活动模式会随着熟练程度的加强而变化,一些大脑区域将不再参与其中。天才也是如此。通过观察瞳孔变化和大脑活动,我们发现高智商的人往往需要较少的努力便可解决同样的问题。普遍的“最省力法则”不仅适用于体力活儿,还适用于我们的认知行为。这个法则主张,如果达成同一个目标的方法有多种,人们往往会选择最简单的那一种。在经济行为中,付出就是成本,学习技能是为了追求利益和成本的平衡。因为懒惰是人类的本性。

    我们研究的这些任务对瞳孔变化的影响差别很大。从基本水平来看,我们的受试者都是清醒的、有意识的,并时刻准备好投入到任务中去—也许觉醒水平和认知准备比平时还高、还充分。记住一位数或两位数或是学会将数字与词汇相联系(比如3=门)会对基准线以上的记忆觉醒产生确切的效果。但是,这样做收效甚微,只有5%的瞳孔直径增大与加3任务有关。鉴别两个音调高低的任务也能有效地使瞳孔扩大。最近的研究还表明,抑制住自己读出干扰性单词的倾向同样会产生一定的效果,而在短时间内记住6位或7位数字则需付出更多精力。如你所体验到的那样,当被要求说出你的电话号码或是爱人的生日时,你需要作一番简单却重要的努力,因为你的回应是有逻辑的,你必须将整串数字记在脑中。而心算两位数的乘法题和加3任务则已经接近人们能够做到的极限。

    为什么我们看不见那只“大猩猩”?

    是什么原因使某些认知任务较其他的更加困难、更需付出努力呢?若注意力是种货币,那我们要买些什么样的产品呢?什么又是系统2能做而系统1不能做的呢?我们现在对这些问题给出假设性的回答。

    想要同时记住不同的想法也需要耗费精力,其中有些想法需要按不同方案实施,另一些想法则需与一定的规则结合起来实施—在进超市前重新核实你的购物单,在餐馆吃饭时,在鱼和牛肉之间进行选择,或是根据小样本得来的信息归纳出一个令人惊喜的结果等,都属于此类实例。系统2是唯一一个可以按规则运行、能根据属性来对比物品、能深思熟虑作出选择的系统。自动运行的系统1不具备这些能力。系统1能察觉简单的关系(比如“他们长得一模一样”,“儿子比父亲高得多”),还擅长整合关于一件事的所有信息,但不能快速处理多个独立的话题,也不能利用纯粹的统计学信息。如果一个人被描述成“本性怯懦,做事井井有条,循规蹈矩,关注细节”,系统1就会认为这个人像是个图书管理员,但系统2在结合了直觉以及图书管理员人数少的这个事实进行思考过后,却不会这样认为。只有系统2才能作这种判断。

    系统2一个非常重要的才能是它能够处理“多重任务”,它可以提取记忆去执行抑制习惯性反应的指令。考虑以下的任务:数出这一页“的”字出现的次数。这个任务你以前从来没有做过,做起来很难得心应手,但是你的系统2却可以应付得来。着手这个练习并非易事,尽管在练习的过程中你会有所提高,但真正完成这项任务会很吃力。心理学家用“执行控制”来描述多重任务的执行和最终完成,神经系统科学家已经确认了大脑中负责执行功能的主要区域。当有冲突需要平息的时候,其中一部分区域也会活跃起来。另一部分是大脑前额叶,人类的这个区域要比其他灵长类的更为发达,它是与智力密切相关的重要脑区。

    现在,假设你在看完这一页时,接到了另一个指示:数出下一页有多少个逗号。这项任务更加困难,因为你还要克制住不久前形成的倾向,即将注意力集中在“的”字上。近几十年来,认知心理学家们有很多重大发现,其中一项就是:从一个任务转换到另一个任务上需要付出努力,在时间紧迫的情况下尤其如此。完成加3任务和心算乘法之所以困难,也是因为两项任务都需要快速转换。要完成加3任务,你必须同时在工作记忆中储存好几个数字,并且每个数字都要与一个特定的运行过程相联系:得记住转换完的数字以便稍后说出来,一个数字正在转换中,还有一些数字正等着被转换。当前关于工作记忆的测试要求个人在两个高要求的任务间不停地转换,在记住其中一个结果的同时,还要执行另一个任务。能够很好完成这些测试的人大都能在一般智力测试中取得好成绩。然而,是否能够控制自己的注意力并不是一般智力的衡量标准。要想预测空中交通指挥员和以色列空军飞行员的表现,衡量他们控制注意力的能力比让他们作智力测试更为有效。

    时间制约是人们付出努力的另一个驱动因素。执行加3任务时,你的匆忙一方面是因为节拍器,另一方面是因为记忆负荷。你就好比是同时向空中抛出好几个球的马戏团演员,无法承担减速的后果。记忆减退的速率催促你的步调,迫使你在完全忘记这些信息前不断进行更新和演练。任何需要你同时记住许多想法的任务都是匆忙的。除非你运气较好,有很大的工作记忆容量,否则你就只能硬着头皮继续工作。慢思考最耗费脑力的思考形式就是那些催你思考的形式。

    你肯定已注意到,在执行加3任务时,你的大脑会不同寻常地高速运作。即使你靠脑力劳动谋生,在日常工作中也极少有类似加3或是类似马上记住6位数这样极具挑战性的任务。我们通常会分几个简单的步骤来执行任务,以避免大脑超负荷运行。这样的话,我们可以将中间结果储存在长期记忆中或是记在纸上,而不是简单地堆积在工作记忆中。我们不紧不慢地绕着远路向目标靠近,通过最省力法则来管理我们的思维活动。

    示例—注意力和努力“我不会在开车的时候想破脑袋去解决这个问题。这是一个会使瞳孔扩散的任务,太费神了!”“他在运用最省力法则,能不多想就不多想。”“她没有忘记开会的事,只是会议开始时她完全在想别的事情,根本没有听到你在说什么。”“我的脑海中最先出现的想法是来自系统1的直觉。我必须得从头到尾思索一遍,三思而后行。”第3章 惰性思维与延迟满足的矛盾

    我每年都要在伯克利待上几个月,在那里,我最大的乐趣就是每天在山间小路上散步4英里,领略旧金山湾的风景。通常我会记录散步所用的时间,也由此对自己在这个过程中所付出的努力有相当的了解。我发现自己大概用17分钟就可以走完1英里的路程。当然我也耗费了体力,以这一速度行走比我坐在靠椅上要消耗更多的热量,但行走中我并没有感受到精神压力,也没有内心矛盾,更无须催促自己前行。以这个速度散步,我还能边走路边思考。事实上,我觉得散步能唤醒身体的感应,使大脑思维更加敏锐。

    系统2也有一个自然的速度。大脑没有专门处理某项任务时,你可以分些精力随意观察自己周围发生了什么。除非你非常小心谨慎,或者自我意识很强,否则观察周围环境或大脑的活动是不需要付出太多努力的。开车时你就能做出一些小决策,读报纸时也能汲取一些信息,和爱人或同事随意说说每天的开心事等,这些都不需要付出多少努力,也没有什么压力,跟散步没什么两样。

    边散步边思考其实是一件很轻松、很惬意的事,但在某些极端情况下,这些活动似乎在争夺系统2有限的资源。只需一个简单的实验就可证实这个假设:在和朋友悠闲地散步时让他心算出“23×78”的结果,而且要立刻就算出来,这时他肯定会停下脚步来算。我的体会是,我可以在散步时思考,却无法利用短时记忆来完成这样一项复杂的心算任务。如果我必须在规定时间内构建一个复杂的理论,我希望无人打扰,而且坐着思考要比站着强。当然,不是所有的慢思考都必须要集中精力、认真计算的。和阿莫斯悠闲散步就是我人生中的最佳思考时间。

    加快散步速度会完全改变我的散步体验,因为加快速度会使我的连贯思考能力明显下降。只要一提速,我就要注意逐渐加快行走速度,要刻意保持更快的速度,将一连串想法加以总结的能力便相应下降了。我在山上行走能保持的最快速度是每14分钟走完1英里,不过这样一来,我根本什么事都想不了。沿着小路快速行走不仅要付出体力,还需要大脑的自我控制,以防止自己减速。自我控制和仔细思考很明显要抢夺努力的有限预算。

    通常情况下,大多数人保持连贯的思维或时不时积极思考都需要自我控制力。尽管没有作过系统的研究,但我认为,不断转换任务和提高大脑运转速度从本质上说是不会让人感到快乐的,人们总是尽可能避开这种情况,这就说明了为什么最省力法则能成为法则。即使没有时间的限制,保持连贯的思维也需要此法则。有人曾观察并记录我写作的一个小时内查收电子邮件或打开冰箱的次数,这可以说明我想要逃离写作的欲望,也可以得出一个结论—我的自我控制力完全达不到工作的要求。

    好在并不是所有认知工作都令人厌恶,有时并不需要意志力的支撑,人们也能花很长时间和大量精力进行一项工作。心理学家米哈里·契克森米哈(Mihaly Csikszentmihalyi)对这种无须作出努力的状态的研究比别人都多,他将这种状态命名为心流,而且此名称已成为一个心理学术语了。体验过心流的人将其描述为“一种将大脑注意力毫不费力地集中起来的状态,这种状态可以使人忘却时间的概念,忘掉自己,也忘掉自身问题”,他们对这种状态所带来的愉悦感的描述非常吸引人,米哈里称之为“最优体验”。很多活动都能带来心流体验,不论是画画还是摩托车比赛。我认识几个作者,出书就是他们的最优体验。对于一个作者而言,这样容易满足是件幸事。心流巧妙地区分了两种努力形式:对任务的关注和对注意力的严格控制。以每小时150英里的速度骑摩托车和在象棋大赛中角逐都需要付出努力,然而在心流状态下,集中注意力关注吸引人的事并不要求自我控制。因此,我们要将所有资源都用于手头上的任务才好。

    又累又饿的保释官更可能否定保释申请

    自我控制和认知努力是大脑工作的形式,这一观点已得到广泛认同。有几项心理研究表明,人若既有认知任务在手又同时受到诱惑的影响,就容易屈从于诱惑。如果有人要求你在一两分钟内记住一串7位数的数字,并且告诉你记住这些数字是你的首要任务,而当你将注意力集中在这些数字上时,却有个人端着甜点让你选一种:是选择让人既爱又恨的巧克力蛋糕呢,还是选择什锦水果沙拉。有证据显示,尽管大脑里装满了这些数字,你却更有可能选择诱人的巧克力蛋糕。系统2在忙碌时,系统1对行为的影响会更大。而且,系统1也更偏爱甜食。

    当人们忙于认知活动时,更有可能作出自私的抉择,会用带有性别歧视的字眼,并在社交场合作出肤浅的评判。记住和重复这些数字会减轻系统2对行为的控制,当然,认知负担不是自我控制减弱的唯一因素。喝几杯酒,或者一夜没睡也会产生同样的结果。早起的人的自我控制力会在晚上受到影响,而夜猫子的自我控制能力则会在早晨受到影响。过多关注自己完成一项任务的结果,就会给其短时记忆增加毫无意义的思想负担,进而影响其整体表现。结论非常明显:自我控制需要集中注意力,需要付出努力。换种说法就是,控制思想和行为是系统2的任务之一。

    心理学家罗伊·鲍迈斯特(Roy Baumeister)和他的同事们所做的一系列令人惊讶的实验最终表明,所有自主努力的不同形式—认知上的、情感上的或者身体上的—至少都能对集思广益有所帮助。他们的实验中要求受试者进行的是连续性任务而不是同时发生(不相关联)的任务。

    鲍迈斯特的小组屡次发现,刻意掌控意志和进行自我控制很辛苦。如果你必须强迫自己去做某件事,而此时这件事又面临一个新的挑战,你就会很不情愿或是根本无法进行自我控制。这种现象被命名为自我损耗(ego depletion)。在一次典型的展示活动中,我们要求受试者一边看一部能引起感情共鸣的电影,一边抑制自己的情绪反应。在随后的耐力测试中,他们表现得很糟糕。该耐力测试的内容是握住测力计—这个动作会让人越来越不舒服—看他们能保持多长时间。受试者在实验的初始阶段作出的抑制情感的努力,会削弱其忍受维持肌肉收缩而带来的痛苦的能力,自我损耗型的人因此会很快产生退出实验的冲动。在另一项实验中,受试者要首先经过自我意志的损耗,他们会吃不同的食物,包括小萝卜、芹菜等,同时还要抑制住吃巧克力和饼干的想法。后来,当这些人面对困难的认知任务时,会表现得比通常情况下更轻易放弃。

    如今,我们知道关于自我控制的情形和任务很多,也很复杂。这些情况既包含思想斗争又要抑制自身倾向的需求,见下面的例子:

    ·不去想北极熊。

    ·对震撼人心的电影抑制情感的共鸣。

    ·对矛盾的事作出选择。

    ·试着让他人眼前一亮。

    ·对同伴不好的行为委婉回应。

    ·和其他种族的人交流(这些人还有种族偏见)

    自我损耗的前兆也多有不同:

    ·改变日常饮食。

    ·疯狂购物,花很多钱。

    ·反应过度,有挑衅的意味。

    ·对有把握的任务花费较少的时间。

    ·在认知任务和逻辑决策的制定中表现得很糟糕

    其证据很具有说服力:对系统2有高需求的活动同样需要自我控制,而发挥自我控制力既有损耗又很枯燥。与认知负担不同,自我损耗至少会令人丧失一部分动力。在一项任务中控制自我后,在另一项任务中就感受不到自己在努力,但只要你真的想做,就一定能做到。在几次实验中,如果受试者有强大的动力抑制自我损耗的影响,他是完全能够做到的。相反,如果你必须在执行某项任务的过程中以短时记忆记下6个数字,此时即使不断努力也是行不通的。自我损耗和认知投入并非同一种思维状态。

    鲍迈斯特小组最惊人的发现,用他自己的话说就是,大脑能量这一概念不仅仅是个比喻。神经系统消耗的葡萄糖比身体其他部位消耗的都要多,而且需要付出脑力活动的成本显然要比葡萄糖高。在积极进行复杂的认知推理或者忙于要求自我控制的任务时,人的血糖就会下降。这种情况和短跑运动员在短跑时肌肉中的葡萄糖储备量下降是相同的。这一概念的大致含义是,自我损耗的影响能通过注射葡萄糖得到缓解,而且鲍迈斯特和他的同事们也通过几个实验证实了这一假设。

    他们有一项研究是让志愿者们看一个无声的短片,其内容是对一位女士的采访。这些志愿者的任务是解释她的肢体语言。在这些志愿者执行这项任务时,屏幕上有一串单词慢慢闪过,而他们事先已经被告知要忽略这些词,如果发现自己的注意力转移了,他们只能再次将注意力拉回到这位女士身上。研究认为,这种自我控制行为可以引起自我损耗。所有的志愿者在执行第二个任务前都喝了些柠檬汁,其中一半的人所喝的柠檬汁加了葡萄糖,而另外一半人的饮料中混有代糖。然后所有的志愿者开始执行第二项任务,在这项任务中,他们必须克服直觉才能得到正确的答案。通常在自我损耗的人群中,直觉性的错误常有发生。结果是喝了含有代糖饮料的人出现了损耗现象,而喝了含有葡萄糖饮料的人却没有。在大脑中储存一定量的糖,可使自己表现得不那么糟糕。能导致葡萄糖降低的任务是否同样会导致瞳孔放大和心率加快等情形发生呢?要想证明这一说法,恐怕还需要些时间和更深入的研究吧。

    《美国科学院院报》最近报道了损耗对判决的影响这一问题的研究情况。在这项研究中,8位不知情的受试者全部是以色列的保释官。他们每天都要审阅保释申请,而且不是按这些保释申请的时间顺序审阅的,这些保释官在每份申请上所用的时间很少,平均只有6分钟。(弃权相当于拒绝保释,只有35%的申请能获准通过。这些保释官作出每个决定所用的时间都有精确的记录,而且他们一日三餐的餐歇时间也有记录,分别是早餐时间、午餐时间和午间休息时间。)这项研究的设计者对两次餐歇间所能获得批准的申请数量进行了预测,结果发现每次用餐过后,获得批准的申请数量都会增加,有约65%的申请得到了批准。在保释官下一次用餐前的约两个小时内,批准率就开始稳步下降,在用餐之前刚好达到零。如你预想,这种结果令人难以接受,但各位设计者已经认真审核并排除了很多其他的原因。对这个数据最合理的解释却带来了负面信息:又累又饿的保释官容易否定保释申请。疲劳和饥饿都有可能影响他们的决定。

    脱口而出的错误答案

    系统2的一大主要功能是监督和控制思想活动以及由系统1引导的各种行为,使得一些想法直接体现在行动上,或者抑制或改变其他想法。

    例如,下面是一个相对简单的难题。别费力去分析它,凭直觉做做看:

    球拍和球共花1.10美元。

    球拍比球贵1美元。

    问球多少钱?

    你会马上想到一个数字,这个数字当然就是10,即10美分。这道简单的难题之所以与众不同,是因为它能引出一个直觉性的、吸引人的但却错误的答案。计算一下,你就会发现。如果球花费10美分的话,总共就要花1.20美元(球10美分,球拍1.10美元),而不是1.10美元。正确答案是5美分。我们可以假设那些最终得出正确答案的人也想到了这个答案,只是他们不知通过什么办法成功抵制住了直觉的诱惑,最终给出了正确的答案。

    肖恩·弗雷德里克(Shane Frederick)和我对基于两个系统的判断理论进行了共同研究,他用这个球拍和球的问题来研究一个核心问题:系统2对系统1的各类方案监视得有多严密?他进行了这样的推理:那些说球为10美分的人让我们了解到这样一个重要的事实,那就是这个人没有认真验证这个答案是否正确,而且他的系统2倾向于直觉性的答案。其实他只要稍稍动脑想一下,就会否定这个直觉性的答案。此外,我们还知道给出直觉性答案的人忽视了一个明显的生活提示,他们应该想一想怎么会有答案这么明显的问题呢。没有验证答案,这是一个明显的失误,因为验证根本不费什么事,只是大脑工作几秒钟(这个问题的难度一般),或者肌肉动一动,抑或睁大眼睛而已,只要稍微动动脑子就可以避免这个令人窘迫的错误。认为答案是10美分的人显然不爱动脑筋,没有给出这个错误答案的人显然思维更活跃。

    上万名大学生都回答了这个球拍和球的问题,其结果令人吃惊。哈佛大学、麻省理工学院和普林斯顿大学中50%以上的学生给出了这个直觉性的错误答案。在声誉稍差一点的大学里,则有80%以上的学生没有验证答案就脱口而出。这个球拍和球的问题是我们所作的第一个作了观测性的研究,这一问题将是本书反复出现的主题:很多人过于自信,过于相信自己的直觉。他们显然觉得认知努力没什么意思,会尽量避免费力思考。

    现在我来为大家作一个逻辑论证—两个前提和一个结论。请你尽量快速地判定这个论证是否符合逻辑。想想结论是否与前提有关联?

    所有的玫瑰都是花。

    有些花会很快凋谢。

    因此,有些玫瑰也会很快凋谢。

    大部分大学生觉得这个推论是合理的。但事实上,这个论证是有问题的,因为玫瑰可能不会很快凋谢。就像球拍和球的问题,貌似正确的答案会马上在大脑中显现。摆脱这种现象需要作出努力,因为坚信自己的观点,认为“这是对的,是对的”,便使人很难去验证自己的答案是否符合逻辑,大多数人根本不愿费力去想明白这个问题。

    这个实验使我们对在日常生活中做出的推论丧失了信心。这个实验使我们认为,当人们相信某个结论是正确的时候,他们很可能会相信支持这个结论的论证,哪怕这些论证不正确。如果系统1也参与到活动中来,人们总会先得出结论,然后才进行论证。

    接下来,请思考以下问题,边读边作答:

    密歇根州在一年中发生了多少起谋杀事件?

    这个问题是肖恩。弗雷德里克设计的,仍旧是对系统2的挑战。回答这个问题的“诀窍”在于调查对象是否会记得底特律这个犯罪率相当高的城市就在密歇根州。美国的大学生都了解这个事实,都能准确无误地指出底特律是密歇根州最大的城市。然而,对事实的了解并不重要,重要的是在我们需要这个事实的时候却总是无法立即将其提取出来。记得底特律在密歇根州的人对该州谋杀犯罪率的估计要多于不知道这一点的人,但弗雷德里克那个实验的大多数受试者在看到密歇根州时,根本没有想到该州还有底特律这座城市。实际上,当人们被问及密歇根州和底特律市的谋杀犯罪率时,回答前一个问题的人总认为密歇根州的谋杀犯罪率低,而回答后一个问题的人则认为底特律市的谋杀犯罪率高。

    受试者在回答上面的问题时没能想到底特律市,这既是系统1的问题,也是系统2的问题。提到密歇根州时能否想到底特律市,这在一定程度上要依赖记忆的自主功能,这一功能因人而异。有些人对密歇根州的一切耳熟能详:该州的居民比其他地方的居民更容易回想起关于该州的事实;熟悉地形的人能比棒球统计员回想的更多;聪明的人在大多数事情上的表述上比其他人表述得更好。聪明不仅是指推理的能力,也指在记忆中搜寻相关信息和在必要时调动注意力的能力。记忆功能是系统1的一种属性。但是,每个人都可以选择放慢速度,在记忆中积极搜寻所有可能相关的事实,就像他们在球拍和球的问题中可以放慢速度验证直觉性答案一样。不同的人仔细核对和搜索的程度也各不相同,这是系统2的一个特征。

    球拍和球的问题、玫瑰的问题和密歇根州/底特律的问题都有共同点。在这些小实验中,答错问题显然在某种程度上说明了其原因是精神动力不足,而不是努力程度不够。能被好大学录取的学生当然能够在前两个问题上作推理判断,在密歇根州的问题上也能够进行思考,能回想起该州的大城市及其犯罪问题。这些学生只要不想接受脑海中出现的似乎是正确的答案,就能够解决更难的问题。若他们满足于现成的答案而不想去思考则会很麻烦。用“懒惰”来形容这些年轻人的自我检测及其系统2似乎有些刻薄,却并非不公平。避免思维上懒惰的人可以被叫做“勤快人”。他们更机警,思维更活跃,不会满足于貌似正确的答案,对自己的直觉也常持怀疑态度。

    心理学家基思·斯坦诺维奇认为他们更理性。

    今天得到1000美元,1年后得到10000美元,你选哪个?

    研究者曾经用各种方式来检验思考和自我控制之间的联系。有些研究者通过询问相关问题来论证其联系:如果分别根据自我控制能力和认知能力将人们分成不同等级,那么不同个体在这两个排序中是否会处于类似的等级呢?

    在心理学发展史中有个很著名的实验,瓦特·米舍(Walter Mischel)和他的学生将一些4岁大的孩子置于残酷的两难处境中。这些孩子可以自行选择,是要一个随时就可以拿到的小奖励(一块奥利奥饼干),还是在充满考验的环境中苦等15分钟,然后得到更大的奖励(两块小甜饼)。每个孩子得单独待在一个房间里,面前有张桌子,桌子上有两件东西:一块饼干和一个铃铛。孩子可以随时摇铃通知研究人员并能领到一片饼干。根据描述,实验如下:“玩具、书、图画或任何其他会使孩子们分心的东西都不在房间里。研究人员离开房间15分钟后才会回来。不过,孩子要是摇了铃、吃掉饼干、站起身来或者表情痛苦,研究人员也会回来。”

    研究人员通过一面单面镜观察这些孩子,他们等待期间的行为总会使观察者大笑。有些孩子成功地经受住了15分钟的考验,其成功原因是他们能把注意力从诱人的奖励上移开。10年或15年之后,那些忍住了诱惑和没忍住诱惑的孩子之间会出现很大差别。忍住了诱惑的孩子在认知任务—尤其是高效地重新分配注意力方面的控制力更强。当他们还年轻时,他们染上毒品的可能性更小。智力水平的巨大区别也随之出现:在4岁时表现出更强的自我控制能力的孩子在智力测验中得到了更高的分数。

    俄勒冈大学的一个研究小组从几个方面研究了认知控制和智力之间的联系,包括通过提升对注意力的控制力来提升智力的做法。研究实验由5个阶段构成,每个阶段40分钟,他们让4~6岁的孩子去玩不同种类的电脑游戏,这些游戏是为检验注意力和控制力而专门设计的。在其中一项游戏中,孩子们要在尽量避开一块泥泞区域的同时,用一个操纵杆将一只卡通猫驱赶到一个长满草的地方。长草的地方会慢慢变少,而泥泞的地方会慢慢扩大,这就需要孩子们不断提高控制的精确度。测试者发现,注意力训练不仅提升了这些孩子的执行控制能力,而且他们在智力测验中的笔试成绩也提高了,并且这种提升的状态可以维持几个月不变。同一个小组所作的其他研究确认了参与了注意力控制的具体基因,表明家长的教育方法也会影响这种能力,研究还证明了,儿童控制其注意力的能力和控制其情感的能力之间有着紧密的联系。

    肖恩·弗雷德里克组织了一个认知反应测试,其中包括球拍和球的问题以及其他两个问题,之所以选这些问题是因为它们可以引发一个吸引人但却错误的直觉性答案(我们将在第5章中讨论这些问题)。他还对这项测试中得分很低的那些学生的特点进行了跟踪研究,发现他们更倾向于用脑海中最先出现的想法来回答问题,而不愿意费事去验证自己的直觉。这些人身上的系统2的监测功能往往较弱。那些遇到各种难题都跟着直觉走的人也易于接受系统1的其他暗示,特别是在冲动、不耐烦以及急功近利的时候,这些人就更易接受系统1的各种暗示了。例如,63%的直觉型受试者说他们宁愿这个月拿到3 400美元也不愿等到下个月拿3 800美元。而那些正确答出3道难题的人中只有37%持这样目光短浅的看法—希望能马上得到一笔钱,哪怕少些也可以。当被问到要想次日就收到自己订购的书愿意付多少钱时,在认知反应测试中得分低的人比得分高的人愿意多付一倍的价钱。弗雷德里克的发现表明,我们这场心理剧中的两个角色有着不同的“人格”。系统1是冲动、凭直觉的;而系统2则具备推理能力,它很谨慎,但对一些人而言,这个系统也是懒惰的。我们从不同人的不同特点中发现了相关性:有些人倾向于系统2,而有些人则更接近于系统1。这个简单的测试可以较好地反映出惰性思考的特点。

    基思·斯坦诺维奇与其长期合作者理查德·韦斯特首先提出了系统1和系统2这两个术语(他们现在更喜欢将其称为第1类型过程和第2类型过程)。斯坦诺维奇和他的同事们用了几十年的时间来研究不同个体面对各种问题时的不同反应,这也是本书所关注的问题。他们用多种不同的方式问受试者同一个基本问题:为什么有些人比其他人更容易受判断成见的影响?斯坦诺维奇在《理性和反思性思维》(Rationality and Reflective Mind)一书中阐明了他的观点,对书中相关章节的主题进行了大胆而独到的论述。他对系统2的两个部分作了明确区分,这一区分十分明显,斯坦诺维奇称其为泾渭分明的两种“思维”。其中一种思维(他称其为算法)负责的是慢思考和要求很高的计算活动。有些人在这些脑力活动中比他人做得更好,他们在智力测试中超越他人,并且从一项任务转换到另一个任务上时,他们往往更快、更高效。不过,斯坦诺维奇认为,高智商并不能消除成见。要想消除成见,还需具备另一种能力,他称其为理性。斯坦诺维奇对理性之人的定义和我之前说到的“勤快人”有相似之处。他的核心观点是我们应当将理性和智力区分开来。在他看来,肤浅的或者惰性思考是一个反思缺陷,是一个理性错误。这是个引人注目且发人深省的想法。为了论证自己的想法,斯坦诺维奇和他的同事们发现,在某种情况下,球拍和球的问题以及此类问题比传统的智力测验(比如智商测试)更能反映出我们对认知错误的敏感度。关于智力和理性之间的区别是否会引出更多的新发现,时间最终会告知我们答案。

    示例—自我控制“连续工作几小时,她也不会感到吃力,她处于一种‘心流’中。”“在长达一天的会议之后,他的自我意识出现一定程度的损耗。因此他决定采用标准的操作规程,不再去想这个问题了。”“他从来不去想自己的话是否有道理。他是特别习惯用懒惰的系统2呢,还是总是非常累?”“不幸的是,她总是喜欢凭直觉随口就说,也许连表达感谢都词不达意吧,弱弱的系统2啊。”第4章 联想的神奇力量

    系统1的运行机制出人意料,在对其进行研究前,请先看以下两个词:

    香蕉   呕吐

    在刚才的一两秒钟里,你一定想到了很多,脑海中浮现出一些不愉快的图像和记忆,你的脸有些扭曲,露出厌恶的表情,而且你还可能不自觉地把这本书推得更远些。你的心率加快,手臂上的汗毛微微立起,而且你的汗腺开始分泌汗液。总之,你对那个令人反感的词的反应与对真实情况的反应相差无几。这些反应全是自发的,超出了你的控制范围。

    你的大脑会不由自主地将香蕉和呕吐这两个词联系起来,暂时在两者间建立了因果联系,认为是香蕉引起了不适。这就是大脑的自然反应。结果,短期内你会对香蕉失去兴趣(不过别担心,这种感觉总会消失的)。你的记忆状态在其他方面也有所改变:你现在很容易就能识别出与“呕吐”相关的物品和概念,对它们的反应也很敏感,比如不舒服、臭味或者恶心等;看到和“香蕉”有关的词,比如黄色、水果,甚至连苹果和浆果都包括在内,也会有不良反应。

    呕吐一般只在特定的情况下才会发生,比如宿醉过后和消化不良时。你肯定还能找出导致呕吐的其他相关词汇。而且,你的系统1注意到将这两个词相提并论并不常见,以前从没遇到过这种情况。你自己也有些惊讶。

    这些复杂的反应快速地呈现在你的脑海中,而且都是自主发生的,无须费力。你左右不了它,也不能让它停下来。这是系统1的一个运行过程。你看到这些词后出现的一切反应都是循着一个名为“联想激活”的过程发生的:事物在你的大脑中唤起的想法激发出许多其他的想法,而且这些联想的行为在你的大脑中迅速扩展开来。连贯性是这种复杂的思维活动的重要特点,其中每个环节都是紧密相连、相互支持的。能引发记忆的词也会引发情感,还能引发面部表情变化和其他反应,比如常出现的紧张和回避倾向。面部表情和退缩行为强化了引起这两种反应的情感,这些情感反过来还会强化相应的概念。所有这些都是瞬间发生的,形成一种认知、情感和生理反应的自我强化模式,这种模式变化多样又能形成一个整体,被称为联想的连贯性。

    在一秒钟左右的时间里,你就能自主且无意识地完成一件了不起的事。一旦发生了完全出乎意料的事—两个风马牛不相及的简单的词语被放在一起—你的系统1就将这两个词随意联系起来,试图弄清具体情况;还预估了可能会出现(从轻度到中等程度)的危险状况,帮你作好准备去面对这些极有可能会出现的事件,以便为你将来的应对创造条件。同时,系统1还会对过去情形的骇人程度进行评估,为当前的事件发展创造条件。这样你就可以透彻了解过去,从容面对未来了。

    在所发生的事情中有一点很奇怪,那就是你的系统1把两个词的简单联系看做真实的情况。你的身体对这一假想情形的反应要稍逊于对真实情况的反应,情感上的反应和生理上的反感表现可以从某个方面解释这个现象。正如近几年来许多认知科学家强调的那样,认知可以体现出来,你不只是用大脑思考,还用身体思考。

    很久以来,人们一直都知道引起这些思维活动的机制是什么,这个机制就是联想。我们都能从自己的经历中了解到,有意识的思维活动中所有的观点都是井然有序的。17世纪和18世纪的英国哲学家曾经努力探求能解释这些续发事件的规律。在1748年出版的《人类理解研究》(An Enquiry Concerning Human Understanding)一书中,苏格兰哲学家大卫·休谟(David Hume)将联想的原则缩减为三个:相似性、时空相接以及因果关系。自休谟时代以后,我们对联想的定义发生了巨大变化,但他的三原则仍可作为定义所有联想的基础。

    什么是观点?我愿意接受开放性的看法。它可能是具体的,也可能是抽象的,能通过很多方式表达出来:它可以是动词、名词、形容词或者只是握紧的拳头。心理学家认为,观点是一张巨网上的节点,他们称其为联想记忆,这些节点和其他节点相联结。联结的类型多种多样:因果联系(病毒→感冒);事物及其特性的联系(柠檬→绿色);事物及其种类的联系(香蕉→水果)。有一方面我们超越了休谟,那就是我们不再将思维活动视为一连串顺序出现的有意识的观点。联想记忆的工作原理是什么?当前的研究中有这样一种见解:一瞬间会发生很多事。思维活动唤起一个看法不仅会引发另一个看法,它还会激发出很多其他看法,而这些看法还会让我们想到另外一些看法。此外,只有几个被激发出来的看法是有意识的思维活动;多数联想思维都是无声的,隐藏在有意识的自我之后的。如果说我们对大脑的运转认识有限,我们当然很难接受这种说法,因为这种说法和我们的体验背道而驰,但事实就是如此:你觉得自己很了解自己,但其实你错了。

    启动效应:让人不知不觉微笑的铅笔

    突破是科学研究的重点,而我们理解联想机制的第一个重大突破就是对测量方式的改进。几十年前,唯一研究联想的方法是向众人提问,比如“当你听到‘天’这个词时脑海中最先出现的词是什么”,研究者记录了不同回答出现的频率,比如“夜晚”、“晴天”,或者“日间长”等。在20世纪80年代,心理学家发现,看到一个词时,人的思维就会立刻产生变化,而且这种变化是可测量的,同时,很多相关词汇会被激发出来。如果你最近看到或者听到“喝__”这个词,你可能会填上偏旁为“氵”的“汤”字而不会填成“场”。当然,如果你刚看到了“运动__”这个词,你可能就会填上“场”字了。我们将此现象称为启动效应,也就是说“喝”这个概念在“汤”之前出现,“运动”先于“场”出现。

    启动效应有多种表现形式。如果你的脑海中此时有“喝”这个概念(不论你是否注意到这一点),恰好此时有人低声跟你说了“汤”字或者在你前面远远的地方放上一碗汤,你肯定会比平时更快地意识到“汤”这个词。当然,你脑海中首先出现的不仅有汤这个概念,还有与食物相关的很多概念,包括猪肉、饿、脂肪、饮食和饼干等。如果最近用餐时几乎都是坐在摇晃的餐桌前吃饭,你的脑海中还会首先浮现摇晃这个概念。此外,启动联想的概念也能引起其他概念,尽管这种能力不算强。就像是池塘里的涟漪一样,概念的激活也是由联想概念这张大网上的一小部分向外逐渐扩展开来的。这个涟漪效应现在是心理学研究中最令人兴奋的探索之一。

    关于记忆理解的另一项重大突破,是研究者发现启动效应不只限于概念和词汇。当然,单纯通过有意识的经验,你是无法了解到这一点的,但你一定要接受这个另类的想法,即你的行为和感情有时会受制于你自己甚至都没有意识到的事件。在一项实验中,心理学家约翰·巴奇(John Bargh)和他的同事们让纽约大学的数位学生从一个包含5个单词的词组中(例如“发现、他、它、黄色的、马上”)挑出4个单词来重组句子。其中一个小组的学生重组的句子中有一半都含有与老年人相关的词汇,例如佛罗里达州、健忘的、秃顶的、灰白的或者满脸皱纹的。当他们完成这项任务时,又被叫到大厅另一头的办公室里去参加另一个实验。从大厅的一头走到另一头是这次实验的关键所在。研究者悄悄地测量了他们所用的时间。正如巴奇预料的那样,那些以老年为主题造句子的年轻人比其他人走得要慢得多。这个实验后来成了经典案例。

    这个“佛罗里达效应”包括信息启动的两个阶段。第一,尽管没有人提过“老年”这个词,但上述那组词令人想到了年迈;第二,这些想法催生了一种行为,即缓慢行走,这个行为与老年人相关。所有这一切的发生都是无意识的。这些学生在回答问题时,谁也没有提及自己注意到这些词有什么共同点,而且他们都坚持认为自己在第一个实验中看到的那些词并未对实验后的行为产生什么影响。“老年”这个概念并非他们的自觉意识,但其行为却因此有了改变。这个由概念影响行为的启动效应被称为概念运动效应,值得我们关注。尽管你自己肯定没有意识到这个效应,但读了上述文字之后,“老年”这个概念肯定对你也产生了一定的影响。假设需要站起来接杯水喝,你起身离开椅子的动作就会比平常稍稍慢上那么一点,除非你恰巧不喜欢“老年”这一概念。有研究案例表明,如果对这一概念反感,人的动作就会比平时稍稍快那么一点。

    在相反的情况下,概念运动效应也同样适用,德国一所大学曾做过的一项实验便证实了这一点。这个实验堪称巴奇和他的同事在纽约所做的那个早期实验的翻版。在实验中,研究人员要求参与实验的学生以每分钟30步的速度在房间里绕着圈走5分钟,这个速度是他们正常行走速度的1/3。这个简单的实验过后,学生们能更快地辨认出与“老年”相关的词汇,比如“健忘”、“年老”和“孤独”等。启动效应往往能产生连贯的反应:如果首先想到老年,你就会表现得像是上了年纪,而这种上了年纪的表现也会强化你关于“年老”的看法。

    相互联系在联想网络中十分常见。例如,觉得高兴时就会微笑,而微笑也会使你感到高兴。拿支铅笔放在齿间几秒钟,有橡皮的一端指向右边,笔尖指向左边。然后拿起笔来,咬住有橡皮的那一端,笔尖指向你的正前方。也许你并未意识到上述活动中有一个动作让你的眉毛皱了起来,而另一个动作却让你的脸上有了微笑。有人曾经让一些大学生给盖瑞·拉尔森(Gary Larson)的漫画《月亮背面》(The Far Side)评定幽默等级,同时要求他们在评级时咬一支笔。那些“微笑着的”学生(他们完全没有意识到自己在微笑)对这本漫画书幽默程度的评价比那些“皱着眉的”学生高得多。在另一项实验中,那些皱眉的人(眉头紧皱)在看到饥饿的儿童、争论不休的人以及事故现场等令人不舒服的图片时,往往会表现出更强烈的情感反应。

    简单地说,常见的动作也会不知不觉地影响到我们的想法和感觉。在一项实验中,受试者按照要求用新耳机听一些信息。他们被告知这项实验的目的是检测音频设备的质量,研究人员告诉他们要不断地摇晃脑袋,以检查设备是否有声音失真的问题,其中一半受试者要上下点头,而另一半则要左右摇头。他们听到的内容是电台的社论。那些点头(表示同意的动作)的受试者往往易于接受他们听到的信息,而那些摇头的受试者则易于否定那些信息。要强调的是,受试者并没有意识到上述问题,他们只是习惯性地将否定或接受的态度与其常用的身体语言联系起来而已。由此可见,老话讲“不管你怎么想的,都得心平气和”,这真是条很好的建议,只有真正做到心平气和,你才可能有回报。

    你会自觉投到盒子里多少钱?

    我们原以为自己作出的判断和选择是有意识且自主的,但那些关于启动效应的研究所带来的发现却颠覆了我们此前的认识。例如,我们中的大多数人都认为投票选举是经过深思熟虑的行为,它反映了我们对政策的认可程度与评价,不会受到不相关的事的影响。比方说,我们投票不应受到投票地点的影响,但事实上这个因素却实实在在影响了投票结果。一项关于2000年亚利桑那州选区投票模式的研究表明,当投票站设在某个学校时,加大教育投入力度的议案的支持率就会比投票站设在附近其他地方的要高。还有一项实验表明,当人们看到一些教室和学校储物柜的照片时,他们往往也倾向于支持关于教育的提案。这些图片对这些受试者的影响比其家长或其他选民与他们的意见分歧对其产生的影响还要大!对启动效应的研究从最初的实证研究—人们想到“年老”走路就会变慢—到今天已经取得了一定的发展,我们现在已经知道启动效应会影响到我们生活的方方面面。

    让人联想到钱的事物往往令人不安。在一项实验中,受试者看到一个列有5个单词的单子,按照要求,他们得在5个词中选出4个组成以钱为主题的短语(比如“高、一份、薪水、桌子、工作”可组成“一份高薪工作”)。其他一些启动想象的实验则更挑战人的领悟力,包括背景中出现一个与钱没有任何关系的东西,比如一张桌子上放着一堆仿制钱币,或者一台电脑的屏保是水里漂着的一些美钞等。

    起初脑海中就有钱的概念的人比自己没有这方面联想时更独立。他们会持之以恒地解决一个非常难的问题,付出双倍的努力也在所不惜,实在迫不得已时才会向研究人员寻求帮助。这一做法清晰地表明其自力更生能力的提升。脑海中总有钱的概念的人更自私:他们更不愿花时间去帮助另外那位假装对实验任务不大清楚的学生。当一位研究人员不小心将一捆铅笔掉到地板上时,脑子里想着钱的那些受试者(他们自己是无意识的)捡起的笔相对较少。在另一系列的一项实验中,受试者得知他们过会儿会和另一个人进行一次简短交谈,彼此熟悉一下,他们负责摆两把椅子,而研究人员则离开去找那个人。潜意识里有钱这一概念的受试者摆放椅子的距离(118厘米)会比没有这一概念的人摆放的距离(80厘米)更远。那些满脑子都是钱的受试者表现出更强烈的独处意愿。

    上述所有发现有一个共同主题,即钱这一概念会滋生个人主义:不愿和他人在一起,不愿依赖他人,也不愿接受他人的请求。心理学家凯瑟琳·沃斯(Kathleen Vohs)完成了这项意义重大的研究,值得赞赏的是,她并未将自己的众多发现向公众和盘托出,而是留给读者更多的思考空间。凯瑟琳的研究意义深远,她的发现表明我们所处的文化环境中有很多能让人想起钱的事物,这些事物以我们意识不到的方式影响着我们的行为和态度,这些方式也许并不那么光彩。有些文化常常提醒人们尊重他人,另外一些文化则常让人们想起上帝,还有一些国家的人们会对着伟大领袖的照片顶礼膜拜。在一个专制国家中,到处挂着领袖的肖像不仅能向你传达“老大哥在看着你”(Big Brother Is Watching You. 语出乔治·奥威尔所著《1984》)的感觉,还会使你逐渐丧失自主的思想和独立的行为能力。

    启动效应的研究证据显示,使人牢记“人终将一死”这一说法能让独裁的主张更得人心,因为在人们恐惧死亡的情况下,独裁的主张会让人心安。其他实验证实了弗洛伊德关于无意识关联中符号和比喻作用的见解。比方说,你可以看看下面这两个不完整的单词W_ _H和S_ _P是什么。如果有人近些天想起了自己某个难以启齿的举动,这些人往往会把这两个不完整的词填成WASH和SOAP(“洗”和“香皂”),而很少会填成WISH和SOUP(“希望”和“汤”)。此外,只是想到背后中伤某位同事就会使人更想去买香皂、消毒剂或清洁剂,而不是去买电池、果汁或者糖果。当人们感觉自己的心灵受到了玷污,往往也会引发他们清洗自己身体的想法,这种冲动被称为“麦克白效应”。

    人们清洗的身体部位往往是那些令他们深感罪恶的部位。一项实验要求受试者通过电话或者电子邮件对一位假想中的人“说谎”。在随后对不同产品的需求测试中,那些通过电话说谎的人更想要漱口水,而不是香皂;而那些通过电子邮件说谎的人更想要的则是香皂,而不是漱口水。

    当我向听众阐述关于启动效应的各项研究时,他们的反应通常是将信将疑的。这也不奇怪,因为系统2认为自己掌控一切,认为自己知道为什么要作出这样或那样的选择。你的脑海中也可能会突然出现一些问题:对情境进行微调怎么可能产生这么大的影响呢?这些实验是否表明我们完全任由情境摆布,随时要听从它的指示呢?当然不是。启动思维的影响力虽强,但并不见得很大。在100位投票者当中,只有几位开始时并不确定要选谁,如果投票点设在学校里而不是在教堂里,他们对与学校相关的问题会就作出不一样的选择,但也不排除有那么几个人会作出相反的选择。

    然而,问题的关键是要接受相关研究的结果,而不是对此心存怀疑。这些结果不是捏造出来的,也不是统计上的偶然现象。你别无选择,只能接受这些研究的主要结论是正确的这一事实。更重要的是,你必须承认这些结论对你自己来说也是正确的。如果你看到电脑屏保上有浮动的美钞,你帮那位笨手笨脚的陌生人捡起的铅笔数量可能比你没看到这些钱时更少。你不相信这些结论适用于你,因为这些结论与你的主观体验不相符,你的主观体验主要是由系统2决定的。启动效应来自系统1,而这个效应发生时,你根本就意识不到。

    我用一个关于启动效应的完美展示案例来结束上面的阐述,这个案例是在英国一所大学一间办公室的茶水间进行的。多年来,这间办公室的职员一直都是自掏腰包买茶或咖啡,他们把每杯茶水和咖啡的建议价格写下来贴到墙上,上班时每次去接茶水或者咖啡时都会把相应的费用投到一个“诚实盒”里。某一天,有人在价格表的上方贴了张横条,上面既没有什么警告,也没作什么解释。在接下来的10周时间里,每周横条都贴有一张新的图片,图片上要么是一些花,要么是一双眼睛,好像盯着看着图片的人。没有人对这些新装饰发表过什么评论,但“诚实盒”里的钱却有了明显变化,如图4所示,这值得仔细研究一番。

     [image file=Image00005.jpg]

    实验开始的第一周(从图底端你可以看到相关信息),有一双睁大的眼睛在盯着来喝茶或咖啡的人,他们投进“诚实盒”的钱的平均值是70便士。第二周,图片上是鲜花,盒子中的钱的平均值少了15便士。这个趋势持续着,凡遇到有鲜花图片的那一周,盒子里的钱数就会减少。从平均水平来看,“眼睛周”时盒子中的钱是“鲜花周”时的3倍。显然,仅仅是一种象征性的监视符号便可促使人们改善自身的行为。正如我们预料的那样,产生这个影响的过程中没有任何意识的参与。现在你相信自己也难逃同样的模式了吧?

    几年前,心理学家蒂莫西·威尔逊(Timothy Wilson)曾写过《我们是自己的陌生人》(Strangers to Ourselves)一书。现在你已经认识了自己身体中的那个陌生人,它也许在很多事情上都会为你做主,尽管你几乎从未察觉到它的存在。系统1带给你的各种印象经常会变成你的信念,而且是你作出选择和展开行动的动力源泉。它可以将当下的情形与新近发生的事情联系起来,再结合对近期的各种预期考虑,对发生在你身上或你身边的事作出心照不宣的解释。系统1包含了对这个世界的认知模式,能立即估测哪些事情是正常的,哪些是出人意料的,它是你作出快速直觉性判断的依据,且这种判断十有八九是准确的,而你的所有判断活动几乎都是在这一系统的指引下毫无意识地完成的。然而,系统1也是你直觉中很多系统性错误的根源,这一点将会在后面几章中得到佐证。

    示例—启动效应“这些人都穿着刻板的制服,看到他们时我们的大脑中是不会有什么创造性想法的。”“这个世界比你想象的要复杂得多,能否对它有个清晰的认识多半要看你的大脑的工作方式。”“他们的作用就是发现问题,而他们也的确发现了很多问题。”“系统1编了一个故事,而系统2也相信了这个故事。我们每个人都有过这种体验。”“我让自己微笑,这样做我也的确感觉好多了!”

    第5章 你的直觉有可能只是错觉

    在头脑清醒的时候——甚至在思绪并不那么清晰的时候——你的大脑一直在进行着多重运算,这些运算可以保留和更新一些关键问题的答案。例如:有什么新情况吗?存在危险吗?事情进展得顺利吗?我需要转移注意力吗?完成这个任务需要投入更多的精力吗?你可以将大脑想象成飞机驾驶座舱,里面有一套刻度盘,上面显示着这些重要变量的当前数值。系统1会自动对当前这些数值进行评估,因为这些数值的一个重要功能就是决定是否需要系统2提供额外帮助。

    其中一个刻度盘测量的是认知放松度。认知放松度介于“放松”和“紧张”之间。放松是事情进展顺利的标志——没有障碍、没有新情况、没必要转移注意力或投入更多精力。紧张说明存在某种问题,且需要不断调动系统2参与其中。如若事情进展不顺利,你便处于认知紧张状态中。认知紧张同时还会受当时的努力程度和未得到满足的需求的影响。令人惊讶的是,一个简单的认知放松过程却与有着多种输入和输出活动的庞大网络相联结。图5对此作了解释。

     [image file=Image00006.jpg]

    图5说明如果一个句子印刷清晰,或是被多次重复,或是已经深植于脑海,人们就能在认知放松的状态下顺畅地将其解读出来。听别人说话时,如果心情好,或者咬一支笔迫使自己“笑”,都能使认知放松。反之,若说明书印刷模糊,颜色浅,句子冗长,语言晦涩,也许心情也不好,甚至在皱眉,这些情形都会使人处于认知紧张状态。

    造成这种放松或紧张状态的不同原因会相互影响。处于认知放松状态时,你有可能心情不错,因此会喜欢你亲眼所见的事物,相信你亲耳所闻的消息,相信你的直觉,感到当时的状态是舒适而熟悉的。此时,你的想法也有可能相对随意、肤浅。当你感到紧张时,你更有可能警惕、多疑,会对手头上的事情投入更多精力,感觉局促,较少犯错,但你的直觉和创造相较平时会下降。

    由记忆造成的错觉

    错觉这个词会让人马上联想到视错觉,因为我们都很熟悉那些令人产生误解的图片。不过,并不是只有视觉才会产生错觉,记忆也容易产生错觉,并且这种现象更加普遍。

    戴维·斯滕比尔(David Stenbill)、莫妮卡·比格特斯基(Monica Bigoutski)、莎娜·蒂拉纳(Shana Tirana),这些名字都是我自己编出来的。如果在接下来几分钟内再次看到这些名字,你很可能还记得自己在哪里见过它们。你心里清楚这些名字并不是那些为数不多的名人的名字,而且有那么一段时间你会记住这一点。但假设几天后你看到一长串名单,其中包括一些知名度不高的名人和你从未听过的“新”名字,而你的任务是挑出名单中所有名人的名字,这时你很可能会将戴维。斯滕比尔当成名人,尽管你并不清楚自己是否在与电影、体育运动或是政治有关的新闻中听说过他的名字。心理学家拉里·雅各比(Larry Jacoby)是第一位在实验室中论证了这种记忆错觉的学者,且发表了一篇名为“一夜成名”的文章。这种情况是怎样发生的呢?要想弄明白,先问问自己是如何知道一个人是否出名的。一些真正有名的名人,例如爱因斯坦、博诺·沃克斯、希拉里·克林顿等,你会在脑海中为他们建立一个信息丰富的记忆档案。但当你在几天后再次见到戴维·斯滕比尔这个名字时,你并没有关于他的记忆档案,你有的只是一种熟悉感——你曾经在某个地方见过这个名字。

    雅各比巧妙地阐述了这个问题:“熟悉感有着简单而又强烈的‘不可复返性’,这种‘不可复返性’似乎说明这种感觉是对过往经历的一种直接反应。”其一大特性便是错觉。正如雅各比和他的许多同事所说的那样,看到戴维·斯滕比尔这个名字之所以觉得很眼熟是因为你更容易辨认出这个名字。再次见到曾经见过的词时会更容易识别出来——无论是在你面前一晃而过或是在嘈杂的环境中让你指认,你都能更加轻松地识别出这些词,而且你读出这些词的速度要比读出其他词快(快百分之几秒)。简而言之,当你指认一个早已见过的词语时,会感到更加放松。正是这种放松使你产生了那种熟悉的感觉。

    图5给出了检测这一观点的方法。挑选一个全新的单词,使其更容易被识别,它就更可能具有不可复返性。的确,如果你在测试前几毫秒时无意中瞥见了一个新词,或是在一张单词列表中看到了这个词,它跟表中的其他单词就形成了强烈对比,你也更有可能觉得这个新词很眼熟。这样的联系在相反的情况下同样适用。假设你看到了一张多少有些模糊的单词列表,其中一些单词非常模糊,另一些要稍微清楚一点,你的任务是挑出比较清楚的单词,此时你最近见过的单词就会比那些你不熟悉的单词看起来更清晰。正如图5指出的那样,引发认知放松和认知紧张的各种方法是可以相互转换的。你可能并不十分清楚是什么让认知更为放松或更为紧张。这也是熟悉感造成错觉的原因。

    什么样的信息更容易让人信服?

    “纽约是美国第一大城市”,“月亮绕着地球(公)转”,“鸡有4条腿”,在所有这些表述中,你在很短时间内便接收了大量信息,这些信息五花八门,各不相同。读过前面三个表述后,你很快就知道前两个是真实的,最后一个是错误的。但值得注意的是,判断“鸡有3条腿”是错误的,明显要比“鸡有4条腿”更容易。你的联想机制对后一种表述作出判断的速度相对缓慢,之所以这样是因为后一句话让你想到许多动物都有4条腿这一事实,你可能还会想到超市通常也会销售4只一包的袋装鸡腿。系统2负责信息转换,它也许会提出问题(关于纽约的那个问题是否太简单了),也可能要核对“(公)转”这个词的意思。

    想想你最后一次参加驾驶考试的情形吧。你真的需要一张驾驶执照去开一辆载重3吨的车吗?或许你学习认真,连答案在哪一页的什么位置都记得,还知道答案的逻辑关系。但我搬到一个新的州后通过驾驶考试所用的方法跟这些丝毫不沾边儿。我只是快速地读了一遍交规,希望自己能交好运通过考试。我开车有很长一段时间了,还是知道一些交通法规的,但一旦遇到不知怎样回答的问题时,我只能靠认知放松来解决。如果某个答案看起来比较熟悉,我就猜测它可能就是正确答案。如果某个答案看起来比较生僻(或是非常极端),我便排除它。系统1让人产生熟悉感,系统2依靠系统1产生的这种熟悉感来作出正误判断。

    我们还可从图5中得知,如果某个判断是基于认知放松或认知紧张作出的,那就一定会造成错觉。任何能使联想机制运行更轻松、更顺利的事物都会使我们心生偏见。想让人们相信谬误有个可靠的方法,那就是不断重复,因为人们很难对熟悉感和真相加以区别。权威机构和营销商都深谙这个事实。然而,心理学家发现,你不必完整地重复某件事情或某个想法,即使只说一部分,人们也可能相信你的话。经常看到“鸡的体温”这个短语的人会更容易接受“鸡的体温是144华氏度”(或其他随便什么温度都无妨)这一说法。只要熟悉其中一个短语,就会觉得对整个陈述都很熟悉,也会因此对陈述内容信以为真。如果你记不清楚某个陈述的来源,也无法将其与自己知道的事物联系起来,这时你就别无选择,只能跟着认知放松的感觉走了。

    假设你需要写一则能让接收方相信的消息,当然,这则消息是真实的,但人们并不一定相信它是真的。此时,你完全可以利用认知放松来帮助自己,真相错觉的有关知识也可以提供一些具体的建议来帮助你实现这个目标。

    这些建议总的原则是,任何缓解认知紧张的做法都会对你有所帮助,所以,你首先应该让字迹更清晰。请比较下面两个陈述句:

    阿道夫·希特勒生于1892年。

    阿道夫·希特勒生于1887年。

    上述两种说法都是错误的(希特勒生于1889年),但实验显示,第一句话更容易使人信服。其次,你的信息应该印刷在质量较好的纸上,并且文字和背景间的反差要达到极致。如果你使用彩色字体的话,亮蓝或大红的文字会比绿、黄、灰蓝等色调更容易让人相信文字内容的真实性。

    如果你很在意自己在别人眼里是否值得信赖、是否聪明睿智,那么说话时就言简意赅吧,能用简单句的时候就别用复杂句。在研究生中有一个广为流传的段子,说的是很多教授眼中那些最令人难忘的词汇。我在普林斯顿大学的同事丹尼·奥本海默(Danny Oppenheimer)反驳了这些学生的说法。在一篇名为“不切实际地运用华丽辞藻的后果:使用长句毫无必要”的文章中,他指出用浮夸的语言来表达熟悉的概念是一种智商低下、可信度差的表现。

    除了应该保持消息简洁外,还应使其易于记忆。如果可以的话,将你的想法以诗歌的形式表达出来,这样人们会更容易相信你的话。在一个多次被引用的实验中,受试者阅读了许多他们并不熟悉的格言,例如:

    危难时,敌人团结。

    水滴石穿,绳锯木断。

    亡羊补牢,为时不晚。

    另一些学生读到的格言版本则是没有什么韵脚的:

    危险团结敌人。

    再轻的击打也能放倒一棵大树。

    承认错误就相当于得救了一半。

    由上可见,押韵的格言比没有韵脚的格言显得更加深刻。

    最后,如果你需要引用一些内容,选择一些容易上口的名字准没错。在一项实验中,我们要求受试者通过两份经纪公司的报告去评估几家虚拟的土耳其公司的发展前景。每家公司都有两份相关报告,其中一份来自一家名字上口的经纪公司(比如Artan),另一份则来自一个名字很拗口的经纪公司(比如Taahhut)。两份报告有时会持不同意见。观测者能采取的最佳方法就是对两份报告进行综合评估,但他们并没有这样做。相比名字拗口的经纪公司的报告,他们更相信名字上口的经纪公司的报告。记住,系统2是非常懒惰的,它不愿付出努力。如果可能的话,消息的接收方会离所有需要付出精力的事物远远的,包括名字复杂的信息源。

    所有这些都是很好的建议,但是我们不能因此而得意忘形。如果你的信息是明显荒谬的或是与接收方已知的事实相左,那么即使你把高质量的纸、鲜艳的颜色、押韵和简单的语言全都用上,也很难提高信息的可信度。做这些实验的心理学家并不认为其他人是愚蠢和容易骗的。他们认为,我们所有人的生活都受系统1所产生的印象指引,但我们通常不知道这些印象从何而来。你怎么知道某个陈述是否正确呢?如果信息富有逻辑性、与你所持的信念或偏好有联系,或是源自你信任和喜爱的信息源,你便会有认知放松之感。但问题在于,可能还有其他的原因导致你感到放松,包括字体的清晰度和优美的韵律,你无法轻易找到这些感觉的来源。这便是图5带给我们的信息:放松或紧张之感是由多种原因导致的,难以将它们理清。虽然这很难,但也不是不可能。人在备受鼓舞时,就能克服一些导致真理错觉的外在因素。然而,在大多数情况下,系统2都会采纳系统1的建议,并继续运作。

    股票代码上口,回报率也相对较高

    联想关系的对称性是讨论联想连贯性的首要主题。正如前文所述,当人们将铅笔咬在嘴里或是把球放在眉心使自己“微笑”或“皱眉”时,也会感受到平时那种微笑或皱眉时所表达出来的情感。自我强化的相互作用同样也能在认知放松的研究中有所体现。一方面,当系统2参与到那些需要努力的事情中时,我们就会感到认知紧张。另一方面,无论是什么原因引起的认知紧张都有可能将系统2调动起来,改变人们处理问题的方式,使他们不再随意且凭直觉做事,而是转向更加专注的分析性思维。

    前文所提到的球拍和球的问题,测试出人们在回答问题时有这样一个倾向,即不假思索地将脑海中出现的第一个想法当做答案。肖恩·弗雷德里克之所以选择了球拍和球的问题及其他两个问题,是因为它们可以唤起一个最直接但却是错误的直觉性答案。这个认知反应测试的另外两个问题是:

    如果5台机器能在5分钟生产5个小零件,那么100台机器生产100个小零件需要多长时间?100分钟还是5分钟?

    湖中有一片睡莲叶子,这片叶子以每天增长一倍的速度向外扩散。如果48天后莲叶就能覆盖整片湖面,那么其覆盖湖面一半的面积需要多长时间?

    24天还是47天?

    两个问题的正确答案。(5分钟和47天)

    研究人员召集了40名普林斯顿大学的学生来做这个认知反应测试,其中有一半问卷使用的是浅灰色的小字。拿到这部分问卷的学生可以辨认出上面是些什么字,但这样的字体会导致他们认知紧张。测试结果清楚地表明:当问卷上的字体清晰时,90%的学生至少会犯一个错误;但当字体勉强能够辨认时,他们的错误率却降到了35%。是的,你没有看错:字体模糊不清时,学生的表现更好。这是因为,无论认知紧张是由什么原因造成的,它都更有可能激发系统2来抑制系统1所给出的直觉性答案。

    《大脑一放松,脸上现笑容》这篇文章描述了这样一个实验:让受试者快速浏览一些物体的图片,在播放其中一些图片时,先在整个物体出现之前用快得令人难以察觉的速度呈现其轮廓。研究发现,受试者在识别这些图片中的物体时会相对容易。实验人员对受试者面部肌肉的电脉冲进行测量,来记录肉眼难以观察到的细微而短暂的表情变化,并由此测出受试者的情绪反应。不出所料,当图片上的物体更容易识别时,人们会微微一笑,眉头舒展,可见认知放松与良好的感觉相互关联似乎是系统1的一个特点。

    正如所料,朗朗上口的单词会唤起人们的正面态度。若某公司有一个上口的名字,其股票发行第一周往往会取得比其他公司更好的成绩,虽然这样的效果会随着时间推移而逐渐消失。如果股票有一个读起来上口的代码(例如KAR或LUNMOO),这只股票就会比有着PXG或ROD这样拗口代码的股票表现优异,并且这种优越性似乎还会持续一段时间。瑞士的一项研究发现,像Emmi、Swissfirst、Comet等有着顺口名字的股票会比GeBerit、Ypsomed这样名字拗口的股票带来更多的回报。

    如图5所示,重复能引发放松状态和令人舒心的熟悉感。著名心理学家罗伯特·扎伊翁茨(Robert Zajonc)曾潜心关注重复某种刺激和这一刺激最终带来的轻微情感波动之间的关系,扎伊翁茨称之为曝光效应(mere exposure effect)(又称多看效应、(简单、单纯)暴露效应、(纯粹)接触效应等,是指个体接触一个刺激的次数越频繁,个体对该刺激就越喜欢的现象)。在密歇根大学和密歇根州立大学这两所大学的校报上所做的实验是我最满意的实验之一。在几个星期的时间里,一个类似广告的板块出现在校报的头版上,上面写着以下某个土耳其语单词(或像土耳其语那样发音的单词):kadirga, saricik, biwonjni, nansoma,iktitaf。这些词语重复的频率各不相同,其中一个只出现过一次,另外一些分别出现过2次、5次、10次和25次。(在其中一所大学校报上出现得最多的单词在另一校报上出现的频率则最低。)没有人就这个问题作出解释,如有读者询问,得到的回答都是:“买下这个板块的人不愿透露身份。”

    当这一系列神秘的广告结束后,研究人员在校园内散发调查问卷,询问学生对每一个土耳其语的印象,是有“好感”还是很“反感”。结果令人惊奇:相比只重复了一两次的词,受试者对那些重复次数较多的词更有好感。通过使用汉字、人脸和任意形状的多边形所做的实验也都再次证实了这一发现。

    曝光效应并不依赖对熟悉程度有意识的体验,事实上,曝光效应完全脱离了意识:当重复的单词或图片迅速闪过,快到观察者根本没有意识到看见它们时,观察者同样还是更为喜欢重复率高的单词或图片。现在我们应该清楚的是,系统1能对系统2意识不到的那些事的印象做出回应。事实上,当人们完全没有意识到自己看见了刺激物时,其曝光效应会更强。

    扎伊翁茨声称,这种只要不断重复接触就能增加喜欢程度的现象,是一个极其重要的生理现象,可推及所有动物身上。要想在一个危机层出不穷的世界生存,一个有机体对新奇刺激应该谨慎回应,随时保持警惕和逃离的状态。若一种动物对新奇的事物没有心存戒备,其生存概率就会很低。然而,如果了解到这个刺激物是无害的,最初的谨慎便会渐渐消失。扎伊翁茨称,曝光效应的产生是因为一个刺激的重复曝光并没有产生不好的影响,这样的刺激最终会成为一个安全信号,而安全的就是好的。显然,这样的观点并不只适用于人类,同样适用于其他物种。为了证实这一点,扎伊翁茨的一个助手给处于孵化状态的鸡蛋放不同的音乐,随后,孵化出来的小鸡在听见孵化期间所听到的音乐时,发出的哀鸣要少得多。

    扎伊翁茨为他的研究项目作了一个很有说服力的总结:

    重复曝光的结果有益于机体适应其所处的有生命和无生命的环境。这一效应能使机体鉴别出安全的物品和栖息地,是最为原始的社会性依附的基础。因此,重复曝光构成了社会组织和社会整合的基础,而社会组织与社会整合又是心理稳定与社会稳定的基础。

    积极情感和系统1的认知放松之间的联系由来已久。

    创新是发生在能让人联想无限的环境中的

    1960年前后,一个名为萨尔诺夫·梅德尼克(Sarnof Mednick)的年轻心理学家认为他已发现了创新的本质。他的观点虽然简单却很有力:创新与出众的记忆力有关(创新是极佳的联想记忆)。他设计了一个测试,名叫远隔联想测验(Remote Association Test,RAT),这个测验直到今天还常常被用来研究创造力问题。

    举一个简单的例子,请考虑下面三个词语:
    村舍 瑞士人 蛋糕
    你能想到一个与这三个词都有关联的词吗?也许你想到了答案是奶酪。再看看下面这个例子:
    潜水 灯光 火箭
    这个问题要难得多,但它的确有一个独一无二的答案。尽管这个答案是每个说英语的人都知道的,但在受试者中,只有不足20%的人在15秒内想到了这个词。问题的答案是天空。当然,不是任意三个词都能与同一个词相联系。例如,“梦、球、书”这三个词就不能引发一个人人都认为正确的共同联想。

    近些年来,由德国心理学家组成的几个研究小组都曾对远隔联想测验作过研究,对认知放松问题的研究取得了重大进展。其中一个小组提出了两个问题:在人们知道答案是什么之前,能否感知随意三个词是否有一个共同的联想意义?心情对这项任务有何影响?为了弄清这些问题,他们首先让受试者花几分钟时间回想一下自己生活中那些快乐或是悲伤的片段,这个回想的过程使一些受试者感到快乐,而让另外一些人感到悲伤。然后,他们向受试者展示一连串三个为一组的词语,这些组词语中有50%是组内的词语有一定联系的(比如潜水、灯光、火箭),而其余50%的组内词语则没有什么联系(例如梦、球、书)。随后,实验人员要求受试者快速按下两个键中的一个来表明词语是否有共同联系,按键时间限定在两秒以内。如此短的时间内,这些受试者根本无法找到问题的答案。

    实验带来了很多惊人的发现。第一个令人惊讶的地方是,参与上述实验的受试者猜测所给问题答案的准确率要比他们随便选出答案的准确率高很多。这个结果很让人吃惊。很明显,认知放松感被联想机制中一个微弱的信号激发起来,这个信号在组内三个词语的关联得到还原之前就已经“知道”它们是相关的(有共同的联系)。认知放松在这种判断中起到的作用也在另一个德国小组所做的实验中得到证实:提高认知放松(启动、清晰的字体、事先看到词)的操作同样能增加人们将词视为相互联系的可能性。

    另一个重大发现是,人的心情在这项直觉性任务中产生了重要影响。实验人员用电脑编写了一个“直觉参数”用于检测准确性。他们发现,通过让受试者想一些愉快的事,使他们在测试之前有好心情的话,猜测的准确率会提高一倍。一个更引人注目的结果是,心情不好的受试者完全无法准确地完成这个直觉性任务,他们的猜测还没有随便选择的准确率高。心情显然能够影响系统1的运行:当我们不舒服和不开心时,就会丧失自己的直觉。

    这些发现进一步证实,好心情、直觉、创造力、轻信以及对系统1不断增强的依赖性形成了一个关联群集。悲伤、警觉、怀疑、分析方法以及不断增强的努力程度等因素之间也是相互联系的。好心情使系统2放松对行为的控制:当人们心情好时,直觉和创造力会增强,但也会放松警惕,易犯逻辑性错误,这种关联与曝光效应一样,在生理上也讲得通。好心情是事情进展顺利的信号,周围的环境是安全的,卸下防备并没有什么影响;坏心情则说明事情进展不那么顺利,有可能存在威胁,必须要保持警觉。认知放松与愉快的感觉互为因果。

    除了认知放松和积极情感的关系之外,我们还可以从远隔联想测验中了解到更多信息。请简单考虑一下下面两组词:

    睡觉 邮件 开关 

    盐 深 泡沫

    在读第二组词时,你的脸上可能会露出一丝微笑,这是因为第二组词能引起一个共同的联想(答案就是“大海”)。你当然不可能知道自己的这一反应,但是只要对你的面部肌肉的电活动进行测量就能发现这一点。这种微笑反应出现在那些对于共同关联事物还并不了解的受试者的脸上。实验人员仅仅是给他们看了纵向排列的三个词语,然后指示他们看完后按下空格键。看到有共同联想意义的三个词而产生的认知放松似乎本身就能令人心情舒畅。

    正如很多科学家所言,虽然我们证实了好心情、认知放松和对连贯性的直觉之间是相互关联的,但这种联系并不是必然的因果关系。虽然认知放松与微笑同时出现,但一定是好心情引发了连贯的直觉反应吗?答案是肯定的。证据源自一个巧妙的实验方法,这种方法现在越来越受欢迎。在这个实验中,一些受试者听到了实验人员讲的一个封面故事,也许正是这个故事给他们带来了好心情:他们都戴着耳机,听着音乐。实验人员告诉他们:“先前的研究显示,现在播放的音乐会对人的情绪反应产生影响。”这个故事完全使人丧失了对相关性的觉察。这一发现证明,在看到三个词(如果三个词相关则感到愉快,不相关则不愉快)后,短暂的情绪反应事实上是对相关性判断的基础。没有什么是系统1做不到的。情感变化现在是可以预料到的,正因为这些变化不足为奇,我们才不会随意将情绪变化归因于词语。

    这项心理研究是迄今为止最为成功的一例,其成功之处在于将实验技巧与实验结果巧妙结合在一起,而这两者都是特色鲜明且极为惊人的。在过去几十年里,我们已经掌握了许多关于系统1自动运作的知识。我们现在掌握的很多知识听起来像是三四十年前的科幻小说。无论是模糊的字体会影响人们对真理的判断,还是提高认知能力,或是人们对每组三个词的认知放松感引起的情感回应会唤起他们头脑中的连贯印象,这些都不再难以想象。心理学研究已经取得了长足的发展。

    示例——认知放松“不要只是因为字体不清楚就否定他们的商务计划。”“我们一定愿意相信这个观点,因为总有人这样想,但还是三思而后行吧。”“熟悉了,就会喜欢,这就是一种曝光效应。”“我今天心情很好,我的系统2也比平时懒惰,我得格外小心了。”

    第6章 意料之外与情理之中

    前面已经介绍了系统1和系统2的主要特点及功能,尤其是系统1,其介绍更为详细。我将我们的大脑比喻成一台功能非常强大的电脑,虽然按传统硬件标准来看,它的运行速度很慢,但通过不同想法联结而成的巨大网络上的相关联结,也能为我们展现这个世界的构造。而且,联想机制的不断激活也是自动完成的。我们(系统2)具备某种能力去控制记忆的搜寻活动,也能对其进行编辑,这样一来,在特定情况下我们才可以集中精力去追踪某个事件。接下来我们将对系统1的非凡之处及其不足之处作更详细的介绍。

    从第一次的惊喜到第二次的习以为常

    系统1的主要功能是维护并更新你个人世界的模式,它呈现的都是常态下的思维模式。这个模式由许多联想和结果共同构成,这些联想由情境、事件、行为等概念引发,而结果则总是伴随某种规律出现,有可能是两者同时出现,也有可能出现时间只差那么一点点。随着这些联系的形成和加强,联想概念的模式逐渐展现出发生在你生活中的各种事件的结构,这一模式还将决定你对当下的理解和对未来的期望。

    对惊喜的承受能力是你精神生活的一个重要方面,而且惊喜本身也是最敏感的指示,它可以表明我们如何理解这个世界,我们希望从这个世界中得到什么。惊喜主要有两种形式。有些期望是积极、有意识的——你知道你正在等待某件特别的事情发生。当时间迫近时,听到敲门声,你会期望是你的孩子放学回家了;打开门时,你期望听到自己熟悉的声音。如果非常期望的事情没有发生,你会很惊讶。不过,你不怎么期盼的事情也很多。你不会等待这些事情发生,但如果真的发生了,你也不会惊讶。因为这些事在某种情境下是正常的,尽管可能不是你欣然盼望的。

    一个插曲如果反复出现就可能不那么令人惊喜了。几年前,我和我的妻子在澳大利亚大堡礁的一座小岛上度假,岛上只有40间客房。我们去吃饭时,竟然遇见了一位老朋友——心理学家乔恩,我们当时感到很意外。朋友间相互问候,都觉得很巧。第二天乔恩就离开了度假村。大约两个星期后,我们去伦敦的一家剧院看电影。剧场关灯之后,一位来迟的人坐到了我旁边。幕间休息时,我发现我旁边坐着的竟是乔恩。我和妻子事后说起这两件事时,我们两人都意识到了两个事实:第一,这次碰面比上次更巧;第二,第二次碰到乔恩时我们的感受不如第一次那么惊讶。显然,第一次碰面在不知不觉中改变了乔恩在我们大脑中的印象,他现在是“只要我们外出旅行就会碰见的心理学家”。我们(系统2)知道这样想很可笑,但系统1却使大脑认为在陌生的地方碰到乔恩是件正常的事。如果我们在伦敦的那家剧院里碰到的是其他熟人,我们会比遇到乔恩感觉更惊讶。如果单纯从可能性来看的话,在剧院里碰到乔恩的概率比碰到我们那几百个熟人中的任何一个的概率都要小得多,然而现在看来,在那里碰到乔恩却似乎更正常。

    在某些情况下,消极的期望很快会变成积极的,就像我们在又一次巧合中发现的那样。几年前,一个周日的傍晚,我们驱车从纽约赶往普林斯顿,很长一段时间以来,我们每周都会这样穿梭于两个城市之间。那天我们看见了不同寻常的景象:路旁有辆车着火了。我们第二周到达那段路时,又有一辆车着火了。我们发现与第一次相比,第二次遇到这种情况时明显表现得不那么惊讶了。这个地方现在就是“车着火的地方”。因为事件发生的情景相同,第二次事件引起了积极的期盼:每当走到这个路段时,我们都会想起着火的车,而且自己已经作好再看到一次的心理准备(当然,我们没有再看见过),几个月也好,几年也好,我们都有足够的心理准备。

    心理学家戴尔·米勒(Dale Miller)和我曾经合写了一篇文章,在文中我们试图解释为什么我们觉得很多事情是正常或是不正常的。接下来我会引用那篇文章中我们用来描述“常态理论”的一个例子,不过我对这个例子稍稍作了改动:

    在一家高级餐厅,一位观察者随意观察着邻桌的顾客。他发现第一位品汤的顾客往后退了一下,好像有些痛苦。接下来的一大堆事都因这个动作而发生了变化。一位服务生不小心碰到了一位喝汤的顾客时,这位顾客吓了一跳,而这根本没什么可惊讶的;另外一个顾客也喝了从同一个碗中盛来的汤,喝后他强忍着没有叫出来,对此我们也没有感到惊讶。这些事和其他种种事情本应是不正常的,但现在却显得正常了。因为这些事是对之前那些预期的肯定。这些事之所以看上去正常是因为它们重复了原来的情节,记忆中的这些情节相互联系,对这几个事件作出了解释。

    试想你就是餐厅中的那位观察者,第一次看到顾客对汤的反应时你感到惊讶,服务生在碰他时他吓了一跳,你也会感到惊讶。然而,第二次非正常事件会提取你对第一次事件的记忆,两件事联系起来似乎就合乎情理了。这两件事都符合一个模式,模式中的顾客是个特别容易紧张的人。另外,如果第一位顾客表现出痛苦状后,另一位顾客拒绝喝这种汤,这两件意外的事也会被联系起来,说明这碗汤肯定有问题。

    “摩西上方舟时,每种动物各带了多少?”发觉这个问题有问题的人太少了,因而有人将此称为“摩西错觉”。摩西并没有带动物上方舟,带动物上方舟的是诺亚。就像那位往后退的喝汤顾客一样,摩西错觉可以通过常态理论来解释。动物登上方舟给人们营造了《圣经》的文化背景,而摩西也出现在这个背景中,虽然你对他并没有什么特别期待,但对他的名字你也不会感到惊讶。况且,摩西和诺亚这两个名字的英文元音和音节数都是相同的,这也容易使人将二人混淆。就像那些三个一组的词语会令人产生认知放松一样,你在不知不觉中就将“摩西”和“方舟”联系在了一起,很快地接受了这一提问。但如果句中的摩西换成乔治。W.布什的话,你就会认为这是一个很蹩脚的政治笑话。

    若“关于水泥”这种说法与当前被激活观点的情境不搭,系统就会察觉到这一反常现象,就像你刚才的感受一样。你本来对“关于”之后是什么并无具体概念,但当“水泥”一词出现时,你就知道这个句子有点不对劲儿了。对大脑反应的许多研究表明,系统对违反常态的问题的察觉速度是惊人的,察觉过程也是微妙的。在最近的一次实验中,当人们听到“地球每年绕着麻烦转”这个句子时,听到“麻烦”这一莫名其妙的词之后不到0.2秒,对大脑活动进行检测就会发现一个特殊的图谱。更值得注意的是,当一个男声说“我确信我怀孕了,因为我每天早晨都想吐”,或者当有人操着上流社会的腔调在说“我后背上有一个很大的文身”时,同一个人对这些话的大脑反应速度是相同的。一定要立刻调动起来大量的知识,思考这些陈述与事实之间是否协调:一听这声音就知此人是上流社会的,而上流社会的人身上很少有很大的文身。

    我们能相互交流,因为我们关于世界的知识和对文字的运用水平都相当。我要是提到桌子,没有其他特别的描述的话,你一定知道我指的是一张普通的桌子。你能确定这张桌子的表面大致是平的,而且桌腿远远少于25条。对于很多事物的常态我们都有认识,这些常态给我们提供了背景知识,使我们能够察觉到诸如怀孕的男性和文身的上流社会人士这样的反常现象。

    要想了解标准在交际中的作用,请看“大老鼠爬过了小象的鼻子”这个句子。我敢肯定你想象中的老鼠和小象的体型和我想象的差不了太多。常态下,这些动物的体型有典型的或平均的大小,而且,常态中还包括了这一类动物的变化范围及变异性。我们都不可能在脑中想象到比象还大的老鼠爬过比老鼠还小的小象的鼻子。但我们各自都能想象到比鞋还小的老鼠爬过比沙发还大的大象。系统1理解语言,也了解分类标准,它能辨明那些貌似正确的价值,也能廓清那些最典型事例可能出现的范围。

    简的钱包是怎么丢的呢?

    “弗雷德的父母来迟了,酒席承办商应该很快就到了,弗雷德很生气。”你知道为什么弗雷德会生气,也知道他生气不是因为酒席承办商还没来。在你的联想网络中,生气和不准时被看成是可能的因果关系,但生气和盼望酒席承办商来的想法却没有这种联系。在你读到这句话时,脑海中马上就形成了一个连贯的故事,你立即知道了弗雷德生气的原因。找到这种因果联系是理解一个故事的一部分,也是系统1的一种无意识行为。而系统2——也就是有意识的自我——在接收到这个主观理解后,也接受了这种因果关系。

    纳西姆·塔勒布所著的《黑天鹅》一书中,有一个故事阐明了对因果关系的自主研究。他指出,萨达姆·侯赛因(Saddam Hussein)在伊拉克的藏身处被捕的那天,债券价格就开始上涨。早晨时,投资者显然想投资更安全的资产,而且《彭博新闻社》打出了这样的头条:美国国债上涨,萨达姆被捕不会遏制住恐怖主义。半个小时后,债券价格下跌,标题被修改为:美国国债下跌,萨达姆被捕刺激风险资产。显然,萨达姆的被捕是这一天的重大事件,因为自主搜索原因的方式影响了我们的思考,这件事就成了那天市场变动的原因了。这两个标题表面来看好像可以作为解释市场发生震荡的原因,但是对两个互相矛盾的结果作出解释的那条陈述其实什么都解释不了。

    事实上,所有的标题都要满足我们对逻辑连贯的需求:一件大事必然会带来一些后果,而这些后果也需要一些原因对其作出解释。我们对那天发生的事情所知有限,于是系统1便熟练地将这些知识片段组合成一个连贯的因果关系。

    请读这个句子:

    在纽约拥挤的大街上逛了一天,欣赏完美景后,简发觉自己的钱包丢了。

    研究人员对读过这个句子的人(这些人同时也读过许多其他故事)进行了一次突击性的回想实验,发现这些读者认为“扒手”这个词比“景色”一词与该句子联系更紧密,尽管后者在句子中出现了而前者却没有。联想连贯性原则告诉我们实实在在发生的事情。丢钱包这件事可能有很多不同的原因:钱包从口袋里掉了出去,或者落在了餐厅等。但是,丢钱包、纽约以及拥挤的街道三种想法同时存在时,这些读者都把丢钱包的原因指向了扒手。在那个喝汤的故事中,无论是第一位喝汤顾客在服务生碰他时做出的极端反应还是另一个顾客在喝汤时往后退,其结果都将对最初那次惊讶反应作出联想性关联的解释,因此整个故事看上去也是合理的。

    比利时的贵族心理学家阿尔伯特·米乔特(Albert Michotte)在1945年出版的一本书(1963年被译成英文)中颠覆了几个世纪来关于因果关系的思考,使人们至少回到了休谟对想法关联的研究时代。过去人们普遍接受一个观点,即我们通过对不同事件之间的相互关联进行反复观察,推断其在自然状态下的因果关系。我们曾无数次看到一个运动中的物体碰触另一个物体,使之随即开始运动,且运动方向相同(也并不总是相同)。这和台球相撞的情形一样;同样,当你推一个花瓶时,也会发生同样的事。米乔特却持有不同观点,他说我们能像看见颜色那样直接“看到”因果现象。为了展示自己的观点,他在纸上画了一连串黑色方块,让这些方块看起来像在连贯地运动,一个连着另一个,而这些方块也立即动了起来。那些观察者知道两者其实并没有真正相连,但他们却有种强烈的“因果关系错觉”。如果第二个物体马上开始移动,他们就会认为这个动作是由第一个物体“引起的”。很多实验表明,6个月大的婴儿会将许多事件及其续发事件看做有因果关系,而续发事件一旦发生改变,他们就会觉得惊讶。我们显然从出生时就对因果关系有感觉,当然,这种因果关系并不依存于理性思维,它们是系统1的产物。

    1944年,米乔特发表了他对物质性因果关系的实证研究。几乎就在同一时间,心理学家弗里茨·海德(Fritz Heider)和玛丽–安·西梅尔(Mary-Ann Simmel)运用一种和米乔特相似的方法展示了他们对“意向性”因果关系的看法。他们做了一部总长度只有1分40秒的电影,在这部微电影中,你能看到一个大三角形、一个小三角形和一个圆形。这些图形绕着一个貌似门开着的房子的图像转。观看者看到一个气势汹汹的大三角形正欺负一个小三角形,而那个圆形也受到了惊吓。圆形和小三角形联合起来共同对付大三角形的欺侮;他们还看到门周围(圆形和小三角形)的动作很多,最后小电影以一个爆发性的反击结束。毫无疑问,每个人对意图和情感都有很强的洞察力;只有患孤独症的人才体验不到这一点。当然,所有这一切全都在你的大脑中。你的大脑愿意甚至急切地想要辨别一些因素,确定这些因素的特点和特殊意图,并将其活动视为表达个人偏爱的举动。再次说明一下,我们生来就长于意向性归因:一岁以下的婴儿能辨别欺凌弱小的人和受害者;不管他们去抓什么东西,都知道要走最近的那条路。

    按自由意愿行事的体验与物质性因果关系没有什么联系。虽然是你的手捏起了盐,但你并不认为这件事与一连串的物质性因果关系有什么联系。你感觉这个行为是由一个“无形”的你做出的决策而引起的,因为你想要在食物里加点盐。很多人发现将自己的心灵描述成行为的根源和原因是很正常的。2005年,心理学家保罗·布鲁姆(Paul Bloom)在《大西洋月刊》(The Atlantic)上发表了有争议的观点,即我们生来就具有区分自然性和意向性的因果关系的能力,而这一能力也解释了宗教信仰的普遍性。他发现,“我们对物质世界和精神世界的感知完全不同,所以我们才可能对没有灵魂的身体和没有身体的灵魂进行想象”。我们注定能够感知得到的这两种因果关系模式使我们能够很自然地接受众多宗教中都存在的两个主要信念:无形的神是物质世界所有现象的最终原因,而不死的灵魂只是在我们活着时暂时控制我们的躯体,我们死后,灵魂也将离开躯体。在布鲁姆看来,因果关系的两个概念在进化过程中是分别形成的,同时也将宗教的起源追溯到系统1中去了。

    因果性直觉的特点是本书一再出现的主题,因为人们总是很不恰当地将因果性思考用于需要统计论证的情景中。统计性思维总是根据事物的不同类别和总体性质得出个案的结论。可惜的是,系统1并不具备这种推理能力;而系统2通过学习可以进行统计性思考,但几乎没有人接受过必要的相关训练。

    有了因果关系心理学做基础,我决心用两个比喻来描述心理过程,几乎不必考虑什么连贯性问题。我有时将系统1比喻成有着某些特性和偏好的媒介,有时又将其看做通过一个环环相扣的复杂模式来表现现实的联想工具。这个系统和工具是虚拟的;之所以用“媒介”和“工具”这两个喻体,是因为它们符合我们对原因的看法。海德的三角形和圆形并不是真正的媒介,只是把它们比做媒介来思考问题更轻松,也更自然。这样做不用那么费力思考。如果按照所发生事情的特点和意图(即两个系统)来描述它,或者有时按照呆板的规律性(即联想工具)来描述它,我觉得你(和我一样)就会发现了解思维活动更加轻松。我并不想让你相信这两个系统是真实存在的,不想像海德那样,想让你相信那个大三角形是个欺负弱小的角色。

    示例——常态和原因“若最后发现第二个申请人也是我的一个老朋友,我就不会像看到第一个来申请的朋友那么惊讶了。只要情节稍有重复,一种新体验也就不那么新鲜了。”“当我们调查人们对这些产品的反馈时,一定要确定关注的不只是平均水平。我们应该看到所有的常态反应。”“她接受不了自己只是运气不好这个解释,她需要一个有前因后果的解释,否则她会认为是有人在故意破坏她的工作。”第7章 字母“B”与数字“13”

    伟大的喜剧演员丹尼·凯(Danny Kaye)的一句话一直萦绕于我的脑际,从十几岁至今都不曾忘记。谈到一个自己很不喜欢的女人时,他说:“她最得意的姿态是忘乎所以,最喜欢做的事就是仓促下结论。”在我与阿莫斯·特沃斯基开始讨论研究统计性直觉的合理性问题时,这句话就浮现在我的脑海里。现在,我觉得这句话正是对系统1的功能恰如其分的描述。如果结论可能是正确的,偶尔的错误所付出的代价也在可接受的范围内,而且这种仓促的做法可以节省很多时间和精力,那么这种仓促的结论就是高效的。如果对情况不熟悉,在风险又高并且没有时间去搜集更多信息的情况下过早下结论就很冒险。此时,很可能会出现直觉性错误,但这种错误也许可以通过系统2的有意干涉而得以避免。

     [image file=Image00007.jpg]

    图6中三个方框的内容有何共同点?答案是,它们全都有歧义。你几乎可以确定地读出左边方框内所呈现的内容是“ABC”,右边是“12 13 14”,但这两个方框的中间那部分内容是一模一样的。你本可以将它们看做是“A13 C”和“12 B 14”的,但你却没有这样做。这是为什么呢?那是因为,同样的形状在字母的环境下就容易被看做是字母,在数字的环境下就容易被看做是数字。完整的环境能帮助你理解其中的每一个因素。那个形状是会引发歧义的,但你过早地对它的“身份”下了结论,并且根本意识不到你已经赋予了某种歧义以解释。

    看到中间框的内容,你可能会把安(Ann)想象成一个满脑子都是钱的女人,她正走入一栋有出纳员和地下金库的房子。但这个貌似可信的理解并不是唯一的可能,这个句子同样有歧义。如果在这个句子之前有“他们沿着这条河缓缓地漂向下游”这样一句话,你就会想到一个完全不同的场景。当你一直在想河流的问题时,“bank”(这个单词有“岸边”和“银行”两个意思)这个单词就与钱没什么联系了。在没有清晰情境的情况下,系统1会自行建立一个可能的情境。我们知道这是系统1判断的结果,因为你并没有意识到自己作了选择,也没有意识到还可能有别的解释。除非你最近一直在乘独木舟,否则你去银行所用的时间肯定要比在河里漂流的时间多,所以你才会根据最近所经历的事化解了“bank”一词的误解。当我们对答案不确定时,系统1就根据过往经历去赌一个答案。这种下赌的规则是明智的:最近发生的事及当前情境是作抉择时最重要的因素。如果脑中没有闪现出任何最近发生的事,那更为遥远的记忆便会呈现出来。你最早、记忆最为深刻的经历一定是唱英文字母歌,这首歌的开头一定是“ABC”,而不是“A13 C”。

    在这两个例子中最为关键的一点是:你作了一个确切的选择,但自己却没有意识到自己这样做了。你的脑海中出现的只有一种解释,而且你从未意识到这些问题会有歧义。系统1不会记得自己放弃的几个选项,甚至都不记得曾有过多种选择。有意识的怀疑需要同时在脑中记住多种互不相容的解释,需要付出努力,而这并不是系统1的长项。易变和怀疑是系统2的职责范围。

    是什么让你相信了那些荒谬之词?

    心理学家丹尼尔·吉尔伯特(Daniel Gilbert)因著有《哈佛幸福课》(Stumbling to Happiness)一书而广为人知。一次,他在一篇名为“大脑怎样产生信任”的文章中,以17世纪的哲学家斯宾诺莎的理论为基础,提出了一个关于信任与不信任的理论。吉尔伯特提出,在理解一个陈述之前,一定会先试图相信它:如果这个陈述正确的话,你必须先了解它的观点究竟是什么意思。只有这样,你才能决定是否“怀疑”它。最初你产生相信某种观点的想法,是因为系统1的自主运作,这种运作包括构建这一情况下可能性最大的解释。吉尔伯特认为,即使是一个毫无意义的陈述也会唤起人们最初的信任。你试试他给出的例子:“白鱼吃糖果。”你有可能意识到一个关于鱼和糖果的模糊印象,这个印象的产生过程,就是联想记忆自动搜索“鱼”和“糖果”这两个概念之间各种联系的过程,这一过程会使这种很荒唐的说法看起来竟有些道理了。

    吉尔伯特认为系统2的工作就是不信任/质疑,他用一个漂亮的实验来证明自己的观点。受试者看到一些很荒谬的说法,比如“一个叫丁卡的人是一团火焰”,他们要在几秒钟内说出这个句子的说法是“对”还是“错”。随后实验人员要检验一下受试者是否记得哪些句子是“对”的。这一实验还有一个条件,即受试者在执行任务的过程中还要按照要求记住一些数字。系统2的干扰产生了选择性效果:它使人们很难“不信任”那些错误的论断。在后续的记忆测试中,筋疲力尽的受试者最后竟认为许多错误的论断都是正确的。这个实验的寓意是深刻的:有系统2参与时,我们几乎会相信所有事情。因为系统1不仅好骗,还容易产生偏见,而尽管系统2掌管怀疑和不信任的大权,但是它有时很忙,不忙时也很懒惰,总会擅离职守。的确,已有证据显示,当人们劳累或是精力耗尽时,更容易受那些空洞却有说服力的信息影响,例如广告。

    联想记忆的运作是导致“确认偏误”的原因之一。如果有人问你:“山姆友好吗?”你就会想到山姆的各种行为举止;而如果有人问你:“山姆是不是很不友好?”你就很难想起他的许多举动。有一项专门针对证据确认问题进行的名为“积极测试策略”的研究,这项研究主要考察系统2是如何验证假设的。一些自然科学家认为应通过驳斥假设以证实其是否成立,但其他人(通常是科学家)则主张通过寻找符合他们当前观点的数据来证实假设是否成立。系统1产生的确认偏误不加批判地接受了建议,夸大了极端的可能性以及不可能的事件。如果被问及海啸在今后30年内袭击加利福尼亚州的可能性有多大,你脑中所呈现的图像很有可能就是海啸,你会更容易高估出现灾难的可能性。这就如同看到同吉尔伯特提出的那些类似“白鱼吃糖果”这种无意义的陈述时产生的反应一样。

    光环效应与群体的智慧

    如果你赞同一个总统的政见,你可能也会喜爱他的声音及着装。喜爱(或讨厌)某个人就会喜爱(或讨厌)这个人的全部—包括你还没有观察到的方面—这种倾向就叫做光环效应。这个术语已在心理学领域使用了长达一个世纪,但仍然没能成为日常用语。这是一件憾事,因为光环效应这个说法很好地诠释了我们生活中普遍存在的一种偏见,这种偏见在我们塑造对人与环境的看法时起着很大的作用。系统1可以通过很多比现实更简单却更连贯的方式来表现这个世界,光环效应就是其中一种。

    你在某派对上遇到了个名叫琼的女士,发现她既漂亮又善谈。现在,她的名字再次出现,并有可能是被叫去捐款。你知道琼有多慷慨吗?正确答案是:你事实上什么都不知道,因为没有理由可以让你认为善于社交的人在慈善方面会表现得慷慨。但你喜爱琼,当你想到琼时,那种喜爱的感觉会再次涌上心头。你自己慷慨,也喜欢慷慨的人。通过联想,你预先倾向于相信琼是慷慨的。现在,你认为琼是慷慨的,你可能会比以前更喜欢她,因为你又增加了一条令她讨你喜欢的特点。

    在琼的这则故事里,我们并没有她慷慨程度的真正证据,而是凭借自己对她的情感回应作出猜测,用猜测弥补证据的缺失。在其他情况下,证据会逐渐出现,由第一印象产生的感觉会影响你对事物的解读。所罗门·阿希(Solomon Asch)的一个实验堪称心理学实验中不朽的经典。他对两个人进行了描述,并要求其他人对这两人的个性进行评论。你认为艾伦和本这两人怎么样?

    艾伦:聪明—勤奋—冲动—爱挑剔—固执—忌妒心强

    本:忌妒心强—固执—爱挑剔—冲动—勤奋—聪明

    如果你像我们一样,你就会更喜欢艾伦一些。前几条列出的性格特征会改变后面出现的特征的含义。我们认为聪明人有理由固执,并且还会尊重他这一点。然而,一个忌妒心强又固执的人如果还很聪明的话,他身上就带有一些危险性。光环效应也可以化解歧义:如同“bank”这个单词一样,“固执”这个形容词也是有歧义的,但将它放在一定情境中歧义便会被化解。

    对于这个研究主题,还有许多衍生出来的实验。在一项研究中,受试者要先考虑一下描述艾伦的前三个形容词,然后再考虑剩下那三个描述艾伦的形容词,但实验人员告诉他们,后三个词是用来描述另外一个人的。随后,当受试者根据这些描述假想出两个人时,实验人员问他们,这6个形容词是否有可能用来形容同一个人时,大多数受试者都认为不可能!

    我们对一个人性格特征的观察顺序是随机的。然而,顺序的确很重要,因为光环效应注重第一印象,而后续信息在很大程度上都被消解掉了。在我刚做教授时,我评价学生论文的方式很传统。我会顺序一次取一本论文,一边读一边打分,然后计算出总成绩,之后再接着批改下一个学生的论文。最后,我注意到自己对每一本论文的评估都出奇地相似。我开始怀疑我的评分产生了光环效应,即第一次评分对接下来的所有评分都产生了一定影响。这样的机制十分简单:在我给某学生的第一份论文打了高分后,再碰到有模糊或是有歧义的陈述时都会对这个学生手下留情。这种做法看似合理。一个学生能将第一份论文写好的话,就不应在第二份论文中犯低级错误!但我评分的方法却存在一个严重的问题。如果某个学生写了两份论文,一份论点有力,另一份却经不起推敲,我则会因为批改的顺序不同而给出不同的分数。我曾经告诉学生两份论文的评分标准是一样的,但事实却并非如此:相比第二份论文来说,第一份论文对于总分的影响更大。所以这样的做法是不可取的。

    我采取了一种新的做法。我阅读并批改了某个学生第一个问题的答案,然后接着改下一个学生的相关论述,而不是按顺序读完第一个学生的整本论文才评阅下一份。我确定将所有分数都写在了论文集的封底,以避免在批改第二份论文时出现偏见(即使是无意识的)。在改变方法后不久,出现了一个令人担忧的结果:我对评分的自信程度比原来更低了。原因在于我频繁地感到一种不适。当我对某个学生的第二份论文感到失望时,便在他的论文集封底记下一个低分,但却偶然发现我给他的第一份论文打了最高分。我也注意到了我会不经意地改变尚未写下来的分数以缩小两份论文之间的分数差,并且,我很难克制住自己不这样做。我对同一个学生的论文评分通常相差巨大。这样的前后不一使我感到不确定和沮丧。

    我现在对自己的评分行为感到失望和不自信,但我认为这是件好事,因为它表明现在这个方法比原来的有进步。我先前所感到的一致性是伪造出来的,它使我有了认知放松之感,我的系统2也欣然接受了最后的分数。采用新方法之后,虽然第一个问题深深影响到我对之后学生的评估,但我允许自己这样做,因而学生某些问题答得好和不好的分数差别也就不是我有意为之的了。但我发现同一个学生在回答一个问题时表现优异,而对另一个问题的解答却很糟糕。当我改变方法时,这种令人感到不适的前后不一致就显露了出来:它不仅反映出随便拿一个问题去衡量学生水平的做法是不恰当的,还反映出我自己打出的分数同样不可靠。

    我采取的避免光环效应的评卷方法遵循了一个普遍原则:消除错误的关联!为了了解这一原则的工作原理,我们设想一下:向大量观察者展示一些装有硬币的玻璃罐,让他们估计一下每一个罐里硬币的数量。詹姆斯·索罗维基(James Surowiecki)在他最为畅销的著作《群体的智慧》(The Wisdom of Crowds)一书中解释道,一个人单独完成这个任务的效果并不理想,但一群人共同作出判断时准确率就很高。有些人高估了硬币的数量,另一些人低估了它,但对所有判断进行平均估算得出的平均值就会趋近于准确值。这种机制很容易理解:每个人都观察着同一个玻璃罐,他们的判断都基于一个共同的基础。另一方面,每个人犯的错误都与其他人的错误无关,(在没有系统性偏见的情况下)这些错误的平均值趋近于零。然而,只有在每个人的观察相互独立、每个人所犯错误之间不相关联的情况下,降低错误率的奇迹才能出现。如果观察者持有相同偏见,就算将他们的判断汇总起来也难以降低错误率。允许不同观察者之间相互影响会减少样本量,进而影响小组估值的准确率。

    想要从大量证据来源中获取最有用的信息,你应设法使这些来源相互独立。这也是警察办案时所遵循的规则。如果某个案件有多个目击证人,在录口供之前,这些证人是不能获准讨论案件的。这样做不仅是为了防止不怀好意的证人相互串通,还避免了没有偏见的证人相互影响。交流过各自目击过程的证人容易在证词中犯相似的错误,降低了他们所提供信息的总体价值。减少信息来源中的冗赘信息总是没错的。

    企业高管需要花大量时间主持会议,独立判断原则(及解除错误关联)可以直接应用到这些工作中。一条简单的规则就能发挥作用:在开始讨论某个问题之前,先让与会的每一位成员各自写下简短的意见阐明自己的观点。这个过程很好地利用了小组里不同知识和见解的价值。而开放性讨论这一常规做法总会注重那些发言早而又强势的人的意见,使得其他人一味附和他们的观点。

    眼见为实的想法往往让我们仓促作出决定

    我和阿莫斯早期合作时最美好的记忆中有一点很难忘,就是他总是乐此不疲地重复一个搞笑情节。阿莫斯能惟妙惟肖地模仿他大学时代的一位哲学老师,他用带着浓重德国口音的希伯来语咆哮着说:“你必须时刻牢记‘Primat of the Is’。”我从未弄明白他的老师所说的那句短语是什么意思(我想阿莫斯也不明白吧),但是阿莫斯却还是会说那些笑话。每当我们遇到大脑对现有信息和未知信息的处理方法严重失衡的问题时,他总会想起那句莫名其妙的短语(我最后也总是这样)。

    联想机制一个最基本的结构特点就是它只能回忆起已被激活的观点。无法从记忆中获取的信息(即使是无意识的)可能并不存在。系统1善于提取当前激活的想法来构建最可信的故事情节,但它不会(也不能)提取本系统中根本不存在的信息。

    衡量系统1是否成功的方法是看它所创造的情境是否具有连贯性,而与故事所需数据的数量和质量关系不大。信息匮乏是常事,一旦出现这种情况,系统1则会仓促作出结论。请思考下面的说法:“明迪克会是一个出色的领导吗?她聪明又坚强……”你的脑海中一定会马上闪现出一个答案—“当然会”。你根据非常有限的信息选择了一个最佳答案,但是你却行动过早。试想一下,如果紧随其后的两个形容词是“腐败“和”严酷“,你该怎么办?

    在对明迪克这位领导作出快速判断时,请注意有些事你并没有做,你没有自问:“在形成对某人是否具有领导才能的看法之前,我应该了解些什么?”系统1在第一个形容词出现后就开始自主运作了:聪明是好的,既聪明又坚强就更好了,系统1非常轻松地生成了这种想法。如果有新信息出现(例如明迪克思想腐败),这个故事就会被改写了,但是系统1并不会等待也不会出现主观上的不适。对于第一印象的偏好依然存在。

    寻找连贯性的系统1和懒惰的系统2相结合,意味着系统2将会赞同许多直觉性的信念,而这些信念又准确地反映了系统1产生的印象。当然,系统2也能对证据采取系统而谨慎的处理方法,还能在作决定之前考虑出现的众多选项—设想你正在卖房子,你就会设法搜寻一些你不知道的信息。然而,即使是深思熟虑后的决定,系统1也能对其产生影响。系统1的信息输入从未停止。

    在证据不足的情况下过早下结论对我们理解直觉性思考非常有帮助,本书也常提到这样的情况,我将会用一个冗长的缩写来代表这种情形:WYSIATI,意思为“What you see is all there is”,即眼见即为事实。系统1基本上对于引起印象和直觉的信息的质量和数量都不敏感。

    阿莫斯与他在斯坦福大学带的两名研究生作了一项与“眼见即为事实”直接相关的研究。受试者得到了一些证据并且知道这些证据是片面的,而研究者则是要观察他们拿到证据后的反应。这些受试者接触到的都是法律案例,下面就是一例:

    43岁的被告戴维·桑顿(David Thornton)是工会界代表。9月3日,他来到了“平价大药房”168号进行例行视察。他来到这家药店还不到10分钟,一名驻店经理就过来告诉他不能再站在店里和员工们说话,他只能利用员工休息时间在一间密室里见见他们。在工会与“平价大药房”的合约中,这一要求是得到允许的,但从未执行过。当桑顿拒绝这个要求时,经理告诉他,要么遵守约定,要么离开药店,否则他将被逮捕。此时桑顿暗示经理,在不妨碍生意的情况下,他一直以来都是在店里与员工交谈的,每次谈话时间也就是10分钟左右,从来也没有人反对过这一做法,他宁愿被抓也不愿改变例行的视察程序。于是,经理叫来了警察,警察以非法侵入的罪名逮捕了桑顿。在桑顿留了案底并被关押在拘留室一段时间后,所有的指控都被取消。现在,桑顿准备起诉“平价大药房”非法拘留。

    所有受试者都阅读了这些背景材料,除此之外,每一组受试者还听了控辩双方代理律师所作的陈述。情况自然是工会方的律师将逮捕视为恐吓行为,药店方的律师则认为在药店进行谈话扰乱经营秩序,经理的行为是合理的。还有一些受试者就像陪审团成员一样听了控辩双方的陈述。双方律师并没有增加任何背景材料中未提及的有用信息。

    所有受试者都充分了解了整个过程,那些只听到其中一方辩词的受试者能够很轻松地为另一方写出辩词。然而,片面的证据陈述对判断有着重大影响。另外,只掌握一方证据的受试者比掌握了双方证据的受试者更有自信。这正说明人们根据已有信息勾勒出的故事的连贯性增强了他们的自信心。一个好故事最重要的是信息的前后一致性,而不是其完整性。的确,你常会发现:知道得很少反而可以把已知的所有事物都囊括进连贯的思维模式中。

    眼见即为事实的理念有助于达成连贯性和认知放松的状态,从而使我们相信某个陈述是真实的。这一理念解释了我们能够快速思考的原因,解释了我们是如何弄清楚一个复杂领域中那些信息片段的含义的。很多时候,我们拼凑出的连贯情节与事实是无限接近的,完全可以用来支持理性活动。而我还会运用眼见即为事实原则对判断和选择中存在的很多偏见作出解释,以下便是其中的一部分:

    ·过于自信:正如眼见即为事实原则指出的那样,无论是证据的数量还是质量都与主观自信关系不大。每个人对自身想法的自信程度主要取决于他们对亲眼所见的事情的讲述效果,即使他们几乎什么都没有看到也没有关系。我们经常考虑不到自己有可能尚未掌握对判断起决定性作用的那份证据,却总是认为眼见即为事实。此外,我们的联想系统更倾向于选择已被激活的连贯模式,抑制怀疑和歧义。

    ·框架效应:同一信息的不同表达方式常常会激发人们不同的情感。“手术后一个月内的存活率是90%”的说法要比“手术后一个月的死亡率是10%”更令人安心。同样,说凉菜“90%不含脂肪”要比说“10%含有脂肪”更具吸引力。很明显,前述每组句子的深层含义都是相同的,只是表达方式不同而已,但人们通常能读出不同的含义,而且觉得自己的所见就是事实。

    ·比率忽略:回忆一下史蒂夫,那个本性怯懦、做事井井有条,常被看做图书管理员的人。这个人物性格的描述是生动形象的,尽管你清楚地知道男性农民比男性图书管理员多,但在考虑这个问题时,你总会忽略这个事实。你觉得自己的所见即为事实。

    示例—过早下结论“她对这个人的管理技能一无所知。之所以对他印象很好,是因为曾经听他作过一次精彩的报告。”“在讨论之前大家先独自考虑一下这个问题,这样可以避免观点的相互干扰,这样更利于集思广益。”“他们看了一份优质的咨询报告后就作了一个重大决定,他们并没意识到自己掌握的信息其实很少。”“他们并不想了解更多信息,因为那样可能会破坏整个故事情节。他们更愿意相信眼见即为事实。”

    第8章 我们究竟是如何作出判断的?

    你可以回答无数个问题,无论这些问题是别人问你的还是你自问的。同样,你能评价的事物特征也是无数的。你能数出这页中“的”字的出现次数,能比较自己家的窗子和马路对面那家的窗子哪个高,也能对你支持的参议员的政治前景作出评价,其前途无限光明还是前景堪忧,或是碌碌无为。这些问题由系统2来解决,系统2能调动注意力并通过搜寻记忆去寻找答案。系统2接受问题或提出问题:不管是提问还是回答,它都能引导注意力并搜寻记忆来找到答案。系统1以不同的方式运行,不断监视着大脑内外发生的一切,没有特定意图,也无须付出多少努力,只是对当时的情形作出全方位评估。这些“基本的评估”在直觉性判断中扮演了重要角色,因为人们常会拿它们来替代更难的问题—这也是启发法和偏见研究方法的基本理念。系统1其他两个特点也支持用一种判断代替另一种判断的做法。其中一个特点就是系统1具备跨维度解读价值观的能力,你可以回答一个大多数人都觉得很简单的问题:“如果山姆的身高和智商一样,那么他究竟有多高?”此时思维快捷方式便开始运行了。系统2会集中注意力回答某个特定问题,或是对某种情况的特殊属性进行评估,集中的注意力又会自动运行其他的评价程序,包括一些基本判断。

    看照片预测竞选胜出者,为何其准确率可高达70%?

    随着人类进化不断完善,系统1可以对生物体生存必须解决的主要问题提供一个连续的评估,这些问题包括:事情进展得怎么样了?我们面临的是威胁还是机遇?一切都正常吗?我应该是前进还是退避呢?这些问题也许对于生存在城市中的人而言,不像对大草原上的羚羊那样紧急,但我们有不断进化的遗传神经机制,可以持续不断地对威胁水平进行评估。我们通常用好与坏来评价不同情形,要么说要避开这种情况要么说可以泰然处之,没有问题。人的好心情和认知放松与动物对安全和熟悉程度的判断是相当的。

    如果想找一个“基本判断”的典型例子,想想只需一瞥就能区分朋友和敌人的能力就是了。这种能力能够提高人们在危险世界的生存概率,而这种专属能力也在不断增强。我在普林斯顿大学的同事亚历克斯·托多罗夫(Alex Todorov)曾经对与陌生人接触的安全性问题作出快速判断这一能力的生物学根源进行了探索。他认为我们生来就具有判断的能力,只需瞥一眼陌生人的脸,就能对这个人的两点重要事实作出判断:他有多强势(因此存在潜在的威胁性);这个人有多可信(不管他的用意可能是友好的还是充满敌意的)。脸型为判断提供了许多暗示:方下巴就是强势的信号。面部表情(微笑或皱眉)是对陌生人意图的判断提示,方下巴加上瘪嘴唇也许就预示着有麻烦了。看脸形的精确性不是很高:圆下巴并不代表温顺,笑容(在某种程度上)也是可以伪装的。不过,即使对陌生人作出判断的能力不高,具备这种能力也是我们的生存优势。

    这种古老的机制在现代社会得到重新利用:它对人们如何选举有些影响。托多罗夫向他的学生展示了一些人脸的图片,有时展示的时间只有0.1秒,他让这些学生按不同属性对这些面部图片进行评估,这些属性包括可爱程度和做事能力。结果所有学生对这些图片的评估结果非常一致。托多罗夫展示给学生的那些人脸图片并不是随意组合的,而是参加竞选的那些政治家的照片。大选结束后,托多罗夫将选举结果和普林斯顿大学学生所作出的能力评估进行了比较,这些学生当时并不了解这些候选人的任何政治背景,仅凭自己对这些照片的匆匆一瞥就作出了评估。事实证明,约有70%的参议员、国会议员和地方长官的竞选活动的胜出者也正是那些在照片评估中获得较高评价的人。这一惊人结果在芬兰的全国大选中得到证实,同样的情况也发生在英国的地区选举中,澳大利亚、德国和墨西哥的众多选举中也发生过类似事件。令人惊奇的是(至少对我而言是这样的),在托多罗夫的研究中,能力评估远比可爱程度的评估对选举结果的预见能力强。

    托多罗夫发现,人们总会结合力量和可信度两方面因素来评估一个人的能力。刚毅的方下巴和自信的微笑便可告诉我们,这个人很有能力。没有证据显示这些面部特征确实能预示某些政治家可以当选,但关于人们对胜出和出局候选人的判断研究显示,我们往往在投票前就会对那些不具备我们认可的面部特征的候选人持否定态度。在他的研究中,失败者引起的(负面)情感回应更强烈,我将这个例子称为“判断启发法”案例,接下来的章节中会沿用这个说法。投票者尝试着对候选人将来的任职表现生成一种印象,他们又转而依靠系统2快速自主地作出一种更加简单的判断,这一系统只有在必要时才会作出这一判断。

    许多政治学者也循着托多罗夫最初研究的路子继续深入研究这一问题,他们划定了一类投票者,这类投票者往往会不由自主地听从系统1的指挥。这些投票者经常看电视,对政治却所知甚少,而那些政治学者在他们身上找到了自己一直在寻找的东西。不出所料,对于那些信息贫乏、爱看电视的投票者来说,面部特征表现出的能力对其投票的影响较大,其受影响程度约为那些信息丰富、看电视少的投票者的3倍。显然,系统1对投票选择的影响因人而异,下文中我们还会遇到一些体现个体差异性的例子。

    当然,系统1理解语言,这种理解是建立在一些基本判断基础之上的,而这些判断通常又是在洞察事实和理解信息的基础上作出的。这些判断包括对相似度和代表性的判断,对因果关系的属性以及对联想和样本的可用性的判断。尽管判断的结果是用来满足任务要求的,但是没有具体任务时,这些判断活动照样也在进行着。

    基本判断的内容很多,但并不是每个可能的属性都需要判断。例如,我们可以简单看看图7。

    一眼看去,你便会对该图的很多特征有个初步印象。你知道左右两个长方体一样高,也很相似。然而,左边那个长方体的方块数和铺在平面上的方块数是不是一样,这可不是瞥一眼就能明了的事,而且你也想不出这堆方块能摞成多高的长方体。

     [image file=Image00008.jpg]

    为了证实左面长方体的方块数目和中间的方块数目相同,你需要数一下这两堆方块,对比一下结果,这个活动只有系统2能完成。

    平均长度与总长度是完全不同的数量概念

    还有一个例子,请看这个问题:图8中各条线的平均长度是多少?

     [image file=Image00009.jpg]

    这个问题很简单,系统1无须任何提示就能回答。实验显示,人们在不到一秒钟的时间里完全可以精确地记下很多线段的平均长度。此外,观察者的认知系统即使正忙于记忆,这些判断的精确度也不会受到影响。认知系统未必知道如何用英寸或厘米为单位来描述平均值,但是如果让其判断另外一条线是否符合平均值,它们的判断也是非常精确的。对于一组线的长度标准生成一个印象无须系统2的参与,系统1会自主且毫不费力地完成这一任务,就像它记一组线的颜色和它们之间不相平行的事实一样轻松。我们也可以立刻对众多物品的数量生成一个印象,如果其数量只有4个或少于4个的话,印象会很精确;如果更多的话,就会变得模糊。

    现在我们来讨论另外一个问题:图8中所有线的总长度是多少?这是一种全新体验,因为系统1无法为回答这个问题提供建议。为此题作答的唯一办法就是启动系统2,系统2会尽力估计平均值,评估或数出有几条线,用平均长度去乘条数得出结果。

    仅凭一瞥系统1计算出一组线的总长度,其结果多半不对,这一点你很清楚。你认为自己绝不会这样做。事实上,这是该系统一个重要的局限性。因为系统1通过原型或一组典型事例来代表不同事物分类,它能解决好平均问题,但对总量问题就束手无策了。一个类别的规模及其所包含的实例数量,在我们判断总额变量时常常被忽略掉了。

    在我们进行的众多实验中,有一项是根据那次损失惨重的埃克森–瓦尔德斯号(Exxon Valdez)原油泄漏事件的诉讼而设计的,我们询问受试者是否愿意掏钱买网来覆盖油池,因为这些油池常淹死迁徙的鸟类。受试者组成的不同小组分别表明了各组的意愿,他们愿意掏钱来拯救鸟的数量分别为2000只、20000只和200000只。如果拯救鸟类是个经济善举的话,其价值大小就要看总数这一变量了,即拯救200000只鸟应该比拯救2000只鸟更有价值。事实上,3个组的平均捐款分别是80美元、78美元和88美元,与鸟的数量没有什么关系。3组受试者做出反应的对象为原型—一只无助的小鸟被淹死的可怕画面,鸟的羽毛浸泡在黏稠的原油中。实验人员屡次发现,在这样的情形下,受试者几乎完全忽略了数量的概念。

    与强度等级匹配的描述

    诸如你的幸福感、总统受欢迎的程度、金融骗子的合理惩罚和政治家的未来前景等问题有一个共同的重要特点:这些问题都涉及隐含的强度或数量概念,因而我们也就可以使用“更”这个词对其进行描述:更幸福、更受欢迎、更严厉或(对政治家来说)更有力度。例如,一个候选人的政治前景可能是“她在首轮竞选就会出局”这样的背运,也可能是“她有朝一日会成为美国总统”,身居高位。

    接下来我们会了解到系统1的又一新能力。强度的等级在不同领域中都有“匹配”描述。如果罪行是颜色,杀人就应该是深红,颜色比偷窃更深。如果犯罪用音乐来表达,大屠杀就应该用强音,而停车不付钱则应该用弱音。当然,你对惩罚的强度也有类似的感觉。在传统的实验中,有些人用声音的大小来表达犯罪的严重性;其他人用声音大小来表达法律惩罚的严重性。如果你听到了两个声音,一个是表达犯罪的,一个是表达惩罚的,如果一个声音比另一个声音更响的话,你会有不公平之感。

    请思考这个例子(后文中还会提到这个例子):

    朱莉4岁时就能阅读。

    现在请将朱莉这个孩子的阅读能力与下面的强度等级进行匹配:

    若某人的身高和朱莉的早慧程度一样,那他有多高?

    你觉得6英尺(1英尺=0.304 8米)怎么样?显然太少了。那7英尺呢?也许又太多了。你希望找到一个高度能匹配4岁孩子极强的能力。虽然很强,但并不超群。15个月大就能阅读才是超群的能力,这就跟一个人身高7.8英尺一样。

    你的工作收入多高才能与朱莉的阅读能力相匹配呢?

    什么罪行的严重程度可以与朱莉的早慧程度相匹配呢?

    常春藤大学的毕业学分积点多高才能与朱莉的阅读水平相匹配呢?

    上述问题并不是很难回答,对吧?此外,可以肯定的是与你同处一个文化领域的人作出的匹配与你的回答会很相近。我们发现,人们根据朱莉的阅读年龄这一信息预估她的学分积点时,他们通过一种范畴向另一范畴的转换来回答这个问题,并且选出了相应的学分积点值。我们也明白为什么这种利用匹配进行预测的模式从统计学角度来看是错误的,尽管对于系统1来说这很正常,但对于统计学家以外的大多数人来说,系统2也可以接受这种做法。

    思维的发散性让我们作出直觉性判断

    系统1任何时候都可以同时进行多种估算,其中有些估算是持续不间断的常规评估。只要眼睛是睁开的,你的大脑就会对视觉范围内呈现出的立体事物进行评估,这种评估是对这些物体的形状、空间位置和特性等因素的全方位评价。这一评估活动的运行或对违背期望的事物进行持续监督的行为都是无意识的。与这些常规评估不同,其他评估行为只有在需要时才会进行:你不会持续评估自己有多高兴或多富裕,即使热衷政治,你也不会一直不间断地评估总统的执政前景。偶尔的判断是主观自愿的,这种判断才是有意识的。

    你不会不由自主地数出每个读到的词的音节数,但如果你选择这样做,就能数对。不过,想要使刻意计算的结果很精确并非易事:我们计算的结果往往比自己想要的或需要的要多。这种过量计算的过程就体现了“思维的发散性”。如同想用散弹猎枪瞄准一个点是不可能的一样(它射出的子弹是分散的),想要让系统1完全执行系统2的命令且不做多余的工作也很难,这一点与散弹枪很相似。我很久以前从书上看到的两个实验就表明了这一点。

    其中一个实验让受试者听几对词,若他们听出这些词是押韵的,要马上按下一个键。下面两组词都是押韵的:

    VOTE–NOTE

     VOTE–GOAT

    在你看来,区别很明显,因为你看到了这两组词,而受试者只能听到单词。“VOTE”和“GOAT”押韵,但它们的拼写不同,虽然受试者听到了这两个词,但他们也会受到拼写的影响。如果两个词的拼写不同,受试者听出它们是押韵的速度就会慢些。尽管要求是比较声音,但受试者同时也对两者的拼写进行了比较,而且与声音无关的不匹配因素妨碍他们迅速作出判断。刻意回答一个问题却引起了另一个问题,这一行为不仅没必要,而且对主要任务的完成也很不利。

    在另一项实验中,受试者听了几个句子,如果句子是真实的,就要马上按下一个键,如果是假的,就按下另一个键。对以下这些句子的正确回应是什么呢?

    有些路是蛇形的。

    有些工作是蛇。

    有些工作像监狱。

    这三个句子从表述上来看都是错的。不过,你很可能已经注意到了第二个句子比另两个句子错得更明显,实验也证实了这一本质性不同。之所以存在这种不同,是因为第一句、第三句两个难句从比喻角度看是正确的。这次又是要进行一个预估活动却引起了另一个预估行为,而且,正确答案在冲突中更明显,但这个与回答并不相关的冲突却影响了系统的正常运行。在下一章中我们会发现,思维的发散性和强度匹配结合起来就可以解释为什么我们对很多自己不很了解的事情能够作出直觉性判断。

    示例—判断问题“评价一个人是否有吸引力是一种基本判断,不管你是否想这样做,这种评价都是不由自主进行的,也会对你产生影响。”“我们的大脑中有一些线路,这些线路可以从脸型来推断一个人统领大局的能力,即他看上去有些领导气质。”“如果强度与罪行不匹配,惩罚则不可能公正。就像是你可以用光的亮度来与音量的大小匹配一样。”“关于思维的发散性,有这样一个明确的例子:他被问及是否认为这家公司财力雄厚时,他想到的却是该公司令其钟情的产品。”

    第9章 目标问题与启发性问题形影不离

    关于你的思维活动,有一点值得注意,即你很少被问题难倒。的确是这样,偶尔你会碰到这样的问题:17×24=?你无法立即想到这个问题的答案,但这种让人目瞪口呆的时刻毕竟是少数。当大脑处于正常的状态时,你几乎对眼前出现的所有事物都会有直觉和想法。对一个人不是特别了解时,你就知道自己是不是喜欢他;你也不知道自己为什么会相信或者不相信一个陌生人;你没有作过调查分析,却能感觉到一家企业一定会成功。有时,对于一些无法完全弄懂的问题,你也总能作出答案,而回答的依据是什么,连你自己也说不清道不明。

    找个相对简单的问题来作答

    我简单描述了如何从复杂的事情中提取直觉性的观点。对于有难度的问题,我们总是很难快速找到令人满意的答案,此时系统1就会找到一个相关问题来回答,这个问题比原来的问题更易作答。我把这种回答一个问题而绕开另一个问题的做法叫做“替代”。我还将采用以下术语:

    “目标问题”就是你想要作出的评估。

    “启发式问题”就是你绕开原来的问题去回答的那个更简单的问题。

    “启发”这一术语是指协助寻找各种难题的恰当答案的简单过程,虽然找到的答案常常并不完美。这个词和希腊语eureka(意为“找到了”)是同根词。

    我和阿莫斯在共同工作的早期就想到了替代这一概念,它也是启发法和偏见研究法的核心内容。我们自问:人们在对可能性没有任何了解的情况下,是如何成功作出可能性判断的呢?我们得出的结论是,人们一定不知道通过什么方式将不可能完成的任务简单化了,由此,我们开始研究他们是如何做到这一点的。我们的答案是,当人们按照要求对可能性作出判断时,他们实际上是对其他的事情作了判断,并且认为自己已经完成了判断可能性的任务。遇到很难的“目标问题”时,如果脑海中马上出现了一些与之相关联且容易回答的“启发性问题”的答案,系统1通常便会采取这种“替代”的做法,采用替代问题的答案。

    用一个问题替代原来的问题是一个解决难题的好策略,乔治·波利亚(George Pólya)在他的经典著作《怎样解题》(How to Solve It)中提到了替代问题:“如果你无法解决某个问题,就去解决另外一个简单点的问题好了—去找这个简单的问题吧。”波利亚的启发法是系统2有意实施战略性决策的过程。不过,我在本章讨论的启发法案例并不是精心挑选的,而是思维发散性造成的结果,是我们锁定问题答案控制能力不强的结果。

    请看下面的“目标问题”。它们都很难,在给出合理的答案之前,你肯定会先处理些其他难题。幸福的含义是什么?未来6个月会有哪些可能的政治动向?其他金融犯罪的标准量刑是什么?候选人的竞争有多激烈?还有哪些环境因素或者其他原因需要考虑?想要真正解决这些问题根本不可能。但是你不要受制于完全理性的答案,经过认真推理之后,可以找到启发性的替代答案,尽管这种方法有时很好用,而有时却会导致严重的错误。

    目标问题启发式问题

    你愿意为拯救濒危物种捐多少钱?

    你这些天对生活满意吗?

    今后6个月里总统受欢迎的程度如何?

    欺骗老人的理财顾问应受到何种惩罚?

    这位竞选总统的女士能在政治道路上走多远?

    启发式问题

    想到垂死的海豚时,我的情绪波动有多大?

    我现在的心情如何?

    总统现在有多受欢迎?

    想到金融骗子,我会有多生气?

    这位女士看上去像是个政治赢家吗?

    思维的发散性可以使懒惰的系统2摆脱很多繁重的工作,快速找到难题的答案。“启发式问题”相对于“目标问题”更容易让人产生联想并作出回答。你对海豚和金融骗子的感觉,你现在的心情,你对自己看好的竞选人政治能力的印象,或者总统现在的立场等,都会立即呈现在你的脑海中。启发式问题给每个有难度的目标问题都准备了一个现成的答案。

    上述说法中存在一定的不足:没有指出答案应该与原始问题存在关联。例如,我对垂死海豚的感觉一定要用钱来表示,这一点让人费解。而系统1的另一项能力,即强度匹配,可以解决这个问题。情感和捐款都是按强度分级的。我对海豚的感情可能很强烈,也可能很淡薄,而我捐款的数目会与我对海豚的感情强度相匹配,我脑海中出现的钱数就是匹配量。相似的强度匹配可能适用于所有的问题。例如,不同竞选者的政治表现可以从很糟糕到非常出众。同样,衡量政治成功等级也包括“她在首次竞选就会出局“的最差表现和”她将来会成为美国总统“的最佳表现。

    思维发散性的自主过程和强度匹配可以使能映射到目标问题的简单问题有一个或多个答案。有些情况下会有替代答案,系统2会认可这一启发式答案。当然,系统2也可以拒绝这个直觉性答案,或者通过整合其他信息来改变它。但是,一个懒惰的系统2往往会遵循最省力法则,不经检验就认可某个启发式答案。你不会被难倒,也不必非常努力,甚至都没有注意到自己其实答非所问。此外,你也许都注意不到目标问题很难,因为你的头脑中会很迅速地闪出一个直觉性答案。

    立体启发法:远处的物体看上去更高大

    请看图9并回答下面的问题。

    图9

    如图9所示,右侧的人是否比左侧的人高大?

    我们很快就想到了那个最明显的答案:右侧的人更高大。但如果你用尺子量一下,你会发现实际上他们体型一样。你对他们相对体型的印象受到强大错觉的控制,这种错觉也正是替代过程的最佳解释。

    图中人物经过的走廊被画成了透视图,显得平面越来越深。你的感知系统自动地将这幅图看做是立体的,而不是印在平面上的。在立体透视图中,右侧的人比左侧的人离我们更远,显得更高大。大多数人都会对立体图感觉很强烈。只有视觉艺术家和有经验的摄影师才具备将这幅图看成平面图的能力。对于我们这些人来说,此时就会有替代产生:对立体图像大小的印象左右了我们对平面图大小的判断。错觉的产生是由立体图的启发导致的。

    此时出现的是一个真正的错觉,不是对问题的误解。你知道是图片中3个人的体形造成了我们的错觉,因为它们是印在纸上的。如果有人让你估计这几个人的体型,我们通过实验就会知道你的答案会是用英寸来表达的,而不是英尺。你对问题没有疑问,但你会受到那个并没有被问到的问题的影响,比如:“这3个人有多高?”

    上例中启发法的那个重要环节—立体大小替代平面大小—是自主发生的。图片中包含着一些暗示,这些暗示会让图片产生立体感。尽管这些暗示和要完成的任务—判断纸上人物的体型大小—并无关联,你本该忽略这些因素,然而你却做不到。启发法的偏见是图中看上去更远的物体看上去更大。正如上例所示,基于替代的判断必然会如预想的那样有失偏颇。在这个例子中,基于替代的判断在感知系统中运作得比较隐蔽,根本就是不由自主发生的。

    一些德国学生作过的一项调查堪称替代研究的最佳案例之一。这些年轻人完成的调查包括下面两个问题:

    你最近觉得幸福吗?

    你上个月有多少次约会?

    实验人员对这两个问题的答案的关联度很感兴趣。那些回答自己有很多次约会的学生会比那些约会次数少的人更幸福吗?令人吃惊的是,答案是否定的,两个答案的关联度几乎为零。显然,学生在评价自己的幸福感时,首先想到的并不是约会。

    另一组学生也看到了这两个问题,但次序正好相反:

    你上个月有多少次约会?

    你最近觉得幸福吗?

    这一次的结果完全不同。在这种顺序下,约会次数和幸福感之间的相关度能达到心理测试的最高水平。其间发生了什么呢?

    原因很明确,这就是替代作用的典型案例。约会显然不是这些学生生活的重心(第一次调查中,幸福和约会并不相关),但当实验者要求他们回想自己的浪漫生活时,他们确实有情感上的回应。有多次约会的学生想起了自己生活中快乐的事,而那些没有约会的学生想起的都是孤独和被拒绝的情节。因此看到第二个问题时,由(第一个)约会问题引起的那些情感就在大家的脑子里徘徊,影响他们对这个问题的回答。

    上例中体现的心理活动和图9中的体型错觉带给人的心理体验很相似。评价“最近的幸福感”这种任务并不常见,也不简单,需要仔细思考之后才能给出恰如其分的回答。但是,提到约会情况,这些学生就无须努力思考了,因为他们脑海中早已有了相关问题的答案。这个相关问题就是:他们对自己的恋爱生活满意程度如何。他们将被问及的问题替换成了另一个自己心中已经有了答案的问题。

    在这个实验中,我们同样可以采用与错觉研究相同的做法,可以问一问:这些学生感到困惑了吗?他们是否真的认为这两个问题—他们被问及的问题和他们回答的那个问题—是相同的?当然不是。学生不会一下子把浪漫时光和生活混为一谈,如果让他们说说对这两个词的理解,他们肯定会说浪漫时光和生活不是一回事,但其实他们需要回答的问题并不是两个概念是否相同,他们的问题是最近是否感到幸福,于是系统1就用已有的答案来作答了。

    约会的案例并非特例,如果这些参与实验的学生先看到的问题是与父母或金钱的关系,而后马上看到那个关于幸福的问题,也会发生同样的情形。在两种情况下,满足感在特殊情况下影响了关于幸福感的表达。任何影响人心情的重要情感问题都会产生同样的效果。眼见即为事实。当人们评估自己的幸福感时,他们思维状态的作用就显得非常突出。

    情感启发式:因为喜欢,所以认同

    一旦加入情感因素,结论对论证的主导作用便会最大程度地凸显出来。心理学家保罗·斯洛维克(Paul Slovic)提出了“情感启发式”的概念,认为人们的好恶决定了他们的世界观。你的政治倾向决定了你对各类论证的看法,即它们是令人信服的还是难以服众的。如果你对当前的医疗政策还满意,就会相信该政策能给自己带来很多好处,而且你相信在这个政策下,花同样的钱能做更多的事。如果你对其他国家采取鹰的态度,就很可能会觉得其他国家相对弱小,更有可能对自己的国家俯首帖耳。而如果你的态度像只鸽子,就会觉得它们更强,不会轻易受到牵制。你对辐照食品、瘦肉、核能、文身或摩托车等事物的态度会左右你对这些事物的感受,它们是惠及生活还是充满风险。如果你对这些事物通通都不喜欢,很可能会觉得它们对你而言利少弊多,根本不会给你的生活带来什么好处。

    结论的至高无上并不意味着你的思维完全停止运转了,也不意味着你可以完全忽略信息和合理解释得出自己的结论。在了解到自己并不喜欢的一项活动的风险其实远比自己想象的小时,你的看法乃至情绪就会发生变化(至少会有那么一点变化)。然而,这种较低风险的信息同样也会改变你对该活动益处的看法(你认为益处会更大),尽管你接收到的信息中没有任何与益处相关的信息。

    在此我们又看到了系统2的另一个“特性”。到目前为止,我似乎已经将其描述成一个给系统1留有足够余地的默许监视器。我描述的系统2还具有主动搜寻记忆的功能、复杂计算功能、比较功能、规划功能和决策功能。在球拍和球的问题中以及许多其他的两个系统相互作用的例子中,系统2似乎总是处于最高决策地位,并有能力抵制系统1的建议,它能使事情放缓,开始进行逻辑分析。自我批评是系统2的功能之一。但在态度方面,系统2更像是系统1各种情感的赞许者而非批评者,也可以说是其各种情感的转让者而非实施者。它搜寻的信息和论据多半局限于与已有看法一致的信息,并不着意对其进行调查审核。积极且追求连贯的系统1为要求不高的系统2提供了各种解决方案。

    示例—替代和启发法“还记得我们绞尽脑汁去回答的那个问题吗?我们是不是把它换成了一个简单点的问题呢?”“别人问我们的问题是这位候选人是否会成功,但我们要回答的问题似乎是她是否能成功应对采访。咱们还是别顾左右而言他了。”“他喜欢这个项目,因此他认为该项目投入少、回报高。这是情感启发式的一个典型案例。”“我们将去年的表现作为依据来预测公司未来几年的表现。这个依据能作为有效参照吗?我们还需要其他什么信息才能作出正确预测?”下面列出了系统1的特点和活动。每个主动句都代替了一个陈述句,虽然表述更精确了,但却更难理解了,因此大脑便开始自主且快速地运行。我希望这个对大脑特性的描述能帮你形成一种对虚拟的系统1各种“特性”的直觉认识。与身边的很多人一样,你对系统1在不同情况下如何运作会有直觉的认识,而且其中大多数直觉都是正确的。

    系统1的特点

    ·生成印象、感觉和倾向;当系统2支持这些行为时,它们就会成为信仰、态度和意图。·自主且快速运行,只需付出较少努力,甚至不用付出努力,没有自主控制的感觉。·当发现(搜寻)特殊形式时,能接受系统2编控来调动注意力。·在接受了一定的训练后,能够做出熟练的回应,产生直觉。·为联想记忆激发出来的各种想法创造连贯形式。·将认知放松感和真理错觉、愉快的感觉以及放松的警惕感联系起来。·区分常态中令人惊奇之事。。推断原因和意图。。忽略歧义,按捺住心中的疑问。·夸大情感的一致性(光环效应)。·将注意力集中在当前的证据上,忽略不存在的证据(眼见即为事实)。·作一些基本估测。。通过常态和原型来表现集合,但不要将两者看成一个整体。·通过测量确定不同程度对应的匹配物(比如音量的大小)。·真正去计算,而不是空想(思维的发散性)。·有时用简单点的问题替代难题(启发法)。·对变化的感知比对形态的感知更敏锐(前景理论)。*·对可能性作出过高估计。*·对数量越来越不敏感(心理物理学)。*·对损失的反应比获得更强烈(损失厌恶)。*·严密设计决策问题,分别进行讨论。* *带*的内容将在本书第四部分作详细介绍。

  • 刘启君:改革开放以来中国腐败状况实证分析

    改革开放以来,中国的经济建设取得了举世瞩目的成就,但与此同时,一些社会问题也凸显出来,腐败就是其中之一。那么,改革开放以来中国的腐败交易活动到底严重到何等程度?哪些部门腐败问题最为严重?哪些人群是腐败交易活动主要群体?在中国的经济发展进程中,腐败活动水平是趋于上升还是下降?找到这些问题的答案,不仅是社会民众的热切期望,也是当前中国反腐败策略制定及制度设计的迫切需要。本文利用1978年至2012年已经审理结案的一万余起腐败案例中所包含的信息,分析了改革开放以来我国腐败活动的发展变化趋势及其主要特征。

    研究回顾

    研究一个国家或地区一个历史时期的腐败活动,需要真实可靠的数据支持。但是众所周知,与其他社会活动不同,腐败活动具有隐蔽性,不能直接观察,于是,关于腐败活动的具体统计数据也就不可能获得。没有可靠的数据,怎么能够知晓一国在一定时期内发生了多少腐败交易?又怎么能够判断在某一时段腐败活动水平的发展趋势?

    到目前为止,国内外学者绝大多数都是根据主观腐败指数开展腐败研究。腐败研究文献中使用较多的腐败指数有:商业国际(Business International)编制的“商业国际指数(Business international index,BI)”、透明国际组织(Transparency International)编制的“腐败感知指数(Corruption Perception Index,CPI)”、世界银行编制的“腐败控制指数(Control of Corruption Index,CCI)”、世界各国风险指南编制的“世界各国风险指南指数(International Country Risk Guide index,ICRG)”以及瑞士洛桑国际管理发展研究院(International Institute for Management Development,IMD)编制的“世界竞争力年鉴指数(World Competitiveness Yearbook index,WCY)”。其中一些指数已经连续编制、发布多年,如CPI指数和ICRG指数,使用起来非常方便,既可以对各国腐败水平进行横向比较、开展跨国研究,也可以对一国腐败活动水平进行纵向评估,因此,深受各国学者的欢迎。但是,随着时间的推移,上述指数的可靠性越来越受到质疑,1以它们为基础开展腐败研究经常得到相互抵触的结论。究其原因,是这些指数的测度对象不是腐败活动,而是个人对腐败活动的主观感知水平,是腐败现实状况的一个“投影”。由于主观指数这一与生俱来的缺陷,各国学者开始另辟蹊径,寻找新的研究方法。例如,有学者将实验经济学方法应用于腐败研究,通过特定的场景设计,观察来自不同文化背景的被测试者的反应,据此研究腐败与文化之间的关联性。这种方法显然比主观指数更加接近现实,不过它的研究设计或多或少含有人为控制的成分。

    努力寻求客观数据研究腐败,是近年来腐败研究的一个发展趋势。根据我们收集的资料,国内外腐败研究文献使用的客观数据一共有四种。第一种是官方数据。国内不少学者利用中国最高人民检察院、最高人民法院以及国家审计局等政府机构公开发布的贪污腐败案件侦查结果数据,研究我国腐败活动发展趋势、腐败成因、腐败效应以及反腐败成效;国外也有一些学者采用这类数据研究腐败,例如,魏德曼搜集我国中纪委和最高法院公布的腐败案件数据,研究“发展-腐败悖论”问题;科尔等人以最高人民检察院公布的腐败案件数据为基础,形成中国1998~2003年省级面板数据,据此分析中国反腐败省际差异及其对招商引资的影响。第二种是直接腐败经验数据。目前最具代表性的,是联合国区域犯罪与执法公正研究院(UNICRI)编制发布的“国际犯罪受害者调查(International Crime Victim Survey)”数据,该机构在世界各地,通过面谈或电话采访形式收集个人行贿或被索贿经历,是目前西方学术界公认的直接腐败经验数据,美国学者采用该数据分析了腐败活动的微观基础,发现不同国家、不同个体特征是腐败交易最终能否达成的决定因素;尼泊尔学者采用一项针对加德满都853位居民的调查数据,证实个体腐败倾向性和受教育程度是决定一国腐败活动水平的两个关键因素;刘启君和彭亚平运用中国高校腐败经历问卷调查数据,证明信息不完全、社会成员异质性、相互信任水平以及微观腐败环境是引起腐败均衡路径转换的重要变量。第三种是个案追踪调查数据,即通过对特定公共项目资金使用情况进行跟踪调查研究腐败。这一方法最早由世界银行研究人员使用,研究世界银行对乌干达教育、健康援助资金被截留挪用情况。最为典型的一个个案追踪研究,是哈佛大学的奥肯对印度尼西亚乡村道路建设项目的跟踪调查。在世界银行资助下,他组织了100余人的研究团队,前后历时12个月,在每条道路上采集分析样本,逐一测定筑路材料数量,向当地筑路材料供货商询问各种材料价格,向当地村民询问筑路项目实际支付的工资,然后独立构造筑路材料实际使用量的估计,再与村民反映的使用量进行逐项比对,最终形成客观数据。第四种,是研究者利用各种途径自己收集腐败案例形成的数据。早在1983年,就有学者收集中国1977~1980年间媒体曝光的275起腐败案件,对中国改革开放初期的腐败概况进行统计分析。近年来采用这种数据开展的独立研究日见增多,例如,意大利学者通过查阅司法档案、统计官员犯罪数量来研究意大利的腐败成因及其经济后果;过勇利用清华大学廉政与治理研究中心腐败要案案例库,通过建立5大类31项指标,对收入案例库的1978~2005年期间发现和惩处的594个腐败要案展开系统分析,并对经济转轨影响腐败的机制进行实证检验;王一江等人收集整理了130个政府官员腐败案例,就腐败的微观影响因素进行了剖析,发现官员的职级与受教育程度是影响腐败程度的两个显著变量;公婷、吴木銮根据《检察日报》2000年至2009年公开报道的2802起腐败案例,描述、分析了我国腐败活动的一些重要特征。

    上述四种数据有一个共同特征:都是以已经发生的腐败活动为统计对象。无疑,腐败研究最可靠、最牢固的基础,就是现实世界实际发生的腐败交易活动本身,据此分析得出的研究结论才真实可信。

    数据来源

    本文使用的数据属于上述客观数据的第四种,取材于1978年至2012年期间已经审理结案的贪污腐败案件。我们通过多种途径,收集各级各地人民法院的贪污腐败案件《判决书》,历时3年多,总共收集到一万余起腐败交易案例,建成了“中国转型期腐败案例数据库”。根据中国人民检察院和最高人民法院公布的数据,改革开放以来,我国立案查处各类经济案件和贪污腐败案件已经超过一百万起,平均每年3万余起。据此计算,本文收集的案例数量大约为全部已经立案查处案件的1%左右,这就是说,本文采用的分析样本所包含的腐败交易活动只是全部已经披露的腐败交易活动的一小部分,而已经披露的腐败活动又仅仅是实际发生的腐败活动中的一部分。尽管如此,就我们所知,这是目前已知最大的腐败案例数据库。如前所述,根据已经发现的腐败案例研究腐败活动特征和规律,也是在无法获取完整腐败数据条件下的最优选择。

    利用案例库,尤其是案例数量足够大的腐败案例库数据分析腐败活动有如下几个优点:第一,数据可靠。在我国,腐败案件一旦立案、进入案件审理程序,每一笔腐败交易都须经人证、书证、物证确认,只有在腐败交易双方对同一笔交易都有书面材料、交易细节陈述吻合或出具直接证据时才予以认可。因此,经过严格审理程序认定的每一笔腐败交易,一定是实际发生的腐败交易。第二,数据真实。研究腐败活动规律和特征,需要的是真实数据。腐败案件《判决书》忠实记录了每一笔腐败交易发生的时间、地点和场所,我们可以以实际发生时间为统计基础,从而可以确保数据的客观真实,这是官方数据所不可比拟的。第三,数据全面。我们收集的腐败案例总数达11752个,时间跨度30多年,平均每年300多个,案例涵盖全社会各个领域、各个层次发生的腐败交易活动,以此作为分析素材,可以揭示我国转型期腐败交易的基本走势,反映该时期腐败活动的基本状况。第四,可以获得反映腐败交易诸多侧面的微观数据。这是官方公布的腐败案件数据和通过媒体收集的腐败案例整理而成的数据所无法提供的。从官方总量数据中看不出具体部门、行业的腐败活动情况,也不能计算腐败交易强度;各种媒体披露的腐败案例有一部分细节,但往往又受到保密等各种限制,而且通讯报道通常更愿意选择腐败大案、要案或案情奇特、有社会渲染力的案例作为报道对象。而我们所用的案例库数据则不同,我们根据法律文本,将每一个腐败案例分解为43个指标逐一予以统计,由此形成的基础数据可以提供研究所需的诸多细节资料,这对于我们分析腐败交易活动特征、发现腐败交易活动的一些基本规律提供了有力支持。

    中国改革开放以来腐败活动总体情况

    我国改革开放以来腐败交易活动的总体发展趋势,是人们普遍关注的焦点之一。为了对这一时期的腐败交易活动总体状况形成一个基本认识,我们分别从微观和宏观两个层次来进行描述。

    (一)从微观层次来观察我国改革开放以来的腐败状况

    我们以腐败主体为统计对象,以个人腐败交易次数、每次腐败交易金额、个人从事腐败活动的时间跨度以及腐败交易发生时腐败主体的年龄等四个维度,描述我国转型期的腐败活动基本情况。表1给出了上述指标的统计结果。数据显示,样本期内个人腐败交易次数最小值为1次,最大值173次,均值3.35次。观察个人腐败交易频率分布可以发现,单次交易占47.3%,其余为多次交易,其中绝大多数为1~10次,占总量的95.0%。在多次腐败交易中,交易次数为2次的所占比例最大,达33.1%,其次为3~5次、6~10次和10次以上,分别占21.0%、13.7%和7.7%。这就是说,我国转型期的腐败交易活动,以多次重复交易为主。从个人参与腐败交易的时间跨度看,有63.1%的腐败交易在1年内完成,连续两年从事腐败交易的人数占19.9%,另有17.0%的腐败主体长期从事腐败交易活动。在长期从事腐败活动的人群中,有97.0%的人在6年之内被发现,而最长的时间跨度达18年之久!

    腐败主体的年龄最小值为16岁,最大值为78岁,均值为40.9岁,中位数为42.0岁;其中,交易频率最高的年龄为42岁,占4.7%,其次是38和40岁,各占4.0%。腐败主体绝大多数为男性,占总数的89.2%,女性仅占10.8%。案卷资料显示,女性腐败主体绝大多数为两类人群:财务工作人员或者是与机构、部门主管关系密切者。腐败主体的年龄构成基本呈正态分布,26~55岁是腐败高发年龄段,接近全部腐败交易总数的90%(88.5%),峰值落在41~45岁年龄组,占20.0%,20岁及以下年龄组和60岁以上年龄组数量最少,分别占1.6%和0.8%。上述统计结果,应该说与现实比较相符,26岁至55岁是一个人社会活动最为频繁的时期,而41岁至45岁往往是个人职业生涯的鼎盛阶段,这一阶段恰恰也是陷身于腐败活动的危险期。

    人们普遍关心的一个问题是,我国转型期的腐败交易强度到底有多大?根据我们的样本资料,历次腐败交易中交易金额最小值为1.07元,最大值为14890万元,均值268786.17元,中位数6000元;其中,交易金额500元及以下的累计占13.5%,1000元及以下的累计占22.4%,5000元以下的累计占43.5%;单次交易金额在5000元至1万元(含)的占全部交易次数的17.7%,1万元以上至5万元(含)的占19.7%,5万元以上至10万元(含)的占7.1%,10万元以上至50万元(含)的占8.5%,50万元以上至100万元(含)的占1.5%,100万元以上的占2.0%。根据我国《刑法(1997)》规定,贪污腐败案件累计金额达到5000元即可立案,据此,样本中56.5%的案例仅一次交易金额即已达到立案标准。

    进一步观察腐败交易金额频度分布,我们发现一个有趣的现象:出现频率高的腐败交易金额全部为整数额,而且部分数额的出现频率明显高于其他整数(详见图1)。其中,出现次数最多的是1万元,占总数的6.6%,其次为5000元和2000元,分别占4.7%和4.4%;此外,1万元与10万元是两个明显的整数关口,在这两个整数之后,其余整数额出现的频率基本上呈逐渐下降趋势。这表明,腐败活动经常以整数额进行交易,而且多以1千元、2千元、5千元、1万元、2万元、5万元、10万元等整数额交易。

    (二)从宏观层次考察我国改革开放以来的腐败活动情况

    依照国际惯例,我们采用腐败广度(breadth of corruption)和腐败强度(depth of corruption)两项指标从宏观层次衡量我国转型期腐败交易活动水平,腐败广度指标以年度交易次数表示,腐败强度指标则以平减后的腐败交易额年度均值表示,结果见图2。

    从图2中可以清楚地看出,改革开放以来,我国实际发生的腐败活动,就腐败交易次数而言,基本呈波浪式上升之势,先后大致经历了四个阶段性周期变化:1978~1982年为第一阶段,历时5年,波峰出现在1981年;1983~1990年为第二阶段,历时8年,波峰出现在1988年,1985年曾经出现过一次跳跃;1991~2001年为第三阶段,历时11年,波峰出现在1998年;2002年以后为第四阶段,波峰出现在2003年,随后呈逐年下降趋势,尤其是2008年之后出现锐减。出现这一情况与腐败活动的潜伏期有关。根据案例库数据分析,1978~2012年期间,腐败活动的平均潜伏期为2.86年,而一个腐败案件从交易实际发生到被发现,从立案、审理直至最终判决都存在一定时滞,据此推算,2008年以后实际发生的部分腐败交易可能尚未发现,或虽已发现并立案但尚未判决。比较四个阶段,可以发现如下几个特征:一,腐败交易活动周期在逐渐拉长;二,整体走势虽然逐渐上扬,但上升的速度却逐渐下降,这可以由两组数据予以证实:各周期的峰值环比分别为232.2%、150.4%和100.3%,各周期的平均交易次数环比分别为221.7%、188.1%和100.5%,这两组数据表明,由第一阶段到第二阶段上升速度最快,后者是前者的两倍有余,第二阶段到第三阶段上升速度下降到不到两倍,第三阶段与第四阶段则基本持平。

    与腐败交易次数波浪式上升走势不同,我国改革开放以来的腐败交易强度呈现明显的“单峰”走势:自1978年起逐步上扬,至1998年上升至顶峰,年平均交易金额达到377725.32元,随后基本呈逐年下降趋势,期间只有2002年呈现过一次跳跃,2010年又开始略有回升(见图2)。虽然各年份平均腐败交易强度起伏较大,但仍然可以清楚看出,1978年至1989年年均交易金额还处于较低水平:12年平均交易金额为2311.06元,即使是年均值最高的1989年也还在万元之内,为6548.94元;然而,1990年交易均值一举突破万元关口,骤然跃升至26239.54元,恰好为1989年均值的4倍。1990年至2010年的21年间,年均值跳上一个新高度,平均额达到69001.52元,是前一阶段均值的29.9倍!而且,自1990年起,腐败交易年度均值再也没有低于一万元。

    国内学者经常以官方公布的腐败大案、要案绝对数为指标评估我国的腐败活动状况,例如,王传利、倪星和王立京先后以这两个指标作为我国反腐败周期的分析依据。根据我国《刑法》,1997年以前的腐败“大案”标准为累计贪污腐败金额达到1万元,1997年执行新《刑法》以后该标准提高到5万元;腐败“要案”则是指腐败主体为县处级以上政府官员。考虑到腐败大案标准前后不一致这一特殊情况,我们以1997年为界,根据腐败交易实际发生年度分别予以统计,并且以“大案、要案数量在当年度全部腐败交易活动中所占比例”作为分析指标,这样,不论立案的影响因素如何变化,被查处案件终究是实际发生的腐败交易活动中的一部分,只要没有就案件类型结构加以人为控制,大案、要案比例应该可以反映样本全体的比例。统计结果见图3。

    腐败大案比重可以反映腐败交易强度变化,一年中大案比例上升则表明腐败交易强度增加。由图3可见,自1978年起,我国腐败大案占比呈逐年上升之势,直至1996年腐败大案在当年度查处腐败案件中达到75.5%。或许是出于办案效率的考虑,我国司法机关于1997年将大案标准提高到5万元,所以,图中1997年以后的大案比例明显低于前期。尽管如此,1997年以后,大案比例仍然维持在较高水平,经过6年不大的波动之后,2003年又上升至55%,而且此后依然保持在高位。以1997年为界,前18年内大案比例均值为26.4%,后14年内大案比例均值上升为32.1%,净增长21.5%。考虑到前后期大案法定标准的调整,可以确认,改革开放以来,我国腐败交易活动强度在不断增加。

    腐败要案数量变化反映腐败主体中县处级以上政府官员参与腐败交易的变化情况。由图3可知,1992年以前的数据特征表现为零星状态,表明县处级以上政府官员的腐败交易活动并不活跃;1992年以后,县处级以上官员的腐败活动明显上升。以2002年为界,腐败要案分布大致可以分为两个周期;第一个周期的峰值出现在2000年,县处级以上政府官员腐败交易在当年度腐败交易活动中所占比例达到16.2%;第二个周期的峰值出现在2006年,达13.5%。结合各年度腐败交易活动绝对数量,可以得出这样的结论:改革开放以来,我国县处级以上政府官员的腐败交易活动以1992年为界分为两个阶段,第一阶段发生数量较少,第二阶段数量明显增加;第二阶段以2002年为界分为两个周期,两个周期均呈先扬后抑的走势。

    综合以上分析,改革开放以来我国腐败交易活动状况确实令人堪忧:第一,腐败交易基本呈愈演愈烈之势,不仅一般性腐败交易次数逐级上升,而且大案、要案数量在年度交易数量中所占份额同样表现为逐步上升走势;第二,腐败交易强度大,1990年之后,腐败交易强度跃上一个新台阶,后一阶段年度均值几乎为前一阶段的30倍之多;第三,腐败交易活动猖獗,其中半数以上为重复交易,同一腐败主体的交易次数最高竟然多达173起,前后从事腐败交易活动长达18年之久而未被发现,足见监管缺位的严重程度。按部门统计的腐败活动情况

    为进一步观察腐败活动的变化情况,我们根据腐败交易实际发生时腐败主体所隶属的部门分别统计,将全部腐败交易分为五个组别,分别为“党政机关”、“国有企业”、“事业单位”、除国有企业之外的“非国有工商企业”以及“其他部门”。

    假如仅仅从腐败交易次数观察,国有企业数量最大,占全部样本总数的36.7%;其次是党政机关,占26.6%;再其次是事业单位和其他部门,分别占13.1%和13.2%;腐败交易次数最少的是非国有工商企业,占10.3%。这似乎与人们通常感知到的腐败交易情况比较吻合。从腐败交易强度指标看,初步统计结果表明,年度平均腐败交易金额由高至低分别为国有企业、事业单位、非国有工商企业、党政机关、其他部门。国有企业腐败交易水平最高,平均每次腐败交易金额为510572.16元,是位居第二的事业单位(平均交易金额188672.63元)的2.7倍,是非国有工商企业(167013.90元)的3.1倍、党政机关(133577.40元)的3.8倍、其他部门(27846.17元)的18.3倍、样本全体均值(268786.17元)的1.9倍。据此,我们可以认为,样本期内国有企业的腐败交易活动水平在所有部门中最高。

    人们最为关注的党政机关工作人员腐败问题,就腐败交易强度而言并不是最高的,在五个组别中位列第四。党政机关腐败交易活动有两个峰值。第一个峰值出现在1990年,1989年以前,各年度平均交易金额波动较小,1990年猛然跃升至481726.14元,为此前各年度均值(6429.31元)的74.9倍;随后逐年下降,分别于1994~1995年、1997~1999年出现过两次小幅反弹,及至2004年降至谷底,随后缓慢回升;2006年出现第二个峰值,平均交易金额达到270320.85元,不过,就其交易强度而言,仅为第一峰值的几乎一半,随后再次逐年下降。总体而言,党政机关的腐败活动,可以大致以1990年为界分为两个阶段:1990年以前为平稳发展期,平均腐败交易金额为6429.31元;此后为波动期,并且上升到一个新的高度,平均腐败交易金额140708.00元,为第一阶段均值的21.9倍。

    国有企业的腐败交易活动在全部五个子样本中水平最高,平均交易金额达到51万元。该子样本只有一个峰值,出现在1998年,腐败交易平均金额高达3389592.90元,是其余年份均值的12.4倍,也是样本全体均值(268786.17元)的12.6倍。国有企业部门的腐败活动不仅平均交易水平最高、最大峰值最高,而且腐败交易次数也远高于其他部门,达4316次,是党政机关的1.4倍、事业单位的2.8倍、非国有工商企业的3.6倍、其他部门的2.8倍。党政机关虽然在交易次数上位居第二且超过样本全体均值,但也仅仅是国有企业的72%。

    国有企业的腐败交易活动同样可以大致分为两个阶段:第一阶段为1989年以前,是较为平稳的阶段,平均腐败交易金额为4539.73元,各年份之间的波动较小,其中最大值为1988年的10713.32元,最小值为1978年的775.36元;1989年以后为第二阶段,1989年的腐败交易均值(21,942.14元)已经是1988年均值(10,713.32元)的2倍;此后逐年攀升,直至1998年平均交易金额达到3,389,592.90元。1989年至1998年这一阶段,是国有企业腐败交易活动的迅速上升期,随后基本呈逐步下降趋势。从腐败交易强度看,后一阶段的平均腐败交易金额(628,419.99元)也远远高于前一阶段,是1989年以前的138.4倍。

    与国有企业相比,非国有工商企业的腐败问题同样比较严重。在五个组别中,样本期内的腐败交易活动水平位居第三,平均腐败交易金额为167,013.90元。但是,该部门腐败活动表现却明显区别于其他部门,基本以1990年为界分为两个阶段。1989年以前比较平稳,平均交易金额为3,487.12元,其中最小值32.30元,最大值为7,110.25元。自1990年起,腐败活动开始不断加剧,且表现为剧烈波动的特征:平均交易金额从1989年的3,466.10元猛然跃升至1990年的45,880.56元,增幅高达12倍多;平均腐败交易金额为213,850.25元,是前期交易强度的61.3倍。1990年以后的21年间,腐败活动强度先后出现5个显著峰值,分别为1996年、1998年、2003年、2007年和2010年,其中最高峰值出现在1996年,平均腐败交易金额达到1,228,879.04元,是党政机关最大峰值(2006年的270,320.85元)的4.5倍、事业单位最大峰值(2003年的286,550.61元)的4.3倍、其他部门最大峰值(2010年的23,379.00元)的5.5倍。

    各类事业单位的腐败活动,包括教育、科研、广播电视、新闻出版、公立医院、各类社团、宗教组织等,也是近期社会关注的热点之一。从平均腐败交易金额看,事业单位的腐败活动水平仅次于国有企业,位居第二,达188,672.63元,不过,这一数额仅为国有企业均值的37%。与非国有工商企业腐败活动情况相比,事业单位的腐败走势相对“平淡”:除2002、2003两个年份外,其余年份整体表现波动不大。样本期内大致可分为两个阶段:1990年以前为第一阶段,均值为3,153.07元,最大值为11,048.92元,最小值为234.09元,各年份波动幅度较小。1990年起上升至一个新的高度,平均腐败交易金额由1989年的3,420.34元骤然升至6,271.88元,净增长83%;随后基本维持相对高位,1990年至2010年,年平均腐败交易金额为218,184.69元,是第一阶段年均值的69倍;其中,最大值出现在2002年,为2,333,276.66元。但是,如果剔除2002年的峰值,整个第二阶段的年均值仅为81,345.67元,该数值为第一阶段的25.8倍。整体而言,事业单位的腐败活动走势基本平稳,1990年以后跃升至一个新的台阶,平均腐败交易水平显著高于第一阶段,但波动幅度不大。2002年突然出现一个巨大跳跃,为其余所有年份平均交易水平(70,068.41元)的33.3倍,这一“鹤立鸡群”现象在全部五个组别中也是独一无二的,个中原委值得进一步深究。

    其他部门的腐败活动走势也有自己的明显特点:1992年以前腐败活动相对平稳,1993年起开始逐步上升,先后在1995、2007、2010年出现三个峰值,且三个峰值呈逐级抬升之势。腐败交易大致可分为三个阶段:1993年以前为第一阶段,这一阶段的平均腐败交易水平为1,884.64元,最大值4,044元,最小值345元,波动幅度较小;1993年至1997年为第二阶段,前3年逐年上升,随后逐步下降,该阶段的平均腐败交易水平为24,206.25元,最大值72,921.56元,最小值11,071.12元;1998年至2009年为第三阶段,1998年至2007年期间基本呈现单边上升趋势,虽然2002年出现过一次小幅跳跃,2007年后开始逐年下降;平均腐败交易水平为66,870.2元,最大值162,932.23元,最小值12,442.12元。纵观三个阶段的走势,不论就平均交易水平还是就最大值、最小值等指标而言,都表现出逐级攀升之势。

    比较五个子样本的统计结果,我们可以就样本期内各部门的腐败活动走势得出如下两个基本结论:第一,综合观察平均腐败交易强度以及腐败交易年度均值的最大值、最小值等基础性指标,五个部门的腐败活动由高至低的排列顺序依次为国有企业、事业单位、非国有工商企业、党政机关、其他部门,国有企业无疑是腐败活动的“重灾区”,该领域的腐败交易强度远大于其他部门,并且抬升了整个样本的平均交易水平,以至于即使是位居第二的事业单位,其平均交易金额也小于样本全体均值。第二,虽然各部门腐败活动情况存在一定差异,但大体上都可以以1990年前后为界分为前后两个阶段。比较两个阶段的腐败活动,第二阶段不仅整体水平大幅上升,波动幅度也非常大。若以由腐败交易强度大小顺序排列,第二阶段国有企业、事业单位、非国有工商企业、党政机关、其它部门的腐败交易均值分别是第一阶段的138.4倍、69倍、61.3倍、21.9倍和30.7倍。从样本全体情况来看,1990年以前的平均腐败交易金额不到5000元(4,988.15元),1990年及以后年份的平均交易金额则上升至338,840.65元,是前期均值的68倍!第三,第二阶段各部门的走势各有特点,其中,国有企业、事业单位、党政机关的腐败活动走势基本相似,均只有一个最大峰值,分别出现在1998年、2002年和1990年,基本表现为“单峰走势”:在最大峰值出现之前逐步上扬,在最大峰值之后基本上逐步下降;而非国有工商企业的腐败活动表现,虽然在最大峰值出现之前也是逐步上扬,但在此之后,又出现三个次高峰值,表现出剧烈波动走势;其他部门的腐败活动又与前四个组别完全不同,先后出现三个峰值,而且三个峰值呈现逐步抬高之势,表明其腐败活动在第二阶段有“愈演愈烈”的发展趋势,这是其他子样本都不具有的重要特征。这是否预示,继国有企业、事业单位、非国有工商企业、党政机关之后,其他部门的腐败将会越来越严重?

    上述分析结果表明,我国改革开放以来的腐败交易活动具有典型的时代特征,与我国社会、经济发展过程,尤其是国有企业改革密切相关。在国有企业放权让利、转换经营机制、产权制度改革、“抓大放小”、国退民进等过程中,出现了大量的寻租机会,同时相关制度安排相对滞后为腐败滋生提供了条件;在轰轰烈烈的经济改革浪潮冲击下,事业单位、党政机关中的部分工作人员经不住利益诱惑,也开始利用自己的社会地位、职务之便牟取私利;私人部门利用、甚至“创造”各种机会,与国有企业、党政机关中的腐败分子合谋,侵占国有资产,捞取私人利益。

    政府官员的腐败活动情况

    政府官员的腐败状况是全社会关注的焦点之一,我们按照行政级别由高至低将公务员群体分解为五组,即:省部级以上、厅局级、处级、科级和一般公务员,选择腐败交易次数和平均腐败交易金额两项指标,根据腐败交易实际发生时腐败主体的行政级别分组统计,然后分别比较分析。

    首先,静态地看,这五个级别的政府工作人员中,省部级以上官员腐败交易次数最少,但平均交易金额最高。从厅局级、县处级至科级官员,交易次数、平均交易金额两项指标均逐级上升,一般公务员的腐败交易次数略高于省部级以上官员,平均交易金额则最低(见图5)。就腐败交易次数而言,最高为科级官员,占样本总数的32.9%,其次为县处级官员,占24.8%,厅局级和一般公务员的交易次数基本相当,各占18.8%和18.5%,最少的是省部级以上官员,仅占4.9%。就腐败交易强度而言,一般公务员的腐败交易水平最低,平均不到3万元(2.96万元),最高的是省部级以上官员,平均腐败交易金额达68万元,分别是厅局级官员(18.9万元)的3.6倍、县处级官员(23.4万元)的2.9倍、科级官员(28.8万元)的2.4倍、一般公务员(2.96万元)的23倍。值得注意的是,正科级官员的平均腐败交易金额位居第四位,为39.2万元,竟然高于正省部级(32.4万元)、正厅局级(26.9万元)、正处级(29.8万元)。

    其次,动态地看,不同级别的政府工作人员的腐败交易活动在不同阶段又有着不同的表现。就腐败交易次数而言,自1978年至2000年代中期,总体呈现逐步上升趋势,随后逐步下降但各个级别政府工作人员的峰值出现的时间点并不相同,省部级以上官员是1999年,厅局级官员是2004年,县处级是2003年,科级是2006,一般公务员则是1999年(见图6)

    关于政府工作人员腐败,有学者认为党政机关正职官员是关键,提出了治理以“一把手”腐败为重点的反腐败建议。到底是否存在这种现象?我们仍以腐败交易次数和平均交易金额两项指标,分别统计各级正副职官员的腐败交易情况,结果见图7。可以清楚地看出,腐败交易次数指标在四个职级中全部都是正职高于副职;而平均腐败交易金额指标指标,除省部级之外,同样是正职高于副职。由此可以确认,“一把手”腐败之说基本成立。

    关于政府官员腐败的另一个经常讨论的议题是,存在部分官员“带病提拔”、“边腐败边升迁”的问题。样本统计数据表明,这种现象也存在,在从事腐败交易活动的同时获得职务晋升的官员占腐败公务员的9.2%,而且在这部分人群中,有三分之一(32.9%)获得过多次职务晋升。如果包括高级管理人员、高级技术人员在内,则腐败主体中有7.1%的人在从事腐败交易的过程中获得过提拔,其中30.7%的人曾经得到多次晋升机会。

    纵观国家公务员群体的腐败交易活动,可以发现如下较为显著的特点:第一,政府工作人员的腐败交易活动自1990年以来越来越活跃,不论是腐败交易次数还是腐败交易强度均呈上升之势。第二,省部级以上、科级官员是值得重视的人群,前者腐败交易次数虽少但每次腐败交易金额在所有政府公务员群体中最高,科级官员不仅腐败交易次数最高、腐败交易均值仅次于省部级以上官员位居第二,而且腐败交易总金额在所有政府工作人员中也最高。第三,党政机关“一把手”腐败现象确实存在。统计数据表明,除省部级官员之外,其余级别官员的平均腐败交易金额都是正职高于副职,其中,正厅局级官员的平均腐败交易金额(26.9万元)是副厅局级官员(10.1万元)的2.6倍,正处级(29.8万元)是副处级(10.2万元)的近3倍,正科级(39.2万元)是副科级(5.2万元)的7.5倍,正副职之间的差距随着职级的下降呈逐渐放大之势;在这五组人群中,惟有正省部级官员平均腐败交易金额(32.4万元)低于副省部级(61.3万元)。第四,腐败交易活动与职级高低并不完全对应,并非职级越高腐败越严重,相反,从厅局级、县处级到科级官员,不论是交易次数还是交易强度恰恰都是逐渐上升。上述特点,对于我国下一阶段反腐败策略的制定具有借鉴作用,省部级以上官员、科级官员应该作为重点防范人群,而各级别政府工作人员中,党政机关的“一把手”又是主要监督、审查对象。

    结语

    改革开放以来,中国的腐败状况成为全社会关注的焦点问题之一。本文采用客观统计数据,就我国改革开放以来的腐败活动总体概况、主要部门的腐败活动以及党政机关工作人员的腐败活动情况进行了统计分析。我们发现,改革开放以来,我国腐败交易活动基本呈逐渐上升之势,腐败交易强度在1990年之后大幅提高;国有企业是腐败交易最为严重的部门,其次是事业单位和非国有工商企业,党政机关仅名列第四;就腐败交易强度而言,高级管理人员最高,其次是政府工作人员和高级技术人员群体;在政府工作人员中,正职官员腐败普遍比副职官员严重,省部级以上官员腐败交易强度最高,其次是科级、县处级、厅局级官员,而科级官员不论就腐败交易次数还是腐败交易总金额而言,均位居首位。这是出乎人们意料之外的一个新发现。

    本文的分析结果表明,我国目前仍处于腐败活动的高发期,当前和今后一段时期反腐败形势依然十分严峻。反腐倡廉绝不能仅仅局限于党政机关,还应该特别关注和加强国有企业和各类事业单位的腐败治理工作。在各级政府官员中,应继续坚持重点防范“一把手”腐败,尤其要加强科级政府官员的监管工作。科级官员面广量大,是政府机构中最基层部门的主管官员,基层公务员的直接领导者,他们廉洁与否直接影响到一般公务员的从政行为,并进而通过他们影响到整个社会风气。

    本文原载《政治学研究》2013年第6期

  • 克劳迪娅·戈尔:女性能实现事业与家庭“双丰收”吗?

    1. 非升即走,艰难的抉择

    在许多职业,比如会计、法律、金融、咨询和学术界,女性和男性的竞争环境甚至更不平等。过去的半个多世纪里,这些领域的职业发展变化不大,尽管其中近半数专业人员是女性。这些领域的晋升规则都要求早期投入大量时间。在预定期限结束时,雇员(一般称为助理)要接受考评。勤奋(或幸运)的人将获得终身职位或合伙人资格,其他人则被打发。这类工作通常被称为“非升即走”职业。“升迁”的人留下来,而“出局”的人往往去更低一层级的公司、机构或大学任职。

    每个职业和部门的门槛和发展时钟并不相同,但都有一个共同点:那些得到丰厚回报的人,届时应该已经30多岁。这一点今非昔比。只是拿下高等学位以及获得第一次晋升、合伙人身份或终身职位所需的时间,都已变得更长、更晚。

    曾几何时,攻读高等学位的大学毕业生会直接进入研究生院或专业学校。而今,几乎所有人毕业后都要花一年或更长时间从事与最终职业相关的工作。在学术界,大多数博士申请者获得学士学位后都首先担任研究助理(这个职位被称为“博士预科”)。MBA群体则通常在进入商学院之前工作若干年。

    今天,攻取博士学位所花的时间比以往任何时候都要多,即便在有大把就业机会的领域也不例外。我拿到博士学位的时候,获得经济学博士学位通常需要4年时间,现在是6年。物理和生物科学的博士后培训同样延长了周期,这些职位已经在其他领域流行起来。

    接受教育和培训的年数增加倒无可厚非。但这只是“非升即走”世界的开始。学术界获得终身职位一般需要6~8年。法律行业确定合伙人身份大约需要10年;咨询和会计行业确定合伙人身份需要6~9年,具体取决于是否拥有MBA 学位。至于投资银行业,需要5~6年或可从初级银行家升级为副总裁级别。         

    所以在学术界,现在至少要有13年(更可能是16年)的学士后生涯做铺垫,个人的职业生涯方能巩固。在咨询和会计领域,考虑升职前起码得拼搏10年。而攻读MBA或法学博士课程之前,应该投入几年时间工作。因此,个人职业生涯的第一次晋升通常发生在30多岁时。

    可想而知,事业与家庭之间会出现怎样的张力。在谋求合伙人身份或终身职位的过程中,当年的22岁大学毕业生渐渐年长,进入了30多岁,甚至更老。大学毕业生的初婚年龄中位数远低于这个年龄。

    如果提早进行“非升即走”抉择,譬如在35岁之前,女性就可以先努力工作,成为合伙人或拿到终身职位,然后再开启家庭生活。然而随着晋升年龄提升,这意味着要么晚点组建家庭,要么第一次重大的晋升时刻在孩子上学前班时到来。职业道路需要长时间的工作,对于有年幼子女的人,这往往太过紧张。两种选择都有问题,尤其是对女性而言。

    职业时钟与生物时钟和家庭时钟交织同步,滴答作响。很多女性和男性必须在职业生涯稳固之前建立家庭;否则,他们可能将永远无法拥有家庭。

    2. 管道泄漏,职场流失的女性

    自20世纪70年代开始,许多专业的职业女性新人比例大幅上升。在完成各类高等学位课程方面,第四组女性取得了长足进步。可是,获得终身职位、合伙人身份或其他晋升机会的女性比例没有跟上节奏。起初,人们以为高级职位的女性比例偏低是因为晋升需要时间,但现在大家发觉事实并非如此,时间其实绰绰有余。

    过去20年间, 我所在的经济学领域的女博士比例达到30%~35%。但她们当中终身副教授为25%,正教授为15%。1974年,我是8% 的助理女教授之中的一员,到了2018 年,该比例升至27%。1974 年,正教授群体的女性比例不足3%,2018年逼近15%,进步可谓巨大,但是速度太慢。假如男性和女性候选人的晋升率相同,那么正教授的女性比例应该会更高。这种差异的部分原因是,女性发表文章的记录导致她们的晋升率降低。另一个原因是,她们在晋升之前离开了学术界。

    女性在学术、法律、咨询、管理和金融等领域的低晋升率,归因于人们通常所称的“管道泄漏”现象。“管道泄漏”是指女性和男性晋升前都有离职者,但在各个关键时刻,女性离职的比例高于男性。

    人们一直想方设法寻找女性流失率更高的原因。通过比较论文发表能力相当的男性和女性,大家发现偏见、偏袒和指导不足等因素依然存在。但是,大多数“非升即走”职业中管道泄漏的主要原因,带领我们回到了晋升所需的时间问题上。高强度的职业对所有人来说都是艰难的。尤其是年轻的父母,更加辛苦;而在通往顶峰的路上,放慢脚步并投入大量家庭时间的一方,往往就是女性。

    女性从事这些职业所面临的最大障碍,是我们熟悉的时间要求,而并非只是工作时间的问题。时间要求还包括生活中需求最大的时刻。一如上文所述,这些压力在个人的30 多岁时冲至顶点。

    工作时间对于升职非常重要,这一点不难在法律等注重工时的职业中得到验证。律师按小时(甚至按分钟)计费,律师事务所自然要密切关注时间。我们知道女律师成为合伙人的比例低于男律师。但直到最近大家才了解个中原因。美国律师协会组织了一项大规模的律师调查(称为“法学博士之后”项目),追踪他们的等级并进行分析;结果表明,成为合伙人与投入的时间之间存在显著的相关性。助理律师的工作时间和获得的收入,是造成男女晋升率差异的主要因素。         

    随着越来越多的女性开始从事这类职业,以及越来越多的男性希望与生活伴侣建立平等关系,老规矩和旧思想产生了越来越大的成本。机构并不想人才流失,而流失的人才大部分又是女性。

    3. 一丝微光,职业公平的解决方案

    大学设有最严厉的“非升即走”政策,不过,在为男女初级教员提供家庭假期和为获得终身教职按下暂停键方面,大学日益宽容。新的职位被开发出来,可以绕过严格的“非升即走”途径。

    无法忍受加班加点争取终身教职的人,或者自认无缘晋升的人可以考虑讲师和兼职职位。法律和会计领域则有非股权合伙制。个人可以沿着食物链行进,在小型机构获得终身职位,或者成为规模较小、利润较低的律师事务所或会计师事务所的合伙人。

    公司也不想失去训练有素的员工,特别是在专业服务行业,客户关系丰富,培训成本(由公司承担)通常很高。没有孩子的年轻员工几乎没有个人时间限制,一般都希望给公司合伙人和高层管理者留下好印象。他们会长时间投入工作,频频相互竞争。如果是20多岁的年轻人,拼命工作没问题。但这并不是很多人,尤其是女性,在有了年幼子女后想要的生活。高层管理者尤其是CEO(首席执行官)们,都愿意减少已经成为多数年轻员工常态的漫长且往往不可预测的工作时间。

    高盛、摩根大通、花旗集团、美国银行、摩根士丹利、巴克莱和瑞士信贷等华尔街巨头们,也纷纷决心创设更好的激励机制,化解如何留住公司困扰年轻人才的委托代理问题。金融巨头开始订立规则,保护周末和晚上的时间、带薪休假、法定假期以及快捷的晋升途径。

    2013年,高盛发起一轮大行动:“我们致力于实施下列举措,以更好地推助本公司初级银行家拥有成功且可持续的长期职业生涯。”规则很明确,几乎没有需要向执行委员会报告的例外情况。“所有分析师和员工周五晚上9点至周日早上9点必须离开办公室(自本周末开始)……所有分析员和经理预计……每年应有3周休假。”此外,不准把工作从办公室搬到家里或附近的咖啡店。一年后,瑞士信贷禁止周六上班,美银美林集团倡议初级银行家每月至少休四天周末。

    科技巨擘们同样明白,长时间工作会破坏舒适的工作环境。2016年,亚马逊为了打造“适当缩短工作时间但仍能促进成功和职业发展的环境”,宣布允许科技人员乃至经理削减25%的工作时间,同时降低25% 的薪酬。员工基本上是按小时减扣工资。

    一些咨询公司和会计师事务所已经落实政策,限制年轻员工长途出差的次数。一些公司则限定员工的工作时间,限制员工下班后发送电子邮件。这些由高级合伙人和CEO 推行的举措引人注目,他们认为,有些经理驱使年轻员工玩儿命工作,以致后者被迫辞职。每个经理和合伙人都希望自己的项目顺利完成,他们不会时时顾及疯狂工作给整个公司带来的成本。无论成功与否,为控制年轻员工过度工作所做的大量努力说明,公司及员工已经认识到,拼命工作是要付出代价的。

    20世纪90年代前半期,美国最大的两家会计师事务所察觉了自身存在的严重人事问题。他们在招聘女性层面做得很好,注册会计师有一半是女性。但这些女性很少能成为合伙人。就像一些业内人士所言,他们一直在流失女性会计师。多数高层领导并不认为可以遏制这种流失。然而,聪明好奇的德勤CEO 迈克尔·库克(Michael Cook)提出了异议,并于1992年委托一个外部审核小组调查女性离职的原因。

    调查发现,女性早在晋升前就已陆续离职。报告称,德勤的文化不断排挤她们。她们接不到利润丰厚的会计业务,不被委以重任,还被斥以不够坚毅,至少被认为没有男同事能吃苦耐劳。在库克的领导下,德勤的企业文化发生质变。女性新合伙人比例渐有上升。

    1997年,安永CEO菲尔·拉斯卡维(Phil Laskawy)发现了类似的问题。公司尝试了实行弹性工作制、开展职业辅导、建立女性网络等策略。不久,安永的女性合伙人比例也见长。

    不只德勤和安永提高了女性合伙人比例,该行业一些政策不算开明的公司也有同样的提升。目前尚无法评估这种提升有多少是由于德勤特意改变企业文化的策略,或安永的弹性工作安排。但有其他证据表明,存在更基本的结构性因素阻碍女性攀登事业高峰。

    这些职业实施的解决方案都不充分。在法律、会计和咨询行业,非股权合伙人的报酬相当低。在学术界,虽然兼职教员有男有女,但女性兼职的比例还是过高。这些职位通常提供给随行配偶(不论男性或女性)。奈何在地理位置上,女性历来更多捆绑于丈夫的职位。甚至就在最近,暂停“非升即走”考核的举措也受到了批评。研究表明,女性需要额外一个学期来照顾家庭;男人则利用这些时间发表更多的学术论文。“非升即走”制度与组建和养育家庭并不协调。这些做法均不适合任何性别,但鉴于现实情况,女性付出的代价更大。         

    毫不奇怪,工作随叫随到、时间不规律又不可预测的员工,往往比工作时间接近正常的员工挣得多。更重要的是,这种溢价给女性的职业生涯和夫妻公平造成了问题。时间长或随叫随到工作的时薪溢价越高,尤其在有孩子时夫妻双方进行分工的激励就越大。

    我所说的“分工”,并非指一人洗碗,另一人擦干。我指的是更普遍的事务:正像我们在整个旅程中看到的,一人(通常是妻子)花更多的时间为家庭待命,另一人(通常是丈夫)花更多的时间在工作中待命。

    如果有孩子的夫妇不进行分工,也即他们不做出最普遍的决定(让一方在家事上待命,另一方在工作上待命),那就意味着他们要少挣钱。两人不能同时接受无法控制时间的工作,因为要照顾孩子;就像我的狗,会在某天不可知的时间生病和需要帮助。

    当能多挣的收入并不是很多时,按照夫妻双方的意愿,少挣就少挣吧。换言之,两人都可以拒绝时间较难预测的工作。这样就好比他们用放弃的那部分薪水购买夫妻公平。可如果这笔钱数额很大,夫妻公平的成本也许就会高到难以抗拒这份工作;进而夫妻公平可能会被放置一边但这不是唯一的损失。当夫妻公平被搁置,职场中的性别平等问题也将随之而起。即便按时薪计算,女性的收入也会低于男性。问题既在于劳动力市场的工作如何计酬,也在于家庭的劳作和照顾如何按性别划分。

    关键是,正如律师和药师案例所启示的,性别(不)平等和夫妻(不)公平恰似硬币的正反两面。造成夫妻间不公平的,是我们一直在探究的艰难抉择:夫妻中有一方,通常是女性,决定在家待命。这也意味着,总体说来,哪怕按时薪计酬,女性的收入也比男性低。这继而引发了性别不平等。幸好,黑暗中突现一丝微光:越来越多人开始努力争取夫妻公平,争取与家人共度时光。

    本文整理自克劳迪娅·戈尔(Claudia Goldin)的著作《事业还是家庭?女性追求平等的百年旅程》。

  • 黄盈盈,潘绥铭:中国东北地区劳动力市场中的女性性工作者

    2002年7月到9月‚我们课题组以“入住式社区考察”的方法在东北A市、B市和C市三个地方进行了为期两个月的红灯区考察。这是一项探索式研究‚创新之处主要有二:其一‚把女性性工作者作为劳动力市场中的一分子考察她们的主要就业经历(包括性工作)‚从纵向的、过程的视角来发现这些女性进入性工作的原因;其二‚定性方法与定量方法的协作并用;以“入住式社区考察”为主要方式收集原始材料‚并把定性资料进行量化处理。

    主要发现有四:其一‚本次访谈的这三地的103个小姐几乎都是城市户口‚下岗女工占半数;其二‚其中的本市人或者附近城市的人比较多。这意味着这些小姐的“匿名性”的弱化;其三‚从下岗到做小姐只是一种“职业平移”现象。由于个人经验资源的短缺与社会就业的救济性质‚她们所获得的历次职业的社会地位一直非常接近‚并不存在“堕落”;其四‚在连续的职业流动中‚各种“关系”所发挥的作用呈现为:“无关系”(自己闯)与“亲关系”(靠亲属)渐行渐弱;“友关系”最终占上风;而“公关系”(正规的职业中介)对于这些女性来说非常陌生。

    一、目的、研究对象与方法

    (一)研究的背景与目的

    通过文献分析‚我们发现以往有关“小姐”的研究资料主要有四种类型:1.写史的人从史学角度对资料加以汇编与分析‚通常可分为“娼妓史”或“禁娼史”;2.政府、公安部门的人从社会控制的角度进行的社会调查与对策研究‚通常关注“扫黄”的问题;3.医生、防疫站从性病、艾滋病预防角度进行的调查与研
    究;4.社会科学研究者从社会学、人类学角度进行的调查与研究。

    大多数资料仅仅描绘最表面的现象‚或者局限于为政府的扫黄政策做解释‚或者对于“卖淫”进行道德谴责‚学术意义十分贫乏。一部分颇有价值的学术著作也主要是把目光集中在小姐本人的现状‚所考察的也大多是农村或城郊的红灯区情况(潘绥铭‚1999‚2000;黄盈盈‚2002)。因此‚尽管在目前的中国许多人都知道有些城市里的失业女性从事了性工作‚而且流传着许多民谣;但是很少有人了解具体深入的情况‚更没有对此进行研究与解释。

    大多数著作没有意识到“小姐”也是劳动力市场中的一分子;“做小姐”也是妇女就业的一种选择结果‚不管这种选择是主动的还是被动的。因而从研究角度讲‚小姐的这种劳动者身份受到双重忽视——研究小姐的人忽视了她们在劳动力市场中找工作的经历‚研究妇女就业的人则忽视了小姐也是需要就业的广大妇女中的一员。

    本项研究旨在弥补这方面的缺陷‚尝试把“小姐”放到整个妇女就业(包括农村进城妇女)的全局中去‚考察她们的就业机会、准备、途径、结果‚从而研究这些妇女是怎样进入性产业以及为什么会进入;本研究格外注意小姐中那些原来就是城市户口的人‚无论是从来就没有工作过的女性还是下岗人员。

    (二)研究对象

    基于我们的研究目的‚我们对研究对象进行三层界定:女性失业劳动力、女性性工作者、作为地理和时间范畴的东北地区。

    界定一‚女性失业劳动力包括:15-50岁人群中的待业者(可以劳动却没有工作‚包括农村进城的人)、完全失业者(所有那些曾经有过工作‚却完全失掉了的人‚包括城市人和农村人)、半失业者(目前无工作‚但是仍然从原来的工作中领取一定金额的人‚包括:待岗、内退、放长假等等)。

    界定二‚女性性工作者(也称为“小姐”)包括:1.性服务者‚即狭义的性工作者:目前正在提供直接的性交服务(通常称为“出台”)的‚有过一次就算。在调查中我们主要根据两个标准来判断小姐是不是直接的性服务者:小姐个人有出台行为‚或个人所在服务场所是专门提供性交服务的。2.涉性工作者‚即广义的性工作者:包括目前正在从事三陪、异性按摩、脱衣舞表演‚以及隐蔽在陪伴、保姆、计时服务等名义中的性服务者。

    界定三‚地理和时间概念包括:局限在东北地区‚以“市”为单位。凡是现在在调查地的妇女都算‚无论来自何方、居住了多长时间。

    我们在A市、B市、C市一共访谈了在中低档的歌舞厅和按摩店工作的103位正在从事直接性服务或涉性服务的待业、完全失业、半失业女性‚包括城市户口和农村户口。

    (三)研究方法与步骤

    本项研究在方法上的创新之处在于:以定性方法为基础‚定性方法与定量方法的互相结合与相互转化。这种定性方法与定量方法的结合并不是一般人所认为的在现场收集材料的过程中既做问卷又做访谈;而是在研究的不同阶段使用不同方法‚取长补短相互结合。根据我们的经验‚这种方式在红灯区考察中比较适宜。我们的具体做法是:

    (1 )准备阶段。实地考察前‚首先从研究目的出发设计好非常细化的访谈提纲‚并在电脑中形成相应的数据库。然后调查人员事先把这些问题背下来‚并转化为自己的日常语言进行练习。

    (2)实地踩点。实地考察前半个月‚课题负责人到东北地区打探红灯区情况‚落实具体调查点‚联系红灯区内或离得最近的方便于考察的住处。本次踩点共涉及性产业较发达的11个城市‚最后选定A市、B市和C市。这三地是经过挑选的‚各有特点‚有利于更全面地了解各种情况。

    (3)田野工作。基于研究对象的“非法”与“地下”的特性‚现场收集材料时‚我们还是采用定性的“入
    住式社区考察”。考察员除负责人外都是女性。是否进行匿名考察、在多大程度上告诉被考察者我们的研究目的‚要视具体情况而定。

    我们入住之后‚首先花一天时间摸清该红灯区的大概面貌‚然后根据当地性产业的具体情况‚尝试“进入”方式(即第一次接触、认识小姐)。基于东北的性产业情况‚我们认为比较成功的进入方式是:2-3个人一小组以唱歌或按摩的方式认识老板娘和小姐‚通常是一个人唱歌‚别人找机会跟没事的小姐认识、交谈‚并寻找进一步交谈的机会。

    其次‚我们“进入”以后以非正规的聊天方式‚结合听、看等其他手段‚逐渐获取所需材料。这通常需要考察员在自然的情境中‚不露痕迹地把话题引到我们的问题上。不过‚我们所获得的资料不限于事先设计好的问题。

    第三‚我们当天回来记录聊天内容‚把所有材料输入电脑或记在笔记本上‚形成原始的定性材料‚并把相关内容提炼为问卷的答案部分输进电脑。定性材料通常按时间顺序记录‚内容包括整个考察过程(进入的方式、跟小姐聊天的步骤和内容)、观察到的东西以及自己的感受与感想。问卷内容则按每个个案(小姐)记录。我们尽量把原始答案提炼后记录在数据库里‚统计时再归类分析。

    最后‚课题组在当天或隔天会进行讨论‚总结、交流经验并随时提出问题‚共同商讨解决方法。我们还会根据所获资料随时修正问卷中的变量‚补充材料。

    (4)整理材料和书写报告。本次考察我们一共获得103个小姐的详细定性资料‚同时把部分内容进行定量化处理‚形成了103份较为完整的问卷。对于问卷部分‚我们所需要做的主要是查看回答项‚并做适度的归类‚然后用SPSS10∙0进行简单的统计分析。对于所有的定性材料‚我们还需要继续做两方面的工作:其一‚整理出较为完整的个案;其二‚设计好主题标签‚把所有的定性材料根据内容贴上标签‚以备进一步的查找、归类和比较。在整理资料期间‚我们通常每周开1-2次讨论会。

    本文的定量分析的目的‚不打算、也不可能推论总体‚但至少能反映这103个东北小姐的相关情况。我们在选点的时候尽量考虑到了调查点的代表性‚从而可以对东北劳动力市场中的女性性工作者有个粗略的了解。

    二、社区基本情况

    基于篇幅‚这里简单介绍与性产业直接相关的社区基本情况。总体上讲‚A市是卫星城市‚以歌厅为主‚其他的性服务形式较少;B市的性服务规模最大‚存在歌厅、按摩、直接进行性交易等各种形式;C市也有歌厅‚但主要是以按摩为主‚而且小姐年龄较前两者偏大‚本地下岗女性偏多。

    (一)A市

    A市的性服务业主要以歌厅为主‚约有300来家歌厅‚分布在6-7条街上。据当地公安局的一个主任介绍‚A市的性产业以前都叫做洗头房‚后来打击了‚都叫做歌厅。1998年前后是性产业发展的高峰期,有上千家带小姐的歌厅。这两年减少了‚当地人认为这主要是因为:经济不好;男人不喜欢嫖了。而政府打击不是主要原因。

    此地的歌厅一般规模比较小‚仅一个门面。纯粹歌厅和带小姐的歌厅会同时在一条街上出现‚门上都写着“一元一首(歌)、高级音响”之类的字。初来乍到者一般分不清哪些是带小姐的。但后来有老板告诉我们‚可以根据两点来判断:其一就是写着“歌舞厅”的一般是带小姐的‚而写着“歌厅”的则一般是不带小姐的;还有就是以马路为隔‚马路的这一段是带小姐的‚另一段则是不带小姐的。A市的小姐基本上都是吃住在营业场所里。

    A市的“客人”以前主要是来自A省省会的富人或者干部‚因为A省省会“扫黄”比较严厉‚所以客人就到A市来‚只要开车40分钟左右。近年来‚由于经济全面不景气‚A省省会来的客人少了‚附近城镇中的富人来的较多。

    (二)B市

    B市的经济在三个地方中是最好的。性服务形式比较多样‚不仅有歌舞厅‚还有按摩、直接进行性交易等形式。B市的性服务场所最繁华的街道是jing街‚至少有80多家歌舞厅和按摩店。但是它并不是最典型的红灯区‚因为在这条街上‚性服务场所跟正规商店饭店混杂在一起‚而且很多是在正规商店的二楼上‚经常是一个过道有4-5家。B市的按摩店和歌舞厅很多是串在一起的‚即:歌舞厅缺人的时候就到按摩店叫人。有些歌舞厅自己不带小姐‚但可以帮客人叫小姐。B市的小姐很多‚流动性比较强‚不像A市那样吃住在工作场所‚而是自己在外面租房子住‚自由度更大一些。

    B市的“客人”群体主要是那些来B市“搞资源”的外地商人‚他们有钱‚见过世面‚敢嫖。其次是本地的一些“耗子”‚他们靠大批量偷取国家资源发财‚往往有后台‚也敢嫖。还有一些“领导”‚是靠包庇“耗子”发财的。

    (三)C市

    跟A市、B市相比‚C市的经济最不景气‚下岗的情况最严重。C市性服务形式主要是按摩店‚也有歌舞厅‚但不是很多。按摩店一般规模不大‚7、8个小姐的比较多。它们的数量很多‚但也比较分散‚有遍地开花的趋势。C市直接提供性交服务的比较少‚“打飞机”(为客人手淫)的情况相对要多一些。C市有不少规模比较大的浴池‚基本上都提供“打飞机”以上的性服务‚因此那里按摩的价格比一般的按摩店要高出2-3倍。在C市的小姐中‚下岗工人比较多‚30-40岁之间的女性比较多。

    C市的客人也主要是外地来的商人‚因为C市的石化厂仍然非常兴旺‚招来许多人。此外就是附近各种小企业的私营老板们。当地人形容说:“锅(国)漏了‚(所以)碗(老板)满了。”不过‚C市本地的一般客人也比较多‚因为只要不下岗‚在当地就是生活富裕的人了。

    三、研究发现

    我们把定性访谈资料整理为问卷之后‚主要涉及四个方面:(1 )小姐的基本情况‚包括年龄、教育程度、家乡所在地(离工作地远近)以及户口;(2)小姐中下岗的情况‚包括是否是下岗工人、下岗前的工人
    类别、单位所有制、下岗原因以及下岗后的待遇等;(3)小姐的工作经历‚包括做小姐前的那一次工作、倒数第二次和第三次的工作。每个工作都包括工作种类、性质、寻找途径、工资情况以及离开原因;(4)做小姐的基本情况‚包括做小姐的时间、收入、寻找途径等。
    通过统计‚再辅助以相关的定性材料的归纳分析‚本次研究主要有三个方面的发现:

    (一)发现之一:“下岗妹”群体的存在

    “下岗女工”和“小姐”可以说是两个形象差距悬殊的身份概念。在人们刻板的印象中‚下岗女工通常是受人同情、非常正面的劳动妇女的形象‚往往与“30-40岁”、“上有老下有小”、“辛劳了几十年最后被单位扫地出门”这些特征相吻合;“小姐”则通常是受人歧视、非常负面的堕落少女形象‚往往与“吃青春饭的”、“不务正业”、“贪图享乐”等特征相吻合。人们把“哀其不幸”给了下岗女工‚把“耻其不争”给了小姐。这两个相距甚远的形象很难捏合在一起。但是经济变化给人们的道德观念带来的冲击往往是巨
    大的。在下岗情况严重、经济不景气的情况下‚社会上流行的民谣首先把这两种似乎没有交点的身份融合在一个人的身上。且听:

    下岗妹‚别流泪‚挺胸走进夜总会;陪大款‚挣小费‚不给国家添累赘;
    爹和妈‚半生苦‚老来待业很凄楚;弱女子‚当自强‚开发身体养爹娘。

    这个民谣早几年就已经在社会上传诵开‚而我们的考察则给它提供了两方面的事实根据。
    1∙小姐中‚城市下岗女工占一半
    本次访谈的这103个东北小姐‚最小的16岁‚最大的47岁;平均年龄25∙1岁‚中位数是24岁。与我们以往调查到的其他地方的小姐相比‚她们的年龄更大。
    此外‚她们的“出身”有两大不同:其一‚拥有城市户口的小姐占到95%;其二‚她们当中原来在国有或者集体等正规单位工作、现在下岗或者完全失业的人比较多:在A市是47∙5%;在B市是41∙7%;在C市则高达72∙7%;三地总计为51∙0%。
    她们下岗前情况主要有这些特点:绝大多数都是在本地下的岗(98%);下岗前主要是没有技术的熟练工人(62%);下岗前主要在国有企业工作(74%);大多数人失去工作是因为单位的原因(单位裁员、破
    产倒闭、改制、被吞并等‚占74∙5%)‚而不是因为个人的原因(指自己主动辞职、请长假等)。这一规律
    在C市尤其明显‚93∙8%的人是因为企业效益不行或倒闭而被迫失去工作。
    至于另外一半左右的小姐‚虽然不是下岗女工‚却基本上是城市户口‚属于“待业青年”‚因此也可以纳入到劳动力市场的范畴里进行分析。

    2.她们曾经找过许多其他工作
    在我们的调查中‚下岗后或者待业后直接做小姐的女性只有不足9%。其余的人都是在经过相当长的时间(平均51∙5个月)、找过多种工作(平均4∙7个)之后‚才最终选择进入性产业。如果说至少干过一个月才算有过一个长期工作的话‚那么在这些小姐中‚87∙4%的人至少有过一个长期工作;65∙0%至少有过两个长期工作;38∙8%至少有过三个长期工作。尤其是‚在她们当中‚即使以前做过“三陪小姐”(不卖淫)的‚也只有3∙9%。这更加可以说明:她们并非“天生就是这块料”‚也不是“好逸恶劳”‚更不是“自甘堕落”‚而是曾经在劳动力市场中‚朝着人们认为是正常的工作‚屡屡挣扎过。
    她们曾经是国家的主人翁‚处在劳动力市场的核心地带。但是下岗之后‚她们四处奔波‚不得已才进入性产业这样一个不被正眼瞧的行业。结果‚深受社会同情的正面劳动妇女形象与痛遭社会鞭挞的负面不良少女形象‚在经济和生活压力的冲击下合二而一。由此‚我们也就可以体会到前述民谣中非凡的“民间智慧”:下岗妹=下岗女工+小姐。

    (二)发现之二:小姐的匿名性在弱化

    匿名性通常被认为是现代的“性工作”的生存基础‚因为它必须建立在一个“陌生人社会”中。“陌生
    人”指的是和我们没有私人亲密关系、只能在公共生活中遭遇的人。只有“陌生人社会”才能够使性工作
    者藏身在茫茫人海中‚才得以脱离家乡社群的监视而在城市讨生活(卡维波‚2001 )。性产业对于匿名性
    的需求‚与现代社会中对于“小姐”身份的“污名化”紧密相连。

    一个性工作者为了给自己营造一个匿名的社会‚需要采取很多措施‚比如给自己起假名、隐瞒自己的家乡、用假身份证等等‚但其中很重要的一种方法就是必须远离自己的家乡‚在一个碰不见熟人的地方开始塑造自己的“小姐”身份。

    根据我们以往的调查经验‚大多数小姐是从外省来的流动人口(例如广东、深圳的情况)‚或者是从该省距离相当远的其他地方过来(例如四川的情况)。她们最担心的问题之一就是害怕家里人知道自己在这里做小姐‚所以离家越远匿名性就越好‚受到的心理压力也就相对越小。可以说‚一个匿名的情境可以帮助她们尽快地认同自己的“小姐”身份。因而‚鲜少有人会在家门口做小姐。

    但是‚跟我们以往了解到的其他地方的小姐相比‚这103个东北小姐体现出来的最大特点之一恰恰就在于:小姐中本地或是附近城市户口的人比较多(见表1 )。

    从表1可以看出‚家乡就在本地或者附近50公里之内的小姐非常多‚两项之和占到总数的63∙1%。再加上家乡在本省的‚就达到80∙6%。也就是说‚绝大多数小姐的流动范围并没有超过本省。小姐的家乡与她们现在工作的城市的直线距离的中位数‚只有50公里‚而且其中三分之一的人就在本市范围内做小姐。这无疑体现了这部分小姐对于匿名性的需求的弱化。

    根据我们的理解‚导致这种“匿名性弱化”的原因至少有三:
    其一‚女工下岗与道德舆论的互动。由于女工下岗的情况比较严重‚再就业的可能性与选择性都非常小。因此当地整体舆论对于“做小姐”这种谋生之道的谴责‚比我们所调查过的其他地区要小得多‚甚至比人们认为是最开放的深圳还要小。①
    舆论压力的弱化降低了这些女性选择性产业的心理成本‚同时也加强了小姐们对于自己为什么干这行的合理化解释。两者相辅相成。匿名的重要性在这种互动的面前显得微不足道。

    其二‚当地娱乐生活传统与“私人空间”成长的互动。东北地区在历史上是一个“移入社会”‚因此‚中原地区那种对于各种“涉性”娱乐活动的抑制‚在这里相当弱化。例如‚“黄”一直是“二人转”中的重要内容。在日常生活中‚异性之间的“人身距离”相对较小‚也被认为是该地区的特点之一。最近20年来‚私人空间的成长‚在这个方面则表现为向这种“本地传统”的回归。

    在东北‚洗浴、歌厅、按摩、足疗这几个最容易成为性产业依托点的行业‚虽然不能说是全国最早出现的‚但是十几年来一直就非常发达。C市的普通人甚至全都坚信:所谓“足疗”‚就是当地人在1990年代首先发明‚然后才传遍全国的。②用当地人自己的解释是:东北人爱玩‚即使一家子吃了晚饭出来溜哒‚也会进小歌厅吼两声。如果乏了‚就会到足疗店按摩一下。这些都很正常‚即使估计到其中可能含有“涉性”的内容‚也很少有人会去深究。所以‚一个女性如果告诉家里人自己在浴池做按摩或是在歌厅里放碟‚也不是什么丢脸的事情。

    其三‚小姐外出与“留守”之间的互动。根据我们对于全国许多地方的性产业的了解‚“东北小姐”在各地都是一个以其开放与泼辣而闻名遐迩的群体;“东北小姐遍天下”的传闻并不是空穴来风。就在我们考察C市期间‚当地十几位女性居然被拐卖到万里之外的中东国家‚成为一个大案。这表明:我们这次所调查到的、目前仍然留在家乡而没有外出的这些小姐‚恰恰是那些缺乏足够的勇气、能力、条件去走南闯北的女性。

    我们访谈到的这些小姐‚最小年龄16岁‚最大年龄47岁。在解释自己为什么不出去闯闯时‚她们既没有提到自己太小或者太老;也没有说过因为自己漂亮或者不漂亮。她们的回答基本上都是家里离不开‚或是上有老下有小‚或是家里人生病需要照顾‚或是对离开这片土地心里茫然。也就是说‚人们通常所认为的“年轻漂亮的小姐容易外出”并不成立。小姐的外出与留守‚是由更加深刻的原因决定的。

    但是‚不管其中的原因是什么‚外出与留守之间却产生了互动。留守的小姐恰恰是因为自己的顾虑多、负担重而获得了更多的合理化解释:我都惨成这样了‚连“人往高处走”都做不到了‚还怕什么道德谴责吗?这就造成了当地留守小姐对于匿名性需求的弱化。

    当然‚这三个地方的特色也是不同的。我们不难发现:家在本地或附近的小姐比例在B市最少‚占6∙4%;在C市最多‚占81∙8%;A市则是居中。三地的这种差异主要源于三地的经济状况与下岗情况。

    简单地讲‚C市下岗情况最严重‚所以本地就业的小姐比例相对也最高。B市则是因为当地经济相对比
    较好‚性消费仍然强劲‚所以吸引来的外地小姐也多。

    也就是说‚匿名性的弱化并不是因为这些小姐已经潇洒到可以“走自己的路‚让别人说去吧”‚更不
    是“利令智昏”‚而是生活处境使然。因此‚用“恬不知耻”来对她们进行道德谴责‚是没有事实根据的。

    (三)发现之三:做小姐只是一种职业“平移”

    1.情况描述

    人们通常认为:从一个无论做什么职业的女工到“做小姐”‚这两者之间存在一道深沟险壑‚迈出这一步通常被冠以“堕落”或“失足”。因而‚如果说一般的职业之间的流动是一种量上的变化的话‚那么从女工到小姐的流动则被认为是一种质的变化‚是从良家妇女到非法娼妓的变化。

    我们在访谈中发现‚大多数小姐对于失业/下岗前的正式工作的满意度都比较高‚都很留恋那时候自己所拥有的整体状况。那么‚从国企工人这样一个社会地位比较高的位置‚跌落至“小姐”这样一个处于边缘地带的职业‚其落差到底有多大?换言之‚为什么这些女性在被迫丢下铁饭碗后‚会拾起“小姐”这样一个被社会视为藏污纳垢而丢置墙隅的破碗?这也是很多人极力寻求答案的一个问题。本次调查正是从这些女性在劳动力市场中流动的过程、从她们经历过的工作之间的比较这个角度出发试图发现一些新线索。

    我们发现‚这些东北小姐并不是直接从一个社会地位比较高的职业骤然下降至社会地位很低甚至是没有任何地位的性服务职业‚而是中间经历很多次找工作的过程。她们在那时就已经处于劳动力市场的边缘了。尤其是‚这些工作的职业地位已经与“做小姐”非常接近。因此‚从职业流动的角度来看‚她们所迈出的这一步并没有多大的落差‚反而更像是一种职业之间的“平移”‚而不是上升或者下降。

    下面我们从工作内容和工资收入这两个主要问题对“做小姐”之前的3次工作进行比较分析。我们的前提保证是:在这103位小姐中‚除1人之外‚都是自愿做小姐的。因此可以把做小姐与她们的其他职业经历等同和联系起来进行分析。

    在我们的分析框架里‚第一次下岗失业前的工作为职业流动的起点‚“做小姐”是终点‚离“做小姐”最近的三次工作则是重要的中间点。我们通过分析这几个职业的社会地位差异‚对这个群体的职业流动做一个初步的探讨‚并试图从过程和比较中来寻找这些女性选择做性工作的原因。

    (1 )做小姐之前的具体工作

    从表2可以清楚地看出三个趋势:
    首先‚无论在哪次工作中‚做各种服务员的人都是最多的‚而能够从事任何一种非体力劳动的、比较体面的工作的人都是最少的。
    其次‚她们每换一次工作‚成为“准小姐”的比例就随之剧增一次;而其他所有职业也就随之逐次减少。
    第三‚除了“较体面”的工作以外‚所有其他工作的社会地位都不怎么样‚即使是当小老板‚做的也都是些非常小的买卖。因此可以说她们均处在社会的最底层‚在阶层上的差异性并不大。
    这些情况不仅是一种职业平移的表现‚而且是其原因之一‚因为她们在那些与性产业关系密切的工作中‚更加可能接触和获得性产业的相关信息‚足以更快和更充分地作好信息准备。

    (2)“做小姐”之前与之后的工资①比较


    从表3的工资比较上看‚做小姐之前的3个工作的工资的中位数在500-600元之间。②其中那些收入不稳定的人主要是美容美发与按摩女和各种小商小贩‚她们的最低收入与最高收入相差500元左右。有些人的最低收入是负值(如-500元)‚也就是做小买卖亏本。有的人的最高收入才300元‚比服务员还少‚这是因为在东北的小商贩这个职业中‚往往是“卖的人比买的人还多”。
    很明显‚“做小姐”的工资收入(中位数1500元)比前3次工作要高出很多。这无疑是任何一种职业流动的主要原因‚无论它符合不符合道德。

    2.职业平移的确定分层社会学意义上的讨论 

    职业流动是社会科学最引人注目的课题之一‚早在20世纪20年代‚索罗金(Sorokin)就编列过有关职业流动的23个表;从60年代起‚布劳-邓肯对职业流动模型、影响职业流动相关因素等内容进行不断的探讨与修正‚极大推动了这方面的研究(M∙侯特‚2001 );国内李强教授等对于职业声望的评价(李强‚2000)以及农民工初次、再次职业流动的分析(李强‚1999)也促进了流动理论的进一步发展。

    职业间的流动到底是平移、上升还是下降‚社会学上最常见的研究是从收入、权力和声望这三个指标进行评价‚通常是把这些指标量化并计算其社会经济地位综合值。可是‚以往学者有关职业地位的调查‚从来不包括性工作者在内‚因而我们无法找到一个现成的职业地位等级来对照“小姐”这个职业在其中的排名情况。因而‚我们在这里也只能从探索性的目的出发‚作一个简略的优势—劣势权衡分析。

    毫无疑问‚小姐们的历次工作‚尤其是“最近那次工作”的职业地位‚在通常的职业排名中是非常靠后的‚往往只比进城农民工、看门人等略高一些(李强‚2000)。我们不妨结合小姐们自己对工作的评价‚从劳动强度、劳动时间、自由度、福利待遇、工资收入、心理成本等方面粗略地比较一下:“以前的”与“现在的”工作的职业地位究竟有多大的差异。

    她们以前的历次工作‚最主要的是在个体、私营性质的宾馆、歌厅、饭店里做服务员以及摆小摊的小商贩。这些工作不可能附带任何的权力‚福利待遇也几乎等于零。但相比而言‚“做小姐”的权力和福利待遇不仅没有‚而且是负值(经常遭遇扫黄和罚款‚被感染性病‚受客人欺负等各种风险也都更大)。因而以前的历次工作在这些方面略占优势。

    从职业名声来看‚尽管以前的历次工作在一般职业表中排位很靠后‚但无疑仍然比“做小姐”占优势。也可以说‚选择“做小姐”要付出的心理成本要远远大于做服务员或摆小摊。但不可忽视的是‚随着社会舆论对于性产业的相对宽容以及“笑贫不笑娼”观念的深化(正如本文在“匿名性弱化”部分所分析的)‚“做小姐”的心理成本将会逐渐降低。

    从劳动强度和劳动时间上看‚两类工作的程度是相当的。做服务员或摆小摊通常的工作时间在12小时以上‚而且非常辛苦。很多小姐在描述自己干过的这些工作时都说:太累了。与此相对照‚“做小姐”的上班时间通常是中午12点左右到凌晨2、3点‚虽然单位时间的劳动强度并不是很大(生意不好的情况下‚一天平均一个“生意”都不大可能)‚但对于女性来讲‚经常熬夜的代价也是很大的。用小姐自己的话讲‚就是“很熬人”。
    从自由度方面讲‚“做小姐”总体上的自由度往往比较高(少数受人身控制的除外)。很多小姐在讲述做小姐的好处时经常提到“自由”、“爱做就做‚不做就不做”。可是各类服务员则通常是固定时间上班‚老板通常管得很严。小商贩则是在经济强制下也不甚自由。

    与以前的历次工作相比‚“做小姐”的最大优势在于工资收入高。尽管东北地区的这种工资差距比我们以往调查的广东、深圳小许多‚但显而易见‚如果仅仅从工资收入上看‚做小姐无疑是一种上升。

    综上所述‚简而言之‚从其他职业到“做小姐”‚其实只是一种得失平衡‚只是对于一个大体不变的总量所进行的结构调整。小姐以牺牲福利待遇、可能附带的权力、社会声望等方面的利益‚来换取较高的收入、更轻的劳动强度和相对的自由。所以我们认为‚从总体上来说‚这仍然只是一种职业平移。

    对这些小姐来说‚下岗‚从国家主人翁一夜之间变成服务员‚这才是最大的和最根本的“坠落”。从那以后‚她们就再也没有进入过劳动力市场的中心地带。她们“做小姐”只是找到了另外一个谋生的工作‚仅仅是平行地换了另外一种职业。

    我们在本次访谈中不断地发现:她们自己对这一点的感觉与认知都非常明确和坚定。我们的一个最突出和最强烈的感觉就是:在深谈当初做小姐的时候‚从来没有任何一位小姐对我们提到过什么“思想斗争”、“内心折磨”、“精神痛苦”等等;反而往往是像买东西算帐一样‚一条一条地细数“做小姐”这一行的各种利弊。也就是说‚这种职业平移不仅仅是一个客观上的结果‚也是她们主观上的选择。性社会学意义上的讨论“做小姐”与女性所能够从事的其他任何职业相比‚“性”是惟一的区别。

    它的根基问题则是:灵与肉、爱与性究竟能不能分离开。如果不能‚那么肉体与性的任何形式的借、租、
    卖‚就都决不可能被女性所容忍;反之‚各种形式的“做小姐”实际上就是不同程度地做到了这种分离‚直
    至极端。

    因此从性社会学的视角来看‚在上述的职业平移中‚其实只发生了一件事:在商业活动中‚这些女性与男性顾客之间的“人身距离”被缩短;性方面的“自我防卫圈”被压缩乃至被冲破;性意义上的“信号辨识能力”被强化乃至被异化;从而被培训出了“灵肉分离”的可能性。

    可是‚这一切并不是发生在她们“做小姐”的前一天‚而是自从做任何一种女服务员时就开始了。到了做任何一种与男性有皮肤接触的工作时‚前述的“培训”其实就已经完成了;她们其实就已经“涉性”了;因为皮肤是“性”的终端感受器。只不过其中的筛选机制‚还需要运用分层社会学的视角来分析。

    3.原因分析

    出现这种职业平移现象的原因‚从宏观的角度来看‚无疑是因为在当地的劳动力市场中‚职业上升的机会非常稀缺。但是根本的问题是:这些女性在下岗或者待业之后‚被从原来的较好的社会处境中抛出来‚或者原来就无法进入。这造成了她们的经验资源、支持系统资源和经济资源不但都非常短缺‚而且在不断流失之中。因此即使她们偶遇上升的机会‚也很难把握住‚更难以坚持下来。

    从个人的经验资源(不仅仅是文化程度与技术水平)来看‚由于她们下岗或者待业之后很难在另一个类似的正规单位找到类似的工作‚所以她们原来千辛万苦积累起来的为人处世准则、人际协调能力乃至于整体的工作与生活方式‚对于她们的职业上升的帮助几乎是零。所以她们只能下降‚只能被放逐到市场中去从事服务员这样在地位上仅仅高于农民工的职业。其中‚曾经做过服务员的占47∙6%;做过各种体力劳动的占13∙6%;做过美容美发或者按摩的占28∙2%;可是做过任何一种非体力劳动的体面工作的只有6∙8%。①再者‚她们给个体经营者打工的最多‚占48∙9%;其次是在私营单位工作‚占27∙8%;自己摆小摊无照经营的占4∙4%;在国有企业工作的只有2∙2%。结果‚她们不得不一切从头学起。

    可是‚这样的工作往往是临时的、多变的和职业跨度较大的。她们很难在其中积累起足够的经验资源‚也就不大可能为她们下一次找工作提供任何有效的支持。尤其是‚这样的工作无法使她们获得从事更高级工作的任何经验资源‚甚至把原来的经验资源也废弃了。结果‚她们不得不在劳动力市场的底层屡屡挣扎‚而且基本上是永无出头之日。

    从个人的支持系统资源来看‚在下岗或者待业之前‚她们的支持系统就基本上是处于相同的阶层之中。因此‚这一资源在当时就不可能帮助她们从非技术工人或者普通待业者的地位上向上流动;一旦她们下岗或者待业‚就更加不可能给她们提供有利于上升的就业信息与帮助。

    从所拥有的经济资源来看‚她们原来的积累就不多‚下岗或者待业之后就更少。例如‚她们在下岗时所获得的经济补偿最多是23000元‚最少的则是倒欠4500元;平均数是1400元;中位数则是0。在她们当中‚目前仍然能够领到任何一种补助的人只占10∙7%‚而且每月只能领到平均不足75元‚因为其中有3人是在扣除全部补助之后还需要给原单位交钱。这充其量只能使她们保住原来的城市户口以及随之而来的高于农民的那些基本利益‚例如不大会去种地、不至于饥寒交迫等等;却不可能为她们的职业上升提供有效的帮助。例如‚她们中间有35∙0%的人曾经去做过各式各样的小商贩‚因为她们的那一点点经济积累至多只能做这个‚其结果则是大概率的一事无成。

    总结起来看‚就“小姐为什么会成为小姐”这个问题而言‚我们所发现的这种职业平移现象‚既不能支持“突变论”也不能支持“渐变论”。

    以往的针对小姐的研究‚在分析人们为什么会去“做小姐”的原因时‚给我们提供的往往是一种“突变论”的思维范式。这种思维的前提假设是:从良家女子到“做小姐”‚其间存在一种深沟险壑‚因而凡是这样做了的女性‚必然会有某些极其特殊的、非常重大的原因。这就等于仅仅把“做小姐”作为惟一的一个断裂点来单独进行分析‚而缺乏一种过程分析式的视角。在这种范式下‚很容易出现道德上的“堕落论”;或者“重大事件论”(婚姻家庭变故、情感变故等)。

    本次研究是从职业流动的角度来考察性工作‚把“做小姐”视为一种职业‚把小姐置于劳动力市场这样一个大“场域”的视角。因此‚我们才得以从小姐的工作经历这样一个连贯的纵向的角度‚来理解这些小姐之所以“做小姐”的原因。

    我们认为:真正的和惟一的“突变”‚并不是她们从良家女子变成小姐‚而是她们原来的那次下岗。
    从那以后‚她们也并没有“渐变”‚而是“职业平移”。

    (四)发现之四:劳动力市场与“关系”的走偏

    1.现有理论

    近两年‚在有关“关系”(中介人)与职业流动之间的相互作用的理论中‚比较流行的主要有格兰诺维特和林南的“弱关系假设”、林南的“社会资源理论”(林南等‚2001 )、边燕杰对于社会网络与职业流动关系的研究‚以及据此提出的“强关系假设”(边燕杰等‚2001 )。

    林南提出:一个体系中的相同阶层的人们在权力、财富、声望等资源方面的相似性高‚他们之间往往是强关系。不同阶层的人们的资源相似性低‚他们之间往往是弱关系。当人们追求工具性目标时‚弱关系就为阶层地位低的人提供了直接上升到高地位的通道‚从而获得社会资源。所以‚通过弱关系得到信息的人‚往往会流动到一个地位较高、收入较高的职位。反之‚通过亲属、朋友(强关系)得到信息的人‚向上流动的机会就大大减少(林南等‚2001;边燕杰等‚2001 )。

    边燕杰在天津地区做的调查则显示出职业流动过程中强关系的作用。他提出:职业流动者的社会网络主要由亲属和朋友这两类强关系构成。社会网络发挥作用的形成‚以提供人情为主、以传递信息为辅(边燕杰等‚2001 )。

    2.本次访谈的结果

    我们在访谈中询问了她们做小姐这次以及在此之前的3个工作‚究竟是通过什么样的途径找到的。统计结果反映在表4中:

    从表4中我们可以在她们连续的职业流动过程中‚发现这样一个鲜明的趋势:
    “看招聘广告自己找”(以下简称为“无关系”)这个途径所占的比例一直在下降;
    “亲属介绍或者给亲属干”(以下简称为“亲关系”)这个途径也在持续下降‚而且降幅超过了前一种途径;
    “朋友、老乡、熟人介绍”(以下简称为“友关系”)这个途径却一直在上升而且增幅很大;
    “职业介绍所或者劳务市场”(以下简称为“公关系”)这个途径则一直都是最少的‚而且变化甚微‚从
    未超过10%。
    这样一种强相关的“逆转”的统计现象‚恐怕不是出于样本量较小的可能误差‚而是反映了一种现实状况。

    3.我们与前述理论的视角差异

    第一‚前述研究所说的职业流动都限定于这样两种假定:求职是为了上升(向上流动);求职中是僧多粥少(资方市场)。我们所发现的情况却恰恰相反:她们不是职业上升‚而仅仅是改换工作(平移流动);是雇主更想招她们而不是相反(劳方市场)。
    第二‚前述的研究虽然调查了“通过介绍人、直接找雇主、通过正式渠道”这三种情况;但是进一步讨论的是运用了社会关系来寻找工作的被访者。
    可是我们在访谈中最鲜明的感觉却是:居然有这么多女孩子在第一次找工作的时候就纯粹是自己独闯‚仅仅是看到一个贴在店门上的招聘广告‚就进去就业了。与此相反的情况是:尽管职业介绍所和劳务市场离许多小姐的工作居住场所不过百米之遥‚可是她们中的大多数人居然从来也不知道‚当然更不会去那里找工作。

    因此我们的视角还是把“无关系”(什么也不靠‚完全自己闯)和“公关系”(全靠公共途径而不是私人关系)这两种情况也考虑进来‚才能从“有与无”的视角上‚更加广泛和全面地揭示“(私人)关系”与职业流动之间的互动。

    4.我们的认识

    由于我们讨论的是在劳方市场和平移流动中的情况‚因此对于“关系”与职业流动之间的相互作用‚我们有一些认识‚也许可以加强或者补充前述的研究成果。

    其一‚最主要的原因是:劳动力的市场化不仅极不充分而且在“走偏”。
    这些小姐在下岗或者待业之初‚曾经努力地个人奋斗过;但是后来却不得不转而依靠各种私人的“关系”‚而不是“公关系”(正规职业中介)。这是劳动力市场化极不充分的最好证明。可是与此同时‚她们越来越多地依靠“友关系”而不是“亲关系”‚说明现在的劳动力市场化进程还不仅是一个不充分的问题‚更加可能是“走偏”的问题。
    我们认为‚在“亲关系”不可避免地弱化的同时‚“公关系”却在形式主义化‚“无关系”更是日益走投
    无路‚其结果是三者共同造成了“友关系”的兴盛。可是尤其重要的是‚这同时也使得“友关系”不得不变
    质:它在急速地利益化甚至是牟利化。也就是说‚在劳动力市场中本来是名正言顺的中介获利行为‚现
    在却被积压得转移到本来应该是“知根知底、两肋插刀”的“友关系”中去了。这不仅会打垮中国传统的
    “人情”‚而且会使得“公关系”和“无关系”都很难再生。因此‚不仅在我们以往访谈的小姐中不同程度地被诱和被骗的很多;推而广之‚现在社会生活中其他方面的“杀熟”之盛‚也无疑是这种“走偏”的结果。

    其二‚关系的利益指向更重要‚而且可能改变关系的强度。
    我们发现:小姐们的“关系”(中介人)‚无论是哪一种‚实际上所发挥的主要作用只有一个‚就是“劝服”(说服她们从事该职业);而不是“卖人情”‚更不是“当作自己的事情来办”。有些情况下‚这些“关系”甚至连相关的信息都没有提供多少‚只是一个劲地“做思想工作”。这种现象不仅仅发生在从服务员到小姐的过程中‚而是在她们以前的3个工作中一贯如此‚甚至从她们刚刚下岗或者待业就已经开始了。
    这就是说‚这些“关系”的屁股在客观上其实是坐在雇主那一边。因此在大多数情况下‚“关系”仅仅是把小姐引到某个经营场所就算完‚并不是“帮人帮到底”。至于她们究竟在该场所中能够获得什么样的具体工作(例如是迎宾小姐还是上菜的服务员;是放碟还是三陪还是出台)‚“关系”所发挥的作用甚微‚往往是小姐们在进入该场所之后与雇主博弈的结果。
    这里面没什么别的原因‚就是因为“友关系”的牟利化。在劳方市场与职业平移中‚有求于人的往往不是求职者‚而是雇主‚所以他们肯于出价。而作为双方中介人的那个“关系”‚就会进行“理性选择”。
    结果‚无论这些“关系”与求职者多么“铁”‚也只能是“胳膊肘子往外拐”。
    可是在求职的小姐们看来‚中介人的这种利益指向实际上是有利于自己的‚她们必然会以此来筛选自己的“关系”。结果‚她们就与原本是强关系的亲属渐行渐远‚与原来是弱关系的邂逅之交却信赖有加。

    其三‚各种关系的取舍‚往往不在于其优越性大‚而在于其副作用小。

    在小姐们连续的职业流动中‚“亲关系”的各种优越性(可靠、温情、可持续支持等等)很可能永远都
    是无比珍贵的;可是它的各种缺陷(欠人情、受约束、越亲越无法讲理等等)却也同时与日俱增。同样‚
    “无关系”的优越性(经济独立、抬腿就走等等)也许一直不会磨损;但是它的缺陷(容易被欺负、社会交往少、很难跟雇主讨价还价等等)也会日甚一日地显露出来。结果‚通过这两种途径流动的人就都变得越
    来越少。

    反之‚“友关系”虽然不太可能具有“亲关系”和“无关系”的那些优越性‚却可以在很大程度上避免它们的副作用。例如在匿名性这个问题上‚“亲关系”的副作用是根本无法匿名;“无关系”的副作用则是匿
    名匿到了老板不拿你当人看的地步。惟有“友关系”可以恰到好处地既弱化又保留匿名性。于是只有它
    才能在连续的平移流动中茁壮成长。

    最后要说的是‚由于研究视角的不同‚我们的认识并不是直接针对“强关系假设”与“弱关系假设”的任何一种‚而是希望补充与发展对于这一问题的解释。

    四、总结:整体图像

    仅仅发现以上4点新情况是远远不够的。整合起来看的话‚这4点之间其实是互相构建的关系与互动发展的机制。

    正是由于小姐里的本地城市下岗女工多‚她们才不得不试图摆脱匿名性的束缚‚只能平移却无法上升‚才会越来越“弃亲靠友”。

    恰恰是因为她们只能处于平移这样一种状态之中‚匿名性才有可能被弱化‚“友关系”的重要性才能超过“亲关系”和“公关系”‚同时她们也就被这种平移长久地固化在“下岗妹”这个“出身”当中。

    正是因为她们虽然弱化但是仍然保持一定的匿名性‚以及她们依赖于“友关系”而不是原来的“无关系”和更加有效的“公关系”;所以她们才长期在底层平移。

    当然‚再复杂的相互作用也并不排斥重点与中心。我们认为‚它就是职业平移。这并不是由于它的作用最强烈(在我们的定性研究中‚这是无法检验的)‚而是因为它作为一种最主要的因与果‚处于链接与支承的位置之上。示意如上图。

    如果一定要从成因的角度上剪短截说的话‚那么下岗这个突变只是这些小姐的源头‚而职业平移才是河床。

  • 70万个村庄,欠了9000亿

      “小村大债”已经成为一个不容忽视的问题。

      据农业农村部抽样调查显示,截至2019年上半年,在全国70万个行政村中,村级债务总额已达到9000亿元,村级组织平均负债达130万元。

      2022年过年期间,马学梅和一位当村支书的亲戚聚餐,注意到“村级债务”的概念。作为民盟宁夏区委会参政议政处副处长,马学梅从2017年至2022年到上百个村庄参与扶贫工作,但之前未曾特别留意过这个问题。

      回家之后,马学梅收集并阅读了大量资料,又对从前扶贫去过的二十多个乡镇村干部做调查,形成了一篇以社情民意形式撰写的文章,递送到民盟中央。出乎她的意料,这篇文章不仅被民盟采用,并最终在2023年的全国两会成为民盟中央的集体提案之一。

      几十年前的旧债

      周向前是中部某省份的一位村副书记,在村子里工作接近15年。在他的记忆中,村子一直都有负债。2020年下半年,农业农村部印发《关于开展全国村级债务摸底调查的通知》,要求各地切实摸清村级债务情况。根据周向前所在村的统计,其村级债务超过200万元。

      在该村超过200万元的债务中,有几十万元是“旧债”,也就是1990年代至2006年全面取消农业税之间村集体形成的债务,这被学界称为“传统村级债务”或“旧村级债务”。

      “原来农业税费任务重,不少农户无法上缴税费,只能是村集体为农户垫付税费,借款完成税费上缴任务。”周向前告诉《中国新闻周刊》,几十年来,有一些农户经济状况好了,就把钱还给了村集体,抵了债务,还有一些农户直到现在还没有还上,因此债务延续至今。

      旧村级债务在农村是普遍存在的。武汉大学社会学院教授、中国乡村治理研究中心研究员吕德文曾到多地农村调研村级债务,他对《中国新闻周刊》说,目前村级债务总额中,有相当一部分是税费改革前形成的旧村级债务。

      旧村级债务中,除了因收缴税费导致的债务,还有一部分是村集体为完成上级的经济考核任务而举债兴办集体企业形成的。

      华南理工大学公共管理学院教授黄岩在2019年曾到湖北省某村进行了为期20天的田野调查,据他了解,该村1990年代接到上级要求,必须兴办桑树基地等三个产业,但在投入大量资金后,三个项目仅持续1年时间就在1996年全部破产,并留下了21万余元的村级债务。

      旧村级债务的债权方构成较为复杂,吕德文说,村集体除了会向银行、农村信用社以及民间金融机构借贷,也会以较高的利息向村干部和村民借款。

      根据武汉大学社会学院教授桂华所著《村级债务的“堵”与“疏”》一文,农村税费改革前,全国村级债务规模约为3600亿元。当时,学界一度将村级债务视为基层治理中的最大难题之一。

      税费改革后,旧村级债务被“锁定”,债务利息不再增长,留着逐年化解。一些村子的债务在税费改革后的十余年内已逐渐还清,但在吕德文调研的村子里,有些村直到现在还在偿还二三十年前的旧债。

      王丽惠是南京师范大学法学院副教授、中国法治现代化研究院研究员,近几年来每年暑假都会到农村进行调研。在她调研的一个村庄,一位退休村干部曾在几十年前借款给村集体,后来他罹患癌症,缺钱医治,但手中的白条始终没有兑现,直到他去世,村集体欠他的债都没有还清。

      建设性债务是主要来源

      在周向前所在的村子,村级债务更多还是来源于2006年全面取消农业税之后形成的新村级债务。

      走进村口的仿古门廊,道路两旁绿树成荫,曾经杂草丛生的堰塘,经过整治已经成为点缀村庄的风景,新建的村民广场也是全镇最大的。而在整洁的村容和崭新的楼房背后,是多年累积的村级债务。

      多位专家对《中国新闻周刊》表达了类似的观点——因村庄建设导致的建设性债务是新村级债务的主要来源,项目制则是新村级债务产生的制度背景。

      取消农业税后,国家公共财政资源是以项目制为主要形式向农村输送的。黄岩指出,中央政府为了保障专项转移支付体现政策目标,往往要求地方提供30%~60%比例不等的配套资金,村庄在承接项目时也需要一定资金投入,其目的之一在于对基层政府或地方社会产生激励作用。但是,很多村子没有能力筹集相应的配套资金,只能采取借债、欠款等方式,因而形成村级债务。

      以周向前所在的村子为例,该村从2006年到2018年陆续实施了通村公路硬化项目,目前硬化公路总公里数接近19公里,总投资额达到600万元左右。周向前说,前些年,按照3.5米宽的乡村公路建设标准,上级补助资金为每公里10万元,2018年补助资金标准上调至每公里20万元,总体计算下来,该村的通村公路硬化项目约有一半资金是村里配套的,因此形成了一定的村级债务。

      还有一些村庄建设的项目是在项目验收之后,通过“以奖代补”的形式获得资金,前期需要村里垫资。浙江省丽水市缙云县的黄碧街村在2019年开展了小城镇环境综合整治,丽水市农业农村局工作人员吴玉平对《中国新闻周刊》说,该村的小城镇环境综合整治项目先后投入基础设施建设资金3024.24万元,其中“以奖代补”的财政资金支持204万元,占比仅6.7%,其余的资金由村级向村民筹建,导致大量债务产生。

      在建设性债务之外,新村级债务中还有一种因集体经营项目产生的经营性债务。

      不过,多位专家指出,经营性债务在村庄并不多见。在王丽惠调研过的村子里,还没有产生经营性负债的。吕德文也几乎没有调研过存在经营性负债的村子,在他看来,许多村庄在2000年左右已经因为举债发展集体经济得到教训,因此不会轻易因发展集体经营项目而欠债,“极少数村庄有经营性债务,要么是村庄有得天独厚的条件,例如适合开发旅游,要么是村干部比较自信”。

      据《中国新闻周刊》了解,村级债务中经营性债务占比高的村子大多位于长三角、珠三角地区。浙江省丽水市的村庄就有这样的例子。吴玉平对《中国新闻周刊》说,截至2022年6月底,丽水市有986个村子有村级债务,负债金额共计5.93亿元,其中集体经营性负债约为3.73亿元,占比接近63%。

      值得注意的是,丽水市诸多村庄的经营性负债体现为投资,具有一定的清偿能力。2017年,丽水市青田县出资在平湖经济技术开发区建工业厂房,产业园项目首期投资1.47亿元。据青田发布报道,该产业园项目建成后每年可为青田县的村集体经济增加收益1470万元。吴玉平提供的数据显示,丽水市村级债务中,3.73亿元的集体经营性负债推动形成资产6.09亿元,年度收益4722.45万元,平均收益率达12.64%。

      但是,不是所有经营性债务都能取得收益。当村庄自身条件一般或是村集体经营能力有限,经营性债务可能会成为难以填满的窟窿。黄岩在广东调研时发现,一些城市周边的村庄为了发展经济,向银行借贷在村里建了工业园,期望工业园建成后租给企业,形成稳定收益,但是一部分工业园的设计不科学、招商不顺利,项目经营失败,因此形成村级负债。

      新村级债务中,建设性债务由于主要是各类拖欠的工程尾款,是无息债务,债权人主要是工程队老板,具有私人性。王丽惠发现,许多乡村工程在招标时就要求老板带资建设。老板同意行政村的欠债也有经济理性考量,例如工程项目有一定利润空间,即便被村子欠了几万元债务仍可盈利,并且这些债务相当于纯利,每年还一些就可以。

      经营性债务则主要是向当地农商行、信用社的贷款,还有一些是向“先富起来的村级精英”的借款,往往是有息债务。

      经营性债务可能会比建设性债务更棘手。吕德文指出,建设性债务形成后其实就锁定了,不会增长,但经营性债务可能会造成一系列连锁反应,当地为了盘活经营性项目有可能持续投入,使得债务越滚越大。

      “资源下乡的一种异化结果”

      在黄岩看来,如果说旧村级负债是一种资源挤压型负债,新村级负债则是一种资源输入型负债,形成于21世纪以来国家大规模自上而下向农村输入资源的过程中,是资源下乡的一种异化结果,“产生巨额新村级债务的原因当然不在于资源本身,而是在于资源落地的操作方式”。

      项目制对于配套资金的硬性要求往往是导致新村级债务产生的直接原因,但新村级债务形成的根源并不能完全归结于此。

      吕德文在调研中发现,一些历史上是“好村”的村庄,后来反而成了“差村”,是因为他们承担了地方的示范任务,包括美丽乡村建设、旅游开发、人居环境整治等,他们必须要推进政策硬性要求的建设项目。这其中,有很多工程是不那么必要的,“我调研的村子里,债务比较庞大的,都是因为搞形式主义工程欠了债”。

      黄岩曾经调研的湖北省某村是一座传统的农业村庄,共有村民1476人,约一半村民常年外出务工,空心化严重,该村所属镇在县域GDP排名倒数第二。在这样一座村庄,截至2019年底的负债高达270万元,最主要的原因是村办公大楼建设及其周边环境整治。黄岩说,该村的整治工程从一进村庄就可看到的“村办公大楼”开始,因为它不仅承载着公共办公职能,而且在一定程度上是看得见的“亮点”,是“需要的成绩”。

      黄岩指出,政绩工程下的利益合谋,是新村级债务形成的内在动机。“资源在下乡工程中,不单单要发挥供给农村公共品的作用,它同样承载着各个行为主体多种意图。工程就是一块‘肥肉’,是各种利益主体参与到这些项目的建设中,上级政府要政绩,村集体要面子,村干部要利益。”

      在新村级债务形成的过程中,部分村干部的“活跃”确实不容忽视。王丽惠说,堰塘、道路等基础设施建设关乎村民对村干部的评价,关乎村干部是否能够连任,也是村干部在任期间有所作为的体现,因而,即使借债某些村干部也必须推进。另外,王丽惠发现,在项目工程建设上,某些村干部多抱着“要么不建,要建就要建好”的想法去建设,所以支出常超出预算。

      需要指出的是,造成新村级债务的基础设施建设中也有相当一部分并非不合理的“脸面工程”,而是必要的村庄建设。

      周向前说,这些年来,他所在的村子对于争取各项项目很积极,因为包括开挖清洗堰塘、维修整治渠道等在内的工程是农户真正需要的,“改善了农户的生活环境,也提升了他们的生活幸福感”,所以虽然这些建设带来了负债,但周向前认为,利益大于负担。

      “新村级债务形成的另一个根源,就是村级‘造血’能力薄弱,而农村的基础设施欠账太多。”黄岩说,1990年代,村里可能有一条土路就够了,但现在农村需要更好的基础设施,村集体只能硬着头皮建设。

      新村级债务对村庄社会带来的影响是多方面的。

      周向前直言,这几年因为村子有债务,在开展各项工作时总是放不开,顾虑很多。吕德文也认为,债务对村级组织影响很大,相当于村干部的主要任务不再是搞建设和服务群众,整天为怎么化解债务焦头烂额,“债务不化解掉,等于整个村就僵死在这里了,几乎不可能把村庄发展好”。

      经过在湖北某村的调研,黄岩发现,新村级债务困局还会造成基层权力僵化和固化,多数村民和村干部不愿意接替巨额村级债务的“烂摊子”。

      还有一种更为极端的情况——尽管工程队老板作为债权人,通常希望与村级保持良好的关系,但近年来工程队老板将村委会告上法庭的案件变得越来越多。

      以山西省高平市为例,该市常住人口45万余人,辖15个乡镇或街道、304个村民委员会或居民委员会。最近几年,高平市涉乡镇(街道)政府(办事处)和农村(社区)组织债权债务案件数量飙升,2016年1件,2017年52件,2018年114件。高平市人民法院副院长吴玲玉在一篇调研报告中指出,高平市基本上所有乡镇(办事处)都涉及债权债务案件,债务金额达数千万元,而且作为被告的乡镇(办事处)、村委(居委)基本上全部败诉。

      当村集体资产有限,村委会不配合执行,不仅影响村委会及其组成人员,也会拖累整个村庄的发展。

      2019年,河南某村委会的法定代表人因为拒绝履行法院支付工程款的判决而被强制拘留。还有一些村委会成为了“老赖”,被法院纳入“失信被执行人”名单。根据《关于加快推进失信被执行人信用监督、警示和惩戒机制建设的意见》,成为失信被执行人的村委会将在参与政府投资项目、获取补贴和政策支持、获评文明村镇奖项等方面受到限制。

      马学梅说,当村干部成为“老赖”,整个村子的运行会更困难,除了在参与项目、获取补贴时受限制,村干部所有的培训活动、外出学习也会受影响,因为坐不了高铁、飞机,“往往就得换人,但这一波人下去之后,债务依旧没解决,(施工队)再告,(新的村委会)再变成‘老赖’”。马学梅指出,一定程度上,村级债务会对基层治理体系和治理能力现代化带来很大的负面影响。

      化解之难

      如今,对于存在村级欠债的村庄,化解债务已经成为头等大事。

      但在村集体经济收入较低的村庄,化解债务并不容易。根据农业农村部的数据,截至2019年底,浙江省已全面消除集体经济年收入低于10万元、经营性收入低于5万元的薄弱村。但是王丽惠指出,排除江浙沪、珠三角的省份,全国很多村子的集体经济年收入仍不超过10万元,甚至在她调研的村子中,绝大多数的村集体年收入在5万元左右。

      周向前说,其所在村子的村集体年收入就不超过10万元,对于偿还村级债务作用轻微。前几年,该村有一大部分债务得到化解,主要靠地方政府征收该村集体土地得到的收入。

      很多村子都像周向前所在的村子一样,通过寻找外部资金化解村级债务。王丽惠举例说,比如通过土地增减挂钩,“在土地上找钱”,她还调研过一些村子,会通过接受水库移民、获取移民扶持资金的方式化解村级债务。

      周向前提到了一个词语,“化缘”,当村集体经济很难增收,村干部只能到对口帮扶单位去多沟通,或者去找一些有能力的人,先“化缘”一些资金渡过难关。

      为了化解债务,周向前所在的村子还在继续“跑项目”。吕德文说,这是很多村子的选择,因为这些村庄没有能力赚钱化解债务,只能通过不断跑新项目,用新项目的资金去还旧项目的债。而申请越多,就意味着村子要配套的资金越多,于是陷入一个怪圈:往往是国家投入得越多,专项资金下达得越多,村级债务就会越多。

      “其实就是拆东墙补西墙”,王丽惠发现,当村庄以“跑项目”作为填补债务的主渠道,往往会造成“滚雪球”困局,这中间会充满了关系运作,产生资源损耗和权力寻租。

      王丽惠还指出,“跑项目”的债务化解方式也会导致村与村的建设能力失衡。“项目资源越多的村,村干部声望越高,越容易得到上级政府的认可,能争取到更多项目,且项目越多的村,村庄建设越好,上级政府也越认为村干部能做事,项目批给这样的村,也更放心,因而债务可以持续化解,但也在持续积累;而资源少、建设少的村越来越缺项目资金,村庄建设越发停滞,债务也无法化解。”

      “小村大债”的化解难题已经引起了各方关注。民盟中央在今年两会期间提交的提案中提出了一种倒逼机制,建议建立和落实“第一责任人”制度,明确各镇(街)镇长(主任)和各村民委员会主任是化解村级债务的第一责任人,把村级债权的回收率、债务偿还率、资产增长率和是否出现新增债务作为镇村干部工作考核的重要内容,同时把考核结果与干部的报酬、评优、提拔等挂钩。

      目前,已经有一些地方在推进村级债务化解时引入类似机制。2023年1月,中共丽水市委组织部和丽水市农业农村局印发了《村级债务化解工作指引(试行)》,其中指出对负债100万元以上的村,由县处级领导包村化解债务,逐村制定方案。

      除了探索化解已有村级债务,如何从源头防范新增村级债务,也是亟待探索的。周向前说,其所在村庄上级政府从2021年强调不允许举债搞建设,所有项目在动工之前要由乡镇一级把关资金筹措情况,“卡得很严”,如果想新增债务,几乎不会通过审批。

      上述丽水市的《村级债务化解工作指引(试行)》也强调要从源头上遏制债务,包括要建立新增债务负面清单和加强新增债务审批管理。

      除此之外,多位专家提到,村一级项目施工的方式还可以优化,以避免村级债务的产生。

      吕德文在北京平谷区罗营镇调研时发现,该地正在探索村民自施项目,部分工程从项目前期工作、项目建设、竣工验收到建成维护,全程由村民共同参与,相较于找施工队,工程成本显著降低。王丽惠在中部某省调研时则发现,一些地方的项目制度也在变化,以前项目资金是直接拨到村里,现在则是 60万元以下项目镇里招标,60万元以上项目县里招投标,把项目资金直接打给施工方,“甲方变了,不再是村两委,而是县级政府,村级欠债的空间也就越来越小了”。

      当然,更重要的是减少不必要的项目。吕德文指出,“形式主义的工程就不要再搞了,经营性的项目,村级组织也尽量少介入。要是能做到,可以大大减轻村子的负担,减少债务”。

  • 易继明,蔡元臻:版权蟑螂现象的法律治理—网络版权市场中的利益平衡机制

    引言

    “版权蟑螂”(Copyright Troll)一词源自近20年来倍受关注的“专利蟑螂”(Patent Troll)现象。与专利蟑螂相似,版权蟑螂或称“版权流氓”,是一种通俗意义上的贬称,它是特指那些专门通过向他人发起版权侵权诉讼或者以发起版权侵权诉讼相要挟,以获得利益的维权主体。从权利角度来看,维权主体发起侵权诉讼,本身并不违反版权法和诉讼规则,也直接或者间接地维护了权利人的权利,并为版权人带来切实的利益。但是,版权蟑螂运用资本优势介入创新市场的诉讼投机行为,可能会骚扰到创新主体或者普通的网络用户,甚至会适得其反地埋没原作品本身的社会价值。也就是说,版权蟑螂是一把双刃剑,在活化版权市场的同时,也会打破原有的利益格局及竞争秩序,反而会阻碍创新或者损及大众利益。例如,“三面向现象”中原版权人与网络服务提供者的困境,昭示的是“传统的复制售卖而获利的整个知识保护体系和文化再生产模式的危机。”

    在我国,版权蟑螂兴起于本世纪初,以华盖、三面向、磊若公司等商业维权主体为代表。但总体上,我国版权蟑螂行为尚处初级阶段:他们涉猎的作品主要包括摄影作品、美术作品和文字作品等,影视作品、音乐作品等数字版权作品较少;诉讼对象更多地指向企业、行政机关、公益性社团等———此类主体的应诉能力强,以司法判决结案的比例较高,较少涉及普通网络用户;传统版权作品的网络盗用行为居多,数字环境中下载版权作品而发起的诉讼尚未形成规模;多数版权蟑螂不是作品的原权利人,导致主体适格性问题成为其败诉的主要原因之一。此外,在诉讼策略上,我国版权蟑螂没有采取急功近利的做法,在发起诉讼前仍会向对方发出停止侵权函件,并尝试通过谈判的途径确定赔偿金额。就现状分析,版权蟑螂在我国演变为“巨兽”,尚需时日。但随着市场全球化格局的形成,对于影视产业而言,中国不但是具有无限潜力的庞大市场,也是欧美影视公司实行打击侵权的首要目标。美国贸易代表办公室在2015年3月发布的《2014年恶名市场非常规审议》报告中,对我国整治“快播”播放软件和关闭“人人影视”站点的成绩给予了积极评价,但同时也指出我国盗版现象依然严重。除了网络播放平台和盗版资源下载网站以外,近年来在我国迅速普及的电视机顶盒(Set Top Box,也称Media Box)也为国外密切关注。美国在《2015年中国履行WTO承诺情况报告》中甚至认为,机顶盒普遍具备的下载功能和便捷的特点,进一步恶化了中国的网络盗版问题。种种迹象表明,版权蟑螂正在跃跃欲试,或已悄然地布局中国市场。

    在美国,版权蟑螂的大量涌现存在两大因素:一是侵权损害赔偿额度高,权利保护力度大;二是网络空间权利边界不明确,侵权现象较为泛滥。尽管我国知识产权保护力度有待加强,但我国网络空间盗版现象更为严重;与遏制专利蟑螂相似,我们应该未雨绸缪,深入探讨版权蟑螂现象、蟑螂行为,并对此加以有效规制。而与专利蟑螂不同的是,版权蟑螂大多活跃在网络空间,由此引发了诸多新问题,例如,网络用户下载盗版作品的行为是否构成侵权?如何在规制版权蟑螂的同时,遏制网络领域的大规模侵权行为?而且,如同本文后面谈及的,版权蟑螂行为在盗版环境下发生了转换,让其身份具有了更强的隐蔽性,也给相应的法律规制带来了困难。本文试图通过分析版权蟑螂现象、行为及其危害,探讨治理版权蟑螂现象中涉及的合理使用、法定赔偿及“三振出局”机制,以寻求网络版权市场的利益平衡机制。

    版权蟑螂现象及其危害

    从维权主体考察版权蟑螂的行为,更多地涉及到诉权滥用的问题。但从权利滥用的角度来看,美国法较早地将专利滥用作为一种抗辩规则延及到了版权领域。1990年Lasercomb America,Inc.v.Reyn-olds一案中,原告在许可被告使用其软件时,要求被告在100年之内不得以此为基础进行后续开发与设计竞争性产品。该案中,法院并未认定被告破解原告技术措施并制作侵权软件复制件的行为构成侵权,而是支持了被告提出的版权滥用抗辩的主张,认为原告即版权人“试图通过其行使版权的行为在权利保护范围之外限制竞争”,其权利行使的方式涉及公共政策之衡量,自然认为禁止版权滥用原则“天然地存在于版权法之中”。诚然,这是美国法院利用衡平法技艺的法律适用,并非一种反垄断法上的规制。不过,这里的原告与被告之间,都是以创造或者利用版权为主,均属于版权实施主体,并非版权蟑螂兴起时的典型样态。

    而典型意义上的“版权蟑螂”,我们似乎可以找到更早时期的雏形。根据欧美学者考据,历史上第一例“版权蟑螂”现象出现在1870年。彼时,英国人托马斯·沃尔(Thomas Wall)在取得大量戏剧作品和音乐作品的表演权许可之后,没有遵循版权许可主体的传统经营规律而与他人签订许可合同,而是选择直接向已经涉嫌侵犯表演者权的主体提起诉讼,以2英镑的最高法定赔偿额度要挟,迫使后者无奈和解。此后的100多年中,虽然企业通过发起版权诉讼而“大捞一笔”的事件时有发生,但其主要利润来源并非侵权赔偿,往往本身也是版权实施的主体,或者尚未形成一种规模而危及创新市场,其“蟑螂”或者“寄生”的属性仍不十分显著。

    事实上,美国法学文献中出现“版权蟑螂”一词,是2007年一篇涉及版权改革的论文,迄今尚不足10年。而典型的“版权蟑螂”性质的大型“版权持有主体”,直到2010年发起了一系列的大规模诉讼之后,才真正引起人们的重视。2010年起,美国出现了众多以获益为唯一目的的趋利性诉讼,并逐渐向网络盗版领域转移,继而引发了大量的以普通网络用户为被告的“共同虚名被告案件”(Multi-Defendant John Doe诉讼,简称MDJD诉讼)。显然,这种针对普通网络用户的滥诉行为,影响到了公众的利益。

    诚然,版权蟑螂作为版权保护链条上的积极执行者,能够对原权利人起到辅助性的保护作用。版权蟑螂强大的执行力使得原版权人可以放心地将其版权保护和执行工作“外包”给前者,起到节省资源的作用。从经济学角度来看,版权蟑螂创建了一种版权保护的规模经济(Economy of Scale),提高了版权保护的效率。不过,版权蟑螂客观上存在的这些优点,并不能完全抵销它所带来的多种负面效应及社会危害。

    第一,版权蟑螂引发了大量滥诉行为。版权蟑螂通过“帮诉”(Champerty)获得侵权赔偿、并将其作为唯一利润来源的经营策略,导致了大量不必要的诉讼。出于避免“诉讼拥堵”(Trafficking in Lawsuits)的考虑,普通法长久以来将“无利害关系的帮诉”视为违反公众利益的行为。即便如此,在2013年美国联邦地区法院审理的所有版权侵权案件中,由版权蟑螂发起的MDJD诉讼仍然占到了其中的43%,该比例在2014年第一季度攀升到了46%,而这个数字在2001年到2013年期间尚不足20%。显然,此类诉讼行为不仅导致诉讼资源的浪费,而且会在合并诉讼的泛滥下失去控制。

    第二,蟑螂诉讼无法缔造市场。如果仅就维权行为本身而言,版权集体管理组织和行业协会似乎已经具有了版权蟑螂的雏形,因为二者也会针对侵犯版权的个人和企业发起大规模诉讼。但此类诉讼的意义绝不仅限于为版权人博取利益,其更多的是为了促使侵权人意识到其行为的危害性及代价,从而转向主动获取正当的版权许可。这种许可关系一旦建立,权利人就拥有了遵循版权法益的、长期稳定的利润来源,市场占有率也会随之增加。换言之,这种善意的版权诉讼发起者,同时也是市场的缔造者(market-maker)。市场缔造者发起诉讼的意义在于消减未来的潜在诉讼,这和版权蟑螂导致滥诉的效果截然相反。同理,任何积极拓展正当利润渠道的大型版权权利主体(如跨国音像制品公司),都是版权市场的缔造者,而不是通常意义上所称的版权蟑螂。

    第三,版权蟑螂埋没了作品的实际价值。版权蟑螂固然能够加强版权的保护力度,但是其效率是否能够满足社会的需要却存在疑问。为了尽可能迅速地实现收益,版权蟑螂在其维权的过程中,通常会选择跳过诉讼以外的其他环节,例如诉前警告(包括take down notice和warning letter)和签订版权许可合同。这种做法的一个明显缺陷,就是抹杀了作品在社会发展和文化传播中拥有的实际商业价值和社会价值,而只是通过诉讼形式烘托出了某种不切合实际的“诉讼价值”。尤其是,在绝大多数诉讼止步于庭外和解的情况下,由于和解金额较之损害赔偿额度更低,此时作品的真正价值已经遭到了无视。

    第四,蟑螂理念违反利益平衡、阻碍社会创新。美国总统行政办公室在2013年发布的《专利主张与美国创新》报告中,认为专利蟑螂现象的滋生和蔓延降低了社会的创新能力,进而导致社会整体福利的缩减。版权蟑螂同样能够导致上述后果。随着版权蟑螂诉讼策略的转变,越来越多的被诉侵权行为开始来自于不带有商业目的、不存在直接市场替代效果、甚至因为不了解版权规定而不慎侵权的普通个人。虽然曾有观点认为“善意侵权不能作为不负民事责任的抗辩理由”,但在现今更多学者看来,基于利益平衡的考量,权利的保护范围在实际操作中不应覆盖法律所允许的每个角落,在版权人维护权利和公众使用作品之间需要始终维持一种权利上的“实施平衡”(Enforcement Equilibrium)。为了实现这一平衡,应当在版权人与公众之间的利益边界周围设定一个灰色区域作为双方权利的缓冲;而进入该区域后的保护,实际上并不能为权利人带来多少额外的激励。“在权利人可接受的范围内允许他人对其作品的适当使用(即便这种使用是侵权),从而使权利人将精力投注在对经济影响最大的侵权行为的阻却上。”在网络版权的语境中,普通网络用户的个人侵权行为(尤其是下载行为),就属于这种灰色区域。版权蟑螂的“利润化”诉讼策略过度挤压了灰色权利区域的空间,从长远来看,会对社会创新产生寒蝉效应,可能会阻碍版权法目标的实现。

    版权蟑螂的行为特征及其转换

    版权蟑螂的商业模式是,在针对性地、有限地获取一定版权之后,围绕获取的版权权利,系统性地主张版权保护以获取收益。从行为特征分析,版权蟑螂的经营模式可以简单归结为四个方面:首先,通过购买或者原始获得的方式获取版权,并且将其针对性地指向已经、正在、以及将要发生的版权侵权行为;其次,专注于作品的诉讼价值,即通过诉讼能够从侵权方“榨取”的利益,而非作品真正的商业价值;再次,其运行模式中缺乏善意的(或积极的)许可机制;最后,倾向于利用高额法定损害赔偿和诉讼花费向侵权方施压,争取在最短的时间内迫使侵权方接受和解。

    (一)版权蟑螂与专利蟑螂的对比分析

    直观地看,版权蟑螂与专利蟑螂较为相似,其商业模式或称“经营手法”也基本相同。两者都是通过自身创造或者从原权利人手中购买作品的版权或者专利权(包括独占许可使用权),有的放矢地针对侵权人发起诉讼,或者以诉讼相要挟,以赚取巨额利润。不过,仔细分析,两者也存在一定的差异。但这种差异,主要是两者权利形成的基础及其转换成本决定的。对版权作品与专利发明这两种客体,法律保护的前提就不一样:前者“出汗”即可,自动产生;后者需要较高的创造性,且有待行政部门确权。缘此,专利制度中的有效性问题(宣告无效程序)成为一个潜在的节点。

    传统的激励理论很难解释为什么专利权人获得保护的前提是公开与其发明相关的研究成果,而版权领域却没有类似的要求;也无法解释为什么版权人拒绝授权许可,将作品束之高阁的行为可以被接受,而专利权人不实施专利的行为却被认为是有损于社会利益。马克·莱姆利(Mark Lemley)认为,这是因为二者在“转换成本”上的截然不同。就版权而言,即便作者拒绝授权许可其作品,公众仍然可以在接触到作品的内容之后,以全新的表达方式将该作品予以“二次呈现”:版权制度只控制和保护原作品的表达,而不延及其背后的思想。思想与表达的二分法,降低了版权作品的转换成本,使得版权人即使疏于开发作品,也不会导致严重损害公众利益和阻碍文化传播。相较之下,由于专利发明中包含了机械、医药、数字等专业性技术,导致其实际的呈现方式受到制约与限制,即便该项发明能够借助其它途径实现,也往往需要大量的研发力量、制造能力及财力的支撑。因此,如果专利权人不实施其专利,很可能直接导致某项技术发展的停滞,从而对科技的进步产生消极的影响。二者在转换成本上的差距,实际上减小了版权蟑螂对社会发展的危害,这也是版权蟑螂在专利蟑螂起势20年之后才形成规模的主要缘由之一。

    但另一方面,对于普通大众而言,版权蟑螂所产生的直接危害可能较之专利蟑螂要大一些。虽然从历史上看,遭到版权蟑螂起诉的主体包括普通企业、网络服务提供者以及非商业性组织等,但是随着诉讼经验的积累,版权蟑螂起诉的对象也发生了变化。版权作品低廉的转换成本不足以牵制住足够多的企业,版权蟑螂若仅以普通企业为目标,其生存无以为继。而版权蟑螂对第三方平台的策略性忽视,则是得益于唱片业版权人获得的经验教训。早期美国唱片业版权人在面临盗版问题时,认为追究下载用户的责任不切实际,便转而起诉网络分享技术提供商。这一思路虽然获得了一定效果,但是最终还是随着P2P技术的革新而遇阻。如今的版权蟑螂(乃至一些急欲维权的行业协会,如美国作曲家、作家与出版商协会,即American Society of Composers,Authorsand Publishers,简称ASCAP)更倾向于将目标锁定为未经许可下载作品的网络用户。具体做法上,版权蟑螂会采取“佯装诉讼”的策略,先起诉网络服务提供者,再以取证的名义迫使其提供有过下载行为的IP地址的相关用户姓名和详细住址,借此将数以千计的“无名氏”(John Does)钓出水面,最后一并起诉。可见,对公众而言,版权蟑螂的诉讼模式给其带来了更为直接的压力和危害,并不像专利蟑螂那样重点在于骚扰创新者而间接地损及公众利益。

    而在维权主体发起的诉讼中,版权蟑螂与专利蟑螂也存在一些不同之处。

    第一,在诉讼主体方面,版权蟑螂作为原始权利人的诉讼比例正呈现出上升趋势。以美国为例,2012年前最具代表性的版权蟑螂是一家名为Righthaven的版权代理机构,其商业运作模式与专利蟑螂非常类似,即本身不使用作品,也不是作品的原权利人,仅仅是为了诉讼目的而获取了Stephens Media等大量新闻媒体公司的文字和摄影作品的授权。但此后,由于这些授权导致原告适格性上存在漏洞,Righthaven在经历了多次败诉后宣告破产。2012年之后出现的版权蟑螂不再轻易授权代理机构或者专门从事蟑螂诉讼的律师事务所,转以原权利人的资格亲自维权。“从联邦法院最近几年受理的案件来看,早前强调‘为了诉讼而专门购买版权’的定义已经过时了。”显然,这与当下专利蟑螂仍然以非经营实体为主的情形有些不同,它具有了更强的隐蔽性。

    第二,所利用的权利武器或称“博弈工具”不同。版权蟑螂和专利蟑螂虽然都是“实施系统性诉讼的投机分子”,但二者诉讼投机行为所利用的法律武器有点差异。专利蟑螂更善于利用专利系统中的漏洞,例如权利要求界限不明确的专利和专利审查的不严密性。相反,版权作品的边界更加明确,一般不会遭到作品有效性的抗辩。版权蟑螂倚仗的是高昂的法定赔偿,而其遭到的抗辩通常是对作品的合理使用。

    第三,二者的诉讼策略有些差异。版权蟑螂更擅长采用针对侵权人心理弱点的诉讼策略。具体地说,版权蟑螂会针对性地挑选某些让侵权人羞于承认接触事实的作品(尤其是非法下载淫秽作品的行为)作为侵权客体。相较之下,虽然某些专利产品(如成人用品)也会有“伤风败俗”之嫌,但无论是从市场还是专利数量的角度来看,都不能为专利蟑螂带来同等程度的收益。

    (二)盗版环境下版权蟑螂的转型

    任何涉嫌侵犯版权权利人权益的行为都可能招致版权蟑螂发起的诉讼。但是,版权蟑螂的运营模式本身决定了其需要格外重视诉讼成本;基于这一考量,在同一诉讼中对多个侵权人发起诉讼应当最能够迎合其低成本、高回报的目的。随着社会的发展,人们文化生活需求与版权作品供给之间已经构建起了一种永久性相互增长(Ever-increasing)的关系,任何普通消费者做出的侵权行为,都可能因为庞大的人口基数而构成大规模侵权。可以说,在公众行为、侵权和版权蟑螂之间,实质上存在着一种相伴相生的微妙关系。

    版权领域中,盗版是最常见的大规模侵权行为。由于制作、销售、购买盗版商品的成本远低于正版,盗版现象在很大程度上迎合了销售者和消费者趋利的天性而产生。伴随印刷术出现的盗版行为,在缺少道德约束且极为便利的网络空间里,迅速发展成了一个全球性的产业,这也注定了盗版领域将成为版权蟑螂攻击的主要目标。

    当下版权蟑螂的主要诉讼对象是通过互联网下载盗版电影作品的网络用户。诚然,如前文所述,版权蟑螂在其诞生之初的情形并非如此。2012年以前,版权维权诉讼的被告多为未经许可在网上使用或者上传他人作品的企业和个人、以及为盗版作品提供传播平台的技术服务提供者。但经验表明,上述侵权群体为版权蟑螂带来的收益一概不及数以百万计的网络下载用户。2012年,以起诉色情影视作品的网络下载用户为生的“淫秽作品版权蟑螂”(Porn Troll)出现在人们的视野里。2013年1月到2014年6月期间,淫秽作品版权蟑螂发起的版权MDJD诉讼占据了美国所有版权诉讼的35.97%,而该比例在2010年尚不足3%。

    总括而言,与早期相比,2012年之后的版权蟑螂诉讼有四个方面的转变:第一,在授权许可上稳重处理,原始权利人诉讼增多而继受权利人诉讼减少;第二,作品领域从文字作品、摄影作品、美术作品等转向了受众更广的电影作品;第三,诉讼主体对象上,“个人”取代了“企业和技术服务提供者”;第四,诉讼主要针对的行为转变为未经许可的下载行为。这四种转变,也形成了当下版权蟑螂鲜明的诉讼风格。有的国外学者将这些专门起诉网络盗版影视作品下载行为的版权蟑螂,称之为“网络盗版版权蟑螂”(Internet Piracy Trolls,例如美国著名色情影视公司Malibu Media)。

    从版权蟑螂的角度来看,上述转变可以为其带来一些好处。

    首先,版权蟑螂从作品继受权利人到原始权利人的角色转变,意味着这些维权主体具有了更加广泛的业务领域,获得侵权赔偿不再是其唯一的利润来源。同时,还填补了原告适格性上的漏洞,避免了在该问题上遭到反诉,也使原本诸如“空壳公司”或者“寄生虫”等反面形象有所改观。某种程度上,转型后的版权蟑螂更接近于一种介于版权协会组织与早期版权蟑螂之间的维权主体。这种身份的转换,容易遮蔽法官们的视线,也为法律上的有效规制增加了一些困难。

    其次,盗版影视作品下载者的数量远远多于其他侵权群体的人数。随着观赏影视作品成为人们日常生活中不可缺少的一部分,未经许可传播影视作品的网站(即盗版影视作品网站)和使用此类网站的用户与日俱增,为版权蟑螂的滋长提供了一片更加“肥沃”的土地。相较于大型企业和组织,个人的经济实力和心理承受能力都处在绝对的劣势,其应诉能力的欠缺也会让版权蟑螂在诉讼中处在更加有利的地位。

    再次,非法下载盗版作品构成侵权行为的可能性大,受合理使用庇护的几率则小;比起早期一些蟑螂诉讼,权利人遭到反诉乃至败诉的风险几乎已是最小化。这一点,在后文中会详细阐述。

    最后,盗版影视作品的网络下载行为增强了版权侵权行为的主观故意性质,在一定程度上导致侵权赔偿额度的提高。在传统版权作品的盗用行为中,版权人常常因为未能在作品上给出警示,导致在证明侵权人存在主观故意时存在困难。如果最终无法证明存在主观故意,侵权人的行为便有可能落入合理使用的范围中。然而,这一困难在下载盗版影视作品的语境中得到了消解———影视作品片头的警示画面和P2P下载网站难以洗净的盗版气息,使得法院完全有理由判定侵权人是在明知的主观状态下做出了下载行为。美国法院对“故意”一词在司法实践中做了相当宽泛的解释,而美国《著作权法》第504条规定,故意侵权案件中法定赔偿额度以15万美元为上限,远远高于非故意侵权时的3万美元。显然,高昂的法定赔偿额将会给侵权人带来更加难以承受的应诉压力,进一步提高诉前和解的可能性。

    侵权 vs. 合理使用

    版权蟑螂的行为特征之转换,使得权利人、个体消费者和公共利益之间的关系复杂化。比如早期个体消费者从街头购买盗版光盘回家自己欣赏,一般认为系终端消费者被免责,不仅不会被认定为侵权,反而有可能被视为侵权产品的“受害者”。但是,当版权蟑螂瞄准网络环境下的灰色地带,对下载盗版作品的网络终端用户发起诉讼攻击的时候,网络用户的下载行为是侵权还是合理使用,就成为了法律争议的焦点。

    (一)侵权风险:传统版权与数字版权的对比分析

    个体消费者与作品之间的互动过程,可以分为接触、享用和使用三个阶段。在现实生活中,消费者购买商品的行为就是一种典型的接触性互动,是第一阶段的互动;购得作品后,消费者出于个人研究、学习、欣赏的目的,对作品进行直观感知的行为,例如聆听音乐、观赏电影等,都属于常见的第二阶段的享用性互动;最后进入第三阶段,个人对于作品的使用——通常指的是严格版权意义上的使用,这类行为往往会直接影响作品的传播和流通,也可能产生新的作品。美国学者德博拉·塔西(Deborah Tussey)以使用行为的目的和作品的传播程度为界线,将作品的使用分为“消费性(Consumption)使用”和“改编性(Adaptation)使用”。前者,通常包括复制以及后续传播作品的行为;后者,则主要表现为改编、注释、翻译等演绎作品的行为,这与美国版权法中的“转换性使用”(Transformative Use)基本相同。

    显然,个人对版权作品的使用与版权人的利益休戚相关。消费者未经许可消费性使用他人作品的行为一旦形成规模,会对权利人的商业利益产生直接的危害;而通过改编性使用诞生的演绎作品,由于会对原作品已经占有的市场产生替代效果,原权利人对此也应当享有相应的获酬权。网络时代,无论是“消费性使用”还是“改编性使用”,由于其规模化程度加深,加之各种使用的即时性,如果我们仍然将网络用户定义为传统意义上的个体消费者,适用个体消费者免责,显然使得版权人利益受损。从这个角度来说,将个体消费者与作品之间的互动环节区分为三个阶段,对侵权判定意义重大。

    如前所述,对于实体盗版商品而言,消费者向盗版商品卖家购买依附于有形载体的盗版商品(例如盗版图书和音像制品)的行为,现行《著作权法》一般不被视为侵犯版权。这是因为在实体盗版商品的语境中,接触、享用和使用三个互动环节可以被简明地区分开来。传统版权法中,对个体消费者的规制主要集中在其对作品的使用行为,不会延及接触或享用。因此,实践中,寄生在实体盗版商品上的版权蟑螂会将诉讼对象指向传播盗版作品的非纯粹意义上的个体消费者,这些个体消费者可能因为其传播行为涉嫌侵犯复制权、发行权和署名权而遭到起诉。

    不过,类似的侵权判定如果是以数字下载为对象,很可能得到截然不同的结论。表面看来,下载一部影片和从摊贩手中购买一张盗版电影光碟的行为,并无本质上的差异。但在数字环境中,下载是一种通过复制来获得作品的一种手段:不仅涉及对作品的获取,更意味着接触作品和使用作品两个环节的同时发生。网络用户的下载行为,其实已将第三阶段的使用,与前两个阶段的接触和享用叠加在一起。如此一来,现行版权法一方面认为下载行为包含了复制而构成了对他人作品的使用,可以被视为侵犯了权利人的复制权,但另一方面,又认为对来源不合法的作品进行私人复制却不是违法,“这样的结果显然很荒诞”。的确,用户在网络上狂欢,但我们同时意识到,任意获取“免费午餐”的行为本身已经触及社会普遍的道德底线,也抑制了社会创新文化的活力。从这个角度分析,无论是从社会观念来看还是从法理角度分析,网络用户下载盗版作品的行为应该被认定为侵权。

    (二)适用个人合理使用抗辩的困境

    当侵权人成为普通大众即广大消费者的时候,侵权人与权利人之间的利益平衡就发生了微妙的变化,因为普通消费者从一定程度上被视为公共利益的载体。事实上,版权法在维护版权人权利的时候,也会尽可能地去满足消费者使用作品的需求。在传统版权市场中,版权法允许消费者在私人空间内,在不产生针对版权作品的市场替代效果的前提下,使用他人的作品。这种使用,一般指向作品的复制和演绎。由于复制权是版权财产权利中最核心的权利,版权人和公众之间的利益争端主要便是围绕复制权而展开,其最终涉及的就是有关私人复制的合法性问题。

    受到版权人利益的制约,私人复制的生存空间自始便十分有限。实际上,私人复制作为合理使用情形中的一种,在各国版权法律中通常只是作为对版权的限制而设计的一种消极抗辩,鲜有上升为公众能够主动行使的积极权利的立法例。随着信息传播技术的革新,人们复制作品的手段渐渐丰富,复制的速度与规模也随之增长。相反,版权人限制私人复制的技术难度和成本却在不断增加。为了保持一种来之不易的利益平衡,立法者在私人复制的合法性问题上采取了愈发严厉的态度,这在许多国家的立法和判例中都有所体现。

    美国司法实务在面对网络个人侵权问题时的态度,随着侵权行为和作品类型的改变,经历了一个从宽松到严厉的变化过程。最初,由版权蟑螂发起的诉讼主要针对的是博客空间发表博文时出现的文字、图片的网络盗用行为。在绝大多数情况下,此类行为都只是对作品或者作品的一部分所进行的不带有商业目的的“实际上的转换使用”(Transformative Useperse)。对此,法院通常会判定该类使用行为因部分满足“四个合理使用要素中的主要因素”而免于侵权责任。可以说,由于博客受本身的技术、场景与篇幅所限,作品遭受大规模侵权的可能性较小,无论是作品被使用部分的篇幅和重要程度,还是市场替代的效果,都不会对版权人的利益带来实质性的损害。况且,版权蟑螂滥用诉讼的行为未能彰显作品的市场和文化价值,无法正确体现版权法的法益。若从衡平法的角度考量,限制此类权利人的诉讼空间,让公众的行为构成合理使用,这种司法政策是能够被理解的。

    但是,针对非法下载网络盗版作品行为的合理使用判定,就有所不同了。网络用户在明知盗版作品涉嫌侵权的情况下,仍然进行下载的故意侵权行为,难以用“合理使用”作为抗辩的理由。大多数国家的版权法认为,“非法下载行为毫无‘合理’或者‘轻微’(de minimis)可言”,都应当被视为侵权。

    在我国,有关网络环境下私人复制的合理使用判定问题,更加富有争议。例如,曾有观点认为,可以将现行《著作权法》第22条第1款的措辞视为私人复制适用于数字环境的依据,并且在此基础上指出,“在当今数字技术广泛运用的情况下……允许个人为欣赏而合理使用作品会严重损害著作权人的经济利益”。继而有学者建议将“个人欣赏”排除在个人合理使用的目的范围之外,该建议最终在2014年《著作权法修订草案送审稿》(以下简称《送审稿》)中受到采用。可以说,这是典型的合理使用面对全新网络环境的一次制度性回应。

    另一方面,《送审稿》第43条第1款在个人使用的限度上加上了“作品片段”的要件,又带来了新的问题。应当说,在转换性使用的语境中,“作品片段”要件仍具有一定的存在意义。使用者在原作品的基础上进行新的创作时,对原作的借鉴程度需要被限制在一个合理的范围之内,这不仅可以确保原权利人的复制权不会受到侵犯,也会促使演绎者在其创作过程中注入足以主导整个演绎作品的新元素。但是,在消费性使用中,该要件的存在价值就应予商榷。实践中,对私人复制作品的篇幅作出限制,往往只会带来“同一作品分多次复制”的饶有意味的后果。而在数字环境中,更是难以找到针对盗版作品的“片段获取”行为,因为一次下载通常就意味着对作品的完整复制,这是由数字技术本身的特点所决定的。

    若《送审稿》通过,原本在数字环境下亦可拥有生存空间的个人合理使用制度,就会遭到排挤。虽然将《著作权法实施条例》中用于合理使用判定的“三步检验法”明确到《著作权法》中,似乎昭示了版权制度的设计将在利益平衡上更倾向于公众,但是,这显然与个人合理使用制度的实际萎缩之间,产生了冲突。本次《著作权法》修订中,我国版权合理使用制度在“因素主义”立法技术的作用下趋于灵活,却又在现实问题的压力之下限缩了适用范围,其实际效果仍待检验。但可以肯定的是,就立法趋势和各界观点来看,普通网络用户下载盗版数字作品的行为不能构成合理使用,这几乎是没有疑异的。

    被异化了的法定赔偿及其理性回归

    版权侵权损害赔偿的判赔标准包括权利人损失、侵权人所得、法定赔偿等多种方式,《送审稿》在现行法律的基础上还增加了惩罚性赔偿的规定。但实践中,真正得到大量运用的是法定赔偿。而在网络传播技术的冲击下,原本旨在加强权利保护、提高司法效率的法定赔偿制度却出现了异化的现象,变相地激励了滥诉行为。

    (一)被异化的法定赔偿

    在版权蟑螂的诉讼中,通过法定赔偿方式获得赔偿是一种主要的损害赔偿承担方式。我国知识产权损害赔偿中,法定赔偿的适用几乎达到了90%。为了确定知识产权损害赔偿的数额,人们采取了诸多方法,但损害计算不精确的问题依然存在。这样,司法实践中多数情况下适用了法定赔偿,既便于法院的操作,也减少原告诉讼的举证成本。从某种角度看,法定赔偿的简便易行,在一定程度上怂恿了版权蟑螂的诉讼行为。

    有人认为,美国版权法上的法定赔偿制度之所以在面对版权蟑螂时失灵,很大程度上要归咎于不同赔偿计算方式的“平行顺位”。我国《送审稿》第76条采用了与美国类似的做法,将进一步增加业已存在的司法上滥用法定赔偿的几率。日常生活中,网络用户下载一部电影、电视剧、一张音乐专辑或是一本电子图书的行为,很难说对于版权人原本拥有的市场产生了多少替代效果。易言之,即便上述行为侵权,对版权人造成的损害也不会超过一件商品本身的价值。这时,采用“实际损失”的赔偿标准对版权人进行赔偿,显然是最为合理的。

    为了解决法定赔偿过高的问题,美国曾在1976年修订版权法时调整了法定赔偿的计赔单位,具体做法是以“每一侵权作品规则”(a per infringed work rule)取代了“每一侵权行为规则”(a per infringement rule),即将针对同一作品的多个(或多次)侵权行为所导致的法定赔偿次数限制在一次,从而减轻一部分侵权人的赔偿责任。这是传统媒体时代针对同一作品多次复制现象的矫正。

    我国的版权法定赔偿制度在计赔单位上缺乏规定,因而近年来多有学者主张效仿美国的做法而推动这一规则。这项规则本来是为了解决法定赔偿过高及频繁适用的问题,但在面对网络用户为主体的侵权下载行为时,却遇到了新的问题:无论是电影、电视剧、音乐或者图书,在大多数情况下,网络用户的下载行为都是面向多个作品的单次行使,如果以侵权客体数量为基础设计计赔规则,容易进一步引发滥诉和赔偿数额过高的情况。从这个角度看,一项旨在限制法定赔偿适用的“每一作品侵权规则”,在网络时代似乎又成为了促使法定赔偿异化的诱因之一。

    (二)法定赔偿的理性回归

    我国虽然比较普遍地适用了法定赔偿,但由于法官们在司法裁量中普遍采取了赔偿金额的低额化标准,尚未成为一项促进版权蟑螂的司法政策。美国著名P2P案件Capitol Records v.Thomas-Rasset案中,陪审团对原本侵权损害不超过54美元的文件共享行为,将法定赔偿数额裁定为192万美元,一定程度上暴露了适用法定赔偿不当的危险。显然,美国带有惩罚性色彩的法定赔偿额度不足效仿,而我们也不能因噎废食地去降低法定赔偿的限额,让司法沦为知识产权保护的漏斗。

    有学者认为,“法定赔偿的目的无疑只是补全性(compensatory)的。”这种说法,并不完全准确。事实上,法定赔偿的功能主要体现在两个方面:一是在无法精确计算赔付数额时,尽可能补偿和填平被侵权人遭受的损失;二是在侵权情节、作品价值等不同考量因素的基础上弹性运用,在适当情形下额外增加赔偿数额,对侵权人施以一定程度上的阻吓和惩罚。两项功能中,以前者的补偿功能为主,后者的惩罚功能为辅。在实践中,法定赔偿的惩罚性功能往往被过分重视,以致激励维权诉讼。但法定赔偿的惩罚性功能只是辅助性的,只有在法官自由心证的过程中,揭示了侵权人主观上的直接故意,并且权利人的实际损失存在扩大化倾向的时候,才以此以儆效尤。但是,在缔造网络环境的信息技术尚处于上升期之时,这种做法是不合时宜的。

    具体到非法下载盗版作品的情形中,应当将网络用户不带有商业目的的作品下载行为予以区别对待,避免加重普通网民的法律责任。诚然,司法实务中,法院已经积累了一些经验并提出了诸多创见。对此,学界也进行了大量的研究。但是,适用法定赔偿的问题依然存在。这些问题主要表现在:第一,过于注重权利人的损失,忽视侵权人所得;第二,片面强调侵权人的过错程度,对侵权的目的不予区分;第三,对侵权人所在地区的经济水平以及侵权人自身的经济承担能力缺乏考虑。这些情形,在非法下载盗版作品的司法适用中容易导致法定赔偿过高的结果。单纯的下载行为所导致的一次(或数次)观赏和阅读行为,给行为人带来的收获更多是在精神层面上的,这种非商业性的行为既无可量化的利润,造成的市场损害也很有限。因此,我们建议将侵权人所得和侵权行为的商业属性纳入衡量的因素,采取“基准赔付额度+”的做法,回归填平原则的同时,适当地发挥阻吓和惩罚功能。另外,还应该考虑侵权人的经济承受能力。美国商务部于2016年1月公布的《混同、首次销售和法定损害赔偿白皮书》(White Paperon Remixes,First Sale,and Statutory Damages:Copyrigh tPolicy,Creativity,and Innovation in the Digital Economy)中,在肯定“法定赔偿适用混乱无益于网络盗版现象的治理”的基础上,提出了一系列针对性的整改建议,其中包括法定赔偿额度判定因素的细化和设立针对散布网络盗版等“轻微版权侵权行为”的小额赔偿庭等。显然,其核心思路也是,即便是针对群体侵权,对那些危害性较小的非商业性的侵权群体,应该予以区别对待,降低法定赔偿的惩罚性程度,以达到法定赔偿向补偿性功能的回归。客观来看,法定赔偿的理性回归,减少了对维权诉讼产生不必要的激励。但这种做法,毕竟也存在某种局限。另外,版权蟑螂诉讼施压或者要挟行为促成诉前和解,也可以有效地避免法定赔偿的司法适用。对于涉嫌数字盗版行为的普通用户而言,法定赔偿无论如何调整,承担司法诉讼成本并进行赔偿,始终是一种难以直面的负担。

    釜底抽薪:“三振出局”机制

    从本质上讲,杜绝盗版泛滥的现象,净化版权市场,是规制版权蟑螂现象的根本途径。这方面,版权行政管理部门可以发挥行政保护的优势,利用行政执法之主动性和简便性,主动监控或者授权网络服务提供者实时监控,可以及时有效地针对侵权行为采取严格的强制性措施,回应网络社会的发展。从这个角度看,我们认为引入“三振出局”的保护机制,是一种“釜底抽薪”式的有效手段。

    (一)“三振出局”机制的由来

    “三振出局”原则(Three Strikes Policy)最早出自于美国加利福尼亚州治理累犯的刑事政策。具体到知识产权制度中,主要规定为由权力机构———法院或者行政机关(包括其授权的网络服务提供者)对网络环境中非法共享、下载版权作品的网络用户的行为展开监控,并在三次警告性提醒后仍不收敛的前提下,对其进行断网、罚款甚至追究刑事责任的处罚。尽管这一政策实施以来受到了限制言论自由之合宪性及域外适用方面的质疑,但其实效绩效却不容忽视。国外研究和统计结果表明,实行“三振出局”国家的非法下载行为已经呈现出了明显的下降趋势。由于这种做法在治理版权盗版市场方面发挥了有效的作用,逐渐为许多国家或者地区效仿,如法国、韩国、英国、新加坡、新西兰、爱尔兰以及我国台湾地区都引入了这一保护机制。

    “三振出局”机制试图在网络服务提供者所承担的法律责任之外,再将治理对象直接定位为网络用户。客观分析,由于网络服务提供者积极或者频繁地适用“避风港”原则以求自保,甚至与网络用户“共谋”以求扩大市场如涉嫌间接侵权的“百度文库”事件,版权人的利益诉求难以实现。可以说,“三振出局”机制是继“避风港”原则之后,对版权人、网络服务提供者和网络用户之间利益的再一次平衡。这一机制,一方面限制了普通用户的利益———哪怕这种利益已经蒙上了侵犯版权的灰色阴影;另一方面,也虑及版权蟑螂介入可能给公众利益造成的更为严重的侵蚀。

    “三振出局”机制的核心价值在于借助较为直接的监管手段,有效遏制上传或者下载盗版作品的行为。由于世界各国和地区的盗版现象的严重程度不同,版权保护意识也各有差异,因此,各国监管及处罚力度也有所不同,从而显示出保护强度的区别。例如,法国版的“三振出局”———Hadopi法案第5条之三规定,可以对用户的每一次非法下载行为处以最高5,00欧元的罚金,严厉程度远超其他采用“三振出局”的国家或者地区;而如韩国、新西兰都只赋予法院终止侵权用户网络服务的权力。

    (二)“三振出局”机制与避风港原则

    从某种角度说,“三振出局”机制的引入,是因为司法上适用避风港原则不足以打击日益猖獗的网络盗版现象。对于版权侵权行为所导致的损害赔偿责任,“避风港”原则一直主张归于作品的直接接触方即网络服务提供者———传播数字盗版作品的网站和获取商业利益的技术提供者。这一做法,“激励了”弱势地位的公众对作品的使用,但却迫使网络服务提供者承担了更多的管控义务和赔偿责任。但是,网络服务提供者与网民之间是一个利益交集的相对方和共同体,而且加重网络服务提供者的责任事实上又会阻碍技术进步,如奇虎360“个人云盘事件”,就是一个典型的例子。相较之下,“三振出局”机制及时回应了网络生态的版权人利益需求,也适当地减轻了网络服务提供者的侵权风险负担,将大部分监管责任归于权力机构及其所授权的网络服务提供者,这是对避风港原则的一种正向补充、乃至升级。

    “三振出局”机制以行政手段介入侵权领域,既为版权人清除了大量的非法上传或者下载行为,也减轻了网络服务提供者的管控义务和赔偿责任。这一做法,表面上看是加重了网络用户的负担,但事实并非如此。首先,“三振出局”机制将大量的潜在民事诉讼转化为行政处罚,在很大程度上为网络用户降低了诉讼的风险。而无论是断网抑或者处罚,其较之版权蟑螂索取的高额侵权赔偿,其显然更能为公众所接受。其次,相较于原本无法预测的诉讼风险,“三振出局”机制为网络用户提供了一个可以预估的侵权成本。这样的机制,既能够帮助消除盗版行为,也能够帮助公众加强版权保护意识。再次,针对不下载网络盗版的用户,非法下载行为的减少可以缓解网络阻塞(network congestion)的问题,营造一个更为高效和健康的网络环境。

    (三)创造性引入“三振出局”机制

    对于版权蟑螂来说,“三振出局”是一个釜底抽薪的行政保护机制。但我们如何引进这一机制,需要深入探讨。我们认为,我国应该因应国情,创造性地引入。

    首先是确定实施主体的问题。但这一问题,又关联到采取何种处罚措施:如果采取的是行政罚款或者刑事处罚,则必须由行政机关或者法院组织实施;但如果仅仅涉及断网处理,则可以由法律赋权或者行政机构授权,由网络服务提供者及其行业组织依法或者依授权直接组织实施。根据美国法社会学家的研究,对下载数字盗版作品的网络用户课以赔偿和罚款的做法,可能导致公众对相关法律规定是否公平正义产生疑问。从这个角度考虑,结合我国国情(如公众版权意识相对较低、普通网络用户经济责任能力有限、行政权力较为强势等),建议我国引入“三振出局”机制时,可以考虑不对普通网络用户课以行政罚款和刑事责任,仅以施以中断网络服务的处罚为宜。这种做法,能够较好地平衡了各方的实际利益,促进网络快速、健康地发展。

    从这个角度考虑,应该发挥行政权在回应知识社会的作用。“由于行政手段在应对社会变化中具有灵活的特性,因此,可以通过在政府机构内建立各种组织机构和设立相应的义务,以扩大对社会变迁的影响,如20世纪西方国家经常依法建立名目繁多的局、委员会以及用于促进特殊政治目的的各种机构。同时,对行政权赋予法律上的义务,以形成一种社会环境,以此培养社会变迁的因素。”这一机制,将版权人从“避风港”原则出发单纯聚焦于网络服务提供者的眼光,部分地转移到了网络用户自身身上,而且由行政机构负担了相应的监管成本。不过,我国版权行政部门一直以来都在根据著作权法和《信息网络传播权保护条例》强化网络服务提供者的监管义务。最近出台的《关于加强网络文学作品版权管理的通知》(2016年11月4日起实施)提出,网络服务提供者应当加强版权监管,履行版权审查和注意义务,并且应该“建立健全侵权作品处理机制”。从这个角度来说,网络服务提供者依然是行政管理部门的治理网络环境的主要抓手。这种状况,就迫使我国网络服务提供者在消极实施的“避风港”原则之外,建立起积极的侵权查处机制。

    不过,单纯由某一家网络服务提供者建立的侵权查处机制,让人担忧其利用市场优势地位的“私权力”扩张,也缺乏信息共享和执法标准的统一。从这个角度分析,按照参加自愿原则、内部治理自治原则、政府监管的外部性原则这三大原则,在主管部门指导下建立起行业组织的市场化运行机制,是一条符合市场经济的法治化途径。因此,建议由版权行政部门指导促成相应的行业协会进行协调,形成行业监管与自律的规范发展模式。同时,建议网络服务提供者及其行业组织可以创造性地引入境外实行的“三振出局”机制,建立起中国特色的“三色机制”:第一次通知黄色提醒之后,第二次采取红色预警,第三次纳入黑色名单;纳入黑色名单之后进行屏蔽,并采取断网措施。当然,对于被采取断网措施的网络用户,经过一定时间之后,应该有一个复活或者“漂白”的过程:一方面是公众言论自由的保护,另一方面是利益的一种再平衡。

    结语

    版权蟑螂现象反映出的是版权人和公众之间的一次正面冲突。通过法律的治理应该因循既有的版权制度,并在网络时代实现创造性转换:一方面,要对版权人利益群体(包括资本介入的维权实体)实行充分的保护;另一方面,又要采取不同措施,尽可能地将公众利益的损失限制在最小的范围之内。

    的确,网络发展与数字技术的进步,在扩大版权市场和方便公众获取作品的同时,也会泥沙俱下,引发网络盗版和版权蟑螂两种相生相克的泛滥现象。此时,版权人、盗版者、网络服务提供者及包括普通网络用户在内的公众利益等多元主体的利益诉求,呈现出较强的张力。就版权蟑螂的行为特征分析,其透过侵权诉讼获利的行为本身无可厚非———诚如有的法官所述,“商业维权有其天然的正当性基因”,因此网络盗版用户并不能用合理使用规则予以抗辩。不过,版权蟑螂频繁地利用法定赔偿方式获取巨额利润的做法,也让我们意识到法定赔偿制度的“异化”现象,从而期待损害赔偿应该是以填平原则为基础的理性回归。这样,将法定赔偿额度定位在“基准赔付额度+”层面上予以适度的惩罚性衡量,是较为妥当的。当然,治理版权蟑螂现象的最佳途径就是铲除这一现象滋生的土壤即网络盗版市场。这方面,诸多国家或者地区通过“三振出局”保护机制,弥补了“避风港”原则的不足,起到了较好的规制效果。对此,我们应该创造性地引入这一机制:以断网处罚为主,建立起中国特色的“三色机制”。若网络版权治理能够实行这种模式,那版权蟑螂可能就只是一条鲶鱼,在新的利益平衡中,激活了一个健康的网络版权市场。

     

  • 李宏彬 等:父母的政治资本如何影响大学生在劳动力市场中的表现?

    李宏彬 孟岭生 施新政 吴斌珍:《父母的政治资本如何影响大学生在劳动力市场中的表现?———基于中国高校应届毕业生就业调查的经验研究》,本文的数据来源于2010年的调查,文章原载《经济学(季刊)》2012年第3期。

    引言

    近年来,越来越多的经济学家开始研究经济社会地位的代际间传递问题。已有的大量研究发现,父母的健康状况、受教育程度及收入对下一代的健康状况、教育水平,以及他们的职场表现都有重要影响。 然而,关于父母的政治资本对下一代的影响的研究依然十分缺乏。 
    中国高校快速扩招之后 (从1999-2009年,高校招生规模扩大了293%),更多的年轻人有机会接受大学教育。这种情况下,代际传递更有可能影响下一代的收入,而不是影响他们的受教育年限。也就是说,即使同样拥有大学文凭,家庭出身更好的大学生可能会在劳动力市场中找到更好的工作。
    目前在中国,“官二代”和 “非官二代”在各个方面受到不同对待的现象受到了包括官方媒体在内的极大关注。例如,《人民日报》在2010年7月1日的一篇题为《为“二代”创建公平的竞技场》的文章中这样说道:“三十多年前,改革开放打破身份桎梏,社会如水流活; 三十多年后,一部分人先富起来,财富与权力的差距,在事实上形成身份的差别、阶层的分化。恰逢代际更替,也就造成了不同的‘二代’—— ‘富二代’、‘官二代’、二代农民工、二代独生子……‘学好数理化,不如有个好爸爸’、‘他们有的是背景,我们有的是背影’等灰色民谣、‘拼爹’等让人啼笑皆非的网络新词,都让人看到在社会的同场竞技中,不同‘二代’面临的不同境遇。”
    文章有几点需要说明。首先,尽管我们的数据库信息丰富,但是父母的政治资本对子女人力资本的影响有一部分是我们 (研究者)无法观察到的,但是雇主能观察到。不过,这对于大学毕业生首份工作的工资而言,这不是一个很大的问题。因为即使对雇主而言,他们的人力资本特征与老员工相比也是难以观察的。因此,研究者和雇主之间的信息不对称问题是可以忽略的。其次,我们只调查了应届毕业生第一份工作的工资。由于工资溢价很可能会随时间而变化,如果说对于缺乏工作经验的应届毕业生而言都存在工资溢价的话,那么,工资溢价很可能会随着这些学生年龄的增长而进一步提高。

    调查数据

    我们的数据来自清华大学中国经济社会数据中心于2010年5、6月间开展的第一轮中国大学生就业追踪调查 (CCSS)。调查以院校的地理位置(北京、上海、天津、东北、东部、中部和西部)1和学校类型(7种)为依据进行分层随机抽样。最终在全国2305所高校中抽取了100所院校,然后在每所大学内随机抽取学生。
    作为预调查,第一轮调查包括了全样本100所高校中的19所,其中10所为名牌大学,即211院校 (含985院校)。我们特意抽取了更多的名牌大学来检验问卷的质量以及整个调查的组织情况。被调查院校分布于全国11个省市,涵盖了各大地理区域。为了基于小样本进行统计推断,我们根据两项指标将被调查院校分为八类,并据此构建了权重用于统计分析。两项指标分别为:院校类型(211院校)和院校所在区域(东北、北部、中部和西部)。每所院校的权重为总体中该类院校的总量与样本中该类院校数量之比。
    我们在每所院校中随机抽取约300名应届毕业生。在被调查的全部6059名应届毕业生中,有3167名学生来自重点高校,2892名来自其他院校。在9所非重点院校中,6所为公立院校(2201名学生),2所为私立院校(415名学生),1所为职业学校(276名学生)。
    调查所使用的问卷是由包括经济学、社会学和教育学在内的各个领域的专家共同设计完成的。问卷内容不仅包括个人基本信息、家庭背景,还包括高考成绩、大学生活、毕业去向等问题。调查工作由各个样本院校选派的1-3名主管教学、学生工作的行政人员负责。我们在北京对他们进行了集中培训。学生填写完问卷后,问卷会被放入密封的信封里以保证匿名性。在所有问卷都填写完成之后,各校负责人收集完成的问卷并将问卷邮寄回北京。为了保证调查的整体质量,我们全程监督了各校问卷填答过程、数据收集及录入过程。
    表1为描述性统计结果,其中第 (1)列为全样本信息,第 (2)、(3)列分别为“非官二代”和“官二代”学生的信息。第四列为考虑权重后两组学生相关变量的差别,权重计算方法如前文所述。“官二代”的划分标准是学生父母中至少一人为政府官员,14%的学生符合“官二代”标准。

    表1第一部分是学生的基本信息。从平均水平上看,大学毕业生第一份工作的平均工资是2153元。“官二代”的平均工资比其他普通同学高出18%(2494元相比于2116元),但是加权后两类学生间的差距没有那么显著。我们将用多元回归的办法来检验控制了其他变量的影响后工资溢价是否依然存在。
    由表1可知,全部样本中有56.2%的学生是男生。有意思的是,“非官二代”学生中的男生比例比 “官二代”学生高 (56.9%相比于51.7%)。学生的平均年龄为22.9岁,在 “非官二代”学生与“官二代”学生之间差别很小,分别为22.9岁和22.6岁。16%的学生父母中至少有一人有大专及以上学历; 不过“官爸爸”、“官妈妈”中有大专及以上文凭的比例比普通父母高出6倍多(59%相比于8.4%)。官二代家庭收入比普通家庭收入也高很多,高出2倍有余(76924元相比于35142元)。
    表1的第二部分报告了学生文理分科情况和标准化后的高考成绩。基于省内参加同类考试的学生高考成绩的平均值和标准差,我们对所有高考分数进行了标准化,公式如下:(学生分数-平均分)/标准差。由定义可知,标准化后的分数均值为0。样本中约75%的学生为理科生。有意思的是,出身普通家庭的学生中理科生的比例更高 (74.0%相比于70.3%)。“官二代”学生的数学成绩更好,但理综/文综成绩更差。不过这两类学生的其他成绩差别不显著。

    表1的第三部分报告了学生在大学期间所获得的人力资本,包括英语等级考试成绩,是否有技术等级证书,是否有工作经验,是否是党员,以及是否有学生会干部经历。从表中可以看到,与来自普通家庭的学生相比“官二代”的更低,但是英语成绩较高。同时,大学期间普通家庭的学生从事打工兼职的可能性也更高。不过,两类学生在持有技术等级证书、入党和担任学生会干部方面没有明显区别。

    在附表中,我们还给出了“官二代”大学生和非“官二代”大学生就业行业的百分比分布。相比之下,“官二代”大学生更多地在金融业以及党政机关/群众组织/社会团体/国际组织等行业就业。

    实证研究模型

    在本部分中,我们建立了一个简单的计量模型来展示我们的研究思路。 假设收入由以下方程决定:

    lnW2 =α+βP1 +γX1 +δX2 +ε 方程(1)

    其中,lnW 为大学毕业生第一份工作工资的对数,P 为“官二代”的虚拟量,1代表父母中至少一人具有行政级别,0代表没有。这里的“官”包括任何有行政级别 (包括副科及以下)的人,他们的工作单位性质可以是党政机关、事业单位和国有企业。X表示其他影响收入的变量。X1表示父母特征变量,X2表示学生特征变量。ε为误差项。系数β是要估计的父母的政治资本给孩子带来的工资溢价。
    当且仅当P独立于误差项ε的时候,普通最小二乘法对β的估计是一致的。但是由于以下几个原因,P可能会与误差项ε相关。
    第一,父母当官对孩子收入有正影响的原因可能在于父母其他方面的特征帮助了孩子。因此除了父母的政治资本之外,我们还需要控制父母其他方面的特征,如父母的户口、人力资本和收入。
    第二,“官二代”可能能力更高,而能力和收入正相关。对这个问题最简单的处理方法是找到一个可以衡量能力的代理变量,并将其包括在回归方程中。前人在研究教育回报时采用高中考试成绩、IQ值、AFQT成绩和其他类似的能力考试的成绩作为不可观测的能力的代理变量。在我们的数据中,学生报告了高考成绩。如果高考成绩是能力的合理或近似合理的度量,那么将高考成绩加入方程会减少“能力偏差”。调查中我们不仅获得了高考总成绩信息,还获得了学生各科的高考成绩,包括数学、语文、英语、理/文综。这些成绩可以用来度量学生不同方面的能力。
    第三,“官二代”就读的院校可能更好,或者他们在本科学习中积累了更多企业需要的技能。这两个因素对学生毕业后的起薪都有促进作用。我们的调查提供了非常丰富的信息,使得我们可以对学生的大学以及大学表现的异质性进行很好的控制。
    不过,我们无法观察到所有影响大学毕业生起薪的因素。尽管我们较为全面地控制背景变量可以减少潜在的遗漏变量问题,但是我们仍然无法从根本上消除其影响。

    父母的政治资本有工资溢价吗?

    通过对回归方程式 (1)的估计,我们估计了“官二代”和非“官二代”大学毕业生在首份工作的工资上的差别。回归中,因变量是工资的对数值。 由于观察对象均为大学生,因此没有引入受教育年限作为自变量。全部的回归都考虑了权重。回归系数估计值的标准差是异方差稳健的,并在各省内聚类(cluster)。

    (一) 基 本 结 果

    表2的回归结果表明“官二代”毕业后首份工作的工资更高。第 (1)列中的回归包含3个解释变量: “官二代”虚拟变量、性别和年龄。“官二代” 虚拟变量的系数在1%的水平上显著,其估计值为0.133。这意味着相比于普通家庭学生,“官二代”的工资溢价为13.3%。根据Zhang et al. (2007) 的估计,这个溢价约为两年教育的回报。另外值得注意的是男生的工资溢价约为20%,考虑到学生之前均没有工作经验,这个差距还是相当大的。由于学生之间年龄差距不是很大,所以年龄对工资的影响并不显著。

    父母做官之所以对下一代收入有正的影响可能是因为“官爸爸”或“官妈妈”其他方面的特质影响了下一代。由表1可知,“官爸爸”和“官妈妈” 整体上的教育水平更高、收入更高。有鉴于此,我们分别引入以下因素作为控制变量:第 (2)列的父母户口虚拟变量(是否为城镇户口)、第 (3)列的父母收入(取对数)、第(4)列的父母学历虚拟变量(是否至少一人有大专及以上学历)。在第5列中,我们还控制了学生来源省份的固定效应。在控制了这些变量后,“官二代”身份对起薪的影响基本没有变化; 第5列显示,“官二代”虚拟变量前的系数依然在1%水平上显著为正,大小为12.1%。
    表2的最后一列显示进一步控制行业虚拟变量之后的回归结果。在控制了行业变量后,“官二代”身份对起薪的影响相对于先前的结果略有下降; “官二代”虚拟变量前的系数依然在1%水平上显著为正,大小为10.4%。
    正如我们所预期的那样,在所有回归中((3)-(6)列),父母收入对子女工资均有正向作用,且在1%水平上显著。由于父母收入、子女工资都是对数形式,因此收入前的系数代表弹性。估计结果表明父母收入每增加1%,子女大学毕业后首份工作的工资就增加3%,这个影响是很大的。此外,父母是否有城镇户口和父母是否有大专及以上学历对子女工资没有影响。

    (二)能力可以解释父母政治资本的工资溢价吗?

    以往研究表明中国官员的能力比普通人更强。如果 “官爸爸”、“官妈妈”的这些能力禀赋可以遗传给子女的话,那么“官二代”与“非官二代”学生之间的能力禀赋有差别,那么将两者的工资进行比较就无法得出父母的政治资本有工资溢价这个结论。由于无法利用自然实验,因此目前处理这个问题的最好办法就是在方程中引入能力的合适代理变量。中国大学生绝大部分都要参加高考,而且他们在高中时都是尽全力准备高考。因此,高考成绩可能比较好地度量能力。
    通过研究“官二代”是否更重视理科(相对于文科),以及“官二代”的高考成绩是否更好,我们首先对“官二代”是否比普通大学生能力更强这个问题予以验证。表3第(1)列研究了哪类学生在高中 (和大学)更倾向于学理科。“官二代”虚拟变量前的系数为负并在10%的水平上显著,说明“官二代”更倾向于在高中(和大学)学文科。我们同时发现男生和年龄更小的学生更倾向于学理科。不过,户口、收入甚至父母学历都没有显著影响。

    “官二代”在高考中表现更好。表3的第 (2)—(6)列中,我们分别以高考总分、数学、语文、英语和理/文综成绩作为因变量进行回归。“官二代”高考总分、数学成绩更高,但是另外几科成绩与普通大学生不分伯仲。以上结果表明,在工资方程中引入高考成绩作为控制变量是非常有必要的。

    其次,我们来研究“官二代”的工资溢价能在多大程度上能由高考成绩来解释。我们先来看 “官二代”工资高是否与他们更倾向于学文科有关系。表4第 (1)列在表2第(5)列的基础上引入理科生虚拟变量。结果显示理科生虚拟变量前的系数不显著,这说明是否为理科生不会影响到首份工作的工资。进一步的,理科生虚拟变量的引入对“官二代”虚拟变量前的系数也没有影响。

    表4的回归结果表明“官二代”并没有因为能力更强而获得工资溢价。第(2)列的结果表明,高考总分的估计系数为正但并不显著。更重要的是,它的引入没有明显改变“官二代”虚拟变量的系数估计结果,这意味着“官二代”的工资溢价不是由于难以观测到的能力或智力因素导致的。

    在第 (3)-(5)列中,我们以数学、语文和英语成绩代替高考总分作为控制变量分别进行回归。类似的,各科成绩前的系数为正但都不显著。在最后一列,我们将四科成绩同时放入方程进行回归。尽管四科成绩的系数联合显著,但是“官二代”虚拟变量的系数并没有明显变化。

    为什么父母的政治资本会有帮助?

    前面的研究结果表明,“官二代”大学生毕业后的首份工作工资更高,且这不是由于学生的能力差异或者父母其他方面的特性所导致的。本部分就“官二代”获得工资溢价的可能原因进行探讨。特别的,我们想对两类可能导致工资溢价的因素予以检验: 院校选择与大学期间的人力资本积累。

    (一)“官二代”选择更好的院校了吗?

    “官二代”在职场上更有优势可能是因为他们上了更好的学校或者在有“工资溢价”的学校读书。高考志愿填报是一个非常讲究策略的事情。考生对风险的不同态度、对院校相关信息的了解、和学校的关系、大学的费用都是影响他们填报志愿的重要因素。如果出身官员家庭的考生有信息优势,有关系,填报志愿时风险承受能力更强,经济条件更好的话,那么他们上好大学的机会就更大。
    由表5回归结果可知,“官二代”和“非官二代”上好大学的几率相当。第(1)列以各校平均的高考录取分数为因变量进行回归,录取分数越高,代表学校更好。自变量与表4类似。“官二代”虚拟变量前的系数小且不显著,说明“官二代”在上好大学(以高考平均分衡量)方面并没有优势。第(2)列中,我们采用各校应届毕业生平均工资作为因变量进行回归,结果类似。

    表5的第(3)、(4)列估计了控制了学校质量之后工资方程,结果证实“官二代”身份所带来的工资溢价不是由于“官二代”上好大学导致的。更具体的,在表4基础上,表5第(3)列、第(4)列分别加入各校学生高考平均成绩、院校固定效应来控制院校质量。加入这些控制变量后,“官二代”虚拟变量前的系数依然显著且大小基本没有变化。有意思的是,学校质量本身影响大学生的起薪,因为各校平均录取分数系数在1%水平上显著为正。

    为了控制专业对收入的影响,在表5的最后一列,我们在回归中加入了大学专业的固定效应。结果显示,“官二代”虚拟变量前的系数略有增大,而且依然在1%水平上显著为正。

    (二)大学期间的人力资本积累能否解释工资溢价?

    “官二代”在大学期间可能积累了更多有助于提升未来工资的人力资本。这些人力资本是多维度的,可以用学分积、技术等级证书、党员身份、学生会干部经历或者是打工兼职(包括实习)经历等来测量。我们在本节中研究这些人力资本特质对大学毕业生的起薪以及 “官二代”的工资溢价的影响。
    基于回归结果,我们发现“官二代”与普通同学在学习成绩、获得技术等级证书方面不分伯仲,但是他们的打工兼职 (包括实习)经历更少。表6第1列的回归以学分积为因变量,自变量与之前保持一致。“官二代”虚拟变量前的系数小且不显著,这表明“官二代”在学习成绩上没有优势。英语对大学生而言很重要,所以我们也以全国英语等级考试成绩为因变量进行了回归。虽然之前的简单统计显示“官二代”的英语成绩更高,但是表6显示,在控制其他因素的影响之后,“官二代”在英语方面没有优势(第(2)列)。同时他们获得技术等级证书的几率与普通同学相同(第(3)列),但是在校期间从事兼职工作的可能性更小(第(4)列)。

    另外一个工资溢价的解释和入党的概率相关: “官二代”更可能是党员,而党员更容易获得政府机关或国企工作。更重要的是党员本身也是一种能力的标志,在职场中是一种积极的信号。但是表6第5列的回归结果表明,“官二代”入党几率与其他同学大致相当。“官二代”也许更多地在课余活动中培养了能力,比如担任学生会干部。但回归结果却表明大学期间“官二代”并没有在社会活动中更活跃。表6最后一列表明“官二代” 担任学生会干部的机会与普通同学不相上下。

    最后,我们将以上衡量大学期间人力资本积累的因素全部包括在工资方程中,其中包括:学分积、技术等级证书、学生会干部身份、党员身份和兼职经历。表7的(1)-(5)列中,我们将这些变量逐一引入方程,在第(6)列中我们将这些变量同时引入。大学学分积、党员身份和学生会干部经历对首份工作工资有正向影响;但技术等级证书和打工兼职经历不影响工资。更重要的是,在控制了所有这些变量后(第(6)列),“官二代”虚拟变量的系数没有明显变化,这表明大学期间积累的人力资本不能解释 “官二代”身份带来的工资溢价。

    结论

    本文的研究结果表明,父母的政治资本对高校毕业生第一份工作的工资存在显 著正向的影响, “官二代”大学毕业生的起薪比其他同学高出了13% (约280元/月)。在控制父母的其他特征,如户口、收入、教育等因素的影响之后,父母政治资本的影响甚至更大了。

    尽管我们无法利用自然实验来解决线性回归中存在的遗漏变量问题,但是我们可以通过控制大量可能影响工资的变量来降低可能存在的估计偏差。其中,最为重要的是,我们将高考成绩作为学生能力或智商的代理变量。在高考中取得好成绩是所有高中生的目标,他们努力学习的目的就是为了提高高考分数。因此,高考成绩可以较好地衡量学生的能力或智商。本文的回归结果表明,“官二代”的高考总分和数学成绩更高。但是,即使引入高考成绩作为控制变量,“官二代”大学生在劳动力市场上有明显工资溢价的结论依然成立。这说明,“官二代”和非“官二代”学生之间可能存在的能力差别不能解释“官二代”的工资溢价。

    中国大学毕业生就业追踪调查所收集的信息还使得我们可以研究父母政治资本通过哪些渠道来影响子女工资。研究发现,父母的政治资本对学生进入211院校读书的可能性、在校期间人力资本的积累情况都没有显著的影响。因此在控制了所有这些可能影响工资的因素之后,“官二代”获得的工资溢价仍高达12%。这些结果进一步说明,父母的政治资本本身对子女的工资是有帮助的。其原因可能是“官二代”父母与雇主间有着某些特殊的关系、也可能是 “官二代”父母有着更好的获取求职信息的渠道。

    尽管仍然存在一些不可观测的人力资本因素可能与 “官二代”身份相关,但鉴于我们可以观察到的人力资本指标都与 “官二代”身份不相关,我们基本可以认定剩余的工资溢价就是 “官二代”身份本身在大学生劳动力市场中的回报。

    即便剩余的工资溢价仍然可能是由不可观测的能力或人力资本引起的, 本文的研究结果依然对我们进一步理解社会公平问题有一定的启发。近年来, 新闻媒体、网络论坛中有很多关于中国“官二代”享受社会、经济等方面特权的讨论,这些讨论很容易激起民众的愤怒情绪。一个毫不怀疑的事实是, 当今大多数中国人都倾向于认为“官二代”是能够获得工资溢价的。我们的实证结果表明,“官二代”身份以外的可观测的家庭特征和学生自身的特征,并不能解释“官二代”所获得的工资溢价,这说明父母的政治资本本身有助于提高大学毕业生的工资。不过影响的具体机制还有待于进一步的研究,文献对此也没有很好的解释。

  • 彭姝祎:欧洲主要国家养老金制度改革及其启示

    文章来源:《社会保障评论》,2023年第2期。

    一、引言

    作为福利国家的发源地,欧洲是全球最早建立养老金制度的地区。二战之后,欧洲各国普遍建立了以现收现付为主要融资方式的公共养老金制度。从20世纪70年代中后期起,在日益严峻的人口老龄化趋势下,各国的养老金制度普遍遭遇财政危机,收不抵支,赤字巨大。从90年代前后起,为确保养老金制度在财政层面可持续,各国陆续启动改革,改革在断断续续中持续至今。

    改革的总方向是控制支出、减少赤字,各国的做法大致相同,即综合运用参数改革和结构性改革两种方式,一方面开源节流,减少公共养老金的财政压力;一方面增建职业/企业年金、个人养老保险/储蓄等基金制的支柱,将养老责任向市场转移。改革后,公共养老金的保障水平趋于下降,政府的责任降低,企业和个人的责任增加。整体来看,改革有效改善了各国养老金制度的财政状况,具有不可否定的积极意义,但同时也削弱了整个养老金制度的再分配性质,使养老金待遇在不同代际、不同性别、不同收入水平、不同技能和学历、不同就业性质的退休者之间出现了较大甚至是巨大的差异,某些群体的老年贫困风险随之增加,养老金制度的充足性受到冲击。欧洲国家的经验表明,养老金改革是一个系统工程,要综合考虑财政可持续性和充足性两大要素,避免顾此失彼。

    鉴于绝大多数中小规模的欧洲国家人口少、经济结构单一,参考意义不大,本文以英国、法国、德国和意大利四国为主要参照,这四国的养老金改革同时也具有典型意义。

    二、养老金改革的措施与结果

    过去二三十年间,在大体相同的人口老龄化压力下,欧洲国家普遍对养老金制度进行了改革,以应对日益加剧的收支失衡。改革通常有两种方式,一是参数改革,即对公共养老金制度的相关技术参数,如退休年龄、缴费年限、缴费率、养老金计发方式等进行调整,从而改变替代率和收益率,实现增收减支目的;二是结构性改革,即增建基金积累制的市场化支柱,让企业和个人承担一定的养老责任,减轻国家的财政负担。前者属于量变,后者属于质变。

    整体来看,各国均综合采用了上述两种改革方式,区别只在于改革的节奏、程度和力度。鉴于结构性改革较为激进,容易引发民众反对,甚至导致政府下台(比如法国),各国普遍选取了由量变到质变的改革路径,先从相对温和的参数改革着手,调整相关技术参数,直接或间接降低公共养老金的待遇水平,实现节流目的。当待遇下降到一定程度后,再“水到渠成”“顺理成章”地开启结构性改革,引进基金制支柱,以此来弥补公共养老金的削减。只有瑞典一步到位,于20世纪末将普惠性的公共养老金改为“名义账户”制,保留了现收现付的融资方式,但脱离政府预算、独立运行,从根本上改变了筹资模式和给付原则。

    (一)参数改革

    参数改革的主要目的是增收减支,各国普遍采用的措施大致可划分为三类。

    1.减支措施

    减支措施主要有:改变养老金的指数化方式,将曾长期施行的养老金待遇与工资挂钩,或与工资和物价中增速较快的一个挂钩,改为只与物价挂钩(英国、法国、意大利等),以间接放缓养老金的支出涨幅;修改养老金计发的参照基数,降低替代率,如荷兰由参照职业生涯末期工资(通常末期工资水平最高)改为参照整个职业生涯的平均工资,法国由参照工资水平最高的10年扩大为25年,英国将国家收入关联养老金(公共养老金的第二层)从参照工资水平最高的20年改为参照整个职业生涯,意大利从参照最后5年零1个月改为参照整个职业生涯;瑞典和德国将养老金与预期寿命或抚养比挂钩,从而随其变化自动调整。

    2.增收措施

    增收的首要措施是提高缴费率。德国将养老保险缴费率由最初的14%提高到了20世纪末的逾20%。但缴费率关涉劳动力成本,无限制上调将损害经济竞争力,故德国经过激烈讨论,做出了将缴费率稳定在20%的政治决定,以防止非工资性劳动成本上涨过快。目前德国的养老保险缴费率为18.6%,并规定在2026年之前禁止突破20%。法国将基本养老保险缴费率由最初的不足10%调整到了目前的15.45%。其次是改善抚养比,即领取退休金的老年人口和缴费的经济活动人口之比。随着分子即退休人口的持续增加,各国纷纷在做大“分母”即增加经济活动人口、扩大缴费群体上做文章,如创造条件促进女性就业、出台反失业措施促进青年人就业、引入青壮年移民劳动力、遏制普遍存在的提前退休现象、用财政激励手段提高老年人口就业率等。

    3.减支、增收并举的措施

    延长法定退休年龄是各国普遍采用的、既能有效减支又能增收的一举两得之策。如英国政府的估算表明,退休年龄每延长一年,大约可减少占GDP0.3%的公共养老金支出;同时人们每多工作一年,还能带来相当于GDP0.1%的额外收入;荷兰政府指出,从2001到2039年,若将退休年龄延长2年,则支出将减少约10%。

    和改变养老金计发方式、调整缴费率等措施相比,延长退休年龄是高度显性的,容易引发反对,为此各国纷纷采取了渐进、弹性的方式,以“月”“季度”等为单位逐步延长,同时配套以正向和反向的激励措施,即提前退休减扣养老金、延后退休增加养老金。意大利等国则在法定退休年龄和预期寿命之间建立了自动关联上调机制。由表1可见,西欧绝大多数国家的法定退休年龄已延至65岁以上,同时以灵活的姿态,允许重体力等从事“艰苦”“有害健康”工作的劳动者或很早便开始职业生涯、缴费年限足够长的劳动者提前退休而不减扣养老金(法国、德国、瑞典等)。在退休年龄存在公私部门差异的国家(在意大利、英国、法国,公共部门退休年龄低于私人部门),为提高延迟退休的合法性、降低改革的阻力,往往先把两者的退休年龄拉齐,之后再共同延至同一水平。

    (二)结构性改革

    参数改革有效增强了公共养老金制度的财政可持续性,同时为结构性改革腾挪了空间、创造了条件:当公共养老金的给付水平随参数调整下降、养老金日渐不足时,增建基金制的支柱来弥补不足便显得水到渠成。因此,在参数改革进行到一定阶段后,各国陆续立法开启了结构性改革,鼓励创建企业/职业年金、个人养老保险/储蓄等,将养老责任向企业和个人转移,让市场发挥作用。

    经过改革,各国大体形成了三支柱的养老金体系,但三支柱的发育程度以及各支柱在整个养老金体系中的占比存在很大差异。英国、瑞典建成了比较鲜明的三支柱体系,法国和意大利处于起步阶段,德国则介于两者之间。

    从20世纪80年代撒切尔夫人执政起,英国就开始对养老金制度进行结构性改革,将养老责任大幅度向个人和企业转移:一方面压低公共养老金的给付水平,只提供最基本的保障;另一方面凭借税费减免、立法支持缴费确定型职业年金等方式鼓励发展职业年金,并立法引入“自动加入”机制,将职业年金由自愿转为半强制;同时以奖励方式鼓励人们退出国家收入关联养老金,加入职业年金或个人养老金。上述措施极大地促进了基金制的发展,使英国最终形成了由公共养老金、职业年金和私人养老金组成的三支柱的养老金体系,其中公共养老金是低水平的普惠制度,覆盖面广但保障水平有限,毛替代率仅为22.1%(2016年),不到欧盟国家平均水平的一半,反之市场支柱发达。

    瑞典经过结构性改革,建立了一个鲜明的三支柱养老金体系,将养老责任从国家和雇主转移到了国家、雇主和个人。基本养老金支柱日益薄弱,国家的责任得到较大幅度的缩减,市场的作用显著上升。

    德国的公共养老金制度在参数改革后保障水平骤降,替代率由从20世纪90年代的70%降至2000年前后的不足50%,为政府“顺理成章”地引进基金制创造了条件,按照施罗德的说法,即“以结构改革替代待遇减缩”。2000年前后,德国通过李斯特改革,从法律层面正式引入基金制,以财政补贴、税收抵扣等方式鼓励人们购买政府认可的商业性养老保险项目。同时针对企业年金不够普及的局面,以税收激励、财政补贴等措施,鼓励雇主建立企业年金。经此改革,德国单支柱的养老金制度开始向多支柱转变。

    法国以现收现付的养老金制度为绝对主导——该国不仅有强制性的、现收现付的基本养老保险(即公共养老金),还有一个同样是现收现付且强制性的补充养老保险,两者相加替代率在70%左右。因此,尽管法国在参数改革后,公共养老金的待遇水平也有一定程度的下降,但和英国、德国等国相比,养老金仍然较为充足。尽管在2000年左右,法国也立法引入了基金制的职业年金和个人储蓄计划,但是基金制的支柱发育缓慢,在整个养老金制度中的占比长期不足5%;2010年以来,法国多次就养老金的改革方式在全民范围内发起讨论,探讨深化结构性改革、加强基金制支柱的可行性,但现行养老金制度的充足性以及深刻的历史教训(见下文),使法国民众对基金制抱有高度戒心,宁愿牺牲待遇水平也不愿放弃现收现付支柱的主导地位。

    意大利的情况和法国类似,该国现收现付的公共养老金替代率高,即使在紧缩性的参数改革后仍高达80%(公共部门更高,在95%以上),因此基金制的支柱——部分引入名义账户制、立法推进企业年金等——引入较晚,发育缓慢,形成了“发育不完全的多支柱”体系。

    基金制并不是新鲜事物,德国最初建立的养老保险制度就是基金制,该制度一度维持着高水平的积累,但随后在两次世界大战、货币改革等因素的影响下,养老基金严重缩水,一度到了只够维持二周支出的地步,这使德国在1957年痛下决心将法定养老保险的融资方式改为了现收现付。法国在20世纪30年代也建立了一个基金制的养老保险制度,但该制度在随后的大萧条以及二战后的金融失序中遭遇毁灭性打击,基金断崖式缩水,退休者失去了保障、生活难以为继,这也是法国人在“降低公共养老金待遇水平”和“进行结构改革,大力发展基金制”的选择中倾向于前者的原因之一。21世纪以来英国也遭遇了类似问题,在2008年的全球性经济与金融危机中,由于基金制规模庞大,英国受到的冲击也较大,养老基金大幅度缩水,导致英国的老年贫困率大幅上升。2008年危机还使部分原本打算向基金制转型的中东欧国家废除了该支柱。近期受特斯拉政府预算改革的影响,英国养老金现暴雷风险,基金制脆弱的一面再次显现。

    (三)改革结果

    各国参数调整和结构性改革相结合的措施有效缓解了养老金制度的财政压力。2016年法国的统计表明,在2010年以来所有改革措施的作用下,法国的养老金收益将逐步下降,降幅在2020、2030和2040年均相当于GDP的1%,到2040年养老金占GDP的比重将下降1.04个百分点。意大利在2011年改革后,平均养老金与劳动者人均GDP之比出现了较大幅度的下降,预计到2046年将由2016年的17.5%降至15%。意大利社保局2016年年度报告显示,2015年公共养老金支出占当年GDP的比重为16.69%,如不实施任何改革,该比重将超过18%,之后直线上扬,预计到2026年左右将突破21%,政府的财政负担将更加沉重。

    三、改革的负面结果

    尽管改革有效提高了养老金制度的财政可持续性,但同时也带来了不容忽视的负面后果:随着公共养老金保障水平的下降,养老金制度的收入再分配功能受到削弱;未来,退休者的养老金水平差异将随着他们在代际、性别、收入、技能和学历、就业性质(正规就业或非正规就业)等方面的差异而扩大,养老金制度的充足性受到冲击。

    (一)当下退休对比未来退休:改革带来养老保障的代际差异

    改革将导致养老金待遇水平的代际差。首先,随着退休年龄的延长和养老金计发标准更加严苛,未来一代退休者整体上将工作更长、缴费更多、收益更少。以改革较温和、法定退休年龄最早(62岁)的法国为例,该国的研究表明,以“终身”为单位,养老金替代率将在代际之间递减:从“50后”(20世纪50年代生人)的55%减至“90后”的45%;养老金的缴费率和收益损失率则递增,前者从“50后”的23%升至“90后”的27.8%,后者从“50后”的1.2%升至“80 后”的4.5% 和“70 后”的5.9%。意大利引入名义账户制后,养老金收益缩水,代价将由未来几代退休者承担,这引发了有关“代际撕裂”的激烈讨论。经合组织的相关报告也表明,在职业生涯完整的前提下,最近进入劳动力市场的人(1996年生人)和大约15年前退休的人(1940年生)相比,平均退休金替代率将下降近6个百分点。

    其次,改革导致未来的退休者更多地依赖市场支柱,但市场支柱不具备再分配功能,能否从中得到充分保障主要取决于能否“进场”以及金融市场这两大因素。一方面,“进场资格”与就业企业、就业性质、个人经济状况等因素息息相关,下列因素势必导致一部分人特别是低收入群体难以进场:一是大多数国家的职业年金是自愿性质,只覆盖部分人口;二是大多数国家的职业年金有准入门槛(收入要求),这使低收入者或者被挡在外面,或者就算勉强拿到了“入场券”,低收入也只能换来低水平年金;三是低收入者往往缺乏购买养老产品或进行养老储蓄的财力,而不仅仅是一些“市场派”所宣称的投资未来的“眼光”;四是各国的职业/企业年金纷纷从待遇确定型转成了缴费确定型,这意味着收益的不稳定。另一方面,基金制支柱的增加意味着投资风险的增大,尽管金融市场有自我修复能力,但老年人的抗风险打击能力较差。经合组织的研究表明,2008年的全球性金融危机对老年雇员的打击最大,因为和年轻雇员相比,他们等待市场自我修复的时间有限,重建储蓄的时间少,再就业更难。

    综上,和当前的退休者相比,未来几代退休者的养老金收益将面临更多的变数,其贫困风险也将随之提升。正如牛津大学教授伯恩哈德·艾宾浩斯(Bernhard Ebbinghaus)指出的,“公共养老金和私人养老金相混合的制度将众多老年人置于危险之中,因为他们缺乏足够的与收入关联的补充养老金。”事实证明,在多支柱的混合制度中,公共养老金支柱占比低的国家的退休者贫困风险更高;反之公共养老金占比高的国家贫困风险更低。如图1所示:在欧盟28国中,法国作为公共养老金支柱占绝对优势的国家,退休者的贫困风险几乎最低(7.3%),是欧盟平均水平(15.3%)的一半。英国高达22.8%,是法国的3倍;德国和瑞典紧随其后。英国、德国和瑞典退休者的贫困风险在西欧国家中名列前茅。艾宾浩斯也指出,英国、瑞士等基本养老金支柱薄弱的国家具有相对中高的贫困风险;德国正在产生中等水平的贫困;而法国和一些南欧国家的贫困率较低。英国作为欧洲养老金市场化程度最高的国家之一,近三十年来老年极端贫困率和极端贫困速度的上升在西欧国家均名列前茅。2021年英国媒体指出,英国有近五分之一的养老金领取者生活在贫困中,这是自2012年以来的最高水平。

    (二)正规就业对比非正规就业:改革导致养老保障的“内部人”“外部人”分化

    改革使公共养老金的待遇水平与个人收入水平和缴费年限高度关联,进而在正规就业者和非正规就业者之间造成了养老保障的“内部人”(insiders)与“外部人”(outsiders)分化。换言之劳动者可获得的养老金水平与其就业安全日益相关。

    退休年龄延长、缴费年限增加等改革凸显了将职业生涯维持到法定退休年龄的重要性,只有能确保工作到退休的稳定就业才能够提供较为充足的养老金,而连续性和稳定性差的就业势必导致退休金减少,这就造成了养老保障的“内部人”和“外部人”分化。正规就业者因职业生涯的连贯而能够获得相对充足的保障,成为养老保障的“内部人”。而临时工、合同工、小时工等各类非全日制、非正规就业者则容易因缴费年限不足、缴费中断、缴费基数过低等因素而难以得到充分保障,甚至被抛出养老保障网(在缴费时长达不到最低缴费要求的情况下),成为养老保障的“外部人”。

    此外,和正规就业者相比,非正规就业者普遍不被职业年金所覆盖,且由于收入水平低而缺乏投资养老保险或储蓄的能力,因此不仅难以获得充足的公共养老金,而且在基金制的支柱中往往也处于不利境地。

    综上,非正规就业者未来将面临更高的老年贫困风险。早在2012年,辛里奇(Hinichs)和杰苏拉(Jessoula)就指出,“公共养老金在提供最低收入方面的慷慨对(预防)老年贫困仍然发挥着重要作用。为降低退休者的严重贫困率,我们需要最低的收入保障,特别是基本的、有保障的或最低的养老金。鉴于目前及未来劳动力职业生涯的中断和非正规就业的发展,这一点将变得更加关键”。然而最近十余年来,稳定的就业在所有欧洲国家均呈降势,取而代之的是非正规就业、临时性就业等。欧盟委员会针对欧盟国家的统计表明,从2002到2017年,非全日制就业人口在就业总人口(15—64岁)中的占比从15.6%上升到了19.4%,临时性就业也从12.4%升至14.3%,这引发了人们对未来收入不平等和养老金不充足的普遍担忧。经合组织也指出:“大多数社会保障体系是以稳定、线性的职业生涯为基础的,没有能力为非正规就业的劳动者提供足够的收入安全,他们中的很多人可能会被忽略”“新工作形式的发展有可能削弱未来几代退休者的收入前景”。典型例子是德国的小微就业。21世纪初,为促进就业,德国通过允许雇员免缴养老保险的方式支持发展“小微就业”,尽管该措施的就业促进效果十分显著,但同时导致小微就业者的养老金水平大大低于正规就业者,十余年后,小微就业者(特别是其中的女性)较高的贫困风险逐渐显现。

    (三)女性对比男性:改革带来养老保障的性别差异

    改革导致了养老金待遇水平的性别差异。和男性相比,女性因生育养育以及普遍承担更多家务劳动的缘故,其职业生涯和建立在职业生涯基础上的缴费记录面临更多的中断风险,进而面临更大的养老金待遇水平下降风险和老年贫困率上升风险。大多数欧洲国家逐步意识到了这一点,并在养老金的计发上对女性给予了一定的补偿和照顾,如将产假视同缴费期等。不过研究表明,类似的做法效果有限,无助于从根本上缩小基于性别因素的养老金待遇差。主要原因在于,出于照顾家庭等因素,女性更容易进入工作弹性较大的非正规就业部门。经合组织的统计表明,在非正规特别是非全日制就业中,女性的占比是男性的3倍;平均每4个在职女性就有1个就职于非全日制部门(见图2)。而非全日制就业的薪资水平普遍较低,按照经合组织的统计数据,非全日制雇员的平均收入比全日制雇员低一半左右。

    低收入叠加缴费时间不足,拉大了女性和男性的退休待遇差。统计表明,2015年,欧盟28国老年女性的平均退休金待遇比男性低四分之一;德国最甚,低40%,这和德国小微就业较多且从业者多为女性有关。2021年,德国女性的平均退休收入仍然比男性低将近三分之一;同年经合组织的报告显示,在全体经合组织成员国中,老年女性的平均贫困率(16.2%)均高于男性(11.6%),只有智利除外(男女几乎持平)。

    (四)法定退休对比提前退休:改革导致不同年龄退休者的养老待遇差

    改革拉大了老年人的退休待遇差,增加了一部分退休者的贫困风险,加剧了老年群体的贫富分化,特别是在养老金市场化程度较高的国家。原因在于,随着法定退休年龄的延长和与之相伴随的领取全额养老金缴费年限的增加,将职业生涯保持到最后一刻、进而获得全额养老金的难度不断加大。法国的研究表明,退休年龄从此前的60岁延至62岁以后,60岁以上劳动者的失业风险上升了7个百分点,且再就业的难度进一步加大。德国左翼政党指出,2008年金融危机以来,能满足全额养老金领取条件(65岁退休并缴费45年)的老年人只占全体老年就业者的20%,如果按计划将退休年龄延至67岁,则势必有更多的老年人失业。

    尽管如前所述,各国出于增收减支目的,纷纷出台措施鼓励老年人就业,但效果并不显著。就业与否归根结底由市场说了算,老年群体无疑缺乏竞争力,最终能否留在就业市场以及能留多久,与老年人自身的年龄、技能、学历、健康状况等息息相关。各国的经验都表明,年龄越大、学历和技能越低、健康状况越差,被劳动力市场淘汰的风险就越高。受劳动力市场青睐的老年人往往是高技能高学历者,而这部分人在任何国家都是少数。与之形成对照的是,占相对多数的低学历低技能的老年人很难将职业生涯维持到退休;对这部分人而言,即使能够继续就业,往往也是辗转在各类低薪、低技能的非正规就业岗位上。经合组织的研究表明,在65—74岁的在职老人中,只有15%在正规就业岗位;德国64岁以上的在职老人中,一半左右在餐饮、零售、家政等行业打零工,薪资微薄。法国针对2010—2015年公共养老金改革的研究也表明,改革对低收入人群和提前退出职场的人负面影响最大,50岁就退出职场的人平均退休金将减少10%。换言之,延迟退休等措施实行后,在劳动力市场的淘汰机制下,对很多人而言,延长的只能是低质低薪的就业,无法从延迟退休中受益。只有少数有良好教育背景的高收入群体才能延长“高薪高质”的就业并从延迟退休中受益。结果是,公共养老金从相对贫困的群体流向了相对富裕的群体。

    综上,退休年龄延长和缴费年限增加使很多无法将职业生涯维持到法定退休年龄的老年人受到负面冲击,进而在社会层面造成老年贫困率上升的恶果。随着问题的显现,一些国家开始反思相关政策并采取了一些补救措施:德国在2014年回调了延长退休的规定,进一步放宽了“提前退休不减扣养老金”的条件;意大利于2018年暂停退休年龄和预期寿命的自动关联,并放宽了对提前退休的限制,允许更多的群体提前退休;荷兰放缓了延迟退休的节奏——将原计划于2021年的延至67岁推迟到2024年,并计划在长期内放慢退休年龄和预期寿命的关联节奏,避免将预期寿命的所有提高都转化为退休年龄的延后;瑞典大约要到2026年才将领取全额养老金的时间调整到64岁。

    (五)低薪对比高薪:改革拉大不同工资水平退休者的养老金差距

    改革导致的公共养老金中缴费与待遇更紧密的关联,以及不具有任何再分配性质的基金制支柱的上升,对低薪者造成了严重的负面冲击。原因在于,一方面,各国的养老金几乎已悉数改为缴费确定型,因此在相同的替代率下,低薪者的养老金水平无疑更低;另一方面,低薪者往往是非正规就业者、自雇者等,难以被企业年金所覆盖,通常也缺乏足够的收入“进场”第三支柱,因此无论在现收现付支柱还是基金制的支柱都处于相对更加弱势的地位,特别是在类似英国那样的市场支柱发达的国家。在“国家保基本、其余人靠市场”的理念下,英国的老年贫困率更高,老年贫富差距更大。根据艾宾浩斯的研究,英国的基础养老金水平太低,只有平均收入的16%,而且需要长时间的缴费,这导致英国的老年贫困率长期在西欧国家排名第一。即便加上私人年金,英国的老年人也在最贫困之列。英国65岁以上极端贫困(即收入不高于国民平均收入中位数的40%)人口数量始终处于升势,所以英国很早就设立了零缴费的救助支柱,并不断提高救助标准。其他国家也大多设立了针对低薪老人的养老救助制度,或针对弱势群体的最低养老金。

    一言以蔽之,养老金改革后,女性、低学历低技能的老年人、60岁以上老年人、非正规就业者、低薪者、自雇者、被迫提前退出劳动力市场的低龄老人等群体,更容易成为改革引发的老年收入分配不公的牺牲品。这些群体通常是重叠的,譬如,一名60岁以上的老人,往往同时是低学历低技能低薪的女性非正规就业者(如家政服务人员、保洁人员、养老院护工等)。一部分人尤其是女性,很可能终身陷在保障水平极不充分的小微就业中,再难回到正规就业岗位。未来养老金水平的个体差异将日益加大。

    四、结语与思考

    由以上分析,我们可初步得出如下结论:养老金制度是个综合性的系统工程,目前普遍使用的三个评价指标,即充足性、完整性(覆盖率)和财政可持续性缺一不可。近三十年来,鉴于养老金的财政可持续性问题突出,欧洲各国纷纷聚焦于改善财政可持续性,通过改革不断降低公共养老金的待遇水平,客观上制造并加强对基金制的需求,进而引进基金制的养老计划,减轻公共养老金的财政负担。在此过程中,各国不同程度地忽略乃至损害了养老金制度的充足性,特别是那些基金制支柱占比较大的国家。

    基金制有其脆弱性的一面,法国、德国建立养老金的历史以及2008年的全球性经济与金融危机都曾不同程度地显现了这一点。2008年的危机还因“凸显了当个人的现金给付与金融市场的波动相关联时,养老金制度所面临的风险”而引发“基金制的养老计划是否适合作为养老保障资金机制的长期辩论”。客观地说,基金制和现收现付制各有利弊,不应盲目否定基金制,也不能否认多支柱的养老金体系在改善养老金财政可持续方面的重要作用。只是这方面的研究已较丰富,基金制的积极作用也已引起世界各国的充分重视。反过来,持续不断的改革对养老金充足性的损害尚未引起普遍关注和充分重视——因为其负面后果的显现需要一定的时间,因此本文着重强调这一点。

    欧洲三十余年的改革实践表明,在提高养老金制度财政可持续性的同时,不能忽略其再分配功能的降低对非正规就业者、自雇者、女性、失业者、低学历低技能者、低薪者等弱势群体的冲击,这些负面结果或许也是各国政府始料未及的。欧洲的经验提醒我们,要尽量客观而全面地认识养老金改革可能带来的消极后果,特别是对上述弱势群体的不利影响,以便未雨绸缪,做好防范或者补救工作。欧洲国家普遍采取了预防或补救措施,一是将病产假、失业、伤残等导致的缴费中断适度视同或折算成缴费。二是在改革的同时建立并加强由财政供款的“零支柱”养老救助制度,为改革后得不到充分保障甚至掉出养老金保障网的弱势群体构筑最后一道防线,这一点业已成为欧洲各国的共识,也是各种老年救助项目未在以增收减支为目标的改革中不减反增的原因。如德国于2020年出台了基础养老金制度(Grundrente),由联邦政府供款为终生工作缴费但法定养老金低于平均水平者提供一份附加养老金,该制度从2021年1月1日起实施,预计受益者将达130万。基础养老金的引入不仅提高了德国法定养老金的“底线水平”,而且缩小了低收入者与高收入者的养老金待遇差。欧洲的改革显示,在某种程度上,公共养老金和老年救助成了跷跷板的两端,当一端的支出因养老金待遇的削减而下降时,另一端的支出就会因贫困人口的增加而上升;一端下降得越快,另一端上升得越多。法国养老金改革后,政府用于失业保险、老年救助的费用有较大幅度的提高,2010年改革中节省出的140亿欧元中,15%用在了额外增加的各种救助上;1996—2013年,意大利公共养老保险支出增长了约79%,而养老救济支出增加了110%;英国每6个退休者中就有一个领取基于家计调查的救助津贴。养老金改革的目的原本是节约资金、减轻国家财政负担,但是贫困率的增加使得用于救助的费用不断提升。三是建立有效的最低收入机制,以应对福利与缴费记录关联的不断强化所导致的不充分不稳定就业者日益加剧的老年贫困风险。

    此外,对各国改革结果的比较研究再次证明了一个“老生常谈”的结论——公共养老金占比高低和老年贫困与收入不平等呈负相关,养老金责任越是从国家向市场转移,养老金制度的再分配性质就越低,减贫效果就越差,老年收入不平等现象就越严重。公共养老金无论何时何地都是预防老年贫困的最有效手段。在市场支柱占比高的国家,很多老年人被迫打零工来弥补养老金不足的现象也充分证明了这一点。

    一言以蔽之,养老金改革是一个随着经济社会和人口结构变化而不断动态调整的过程。即便是已建立现代养老金制度逾半个世纪的老牌欧洲福利国家,仍在不断地摸索改革。理想的养老金制度统筹兼顾充足性、完整性和财政可持续,但充足性和制度可持续之间存在一定的矛盾,这是世界各国普遍面临的难题。此外,没有脱离一国国情的、放之四海皆准的养老金模式;即便在一国之内,也没有放在任何历史时期皆准的模式。各国都应从本国的经济社会现实甚至历史文化传统出发,探索符合本国国情的养老金制度,使之既有能力为尽可能广泛的人口提供尽量充足的老年收入保障,也不超越特定历史阶段的经济财政能力。

  • 焦长权:“部门型”项目管理模式——中央对地方专项资金的分配与管理机制研究

    本文节选自《部门型”项目管理模式——中央对地方专项资金的分配与管理机制研究》,原载《中国研究》第29期。

    中央与地方:财政事权与支出责任

    分税制改革后,中央和地方间逐渐形成了一个极其复杂庞大的财政转移支付体系。但是,由于中国财政转移支付体系是通过渐进性的方式建立起来,尤其是专项转移支付基本都是根据中央政策“一事一议”不断累积起来,具有典型的“打补丁”特征。因此,在分税制改革近20年后,中国虽然已经建立了一个庞大复杂的转移支付体系,但其内部的各种弊病也不断显现,尤其是专项转移支付受到了社会各界的批评。为此,党的十八大后,中央对财政转移支付体系进行了一系列改革,其中的关键是中央和地方财政事权和支出责任改革。

    中央和地方财政事权和支出责任改革涉及财政支出的所有领域,各领域具体情况千差万别,为此中央采取了分领域分别制定具体方案的办法,这首先在基本公共服务领域取得了进展。改革将涉及人民群众基本生活和发展需要、现有管理体制和政策比较清晰、由中央与地方共同承担支出责任、以人员或家庭为补助对象或分配依据、需要优先和重点保障的主要基本公共服务事项,首先纳入中央与地方共同财政事权范围。目前暂定为八大类18项:一是义务教育,包括公用经费保障、免费提供教科书、家庭经济困难学生生活补助、贫困地区学生营养膳食补助4项;二是学生资助,包括中等职业教育国家助学金、中等职业教育免学费补助、普通高中教育国家助学金、普通高中教育免学杂费补助4项;三是基本就业服务,包括基本公共就业服务1项;四是基本养老保险,包括城乡居民基本养老保险补助1项;五是基本医疗保障,包括城乡居民基本医疗保险补助、医疗救助2项;六是基本卫生计生,包括基本公共卫生服务、计划生育扶助保障2项;七是基本生活救助,包括困难群众救助、受灾人员救助、残疾人服务3项;八是基本住房保障,包括城乡保障性安居工程1项。

    18项基本公共服务,被改革确立为典型的中央和地方共同财政事权和支出责任,在支出上由中央与地方按比例分担。具体分担方式如下:

    一是中等职业教育国家助学金、中等职业教育免学费补助、普通高中教育国家助学金、普通高中教育免学杂费补助、城乡居民基本医疗保险补助、基本公共卫生服务、计划生育扶助保障7个事项,实行中央分档分担办法。具体而言:第一档包括内蒙古、广西、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆12个省(区、市),中央分担80%;第二档包括河北、山西、吉林、黑龙江、安徽、江西、河南、湖北、湖南、海南10个省,中央分担60%;第三档包括辽宁、福建、山东3个省,中央分担50%;第四档包括天津、江苏、浙江、广东4个省(市)和大连、宁波、厦门、青岛、深圳5个计划单列市,中央分担30%;第五档包括北京、上海2个直辖市,中央分担10%。

    二是义务教育公用经费保障等6个按比例分担、按项目分担或按标准定额补助的事项,暂按现行政策执行。具体如下:义务教育公用经费保障,中央与地方按比例分担支出责任,第一档为8:2,第二档为6:4,其他为5:5。家庭经济困难学生生活补助,中央与地方按比例分担支出责任,各地区均为5:5,对人口较少民族寄宿生增加安排生活补助所需经费,由中央财政承担。城乡居民基本养老保险补助,中央确定的基础养老金标准部分,中央与地方按比例分担支出责任,中央对第一档和第二档承担全部支出责任,其他为5:5。免费提供教科书,免费提供国家规定课程教科书和免费为小学一年级新生提供正版学生字典所需经费,由中央财政承担;免费提供地方课程教科书所需经费,由地方财政承担。贫困地区学生营养膳食补助,国家试点所需经费,由中央财政承担;地方试点所需经费,由地方财政统筹安排,中央财政给予生均定额奖补。受灾人员救助,对遭受重特大自然灾害的省份,中央财政按规定的补助标准给予适当补助,灾害救助所需其余资金由地方财政承担。

    三是基本公共就业服务、医疗救助、困难群众救助、残疾人服务、城乡保障性安居工程5个事项,中央分担比例主要依据地方财力状况、保障对象数量等因素确定。

    以上改革方案,对十三五时期国家基本公共服务领域的中央和地方财政事权和支出责任进行了初步明确,尤其是对18项民生领域基本公共服务进行了详细规定。国家发改委最新发布的《国家基本公共服务标准(2021年版)》,则对十四五时期国家各项基本公共服务的服务标准、支出责任等进行了明确,进一步规范了中央和地方间在基本公共服务领域中的财政事权和支出责任划分,为完善这一领域的财政转移支付体制奠定了重要基础。

    根据中央的上述划分方案,各省也制定了本省基本公共服务领域省与市县共同财政事权和支出责任划分改革方案,核心就是要明确各项基本公共服务在省内各层级政府间的支出责任。在此基础上,市、县级政府还制定了本辖区的相关方案,由于相关支出责任已经基本明确,市县级方案更主要聚焦于更细致的组织实施方案。

    至此,我们简略勾勒了国家以18项基本公共服务为重点,开展中央和地方共同财政事权和支出责任改革的基本做法,它涉及中央、省、市、县等各个层级,并覆盖了诸多政府部门,是改革中央和地方关系,尤其是规范中央和地方间转移支付的关键环节。这18项基本公共服务,代表了国家公共支出在民生和公共服务领域的典型特点,即大量支出最终都按照一定标准补助到了个人和家庭,因此只要明确了各层级政府的分担比例,就很容易通过公式精确的预算和分配,并最终落实到政策主体。

    除基本公共服务领域外,过去几年,中央先后在诸多不同领域展开了财政事权和支出责任改革,比如先后发布了教育、医疗卫生等领域的具体改革方案。根据前财政部部长楼继伟的介绍,十八大以后,截止2018年4月,党中央、国务院出台的重要文件中,涉及政府间事权和支出责任划分的共50件,涵盖经济体制、生态环保、市场监管、民生保障、政法、国防、外交等多个领域。其中,15件明确界定了相关领域中央和地方的事权和支出责任范围,包括人民防空、金融监管、环保监察、司法管辖、内贸流通、优抚安置、外交、外援、海域海岛管理等方面。但总体而言,我国中央和地方间财政事权与支出责任改革仍然还有很长路要走,许多改革文件方案并未实现像基本公共服务领域那样明确划分财政事权与支出责任,不少方案以“按照中央和地方事权划分,明确各级政府支出责任”的原则表述代替了具体划分。

    专项转移支付的分配方式

    在前述财政事权和支出责任划分框架下,中央和地方间财政转移支付体系也要同步改革。基本原则和要求是:属于中央事权的,原则上应通过中央本级支出安排,由中央直接实施;随着中央委托事权和支出责任的上收,应提高中央直接履行事权安排支出的比重,减少委托地方实施的专项转移支付。属于中央地方共同事权的,中央分担部分通过专项转移支付委托地方实施。属于地方事权的,由地方承担支出责任,中央主要通过一般性转移支付给予支持;少量的引导类、救济类、应急类事务通过专项转移支付予以支持,以实现特定政策目标。

    2019年开始,财政部在转移支付预决算中,将中央和地方共同事权转移支付作为一个新的类别列入一般性转移支付中,资金规模占转移支付总量的43%。其实,共同事权转移支付也是一种典型的具有明确资金用途和支出标准的专项资金,和美国等西方国家在社会性支出中采取的专项转移支付非常相似。在中国,由于一段时期内专项转移支付的设立、分配和管理不规范,引来了社会各界的大量批评,使中央在政策上尽力压缩专项转移支付,才有了共同事权转移支付这一类别,它本质上只是专项转移支付的一种新形式。在中央大规模压缩、整合和规范专项转移支付的情况下,传统专项转移支付的规模大大缩小,2019年占转移支付总额的比重仅10%。但是,一般性转移支付中仍然有大量资金具有明确的指定用途。比如,2019年,一般性转移支付中真正没有指定用途,地方政府可统筹安排的均衡性转移支付只有15632亿元,占转移支付总量的比重仅21%。

    可见,即使在中央极力压缩专项转移支付的情况下,具有明确指定用途的资金仍然占转移支付的绝对主体,他们本质上都是专项转移支付。为何如此?主要原因在于:一方面,中国社会经济发展高度不平衡,同时又是一个特别强调全体人民逐渐实现共同富裕的社会主义国家。因此,这客观要求中央政府承担大量的宏观经济稳定、社会再分配等职能,而且随着社会经济发展,这些职能日益丰富和凸显。另一方面,与世界其他国家相比,中国中央政府的组织规模显著偏小,中央政府公务员占全国公务员总量的比重处于极低水平。这客观上造成中央政府没有能力直接组织实施许多事项和履行职能,只能将不少职能委托给地方政府行使,为了确保地方政府在履行这些职能时严格体现中央政策意图,又不得不采取专项转移支付的形式。

    目前,我国的大量中央和地方共同事权,及由此产生的共同事权转移支付,本质上都与此相关。这就必然导致两个密切相关的结果:一是中央政府本级支出占全部财政支出比重极低,近年已经下降到15%左右,这在全世界也是极低水平,这表明中央政府直接履行和实施的事权规模很小。二是中央和地方各级政府职能高度同构,“上下一般粗”。所谓“上下一般粗”是指除国防、外交等明显中央政府职能外,中央和地方各级政府在职能上高度同构,各自的主要职能事权划分不清晰,同一事权多层级政府共同参与,共同事权泛滥、行政效率偏低,背后的重要原因之一是中央政府缺乏直接履行大量事权的组织能力。因此,本质上讲,大量中央和地方共同事权实际上是中央事权委托给地方行使,共同事权转移支付只是专项转移支付的一种新形式。

    可见,分税制以来,尤其是进入新世纪后,专项转移支付在中国财政转移支付体系中的普遍采用,就不简单是政策选择的结果,而是有更深层的结构性原因。正是因此,虽然十八大以来中央一直尝试以各种方式规范整合专项转移支付,但专项转移支付仍然是财政转移支付的主体。更深层来看,既然在目前中央和地方关系中,专项转移支付的大规模存在有其内在必然性,因此与其仅仅从政策选择上对专项转移支付展开批评,或者仅仅从形式上对其进行更名换姓式的表面整治,还不如深入探讨如何对专项转移支付展开更为规范化的分配管理,这是更加实质性的问题。

    根据资金性质和具体用途,中国专项转移支付在自上而下分配过程中,一般采取因素法、项目法,以及因素与项目法相结合等分配方法。所谓因素法,就是在分配专项转移支付过程中根据各种客观因素并制定权重,设计一个分配公式,并据此对各地区分配专项转移支付。

    在具体执行中,专项转移支付在不同层级政府中也可能采取不同分配方式,典型的有以下几种组合:(1)“中央因素法、地方项目法”模式。即中央财政采用因素法确定各省专项资金规模,地方政府则需要通过项目法将资金落实到具体项目并组织实施,这里运用项目法的地方政府,既可能是省级政府,也可能是更低层级的地市级基层政府。(2)“中央因素法、地方因素法”模式。即中央和地方均采取因素法层层向下分配资金。(3)“中央因素法、地方自主”模式。即中央采取因素法分配确定各省资金规模,各省相关部门自行安排地方分配方法。

    “因素法”分配,本质上是一种资金指标分配方式。即中央主管部门并不负责将财政资金明确分配到可组织实施的具体项目,他们只负责资金指标的分配,将财政资金切块分配下去,由地方政府部门负责分配到具体项目。形象的看,专项转移支付在地方和基层由资金指标到具体项目的转化,就像一束聚焦的灯光突然散射出去一般,每个县市每年获得的数百项资金指标都会在基层细化为成千上万的具体项目。比如,一个典型的例子就是,中西部农村低保项目,项目资金基本都主要来自于中央财政转移支付,但中央部门向下分配时都是按照一定因素分配资金指标,这一直要分配到乡村两级基层政府和组织,才能最终确立到具体项目对象。

    因素法也是发达国家分配专项转移支付的主要方法。比如,美国是没有一般性转移支付的国家,他的许多专项转移支付具有一定的均衡性功能(尤其是直接对公民的转移支付项目),但他的大部分专项转移支付都采取因素法来分配。在联邦政府对州和地方政府的财政补助中,有三分之二是以现金或实物的形式发放给了符合条件的个人。运用公式性的因素法分配转移支付,基本成了现代转移支付体制最主要的共同特征,即无论是专项转移支付还是一般性转移支付,中央政府都倾向于用事先确立的公式向地方政府分配财政资金。

    专项转移支付采取项目法分配的,主要是对“用于国家重大工程、跨地区跨流域的投资项目以及外部性强的重点项目”。按照项目法分配的项目都要求实行项目库管理,明确项目申报主体、申报范围和申报条件,规范项目申报流程,发挥专业组织和专家的作用,完善监督制衡机制。学界通常对项目制所连带的申请申报、评估评审、监督检查等一系列复杂程序的批评,最典型的就表现在以项目法分配专项转移支付的过程中。项目法分配具有典型的“一事一议”特征,需要上下级政府以及不同部门间反复的协商论证,经常还伴随着一定的竞争性特征。因此,项目法分配经常导致项目预算分配周期漫长,资金支出进度和效率偏低,也容易滋生寻租腐败,是改革和完善专项转移支付分配过程的重点和难点。

    专项转移支付的不同分配方式具有不同的特征。“因素法”的优点是分配依据客观变量,结果相对公平,行政成本较低,行政效率较高,资金预算安排周期短,一般能够在预算批复后很快下拨给下级政府;其缺陷是资金针对性不强,资金拨付方对接收方的控制权较弱。“项目法”则相反,上级政府对项目资金具有很强的控制权,资金针对性也更强,但分配过程中的主观性和“寻租空间”更大,行政成本更高,行政效率较低,预算安排周期长。

    实际上,专项转移支付具体采用什么分配方式,主要与财政资金的支出功能有关。总体来看,对于教育、医疗、社会保障等典型的民生支出,其中很大部分最终会直接补助到个人或家庭,在西方国家称为“权利性支出”,因此比较容易用因素法展开分配。比如,以18项基本公共服务为代表的公共服务支出,由于具有明确的支出标准,最终很大部分也是补助到个人和家庭,因此就能够顺利用因素法在各级政府间分担。与之相反,基础设施建设、产业政策发展等经济事务支出,基本都得用项目法分配,尤其是“国家重大工程、跨地区跨流域的投资项目以及外部性强的重点项目”,必然按项目法分配。

    国家公共支出结构则与经济发展阶段密切相关。诸多经济史家的研究一致发现:在工业化和城市化的早中期阶段,国家公共支出必须履行大量公共投资职能,在基础设施建设(交通、道路等)等方面投入大量资本,当经济发展进入成熟阶段后,公共支出的主要方向才会转向教育、医疗、社保等社会服务领域。中国当前仍然处于从中高收入国家迈向高收入国家的关键阶段,国家工业化、城镇化过程中还有大量基础设施、产业政策短板需要弥补,因此公共支出中仍然会有较大量的经济事务支出,而典型西方发达国家公共支出则以社会保障等社会性支出为主体,只有极少量的经济事务支出。同时,即使是教育、医疗、社会保障等社会性支出领域,目前在中国也有不小比例是基础设施建设等资本性支出,而不同于这一领域通常的维持型支出(工资福利、办公经费等)。改革开放以来,虽然中国公共支出中经济事务支出比例逐渐下降,民生和公共服务支出比重逐渐上升,但目前仍然是一个经济事务与民生支出的“双强格局”,经济事务支出仍然占据重要位置,这在短期内还不会发生根本性的变化。

    因此,专项转移支付的分配方法才是最根本的,而这又与公共支出结构密切有关。当前,从中国专项转移支付的构成来看,它也基本是一个经济事务和民生支出的“双强格局”,近年来民生支出扮演的角色越来越重要。公共支出结构的逐渐变化,尤其是专项转移支付支出结构的变化,给进一步规范完善转移支付提供了可能,我国之所以在分税制改革20多年后才系统性地清晰划分和界定中央和地方财政事权与支出责任,也与中国公共支出结构的这一演变历程直接相关。

    “部门型”项目管理模式

    那么,自上而下的专项资金的分配具体如何实现?这就涉及专项资金的管理模式问题。实际上,无论是中央还是地方各层级政府设立的诸多项目,包括专项转移支付、非转移性项目支出、以及地方本级部门预算中的项目支出等,都是由不同政府部门来主要负责分配管理,进而形成了一种“部门型”项目管理模式。自上而下的专项资金,在资金分配和管理过程中,长时期是在各层级政府部门内部相对封闭运行,一直要到最终组织实施的层级,才在该层级政府的统筹下,由主管部门和基层政府协调组织实施。

    以中央对地方专项转移支付为例。在资金管理分配过程中,由于大多数专项转移支付都涉及到一些领域非常专业的知识和信息,财政部没有能力单独完成相关信息收集和核实评审,因此各类专项转移支付都根据业务性质划归到了不同政府部门主管。财政部和这些部门互相配合,共同完成资金分配和管理。比如,2013年,中央对地方专项转移支付多达220项,资金管理涉及56个部门;2014年,中央对地方专项转移支付共133个,实际执行中安排明细专项362个,审计署抽查的343个明细专项有43个部门参与分配。总体而言,绝大多数专项转移支付都是财政部门和主管部门共同管理的“共管资金”,只有极少数是由财政部门单独管理。

    因此,凡是参与主管中央对地方专项转移支付资金的中央部门,它实质上都拥有两类专项资金:一是中央本级部门预算中的项目支出,二是主管分配的专项转移支付。发改委等具有二次预算分配权的单位,在资金分配上的自主性更大,一方面,财政部将中央基础设施建设资金整体切块给发改委,由它进行二次分配,它就具有了“小财政部”的特征;另一方面,中央对地方专项转移支付中的基础设施建设资金,也归口到发改委管理,它在项目分配上也具有很大的决定权,这属于一种特殊性质的“共管资金”。

    从专项转移支付的设立申报审批过程来看。中央专项转移支付,都承载了一些重要政策目标,因此它一般由国务院根据相关重要社会经济发展战略和政策设立,再由相关部门代表中央负责具体管理,财政部和其他政府部门无权自行设立专项转移支付。尤其是近年来中央大大加强了对专项转移支付的规范整合,原则上不再新设专项转移支付,确因经济社会发展需要新设立的专项,要求有明确的政策依据和政策目标,并需报国务院批准。专项转移支付的申报审批,一般按照以下程序:(1)一般由中央主管部门发布申报通知或年度立项指南;(2)地方和基层相应政府部门组织项目申报,将相关申报材料汇总报送中央主管部门;(3)中央主管部门单独或会同财政部门对申报项目展开资料审核、项目评审等工作,确立资金分配方案;(4)中央主管部门会同财政部门联合下达项目计划和资金指标。

    因此,自上而下的专项转移支付,就类似于在封闭管道中流动的水流,中央政府一次性给各条管道注入了大量资金,资金达到省级后,省级部门有可能会取出少量资金在本级直接支出,但大部分资金则会由省级部门进一步细化分流导入到各个县、市主管部门的资金渠道。省级部门在向下细分专项转移支付时,会加上自身的政策意图,即根据自身的政策偏好和资金管理要求,将资金细分到县市一级政府部门。不仅如此,省级政府一般还会在这个过程进行一轮注资,结果省级部门向下下达的专项转移支付,除了中央对省级下达的部分外,还包括省级财政另外增加的对市、县的专项转移支付。这既包括省级政府按照要求对中央某些专项转移支付的地方配套,也包括省级政府根据本省工作计划另外设立的专项转移支付。

    与专项转移支付不同,在中央本级部门预算的项目支出分配过程中,政府部门会发挥更大的主导作用,因此又被称为“部门资金”。之所以如此,是因为这些项目支出的分配,专业性和政策性一般比专项转移支付更强,而且由于本身就属于中央部门支出,因此会更直接清晰的体现部门政策意图。近年来,随着中央对专项转移支付合并整合,以及进一步改革和规范中央与地方间财政事权和支出责任,中央专项转移支付也大幅指向了民生领域,“因素法”分配的比重明显扩大,因此专项转移支付分配中的规范性显著增强,主管部门的随意性明显减弱。但是,中央本级部门预算的项目支出,在具体项目确定和分配过程中,政策性和专业性都很强,基本都是“一事一议”的项目法,因此政府部门的主导性还是非常明显。

    中央部门预算中的项目支出,有些项目会由中央部门直接组织实施,但也有不少项目会在地方省市区具体组织实施。在这个过程中,很多时候就需要通过与专项转移支付相似的程序展开项目申报评审,而且这些项目基本都是“国家重大工程、跨地区跨流域的投资项目以及外部性强的重点项目”,因此评审过程更加严谨复杂。但在项目确立以后,项目在地方的组织实施管理过程,则与专项转移支付基本一致。正是这种相似性,使一些项目到底该列为中央本级项目支出,还是确定为中央对地方专项转移支付,就不容易明确区分。

    实际上,在中央对地方财政转移支付的改革完善过程中,如何明确区分中央部门直接项目支出和中央对地方专项转移支付,一直是一个难点。在目前的中央和地方间财政体制下,中央对地方专项转移支付有以下几种情况。(1)中央财政事权,中央安排专项转移支付委托地方行使;(2)中央和地方共同财政事权,中央分担部分通过专项转移支付委托地方实施;(3)地方财政事权,中央为实现特定目标,安排少量的引导类、救济类、应急类专项转移支付予以支持。前文已指出,目前共同事权转移支付成了中央与地方间专项转移支付的主体部分。

    那么,在财政预算管理过程中,如何明确区分一些事项到底是中央对地方专项转移支付还是中央部门直接项目支出呢?其关键在于区分这一项目支出是由中央直接组织实施,还是委托给地方组织实施。

    中央明确要求:属于中央事权的,原则上应通过中央本级支出安排,由中央直接实施;随着中央委托事权和支出责任的上收,应提高中央直接履行事权安排支出的比重,相应减少委托地方实施的专项转移支付;属于中央地方共同事权的,中央分担部分通过专项转移支付委托地方实施。但是,在实际预算管理过程中,仍然会时不时出现将二者部分混淆的情况。比如,2019年,在预算执行过程中,中央对地方专项转移支付中有基建支出等6个大项出现了实施主体发生变化,部分资金由对地方转移支付转列为中央本级支出,其中基建支出涉及金额约60亿元;可再生能源发展专项资金由地方实施的只占预算的66.7%,其余部分基本都转为由中央本级直接组织实施。同时,2019年共有农田建设补助资金等7个大项的共同财政事权转移支付中有部分资金被转列为中央本级支出。虽然这种预算执行中实施主体调整涉及的资金规模并不算大,但仍然反映出如何明确区分中央本级支出与对地方专项转移支付的难点。

    比专项转移支付转为中央本级支出要更为隐蔽的,是中央本级支出直接或间接的委托给地方政府组织实施。这种情况有直接明确的案例,比如,2019年中央对地方专项转移支付中的工业转型升级资金,在实际执行中就超出预算约10亿元,其原因就在于部分资金由中央本级明确转为对地方转移支付,即实施主体由中央部门委托给了地方政府。但这更多是间接隐蔽的,即这些财政资金从预决算上都是中央本级项目支出,但在具体组织实施中,却变相委托给了地方组织实施。这种情况非常隐蔽,很难清晰揭示出来,但应该说在中国政府运行中并不少见。背后的本质问题仍然是,本来应该由中央政府直接履行和组织实施的中央事权,在财政预算上也将财政资金明确给了有关部门,但由于相关部门组织规模不足等原因无法直接组织实施项目,进而不得不将项目委托给地方组织实施。在这种情况下,中央部门的直接项目支出,和中央对地方专项转移支付已经没有实质差异,本质上成了中央事权委托地方执行。

    对地方政府而言,无论是中央专项转移支付,还是中央部门直接项目支出,都是上级政府对本地的项目支持,也都需要地方政府向中央和上级进行争取。在专项转移支付中则主要争取项目法分配的项目,因素法分配的项目有些因素也与地方政府履职的积极性或绩效相关。对中央部门直接项目支出,也需要争取更多中央直接项目落地到本辖区;尤其是一些重大基础设施建设,经常由中央部门直接组织实施,但对地方发展而言却是命脉工程,因此地方尤其重视。

    中央对地方专项资金,主要就包括专项转移支付和中央部门预算中的项目支出两大块。同样,省级政府对县市级政府的项目资金,也主要由这两块组成,其具体分配管理机制,也与中央到省级之间类似。从实践来看,这些专项资金,都由相关主管部门负责管理分配,并在上下级相应部门之间相对封闭的运行,一直到其最终的组织实施部门。这就是学界所说的项目制这一国家治理体制的主要形态,即在中央和地方、上级和下级间的政府部门中相对封闭运行,最终汇聚到基层政府统筹实施的各类项目。

    这种以部门为主要管理和运行单位的项目制,可以称之为“部门型”项目管理模式。西方国家曾经采用过的项目预算(或计划-项目预算)是以跨部门的项目为中心,尝试彻底重构政府的治理模式;而中国的项目支出预算,则仍然是以政府部门为基础,是在政府部门统筹管理分配的项目制,因此可以称为“部门型”项目管理模式。

    项目制之所以采用“部门型”项目管理模式,主要是为了确保专项资金的使用方向和资金安全。由于项目资金要经过多层级政府才能最终达到项目落点或实施主体,为防止各层级政府雁过拔毛或腾挪转移,中央就直接刚性确定了资金用途和流通渠道,这无论在中央部门直接项目支出还是中央对地方专项转移支付中都是如此。这种层层规范化、程序化和相对封闭化的部门管理,是一种典型的理性化、技术化治理模式,国家希望通过这种方式,实现中央和上级政府的政策意图,并确保资金运行安全。

    “部门型”项目管理模式的影响

    项目制所采用的“部门型”项目管理模式,也蕴藏着诸多内生的不足,最典型的包括以下两方面。

    一是财政资金的“部门化”和“碎片化”。这种相对封闭的“部门型”项目管理模式,不可避免的导致财政资金的“部门化”和“碎片化”。具体实践中,不仅同一类型和用途的专项资金被切割到许多主管部门分别掌握,就是在同一个部门内部,一项专项资金也被分割成了很多细小专项分别由不同二级部门掌握,一直要细化和明确到主管部门内的基层行政单位,中央、省级部门就明确到了处(室),地市级细化到科(室),县级则分割到股(室)。这就是中央政府部门专项资金管理过程中反复出现的“司处化”和“碎片化”问题。

    党的十八大以来,中央对专项转移支付改革的一个重点,就是整合规范专项转移支付的“碎片化”问题。改革要求将“目标接近、资金投入方向类同、资金管理方式相近的项目予以整合,严格控制同一方向或领域的专项数量”;同时在资金管理中,特别强调“每一个专项转移支付都有且只有一个资金管理办法,对一个专项有多个资金管理办法的,要进行整合归并,不得变相增设专项”;“资金管理办法要明确政策目标、部门职责分工、资金补助对象、资金使用范围、资金分配办法等内容,逐步达到分配主体统一、分配办法一致、申报审批程序唯一等要求”。之所以如此要求,就是原来专项转移支付管理分配中,出现了大量的“大项套小项”,即一个大的专项转移支付,在实际执行中被主管部门再次分割成了诸多明细专项,由部门内部不同二级单位负责管理,导致一个大的专项转移支付,出现了不同的分配主体、不同分配办法、不同申报审批程序等情况,这实际上是变相增设专项。

    但是,从实践来看,项目整合仍然面临很大挑战。以2014年为例,虽然中央在专项转移支付项目上由2013年的220个压减到了133个,完成了政府工作报告提出的减少1/3专项转移支付项目的目标。但是实际执行中却又安排明细专项362个,审计署抽查的343个明细专项有43个部门参与分配,涉及123个司局、209个处室。其中,农业部就参与分配4个大项(共18个子项),“公共卫生服务补助”专项则细分为21个明细专项,其中卫计委疾病预防控制局有10个处参与13个明细专项的分配。显然,实际执行中并未有效实现专项整合的目标,专项资金的“碎片化”“司处化”问题仍然严重。

    实际上,这是精密理性科层制的科层分工逻辑的必然结果,它一方面强调明确具体的科层分工,因此要将专项资金细分到部门内的基层行政单位才能明确权责关系。因此一个专项转移支付被划归政府部门主管后,一定要落实到部门内的最基层行政单元。同时,在这个过程中还需要处理和面对政府部门内部各部门间微妙的权责平衡,如果一项专项转移支付数额巨大,若在一个中央部门中完全由一个二级部门掌握,则形成了各部门间权力-资源的严重不平衡,为平衡部门内部的权责关系,则几乎必然将大专项在部门内部切分为小专项,由不同二级部门分别管理,结果就造成了“大项套小项”。但是,从功能和用途来看,这又要求同一用途的专项资金不能过度细分,它既不利于专项转移支付的分配管理,也不利于项目在地方和基层的组织实施。

    财政资金的“部门化”和“碎片化”也明显冲击了各级政府财政预算分配权的统一。从专项转移支付的分配管理来看,虽然是财政部门和业务部门共同管理,但由于专项转移支付涉及类型和领域繁多,财政部门缺乏相关领域的专业信息和业务知识,因此业务部门在这个过程中就拥有了很大的控制权。尤其是,除部分民生支出外,目前专项转移支付中仍然有大量资金需通过“项目法”分配,这进一步扩大了业务部门对资金的分配管理权限。若是主要采用“因素法”分配,业务部门只需要负责收集审核相关客观性因素指标信息,再汇总到财政部门统一完成资金拨付。若是采用“项目法”分配,则需要依赖业务部门组织复杂的项目申报评审,实际上是赋予了业务部门二次预算分配权,像发改委等本来就拥有二次预算分配权的单位就更甚,这直接冲击了各级政府财政部门预算分配权的统一。

    二是财政支出进度慢和效率低。中国大规模的自上而下的专项转移支付,在主管部门层层规范化、程序化的管理过程中,在很大程度上造成了支出进度缓慢和效率低下。在很长时间内,由于大规模专项转移支付主要依赖项目法分配,审批权也集中在中央部门,导致年初预算时大量专项转移支付无法明确到具体地区和项目,需要等年中预算执行时进行细化分配。结果,大量专项转移支付资金都堆积到下半年才能拨付支出,甚至造成大规模的资金结转结余。专项转移支付到达地方政府后,也还需要再经过层层审批分配,进而在各层级政府中长时间“滞留”,导致其最终到达基层政府的时间太晚,严重影响资金支出进度和效率。

    最近几年,中央一方面要求各层级政府要加快专项资金审批和拨付进度,减少资金在中间层级政府的“滞留”时间。中央明确指出:除据实结算等特殊项目可以分期下达预算或者先预付后结算外,中央对地方一般性转移支付在全国人大批准预算后30日内下达,专项转移支付在90日内下达。省级政府接到中央转移支付后,应在30日内正式下达到本行政区域县级以上各级政府。但实际上,中央财政资金达到地方各层级政府后,往往还是难以按照规定时间快速下达。为此,自2020年起,中央又推出了项目资金的“直达”模式,即中央下达的部分专项资金直达到县、市基层政府,以提高资金支出进度和效率。中央“直达”资金按照“中央切块、省级细化、备案同意、快速直达”的管理和分配机制,重点用于保民生、保就业、保市场主体方面,2020年资金规模达1.7万亿,2021年达到了2.8万亿。截至2021年5月,中央下达直达资金2.579万亿元,下达比例92.1%;省级财政已分配下达2.362万亿元,达到了中央财政下达的91.6%。其中,按照有关规定,省本级使用了0.869万亿元,下达市县1.493万亿元,市县财政接到上面直达资金指标后,已将1.428万亿元分配到资金使用单位,达到省级下达的95.6%。显然,财政直达资金机制确实有效提高了资金支出进度和效率,但是它能使用的范围仍然有限,主要还是限于那些能够直接补助到个人、家庭和企业的支出项目。其他大量专项转移支付,仍然面临着支出进度和支出效率的考验。

    但是,需要特别指出的是,项目制这种“部门型”项目管理模式的一些弊病,在一定程度上具有内生性和结构性,我们不能期待简单通过政策改革来毕其功于一役。比如,中国的公共支出结构,就在很大程度上影响专项转移支付的分配管理方式,但它却是由中国社会经济发展模式和发展阶段决定的,不可能在短期内随政策改革而发生根本性的变化。又如,中国中央和地方政府的组织规模也是由新中国成立后长期历史演变所形成的,中央政府组织规模偏小的结构特征也很难在短期内发生大的变化。一旦深入到这些结构性层面,就提醒我们既要充分认识到项目制及其管理模式的弊病,也要对相关制度变革和结构变迁保持必要的历史耐心。

    结论与讨论

    分税制改革后,国家财政汲取效率明显上升,中央政府财政能力显著增强。在世纪之交,两方面因素共同作用,推动了项目制的形成。一方面,中央大力推动了公共预算体制改革,各级政府形成了以部门预算为基础、项目支出为核心的公共预算体制,这直接推动了各级政府公共支出的“项目化”。另一方面,随着中央财政能力实质强化,中央在平衡区域发展差异、引导地方政策导向等方面发挥的主导作用日益强化,专项转移支付成了一个最主要的政策工具。中央专项转移支付和各级政府的部门预算体制互相组合形塑,形成了项目制这一新型国家治理体制。

    可见,项目制是在分税制改革后,尤其是新世纪以来二十多年的国家治理变迁中逐渐形成的,它不是简单的国家政策选择的结果,而是由中央和地方关系等诸多结构性因素塑造的。首先,中国作为一个广土众民的国家,其社会经济发展存在严重的不平衡问题,这在区域、城乡和人群间都有多方面表现。新中国成立以来七十多年的治理理念和实践,又赋予了共同富裕以特殊的正当性,因此中央政府在中国承担着巨大的均衡地区、城乡和人群间发展差距的责任,即不可避免的要承担大量的再分配职能。其次,由于中国中央政府组织规模偏小,中央本级直接支出占比也很小,大量中央事权、中央和地方共同事权,不得不直接或间接委托给地方政府具体执行。这些委托事权或共同事权,在执行中还必须体现中央政策意图,这使得大规模专项转移支付就基本不可避免,同时还产生了部分中央直接项目支出变相委托给地方执行的情况。再者,中国从计划经济向市场经济转型后,一直到目前为止,中国公共支出结构仍然是一个民生支出和经济事务支出的“双强格局”,经济事务支出规模大,使得公共支出的预算难度大大增加,尤其是中央到地方转移支付中的经济事务支出,预算和分配难度更大,进而使项目法成了专项转移支付分配中的一个重要方法,这也是滋生项目制诸种弊端的关键因素之一。

    项目制采用了一种“部门型”项目管理模式,这是在中央对地方大规模转移支付实施20余年,以及国家公共预算改革推行20余年的过程中,逐步摸索形成的。党的十八大以后,中央以厘清中央和地方间财政事权和支出责任划分为核心,进一步从理论和制度上对财政转移支付体制进行了改革完善,但并未有意推翻和改变已有的“部门型”项目管理模式,而是进一步完善规范了这一模式。总体来看,“部门型”项目管理模式虽然在后续改革过程中可能还会进一步调整,但其基本框架、核心精神应该说已经基本定型。

    当前,从国家治理的角度看,自上而下的专项资金是项目制的一个关键部分,也是“部门型”项目管理模式的典型代表。在这种管理模式下,项目根据中央和上级政府的政策意图,在自上而下的部门内部相对封闭的流动和管理,一直到项目组织实施的基层政府。中央试图通过规范化、技术化的项目管理模式,将自身的政策意图跨层级的传递到地方和基层,甚至直接对接到最终的项目主体,大量直接补助到个人和家庭的民生支出就是典型例子。这种从中央跨越多个中间层级政府,直接将政策意图传递和明确到基层甚至最终政策目标群体的做法,明显超越了中国多层级政府结构中下管一级的常态治理模式,确实在一定程度上重新塑造了中央和地方间关系。同时为了确保上述政策意图的实现,中央强化了专项资金在各层级政府部门流动和管理过程中的监控,以防止资金跑冒滴漏,最大限度确保资金安全。也正是因为专项资金要“艰难”地越过多层级政府,要不断承载中央到地方各层级政府相关主体的多种意图,这就必然造成了专项资金分配和支出过程中的碎片化和低效率。

    但是,自上而下的项目制形态,在通过漫长的相对封闭运行越过多个中间层级后,它的最终组织实施,还得依赖地方和基层政府的统筹协调。也就是说,它还得必须通过基层政府与地方社会相结合,并与基层政府自身的公共预算相融汇,最终由地方和基层政府对这些上级各条线下达的多样化项目进行重新排列组合和落地实施。在项目制的组织实施过程中,已经形成了“以县为主”的格局,县级政府扮演着枢纽性的角色。因此,如何从政府内部,深入分析和揭示项目制在县级政府内部的重新排列组合过程和机制,是项目制研究亟需解决的难点。

  • 白营 等:权力之网:精英网络如何塑造中国的战争和政治

    原文信息:Bai, Ying, Ruixue Jia, and Jiaojiao Yang. “Web of Power: How Elite Networks Shaped War and Politics in China.” The Quarterly Journal of Economics (2022).