从此走进深度人生 Deep net, deep life.

分类: 社会分析

  • 威廉·伯恩斯坦《群体的疯狂》1-7

    前言
    1 末日论的起源 约阿希姆的子民们
    2 滥用末日叙事的悲剧 信徒与无赖
    3 短暂的致富 密西西比泡沫与南海泡沫
    4 资本主义的英雄 英国铁路泡沫
    5 米勒运动的“大失望” 数秘主义与确认偏见
    6 弹性货币政策的灾难 泡沫与崩溃的四个前提
    7 致富空想的破灭 1929年大萧条
    8 天启之牛 时代论如何兴起
    9 圣殿山的争夺 末日叙事如何影响犹太人建国
    10 《启示录》的开创者 畅销书与美国核武政策
    11 时代论的灾难 大卫教派的悲剧
    12 “被提”类小说 末日文学为何畅销
    13 资本主义的慈善家 从环球电讯、安然公司到互联网泡沫
    14 数字时代暴富梦的推手 投资分析师、大众、媒体与政治家
    15 伊斯兰国的兴衰 马赫迪与哈里发
    后记

    前言

    近两个世纪之前,一位年轻的名叫查尔斯·麦基的苏格兰人,以令人难忘的方式同时攻击上帝和玛门[1]。他出生于1814年,是一名颇受欢迎的诗人、民谣作家,还担任过美国内战记者和英国报纸的编辑,在文学生涯中享有杰出的声誉。但后人对他最深刻的印象,是他在1841年撰写了《异常流行幻象与群众疯狂》(Memoirs of Extraordinary Popular Delusions)一书,当时他才27岁。该书讲述了多个历史性群体狂热事件,其中一些与宗教和货币有关。[2]从那以后,这本书为读者不断加印。

    麦基记录了公元1000年前笼罩在欧洲的末日幻想,以及十字军东征时期惊人的宗教疯狂。不过,这本书最著名的内容是17世纪30年代荷兰郁金香投机,以及1719—1720年巴黎和伦敦双股市泡沫中的群体性金融狂热。这些情节使这本书一直享有盛誉[3]。在它出版之后,接连发生的金融狂热的频繁性、规律性及其造成的全球性影响,使得即使在写成近两个世纪之后,这本书依然是金融专业人士的必读经典。[4]

    麦基并不是第一个认识到人类的非理性具有传染性的人。例如,希罗多德写过这样一段话:
    (大流士)担任波斯国王的时候,他召见了统治下的一些希腊人,问付给他们多少钱他们才愿意吃掉自己父亲的遗体。他们回答说,无论给多少钱都不可能做这种事情。然后,当着希腊人的面,大流士又把印度卡拉提亚人(他们愿意吃掉自己双亲的遗体)召来,借助翻译问,付给他们多少钱他们才愿意焚烧自己父母的遗体。这些印度人惊恐地大叫起来,不允许大流士提这么可怕的事情。这个故事显示出习俗的意义。在我看来,诗人品达说得对:习俗乃是“万事之主”。[5]

    希腊人毕竟是古代的智者,大流士一定忍不住想要教育他们。他想传递给希腊人未言明的信息:你们也许是人类中最博学的人,但你们和我们一样具有非理性;你们只是更善于进行合理化解释而已,善于解释尽管有各种反面证据,但你们依然是对的。

    虽然古人和麦基非常熟悉人类的非理性和流行性狂热,但无法得知其中精确的生物学、进化论和社会心理原因。例如,麦基一定问过自己,为什么一群人会时不时地去追逐某种价格高得离谱的投资?

    今天,我们对此有了更好的理解。首先,金融经济学家发现,人类会本能地追求回报非常高但是发生概率非常小的结果。比如彩票,平均来说是赔钱的,但用巨额财富幻觉吸引了买家。此外,在过去几十年里,神经系统科学家已经揭示了贪婪和恐惧背后基本的解剖学和心理学机制——“大脑边缘系统”,其位于大脑左右半球中间的垂直面附近,具有对称分布的结构,包括一对伏隔核(大约位于每只眼睛的后面)和一对杏仁核(位于太阳穴下方)。

    研究人员使用功能性磁共振成像技术后发现,伏隔核不仅会因奖励而被激发,而且会因为对奖励的预期而被激发得更加强烈,无论这种预期是关于烹饪、性、社交还是金融;相反,杏仁核会因厌恶、恐惧和退缩而被激发。例如,如果你喜欢芙洛阿姨的烤宽面条,那么在你去往她家的路上,你的一对伏隔核及两核之间的连接会更快地被激发,并且很可能在你闻到菜肴香味时达到激发率的顶峰。但是,一旦你品尝到第一口,伏隔核的激发率就会下降,如果芙洛阿姨在你到达时告诉你她刚刚烤煳了这道菜,你的伏隔核就不再被激发。[6]

    这种活跃的预期传导有很明显的好处:大自然偏爱那些怀有预期并为之努力奋斗的人,而预期一旦被满足,就几乎没什么进化优势了。周围的人毫不费力地变得富有,这会大大刺激我们的伏隔核,正如经济历史学家查尔斯·金德尔伯格观察到的那样,“没有什么比看到朋友发财更干扰一个人的幸福感和判断力的了”[7]

    几个世纪以来,小说家和历史学家都知道,人类并没有运用强大的智力冷静分析世界,而是对事实进行合理化,使其符合情感上的预期。记者戴维·哈伯斯塔姆的权威著作《出类拔萃之辈》[8],使用反讽方式说明了美国“最杰出”的决策者如何在军事介入越南事件中自欺欺人,对事实进行合理化的倾向明显;而我们最近在国外的军事行动也表明我们还没有吸取教训。[9]

    在过去几十年里,心理学家积累了很多实验数据,分析人类对“合理化”胜于“合理性”的偏好。当面对的事实和数据与我们根深蒂固的信仰相矛盾的时候,我们通常不会重新考虑并适当改变这些信仰,而往往会回避这些事实和数据。而当无法回避时,我们有时会更加强硬地继续进行错误评估。令人惊讶的是,我们甚至可能会教化、改变、使其归附或说服对方。简言之,人类的“理性”构成了一个脆弱的盖子,在麦基所说明的自欺欺人的沸腾的大锅上危险地保持平衡。

    麦基本人的行为表明,即使是最理性、信息最灵通的人也容易受到金融狂热的影响。1841年,他出版《非同寻常的大众幻想》一书后不久,英国经历了一场金融狂热,其围绕当时伟大的高科技产业——铁路,甚至比1719—1720年席卷巴黎和伦敦的双股市泡沫还要严重。投资者们贪婪地购买铁路股票,为英格兰的铁路里程从1843年的2000英里[10]增加到1848年的5000英里提供了资金支持;股市最终崩盘时,还有数千英里的铁路已在计划中但从未建成。如果说应该有人预见到这次崩盘,这个人就是麦基。

    但狂热事件发生时,麦基正担任《格拉斯哥的阿格斯》报纸的编辑,他报道了正在进行的铁路建设,却明显缺乏怀疑态度。1852年,他出版了《非同寻常的大众幻想》第二版,对此只做了一个简短的脚注。

    金融狂热可以被看作一场像《哈姆雷特》或《麦克白》一样的悲剧,有着界定清晰的人物、熟悉的叙事和精心排练的台词。四个戏剧人物控制了故事的叙述:有才华但不择手段的项目发起人,轻信并购买股票的公众,大肆渲染的媒体,以及把手伸进钱柜并无视腐败之火的政客。

    发起人走上了一条经典的莎士比亚悲剧式道路,成为最引人入胜的演员。他们大多数一开始都是才华横溢、努力工作而又有远见卓识的人,凭直觉比别人更早地知道某项新技术将给社会带来财富。在实现愿景的过程中,他们变得富有和强大,在一个以财富判断人的资本社会中,他们成为国家的雄狮。当投机活动走到尽头、泡沫破裂时,他们最终落得不光彩和破产的下场,但通常(并不总是)能够侥幸逃脱牢狱之灾。

    事实证明,公众很容易被那些英雄般的、魅力四射的发起人用花言巧语说服。要想胜任投资工作,必须具备一系列能力,包括数学能力、技术专长以及最关键的经济历史类应用知识。唉,比起数据和事实,人们更喜欢故事;当面对复杂的投资任务时,人类默认进入叙事模式,也许最令人愉快的就是那些通过购买新技术不费吹灰之力获得财富的故事。

    媒体和公众一样成为发起人的受害人。写杰出商人的改革性经营事迹,能非常轻易地损害新闻界的名誉。这些发起人以惊人的频率出现在各大杂志封面上,先是被称作英雄,后来又成为被控重罪者。

    最后,金融狂热席卷了相关政客,他们的声誉和人气曾经因过度投机带来的经济短暂繁荣而得到提升,但最后经常因为把手伸进钱柜而被抓。

    各种金融狂热故事的情节变化不大。大多数投机性事件包含两个因素:预示共同富裕的激动人心的新技术,以及宽松的信贷。在今天的美国,只有大约10%的货币供应由实际流通的纸币和硬币组成;其余部分以信贷形式存在。银行系统可以在一定程度内随意创造信贷,信贷的规模取决于银行、抵押贷款公司和其他贷款人对得到偿还的乐观程度。这个过程是如此违反常理和令人震惊,因此值得我们重复这个概念:银行印钞。事实上,银行与其所服务的公众一样容易狂躁或抑郁,当沉浸在泡沫里极度兴奋时,它们放纵的“赚钱”行为通常更能煽动起投机之火,这在2007—2009年金融危机爆发前最为显著。

    泡沫伴随着四个特征。首先,最重要的是,金融投机开始主导除了最普通的社会互动之外的一切;无论何时何地,人们见面时谈论的不是天气、家庭或运动,而是股票或房地产。其次,原本在其他领域很理智的专业人士,却放弃了可靠、高薪的工作,去参与上述资产的投机。再次,对投机持怀疑态度的人往往会遭到激烈的反对;虽然总有一些年纪够大、记忆够长、以前看过这出戏的人知道它的结局,但他们的警告遭到了鄙视和嘲笑,并在过去几十年里通常被冠以五个字:“你就是不懂”。最后,平时稳重的观察家们也开始做出荒诞的金融预测,他们预计资产价格一年内的上涨幅度,不仅仅是10%、20%或30%,而是一倍、两倍或末尾增加一个零。

    除了关于金融狂热的前三章之外,《非同寻常的大众幻想》还包含三章篇幅较长的关于宗教狂热的内容:分别讲述《圣经》预言、十字军东征和猎杀女巫。虽然宗教狂热和金融狂热看上去没有什么共同点,但它们发生的潜在力量是相同的:希望改善自己今生或来世的福祉。而放大金融和宗教群体幻想传染性的因素也很相似:人类固有的模仿、编造和接受引人入胜的叙事以及追求地位的倾向。

    宗教狂热似乎是人类历史不变的特征,最近的一个例子就是太阳圣殿悲剧。1994年10月4日晚,瑞士切伊里村的居民被镇上一座农舍冒出的火焰吓了一跳,消防队员在那里看到了一幅奇异、可怕的景象:22具尸体,其多数身穿红色、黑色或白色斗篷,还有几个妇女穿着金色斗篷。除了其中3名受害者以外,其他人都是被枪杀的。此外,还有10名受害者头上蒙着塑料袋。被发现时,大多数人躺成一个圈,头朝外;弹壳和空香槟酒瓶散落在地板上。

    这仅仅是开始;接下来的两年半时间里,瑞士和加拿大又发现了74名被谋杀或自杀的受害者,其全部为教派成员或者他们的孩子;所有的死亡事件都发生在春分或秋分、夏至或冬至的前后几天内。

    该教派由两个男子领导:一个叫吕克·茹雷,他是神秘、英俊、有吸引力的46岁比利时医生,1993年受到共谋和武器指控,但从加拿大逃脱;还有一个叫约瑟夫·迪·马布罗,是70岁的法裔加拿大人。最终的受害者里包括法国滑雪名将让·维亚尔内的妻子和儿子。维亚尔内是1960年奥运会滑雪金牌获得者,后来他将自己的名字授权给一家国际太阳镜制造商,此后他的名字成为一个著名的商标。在维亚尔内去世之前,小维亚尔内曾经告诉记者:“从生到死这段路程的主题一次又一次地被提到。茹雷解释说没什么可怕的——但恰恰相反,我开始觉得自己快要殉道了。”[11]

    1997年3月24日,最后一批圣殿教受害者被发现;两天后,在美国圣迭戈附近的兰乔圣菲小镇,警察发现了另一个末日组织——天堂之门的39名成员的尸体,他们也死在那个春分前后。他们相信自己死后将被隐藏在海尔-波普彗星尾部的宇宙飞船里运出地球。[12]

    太阳圣殿和天堂之门只是一系列著名末日组织中的两个例子:1978年,吉姆·琼斯领导的人民圣殿教在圭亚那的集体自杀及谋杀事件夺走了918条人命;1993年,大卫支教在得克萨斯州韦科镇与愚蠢的联邦当局对峙,导致86名教徒被杀;残忍的日本奥姆真理教制造了1995年东京地铁神经麻痹毒气袭击。令人震惊的是,这些组织中的许多成员,如茹雷和维亚尔内,都是受过高等教育、有一定成就的人。

    末日论的群体幻想不是现代世界特有的;中世纪的欧洲就有大量精彩故事——如果我们对它们印象不深刻的话,就可以称之为插曲。现代神经心理学研究揭示了为什么一群神志正常、聪明、能很好适应社会的人,会自欺欺人地认为世界将以一种特定的方式终结,而且往往在某个特定的日期终结。人类是通过叙事来理解世界的:无论我们如何吹捧自己的个人理性,一个好的故事,即使分析起来很有欠缺,也会萦绕在我们的脑海中,使我们在情感上产生共鸣,并且比最具决定权的事实或数据更有说服力。

    最近,心理学家开始意识到,这些引人入胜的叙事是多么有效地腐蚀了我们的分析能力。也许所有故事中最引人入胜的就是末日论的叙事;如果认识到自己存在于叙事中,那么我们都想知道叙事的结局。末日论故事深嵌于世界上的许多宗教中,尤其是亚伯拉罕诸教[13],它如此普遍以至于几乎不被看见,但它潜伏在每天的头条新闻和推特背后,它如此古老以至于至少可以追溯到人类文明的起源。

    想要了解“故事的剩余部分”的渴望深深地侵蚀着我们的意识。此外,末日论故事还有另一种不可抗拒的吸引力:它承诺将使人类摆脱一个被托马斯·霍布斯称为“孤独、贫穷、肮脏、野蛮、短见”,充斥着以牺牲正义为代价而偏袒富人和权贵的腐败的人类存在。很少有故事能像承诺救世主的回归那样让人感到欣慰。救世主会扭转局面,拨乱反正。这种对人类新开端的渴望深深地内嵌在《圣经》中,尤其是《以西结书》、《但以理书》和《启示录》。这些书为几次血腥的末日运动提供了蓝图。

    演化心理学的新兴领域为解释群体狂热的传播提供了令人信服的机制。冰河时期末期,第一批部落从西伯利亚进入北美,之后的大约一万年时间里,人类的足迹从亚北极地区到北美大平原,再到热带亚马孙河流域。人类在如此多变的环境中需要掌握生存所需的各项专门技能,生物本来不可能进化得这么快:比如,要进化出一种会在亚北极海岸制造皮艇的基因天赋,还要进化出在北美大平原上猎杀水牛的天赋,然后是进化出在亚马孙地区制造毒气喷枪的天赋,这些进化需要很长时间。(据估计,北欧成年人的乳糖耐受性和吐蕃人的高海拔耐受性的进化用了3000~10000年,这是已知人类适应性进化最快的时间。)[14]

    但人类做到了。在进化过程中,人类并没有将制造皮艇、猎杀水牛或制造毒气喷枪的独特能力硬连接到基因中,而是编码了一项通用技能——模仿能力。例如,当有足够多的人和足够多的试错时,最终会有人想出如何建造一艘可使用的皮艇,而其他人可以准确地模仿这一过程。[15]

    人类比其他物种更喜欢模仿;一旦有人有所创新,其他人很快就会采纳。然而,我们的模仿倾向也增强了适应不良性行为,其中最主要是幻想性信仰。诚然,在现代后工业社会中,模仿能力确实促进了经济发展,但它对人类生存的促进作用远不及前现代时期在亚北极、大平原或亚马孙流域所起的作用。因此,在现代世界,适应性行为和适应不良性行为之间的权衡使得模仿能力对于人类已不如过去那么有利,我们现在陷入晚更新世时期的模仿倾向中,这一倾向在现代时期的成本越来越高,其中最昂贵和最危险的代价就是对世界末日即将到来这一信仰的传播。

    人类不仅对叙事的反应比对事实和数据的反应更加强烈,而且初步研究表明,越引人入胜的故事越能侵蚀人们的批判性思维能力。[16]此外,研究还表明,叙事的提供者和消费者之间是存在内在利益冲突的:前者希望使消费者信服,并设计出最引人入胜的叙事,而后者如果是理性的,就应有意避开这些叙事,并仅仅依赖数据、事实以及分析的方法。

    人类偏好于引人入胜的叙事,与之密切相关的是,人类还具有自欺欺人的倾向。人类本来很善于发现他人撒谎的真相,但是人类用欺骗自己的能力消除了这些真相,这使人类成为更好的骗子。[17]纵观历史,在各种宗教性群体幻想的主角中,作为局外人的骗子相对较少,更多的是一些被自己的幻想欺骗的受害者。

    大约从150年前开始,基督教新教发展出一种信仰,其专业名称为“时代论前千禧年论”(简称“时代论”),其现代倡导者将其打磨成世界上最引人入胜的末日叙事。尽管其确切的内容因不同的神学风格而异,但基本叙事都是预测犹太人将返回以色列、重建耶路撒冷圣殿,并在那里恢复祭祀。然后,罗马帝国以十国联盟的形式重新组合起来,由一个有魅力、才华横溢、英俊潇洒的人领导,这个人是反基督者,是魔鬼在人间的化身,他与犹太人结成了一个七年联盟,但三年半后,这个反基督者背叛了犹太人,从而促成了外国军人对以色列的入侵。入侵者不仅包括俄国人,还包括穿越喜马拉雅山到达那里的2亿中国人。

    一场灾难性的核战争接踵而至:大决战和其他恐怖事件,统称为大灾难。七年大灾难的最后,耶稣复临,击败反基督者,建立千禧年国家。在这个过程中,数十亿人死亡。信仰耶稣的基督教徒被顺利地从大决战和大灾难中提到天堂——这就是“被提”。犹太人的结局差一些:1/3的犹太人改信了基督教,并规劝其他人也改信,从而在大灾难中幸存下来。另外2/3的犹太人就倒霉了。

    不了解上述时代论叙事,就无法充分理解当前美国社会的两极分化现状。大多数受过良好教育、非宗教取向的公民都认为这是极其怪诞的,但是,对相当一部分美国人来说,这一系列的预言事件就像《罗密欧与朱丽叶》或《教父》一样耳熟能详,像杰瑞·法威尔、金·贝克和吉米·斯瓦加特这样的电视福音布道者,他们对公众的吸引力也完全依赖于他们的时代论资质。

    几个原因决定了对时代论叙事的普遍关注。以色列,尤其是重建圣殿在这一信仰体系中的中心地位,深刻地影响了美国的中东政策。美国对以色列扩大在约旦河西岸定居点的不加批判的支持和对巴以“两国方案”的明显放弃[18],可以直接追溯到福音派,也就是所谓的基督教犹太复国主义者的鼓吹,他们现在的影响力远远超过犹太复国主义[19]者。事实上,2018年5月美国驻耶路撒冷新大使馆落成典礼的开幕式和闭幕式是由两位时代论牧师主持的。其中一位是罗伯特·杰夫里斯,曾经声称希特勒帮助过犹太人返回以色列;另一位是约翰·哈吉,他认为卡特里娜飓风是上帝对新奥尔良罪恶[20]的惩罚。[21]

    在核时代,即使是轻微的“世界末日不可避免”的宿命论也是危险的。2010年美国皮尤基金会的一项民意调查发现,超过1/3的美国人相信耶稣会在他们的有生之年回来,而且大多数人相信“被提”。[22]其中一个有此信仰的美国人就是罗纳德·里根[23]。他可以和杰瑞·法威尔这样的人畅所欲言地谈论时代论神学。福音派占据美国军队的近1/4,其中大部分是时代论者;他们的影响在空军学院尤为突出,所服务的部门控制了美国的大部分核武器。[24]1964年,丹尼尔·埃尔斯伯格和他的兰德公司老板审查完美国的核指挥系统后,放映了电影《奇爱博士》,并评论说这部电影很可能成为一部纪实节目。影片中,一位患精神病的美国空军基地指挥官奇爱博士关注于饮用水的氟化[25]——即使到今天仍然有部分时代论者被饮用水氟化问题困扰——影片中这位指挥官触发了第三次世界大战。[26]

    历史上,基督教徒一直给犹太人贴上反基督的标签,这一概念本身就容易引起暴动。即使在今天,对一些极端福音派教徒来说,把这个标签贴在某人或任何团体身上,都可以为他们的谋杀辩护。

    最后,单是时代论这一信仰就能够而且确实已经引发大规模死亡。1993年,在得克萨斯州的韦科镇,痴迷于《启示录》的大卫·考雷什[27]领导的大卫支教与不理解其信仰体系的联邦官员发生了冲突。

    启示性末日论的起源在《新约》和《旧约》中都有,并且可能更早地起源于肥沃新月地带的多神教,因此,以色列犹太人中的极端主义者和伊斯兰教国家的末日剧本,都与基督教时代论者的末日剧本有很多的相似之处,这不足为奇。它们的不同之处在于谁扮演英雄,谁扮演反派人物。今天的穆斯林末日论者几乎一致认为犹太人是反基督者,而“伊斯兰国”之所以能够从世界各地招募新兵到叙利亚和伊拉克这片杀戮之地,很大程度上依赖于从圣训中直接引用的末日论叙事。

    要想理解金融泡沫和暴力性的末日疯狂等社会潮流是如何产生和传播的,可以先理解它们在什么情况下不会发生,这同样具有指导意义。我们对群体决策智慧的现代理解开始于1906年秋天,当时的先驱博学家弗朗西斯·高尔顿(他是查尔斯·达尔文的表弟)参加了在普利茅斯举行的一年一度的英格兰西部肥畜和家禽展览。在那里,他进行了一次群体理性实验。大约800名参赛者以每个人6便士[28]的价格购买一张“公牛体重竞猜”的票,对公牛净重(即屠宰后去掉头和内脏)猜得最准的人将获得奖品。令人惊讶的是,所有猜测值的中位数为1207磅[29],与实际体重1198磅相差不到1%。所有猜测值的平均数为1197磅,几乎准确,尽管高尔顿在他发表在《自然》(Nature)上的第一篇文章中没有提到平均值这个数字,因为他认为中位数,也就是(按顺序排列后)所有数据中居于中间位置的数,在理论上比平均数更具有吸引力。[30]

    高尔顿关于集体决策准确性的结论已经被反复证实。[31]最近,《纽约客》专栏作家詹姆斯·索罗维基在他的畅销书《群体的智慧》中总结了这一概念,他在书中提出,有效的群体智慧有三个要求:个体分析的独立性,个体经验和技能的多样性,以及收集个体意见的有效方式。[32]

    那么,就我们的目的而言,什么才是“群体”——是弗朗西斯·高尔顿和詹姆斯·索罗维基提到的那些理性的人,还是吕克·茹雷、约瑟夫·迪·马布罗和大卫·考雷什这些不理性的人?

    妄想性群体与智者群体之间的区别在于其成员之间的互动程度。高尔顿的约800名参赛者中的所有人,甚至大部分人,是否真的聚集成一个集体,这是值得怀疑的。他的实验有一个关键的、通常被忽略的细节,那就是它涉及牛的净重。在牛被屠宰前,没有人知道结果,参赛者必须在参赛卡上填写自己的地址,这样获胜者才能接到通知,且参赛者为了让自己的预测结果不对外泄露,在填写卡片之前并没有聚集在一起。

    几年前,金融专家乔尔·格林布拉特对高尔顿实验进行了巧妙的改变,他向哈勒姆地区的一个小学生班级展示了一个装有1776颗果冻糖豆的罐子。和之前的实验一样,学生们独立提交的索引卡上所显示的平均估计值非常准确:1771颗果冻糖豆。然后格林布拉特让每个学生当众说出他们的估计值[33],这破坏了他们总体判断的准确性——新的“开放式”估计结果平均只有850颗果冻糖豆。[34]

    因此,一组人的互动越多,其行为就越像一个真正的群体的行为,评估结果就越不准确。有时候,群体互动变得如此紧密、频繁,就产生了疯狂。用弗里德里希·尼采最简洁的话说,“在个体中,疯狂是罕见的;但在群体、政党、民族以及时代中,疯狂是司空见惯的”[35]。麦基也意识到了这一点;也许他的《非同寻常的大众幻想》中最有名的那一句话就是,“据说,人以群体为单位思考;我们可以看到,他们成群结队地发疯,但非常缓慢地逐个恢复意识”[36]

    因此,实现一组人整体判断的准确性,要求参与者不能像群体那样行动。此外,正如索罗维基所指出的,这还要求这组人中个体的多样性:一组人对于某项估计的观点越多,该估计就越准确。

    观点的多样性也有利于个体;正如弗朗西斯·斯科特·菲茨杰拉德所言:“检验一流智力的标准,就是在头脑中同时存在两种相反的想法但仍保持行动能力。”[37]在过去30年中,心理学家菲利普·泰洛克检验了数百位著名专家预测的准确性;他发现,那些综合考虑各种往往相互矛盾的观点的人比那些从单一理论视角看待世界的人表现得更好。[38]简单一句话:无论是在政治、宗教还是金融领域,都要提防空想家和真信徒。

    索罗维基的书描述了群体决策是如何成功的,而我的书将描述群体决策是如何失败的,以及群体决策失败时会发生什么。在最极端的情况下,不仅群体会疯狂,而且正如20世纪发生的几次事件那样,整个国家都会疯狂。

    麦基做得并不完美,他的很多编写内容甚至都不是原创的;他可能从当时四年前出版的一本理查德·达文波特的书《了解假冒、欺骗和轻信》(Sketches of Imposture,Deception,and Credulity)中获得了灵感甚至摘录了部分内容。达文波特的书涵盖了许多相同领域的内容,但没有那么多细节。[39]另外,麦基对郁金香事件进行了耸人听闻的描述,并将“郁金香狂热”这个术语引入现代词典,也为现代评论家们所不屑,他们认为麦基描述的并不是一个全社会范围的现象。[40]

    此外,麦基的章节、主题和时间顺序是混乱的;关于群体行为的章节(如金融泡沫、十字军东征)中穿插着关于时尚(头发长度、胡须和决斗)、健康和科学困境(磁化、炼金术)的章节。[41]

    也就是说,麦基意识到了,我们的社会特性会如此频繁地干扰我们的理性。在这一事实面前,麦基(以及那个时代的任何其他观察者)的错误、混乱和可能缺乏独创性的问题,都可以忽略。

    我第一次阅读《非同寻常的大众幻想》是在25年前,尽管前三章所描述的金融狂热吸引了我,但我当时认为这种狂热与20世纪90年代初期表现相对良好的资本市场是没有关联的。我错了。让我惊讶的是,在接下来的几年里,随着互联网泡沫的发展,麦基描述的金融狂热景象在现实生活中出现。

    20年后,伊斯兰国及其前身格外擅长向世界各地的信徒传教,其吸引了数千人从安全、繁荣的西方国家到伊拉克和叙利亚的杀戮战场。在很大程度上,其这样做相当于兜售了一种末日叙事,这种叙事与大量基督教徒所信仰的末日叙事非常相似。麦基对这一主题也进行了一些详细的论述。

    对深受《非同寻常的大众幻想》这本书影响的人来说,伊斯兰国的崛起敲响了响亮而清晰的警钟。如果说宗教狂热的现代表现是存在的,那么这就是随着神经科学最近取得的快速发展,审视从中世纪至今的群体幻想的时机已经成熟。

    在本书中,我忽略了几个麦基详细阐述的事件,例如时尚和健康狂热;而且,我并不直接报道政治事件。可能一些读者有疑问,在当今紧张的、两极分化的政治氛围中,我为什么选择这么做。我将这本书局限在金融和宗教群体狂热这两个领域,是为了使本书的主要内容保持在可控篇幅之内,也是因为我个人对金融和宗教群体狂热的共鸣。但是,读者会发现,这本书接下来所描述的事件及其心理学基础,可以与所有种类的狂热相联系,尤其是与20世纪的极权主义和21世纪的病毒阴谋论相联系,这不会有太大困难。

    很显然,21世纪最重要的地缘政治事件是2001年9月11日世贸双子塔和五角大楼的遇袭,这场灾难增强了一种已经确立的现代伊斯兰教末日主义,后者被西方政治和文化的主导地位以及1979年苏联入侵阿富汗重新唤醒。可以说,20世纪美国文化和政治生活中最重要的转变是基督新教福音主义的兴起,这给美国的中东政策以及战略武器的指挥和控制带来了巨大的风险。伊斯兰原教旨主义和基督新教福音主义的兴起,都可以很容易地通过以往的宗教狂热来理解。

    更笼统地说,本书将提供一个心理学框架,用来解释为什么人类有时候会出现各种类型的群体性疯狂。显然,人类是一种会模仿、会讲故事、会寻求地位、会道德性谴责他人、会怀念过去美好时光的猿类,所有这些都意味着,人类的未来必将充满宗教和金融群体狂热。

    任何一个写群体幻想的作者都很快会遇到一个非常不方便的社会学事实。就像大流士故事中的希腊人和印度卡拉提亚人一样,我们每个人都是社会规范的产物,有时,一个社会的圣礼是另一个社会的亵渎。例如,世界上有许多神学(如果不是大多数的话)倾向于将他人的信仰体系视为异端,这甚至会发生在密切相关的教派中,也就是弗洛伊德著名的“微小差异的自恋”[42]。正如那个古老的笑话,几百人共有的幻想被称为“邪教”,而数百万人共有的幻想被称为“宗教”。

    相当一部分美国人相信《启示录》的字面真理:世界将很快遭受一场末日大灾难。非原教旨主义基督徒和非基督徒可能会认为,末日叙事只是一种幻想,这种群体性幻想对信徒或世界上的其他人极少产生强烈危害。但是事实恰恰相反,所有成功的群体都在一定程度上依赖于共有的幻想。无论美国社会存在什么缺陷,我们最大的力量在于我们信仰法治和法律面前的平等;同样,我们的经济运行良好,是因为几乎所有人都相信,纸币和更为缥缈的电子交易货币代表着真实的资产和债务。但归根结底,这些有益的共同信仰只不过是全社会的骗局:只有在大多数人都相信的情况下,它们才是正确的——这就是所谓的“仙子效应”[43]。因此,我选择将注意力集中在那些变坏的群体幻想上,如果你愿意的话,那么也可以将其理解为“极其有害的大众幻想和群体疯狂”。

    本书的讲述基本按照年代顺序,从麦基没有提到过的中世纪末日狂热事件开始,到近期末日狂热最壮观的例子——中东伊斯兰国的崛起。在这两者之间,我按照发生顺序向读者介绍过去这段时间里所发生的各种金融和宗教狂热事件,以及相关的神经科学发展历程。

    我们首先从人类群体幻想的黑暗中心——中世纪的欧洲开始。在那里,一位名不见经传的西多会[44]修道士受《圣经》启示类书卷的启发,发展了一种神学,引发了一系列可怕的新教末日叛乱。

    1 末日论的起源

    约阿希姆的子民们

    老虎去打猎了,
    鸟儿开始飞翔;
    男人坐下来想,“为什么,为什么,为什么?”
    老虎睡着了,
    鸟儿降落了;
    男人不得不告诉自己他明白。
    ——库尔特·冯内古特[1]

    12世纪末,欧洲的国王和王后们踏上了艰苦的旅程,来到遥远的卡拉布里亚山上的一座修道院,沐浴在一位几乎被遗忘的西多会修道院院长——菲奥雷的约阿希姆[2]的传奇智慧中。在1190—1191年第三次十字军东征途中,狮心王理查[3]也经过这里,寻找自己的未来景象。[4]

    这位沉默寡言而又有智慧的修道院院长喜欢数字和历史类比,他将人类历史分为三个时代,并预言一个即将到来的黄金时代。这正是欧洲统治者被吸引到修道院的原因。不幸的是,约阿希姆无意中点燃了预言的导火索。他的未来景象对饱受蹂躏的穷人来说是一种雄辩的诉说,在他们心中激起了革命。在接下来的几个世纪里,他最初的和平模式演变成一种血腥的末日神学,席卷欧洲大片土地。

    要想理解这是如何发生的,需要援引《圣经》的三大末日叙事:《旧约》中的《以西结书》和《但以理书》,以及《新约》的最后一本书《启示录》。虽然这三本书对现代非宗教读者来说可能显得晦涩难懂,但它们有助于解释基督教福音派教徒与其他美国人之间的文化分化,这种分化在过去几个选举周期中变得非常明显。基督教福音派教徒对这三本书的内容像对美国独立战争故事和内战故事一样熟悉,但其他美国人并不太了解这些书。此外,即使是福音派教徒也常常不知道这三本书中故事背后的古代近东[5]历史,特别是埃及人、非利士人、亚述人、巴比伦人、波斯人,以及以色列王国和犹大王国这两个犹太王国之间的复杂关系。

    《以西结书》、《但以理书》和《启示录》为一系列宗教群体的末日幻想提供了背景,这些幻想在许多方面与瑞士切伊里村的悲剧相似。幻想是亚伯拉罕宗教[6]自诞生以来一直具有的特征,最突出的体现包括16世纪的德国明斯特镇,19世纪中期的美国米勒运动,以及随着现代以色列国家的建立、对即将到来的末日进行的各种反复和广泛的预测。

    宗教狂热往往发生在最糟糕的年代。在这样的年代,人类希望摆脱困境,回到美好的旧时代,回到一个神话般和平、和谐和繁荣的时代。现存最早的希腊诗歌之一,约公元前700年赫西俄德[7]的《工作与时日》很好地表达了这一点。当时的希腊极度贫困,作者在雅典西北部维奥蒂亚的一个农场艰难度日,他把这个农场描述为“冬天不好,夏天闷热,任何时候都不好”[8]。赫西俄德想象着,这些事情在过去的年代里肯定会好一些。在他所讲述的神话中,首先出现的是奥林匹斯山上的众神,他们创造了一个“人类的黄金种族”,这个种族:

    像诸神一样生活,没有内心的悲痛,没有劳累和忧愁。他们不会悲惨地衰老,四肢永远有力;除了远离所有的不幸,他们还享受筵宴的快乐。他们的死亡就像熟睡一样安详,他们拥有一切美好的东西。肥沃的土地自动慷慨地产出丰盛又足量的果实。他们和平轻松地生活在富有的土地上,羊群随处可见,诸神眷爱着他们。[9]

    然后是第二代种族,“用白银打造的,到目前为止还不那么高贵”。他们仍然受到祝福,但他们犯了罪而且没有向神献祭。随后是第三代种族,他们的盔甲、房屋和工具都是由青铜打造的。出于某种原因,诸神给了第四代种族比第三代种族更好的平局:一半死于战斗,另一半以半神的身份生活。赫西俄德的第五代种族是“一个铁族,人们白天不停地感到劳累和悲伤,夜晚接二连三地死去,诸神给他们设置了很多麻烦”。赫西俄德预言,他们的孩子会更差——唯利是图,口出恶言,最糟糕的是,他们不愿意赡养年迈的父母。[10]生活确实是孤独、贫穷、肮脏、野蛮和短暂的——赫西俄德的描述比托马斯·霍布斯在《利维坦》中的描述早了2000多年。

    赫西俄德时代的苦难生活尽管凄凉,但至少是当地土地和文化的固有特征——土地的贫瘠、人的贪婪和邻近城邦的侵略。但毕竟,敌对邻邦的人和他们有着相同的宗教和文化,尽管战胜方经常奴役战败的邻居,但在伯罗奔尼撒战争[11]之前,通常不会取战败方的性命。

    犹太人是怎样来到圣地定居的,这仍然是一个谜,因为历史学家质疑摩西和《出埃及记》的真实性。毋庸置疑的是,后来以色列人征服了迦南人,比征服随后凶猛的“海上民族”更容易。迦南人是巴勒斯坦地区文化上更先进但侵略性更弱的原住民,而“海上民族”是一个神秘的种族,不仅侵犯了埃及,可能还消灭了包括迈锡尼在内的几个地中海西岸文明。在所谓的“犹太人逃离埃及”后不久,当地的“海上民族”——非利士人在现代加沙地带和特拉维夫之间建立了一个滩头阵地,并开始向内陆推进。

    非利士人的威胁促进了以色列各个部落的联合。扫罗最终被选为以色列的领袖,并开启了希伯来人联盟的时期。扫罗曾经是非利士人的雇佣兵,他击败了以前的雇主。公元前1000年之后,扫罗的副官大卫在扫罗死后接替了他的职位。大卫也曾是非利士人的雇佣兵,是一位更具军事天赋和魅力的领袖,在他的领导下,他们不仅占领了北部的以色列地区和南部的犹大地区,还占领了一座由迦南人控制的、设有重防的城镇耶路撒冷,其作为大卫的私人领地。

    大卫领导下的犹太人地理版图达到最大,向北延伸到大马士革。但我们今天所说的“大卫王国”并不是一个统一的国家,而是由三个独立的部分组成的:犹大王国、以色列王国和耶路撒冷。其中犹大王国和以色列王国具有独立的王权(见图1-1),由大卫分别占有,而耶路撒冷是大卫的私人财产。

    图1-1 大卫王国的犹大王国和以色列王国

    注:书中地图系原文插附地图。

    他的儿子所罗门统一了这个联盟。所罗门像一名雄心勃勃的建筑师,他修建了一系列宫殿、堡垒和朝圣场所,其中最著名的是耶路撒冷第一圣殿。他还积极开展婚姻外交:娶了一位法老的女儿为妻,根据《列王纪上》[12],他至少拥有700个妻子和300个妃嫔。他在美吉多[13]建立的一个堡垒后来因其希腊名称而更为人所知:哈米吉多顿[14]

    所罗门的建筑计划不仅耗费巨资,而且需要众多的劳役,使民生怨愤。公元前931年,所罗门去世,他的儿子罗波安拒绝北上到以色列首都示剑城参加加冕典礼,至此以色列王国退出联邦[15][16]

    当亚述人成为强大的“军事机器”时,南北分裂对犹太人的独立是致命的。公元前9世纪,北方的以色列王国开始向亚述人进贡。公元前745年,提格拉·帕拉萨三世夺取了亚述王位,他挥师西进开始分割以色列王国。公元前721年,他的继任者撒缦以色五世和萨尔贡二世(又译撒珥根二世)征服了以色列王国,萨尔贡二世的史册记录:“我带走了住在这里的27290人,并挑选了50辆战车给我的皇家军队……我修复了那座城市,使它比以前更加伟大;把被我手征服的土地上的人,迁到这里住。”[17]

    萨尔贡将以色列王国中的精英们(包括贵族、富豪、能工巧匠等)驱逐到底格里斯河和幼发拉底河沿岸;他们逐渐消失在历史的迷雾中,很可能是同化融合到当地的美索不达米亚人中了,从而出现了10个“消失的部落”。亚述人随后将目光转向了南部的犹大王国,并在公元前701年发动了一次进攻,但失败了。此后一个世纪,不知何故,亚述人没有再进犯犹大国,也许是想把该地区作为他们和埃及人之间的缓冲区。这拯救了犹大国和犹太人民,使他们免遭北部以色列王国那样湮灭消失的厄运。

    公元前605年左右,亚述被巴比伦人攻陷,犹太人面临着一股更可怕的征服力量。公元前597年,尼布甲尼撒二世带领巴比伦人攻占了耶路撒冷。据《列王纪下》记载:

    ……犹大王约雅斤和他母亲、臣仆、首领、太监一同出城,投降巴比伦王,巴比伦王便拿住他。那时,是巴比伦王第八年。

    巴比伦王将耶和华殿和王宫里的宝物都拿去了,将以色列王所罗门所造耶和华殿里的金器都毁坏了,正如耶和华所说的。

    又将耶路撒冷的众民和众首领,并所有大能的勇士共一万人,连一切木匠、铁匠都掳了去。除了国中极贫穷的人以外,没有剩下的。[18]

    更可怕的事情还在后面。大约公元前587年,巴比伦人在犹大国扶持的傀儡西底家反叛,作为回应,巴比伦人攻破耶路撒冷的城墙,蜂拥而入。国王逃跑,但在杰里科附近被捉,巴比伦人“在西底家眼前杀了他的众子,然后剜了他的眼睛,用铜镣铐把他绑起来,将他掳到巴比伦去”[19]

    鉴于北方邻国“消失”的经历,犹地亚人[20]非常清楚,尼布甲尼撒二世正以灭绝的方式威胁着他们的文化甚至是生存,因此他们寻找一种极端的解决方式:一场奇迹般的大灾难,将他们从即将被湮灭中解救出来。——这是同时期的希腊诗人赫西俄德所不需要的,因为他的文化并没有受到这种被灭亡的威胁。

    公元前597年,与约雅斤一起被虏到幼发拉底河沿岸的流亡者中,有一位受过圣殿教育的祭司,名叫以西结。《以西结书》是他本人或他人以他的名义写的,书中记录的内容开始于五年后,也就是公元前592年。随着天堂的幻象向他打开,一辆载着上帝的战车出现了,这辆战车有四个幻影般的有翅膀的活物,每个活物都有四张脸:人脸、狮脸、牛脸和鹰脸。

    《以西结书》是《圣经》中第一本重要的末日启示类书籍,不管它的作者是谁[21],写作时间一定是在圣地环境恶化的那几十年里。正如《列王纪下》中所描述的,巴比伦人放逐了犹大王国的王室成员、祭司和富人,留下了大量的下层阶级。起初,被虏往巴比伦的这些贵族乐观地认为他们很快就会回到耶路撒冷,但公元前587年,耶路撒冷和第一圣殿被摧毁,这使他们的叙事文学朝着启示末日的方向演变。

    《以西结书》的作者讲述的故事从被征服的原因(即犹大的不敬),转向上帝的回归和犹太国家的重建。他转向了一个在接下来的几千年中越来越引起共鸣的叙事:人类的堕落,上帝的愤怒,他的回归,以及后来他儿子重建王国,并将不虔诚的人罚入地狱。

    《以西结书》依次包括三个部分:第一,以西结被任命为先知(传达上帝讯息的人);第二,重建大卫王国,并摧毁现实中的敌人,以及摧毁神话中的敌人——可怕的玛各和统治者歌革;第三,新圣殿的辉煌,以及一个复兴并扩大的犹太国家的辉煌。(《圣经》后来的书卷混淆了歌革和玛各,因为两者都可以解释为人或地区。)

    以西结还描述了大卫王国重建之后,以色列人将如何遭受这个神话中的掠夺者的入侵,然后击败他。这是《圣经》中首次实际性地提到歌革这个人物,他最终将演变成《新约》中的反基督者,是现代新教徒启示性末日预言中的主要人物之一。[22]以上三个部分的预言应验过程中包括许多奇妙而可怕的幻象,战胜邪恶力量,以及新世界的荣耀,这些成为随后许多末日叙事的基础。

    《圣经》中的第二本重要的末日启示类书籍是《但以理书》,据说写作时代与《以西结书》相同。它的开篇是征服耶路撒冷,流放巴比伦,以及尼布甲尼撒二世提挈四个聪明的希伯来人沙得拉、米煞、亚伯尼歌和但以理,“国王向他们咨询所有智慧和领悟方面的问题,发现他们比王国里所有术士和占卜师好10倍”[23]

    尼布甲尼撒做了一个几乎记不清楚的梦。他只知道这是一个重大预兆,但不知道其他方面的细节。当宫廷占卜师说他们没有能力把梦的细节和梦的讲解告诉他时,尼布甲尼撒下令,不仅要杀死这些占卜师,还要杀死王国里的所有智者,包括四个希伯来人。

    幸运的是,上帝向但以理展示了国王梦的内容:一个可怕的幽灵,有着金色的头、银色的胸膛和手臂、青铜的腰腹和臀股、铁的腿,以及半铁半泥的脚(因此出现了现代短语“泥足”)。一块石头打碎这个野兽的脚;然后石头变得越来越大,先是变成一座山,然后充满整个天下。[24]

    但以理所描述的野兽的金、银、铜、铁恰好与赫西俄德所讲述的时代相匹配;这可能不是巧合,因为同一时期的波斯文本中也描述过根据这四种金属命名的四个历史时代。[25]

    上帝给但以理讲解了这个梦,但以理将解梦转述给尼布甲尼撒二世:野兽的头是尼布甲尼撒本人,银和铜部分代表未来较小的王国,铁和泥足是一个伟大的联合帝国,但由于铁和泥两种元素不相合,联合帝国很容易破裂。最后,上帝接管了统治权:“当那列王在位的时候,天上的神必另立一国,永不败坏,也不归别国的人,却要打碎灭绝那一切国,这国必存到永远。”[26]

    很多学者根据书中的内容推测,《但以理书》的写作时间并不是巴比伦流亡时期,而是在公元前2世纪。如果这个推测正确的话,那么从尼布甲尼撒二世到这本书的实际写作之间的3个多世纪里,发生了很多事情:居鲁士国王征服了巴比伦人,允许犹太人返回巴勒斯坦地区并建造第二圣殿;但是,公元前332年,巴勒斯坦又被亚历山大占领。在被希腊统治期间,任何一个有文化的犹地亚人[27]都知道叙事中的预言是什么:尼布甲尼撒二世梦中野兽的半铁半泥脚代表了希腊托勒密帝国和塞琉西帝国[28]——亚历山大大帝征服地区的继承国——的衰弱及其最终的毁灭。《但以理书》的作者很可能想让书看起来比实际写得早3个世纪,以增强其预言的可信度。

    希腊人给犹太人带来了另一个生存威胁。公元前167年,位于黎凡特地区的希腊塞琉西帝国统治者安条克四世任命墨涅拉俄斯为犹太大祭司。后者主张对宗教习俗进行彻底改革,其计划包括废除祭祀和摩西律法等。安条克四世还将第二圣殿改造成世俗空间,并用宙斯雕像[29]亵渎它。

    改革派祭司、传统犹太人和安条克之间的冲突逐渐失控;公元前167—前164年,安条克的军队抢劫了圣殿,摧毁了神圣的卷轴,并将任何遵守安息日、割礼和献祭仪式的人处以死刑。他还洗劫了耶路撒冷;杀害、奴役和驱逐成千上万的居民;拆毁了耶路撒冷城墙;在城里驻扎希腊军队。

    这还不是全部:犹太人被要求在圣殿敬拜宙斯雕像,并献祭猪。最终在公元前164年,传统主义者马卡比兄弟领导的起义爆发,他们首先消除了这些可憎的行为,之后建立了一个独立的犹太国家,该国家一直持续到公元前63年被罗马征服。

    《但以理书》的上半部分结束时,男主角(指但以理)被送到狮穴敬拜上帝,并在上帝的保护下奇迹般地幸存下来。在书的后半部分,但以理本人梦见了异象,他自称不理解这些异象,但实际上这些异象只是尼布甲尼撒的梦的一个变体。四头幻影般的野兽依次从海里出来,每一头都比上一头更令人敬畏:一头被拔出翅膀的狮子;一头牙齿间咬着肋骨的熊;一头有四头和四翅的豹子;最后一头挑战动物学分类,“可怕又狰狞”,有着铁牙和铁角,在但以理的注视下,铁牙和铁角的数量不断增加,其中一个角长着眼睛和嘴巴,能说“夸大的话”[30]。上帝出现了,宝座上发出火焰,他征服了第四只野兽。就像尼布甲尼撒的梦一样,这只野兽代表塞琉西帝国。在接下来的居鲁士及其接替者大流士和伯沙撒统治期间[31],但以理又看到了异象,异象以寓言的形式讲述了波斯帝国被亚历山大征服以及波斯帝国的最终解体。这本书的最后一章描述了一个神圣的审判,在这个审判中,死者被复活,一些人享受“永生”,而另一些人在上帝的永久统治下被判“耻辱和永远的蔑视”。[32]

    《圣经》中的第三本末日启示类书籍是《启示录》,95年左右由书中被称为“约翰”的人写作,他是上帝讯息的一个谦卑的接收者。作者很有可能不是当时大约90岁的使徒约翰,而是生活在小亚细亚的帕特莫斯岛上的一名囚犯,是一位更为平庸的先知。这部作品最终被大多数基督教教派编纂成《圣经》的最后一本书。

    大多数现代读者,即使有深厚的宗教背景,也会发现《启示录》是一卷难以理解的、晦涩难懂的书。历史学家R.H.查尔斯说:

    从最早的教会时代开始,人们就普遍承认《启示录》是整套《圣经》中最难读的一卷。不仅略读,即使认真研读,读者也依然会觉得困惑。这从《启示录》的解读史中也可以体现出来。[33]

    《启示录》读起来像是一堆杂乱无章的图像,甚至比《但以理书》中的异象更梦幻。它与《但以理书》的异象有很多相似之处,这可能并非巧合。

    因此,对这本书的解读,需要具备东罗马帝国以及马卡比时期的专业历史知识。查尔斯对这本书进行了细致的文学分析,他认为帕特莫斯岛上的约翰很可能在完成这本书之前就去世了,后人对他未完成的原稿进行了不适当的编辑,造成了这本书的难懂。学识渊博的学者们几乎完全缺乏对该书叙事结构的共识。在过去几个世纪,这种解读困难造成了无穷无尽的伤害和混乱。[34]

    《启示录》由22章组成;前三章是约翰写给罗马帝国东部七教堂的信。接下来两章描述了主的宝座,被24位长老和4只可敬的野兽围绕着;出现了用7个封印封严的书卷,只有犹太大卫国王的后裔才能打开;一只被杀过的七角七眼的羔羊(圣经学者认为羔羊代表耶稣)正符合要求,这只羔羊一个接一个地揭开了封印。

    第六章到第八章描述了接下来会发生什么:前四印打开后出现了四匹颜色分别为白色、红色、黑色和灰色的马,分别象征着战争、国际冲突、饥荒和瘟疫。第五印打开后出现了祭坛下的殉道者,象征着迫害;第六印是地震。接下来是一段插曲,144000名犹太人被“封印”(额上有上帝的印记;12个部落各12000人)。第七印,也是最后一个封印,是由8位天使带来的;前面7位吹号,第8位摧毁世界。

    接下来的三章出现了同样令人困惑的画面:天使们吹响了七个号角,带来类似于七印那样的灾难。中间有个插曲,约翰被一位天使命令吃一本小书,然后天使指示他设计新的耶路撒冷和圣殿。

    书的后半部分描述了一条巨大的红龙,有7个头、7顶王冠和10个角。这条龙被认定为撒旦,他试图吞食一个新生儿,但没有成功。那个新生儿是上帝的儿子,因为寓言中的玛丽即将生下他。[35]

    接着是更多的幻象:第二只7头、10角、戴着10顶王冠的野兽,制造出寻常的混乱;第三只有两个角的复合兽,也在制造混乱;“羔羊”(耶稣)归来,指挥144000名原住犹太人;7个碗(或小瓶,取决于解释版本)倾倒在地上,带来类似于封印和号角的灾难;最后,一个可怕的女性形象,巴比伦的大淫妇出现了,被学者解释为罗马帝国或是耶路撒冷的背叛者。

    在第十九章和第二十章中,一位天使将龙/撒旦抛入火湖1000年,殉道者复活。1000年后,撒旦归来,征募了一支庞大的军队,“人数之多犹如大海之沙”,包括来自玛各的歌革,进行最后的战斗,最后撒旦被永远地扔回火湖。最后的审判将正义者与邪恶者分开,后者将和撒旦一起被封进火湖,连同“死亡与地狱”。最后两章描述了规模宏大的新耶路撒冷城的荣耀,“……12000弗隆[36]。长度、宽度和高度都相等”,并且基督应许说他很快就会回来。[37]

    《启示录》的基本叙事是耶稣回到地球与邪恶做斗争,并最终将邪恶抛入火热的永恒,将正义之人提入天堂,宣判其他人,并毁灭世界。至于确切的细节如何,就只是一个解释方面的问题了。此外,几乎可以肯定的是,它与《旧约》的末日叙事有着共同的起源,特别是与它非常相似的《但以理书》。事实上,《但以理书》和《启示录》的结构和内容并非基督教和犹太教所独有;哲学家、神学历史学家米尔恰·伊利亚德的研究显示,世界各地、不同时期的宗教有许多共同的主题;其中最持久的主题是赦免正义的世界末日之火,他推测这起源于波斯教/琐罗亚斯德教[38][39]

    《启示录》中那些极端的模棱两可的内容,可以有无限的解释。最突出的是,如果人类历史上存在千禧年,那么应该如何理解“1000年”,以及为什么末日发生的时间如此精确。在神学术语中,对这些问题的研究被称为“末日论”:末日时代人类的最终结局。

    模棱两可和难解性更扩大了《启示录》的影响力,因为这为世界何时结束以及与之相关的各种解释性寓言开辟了道路。用宗教历史学家罗伯特·赖特的话说:

    模棱两可、选择性保留和误导性的释义结合在一起,使信徒可以对宗教教义产生重大影响。因为他们只需要巧妙地运用隐喻和寓言,便可抹去文本的字面意思,并用完全不同的东西取代它。而如果原始文本的语义非常清晰,那么无论用什么工具都无法达到这种效果。[40]

    根据2010年的一项国际调查,有35%的现代美国人相信《圣经》代表了上帝的字面意思,同样有35%的人认为耶稣会在他们的有生之年回到地球。[41]我们似乎有理由认为,信仰的回溯时间越久,这种信仰就越普遍。

    从基督教早期开始,神学家们就假定了耶稣回归的三种不同的年表。第一种是教会已经建立了千禧年,耶稣将在千禧年结束时回归。这种时间序列在神学术语上被称为“后千禧年主义”,包括现在或未来的1000年时期,然后是最后审判和耶稣回归。第二种是前千禧年主义,意思是耶稣在千禧年之前回来,然后是最后的审判;换句话说,耶稣回归、最后的审判,以及千禧年本身都在未来。最后一种是所谓的“非千禧年主义”,即千禧年只是一个寓言性的概念,在现实中并不存在。[42]在这三种解释中,前千禧年主义的叙事最引人注目。几乎从《启示录》写完那一刻开始,书中模棱两可的语言以及人类对故事结局的渴望就催生了各种源源不断的前千禧年主义末日故事。

    罗马帝国晚期最著名的基督教神学家,希波的奥古斯丁,抵制住了这种诱惑,发誓不去尝试计算末日时间,“真理之口告诉我们,这件事不是我们应该知道的,因此,我们试图预计并设定这个世界的剩余时间是徒劳的”,更通俗地说,“放松你的手指,让它们休息一下”。[43]之后一段时间里,在教会的末日论立场中,奥古斯丁的这种不干预态度一直占据主导地位,直到约阿希姆的神学继承人登上历史舞台。他们迫不及待地期望末日时代的到来。

    人类在很大程度上是通过叙事来理解世界的,虽然末日预言可能是有史以来最引人注目的,但它的预测屡屡失败。预测研究表明,人类在预测未来方面的能力很差。实际上,只要观察历史上预测事件的正确概率,就会比基于叙事的推理更好地预测未来,而显然,到目前为止,对末日时间预测正确的概率一直是零。

    既然末日预测的准确性为零,为什么我们会被这些叙事影响?更一般地说,为什么基于叙事的推理如此站不住脚?心理学家已经证明,人们是“认知吝啬鬼”[44],他们不愿意进行严格的分析,而是倾向于启发法——一种简单的心理捷径。而一个令人信服的叙事就是最有力的启发法。[45]

    20世纪,神经科学家发现人类有两种不同类型的认知过程:第一种是快速的情绪反应,位于我们大脑深处进化古老的边缘系统,即所谓的“爬虫脑”,第二种是一种缓慢得多的有意识推理,产生于进化上比较新的大脑皮质,位于大脑边缘系统的上方。2000年,心理学家基思·斯坦诺维奇和理查德·韦斯特将这两种大脑系统分别标注为系统1和系统2,自此我们就一直沿用这种最普通的分类方法。[46]

    从进化的角度来看,系统1比系统2更占支配地位是有道理的;数亿年来,早在人类进化出系统2之前,快速反应的系统1就驱动着动物们对危险信号做出行为反应,例如蛇的嘶嘶声或捕食性动物的脚步声。而反应速度较慢的系统2,可能进化时间还不到十万年,因此只能在更古老的系统1的束缚下运作。更简单地说,我们更快的情感机器引领着我们,而我们较慢的“理性”跟随着我们。在自然界中,系统1的优势是显而易见的,它使我们甚至能够在危险的感官信息进入意识之前就做出反应;但在一个相对安全、危险持续时间更长的后工业世界,系统1的优势往往会带来巨大的成本。

    因此,我们越多地依赖叙事,越少地依赖硬数据,就越远离现实世界。你是否曾在一本小说中深深迷失自己,以至于忘记了周围的世界?你有没有听过一个令人着迷的电台广播,以至于你停在车道上10分钟,这样就不会错过结尾?在心理学界,这被称为“运送”。心理学家理查德·格里格将叙事定义为一种装置,其可以暂时在精神上将听众或读者从他们周围的环境中“运送”出去;当“运送”结束时,他们会回到原来的环境中,但此时环境在“运送时有所改变”。[47]

    换句话说,一部小说或非小说、电影、舞台表演或绘画作品能够暂时将读者、观众或听众从现实世界中“运送”出去,当他们回来时,现实世界已经有了一点儿改变。正如艾米莉·狄金森[48]所说:

    没有一艘战舰能像一本书一样,

    带着我们在天地之外翱翔,

    也没有任何一匹骏马能像一页诗篇欢腾奔跳。

    最贫穷的人也能从这里通过,

    没有强迫缴费,

    这是多么廉价的马车,

    它承载着人类的全部灵魂。[49]

    在过去几十年里,研究人员已经证明,人们所掌握的事实很容易受到虚构数据的侵蚀,即使这些数据被清楚地标记为虚构。保罗·罗津和他的同事在宾夕法尼亚大学进行了一项经典实验,他们向受试者展示了两个新买的、相同的玻璃瓶,里面装有蔗糖,并且告诉受试者,这两个瓶子都是首次使用;然后向受试者展示了这两个瓶子上贴的新标签,一个写着“蔗糖”,另一个写着“氰化物”;他们坚定地告诉受试者:“记住,两个瓶子里装的都是糖。”

    然后,他们将两个瓶子里的糖分别搅拌到一些盛水的杯子里;要求受试者说出想从每种杯子中喝多少水,然后受试者从两种杯子里分别喝一小口水。最终50名受试者中的41人选择的是那些蔗糖来自标有“蔗糖”的玻璃瓶的杯子。即使让受试者自己贴上标签,实验效果仍然存在。[50]

    这项研究以及其他类似的研究表明,人类无法将虚构世界和真实世界分开,换句话说,他们无法在文学世界和现实世界之间进行清晰的“切换”。1975年,电影《大白鲨》上映。《时代》杂志报道了那个夏天:

    从前那些勇敢的游泳者,现在只敢挤在离岸几码[51]处游泳,被太阳几乎晒晕的他们紧张地踌躇在水边,出现一点点背鳍靠近海滩的迹象就会让他们很紧张。在加利福尼亚州圣莫尼卡市的冲浪场上,一个孩子对另一个孩子喊道:“你想被吃掉吗?”即使是一条卑微的被称为“海洋猎犬”的狗鲨,由于它是鲨鱼,也被怀疑有杀人意图。“杀了它,杀了它,”一位纽约长岛垂钓者对他的同伴说,“在它长大杀死我们所有人之前,”而他同伴的钓竿上挂着一条仅仅两英尺[52]长、几乎没有牙齿的鱼。[53]

    这种效果是故意的:电影制片人故意将影片上映时间推迟到夏季。正如其中一个制片人所说:“一个游泳者,如果他看过或听说过这部电影,那么当他把脚趾伸进海里时,一定会联想到一条大白鲨。”[54]

    20世纪70年代,心理学家克莱顿·刘易斯和约翰·安德森研究了可识别的错误描述对核对确凿事实的影响。在一个简单的例子中,受试者被告知了一些历史上关于乔治·华盛顿的真实描述,他是美国第一任总统,他横渡了特拉华河,他戴着假发。再把一些虚假描述提供给受试者,诸如华盛顿是《汤姆·索亚历险记》的作者,他至今仍活着,等等。这时,受试者核对真实描述所需要的时间更长,而且每增加一个虚假描述,受试者核对时所犯的错误就越多。[55]

    格里格也进行了一些细致而又专业的实验,他的实验表明,小说内容越遵循历史事实,读者接下来就越难将虚构叙事和真实事件区分开。他举的其中一个例子是《夏洛克·福尔摩斯之谜》,这本书中的历史和地理背景通常是真实的。虽然作者阿瑟·柯南·道尔的读者一开始能清晰区分虚构的19世纪伦敦与真实历史上的伦敦,但格里格发现,道尔对19世纪伦敦的描绘是如此逼真,以至于其虚构部分也侵入读者对于这个现实城市的心理图像中。[56]

    换句话说,文学作品、电影和艺术可以使人们难以区分事实和虚构。正如格里格所说:“沉浸在叙事文学中,会导致与事实和现实世界的隔离。”[57]

    其他研究人员进一步发现,引人入胜的虚构叙事能够侵蚀人类的分析过程。俄亥俄州立大学的两位心理学家,梅拉妮·格林和蒂莫西·布罗克,扩展了格里格的研究。他们通过观察首次发现,叙事很明显比辞藻华丽的争辩更能引起公众关注:

    小说、电影、肥皂剧、音乐歌词,以及报纸、杂志、电视和广播中的故事远比广告、布道、社论、广告牌等更能引起人们的注意。叙事改变信仰的力量从来没有被怀疑过,也一直令人恐惧。[58]

    格林和布罗克根据以下几个指标对“运送”进行了量化:读者构思叙事场景并将自身置于其中的能力、心理和情感的参与程度、对相关叙事的感知、想要知道结局的渴望,以及“叙事中的事件改变了我的生活”的感觉,这些能提高“运送分数”。反之,意识到正在发生的事情,注意力的分散,以及叙事随后被遗忘的容易程度,将降低“运送分数”。

    他们让受试者阅读了一个令人伤心的真实故事,故事里一个名叫凯蒂的小女孩被精神病患者刺死。他们将这个“商场刺杀案”故事以两种形式分别呈现给受试者。第一种是两栏的“非虚构”版本,小字体,看起来像报纸上的报道;第二种是类似于文学杂志的“虚构”版本,以粗体警示文字为标题,“商场刺杀事件是一个短篇故事,发表在1993年12月俄亥俄州小说杂志《阿克伦最佳小说》的专题上,其中与真实人物和地点的相似性当然只是巧合。”

    然后,根据上面讨论的“运送分数”,格林和布罗克将受试者分成两组,低分组和高分组,并询问他们对故事的看法。实验结果是,高分组受试者比低分组受试者更有可能同情故事中的小女孩凯蒂,并认为世界是不公正的,那种商场袭击是常见的,以及精神病患者的自由应该受到限制。值得注意的是,明确地将这个故事标记为虚构并没有减少故事对受试者态度的影响:对于非虚构和虚构两种形式,“运送”影响是相同的。

    接下来,他们要求受试者对一些文本内容进行初步分析,例如,识别有关“匹诺曹”以及有关“四年级练习题”的文本。在测试中,他们要求受试者圈出那些不符合“匹诺曹”内容的文本,或圈出那些四年级学生不理解的单词和短语。结果同样引人注目:两种情况下,高分组识别的内容比低分组的一半还要少。这些实验结果与假设一致,用作者的话来说,“被‘运送’的个体更少地倾向于怀疑、质疑或不信任。‘运送’使人更加倾向于将信息识别为真实。”[59]换句话说,高度的叙事性运送损害了一个人的关键能力。

    格林和布罗克注意到,将叙事明确标注为真实或虚构,对它们“运送”读者的程度没有影响,他们评论道:

    一旦读者开始阅读一篇引人入胜的叙事,那么叙事来源(真实或者虚构)的影响力就会减弱。这样一来,不管故事是不是真实的,读者都可能会采纳故事所体现的信仰。因此,当信息的来源可信度较低或者演讲者缺乏有力论据的时候,叙事的这种优势都可以被利用。[60]

    因此,读者或听众越深入了解一个故事,他们就越会停止怀疑,也就越不关注故事的真实性或虚构性。虽然反向因果关系可能是分析能力较低的人更容易被“运送”,但“运送”会减弱分析能力这个逻辑更有意义,而且叙事越有说服力,其读者就越忘乎所以。

    换句话说,一个好故事通常能胜过最铁的事实。2015年9月16日的共和党初选辩论就是一个很好的例子。当被问及疫苗的安全性时,参选者之一、著名神经外科医生本·卡森简要总结了大量存在的数据,证明疫苗接种与孤独症之间缺乏相关性。而唐纳德·特朗普却回应说“孤独症已经成为一种流行病”,然后讲述了一个被他称为“漂亮的孩子”的雇员接种疫苗后患上孤独症的故事。大多数旁听者在这次辩论中支持特朗普;一位记者写道:“特朗普知道他在做什么,因为他讲的故事比仅仅陈述事实更具感染力和说服力。”[61]如果你想说服某人,就用叙事的方式以其大脑系统1为攻击目标,而不是用事实和数据以大脑系统2为攻击目标。

    音乐比叙事更能刺激系统1。听觉信息通过内耳的毛细胞传递到听神经,然后从下脑干传递到上脑干,再从上脑干传递到丘脑,丘脑将有关声音的信息发送给系统1和系统2(见图1-2)。

    图1-2 听觉信息至系统1和系统2的传递示意图

    一对丘脑位于脑干顶部;它们被认为是大脑接收来自下面的感官信息的主要中继站。丘脑直接与系统1相连,特别是伏隔核和杏仁核,它们分别介导愉悦和厌恶。[62]丘脑还向系统2的听觉部分发送声音信息,这些听觉部分包括一部分被称为赫氏回(也称颞横回)的大脑颞叶,及其以外的大脑皮质联合区,它们负责解释声音并使我们有意识地感受到声音。关键在于,听觉与系统2的连接更为间接,因此与系统1相比连接更慢。

    从丘脑到系统1的传导更直接,这意味着,一首令人兴奋的曲调通过系统2到达我们的意识之前,它可以先通过激活伏隔核使我们产生快感;相反,当我们听到电影中的反派或英雄即将到来的厄运所伴随的黑暗小调时,我们的杏仁核几乎立刻燃烧起来。

    因此,音乐可以看作通往人类情绪的一条进化久远的高速公路。由于音乐可以如此有效地绕过我们的系统2而直接作用于系统1,它的说服力自古以来就得到了充分的体现:旋律很可能在句法上早于复杂的人类语言,母亲们会自发地为婴儿唱歌,世界各地几乎所有的宗教仪式和爱国事件都涉及音乐。

    乔治·奥威尔描述了当猪少校用一首《英格兰牲畜之歌》劝诫其追随者反抗农场主琼斯时,音乐对动物农场中的非理性动物的吸引力:

    唱这首歌使动物们激动不已。少校还没唱完,它们就开始自己唱了。即使是最愚笨的动物也已经学会了曲调和一些单词,至于聪明的动物,比如猪和狗,它们在几分钟内就把整首歌记下来了。几次试唱之后,整个农场惊人地爆发出《英格兰牲畜之歌》。牛哞哞地唱,狗哀叫着唱,羊咩咩地唱,马呜呜地唱,鸭子嘎嘎地唱。它们非常喜欢这首歌,连续唱了5遍,如果没有被打断,那么它们可能整晚都在唱。[63][64]

    现实世界中,也许最著名的具有音乐说服力的例子就是莱尼·里芬斯塔尔执导的纪录片《意志的胜利》,影片记录了1934年的纽伦堡国社党代表大会。这部电影巧妙地将理查德·瓦格纳和纳粹作曲家赫伯特·温特的音乐编排到电影中,除了希特勒和其他纳粹领导人的演讲片段外,没有任何其他口头叙述。《意志的胜利》给好莱坞电影制作人留下了深刻的印象。后来,当美国加入二战时,弗兰克·卡普拉在拍摄《我们为何而战》系列电影时进行了模仿。

    到20世纪80年代中期,音乐开始成为一种政治工具。当时美国的政治竞选广告中开始频繁采用旋律:广告中出现候选人时就在主调上采用欢快振奋的曲调,而出现竞争对手时就采用不祥的黑暗小调(或偶尔采用马戏团小丑即兴表演所用的小调)。

    这类题材的经典之作是2004年乔治·W.布什命名为《狼》的总统竞选广告,伴随着黑暗和沉思的音乐,视频中一群狼蜷缩在草地上,一段旁白开始指责国会民主党人在一个危险的世界里反恐行动不力。音乐学家和传播学学者保罗·克里斯蒂安森评论道:

    虽然图像和旁白增添了广告意义,但它们只是音乐的侍女,音乐传达了大部分情感。这不是普通的音乐,是一种人们在恐怖电影里可以找到的音乐:低沉的嗡嗡声、原始鼓声、刺耳的不和谐和弦声、奇怪的音色,以及别的。[65]

    末日叙事引人入胜的另一个原因是,人类热衷于悲剧。路肩上多辆救护车聚集在一辆被撞得变形的汽车周围,这会引起围观并影响交通;而同样位置上一辆完好的废弃汽车则不会。“数十名矿工在爆炸中丧生”这样的标题会使报纸畅销,而“情况逐渐好转”这样的标题则不会。正如托尔斯泰在《安娜·卡列尼娜》的开头所说,“所有幸福的家庭都是相似的,而每个不幸的家庭则各有各的不幸”[66],很少有小说是通过描写幸福的婚姻和和睦的兄弟姐妹而成功的。

    人类更多地关注坏消息,而不是好消息。这似乎是人性的一个明显特征,因此心理学家们进行了很多实验,以验证我们对悲剧和厄运的关注。在一项研究中,受试者对一场足球比赛下注,一周后返回,结清赌注并与研究人员一起回顾比赛。那些输了赌注的人比赢了赌注的人讨论比赛时所花费的时间要长得多。[67]人类对坏消息的关注如此普遍,以至于“坏消息比好消息强大”已成为实验心理学的基本准则之一;从进化的角度,关注负面结果会使人类更加关注环境风险,从而带来遗传优势。[68]

    和许多生物进化所驱动的心理现象一样,坏消息更加受到关注,这证明了数字时代的功能失调。例如,一项研究发现,那些恐怖、耸人听闻的假新闻报道被转发的可能性比真实新闻高70%。研究人员指出,Bots(自动运行木马病毒)并没有加速虚假新闻的传播,而操作键盘和手机的人类却做到了。YouTube(视频共享网站)上的“三度亚历克斯·琼斯”现象已经成为媒体学者们之间的一个冷笑话:只需点击三下,就可以将一个更换割草机火花塞的视频,切换成琼斯先生愤怒地诉说桑迪·胡克学校大屠杀是一场“恶作剧”的视频。[69]

    鉴于负面新闻对人类的吸引力,《启示录》能够具有持久的影响力也就不足为奇了。

    菲奥雷的约阿希姆是最早构建末日之路的基督教神学家之一。他于1135年出生在意大利的脚趾地区卡拉布里亚[70],和他的父亲一样,接受过教育并担任公证人。之后,他在快30岁的时候去圣地朝圣,在那里经历了神灵启示。从圣地回到西西里岛后,他作为隐士在埃特纳火山上生活了一阵子,然后重新穿越墨西拿海峡,在卡拉布里亚地区做了一名漫游布道士。有段时间,他静下心来研究《圣经》,并在科拉佐的一所本笃会[71]修道院担任职位。他一定是个政治老手,因为他得到了教皇路爵三世[72]的鼓励和支持,成为修道院的院长,并成功地将修道院转为西多会。[73]随后,他与另外两位教皇进行了商谈,并获得了他们在思想体系上的认可。

    他被数字迷住了,尤其是7和12:圣奥古斯丁的七国时期,创世的7天,以及《启示录》里的7个封印和7个碗;以色列的十二使徒和十二部落。更妙的是,12可以分为7和5,代表小亚细亚的7个教会和5种感官。他认为,如此强大的数字命理学无疑可以应用于《圣经》解读,不仅可以用来揭示历史或伦理,还可以用来预测未来。

    他也喜欢数字3。他认为,圣三位一体[74]是关键:它将历史分为三个时代:圣父时代,从亚伯拉罕到基督诞生;圣子时代,从基督诞生到约阿希姆时代;最后一个是包括了现在和未来的圣灵时代,这个时代将由一位手持宝剑的天使引领。

    偏好数学的约阿希姆还将经文组织成几何图式,他在图式中将历史排列成各种形状,其中包括与历史“侧枝”相连的圆圈和树木。他在《图像书》(Book of Figures)中对此进行了描述。[75]

    现代读者可能会嘲笑这种不科学的数字命理——也就是数学家埃里克·坦普尔·贝尔所称的“数秘主义”——但中世纪的神学家有一个借口:希腊数学家毕达哥拉斯就是从纯数学中推导出自然界的规律的,其卓越成就在几千年的历史中熠熠生辉,他应该说过“万物皆数字”这样一句话。在弗朗西斯·培根提出以观察为基础的科学方法之前,数字在自然哲学中占据着重要地位,不仅在科学中是这样,在神学中也是。[76]

    用心理学术语来说,我们都是寻求“模式”的灵长类动物。这并不是一个新概念:1620年左右,培根观察到人类“具有自己的本性,倾向于假设世界上存在更多的秩序和规律”[77]。也就是说,我们天生就想寻找各种往往不存在的关联。这种倾向被科学作家迈克尔·舍默称为“模式化”。约阿希姆富有幻想的数字图式就符合人类的这一倾向。[78]

    人类为什么倾向于幻觉模式呢?进化论中的物竞天择提供了现成的解释。在遥远的人类历史中,如果人类错过了危险来临的线索,例如模糊的嘶嘶声或周边视线中黄黑色相间的条纹动物,付出的代价就会非常高昂,而如果出现幻觉,到处都听到蛇或看到老虎,那么人类也需要付出一定的代价,但这种代价与被蛇咬死或被老虎吃掉的代价相比并不高。因此,不仅在人类身上,而且在任何具有正常神经系统的生物体上,进化论都支持过度解释数据。[79]

    《圣经》的内容很多,大概有783000个单词,标准印刷版有2000多页,描述了无数的参与者及其活动事件,为那些寻求模式和关联的人提供了一个宝库,特别是偏爱数学的约阿希姆,他的历史图式结束在欢乐、自由和丰富的第三时代(即圣灵时代),在这个时代,所有信徒都可以直接获得上帝的真理,而不需要以教会为媒介,这种幸福状态将一直持续到最后的审判。[80]

    约阿希姆不会用上帝的信息煽动群众,因此他并不是一个革命性的或号召性的先知,而是一个令人困惑的圣经解释者。他认为第三时代(圣灵时代)中具有完善的人性和原始共产主义,能够战胜人类的一切恶习,特别是拥有物质财富的欲望,但他不愿意提供有关第三时代的细节信息。他的预言显得有些笼统:“每个人都将以这样一种方式被给予:别人所得会比自己所得更令他高兴;比起自己所拥有的,他更在意自己能够给予别人什么”[81]。约阿希姆描述的景象会在地球上逐渐显现,中间不需要插入《启示录》中可怕的异象,因此三任教皇都支持他。约阿希姆认为未来的第三时代最终将修正当前第二时代的缺陷,但是,受第二时代封建社会压迫的群众没有约阿希姆那样的耐心。他们想要采取更积极主动的方式推动第三时代的早日到来。

    约阿希姆的数学既具有公众吸引力,又能够运用于各种圣经派别和数秘主义,因此能够以这样或那样的形式一直持续到今天。例如,在他的继承者中,新近崛起了一个方济各会的属灵派,其被日益成功的教会物质主义排斥。对他们来说,数学很简单:《马太福音》1:17[82]清楚地指出,亚伯拉罕和大卫之间隔了14代人,大卫和巴比伦囚禁之间隔了14代人,巴比伦囚禁与基督诞生之间隔了14代人。因此,第一时代持续了42代,每代持续30年,总共1260年。当前的第二时代同样持续1260年,因此将在公元1260年结束,那时将开始出现持续1000多年的第三时代。

    随着中世纪的发展,衰落的封建主义、逐渐兴起的贸易和货币经济带来了经济的增长,但经济增长又导致了极端的收入不平等。这时产生了大量恶毒的反犹主义末日叙事,其中一个就是与马丁·路德[83]的宗教异端几乎同时出现的德语版本《百章全书》(The Book of a Hundred Chapters)。

    这本书的开始是天使长米迦勒向匿名作者转达来自上帝的讯息:人类激怒了全能者[84],他即将带来可怕的毁灭,但他决定暂缓;上帝希望作者聚集信徒,等待“黑森林皇帝”的到来;“黑森林皇帝”将带来血腥的启示录式的末日时代,以及丰富的食物和酒。信徒大部分来自受苦受难的穷人,他们参与了一系列广泛的谋杀,尤其对贵族和神职人员。这本书的弥赛亚并没有容忍,而是规定在4年半的时间里每天要谋杀2300名神职人员。[85]

    教会的腐败早就引起了人们的厌恶:早在马丁·路德和约阿希姆之前,神职人员,尤其是教皇的肆意挥霍和肉欲之罪早已震惊了基督教世界。路德只是在正确的时间、正确的地点成了正确的人。谷登堡大约在70年前发明的印刷机,将复印小册子或书籍的成本降低至原来的约1/30,而维滕贝格[86]的印刷机处于新技术的前沿,不仅可以打印拉丁字母,还可以打印希腊和希伯来字母。

    路德需要贵族支持他的宗教改革,因此他将宗教分歧严格限制在神学上而避开政治。这位伟大的改革者从《罗马书》和《彼得前书》中得到忠告,恺撒的法律仍然必须遵守:“看在主的分儿上,你们要服从人类的每一条法律。”[87]

    虽然路德反对那些寻求社会改革的人,但那些人确实运用了路德的方法。路德不仅摧毁了教会对《圣经》解释权的强大垄断,而且还向所有人展示了印刷机的强大力量。当被质疑布道很少的时候,他回答:“我们用我们的(印刷)书来做(布道)。”[88]

    16世纪初,歉收的庄稼、贪婪的贵族和狂热的路德教徒共同点燃了血腥的民众起义。据说,1523年6月23日,在路德将他的《九十五条论纲》钉在维滕贝格城堡教堂的门上6年后,在德国施瓦本地区,位于现代瑞士中部的北方,女伯爵卢芬斯特林根命令1200名农民为她收集蜗牛壳,她可能有大量的线需要蜗牛壳做线轴。而这时农民正忙于农收,女伯爵为了蜗牛壳而进行的逼迫激怒了他们,引发了一场席卷欧洲大部分德语区、持续两年的农民起义。[89]

    1524—1525年,农民军队与当地贵族的雇佣兵展开了一系列战争,其统称为德意志农民战争(俗称蜗牛战争),这些缺乏训练和武器的农民叛军遭到大规模屠杀,最终大约有10万农民被杀戮。

    在整个起义过程中,德意志农民叛军主要关注的是社会问题而非宗教问题,而这场起义的血腥结局却与宗教有关,主要发起者是一位名叫托马斯·闵采尔的千禧年传教士以及被他迷惑的疯狂的追随者。

    1525年3月,叛军在施瓦本的梅明根镇上集会,提出了12条要求,也就是《十二条款》,并印刷了至少2.5万份副本。只有第一条要求是明显关于神学的:每个城市都可以选出自己的传教士,他们将“简单地宣讲福音”,这大概是为了排除拉丁天主教的弥撒仪式。接下来的十条要求更是关于经济而非宗教的:包括如何支付传教士的报酬,废除农奴制,降低地租,狩猎和捕鱼的权利,以及归还最近私有化的公共土地等。最后一条要求谦恭地指出,如果上述十一条要求中的任何一条后来被证明与圣经背道而驰,那么它们都是无效的。[90]

    但是,起义后期,闵采尔成了农民军领导人。闵采尔至少阅读并解释过约阿希姆的一篇著作,但人们对他的出身知之甚少。最可接受的猜测是,他生于德意志亚琛城外的施托尔贝格镇,其位于现代比利时、德国和荷兰的交会地带;他是工匠家庭出身,教育背景也很模糊,几乎没有留下学业记录,有人说他父亲就死在一个腐败贵族的绞刑架上,因此他具有反独裁的末日倾向。唯一可以确认的信息是他大约于1514年被任命为农民军领导人,虽然这种任命不需要大学教育背景,但他的文笔表明他接受过先进的学业教育。

    三年后,路德的宗教改革运动在维滕贝格爆发,闵采尔前往那里,在革命的激情中畅饮。他可能见过路德,甚至在他的讲坛上讲过道;他当然遇到过路德的杰出同事菲利普·梅兰希顿。起初,闵采尔与路德派并肩作战,对抗教皇的支持者;1520年,路德推荐他接替约翰内斯·西尔维于斯·伊格拉努斯做茨维考的传教士。当时伊格拉努斯要去进修,和鹿特丹的伊拉斯谟等人文主义学者一起学习。

    在茨维考,闵采尔充分表现出他在神学上偏执的冲动和对建立“千年王国”的狂热。和路德一样,他将天主教神父和修道士称为“庞大的怪物”和“撕裂肉体的女妖”,并开始鼓吹,通过与上帝直接沟通也可以实现救赎,而与圣经无关。[91]这种说法对路德和伊格拉努斯来说都太过分了。伊格拉努斯当时已返回茨维考,并将闵采尔降职到该镇一个较小的教堂。在那里,闵采尔可能受到了茨维考“先知”的影响,这些先知分享给他一些神秘的信仰,包括理想的重要性,以及救赎与圣经的无关性。

    闵采尔进行了煽动性的布道并分发小册子,这导致他被驱逐,先是从茨维考被驱逐,然后是从布拉格和其他多个城市;最后,他落脚在萨克森人居住的阿尔施泰特镇上。在被驱逐的路上,他发展了自己的天启末日主题。1524年,他对萨克森州的约翰公爵进行了一次著名的布道,其主要围绕《但以理书》中的尼布甲尼撒之梦;公爵不可能不理解这个典故,但是他回应说,罗马教堂和那些支持它的贵族已经取代了但以理的希腊塞琉西帝国;闵采尔更加清楚地向公爵指出,有理想的先知们,通常是那些没有受过正规宗教教育的平教徒[92],但是他们在解释《圣经》方面起到了主要作用,他们现在都生活在末日前最后的日子中。最令人震惊的是,闵采尔宣称自己是新的但以理,他的追随者是“被选者”,他们理解末日的紧迫性,他们的出现不仅是为了观察,而且是为了积极实现它。

    闵采尔布道后,公爵愤而不发地离去。闵采尔继续出版了更多的反教权主义小册子,这进一步恶化了他和公爵之间脆弱的关系。最终,公爵受够了,他强制关闭了闵采尔的印刷机,并将闵采尔传唤到他在魏玛的城堡里,使其接受审讯。由于担心自己会被杀,闵采尔离开了阿尔施泰特镇,又在几个动荡的地方逗留后,他成为农民战争的高潮——弗兰肯豪森战役——的叛军领导人之一。

    至此,闵采尔已经说服了自己以及许多追随者,他们相信上帝让闵采尔开启末日。他不仅用自己的“千年王国”理想来说服民众,还引用了多段圣经经文来支持自己。他似乎对《马太福音》第24章印象深刻,这一章讲述了耶稣预言圣殿将被摧毁,随后发生饥荒、瘟疫、战争、地震等全球性灾难。上帝还用基甸之剑武装闵采尔,让他和他的军队战胜处于优势地位的贵族军队,据一位观察者说,他“用他的外套袖子抓住了敌人的所有子弹”[93]

    受此鼓励,1525年5月14日,农民叛军冲向贵族雇佣军(见图1-3)。但雇佣军仅以6人的伤亡为代价,屠杀了90%的叛军部队,约6000人被杀。[94]闵采尔仓皇逃离战场,但很快被抓获并被带到贵族面前,经过长时间的审讯后,他被斩首。[95]

    图1-3 1525年农民战争的地标

    闵采尔及其追随者的悲惨死亡,只是拉开了这场血腥的世界末日论的序幕而已。在繁荣的波罗的海海上贸易航线上,末日论将在接下来的10年里席卷欧洲西北部。

    2 滥用末日叙事的悲剧

    信徒与无赖

    1534年2月,威斯特法伦州的明斯特城的气氛狂热,居民们报告说,看见天空中出现了三个太阳,这在那个时代很容易被认为与尤利乌斯·恺撒死后出现的预兆相同,预示着将出现像屋大维、马克·安东尼和雷必达那样的后三头同盟[1]

    这一愿景尤其激励了一个被称为再洗礼派的新教教派,该教派反对天主教传统的婴儿洗礼做法,而是对新皈依者施行成年再洗礼。有一位名叫赫尔曼·冯·克森布罗克的天主教徒,他小时候目睹了1534年事件,后来他记录到:“天空似乎张开了嘴,出现长长的裂缝,可怕的火焰从裂缝中闪烁……(农民们)看到这座城市似乎着火了,但当他们赶来调查时,发现火焰不仅没有伤害城市,而且完全消失了。”[2]

    年轻的冯·克森布罗克对街头的疯狂事件感到惊讶,并将再洗礼派描述为:

    ……如此错乱,如此失常,如此被疯狂驱使,他们超越了诗歌中描述的愤怒。他们没廉耻地在市场上跑来跑去,有的头发蓬乱,有的衣服松散,有的头巾在风中飞舞。有些人跳起疯狂的舞蹈,仿佛要在狂躁中飞翔。有些人脸朝下趴在地上,伸出手臂,身体摆成十字架的形状……有些人躺在松软的泥浆里,一遍又一遍地翻滚。有些人跪下来大声喊叫。有些人睁着闪光的眼睛号叫。有些人口吐白沫。有些人摇头咬牙地做出威胁的表情,有些人捶胸顿足、招摇过市。有人哭,有人笑。从另一个角度看,与其说我们嘲笑他们的疯狂,不如说是为他们而悲伤。[3]

    托马斯·闵采尔短暂、血腥、笨拙的起义后不到10年,约阿希姆的另一批能力更强的子民在明斯特城企图实现他们狂热的末日愿景,这被称为再洗礼派的疯狂。1533—1535年,他们一度控制了市政当局,后来又在后者的最后攻击下失败。

    德意志农民战争惨败之后,群体疯狂的中心逐渐向北移动,到了今天的德国西部和荷兰所在地(见图2-1)。几十年来,这个地区在汉萨同盟[4]的推动下出现日益繁荣的局面。汉萨同盟是一个松散的贸易联盟,沿波罗的海和北海延伸,大致从今天的爱沙尼亚共和国到比利时的佛兰德。上一章所提到的德意志农民战争主要源于对社会的不满,但这一场德国和荷兰的民间叛乱是由一种新的宗教教义——再洗礼主义——所驱动的。

    图2-1 再洗礼派疯狂事件的地标

    8世纪末,查理曼[5]已经占领了明斯特城,该地区位于今荷兰东部、德国埃姆登城南部。他派了一位名叫卢德格尔的传教士去改变该地区的宗教信仰,并强迫当地居民皈依基督教。卢德格尔在当地某处河岸上建造了一座修道院,该城由此得名[6]。随着明斯特在汉萨同盟经济中日益繁荣,该地区富丽堂皇的主教堂和众多的礼拜教堂使城市景象更加繁荣。

    明斯特城基督教会的繁荣是有代价的:用于支持教会的沉重的什一税落在教徒身上,而神职人员却不需要纳税;修道士们耕种土地,修女们在织布机上工作,他们与当地农民和布料生产商产生了竞争。如此贪婪的教会并不是明斯特城所独有的:在整个欧洲,教会行为点燃了宗教冲突和公众愤怒的火焰。[7]

    再洗礼派本身起源于10年前在瑞士苏黎世开展的一系列晦涩难懂的神学讨论。1519年,一位名叫乌尔里希·茨温利[8]的天主教牧师建立了一座改革宗教堂。茨温利参加了一系列由市议会发起的正式教义辩论,被宣布为获胜者。他们在市议会面前辩论的议题之一就是洗礼时间。从逻辑上讲,只有成年人才能按照自己的自由意志行事,才能有意义地服从于基督,《新约》中的福音书也是这样描述的。但是,婴儿洗礼是从3世纪就已经确立了的,到马丁·路德和茨温利时期,几乎已经是一种普遍的、毫无疑问的教会做法。

    茨温利在这次辩论中的反对者之一,一位名叫康拉德·格列伯的商人,反对婴儿洗礼——“洗孩子”,因为这些神学后裔长大后可能会轻视它。辩论之后,格列伯为他的一个朋友乔治·布劳罗克施行了再洗礼,然后他们两人开始为其他成年人施行再洗礼。

    当时,这并没有引起什么。茨温利本人也评论说,他和格列伯之间只有很少的神学时间,只讨论了一些“不重要的周围事件,比如应该对婴儿还是成人进行洗礼,基督徒是否可以担任地方法官”[9]

    但再洗礼派的导火索已经点燃,或者更准确地说,是两条导火索:一条穿过波罗的海和低地国家(今荷兰、比利时,以及莱茵河、埃姆斯河、斯海尔德河和默兹河的河口),另一条穿过明斯特。这两条导火索分别燃烧,直到1534年,在明斯特合并,点燃了历史上最混乱的群体幻想之一。

    梅尔基奥·霍夫曼是一位德国毛皮贸易商,经常来往于汉萨同盟的城市间(可以带来丰厚利润),他点燃了波罗的海和低地国家的导火索。他比路德小10岁,在1523年左右获得维滕贝格大学的教授职称,并在来往行程中传播主张改革的异端教义。几年后,他对《启示录》念念不忘,开始背离路德的教义,宣扬一场即将来临的末日式善恶大战。

    和之前以及之后的启示性末日论者一样,他热衷于应用自造的末日数学。霍夫曼计算出,基督死于33年,使徒时期[10]持续了100年,直到133年。他认为,由于犹太人的罪行,人类受到了三年半的惩罚;由于巴比伦时期的邪恶,惩罚时间增加了20倍;由于教会对耶稣的疏离堕落,惩罚时间又增加了20倍,总共增加了1400年。因此,世界末日将发生在1533年,这一预言在波罗的海的多个贸易城市引发了暴动和混乱,包括吕贝克、斯德哥尔摩和一些丹麦港口。由于制造了这一系列混乱,霍夫曼被逐出这些城市。[11]

    就其性质而言,再洗礼主义是一种有吸引力但组织分散的神学,其信徒仅仅因为相信成人洗礼而被统一。最终,再洗礼派在整个西欧,尤其是汉萨同盟贸易路线上蓬勃兴起。霍夫曼的启示性再洗礼在低地国家取得了最大的成功,尤其是在东弗里西亚最大的城市埃姆登,其位于德国沿海地区,今荷兰边境以东。

    15世纪末,哈布斯堡人接替勃艮第人开始统治低地国家。此时,这些城市已成为欧洲大陆最繁荣的城市。在路德摧毁教会对《圣经》解释的垄断权以及谷登堡发明的印刷机的支持下,当地居民在一种被称为“秘密集会”的小型非官方组织下聚集。这种“秘密集会”是各种宗教派别的温床。

    1530年左右,霍夫曼经过当时宗教改革活动的密集之地——斯特拉斯堡,这座城市是再洗礼派中比较温和的瑞士版本的发源地,他将其嫁接到他的末日信条中。1531年,与《启示录》相呼应,他将斯特拉斯堡定为《启示录》提到的144000名神圣信使聚集的地方,并将在该城战胜邪恶势力的大规模围困。他向斯特拉斯堡市议会请愿建立自己的教堂,但这再一次导致他被驱逐,于是他回到了低地国家,对大量成年人进行再洗礼,仅在埃姆登主教堂的一次就有300人。[12]

    1531年12月,神圣罗马帝国当局——低地国家实际上的统治者,抓获了扬·沃克茨,他是霍夫曼的一个门徒,曾在阿姆斯特丹对50名皈依者施行了再洗礼。他们邀请他逃跑,但他选择了殉道,并与9名追随者一起被斩首。为了保护教徒,霍夫曼把宗派的教义改为禁止成人洗礼。[13]1533年,霍夫曼返回斯特拉斯堡,这很不明智。在那里,教会判定他犯有异端罪,罪行相对次要,并将他囚禁在一些条件恶劣的牢房中。他平静地接受了阴冷的新环境,因为他认为世界末日即将来临,自己不会在那里待太久。但是,这个很乐观的推测被证明是错误的。他在狱中度过了10年,其间,下面街道的市民偶尔会听到他轻轻地吟唱圣歌,并不断重复:“你们斯特拉斯堡的不敬上帝的经书家们有祸了!”[14]

    霍夫曼入狱后,他的追随者,一位名叫扬·马提斯的面包师来到阿姆斯特丹,宣称自己是先知以诺。令信徒们高兴的是,他又开始了成人洗礼。以诺是《旧约》中在生前就被上帝带到天堂的仅有的两个人物之一,另一个是以利亚,而霍夫曼在此之前已经盗用了以利亚的身份。此外,一些再洗礼派成员以《启示录》11:3~11:12的内容作为证据,证明以诺和以利亚是两个未言明的“被提”见证人。随着时间从1533年进入1534年,世界末日并没有到来,低地国家的信徒被迫将末日时间推迟到1535年,并将地点从斯特拉斯堡北移到宗教上更具宽容性的明斯特。

    1534年3月,至少3000名阿姆斯特丹的再洗礼派教徒试图穿越须得海[15]去往明斯特。哈布斯堡军队阻止了他们,并处决了大约100名异教徒,其余的被当作无辜受骗者放走。在那个时代,哈布斯堡军队的这种做法被认为是温和的。第二天,几个“使徒”激动地挥舞着刀,在阿姆斯特丹的街道上游行,警告说最后的审判将会在复活节前到来;他们被抓住并被杀死。那一年,(荷兰)海牙的哈布斯堡当局已经部署了“飞行纵队”,围捕这些低地国家的再洗礼者,对抓捕到的信徒施行酷刑,让他们在认罪和被处决之间做出选择。[16]

    1535年2月的一个寒冷夜晚,一群再洗礼者赤身裸体地跑过阿姆斯特丹高呼:“对神不敬者有祸了!”公开裸体象征着在上帝面前忠贞不渝,在明斯特也很常见。最后,拒绝穿衣服的男人被处死,拒绝穿衣服的女人被淹死。(刀和裸行者在荷兰语中留下了两个新词:zwaardlopers和naaklopers。)

    荷兰的许多其他城市也出现了再洗礼派暴动,这导致了更多的处决。到1535年中,多达20%的阿姆斯特丹人可能经历过成人洗礼,许多受洗礼者(如果不是大部分)都是无辜的局外人,他们是不断升级的镇压和抵抗(包括几场大规模的激战)下的难民。5月11日,携带武器的再洗礼者占据了该市的一个主要集市,在失败被捕之前,他们大声喊道:“爱上帝的人,加入我们吧!”3天后,当局挖掉了11名头目的心脏。当年夏天,当局割断了一位再洗礼派领袖的舌头,因为他用舌头来布道;然后,当局砍掉了他的右手,因为他用右手洗礼;最后,当局砍了他的头。[17]

    即使对于那个时代,这场对再洗礼者的镇压也显得很残酷,肯定比路德和茨温利的追随者遭受的镇压要残酷。路德和茨温利废除了教会对《圣经》解释权的垄断,这已经够糟糕的了,但至少他们尊重私有财产,尊重世俗化的政府权威。而在大多数情况下,再洗礼派却主张没收集中的财富,特别是集中在教会手中的财富,并否认现有政府的合法性。再洗礼者还在煽动性的言论中掺入了即将来临的末日这种信念;很多时候,行动会加速灭亡。

    尽管荷兰的再洗礼者众多,但由于哈布斯堡家族对荷兰控制得过于严格,他们无法成功;他们需要更温和的政治土壤,这意味着,一个事实上不受哈布斯堡家族控制的城市。他们发现了明斯特,并在那里点燃了再洗礼派疯狂的第二条导火索。

    许多汉萨同盟的城镇,如但泽和吕贝克,都是所谓的“自由城市”,基本上独立于遥远而日益衰落的神圣罗马帝国皇帝,只在名义上效忠。这些几乎独立的城镇大多由当地贵族统治,例如明斯特由一位“亲王主教”统治。被选为“亲王主教”的代价通常非常昂贵,其需要由当地大教堂挑选并必须经过教皇确认,他们更多的是以封建主的身份进行统治,而不是政教合一的身份。

    1525年,明斯特的亲王主教弗雷德里克·冯·维德由于害怕农民战争,将权力下放给一个由24名成员组成的委员会,其中包括两名共同市长。与低地国家政府不同,该委员会基本不受哈布斯堡的影响。近10年后,该委员会将成为再洗礼派实施疯狂暴力破坏的楔子。[18]

    再洗礼派将滩头阵地定在明斯特,大多数历史学家将这归因于贝尔纳德·罗特曼。他于1495年左右出生在一个铁匠家里,与他的祖先一起被指控犯有巫术罪。小罗特曼被描述为具有“变化无常的、小丑的气质”。由于太穷,他没有上学。他叔叔在明斯特圣莫里斯教堂担任教区牧师,在叔叔的指导下,他成为唱诗班男童,后来以唱歌谋生。到青春期结束声乐生涯时,他已经赚得了在美因茨市学习所需要的钱,并在那里获得了硕士学位。1529年,他回到了圣莫里斯教堂。[19]

    1530年左右,罗特曼已经成为一名有说服力的传教士,得到了富有布商贝尔纳德·克尼佩尔多林的资助。克尼佩尔多林还担任协会会长、市议会议员,首先皈依了路德教,后来在罗特曼的影响下成为一名秘密的再洗礼派教徒。克尼佩尔多林印刷了罗特曼的小册子。不仅在明斯特,而且在低地国家,这些作品都点燃了再洗礼的火焰。

    现代社会对疯狂的再洗礼派的了解在很大程度上归功于两位观察者,一位是前面提到的赫尔曼·冯·克森布罗克,另一位是海因里希·格雷斯贝克。后者是一位皈依再洗礼派的木匠,参与了整个过程,并在最后扮演了一个小而关键的角色。冯·克森布罗克和格雷斯贝克都留下了详细的书面记录,他们在记录中所体现出的个人偏见表明,这些记录看上去是可信的。[20]

    根据冯·克森布罗克的描述,最初罗特曼忠实地传授天主教教义,但后来:

    渐渐地,他开始将那些看上去与天主教教条背道而驰的教义融入他的布道中。他开始煽动平民对神职人员的愤怒,这吸引了一些渴望新奇事物的市民。[21]

    他在圣莫里斯教堂的上级决定保护他们的信众不受日益激进的观点的影响,因此借给他20个金弗罗林[22]供他去科隆深造学习。他既没有去也没偿还借款;相反,他直接前往了维滕贝格。路德和梅兰希顿的家就在那里。

    1531年,这位年轻的牧师回到了圣莫里斯教堂。他作为一位坚定的路德宗教徒,陶醉于作为煽动者的快乐之中,非常善于吸引人群到城墙外的小教堂里。根据冯·克森布罗克的记录:

    许多人,特别是那些被债务压得喘不过气来的人,像尊敬上帝一样尊敬他,听信他说的每一句话,并深信他的行为都是奉上帝之灵。即使官方明令禁止,他们还是成群结队地从城里跟着他,因为他们渴望听到他讲话,他们的渴望如此强烈,以至于他们认为除了他之外没有其他传教士了,他们蔑视、谴责和诅咒其他人以及所有的神职人员。[23]

    作为一名忠诚的天主教徒,冯·克森布罗克对罗特曼的布道不屑一顾,“与其说是有确凿的论据,不如说是拙劣的诽谤”。然而,无知的平民们无法区分什么是雄辩,什么是夸夸其谈,他们认为他说得很好。[24]

    此时,罗特曼已被圣莫里斯教堂免去牧师职务,他带领一伙暴徒来到教堂,砸碎了神像,推倒了祭坛,砸碎了一个银杯,焚烧了圣母玛利亚的画像。当局再次驱逐了他,他又一次到了维滕贝格,在那里,他给路德和梅兰希顿留下了深刻的印象,据说他们俩很有先见之明地评论道:“罗特曼要么非常好,要么非常坏。”[25]

    1532年,罗特曼再次回到明斯特,他开始公开支持再洗礼派的观点。这是一把双刃剑。成人洗礼不仅获得了听众的认可,也得到了教会的许可。到那时,对于曾经把再洗礼者绑在木桩上焚烧,以及曾经将石头绑在再洗礼者的脖子上并将他们抛入水中,教会已经表现出一丝内疚。用再洗礼主义学者克里斯托弗·麦基的话说,“有点儿像一个神学笑话”[26]

    此时,亲王主教冯·维德仍然控制着这座城市,并强迫罗特曼停止亵渎神明的行为。罗特曼遵从了几个星期,但随后又不顾一切地给冯·维德写信说:“我问心无愧,因此我毫不怀疑我可以依靠上帝的怜悯。他会保护我,把我从危险中解救出来。”[27]

    1532年2月,罗特曼在该市的一个主要教堂——圣兰伯特教堂的院子里布道,公众被他动摇了,自发地选择以他作为自己的牧师。更重要的是,他在市议会中赢得了足够的支持,他不会再被驱逐。明斯特的宗教热情不仅限于再洗礼;全城的教堂中都有激进的路德派传教士,除罗特曼以外,他们都来自其他城市。

    在使城市皈依方面,罗特曼的成功与低地国家的霍夫曼和马提斯不相上下。罗特曼在圣兰伯特教堂的布道结束后不久,冯·维德在失意中辞职,他的继任者在被祝圣[28]之前就去世了;6月,没有多少基督教会背景的一位伯爵的儿子,弗朗西斯·冯·瓦尔德克,升任亲王主教。下半年,他封锁了这座城市,而作为回应,再洗礼派成功地突袭了城墙外冯·瓦尔德克的总部,这样明斯特就完全处于叛逆的再洗礼者的控制之下了。1533年2月,他们达成了一项妥协:教区教堂可以实行路德教,而大教堂将保持天主教。[29]

    尽管达成了妥协,但明斯特的天主教徒和路德教徒的时间已经不多了。罗特曼的小册子,由富有的布商克尼佩尔多林承销,已经渗透到了低地国家。这些小册子将私有财产列为邪恶的根源:“上帝所造的万物都是共有的,就像今天仍然可以共同享受空气、火、雨和太阳一样,任何东西都不能让某些偷窃者抓在他们自己手里。”罗特曼将明斯特描绘成一座富足的城市,它张开双臂欢迎信徒,数百名来自低地国家的可怜人南行至明斯特——再洗礼者口中所谓的新耶路撒冷城——去朝圣。

    1533年初,天主教徒、传统的路德派教徒和再洗礼派教徒不稳定地混杂在这座城市,其中的再洗礼派不想遵守与亲王主教之间的协议。与此同时,从低地国家涌入很多再洗礼者,引发了3月份的特别委员会选举,选举结果是激进的路德派占多数,相当多的再洗礼者占少数,没有天主教徒。[30]市议会对那些在基督大教堂给婴儿洗礼的家庭处以罚款,标志着新的统治开始。

    与此同时,在低地国家,扬·马提斯为一个来自莱顿市的名叫扬·博克尔松[31]的人施行再洗礼。和霍夫曼一样,马提斯是一个冲动、暴躁的传教士,而扬·博克尔松则利用自己的戏剧表演技巧和精于算计的能力塑造出一股强大的政治力量。

    作为一名镇长和一名农奴妇女的私生子,博克尔松一出生就面临着痛苦和失望,父母安排他接受了初级教育,并让他在裁缝店做学徒,但他并不擅长于此。他的一些其他天赋,很快就在明斯特显现出来:金发碧眼的英俊外表,优雅、狡黠、富有演讲造诣和表演天赋。用千禧年学者诺曼·科恩的话说,他利用这些天赋“将现实生活塑造成一部戏剧,以自己为主角,以整个欧洲为观众”[32]

    1533年末,马提斯派了几名使者前往明斯特,他们于次年1月抵达。其中包括博克尔松,他在前一年夏天来过这座城市。一到那里,他们就发现罗特曼及其追随者已经为城里的大概1/5的成年人施行了再洗礼,该城有多达1/3的人相信世界末日即将来临。马提斯本人于1534年2月9日来到这里。[33]马提斯和博克尔松的到来标志着两位再洗礼者融合在一起:罗特曼具有说服力的土生土长的明斯特再洗礼主义,以及梅尔基奥·霍夫曼从低地地区衍生的催眠般的末日幻觉。对双方来说,他们抵达明斯特的意义非常明确。用学者拉尔夫·克勒策尔的话说:

    先知派遣使者施洗被解读为上帝正在准备世界末日。在此背景下,战争、瘟疫和通货膨胀,以及帝国的改革,突然成为末日的预兆。[34]

    事情从这里开始发展迅速。再洗礼派让使者到邻近的城市传达信息:到1534年复活节,上帝会回来惩罚恶人,很少有人能活下来;只有在新耶路撒冷城明斯特才能获得平安和救赎。世界末日即将来临。

    1534年2月6日,罗特曼为河对岸女修道院的修女们表演了一场滑稽戏剧:

    他发表了一场赞美婚姻的布道,并用他演讲中神奇的击槌声打开了修女们童贞的营房。他似乎在敦促修女们去繁殖人类,而修女们对此并不十分反感。接下来,为了让修女们进一步从愚蠢过渡到彻底疯狂,他告诉她们修道院的塔楼及房屋结构将在第二天午夜倒塌,连同所有住在里面的人。他的神谕带给修女们的与其说是痛苦,不如说是欢乐,因为她们的灵魂充满了欲望,憎恨修女的生活。[35]

    这些年轻的修女无处可去,她们认为罗特曼是上帝派来的人,于是带着自己的财产跑去了他的家。整个城市的市民都无眠,迎接末日的到来。

    但是末日没有到来,为了挽回面子,罗特曼利用了一个正符合时机的圣经例子——约拿的故事,约拿错误地预言了亚述首都尼尼微的沦陷,全能者出于怜悯而没有责罚他。两个早晨后,再洗礼派的其他成员担心罗特曼的预测能力会使教派受损,于是滑稽地冲过街道,用“可怕的喊叫和疯狂的怒吼”大声宣讲,让不信教的人忏悔,试图以此来维护他们的信誉。那天下午,扬·博克尔松和克尼佩尔多林也加入了进来,一次又一次地大喊:“忏悔!忏悔!忏悔!”他们的疯狂感染了其他人,所有人一起以各种各样的姿态跳上跳下,摇着头,还有的扑通一声倒在泥里。一位再洗礼者骑马疾驰而过,宣布结束,并告诉所有人,他看见了成千上万的天使,所有人都将听到天使们的声音。[36]

    这种疯狂激励了再洗礼者,当天晚些时候,500名再洗礼教徒占领了城市市场,后来被主流路德派教徒阻止。但路德教的阻止是短暂的;在2月23日的选举中,再洗礼派最终完全控制了市议会。2月底,武装的再洗礼派向非教徒发出最后通牒:选择接受再洗礼或被驱逐,“从这里滚开,你们这些不虔诚的人!上帝会惩罚你们!”[37]

    再洗礼派摧毁了教堂的祭坛,并花费数天时间掠夺教堂里的金银,还焚烧雕像。他们还收取刻有“DWWF”的铜币,以允许行人通过戒备森严的城门。到了月底,亲王主教的军队开始围攻明斯特城,博克尔松告诉信徒,圣经要求,当末日来临时,上帝准许基督徒不再容忍,并准许他们全副武装去防御。

    第一批被驱逐的天主教徒被允许带走他们的财产,但短缺的食物除外;最后一批离开的人只能带衣服,但衣服上的纽扣和金钩都被没收了。[38]再洗礼派教徒对政变中路德教对他们的反击记忆犹新,他们把愤怒集中在男人身上。而路德教徒和天主教男子预测亲王主教能够夺回这座城市,因此留下他们的女人来守卫他们的房屋和财产。这造成城墙内女人数量过多,很快将产生可怕的后果。[39]

    1月,再洗礼者自愿捐出所有的物质财产——因为世界将会在复活节终结,但是到了3月,市议会开始禁止私人持有财产;罗特曼和博克尔松要求所有的金银和纸币都要上交到市政厅。为了鼓励捐赠,博克尔松宣扬,信徒有三种分类:完全放弃自我的好基督徒;保留部分财产的人,他们需要向上帝祈祷,但是上帝会心存报复;只为了方便而受洗的人,他们什么也指望不上,在末日将会被烧死。

    马提斯和博克尔松把镇上所有人都聚集在大教堂广场上,向他们大声喊道,仁慈之门已经关上,上帝很生气。那些已经受洗的人被聚拢在一边,剩余的人,总共大约300人,被解除武器,被迫俯伏在地,祈求怜悯一个小时,这期间随时都可能被杀死。然后,他们被带进大教堂,被迫跪祈上帝3个多小时。最后,教堂门外的博克尔松戏剧性地打开门宣布:“亲爱的兄弟们,看在上帝的分儿上,我要告诉你们,你们得到了上帝的怜悯,你们将与我们同在,成为圣人。”第二天,他对镇上2000名未受洗礼的妇女重复了这个过程。[40]

    到3月底,这座城市已经经历完一次宗教清洗;大约有2000名天主教徒和未受洗礼的路德教徒被驱逐,人数与从荷兰和东弗里西亚迁移来的再洗礼者人数大致相等,因此人口基本保持不变,约为9000。但是,该镇的宗教结构以及心理结构已经发生变化。不易受到他人影响的天主教徒被更易受到影响的再洗礼者取代,这加剧了已经变得明显的群体幻想行为。此外,对不敬虔者的驱逐和信徒的迁移只会加强“新先知”罗特曼、马提斯和博克尔松所说的“大灾难”的确定性,即末日真的要来了。

    再洗礼者不仅要拥抱未来,还要毁灭过去,因此他们下令销毁所有市政记录,特别是债务分类账簿。狂热者们焚烧路德和阿奎那[41]的书籍;一些家庭和教堂里只剩下《圣经》。最终,博克尔松还对城市的门和街道进行一般性重命名,例如,圣路德门被简称为南门,他还按照字母顺序指派姓名给新生儿。[42]

    这些“新先知”开始残酷地惩罚持不同政见者。一位名叫胡贝特·吕舍的铁匠,在2月份的选举中失去了议会席位,还对市政记录被毁感到不满。于是他被带到博克尔松面前,先是戏剧性地被赦免,然后戏剧性地被释放,他哭着求饶,但是被一把戟刺中背部。这位身体强壮、肌肉结实的铁匠还没有死,于是博克尔松朝他的背部开了一枪;吕舍被痛苦折磨了8天才死去。[43]

    复活节前不久,马提斯参加了一些朋友的婚礼;他预言了自己的死亡,格雷斯贝克对此做了记录:

    他在那里坐了一个小时,拍打着双手,上下点着头,沉重地叹着气,就好像快要死了。最后,他又醒了过来,叹了口气说:“哦,亲爱的父亲,不要照我的意思,只要照你的意思。”他站起来,把一只手伸向每一个人,并亲吻他们的嘴唇。他说:“上帝的平安与你们同在。”然后他和妻子一起走了。(那时,再洗礼者还没有很多妻子。)[44]

    1534年,复活节在4月5日到来,但耶稣没有出现,世界也没有结束。那天,马提斯和十几名追随者离开城门,骑着马走向亲王主教的雇佣兵,后者开始屠杀他们。格雷斯贝克记录说,围城者将马提斯的尸体切成100块,玩耍似的用血淋淋的碎片相互撞击,并用一根长矛挑着他的头,然后向城内喊话:居民们应该找回他们的市长。[45]马提斯可能是想吸引耶稣回来,或者,为了完成《启示录》11章中的一段话,即以诺(他自己)和以利亚(霍夫曼,仍被扔在斯特拉斯堡监狱中)的死亡将标志着耶稣的回归。

    博克尔松在乡村传教多年,还在上一年夏天到过明斯特,传教经历磨炼了他戏剧般的间谍技巧。在附近的舍平根镇,据说他通过洗礼治愈了一个生病的女孩,到1534年初他再回到明斯特时,已经很有名气了。他很可能一直在为这一时刻做准备。在此之前,他在明斯特一直保持着相对低调的姿态,马提斯去世后,他站在教堂的上层窗户处俯瞰人群,身穿白色长袍,沐浴在烛光中,右边是克尼佩尔多林,左边是迪沃——马提斯美丽而神秘的妻子,历史只记载了她的教名。

    博克尔松告诉群众,马提斯应该被处死,因为他虚荣并贪婪,这让群众大为震惊。博克尔松指了指克尼佩尔多林,并告诉人们,当他住在克尼佩尔多林家时,看到了马提斯血淋淋地剖开了一名雇佣兵的肠子。这名雇佣兵告诉博克尔松不要害怕:马提斯将受到上帝的审判,而他,博克尔松,必须迎娶他的遗孀迪沃。之后,博克尔松再次指向克尼佩尔多林,让他证明雇佣兵说这话的时候他也在场。人群对这一神圣景象感到兴奋,不少人脱下衣服跳舞,所有人都知道了,博克尔松继承了马提斯的职位。[46]

    马提斯和罗特曼还遗留了一个问题,那就是为什么耶稣又一次没有出现,博克尔松必须向信徒解释这个问题。他预言,耶稣现在不会回来,直到新耶路撒冷城清除所有不洁的元素。

    博克尔松不仅是一位杰出的煽动家,而且还是一位有能力的军事指挥官。他加强了该市本就很强大的防御警戒线,包括双墙、护城河和石制圆形大门。9000名公民面对的是数量大致相等的雇佣兵,因此不允许有累赘:妇女不仅在火药厂协助男子,而且还将亚麻花环浸入沸腾的沥青和生石灰锅中,从城墙上扔到突袭的雇佣兵身上。晚上,博克尔松的人溜进雇佣兵帐篷,割断他们的喉咙,并给幸存者留下纸条,鼓励他们皈依再洗礼派。

    5月25日,博克尔松的部队轻松击退了亲王主教军队的进攻,其中许多人投奔进城(尽管其中6人不久就因酗酒闹事而被处死)。[47]这场胜利极大地鼓舞了再洗礼者;当然,上帝是站在他们这一边的,亲王主教军队的失败巩固了再洗礼者对城市的控制。

    7月,博克尔松宣布所有以前的婚姻无效,并命令所有成年人再婚。此时,路德教和天主教留下的女性加剧了男女比例失调,女性的数量几乎是男性的三倍。因此再洗礼派鼓励一夫多妻制。起初,再洗礼派中那些富有攻击性的男性疯狂地在城市里四处寻找年轻女性和童女,他们基于一个理论,用格雷斯贝克的话说,“拥有的妻子越多,这样的基督徒就越好。”很快,领导层意识到,由此产生的自由放任的雄性激素已经破坏了城市的稳定。为了遏制这些疯狂男性的行为,他们规定,新娶必须经过主妻的同意,并允许各方当事人都可以提出离婚。但即便如此,第一任妻子也对他们新扩大的家庭感到不满,这是可以理解的,她们经常虐待这些新添的妻子。为了鼓励人们遵守一夫多妻制,领导层将最顽固的妻子监禁起来,并斩首了不少人。[48]

    婚姻法引发了一场暴动。大约120名男人抓获了博克尔松和克尼佩尔多林,并指认他们为刽子手,但是一场反击战将这二人又营救了出来。大多数叛乱者都祈求到了宽恕,但博克尔松枪杀、斩首了47名叛乱者,还有少数叛乱者被砍死。除此之外,博克尔松还处决了更多抵制一夫多妻婚姻的妇女。

    8月,亲王主教又进行了一次袭击,他们几乎冲破了内墙,但最终被击退。袭击者遭受了可怕的损失,因为当他们爬向城墙抬起头的时候,发现迎接他们的死亡形式是煮沸的大锅、木柱和树木,一旦木桩和树木掉落,会立即将他们其中的几个人从爬梯上带下。他们中的幸运儿从破裂的外墙逃了回来。之后,亲王主教的军队几乎解散。[49]

    这场胜利鼓舞了博克尔松的精神和气势;他认为自己是大卫王转世,也是这个星球唯一合法的统治者。他还英明地推断,这样一个惊人的说法最好是出自他人之口。那年夏初,一位名叫扬·杜森舒尔的跛行金匠从附近一个小镇来到明斯特,他自称拥有预言能力。果然不出所料,在亲王主教第二次袭击失败后,他宣布上帝已为博克尔松施了涂油礼,任命他为国王。[50]

    作为君主,博克尔松宣布明斯特的旧宪法不适合新的神圣秩序,废除了市议会和两个市长职位,并以皇家法庭取而代之。“新耶路撒冷”被重新命名为“上帝的子民”。

    在击退亲王主教的第二次进攻后,邻近的亲王加强了封锁,并任命了一名新指挥官。因此,食物和供应品很难偷运到市里;这位新国王的臣民们衣衫褴褛,慢慢被饿死。博克尔松却一点儿也不担心,他对戏剧和戏服的热情开始高涨。格雷斯贝克这样描述博克尔松:

    他为自己做了一件天鹅绒外套,用华丽的丝织布制作成华丽的紧身裤和紧身短上衣,还有华丽的金帽子、一顶带天鹅绒细绳的皇冠、一把配有金鞘的刀、一把配有金鞘的匕首、戴在脖子上的许多金项链……他把世界挂在链子上,就像在他的盾形纹章上挂着的那个金色圆球一样。这像他的盾形纹章一样闪烁着蓝色斑点。[51]

    博克尔松的奢华感还延伸到为他的骑兵装备华丽的衣服,用华丽的丝绸,“制作成半身服装,一只手臂没有袖子,胸部镂空,因此他们在马背上能给人留下深刻印象”,并为他的家仆穿上红色外套,配上灰色或金色戒指,以戒指大小显示仆人等级。[52]

    10月,杜森舒尔将预言中博克尔松的统治权扩展到整个地球,并宣布上帝将吹响三次号角,这标志着该城通往上帝应许之地的旅程开始。1534年10月31日日出前,瘸腿金匠杜森舒尔爬上圣兰伯特教堂的塔楼,吹响了牛角。然后他下楼,继续在街上吹喇叭,其他人则吹奏其他乐器。成千上万的居民费力地走向大教堂广场,男人们扛着武器,女人们抱着小孩和她们最珍贵的财产。更多的号角吹响了,博克尔松骑着一匹白色的种马,全身行头,在20个护卫的簇拥下来到这里;后面跟着的是坐在马车里的迪沃王后,她由仆人侍奉着,还有他的另外15位妻子。

    此时,博克尔松已经把没有到来的末日提升到了高级剧场。他命令一位受尊敬的贵族,格拉赫·冯·武伦,带领自杀式冲锋队冲向围攻部队。然后,这位国王让冯·武伦宣布,这只是一次旨在测试他们意志的演练,他很高兴地通知他们,他们已经通过了。博克尔松脱下他的猩红色长袍,摘下王冠,放下君主权杖,和他的“长老们”一起为饥饿的群众提供了一场盛宴。除了给他们供应食物,博克尔松和长老们还与男人们开了一个轻松的玩笑——谈论他们妻子的数量。格雷斯贝克写道:

    只有一位妻子的市民羞愧地坐着。这样的人还不算信徒,不算一个真正的基督徒……他们坐着吃喝,兴高采烈。在大教堂广场上,这些人看上去并不像马上要死的人,每个兄弟都坐在妻子们旁边,到晚上可以选一位他渴求的人和他一起上床睡觉。[53]

    市民们饱足后,博克尔松站起身来,声泪俱下地宣称,他辜负了人民的期望,将退位。博克尔松刚说完,杜森舒尔就转达了上帝那里传来的消息:上帝命令他和其他26个人一起前往附近的4个城镇传播消息,以加速末日的到来。

    此外,杜森舒尔透露,博克尔松应该恢复其国王的职责,其中最主要的职责就是惩罚明斯特城中的不虔诚行为。然后,这位金匠把王冠重新戴在国王的头上,并把他的猩红色长袍和君主权杖还给了他。

    这戏剧性的一幕也许就是博克尔松本人的杰作;他在27名信使及其134位妻子面前,一举提升了自己的权威,摆脱了潜在的竞争对手。然后,国王和他的妻子以及宫廷人员,吃了一顿丰盛的晚餐;每上一道菜前,他的仆人都会大吹大擂。晚餐结束时,博克尔松沉默地坐了一会儿,然后告诉在场的人,他从上帝那里得到了启示,上帝命令他把刀和一个被俘的雇佣兵带来。他命令俘虏坐下,被拒绝后,他威胁俘虏说要把其腰斩,而不仅仅是斩首,俘虏未反抗。完成了上帝的旨意后,博克尔松结束了这顿饭。[54]

    27名信使离开了;然后26名信使被抓获并被雇佣兵处决了,除了一个名叫海因里希·格拉斯的人,他因会说拉丁语而没有被杀。这也引起了亲王主教的注意,使格拉斯有机会叛变。[55]

    格拉斯回到明斯特,讲述了他戏剧性地从亵渎上帝的人手中逃脱的故事,然后离开了这座城市,将无价的情报送给了亲王主教:食物和武器已经短缺,这座城市已经分裂,一边是曾经忠诚但现在饥肠辘辘、士气低落的民众,另一边是再洗礼派的精英们,他们的特权使他们能够保持精气和幻想。

    格拉斯离开这座城市之前给镇上的人留下一封谴责信:“现在明斯特正在进行的行为都是一场骗局,因此,我谦卑地祈祷你们最终睁开眼睛——是时候了!注意你们的行为,你们显然违背了上帝和他神圣的话语。”[56]尽管信使们已经被杀,但博克尔松安慰信徒们,信使死亡是上帝的意愿,他派遣了更多的信使到更远的低地国家去招募新的再洗礼者来守卫城镇。为了迎接增援部队的到来,他下令制造装甲车,以穿越封锁线回到城镇。

    但增援没有到来,第二批信使也杳无音信。这些持续出现的不幸事件,再加上邻近亲王向亲王主教支援了更多的雇佣兵,使他们没有机会再取得军事胜利。罗特曼告诉市民,虽然他们不能依靠外部世界,但上帝会拯救他们。随着食物和资源的日益匮乏,博克尔松削减了军队,转而专注于神学研究。

    1535年1月1日,博克尔松发表了一份宣言,其中规定,“只有那些以上帝的话语为导向的政府才能得到保护”,“做出法律决定是国王、他的摄政者以及法官的特权”,“一个不受非基督胁迫的政府不应该受到干涉,即使它还没有接受信徒的洗礼”[57]

    一群年仅10岁的儿童因偷窃食物或涉嫌叛国而被处决。一位名叫图尔班·比尔的丹麦贵族离城后不久被发现是间谍,三个知情妇女在大教堂广场被斩首。其中一个是克尼佩尔多林的情妇,她没有被纳为妻子,因为她是妓女。被带到断头台上时,她公然谴责克尼佩尔多林的背叛行为;愤怒的克尼佩尔多林抓起一把刀砍了她的头。[58]

    到了复活节,低地国家的救援部队还没有出现,博克尔松宣称,他一直以来都是从精神意义而不是军事意义上定义“胜利”的。当镇上的流浪猫狗都已经被吃掉的时候,饥饿的市民们才被允许离城。

    博克尔松给予民众三四天的离城期限。离城民众的衣服被交换为破布;那些在期限之外离开明斯特的人被抓获并被处以绞刑。还有少数按照期限离城的民众被城外的雇佣兵屠杀,他们的头被挂在木桩上。格雷斯贝克将此解释为“霍布森选择”[59]:“他们仍然选择从城市叛逃,因为他们在城市里遭受了如此巨大的饥饿。他们宁愿被杀,也不愿在巨大的饥饿中受苦。”[60]

    几周后,为了节省食物,博克尔松允许男人与他们的某些次要妻子以及孩子断绝关系,这样他们就可以离开;博克尔松也和他的妻子以及孩子断绝了关系。格雷斯贝克观察到,“如果有人出一块面包,那么肯定有一些再洗礼者愿意用一位妻子换回一块面包。当没有面包的时候,法庭就没什么存在意义”[61]

    这时,雇佣军每天都要将50名男性逃犯斩首,让逃犯中的妇女和儿童挤在围墙外的一块几百码宽、周长4英里的地狱般的土地上,其在一个多月的时间里都没有食物和住所。后来雇佣军允许其中的外国妇女和儿童回家,明斯特当地人被拘留,一直到城市沦陷。[62]

    大约5月23日,格雷斯贝克和其他几个人也逃离了这座城市。和以前大多数逃离者一样,他们被抓获了,但幸运的是没有被杀;就格雷斯贝克而言,由于他年轻、个性讨人喜欢以及抓获他的雇佣兵心地善良,他只是被判入狱。[63]他的成功逃离鼓励了数百人逃离明斯特,但最后几乎所有人都被杀了。

    格雷斯贝克在牢房的泥土地上为雇佣兵画了一张地图,勾画出军队应该如何进入城市。6月22日晚,一位名叫“朗斯特里特的小汉斯”的人(曾是围攻者,后来叛变到明斯特,然后又和格雷斯贝克一起逃离明斯特)和格雷斯贝克通过一个小型浮动桥游到一个能够穿过护城河的地方,35名雇佣兵从那里迅速穿过护城河,杀死了熟睡的哨兵,用小汉斯的钥匙打开了大门。在防御者最终关闭城门之前,至少还有300多名雇佣兵沿着又短又细的堤道进入(比起格雷斯贝克,围攻者们更信任小汉斯,也许是因为小汉斯最初是他们中的一员,所以小汉斯带领他们进攻,格雷斯贝克则留在桥上)。重新关闭城门后,困在城墙内的入侵者本来几乎就要被博克尔松的部队消灭了,但他们狡猾的指挥官威廉·施特丁用假谈判拖延了一段时间,直到后来亲王主教的主力兵团涌入该城,并在残酷的肉搏战中扫荡剩余的再洗礼者。[64]

    雇佣兵屠杀了600名居民,当他们发现每个人分到的战利品份额为50荷兰盾(相当于今天的1600美元)时,可能存在的任何罪恶感都消失了。再洗礼派护城河首领克里斯蒂安·克尔克林克很快被处决,一起被处决的可能还有迪沃王后。但博克尔松、克尼佩尔多林和另一名副手布伦德·克雷切丁克因各种神学犯罪、盗窃和谋杀的罪名而被慢慢审讯。博克尔松被捕几天后,亲王主教悲伤地问道:“你是国王吗?”博克尔松傲慢地回答:“你是主教吗?”[65]上层领导中可能只有罗特曼逃脱了,而且人们再也没有听说过他的消息。

    1536年1月22日是对博克尔松行刑的日子。按照帝国新刑法规定的程序,两名刽子手用一根木桩附着一个铁圈,圈住博克尔松的脖子使他不能动弹,并用灼热的钳子把他的肉撕下来。根据冯·克森布罗克的记录,“当被灼热的钳子触碰时,肌肉会发出明显的火焰,并因此散发出强烈的恶臭,使旁边的人感到恶心”[66]

    看到这一幕,克尼佩尔多林试图用脖子上的项圈让自己窒息,但刽子手们用绳子把他张大的嘴牢牢地固定住,并把他捆在木桩上,然后又回到博克尔松身边继续钳肉,博克尔松默默地经受着这种折磨。之后克尼佩尔多林和布伦德·克雷切丁克也经历了这种折磨。然后刽子手用刀划开三个人的喉咙,最后刺中心脏。刽子手把他们直立的尸体塞进铁笼里,然后把铁笼挂在圣兰伯特教堂的塔楼上,让所有人都能看到。[67]他们的骨头在那里保存了50年,街上仍然有这三个笼子[68]

    明斯特再洗礼派的继承者从他们的经历中吸取了教训;今天,成人洗礼的教义主要存在于阿米什和门诺派中,它们既安静又和平。

    第三个大规模的中世纪末日事件发生在17世纪中期的英格兰,当时整个英格兰都处于混乱之中。17世纪早期,议会与斯图亚特国王之间存在冲突,后者继续宣称国王的神圣权利;而议会不满于查理一世对安立甘宗[69]的支持,其更亲近天主教。

    不过,他们的冲突主要围绕财政问题。查理一世由于无法筹集到必要的资金支持他的军事行动,试图用一些非法手段结束议会的财政权力,尤其是筹集“船款”的权利。这是一项古老的皇家税,只在战时适用,而且只适用于沿海城镇。查理一世在和平时期收取议会外税收,并将其推广到内陆社区,引发了三场独立的冲突,其统称为英国内战,最终国王于1649年被斩首。奥利弗·克伦威尔建立了短暂的联邦和保护国制。克伦威尔的统治,以及他能力较弱、参与政治较少的儿子理查德的继任,被证明是灾难性的,使查理二世的君主制统治又在1660年得以恢复。

    动荡催生了两大派别:一个是平等派,主张法治、民主改革和宗教宽容;另一个是第五君主国派,是一个千禧年主义团体,其末日论支持“圣徒”统治,自认为是正义的骨干,但是和明斯特的再洗礼派一样,一点儿也不民主、不宽容甚至不谦逊。第五君主国派统治英国后,正义者将无法得到休息,因为它颁布了一项神圣法令,授权随后征服欧洲大陆。尽管这两个派别都没有完整地幸存下来,但第五君主国派在1653年短暂存在的“贝尔朋议会”(以一名成员的名字命名)中几乎掌握了政府大权。“贝尔朋议会”是克伦威尔令人眼花缭乱的一系列议会之一。[70]

    自约阿希姆以来,困难时期就会产生大量的数秘主义和末日论算术。英国外交官约翰·佩尔在1655年写道:

    有些人认为,395年是异教终结的时代,因为当时罗马帝国中不存在任何一座异教徒圣殿。在此年上加上著名的数字1260,也就是1655年,是末日的新纪元。另一些人则认为是1656年,因为他们将《创世记》第五章中先辈们的生活时间进行加总,发现从创世到洪水一共经历了1656年,并由此推断,耶稣一定和挪亚一样,在第二年到来。还有一些人认为应该再等三四年,认为1260这个数字必须从狄奥多西死后、他的儿子们分裂罗马帝国时开始算起。甚至还有一些人认为需要再等11年,我们不必惊讶,这是由数字666推算出来的。(也就是说,末日时间将在1666年。)[71]

    第五君主国派中一个叫阿里塞·埃文斯的人轻易地做出了最愚蠢的估计。《但以理书》中的“小号角”在书中代表希腊塞琉西帝国统治者安条克四世,那么它在当前时期又代表了谁,这是第五君主国派末日论中的关键要素之一。大多数信徒认为当前的小号角是国王查理一世,这让埃文斯很生气,因为他是已故国王及其大主教威廉·劳德的坚定支持者。对埃文斯来说,大主教的名字正标注着世界末日的时间:VVILLIaM LaVD中的罗马数字加起来是1667年[72]

    在另一领域,物理学家艾萨克·牛顿写了大量文章解释《启示录》经文(在他死后,其结集成一本《对但以理预言和圣约翰启示录的考察》),但是他很明智,并没有预测耶稣复临的日期。[73]

    也许最有影响力的末日推算,当属一位名叫亨利·阿彻的传教士了。他在1642年出版了《基督亲临统治全地》,一部仅58页的著作,将但以理梦中被石头打碎的野兽重新解释为四个君主国:亚述/巴比伦、地中海/波斯、希腊和罗马。他认为即将到来的第五个君主国将由耶稣亲临统治,第五君主国派的名称由此而来。阿彻的计算表明,耶稣将会在1666年或1700年复临。这种模式完全属于新教神学范畴。路德认为第四君主国和野兽都是教皇制的隐喻。[74]

    许多第五君主国派成员都是英国内战以及克伦威尔议会和护国政体的主要参与者,他们认为自己是即将到来的基督复临和最后审判事件的被动观察者。在英国内战期间,该派别中最杰出的人物是托马斯·哈里森,他官至少将,表现出极大的勇气和极强的能力。他还担任议会议员,主张进行改革。

    大多数第五君主国教徒都主张通过法律手段寻求变革,例如哈里森。但是也有少数人并不认同,特别是一位名叫克里斯托弗·费克的煽动性传教士,他敦促公众进行一场暴力革命,去迎接一个由“圣徒”——也就是他们这些虔诚的精英——组成的千禧年神权政体。[75]

    第五君主国教徒一开始很顺利,他们(包括哈里森)都参加了战争并在新模范军中担任高级职位,也是1648年克伦威尔清除“长期议会”事件的参与者。但随着时间的推移,克伦威尔要么不愿意,要么无法接受第五君主国教徒的政治和神学要求,他们之间的联盟开始破裂。1653年,第五君主国派在贝尔朋议会中达到了权力的顶峰,但维持时间不长,随着议会的解散和随后独裁护国政体的建立,克伦威尔和第五君主国派之间的关系恶化。克伦威尔断断续续地拘留了包括哈里森在内的许多第五君主国派成员,但他通常会谨慎对待这些老盟友,没有因为他们的千禧年信仰而处决他们。例如,1654年,那时的哈里森可能已被多达8个不同选区选中进入新议会,他提交了一份请愿书,敦促恢复“一个完全自由的国家”。克伦威尔发表了反对意见,拘留了哈里森,然后“温和”警告了他;几天后,又释放了他。[76]

    用历史学家罗杰斯的话说,克伦威尔对待第五君主国派成员“就像对待自己顽皮的、被误导的孩子一样,虽然他们违背了他的意愿,但他不希望他们被监禁的天数太多,哪怕多一天也不行”。[77]

    随着1660年4月查理二世复辟,第五君主国派的幸运终于耗尽。新国王对这群人怀有偏见和仇视。哈里森不仅曾经是查理一世被监禁时的看守,而且在判处查理一世死刑的司法程序中也扮演了重要角色,因此他尤其受到查理二世的仇视。6个月后,国王审判哈里森和他的同僚们(弑君者),其中有一些是第五君主国派的成员。大多数人都被判有罪,而哈里森发现自己是第一个被判有罪的人,并被告知:

    在囚车上被拖到行刑地点;在那里,你将被吊起来,活人剖腹,你的内脏将在活着的你面前燃烧,然后你的头将被砍掉,身体将被肢解为4块,由国王陛下随意处置。[78]

    曾经目睹过查理一世被斩首的日记作者塞缪尔·佩皮斯,记载了10月13日对哈里森的行刑:

    我到查令十字街,去看哈里森少将被拖行、绞死并被肢解为4块;就在那里,观看的人都很高兴。他很快就被砍成块,头和心被展示给人群,这时人群发出巨大的欢呼声。[79]

    在这次事件中,哈里森的头和4块身体在城里被四处展示,这令国王很高兴。两天后,佩皮斯又目睹了另一位著名的第五君主国派弑君者约翰·卡鲁的死刑执行仪式,他“在查令十字街被绞死并被肢解为4块,但是,幸运的是,他的身体各块没有被吊起来展示”[80][81]

    第五君主国派中的一个小派系,其领导者是一位名叫托马斯·文纳的制桶工匠。他们一直幻想自己的民众支持率很高,足以通过武装暴动实现耶稣复临。尽管第五君主国派的其他一些更清醒的成员,如哈里森等人认为他们是鲁莽的,但文纳还是在1657年4月策划了一场暴动,不过暴动还没开始,就被揭发了,这证明他确实鲁莽。

    奥利弗·克伦威尔对文纳及其同伙非常宽容,只是将他们囚禁在伦敦塔;克伦威尔死后,他的儿子理查德释放了这些无能的策划者,他们只被监禁了不到两年。随着查理二世的复辟以及哈里森和其他参与弑君的第五君主国派成员的死亡,刚刚获释的文纳团队感到绝望,决定采取行动。1660年12月,文纳的一个喝醉的同伙向一个名叫霍尔的人吹嘘他即将参加一个“光荣的事业”。霍尔问是什么,他回答:“我们会把查理从王位上拉下来。因为国家应该由圣徒来统治。”霍尔迅速向当局报告了谈话内容,然后被带到国王面前,国王下令逮捕第五君主国派中的其他不满者。

    文纳和他的大约50个同伙没有被逮捕,因此他们继续执行他们的计划。1661年1月6日晚上(选择这个日期是因为他们认为第十二夜狂欢结束时城市的看守人都会喝醉),他们闯入圣保罗大教堂,并在教堂外面派了一个守卫,结果这个卫兵很快开枪打死了一位路人,因为当被问及忠于谁的时候,这位路人宣称自己忠于国王。密谋就这样暴露了,文纳那支可怜的小部队在伦敦的街道上被不断壮大的“火车队”追赶,这些“火车队”由城市民兵构成,后来国王的军队也来增援。在接下来的三天里,文纳的士兵从人数上远逊于对方,他们进行了一系列越来越绝望的殊死反抗。

    塞缪尔·佩皮斯在1月10日的日记中,简洁地描述了这群人:

    这些狂热分子击溃了他们遇到的所有火车队,把国王的近卫兵赶跑,杀死了大约20人,两次闯入城门;而这一切发生在白天,当全城武装起来的时候,他们总共不超过31人。然而我们却认为他们至少有500人(因为他们几乎在全城的每个地方都出现过,而且他们在海格特地区还待了两三天,还在其他几个地方待过)。闻所未闻,如此少的人竟敢做如此多的坏事。他们的口号是“耶稣国王和城门上的头颅”。最终,他们中很少有人会被分尸,因为他们在暴力中很难活下来:期待耶稣降临这里,并在此刻统治世界吧。[82]

    最后,文纳的追随者中大约有一半死在追杀中,其余大部分后来被绞死,但国王对文纳和他的副手执行了全套的半活剖腹刑,就像对之前的哈里森和卡鲁那样。[83]

    16世纪和17世纪,北欧人通过引人入胜的末日叙事,寻求逃离这个世界的苦难,去往一个美好的舒适世界。在施瓦本农民战争中,托马斯·闵采尔只是把末日神学附加在世俗平民起义的基础上,造成了灾难性的后果;而在疯狂的再洗礼派和第五君主国派的暴动中,从一开始到悲惨结束,都是一场末日事件。

    从18世纪开始,随着一系列金融群体幻觉席卷欧洲,整个国家不再寻求上帝的援助,而是开始寻求玛门的援助。从表面上看,宗教和金融事件似乎属于不同现象,但它们是由相同的社会和心理机制驱动的:叙事的诱人力量;人类倾向于幻想本不存在的“模式”;领袖和追随者的过于自负和过度自信;而且最重要的是,人类有一种压倒性的倾向,即模仿周围人的行为,尽管这种行为毫无根据或是一种自我毁灭。

    3 短暂的致富

    密西西比泡沫与南海泡沫

    在这片广阔的土地上,人们的思想都集中于同一个主题。这一主题吞并了政党政治:辉格党和托利党停止了争吵,雅各布斯派也停止了阴谋。在全国各地的每一家旅店、每一条道路上,谈论的内容都是一样的。在阿伯里斯特维斯,在特威德河畔贝里克,在布里斯托尔和圣戴维斯,在哈里奇和朴次茅斯,在切斯特和约克,在埃克塞特和特鲁罗,几乎在陆地的尽头,人们谈论的只是南海公司的股票——只谈论南海公司的股票!

    ——威廉·哈里森·安斯沃思,1868[1]

    18世纪初,聪明的苏格兰金融家约翰·劳留下了一条可怕的金融混乱足迹,这对20世纪90年代那些在互联网泡沫破裂中幸存的人来说非常熟悉。互联网股票只会伤害数百万投资者;但劳损害了整个法国对银行业的信心,这是更严重的打击。

    劳是苏格兰人,出生于一个有着数百年历史的著名的爱丁堡金匠世家,他的父亲、叔叔和三个兄弟都是金匠。到他1671年出生时,古老的“金匠”职业已经演变并伪装成了一个完全不同的东西:银行业。

    劳的直系祖先生活在苏格兰岛,但当时的苏格兰与未来那个雄伟、贸易自由的不列颠岛完全不同(当时,苏格兰仍然独立于英格兰)。17世纪初,英国人口仅为法国的1/3,比1348—1349年黑死病暴发前的人口还要少。劳时代的英格兰弱小、不发达,当时还卷入了一场弑君性国内战争。当时英格兰在公海上的业务不仅涉及商业,还涉及海盗和走私。随着1600年左右大型贸易组织的建立,大规模国际贸易开始缓慢出现,其中最著名的是东印度公司的贸易。

    当东印度公司的船只拉着从新兴香料贸易中赚得的金银驶入伦敦时,商人们遇到了一个后勤问题:英国没有银行系统,因此没有可靠的地方存放财富。金匠们的职业就是对客户的贵重物品进行安全储存,他们提供了最合理的替代物,即证书。商人们将贵重物品交给金匠后,会收到金匠的证书。关键是这张纸质证书可以用来交换商品和服务,换句话说,它起着货币的作用。此外,金匠们意识到,他们可以创造出超过他们所持有金银(铸币)数量的纸币。

    也就是说,金匠可以印钞。

    只有最虚伪、目光最短浅的金匠才会只制作和颁发证书给储户;大部分金匠都制作纸质证书并以高利率借出。即使是借给信用最好的人,借款年利率也常常会超过10%(尤其当英国处于战争状态时),在那10年里,借出证书比发放证书给储户更赚钱,而且只要金匠仍有偿付能力,这种情况就会一直存在。

    只有在证书持有者没有一次性全部赎回的情况下,这条菊花链才能正常运转。假设金匠的保险箱里有10000英镑的金币,他发行了价值30000英镑的证书,1/3的证书颁发给金币的主人,2/3的证书颁发给借款人。如果持有证书的人要求取出价值10001英镑的黄金或白银,那么不管他们是借款人还是最初的储户,金匠都可能被毁掉。更糟糕的是,如果证书持有者怀疑会发生这种情况,那么金匠办公室不断壮大的队伍将足以引发挤兑,从而推翻整个纸牌屋。在本例中,证书与铸币的比率为3:1;该比率越高,运行崩溃的可能性就越大。即使是最谨慎的金匠/银行家也可能陷入崩溃;1674—1688年,发生了四次有记录的“金匠挤兑”;1677—1694年英格兰银行成立期间,伦敦金匠/银行家的数量从44人下降到12人左右。

    实践当中,金匠/银行家们发现2:1的比率——每接收1英镑存款,向借款人发放1英镑贷款——是相当安全的。这一体系的重要性不容低估,因为它预示着弹性货币供应的诞生,而弹性货币供应量可以根据借款人对贷款的渴望和债权人的放贷意愿进行调整。当借贷双方情绪高涨时,货币供应量就会扩大;当他们感到恐惧时,货币供应量就会收缩。这种纸币数量扩张的现代金融术语是“杠杆”,即纸质资产总额与硬资产的比率。[2]

    银行的杠杆推动了现代金融狂热。在欧洲,它产生于17世纪,导致各种过山车般的泡沫和泡沫的破灭。在接下来的4个世纪里,金融创新产生了各种令人眼花缭乱的投资工具,每一种都只是在稍微不同的伪装下进行杠杆操作,并成为接连出现的各种过度投机的导火线。

    作为英国金匠的继承者,约翰·劳从小生活在一种英国式的银行体系中,纸张可以像稀有铸币一样发挥货币的作用。但即使在今天,许多人仍然抵制纸币的概念;在17世纪之交,纸币让很多普通人觉得可笑。

    到了1694年,年轻的劳厌倦了肮脏、贫穷、处于中世纪晚期的爱丁堡,来到伦敦。他改名为博·劳,在城市里尤其是经常在赌桌上游荡。他与一位名叫博·威尔逊的人为了一个他们都感兴趣的年轻女人而展开决斗,最终他杀死了博·威尔逊。经过审判,劳被判绞刑,然后获得缓刑,然后再次被判绞刑后,逃跑了。1695年初的《伦敦公报》写道:

    约翰·劳上尉,苏格兰人,王座法庭囚犯,最近犯有谋杀罪,26岁,瘦高个,皮肤黝黑,身材匀称,身高6英尺以上,脸上长着麻子,大鼻子,声若洪钟,从上述监狱逃跑。无论是谁能够控制并将他送回上述监狱,都将立即获得由王座法庭支付的50英镑。[3]

    17世纪末,囚犯们比今天更容易“逃跑”,而劳的朋友,可能是得到了国王威廉三世的默许,安排了他的逃跑。[4]上述身体特征描述属于故意误导,因为劳的鼻子并不大,肤色白皙。

    最初,他去了法国,在那里,他的数学能力震惊了周围的人,在赌桌上受到欢迎。但是,把劳称为赌徒,对他的能力来说并不公正。即使在今天,定量能力和专注能力在二十一点的牌桌上也很有用。300年前的赌场的效率较低,冷静计算的回报更为丰厚。这吸引了一些欧洲最聪明的数学家参加这种机会主义游戏,其中最著名的是亚伯拉罕·棣莫弗,他的机会学说构成了现代统计学的重要基础。[5]一位熟悉劳的人写道:

    如果你问我劳的消息,那么我只能说他从早到晚只和玩纸牌的人在一起。他赌博时总是很开心,每天都会提议不同的游戏。他向所有能连续投6个6的人出价10000块亮片,但如果他们投不到,那么他们每次都要给他一块亮片。[6]

    由于连续投6个6的概率是1/46656(1/66),劳的出价一定会获胜(在第10000轮6次投球之前,他输球或付款的概率为19%)。此外,只要有机会,劳都会充当纸牌的“银行家”,他可以扮演赌场而不是客户的角色,无论什么样的特定游戏规则,他都能利用一点儿统计方面的优势。[7]

    据经济历史学家安托因·墨菲估计,当劳离开法国时,他从赌场赢来的钱总计几十万英镑,这在当时是一笔巨大的财富。[8]然后他去往荷兰,在那里,他研究了阿姆斯特丹银行和该城市新证券交易所的尖端业务。他还访问了热那亚和威尼斯,熟悉了那里具有数百年历史的银行体系。

    那个时代的法国人不信任国家管理机构,因此法国几乎不存在银行体系。攒下来的里弗尔(法国古代货币)放在床垫下或袜子里,而不是放在银行里,经济急缺资金。[9]劳赞叹于意大利和荷兰的先进金融体系,并努力使之为法国带来好处;在大约10年的欧洲大陆游历中,劳将自己从职业赌徒转变为经济学家。尽管当时经济学家这一术语还没有出现。

    劳直观地认识到以稀缺金银为基础的货币供应不足是如何扼杀欧洲经济的,而充足的货币供应又是如何刺激欧洲经济的。他早已熟悉私人发行纸币的概念,但以他在荷兰银行业的经验,他认为由中央国家银行发行纸币才能解决货币基础不足的问题。

    劳的这种充足的纸币供应能够刺激经济的直觉,可以通过3个世纪后华盛顿特区出现的婴儿合作社的著名故事(至少在经济学家中非常著名)来理解。这种合作社涉及婴儿保育服务的交易。最流行的方案之一是使用“代金券”:一种票证,每张代表半小时的婴儿照顾时间;因此,一对想要看三个小时电影的夫妇需要使用六张票证。

    此类代金券/票证方案的成功在很大程度上依赖于流通中票证的精确数量。20世纪70年代早期,华盛顿特区有一家这样的合作社,由于它印制的票证数量不多,因此家长们就把它们收藏起来。许多人愿意照看孩子以赚取票证,但愿意花票证请人照顾自己孩子的人很少,因此每个人晚上出去的时间都比自己原本想要的少。

    在华盛顿特区,许多父母都是律师,正如律师们惯常做的那样,为了解决问题,他们通过立法强制要求个人花这些票证。但在经济领域,通过立法解决问题往往会失败,本案也是这样。于是一对经济学家夫妇说服合作社印刷并分发更多的票证。家长们有了充足的票证,所以晚上会出去玩儿更长时间。[10]

    同样,劳的金匠/银行业背景和经验告诉他,欧洲经济停滞的原因是铸币短缺,除了其他措施,印刷纸币可以弥补铸币的短缺。劳并不是第一个意识到这一点的人;几乎从17世纪初金匠/银行家发明弹性信贷开始,他们中的一些人就认识到,扩张纸币可以刺激经济。1650年,也就是在约翰·梅纳德·凯恩斯将以黄金为基础的货币体系称为“野蛮遗迹”的3个世纪之前,王室官员威廉·波特就指出,流通中有限的铸币数量意味着:

    尽管世界上的仓库从来没有像现在这样装满商品,但是你将会看到,由于支付能力不足,商人们进货的速度慢于他们为商品找到销路的速度,而接下来,如果人们由于极度贫困而无法从商人手中买走商品,那么贸易的大门将会关上,其结果就是财富的大门会关上……反之,如果所有人手中的货币(或者类似货币的东西)增加,那么(商人们就不需要囤积货币,只要一有货币,他们就会买进商品,并将其摆在货架上),随着货币供应量的增加,人们手中的钱越多,商品贸易就越多;而这种贸易的增加将增加财富……因此,财富的关键在于增加货币,或者类似货币的东西,而不是囤积货币。[11]

    法国以及劳的祖国苏格兰的银行体系远比荷兰和意大利更为原始,因此,法国和苏格兰的经济运行不佳。罗讷河谷纺织业的恶劣状况给劳留下了特别深刻的印象,他制订了一项通过发行纸币为工厂、托儿所、面包房和作坊融资的计划。1703年底,他认识的一位法国驻都灵大使,将他的建议转述给法国财政大臣沙米亚尔侯爵,但后者婉拒了他。

    新年前后的某个时间,劳回到了苏格兰,那里的情况更加变化无常。早些时候,在1695年,苏格兰议会将该国的远洋贸易垄断权授予苏格兰非洲和东西印度群岛贸易公司(更广为人知的名字是“达里恩公司”)。公司计划在巴拿马地峡的达里恩建立一个贸易前哨站,以缩短从欧洲到亚洲的贸易路线。该公司向达里恩派出了两支探险队,第一支探险队由于计划和供应不善而遭遇失败,而第二支探险队的成员则被西班牙人屠杀。

    1699年,该哨站落入西班牙人手中,苏格兰银行不得不暂停营业。银行的经营困难使劳感到悲痛,他进一步完善了他的经济思想,写成了两本作品:《土地银行》和《论货币和贸易》。前者提出发行以土地为担保的纸币;后者是一本详细而精辟的书,为亚当·斯密的《国富论》一书中的许多概念埋下了70年的伏笔。

    劳开始以一种非常现代的方式深入思考货币的本质。他认为,真正的货币应该有7个基本特征:价值的稳定性、同质性(也就是说,它可以以固定单位交易)、易于运输性、各地统一性、易储存而不损失价值性、可分割成更小或组合成更大的货币量,以及拥有一个关于其价值的印章或标识。[12]

    劳认为土地正符合这些标准,与土地挂钩的纸币将优于锚定白银的传统货币。在今天看来,这种以土地为单位的货币概念似乎很奇怪,但在18世纪早期,它是有道理的。大约从1550年开始,白银从秘鲁和墨西哥的巨大矿场涌入欧洲,这导致其价值贬值。相反,表示一块土地的证书可以根据其未来粮食、水果或动物产量的总和进行估价。此外,白银只有少数几个限定用途:货币、珠宝和器皿或工业用途。相比之下,土地在支持纸币的同时,还有各种广泛的农业用途。[13]正如劳所写,“土地产生了一切,但白银只是产品。土地的数量不会增加或减少,白银或其他任何产品的数量可以增加或减少。因此,土地的价值比白银或其他任何产品更为确定”[14]

    劳逐渐将他的货币概念扩展到了土地之外,包括了那个时代最伟大公司的股票,特别是英国和荷兰东印度公司以及英格兰银行,他认为,这些公司的利润应该比白银更稳定。这是一个合理的假设;但劳没有预见到的是,他的体系本身会给那些价格带来致命的不稳定性。

    作为卡尔·马克思的先驱,劳提出了社会发展的三个阶段。在第一个阶段,货币是不存在的,易货是交换的主要形式,这时,大规模的生产制造几乎是不可能的,因为那需要前期大量的货币开支。用劳的话说,“这种易货状态下几乎没有贸易,也很少有手工生产者”。[劳的“贸易”一词具有现代GDP(国内生产总值)的意义:指消费的商品和服务总量。我们现在认为,劳认为货币时代之前是易货阶段,这种说法是不正确的,因为在原始社会,交换是通过互相赠送和积攒记号来完成的,这些做法的经济效率比易货更低。][15]

    在第二个阶段,经济在金属货币的基础上运行,但金属货币太少。虽然从理论上讲,如果货币短缺,人们就可以在较低的工资下工作,但这会妨碍制造业发展:

    人们会问,如果各国的管理良好,那么为什么它们不自己加工羊毛和其他原材料?是因为在货币短缺的地方,工人的工资很低吗?答案是,没有货币就没有人愿意工作;而且,在货币很少的地方,其几乎不能满足国家的其他需要,因为人们不能同时在不同的地方使用同一枚铸币。[16]

    在第三个阶段,当货币和信贷充裕时,国家繁荣。英国就是一个典型的例子,它在10年前刚刚成立了英格兰银行,以发行钞票。[17]银行周期性地增加和减少钞票供应;劳观察到,“随着英国货币的增加,(国民收入的)年均值也增加了;随着货币的减少,年均值也随之减少”[18]

    劳首次描述了一个被称为“循环流动”模型的经济概念(他的理论核心),这在他的《论货币和贸易》中有数页解释。该模型可以想象为两个同心圆,货币从一个所有者向另一个所有者以顺时针方向流动,而商品和服务则逆时针流动。

    劳设想了一个孤岛,它由一位领主拥有,该领主将自己的土地出租给1000名农民,这些农民种植农作物并饲养动物,其产出占岛上产出的100%。但制成品不能在当地生产,而是通过出口多余的谷物以换取制造品进口。

    此外,岛上还有300名没有工作的贫民,他们靠上帝和农民的施舍生存。为解决这种悲哀状况,劳让领主印刷足够多的货币,用于建立工厂并雇用300名贫民,工人的工资将用于购买农民的粮食。这将增加农民交给领主的租金,领主可以继续用租金支付工人工资。

    正如现代任何一个凯恩斯主义者都会做的那样,劳将他的例子做了概括:

    贸易(也就是现代术语中的GDP)和货币相互依赖:当贸易衰退时,货币减少;而当货币减少时,贸易就会衰退。权力和财富依赖于人的数量以及国内外商品的储存数量;而这些又依赖于贸易,贸易又依赖于货币。因此,贸易和货币两者之间会产生直接和必然的影响;损害其中任何一方都将损害双方,权力和财富都将是不稳定的。[19]

    劳提出一个由苏格兰银行发行纸币的方案,但这个方案被苏格兰议会于1705年投票否决了。两年后,苏格兰通过了《联合法案》,根据该法案,苏格兰与英格兰合并,这样劳在苏格兰就面临着生命危险,因为他本应在伦敦被监禁和处决。劳请求安妮女王的赦免,但被拒绝,于是他逃回了欧洲大陆,在荷兰、意大利和法国之间辗转10年,然后于1715年在巴黎定居。[20]

    那时,他又一次被法国财政大臣沙米亚尔拒绝,他的另一个在都灵开设银行的计划也被萨伏依公爵否决。接下来,他大胆地寻求路易十四的支持。到1715年夏天,路易十四已经统治法国72年,这是欧洲君主至今的最高纪录(伊丽莎白女王必须活到98岁,也就是2024年,才能超过路易十四的在位时间)。路易十四正打算批准劳的建议时却患上了坏疽,他明确地告诉摄政王奥尔良公爵:“我的侄子,我让你成为王国的摄政王。你将目睹一个国王在坟墓里,而另一个在摇篮中;你要永远记住前者的记忆和后者的利益。”[21]英俊、迷人和富有的劳获得了摄政王的支持,并最终说服摄政王进行了一次大规模的金融尝试。

    1715年9月路易十四去世时,法国已经因参与西班牙王位继承战争而濒临破产。劳曾试图组建一家大型国有银行,但受到摄政王的限制。1716年,他成立了“私人通用银行”,正如其名所示,这是一家私人企业,总部设在劳的家里,劳成为一位新加入的法国公民。

    当时,只有5个国家——瑞典、热那亚、威尼斯、荷兰和英格兰——发行了纸币,但其不能用于日常小规模交易,因此法国人对私人通用银行的纸币持怀疑态度。[22]新银行成立之初,劳就立即规定,新纸币可以与流通中的黄金和/或白银一对一兑换。由于当时的法国长期资不抵债,经常发行不足值的金属铸币,因此新纸币的价值比当时流通中的金属铸币要高。为了吸引富有的客户并增强信心,他将存款准备金率保持在较低水平,并开展了一些“亏损业务”,包括免费兑换外币和按银行纸币面值兑换铸币业务,而不是按低得多的(高折扣的)普通的政府纸币价格进行兑换。[23]

    由于票面价值得到了保证,劳的银行纸币和服务所具有的优势引起了人们的注意。正如劳预测的那样,纸币供应的增加提振了王国经济。

    劳的下一个目标是密西西比公司。该公司最初于1684年获得特许经营权,后来通过与其他公司合并而获得法属美洲的贸易垄断权,但由于未能成功利用这些垄断权,其经营者安托万·克罗扎于1717年将特许经营权交还给了国王。现在,由于私人通用银行的成功,劳声名鹊起,他承诺通过让密西西比公司买断王室的巨额债务来拯救国家财政。在这个过程中,劳通过投机买卖公司股票,本已惊人的赌博财富更是成倍增加。

    为了使密西西比公司承担起王室的债务,他让王室扩大他的垄断权,垄断与中国、东印度群岛和“南海”(赤道以南的所有海域)的贸易。但几乎所有的相关贸易路线都已在英国、西班牙、葡萄牙的控制之下。[24]因此,密西西比公司对于这些新大陆贸易的“垄断”毫无价值。但是,这一点儿也没有减少劳的新金融体系的魅力。

    密西西比公司承担了王室的巨额债务,主要是以公民国库券的形式,国库券当时的利率为4%。由于王国的财政状况很脆弱,国库券的交易价格大大低于其面值;劳承诺,他的计划将使国库券的交易价格达到面值,这对王室来说是一个不可抗拒的诱惑。1718年12月,劳成功地使他的私人通用银行升级为国家银行,即“皇家银行”,该银行完成了货币流转链条:新银行将发行纸币,以支付密西西比公司的股票;纸币将用于购买国库券,从而减轻国王的战争债务。难以理解的是,国库券也可以直接用于购买公司股票;由于国库券是债务,公民用国库券购买股票意味着国库券的消失,这进一步改善了王室的财政状况。[25]

    劳的权力使他沉溺于与银币的斗争,他将银币视为国家的经济锁链。硬币被抛弃,纸币被引进。早在私人通用银行存续期内,政府就已经允许公众用私人银行发行的纸币支付税款。1719年初,皇家银行在法国各大城市设立分行,在这些城市,高于600里弗尔的白银交易必须用银行纸币或黄金进行;禁止使用银币支付。到1719年底,皇家银行已经买进了大部分的国库券,国家债务的消失进一步鼓舞了这个国家的动物精神。

    随着密西西比公司股价的上涨,银行印制了更多的纸币以满足对股票的需求,这进一步推高了股票价格,从而导致更多的纸币发行。很快,第一个记载翔实的全国性股市泡沫正在形成。冒失的货币扩张并不完全是劳一个人的作品,也受到了摄政王的影响。劳理解螺旋型通货膨胀的特点,但摄政王并不理解这一风险,他只是被该计划的成功鼓舞。

    以所谓的“永久资本”运营的现代公司,这只是一种花哨的说法,实际上就是,如果某个项目需要10亿美元,那么将通过销售股票来筹集大部分资金;如果费用预测准确,那么该项目将随后完成。

    密西西比公司的股票并非如此。该公司的股票不需要以全价直接购买,而是以认购的方式,以现金支付10%的股价。也就是说,为了获得股份,购买者只需支付10%的股价和20个月的分期付款(或“催缴股款”,每笔5%)中的第一笔,即只需要支付股价的15%。催缴机制是金融杠杆的一种早期形式,如果价格上涨15%,投资者的首期付款价值就翻了一番,它会放大收益和损失;如果价格下跌15%,那么投资者将被清出市场。因此,催缴机制可以被认为是保证金债务的祖先,而保证金债务是随后出现许多金融崩溃的原因,最明显的一次是在1929年。[26]

    为了满足对公司股票的需求,劳的银行发行了更多的股票;查尔斯·麦基描述了接下来发生的事情:

    至少有30万人申购这5万份新股,劳在坎康普瓦大街的住宅从早到晚都挤满了热切的申购者。由于不可能满足所有的申请人,新股东名单只能在几周后才公布,在此期间,公众的焦急情绪达到了疯狂的程度。公爵、侯爵、伯爵以及他们的夫人每天都要在劳家门前的街道上等待数小时,以了解结果。最后,成千上万的人挤满了整条大街。为了避免平民人群的推挤,贵族们在邻近的房子里租了公寓,这样他们就可以一直住在这位新财神爷散播财富的神庙附近(见图3-1)。[27]

    图3-1 约翰·劳的巴黎

    人们很少谈论其他事情,几乎所有有幸拥有股票的贵族都忙于买卖股票。坎康普瓦大街的租金上涨了15倍。

    劳对拥挤的人群感到厌倦,于是逃到他在旺多姆更宽敞的住所,但那里也很快挤满了人。这引起了议长的愤怒,因为议长的法庭就在旺多姆广场上。最后,劳搬到了苏瓦松酒店,那里有一个足够大的花园,花园可以容纳几百个帐篷;拥有该房产的幸运贵族以每月500里弗尔的价格出租每一个帐篷。

    麦基回忆说:“如果在某次会面中,摄政王让贵族们等了半个小时,那么他们会被激怒,但他们愿意等6个小时得到一次与劳见面的机会。”[28]一位女士巧妙地利用了劳对女士的殷勤,她故意让马车在劳面前翻车,劳不出所料地过来救助:她很快就承认了这是她的小伎俩,劳被她逗笑,于是给她签发了股票。拘谨的麦基提到了另外一个会让读者“微笑或脸红”的情节,但没有描述它,只是害羞地提到了一封奥尔良公爵夫人写的信:

    劳太忙了,日夜不得休息。一位公爵夫人在众人面前吻了他的手;如果公爵夫人吻了他的手,那么其他女士会如何?[29]

    其他观察者也证实了麦基的描述。1719年9月,英国大使馆的一名办事员向伦敦报告说:

    坎康普瓦大街是他们的交易场所,从清晨到深夜,这里挤满了亲王和王妃,公爵、贵族和他们的夫人等,总之,这里在法国非常有名。他们出售房地产、典当珠宝,以购买密西西比公司的股票。

    一周后,这名办事员又写道:“这个镇上的所有新闻都是关于股票买卖的。目前,法国人的脑子不会转向任何其他事情。”[30]巴黎成为一个繁荣的城市。泡沫期间,人口膨胀,城市不可避免地受到食品、服务和房地产价格飙升的负面影响。这种气氛高涨的环境下产生了“百万富翁”一词,其被普遍用来形容幸运的股东。[31]另一份大使馆报告写道:“昨天有人告诉我,一家商店在不到3周的时间里出售了80万里弗尔的蕾丝和亚麻布,主要是卖给一些以前从未穿过蕾丝的人;诸如此类的报道每天都如此令人意想不到,其他国家的人根本就难以相信。”[32]

    泡沫通常结束于看似很小的扰动,然后迅速崩塌。震动发生在1720年初,当时孔蒂亲王因没有买到足够多的公司股票而被激怒,为此,他派出了三辆马车,去皇家银行(卖出纸币)换取铸币,这些铸币本应是银行发行新纸币的基础。劳当时担任法国财政部长,不能在公众面前拒绝这一糟糕的请求,因此他做了次好选择:他向摄政王抱怨,摄政王强迫孔蒂撤销这一要求。敏锐的投资者意识到亲王所提要求和摄政王默许拒绝背后的含义:银行发行的纸币数量大大超过了其黄金和白银储备。随后发生了对该银行的全面挤兑。

    劳现在面临着一个危急的选择。他可以通过减少印刷纸币来保护货币币值,但这将损害股价;或者他可以通过印制更多的纸币来保护股价,而这将加剧本已猖獗的通胀。前一种做法将保护法国;后一种做法将保护贵族投资者。

    起初,劳选择保护货币,从而保护国家,或者他认为是这样。1720年2月底,陷入绝望的劳和摄政王开始禁止使用铸币进行交易,并将私人拥有的铸币限制在500里弗尔以内;此外,还禁止囤积银制器皿和珠宝,并招募告密者和经纪人来强制执行这些可恶的新规定。随着仆人背叛主人,父亲背叛儿子,国家的社会关系网开始瓦解。

    由于社会如此混乱,两周后,劳转而保护股价,从而保护富人,他提出每股出价9000里弗尔,这意味着需要印刷更多的银行纸币。到那时,里弗尔贬值带来的通货膨胀已经非常明显,到5月份,他通过两个步骤让里弗尔贬值了50%。1720年后期,为了控制通货膨胀,他宣布大面额纸币价值为零,抹去了国家的大部分财富;经济历史学家安托因·墨菲估计,包括密西西比公司股票和纸币在内的整个系统经通胀调整后的价值下降了约87%。对纸币和密西西比公司股票的最后一击是在那年秋天,瘟疫肆虐马赛,并威胁到巴黎,这进一步动摇了金融信心(见图3-2)。[33]

    图3-2 1719—1720年密西西比公司的股票价格

    至此,劳不仅耗尽了银行资本,也耗尽了他的政治资本。为了避免进一步的尴尬,摄政王允许他体面地离开巴黎,即先去巴黎郊区,然后出国。此时,他谋杀博·威尔逊的罪名已经获得王室的赦免。生命的最后几年里,劳在英格兰和欧洲大陆四处奔波,逃避债权人,其中最著名的债权人是伦敦德里勋爵。1719年9月,劳与伦敦德里勋爵下注,他认为密西西比公司将损害英格兰东印度公司股票的价值,因此承诺未来将向伦敦德里交付大量EIC(东印度公司)股票,这有效地“做空”了EIC的股票(“做空”就是押注股价下跌)。但是,南海泡沫(密西西比泡沫的伦敦孪生兄弟)期间,EIC的股价飙升,同时劳的体系又使法国货币相对于英国货币大幅贬值,这个赌注对劳来说成为一个灾难性的赌注。[34]

    尽管劳已经成为奥尔良公爵的政治负担,但这位摄政王仍然珍视他的才华,如果摄政王没有在1723年去世的话,那么可能会将劳重新召回巴黎。最终,劳于1729年在他深爱的威尼斯病逝,遗留下的主要财产是大量艺术收藏品,几乎没有其他东西。但总的来说,他是幸运的;而未来的泡沫主角往往会有更悲惨的结局。[35]

    密西西比公司确实拥有过一片美洲土地,就是后来的路易斯安那州。但在18世纪早期,该地区人口不足,而且流行疟疾病。为了给这片领土招募定居者,为公司的新大陆经营做准备,劳制作了欺骗性的小册子,将该地区描述为人间天堂。广告宣传失败后,劳又开始征募数千名男女白人囚犯以及非洲奴隶。

    违反纪律的士兵、名门中的害群之马、乞丐、妓女以及任何毫无戒心误入巴黎的农民都被强行运到了墨西哥湾沿岸。那些自愿去的人可以得到免费的土地、饮食和前往新领土的免费交通。[36]

    路易斯安那州所谓的“首府”,在现代的比洛克西和莫比尔[37]之间交替,不过是一处仅有几百名定居者的恶臭营地,他们中的大多数人在1721年公司倒闭后逃往新首府新奥尔良。[38]

    两个世纪以来,劳一直被描绘成一个无赖。最典型的是丹尼尔·笛福[39](以“迷雾先生”的笔名写作)写给那些希望获得巨大财富的人的建议:

    迷雾先生说,如果你已经下定决心了,除了这样做,没有什么别的办法,那么你必须做什么?很简单,你必须佩剑,杀一两个花花公子,被关进纽盖特监狱,被判绞刑,然后越狱,假如你能做到的话,记住,顺便去一个陌生的国家,转做股票经纪人,发行一支密西西比公司的股票,搅动一个国家的泡沫,那么你可能很快就会成为一个伟人;如果你有好运气,那么根据一句古老的英国格言——一旦你敢做一个记录在案的流氓,你可能很快就有希望成为一个贵族。[40]

    经济史学家们对他更为宽容。在劳的时代,经济运行中的货币不以黄金和白银为基础,这种想法在当时似乎是革命性的,甚至是可笑的。但今天的绝大多数经济学家认为,将货币供应量建立在矿山或珠宝盒中的金属量的基础上更加愚蠢。例如,金本位制的权威经济历史学家巴里·埃森格林发现,各国从大萧条中复苏的顺序与它们放弃硬通货(指金属硬币)的顺序恰好一致。[41]从本质上说,我们生活在一个叮当仙子[42]的经济中,因为每个人都相信纸币幻觉,所以它运转良好。就像穿越海格力斯之柱[43]航行、死于地中海之外的远古水手一样,劳的体系——一种群体幻想——由于缺乏经验而走向了失败,但也照亮了未来的路。

    密西西比泡沫传染了整个欧洲大陆。狂热时期,顽固的威尼斯人不再反对合股公司[44];有一些合股公司开始热情地发行股票,但后来随着巴黎灾难的消息南下而消失。荷兰也不愿落后于法国,紧随其后,进行了44次股票发行,其中有30次的价格几乎立即翻了一番。在稍欠发达的欧洲地区,贸易公司像野花一样遍地开花,然后迅速消失;18世纪欧洲股票发行中有整整40%的比重发行于1720年。[45]

    法国泡沫在伦敦最响亮的共鸣来自约翰·布朗特爵士,他出生在正确的时代。1689年,他25岁,英国在这一年继1688年光荣革命之后确立了君主立宪制。这一年,荷兰政权持有者威廉三世应英格兰新教势力的邀请进入英格兰,并以国王的身份登上王位,结束了英格兰斯图亚特君主制时代。

    在此之前,英格兰没有“国家债务”,只有国王及其家人的私人债务。1685年查理二世去世时,他和他的兄弟以及侄子欠了伦敦银行家约100万英镑,没有偿还一分钱的利息或本金。[46]由于王室不偿还贷款的风险一直存在,银行家们就理所当然地收取高利率,这压制了英国经济的发展。光荣革命之后,君主立宪制建立,国王放弃了原有的神圣权利,权利不受限制的问题得以解决,这立即使政府债务对银行家来说更具有吸引力。这反过来又更普遍地降低了利率;由于相对安全的债券不能获得高回报,投资者寻找风险更大的投资机会。这引发了未来10年合股公司的繁荣。

    布朗特是一位浸信会鞋匠的儿子,曾当过撰稿人(也就是从事法律和金融文件的写作,是一个传授房地产和金融活动内幕知识的职业)。借着这个职业,他进入一家小型商业企业集团,该集团包括一家亚麻布企业和一家伦敦供水公司。随后,他又受雇于一家最具野心的新合股公司——剑锋公司。

    起初,该公司生产先进的法式剑杆,但很快就将业务扩展到土地投机和政府债务交易。(商业模式的彻底改变,是与泡沫有关的金融诈骗的一个特征;近3个世纪后,安然公司也从一家枯燥沉闷的管道公司和发电厂蜕变为一家期货交易巨头,直至风险暴露。)

    1710年,布朗特的商业头脑引起了英国财政部长罗伯特·哈雷的注意,他请布朗特帮助解决国家巨额债务问题。与法国一样,英国的巨额债务也是从西班牙王位继承战争中遗留下来的。布朗特确实有那么一两个办法。他对债务的解决方案就是利用人们的投机心理,这也将成为他的招牌方法:政府将发行利率为6%的传统债券,债券中含有彩票,奖金从20英镑到高达12000英镑不等。债券的发行非常成功,这推动了一项更具吸引力的计划——“200万人的冒险”:一种复杂的分层彩票,起价100英镑,连续五次抽奖,最高奖金不断增加,分别为1000英镑、3000英镑、4000英镑、5000英镑,最后是20000英镑;每次抽奖,都有可能实现更大的回报,以此让输家留在游戏中。

    这些投机项目的成功使哈雷更加大胆,他于1711年成立了南海公司,目的是接管英格兰的所有巨额债务,他本人担任董事,董事会中有很多剑锋公司的人,包括布朗特。[47]作为承担政府债务的交换条件,南海公司与密西西比公司一样,获得了南美洲贸易的垄断权,但事实上当时西班牙和葡萄牙已经控制了南美洲,而且该公司董事会中没有一个人有与西属美洲贸易的经验。作为获得这项“垄断”权的部分交换条件,该公司承担了1000万英镑的政府债务。

    具有讽刺意味的是,英国南海泡沫正是在对法国体系的恐惧和嫉妒中产生的,它与巴黎泡沫几乎同时发生。但1717年密西西比公司承担法国国债,这种做法实际上是学习了此前南海公司对英国国债的承担。自1711年南海公司获得经营权的8年里,用承担政府债务换取新大陆贸易的“垄断”权,这种交换规模一直很小;但到了1720年,飞速发展的法国密西西比公司以及数千人涌入的坎康普瓦大街,让英国人羡慕不已。当年法国泡沫吹得最大时,丹尼尔·笛福在巴黎街头写道:

    你们,英格兰的迷雾先生们,在伦敦的你们是一群迟钝、冷漠的家伙;而在巴黎的我们喝着勃艮第酒和冒泡的香槟。你们连巴黎人民的一半聪明都没有。我们这里有清新的空气与柔和的火焰。100可以积累到2000,现在的股息为40%。[48]

    由于担心英格兰会被法国波旁家族所设计的金融永动机压倒,南海公司和议会设计了一个类似的体系,由南海公司承担更多的国家债务(约3100万英镑),这些债务的主要形式是年金。有人提议,这些债务的持有人,即年金受益人,应该自愿将这些政府债券转换为公司股票。

    当然,年金主要持有人是英国公民,他们从中获得收入。年金持有人必须得到一个有吸引力的报价才肯卖出,而最简单的方法就是刺激他们的大脑边缘系统,让他们相信公司的股票价格会上涨。

    南海公司出售了各种形式的股票。最典型的一种,是卖出一份票面价值(签发时的价格)为100英镑的股票,从年金持有者那里换取100英镑的年金。股票价格越高,公司越受益,因为这使公司能够为自己保留更多的股票。例如,如果股票价格上涨至200英镑,公司就只需卖出比100英镑价格时少一半的股票,并保留剩余的一半股票;如果价格上涨到1000英镑,公司就将保留90%的股票。随着股价的上涨,股票更受欢迎,这是一个正反馈循环,是所有泡沫的核心特征。

    现在,差不多3个世纪后,布朗特和哈雷对心理学的掌控的本质变得更加清晰。他们偶然发现了一种强大的方法,利用了非常古老的人类现象:人类偏好于“正偏态结果”——概率很低但是回报丰厚,即使所有回报的均值为负。例如,任何一个理性的人都不会买一张价值2美元的彩票,这张彩票的结果是50%的概率获得3美元,50%的概率什么都得不到,即它会产生1.5美元(0美元和3美元的平均数)的回报,平均损失率为25%。然而,许多人会买另一张价值2美元的彩票,它有1/2000000的机会获得3000000美元,这意味着平均赔付额也是1.5美元(3000000/2000000),平均损失率也是25%。[49]

    换句话说,哈雷和布朗特找到了一条通往人类贪婪之地的道路:大脑边缘系统强大的奖励预期电路。这是一种本能,这种本能曾经让远古狩猎者获利,但在金融领域是有害的。

    正如我们所知,在南海的垄断权几乎没有价值,但这并不妨碍该公司散布最捕风捉影的谣言。麦基写道:

    他们提到了英国和西班牙之间的条约,根据这些条约,所有西属殖民地可以自由贸易;从波托西-拉巴斯[50]矿中开采的丰富的白银将被运到英国,英国的白银将几乎与铁一样充足……与南海进行贸易的商业公司将成为有史以来最富有的公司,每投资100英镑,将为股东带来每年数百英镑的收入。[51]

    为了确保议会同意该计划,南海公司向议员们贿赂股票,该计划通过后,这些股票大幅升值。1720年4月14日,首次允许以现金形式出售股票;两周后,首次允许公众用年金换取股票;此时股价已从年初的120英镑上涨至约300英镑;到了6月,达到1000英镑以上的峰值。布朗特设计了极其复杂的细节,将这场200万人参加的冒险活动提升到了一个新的水平:公司部署了不同级别的股票连续认购,旨在吸引公众的注意力。最后,如前所述,股价越高,公司买进政府债务时向持有人提供的股票数量就越少,从而更多股票掌握在布朗特及其同僚们手中。[52]

    与法国泡沫相比,英国泡沫有四个特征。首先,法国泡沫几乎完全围绕一家公司的股票,但英国泡沫中,受当时普遍的乐观情绪所鼓励,还存在很多其他企业的上市股票。麦基列出了不少于86家被称为“泡沫公司”的英国企业,而随后的历史学家们确定的数量更是翻了一番。虽然大多数企业筹资都是为了实体经济,例如修建公路、房屋以及建立进口商品贸易,但也有很多计划是不切实际的:“头发贸易”、“永远转动的车轮”、“热风烘干麦芽”以及“将水银转化为可锻性精炼金属”。当代现存的一些资料列出了各种各样的筹资项目,其中有许多可能是虚构的,比如一个“大脑的空气泵”,或者“抽干红海的水,找到犹太人离开后遗弃在埃及的宝藏”,或者,最著名的是“为了一项大有裨益的事业;但没人知道这项事业是什么”。[53]

    南海泡沫的第二个显著特征是英国泡沫公司的杠杆程度极高。与密西西比公司股票需要15%的首付类似,南海公司股票的首期付款仅为10%~20%,其余部分将在后续催缴中缴纳。而泡沫公司的杠杆率则高于南海公司,也就是说,它们的初始认购价格较低;有时,一先令[54]可以认购一股价值1000英镑的股票(占规定购买价格的0.005%)。因此,泡沫公司的资金非常匮乏,经常会快速破产。但是,仍有少数公司资本充足,管理良好,得以生存,其中包括两家保险公司:伦敦保险公司和皇家交易所。

    股东们的财富疯狂增加,对公众产生了诱惑。麦基写道:“公众的思想处于一种不健康的发酵状态。人们不再满足于谨慎而具有可靠利润的行业,因为这些行业赚钱缓慢。明天将拥有无限财富的希望,使人们今天的行为无所顾忌,挥霍无度。”[55]

    18世纪早期的伦敦可以看作两个独立的部分:西面是威斯敏斯特区,是政府所在地,有议会大厦、圣詹姆斯宫和为白金汉公爵新建的白金汉宫;东部是商业中心,即“伦敦金融城”,其就是皇家交易所,首都的商业精英们也在这里从事各种形式的国内外商业活动:交易羊毛、木材、谷物和无数其他商品(见图3-3)。

    图3-3 南海泡沫时期的伦敦地标

    股票经纪人受到商业人士的鄙视,在皇家交易所大厅里不受欢迎,被赶到一条聚集了很多咖啡馆的狭窄小巷,这条小巷夹在伦巴第街和康希尔街形成的锐角中,被称为“交易巷”。

    通常情况下,“金融家”们在咖啡馆兜售股票,投机者在那里排队。股票的认购价格通常非常低,然后,买到股票的投机者匆忙来到附近的“交易巷”,通过股票经纪人的斡旋,他们把股票卖给更大的傻瓜。1720年春夏之交,这里的景象和巴黎坎康普瓦大街一样疯狂:哈克尼出租车供不应求,人们即使打到了车,也可能被堵在狭窄的街道上。卖咖啡的商人挤在像乔纳森、加洛韦和山姆这样的咖啡馆,小偷们也很猖獗;在巷子里比在王宫里更容易找到国王和他的宫廷人员。一位律师将此过程描述为“更像是所有疯子同时从疯人院逃了出来”[56]

    和巴黎一样,投机助长了普遍的价格膨胀。乔治一世国王举办了全国有史以来最奢华的生日聚会,公司的董事们拆除了豪宅以建造更大的豪宅。在现代金融史的大部分时间里,房地产价格都是年租金的5~20倍;而1720年,伦敦房地产的出售价格是年租金的45倍,这一比例和21世纪初的房地产泡沫期间的比例接近。[57]南海的热情也见证了泡沫的另一个特征的诞生:证券投机成为一种时尚。在投机活动达到高潮时,伦敦的社交场合从圣詹姆斯宫和威斯敏斯特宫(即议会大厦)向东转移到伦敦金融城;在那里,一群贵族女士在“交易巷”附近租了一家商店,“闲暇时间里,当经纪人外出时,她们追捧中国瓷器”[58]。这种兴奋也不仅仅限于贵族:
    还有德鲁里巷的年轻妓女,
    她们通过在豪华马车里的交易,
    通过放荡,
    骗走他们赚得的金子。[59]

    这种氛围不利于理性决策。投机在贵族中最为热烈;6月,接近顶峰时,忧心忡忡的财政大臣约翰·艾斯拉比建议乔治国王将价值8.8万英镑的公司股票兑现为现金,这位粗鲁的国王将艾斯拉比称为懦夫,但艾斯拉比坚持己见,最终国王将其持有的约40%的股票转换为安全资产。[60]

    南海泡沫的第三个显著特征是肇事者越来越狂妄;密西西比事件中的肇事者约翰·劳一直保持了他与生俱来的礼节,但他的英国同行不是这样。虽然我们可以将布朗特或艾斯拉比形容为轻信的或虚伪的人,但这只是一个起点。从一开始,商业社会便将财富等同于智慧和正直;拥有财富的人喜欢听到别人说他们具有卓越的智力和道德品质。伴随着在金融领域内的成功,他们获得的财富和奉承不可避免地让他们产生一种侵蚀自我意识的自负。更糟糕的是,巨额财富往往更多地来源于欺诈,而不是智慧和实体经济。在这种情况下,奉承会腐蚀灵魂,正如布朗特身上所发生的那样,他这时已经演变为现代狂妄自大CEO(首席执行官)的原型。有一本作者不详的小册子,可能是作者在布朗特倒台后不久写的,描述了南海公司崩溃前不久,布朗特去往时尚度假胜地坦布里奇韦尔斯:布朗特去往坦布里奇韦尔斯的装备多么华丽,那里对他有多么尊重,他在那里表现得有多么傲慢,他和他的家人在谈到这个项目时怎样称之为“我们的项目”[61]。小册子的作者描绘了一幅经典画面:

    (布朗特)在他任期的前几个月里,除了他自己,从未允许任何人就(公司交易)做出提议;法庭记录中也没有任何与此有关的会议记录,而只有他口述的内容。他明显地塑造了一个先知的形象,用一种强调和异常激烈的语气说话;他习惯于摆出威严的姿态,斥责那些对他所说的任何话有一点点反对的人,并竭力教导人们。他所说的好像都是出于心血来潮,说的话类似于:“先生们,不要惊慌,你们必须坚定、果断、勇敢地行动。我告诉你们,在你们面前的不是一件普通的事情。世界上最伟大的事情和你们有关。欧洲所有的钱都将集中在你们这里。世界上所有的国家都要向你们缴纳贡金。”[62]

    正如历史学家爱德华·钱塞勒所指出的,从南海泡沫到互联网泡沫,都常常会唤醒其主要人物的狂妄自大:

    伟大金融家所做的计划可能会成为投机狂热的催化剂,金融家自己也会受到影响。其野心变得无限大。一方面,其获得大众面前的成功和普遍的奉承;另一方面,私人事务管理越来越混乱甚至出现欺诈;这两者之间出现鸿沟。[63]

    布朗特策划了对南海公司股票的操纵,包括从认购金中借出部分资金以购买股票。他不仅通过在价格上涨到接近最高值时卖出股票而获利,而且还秘密地向自己、朋友和许多议员增发股票,其中一些是欺诈性的。

    正如通常发生的那样,一个意想不到的事件引发了结局。1720年6月,密西西比公司股价暴跌,布朗特害怕英国其他泡沫公司会抢占南海公司的资金,于是在南海股价达到峰值时推动议会通过了《泡沫法案》。该法案要求新企业必须经过议会批准才能成立,并将新企业的股东数量限制为5名;布朗特还让法院起诉了3家现存的泡沫公司,因为它们违反了公司章程。

    就像在巴黎一样,布朗特的狂妄也蔓延至其他人。如麦基所写的,一位导演,“十分骄傲的无知富人,曾说过要用金子喂他的马”[64]。普通民众也是这样:“通过成功的赌博而暴富的无知的人,他们傲慢专横,让真正有教养和思想的人尴尬,黄金竟然有能力在社会中提拔不值得被提拔的人。”[65]布朗特对其他竞争性泡沫公司采取的行动,使自己反受其害,不仅刺破了泡沫公司,还刺破了南海公司;截至10月底,其股价已从峰值1000英镑跌至210英镑,到1721年底,跌至150英镑以下(见图3-4)。[66]

    图3-4 1719—1721年南海公司股票价格

    第四个特征,也是最后一个特征,就是南海和密西西比泡沫的区别在于它们的格局和范围。约翰·劳不是禁欲主义者,但他并没有只关注自己的私利;他真正希望通过革命性的信贷扩张刺激和推动法国经济的发展。但是,布朗特的计划很狭隘,他想通过南海公司把信贷塞进自己的口袋;当信贷扩张从南海公司扩展到其他企业时,他开始努力限制信贷,目标达到了,但这不仅摧毁了其他企业,也摧毁了南海。但从国家的角度看,布朗特计划的狭隘性使金融部门受到的损害相对短暂,这也成为南海泡沫仅有的优势,区别于法国那样灾难性的银行业崩溃、全国性的通货膨胀以及随后长期持续的对银行的恐惧。[67]

    此外,与密西西比公司不同,南海公司并没有给出一个完全空洞的承诺。即使在18世纪早期,其内在价值也可以做出合理估计。首先,它持有年金受益人(现在是公司股东)提供给它的年金,这些资产的价值大约为每股100英镑,也大约是泡沫破裂后的结算值。

    南海公司的另一个特点是,它继承了1707年西班牙授予安妮女王的西属殖民地(《阿西恩托[68]条约》)奴隶贸易垄断权,这在其假定的业务量中占据了最大份额,而根据与西班牙的条约,授权仅限于一艘装有500吨货物的“年度船舶”,这实际上排除了新大陆产品贸易。然而,新大陆产品贸易几乎对南海公司没有意义,因为公司专门从事于金融,而不是国际商业;可恶的是,其中一名董事为了自己的利益,私自使用公司500吨年限额中的60吨,被当场抓获。到了1714年,也就是泡沫破灭的6年前,由于实际贸易业务没有利润,因此公司退出贸易业务;40年后,该公司以仅仅100000英镑的价格出售了其《阿西恩托条约》的权利。[69]最后,公司的新大陆投资价值已经无关紧要,因为投机者关心的不是奴隶贸易或糖贸易中的利润,而是那些股票买卖的利润,这些股票的价格似乎涨到了天价。

    一位名叫阿奇博尔德·哈奇森的律师兼议员进行了当时最复杂的股价计算,他发表了一系列关于该公司股票的报告。幸运的是,其中一个报告写于1720年6月,正好在繁荣达到顶峰之前;报告建议,股票市值应该是该公司年金资产价值的两倍,也就是200英镑。而当时,股价已经是740英镑;他预言“现在就应该停止当前的这种疯狂”。结果,疯狂又持续了几个月;7月,股价已经达到每股1000英镑,哈奇森以这个价格估算出该公司的总价值几乎已经是英格兰所有土地价值的两倍。[70](20世纪80年代的东京房地产泡沫也是如此,当时东京皇宫的泡沫价格能买下整个美国加州的土地。)[71]

    第二年,在受害选民以及被骗议员的推动下,议会开始调查股价崩溃以及布朗特、他的同僚和政府内部人员积累的巨额财富。财政大臣艾斯拉比成为替罪羊,他被迫辞职,被关进伦敦塔,还有另外6名议员被驱逐。南海公司一直运作到1853年,不是作为贸易公司,只是作为政府债务的持有人。国王成为人们嘲笑的对象,但是没有被制裁。[72]

    一些人提出要监禁甚至绞死南海公司的董事,但董事们在被短暂监禁后勉强避免了这种命运。议会没收了他们的财产,用以补偿项目受害者;布朗特保留了他18.7万英镑资产中的5000英镑,悄悄地退休并到了巴斯[73],在那里建立起一个杰出的后代宗系,其产生了包括主教和维多利亚女王的牧师在内的很多虔诚的后裔。[74]

    《泡沫法案》是在狂热达到顶峰时通过的,该法案不仅阻止了其他公司的进一步投机,而且也无意中导致了南海公司的沉没。该法案存在了一个多世纪。但未来,对狂热及其崩溃的记忆将不可避免地逐渐消失,在激动人心的新技术和宽松信贷的鼓舞下,在发起人、公众、媒体和政客的推动下,市场的动物精神将再次崛起,从而再次产生一波狂热,使这场18世纪初的狂热也相形见绌。

    4 资本主义的英雄

    英国铁路泡沫

    20世纪50年代初,斯沃斯莫尔学院的一位社会心理学家所罗门·阿希进行了一系列开创性的实验,对中世纪群体末日幻想和18世纪金融狂热的传染性进行了研究。

    阿希让大约6个男性参与者围坐在一张长方形的桌子旁,他们正在接受视觉感知测试。他给所有人看了一张卡片,上面有一条固定长度的直线,比如说英寸[1]。然后他给他们看了第二张卡片,上面有三条线,其中一条线的长度也是英寸,另外两条线的长度稍有不同,比如3英寸和英寸(见图4-1)。参与者被要求在第二张卡片上选出与第一张卡片上长度相同的线条。这项任务需要一定的专注力,但也很容易,正常情况下受试者选错的概率是1%,连续参加12组配对实验全部正确的概率是95%。

    图4-1 阿希实验中所用的卡片

    许多(如果不是大多数的话)心理学实验都需要对受试者撒个小谎。这项测试根本不是关于视觉感知的,每组只包含一个真实的受试者。其他参与者实际上是阿希博士的助手;真正的受试者坐在桌子中间附近,这样尽量缩短他与陪试者们的平均距离。

    测试中这个真正的受试者要么最后一个回答,要么倒数第二个回答,因此在回答问题之前,他已经听到来自陪试者们的多个答案。当陪试者们答案正确时,受试者的表现与单独参加测试时相似,所有12组卡片的正确率为95%。但是,当陪试者们故意回答错误时,受试者的表现结果会急剧变差。他们中只有25%的人在12组配对中选择正确,令人难以置信的是,5%的人在12组卡片配对中全部错误。[2]此外,受试者在各组实验中表现一致:如果一个受试者在前6组实验中深受陪试者错误的影响,那么他在后6组实验中也将受到类似的影响。也就是说,其中一些受试者确实比其他人更容易受到影响。

    实验结束后,阿希博士采访了这些受试者,他们的回答发人深省。容易被影响的人担心他们的视力或心理处理能力正在衰退;其中一个受试者说:“我知道这群人不会错。”[3]即使是那些不易被影响的人也对自己与大多数人的分歧感到不安,并感觉到可能别人是对的,其中很少有人能对自己的答案完全确定。

    引人瞩目的社会科学实验往往会成为街谈巷议的话题,阿希博士的例子就是如此。在他的实验之后的几十年里,其结论越来越多地出现在大众媒体、教科书甚至学术文献中,这也恰恰表明了大多数人的随波逐流。[4]

    实际上,这些数据也呈现出一些细微差别。在存在误导性陪试者的情况下,超过一半的受试者的答案是正确的,即非一致性。此外,即使只存在一个答案正确的陪试者,也能显著降低受试者的错误率。对阿希实验的更精准的总结是,一些人比其他人更容易被影响,但25%的受试者没有受到任何影响。那么,很容易想到的是,阿希已经找出了那些最容易受到金融泡沫或世界末日信条影响的人。

    阿希博士的结果尤其显著,因为估计线长这种实验几乎不会受到情感因素的影响。打哈欠也是这样,人们对这种话题往往没有什么情感驱动的想法。当然,正如我们大多数人知道的,并且已经被实验证明,打哈欠是有传染性的。在正常、完全清醒的受试者中,传染性打哈欠不仅可以通过其他人的哈欠诱发,还可以通过打哈欠的视频诱发,即使打哈欠的人的嘴巴已经被遮住。奇怪的是,只显示嘴巴的视频并不能引起打哈欠。[5]

    在情绪饱满的时候,人们的从众性会提高。查尔斯·金德尔伯格发出了一个警告,即目睹别人的变富会产生有害影响,这一警告也适用于阿希博士的实验:在实验室里成功地抵抗了社会压力的人,在现实中却可能无法抵抗充满情绪的群体幻想。

    模仿不仅仅是一种最真诚的恭维,它对我们的生存也至关重要。在人类进化过程中,我们的物种必须要适应各种各样的环境。这种适应有两种形式。第一种是身体上的,一个明显的例子是非洲人的皮肤比北欧人更黑,因为深色皮肤可以保护底层组织免受热带阳光的伤害;相反,浅色皮肤可以在阳光较少的北纬度地区更有效地生成维生素D。

    第二种适应是文化和心理上的,正如进化心理学的先驱罗伯特·博伊德和彼得·理查森指出的那样,在亚马孙河雨林生存所需的技能与在北极生活的人所需的技能大不相同,他们:

    必须知道如何制作几十种基本的工具——皮艇、保暖衣、倒钩鱼叉、油灯、用皮毛和雪搭建的住所、防止雪盲症的护目镜、狗拉雪橇以及制作这些工具的工具……虽然我们是相当聪明的动物,但我们做不到这一点,因为我们还不够聪明。皮艇是一种由各种不同部分组成的高度复杂的物体,设计一艘好的皮艇,意味着需要找到一种极为罕见的各部分组合。[6]

    换句话说,如果你以前从未见过北极人用当地存在的原材料制作皮艇,那么你几乎不可能会制作皮艇。亚马孙本地人所需要的各种其他技能也都是如此。人类从白令海峡迁移到亚马孙河只用了不到1万年的时间,这意味着我们在此之前一定进化出了准确模仿的能力。用博伊德和理查森的话说,能够在如此不同的环境中生存,意味着人类不得不:

    进化(文化上)对当地环境的适应能力——北极的皮艇和亚马孙河流域的喷枪——这是一种适应更新世时期的混乱、快速变化世界的高超能力。然而,创造这种好处的心理机制必然伴随着内在成本。为了获得社会学习的好处,人类必须是轻信的……我们以低廉的价格获得了橡皮艇和喷枪这样奇妙的改编作品。问题在于,对这种容易适应的传统的贪婪,很容易导致不适应的情况以某种方式出现。[7]

    在过去的大概5万年里,人类物种已经从非洲诞生地传播到地球的几乎每一个角落,从北极海岸到热带,再到广阔太平洋中的各个孤岛。晚更新世时期,人类物种从北极之地向麦哲伦海峡迁徙,在这期间能够适应如此多样的环境,这依赖于人类精确模仿的能力。但是,人类在石器时代的许多适应性已经不适合于现代世界,一个经典的例子就是富含能量的脂肪和糖对我们的吸引力,在我们的进化史上,脂肪和糖曾经是稀缺的,可以帮我们维持生命,但现在作为廉价垃圾食品存在,并威胁人类健康。同样地,我们某些古老的模仿倾向也常常不适合于现代,用麦基的名言来说,会给现代社会带来“非同寻常的大众幻想与群众性癫狂”。

    群体幻想的传播还助长了另一种古老的心理冲动,即人类具有压制与日常信仰相矛盾的事实和数据的倾向。1946年,心理学家弗里茨·海德提出了所谓的“平衡状态”范式,以解释人们在日常生活中如何处理大量复杂且往往相互矛盾的数据。想象一下,你认识一个叫鲍勃的人,你和他都对某种能带来一定情感分量的物品有自己的看法,比如说安卓手机与苹果手机相比,哪一款更加高级。

    如果你很欣赏鲍勃,并且你俩都认为苹果手机更好,那么你就会感到很舒服;你现在就处于海德所说的“平衡状态”。类似地,如果你认为苹果手机更好,但是鲍勃喜欢他的安卓手机,并且你认为鲍勃是个无知的浑蛋,那么你也处于“平衡状态”,因为你对鲍勃的负面评价能够使你驳斥他的相反观点。[8]但是,如果你欣赏鲍勃但在手机问题上不同意他的观点,那么你就处于一种让自己不舒服的“不平衡状态”。

    如果你对鲍勃的欣赏只有一点点,或者如果你对手机不太在乎,那么你可以忽略自己的不适。但如果鲍勃是你最亲密的朋友,而你在一些更具情感分量的事情上(比如特朗普的总统任期问题)与他存在强烈分歧,那么你就必须采取行动解决欣赏鲍勃和政治分歧之间的不平衡。神经科学家最近发现,这种不平衡状态会增加背内侧前额叶的活跃性。背内侧前额叶是位于额头中部上方两个脑半球的大脑区域。此外,这种活跃性预示着人们对鲍勃或唐纳德·特朗普的看法将发生变化。换句话说,如果你想让你的背内侧前额叶停止烦扰你,你就必须改变对其中一个人的看法。[9]与此相反,当受试者得知专家同意他的观点,即达到平衡状态时,大脑的另一个部分,腹侧纹状体,位于两个脑半球深处的成对结构,就会被激活。[10]这一区域能接收多巴胺神经元的密集性输入,而多巴胺是一种让我们感到快乐的神经递质。

    在《非同寻常的大众幻想》1841年的初始版本中,麦基写到了南海泡沫:

    企业,像伊卡洛斯一样,飞得太高,融化了翅膀上的蜡;和伊卡洛斯一样,她也掉进了海里,当她在海浪中挣扎时,她认识到她最适合的地方是坚实的地面。从那以后,她没再尝试过这么高的飞行。[11]

    但写下这些话后的几年内,金融市场证明麦基是错的,因为投机的伊卡洛斯将再次飙升,这一次将围绕第一条蒸汽铁路的兴奋和混乱,相应的金融狂热将使1719—1720年的南海泡沫也相形见绌。很少有作家能比历史学家斯蒂芬·安布罗斯更好地描述蒸汽机爆发前的人类状况:

    1801年,一个关键事实是,世界上没有什么能比马的速度更快。没有任何人、制造品、蒲式耳小麦、大块牛肉,信件、信息,以及任何形式的想法、订单或指示能够移动得更快。没有什么能够比马更快了,就杰斐逊[12]的同时代人所知,没有什么将会比马更快。[13]

    1851年,英国历史学家约翰·弗朗西斯的经典记录见证了英国的铁路网建设。他将近代交通状况描述如下:

    用来运送农产品的机器,结构粗陋,既沉重又笨拙。即使道路状况还可以,移动(这些机器)也很困难。如果道路状况不好,那么它们要么被沼泽吞没,要么掉进堤坝中:有时,它们陷入泥泞的道路中太深了,根本无法逃脱,必须要等到温暖的天气和炙热的太阳到来才可以。几个月以来,产品都无法进入市场,水果在产地腐烂,而在几英里之外的市场上却远远供不应求……人们发现,出口到国外要比把农产品从英格兰北部运到南部的成本更低。将商品从伦敦运送到葡萄牙比从诺里奇[14]运送到伦敦更容易。[15]

    用蒸汽动力代替人力、牲畜和水车的想法,可以追溯到2000年前的托勒密希腊人,据说他们用蒸汽动力来打开和关闭一座亚历山大神庙的门。1712年左右,英国发明家托马斯·纽科门制造了第一台蒸汽机,该机体积庞大,效率低下,只能用于煤矿的排水,因为煤矿的燃料非常丰富。因此,詹姆斯·瓦特并没有像人们通常认为的那样在1776年发明蒸汽机,而是完成了一件更巧妙、更有效的事情:通过在纽科门的设计中增加一个外部冷凝器,制造出一种燃料效率高的装置,其可以在远离煤矿的地方使用。这一创新让瓦特的合伙人马修·博尔顿说出了那句名言:“先生,我这里卖的是全世界都渴望拥有的——动力。”[16]

    在接下来的25年里,瓦特首先使用笨重的发动机驱动船桨,然后不断缩小发动机体积,到1801年,发动机已经缩小到足以让理查德·特雷维西克将之安装到陆地马车上;到1808年,他已经在伦敦尤斯顿广场附近提供了价格为5先令的乘车服务。早期的装置由软铁制成,非常脆弱,那时一位技师的妻子不仅必须在凌晨4点醒来给发动机加燃料,还必须用她强壮的肩膀使发动机运转。[17]

    18世纪之交,乔治·斯蒂芬森,诺森伯兰(位于英格兰北部)一个不识字的蒸汽机看管人的儿子,继承了父亲的职业,但与父亲不同,他在夜校学会了阅读、写作和数学技能,而且将自己的天赋用于逐渐提高早期蒸汽装置的效率。拿破仑战争让英国付出了高昂的代价,干草价格的高昂暂时推动了蒸汽动力对马力拉动矿车的代替,但直到1818年,斯蒂芬森才说服纽卡斯尔地区附近达灵顿的矿主,修建了一条通往25英里外的蒂斯河畔斯托克顿的蒸汽轨道线,于1825年9月开始使用。尽管轨道线非常短,但是后来在经济上非常成功。[18]

    新铁路技术震惊了世界:1825—1845年,英格兰经历了至少三次铁路泡沫。第一次泡沫紧随斯托克顿—达灵顿铁路线的建成。斯蒂芬森早期的发动机并不可靠,运营的最初几年,煤炭车和客车经常需要马来牵引。但随着发动机的改进,多达59条铁路线列入修建计划。[19]

    第一批项目在议会中遭到了不小的反对,因为《泡沫法案》(南海事件的遗留法案,此时已经有百年历史)规定,所有的公司组建都必须由议会批准。最积极的反对者是运河和收费公路的经营者,他们认识到铁路运输会对自身利润造成损害。他们及其爪牙告诉公众,发动机的烟雾会杀死鸟类;发动机的重量会使其无法移动;发动机的火花会把货物烧成灰烬;老人们会被碾死;受惊的马会伤害骑马的人;马会灭绝,燕麦和干草种植户将会破产;狐狸会消失;而且,被噪声干扰的奶牛将停止产奶。[20]

    1825年,议会废除了《泡沫法案》,但普遍存在的金融恐慌以及落后的发动机技术,阻碍了更多项目的开展,经过1825—1826年的一番议会波折,斯蒂芬森的利物浦—曼彻斯特铁路花了4年时间才建成,于1830年9月15日正式通车。它长35英里,是当时的工程奇迹,需要建造64座桥梁并挖掘300万立方码[21]的土壤。

    这项非凡的新技术有望改变人们的日常生活,这激起了那些想要先下手为强的人的贪婪。这种刺激在1836—1837年达到顶峰。一位记者写道:“我们的语言开始受到(铁路)影响。人们用‘加蒸汽’表示‘打起精神’,用‘铁路速度’表示‘很快的速度’,并以小时和分钟估计距离。”[22]新闻报道提到,一位商人在早晨坐上从曼彻斯特到利物浦的火车,当天就能运回150吨棉花,并以巨大的利润出售,然后重复这种做法。“不是支持者,而是铁路的反对者被认为是疯子。如果这是一种狂热,那么这种狂热就像我们呼吸的空气一样。”[23]约翰·弗朗西斯写道:“1836—1837年的这几个月将长久地被商业人士铭记。数千人关注并将资本投入计划中的公司。”[24]

    和其他泡沫事件一样,利率下降进一步增强了新技术的吸引力,因为利率下降能使投资资本更加充裕。25年前,拿破仑战争引起的借贷需求提高了利率;1815年利率达到顶峰时,一个富有的英国人通过购买政府债券使其索维林金币[25]的收益率接近6%。在接下来的30年里,利率下降到3.25%。[26]当投资者不满于安全资产的超低利率时,他们就会抬高那些潜在收益更高的风险资产的价格。著名记者(也是《经济学人》的编辑)沃尔特·白芝浩在描绘英国铁路泡沫破裂后的一代人时写道:“约翰·布尔可以忍受很多事情,但他忍受不了2%的利率。”[27]换句话说,低利率是泡沫萌芽的沃土。

    低利率,加上这一时期斯蒂芬森的利物浦—曼彻斯特铁路的成功,重新点燃了铁路投机:“媒体支持这种狂热,政府也做出了许可,而人民为此付出了代价。铁路立刻成为一种时尚和狂热。英格兰规划了各条铁路。”[28]

    每一种泡沫里都有自我毁灭的种子。就这个事件而言,廉价资本催生的重复铁路线过度竞争就是种子。利物浦和曼彻斯特的股东们吃到了牛排,而那些跟随频繁的人则比不频繁的人吃到了更多酸臭的食物。1836年的《爱丁堡评论》指出:“事实上,两个比较大的地方之间(无论距离多么遥远),几乎都会有一条被某个公司占据的可行性铁轨线,通常会同时启动两条、三条或四条竞争性路线。”约翰·弗朗西斯写道:“一个大都会区的某个教区,有16项铁路计划,计划拆除的房屋超过1200栋。”[29]

    这些只是最可信的计划。在达勒姆,某位企业家同时工作于三条平行的铁路线上。第一条是成功的,另外两条,很自然地,失败了。而其他发起人的设想包括:由帆或火箭驱动的火车头,能以每小时数百英里的速度运行;高架木轨线;另外一个,根据弗朗西斯的记录,广告说法是“把残疾人抬到床上去”。[30]

    无论何时何地,免费获得的信贷和轻信的投资者都是无赖发起人的垫脚石。当时一位评论家指出,通常:

    一个穷困潦倒的冒险家突然想到,从A镇到B镇的一条铁路线是一项巨大的公共事业,他从中可以获取巨大的利益。因此,他购买了一份军用地图,布鲁克县的或者是哪个地方的地名词典,以及一份名录。首先,他在两个城镇之间画了一条线,在阴暗的山丘之间的这里或那里画了一些漂亮的曲线,目的是使它有一种真实的感觉,他称此为调查报告,尽管他和他的人根本没有去过这个地方。地名词典、名录以及支付给一个无赖或马车夫的一罐啤酒,构成了他收入来源的所有原材料。幸运的是,年收入从未低于15%、20%或30%。收入经常如此之多,他都不好意思去欺骗更多的人了。[31]

    据说埃德蒙·德·罗斯柴尔德说过,“有三种赔钱的主要方式:葡萄酒、女人和发动机。前两种更令人愉悦,而第三种迄今为止(在赔钱问题上)更为确定。”[32]随着越来越多的铁路轨道进入施工阶段,可聘用的合格工程师和劳动力数量不足,导致工期延误、成本大量超支、无法解决发动机难题等,这最终导致不可避免的破产潮。

    和南海泡沫期间的状况一样,英国的合股公司最初只筹集到所需资本的一小部分。投资者最初只需要支付股票面值的一小部分,对接下来铁路建设所需要筹集的资本承担分期缴纳的义务——这是一种干柴式“杠杆”结构,不可避免地会遇到烈火。

    回应马上就来了。钱变得稀缺;人们已经看清楚了这些人的愚蠢;各种类型的股票都下跌了。然后是可怕的不安,毁灭降临到社区,悲伤使家庭不再温暖。那些曾经因为假想的财富而趾高气扬的男人为他们的鲁莽而悲伤,而女人们则因为无法阻止而哭泣。[33]

    至19世纪30年代的泡沫破灭时,议会已经批准了2285英里的铁路修建计划,但是截至1838年,实际动工还不足1/4。其余的里程通常是不盈利的,还需要几年时间才能完成;正在进行中的则需要投资者追缴大量资金。1836—1837年暴跌之后,股票价格确实又有所回升,因此那些坚持持有股票的人也没有很差;在此之前一直稳定的股票价格,在1836年上涨了约80%,然后又迅速回落到实际上略高于泡沫前的水平。[34]到1841年,从伦敦到纽卡斯尔近300英里的旅程在17个小时内就可以实现:“一个理性的人,还能要求什么呢?”《铁路时报》为此报道。[35]

    事实上,截至1844年,普通股东对前10年的投资回报非常满意。这推动了19世纪40年代后期更大的泡沫,相关代表人物是乔治·哈德森。哈德森出生于1800年,是约克郡一个小农场主的儿子,由于被假定为会继续耕种土地,因此接受了很少的正规教育。在他9岁时,父亲去世,他被送到约克的一家亚麻布店当学徒,他也由此因祸得福。哈德森的精力、魅力和才智很快在布店里显现出来,而这些是在耕犁中无法体现的。他最终通过婚姻关系加入雇主家庭,并接管了布店。1827年,好运继续光顾这个年轻的店主,他从一个叔父那里继承了30000英镑的遗产,叔父临终时,他正好在现场(叔父遗嘱的受益人可能在最后一刻被更改为他)。[36]

    新获得的财富使他得以进入政治和银行业,1833年,他被任命为约克铁路委员会的司库,负责一条通过发行股票筹集建设资金的地方性铁路。哈德森聘请约翰·雷尼爵士勘测路线,但这位著名工程师建议采用马拉系统,这令委员会很失望。幸运的是,在某次参观叔父留给他的不动产时,哈德森遇到了乔治·斯蒂芬森,后者当时已经是一位非常著名的工程师。哈德森充分展示了自己的魅力和远见,斯蒂芬森同意建造约克—北米德兰铁路。该铁路由一家合股公司出资,第一段仅14.5英里长,于1839年开通。

    在接下来的10年里,哈德森成为公众所熟知的“铁路之王”,创建了一个由十几家铁路公司组成的帝国,其中四家是全国最大的铁路公司。他领导几家公司的董事会,经常一会儿出现在这里勘测一条新路线,一会儿又出现在那里指责一家失败公司的股东大会,并四处筹集新资本。他的生活围绕着两个权力中心展开:一个是约克,他在那里担任过几届市长,慷慨而又受人爱戴;另一个是威斯敏斯特,国家的政治中心。

    哈德森能把沙子卖给贝都因人[37]。即使是最坚定的对手,他也能扭转局面。他的标志性胜利是说服了威廉·尤尔特·格莱斯顿。格莱斯顿也许是19世纪最令人敬畏的政治家,他在1832年22岁时进入议会,在1843年成为贸易委员会主席,该委员会是议会的铁路立法部门。他先后担任了四届英国财政大臣,又于1868—1894年四次出任英国首相。

    这两个人简直有天壤之别:哈德森充满活力而未受教育,是约克郡农民的儿子,而格莱斯顿毕业于伊顿公学和牛津大学,是奴隶主的儿子。两人在当时最关键的问题上存在分歧;哈德森是正统的保守党,是一个反对废除《谷物法》的贸易保护主义者;格莱斯顿虽然名义上是保守党,但实际上是一位热诚的自由贸易者。

    不过,假如在今天,哈德森将被称为自由主义者,因为他反对政府干预商业,尤其是他所珍爱的铁路,而格莱斯顿很早就认为技术日益发达的经济领域需要政府监管。比约翰·洛克菲勒降低油价还要早几十年,格莱斯顿就预见到,实力最强的铁路公司可以通过大幅减价将竞争对手赶出市场,垄断市场后,公众将越来越受其摆布——格莱斯顿认为,哈德森的某个公司就是这样。

    1844年3月,哈德森在贸易委员会作证时,老练地强调了他与格莱斯顿的一致意见:为了公众的利益,应该限制对竞争性路线的许可(但没有提到自己的公司)。委员会推迟了这个话题,追问哈德森是如何确定票价的。委员会想知道,议会定期调整票价有什么错?哈德森一如既往地做好了充分准备,他回答说,他不反对由政府规定票价,但要求议会限制竞争性路线的许可证发放。

    委员会对哈德森的回答感到些许宽慰,提出了相对比较温和的铁路立法,规定“议会级”票价为每英里1便士。[38]但该法案使议会能够修改铁路公司的票价,这些铁路公司曾经利润如此丰厚,可以发放超过10%的股息分红;该法案通过后,对于任何已经获得许可并运营超过20年的铁路公司,政府都将有权购买。

    这令哈德森很焦虑,他给格莱斯顿写了一封公开信,信中用最悦耳、最恭维的语气对该法案中降低票价以及政府的购买选择权表示反对。他组织了一个由铁路公司所有权人组成的代表团,他们一起前往唐宁街10号的首相官邸。首相罗伯特·皮尔对此印象深刻,于是在下议院发表了一些对铁路公司有利的意见。

    格莱斯顿接受了公开信的暗示,私下会见了哈德森,会面中,哈德森把坦白直率的魅力发挥到了极致,把这位委员会主席感动了。格莱斯顿评论道:“将哈德森看作一个投机者是一个巨大的误会,他是一个非常有辨别力的人,拥有很大的勇气和很强的进取心——一个非常大胆但非常明智的设计师。”格莱斯顿基本废除了法案:只在法案中保留了低级三等车票的票价限制。[39]

    哈德森意识到,他差点儿忽略了议会的潜在监督职能,他需要更积极地参与政治。假如在今天,强大的实业家可能会为自己雇用一大群说客;但19世纪的英国具有更宽松的道德环境,有一个更直接的办法:哈德森只需要给自己买一个下议院的席位。1845年中,机会出现了。在冷清的沿海小镇森德兰,他接管了当地一条失败的铁路以及码头,作为交换条件,那里的官员们提名他为保守党的席位候选人。他于8月14日正式当选,比较类似于现代社会中同时在美国参议院任职的高盛公司董事长。

    那天晚上,一辆专列将他当选的消息从森德兰送到伦敦,第二天,另一辆专列将伦敦《晨报》对这一事件的报道带回森德兰。在胜利庆典的狂欢中,哈德森将报纸扔进人群,欢呼道:“看,看智慧的进军!”[40]两个月后,在森德兰的一次宴会上,他鼓吹自己码头公司的股票,再次激发了当地人的热情:“我不明白,为什么你们不能让圣彼得斯堡的棉花、中国和世界其他地区的产品运到森德兰港,只要你们提供设施……让我们想象一下,我们将成为世界的利物浦和曼彻斯特。”[41]

    他似乎很少睡觉;例如,1846年5月2日至3日的晚上,他在下议院工作到凌晨2:30,打了个盹儿,然后坐上开往德比(英格兰中部城市)的早班火车,其大约在伦敦、约克以及他的其中一个公司——米德兰铁路公司总部三者中间的位置(见图4-2、图4-3)。在那里,他向股东们解释他的26项提案的精髓,这些提案通过修建一些新的、扩展一些已经存在的铁路和运河,将铁路和运河系统相融合。该计划需要300万英镑的投资资本;他向心存疑惑的人坦率地承认,的确许多新线路将失败,但总的来说,它们将打造一个坚不可摧的地区铁路系统。他已经拥有大量支持者,很轻易地排除掉了那些分散的持反对意见的股东,然后通过了所有26项公司提案。[42]一位当时的评论家写道:

    资料来源:The Railway King,by Richard S.Lambert,London,George Allen & Unwin Ltd,©1964,p.57.Copyright ©1934 HarperCollins Publishers.All rights reserved.

    图4-2 1840年的英国铁路系统(粗体部分是哈德森公司建的铁路)

    资料来源:The Railway King,by Richard S.Lambert,London,George Allen & Unwin Ltd,©1964,p.238.Copyright ©1934 HarperCollins Publishers.All rights reserved.

    图4-3 1849年的英国铁路系统(粗体部分是哈德森公司建的铁路)

    似乎从来没有什么事情能让他烦乱,也没有什么事情会让他疲劳。他在议会委员会中斗争,一天又一天;他以一种认真的态度争辩和恳求,从目的上看几乎没有失败过。他今天在镇上哄骗一个委员会,明天说服一位大主教;早上,在一个不起眼的办公室里说服一些持对立主张的人,下午,以某种大胆的突袭政策震惊了证券交易所。[43]

    他的专注力和计算能力令人敬佩。人们经常看到他把头往后一仰,遮住眼睛,然后准确地预测出尚未建成的铁路线的红利,他还能同时参与两场激烈的对话。商业伙伴们发现,如果他们的分析没有抓住要点,马上就会被他打断,但很容易又会被他原谅,他对员工和陌生人非常宽宏大量。但是,他处理数字和疯狂交易的能力也伴随着一个缺点:他过分依赖口头指令,没有保存交易的账簿或记录,只是简单地认为他的愿望会实现。[44]

    1843年的英格兰铁路线还不到2000英里,但是到1848年底已经超过5000英里;哈德森控制了其中大约1450英里的路线,并对英格兰东北部拥有实际的垄断权。[45]更多的铁路线正在计划中:议会在1844年批准了800英里,在1845年批准了2700英里,在1846年批准了4500英里。以少量首期付款认购股票,然后在很久之后完成全部购买,是哈德森和大多数其他发起人的经营手段。在工程尚未开工、连运营和收入都没有的时候,新股通常就会公布每年接近10%的股息;大多数投资者被高收益吸引,却没有注意到收入的缺失意味着最初投资者的股息必须来自新投资者的资本,这在现在被称为“庞氏骗局”。在庞氏骗局下,后来股东的股息是无法获得支付的。哈德森故意泄露他的铁路项目即将被议会批准的消息,以此推动这种狂热。就像蛋糕上的糖霜,直到泡沫的最后阶段,哈德森稠密的东北部铁路网还在阻碍竞争性路线的股票发行。

    19世纪40年代,除了布朗特和哈德森这样的发起者、公众和政客外,泡沫剧场的第四个主角——媒体出现了。概括来说,那个时代有两类媒体:以《泰晤士报》为代表的“旧媒体”和以《铁路时报》为代表的铁路专报“新媒体”;前者坚持高度正统的怀疑主义,而后者则煽动投机的火焰。在泡沫最严重的时候,市面上至少有20种铁路出版物,铁路公司每周都要慷慨地花费1.2万~1.4万英镑发布广告,这些资金成为媒体的主要收入来源,而这些钱本可以更明智地用于建设。关于新提案的吹嘘文章比比皆是。一位评论家讽刺道:“委员会为绅士和男爵们高兴,下议院通过新提案的前景是肯定的。它的工程师是斯蒂芬森(此时已经是乔治的儿子罗伯特·斯蒂芬森);它的当权者是哈德森;它的银行家是格林。广告还谦虚地补充说,利润不会超过15%。”[46]一篇文章夸张地说,铁路是环绕全球的新世界奇迹:

    不满足于让利物浦成为他们的铁路中心……他们的目标是全球。遥远的印度跨越河海对铁路表示期盼,中国正在倾听这神奇的声音。古希腊被毁坏的山丘和破碎的祭坛将很快与火车头的汽笛声相呼应,或者被转变为商业圣地。通过这些宏伟的工程,河流得以跨越,领土得以穿越,商业得以特许,联邦得以巩固;通过它们,金刚石可以被分割,人类在时间和空间上拥有主宰权。[47]

    直到1843年,英国经济依旧在消化1836—1837年的泡沫,但在1844年秋天,银行的贷款利率已经降为2.5%;更为不祥的是,银行普遍认为铁路证券“像房子一样安全”,并乐于将其作为抵押品。股票认购名单会让21世纪初房地产泡沫中的美国抵押贷款经纪人都脸红:一个年收入54英镑的半薪军官在多个名单上的总收入为41500英镑;两个住在阁楼里的清洁工的儿子,其中一个认购了12500英镑的股票,另一个25000英镑,所包含的追缴金是他们无法承担的;更多的追缴金来自虚构联系方式的股东。[48]

    一位不知姓名的观察者这样描述,英国公众:

    看到整个世界都在为铁路疯狂。铁路在公众集会上受到赞扬;它是公众崇拜的对象;人们在交易所里谈论它;在参议院为它立法;在舞台上暗喻它。它渗透到每一个阶层;渗透到每一个家庭;所有人都被它诱惑。那些说话与契约一样可靠的人,现在也加入追逐铁路的行列,被旋涡带走了。[49]

    商人兼议员詹姆斯·莫里森观察到:

    不易觉察的贪婪之毒在每个阶层蔓延,不仅影响了高贵的大殿主人,也影响了简陋农舍里的合居者。公爵夫人们甚至会在众人面前用凭证弄脏手指,老女仆们会发抖地急切询问股票的价格。年轻的女士们抛弃了婚礼清单而专注于股票行情表,询问她们的爱人有关牛市、熊市操作的问题,这吓到了她们的爱人。时尚人士频繁地出现在经纪人那里,而不是出现在俱乐部。商人不再关注生意而去打理他的股票,但最终,他的股票和生意都将离开他。[50]

    按照贸易委员会的规定,每年11月30日是提交新路线计划的截止日期。1845年11月30日傍晚,当800个铁路计划发起人聚集在白厅(指英国政府)办公室时,一股狂潮席卷了首都:铁路公司允许通过的快递列车以每小时80英里的速度驶向伦敦,但那些运载竞争性路线计划书的列车被铁路公司阻止通过;一位设计师将路线计划书装进一个装饰齐全的灵柩内,然后将其运到列车上,才绕过了铁路公司的障碍。[51]

    如约翰·弗朗西斯所写的,就像南海泡沫期间一样,交易巷里挤满了人,交通堵塞,“几乎无法通行”,周围的街区“像集市一样”。他继续写道:

    谨慎的商人和敏锐的制造商都没有抵制住投机的诱惑。它像麻风病一样在他们中间传播。它不仅毁灭了无辜者,也毁灭了有罪者。它不仅毁坏了很多简陋的农舍,也扰乱了许多亲王的住所。人们急于致富,却被毁灭。他们大量购买;他们踊跃认购;他们抛弃了自己公司的存账室;如果成功了,他们就会继续买入;如果失败了,那么他们往往会自毁,使本已凄凉的家园更加悲惨。[52]

    斯蒂芬森在威斯敏斯特乔治大街的办公室比首相在唐宁街的办公室更受欢迎;铁的价格翻了一番;勘测员的工资很高,特别是那些在军械局工作的人,经常未经许可非法进入私人土地。一份议会报告表明,157名议员的股票认购额超过2000英镑;到1845年夏天,“全国出现了前所未有的对所有生意的忽视;几个月里,柜台上找不到卖货的商人,办公室里也找不到批发商,全国各地都是这样。如果你去拜访商家,那么你肯定会得到‘去城里了’这样的答复”。就连勃朗特[53]一家也参与了:艾米莉和安妮拥有约克和北米德兰的股票,而更脚踏实地的夏洛蒂则持怀疑态度。[54]

    虽然哈德森的许多商业行为,特别是他对公司治理的保密和高压手段,放在今天可能会让他坐牢,但在那时还不是非法的。再过80年,查尔斯·庞兹[55]在初始资本支付股息的操作中不会使用自己的名字;在19世纪40年代早期,这些做法不会引起法律审查(但这种情况很快就会改变)。哈德森的终结不是来自欺诈或欺骗,而只是来自过度建设和监管改革。

    与18世纪的双泡沫不同,这次事件中铁路公司的倒闭过程比较缓慢。到19世纪40年代末,哈德森的铁路网(大致从伦敦延伸到爱丁堡)越来越被东西部的竞争性路线包围。为了进一步延长铁路线来突破包围圈,他冒险性地从个人投资者那里筹集了大量资金;但与此同时,议会于1847年建立了新的监管制度,在此制度下,用新收购的资本支付旧股东的股息,这种类似庞氏骗局的做法被认定为非法。[56]

    1847年初,英格兰银行将贴现率从3.5%提高到5%,这阻碍了股票认购之后所需追缴金的资本流动。1846年的马铃薯歉收和1848年欧洲大陆的革命动乱加剧了英国的经济困境,迫使哈德森和其他铁路经营者降低股息:惊慌失措的投资者开始抛售股票,到1848年10月,股票价格从1845年的峰值下跌了60%(见图4-4)。[57]

    图4-4 英格兰铁路公司的股票价格(1830—1850年)

    虽然股价下跌的绝对数小于南海泡沫时期,甚至小于20世纪的大熊市时期,但认购机制固有的极端杠杆带来了大面积的破坏:

    很多家庭完全被毁。一个不太起眼的英格兰镇上,发生了一些悲惨的自杀事件。原本被精心培育的女儿们现在需要出去寻找面包,儿子们被迫停止学业,很多家庭被分离:房子被法院强制执行。每一个社会纽带都被破坏。那些以前过着舒适独立生活的人突然发现自己欠了大量无力支付的钱。有的放弃了一切,重新开始;有的离开英国去往欧洲大陆的其他国家,蔑视并逃避债权人的追赶。一位绅士收到了400张法院令状。还有一位贵族承受了15000英镑的债务压力,于是他坐上游艇去往美丽的地中海,在那里,他忘却了与自己有关的所有难题。[58]

    此时,即使是哈德森所犯的小过失也会引致仔细审查,而这样的小过失在过去是很容易被原谅的。证券交易所的两个对手仔细检查了买卖记录,发现哈德森的某家公司以高于市场的价格购买了另一家公司的股票,而这另一家公司恰好也归哈德森个人所有;也就是说,他诈骗股东的行为被发现了。很快,他更严重的违规行为也被发现,尽管还没有上升到需要承担刑事责任的高度,但也让他面临严重的民事判决。

    哈德森还有最后一张王牌:森德兰地区的选民依然非常感激他,这使他在议会又待了10年,只要下议院还在开会,他就不会因债务问题而被捕。随后他会以一种滑稽歌剧式的状态往返于英国和欧洲大陆之间:议会开会时,他可以安全地待在英国,并拼命挽回他的财产;休会后,他逃往巴黎。1859年,他在选举中落败,游戏结束了;朋友们离他而去,只有债权人关注他,他剩下的大量财产被没收。最后,他靠仰慕者给他购买的年金维生。[59]

    1863年的一天,查尔斯·狄更斯[60]即将乘坐“福克斯通”号船返回英格兰,遇到了他的朋友查尔斯·曼比。狄更斯写道:

    曼比向一位衣衫褴褛的人告别,我对这个人有印象,但想不起来他是谁。当我们驶离港口时,那人正站在码头边上,凄凉地挥舞着他的帽子。我对曼比说:“我肯定认识那个人。”“我想你认识,”他说,“哈德森!”哈德森住在巴黎,是曼比带过去的。临别时哈德森对曼比说:“在你回来之前,我再也吃不到一顿丰盛的晚餐了。”[61]

    后两轮铁路泡沫毁掉了英国投资者,但为英国提供了必要的基础设施。1838—1848年,铁路里程增加了10倍,直到今天,英国的铁路地图还和1848年非常相似。1848年之后的将近一个世纪里,这个数字才又翻了一番。

    事实上,不幸的铁路投资者们为英格兰提供了宝贵的公共物品——首个高容量、高速度的运输网络。19世纪初之前的英格兰,人均GDP几乎没有增长;而在此之后,它以每年约2%的速度增长——每一代人大约能翻一番,不仅在英格兰,在其他西方发达国家也是如此。这一转变在很大程度上是由蒸汽驱动的陆海运输效率带来的。[62]这种损害了技术投资者但为国家经济增长提供了必要基础设施的例子,还将继续出现。

    1841年,查尔斯·麦基出版了《非同寻常的大众幻想》第一版,正是在铁路狂热达到高潮之前,因此麦基应该会比其他任何人都更清楚地意识到这种狂热。作为一名记者和受欢迎的作家,他完全应该对此提出警告。

    但是他没有,在1852年出版的该书第二版中,他只在一个两句话的脚注中提到了这一事件。[63]19世纪30年代,青年时期的麦基曾为两份伦敦报纸《太阳报》和《晨报》撰稿并编辑;1844年,就在铁路泡沫破裂之前,他开始担任《格拉斯哥的阿格斯》报纸的编辑,并在这个职位上干了3年,这3年正是铁路从繁荣走向萧条的3年。该报纸,特别是“头条”专栏,经常转载其他报纸的文章。这些文章表明,麦基对铁路发展的总体态度是适度热情,这很可能只是对当时经济基调的一种反应。自由放任是当时的经济基调,其核心是废除《谷物法》,因为《谷物法》使地主、贵族受益,导致粮食价格过高,城市贫民挨饿。而铁路只是麦基及其圈子的次要关注点。[64]

    在麦基担任编辑期间,该报的头条确实转载了《泰晤士报》关于泡沫的可怕警告,但该报也转载了其他报纸中对铁路公司有利的文章。尽管在今天,麦基的名字几乎是“狂热”的同义词,但在当时,他似乎完全错过了他正在经历的那场浩劫。在1845年10月的一篇头条文章中,他直言不讳地说,铁路股的热情与南海泡沫没有什么共同点,南海泡沫“没有什么坚实的基础,完全是虚构的”,而铁路热情的基础:

    宽阔而安全。铁路是这个时代的必需品。其本身就是一种不动产和有形资产……沉默的哲学家和活跃的商界人士都能看出,没有什么能比英国资本用于这些项目更高尚、更有利的了。[65]

    虽然没有什么证据表明麦基也在铁路狂热中赔过钱,但作为那个时代最敏锐的观察者,他没有看到人类的金融非理性,这更证明了金融泡沫的诱惑力。到了19世纪,有这样一条旧新闻:一个世纪前,艾萨克·牛顿的例子说明,即使是具有非凡知识和智慧的人,也无法免受投资泡沫的影响。牛顿不是金融新手,南海泡沫时期,他已经担任英国皇家造币厂厂长20多年了。他在1712年购买的南海股票获得了丰厚的回报,1720年初,他以可观的利润卖出了这些股票,但那年晚些时候,他失去了理智,以更高的价格回购了这些股票。他损失了大约20000英镑,并认识到:“我能计算天体的运动,但不能计算人类的疯狂。”[66]

    英国铁路泡沫可以看作一场许诺改变人们日常生活的技术动乱。几乎与此同时,远离欧洲大陆的美国,产生了一种与之截然不同的极端末日狂热。

    5 米勒运动的“大失望”

    数秘主义与确认偏见

    20世纪50年代中期,一位名叫利昂·费斯汀格的心理学家走运了。

    费斯汀格的父亲是一位政治激进的无神论者,也是自苏联移民至美国的刺绣师。在长期杰出的学术生涯中,费斯汀格将自己的才智运用到社会心理学的新兴领域。他幸运地潜伏到美国中西部的一场飞碟狂热事件中,其正好属于他的研究领域。他的研究对象,即“情感”群体,由一位名叫多萝西·马丁的女性领导,她声称已经向人类传达了神灵们有关大地震和洪水的警报:神灵们告诉她,这两个大灾难将于1954年12月21日吞噬北美。[1]

    社会心理学家们都理解所罗门·阿希的线条长度实验,他们早就知道,社会压力通常会磨灭个体之间的观点差异,因此各个小群体和整个社会都会演化出各自的文化、道德和宗教价值观。此外,他们还知道,这些价值观的转变往往是爆炸性的,其快速扩散类似于传染病。

    20世纪20年代以来,流行病学家对疾病传播进行了数学建模,认为疾病传播主要取决于两个关键参数:病原体的传播率或传染性,以及治愈率或死亡率。社会学家发现,他们可以用同样的方法理解思想和信仰的传播。费斯汀格意识到,马丁及其信徒为他提供了一个实验室,让他能够实时观察这一传播过程。更重要的是,马丁团队提供了一个难得的机会,让他可以观察到末日预言不可避免地失败之后会发生什么。

    假如在今天,任何一个机构审查委员会都不会批准费斯汀格的这项研究。在研究中,他的助手“在没有经过马丁团队知情或同意的情况下”潜伏进了马丁的圈子。[2]费斯汀格的项目也违反了实验和伦理规定,即现场研究人员不应干预受试者的决策。当不知情的马丁及其追随者要求费斯汀格的潜伏者们就意见和建议畅所欲言时,他们被迫屡次违反了这项不干预的规定。

    作为早期的山达基[3]信徒,马丁对于“来世”并不陌生,她经历了该组织对她的“审计”过程,能够回忆起自己的受孕、出生和之前的各次转世。她的主要合作者查尔斯·劳赫德博士,则是一位更传统的末日信仰者。他是密歇根州立大学学生健康服务处的一名医生,为一个主流新教团体做国外医药的宣传工作;后来他的妻子患上失能性的神经症,他开始努力为她求医,无意中遇到了一些飞碟狂热者,他们把他介绍给了马丁女士。

    在预言大灾难的大约前一年,马丁成为一名女先知。她醒来时感到右臂一阵刺痛:“我感觉有人在试图引起我的注意。”[4]她拿起一支铅笔,很快发现自己的手非常陌生,不由自主地写字。与《圣经》中的先知们不同,她最初传达的并不是来自上帝的信息,而是来自更亲近的人的信息:当她向肢体的指挥者询问时,对方透露说自己是她去世的父亲。

    她的通灵技巧很快得到了提高;她疼痛的右臂和铅笔开始传递来自地位更高者的信息:一个叫“兄长”的人,向她提供了一些关于她死去父亲的精神需求方面的建议;其次是来自“塞勒斯”号行星和“号角”号行星的生物,其中最重要的是萨南达,他说自己是耶稣本时代的肉体化身。

    萨南达是一位完全现代化的弥赛亚,当时正在美国境内进行高级侦察,并已与马丁女士以及其他人取得了联系。萨南达及其被称为“卫士”的同伴被这个国家的某些东西(后来被德怀特·艾森豪威尔称为军事-工业综合体)激怒;作为报复,他们将把陆地撕成碎片,并在年底前用一场大洪水淹没它。1954年8月1日晚上,卫士们指示马丁及其11名追随者(其中没有费斯汀格的潜伏者)去见他们的飞碟,但马丁一行人什么也没看到,只看到一个相貌平平的男人。马丁给了那个男人果汁和三明治,但他礼貌地拒绝了,然后走开了。

    飞碟没有出现,这给马丁的团队带来了第一次动摇,有7名成员立即离开了她。马丁和其余4名坚持信仰的人没有等很久:两天后,萨南达就通知马丁,那天是他拒绝了茶点,并表示对她和其他同伴的道德品质感到满意;还告诉她,大灾难发生之前,飞碟将拯救少数人,而他们是部分被选中的人。[5]

    像几乎所有的千禧年主义者和启示性末日论者一样,马丁是一个真诚的傻瓜,而不是一个无赖。她将自己的时间和财富奉献给了她的追随者,为信仰付出了沉重的代价。当芝加哥郊区橡树公园的孩子们从父母那里听到即将到来的大灾难后开始做噩梦时,警方指控她“煽动暴乱”,并对她进行精神治疗,随后她逃离了芝加哥的家。劳赫德也因为与这一事件有关而失业。[6]

    1954年底,当救命飞碟和随后的大灾难几乎确定不会出现时,信徒们的信仰体系被证明与事实不一致,即所谓的信仰“失验”,这是费斯汀格研究的主要目标:他想精准地确定,当事实和数据与根深蒂固的观点不一致时人们会如何行动。其研究成果《当预言失败时》成为心理学家、社会学家、经济学家和政治学家公认的经典之作。[7]费斯汀格后来创造了现在人们很熟悉的术语“认知失调”,用来描述信仰和事实之间,或者更微妙地说,叙事和数据之间的情感冲突。当令人信服的叙事和客观事实发生冲突时,叙事往往会幸存下来,这种结果自远古以来就存在于人类社会。

    多萝西·马丁后来的行为体现出很多人处理认知失调的方式。她并没有根据那些与自己信仰不一致的证据修改自己的信仰体系,她和她的团队在此之前对自己的信仰相对保密,但后来他们反而加倍努力,开始就飞碟的到来进行传教。离开芝加哥地区后,她的余生一直从事于通灵研究,先是在南美、北加利福尼亚,最后在亚利桑那州的塞多纳。在1954年的信仰失验事件过去将近半个世纪后,她以德拉修女的化名在塞多纳去世。[8]

    虽然我们很容易将多萝西·马丁的预言讽刺为一种21世纪的胡编乱造,但在某种程度上,我们都是费斯汀格所说的恶魔的奴隶。马丁及其追随者们所表现出的“加倍努力”似乎是人类行为的一个近乎恒定的现象。当明斯特的再洗礼主义者反复看到博克尔松的末日预言被事实推翻时,他们的信仰,至少在一段时间内,变得更加坚定,他们也加倍努力改变周围城镇居民的信仰。同样的情况也将发生在19世纪中期众多福音派新教徒的末日预言事件中。

    这种反常行为具有某种执拗的意义。信仰失验会带来严重的精神痛苦,而缓解这种痛苦的最好方式,就是和新赢得的信徒在一起。正如费斯汀格所说:“如果越来越多的人相信信仰体系是正确的,那么显然,它终究是正确的。”[9]

    从1620年开始,与第五君主国派关系密切的英国清教徒将第一批殖民者送往北美马萨诸塞州。10年后,马萨诸塞海湾殖民地的新领导人约翰·温斯罗普向他的追随者们宣扬,他们即将看到“一个山巅之城”,该城的成功和上帝的宠爱将受到全世界的热切关注。[10]从马萨诸塞殖民地演变而来的美国,没有国教,宗教和意识形态的自由程度前所未有,这为神启性运动的扩散和发展提供了肥沃的土壤。

    18世纪初和19世纪初,分别出现了第一次和第二次“大觉醒”,即席卷美国和英国的宗教复兴;两者都催生了各种各样的非正统神学,就像之前的宗教改革一样,重视个人神灵主义,贬低有组织的宗教等级制度。

    美联储所发行的20美元纸币上那个轮廓分明、眼神锐利的面孔,总统安德鲁·杰克逊,直接促成了第二次大觉醒,这不失为一种历史讽刺。杰克逊反对建立中央银行,并于1837年美国第二合众国银行许可证到期时拒绝了它的延期申请。他这样做的时机非常糟糕:几乎同时,美国经历了一场壮观的泡沫,泡沫事件非常复杂,其特点是大量政府土地被出售、房地产投机以及棉花价格从繁荣到萧条。后来,泡沫破裂,由于没有一家中央银行能够充当救市的最后贷款人,由此造成的货币短缺使美国陷入持续近10年的萧条,并带来约25%的失业率。那个时代并没有留下什么详细的经济数据,但杰克逊的鲁莽行为给美国造成的损失可能与一个世纪后的大萧条一样严重。英国小说家弗雷德里克·马里亚特在1837年恐慌之后访问了纽约,他写道:

    猜疑、恐惧和不幸弥漫了这座城市。如果我不知道原因的话,我就会以为瘟疫正在肆虐。但笛福已经告诉我原因了。来往的人群中,人们脸上没有一丝笑容;匆忙的脚步,疲惫的脸庞,快速打招呼,或者匆忙地交流着在太阳落山之前会发生的预期损失……被解雇的机械师们像饥饿的狼群一样踱来踱去。这种剧烈的震荡像电一样传播开来,传播到数百英里以外的地方。运河、铁路和所有公共工程都已中断,一位爱尔兰移民靠着他的棚屋,手里拿着闲置的铁锹,饥饿着,他想念他的绿宝石岛[11][12]

    第二次大觉醒运动当时已经开始,于1837年恐慌之后加速进行。觉醒运动中的“助产师”们产生了宗教分裂,例如摩门教和各种公然的欺骗性通灵运动。所谓福克斯姐妹与死者沟通的欺骗性,不亚于伟大作家和政治家霍勒斯·格里利[13]的欺骗性。[14]

    最为壮观的是,多达10万的美国人开始相信世界将在1844年10月22日结束,这个集体幻想起源于威廉·米勒,他是一个谦逊、不爱出风头、深思熟虑的人,本来最不可能成为米勒派领导人。

    米勒出生于1782年,是父母的16个孩子中的长子。他们家位于纽约州最东北部的罗汉普顿镇(见图5-1),是一个虔诚的浸信会农业家庭,家中极度贫困,子女几乎无法接受正规教育。像那个时代的许多农家子弟一样,从9岁到14岁,他只在除了收获期和种植期之外的其他3个月里上学。在家里,这个热爱书籍的男孩只能阅读他父亲的《圣经》、《赞美诗》和《诗篇》;慷慨的邻居借给他《鲁滨孙漂流记》等通俗作品的复印本。他的文学兴趣惹恼了父亲,因为父亲注意到,这些兴趣分散了他的注意力,使他无法做农活,所以小米勒会在深夜偷偷溜到壁炉旁,在燃烧着的松树结的昏暗光线下看书。[15]

    图5-1 美国东北部的米勒主义地标

    21岁时,他结婚了,向东进入佛蒙特州几英里,搬到妻子位于波尔特尼附近的家中耕种。波尔特尼镇正是自然神论的温床。自然神论假定一个超然的至高无上的存在,即一个“神圣的钟表匠”只在远处观察他的创造物,自然神论将《圣经》视为一本纯粹的书,而不是神灵的启示——最多只不过是一本关于古代历史的有用手册。

    镇上的大量图书馆藏书反映出这种自由:伏尔泰的,休谟的,潘恩的,以及其他许多人的书,米勒津津有味地读着,并逐渐成为一名自然神论者。在波尔特尼,米勒还受到最著名的市民马修·里昂的影响。马修·里昂是国会议员、美国独立战争的退伍军人、伊桑·艾伦[16]的煽动性伙伴,还是一个臭名昭著的不可知论者。[17]

    米勒读的启蒙哲学的书越多,就越反感《圣经》:为什么上帝创造了一本完全不可理解的书,然后让那些无法正确解读这本书的不幸灵魂遭受死亡、折磨、流放和饥饿?在米勒看来,人类也有错:

    我读得越多,就越发现人类性格中的严重缺陷。我找不到人类过去历史上有什么亮点,那些世界征服者和历史英雄显然都只是人类形态的恶魔。世界上所有的悲伤、痛楚和苦难,似乎都随着他们对同伴的控制权的增强而增加。我开始对所有人都感到不信任。[18]

    波尔特尼镇上打破旧俗的氛围非常适合这位年轻的农民;他终于从家里的令人窒息的宗教氛围中解脱了,他反叛了,当着大家的面,毫不留情地模仿他祖父的华丽布道,滑稽地模仿他们的假虔诚。[19]

    米勒也确实找到了他的家庭值得称赞的地方:他的父亲曾参加过独立战争,因此作为儿子,他在爱国主义和兵役方面得到了庇护。1810年,当与英国之间的战争临近时,佛蒙特州的民兵组织授予他中尉职位;1812年美国对英宣战后,民兵组织将他提升为上尉,第二年他又调任美国正规军中尉。虽然军衔更低了,但这次调任被视为升职。不管怎样,到1814年初,他已经重新获得了上尉军衔。夏末,他来到尚普兰湖畔的普拉茨堡,在那里,人数和武器装备都处于劣势的美国军队,在一场海陆一体战中决定性地击败了英国侵略者。

    这场战争令米勒感到震惊又害怕,9月11日,他写信告诉妻子,一艘美国船只上的300名士兵和水手中,只有25人幸存。“船上的一些官员说,血是及膝深的。”第二天,他再次写信给妻子:

    天哪!到处都是屠杀。我无法向你描述这种普遍的兴奋……日落时分,在一首扬基小调[20]中,我们军营鸣放了礼炮。在一两英里范围内,1.5万~2万人同时参与海陆交战,这超过了以前我见过的任何一场战争。多么宏伟,多么高尚,但又多么可怕![21]

    这场战争不仅摧毁了英国入侵部队,还摧毁了米勒的自然神论:一支在拿破仑战争中身经百战的15000人的精锐英军,却被一支合并了1500人的正规军和4000人的志愿军的杂乱无章的美军打败,除非有一个主动支持美国的上帝,否则还有什么能够解释美军胜利的原因?“在如此困难的情况下,出现如此令人惊讶的结果,在我看来确实像是一个比人类更强大的力量所做的事情。”[22]

    战争结束后不久,他回到了罗汉普顿的农场。在那里,作为一名受人尊敬的退伍军人和小镇官员,他即将在家族的浸信会中扮演更重要的角色。

    战时的经历和回到童年时保守的宗教环境引发了他的信仰冲突,也就是他先前对上帝的不信仰和战争中看到的超自然之力之间的冲突。基于对阅读的热爱,他使用经文来分析解决这种冲突。大约在1816年的某个时候,他开始对《圣经》进行艰难的逐字逐句分析。例如,如果他遇到“野兽”这个词,且这个词在《但以理书》或《启示录》中象征着异教徒帝国,他就会强迫性地在《圣经》的其余书卷中寻找其他的“野兽”。

    经过几年的努力,通过查阅《圣经》,他找到了之前的不信仰和战争经历之间矛盾的解决办法。在《但以理书》中的四个王国中,只有以天主教会为代表的罗马仍然存在。他被《但以理书》8:14打动:“他对我说,到二千三百日,圣所就必洁净。”

    对米勒来说,一切都很清晰了:《以斯拉记》第7章中,波斯皇帝阿尔塔薛西斯在其当政的第七年发布了返回犹大并建造礼拜场所的命令,当时的历史学家估计这一年是公元前457年。根据米勒的末日论,末日时钟从这一年开始倒计时。鉴于圣经学者所假定的圣经日和时间年的等价性,世界将在2300年后,也就是1843年结束。

    米勒继承了悠久的“数字神秘主义”传统。数秘主义曾经为约阿希姆所迷恋,直至今天人们对它的迷恋还有增无减。最引人注目的现代例子是约翰·泰勒和查尔斯·皮亚齐·史密斯在19世纪末的研究成果。他们注意到金字塔结构中的一些数学巧合,例如,金字塔底部周长的两倍与高度之比接近π值,底部周长与框架石长度之比是365,以及从地球到太阳的距离几乎正好是金字塔高度的10亿倍。接着,史密斯写了一本畅销书《伟大金字塔的遗产》(Our Inheritance in the Great Pyramid),详细描述了这些惊人的发现。[23]

    一个世纪后,一位名叫埃里希·冯·丹尼肯的瑞士人在另一本畅销书《众神的战车》中,利用类似的观察结果证明,外星人曾来过地球。[24]近千年来,神学怪人利用类似的数学巧合和圣经年表来预测世界末日。就在2011年,一位名叫哈罗德·坎普的基督教广播名人,预测世界将在10月21日结束。2012年,他承认了自己的错误,谦卑地接受了《马太福音》24:36的告诫:“那日子、那时辰,没有人知道。”[25]

    杰出的数学作家、趣味数学之王、社交网站策划人马丁·加德纳这样评价史密斯的《伟大金字塔的遗产》:“这一类的经典作品就是我们的遗产。很少有一本书,能如此优美地展现出一个对某种理论深信不疑的聪明人(指作者)轻而易举地掌控着整本书的主题,使其精确地契合他的观点。”[26](具有讽刺意味的是,加德纳正是在米勒神学的直系后裔——基督复临安息日会中长大的。)[27]已故“文学坏小子”克里斯托弗·希钦斯针对那些幻想的圣经日期设定,创造了一个更一针见血的术语:“白痴的里程表”[28]

    圣经的数秘主义源于“模式”现象。《圣经》是一部包含大量数字、叙事和各种往往阐述不清的历法的汇编,勤奋的千禧年主义者几乎可以将未来的任何一个日期视为世界末日。米勒并不是第一个运用圣经数秘主义将1843年定为世界末日的人;1946年,一位名叫勒罗伊·埃德温·弗鲁姆的基督复临安息日会牧师出版了《我们祖先的预言信仰》(The Prophetic Faith of our Fathers),它是一本关于末日计算的历史书,包括四卷。其中记录的几十种末日计算时间集中在1843年。但没有任何一个人能像威廉·米勒那样使数秘主义发挥出如此毁灭性的影响。[29]

    数秘主义的影响不可避免地被另一个著名心理现象“确认偏见”放大。在“确认偏见”现象中,人类一旦确定了一个假说或信仰体系,就会只关注支持其信仰的数据,而避免使用与之相悖的数据。

    “确认偏见”这个词与心理学家彼得·沃森有关。在20世纪50年代后期的一个经典实验中,他向受试者展示了一个由三个数字组成的序列,如2-4-6,并要求他们推导出产生该序列的规则,然后让他们用另一个序列对该规则进行测试。[30]

    受试者根据上述序列推出的最明显的规则是“连续偶数”,因此他们最有可能再提出诸如8-10-12这样的序列进行测试,然后他们被告知这一序列与答案规则一致。然后,受试者可能会提出24-26-28这样的序列,然后也被告知这一序列符合规则。

    在多次连续“确认”他们的“连续偶数”规则后,受试者可能会合理地得出结论,认为这就是正确的规则。

    问题是,这三个序列还符合其他多种规则,例如“数字不断增加”或“只有正增长的数字序列”。换句话说,受试者只是试图确认自己的假设,而事实上更有效的策略是测试一些推翻假设的三数字序列,例如5-7-9,如果考官回答说这个序列也符合规则,那么他们就会知道“连续偶数”规则是不正确的,但“数字不断增加”或“每次增加二的数字序列”规则可能仍然成立。

    大多数受试者通常只测试符合其假设规则的三数字,而不是不符合其规则的三数字。这种只寻找支持假设的证据的做法,使得很少人能够推导出正确的规则。

    作为一名科学家,沃森知道,科学方法的核心是试图推翻假设,但作为一名心理学家,他怀疑人类的自然倾向是要确认这些假设。[31]心理学家很快拓展了沃森的研究,并进行了大量的实验,证明人类物种更倾向于寻找和接受确认的证据,而忽视相反的证据。正如那句老话:“一个违背自己意愿被‘说服’的人还会持有不变的看法。”[32][33]

    在20世纪70年代末的一项经典研究中,斯坦福大学的一组研究人员调查了151名大学生对死刑等争议话题的看法,并从中选出48人,其中24人强烈赞成死刑,24人强烈反对死刑(分别被称为支持者/反对者)。然后,他们向两组人展示了两组不同的研究成果,他们说这些研究成果是真实的,但实际上是虚构的。其中一组“研究”表明,死刑州的谋杀率较低,而另一组“研究”则表明,死刑州的谋杀率较高(赞成威慑/反对威慑)。

    支持者们认为,赞成威慑的研究在方法论上比反对威慑的研究更可靠,他们更加相信赞成威慑的研究;而反对者们则认为反对威慑的研究更为合理和令人信服。最具启发性的是,在实验的最后,在参与者阅读并评估了两组相互矛盾的研究结果后,每组都强化了其原来的支持及反对观点。[34]

    威廉·米勒,以及他后来的追随者们,正患上了长期的“确认偏见”病症。计算出1843年这个时间后,米勒专注于寻找确认性的证据,因此他能够说服自己,认为自己的预测是准确的。米勒得出了1843年世界末日的惊人结论:基督将出现在云端,火焰将吞噬大地。正义之人——那些信仰上帝的人——将会被提升天并获得永生,而邪恶之人不仅会被上帝毁灭,而且他们的灵魂将永远被上帝囚禁。[35]

    在近10年的时间里,米勒没有公开这个令人不安的预言,只和周围认识的人讨论。[36]但他的羞怯和内向更加提高了可信度,特别是在卫理公会、浸信会和长老会神职人员中,他们对米勒的这种同时具有学术性和非教派歧视性的方法印象深刻:任何新教派别的成员都有资格获得救赎。米勒的朋友们被他的末日论征服,但不理解他为什么不愿意布道。这其实是因为米勒害怕成为笑柄,这种恐惧可能源于他的社交拘谨和卑微的教育经历。[37]

    1831年夏,他的浸信会妹妹和妹夫邀请他从罗汉普顿去往佛蒙特州的德累斯顿演讲,那里离尚普兰湖只有16英里。虽然他以前读过传教士写的布道,但他从未发表过自己的布道。此时,他已经快50岁了,身体不好。就在普拉茨堡战争之前,他差点儿死于斑点热,此后,他经常受到各种皮肤感染的折磨。

    历史上并没有他那次演讲内容的记录,但他说的话可能与后来的书面布道没有什么太大不同:基督将出现在天空并复活死去的圣徒,正义之人将“在空中遇见主,在那里他们将把自己完全地交给主”。然后基督会把注意力转向有罪之人:

    看哪,天空布满了乌云,太阳蒙上了面纱;月亮苍白而被遗弃,挂在半空中;冰雹降下,七个号角高声吹响;闪电将硫黄火焰的鲜活光芒洒向远方;这个国家的伟大城市将永远不再崛起。[38]

    他的表现让德累斯顿的浸信会教徒们如此着迷,他们一直留他到星期日。在接下来的8年里,他应邀在新英格兰、纽约和加拿大的农村地区演讲。当无法满足远方教徒的演讲邀请时,他给他们提供了书面传单,后来产生了一系列小册子和书籍,而这又引发了更多的演讲邀请。

    有一位目击者似乎对“确认偏见”有直观理解,他对米勒既钦佩又怀疑,他描述了讲坛上的米勒:

    他本人高大魁梧,宽大的脑袋,高高的额头,一双温柔而富有表现力的眼睛,他声音里所有的抑扬顿挫都表明了他最真诚的敬拜。他的想象力相当丰富,从一个有缺陷的前提中得出的结论对他来说就是一个真正的事实。在这种精神状态下,他开始讲课,用大图表说明但以理和约翰的异象。无数的人前来听他演讲,许多心胸开阔的牧师和非宗教人士也乐于接受他的观点,全国东北部的所有地区都弥漫着极大的兴奋。[39]

    米勒所用的圣经数秘主义早已经有数百年历史,同样,他充满活力的布道风格也缺乏独创性。从约1825年开始,一位长老会牧师、第二次大觉醒的主角查尔斯·格兰迪森·芬尼在听众的参与下完善了后来大家都熟悉的“地狱之火和硫黄”的福音讲演。他的布道带来了大量皈依;一位观察家指出,芬尼经过一座城镇后,“宗教情感深深地渗透其中,人们再也无法组织舞会,而马戏团也无利可图”[40]。米勒本人并不赞成这种新的复兴主义布道方式,但是,毫无疑问他已经掌握了芬尼的技巧,而且邀请米勒演讲的许多人都认为他是芬尼技巧的有效实践者。[41]

    和许多早期福音派教徒一样,芬尼是一位坚定的废奴主义者和社会活动家。早期,米勒也有这些信念:罗汉普顿是“地下铁路”运动[42]的一个停靠站,米勒至少庇护过一名奴隶。但1840年,当他参加完一个废奴协会会议时,他确信腐败在人类社会中如此普遍,必须寻求神灵的干预来解决许多弊病,特别是奴隶制:“如果人类是罪魁祸首的话,那么可怜的奴隶的大赦之年还很遥远。但是上帝能够并将释放被俘之人。我们必须也只能向上帝寻求帮助。”[43]

    米勒华丽的演讲风格让普通听众着迷,而且,他对其他新教派别的宽容和对《圣经》文本的熟悉,也让教会的圣职人员着迷。一位持怀疑态度的教会长老想让他难堪:

    我在他房间里见到了他,提出了一大堆为难他的反对意见。令我惊讶的是,他对这些问题几乎都不陌生,而且他回答这些问题的速度和我提出问题的速度一样快。然后他提出了他的异议和问题,这难倒了我,并推翻了我所依赖的那些解释。我回家时已经筋疲力尽,感觉自己有罪,感到卑微,并下定决心要回答这些问题。[44]

    米勒的受欢迎源于他振奋人心的布道,但这是有代价的:让教徒们所感动的远不是米勒的复临主义神学,而是他演讲内容中的地狱之火和硫黄。米勒是为了从地狱之火中救赎灵魂,而邀请他演讲的人则是为了让教堂的长椅上坐满人。当然,到19世纪30年代末,他已经吸引了一大批传播他信息的支持者。例如,1838年,波士顿《每日时报》的编辑发表了一系列米勒的布道;几乎同一时间,一位名叫约西亚·利奇的牧师写了一本名为《午夜呼声!》(The Midnight Cry!)的支持米勒的小册子,其在新英格兰广泛传播;一位名叫查尔斯·菲奇的波士顿牧师,是废奴主义者威廉·劳埃德·加里森的助手之一,连续几次重读了利奇的作品。利奇、菲奇和其他几位米勒的助手将在未来几年内支持米勒运动,并最终鼓励他做出那个最失败的世界末日预测。[45]

    起初,这些支持并没有使米勒受到鼓舞;到1839年,由于年龄增长和健康状况不佳,他已经步履蹒跚;没有几个人相信4年之后的末日,他因此而沮丧并认为自己是个失败者。他不断收到演讲邀请,但他知道,分散在农村的布道只能拯救少数灵魂免遭即将到来的末日大灾难。[46]

    虽然追随者们认为他是先知,但从技术上说,他不是,因为他坚决否认与全能者(上帝)有任何交流。他只是声称自己有能力从《圣经》中领悟未来。不管他如何看待自己,他显然低估了自己富有说服力的安息日神学对美国东北部神职人员的影响力。例如,1838年,他拒绝了波士顿牧师约书亚·海姆斯和加里森的助手菲奇的演讲邀请。

    与米勒的谦虚和不谙世故不同,海姆斯儒雅而圆滑,在波士顿的改革派圈子里人脉很广。第一基督教会对他来说过于保守,因此他建立了自己的教会,并很自然地命名为第二基督教会。在海姆斯的领导下,第二基督教会发展迅速,不得不在波士顿沙登大街另建了一个有500个座位的小教堂。坚强、外向、有号召力的海姆斯丝毫没有因为米勒的羞怯而退缩。1839年秋天的某个时候,他说服米勒向会众布道,而米勒的表现也给他留下了深刻的印象,于是他将自己相当多的精力、组织能力和当时他所掌握的印刷媒介都投入米勒运动中,并有效地接管了这一事业。

    海姆斯不仅将米勒送往冷清的乡村教堂,还送往拥挤的纽约市和奥尔巴尼市大教堂。他重新出版了米勒的小册子和书籍,创办了一份非常成功的报纸《时兆》,它最初是双周报,很快就成了周报。海姆斯还与其他受米勒末日论影响的人建立了广泛的联系,那些人也出版了他们自己的米勒系报纸。其中最著名的是纳撒尼尔·索瑟德,他后来编辑了最著名的复临主义出版物《午夜呼声!》(容易混淆的是,它与利奇的小册子同名)。

    从各种最小的集会到最大的讲座,海姆斯凭直觉领悟到出版物和布道之间的协同增效作用。以引人入胜的复临主义末日叙事为特色的小册子、报纸和书籍引发了对布道的需求,而布道又引发了更多的出版物销量。信徒们到处传播米勒的话语,他们在港口付款,将一捆捆的小册子留在远洋海船和运河驳船上,或者在火车车厢里悬挂海报。[47]

    从1840年开始,海姆斯组织了几次全体大会,汇集并协调米勒的复临运动,不仅包括传统的教堂集会,还涉及大规模的“野营集会”。

    野营集会并不是海姆斯发明的;第一批野营集会在美国建国后不久就产生了,到1840年,已成为一个组织。其成员一部分是奋兴派[48]教徒,一部分是社交俱乐部成员,他们吸引了很多南卡罗来纳州、田纳西州和肯塔基州边境地区原本孤立的农民。这些农民迫切需要社交活动。通常,他们的浸信会和卫理公会组织者会清理出一片森林土地,将砍伐的树木做成粗糙的长凳和小讲坛,作为流动教堂。(另一方面,圣公会教徒和公理会教徒对野营集会及其传教活动嗤之以鼻。[49]

    米勒的追随者于1842年6月下旬举行了前两次野营集会:一次在新罕布什尔州的东金斯顿,另一次在魁北克的哈特利。新罕布什尔州的集会取得了惊人的成功:多达1万名浸信会教徒和卫理公会教徒前来参加,还有少量自然神论者和不信仰耶稣的“异教徒”,其大概是被无宗教派别歧视的伙伴关系吸引而来的。这次集会证明,海姆斯是一位后勤高手:这些聚会地点都很容易通过铁路到达,根据一位历史学家的说法,还有“大量纯净的凉水,高大的铁杉树和凉爽的树荫,以及僻静的小树林来做祈祷和敬拜”[50]。大、中型城市赞助了帐篷用来住宿,铁路建立了临时车站,为信徒们降低了票价,并让传教士免费乘车。最后,每个帐篷的“主人”都提供了一张记录表,记录着从永恒之火中救赎的灵魂。

    新罕布什尔州的集会非常成功,因此海姆斯和他的同事决定购买一个“大帐篷”,它高55英尺,直径为120英尺,可容纳4000人,过道中还可容纳数千人。在天气恶劣时,它可以在室内提供服务,并可以配备炉灶,以便在寒冷天气举行集会;这个帐篷吸引了纽约州罗切斯特市以及西至俄亥俄州的数千人。在随后的两年中,海姆斯和他的同事组织了125次野营集会,约50万人参加。[51]

    每次野营集会结束时,牧师们都会安排一场祈祷或一首告别的歌曲,其中最受欢迎的是歌曲《永不分离》。

    我们正穿过以马内利[52]的地盘,

    我们很快就将听到号角声,

    很快我们将与耶稣一起统治,

    永不,永不分离。

    什么?永不分离?

    是的,永不分离。

    因为我们很快就会和耶稣一起统治,

    永不,永不分离。[53]

    牧师随后带领会众排成一队走出帐篷,队伍螺旋排列,每个人都能与其他人握手。由于世界末日即将来临,信徒们期待着他们在“天堂野营”的下一次会面。[54]

    米勒为自己的成功付出了高昂的个人代价。起初他的身体就不太好,据他估计仅在1841年就做了627次90分钟的激情演讲。[55]在这期间,由于米勒的皮肤疾病和劳累状况,不止一次,健康问题迫使他早早回到罗汉普顿。他的助手们非常热情地接替了他,因此他对运动的影响力有所减弱。[56]

    若得不到精心管理,情绪满满的群众事件很可能会失控,后来的野营集会就发生了这样的事情。由于海姆斯忙于传播米勒的信息,他让副手查尔斯·斯塔克韦瑟负责管理沙登大街小教堂,但事实证明,斯塔克韦瑟特别善于煽动会众进入疯狂状态。由于害怕他的这种影响,海姆斯最终解雇了斯塔克韦瑟,但无法阻止他参加野营集会。在野营集会上,斯塔克韦瑟的布道使信徒相信他是圣灵的宿主,并拥有“天赋”,包括能够停止蒸汽机或在水上行走。此外,在另一次集会上,一位与会者声称读懂了一位信徒的性格和内心,然后号召追随者们联合起来反对他的怀疑者,以消除永恒诅咒的痛苦。当怀疑者们反抗时,他讲着不为人知的语言并连续击打他们,周围的人试图干预,但也被他谴责下地狱。[57]

    更重要的是,米勒和海姆斯开始失去对日益强大的复临主义传播媒介的控制。信徒们开始出版自己的报纸,名称诸如《真理之声》《将临王国的喜讯》《降临纪事》《帐篷通信》《朱比利号角》《西部午夜呼声》等。其中最后一份报纸是由卫理公会牧师乔治·斯托尔斯创办的,他曾经因为废奴活动而被关押在新罕布什尔州,又以同样的热情追求复临事业,最终落得惨痛的结局。

    1842年12月31日,新年前夕,全国各地的复临主义者聚集在沙登大街迎接1843年的到来,这将是世界的最后一年。海姆斯和斯塔克韦瑟(后者那时还没有被解雇)在拥挤的小教堂里布道。日渐虚弱的米勒向信徒们发出了一封信:

    根据我们的信仰,今年是撒旦统治我们地球的最后一年。耶稣基督会来,并打破他的头……地球上的王国将被粉碎。那有权做王的,必夺取国,得为业,直到永远。[58]

    到了2月,米勒已经从疾病中恢复到可以前往费城,在那里,巨大的中国式博物馆大厅被租来进行他的布道。兴奋之情是如此明显,等待在外面的人群也是如此不守规矩,以至于市政府因为担心市民混乱而取消了2月9日的第一次布道。第二天,米勒的布道效果很好,意外事件也没有发生。随后不久,应市长的邀请,他在特伦顿市进行了布道。在回家的路上,米勒生病了,直到那年秋天一直留在罗汉普顿。海姆斯和几位同僚将国家划分为几个区域,并在各地的教堂布道,租用大厅,还将宣传资料分发,西至威斯康星州和密苏里州,南至北卡罗来纳州和南卡罗来纳州。

    这场运动的中心在波士顿的沙登大街,想听海姆斯布道的人的数量大大超过了教堂的座位数,因此他们计划在霍华德街修建一个更大的、能容纳3000人的场地。根据城市法令的要求,这样规模的建筑需要用砖把四面都围起来,而世界末日已近,因此霍华德街地段非常理想——已经有三面墙,只需要在第四面修建一堵12英尺高的墙。

    这场运动早已引起广大公众的怀疑和奚落,此时,收到了公开的敌意。报纸上充满了警告和蔑视,认为这个信仰体系不仅危险而且极度鲁莽:如果世界末日即将来临,那么不仅在波士顿,而且在辛辛那提和克利夫兰建造会堂都毫无用处。尽管公众的反对声越来越大,但信徒们还是在1843年5月4日为霍华德街的会堂举行了落成仪式。

    正如大多数闭关自守的信仰体系那样,米勒利用确认偏见来支持他们的神学;与往常一样,《圣经》再次成为支持性数据的来源宝库:

    第一要紧的,该知道在末世必有好讥诮的人,随从自己的私欲出来讥诮说:主要降临的应许在哪里呢?因为从列祖睡了以来,万物与起初创造的时候仍是一样。(《彼得后书》,第3章,第3—4节)

    为了鼓舞因日益受到公众蔑视而灰心丧气的队伍,《午夜呼声!》开设“骗徒”和“嘲笑者角落”两个固定专栏。[59]

    米勒一直没有指明末日的确切日期。他将《但以理书》8:14中的2300年加在了波斯皇帝阿尔塔薛西斯允许犹太人返回耶路撒冷重建圣殿的那一年(公元前457年)上,这个简单的算术确定了耶稣复临的时间是1843年。随着这一年平淡无奇地过去,米勒开始敷衍:由于《圣经》中的事件是按照犹太拉比的历法计算的,3月或4月才是一年的开始,根据这一计算调整,犹太人的“1843年”直到1844年3月21日才结束,因此时间仍然充足。[60]

    1844年初,米勒重返战场,在波士顿和纽约市向广大听众布道。随着那个重大日期的临近,他与约西亚·利奇和海姆斯一起,在华盛顿特区举行了一次压轴布道。但是,被米勒称为“恺撒之家”的首都似乎更关注当年的总统选举,而不是即将到来的天启末日,这让他烦恼不已:

    我们的统治者和政治家还没有准备好放弃他们的权力,他们正在为下一任总统而进行政治斗争,就好像他们小小的“短暂权力”将永存一样。但是在上帝的话语、圣灵和历史的帮助下,我将向他们展示,一场重要的革命即将发生,这将取代选择总统的必要性。[61]

    到了3月3日,米勒已经在首都发表了19次布道,然后在返回罗汉普顿的路上又发表了几次。回到罗汉普顿的他精疲力竭,等待3月21日的末日。

    这一天,又平安无事地过去。米勒通过私人邮件写给海姆斯一些充满希望的话语,又通过复临主义的报纸将一些信息发给信徒们:他的计算从来都不精确,所以如果计算偏离了一周或一个月或两个月会怎么样?上帝仍会降临。至于海姆斯,他警告读者:“因此,我们只在心中把事件推迟一个小时是不安全的,应该要生活在不断的期待中,随时准备与我们的大法官(指耶稣)见面。有了这样的想法,我们无法为未来做出确定的安排。”[62]

    实际上还有很多回旋余地。例如,海姆斯旗下的一份报纸《时兆》在上一年发表过一篇未署名的文章,其指出了米勒的计算错误:因为基督教历法中没有0年,所以公元前457年和1843年之间仅相隔2999年,而不是3000年。因此,末日应该发生在“犹太年”的1844年,而不是1843年。

    这篇文章进一步对米勒使用的犹太教历法提出了异议。罗马人将犹太人驱逐到各地后,犹太的大麦收割(赎罪节的日期以大麦收割为基础)再也无法观测到,因此几乎所有犹太人都采用了拉比历法,这是一种精确的数学测年系统,以19年为一个周期。然而,这种较新的历法直到4世纪才开始使用。这篇文章的作者认为,更好的做法是观察圣经时代所使用的“卡拉”历法体系,该历法以最接近犹太大麦收割时间的新月出现时间为一年的开始。通过这种方法计算,天启末日将发生在1844年4月29日。[63]

    但是,那一天也安然无恙地过去了。公众的嘲笑声越来越大,米勒很容易从他的邻居那里听到一些类似的话:“什么?!还没升天?我们以为你已经升天了!不是被你妻子丢下等待被烧吧?”[64]

    《圣经》再次被挖掘出来,以解释为什么末日没有到来。《旧约》中最晦涩难懂的《哈巴谷书》2:3中有这样一段话:“因为这默示有一定的日期,快要应验,并不虚谎。虽然迟延,还要等候。因为必然临到,不再迟延。”《圣经》其他地方也出现过“迟延”一词,最重要的是《马太福音》25章中的一个寓言,10个童女等待“新郎”,新郎代表耶稣。第5节和第6节解释说,“新郎迟延的时候,他们都打盹儿睡着了。半夜有人喊着说,新郎来了,你们出来迎接他”(利奇的小册子和最著名的复临报纸《午夜呼声!》即由此得名)。这种解释使失望的信徒安心了:耶稣的工作基本上完成了,他只是在迟延。

    米勒派遵循了多萝西·马丁的追随者在飞碟首次未能出现时的剧本。一些追随者离开了,但那些留下来的人则加倍努力向周围的人传教。野营集会仍在继续,春季失望之后所产生的不信任,在降低信徒人数的同时,也为更热情的信徒带来了机会。狂热的斯塔克韦瑟被逐出沙登大街后,带走了许多追随者。另一个狂热分子卡尔文·弗伦奇宣称,信徒们不仅可以避免地狱之火,还可以实现“圆满”(一种他们所做的任何事情都可以被宽恕和被祝福的状态),包括可以在婚姻界限之外拥有很多“精神妻子”,这是所有时代的末日论领导人经常享有的特权。斯塔克韦瑟也热情地宣扬这一点。

    1844年8月,在新罕布什尔州埃克塞特市举行的野营集会上,失望与狂热交织。在一次枯燥无味的演讲中,演讲者约瑟夫·贝茨中途被米勒的一位助手打断,助手说一位以前不知名的人物塞缪尔·斯诺有紧急消息。

    斯诺告诉人们,他对《旧约》和《新约》进行了详尽的调查,并取得惊人的发现:4个犹太教圣日和4个基督教圣日之间有一对一的一致性。那一年已经庆祝了3个基督教圣日,而第4个对应着犹太赎罪日的基督教圣日还没有庆祝。赎罪日是犹太教中最神圣的节日,发生在犹太历法的第7个月(提市黎月)的第10天。

    对于1844年的赎罪日在9月23日,斯诺不同意这个日期,他觉得使用古代的卡拉历法更准确,这种历法比犹太教历法晚一个月;因此,末日时间将在10月22日。(即使如此“精确”也有一些不确定性。因为在那个时代,耶路撒冷的新月出现在数千英里之外,新大陆无法观测到,有一些信徒认为实际日期可能会延长至10月24日。)[65]

    斯诺的消息震惊了整个营地,甚至连被打断演讲的贝茨也吓了一跳,贝茨写道:

    这个消息开始发酵,传遍了整个营地。集会结束时,新罕布什尔州的花岗岩山上回响着呼喊声:“看,新郎来了,你们出去迎接他。”当满载的马车、舞台和火车驶过新英格兰地区的各个州、城市和村庄时,呼喊声仍然响亮,“看,新郎来了!”基督,我们可称颂的主,将在第7个月的第10天降临!准备好!准备好![66]

    引用的“新郎”一词再次指向《马太福音》25章。模仿海姆斯的做法,斯诺创办了名为《真正的午夜呼声》的新报纸。斯诺的计算并不是原创:早些时候,米勒本人曾有过“第7个月的第10天”的提法。1844年夏天,饱受批评的米勒派因认知失调和确认偏见而变得狂热,正好可以利用斯诺的构想。充满激情的乔治·斯托尔斯也支持这一构想。

    斯诺和斯托尔斯都是适应能力强的人:斯诺一开始自称为“异教徒”,为一家公开的无神论报纸《波士顿调查》撰稿;和那个时期的许多非信徒一样,他在阅读了米勒的著作后皈依了基督复临主义。而斯托尔斯一开始是卫理公会教徒,有一次他应邀在教堂进行废奴主义的布道;为了阻止他,逮捕他的人将他从教堂拖了出来。

    复临主义的高层们,就像所罗门·阿希的线条测试实验中更易受别人影响的受试者一样,一个接一个地,接受了“第7个月的第10天”,也就是当时日历的10月22日这个末日日期。9月下旬,该运动的旗舰报纸《午夜呼声!》的编辑内森·索瑟德在该报上刊登并支持10月22日这个末日日期。海姆斯一直是一个讲究实效的组织者,他察觉到队伍里的日期改变并提醒米勒,因为米勒以前也提过第10天/第7个月的说法;于是两人都于10月6日确认末日日期是10月22日。现在离末日大概只有两周了。[67]

    米勒在《午夜呼声!》中写道:

    我在第7个月看到了我从未见过的荣耀。虽然主在一年半前向我展示了第7个月的特殊担当,但我没有意识到这类担当的力量(《新约》和《旧约》在圣日问题上的一致性)。现在,称颂主的名字,我在《圣经》中看到了美丽、和谐和一致,我一直在为此祈祷,但直到今天才看到。——我的灵魂啊,感谢主。斯诺兄弟、斯托尔斯兄弟和其他人打开了我的眼睛,他们应该受到祝福。我快回家了。荣耀!荣耀!!荣耀!!![68]

    信徒们大致接受了斯诺的计算;10月12日,守旧者中最持怀疑态度的约西亚·利奇也开始与末日步调一致:

    我的困难全都消失了,我现在在《旧约》中上帝话语所闪耀的光芒里感到愉悦……我感到自卑,服在神大能的手下,现在我抬起头,满怀喜悦地期待10天内见到万王之王。[69]

    霍华德街的会堂里挤满了人,《午夜呼声!》和《复临通报》最先进的蒸汽印刷机24小时不停地疯狂运转,试图在耶稣关上救赎之窗前从地狱之火中拯救出尽可能多的灵魂。

    这时,信徒们已经强烈地意识到,世界上的其他人都认为他们疯了,因此他们面临着一个可怕的选择:要么继续他们的日常活动和生意,被贴上伪君子的标签;要么停止所有这些活动,被指责为狂热分子。领导层一直注意运动的公众形象,建议采取前一种做法:信徒们要过正常的生活,直到末日。

    《午夜呼声!》的最后一期报纸,在预期末日之前的10月19日出版。这期报纸包含了很多由衷的信念表达。也许最令人印象深刻的是威廉·尼古拉斯,他刚刚拜访了他的复临派邻居巴克斯特夫人:

    这是她能够吃点儿东西的第29天。但显然她身体很好,看起来很健康,邻居们说她的体力最近有所增强。她说她没有生病,身体很好。昨天和今天早上,她都出了趟门。[70]

    米勒非常谦虚,他估计有5万人相信耶稣将会在1844年复临,而其他人则认为这个数字是美国总人口2000万中的100万;受人尊敬的美国古文物学会将这场运动的信徒人数定为15万~20万。[71]10月22日,他们中的大多数人沉着自信地迎接末日,与家人在家中或教堂静静地聚集,并告别那些他们认为无法避免地狱之火的人。海姆斯从波士顿前往罗汉普顿,与米勒一起迎接救世主。

    米勒和海姆斯劝诫他们的追随者,要按照圣经的指令“你们去做生意,直等我回来”(《路加福音》19:13)进行日常活动。尽管有这样的建议,但1844年春天,许多人并没有播种庄稼,或者有的播种了但没去收割,以此表达他们的信仰。有些人结束了自己的生意,敲响了公共警报,并不再让孩子们去学校。有些人更进一步,把自己商店和面包店的东西都送给了别人。还有一些人把自己的大部分钱和世俗财产都送给了别人。[72]复临主义的报纸报道说,有几十个人在野营集会上供认了自己的罪行;当信徒们试图把钱送人时却没有成功,钞票散落在讲坛上。信徒们放弃了自己数千美元的债权;纽约立法机构宽恕了一名议员,以便他能为世界末日做准备;在罗切斯特,一名妇女供认了几年前在英国犯下的谋杀罪,并要求被送回那里受审。[73]根据一部19世纪的费城综合历史:

    米勒教堂位于伍德和卡洛希尔之间的朱利安娜街上,在那里,米勒的追随者们日夜相聚,望着星星和太阳,祈祷并警告执迷不悟者“审判日就在眼前”。他们中的许多人开始以很低的价格出售土地和房屋。其他人则捐出个人物品,结束生意或腾空房屋。在第五街的一家商店里,栗子树的上方有一块标语牌,上面写着:“这家商店为了致敬王中之王而关闭,他将在10月20日左右出现。准备好,朋友们,给他加冕万王之王!”[74]

    主流米勒派非常平静地等待10月22日的到来,他们对末日神学所产生的狂热感到忧虑:

    随着日期的临近,受骗的人们放弃了所有事情,只给自己安排各种集会,在附近的私人住宅里日日夜夜地集会。他们几乎完全忽略了自己的世俗事务,有些人甚至让幼儿自己照顾自己,或者由那些不那么痴迷于集会的人来照顾。[75]

    预期的复临日对整个社会的影响大大超过了对信徒的影响,因为每一个坚定的米勒派肯定会面对几个不信仰的人,随着10月22日的临近,每当起风或天色变暗时,这些不信仰者就会想,他们是不是不应该下这个赌注。在纽约的伊萨卡,一名男子被“着火”的喊声惊醒,他经过调查发现,起火的源头是一个基督复临派的会议厅,他对于“米勒派圣殿着火了,而不是全世界着火了”表示宽慰。[76]

    这次事件之后,20世纪20年代初,一位名叫克拉拉·恩迪科特·西尔斯的接受私人家庭教育的美国北方贵族,对米勒运动感兴趣,并通过在报纸上发布广告来征求这一事件的第一手资料。她收集了大约160个故事,将其编入一本名为《幻想的日子》(Days of Delusion)的书中,这本书极大地加深了现代人对米勒运动的疯狂的印象,尽管历史学家已经得出结论,其中的许多故事(如果不是大多数的话)通过父母、祖父母、阿姨和叔叔80年的滤化,可能已经被渲染,或者显然是不真实的。

    尽管如此,西尔斯收集的故事中仍有几个主题始终如一:许多米勒信徒在山顶上等待,还有少数信徒在墓地等待。许多故事也确实像是真实的:西尔斯的一位上了年纪的联系人,在1844年时还是一个小女孩,她记得曾向一位邻居女孩求助,这位女孩的父母都是米勒信徒,她想请这位女孩帮忙做饭。这位女孩的父母告诉她,女孩正在为被提做准备,她问:“若这没有发生,她能在一周后过来吗?”她后来回忆说:“尽管我很小,但我永远不会忘记她脸上的恐惧表情,以及她那双蓝色大眼睛里充满的泪水。”

    西尔斯的另一个故事来自一个热心的米勒信徒,他讲述了唯一神教派的牧师西奥多·帕克和诗人拉尔夫·沃尔多·爱默生的对话。爱默生说:“世界末日不会影响我;没有它,我可以继续生活。”帕克回应说:“这与我无关,因为我住在波士顿。”[77]

    西尔斯的书中最令人难忘的一个故事,描述了米勒信徒们穿着白色“升天长袍”等待升天的情景,以及他们从树上跳起后掉下来摔断脖子和四肢,有时还使用了自制翅膀的情景。这些情节虽然看似可信,但很可能是复临派反对者宣传的结果。

    批评家们还指责米勒主义导致精神病院住满了精神病患者,但这也可能是虚构的:宗教思想经常会带一点儿精神分裂症特征,它是一种常见的紊乱症,但新英格兰地区的精神病院记录本上,只在少数情况下提到了米勒主义。[78]此外,一位米勒信徒将自己所有的世俗财产都送给了别人,他的亲人很合理地试图把他关起来。1843年,一个叫普尔的信徒,为了支付从波士顿到西部说服别人皈依和传播圣经的旅费而花掉了自己的财产,他的一个兄弟把他骗到家中并试图将他送进精神病院,但他被他的复临派旅伴救了出来。[79]

    10月22日是个硬目标,10月的失望比春天的失望更强烈地打击了信仰者。他们的集体绝望压倒了一切。据米勒所说:“似乎所有的恶魔都从无底深渊中释放在我们身上。”[80]据该运动的一位长老路易斯·鲍特尔观察:

    10月22日过去了,那些忠实和渴望的信徒感到难以言表的悲伤;那些不信仰的人和恶人却在欢喜。一切都依旧。复临前兆没有了;以前的集会没有了。每个人都感到孤独,几乎不想和任何人说话。大家像是在寒冷的世界里!上帝不会来的!任何语言都无法表达出一个真正的复临派信徒的失望之情。只有那些经历过的人才能加入这个话题。这是一件丢脸的事,我们都有同感。除了询问“我们在哪里”和“下一步怎么办”以外,大家都在沉默。[81]

    救赎失败受到了广泛的鄙视。许多复临派教徒都是废奴主义者威廉·劳埃德·加里森的追随者,而加里森却说他们患有“一种可悲的大脑幻想,现在已经清楚地证明是这样的”,这格外令人感到刺痛。(加里森另有企图,他认为米勒运动抢走了废奴运动的人员和资源。)[82]

    信徒们受到了大大小小的侮辱,从小男孩们嘲讽“你还没有上升吗?”到对海姆斯的严重欺诈指控(波士顿的一家报纸建议他避免在街上露面)。

    在这些指控中,海姆斯是无辜的。他主动提出,如果有人有任何关于他欺诈的证据,那么他将提供4倍的还款(但没有找到任何证据);他找到了一些证人,这些人撤回了之前对他渎职的错误陈述;他还让银行证明他的私人财产很少。[83]随后,海姆斯积极组织对那些在复临中疏忽个人和经济事务的人进行经济救济。“大失望”[84]的直接后果是,暴徒洗劫并烧毁了会堂,闯入集会并挥舞枪支挑衅。1845年1月29日,米勒被罗汉普顿浸信会逐出了教会,这对米勒本人是一种极大的侮辱。

    与多萝西·马丁的追随者一样,复临派教徒对这种强烈的认知失调做出了各种各样的反应。斯诺与马丁女士以及她最忠实的追随者们一样,加倍努力,坚持认为末日即将到来。斯诺的顾问乔治·斯托尔斯则恰恰相反,他否认了自己之前的信仰。

    其他人有两种应对方式。第一种,最终成为最重要的一种,是“灵化”论,由来自纽约州北部的一位名叫海勒姆·埃德森的米勒派人士提出。埃德森声称基督在10月22日采取了行动,不过是以簿记模式,而不是以末日模式。他没有回到地球,而是进入了“至圣所”,正辛苦地将人类分为粗俗和善良两类。最终,他将完成名单设定,然后才回到地球做最后的判决。

    10月22日“大失望”的第二种应对认知失调的方式是“闭门”论。持这种观点的人认为耶稣还没有复临,但已经在10月22日那天,对那些没有看到光明的人关闭了极乐城之门,耶稣只会拯救选民,也就是他们。而且,作为选民,他们的“圆满”赋予他们各种性特权,从“淫乱的洗脚礼”到“圣洁的亲吻”,再到精神婚姻的最终肉体回报。[85]

    米勒,就像他经常做的那样,采取了一种微妙的、界限不清的方式,躲躲闪闪、支支吾吾,最后将责任归咎于现有历史数据不精确;末日肯定会到来,但由于计算的不精确性,它可能发生在长达数年之后。

    此时,他已经精疲力竭、病入膏肓。他徘徊了5年后最终死去。精力充沛、精明强干的约书亚·海姆斯试图将这场运动凝聚起来。10月22日的承诺对他来说只是一个务实事件,而不是神学信仰,因此他很快就改变了立场。他拒绝进一步做任何日期设定,并试图压制他所鄙视的“灵化”论和“闭门”论。这激怒了诸如斯诺那样的“闭门”人,斯诺谴责米勒和海姆斯将会因叛教而下地狱。[86]

    海姆斯不可避免地失败了;米勒派会众萎缩,报纸订阅量急剧下降,运动分裂得无法修复。斯诺的正统派很快就消失了;以海姆斯和米勒为代表的主流群体承认了他们的预测错误,但仍然相信即将发生的耶稣复临。海姆斯本人逐渐远离了这场运动,最终回归到童年时代的信仰——主教制度主义。

    和16世纪的再洗礼派一样,一小部分的“灵化”者幸存下来,并发展出一个和平的现代教派——基督复临安息日会。今天的基督复临安息日会是一个温和的现代主流团体,交际保守,鼓励素食主义,遵守严格的安息日禁令。该教派依然宣扬耶稣复临,但并不确定复临日期,这是可以理解的。[87]

    但幻想的复临派末日论余烬从未熄灭。“大失望”一个半世纪后,一个脱离复临安息日会的小教派,大卫·考雷什的大卫支教,引发了美国宗教史上最悲惨的事件。

    正如心理学家利昂·费斯汀格描述的那样,日期设定会产生一种内在的不稳定动态。预言越精确,就越有说服力;前几次的预言没有实现,由此产生的认知失调鼓励信徒们以更大的活力和精准度宣讲自己的信仰,从而吸引了更多的信徒;最后,一个大胆而精确的预言出现了,这个预言肯定会失败,然后动摇大多数追随者,只留下一小部分顽固的信徒。费斯汀格的研究解释了米勒事件,但他的描述不仅适用于宗教信仰,还适用于政治和文化信仰:

    尽管有一个限度,超过这个限度,信仰的失验将很难被承受,但很明显,引入相反的证据有助于增加信仰者的信念和热情。[88]

    主流基督教派再也不会犯错去进行日期设定了。正如宗教历史学家欧内斯特·桑登所说:

    米勒事件几乎摧毁了整整一代的美国前千禧年主义者……但把注意力集中于1843年时,米勒也引入了一个可能会摧毁这场运动的因素……米勒在1844年之前越成功,就意味着1844年之后的千禧年主义者传道越困难。美国人花了很长时间才忘记威廉·米勒。[89]

    但是,仍有一些人无法抗拒将《圣经》的模糊语言转化为精确预言的冲动。20世纪,米勒的神学继承人学会了对末日发生日期含糊其词,但事实证明他们依然过分地热衷于末日的发生;正如米勒及其追随者忍不住要从《圣经》中推出一个确定日期一样,他的现代追随者们总是尝试做一件事,即将当天的报纸头条事件外推到看似合理的末日叙事中,但不可避免地都失败了。正如多萝西·马丁的飞碟一样,每一次的认知失验都会产生更多的信仰归附和更离奇的叙事。

    令人担忧的是,这些叙事将对那些控制世界末日机器的人[90]产生巨大的影响。

    6 弹性货币政策的灾难

    泡沫与崩溃的四个前提

    人们在最快乐的时候,都是最轻信的;当人们刚刚赚了很多钱,当一些人真的在赚钱,当大多数人认为他们在赚钱,此时就是人们最快乐的时候,也是捏造谎言的最巧妙时机。人们在这样一小段时间里几乎会相信任何事情。 ——沃尔特·白芝浩[1]

    1929年初秋,温斯顿·丘吉尔在加拿大进行了一次悠闲的私人火车旅行。10月24日,黑色星期四,他抵达纽约,正值那个秋天第一次股市大暴跌,他在那里看到,“就在我房间的窗户下,一位绅士从15层纵身跳下,摔得粉身碎骨,引起一场严重混乱,消防队也赶来了”。第二天,丘吉尔被邀请进入纽约证券交易所的访客大厅,他在那里注意到:

    我以为我会看到混乱;但眼前的平静和有序出人意料。(证券经纪人)被最严格的规则约束,不能奔跑或提高说话的音量。于是,他们就在那里,来回走动,就像一段被扰乱的蚂蚁群的慢镜头影像一样,以旧价格的1/3和现值的1/2互相提供大量的证券。凑在一起较长时间后,他们发现没有人能买得起他们被迫卖出的股票。[2]

    此后不久,他乘船回家,没有意识到4年前他在财政上的一窍不通[3]与眼前发生的重大事件之间的联系。不过,这次股票崩盘事件确实影响了丘吉尔,摧毁了他的投机性投资组合,使他负债累累。他个人的不幸却给后世带来了一线希望:为了偿还债主,他开始依赖自己最可靠的饭票——他的笔。在接下来的10年里,他创作了一些优秀的书籍、许多文章,甚至还有一部剧本。

    将丘吉尔1929年之前的政治生涯形容为“起起落落”未免有些轻描淡写。作为第一次世界大战期间的海军大臣,他曾大力支持加利波利之战,之后的惨败导致数千人死亡,他也被降级。10年后,首相斯坦利·鲍德温没有意识到丘吉尔对财政一窍不通,任命他为财政大臣(相当于英国的财政部长)。(丘吉尔是这样描述他与财政部专家的互动的:“如果他们是士兵或将军,我就会理解他们在说什么了。但好像他们说的都是波斯语。”)[4]

    经济学家在讨论金融泡沫时,最常提到的名字是海曼·明斯基。20世纪50—80年代,明斯基在经济学界扮演了一个奇怪的角色——一个长头发的反传统主义者,他认为资本主义从根本上是不稳定的,他是一个现代的、更理智的卡尔·马克思。他比任何一个20世纪的观察家都更好地理解和描述了泡沫及其破灭的病理生理学,认为泡沫及其破灭需要具备两个必要条件:利率下降带来的信贷宽松,以及激动人心的新技术的出现。

    首先是利率。第一次世界大战前,英镑纸币可以以每盎司4.86美元的价格自由兑换成黄金主权硬币,纸币持有人相信有足够数量的黄金满足任何需求。由于英镑似乎坚挺,因此将英镑兑换为黄金的人相对较少;毕竟,持有一大块黄色金属有什么用呢?但是,当英国开动印刷机、用印钞的方式来支付战争费用时,不断增加的纸币数量侵蚀了人们对纸币的信心,持有者越来越希望将纸币兑换成黄金。

    战争结束后,由于英国的黄金数量几乎不足以支付纸币,英国不得不暂停兑换,以免贬值纸币的持有者耗尽国家的黄金储备。但是,1925年,丘吉尔按照旧价格恢复金本位制,这一举措是灾难性的。被高估的英镑使英国国内商品更加昂贵,从而减少了出口;此外,人为的高汇率也使外国商品更便宜,从而鼓励了进口;到1926年,英国的黄金储备下降了惊人的8000万英镑(占其总量的10%)。[5]

    自美国诞生以来,美国和英国的政府官员就建立了密切的私人友谊,而在这个关头,这种关系——世界上两位最重要的央行行长美联储主席本杰明·斯特朗和英格兰银行行长蒙塔古·诺曼之间的友谊,却被证明是特别不幸的。

    提高英镑价值和阻止黄金外流的最可靠方法是降低美国利率,这可以使以英镑计价的资产相对更具吸引力。1927年,斯特朗这样做了,从而帮助诺曼摆脱了困境,但这只是暂时的。当时的美国已经处于经济繁荣时期,在丘吉尔即将结束其北美之行、到达纽约之际,低利率引发了一股投机热。

    到了1929年,发达国家已经习惯了周期性的金融动荡。漫不经心的观察家和历史学家经常将这些繁荣和萧条称为疾病,而医学模式确实有助于了解该类事件中的患者和疾病,不管是个人事件还是社会事件。

    医生从三个基本视角来理解疾病:病理生理学视角,即疾病过程的生物化学和生理学基础;解剖学视角,即受影响的身体部位;症状和体征视角,即病人的感觉和医生看到的情况。

    我们可以用同样的方式理解泡沫和崩溃。例如,它们的病理生理学,涉及人类心理的反复无常和现代银行系统信贷供应的不稳定性。它们的解剖结构由“4P”组成,即发起人(promoters)、公众(public)、政客(politicians)和媒体(press)。最后,它们的症状和体征包括对几乎不劳而获的财富的迷恋——一种具有社会传染性的迷恋,发起人的傲慢,以及公众对他们的崇拜。[6]

    根据海曼·明斯基的理论,泡沫膨胀不仅需要1927年本杰明·斯特朗降低利率所产生的那种信贷宽松,还需要激动人心的新技术的出现。这样的技术进步出现在科学或工程领域,比如19世纪的铁路;或者出现在金融领域,比如17世纪和18世纪的合股公司。[7]新技术或金融产品可以是股票、房地产或者其他工具,投资者为它们的出现而激动,开始向它们投入资金。由于这些资产也可以成为贷款的抵押品,因此资产价格的上涨意味着投机者可以以资产作为抵押品,借更多的钱继续购买这些资产,这进一步抬高了价格,然后他们又能够借更多的钱——这是一个自我强化的“良性循环”,但只限于上升时期。因此,狂热、恐慌和崩溃从1600年左右开始成为西方生活中长期反复出现的一部分,这绝非偶然,因为那个时候首次出现“技术替代”和弹性纸币信贷。

    今天,技术替代可以采取多种形式。令人目眩的科技进步速度似乎是现代生活的一个永恒特征:仅仅在20年前,如果人们被告知世界范围内的个人视频通信将无处不在且几乎免费,那么人们会难以置信。就在20世纪40年代,即使是年富力强的人也经常受到霍乱、伤寒、细菌性肺炎和脑膜炎等常见细菌性疾病肆无忌惮的折磨,这与他们财富的多少和社会阶层的高低无关。但在发达国家,在青霉素等抗生素出现后,这些灾难极其罕见。

    相比之下,在1600年之前,缺乏技术是一个被接受的事实。在印刷机出现之前,许多技术进步都轻易地丢失了,因为手工抄写文档如此费力和昂贵,没有足够的副本流传下来。此外,低识字率意味着工匠们往往无法记录他们的技术,这些技术也随着工匠的消失而消失。例如,罗马人发明了混凝土,但混凝土的使用实际上随着帝国的灭亡而消失;直到1756年,约翰·斯梅顿才重新揭示了波特兰水泥的秘密。

    1450年左右,谷登堡发明了批量生产的可移动式印刷机,消除了技术进步的这一特殊障碍,但其他障碍仍然存在;1600年以前,西方的人均GDP几乎没有增长,东方也是直到很久之后才有增长。

    1620年,哲学家弗朗西斯·培根出版了他的《新工具》[8]一书。在培根之前,科学家被称为“自然哲学家”,他们通过亚里士多德的“演绎”法,从公理出发发展自己的模型,所有进一步的推理是以不可置疑的公理为基础的。在这一体系中,可观察到的事实几乎是事后补充上的。

    《新工具》本身就是一种技术替代,它有双重作用。首先,它认识到旧的亚里士多德式的演绎推理体系压制了人类进步;其次,它提出一个可行的替代方案——一个“归纳”过程,即仔细收集经验性数据,然后将数据与理论相匹配——这才是现代科学方法的本质。接下来几代人的时间里,培根那些有才智的继承者,如胡克、博伊尔和牛顿(仅举几个例子)成立了伦敦皇家自然知识促进学会(现在简称为英国皇家学会)。这催生了整个欧洲的类似群体,科学发现开始惊人地加速。[9]

    17世纪不仅诞生了科学方法,还有第二次社会革命,即弹性货币的出现。大多数美国人误解了一个概念,以为货币就是由政府颁发的绿色纸张,一种“可以支付所有债务,包括公共债务和私人债务的法定货币”,或者,在过去是一种印有字样的金银小圆片。但是,在古代,几乎任何东西都可以是货币:一定标准的小麦、油,或者随着时间的推移,白银出现。一直到公元前7世纪中期,小亚细亚的吕底亚人才铸成第一枚琥珀金币,那是一种金银的混合币。

    今天,我们生活在一个完全不同的世界。在美国,只有1/10的货币是流通纸币和硬币;政府和银行计算机的按键输入创造了其余部分的货币。例如,银行发放抵押贷款时,不会采用运动包里装满印有亚历山大·汉密尔顿、本杰明·富兰克林和各种已故总统照片的绿色亚麻布[10]的形式;相反,它会向贷款公司发送一个电子包。这些支票或电子包肯定没有相应数量的纸币和硬币作为支持,更不用说金、银或牛作为支持了。

    这种信用体系在今天被称为“部分准备金银行体系”,由17世纪的金匠们创立,在之后的几个世纪里变得越来越有弹性。早期银行如果发行远高于2:1的存款准备金率的凭证,就有可能遭到储户挤兑,被要求归还资金。随着银行联盟和政府运营的中央银行的发展,商业银行的这一比率增长到约10:1,投资银行的这一比率可能会更高。存款准备金率上升的幅度取决于消费者和投资者想借多少钱,银行愿意贷多少钱,以及越来越多地取决于政府监管机构允许多少杠杆。[11]扩大准备金率的一个恰当的比喻就是橡皮筋:1913年美国国会立法规定,建立联邦储备银行就是要完成“提供弹性货币”的任务。[12]

    21世纪初的房地产市场是一个完美的海曼·明斯基范式案例。2000年之前,房地产市场相当平静、稳定和沉闷,银行只向最安全的借款人提供抵押贷款,即那些信用记录良好、收入稳定、几乎没有其他债务、所需贷款额远低于房屋市值的借款人。因此,这样的借款人几乎总是能按时还清抵押贷款,违约率很低,银行也获得了适中的利润。

    然而,银行经理们开始注意到,一些竞争性银行机构的贷款要求比较宽松,其可以为更多的借款人提供服务,从而赚更多的钱;最终,几乎所有银行都效仿了这一做法。大约在同一时间,另一种现象开始流行:银行向华尔街公司出售抵押物,这些公司将抵押物打造成越来越冒险的组合,如债务抵押债券。这就是所谓的贷款证券化,它将房主抵押贷款违约的风险从最初比较了解初始借款人情况的银行,转移到容易上当受骗的机构和世界各国政府,而这些机构和政府并不了解最初的借款人情况。

    贷款标准的降低蔓延到整个银行系统,违约率开始上升。起初,抵押品标的房屋的价值上升,银行和抵押贷款证券的持有人基本没有遭受过损失,因为他们可以将违约人的抵押物没收并转售获利。但从约2007年开始,不断增加的被迫出售的房源压低了房价,银行和证券持有人开始亏损;最终,有的破产,有的得到了联邦政府救助。最后,所有银行都收紧了贷款标准。银行贷款的收缩进一步降低了房价,迫使房主抵押贷款违约。

    这一过程不仅发生在美国,而且发生在全球。在房地产泡沫的前五年,大约在2002—2007年,似乎一个人只要活着,就有资格抵押贷款;而泡沫破灭后,银行恨不得数一下贷款申请人有几颗金牙,以确定贷款资格。类似地,消费者、投资者和潜在房主对偿还债务的兴趣比对获得贷款的兴趣大得多,因此信贷供应和货币供应量都下降了。

    明斯基于1996年去世。他告诉我们,上述周期是弹性货币体系的必然结果。在弹性货币体系中,不管是政府的中央银行(例如美联储)还是私人银行,都可以扩张和收缩货币供应。此外,他认为,这种货币扩张和收缩几乎发生在市场经济的所有领域,不仅发生在住房领域,也发生在企业管理以及股票和债券市场。

    明斯基著名的“金融不稳定假说”指出,当金融环境比较安全稳定时,资金必然将逐渐从安全的借款人处转移到风险越来越高的借款人处。最终事情将失去控制,导致上述那样的风险爆发,这使得放款人和投资者更加谨慎,循环重新开始,这一过程大概每十年发生一次。简言之,稳定带来不稳定,不稳定带来稳定,放款人的周期性恐惧和贪婪循环着经济系统。[13]当然,这还要有间歇性贪婪的借款人,否则贪婪的放款人将缺乏客户。

    虽然明斯基没有明确指出,但他的直觉告诉他,除了“技术替代”和信贷宽松之外,另外两个因素也必须满足:对以往繁荣和萧条的遗忘,以及对传统和审慎的投资方法的放弃。

    记忆缺失是金融不稳定假说的隐性因素。金融危机过后,损失惨痛的记忆依然历历在目,银行家和投资者都回避风险;前者只提供最安全的贷款,而后者不愿购买股票。随着市场慢慢复苏,不愉快的记忆逐渐消失,参与者又愿意面对风险,不稳定周期重新开始。

    引发金融狂热的最后一个因素,是放弃头脑冷静的金融计算,转而采用引人入胜的叙事。当人类面临困难或不可能完成的分析任务时——比如评估一家从未产生过利润更不用说股息的公司——他们默认回到更简单的分析方法,也就是心理学家用“启发式”一词所表示的心理捷径。

    当人类面对具有挑战性的或不可能解决的难题时,就会采取“启发式”方法。过去几十年中,心理学家把对这种方法的理解扩展到金融领域,尤其是金融狂热。20世纪40年代,密歇根大学的匈牙利心理学家乔治·卡托纳开始研究经济学和人类心理的交叉领域,开创了与经济(行为)相关的心理学测度。他不仅创立了现在正广泛使用的消费者情绪指数,还取得很多其他方面的成就,密歇根大学也成为心理学研究的温床。

    密歇根大学的另一个开拓性研究领域是决策理论。这引起了以色列研究员阿莫斯·特沃斯基的注意[14],特沃斯基特别聪明,认识他的人喜欢拿他的智力开玩笑:“你越快地意识到特沃斯基比你聪明,你就越聪明。”[15]密歇根大学的研究人员认为,人类是熟练的直觉统计专家——直至今天也有很多经济学家这样认为;就像我们毫不费力就可以掌握语法和句法规则一样,人类也很好地掌握了统计和概率。

    起初,特沃斯基也认为上述说法是合理的,但当他与来自耶路撒冷希伯来大学的院士丹尼尔·卡尼曼辩论时,他被对方说服。1970年前后,两人进行了一系列著名的实验,彻底改变了经济学家和心理学家看待决策的方式。他们证明,不仅普通人具有糟糕的统计直觉,甚至心理学家也是这样。[16]在一项经典研究中,他们这样介绍了他们的目标主体:

    史蒂夫非常害羞和内向,乐于助人,但对人或现实世界不感兴趣。他有一个温顺整洁的灵魂,要求秩序和结构,对细节感兴趣。

    然后,卡尼曼和特沃斯基询问受试者,史蒂夫最有可能是农民、推销员、飞行员、图书管理员还是医生?大多数人选择图书管理员,因为上面的描述最符合人们对图书管理员的刻板印象。然而,现实中农民的人数比图书管理员多20倍,而且有很多害羞的农民,因此史蒂夫更可能成为他们中的一员,而不是图书管理员。[17]

    他们还发现,人类存在广泛的系统性分析错误,有些甚至是由最聪明的人犯的,仅举几个例子:无视基础频率(例如,没有意识到农民比图书管理员多得多);没有意识到大样本比小样本更可靠;对人类从随机数据中感知不存在模式的倾向估计不足;没有理解在连续多次尝试时、任务结果通常都会趋向于一般水平。[18]实验结束时,他们对人类可悲的理性状态深感失望:

    也许令人惊讶的是,人们未能从一生的经验中推断出基本的统计规则,如趋向平均值的回归,或样本大小对抽样变异性的影响。尽管在普通生活里,每个人都会接触到许多可以归纳出这些规则的例子,但很少有人能自己发现抽样和回归的原理。[19]

    他们的实验揭示出人类天生的认知懒惰性。与其停下来严格分析史蒂夫最有可能从事五种职业中的哪一种,不如回到以下捷径:史蒂夫符合图书管理员的刻板形象——这就是故事的结尾。[20]

    很显然,卡尼曼和特沃斯基的发现与金融泡沫相关。1720年的南海公司、1928年的美国无线电公司、1999年的Pets.com[21]或今天的特斯拉,这些公司的投资者没有尝试对高预期未来收益的股票价值进行估计,因为这几乎无法估计,而是默认回到了简单的启发式方法:“南海/美国无线电/Pets.com/特斯拉是一家伟大的公司,它将改变世界,因此人们几乎值得为此支付任何价格。”

    卡尼曼、特沃斯基和其他研究人员还发现,最有力的启发法之一是人类对显著性事件的敏感性,即过分强调引人注目的事件。“9·11”袭击是一个极端例子,它是过去半个世纪中具有决定性意义的美国事件,造成近3000人死亡。“9·11”后,即使是只导致一人死亡的恐怖袭击也会成为头条新闻,但媒体基本上没有注意到普通枪支暴力、类鸦片或车祸导致的个人死亡事件,尽管在美国,这三类事件每年都导致3万多人丧生。[22]美国人死于恐怖袭击的概率远远小于死于雷击的概率,然而,美国在反恐问题上投入的资源远远多于防止因枪支、车祸和毒品造成的十几万人的死亡而投入的资源。(类似地,任何打算去以色列旅游的游客都可能会被朋友或家人问到是否担心恐怖主义,尽管自2005年以来,以色列人死于交通事故的平均概率是死于恐怖袭击的20倍。)[23]

    卡尼曼和特沃斯基将上述的显著性谬误称为“可用性启发式”;人们更有可能在地震或洪水发生后立即购买保险。很自然地,他们将之称为“近因启发式”。

    简言之,人类是显著性事件的俘虏,这以各种不同的形式适用于金融狂热。一项新技术能给人们带来激动人心的新鲜感,比如能够以每小时数百英里的速度环绕地球飞行,或者能够瞬间将娱乐活动或时事带入家庭,这种新鲜感非常显著——直到这种新鲜感消失。

    近因启发式扭曲了投资者对长期事实的看法:如果股票价格在过去几年一直上涨,他们就会认为它会永远上涨;随着股价攀升,股票变得更具吸引力,从而推动股价进一步上涨。这将成为一个自我持续的“良性循环”,可以将股价推向高位。当然,在长期熊市期间,情况正好相反。

    和大多数经济学家一样,明斯基对心理学不太感兴趣,但他清楚地认识到人类对叙事的偏好超过对定量推理的偏好。人们都喜欢好故事;当被泡沫控制时,当面临不愉快或难解的计算时,一个引人入胜的叙事可以轻松地绕过严格缜密的分析。把这些叙事看作导致泡沫疾病扩散至整个社会的病原体,并不算过度简单化。

    我们只需要稍微扩展一下上文中弹性货币的比喻,便很容易理解泡沫是如何破灭的。想象一根直径一英寸、长几百英尺的橡皮筋。橡皮筋周围聚集着数百名观察家,他们中的大多数人只是在闲逛。不过,他们中有几十人正在努力把橡皮筋拽长。继续想象,橡皮筋长度的不断增加给拽动的人带来了财富;随着时间的推移,这吸引了更多闲散的人群。他们中更天真的成员相信橡皮筋可以一直被拽长;但很多人知道它迟早会剧烈收缩,计划在第一次出现收缩迹象时就放手,并相信自己知道什么时候该放手;也就是说,他们已经准备好松开它。

    最终,一些人松手了,这增加了剩下的人的压力。然后,那些准备好放手的人也匆忙放手,很快,橡皮筋不仅恢复到它的自然长度,而且卷曲成一个紧密的线圈。最后,一些聪明的观察家发现,皱巴巴的线圈很容易被再次拉长,于是循环又开始了。

    到20世纪20年代,海曼·明斯基的4个条件都已经确立。

    第一次世界大战后,五项技术进步震撼了人类生活。19世纪末的内燃机是其中第一项发明,并促进了另外两项发明:莱特兄弟发明的飞机和汽车的普及。汽车的普及使人们可以随意长途旅行,到1925年,超过1/3的美国家庭拥有汽车。[24]

    第四项发明是无线电。1895年,古列尔莫·马可尼在意大利农村地区成功将莫尔斯电码字母“s”传输至几公里外。随后20年里,这项昂贵的新技术被私人保留,用于传输私人敏感信息和有价值的信息;在美国,无线电甚至主要用于一个领域——海上通信,因为事实证明,海上通信比在陆地上以及通过海底电缆在大陆之间通信更可靠、更便宜。

    1915年,马可尼电报公司的一名雇员戴维·萨诺夫写了著名的《广播音乐盒备忘录》,建议公司向公众开放广播媒介,“通过无线方式将音乐带入家庭”。萨诺夫做了一些努力才让马可尼将他颇有利润的私人媒介向公众开放。1919年,马可尼电报公司和通用电气公司合并成立美国无线电公司,到1920年,匹兹堡的KDKA和底特律的WWJ这两个最早的无线电台开始运营。音乐会、体育赛事和突发新闻有史以来第一次实现现场直播;毫无疑问,在改变日常生活方式上,无线电所起到的作用与电报和互联网的发明和传播并驾齐驱。

    将乔治·伯恩斯和格雷西·艾伦[25]的表演,或1921年杰克·邓普西和乔治·卡彭蒂耶之间的重量级拳王争霸赛的消息带进美国各个家庭的客厅,这比20世纪90年代初互联网的出现更让人震惊。美国无线电公司开始成为投资者的宠儿,到20世纪20年代末,当有人提到“无线电”这个词时,它最可能指的是股票的昵称,而不是媒介或硬件。

    第五项技术进步涉及电力公司的快速扩张,这些公司越来越多地为美国家庭提供照明,为工厂提供动力。尽管约翰·摩根和他的同事们在一代人之前就已经合并了通用电气公司[26],但通用及其竞争对手们用了几十年的时间才使国家完全通电。

    所有这五项“技术替代”——内燃机、飞机、汽车、无线电和广泛可用的电力——刺激了20世纪20年代经济的蓬勃发展。此外,亨利·福特的批量生产技术和弗雷德里克·温斯洛·泰勒的影响也是如此。泰勒是一位机械工程师,从19世纪末开始,领导了“效率运动”,将秒表转变为工人生产力和企业收益的驱动力[27]。1922—1927年,美国的工人产出以每年3.5%的速度增长,公司股东很高兴;但公司员工的反应不那么热情。[28]由于泰勒带来了很大的影响,“泰勒主义”进入了英语词汇;具有讽刺意味的是,它得到了列宁和斯大林的支持,但在美国并不总是得到称赞,特别是在迅速发展的工会运动中。

    20世纪20年代,美国出现了第二个明斯基因素——信贷宽松。明斯基知道,技术替代不仅可以是技术方面的,也可以是金融方面的。20世纪20年代产生了大量金融杠杆方面的“进步”,如经纪人贷款、投资信托和控股公司,它们都提供了新的、强大的资金来源。这些资金可以被借入,然后被配置到股市。在越来越多的美国人看来,这些资金更像是能喷出财富的源泉。正如经济学家约翰·肯尼斯·加尔布雷思所说:“金融界一遍又一遍地欢呼这一类似于车轮发明的伟大创新,但其版本往往不太经受得起考验。”[29]

    20世纪以前,股票市场杠杆的主要形式是以较少的初始认购金购买股票,之后以追缴金的方式完成剩余资金额的追加。贪婪的投机者认为,他们可以通过出售这些部分持有、正在升值的股票去支付之后的追缴金;少数幸运者做到了,但大多数没有做到,而且许多人破产了。

    相比之下,20世纪20年代的投机者则是全款购买股票,不过是用借入资金购买的,有时借入资金高达股票价值的90%。举个例子,投资于价值为1000美元的股票,需要用100美元的自有资金和900美元的“经纪人贷款”支付。如果这些股票的价值增加10%,现在值1100美元,那么偿还贷款后留给投机者的是200美元,从而使他原来的100美元投资翻了一番。但是,如果股票的价值下降10%至900美元,债权人就会向借款人发出“追加保证金通知”,要求借款人提交更多的资金来保护其900美元的贷款。如果资金不到位,那么贷款合同允许债权人出售头寸,以保护其900美元的贷款。经纪人贷款并不便宜;随着股票价格的上涨,对贷款的需求也随之增加,到1929年,贷款年利率已提高到15%,从而逐渐增加了股票购买者的负担。

    除了最乐观的投机者,其他人都至少隐约意识到了股票投机的风险。但对银行来说,经纪人贷款本身似乎是100%安全的,银行以5%的利率从美联储获得资金,并以该利率的两倍或三倍向投机者发放贷款,这是一种简单且利润丰厚的操作。金融资本的主要功能是将资金有效地从资金过剩的人手中转移到需要资金的人手中,泡沫会扭曲这种流动,从而腐蚀一个国家的经济;20世纪20年代,不少大公司将维持和发展业务所需的资金转移到保证金贷款市场,这正是一种扭曲。[30]

    我们从经纪人贷款的高利率,可以清楚地看出美联储要安全刺破已形成的泡沫有多难。即使在今天也很难。1929年,在理论上,美联储是可以阻止经纪人贷款流动的,只要把再贷款利率提高就可以;但由于银行和企业的贷款利率已经达到两位数,如果美联储将再贷款利率提高到几乎和贷款利率一样高,那么这在经济上将会是灾难性的。即使政府要求经纪人贷款提高利率,这也不会对热情的投机者产生太大影响,因为他们的净资产(至少在账面上)正在以更高的速度增长,在一个自我维持的循环里,昨天的价格上涨推动了明天继续上涨。美联储发现,自己就像从山上飞驰而下无法自控的滑板手,只有两种选择:故意撞到树上,或者继续深蹲向前,然后以更高的速度撞树。美联储选择了后者。(1929年10月的最初崩盘确实抑制了对经纪人贷款的需求,使经纪人贷款利率降至7%。)

    20世纪20年代,金融狂热也感染了当时已经稳定运行的投资信托机构。18世纪末,荷兰商人亚伯拉罕·范·凯特维奇创建了大概是世界上的首个共同基金——“团结创造力量”[31],它是一个可对公众发行的投资集合,汇集了欧洲各地和新大陆种植园的企业股份。[32]在接下来的一个世纪里,投资信托的概念传遍了整个欧洲,特别是苏格兰。到了1893年,随着波士顿个人财产信托的成立,投资信托的概念又传到了美国。这些保守运作的基金通常可以像股票那样交易,按需买进和卖出。在20世纪20年代创立的信托投资公司中,有几个至今仍存在:美国通用投资公司、三角洲公司、亚当斯快递公司和中央证券公司。

    另一个信托公司——高盛交易公司却没能幸存。高盛公司是直到泡沫后期才涉足投资信托业务的,1928年12月,它出资成立了高盛交易公司。最初,交易公司比较谨慎;它直接持有所有的股票和债券,也就是说,没有杠杆;此外,母公司高盛保留了该交易公司90%的股票所有权,只向公众出售了其中的10%。用今天的术语来说,高盛交易公司可以被认为是由先锋或富达[33]建立并持有几乎所有股票的简单的共同基金。

    高盛交易公司很快就不再保守。几个月后,它与高盛旗下的另一个公司——金融实业公司合并。市场如此泡沫化,1929年2月,就在合并后几天,新组建的高盛交易公司的价值就达到其持有证券价值的两倍;相当于将一美元的钞票以两美元的价格向公众出售。

    大多数公司都会对这样的结果感到高兴,但高盛公司还不满足,随后它回购了自己的股票,这进一步提升了其股票价值。此时,高盛公司开始以极度膨胀的价格向公众出售其持有的交易公司股票。接着,交易公司迅速投资成立了一个新的信托公司——谢南多厄公司;而谢南多厄公司在荒谬层上又堆起了一层荒谬,它发起成立了第三级信托公司——蓝山公司。正如加尔布雷思所说:

    该信托公司的优点在于,它使公司发行在外的证券数量与现有公司资产数量几乎完全分离。前者可以是后者的两倍、三倍或任意倍数。[34]

    在著名的高盛大厦内,谢南多厄和蓝山各自发行了普通股和“可转换优先股”,后者本质上与债券相同,每年需要向其持有者支付6%的利息。这两个信托公司事实上利用其可转换优先股为自己提供经纪人贷款,根据加尔布雷思的描述,这种“乘数”放大了普通股的价格波动。

    按照普通标准,杠杆作用并没有那么大:谢南多厄的股票中只有约1/3是债券式可转换优先股,这一比重在蓝山的股票中不到1/2。但这两个公司杠杆的乘数,以及高盛交易公司处于上层所有权结构的乘数,破坏了局势的稳定。谢南多厄控股蓝山,但只有在蓝山的可转换优先股持有人获得6%的利息支付后,谢南多厄才获得支付;同样,交易公司控股谢南多厄,但只有在谢南多厄的可转换优先股持有人获得利息支付后,交易公司才能获得支付。因此,当沿着金字塔向上方的交易公司移动时,价格波动幅度成倍增加。而同时,交易公司也承担着自己的股息债务。例如,谢南多厄只向其普通股股东支付了一小笔股息,到1929年12月便永久停止了支付。

    高盛公司的信托船队是为风平浪静的海洋设计的,只要价格上涨,航行就会顺利。但几乎就在这三个信托公司成立后不久,天就变了,这些公司按照与创建相反的顺序陆续倒闭:首先是蓝山,然后是谢南多厄,最后是交易公司。

    杠杆结构产生了毁灭性的影响。1929年底,道琼斯工业指数已经从10月的崩盘中有所回升,比9月的峰值“仅”下跌了35%。但相比之下,这三个信托公司的股票下跌了75%左右。到1932年中期的市场低点,道琼斯工业指数下跌了89%,信托指数下跌了99%,仅在高盛的这三个信托公司中,公众承担的总损失就约为3亿美元。就在1929年8月和9月,美国各大公司发行了价值超过10亿美元的类似的投资信托基金,这在那个时代是一个惊人的数字,其中大部分基金到1932年已经蒸发。[35]此时大萧条已经开始,并将持续,直到第二次世界大战。第二次世界大战作为一个巨大的公共工程项目,推动了经济活力的恢复。[36]

    到1929年,第三个因素——对上一次泡沫的健忘——也已牢固确立。上一代人确实经历了两次市场下跌。第一次是1907年的恐慌,是一次相当奇怪的事件。它的触发事件其实是一次失败的股票投机,但其规模非常小。两兄弟、铜矿巨头奥托·海因策和奥古斯塔斯·海因策,试图操作一桩复杂的计谋,即尝试对他们的联合铜业公司的股票进行轧空操作,但彻底失败了。[37]

    奥古斯塔斯·海因策还拥有蒙大拿州的一家小银行——比尤特储蓄银行,该银行也随着失败的轧空操作而破产。1837年,安德鲁·杰克逊总统对第二合众国银行实施了“安乐死”[38],使得美国在私人贷款枯竭时没有“最后贷款人”来提供急需的资本。由于各大银行之间相互借贷,其中一个银行的失败会像多米诺骨牌一样蔓延;如果没有央行出面救助,那么温和的衰退可能会演变成全面的恐慌和萧条。19世纪30年代末就发生了这样的金融危机,那是美国历史上最严重的金融危机之一。

    1907年,海因策的银行的倒闭拖垮了规模更大的银行,并最终将股价压低了约40%,直到约翰·摩根“画出一条线”——在这条线之上的银行是他认为有偿付能力的银行,因此值得支持,在这条线之下的是允许倒闭的银行,此时,恐慌才停止。出于历史巧合,摩根生于1837年,也就是美国最后一个中央银行关闭的那一年;1913年,随着重建中央银行的《联邦储备法》通过,摩根去世。在世76年的大部分时间里,他都扮演了美国央行行长的角色。1893年经济萧条耗尽美国财政部黄金储备时,正是他策划挽救了美国的金本位制。

    1929年之前的第二次市场衰退发生在第一次世界大战结束时。这场战争提振了美国股市,但随着农产品价格的下跌,股市投机很快被绝望替代:1919年夏天,股票市场达到顶峰,之后的一年里,股票价格逐渐下降了约1/3,当然这一时期产生的丰厚股息可以抵销一部分的价格下跌损失。[39]因此市场的下跌相对温和。

    在第一次世界大战之前的美国,只有富人才拥有股票,因此1907年恐慌和1919年股价下跌都没有给公众留下太多持久的印象。到1929年,新的投资者被内燃机、飞机、汽车、无线电和电力带来的奇迹吸引,忘记了之前的泡沫。

    产生泡沫的第四个因素是对保守的传统股票估值方法的放弃。美国在第一次世界大战中所需要的资金,部分来源于数十亿美元的自由债券发行,收益率为3.5%~4.5%。在这一过程中,普通的美国人被引入证券市场。自由债券充当了公众投资的“训练轮”,并提供了安全而适度的回报率。

    政府债券可以被视为安全资产的基准,或者说,政府债券的收益率是金融经济学家所谓的“无风险利率”。几个世纪以来,投资者购买股票完全是为了股息,而由于股票有风险,为了吸引买家,股息收益率必须高于相对安全的政府证券的收益率。例如,乔治·哈德森必须向其铁路股票的买家承诺,股息收益率远远高于英国政府债券3%~4%的收益率。与英国同行一样,理性的美国投资者不要求也不期望从股价上涨中获益,但他们希望获得比安全的政府债券更高的平淡但稳定的股息流;第一次世界大战前,美国的平均股票收益率在5%左右。[40]到了20世纪20年代,人们普遍认为,股票应该以年收益的10倍左右卖出,以便轻松地收回成本。

    今天,不管是不是明智的投资者,都认为公司利润和股价的长期上涨是理所当然的,因此可以容忍低得多的股息支付。但在20世纪之前,很少有持续的股价上涨,除非是最成功的公司。即使在最顺利的情况下,股价涨幅也很小。例如,英格兰银行和东印度公司是英国早期最成功的两家合股公司,即使是这两家精心挑选的公司,1709—1823年,其股价平均每年也仅上涨0.7%和0.6%。[41]

    那么,那些最有成就的投资者是如何评价美国无线电公司的?到1929年金融危机时,美国无线电公司还没有产生任何股息,而且,它在1937年之前都没有产生股息。[42]到20世纪20年代末,投资者显然认为该公司前景光明,但他们没有工具为它估计一个合适的价格,以支付该公司未来的预期利润。再过10年,欧文·费雪、约翰·伯尔·威廉姆斯和本杰明·格雷厄姆等金融经济学家就会推导出计算股票或债券内在价值的复杂数学方法,特别是那些具有高度投机前景的股票或债券的内在价值的计算方法。这种估计未来所有股息价值并将其“贴现”到即期的技术,就是所谓的“股利贴现模型”。这种模型即使到今天也很难被普通投资者理解,此外,其准确性也非常有限,甚至连专业人士也经常抵制它。[43]

    20世纪20年代,随着无线电、汽车和飞机的发展,技术环境的不断完善,公众很容易相信旧的证券评估规则不再适用。正如20世纪伟大的投资者约翰·邓普顿所说:“英语中最昂贵的一句话是‘这次不一样’。”[44]

    本杰明·格雷厄姆在记述那段时间时说:
    按照股市繁荣前的标准,股票的销售价格是其平均年收益的10倍;而现在,如果公用事业公司的一只股票的销售价格达到其最高年纪录收益的35倍,那么大家不会认为该价格太高,而会认为仅仅是估值标准提高了……因此,所有的价格上限都消失了,股票的价格不是取决于它能够卖出的价格,而是取决于它值得卖出的价格……这个原则将得出一个诱人的推论:在股票市场中赚钱是现在世界上最容易的事情。[45]

    到了1929年,卡尼曼和特沃斯基的各种启发式,特别是那个时代新技术的显著性、证券价格的飙升以及信贷的宽松,已经压倒了对证券价格的理性分析。

    经济学家马克斯·温克勒说得最简单。股市崩盘后,在提到最新的股利贴现模型时,他敏锐地观察到,20世纪20年代的股市不仅贴现了远期,也贴现了未来。[46]

    7 致富空想的破灭

    1929年大萧条

    和密西西比公司、南海公司和英国铁路泡沫等事件一样,对1929年美国股票崩盘事件的剖析也涉及“4P”:发起人、公众、政客和媒体。

    20世纪早期,塞缪尔·英萨尔继承了约翰·劳和乔治·哈德森的衣钵,创建了一个工业巨人企业,为美国的大型工厂提供动力,为数百万家庭提供照明。

    他出生于1859年的伦敦,父亲是一名中产阶级平教徒传教士和禁酒旅馆店主。英萨尔十几岁时主要忙于文员和速记员的工作,和那个时代许多雄心勃勃的年轻人一样,他崇拜托马斯·爱迪生。在失去一家伦敦拍卖行的工作后,他看到爱迪生旗下的一家英国电话公司的招聘广告,非常高兴,并成功地应聘到那里。

    他的上司很快就发现,英萨尔的办公技能远远超过了速记和簿记。几年后,公司选中英萨尔去美国总部工作,他回应说:“如果能成为爱迪生本人的秘书,我就去。”为了看起来比实际的21岁成熟,他开始留鬓角。1881年初,他横渡大西洋到了爱迪生身边,在那里工作了11年,并在公司的各个职位上一路晋升。

    越来越多地,英萨尔的命运不仅与爱迪生捆绑,还与支持爱迪生的约翰·摩根捆绑。那时,正值摩根在社会影响力和对技术的敏锐性方面达到了个人顶峰,作为一名早期电力爱好者,他在麦迪逊大道219号的家里安装了爱迪生的第一个白炽灯泡。在当时没有电网的情况下,这是一项不小的成就。后来摩根资助建设了曼哈顿第一座大型发电厂和输电线路,弥补了没有电网这一缺陷。

    对爱迪生来说很不幸的是,由于低压直流系统不适合长途传输,爱迪生通用电气公司的市场份额逐渐被汤姆森-休斯敦电气公司占据(其建造了交流高压电网)。汤姆森-休斯敦电气公司由电气工程师伊莱休·汤姆森和埃德温·休斯敦于1882年创建,是爱迪生通用电气公司的竞争对手。从1883年开始,爱迪生通用电气公司逐渐走向终结,因为当时英国发布了一项变压器专利,该变压器能够“降低”住宅用长距离交流输电线路中的高压电流。美国西屋电气公司很快采用了这项专利,并在公司里部署了汤姆森-休斯敦公司的交流电系统。

    1892年,在摩根投资公司的推动下,爱迪生通用电气公司与汤姆森-休斯敦电气公司合并,这巧妙地避免了爱迪生的公司的倒闭。但爱迪生本人从未承认过交流电的优越性;他一气之下卖掉了他在通用电气的股票,后来,当有人提醒他这些股票会值很多钱时,他说:“好吧,都卖没了,但我们花钱时很开心。”[1]

    英萨尔是经营电力设施的天才。在公司被合并前的10年里,他逐渐帮助爱迪生吞并了竞争对手,并取得芝加哥地区的垄断地位。[2]但1892年公司合并之后,他不再经营芝加哥公司,也开始无所事事。第二年,他自己接管了爱迪生在芝加哥孤立的各项业务,在那里,他熟练地收购、管理小型公用事业公司,并将其合并为大型公司。到了1905年,他将业务扩展到芝加哥以外的中西部地区;他游刃有余地经营自己的公司,而且那时是为了公众的利益。不断扩大的规模经济使他能够逐步降低行业价格,并引入非高峰低定价策略。由于电力服务对社会日益重要,他支持政府的法定监管,甚至有一次他还建议,如果他的公司无法为客户提供适当的服务,那么这个工作应该由政府来做。[3]

    如果他将自己的目标仅专注于为工业和城市照明提供电力,那么他仍将被人们铭记。遗憾的是,他对用电客户审慎而正直的关心并没有延伸到公司股东身上。英萨尔早期金融阴谋的典型例子是1912年中西部公用事业公司的上市,其主要目的不是发电,而是为其他业务筹集资金。英萨尔复杂金融阴谋的核心是他以个人身份以360万美元的价格购买了中西部公用事业公司所有的优先股和普通股,然后,转身以360万美元的价格向公众出售了所有优先股和1/6的普通股,这样实际上他自己免费获得了公司5/6的普通股。

    和哈德森一样,英萨尔也热心于公益,工作起来像特洛伊人。也和哈德森一样,他慷慨地资助市政项目和艺术项目,包括芝加哥的市民歌剧院,其被当地人称为“英萨尔的王座”。他在芝加哥北部的利伯蒂维尔建造了一个占地4445英亩[4]的庄园,居民们“在英萨尔的庄园里建房子,将出生在英萨尔医院的孩子们送到英萨尔学校上学,使用英萨尔灯,用英萨尔煤气烹饪,在英萨尔公路上行驶,在英萨尔银行存钱,在英萨尔高尔夫球场上打高尔夫”[5]。该镇代表了他庞大帝国的缩影。在鼎盛时期,该帝国由很多公司组成,这些公司的发电厂雇用了72000名工人,为1000万个客户服务。他是65家公司的董事会主席或成员,并担任11家公司的董事长。[6]

    早在1898年,英萨尔就凭直觉认为,在公用事业领域,国家机构的监管比城市运营的竞争更为可取。到第一次世界大战时,公用事业公司完全在政府监管之下,主要归功于英萨尔本人对该行业的引领。[7]政府监管限制了公司的利润,但就像之前的哈德森一样,英萨尔明白,最大的财富不在于提供商品和服务,而在于为商品和服务提供资金。

    英萨尔控股公司的复杂性超出了大多数观察者的理解能力,甚至可能超过了英萨尔本人的理解能力。他将数百家公司层层叠加,底层公司有时又部分地控股顶层公司。历史学家兼记者弗雷德里克·刘易斯·艾伦的一小段描述可以展现英萨尔的鲁布·戈德堡机械[8]般的复杂结构:

    缅因州的小安德罗斯科金电力公司由安德罗斯科金公司控制;而安德罗斯科金公司由缅因州中部电力公司控制;缅因州中部电力公司由新英格兰公共服务公司控制;新英格兰公共服务公司又由国家电力公司控制,国家电力公司又由中西部公用事业公司控制。[9]

    当时,代表公司所有权和控制权的中西部公用事业公司普通股,由英萨尔的私人公司公用事业投资公司持有,因此共7个层级的公司。于是,杠杆作用呈多倍增加,不仅仅是撇奶油[10],用艾伦的话来说,还有来自多个组织层级的“超级富豪奶油”和“超超级富豪奶油”。[11]到1928年,英萨尔的这种拜占庭式的公司结构几乎已经不是个例,而是规则。当年,在纽约证券交易所上市的573家公司中,92家为纯控股公司,395家为控股和经营性公司,只有86家为纯经营性公司。[12]

    为了以虚高的价格向公众出售公司股票,必须创造盈利的幻觉。英萨尔有一套与布朗特和哈德森相当的金融骗术,其中最著名的就是让他的公司以不断上涨的价格相互购买资产,然后将每笔购买业务的利润都入账。就好像丈夫以1500美元的价格将之前1000美元入手的雪佛兰汽车卖给妻子,而妻子则以同样的方式将她的福特汽车卖给丈夫,这样每人都获得了500美元的收益。

    与之前的布朗特和哈德森,以及之后的互联网巨头一样,英萨尔受到公众和媒体的崇拜。20世纪20年代,他威严的照片两次登上《时代》杂志封面;与他在大陆银行前见一面据说价值100万美元。[13]英萨尔的销售员们推动了这场杠杆式闹剧最后一幕的出现。1929年初,经过专门训练的销售队伍开始首次向公众出售其顶层公司英萨尔的公用事业投资公司的股票,最初的售价是英萨尔为其资产支付的价格的10倍,后来随着人们对该公司的热情高涨,其售价超过了30倍。英萨尔的公司结构就像高盛信托一样,是为繁荣时期设计的。任何经济波动都会削弱电力公司支付债券利息和优先股(对公司收入享有优先权)分红的能力,而这又将严重影响其普通股的股息和价格。普通股股东通常以保证金形式认购股票,他们的净资产也将受到影响。这一过程随着英萨尔控股公司的金字塔结构逐层加速。

    这正是1929年以后发生在英萨尔和他的60万股东中的大部分人身上的故事。与哈德森一样,英萨尔始终对自己的计划坚信不疑,公司股价在漫长而艰难的1929—1932年熊市中缓慢跌落直至崩溃。他借了数百万美元,试图用他的多层公司结构来抬高公司股价,但徒劳无功。1932年4月,就在股市最终触底前的3个月,他的银行家们把他召集到纽约的一家办事处并告诉他,他们将不再支持他。“这意味着公司要进入破产管理吗?”他问道。“是的,英萨尔先生,恐怕是这样。”[14]这对投资大众产生了巨大的损害;一份会计报告估计,到1946年,一场围绕中西部证券公司破产的持久法律争论终于结束时,公众损失数额会达到6.38亿美元。[15]而到那一年,股票市场已基本恢复;因此1932年股市崩盘时,在接近市场最低点的时候,公众遭受的损失肯定达到了数十亿美元。

    英萨尔最后的经历和他的控股公司一样错综复杂,与哈德森的垮台过程遥相呼应。在破产数月后,他因与出售公用事业公司股票有关的邮件欺诈而被起诉,逃往法国,当政府试图将他带回受审时,他又逃往希腊,因为希腊与美国的引渡条约已经商定但尚未签字生效。但雅典当局忽略了这一瑕疵,无论如何还是把他经由土耳其送回了美国。[16]回到美国,他再次出现在《时代》杂志封面上,这一次帽子遮住了他的脸。他被剥夺了大部分财富,但仍然可以组织起强有力的法律辩护团队,对他的多项指控最终被击败了。回到法国时,已是78岁高龄的他痛苦而虚弱,瘦得不成样子。1938年7月16日,在巴黎的一个地铁站,当他把手伸向售票员时,突然心脏病发作而死去,口袋里只有几个法郎。由于他心脏不好,他的妻子曾一再警告他不要乘坐地铁。[17]

    在巨大的债务规模中,英萨尔的控股公司的债务只占相对较小的一块。正如密西西比、南海和铁路事件那样,20世纪20年代末的美国股票狂热以一种极端的乐观情绪感染了民众和商界,导致其过度借贷。[18]1922—1929年,美国的全国总债务增长了68%,但全国总资产仅增长20%,收入仅增长29%。[19]在崩盘之前,债务的增长速度可能一直快于经济的其他方面。私人债务增长尤其迅速;与政府不同的是,个人和公司不能通过征税或印钞来消除债务,而且由于个人和公司是20世纪20年代债务的主要引擎,因此,当事件爆发时,其债务承担带来的负面影响也尤其大。

    20世纪20年代泡沫事件的另一个主要发起人是股票池,它通常是一个由经纪人和金融家组成的特设小组,他们按照精心设计的顺序相互买卖股票,操纵特定公司的股价,旨在引起小投资者的注意。他们聚集在券商大厅的股票报价器和黑板前,得出某只股票已“被控制”的结论,也跟随买入,进一步推高价格。

    股票池的关键人物是股票交易所的场内“专家”:他是在交易所场内为公众买卖股票的经纪人,保存着一本珍贵的客户买卖“订单簿”,这能够预测未来的股票走向。当订单簿上的公开购买订单列表足够庞大时,股票池的参与者就会将自己的股票出售给那些由股价暴涨引来的投资者,并获得数百万美元的利润。

    最臭名昭著的股票池集中在无线电领域,例如众所周知的美国无线电公司,其参与者似乎是美国政界和商界的名人:杜邦和通用汽车公司的财务主管约翰·J.拉斯科布,美国钢铁公司的最高领导者查尔斯·施瓦布,沃尔特·克莱斯勒,佩尔西梅·洛克菲勒,伍德罗·威尔逊总统的前助手约瑟夫·塔马尔蒂。内线交易在20世纪20年代并不违法。对现代读者来说,另一个名字很突出:戴维·萨诺夫夫人,美国无线电公司总裁的妻子。

    然而,有史以来最伟大的股票池经理应该是约瑟夫·P.肯尼迪[20]。经常有一些传说,将肯尼迪家族的财富与私酒交易联系在一起。不过,没有可靠证据支持这一点,而且无论如何,非法制造烈酒对一个哈佛经济学毕业生来说并不是一个理性的职业选择。他的血统更适合华尔街。在那里,他通过传奇般的股票池操作积累了一笔财富,后来又将这笔财富扩展到好莱坞和房地产等领域。

    正如19世纪40年代乔治·哈德森在铁路领域的庞氏骗局式融资——用新股东的资本支付旧股东的股息——在那时是可以接受的,也是合法的,20世纪20年代的股票池行为也是如此,在1933年和1934年的相关证券法[21]通过之前,这种公然操纵股价的行为没有被禁止。

    金融狂热的第三个和第四个解剖位置是政客和媒体,这两个部分巧妙地集中在约翰·J.拉斯科布身上。拉斯科布的父亲是一个雪茄制造商(经营规模中等),于1898年去世。之后的拉斯科布与英萨尔一样好运,成为工业巨头皮埃尔·S.杜邦的私人秘书,并最终成为这家大型化工公司的财务主管。1920年,杜邦拯救陷入困境的通用汽车,拉斯科布接管了通用汽车的财务。20世纪20年代后期,拉斯科布成为股票爱好者,参与了一些最成功的股票池。[22]1928年,民主党任命他为全国委员会主席。

    然而,拉斯科布最让人印象深刻的是一次臭名昭著的采访,采访文章名为《人人都应该富有》,并发表在《女性家庭杂志》1929年8月刊,当时该杂志的订户已超过200万。其中最臭名昭著的一段话正解释了文章标题的主旨:

    假设一个男人23岁结婚,并开始每月定期储蓄15美元——几乎任何一个有工作的人都可以做到,只要他足够努力。如果他投资于优质普通股,并将股息和股权进行再投资,那么20年后他将至少有8万美元,以及每月约400美元的投资收入,这样他会很富有。任何人都能做到这一点,所以我坚信任何人不仅可以富有,而且应该富有。[23]

    拉斯科布的这段话,是泡沫时代媒体对不费吹灰之力的财富的经典赞歌,巧妙地说明了即使是两大著名公司的首席财务官也会采取启发式捷径。如今,我们只要借助资产负债表或财务计算器,并且具备一定的能力就能计算出,20年里将每月15美元的储蓄转化为8万美元需要25%的年平均回报率;但1929年,这一计算更加困难。虽然拉斯科布可能拿出了他的铅笔、纸和复利表,但事实上他没有提到25%这一隐含的长期投资回报率(这一数字即使在1929年也高得离谱),很可能他只是凭空说出了这些数字。

    像拉斯科布这样的政客,在泡沫及其破灭中扮演着双重角色。首先,和其他人一样,他们也陶醉于追求不费吹灰之力的财富,就像1719—1720年的乔治一世国王和奥尔良公爵以及铁路泡沫时期的大部分议会成员一样。之后的几十年,现代政治廉洁和立法遏制了这种腐败,至少在发达的西方国家是如此,这让政治领导人有了更为神圣的责任,即要保证经济基本健康发展:在经济扩张时期,没有过度投机,而在经济收缩时期,国家领导人能够平稳地避免任何担忧或恐慌。

    20世纪20年代时也是如此。在1928年共和党大会上,赫伯特·胡佛在提名演讲中庄严地吟诵道:“今天,我们美国比以往任何时候都更接近于最终战胜贫困。贫困家庭正在从我们中间消失。”[24]经济崩溃后,胡佛和他的财政部长安德鲁·梅隆一再向公众保证经济“基本上是健康的”。胡佛还开创了一种在面临经济危机时的反应,其将成为现代世界各国领导人的标准反应,被约翰·肯尼斯·加尔布雷思称为“无事由会议”:在这种会议上,国家的政治、金融、经济领袖都被召入白宫,“不是因为有事要做,而是因为有必要给人留下正在做事的印象”[25]

    有可能实时发现泡沫吗?

    现代金融的伟大进步之一,是芝加哥大学的尤金·法玛提出的有效市场假说。20世纪60年代,尤金·法玛认识到,金融市场能够快速将新信息——市场变故——转化为价格。但市场变故是无法被预测到的,因为我们也不可能预测到未来的价格方向。

    而且,有效市场假说认为,当前市场价格能够准确反映现有信息,因此狂热不应该出现。正如法玛尖锐地指出:“坦率地说,‘泡沫’这个词让我发疯。”[26]

    有效市场假说的支持者对泡沫的厌恶是可以理解的;现代金融学的核心是构建和测试市场行为模型。艾萨克·牛顿所谓的“我能计算天体的运动,但不能计算人类的疯狂”很容易被理解,但它揭示了一个更深层次的事实:牛顿是有史以来世界上最伟大的数学建模者之一,如果连他都不能用数学术语来描述泡沫,那么也许没有人能做到。

    耶鲁大学的罗伯特·席勒与法玛共同获得了2013年诺贝尔经济学奖。席勒认为,当上涨的价格能够实现自我维持时,泡沫就会出现,用他的话说就是,“当价格也被狂热传染的时候”[27]。尽管所有泡沫都是如此,但仅凭这一现象无法识别泡沫,因为投资者一直在到处追逐当前高回报的资产。然而,像1719—1720年、19世纪40年代和20世纪20年代那样的大规模泡沫是罕见的,因此仅仅靠每天自我维持的价格上涨这一判断标准,会产生很高的误报率。

    最高法院大法官波特·斯图尔特在审理雅各贝利斯诉俄亥俄州案[28]时遇到了同样的难题。虽然它所涉及的领域不是金融业,但他的方法提供了考虑泡沫的另外一种方式:

    根据宪法第一和第十四修正案,这一领域的刑法犯罪仅限于“硬核色情物品”。今天,我将不再试图用寥寥几笔就对我所理解的这类物品做进一步的界定,也许我永远无法成功地做到这一点。但是,当我看到它的时候,我就知道是它。[29]

    正如牛顿无法模拟人类的疯狂一样,也如法玛教授讨厌“泡沫”这个词一样,斯图尔特大法官这段著名的话表明,尽管他无法从语言学角度描述什么是硬核色情物品,但他知道它是什么样子的。这同样适用于金融业:即使我们不能对泡沫进行建模,但现在我们肯定已经知道它们是什么样子了。

    到目前为止,密西西比公司、南海公司、英国铁路和20世纪20年代的美国股票市场都呈现出4个极具特色的特征。第一个特征是,金融投机成为日常对话和社会互动的主要话题,从坎康普瓦大街和交易巷的人群,到20世纪20年代美国券商大厅的人群。据弗雷德里克·刘易斯·艾伦回忆,在20世纪20年代:

    一夜之间发财的故事挂在每个人嘴边。一位金融评论员报告说,他的医生发现病人在谈论股票市场时不关心其他任何事情,他的理发师不止一次地用热毛巾打断客户对蒙哥马利·沃德股票前景的描述。妻子们问她们的丈夫为什么这么慢,为什么他们不参与这一切,结果她们的丈夫在当天早上已经买了100股美国亚麻籽公司的股票。[30]

    泡沫的第二个特征是,相当一部分通常情况下能力强、头脑清醒的人,现在却放弃了安全、高薪的职业,全职从事金融投机。例如,如果没有当时的金融刺激,那么布朗特和哈德森都会继续成为相对成功的亚麻布经销商。艾伦描述过一位女演员,她把自己在公园大道的住所装修成一家小型经纪公司,“周围摆满了表格、图表和财务报告,越来越多地通过电话进行市场操作,而且越来越沉迷于此”,而另一位艺术家“曾经口若悬河地说,只有高更[31]才会一边画画,一边宣扬国家贝拉斯·赫斯(一家现已不复存在的邮购商行)的股票价值”[32]

    泡沫的第三个也是最持久的特征是,信徒对怀疑论者的猛烈抨击。20世纪20年代末,如果说有人能够以血统和历史感来表达怀疑并警告公众的话,这个人就是保罗·莫里茨·沃伯格。沃伯格于1868年出生于一个德国犹太家庭,其家族具有中世纪威尼斯的银行背景。在1911年入籍美国之前,他在欧洲金融机构中迅速崛起;1914年,他作为创始成员宣誓就职美国联邦储备委员会。

    沃伯格在移民之前曾经见过类似的欧洲泡沫,他知道泡沫的结局。1929年3月,在担任国际承兑银行行长期间,他注意到,股票价格已经完全脱离了合理范围内的估值,并惊恐地指出,贷款数量的激增已经导致“无限制的投机狂欢”,这最终不仅会损害投机者,而且“还会导致整个国家的经济萧条”。[33]

    这一惊人准确的预测却遭到了公众的强烈谴责。最温和的方式是批评他“过时”;还有愤怒的观察家指责他“粗暴抨击美国的繁荣”,这些语句几乎与两代人之后抨击互联网泡沫怀疑论者的语句一模一样。[34]

    著名投资顾问罗杰·巴布森也有同样的遭遇。他在10年前创办了巴布森学院,1929年9月5日,在该学院举办的一次人数众多的商业会议上,他发表演讲:“迟早会有一场崩盘,而且它可能会很可怕。”与沃伯格一样,他预测会有一场严重的萧条。正是在那天,市场急剧下跌,即所谓的“巴布森崩盘”。沃伯格很容易受到本土主义和反犹太主义的攻击,而巴布森则更容易成为被攻击的目标,因为他之前已经证明了自己是个怪人:他的作品中有一份名为《重力——我们的头号敌人》的宣言,他还成立了重力研究所,其主要目的是发明一种保护盾来抵御重力的致命力量。

    如果是在正常时期,那么巴布森的预言顶多会受到温和的质疑。但当时并不是正常时期。报纸讽刺地称他为“韦尔斯利[35]的圣人”,并指出他先前预言的不准确之处。一家投资公司警告其客户,“我们不能因为某位著名统计学家对市场的不利预测而仓促抛售股票”[36]

    明斯基的健忘症因素通常揭示了泡沫时期的代沟现象;只有年龄足以回忆起上一次繁荣和萧条的参与者才可能持怀疑态度。而他们更年轻、更热情的伙伴会嘲笑他们是守旧派,与经济和金融市场的新现实脱节。简言之,泡沫主要集中在记忆短暂的年轻人领域。

    无论是由于何种机制,这些激烈反应都可以理解为弗里茨·海德理论中的平衡和不平衡状态。正如末日信徒的期望那样,没有什么信仰能比不劳而获和无限财富的承诺更令人愉快,信徒也不会轻易放弃这样一个令人安慰的概念。对忠实的信徒来说,阻力最小的方法就是给怀疑论者贴上“不理解”的标签,从而达到平衡状态。

    泡沫的第四个也是最后一个特征是极端预测内容的出现,比如南海事件中预测西班牙奇迹般地将其新大陆贸易的垄断权转让给英国、投资100英镑可以获得数百英镑的年度分红,英国铁路事件中预测即将“主宰时空”,美国股票泡沫中拉斯科布隐含预测的25%的市场年回报率。

    1929年,耶鲁大学的欧文·费雪做出了结束所有预言的预言。也许费雪是那个时代最伟大的金融经济学家,他发展了许多现代数理金融学的理论基础,至今仍受到尊敬。但是,人们更记得他于1929年10月15日在曼哈顿采购代理协会说的话,那是在黑色星期四的9天前:“股票价格已经达到了一个看似永久的高峰状态。”[37][38]

    没有“阳光查理”米切尔的故事,1929年的崩盘历史就不完整。英萨尔和哈德森至少为子孙后代提供了重要的基础设施,这些遗产减轻了他们的罪恶。但是,查理·米切尔,这个时代的伟大的金融发起人——和掠夺者——无法得到任何救赎。

    和英萨尔一样,米切尔出身卑微。1907年,他成为总部位于纽约的美国信托公司的总裁奥克利·索恩的助手。米切尔就职时正赶上当年的大恐慌,美国信托公司正处于这场风暴的中心,索恩领导这家公司化解了银行挤兑危机。30岁的米切尔作为助手,在整个危机期间投入了大量的时间,经常晚上不回家,睡在老板办公室的地板上。1911—1916年,他开始经营自己的证券经纪公司,随后被纽约城市银行(花旗银行的前身)聘请,为其管理小型股票和债券销售部门——纽约城市公司。

    商业银行家履行3项近乎神圣的职能,其对任何资本主义社会都至关重要:保护他人的货币;向企业提供营运资本,否则经济将无法运转;创造货币。相比之下,投资银行家却向公众出售股票和债券,这是一种风险更大、在道德层面更模棱两可的行为。

    银行监管机构早就明白它们之间的区别。事实上,监管机构禁止商业银行拥有投资银行。但不能拥有也并不意味着无法控制。通过控制的方式,米切尔和他的银行的律师们设法构建了与纽约城市公司的关系。[39]简言之,查理·米切尔是一名伪装成女王的军官的海盗,在纽约城市银行旗下航行。纽约城市公司收取了大量费用,成为一家投资银行,其主要职能是向公众出售新发行的股票和债券,进而为公司创造资本。不幸的是,该公司出售的许多股票和债券都是不可靠的,这些证券出售给了那些毫无戒心的纽约城市银行的客户,这加剧了银行的渎职行为。之后,纽约城市公司和银行承销了外国政府发行的更加不可靠的债券。

    米切尔在1916年接管纽约城市公司时,该公司在银行总部只占用了一间办公室,只有4名员工。发起人不仅需要公众和客户,还需要媒体。繁荣时期的媒体能带来一大群轻信的新兵。20世纪20年代,杂志专栏作家布鲁斯·巴顿是典型的媒体骗子,他的父亲是一位传教士,曾将耶稣描述为“A-1推销员”。1923年,他写了一篇关于米切尔的吹捧文章,题为《这里有什么其他人做不到的吗?》。在一次采访中,米切尔向巴顿讲述,当他的年轻推销员遇到萧条期时,他会带推销员到银行家俱乐部的顶层去看看下面的人群。“下面有600万人,他们的收入有成千上万美元。他们正在等待有人告诉他们如何使用自己的储蓄。你应该好好看看,吃一顿丰盛的午餐,然后去那里告诉他们。”[40]

    米切尔的魅力和干劲、媒体的热情以及20世纪20年代股市的狂热,这些因素都推动了纽约城市公司不断扩大其经营规模;到1929年,该公司雇用了1400名销售和支持人员,他们分散在58个分支机构中,所有这些人员都通过11000英里的私人电话线与纽约总部相连(因此现代社会将提供全方位服务的证券经纪公司蔑称为“电线屋”)。面对指责,米切尔发出了几乎不间断的规劝:“我们希望能够完全做到,除了童工之外,我们所有的销售人员都是正式员工。”该公司实现了这一抱负,并且实现了更多目标,在20世纪20年代每年承销了超过15亿美元的股票和债券,比任何其他投资银行都多。[41]

    该银行向轻信的客户大力推销纽约城市公司的投资银行“专长”。这些客户得到的建议是,购买具有诱人优惠券的债券,以及价格不断上涨的更诱人的股票,以取代传统的低收益但安全的储蓄。

    米切尔可能不是证券经纪行业销售大赛的最早发起人,但他将此细化为一门艺术,向获胜的“员工”提供高达25000美元的奖金(“员工”这个术语并不讨人喜欢,但仍然很自然地用在金融业中)。米切尔的公司非常成功,其卖光了所有的债券。通常情况下,公司和外国政府会争取由投资银行发行其债券,但纽约城市公司通过主动鼓励公司发行更多债券,扭转了这种局面。更为离奇的是,米切尔将销售人员分散到不稳定的巴尔干和南美洲国家,为那些贫困的政府提供廉价资本。

    尽管销售人员汇报了秘鲁和巴西的米纳斯吉拉斯州等外国政府的无能和数据造假,而且其几乎肯定会违约,但米切尔和纽约城市公司仍继续向银行的轻信客户出售这些外国债券。

    1921年,他从纽约城市公司总裁升任银行总裁,这为他的销售大业扫清了最后一道障碍。文学评论家埃德蒙·威尔逊最好地捕捉到了米切尔的精神,他描述了米切尔派出的推销员,他们“敲开农村各户房屋的门,像那些推销吸尘器或刷子的人一样”;20世纪20年代早期和中期,纽约城市公司主要销售债券;慢慢地,随着市场牛市势头增强,该公司将销售重点从债券转向股票,不仅销售负债的亚纳康达铜业等公司的高风险股票,甚至销售银行自己发行的股票,而如果没有该公司与银行合法分离的遮羞布,那么这样的股票本来就是非法的。[42]

    1958年,威尔逊描述了米切尔:

    在10年的时间里,他向美国公众出售了价值超过150亿美元的证券。他向公众出售汽车公司的股票,这些股票现在打了水漂;他向公众出售濒临破产的南美洲共和国的债券;他向公众出售自己银行的股票。1929年10月后,这些股票的价格在3周内从572美元下跌到220美元,最近它们只值20美元。[43]

    在这次股票崩盘事件中,米切尔让他的客户财富归零。公众对这一事件的印象集中在10月戏剧性的“黑色日子”上。24日,黑色星期四,摩根大通领导的财团上演了戏剧性的救援,到这天中午,恐慌基本消除。但到了黑色星期一和黑色星期二,即28日和29日,曾在24日拯救了股市的财阀们——米切尔、摩根大通的托马斯·拉蒙特和大通国民银行的阿尔伯特·威金——已经耗尽了勇气和资金。连续两天,股市分别下跌13.5%和11.7%。[44]

    到10月29日收盘时,股票价格已从9月的峰值下跌了39.6%:可以肯定的是,价格下跌幅度比1973—1974年、2000—2002年和2007—2009年的价格下跌幅度还要大。此外,到1930年4月中旬,股票市场又挽回了2/5以上的损失。[45]

    在1907年的金融危机期间,只有少数美国人拥有股票,即使到了1929年,也只有10%的美国人拥有股票,因此,1929年的最初下跌对普通民众的直接经济影响相对较小。[46]但在接下来的几年中,腐败蔓延到了商业活动的心脏——银行系统,经济陷入混乱。到1932年中,股票价格从1929年的峰值水平暴跌了近90%。1931年12月11日,距离1932年中最终触底还有6个月(见图7-1)。一位小投资者本杰明·罗思在日记中写到了投资者的贫困:

    图7-1 1925—1935年的道琼斯工业股票平均价格指数

    一位非常保守的年轻已婚男子告诉我,在过去的10年里,他成功偿还了房子的抵押贷款。几周前,他又将房子进行了抵押,获得的5000美元贷款用于投资优质股票,且他打算长期投资。我认为两三年后,他将获得可观的利润。人们普遍认为,现在可以以非常有吸引力的价格购买优质股票和债券。困难在于人们手头没有资金。[47]

    没有资金的公众是愤怒的公众,就像在1720年和1848年那样,公众想要证明自己的成功。金融幽默作家弗雷德·施韦德用最简洁的语言描述:“赔光钱的客户当然更愿意相信自己是被抢了,而不愿意承认自己是在傻瓜的建议下做了傻瓜。”[48]截至1929年,银行拥有23万名客户;目前尚不清楚具体有多少客户开立了纽约城市公司的证券经纪账户,但估计至少有数万人,而且可能会更多。[49]与其他证券经纪人的客户(自愿走进门购买证券)不同,米切尔的客户原本打算找一家安全的商业银行存钱,结果却像是跌跌撞撞地走进了一家妓院。

    一个最不可能的人物命中注定地成为查理·米切尔的复仇天使:一位直言不讳的意大利裔美国律师,名叫费迪南·佩科拉,他的父亲是一名制鞋厂工人,因工伤致残,他的受教育时间也因此被缩短。19世纪90年代末,十几岁的佩科拉从大学辍学,以供养父母和兄弟姐妹,但他设法攻读了法律学位。随后的很长一段时间里,他担任纽约市的地方检察官助理,并成功起诉了许多起金融案件。

    崩盘和随后的熊市促使美国参议院的银行货币委员会展开了对证券业的调查。委员会从1932年开始举行听证会,审问了米切尔和其他许多人。前两名律师的审问毫无效果,于是委员会解雇了他们。

    佩科拉在审问工作中的出色表现引起了班布里奇·科尔比的注意。班布里奇·科尔比是一位杰出的律师,曾在伍德罗·威尔逊时期担任国务卿,他向即将离任的共和党委员会主席彼得·诺贝克推荐了年轻的佩科拉。那时,诺贝克正在拼命寻找人来替代他之前解雇的律师。[50]

    佩科拉从1933年1月24日开始担任首席律师;他必须全力以赴,因为一开始就远远落后于形势。就在他被聘用3周后,他第一次与英萨尔信托公司的人打交道,没占到优势。因此,1933年2月21日,当身材高大、颇有气场、皮肤黝黑、极度自信的米切尔大步走进委员会会议室时,这位新任首席律师看上去不可能是他的对手。

    但佩科拉很快就找到了自信,主导了听证会并彻底摧毁了起诉目标,历史上将这场诉讼称为“佩科拉听证会”。正如我们见过的,巨额财富的拥有者将受到极大的奉承,这反过来腐蚀了他们的自我意识,当涉及犯罪行为时,这是一个致命缺陷。此外,犯罪企业通常会给其员工洗脑,使员工们认为自己的行为是正常的,甚至是值得赞扬的。

    同样的事情也经常发生在金融公司的欺诈行为上。在这些公司里,员工们学着用“符合客户最佳利益”这一借口来合理化自己的行为。有魅力和成功的企业领导者尤其会这样培训员工;正如老话所说,鱼从头开始向下腐烂。打击犯罪的行家佩科拉很快就认识到,米切尔正是这种典型的企业精英,纽约城市公司的作案手法在法律上或道德上没有任何问题,因此,起诉他的最有效方法,是让他解释他是如何领导他的销售人员的。在8天的证词中,佩科拉以礼貌、低调的方式,有条不紊地引导着傲慢的米切尔穿过了纽约城市公司销售机构的道德沼泽,并彻底摧毁了米切尔。

    米切尔需要支付多少钱才能说服他的销售人员将股票和债券出售给客户?米切尔回答说,不多,每年只有大约25000美元——此时一个美国工人的年均收入只有800美元。纽约城市公司如何支付其高管薪酬?根据出售证券的利润,而不是根据这些证券给客户带来的收益。这一体系支付给米切尔多少钱?每年超过100万美元——即使是对于那个时代的最高级的管理者,这也是一个闻所未闻的工资水平。

    更糟糕的是,1929年,米切尔以低于成本的价格将纽约城市公司的股票卖给了自己的妻子,然后立即又从她那里买回,没有缴纳个人所得税;他还对纽约城市银行的股票进行了典型的股票池操纵;向高级管理人员发放奢侈的可免除“贷款”,但粗暴地对待普通员工,强制性地要求普通员工购买银行的股票,以远高于市场的价格抵销员工的未来工资。当他的普通员工最终付清高价购买的股票时,他便解雇了他们。[51]

    当骇人听闻的工资和贷款、逃税把戏和员工受虐充斥着头条新闻时,最初自信的米切尔慢慢意识到自己已经陷入很大的麻烦中。然而,佩科拉的目标更高:他想揭露鼓动客户用借来的钱购买大量风险证券的销售人员(不仅仅是纽约城市公司的销售人员)扭曲的动机,这是让成千上万辛勤工作的美国人破产的原因。他在听证会的第4天开始做这项任务,并展示了该公司如何在有充分的机会接触普通银行存款人名单的情况下,按照销售指导书的措辞,“无情地”向公众出售股票和债券。[52]

    听证会的第六天,即2月28日,佩科拉再次转换关注点,关注对个人投资者造成的损害。在听证会之前,委员会已经收到数百封纽约城市公司的破产客户的来信。他们的共同点是谨慎和节俭,购买了政府债券,生活终于可以较为舒适,然后被纽约城市公司的销售人员说服,反复购买高风险股票和债券,最后陷入贫困。

    佩科拉挑选了其中最让人同情的一位,即来自宾夕法尼亚州波茨维尔的埃德加·布朗。布朗最近卖掉了一家连锁剧院,出于健康原因想搬到加利福尼亚州,他想寻找一家全国性的金融机构,以获得财务和后勤方面的建议和支持。在一家全国性的杂志上,他看到了这则广告:

    您在考虑一次长途旅行吗?如果答案是肯定的,那么我们将支付您与我们机构联系的费用,因为您将不再需要当地银行家的建议,而是将与我们密切联系,我们将指导您的投资。[53]

    关键是,该广告是由纽约城市银行发布的,但是纽约城市公司的弗雷德·拉梅尔联系了布朗,要帮助他投资10万美元。布朗积蓄中的大部分是卖剧院所得,其中的1/4已经购买了债券,主要是美国政府债券。布朗对拉梅尔只提出了一个要求:避开股票。

    在布朗的准许下,拉梅尔为他购买了各种国内外债券,远远超过了布朗10万美元的储蓄,因此布朗又从包括纽约城市银行在内的多家银行贷款,总计18万美元。当他的债券投资组合甚至在市场崩盘之前就暴跌了的时候,布朗抱怨道:

    布朗:然后(拉梅尔)说“好吧,那是你坚持只买债券的错。你为什么不让我卖给你一些股票?”。嗯,股票市场一直在上涨。于是我完全相信了,说“好,那买股票”。

    佩科拉:你告诉他买什么股票了吗?

    布朗:从来没有。

    佩科拉:那他为你买股票了吗?

    布朗:我可以开玩笑地回答一下吗——他买股票了吗?

    听证会的书记员尽职地记录了一句话:“长时间的大笑”。[54]

    布朗随后向听证会出示了一份大量购入股票的记录,佩科拉为了减轻书记员的负担,并没有让其记录。布朗讲述了他如何前往纽约城市公司总部,抱怨拉梅尔的账户交易过于激进,以至于尽管股市不断上涨,但他的投资组合的价值一直在下降。他被告知,公司将调查此事,他将得到答复。

    布朗确实收到了拉梅尔的回信,但他建议布朗购买更多的股票,包括纽约城市银行的股票;到1929年10月4日,他的投资组合的价值进一步下降。布朗前往纽约城市公司的洛杉矶办事处,要求出售自己的所有仓位[55],但接下来,“他们好似把我看作一个想把自己的母亲赶出家门的人,我立刻被那里所有的销售员包围,他们让我知道出售仓位是非常非常愚蠢的”。

    该公司终于在10月29日黑色星期二卖出了布朗的股票,当时布朗的保证金已经用完,他一无所有。此外,该公司以最虚假的方式——远低于市场的价格购买了布朗的证券。

    布朗,两年前的身价为10万美元(约可折合为今天的150万美元),现在成了贫民。令人惊讶的是,布朗此时想再贷款25000美元以进一步投机亚纳康达铜业公司的股票,而银行拒绝了,理由是布朗失业又破产。[56]

    1929年以前,那些成功的商界人士几乎具有被膜拜的地位,成为国家利益的最终仲裁者;但1933年后的一段时间里,佩科拉听证会将华尔街列为头号公敌,还将“银匪”[57]一词引入了美语词汇中。这个词在两代人之后的2007—2009年全球金融危机中又死灰复燃。

    听证会于3月2日结束,也就是富兰克林·罗斯福就职典礼的前两天。现代经济史学家认为罗斯福的竞选口号是银行大规模倒闭的重要原因,特别是他威胁要让美元相对黄金贬值的言论,而他最终也实施了这一政策。[58]公众渴望报复,听证会后的两个月内,米切尔因涉嫌欺诈而受审。与布朗特和哈德森一样,米切尔可能没有做任何违犯证券法的事情,那时的法律比较宽松,因此所有的指控都不成立,他被无罪释放。当然他必须与政府解决补税问题。在接下来的20年里,他甚至重新获得了一些财富以及体面的社会地位;他最后的住所在第五大道,现已成为法国领事馆。

    正如两个世纪前南海股票崩溃后发生的那样,相关法律的修改姗姗来迟。在听证会之后的15个月内,罗斯福签署了一整套受佩科拉委员会启发的证券立法的文件,包括严格区分投资银行和商业银行的《格拉斯-斯蒂格尔法案》;1933年和1934年的相关证券法,分别规范证券的发行和交易;1940年的《投资公司法》,主要监管金融顾问和投资信托(当今共同基金的前身)。

    美国证券交易委员会是根据1934年的《证券交易法》设立其规定的机构。金融界最大的讽刺之一是,美国证券交易委员会的第一任专员正是曾经股票池的完美操纵者约瑟夫·P.肯尼迪。当有人向罗斯福指出肯尼迪不适合担任此职位时,罗斯福调侃道:“只有小偷才能抓住小偷。”[59]

    弗雷德·施韦德以其特有的幽默,从当代视角对此次崩盘事件进行了解释:

    1929年,有一列火车的奢华车厢,每周早上都会到达宾夕法尼亚车站。当火车停下来时,一直在打桥牌、读报纸、攀比财富的百万富翁们从车厢前端走了出来。靠近车厢门的地方放着一个银碗,里面有很多硬币。那些需要5美分换乘市区地铁的人会拿走一枚。他们不需要用任何东西来交换硬币;这根本不算钱,就像羽毛牙签一样免费提供。只是5美分而已。

    1929年10月的突然崩盘有很多解释。我更喜欢的解释是耶和华之眼,愤怒的上帝正好在10月碰到了那个碗,在可以理解的突然恼怒中,耶和华踢翻了美国的金融结构,结果就是碗里的硬币永远消失了。[60]

    阿尔伯特·爱因斯坦有一句名言,复利是宇宙中最强大的力量(实际上这句话并不是爱因斯坦说的)。事实并非如此。健忘才是宇宙中最强大的力量。佩科拉听证会后短短两年,弗雷德里克·刘易斯·艾伦就预见性地观察到了这一点:

    圣乔治攻击巨龙,受到热烈的赞扬[61];但总有一天,圣乔治死了,观众散去,圣乔治的继任者发现龙是一个非常有说服力的家伙,开始怀疑为什么会有屠龙这样的事情发生,时代是否改变了,以及是否有必要让龙受到最温和的约束。[62]

    随着佩科拉委员会逐渐淡出人们的记忆,圣乔治不仅失去了警惕,还躺在路边流血不止,无法保护一群几乎忘记了拉斯科布、英萨尔和米切尔的公众,新的发起者又将诞生。

  • Torsten Dennin《From Tulips to Bitcoins_ A History of Fortunes Made and Lost in Commodity Markets》31-42

    31 Wheat: Working in Memphis 2008

    The price of wheat speeds from record to record. Trader Evan Dooley bets on the wrong direction, juggling 1 billion USD and dropping the ball. This results in a loss of 140 million USD for his employer, MF Global, in February 2008.

    “I simply do not know where the money is.” —Jon Corzine, CEO of MF Global

    Less than a month after Jérôme Kerviel’s catastrophic bet on European equity indices, which resulted in losses of nearly 5 billion USD to French investment bank Société Générale, another trader caused difficulties for his employer.
    This time it was through speculation on wheat futures. At the end of February 2008, MF Global, one of the world’s largest futures and options brokers, had to admit that one of its traders in Memphis, Tennessee, had speculated on wheat futures with corporate accounts. Within hours, a loss of about 140 million USD occurred.

    Spun out of Man Financial Group in 2007, MF Global was a commodity brokerage house that offered clearing and execution services. It had ambitions to become a financial services firm on the order of a Goldman Sachs or JPMorgan, and its CEO was Jon Corzine, former chairman of Goldman Sachs and onetime governor of New Jersey. Although it was a niche player on Wall Street, MF Global was a force on the Chicago Mercantile Exchange (CME), with 3 million futures and options positions open with a face value of more than 100 billion USD. Its customers made up almost 30 percent of the trading volume on the CME.

    Trading Wheat

    After corn, wheat is the second-biggest agricultural crop in the world, and it is traded worldwide on commodity futures exchanges. On the Chicago Board of Trade (CBOT), wheat is traded under the symbol W and the current contract month (e.g., W Z0 for wheat December 2020). One contract refers to 5,000 bushels of wheat, and each bushel is equivalent to 27.2 kilograms.
    Priced at 7.50 USD per bushel in November 2007, US wheat was already trading above 8 USD by the beginning of 2008. In part this was due to a tightening supply, but the increase was also increasingly driven by speculative capital, along with a weak US currency. The price broke through 9 and 10 USD per bushel within days, and at the end of February the situation had really gotten out of hand. On February 27, wheat contracts close to delivery experienced price movements of as much as 25 percent within a day. Although trading opened positive, by noon the price had fallen to 10.80 USD.

    Trader Evan Dooley speculated on falling
    prices of 2 million tons of wheat.

    In the afternoon, however, the price jumped again, to 13.50 USD per bushel. The news that Kazakhstan, one of the largest exporters of wheat, wanted to introduce export taxes to reduce sales was boosting the US wheat price. It was the strongest intraday price movement in wheat ever observed.
    However, there was also another explanation for the price swings: Evan Dooley, who had been a trader at MF Global since November 2005, had quickly entered significant positions in wheat futures on his own account in the morning hours of February 27. With these unauthorized actions, the 40-year-old trader exceeded his limits by far.
    Betting on a falling wheat price, Dooley is said to have traded around 15,000 futures—2 million metric tons of wheat. The value of the position varied between 800 million and 1 billion USD. However, as the wheat price continued to rise sharply, the company was forced to close the position with losses, that is, to buy further futures contracts. This led to a further price jump to a level that the market would not reach again, despite continuing strength, for several years.

    Figure 28. Wheat prices in US cents/bushel, 2007–2008, Chicago Board of Trade. Data: Bloomberg, 2019.

    MF Global shares lost more than 25 percent in value on that day. The losses came to approximately 140 million USD and represented four times the previous quarter. Concerned about the extent of the loss, MF Global promised to revise its internal policies and risk management. Dooley was fired immediately, and MF Global was fined 10 million USD for lack of supervision of its traders. Dooley himself was sentenced to five years in federal prison and had to make restitution of 140 million USD.
    On a side note, MF Global collapsed in 2011 when the company reported a 192 million USD quarterly loss. Client funds disappeared in the aftermath, which became a huge scandal. However, the failure of MF Global, with more than 40 billion USD in assets—the eighth-biggest bankruptcy in US history—was modest compared with the chaotic 2008 failure of Lehman Brothers, which had a 691 billion USD balance sheet. Regulators were eager to show that not all Wall Street firms were too big to fail. They happily let MF Global go under.

    Key Takeaways
    •Less than a month after Jérôme Kerviel’s catastrophic bet on European equity indices in 2008, another trader caused trouble for his employer: Evan Dooley of MF Global speculated on falling wheat prices and built up a short position of almost 1 billion USD.
    •Wheat prices kept climbing higher and higher, however, from 7.50 USD per bushel in late 2007 to more than 10 USD per bushel in January 2008.
    •On February 27, 2008, the price of wheat traded in Chicago fluctuated in the course of the day by 25 percent—falling back to 10.80 USD per bushel, then jumping again to 13.50 USD in the afternoon. MF Global accumulated a loss of about 140 million USD within hours.

    32 Crude Oil: Contango in Texas 2009

    The price of West Texas Intermediate (WTI) crude oil collapses, unsettling commodity traders around the world. A 10,000-person community in Oklahoma becomes the center of world attention. The concept of “super-contango” is born, and investment banks enter the tanker business.

    “Super-Contango is a state in which a forward price of a commodity is higher than the spot price to a greater extent than can be explained by the interest and storage costs that explain the usual state of contango.” Moneyterms.co.uk

    Cushing is a small town in Oklahoma with fewer than 10,000 residents: There’s a Wal-Mart, some fast-food restaurants, and a few gas stations. Only massive tanks, pipes, and refineries hint that the town is somehow special. In the south of the city is a complex for the strategic oil reserves of the United States, with a capacity of 35 million barrels—one of the largest in the country.
    Suddenly, at the beginning of 2009, Cushing—the only delivery location for West Texas Intermediate (WTI), the US benchmark for crude oil—became the focus of the world’s attention. In the oil market, big-time inventory building had begun. And it began on a large scale.

    Trading in Crude

    Because of the many different types and qualities of crude oil, market participants have agreed to trade in a few local varieties for reference: At the New York Mercantile Exchange (NYMEX), this is US West Texas Intermediate (WTI) oil, at the Intercontinental Exchange (ICE) in London it’s North Sea Brent, and in Singapore the Asian reference is Tapis. Additionally, there is an OPEC basket price, which calculates the average price of seven different types of crude: Sahara Blend (Algeria), Minas (Indonesia), Bonny Light (Nigeria), Arab Light (Saudi Arabia), Dubai (United Arab Emirates), Tia Juana Light (Venezuela), and Isthmus (Mexico). On commodity futures markets, WTI and Brent are the primary references for the price of oil, which is traded in 1,000 barrels per contract under the abbreviations CL (WTI) and CO (Brent) as well as the corresponding contract months (e.g., Z9 for December 2019).
    In the wake of the financial market crisis and the deteriorating economic outlook, the price of crude oil had come under massive pressure in the second half of 2008. That summer, crude oil had briefly traded at more than 145 USD for a short time. But then, the price dropped to less than 45 USD. The withdrawal of investment capital (“deleveraging”) also contributed significantly to the price decline. This became obvious through an analysis of the short-term crude oil contracts in which financial investors are typically invested, and which were now much more affected than long-term contracts.

    Figure 29. Crude Oil (WTI) Term Structure in USD/barrel, 2008. Data: Bloomberg, 2019.

    The forward term structure, which tracks the price of future crude oil deliveries over a period of several years, was still nearly flat in summer 2008, but from there, the contango structure of crude oil (WTI) increased. Contango refers to the situation in which spot prices are below the level of futures prices. This could be due to warehousing costs, including insurance and interest, for example, although those can be superseded by the effects of supply and demand.
    Between October and December 2008, the contango became extreme. The price decline at the short end of WTI contracts led to a record price difference (the spread)—in excess of 20 USD—between contracts for WTI January 2009 and WTI December 2009. Commodity traders introduced the term “super-contango” to describe what was happening, and commodity analysts called the price distortion of crude oil “absurd.” WTI decoupled completely from other crude oil reference prices such as Brent and, as a barometer for international crude oil markets, was “as useful as a chocolate oven glove,” noted a commodity analyst of Barclays, the British investment bank. What led to this situation? And, more importantly, what were the implications?

    Super-contango! Front-end WTI traded as low as 35 USD, while later crude contracts with later dates stayed above 50 USD.

    The world’s attention turned to Cushing, the world’s “pipeline crossroads” and the only source of WTI crude oil. Contango favors stockpiling, because instead of a low current price, oil can be sold for more at a later date. The only obstacle is that the owner of the crude needs to have appropriate storage facilities. At Cushing, due to the increasing contango, the storage level of oil was steadily increasing.

    Figure 30. Price spread of crude oil January (CLF9) and December 2009 (CLZ9) in USD/barrel. Data: Bloomberg, 2019.

    In January, oil inventories counted more than 33 million barrels (1 barrel equals 159 liters), and the remaining capacity literally was disappearing like ice in sunshine. The super-contango led to “super-storage,” because every holder of crude oil futures without the appropriate capacity had to sell crude oil, if needed, regardless of price. At its low, US crude oil was trading below 35 USD.
    It’s hard to know whether the super-contango was merely an expression of the short-term oversupply of the crude oil market due to the economic slowdown, or whether this was the effect of disinvestment of index and hedge fund capital in the forward contracts. In any case, the steepness of the crude oil forward curve continued to increase.

    Figure 31. Baltic Dirty Tanker Index, 2002–2010. Data: Bloomberg, 2019.

    An additional factor, apart from the price differences, distinguished this situation from past events: The economic slowdown and the effects of the credit crunch had put international freight rates under extreme pressure. At the beginning of 2009, freight rates for oil tankers were around 85 percent below their highs in summer 2008.

    The crude oil super-contango, combined with low freight rates, provided a lucrative business for investment banks.

    For a short while early in 2009, the price difference between a current crude oil contract and a December 2009 contract exceeded 30 percent. The combination of super-contango and the low crude oil tanker freight rates opened up a new field not only for crude oil traders but also for investment banks, since it was possible to store crude oil in oil tankers on the high seas.
    With sufficient inventories, it made no sense to sell oil at prices below 40 USD, if you could sell above 55 USD risk-free through a futures contract. January crude oil prices were trading 20 USD below December contracts, while the cost of storage aboard on a supertanker in January 2009 averaged around 90 US cents a barrel. Assuming that transportation, insurance, and financing were secured, there was an opportunity for immense profit for oil companies and traders.

    Tanker Talk

    The Baltic Exchange is a global marketplace for shipbrokers, shipowners, and charterers. The various indices of the stock exchange offer an important overview of freight rates differentiated according to cargo types, ship sizes, and shipping routes. The Baltic Clean Tanker Index tracks tankers carrying clean cargo, such as oil products (petrol, diesel, fuel oil, or kerosene); the Baltic Dirty Tanker Index is for tankers that carry cargo such as crude oil. In 2009, freight rates for bulk carriers—summarized in the Baltic Dry Index—had fallen by 94 percent since the previous summer, due to the economic slowdown and the credit crunch during the international financial crisis. In comparison, the freight rates for tankers lost a little less. Freight rates for crude oil fell by around 85 percent.
    Tanker lease periods between three and nine months were particularly sought after.
    In February 2009, Frontline, the world’s largest owner of supertankers, reported that 25 tankers had been chartered, and there were still open inquiries about 10 more ships. Any tanker that held less than 2 million barrels of oil was not statistically recorded, but industry experts estimated that there were as many as 80 million barrels on the water at the time, more than twice as much oil as was in official storage in Cushing. The profitable business had also taken on a new dimension. The new customers were no longer BP or Exxon, but Merrill Lynch, Morgan Stanley, Goldman Sachs, Citibank, Barclays, and Deutsche Bank.
    Ship brokers around the globe were surprised by the extent of storage inquiries. After all, 35 supertankers accounted for roughly 10 percent of crude oil tanker capacity worldwide. Due to additional demand, tanker freight rates recovered slightly from their lows. However, the floating inventories prevented a significant spike in oil prices during the year, despite any improvement in underlying economic data. After a nearly 75 percent drop in crude oil prices in just one year, the supply surplus of floating stock unsettled the market. For 2008, the International Energy Agency (IEA) reported a decline in oil demand for the first time since 1983.

    Key Takeaways
    •Cushing, a small town in Oklahoma, is the pipeline capital of the world—the only delivery point for WTI, the most important benchmark for crude oil.
    •In the summer of 2008, crude oil was trading above 145 USD. But then the price collapsed to less than 45 USD, and WTI switched from backwardation into a deep contango. A super-contango was born.
    •In combination with low freight rates due to the economic crisis, the oil super-contango provided a lucrative business for investment banks, which could physically buy oil, store it in supertankers, and sell it on futures exchanges, locking in a secure profit.
    •The super-contango led to a massive supply glut in crude oil for a number of years.

    33 Sugar: Waiting for the Monsoon 2010

    A severe drought threatens India’s sugar harvest, and the world’s largest consumer becomes a net importer on the world market. Brazil, the largest exporter of sugar, has its own problems. As a result, international sugar prices rise to a 28-year high.

    “The peacocks are not dancing.
    It will not rain.”

    —P. K. Dubey in Monsoon Wedding (2001)

    June 2009 was the driest summer month in India for more than 80 years, and the dry season was nowhere near ending. In the first week of August, rainfall was only one-third of its normal level. In the main agricultural areas in the north of the country, the weather phenomenon called El Niño had practically stopped the monsoon, whose season on the subcontinent usually lasts from the beginning of June to the end of September.
    One consequence of El Niño in India is significant crop failures, but India’s frequent experience of drought and famine has historically led to large storage facilities. According to the US Department of Agriculture, about 20 million metric tons of rice and about 30 million tons of wheat were stored in 2009. For sugar, however, the situation was quite different.
    Crop failures were so severe, especially in the state of Uttar Pradesh, that India—the second-largest sugar producer in the world—changed from being a net exporter of the crop to becoming a net importer. After producing more than 26 million metric tons of sugar the year before, the country was initially expected to consume 22 million tons of sugar in 2009. However, in August, the Indian Ministry of Agriculture revised the harvest estimates downward, first to 17 million tons and later to 15 million tons. It was not until 2011 that the Indian authorities expected a harvest of around 25 million metric tons of sugar.

    Sweet!

    Almost three-quarters of the sugar produced in more than 100 countries comes from sugarcane, grown primarily in tropical and subtropical regions. Sugar beets come mainly from the European Union and Russia. Brazil, the largest sugar producer and exporter, is responsible for about 16 percent of the world’s sugar, followed by India (14 percent), China (6 percent), and the United States (5 percent). In Brazil, more than half of the sugar harvest is processed into fuel (ethanol).
    Sugar is traded on multiple futures exchanges in different classifications. The most liquid trading is in Sugar No. 11 (ticker SB) on the New York Board of Trade (NYBOT), where futures contracts are traded in US cents per pound and comprise approximately 50 metric tons of sugar (112,000 pounds). Together with wheat, corn, and soybeans, sugar is the most liquid traded agricultural commodity.

    In 2008, the global trading volume of sugar was about 45 million tons, which equates to almost one-third of the quantity produced worldwide. Two-thirds of total sugar production is consumed directly in producer countries and is excluded from global trade. If other trade barriers, such as quotas and trade agreements, are taken into account, only about 25 percent of the world’s sugar is available to the global market, and about 40 percent of that comes from Brazil, which has quadrupled its sugar production since the early 1990s.

    With severe weather in India and Brazil, the price of sugar shot up.

    Like India, Brazil also had to cope with severe weather conditions in 2009. The problem there was not drought, however, but too much water.

    Figure 32. Sugar prices in US cents/lb, 1970–2010. Data: Bloomberg, 2019.

    Over the past 40 years, the price of sugar has been very volatile. Starting with prices as low as 1 US cent per pound in 1967, the price exploded in the mid-1970s to more than 60 US cents. Then, in 2004, the price of sugar slipped below 6 US cents—levels that had not been seen for more than 20 years.
    In 2010, however, there was a sugar rush! Massive imports from India and weather-related delivery delays in Brazil pushed the raw sugar price to a 28-year high. Futures contracts closed at 29.90 US cents per pound on January 29, 2010, a premium of more than 150 percent compared to the previous year. The situation calmed down only after the March contracts expired on February 26, 2010. At that point positive data from Brazil signaled that the worst scarcity was over.

    Key Takeaways
    •The three most important sugar producers worldwide are Brazil, India, and China, and the latter two mostly produce the crop for their own use.
    •The summer of 2009 was the driest summer in India for more than 80 years. El Niño caused significant crop failures, India became a net importer of sugar on the world market, and Brazil had weather-related problems as well. The price of sugar spiked around the globe.
    •Sugar prices rose to just under 30 US cents per pound by the end of January 2010—more than 150 percent over the previous year. Compared to prices in 2004, when sugar traded below 6 US cents, it represented a staggering increase of 500 percent and the highest price in almost 30 years.

    34 Chocolate Finger 2010

    Due to declining harvests in Côte d’Ivoire (the Ivory Coast)—the largest cocoa exporter on the world market—prices are rising on the international commodity futures markets. In the summer of 2010, cocoa trader Anthony Ward, “Chocolate Finger,” wagers more than 1 billion USD on cocoa futures.

    “Of course they are people. They’re Oompa Loompas.“ —Willy Wonka in the movie Charlie and the Chocolate Factory

    Cocoa, native to Central and South America, was considered by the Maya and the Aztecs to be a gift from the gods and therefore sacred. The seeds of the cacao tree also served as a means of payment. In the treasuries of Aztec king Moctezuma II, the Spanish conquistadors discovered, in addition to gold, more than 1,200 tons of cocoa—tax revenues and a huge currency reserve.
    Today cocoa is an important cash crop, an export commodity for many developing countries, and the raw material for the production of chocolate. (In Germany, one of the countries with the highest per capita consumption of chocolate worldwide, every person eats an average of around 9 kilos per year.) Production costs for chocolate depend on the cocoa content, cocoa quality, and processing time, so that for a normal chocolate bar, the price of cocoa accounts only for about 10 percent of the cost of production.
    Cocoa is traded in New York on the New York Board of Trade (NYBOT) and in London on the London International Financial Futures Exchange (LIFFE) in contracts of 10 tons each in USD and GBP, respectively.

    The 10 largest cocoa producers account for more than 90 percent of the world’s crop. Côte d’Ivoire dominates global production with a market share of more than a third of world production.

    In July 2010, market rumors in London suggested that the Armajaro hedge fund had placed a 1 billion USD bet in the cocoa market. Fund manager Anthony Ward was said to have bought around 240,000 tons of cocoa in an attempt to corner the market. This would have accounted for about 7 percent of global cocoa production and the majority of the available quantities. While some traders saw this as a bet that cocoa prices would continue to rise due to a declining supply, others argued that Ward was creating an artificial shortage and manipulating the market through his massive purchases just before the start of the annual cocoa harvest in October.

    Where’s the Cocoa?

    Cocoa’s main growing areas have shifted in recent years from Central America to Africa. The 10 largest producer countries account for more than 90 percent of the global cocoa harvest. Of these, Côte d’Ivoire is the largest supplier of cocoa in the world, with a market share of more than 33 percent. Indonesia, Ghana, Nigeria, Brazil, and Cameroon follow far behind. By 2010, however, cocoa production in Côte d’Ivoire had fallen by more than 15 percent over the previous five years, largely due to poor crop maintenance and pest infestation. Cocoa production in 2008–2009 was the smallest harvest in the previous five years, at just 1.2 million metric tons, a trend that market participants expected for the 2009–2010 crop as well.
    At age 50, Anthony Ward was considered a genius in trading cocoa. His attempt to corner the market for cocoa was spectacular but not an isolated event. In 2002, Ward had purchased more than 200,000 tons of cocoa—the equivalent of 5 percent of the world’s cocoa market—through futures contracts. That was not the biggest cocoa transaction, however. The cocoa trading desk at Phibro, Salomon Smith Barney’s commodity trading business, had taken a position of 300,000 tons of cocoa in 1997. The head of the cocoa trading desk at that time? Anthony Ward.

    Anthony Ward had been a cocoa trader and industry expert since 1979. In the first months of 2010, the price rose more than 20 percent because of his trades.

    Anthony Ward gained his first trading experiences in 1979 with tea, rice, cocoa, and rubber. In 1998 he co-founded Armajaro with Richard Gower, initially focusing on cocoa, then adding coffee and, later, other agricultural goods. Today Armajaro manages 1.5 billion USD and, with a local presence in Côte d’Ivoire, Indonesia, and Ecuador, is one of the largest cocoa suppliers to the world market. After Ward’s trades in July 2010, the British press dubbed Ward “Willy Wonka,” after the character in Charlie and the Chocolate Factory, and “Chocolate Finger,” in homage to a James Bond villain.

    Figure 33. Cocoa prices in USD/ton, 1990–2012. Data: Bloomberg, 2019.

    In 2009 and 2010, increasing demand, declines in production, and price speculation by hedge funds caused cocoa prices to rise more than 150 percent within two and a half years and to reach their highest level since 1977. A ton of cocoa in mid-July cost more than 3,600 USD. Because of Armajaro’s purchases, the short-term price of cocoa rose: A July contract carried a 300 USD premium compared to a December 2010 contract. Customers had to pay a premium of around 15 percent compared to a later delivery (backwardation).

    In a letter to the NYSE and LIFFE, 16 companies and trading houses complained about market manipulation of the cocoa market. However, LIFFE declared that “indications for a market manipulation are not recognized.”

    Key Takeaways
    •The cocoa market is relatively small and highly concentrated: Côte d’Ivoire dominates global cocoa production with a market share of more than a third of world production. The 10 largest cocoa-producing countries account for more than 90 percent of the world’s crop.
    •During the summer of 2010, rumors spread that hedge fund Armajaro had placed a bet of 1 billion USD in the cocoa market. Fund manager Anthony Ward, nicknamed “Willy Wonka” and “Chocolate Finger,” is said to have bought around 240,000 tons of cocoa in an attempt to corner the market.
    •Compared to price levels in early 2009, cocoa prices in London and New York rose by more than 150 percent and reached their highest level since 1977. A ton of cocoa cost more than 3,600 USD in July 2010—an increase of more than 500 percent compared to 2002. It was a successful bet for Chocolate Finger.

    35 Copper: King of the Congo 2010

    The copper belt of the Congo is rich in natural resources, but countless despots have looted the land. Now Eurasian Natural Resources Corporation (ENRC) is reaching out to Africa, and oligarchs from Kazakhstan aren’t shy about dealing with shady businessmen or the corrupt regime of President Joseph Kabila.

    “The West exploited Africa and now it wants to save it. We have been living with this hypocrisy for too long. Africa can only be saved by Africans.” —Joseph Kabila, President of the Democratic Republic of the Congo
    “We bought an asset from the Democratic Republic of Congo that was for sale.” —Sir Richard Sykes, ENRC

    On Friday, August 20, 2010, investors in the city of London listened closely as Eurasian Natural Resources Corporation (ENRC), a 12 billion USD, London-listed Kazakh mining company, took over the majority stake in Camrose Resources, which held the Kolwezi mining licenses recently expropriated by the government of the Congo. The previous owner of the extremely lucrative licenses? The Canadian mining company First Quantum Minerals. This was explosive news!

    All of a sudden, after decades of colonialism, dictatorship, and warfare, the Democratic Republic of the Congo (DRC) was once again the focus of media attention and the international mining industry. The Congo, one of the poorest countries in the world, nevertheless has an immense wealth of natural resources. The African copper belt stretches from the Congolese mining province of Katanga to northern Zambia. Here lies around 10 percent of the world’s copper reserves. And in 2010, copper was scarcer and more expensive than ever before: Based on its 52-week low, the price of the metal had increased that year alone by 50 percent. For the first time, copper traded above 9,000 USD per metric ton on the London Metal Exchange (LME).

    An Introduction to the Congo

    The Democratic Republic of the Congo, formerly Zaire, is the third-largest country in Africa, after Sudan and Algeria. Neighboring countries—the (formerly French) Republic of the Congo, the Central African Republic, Sudan, Uganda, Rwanda, Burundi, Zambia, Tanzania, and Angola—are all much smaller. With its wealth of natural resources, such as cobalt, diamonds, copper, gold, and other rare minerals, the Congo is a prime example of the “resource curse” thesis: The 70 million inhabitants of the Democratic Republic of the Congo are among the world’s poorest. Only Zimbabwe has a lower per capita GDP.
    The Congo, whose capital is Kinshasa, gained independence from Belgium in 1960 under President Kasavubu and the popular Prime Minister Patrice Lumumba. A period of instability and military intervention followed, beginning in 1965, under the long dictatorship of Mobutu Sese Seko, during which Mobutu and the elite of the country (now called Zaire) systematically looted the wealth of the nation.
    The system collapsed in 1997, when Mobutu was ousted by Laurent-Désiré Kabila. In January 2001, L.-D. Kabila was murdered by one of his bodyguards under unclear circumstances, and the presidency passed to his son, Joseph Kabila. The latter stayed in power until the end of 2018. In January 2019, opposition leader Felix Tshisekedi was declared the fifth president of Congo-Kinshasa since its independence of Belgian colonial supremacy.
    Despite the official end of the second Congo war in July 2003 (the first took place in 1997–1998), conflicts still persisted in the country up until today. In the course of this “African World War,” which involved eight African states and 25 armed groups, more than 5 million people died. It was the bloodiest armed conflict since World War II.
    The Kamoto Mine near the town of Kolwezi is in the heart of the Congo’s mining district, where more than 3 million tons of copper and more than 300,000 tons of cobalt are believed to be in the ground. The current market value of copper reserves alone exceeds 30 billion USD. When the mine was still in operation, the machines of state-owned mining company Gécamines, once the largest company in Africa, moved about 10,000 tons of rock each day. In September 1990, however, the central part of the mine collapsed, burying many miners. The operation came to a standstill. Under the Mobutu dictatorship, reinvestments were neglected, and the largest mines fell into decay. In the late 1990s, Gécamines sold most of its projects to international mining corporations.

    Figure 34. Copper and share price of First Quantum Minerals, 2009–2010. Data: Bloomberg, 2019.

    Beginning in 2007, the Congolese government undertook a review of more than 60 foreign mining agreements in order to increase state involvement and ownership in the mining sector. Since then, the revision of mining licenses has created multiple sources of conflict.

    The government was aiming for at least 35 percent government ownership in future mining projects. In addition, newer regulations called for a signing bonus of 1 percent of the project value, a 2.5 percent license fee on the gross income, and a stipulation that the mine would go into production within two years.

    The value of the mineral reserves of the African copper belt between the DRC and Zambia exceeded the GDP of half the African continent.

    In August 2009, after a 2½-year review by the government, Canadian First Quantum Minerals’ Kolwezi license was terminated. The government accused First Quantum of breaching the 2002 mining regulations, though First Quantum denied it. One of the contentious issues was the increase of the Gécamines’ share by 12.5 percent—for zero costs involved.
    The situation for the Canadian company was precarious, since it had already invested more than 700 million USD in expanding Kolwezi. Moreover, after First Quantum couldn’t come to an agreement with the Kabila government, the Congolese Supreme Court also revoked the company’s licenses for the Frontier and Lonshi mines in favor of the state mining company Sodimico—another bitter blow to First Quantum.

    Sly Foxes

    The wealth of natural resources in the Katanga province of the Congo smoldered into a power struggle among the three craftiest businessmen on the continent: George Forrest, Billy Rautenbach, and Dan Gertler. Sixty-seven-year-old Forrest, head of the Forrest Group, had been born in the Congo and was the old man of the Congolese mining industry. In early 2004, a few months after the end of the war in the Congo, Forrest and Kinross Gold entered into a joint-venture agreement with the government over the Kamoto Copper Company (later Katanga Mining).
    Rautenbach, founder of Wheels of Africa, the largest transport company in southern Africa, was a friend of Zimbabwean president Robert Mugabe. He went after the jewel, Katanga Mining, through the British company Camec. However, after a short takeover battle, the Congolese government announced a review of those mining licenses, and Rautenbach took the hint. He pulled back in September 2007. Rautenbach had previously been the manager of Gécamines but was replaced by Forrest, which accounted for the hostility between the two men.
    Meanwhile, Gertler was laughing on the sidelines. Just 30 years old, he closed a joint-venture contract with the government of the Congo in 2004 for the development of KOV (Kamoto-Oliveira Virgule, later the company Nikanor). KOV was the only mine in Katanga with more resources than Kamoto Copper Company. More than 6.7 million metric tons of copper and 650,000 tons of cobalt—twice as much as in Kamoto—were estimated to be in the ground. According to market prices in 2018, the value of these resources alone exceeds half the GDP of Africa.
    During the takeover battle for Katanga, Gertler bought shares in that mine through Nikanor. Camec finally lost its bid at the beginning of 2008, and Nikanor and Katanga Mining merged. In addition to his financial resources, Gertler had excellent connections: He is the grandson of the founder of Israel’s diamond exchange, a friend of then-Israeli prime minister Ariel Sharon, and the same age as Congo president Joseph Kabila, whom he considered a close friend.
    In January 2010 the newly established Highwinds Properties, owned by Dan Gertler, was awarded the Kolwezi license in a shady deal. A few months later came the bombshell. On August 20, 2010, ENRC confirmed that it had secured the licenses to Kolwezi through its 50.5 percent acquisition of Camrose Resources for 175 million USD. The company said it intended to cooperate with Cerida Global, another Dan Gertler–controlled company. With the acquisition of Camrose, ENRC was also committed to a 400 million USD loan for Highwinds and a loan guarantee of another 155 million USD for Cerida’s debts.

    The Kazakh company ENRC aggressively expanded its business in Africa and was not shy about dealing with African despots like Joseph Kabila.

    Camrose also offered a majority stake in its subsidiary Africo to ENRC, whose copper and cobalt projects were located near its Camec properties. This was of high strategic importance for the Kazakh company, since ENRC had acquired the Central African Mining and Exploration Company (Camec) for 955 million USD in 2009. This is where Dan Gertler came into play, as Camec was 35 percent owned by the Israeli investor, who quickly unified the three Kazakh oligarchs—Alexander Mashkevitch, Patokh Chodiev, and Alijan Ibragimov—who owned 40 percent of ENRC.
    The deals between Camec and Camrose were important milestones for ENRC’s aggressive expansion policy in Africa, along with a 12 percent stake in Northam Platinum in South Africa that ENRC acquired in May 2010. Regardless of pending possible expropriations and a skeptical attitude by many institutional investors, only time would show whether ENRC would have a more favorable outcome in Congo than its Canadian rival, First Quantum.
    Sometimes time flies. In November 2013, ENRC delisted its shares from the London stock exchange. The following April, an official investigation into bribery and sanction-busting began in England, and the founding partners decided to take the company private again. In February 2014, news spread that the company needed to sell all its international assets—including the copper mines in the Democratic Republic of the Congo—to repay debts. President Kabila, however, stayed in power until the end of 2018.
    In January 2019, the opposition leader Felix Tshisekedi was declared the fifth president of Congo-Kinshasa. Leader of the opposition, Martin Fayulu, complained that Kamila, despite officially stepping down from office, would with his associates most likely continue controlling the levers of powers. Presidential elections had been due for more than two years, but elections had been postponed several times despite forceful protests. Since the end of Belgian colonial supremacy in 1960, the country had never seen a peaceful transfer of power.

    Key Takeaways
    •The African copper belt that runs between the Congo and Zambia holds an incredible wealth of natural resources. In 2010 it became the focus of upheaval when President Kabila revoked the mining license of Canadian firm First Quantum Minerals.
    •Copper was now big business, as copper prices traded at record highs of more than 9,000 USD per ton on the London Metal Exchange (LME).
    •The Kazakh (but London-listed) resource company Eurasian Natural Resources Corporation (ENRC) began to massively expand its footprint in Africa. The firm’s leaders were willing to deal with shady businessmen as well as with President Kabila’s corrupt regime.
    •In a murky transaction involving Dan Gertler’s Highwinds Properties, the expropriated assets of First Quantum were sold to ENRC. International investors were shocked, and the company went private a couple of years later.

    36 Crude Oil: Deep Water Horizon and the Spill 2010

    Time is pressing in the Gulf of Mexico. After a blowout at the Deepwater Horizon oil rig, a catastrophe unfolds—the biggest spill of all time. About 780 million liters of crude oil flow into the sea. Within weeks BP loses half its stock-market value.

    “This well did not want to be drilled . . . it just seemed like we were messing with Mother Nature.” —Daniel Barron, survivor of the Deepwater Horizon disaster
    “I would like my life back.” —Tony Hayward, CEO of BP

    Deepwater Horizon was one of the world’s most advanced deepwater rigs. Installed in 2001, it was 121 meters long, 78 meters wide, and 23 meters high and cost 350 million USD. In April 2010, the giant lay about 40 miles off the coast of Louisiana in the Gulf of Mexico. Since February, the platform had been busy in the Mississippi Canyon Block 252, drilling in the Macondo reservoir about 4,000 meters below sea level.
    April 20, 2010, promised to be a successful day, because the drill hole identified as API Well No. 60-817-44169 was about to be completed. The well would be sealed and prepared for production by a production platform. Every day counted because platform operators like Transocean charged oil companies on a daily basis. And in this case, BP was already concerned because Deepwater Horizon had been behind schedule for 43 days. The delays had already cost the big oil company more than 20 million USD.

    Twenty years after the Exxon Valdez oil spill, an even bigger environmental catastrophe was looming on the horizon.

    The Exxon Valdez—A Past Catastrophe

    Shortly after midnight on March 24, 1989, the most severe environmental disaster in the history of the United States occurred. The 300-meter-long oil tanker Exxon Valdez was on its way from the oil-loading station of the Trans-Alaska Pipeline, in the port city of Valdez, Alaska, when it collided with Bligh Reef in Prince William Sound. The accident caused a spill of almost 40,000 tons of crude oil. Around 2,000 km of coastline were contaminated, and hundreds of thousands of fish, seabirds, and marine animals died. Captain Joseph Hazelwood was drunk in his room at the time of the accident, and third officer Gregory Cousins had the bridge.
    Despite an extensive cleanup, the ecosystem remains severely disturbed three decades later.
    That morning, four BP managers arrived by helicopter to monitor the completion of the drilling. Only a few hours before, experts from the oil services company Halliburton had cemented the drill hole closed, but employees of Schlumberger, who were about to test the cement seal, were sent back to shore by the BP managers before they had accomplished their task.

    Deepwater Horizon drilled for black gold in the Gulf of Mexico on behalf of BP.

    To accelerate completion of the work, BP urged rapid replacement of the drilling mud in the well with seawater to prepare for early production. This decision precipitated an argument between BP and the Transocean managers, who considered that step premature. Unlike seawater, drilling mud holds back rising gas and oil. However, the managers of BP prevailed, and the work began.
    The decision would prove disastrous. The hole had a leak, and drilling mud and gas bubbles began to spill out. The cement plug also appeared to be leaking. Work continued into the night, until suddenly a sharp hiss of methane was heard and a fountain of mud shot out of the derrick, signaling a blowout.
    As the methane ignited, a huge column of flame rose into the sky. Suddenly the entire derrick was on fire, and four workers on the drilling deck were dead.
    The alarm sensors designed to warn of fire and a concentration of toxic or exploding gases had been turned off to keep workers from being disturbed by false alarms in the middle of the night. Now, below deck, it was chaos. Workers, some of them barely awake and dressed in little more than a life jacket, were jumping off the platform into the water, trying to save themselves. But with the Deepwater Horizon in flames, the oil on the water’s surface had caught fire as well. Chaos also reigned in the rig’s two lifeboats.

    Around 11 pm, the Damon B. Bankston, an 80-meter-long supply ship, rescued the survivors. Eleven people had died in the explosion. Two days later, the oil platform sank in the Gulf of Mexico.
    The demise of the platform marked the beginning of the biggest environmental disaster in the history of the United States, an event that would provide the plot for a Hollywood blockbuster movie, starring Mark Wahlberg, in 2016.

    The Macondo drilling ended in disaster. In the largest oil spill in the United States, nearly 780 million liters of crude oil ran out, and the market value of BP fell by half.

    When fire broke out on the deck of the Deepwater Horizon, engineer Christopher Pleasant pressed the emergency button for the blowout preventer (BOP), a series of shut-off valves mounted directly above the well bore to interrupt the flow of oil into it. Like huge pliers, the massive shear jaw of the BOP was supposed to cap and close the well in case of disaster. The automatic emergency system was activated, but nothing happened.
    A commission of inquiry later found that the Deepwater Horizon blowout preventer was poorly maintained, the hydraulic system was leaking, and the safety instructions had not been properly maintained. In addition, the ring valve of the device had been damaged weeks before. Not only was the blowout preventer in poor condition, as early as September 2009, BP had reported almost 400 defects on the rig to Transocean. However, maintenance had been delayed, and more than 26 systems were in poor condition. There were even problems with the ballast system.
    After the platform sank, an oil slick formed. Approximately 1.5 km by 8 km at first, it expanded to almost 10,000 square kilometers within a few days. Between 5 and 10 million liters of crude oil were flowing out every day, and Louisiana, Florida, Mississippi, and Alabama all declared a state of emergency. According to the US Department of the Interior’s Flow Rate Technical Group (FRTG), the amount of oil that flowed out every 8 to 10 days matched the total amount of oil from the Exxon Valdez disaster. BP estimated that there were around 7 billion liters of crude oil in the source. Thus, it would take another two to four years until the entire amount of oil had oozed into the sea.
    Shortly after the platform sank, BP initiated two independently made side-to-side relief wells (called the “bottom-kill method”), but the drilling would have taken about three months. Meanwhile, the capture of the oil with the aid of large steel domes was failing.

    The depth of the seabed—around 1,500 meters—complicated the work. At the end of May 2010, several attempts were made to plug the leak with mud and cement (the “top- kill method”), but they, too, were unsuccessful. In the middle of July, BP succeeded in significantly reducing the oil flow with a new sealing attachment—a temporary closure was successful. As a result, on August 6, the leak was finally sealed permanently using a modified variant of the top-kill method (“static-kill”)—pumping in liquid cement through side relief holes. On September 19, five months after the Deepwater Horizon sank, BP declared the well “officially dead.”

    It took five months to seal the oil leak.

    It was estimated that nearly 5 million barrels of oil, around 780 million liters, had run out, and BP’s stock-market value fell by half in the course of the disaster. The company announced that it would divest 10 billion USD worth of assets to defer the cost of the spill.

    Figure 35. BP, share price fluctuation during first half of 2010. Data: Bloomberg, 2019.

    At that point only about 3 billion USD in costs had accumulated. But BP also set up a trust fund of more than 20 billion USD for the future consequences of the catastrophe. Still unanswered is the question of who bears the responsibility for the disaster. Undoubtedly, BP took high risks, applied non-industry-compliant practices to save costs, and, as the principal, bears the financial responsibility. Transocean’s role as operator of the oil platform also needs to be clarified, especially since the platform was in relatively poor condition. For Halliburton, the questions revolve around the doubtful completion of the cement seal of the well, and initial claims have also been made to BP’s partner companies Mitsui and Anadarko.
    The disaster heightened public awareness of the risks associated with deepwater drilling, both in the Gulf of Mexico and in planned projects off Brazil and Africa. As a direct result of the catastrophe, the US government passed a deep-sea moratorium, temporarily banning all new deep-sea drillings. Although this was later repealed, no new licenses have been awarded. As a further consequence, President Barack Obama fired the head of the Minerals Management Service, Elizabeth Birnbaum. The agency, now renamed the Bureau of Ocean Energy Management, Regulation and Enforcement, had grossly and negligently violated its oversight responsibilities.
    It is impossible to estimate the economic consequences of the disaster, let alone the environmental consequences, which include not only the direct effects of the oil pollution but also the burning of oil and the use of toxic chemicals like Corexit, which have been used to combat the oil spill. BP said in 2018 that it would take a new charge over the Deepwater Horizon spill after again raising estimates for outstanding claims, lifting total costs to around 65 billion USD. The story of the disaster in the Gulf of Mexico will play out for decades in the future.

    Key Takeaways
    •At the Deepwater Horizon oil rig in the Gulf of Mexico, the Macondo drilling, at about 4,000 meters below sea level, ended in disaster. Nearly 780 million liters of crude oil ran out, and the market value of BP, the oil and gas company in charge, fell by half within weeks.
    •The oil spill caused the biggest environmental catastrophe in the history of the United States, far more devastating than the oil spill of the Exxon Valdez 20 years earlier.
    •As a consequence, US authorities temporarily froze all deepwater drilling licenses. BP is estimating a price tag of more than 65 billion USD.

    37 Cotton: White Gold 2011

    The weather phenomenon known as La Niña causes drastic crop failures in Pakistan, China, and India due to flooding and bad weather conditions. Panic buying and hoarding drive the price of cotton to a level that has not been reached since the end of the American Civil War 150 years ago.

    “It’s not something you’re going to see again in your lifetime.” —Sharon Johnson, senior cotton analyst
    “I think there’s still hope for prices to go higher.” —Yu Lianmin, Chinese cotton farmer

    In ancient Babylon, cotton was known as “white gold,” and the fabric has remained popular throughout history, woven by hand for hundreds of years. At the end of the 18th century, however, spinning and weaving mills began to produce fabrics and clothing at a much lower cost than could be done by hand. By the 19th century, the cotton business was booming, due to recent inventions such as the steam engine, the cotton gin, the spinning jenny, and mechanical looms.
    The textile industry of the United Kingdom required ever larger quantities of the raw material, which was produced in its colonies or elsewhere abroad, especially in the southern United States, where cotton had expanded tremendously in the early 1800s. The crop thrived everywhere that was moist and warm, and labor was cheap in the American South. For about 250 years enslaved Africans had toiled on southern plantations, and cotton production grew from just 10,000 bales a year to more than 4 million until slavery was abolished after the end of the American Civil War in 1865. During that war, the price of cotton rose to dizzying heights that would only be reached again in spring 2011, almost 150 years later.

    The last time cotton reached almost 2 USD per pound was after the American Civil War.

    Since 1995, cotton had traded mostly between 0.40 and 0.80 USD, but at the end of September 2010, for the first time in 15 years, the price of cotton broke the 1 USD/lb level. A few months earlier, in May, the German magazine Der Spiegel had bemoaned “the end of cheap jeans,” as it noted the price explosion in cotton. But that was only the beginning. By November, cotton prices had increased another 40 percent. A sharp correction followed, but by the end of December cotton was up to 1.40 USD. And, beginning in January 2011, the market was unstoppable. The price spiked to more than 2.15 USD in March 2011—four times the level of early 2000 and a 480 percent increase over the November 2008 price.
    It was the highest price ever paid for cotton since the introduction of cotton trading on the New York Cotton Exchange in 1870.

    Figure 36. Cotton prices in US cents/lb, 2005–2013. Data: Bloomberg, 2019.

    The price had actually been rising for several years. At the end of 2009, the global textile industry had forecast robust growth of around 3 percent for the following year. However, flooding and bad weather conditions in several important producer countries such as China, India, Pakistan, and Australia led to significant crop losses. Because of the falling inventory, high premiums were paid for material that was available in the short term.

    Once again, severe weather conditions influenced agriculture prices.

    In Pakistan, the world’s fourth-largest cotton-producing country, floods hit more than 14 million people in 2010, according to UN estimates. The exceptionally heavy monsoon season was considered the strongest in more than 80 years, and rain destroyed more than 280,000 hectares of cotton. According to the Pakistan Cotton Ginners Association, the flood destroyed 2 million bales of cotton. The All Pakistan Textile Mills Association also reported a worrying shortage of cotton. Only 30 percent of the mills had raw material in stock for the next 90 days, and Pakistan would soon stop exporting cotton.

    A few weeks later, India, the second-largest cotton producer in the world, followed suit. The Indian Ministry of Textiles stopped exports, since without the ban the Indian textile industry would not have been guaranteed an adequate supply of cotton. Indian exports dropped to 0.5 million metric tons, having exceeded 1.5 million tons in the 2007–2008 season.
    There were several reasons for the shortage beyond the dynamic growth of the domestic Indian textile industry. The world’s largest cotton producer and importer, China, was also enduring a shrinking cotton harvest for the second year in a row, due to low temperatures and too much rain. China Cotton Association statistics in December 2010 showed monthly imports doubling year over year.

    Cotton Basics

    Most cotton species and varieties are cultivated as annual plants and have high requirements for heat and water. In the Northern Hemisphere, sowing takes place from the beginning of February to the beginning of June, depending on the location.
    China, India, the United States, Pakistan, Brazil, and Uzbekistan together account for around 85 percent of the world’s cotton production, with China and India producing more than half of the global market volume. In the 2009–2010 harvest, the amount of cotton grown worldwide reached 25 million metric tons.
    Cotton is used mainly in textiles, accounting for about one-third of the world’s textile fibers. These can be categorized into natural fibers—such as vegetable fibers (e.g., cotton or linen) and animal fibers (e.g., wool, hair, and silk)—or artificial (synthetic) fibers. Synthetic fibers actually dominate the industry, accounting for almost 60 percent. They can be divided into cellulosic fibers (e.g., viscose) and those derived from petroleum. The most important synthetic fibers are polyester, polyamide, and polyacrylic fibers.
    Cotton is traded on the commodity futures exchanges in the United States under the symbol CT and the respective contract month in a contract size of 50,000 lb per contract.
    In late 2010 and early 2011, flooding and Cyclone Yasi caused severe damage in Australia, which ranked eighth among the top 10 cotton producers worldwide. The Australian Cotton Shippers Association, which had predicted a bumper harvest of more than 4 million bales, reduced its forecast by more than 10 percent.

    Blocks on cotton exports worsened the situation, and panic buying and hoarding were the result.

    Cotton processors in the region reacted in panic. Willing to pay any price for raw material, they pushed prices ever higher. Cotton farmers who still had inventory continued to aggravate the situation. The China National Cotton Information Center estimated that around 2 million tons of available material never reached the market in China. For example, in Huji, in Shandong province, about 220 kilometers from Beijing, growers held back more than 50 percent of their harvest at the end of January, expecting prices to continue to rise. Because of the short shelf life of cotton, that strategy could only be maintained until April or May.
    In any case, the price boom in cotton was short lived. The International Cotton Advisory Committee in Washington estimated that the acreage for the 2011–2012 season would increase to 36 million hectares, the most in 17 years. It was a natural response to record prices. In the short term, however, most processors had no choice but to mix cheaper synthetic fibers with the more expensive cotton.

    Key Takeaways
    •If you thought that the exciting times of trading cotton took place more than 100 years ago, events in 2010 proved you wrong.
    •The first impacts of global climate change were evident in a series of extreme weather events. Flooding and bad weather conditions caused by La Niña accounted for significant crop losses in several important cotton-producing countries, such as China, India, Pakistan, and Australia.
    •Cotton processors in the region reacted in panic, driving prices higher. Cotton farmers who still had stocks held back their supply in expectation of even higher profits.
    •As a consequence, cotton prices shot through the roof. Cotton, which once traded at 40 US cents per pound in 2009, doubled in value within a year to 80 US cents and skyrocketed to 2 USD in 2011. This was an increase of 500 percent in two years!
    •Because of short supplies, export restrictions, panic buying, and hoarding, the price of cotton rose to a level not reached since the end of the American Civil War 150 years ago.

    38 Glencore: A Giant Steps Into the Light (2011)

    In May 2011, the world’s largest commodity trading company—a conspicuous and discreet partnership with an enigmatic history—holds an IPO. The former owners, Marc Rich and Pincus Green, have been followed by US justice authorities for more than 20 years. Without mandatory transparency or public accountability in the past, they were able to close deals with dictators and rogue states around the world.

    “Glencore is Marc Rich’s legacy.” —Daniel Ammann, author of The King of Oil
    “My business is my life.” —Marc Rich

    It was the week before the Easter holidays in 2011, on a warm, sunny day in the banking metropolis of Frankfurt am Main, Germany. For the first time that year, temperatures climbed above 72 degrees Fahrenheit, and the city was full of people enjoying the sun’s warm rays. It was also the first week of “investor education” concerning the biggest IPO of the year, for Glencore.
    Equity sector specialists were explaining corporate strategy and the business model of the world’s largest commodity trading house and the reasons why institutional investors should participate in its initial public equity offering. In a meeting room in one of the bank towers, high above the city center, 11 people nibbled on light snacks. The analyst was late, however, thanks to too many meetings and telephone conferences. And much of the information about corporate returns remained unclear. It seemed that Glencore was not being completely transparent. How exactly did the commodity giant—whose value was estimated at between 60 and 80 billion USD by the banks in the consortium and whose management team was known only to industry insiders—earn its money? Until the IPO, the Switzerland-based company had cherished one thing above all: secrecy.
    Glencore (the name was derived from Global Energy Commodity Resources) was one of the world’s leading commodity players. Its business activities included the production, processing, and trading of aluminum, copper, zinc, nickel, lead, iron ore, coal, and crude oil as well as agricultural products. In terms of sales, the company was the largest in Switzerland and the largest individual shareholder, with 33 percent, of the multinational mining company Xstrata. Before the IPO, Glencore was completely owned by its management and employees, but until 1993 it had had a turbulent history determined by only one man: Marc Rich, nicknamed “The King of Oil.”

    Marc Rich was the world’s most successful commodity trader. Together with Pincus Green, he broke the Seven Sisters cartel, the dominant oil companies until the 1970s.

    Within commodity markets, Marc Rich was a legend. No commodity trader before or after him has ever been so successful. As a son of German-speaking Jews, Rich began his career in 1954 with Philipp Brothers, then the world’s largest commodity trader. Strong economic growth in Europe, the United States, and Asia made the 1960s a boom decade for commodity trading. But in 1973, when the company earned a record profit in which Marc Rich and Pincus Green played a decisive role, a dispute about future payments arose.
    Rich and Green left Philipp Brothers and convinced Jacques Hachuel, Alexander Hackel, and John Trafford to follow them. Together they founded Marc Rich + Co AG in Zug, Switzerland, on April 3, 1974.

    Rich and Green revolutionized commodity trading, breaking the multinational Seven Sisters oil companies cartel and becoming major players in international petroleum trading. In the early 1980s Rich was the world’s largest independent oil trader. Marc Rich + Co generated more profit than UBS, the biggest bank in Switzerland, and Rich’s private wealth was estimated to total more than a billion USD.
    Initially, the company focused on the physical trading of iron, nonferrous metals, and minerals. Crude oil and coal marked an expansion into energy. With the acquisition of an established Dutch grain distribution company in 1982, Rich + Co also entered the agricultural sector. Through further acquisitions in mining, smelting, refineries, and processing, the company continued to grow in the 1980s and 1990s.

    Who Was Marc Rich?

    Marc Rich, born Marcell David Reich on December 18, 1934, in Antwerp, Belgium, was the son of German-speaking Jews. Fleeing war and persecution, the family immigrated to the United States and changed the family name to Rich. As a young man, Rich studied at New York University but left after two semesters to join Philipp Brothers in 1954, then the largest commodity trading company in the United States. He started his career under Ludwig Jesselson, and between 1964 and 1974 he worked as a manager of the Philipp Brothers offices in Spain. In 1974 Rich left the company and with Pincus Green and others founded Marc Rich + Co AG.
    Within the next two decades, the new commodity trading company would become the most successful in the industry. But because of business ties to Iran—despite American political and economic sanctions and the US abolition of diplomatic relations in April 1980—Rich and Green became the focus of the US Justice Department. Accused of organized crime and tax fraud, Rich avoided prosecution by fleeing to Switzerland, where for 20 years he and Green proceeded with business as usual, while they were pursued by US justice.
    After a management buyout in 1993, Rich separated from the firm, and the group was renamed Glencore. At the time, Forbes magazine estimated his private assets at more than 1.5 billion USD.
    Rich never went to trial, and on his last day of office, January 20, 2001, President Bill Clinton granted full and unconditional pardons to Rich and Green in a still-controversial act.
    In June 2013, Rich died of a stroke at a hospital in Lucerne, Switzerland, at the age of 78.
    As it hunted for the next source of profits, the company was not picky. The list of its business partners read like a “Who’s Who” of international rogue states and dictatorships. The company traded commodities with Iran during the hostage crisis and with Fidel Castro’s Cuba, as well as with Slobodan Milosevic’s Yugoslavia, North Korea, Muammar Gaddafi’s Libya, the Soviet Union under Brezhnev, South Africa’s apartheid regime, and Nigeria and Angola in the late 1970s.
    In the 1990s, though, the tables turned. Pincus Green and Alexander Hackel resigned, and the press relentlessly excoriated the company’s business behavior. Finally, after heavy trading losses, Rich lost the support of other senior managers.
    In November 1993, the 39 most important employees of Marc Rich + Co met at the Parkhotel in Zug to discuss the future of the company without Rich. Led by Willy Strothotte, they agreed on a management buyout, and by the following November, Rich had gradually sold his shares of the firm to management and senior employees, about 200 people in all. The value of the company—an industry leader in trading crude oil, metals, and minerals—was estimated to be between 1 and 1.5 billion USD. The new owners renamed the company Glencore, eliminating all traces of the Marc Rich name after 20 years.
    Strothotte took over as chairman of the board of directors of Glencore but also moved into a top position at Schweizerischer Südelektra, which was renamed Xstrata in 1999 and was 33 percent owned by Glencore. The two companies maintained a close relationship. While Xstrata concentrated on commodity production, Glencore focused on marketing and trading raw materials. Xstrata, listed in London, offered transparency for investors. However, Glencore’s business continued to play out behind the scenes.

    Figure 37. Glencore (GBP). Equity price performance since IPO on May 19, 2011. Data: Bloomberg, 2019.

    As Glencore reached the limits of growth within its corporate structure, it badly needed fresh capital, a situation exacerbated by the fact that some of the management team had to be reimbursed within the next couple of years. The initial public offering, which raised 12 billion USD, satisfied that hunger for cash. On May 19, 2011, shares of Glencore were listed for the first time in London at 5.27 GBP. In February 2012, the company announced a merger with Xstrata that would be concluded almost a year later under CEO Ivan Glasenberg. The CEO of Glencore since 2002, Glasenberg had been with the company since 1984 and, with an estimated 5 billion USD net wealth, he became one of the top 10 richest people in Switzerland.
    It turned out that Glencore’s management had cashed out at the peak of the cycle: The share price of the initial IPO has never been reached again. Instead, during a commodity sell-off, shares plunged to 67 GBP on September 28, 2015, a loss of 87 percent since the IPO. In January 2019, however, Glencore’s share price had recovered to 3 GBP, which shows that its business model as a listed company was working.

    Key Takeaways
    •The commodity trading company Glencore had a turbulent history that, until 1993, was determined by one man—Marc Rich, nicknamed “The King of Oil.” Rich had founded Glencore’s predecessor company, Marc Rich + Co AG, in Zug, Switzerland, in 1974.
    •With private wealth of more than 1 billion USD, Rich became the most famous commodity trader by breaking the Seven Sisters cartel, and by becoming the world’s largest independent oil trader. His list of business partners read like a “Who’s Who” of international rogue states and dictatorships.
    •Glencore and other commodity trading companies generally maintain an aura of secrecy, since they prefer to strike their deals in private. However, to overcome financing constraints, Glencore, which was completely owned by its management and employees after 1993, raised 12 billion USD in its initial public offering in May 2011. It merged with mining giant Xstrata one year later and became a leader in both mining and commodity trading.
    •In May 2011, shares of Glencore were listed for the first time in London at 5.27 GBP. In hindsight, that was the top of the cycle; during the following bear market in commodities, the shares plunged to 0.67 GBP in September 2015. Today, shares of Glencore have recovered to 3 GBP.

    39 Rare Earth Mania: Neodymium, Dysprosium, and Lanthanum 2011

    China squeezes the supply of rare earths, and high-tech industries in the United States, Japan, and Europe ring the alarm bell. But the Chinese monopoly can’t be broken quickly. And the resulting sharp rise in rare earth prices lures investors from around the globe.

    “The Middle East has oil. China has rare earths.” —Deng Xiaoping, 1992

    In 2013, geologist Don Bubar bought 4,000 hectares of land in the wilderness of Canada for less than half a million USD, hoping that in a few years the area would be worth billions. Bubar and his company, Avalon Resources, planned to develop a mine for rare earths and to start production by 2015. Gold fever had seized the mining industry. Almost 300 companies worldwide were exploring for rare earths and other exotic metals like lithium, indium, or gallium. Investors were happy to spend their money on these projects, because the supply of rare earths is limited, demand was high, and prices were soaring, reflected in press headlines almost every day.
    Rare earths have become indispensable for modern high-tech applications—in computers, mobile phones, or flat screens, for example, and the growth of regenerative energy can’t be achieved without rare earths in electric/hybrid cars or in wind power plants. But these metals have been at the center of a trade conflict between the main producer, China, and the industrialized countries, a situation that has been worsening over the past few years.

    What Are Rare Earths?

    Rare earths consist of 17 metals: scandium, yttrium, and the lanthanides group of lanthanum, cerium, dysprosium, europium, erbium, gadolinium, holmium, lutetium, neodymium, praseodymium, promethium, samarium, terbium, thulium, and ytterbium. In most deposits, light rare earths (cerium, lanthanum, neodymium, and praseodymium) are found in large quantities, while the occurrence of heavy rare earths (yttrium, terbium, and dysprosium among others) is considerably lower.
    One of the most extensively used metals is neodymium, which is indispensable for the production of permanent magnets, that is, magnets that do not discharge. Neodymium is used in mobile phones and computers, wind turbines, and electric/hybrid cars. Each megawatt of power from a wind generator requires between 600 and 1,000 kg of permanent magnets made of iron-boron-neodymium alloys. Moreover, in every wind turbine, there are several hundred kilos of neodymium and dysprosium.
    Lanthanum is also used in many high-tech applications. For example, about one kg of neodymium is needed for the hybrid engine of a Toyota Prius, but the batteries contain about 15 kg of lanthanum. The German Federal Institute for Geosciences and Natural Resources expects the demand for rare earths to rise to 200,000 metric tons a year. At current prices, this means a market size of 2 billion USD. Compared to other metal markets, such as that for copper, with an annual production volume of almost 20 million metric tons and a market value of almost 140 billion USD, rare earths are a tiny but profitable segment.
    China has dictated world market prices of rare earths, since its production accounts for about 97 percent of the global volume of 120,000 tons per year. China also has almost 40 percent of the world’s reserves, while other significant reserves are located in Russia, the United States, Australia, and India.
    Similar to OPEC’s actions during the oil crises of the 1970s, China has been manipulating exports for years, and the United States, Japan, and Europe have all complained about export restrictions and high export duties. In 2005, exports were around 65,000 metric tons per year, but the volume has shrunk dramatically since then. As a result, prices for rare earths rose sharply from 2005 to 2008, and there was another price push in the third quarter of 2009. For the first half of 2011, the Chinese government announced exports of just 14,500 metric tons, and prices rose again. A kilogram of neodymium in May 2011 cost almost 300 USD, compared to just 40 USD 12 months earlier.
    China also used its dominance in rare earth production as a political weapon. When Japan detained a Chinese ship captain, China banned rare earth exports to Japan in September 2010.

    Figure 38. Rare earth carbonate, neodymium, dysprosium, and lanthanum, 2010–2013. Chinese onshore prices in RMB, indexed 30.12.2009=100. Data: Bloomberg, 2019.

    Over the past 20 years, industrialized nations have maneuvered themselves into this economic dependency. In the mid-1960s, the United States began producing rare earths in the Mountain Pass Mine, in the Mojave Desert of California. Until the late 1990s, this mine alone covered the world’s demand for these metals. Within the industry, this time period is known as the “Mountain Pass era.”

    However, due to environmental constraints and low prices for rare earth metals, the mine closed in 2002. Since the beginning of the 1990s, the Chinese—able to produce the rare earths more cheaply and without worrying about environmental requirements—have begun to flood the world market.
    The main Chinese production comes from Mongolia, where only a few kilometers away from the city of Baotou, with its multimillion population, is Bayan Obo, one of the world’s largest open-air mines.

    It is estimated that up to 35 million metric tons of rare earths—more than half of total Chinese production—come from Bayan Obo. Another large segment of the Chinese supply derives from the southern provinces, where there are numerous small illegal projects in addition to official government mines. Production has its price, however. Processing rare earths generates large amounts of poisonous residues, which leads to heavy pollution by thorium, uranium, heavy metals, acids, and fluorides. Thus, untreated sewage has turned the nearby 12-kilometer-long drinking-water reservoir at Baotou into a waste dump enriched with chemicals and radioactive thorium.

    Bayan Obo in China is the world’s largest mine for rare earth minerals.

    Such heavy environmental damages are ironic, since these rare earths are indispensable to the clean energy industry, especially wind turbines and electric/hybrid cars. There’s no short-term, easy way out of the West’s self-inflicted scarcity. Development of an independent production capacity without environmental problems is a very capital-intensive undertaking. Exploration and exploitation of rare earth deposits is somewhat less problematic; despite their name, rare earths are not really scarce. Even the rarest metal in the group is around 200 times more common than gold.

    Skyrocketing prices of rare earths have attracted many adventurers.

    Skyrocketing prices in 2011 attracted investors and adventurers around the globe, as small mining companies began to search for rare earths and other exotic metals, and investors looked for attractive rare earth deposits to invest in. However, the majority of new rare earth deposits will never be developed or even have the slightest chance to go into production.
    The two most promising companies were Molycorp and Lynas. Molycorp, which had an IPO in 2010, planned to reactivate the Mountain Pass Mine, while Lynas aimed to start production at the Mount Weld Mine in Australia in 2011. All other projects were looking at a planning horizon of at least five years. Meanwhile, the absence of a processing infrastructure was an even greater obstacle than the need for capital-intensive funding.
    In 2015, Molycorp filed for bankruptcy after facing challenging competition and declining rare earth prices. The company was then reorganized as Neo Performance Materials. Lynas successfully got into production and made a first shipment of concentrate in November 2012. Today it operates a mining and concentration plant at Mount Weld and a refining facility in Kuantan, Malaysia. In September 2018, however, the processing facilities in Malaysia came under government review because of environmental concerns, and shares of Lynas began to tumble.
    China will continue to be the dominant source of rare earths, which perfectly fits into the strategic plan issued by Chinese premier Li Keqiang and his cabinet in May 2015: Made in China 2025.

    Key Takeaways
    •The group of 17 rare earth metals, with exotic names like neodymium, dysprosium, or lanthanum, have become indispensable for modern high-tech applications like wind turbines and e-mobility.
    •In 2011, China squeezed the supply of rare earths, using its dominance in rare earth production as a political weapon. Because its production accounts for more than 90 percent of global supply, China has been able to dictate world market prices.
    •High-tech industries in the United States, Japan, and Europe sounded the alarm, but it was impossible to break the Chinese monopoly on the supply of rare earths in the short term. As a consequence, rare earth prices increased sharply, an average of 10 times between 2009 and 2011. Prices of neodymium and dysprosium, which are in the highest demand, increased even more drastically. This price spike attracted global investors who were eager to invest in rare earth deposits.

    40 The End? Crude Oil Down the Drain 2016

    A perfect storm is brewing for the oil market. There is an economic slowdown and too much storage because of contango. The world seems to be floating in oil, whose price falls to 26 USD in February 2016. But the night is always darkest before dawn, and crude oil and other commodities find their multiyear lows.

    “Everybody be cool. You—be cool.” —Seth Gecko in From Dusk till Dawn
    “The crude oil supply glut is gone.” —Nick Cunningham, www.oilprice.com

    The Armageddon of the global financial crisis had been stopped by the massive bailouts and unconventional monetary policy of central banks around the world. As for oil, WTI crashed from almost 150 USD/barrel in June 2008 and traded temporarily below 33 USD during spring 2009. By the end of that year, crude prices had recovered to 80 USD, and between 2011 and 2014 the reference point for crude oil was 100 USD.
    But in hindsight, the summer of 2014 proved to be just the quiet before a massive storm: WTI fell from almost 110 USD to less than 26 USD—a drop of 76 percent, even lower than it had been during the financial crisis. (Actually it was the lowest level for crude prices since 2003.)
    Crude oil was not the only victim. The year 2016 began as an ugly one for all commodities as the Chinese domestic stock market plunged, and many other equity indices around the world followed in a case of Asian contagion. Demand in China was of fundamental importance for commodities because of demographics, growth, and the country’s immense raw material purchases. The US dollar retreated massively from highs of 100 on the Dollar Index, and raw material prices dropped further.

    Figure 39. Crude oil (WTI): recovery and bear market, 2008–2016. Data: Bloomberg, 2019.

    The massive price drop during the financial crisis had caused the term structure for crude oil to flip into contango, in which spot prices are below those of future delivery dates. It made more sense to store oil than to sell it, but the glut in supply overtaxed existing holding facilities, eventually leading to the use of supertankers as floating storage.
    By the end of summer 2015, crude inventories were still rising and prices had started to crash. In early 2016, storage levels had barely declined from their 80-year highs of 490 million barrels in the United States alone, leading to pessimism about the future.
    The International Energy Agency (IEA) noted that crude oil markets could “drown in over-supply” because of rising storage levels around the world. The agency said that the world had added 1 billion barrels of oil in storage in 2015, and storage levels were still rising. Even in the fourth quarter, normally when stocks are drawn down, inventories continued to climb.

    Crude oil crashed because of a massive global supply glut. Oil prices fell to less than 26 USD.

    There were dire warnings that the world could soon run out of storage space for oil, which would depress prices even further. Oil tumbled to its lowest level in more than 12 years, as the crude stockpiled at the delivery point for New York futures reached a record.
    On February 11, 2016, when the S&P 500 index posted a 12 percent loss on the year, the Baltic Dry Index—which measures the shipping activity of dry bulk cargos around the world—fell to an all-time low of 290. The activity in commodity markets came to a halt, and the Bloomberg Commodity Index posted a 30 percent loss on the year. However, February 11 marked the lows for many assets, and the markets began to improve in the weeks and months that followed.

    OPEC and Russia agreed to a joint production cut to fight the supply glut. Finally prices started to recover.

    Capitulation Price Levels

    In early February 2016, the S&P Goldman Sachs Commodity Index and Bloomberg Commodity Index, two important commodity market references, posted double-digit losses. Investors were devastated since 2015 had already been a bloodbath for commodities. Crude oil traded as low as 26 USD/barrel, copper below 2 USD/lb, and even gold traded as low as 1,050 USD/oz. Cryptocurrencies weren’t given much attention from investors at that time. Bitcoins, for example, had a bad year in 2015, trading below 200 BTC/USD, and started to recover in 2016.
    Gold was the first among the group of more than 20 commodities to indicate a turnaround, as prices started to climb, and exceeded its 200-day moving average rather quickly, a strong technical indicator for bullish markets.
    In the face of the massive supply glut, OPEC and Russia agreed to a joint cut in production. It was OPEC’s first agreed cut since 2008, when oil prices collapsed late in the year after hitting record levels during the summer. And it had the potential to restore some longer-term stability to the global oil market. The wild card was renewed production in the United States, pushed by shale oil and fracking on the back of rising prices. Some feared that this could simply end up prolonging the glut and pushing prices back down.
    But there was also evidence that the massive inventories of raw materials were declining, and demand was finally picking up. And demographic trends continued to support the rationale that more people in the world would require more commodities in the years ahead. Both classic economic theory and common sense dictate that as demand rises, inventories fall and prices rise.

    Figure 40. Commodity performance in 2016. Data: Bloomberg, 2019.

    Meanwhile commodity prices were rising, with gold leading the way. The precious yellow metal traded to more than 1,380 USD in the wake of Britain’s Brexit vote, and silver shot up above 21 USD. Crude oil rose from just above 26 USD per barrel in February to more than 50 USD at the beginning of October. The price of sugar increased from 10 US cents per pound in August 2015 to more than 24 US cents on September 29, 2016. The prices of iron ore, zinc, tin, nickel, and lead all posted double-digit gains in 2016. In perhaps the most optimistic signal for commodity markets, the Baltic Dry Index rose from 290 in February to 915 in early October, an increase of more than 215 percent.

    Crude oil prices doubled from their lows in 2009, and commodities started to shine again.

    It appeared that prices for raw materials had reached a significant bottom. Commodities as an asset class posted impressive gains, rising by more than 20 percent from its lows in 2016 to the end of the year. WTI more than doubled in that period to above 55 USD/barrel.
    Production cuts that had been in place since the start of 2017 helped halve the excess of global oil stocks, although, according to OPEC, those remained above the five-year average, at 140 million barrels. It was not until May 2018 that OPEC said the global oil supply surplus had nearly been eliminated.

    Key Takeaways
    •“Super-contango” had caused a massive supply glut in crude oil, during which storage facilities for WTI in Cushing, Oklahoma, reached maximum capacity: The world seemed to be floating in oil, and WTI crashed from almost 110 USD to less than 26 USD in February 2016—a drop of 76 percent and the lowest level for crude oil prices since 2003.
    •During 2016, the Chinese domestic stock market plunged, and many other equity indices around the world followed, leading commodity markets lower as well. However, in spring 2016, commodity markets found a bottom, and commodities as an asset class posted impressive gains over the full year, rising by more than 20 percent. The price of WTI more than doubled in that period to more than 55 USD/barrel.
    •Nevertheless, it would take until May 2018 until OPEC confirmed that the global oil supply surplus had nearly been eliminated.

    41 Electrification: The Evolution of Battery Metals 2017

    Elon Musk and Tesla are setting the pace for a mega trend: electrification! Demand from automobile manufacturers, utilities, and consumers pushes lithium-based battery usage to new heights. For commodity markets, it is not only lithium and cobalt but also traditional metals like copper and nickel that are suddenly in high demand again. Electrification might prove to be the “new China” for commodity markets in the long term.

    “Tesla is here to stay and keep fighting for the electric car revolution.” —Elon Musk

    The year 2016 issued a wake-up call for the automotive and oil industries. OPEC, the mighty oil cartel, massively revised its growth expectations for electric vehicles (EVs) upward by 500 percent. Instead of the 46 million EVs by 2040 it had envisioned in 2015, OPEC was now looking at a forecast of 266 million EVs.
    If those projections turn out to be correct, by 2040 demand for oil could fall by 8 million barrels a day. That is about what the United States currently produces in a day, or roughly 8 percent of global consumption. (The world consumes almost 100 million barrels of crude oil every day, of which 75 percent is related to the transportation sector.)

    Elon Musk and Tesla

    Elon Musk, founder and CEO of SpaceX, Tesla, and Neuralink, was born in Pretoria, South Africa, in 1971. As of February 2018, Musk had a net worth in excess of 20 billion USD and was listed by Forbes as the 53rd-richest person in the world. In December 2016, he was ranked 21st on the Forbes list of “The World’s Most Powerful People.” Musk also founded PayPal, which was bought by eBay for 1.5 billion USD in October 2002.
    Tesla, based in Palo Alto, California, specializes in electric vehicles (EVs), lithium-ion battery energy storage, and solar-panel manufacturing through its subsidiary company SolarCity. Tesla operates multiple production and assembly plants near Reno, Nevada, while its main vehicle-manufacturing facility is in Fremont, California. The Gigafactory in Reno primarily produces batteries and battery packs for Tesla vehicles and energy storage products. According to Bloomberg, over the past 12 months Tesla has been burning money at a clip of about 8,000 USD a minute (roughly 500,000 USD an hour).
    In 2017 Tesla produced and sold 100,000 cars. It might be the beginning of a revolution, but so far EVs are hardly making a dent. German automakers BMW, Mercedes, and Audi together sold 6.6 million cars, and for these traditional car companies, the electric catchup has just started. In Germany, new car registrations of EVs reached 55,000, half of which were plug-in hybrids. This represented 1.6 percent of the new car market, based on 3.4 million new cars in Germany. Compared to 43.8 million total cars in use in that country, it was basically a grain of sand in the desert.

    EVs made up 1.6 percent of new car registrations in car-crazy Germany in 2017. However, Bloomberg New Energy Finance estimates that by 2040, EVs will make up to 40 percent of global new car registrations—tremendous growth!

    Currently China makes up half of the global EV market, according to the International Energy Agency’s Global EV Outlook 2018. In 2017, China sold 579,000 EVs, a 72 percent increase compared to 2016. Meanwhile, the global stock of electric passenger cars exceeded 3 million last year.
    But compared to the bigger picture, that’s merely a drop of water in the ocean, since according to BMI Research, the global car fleet can be estimated at around 1.2 billion cars. And global sales of passenger cars are forecast to exceed 81 million vehicles in 2018. Along with China, the United States is among the largest automobile markets worldwide, in terms of both production and sales.
    Therefore, it is all about the future as automakers start to expand their business into the electric mobility sector. Bloomberg New Energy Finance (BNEF) estimates that by 2040, global EV penetration of new car registration could reach 35 to 40 percent.

    Figure 41. Cobalt prices, 2012–2018. Data: Bloomberg, 2019.

    For commodity markets, this might signal the beginning of an avalanche, as electric cars demand additional raw materials. For example, studies done by the investment bank UBS and BNEF suggest that by 2040 there will be a significant surplus demand for graphite, nickel, aluminum, copper, lithium, cobalt, and manganese. Other commodities, like crude oil, steel, as well as platinum and palladium, would be negatively affected.

    For commodity markets, the mega trend of electrification could turn out to be an enormous new source of demand.

    Prices for cobalt and lithium, which are both essential for different types of batteries, are experiencing a bull market. Lithium-based batteries first had commercial applications a couple of years ago. Now we have them in almost all mobile devices: laptops, smartphones, electric tools, and cars. Gigafactories have been ramped up in the United States and China, and battery prices are falling because of economics of scale and scope. That, in turn, triggers new applications.

    Figure 42. Benchmark Lithium Index, 2012–2018. Data: Benchmark Mineral Intelligence, 2019.

    Tesla might lose its leadership in electric cars, but Elon Musk kicked off a revolution in electrification and energy usage—a revolution that works to the good of humanity and, as a side benefit, will be good for commodity markets as well.
    The electrification of the automobile industry is a gigantic step, but only the tip of an iceberg. The ability to store energy is the missing link in growing alternative (wind, solar, and water) energy production. By 2025, power banks and power walls—instruments for decentralized energy storage at home, for example—might exceed sales for lithium-based batteries for the car industry. And this market is much bigger and promises much higher growth!

    Key Takeaways
    •There is a bull market for battery metals like lithium and cobalt, as battery-producing facilities shoot up like mushrooms. Prices for cobalt quadrupled from 25,000 to 100,000 USD per ton in 2017.
    •Elon Musk and Tesla are at the forefront of a mega trend in electrification. Although sales of electric vehicles today are minuscule, industry estimates peg them at 40 percent of global new car registrations by 2040. We might be witnessing the beginning of a revolution.
    •E-mobility is the first step, but energy storage is the missing link to alternative energy production by wind, sun, and water.
    •Together, e-mobility and energy storage might prove to be the “new China” for commodity markets in the long term, since demand is climbing not only for lithium and cobalt, but also for traditional metals like copper and nickel.

    42 Crypto Craze: Bitcoins and the Emergence of Cryptocurrencies 2018

    Bitcoins, the first modern cryptocurrency, emerged in 2009, described in a white paper the previous year by the pseudonymous Satoshi Nakamoto. The value of bitcoins explodes in 2017 from below 1,000 to above 20,000 USD, attracting worldwide attention. This stellar price rise, followed by a crash of almost 80 percent in 2018, makes bitcoins the biggest financial bubble in history, dwarfing even the Dutch tulip mania of the 17th century. Despite the boom and bust, the future looks bright, as underlying blockchain technology reveals its potential and starts to revolutionize daily life.

    “[Bitcoin/Blockchain] is the next major IT revolution that is about to happen.” —Steve “Woz” Wozniak, co-founder of Apple
    “With all of the calls of ‘bubble,’ it’s worth remembering that we’re in the early stages of global adoption as well as the early stages of development of the technology.” —Ari Paul, Forbes

    The punch came fast. Before boarding a flight to leave the country on April 1, 2018, Robert Farkas, co-founder of Centra Tech, was arrested by local criminal authorities in the United States. Half a year earlier, in September 2017, celebrity boxer Floyd Mayweather had posted happy pictures of himself living la dolce vita, spending money in expensive shops in Beverly Hills with his cryptocurrency-based Centra card.
    Farkas and his Centra Tech co-founder Sohrab “Sam” Sharma had claimed to offer a debit card, backed by Visa and Mastercard, that would allow people to convert cryptocurrency to US dollars to spend on everyday goods. The Securities and Exchange Commission alleged that Centra had no relationship with either card company. Sharma and Farkas had created fake biographies of fictional executives and paid celebrities to tout the upcoming initial coin offering (ICO)—an unregulated process by which a company can issue a new digital coin in exchange for real money—and the promise of quick riches on social media. Sharma and Farkas had swindled about 32 million USD from investors.
    Centra Tech is just one example of multiple scams and frauds in the crypto and ICO market in 2018, but it was dwarfed by other ICO scams like Modern Tech, which had made off with more than 660 million USD.
    It is still pioneer days in the technology sector, where ICOs are more popular and better known than companies’ traditional initial public offerings (IPOs). ICOs have quickly become a more important source of project funding than endless discussions with venture capital companies. There’s a dark side, however. The opportunities of a fast-developing market always attract fraud and black sheep. That is part of the game.

    The bitcoin was born in 2009. Today, more than 2,000 alternative coins exist.

    December 2018 is still the Wild West in an industry that is barely 10 years old. Bitcoins (BTC), described in a white paper in November 2008 and first released as open-source software in January 2009 by the pseudonymous Satoshi Nakamoto, are generally considered the first decentralized cryptocurrency. It was originally created as an alternative, decentralized payment method. Since then, more than 2,000 alternative coin variants have been created. Like Napster 10 years earlier, the system works without a central bank, as a peer-to-peer network in which transactions take place directly between users, without an intermediary. Blockchain is the technology behind cryptocurrencies, and it is fast becoming a platform for a vast number of innovations in peer-to-peer transactions.
    A blockchain is a cryptographically protected distributed ledger. It’s what protects you or anyone else from making a copy of that bitcoin you just bought. In fact, anything that you can make a mental list of, you can manage with blockchains—everything from tracking land and real estate ownership to the way we distribute medicine and how we grant certificates and diplomas. Some of these ideas are brilliant, while others are ridiculous.

    Digital Assets, Cryptocurrencies, and Tokens

    A digital asset is anything that exists in a binary format and comes with the right to use it, while the term “cryptocurrency” refers to coins that fulfill the characteristics of standard paper-based money (fiat money). The characteristics are its function as a store of value, a unit of account, and fungibility. Examples include bitcoin, ethereum’s ether, and ripple’s XRP. Note that ethereum and ripple refer to the underlying blockchain and not to their cryptocurrencies. Crypto tokens are similar to cryptocurrencies in that they are built on blockchains.
    Cryptocurrencies are the most common form of tokens, but crypto tokens are broader representations of a blockchain’s value. That value is manifested across a diverse range—from cryptocurrencies to loyalty points and even to assets built on the blockchain.
    Ethereum, for example, is the underlying blockchain for several tokens that use its platform to develop services and products. The difference between cryptocurrencies and crypto tokens becomes important within the context of investment. For example, cryptocurrency valuation is derived from a coin’s success in adhering to the characteristics of money. On the other hand, crypto token valuations depend on a different set of factors, such as protocol adoption and robustness.
    Originally, cryptocurrencies were designed to offer a decentralized alternative to traditional fiat currencies. Even at peak valuation in December 2017, bitcoins—plus the sum of all other cryptocurrencies a decade after their invention—represented just a fraction of physical money in US dollars, euros, pound sterling, or yen in terms of value. In volume, bitcoins are still by far the biggest cryptocurrency, followed by ether, ripple, and dash. In 2018, the 500 biggest coins had a combined market capitalization of 500 billion USD, of which bitcoins made up two-thirds. Physical US dollar notes in circulation are valued at 1.5 trillion USD, and that is only a minor fraction of the total US dollar supply. Next in line is physical gold, whose circulating value is estimated at 8 trillion USD, before taking the whole currency market into consideration. All fiat currencies together add up to a value of 83 trillion USD, which includes all physical money in circulation and electronic, that is, virtual money.
    Another important factor is the concentration of holdings. About 40 percent of bitcoins are held by perhaps 1,000 users. The top 100 bitcoin addresses control 17.3 percent of all the issued currency, according to Alex Sunnarborg, co-founder of the crypto hedge fund Tetras Capital. That’s important, since the cryptocurrency was designed to reach a maximum of 21 million bitcoins. Bitcoins are added by “mining,” a process by which transactions are verified and added to the public ledger. Currently, one bitcoin is added approximately every 10 minutes. With ether, the top 100 addresses control 40 percent of the supply, and with smaller currencies top coin holders control more than 90 percent because many of them are members of the teams running these projects.
    Bitcoins were first explained to the public as a form of digital money, and that is how its successors and competitors like litecoin and ether have been framed as well. Each of these currencies resembles traditional money in certain ways: They are abstractions of economic value and can be traded. But none of them offers the most basic role of a currency as a relatively stable medium of exchange. There is too much friction involved. Each transaction takes too long, uses too much energy, and involves too many risks.

    Bitcoins are more than digital money.

    The biggest problems with bitcoins have emerged because the mechanics of buying and holding them are so inscrutable that nearly everyone pays third parties to handle them. Those wallet-service middlemen become points of failure for the whole system. They get hacked, their systems go down, and they are ordered by governments and regulators to report transactions that users thought would be anonymous.

    The Mt. Gox Heist

    Launched in 2010 by Jed McCaleb, who later founded ripple, Mt. Gox, by 2013, had become the largest bitcoin exchange in the world. Based in Shibuya, an area in Tokyo, Japan, at that point Mt. Gox was handling more than 70 percent of all bitcoin transactions worldwide. In June 2011, when Mt. Gox was acquired by Mark Karpelès, the company was hacked the first time, and 2,000 bitcoins were stolen. As a consequence, a number of security measures were initiated, including arranging for a substantial number of bitcoins to be taken offline and held in cold storage. As a result of an investigation by the US Department of Homeland Security regarding the company’s license, the US government seized more than 5 million USD from Mt. Gox, and the company had to announce a temporary suspension of US dollar withdrawals. But that was not the biggest problem. As it turned out, the company had been the victim of an ongoing hack for more than two years.
    In February 2014, Mt. Gox suspended trading, closed its website and exchange service, filed for bankruptcy protection in Japan and the United States, and began liquidation proceedings soon after. The crypto exchange announced that approximately 850,000 bitcoins belonging to customers and the company were missing (valued today at 4.2 billion USD). Although 200,000 bitcoins were eventually recovered, the remaining 650,000 have never been found.
    CEO Mark Karpelès was arrested in August 2015 in Japan and charged with fraud and embezzlement and manipulating the Mt. Gox computer system to increase the balance in an account. US authorities followed the trail of money, and in July 2017 Alexander Vinnik was arrested in Greece and charged with playing a key role in the laundering of bitcoins stolen from Mt. Gox. Vinnik is alleged to be associated with BTC-e, an established bitcoin exchange, which was raided by the FBI as part of the investigation. The BTC-e site has been shut down, and the domain has been seized by the FBI. But no money has been found so far.
    What is a fair price for a bitcoin? Is it 1 or 100,000 USD? Some financial analysts today emphasize that bitcoins have no intrinsic value at all, and some economists refer to the Fisher equation, which pins the current value of a bitcoin to 20 to 25 USD in regard to the total available number of bitcoins, transaction speed, and trading volume. But it’s important to note that for this equation it is not the status quo but the future potential of the technology and application that is relevant for a bitcoin’s value. And it is hard to see limits to the application of blockchain technology.

    In May 2010 Laszlo Hanyecz bought two pizzas in Jacksonville, Florida, for 10,000 BTC. It was the first real-world bitcoin transaction.

    Bitcoins became a hot topic in 2017 in the financial mainstream because of tremendous price fluctuations. Let’s take a step back: Prices initially were measured in US cents and single-digit US dollars in the land of Dungeons and Dragons or World of Warcraft. But on May 22, 2010, Laszlo Hanyecz made the first real-world bitcoin transaction by buying two pizzas in Jacksonville, Florida, for 10,000 BTC, valuing one bitcoin at 0.003 USD. One year later, in spring 2011, bitcoins were traded at parity with US dollars. And six years after that, on December 17, 2017, bitcoins surpassed 20,000 USD for the first time.

    Bitcoins traded at 0.03 USD in May 2010 and above 20,000 USD in December 2017.

    That same month, in December 2017, the Chicago Mercantile Exchange (CME) introduced and listed futures contracts on bitcoins in the commodity segment, allowing a hot speculative bubble to unfold. Bitcoins became commoditized and open to new investors and the mainstream, beyond the niche of electronic wallets. Until then, bitcoin and other cryptocurrency trading had been limited to specialized exchanges like Bitfinex, Kraken, or OKCoin, where you had to exchange US dollars or euros into bitcoins with your electronic wallet, though bitcoins were exchangeable into any other cryptocurrency. From its high in December, bitcoins crashed to below 6,000 USD within two weeks.

    Figure 43. Price of bitcoins surpassed 1,000, 5,000, 10,000, and finally 20,000 USD in 2017. Data: Bloomberg, 2019.

    In December 2018, bitcoins tumbled below 3,500 USD to a 13-month low before stabilizing. The slide fueled a sell-off among rival tokens ether, litecoin, and XRP. After months of stability at around 6,000 to 6,500 USD, bitcoins and other cryptocurrencies had lost more than 700 billion USD in market capitalization since their peak in December 2017.
    Regulatory concerns played a role, as the US Securities and Exchange Commission announced penalties against two companies that hadn’t registered their initial coin offerings as securities. Also, the US Justice Department was in the process of investigating whether the previous year’s rally was fueled by market manipulation.
    As Robert Shiller noted in his book Irrational Exuberance, it is impossible to spot a bubble and time its burst if you are part of it. That is possible only in hindsight. But after the stellar rise from less than 1 USD before 2011 and the crash by almost 80 percent from its December 2017 peak, the verdict is official: The bitcoin craze is the biggest financial bubble in history! It even dwarfs the tulip mania of the 17th century, which had previously exceeded every historic financial market bubble, including the Mississippi or South Sea Bubble, the run-up in equity prices before the busts of the Great Depression and Black Friday, or—more recently—the dot-com bubble and the rally before the world financial crisis hit in 2008.

    It may comfort investors that an 80 percent crash is not a unique event in the crypto space. In the past five years, the value of bitcoins was cut in half three times, and crashed by more than 25 percent 16 times, only to rise to new highs until 2018. Think back . . . how many years did it take to recover your losses from the dot-com bubble? Measured by the NASDAQ Composite, on average that took about 15 years! In the past, recoveries in the crypto universe have been much faster.

    The year 2013 was a rough ride for bitcoins. And the Mt. Gox heist almost became an extinction event for the cryptocurrency.

    In percentage terms, the bitcoin crashes of 2013 were almost as bloody as 2018. Prices ran up from a couple of US dollars to more than 1,200 USD, before plummeting. In April 2013, bitcoin prices fell from 230 to 67 USD overnight, a massive 70 percent drop in 12 hours. It took seven months to recover. After April, bitcoin prices hovered around 100 to 120 USD until later in the year, when prices suddenly skyrocketed to 1,200 USD in late November. However, in December the price tumbled back to less than half of that.
    Adding to the long road of recovery after the collapse in December 2013 was the Mt. Gox scandal. Bitcoins steadily increased in price through January and February, when they suddenly dropped by nearly 50 percent from 880 to below 500 USD because of the Mt. Gox heist.

    Figure 44. Historic bitcoin price corrections, 2013–2017. Data: Coindesk.com.

    One of the results of the erratic price swings of 2013–2014 is the emergence of an active cryptocurrency trading scene with its own slang, a special language established by crypto enthusiasts. The term “HODL” is probably the best known. During a massive price crash in 2013, someone called “GameKyuubi,” apparently drunk, posted “I AM HODLING” in a Bitcoin Talk forum. What the user in the post wanted to convey was the fact that despite the sharp drop in price, he was choosing to hold on to his bitcoins. The post went viral, and #HODL has been interpreted as “Hold On for Dear Life,” which corresponds to “Buy & Hold,” an investment strategy every long-term investor can relate to.

    #HODL. Hold On for Dear Life.

    Crypto slang today is very colorful, with a multitude of new terms and phrases whose meanings go way beyond their traditional definitions. There are words and abbreviations such as “mooning,” “fudding,” ADDY, JOMO, BTFD, and DYOR—the list goes on and on. HODL, however, is by far the most popular of these terms, and one that almost all cryptocurrency investors can identify with.

    Anti-money-laundering measures and the Chinese ban on cryptocurrencies and ICOs weighed heavily on bitcoins in 2018.

    How does one account for the extraordinary bitcoin rally and its bust? Originally, bitcoins were founded to redistribute value and move money away from banks and other financial institutions to people. Anyone could become a bank, a payment service, or a lender. But bitcoins and other cryptocurrencies also became a loophole for money laundering and capital flight. Because of the low level of legal regulation, the use of cryptocurrency spread into the shadow economy. The implementation of an automatic exchange of information in 2017 led to last-minute panic as a new global standard on the automatic exchange of information targeted tax evaders. The new system provides for the exchange of non-resident financial account information with the tax authorities in the account holders’ country of residence. Data was exchanged for the first time in September 2017, but the majority of the 100-plus jurisdictions had implemented the system by January 1, 2018.

    The Top 5 Crypto Billionaires in 2018

    1.Chris Larsen (57), co-founder of ripple, owns 5.2 billion XRP, the token launched by ripple, whose current value is 8 billion USD.
    2.Joseph Lubin (53), co-founder of ethereum, has an estimated wealth of 1–5 billion USD.
    3.Changpeng Zhao (41), founder and CEO of Binance, the world’s largest cryptocurrency exchange, has an estimated wealth of 1–2 billion USD.
    4.Cameron and Tyler Winklevoss (36) were early investors in bitcoins and the founders of Gemini in 2015. Their estimated wealth is 0.9–1.1 billion USD.
    5.Matthew Mellon (45), an early investor in ripple’s XRP, has an estimated wealth of 0.9–1 billion USD.
    Source: Business Insider, 2018.

    Capital flight has also worried the government of China. By buying bitcoins, the Chinese have been able to move funds abroad. In September 2017, renminbi-to-bitcoin trades made up more than 90 percent of all bitcoin transactions. The government outlawed fiat money from being used in cryptocurrency purchases and even imposed travel bans on Huobi and OKCoin executives, two of the nation’s largest crypto exchanges. Chinese regulatory authorities also imposed a ban on ICOs and finally termed them illegal in China in September 2017. Huobi was forced to move its operations to Singapore, while OKCoin, renamed OKEx, was embraced by Malta. Many Chinese simply transferred their bitcoins to the now-offshore exchanges and carried on trading—until February 2018.
    That February, the People’s Bank of China (PBOC), which is the central regulatory authority, issued a statement that “it will block access to all domestic and foreign cryptocurrency exchanges and ICO websites,” basically shutting down all cryptocurrency activities in the country. And the authorities were not bluffing: In April 2018, police stormed a large-scale bitcoin mining operation in the city of Tianjin and confiscated 600 computers in the raid

    For bitcoins and blockchains, 2018 was like 1992 for the internet—early days. To reveal the cryptocurrency’s full potential, another 10 years are needed.

    The Chinese government has been successful in imposing stricter capital controls, banning bitcoin trading and ICOs, and shielding its people from bad influences by its Great Firewall. But China will not be able to turn back time for blockchain technology and its applications.
    The blockchains and cryptocurrencies will achieve their full potential in a decade, said Steve Wozniak, co-founder of Apple, in 2018, and according to Jack Dorsey, CEO of Twitter, bitcoins will become the world’s “single currency.” Previously, from 2014 to 2017, Jamie Dimon, CEO of JPMorgan Chase, was regularly quoted about his views of bitcoins: “Bitcoin is a fraud,” he said, as well as “Bitcoin will not survive,” and “Bitcoin is going nowhere.” In 2018, Jamie Dimon regretted that he had called bitcoin a fraud but still remained bearish. Meanwhile, earlier in that year, overwhelmed by client demand, JPMorgan Chase’s top rival, Goldman Sachs, announced the setup of a cryptocurrency trading desk.
    As for a distributed ledger technology like blockchain, its situation today is like that of the internet in 1992, with immense potential but a steep and messy learning curve. Every successful new technology undergoes an explosion of growth in which we try to use it for everything, until time reveals what the best applications and limitations are. Investing in dot-com stocks in the late 1990s was a roller-coaster ride, and many of the pioneers in that field ultimately failed. The real impact of the internet has taken decades to unfold, but the future of e-commerce and society has been changed forever.

    Blockchain technology has the potential to be just as impactful over time. Just as with the dot-com bubble, backing any single player in the crypto craze is like placing a bet on 27 red in a game of roulette. It is too early and the outcomes are too uncertain to identify potential winners. However, with the digital revolution we are experiencing right now, the economic landscape will be transformed in drastic ways. And, despite its sins of adolescence and the irrational exuberance of crypto trading’s early years, crypto tokens and blockchain technology have already begun to revolutionize our world. The applications in real estate, property, banking and financial services, and health care, just to name a few, are limitless and can only be compared with the development of the internet or the rise of smartphone applications. It might be that we are witnessing the first glimpse of a tokenized and coin-based economy. The future looks bright.

    Key Takeaways
    •Bitcoins were introduced in 2009 as an alternative, decentralized payment method using blockchain technology. Today more than 2,000 alternative coins (“altcoins”) exist.
    •Over 10 years the price of bitcoins rose from 0.003 USD in 2010 to 1 USD in 2011, to more than 1,000 USD in 2017. It exceeded 20,000 USD in December 2017, but within weeks, bitcoins dropped by almost 80 percent to below 3,500 USD in December 2018.
    •This tremendous boom and bust has made bitcoins the biggest financial bubble in history, greater even than the Dutch tulip mania of 1637.
    •The boom and bust of 2017–2018 has been associated with the Chinese ban on cryptocurrencies and ICOs, as well as anti-money-laundering measures like the implementation of automatic exchange of financial information in more than 100 countries. The beginnings of new disruptive technologies often attract black sheep and fraud, and many of the ICOs did turn out to be scams.
    •For bitcoins and blockchain applications, it is still early days. To reveal their true potential, another decade is needed. But from today’s perspective, the applications seem limitless.

    Outlook: The Dawn of a New Cycle and a New Era

    We are at the dawn of the 2020s and the commodity and crypto markets are in the starting blocks for a new rally. At the beginning of 2016, commodity investors looked back on five painful bear market years. In 2015, the Bloomberg Commodity Index, which measures the performance of 22 commodities like crude oil, gold, copper, wheat, and corn, lost 25 percent of value. And it got worse: In January 2016, commodity markets traded down an additional 7 percent. The Bloomberg Commodity Index was trading at its lowest level since its inception in 1991. Since spring 2014, investors had lost almost half of their invested funds. Investors in gold and silver mining companies, in particular, were hit hardest. The Arca Gold BUGS Index and Philadelphia Gold and Silver Index, both representing the biggest gold and silver mines, traded down to levels last reached at the beginning of 2000, when a troy ounce of gold was 260 USD.

    From summer 2011 to the beginning of 2016, investors saw 80 percent of their principal vanish into thin air, while gold in the same period traded down from above 1,900 USD to 1,050 USD (–45 percent). Mining in general suffered greatly. Market capitalization of companies included in the MSCI World Metals & Mining Index dropped by more than 80 percent since their peak valuation during the commodity super cycle in 2008. Shares of Glencore, the biggest mining and commodity trading company in the world, traded down to 67 GBP at the end of September 2015. From its highest prices in 2011, investors lost more than 80 percent of their capital. Compared to its closing price of 527 GBP for its initial public offering in May 2011, this represented a loss of shareholder value of almost 90 percent!
    Market exaggerations drove credit default swaps for mining companies into the stratosphere. For example, Glencore’s 2.5 percent yielding bond, maturing in 2019, dropped by 25 percent within three months to 75 US cents per dollar, offering a yield to maturity of more than 17 percent per year for investors. The same held true, for example, for bonds of Freeport-McMoRan, Teck Resources, First Quantum, or Lundin Mining, all large cap mining companies. Investors anticipated the bankruptcy of a whole industry.

    Figure 45. 50 years of commodity markets ups and downs. Did we see the beginning of a new bullish cycle in 2016? Data: Bloomberg, 2019

    .In retrospect, we witnessed capitulation levels at the beginning of the year 2016. However, bold investors were able to make a killing in commodities during an early recovery. Compared to January 2016, gold mines tripled in value in just half of a year while gold gained 30 percent. Shares of Glencore approached 300 GBP, quadrupling in value compared to its lows just a couple of months before.
    While commodity markets crumbled and value in mining evaporated, world equity and bond markets celebrated the time of their life. MSCI World increased steadily after its drop by almost 60 percent during the financial crisis of 2008–2009. In the United States, the Dow Jones and S&P 500 were both trading at all-time highs in late 2016 and continued their path of success until January 2018. At the same time, yields of 10-year bonds in the United States fell below 1.5 percent, while in Europe, German 10-year bonds dropped into negative territory. Bond investors woke up every day believing their party would never stop.
    Looking at the long-term relationship between equities and commodities by taking the ratio of S&P Goldman Sachs Commodity Index versus the S&P 500, one fact is striking: Relative valuation is extreme. Compared to equities, commodities have been stuck in the penalty box since the China-fueled commodity super cycle burst. Similar to the tech bubble 15 years ago, Alphabet (Google) today is valued equal to the aggregated market capitalization of all companies included in MSCI World Metals & Mining Index (more than 180 companies, including mining giants like BHP Group, Rio Tinto, Glencore, Vale, Barrick Gold, and Newmont Mining)! One has to ask: What is cheap, and what is expensive?

    Figure 46. Relative valuation of commodities versus equities. Buy commodities! Data: Bloomberg, 2019.

    Therefore, it is no surprise that after a severe five-year bear market, a 15 percent rise in commodity markets in 2016 passed the majority of investors unnoticed. From their intra-year lows, commodity market indices like the Bloomberg Commodity Index (BCOM), S&P Goldman Sachs Commodity Index (S&P GSCI), and Rogers International Commodity Index (RICI) all gained more than 25 percent and surpassed equity-index performance. Furthermore, metals and mining as well as oil and gas led the equity-index sector performance in the United States and Europe, but fund manager surveys show that investors continued to be massively underweighted in resources equities.
    Recent history aside, investors can refer to several commodity markets that are still in oversupply. But in terms of supply-demand imbalances following the boom of the commodity super cycle, the worst is behind us. Slashes of industry investments in mining, as well as in oil and gas, will have brutal results in 2020–2030, when natural depletion will combine with and outweigh reduced exploration and development expenditures. With fundamental market data for commodities just starting to improve, commodity prices reached a technical bottom. A shift of the 200-day moving average to the upside in April 2016 was a first positive sign for a bullish market environment in commodities in the future.
    In conclusion, 2016 might prove to have been the dawn of a new cycle for commodity investors, a multiyear period of rising prices, which also reflects healthy prospects for the global mining industry. In the coming years, new trends like battery metals for electrification, e-mobility, and the megatrend of digitalization, which includes cryptocurrencies, will become an important and enormous driver for productivity, growth, and commodity markets. Electric vehicles might not need gasoline or diesel, but demand for gold, copper, nickel, cobalt, lithium, and rare earths increases drastically. If this scenario holds true, we witnessed the beginning of a new cycle which can only be compared to the awakening of the Chinese economy almost 20 years ago. It is also the beginning of a more mature stage in blockchain and bitcoins, as the exuberance of the early years is gone and opens the path to future applications.

    Epilogue

    “Commodities tend to zig when the equity markets zag.” —Jim Rogers, commodity expert and co-founder of the Quantum Fund

    Let us take a short time trip back to the year 2001. The average price for a barrel of crude oil was 26 USD. In the course of the year, the price of a ton of copper dropped from 1,800 to below 1,400 USD. Gold traded between 255 and 293 USD per troy ounce and made its first serious attempt in modern times to jump above 300 USD.

    Prices for wheat and corn averaged 2.70 and 2.08 USD per bushel. The terror attacks of 9/11 on the World Trade Center and the Pentagon, which killed about 3,000 people, were the most traumatizing events in 2001. Although the head of Al-Qaeda, Osama bin Laden, was shot in an elite U.S military mission in 2011, the war against global terrorism still has not been won today, almost 20 years later. But at least a military victory against the Islamic State seems imminent. In the White House, Democrat Bill Clinton was replaced by Republican George W. Bush; 15 years later Republican Donald Trump took over the presidency from charismatic Democrat Barack Obama. Cynical observers note that 9/11 has been replaced by 11/9, the date Donald Trump’s election was announced.

    In 2001, commodities as a professionally recognized and investable asset class were still in their infancy. The Bloomberg Commodity Index, as a measure of commodity market performance, had been launched just a few years earlier, in 1998, as the Dow Jones AIG Commodity Index. Alternative investments in addition to traditional investments in equities and bonds have since become more fashionable, thanks to the investment strategies of endowment funds such as those at Yale and Harvard Universities. In 2005, Gary Gorton and K. Geert Rouwenhorst published “Facts and Fantasies about Commodity Futures,” which also helped anchor commodities as an integral part of a global asset allocation.

    At the end of 2001, China entered the World Trade Organization (WTO), an event that marked the beginning of rapid growth of the Chinese economy and caused massive turbulence for global commodity markets. Within a few years, China had evolved as a dominant factor in global commodity demand, and the commodity super cycle was born.

    Crude oil reached 147 USD per barrel, copper traded above 10,000 USD per ton, gold surpassed 1,900 USD per troy ounce, and wheat and corn shot up to 9.50 and 8.40 USD per bushel. But depression followed euphoria in the form of years of sluggish growth in the aftermath of the global financial and economic crisis. The year 2008 was an annus horribilis for global capital markets, as equity and commodity markets dropped by more than 50 percent. A period of deleveraging and sluggish growth followed a nonsustainable recovery. Thereafter, commodity markets faced five years of a severe bear market.
    Today, approaching 2020, we are witnessing the starting point of a new commodity bull market and a maturing of the market for cryptocurrencies. The exuberance of the commodity super cycle is gone, invested assets are rising again for the first time in years, and commodity market performance is up ahead of equities. The price of a barrel of oil tested a low of 26 USD during spring 2016 but has since nearly tripled from that level. Copper traded in excess of 6,000 USD per ton. Gold rose above 1,300 USD per troy ounce. In the agricultural sector, wheat and corn prices averaged 4.80 and 3.60 USD per bushel. From a technical perspective, bottom building was completed in 2016, as commodities went above their 200-day moving average and created a bullish chart pattern in 2017. Nevertheless, even at the start of 2019 the majority of commodities still traded way below their medium- to long-term average prices, and bitcoins are in a phase of bottom-building.
    In hindsight, 2016 proved to be the turning point for commodities, as fundamentals started to improve, prices recovered, and the way was cleared for a new market cycle.
    The 42 chapters of this book show, on the one hand, that commodity market speculation was not invented in this decade. On the contrary, in the 1980s and 1990s commodities had only disappeared from investors’ radar screens, while the 1970s also saw tremendous commodity price spikes. Many of the episodes described here—from the Dutch tulip mania in the 17th century to the fantastic rise and fall of bitcoins in the 21st century—show how dramatically temporary imbalances on the supply or demand side can affect individual commodity markets. The real economic consequences should not be underestimated, as unlike stocks, bonds, or currencies, commodities are real assets. Political unrest and failing governments because of high food prices in Africa, which led to the Arab Spring, or current instabilities in Venezuela and Brazil due to low oil prices, are only two examples.
    Tulips and bitcoins are linked as the two biggest financial bubbles in history, despite nearly 400 years between them. Meanwhile markets and events have given rise to 40 fantastic stories from the commodity world. The wheel of time continues to turn, and due to the cyclical nature of commodity markets, extreme events are doomed to repeat themselves, albeit in a modified form. Each market is determined in its extreme phase by greed and fear; and the short memory of capital markets is proverbial anyway.
    The episodes summarized in this book are meant to highlight the booms and busts of commodity and crypto markets. Besides extreme price fluctuations, this book aims to show an insider’s perspective on speculation, gains, and losses that determine individual fates. The extent and velocity of price spikes are stunning, even for long-term investors. Linking commodity market events over several hundred years demonstrates the parallels among events in the past and prepares us for future developments including blockchain and bitcoins.

    Glossary of Terms

    AddyShort version of “address,” usually meaning your public key or the address of your crypto wallet. A bitcoin address is used to send and receive bitcoin transactions. The address is made up of a sequence of letters and numbers but can also be represented as a QR code.
    AgflationA period of rising food prices caused by increased demand for agricultural commodities, as was seen for both food and biofuels in 2007–2008. The word is a combination of the terms “agriculture” and “inflation.”
    AltcoinAltcoins or coins are alternative cryptocurrencies launched after bitcoins. Today there are more than 4,000 altcoins, which differ from bitcoins in various ways. An example of an altcoin is litecoin.
    Backwardation and ContangoIn finance, the difference between a spot (or cash) price and future prices defines the term structure. Backwardation occurs when the price for future delivery is lower than the spot price (e.g., the price of crude oil delivered in 3 months is 60 USD/barrel and the spot price is 70 USD/barrel). Contango occurs when the price for future delivery is higher than the spot price (e.g., the price of gold delivered in 1 year is 1,400 USD/oz and the spot price is 1,300 USD/oz). Contango is common for financial futures and gold, whereas backwardation is often seen in commodity markets and implies a positive carry for investors.
    BlockchainA blockchain is a growing list of records, called blocks, that are linked using cryptography. Blockchain is a form of Distributed Ledger Technology (DLT), which is a consensus of replicated, shared, and synchronized digital data geographically spread across multiple sites, countries, or institutions. There is no central administrator or centralized data storage.
    Bull and Bear MarketIn finance, the terms bull and bear market describe the general direction of a market. The use of “bull” and “bear” derives from the way the animals attack their opponents. A bull thrusts its horns up into the air, while a bear swipes its paws downward. These actions are metaphors for the movement of a market. If the trend is up, it’s a bull market. If the trend is down, it’s a bear market. A bear market usually is defined when prices drop to 20 percent or more below their recent top, while a smaller price decline is considered to be a correction.
    BTCBitcoin (BTC, or). A cryptocurrency, a form of electronic money, 1 bitcoin is divided into 1,000 millibitcoins and 100,000,000 satoshis. A bitcoin is currently worth about 4,000 USD.
    BTFDAn abbreviation for “Buy The Fucking Dip,” a stock market term to buy stocks or other assets during a price correction.
    Cornering a MarketIn finance, cornering a market consists of obtaining sufficient control of an asset—for example, a stock, currency, or commodity—in an attempt to manipulate the market price. Control usually means to have a dominant share in ownership.
    (Market) CrashA crash in stocks, commodities, or cryptocurrencies is a sudden dramatic decline of prices across a significant cross-section of the market, resulting in a significant loss of paper wealth. Crashes are driven by panic as much as by underlying economic factors. They often follow speculative stock market bubbles.
    CryptocurrencyA cryptocurrency is a digital asset designed to work as a medium of exchange that uses a high level of cryptography to secure financial transactions, control the creation of additional units, and verify the transfer of assets. Cryptocurrencies are an alternative and digital currency, which use decentralized control as opposed to the centralized digital currency and central banking systems of fiat currencies. The most popular cryptocurrency is bitcoin. The most common categorization of cryptocurrencies are alternative cryptocurrency coins (altcoins) and tokens (which are not meant to be a medium of exchange).
    DYORAn abbreviation for “Do Your Own Research.” It is used often in internet forums and blogs as a reminder for readers to do their own research on a subject, rather than take everything they read at face value.
    Fiat CurrencyA “regular” or “normal” currency today, such as the US dollar, euro, or pound sterling. Fiat money is a currency without intrinsic value that has been established as money, often by government regulation, and is backed by the government. (The term fiat comes from the Latin for “let it be done.”) This approach differs from money whose value is underpinned by some physical good such as gold or silver (the “gold standard”) or economic value like some cryptocurrencies.
    FOMO / JOMOAn abbreviation for “Fear of Missing Out.” It is defined as a fear of regret, which may lead to a compulsive concern that one might miss an opportunity for social interaction, a novel experience, a profitable investment, or other satisfying events. FOMO perpetuates the fear of having made the wrong decision. JOMO, on the other hand, describes the “Joy of Missing Out,” the antithesis of FOMO.
    FUDThis describes the spreading of “Fear, Uncertainty, and Doubt,” typically through the media. It’s a disinformation strategy broadly used in politics, public relations, sales, marketing, and investing. Generally, FUD is a strategy to influence perception by disseminating negative or false information and a manifestation of the appeal to fear.
    Gold and SilverGold (symbol AU, from the Latin aurum) and silver (symbol AG, from the Latin argentum) are precious metals that have been used for thousands of years as a measure of value. Since the sixth century BCE, gold and silver have been minted as coins. In the past, a gold or silver standard was often implemented as a base of monetary policy. Officially, the world gold standard was abandoned for a fiat currency system after 1971 (the “Nixon Shock”).
    Gold StandardThe gold standard is a monetary system where a country’s currency or paper money has a value directly linked to gold. (Variations include the silver standard or bimetallic standard.) Most nations abandoned the gold standard as the basis of their monetary systems at some point, although many hold substantial gold reserves. After World War II, a system similar to a gold standard was established by the Bretton Woods Agreements. Under this system, many countries fixed their exchange rates relative to the US dollar, and central banks could exchange dollar holdings into gold at the official exchange rate of 35 USD per ounce. All currencies pegged to the US dollar thereby had a fixed value in terms of gold. In August 1971, President Nixon ended the convertibility of US dollars into gold, which marked the beginning of the fiat currency system of floating exchange rates.
    HODLAn abbreviation for “Hold On for Dear Life.” HODL was originally a typo, originated in a December 2013 post on the Bitcoin Forum during a price crash. It became very popular within the cryptocurrency community as encouragement for holding the cryptocurrency rather than selling it (buy and hold).
    ICOAn Initial Coin Offering (ICO) is a type of funding using cryptocurrencies. In an ICO, a quantity of cryptocurrency is sold in the form of tokens to investors in exchange for legal tender or other cryptocurrencies such as bitcoins or ether. ICOs can be a source of capital for startup companies and can usually avoid regulatory compliance and intermediaries such as venture capitalists, banks, and stock exchanges.
    Long and ShortIn trading, an investor can take two types of positions: long and short. An investor can either buy an asset (going long), or sell it (going short). In a long (buy) position, the investor is hoping for the price to rise. In a short position, the investor hopes for and benefits from a drop in the price of the asset. Entering a short position is a bit more complicated than purchasing the asset.
    MooningIn the cryptocurrency world, mooning refers to an instant surge in pricing in a positive way. If someone says, “the bitcoin is mooning,” it means the price of a bitcoin has surged instantly for a certain time.
    Pump and DumpThis is a form of securities fraud that involves artificially inflating the price of an owned stock through false and misleading positive statements, in order to sell the cheaply purchased stock at a higher price. Once the operators of the scheme dump—that is, sell—their overvalued shares, the price falls and investors lose their money. False or misleading information can be spread by spam email, social media, internet forums, or blogs. The scheme is most common with small cap cryptocurrencies and very small exchange listed corporations, that is, microcaps.
    Rare Earth Metals or Rare Earth ElementsA set of 17 elements, specifically 15 lanthanides as well as scandium and yttrium. These are: cerium, dysprosium, erbium, europium, gadolinium, holmium, lanthanum, lutetium, neodymium, praseodymium, promethium, samarium, scandium, terbium, thulium, ytterbium, and yttrium. A common distinction differentiates between light rare earth elements and heavy rare earth elements. Rare earth elements are used in many high-tech applications, like electric motors of hybrid vehicles, wind turbines, hard disc drives, portable electronics, microphones, and speakers.
    SatsShort for “satoshi,” the smallest fraction of a bitcoin. There are 100,000,000 satoshis in a bitcoin. The term derives from the pseudonym of bitcoin inventor Satoshi Nakamoto. Currently, 10,000 sats are equivalent to 65 US cents.
    Strong and Weak HandsIn finance, strong hands refer to well-financed investors or speculators, typically long-term holders who are unlikely to exit their position based on small market movements. Weak hands refer to the opposite.
    Rogue TraderA trader who makes unauthorized trades, often in the gray area between civil and criminal transgression. A rogue trader may be a legitimate employee of a company yet enter into transactions on behalf of his or her employer without permission.
    Tokens(Crypto) tokens are a digital representation of a particular asset or utility and a category of cryptocurrencies. Tokens can represent basically any asset that is fungible and tradeable, such as property or real estate, commodities, loyalty points, or even other cryptocurrencies.
    USDThe US dollar (USD, or $) is the official currency of the United States of America and its territories. Dollar is also the name of more than 20 currencies, including those of Canada, Australia, and New Zealand. One US dollar is generally divided into 100 US cents.
    WalletIf you want to store bitcoins or any other cryptocurrency, you will need to have a digital wallet. A cryptocurrency wallet is a software program that stores private and public keys and interacts with various blockchains to enable users to send and receive digital currency and monitor their balance. There are various forms of wallets: online, offline, hardware, and paper, all with varying levels of security.
    WhaleThe term “whale” is frequently used to describe a very big player or a very big investor in the market. The ocean is a metaphor for the market, since one can then extend it to include big fish and small fish, sharks, waves as the market moves, and so forth.

    List of Abbreviations

    BMOBank of Montreal
    BTCBitcoin
    CADCanadian Dollar
    CBOTChicago Board of Trade
    CHFConfoederatio Helvetica Franc, or for short, Swiss Franc
    CMEChicago Mercantile Exchange
    ct.Carat
    DOEDepartment of Energy
    EURThe euro is the official currency of 19 of 28 member states of the European Union (EU).
    EVsElectric Vehicle(s)
    FAOFood and Agricultural Organization
    GBPPound Sterling (Great Britain Pound)
    ICEIntercontinental Exchange
    IEAInternational Energy Agency
    kgKilogram
    lbPound
    LIFFELondon International Financial Futures Exchange
    LMELondon Metal Exchange
    LNGLiquefied Natural Gas
    LTCMLong-Term Capital Management
    NOKNorwegian Krona
    NYMEXNew York Mercantile Exchange
    MMBtuMillion British Thermal Units
    OECDOrganisation for Economic Co-operation and Development
    OPECOrganization of the Petroleum Exporting Countries
    ozTroy Ounce
    RBCRoyal Bank of Canada
    USDUS Dollar
    USDAUS Department of Agriculture
    WTIWest Texas Intermediate (crude oil)

    List of Figures

      Figure 1.Rice. Candlestick chart in USD/cwt 2016, Chicago Board of Trade (CBOT). Data: Bloomberg, 2019.
      Figure 2.Crude oil prices 1861–2018, in USD/barrel (real prices of 2015). Data: BP Statistical Review of Energy, 2019.
      Figure 3.Prices for soybean oil, 1960–1964, in US cents/lb, Chicago Board of Trade. Data: Bloomberg, 2019.
      Figure 4.Wheat prices, 1970–1977, in US cents/bushel, Chicago Board of Trade. Data: Bloomberg, 2019.
      Figure 5.Gold-silver ratio, 1973–2013. Data: Bloomberg, 2019.
      Figure 6.Crude oil prices, 1965–1986, in USD/barrel. Data: Datastream, 2019.
      Figure 7.Diamond prices, 2003–2016. Prices indexed over different sizes and qualities. Data: PolishedPrices.com, Bloomberg, 2019.
      Figure 8.Silver prices, 1970–1982, in USD/troy ounce. Data: Bloomberg, 2019.
      Figure 9.Crude oil prices, 1989–1991, in USD/barrel. Data: Bloomberg, 2019.
    Figure 10.Crude oil future term structure in 1993/1994, in USD/barrel. Data: Bloomberg, 2019.
    Figure 11.Silver prices, 1994–2008, in USD/troy ounce. Data: Bloomberg, 2019.
    Figure 12.Silver, Pan American Silver, and Apex Silver, 1998–2009. Performance indexed 1998. Data: Bloomberg, 2019.
    Figure 13.Copper in US cents/lb, 1995–1997. Data: Bloomberg, 2019.
    Figure 14.Share price of Bre-X, 1992–1997, in Canadian dollars (CAD). Data: Bloomberg, 2019.
    Figure 15.Palladium in USD/ounce, 1998–2004. Data: Bloomberg, 2019.
    Figure 16.Copper prices in USD/ton, 2003–2007, London Metal Exchange (LME). Data: Bloomberg, 2019.
    Figure 17.Zinc prices in USD/ton, 2003–2006, London Metal Exchange (LME). Data: Bloomberg, 2019.
    Figure 18.Natural gas prices in USD/MMBtu, 2003–2007, New York Mercantile Exchange. Data: Bloomberg, 2019.
    Figure 19.Price spread between natural gas March and April 2007 delivery, in USD/MMBtu, New York Mercantile Exchange. Data: Bloomberg, 2019.
    Figure 20.Future term structure of natural gas in USD/MMBtu, 2010, New York Mercantile Exchange. Data: Bloomberg, 2019.
    Figure 21.Frozen orange juice concentrate prices in US cents/lb, 2002–2006.Data: Bloomberg, 2019.
    Figure 22.Norwegian salmon prices in NOK/kg, 2000–2011. Data: Bloomberg, 2019.
    Figure 23.Steel prices in USD/ton, 2000–2010. Data: Bloomberg, 2019.
    Figure 24.Wheat prices in US cents/bushel, 2005–2008, Chicago Board of Trade. Data: Bloomberg, 2019.
    Figure 25.Natural gas prices in USD/MMBtu, 2003–2007, New York Mercantile Exchange. Data: Bloomberg, 2019.
    Figure 26.Platinum prices in USD/troy ounce, 2004–2009. Data: Bloomberg, 2019.
    Figure 27.Rice prices in US cents/cwt, 2000–2010, Chicago Board of Trade. Data: Bloomberg, 2019.
    Figure 28.Wheat prices in US cents/bushel, 2007–2008, Chicago Board of Trade. Data: Bloomberg, 2019.
    Figure 29.Crude oil (WTI) term structure in USD/barrel, 2008. Data: Bloomberg, 2019.
    Figure 30.Price spread of crude oil January (CLF9) and December 2009 (CLZ9) in USD/barrel. Data: Bloomberg, 2019.
    Figure 31.Baltic Dirty Tanker Index, 2002–2010. Data: Bloomberg, 2019.
    Figure 32.Sugar prices in US cents/lb, 1970–2010. Data: Bloomberg, 2019.
    Figure 33.Cocoa prices in USD/ton, 1990–2012. Data: Bloomberg, 2019.
    Figure 34.Copper and share price of First Quantum Minerals, 2009–2010. Data: Bloomberg, 2019.
    Figure 35.BP share price fluctuation during first half of 2010. Data: Bloomberg, 2019.
    Figure 36.Cotton prices in US cents/lb, 2005–2013. Data: Bloomberg, 2019.
    Figure 37.Glencore (GBP). Equity price performance since IPO on May 19, 2011. Data: Bloomberg, 2019.
    Figure 38.Rare earth carbonate, neodymium, dysprosium, and lanthanum, 2010–2013. Chinese onshore prices in RMB, indexed 30.12.2009=100. Data: Bloomberg, 2019.
    Figure 39.Crude oil (WTI): recovery and bear market, 2008–2016. Data: Bloomberg, 2019.
    Figure 40.Commodity performance in 2016. Data: Bloomberg, 2019.
    Figure 41.Cobalt prices, 2012–2018. Data: Bloomberg, 2019.
    Figure 42.Benchmark Lithium Index, 2012–2018. Data: Benchmark Mineral Intelligence, 2019.
    Figure 43.Price of bitcoins surpassed 1,000, 5,000, 10,000, and finally 20,000 per USD in 2017. Data: Bloomberg, 2019.
    Figure 44.Historic bitcoin price corrections, 2013–2017. Data: Coindesk.com.
    Figure 45.50 years of commodity markets ups and downs. Did we see the beginning of a new bullish cycle in 2016? Data: Bloomberg, 2019.
    Figure 46.Relative valuation of commodities versus equities. Buy commodities! Data: Bloomberg, 2019.

    References

    1.Tulip Mania: The Biggest Bubble in History (1637)

    Dash, M. Tulpenwahn. Die verrückteste Spekulation der Geschichte. München: Claasen Verlag, 1999.

    Friedmann, J. “Tulpen-Wahn in Holland—Wie die große Gartenhure Investoren verrückt machte.” www.spiegel.de, 1 August 2009.

    von Petersdorff, W. “Eine Blumenzwiebel für 87.000 Euro.” www.faz.net, 18 March 2008.

    2.The Dojima Rice Market and the “God of Markets” (1750)

    Mattheis, P. “Der Reishändler.” SZ-Serie: Die großen Spekulanten 39. www.sueddeutsche.de, 28 October 2008.

    Needham, J. “Samurai trader!” www.financialsense.com, 20 January 2008.

    3.The California Gold Rush (1849)

    Bojanowski, A. “Neuer Goldrausch in Kalifornien—‘Es ist wie 1849.’” www.sueddeutsche.de, 17 June 2008.

    “Going to California—49ers and the Gold Rush.” http://americanhistory.about.com, 2008.

    “Gold Rush.” The California State Library, www.library.ca.gov/goldrush, 2007.

    4.Wheat: Old Hutch Makes a Killing (1866)

    “B. P. Hutchinson dead—once leading grain speculator in this country.” The New York Times, 17 March 1899.

    Ferris, W. G. The Grain Traders. The Story of the Chicago Board of Trade. East Lansing: Michigan State University Press, 1988.

    Geisst, Charles. Wheels of fortune—The history of speculation to respectability. Hoboken, NJ: John Wiley & Sons, 2002.

    “The great speculator fails—Mr. Hutchinson leaves Chicago and his trades closed out.” The New York Times, 30 April 1891.

    Teweles, R. J., and Jones, F. J. The Futures Game—Who Wins? Who Loses? And Why? New York: McGraw-Hill, 1987.

    5.Rockefeller and Standard Oil (1870)

    King, B. W. “John D. Rockefeller und das Zeitalter des Öls.” http://finanzen.coart.de/BrsenKnowHow/Geschichtliches, 18 August 2006.

    Kunz, M. “Reichster und meistgehasster Mann der Welt.” www.focus.de, 23 May 2008.

    6.Wheat: The Great Chicago Fire (1872)

    Ferris, W. G. The Grain Traders: The Story of the Chicago Board of Trade. East Lansing: Michigan State University Press, 1988.

    Geisst, C. Wheels of fortune—The history of speculation to respectability. Hoboken, NJ: John Wiley & Sons, 2002.

    “The wheat corner—sudden collapse of the grain gamblers’ schemes in Chicago loss of the clique over USD 1,000,000.” The New York Times, 23 August 1872.

    7.Crude Oil: Ari Onassis’s Midas Touch (1956)

    “Aristoteles Onassis—Reicher Mann ganz arm.” www.stern.de, 13 January 2006.

    “Kalkuliertes Risiko.” Der Spiegel 29(1978), www.spiegel.de.

    Seebach, W. “König Saud und Aristoteles Onassis.” Die Zeitwww.zeit.de, 17 June 1954.

    8.Soybeans: Hide and Seek in New Jersey (1963)

    Food and Agriculture Organization of the United Nations (FAO), www.fao.org, December 2008.

    “The man who fooled everybody.” www.time.com, 4 June 1963.

    Miller, N. C. The Great Salad Oil Swindle. Baltimore: Penguin Books, 1965.

    “Wall Street: spreading the losses.” www.time.com, 6 December 1963.

    9.Wheat: The Russian Bear Is Hungry (1972)

    “Another Soviet grain sting.” www.time.com, 28 November 1977.

    The Food and Agriculture Organization of the United Nations (FAO), www.fao. org, December 2008.

    Mattheis, P. “Der Turtle-Chef.” SZ-Serie: Die großen Spekulanten (33), www.sueddeutsche.de, 29 January 2008.

    Peters, M., Langley, S., and Westcott, P. “Agricultural commodity price spikes in the 1970s and 1990s.” United States Department of Agriculture (USDA), March 2009, www.ers.usda.gov.

    10.The End of the Gold Standard (1973)

    Schulte, T. “Silber—das bessere Gold.” Kopp Verlag, 2010.

    “Die Silber-Panik” (1893). http://zeitenwende.ch.

    “US-Bundesstaaten wollen einen Gold- und Silberstandard.” www.bullion-investor.net, 7 March 2010.

    11.1970s—Oil Crisis! (1973 & 1979)

    “Die Ölkrise 1973.” http://zeitenwende.ch, 2009.

    Organization of the Petroleum Exporting Countries (OPEC), www.opec.org, 2008.

    US Department of Energy, www.eia.doe.gov, 2008.

    12.Diamonds: The Crash of the World’s Hardest Currency (1979)

    Grill, B. “Herr der Diamanten.” www.zeit.de, 2 October 2003.

    “Im Griff des Syndikats.” Der Spiegel 44 (1989), www.spiegel.de.

    Kühner, C. “A diamond’s best friend—Antwerpen, Weltzentrum des Diamantenhandels.” NZZ Folio, December 1993.

    Schulz, B. “Nicholas Oppenheimer—Der Diamantenkönig.” www.faz.net, 22 October 2006.

    13.“Silver Thursday” and the Downfall of the Hunt Brothers (1980)

    Boehringer, S. “Aufstieg mit Öl, Absturz mit Silber.” SZ-Serie: Die großen Spekulanten 17, www.sueddeutsche.de, 14 May 2008.

    “Die Gebrüder Hunt verzocken sich am Silbermarkt.” www.faz.net, 26 February 2004.

    14.Crude Oil: No Blood for Oil? (1990)

    “Fünf Jahre Irak-Krieg—Chronik eines umstrittenen Feldzugs.” www.spiegel.de, 17 March 2008.

    “Der Golfkrieg 1991.” www.faz.net, 24 February 2001.

    Pollack, K. “Der gefährlichste Mann der Welt.” Der Spiegel 6 (2003), www.spiegel.de.

    Pollack, K. The Threatening Storm—The Case for Invading Iraq. New York: Random House, 2002.

    Thumann, M. “Trotz Blut kein Öl.” www.zeit.de, 16 June 2009.

    15.The Doom of German Metallgesellschaft (1993)

    Knipp, T. Der Machtkampf. Der Fall Metallgesellschaft und die Deutsche Bank. Düsseldorf: Econ Verlag, 1998.

    Landler, M. “Spotlight: Heinz Schimmelbusch’s comeback.” www.nytimes.com, 10 August 2007.

    ”Metallgesellschaft reports talks with ex-chief fail.” New York Times, 5 April 1996.

    “Missmanagement bei Metallgesellschaft.” www.manager-magazin.de, 28 August 2001.

    16.Silver: Three Wise Kings (1994)

    Chasan, E. “Apex Silver Mines files for bankruptcy protection.” www.reuters.com, 14 January 2009.

    Fuerbringer, J. “Buffett likes silver; Soros, a silver mine.” www.nytimes.com, 26 March 1998.

    Morgenson, G. “Gates putting some money in silver miner.” www.nytimes.com, 29 September 1999.

    The Silver Institute, www.silverinstitute.org.

    Weitzman, H. “Morales pledges to nationalize mining industry in Bolivia.” www.ft.com, 9 May 2006.

    17.Copper: “Mr. Five Percent” Moves the Market (1996)

    Bastian, N. “Kupferfinger sucht einen neuen Job.” www.handelsblatt.com, 12 December 2005.

    www.kupferinstitut.de.

    Neidhart, C. “Hamanaka—der Vorstadt-Spießer.” SZ-Serie: Die großen Spekulanten 2. www.sueddeutsche.de, 29 January 2008.

    18.Gold: Welcome to the Jungle (1997)

    Behar, R. “Jungle Fever.” Fortune, 9 June 1997.

    BHP Billiton, Minerals Companion, 2006

    “Goldenes Grab.” Der Spiegel 16 (1997), www.spiegel.de.

    Goold, D., and Willis, A. The Bre-X Fraud. Toronto: McClelland & Stewart, 1997.

    19.Palladium: More Expensive Than Gold (2001)

    Frank, R. “Eine Seltenheit: Palladium-Münzen.” www.moneytrend.at, January 2001.

    United Nations Conference on Trade and Development (UNCTAD), Market Information in the Commodities Area (InfoComm), www.unctad.org/infocomm.

    Wolf, C. “Palladium—Rasante Rekordjagd.” www.focus.de, 18 January 2001.

    20.Copper: Liu Qibing Disappears Without a Trace (2005)

    “Bad bets in the copper market.” www.economist.com, 18 November 2005.

    Busch, A. “China treibt den Kupferpreis von allen Seiten in die Höhe.” www.handelsblatt.com, 12 December 2005.

    Hoffbauer, A. “Die diskreten Kontrakte des Herrn Liu.” www.handelsblatt.com, 12 December 2005.

    Mortished, C. “City gripped by mystery of the phantom copper dealer.” The Times, 15 November 2005.

    Powell, B. “Buy! Sell! Run!” www.time.com, 20 November 2005.

    21.Zinc: Flotsam and Jetsam (2005)

    BHP Billiton, Minerals Companion, 2006.

    International Lead and Zinc Study Group, www.ilzsg.org, 2009.

    London Metal Exchange, www.lme.co.uk, 2009.

    “A user guide to commodities.” Deutsche Bank, September 2008.

    “Zinc in New Orleans flooded warehouses.” Reed Business Information, 2009.

    “Zinc price soars after New Orleans supply freeze.” www.telegraph.co.uk, 7 September 2005.

    “Zinc under supply tightness.” Metalworld, September 2005.

    22.Natural Gas: Brian Hunter and the Downfall of Amaranth (2006)

    “Amaranth trading led to MotherRock loss.” Bloomberg, 25 June 2007.

    Energy Information Administration, www.eia.doe.gov, 2009.

    “Hedge-Fonds hat angeblich fünf Milliarden Dollar verwettet.” www.handelsblatt. com, 19 September 2006.

    “Hedge-Fonds MotherRock schließt.” www.handelsblatt.com, 7 August 2006.

    “In sieben Tagen 4,5 Milliarden Dollar Verlust.” www.manager-magazin.de, 19 September 2006.

    “Milliardenverlust von Hedge-Fonds läßt Märkte kalt.” www.fazfinance.net, 20 September 2006.

    US Department of Energy, www.energy.gov, 2009.

    Copeland, R. “Ten years after blowup, Amaranth investors waiting to get money back.” Wall Street Journalwww.wsj.com/articles/ten-years-after-blowup-amaranth-investors-still-waiting-for-money-back-1451524482, 1 January 2016.

    23.Orange Juice: Collateral Damage (2006)

    “Orange juice falls.” The New York Times, 22 January 2004.

    “Orange juice rises.” The New York Times, 14 August 2004.

    www.flcitrusmutual.com.

    www.nws.noaa.gov.

    US Department of Agriculture (USDA). Situation and Outlook for Orange Juice. www.fas.usda.gov, February 2006.

    24.John Fredriksen: The Sea Wolf (2006)

    Bomsdorf, B. “John Fredriksen—Milliardär und Tankerkönig.” www.welt.de/wirtschaft/article1799093/John-Fredriksen-Milliardaer-und-Tankerkoenig.html, 14 March 2008.

    “Kathrine und Cecilie Astrup Fredriksen Schnappen sich diese schönen Milliardärs-Töchter TUI?” www.bild.de/politik/wirtschaft/kaufen-diese-schoenen-milliardaers-toechter-tui-11713918.bild.html, 2 July 2010.

    “Lachsfieber: Brisante Recherchen über einen Nahrungsmittelgiganten.” www.ardmediathek.de.

    OECD-FAO: Agricultural Outlook 2011–2012. www.fao.org.

    25.Lakshmi Mittal: Feel the Steel (2006)

    Feel the Steel is the logo of Pittsburgh Steelers (www.steelers.com).

    “Arcelor und Mittal. Stahl-Giganten einigen sich auf Fusion.” www.spiegel.de/wirtschaft/arcelor-und-mittal-stahl-giganten-einigen-sich-auf-fusion-a-423475.html, 25 June 2006.

    “Der größte Stahlproduzent der Welt entsteht.” http://www.faz.net/aktuell/wirtschaft/rohstoffe-der-groesste-stahlproduzent-der-welt-entsteht-1192255.html, 25 October 2004.

    James, J. “Steel’s new spring.” Time magazine, www.time.com, 31 October 2004.

    Kanter, J., Timmons, H., and Giridharadas, A. “Arcelor agrees to Mittal takeover.” www.nytimes.com/2006/06/25/business/worldbusiness/25iht-steel.html, 25 June 2006.

    Kroder, T. “Lakshmi Mittal: Der Stahlbaron aus Indien.” www.ftd.de, 25 October 2004.

    www.arcelormittal.com.

    “Lakshmi Mittal ‘Stahl-Maharadscha’ mit Familiensinn.” www.stern.de/wirtschaft/news/lakshmi-mittal–stahl-maharadscha–mit-familiensinn-3498140.html, 27 January 2006.

    “Mittal/Arcelor Fusion perfekt.” http://www.manager-magazin.de/unternehmen/artikel/a-428605.html, 26 July 2006.

    Zitzelsberger, G. “Fusion der Stahlgiganten. Ein moderner Maharadscha.” www.sueddeutsche.de/wirtschaft/fusion-der-stahlgiganten-ein-moderner-maharadscha-1.819924, 5 December 2008.

    26.Crude Oil: The Return of the “Seven Sisters” (2007)

    Hoyos, C. “The evolution of the Seven Sisters.” www.ft.com/content/2103f4da-cd8e-11db-839d-000b5df10621, 11 March 2007.

    Hoyos, C. “The new Seven Sisters: oil and gas giants dwarf western rivals.” www.ft.com/content/471ae1b8-d001-11db-94cb-000b5df10621, 12 March 2007.

    “Petro-China—Das teuerste Unternehmen der Welt.” www.faz.net, 5 November 2007.

    “The Seven Sisters still rule.” www.time.com, 9 September 1978.

    Vardy, N. “The new Seven Sisters: today’s most powerful energy companies.” https://seekingalpha.com/article/30922-the-new-seven-sisters-todays-most-powerful-energy-companies, 28 March 2007.

    27.Wheat and the “Millennium Drought” in Australia (2007)

    “Dried up, washed out, fed up.” The Economist, 4 October 2007.

    “Dramatische Dürre.” www.spiegel.de, 20 April 2007.

    “Dürre in Australien.” www.faz.net, 10 November 2006.

    “Dürre in Australien.” www.stern.de, 2 January 2007.

    “Dürre treibt Bauern in den Selbstmord.” www.stern.de, 24 October 2006.

    “Extremwetter—Jahrtausend-Dürre in Australien.” www.spiegel.de, 7 November 2006.

    International Grains Council (IGC), www.igc.org.uk, 2009.

    “Der Weizenpreis läuft von Rekord zu Rekord.” www.faz.net, 26 February 2008.

    28.Natural Gas: Aftermath in Canada (2007)

    “BMO Financial hikes commodity-trading loss view.” Reuters, May 2007.

    “BMO says commodity-trading losses to dent profit.” Reuters, April 2007.

    “Ex-BMO trader gets fine.” www.thestar.com, 7 November 2009.

    “How did BMO’s USD450M loss just materialize?” Financial Post, April 2007.

    29.Platinum: All Lights Out in South Africa (2008)

    Cotterill, J. “S Africa power monopoly too big to fail.” Financial Times, 6 February 2019.

    “Eskom says SA needs ‘at least’ 40 new coal mines.” www.mg.co.za, 8 August 2009.

    Johnson Matthey, www.matthey.com, 2009.

    London Platinum and Palladium Market, www.lppm.org.uk, 2009.

    “Stromausfall in Südafrika erreicht Rohstoffmärkte.” www.fazfinance.net, 25 January 2008.

    30.Rice: The Oracle (2008)

    Müller, O. “Angst vor Hungersnot—Hoher Reispreis macht Asien nervös.” www.handelsblatt.com, 9 April 2008.

    “USA rechnen mit mehr als 100.000 Toten.” www.focus.de, 7 May 2008.

    31.Wheat: Working in Memphis (2008)

    “Rohstoffmärkte sind spekulativ überhitzt.” www.faz.net, 6 March 2008.

    “Rogue trader rocks firm—Huge wheat futures loss stuns MF Global.” www.chicagotribune.com, 29 February 2008.

    32.Crude Oil: Contango in Texas (2009)

    Baskin, B. “Oil stored at sea washes out rallies.” http://online.wsj.com, 5 February 2009.

    Bayer, T. “‘Super-Contango’—Unternehmen bunkern Öl.” www.ftd.de, 8 December 2008.

    Hecking, C., and Bayer, T. “Abgeschmiert in der Prärie.” www.ftd.de, 19 January 2009.

    33.Sugar: Waiting for the Monsoon (2010)

    Abraham, T. K. “World sugar shortage to extend a third year.” Bloomberg, 29 January 2010.

    Hein, C. “Indien betet für einen stärkeren Monsun.” www.faz.net, 12 August 2009.

    Kazim, H. “Dürre bedroht Indiens Wirtschaft.” www.spiegel.de, 18 August 2009.

    Lembke, J. “Der Zuckerpreis ist kaum zu stoppen.” www.faz.net, 7 August 2009.

    Mai, C. “Zuckerpreis erreicht 25-Jahres-Hoch.” www.ftd.de, 3 August 2009.

    Merkel, W. “In Indien und Australien wird die Dürre noch größer.” www.welt.de, 24 September 2009.

    Stern, N. “Ernteausfälle in Indien treiben Zuckerpreis.” http://diepresse.com, 16 August 2009.

    34.Chocolate Finger (2010)

    “Kakao als Spielball der Spekulation.” www.faz.net, 20 July 2010.

    Marron, D. “The cocoa corner: Is Choc Finger down USD 150 million?” http://seekingalpha.com, 26 July 2010.

    Murugan, S. “What’s driving cocoa?” http://seekingalpha.com, 4 August 2010.

    “Sweet dreams. A hedge fund bets big on chocolate.” www.economist.com/finance-and-economics/2010/08/05/sweet-dreams, 7–13 August 2010.

    Werdigier, J., and Creswell, J. “Trader’s cocoa binge wraps up chocolate market.” www.nytimes.com, 24 July 2010.

    35.Copper: King of the Congo (2010)

    “Congo—Africa’s disaster.” www.independent.co.uk/voices/editorials/leading-article-congo-africas-disaster-2013789.html, 30 June 2010. “Kongo will mehr von eigenen Rohstoffen profitieren.” www.gtai.de, 24 June 2010.

    MacNamara, W., and Johnson, M. “Disquiet over ENRC’s purchase of Congo assets.” www.ft.com/content/19fe6f94-b791-11df-8ef6-00144feabdc0, 3 September 2010.

    MacNamara, W., and Thompson, C. “Congo seizes First Quantum Minerals’ assets.” www.ft.com/content/27d6e104-b530-11df-9af8-00144feabdc0, 31 August 2010.

    Thompson, C., and MacNamara, W. “ENRC buys into disputed Congo project.” www.ft.com/content/870a8b2a-acda-11df-8582-00144feabdc0, 21 August 2010.

    36.Crude Oil: Deep Water Horizon and the Spill (2010)

    “780 Millionen Liter—die bisher größte Ölpest aller Zeiten.” www.zeit.de/wissen/umwelt/2010-08/bp-oelloch-leck-verzoegerung, 3 August 2010.

    Bethge, P., and Meyer, C. “Die Alptraum-Bohrung.” www.spiegel.de/spiegel/a-713063.html, 23 August 2010.

    “Ölkatastrophe im Golf von Mexiko Alarm auf Bohrinsel war offenbar abgeschaltet.” www.spiegel.de/wissenschaft/natur/oelkatastrophe-im-golf-von-mexiko-alarm-auf-bohrinsel-war-offenbar-abgeschaltet-a-708247.html, 24 July 2010.

    “Ölpest im Golf von MexikoAuch BP macht die Katastrophe jetzt Angst.” www.stern.de/panorama/wissen/natur/oelpest-im-golf-von-mexiko-auch-bp-macht-die-katastrophe-jetzt-angst-3284936.html, 30 May 2010.

    “Ölpest im Golf von Mexiko BP-Experten durchtrennen leckendes Öl-Rohr.” www.spiegel.de/wissenschaft/natur/oelpest-im-golf-von-mexiko-bp-experten-durchtrennen-leckendes-oel-rohr-a-698597.html, 3 June 2010.

    “‘Static Kill’ erfolgreich. BP stopft Öl-Bohrloch.” www.stern.de/panorama/wissen/natur/-static-kill–erfolgreich-bp-stopft-oel-bohrloch-3537142.html, 4 August 2010.

    37.Cotton: White Gold (2011)

    Cancryn, A., and Cui, C. “Flashback to 1870 as cotton hits peak.” www.wsj.com/articles/SB10001424052748704300604575554210569885910, 16 October 2010.

    Cui, C. “Chinese take a cotton to hoarding.” www.wsj.com/articles/SB10001424052748704680604576110423777349298, 29 January 2011.

    Industrievereinigung Chemiefaser e.V. (IVC), www.ivc-ev.de.

    National Cotton Council of America, www.cotton.org.

    Pitzke, M. “Preisexplosion bei Baumwolle Das Ende der Billig-Jeans.” http://www.spiegel.de/wirtschaft/unternehmen/preisexplosion-bei-baumwolle-das-ende-der-billig-jeans-a-696579.html, 25 May 2010.

    United States Department of Agriculture, www.usda.gov.

    White, G. “Cotton price causes ‘panic buying’ as nears 150-year high.” www.telegraph.co.uk/finance/markets/8301886/Cotton-price-causes-panic-buying-as-nears-150-year-high.html, 4 February 2011.

    Wollenschlaeger, U. “Baumwolle: Auf Rekordpreise folgt Rekordproduktion.” www.textilwirtschaft.de/business/unternehmen/Baumwolle-Auf-Rekordpreise-folgt-Rekordproduktion-69081?crefresh=1, 9 March 2011.

    38.Glencore: A Giant Steps into the Light (2011)

    Ammann, D. “King of Oil.” Orell Füssli Verlag, Zurich, 2010.

    Ammann, D. “Marc Rich: Der mann, der seinen Namen verlor.” www.weltwoche.ch, 23 May 2007.

    Honigsbaum, M. “The Rich list.” In The Observerwww.guardian.co.uk, 13 May 2001.

    “Rohstoffhändler Marc Rich gestorben.” www.srf.ch/news/wirtschaft/rohstoffhaendler-marc-rich-gestorben, 27 June 2013.

    Schärer, A. “Die Erben des Marc Rich.” www.woz.ch, 13 December 2001.

    “Warum Marc Rich bei Madoff rechtzeitig ausstieg.” www.tagesanzeiger.ch/wirtschaft/unternehmen-und-konjunktur/Warum-Marc-Rich-bei-Madoff-rechtzeitig-ausstieg/story/30815433, 27 January 2011.

    39.Rare Earth Mania: Neodymium, Dysprosium, and Lanthanum (2011)

    Quote from: J. Perkowski, Behind China’s Rare Earth Controversyhttp://www.forbes.com/sites/jackperkowski/2012/06/21/behind-chinas-rare-earth-controversy/#e5aaecd16b82, 21 June 2012.

    Blank, G. “Wichtiger Rohstoff Seltene Erden. Knappheit made in China.” www.stern.de/digital/computer/wichtiger-rohstoff-seltene-erden-knappheit-made-in-china-3874186.html, 29 December 2010.

    “Chinas schwere Hand auf den seltenen Erden.” www.nzz.ch/chinas_schwere_hand_auf_den_seltenen_erden-1.8096711, 22 October 2010.

    Geinitz, C. “Streit mit China um seltene Erden spitzt sich zu.” www.faz.net/aktuell/wirtschaft/rohstoffe-streit-mit-china-um-seltene-erden-spitzt-sich-zu-13091.html, 25 October 2010.

    Jung, A. “Rohstoffe. Wettlauf der Trüffelschweine,” www.spiegel.de/spiegel/print/d-75159727.html, 15 November 2010.

    Liedtke, M., and Elsner, H. “Seltene Erden,” Bundesanstalt für Geowissenschaften und Rohstoffe.” www.bgr.bund.de, 20 November 2009.

    Lohmann, D. “Kampf um Seltene Erden. Hightech-Rohstoffe als Mangelware.” www.scinexx.de/dossier-540-1.html, 13 May 2011.

    Mayer-Kuckuk, F. “Strategische Metalle China verknappt Molybdän-Förderung.” www.handelsblatt.com/finanzen/maerkte/devisen-rohstoffe/strategische-metalle-china-verknappt-molybdaen-foerderung/3579078.html?ticket=ST-1201086-huIl3W7cP5RSMLdwDNFj-ap3, 1 November 2010.

    40.The End? Crude Oil Down the Drain (2016)

    Cunningham, N. “OPEC: the oil glut is gone.” https://oilprice.com/Energy/Crude-Oil/OPEC-The-Oil-Glut-Is-Gone.html, 14 May 2018.

    Cunningham, N. “The world is not running out of storage space for oil.” https://oilprice.com/Energy/Energy-General/The-World-Is-Not-Running-Out-Of-Storage-Space-For-Oil.html, 21 January 2016.

    Dennin, T. “The dawn of a new cycle in commodities.” Research Paper, Tiberius Asset Management AG, April 2016.

    EIA. “Crude oil prices to remain relatively low through 2016 and 2017.” www.eia.gov/todayinenergy/detail.php?id=24532, 13 January 2016.

    El Gamal, R., Lawler, A., and Ghaddar, A. “OPEC in first joint oil cut with Russia since 2001,” Saudis take ‘big hit.’” www.reuters.com/article/us-opec-meeting-idUSKBN13P0JA, 30 November 2016.

    Raval, A. “‘Oil market glut will persist through 2016,’ says IEA.” www.ft.com/content/e27ff724-717e-11e5-9b9e-690fdae72044, 13 October 2015.

    Shenk, M. “WTI crude falls to 12-year low at $26.14 per barrel.” www.bloomberg.com/news/articles/2016-02-10/oil-holds-losses-near-3-week-low-amid-record-cushing-supplies, 11 February 2016.

    41.Electrification: The Evolution of Battery Metals (2017)

    Autoverkäufe 2017. “Mercedes fährt BMW und Audi davon.” cwww.abendblatt.de/wirtschaft/article213089441/BMW-verkauft-so-viele-Autos-wie-nie.html, 12 January 2018.

    BNEF New Energy Outlook, https://about.bnef.com/new-energy-outlook, 16 August 2018.

    Hull, D., and Recht, H. “Tesla doesn’t burn fuel, it burns cash.” www.bloomberg.com/graphics/2018-tesla-burns-cash, 3 May 2018.

    Kraftfahrtbundesamt, www.kba.de.

    42.Crypto Craze: Bitcoins and the Emergence of Cryptocurrencies (2018)

    Akolkar, B. “China officially bans all crypto-related commercial activities.” 22 August 2018, https://bitcoinist.com/china-officially-bans-crypto-activities/.

    “Comparing 25 of the biggest cryptocurrencies.” World Economic Forum, March 2018, www.weforum.org/agenda/2018/03/comparing-the-25-most-notable-cryptocurrencies.

    “Cryptoprimer.” www.investopedia.com/tech/crypto-primer-currencies-commodities-tokens/#ixzz5HfVcEWBS.

    Kharif, O. “The bitcoin whales: 1,000 people who own 40 percent of the market.” https://www.bloomberg.com/news/articles/2017-12-08/the-bitcoin-whales-1-000-people-who-own-40-percent-of-the-market, 8 December 2017.

    Kharpal, A. (2017): “Founders of a cryptocurrency backed by Floyd Mayweather charged with fraud by SEC.” www.cnbc.com, 3 April 2017.

    Lee, J. “Mystery of the $2 billion bitcoin whale that fueled a selloff.” https://www.bloomberg.com/news/articles/2018-09-13/mystery-of-the-2-billion-bitcoin-whale-that-fueled-a-selloff, 13 September 2018.

    Meyer, D. “China enlists its ‘great firewall’ to block bitcoin websites.” http://fortune.com/2018/02/05/bitcoin-china-website-ico-block-ban-firewall/, 5 February 2018.

    Paul, A. “It’s 1994 In cryptocurrency.” www.forbes.com/sites/apaul/2017/11/27/its-1994-in-cryptocurrency/#7a81d58eb28a, 27 November 20017.

    Potter, S., and White, T. “No end in sight for crypto sell-off as bitcoin breaches $4,250.” www.bloomberg.com/news/articles/2018-11-20/no-end-in-sight-for-crypto-sell-off-as-tokens-take-fresh-hit.

    Shiller, R. “Irrational exuberance.” Crown Business, 9 May 2006.

  • Torsten Dennin《From Tulips to Bitcoins_ A History of Fortunes Made and Lost in Commodity Markets》16-30

    16 Silver: Three Wise Kings 1994

    Warren Buffett, Bill Gates, and George Soros show their interest in the silver market in the 1990s—investing in Apex Silver Mines, Pan American Silver, and physical silver. It is silver versus silver mining. Who would lead and who would lag?

    “The financial markets generally are unpredictable.” —George Soros

    At the beginning of May 2006, Bolivia’s leftist president Evo Morales practiced a little saber rattling as he threatened to nationalize the country’s domestic mining industry. A lot of silver was at stake, given Bolivia’s two important mines, San Cristóbal (part of Apex Silver Mines) and San Bartolomé (Coeur d’Alene Mines). (Morales had already implemented nationalization of the natural gas industry a week earlier.) In reaction, the stock prices of Apex Silver fell dramatically. From a price of 26 USD in April, the stock plunged to below 13 USD by June. It was a demonstration of how risky investments in mineral resources can be because of politics.

    Some Facts About Silver

    Silver is about 20 times more common than gold, with the most significant deposits found in North and South America. According to industry figures, there are only 25 relevant silver mines worldwide, and half of their sales are generated by precious metal production. The overwhelming share of global silver production is coupled to the extraction of other metals, especially lead, zinc, copper, or gold. According to the Silver Institute, industrial applications account for about 50 percent of total demand, followed by jewelry and photography.
    For standardized silver trading on commodity exchanges, the ticker XAG stands for the price of a troy ounce of silver in USD. The center of physical silver trade is the London Bullion Market, and the London Bullion Market Association (LBMA) fixes an official price once a day. COMEX, part of the New York Mercantile Exchange, is the largest trading place for futures and options on silver. There silver futures are traded under the symbol SI, followed by the contract month and year (e.g., SIH0, Silver March 2020 Futures).
    It’s not always clear, however, where the best investments lie. In the mid- and late 1990s, Warren Buffett, George Soros, and Bill Gates all entered the silver market as major professional investors, and their actions attracted attention within the international financial community. Like the three kings in the Bible, these men inspired private and institutional investors to follow their lead. However, though Soros, Buffett, and Gates all invested in silver, they used different instruments—physical silver and equity investments in silver-mining companies.

    Figure 11. Silver prices, 1994–2008, in USD/troy ounce. Data: Bloomberg, 2019.

    George Soros, born in Hungary in 1930, is known for the success of his Quantum Fund—a hedge fund founded by him and Jim Rogers—and for his bets in 1992 against the pound sterling, which forced the Bank of England to depreciate its currency. Today his net worth is estimated by Forbes to be around 14 billion USD. At the end of 1994, Soros invested in Apex Silver Mines and, together with his brother Paul, temporarily held more than 20 percent of the company. Founded in 1993, Apex owned 65 percent of San Cristóbal, a silver-zinc-lead mine in southwestern Bolivia that was estimated to contain 450 million ounces of silver. Apex also was active in Argentina, Bolivia, Mexico, and Peru.
    Warren Buffett, also born in 1930, is the third-richest man in the world, with an estimated net private wealth of about 47 billion USD. As CEO of Berkshire Hathaway, an investment holding company he founded, he has demonstrated outstanding investment success over decades. The annual general meetings of the firm are reported to be a “Woodstock for investors,” with more than 20,000 people following every statement by the “Oracle of Omaha,” as Buffett is known.

    In the mid- and late 1990s, Warren Buffett, George Soros, and Bill Gates all got involved in the silver market.

    William “Bill” Henry Gates III, born in 1955, founded the Microsoft Corporation together with Paul Allen in 1975 and has a fortune of 53 billion USD, which made him the second-richest man in the world before he began to donate large amounts to charitable causes. In 1999 Gates got involved in Pan American Silver as the third big investor in the silver market after Soros and Buffett.
    Buffett tried a different strategy. In 1998, before official publication of its annual financial statements, Berkshire Hathaway announced that the company had acquired a total of 130 million troy ounces of silver between July 25, 1997, and January 12, 1998. That was about 4,000 metric tons of silver, which accounted for about 20 percent of the global annual mine production. For Berkshire Hathaway, however, this represented a mere 2 percent of its total invested capital.
    The investment in the physical metal surprised the international financial community, as Buffett had always been known for his value-oriented equity investment style. In this case his rationale was based on the discrepancy between supply and demand in the metal over the previous few years and a significant decline in inventories. The increase in silver price that followed proved him right. His investment was very profitable.
    As for Bill Gates, it became public in September 1999 that through Cascade Investment LLC he had purchased more than three million shares of Pan American Silver at an average price of about 5.25 USD. This represented 10 percent of the company, which was founded in 1994 and which now had a portfolio of silver-mining projects in Mexico, Peru, Bolivia, and Argentina.
    Looking at the price performance of silver versus share price performance of Apex Silver and Pan American Silver since 1997, an interesting picture emerges.

    Figure 12. Silver, Pan American Silver, and Apex Silver, 1998–2009. Performance indexed 1998. Data: Bloomberg, 2019.

    By the end of 2008, silver was performing the best, followed by the share price of Pan American Silver. Although Apex Silver shares first traded in line with silver and with Pan American Silver, it later crashed: It fell 90 percent between its IPO in 1997 and the end of 2008. Bankruptcy followed. What had happened?

    When Bolivian president Morales threatened mining companies with nationalization, investors panicked.

    President Morales’s threat to nationalize Bolivian mining projects unsettled investors. Actually, in place of a direct nationalization, the tax burden in Bolivia was heavily increased. Nevertheless, Apex Silver was forced to a sell part of its flagship asset to Sumitomo. Developing the San Cristóbal Mine became more and more expensive, as the cost of energy exploded. In order to obtain credit, Apex Silver had to sell futures in high quantities of silver, zinc, and lead. As commodity prices rose, these hedges led to increasing losses, and in January 2009 the company announced bankruptcy.

    So which investment was better? The share price of both Apex Silver and Pan American Silver temporarily outperformed silver, because annual production and the value of total mineral resources in the ground had a leverage effect. But leverage is the price investors pay for entrepreneurial and market risk. And when compared to Apex Silver, an investment in physical silver proved to be the much safer bet.

    Key Takeaways
    •Warren Buffett, Bill Gates, and George Soros became interested in the opportunities offered by the silver market in the 1990s.
    •Over a decade, the price of silver climbed from below 4 USD to more than 8 USD in 1997. It reached 22 USD in 2008.
    •Silver mining companies seemed to offer a much higher return than a direct investment in silver, but this higher expected return came with a price.
    •Because of the rising silver price, Bolivian president Evo Morales threatened to nationalize his country’s domestic mining industry. Shares of Apex Silver crashed by more than 90 percent from its IPO in 1997, followed by bankruptcy.

    17 Copper: “Mr. Five Percent” Moves the Market 1996

    The star trader of Sumitomo, Yasuo Hamanaka, lives two lives in Tokyo, manipulating the copper market and creating record earnings for his superiors but also carrying on risky private trades. In the end, Sumitomo endures a record loss of 2.6 billion USD, and Hamanaka is sentenced to eight years in prison.

    “Who is Mr. Copper?” Investopedia

    For years Yasuo Hamanaka was the head trader at Sumitomo Trading in Tokyo, the commodity trading subsidiary of Japanese conglomerate Sumitomo. In insider circles he was known by his nicknames—“Copper Fingers” or “Mr. Five Percent,” because he controlled as much as 5 percent of the global copper market. He earned huge profits for his company. However, on June 5, 1996, Hamanaka revealed that he’d lost 1.6 billion USD of his company’s money. Since then, the Sumitomo scandal has been considered one of the biggest financial frauds in recent history.

    Some Copper Basics

    The global production of copper, which is used mainly in construction and electrical and mechanical engineering, is around 20 million metric tons. Chile is the largest producer, with about one-third of the world’s output, followed by Indonesia, the United States, and Australia. Copper can be recycled and reprocessed almost without loss of quality, and along with aluminum, it is the most frequently traded industrial metal. The two most important exchanges are the London Metal Exchange (LME) and the New York Mercantile Exchange (NYMEX). At LME copper trades in US dollars per ton; at NYMEX, in US cents per pound. In the United States, the ticker symbol is HG, followed by the contract month and year (e.g., HGZ9, for copper with delivery in December 2019). Currently copper costs 2.80 USD per pound, or 5,600 USD per ton.
    In 1985 Yasuo Hamanaka, a 37-year-old expert in copper trading on the commodity futures markets, was hired by the Sumitomo Corporation in Tokyo. His department suffered a considerable loss in the mid-1980s, but the head of trading, and later Hamanaka himself, managed to conceal it with secret trades. Contrary to company tradition in which a trader changed position after a certain period of time, Hamanaka remained at his post for 11 years, because he generated such high profits.

    The Japanese trader Yasuo Hamanaka was a dominant factor in global copper. But he lost his bet against China.

    Any allegations about market manipulation and fraud from the LME went unheeded, while Hamanaka’s influential comments about rising copper demand and the occurrence of an artificial shortage were often published in the financial press. Even as Sumitomo’s star trader was making a modest impression, however, he was actually living a double life, professionally and privately. During the day he officially traded for Sumitomo; secretly at night he traded for himself on the LME and NYMEX. He lived with his family of four in a small house in Kawasaki, an unattractive Tokyo suburb, and drove a small car. But he enjoyed expensive trips with a lover from the Ginza entertainment district and—of course—had a Swiss bank account.
    Beginning in 1993, Hamanaka recognized that the Chinese economy was developing an enormous demand for copper due to its fast industrialization, and he bet that prices would rise. However, the Chinese put the market under pressure by talking down the price. Hamanaka’s losses started to pile up. He faked balance sheets, trading reports, and his superiors’ signatures in order to obtain additional credit lines to increase his positions and move the market in the “right” direction. But the Chinese seemed in no hurry to buy. By the end of 1995 and the beginning of 1996, the situation was slowly becoming critical. Now mentally unstable, Hamanaka was drinking heavily.
    In June 1996, the star trader had no choice but to admit the extent of his losses: Uncovered futures positions came to 1.8 billion USD. Shocked, Sumitomo dismissed Hamanaka, and in a panic it liquidated all positions. This caused another 800 million USD in losses for the company, as the price of copper dropped by 27 percent in a single day due to the sheer volume of the sales orders. In the end, the Sumitomo Corporation realized a loss of 2.6 billion USD, the biggest ever for a single company in the international financial markets.

    By liquidating copper futures positions it could not cover, the Sumitomo Corporation faced a loss of 2.6 billion USD.

    Figure 13. Copper in US cents/lb, 1995–1997. Data: Bloomberg, 2019.

    Afterward, reporters wondered how a single trader could have concealed such an unprecedented loss from his superiors. Obviously, internal audits, risk management, and supervision at Sumitomo had failed because, despite the immense transaction volume, none of Hamanaka’s superiors knew about his deals in detail. As for Hamanaka himself, the public considered him a criminal offender. He admitted his guilt in court and was sentenced to eight years’ imprisonment in 1998.

    Key Takeaways
    •Yasuo Hamanaka began trading copper for the Japanese conglomerate Sumitomo in 1985. Because of the size of his orders, and his control of up to 5 percent of the global copper market, Hamanaka earned the nicknames “Copper Fingers” and “Mr. Five Percent.”
    •After 1993, Hamanaka bet on rising copper prices caused by increasing Chinese demand, but when prices continued to fall, he lost money. Hoping that prices would recover, Hamanaka continued to hide his cumulative losses through secret trades.
    •In 1996, however, Hamanaka was forced to reveal a loss of 1.8 billion USD. Shocked, his superiors ordered all positions to be sold immediately, which caused a 27 percent drop in copper prices in a single day and resulted in an additional loss for Sumitomo of 800 million USD.
    •The Sumitomo copper scandal in Japan of 1996 was one of the biggest financial frauds in history; a single person caused a loss of 2.6 billion USD.

    18 Gold: Welcome to the Jungle 1997

    In the jungle of Borneo, the Canadian firm Bre-X supposedly finds a gold deposit with a total estimated value of more than 200 billion USD. Large mining companies and Indonesian president Suharto all want a piece of the pie, but in March 1997 the discovery turns out to be the largest gold fraud of all time.

    “Geologically, it’s the most brilliant thing I’ve ever seen in my life! It’s so big, it’s scary. It’s f***ing scary!” —John Felderhof, Bre-X
    “This can’t be a scam! Do some more tests! Figure it out! I know it’s there, okay?” —Peter Munk, Barrick Gold

    St. Paul is a remote community with roughly 5,000 inhabitants northeast of Alberta, Canada. Its only tourist attraction has been a landing platform for UFOs that was erected on June 3, 1967. In the middle of the 1990s, however, the tiny town became the focus of international media: Every 50th resident was a shareholder of the mining company Bre-X, whose value had increased 500-fold within just three years. As a result, the number of millionaires in St. Paul had suddenly shot up dramatically. At the center of attention was John Kutyn, an employee of the local savings bank, who had sold everything, including his car and his motorcycle, to invest in Bre-X early on.

    St. Paul, a small Canadian community of 5,000, recorded a sudden surge in resident millionaires.

    Kutyn spread the news about the gold discovery of the century among his neighbors and customers. He would be one of the few who managed to exit the company before it collapsed. A wealthy man, he went on to settle in New Zealand.

    Where’s the Gold?

    Based on industry estimates of the World Gold Council, around 190,000 metric tons of gold have been produced throughout history, of which one-fifth is stored in central bank vaults. The main gold-producing countries are China, Australia, Russia, the United States, and Canada, followed by Peru, Indonesia, South Africa, Mexico, and Ghana. Together, these 10 countries account for around 75 percent of global mine production. Former number-one gold producer South Africa now barely makes the top 10. Though it dominated gold mining for more than 30 years, the country’s production peaked in the 1970s.
    The center of global gold trading is the London Bullion Market, and most of the demand comes from the jewelry industry, followed by investors and industrial applications. The largest gold-producing companies in terms of volume are Barrick Gold, Newmont Mining, and Goldcorp.
    In the 1980s Canada had witnessed a boom in exploration companies, which searched the world for crude oil, gold, and other commodities. Among them was Bre-X, founded by former stockbroker David Walsh late in the decade. From an initial 0.30 Canadian dollar (CAD), the value of Bre-X shares fell to a few cents in 1993. But that would change after Walsh and a geologist named Felderhof bought exploration rights for Busang in the jungle of Borneo, Indonesia. Together with his colleague Mike de Guzman, Felderhof had explored Busang for another company in the mid-1980s, and the two men had found small traces of gold. On May 6, 1993, Bre-X announced that it had acquired a license for Busang. At that point the share price was around 0.50 CAD. But drilling samples validated gold levels of more than 6 grams per ton of rock. Since 3 grams are considered an excellent result, this caused a sensation.

    Was Busang home to the biggest gold treasure of all time?

    It wasn’t long before analysts picked up the Bre-X story. In March 1994 the stock rose to 2.40 CAD. By September, after a year of exploration and testing, the management of Bre-X estimated that Busang’s ore resources were between 3 and 6 million ounces of gold. As Bre-X’s drill results got better and better, gold experts and analysts published ever more optimistic forecasts.
    In November 1995 Busang’s gold resources were estimated at more than 30 million ounces, and toward the end of the year the stock price of Bre-X shares climbed above 50 CAD! At the annual general shareholders’ meeting in May 1996, the company was valued at 200 CAD per share, which then split by 1:10. The estimates kept rising: Bre-X reported more than 39 million ounces of gold in June 1996, 47 million ounces in July, 57 million ounces in December, and 71 million ounces in February 1997. Shortly afterward, Felderhof publicly speculated about resources of more than 100 million ounces. This would have made Busang the richest gold deposit of all time. Market rumors even doubled the estimate: Some 200 million ounces, about 6,000 tons, were supposed to lie hidden in the jungle of Borneo!

    Though the company had not produced a single ounce of gold, Bre-X shares rose 500-fold.

    At the beginning of September 1996, the stock reached its highest price—28 CAD (which corresponded to a price of 280 CAD before the stock split) and a market capitalization of more than 4 billion USD. In just three years the value of Bre-X shares had increased by more than 500 times, even though not a single ounce of gold had been commercially produced!

    In the meantime, the industry’s big names—Placer Dome, Newmont Mining, Barrick Gold, and Freeport-McMoRan—were also taking part in the race for Busang. Indonesian president Haji Muhammed Suharto wanted his share of the treasure, too. In December 1996 the Indonesian government, Bre-X, and Barrick Gold agreed to divide Busang among themselves. The following February, Freeport joined the group.
    But then things began to fall apart. On March 19, 1997, Mike de Guzman committed suicide by jumping from a helicopter. During the due-diligence process, independent drill holes had revealed only negligible amounts of gold. A week later, lab results showed that Bre-X had manipulated the initial samples. It was a personal disgrace for Peter Munk, the head of Barrick Gold, and the news caused investors to panic. The share price of Bre-X collapsed, and the stock was suspended from trading. Later Bre-X had to declare bankruptcy, and the stock became worthless.

    Figure 14. Share price of Bre-X, 1992–1997, in Canadian dollars (CAD). Data: Bloomberg, 2019.

    The Bre-X fraud remains one of the biggest capital market scandals in Canada and the biggest mining scandal ever recorded, causing serious lingering damage to the reputation of the Canadian stock market. Major investors who were hurt included the Ontario Municipal Employees Retirement Board, the Quebec Public Sector Pension Fund, and the Ontario Teachers Pension Plan. In addition, many small investors, including some 200 residents of St. Paul, saw their money vanish into thin air.

    Bre-X crashed. The stock was worthless.

    Not everyone suffered. David Walsh capitalized 35 million USD by selling Bre-X shares before the collapse and moved to the Bahamas. John Felderhof was able to sell nearly 3 million Bre-X shares, with a total value of almost 85 million CAD, between April and September 1996. He found a new home in the Cayman Islands. The Bre-X scandal was finally settled in 2002. However, legal disputes continue today.

    Key Takeaways
    •The Bre-X scandal remains the biggest corporate mining scandal in Canada to date.
    •In 1993 David Walsh and John Felderhof claimed to find the gold deposit of the century in Borneo. Their company, Bre-X, rose from a penny stock, trading below 30 Canadian cents, to 4 billion USD in market capitalization. From mid-1993 to mid-1996, the value of Bre-X shares increased by a multiple of 500. Indonesian president Haji Muhammed Suharto and large multinational gold companies all wanted a piece of the pie.
    •But in March 1997 the discovery was unmasked as the largest gold fraud of all time. Lab results confirmed that the company had manipulated its gold samples. Bre-X declared bankruptcy; its stock was worthless.

    19 Palladium: More Expensive Than Gold 2001

    In 2001 palladium becomes the first of the four traded precious metals—gold, silver, platinum, and palladium—whose price breaks the psychological mark of 1,000 USD per ounce. That represents a tenfold increase in just four years. The reason lies in continuing delivery delays by the most important producer: Russia.

    “The actual level of Russian stockpiles of palladium is a closely guarded state secret.” —United Nations Conference on Trade and Development

    Russia is the epicenter of the global palladium market, due to its high share of world annual production and its strategic inventories, which were built up through overproduction in the 1970s and 1980s. Since palladium is mainly a by-product of the production of other metals such as platinum or nickel, the production of palladium continues even when the supply of the metal is sufficient and prices are low.

    Russia dominated global palladium production and held significant inventories.

    The majority of palladium comes from Russia—and from a single spot, the Norilsk nickel deposit in northern Siberia. If supplies of Norilsk nickel are unable to keep pace with demand, stocks held by the Russian precious metals authority Gokhran, which is under the supervision of the Ministry of Finance, and the Russian Central Bank, fill the gap.

    A Palladium Primer

    Together with platinum, ruthenium, rhodium, osmium, and iridium, palladium is part of the platinum group of metals (PGM). More than 50 percent of the market for the metal depends on automobile catalysts and other industrial processes, though palladium is also used in jewelry. On average over the past five years, just over 50 percent of the annually mined palladium has come from Russia. Other important producer countries are South Africa, which accounts for just under one-third of global production, and the United States, with 15 percent of the global supply. With an annual production volume of around 220 metric tons, the market for palladium is significantly smaller than, for example, gold or silver. (For comparison, around 3,000 metric tons of gold and 24,000 of silver are produced each year.)
    The London Bullion Market Association’s (LBMA) twice-daily price fixing is the most internationally recognized price reference, and futures in palladium are traded in the United States (NYMEX) and Japan (TOCOM).

    Figure 15. Palladium in USD/ounce, 1998–2004. Data: Bloomberg, 2019.

    In the late 1990s the development of automobile catalysts made palladium an important industrial metal, and it was increasingly used instead of platinum because of the relatively low price at the time. But lack of deliveries from Russia started to drive the price up.
    In 1997 palladium deliveries from Russia halted for seven months. The next year deliveries stopped again. Moreover, analysts began to question the actual physical availability of the metal. It seemed that a large share of the palladium inventory had been collateralized by Western banks for credits in the aftermath of the Russian Financial Crisis of 1997.

    The price of palladium rose from 120 USD to more than 1,000 USD, making the metal more valuable than gold, silver, and platinum.

    The price of palladium rose from 120 USD per ounce in early 1997 to more than 200 USD in 1998. In April of that year, the price of the metal surpassed the gold price for the first time since 1971, due to continued supply disruptions in Russia. And the prices for palladium continued to climb: to 400 USD, then to 600 USD. In February 2000 the price of palladium skyrocketed to more than 800 USD, while the price of gold averaged just under 300 USD during that period. It seemed as though the price would consolidate, but instead it rose again to 1,000 USD.
    At the beginning of 2001, palladium broke through the psychological barrier of 1,000 USD, the first of the four traded precious metals—the others are gold, silver, and platinum—to do so. The shortage pushed the price up to almost 1,100 USD at the end of January 2001. The value of palladium had increased almost tenfold in just four years!
    It didn’t last. Subsequently, the value of palladium fell as low as 200 USD, after Russia announced long-term supply contracts with Japan, which were expected to start in January 2001. Then, during the commodity boom in the first decade of the new millennium, the price of palladium once again reached 600 USD before consolidating. Still this represented only a triple rise, compared with a multiple of 10 in 2001.
    In 2015 a major emissions scandal in the car industry (“Dieselgate”) fueled another palladium rally. In September of that year, the US Environment Protection Agency (EPA) issued a notice of violation of the Clean Air Act to the Volkswagen Group. The German car manufacturer had intentionally manipulated data and software in its diesel engines to meet emissions limits. The scandal spread to other manufacturers and raised awareness of the higher levels of pollution emitted by diesel-powered vehicles. The price of palladium, which was used in catalysts for gasoline cars, more than doubled, from less than 500 USD in mid-2015 to more than 1,100 USD at the end of 2018. At the beginning of 2019, Palladium was trading at 1,320 USD, once again higher than gold. Investors are wondering how long the rally will last this time . . .

    Key Takeaways

    •More than 90 percent of palladium reserves are found in Russia and South Africa. The metal (together with platinum) is predominantly used in automobile catalyst systems and related industrial applications.
    •In January 2001 palladium prices rose to 1,100 USD, 10 times the value of four years before.
    •Palladium became more valuable than gold, silver, or platinum, as Russia, the biggest producer and exporter of the metal, withheld shipments.
    •Dieselgate, the global diesel-related emissions scandal, fueled a new rally in palladium, whose prices have more than doubled again since 2015.

    20 Copper: Liu Qibing Disappears Without a Trace 2005

    A trader for the Chinese State Reserve Bureau shorts 200,000 tons of copper and hopes for falling prices. However, when copper prices climb to new records, he disappears and his employer pretends never to have heard of him. What sounds like the plot of a thriller shocks metal traders all over the world.

    “It’s one thing to have a rogue trader on your staff—that happens. But I’d be amazed if China wanted a reputation as a rogue nation in these markets, where it has become such an important player.” —Anonymous trader

    Most people even have trouble pronouncing the name Liu Qibing, but in November 2005 the Chinese copper trader was the number-one topic of conversation on the commodity futures exchanges in London, New York, and Shanghai. Rumors were circulating about a massive, speculative short position in the copper market: Liu Qibing, in his capacity as a trader for the Chinese State Reserve Bureau (SRB), was said to have shorted futures contracts on the London Metal Exchange (LME) amounting to 100,000 to 200,000 tons.
    Unlike Yasuo Hamanaka in Japan almost ten years earlier, Liu Qibing was speculating on falling copper prices. However, prices continued to rise, and the talk of a massive short position temporarily drove London’s three-month-forward copper contracts to a record high of nearly 4,200 USD per metric ton.

    Starting at 1,500 USD, the copper price bounced up to 9,000 USD per ton.

    Copper prices had started to climb since the turn of the millennium. In December 2003 the price of copper broke the 2,000 USD per ton mark for the first time, while the average price of previous years was only slightly above 1,500 USD. Just a few months later, the price breached the 4,000 USD level. The trigger for this development lay in the growing demand of the Chinese economy, which required more and more of the red metal for its infrastructure and housing industry. Although the OECD countries (members of the Organisation for Economic Co-operation and Development) collectively consumed about 80 percent of the world’s copper output at that time, China’s growth was more dynamic. Copper consumption in OECD countries increased on average by 2.5 percent per year over the previous five years. However, China’s demand grew by about 15 percent per year over the same period, while supply growth proved inflexible. At peak times China’s demand growth accounted for more than 80 percent of global demand growth.

    China was sucking global copper markets dry.

    At that time China alone accounted for a quarter of the world’s copper consumption. Meanwhile, the prices for industrial metals continued to rise, because producers were slow to respond with an increased supply. There were several reasons for their reluctance: First, the development of new mines usually takes several years until the first ton of copper can be produced. Second, many producers didn’t trust the high price level to last and therefore delayed long-term investment projects. By 2004, however, the extension of existing projects and the activation of new mines were entering a decisive phase. Experts—including the world’s largest copper producer, Chilean Codelco, and the Chinese State Reserve Bureau—expected the supply to increase at the end of 2005, and the rise in copper prices should have come to an end. As it turned out, that was a misperception for which China paid dearly.
    Contrary to expectations, almost all major producers had problems with production. Costs increased; high oil prices, strikes, and even earthquakes all had a lasting effect. The projected additional supply in the copper market was lagging, and demand, continually fueled by China’s dynamic economic growth, was jumping ahead. As a consequence, the price rose steadily. The rumors surrounding Liu’s positions created additional momentum, as copper inventories on commodity futures exchanges in London, New York, and Shanghai reached their lowest levels in 30 years.

    Figure 16. Copper prices in USD/ton, 2003–2007, London Metal Exchange (LME). Data: Bloomberg, 2019.

    The newspaper China Daily reported that 130,000 metric tons of copper were sold by Liu Qibing for the SRB at an average price of 3,300 USD per ton. As the price of copper rose above 4,000 USD, Liu broke off contacts with other traders in London and China and disappeared. His cell phone remained silent, the door of his apartment on the 10th floor of a Beijing building never opened, and he was absent from his job in Shanghai.

    The Chinese trader broke off all contacts, never answered his cell phone, and his employer denied his existence.

    At first Liu’s employer denied he existed. Later, the SRB claimed that the trader was acting solely on his own behalf. The SRB, which was founded in 1953, was supposed to stabilize prices and secure supplies through commodity trading, not earn profits through speculation. Industry experts considered the 36-year-old trader, who was under house arrest according to Chinese sources, more a pawn than a perpetrator.
    Liu, the son of a farming family from Hubei Province, had been with the SRB since 1990 and had been trained for futures and options trading at the London Metal Exchange (LME). Between 2002 and 2004, Liu is said to have generated more than 300 million USD in risky copper trades for the SRB. Now, the Chinese state was facing losses of hundreds of millions of dollars. In response, the government in Beijing tried to push down the world market price through copper auctions. In a first tranche, 50,000 tons were sold. Another tranche of a similar size was to follow, and the leadership in Beijing spread the word that the country had 1.3 million tons of copper in reserve. However, market participants estimated that the amount of copper available was just half that. The Chinese government’s actions were unsuccessful, as more and more market participants took counter-positions to force China to make physical delivery of the metal in late December.
    Hedge funds—called “crocodiles” in China—particularly saw an opportunity to generate short-term profits. The copper price climbed above 5,000 USD in January 2006, to 6,000 USD in early April, and to 7,000 USD at the end of that month. It rose to the dizzying heights of nearly 8,800 USD a ton in May, before normalizing again over the coming months.

    Key Takeaways
    •Like the Japanese trader Yasuo Hamanaka almost 10 years before, Chinese trader Liu Qibing was caught on the wrong side of the copper market. He speculated on falling prices and lost a great deal.
    •Liu was working for the Chinese State Reserve Bureau (SRB), which handled the Chinese economy’s rising demand for the commodity. Market intelligence estimated Liu’s short position at about 100,000 to 200,000 tons of copper.
    •Copper prices climbed from 1,500 USD per ton in 2003 to almost 9,000 USD in 2006, and Liu, labeled as a rogue trader, vanished.

    21 Zinc: Flotsam and Jetsam 2005

    The city of New Orleans, called The Big Easy, is well known for its jazz, Mardi Gras, and Creole cuisine. Less well known, however, is that about one-quarter of the world’s zinc inventories are stored there. Hurricane Katrina’s flooding makes the metal inaccessible, and concerns over damage cause the price of zinc to rise to an all-time high.

    “It’s totally wiped out . . . it’s devastating.” —President George W. Bush

    Zinc, which is traded on the London Metal Exchange (LME) in US dollars per metric ton, is the third-largest metal market, after copper and aluminum. But in the first years of the new millennium, zinc and lead were considered the ugly sisters of copper and aluminum, because of years of low prices and low margins for mining companies. Global supply was stagnating.

    What Happens at the LME?

    At the London Metal Exchange (LME), copper, aluminum, zinc, lead, nickel, and tin, as well as molybdenum, cobalt, and steel are traded. To capture the opportunities of electrification and electronic vehicles, LME plans to introduce lithium, manganese, and graphite futures contracts in the near future. Trading takes place in two rounds, in the morning and afternoon, in an open ring (“open pit”) during which the daily official trading price is determined. In 2012 the 137-year-old LME agreed to a 1 billion GBP takeover from the Hong Kong Exchange and Clearing (HKEx) after a nine-month auction battle that included ICE, CME, and Nasdaq. With an annual turnover of more than 12 trillion USD, the London Metal Exchange is the world’s largest trading place for metals, followed by metal exchanges in Singapore and New York.
    LME forward contracts are physically deliverable, and inventories of corresponding metals are stocked in LME-approved warehouses. Delivery takes place against LME delivery notes, which provide the owner with the right to a specified quantity of metal at a designated storage location. Currently, there are more than 400 warehouses in 32 locations, from the United States and Europe to the Middle East and Asia.
    Even as interest in industrial metals increased in 2003 as a result of the rapid growth of the Chinese economy, zinc’s price rise lagged behind those of other industrial metals. Nevertheless, China played a major role in the metal’s shortage: In 2004 the country became a net importer of zinc, bringing in about 67,000 tons in the first seven months of 2005, after only 15,000 tons were imported in the entire previous year. The International Lead & Zinc Study Group forecast a market deficit of 200,000 metric tons by the end of 2005, though there had been an excess of 50,000 tons in the first five months.
    Even though global inventories continued to decline, many producing companies remained skeptical about increasing the supply. “At this point, nobody in our business is rushing to build new zinc mines,” explained Greig Gailey, managing director of Zinifex, the world’s third-largest producer of zinc (after Xstrata and Teck Cominco), in 2005. “We’re certainly not, nor are Teck Cominco or Falconbridge.”

    Figure 17. Zinc prices in USD/ton, 2003–2006, London Metal Exchange (LME). Data: Bloomberg, 2019.

    By this time the price of zinc was hovering around 1,200 USD per metric ton. It had broken through 1,000 USD at the beginning of 2004, after moving in a narrow range between 750 and 850 USD over the two previous years.

    About 25 percent of global zinc inventories were concentrated in warehouses in and around New Orleans.

    In a nutshell, that was the situation until August 2005. Then Katrina hit New Orleans like an atomic bomb. The Level 5 hurricane caused devastating damage in the southeastern United States but particularly affected the city, whose urban area was almost completely below sea level.
    Twenty-four official LME warehouses had been sited in and around the city at the Mississippi Delta, due to its geographical location and attractive economic conditions. In addition to 250,000 tons of zinc, there were also 1,200 tons of aluminum and 900 tons of copper locked away. Global zinc inventories were estimated by the International Lead & Zinc Study Group to be just over 1 million metric tons at that point—the equivalent to a 35-day global supply. The inventories in New Orleans therefore accounted for around a quarter of global stocks and about half of the zinc traded at the LME. Due to the flood damage in New Orleans, however, access to the zinc was suddenly severely limited.
    Stephen Briggs, a metal analyst at Société Générale, summarized the situation: “We have a potentially serious development . . . the market is assuming that the metal is damaged and will be inaccessible for a lengthy period of time.”

    Who Needs Zinc?

    Zinc is mainly used as corrosion protection for other metals or metallic alloys such as iron or steel, and most of the demand for it is based on infrastructure, construction, and transport. Zinc is commonly produced as a co-product with lead, and worldwide mined production is around 11 million metric tons. The largest producer countries are China, Australia, Peru, the United States, Australia, and Canada; the latter two are also the largest exporters of the metal. Unlike the more concentrated markets for copper or nickel, the 10 largest companies produce less than 50 percent of the world’s zinc.
    Consumers assumed the worst. On September 2, zinc prices rose to a five-month high, as speculators foresaw delays in the delivery of zinc from the New Orleans warehouses. On September 6, the LME decided to temporarily suspend the supply of zinc from its stocks, though it had confirmed delivery of the metal just a week before. Accordingly, the price of zinc in London increased exponentially to 1,454 USD per metric ton, the highest since 1997. Two days later the LME’s CEO, Simon Heale, confirmed that suspension of deliveries could last until 2006 because of lack of access to the port of New Orleans.
    At the end of the year, zinc prices broke through 1,900 USD and, just under two weeks later, reached 2,400 USD in London. But that was only the beginning: The worsening situation eventually drove the value of the metal to 4,000 USD in the first half of 2006 and marked a new high of just under 4,600 USD per ton in November of that year.
    By 2007 the scare was over: Beginning in August, the price dropped continuously over the next 12 months, from 3,500 USD to less than 1,500 USD.

    Key Takeaways
    •Only market insiders were aware that warehouses in the city of New Orleans held around a quarter of global zinc stocks and about half of the zinc traded at the London Metal Exchange, the biggest physical metal market in the world.
    •In August 2005 Hurricane Katrina devastated New Orleans, causing extensive flooding in the area and making zinc inventories inaccessible.
    •As a consequence of this shortage of material, the price for zinc climbed from nearly 1,200 USD per ton during summer 2005 to a record of 4,600 USD in November 2006.

    22 Natural Gas: Brian Hunter and the Downfall of Amaranth 2006

    In the aftermath of the closure of MotherRock, an energy-based hedge fund, the bust of Amaranth Advisors shakes the financial industry, as it is the largest hedge fund failure since the collapse of Long-Term Capital Management in 1998. The cause? A failed speculation in US natural gas futures. Brian Hunter, an energy trader at Amaranth, loses 6 billion USD within weeks.

    “The market can stay irrational longer than you can stay solvent.” —John Maynard Keynes

    The news shook financial markets like an earthquake in September 2006: Amaranth Advisors, a 10 billion USD American hedge fund, erased around two-thirds of its capital in two weeks by betting on natural gas and was about to close. Only a few weeks before, MotherRock, another hedge fund that specialized in natural gas futures, had collapsed as well. Some of the causes for these events date back to previous years. Following the record hurricane seasons of 2004 and 2005, many hedge funds had become interested in the energy markets. Hurricanes Ivan, Katrina, Rita, and Wilma had all damaged crude oil and natural gas production facilities in the Gulf of Mexico, resulting in a significantly reduced supply.

    Weather and hedge fund speculation drove up natural gas prices from 6 to above 15 USD.

    These extreme weather events, as well as relatively constant demand during the winter months, led to increasing price volatility and, in some cases, substantial price spikes for energy, especially natural gas. While the price of gas traded between 6 and 7 USD during 2004 and the first half of 2005, the hurricane season drove up gas prices to more than 15 USD in December. Production disruptions dragged on for months, but the warm winter, the absence of major storms, and a greater number of imports dampened the effect on the price level of natural gas in 2006.
    Compared to their all-time high that year, benchmark natural gas prices in New York lost around two-thirds of their value. In September natural gas was trading near 4 USD. The huge fluctuations in price made natural gas interesting for short-term-oriented traders, but natural gas’s future contract curve offered an even more interesting investment opportunity. Speculation on the change of price differences between different contract maturities is a popular trading strategy, especially by hedge funds: Traders enter long and short positions in the same commodity simultaneously, and the trade is based on an expansion or narrowing of the price differences, that is, a change in the steepness of the term structure.

    Some Thoughts on Natural Gas

    Natural gas is one of the most important sources of energy in the United States, with a market share of almost 25 percent. Home heating, electricity generation, and other industrial applications together make up nearly 80 percent of its use. But the need for heat, which accounts for 20 percent of total demand, is very seasonal: There’s high demand in the winter months, less during the summer.

    Natural gas production in the United States is focused in Texas, the Gulf of Mexico, Oklahoma, New Mexico, Wyoming, and Louisiana. Texas and the Gulf region together contribute more than 50 percent of domestic output. Another 15-plus percent of total US natural gas consumption is imported from Canada or imported in the form of liquefied natural gas (LNG).

    Natural gas is traded on NYMEX under the symbol NG and the current contract month in USD per 10,000 MMBtu (1 MMBtu equals 26.4 cubic meters of gas, based on an energy content of 40 megajoules/m3).
    In 2006 the two top hedge fund investors in the US natural gas market were Brian Hunter, head of energy trading at Amaranth Advisors, a fund worth 9 billion USD, and Robert “Bo” Collins, chief executive of MotherRock, which oversaw about 400 million USD. The Mother Rock Energy Master Fund, which launched in December 2004, returned 20 percent to its investors in 2005.

    Figure 18. Natural gas prices in USD/MMBtu, 2003 to 2007, New York Mercantile Exchange. Data: Bloomberg, 2019.

    Some investors at the time were aware that Collins and Hunter held opposing positions in March–April and October–January natural gas contracts. In July 2006 the price difference between the gas futures for March and April 2007 reached 2.60 USD. Hunter’s investment decisions assumed that the difference would increase due to the upcoming cold season. In contrast, MotherRock was betting on a correction in the price spread.

    Who Is Brian Hunter?

    Born in 1975, Brian Hunter is a Canadian mathematician and hedge fund manager. From 2001 to 2004, he worked at Deutsche Bank in New York. There, in 2001 and 2002, he achieved a profit of 17 and 52 million USD by trading natural gas futures. However, after losses of more than 50 million USD in just one week, Hunter was released from his job. He moved on to Amaranth.
    Hunter became a legend on Wall Street by earning more than 1 billion USD speculating on natural gas prices after Hurricanes Katrina and Rita. By August 2006 he had achieved a profit of about 2 billion USD. Within a week, however, he had lost three times that, causing serious problems for Amaranth. After his separation from the company, Hunter went on to found a new hedge fund in 2007.
    Amaranth, with about 360 employees, had begun as a company that focused on convertible arbitrage. As those profit opportunities dwindled, it moved on to the energy sector. The firm dominated US natural gas trading on financial markets such as the NYMEX and the Intercontinental Exchange (ICE), as it bought and sold thousands of contracts, sometimes even tens of thousands, on a daily basis. Amaranth held about 100,000 natural gas contracts in one month, which accounted for about 5 percent of the total annual gas consumption of the United States. On the New York Stock Exchange alone, Amaranth controlled 40 percent of all outstanding contracts for the 2006–2007 winter season (October–March) and more than three-quarters of all outstanding November futures contracts.

    Amaranth Advisors and MotherRock had opposite guesses on which way the market would move.

    In June and July 2006, erratic natural gas price movements caused massive losses in the MotherRock Energy Master Fund. Earlier, the US Department of Commerce had reported a 12 percent increase in gas inventories. As a result, the gas price dropped by 12 percent within a week. The redemption of shares by investors aggravated MotherRock’s distress, which increased its losses to more than 200 million USD. However, the hedge fund’s high losses were not primarily due to a “normal” price decline. A subsequent Senate investigation confirmed that the sheer volume of Amaranth purchases of March contracts and sales of April contracts had distorted the price spread of natural gas, which moved up by more than 70 percent by July 31, 2006. MotherRock’s position worsened to the point where the fund was unable to meet its margin requirements. The fund collapsed, and positions were wound up in August 2006. Brian Hunter had triumphed, but his victory would be short lived.

    In late summer, natural gas prices began a downward spiral. The price of natural gas on the NYMEX, with delivery in October, dropped from 8.45 USD in July to below 4.80 USD in September, the lowest price of the previous two and a half years. The difference between futures contracts maturing in March 2007 and April 2007 moved from a high of nearly 2.50 USD in June to below 50 US cents in September—a plunge of around 75 percent!

    Figure 19. Price spread between natural gas March and April 2007 delivery, in USD/MMBtu, New York Mercantile Exchange. Data: Bloomberg, 2019.

    At the end of August, Amaranth held approximately 100,000 contracts in both the September and October futures on the long and short sides. Taken together, these represented enormous positions, because the movement of only 1 US cent on 100,000 contracts meant a change in value of about 10 million USD. The sheer size of the trades caused significant price movements in natural gas and its future term structure, that is, the price relationship of the different maturities.

    Figure 20. Future Term Structure of natural gas in USD/MMBtu, 2010, New York Mercantile Exchange. Data: Bloomberg, 2019.

    The total positions of the fund added up to approximately 18 billion USD. The 60-cent increase in September contracts and the associated drop in the October–September price spread meant a huge loss for Amaranth.
    On August 29 the profit-and-loss calculation showed a one-day depreciation of natural gas valuation of just under 600 million USD. The next day’s margin obligations would be even worse: They rose to 944 million USD, due to further price depreciation. Two days later Amaranth’s margin commitments were in excess of 2.5 billion USD. A week later, on September 8, the hedge fund’s obligations exceeded 3 billion USD.

    Amaranth’s total positions added up to 18 billion USD. In September the fund’s margin commitments rose to more than 3 billion USD.

    With the price volatility of energy markets remaining high, and because of the cumulative losses, concerns were mounting at Morgan Stanley (one of Amaranth’s important investors, along with Credit Suisse and Deutsche Bank), which forced the fund to return money.
    Funds under management at Amaranth fell from 9 to 4.5 billion USD in just a week. Founder Nicholas Maounis told his investors in a letter that the company would drastically reduce its positions due to the price fluctuations in the US gas market, and that investors could anticipate losses of 35 percent by the end of the year, even though four weeks earlier the fund had posted a 26 percent profit.
    Amaranth got its name from the Greek word for “imperishable,” but it was now painfully clear that the firm’s profits were anything but. In addition to individual investors, injured parties included umbrella hedge funds of Credit Suisse, Morgan Stanley, and Deutsche Bank. On July 25, 2007, the Commodity Futures Trading Commission condemned Amaranth and Brian Hunter for attempted price manipulation of the natural gas market. Hunter, who had left Amaranth, had already established a new hedge fund—Solengo Capital Advisors.
    When Amaranth collapsed in September 2006, investors were told redemptions would be temporarily suspended. Ten years after the blowup, in 2016, Amaranth investors were still waiting to get their money back.

    Key Takeaways
    •Energy markets were a hot topic in 2005–2006. The price of natural gas climbed from 6 to more than 15 USD, but in late summer the market turned sour and a downward spiral began. In September 2006 natural gas fell below 5 USD.
    •Brian Hunter built a position of 18 billion USD in natural gas. By August 2006 his trades had earned him 2 billion USD. But then the market turned against him. Within weeks he had lost 6 billion USD, and Amaranth Advisors collapsed in September 2006.
    •The demise of Amaranth Advisors shook the financial industry. It was the biggest hedge fund collapse since the downfall of Long-Term Capital Management in 1998 and investors haven’t been paid back yet.

    23 Orange Juice: Collateral Damage 2006

    “Think big; think positive. Never show any sign of weakness. Always go for the throat. Buy low; sell high.” That’s the philosophy of Billy Ray Valentine, played by Eddie Murphy in the 1983 movie Trading Places. The film’s final showdown has Murphy and Dan Aykroyd cornering the orange juice market. In reality, the price of frozen orange juice concentrate would quadruple between 2004 and 2006 on the New York Mercantile Exchange—a consequence of a record hurricane season.

    “My God! The Dukes are going to corner the entire frozen orange juice market!” —Dan Aykroyd, as Louis Winthorpe III in Trading Places

    The blockbuster movie Trading Places, from 1983, stars Eddie Murphy and Dan Aykroyd and culminates in a chaotic scene at the New York commodity exchange over trades of orange juice that hinge on data from the US Department of Agriculture. This was not really farfetched, as trading in orange juice, or more precisely frozen orange juice concentrate, on the New York Mercantile Exchange (NYMEX) is dominated by the effects of weather. Hurricanes, frosts, or droughts in Florida and the region around São Paulo, Brazil—the main places where oranges are grown—can lead to major price fluctuations that vary with the seasons and also affect other agricultural commodities: High prices are due to risk premiums in May (frost in Brazil) and November (hurricane season in Florida), and lows are more common in February and September. Even light storms can lead to a loss of fruit.

    Some Juicy Facts

    Oranges are cultivated in almost all parts of the world with tropical or subtropical climates, but two countries dominate orange juice production. More than 50 percent of the world’s harvest comes from Brazil (the São Paulo region) and Florida in the United States. At harvest, oranges are typically packaged in boxes of 90 pounds or 40.8 kilograms. Processing fruit into concentrate offers advantages, compared to oranges and orange juice, when it comes to storage, shelf life, and transportation.
    Orange juice is traded in the form of frozen concentrated orange juice futures in New York. A futures contract refers to 15,000 pounds of concentrate, the equivalent of 2,300 to 2,500 boxes of oranges. Under normal conditions, an orange harvest in Florida provides about 200 million boxes, worth about 1.2 billion USD.

    The hurricane seasons of 2004 and 2005 were the most active since weather records were kept in the United States.

    Heavy storms can destroy entire plantations and, at worst, result in lower harvests for several years, because new crops do not bear fruit for three to four years and are most productive only after about eight years. Storms can also make a difference in the spread of pests and diseases, which can greatly impact harvests on monoculture plantations. The years 2004 to 2006 created a “perfect storm” for the price of orange juice, overshadowing even the price spike of crude oil during the 2005 hurricane season.

    Storms to Remember

    The Atlantic hurricane season typically lasts from June 1 to November 30, and an average season sees just six hurricanes. There are exceptions: The year 2004 was one of the most active and costly hurricane seasons since records began. Winds and floods were responsible for at least 3,000 deaths and property damage of approximately 50 billion USD. The most significant storms—Charley, Frances, Ivan, and Jeanne—all crossed the United States. And all four hit Florida.
    But the hurricane season of 2005 stands out even more. It emerged as the most active hurricane season since weather records began, with 28 storms, including 13 hurricanes, of which 4 were Category 5 storms! Category 5 on the Saffir-Simpson scale means a hurricane with wind speeds in excess of 251 km/h. The storms in 2005 cost some 2,300 lives and caused damages amounting to 130 billion USD. Hurricanes Dennis, Emily, Katrina, Rita, and Wilma were responsible for the worst of the devastation that year. Katrina caused massive damage in the southeastern United States in August 2005, hitting the city of New Orleans particularly hard. However, Wilma broke all records and is now considered the strongest storm in history.

    Florida’s orange industry generally has suffered from subsidized overproduction. As a result, in times of good harvests income levels are low. The orange harvest in 2004 was very productive, and consequently in May 2004 the price of orange juice was about 35 percent lower than in the previous year. The US Department of Agriculture was estimating a harvest of 245 million cases in 2004, which would have been well above the crop level of the previous year (203 million cases) and would even have topped the record harvest of the 1997–1998 season (244 million cases). In addition, the Atkins diet, which advocated avoiding carbohydrates (including the sugar in orange juice), was particularly popular in the United States at the time and causing noticeably lower demand. At the end of May 2004, orange juice was trading at only 0.54 USD/lb in New York.

    Figure 21. Frozen orange juice concentrate prices in US cents/lb, 2002–2006. Data: Bloomberg, 2019.

    But then parameters started to change. The Atkins diet lost popularity, and demand began to pick up. And four hurricanes in 2004–2005—Charley, Frances, Jeanne, and Wilma—would affect the supply of Florida oranges. According to the Florida Citrus Mutual industry association, Hurricane Wilma alone caused a crop loss of around 35 million boxes, or about 17 percent of unharvested fruit.

    From a base of 0.55 USD, the price for frozen orange juice concentrate rose to more than 2 USD. A quadruple increase!

    In 2005 the US Department of Agriculture predicted a harvest of only 135 million boxes, that is, a decline of almost 10 percent compared to the already-below-average harvest of the previous year. Market observers expected the lowest harvest level in the previous 17 years due to storm damage and pest infestation. Starting at just under 0.55 USD in May 2004, the price of orange juice concentrate in New York continued to rise, quadrupling within two and a half years.

    The prices for orange juice rose to levels unmatched since 1990.

    In October 2005 the price rose above 1 USD, breaking a psychological barrier, and the upward momentum continued. Orange juice rose to levels that had not been reached since January 1990, when the price topped 2 USD after a severe frost. In December 2006 the price of orange juice was again trading above 2 USD.
    The orange crop in 2005–2006 began to recover slightly in both the United States and Brazil compared to the previous year. But the supply remained about 30 percent below the 2003–2004 level. Finally, in 2007, the price for orange juice fell back to between 1.20 and 1.40 USD, and in 2008, the price normalized to levels below 1 USD again.

    Key Takeaways
    •Prices of agricultural commodities are very sensitive to extreme weather. As a consequence of a record Atlantic hurricane season, the price of frozen orange juice concentrate quadrupled between 2004 and 2006.
    •In October 2005 prices surpassed 1 USD and continued to climb. In December 2006, the price of orange juice traded above 2 USD, a level that had not been reached since January 1990.
    •A notable fictional cornering of the market for frozen orange juice concentrate—whose plot hinged on weather information from the US Department of Agriculture’s Crop Report—took place in the movie Trading Places (1983), starring Eddie Murphy and Dan Aykroyd.

    24 John Fredriksen: The Sea Wolf 2006

    John Fredriksen controls a corporate empire founded on transporting crude oil. Among the pearls of that empire is Marine Harvest, the largest fish-farming company in the world.

    “You stand on dead men’s legs. You’ve never had any of your own. You couldn’t walk alone between two sunrises and hustle the meat for your belly . . .” —Jack London, The Sea Wolf

    Acomparison with socialite Paris Hilton is inevitable: The twin sisters Kathrine and Cecilie, 26, are young, beautiful, and rich. In the list of Forbes magazine’s “Hottest Billionaire Heiresses,” the twins are next to Ivanka Trump and Holly Branson. The sisters have so far kept their names out of scandals, but they are already following in the business footsteps of their father, John Fredriksen. Forbes rates the private wealth of the 74-year-old Norwegian shipowner—by far the richest Norwegian—at more than 8 billion USD. Due to high taxes in Norway, however, Fredriksen lives in London and holds Cypriot citizenship.
    Fredriksen, born May 11, 1944, near Oslo, became rich in the crude oil business, as have many before him. He was already working in the shipping business when he set up his own company during the oil crises of the 1970s and built up a tanker fleet, today one of the largest in the world. He earned money on risky ventures during the Iran-Iraq War in the 1980s and delivered crude oil to the apartheid regime in South Africa.
    Today Frederiksen heads a huge corporate empire, directly or through its investment firms. He is the largest shareholder of the Bermuda-registered shipping company Frontline, which controls a fleet of Liquefied Natural Gas (LNG) tankers with Golar LNG, and is involved in the oil rig operator SeaDrill and the shipping companies Golden Ocean Group and Overseas Shipholding Group. In Germany, Fredriksen is known as a major shareholder of the TUI Group and an advocate of selling the container shipping division Hapag-Lloyd, in order to promote the consolidation of the industry. Prior to 2010 John Fredriksen held the largest stake in TUI Travel and had a significant influence upon its direction and strategy. The Norwegian had already made a name for himself in the world of fish farming and today controls the largest fish-farming company in the world—Marine Harvest.

    Figure 22. Norwegian salmon prices in NOK/kg, 2000–2011. Data: Bloomberg, 2019.

    In the 1971 German TV adaptation of Jack London’s famous adventure novel The Sea Wolf, Raimund Harmstorf, in his role as Wolf Larsen, crushes a raw potato to illustrate his worldview—eat, or be eaten. It’s an apt metaphor for the dealings of John Fredriksen, the Norwegian Sea Wolf.
    In the first years of the new millennium, the Norwegian fish-farming industry was experiencing financial difficulties due to low prices for fish. In particular, the company Pan Fish, founded in 1992, had been struggling since 2000.

    What’s the Catch?

    By far the world’s largest fishing nations are China, Peru, India, and Japan. In Europe, Norway, Denmark, and Spain haul in the largest harvests. The value of world exports of fish and fishery products in 2015 reached 96 billion USD. Aquaculture deals with the controlled cultivation of fish, mussels, crabs, and algae, and there’s a rapidly growing global market for these products: According to figures from the UN’s Food and Agriculture Organization (FAO), slightly more than a third of the almost 150 million metric tons of fish caught come from aquaculture—and the number is rising. The Organisation for Economic Co-operation and Development (OECD) and FAO estimate that by 2020 the proportion of farmed fish will account for almost 50 percent of the total fishery.
    Farmed fish have the advantage of lower prices, and some argue that fish farms can also counteract the overfishing of the oceans; according to FAO estimates, more than 70 percent of the fishing grounds are already considered “overfished.” However, others point out some disadvantages: Aquaculture’s carnivorous fish, such as salmon and trout, consume many times the body weight of wild-caught fish; and there are particularly negative consequences to keeping fish in unnaturally large and dense pens, especially in countries with low ecological standards, such as in Southeast Asia or South America, because of over-fertilization or the use of antibiotics.
    Fredricksen controlled an almost 50 percent stake in Pan Fish through his investment company Greenwich Holding and the two vehicles Geveran Trading and Westborough Holdings. In June 2005, he bid successfully for the remaining shares of the company. In the second quarter of 2005, Fredriksen also acquired 24 percent of Fjord Seafood through Geveran Trading. His shares would soon amount to nearly 50 percent of the company. Then, in October 2005, Fjord Seafood made an offer to the state fish-farming company Cermaq, but the bid failed due to opposition from the Norwegian government.
    Fredricksen made his next big move in March 2006: Nutreco, today the largest manufacturer of fish feed worldwide, sold 75 percent of Marine Harvest—which had been involved in Chilean fish farming since the mid-1970s—to Geveran Trading for nearly 900 million euros. The remaining 25 percent was acquired by the Norwegian firm Stolt-Nielsen.

    On December 29, 2006, Pan Fish, Fjord Seafood, and Marine Harvest merged to form the new Marine Harvest Group. What was by far the largest fish-farming corporation in the world was now under the control of John Fredriksen.

    Key Takeaways
    •John Fredriksen, a modern version of Jack London’s Sea Wolf, made his fortune in the crude oil market, then became active in oil drilling, the transport of crude oil, shipping, and liquified natural gas. Today he controls an extensive corporate empire.
    •During the first years of the new millennium, the Norwegian fish-farming industry experienced severe financial difficulties due to low salmon prices.
    •By active industry consolidation over two years, Fredriksen built the Marine Harvest Group in 2006. Today it’s the world leader in fish farming and aquaculture.

    25 Lakshmi Mittal: Feel the Steel (2006)

    The dynamic growth of the Chinese economy and its hunger for raw materials rouses the suffering steel industry from near death. Through clever takeovers and the reorganization of rundown businesses, Lakshmi Mittal rises from a small entrepreneur in India to the largest steel tycoon in the world, a position he crowns with the acquisition of his main competitor and the world’s second-largest steel producer—Arcelor.

    “I want to be the Ford of Steel.” —Lakshmi Mittal
    “Aim for the highest.” —Andrew Carnegie

    It was a dream wedding, with a setting akin to the court of ancient maharajahs in India or a tale from 1001 Nights. On June 22, 2004, fireworks illuminated the night sky in Paris, Bollywood stars Aishwarya Rai and Shah Rukh Khan entertained the guests, pop star Kylie Minogue performed, and more than 5,000 bottles of Mouton-Rothschild 1986 were served. The evening festivities were the main attraction of the six-day celebration of the wedding of 23-year-old Vanisha Mittal and London investment banker and founder of Swordfish Investments Amit Bhatia, age 25. Twelve Boeing jets had been chartered to bring more than 1,500 guests from India to France, where they visited the Jardin des Tuileries, Versailles, and the Château de Vaux-le-Vicomte. The silver-wrapped wedding invitations included five-star accommodations at the Hotel Le Grand and the InterContinental, whose 600 rooms had been fully booked. Presents for the guests featured designer handbags filled with jewelry. It is estimated that the cost of this extravaganza was around 60 million USD. The check was signed by the proud bride’s father, Lakshmi Mittal.
    Who is this tycoon who could arrange a fairytale wedding for his daughter and that same year acquire a princely residence in London’s posh Kensington district from the chief executive of the Formula One Group, Bernie Ecclestone, for the equivalent of around 130 million USD?
    Lakshmi Mittal’s father had run a small steel plant in the Rajasthan province of India. The family later moved to Calcutta, where the father took over a major factory and where Lakshmi learned the steel business from scratch.
    After studying business administration in Calcutta, in 1976 Lakshmi was put in charge of modernizing a rundown steelwork in Indonesia that the family had previously acquired for 1.5 million USD. That pattern would continue throughout the Indian mogul’s life, as he bought money-losing or underutilized steel producers and restructured their business through cost reductions, sales orientation, layoffs, and closures. When a steel industry boom was triggered by rapid economic growth in China, Lakshmi Mittal would become one of the richest men in the world in just a few years.

    Lakshmi Mittal forged the world’s largest steel company.

    Gradually he added larger and larger acquisition targets. In 1989 Mittal bought a derelict steel plant in Trinidad and Tobago and renovated it. He had a major success in Mexico in 1992: The state had invested 2.2 billion USD in state-of-the-art steel-production equipment, but the end of the oil boom was forcing the government to sell. Mexican president Carlos Salinas awarded the Indian entrepreneur the contract for just 220 million USD, of which Mittal only had to raise 25 million in cash. He then renamed the company Ispat Mexicana. (Ispat is Hindi for “steel.”)
    The year 1995 marked another turning point for the businessman. After the collapse of the Soviet Union, the giant Karmetwerk, which included coal mines, was up for privatization in Kazakhstan. Although Western corporations did not dare invest, Mittal paid 400 million USD, dismissed a third of the workforce, and made the company profitable within a year. Mittal also bought Sidex in Romania after that company was privatized, though it was a controversial deal because of a letter of recommendation written by British prime minister Tony Blair to Romanian president Adrian Năstase after Mittal’s donation to Blair’s party (“Mittalgate”).

    Mittal Steel was created in the spring of 2005.

    In October 2004 Mittal announced the merger of privately held LNM Holding and publicly listed Ispat International with the American International Steel Group (ISG). (ISG arose from the assets of LTV Steel and the assets of former industrial titans Acme Steel and Bethlehem Steel.) In the spring of 2005, the deal—worth 4.5 billion USD—was concluded. Mittal Steel, based in the Netherlands, was born.

    Steel Ups and Downs

    Carnegie and Vanderbilt in USA, or Thyssen and Krupp in Germany—these family names ring a bell in the history of the steel industry. Compared to other industries, the steel industry today is highly fragmented; the 10 largest steelmakers produce less than a third of the world’s supply, compared to a market share of more than 90 percent by the world’s 10 largest carmakers. ArcelorMittal is the industry leader. Nippon Steel, Baoshan Iron & Steel, POSCO, and JFE Steel follow at some distance.
    The 1990s were dark years for steel producers from Western countries. Specifically, the US steel industry slipped into a severe crisis due to overcapacity and cheap imports, and since the late 1990s, more than 30 companies have had to apply for bankruptcy and creditor protection. The situation changed dramatically with the rapid growth of the Chinese economy. The Chinese demand for steel increased from around 15 percent of the world’s market in 2000 to almost 50 percent a decade later. This unbalanced the markets for raw materials like iron ore and metallurgical coal and caused prices for crude steel to rise significantly. At the beginning of the millennium, the price for a metric ton of steel was around 200 USD; by 2008, it had risen to 1,100 USD.
    Mittal had created the world’s largest steel producer, with more than 70 million tons of production capacity. About 90 percent of the company was owned by the family. But Mittal, who wanted to outdo magnates like Andrew Carnegie and Bethlehem Steel’s Charles Schwab, was not yet satisfied.
    In October of the same year, Mittal Steel acquired Ukrainian steel producer Kryvorizhstal at an auction for 4.8 billion USD, after the Ukrainian president decided against a consortium headed by the son-in-law of the former Ukrainian president. But behind the scenes a much larger deal was looming that would profoundly change the steel industry.

    Figure 23. Steel prices in USD/ton, 2000–2010. Data: Bloomberg, 2019.

    In January 27, 2006, Mittal announced a takeover bid to the shareholders of Arcelor, which was the industry’s second-biggest company. He offered a premium of 27 percent on the closing price of the previous day, a purchase price of nearly 20 billion USD. Arcelor itself had been created by the merger of French, Spanish, Luxembourg, and Belgian steelworks, and in 2005 it had produced almost 50 million metric tons of crude steel. The attempt at the hostile takeover provoked Arcelor’s corporate leadership; the governments of Luxembourg, France, and Belgium also opposed the merger.
    “L’India”—the Indian—“does not fit in with our great culture,” said Guy Dollé, the French head of Arcelor. And, in fact, the takeover battle turned into a war of cultures, during which Arcelor sought to save itself through a merger with Russian steelmaker Severstal. It played out like high-stakes poker. In the course of a month, Arcelor rejected two offers from Mittal as too low. Then, in June 2006, the Arcelor board of directors called for a marathon nine-hour negotiation. For almost 34 billion USD, a further premium of 15 percent on the stock closing price of the previous day—about 45 percent above the original offer—Arcelor finally agreed to the sale.

    With the merger of Arcelor and Mittal, the world’s largest steel producer was created, with a combined production volume of just under 120 million tons of crude steel, a global market share of around 12 percent, 60 billion USD in sales, and more than 320,000 employees. Number two in the industry, Nippon Steel, had less than one-third of ArcelorMittal’s production capacity.
    With the acquisition of Arcelor, the Mittal family reduced its stake in the new company to around 45 percent. Nevertheless, with estimated private assets of around 25 billion USD, Lakshmi Mittal is considered the fifth richest person in the world.

    Key Takeaways
    •The awakening of the Chinese economy, with its dynamic growth and enormous lust for resources, shook up a moribund global steel industry. Between 2000 and 2008, global steel prices increased more than fivefold. One entrepreneur noticed this industry trend faster than others.
    •Lakshmi Mittal became the “man of steel.” The Indian tycoon created Mittal Steel in 2005 by buying ISG and the remaining assets of former US industry giants Acme Steel and Bethlehem Steel. But that was not enough. After a bidding frenzy, in summer 2006 Mittal bought Arcelor and forged the world’s biggest steel company, ArcelorMittal.
    •After the transaction was complete, Lakshmi Mittal was considered the fifth richest person in the world, with estimated private assets topping 25 billion USD.

    26 Crude Oil: The Return of the “Seven Sisters” (2007)

    An exclusive club of companies controls oil production and worldwide reserves. But its influence diminishes with the founding of the Organization of the Petroleum Exporting Countries (OPEC) and the rise of state oil companies outside the Western world.

    “There is no business like oil business.“ —C. C. Pocock, Chairman of Shell

    In 2007 the Financial Times created the term the “New Seven Sisters” to describe the world’s seven most influential energy companies outside the Organisation for Economic Co-operation and Development (OECD). The original Seven Sisters, a term coined in the 1950s, referred to a consortium of predominantly successor companies to the Standard Oil Company: Standard Oil of New Jersey, Standard Oil Company of New York, Standard Oil of California, Gulf Oil, Texaco, Royal Dutch Shell, and the Anglo-Persian Oil Company.

    For a long time, the Seven Sisters were regarded as the dominant force in the oil business, since, thanks to a framework agreement with the Iranian government, they held a demand cartel over oil producers in the Third World. Producer countries were forced to sell the majority of their production on the basis of long-term contracts and fixed prices to the oligopoly, which also controlled trade and distribution.
    The Seven Sisters were able to set the rules, because until the 1970s the group controlled about 85 percent of global oil reserves. However, early in that decade, more and more important producer countries began to nationalize their oil industry: Algeria was the first country to do so, in 1971, followed shortly thereafter by Libya. In the following year, Iraq nationalized the concessions of Western companies. In 1973 Iran also nationalized its domestic oil industry. The power of the Seven Sisters was dwindling, and OPEC—founded in 1960 and the cartel’s counterpart on the supply side—was gaining in importance.

    The Seven Sisters controlled 85 percent of the world’s oil reserves until the 1970s.

    Today, OPEC countries supply about 40 percent of the world’s crude oil, and according to their own data, member countries together account for about 75 percent of global crude oil reserves, while oil production in Western countries has declined over recent years.

    Four of the Seven Sisters still exist today—ExxonMobil, Chevron, Royal Dutch Shell, and BP.

    To counter strong price fluctuations and a continuous drop in oil prices below 10 USD, the large oil companies used mergers and acquisitions. For example, Exxon (Standard Oil of New Jersey) and Mobil Oil (Standard Oil Company of New York) merged in 1999 to create ExxonMobil, the world’s largest oil company, whose annual revenue exceeds the economic power of many small countries.
    From Standard Oil of California came Chevron, which took over US Gulf Oil in 1985 and in 2001 incorporated Texaco as well. The British Anglo-Persian Oil Company first became the Anglo-Iranian Oil Company and then British Petroleum. Following the acquisition of Amoco (the former Standard Oil of Indiana) and Atlantic Richfield, the company finally changed its name to BP in 2000. As a result, four of the original seven dominant companies were left: ExxonMobil, Chevron, Royal Dutch Shell, and BP.

    Big Oil today is made up of BP, Chevron, ConocoPhillips, ExxonMobil, Royal Dutch Shell, and Total.

    Further mergers, such as Total and Petrofina (1999), Total and Elf Aquitaine (2000), and Conoco and Phillips Petroleum (2002), have put the US firm ConocoPhillips and the French company Total into the same category as the other four. There are now six super-majors—BP, Chevron, ConocoPhillips, ExxonMobil, Royal Dutch Shell, and Total—all often referred to as “Big Oil” in the financial press. However, their influence today is significantly lower than that of the Seven Sisters 50 years ago. Together, Big Oil today controls less than 10 percent of global oil and gas production, and the group’s share of global reserves is again significantly lower.
    In contrast, the “new Seven Sisters” of the oil industry together control about a third of global oil and gas production and global reserves: These include Saudi Aramco (Saudi Arabia), Gazprom (Russia), China National Petroleum Corporation (China; CNPC), National Iranian Oil Company (Iran), Petróleos de Venezuela (Venezuela), Petrobras (Brazil), and Petronas (Malaysia).

    The “new Seven Sisters” are Saudi Aramco, Gazprom, CNPC, National Iranian Oil, Petróleos de Venezuela, Petrobras, and Petronas.

    Aramco, based in Dhahran, Saudi Arabia, is the most important of the group. As the world’s largest oil company, it produces 12 million barrels of crude oil daily and has reserves of approximately 260 billion barrels of crude oil—almost a quarter of global reserves. With its Ghawar oil field, Saudi Aramco also operates the largest oil field in the world. After a dramatic drop in oil prices in 2015–2016, the kingdom of Saudi Arabia speculated about an IPO of Saudi Aramco to raise money. But plans have not yet been realized.
    At the end of 2006, Russian Gazprom and Petro China, a subsidiary of CNPC, had left the market value of most Western energy companies far behind. CNPC, the China National Offshore Oil Corporation (CNOOC), and Sinopec are China’s three largest oil companies.
    The power of the former Russian state-owned company Gazprom—the world’s largest producer of natural gas—was felt in Europe in late 2005 due to the gas dispute with Ukraine. (The enterprise also holds a monopoly on the export of gas from Russia.)
    The state-owned National Iranian Oil Company (NIOC), based in Tehran, is part of the Iranian Ministry of Petroleum and is also active worldwide. Petróleos de Venezuela (PDVSA) was the instrument of power of former Venezuelan president Hugo Chávez. Established as part of the nationalization of the country’s oil industry, PDVSA is today the largest oil company in Latin America. In the Campos Basin, the semipublic Petrobras (formally Petróleo Brasileiro) accounts for more than 80 percent of Brazil’s oil production. The company is also a leader in offshore drilling and deep drilling. With the Tupi field, the Brazilians have probably discovered the third-largest oil field in the world. Petronas (full name Petroliam Nasional Berhad), a state-owned petroleum company known for its landmark Petronas Towers in Kuala Lumpur, is one of the largest international oil and gas companies, with more than 100 subsidiaries and representations in more than 30 countries.

    Key Takeaways
    •After the breakup of Rockefeller’s Standard Oil empire, a consortium known as the “Seven Sisters” emerged. Included were Standard Oil of New Jersey, Standard Oil Company of New York, Standard Oil of California, Gulf Oil, Texaco, Royal Dutch Shell, and the Anglo-Persian Oil Company. This consortium controlled 85 percent of global crude oil reserves until the mid-1970s.
    •The influence of the Seven Sisters diminished with the founding of OPEC and the rise of state oil companies outside the Western world. OPEC today controls about 40 percent of global oil and gas production.
    •The legacy of the Seven Sisters lives on in a group of super-majors, six integrated oil and gas companies also referred to as “Big Oil”: BP, Chevron, ConocoPhillips, ExxonMobil, Royal Dutch Shell, and Total. Compared to the original Seven Sisters, they control less than 10 percent of global oil and gas production.
    •The “new Seven Sisters” are Saudi Aramco, Gazprom, CNPC, National Iranian Oil, Petróleos de Venezuela, Petrobras, and Petronas. Together these seven companies control about a third of global oil and gas production and reserves.

    27 Wheat and the “Millennium Drought” in Australia 2007

    After seven lean years for Australia’s agricultural sector, a Millennium Drought drives the price of wheat internationally from record to record. Thousands of Australian farmers expect a total failure of their harvest. Is this a preview of the effects of global climate change?

    “This is more typical of a 1 in a 1000-year drought, or possibly even drier, than it is of a 1 in a 100-year event.” —David Dreverman, Head of the Murray-Darling Basin Authority

    The Aboriginal term uamby means “where the waters meet,” except that on the Uamby farm, 50 kilometers northwest of the Australian wine-making and sheep-breeding city of Mudgee, no more water was flowing. The year 2006 was one of the hottest since weather records began on this continent and also one with the least rainfall.

    Though the extreme drought had already affected the farm severely, it was only the beginning of the worst summer months—which fall between December and March in Australia. Water reserves were running low, and the animals could no longer find food. The pastures were bare and parched, necessitating purchases of water and food. Of the original 4,800 sheep on the farm, only 2,800 were left; the remainder had to be sold for 5 USD per animal, though the owners had expected about 40 USD.

    The World’s Wheat

    With an annual production of just under 600 million tons, various wheat varieties, together with corn and rice, are among the most widely cultivated cereals in the world. Wheat accounts for around one-fifth of the world’s calorie needs. It’s an important food for livestock and is also used to produce biofuels like ethanol. The average yield per hectare is just under 3 tons worldwide (1 hectare = 10,000 square meters, comparable to a soccer field). Large parts of the harvest are consumed by the producer countries themselves, so that only about 100 million tons of the total amount produced reach the world market—a factor that can affect price fluctuations in times of shortages.
    More than 400,000 people were working in Australia’s agriculture sector, one of the country’s most important industries, and the situation was dire. At the beginning of 2007, due to the adverse circumstances, a farmer was taking his own life every four days. At the beginning of the next year, more than 70 percent of the agricultural land, about 320 million hectares, was affected by lack of rain and high temperatures.

    The “granary” of Australia, the Murray-Darling Basin, produces 40 percent of the country’s wheat.

    The situation was especially tense in the Murray-Darling Basin. The river system spans thousands of kilometers, an area about the size of France and Spain combined, supplying some 15 percent of Australia’s water. Officially, the rivers supplied around 50 percent less water in 2007 than the previous year, and 2006 itself had been a record low-water year. The basin is considered the granary of Australia, because this area alone grows 40 percent of the food on the continent. Meanwhile, small towns like Dimboola, about 330 kilometers from Melbourne, in the Australian wheat belt, were becoming ghost towns.
    For the international market, Australia’s role as the second-largest exporter of wheat was of particular importance. In “normal” times, Australia exports 25 million tons every year. But normal times had not existed in Australia for seven years, making the drought the country’s longest. The year 2006 was the third-driest year since records began in 1900, and the Australian Bureau of Agricultural and Resource Economics (ABARE) was estimating the 2006–2007 winter harvest at just 26 million metric tons, 36 percent less than the previous year. Even so, 2007 proved to be hotter, and experts began talking about a Millennium Drought. Australian prime minister John Howard declared it “the worst drought in living memory.” The direct cause was the phenomenon known as El Niño—a rise in Pacific Ocean temperature that affects weather patterns, and a phenomenon whose frequency and intensity has increased significantly through global climate change, according to environmental and weather experts.

    El Niño Acts Up

    El Niño (“the boy” in Spanish, referring to the Christ Child, since El Niño usually occurs around Christmastime) describes a weather phenomenon in which the sea surface temperature in the equatorial Pacific rises, wind systems over the Pacific change, and as a result, the cold Humboldt current west of South America weakens. A layer of warm water travels through the tropical East Pacific from Southeast Asia to South America, and water temperatures off Australia and Indonesia drop. The result is a change in global weather patterns: There are usually heavy rains on the South and North American West Coasts and drought, crop failures, and bush fires in Australia, India, and Southeast Asia.
    In contrast, La Niña (“the girl”) is an exceptionally cold current in the equatorial Pacific, whose effects are excessive rain in Indonesia and drought in Peru.
    The Australian harvest was crucial because the global 2006–2007 wheat harvest, at 598 million metric tons, was also significantly lower than the previous year’s 621 and 628 million tons. The 15 largest producing countries provided about 80 percent of that total. Australia, the second-largest exporter after the United States at the time, accounted for about 16 percent of global wheat exports.

    The harvest came at a time of increasing demand, growing prosperity, and robust economic growth. For global wheat consumption, the forecast for this period was 611 million metric tons.
    The collapse of Australian wheat production first hit Asia and the Middle East, since these countries traditionally imported grain from Australia. They were now looking for wheat in the United States and Canada. The Europeans were also affected by the heat. In Ukraine, the 2006 crop had shrunk by half.

    In February 2008 the price for wheat more than tripled, compared to 2006, to almost 13 USD per bushel.

    The price of wheat on the Chicago Board of Trade (CBOT) soon began an unprecedented rally. The typical trading band for wheat in the years before 2006 was between 2.50 USD and 4 USD. At the beginning of 2004, however, inventories fell to their lowest levels since 1980. Bad harvests in Europe and China meant that the Middle Kingdom had to import wheat for the fourth year in a row. The price of grains was picking up dynamically.
    In October 2006, wheat broke through the 5 USD mark for the first time and remained there. Then, in June 2007, wheat prices rose to 6 USD, climbed to 7 USD in August, 8 USD at the beginning of September, 9 USD at the end of that month, and rose to 9.50 USD at the beginning of October.
    Meanwhile, global inventories continued to fall and reached a 26-year low. In addition, in Canada—another major wheat exporter on the world market—grain reserves plunged 29 percent year-on-year at the end of July, while Egypt, Jordan, Japan, and Iraq placed buying orders for large quantities of wheat.

    Figure 24. Wheat prices in US cents/bushel, 2005–2008, Chicago Board of Trade. Data: Bloomberg, 2019.

    After this fast-paced rally, international wheat prices took a breather, but in hindsight that turned out to be just a short break. At the beginning of February 2008, wheat prices broke through the 10 USD barrier, and the price momentum continued. The closing price on February 27, 2008, was 12.80 USD, a dramatic tripling since early 2006!
    The devastating drought had caused losses of around 50 percent in the recent Australian harvest. The situation began to relax slightly with the 2007–2008 harvest of 609 million tons, as the rapid increase in wheat prices had proved an incentive for many farmers to plant previously fallow land. A harvest of 688 million tons worldwide was estimated for 2008–2009. By then the unprecedented Australian drought finally had come to an end. However, weather experts painted a bleak picture for the country’s agriculture in the future.

    Key Takeaways
    •The year 2006 was the third driest in Australia since weather records started in 1900, but 2007 topped it. That year turned out to be the hottest year in history.
    •After several lean years, the Millennium Drought caused devastating damages to Australian agriculture. The national wheat harvest dropped by 50 percent, and global grain markets panicked, since Australia was the biggest global exporter of wheat after the United States.
    •In October 2006, wheat topped 5 USD for the first time. In summer 2007, the rally in wheat prices intensified. In February 2008, wheat prices broke the psychological barrier of 10 USD and closed the month at 12.80 USD. Prices had tripled since early 2006.
    •The Millennium Drought in Australia was caused by El Niño, a weather phenomenon whose strength and frequency could be directly linked to global climate change, according to environmental and weather experts.

    28 Natural Gas: Aftermath in Canada 2007

    The new CEO of the Bank of Montreal, Bill Downe, must report a record loss for the second quarter of 2007 due to failed commodity price speculation. Half a year after Amaranth’s bankruptcy, another natural gas trading scandal shakes market participants’ confidence.

    “How all of a sudden does a USD 450 million loss just materialize like this? Was it a lack of control from a risk perspective or was somebody hiding trades in a desk drawer?” —Leigh Parkinson, Risk Advisory

    It was the middle of April when three of the directors of Optionable, a New York commodity broker, unloaded a share package worth nearly 30 million USD. Just days later, the auditor Deloitte and Touche released a report to its principal, the Bank of Montreal (BMO), stating that there was a 350 to 450 million CAD loss in its natural gas portfolio. This came as a nasty surprise for CEO Bill Downe, who had been in his position for only a month and who was about to announce BMO’s quarterly figures.

    A Canadian Institution

    Founded in 1817, the Bank of Montreal (BMO) is the fourth-largest bank in Canada in terms of deposits and has played a major role in the development of the country, having financed the construction of the first transcontinental railroad in the 1880s. Today BMO’s business activities are divided into private and commercial clients (retail banking), investment banking (BMO capital markets), and wealth management. Tony Comper served as CEO from 1990 to 2007, and during his leadership, in 2000, a small trading scandal occurred in futures trading of natural gas, causing damage of around 30 million CAD. Seven years later, Bill Downe took over.
    The responsible trader at BMO was David Lee, who dealt in natural gas options both on the New York Mercantile Exchange (NYMEX) and over the counter. Lee had joined BMO in his mid-20s, coming from the Bank of New York, where he had been involved in building the commodity derivatives business from scratch. Beginning as an analyst, he soon switched to trading and specialized in natural gas options.
    At BMO, Lee handled a large portion of his trades via Optionable. For a broker like Optionable with fewer than 20 employees, these trades represent almost 30 percent of his total revenue. It was no wonder that Lee and Kevin Cassidy, the CEO of Optionable, were close friends.

    BMO’s commodity trading achieved a huge profit in 2006.

    Trading in natural gas delivered an attractive additional income for BMO. Its commodity trading was 15 to 20 times larger than that of the Canadian market leader, the Royal Bank of Canada (RBC). BMO’s energy-trading business had grown to 25 traders. The bank had offices in Houston, New York, and Canadian energy metropolis Calgary, where in March 2006, at BMO’s annual general meeting, Tony Comper had announced excellent results in the investment banking segment, driven primarily by trading profits in oil and gas.

    The commodity business was booming. Due to the damage caused by Hurricane Katrina in 2005, the price of natural gas was rising. In 2004 and the first half of 2005, the price hovered between 6 and 7 USD, but after the hurricane season, corporate clients increasingly were interested in price-hedging transactions. In December 2005, the price of US natural gas went over 15 USD/MMBtu.
    This trend did not go on forever, though. Within weeks benchmark gas prices in New York had lost around two-thirds of their value. A mild winter ensured a sufficient supply of the commodity, which this time was unaffected by hurricanes. Customer interest cooled down significantly, but energy trading at BMO continued to grow.

    The BMO team around David Lee was betting on a rebound in prices.

    BMO’s star trader David Lee got it massively wrong with natural gas options.

    Market participants could see that someone was building massive options positions on the NYMEX and over the counter, but prices continued to fall and volatility declined. The value of call options imploded.
    The trading positions in Lee’s team were getting out of balance, but he was able to disguise his losses with the help of Optionable. Later the law firm Schatz Nobel Izard would accuse Optionable of having helped the BMO trader falsify his book and, among other things, of confirming incorrect trading prices. When Deloitte and Touche examined the upcoming quarterly figures, the loss could no longer be concealed. The auditors estimated the deficit came to 350 to 450 million CAD. BMO canceled collaboration with Optionable immediately, and Optionable stock lost almost 90 percent of its value.

    Figure 25. Natural gas prices in USD/MMBtu, 2003–2007, New York Mercantile Exchange. Data: Bloomberg, 2019.

    At the end of April 2007, just days before the announcement of its quarterly figures, BMO announced a profit warning and pointed to the bank’s deferred trading positions in the commodity market, namely positions in natural gas, that would weigh heavily on quarterly profits. Companies such as Goldman Sachs and Citadel, a major Chicago hedge fund manager, showed interest in taking over the portfolio. However, BMO’s managers were convinced that they could handle the situation themselves. It turned out, though, that publicizing the trading positions before they could be reduced was the wrong strategy. The losses continued to increase.
    When the quarterly figures came out in May, BMO had upped the losses on its commodity trading book to 680 million USD, the equivalent of about 12 percent of its total annual profit. Gritting his teeth, Downe reported the biggest trade loss of any Canadian bank in history, blaming market illiquidity and lower volatility. His rationale was not wrong, but market participants were skeptical, and analysts asked some unpleasant questions, about both the bank’s business strategy and the quality of its risk management. Bob Moore, executive managing director for commodity products, and David Lee had to leave the company. Lee was fined 500,000 USD and was banned from working in the banking industry. The total cost of the BMO trade scandal added up to around 850 million USD.

    Key Takeaways
    •Half a year after Amaranth Advisors’ bankruptcy, another natural gas trading scandal shook the commodity markets in 2007.
    •David Lee was a celebrated star trader at BMO, and he and his team bet on a rebound of natural gas prices, after prices had declined from a record high of 15 USD due to damages from a record hurricane season.
    •But prices declined further. Natural gas even traded temporarily below 4 USD again. For a while, Lee could disguise his loss of 350 to 450 million USD with the help of his broker Optionable. But auditors uncovered the problem.
    •After earning record profits the year before, Lee’s energy trading imploded. Losses from the trading scandal added up to more than 800 million USD.

    29 Platinum: All Lights Out in South Africa 2008

    Due to ongoing supply bottlenecks of electricity from Africa’s largest energy provider, Eskom, South Africa’s major mining companies restrict their production, and the price of platinum explodes.

    “South Africa needs at least 40 new coal mines to prevent shortages over the long term.” —Brian Dames, Eskom

    “Restoring energy security for the country is an absolute imperative.” —Cyril Ramaphosa, president of South Africa in 2019

    Two years before the World Cup kickoff in June 2010 in South Africa, the country faced its worst electricity supply bottleneck in decades. In spring 2008 the government declared an energy emergency. The national utility company Eskom—the largest electricity provider in Africa—shut down power for several hours every day for weeks, since its capacity lagged far below demand. For 20 years the country’s economy had been growing at a rapid pace. Electricity demand had risen 50 percent since the end of apartheid in 1994, but the South African government and Eskom had failed to provide additional capacity. The electricity company had repeatedly stressed that the nation’s power plants would have to be overhauled and new power plants built, but government agencies ignored these warnings.

    Because there was not enough power available, electricity was rationed at various intervals and in different zones, resulting in two- to three-hour power outages every day. Particularly affected were Johannesburg and the Gauteng region, the center of gold and platinum production. Around half of the mining companies’ energy demand was needed just to maintain infrastructure. Without electricity, the water could no longer be pumped out of the mines, and getting sufficient oxygen several kilometers deep became critical. The impact on actual production was even more dramatic. The Miners’ Union said that the companies sent tens of thousands of workers home or for training. At the end of January, the situation worsened. The energy company operated the world’s largest coal-fired power plant, the Kendal power plant, and Eskom’s coal reserves were being soaked by rainfall. At this point international precious metal prices began to react.

    Eskom turned off the power for the mining companies.

    Precious Platinum and Palladium

    The group of platinum metals (PGMs) includes platinum, palladium, rhodium, iridium, osmium, and ruthenium, but the economically important metals in this group are platinum and palladium, whose trading is overseen by the London Platinum and Palladium Market (LPPM). South Africa and Russia together account for around 90 percent of the world’s platinum metals production. Smaller producer countries are Canada, the United States, and Zimbabwe. The major companies are Anglo American Platinum (Amplats), Impala Platinum (Implats), Lonmin in South Africa, and Norilsk Nickel in Russia. In recent years, Sibanye has also grown into a new player through takeovers and acquisitions.
    Platinum is mainly used for catalysts (50 percent) and jewelry (25 percent); while for palladium, in addition to those applications, dentistry and electronics are important. Price-determining factors for both metals are Russian and South African production, Russian inventories, and global growth rates.
    South Africa had been the center of global gold production since the end of the 19th century, though it had fallen back over the past 30 years to eighth place. However, South Africa still has a dominant position in producing platinum. Around 80 percent of the world’s production comes from that country, with the overwhelming majority being produced in the Bushveld complex. The prices for platinum are correspondingly sensitive to any negative news from South Africa.
    Prices for platinum had been rising steadily since mid-2005, but the momentum increased significantly in late 2007 and early 2008. For the first time in seven years, the multinational firm Johnson Matthey, the world market leader in auto catalysts and thus the largest customer of platinum, expected falling shipments for the entire year.

    Figure 26. Platinum prices in USD/troy ounce, 2004–2009. Data: Bloomberg, 2019.

    At the end of January 2008, the news that the three largest gold producers in South Africa and the largest platinum producer were reducing production in all mines caused prices to jump. Amplats, with a 40 percent market share, expected production losses of 9,000 ounces per day. The number-two firm, Impala Platinum, claimed to lose about 3,500 ounces per day. Overall, South Africa’s platinum miners feared a 2008 production loss of 0.5 million ounces.

    By March 2008 the price of platinum rose to more than 2,200 USD/oz.

    In addition to gold, the price of platinum in particular rose overnight by almost 100 USD to more than 1,700 USD. At the beginning of March 2008, the price of a troy ounce of platinum closed at more than 2,250 USD, a temporary price maximum.
    Electricity supplier Eskom slowly began to regain control of the situation, but industry production was still running at only 90 percent capacity, and the company predicted that supply problems would continue until at least 2020.
    And the years of mismanagement and corruption continued. In February 2019 the situation escalated again, as Cyril Ramaphosa, the president of South Africa following Jacob Zuma, declared Eskom to be “too big and too important to fail” during the Indaba mining conference in Cape Town. Besides its aging coal-fired plants, the company suffers from a debt level of more than 30 billion USD. A breakup, a government rescue plan, as well as a 15% increase in its tariffs to its industrial customers are in the cards for 2019. At the same time, an ounce of platinum costs 800 USD—a new price rally is about to unfold!

    Key Takeaways
    •In 2008, South Africa faced its worst electricity supply bottleneck in decades, and the government declared an energy emergency. Eskom, the national utility company and the largest electricity provider in Africa, shut down power for several hours every day.
    •Although South Africa’s golden days of gold mining were over, it remained the dominant force in platinum group metals, with about 80 percent of the world’s production.
    •At the end of January 2008, the three largest gold producers and the largest platinum producers all reduced their mine production as a result of continuing power outages.
    •That development spurred prices for platinum, which had been rising steadily since mid-2005 and had already reached 1,000 USD. By March 2008, the price of platinum climbed above 2,200 USD per troy ounce, its highest price ever!

    30 Rice: The Oracle 2008

    The Thai “Rice Oracle,” Vichai Sriprasert, predicts in 2007 that rice will increase in price from 300 USD to 1,000 USD, and he becomes a figure of ridicule and mockery. However, a dangerous chain reaction affecting the rice harvest is about to start in Asia and, with Cyclone Nargis, culminates in a catastrophe.

    “National hoarding really doesn’t help the market.” —Robert Zeigler,
    International Rice Research Institute

    At 65, Vichai Sriprasert was one of Thailand’s largest rice exporters, nicknamed the “Rice Oracle.” Years of experience with the interrelationship between supply, demand, and price development had earned Vichai a lot of money as well as the honorary chairmanship of the Thai Association of Rice Traders. As the world’s largest exporter of rice, Thailand was a determining factor in international trade.
    Disbelief and ridicule were the initial reactions to Vichai’s prediction, in 2007, that rice prices were likely to exceed 1,000 USD per ton in the following year. At the time Thai export rice was priced at around 300 USD per ton. After a rapid increase in the price of oil and dramatically higher prices for wheat and corn, however, the laughter disappeared. In spring 2008, the price of rice actually broke Vichai’s targeted 1,000 USD mark. And it would continue to rise. For Vichai, the situation was comparable to the 1970s, when in the shadow of the oil crisis, rice prices rose to around 2,700 USD per metric ton.

    Rice Realities

    According to figures from the Food and Agriculture Organization (FAO), rice—along with corn and wheat—is one of the most widely cultivated cereals in the world, with an annual production of around 650 million metric tons. The largest producer countries are China, India, Indonesia, Bangladesh, Vietnam, and Thailand. Due to its predominantly wet cultivation, between 3,000 and 5,000 liters of flowing water are needed per kilogram of rice. On the one hand, this has a positive effect in terms of lower pest and weed infestation; on the other hand, this can lead to serious crop failures in periods of dry weather.
    Despite the importance of rice, futures trading is insignificant, with less liquidity than the wheat or corn market. The most important trading place for rice is the Chicago Board of Trade (CBOT) in the United States. Traded contracts are quoted in US cents per American centner or hundredweight (1 cwt equals 100 lb equals 45.359 kg), with one contract covering 2,000 hundredweights.
    What had happened? Driven by the rising price of crude oil, the prices of many agricultural goods rose sharply in 2007, a condition called “agflation.” The food price index, calculated by the FAO, had risen by 57 percent within just one year, from March 2007 to March 2008. Wheat and soybean prices also doubled, and the price of corn had increased by 66 percent since autumn 2007.

    Figure 27. Rice prices in US cents/cwt, 2000–2010, Chicago Board of Trade. Data: Bloomberg, 2019.

    However, the price of rice was still well above that of other agricultural goods and was developing its own momentum in spring 2008. From June 2007 to April 2008, rice prices rose by around 75 percent—even more in Asia. Prices increased from 400 USD per metric ton to more than 1,000 USD.
    The price spike had widespread consequences. Rice is a staple food for around three billion people, and in many countries nearly half of household income is spent on nutrition. The rise in prices threatened political stability in several countries and caused serious unrest around the world. In Haiti several people were killed in protests, and uprisings were reported in Egypt, Burkina Faso, Cameroon, Indonesia, Côte d’Ivoire, Mauritania, Mozambique, and Senegal. How did all this happen?

    The globally traded rice volume of 30 million tons was very low compared to the total production of 650 million tons.

    The rice market is generally subject to structural deficits. The average amount of rice traded on the world markets per year—around 30 million metric tons—is very low compared to global production of around 650 million tons. This makes global prices extremely vulnerable to short-term fluctuations in supply and demand. Urbanization, demographics, and the demand for alternative energies and weather conditions all are influential factors and also apply to other agricultural goods to some extent.
    For example, rapid urbanization in Asia has destroyed more and more agricultural acreage, and increasing prosperity on that continent has also led to more meat consumption, increasing the amount of grain needed to feed livestock. The consumption of meat in China alone increased by about 150 percent in the past 30 years. Furthermore, the rice fields of Asia have had to absorb an annual birth rate of about 80 million babies in the region. Indirectly, the high price of oil and a related increase in demand for biofuels are also driving up the price of rice, as many farmers switch to the more profitable cultivation of corn, wheat, and oilseeds.
    Some countries recorded significant losses in their rice harvest due to weather in 2007–2008. Thunderstorms and floods destroyed more than 20 million hectares of fields within one year, twice the total acreage of Thailand. Bangladesh, generally a major exporter of rice, suffered significant crop losses in 2007 from floods and Tropical Storm Sidr, which destroyed almost the entire crop. The rice harvest in Vietnam was also hampered by severe pest infestation and disease. As a result, the price of rice continued to rise, and the situation gradually worsened.
    With panic buying and export restrictions, the dominoes were falling: In Asia, supplies continued to be stretched. The rice-exporting countries of Vietnam and India issued restrictions on the export of rice, while India slowed exports to stabilize prices at home. Other exporting countries, such as China, Egypt, and Cambodia, joined in with quotas and taxes. China was so worried about supplying its own population that it waived exports until further notice, while in Thailand, farmers, traders, and rice mills began to hoard their rice.

    In Asia, hoarding and export restrictions worsened the already tight supply.

    Everywhere in the region there was panic buying. Even in the United States, Wal-Mart rationed its sales to customers. The world’s largest importer, the Philippines, announced massive purchases to forestall further supply shortages. Importing countries like Bangladesh, Indonesia, and Iran were also affected. And then, on the night of May 3, a catastrophe occurred.
    Cyclone Nargis hit the coast of Myanmar, devastating the rice supply region in the middle of the harvest season and leaving between 50,000 and 100,000 people dead. The price of rice shot up again, and the risk of famine and revolts caused by hunger rose. As the price of rice quadrupled, many regions were threatened by unrest. In addition to the tight supply and the unfavorable weather, export restrictions and hoarding had created an artificial shortage, dramatically exacerbating the situation. Even Vichai did not foresee how bad the situation would become.
    In May 2008, however, the supply situation eased. Pakistan, one of the largest rice producers, loosened its export restrictions, and the crop in India was more than 2 million metric tons larger than expected. However, the structural problems of the rice market would remain. Given a comparatively small international market, repeated supply bottlenecks in Asia are to be expected in the future.

    Key Takeaways
    •In the beginning of 2007, Vichai Sriprasert, the “Rice Oracle” of Thailand, predicted a massive increase in the price of rice, a ridiculous thought at that time.
    •Later in 2007, however, prices of many agricultural goods rose sharply, driven by increasing crude oil prices (“agflation”). The situation in the rice market was especially critical.
    •From June 2007 to April 2008, rice prices in Asia increased from 400 USD to more than 1,000. Hoarding and export restrictions worsened an already tight supply.
    •When Cyclone Nargis hit Myanmar in May 2008, it devastated that country’s rice harvest and left as many as 100,000 people dead.
    •The price of rice quadrupled, and many regions were threatened by unrest, causing difficulties that even the Rice Oracle did not foresee.

  • Torsten Dennin《From Tulips to Bitcoins_ A History of Fortunes Made and Lost in Commodity Markets》1-15

    “The Wheel of Time turns and, Ages come and pass, leaving memories that become legend. Legend fades to myth, and even myth is long forgotten when the Age that gave it birth comes again.”—Robert Jordan (1948–2007), The Wheel of Time

    “Wall Street people learn nothing and forget everything [. . .] to give way to hope, fear and greed.” —Benjamin Graham (1894–1976)

    Contents

    Introduction
    1.Tulip Mania: The Biggest Bubble in History (1637)
    In the Netherlands in the 17th century, tulips become a status symbol for the prosperous new upper class. Margin trading of the flower bulbs, which are weighed in gold, turns conservative businessmen into reckless gamblers who risk their homes and fortunes. In 1637 the bubble bursts.
    2.The Dojima Rice Market and the “God of Markets” (1750)
    In the 18th century, futures contracts on rice are introduced at the Dojima rice market in Japan. The merchant Homma Munehisa earns the nickname “God of Markets” for his market intelligence, and he becomes the richest man in Japan.
    3.The California Gold Rush (1849)
    Gold Rush! Some 100,000 adventurers stream into California in 1849 alone, lured by the vision of incredible wealth. The following year, the value of gold production in California exceeds the total federal budget of the United States. Because of this treasure, California becomes the 31st state in the Union in 1850.
    4.Wheat: Old Hutch Makes a Killing (1866)
    The Chicago Board of Trade is established in 1848, and Benjamin Hutchinson, known as “Old Hutch,” later becomes famous by successfully cornering the wheat market. He temporarily controls the whole market and earns millions.
    5.Rockefeller and Standard Oil (1870)
    The US Civil War triggers one of the first oil booms. During this time, John D. Rockefeller founds the Standard Oil Company. Within a few years, through an aggressive business strategy, he dominates the oil market, from production and processing to transport and logistics.
    6.Wheat: The Great Chicago Fire (1872)
    The Great Chicago Fire of October 1871 leads to massive destruction in the city and leaves more than 100,000 residents homeless. The storage capacities for wheat are also significantly reduced. Trader John Lyon sees this as an opportunity to earn a fortune.
    7.Crude Oil: Ari Onassis’s Midas Touch (1956)
    Aristotle Onassis, an icon of high society, seems to have the Midas touch. Apparently emerging out of nowhere, he builds the world’s largest cargo and tanker fleet and earns a fortune with the construction of supertankers and the transport of crude oil. Onassis closes exclusive contracts with the royal Saudi family, and he is one of the winners in the Suez Canal conflict.
    8.Soybeans: Hide and Seek in New Jersey (1963)
    Soybean oil fuels the US credit crisis of 1963. The attempt to corner the market for soybeans ends in chaos, drives many firms into bankruptcy, and causes a loss of 150 million USD (1.2 billion USD in today’s prices). Among the victims are American Express, Bank of America, and Chase Manhattan.
    9.Wheat: The Russian Bear Is Hungry (1972)
    The Soviet Union starts to buy American wheat in huge quantities, and local prices triple. Consequently, Richard Dennis establishes a groundbreaking career in commodity trading.
    10.The End of the Gold Standard (1973)
    Gold and silver have been recognized as legal currencies for centuries, but in the late 19th century silver gradually loses this function. Gold keeps its currency status until the fall of the Bretton Woods system in 1973. The current levels of sovereign debt are causing many investors to reconsider an investment in precious metals.
    11.The 1970s—Oil Crisis! (1973 & 1979)
    During the 1970s the world must cope with global oil crises in 1973 and 1979. The Middle East uses crude oil as a political weapon, and the industrialized nations— previously unconcerned about their rising energy addiction and the security of the supply—face economic chaos.
    12.Diamonds: The Crash of the World’s Hardest Currency (1979)
    Despite the need for individual valuation, diamonds have shown a positive and stable price trend over a long period of time. In 1979, however, monopolist De Beers loses control of the diamond market; “investment diamonds” drop by 90 percent in value.
    13.“Silver Thursday” and the Downfall of the Hunt Brothers (1980)
    Brothers Nelson Bunker Hunt and William Herbert Hunt try to corner the silver market in 1980 and fail in a big way. On March 27, 1980, known as “Silver Thursday,” silver loses one-third of its value in a single day.
    14.Crude Oil: No Blood for Oil? (1990)
    Power politics in the Middle East: Kuwait is invaded by Iraq, but Iraq faces a coalition of Western countries led by the United States and has to back down. In retreat, Iraqi troops set the Kuwaiti oil fields on fire. Within three months the price of oil more than doubles, from below 20 to more than 40 USD.
    15.The Doom of German Metallgesellschaft (1993)
    Crude oil futures take Metallgesellschaft to the brink of insolvency and almost lead to the largest collapse of a company in Germany since World War II. CEO Heinz Schimmelbusch is responsible for a loss of more than 1 billion USD in 1993.
    16.Silver: Three Wise Kings (1994)
    Warren Buffett, Bill Gates, and George Soros show their interest in the silver market in the 1990s—investing in Apex Silver Mines, Pan American Silver, and physical silver. It is silver versus silver mining. Who would lead and who would lag?
    17.Copper: “Mr. Five Percent” Moves the Market (1996)
    The star trader of Sumitomo, Yasuo Hamanaka, lives two lives in Tokyo, manipulating the copper market and creating record earnings for his superiors but also carrying on risky private trades. In the end, Sumitomo endures a record loss of 2.6 billion USD, and Hamanaka is sentenced to eight years in prison.
    18.Gold: Welcome to the Jungle (1997)
    In the jungle of Borneo, Canadian firm Bre-X supposedly finds a gold deposit with a total estimated value of more than 200 billion USD. Large mining companies and Indonesian president Suharto all want a piece of the pie, but in March 1997 the discovery turns out to be the largest gold fraud of all time.
    19.Palladium: More Expensive Than Gold (2001)
    In 2001 palladium becomes the first of the four traded precious metals—gold, silver, platinum, and palladium—whose price breaks the psychological mark of 1,000 USD per ounce. That represents a tenfold increase in just four years. The reason lies in continuing delivery delays by the most important producer: Russia.
    20.Copper: Liu Qibing Disappears Without a Trace (2005)
    A trader for the Chinese State Reserve Bureau shorts 200,000 tons of copper and hopes for falling prices. However, when copper prices climb to new records, he disappears and his employer pretends never to have heard of him. What sounds like the plot of a thriller shocks metal traders all over the world.
    21.Zinc: Flotsam and Jetsam (2005)
    The city of New Orleans, called The Big Easy, is well known for its jazz, Mardi Gras, and Creole cuisine. Less well known, however, is that about one-quarter of the world’s zinc inventories are stored there. Hurricane Katrina’s flooding makes the metal inaccessible, and concerns over damage cause the price of zinc to rise to an all-time high.
    22.Natural Gas: Brian Hunter and the Downfall of Amaranth (2006)
    In the aftermath of the closure of MotherRock, an energy-based hedge fund, the bust of Amaranth Advisors shakes the financial industry, as it is the largest hedge fund failure since the collapse of Long-Term Capital Management in 1998. The cause? A failed speculation in US natural gas futures. Brian Hunter, an energy trader at Amaranth, loses 6 billion USD within weeks.
    23.Orange Juice: Collateral Damage (2006)
    “Think big; think positive. Never show any sign of weakness. Always go for the throat. Buy low; sell high.” That’s the philosophy of Billy Ray Valentine, played by Eddie Murphy in the 1983 movie Trading Places. The film’s final showdown has Murphy and Dan Aykroyd cornering the orange juice market. In reality, the price of frozen orange juice concentrate would quadruple between 2004 and 2006 on the New York Mercantile Exchange—a consequence of a record hurricane season.
    24.John Fredriksen: The Sea Wolf (2006)
    John Fredriksen controls a corporate empire founded on transporting crude oil. Among the pearls of that empire is Marine Harvest, the largest fish-farming company in the world.
    25.Lakshmi Mittal: Feel the Steel (2006)
    The dynamic growth of the Chinese economy and its hunger for raw materials rouses the suffering steel industry from near death. Through clever takeovers and the reorganization of rundown businesses, Lakshmi Mittal rises from a small entrepreneur in India to the largest steel tycoon in the world, a position he crowns with the acquisition of his main competitor and the world’s second-largest steel producer—Arcelor.
    26.Crude Oil: The Return of the “Seven Sisters” (2007)
    An exclusive club of companies controls oil production and worldwide reserves. But its influence diminishes with the founding of the Organization of the Petroleum Exporting Countries (OPEC) and the rise of state oil companies outside the Western world.
    27.Wheat and the “Millennium Drought” in Australia (2007)
    After seven lean years for Australia’s agricultural sector, a Millennium Drought drives the price of wheat internationally from record to record. Thousands of Australian farmers expect a total failure of their harvest. Is this a preview of the effects of global climate change?
    28.Natural Gas: Aftermath in Canada (2007)
    The new CEO of the Bank of Montreal, Bill Downe, must report a record loss for the second quarter of 2007 due to failed commodity price speculation. Half a year after Amaranth’s bankruptcy, another natural gas trading scandal shakes market participants’ confidence.
    29.Platinum: All Lights Out in South Africa (2008)
    Due to ongoing supply bottlenecks of electricity from Africa’s largest energy provider, Eskom, South Africa’s major mining companies restrict their production, and the price of platinum explodes.
    30.Rice: The Oracle (2008)
    The Thai “Rice Oracle,” Vichai Sriprasert, predicts in 2007 that rice will increase in price from 300 USD to 1,000 USD, and he becomes a figure of ridicule and mockery. However, a dangerous chain reaction affecting the rice harvest is about to start in Asia and, with Cyclone Nargis, culminates in a catastrophe.
    31.Wheat: Working in Memphis (2008)
    The price of wheat speeds from record to record. Trader Evan Dooley bets on the wrong direction, juggling 1 billion USD and dropping the ball. This results in a loss of 140 million USD for his employer, MF Global, in February 2008.
    32.Crude Oil: Contango in Texas (2009)
    The price of West Texas Intermediate (WTI) crude oil collapses, unsettling commodity traders around world attention. A 10,000-person community in Oklahoma becomes the center of the world. The concept of “super-contango” is born, and investment banks enter the tanker business.
    33.Sugar: Waiting for the Monsoon (2010)
    A severe drought threatens India’s sugar harvest, and the world’s largest consumer becomes a net importer on the world market. Brazil, the largest exporter of sugar, has its own problems. As a result, international sugar prices rise to a 28-year high.
    34.Chocolate Finger (2010)
    Due to declining harvests in Côte d’Ivoire (the Ivory Coast)—the largest cocoa exporter on the world market—prices are rising on the international commodity futures markets. In the summer of 2010, cocoa trader Anthony Ward, “Chocolate Finger,” wagers more than 1 billion USD on cocoa futures.
    35.Copper: King of the Congo (2010)
    The copper belt of the Congo is rich in natural resources, but countless despots have looted the land. Now Eurasian Natural Resources Corporation (ENRC) is reaching out to Africa, and oligarchs from Kazakhstan aren’t shy about dealing with shady businessmen or the corrupt regime of President Joseph Kabila.
    36.Crude Oil: Deep Water Horizon and the Spill (2010)
    Time is pressing in the Gulf of Mexico. After a blowout at the Deepwater Horizon oil rig, a catastrophe unfolds—the biggest oil spill of all time. About 780 million liters of crude oil flow into the sea. Within weeks BP loses half its stock-market value.
    37.Cotton: White Gold (2011)
    The weather phenomenon known as La Niña causes drastic crop failures in Pakistan, China, and India due to flooding and bad weather conditions. Panic buying and hoarding drive the price of cotton to a level that has not been reached since the end of the American Civil War 150 years ago.
    38.Glencore: A Giant Steps into the Light (2011)
    In May 2011, the world’s largest commodity trading company—a conspicuous and discreet partnership with an enigmatic history—holds an IPO. The former owners, Marc Rich and Pincus Green, have been followed by US justice authorities for more than 20 years. Without mandatory transparency or public accountability in the past, they were able to close deals with dictators and rogue states around the world.
    39.Rare Earth Mania: Neodymium, Dysprosium, and Lanthanum (2011)
    China squeezes the supply of rare earths, and high-tech industries in the United States, Japan, and Europe ring the alarm bell. But the Chinese monopoly can’t be broken quickly. And the resulting sharp rise in rare earth prices lures investors around the globe.
    40.The End? Crude Oil Down the Drain (2016)
    A perfect storm is brewing for the oil market. There is an economic slowdown and too much storage because of contango. The world seems to be floating in oil, whose price falls to 26 USD in February 2016. But the night is always darkest before dawn, and crude oil and other commodities find their multiyear lows.
    41.Electrification: The Evolution of Battery Metals (2017)
    Elon Musk and Tesla are setting the pace for a mega trend: electrification! Demand from automobile manufacturers, utilities, and consumers pushes lithium-based battery usage to new heights. For commodity markets, it is not only lithium and cobalt but also traditional metals like copper and nickel that are suddenly in high demand again. Electrification might prove to be the “new China” for commodity markets in the long term.
    42.Crypto Craze: Bitcoins and the Emergence of Cryptocurrencies (2018)
    Bitcoins, the first modern cryptocurrency, emerged in 2009. The value of bitcoins explodes in 2017 from below 1,000 to above 20,000 USD, attracting worldwide attention. This stellar price rise, followed by a crash of almost 80 percent in 2018, makes bitcoins the biggest financial bubble in history, dwarfing even the Dutch tulip mania of the 17th century. Despite the boom and bust, the future looks bright, as underlying blockchain technology reveals its potential and starts to revolutionize daily life.

    Introduction

    “The price of a commodity will never go to zero . . . you’re not buying a piece of paper that says you own an intangible piece of company that can go bankrupt.” —Jim Rogers

    Commodities came into vogue with the beginning of the new millennium, as investing in crude oil, gold, silver, copper, wheat, corn, or sugar was introduced and marketed massively as an “investment theme” and a “new” asset class by banks and other financial intermediaries. The first investable commodity indices—the S&P Goldman Sachs Commodity Index and the Dow Jones AIG Commodity Index—were developed in the early 1990s, but after the turn of the millennium, every major investment bank offered its own commodity index and index concept. This development opened up a new and attractive asset class for institutional investors and wealthy individuals. We witness today the same development in the cryptocurrency world, making an exotic new asset class investable for the public.
    The rapid growth of the Chinese economy is the key parameter of the commodity boom, which has been evident since around the year 2000, when the “workbench of the world” developed a gigantic hunger for raw materials: Imports of iron ore, coal, copper, aluminum and zinc began soaring, and China became the dominant factor in worldwide demand. The dynamic growth of the Chinese economy catapulted commodity prices sky-high. Like a gigantic vacuum cleaner, China swept up the markets for energy, metals, and agricultural goods, and prices kept rising, since supply growth couldn’t keep up with rising demand.
    At least temporarily, the collapse of Lehman Brothers and the worsening financial crisis caused a break in the skyrocketing prices. Crude oil crashed from its high at 150 USD/barrel during the summer of 2008 to below 40 USD in the spring of 2009. In the course of the year, prices recovered again, to above 80 USD. Industrial metals also benefited from the economic recovery. In the aftermath of the financial crisis, and amid worries about rising public debt as well as the stability of the financial system, the interest of investors in gold rose substantially. In 2009, with the European debt crisis looming, gold surpassed the level of 1,000 USD for the first time, but it climbed as high as 1,900 USD per troy ounce in 2011.
    Exotic agricultural products such as sugar, coffee, and cocoa were also among the goods that experienced significant price increases in 2009, as the ghost of “agflation” returned and spooked markets. Market recovery after the financial market meltdown of 2008/2009 proved not to be sustainable, however. After April 2011, commodity markets entered a severe five-year bear market. A period of sluggish growth, deleveraging, and a slower economy in China worsened a massive imbalance of demand and supply for raw materials. A supply glut caused crude oil to fall back to 26 USD early in 2016. But since then, commodity markets have turned around. In 2016, for the first time in five years, they closed positive.

    The Commodity Market and Cryptocurrencies—Some Basics

    A commodity is any raw or primary economic good that is standardized. Organized commodity trading in the United States dates back almost 200 years, but commodity trading has a much longer history. It goes back several thousand years to ancient Sumerians, Greeks, and Romans, for example. In comparison to commodity trading, the history of the stock market—where you exchange pieces of ownership in companies—is much younger. In 1602 the Dutch East India Company officially became the world’s first publicly traded company on the Amsterdam Stock Exchange in Europe. In the United States, the first major stock exchange was the New York Stock Exchange, created in 1792 on Wall Street in New York City.

    Commodities can be categorized into energy, metals, agriculture, livestock, and meat. You can also differentiate between hard commodities like metals and oil, which are mined, and soft commodities that are grown, like wheat, corn, cotton, or sugar.

    By far the most important commodity sector is crude oil and its products like gasoline, heating oil, jet fuel, or diesel. With the world consuming more than 100 million barrels of crude oil every day, that comes to a market value in excess of 6 billion USD per day, or 2.2 trillion USD per year! About three-quarters of crude oil goes into the transportation sector, fueling cars, trucks, planes, and ships.

    Metal markets are usually divided into base and precious metals. By tonnage, iron ore is the biggest metal market, with more than 2.2 million tons of iron ore mined globally. Nearly two-thirds of global exports go to China; that’s around 1 billion metric tons! At 70 USD per ton, the market value of iron ore, on the other hand, is rather small. The biggest metal market, in value of US dollars, is gold. Around 3,500 tons are mined per year, an equivalent of 140 billion USD. The total aboveground stocks of gold are estimated at around 190,000 tons; that makes gold a physical market of nearly 8 trillion USD. In value terms, copper, aluminum, and zinc are next, whereas other precious metal markets—silver, platinum, or palladium—are rather small.

    In agriculture and livestock, the biggest markets are grains like wheat and corn as well as oil seeds like soybeans, and sugar.

    Bitcoins were released as the first cryptocurrency in January 2009. Since then, more than 4,000 alternative coins (“altcoins”) have been invented. The website coinmarketcap.com tracks prices of about 2,000 of them on a daily basis. After massive price corrections in 2018, the total market capitalization of all cryptocurrencies dropped below 200 billion USD. Bitcoins remain the dominant cryptocurrency, with a market capitalization of almost 70 billion USD and a market share of 40 percent. The next five most traded cryptos are ripple, ethereum, stellar, bitcoin cash, and litecoin. Together these five cryptos amount to a market capitalization of 30 billion USD, less than half of bitcoins.

    Organized commodity trading by itself has a longer history than equity markets, a fact often overlooked in the focus on the dramatic price swings over the past decades. For example, the Chicago Board of Trade (CBOT) was founded in 1848 to provide a platform for trading agricultural products such as wheat and corn. But trade and the speculation in commodities is much older than that. Around 4000 BCE, Sumerians used clay tokens to fix a future time, date, and number of animals, such as goats, to be delivered, which resembles modern commodity future contracts. Peasants in ancient Greece sold future deliveries of their olives, and records from ancient Rome show that wheat was bought and sold on the basis of future delivery. Roman traders hedged the prices of North African grains to protect themselves against unexpected price increases.

    The history of commodity and crypto trading is colorful and instructive, and my aim with this book is to bring to life the most important episodes from the past up to the present. Some of these are spectacular boom-and-bust stories; others are examples of successful trading. All are worth paying attention to.

    The first six chapters cover major events from the 17th to the 19th century. The Dutch tulip mania of the 1600s is considered one of the first documented market crashes in history and is still a topic of university lectures. In the 18th century, rice market fortunes were earned and lost in Japan, and in the process candlestick charts—which are used today in the financial industry—were invented. In the 1800s, J. D. Rockefeller’s strategies and the rise of Standard Oil marked the beginning of the oil age. At nearly the same time in the midwestern United States, two men were trying to accumulate a fortune by manipulating wheat markets, while in California the Gold Rush broke out, with momentous consequences.

    The episodes of commodity trading in the 20th century read like a “Who’s Who” of business history: Aristotle Onassis, Warren Buffett, Bill Gates, and George Soros are just some of the major players. Meanwhile, crude oil was playing an increasingly important role.

    The 1970s saw a real boom in commodity markets. After a shortfall in its wheat harvest, the Soviet Union went shopping for US agricultural goods, reinforcing an already positive price trend in wheat, corn, and soybeans. It’s no overstatement to say that the rapid rise of crude oil prices during two oil crises in 1973 and 1979 changed the existing world order; the 1990 Gulf War was, in part, an attempt to reverse the clock. During this period the price of oil doubled. Among the collateral damage, the German conglomerate Metallgesellschaft was driven to the brink of insolvency by its crude oil-trading activities.

    In the years that followed, a boom in gold, silver, and diamond prices was followed by a crash, and the Hunt brothers lost their oil-based family fortune because of the collapsing silver price. Warren Buffett, Bill Gates, and George Soros later were also involved in the silver market. And in the jungles of Borneo, the biggest gold scam of all time culminated in the bankruptcy of Bre-X. Another huge speculation in 1996 was caused by the Japanese trader Hamanaka in the copper market. That was repeated almost ten years later by Chinese copper trader Liu Qibing, which also signaled the shift of economic forces from Japan to China.

    The emerging commodity boom of the new millennium attracted additional speculators and led to other boom-and-bust episodes. The collapse of Amaranth Advisors, which accumulated a loss of 6 billion USD within a few weeks by betting on natural gas, hit news headlines worldwide.

    Weather often has played a role. The flooding of New Orleans by Hurricane Katrina led to a price spike in zinc in London, as the majority of zinc warehouses licensed by the London Metal Exchange became inaccessible. An active Atlantic hurricane season in 2006 not only caused oil prices to rise due to damage in the Gulf of Mexico but also pushed the price of orange juice concentrate to new heights.

    A “millennium drought” threatened Australia, resulting in record high wheat prices worldwide. A few years later, a drought in India drove the price of sugar to levels that had not been observed for 30 years. Shortly before that, Cyclone Nargis in Asia caused a human catastrophe. Rice had to be rationed, and the rising prices led to unrest in several countries.

    These fateful events often contrast with individual speculations, in which huge sums of money were involved. For example, trader Evan Dooley lost more than 100 million USD in wheat futures, just a few weeks after the loss of billions by Jérôme Kerviel, in the proprietary trading of French banking giant Société Générale, made world headlines. In 2011, the heritage of Marc Rich, “The King of Oil,” was cashed in: Glencore celebrated its initial public offering, catapulting its CEO Ivan Glasenberg into the list of the top 10 richest people in Switzerland.

    As a new decade began, the trendy themes of commodity markets shifted first to rare earths like neodymium and dysprosium, then to “energy metals” like lithium and cobalt, which are essential for energy storage and the electrification of transportation in the future. Since 2009 blockchain and bitcoins have caught the attention of traders. With tradeable bitcoin futures introduced at COMEX in 2017, the cryptocurrency has now become a commodity. With prices starting the year below 1,000 USD, bitcoins rose to 20,000 USD in 2017; then the cryptocurrency crashed by 80 percent in the first weeks of 2018. In the history of the biggest financial bubbles of mankind, tulip mania was pushed to second place after 400 years at the top.

    The chapters in this book are framed by the biggest and the second biggest financial bubbles in financial history: tulips and bitcoins. In between are the stories of 40 major commodity market events over four centuries. These episodes were accompanied by extreme price fluctuations and individual outcomes, and they demonstrate that each market can be subject to a boom-and-bust cycle due to a change in supply, demand, or other external factors. This holds true for South African–dominated platinum production, sudden frost in coffee or orange harvests, unrest in Côte d’Ivoire that affected the price of cocoa, strikes by Chilean mine workers that pushed copper prices up, and the fluctuation of bitcoin and other cryptocurrency prices because of financial woes.
    Commodity and cryptocurrency markets are now at the crossroads of investment mega trends like demographic revolution, climate change, electrification, and digitalization. Investing in commodities, blockchain, and its applications will remain a thrilling ride.

    1 Tulip Mania: The Biggest Bubble in History 1637

    In the Netherlands in the 17th century, tulips become a status symbol for the prosperous new upper class. Margin trading of the flower bulbs, which are weighed in gold, turns conservative businessmen into reckless gamblers who risk their homes and fortunes. In 1637 the bubble bursts.

    “Like the Great Tulip Mania in Holland in the 1600s and the dot-com mania of early 2000, markets have repeatedly disconnected from reality.” —Tony Crescenzi, Pimco

    At the beginning of the 17th century, the Netherlands were on the threshold of a golden age, a period of economic and cultural prosperity that would last for about a hundred years. The country’s religious freedom attracted a great diversity of people who were persecuted elsewhere because of their faith. At this time, the small and recently founded Republic of the Seven United Netherlands was rising to the rank of world power, becoming one of the leading nations in international trade, while the rest of Europe stagnated.
    As the Hanseatic League (a dominant mercantile confederation in Europe in the Middle Ages) declined in power, the young maritime nation built colonies and trading posts around the world, including New Amsterdam (today’s New York), Dutch India (Indonesia), and outposts in South America and the Caribbean, such as Aruba and the Netherlands Antilles. In 1602 merchants founded the Dutch East India Company (Vereenigde Oostindische Compagnie—VOC), which was endowed with sovereign rights and commercial monopolies by the government. The VOC was the first multinational corporation and one of the largest trading companies of the 17th and 18th centuries. Merchants from Haarlem and Amsterdam experienced an unprecedented economic boom.
    The new class of rich merchants eagerly imitated the lifestyle of noble lords and ladies by building large estates with gigantic gardens. Tulips—which had arrived in Leiden from Armenia and Turkey in the 16th century by way of Constantinople, Vienna, and Frankfurt am Main—quickly became a luxury good and a status symbol of the wealthy. Upper-class women wore the exotic flowers as hair ornaments or on their clothes for social occasions.

    Tulip Mania on the Silver Screen

    Tulip mania is not only an important topic in economics and finance, but it also frequently surfaces in modern pop culture. In the movie Wall Street: Money Never Sleeps (2010), Michael Douglas explains to Shia LaBeouf what happened during the Dutch tulip mania, and a painting of tulips in his apartment is a mocking reminder of that bubble.
    In 2017 Alison Owen and Harvey Weinstein produced the movie Tulip Fever, whose plot is set against the backdrop of the 17th-century tulip wars. In the movie a married noblewoman (Alicia Vikander) switches identities with her maid to escape the wealthy merchant she married, and has an affair with an artist (Dane DeHaan). She and her lover try to raise money by investing what little they have in the high-stakes tulip market.
    The supply of tulip bulbs, however, grew very slowly since a bulb produced only two to three offspring every year, and the “mother” bulb actually faded away after a few seasons. Thus the supply lagged behind demand, and prices rose, opening up a lucrative niche for intermediaries. Tulips were now no longer sold by growers to wealthy clients but at auctions. And instead of occurring at organized exchanges, trading initially took place in pubs and inns. Later, groups gathered to form trading clubs, or informal exchanges, and they organized auctions according to fixed rules.
    Initially the tulip bulbs were traded only during the planting season. However, as demand rose, traders sold bulbs that were still in the ground: It wasn’t the flowers that were sold anymore, but the rights to buy tulip bulbs. By this time, in the 1630s, tulip trading had become a speculative business because no one knew what the flowers would actually look like. Around 400 painters were commissioned to produce pictures that would entice potential buyers.

    Tulips quickly advanced to become a status symbol. Prices skyrocketed, rising to 50 times the original level between 1634 and 1637.

    Flower experts tried to satisfy their demanding clients with newer and ever more gorgeous creations characterized by particularly uniform petals and striking color patterns. The appearance of the mosaic virus, a plant infestation transmitted by aphids, actually created an extremely rare specimen, a surprising plant with flamed, two-color petals.
    At the height of the boom, tulip contracts changed hands as many as 10 times. Prices skyrocketed and between 1634 and 1637 multiplied by a factor of 50. In individual cases, for example the variety Semper Augustus, buyers paid as much as 10,000 guilders for a single tulip bulb, about 20 times a craftsman’s annual salary. In January 1637 alone, prices doubled in a short period of time. An entire house in Amsterdam could be bought for just three tulip bulbs. The speculative bubble reached its climax on February 5, 1637. Traders from all over the region met in Alkmaar, and 99 tulip bulbs changed hands for 90,000 guilders, the equivalent of one million US dollars today. The excess carried the seeds of the tulip’s downfall since the crash had already begun two days earlier in Haarlem. There for the first time, at a simple pub auction, no buyer was found. The reaction spread rapidly. Suddenly all market participants wanted to sell, resulting in the collapse of the entire tulip market in the Netherlands.

    In 1637, the bubble burst: Prices fell by 95 percent, and trading ceased.

    On February 7, 1637, trading stopped entirely. Prices had fallen by 95 percent, and the number of open contracts referring to tulip bulbs exceeded existing bulb supply by a huge multiple. Both buyers and sellers were hoping for a solution from the Dutch government. In the end, futures trading was prohibited, and buyers and sellers were forced to agree among themselves.
    Large parts of the Dutch population had been infected by tulip fever, from nobles and merchants to farmers and casual workers. Most participants, knowing nothing about the market, started their trading with the tulip bulbs and mortgaged their house or farm to increase their initial capital. However, the booming economy in the Netherlands did dampen the negative economic impact of this speculative bubble.
    Dutch tulip mania is the first documented market crash in history, and the analysis of the process can be applied to the dot-com bubble of 1998–2001 or any other financial bubble. In the decades following the tulip fever, the flower changed from an upper-class status symbol to a widespread ornamental plant, which it still is today, almost 400 years later. And almost 80 percent of the world’s tulip crop still comes from the Netherlands.

    Key Takeaways
    •During the Dutch economic boom of the Golden Age, during the 17th century, tulips became an exclusive status symbol of the new, wealthy upper class.
    •Prices skyrocketed, rising by more than 50 times between 1634 and 1637. Wide segments of the Dutch population were gripped by the speculative fever.
    •Before the bust, tulip bulbs traded for as much as the value of a house in Amsterdam. Then, in February 1637, the bubble burst. Prices fell by 95 percent.
    •The tulip mania is the first well-documented market crash in history. And for almost four centuries, it was known as the biggest financial bubble in history, much larger than the dot-com crash of 2000.

    2 The Dojima Rice Market and the “God of Markets” 1750

    In the 18th century, futures contracts on rice are introduced at the Dojima rice market in Japan. The merchant Homma Munehisa earns the nickname “God of Markets” for his market intelligence, and he becomes the richest man in Japan.

    “After 60 years of working day and night I have gradually acquired a deep understanding of the movements of the rice market.” —Homma Munehisa

    During Japan’s Edo period, which began in 1603, the country enjoyed its longest uninterrupted period of peace, and during this time domestic trade and the agriculture sector strengthened. The Dojima rice market was established in Osaka toward the end of the 17th century, and the city became the center of Japanese rice trading in the hundred years that followed. At the Dojima market, rice was traded for other goods, such as silk or tea. A common currency had not yet been established, but rice was generally accepted as payment (for taxes, for example).
    Due to the financial needs of the country’s feudal lords, warehouses started to accept warrants, which promised future delivery instead of the actual goods, and many landowners pledged their harvests for years in advance. Soon trading warrants were uncoupled from trades of physical rice at Dojima; a lively trade in so-called rice coupons evolved. Over time the rice coupons surpassed rice production levels by far. In the middle of the 18th century, almost four times the quantity of rice produced was traded in rice coupons.

    In 1749 around 100,000 bales of rice were traded in Osaka, but at the same time, there were only about 30,000 physical bales of rice in Japan.

    What Is a Rice Coupon?
    Rice coupons are a standardized form of a promise for the future delivery of rice, in which the price, quantity, and delivery date are fixed. If the market price is above the agreed price, the buyer makes a profit. If the price of rice is lower than the contract price, the buyer suffers a loss. Rice coupons are the first known standardized commodity futures in the world, and the Dojima rice market can be regarded as the first modern futures exchange, predating the introduction of trading in Amsterdam, London, New York, and Chicago.
    In 1750, at the age of 36, Homma Munehisa took over his family’s rice-trading company. As the owner of large rice fields in the northwest of Japan, Homma specialized in grain trading. At first he concentrated his activities in Sakata, where his family was located. Later he moved to Osaka.
    There Homma began to trade rice coupons, and in order to be informed as quickly as possible about the actual harvest in Sakata, he built up his own communication system, which covered about 600 kilometers. His family’s rice fields offered him valuable insider information. But in addition, Homma was probably the first to use analyses of historic price movements. He invented a graph, later known as a candlestick chart, that is still in use today. In contrast to a line chart, the “candles” not only show the opening and closing prices in the course of a day but also track the intraday high and low prices. Homma was convinced that by analyzing historic price movements, it was possible to recognize repetitive patterns that would allow him to make a profit.

    Figure 1. Rice. Candlestick chart in USD/cwt 2016, Chicago Board of Trade (CBOT). Data: Bloomberg, 2019.

    The following episode is legendary: Over several days Homma, who seemed to have more background information than his competitors, bought more and more rice from local farmers at the rice exchange in Dojima. Again and again he drew a paper out of his pocket and peered at symbols that remotely looked like candles. On the fourth day, a messenger from the countryside arrived in Osaka with reports of harvest losses because of a storm. The price for rice in Dojima jumped up, but there was hardly any rice for sale.
    In just a few days Homma had gotten control of Japan’s entire rice market, and he became rich beyond description. After his success at the Dojima exchange, Homma moved to Edo (Tokyo) and continued his ascent, acquiring the nickname “God of Markets.” Raised to the aristocracy, he served as a financial advisor to the Japanese government. He died in 1803. It was almost 200 years before his invention, the candlestick chart, was rediscovered and popularized by investors and traders alike.

    Key Takeaways
    •The trader Homma Munehisa cornered the Japanese rice market in 1750, buying physical supplies of rice and acquiring rice coupons on the basis of his superior market intelligence.
    •Earning the nickname “God of Markets,” he became the richest man in the country.
    •Homma invented candlestick charts, which are still used today in financial and technical analysis.

    3 The California Gold Rush 1849

    Gold Rush! Some 100,000 adventurers stream into California in 1849 alone, lured by the vision of incredible wealth. The following year, the value of gold production in California exceeds the total federal budget of the United States. Because of this treasure, California becomes the 31st state in the Union in 1850.

    “Gold! Gold! Gold from the American River!” —Samuel Brannan

    It’s hard to imagine today, but before 1848 California was an inhospitable and remote place, populated mainly by Mexicans, descendants of Spaniards, and Native Americans. Among the few European settlers was the Swiss-German émigré John Augustus Sutter, who had left his wife and children in Switzerland after the bankruptcy of his company and moved to the American West. By this time he owned a large piece of land in the Sacramento Valley, a settlement he called Nueva Helvetica. Sutter built a fort at the confluence of the American and Sacramento Rivers, and on the southern arm of the American River, near the village of Coloma, he started to put up a sawmill. It was there, on the morning of January 24, 1848, that one of the workers, carpenter James Wilson Marshall, found a gold nugget in the riverbed. Sutter and Marshall tried to keep the find secret while they gradually bought up more land. But the news of the spectacular discovery couldn’t be concealed for long when Sutter’s employees began to pay for goods with the gold they had found.
    Things soon got out of control. Samuel Brannan, a Coloma shopkeeper, filled a bottle with gold nuggets and traveled to San Francisco. There he rode through the streets, waving the bottle and shouting, “Gold, gold from the American River,” to gain attention for his business, which just happened to include prospecting equipment. The California Gold Rush was on.
    In 1848 only 6,000 people came to search for gold. But the following year gold fever truly took hold. As news of the finds spread, adventurers from all over the world hurried to California. Almost 100,000 people traveled to California in search of wealth and fast fortune in the boom year of 1849. They came from Asia as well. More and more Chinese arrived at Gum San, the “mountain of gold,” as they called California.
    The numbers are staggering. In 1848 California had fewer than 15,000 people. In 1852, four years after the first gold discovery, the population exploded tenfold. San Francisco grew from fewer than 1,000 inhabitants in 1848 to about 25,000 residents in 1850. By 1855 more than 300,000 adventurers were searching for gold, and there were plenty of merchants to service—and take advantage of—them.

    The Gold Rush in the Movies

    With No Country for Old Men, directed by the Coen brothers, and The Hateful Eight, by Quentin Tarantino, recent years have seen a comeback of the Western as a movie genre. The concept of a gold rush was a popular theme in these movies in the past. Perhaps the most prominent is The Gold Rush (1925), a classic silent movie with Charlie Chaplin in his Little Tramp persona participating in the Klondike Gold Rush. Re-released in 1942, the movie remains one of Chaplin’s most celebrated works. More recent is Gold, made in 2013 by Thomas Arslan: The plot focuses on a small group of German compatriots who head into the hostile northern interior of British Columbia in the summer of 1898, at the height of the Klondike Gold Rush, in search of the precious metal.
    Prices for prospecting gear multiplied by 10. In Coloma, Sam Brannan’s business took in 150,000 USD per month. Still, the promise of great wealth kept miners panning for gold in the riverbeds. Success meant they’d earn about 20 times as much as a worker on the East Coast in one day. In many cases six months of hard work in the goldfields earned adventurers the equivalent of six years of “normal” work. Annual gold production in California rose to 77 tons in 1851.
    The value of that amount of gold exceeded the total US gross domestic product at that time. Many miners, though, had a hard time holding on to their earnings. Far from civilization, merchants charged fantastic prices for their goods, while saloonkeepers profited greatly on alcohol and gambling. In truth, the actual winners of the gold rush were businessmen and merchants like Samuel Brannan. The most famous of these is probably entrepreneur Levi Strauss. Born in Germany, he set up shop in San Francisco, and when he realized prospectors needed sturdy trousers to work in, he trimmed tent fabric to meet the demand. Jeans were born.

    Almost 100,000 people came to California in 1849 alone. By 1855 there would be more than 300,000 new migrants.

    With its growth in wealth and population, California’s political weight also increased. In 1850 the “Golden State” was incorporated into the United States. The boom didn’t last forever, though. Around 1860 the easily accessible gold reserves had been depleted, and many cities were abandoned. The population of Columbia, founded just 10 years earlier, dropped from 20,000 people to 500. Boom towns became ghost towns.
    The pattern of the California Gold Rush would be repeated in other places over the next half century. Within a decade, the population of Australia multiplied by 10 in the aftermath of the 1851 gold rush on that continent, which evolved from a British convict colony to a more or less civilized state. In 1886 gold was found on the Witwatersrand south of Pretoria in Transvaal, South Africa. In a few years, Transvaal became the largest gold producer in the world. And in 1896, gold was discovered on the Klondike River in Alaska, leading to boom towns such as Dawson City at the confluence of the Klondike and the Yukon Rivers, which grew from 500 to 30,000 inhabitants within two years.
    As for California, Sutter’s settlement eventually developed into Sacramento, the capital of the state. The huge wave of 19th-century gold seekers is recalled in the name of San Francisco’s football team—the 49ers. And what about John Augustus Sutter? He died in poverty in 1880.

    Key Takeaways
    •The discovery of gold by Swiss-German immigrant John Augustus Sutter and James Wilson Marshall triggered a true global gold rush. More than the prospectors, however, it was the merchants who generally became rich selling equipment and services.
    •The California Gold Rush of 1849 kicked off a huge wave of immigration—with 100,000 new arrivals in that year alone.
    •The discovery of gold accelerated California’s development, leading to statehood in 1850.
    •The pattern of gold rush booms was followed in Australia, South Africa, and the Yukon.

    4 Wheat: Old Hutch Makes a Killing 1866

    The Chicago Board of Trade is established in 1848, and Benjamin Hutchinson, known as “Old Hutch,” later becomes famous by successfully cornering the wheat market. He temporarily controls the whole market and earns millions.

    “Did you hear what Charlie said? Charlie said we were philanthropists! Why bless my buttons, we’re gamblers! . . . You’re a gambler! and I’m a gambler!” —Benjamin Hutchinson

    ACorner in Wheat is a short silent American film, made in 1909, that tells of a greedy tycoon who tries to corner the world market on wheat, destroying the lives of the people who can no longer afford to buy bread. The classic movie, set in the wheat-speculation trading pits of the Chicago Board of Trade building, was adapted from a novel and a short story by Frank Norris, titled The Pit and “A Deal in Wheat,” respectively. In 1994 A Corner in Wheat was selected for preservation in the US National Film Registry by the Library of Congress as being “culturally, historically, or aesthetically significant.”
    Chicago had become the hub for agricultural products in the American Midwest in the 19th century, as large quantities of grains entered the city and more and more warehouses were built to better coordinate supply and demand. Prices regularly came under pressure, and in 1848 the Chicago Board of Trade (CBOT) was founded.
    Benjamin Peters Hutchinson, nicknamed “Old Hutch,” is famous for being the first person to corner the wheat market. Born in Massachusetts in 1829, he moved to Chicago at the age of 30, started trading in grain, and became a member of the CBOT.
    In 1866 Hutchinson was betting on a poor wheat harvest. From May to June of that year, he grew his position, both in the spot market and in futures contracts. His average realized price was reported to be 88 US cents per bushel. Then, in August, the price began to rise steadily because of below-average harvests in Illinois, Iowa, and other states that delivered grain to Chicago. On August 4, the price of wheat ranged between 90 and 92 US cents per bushel. Short sellers soon realized that there would not be enough wheat to meet their delivery obligations. (The strategy of short sellers is to sell contracts at the beginning of the season; they assume that prices during harvest season will come under pressure, and they’ll be able to close their positions with a profit.)
    By August 18, Hutchinson’s control of the tight physical market had driven wheat prices up to 1.87 USD. He had become a rich man. As a consequence, however, the CBOT declared illegal the practice of acquiring futures contracts and trying to prevent physical delivery at the same time.

    What Is a Commodity Futures Exchange?

    The Chicago Board of Trade, established in 1848, is one of the oldest organized commodity futures exchanges in the world. The function of every futures exchange is to provide liquidity and a central marketplace for buyers and sellers to handle standardized contracts (futures and options) that are subject to physical delivery in the future. At the CBOT, these are mainly agricultural products such as wheat, corn, or pork bellies. In 1864 the CBOT introduced the first standardized exchange-traded futures contracts. In 2007 the CBOT and the Chicago Mercantile Exchange (CME) merged into the CME Group. Ten years later, the CME introduced bitcoin futures in the commodity segment of the exchange.
    In 1888 Hutchinson saw another opportunity for lucrative speculation. During the spring, he bought wheat in the spot market and acquired more and more futures contracts for maturity and delivery in September. The storage capacity in the city was around 15 million bushels, and Hutchinson controlled most of the wheat available in Chicago through the spot market.

    On September 22 the wheat price broke the psychological level of 1 USD.

    As a few years before, his average realized price was below 90 US cents per bushel. But this time Old Hutch was facing a powerful group of short sellers who included John Cudahy, Edwin Pardridge, and Nat Jones; they would challenge him over future deliveries in September.
    Until August, the price of wheat remained at around 90 US cents per bushel. But Old Hutch again had the right instincts. Frost destroyed a large part of the local crop. And European demand for wheat imports also grew because of an unexpectedly large crop deficit. The price started to rise, and on September 22 it broke the psychologically important mark of 1 USD.

    One day before maturity of the futures contracts, prices climbed to 1.50 USD. Hutchinson set the final settlement price at 2 USD.

    On September 27, three days before the contracts for September expired, wheat prices rose to 1.05 USD, then increased further to 1.28 USD. Market participants caught on the wrong side began to panic, and short sellers were forced to cover their positions in what’s known as a “short squeeze.” With his positions in the physical market, Old Hutch controlled the price. The day before maturity, on September 29, he offered 1.50 USD to the big short sellers and raised the settlement price to 2 USD. Based on his average realized price, Hutchinson must have realized a profit of around 1.5 million USD.
    He wasn’t done speculating, however. Within the next three years, Hutchinson had given up his profit. Later he lost his entire fortune.

    Key Takeaways
    •Benjamin Peters Hutchinson, nicknamed “Old Hutch,” was a grain trader who bought wheat on the spot market and acquired contracts for future delivery at the Chicago Board of Trade (CBOT). By cornering the wheat market in Chicago in 1866 and 1888, he was able to double his investments within weeks, earning a fortune.
    •The CBOT was established in 1848 and is today one of the oldest organized commodity futures exchanges in the world. The exchange later declared illegal the practice of cornering a market by buying harvests physically and financially at the same time.
    •The CBOT and the Chicago Mercantile Exchange (CME) merged in 2007 to become the CME Group.

    5 Rockefeller and Standard Oil 1870

    The US Civil War triggers one of the first oil booms. During this time, John D. Rockefeller founds the Standard Oil Company. Within a few years, through an aggressive business strategy, he dominates the oil market, from production and processing to transport and logistics.

    “Competition is a sin.” —John D. Rockefeller

    The production of petroleum from coal or crude oil as an inexpensive alternative to whale oil for lamp fuel is commonly regarded as the beginning of the modern petroleum industry. On August 27, 1859, Colonel Edwin Drake discovered a lucrative deposit of crude oil near Titusville, Pennsylvania. The onset of the American Civil War two years later sparked the first oil boom in that state. The price of oil rose to more than 100 USD per barrel (measured in today’s prices). Drilling rigs soon spread across farms in northwestern Pennsylvania, as hundreds of small refineries were created near the oil wells and along the transport routes to Pittsburgh and Cleveland, Ohio, cities that were home to major railroad crossroads: The New York Central and Erie Railroad led to Cleveland, while Pittsburgh served as an important east-west junction on the Pennsylvania Railroad. The majority of freight on these railways still consisted of grains and industrial goods, but the volume of oil products was growing rapidly.
    In 1863 John Davison Rockefeller, age 24, founded a small oil refinery in Cleveland together with his brother William. The son of penniless German immigrants, John worked as a dishwasher during his school years and graduated as an accountant. Rockefeller’s company was successful and prospered, despite fluctuations in the market. The oil boom had led to a spike in production, and the price of the commodity fell from 20 USD per barrel in 1861 to only 10 US cents. In 1866, one year after the end of Civil War, however, the price had risen again to more than 1.50 USD.

    Figure 2. Crude oil prices 1861–2018, in USD/barrel (real prices of 2015). Data: BP Statistical Review of Energy, 2019.

    With William, Rockefeller founded a second refinery in 1866, then, in 1870, he reorganized his company, naming it the Standard Oil Company. A year later, Rockefeller and other refinery owners formed an alliance to obtain discounts from railway operators. In addition, this alliance was responsible for railway operators raising prices for competitors, which led to an oil war in 1872.
    At the end of that year, Rockefeller took over the presidency of the National Refiners Association, which represented 80 percent of all American refineries. He would continue to aggressively grow Standard Oil, and by 1873 he had managed to acquire or to control almost all refineries in Pennsylvania.

    From Crude Oil to the Plastic-Wrapped Cucumber at Your Supermarket

    A refinery splits crude oil into its various components, such as light and heavy fuel oil, kerosene, and gasoline. With additional steps, a variety of alkanes and alkenes can also be produced from petroleum. Petroleum remained the most important use of crude oil until the rapid spread of automobiles in the 1920s. Although Henry Ford had intended ethanol to fuel his cars, the Rockefeller family, as founders of the Standard Oil Company, pushed for gasoline to power automobiles and succeeded.
    Today, oil is still by far the most important source of energy, at the core of every industrial society, and the base for numerous chemical products, such as fertilizers, plastics, and paints. Although three-quarters of crude oil production is used in transportation, it will take e-mobility further decades at least to challenge the supremacy of crude oil.
    Between 1875 and 1878, Rockefeller traveled throughout America to convince the owners of the 15 largest refineries to become part of his Standard Oil Company. Smaller companies had to follow suit or perish: For example, the plant of the Vacuum Oil Company, founded in 1866, went up in flames. Other entrepreneurs sold Rockefeller their companies for well below half of their market value. As early as 1882, Standard Oil controlled more than 90 percent of the refinery business in the United States.
    Next, the company turned to pipeline and distribution networks. Rockefeller built his own sales channels, forcing other trading networks out of the market. In late 1882, the National Petroleum Exchange opened in New York to facilitate the trading of oil futures.
    In the end, Standard Oil had a hold over virtually the whole crude oil value chain in the United States—from oil production to processing, transport, and logistics—and began to extend its dominance to the global oil market as well.

    Accumulating a fortune of around 900 million USD by 1913, Rockefeller represented the American Dream, the richest man of all time.

    By transforming his enterprise, Rockefeller was able to postpone the destruction of his empire. But his aggressive company strategy eventually prompted the first antimonopoly legislation in the United States. In 1911, the Supreme Court ordered the dismantling of Standard Oil. As a result, the company’s share price fell like a stone. Rockefeller, nevertheless, was able to buy back large quantities of the stock, which only increased his fortune in the years that followed. World War I, increasing motorization, and advances in the industrialization process all resulted in a rapid increase in the demand for oil.
    Eventually Standard Oil was broken up into 34 individual companies, from which today’s ExxonMobil and Chevron have emerged. Other sections of the original firm were liquidated over time or were absorbed by other oil and gas companies.
    Back in 1913, the total wealth of John D. Rockefeller was estimated at 900 million USD, the equivalent of 300 billion USD today. This is more than twice the private wealth of Jeff Bezos, founder and CEO of Amazon and, according to Forbes, the wealthiest man in the world today (before his divorce).
    The son of John D. Rockefeller, Nelson, almost became president of the United States, but instead served as vice president from 1974 to 1977. David Rockefeller, the last grandson of John D. Rockefeller, died in 2017. Even today, the name Rockefeller is a symbol of vast wealth and also of philanthropy.

    Key Takeaways
    •The American Civil War fueled the first crude oil boom in history. Prices in 1861 soared above 100 USD (in today’s currency).
    •John D. Rockefeller founded the Standard Oil Company, a corporation that not only came to control the US market for crude oil but also dominated the global market.
    •The rise of the automotive industry and industrialization in general propelled all developing countries into the oil age.
    •John D. Rockefeller personified the American Dream par excellence, rising from a dishwasher to a multibillionaire. Even in 2019 his surname remains a synonym for immeasurable wealth.
    •Though Standard Oil was broken up, successor companies like Exxon-Mobil and Chevron are still operating today.

    6 Wheat: The Great Chicago Fire 1872

    The Great Chicago Fire of October 1871 leads to massive destruction in the city and leaves more than 100,000 residents homeless. The storage capacities for wheat are also significantly reduced. Trader John Lyon sees this as an opportunity to earn a fortune.

    “Being a firefighter is not something you do; it’s something you are.” —the TV show Chicago Fire

    The sun burned hot in the American Midwest during the summer of 1871. In and around Chicago, only 3 centimeters of rain fell between July and October. Water resources were nearing depletion, and small fires sprang up regularly. On October 8, a fire broke out in a barn, initiating a disaster that became known as the “Great Chicago Fire.”

    Winds from the southwest fanned the flames and set neighboring houses on fire. Traveling quickly, the fire spread toward the city center and crossed the Chicago River. It took two days to get the conflagration under control, and by then an area of more than 8 square kilometers and 17,000 buildings had been destroyed. Every third inhabitant of the city lost his home. The damage has been estimated at more than 200 million USD. In addition to large parts of the city, the fire destroyed 6 out of the 17 warehouses approved by the Chicago Board of Trade (CBOT). The city’s total storage capacity decreased from about 8 to 5.5 million bushels. John Lyon, a large-scale wheat trader, saw the opportunity to make a profit. He joined with another trader, Hugh Maher, and CBOT broker P. J. Diamond, to manipulate the wheat market.

    What’s What with Wheat

    Different types of wheat are traded on futures exchanges. In the United States, wheat is traded on the Chicago Board of Trade (CBOT) and the Kansas City Board of Trade (KCBT), with the volume of Chicago Soft Red Winter Wheat (soft wheat) outweighing Kansas Hard Red Winter Wheat (hard wheat). Chicago wheat is mainly grown in an area that extends from Central Texas to the Great Lakes and the Atlantic Ocean. Kansas wheat grows primarily in Kansas, Nebraska, Oklahoma, and parts of Texas.

    At CBOT, wheat is traded in US cents per bushel and designated with the abbreviation W plus a letter and number that stands for the current contract month (e.g., W Z9 for wheat delivered in December 2019). A contract refers to 5,000 bushels of wheat, with one bushel corresponding to 27.2 kilograms. Therefore, one contract refers to around 136 metric tons of wheat.

    In the spring of 1872, the group began to buy wheat in the spot and futures market. Wheat prices rose continuously through early July, and contracts specifying delivery in August traded between 1.16 and 1.18 USD per bushel. At the beginning of July an average of just 14,000 bushels of wheat a day reached the city; by the end of the month, prices had climbed to 1.35 USD. In response, however, wheat deliveries to Chicago increased.

    By the beginning of August, 27,000 bushels a day were coming in. But luck was still with Lyon. Another warehouse burned to the ground, and the city’s already stretched storage capacity was reduced by another 300,000 bushels. Rumors about a below-average harvest due to bad weather pushed up prices even more. On August 10 these two factors combined to push wheat contracts for August up to 1.50 USD. On August 15 prices climbed to above 1.60 USD. But then the wheel of fortune started to turn.

    As more and more wheat reached the city of Chicago, Lyon was forced to give up.

    The high prices incentivized farmers to speed up their harvest: Crops were picked into the night. In the second week of August, about 75,000 bushels of wheat reached Chicago each day; a week later that figure had risen to 172,000 bushels. For the rest of the month, daily deliveries increased to nearly 200,000 bushels.

    Wheat that had already been shipped from Chicago to Buffalo returned to the Windy City, because of the high local prices. Newly opened warehouses also added to the storage capacity in the city, bringing it to more than 10 million bushels—two million bushels more than before the Great Fire!

    To secure their profits and stabilize prices, Lyon and his partners had to buy all the wheat coming into Chicago. But they were already leveraged by local banks, and the additional funds they needed soon exceeded the group’s financial options.

    On Monday, August 19, Lyon had to admit defeat. He could no longer afford to buy wheat in the spot market. The price of wheat with delivery in August fell by 25 US cents. The following day prices dropped another 17 US cents. The crash ruined John Lyon, who was unable to meet his margin calls. His attempt at market manipulation ended in financial disaster and bankruptcy.

    Key Takeaways
    •The Great Chicago Fire of 1871 led to massive destruction and left more than 100,000 people homeless.
    •With the number of grain warehouses drastically reduced, a group of speculators around John Lyon saw a big opportunity in the wheat market. Together they tried to corner the wheat market, but rises in price also resulted in increased shipments of wheat to the city. After initially increasing to 1.60 USD, the price of wheat crashed.
    •Lyon and his friends were unable to meet their margin calls. Their attempt at cornering the market ended in bankruptcy and financial disaster.

    7 Crude Oil: Ari Onassis’s Midas Touch 1956

    Aristotle Onassis, an icon of high society, seems to have the Midas touch. Apparently emerging out of nowhere, he builds the world’s largest cargo and tanker fleet and earns a fortune with the construction of supertankers and the transport of crude oil. Onassis closes exclusive contracts with the royal Saudi family, and he is one of the winners in the Suez Canal conflict.

    “The secret of business is to know something that nobody else knows.” —Aristotle Onassis

    At the beginning of December 2005 the youngest billionaire in the world, Athina Roussel, age 20, celebrated her wedding to 32-year-old Brazilian equestrian Álvaro Alfonso de Miranda Neto. A thousand bottles of Veuve Clicquot were ordered for the 1,000 guests at the São Paulo nuptials. Athina was the only heiress to the Onassis fortune, the last of her clan. Her grandfather, Aristotle “Ari” Socrates Onassis, would have been almost 100 years old.

    A central figure in the high society of the 1950s, ’60s, and ’70s, Aristotle Onassis earned his fortune by constructing supertankers and transporting crude oil. Like Rockefeller, Onassis became synonymous with wealth and fortune. But his rise to fame was not a straightforward one.

    The Onassis family initially became wealthy through the tobacco trade. Based in the city of Smyrna, Ari’s father had a fleet of ten ships. Ari himself enjoyed a good education. At 16 he already spoke four languages—Greek, Turkish, English, and Spanish. In 1922, however, when the Turks retook Smyrna (Izmir), which had been under Greek rule since World War I, the family had to flee. They were forced to leave everything behind. Virtually penniless, Onassis migrated to Argentina and earned money by importing tobacco. He also kept himself afloat with occasional jobs.

    In the 1930s the world economic crisis offered Onassis an attractive business opportunity in the form of large-scale transport of crude oil.

    The economic crisis of the 1930s offered Onassis the opportunity to get into the crude oil transport business on a large scale. There were rumors that the Canadian National Steamship Company was in serious financial difficulties and that several of its freighters were for sale. Onassis took all the money he’d accumulated and purchased six rundown ships for 120,000 USD, one-tenth of their value at the time.

    With that bold move, Onassis laid the foundation of his empire. The purchase quickly paid off during the economic recovery that followed. At the beginning of World War II, Onassis’s fleet had grown to 46 freighters and tankers, and he leased them to the Allied forces on profitable terms.

    Ari and the Women

    Aristotle Onassis married into another family of successful Greek shipowners when he wed Athina “Tina” Livanos. They divorced in the 1950s, however, after he began a long relationship with celebrated opera diva Maria Callas, who separated from her husband for Onassis. In 1968 Onassis married Jacqueline Kennedy, widow of President John F. Kennedy. At the time, Onassis was 62 years old; Jackie was 23 years younger. Because of her spending on travel and shopping, Onassis nicknamed her “supertanker,” since he said she cost him just as much as a ship.

    During the war, Onassis’s ships changed their flags to neutral Panama and remained undisturbed by naval battles. As more and more freight ships were lost to the conflict, his own fleet’s rates rose higher, creating a gold mine for Onassis. After the war, he expanded the number of his ships into the largest private commercial fleet in the world, and in 1950, he commissioned the biggest tanker in the world, 236 meters long, to be completed at the German Howaldt shipyard.

    But it was not until spring 1954 that the 48-year-old Onassis made a definite breakthrough. Through shady contacts and friendships, he struck a lucrative agreement with the royal family of Saudi Arabia. Onassis not only received the exclusive right to transport crude oil for King Saud, but he also was to produce a new supertanker for the country almost every month and would participate in the sale of crude oil. Together Onassis and Saudi Arabia set up the Saudi Arabian Tanker Company, with a goal of having 25 to 30 ships that could transport about 10 percent of the country’s crude oil.

    By royal decree the Arabian American Oil Company (Aramco) would have had to use Saudi Arabian ships for the tonnage previously shipped in charter ships. Aramco—a joint venture among Standard Oil (New Jersey), Standard Oil of California, Socony Vacuum, and Texas Co.—had had a concession agreement with King Ibn Saud since 1933 and was responsible for nearly 10 percent of the world’s oil production. About half of the oil produced in Saudi Arabia went by pipeline to Lebanon; the other half was transported by tankers. Of the tanker market, 40 percent of crude was shipped in Aramco’s own tankers; for the remaining 60 percent, the company used charters.

    The Suez Canal conflict resulted in enormously profitable opportunities for Onassis.

    By breaking into this system, Onassis made some powerful enemies. The United States tried to block the agreement to safeguard its own influence, and Europe—which in the 1950s derived 90 percent of its oil supply from the Middle East, whose largest producer was Saudi Arabia—was also unenthusiastic. The deal with Saudi Arabia ultimately fell through, and without the new freight orders, Onassis’s ships sat idle in shipyards around the world. The Greek magnate’s empire began to crumble. But he was rescued by the Suez crisis in 1956.

    With the growing economic importance of crude oil, European nations increasingly were dependent on the use of the Suez Canal to bring fuel from the producing countries. But the nationalist policies of the new Egyptian president, Gamal Abdel Nasser, were intensifying conflicts with Israel as well as with France and Great Britain, which controlled the canal. Egypt blocked the Gulf of Aqaba and Suez Canal to Israeli shipping; then on July 26, 1956, Nasser nationalized the Suez Canal.

    Britain’s prime minister, Anthony Eden, responded together with Israel and France with Operation Musketeer. On October 29, Israel invaded the Gaza Strip and the Sinai Peninsula and quickly pushed toward the canal. Two days later Britain and France began bombing Egyptian airports. Although the Egyptian army was quickly beaten and the war was over by December 22, 1956, sunken ships continued to block the Suez passage until April 1957.

    The crisis brought salvation to Aristotle Onassis. No other shipowner had the transport capacity to move the oil. With more than 100 idle tankers and virtually no competition, he was able to double his rates, once again earning a fortune. The Six-Day War in 1967 offered a similar opportunity, and later, during the oil crisis in 1973, Onassis’s Olympic Maritime Company posted a profit of more than 100 million USD.

    Aristotle Onassis earned his fortune through the transport of crude oil. He became a society icon through his extravagant lifestyle and his marriage to Jackie Kennedy.

    By then, Onassis’s total private wealth was estimated at more than 1 billion USD. Throughout his career he had diversified into other businesses: He bought banks in Geneva, founded Olympic Airways, built the Olympic Tower on Fifth Avenue in New York, and acquired the Greek island of Skorpios. Onassis became enamored of Monaco, which had been a dull, sleepy little place until he transformed it. In Monte Carlo, Onassis bought beautiful hotels and dozens of houses and villas, built public facilities and beach clubs, and renovated the port and the casino. He held legendary gatherings on his yacht, inviting guests who included President John F. Kennedy and his wife, Winston Churchill, Ernest Hemingway, and other members of high society from business, politics, and Hollywood. Onassis even brought together Prince Rainier of Monaco and American actress Grace Kelly, helping establish Monaco as a paradise for the rich and beautiful in Europe.

    Key Takeaways

    •Aristotle “Ari” Socrates Onassis earned a fortune by transporting crude oil in his huge tanker fleet and through his excellent relationships with the Saudi family.
    •He profited massively from the Suez crisis in 1956 and the oil crises of the 1970s.
    •Onassis was an icon of the international jet set, thanks to his relationship with opera star Maria Callas, and his second marriage to Jacqueline Kennedy, the widow of John F. Kennedy.
    •With his private wealth of more than 1 billion USD, Onassis supported Prince Rainer of Monaco and established the principality as the place to be for the rich and beautiful.

    8 Soybeans: Hide and Seek in New Jersey 1963

    Soybean oil fuels the US credit crisis of 1963. The attempt to corner the market for soybeans ends in chaos, drives many firms into bankruptcy, and causes a loss of 150 million USD (1.2 billion USD in today’s prices). Among the victims are American Express, Bank of America, and Chase Manhattan.

    “You have caused terrific loss to many of your fellow Americans!US federal judge Reynier Wortendyke

    At first glance, it seemed like a plot for a Hollywood movie: Workers deceived warehouse inspectors using oil tanks filled with water to hide one of the largest credit frauds in US history. It was all part of an attempt to corner the soybean market, a fragile house of cards whose collapse caused a loss of more than 150 million USD (the equivalent of about 1.2 billion USD today) and whose effects rippled throughout corporate America.
    At the center of the debacle were Allied Crude Vegetable Oil, a New Jersey company, and its owner Anthony (“Tino”) De Angelis. In the end the unraveling of the scheme was analogous to the bankruptcy of Lehman Brothers in 2008: On a November evening in 1963, a group of employees of the Wall Street brokerage firm Ira Haupt & Co., including managing partner Morton Kamerman, sat in a conference room and spoke on the phone with Anthony De Angelis. As the conversation heated up, De Angelis accused Kamerman of ruining his company. Kamerman was not responsible for his firm’s commodity trading, but he was aware that De Angelis was one of his biggest customers. The Haupt & Co. partners were desperately looking for someone willing to buy soybean oil in large quantities, but they had no success. The next morning Kamerman understood a lot more about his company’s commodity business. However, the knowledge went hand in hand with the fact that Haupt & Co. was bankrupt due to the insolvency of Allied Crude.

    Some Background About Soybeans

    Soybeans, which are predominantly crushed for soybean oil and soybean meal, are produced and exported mainly by the United States “Corn Belt” (Illinois and Iowa), Brazil, and Argentina. Together these countries account for about 80 percent of the world’s soybean harvest of around 215 million metric tons. In most of the world’s production, the oil is extracted first, and the residual mass is used primarily as a feedstock. Soybeans, soybean meal, and soybean oil are traded on the Chicago Board of Trade (CBOT) with the symbol S, SM, and BO and the respective contract month (for example, S F0 = Soybean January 2020).

    Figure 3. Prices for soybean oil, 1960 – 1964, in US cents/lb, Chicago Board of Trade. Data: Bloomberg, 2019.

    Anthony De Angelis had founded Allied Crude Vegetable Oil in 1955 to buy subsidized soybeans from the government, process them for soybean oil, and sell the product abroad. Born in 1915, he was the son of Italian immigrants and grew up in the Bronx in New York. As a commodity trader, he dealt in cotton and soybeans, and between 1958 and 1962, he built a refinery in Bayonne, New Jersey, and leased 139 oil tanks, many as high as a five-story building. American Express Warehousing, a subsidiary of American Express, was paid by Allied Crude for storage, inspection, and certification of the oil volume. In 1962 De Angelis was responsible for about three-quarters of the total soybean and cottonseed oils in the United States. But in order to finance the rapid growth of the company in a highly competitive industry, he increased leverage by taking more and more credit, which was largely collateralized by the oil he produced.

    And that is where the fraud began: Allied Crude Vegetable Oil never had as much oil as was necessary to secure its loans. A close investigation by American Express Warehousing would have revealed that De Angelis needed to store more oil than was available in the entire United States, according to the US Department of Agriculture’s monthly data. At its peak, De Angelis’s credit volume represented more than three times the amount of oil that could be stored in the tanks in Bayonne. But De Angelis was American Express’s largest customer. And his employees deceived the inspectors who were sent to check the collateral by pumping oil from tank to tank or filling the tanks mainly with water and only a small amount of oil. In this way the company continued to receive new credit lines.
    Instead of expanding operations, however, the company used the credit lines for speculation in soybean futures at Chicago’s commodity exchange. De Angelis placed huge bets on rising prices for soybeans; he had to deposit only about 5 percent of the future purchase sum as a margin. Nevertheless, in his attempt to corner the entire market through further positions, De Angelis needed an even higher credit line.
    He was already trading in futures contracts with Wall Street brokers Ira Haupt and J. R. Williston & Beane, and they agreed to further credit against stockpiles of the nonexistent oil. Both institutions were financed on the basis of their warrants by commercial banks Chase Manhattan and Continental Illinois.
    By mid-1963, De Angelis had accumulated soybean positions equaling about 120 million USD or 1.2 billion pounds. A tick of only 1 US cent in the price of soybeans meant that De Angelis gained or lost 12 million USD. For a while his trades were profitable. In just six weeks in autumn 1963, the price of soybean oil climbed from 9.20 USD per pound to 10.30 USD. But on November 15 the market collapsed because of Russian plans to buy more US grain and the negative reaction to this. Allied Crude Vegetable Oil collapsed with it.

    De Angelis deceived his creditors and caused losses of more than 1 billion USD in today’s prices.

    Within four hours soybean oil had fallen to 7.60 USD per pound, and the Chicago Board of Trade called for additional margins from Ira Haupt, which the company was unable to provide because its main customer, De Angelis, was not in a position to do so. Even another 30 million USD borrowed by American and British banks was not enough to rescue Ira Haupt. Williston & Beane was also forced to merge with Walston & Co. because of dwindling equity.

    The soybean market tumbled and took Allied Crude down with it.

    Allied Crude went into bankruptcy, and as creditors reviewed the company’s tanks more carefully, they confirmed there were just 100 million pounds of soybean oil there instead of 1.8 billion pounds. This difference was worth about 130 million USD.
    Affected by the debacle were banks, brokers, oil traders, and warehouses, huge firms like Bank of America, Chase Manhattan, Continental Illinois, Williston & Beane, Bunge Corp., and Harbor Tank Storage Co., to name just a few. The main loser was the parent company of American Express Warehousing: American Express faced legal suits by 43 companies, to the tune of more than 100 million USD. The share price of American Express dropped by more than 50 percent after the fraud hit the news. The scandal, however, received only limited attention, because two days later President Kennedy was shot in Dallas.
    For Ira Haupt & Co., liabilities amounted to almost 40 million USD, which they were not able to meet, affecting more than 20,000 brokerage customers. Even worse than these financial claims was the damage to the reputation of the US economy. As for Anthony De Angelis, in 1965 he was sentenced to 10 years’ imprisonment for fraud.

    Key Takeaways
    •In 1963 Anthony (“Tino”) De Angelis and his company Allied Crude Vegetable Oil were at the epicenter of one of the biggest corporate credit crises before the collapse of Lehman Brothers in 2008.
    •By cheating on inventories and in a bold pattern of fraud, Allied Crude received immense credit lines for its business and heavily speculated on the rise of soybean and soybean oil futures in Chicago. Eventually the market for soybeans crashed in November 1963 and took Allied Crude Vegetable Oil with it.
    •Affected by the fraud were several banks, brokers, oil traders, and warehouse companies, including prominent names like American Express, Bank of America, and Chase Manhattan.
    •The huge scandal, however, was overshadowed by the assassination of President John F. Kennedy two days later.

    9 Wheat: The Russian Bear Is Hungry 1972

    The Soviet Union starts to buy American wheat in huge quantities, and local prices triple. Consequently, Richard Dennis establishes a ground-breaking career in commodity trading.

    “If you live among wolves you have to act like a wolf.” —Nikita Khrushchev

    In the history of capital markets, 1972 is known as the year of “The Great Russian Grain Robbery.” Because of harvest shortages, Soviet commissioners were traveling all over the United States, buying as much wheat as they could. Their actions affected not only the grain market but also the career of a young commodity trader named Richard Dennis.
    At the beginning of the 1970s, the United States was beginning to abolish the gold standard, and as a result the US currency subsequently weakened. At the same time, wheat was trading close to 1 USD—historically low levels. That was not a surprise, since wheat production was massively subsidized by the government. But the weakening dollar gradually made American products, including many agricultural goods, more competitive. As a result, exports rose, and hand in hand with export volume, prices began to rise as well: That included grain prices, which were slowly awakening from their slumber.

    In the history of capital markets, 1972 is known as the year of “The Great Russian Grain Robbery.”

    Weather is always a key factor for agricultural prices, and after years of good harvests, the world’s grain production started to decline in 1972. Poor weather conditions were responsible for lower yields in important producer nations like the United States, Canada, Australia, and the Soviet Union. In comparison to 1970–1971, wheat stocks in 1973–1974 fell by 93 percent in Australia, 64 percent in Canada, and 59 percent in the United States. Inventories approached critically low levels.

    Figure 4. Wheat prices, 1970–1977, in US cents/bushel, Chicago Board of Trade. Data: Bloomberg, 2019.

    In July and August 1972, the Soviets bought nearly 12 million metric tons of US wheat—approximately 30 percent of the country’s production—amounting to a net value of about 700 million USD. Because farmers were already facing problems meeting demand, prices increased sharply, from below 2 USD at the beginning of the decade to more than 6 USD in February 1974. Corn spiked at the same time, from less than 1.5 USD to nearly 4 USD, while soybean prices more than tripled, reaching their highest level of more than 12 USD in June 1973.

    Weather Woes

    The harvest of Kansas wheat (Hard Red Winter Wheat), which is mainly exported, can be threatened by climatic fluctuations three times during the year: in late autumn, when it is too hot and dry or too cold and humid for germination; during winter, when sudden temperature changes threaten growth; and finally, in spring, when rain prevents pollination. For these reasons crop quality, quantity, and price are all subject to huge fluctuations.

    The rapid price spike favored young Richard Dennis, who had studied in Chicago and at Tulane University in Louisiana and had worked as a student at the Chicago Mercantile Exchange (CME) in 1966 at the age of 17. He began speculating with 2,000 USD in initial capital from his family, first with small contracts on the MidAmerica Exchange, and later on the CME.

    In 1972 the 23-year-old Dennis recognized the new agricultural market trend. He bet on rising wheat prices and won. A year later, in 1973, his initial capital increased to 100,000 USD as he took advantage of a trend-following system, aggressively increased his positions, and remained invested. In 1974 he made a profit of 500,000 USD on soybeans alone, and by the end of the year, he’d become a millionaire at the age of 25.

    The Soviet shopping spree of 1972 was repeated in 1977 after another bad harvest in Eastern Europe.

    Three years later history repeated itself. In 1977 Soviet president Brezhnev announced a national wheat harvest of less than 200 million tons, which took the markets by surprise as the US Department of Agriculture and US intelligence both were forecasting a good harvest.
    By this time Soviets had already bought 18 to 20 million tons of wheat from the United States, Canada, Australia, and India. Although worldwide production of wheat was around 600 million metric tons, according to data from the Food and Agriculture Organization (FAO), only a small fraction of that quantity was globally traded. Because large amounts are consumed by the producer countries themselves, world market prices can fluctuate dramatically based on relatively small changes in global trading.
    Meanwhile, Dennis’s career continued to soar. At the beginning of the 1980s, his capital rose to around 200 million USD. At 35 he was known as the “Prince of the Pit” and was one of the most recognized commodity traders in the world.
    In 1983 and 1984 Dennis recruited and trained 21 men and two women in commodity trading. The group later became known as “Turtle Traders,” thanks to an often-quoted comment by Dennis, who said, “You can breed traders like turtles in a laboratory.” Five years later the group had earned him a profit of 175 million USD.

    Key Takeaways
    •After a bad harvest, agents of the Soviet Union quickly and secretly purchased 30 percent of the total US wheat crop. Therefore, 1972 became famous as the year of the “Great Russian Grain Robbery.”
    •Grain shortages and the Soviet actions caused a spike in prices: Wheat prices that traded at 2 USD in 1970 shot up above 6 USD in February 1974, a threefold increase within 24 months. Corn also rose from 1.50 USD to nearly 4 USD, while soybean prices surpassed 12 USD during the summer of 1973.
    •Richard Dennis, age 23, recognized the new trend in agricultural markets and bet on rising wheat prices. He became a millionaire two years later, After a decade he was making a profit of 200 million USD, earning the nickname “Prince of the Pit.”

    10 The End of the Gold Standard 1973

    Gold and silver have been recognized as legal currencies for centuries, but in the late 19th century silver gradually loses this function. Gold keeps its currency status until the fall of the Bretton Woods system in 1973. The current levels of sovereign debt are causing many investors to reconsider an investment in precious metals.

    “Gold and silver, like other commodities, have an intrinsic value, which is not arbitrary, but is dependent on their scarcity, the quantity of labour bestowed in procuring them, and the value of the capital employed in the mines which produce them.” —David Ricardo

    “You have to choose . . . between trusting to the natural stability of gold and the natural stability of the honesty and intelligence of the members of the government. And, with due respect to these gentlemen, I advise you, as long as the capitalist system lasts, to vote for gold.” —George Bernard Shaw

    “Only gold is money. Everything else is credit.” —J. P. Morgan

    In June 2011 the US Mint announced a 30 percent increase in silver coin sales compared to the previous month. With more than 3.6 million silver eagles sold, the US Mint reached its limit of production, so great was the interest of investors in silver coins. Similar figures were reported by the Royal Canadian Mint, the Australian Mint in Perth, and also by the Vienna-based Mint Austria, producer of the Vienna Philharmonic Coin. In March 2011 newspaper headlines proclaimed that the state of Utah was considering once again accepting gold and silver as legal currencies. Utah was not an isolated case in the United States; Colorado, Georgia, Carolina, Tennessee, Vermont, and Washington were also looking to return to the stable value of gold.
    What seems curious at first glance made many investors thoughtful. After all, the use of a paper currency without a tie to precious metals like gold or silver is a relatively recent experiment. Only in the early 1970s, when President Nixon abolished gold convertibility in 1971, and with the collapse of the Bretton Woods system of fixed exchange rates and the convertibility of all currencies into gold in 1973, was the gold standard abolished and replaced by fiat money.
    Fiat money is a currency without intrinsic value that has been established as money, often by government regulation. Thus, the fiat money experiment has been tested in international financial markets for less than 50 years.

    The international monetary system—detached from gold and silver—has existed in this form for less than 50 years.

    The gold standard was the prevailing monetary system until World War I. Under a pure gold standard, the money supply equals the gold possession of a country. In the wake of the Great Depression in 1929 and the subsequent banking crisis in 1931, however, the gold standard came increasingly under pressure. In Britain, the suspension of sterling’s gold convertibility in September 1931 (the Sterling Crisis) heralded the collapse of the international gold standard. The United States also began to break away from the gold standard as it gradually devalued the US dollar. In 1933 President Franklin D. Roosevelt declared private gold ownership illegal so the government could print more paper money as a way to overcome the Great Depression.

    Gold or Silver?

    In the historical context, the gold standard was just a short transitional period for global financial markets. For many centuries silver was the dominant currency. Most countries used a silver standard or a bimetallic standard. Similar to the gold standard, under a silver standard the total amount of money in circulation is hedged by silver, while a bimetallic standard additionally prescribes a fixed exchange ratio between silver and gold. For many years in the United States, that was 1:16. The gold-silver ratio indicates how many units of silver are needed to buy one unit of gold.
    After both the silver and gold standards ended, the range of this ratio has fluctuated between 1:10 and 1:100. At the beginning of the 1980s, the ratio dropped below 1:20. In the early 1990s, it peaked at just under 1:100. In the years 2009 and 2010, the price of silver rose much more sharply than the price of gold. While 80 ounces of silver had to be paid for 1 troy ounce of gold by the end of 2008, it was just 40 ounces in mid-2011 and fell further to 1:50 by the beginning of 2019. Considering the natural resources and the amount of each metal mined annually, it would imply a long-term ratio of 1:10.
    After World War II the world’s economic and political center shifted toward the United States. The Bretton Woods system reorganized the international monetary system, and the US dollar, backed by gold, became the new global reserve currency.

    Figure 5. Gold-silver ratio, 1973–2013. Data: Bloomberg, 2019.

    All central banks were obligated to other central banks to exchange currency for gold at a fixed rate of 35 USD per ounce. But since the 1960s, US gold reserves have been shrinking, due to increasing account deficits. Social welfare entitlements and the growing financial burden of the Vietnam War accelerated the US current account deficit, raised inflation, and lowered international confidence in the US dollar. For the first time in 1970, the US money supply exceeded the amount of gold reserves. A year later, in August, President Nixon stopped the conversion of US dollars to gold (an event known as “Nixon shock”), but it was not until 1973 that the Bretton Woods system was officially overruled and replaced by a system of floating exchange rates. After that, the gold standard faded into history.
    Today, central banks and supranational organizations like the International Monetary Fund (IMF) hold 33,000 metric tons of gold, almost 20 percent of all known aboveground stocks of the precious metal.

    Silver Gives Way to Gold

    Silver gradually lost its official payment function in the late 19th century due to several factors. On the one hand, the United Kingdom, as a leading economic nation, was able to prevail with its gold standard against the French-dominated Latin coinage based on the silver standard. On the other hand, gold discoveries in California and Australia led to a tenfold increase in worldwide gold production and thus to lower gold prices. This made the gold standard more attractive. In 1871 Germany also switched to the gold standard. The transition from the silver or bimetallic standard to a pure gold standard led to an oversupply of silver and weighed on the price of silver for several decades.How
    ever, attention again has been focused on the solvency of many countries, including the United States, Japan, and some European economies. Measures taken to combat the financial and economic crisis that started in spring 2007 with the US real estate crash caused the national debt and the money supply to explode.
    Global debt accelerated to 320 trillion USD, whereas global GDP only rose to 80 trillion USD, and the dollar’s purchasing power declined by more than 90 percent since 1971. In addition to some European countries—Portugal, Ireland, Greece, and Spain (known as “PIGS countries”)—the United States was also temporarily threatened by a downgrade of its creditworthiness by international rating agencies. In the face of all this, it is not surprising that gold and silver bullion and coins, even if they are no longer legal tender, are popular with investors, and that bitcoins have emerged as an alternative currency. Gold-backed cryptocurrencies offer another alternative to fiat money. It seems like the gold standard is rising from its ashes through private initiatives instead of by government institutions.

    A sovereign crisis and a lack of trust are attracting investors to gold, silver, and cryptocurrencies.

    Key Takeaways
    •In 1933 President Franklin D. Roosevelt issued Executive Order 6102, which declared private possession of gold bars and coins illegal and punishable by up to 10 years in prison. All private gold holdings had to be turned over to the Federal Reserve in exchange for paper money at 20.67 USD per troy ounce. This prohibition against gold ownership wasn’t lifted until 1975 by President Gerald Ford.
    •After World War II, the US dollar was declared the world reserve currency, pegged to gold at a fixed exchange ratio. All other currencies were then pegged to the US dollar (the “Gold Standard”).
    •As US debt spiraled out of control, President Nixon ended the convertibility of US dollars into gold in 1971 (the “Nixon Shock”).
    •With the end of the Bretton Woods system in 1973, one of the greatest economic experiments began: a system of free and floating exchange rates for currencies that are not backed by any collateral other than the faith in national governments.

    11 The 1970s—Oil Crisis! 1973 & 1979

    During the 1970s the world must cope with global oil crises in 1973 and 1979. The Middle East uses crude oil as a political weapon, and the industrialized nations—previously unconcerned about their rising energy addiction and the security of the supply—face economic chaos.

    “Peak oil is the point in time when the maximum rate of global petroleum extraction is reached, after which the rate of production enters terminal decline.” —“Peak Oil,” Wikipedia

    “Just like global warming, the rationale for peak oil sounds great, it makes sense, but there is just one small problem, the facts don’t support it . . . it is a myth.” seekingalpha.com

    On Sunday, November 25, 1973, highways in Germany were emptied by a driving ban! The same day almost no cars moved in Denmark, the Netherlands, Luxembourg, or Switzerland. A week earlier, on November 19, Germany had introduced a general “Sunday driving ban” for four weeks, combined with a speed limit of 100 km/h on motorways and 80 km/h on ordinary roads. This was noteworthy: Germany—home to Mercedes, BMW, and Audi—is one of the few countries in the world today that does not have a general speed limit on its highways. Germans generally are in love with their cars! But the ban was the reaction of the German government to a sudden spike in energy prices caused by an oil crisis.
    The crisis was due to a conflict in the Middle East, between the Arab countries and Israel, that had been intensifying since the beginning of the 1970s. During the Six-Day War in 1967, Israel had conquered the Golan Heights and the Sinai Peninsula and occupied the Gaza Strip, the West Bank, and East Jerusalem. The Arab countries called for an immediate withdrawal from the occupied territories, and international pressure on Israel increased. But warnings about possible retaliation were ignored, as was the Egyptian offer of a peace treaty if the Sinai Peninsula were to be returned. On October 6, 1973, during the Jewish holy day of Yom Kippur, Egypt and Syria together attacked Israel.
    At first Syria achieved some success in the Golan Heights, and Egypt was prevailing on the Sinai Peninsula. However, the United States supported Israel with substantial military resources, and the small country finally changed the course of the war. Subsequently, the Arab countries pursued a different option.

    On October 17, 1973, OPEC decided to limit the supply of crude oil as a political weapon.

    On October 17, 1973, all Arabian crude oil–producing nations retaliated by reducing oil supply by 5 percent compared to September 1973 levels. They also imposed a complete supply boycott for crude oil against the United States and the Netherlands, which were considered Israel’s close allies. The league of exporting countries then announced that they would continue to restrict oil production until all occupied areas were “liberated” and the rights of Palestinian people were restored. The first oil crisis had begun.

    What Is OPEC?

    The Organization of the Petroleum Exporting Countries (OPEC) was established in 1960 in Baghdad by five founding members: Iraq, Iran, Kuwait, Saudi Arabia, and Venezuela. The development of new oil fields and a global oversupply had resulted in steady price declines in the 1950s. In response OPEC’s objective was to establish a common crude oil production level by joint agreement of all OPEC member countries, so that the world market price for crude oil stayed within a defined target corridor. OPEC has also been a driving force to break the power of the “seven sisters,” a group of Western oil companies. As of March 2019 the cartel consisted of 14 members—Algeria, Angola, Ecuador, Equatorial Guinea, Gabon, Iran, Iraq, Kuwait, Libya, Nigeria, Republic of the Congo, Saudi Arabia, Venezuela, and the United Arab Emirates, representing about 44 percent of global oil production and about 80 percent of the world’s “proven” oil reserves. Saudi Arabia is by far the largest crude oil producer among all OPEC members, responsible for about 12 million barrels per day in 2018. According to figures from the Energy Information Administration (EIA), the largest non-OPEC producing countries include Russia, the United States, China, Mexico, Canada, Norway, and Brazil.
    Up to this point, Western industrialized countries had been living with the illusion that global energy reserves were inexhaustible and that they needn’t be concerned with the security of the supply. Their addiction to crude oil kept rising, so the sudden embargo triggered an economic shock in many industrialized countries. Germany, for instance, sourced more than 50 percent of its energy demand from imported oil, about three-quarters of which came from the Middle East. It turned out that even with reduced consumption, reserves would have lasted only for three months, which caused people to panic. To limit the use of oil and reduce the degree of dependence, European countries began implementing energy-saving measures. They intensified negotiations with alternative crude oil suppliers, started to develop domestic sources of oil as well as alternative energy sources, and implemented strategic oil reserves.

    Economic Ripples

    In Germany and other industrialized countries, the first oil price shock triggered stagflation, which is economic stagnation combined with rising prices (inflation). Rising energy prices fueled an inflation spiral and at the same time slowed economic growth: Gross domestic output shrank from 5.3 percent in 1972 to 0.4 percent in 1974 and –1.8 percent in 1975. Many industries recorded a massive decline in production; construction fell 16 percent, and the automotive industry declined 18 percent. The stock market value of German companies dropped drastically and recorded a loss at the end of September 1974 of almost 40 percent, compared to July 1972. Unemployment rose from almost-full employment to 2.6 percent in 1974 and 4.8 percent in 1975.
    The impact of the cuts in the crude oil supply was visible immediately: Prices started to rise. At the end of 1972, US crude oil was trading at 3.50 USD per barrel; in September 1973 it rose to 4.30 USD, and at the end of 1973 oil prices traded above 10 USD. Sales in OPEC countries grew from about 14 billion USD in 1972 to more than 90 billion USD in 1974.

    During the first oil crisis in 1973 oil prices spiked from 3.50 USD to more than 10 USD.

    Using oil as a weapon brought quick political results: On November 5, 1973, the European foreign ministers called for Israel to evacuate the areas it had occupied since 1967. OPEC responded by gradually loosening the supply restrictions.
    But the world had changed. Even after the initial relaxation, prices for crude oil remained high. In 1974 alone, the value of German oil imports increased by more than 150 percent compared to the previous year.

    With the second oil crisis in 1979, oil prices jumped from under 15 USD to almost 40.

    Over the following years, crude oil prices stagnated, but they started to rise rapidly again in 1979–1980. After the Iranian Revolution and Iraq’s attack on neighboring Iran, industrialized countries once more became concerned about oil supply security. At the beginning of 1979, crude oil was trading at less than 15 USD per barrel. Within 12 months, prices had risen to nearly 40 USD, causing a second oil crisis. As a side effect, both oil crises marked the most prosperous years in the Soviet Union after discovery of oil in western Siberia and the rise of non-OPEC Western offshore oil production.

    Figure 6. Crude oil prices, 1965–1986, in USD/barrel. Data: Datastream, 2019.

    OPEC raised their basket price—an average of the prices of petroleum blends that are produced by OPEC members—to 24 USD per barrel; Libya, Algeria, and Iraq even asked 30 USD for their crude oil. In 1980 OPEC’s prices reached their peak when Libya demanded 41 USD, Saudi Arabia 32 USD, and the other countries 36 USD per barrel. In the following year, however, sales volume declined due to weaker economic development in the Western industrialized countries.
    As investments in alternative energy sources bore fruit, global crude oil consumption between 1978 and 1983 dropped by 11 percent. OPEC’s global market share of crude oil production fell back to 40 percent and continued to decline because of a lack of cartel discipline. US president Ronald Reagan made an agreement with Saudi Arabia to increase oil production in the 1980s, putting crude oil prices into a slide until the late 1990s. In the late 1980s, oil prices briefly dropped below 10 USD per barrel, bringing the Soviet Union to the brick of insolvency. OPEC’s market share fell during that time to 30 percent of world production.

    Key Takeaways
    •In 1973, because of tension in the Mideast, the Organization of the Petroleum Exporting Countries (OPEC) used its oil exports to Western industrialized countries as a political weapon and limited the supply, precipitating the first oil crisis. Crude oil prices soared from 3.50 USD at the end of 1972 to more than 10 USD just 12 months later.
    •The oil crisis came as a shock to most involved nations, strongly affecting economic growth and leading to rising unemployment.
    •During the second oil crisis, in 1979, oil prices jumped from less than 15 USD to almost 40.

    12 Diamonds: The Crash of the World’s Hardest Currency 1979

    Despite the need for individual valuation, diamonds have shown a positive and stable price trend over a long period of time. In 1979, however, monopolist De Beers loses control of the diamond market; “investment diamonds” drop by 90 percent in value.

    “Diamonds are a girl’s best friend.” —Marilyn Monroe,
    as Lorelei Lee in Gentlemen Prefer Blondes

    Precious stones such as diamonds, rubies, sapphires, emeralds, and opals are mainly known for their use in jewelry. Of these, diamonds are by far the largest market segment, and many individual gemstones—for example, the Blue Hope, the Cullinan, the Millennium Star, the Excelsior, the Koh-i-Noor, and the Orlov—have famous histories.

    Global production of rough diamonds generally ranges between 20 and 25 metric tons per year. This represents 100 to 130 million carats and is worth approximately 10 billion USD.

    Only about 20 percent of all diamonds are used in the jewelry industry, however. Industrial diamonds make up a huge market, and within this segment of smaller stones, artificially produced (industrial) diamonds also play an important role. The largest diamond production sites are in Russia, Australia, Canada, and Africa—in particular South Africa, Namibia, Botswana, Sierra Leone, and the Democratic Republic of the Congo.

    The Four Cs in Diamonds

    Unlike other commodities, diamonds do not have a standardized fixed value per unit weight. A diamond’s value is determined by various criteria, of which the “4 Cs” are the best known: color, clarity, cut, and carat. Sometimes, a fifth “C” is included. It stands for certification, which confirms the physical characteristics of a particular stone as certified by an official institution.
    Color grading depends on how close a stone is to colorless. The classification begins at D—which corresponds to very fine white or almost colorless diamonds—and continues through E, F, G, H (simple white), and so on. Colored diamonds (e.g., yellow, red, blue, or green) are particularly rare, so these so-called fancy diamonds are very precious.
    The clarity (purity) of a diamond is determined by the degree of inclusions in the stone. The higher the clarity, the rarer it is. The scale begins with IF (internally flawless) and continues through small to clear and coarse inclusions. Cut refers to the angles and proportions of a diamond. The most popular is the brilliant cut. Finally, traditionally a diamond’s weight is given in carats (1 ct = 0.2 gram).

    The largest diamond exchanges are located in Antwerp, Amsterdam, New York, Ramat Gan (Israel), Johannesburg, and London. Antwerp is the most important market; 85 percent of rough diamonds and about half of global cut stones are traded in the Diamond Quarter of that Belgian city.
    The value chain begins with mining and includes purchasing agents, processing, wholesalers, traders, intermediaries, jewelers, and other retailers, but a valuation is not simply a linear correlation to size: Larger stones are much rarer and thus exponentially more precious. In addition, prices fluctuate from one size class to the next. For example, the price can vary by more than 1,000 USD from a 0.49-carat diamond to a 0.5-carat diamond, though the difference is only 100 mg or less. In December 2018 prices for 1-carat diamonds ranged from 500 USD to 10,000 USD, depending on the degree of purity and colorlessness.
    By far the most important player in the diamond industry—analogous to OPEC in the global oil market—is De Beers. The South African company, part of the Anglo American mining group, is the largest diamond producer and trader in the world.

    Figure 7. Diamond prices, 2003–2016. Prices indexed over different sizes and qualities. Data: PolishedPrices.com, Bloomberg, 2019.

    De Beers has long dominated the global diamond market, similar to the way OPEC dominates global oil.

    De Beers controls about 30 percent of the world’s diamond production, and its influence in marketing and sales is even stronger. The company determines the volume and quality of rough diamonds that traders are able to buy. The Diamond Trading Company (DTC), which is controlled by De Beers, buys most of the world’s raw diamond production, allocates production quotas to mining companies, and manages sales through the Central Selling Organization (CSO), which is also an extended arm of the DTC. The CSO regularly organizes “sights” in London where about 150 authorized sightholders are offered compilations of rough diamonds for sale.
    For years the De Beers Syndicate guaranteed stable prices. At the end of the 1970s, however, the company lost control of the diamond market.

    A De Beers Primer

    De Beers, the largest diamond producer and trader in the world, has been active in the diamond market for more than 100 years. The company’s name goes back to the first mine in Kimberley, which was located on the farm of brothers Johannes Nicolaas and Diederik Arnoldus de Beer. After diamonds were found there in 1871, a group of adventurers transformed the remote place into the world capital of diamonds. British businessman Cecil Rhodes gradually bought up all the mining licenses and founded De Beers in 1888. Today, the company is 45 percent owned by the Anglo American Corporation, with 40 percent owned by the Oppenheimer family.
    Ernest Oppenheimer was born in Friedberg, Germany, near Frankfurt am Main, in 1880, and at age 32 he was pulling the political strings in Kimberley. In 1916, Oppenheimer founded Anglo American, which quickly became one of the most successful mining companies in the world. In 1926, he took over the majority of De Beers.
    De Beers’s entire production was always bought by the London Diamond Syndicate, which was established in 1890. The syndicate was the cornerstone of the Diamond Corporation, precursor to the Central Selling Organization (CSO). In the 1930s, during the Great Depression, Oppenheimer bought up massive quantities of diamonds in order to stabilize prices. Since then, De Beers and CSO have formed an exclusive diamond cartel.
    During that decade the US dollar depreciated significantly against other currencies, due to rising inflation in the United States and a search by investors for nontraditional investment opportunities. Interest in diamonds as a “hard” currency and a stable store for wealth increased, leading to greater demand for high-quality stones. De Beers, however, only moderately expanded the supply at the time, which resulted in further price increases that, in turn, attracted more and more potential investors.

    Diamond hysteria took hold. In 1979, the value of investment diamonds doubled, and prices for a 1-carat diamond of the best quality increased tenfold.

    Meanwhile, in Israel, rough diamonds were also becoming a favorite investment. In order to support Tel Aviv as an emerging center of diamond processing, the government granted large loans to banks under favorable conditions. As a result, a number of diamond investment companies were set up, which were able to sell diamonds directly to private investors.
    The hysteria over investment diamonds fueled a vicious circle. In 1979 the average price for diamonds doubled. Prices for a 1-carat, best-quality diamond multiplied by 10 and for a while traded at around 60,000 USD!
    De Beers attempted to gradually cool the market by expanding the supply, but the strategy was unsuccessful. The result was complete market chaos. The inevitable bust finally began in Japan, where it was common practice to accept diamonds as collateral for loans. When the first bank considered the market overheated and stopped accepting diamonds as collateral, the house of cards collapsed. The first drop in prices kicked off a race to sell stones. As speculators disposed of their stock, more and more borrowers fell below their collateral limits and were forced to raise money. Diamonds flooded the market, which was already oversaturated by De Beers’s efforts to cool it down. Even a cessation of sales and a buyback of diamonds by the cartel didn’t help. Prices crashed, and investors’ net wealth decreased, a downtrend accelerated by global recession.

    Within a year, the prices of investment diamonds fell from 60,000 to 6,000 USD.

    Within 12 months, the price of investment diamonds fell from 60,000 to 6,000 USD, approximately the level before the hysteria started. After that diamond prices recovered slowly, although in the early 1980s, the CSO withdrew diamonds worth more than 6 billion USD from the market, while De Beers cut mining quotas and closed one of its mines in South Africa. De Beers took similar actions to stabilize the price of diamonds after the global financial crisis in 2009, which had lessened the demand for luxury goods.

    Key Takeaways
    •South African company De Beers, today part of the Anglo American mining group, has long dominated international diamond production and sales.
    •In 1979 the company lost control of the diamond market after a market frenzy, during which average diamond prices doubled within a year, and prices for a 1-carat best-quality diamond rose tenfold, only to crash by 90 percent after the bubble burst.

    13 “Silver Thursday” and the Downfall of the Hunt Brothers 1980

    Brothers Nelson Bunker Hunt and William Herbert Hunt try to corner the silver market in 1980 and fail in a big way. On March 27, 1980, known as “Silver Thursday,” the metal loses one-third of its value in a single day.

    “The U.S. government has a technology, called a printing press, that allows it to produce as many U.S. dollars as it wishes.” —Ben Bernanke, Chairman of the Federal Reserve, 2006–2014

    The Hunt clan is one of the most glamorous families in the United States. They have a colorful history. In the 1920s Haroldson Lafayette Hunt (1889–1974), adventurer and professional poker player, won a drilling license in El Dorado, Arkansas, during a round of poker. Hunt, also known as “Arkansas Slim,” struck oil with his initial drilling exploration. With the first profits from El Dorado, he purchased additional drilling licenses in Kilgore, Texas, and discovered the world’s biggest known oil field to that date. In 1936 he founded the Hunt Oil Company, which became the largest independent oil producer in the United States. Fortune magazine estimated his net wealth at between 400 and 700 million USD in 1957, placing Hunt among the top 10 richest Americans. The Hunts also possessed large segments of Libyan oil fields until Muammar Gaddafi expropriated them in the early 1970s.
    H. L. Hunt’s private life was equally notorious: He had six children with his first wife, Lyda Bunker, including Nelson Bunker, Lamar, and William Herbert. Later, he started an affair with Frania Tye, whom he married and with whom he had four children before the couple separated in 1942. Hunt had another four children with one of his secretaries, Ruth Ray, whom he finally married in 1957.
    Unlike the Rockefellers, whose surname has always been associated with wealth, crude oil, and the Standard Oil Company, the name Hunt is forever tied to the largest failed speculation in silver.

    A Precious Metal Primer—A Recap

    The two most significant factors in the past 50 years for precious metals have been the prohibition of private gold holdings in the United States and the collapse of the Bretton Woods system, which was created in 1944. In 1933 President Franklin D. Roosevelt declared private possession of gold of more than 100 USD illegal, and the ban remained in place for more than 40 years. With the Nixon Shock of 1971, the United States declared an end to the official convertibility of the US dollar into gold, due to massive increases of government debt, expansion of the money supply, and rising inflation. In 1973 the Bretton Woods system—the international currency system that established the US dollar as the leading currency, backed by gold (“the Gold Standard”)—fell apart. With the abolition of the silver and gold standards, both metals lost their economic importance, and large quantities became available on the market. As a result, silver fell to 2 USD per troy ounce. But this price level also has had a lasting negative effect on silver production, as only a few countries are able to produce it at this low price level.
    The Hunt brothers’ speculation, which culminated in the collapse of the silver market in 1980, became a legend in commodity trading.
    William Herbert and Nelson Bunker Hunt were the first big investors to recognize the rare opportunities offered by the silver market in the 1970s: There was constant industrial demand, low incentives for subsidies due to low prices, and a small market of available silver.
    Nelson Bunker had made no secret of his aversion to “paper money” after the gold standard was abandoned. “Every moron could buy a printing press, and everything might be better than paper money,” he said. To preserve the family fortune, the Hunt brothers focused their investments on real estate and the silver market.
    Between 1970 and 1973 Nelson Bunker and William Herbert bought about 200,000 troy ounces of silver. Within these three years, the price of silver doubled from 1.5 USD to 3 USD per troy ounce.
    Encouraged by this success, the brothers expanded their activities to futures exchanges and acquired, at the beginning of 1974, futures contracts representing 55 million ounces of silver. Then they waited for physical delivery. Physical delivery was as unusual at that time as it is nowadays, and with constant purchases on the spot markets, the Hunts generated an artificial shortage of silver. Keeping in mind how the United States had appropriated private gold holdings 40 years before, they had the bulk of the precious metal delivered to banks in Zurich and London, where they thought their silver stocks would be safe from US authorities.
    In spring 1974 the price of silver rose to more than 6 USD. Rumors spread that the Hunts—who by now possessed about 10 percent of the world’s silver supply—were targeting a dominant market position. Before 1978 another 20 million ounces of silver were delivered to Nelson Bunker and William Herbert, who tried to convince more investors to partner with them. Together with two Saudi sheikhs, they founded the International Metal Investment Group, and by 1979 they had acquired additional futures contracts for more than 40 million ounces of silver at the Commodity Exchange (COMEX) and the Chicago Board of Trade (CBOT). Over almost a decade, the Hunts and their partners had amassed some 150 million ounces of silver, about 5,000 tons.
    This was equivalent to half of US silver reserves, about 15 percent of the world’s total. In addition, the Hunt brothers possessed around 200 million ounces of silver in the form of exchange-traded futures contracts. Global demand for silver rose to around 450 million ounces, while output remained below 250 million ounces, due to the low price level of just a few years earlier.
    In the meantime, the price of silver had risen to 8 USD, then it doubled to 16 USD in just two months, due to a growing physical shortage of silver. The CBOT and COMEX combined were able to deliver only 120 million ounces of silver, since the Hunts’ strategy concerning physical delivery was now being imitated by an increasing number of market participants.

    Figure 8. Silver prices, 1970–1982, in USD/troy ounce. Data: Bloomberg, 2019.

    At the end of 1979, the CBOT announced that no investor would be allowed to hold more than three million silver contracts. All contracts above that limit had to be liquidated. Nelson Bunker interpreted this as a sign of an imminent scarcity; he continued to buy silver, while Lamar joined him and invested 300 million USD. At that point Nelson Bunker held 40 million ounces of silver abroad and—together with the partners of the International Metal Investment Group—an additional 90 million ounces of silver. The International Metal Group in turn held futures contracts for an additional 90 million ounces, with a delivery date of March 1980.

    At the end of 1979 the price of silver rose to 34.50 USD; in the middle of January 1980 the price jumped above 50 USD (about 120 USD in today’s prices). The Hunt family’s silver stocks surpassed 4.5 billion USD in value!

    The wheel of fortune was about to turn, however. Once COMEX accepted only liquidation orders, prices started to fall. The US Federal Reserve System increased interest rates, and the stronger US dollar began to negatively affect prices for gold and silver. By mid-March 1980, silver prices had fallen to 21 USD. The crash was accelerated by panic selling on the part of smaller speculators who had followed the Hunts’ example. Others cashed in private silver stocks of jewelry and coins because of the record prices, further increasing physical supply of the metal.

    As March 1980 came to an end, the Hunts could no longer meet the margin requirements of their futures positions and were forced to sell more than 100 million USD worth of silver. On March 27, 1980, silver opened at 15.80 USD and closed at 10.80 USD. The day went down in history as “Silver Thursday.”

    On “Silver Thursday,” March 27, 1980, silver opened at 15.80 USD per troy ounce and closed at 10.80 USD. It was a daily loss of more than 30 percent!

    For the Hunts, whose volume-weighted average entry price in silver futures was 35 USD, this meant a debt of 1.5 billion dollars!
    Many investors, including COMEX officials who held short positions, significantly reinforced the downward spiral in silver prices. Although the metal recovered to about 17 USD by the mid-1980s, the Hunts had to file for bankruptcy and were accused of conspiracy to manipulate the market.
    The downfall of the Hunts was caused by extensive leverage. Otherwise they would have been able to weather the crash in silver prices without having to liquidate massive positions in the market. In the media the Hunts became a symbol of market manipulation, and their speculation and the collapse of silver prices, which caused huge losses for private investors, weighed down the reputation of the silver market for decades.

    Key Takeaways
    •Haroldson Lafayette Hunt, known as “Arkansas Slim,” founded the family fortune on oil. Subsequently the Hunts were among the top 10 wealthiest families in the United States.
    •Brothers Nelson Bunker and William Herbert Hunt tried to preserve the family wealth by investing in silver. They attempted to corner the silver market by buying the metal physically and building up large futures contract positions.
    •The price of silver skyrocketed from below 2 USD per troy ounce to above 50 in January 1980. By then, the Hunt family fortune surpassed 4.5 billion USD. But on March 27, 1980—“Silver Thursday”—silver crashed 30 percent. The Hunts had to file for bankruptcy and were accused of conspiracy to manipulate the silver market.

    14 Crude Oil: No Blood for Oil? 1990

    Power politics in the Middle East: Kuwait is invaded by Iraq, but Iraq faces a coalition of Western countries led by the United States and has to back down. In retreat, Iraqi troops set the Kuwaiti oil fields on fire. Within three months the price of oil more than doubles, from below 20 to more than 40 USD.

    “Once [Saddam Hussein] acquired Kuwait . . . he was clearly in a position to be able to dictate the future of worldwide energy policy, and that gave him a stranglehold on our economy and on that of most of the other nations of the world as well.” —Richard “Dick” Cheney, US Secretary of Defense, 1990

    During the Iran-Iraq War of the 1980s, Iraq had enjoyed good relations with the United States and Europe. The Western countries supported Iraq, especially militarily, in order to counteract the Khomeini regime in Tehran and the further spread of Islamic and Soviet influence.
    In 1980 Iraq was producing about six million barrels of crude oil per day, and Iran about five million barrels, most of which came from the oil-rich southwestern province of Khuzestan. Combined, crude oil production in the two countries accounted for about 20 percent of the world’s daily consumption. But the eight-year war, which killed a million people on both sides, greatly affected the economy of Iraq, whose main funding came from the Arab states, in particular Saudi Arabia and Kuwait. After the war, the country was heavily in debt to them.
    In addition, Iraq had always denied the legitimacy of Kuwait’s independence, considering it part of Iraqi territory. Conflicts had been smoldering around the border since its independence from the United Kingdom in 1961. Meanwhile Iraq was working to cancel or renegotiate its debt burden with Saudi Arabia and Kuwait and also trying to lower its debt by reducing crude oil production (thus leading to higher prices and higher profits). But Kuwait counteracted that move by increasing its quota and lowering its export price to increase its own market share.
    On July 17, 1990, Iraq accused its neighbors and the United Arab Emirates of producing far more oil than was agreed within OPEC, thereby pushing prices down and resulting in losses of 14 billion USD to Iraq alone. Iraq also accused its neighbors of stealing oil from Iraqi oil fields along their common border.
    Negotiations to ease tensions between Iraq and Kuwait failed on July 31, and Iraq deployed its forces along Kuwait’s border. During a meeting with Iraqi president Saddam Hussein, the US ambassador affirmed that the United States would not take any position in domestic Arab disputes or concerning the border conflict between Iraq and Kuwait. There were no specific defense or security agreements between the United States and Kuwait either. The Iraqi president interpreted this as a toleration of further action: On August 2, 1990, 100,000 Iraqi soldiers marched into Kuwait. The Gulf War had begun.

    A Quick Primer to Three Persian Gulf Wars

    The Iran-Iraq War (1980–1988) was originally referred to as the Gulf War until the Persian Gulf War of 1990–1991 (the Iraq-Kuwait conflict), after which the latter was known as the First Gulf War. Consequently, the Iraq War of 2003–2011 has been called the Second Gulf War.
    In September 1980 Iraq, headed by Saddam Hussein, invaded Iran, triggering an eight-year war that destabilized the region and devastated both countries. The United States supported Iraq during that war, because America was nervous about the potential spread of the Islamic Iranian Revolution by Ayatollah Khomeini, and Iraq longed to replace Iran as the dominant Persian Gulf state.
    The Gulf War of 1990 was waged by coalition forces from 35 nations led by the United States against Iraq, still headed by Saddam Hussein, in response to Iraq’s invasion and annexation of Kuwait. By that annexation, Iraq doubled its known oil reserves to 20 percent of global reserves, and was threatening Saudi Arabia, which controlled another 25 percent of global crude oil reserves, a situation that the United States could not tolerate.

    But it took another Gulf War to overthrow the government of Saddam Hussein. In 2003 a United States–led coalition invaded Iraq on the pretext that Iraq had weapons of mass destruction.

    Today Iran and Saudi Arabia are fighting for regional hegemony in a renewed cold war that is also an Islamic conflict of Sunni against Shiite. The Sunni-Shia conflict has been 1,400 years in the making. The arguments are complicated but essentially boil down to who is the rightful leader of Muslims following the prophet Mohammed after his death. With as much as 90 percent, the majority of the world’s Muslims are Sunni. Iran, Iraq, Azerbaijan, and Bahrain, however, have a majority Shia population.

    Figure 9. Crude oil prices, 1989–1991, in USD/barrel. Data: Bloomberg, 2019.

    The effect on oil prices was obvious. Oil prices marked a low in June 1990 of around 15 USD per barrel, having bounced between 15 and 25 USD in the previous months. At the end of July, on the eve of the war, the price of crude oil was already back at 20 USD. On August 3, West Texas Intermediate (WTI, a trading benchmark for crude oil) was just below 25 USD. Crude closed the month above 30 USD, then, at the end of September, oil traded at 40 USD for the first time. In October 1990 the price of crude oil marked a new high—more than 40 USD per barrel.

    Together, Iraq and Kuwait accounted for about 20 percent of the world’s oil reserves.

    Strategically, Kuwait was extremely valuable to Iraq. Although it is only 20,000 square kilometers, Kuwait has a 500-kilometer coastline, far exceeding the 60-kilometer coastline of much larger Iraq, whose area is almost 450,000 square kilometers. During the invasion, Iraq captured gold worth more than 500 million USD and, more importantly, gained access to Kuwaiti oil resources.
    Saddam Hussein had counted on the United States not to interfere in internal Arab affairs, but he now faced a completely different reaction from President George H. W. Bush. It seemed that US interests not only concerned Kuwaiti oil fields; they touched indirectly on Iraqi oil fields as well. Iraq controlled 10 percent of the world’s oil reserves; the annexation of Kuwait added another 10 percent.
    Moreover, as US Secretary of Defense (and later CEO of Halliburton, a major oil company) Richard “Dick” Cheney noted a few weeks after the Iraqi invasion, “Iraqi troops are only a few hundred kilometers away from another 25 percent of the world’s oil reserves in eastern Saudi Arabia.”
    Just a few hours after the beginning of the invasion, the UN Security Council adopted Resolution 660, which called for the withdrawal of the Iraqi troops. Within a week, the Security Council had imposed an economic and financial ban against Iraq (Resolution 661), which was designed to put an end to Iraqi crude oil exports. Meanwhile, the United States formed a military alliance of 34 countries against Iraq under the leadership of General Norman Schwarzkopf. Of the more than 900,000 soldiers deployed, about 75 percent were American troops. On August 8, two US Navy aircraft carriers arrived in the region, and President Bush initiated Operation Desert Shield to protect Saudi Arabia from an invasion.

    The invasion of Iraq began with Operations Desert Shield and Desert Storm. Oil prices spiked from 15 USD to more than 40 USD per barrel in October 1990.

    By Resolution 662, the UN Security Council declared the annexation of Kuwait by Iraq void and called for the restoration of its sovereignty. On August 25, the UN Security Council sanctioned the coalition’s embargo under Operation Desert Shield. By then 70 warships were deployed in the Gulf region.
    In occupied Kuwait arrests, abductions, torture, and executions were the order of the day, and the Iraqi government used foreign hostages as human shields. On September 5 Saddam Hussein invoked holy war against the United States in the Persian Gulf and called for the fall of the Saudi Arabian king Fahd. The Kuwaiti royal family had already fled.
    On November 29 the UN Security Council presented Iraq with an ultimatum for withdrawal from Kuwait by January 15, 1991. The US Congress approved military measures on January 12, and five days later, in the early morning hours, coalition forces began a massive air strike against Iraq. Within the first 24 hours of Operation Desert Storm, there were approximately 1,300 attacks.

    It took another Gulf War, in 2003, to overthrow the regime of Saddam Hussein.

    After a further ultimatum expired, the United States initiated a ground war on February 24. Two days later, the war was essentially over, as Iraqi troops officially began a withdrawal from Kuwait. In doing so, however, they set fire to Kuwaiti oil fields and opened the locking bars of many oil terminals to let the oil flow out into the sea. According to Kuwait, about 950 fields were set on fire or were mined by the Iraqi forces. In addition, oil production was interrupted until summer 1991. Only after the last fires were extinguished in November of that year did production increase again.
    Despite the war, American and British aims to eliminate the military power of Iraq, and its claims to supremacy in the region, remained unfulfilled. It took another Gulf War in 2003 to overthrow the regime of Saddam Hussein.

    Key Takeaways
    •The president of Iraq, Saddam Hussein, aspired to hegemony in the Middle East, the most oil-rich region of the world, but he failed to overthrow Iran during eight years of war in the 1980s.
    •Kuwait, despite its small geographic size, was of strategic importance to Iraq, because of its oil resources and its coastal access and harbor.
    •The Gulf War of 1990–1991 began with the invasion of Kuwait by Iraq and ended because of the intervention of the United States with Operations Desert Shield and Desert Storm. As a consequence of supply insecurity and burning oil fields, oil prices shot up from 15 USD to more than 40 USD.
    •After 9/11, Saddam Hussein was accused of possessing weapons of mass destruction; his regime in Iraq was finally overthrown in 2003.

    15 The Doom of German Metallgesellschaft 1993

    Crude oil futures take Metallgesellschaft to the brink of insolvency and almost lead to the largest collapse of a company in Germany since World War II. CEO Heinz Schimmelbusch is responsible for a loss of more than 1 billion USD in 1993.

    “We’re back, we’ve made it.” —Kajo Neukirchen, CEO of MG

    He was one of the stars of the German business scene: In 1989 Heinz Schimmelbusch became the youngest CEO in German history, the head of German Metallgesellschaft (MG), a huge industrial conglomerate founded in 1881 with a focus on mining and commodity trading. With Schimmelbusch’s arrival, a new wind was blowing through the company. Its traditional dependence on the metal business, which accounted for almost two-thirds of group sales and profit, was about to be reduced. The new growth areas would be engineering, environmental technology, and financial services.
    Schimmelbusch went on a shopping spree, acquiring Feldmühle Nobel, Dynamit Nobel, Buderus, and Cerasiv and creating an empire, valued at 15 billion USD, that included more than 250 subsidiaries. In 1991 Manager Magazine named him “Manager of the Year.” But four years after Schimmelbusch joined MG, his realm would end in disaster.

    The subsidiary of the MG Group in the United States was engaged in risky bets on crude oil prices.

    Under Schimmelbusch the MG Group was not only getting bigger but also more complicated to manage. At the beginning of the 1990s, the German economy cooled down. There was pressure from cheap Eastern European competitors, the car industry weakened, and Metallgesellschaft’s high debt levels began to drag on the company. But the firm’s Sword of Damocles was actually hovering above its subsidiary in the United States.
    Metallgesellschaft Refining and Marketing (MGRM) in New York sold fuel oil, gasoline, and diesel to large customers at long-term fixed rates; the company dealt in contracts of five- to ten-year maturity that promised delivery of a certain quantity of oil at a fixed price every month. MGRM’s customers were hedging against rising crude oil prices. However, MGRM did not have oil through its own sources or inventories. It had to buy the oil itself.

    Understanding the Oil Market

    From 1984 to 1992, the oil market was dominated by what traders refer to as “backwardation.” This means that price of crude oil to be delivered in the future will be traded at a discount to the current (cash) price. For the buyer of oil contracts this means, in addition to interest gained on the capital invested, there’s a gain from the difference between the future price and the spot price. Thus, MGRM’s rollover hedging strategy generated a continuous profit in addition to its hedging fees.
    Due to the volatile price of crude oil, MGRM was facing a market price risk of more than 600 million USD, which corresponded to one-tenth of the balance sheet of the parent company. This market price risk was hedged by futures.
    The company entered into a growing volume of crude oil futures whose sizes would be adjusted just before maturity to the contract volume of its customers and which would be rolled forward into the next contract month.

    A massive price decline in crude oil flipped the future term structure from backwardation into contango, which resulted in massive losses in MGRM’s hedging strategy.

    However, in 1993, these conditions changed as a massive decline in crude oil prices reversed the future term structure from backwardation to “contango,” in which future prices are higher than current ones. While the current oil price was below 18.50 USD per barrel, prices for a year ahead were more than 1 USD per barrel higher. The monthly gain for MGRM was converting into a widening loss. And there was another factor neglected by MGRM: rising cash-flow risks during contract maturity.
    While its delivery obligations matched delivery requirements at maturity, MGRM was now faced with increasing margin payments in the future. This had a direct impact on the balance sheet for MGRM, since realized losses would not be offset by potential future profits.

    Figure 10. Crude oil future term structure in 1993/1994, in USD/barrel. Data: Bloomberg, 2019.

    The situation continued to worsen as MGRM suffered from liquidity problems and poor credit ratings. In the context of declining oil prices, MGRM was caught in a vicious circle.
    Local management staked everything on a single throw of the dice and continued to carry out additional contracts with customers. At the low point of the crisis, MGRM alone was responsible for between 10 and 20 percent of all outstanding one-month-forward transactions in crude oil.

    By terminating all crude oil futures positions, the MG Group realized a loss of more than 1 billion USD.

    Meanwhile, German Metallgesellschaft’s fortunes had also been plunging. As a result of the economic slowdown and a high debt burden, the company could only pay a dividend in 1991–1992 by writing down hidden reserves. The following year the deficit had climbed to almost 350 million Deutschmarks, about 200 million USD. Then the bad news from the United States hit. Under pressure from creditors, MGRM was forced to file for bankruptcy with a loss of 1.5 billion USD. That brought the entire group to the brink of insolvency.

    In February 1993 Schimmelbusch launched an extensive divestment program to redeem 600 million USD. But the US subsidiary’s losses continued to grow and soon exceeded 1 billion USD. Schimmelbusch now had to ask for additional funding by the company’s major shareholders, Deutsche Bank and Dresdner Bank. Startled by the imminent loss, Ronaldo Schmitz, a member of Deutsche Bank’s executive board and chairman of MG’s supervisory board, pulled the trigger. The MG Group realized losses of more than 1 billion USD as a result of the termination of all crude oil contracts, and the group’s total liabilities grew to almost 5 billion USD.
    On December 17, 1993, Schimmelbusch and CFO Meinhard Forster were dismissed by the supervisory board without notice, and Kajo Neukirchen was hired by Schmitz to save the company. With a bailout of 2 billion USD, rigorous cost savings, and the dismissal of 7,500 employees, Neukirchen restructured the MG Group, which now focused on trading, plant construction, chemicals, and construction technology. In February 2000 the company was renamed MG Technologies, and it became the GEA Group in 2005. The MG Group had met an inglorious end.

    Key Takeaways
    •CEO Heinz Schimmelbusch became the youngest CEO in Germany when he headed German Metallgesellschaft (MG Group), a large and venerable industrial conglomerate. Manager Magazine named him “Manager of the Year” in 1991.
    •MGRM—the company’s crude oil refining and marketing subsidiary—followed practices that would adversely affect the entire conglomerate.
    •MGRM was selling petroleum products at a fixed price to customers, hedging its exposure on the futures market. During normal market conditions, the backwardation term structure of crude oil provided a comfortable markup.
    •Things changed when crude oil dropped from more than 40 USD in 1991 to below 20 USD in 1993, and the term structure flipped into contango. Losses mounted to a total of more than 1 billion USD and brought the MG Group to the brink of bankruptcy.

  • 丹尼尔•卡尼曼《思考,快与慢》35-38

    第五部分  两个自我

    第35章 体验效用与决策效用的不一致

    一直以来,“效用”这个术语有两种不同的含义。杰里米·边沁(Jeremy Bentham)在他的《道德和立法原则引论》(An Introduction to the Principles of Morals and Legislation)中用了这样一句名言作为开头:“大自然让人类处于‘痛苦’和‘快乐’这两者的主宰下。它们指明了我们应该做什么,并决定了我们应该怎样做。”在这本书的脚注中,边沁为用“效用”来表示这些体验而道歉,说自己找不到更好的词了。为了和边沁对这个术语的解释区分开来,我现将称其为体验效用(experienced utility)

    在过去的100年里,经济学家总会用同样的词去定义别的东西。经济学家和决策理论家在使用上面那个术语时,想要表达的是“想要能力”(wantability)这层意思,而我对此往往会用“决策效用”(decision utility)来表达。例如,期望效用理论就是控制决策效用的合理性原则,它与快乐体验没有关系。当然,若人们想要的正巧是自己喜欢的,喜欢的也是自己所选择的时候,“效用”的这两种含义就一致了。在经济主体都是理性的总体思路下,这种关于含义一致性的假设是内隐的。人们希望理性的经济行为人知道人们对现在和未来的看法,还希望他们作出将大众利益最大化的正确决定。

    如何测量体验效用?

    我研究体验效用和决策效用之间可能存在的差异性已经有很长的时间了。当我和阿莫斯致力于前景理论研究的时候,我设计了这样一道测试题:假设某人每天都要接受一次痛苦的注射。原计划注射20天,现减至18天,请问人们对这种减少的感觉与从6天减少到4天一样吗?

    若不一样,你能说出理由吗?

    我没有收集结果数据,因为结果很明显。你也可以自己验证一下,若能将注射天数减少1/3(即从6天减到4天),而不是1/10(即从20天减到18天),人们往往愿意付出更多。在第一种情况下避免两次注射的决策效用要比在第二种情况下大,并且相较于第二种情况,人们都愿意为第一种情况付出更多。但是,这种区别是荒谬的。如果痛苦每天都是一样的,则按应该注射的次数而言,为两种减少的注射量分配不同的效用又有何道理呢?用我们今天的话说,这个测验题告诉我们:体验效用可以用注射次数来衡量。而且,至少在某些情况下,体验效用可用做评估决策的标准。决策者若想得到同等的体验效用(或免于遭受同样的损失)却分配出不同的效用是种错误。你可能会发现这种情况很明显,但是在决策理论中,判断决策是否错误的唯一标准就是看这个决策和决策人的其他偏向是否一致。我和阿莫斯一起讨论了这个问题,但是我们没有深入研究。多年以后,我又开始思考这个问题。

    怎样衡量体验效用?怎样回答像“在治疗过程中,海伦承受了多大的痛苦”或者“她在沙滩上待了20分钟有多享受”这样的问题?英国经济学家弗朗西斯·埃奇沃思(Francis Edgeworth)早在19世纪就对此类问题作了推测,并提出发明“快乐测量仪”的想法,这种仪器可衡量出一个人所经历的快乐或痛苦的大小。

    体验效用是会变化的,就像每天的温度或气压那样,其结果将被绘制成时间函数。海伦在治疗过程中或休假期间经受了怎样的痛苦或快乐就像是“曲线下的区域”。时间在埃奇沃思的构想中起到了关键的作用。如果海伦在沙滩上待了40分钟而不是20分钟,并且她很享受,则此时她的总体体验效用就会翻倍。就像注射次数加倍会使治疗时注射的痛苦翻倍一样。这就是埃奇沃思理论,现在我们对于他的理论的构建情景有了更准确的理解。

    图15是我和唐·雷德梅尔(Don Redelmeier)为一项研究而设计的,是关于两名病患经历的痛苦的结肠镜检查数据。雷德梅尔是多伦多大学的医生和研究者,早在20世纪90年代,他就将这项实验提出来了。现在,做这个手术时常会辅用麻醉药物和健忘症药物,但是在我们收集数据时,这些药物还未被广泛应用。实验中,每60秒我们就要求这些患者说出他们当前的痛苦程度。这些数据用一个范围的值来表示:零表示“没有任何的痛苦”,10表示“无法忍受的痛苦”。正如你可以看到的,在此过程中,每个患者的体验有很大的改变,患者A的体验持续了8分钟,患者B持续了24分钟。(过程结束时记录的数据则为零)。此实验共有154位患者参加,最短的过程持续了4分钟,最长的有69分钟。

    图15

    接下来请思考一个简单的问题:假设研究人员使用相似的疼痛范围值对两位患者的疼痛感进行测量,哪一位患者的疼痛感更强呢?无可争议,人们普遍认同患者B会承受更大的痛苦。痛苦程度相同时,患者B不会比患者A所承受的时间短,对于B来说,“曲线下的区域”显然比A的要大。当然,关键因素是B的痛苦过程持续时间更长。这些测量数据都来自瞬时疼痛的“快乐测量值”。

    当实验结束时,我们要求受试者评估整个过程中感受到的“痛苦”。图中的文字是为了帮助受试者回想他们感受到的全部痛苦,以及进而产生的快乐测量值。令人惊讶的是,患者没参加过类似的实验。统计分析揭示了两个结果,解释了我们在其他实验中观察到的模式:

    ·峰终定律(peak-end rule) (指对一件事物的记忆仅限于高峰和结尾,事件过程对记忆几乎没有影响。高峰之后,终点出现得越迅速,这件事留下的印象越深刻):整体的回顾性评级可通过将最糟糕时期和最后时刻的疼痛程度的平均加权而评估出来。
    ·过程忽视(duration neglect):过程的持续对所有疼痛的评估没有任何影响。

    现在你可以将这些规则应用到患者A和患者B的情况中。最糟糕的评估(8~10)对这两位患者来说是相同的,但患者A在过程结束前的最后评估是7,而患者B只是1。因此,对于患者A来说,峰终的平均值是7.5,而患者B只有4.5。正如预期的那样,患者A在此期间比患者B更痛苦。对于患者A来说,结束时也是个糟糕的体验,这真的很不幸,完全没有愉快的记忆。

    我们现在陷入了困境:测量体验效用有两种方法,即快乐测量值和回顾性评级,但这两种方法从系统角度而言是不同的。快乐测量值是有观察员从他人不同时刻的体验报告中计算出的数据。我们将这些判断称为过程—权衡,因为在计算“曲线下的区域”时,对各个时刻都作了相等的权衡:在疼痛强度为9时,两分钟的疼痛是一分钟的两倍。然而,本实验和其他研究的成果表明,回顾性评级对过程并不敏感,而且,相比于其他时刻,回顾性评级会权衡两个单一时刻,即高峰和末端。所以,哪一个更重要呢?医生应该怎样做呢?这种选择对医疗实践有所启示,我们注意到:

    ·如果目的是为了减少患者的痛苦记忆,那降低最为疼痛时的疼痛感就比将疼痛的过程减到最短更为重要。同样的道理,如果患者在过程结束时感到的疼痛相对较轻,他对此过程的记忆就会更好,那么逐渐减轻疼痛比急剧减轻更可取。

    ·如果想减少实际体验到的痛苦,迅速完成这个过程或许更合适,即使这样做会让患者更疼痛并给患者留下可怕的记忆。

    你认为这两个目标哪一个更好?我没有作调查,但我认为会有很多人选择痛苦记忆较少的那个。我觉得将这种困境看做是两个自我之间的利益冲突会更容易理解一点(这与我们所熟悉的两个系统不符合)。经验自我是回答“现在疼吗”这种问题的,而记忆自我则是回答“总体如何”这种问题的。我们只有通过记忆才能保存生活体验,因此,在我们思考生命时,唯一能采取的观点来自于记忆自我。

    我曾作过一个关于将记忆和体验区分开的困难的演讲。结束后,我听到了一名观众的评论。他说聚精会神地听唱片中的交响乐时,由于光盘有刮痕,快结束时产生了令人厌恶的声音,糟糕的结尾往往“毁了全部的体验”。但实际上毁的并非是体验,只是对它的记忆而已。经验自我几乎有了完美的经验,糟糕的结尾并不能将其抹去,因为这种体验已经发生了。这位听众将整个体验定义为失败,就因为它的结尾很糟糕,但他却忽略了40分钟的音乐带给他的快乐。实际体验真的毫无价值吗?

    混乱的体验以及对此体验的记忆是种认知错觉,而对这种体验的替代让我们相信过去的体验是可以被消除的。经验自我无法表达自己的感受,记忆自我有时又是错的,但记忆自我可以记录体验,并掌控我们从生活中学到的东西,而决策也正是由这个自我做出的。我们从过去的经验中学到的就是储存记忆,这么做未必是为了未来的体验。这就是记忆自我的专制性。

    记忆自我夸大了痛苦体验

    为了证明记忆自我的决策能力,我和我的同事设计了一个实验,用的是温和却有些残忍的方式,我将这种方式称为冰手方式(正式名称为冷升压试验)。我们要求受试者将手浸入冰冷的水中且让冰水没过手腕,一段时间后可以拿出来,并能得到一条温暖的毛巾。受试者可用另一只手控制键盘上的左右键以不断记录自己所承受的痛苦,这种方法可作为与其经验自我的直接交流。我们选择的水温会让人感觉疼痛,但能忍受。当然,受试者在任何时候都可以自由地移动他们的手,但没有人这么做。

    每位受试者都做了两次冰手实验:

    短期实验情况就是在14摄氏度的水中浸泡60秒,受试者会感到水特别凉,但还能忍受。60秒结束后,实验者让受试者把手从冷水中拿出来,并给他们一条温热的毛巾。

    长期实验情况会持续90秒。其最初的60秒和短期实验的情况一样,在60秒结束时,实验者什么也不会说,但是他会打开一个阀门,让温水流入容器中。在后30秒内,水温大约会上升1摄氏度,刚好可让受试者觉察到疼痛感略有缓解。

    受试者被告知会进行3次实验,但事实上,他们只经历了短期和长期两种情况,分别用不同的手。两次实验间隔7分钟。第二次实验结束7分钟后,受试者可选择是否参加第三次实验。而且第三次试验是对前面某次实验的重复,而且使用哪只手可自己决定。当然,一半的受试者用左手做短期实验,一半用右手做;一半选择先做短期实验,一半选择先做长期实验,等等。这是一个被严格控制的实验。

    该实验的目的是为了在经验自我和记忆自我间引起冲突,也是在体验效用和决策效用间引起冲突。从经验自我的角度看,长期实验明显更糟糕。我们希望记忆自我会有另一种见解。峰终定律认为短期实验的记忆要比长期实验的记忆更糟,而过程忽视则认为90秒和60秒疼痛之间的区别会被忽略。因此,我们预测受试者将对长期实验会有更好的(或更不好的)记忆并且选择重复此试验。他们也确实这样做了。有80%的受试者(在做长期实验时认为最后一个阶段的痛苦减轻了)选择在第三次实验时重复长期实验,称自己愿意忍受后30秒不必要的痛苦。

    那些选长期实验的受试者并不是受虐狂,也不是想使自己置身于更糟糕的体验中,他们只是犯了一个错误。如果我们问他们:“你是喜欢泡90秒,还是只是前60秒?”他们肯定就会选择短期实验了。然而,我们没有这样问,受试者只是选择脑海中自然想到的:他们选择的是记忆中不那么令人厌恶的实验。我在问他们时,他们知道两次所受痛苦哪个时间更长,但他们并没有将这种认识与实际联系起来。他们的决定是出于一种简单的直觉:即选择你最喜欢的或最不喜欢的。记忆规则决定了他们有多不喜欢这两种选择,反过来,这种不喜欢的程度又决定了他们的选择。冰手实验,就像我之前说的注射测验题,都揭示了决策效用和体验效用之间的差异。

    在本实验中,我们观察到的偏向是我们在之前讲到的“少即是多”的另一个例子。其他“少即是多”的例子包括奚恺元的实验,即给低于总价值的24个盘子附加上几个盘子,因为附加的盘子中有的是坏的。还有一个例子是琳达问题,即激进的妇女会被认为更像是主张女权主义的银行出纳,而不是普通的银行出纳。其中的相似性并非偶然。系统1同样的操作特点说明了三种情况:系统1是用平均水平、规范和原型来表示集合,而不是用各条件的集合。冰手实验就是多个时刻的集合,而记忆自我会将每个时刻作为典型时刻记下来。这又会导致冲突。对于通过经验自我来评估各个时刻的客观观察者来说,最重要的是“曲线下的区域”,因为它表示的正是这段时间内受试者承受的所有痛苦,这本质上属于总结。相比之下,记忆自我保存的记忆是对代表性的时刻的感受,受到高峰和结束时刻的强烈影响。

    当然,动物对整体信息的存储记忆可通过进化而得以加强,某些情况下确实是这样。对于一只松鼠来说,“知道”已储存的食物总量是很重要的,只知道存储坚果的平均量不足以让它安心。然而,一段时间里的痛苦和快乐的总量对身体来讲不是那么重要。例如,老鼠对快乐和痛苦都会表现出过程忽视。在某项实验中,老鼠会先看到一束光,之后会遭电击,老鼠很快就会对光产生恐惧感。恐惧的程度可以通过一些生理反应来测量。实验的主要结论是,电击的持续时间对恐惧没有任何影响,有影响的是电击产生的痛苦程度。

    其他的经典研究表明,对老鼠大脑内的特殊区域(老鼠的大脑和人类的大脑相似)进行电刺激会产生强烈的快乐感,这种快乐感很强烈,以至于在某些情况下,老鼠(实验者可通过操纵杠杆刺激其大脑)会很兴奋,连停下来进食都不可能,最终被饿死。实验者可用不同电流强度和持续的电刺激能使大脑产生快乐的区域。需要再次强调的是,只有电流强度会起作用。在一定程度上,增加电刺激的持续时间并不会使动物更能感受到这种快感。支配人类记忆自我的规则有一个漫长的发展史。

    记忆没那么可靠

    几年前就一直困扰我的注射难题中最有用的一个想法就是:多次使人同样痛苦的注射,其体验效用可用计算注射次数的方法进行测量。如果所有的注射都同样令人厌恶,那么其中20次注射的痛苦程度会是10次注射的2倍,并且从20次注射减少至18次与从6次减少到4次给人们带来的减少痛苦感受的程度是相同的。如果决策效用与体验效用不相符,那么肯定是决策出错了。冰手实验也体现了这样的逻辑:持续90秒浸在冷水里比其前60秒在冷水里更痛苦。如果人们愿意选择忍受较长时间的浸泡,则说明他们的决定是错的。在我之前遇到的难题中,决策和体验之间的差异源于越来越小的敏感度:18次和20次之间的差异并不是很明显,似乎还没有6次和4次注射之间的差异明显。在冰手实验中,这种错误则反映出了记忆的两个原则:过程忽视和峰终定律。这些机制虽然不同,但结果却是一样的:决策与体验不协调。

    决策不会产生最有可能的体验,对未来感觉的预测也会是错的,这对于相信选择中是有理性的人来说不是好消息。冰手实验的研究表明,我们不能完全相信我们的偏向会反映出自身的爱好,即使这种偏向是基于个人经验的,甚至那些经验的记忆是刚刚才建立的!品位和决策受记忆影响,但记忆可能是错的。因此,像“人们的偏向不会改变,且知道如何让偏向达到最大值(这是理性代理人模式的基础)”这种说法就会受到质疑。我们的大脑在运作时,常会出现不一致的情况。我们对痛苦和快乐体验的持续时间有着强烈的偏向。我们希望痛苦的时间缩短,而愉快的时间能够延长。然而,我们的记忆(系统1的作用)已变成痛苦和快乐的最强烈感受(高峰时)以及感受结束时的自身感觉。忽视过程的记忆不会为我们的偏向带来长期的愉快和短暂的痛苦。

    示例—体验效用“你完全是从记忆自我的角度思考你失败的婚姻的。离婚就像是以刺耳的音符结束的交响乐。事实上,它虽然结束时很糟糕,但这并不意味着整首交响乐都那么糟。”“这是关于过程忽视的一个负面例子。尽管好的体验的时间要比不好的体验时间多10倍,但你还是将好的体验和不好的等同并加以权衡了。”

    第36章 人生如戏

    在我研究的早期,我看了威尔第的歌剧《茶花女》(La Traviata)。这部歌剧以华丽的音乐著称,讲述了一位年轻贵族与出身风尘的薇奥莉塔之间动人的爱情故事。这个年轻人的父亲因为想要保护家族声誉,不希望薇奥莉塔的出身妨碍到自己女儿的婚姻,便找到薇奥莉塔并劝她离开自己的儿子。于是,薇奥莉塔假装不爱自己的心上人了,拒绝了他。后来,她的肺结核开始复发。在最后一幕中,薇奥莉塔即将死去,她躺在床上,周围有几个朋友。薇奥莉塔的爱人知道了她病危的消息,匆匆赶往巴黎。而她在听到这个消息后,也仿佛看到了希望,感受到了喜悦,尽管她的病情还是在快速恶化。

    无论你看了多少次这部歌剧,还是会为这个紧张而危险的时刻揪心:这位年轻的爱人会及时赶到吗?对他来说,在薇奥莉塔死之前与她团聚有着重要的意义。当然,他做到了,美妙的爱情二重唱响起,但薇奥莉塔也在这10分钟美妙的音乐过后死去。

    比起整个人生,我们更在意人生的结局

    看完歌剧后,在回家的路上我想:我们为什么会那么在意最后的10分钟呢?我很快意识到我忽然感到自己完全没有注意薇奥莉塔活了多长时间。如果我知道她是27岁死去的,而不是我认为的28岁,就算她错过了一年的快乐生活也丝毫不会令我动容,但是,错过了这最后的10分钟却关系重大。另外,就算我知道他们重聚后在一起的时间是一周而不是10分钟,我的情绪也不会有什么改变。然而,如果她的爱人来得太迟,《茶花女》就会是一个完全不同的故事了。故事所关注的应该是其中有意义的事件和值得珍藏的时刻,而不是时间的流逝。过程忽视常出现在故事中,故事的结局也总能将故事的角色定型。我们在叙述的规则以及对结肠镜检查、假期、电影的回忆中都能找到与这则故事相同的主要特征。这也是记忆自我的工作机制:编故事,并将其作为将来的参考保存在记忆中。

    我们并非只在歌剧院才会感受到人生如同故事,并希望它会有个好结局。当我们听说一位和女儿疏远多年的妇人逝世时,也想知道她在死前是否已经与女儿冰释前嫌。我们所关心的不只是女儿的心情,而是希望这位母亲的故事更为圆满。关怀某个人通常体现在关心这个人故事的完整性,而不是他的感觉。一些事情还会改变已经去世的人的故事,这些事情也可能使我们深深动容。例如:一个男人到死都深信自己的妻子很爱他。所以,当我们听说他的妻子多年前就有了情夫,与这个男人在一起只是为了他的钱时,就会为这个男人感到悲哀。尽管,这个丈夫一生都很快乐,我们还是会同情他。若某位科学家的某项重要发现在她死后被证实是错误的,我们也会为她感到耻辱,尽管她自己并没有体验过这种耻辱。当然,更重要的是,我们都极度关注自己的人生故事,并希望故事的主角正派,结局完美。

    心理学家埃德·迪耶内(Ed Diener)及他的学生们对过程忽视和峰终定律是否会主宰我们对整个人生中所作的评估感到好奇。迪耶内简要地描述了简的一生(简是虚构出来的人物):简从未结婚生子,一场车祸让她丧命,但死的时候并不痛苦。对于简的故事有这么一个版本:她一生都非常幸福(这种幸福可能持续了30年或60年),她将工作视为享受,喜爱度假,花了很多时间与朋友聚会,培养自己的爱好。在故事的第二个版本中,简的寿命被延长了5年,她于35岁或65岁逝世。迪耶内描述说简生命的最后5年很快乐,但不及从前那样快乐。每位受试者在读过其中一份为简设计好的“传记”以后,都需要回答两个问题,“纵观简的一生,你认为她的人生有多圆满”以及“你认为简的一生经历了多大的幸福或不幸”。

    研究的结果进一步证实了过程忽视和峰终定律。在组间实验中(不同受试者看到的实验情景不同),将简的寿命延长一倍不会使受试者对她人生的圆满度或是整体的幸福度改变观点。显然,她的一生是由一个典型的时间段代表,与总体的时间无关。因此,她的“总体幸福”是生命中一段典型时期体验到的幸福,而不是整个生命过程中体验到的幸福。

    由这个观点可以得知,迪耶内和他的学生们也发现了“少即是多”的效应。这个效应清楚地表明,平均(典型)可替代总体。若给原本一直都非常幸福的生命增加5年“还算幸福”的日子,会导致人们对这个生命总体幸福度的评估大幅降低。

    在我的鼓励下,他们还收集了一些组间实验数据,数据是关于增加5年寿命的影响;每一名受试者都必须在实验过后迅速作出判断。尽管我长期研究判断错误,我也不相信理性的人会作出增加5年还算幸福的日子会使生命更加糟糕的判断,然而我错了,增加那令人失望的5年会使整个生命都显得很糟糕。

    这种判断模式似乎极为荒谬,所以一开始,迪耶内和他的学生们还认为是这些年轻受试者的问题。然而当这些受试者的父母和较为年长的朋友回答相同的问题时,他们的判断模式也没有发生改变。在评估整个生命以及一些有趣的事时,高潮与结尾很重要,过程通常会被忽略。

    人们经常会用工作的劳累和假期的舒适来反驳过程忽视的观点:我们都有直觉,工作24小时肯定会比工作6小时累,工作6小时比工作3小时更累。过程在这些情况中似乎很重要,但实际上是故事的结尾让整个事件过程的长度发生了改变。对于前面提到的那位母亲,等24小时会比等待6小时更为痛苦和绝望;旅游者休息6小时也会比休息4小时感到更为放松。当我们用直觉来评估这些事件时,真正起作用的是现有体验的不断恶化或改善,以及这个人的最终感受。

    关于上一次旅行,你还能记起多少?

    请思考度假时的选择。你是希望在去年去过且很熟悉的海滩度过愉快的周末,还是想充实新的记忆?为了满足这些不同的选择,两种截然不同的行业随之出现:度假村提供了恢复元气的休闲方式;旅游业则帮助人们构建故事、收集记忆。许多旅行者会近乎疯狂地拍照,这说明储存记忆是人们旅游的重要目的,这个目的会影响我们旅游的计划和体验。照相的人并不认为当时的景色只能供自己欣赏片刻,他们将景色当做未来的记忆来收藏。照片对于记忆自我来说很有用,尽管我们很少会长时间或多次观看这些照片,有的照片我们甚至没再看过,但是拍照并不一定就是旅行者的经验自我欣赏风景的最佳方式。

    很多时候我们都通过自己想要储存的故事或记忆来评估旅行。“难忘”这个词常都用来描述旅行中的亮点,明确地阐述旅行的目的。在其他情况下,我们会想到“喜爱”这个词,这是对此刻永生难忘的宣言,尽管这并不总是准确,会随着时间的变化而变化。有自我意识的记忆体验会得到重视、被赋予意义,这是其他体验无法实现的。

    埃德·迪耶内及他的团队提供的证据表明,是记忆自我选择了旅行方式。他们要求一些学生记日记,记录下春假期间他们对自己经历的评估。学生在假期结束之时,还需提供自己对整个假期的整体评估。最后,他们还需说明自己是否愿意再次这样度假。统计分析说明,他们是否想要重复假期的意愿完全取决于最后的评估,即使是最后的评分也不能代表他们在日记中描述的经历,他们依然会这样选择。就像冰手实验一样,无论对错,当人们在作是否重复某个经历的决定时,他们都会由记忆作出选择。

    有关你下次旅行的思考性实验能使你察觉到你对自己的经验自我的态度。
    在假期结束之时,你拍的照片和录像将被全部销毁。
    另外,你会服下一剂药,这剂药会消除你关于这次旅行的所有记忆。
    以上情况对你的假期计划有多大影响?与普通的旅行相比,你会花多少钱在这次旅行上?

    在我还没有正式研究人们对这种情境的反应之前,我曾与他人讨论过,得出的结论是,记忆的消除会大大降低这次体验的价值。有时候,人们对待自己就如对待其他失忆的人一样,他们通过回到曾令自己愉快的地方以增强自己的愉悦感。然而,许多人说他们完全不想去那些地方,这表明他们只关注自己的记忆自我,而且相对于失去记忆的陌生人来说,他们更少关注失去记忆的经验自我。许多人指出他们不会让自己或是失忆的人去爬山或是穿越丛林,因为这些体验在当时大都是痛苦的,只能靠提醒自己达成目标的痛苦与快乐都是值得的才能坚持下去。

    另一个思考性实验需要你想象自己正面临一场痛苦的手术,整个手术过程你都是清醒的,别人告诉你你会痛苦地叫出来,还会请求医生停止手术。然而,你事后肯定能得到一颗“忘忧草”,彻底忘掉这件事。你对此有何看法?我无心的观察再次得出这样的结论:大多数人对于他们经验自我遭受的痛苦都是漠然的。许多人说他们毫不在乎。另一些人和我有一样的看法,我为我的经验自我感到遗憾,但遗憾的程度不会比我对痛苦的陌生人的遗憾感受强。我就是自己的记忆自我,也是自己的经验自我,两者主宰我的生活,但它们对我来说就像是个陌生人,这感觉很奇怪。

    示例—谈到人生如戏“他一生正直磊落,但生命的最后一段却不得人心,为此,他要竭力维护自己的一生。”“为了能有一晚的相处时间,等多久都愿意的现象就是过程忽视的例子。”“你似乎将整个假期都用在了构建记忆上。也许你应该放下相机,享受这一刻,即使这一刻并不令你感到难忘。”“她是老年痴呆症患者。没有了人生故事,但是她的经验自我对于美与高贵依然敏感。”第37章 你有多幸福?

    15年前,在我刚开始对幸福的研究感兴趣时,我发现我们对幸福的认识都是通过让无数人回答一些差别不大的问卷调查得到的,这是被普遍接受的测量幸福的方法。这些问题是为记忆自我而设计的,会使你思考自己的生活:
    从各方面考虑,你对自己目前生活的满意程度如何?

    在从结肠镜检查以及冰手实验的错误记忆的研究谈到幸福这个话题时,我自然而然地对生活满意度是衡量幸福程度的标准这一观点产生了怀疑。由于记忆自我对实验没有什么帮助,我将注意力集中在了经验自我的幸福感上。我提出这样的说法:“海伦在3月份很快乐。”我认为这种说法是合理的,其前提是:

    她将大多数时间用在了她愿意继续、不想停止的活动上,很少将时间用在不想做的事情上。更重要的是,人生苦短,所以她也没将时间花在自己不在乎的事情上。

    有许多事是我们愿意继续、不想停止的,包括心理和生理上的愉悦。我想到的海伦想要继续做下去的事情是全身心投入到某项工作中去,这种全身心投入的状态被米哈里称为心流。心流是艺术家在创作时、人们在被电影和书籍或是填字游戏深深吸引住时的一种状态。人们处于这些情境时,往往不愿被打扰。我也有过类似的记忆:我小时候,当我母亲从我手中把玩具拿走,要带我去公园时,我总会哭。在公园里,当她将我从秋千上抱走,带我去玩滑梯时,我也会哭。抗拒中断当前事情表明:无论是玩玩具还是荡秋千,我当时都正玩得愉快。

    我建议测量海伦的客观幸福感要和评估两位做结肠镜手术的病人的方法一样,通过海伦对其生活中连续时刻的幸福感来评估。我采用了埃奇沃思在一个世纪以前就提出的快乐测量仪的方法。最初采用这个方法时,我认为海伦的记忆自我对实际的幸福与其经验自我体会到的真实幸福相比会更容易犯错误,因而,对其不予考虑。我怀疑自己的这个观点过于极端,后来证实这果然是极端的,但却是个很好的开始。

    测量经验自我的幸福感

    我召集了一个“梦之队”,其中包括除我在内的三个不同领域的心理学家以及一位经济学家。我们一起提出了一套测量经验自我的方法。不幸的是,对经验的持续记录难以实现,因为一个人不可能一边不停地报告自己的体验,一边像平常那样生活。最接近于真实情况的选择是使用经验取样法,这是由米哈里发明的方法。自首次使用以后,这个方法已经有了一定的改进。现在,我们可以通过手机来采集经验样本。具体方法是:将某个人的手机设置为在每天任意的时间响或振动,随后,手机会在打断这个受试者后,显示一些关于她正在做什么以及和谁在一起的问题。手机还会显示评定量表,以供受试者报告她各种感受的强度,这些感受有:快乐、紧张、愤怒、担心、投入程度、身体上的疼痛等。

    经验取样法成本高且烦琐(尽管没有大多数人一开始觉得的那样令人烦扰,回答这些问题只需很少的时间)。因此我们需要一个更为实际的方法,所以,我们开始采取昨日重现法(Day Reconstruction Method,DRM)。我们希望这个方法可以得到接近于使用经验取样法的结果,并提供关于人们如何利用他们时间的额外信息。我们邀请受试者(在研究早期时都为女性)参与一个两小时的会议。首先,我们请他们将昨天的生活分为如同电影一样的多个片段,然后详细叙述出来。然后,他们还需回答关于每个片段的一些选择题,这些问题是基于经验取样法提出的。他们从一个列表中选择了参与的活动,并说明是哪一个活动吸引了自己最多的注意力。还列出了与他们在一起的人,并将自己几种感觉的强度划分了等级,等级范围为0~6,其中0=没感觉,6=感觉最强烈。这种方法证明,能够详细回忆过去情境的人也能重新感受到过去事情发生时的感受,甚至可以体验到他们先前对这些情绪的生理反应。

    我们假设受试者能够非常准确地还原某个场景的典型时刻。几个与经验取样法进行的比对证实了昨日重现法的有效性。由于受试者还说出了各个场景开始与结束的时间,我们还可以计算出他们清醒时感受的过程权重。在对我们每天受到的影响的综合测量中,持续时间较长的场景比稍短的更有价值。我们的调查问卷还包括估测生活满意度,我们将此时的满意度理解为记忆自我的满意度。我们采取了昨日重现法研究决定情绪上的幸福感和生活中满足感的因素,受试者是几千位来自美国、法国和丹麦的女士。

    单一的幸福价值很难代表某一时刻或场景的经历。积极感受有很多种,包括喜爱、快乐、投入、希望、乐趣等。消极情绪也有许多种,包括生气、羞愧、忧郁和孤独。尽管积极和消极的情绪可能同时存在,但将生活中大多数时刻区分为完全积极和完全消极还是有可能的。通过比较积极与消极的形容词的等级,我们可以辨别出令人不悦的场景。如若在某个场景中,某种消极感受比所有积极感受都要强烈,我们就认定这个场景是令人不悦的。我们发现,美国女性有19%的时间都处于不愉快的状态,比法国女性(16%)或丹麦女性(14%)都要高。

    我们将个人处于不愉快状态的时间比称为U指数。例如,某个人在16个小时醒着的时间内,有4小时处于不愉快状态,其U指数就是25%。U指数并不是基于评定量表,而是基于对时间的客观测评。

    各种活动的U指数也可以被测量。例如,我们可以测量出人们在交谈、工作,或是与父母、爱人、孩子交流时处于消极情绪的时间占总时间的比例。对于美国中西部城市的1 000位女士来说,晨间交流的U指数是29%,工作时交流的U指数是27%,

    照顾小孩时是24%,做家务时是18%,社交时是12%,看电视时是12%,做爱时是5%。工作日的U指数会比休息日高6%左右,主要是因为人们在周末会更少将时间花在他们不喜欢的事情上,也不用承受与工作相关的紧张和压力。最令我们惊讶的是人们与孩子相处时的情绪经历,美国女性与孩子相处的时候感到比做家务还要无趣一些。法国女性和美国女性的U指数有少许不同的地方,下面是其中一点:法国女性比美国女性与孩子相处的时间少,但是更享受其中,可能是因为她们有更多使孩子受到照顾的方法,而且也不用在中午花太多时间接送孩子去参加各种活动。

    人在任何时刻的心情都由他的性情和整体的幸福感决定,但情绪上的幸福也会在一天或一周之内出现巨大的波动。人在某个时刻的心情主要取决于当时的情境。例如,工作时候的心情主要不会受大体上的工作满意度(包括待遇和职位的满意度)的影响。更重要的是情境因素,例如与同事交流的机会、被噪音烦扰、时间压力(这是消极影响的重要来源),以及突然看到老板(在我们的第一项研究中,这一点是唯一一个比孤独更糟糕的因素)。注意力是关键。我们的情绪状态绝大部分取决于我们关注的事情,我们通常都会关注正在进行的活动以及直接环境。也有例外的时候,那时,主观经验的质量是由再现的想法来主导的,而不是由当时发生的事件主导的。处于恋爱中的人即使在堵车的情况下也可能感到快乐,而处于哀悼中的人就算是看搞笑电影也可能会继续悲伤。然而,在正常情况下,我们只因此刻正在发生的事或喜或悲,但前提是我们必须关注这件事。例如,从吃中得到快乐,你必须注意到你正在吃东西。我们发现法国女性和美国女性花在吃东西上的时间大约是相同的,但对于法国女性来说,她们对吃的关注是美国女性的一倍。美国人更有可能在吃的同时兼顾其他事情,所以,她们从吃中得到的快乐也相应减少。

    这些观察对于个人和社会而言都是有意义的。对时间的利用是生活的一部分,是人们可以掌控的。少数人可以用意志使自己更为开朗、乐观,但是许多人可能会安排他们的生活,使自己少花些时间交谈,多花些时间做喜欢的事、见喜欢的人。由不同活动产生的感受表明,人们可以用另一种方法提高经验的质量:将消极休闲的时间用在其他事情上,例如将看电视转换为更为积极的休闲方式,包括社交和锻炼。以社会的角度来看,为劳动工人提供更好的交通条件,为职业女性提供照顾儿童的渠道以及为老人提供社交的机会等都是降低社会U指数的有效方法。即使是1%的降低也是显著的成就,因为这可以使人们避免成千上万个受苦的小时。将利用时间的全国性调查和经验自我的幸福感相结合可为社会政策提供多种参考。我们团队的经济学家艾伦·克鲁格(Alan Krueger)就是致力于将这种方法介绍给国家统计局的第一人。

    幸福的方法

    测量经验自我的幸福感已被普遍应用于美国、加拿大、欧洲等国的全国性测试中,盖洛普世界民意调查还将这种测试应用到了美国及150多个国家成千上万的受试者身上。这些民意调查使受试者回想起前一天所经历的情绪变化,尽管并没有昨日重现法那样详细。这个巨大的样本使得我们可以进行全面的分析,证实了情境因素、生理健康以及社会接触等对于经验自我幸福感的重要性。当然,头痛也会使人痛苦,而某人某天感受的第二个最佳参照点就是这个人是否与朋友和亲人接触。说快乐就是将时间用在你爱的人和爱你的人身上的确有一点儿夸张。

    盖洛普获得的数据使我们能对幸福的两方面进行对比:
    ·人们生活中经历的幸福。
    ·当人们评估自己的生活时作的判断。

    盖洛普的生活总体评价是通过名为坎特里尔自我定位奋斗量尺问题来实现的,具体如下:

    请想象有一架阶梯,每级台阶都标有数字,最低一级是零,最高一级是10。最高的台阶代表你最美好的生活,最低的台阶代表你最糟糕的生活。此时此刻,你认为自己站在哪一级台阶上?

    比起生活经历,生活中的某些方面会对某个人对生活的估测产生更大的影响。教育程度就是一个例子。若某个人接受过更高的教育,那他对自己生活的评估也会更高,但这并不意味他的经验自我更幸福。的确,至少在美国,教育程度越高的人压力也会越大。另一方面,身体不健康对经验自我幸福的不利影响会比对生活方面的评估大很多。与孩子生活在一起也会给日常感受带来坏的影响—有报告表明,父母普遍感到压力与愤怒,但是这对生活评估的不利影响却不大。参与宗教活动对于积极情绪与压力都有有利影响,对生活评估的影响很大。然而,令人惊奇的是,宗教并不会让人们沮丧或担心的感受有所减少。

    钱可以买到快乐吗?这是人们最常问的关于幸福的问题。对45万名受试者回应的盖洛普海斯威斯幸福指数分析以及对1000名美国人的每日调查,为我们提供了惊人而又明确的答案。结论是贫穷使人悲惨,富有可能会提升某个人的生活满意度,但总体来说来却不能提高经验自我的幸福感。

    极度的贫穷会增强经验对生活中其他不幸经验的感受。这尤其体现在生病上,生病对于贫穷的人来说会比家道小康的人有更糟糕的感受。位于收入分配前2/3的人中,因为头痛,原本19%说自己忧郁和担忧的个人会增长到38%。而在收入分配最后10%的穷人中忧郁和担心的人则会从38%增加到70%,其基线水平越高,增加的也越多。穷人与其他人的重大区别还体现在离婚和孤独的影响方面。另外,对穷人来说,周末对于经验自我的幸福的有利影响会比其他大多数人小得多。

    当某位住在高消费地区的人的家庭收入约为7.5万美元时(此收入标准在低消费地区相应减少),他的经验自我的幸福的满足水平就不会再提升。经验自我的幸福感也会随着收入增加,但超过那个标准后,也就不会再提升了。这令人惊奇,因为更高的收入无疑能使人们获得更多快乐,包括可以在有趣的地方度假、听歌剧、改善生活环境等。为什么这些增加的快乐没有在情绪经验的报告中显示出来呢?其合理的解释为,更高的收入会削弱人们享受生活中小乐趣的能力。有证据支持这个观点:向学生过早地灌输金钱观会影响他们在吃巧克力时的快乐感受!

    收入对经验自我的幸福感的影响和对生活满意度的影响有着明显的区别。我们得出的关于幸福的一般结论与结肠镜那个实验的结论一样清晰明了:人们对自己生活的评估与他们的真实体验可能有关,但也有不同。正如我几年前的想法一样,用生活满意度来衡量经验自我的幸福感并没有错。这完全是另外一回事。

    示例—幸福感“客观的政策可以减少人们的痛苦。我们以降低社会的U指数为目标,解决沮丧和极端贫穷是首要问题。”“增加幸福感的最简单方法是分配好你的时间。你能抽出更多时间做自己喜欢做的事情吗?”“如果你的收入超过了满意水平,你能够拥有更多使人愉快的经历,但你将会丧失一些享受小乐趣的能力。”第38章 思考生活

    德国社会经济小组成员安德鲁·克拉克、埃德·迪耶内和雅尼斯·基尔格里斯每年都会询问同一群受试者有关生活满意度的问题,以及他们在前一年经历了什么大变动。小组成员对受试者的回答进行了分析,图16就是分析的一部分,是这些受试者在每一年回答对自己结婚期间的满意度情况。

    图16

    生活满意度:一个很难回答的问题

    图16肯定会使读者紧张地淡然一笑,这种紧张感也很容易理解:毕竟决定结婚的人不是希望婚姻能使他们更快乐,就是希望建立稳定长久的关系以维持自己目前的幸福状态。丹尼尔·吉尔伯特和蒂莫西·威尔逊引入了情感预测这个有用的名词。而对于许多人来说,作出结婚的决定就反映出了因情感预测而引起的重大错误。

    即使在结婚当天,新娘和新郎都知道离婚率很高,对婚姻失望的例子更是数不胜数,但是他们还是不相信自己也会这样。

    图16中最令人惊讶的是人们在结婚后的生活满意度陡然下降。这个图被普遍认为是对人们适应过程的追踪记录,在这个适应过程中,由于婚姻生活的反复,人们起初感到的婚姻带来的快乐会很快消逝。然而,以另一种强调直观判断法的方法来追踪适应过程同样可行。我们想知道,当人们正在评估自己的生活时,他们的大脑有什么样的活动。“你对自己生活的整体满意程度如何”以及“最近你有多快乐”等问题并不像“你的电话号码是多少”这个问题那样简单。所有的受试者是怎样在短短几秒内回答这样的问题的呢?结论是:将此问题想成是另一个判断会有助于回答。对于其他问题来说也是如此,有些人可能已经有了现成的答案,这个答案是他们在另一种情况下评估自己的生活时得出的。还有些人,也可能是大多数人,在不能很快想到某个问题的确切答案时,会自动地将答案替换为更为简单的问题的答案。系统1参与到了这个过程当中。当我们以这个观点来看图16时,其意义就会有所不同。

    许多简单问题的答案都能由对生活的总体评估替换。你一定还记得这项研究:刚回答过在前一个月有多少次约会的学生在回答他们“最近的快乐程度”时,就会将约会当做他们生活中唯一重要的因素。在另一个基于同样目的的著名实验里,诺伯特。施瓦茨和他的同事邀请了一些受试者来到实验室,并请他们完成一份关于生活满意度的问卷调查。然而,在他们开始调查之前,施瓦茨请受试者们为他复印了一张纸。其中,有一半的受试者会发现复印机上有一个一角的硬币(是实验者预先放在那儿的)。即使是这样小小的幸运却极大地提高了受试者对于他们生活整体满意度的评估。心情启发式是回答生活满意度的一种方式。

    与约会有关的调查和机器上有硬币的实验表明了我们应该对关于总体幸福度问题的回答持保留态度。当然,当别人要求你评估自己的生活时,你的大脑并不是只有当前这一种情绪。你很可能会想到最近刚发生或即将要发生的重要事件;会想到反复担心的问题,比如爱人的健康或是经常与你儿子在一起的那些坏伙伴;还会想到重大的成就和使你痛苦的失败。你可能会想到几个与总体幸福度这个问题相关的观点,但多数其他观点你还是想不到的。即使你快速得到的关于自己生活幸福感的评分不会受与之完全无关的事情(例如机器上的硬币)的影响,此评分还是会取决于少数极易想到的观点,而并非取决于对你生活中所有领域的仔细衡量。

    刚结婚或马上要结婚的人当被问到对生活的整体评价时,很有可能就会联想到结婚这件事。在美国,绝大部分婚姻都是出于自愿的,几乎所有人在想到自己的婚姻或即将开始的婚姻时都会感到高兴。所以这个问题的关键就是注意力。我们可以从图16中看出当人们被问到自己的生活时,他们想到最近或即将到来的婚姻生活的可能性。这个想法肯定会随时间的流逝而越来越不受重视,因为其新鲜感会有所消退。

    图16显示,人们在结婚前后一两年的生活满意度都非常高。然而,如果这种明显的涨幅反映了回答问题时启发式的时间过程,我们从中得到的关于幸福或是对婚姻适应过程的信息就会很少。我们不能由此推断出为何幸福感会在几年内提升但又逐渐下降的趋势。即使是那些在被问到关于他们生活的问题时就会想到婚姻、就会快乐的人在其他时候也未必会感到很快乐。除非他们常想到自己幸福的婚姻,否则婚姻的幸福与否并不能直接影响到他们整体上的幸福感。即使是那些足够幸运,能完全处于享受幸福婚姻状态的新婚夫妇最终也会回归到现实中,他们体验到的幸福感也会像其他人一样,再次依赖于当前自己身处的环境和参与的事情。

    在对昨日重现法的研究过程中,有伴侣的女性和无伴侣女性的经验自我的幸福感在大体上并没有不同。这两类女性对时间的分配可以解释这一发现。有伴侣的女性很少独自一人,和朋友在一起的时间也很少。她们会花更多的时间在美妙的性生活上,也会花很多时间做家务或照顾孩子,这些事当然是人们不想做的。当然,对于一部分已婚女性来说,长时间和丈夫在一起会更快乐,而另一部分女性却不这么认为。平均来说,经验自我的幸福感不受婚姻的影响,原因并不是婚姻不能影响幸福感,而是其对于生活某些方面的影响对一些人来说是积极的,而对于另一些人来说却是消极的。

    经验自我的幸福感和生活满意度在总体上取决于性情的遗传,这也是个人生活环境与其生活满意度相关性低的原因之一。体验幸福的性情像身高和智力那样,是可遗传的,对出生之后就分开的双胞胎进行的实验就证明了这一点。那些似乎是同样幸运的人却对幸福感的体验有很大差别。在某些情况下,例如由于平衡效应的影响,婚姻与幸福感的相关性低。这是因为,同样的情况对一些人来说是好事,对另一些人来说却是坏事,新的环境对人的影响也是有利有弊。在其他情况下,比如高收入对生活满意度的影响普遍都是积极的,但某些人可能会更在意钱,事情也会因此而变得复杂。

    有人出于另一个目的,对高等教育的影响进行了大规模的研究,其研究结果显示了年轻人设定目标对其终身的影响。这些数据是由1995~1997年对近12000人做的调查问卷得来的,这些受试者都在1976年进入名牌大学读书,在十七八岁时填写了一份关于过上“富裕”生活重要性的调查问卷,从“不重要”到“必不可少”共有4个等级可供选择。他们在20年后又填写了一份调查问卷,其中涉及了他们在1995年的收入水平和对自己生活满意度的总体评价。

    目标不同,结果也会有很大的不同。在写下抱负的19年后,许多希望能有高收入的人都实现了这个愿望。例如,在597位心理学家和其他医学专家的样本中,他们对金钱重要性的观点每升高一个层次,工资收入就都会增加14 000美元(1995年时的美元价值)!不工作的已婚女性也有可能实现她们对金钱的渴望。对于这些女性来说,她们对金钱的渴望每升高一个级别,就会增加12 000美元的家庭收入,这些钱显然是由她们的丈夫赚的。

    人们在18岁时对钱看重的程度同样也预示着他们在成年以后对自己收入的满意程度。我们比较了高收入人群(收入超过20万美元)和低收入人群(少于5万美元)的生活满意度。对于那些认为有钱很重要的人来说,收入对生活满意度的影响更大(总分为5,其影响为0.57分);而对那些认为钱不重要的人来说,收入对其生活满意度的影响则只有0.12分。相对于普通人来说,想要且能得到钱的人对生活明显更为满意;想要却没有钱的人则对生活更为不满。同样的原则也适用于其他目标—对生活不满的成年人,解决这个问题的一个方法就是设定非常难以实现的目标。在20年后对这些受试者生活满意度的调查表明,年轻人最难以实现的目标是“在表演艺术方面功成名就”。年轻人的目标会影响他们将要经历的事、他们的未来,以及对生活的满意程度。

    在一定程度上,这些发现改变了我对于幸福的看法。人们为自己设定的目标对于他们要做什么,以及对只关注经验自我的幸福感是难以维持的这一事实的感受都极为重要。幸福不是忽略人们想要得到的。此外,说幸福是忽略自己活着的真实感受而只关注自己对生活的想法也是不成立的。我们必须接受幸福是各个方面的综合体的观点,必须把记忆自我和经验自我的感受都考虑在内。

    被放大了的幸福错觉

    受试者在评估自己的生活时,并没有仔细思考。这个看法是由受试者回答问题的速度以及他们受当前情绪的影响程度推测出来的。他们肯定会使用启发法(替换和眼见即为事实的例子)。尽管受试者关于生活的看法会受到有关约会的问题或是放在复印机上的硬币的影响,但他们并没有忘记生活不仅仅是约会或走运。幸福的概念并不会随着突然发现一枚硬币而发生改变,但是系统1常会作为生活的一部分替代整个生活。人们所关注的生活的任意方面会在整体评估中被放大。这就是聚焦错觉的实质,下面的这个句子可以描述这一点:

    在你思索某件事时,这件事就不会像你想的那样重要了。

    这个概念源自一场关于从加州搬到普林斯顿的家庭辩论。在这场辩论中,我的妻子说加州的人比东海岸的人幸福。我反驳道,气候肯定不是决定幸福的重要因素,斯堪的纳维亚人可能是世界上最幸福的人。我还注意到永久的生活环境对幸福的影响也很小,但是我还是没能说服我的妻子,她依然相信加州人更幸福,这是一种情感预测的错误。

    不久之后,我参与了一个关于全球变暖的社会科学的研讨会,而那个家庭辩论的话题依然在我的脑海中徘徊。研讨会上,一个同事根据他对下个世纪地球人口幸福度的观点提出了自己的看法。我反驳道,预测在一个更温暖的行星生活是何种情形是荒谬的,因为我们甚至不知道住在加州的感觉会如何。交流不久后,我和我的同事戴维·施卡德(David Schkade)得到了一笔研究资金,主要研究两个问题:住在加州的人比其他地方的人更快乐吗?人们普遍认为加州人相对快乐的程度如何?

    我们召集了许多来自加州、俄亥俄州和密歇根州的学生,组成了一个大的样本。在其中一些学生的帮助下,我们得到了关于他们生活各个方面满意程度的详细报告。通过另一些学生,我们得到了关于某个“与你有同样兴趣和价值观”但却住在别处的人会怎样完成同样的调查问卷的预测。

    分析了数据以后,我显然赢得了那场家庭辩论。正如预期的那样,两个地区的学生对天气的态度是不同的:加州人很享受当地的气候,而中西部人却厌恶当地的气候。然而,气候并不是决定幸福感的重要因素,甚至加州学生与中西部学生的生活满意度也根本没有任何不同。我们还发现,我的妻子并不是唯一一个认为加州人更为幸福的人。两个地区的学生都犯了和我妻子同样的错误,我们还能追溯到此错误的根源,即他们都夸大了气候的重要性。我们将这种错误称为聚焦错觉。

    聚焦错觉的本质是眼见即为事实,就上面例子来看,即是对气候给予过多的权重,却忽略了其他影响幸福的因素。为了理解这种错觉强大的影响力,请花几秒钟思考下面的问题:

    你从自己的车上能得到多大快乐?

    你能立刻得到答案,因为你知道自己有多喜爱和欣赏自己的车。你将其替换成了另一个不同的问题:“你在什么时候能从车中得到快乐?”这个问题的答案可能会令你惊奇,但也是简单直接的:当你考虑到自己的车时,你就能从车中得到快乐(或不快)。当然,你也不会常想到自己的车。正常情况下,你平时开车时是不会花很多时间思考自己的车的,你会想一些其他的事情,而你的心情也由你所想的事决定。当你尝试评估自己有多喜爱车时,你实际上回答的是另一个更为具体的问题:“当你考虑自己的车时,你能从车中得到多少快乐?”这个替换导致你忽略了自己很少想起车的事实,这是过程忽视的一种形式。其结果就是聚焦忽略。如果你喜欢自己的车,你就有可能夸大从其中得到的快乐,这会使你在想到当前这辆车的优点或是考虑是否要买辆新车时出现错觉。

    类似的偏见使得人们对加州人幸福感的判断发生了偏差。当被问到加州人的幸福感时,你可能会想到加州比较特别的活动,例如夏天可以爬山,或是羡慕那里冬天气候温和。但事实上,加州人很少参与那些活动。不仅如此,加州的常驻居民在对自己的生活进行总体评估时,根本没怎么想到气候这个问题。如果你一生都住在加州,而且不怎么去旅游的话,那么加州就像自己的10根脚趾一样,会觉得它们很重要,但却不会时常想到它们。如果生活中任意一方面的想法有很强的可替代性的话,此方面就更有可能被凸显出来。

    而搬到加州的人则会有不同的回应。假设某个企业的核心人员搬到了加州,想从这宜人的气候中得到快乐。搬家后的几年内,当问他对自己生活的满意度时,他可能会想到这次搬家,进而会对比搬家前后两州的气候。对比的结果肯定是加州更胜一筹,而对于生活中气候这一方面的关注就会使他对自己真实经验的权重发生偏差。无论这个人在搬家后是否真的更快乐,他都会说自己感到更快乐了,因为关于气候的想法导致他相信自己更快乐。聚焦错觉能使人们对自己当前的幸福状态、他人的幸福感以及自己未来的幸福感判断错误。

    半身瘫痪的人一天中有多长时间情绪低落?

    这个问题肯定会让你想到某位半身瘫痪的人正在思考自己的身体状况。在这个瘫痪者发生事故后的前几天里,你的这个猜想很可能还是正确的。但是随着时间的流逝,瘫痪者会开始慢慢习惯,对自己身体状况的注意力就会转移到其他新的情况上去(只有少数例子除外),最主要的例外情况包括长时间的疼痛、持续处于吵闹声中以及严重的抑郁。疼痛和吵闹声是吸引注意力的生理信号,抑郁则会使难受的想法不断强化。因此,对于类似情况,人们是不可能完全适应的。半身瘫痪者也并不例外:观测表明,半身瘫痪者在事故发生的一个月内心情大都是相当好的。尽管当他们想到自己的境况时,也肯定会感到悲伤。然而,在大多数时候,这些半身瘫痪者工作、阅读、看笑话、交朋友,在报纸上读到政治新闻时同样也会生气。当他们参与到任意一项活动中时,与其他人并没有多大的差别,我们也可以说,半身瘫痪者的幸福感在大多数时候都是接近于正常水平的。想要适应一个新的环境,无论这个环境是好还是坏,在很大程度上取决于慢慢地不去想这个环境。从这个意义上来看,生活的长期状况(包括半身瘫痪和婚姻)只在部分时间会对人们的状态产生影响,即当人们关注于这些状况的时候。

    在普林斯顿大学教书有个好处,即能带聪明的学生完成研究论文。其中,指导波特鲁利亚·科恩(Beruria Cohn)的论文就给我留下了深刻的印象。她的论文数据来自于某家调查公司,这家公司请受试者估测了半身瘫痪者处于坏心情的时间比例,科恩收集并分析了得来的数据。她将受试者分成两组:第一组被告之导致患者瘫痪的事故发生在一个月前,另一组被告知事故发生在一年前。另外,每一个受试者都需要说明自己是否认识半身瘫痪的人。从这一点出发,她又将受试者分成两个组。这两个组对半身瘫痪不久的人的判断非常接近:认识瘫痪者的受试者估测他们有75%的时间处于负面情绪中;需要靠想象才知道瘫痪者是何状况的受试者的估测值是70%。相较而言,这两组受试者对事故一年后瘫痪者情绪的估测则大不相同:认识瘫痪者的人认为他们有41%的时间处于负面情绪中;现实生活中不认识半身瘫痪者的受试者的平均估测值则为68%。很明显,那些认识瘫痪者的人观察到瘫痪者对自己境况的注意力会逐渐转移,而那些不认识瘫痪者的人就不能预测到这种适应性的发生。判断某人赢得彩票一个月后和一年后的心情也是这样的模式。

    我们能够预测出,对于那些半身瘫痪者以及有慢性病且难以负荷身体状况折磨的人来说,他们的生活满意度与幸福感关系并不大,因为在要求他们评估自己的生活时,不可避免地会使他们想到其他人的生活以及自己曾经的生活状态。最近关于结肠造口术病人的研究结果也与这个看法一致。此研究结果表明,病人的幸福感与他们对自己生活的评估有着极大的不同。在经验样本中,并没有发现这些病人的幸福感与健康人有何不同。但结肠造口术病人却想要以自己几年的生命换取健康的身体。而没有得结肠造口的人会认为自己若得了这种病情况会很糟糕,因此他们宁愿失去几年的寿命也不愿再次做这个手术。这个时候,记忆自我似乎是受到了聚焦错觉的支配,而聚焦错觉则将焦点放在了经验自我忍受的痛苦上。

    丹尼尔·吉尔伯特和蒂莫西·威尔逊引入了错误想法(miswanting)这个词组来描述因情感预测的错误而导致不佳决策的这种情况。这个词组理应成为我们的日常用语。聚焦错觉(丹尼尔·吉尔伯特和蒂莫西·威尔逊称之为过度聚焦)是产生错误想法的主要原因。值得注意的是,错误想法会导致我们易于夸大购买大件商品或变换环境对我们未来幸福感的影响力。

    请比较两个会使你的生活某些方面发生改变的决定:买一辆舒适的新车和加入每周都有聚会的小组,有可能是扑克小组或是读书小组。这两种经历在开始时都是新鲜且令人兴奋的体验。其主要的不同在于,买了车后,你对它就会越来越不关注;但加入小组却能常参加社交活动,当然前提是你愿意常去。由于眼见即为事实的关系,你可能会夸大汽车的价值,但不太可能在社交活动或其他需要注意力的活动方面犯同样的错误,这样的活动有打网球或学习拉大提琴等。聚焦错觉会产生一种偏见,这种偏见会导致人们更加看好本身就能令人兴奋的事物或经历,即使这些事物或经历最终也会失去吸引力。人们忽视了时间,致使维持人们长久的注意力价值的经验很少受到关注,至少比这种经验应得到的关注要少。

    千万不要忽略时间的作用

    本书中不断重复时间的重要性。将经验自我的生活描述为一系列有价值的时刻是符合逻辑的。某个生活阶段的价值(我曾称其为快乐总量)就是这一阶段所有价值的总和。不过,这不是大脑呈现各个阶段的方法。我曾提到过,记忆自我同样也会讲故事和作出选择,而且它讲的故事和作出的选择都不能恰当地表示时间。在讲故事时,一些关键的时刻,特别是开始、高潮和结尾,代表了整个生活阶段,过程因此就被忽略掉了。在冰手试验和薇奥莉塔的故事中,我们可以看到将注意力完全集中在某一特定时刻的情形。

    我们在前景理论中看到了另一种不同形式的过程忽视,在这种过程忽视中,状态由其过渡状态所代表。彩票中奖会创造一种新的财富状态,此状态能持续一段时间,但决策效用会随着对彩票中奖这则消息的反应强度的改变而改变。人们忽略了对注意力的减退以及对新状态的适应,只注意到了短暂的时间片段。在对慢性疾病的预测以及聚焦错觉的过程中,都有同样的对过渡到新状态的关注、时间忽略和适应性。人们在聚焦错觉中犯的错误包括关注选定的时刻,忽略其他片段发生的事。大脑善于处理故事,但却似乎不能很好地处理时间。

    在过去的10年里,我们了解了许多关于幸福的新发现的事实。我们也明白了,幸福这个词并不只有一个简单的含义,我们也不该将其简单地随意使用。有时,科学的进步会使我们更加困惑。

    示例—生活的思考“她认为买一辆豪车会使自己更为快乐,但这其实是个情感预测错误。”“今天早上,他的车在上班途中坏掉了,因此,他的心情非常糟糕。今天并不适合问他关于工作满意度的问题。”“她平时看起来都很开心,但当我们问她是否快乐时,她说自己并不快乐。这个问题肯定使她想到了自己最近离婚这件事。““买一座更大的房子可能不会使我们永远感到快乐。我们可能会因为犯聚焦错觉的错误而遭殃。”“他选择了在两座城市间之间奔波往返。这可能是一个错误想法的典型例子。”结语

    我在本书的开头引入了两个虚拟的人物,随后讨论了人类的两种存在形式,最后又介绍了两种自我。两个虚拟人物分别是运用直觉、进行快速思考的系统1和需付出努力、运行更慢的系统2。系统2进行的是慢思考,能监督系统1的运作,并在其自身有限的能力下尽可能地占据控制地位。两个物种分别是活在理论世界的虚拟经济人以及活在现实世界的人类。两个自我指的是感受当下的经验自我以及记录并作出选择的记忆自我。最后一章是对这三组概念的某些应用,我将逆序进行讲解。

    两个自我

    记忆自我与经验自我相抗争的可能性问题比我最初想象的更加复杂。在早期的冰手实验中,过程忽视和峰终定律的结合会使人们作出明显荒谬的选择。为什么人们愿意承受没有必要的痛苦呢?这是受试者的记忆自我作出的选择,更愿意去回忆那些给他们留下更好记忆的体验,尽管这些选择会使自己承受更多的痛苦。或许在一些极端例子中,以记忆的质量为标准进行选择是恰当的。例如,创伤后产生压力是有可能发生的,但手冰凉的体验并不是一种创伤。客观的旁观者在为别人作选择时,肯定会选择受创期短的那一个,会更加考虑别人经验自我的感受。但人们为自己作的选择,有一半都可被认为是错误的。在像茶花女的歌剧和对简的生活判断的故事中,过程忽视和峰终定律都经不起推敲。以某个生命的最后时刻来评估整个生命,或在判断哪种生命更为理想时,完全忽略其过程都是没有道理的。

    记忆自我是系统2的一部分。系统2评估生活中某些情节及生活本身的方法有着显著的特点,这些特点也是我们记忆的特征。由系统1产生的过程忽视和峰终定律并不一定与系统2的评判标准相符合。我们相信过程是重要的,但记忆却告诉我们,过程并不一定重要。规定评估过去事件的原则对决策制定不能起到很好的导向作用,因为时间在其中也起了重要作用。人类的存在有一个核心的事实,即时间最终还是有限的资源,但人类的记忆自我却忽略了这个事实。比起细水长流的幸福来说,人们更偏好享受短暂却强烈的快乐。这种偏见是由结合了峰终定律的过程忽视造成的。与这种偏见相反,另一种偏见使我们更为害怕短期、强烈的疼痛,而对于长时间但较轻微的疼痛却更容易接受。过程忽视还使我们容易接受长期但轻微的不愉快,因为其结局会更好;若某件事的结局不好,即使其过程是长期且快乐的,我们也会忽略掉。以同样的观点来看待不适,请考虑这个普遍的警告,“不要这样做,否则你会后悔的”,这个建议听起来很明智,因为其所能预见的后悔出自于记忆自我的判断,我们也倾向于将这个判断看做是最终结论。然而,我们不应该忘记,记忆自我的观点不总是正确的。一个测量快乐的客观观察者会更注重经验自我,会提供不同的建议。记忆自我对过程的忽略、对峰终和结局的重要性的夸大,以及对后见之明的怀疑共同作用,歪曲地反映着我们真实的体验。

    相反,对过程加权的幸福观使我们将生活中的所有时刻都看做是相似的,其将生命中所有时刻都分为值得纪念或不值得纪念两种。有些时刻最终会比其他时刻得到更多的权重,并不是因为它们值得纪念或是很重要。人们花在思考某个值得纪念的时刻的时间应被考虑在内,增加这个时刻的权重。通过改变某个时刻之后时刻的经验也能增强这个时刻的重要性。例如,练习拉一个小时的小提琴可能会增强多个小时的演奏经验或几年后听音乐的鉴赏能力。同样,引起创伤后应激障碍(PTSD)的短暂且可怕的事件应该通过其引起的长时间的痛苦来权衡。从过程加权的角度来看,我们只能在事情发生后才能决定某个时刻是值得纪念的还是毫无意义的。“我会一直记得……”或“这是一个意义非凡的时刻”的说法可以被看做是承诺或是预测,但即使我们在说这些话时是百分之百真诚的,我们还是常常无法实现这些承诺或正确进行预测。我敢打赌,10年后,许多我们曾经说过想要一直记住的事都会被忘记。

    过程权重的逻辑具有强迫性,但我们并不能将其视为关于幸福的完整理论,因为人们只认同记忆自我,而且只关心自己的故事。忽略了人们想要的关于幸福的理论是站不住脚的。另外,忽略了真实发生的事并只关注于人们对自己生活的想法的理论同样也站不住脚。我们必须将记忆自我和经验自我都考虑在内,因为它们对生活的诠释不总是一致的。哲学家可能会长时间在这些问题上纠结。

    对于这两个自我哪一个更重要的问题,并不是只有哲学家才需要考虑的。这个问题对于某些领域的政策问题都有一定的影响,特别是医药和福利领域。请考虑对治疗不同的病应该作的投资,包括失明、耳聋和肾衰竭。这些投资应该受人们对这些疾病的恐惧程度的影响,还是该受病人真实的痛苦体验的刺激?是受病人想要恢复健康的愿望的强烈程度还是病人为了健康而愿意付出代价的大小来决定?关于失明和耳聋,或结肠造口术和透析的投资意愿强度,可能会因为对痛苦严重程度评估方法的不同而有所不同。当前对此问题还没有简单的解决办法,但这个问题却非常重要,不容忽视。

    最近,用对幸福的测量来引导政府决策的可能得到了包括学者和欧洲几个政府机构在内的关注。将来,社会痛苦总量指数可能会和失业、残疾和收入指数一起包含在国家统计数据中。比起几年前,这个想法在现在看来还是有可能实现的。这个项目已经取得了一定的进展。

    经济人和人类

    如果我们能与某个人进行理性讨论,此人的信念能顺应现实,而且他的倾向也与其兴趣和价值观相符合,我们就可以说这个人是通情达理的。在说到理性这个词时,人们往往会想到审慎、深思熟虑且缺少热情的人物形象,但在日常用语中,一个理性的人肯定是通情达理的。但对于经济学家和决策理论家来说,“理性”这个形容词有着完全不同的意义。判断某个人是否理性的唯一标准并非是看这个人的信念或是偏好是否合理,而是看它们是否一致。一个理性的人可以相信鬼,只要他的其他信念也与世界上有鬼存在这个信念相一致。一个理性的人可以有好恶,但他的偏好要前后一致。理性指的是逻辑上的一致,即合理与否。根据这个定义,经济人就是理性的,但有很多证据表明,人类并不理性。经济人不会受启发式、眼见即为事实、窄框架、内部意见或偏好逆转的影响,但人类却无法避免这些影响。

    将理性定义为一致性是会受到限制的。理性要求人们遵守逻辑原则,但我们有限的大脑却不能够实现这一点。从这个定义来看,通情达理的人并不一定就是理性的人,但也不能因此就被认为是非理性的。“非理性”是一个较重的词,包含了冲动、感情用事以及对合理辩护的顽强抵抗等含义。当我与阿莫斯的研究成果被认为证明了人类的选择是非理性的时候,我总想要退缩。因为事实上,我们的研究仅仅表明了人类不应该被描述为处于理性代理模式中。

    尽管人类不是非理性的,人类仍然时常需要帮助才能作出更准确的判断和更好的决策。有时,相应的政策和机构就能够提供这种帮助。这样说虽然没什么不对,但实际上却颇具争议。正如比较权威的芝加哥学院派解读的那样,对人类理性的信心和防止人们作出错误选择是没必要甚至不道德的这一观念联系紧密。理性的人应该是自由的,他们应该为自己的选择负责。米尔顿·弗里德曼是芝加哥学院派的主要代表人物,其主要观点在他的一本畅销书的标题上得到了体现—《自由选择》(Free to Choose)

    经济人是理性的这一设想为用自由主义的方法制定公共政策的观点提供了思想基础:不要干涉个人选择的权利,除非这些选择对他人有害。将物品分配给愿意付钱最多的人是市场效率的体现,对市场效率的赞叹是对自由主义政策的支持。有一篇《理性成瘾理论》支持芝加哥学院派的这一观点,它解释了对强烈且即时满足有极度偏好的理性代理人会做出理性的决策,把对未来的沉迷当做一个结果。加里·贝克尔是这篇文章的作者之一,也是芝加哥学院派中的一个诺贝尔奖获得者。他曾以轻松但不失严肃的口吻说过,我们应该考虑通过某种信念,即人们能很快找到治愈糖尿病的方法,来解释所谓的肥胖流行病的病因。他提出了一个有价值的观点:当我们观察那些行为看似怪异的人时,应该考虑到一种可能—他们这样做有合理的理由。只有当理由变得不合理时,才会引发心理学上的解释。其中,贝克尔对于肥胖症的解释可能就是不合理的。

    在经济人的国度里,政府应该让经济人在对他人不造成危害的前提下自己作选择,不横加干涉。如果骑摩托车的人选择不戴头盔,那么自由主义者就会认为这是他的权利,并支持他这么做。无论是决定不存养老金还是选择吸食毒品,公民们都知道自己正在做什么。不过,往往难以界定这种情况:没有存够养老金的老年人并不会比在餐厅吃完大餐后抱怨价格太高的人得到更多怜悯。因此,在芝加哥学院派与行为经济学家的辩论中,有许多理论都是相互矛盾的。行为经济学家抵制极端的理性代理人模式。辩论的所有参与者都认为自由不是争辩而来的价值。但是相比人类理性的真正信徒,生活对于行为经济学家来说更加复杂。没有行为经济学家会赞同强迫市民均衡膳食,以及只看有益电视节目的规定。然而,对于行为经济学家来说,自由是需要付出代价的,做了不明智决策的个人以及认为有义务帮助这些人的社会都需要付出代价。因此,该不该帮助个人避免错误的决策就成为了行为经济学家的两难。芝加哥学院派的经济学家们不存在这个问题,因为理性代理人不会犯错。对于这个学派的人来说,自由是免费的。

    在2008年,经济学家理查德·泰勒和法学家卡斯·桑斯坦合著了《助推》。这本书很快成为了全球畅销书,还被视为行为经济学的《圣经》。书中引入了几个新的词语,包括经济人和人类,还提出了一系列方案来解决在不剥夺人们自由的前提下帮助人们做出良策的难题。泰勒和桑斯坦主张自由家长制的做法,即允许国家和其他机构“推动”人们做决策,并使这些决策服务于该国或该机构的长远利益。将参与养老金计划指定为默认选项就是助推的一个例子。不可否认,人们会因为不自觉地加入了这个计划而觉得自己的自由少了,因为他们在当初填表时,只需确认一个复选框,就可以退出这个计划。在之前已经提过,个人决策的框架(泰勒和桑斯坦将其称为选择架构)对结果有着巨大的影响。助推基于坚实的心理学,我在之前已阐述过。默认选项自然而然地被认为是普通选项。而偏离普通选项是一种委任的行为,需要考虑更多,承担更多的责任,比什么都不做更有可能让人后悔。如果某个人不确定该怎么做时,就会有强大的助推力来引导这个人做出决策。

    与经济人相比,人类同样需要保护,以免受那些蓄意利用他们弱点的人的危害—特别是系统1的怪异模式以及系统2懒惰的弱点。理性代理人被认为能谨慎地作重要的决定,并充分利用知道的已有信息。经济人会在签署一份合约之前,阅读并理解所有条文,但是人类通常不那样做。某家不道德的公司设计出的合约在显而易见的地方隐藏着重要的信息,这些信息能使公司在法律范围内有回旋的余地,但人们不经阅读就签下了合约。对理性代理人模式有害的极端解读是:除了确保相关信息公开外,顾客被假定为不需要保护,合约中字体的大小和语言的复杂程度不被认为是相关信息,但是一个经济人知道如何处理小字体的信息。《助推》这本书给出的建议是要求公司提供足够简单的合约以供人类客户阅读和理解。因为顾客得到了更详细的信息,这可能使一些公司的利益受到损害,因此,一些建议遭到了这些公司的强烈反对,但这是一个好的迹象。公司通过提供更好的产品来提高竞争力要比公司独自赢利更为可取。因此,通过提供好产品来提高竞争力的公司更受到人们的青睐,也就是说更受青睐的公司往往是提供的信息不明确的公司。

    自由家长制的显著特点是其在广泛的政治方面的吸引力。行为政策的绝佳例子是“为明天储蓄更多”计划,这是由国会中的极端保守主义者和自由主义者联合提出的议案,而这两者的联合并不常见。“为明天储蓄更多”是公司为其员工提供的养老金计划。签了这份合约的员工在加薪时增加一定的存储比率,这样,员工就能为储蓄计划贡献得更多。储蓄率随工资的上涨而自动上升,直至员工注意到存得太多,进而选择退出该计划。现在,这个由泰勒和桑斯坦于2003年提出的伟大革新使储蓄率有了一定的提高,也使成千上万工人的前景更加光明。这个计划有坚实的心理学理论作为基础,本书的读者们对这些理论知识肯定都有所了解了。此计划通过要求非立即改变或尝试来提高存储以支付工资的方法避免了直接损失,将损失转变成了未得收益(foregone gains),也就更容易使人接受。另外,其自动性的特点还将系统2的懒惰与工人的长远利益结合在了一起。当然,所有这些特点都没有强迫任何人做任何他们不想做的事,也不含任何误导或欺诈。

    自由家长制在许多国家都得到了认可,包括英国、韩国,还得到了很多政党的认可,包括英国托利党以及奥巴马政府等。的确,英国政府成立了一个新的小部门,这个部门的任务就是将行为科学原则用于帮助政府实现目标。这个部门的正式名称叫做“行为研究小组”,但是,无论是政府内部的人还是政府外部的人,都将这个小组简单地称为“助推小组”。泰勒是这个小组的顾问之一。

    继《助推》一书之后的一本书中,奥巴马总统邀请了桑斯坦在政府信息与规制事务办公室任职。这个职位为桑斯坦提供了很多将心理学和行为经济学的课程应用于政府机构的机会。这个任务在管理与政府预算办公室在2010年所作的报告中有所描述。本书的读者应该可以理解一些特定提议背后的逻辑,包括鼓励“清晰、简单、显著及有意义的披露”。读者还需读懂背景陈述“描述非常重要,例如,如果某个可能的结果被构架成一种损失,这种结果会比构架成收益有更大的影响”。

    关于助推的例子有很多,比如之前已经提过的关于耗油量公开信息的框架规则,而其他方面的应用还包括自动参加健康保险,用新的膳食指南代替令人费解的膳食宝塔(新的膳食指南是由一个盛满营养均衡的食物的盘子所表示),以及美国农业部门(USDA)所指定的规则,即允许在肉制品标签上写上类似“90%无脂肪”等信息,而“10%的脂肪”也可以说成“接近于瘦肉率颜色的表述方法,即描述出与同脂肪率的肉相同的色泽、大小及种类”。与经济人不同的是,人类需要帮助才能作出好的决定,且这种帮助可以通过告知或不介入的方式得以实现。

    两个系统

    本书将大脑的运作描述成了两个虚拟人物不稳定的相互作用,这两个虚拟人物就是自动的系统1以及需要付出努力的系统2。现在,你对这两个系统的个性已经相当熟悉了,也能够预测他们在不同情境下可能的回应方式。当然,你也知道这两个系统并不是真正存在于大脑或其他地方中。“系统1做了某事”是“某事自主发生”的简略说法。“系统2被动完成了Y”是“更兴奋,瞳孔扩散,注意力集中,Y活动开始进行”的简略说法。我希望你能和我一样,交谈时使用关于两个系统的语言,这样的话,交谈就会更方便,还能在不知两个系统存在与否的问题时凭直觉判断系统的运作方式。作出这些简要说明后,在后面的内容中,我会继续使用两个系统的说法。

    我们对自己的看法就是对系统2的看法。系统2会进行判断和选择,但它会认可系统1形成的观点和感觉,或将这些观点和感觉合理化。你可能没有意识到你对某个项目持乐观态度,只是因为此项目的领导使你想到了自己亲爱的姐姐。或是,你或许会厌恶和你的牙医长得像的人。如果你想寻求一个解释,就要搜寻记忆,寻找一些像样的理由,你最后肯定能找到一些。另外,你还会相信自己编造的故事。系统2不仅是系统1的辩护者,它也能避免许多愚蠢的想法和不当表达而引起的冲动。投入注意力能提升众多活动的表现(试想在思想混乱时在狭窄的路上开车的风险),对于一些任务来说,注意力的集中还是必要的,例如在进行比较、选择和推理时。然而,系统2并不是理性的模范,其能力以及能够掌握的信息都是有限的。我们在推理时,头脑不会总是很清醒,我们犯错也不全是因为突然想到的不恰当的直觉。通常,我们犯错是因为我们(系统2)无法再了解到更多的信息。

    我花了更多的时间来描述系统1,也用了很大篇幅描述我源于直觉判断和选择的错误。然而,相对的篇幅并不是评判直觉思考优劣的好指标。系统1是我们许多错误的原因,但也是我们许多正确做法的原因,而且我们也常做正确的事。我们的想法和行动通常由系统1指导,是当机立断的。系统1的一个优点就是储存在我们联想记忆中丰富而详细的世界:在这个世界里,人们能在不到一秒的时间内,从普通事件中区分出令人惊奇的事件;立即对自己所期望的事生成想法,并对令人惊奇之事和正在发生的事自动搜寻有因果关系的解释。

    记忆能记录我们一生中习得的技能,因而也会自主产生解决方法来应对不断出现的挑战(比如绕过路上的一块大石头走,避免让顾客挑出错误)。技能的习得要求有固定的环境、练习的机会,以及对自己想法和做法快速且明确的反馈。当这些条件都满足时,就能掌握技能了,且此后快速闪现在大脑中的直觉性判断和选择都会是正确的。这些都是系统1来完成的,也就是说这些是快速且自主发生的。有技能的行为是能快速有效地处理大量信息的能力。

    若挑战碰上了有技能的应对方法,这个应对方法就能被唤起。如果没有技能,又会发生什么呢?此时,系统2显然要介入,就如同回答“17×24=?”这个问题,其结果肯定是确定的。但想要系统1对系统2的能力表现出吃惊,不介入进来却不太可能。系统1不会受能力的限制,在计算时不要求确切数值。在搜寻某问题答案时,它能自动生成对相关问题的回答,还可能会将所问问题的答案替换成很容易出现在头脑中的回答。在启发式的概念中,启发式的回答并不一定比原来的问题更简单或需要更少的努力,启发式的回答只是更容易想到,更快、更容易被发现而已。启发式的回答不是随意想出来的,它们“似乎”是正确的答案。不过,有时也错得离谱。

    系统1在处理信息时,可能会产生认知放松。当信息不可信时,系统1也不会生成警告信号。人们会快速且自信地进行直觉性回答,不管这些回答是否源于技能或启发式。系统2没有简单的方式来区分有技能的和启发式的回答。唯一的方式是放慢速度、自身构建出一个答案,这个答案可能不会被轻易接受,因为系统2比较懒惰。系统1的很多建议常常没有通过最基本的检验就得到了人们的支持,就像球拍和球的问题。这就是系统1得到“错误和偏见的起源”这个负面称号的原因。系统1的运行特征,包括眼见即为事实、强度匹配和联想一致性等,会产生可预测的偏见和认知错觉,比如锚定效应、回归平均值的预测、过度自信,以及许多其他错觉。

    对于偏见我们能做什么呢?我们如何提升判断和决策(这些判断和决策来自我们自身和那些我们为之服务也服务于我们的机构)的质量呢?从自身经验来谈,系统1的运行方式是不能教给别人的。我除了认为年龄会有些影响外,我们的直觉思考就像我之前对这些问题作的研究那样,包括过度自信、极端预测和计划失误的倾向。我只提升了对易犯错误的情境的识别能力,“这个数字会成为一种锚定……”,“如果问题被重新架构,决策会改变……”而我在识别别人错误的过程中,也取得了更多的进步。

    避免系统1出错的方法从原则上讲是很简单的:认识到你正处于的认知领域,放缓并要求系统2来加以强化。当再次碰到缪勒–莱耶错觉图时,你会怎么做?当你看到有箭头的线段指向不同的方向时,你会意识到现在你不能相信自己对长度的直觉。不过,这种明智的过程在最需要的时候不会被应用到生活中。我们都希望在自己要犯错时能有个铃声提醒自己,但这是不可能的,认知错觉比感知错觉更难以识别。理性的声音也许比错误的直觉响亮又清晰的声音更微弱。当你面临着重大决策的压力时,质疑自己的直觉会让你感到不愉快。当你处于麻烦中时,最不愿意看到的就是有更多的质疑。这样的结果就是,相比自己要犯错时,你在观察别人是否要犯错时,能更容易辨认出雷区。观察者会比实施者在认知上更为放松,更愿意接收信息。我写本书的一个原因就是指导批评家和传闲言碎语的人,而不是指导决策制定者。

    机构要比个人更容易犯规避错误,因为机构的人多,自然就会思考得很慢,也更有能力按规则行事。机构可以制定和有效使用检查表,还可以深入开展,比如参考类别的预测以及“事前验尸”练习。机构能够鼓励其成员形成一种在靠近雷区时互相留意和提醒的文化,而这种文化的形成一部分是通过为其成员提供一些独特的词汇。无论机构是干什么的,都涉及判断和制定决策,就像是工厂生产产品,每个工厂都应该有保障其产品在最初设计、装配及最后检查时的质量的方法。决策产生的相关阶段包括解决框架问题、收集引导决策的相关信息、反馈以及检查。想要提高其决策质量的机构应该经常在每一个阶段里搜寻可提高效率的环节。这个运作的概念是有规律的。持续的质量控制通常是在危机产生后机构采取的对过程的全面回顾。其中一个例子就是明显缺乏主持高效会议必要技能的系统训练。

    基本上,更为丰富的语言对于建设性批评来说是必不可少的技能。与医疗相似,辨别判断性错误就像是在诊断病人,需要一些精确的词汇。从某种疾病的名字中,我们希望得到所有关于这一疾病的信息,包括其易感染性、环境因素、症状、预断及治疗等。与其相似的是,如“锚定效应,”“窄框架”、“过度一致性”也能使我们想到关于某个偏见的所有信息,包括其原因、影响以及我们能对其做些什么。

    在办公室饮水机旁的闲谈与决策有直接的联系:闲谈越多,所做的决策就可能更好。有时,决策制定者能听到大家当时传的闲言碎语和批评,这比听自己内心疑虑更容易。当他们相信批评自己决策的人经验丰富且公平正直,或当他们希望自己的决策能通过制定的方式而不是结果来评判的话,就会做出更好的决策。

    附录A  不确定性下的判断:启发法和偏见

    (本文首次刊登于1974年的《科学》杂志上,第185卷。美国国防部高级研究计划局为此项研究提供了支持,海军研究办公室也与位于尤金的俄勒冈研究院签订了合约,监督该研究。另外,该研究还得到了位于以色列耶路撒冷的希伯来大学研究与开发部门的支持。)

    我们所做的许多决策都是基于对不确定事件概率的信念,这些不确定事件包括选举结果、被告的内疚感或是美元的未来价值。这些信念通常被表述为“我想……”“概率是……”“它是不可能的……”等。对于不肯定事件的信念有时还能以概率或主观概率等数字形式表现出来。那么,是什么决定了人们的信念?

    人们又是怎样评估不确定事件的概率和不确定数量的价值呢?本文将会告知你们,人们依赖于数量有限的启发式原则,而这些原则能将测量概率以及预测价值的任务简化,使其成为更为简单的判断过程。总的来说,这些启发法相当有用,但有时也会导致严重的、系统性的错误。

    对概率的主观评估与对距离或大小等物理量的主观测量相类似。这些判断都依赖于效度有限的数据,是根据启发式的规则进行的。例如,某物体的距离取决于其清晰程度。物体看上去越清楚,其距离就显得越近。这条规则有一定的效度,因为在任何给定的情境中,距离较远的物体都会比距离较近的物体更不清楚。然而,对这条规则的信赖会导致我们在测量距离的过程中产生系统性错误。特别是在能见度较低时,物体轮廓就会模糊,而其距离就常常会被高估。另一方面,在能见度较高时,物体轮廓就会清晰,其距离也就会被低估。因此,如果依赖于清晰度,将清晰度作为测量距离远近的标尺的话,就会导致普遍的偏见。这样的偏见在对概率直觉性的判断中也会出现。本文将描述三种应用于判断概率和预测价值的启发式,列出由这些启发式引起的偏见,并讨论这些偏见的实际应用和理论内涵。

    代表性

    人们考虑的许多概率问题都包含在以下某个类型当中:物体A属于类别B的概率是多少?事件A起源于过程B的概率是多少?过程B引起事件A的概率是多少?人们在回答这些问题时,会典型地依赖于代表性启发法,即通过用A来代表B,也就是通过比较B与A的相似程度来对概率进行评估。例如,如果A能高度代表B,人们就会认为A源自B的概率高。但如果A与B并不相似,人们就会认为A源自B的概率低。

    若想通过代表性对判断进行阐述,请考虑下面这个情况,若有某个人被他原来的邻居描述为:“史蒂夫非常腼腆,少言寡语,很乐于助人,却对他人或这个现实世界没多大兴趣。他谦恭有礼,做事井井有条,中规中矩,关注细节。”人们如何从一个可能的职业列表中(例如农民、售货员、飞行员、图书管理员或是医生)评估他从事某个特定职业的概率?又如何根据可能性的大小来将这些职业进行排序呢?在代表性启发法中,例如,史蒂夫是个图书管理员的概率是通过其与典型的图书管理员形象的代表性或相似性来进行评估的。事实上,对于这类问题的研究已经表明,人们对职业概率的排序与对职业相似性的排序方法完全是相同的。而这种关于概率的判断方法会导致严重的错误,因为相似性或代表性不会受到某些因素的影响,而这些因素却能影响对概率的判断。

    对结果的先验概率(prior probability)不敏感。 对代表性没有任何影响而对概率有重要影响的其中一个因素是结果的先验概率,或基础比率。例如,在史蒂夫的那个例子中,在我们作出史蒂夫是个图书管理员而不是农民的理性评估时,是应该将农民比图书管理员人数更多的事实考虑在内的。然而,对基础比率的考虑并不会影响史蒂夫与图书管理员以及农民的典型形象的相似性。因此,如果人们通过代表性来评估概率,先验概率就会被忽视掉。我们在运用了先验概率的实验中检验了这个假设。在实验中,我们向受试者简要概述了几个人的性格,这几个人是从100位工程师及律师的样本中随意抽取出来的。而受试者需要通过对每个人的描述来评估其是工程师还是律师。在某个实验情境中,受试者被告知这些被描述的100人中,有70位工程师、30位律师。而在另一个实验情境中,受试者被告知这100人中,有30位工程师、70位律师。在第一种情境下,受试者判断任意一个描述是关于工程师的而不是关于律师的概率都应该高于第二种实验情境。因为第一种情境中工程师更多,第二种情境中律师更多。值得注意的是,我们通过贝叶斯定理还能知道每个描述的概率比率应该是(0.7/0.3)2,或是5.44。然而,这些受试者在这两个实验情境中都得出了同样的概率判断,这严重违反了贝叶斯定理。很明显,受试者认为某个特定的描述是在说工程师而非律师是通过描述对于这两个典型职业的代表程度而来的,而很少或根本就不考虑其所属类别的先验概率。

    当这些受试者没有其他信息来源时,他们会正确地利用先验概率。在没有人物描述的情况下,受试者判断某个人是工程师或律师的概率分别是0.7和0.3,这与基础比率正好符合。然而,当某个描述存在,就算这个描述没有任何信息,先验概率还是会被彻底忽略掉。对于以下描述的回应就阐明了这个现象:

    迪克是位30岁的男性,已婚,但无子女。他能力强,干劲足,承诺一定要在自己的领域功成名就。他很受同事的欢迎。

    这个描述所传达的信息与迪克是工程师还是律师的问题完全没有关系。因此,迪克是工程师的概率应该与工程师占样本总人数的比率相同,就如同我们没有得到任何有关迪克的描述时一样。然而,受试者却将迪克是工程师的概率判断为0.5,并不关注工程师占总人数的比率是0.7还是0.3。很明显,在没有任何证据和得到了一些无用的证据之后,人们的回应是不同的。在没有任何特定证据的情况下,先验概率能够被合理地应用;而在得知一些无用证据的情况下,先验概率就会被忽略。

    对样本大小的不敏感。 在某个指定大小的样本中,评估获得某个特定结果的概率时,人们总会应用代表性启发法。即他们会通过某个样本结果与相关参数的相似性来评估这个结果的概率。例如,人们会认为随机抽取的10位男性的平均身高是6英尺,而这个结果就是由与相应参数(这个参数即是男性人口的平均身高)的相似性得来的。某个样本的统计数据与人口参数的相似性并不是由样本的大小来决定的。其结果就是,如果我们通过代表性来评估概率,判断出的某个样本的统计数据实质上就是独立于样本大小的。的确,当受试者评估大小不同样本的平均身高分布时,他们得出的分布是相同的。例如,人们在评估平均高度高于6英尺的概率时,无论样本大小是1 000、100还是10位时,其得出的分布都是相同的。另外,即使样本大小的重要性在问题形成之时就被强调过,受试者还是不能体会其所起的作用。请考虑下面的问题:

    某个城镇有两家医院。在较大的那家医院里,每天大约有45个婴儿降生,而在较小的医院里,每天有15个婴儿降生。如你所知,其中50%的婴儿应该是男婴。然而,男婴实际的百分比每天都会有所变化,有时会高于50%,有时会低于50%。

    在一年的时间里,每家医院都记录了新生婴儿中男婴比率大于60%的天数。你认为,哪一家医院记录的天数更多?

    更大的医院(21)
    更小的医院(21)
    大致相同(其天数的不同在5%的范围内,53)

    括号中的数值表示的是选择该答案的大学生人数。

    无论是大医院还是小医院,多数受试者判断出的60%以上新生儿是男婴的概率都是相同的。这可能是因为这些事件都来自于同样的统计资料提供的描述,因此关于总体情况的代表性相同。相反,以样本理论进行分析的话,在小医院里,超过60%的婴儿是男婴的天数肯定应该比大医院的多,因为大样本的男女比率不太可能偏离50%。很明显,这个统计学的基本概念与人类的直觉不相符。

    在对后验概率(即从一个整体而不是另一个整体中抽取样本的概率)的判断中,人们对样本大小的问题也不是很敏感。

    请考虑下面这个例子:

    想象有个装满球的罐子,其中有2/3的球是一种颜色,1/3的球是另一种颜色。某个人从罐子里取出了5个球,发现有4个是红色的,1个是白色的。另一个人取出了20个球,其中有12个是红色的,8个是白色的。这两个人中,谁更会认为罐子里2/3的球是红色的,1/3的球是白色的?每个人给出的概率各是多少?

    在这个问题中,假设两次抽取的先验概率相同,那对于4∶1的那个样本来说,其正确的后验概率应为8 ∶1;而对于12∶8的样本来说,其后验概率为16∶1。然而,大多数人却认为第一个样本为罐子里主要是红球的这个假设提供了更为有力的证据,因为第一个样本的红球比例要比第二个样本的高。这再次证明了,直觉性判断由样本比例主导,本质上并不受样本大小的影响。然而,样本大小却对实际的后验概率起着至关重要的作用。此外,对后验概率的直觉性评估比起正确的值来说并没有那么极端。在这类对概率的评估中,低估证据的影响反复出现。这种情况被称为“保守主义”。

    误解机会 。人们期望由随机过程产生的事件序列能够代表这个过程的基本特征,即使这个序列很短。例如,人们在考虑抛硬币看正反面的问题时,总会觉得其顺序更可能是正—反—正—反—反—正,而不是正—正—正—反—反—反,因为后者并不能体现出抛硬币的公正性。因此,人们期望过程的基本特征不仅表现在整个序列中,还表现在局部的序列中。然而,局部代表的序列系统地脱离了概率的期望:因为局部代表的序列中选择很多,但可供选择的项却很少。抱有局部代表性这个想法的另一个后果就是有名的赌徒谬误。例如,在看到轮盘赌的指针长时间连续指向红色以后,大多数人就会错误地认为现在该是指向黑色的时候了。这是因为,相比再次出现红色,出现黑色会使序列更具代表性。人们普遍将概率视为可进行自我纠正的过程。在这个过程中,某个方向的偏离能引起其相反方向的偏离,以达到恢复平衡的目的。事实上,在概率的结果揭晓之时,偏离并不是被“纠正”了,而只是融为一体了。

    不只是天真的受试者才会误解概率。一项关于统计直觉的研究以有经验的心理学家为受试者,揭示了人们长期抱有的“小数法则”这一信念。这些受试者认为,他们抽取的样本即使很小,也具有很强的代表性。他们这样的回应反映了一个有效的假设:某个具有统计意义的样本结果可以代表样本所属的整个群体的性质,这与样本大小并无关联。因此,研究人员过于信任小样本的结果,高估了这些结果的可复制性。在实际的研究中,这些偏见会导致研究人员选择的样本不够大,并对仅有的发现作过多的阐释。

    对可预测性的不敏感。 有时,人们需要作一些数值上的预测,例如,预测某只股票的走势、某种商品的需求量或是某场球赛的最后比分。这样的预测经常是通过代表性作出的。例如,假设有个人在听了关于某家公司的描述之后,需要预测这家公司的未来收益。那么,如果这个人听到的描述是正面的,他就会预测这家公司将有非常高的收益,因为高收益最能代表那个描述;如果描述是普通的,这个人就会觉得公司的表现也会很普通。描述的好坏程度并不受该描述的可信程度以及精确程度的影响。因此,如果人们仅仅依靠描述的好坏来预测,那么他们的预测就会对证据的可靠性和预测的预期精确度不敏感。

    这种判断模式违反了标准的统计理论。在标准的统计理论中,出于对可预测性的考虑,极端和预测范围受到了控制。当某件事的可预测性为零时,该预测的结果在任何情况下都应该是相同的。例如,如果在一些公司的描述中,没有听到有关其收益的信息,那么对所有这些公司未来收益的预测都应该是相同的。当然,如果某件事的可预测性非常高,那么预测值就会符合实际值,预测的范围也会等同于实际结果的范围。总之,可预测性越高,预测值的范围就会越广。

    一些关于数值预测的研究表明:直觉性预测违反了这条规则,因为受试者很少甚至没有考虑过可预测性的问题。在其中一项研究里,受试者看了几段文字,每段文字都描述了一位实习老师在特定实习课上的表现。一些受试者需要根据那几段文字描述以百分制来评价特定总体的课堂质量,其他受试者则需要预测这些实习老师在5年以后的成就,同样要以百分制来打分。这两种情况下作的判断是相同的,即预测某一未来事件(老师在5年以后的成就)与评估当前事件所依据的信息(实习课的课堂质量)是相同的。作这些预测的人肯定也意识到了用某位老师5年以前的实习课来预测她的教学能力过于局限。不过,他们的预测与评估一样极端。

    效度错觉。 前面已经介绍过,人们常会挑选输入信息(例如对某个人的描述)中最具代表性的特点(例如职业)来进行预测。他们在预测时的自信程度主要取决于相关信息代表性的高低(即所选特点与输入信息的吻合程度),与限制预测准确性的因素关系不大。因此,人们在听到与图书管理员的典型形象相符合的性格描述后,就会极有自信地作出所描述的人就是一个图书管理员的预测,即使这个描述是片面的、不可靠的或是过时的。由于预测特点与输入信息非常吻合而产生的没有保证的自信就被称为效度错觉。即使当判断者意识到限制其预测准确性的因素时,这种错觉仍然存在。许多文献已经证实:甄选面谈的出错率很高,但即使心理学家知道这一点,在甄选面谈时,他们还是常会在预测中表现出很大的自信。尽管不断有证据表明甄选面谈是不恰当的,但临床上仍然持续依赖这种访谈方式,这也充分说明了效度错觉强大的影响力。

    预测需要依靠输入,而输入模式的内部一致性就是决定人们在预测时自信程度的主要因素。例如,相比某个在一年级得了许多A但也得了许多C的学生来说,人们在预测一年级得了许多B的学生的平均绩点时会更有自信。高度一致的模式最常出现在输入变量过多或相关度高的时候。然而,相关统计学的结果证实,若规定了输入变量的效度,基于几个这种输入的预测会比输入过多或相关情况下的准确性高。因此,输入变量过多虽然可以增加自信程度,但却会降低预测的准确性。而人们在预测时所抱持的信心常会超出他们的能力范围。

    误解回归性。 假设让一群儿童做两套等效的能力测试题。如果你挑选出了在其中一套能力测试题中表现最好的10个人,那么他们在另一套测试中的表现通常会让你失望。相反,如果你挑选的是在其中一套能力测试中表现最差的10个人,你就会发现,他们在下一次测试中平均都比前一次测试表现得好。一般来说,假设变量X和Y有相同的分布。如果你挑选的X的平均分数偏离了X的均值K个单位,那么,Y的平均分通常偏离Y的均值的程度就会少于K个单位。这些观察表明了一个普遍的现象,即回归平均值现象。这个现象是高尔顿在100年前首次证明的。

    在正常的生命过程中,你会遇到许多回归平均值的例子。例如,在比较父亲与儿子的身高,丈夫与妻子的智力水平或是某个人连续测试的不同表现时。不过,人们没能对此现象产生正确的直觉。首先,人们不能预料一些肯定会发生回归平均值的情境。其次,当他们辨别出回归平均值的发生时,总会捏造出虚假的因果解释。有这样一个信念:预测结果应该最大程度代表输入信息,因此,结果变量的值也应与输入变量的值一样极端。我们提出,回归平均值的现象之所以难以掌握就是因为与上述信念不相容。

    未能意识到回归平均值的重要性将会带来严重的后果。下面这个例子就说明了这一点:在一次关于飞行训练的讨论中,有经验的指导员注意到,若赞扬某位飞行员着陆非常平稳,该飞行员下一次着陆就会表现得糟糕;若某位飞行员着陆较差,该飞行员下一次着陆就会有很大进步。这些指导员总结道,口头表扬对学习是有害的,而口头批评却大有益处,这与广为接受的心理学定律相左。由于回归平均值的存在,这个结论是没有根据的。就像其他重复的测试一样,每次表现糟糕以后总会有进步,而表现优异以后又总会变得糟糕,即使指导员没有对学员的第一次表现给予任何回应。指导员形成了惩罚比奖赏更有效这个错误且有潜在危害的结论,因为他们正好在着陆表现优异后表扬了这些学员,在着陆表现糟糕后批评了这些学员。

    因此,未能理解回归效应会导致人们高估惩罚的有效性,低估奖赏的有效性。无论是在社会交往中,还是在训练中,表现得好都会有奖赏,表现得差也都会有惩罚。因此,行为最有可能在惩罚之后得到改进,在奖赏之后变得更坏,这其实就是一种回归现象。其结果就是:人们碰巧因为惩罚他人得到了奖赏,因为奖赏他人得到了惩罚。然而,人们通常不会意识到这种偶然性。事实上,难以掌握回归性主要是因为奖赏与惩罚带来的结果非常明显,因此,这个领域的学者也没有注意到它。

    可得性

    有时候,人们会通过能想到例子或事件的容易程度来评估这类事的频率或概率。例如,你可能会通过回忆自己认识的人中有多少位是心脏病患者来估测中年人患心脏病的风险。同样,你也可能会通过想象某个企业可能会遇到的各种难题来估测其倒闭的概率。这种判断启发式被称为可得性。可得性对于评估频率或概率来说,是个很有用的线索,因为相比频率较低的类别的例子来说,我们可以更好、更快地得到频率较高的类别的例子。然而,可得性并不受频率和概率的影响。因此,依赖于可得性会导致预测的偏见。我接下来将说明其中的一些偏见。

    因例子的可提取性导致的偏见。 当用某个类别的例子的可得性来判断该类别的大小时,例子很容易提取的类别会比频率相同但例子较难想到的类别显得更大。在证明此效应的基本研究中,受试者听到了一串知名人士的名字,男女均有。接着,他们需要判断这串名字中男性是否比女性多。不同组的受试者听到的名字并不相同。在一些名单中,男性更有名;而在另外一些名单中,女性则更有名。受试者都错误地判断了所有名单的类别(性别)。他们的判断显示,名人更多的类别,其数目也越大。除了熟悉度以外,显著程度也会影响例子的可提取性。例如,看见房子失火对这类事件主观概率的影响可能会比在报纸上读到失火这件事的影响要大。另外,最近发生的事有可能会比之前发生的事更容易获得。对于交通事故的主观概率会在见到一辆翻倒在路边的车后暂时升高,这很平常。

    因搜索集合的有效性导致的偏见。 假设从某个英文文本中随机抽取一个词(含有3个或更多字母的词)。这个词更有可能是以r开头还是以r作为第三个字母?人们在回答这个问题时,会回忆首字母为r的单词(例如road)以及第三个字母为r的单词(例如car),然后通过想到这两个词的容易程度来评估相对频率。因为从记忆中搜寻单词的首字母要比搜寻其第三个字母更为容易,所以大多数人都判断以某个辅音开头的单词要比第三个字母为该辅音的单词多。但实际上,例如r或k的辅音字母,出现在第三个字母的频率都要比出现在开头的频率高。

    不同的任务会引发不同的搜索集合。 例如,假设你被要求评估抽象词(比如想法、爱)和具体词(比如门、水)出现在书面英语中的频率。回答这个问题自然而然的方法就是搜寻这些词可能出现的情境。联想起提到抽象概念(爱情故事中的爱情)的情境似乎要比联想起提到具体词(例如门)的情境更为容易。如果用单词出现情境的可得性来判断这些单词的频率,抽象词就会多于具体词。这一偏见在最近的研究中已被发现,此研究表明,判断出抽象词的出现频率比具体词的出现频率高很多,与客观频率相等。相较于具体词,抽象词还会出现在更多的语境中。

    想象力的偏见。 有时,你需要评估某类事件发生的频率,这类事件的实例没有储存在你的大脑中,但你可以通过一定的规则构建一些实例。在这样的情况下,你通常会构建几个实例并通过构建这些实例的容易程度来评估其频率或概率。然而,构建实例的容易程度并不总能反映出真实的频率,这种评估模式很容易导致偏见。下面这个例子将会说明这一点:请考虑一个10个人的团体,他们想组成一个有K个成员的委员会(2 ≤k ≤8)。他们可以组成多少个不同的且有K个成员的委员会?这个问题的正确答案是二项式系数(10/ k),当K=5时,达到其最大值252。这明确表明了,K个成员的委员会数量等于(10 – k)个成员的委员会数量,因为任何有K个成员的委员会界定了一个独有的(10 – k)个非成员的团体。

    若想不通过计算就回答这个问题,则需要在心里构建有K个成员的委员会,然后通过构建这些委员会的容易程度来评估它们的数量。人数较少的委员会(比如只有两人的委员会)会比人数较多的委员会(比如有8人的委员会)更容易构建。因此,如果通过想象力或是构建的可得性来评估频率的话,规模小的委员会似乎就会比规模大的委员会的数量更多,这与对称的钟形函数正好相反。事实上,在要求天真的受试者评估规模不同的委员会的数目时,他们的估计是委员会规模的单调递减函数。例如,他们评估的有两个成员的委员会的中值是70,有8个成员的委员会的中值是20(正确答案应该是两种情况下都是45)。

    在真实情境中,想象力对概率的评估起着重要的作用。例如,通过想象某次探险中无法应对的意外事件来评估这次探险的风险。如果能想到许多这样生动的意外事件,这次探险就会显得尤其危险,尽管想到这些灾难的容易程度并不能反映出它们实际发生的可能性。相反,如果没能想到某些可能的危险,那将要承担的风险就会被低估。

    相关性错觉。 L. J.查普曼与J.P.查普曼曾描述过一种有趣的偏见,这种偏见是在判断两个同时发生的事件的频率时产生的。他们向受试者提供了几个假设的精神病患者的信息。信息包括每位病人的临床诊断数据和一幅由病人画的人像画。然后,受试者需评估每个诊断(例如妄想症或疑心病)以及人像画中不同特征(例如奇怪的眼睛)的频率。受试者明显高估了自然的联想物同时发生的频率,例如疑心病和奇怪的眼睛的频率。这种效应被称为相关性错觉(illusory correlation)。受试者错误地判断了得到的数据,“重新发现”了许多普遍但无根据的临床知识,这些临床知识就涉及人像画测试的相关解释。相关性错觉效应极度抗拒相互矛盾的数据。即使在症状与诊断呈负相关的情况下,相关性错觉仍然存在,它使受试者不能察觉到真正存在的关系。

    可得性为相关性错觉效应提供了自然的解释。根据两个事件相互关联的强度,可以判断出它们同时发生的频率。当两个事件关联性强的时候,你可能会认为它们经常同时发生。因此,强关联常被判断为经常同时发生。根据这个观点,疑心病与奇怪的眼睛的关联性错觉就是由疑心病常会与奇怪的眼睛而引起的,而不是因与人体其他部位相联系而引起的。

    从我们的人生经历可知,总的来说,相比发生频率低的例子,我们更能又好又快地回忆起发生频率高的例子,更容易想到可能发生的事,而不是发生概率不高的事。当事件频繁地同时发生时,这两个事件之间的关联性会得以增强。所以,人们可以自由使用可得性启发式的程序,具体是通过提取、构建和联想等相关大脑运作的容易程度来估测类别的数量、事件的可能性或是事件同时发生的频率。然而,前面的例子已经说明,这个有价值的估测过程会导致系统性错误。

    判断与锚定

    在许多情况下,人们都会通过初始值来确定最后的答案。初始值或起始点,可能是从问题形成之时得到的提示,也可能是在稍微计算之后得到的结果。但无论是前者还是后者,其调整都不会太过充分。不同的起始点会产生不同的估测,都会偏向于初始值。我们将这个现象称为锚定。

    不充分的判断。 在某个证明锚定效应的实验中,受试者需要估测不同的数值,并以百分比来进行评定(例如非洲国家在所有联合国成员国中所占席位的百分比)。在猜测每一个数值的时候,受试者面前一个范围为0~100的幸运转盘都会旋转一次。受试者首先需要说明,转盘指针指向的数值比起实际值来说是高了还是低了,然后,再将转盘的指针拨向自己估计的值。不同的小组面对的是不同的初始数字,而这些随机的数值对估计有着巨大的影响。以非洲国家占联合国成员国的百分比为例,转盘指针指向10的小组估测的中值是25,而指针指向65的小组估测的中值是45,其中,10和65就被受试者视为起始点。对于估计要精确的要求也并没能削弱锚定效应的影响。

    锚定不只是在受试者被给予相关起始点的情况下发生,当受试者依赖于未完成的计算结果进行估测时,这种情形也会发生。关于直觉性数值估计的研究就说明了这一效应:在黑板上写出一些算式,让两组高中生在5秒之内估计结果。其中一组学生估计下面这个算式的结果

    8×7×6×5×4×3×2×1

    另一组学生估计以下算式的结果

    1×2×3×4×5×6×7×8

    想要快速回答这样的问题,人们可能会先计算几步,然后再通过外推或调整得出结果。由于判断的根据并不充分,这样的过程就会导致低估。另外,就前几步的计算结果而言(从左到右进行计算),降序序列得到的结果肯定会比升序序列的结果大。那么,你就会认为第一个序列的结果大于第二个序列的结果。这两种判断都得到了证实。对于升序序列中值的估计为512,对降序序列估测的中值是2 250,但正确的答案应该是40 320。

    评估连续事件与非连续事件的偏差。 在巴希勒最近的一次研究中,受试者需要选两个事件中的一个来打赌。该研究应用了三种类型的事件:(1)简单事件,例如从一半是红球一半是白球的口袋中取出一个红球;(2)连续事件,例如从90%是红球、10%是白球的口袋中连续7次抽取红球;(3)非连续事件,例如从10%是红球、90%是白球的口袋中连续取球7次,至少取出一个白球。在这个问题中,相比简单事件的那个赌(概率是0.50),绝大多数受试者都更愿意打连续事件的那个赌(概率是0.48)。而相比不连续事件(概率是0.52),受试者又更愿意打简单事件的赌。因此,在这番比较中,大多数受试者倾向于打的赌都是相对不太可能发生的事件。这样的选择模式证明了一个普遍的发现。对赌的选择以及对概率的判断的研究表明:人们易于高估连续事件的概率,低估非连续事件的概率。这样的偏见是由锚定效应引起的。基本事件的概率(即任意某个阶段的成功)提供了估测连续事件以及非连续事件概率的自然起始点。因为从出发点进行调整显然不会充分,对于上述两种事来说,最后的估测都会与基本事件的概率相接近。请注意,某个连续事件的整体概率会比其中每个基本事件的概率低,而非连续事件的整体概率会比其中每个基本事件的概率高。由于锚定的影响,在连续的问题中,整体概率会被高估;在非连续问题中,整体概率会被低估。

    评估复合事件的偏见在计划的情境中尤其明显。成功完成某个任务(例如推广一个新产品)具有连续的特征:要想某个任务成功,该任务中包含的每一个事件就都必须发生。如果需要发生的事件数量众多的话,即使每个事件都很有可能发生,其整体成功的概率也可能会很低。高估连续事件概率这个普遍的倾向会使人们在评估某个计划成功的可能性或能否按时完成时过度乐观,但却缺乏根据。相反,非连续结构总会遭遇风险性的评估。一个复杂的体系,例如核反应或人的身体,如果其中的某个部分出现问题,整个体系就会出现故障。即使每个部分失败的可能性都很小,但若包含很多部分,那么整体失败的概率也可能会很高。因为锚定效应,人们会倾向于低估复杂系统失败的概率。因此,我们有时可以从事件的结构中推测出锚定偏见的方向。连续事件的链式结构会导致高估,非连续事件的漏斗式结构会导致低估。

    评估主观概率分布时的锚定。 在决策分析中,专家时常需要以概率分布的形式来表示他们对某个数值(例如某一天的道琼斯指数)的信念。这样的分布通常是根据专家选择的不同数值构建的,而这些数值与其主观概率分布的百分位相对应。例如,判断者可能会被要求挑选出一个数字X90。这样的话,他认为这个数字将会超过道琼斯指数的主观概率就是0.90。也就是说,他选择数字X90,所以愿意接受道琼斯指数不会超过这个数值的比率是9 ∶1。通过几个这样对应于不同百分位数的判断,我们可以构建出道琼斯平均指数的主观概率分布。

    通过搜集多个不同数值的主观概率分布,还有可能测试出判断者的度量或校准是否合适。如果待估量值的真实值有II%分布在某位受试者规定的XII值之下,那么这个受试者就在一系列问题中进行了恰当的(或外部)校准。例如1%的量值,其真实值应该分布在X01之下,即X99之上。因此,98%的问题,真实值应该在X01到X99的置信区间内。

    几位研究人员已从大量的判断中观察到许多量值的概率分布。这些分布表明了其与恰当的校准之间巨大且系统的偏差。在多数研究中,30%的问题,其待评估量的真实值或小于X01,或大于X99。也就是说,受试者设定的置信区间过小,与他们关于待估量的知识所能证明的相比,反映出了更大的确定性。经验不足与经验老到的受试者都存在这种偏差,而引入合适的积分规则虽能为外部校准提供刺激,但也不能彻底消除偏差。这种效应至少部分是因锚定引起的。

    例如,为了选择X90作为道琼斯指数,人们会首先想到自己对道琼斯指数最佳的估测,然后将这个数值上调。如果这个调整和大多数其他调整一样是不充足的,那么X90就不会是极端的。同样的锚定效应在选择X10时也会发生,这时,人们就会将最佳估测向下调整。所以,X10到X90之间的置信区间将会太小,而待估量的概率分布就会更紧密。一种程序能够系统地改变主观概率分布,使最佳估测值不作为初始值,这也支持了这种解释。

    某个给定的量(比如道琼斯指数)的主观概率分布可以通过两种不同的方法得以实现:(1)要求受试者选择与自己的概率分布的特定百分位数相符合的道琼斯指数;(2)要求受试者估测出的真实值超过特定数值的概率。这两种方法在形式上是等同的,因此应该产生相同的分布。然而,这两种方法体现出的是不同锚定下不同的判断模式。在方法(1)中,自然的起始点是人们对变量的最佳估测。此外,在方法(2)中,受试者可能将锚定点定在了问题中给定的数值上。或者,他可能将锚定定位在相等的概率上,即50–50的概率,因为这是估测可能性通常的起始点。无论哪种情况,方法(2)得到的概率应该不会像方法(1)那样极端。

    为了对比这两种方法,研究人员给一组受试者24个量值(例如从新德里到北京的空中距离),并要求他们在每一个问题上估计X10或X90。另外一个组的受试者得到的是第一组受试者对24个数值中每个评估结果的中值。他们被要求评估每个给定的数值超过相应量值的真实值的概率。在没有任何偏见的干扰下,第二组受试者应该提取出和第一组相同的概率,即9 ∶1。然而,如果使用50%的概率或给出的数值作为锚定,第二组的概率也应该更不极端,即接近于1 ∶1。事实上,第二组给出的所有问题的概率中值都是3 ∶1。当对两组受试者的判断进行外部校准时,发现第一组的受试者太过极端,这与早前的研究结果相符合。他们估测的发生概率为0.10的事件实际上有24%发生了。相反,第二组受试者太过保守。他们认为平均概率为0.34的事件实际发生的概率只有26%。这些结果说明了校准的程度取决于引导的程序。

    讨论

    本附录关注的是依赖于判断启发式的认知偏见。我们不能把这些偏见归因于激励效应,比如一相情愿的想法或是因为报酬和罚款而扭曲的判断。实际上,尽管受试者被鼓励应尽量准确,而且答案正确的话还能得到奖赏,但还是会犯前面所提到的严重的判断性错误。

    对启发式的依赖性以及偏见的普遍存在,并不局限于普通人。有经验的研究人员在凭直觉进行思考时,同样易于犯偏见的错误。例如,受过广泛训练的人在进行直觉判断时,也会有在没能充分考虑先验概率的情况下预测最能代表数据的结果这一倾向。尽管这些研究人员在统计学方面的经验可以使其避免类似于赌徒谬误的基本错误,但他们的直觉性判断还是容易在更为复杂的问题中犯类似的谬误。

    类似于代表性和可得性等有用的启发式可以得以保留,即使它们有时会导致预测或估测的错误。这一点并不会使我们惊奇,而可能会使我们惊奇的是,人们不能从其人生经历中推断出基本的统计学规则,例如回归平均值或是样本大小对样本可变性的影响。尽管在人的生命历程中,每个人都会遇到许多这样的例子,很少有人能独自发现样本和回归性的原则。我们不能从每天的经历中学习到统计学的规则,因为相关的例子不能被恰当地解释。例如,人们不会发现,某文本中连续几行单词的平均词汇长度比连续几页中单词的平均长度变化更大,因为无论是几行或者几页,人们根本就不会注意到单词平均长度的问题。所以,人们不能了解到样本大小和样本可变性的关系,尽管相关数据比比皆是。

    缺少恰当的编码也能解释为什么人们在判断概率时通常不能察觉到偏见。人们可以通过在分配的同样概率的事件中保持实际发生事件的比例,来了解自己的判断是否是外在度量的。但是,用判断所得的概率来将事件分组并不合适。那么,在分组缺乏的情况下,某个人就不可能知道他分配的有0.9或更高的概率的预测,有50%会真正发生。

    认知偏差的经验分析对于判断的概率理论及应用角色方面都有一定的意义。现代决策理论将主观概率视为某个理想化的人量化的观点。具体来说,对某个给定事件的主观概率可被定义为某个人是否愿意接受有关这个事件的赌注。如果这个人在不同赌注之间的选择满足于特定的规则,比如概率论的公理,那么内在一致或是连贯的主观概率就可以被引申出来。引申出的概率是主观的,原因是不同的人可以对同样的事件作出不同的概率评估。这种方法最主要的贡献是提供了对概率严格主观的解释,这个解释能够应用于独特的事件,也能应用于理性决策的普遍理论中。也许应该注意一点,我们有时可能从对赌注之间的偏好中推断出主观概率,但通常主观概率并不是由此而形成的。某个人愿意给A队下赌注而不是B队,是因为他相信A队更有可能会赢,他并不是从自己对赌注的偏好中推断出这个想法的。因此,在现实中,主观概率会决定我们对赌注的偏好,但我们并不是从这些偏好中推断出主观概率的,就如同理性决策中不证自明的理论一样。

    概率内在的主观本质使许多学生相信一致性或内在一致性是判断概率唯一有效的准则。从主观概率的形式理论来看,任何内在一致的可能性判断和其他判断都是一样的。这个准则并不完全令人满意,因为内在一致的主观概率可能和人们抱有的其他信念相抵触。例如某个人对抛硬币游戏所有可能结果的主观概率就反映了赌徒谬误。即他推测硬币更可能是呈反面,因为已经连续出现了多次正面。这样的判断可能是有内在一致性的,因此,根据形式理论,这是一个恰当的主观概率。然而,这样的概率与硬币是没有记忆的这一人们普遍持有的信念不相符,因此不能产生序列依存。若对判断的概率进行充分和理性的考虑,就会发觉对内在一致性的解释并不充分。判断必须与人们持有的所有信念相容。但不幸的是,还没有简单且正式的方法去测评一系列概率的判断与判断者整体信念系统的相容性。不过,理性判断者会努力争取这种相容,即使利用内在一致性能更容易完成判断和评估。特别是,理性判断者会尝试使自己对概率的判断与自己相关的知识、概率的规则以及个人的判断启发式和偏见相容。

    结语

    本文描述了在不确定的情况下进行判断的三种启发式:(1)代表性。人们通常在需要判断物体A是否属于类别B或是事件A是否属于过程B时,就会使用代表性;(2)事件的可得性。当人们需要估测某类事件发生的频率或是某个特定进展的合理性时,就会使用可得性。(3)通过锚定进行调整。当相关数值可得时,许多预测都会用到锚定。使用这些启发式不仅能节约很多时间,大多数时候也很奏效,但它们也会导致一些系统性的错误。更好地理解这些启发式和它们带来的偏见,能够在不确定的情境下提高判断和决策的质量。

    附录B 选择、价值以及框架

    (1983年8月,我在美国心理协会大会上发言时用的就是这篇文章,后来因此被授予卓越科学贡献奖。这篇文章最初发表在《美国心理学者》杂志上。)

    摘要:我们已经讨论了在风险状况以及无风险状况下,作选择时认知和心理的决定因素。价值的心理物理学会使人们在获利概率大时选择规避风险,在损失概率大时选择冒险。概率中体现的心理物理学使得人们过于重视确定的事情和不可能发生的事(与一般的概率性事件相对)。决策问题可用多种关于不同偏好的方式来进行描述或建构,这与理性选择的不变性准则相矛盾。心理账户过程(人们在此过程中会组织交易的结果)可以解释一些消费行为中的反常现象。是否采取某个选择取决于这个选择可能的负面结果是被评估为一种成本还是无法补偿的损失。我们将讨论决策价值和体验价值之间的关系。

    人们总是在做决策,做决策时可能是有意识的,也可能是无意识的,就像是在念散文。如此看来,决策制定也自然会涉及众多学科,包括数学和统计学、经济学和政治科学,以及社会学和心理学。对决策的研究不但解决了规范性问题,也解决了描述性问题。规范性分析涉及理性的本质和决策制定中的逻辑。而描述性分析涉及的却是人们真实的观念和偏好,而不是人们应有的观念和偏好。规范性和描述性考虑问题间的对峙就是判断和决策研究的主要内容。

    在分析决策制定时,通常会将有风险的决策和无风险的决策区分开来。是否会去赌钱(赢的概率确定)是具有风险的决策的典型例子,而是否会接受将某件商品或某项服务换成钱或劳力则是没有风险的决策的典型例子。本文第一部分分析了有风险前景价值的认知和心理物理学的决定因素。第二部分介绍的是这种分析在交易和贸易中的运用。

    风险性选择

    做出类似是否带雨伞或是否参战这种有风险的决策时,人们是不会知道其结果的。因为还有很多不确定因素在里面,比如天气好坏或敌人的强弱。是否会做出某项决策可以被看成是否会打某种赌,当然,是赌就会产生不同的结果,且不同的结果会有不同的概率。因此,对于在一定风险下的决策制定的研究关注的就是在简单的赌钱和确定的概率间的决策,并希望这些简单的问题能对风险和价值的研究有所启示。

    我们在研究风险决策问题时提出了一套方案,此方案的许多假设都是从人们对金钱和概率反应的心理物理学分析中得来的。对于决策制定的心理物理学分析最早出现在丹尼尔·伯努利于1738年发表的一篇有重要影响力的文章中。伯努利在这篇文章里试图解释为什么人们总是会选择风险规避,而随着财富增长选择风险规避的意愿却降低了。为了更明白地说明风险规避和伯努利的分析,请思考这样一个问题:我们现在面临两种选择,一种是有85%的概率赢得1000美元(15%的概率什么也得不到),一种是肯定会得到800美元。虽然从数学的角度来看,选择冒险会得到更多的好处,但大多数人还是更愿意选择确定的事。赌钱的结果是经权衡后的平均值,这种平均值在计算时会把每种可能的结果进行权衡。在刚提到的问题中,赌一把的结果可表示为0.85×1000+0.15×0 =850(美元),这比选择确定的事(肯定会得到800美元)所得到的钱要多。选择确定的事就是风险规避。大体来看,选择确定的事而不是赌一把(所得结果更多或同等)被称为风险规避;不选择确定的事,而愿意赌一把(可能性更小或相等)被称为风险追求。

    伯努利建议不要通过收益结果来评估前景,而是要通过这些结果的主观价值来评估。某次赌的主观价值也是一种经过权衡后的平均值,但在这里,每种结果的主观价值是通过其发生的可能性来权衡的。为了在这个框架下解释风险规避,伯努利提出主观价值或者说是效用,可用收益的凹函数来表示。例如,在这种函数下,200美元和100美元间效用的不同比1 200美元和1 100美元间效用的差异更明显。从函数凹处可以看出,得到800美元的主观价值比得到1 000美元的价值的80%要大。因此,效用函数的凹处也就意味着是风险规避,人们会选择肯定能得到800美元,而不是有80%的概率得到1 000美元,尽管这两种可能最终得到的钱数一样。

    在决策分析中,常用总财富状态来描述决策的结果。例如,一个下20美元赌注的抛硬币游戏,就可以表示成在个人当前的财富状态W和等概率的可能变成W+20美元或W–20美元的财富状态间的选择。这种表示方法在心理学上是不现实的,因为人们通常不会从财富状态出发来考虑概率相对较小的结果,人们常会从收益、损失和中立的结果(比如维持现状)的角度来考虑。如果主观价值的表示方式如我们提出的那样,是财富的变化而不是最终的财富状态,那么对于结果的心理物理学分析就应该应用到获得和损失上来,而不是应用于总财产上。这种假设在对待有风险的选择方面发挥着重要作用,我们称之为前景理论。无论是通过反省还是心理物理学的测量,都表明主观价值是个关于获得多少的凹函数。同样的归纳也适用于描述损失。损失200美元和100美元的主观价值的区别要比损失1 200美元和1 100美元的主观价值的区别要大。当把获得和损失的价值函数结合到一起时,我们就得到了一个S形的函数,如图B–1所示。

    图B-1

    图中显示的价值函数是由获得和损失来定义的,而不是通过总财富值来定义的。在获得的情况下是凹面,在损失的情况下是凸面,损失情况下的曲线比获得情况下的曲线更陡。该图表示的情况就是损失厌恶,表明了获得某笔钱的吸引力要弱于人们想要规避某笔损失的意愿。损失厌恶解释了为什么人们不愿在抛硬币的游戏中选择有同等概率的赌注:可能的收益的吸引力并不足以抵消可能的损失带来的厌恶。例如,在以大学生为样本的抛硬币实验中,如果赢得的收益不到30美元,大多数受试者都会拒绝冒10美元的风险。

    对风险决策的假设在经济理论中占有核心地位。然而,正像收益曲线的凹面表示的是风险规避一样,损失曲线的凸面也表示着风险追求。确实如此,在损失的情况下选择风险追求作用很大,尤其是在损失的概率很大时。例如,人们在有85%的概率损失1000美元(15%的可能性什么也不损失)和肯定会损失800美元间作出选择时,大多数人都愿意选择赌一把而不是选择确定的损失。这就是风险追求。因为赌一把的期望值(–850美元)比确定事件的期望值(–850美元)要低。在损失情况下的风险追求已经得到了一些研究员的证实。即使在结果不涉及钱时,这种结论也得到了证实,比如疼痛时间和生命的损失。在获益的情况下选择风险规避和在损失的情况下选择风险追求是错的吗?这些偏向与对得失的主观价值的强烈直觉相符合,其前提是人们可自由选择对获得和损失的自我价值。然而,我们会看到这条S形价值函数曲线所显示的含义时,从规范的角度来看,它是不被接受的。

    为了解决规范的问题,我们从心理学转向决策理论。现代的决策理论最早可追溯到冯。诺依曼和摩根斯顿的研究。他们创建了几条定性原则或公理,而且这些原则和公理能左右理性的决策制定者的偏向。其中的公理包括有传递性(如果A比B更受青睐,B比C更受青睐,那么A就比C更受青睐)、替代性(如果A比B更受青睐,那么赢得A或C青睐的可能性就比赢得B或C青睐的可能性更大),以及其他一些技术性公理。针对理性决策公理的规范化和描述化状态已经有了广泛的讨论。特别是有证据显示,人们不总是遵从替代性公理,而且对于这个公理的规范性优点还有很多反对意见。然而,所有关于理性决策的分析都包含了两条原则:主导性和不变性。

    主导性要求如果前景A在各方面和前景B都一样好,但至少A在一方面强于B,那A就应比B更受青睐。不变性要求在众多前景中的偏向不应依从于描述的方式。特别是,如果两种表达方式不同的问题同时出现,能被界定为实质是相同的,那么这两种表达方式不在同一时间出现时,人们也应该对它们持有同样的偏向。现在,我们给出了不变性的要求,这种要求虽然看上去很基础且无关紧要,但人们却不是总能做到。

    结果的框架

    风险前景的特点表现在它们可能的结果以及产生这些结果的概率方面。然而,同样的选择会以不同的方式来构架或描述。例如,一次赌的可能结果可以被构架成现状的获得或损失,或是包含最初财富的资产状态。不变性要求不能因为对结果描述的不同而改变自己的偏向。下面的这两个问题违反了这个要求。N表示每个问题的受试者总数,括号里是选择每个选项的人数比例。

    问题1(N=152):设想美国可能爆发一种异常的亚洲疾病,这种疾病可能导致600人死亡。有两种方案来应对疫情,假设下面是对每种方案结果准确的科学预测:

    如果采取方案A,可救治200人。(72%)

    如果采取方案B,有1/3的概率救治600人,2/3的概率无人获救。(28%)

    你会选择哪种方案?

    问题1的表达模式可作为此事件的一个参考状态,即该疾病会夺去600条生命。两种方案的结果包括这种参考状态以及通过被救者的数量而量化得来的收益情况。就像期待的那样,偏好是一种风险规避:绝大多数受试者更愿意选择能保证有200人获救的方案,而不是有1/3的可能性救600人的方案。现在来考虑另一个问题,还是同样的情况,但两种方案用的是另一种方式表述:

    问题2(N=155):

    如果采取方案C,400人死亡。(22%)

    如果采取方案D,1/3的概率没有人死,有2/3的概率600人全部死亡。(78%)

    很容易看出问题2中的方案C和D与问题1中的方案A和B在本质上没有差别。然而问题2中假设的参考点是没有人会因为该疾病而死亡。最好的结果是维持该参考状态,其相对的情况是因该疾病致死的人数来量化的损失。用这些参考状态来评估作出的选择可表明,人们会偏向于赌一把(方案D)的风险追求,而不是肯定会丧失400条性命的风险追求。实质上,在第二个问题中的风险追求比在第一个问题中的风险规避代价更大。

    没能遵守不变性这一现象非常普遍,且难以克服。这在经验丰富的受试者和初级受试者中都很常见,即使相同的受试者在几分钟内回答这两种问题,也无法消除这一现象。面对两种相互矛盾的回答,受试者也时常不解。但即使再读一遍该问题的陈述,他们也会在“生命拯救”的说法中选择风险规避,在“生命死亡”的说法中选择风险追求。而且他们在两种说法中都希望能遵守不变性,且给出一致的回答。在他们不断地迎合下,框架效应更像是感觉错觉而不是计算上的错误。

    下列问题引出了违反理性决策的主要要求的偏向。

    问题3(N=86):请在下列选项中作出选择:

    E:25%的概率赢得240美元,75%的概率失去760美元。(0)

    F:25%的概率赢得250美元,75%的概率失去750美元。(100%)

    很容易看出F比E更占优势。实际上,所有的受试者也都是这样选择的。

    问题4(N=150):设想你需要同时对下面两个问题做出决策。

    先看一下两个决策,之后选出你偏爱的那一项。

    决策(1)在下列两者中选择:

    A.肯定会得到240美元。(84%)

    B. 25%的概率得到1000美元,75%的概率什么也得不到。(16%)

    决策(2)在下列两者中选择:

    C.肯定会损失750美元。(13%)

    D. 75%的概率损失1 000美元,25%的概率什么也不损失。(87%)

    通过前面的分析可以看出,在第一个决策中,大多数受试者会对确定的事选择风险规避;更多的受试者在第二个决策中选择风险追求,而不是确定的事。事实上,73%的受试者选择A和D,而只有3%的受试者选择了B和C。同样的结果模式也出现在问题的另一种说法中,在这种说法中,大学生们选择了他们能够真正参与的博一把。

    受试者会同时考虑问题4中的两个问题,因此,相对于B和C,他们会偏向于A和D。然而,受试者的偏向(A和D)往往受放弃的选择的控制。若把肯定会得到的收益(选项A)增加到D选项上,会产生有25%的概率赢得240美元和75%的概率失去760美元的结果。这正是问题3中的选项E。同样,把750美元确保的损失(选项C)增加到B选项上,会产生25%的概率得到250美元和75%的概率失去750美元的结果,这也正是问题3中的F选项。因此构架的敏感性以及S形的价值函数在一些需要同时做出决策的事件中与主导因素相违背。

    能运用这些结果的地方并不理想:不变性从规范上来看是至关重要的,直觉是很吸引人的,但从心理学角度看却无法实现。我们只设想了保证不变性的两种方式。第一种就是采取可将任何问题、实质等同的表达方式转化成完全一样的常规表述。我在给经济系的学生上课时,常会将这点作为最基本的原理告诫他们,他们应该在思考每一个决策问题时,从总值的角度考虑,而非仅从收益和损失上考虑。这样的表述可避免违背在先前问题中提到的不变性,但执行起来却很难。除了特殊情况,也就是从获得和损失的角度考虑钱财结果比从当前的财富状态考虑更普遍。此外,风险前景的常规表述需要计算同时出现的决策(例如问题4)的所有结果,而计算这些同时出现的决策的难度超过了对简单问题直觉上的计算。在其他条件下用常规表述更困难,这些条件包括安全性、健康性或生活质量。我们是否应该建议人们,通过计算因某种疾病致死的总数,或因研究中某种特殊疾病而致死的人数,去评估公共卫生政策(例如问题1和2)?

    另一种可以保证不变性的方法是通过保险精算的结果来评估某项选择,而非通过心理学的结果来评估。在人们的生活中,保险精算的准则有一定的吸引力,但对于涉及钱的决策而言,这样的准则明显不够。应该说,该准则在伯努利时期就被意识到了,而且对于缺少客观量度标准的结果完全不适用。总之,构架不变性很难被预测,而且人们在某个特殊选择中的自信不能确保其在另外一个框架下还会做出同样的决策。因此,用多种方法来构架决策问题的行为来测试偏向的稳定性是个不错的方法。

    概率的心理物理学

    到目前为止,我们假设伯努利的期望原则所依据的是某种不确定前景的价值或效用,该原则是通过增加每种可能结果的效用而得来的,每个结果的效用又都是通过概率来加以权衡的。为了测试这个假设,我们再从心理物理学角度出发。将当前的状态价值设为零,想象有份价值300美元的收益,我们将这份收益的价值设为1。现在假设你只有一张彩票,且该彩票的单次奖励是300美元。这张彩票的价值会怎样随着赢得奖励的可能性函数而改变?除了赌一把的效用外,这种前景的价值一定会在零(当赢得的概率为零时)和1(确定赢得300美元)之间变化。

    按照直觉,彩票的价值并不是获胜概率的线性函数,正如期望原则推导出的那样。从零到5%的增长比从30%到35%的增长有更大的影响力,而相对于从95%到100%的增长,影响就显得小了。综合考虑各方面可得出种类—边界效应:即从不可能到可能,或从可能到确定的变化比变化范围内的变化有更大的影响力。这种假设体现在图B–2的曲线上,该曲线以函数的形式标出了对某事件众多可能性的权重。该图最大的特点是关于规定的可能性,决策权重会成回归状态。除了终点附近,获胜的概率每增加0.05,赢得奖励的价值就会增长不到5%。我们接下来要研究的就是在有风险的选择中,对偏向的心理物理学假设的含义。

    在该图中,决策权重在很大的范围内要低于相应的概率。过低权衡确定事件的中等或高概率会降低能得到奖励的赌局的吸引力,从而在会有所得的选择中使人们选择风险规避;同样,在损失的情况下,也会通过减弱对赌局中的损失厌恶而选择风险追求。然而,小概率事件常被过高权衡,且非常小的概率不会被过高权衡或完全忽视,使得这个区域内的决策权重很不稳定。对低概率过高权衡推翻了前面描述的规律模式:它提高了风险大的赌注的价值,提高了对于小概率的严重损失的厌恶值。最终,人们通常在未必有收益的情况下选择风险追求,在未必有损失的情况下选择风险规避。因此,决策权重的特点解释了彩票和保险政策吸引人的原因。

    图B-2

    决策权重的非线性必然会违背不变性,下列两个问题就说明了这一点:

    问题5(N=85):假想有如下两个阶段的游戏。在第一个阶段,有75%的概率在游戏最后什么也得不到,有25%的概率会进入到第二个阶段。如果你进入第二个阶段,可以在下面两个选项中作出选择:

    A.肯定会获得30美元。(74%)

    B.80%的概率获得45美元。(26%)

    你必须在游戏开始前作出选择,也就是说,要在第一个阶段结果出来前选择。

    问题6(N=81):请在下面两个选项中作选择:

    C.25%的概率获得30美元。(42%)

    D.20%的概率获得45美元。(58%)

    由于在问题5中有25%的概率进入到第二个阶段,选项A有25%的概率获得30美元,选项B有80%(0.25×0.80 = 0.20)的概率获得45美元。因此,问题5和问题6在概率和结果方面是相同的。不过,这两种说法的偏向却不同:在问题5中,绝大多数人更喜欢获得小数目钱的高概率选择;而在问题6中,情况却正相反。现实和假设的收益(当前,其结果用钱来表示),生命的拯救和丧失,以及概率过程的非连续表示都已经证实了这种与不变性的违背。

    我们认为,不变性之所以被证实不成立是由于两种因素的相互作用:即概率的构架和决策权重的非线性。具体说,我们认为,人们会忽略问题5中的第一个阶段(不管是否已经做出决策,都会产生相同的结果),且只专注于进入第二个阶段后会发生什么。当然,在这种情况下,如果人们选择A,肯定会有所获得;但如果人们更愿意赌一把,就会有80%的概率获得收益。的确,在需要作出连续选择的问题中,人们的选择会和在肯定会获得30美元且有85%的概率获得45美元间的选择相同。因为相比有一般或较高概率的事件来说,确定事件会被过高权衡,肯定会获得30美元的选项就比需要连续做出决策的问题选项更具吸引力。我们将这种现象称为虚假确定性效应,因为实际上不确定的事件在被权衡时会被看成是确定的。

    可能性范围的低端也出现了类似的现象。假设你嫌保险费太高而不确定要不要买地震保险。就在你犹豫不决的时候,保险代理说你可以有另一个选择:“你可以选择支付一半的保险费,若地震发生的日子是奇数,你就能获得全额的保险金。”但为什么很多人会认为这种保险没有吸引力呢?图B–2给出了答案。在低概率范围内任意处(设为P点)开始,概率从P降低到P/2的决策权重的影响会比从P/2减小到零的影响小得多。因此,风险降低一半不会使得只需一半的保险费更具吸引力。

    对概率保险的厌恶主要有三个原因。第一,传统上对保险的解释是从凹线效用函数的角度出发的,而概率保险显然违背了这一点。按照期望效用函数理论,当普通的保险可被接受时,概率保险应该比普通保险更受欢迎。第二,概率保险有多种形式的防御措施,比如做医疗检查、购置新轮胎或安装防盗系统。这些措施没有完全排除所有的危害,却有效地降低了某些危害的可能性。第三,意外事件的构架也会影响人们是否购买保险。例如,火灾保险不包含洪水造成的灾难,这种保险政策就会被评估为是对某种特定危险(比如火灾)的完全防护,或总财产损失的可能性的降低。

    从图B–2可以发现,相对于完全消除危险而言,人们过低估计了降低发生危险的可能性。因此,当将保险被描述成可以消除危险而不只是降低危险时,保险会更具吸引力。的确,正如斯洛维克,费斯科霍夫和利希滕斯坦所说的那样,假设某种疫苗可将发病率从20%降低到10%,若这种疫苗被描述成可治愈一半的病人时,与其被描述成对相同症状的病毒的一半完全有效得到的吸引力相比,其对公众的吸引力更小。

    公式化效应

    我们已经谈到,构架效应可表明不变性也有不成立的时候。现在,我们将目光转移到控制结果和事件框架的过程上。公共卫生问题就体现了公式化效应,若把“生命拯救”的说法换为“生命丧失”,其偏向会从风险规避转变为风险追求。很显然,受试者采用了问题里面给出的关于结果的描述,并将结果评估为收益和损失。麦克尼尔、鲍克、萨班斯和特沃斯基提出了另一种关于公式化效应的例子。他们发现,当用死亡和存活来描述肺癌可能出现的结果时,医生和病人对治疗方法的偏向差异非常大。外科手术不像放射性治疗那样,在治疗期间会有一定的死亡风险。因此,用死亡来描述外科手术的结果比用存活率来描述的吸引力更小。

    医生或者总统顾问,可以不用歪曲或隐藏事实,只构架事件发生的结果和可能性就能左右病人或总统的决策。公式化效应可能会偶然发生,人们可能会意识不到框架效应对最终决策的影响。公式化效应也可以被利用起来控制选项的相对吸引力。泰勒指出,信用卡行业的说客总是说,信用卡和现金在购买力上的区别可被表示为现金可打折,而不是信用卡可超额使用。这两种表述通过分配比平常价钱更少或更多的钱,将不同的价钱用获得或损失来构架。由于损失给人们带来的感受比收益带来的感受强烈,相对于放弃折扣,消费者更不愿意额外付费。正如人们所预期的那样,在商界和政界,试图影响框架构架的尝试经常发生。

    由于价值函数的非线性,以及人们有从问题的陈述所给出或隐含的参考点去评估某种选择的倾向,因此,对结果的评估易受公式化效应的影响。值得注意的是,在其他情况下,人们会自主地将同样的信息用同样的表达方式来加以转换。对语言理解力的研究指出,人们会将听到的东西迅速地转化为抽象的表述,这种表述不能再区分该想法是用主动还是被动的形式来表达的,且不能再辨别实际所说的和暗指的、假定的或包含的意思。不幸的是,自主地进行这些运作的大脑机制不能完成将公共健康问题或死亡率、存活率的统计问题转化成普通的抽象任务。

    交易与贸易

    我们可将对框架构架以及价值的分析应用到多属性选择中,比如是否接受某项交易或贸易。为了评估多属性选择,我们作出了这样的假设,人们会建立一个心理账户,并用此说明某个选项的优点和缺点,这与多属性的参考状态相关联。某项选择的总体价值是通过相对于其参考状态的优缺点的平衡状态得以实现的。因此,当某个选项的优点多于其缺点时,这个选项就会被采纳。在作这种分析时,人们会从心理学上(而非从实际角度)将优缺点分开来考虑。该模式没有规定要把不同的特点综合起来,从而形成对优缺点的整体考虑,但在这种模式下考虑问题时需要作出凹面曲线和损失厌恶的假设。

    我们对于心理账户的分析得益于理查德。泰勒的研究,他揭示了心理账户的过程和消费者行为之间的相关性。下面的问题来自萨维奇和泰勒曾举过的例子,他们通过这个例子引入了控制心理账户的原则,并表明了从价值曲线到是否接受交易的过渡。

    问题7:设想你要买一件125美元的夹克和一个15美元的计算器。去买计算器时,那家商店的销售员告诉你,另一家分店正在搞促销,10美元就可以买到你想要的这款计算器,开车20分钟就能到那家店。你愿意去那家店吗?

    这个问题的重点在于你是否接受销售员的提议,这个提议将路程的不便捷和价格上的优惠相结合,可被构架成一个最小限度的涉及主题或全面综合的理论。最小限度的理论只包括两种选项的不同,并忽视这两种选项共有的特点。在最小限度理论中,驱车到另一家店可被构架成有5美元的收益。涉及主题的理论将可能的选择同参考水平联系起来,且参考水平是通过引起决策的情境来确定的。在先前的问题中,相应的主题是购买计算器,因此,去另一家店的意义就被构架成价格降低(从15美元降低到10美元)。由于价格的节省只与计算器有关,夹克的价格就没有包含在涉及主题的理论中。夹克的价格以及其他的花销可以包含在更加全面综合的理论中,在这个理论中,节约与每月消费相联系。

    前面的问题模式在最小账户、局部账户或综合账户中处于中立。但我们却表示,人们会自然而然地用局部账户来构架决策,在制定决策时,该账户的作用在感觉上和“好的形式”发挥的作用相似;在认知上,和基本层次范畴相似。局部事件和价值曲线使得为了节省5美元去另一家店买计算器的意愿与计算器的价格相反,与夹克的价格无关。为了验证这个预测,我们用另一种说法来表达这个问题,其中两种商品的价格是可以互换的。某家商店的计算器卖125美元,分店里卖120美元,夹克的售价为15美元。和预期一样,在这个问题的两种说法中,愿意去分店的人数比例大相径庭。结果显示,68%的受试者(N=98)会为了节省5美元(原价15美元的计算器)愿意去分店,但在93名受试者中,只有29%的人愿意为了节省5美元(原价125美元的计算器)跑去分店。这个问题的两种说法在最小账户和综合账户中是相同的,因此,这个发现证明了局部账户的概念。观察发现,一个城市不同商店中同种商品报价的标准偏差与平均值大致成比例,通过这个观察得出,在消费者行为中,局部账户有着重要作用。消费者肯定希望买到物美价廉的商品,这就必然会影响到价格的差别,这些结果表明,相对于为50美元的商品节省5美元来说,消费者对于为了150美元的商品节省15美元没有太大的兴趣。

    局部账户使得人们从相关而不是单独的角度来评估收益和损失,导致金钱交换率有很大变动,比如为买到好商品而打电话的次数,或驾车行驶较长距离的意愿。大多数消费者认为相对于买一辆汽车或一幢房子而言,买车载音响或波斯地毯较为容易。当然,这些现象和消费者行为的标准理论背道而驰,消费者行为理论对不变性作出假设,并且意识不到心理账户的影响。

    下面的问题是关于心理账户的例子,在这个例子中,某笔账目中的花费受局部账户的左右:

    问题8(N=200):设想你想看一场电影,每张票的价格是10美元。入场时,你发现票丢了。座位没有标记,而且票又找不到。

    你愿意花10美元再买一张票吗?

    愿意。(46%)

    不愿意。(54%)

    问题9(N=183):设想你打算看一场电影,每张票的价格是10美元。入场时,

    你发现丢了10美元。

    你现在还愿意花10美元买一张票吗?

    愿意。(88%)

    不愿意。(12%)

    对这两个问题的不同回答很能引起人们的兴趣。为什么很多人在丢了票以后不愿意再花10美元,而丢了与票价相当的钱后却愿意再花10美元?我们将这点不同归因于局部账户。去电影院被看成是种交易,其中买票的钱被交换成看电影。再买一张票提升了看电影的成本,以至于很多受试者都认为这难以接受。相反,丢的钱没有被纳入电影的成本中,这只会使得个人感觉自己的财富减少了一点,从而影响买票的决定。

    当将问题的两种说法呈现给同样的受试者时,有趣的事情发生了。若丢钱的说法紧随着丢票的说法出现,人们会更愿意再买张票。相反,丢钱后再买票的意愿没有因为此前另一个问题的出现而受到影响。两个问题的同时出现显然使受试者将丢票视为丢钱是有理可依,但反过来却不是这样。

    心理账户作用的规范化状态会被质疑。之前列出的问题,比如公共卫生问题的两种说法只是形式不同,而计算器和电影票问题的两种说法则是本质上的不同。尤其是在购买15美元的商品时,节省5美元很具吸引力;而在较大花销的商品上可以节省5美元时,吸引力就没有这么大了。同时,相对丢了10美元而言,一张电影票花双倍的钱更令人懊恼。后悔、沮丧以及自我满足感都会受到框架效应的左右。如果这样的从属结果被认为是合理的,那么观察到的受试者的偏向也就没有和不变性原则相矛盾,也就不会被视为不一致或因错误而被排除。从另一个角度说,从属结果也会在反思之后发生改变。当人们在购买200美元的商品而无法节省10美元时,从15美元的商品上节省5美元的满足感就会被破坏。我们不建议用相同的方式来解决任何有相同首要结果且有两种解决方案的问题,但我们建议可以将另一种框架效应的系统检测作为一种有效的反思方法,帮助决策制定者评估其决策的首要或次要结果的价值。

    损失和成本

    许多决策问题都以在维持现状和选择一个替代选项的形式出现。这些替代选项在某些方面是有利的,而在其他方面又是不利的。早期用于线性风险前景的价值分析可运用到这种决策中来,其方法是通过假设现状可定义问题所有因素的参考水平。替代选项的有利点会被评估成收益,而其不利点会被评估为损失。因为损失比收益的影响更大,决策制定者会偏向于维持当前现状。

    泰勒用“禀赋效应”这个词来描述人们不愿意分隔属于自己的资产。当放弃资产的痛苦大于获得收益时的愉悦时,购买价格会远低于出售价格。也就是说,人们为了获得某物而付出的最高价钱,会低于使他们放弃已有资产的最低补偿价。泰勒列举了消费者与企业家的行为中一些关于禀赋效应的例子。一些研究发现,在假设和现实交易中,买入价格和出售价格都会有本质的不同。这些结果是对标准经济理论的质疑。在标准经济理论中,除了交易成本和财富效应外,买价和售价应保持一致。我们还发现,在假设的周薪(S)不同和工作地点的温度(T)不同的工作中选择时,受试者也会迟疑。我们让受试者想象他们的工作有特定的周薪和温度(S1,T1),并且他们可以换另一份工作(S2,T2)(这份工作在周薪和温度两者中有一点优于前一份工作,而另一点不如前一份工作)。我们发现,大多数处在(S1,T1)的受试者不愿意换到(S2,T2),而且处于(S2,T2)的受试者也不愿换到(S1,T1)。很显然,在薪水或者工作环境差异相同的情况下,不利点显得比有利点更为突出。

    总的来说,损失厌恶偏向于稳定而非改变。假设有一对兴趣相同的双胞胎,他们认为某两种环境对自己的吸引力相同。出于某种原因,两人被迫分开,并分别置身于这两种环境中。他们很快会将自己的环境设为参考点,并据此评价对方环境的优缺点。两人对两种环境都不再漠视了,并且都更愿意待在自己所在的环境中。因此,偏向的不稳定产生了对稳定的偏向。除了偏向稳定而不是变化以外,适应性和损失厌恶的结合通过降低已排除的选项以及他人“禀赋”的吸引力,对悔恨和忌妒产生了有限的保护。

    损失厌恶及其禀赋效应在传统的经济交易中发挥的作用不是很大。例如,商店老板不会认为付给供货商的钱是损失,也不会将从顾客那里得到的钱视为收益。而是将一段时期的成本和收益累加起来,仅就平衡状态进行评估。在评估前,相匹配的借款和贷款会被有效地取消。消费者支付的钱不会被评估为损失,而是种购买。在标准经济理论的分析下,我们很自然地认为可以用金钱购买到的商品和服务来代表金钱本身。当某人在头脑中有特定的选择时,如“我能买个新相机或者新帐篷”,该评估模式会被明确制定。在这种分析下,如果相机的主观价值超过了保留买相机的钱的价值的话,人们往往选择买相机。

    在某些情况下,不利点可被构架为成本或损失,尤其是当买保险也能被构架为是在肯定的损失和可能的更大损失间的选择时。在这些情况下,成本—损失间的差异会导致违背不变性的情况发生。例如,请在肯定损失50美元和有25%的概率损失200美元间作出选择。斯洛维克、费斯科霍夫和利希滕斯坦指出,80%的受试者选择风险追求,即想赌一把而不是接受确定的损失。不过,只有35%的受试者拒绝花50美元为25%的概率损失200美元上保险。舒梅克尔和昆鲁斯以及赫尔歇和舒梅克尔也得出了类似的结论。我们认为,同样多的钱在第一个问题中被构架为了无法补偿的损失,在第二个问题中被构架为预防损失的花费。相对于消费而言,损失更让人厌恶,因此两个问题中的模式化偏向相颠倒。

    在收益的情境下,我们也观察到了相似的结果,如下列问题所示:

    问题10:你会接受一个有10%的概率获得95美元、90%的概率损失5美元的赌吗?

    问题11:有种抽奖有10%的概率赢得100美元、90%的机会什么也得不到,你愿意花5美元参加这种抽奖吗?

    有132个大学生回答了这两个问题,且两个问题间有个填充问题。有一半的受试者看到的问题顺序是调换的。虽然很容易看出这两个问题的选项从客观上看是一致的,但有55名受试者给出了不同的偏向。有42位受试者在问题10中不愿意赌一把,却在与问题10有着相同结果的问题11中选择了参加抽奖。这种看上去似乎是无关紧要的研究说明了消费—损失矛盾和框架效应的力量。相比将5美元看做损失,将这5美元当做支付的钱,使得冒这个险更加容易令人接受。

    之前的分析表明,通过将损失的结果构架成消费而不是损失时,人们的主观状态会被提升。我们可以将这种心理改变解释为废弃—损失效用(dead-loss effect)的矛盾行为。泰勒提到过一个例子,在这个例子中,某个人交了网球俱乐部的会费,其技能很快就变得非常棒,即使生病了也坚持去俱乐部,为的是不浪费已交的会费。假设此人如果没有交会费就不去练习,那么问题就出现了:伤病期练习怎么能提高其水平?我们认为,带病训练是将会费评估成一种消费。如果停止练习,则此人就会被迫将会费视为完全的损失,这可能比带病练习更让人厌恶。

    结语

    效用和价值的概念一般会被用在两个完全不同的意义中:(1)体验价值:高兴或悲伤的程度、对结果真实体验的满足感或痛苦;(2)决策价值:预期结果对某个选项中总的吸引力或厌恶的影响。由于体验价值和决策价值常被假设成是一致的,所以两者的区别在决策理论中并不明显。这个假设是理想化的决策者持有的概念的一部分,理想化的决策制定者能准确地预测未来的事情,并以此来评估自己的决策。但对于普通的决策制定者而言,其体验价值与决策价值的一致性不会太完美。影响体验的某些因素是很难预测的,而且一些影响决策的因素对结果的体验并没有产生与其相当的影响力。

    相对于决策制定的大量研究而言,对于这种将享乐体验与主观状态相联系的心理物理学的研究还不是很系统化。享乐的心理物理学最基本的问题就是,测定出能从消极结果中区分出对积极结果的认可或渴望。享乐的参考点在很大程度上是由客观现状决定的,但其也会受期望值和社会比较的影响。例如,在某位员工升职比办公室里其他人慢时,客观进步就会被认为是一种损失。随处境变化而体验到的愉悦或痛苦也依靠于享乐适应的动态变化。布里克曼和坎贝尔就享乐跑步机的概念提出了激进假说,即快速的适应性会使得任何客观进步的影响都很短暂。享乐体验的复杂与微妙使决策制定者很难预测结果的真实体验。很多人选择在非常饿的时候去点菜是很不明智的,当第五道菜端上桌来时,他们就会承认这是个错误的做法。决策价值和体验价值的不匹配引发了很多决策问题中额外的不确定因素。

    框架效应的普遍性以及对不变性的违背使决策价值和体验价值之间的关系更加复杂了。结果框架时常引出在实际体验中与之无法对应的决策价值。例如,分别用死亡和生存来构架肺癌治疗方法似乎不会影响到体验,尽管这种方法对决策有很大的影响。然而在其他情况下,决策框架不仅影响了决策,还影响了体验。例如,某笔花费被构架为无法补偿的损失或保险费的话,很可能就会影响到人们对结果的体验。在这些情况下,制定决策时,对结果的评估不仅能预期到体验,还能构架模式。

  • 丹尼尔•卡尼曼《思考,快与慢》25-34

    第四部分 选择与风险

    第25章 事关风险与财富的抉择

    20世纪70年代早期的某一天,阿莫斯给了我一篇打印好的文章,其作者是瑞士的经济学家布鲁诺·弗雷(Bruno Frey),文章讨论的内容是经济理论的心理学假设。
    我对这篇文章的深红色封面仍然记忆犹新。尽管布鲁诺·弗雷本人几乎已经忘了写过这篇文章,但我仍能记起文章的第一句话:“经济理论的传播者(即经济学家)是理性且自私的,其倾向性没有发生变化。”我对这种说法感到很吃惊。在我隔壁那栋房子里工作的一些同事就是经济学家,但我却未曾发现我们在理智方面存在什么本质差异。对于心理学家来说,人不会是完全理性或完全自私的,而且其品位也不可能一成不变,这一点不言自明。我们两个学科似乎在研究不同物种,行为经济学家理查德。泰勒后来将这两个物种称为经济人和人类。
    心理学家所了解的经济人与人类不同,他们认为人类拥有系统1。人类的世界观受制于眼见即为事实的原则,因此他们不能像经济人那样有一致性和逻辑性。他们有时很慷慨,经常愿意为自己所在的团队作出贡献,而且他们对于自己明年甚至明天会喜欢什么都没有什么想法。那时我们有机会进行一次跨学科的有趣交谈,没想到那次交谈会确定了我的职业生涯。

    面对风险,我们不是理性的经济人

    给我看过弗雷的文章后不久,阿莫斯就建议我们将下一个研究项目定为决策制定。对于这个课题,我几乎没有一点概念,但阿莫斯是这个领域的专家和领军人物,他说他会教我。在他还在读研究生时,就曾和别人合著了一本《数学心理学》(Mathematical Psychology),他指定了几个章节让我看,说这些章节可以帮助我入门。

    我很快就了解到,我们的主要课题是研究人们在作有风险的选择时的态度,而且我们要找到一个特定问题的答案,这个问题就是:在不同的简单风险之间和在有风险与确定的事情之间,究竟是什么规则操控了人们的选择。

    简单的风险问题(比如“有40%的概率赢得300美元”)对于制定学习决策的学生而言,就像是果蝇之于遗传学家的意义一样。对简单风险进行的选择提供了一个简单的模式,这个模式和研究者想要了解的更复杂的决策问题有着相同的重要特点。各种风险表明,这些选择的结果永远不会是确定的,即使表面看上去很确定的结果也是不确定的:在签订购房合同时,你不知道将来自己卖掉这所房子时价钱会是多少,也不知道邻居的儿子很快就会学吹大号。我们在生活中作出的每个重要选择都会带有一定的不确定性—正因如此,学习决策制定的学生才希望在模拟情景中学到的课程中有一些知识可以在更加有趣的日常问题中得到应用。当然,某些决策理论家之所以研究简单的风险问题,其主要原因是因为其他的决策理论家就是这样做的。

    这一领域过去有个理论,即期望效用理论(expected utility theory),这个理论正是理性代理模式的基础,时至今日依旧是社会科学中最重要的理论。期望效用理论并不是按照心理学模式设计的,它是基于理性的基本原则(原理)作出的逻辑选择。

    请看下面这个例子:

    如果你对苹果的好感多于香蕉,那么,你也愿意以10%的概率赢得一个苹果,而不是以同样的概率赢得一根香蕉。

    这里的苹果和香蕉代表任意选择对象(包括风险),10%的概率代表任何的可能性。20世纪最伟大的知识分子之一、数学家约翰·冯·诺依曼(John von Neumann)和经济学家奥斯卡·摩根斯顿(Oskar Morgenstern)从几个原理中推导出了风险的理性选择理论。经济学家赋予了期望效用理论双重角色:作为一种规定决策制定方式的逻辑,作为对经济人决策方式的描述。尽管同为心理学家,阿莫斯和我却是从那时才开始明白人类究竟是如何作出风险选择的,而且我们对人们的理性没有作任何假设。

    我们保留着每天进行若干小时交流的习惯,有时在我们的办公室里,有时在餐厅,最常见的方式是步行走过耶路撒冷那些静谧的街道,边走边谈。就像在研究判断问题时所做的那样,我们仔细审视了自己的直觉性偏见。我们花时间设计出简单的决策问题,并自问要如何作出选择。例如:

    你愿意选择哪一项?
    A.抛硬币决定。如果是正面,你会得到100美元;如果是背面,你就什么都得不到。
    B.肯定会得到46美元。

    我们并没有试图找出最理性或获利最大的选择。我们想找到一个直觉性选择,一个一看就想选的选项。我们几乎总会选择同样的选项。在这个例子中,我们两个都会选B选项,而且很可能你也会这么选。当我们自信地达成一致时,我们都相信—结果证明我们这种想法几乎总是正确的—大多数人都会作出跟我们一样的选择,而且我们持有这种想法仿佛有可靠的证据一般。当然,我们知道此后还需要对自己的直觉加以证实才行,但通过扮演实验者和受试者的双重角色,我们就能顺利推进实验。

    在风险研究进行了5年之后,我们终于完成了一篇文章—《前景理论:风险下的决策分析》。我们的理论仿照了期望效用理论,但两者还是存在着根本上的不同。最重要的是,我们的模式是纯描述性的,而且我们提出这个模式的目的是要用文件证明并解释对不同风险进行选择时对理性原理的系统违背现象。我们把这篇文章投给了《计量经济学》(Econometrica),这份杂志刊登的都是经济学和决策理论方面的重要理论文章。事实证明,对杂志社的选择也很重要。如果我们将完全相同的文章发表在一份心理学杂志上,它对经济学的影响很可能就微乎其微了。然而,我们当时作出那样的投稿决定并不是希望对经济学产生影响,只是决策制定问题的顶级论文过去都是刊发在这份杂志上,于是我们也跃跃欲试。就这个选择和许多其他选择而言,我们是很幸运的。事实证明,前景理论是我们做过的最有意义的工作,而且我们的文章在社会科学文章中是被引用最多的文章之一。两年后,我们在《科学》杂志上发表了一篇论文解释了框架效应(framing effect):由无关紧要的措辞变化引起的巨大偏好变化。

    在研究人们如何做决策这一问题的前5年里,我们对人们在有风险的选项中进行选择的许多情形作了情况记录,其中有几次记录与期望效用理论截然相反。以前有人曾经观察过这些记录情况,有些是全新的情况。随后我们在对期望效用理论进行全面改进的基础上创立了一个理论,这个理论足以解释我们记录的所有观察结果,这个理论就是前景理论。

    我们将心理学中的心理物理学作为解决这一问题的方法,心理物理学是由德国心理学家、神秘主义者古斯塔夫·费希纳(Gustav Fechner)创建并命名的。费希纳对思维和事件之间的联系非常着迷。一边是可以变化的物理量,比如光能、音频或一笔钱;另一边是对亮度、音量或价值的主观体验。不可思议的是,物理量的变化竟然能够引起主观体验的变化。费希纳的研究是要找到将观察者思维中的主观量和物质世界中的客观量联系在一起的心理学规则。他提出,对于众多维度来讲,其功能是对数的—这就明显意味着如果某个给定因素(比方说,乘以1.5或乘以10)的刺激强度增加,在心理上也总会产生等量的增值。如果将声音的物理强度从10个单位提升至100个单位,心理强度就会增强4个单位,那么,刺激强度若进一步增强,比如将100个单位提升至1 000个单位,心理强度的增幅也是4个单位。

    伯努利的财富效用理论错在哪里?

    费希纳并不是第一个试图找到一个函数将心理强度和刺激大小联系起来的人,他自己对此很清楚。1738年,瑞士科学家丹尼尔·伯努利(Daniel Bernoulli)预先采用了费希纳后来的推理论证,并将其运用到对心理价值或钱的欲望(现在称其为“效用“)和钱的实际数量之间关系的研究当中。他认为,10达克(从前流通于欧洲各国的钱币)对于已经有100达克的人的效用和20达克对于有200达克的人的效用是相同的。伯努利当然是正确的,因为我们通常用百分比来表示收入的变换,比如,我们会听到”她工资涨了30%“这样的说法。他认为30%的上涨率在富人和穷人中会唤起非常相似的心理回应,而涨了100美元却未必会有这样的效果。费希纳规则表明对财富变化的心理反应和已积累的财富值成反比,进而得出结论:效用是关于财富的对数函数。如果这个函数是正确的,则10万美元和100万美元间的心理距离与1 000万美元与1亿美元间的心理距离是一样的。

    伯努利将自己的心理学知识运用到财富效用中,借以对风险评估问题给出一个全新的方法,这一问题对当时的数学家而言是一项很重要的研究课题。在伯努利之前,许多数学家就曾假设可以根据预期值对风险进行评估:预期值即对每个可能结果的概率进行加权后,得到的所有可能结果权重的平均值。例如,下面这个问题的预期值:

    80%的概率赢得100美元和20%的概率赢得10美元的预期值为82美元,即0.8×100+0.2×10=82(美元)。

    现在请自问下面这个问题:我是想接受上面这个风险收益还是想得到确定的80美元?几乎所有的人都想要得到确定数目的钱。如果人们在预期值的作用下估计不确定的前景的话,会更愿意尝试赌一把,因为82美元比80美元多。伯努利指出,人们实际上是不会用这种方式去评估风险的。

    伯努利观察到,大多数人都不喜欢冒险(即不喜欢接受最不可能的结果),而且,如果在期望值相同的风险收益和确定收益中作选择,他们就会选择确定收益。事实上,一个规避风险的决策制定者会选择一件低于预期值的确定事情,实际上就是拿出一笔额外费用以避免不确定的事情发生。伯努利用心理物理学来解释这种风险规避现象的时间比费希纳提前了100年。他的想法简单明了,即:人们的各种选择并非基于金钱价值,而是基于各种结果的心理价值,即它们的效用。如此说来,一个风险的心理价值就不是对可能会得到的金钱收益量的平均加权,而是这些收益效用的平均值,每项收益都要乘上自身的概率。

    财富值(百万达克)1 2 3 4 5 6 7 8 9 10
    效用值10 30 48 60 70 78 84 90 96 100

    上面是伯努利计算出来的一个效用函数版本。从中我们可以看出从100万达克到1 000万达克之间不同财富水平的效用。你会发现,在100万达克的基础上加100万达克就会增加20个点的效用值,但是,在900万达克的基础上加100万达克增加的效用值就只有4个点。伯努利指出,财富的边际价值递减现象(在现代术语中)可以解释风险规避问题—人们一般愿意选择确定事件而非具有相同或稍高预期值的风险收益。请看下面这个选择:
    获得100万达克和700万达克的概率相同效用:(10+84)/2=47
    或者
    肯定会得到400万达克效用:60

    就金额来说,风险收益的预期值和“确定事件”是相同的(都是400万达克),但两种选择的心理效用是不同的,其原因就是财富的效用递减,即从100万达克到400万达克的效用增值是50个单位,但从400万达克到700万达克同样增量的财富效用的增值就只有24个单位。风险的效用是(10+84)/2=47(其两种结果的效用,每种结果都乘以其概率的1/2),400万达克的效用是60。由于60比47大,根据这一效用函数,人们就会选择效用值更大的确定事件。伯努利认为,决策制定者在看到财富的边际效用递减时,就会规避风险。

    伯努利的文章言简意赅,他用自己的新概念“期望效用”(他称之为“道德期望”)来计算下列问题:圣彼得堡的某位商人“很清楚在每年的这个时候,从阿姆斯特丹开往圣彼得堡的商船中每100艘通常会损失5艘”。那么,如果这位商人要想从阿姆斯特丹装运香料的话,他愿意给商船买多少钱的保险。他的效用函数解释了为什么是穷人买保险、富人卖保险。你可以从上述函数效用版本中看出,对于有1000万达克的人来说,损失100万达克会损失4个点的效用值(从100到96);而对于只有300万达克的人来说,损失的效用值会更大,有18个点(从48到30)。穷人当然愿意花点钱将风险转嫁给富人,而这就是保险的背后原因。伯努利还对著名的“圣彼得堡悖论“提出了一个解决方案,在该悖论中,风险的期望值(用达克表示)无限大时,人们愿意只花几达克来赌一把。给人印象最深的一点是,伯努利从财富偏好的角度对风险态度的分析经受住了时间考验,在300年后的今天,这一分析方法在经济分析中仍未过时。

    伯努利理论令人尤为关注的地方在于它的经久不衰,尽管这个理论存在着严重缺陷。我们很少能从一种理论明确主张的部分中发现错误,这些错误往往隐藏在该理论忽视或假设的内容中。下面这种情况就是一例:

    如今,杰克和吉尔每人都有500万美元的财富。
    从前,杰克有100万美元,而吉尔有900万美元。
    他们如今是不是一样高兴?(他们的财富效用相同吗?)

    从伯努利理论的角度来看,杰克和吉尔的财富效用是使人们更快乐或更不快乐的原因。两人如今拥有同样的财富,因而,伯努利理论认为他们应该同样快乐,然而就算从来没有学过心理学,你也知道如今的杰克非常高兴,而吉尔却非常失望。其实我们知道,即使杰克如今只有200万美元而吉尔仍有500万美元,杰克也会比吉尔更高兴。所以伯努利的理论肯定是错误的。

    杰克和吉尔体验到的快乐是由他们财富的近期“变化”决定的,而不是由界定其参照点(杰克100万美元,吉尔900万美元)的不同财富现状决定的。这种参考依赖普遍受感觉和知觉影响。同样的声音,如果你在它之前听到的是低声耳语,就会感觉这个声音很大;而若在它之前听到的是大声吼叫,就会感到这个声音很小。要预估(声音)音量的主观体验,只知道声音的绝对音量还不够,你还需要知道听者进行自主比较的参照声音的大小。同样,在判断一张纸上的灰点是深还是浅时,你也需要知道这张纸的颜色如何。在预测一笔财富的效用之前,你同样需要了解其参考值。

    为说明伯努利理论的缺陷,我们再来看下面这个关于安东尼和贝蒂的例子:

    安东尼目前的财富是100万美元。
    贝蒂目前的财富是400万美元。
    现在,安东尼和贝蒂都要在风险和一个确定事件中作出选择。
    风险:拥有100万美元和400万美元的概率相等
    或者
    确定选项:肯定能拥有200万美元

    根据伯努利的解释,安东尼和贝蒂面临着同样的选择:如果选择赌一把,他们的预期财富将会是250万美元;如果他们选择确定选项,其预期财富则会是200万美元。据此,伯努利就会预期安东尼和贝蒂会作出同样的选择,但这样的预测是不正确的。之所以再度失败,还是因为这个理论在安东尼和贝蒂考虑自己的选择时并未给两人提供不同的参照点。如果站在安东尼和贝蒂的角度考虑一下,你很快就会发现目前的财富非常重要。他们也许会这样想:

    安东尼(目前拥有100万美元):“如果选择确定选项,我的财富肯定会翻倍。这是相当有吸引力的。同样我也可以选择赌一把,那样我的财富要么翻4倍,要么什么也得不到。“

    贝蒂(目前拥有400万美元):“如果选择确定选项,我肯定会损失一半财富,这将是非常可怕的。同样我也可以选择赌一把,那样我的财富要么会损失3/4,要么一点也不损失。“

    你能感觉到安东尼和贝蒂很可能会作出不同的选择,因为那个拥有200万美元的确定选项会使安东尼高兴,却会让贝蒂痛苦。还有一点需要注意,那个“最糟糕”的结果与那个“确定的”结果有何不同:对于安东尼来说,这种不同是财富翻倍或什么也得不到;而对于贝蒂来说,这种不同则是损失一半财富和损失3/4财富之间的不同。贝蒂更有可能会选择碰碰运气,就像其他人在面对非常糟糕的选择时所做的一样。在我讲述关于安东尼和贝蒂的故事时,他们都没有想到自己的财富状态:安东尼想的是得到,而贝蒂想的是损失。尽管他们面对的可能财富状态是相同的,但他们的心理过程却完全不同。

    因为伯努利的模式没有考虑到参照点,因此期望效用理论并没有体现出对安东尼而言的好结果对贝蒂来说却是坏结果这一明显事实。他的模式能解释安东尼的风险规避,却不能解释贝蒂对风险收益的偏好。这种冒险赌一把的做法在企业家和指挥官们束手无策时总会成为他们的不二选择。

    所有这一切都很明显,不是吗?人们很容易认为是伯努利本人构建了类似的例子并建立了一个更为复杂的理论来解释这些例子,但由于某种原因,他没有这样做。人们也可能认为与伯努利同时代的业界同仁并不同意他的观点,或者说后世学者在读到他的文章时会反对他的观点,但由于某种原因,他们也没有这样做。

    令人费解的是,结果效用这一概念在这些明显的反例面前如此不堪一击,却为何存在了这么长时间?我只能通过我常在自己身上发现的学者思维的一个弱点来解释这一现象。我称这个弱点为理论诱导的盲区(theory-induced blindness),即一旦你接受了某个理论并将其作为一个思考工具,就很难注意到其错误。如果你碰到一个似乎和这个模式不相符的例子,就会认为肯定有一个非常合理的解释,只是不知为什么你没有发现这个解释而已。你认为这个理论无可指摘,而且很信任认同这个理论的那群专家。很多学者都曾有那么一刻想起安东尼和贝蒂或杰克和吉尔这样的例子,而且偶尔会注意到这些例子与效用理论并不吻合。不过,他们没有继续深究,没有说“这个理论严重错误,因为它忽略了效用不仅仅依赖于某人目前的财富,而是依赖其财富的来源这一事实”。正如心理学家丹尼尔·吉尔伯特所观察到的那样,怀疑是件苦差事,而且运用系统2很容易令人疲惫。

    示例—伯努利理论的错误“3年前,他有2万美元的奖金,他对此已经很满意了,但他的薪水自那以后只涨了20%,所以他需要更多的奖金来获得同样的效用。”“两个人都愿意接受自己拿到的薪水,但他们对这份薪水的满意度不一样,因为他们的参照点是不同的。她目前的薪水更高。”“她在申请离婚赡养费。实际上她愿意调解,但他更愿意上法庭。这种分歧是意料之中的—她只能稳赚,所以要规避风险;而他面对的却都是糟糕的结果,所以他更愿意冒险。”

    第26章 更人性化的前景理论

    我和阿莫斯半是凭借能力半是因为无知,在无意中发现了伯努利理论的主要缺陷。我听从阿莫斯的建议,读了他书中的一章。这一章描述了一些实验,在这些实验中,一些著名学者测试了财富的效用,他们让受试者对一些风险作出选择,这些受试者可能会因选择不同而赢得或输掉几便士。实验者将测量的财富量限定在1美元之内,依此来测试财富的效用。这项实验进而引发了一些问题:人们通过财富间的细微差别对风险进行评估这一假设合理吗?人们怎么会通过对区区几便士的得失反应研究就理解了财富心理物理学呢?心理物理学理论的最新进展表明,如果想研究财富的主观价值,你应该问一些与财富直接相关的问题,而不是关于财富变化的问题。我不太明白为何效用理论会让人们因为敬畏而盲从,对此我感到很迷惑。

    第二天和阿莫斯见面时,我告诉他在阅读中我遇到了一些难题,这些难题只是一个笼统的想法,算不得什么新发现。我非常希望他能给我指明方向,解释一下一直困扰着我的这项实验究竟有什么意义,但他既没给我指明方向,也没向我解释,却对现代心理物理学的相关性问题觉得豁然开朗了。他想起经济学家哈里·马科维茨(Harry Markowitz)—后来因其对金融领域作出的贡献而获得诺贝尔奖—曾经提出过一个理论,即效用是伴随财富的变化出现的,而不是伴随财富的各种状态出现的。马科维茨的理论存在了近25年,但并没有引起过多关注,我们却很快得出结论:就应该朝着这个方向发展,而且我们酝酿提出的理论会把最终结果界定为盈与亏,而不是财富的状态。关于决策论的感知力和无知对我们的研究都具有推动作用。

    我们很快就知道自己已经成功规避了一桩由理论诱导的盲目性引发的严重事件,因为我们刚刚摒弃的想法看起来不仅是错误的,而且非常荒谬。我们很高兴地意识到,在数以万计的财富区间内,自己其实根本无法评估目前的财富效用。从财富效用中推理对细小变化的态度这一想法现在看来也是行不通的。在自己再也无法解释为何这么久都不能看到明显的结果时,你就应该知道自己已经取得了进展。然而,我们还是用了很多年的时间来探索结果是盈还是亏的界定。

    面对财富,你会选择规避风险还是冒险一搏?

    在效用理论中,对“盈”的效用评估是通过对两种财富状态的效用进行对比来实现的。例如,如果你有100万美元,额外再得到500美元,这500美元的效用就是100.05万美元的效用和100万美元的效用差。而且如果你拥有数目较大的那笔钱的话,损失500美元的负效用仍然是两种财富状态的效用差。在这种理论下,盈亏的不同效用只是在符号上有所不同(正号或者负号)。没有哪种方式可以表明损失500美元的负效用会大于获得同样数目的钱的效用这一事实,尽管事实确实如此。正如在理论诱导存在盲目性的情况下可能出现的问题一样,我们既不能对盈亏之间可能存在的各种区别进行预测,也无法对其进行研究。盈亏之间的区别被认为是无关紧要的,因此研究这一点也没有意义。

    我和阿莫斯没有立即发现我们对财富变化的关注为我们开辟了一条新论题的探索之路。我们主要关注了成功概率不同(或高或低)的风险之间的区别。有一天,阿莫斯随便作了一番假设:“亏损的情况又如何呢?”我们很快就发现,当我们变换焦点时,我们所熟悉的风险规避做法就会被冒险的做法取代。请看下面这两个问题:
    问题1:你会选择哪一个?
    肯定会得到900美元,还是有90%的可能性会得到1000美元?
    问题2:你会选择哪一个?
    必定会损失900美元,还是有90%的可能性会损失1000美元?

    你很可能会在问题1中选择规避风险,大多数人都会这样。得到900美元的主观价值肯定比有90%的可能性得到1000美元的价值要大。这个问题中的风险规避情况不会让伯努利感到惊讶。

    现在来看你对问题2的选择。如果与其他大多数人一样,你在这个问题中就会选择风险答案。这次选择冒险的理由与在问题1中选择规避风险的理由如出一辙,即损失900美元的(负面)价值比有90%的可能性损失1000美元的(负面)价值要大。必然的损失肯定会令人反感,也会使你愿意冒险一试。我们以后就会发现,对可能性的评估(90%对应100%)会导致问题1中的风险规避和问题2中的选择冒险这两种不同做法。

    在没有理想的选择时,人们更愿意碰运气,我们不是最先注意到这一现象的人,但由理论误导的盲目性其实早就是普遍现象了。因为占主导地位的理论并未提供一个看似合理的方法来协调人们对盈亏风险的不同态度,于是人们只能忽略态度并不统一这一事实。相反,我们将各种结果视为盈余或者亏损,于是便格外关注这种差异。对是否愿意冒险的不同态度的观察很快便取得了一项重大进展:我们找到了一个论证伯努利理论主要缺陷的方法。请看:

    问题3:不管你有多少钱,有人额外又给了你1000美元。现在请从下列两个选项中作出选择:是选有50%的概率赢得1000美元,还是选择肯定会得到500美元?
    问题4:不管你有多少钱,有人额外又给了你2000美元。现在请从下列两个选项中作出选择:
    是选有50%的概率失去1000美元,还是选择肯定会失去500美元?

    你很容易就能确定,就财富的最终状态(伯努利理论中最重要的因素)而言,问题3和问题4并没有什么不同。在两种情况下,你都得就相同的两个选项作出选择:你可以选择得到1500美元,这样你肯定会比现在更有钱;或者你可以冒一次险,这样你得到1 000美元或2 000美元的机会是相同的。因此在伯努利理论中,这两个问题应该引出相似的选择。凭直觉你就可以猜出其他人会作何选择。

    。在第一个选择中,大多数调查对象都选择确定的选项。。在第二个选择中,大多数调查对象则更倾向于那个冒险选项。

    问题3和4的选择有所不同,这一发现是伯努利理论核心观点的绝对反例。如果财富效用至关重要,那么对相同问题的等义陈述就应产生同样的选择。对这几个问题的对比凸显了对选择进行评估时所选的参照点有着十分重要的作用。问题3中的参照点比当前财富多出1000美元,而问题4中则多出了2000美元。所得增至1500美元在问题3中是赢利500美元,在问题4中却是亏损500美元。显然,相同类型的其他例子也很容易发生,安东尼和贝蒂的故事便与此类似。

    在选择之前,你对得到1000美元或2000美元这样馈赠的关注程度如何呢?如果你和大多数人一样,那么你几乎都注意不到这一点。的确,你没理由去注意这一点,因为这笔馈赠包含在参照点中,而参照点通常会被忽略掉。你对自己的选择有所了解,而效用理论却并不了解这些—如果你的净资产高至几千美元或低至几千美元(除非你很穷),你对风险的态度就会不同。你还知道自己对盈亏的态度并非源自对所拥有财富的自我评估。你想得到100美元而不想失去100美元,其原因并非因为这些钱使你的财富状态有了变化。你只是喜欢得到,不喜欢失去—几乎可以肯定地说,你对失去的厌恶程度远大于你对得到的喜欢程度。

    这4个问题凸显了伯努利理论的弱点。他的理论太过简单,缺少令人信服的因素。这个缺失的变量就是参照点,它是得失评估所依据的初始状态。在伯努利理论中,你只需要了解财富的状态就可以决定其效用,但在前景理论中,你还需要知道参考状态,因此前景理论比效用理论更复杂。在科学中,复杂性被视为一种成本,要想厘清其中原理,就必须有一套足够丰富、新颖且(最好是)有趣的预测来解释已有的理论往往解释不了的事实。这曾是我们过去必须要面对的挑战。

    尽管我和阿莫斯那时并没有研究大脑的双系统模式,但现在我们已经明确地知道,前景理论的核心内容有三个认知特征,这三个特征在金融状况评估工作中扮演着非常重要的角色,在感知、判断和情感等许多自动过程中也很常见,它们应该被看做是系统1的运行特征。

    ·评估与一个中性参照点相关,这个参照点有时也被视为“适应水平”。你可以很轻松地对这一原则作出令人信服的论证。在你面前放上3碗水,左边的碗中放冰水,右边的碗中放温水,中间碗中的水温则与室温相同。把你的双手分别浸在冰水和温水中约一分钟,然后再浸到中间的碗中。虽然一手凉一手热,但两只手对中间碗中水的温度的感觉是一样的。对金融状况而言,最常见的参照点就是现状,但也可能是你期待的那个结果,或者是你感觉实至名归的结果,比方说,你的同事获得晋升或者得到奖金。高于参照点的结果就是所得,低于参照点的结果就是损失。

    ·一种降低敏感度的原则在感觉维度和财富变化评估活动中都是适用的。在漆黑的房间里,即使灯光再微弱,效果也会很明显。而同等亮度的灯在非常明亮的房间里也许都令人难以察觉到。同样,900美元和1000美元之间的主观差别也比100美元和200美元之间的差别小得多。

    ·第三个原则是损失厌恶。当我们对盈亏进行直接比较或权衡时,亏似乎比盈影响更大。积极和消极的期盼或体验之间的力量不对称状况由来已久,将各种威胁当成“危”而不是“机”的有机体的存活和繁殖的概率更大。

    图10阐释了掌控结果价值的三项原则。如果前景理论有一面旗帜的话,上面画的肯定是图10.这幅图表明了盈与亏的心理学价值,而盈与亏正是前景理论中的价值“载体”(这一点与伯努利理论不同,在伯努利理论中,财富状态才是价值载体)。这个图有明显不同的两个部分,中性参照点的右边和左边。这个图的明显特征就是它是S形的,这表明人们对盈与亏的敏感度都降低了。最后,图中S形的两条曲线并不对称。在参照点处函数的斜率突然发生改变,即对亏损的反应比对同等数量盈余的反应要强烈得多。这就是所谓的损失厌恶。

    图10

    损失厌恶:人们对亏损的反应比对盈余的反应大得多

    我们在生活中面对的很多选择都是喜忧参半的:既有损失的风险也有获利的可能,我们必须要决定是接受这个风险还是拒绝它。对新成立的企业进行评估的投资商,思忖是否上诉的律师,定夺是否出击的战时将军,以及必须决定自己是否参加竞选的政治家们,都要面对胜利或失败的各种可能性。如果要找一个前景喜忧参半的例子,请看看你对下面问题的反应。

    问题5:现在,用抛硬币来打赌。
    如果是背面,你会输掉100美元。
    如果是正面,你会赢得150美元。
    这个赌局吸引人吗?你想参加吗?

    为了作出选择,你必须平衡得到150美元时的满足感和失去100美元时的失落感。你有何想法?尽管这个赌局的预期值显然是有利的,因为你坐收的赢利铁定比你可能遭受的亏损小,但你可能还是不愿下这个赌注—大多数人都不会愿意这样做。拒绝这个赌局是系统2的行为,但那些关键的输入信息是由系统1产生的情感反应。对于大多数人来说,对失去100美元的恐惧比得到150美元的愿望更强烈。我们从众多此类观察中得出结论,即“失去比得到给人的感受更强烈”,因此人们往往会规避损失。

    问自己一个问题,你就能测量出自己能在多大的程度上规避损失,这个问题就是:要想平衡100美元的可能损失,我需要得到的最少收益是多少?对很多人来说,这个问题的答案是约为200美元,是损失的2倍。有几个实验曾对“损失厌恶系数”作出估计,这个系数通常在1.5~2.5之间。当然,这是个平均值。有些人规避损失的能力比别人更强。金融市场中的专业风险投资者更能容忍损失,可能是因为他们不会对每一次经济波动都产生情绪上的反应吧。当实验人员要求参与实验的受试者“像商人那样思考“时,他们对损失的规避感就不那么强烈了,他们对损失的情绪反应(通过情感激励的心理指数来测量)也大大减弱了。

    为了检测你对不同风险的损失厌恶率,请思考下面的问题。忽略所有社会因素,不要试图表现得胆大无礼或者谨小慎微,只关注可能的损失和抵消盈余的主观影响即可。

    ·来看一个赌局,在这个赌局中你有50%的可能性会损失10美元。你最少需要得到多少钱才会觉得这个赌局能吸引你呢?如果你说10美元,那就说明你对风险根本就不在意;如果你给出的答案不到10美元,那就说明你在寻求冒险;如果你的回答超过10美元,这就说明你有损失厌恶的概念。

    ·要是在抛硬币的赌局中你可能会损失500美元,又会怎样呢?你需要多少钱才能抵消这一损失?

    ·要是会损失2000美元,又会怎样呢?

    在做这个实验时,你可能会发现自己的损失厌恶系数在风险增大时也会提高,但并不是急速提高。当然,如果这种可能的损失具有潜在的破坏性,或者你的生活方式受到了威胁,所有的赌注也就荡然无存了。在这些情况下,损失厌恶系数会非常大,甚至也许会无穷大—如果你很幸运,非常有可能赢钱,但不管赢得几百万美元,

    你总有不想承担的风险。

    再来看一下图10,也许它能帮你避免常见的困惑。在第1章中我曾两次断言,有些读者也许会认为这两种说法是矛盾的:

    ·在得失都可能出现的赌局中,损失厌恶会产生极力规避风险的选择。

    ·在肯定会有损失和有可能会损失更多的选择中,降低敏感度会引发冒险之举。

    两者之间并不矛盾。在得失都可能出现的赌局中,可能的损失是可能的获利的2倍,从比较得失的价值功能线形图的倾斜度就可以看出这一点。在肯定会有损失的情况下,价值曲线(降低敏感度)的弯曲度会导致冒险之举。必定损失900美元的痛苦比有90%的可能失去1 000美元的痛苦要强烈。这两种见解是前景理论的精髓。

    图10显示出价值功能曲线的突变,在这个曲线图中,获利变成了损失,因为即使相对于你现有的财富而言,风险系数很小,但它引起的损失厌恶数目却是很大的。对财富状态的态度可以解释人们对小风险的极端规避,这样的说法可信吗?伯努利理论这个明显的缺陷在250多年里都未能引起学者的注意,这的确可以算做理论导致盲目性的典型案例了。2000年,行为经济学家马修·拉宾(Matthew Rabin)最终从数学角度证明了通过财富效用来解释损失厌恶是荒谬的,注定会失败,他的证明引起了广泛的关注。拉宾的原理显示,从数学角度来看,任何拒绝低风险的有利赌局的人,都是为了获得更大的赌注从而坚决将风险规避推向一个荒谬的水平。例如,他注意到大多数人都排斥下面这种赌法:
    有50%的概率损失100美元,有50%的概率得到200美元。

    他之后表明,根据效用理论,排斥这种赌法的人最终也会拒绝下面这种赌法:
    有50%的概率损失200美元,有50%的概率得到20000美元。

    当然,思维正常的人都不会拒绝这种赌法!在某篇文章中,马修·拉宾和理查德·泰勒记录了这些证据,他们评论说,这个更大的赌局“有9900美元的预期收益—损失绝对不会超过200美元。如果你拒绝了这个赌局,即使是最差劲的律师也会认定你就是法律意义上的精神病患者”。

    也许是被热情冲昏了头,他们竟然以回顾著名的“巨蟒”小组的幽默短剧作为文章的结束语,短剧中一位倍感挫败的顾客想把一只死掉的鹦鹉送回宠物店去。顾客用了一长串短语来描述这只鹦鹉的状态,高潮部分说的是“这就是那只前鹦鹉”。拉宾和泰勒继续说道:“经济学家应该认识到预期效用是一种‘过气的假设’。”很多经济学家认为这种草率的说法颇有些亵渎神明的意味。然而,认为财富效用可以解释人们对小损失的态度堪称受伯努利理论引导的盲目做法,这种盲目做法正是幽默评论理所应当抨击的目标。

    前景理论无法应对令人失望的事

    在本书这一部分中,我已经赞扬了前景理论的优点,批评了理性模式和期望效用理论。现在应该平衡一下两者了。

    大多数经济学研究生都曾听说过前景理论和损失厌恶,但在经济学书籍的索引中不会出现这些术语。有时候,这种缺失让我有些伤心,但事实上这也是合理的,因为基础经济学理论中理性扮演着主要角色。那些研究生学到的大多数标准概念和理论在经济人不会犯下愚蠢错误的前提下很容易理解。这个假设的确没有什么必要,而且也会随着人们对前景理论的逐渐了解而瓦解,它对各种结果的评估总是太过目光短浅。

    经济学的基本概念都是重要的智力工具,这些工具掌握起来并不容易,即便是利用那些简化了的且不切实际的假设(这些假设都是关于在市场中相互作用的经济动因的本质的)来解释这些概念也是很困难的。在引入阶段就对这些假设提出种种问题的做法的确令人费解,也许还会使人泄气。把帮助学生掌握这一学科的基本工具作为首要任务才是硬道理。此外,前景理论中的理性缺失通常与经济理论的相关预测并不相干,这些预测在某些情况下会很精确,在其他许多情况下还会提供令人满意的近似值。然而在有些情况下,有所区别变得很重要:在前景理论的描述中,对人类产生直接情绪影响的是得与失的情绪,而不是财富和普遍效用的长期前景。两个多世纪以来,在我谈到伯努利理论的缺陷并强调其中因理论诱导而产生的盲目性之前,没有人质疑过伯努利理论。当然了,因理论诱导而产生的盲目性并不仅限于期望效用理论。前景理论自身也有缺陷,而且这些缺陷中存在的因理论诱导而产生的盲目性使得这一理论成为效用理论的主要攻击对象。

    试想前景理论的假设(即参照点),通常就是现状,其价值就是零。这个假设看来是合理的,但它却导致了一些荒唐的后果。请看下面的各项预测,有了这些预测之后会是什么样子呢?

    A.有百万分之一的概率赢得100万美元。

    B.有90%的概率赢得12美元,有10%的概率什么也得不到。

    C.有90%的概率赢得100万美元,有10%的概率什么也得不到。

    “什么也得不到”在三种情况下都是可能会出现的结果,前景理论在这三种情况下给这种结果分配了相同的价值。“什么也得不到”是个参照点,且其价值是零。这些说法和你的经历相符吗?当然不是。“什么也得不到”在前两种情况下是被期望但未能实现的事,没有给其分配价值也是讲得通的。相反,在第三种情况下,没能获利就会让人非常失望。这就好比私下里向你保证会给你加工资,赢得一大笔钱的可能性那么大,这就建立了一个新的暂时参照点。相对于你的期望而言,“什么也得不到”无异于一种巨大的损失。前景理论无法应对这种情况,因为在结果(在这里是指“什么也得不到”)出现的可能性很小或另外一种选择很有价值时,前景理论是不会允许这种结果的价值发生改变的。简而言之,那就是前景理论无法应对令人失望的事。失望和对失望的预感都是真实的感觉,而人们不能承认这种感觉的情形正好印证了我在批判伯努利理论时提出的那些反例。

    前景理论和效用理论没有给我们留下回旋的余地。这两种理论都有这样的假设,即某种选择中选项都是分开的,需要独自评估的,价值最大的选项就会被选中。这种假设显然是错的,请看下面的例子。

    问题6:选择有90%的机会赢得100万美元,还是选择肯定会得到50美元?
    问题7:选择有90%的机会赢得100万美元,或者选择肯定会得到15万美元?

    请比较一下两种情况下选择赌一把却赢不了的痛苦孰大孰小。在两种情况下,不能赢都会带来失望,但在问题7中,潜在的痛苦是多重的,因为知道如果选择赌一把又输了的话,你会后悔自己“贪婪的”决定,后悔放弃了拿到15万美元的机会,后悔这种体验依赖于你本应该采取却没有采取的意见。

    有些经济学家和心理学家依据对后悔和失望的情感提出了决策制定的模式。如果说这些模式没有前景理论那样有影响力的话也是说得通的,且其中的原因也很有启示意义。后悔和失望的情感是真实的,做出决策的人当然在做决策时会预测到这些情感。问题是后悔理论会产生一些惊人的预言,使得前景理论中这些情绪的作用变弱,这也就使问题变简单了。前景理论的复杂度在与期望效用理论进行对比时容易被大家接受,因为它确实预言了期望效用理论无法解释的一些现象。

    更丰富且更切实际的假设还不足以使一种理论获得成功。科学家把理论作为工具,但他们很难接受新的工具,除非这个新工具非常有用。前景理论为众多学者所接受不是因为它是“真实的”,而是因为它在效用理论基础上增加了一些概念,比如说参照点和损失厌恶等,这些都值得大家花费时间和精力来研究。它们产生的新预测最后都被证实是真实的。所以说我们是很幸运的。

    示例—前景理论“他是损失厌恶的典型例子,因而连非常有利的机会也被他拒绝了。”“她非常有钱,因而她对微不足道的所得反应那么强烈着实让人费解。”“他把损失看得比所得要重一倍。不过这也很正常。”

    第27章 禀赋效应与市场交易

    图11

    (禀赋效应是指当个人一旦拥有某个物品,那么他对该物品价值的评价要比未拥有之前大大提高)

    即使没学过经济学的课程,你可能也看到过图11或与之类似的图形。这个图形展示了面对两种好处(收入和休假时间)时,不同的人表现出的“无差异曲线图”。

    在经济学入门课程中,学生们会了解到:图中每一个点都代表了收入与休假天数的特殊结合。每条“无差异曲线”都与两种情况的结合相关联,收入和休假都是大家想要的,都有同样的效用。如果人们不管自己有多少收入、有多少休假时间,只想以同样的价格“出卖”休假时间以换取更多收入的话,这些曲线就会变成平行的直线了。凸出的部分表明边际效用递减,即你的休假天数越多,就越不会在意自己是否还想多休息一天,而且每多一天,这一天的意义就比前一天更小。同样,你的收入越高,就越不关心自己是否会额外再得到一美元,而且为换取一天的额外休假,你愿意放弃的钱数也会有所增加。

    每条“无差异曲线”上所有的位置都同样吸引人,这也正是“无差异”三个字的真实体现:你并不在意自己到底处在“无差异曲线”上的哪个位置。所以,如果A和B都在你的无差异曲线上,你对它们的位置并不在意,而且也不需要刻意在两点之间来回移动。在过去100年里出版的所有经济学教科书中都曾出现过这个图的不同版本,数百万学生都曾仔细研究过这个曲线图,却很少有人注意到图中缺失了什么。理论模式的影响和简洁再一次蒙蔽了这些学生和学者,使得他们没有看到这个曲线图的严重缺陷。

    图中缺失的是对个人当前收入和休假天数的标示。如果你是个雇员,劳动待遇便说明了你应得的薪水和休假日,这在图中也有对应的点。这个点就是你的参照点、你的现状,但图中并没有显示这个点。画这个图的那些理论家没能展示出这一点,所以你便相信参照点并不重要,但现在你知道参照点是很重要的。这又是一个不折不扣的伯努利式错误。无差异曲线的表现含蓄地给出了假设,即所有时间点的效用完全是由当前的情况决定的,与过往毫不相干,而且你对一项可能的工作的评估并不依赖于自己当前的工作待遇。在这种情形以及其他许多情形下,这些假设完全是不切实际的。

    忽略无差异曲线图中的参照点这一做法正好印证了由理论导致的盲目性,堪称一个令人惊讶的案例,因为我们常碰到一些参照点非常重要的案例。在劳资谈判中,双方都清楚其参照点是现行合同,而且谈判关注的是就参照点作出让步时双方的共同要求是什么。在讨价还价时,损失厌恶的作用也很容易理解:作出让步让人很痛心。

    你对参照点的作用肯定有很深刻的亲身感受。如果你曾换过工作或职位,哪怕是曾想过要换一换,你就会以自己现在的情况作为参照点,看看新的工作和职位的特点是更好了还是更差了。你也许还会注意到,在评估中不利之处比有利之处更加突出,这说明损失厌恶发生了作用。人们很难接受比原来还糟糕的改变。例如,想要得到新工作的失业人员能接受的最低工资平均来看是其之前工作的90%,在一年的时间内下降不到10%。

    为了弄明白参照点对选择的影响,请看艾伯特和本这两位的例子,他们是“快乐双胞胎”,有相同的品位,第一份工作也是一样的,这份工作工资低、假期短。他们当前的状况和图11中点1的情况相同。公司给他们提供了两个更好的位置A和B,并让他们自己选择谁要1万美元的加薪(位置A),谁要每月带薪休假一天的机会(位置B)。由于他们两人对这两种选择都无所谓,便用抛硬币的方式来决定。于是艾伯特获得了加薪机会,而本则得到了额外的每月一天带薪假期。一段时间过后,这对双胞胎习惯了各自的位置。现在公司告诉他们,如果他们愿意,可以互换位置。

    图11中体现的标准理论给出的假设为:人们的选择偏好很稳定,不会随时间推移发生改变。位置A和B对这对双胞胎来说具有相同的吸引力,而且他们几乎没有或者根本就不会产生想要改变的想法。前景理论的断言则截然相反,该理论认为两人肯定会留在自己当前位置上的原因是他们想规避损失。

    现在让我们来看看艾伯特。他刚开始在图中的位置1,在那个参照点上,他发现了两个同样吸引人的选择:
    选择A:加薪1万美元
    或者
    选择B:得到12天的额外假期

    选择位置A改变了艾伯特的参照点,当他想要换到位置B时,他又有了新的选择:
    停留在A点上:无所得也不损失
    或者换到B点:获得12天的额外假期,少赚1万美元

    你刚刚对损失厌恶有过主观体验,能感受到:少赚1万美元是个非常糟糕的消息。即使获得12天额外假期和得到1万美元同样令人惊喜,多出来的假期也不足以补偿损失的1万美元。艾伯特之所以会留在A点上是因为移动的不利之处大于有利之处。对本来说同样如此,他也想保住自己当前的职位,因为失去眼前这宝贵的假期比损失额外的收入更划不来。

    这个例子凸显了“无差异曲线”的标准模式没有预见到的选择的两个方面。第一,人们的偏好并不是一成不变的,它们会随着参照点发生变化。第二,改变的不利之处比有利之处更突出,其有利之处包括对倾向于现状的偏见。当然,损失厌恶并不是说你从未想过要改变自己的处境;一次机会带来的益处也许会超过甚至大大超过损失。损失厌恶只能表明我们的选择总是强烈偏向趋近参照情形的选项(而且通常情况下会偏向较小而不是较大的改变)。

    传统的无差异曲线和伯努利用财富状态来表示结果的做法有一个共同的错误假设,即拟定各项事务状态的效用只依赖于该状态本身,并不受你过往的影响。对这一错误的修正已经成为行为经济学的成就之一。

    人们为什么不愿意割舍自己已拥有的东西?

    一项决策何时付诸实施或一项行动何时开始,这个问题通常很难回答,但我们却可以准确而详尽地追溯到今天所说的行为经济学的发端。20世纪70年代早期,罗彻斯特大学的经济学系还非常保守,理查德·泰勒当时还是那里的研究生,他那时就有一些异端想法。泰勒总是很睿智,言辞犀利,作为学生,他常常乐于观察记录别人的行为,而这些行为只有理性经济行为模式才可以解释。他也很乐于在教自己的那拨教授身上发现他们理财不合理的情况,他发现有一种情况尤其突出。

    R教授(现在已被证实是理查德·罗塞特,他后来成为芝加哥大学商学院的院长)对标准经济理论深信不疑,还对葡萄酒难以割舍。泰勒发现R教授非常不愿意卖掉自己收藏的葡萄酒,即使对方出价高达100美元(当时可是1975年)一瓶也不行。R教授也会从拍卖会上买葡萄酒,但无论质量如何,他出价从不会高过35美元一瓶。若价格在35美元~100美元,他就既不买也不卖。这个巨大的价格差在经济理论上看是相互矛盾的,人们希望这位教授能在这个价格区间为某瓶酒定一个值。如果在他看来某瓶酒值50美元,那么只要出价超过50美元,他就应该会卖掉它;如果这瓶酒本来不是他的,那么他也应该愿意花50美元买下它。这个可以接受的卖价和可以接受的买价应该相同,但事实上,最低卖价(100美元)比最高买价(35美元)高出很多,拥有这件物品似乎会提升它的价值。

    理查德·泰勒发现了很多禀赋效应的例子,那些没有用做定期交易的商品尤其会出现这一效应。你很容易就可以想象自己处于一个类似的情景中。假设你手里有一张票已售罄的演唱会门票,这是一个著名乐队的演唱会。这张票你是以200美元的价格买下的,而你又是个狂热的粉丝,即便是以500美元买下这张票,你也愿意。后来你从互联网上看到有更有钱或更狂热的粉丝愿意花3000美元买下门票。你现在手里有票,你愿意卖吗?如果像票已售罄的各种重大活动中的大多数观众一样,你就不会卖。你的最低卖价也要在3000美元之上,而你的最高买价只是500美元。这就是禀赋效应的一个例子,而一个坚信标准经济理论的人则会对此感到迷惑。泰勒当时正在寻求一种解释来破解这类难题。

    泰勒在一次会议上遇到了我们以前的学生并拿到了前景理论的早期手稿,这才使得上述难题得到破解。他说他非常激动地读完了这份手稿,因为他很快就意识到前景理论中的损失厌恶能够对禀赋效应和其他一些难题作出解释,其解决方法就是摒弃标准理论,即R教授“拥有”某瓶特定葡萄酒的状态具有独特的效用。前景理论表明,是愿意买还是愿意卖这瓶酒取决于参照点,即教授当时是否拥有这瓶酒。如果拥有这瓶酒,他就会考虑“放弃”这瓶酒时的痛苦;如果还没拥有这瓶酒,那他考虑的就是“得到”这瓶酒的乐趣。因为存在损失厌恶,所以两者的价值并不相等,即放弃一瓶好酒的痛苦比得到同一瓶酒所得到的快乐更深刻。我们可以回想一下前一章中的那幅得失图。在对称轴左侧的函数曲线更陡,人们对损失的反应比对相应的所得的反应更强烈。这正是泰勒一直在寻找的对禀赋效应的解释。在今天看来,应用前景理论来解决经济难题的做法应该算做行为经济学发展过程中的里程碑式事件了。

    在泰勒得知阿莫斯和我将会到斯坦福大学工作时,他也计划在那里待上一年。这段时间我们都收获颇丰,我们相互学到了很多知识,也成了好朋友。7年后,我和泰勒又有机会在一起工作一年,继续就心理学和经济学中的问题进行交流。长期以来一直作为行为经济学主要赞助方的拉塞尔·塞齐基金会拨给泰勒一笔钱,目的是让我们两人能在温哥华共事一年。在这一年里,我们和当地的一位经济学家杰克·尼奇(Jack Knetsch)密切合作,他和我们一样,都对禀赋效应、经济公平原则和中国的辛辣食品很感兴趣。

    我们调查研究的起点是禀赋效应并不具有普遍性。如果有人想让你把面值5美元的钞票换成5张1美元的零钞,你递过去5张1美元纸钞时不会有损失感。在商店买鞋时你也不会有损失厌恶,卖鞋赚钱的商人当然也不会感到有什么损失。的确,从他的角度来看,递出去的鞋一直就是钱的代表,钱正是他想要从顾客那里拿来的东西。此外,你付给商家钱也不会感到是种损失,因为你把钱看做是你想要买的鞋的代表。这些日常交易与把面值5美元的钞票换成零钞有相同之处。日常交易中的双方都不存在损失厌恶。

    上述这些市场交易与R教授不情愿出售自己的葡萄酒有什么区别?就像那些持有美国橄榄球超级杯大赛门票的人,即便有人出一个非常高的价格也不愿转让这种做法又有什么区别?这一区别性特征就是,商家要卖给你的鞋和你从预算中拿出来的买鞋钱都是用来“作交换”的。人们想用它们来交易以换取其他商品。其他商品,比如葡萄酒和橄榄球超级杯大赛的票,都是拿来“使用”的,或者说都是用于消费或享受的。你的闲暇时光和收入也都不是用来出售或交换的。

    尼奇、泰勒和我打算设计一个实验来表明用来使用的商品和用来交换的商品之间的不同。我们实验设计的部分内容借鉴了实验经济学的奠基人费农·史密斯(Vernon Smith)的做法,多年以后,我和他共同获得了诺贝尔奖。利用这种做法,在某个“市场”中,我们向受试者发放了少量代币。实验结束时,所有手里还有代币的受试者都可以可将其兑换成现金。为了体现市场中用来交易的商品对某些人来说比对其他人更有价值,不同的人得到的补偿价值不同。同样的代币对你来说可能值10美元,对我来说却价值20美元,在这两种价值之间以任何一种价格进行交换对我们双方而言都是有利的。

    史密斯对供求的基本机制进行了生动的展示。个人会对买卖代币给出连续的公开报价,其他人会对报价做出快速回应。每个人都会关注这些交易,会看到代币的成交价。这些结果和一项物理学实证研究的结果一样合乎规范。那些代币持有者(代币于他们而言价值微乎其微,因为它们的补偿价值很低)为获利最终会将自己的代币卖给某个对代币估值更高的人,这种交易就好比水往低处流那样必然会发生。交易结束后,所有代币都集中到那些能从实验人员那儿拿到最多钱的受试者手中。市场魔力显神威!此外,经济理论还对市场平稳时的最终价格和转手的代币数量作出了正确预测。如果实验人员将这些代币随机分配给市场中的半数受试者,这个理论就会预测有半数代币会被转手。

    我们在实验中用到了史密斯方法的一个变量。每一次实验开始时都会进行几轮代币交易,这种做法完美重现了史密斯的发现。实验预计的交易数量与利用标准理论预测的数量非常接近甚至完全相同。当然,代币之所以有价值只是因为它们能用来交换实验人员的现金,它们没有任何使用价值。随后我们又模拟了一个相似的市场,目的是想让人们关注使用价值:一个好看的咖啡杯,杯子上印有大学校徽,我们在哪所大学做实验,杯子上就印着哪所大学的校徽。这个杯子当时价值6美元(今天这个杯子的价值可能是当时价值的两倍了吧)。我们随机将这些杯子发放给半数受试者。卖方将自己的杯子摆在面前,却热情地让买方去看旁边卖家的杯子;所有杯子都明码标价。要想得到一个杯子,买方必须自己花钱去买。实验结果很有戏剧性:平均卖价接近平均买价的两倍,而且实验预计的交易数量还不到利用标准理论预测数量的一半。市场的魔力对于那些想使用某件商品的所有者(卖家)而言根本就不起作用。

    我们用同一过程的不同变体进行了一系列实验,总是得到相同的结果。在我最喜欢的一项实验中,我们在“买方”和“卖方”之外加入了第三个小组—“选择者”。与那些不得不花自己的钱买东西的“买方”不同,“选择者”可选择是接受一个杯子还是一笔钱,而且他们的选择表明那笔钱和得到那样东西一样吸引人。下面就是实验结果:

    卖方    7.12美元

    选择者  3.12美元

    买方    2.87美元

    “卖方”和“选择者”之间的差距很大,因为他们实际上面对的是同一种选择!如果你是“卖方”,你能拿回家的要么是一个杯子要么是钱;而如果你是个“选择者”,也有完全相同的两个选项。这个决定的长期效应对于两组人来说是完全相同的,唯一不同的是当时的情绪。卖方标注的高价反映出他们在放弃自己已经拥有的物品时很不情愿,这种不情愿与婴儿在自己特别看重的某件玩具被拿走时表现出的焦虑一样。损失厌恶是系统1自主评估必然包含的内容。尽管“买方”只能花钱买杯子,而“选择者”却可以免费得到这个杯子,但两者却设定了相似的现金值。如果“买方”不觉得花钱买下这个杯子是种损失的话,这个相似的现金值便与我们的预期正相吻合。大脑成像的证据也证实了这种不同。出售自己常用的商品会激活大脑中与厌恶和痛苦有关的区域,购买行为也会激活这些区域,但只有在(买方)认为价钱太高,即当你觉得卖方的要价超过了交换价值时才会这样。大脑记录还表明以特别低的价格购买商品是件令人愉快的事。

    “卖方”给杯子设定的现金价值比“选择者”和“买方”设定的高出两倍多,这个比例与有风险选择的损失厌恶系数非常接近,不管决策是否有风险,只要运用赚钱和赔钱两种结果中相同的价值功能/函数,我们就能预测到这个比例。在不同经济领域的研究中都出现过大约2∶1的比例,包括许多家庭对价格变动的反应。正如经济学家所预测的那样,在价格下降时,顾客往往会增加蛋、橙汁或鱼等商品的购买量;而价格上涨时,他们就会减少其购买量。然而,与经济理论预测不同的是,价格上涨的效应(基于参照价格的相对损失)竟然是收益效应的两倍。

    杯子实验延续了禀赋效应的标准实证研究,这个实验与杰克·尼奇负责的一项更为简单的实验基本上是同期进行的。尼奇让两个班的学生填写了调查问卷,并且给他们每人一份礼物作为回报,这份礼物在实验期间一直放在受试者面前。其中一个班的学生得到的礼物是昂贵的钢笔,而另外一个班的礼物则是一块瑞士巧克力。快下课时,实验人员拿出了另外一份备选礼物,并且告诉学生可以用他们手里的礼物来交换这份礼物。结果只有约10%的受试者选择交换礼物,大多数得到钢笔的人仍然保留了钢笔,那些拿到巧克力的人也没有改变自己的选择。

    像商人那样思考和交易

    前景理论的基本概念是参照点是存在的,而且一定量的损失比等量的所得影响更大。过去这些年在真正的市场中进行的观察表明,这些概念有着很强的影响力。经济衰退期间,对波士顿的公寓大厦市场进行的一项研究调查给出了尤为清晰的结果。参与该项目的人员对那些曾以不同价格购买了相似房产的业主行为进行了对比。对于理性的代理人来说,从前的买价与自己根本就不相干—当前的市场价值才是最重要的。然而对于那些处于住房市场低迷时期的业主来说,情况却并非如此。那些参照点较高同时也面临着较大损失的业主对私有住宅的标价更高,他们会花更多的时间尽量以高价卖掉自己的房子,最终得到更多的钱。

    对卖价和买价之间(更确切地说,是买卖之间)的不对称性最初进行的实证研究,在人们接受参照点和损失厌恶这些概念的早期发挥了非常重要的作用。然而,我们都知道参照点是不稳定的,在不同寻常的实验环境中尤其如此,而且禀赋效应可通过改变参照点而消除。

    当那些业主将其商品看做未来交换中的价值载体时,他们就不想看到禀赋效应出现,这种态度在日常商务活动和金融市场上非常普遍。曾通过各种棒球卡大会研究贸易的实验经济学家约翰·李斯特(John List)发现贸易新手不愿割舍自己手中的球员卡,但这种不情愿会随着贸易经验的增多而最终消失。更令人惊讶的是,李斯特发现,就新商品来说,贸易经验对禀赋效应的影响很大。

    在某次大会上,李斯特贴出了一张通告,邀请人们参与一个小调查,而且他们可得到一份小礼物,这份小礼物可能是一个咖啡杯或一块同等价值的巧克力。这些礼物是随机分给大家的。在那些自愿参加调查的人即将离开时,李斯特告诉大家说:“我们给了你一个杯子或一块巧克力,但如果你愿意,你可以用它来换块巧克力或换个杯子。”在完整再现杰克。尼奇的早期实验时,李斯特发现那些缺乏经验的商人中只有18%的人愿意和别人交换礼物。与之形成鲜明对比的是,那些经验丰富的商人并没有表现出任何禀赋效应的迹象:他们中有48%的人进行了交易!至少在一个以交易为基准的市场环境中,他们在交易时没有表现出任何不情愿。

    杰克·尼奇还做了一些实验,在这些实验中只要进行一些细微的操作就可以使禀赋效应消失。在实验人员提到受试者手头的商品有可能用来交易之前,只有在真正拥有该商品一段时间的前提下,他们才会表现出禀赋效应。经济学家也许会说尼奇和心理学家待在一起的时间太久了,因为他的实验操作表现出对一些变量的关注,而这些变量正是社会心理学家认为很重要的因素。的确,实验经济学家和心理学家对方法论的不同关注点在关于禀赋效应的持续辩论中体现得越来越明显。

    经验丰富的商人显然已经学会了正确提问,即“与可以得到的其他东西相比,那个杯子真的是我特别想‘得到’的吗”。经济学家会问这个问题,有了这个问题,禀赋效应就不复存在了,因为得到的快乐和放弃的痛苦之间的不对称性没有关联。

    对“在贫困境遇中做决策”的心理进行的最新研究表明,我们并没有希望从这些贫困的人的身上发现禀赋效应。在前景理论中,贫困就意味着一个人的生活水平低于自己的参照点。有些商品是穷人买不起的,因此他们总是“处于损失中”。他们会觉得自己得到的那一小笔钱算是减少了的损失,而不是所得。这些钱可以帮助一个人向参照点再靠近一点,但穷人却总是徘徊在价值函数坡度最大的地方。

    穷人可以像商人那样思考,但其原动力却有着很大的不同。与商人不同,穷人对获得和放弃之间的区别很在意。他们的问题在于,他们只能在不同的损失之间作出选择。花在某件商品上的钱对于本来可以购买的另外一件商品而言就是损失。对于穷人来说,花钱就意味着损失。

    我们都认识一些认为花钱很痛苦的人,尽管客观来讲他们其实很富裕。对花钱的态度,尤其是对一时兴起买的东西或者一些较小奢侈品(例如买个有装饰的杯子)的态度,常带有文化差异的因素。这种差异也许可以解释美英两国分别进行的“杯子研究”的结果之间存在的重大分歧。在美国,对学生样本所做的实验中买价和卖价存在很大差异;但在英国的学生中,这些差距则要小得多。因此,对禀赋效应的研究还有待深入。

    示例—禀赋效应“她不在意自己能得到两个职位中的哪一个,但公告发布一天之后,她就不再想换了。这就是禀赋效应!”“这些协商不会有任何进展,因为双方都发现很难作出让步,即使自己能得到补偿也不行。损失的比得到的更多。”“他们一涨价,需求量就下降。”“他只是不想以低于自己买房的价格卖掉自己的房子。损失厌恶起作用了。”“他是个吝啬鬼,只要花钱就觉得赔了。”

    第28章 公平性—经济交易的参照点

    损失厌恶这一概念绝对是心理学对行为经济学最重要的贡献。这很奇怪,因为人们虽然通过这个概念将众多结果评估为得和失,而且损失显得比获得更突出,但这个概念并没有让人们感到惊讶。阿莫斯和我经常开玩笑说,我们正在研究一项连我们的祖母那辈人都耳熟能详的课题。然而事实上,我们比那辈人了解得更多,而且能将损失厌恶与大脑双系统模式相结合进行研究,还特别将一种生理学和心理学观点应用到这些研究中,即相比于积极与靠近而言,消极与规避更能占据主导地位。我们还能通过数量惊人的各种观察研究来探索损失厌恶的结果:当商品在运输中丢失时,只有需现款支付的那部分损失才能得到补偿;大范围的改革通常会失败;职业高尔夫球手短打标准杆比短打小鸟球(高尔夫中某洞的杆数低于标准杆一杆)更精准。就算我的奶奶很有智慧,但如果我们能从她认为平淡无奇的观点中得出精准的预测的话,她应该也会感到惊奇的。

    图12

    在看到图12左面的图时,你的心跳会加速,也许在你还不清楚那张图有何怪异之处之前,心跳就已经加速了。过了一会儿,你也许就会认出那是双受到惊吓的人的眼睛。右面的图则表达了一种愉悦之感,微笑的脸颊上扬使眼睛变小了—当然这双眼睛还没有达到兴奋的程度。我们把这两幅图拿给做脑CT的人看。每幅图展示的时间都不到0.02秒,之后会被“视觉噪声”掩盖,这个“视觉噪声”是随机展示的黑白图片。这些观看者中没有人意识到自己曾看过那幅眼睛的图片,但他们大脑的一个部分显然意识到了:这个部分即为小脑扁桃核,尽管它在其他情绪状态下也会被激发起来,但其主要角色是担任大脑的“风险中心”。脑部影像显示,小脑扁桃核对观看者无法识别出来的有威胁性的图片有强烈的反应。关于威胁的感觉很可能是通过一个非常快的神经通道传递的,这种感觉会直接传到大脑处理情感的区域,绕过产生“视觉”意识的视觉皮质。同样的通道还会使得生气的面孔(一种潜在威胁)比快乐的面孔更快、更有效地得到处理。有些实验人员描述道,生气的面孔在众多快乐的面孔中会“凸显出来”,但快乐的面孔在众多生气的面孔中却不会很突出。人类的大脑和其他动物的大脑都包含一种机制,这种机制总会优先考虑不好的消息。将察觉掠食者所需的时间减少百分之几秒,通过这种做法,提高了动物的生存概率,使其得以繁衍生息。系统1的自动运行便体现了这种进化史。然而,人们至今尚未找到能够同样快速检测到好消息的机制。当然,我们人类和动物都对交配或进食的信号反应很机敏,因此广告商才会设计许多广告牌。不过,威胁仍然优先于机遇,而且也应该是这样。

    即使是对纯粹象征性的威胁,大脑的反应也很迅速。充满情绪的字眼会引起注意,而不好的字眼(战争、犯罪)比好的字眼(和平、爱)能更快地引起注意。其实并没有真正的威胁,但只是提一下不好的字眼对系统1来说就是一种威胁。之前我们曾提到“呕吐”这个词,只是看到这个词就会自然联想起很多对真实事情的反应,包括生理上的情感流露,甚至有规避或接近、畏缩或向前的趋向。对威胁的敏感性还会延伸到对自己强烈反对的那些意见陈述的处理上来。例如,基于你对安乐死的态度,你的大脑用不到1/4秒的时间就可以在“我认为安乐死是一种可以/不可以接受的……”这句话中识别出“威胁”的意味。

    保罗·罗津(Paul Rozin)是位对厌恶很有研究的心理学家,他观察到一只蟑螂可使一碗樱桃不再诱人,而一个樱桃对一碗蟑螂却不会起任何作用。他指出,负面情况在众多方面都可战胜正面情况,而且损失厌恶是负面占优势的典型例子之一。其他学者在一篇题为“坏消息比好消息强”的文章中将原因总结为以下几点:“负面情绪、不负责任的父母和糟糕的反馈比好的情况更具影响力,且人们处理坏消息时比处理好消息更彻底,我们会更在意避开负面的自我定义,而不是追求正面的自我定义,不好的印象和不好的模式比好的情况更容易形成,且不易消失。”他们引用了研究婚姻关系的著名专家约翰·葛特蒙(John Gottman)的话,他观察到长期健康的婚姻关系不仅仅依赖于寻求幸福,更在于避免负面的情况出现。葛特蒙预测一种稳健的关系需要良好的互动与不好的互动间的比例至少为5 ∶1。其他社会方面的不协调则更吸引人,我们都知道,也许一件事就会毁掉数年时间培养的友谊。

    我们生来就能对好与坏的某些区别进行分辨。婴儿来到这个世界上,就知道苦是不好的,(某种程度的)甜是好的。然而在很多情况下,好和坏之间的界限是种参照点,会随着时间的改变而改变,而且依赖于当时的情况。假设你在一个寒冷的晚上来到乡村,适逢大雨,而身上的衣服又不足以挡雨,衣服都湿透了。不凑巧的是,冷风又起,这下真的是糟糕透顶。就在你不知如何是好时,发现了一大块岩石可暂时挡风避雨。生物学家米歇尔·卡巴纳克(Michel Cabanac)说这种体验会令人非常快乐,因为这种体验与我们平时可能感到快乐的原因相似,都指明了生理状况的重要改善方向。当然,这种感到获救的快乐感不会持续很长时间,不一会儿你就会在岩石后面冻得哆嗦起来。新遭受的痛苦又会驱使你去寻找更好的庇护之所。

    目标就是参照点

    损失厌恶系数指的是两种动机的相对强度:我们想要规避损失的动机要强于获得利益的动机。参照点所关注的是现状,但它还会是将来的目标,即没有实现的目标就是种损失,超过了目标就是种所得。正如我们从消极主导中可能推断出来的那样,这两种动机的影响程度并不形同。对没能实现目标的损失厌恶比想要超过目标的愿望更为强烈。

    人们通常会设定一些短期目标,对于这些目标他们会努力去实现,但并不是必须去超越。人们在实现一个最接近的目标后往往不再那么努力,而这样做有时候会违背经济逻辑。例如,纽约市的计程车司机对月收入或年收入有个目标,但能控制他们努力程度的目标则是每天的收入目标。当然,每天的目标有时容易实现(或超过),而有时则难以实现。下雨天时,纽约市的计程车是不会长时间空车的,司机很快就可以实现自己的目标;而在天气晴好时,情况则大不相同,此时那些计程车只能在大街小巷逡巡,希望能载到客人,时间都浪费在路上了。经济逻辑表明,计程车司机应该在下雨天多干几个小时,晴天时则要多休息,因为晴天时能以较低价格“买”到轻松闲暇。损失厌恶背后的逻辑却正相反:每天有固定目标的司机会在客人少的日子多干几个小时,在浑身湿透的客人巴望打到车的日子里,他们也早早回到家里。

    宾夕法尼亚大学的经济学家德文·波普(Devin Pope)和马利斯·施韦泽(Maurice Schweitzer)认为,高尔夫球对参照点给出了很好的说明,即标准杆数。高尔夫球场上每个洞都有许多击球数,标准杆数给好球(而不是相当出色的球)提供了一个基准点。对于职业高尔夫球员来说,小鸟球(即低于标准杆的一击)即是所得,而超过标准杆数的球则是种损失。经济学家比较了一个球员在球洞附近时可能会碰到的两种情形。

    ·避免击超过标准杆数的球
    ·打出小鸟球

    在打高尔夫时,每一击都算数,在职业高尔夫球比赛中更是如此。然而依据前景理论,有几次击球要比其他击球更重要。没能达到标准杆是种损失,但没有击中小鸟球则是种可预知的所得,不是损失。波普和施韦泽从损失厌恶中推断出球员击标准球(避免超过标准杆数)时会比击小鸟球时更努力。他们仔细分析了250多万次击球以验证这个预测。

    他们是正确的。不论击球是易还是难,不管离球洞有多远,球员在击标准球(而不是小鸟球)时会更成功。在击标准球(避免超过标准杆数)或击小鸟球时,他们成功概率之间的区别是3.6%。这个区别不算小。老虎伍兹是他们的一个“受试者”。在伍兹成绩最好的那几年里,如果他的小鸟球和标准杆都击得那么好的话,他联赛的平均绩点就会提高1杆,而且他的收入每个季度都会增加100万美元。这些激烈的竞争者当然不会轻视小鸟球,但他们对超过标准杆的规避显然会使他们对当前的任务格外关注。

    对击球的研究说明理论概念的力量可协助思考。谁会认为花几个月的时间去研究击标准球和小鸟球是值得的呢?除了一些经济学家以外,大多数人都不会对损失厌恶的概念感到惊讶。但是,损失厌恶形成了一个精确且非直觉性的假设,还引导研究者得出了一个让所有人都震惊的发现。当然,这里的所有人也包括职业高尔夫球运动员。

    我们为什么不愿意改变现状?

    避免损失的动机和获得收益的动机强度并不对称,这一点在许多情况下都有体现。在商务谈判中,尤其是在对现有合同的重新商谈中、在典型的劳动商议和在贸易或限制军备的国际谈判中,这种不对称是长期存在的一个特征。现有的条款确定了参照点,协议中任何方面拟定的变更都会被看成是一方对另一方作出的让步。损失厌恶会产生一种不对称,使得双方难以达成共识。你对我作出的让步是我的所得,但它们却是你的损失;损失使你产生的痛苦会比它们给我带来的快乐更多。因此,你对这种让步的价值会比我赋予它的价值高。当然,你要求我作出的让步对于我来说也会是这样,你对我作出的让步也不会给予足够的价值评价!对越来越小的蛋糕进行商讨非常困难,因为即使损失,也要将其分配出去。人们在蛋糕越来越大时,显得更随和。

    在讨价还价时,双方交换的信息都是想找到一个参照点并给对方提供一个锚定。这些信息并不都是真实的。商议双方对有些利益(也许是商谈裁军问题时提到的某一特定类型的导弹)假装很在意,尽管他们实际上是将这种利益看成讨价还价的筹码并最终想要将其交换出去。因为商议双方都受互惠原则的影响,一个看似令人痛心的让步就需要对方作出同样使他们痛心(可能这种痛心也是伪装的)的让步。

    所有动物(包括人)都想有所得,但他们会更努力地避免有所失。在这样一个所有动物都想有自己地盘的世界中,这项原则解释了防御者成功的奥秘。一位生物学家观察到,“拥有领地的动物受到对手的挑战时几乎总会获胜—往往就是几秒钟的事“。对于人类来说,同样简单的原则也能解释社会机构的改革问题,公司的”重组“和“调整”行为就是如此,官僚主义的合理化、简化免税代码以及降低医疗费用等方面的努力同样如此。起初我们认为,在改革计划中,总体的提升会产生赢家和输家。如果受影响的一方有某种政治影响力,可能成为输家的人就会变得比赢家更积极、更有决心,结果也会更倾向于输家,也一定会比起初计划的代价更高、作用更小。改革通常包括保护利益相关者的不追溯条款,例如以下情形:劳动力减少是由于(退休、辞职、死亡等原因造成的)人员缩减而不是开除;工资或福利的缩减只会在将来的工人身上施行。损失厌恶是一种强大而保守的力量,它偏爱机构或个人对当前生活的细小改变。这种保守主义做派使得我们在邻里间、婚姻中和工作中保持一个稳定的状态,是引力作用让我们的生命无限靠近参照点。

    商人提价或降低员工工资的行为公平吗?

    理查德·泰勒、杰克·尼奇和我一起在温哥华工作的那一年,我们三人对经济交易中的公平性研究产生了兴趣,这不仅是因为我们对这个话题很感兴趣,还因为我们每周都可以(也可以说是必须)制定一份新的调查问卷。加拿大的渔业及海洋部针对多伦多市失业的专业人员制订了一项计划,他们让这些专业人员负责电话调查,并且会支付他们一些薪酬。这一大群调查者每晚都要工作,因而我们也需要不断为他们供应新的问卷调查。由于杰克·尼奇的原因,我们同意每周设计一份调查问卷,用4种颜色印刷。我们什么都可以问,唯一的一个限定条件是问卷应至少提到一次鱼,这样也好跟渔业及海洋部扯上点儿关系。这项工作进行了几个月,这几个月里我们疯狂地收集数据。

    是什么造成了商人、雇主以及房主的不公平交易行为?我们研究了公众对这一问题的看法。问卷中的首要问题是:因为这种不公平行为招来的骂名是否会使他们追逐利润的行为收敛些?我们的发现是:会。而且我们还发现,公众评估哪家公司也许真的(不)会收敛时所依照的道德原则可以明鉴得失。其基本原则是,当前的工资、价格或租金设定了一个参照点,不可违背这个参照点。有些公司将自身的损失强加给顾客或工人,使自己回到交易参照点,这样做是不公平的,除非这样做是为了保护自身的权利。请思考下面的例子:
    一家五金店一直以15美元的价格出售雪铲。某日下了大雪,第二天早上店主就将雪铲的价格提高到了20美元。

    你认为这种行为:完全公平可以接受不公平很不公平

    按标准的经济行为模式来看,这家五金店的行为是公平的:通过提高价格来回应需求的增加。而调查对象却不这么认为,82%的人选择了不公平或很不公平。他们显然是将大雪前的雪铲价格看成了参照点,而将提升的价格看成是店主强加给顾客的损失,因为这家店并不是不得已才这样做的,而是因为它选择这样做。我们发现公平性的一条基本原则是:不可利用市场的力量将损失强加给他人。下面的例子在另一个情境下(因为这些数据是1984年收集的,所以美元的价值应该调至约100%的通货膨胀状态)说明了这条原则:

    有一家小型复印店,店里只有一位雇员,他在这里工作有6个月了,每小时赚9美元。店里的生意还算景气,但当地一家工厂倒闭了,失业人数上升。现在其他小商店里雇用的可靠员工工资都是每小时7美元,工作量和复印店里那位雇员的工作量相似。之后,这家复印店店主也将其雇员的工资降到了7美元。

    那些调查对象不赞成这种做法,83%的人觉得这种行为不公平或很不公平。然而,略微变动一下这个问题就可以澄清雇主的责任。同样是在高失业率的地区,同样是一家赢利的商店,但情况是:

    现在的雇员辞职了,雇主决定支付新的雇员每小时7美元的工资。

    大多数人(73%)觉得这种行为是可以接受的。这表明雇主并没有支付每小时9美元的道德义务。这种权利是个人的:即使市场允许雇主降低工资,雇员也有权利维持自己的工资。新雇员没有权利以之前雇员的工资作参考,因而雇主可以降低其工资,这样做不应该被看做不公平。

    这家公司有其自身的权利,即保持当前的收益。如果该公司面临损失的危险,也可以将损失转嫁给别人。大多数调查对象认为,在收益下降时降低工资是不公平的。我们称这种原则是公司和与公司有关联的个人之间的典型双向权利。受到威胁时,公司的自私行为可被看做是公平行为。人们甚至认为这家公司连部分损失也不必承担,它完全可以将这种损失转嫁给个人。

    不同的原则制约着公司追求利益或避免利益损失的行为。当公司生产成本低时,公平性原则就不会限制公司将财富分给顾客或雇员。当然,若公司分摊赢利,我们的调查对象就会更喜欢这家公司,并觉得这家公司更公平;若不分摊,他们也不会认为该公司做法失当。他们只会在公司利用权力违背与雇员或顾客间的非正式合同时,或者在公司为自身赢利而将损失强加给别人时才会表现出愤怒。研究经济公平性的学生们不应该去评判公司最应该有的举措,而应该找到区分遭人厌恶、应得到惩罚的行为和可接受的行为之间的分界线。

    在把这篇研究报告提交给《美国经济评论》(American Economic Review)时,我们当时并不是很乐观。我们的文章是对当时经济学家们公认的知识的挑战,即经济行为是受自身利益驱使的,而与是否公平无关。我们的研究依赖于调查结果,而经济学家对此并无多大兴趣。杂志的编辑把我们的文章送给两位经济学家评估,这两位经济学家并没有受到传统观念的束缚(我们后来才知道他们的身份,他们是编辑能找到的最和善的人了)。编辑的做法是明智的。这篇文章如今常被引用,而且其结论也经受住了时间的考验。最近有很多研究都支持这个以参照点为基础的公平性实验的结果,而且这些研究还表明公平性在经济学中是很重要的,关于这一点我们过去曾经怀疑过,但没有得到验证。违背了公平原则的雇主会受到生产力下降的惩罚,标价不合理的商人也会失去一部分销售市场。以较低价格卖出近期以较高价格购进的商品会使这位商人此后从这家商品供应商进货的量减少15%,即每位顾客都会分摊到90美元的损失。顾客显然将低价位看成了参照点,而且由于多付了钱,他们会认为自己也遭受了损失。尽管反应最强烈的顾客是那些以较高价钱买了更多商品的人,而且新价目表中较低的价格增加了产品销量,但按底价购物的那些顾客的损失其实远远超过他们所得的。

    如果认为自己遭遇了不公平的人想反抗,那么这种将损失强加给别人的行为就会有风险。实验表明,不公平行为的旁观者也常会被卷入惩罚当中。神经经济学家(将经济学和大脑研究联系起来进行研究的科学家)使用核磁共振成像仪检测了人们的大脑,这些人惩罚某人对他人做出的不公平行为。令人惊讶的是,利他惩罚会伴有大脑“快乐中心”的活动加强的情形出现。这表明保持社会秩序和公平原则的做法会通过利他惩罚而得到回报。利他惩罚能将这个社会凝聚到一起。然而,我们的大脑在奖赏无私慷慨行为时不能像在惩罚自私吝啬行为时那样实在。我们在这里又发现了得失间的不对称。

    损失厌恶和权利的影响远不只存在于金融交易领域中。法官很快就能看出它们对法律和司法行政的影响。在一项研究中,戴维·科恩(David Cohen)和杰克·尼奇发现,在法律决策中真正的损失和可预测的所得之间有着明显区别。例如,在运输中丢失货物的商人可得到实际损失的赔偿,但损失的利润却不可能得到补偿。90%的财产起诉存有的相似原则也证实了参照点的道德地位。在近期的一场讨论中,埃亚尔·扎米尔(Eyal Zamir)提出了一个颇具挑衅性的论点,即法律对挽回损失和补偿失去的所得之间的区分,也许可以凭借其对个人幸福的不对称影响使自身的行为合理化。如果遭受损失的人比没能赢利的人遭受更大的损失,他们也许应该得到更多的法律保护。

    示例—损失问题“这项改革肯定无法通过。那些必然受损的人会比那些必然获利的人更加强烈地反对这种做法。”“他们都认为对方作出让步时不会感到痛心。当然,他们都错了。这正是损失的不对称性的表现。”“如果他们觉得利益的蛋糕的确在变大,就会发现再次商议更容易。因为他们不是在分配损失,而是在分配所得。”“这儿的租赁价格直线上涨,但房客认为我们不应该提高租金。他们觉得自己有权利享受当前的利益。”“我们的客户对价格上涨并无抱怨,因为他们知道我们的成本也上涨了。他们尊重我赢利的权利。“第29章 对结果可能性的权衡

    对于你要买的汽车、你的女婿或者不确定的形势这样复杂的对象,你会形成一个总体评估,而在作这个评估时,你会对这个对象的特征加以权衡。这么说有些烦琐,简单来讲就是,某些特征比其他特征更容易对你的评估产生影响。这种权衡在发生时你可能意识不到,这是系统1在起作用。评估一辆车时多少会权衡其燃油情况、舒适程度或外观等。评估女婿也多少会考虑他的经济状况、相貌或是否可靠等。同样,对于不确定形势的评估也会权衡其可能出现的结果。权衡时,你肯定会考虑到这些结果的可能性:有50%的概率赢得100万美元当然要比只有1%的概率更吸引人。权衡有时是有意识的,有时是经过深思熟虑的。然而,大多情况下,这些总体评估都是由系统1作出的。

    可能性效应与确定性效应

    在研究决策制定时,我们以打赌为例,效果不错,其中一个原因是打赌是对预期结果加以权衡的一种很自然的方式:结果的可能性越大,就越应该受到关注。一个赌局的预期值即为其结果的平均值,而每个结果又要靠其可能性来权衡。例如,如果“有20%的概率赢得1000美元和有75%的概率赢得100美元”,这种情况的预期值就是275美元。在伯努利开始研究前,赌注是通过其预期值加以评估的。伯努利也使用了这一方法来权衡结果,人们将这一方法称为预期原理,但却将其应用到研究结果的心理价值中去了。在伯努利理论中,打赌的效用是其结果效用的平均值,每个结果都是通过其可能性来加以权衡的。

    预期原理没有正确地描述你对有风险的可能性是怎么想的。若在以下4种情况中,得到100万美元的概率都提升了5%,你认为这个消息给人的感觉是一样的吗?

    A.从零提升到5%。
    B.从5%提升到10%. 
    C.从60%提升到65%。
    D.从95%提升到100%。

    依据预期原理来看,每种情况下你得到100万美元的效用都提升了5%。但这么说与你的经验相符吗?当然不相符。

    大家都知道:从零提升到5%和从95%提升到100%要比从5%提升到10%或从60%提升到65%更具诱惑力。从零提升到5%意味着情况完全转变,从无到有,产生了赢得奖金的希望,这是一种实质性改变;而从5%到10%只是一种数量上的提升,是将赢得奖金的可能性翻倍,但这种情况下的心理价值并没有翻倍;从零到5%的巨大转变表明了“可能性效应”(possibility effect),这一效应会是我们高估那些出现可能性极低的结果的发生频率。大量买彩票的人表明,他们愿意花超出预期价值的钱来换取赢得大奖的渺茫机会。

    从95%提升到100%是另一种实质性改变,也会产生巨大的影响,是“确定性效应”(certainty effect)。那些几乎可以确定会出现的结果受到的重视程度要小于其理应受到的重视程度。为了更好地理解确定性效应,假设你继承了100万美元,但你那同母异父的妹妹不甘心,在法庭上对这份遗嘱提出了质疑。判决结果明天就会出来,你的律师向你保证你赢得官司的概率很大,有95%,但他又煞费苦心地提醒你法律判决并不都是尽如人意的。现在,有个风险调整(校正)公司找到了你,想立即以91万美元与你交易,接不接受是你的事。公司的报价比等待判决的预期价值(95万美元)要少(少了4万美元),但你确定你会拒绝这个提议吗?如果这样的事在你的生活中确确实实发生了,你应该知道“结构性和解”( 结构性和解,又被称为结合式和解(Structured Settlement),是有关赔偿金和解的一种,被告同意在受害原告的有生之年向其分期支付赔偿金。一般包括首期一次总付的赔偿金和将来以年金方式分期支付的赔偿金)这个大产业是以不菲的价格来提供保障的,他们充分利用了确定性效应。

    可能性和确定性在损失研究方面具有同样强大的效应。当心爱的人被推进手术室时,即使截肢的可能性只有5%,也是个噩耗—这个5%的风险带来的痛苦要远大于10%的可能性带来的痛苦的一半。这是由于可能性效应,即我们往往看重轻风险,更愿意花比预期价值更多的钱将其排除掉。在可能性效应中,有95%的可能性会遭受灾难和必然会遭受灾难两者间的心理差别甚至更大;虽然“一切都会没事的”这样的希望很渺茫,但人们却总是将这种希望无限放大。过于看重很小的概率,使得风险和保险政策更具诱惑力。

    结论很明显:与预期原理相反,人们对结果的重视程度和对结果可能性的重视程度不同。可能性效应会重视不大可能的结果,而几乎肯定的结果相对于确定的结果来说,受到的重视程度要小。预期原理通过可能性来判定价值,这是一种不可取的心理。

    然而这个问题却越来越复杂,因为有个有力的论点指出:想变得理性的决策制定者“一定”要遵从预期原理。这也是冯·诺依曼和摩根斯坦恩在1944年提出的公理版效用理论的主要观点。冯·诺依曼和摩根斯坦恩指出,有些不确定结果与可能性并不相符,对这些结果的权衡会导致不一致性和其他恶果。他们由理性选择的公理推出的期望效用理论当时立即就被视为一项重大成果,也使得期望效用理论成为经济和其他社会科学理性模式的核心内容。30年后,阿莫斯带着一种敬畏把他们的研究介绍给我,当时他还向我介绍了一项针对这个理论的著名挑战。

    著名经济学家也难逃阿莱斯悖论的陷阱

    1952年,即冯·诺依曼和摩根斯坦恩的效用理论发表几年后,在巴黎召开的一次大会讨论了风险经济学的问题。很多当时著名的经济学家都参加了这次会议。来自美国的与会者中包括了后来的诺贝尔奖得主保罗·萨缪尔森(Paul Samuelson)、肯尼斯·阿罗(Kenneth Arrow)、米尔顿·费里德曼(Milton Friedman)和统计学界的带头人吉米·萨维奇(Jimmie Savage)等人。

    巴黎大会的一位组织人莫里斯·阿莱斯(Maurice Allais)几年后也获得了诺贝尔奖。阿莱斯准备了几个关于选择的问题来问与会嘉宾。那次大会与本章内容相关的问题就是,阿莱斯想要表明那些嘉宾容易受确定性效应的影响,因此才违背了期望效用理论和该理论所依据的理性选择的公理。以下的一套选择是对阿莱斯构建的难题的简单表示。在问题A和问题B中,你会选择哪一个?

    A. 61%的概率赢得52万美元或者63%的概率赢得50万美元
    B. 98%的概率赢得52万美元或者100%的概率赢得50万美元

    如果你和其他人一样,便会在问题A中偏向前面的选项,在问题B中偏向后面的选项。如果你的确是这样选择的,就说明你犯了逻辑上的错误,并且违背了理性选择的原则。这些齐聚巴黎的著名经济学家在“阿莱斯悖论”中也犯了同样的错误。

    为了弄明白为什么这些选择有问题,我们可以将其看成是从罐子里随意抓取弹珠的游戏,即若罐子里装有100颗弹珠,抽到红色的弹珠就算赢,抽到白色的就算输。在问题A中,几乎所有人都偏向前面的选项,我们可以将其看成左边的罐子,即使里面所含的红弹珠少,赢的概率也小,但奖品的大小比赢得奖品的概率更吸引人。在问题B中,大多数人都选择能确保得50万美元的那个罐子。且人们对自己作的两个选择(即问题A选左边,问题B选右边)都感到很满意,不过在他们了解了问题背后的逻辑之后,就不这么认为了。

    比较一下这两个问题,你会发现问题B中的两个罐子比问题A中的两个罐子更具吸引力,因为问题B的两个罐子中有37个白球替换成能赢的红球了。左边那个罐子的改进明显比右边的大,因为左边的罐子中每个红球都有能使你赢得52万美元的机会,而选右边的罐子只能赢得50万美元。你本会对左手边的罐子感兴趣,毕竟这个罐子作了改进,情况比右手边的好,但是,现在你喜欢的却是右手边的!这个选择的模式没有什么逻辑意义,但却可以从心理上作出解释:确定性效应起了作用。在问题B中,100%的概率和98%的概率之间虽然就差两个百分点,但相比于问题A中63%和61%之间相差的两个百分点来说,这个差距的影响则要大得多。

    正如阿莱斯所预测的那样,那些经验老到的与会者并没有注意到自己的偏向已经违反了效用理论,直到大会快结束了他们才注意到这个事实。阿莱斯本想向外界公布这个情况,制造一条爆炸性新闻:那些世界上顶尖的决策理论学家也存在偏好,这种偏好和他们自己对理性的见解完全背道而驰!阿莱斯显然相信众位来宾会接受劝说,放弃那种他蔑称为“美国式”的分析方法,转而采取另一种由他提出的选择逻辑。不过,当时的情况令他极为失望。

    那些对决策理论不是很热衷的经济学家大都忽视了阿莱斯提到的问题。当某个为人们广泛采纳并被认为非常有用的理论遭到挑战时,都会出现类似的情况:他们将阿莱斯提出的这个问题视为非常规问题,仍旧使用期望效用理论来解决这一问题,就像什么事都没发生过一样。相反,那些决策理论专家—包括统计学家、经济学家、哲学家和心理学家等各路高人在内—对阿莱斯的挑战却非常重视。在阿莫斯和我开始我们的工作时,我们的初衷就是对阿莱斯悖论给出令人满意的心理学解释。

    大多数决策理论家—当然也包括阿莱斯在内—坚定地相信人类的理性,他们还试图改变理性选择的规则以使阿莱斯模式可以为人们所接受。过去这些年中,他们为找到一个似乎合理的理由来解释确定性效用一直在进行各种各样的尝试,但所有的理由都无法令人信服。阿莫斯对这些人的努力几乎失去了耐心,他将那些试图使违背效用理论做法合理化的理论家称为“为举措失当的人辩护的律师”。我们没有步他们的后尘。我们将效用理论看成是理性选择的逻辑基础,但并不认为人们都是非常棒的理性选择者。我们承担了一项建立一种心理学理论的任务,不管人们作出的选择是否是理性的,这一理论要能够对其进行描述。在前景理论中,决策的权重和可能性的权重不可同日而语。

    决策权重的大小取决于人们的担忧程度

    在我们发表前景理论多年以后,阿莫斯和我进行了一项研究,在这项研究中,我们衡量了决策权重,这个权重解释了人们在打赌时为什么会选择保守的赌注。下面的表格显示的是对所得的评估信息。

    (%)可能性——决策权重

                      0 ——0

                      1 ——5.5

                      2 ——8.1

                      5 ——13.2

                     10——18.6

                     20——26.1

                     50——42.1

                     80——60.1

                     90——71.2

                     95——79.3

                     98——87.1

                     99——91.2

                    100——100

    你会发现,在极端情况下,决策权重和相应的可能性是相同的:当结果不可能出现时,两者都是零;当结果肯定会出现时,两者都是100。但是,在这些点附近,决策权重却明显与可能性拉开了距离。在距离最远处,我们发现了可能性效应:不可能出现的事往往受到重视。例如,相对于可能性为2%的决策权重是8.1。如果人们遵从理性选择的公理,决策权重将会是2—罕见事件被过分看重了。因此对罕见事件偏重的程度增加了4倍。可能性范围右端的确定性效应更显著。“无法”得奖的2%的风险使得风险效用从100降低到87.1,降低了13%。

    想要理解可能性效应和确定性效应之间的不对称性,先假设你有1%的概率能赢得100万美元,明天就会揭晓结果。现在,再假设你几乎确定自己能赢得100万美元,但还是有1%的可能性赢不了,同样是明天揭晓结果。第二种情况中的焦虑情绪显然比第一种情况下的期望心理更明显。如果结果是手术失败而不是钱财得失,确定性效应就要比可能性效应更显著。与对1%的风险的担忧相比,你对一项成功希望渺茫的手术(这项手术几乎可以确定会致命)的关注程度又如何呢?

    在可能性变化范围的两端,确定性效应和可能性效应的双重作用不可避免地会伴随着对中间概率不够敏感的情形出现。从上表中可以看出,从5%到95%之间的可能性和范围更小的决策权重(从13.2到79.3)之间密切相关,约占理性期望的2/3。神经科学家已经证实了这些观察结果,发现了对得奖可能性的不同变化做出反应的大脑区域。大脑对可能性变化的反应和从选择中估测出来的决策权重惊人地相似。

    极小或极大的可能性(低于1%或高于99%)都是特殊的情况。权衡极罕见的情况是很难的,因为这些情况常常会被彻底忽视,事实上人们赋予它们的决策权重为零。另一方面,在没有忽视这些罕见的情况时,你肯定又会过于重视它们。大多数人很少有时间去关心核能外泄问题,也几乎不会幻想从素未谋面的亲戚那里继承到大笔遗产。然而,当不大可能出现的事情成为关注的焦点时,我们对它的重视程度就要超过其本身出现的概率应该引起的关注度。此外,人们对于可能性较小的各种风险几乎完全是迟钝的。人们很难说出0.001%的癌症风险与0.000 01%的癌症风险之间的区别,尽管前者是指美国人口中有3 000人罹患癌症,而后者则说明只有30个美国人患癌症。

    当你关注某种威胁时,你就会担忧,而且决策权重会反映出你的担忧程度。根据可能性效应,这种担忧和威胁出现的可能性并不相符。仅仅减少或降低风险还不够;若想消除这种忧虑,必须将其出现的可能性降低为零。

    下面的问题改编自对消费者评估健康风险时所体现的理性的研究。1980年,一个由经济学家组成的团队公布了这项研究,并把调查结果交给了小孩子的家长们。

    假设你正在使用一种杀虫剂,每瓶要10美元,每使用10000瓶杀虫剂就可使15个人吸入中毒和15个孩子中毒。

    你了解到有一种更昂贵的杀虫剂,它可使以上两种风险降低,即每使用10000瓶出现上述两种风险的人数分别为5人。你愿意花多少钱买这瓶杀虫剂呢?

    这些父母愿意多花平均2.38美元的钱来降低2/3的风险(从15/10 000降低到5/10 000)。他们愿意花8.09美元去完全排除风险,这个价钱是2.38美元的3倍多。其他的问题表明这些父母将这两种风险(吸入中毒和儿童中毒)视为不同的烦恼,只要能完全消除其中任何一种风险,他们都愿意支付一定数额的钱。这个数额与担忧的心理很吻合,但和理性模式并不相符。

    四重模式:可能性与决策权重的关系模型

    阿莫斯和我在研究前景理论时,很快就得出了两个结论:相对于现有财富来说,人们更看重得失,而且关于结果的可能性和决策权重方面,表现大不相同。这并不是全新的观点,但它们一旦结合起来,就可以对一种偏好的特殊模式作出解释,我们将这一特殊模式称为四重模式。名字是固定的,具体阐述如下。

    图13

    ·每栏中的第一行都对前景作了解释。

    ·第二行对前景引起的情绪作了特征描述。

    ·第三行表明,在风险和与期望价值相符合的必然获得(或损失)之间作选择时(例如在“有95%的概率赢得10000美元”和“肯定能赢得9500美元”之间作出选择),大多数人是如何表现的。

    ·第四行描述了在被告和原告讨论民事案件的解决方法时可能会出现的态度。

    偏好的“四重模式”被视为前景理论的核心成果之一。上面四栏中有三栏是相似的;只有第四个(右上角)是新的,是完全出乎意料的。

    ·左上角一栏是伯努利曾讨论过的:当人们觉得未来获得一大笔收益的概率很大时,会选择风险规避。人们在打赌时愿意接受比预期价值少的赌注,以确保肯定能有所得。

    ·左下角一栏的可能性效应解释了为什么人们都愿意买彩票。若头彩很大,人们会疯狂地买,会忽视赢的概率很小这一事实。买彩票是可能性效应最好的例子。没有彩票,就不能赢,有了彩票就有了机会,概率小不小并不重要。彩票能获得的东西要比赢得的概率更重要,梦想赢是人们的权利。

    ·右下角一栏说明了什么时候应该买保险。人们愿意支付比期待价值更高的价格去买保险,保险公司就是这样支付成本、获得利益的。有些灾难不太可能发生,但人们更愿意买个保障。他们消除了自己的忧虑,买个心里踏实。

    刚开始时,右上角那一栏的内容着实让我们惊讶了一番。除了左下角那栏,其他几栏都会让我们习惯性地想到风险规避,而在左下角一栏的情况中,人们往往会选择碰运气。在审视自己的选择是否错误的时候,我们在处于损失的情况下会选择冒险;处于赢利的情况下会选择规避。我们不是用负面前景的观点观察研究冒险的开先河者—至少有两位作者曾经提到这一事实,但他们的讲述不是很详尽。不过我们对冒险的研究有个理论框架作支撑,这样研究就会更容易些,这也是我们思想发展的里程碑。我们已经找到两点来解释这个效应了。

    第一,敏感性不断降低。人们对损失900美元的反应比损失1000美元的90%的反应程度更强烈,这也说明了为什么人们会避免必然的损失。第二个原因也许更有说服力:90%这一可能性的相应决策权重只有71,比可能性小很多。出现这种情况的结果是,当你在必然的损失和很可能会承受很大损失之间做决策时,降低敏感度可使你更愿意规避必然的损失,而且确定性效应也降低了对赌注的规避。这两个相同的因素,在结果是正面时,加强了确定性事件的吸引力,使赌注的吸引力得以削弱。

    价值函数和决策权重的曲线共同促成了图13中首行所描述的模式。然而,在底行描述的模式中,这两个因素却背道而驰:降低敏感度会使得你在所得面前选择规避,在损失面前选择冒险,但对较小可能性的过分看重则会战胜这种效应,产生我们前面所观察到的那种模式,即为收益愿冒风险,对损失保持谨慎。

    人类的很多不幸处境都在右上角那栏中得到了体现,也就是说人们在面临的抉择比较糟糕时会孤注一掷,尽管希望渺茫,他们也宁愿选择使事情更糟的较大可能性以换取避免损失的希望,这种做法常会使可控制的失误变成灾难。一想到即将会有一大笔损失就很痛苦,完全的解脱也很吸引人,因而我们难以做出明智的决策,难以相信时间可以使人摆脱损失所带来的痛苦。这也正是那些屈从于高科技的企业浪费了自己的剩余资产却什么也没有得到的原因。失败总是难以让人接受,所以失败的一方常会保持战斗力,即使在知道对方的胜利只是时间问题的情况下,输的这一方还是会作无谓的挣扎。

    可能性效应影响下的风险决策

    法学家克里斯·格思里(Chris Guthrie)将四重模式应用到两种情况中,在这两种情况中,民事诉讼的原告和被告都认为这一模式可能会解决双方存在的问题。这两种情况在原告案例中体现的强度有所不同。

    就像我们之前看到的情况那样,假设你是一起民事诉讼案件中的原告,你要求一大笔损失赔偿。这个案件进行得非常顺利,你的律师给出了他的专业见解,说你有95%的概率会赢,但也不能掉以轻心,“在陪审团出庭前,你永远都不会知道结果”。你的律师劝你接受庭外调解,但你只能得到90%的赔偿金。你正处于四重模式左上角的一栏中,你脑中的问题是:“即便什么也得不到的概率不算大,可我真的愿意冒险打官司吗?即便得到90%的赔偿金也是一大笔钱了,而且我又能马上拿走。”这种情景引发了两种情绪,而且两种情绪都向相同的方向发展:对必然所得(一大笔钱)的渴望以及拒绝庭外和解又输了官司的极度失望与后悔。你能感受到在这种情况下,有种压力使人们的行为更谨慎。若原告打赢官司的可能性很大,则更趋向于风险规避。

    现在从被告的角度审视一下这个案件。尽管为了自己的利益没有完全放弃决策的希望,但你会发觉这个案件的进展非常糟糕。原告的律师提出庭外和解,即只需提供给原告所要赔偿金的90%(显然原告不会接受更少的金额)。你会接受这种解决方案吗?还是更愿意打官司?要记住你遭受损失的可能性较大,情况属于右上角一栏。你希望能再搏一搏,因为庭外和解与你将要面对的最糟结果几乎同样令你痛苦,而且毕竟打赢官司的希望还是有的。于是,两种情绪再一次被唤起:人们不愿面对必然的损失,而且能在法庭上赢的可能性还是很有吸引力的。案件前景不乐观的被告更愿意采取冒险手段,更愿为打赌作好准备,而不是接受对自己不利的解决方案。在规避风险的原告和冒险的被告的对峙中,被告有更多的掌控机会。被告更高的谈判地位应该反映在协议解决中,原告则满足于能通过法庭获得更少的钱。通过四重模式作出预测的模式已经由法律系的学生和执业法官所做的实验和民事案件中的实际谈判证实了。

    若原告胜算不大却索赔一大笔钱的话,请思考一下“无意义诉讼”问题。双方都意识到可能性的大小,也都知道在商讨解决方案时,原告只能得到索赔的一小部分。商谈是受最下面一行中那个四重模式引导的。原告的情况属于左侧的类型,赢得一大笔钱的概率很小。无意义诉讼的索赔就像是买一张会中大奖的彩票一样。过分看重成功的较小概率在这种情况下是很自然的,原告也会在商谈中变得厚颜无耻或咄咄逼人。对于被告来说,起诉是件很烦人的事,但结果不好的风险很小。有些损失虽大,但概率较小,过分看重这样的损失会导致风险规避,而且选择用合适的索赔解决这个案子就像是买了份保险,以防判决对自己不利。现在换一个角度:原告愿意赌一次,而被告想要保险之策。作出无意义诉讼的原告很可能会接受一个比这个案件应该付出的钱更多的解决方法。

    这些通过四重模式来描述的决策并非不合理。你可以在每种情况下都体会一下原告和被告的心情,这些心情会使得他们采取或挑战或顺从的立场。然而,从长远角度来看,期望值的偏差代价可能会很大。试想一个大型组织,比如纽约市,它每年要处理200起“无意义”案件,每个案件都有5%的可能花掉这个城市的100万美元。再假设:对于每个案件,这个城市都能用10美元解决。这个城市认为有两种政策能用于所有的案件,即自己解决或法庭上见。(为了方便起见,我在此忽略了诉讼费。)

    ·如果这个城市同意受理200起诉讼案件,就会输掉10起,总计损失达1000万美元。
    ·如果这个城市处理每个案件都要花10万美元,那么总共的损失就会高达2000万美元。

    若要对相似的决策从长计议的话,你就可以看到,支付额外费用以避免不大可能出现的大笔损失代价就太高昂了。相似的分析适用于四重模式中的任何一栏:从长远来看,期望值的系统偏差的代价还是很高的—这个原则适用于风险规避和冒险之举。一贯看重不大可能会出现的结果—这也是直觉性决策制定的一个特征—最终会导致不好的结果出现。

    示例—四重模式“他试图用庭外和解的手段来解决这个无意义的诉讼案件,以避免损失,然而却不大可能。这是过分看重较小可能性的结果。既然会面对很多相似的问题,他最好还是不要放弃。”“我们从不在最后一秒才享受自己的假期,我们愿意为了确定性而付出努力。”“只要有可能不赚不赔,损失就不会减少。这就是损失中的冒险。”“他们知道瓦斯爆炸的可能性很小,但他们想要消除这种可能性。这是可能性效应,而且他们想要的是再无后患。”

    第30章 被过分关注的罕见事件

    在以色列巴士遭遇自杀式炸弹袭击相对频繁的那段期间,我去了那里几趟。当然,如果按绝对值计算的话,这样的袭击是相当罕见的。2001年12月至2004年9月,以色列总共发生了23起炸弹袭击事件,造成236人死亡。而在这期间,以色列境内每天乘巴士的人大约有130万。对于每一位乘客来说,遭遇袭击的概率是极小的,但人们并不这样认为,大家都尽量不乘巴士,而不得不乘巴士的人则会焦虑地扫视邻座乘客的行李或其宽松的衣服,害怕里面藏有炸弹。

    我在以色列开的都是租来的车,很少乘巴士,但即便如此,也受到了炸弹袭击的影响,这着实令我懊恼。在等红灯时,我不愿停在巴士旁,绿灯一亮,我会用比平时更快的速度将车开离。为此,我感到很惭愧,因为我比其他人更清楚遇袭的概率其实很小。遇袭的风险真的可以被忽略掉,但其对我行为的影响使这个极小的概率有了极大的决策权重。实际上,与把车停在巴士旁(而遭遇爆炸事件的概率)相比,我更有可能在车祸中受伤。但并不是出于对活命的理性考虑我才躲避巴士,而是当时的体验驱使我这样做:在巴士旁边停车使我联想到了炸弹,而且这些想法令我很不愉快。我躲避巴士是因为我想要思考别的事。

    我的经历说明了恐怖主义是如何产生影响的,也解释了为什么人们这么害怕恐怖主义:因为它降低了效用层叠。极其生动的死亡或爆炸画面的影响因媒体的关注以及人们的频繁交谈而不断加强,在身处具体的情境时,尤其如此,例如看见了一辆巴士时。此类情绪一触即发、身不由己且无法控制,会使人们本能地想要保护自己。系统2可能“知道”发生危险的概率很小,但即使知道也无法消除人们内心的不安和躲避危险的冲动。我们无法停止系统1的运行。情绪的紧张程度不仅和概率不相符,对概率的估测也不够敏感。假设有两座城市都被警告有自杀式炸弹袭击者出没,其中一座城市的居民被告知有两名袭击者准备袭击该城市,而另一个城市的居民被告知只有一名袭击者。后一座城市的风险降低了一半,但那里的人们会感到更安全吗?

    纽约市有很多商店都卖彩票,生意也不错。其实,中彩票大奖的心理与对恐怖主义事件抱持的心理是类似的。能赢大奖必然令人激动,整个社区也会为之兴奋,而且人们在工作场合和家里聊到此事时,会更兴奋。买彩票之后会有一种愉快的幻想,就像躲避巴士之后恐惧会减轻一样。这两个例子的实际发生概率其实都非常小,人们更在意的是可能性。人们对前景理论的最初构想包括这样的观点:“罕见事件不是被忽视就是被过度重视。”不过,这个说法并没有详细说明在什么情况下事件会被忽视,什么情况下会被过度重视,也没有从心理学上对此作出解释。对决策制定过程中情感和生动性作用的最新研究影响了我对决策权重的看法。过高权衡不太可能的结果是系统1的特点,我们对此已经很熟悉了。情感和生动性会影响顺畅性、可得性以及对概率的判断—因此也就解释了人们为什么过分关注那些没有被自己忽略掉的罕见事件。

    你认为一支三流球队获得NBA总冠军的可能性有多大?
    你认为下一届美国总统是第三党派候选人的概率有多大?
    如果下一届美国总统是第三党派候选人,你会得到1000美元;如果不是的话,你将一分钱也得不到。你准备下多大的赌注?

    这两个问题虽不同,但明显有关联。第一题要求你评估罕见事件的概率,第二题想让你通过下赌注来权衡第一题那件事的决策权重。

    人们是怎样作出判断,怎样确定决策权重的呢?让我们先来看两个简化的回答,然后再对答案进行证实。以下就是这两个十分简单的答案:

    ·人们高估了罕见事件的概率。

    ·人们在做决策时过高权衡了罕见事件。

    尽管过高估计和过高权衡是两个不同的现象,却有着同样的心理机制,即集中注意力、证实性偏差以及认知放松。

    明确的描述激发了系统1的联想机制。当你想到第三党派候选人胜出的可能性不大时,你的联想机制会像平时那样在验证性模式下工作,会有选择地提取使表述正确的信息、事例以及画面。这个过程有偏见存在,但并不是在幻想下进行的。你寻找的是符合现实条件制约的可能情况,你不会天真地想象是“西方的仙女”任命了一位第三党派的总统。你对概率的判断最终总是由认知放松或顺畅性决定的,因此你的脑海中总会出现貌似正确的情形。

    你并不总是关注要求你作出评估的事件。如果目标事件发生的可能性很大,你就会关注这个事件的其他可能性。请思考下面这个例子:

    在你们当地医院里出生的新生儿在3天内就出院的概率有多大?

    你现在要估测婴儿出院回家的概率,但你肯定会关注造成婴儿不能在正常期间出院的事件。我们的大脑有个有用的机能,它会不由自主地去关注奇怪、不同或是不寻常的事。你很快就会意识到,在美国(不是所有国家都设有同样的标准),婴儿于分娩后的两三天出院是很正常的。所以,你将注意力转移到反常的情况上去了。罕见事件成了焦点,这些事件很可能唤起可得性启发模式:你的判断可能由你所制造的许多医疗问题的发生场景以及想起这些问题时的感受决定。因为你处于确定性模式下,你对医疗问题出现频率的估计很有可能会非常高。

    当某件事的其他可能不太明确的时候,罕见事件的概率就很容易被高估。我常爱引用的一个例子是心理学家克雷格·福克斯(Craig Fox)的一项研究。开始这项研究的时候,他还是阿莫斯的学生。福克斯召集了一些职业篮球赛的球迷并引出了几个关于NBA季后赛冠军的判断与决策。他特别要求受试者分别估计参与季后赛的8支篮球队取得最后胜利的概率。因此,每支球队的胜利都成了焦点事件。

    你肯定可以猜到发生了什么,但福克斯所观察到的影响程度可能会令你感到惊讶。假设某个球迷被要求去估计芝加哥公牛队赢得联赛的概率。此时焦点事件已经确定,但其他情况—其他7支球队中的某支球队赢得比赛—往往会被忽略。球迷在肯定性模式下的记忆和想象都在努力构建公牛队胜利的情况。还是这个受试者,在被问到湖人队的胜算时,相同的选择性激活又会偏向支持湖人队。这8支美国最好的职业篮球球队都很优秀,所以设想其中一支相对较弱的球队成为冠军也是有可能的。结果是:把相继对这8支球队进行判断的概率相加,得到了240%!这样的结果当然是荒谬的,因为这8支球队的胜算相加结果应该是100%.当裁判被问到冠军是出自西部联盟还是东部联盟时,这种荒谬就不存在了。因为在这个问题中,焦点事件及其他情况同样详细,他们判断的概率相加就是100%。

    在评估决策权重时,福克斯请了球迷对联赛结果下注。他们对每个赌局都标明了金额(金额大小与赌局的风险大小相匹配)。赢得赌局的人可获得160美元。而这8支球队的现金标价总额为287美元。也就是说,如果某个受试者对8支球队都下了注,他肯定会损失127美元!受试者肯定知道联赛有8支球队,对8支球队都下注的平均回报不可能超过160美元,尽管如此,他们还是过高地估计了结果的可能性。球迷不仅高估了他们所关注的事件的可能性,还更愿意对它们下注。

    这些发现对规划谬误以及其他乐观主义的表现形式作出了新的阐述。当某个人努力预测某个方案的结果时,就可以切实且轻松地成功执行某项方案。相反,失败的可能性则会被忽略,因为事情出问题的情况错综复杂。对自己职业前景进行评估的那些企业家与投资者很容易高估自己的机会,也喜欢过高权衡自己的估值。

    画面感越强,决策权重越大

    正如我们所看到的那样,前景理论与效用理论的不同体现在概率与决策权重的关系上。在效用理论中,概率与决策权重是相同的。对已经确定的事情的决策权重是100,某件事有90%的概率,说明人们对这件事的决策权重是90,是概率为10%的事件的决策权重的9倍。在前景理论中,各种概率对决策权重的影响较小。我早前提到的一项实验发现,概率为90%的事件的决策权重是71.2;概率为10%的事件的决策权重是18.6。两个概率的比率是9,但其决策权重的比率只有3.83,这说明在那个范围内人们对概率的敏感度不够。在这两个理论中,决策权重只依赖于概率,与结果无关。两种理论都认为,概率为90%的事件的决策权重与赢得100美元、收到一束玫瑰花或是遭到一次电击的权重相同。这个理论预测后来被证实是错误的。

    芝加哥大学的心理学家们发表了一篇文章—《钱、吻与电击:对待风险的情感心理》,他们发现,人们评估风险时,如果(假想的)结果与情感相关(“碰见了你最爱的明星并亲了他一下”或“遭受了一次疼痛但没有危险的电击”),这种评估对概率的敏感度要低于有关金钱得失的结果。这并不是一个孤立的发现。通过生理检测(比如心跳)的手段,其他研究者发现,对将要遭受的电击的恐惧与遭到电击的概率从本质上说是毫不相关的。仅仅是电击的可能性便会让人心生恐惧。芝加哥的这个团队提出“满溢意象”(affect-laden imagery)完全盖过了对可能性的回应。10年后,普林斯顿大学一个心理学家团队对这个结论发起了挑战。

    普林斯顿的这个团队说,他们已经观察到人们对与情感相关的结果的出现概率的敏感度很低,这种情况很正常。赌钱属于例外情况。赌钱时,人们对概率的敏感度相对较高,因为他们有确切的预期值。

    下面两个赌局的吸引力与多少现金的吸引力是等价的?
    A.有84%的概率赢得59美元。
    B.有84%的概率赢得一束装在玻璃瓶里的玫瑰花。

    你注意到了什么?其中显著的不同在于A问题比B问题更为简单。你不用停下来去估算这个赌金的预期值,就能很快知道其价值在50美元左右(事实上其价值为49.56美元),在你寻找一个具有同样吸引力的现金等价物时,这个大概的估算已足以提供一个有帮助的锚定。问题B却不存在这样的锚定,因此也就更难回答。调查对象还对两个赌局的等价现金进行了评估,认为同时赢得两个赌局中的等价现金的概率为21%。不出所料,高概率的赌博与低概率的赌博之间的不同在于,进行高概率赌博的人更可能是为了金钱,而不会是为了玫瑰。

    普林斯顿团队认为,对概率不敏感并非因为情绪原因。为了支持这个观点,他们比较了人们花钱避开风险的意愿:

    利用某个周末粉刷某人的三居室公寓的概率为21%(或84%)。

    打扫使用了一周的一座公寓厕所中的三个小隔间的概率为21%(或84%)。

    第二个结果肯定比第一个更能引发情感,但这两个结果的决策权重并无不同。显然,情感强烈程度不会影响概率。

    另一个实验产生了一个惊人的结果。在这个实验中,受试者得到了奖品的明确价格以及文字描述信息。例如:

    有84%的概率可以赢得一束装在玻璃花瓶里的玫瑰花,价值59美元。

    有21%的概率可以赢得一束装在玻璃花瓶里的玫瑰花,价值59美元。

    对这些赌注预期的货币价值进行评估很简单,但增加一个具体的货币价值并不会改变其结果:即使在那样的情况下,评估依然对概率不敏感。想到奖品是玫瑰花的人不会将奖品信息作为评估风险的锚定。正如科学家有时说的那样,这是一个令人惊喜的发现,它想告诉我们一些事情。那么,现在这个实验想要告诉我们什么呢?

    我认为,这种说法体现了结果的丰富性和生动性,无论结果是否会激发情感,它都会降低概率在评估不确定的前景时本应起到的作用。这个假设提出了一种预测(我对这一预测信心满满):若对货币形式的结果附上毫不关联但却非常生动的细节描述,同样也会影响估算结果。比较一下你对下面这些结果的现金等价物的估值:

    有21%(或84%)的概率在下个周一收到59美元。

    有21%(或84%)的概率在下个周一上午收到一个内含59美元的蓝色大信封。

    新的假设为,在第二个案例中,对概率的敏感度会更低,因为与“一笔钱”这个抽象的概念相比,蓝色信封能唤起更为丰富的想象。你在脑中构建这个事件时,即使知道赢的概率很小,但奖品的生动画面仍然会浮现出来。认知放松同样也对确定性效应产生了影响:当你脑海中闪现关于某个事件生动的画面时,这个事件不发生的可能性所带来的影响同样也很生动,因此就会被过度权衡。增强的可能性效应与增强的确定性效应相结合以后,决策权重很难在21%的概率和84%的概率之间发生改变。

    对风险的表述方式不同,所做决策可能截然相反

    顺畅性、生动性以及想象的轻松程度等因素会影响决策权重,这个观点已得到许多其他观察实验的支持。一个著名的实验要求受试者从两个罐子中选一个,从里面拿球,若拿到红球,则有奖励:

    A罐中有10个球,其中有1个是红色的。

    B罐中有100个球,其中有8个是红色的。

    你会选哪个罐子呢?因为选A罐的胜算是10%,选B罐是8%,所以作出正确选择应该不难,但实际并非如此:大约有30%~40%的学生选择了红球数量较多的那个罐子,而不是胜算率高的那一个。希莫·爱泼斯坦(Seymour Epstein)说,这个结果说明的是系统1(他称为经验系统)表面的运作特点。

    正如你可能想到的那样,人们在这种情况下作出的愚蠢选择已经引起众多研究者的关注。他们对这种偏见也有不同的命名,而我使用的是保罗。斯洛维克的命名“分母忽视”。如果你将注意力集中在能使你胜利的球上,就不会去关注那些不能使你赢的球。生动的画面也是产生分母忽视的原因,至少我有过这样的经历。当我想到小罐子时,我看到的是一个小红球在一片白色的背景中;当我想到大罐子时,我看到的是8个红球在一堆白球当中,这样的画面增强了我对胜利的信心。能使我胜利的生动画面增强了我对那个事件的决策权重,增强了可能性效应。当然,对确定性效应来说也是同样原理。如果我有90%的概率赢得奖品,那么相较于10个球中有一种“不能制胜”的情况而言,100个球中那10个“不能制胜”的球更会突出输的可能性。

    分母忽视这个观点有助于解释为什么不同的风险表达方式所造成的效果会有这么大的不同。如果你看到“能使儿童免受某种疾病侵袭的疫苗有0.001%的风险将导致终身瘫痪”这样的说法时,就会觉得这个风险看似很小。现在,请考虑用另外的方式描述这一风险:“在10万名接种疫苗的儿童中,有一个将会终身瘫痪。”第二种说法使你产生了一些第一个说法不会引起的想法:它唤起了某个儿童因接种疫苗而终身瘫痪的画面;而另外99999名安全接种疫苗的儿童则被完全忽视了。正如分母忽视原则预测的那样,与抽象术语相比,例如“风险”或是“概率”(多大可能),用相对频率(有多少)来描述会使小概率事件得到更大的权重。我们已经知道系统1更善于处理独立事件,而不是整个范畴的事件。

    频率格式(frequency format)的影响很大。在一项研究中,看到“每10 000个人中有1 286人因某种疾病而死亡“的人比看到”某种疾病导致24.14%的人口死亡“的人更有可能认为此疾病的危害性很大。尽管患第一种疾病的风险只是第二种的一半,但第一种却看似比第二种更危险!在一个更为直接的分母忽视的例子中,某种疾病会“使100人中的24.4人死亡”,与之相比,“每10 000人中有1 286人因某种疾病而死亡“这种说法听上去更危险。若要求受试者对这两种表述作一个直接的对比(系统2肯定会参与到这个任务当中),这种效果肯定会削弱或是消除。然而,生活就像是受试者的组间实验,你一次只能看到一种表述。系统2只有在格外活跃的情况下才会对你看到的那个说法有另外的表述,才会发现这些说法能引发不同的回应。

    有经验的法庭心理学家和精神病学家也不能避免因对风险的不同表述而带来的影响。在一个实验中,有关专业人员需评估让一位精神病患者出院的安全性。这个精神病患者叫琼斯,有暴力倾向。他们收到的信息包括某位专家对风险的评估,但同样的统计数据是用两种方式表述出来的:

    评估那些与琼斯类似的病人,专家发现他们在出院后最初的几个月里对他人使用暴力的概率是10%。在100个类似琼斯的病人中,大约有10个人在出院后的前几个月里对他人使用暴力。

    看到第一种描述的专业人员让病人出院的概率几乎是看到第二种描述的专业人员的2倍(概率分别为41%和21%)。对相同的可能性,更加生动的描述产生了更高的决策权重。

    不同的表述使人们做出不同的决策,使他们对该怎么做生成不同的意见。斯洛维克与他的同事引用了某篇文章的一段话:“一年之中,全美有接近1 000起谋杀事件是由没有服用药物的严重精神病患者制造的。“有一种表达同一事实的说法是”每年每2.73亿美国人中,有1000人是被精神病患者杀死的“。另外一种说法是,”每年,(我们)被这样(患有精神病)的人杀死的概率接近0.000 36%“。还有一种说法是:”每年死于严重精神病患者之手的美国人有1 000人,比自杀人数的1/30还少,是因喉癌而死亡的人数的1/4左右。“斯洛维克指出,”这些说法使得他们的动机很明显,他们想要通过强调精神病患者的暴力来造成大众恐慌,进而使有关部门增加心理卫生服务业的资金注入“。

    如果一名优秀的律师想要引起法官对DNA证据的怀疑,他不会说,“DNA不匹配的概率是0.1%”,反而会说“1 000起死刑案件中就有一起案件的DNA会出现不匹配”,这样更有可能使法官产生怀疑。听到这个陈述的陪审团会想到坐在他们对面审判室里的人可能会因为错误的DNA证据而被误判。当然,检察官会更偏爱抽象框架,希望陪审团的大脑中充满小数点。

    罕见事件又为何会被人忽视?

    有证据支持下面这个假设:主要注意力和显著性会导致人们过高评估罕见事件的发生概率,也会过高权衡低概率的结果。单纯提及某个事件,通过对其进行生动性以及特有的概率描述模式就会增强其显著性。当然也有例外情况,即人们对某一事件的关注并没有提高它的出现概率:那些含有一个荒谬的论调使你想起它就觉得不可能发生的事件,或是因不能想象结果会怎样而使你认为它根本不会发生的事件都属于此类事件。对显著事件的过高估计或过度权衡这种偏见不是绝对的规则,但其影响却很普遍,也是根深蒂固的。近年来,对“根据经验作出选择”这一课题的研究引起了人们的广泛兴趣,其遵循的原则与前景理论中分析的“根据描述作出选择”的研究原则不同。在一个典型实验中,受试者面前有两个按钮。按下按钮有可能会得到金钱奖赏,也有可能什么都得不到。结果是根据前景理论随机出现的(例如,“有5%的概率赢得12美元”或“有95%的概率赢得1美元”)。这个过程是真正随机的,所以不能保证某位受试者所见的样本完全符合统计设置。这两个按钮的预期值几乎是相当的,其中一个比另一个风险更大、更多变(例如,一个按钮的结果可能是有5%的概率得到10美元,另一个按钮则是有50%的概率得到1美元)。通过为受试者提供多次按按钮的机会,使她可以观察到一次又一次按按钮后的结果,这样她就能够凭经验作出选择。通过描述性文字作选择可通过给受试者提供关于每个按钮的预期风险的文字描述(例如“5%的概率赢得12美元”),并让她选择其中一个来实现。根据前景理论可知,通过描述性文字作选择会产生可能性效应—低概率结果的可能性被过高权衡。与之形成鲜明对比的是,凭经验作选择不会出现过高权衡的情况,而较低权衡的情况却较为普遍。

    凭经验作选择的实验情景旨在代表许多情境,在这些情境中,我们会接触到来源相同结果却各不相同的许多情况。一间较普通的餐厅会偶尔做出一道超级美味或很难吃的菜。你的朋友通常很好相处,但有时也会变得喜怒无常、咄咄逼人。加州容易发生地震,但实际却很少发生。许多实验的结果表明,当我们做类似于选择餐厅或是固定好水壶以应对地震这样的决策时,罕见事件不会被过高权衡。

    现在仍然没有能够阐释凭经验选择的方法,但无论在实验中还是在现实世界里,大家都普遍认同一点,即对罕见事件的决策权重较低有一个绝对主要的原因:许多受试者从未经历过罕见事件!大多数加州的市民从未体验过大地震,2007年时也没有银行家切身经历过大规模的金融危机。拉尔夫·赫特维希(Ralph Hertwig)和伊多·伊雷夫(Ido Erev)注意到“根据它们的主观可能性,罕见事件的概率(例如房贷泡沫破灭)受到的影响比它们应得的影响更小”。他们指出,公众对长期威胁的回应很冷淡就是这样一个例子。

    这些关于忽略的例子很重要,也很好解释,但当人们真正经历罕见事件时,低权重的情况也会出现。假设你有一个复杂的问题,与你同楼层的两个同事可能会回答这个问题。你认识他们俩很多年了,也有很多机会观察或是在接触中了解他们的个性。阿黛尔做事持之以恒,也乐于助人,尽管有时也帮倒忙;布莱恩并不特别友好,和阿黛尔一样爱帮助人,但有时候又表现得过于热情。你会找谁帮忙?

    考虑关于这个决定两个可能的观点:

    ·你在两种风险中作出选择。阿黛尔更可靠;对布莱恩的期望更可能会导致一个稍逊一筹的结果,产生好的结果的概率较小。罕见事件可能会因为可能性效应而被过高权衡,所以最好选布莱恩。

    ·你在对阿黛尔的总体印象和对布莱恩的总体印象之间作出选择。你与他们之间或好或坏的经历都会影响你对他们日常行为的看法。除非这个罕见事件非常极端,你才单独想起了这件事(布莱恩曾有一次辱骂了向他求助的同事),因而标准会偏向于典型事例及最近发生的事,所以该选阿黛尔。

    在一个双系统的大脑里,第二种阐述似乎更为合理。系统1产生了对阿黛尔和布莱恩的总体印象,包括对他们的情感态度以及靠近或是回避他们的倾向。你的选择就取决于对这些倾向的比较。除非你明确地想到了某个罕见事件,否则就不会出现过高权衡。将相同观点应用到凭经验选择上很简单。因为他们对结果有长时间的观察,这两个按钮似乎也形成了情感回应所依附的综合“人格”。

    与前景理论刚被廓清之时相比,现在我们可以更好地了解罕见事件被忽视或是被过高权衡的情况了。由于记忆存在证实偏差,罕见事件的概率会(经常但不总是)被高估。当想起某个事件时,你会尽可能地将其视为真实的。当某个罕见事件特别吸引你的注意力时,这个事件就会被过高权衡。当前景得到明确描述时(例如“有99%的概率赢得1 000美元,1%的概率什么也得不到”),注意力就一定会分散。过多关注(耶路撒冷的大巴)、生动的画面(玫瑰花)、具体的表述(1 000中的1个),以及明确的提醒(以描述为基础作出选择)都是引起过高权衡的原因。没有过高权衡,就会存在忽视。就罕见事件而言,我们的大脑并不能总是作出正确判断。碰上一些任何人都未曾经历过的事情,这可不是什么好消息。

    示例—罕见事件“即使在日本,海啸也很少发生,但是海啸在我们头脑中的画面非常生动形象,游客也因此会高估海啸发生的可能性。”“这是我们都熟悉的灾难循环,即先是言过其实,之后作出过高权衡,最后忽视此事件。”“我们不应该将注意力集中在单一情境中,否则我们会高估它的可能性。想想其他的选择吧,然后将所有选择的概率相加,得到100%。““他们想让人们意识到风险是存在的。这也就是他们会使用‘每1 000人中有1人死亡’这个说法的原因,这种做法利用了分母忽视效应。”第31章 能带来长远收益的风险政策

    设想你需要做下列两组决策。首先查看全部决策,然后作出选择。

    决策(1):从A、B中作出选择:

    A.肯定能赚到240美元

    B.有25%的概率得到1 000美元,75%的概率什么也得不到

    决策(2):从C、D中作出选择:

    C.肯定会损失750美元

    D.有75%的概率损失1 000美元,25%的概率没有损失

    这一对选择题在前景理论的发展历程中有着重要的地位,它们使我们重新理解了理性的含义。看到这两个问题时,你对确定事件(A和C)的第一反应肯定是被A吸引,排斥C。对“肯定获得”和“肯定损失”的情感评估是系统1的自动反应,肯定会发生在估计两种风险的预期值(分别为获得250美元和损失750美元)之前,因为这样的估计需要付出更多努力(作更多选择)。大多数人的选择都与系统1的预测一致,绝大多数人都会选A不选B,选D不选C。在其他一些可能性中等或较大的选项出现时也一样,人们在收益状态下更倾向于规避损失,在亏损状态下更倾向于承担风险。我与阿莫斯所做的实验的结果是,有73%的受试者在决策(1)中选了A,在决策(2)中选了D,只有3%的人选择了B、C选项。

    按照要求,你在首次作出选择后要再次查看所有选项,你可能也这样做了,但有一件事你肯定没有做,即你没有估计4种不同选项组合的可能结果(A和C,A和D,B和C,B和D),以推测哪一种组合是你最想选的。直觉上,你只会分别考虑这两个问题,分开选择,并且不会觉得这样做比较麻烦。此外,综合考虑两个决策性问题需要费些劲儿,你可能需要笔和纸才能完成。所以,你并没有这样做。现在,请思考下面的选项问题:

    AD. 25%的概率获得240美元,75%的概率损失760美元

    BC. 25%的概率获得250美元,75%的概率损失750美元

    这个问题很容易!BC选项明显比AD选项更“占优势”(某个选项明显优于其他选项时使用的专业术语)。你已经知道我接下来要说什么了吧?在第一组决策问题中有压倒性优势的选项AD(在第二个决策问题中)是不被看好的那两个,只有3%的受试者一开始就选择了它们,而现在却有73%的受试者选择(上次)概率不理想的选项BC。

    宽框架还是窄框架?

    这些选择题使我们意识到人类理性的局限性。这些选项首先让我们了解到人类偏好的逻辑一致性—无论人们偏好的是什么,甚至是永远到达不了的海市蜃楼。再看一下最后那个简单的问题,你是否曾想过将这个答案明显的问题进行分解之后,会有很多人选择比较不理想的选项呢?每个有关得失的简单问题都可以通过无数方法分解为选项组合,而分解后的选择很可能和最初的选择不一致。一般来说,这是个事实。

    这个例子还说明处于收益状态时规避损失、处于亏损状态时承担风险是需要付出代价的。这些态度会使你不愿冒险,而愿付出额外的费用去得到肯定可获得的赢利,还会使你愿意付出额外费用(包含在预期价值中)以避免肯定的亏损。两种情况下付出的这些钱来源都一样,在同时面临这两种问题时,你的矛盾态度就不会很乐观。

    决策(1)和决策(2)有两种解释方式:

    ·窄框架:分别思考两个简单的决策问题。

    ·宽框架:一个有4个选项的综合决策问题。

    在这个例子中,选择宽框架明显更好。的确,在任何情况下,将多种决策综合考虑都会更有优势。假设同时考虑5个简单的(二选一)决策问题。宽(综合)框架需要考虑的是包含32个选项的综合选择,窄框架需要考虑的则是一连串5个简单的选择。5个连续的选择会是宽框架中32个选择的一部分。利用宽框架是最好的做法吗?有可能,但人们却不太可能这样做。一个理性的经纪人当然会利用宽框架进行考虑,但人们天生喜欢用的却是窄框架。

    这个例子说明,我们有限的大脑很难达到逻辑一致性的理想状态,因为我们易受眼见即为事实原则的影响,不愿动脑筋。另外,即使有人告诉我们应该综合考虑问题,我们自己还是倾向于在问题刚出现的时候立刻做出决策。我们既没有意愿也没有精力去增强偏好的一致性,我们的偏好也不会自动变得一致,它们处于理性代理模式。

    聪明的投资者不会每天都看股票行情表

    保罗·萨缪尔森是20世纪著名的经济学家。他曾问过他的某个朋友是否愿意玩一个抛硬币的游戏,玩这个游戏可能会损失100美元,也可能会获得200美元。他的朋友答道:“我不会接受,因为我觉得获得200美元的满足感无法抵消我损失100美元的痛苦。但如果你保证将硬币抛100次的话,我就和你玩这个游戏。“除非你是决策理论家,否则,你就不会有萨缪尔森的朋友的那种直觉:反复打一个有趣却也有风险的赌可以降低主观风险。萨缪尔森觉得他朋友的回答很有意思,便继续进行分析。他证明,在一些特定情况下,最注重效用的人拒绝了一次赌局,也会拒绝多次。

    值得注意的是,萨缪尔森的证明虽然是有效的,但这个证明引出的结论却有违常识—打100次赌当然是个吸引人的提议,心智正常的人都不会拒绝—可他本人似乎并没有意识到这个事实。马修·拉宾(Matthew Rabin)和理查德·泰勒指出,“在100个赌局中,输100美元和得200美元的比率是50 ∶50,因此,期望回报是5 000美元。另外,只有1/2 300的概率会输钱,会输掉超过1 000美元的钱的概率仅为1/62 000“。当然,他们想要说明的是,如果效用理论在任何情况下都与如此愚蠢的偏好相一致的话,这个理性选择模式肯定出什么问题了。拉宾对一些小额赌注严重的规避损失做法的荒谬结果进行了证明,但萨缪尔森没有看到这些证明,即便他看到过也不会感到惊讶。他甚至很愿意考虑很有可能被理性的人拒绝的交易的发生概率,这一意愿证实了理性模式的强大影响力。

    假设用非常简单的价值函数来描述萨缪尔森的朋友(我们称之为山姆)的偏好。为了表明自己规避损失的程度,山姆首先改变了赌注,将亏损金额改为原来的2倍。然后,他开始计算这个改变后的赌局的预期值。下面是他抛一次、两次、三次硬币的结果。做这些工作肯定需要极为专注。

     [image file=Image00016.jpg]

    从上表中可以得知,这个赌注的预期值是50。然而第一次掷硬币对山姆来说毫无价值,因为他感到输掉1美元的痛苦程度是赢得1美元的满足程度的2倍。改变赌注来体现自己的损失厌恶之后,山姆就会发现这个赌局的价值为零。

    现在,请考虑抛两次硬币的情况。输钱的概率降低到25%。两个极端结果(损失200美元或赢得400美元)在价值上相互抵消,它们的概率相同,且输的痛苦程度是赢的满足程度的2倍。但中间结果(一次输,一次赢)是积极的,所以抛两次硬币可以视为赌一次。现在,你就能看到窄框架的成本和多次打赌的奇妙之处了。当山姆分开来看的时候,就会认为它们毫无价值。如果在不同的场合中分别问他是否愿意打这两个赌,他都会拒绝。然而,当它们同时出现时,它们的共同价值就是50美元!

    若抛3次硬币的话,这个赌局就更有利了。极端结果仍然相互抵消,而且也不那么重要了。第三次抛硬币,尽管单独来看没什么价值,但却为整个赌注增加了62.5美元的价值。当山姆打的赌变为抛5次硬币时,这个赌局的期望价值就会是250美元,而山姆输钱的可能性是18.75%,他的现金等价物是203.125美元。这个例子中值得注意的一点是山姆的损失厌恶度从未改变过。然而,随着抛硬币次数的增多,输的可能性很快就降低了,损失厌恶对其偏好的影响也就相应减弱了。

    现在,如果山姆拒绝只赌一次的话,我已经准备好了一套说辞。如果你和山姆一样,也有不合理的损失厌恶的话,这套说辞也同样适用于你:

    我理解你对赌输的反感情绪,但这种情绪会让你损失很多钱。请考虑一下这个问题:你已经活不长了吗?这是你这辈子需要考虑的最后一个小赌注吗?当然,你不太可能再碰到和这个完全一样的赌局,但你会有很多机会碰到吸引人但赌注相对你的财产来说很小的赌局。如果你能将这些赌局看做一个整体的一部分,并重复念咒语:有赚有赔。这样,你在经济上就会更理性,也能在无形中帮自己赚到一大笔钱。那句咒语的主要目的是在你输的时候帮助你控制你的情感反应。如果你相信自己这样做是有效的,在你在决定是否该承担某个有正面预期值的小风险时,就应该用这句咒语提醒自己。在说这句咒语时,还需记住以下几个条件:

    ·当所有赌局都真正相互独立时,它才适用;它不适用于同一行业的多种投资,因为这些投资可能会同时遭遇失败。

    ·只有在可能的损失不会使你的全部资产处于危险时它才有效。如果你不想某一次损失成为影响你经济前景的重要阻碍的话,就请注意!

    ·若一个赌局中每次下注赢的可能性都非常小,就不该将咒语用在这个风险大的赌注上。

    如果你有这条规则所要求的情绪戒律,就永远不会孤立地考虑一个小的赌注,或是在小的赌注上规避损失,直到你快要进入棺材的那一刻(或许在那个时候还是不会这样做)。

    遵循这条建议不是没有可能的。金融市场中有经验的交易者每天都以此建议为生,他们通过宽框架来减轻亏损带来的痛苦。正如书中已提及的那样,我们知道可以通过引导受试者“像商人那样思考”,使他们不去规避损失,这就正如有经验的棒球卡商人不会像新手那样受到禀赋效应的影响一样。学生在不同的指导下可能会做出有风险的决策(接受或拒绝他们有可能会输掉的赌局)。在窄框架的情况下,他们被告知在做决策时应该“将每一个决策都当做你唯一需要做的决策”,并且要体会这些决策带给自己的情绪反应。在宽框架的情况下做决策的建议,包括“将自己想象为商人”,“你总是做这样的事”,以及“将它看做众多财政决策中的一个,这样一个决策会在将来一起被并入‘证券投资组合’中”。实验者通过心理学方法评估了受试者对盈与亏的情绪反应,方法包括测谎时用的测试皮肤电导率等。正如人们期望的那样,宽框架缓解了人们对损失的情绪反应,增强了他们承担风险的意愿。

    损失厌恶和窄框架的结合是一个代价更大的祸端。个人投资者可以通过降低查看自己投资结果的频率来避免这一祸端,并在获得宽框架带来的情感收益的同时节约时间、减轻痛苦。时刻关注每日的经济波动是种亏本的对策,因为频繁的低额损失带来的痛苦比同样频率的低额收益带来的快乐程度更为强烈。一个季度查看一次就足够了,对于个人投资者来说,这样的频率还要高一些。刻意避免查看短期结果,除了可使投资者的心情更为愉快以外,还可以提升决策和结果的品质。对坏消息典型的短期反应就是加剧损失厌恶。查看总体反馈的投资者很少能得到类似的坏消息,就更有可能不规避损失,结果也会赚得更多。如果你不知道每只股票每天(每周甚至每月)的情况,也就不会对你的证券投资组合进行无效的变动。在几个周期内都不改变某个投资的承诺(“锁定”投资的相同说法)可以改善财务状况。

    风险政策可以抵消风险厌恶的偏见

    善于使用窄框架的决策制定者在每次面临风险决策时都会带有偏见。每当相关问题出现时,他们就会使用风险政策,而风险政策确实可以改善他们的表现。我们熟悉的风险政策有“在买保险时,总是选择最高的免赔额”以及“绝不要买延长保险”等。风险政策是一种宽框架。在保险的例子中,你期望偶尔的损失是完全免额的,或是无保险产品损坏的频率别太高。与之相关的问题是,你设想自己接触的这个风险政策从长远来看肯定会为你带来收益,而你减少或是消除偶尔的损失所引起的痛苦的能力如何呢?

    风险政策与我前面提到的外部意见类同。外部意见将注意力从当前情境的特性转移到类似情境结果的数据上。外部意见是思考计划的宽框架。风险政策在一组类似的选项中嵌入了一个特别有风险的选项,也利用了宽框架。

    外部意见和风险政策是补救两种不同偏见的方法,而这两种偏见会影响许多决策的制定:规划谬误中的过度乐观以及损失厌恶中的过度谨慎。这两种偏见相互对立。过度乐观使个人和组织免于损失厌恶的不好影响;损失厌恶使人们不会产生过度自信的乐观主义。这样的结果对于决策制定者来说是有益的。乐观主义者认为他们做决策时比在实际情况下更为谨慎,而损失厌恶者则会正确地拒绝危险的提议(在没有外部意见的情况下,他们是可能接受这些提议的)。当然,我们不能保证这些偏见会在所有情况下都相互抵消。能够同时消除过度乐观以及过度规避风险的机构应该采取这种做法,将外部意见与风险政策结合来考虑应该可以实现其目的。

    理查德·泰勒曾与一家大型企业的25名部门总经理进行过有关决策制定的讨论。他请他们考虑一个有风险的选择,作这一选择,他们可能赔掉自己的大量资金或是使那笔资金翻倍,其中赔和赢的可能性是相当的。没有一位经理愿意接受这个如此大风险的赌局。泰勒又询问了这家企业执行总裁的意见,他当时也在场。这个执行总裁毫不犹豫地回答道:“我想要他们所有人都冒险。”在这个谈话的情境之下,这位执行总裁很自然地采用了宽框架,这个框架综合权衡了所有25个赌注。就像面对100次抛硬币机会的山姆一样,这位总裁可以依靠统计结果来使整体风险降低。

    示例—风险政策“告诉她应该像商人那样思考!有赚,当然也有赔。”“我决定每个季度查看一次我的证券投资组合。我总是选择规避损失,因此在面对每天价格波动的情况下总是不能做出理性的决策。”“他们从不买延长保险,这是他们的风险政策。”“我们公司每个部门经理在其所在领域都采取损失厌恶的做法。这很正常,但造成的后果是,这个机构不敢冒险。”第32章 心理账户是如何影响我们的选择的?

    除了那些非常穷、要靠收入来养家糊口的人以外,绝大多数人赚钱都未必是出于经济动机。亿万富翁再赚几亿美元不是出于经济原因,实验经济学项目的参与者获取额外的赞助也不是出于经济原因,钱是衡量一个人自身利益与自我成就感的标尺。

    奖励与惩罚、承诺与威胁,都在我们的脑中,我们谨慎地将其记录下来。这些因素如同社会环境中的诱因一样影响着我们的偏向,激发我们的行为。于是,我们拒绝减少损失,因为有时这样做就相当于承认失败;我们对可能使人后悔的行动存有偏见;我们虽然不能界定对玩忽职守和拿人钱财之间的区别,却也能够将两者区分开来;我们不会不停地做事,因为责任感总是因人而异的。奖励和惩罚带来的最终价值通常会使人有情绪反应,这是一种精神上的自我交易,而当个人成为某个机构的代理人时,就不可避免地会与该机构发生利益冲突。

    你会卖掉赢利的股票还是亏损的股票?

    理查德·泰勒多年来一直对会计行业与心理账户的类似之处很感兴趣。心理账户是我们用于组织和经营生活的账户,它有弊也有利,并且有多种来源。现实生活中,我们可能会将自己的钱存在不同的银行账户里,而有时我们仅仅是将钱存在了不同的心理账户中。我们有零用钱和普通存款,也有支付孩子教育费用或急诊的预留存款。该用哪些存款来满足现在的资金需求,我们有明确的先后顺序。就像为家庭开支作预算、限制每天喝黑咖啡的数量或是增加锻炼时间一样,存款也是为了自我控制。通常我们会为了自我控制而付出代价,例如,一面把钱存入储蓄账户,一面却透支信用卡。理性代理模式下的经济人并不依赖心理账户:他们对结果的看法是经过综合分析得来的,是受外部诱因驱使的。对于人类来说,心理账户是窄框架的一种形式;他们通过有限的大脑使所有事情都得到掌控,易于管理。

    心理账户在记录得分上应用广泛。回想职业高尔夫球手在避免击出超过标准杆的球而不是小鸟球时,往往打得更出色。我们可以得出的结论是,优秀的高尔夫球手会为球场上的每个球洞都创立账户,他们不会将整体的成功押在唯一的账户上。泰勒在此前的一篇文章中阐述的一个颇具讽刺意义的例子就很好地说明了心理账户是怎样影响行为的:

    两个狂热的球迷计划到离他们约64公里远的地方看篮球赛。其中一个人买了门票;另一个人在买票的途中遇见了一个朋友,免费得到了票。现在,有预报称比赛当晚会有暴风雪。这两位持票的球迷谁会更愿意冒着暴风雪去看比赛?

    答案很明显,我们知道买了票的那个球迷更有可能会去。心理账户也为此提供了解释。假设两个球迷都为这场比赛开设了账户,而错过比赛就是在负差额(逆差)的情况下关闭了这两个账户。那么无论是怎样得到门票的,他们都会很失望。但是,关闭账户对于买票的那个人来说影响更为消极,因为现在他的钱没有了,还不能看比赛。对这个人而言,待在家里是个更糟糕的选择,所以他更愿意去看比赛,也就更可能会冒着暴风雪开车去看比赛。这是系统1自动对情绪平衡作出的内在分析。在标准的经济学理论中,人们由心理账户引发的情绪并没有得到普遍认可。经济人可能会意识到这张票已经付了钱,而且已经不能退换。票的成本已经“沉没”了,这位经济人不会再在意这张球赛门票是自己买的还是朋友赠的(如果该行为人有朋友的话)。想要实施这个理性行为,系统2应该会考虑反事实的(指在不同条件下有可能发生但违反现存事实的)可能性:“如果我的票是从朋友那儿得来的,我还会冒着暴风雪驾车吗?”但只有积极的、受过相关训练的大脑才会想到提出这样的难题。

    当个人投资者将他们的证券投资组合中的一些股票卖掉时,犯一个错误也会使他们痛苦不堪:

    你需要钱来操办女儿的婚礼,所以想卖掉一些股票。你记得自己每一只股票的买进价,也能分辨出某只股票是“赢利股”(即当前价值高于你的买进价的股票),或是亏损股。在你所有的股票中,蓝莓牌瓷砖是一只赢利股;如果你在今天将其售出,就会得到5000美元的收益。你持有蒂芙尼电机相同的股份,现值是5000美元,但低于你的买进价格。你更有可能出售哪一只股票?

    作出这个选择的可行方法是:“我会关闭蓝莓牌瓷砖股票账户,记录下一笔成功的投资。或者,我可以关闭蒂芙尼电机股票账户并记下失败的一笔。我更愿意怎么做?”如果将这个问题看做是在给你带来的快乐和给你造成的痛苦中作选择,你肯定会卖掉蓝莓牌瓷砖,以享受成功投资的乐趣。可以预料,金融研究中已经记录了大量人们售出自己的赢利股、保留亏损股的偏好—这被视为一种偏见,关于此还有一个晦涩难懂的名字:处置效应。

    处置效应是窄框架的一个例子。投资者为她买的每一只股票都开设了账户,并想在关闭每一个账户时都能获利。理性的代理人会对证券投资组合有一个整体的看法,会售出最无可能在未来赢利的股票,而不是去考虑它是赢利股还是亏损股。阿莫斯跟我说了他与一名财务顾问的谈话。这名顾问询问阿莫斯他的证券投资组合中所有股票的相关信息,包括每只股票的买入价格。当时阿莫斯温和地问:“难道这个问题很要紧吗?”这个顾问当时看起来非常吃惊,他显然一直认为心理账户的状态是值得考虑的因素。

    阿莫斯对这个财务顾问的观念的猜测可能是对的,但他将买入价视为无关紧要的却是错误的。即使对经济人来说,买入价也很重要,应该将其考虑在内。处置效应是需要付出代价的偏见,因为对于售出赢利股还是亏损股这个问题,答案很明确,但并不是说选择卖哪只股票都无关紧要。如果你在意的是自己的财富,而不是直观感受,就会售出蒂芙尼电机这只亏损股,保留蓝莓牌瓷砖这只赢利股。至少在美国,税收能给人很大的刺激:你会意识到,卖掉亏损股可以减免税赋,而卖掉赢利股就必须得纳税。全美国的投资者都知道这个金融方面的基本事实,这个事实还决定了他们所做的一个决策—投资者会在12月卖掉更多的亏损股,因为这个月的税赋一直令他们忧心忡忡。一年中每个月都有税收优惠,但是在其他11个月份中,心理账户在人们心中的分量都重于金融常识。另一个反对出售赢利股的论据是对市场反常现象的详细记录,即最近升值的股票有可能还会继续升值至少一小段时间。这个净效应很大:预计卖掉蒂芙尼股而非蓝莓股的税后额外回报率在第二年是3.4%。在赢利的情况下关闭心理账户会令人心情愉悦,但这种愉悦是你花钱买来的。一个经济人不会犯这样的错误,在这一点上,那些运用系统2的经验丰富的投资者比新手更容易犯这种错误。

    理性的决策者只会对当前投资的未来结果感兴趣,经济人不会去考虑纠正先前的错误。当有更好的投资项目时,对亏损账户进行额外投资的决策被称为“沉没成本悖论”,这是一个代价高昂的错误决策,在大大小小的许多决策中都能看到其身影。由于买了门票而冒着暴风雪开车去看演出就是一种沉没成本悖论。

    设想一家公司已经在某个项目中投入了5000万美元。现在,这个项目误了工期,其最终回报的预计收益也没有最初计划的那样好。如果想要实现这个项目的最初目标,则需要6000万美元的额外投资。另一个提议是将同样的资金投入到一个新的项目中,且这个项目似乎可以带来更高的回报。这家公司会怎么做呢?通常的情况是,像冒着暴风雪开车那样,受到沉没成本影响的公司会继续将钱砸在那个不好的项目上,因为关闭这个项目的账户就相当于承认自己的失败,这是一种耻辱。这个情景属于四重模式中右上角那一栏的情况:在这种情况下,我们需要在必然的损失和不利的风险中作出选择,这样做通常是不明智的。

    从公司的角度来看,向失败的尝试增加投入是个错误做法,但对“拥有”这个前景并不明朗的项目的高管来说,却未必如此。撤销这个项目会给这个高管的履历上留下难以抹掉的污点,只能依靠该组织的资源再赌一把才能最大限度地保住个人利益,才有希望收回投资成本—至少可以尝试着延长清算日期。在沉没成本的状态下,高管的动机与公司的目标以及股东的利益都会不一致,这就是我们所说的代理问题中常见的类型。董事会非常清楚这样的冲突,所以当某位执行总裁因受困于先前的决策影响而不愿避免再造成损失的话,董事会就会将其替换掉。董事会成员不见得认为新的执行总裁比原先的更有能力,但他们知道新的总裁不会有与原总裁一样的心理账户,在评估当前机会的选择时,他也就更容易忽视过去投资的沉没成本。

    沉没成本悖论导致人们在不被看好的事情上浪费了太多时间,例如不幸福的婚姻、没有希望的研究项目等。我常注意到,一些年轻的科学家宁愿苦苦挣扎于注定会失败的项目,也不会选择放弃,重新开始。不过,好在有研究表明这样的悖论至少在某些情况下是可以克服的。在经济学和商贸学的课堂上,沉没成本悖论也被视为一种错误理论。这样做显然会产生积极影响,有证据表明,这些领域的毕业生比其他人更有可能放弃会失败的项目。

    哪种选择会让你更后悔?

    后悔是一种情绪,也是一种自我惩罚。人们做出的许多决策都是因为不想后悔(“不要这样做,否则你会后悔的”是个非常常见的警告),现实生活中我们也有很多后悔的事。有两位荷兰的心理学家对这种情绪状态作了很好的描述,他们注意到,后悔“总是与一个人本该更加了解的情感、不祥的预感以及对做错的事或失去的机会念念不忘等情绪形影相随,与严厉自责和改正错误的倾向形影相随,与‘此事如果没有发生该多好’或是‘如果再有一次机会该多好’之类的想法形影相随”。当你想象自己正在做某事而不是在想曾经做过的事情时,就会感到强烈的悔意。

    后悔是由替代现实的可用性引发的反事实情绪。每架飞机失事后,都会有关于一些乘客“本不应该”在那架飞机上的特别报道—他们有的是在最后几秒才订到的位子,有的是从另一条航线转机过来的,还有的理应早飞一天,但不幸延迟了才上了这架飞机。这些令人痛苦的事例有个共同特点,即它们都属于反常规事件。与正常事件相比,人们更容易凭想象搞砸这些反常规事件。联想机制包含了正常世界的典型及其规则。反常规事件会吸引人的注意力,还会使人们认为在相同情况下这些事件也应该是正常的。

    为了理解后悔与常态的关系,请思考下列情境:

    布朗先生几乎从不让旅行者搭便车。昨天他让一个男人搭了便车,然后他被抢了。
    史密斯先生经常让旅行者搭便车。昨天他让一个男人搭了便车,然后他被抢了。
    这两个人谁更可能感到后悔?

    答案不出我们所料:有88%的受试者认为布朗先生会更后悔,12%的受试者认为是史密斯先生。

    后悔与责备并不是一回事。实验人员问了其他受试者与上述事件相关的一个问题:
    谁会受到他人更严厉的责备?
    结果是:认为是布朗先生的占23%,认为是史密斯先生的占77%。

    与常态的对比可引起后悔和责备,但相关的常态是不相同的。布朗先生和史密斯先生体验到的情绪主要是由他们平时对待旅行者的方式决定的。让旅行者搭便车对于布朗先生来说是一件反常规事情,因此,大多数人认为他会更后悔。然而,带有批判性的观察者会将这两个人的行为与合理行为的传统常态相比较,更可能会批评史密斯先生,因为他总是习惯性地承担这种不可预知的风险。我们会忍不住说,史密斯先生是自食其果,布朗先生是走了霉运。但布朗先生更应被指责,因为他在这件事上的做法与他平时的性格不符。

    决策制定者容易感到后悔,而痛苦的情绪则对很多的决策制定都有影响。后悔的直觉非常一致,而且还很明显,下面这个例子就说明了这一点。

    保罗在A公司持有股份。在过去一年里,他想要将股份转移到B公司,但最终决定还是不那样做。现在,他了解到,如果他当时将股份转到了B公司的话,可以多赚1200美元。

    乔治在B公司持有股份。在过去一年里,他将股份转移到了A公司。现在,他了解到,如果他当时坚持保留B公司股份的话,可以多赚1200美元。

    谁会更后悔呢?

    结果很明显:8%的受试者说是保罗,92%的受试者说是乔治。

    这很令人好奇,因为从客观上来说,这两位投资者的情况是一样的。他们现在都拥有A股,而且如果拥有B股可多赚同样多的钱。唯一的区别在于,乔治没能赚更多钱是因为他采取了行动,而保罗则是因为没有采取行动。这个小事例说明了一个大道理:人们对由于不采取行动而导致的结果,会比因行动而产生的结果有更为强烈的情绪反应(包括后悔)。这个观点在赌博的情境下也得到了证实:人们下注并赢了钱会比其不赌但得到同样多的钱更快乐。这种不对称至少对于损失来说是强烈的,还可用来解释责备和后悔的原因。问题的关键并不在于玩忽职守和拿人钱财的不同,而在于默认选择和偏离默认的行动间的区别。你在偏离了默认情况之时,会很容易联想到常态,想知道默认情况是否会导致糟糕的结果。如果真会这样,那你的偏离和常态就可能成为自己痛苦的来源。当你持有一只股票时,你默认的选择不是卖,但当你早上碰见某个同事时,你默认的选择又变成了同意他的观点,即卖掉股票。出售一只股票与违背你同事意愿都是对默认选择的违背,也都可能让你后悔或招来责骂。

    在一个证明默认选择的影响力的实验中,受试者在计算机上模拟了21点游戏。一些玩家被问道:“你想要拿牌吗?”而另一些人则被问道:“你想要停牌吗?”无论问题是什么,如果结果并不理想的话,说“是”肯定会比说“不”更令人感到后悔。很显然,这个问题表明了一个默认的回答,即“我们有很强的意愿这样做”。另一个默认行动的例子是说球队在决赛中惨败与教练有关。这个教练理应对人员和战术进行调整,但他却没有这样做,因此,他被人责备,他自己也感到后悔。

    后悔的风险是不平衡的,其不平衡性体现在偏向于常规的、厌恶风险的选择这种偏见存在于许多情境中。如果某位顾客在购物时被提醒,他可能就会因为自己的选择而后悔,这名顾客在选择时就会偏向于常规选项,即更看好品牌。接近年末时,财务经理的行为也显示出了预期评估的影响:他们易于清理那些并非传统投资组合或是让人质疑的股票。另外,即使是关乎生死的决策都能被预期的评估所影响。

    设想有个医治重病患者的医生,某个治疗手段是正常且标准的,另一个则是不同寻常的。这个医生有理由相信这个非传统的治疗手段可提高病人的康复概率,但证据不足。使用这个与众不同的治疗手段的医生可能会面对极度的悔恨、严厉的责备,还可能被人起诉。以后见之明来看,医生很容易想到常规的选择,总是希望自己没有作非常规的选择。如果结果是好的,这个敢于冒险的医生就会得到好的名声。这是事实。但是,这种可能的利益小于可能的成本,因为成功通常是比失败更为正常的结果。

    因为害怕将来后悔而作出不理性的选择

    在许多情境中,损失的痛苦是获得的快乐的两倍,例如下赌注、禀赋效应以及对物价变动的反应等。损失厌恶系数在某些情况下会更高。你更容易在生活中比钱更加重要的方面产生损失厌恶,例如健康。另外,当“卖掉”重要的基金可能使你承担可怕的后果时,你会更加不愿卖掉这些基金。理查德。泰勒早期在消费者行为方面的经典实验就用了一个著名的例子,我将这个例子作了细微调整:

    你接触到了一种疾病,感染这种病会使你在一星期内快速且没什么痛苦地死去。得这种病的概率是十分之一。在此病尚未出现任何症状之前,有一种疫苗是有效的。你愿意付多少钱来打这种疫苗?

    大多数人都愿意付钱,但钱不是很多。面对死亡的可能令人不安,但是死亡的概率很低,所以想要躲避死亡而花掉大量积蓄是不合理的。

    现在,请考虑下面这个作了细微调整的例子:

    研究上面这种疾病需要一些志愿者。对志愿者的唯一要求是必须接触这种病,也就是说,你会有十分之一的概率会感染上这种病。那么,要是去做志愿者,你最低要多少钱?(你不能购买疫苗。)

    正如你可能预料的那样,人们当志愿者要的薪水会比他们买疫苗的最高定价高很多。根据泰勒的非正式报告,其常规比率大约是50 ∶1。极高的售价说明了这个问题的两个特点。首先,你不会“出售”健康。这种交易不是合法的,高的定价反映了人们并不愿意参与其中,而可能因此而承担的不好结果或许也是你不愿“出售”健康的最重要因素。如果你在某天早上起床的时候,发现自己有了疾病的症状并将在不久后死去,你就会觉得去当志愿者比起没买疫苗更会令你后悔。因为你本可以拒绝“出售”自己的健康的,甚至是能在完全不考虑可以得多少钱的情况下拒绝。你本来可以坚持自己的默认选择,什么都不做。现在,这种与事实相反的情况会让你的余生都不得安宁。

    前面提到过的关于家长对有潜在危险的杀虫剂的反应也存在着是否愿意冒险的问题。受试者需回想自己正在使用的某种杀虫剂,且这10000瓶杀虫剂里有15瓶可能造成误吸和儿童中毒。另外,还有一种稍便宜的杀虫剂,但其导致中毒的风险也有所增加:10000瓶中有16瓶可使人中毒。实验者问家长,第二种杀虫剂(更不安全)要比第一种便宜多少时,他们才会去买?超过2/3的受试者回应,无论这种新的杀虫剂定价多少,他们都不会买。他们显然反对拿自己孩子的健康做交易。若第二种杀虫剂与第一种的价格差额足够大的话,也有少数人是愿意买的,但愿意接受较小的折扣而买第二种杀虫剂的少数人会要求得到一笔钱,这笔钱比他们愿意为提高产品安全而支付的钱更多。

    任何人都明白也理解,为什么家长不愿为了钱而让孩子承担风险,哪怕只是增加一点风险。值得注意的是,这种态度对于我们想保护的人的安全来说,是不合逻辑且有潜在危害的。即使是最慈爱的父母,他们用来保护自己孩子的时间和金钱也是有限的(保护孩子安全的心理账户预算有限),因此,使这些资源的作用发挥到极致似乎很合理。通过买稍差的杀虫剂可以节约一小笔钱,但会增加孩子中毒的风险。然而,节约的这笔钱却可以更好地用在消除其他威胁孩子健康的事情上,例如买一个更为安全的儿童汽车座椅或是插座罩。禁忌权衡反对任何增加风险的可能,但这并不是利用健康预算的有效方法。事实上,相较于想要保障孩子安全的愿望,这种抗拒可能更多的是出于害怕自己会后悔。任何在考虑后接受了这种交易的家长都会假设,想到杀虫剂带来危害时他们后悔和羞愧的画面。

    人们极度厌恶为得到其他好处而以增加风险为代价的交易,监管风险的法律与规章充分体现了人们的这种厌恶。这种趋势在欧洲特别强劲。在欧洲,防止一切可能造成危害行为的预警原则是一个被普遍接受的学说。在监管的体制下,预警原则将安全检测的全部目标都放在了可能会做出对他人和环境有害行为的人的身上。多个国际组织都已说明,潜在危害的科学证据的缺失并不是承担风险的充分理由。正如法学家卡斯·桑斯坦指出的那样,预警原则代价高,而且对它作严格解读的话,它是经不起考验的。他提到了一连串无法通过预警原则考验的创新发明,包括“飞机、空调、抗生素、汽车、氯气处理、麻疹疫苗、心脏手术、收音机、电冰箱、天花疫苗以及X射线”。强势的预警原则明显是站不住脚的,但加强的风险规避却根植于我们强烈且普遍的道德直觉中,它源于系统1。强烈的风险规避意识与有效的风险管理形成的两难问题,还没有一个简单而又令人信服的解决方案。

    我们花了很多时间预测,并尝试去回避由我们自身造成的情感创伤。我们该怎样对待那些难以捉摸的结果,以及当我们记录自己生活时的那些自我惩罚(或偶尔的奖励)?经济人不应有这些情绪,而这些情绪对于人类来说却代价沉重。这些情绪会导致人们做出损害个人财富、政策力度以及社会福利的行为。后悔情绪与道德责任是真实存在的,没有后悔情绪和道德责任的经济人也许与这样的行为并无关联。

    因为害怕将来后悔而影响了你的选择,这样合理吗?对后悔的预感就像对自己快要昏厥的预感一样,是生活中的事实,并且需要在发现以后作出调整。如果你是位富有又谨慎的投资者,你也许可以支付某个昂贵的投资组合,这个组合即使不能够使你的财富收益达到最大,也可将你可能会感到的后悔程度降至最轻。

    你还可以采取一些预防措施,以防止将来后悔。也许最有效的方法就是做到对可能会后悔的事心中有数。如果你能够在情况变糟糕时,先仔细考虑自己是否会后悔再作决定,那么你将来的遗憾也就可能会更少一些。你应该也知道,后悔总是伴随着后见之明的偏见而来,所以,任何你能做的、防止后见之明的措施都有可能是有益的。我个人躲避后见之明的方法是:在做有长远影响的决策之时,不要太过周密,但也不要完全凭偶然行事。如果你考虑到了一点点,你可能在事后说,“我本可以作出更好的选择”,这种后见之明就更会令你很不甘心。

    丹尼尔·吉尔伯特与他的同事们说,人们预见的后悔感觉往往会比实际体验的程度深,因为他们会低估自己的心理防御能力,即“心理免疫系统”。对此,吉尔伯特和他同事们的建议是,不应该过于关注自己是否会后悔,即使你有些后悔,其令你痛心的程度也绝对会比你想象中的程度轻。

    示例—心理账户“他对现金支付和信用卡支付有不同的心理账户。我不断地提醒他,钱就是钱,并没有多大区别。”“他一直保留着那只股票,只是因为不想在关闭心理账户时处于损失状态。这就是处置效应。““我们在那家餐馆里发现了一道极其美味的菜,因为害怕会后悔,所以我们就不愿意再尝试别的菜了。”“售货员给我看了最贵的儿童汽车座椅,还说它是最安全的,我就不敢买比较便宜的了。这似乎是禁忌权衡在作祟。”

    第33章 评估结果的逆转

    假设,某人走进了附近的一家便利店,里面恰巧发生了抢劫案,他不幸中弹。你认定他是因中弹而导致右臂残疾。你的任务就是给这起抢劫案中的受害者设定赔偿金额。

    此人住所附近有两家商店,其中一家是这个人常去的。请思考以下两种情况:

    ·抢劫案发生在此人常去的那家商店。
    ·此人常去的那家商店的店主要去参加一个葬礼,商店不营业,这个人就去了另一家商店,而就在那家商店里,他中弹了。
    此人中弹的那家商店是否会对此人的赔偿有影响?

    你会通过联合评估对此作出判断,即将两种情况同时考虑在内并进行对比。你可以有自己的一套原则。如果你认为第二种情况会得到更高的赔偿,你就会给这种情况分配更高的美元价值。

    大家都会认同这个答案,即在这两种情况下,赔偿金应该相同。赔偿针对的应该是受害者受到的重创伤害,而抢劫案发生的地点对赔偿会有何影响呢?对这两种情况的联合评估会使你对赔偿过程中的相关情况产生同情。对于大多数情况来说,地点不是相关情况中的一个。在其他需要鲜明对比的情况中,思考较慢,且系统2也参与其中。

    这两种情况最初是由心理学家戴尔·米勒(Dale Miller)和凯茜·麦克法兰(Cathy McFarland)设计的,他们将这两种情况展示给不同的人看,并请他们作出评估。在他们这一跨学科的实验中,每位受试者都只看到了一种情况,并用金钱来衡量这个人的受害程度。他们发现(你肯定也猜到了)如果受害者受伤的商店是他不常去的那家而不是他常去的那家,他得到的赔偿会更多。人们自然会想“要是他去的是常去的那家店就……”正是这种想法引起了心酸这种与事实相反的感觉。系统1的替代和强度匹配机制将用金钱来表达对某件事的情感反应强度,使得金钱价值有了很大的不同。

    两项实验对比鲜明。几乎所有将两种情况放到一起来看(受试者包括在内)的人都同样认为悲痛不是合理的想法这一原则。不幸的是,只有在将两种情况放到一起看时,才能得出这个原则,而现实生活中,这两种情况不可能同时发生。我们通常用受试者组间模式体验生活,在这种模式中,可能会改变你的想法且有鲜明对比的方案并不存在,当然了眼见即为事实。因此,你的道德观不一定能支配你的情感反应,并且从内心角度看,在不同情况下大脑中生成的道德直觉都不是一致的。

    抢劫案中单一评估和联合评估的不一致属于判断和抉择中的逆转。偏好逆转(preference reversals)是在19世纪70年代被首次提出来的,此后几年,其他方面的逆转也相继被提出来。

    开启经济学与心理学的跨界交流

    偏好逆转在心理学家和经济学家间的对话中有着重要的地位。引起注意的逆转是由萨拉。利希滕斯坦和保罗。斯洛维克提出的,他们都是心理学家,在密歇根大学做毕业设计时,他们和阿莫斯是同一届的。他们就赌注的偏好逆转做了项实验,关于此实验,我会做简要说明。

    将有36个格的轮盘转两次,你可以在两个赌注中选择一个。
    赌注A:11/36的概率赢得160美元,25/36的概率损失15美元。
    赌注B:35/36的概率赢得40美元,1/36的概率损失10美元。
    你可以在无风险和有风险的赌注间选择:一个几乎肯定会赢,但赢得不多;另一个是赢的概率小,但可以赢一大笔,还有很大可能会输钱。

    现在请单独考虑每个赌注:如果你是该赌注的持有者,你最低会以多少钱卖掉它?记住,你不是在和别人讨价还价,你的任务是决定你真的愿意放弃这一赌注时,可以接受的最低价钱是多少。你来尝试一下。你可能会发现,在这项任务中,赢得的钱数尤为突出,你对赌注的评估被锚定在了其价值上。A赌注中支撑这一猜想的结论和卖价都要比B赌注的好。这就是偏好逆转,即人们会选择B而不是A。不过,如果他们只能在其中选一个的话,他们会认为A比B有更高的价值。就像是抢劫案中的那种情况,偏好逆转之所以会发生是因为联合评估将注意力集中到了情况的一个方面上,即A赌注没有B更稳妥,而这点在单一评估中则没那么突出。当选择联合评估时,致使单一评估中产生不同观点判断的特征就会受到克制或认为不相关,这种特征包括第一个例子中走错商店的受害者的悲痛和第二个例子中锚定奖品的心酸。系统1的情绪反应很可能会决定单一评估;而联合评估中出现的对比也常需要更仔细、更需要付出努力的评估,这其中需要系统2的参与。

    偏好逆转可在受试者间(within-subject)的实验中得到证实。在这个实验中,受试者对很多商品作出两套定价并从中作出选择。受试者都没有意识到自己选择时的不一致性,而且在面对这种不一致性时,他们的反应很好笑。1968年,萨拉·利希滕斯坦曾采访该实验中的一名受试者,这次采访堪称业界经久不衰的经典。萨拉和这个困惑的受试者(该受试者后来又愿意花一笔钱放弃自己刚选择的赌注,选择自己刚放弃的赌注,而且他多次改变主意)进行了详细的交谈。

    理性的经济人当然不易受偏好逆转的影响,因而偏好逆转现象被看成是对理性因素模式以及建立在理性因素模式之上的标准经济理论的一种挑战。这种挑战本可以被忽略,但却没有。就在偏好逆转现象被报道的前几年,有两位知名的经济学家戴维·格雷瑟(David Grether)和查尔斯·普莱特(Charles Plott)在《美国经济评论》上发表了一篇文章,其中就对利希滕斯坦和斯洛维克所描述的现象谈了自己的研究。这也许是实验心理学家第一次作出了引起经济学家关注的发现。对于学术论文来说,

    格雷瑟和普莱特的文章简介部分写得有些夸张,他们的意图很明确:“经济学家应该对心理学感兴趣,而且正是在心理学领域中构建起了数据和理论体系。从表面价值的角度来看,数据与偏好理论并不一致,而且会就研究重点生成更多经济学上的含义启示……“该论文指出了心理学研究成果不适用于经济学领域而设计的一系列实验。

    格雷瑟和普莱特列出了13种理论来解释最初的发现,并指出了精心设计的、可测试这些理论的实验。他们提出了很多假设,其中一种(当然心理学家会认为这种假设有些做作)是实验的结果本应该是心理学家得出来的!最后只有一种假设经受住了检验:即心理学家是正确的。格雷瑟和普莱特承认,从标准的偏好理论来看,这种假设是最不令人满意的,因为“如此一来,个人选择可依赖作出选择时的环境”,这显然与一致性学说相悖。

    你可能会觉得这一惊人结果使得经济学家们的理论基础假设受到了质疑,会引起经济学家的自我反思。但在社会科学领域中,包括心理学和经济学,事情不应该是这样发展的。理论基础应该是强有力的,而且要质疑某一既定的理论,只有一项发现是不够的。事实上,格雷瑟和普莱特那篇直言不讳的文章对认定经济学家(也可能包括格雷瑟和普莱特)的疏忽有着直接的影响。不过,这篇文章却对经济学家们正视心理学的研究起到了促进作用,而且促进了两个学科间的跨界交流。

    联合评估引发偏好逆转

    “约翰高吗?”如果约翰高5英尺,你的回答就会取决于他的年龄。如果他6岁,他自然是很高;如果他16岁,这个身高就算矮的了。你的系统1会自动检索相关信息,同时,你对高的概念也会随之调整。你还会根据类别来匹配各项参数,比如回答:“在餐馆里吃饭,多少钱的一顿饭可以和约翰的身高相匹配?”你的回答会取决于约翰的年龄,即如果他16岁,这顿饭就比他6岁时更便宜。
    但是,请看下面的说法:
    约翰6岁,他身高5英尺。
    吉姆16岁,他身高5.1英尺。

    在单一评估中,由于每个人的参照标准不一样,大家都会觉得约翰很高,而吉姆不高。如果你需要对比,比如“约翰是和吉姆一样高吗”,你会回答不是。这个问题不会引起疑问,也没有模糊不清的地方。不过,在其他情况下,即事物和事件在它们各自的情境中进行比较时,会造成对重要事情的选择不一致。

    你不应该形成单一评价和综合评价总是不一致的印象,也不应该认为判断完全是混乱的。我们生活的这个世界有多个范畴,因为我们有标准,例如,6岁的孩子或者桌子。判断和偏好在同一种类中是一致的,但当事物从属于不同的种类时,就是不一致的了。例如以下3个问题的答案:
    你喜欢苹果还是桃?
    你喜欢牛排还是炖菜?
    你喜欢苹果还是牛排?

    第一个问题和第二个问题中的事物属于同一个种类,你能立即回答出自己喜欢哪一个。此外,你可以从单一评估(“你有多喜欢苹果”和“你有多喜欢桃子”)中得到自己的喜好评价,因为苹果和桃子都是水果。由于不同的水果是通过相同的标准进行对比的,在单一评估和联合评估中,每种水果都可以直接进行对比,因而也就不存在偏好逆转了。与种类内的问题不同的是,苹果和牛排的对比没有固定的回答。

    苹果和牛排与苹果和桃子不同,从本质上讲,它们是不可以相互替换的,它们也不能满足同样的需求。有时你会想吃牛排,有时又想吃苹果,但你很少会在想吃苹果时说吃牛排也一样,或者在想吃牛排时说吃苹果也一样。

    假设你收到一封自己信赖的组织发来的电子邮件,要求你对某一事业作出贡献:

    很多繁殖海豚的地方都受到了污染的威胁,这导致海豚的数量减少。一个由私人捐献的特殊基金会成立了,并给海豚提供无污染的繁殖区。

    这个问题能引发什么样的联想呢?你是否意识到脑中闪现了相关事业的想法和记忆?你很可能会想起保护濒危动物的工程。你的系统1会自动评估其好坏,并对海豚在濒危动物中的排名生成一个大致的印象。海豚要比白釉、蜗牛或鲤鱼这样的动物更惹人喜爱—也就是说海豚比大脑自动进行对比的动物更受欢迎。

    你必须要回答的问题不是你是否更喜欢鲤鱼,你需要对此进行美元价值评估。当然,你可以从以往的经验中知道你从没有对这种要求做出过回应。设想你就是对这种要求作出贡献的人。

    和其他难题一样,对美元价值的评估可以用替代和强度匹配来解决。美元的问题是很难,但可以通过更简单的问题来回答。因为你喜欢海豚,你很可能会觉得拯救海豚是项善举。下一步(也正是自动进行的一步),你会将你对海豚的喜爱用贡献的大小来表达。你对以前对环境事业作出的贡献大小有意识,这份贡献与对政治或母校足球队的贡献有所不同。你知道对自己来说多大的贡献是份“巨大的贡献”,多大的贡献是“大贡献”或“一般贡献”,又或是“小贡献”。你对不同动物的态度也有所不同(从“非常喜欢”到“一点也不喜欢”)。因此你也能将自己的态度用美元价值来表达,自动从“非常大”到“较大”再到几美元。

    在另一种情况下,你接手了另一种诉求:

    雇农要在阳光下暴晒多个小时,他们患皮肤癌的概率要比一般人高很多。定期体检可以降低其风险。现要建立一个基金会支持面临患皮肤癌风险的雇农的体检项目。

    这是个紧急的问题吗?你在评估紧急事件的时候,这件事属于哪种类别呢?如果你自主地将这件事归为公共卫生问题,你很可能会发现雇农患皮肤癌的风险在这些公共卫生问题中排名不是很靠前—它的排名相对于濒危动物中海豚的排名来说,肯定会靠后。若将皮肤癌问题的相关重要性用美元价值来表示的话,你对其作出的贡献就会比对濒危动物的贡献要小。在实验中,海豚在单一评估中吸引到的贡献量要比雇农吸引到的多。

    其次,思考联合评估中的这两个例子。在这两种例子中,是海豚还是雇农应该得到更大的那笔捐款呢?联合评估中关注了单一评估中没有被注意到的一点特征,但其在被发现时,却被认为是有决定性的因素:雇农是人,海豚不是。你当然认识到了这一点,但这点在单一评估中判断时是不相关的。“海豚不是人”这一事实没有引起注意,是因为在脑中被激活的所有事情都具备这一特点。“雇农是人”这一事实没有在脑中浮现是因为所有的公共卫生问题涉及的都是人。单一评估的窄框架使得海豚有更高的强度得分,通过强度匹配,海豚会得到相应更多的捐款。联合评估改变了事情的表述:这一“人Vs.动物”的特点只有在将两者综合在一起看时才会凸显出来。在联合评估中,人们对雇农表现出偏好,并愿意捐献更多,比保护可爱的动物要捐得多。在打赌和抢劫案射杀人的例子中,单一评估和联合评估是不一致的。

    芝加哥大学的奚恺元对下面这个同等类型中的偏好逆转例子作出了贡献。被评估的对象是二手音乐词典。

                      词典A     词典B

    出版年份          1993      1993

    词条数            10 000    20 000

    情况              较新      封皮已毁,其他的地方很新

    在单一评估时,词典A要更有价值,当然,偏向在联合评估中会改变。其结果正好表明了奚恺元的可评价性假设(evaluability hypothesis),即词条数在单一评估中没有价值,因为数量自身是没有价值的。而在联合评估中,这一点则显然使词典B更具吸引力,而且词条数比封皮状况更重要。

    同类案件判罚的力度为何不一样?

    我们有理由相信公正的管理在不同领域中受可预测的不一致性的影响。其中的证据部分可从实验中获得,比如对模拟陪审团的研究;部分可从对立法、管理和诉讼模式的观察研究中获得。

    在一项实验中,从得克萨斯州的陪审团中挑出了模拟陪审员,并要求他们去评估几起民事案件的惩罚性赔偿。这些案件是两个为一组呈上来的,其中一个案件提出人身赔偿,另一个案件是经济损失。模拟陪审员首先评估了其中一个案件,然后给他们看了同组中的另一个案件,并要求他们进行对比。下面是关于一组案件的总结:

    案例1:某个孩子在玩火柴时不小心点着了自己的睡衣,造成中度烧伤。生产这种睡衣的公司没有将这种睡衣制成耐燃的。

    案例2:由于某家银行的不慎处理,另一家银行损失了1000万美元。

    一半的受试者在将两个案例进行联合评估时,会先评判案例1(用单一评估)。其他的受试者在评估时,会将案件的顺序颠倒过来。在单一评估时,陪审员判给诈骗银行的惩罚性赔偿要比判给烧伤孩子的高,很可能是因为诈骗银行的案例中涉及的金额要大,是个高锚定。

    然而综合来看案件时,对受害个体的同情心会比锚定效应占更大的影响比重,因而陪审员判给孩子的赔偿金要比判给诈骗银行的高。平均来看几组这样的案件,联合评估中人身伤害的受害者所得的赔偿是单一评估中得到的赔偿的2倍。只看到孩子烧伤案件的陪审员作出的决定和他们的感觉相匹配。他们不能预测到给那家金融机构的大笔赔偿金会使给孩子的赔偿金显得不够。在联合评估中,关于银行的惩罚性赔偿金仍然锚定在损失上,而给烧伤孩子的赔偿金却有所提升,这其中反映出了陪审员对因疏忽而导致孩子受伤的愤怒。

    我们可以看到,理性通常会受到更广泛、更综合的框架的限制,而且联合评估显然比单一评估更广泛。当然,当能控制你所看到的人对你的选择有既定的兴趣时,你应该在联合评估时谨慎些。售货员很快就意识到改变购物环境能影响顾客的偏好。除了故意的改变外,你可以设想判断时用对比的方法(一定会包括系统2)会比单一评估更稳定,单一评估常会反映出系统1的情绪反应强度。我们希望任何想要得出周全判断的机构都能在评估单个案件时,为所作的判断提供更广泛的背景。我从卡斯。桑斯坦那儿了解到评估惩罚性赔偿的陪审员明显未能考虑到其他案例,这让我很惊讶。法律体系和心理学常识不同,法律判决更倾向于单一评估。

    在法律体系另一项关于不一致性的研究中,桑斯坦对比了不同美国政府部门实施的行政处罚,包括职业安全与保健管理总署和环境保护局。他总结道:“在范畴内,惩罚似乎是理智的,至少更严重的伤害会受到更严厉的惩罚。对于违背职业安全与保健的行为,最重的惩罚是针对不断的违反行为,其次的惩罚是针对蓄意且严重的违反行为,最轻的惩罚是针对未能保持其良好记录的行为。”然而,如果不同部门惩罚的力度不一样,你也不会感到惊讶,因为不同部门的惩罚反映了其特有的政治和历史,而不是所有地方都关心的公正。工人“严重违反”安全原则最多罚款7 000美元;而违反野生鸟类保育行动可导致最高25 000美元的罚款。每个部门制定的罚款与该部门制定的其他罚款相比都是明智的,但将不同部门的罚款相对比就显得很奇怪了。就像此章中的其他例子那样,只有将两个案例放在一个大框架下时,你才能看出其中的奇怪之处。同种类间的行政处罚系统是具有一致性的,但与其他种类综合在一起来看,却是不一致的。

    示例—逆转“我对英国的热量单位没有什么概念,但在看到空调装置的改变后,我对此就有所了解了。联合评估非常重要。”“你认为这个演讲非常成功,这是因为你将这个演讲和她的其他演讲作了对比。要是和其他人对比的话,她仍然不怎么样。”“当你将框架放大时,你就会做出更明智的决策,事实往往如此。”“当你单独看某件事时,你很容易受系统1的情感反应的支配。”第34章 善用框架效应,让生活更美好

    2006年世界杯总决赛是意大利队和法国队之间的较量。“意大利队赢了”,“法国队输了”,两个句子描述了这场比赛的结果,这两句含义相同吗?回答要看怎么理解“含义”这个词了。

    从逻辑推理的角度来看,这两个描述比赛结果的句子是可以互换的,因为它们所指的状况相同。正如哲学家曾说的,它们的真值条件是相同的:如果其中一个句子是正确的,另一个也是正确的。这正是经济人理解事情的办法。经济人的观点和偏好都是基于现实的,尤其是他们选择的对象—都是对这个世界的陈述,而且他们不会受到陈述所用字眼的影响。

    含义还有另一层观念,在这层观念中“意大利队赢了”和“法国队输了”的意思并不相同。在这层观念中,对某个句子含义的理解发生在你的联想机制中。这两个句子引发了不同的联想。“意大利队赢了”让人们想起了意大利队,以及该队为了赢得比赛所作的努力。“法国队输了”会让人们想起法国队,还有法国队为什么会失败,包括法国队的球星齐达内用头撞了意大利队队员。这两句话引起大脑的联想,即系统1如何对此反应,这确实有不同的“含义”。逻辑上相同的陈述引发了不同的反应,这一事实使得人们无法像经济人那样可靠且有理性。

    情感的框架效应很难抵挡

    阿莫斯和我将框架效应运用到了研究构想对信念和偏好的不公平影响中。以下就是我们曾使用的一个例子:

    若某赌注有10%的概率赢得95美元,有90%的概率损失5美元,你会接受这个赌注吗?

    若某彩票有10%的概率赢得100美元,有90%的概率什么也得不到,你愿意花5美元买这张彩票吗?

    首次,要花点时间弄明白这两个问题是相同的。在这两个问题中,你都要决定是否愿意接受某一不确定的可能,即拿到95美元或损失5美元。有人作选择会基于理性,他们会给出两个相同的答案,但这样的人是少数。事实上,其中有一个问题引起了很多正面的答复,这个问题是第二个。一个不好的结果如果被架构为不会赢的彩票的成本,比被简单地描述成输掉一个赌注更易被接受。我们对以下这个说法不应该感到惊讶:损失能比成本引起更强烈的负面感觉。选择不是基于现实的,因为系统1就不是基于现实的。

    从理查德·泰勒那儿学到的东西影响了我们构建的问题。泰勒告诉我们当他还是个研究生时,他就在一块木板上钉一张卡片,上面写着:成本就是没有损失。他在早期研究消费行为的文章中讲了一次争辩,那次争辩是关于加油站是否可以向用现金或信用卡付款的人收取不同的价钱。用信用卡支付的人强烈坚持不同的价格是不合法的,但也有可商量的余地:只要价钱上的不同是现金折扣,而不是信用卡附加费。他们的心理信念是合理的:相对于附加费来说,人们更容易放弃折扣。附加费和折扣也许在钱数上来看是相等的,但它们在情感上是不等的。

    在某项实验中,伦敦大学的一组神经科学家将框架效应的研究和大脑不同位置的活动记录相联系。为了得到大脑反应的可靠测量值,实验作了很多次的尝试。图14表明了其中一次尝试的两个阶段。

    图14

    第一,要求受试者想象自己收到了一笔钱,在此例子中是50英镑。

    然后要求受试者在肯定的结果和在轮盘赌中作出选择。如果轮盘指针停在了白色区域,她就会“得到”全部的钱;如果指针停在黑色区域,她就什么也得不到了。赌博的预期值当然是确定的结果,在这个例子中就是得到20英镑。

    正如图14所显示的那样,同样的确定结果可以被构架成两种不同的方式:即得到20英镑或损失30英镑。客观的结果在两个框架下完全相同,而且基于现实的经济人会以相同的方式对这两个结果做出反应(不管框架的限制,只是选择确定的事情或赌一把),但我们已经知道人类大脑不会受限于现实。是接近还是逃避是经由文字引起的,而且当获得是确定的时候,系统1便会偏向于获得;若损失是确定的时候,系统1便又会规避损失。

    实验人员作了很多尝试,而且每位受试者都需要在获得和损失的框架内解决几个选择问题。正如所预期的那样,20位受试者都表现出了框架效应:在获得的框架下,他们更愿意选择确定的事;在损失框架下,他们更愿意选择赌一把。但是,受试者不都是这个样子的。有些人易受到问题框架的影响;而有些人不管框架,但他们作出的选择几乎和基于现实的人作出的选择一样。实验者相应地对20位受试者进行排序,并给这个排序一个惊人的标签:合理指数。

    受试者做每个决策时,大脑活动都被记录了下来。然后,所作的尝试被分为两组:

    1.受试者的选择遵从框架的尝试。

    ·在获得时,偏向确定的事

    ·在损失时,偏向赌一把

    2.受试者的选择不遵从框架的尝试

    惊人的结果让人们看到了神经经济学这一新兴学科的潜质,即研究在人们做决策时的大脑活动。神经经济学学家做了上千种这样的实验,而且他们了解到:大脑特定区域的“活跃”(表明氧气需求量增大,即神经活动加强)取决于任务本身。在个人专心于某一视觉对象、在幻想中踢足球、识别一张脸或思考一所房子时,大脑的不同区域会变得活跃。当个人有某种情感共鸣、情感冲突或注意力集中于解决某个难题时,大脑的其他区域会变得活跃。尽管神经科学家出于谨慎,没有使用“大脑的这种模式会……”这种说法,但他们对于不同大脑区域的“个性”已经很了解了,而且知道大脑活动对心理解释的分析已经大有进展。对框架的研究产生了三个主要的发现:

    ·在受试者的选择和框架相一致时,与情绪激发相联系的大脑区域(大脑扁桃体)会很活跃。这正是可引发情绪反应的词,如获得或损失产生趋向于确定事件(当该确定事件被构架成获得时)或避免确定事件(当该确定事件被构架成损失时)的动力时我们所预测的那样。因为情绪刺激词的缘故,大脑扁桃体可被快速访问—这点很可疑,很有可能是因为系统1的参与。

    ·在受试者没有顺从自己的意识时(即他们在已知确定的事是损失时,依然选择确定的事),和矛盾以及自我控制相联系的大脑区域(前扣带)会更活跃。拒绝系统1参与其中,显然会产生矛盾。

    ·最“理性的”受试者,即那些最不易受框架效应影响的人,大脑额叶区的活动会加强,该区域可将情绪和引导做出决策的理性联系起来。我可以从中明显地看出来,“理性的”个体不会都显示出强有力的神经冲突。似乎这些理性的受试者都是(经常,或不总是)基于现实做出决策的,少有冲突。

    这项研究通过把对真实选择的观察和神经活动的测量联合起来,对文字如何引起情绪反应,并“泄露”出最后的选择作出了很好的说明。

    阿莫斯和他的同事在哈佛医学院做的一项实验是情感框架一个经典的例子。受试者都是医生,实验者给受试者看了两种肺癌治疗结果的数据,分别是手术治疗和放射治疗。手术治疗可保证有5年的存活时间,因此,大家都愿意选择手术,但在短期内,手术要比放射治疗的风险更大。一半的受试者读到了关于存活率的数据,其他人收到了关于死亡率的相关信息。对手术短期结果的两种描述是:

    第一个月的存活率是90%。

    在第一个月里,有10%的死亡率。

    你已经知道了结果:在第一个框架下(84%的医生选择了它),手术治疗要比在第二个框架下(50%的受试者选择放射治疗)更受欢迎。两种描述的逻辑等价很明显,而且基于现实的决策制定者会作出同样的选择,不管她看到的是哪种描述。不过,我们都知道,系统1对于引起情绪的文字很敏感,在第二个描述中,死亡率就是会引起负面情绪的词,而存活率是引发正面情绪的词;90%的存活率听上去让人心安,而10%的死亡率却让人感到恐惧。这项研究的一个重要发现是医生和对医学涉猎不深的人(比如病患和商学院的研究生)一样,也容易受到框架效应的影响。显然,医学培训也阻挡不了框架效应的出现。

    “获得—损失”研究和“存活率—死亡率”的研究没有什么本质的不同。脑部造影研究中的受试者作的很多尝试时也碰到了不同的框架。他们能够认识到框架有分散注意力的作用,而且可通过采用一个共同的框架,或将“损失”转换成等量的“所得”,可使问题变得简单些。聪明的人(和机警的系统2)也需要学一学,而且有专长的几位受试者也会出现在实验者发现的“理性的”人中。相反,在存活率框架下读到关于两种治疗数据的医生没理由怀疑自己若在死亡率框架下读到相同的数据会作出不同的选择。重新构架是要付出努力的,而且系统2通常很懒惰。除非有明显的理由需要这样做外,否则,大多数人都会被动地接受在框架下的决策问题,因此很少有机会发现我们的偏好受框架约束而不是现实约束的程度。

    用框架性政策助推人们作出更好的选择

    阿莫斯和我通过一个例子来引入我们对框架问题的讨论,这个例子被认为是“亚洲病害问题“。

    假设美国正为一场来自亚洲的异常疾病作准备,这场疾病估计会夺取600人的性命。为战胜这一疾病,我们提出了两种方案。假设对方案结果准确的科学估测如下:

    如果采用了方案A,200人会获救。

    如果采用了方案B,有1/3的可能会救600人,有2/3的可能一个人也救不了。

    很多受试者都会选择方案A:他们更愿意选择确定的选项,而不想赌一把。

    方案的结果在第二种说法中有了不同的框架,如:

    如果采用了方案A’,400人会死。

    如果采用了方案B’,有1/3的可能没人会死,而有2/3的可能有600人都会死。

    请仔细看并对比两种说法:方案A和A’的结果是相同的,方案B和B’的结果也是相同的。然而在第二个框架下,很多人都选择赌一把。

    两种框架下不同的选择都符合前景理论。在前景理论中,根据结果的好坏,我们对打赌还是确定的事的选择也会不同。当结果是正面的时候,决策制定者更愿意选择确定的事(他们是风险规避者);当结果都是负面的时候,他们更愿意拒绝确定的事,愿意赌一把(他们会冒险)。这些结论在钱的问题上是选择赌还是确定的事时很适用。疾病问题显示出,当结果关乎生命时,同样的原则也适用。在这个情况下,框架实验显示:对风险规避或冒险的偏向都不是基于现实的。在同样客观的结果中,做出的偏向会随着不同的制定情况而反转。

    阿莫斯曾跟我说过他的某次体验,这次体验使得我们的故事更值得关注。阿莫斯受邀为一组公共卫生专家作演讲,这些专家要对疫苗和其他项目做出决策。他利用这个机会让这些医生们关注“亚洲病害问题”:一半的人看的是“拯救生命”的那个说法,而其他人回答的是关于“失去生命”的说法。如一般人一样,这些专家也易受到框架效应的影响。制定关于健康决策的专家也会被表面现象所左右,这的确让人焦虑,但我们必须适应重要的决策也受系统1影响(而不是掌控)的事实。

    更让人苦恼的是,人们在面对自身不一致时所发生的事情:“你在一种指定情况下选择肯定能拯救200条性命的选项;在另一种情况下,选择赌一把而不是接受丢失400条性命的事实。现在,你知道这些选择是不一致的,你要怎么抉择呢?“回答常是让人窘迫的沉默。作出原始选择的直觉来自系统1,而且并没有比偏爱获得20英镑而规避损失30英镑存在更多的道德偏见。确定能拯救的性命当然是好事,死亡是大家都不愿看到的。大多数人都发现他们的系统2在回答这些问题时没有道德直觉。

    我对伟大的经济学家托马斯·谢林心存感激,他为框架效应提供了一个很好的例子,他在《选择与结果》(Choice and Consequence)一书中描述了这个例子。在我们开始对框架进行研究前,谢林的书就已出版了,框架效应并不是他主要讨论的问题。他提到了在哈佛大学肯尼迪学院授课的经验,他授课的内容是税法中儿童的免征额问题。谢林告诉他的学生们说,每个孩子都应有标准的免征额,而且免征总额和纳税人的收入是不相关的。他问学生们对下面这个问题有何看法:

    富人的生育免税额是不是应该比穷人的更高?

    你的直觉会和谢林的学生们的直觉很相似,即认为给富人更大的免税额是不可接受的。谢林之后指出,税法的制定是恣意的。现有税法认定没有孩子的家庭是默认情况,每多生一个孩子,就多享有一些免税额。当然,税法也可以将另一种情况视为默认值,比如设定一个有两个孩子的家庭为默认情况。在这种情况下,有比默认情况中的孩子数量少的家庭就要额外缴纳免税额了。谢林又问他的学生们对于另一情况的看法:

    没有孩子的贫穷家庭是否要和没有孩子的富人家庭缴纳同样多的附加费?

    对此问题,你可能还会有和谢林的学生同样的反应,即和对第一个问题的反应一样,持强烈否定态度。但谢林告诉他的学生们,从逻辑上讲,他们不应该对这两个问题都持否定态度。纵观这两种情况,对于第一个问题来说,与没有孩子的家庭相比,有两个孩子的家庭相当于是在减税。但对于第二个问题来说,与没有孩子相比,有两个孩子相当于是在增税。如果在第一个问题中,你想要穷人因为多生孩子而享受到与富人多生孩子相同(或更大)的好处,那你就也该认为,穷人必须因为没有孩子而付出至少与没有孩子的富人相同的金钱。

    我们能看到,系统1在其中发挥了作用。它能对贫富问题产生快速的反应:在怀疑时,你会倾向于穷人。谢林的问题中令人意外的一点是,道德原则在其中没有发挥作用。对于同样的问题,受问题框架影响,道德原则往往会生成相互矛盾的回答。当然,你已经知道下一个问题会是什么了。你已经了解到你对问题的反应受到框架的影响,那么对于这个问题:应如何公平处理贫富两种家庭中儿童的免税问题?

    现在,你一定已经瞠目结舌了。对于穷人和富人间的不同,你有道德直觉,但这些直觉依赖于任意的参照点,而且它们并不是真正的问题所在。关于世界上真实情况的问题是每个家庭应该缴纳多少税,以及如何填写免税代码。你没有能指导你解决这些问题的强有力的道德直觉。你的道德感觉与框架相联系,与对实际情况的描述相联系,而不是实际情况本身。关于框架本质的描述是很刻板的:框架不应该被看成是种掩饰或曲解了潜在偏向的干预。至少在这个例子中(以及亚洲病害问题和是手术治疗肺癌还是辐射治疗的问题中),没有被框架掩饰或曲解的潜在偏向。我们的偏向是关于被架构的问题,且我们的道德直觉是关于描述的,而不是关于其实质的。不是所有的框架都是平等的,而且有些框架显然比其他对相同问题的描述(或思考)的方式要好。请看下面这组问题:

    一位女士买了两张价格为80美元的电影票。当她到了电影院时,打开钱包却发现票不见了。她会再买两张票吗?

    一位女士到了电影院,本想要买两张80美元的票,但排到时,她打开钱包却发现用来买票的160美元不见了。她可以用信用卡买票,但你觉得她会买吗?

    基于框架效应,看到此问题不同版本的受试者会得出不同的结论。大多数人都会认为:第一个故事中的那位女士如果丢了票会回家,不看电影了。而且大多数人相信,如果她丢了钱,她就会赊购票看电影。

    其中的解释大家应该已经很熟悉了,这个问题涵盖了心理账户和沉没成本悖论。不同的框架会触发不同的心理账户,且损失的严重性如何要看其指向的账户。若看某场表演的票丢了,人们很自然地会将损失指向“表演”这个账户。损失显然已经翻倍了,且远超过其应有的价值。相反,丢掉的钱会被记在“一般收入”的账户上:她会想电影院的常客比自己更穷,而且她会自问,自己可支配财富的减少是否会改变自己买票的决定。多数受试者都认为不会。

    对丢钱的规避可得到更合理的决策,产生更好的框架,因为损失已经(即使票丢了)“沉没”了,且沉没成本应该被忽略。已发生的事是不相关的,唯一要紧的事是电影院常客现有的选择及其可能的结果。无论她损失什么,相关事实是她在打开钱包前损失了些钱。如果丢票的人要问我的意见的话,我会说:“如果你丢了同等价值的钱,你还会再买票吗?如果会,就请再去买票吧。“广泛的框架和包括情况多的账户往往会导致更理性的决策。

    在下面这个例子中,两种框架引起了不同的数学直觉,其中一个比另一个更好。在2008年《科学》杂志中《每加仑汽油所跑英里数的错觉》的文章中,心理学家理查德·拉里克(Richard Larrick)和杰克·索尔(Jack Soll)确定一个案例,其中被动地接受错误的框架会产生高昂的成本和严重的政策后果。很多买车的人都列出了每辆车每英里所需的汽油量,并将其看成是影响他们决策的一个因素。他们知道高里程车的成本都较低。但美国常用的框架,即每加仑汽油能跑的英里数,却将个人和政策制定者引向了一个糟糕的方向。请看下面这两位想要降低其成本的车主:

    亚当原来的车耗油,每加仑汽油能跑12英里,现在他换了一辆更省油的车,每加仑汽油能跑14英里。

    贝斯爱护环境,她把原来每加仑汽油跑30英里的车换成了每加仑汽油跑40英里的车。

    假设这两位司机一年中的行程是相同的。换了车之后,谁的车更省油?你的直觉可能会和大多数人一样,几乎会肯定地认为贝斯比亚当更省油:她每加仑汽油多跑10英里,而不是2英里,也就是说她省了1/3(从30英里提升到40英里)而不是1/6(从12英里提升到14英里)。现在,请启动你的系统2算一算。如果两位车主都行驶了10 000英里,亚当就是从833加仑减至714加仑,共省了119加仑。贝斯的耗油量就会从333加仑降到250加仑,只省了83加仑。每加仑汽油行驶的英里数的框架是错误的,应该被每英里耗油量框架(或每100英里耗油量框架,这在其他国家应用得较广泛)来代替。正如拉里克和索尔提出的,由每加仑行驶路程引起的错误直觉很容易误导政策制定者和买车的人。

    卡斯·桑斯坦在奥巴马政府中任信息与规制事务办公室主任。和理查德·泰勒一起合著了《助推》一书,该书是将行为经济学应用到政策中的基本手册。恰巧,从2013年开始,每辆新车上都会贴上“节约燃料和环保”的标志,而且此标志还包含每英里耗油量,这在美国尚属首次。不过,正确的构想框架都是用小字体排印的,而我们所熟悉的每加仑耗油量的信息却用大字体排印,但无论如何,大致的方向还是正确的。在《每加仑汽油所跑英里数的错觉》的发表和实施部分正确改革的5年内,也许是将心理科学应用于公共政策的重要时期。

    在很多国家,意外死亡后是否愿意捐献器官会在此人的驾照上标注。这则标注的构想又是另一回事了,在此,一种框架要比另一种框架更优越。很少有人会质疑是否愿意捐献器官的决定是不重要的,但有证据显示,大多数人会草率地作出决定。这个证据来自欧洲各个国家器官捐献率的对比(此对比显示出临近的且文化相似的国家有着惊人的不同)。2003年发表的一篇文章中表示,器官捐献率在奥地利接近100%,在德国有12%,在瑞典有86%,而在丹麦只有4%。

    这些巨大的不同就是种框架效应,是由这个关键问题的模式引发的。高捐献率的国家要填决定不捐献的表格,不想捐献的人一定要填上某一项,如果他们不这么做了,则被认为是自愿的捐献者。低捐献率的国家要填决定捐献的表格,你必须填上某一项,才能成为捐献者。这就足够了。预言人们是否会捐献自己器官的最好且唯一的标志是默认选项的设计,这个设计不用勾选某项内容就可被采用。

    器官捐献效应与系统1控制下的框架效应不同,它可用系统2的懒惰给出很好的解释。若人们已经决定自己想干什么,会勾选这一项;如果他们还没有想好,则要想想是否要勾选这一项。我认为,人们要填的这张是否愿意捐献的表格与他们的决定相对应。我将器官移植表想象成要求人们解决算术问题:2+2=?另一项中又有另一个问题:13×37=?捐献率当然会受到这些数字的影响。

    当构想的作用得到认可后,一个政策问题产生了:应该采用哪种构想呢?在这个问题中,回答很明显。如果你相信大量捐献器官对于这个社会有好处,你就不会在有100%捐献率的情形和有4%的司机的捐献率的情形间保持中立立场。

    从这些例子中我们能反复看到,某个重要的决定是受该情况下完全无关紧要的特征的控制的。这似乎令人困窘—这不是我们想要的作出重要决定的办法。而且,这也不是我们想要体验到的大脑的工作方式,但这些认知错觉的实例确实是不容诋毁的。

    讨论的事项有理由与理性代理理论相抗衡。一个名副其实的理论可确定某些事件是不可能的—如果理论是正确的,某些事件就不会发生。当观察到“不可能”事件发生时,该理论就是被伪造的。有确切证据证明理论是虚假时,理论也还会存在很长时间,理性代理理论模式当然也能经受住我们看到的和许多其他证据的检验。

    器官捐献的例子表明了人类理性对现实世界有很大的影响。理性代理模式的信从者和怀疑者之间的一个重要不同是信从者只会理所当然地认为关于选择的构想不能决定对重要问题的偏向。即使在探讨这个重要问题时,他们也不会感到有兴趣,因此我们的决策常会有不好的结果。

    对此,对理性持怀疑态度的人不会感到惊讶。他们对无关紧要的因素会成为偏向的决定因素比较敏感,我希望读到本书的人能有这种敏感。

    示例—框架和现实“如果他们能对自己会得到多少钱而不是会损失多少钱有个框架的话,就会对将要发生的事有心理准备。”“通过改变参照点来重新架构问题吧,假想我们没有拥有过某个东西,我们会认为它值多少钱呢?”“对于损失,要在大脑中将其引入‘一般收入’,这样你就会感觉好一点!”“他们要你在他们的邮件列表中勾选以表明不加入他们。如果他们要你在他们的邮件列表中勾选表明参与的话,他们的邮件列表就会很短。”

  • 丹尼尔•卡尼曼《思考,快与慢》19-24

    第三部分 过度自信与决策失误

    第19章 “知道”的错觉

    纳西姆·塔勒布身兼商人、哲学家、统计学家等多种角色,还被视为心理学家。他在自己的著作《黑天鹅》中,引入了“叙事谬误”的概念,用来描述存有缺憾的往事是如何影响我们的世界观和我们对未来的预期的。我们不断试图去了解这个世界,在这个过程中难免就会产生“叙事谬误”。能够吸引人们眼球的那些说法往往很通俗易懂,那些说法具体而不抽象,它们认为天资、愚蠢和意图的作用都要超过运气的作用,它们关注的是少数几件已经发生的重大事件,而不是无数件并没有发生的事。任何新近发生的有影响的事都可能成为一个存在因果关系的故事的核心情节。塔勒布指出,我们人类常会为过去的憾事编造牵强的解释,并信以为真,以此来蒙蔽自己。

    好的故事为人们的行为和意图提供了简单且合乎逻辑的解释。你总是喜欢将行为看成是一般习性和个性特征的外在表现—你可以很轻松地找到这些结果的原因。此前讨论的光环效应是思维连贯性形成的部分原因,因为这一效应使我们更有可能将自己对某人所有品质的看法和对其特别重要特质的判断匹配起来。例如,如果觉得这位棒球投手又帅又强壮,那我们也很容易会认为他投球水平一定很高。光环效应也可能是负面的:如果觉得一位运动员很丑,我们就很可能会低估他的竞技能力。光环效应通过夸大评估的一致性来保持简单和连贯的特点:好人只做好事,坏人全都很坏。“希特勒喜欢狗和小鸡”这种说法,不论你听过多少次,无论如何都不会相信。因为根据光环效应,如此坏的人是不会有任何善意的,而这句话却违背了这一点。一致性使我们的想法有些固执,感觉模糊不定。

    引人入胜的故事会使人产生某种必然性错觉。谷歌变身为科技产业巨人的故事就是一例。斯坦福大学计算机科学系有两位极富创造力的研究生,他们想出了一个在互联网上搜寻信息的好方法,于是便筹集资金创建了一家公司,此后又连续做出很多行之有效的决策。几年后,他们创建的公司成为美国股票市场上最有价值的一家,这两位研究生也跻身全球顶级富豪之列。不同寻常的机遇再加上好运气使得这个故事引人入胜。谷歌上市一年后,他们就想以不到100万美元的价格卖掉公司,但买方却说太贵了。

    虽然详尽的历史更能详细说明谷歌创始人当时的决定,但我们前面的叙述已足以说明两位创始人当时所作的每一个决定几乎都为他们带来了美好的结局。一个更完整的故事还可以描述谷歌打败的那些公司所采取的行动,这些倒霉的竞争者似乎很盲目,它们行动迟缓,而且没有足够的能力来对抗谷歌的威胁。

    尽管我在讲述上述故事时刻意采用了平淡的口吻,但你仍然会有这样的想法:这个故事非常棒。如果加上更多细节,这个故事就会让你觉得自己明白谷歌成功的秘诀。它还会使你感觉自己学到了颇具价值的重要一课,了解了企业成功的秘诀。但不幸的是,我们有足够的理由相信,你对谷歌这个例子的理解和认识大都是错觉。想知道一个解释是否行得通,可以对它作一个最终测试,看它能否使这个事件事先就能被预测到。谷歌成功的故事就符合这样的测试,因为这其中没有哪一个故事会包含无数个可能会导致不同结果的事件。人类的大脑无法妥善处理没有发生的事情。事实上,很多实实在在发生过的重要事件中包含着众多抉择,这些抉择会诱导你夸大技能的作用并低估运气对最终结局的影响。因为每一个重要决策都有好的结果,上述故事堪称一个几乎毫无瑕疵的预言—但坏运气本来极有可能扰乱这些成功的步伐。光环效应还有最后一个阶段,即给该故事的主角戴上不可战胜的光环。

    如同看着一位技能娴熟的筏夫沿激流而下时巧妙地躲过一个又一个暗礁险滩一般,阅读谷歌的故事之所以令人振奋也是因为故事中艰难风险接连不断。然而,两者间有着很大的不同。技能熟练的筏夫有过上百次顺激流而下的经验,他能通过观察眼前的激流预测哪里有障碍,他学过如何对姿势进行微调来保持正确的方向。但对于年轻人来说,却没有多少机会去学习如何创建一家大型公司,更极少有机会学习如何避开潜在的风险—比如说他们的竞争公司推出了一款超级棒的新品。当然,谷歌公司的案例也包含了大量的技能,但运气在公司的实际运作中发挥的作用远远超出了故事中所讲述的那个水平。运气的成分越多,从中能学到的就越少。

    此处发生作用的就是强大的眼见即为事实原则。你会不由自主地去处理手头有限的信息,好像这些信息就是全部事实了。根据这些可得信息,你构建出最可能的故事,如果这个故事还不错,你就会相信它。然而自相矛盾的是,在自己所知甚少或是谜题的答案只是初露端倪时,我们却更容易构建出一个连贯的故事。我们满心相信这个世界是有意义的,这份信心建立在一个稳妥的基础之上:我们最大限度地忽略自己的无知。

    我曾听说太多人“在2008年金融危机发生前就知道这场危机不可避免”。这个句子中含有一个极有可能引发异议的词,在讨论重大事件时,这个词本不该出现在我们的词汇当中。这个词当然就是“知道”。有些人事前清楚地意识到可能会发生危机,但他们却并不“知道”究竟是什么危机。而他们现在却说他们当初就知道这场危机,那是因为危机确实发生了。这是对一个重要概念的误用。在日常生活中,只有在所了解的事情属实且其表现也真实的情况下,我们才会用“知道”这个词。但是那些当初认为会有危机的人(当初本没有那样多的人这样想,而如今却有更多人声称记得自己当时就是这样认为的)在当时并不能十分确定地指出危机是什么。很多聪明且见多识广的人对经济前景怀有浓厚的兴趣,并不相信灾难已经迫近。我从这个事实推论:危机是不可知的。在这个情境中运用“知道”一词很反常,并不是因为有些人因为这种预知能力获得了本不应属于他们的赞赏,而是这个词给人一种暗示,使人觉得这个世界比事实上更可知。这个词使得人们心中存有一种致命的错觉。

    这个错觉的核心是我们认为自己了解过去,这也表明未来也应该是可知的,但事实上,我们对过去的了解比我们自认为能够了解的要少。“知道”不是唯一一个会引起错觉的词。“直觉”和“预感”等词一般也可用来形容过去的想法变成了现实。“我预感这段婚姻不会长久,但我错了”这句话听上去有些奇怪,而类似“一种直觉最终被证实是错误的“这样的说法听来也很奇怪。为了想清楚未来,我们需要清除自己过去曾经用来表明信念的语言。

    后见之明的社会成本

    将从前的事编成叙事故事的大脑区域是构建意义的器官。当一件不可预知的事情发生时,我们会立即调整自己的世界观以适应这种意外。试想自己正在看一场足球赛,比赛双方的输赢记录相同。现在比赛结束了,其中一方击败了另一方。在你修正过的世界观里,赢得比赛的球队比输掉比赛的球队更加强大,你对过去和将来的看法也已经被这种新感觉改变了。从各种意外事件中积累经验的做法值得一试,但这样做也可能会导致一些危险后果。

    人类大脑的常规局限使它没有足够的能力重构过去的知识结构或信念。一旦接受了一种新的世界观(或对世界某一方面的看法发生了变化),你就会立即丧失很大一部分回忆能力,无法回想起自己观点改变之前的那些想法了。

    很多心理学家曾经研究过人们观念发生改变时究竟发生了什么这一问题。实验人员选了一个尚无定论的话题,比如说死刑,之后他们仔细测试了受试者的态度。接下来,受试者们会看见或听见一则颇具说服力的信息,这则信息对所选话题持或赞同或否定的态度。然后实验人员再次测试受试者的态度,受试者往往倾向于他们看到或听到的那个观点。最后,受试者要说出自己在实验前的观点。这项任务也许很难。受试者被问到之前的观点时,说的往往就是现在的观点,这便体现了替代理论,而且很多人都无法相信他们之前的观点与现在的不同。

    你无法重构过去的想法,这种情况会不可避免地导致你低估自己受往事影响的程度。巴鲁克。费斯科霍夫率先揭示了“我早就知道”效应,或者说“后见之明”现象,当时他还在耶路撒冷读书。在尼克松1972年访问中国和苏联之前,费斯科霍夫和鲁斯。贝斯(我们的另一名学生)作了一项调查。受试者需要对尼克松此次外交破冰之行中可能出现的15种结果的可能性作出评估。毛泽东会同意与尼克松会面吗?美国会在外交上承认中国吗?眈眈相向几十年之后,美国还会和苏联就重大问题达成共识吗?

    尼克松访问结束后,费斯科霍夫和贝斯让这些人回想他们对15个可能出现的结果的预测。结果很明显。如果一个事件果真发生了,人们就会夸大自己此前作出的预测的可能性;如果可能的事件并未发生,受试者就会错误地回忆说自己当初一直都认为此事发生的可能性不大。接下来的多次实验表明,人们不仅会高估自己最初的预测,还会高估其他人作出的预测。引起公众注意的其他事件中也出现了相似结果,例如辛普森谋杀案和比尔。克林顿总统的弹劾事件。根据发生过的事来改变个人的想法会产生深刻的认知错觉。

    后见之明的偏见对决策者的评估行为有着恶劣影响,它导致观察者不是根据判断过程的合理性来评估一个判断的好坏,而是以结果的好坏作为判断标准。假设有一个低风险的外科手术,手术期间发生了一件始料未及的事故,病人因此死亡。事后,陪审团更倾向于相信手术本来就存在风险,而且主刀医生应该比其他人更清楚这一点。即使在制定决策时其想法是合理的,这一结果偏见也会使人们几乎不可能对他的决策作出正确评估。

    后见之明对那些决策制定者而言尤其无情,他们的工作就像是为他人做代理人,这些人包括医生、金融顾问、三垒教练、执行总裁、社工、外交家以及政治家等。好的决策如果产生了坏的结果,我们就会责备那些决策制定者;而对那些只是在事后才能明确看出是正确的决策而言,其制定者也不会因此得到什么赞扬。这便是典型的“结果偏见”。若结果很糟糕,客户常会责备代理人没有看清墙上的笔迹—却忘了这笔迹原是用隐形墨水写成的,只有在事后才能变得清晰可辨。事前原本感觉很是谨慎的行动在事后也会被看成是不负责任的过失。曾经有一项以一个真实法律案例为基础的实验,实验人员问加利福尼亚大学的学生,明尼苏达州的德卢斯市是否应该花一大笔钱租用一个全天候大桥监控器来监视桥体,防止出现瓦砾阻塞河流的风险。其中一组学生只是看了该市做决策时的已有材料,其中24%的学生就认为德卢斯市应该承担租用洪水监控器的花销。第二组受试者则被告知瓦砾已经阻塞了河流,并引起了重大洪灾。尽管实验人员已经明确告诉他们不要让后见之明妨碍自己的判断,但这组中仍有56%的学生认为该市应该租用监控器。

    结果越糟糕,后见之明的偏见就越严重。遇有重大灾难发生时,比如“9•11”恐怖袭击事件,我们尤其容易相信那些没能预见到这场灾难的官员玩忽职守,置公民安全于不顾。2001年7月10日,中央情报局得到消息:基地组织可能正在谋划一次针对美国的重大袭击。时任中央情报局局长的乔治·特尼特(George Tenet)并没有把这则消息传达给总统乔治·W·布什,而是告知了国家安全顾问康多莉扎·赖斯(Condoleezza Rice)。当事实浮出水面之后,《华盛顿邮报》的传奇编辑本·布莱德里(Ben Bradlee)表示,“如果你对即将主宰历史的事件有所了解的话,也许就有机会直接登上总统宝座了,我认为就是这么简单”。但在7月10日这天,没有人知道—或者说有可能知道—这则消息最终会在历史上留下重重的一笔。

    很难在事后评论人们是否严格依照标准运作过程行事,因此那些希望自己的决定能经受住后见之明检测的决策制定者只好采用官僚的做派—极不情愿冒风险。由玩忽职守引起的起诉变得越来越常见,内科医生们以多种方式改变了自己的诊疗程序:要求患者作更多检查,请教专家更多病例,采用保守疗法,即使这些方法未必奏效也要用。这些行为与其说对病人有益,倒不如说是保护了医生,埋下了利益冲突的隐患。不断增强的责任可谓福祸参半。

    尽管后见之明和结果偏见总会有滋生风险之嫌,却也会给那些不负责任的冒险者带来不应得的回馈,例如某位将军或企业家一次疯狂的冒险举动竟然成功了。那些一直很幸运的领导者不但从未因冒太大的风险而受到惩罚,相反,人们总会相信他们有很强的鉴别力和先见之明,能够预见成功;而那些曾经怀疑过他们的明智的人事后也会被视为平庸、胆小、懦弱之辈。几次幸运的冒险便会给一个不顾后果的领导人罩上耀眼的光环:极富远见、英勇果敢。

    真的存在能让企业基业长青的秘诀吗?

    系统1的意义构建体系会让我们认为这个世界比现实中的更整洁、更简单、更可预知,且更富逻辑性。认为人类对过去了然于心这一错觉会带来更深层次的错觉—以为人类可以预知并控制未来。这些错觉会让人感到安适,如果我们允许自己充分接受世间事物的不确定性,这些错觉还会减轻自己将要体验的焦虑。我们都需要一颗定心丸,想知道我们的行动会有恰当的结果,想知道智慧和勇气一定会带来成功。很多商业书籍都是因此而应运而生的。

    领导者和管理措施是否会影响上市公司的最终成绩呢?回答是:当然会,而且其影响已被系统研究证实了,这些研究客观评估了众多执行总裁的个性特征及其决策,并将这些评估结果与公司后来的业绩联系在一起。在一项研究中,各位执行总裁的性格特征常常会受到他们之前所在公司的策略的影响,在现公司走马上任后,还会受到公司管理规定和程序的影响。诸位执行总裁的确会影响公司业绩,但这种影响远比商业书籍中所宣称的小得多。

    研究人员运用相关系数测量了上述(总裁个性与公司业绩之间)的相关系数,这个值在零到1之间变化。此前定义过了相关系数(和回归平均值的关系),即看共有因素在多大程度上对两种测量方式发生作用。公司成功和执行总裁特性之间的相关系数的最高值可能高达0.30,这就表明两者间有30%的重叠部分。为了充分了解这个数字的意义,请思考下面的问题:

    假设你要考虑很多组公司的情况。每组的两个公司情况大致相同,但其中一个公司的执行总裁比另一个优秀,那么你多久才能发现那个执行总裁比较优秀的公司会是这组中较强的?

    在一个秩序良好且可预知的世界中,相关系数会很高,而且你会发现每组中能力较强的执行总裁百分之百会领导那个更成功的公司。如果相似企业的相对成功完全是由其执行总裁控制不了的因素决定的(你也可以将这些因素称为运气),你就会发现,更成功的公司有50%的概率是处在较弱的执行总裁的领导之下的。0.30的相关系数表明你会找到那个能力更强的执行总裁来领导所有小组中60%较强的公司,这比随意猜想提高了10个百分点,这个结果充分印证了我们常常见到的对执行总裁英雄崇拜的现象。

    如果你曾经希望这个数值更高—我们中的大多数人都这么希望—就应该将这种想法视为自己容易高估现实世界的可评估性的标志。不要犯错:将成功概率从1∶1提高到3∶2是非常重要的,无论是在跑道上还是在商界中,都是如此。然而,在大多数经济书籍的作者看来,一位对公司业绩几乎没有什么控制能力的执行总裁是不会给人留下特别深刻的印象的,即使这家公司运行良好,人们也不会对他有什么印象。很难想象人们会在机场书店排起长队去买一本满怀热情描述商界领袖管理经验的书,因为这些领导的表现一般而言也就比仅凭运气强那么一点。消费者亟须对决定企业成功与失败的因素有个明确的了解,他们需要一些信息帮助自己了解这些因素,哪怕这些信息有多虚假都无妨。

    身为瑞士一所商学院教授的菲利普·罗森茨威格(Philip Rosenzweig)曾写过一本书—《光环效应》(The Halo Effect),该著作颇有见地。他在书中表明,有两种类型的商业书籍很受欢迎,能够满足人们对虚幻确定性的需求。这两种类型包括:描写特别的个人和企业(常见的)成功与(偶尔)失败的历史;分析成功与比较成功企业之间的区别。他总结道,成功和失败的故事常会夸大领导风格和管理措施对公司业绩的影响,因此这些故事基本上都没什么用。

    为了理解正在发生的事情,我们假设一些商业专家,比如说其他公司的首席执行官,应邀对某家公司的执行官进行声誉评估。这些首席执行官非常清楚该公司最近是在走上坡路还是下坡路。与此前了解的谷歌案例一样,本例中产生了一种光环效应。人们很可能认为一家成功公司的执行总裁必定是头脑灵活、讲究方法、行事果断的人。假使一年过后事情变得很糟糕,人们又会将同一位总裁描述成稀里糊涂、僵化死板、独断专行的人。两种描述当时听上去都是正确的:看起来说一位成功的领导者僵化死板、稀里糊涂是很荒唐的,而说一位苦苦挣扎的领导者头脑灵活、讲究方法似乎也很奇怪。

    明明是同一个人和同样的行为,在事情进展顺利时就是讲究方法,而事情进展不顺利时就成了死板,光环效应的影响的确太大了,因此你也许会发现自己对前述想法十分抵触。由于光环效应,我们将因果关系抛到脑后:我们很容易相信公司的失败是因为其执行总裁僵化死板,而真实情况是其执行总裁之所以显得死板是因为这家公司正每况愈下。错觉就是这样产生的。

    在对成功企业的系统研究中寻求其经营之道的书籍为什么格外有吸引力?将光环效应和结果偏见结合起来就可以对这个现象作出解释了。这种类型的书中知名度最高的有那么几本,其中一本是吉姆·柯林斯(Jim Collins)和杰里·波勒斯(JerryI. Porras)合著的《基业长青》 (Built to Last)。这本书包含了关于18组相互竞争的公司的全部情况分析,每组中都有一家公司比另一家更为成功。这些对比数据包括对企业文化、经营策略和管理措施等众多方面的评估。两位作者在书中宣称:“我们认为世界上每一位执行总裁、经理和企业家都应该读读这本书,读过之后你就能建造一家梦想的公司。”

    《基业长青》和其他类似书籍的基本概念是:良好的管理措施会得到认同,而执行这些措施会带来丰厚的回报。这两点都有些言过其实了。公司是非常成功还是不怎么成功,其间的区别在很大程度上要看这家公司是否幸运。知道了运气的重要性,看到非常成功和不怎么成功的公司在对比过程中体现的高度一致的模式,你就尤其应该持怀疑态度。因为存在不可测性因素,我们根本就不可能建立什么有规律的模式。

    因为运气起到很大的作用,所以我们无法通过对成功的预测推断出领导水平高低和管理措施优劣。即使你的预测非常准确,知道总裁有绝佳的洞察力和超群的能力,你还是不能预测这家公司会如何运转,你的预测比抛硬币的结果强不了多少。《基业长青》一书中对卓越的企业和不怎么成功的企业的对比研究显示,总体上讲,在该研究过后的一段时间里,两类企业在企业效益和股票收益等方面的差距几乎趋近于零。在《追求卓越》 (In Search of Excellence)这本著作中提到的各家公司的平均赢利额也在很短的时间内大幅下降。《财富》月刊做了一项关于“最受推崇的公司”的调查,调查发现,在过去20年里,评级最差的公司比最受推崇的公司的股票收益更高。

    你可能会试图用因果关系来解释这些观察到的结果:也许成功的公司变得自满了,不怎么成功的公司则更努力。然而,这么想是错的。必须缩小这个平均差距,因为最初的差距大都是因为运气所致,是运气使顶尖公司成功,使其他公司落后。我们已经遭遇过实实在在存在的统计学事实:回归平均值。

    通过提供人类大脑所需,企业成败的故事与读者实现了共鸣,这里的所需指的是关于成败的简单信息,其中明确表明了原因,忽略了运气的决定性力量和回归的不可避免性。这些故事引起并维持了关于了解的错觉,同时给读者上了一些没有什么持久价值的课,但这些读者却偏偏愿意相信这些内容。

    示例—后见之明“这个错误很明显,但这不过是后见之明,你事前根本无法知道。”“他从这则关于成功的故事中学到了太多,多得有些过头了,他现在已经陷入了叙事谬误的误区。”“她说这家公司经营不善,真是无稽之谈。她并不了解这家公司,只知道其股票在下跌。这是结果偏见,其中一部分是后见之明,一部分是光环效应。”“我们不要带有结果偏见。尽管结果偏见有时也很管用,但这个决定是很愚蠢的。”

    第20章 未来是不可预测的

    系统1在信息有限的情况下也能得出结论,但我们却无从得知得出这个结论的过程有多复杂。因为有了眼见即为事实原则,所以只有眼前的条件才是最重要的。逻辑上的连贯性能给人信心,而我们在观点中表现出的主观自信也反映出系统1和系统2所构建的情景的连贯性。证据的数量和质量并不那么重要,因为即使证据十分苍白也能构建一个非常连贯的故事。对于一些最重要的信念,我们其实根本就没有什么证据来证明其合理性,我们怀有这些信念仅仅是因为我们所爱的人和所信任的人也持有同样的信念。由于所知甚少,我们对自己信念的信心是毫无缘由的—但这种信念也很重要。

    士兵测评的有效性错觉

    几十年前,我在以色列军队服兵役。当时我已经拿到了心理学学士学位。做了一年的步兵军官后,我被派到部队的心理科,有时候我需要对士兵进行测评,看其是否完成了军官培训科目。我需要在炎炎烈日下站很长时间,观察几组汗流浃背的士兵是如何解决问题的。我们使用的测评方法是英军在“二战”时开创的方法。

    其中一项实验名为“挑战无领导小组”,这项实验是在障碍训练场上进行的。参加实验的有8个士兵,他们之间互不相识,军衔都被摘掉了,身上只贴数字标签以作鉴别,他们的任务是将地上的原木拖过6英尺高的墙。全组所有人都必须翻过墙且原木既不能碰到地也不能碰到墙,而且任何人都不许碰到墙。一旦出现了任何一种违规情况,他们就必须报告并从头再来。

    解决这个难题的办法有很多种。其中一个普通的办法就是让几个人像拿钓鱼竿一样按照一个角度把住原木,其他人通过原木攀缘而爬过墙。或者让一些士兵踩着他人的肩膀跳过墙去。到最后一个人时,其他人就要按照一个合适的角度把住原木,此时原木的一端是悬空的。待他跳上原木后,翘起原木,让他滑过去,最后安全地跳到墙的另一面。在这一环节中,失败是常有的事,他们需要不断从头再来。

    我和另一位同事看着他们训练,记录下是谁在指挥其他人,是谁想要领导却被断然拒绝,还要关注每位士兵的合作精神对整个小组能力的影响情况。我们发现有人固执,有人顺从,有人自负,有人脾气暴躁,有人执著,而有人其实就是个逃兵。有些人的想法一旦被小组否定了,他们就不再那么努力了。然而,从这些人身上我们有时也能看出些斗志来。我们还观察了这几位士兵面对危机时的反应:有人会斥责那个导致整组沦陷的人,有人在这个精疲力竭的小组还需从头再来时打头阵。在这个测验的压力下,我们感到其中每个人都展现了自己的天性。我们对参加实验的每位士兵性格的印象就如同天空的颜色那样真切、那样深刻。

    观察过这些士兵完成的几次测试之后,我们就要对他们的领导能力和决策能力进行总结,而且要用分数表示谁在军官训练中是合格的。我们深入讨论了每一次测试,回顾了我们对他们的印象。这项任务并不难,因为我们感觉自己已经看到了每位士兵的领导能力。有些人像是强势的领导;有些人则比较懦弱,或是自大愚蠢;还有的人虽然平庸但并非无药可救。有几个人看上去非常软弱,只能将他们从军官候选人行列淘汰出去。在将对每位士兵的多角度观察汇集成连贯的情况时,我们对自己的评估很有信心,感觉我们所看到的一定是他们未来的发展。当小组遇到麻烦时,敢于担当并带领团队翻过障碍墙的士兵当时就是整个队伍的领导者。那么,他在训练中或战场上会如何表现呢?显然大家都会猜测他会像在翻墙训练中表现的那样非常高效,其他的推测都不太可能,因为现实情况就摆在我们眼前。

    因为对每位士兵表现情况的印象总体来看是清晰且明确的,所以我们在正式预测时也没有任何迟疑,脑海中通常只会出现一个分数,几乎不会有心生疑虑的情况,也极少有自相矛盾的情形。我们很愿意这样断言:“这个士兵根本不行”,“这个比较平庸,但还算可以吧”,或者说“他将来肯定是个人才”。我们觉得没必要质疑自己的预测,也没有必要过低预测或者只说些模棱两可的话。但如果有人对这份测评结果提出质疑,我们也愿意承认,会说“当然了,什么都可能发生”。之所以愿意承认这一点,是因为不管我们对参与测试的每位士兵的印象如何,都十分确信这份预测在很大程度上是无效的。

    事实表明,我们根本就无法对参与测试的士兵的表现进行准确的预测。每隔几个月我们就会召开一次反馈会议,会上我们会了解这些新兵在军官训练学校的表现,并将我们(对他们)的评估和管理过他们一段时间的教官的意见进行对比。每次得到的结果几乎总是相同的:我们对这些士兵在军官学校的表现进行预测的能力弱到完全可以被忽略掉。我们的预测也就比凭空猜想强点,但也强不了多少。

    得知这个令人气馁的消息后,我们颇沮丧了一段时间。但这里毕竟是军队,无论管不管用,都要按程序办事,都要服从命令。第二天又来了一批士兵。我们把他们带到障碍训练场地,看着他们面对着墙,抬起原木,几分钟后他们的真正本性就暴露无遗,和之前那些士兵一样明显。我们预测的质量虽低,但这个事实对于我们怎样评估士兵完全没有影响,对于我们在判断和预测士兵能力时的信心也影响甚微。

    这一切都很令人关注。之前预测失败的主要原因本应动摇我们对士兵进行评判的信心,然而我们的信心并未因此受到影响。这个原因本来也可能使我们适度调低自己的评价,但我们却并未受其影响降低评价。其实我们知道自己的预测只比随意乱猜强一点,一般情况下都是这样,但我们仍然感觉自己所作的每一项预测都是有根据的,而且我们还会按照自己的预测行事。这让我想起了缪勒–莱耶错觉,我们都知道图中的线段是等长的,但一眼看过去仍然觉得它们长度不同。我对这种类推非常感兴趣,所以特意为我们的这种体验创造了一个术语:有效性的错觉。

    我曾经发现了自己的第一个认知错觉。

    几十年后的今天,我仍能从那个旧时的故事中看到自己思考的许多中心问题,这些问题也是本书的写作主题。我们对这些士兵未来表现的期望是替代问题的一个典型实例,更堪称典型性启发式的经典案例。我们曾经在一个模拟情景下观察一个士兵的行为,一小时后我们感觉自己能判断该士兵在面对军官训练和无领导作战的挑战时会有何表现。我们的预测是完全不能回归的,我们仅仅根据非常薄弱的证据就推测失败或者大获全胜,没给自己留一点余地。这也正是“眼见即为事实”的典型实例。

    我们对观察到的行为印象深刻,对最终决定这些人作为军官表现的因素却知之甚少,而且没有什么好办法来体现这种无知。

    回顾我们所做的一切,其中最值得注意的就是我们对一般原则的认识,即我们无法作出预测,这种认识对我们对个体案例的信心没有什么影响。现在我明白了,我们的反应与尼斯贝特和博吉达的学生们在得知大多数人不会去帮助疾病发作的陌生人时的反应相似。他们当然会相信自己看到的统计数字,但在判断视频中看到的某人会不会去帮一个陌生人时,基础比率并没有影响他们的判断。就像尼斯贝特和博吉达说的那样,人们通常不愿从一般情况中推断特殊情况。

    对某个判断的主观自信并不是对这个判断正确概率的合理评估。自信是一种感觉,它能反映出某条信息和处理该信息时所体现的认知放松的一致性。由衷地承认不确定性乃明智之举,但如果有人声称自信满满,只能说明他在脑海里已经构建了一个连贯的情节,当然这个情节未必是真实的。

    投资股票的技能错觉

    1984年,我和阿莫斯以及我们的朋友理查德。泰勒访问了华尔街的一家公司。接待我们的是该公司的高级投资经理,他请我们来是要讨论判断偏见在投资中的作用。我对金融了解不多,都不知道要问他什么,但我还记得我们之间的一次交流。“你售出一只股票后谁会买?”他大致朝窗户那边挥了一下手,表示他希望买方会是像自己一样的人。这就奇怪了:是什么东西使得有人买有人卖呢?是什么使得卖方觉得他们知道买方一无所知的事情呢?

    自那时起,我对股票市场的问题就越来越迷惑:一个重要产业在很大程度上似乎是建立在“技能错觉”的基础上的。每天都有数十亿笔股票交易,很多人会买同一只股票,而其他人则将这只股票出售给他们。一只股票一天当中有一亿多的股份转手是常有的事。大多数买方和卖方都知道他们享有相同的信息,之所以进行股票交易主要是因为他们有不同的想法。买方觉得股价太低,很有可能会升值;而卖方认为股价过高,极有可能下跌。问题在于为什么买卖双方都觉得当前的股价有问题,为什么他们认为自己比市场更了解股价?对于他们中的大多数人来说,这种想法其实是种错觉。

    总的来看,股票市场运行的标准理论是为业内所有人士所接受的。投资行业中的每个人都读过波顿·麦基尔(Burton Malkiel)的著作《漫步华尔街》(A Random Walk Down Wall Street)。麦基尔的核心理念是,一只股票的价格包含了关于公司价值和对股票前景的最佳预测的所有信息。如果有人相信某只股票的价格明天会上涨,他们今天就会买进更多该股票。而这种大量买进该股票的行为也会反过来导致股价上涨。如果市场上所有资产的标价都是正确的,就没有人能通过交易来预测会赚还是赔了。最佳价格使得聪明无处施展,但它们也会保护不聪明的人免受自身愚钝的损害。然而,我们现在知道这个理论并不完全正确。很多投资者在交易过程中一直在赔钱,连会扔飞镖的黑猩猩都能比他们做得更好。这个令人惊讶的结论是由特里·奥登(Terry Odean)首次提出来的,他是加州大学伯克利分校的一名金融学教授,也曾是我的学生。

    奥登对一万名投资者的收益账目中体现出来的长达7年间的交易记录进行了研究,他分析这些投资者通过那家公司进行的每一笔交易,总共有接近16.3万笔交易。凭着这组丰富的数据,奥登便能确定为什么一位投资者会卖掉自己所持的某只股票的一些股份,随后很快又买进另外一只股票。通过这些行为,投资者透露了他(大多数投资者都是男性)对两只股票前景的明确想法:他希望自己要买的股票比自己要卖的股票走势更好。

    为了确定这些想法是否能站得住脚,奥登对投资者卖掉的股票收益和买进的股票收益进行了对比,这项对比是在交易完成一年后进行的。结果明显很糟糕。平均来说,个体交易者卖掉的股份比他们买进的走势要好,而且赢利空间相当大:每年约有3.2个百分点,远远超过两种交易的执行成本。

    当然这只是平均水平,记住这点很重要:有些投资人做得很好,而有些投资者则做得差得多。然而,显然对于个人投资者中的大多数人来说,冲个澡,然后什么事也不做也会比践行脑中出现的想法更好。后来,奥登和他的同事布莱德·巴布尔(BradBarber)在研究中也支持这个结论。在一篇题为“交易有损你的财富”的论文中,他们表示,总体来看,最积极的交易者往往会得到最糟糕的结果,而交易最少的投资者却赢得了最高的收益。在另一篇题为“男儿本色”的论文中,他们提到男性比女性更常按照自己无用的想法行事,而女性在投资中的收益比男性取得的收益更多。

    当然,每笔交易总是会涉及第三方的某个人。一般来讲,这第三方就是金融机构和专业投资者,他们善于利用个人投资者在选择卖出哪只股票和买进哪只股票的过程中所犯的错误。巴布尔和奥登的深入研究对这些错误作了解释。个人投资者常会抛售“赢利股”以保持自己的收益,“赢利股”即为买进后增值的股票,是涨是跌要看“亏损股”了。不幸的是,近期的赢利股比近期的亏损股在短期内走势更好,所以这些个人投资者卖错了股票,也买错了股票。可以预见,个人投资者都集中到那些吸引他们注意力的公司那儿去了,因为媒体在宣传那些公司。职业投资者往往会更有选择地接收消息。这些发现让我们晓得,金融专业人员所推崇的“掌握内情下赌注”的说法有一定道理。

    尽管专业人员能够从业余人员身上赚到数目可观的一笔财富,但几乎鲜有哪个炒股的人拥有可以年复一年地在股市上始终立于不败之地的能力。专业投资者,包括基金经理,在一项基础能力测试中失败了,这项测试即为持久性成就。对所有技能的研究结果都表明:个体成就的差异具有一致性。其中的逻辑很简单:如果任何一年中的个体差异完全是由于运气,那么关于投资者和基金的排位就会不规律地改变,年与年之间的相关系数就为零。但是,涉及技能因素时,排位就会更稳定一些。个体差异的持久性是一种测量方式,通过这种方式我们就能确定高尔夫球员、汽车推销员、牙齿整形医生或者公路收费员是否拥有这种技能。

    对冲基金是由经验丰富且工作努力的专业人士管理的,这些专业人士买卖股票是为了给他们的客户赢得最佳效益。然而,从50多年的研究中得来的证据还是很具决定性的:对于大多数基金管理者来说,选择股票更像是掷骰子,而不像是玩扑克。任何一年中,往往每3只对冲基金中至少有两只的表现要比整个市场的整体表现差。

    更重要的是,对冲基金收益的年度相关系数非常小,也就比零稍高那么一点点。每年成功的基金差不多都是靠运气,或者说他们骰子掷得好。众多研究者有一个普遍认同的观点,那就是几乎所有炒股的人,不管他们对股票是否了解(很少人了解股票),都在玩碰运气的游戏。交易者的主观经验只不过是他们在很不确定的情况下作出的看似明智的猜测而已。然而在高效率的市场中,明智的猜测比瞎猜也准不了多少。

    几年前,我得到一次非同寻常的机会,可以近距离调查金融技能中的错觉问题。我应邀到一家公司为一组投资顾问作报告,这家公司为非常富有的客户提供金融建议和其他服务。我向他们要了一些数据用于准备报告,还有一个小收获:一张电子表格中有25位匿名的财富顾问连续8年来的投资收益。每位顾问(大多数顾问都是男性)每年所得的分数直接与他的年终奖金挂钩。按照每位顾问每年的表现进行排序,并决定他们中是否一直存在技能差异,以及同一个财富顾问为他的顾客赢得的收益是否一年更比一年多,这些都是非常简单的事。

    为了回答这个问题,我以两年为一组计算了排序的相关系数:第一年和第二年,第一年和第三年……一直到第七年和第八年。每两年会有一个相关系数,总共就会有28组相关系数。我知道其中的理论,也希望能找到能够表明技能持久性的些许论据。我仍然惊讶地发现28组关联值的平均值仅为0.01。换句话说,就是零。我们并未能发现技能差异的持久关联性。这样的结果和你在掷骰子比赛时所期待的如出一辙,却与技能比赛大相径庭。

    这家公司中似乎没有人注意到这场游戏的本质,即股票玩家在操控一切。顾问们感觉自己在这份严肃的工作中是有能力的专业人士,而且他们的上级也同意这一点。在研讨会召开的前一个晚上,我和理查德。泰勒与该公司的一些主管共进晚餐,这些主管是决定年终红利多少的人。我们让他们猜猜每位顾问不同年份间的排名有什么关联。他们觉得自己似乎知道我们的意图了,笑着回答道“关联不大”或说“表现当然会有波动”。然而我们很快明白了,没有人希望平均相关系数为零。

    我们向这些主管传达了这样一个信息,至少在构建证券投资组合时,该公司是凭借运气得到的回报,而不是技能。这一点本应让他们感到吃惊,但却没有。他们完全没有表露出不相信我们的迹象。为什么会这样?毕竟我们已经分析了他们的业绩,虽然措辞谨慎,但他们经验老到,肯定看得出来其中的含义。大家继续安静地吃饭,

    我确信我们的发现及其含义都被他们刻意掩盖了,这家公司又回到了以前的运行状态。对技能的错觉不仅是个人的失误,它还深深植入了这个产业的文化中。许多对这一基本假设提出挑战的事实—因此也威胁着人们的生计和自尊心—还远远没有为人们所接受,人类大脑还没有消化这些事实。对绩效的统计研究尤其如此,这种统计研究提供了基础比率信息,当这一信息与自己从经验中得来的印象互相冲突时,人们一般就会忽视它。

    第二天早晨,我们把各项发现告知这些顾问,他们的反应都非常冷漠。他们是对复杂问题进行仔细判断的人,这种经验对他们来说比一个陌生的统计结果更深入人心。活动结束后,昨晚一起吃过饭的一位主管把我送到机场。他用一种带着戒备的口吻跟我说:“我在这个公司做得非常好,没人可以否认这一点。”我笑了笑,什么也没说。我想:“我今早已经否认这一点了。如果你的成功主要是靠运气,那你又能将多少成绩归功于自己呢?”

    主观自信与专业文化为认知错觉提供了生存的土壤

    认知错觉比视觉错觉更顽固。缪勒–莱耶错觉虽然告诉你线段长度是相同的,但这没有改变你看线段的方式,却改变了你的行为。现在你知道不能相信自己对末端有箭头的线段长度的印象,而且你还知道在一般的缪勒–莱耶错觉中不能相信自己的眼睛。如果有人问起线段的长度,你会说出别人告诉你的长度,而不是你将看到的错误长度。与此相反,当我和同事们在以色列军队中得知领导能力评估实验的有效性很低时,我们很理智地接受了这一事实,但这并未影响我们的感觉及此后的行动。我们在金融公司得到的反应结果更是极端。我现在相信泰勒和我传达给那些主管与投资经理的信息立即就被放到记忆中的黑暗角落里去了,因为放到那里就不会对自己产生什么危害了。

    不管是业余投资者还是专业投资者,都会固执地认为他们能比市场做得更好,与自己曾经接受的经济理论背道而驰,与自己从他人对自身经历公正客观的评价中学到的东西背道而驰,这是为什么呢?为什么金融界中的技能错觉可以长盛不衰?要解释这个问题,我们需要提及此前几章中的很多主题。

    产生错觉最有说服力的心理学原因当然是玩股票的人拥有的都是高水平的技能。他们要查询经济数据和各种预测,查看损益表和资产负债表,评估高层管理的质量,还要对竞争对手进行估量。所有这些都是严肃的工作,需要经过大量训练。当然,从事这项工作的人也有直接(且正当)的机会来运用这些技能。不幸的是,光有评估公司商业前景的技能还不足以确保在股票交易中取得成功,因为股票交易中的关键问题是关于该公司的这些信息是否已经包含在股价里了。交易者显然缺少回答这一关键问题的能力,但他们貌似又对自己的无知一无所知。通过在障碍训练场上观察新兵,我发现交易者的主观自信是一种感觉,不是一种判断。我们对认知放松和联想一致性的理解将这种主观自信深深地植入了系统1。

    最后,有效性错觉和技能错觉是由一种强大的专业文化来支撑的。我们知道,在任何情况下,当身边的人都跟自己持同样的想法时,不论这种想法有多么荒唐,人们都能保持一种不可动摇的信念。如果处于金融领域中的专业文化之中,那么该领域中很大一部分人就会相信自己是能做到别人做不到的极少数人之一。这种想法不足为奇。

    专家预测的准确度比不上扔飞镖的猴子

    人们想当然地从对过去的解读中预测未来,总是忽视“未来是不可预知的”这一观点。正如纳西姆·塔勒布在《黑天鹅》一书中指出的那样,我们更愿意构建和相信对过往的连贯叙述,这种叙述使我们很难接受自己的预测能力的限度。我们都知道后见之明这个道理,金融专家也是在仔细研读每份晚报之后才对当天的大事作出令人信服的解释的。今天的后见之明中有价值的部分,其实昨天就可以预见到,我们不能抑制这种强烈的直觉。我们理解过去所产生的错觉会使我们对自己预测未来的能力过于自信。

    人们常用的“历史的征程”这一意象暗含秩序和方向之意。征程与漫步或者走路不同,不是随意的。我们认为自己应该能通过关注声势浩大的社会运动、文化科技发展,或者几位伟人的意向及能力来解释过去。重大历史事件是由运气决定的,尽管这一说法显然是正确的,却依旧令人震惊。提到20世纪的历史—包括其中的重大社会运动—就很难不提到希特勒、斯大林。在孕育希特勒这个生命的卵子受精后,这个受精卵将来发育为女性的概率为50%。将两件“大事”综合来看,20世纪就有1/8的可能性不会出现这两位掌权人,而一旦缺少了这两个人物,整个历史几乎就会被改写。这两个卵子的受精过程有着重大意义,也是对“长期发展是可以预测的”这一观点的巨大讽刺。

    然而有效预测的错觉仍然没有受到丝毫影响,做预测生意的人充分利用了这一事实,这里所说的从事预测生意的人,不仅有金融专家,还有商界和政界的权威。电视台、电台和各家报纸都有自己的专家团,他们的工作就是对新近发生的事件进行评论,对未来进行预测,而观者和读者就会感觉自己在接受为自己量身定做的或者至少是极有见地的信息。当然,诸位专家和助推者也发自内心地认为他们提供的就是这样的信息。宾夕法尼亚大学心理学家菲利普·泰特罗克(Philip Tetlock)在一项长达20年的里程碑式的研究中解释了所谓的专家预测现象,这项研究发表在他2005年出版的《专家的政治判断:有多好?我们如何得知?》(Expert Political Judgment:How Good Is It? How Can We Know?)一书中。泰特罗克为此话题的进一步讨论设定了一些术语。

    泰特罗克采访了284位以“评论政治和经济走向或提出建议”为职业的人。他让这些人对某些大事在不久的将来的发生概率进行评估,这些事件既涉及他们的专业领域,也涉及他们所知甚少的领域。戈尔巴乔夫在政变中会遭到驱逐吗?美国会参加波斯湾战争吗?哪个国家会成为下一个大型新兴市场?泰特罗克一共搜集了8万份预测。他还问过这些专家是如何得出结论的,若结论是错的,他们会有何种反应,以及他们对不能支持自己立场的论据要如何评估等问题。受试者需要对每件事的3种可能结论的出现概率作出评估:例如在政治自由或经济发展方面,是会维持现状、有所增长还是有所下降。

    结果令人震惊。这些专家表现得很糟糕,如果他们简单地将这3种潜在结果出现的概率平均一下的话,可能会做得更好。换句话说,那些花时间以研究某一特别课题为生的人作出的预测还不如扔飞盘的猴子预测得准确,因为猴子能平均对待每种可能。即使在自己最了解的领域中,专家的预测也比非专业人士好不到哪儿去。

    那些了解更多的人比了解少的人作出的预测强不了多少。知识最丰富的人反而常常不大可靠,原因是学到更多知识的人对自己的技能产生了一种无限放大的错觉,进而变得不切实际、过于自信。泰特罗克写道:“为了获取知识,我们匆忙而草率地预测出利润回馈缩减的临界点。在这个理论高度专门化的时代,没有理由假设顶级期刊的投稿人—著名的政治科学家、各领域研究专家以及经济学家—比记者或《纽约时报》的细心读者强多少。”泰特罗克发现预言者名气越大,他们的预言就越夸张,他写道“那些受欢迎的专家比他们那些远离聚光灯大肆评论的同事更自信”。

    泰特罗克还发现,这些专家不愿承认自己过去错了,非要他们承认错误时,他们就会有一大堆借口,比如我的失误在于时机不好,突发意外之事,或者就说“我错了,但我有正当理由”。专家毕竟也是人,他们被自己的荣耀蒙蔽了,而且还痛恨错误。泰特罗克说,专家犯错误不是因为他们的思考内容,而是因为他们的思考方式。

    他引用了赛亚·柏林所写的关于托尔斯泰的文章中的术语,“刺猬与狐狸”。刺猬“知道一件大事”,对这个世界有它们自己的一套理论,它们在一个清晰的框架下说明某些特殊事件,对不按自己的方式看待事情的人往往没有耐心,而且对自己的预测很有信心,它们尤其不愿承认错误。对于刺猬来说,错误的预测常是由于“时机不佳”或“就差一点儿”。它们固执己见,没有罪过,而这一点正是电视制片人喜欢在节目中看到的。两只刺猬对一个问题各执己见,每只都想攻击对方的愚蠢观点,这真是一场好戏。

    而狐狸却相反,它们是更复杂的思想者。它们不相信仅凭一件大事就可以推动历史的进程(例如,他们不可能接受罗纳德。里根与苏联强硬对抗,仅凭个人力量结束冷战的观点)。相反,这些狐狸认识到,很多不同因素和作用力的相互作用导致了这一结果,这些因素中也包括纯运气因素,而这一结果往往会导致更大、更不可预知的结果。尽管狐狸的表现仍旧很差劲,但在泰特罗克的研究中,它们的得分却最高。谈及请谁参加电视辩论,可能刺猬被选中的概率会大些。

    本章的主要观点并不是说那些企图预测未来的人会犯很多错误,即使不说也是如此。我们应该了解的第一点是,预测错误不可避免,因为这个世界就是不可预知的;我们应该了解的第二点是,我们不应该相信高度主观的自信就是准确性的指示器(低度自信可能更有益处)。

    短期内的走向是可以预测的,且人们的行为和成就能从以往的行为和成就中得到较为准确的预测。不过,我们不应该根据士兵在障碍训练场上的行为来推测他们在军官训练和战场上的行为,测试和现实世界中的行为是由特定情况下的很多因素共同决定的。从有8个新兵的小组中调走一个坚定且自信的,其他人的个性特征也会改变。狙击手的子弹会偏移几厘米,军官的行为也会有所改变。我不否认这些测试的正确性,如果一项测试对重要结果的预测的正确性达到0.20或0.30,这项实验就应该得到推广应用。不过,你不应再有更多奢望了。你应该降低对华尔街炒股人的期望,或者干脆就不相信他们,这些玩股票的人就是些希望自己比市场预测未来股价更准确的人。你也不应该对专家们作出的长期预测抱有很高期望,尽管他们关于不远的将来可能会有有价值的见解。目前,还没有划定分开可预测的未来和不可预测的长远未来的界限。

    示例—有效性错觉与技能错觉“他知道这份记录表明这种疾病的变化几乎是不可预知的,他怎么会对这个病例表现得这么自信?听起来像是有效性错觉。”“她能通过一个富有逻辑连贯性的情景来解释自己所知道的一切,这种连贯性让她感觉很好。”“是什么让他觉得自己比市场更聪明呢?是技能错觉吗?”“她就像只刺猬,有一个可以解释所有事情的理论,这让她产生一种错觉,那就是她了解这个世界。”“问题不在于这些专家是否训练有素,而在于他们的世界是否是可预测的。”第21章 直觉判断与公式运算,孰优孰劣?

    保罗·米尔(Paul Meehl)是个性格奇特而又超凡脱俗的人,是20世纪最有才华的心理学家之一。他曾在明尼苏达大学的心理学系、法学系、精神病学系、神经病学系以及哲学系任教,同时写了宗教、政治科学方面的文章,还曾经研究过老鼠。米尔习惯用统计数字说话,经验丰富,曾对临床心理学的空洞言论大加批评,在精神分析方面有过实践。他写过一些论述心理学研究的哲学基础的文章,这些文章很有思想,我在读研究生时几乎能把它们全部背下来。我从来没见过米尔,但自从我读了他的那本《临床与统计的预测:理论分析与事实回顾》(Clinical vs. Statistical Prediction:A Theoretical Analysis and a Review of the Evidence)后,他便成了我心目中的一位英雄。

    在这本他后来称为“让我烦恼的小书”的薄册子里,米尔回顾了20项研究结果,这些结果分析了以经过训练的专业人士主观印象为基础的“临床预测”,是否比按某种规则将一些分数或等级评定结合在一起作出的“统计”预测更准确。在一项典型的研究中,经过训练的辅导员预测了新生在学年末的成绩。他们与每个学生进行了45分钟的谈话,还参考了他们高中时的成绩、几次能力测试加上一份4页长的学生的个人陈述。数据统计的方法则只采用了其中的一小部分信息,即高中成绩和能力测试。然而,应用数据统计方法得出的结果要比14名辅导员中11个的预测都准确。米尔综合其他多种预测结果得出了相似的结论,这些预测包括违反假释程序、飞行员的成功训练以及刑事累犯情况等。

    不出所料,米尔的著作在临床心理学家中引起了震惊和质疑,这一争议引发了一股研究大潮,自该书出版至今50余载,这股大潮还在继续。将临床预测和统计预测进行对比的研究报告大约已有200篇,然而两者的对峙依然没有分出胜负。大约60%的研究指出,运算手法更准确。其余的比较研究认为两者准确性相近,但似乎数据统计方法更胜一筹,因为它比人工判断的成本低。至今还没有令人信服的例外情况记录在案。

    预测结果的范围已经延伸到了医学的可变因素,比如癌症病人的寿命、住院时间、心脏病的诊断以及婴儿对猝死综合征的敏感性;经济措施,比如新企业的成功前景、银行对信用危机的评估、员工对未来职业的满意度;政府机构所关心的问题,比如收养人的适合条件评估、少年累犯的可能性以及其他暴力行为发生的可能性;还有一些混合结果评估,比如科学报告的评估、橄榄球比赛的胜负预测以及波尔多酒的价格预测。这些领域都有很强的不确定性和不可预见性。我们将其称为“有效性低的环境”。在这些情况下,专家预测的准确性与简单的运算得到的结果相当,甚至还要低于简单运算的结果。

    在该书出版30年后,米尔自信而骄傲地说:“在社会科学中,还没有哪一项研究像这项一样,众多研究虽定性不同,结果却都一致地指向同一个方向,这一点是毫无争议的。”

    专家预测比不上简单运算准确

    奥利·阿申菲尔特(Orley Ashenfelter)是普林斯顿大学的经济学家,爱喝葡萄酒。对于简单的统计学方法的力量可以胜过世界著名学者的观点,阿申菲尔特曾经作过一个引人注目的论证。他想通过波尔多酒生产年所提供的相关信息来预测该酒的未来价值。这个问题之所以重要,是因为优质葡萄酒要想达到质量的顶峰需要很多年。出自同一个酒窖的酒,因其年份不同,在价格上有很大差异。生产时间相差12个月的酒,其价值会相差10倍或更多。预测未来价格的一项因素是它的本质价值,因为投资者买酒就像买艺术品一样,都希望它能够增值。

    人们通常认为葡萄酒酿造期之所以能够决定酒的好坏是受生长期间天气多样性的影响,温暖干燥的夏季会酿就最好的葡萄酒,因此全球变暖貌似会惠及葡萄酒产业。湿润的春天也会使这一产业受益,这样的天气会在不影响质量的情况下增产。阿申菲尔特通过天气的三个特征—夏季生长期的平均温度、丰收期的降水量以及上一个冬季的总降水量—来估测出葡萄酒的特质及特定的年份,再将这些常识性知识转化成数据公式来预测葡萄酒的价格。他的公式给出了未来几年甚至几十年后的准确价格预测。事实上,他的公式所预测的葡萄酒期货价格比新酒的市价更准确。这个新的“米尔模式”向那些为前期价格定位提供建议的专家的估价能力发起了挑战。它还对经济理论发起了挑战,根据这些理论,价格应该能够反映出所有有用信息,包括天气因素。阿申菲尔特的公式非常精确,预测价格与真实价格的相关系数超过了0.9。

    为什么专家预测不如简单运算准确?米尔猜测其中一个原因是这些专家试图变得聪明,总想跳出思维的框框,在预测时会考虑将不同特征进行复杂的结合。复杂化对稀奇古怪的事情是有影响的,但十有八九会降低其正确性,将这些特征简单地整合在一起反而会更好。有几项研究已经表明,即使人们知道公式给出的建议分数,人类决策制定者在面对预测公式时也会自叹弗如。他们认为自己比公式强大,因为人们拥有关于这一问题的其他信息,但他们往往是错的。在米尔看来,在极少数情况下,我们可以利用主观判断,其他时候用判断替代公式并不是个好主意。在一个著名的思维实验中,他描述了一个能够预测某人今晚会不会去看电影的公式,他指出,如果知道此人今天摔断了腿,不用这个公式也罢。于是就有了“断腿原则”。当然,关键问题是断腿的概率太小了,但一旦腿断了,结论也就很明确了。

    专家判断不可取的另一个原因,是人们对复杂信息的最终判断很难达成一致。如果有人要求这些专家对同一信息进行两次评估,他们通常会给出不同的答案。这些不一致之处往往正是真正令人关切的地方。一个经验丰富的放射科医师在两个不同的场合看到同一张片子,这两次检查结果在“正常”与“异常”之间会有20%的偏差。一项让101名审计员独立评价企业内部审计业务可靠性的实验也反映出类似的不一致程度。此前曾有过对不同专业人士判断可靠性的41项研究,研究要求审计员、病理学家、心理学家、组织管理者等专业人士回顾自己原来的判断。尽管他们对每个案例的再次评估在几分钟内就完成了,但实验结果还是说明了判断的不一致性非常典型。不可靠的判断使人们对任何事物都不可能作出有效预测。

    这种普遍的不一致性很有可能是由于系统1对极端条件的依赖所致。我们从那个主要实验可以得知,在我们的环境中有一种不被注意的刺激物在本质上影响着我们的思想和行为。这种影响会从这一时刻波及下一时刻。在炎热的天气里,短暂的凉风会使你感到心情舒畅,这个时刻无论评估什么都会相对更积极一些。对于一个将要获得假释的犯人来说,在假释审核期间的每一顿饭之间,他都会有很大的变化。由于我们对我们思想中的东西没有一个清晰的认识,我们永远不会知道在周围环境有微小的变化时,我们会作出不一样的判断。公式却不会有这样的问题,输入不变,输出也不会改变。可预见性很差—这是米尔和他的后继者们在研究中得出的—不一致性会破坏任何预测的有效性。

    这项研究得出了一个惊人的结论:要提升预测的准确度,最终的结果应由公式给出,在低效的情况下尤其如此。例如,在医学院的学生录取工作中,最终决定一般由面试候选人的老师来做。这一依据是片面的,但他们的推测也有可靠的证据:如果面试官也参与最终的录取工作,面试的过程很可能会降低选拔过程的准确性。这是因为面试官过于相信自己的直觉,他们会很重视个人的喜好而忽略很多其他信息,从而降低了有效性。同样,专家在评估新酒的价格时会品尝酒,这种信息的反面作用大于正面。当然,即使清楚天气对酒质的影响,专家们也无法保证公式那样的一致性。

    继米尔的最初研究之后,促进该领域最重要发展的要数罗宾。道斯所发表的著名论文《决定中非正当线性模型的稳定之美》了。社会科学中常用的数据统计分析是按照某一运算法则评估不同的预测因素,这叫做多次回归,且已经被运用于常用软件中。多次回归中体现的逻辑很有说服力:它找到了将各种预测因素权衡后再整合到一起的最理想公式。然而,道斯发现,这种复杂的数据运算没什么用处,人们也可以通过选取一组对于预测结果以及提升价值都很有效的数据作出类似的判断(使用标准数据或者是等级)。一个公式与这些预测因素以同样的权重结合起来预测新事物才有可能像使用多次回归处理原始样本一样取得理想的预测效果。更新研究则更深入地指出:均衡考虑各项预测因素的公式更有优势,因为它们不受样本突变的影响。

    这种基于等权原则的计算方案的成功有着重要的实践意义:它可以在不作任何事前统计研究的基础上就能开发出有用的运算方法。这种基于现有数据或者常识的简单等权公式通常可以预测出意义重大的结果。在一个令人难忘的例子中,道斯指出了婚姻的稳定性可以通过一个公式来预测:

    做爱的频率减去争吵的频率
    你应该不会希望得到的结果是负数。

    这个研究的重要结论是,在信封背面构思的一个运算公式通常可以和理想化的公式媲美,与专家的言论相比肯定更胜一筹了。这种逻辑适用于很多领域,从证券投资组合经理对股票的选择,到医生和病人对治疗方式的选择。

    一项拯救了千万婴儿的简单运算法堪称对于这项研究的经典应用。妇产科医生清楚地知道,如果婴儿在出生后的几分钟内无法正常呼吸的话,他/她就会有很大的脑损伤甚至夭折的风险。在1953年麻醉学家弗吉尼亚·阿普加(Virginia Apgar)介入之前,内科医生和接生人员一直在用他们的临床经验来判断婴儿是否处于危险状态,不同人员的依据也不尽相同。一些人侧重于观察孩子的呼吸情况,另一些人则观察婴儿的啼哭频率。由于没有一个标准,人们经常错过危险信号,导致许多新生儿不幸夭折。

    一天早饭后,一个住院医生问阿普加医生如何对新生儿作系统评估。她回答道:“这很简单,你可以这样做。”阿普加快速写下了5个变量(心率、呼吸、反应、肌肉强度和颜色)以及3个分数(0、1、2分别代表各个变量的稳健度)。阿普加意识到自己可能会有所突破,而且这一突破还可能被应用到所有的产房中,她便开始用这种方法评估每一个出生一分钟的婴儿。一个得到8分以上的婴儿一般是肤色粉红、蠕动、啼哭、面部扭曲并拥有100次以上的脉搏,这样的婴儿外形很好。低于4分的婴儿一般是浑身青紫、肌肉松弛、不爱动且心跳微弱,这样的婴儿需要立即救治。应用了阿普加的评分原则后,产房的护士们终于在判断婴儿情况是否危险的问题上有了一套标准,人们认为这个公式对减少婴儿的夭折率起到了很重要的作用。现在,阿普加的方法依然应用于每一个产房中。阿图尔·甘德(Atul Gawande)近期的著作《一份清单宣言》(A Checklist Manifesto)也介绍了一些其他案例,以说明列表以及简单原则的优点。

    让许多业内人士烦恼的运算法

    从一开始,很多临床心理学家就不认同米尔的观点,对此持怀疑态度。他们显然幻想过自己有长远预测的能力。我们在深思熟虑后,不难发现这种幻想是如何产生的,也可以理解临床医生为何反对米尔的研究。

    证明临床统计可信度低的统计证据与临床医师对自己判断质量的日常体验相悖。经常接触患者的医生对每一个疗程都有其直觉,他们可以预测病人对干预治疗会有什么反应,并猜测下一步会发生什么。很多推测都得到了证实,这显示出临床医师真实的临床诊断能力。

    问题是在整个治疗期间,这些正确的判断涉及的都是短期预测,而且是在当面诊疗后作出的预测,这项技能是治疗师经过长期实践得来的。他们失败的任务往往需要对病人的病情作长远的预测。想要做到这一点尤为困难,因为即使是最好的公式也只能是有个大概,临床医师也不可能完全了解,这需要患者多年的反馈,而不仅仅是当时短暂的治疗反馈。然而,临床医师可以出色完成的任务与他们完全不能做的事情之间没有绝对的界限,当然他们自己也是如此认为。他们知道自己有医术,但却不一定知道医术的终极。当然,认为机械地将几个变量整合到一起就会超过人工判断微妙的复杂性的想法对有经验的临床医师来说显然也是错误的。

    这场关于临床预测与数据统计预测孰优孰劣的辩论总会涉及伦理道德的范畴。米尔写道,统计方法被那些临床医师批评为“机械化、自动化、附加物、模式化、人工化、不真实、表面化、武断、不完善、无生机、迂腐、片面、无关紧要、武断、数据化、表面化、死板、无前景、学术化、伪科学且很盲目”。相反,临床方法被它的支持者称赞为“灵活、全球化、有意义、正统、精细、统一、机构完整、有规律可循、系统化、丰富、深邃、真实、科学、成熟、准确、生动、正确、自然、可行,以及可以被理解”。

    这种观点我们都可以理解。无论是约翰·亨利(John Henry)在山顶上挥锤,还是国际象棋天才盖瑞·卡斯帕罗夫(Garry Kasparov)与计算机“深蓝”的对决,我们总会同情我们人类自己。对通过数理统计来作决定的厌恶情绪影响着人类,这种厌恶源于我们本身对自然事物的偏好以及对人工合成产物的否定。选苹果时,如果有人问我们喜欢有机的苹果还是商业种植的,大多数人都会倾向于“全天然”的那个。即使被告知两者的口味相同、营养相同而且同样卫生,很多人还是会选择有机水果。商人们甚至发现,标签上印有“全天然”或者“不添加防腐剂”时,销量就会增加。

    欧洲葡萄酒协会对阿申菲尔特推测波尔多酒价格这一公式的反应表明,业内人士对揭秘专业知识有着强烈的抵触情绪。阿申菲尔特的公式对公众而言是一种福祉:我们原本以为各地的葡萄酒爱好者都会感谢阿申菲尔特,他提出的公式提高了这些人辨别葡萄酒质量的能力,使他们能够分辨哪些葡萄酒多年后会有上乘的品质。然而事实却并非如此,据《纽约时报》报道,法国葡萄酒界对此的表现是在“愤怒和歇斯底里之间”。阿申菲尔特指出一个品酒专家认为他的发现“荒唐可笑”,还有一个人也嘲笑他“就像没有亲自看过电影却对这部电影评头论足”。

    作重要决定时,对运算法的偏见就会被放大。米尔指出:“有些临床医师会因一个‘盲目的、机械化的’公式而耽误了可以治疗的病例,这是很可怕的,但我也没有什么好办法来缓和这种令人恐惧的情形。”相反,米尔和其他的运算法支持者激烈争论,如果说运算法在作出重大决定的时候可以减少错误,那么仍旧凭直觉判断就是不道德的。他们的论述有理有据,但却与一个心理学事实背道而驰:对大多数人来说,错误的原因最重要。由于运算法导致婴儿死亡的案例比人为因素造成的悲剧更让人感到悲痛。这种情感强烈程度已经上升到道德取向的层面了。

    值得庆幸的是,随着运算法在生活中适用范围的不断扩大,人们也在慢慢接受它。我们在寻找喜欢的书籍或音乐时,会接受软件推荐的选项;我们理所当然地认为人为因素并没有影响信贷限额的决定;我们也越来越习惯那些以简单的运算法形式出现的指导方针,比如说我们应该努力将有益和有害的胆固醇水平维持在什么比例。公众现在已经意识到,在体育界公式能比人做得更好:一个职业球队该给新队员开多少薪水,或者在第四节的什么时候该踢凌空球。随着运算法使用范围的扩大,大多数人第一次接触米尔在他那本“让我烦恼的小书”中提到的结果模式时,他们的不适应感最终必将会降低。

    “闭上眼睛”的直觉判断比主观判断更可取

    1955年,作为以色列国防军中一个21岁的陆军中尉,我接受指派为全军建立一套测试系统。你也许会惊讶为什么会将如此重任交给我这么年轻的人,但请记住,以色列当时建国才7年,国内所有的机构都在筹建当中,必须有人去建设。今天听来有些奇怪,我的心理学学士学位竟然能够证明我有能力成为军中最训练有素的心理学家。我的顶头上司是一个才华横溢的研究者,他拥有化学学士学位。

    当我接到任务时,例行面试已经准备就绪。每一个入伍的士兵都要完成一系列心理素质测试,对那些有作战任务的士兵要进行个性评估。我们的目标是要给这些新兵对作战适应性打一个分,并在步兵、炮兵、装甲兵等兵种中给他们选择一个最适合他们个性的兵种。面试官们本身也是新兵,之所以被选中做面试官是因为她们智商高,喜欢与人打交道,她们中的大多数人是当时不必参战的女兵。经过几周培训后,她们学会如何安排一个15~20分钟的面试,培训人员还鼓励她们要覆盖多个话题,而且要尽量对被测试者日后在军中的表现情况形成一个整体的印象。

    不幸的是,接下来的评估已经显示这种测试过程对预测新兵日后成功与否毫无用处。于是他们要求我设计一个更有用但不会更耗时的测试。他们还要求我设计新的面试方法,并评估这个方法的准确性。从专业角度来讲,这些任务的难度与让我建一座横跨亚马孙河的大桥差不多。

    幸运的是,我读过保罗·米尔那本一年前出版发行的“小书”。我很相信书中的论证,认为简单的运算法优于临床的直觉判断。我总结出,当前的面试之所以失败,部分原因是它允许面试者按照个人的喜好作决定,这个决定会因面试者的心理活动而发生一些变动。相反,我们应该用限时的项目来获得受试者在正常环境下更具体的信息。我从米尔那里还学到了我们应该摒弃这种用面试者的整体评估来给新兵打分的方法。米尔的书中指出这种评估不值得相信,而运算法从分散的评价中得出的结果则更有价值。

    我决定采用这样的过程,面试者要评估几项相关个性特征,为每项单独打分。最后的作战适应性结果由计算机根据一个特定的公式给出,面试者不干预。我列了一个表格,其中包含与作战表现相关的6个特点,包括责任心、社交能力以及男子气概等。之后我再针对每个特点整理出一系列关于他们入伍之前生活的问题,例如之前做过几份工作、工作和学习时是否准时、和朋友交往的频率,以及他的兴趣爱好和参加过的运动等。这便使我能尽量客观地从每个角度对新兵进行评估。

    通过这些标准化的真实问题,我希望能够排除光环效应,排除人们喜好的第一印象对判断结果的影响。为了进一步预防各种光环的影响,我要求面试官依照固定的顺序去测试这6个特点,在测试下一个特点之前要对前一个特点按5分制打分。我告诉他们不要为新兵在部队的未来发展操心。他们唯一的工作就是找出与新兵的过去相关的信息并以此来给每一个特性打分。“你们的作用就是提供可靠的测定值,”我说,“处理预测有效性的工作让我来。”我这句话的意思是我要用公式来整合他们的具体得分。

    面试官们齐声抗议这种安排。这些优秀的年轻人对我这个和他们差不多大的中尉的命令有点不情愿,毕竟这样的要求禁止他们运用直觉,将注意力完全放在一些无聊的真实问题上。其中一个人抱怨说:“你在把我们变成机器人吧!”所以我妥协了,“按照要求进行测试吧,”我说,“请完全按照要求来进行测试,测试完后,就像许愿那样闭上眼睛,将新兵想象成一个战士,并给他打分。

    我们对几百次面试都采用了这个新方法。数月之后,我们收集了新兵指挥中心对他们表现的评价,这使我们很欣喜。正如米尔的书中提到的那样,新的测试过程比原来的过程有质的飞跃。虽然离完美还有一定差距,但6项指标整合起来作出的预测比之前的整体评估要准确得多。我们已经从“徒劳”进步到了“有效”。

    面试官“闭上眼睛”后的直觉判断也很准确,甚至和整合6项指标得到的运算结果一样准确,这是我最为惊喜的地方。我从这一发现中学到了毕生难忘的一课:即使是不那么正规严肃的遴选面试,直觉也会起到积极作用,当然前提是按照规定收集客观信息并对不同特性进行独立评分。我建立了一个给予“闭眼”评估和整合6项指标同等权重的公式。从这件事中我学到一个普遍规律:不要简单地相信直觉判断—无论是你自己的还是他人的—但也不要完全抛开它。

    45年后,我获得了诺贝尔经济学奖,在以色列一时间也小有名气。在一次访问中,一些人想带我看看旧时服役的军事基地,那里依然矗立着测试新兵的房子。有人把我介绍给心理组的司令部官员,她向我介绍了目前的测试方法,和我当时设计的没有什么两样。在那里,大量研究显示该测试依然有效。最后在介绍如何引导面试官时,她补充道:“我们告诉他们,‘闭上你们的眼睛’。”

    本章的内容已经在部队人力测试以外的项目中也得到了应用。按照米尔和道斯的原则进行的测试过程相对来说不怎么费力,但却相当严格。设想你要为你的公司招聘一名销售人员。如果真的想选择最合适的人选,那么你应该这样做:首先,选择一些这个岗位要求的先决条件(比如技能熟练程度、个性稳重程度、可靠性等)。不要列太多,6个左右即可。这些条件最好相对独立,同时要保证你通过一个问题就能够对这几个条件进行评估。下一步就是为每个条件都列出一些问题,并想好如何对其进行评估,分数为1~5分。你应该清楚什么情况“最弱”,什么情况“最强”。

    作这些准备大约需要半个小时,这种很小的投入能保证你招聘到的员工的质量。为了避免光环效应,你必须在一定时间内完成某一个特性的信息采集并对其打分,之后才能测试下一个。不要越过某个特性去测其他项目。评估每个候选者时,要将这6项评分累加起来。由于你要负责作出最终决定,那就不要“闭眼”测试了。即使你认为其他候选人更合适,也一定要雇用那个得分最高的人—请尽量克制自己创造“断腿”机会改变排位的想法。大量的研究可以向你保证:只要按照该过程操作,你就能找到最合适的人选。这比人们通常用的那些没有准备就开始面试,并依靠“我看到了他深邃的眼神,我喜欢自己看到的一切“这类主观判断要好得多。

    示例—人工判断和公式运算“不管何时,只要公式能替代人工判断,我们至少应该考虑一下(运算法)。”“他认为自己的判断既缜密又微妙,但实际上把一些分数简单地整合在一起也许会更胜一筹。”“我们应该事先考虑清楚自己有多重视这些候选者以往的表现,否则,对他们的第一印象会对我们产生过多的影响。”第22章 什么时候可以相信专家的直觉?

    专业人士的争论暴露了学术界最为糟糕的一面。科学杂志上偶尔会有一些交流文章,开始是某人对他人研究的批判性评论,接着就是被批判专家的回复和反驳。我一直认为写这种文章是在浪费时间。最初的那篇批判若言辞犀利,其回复和反驳便尤其激烈,我将其称为对始作俑者的讽刺和深度讽刺。回复很少会对尖锐的批判作出任何让步,而且也没听说过某个反驳者会承认开始的那篇批判性文章有任何误导性或者错误。只有在少数情况下,在我认为批判具有严重的误导性时,我才会做出回应。这是因为,此时不回复可能会被视为对错误的默认,但我从来没有发现这些不友善的批判有什么指导意义。为了寻求另一种方式来化解分歧,我曾参与了几次“对手合作”活动,在这一活动中,对某项科学研究见解不同的学者需要就他们的不同观点共同撰写一篇论文,有时还要一起进行研究。在争论特别激烈的情况下,这项研究则由裁决者主持。

    我与加里·克莱因进行的对手合作是我最为满意也是最有成效的一次。加里·克莱因是某个协会的优秀领导,他所在协会的学者和成员都不看好我做的工作。此协会的人称他们自己为自然主义决策学者,他们中的大多数人都在各类组织里工作,在那里他们经常研究专家们是怎样工作的。他们坚持反对在研究启发式和偏见时关注偏见。他们认为这种研究模式过于关注失败,并且是通过仿真实验进行研究,而不是通过真人真事。他们高度怀疑以严谨的计算来代替人工判断的价值,所以,他们并不推崇保罗·米尔。多年来,加里·克莱因一直保持着明确的立场。

    我们的合作几乎没有奠定什么美好友谊的基础,但整个过程中却有很多值得铭记的东西。过去我从不认为直觉总会产生误导。自从读过克莱因于20世纪70年代撰写的一篇论文的草稿之后,我曾一度非常推崇他关于消防员专业技能的研究,他的著作《力量的源泉》也给我留下了深刻的印象。这本书用很大篇幅分析了经验丰富的专家是如何开发出直觉能力的。我邀请克莱因一起参与直觉成败界限的划分工作。他对这个想法很感兴趣,虽然我们并不肯定这项工作会成功,但还是一起开始了这项工作。

    我们首先要回答一个具体的问题:什么时候你可以相信那些声称自己有直觉能力的经验丰富的专业人员?很明显,克莱因更容易相信这些专业人员的直觉,而我则更容易对此心存质疑。不过,我们在回答这个一般性问题时是否可以遵从一定的原则呢?在七八年的时间里,我们有过多次讨论,解决了许多分歧,也发生过不止一次的争执。我们写过很多稿件,成了朋友,最终还联合发表了一篇文章,文章的标题见证了我们的经历—“相信专家直觉的条件:达成一致”。的确,我们并没有遇到真正存有分歧的问题,但我们也没有真正达成一致。

    直觉就在眨眼之间

    当我和克莱因进行上述项目的研究时,马尔科姆·格拉德威尔(Malcolm Gladwell)的畅销书《眨眼之间》(Blink)问世了。这本书使我们更加确信我们对共同研究的问题的观点是一致的。格拉德威尔这本书开篇的故事令人印象深刻:一些艺术名家鉴赏雕像中的杰作—一个阔步行走的男孩雕像。有些专家本能地认为这个雕像是仿冒品,但也说不清楚是什么让自己有这种感觉的。读了这本书的人(有数百万人读过)都认为直觉在其中起了作用。这些专家知道雕塑是仿冒的,却不知道自己为什么知道—这正是对直觉的定义。这个故事好像在暗示,对引导这些专家的线索进行系统调查应该会失败。不过,我和克莱因却并不这样认为,我们觉得,这样的调查很有必要,而且,如果方法得当(克莱因知道该怎么做),是有可能成功的。

    读过这个故事的读者会对专家近乎神奇的直觉啧啧称奇,但格拉德威尔本人却并不那样认为。在随后一章中,他讲述了一个因相信直觉而造成的巨大失败:美国总统哈丁之所以当选是因为他符合总统的相貌特征:高个子、宽下巴,是典型的强硬而果断的领导者形象。人们把票投给他没有其他理由,只是因为他的外表看起来强硬和果断,就认为他是这样的人。之所以出现了哈丁作为总统表现会如何的直觉预测是因为选民替换了问题。本书的读者会期待自己也能拥有这种信心满满的直觉。

    克莱因形成其直觉观点的早期经历与我的不同。我的观点是通过观察自己的有效性错觉以及阅读保罗。米尔关于临床预测缺点的实证研究而形成的。克莱因的观点是在他对火场指挥官(消防队的领导)的早期研究的基础上形成的。在指挥官对抗火灾时,他进行了跟踪调查并在火灾扑灭后对指挥官当时做决策的想法进行了采访。克莱因在我们合作的文章中写道,他和他的合作者:

    调查指挥官们是怎样不加选择就做出正确决策的。最初的假设是指挥官会将其分析限制在两个选项中,但这个假设已被证实是错误的。事实上,指挥官只萌生了一个选项,且这个选项也正是他们所需要的。他们花了超过10年的时间进行真实和虚拟的演练,以识别出合适的选项作为首选,而在有真实需要时,他们就可以利用这个累积了多年的指令库。他们评估某个选项的方法是在脑部模拟这个选项,看它是否适用于当时的情况……如果他们考虑的这个做法大概可行,他们就会这样做;如果这样做不太好,他们就会对其进行调整;如果不易调整,他们就会选择下一个最有可能的选项。然后,重复上面所说的过程,直到找到一个合适的做法。

    克莱因将上面的描述定义为一种决策制定理论,他称之为预认知决策模式。预认知决策模式可以用来解释消防员的专业技能,也可用来解释其他领域的专业技能,包括下象棋。系统1和系统2同时参与了这个过程。在第一阶段,暂定计划通过联想记忆(即系统1)的自主功能呈现在大脑中。下一阶段是一个需要深思熟虑的过程,大脑会对这个计划进行模拟以检测其是否有效,这是在系统2的运作下进行的。不久前,赫伯特·西蒙提出将直觉性决策制定模式视为从认知模式中提出想法,而且,赫伯特·西蒙可能是唯一一个被各路决策研究者公认为英雄和创始人的学者。我在本书的序言部分曾引用了赫伯特·西蒙对直觉的定义,现在重复一下会更有意义:“这个棋局已经给了我们提示,根据这个提示我们可以搜寻到大脑存储的信息,而这个信息就能给出答案。直觉只不过是人们的认知而已。”

    这个有力的陈述用日常经验的记忆解释了直觉的不可思议。消防员凭借其对危险的直觉(“尽管不知道自己是如何拥有这种直觉的”)能在房屋塌陷前逃脱的故事的确令人称奇,然而,我们也不知道自己为什么立刻就知道一进屋看到的那个人就是我们的朋友彼得。西蒙这番话的寓意是,人们在不知情的情况下就能知道,其中的奥秘并非直觉的显著特征,而是大脑的常规活动。

    专家型直觉的习得

    构成直觉的信息是怎样“储存在记忆中”的呢?某些类型的直觉能够快速习得。我们从祖先那里继承了一个重要机制,学会何时应该感到恐惧。的确,“一朝被蛇咬,十年怕井绳。”我们中的许多人都有过这样深刻的记忆,记得有家餐厅有一道自己不喜欢的菜,于是我们就一直不愿再进那家餐厅了。在接近曾发生过令人不快的事件的地点时,我们都会感到紧张,即使当时根本不可能再次发生同样的事情也会感到紧张。对我来说,前往旧金山机场的斜坡就是这样的一个地点。多年前,有个怒路症司机从上高速公路之后就一直跟在我后面,他还摇下车窗,骂了我几句脏话。我一直都不明白他为何会发怒,但我每次经过那个斜坡时,总能记起他的声音。

    我对于这件事的记忆是有意识的,这也充分解释了我当时的情绪。但在许多情况下,你会在去到某个特别的地方或是听到某个特别的说法时感到不自在,即使这个地方或这个说法并没有触发记忆中的某个事件时也是如此。如若事后真有什么不好的事发生,你的后见之明就会将那种不自在看做是直觉。这种情绪学习的模式与巴甫洛夫著名的条件反射实验密切相关。在那个实验中,狗学会了识别食物到来时的铃声。巴甫洛夫的狗所学到的可以称为习得的希望,而习得的恐惧则更容易被感知。

    恐惧可以被感知,事实上也很容易被感知,因为无须亲身经历只需通过语言就能感知。对危险有着“第六感”的消防员肯定有很多机会讨论及思考多种他并没有亲自参与的火灾,并在脑中对会有什么样的线索出现以及该怎样反应进行演练。我还记得,一名没有作战经历的年轻排长在带领部队穿越峡谷时会很紧张,因为他曾经学习过这样的地形很可能会有埋伏。学习需要一定的反复强化。

    情感学习可能很快,但学习我们所说的“专业技能”通常需要很长时间。学习专业技能,例如高水平的国际象棋、职业篮球以及消防技能,很复杂也很缓慢,因为某个领域的专业技能涉及的不仅是一项单一的技能,还包含了很多小技巧。象棋就是一个很好的例子。一名专业棋手一眼就能看清一个复杂的棋局,但达到那样的能力水平却需要很多年。对象棋大师的各项研究表明,想要达到高水平需要至少10000个小时的专注练习(大约需要在6年的时间里每天练习5小时)。在注意力高度集中的这若干个小时内,一个谨慎的棋手会熟悉数以千计的棋局,且每个棋局中的棋子都有攻守关系。

    学习高水平象棋好比学习阅读。一个一年级的学生需要努力学习单个字母,再将这些字母组合成音节和单词,但一个成年人则可以掌握所有从句。一个精于阅读的人还可以将熟悉的成分组合在一个新的句型中,并能快速“识别”且正确读出一个她从未见过的单词。重复出现且相互关联的棋子如同字母,而棋局则像一个长的单词或是句子。

    技能过硬的读者第一次看到刘易斯·卡罗尔(Lewis Carroll)所作的《隐语重重》(Jabberwocky)的开篇诗句,就能够以完美的节奏和音调读出来,且朗朗上口:

    是滑菱鲆在缓慢滑动,时而翻转,时而平衡;

    所有的扭捏作态展示了,蠢人的早熟、懒人的平庸。

    掌握下棋的技巧要比学习朗读更难也更慢,因为象棋的“字母表”含有更多的字母,每个“单词”也包含许多字母。然而,经过上千小时的练习以后,象棋大师能够一眼就“读”出棋局。他想出的那几步棋通常也都很高明,有时还会令对手措手不及。他们可以处理自己从未遇到过的“单词”,还能找到一个新的方法去解释一个熟悉的“单词”。

    环境有规律可循,直觉才可相信

    我和克莱因很快就发现,我们对直觉技能的本质和习得的观点一致,但还需就我们的关键问题达成共识,即什么时候可以相信一个自信的专业人士的直觉。

    最终,我们推断我们之间出现分歧的一部分原因是由于我们的专业不同。克莱恩花了很多时间研究消防指挥官、临床护士以及其他真正具有专业技能的职业。我的大多数时间则用在了对临床医生、股票投资者以及政治学者等人的研究上,这些人普遍都在做毫无依据的长期预测。克莱因则更愿意相信那些称自己有直觉的专家,据他说,这是因为真正的专家知道自己知识的局限。我与他争辩道,也有许多伪专家并不清楚他们其实并不知道自己正在做什么(有效性错觉),总的来说,人们的主观自信普遍过高而且通常毫无根据。

    早些时候,我研究过人们自信的来源,认为以下两点与之相关:认知放松和一致性。如果我们能很轻松地想到自己想要的那个故事,且各个情节之间并无矛盾时,我们就会很有自信。但是放松和一致并不能保证我们充满自信的观点就是正确的。联想机制会抑制怀疑并引发与当前情况相符合的想法与信息。遵从眼见即为事实原则的大脑可通过忽略自己所不知道的事而变得过于自信。因此,许多人容易对没有事实根据的直觉怀有高度的自信也就不足为奇了。我和克莱因最终就一个重要的原则达成了共识:人们对直觉的自信心不能作为他们判断的有效性的可靠指标。换句话说,当有人告诉你你应该相信他们的判断时,不要相信他们,也不要相信自己。

    如果主观自信不可信的话,我们该怎样评估直觉判断的有效性呢?判断在什么时候才能反映出真实的技能水平呢?什么时候会显现出有效性错觉呢?回答这些问题需考虑到技能习得的两个基本条件:

    ·一个可预测的、有足够规律可循的环境。

    ·一次通过长期训练学习这些规律的机会。

    当满足以上两个条件时,就可以培养出直觉来了。象棋这个活动就需要在极具规律的环境下进行,桥牌和扑克也提供了有力的、能支撑技能的统计学规律。医生、护士、运动员以及消防员面对的都是复杂但却基本有序的情境。尽管系统2并没有学会如何给它们命名,但事实上专家的系统1学会使用的那些高度有效的线索才是引发加里。克莱因所描述的准确的直觉的原因。相反,作长期预测的股票投资者以及政治学者是在有效性为零的环境中进行的。他们的失败反映了他们尝试预测的事物基本是不可预见的。

    有些环境毫无规律可言。罗宾·霍格思(Robin Hogarth)曾描述过一些“恶劣的”环境,在这些环境中,专业人员可能会从自己的经历中得到错误的信息。他借鉴了刘易斯·托马斯(Lewis Thomas)那个关于医生的例子。在20世纪初,某位医生总能凭直觉来预测哪位来就诊的人会染上伤寒。不幸的是,他是通过咽部触诊来证实自己的预测的,但在诊断两名门诊病人的间隙并没有洗手。于是,来看病的人接二连三地病了,医生也开始认为自己的诊断不会有错。他的预测是准确的,但这并不是因为他有专家型直觉。

    米尔提到的那些临床医生并不是无能,他们的失败也不是因为能力不够。他们表现不佳是因为其任务没有简单的解决方案。临床医生的窘境并没有在零效度环境下作出的政治方面的长期预测极端,但也是基于低效度的情境,准确性也就不会很高。我们知道事实就是如此,因为虽然最好的运算法的准确率是高于人工判断的,但也不会非常准确。的确,米尔及其追随者的这些研究从未提供过“确凿的证据”,这些证据被临床医生完全忽略了,但能被运算法察觉到。这类情况的极端失败案例不可能出现,因为人类的学习能力通常是高效的。若存在有助于猜测的有力线索,人们一旦得到机会就一定能发掘出来。在毫无章法的环境下,运算法远远优于人工判断有两个原因:运算法比人工判断更可能观察到不怎么有效的线索,还可能通过利用这样的线索将正确性保持在适度水平上。

    在这样一个不可预知的世界里,人们出现预测错误也是无可厚非的。但是,若专业人士认为自己可以成功预测不可能的任务,我们就可以对其进行指摘。在一个不可预知的环境下声称自己有正确的直觉至少也会被称做自我妄想,有时则更难听。如果缺乏有效的线索,直觉的“准确性”不是因为巧合就是在撒谎。如果这个结论让你惊讶,那说明你仍然相信直觉是不可思议的。请记住这条规则:在环境缺乏牢靠的规律时,不要相信直觉。

    环境中的某些规律会比其他规律更容易察觉并容易加以利用。想想你是如何形成自己的刹车方式的。当你学习转弯时,你渐渐学会了何时放油门以及用多大力气踩刹车。现在,弯道改变了,但多次转弯的经历已使你能在任何弯道上在恰当的时间以恰当的力度踩刹车。学习这项技能的条件是很理想的,因为你在每次遇到弯道时都能收到及时、清楚的反馈:转弯顺畅时你会感到很舒服,但如果刹车没有踩到底,你就会感到车子有些难以控制。港口引航员调动大型船舶的情境也有一定的规律,但只凭借经验是很难学到这项技能的,因为行动之间可能会有长时间的推迟,这样的推迟还会带来显著的后果。专业人员是否有机会培养直觉性专业技能主要取决于反馈的质量和速度,以及是否有足够的时间进行练习。

    专业技能不是一项单一的技能,而是由许多技能组成的。同一个专业人员可能在她的领域中是个行家,但在别的领域是个新手。等到象棋新手成为专家的时候,他们就已经“看清所有的棋局(或大部分棋局)”了,就这点而言,象棋是个例外。外科医生在有些手术中表现得比其他人更为专业。另外,专业技能的某些方面可能会比其他方面更容易学。精神治疗医师有很多机会观察患者对他们所说的话的即时反应,回馈使他们培养了相关的直觉性技能,使他们可以使用能平息怒火、增强信心以及使患者集中注意力的语言和音调。另一方面,治疗师没有机会判断对不同的病人应该使用哪一种治疗方法才最有效。他们收到的反馈是病人长期的治疗结果,这种反馈量少且滞后,还有可能根本没有反馈,无论哪种情况都无法运用他们从经验中学到的知识。

    在医学专业中,充分的反馈可以使麻醉师受益,因为他们的行为很快就会见效。相反,放射科医生就不怎么了解他们诊断的准确性了,也不知道他们是否有漏诊。因此,麻醉师更能培养出有用的直觉性技能。如果一个麻醉师说:“我感到有些不对劲儿。”手术室的人就应该开始准备应急计划。

    像主观自信的那个例子一样,专家可能不知道他们专业技能的局限性。一位有经验的精神治疗师知道自己擅长揣测患者的想法,并对患者接下来要说些什么有一定的直觉。她很容易就能预测出患者明年的康复状况,但这个结论并不十分正确。短期预测和长期预测不同,治疗师有足够的机会去接触其中一个患者,却不能了解其他患者。同样,财务专家对他所在公司多方面的贸易情况都比较熟悉,但对如何选择股票就不那么熟悉了。中东的某位专家知道许多事,但却无法知道未来。临床心理学家、股票投资者以及经济学者都掌握了各自领域的直觉性技能,但他们却不能够鉴别出因直觉导致错误的情境和任务。这些未能识别的专业技能的局限性解释了专家总是过分自信的原因。

    直觉的对错评估

    在我们的实验快结束时,我和加里·克莱恩就上面提及的那个问题给出了一个一般性答案:什么时候可以相信有经验的专业人士的直觉?我们的结论是,大多数情况下,我们还是可以将可能是有效的直觉与可能是无效的直觉区分开来的。这就好比判断一件艺术作品的真假一样,关注这件作品的出处通常比关注作品本身的判断准确率更高。如果环境有足够的规律性,并且在判断时有机会掌握这些规律,联想机制就会识别这些情境并做出快速且准确的预测与决策。这些条件若得到满足,你就可以相信某个人的直觉。

    不幸的是,联想机制同样会产生主观的强迫性直觉,这种直觉是错误的。如果我们观察有天赋的年轻人在象棋方面取得的进步,就会非常清楚完美的技能不是短时间就能练就的。在接近完美的过程中,他会犯错误,而且对这些错误还信心十足。当评估专家的直觉时,你应该时刻考虑到该专家是否有足够的机会挖掘线索,即使是在有规律的环境下。

    在一个不够规律或效度较低的环境中,判断启发式就会被激活。系统1通常会用另一个问题快速替换掉难题,创造出并不存在的关联。此时回答的问题并不是预期的那一个,但这个答案会很快出现在人们的脑海中,会通过系统2宽松的审查。你可能想预测某个公司的商业前景,并相信这就是你正在判断的事,但实际上,你对这家公司高管能力的印象主宰了你的评估。因为替代是自动发生的,你通常并不清楚自己(你的系统2)赞同并采纳的判断源自何处。如果这是唯一出现在大脑里的判断,你可能就无法将它与你根据专业直觉得来的有效判断进行主观上的区分。这就是主观自信不能作为直觉准确性指标的原因:即使判断的是错误的问题,在作出这一判断时仍可能有高度的自信。

    你可能会问:为什么我和加里。克莱因立即想到了通过评估环境规律和专家学习经历的方法来估测专家的直觉能力,而不是通过专家的自信程度来评判,还会问我们答案可能是什么。其实解决方案一开始就很明显。我们先前就知道火场指挥官和儿科护士的直觉是有效的,而米尔研究的那些专业人士以及股票投资者和经济学者的直觉则不准确。

    很难说清是什么使我们的实验经年累月进行这么久,是长时间的讨论、不断交换演示稿、数以百计的商谈邮件,还是不止一次想要放弃的想法,我们真的不清楚。但如果某个项目完成得相当好,就常会有这样的事情发生:一旦你明白了主要结论,这个结论就总是看似很明显。

    正如我们那篇文章的标题所示,我和克莱因所持的观点并不像我们预期的那样不同,对于我们提出的实质性问题,我们采用了一些联合方案。然而,我们发觉我们前期的分歧不单单是观念上的不同,还有态度、情感和品位上的不同,而且这些分歧多年来都没有太大变化,这一点在我们认为最有趣和最感兴趣的事情上体现得最明显。当有人提到“偏见”这个词时,克莱恩的脸部仍然会有轻微抽搐,他仍然会嘲笑由于运算或是正式程序导致的明显荒谬的决策;而我则会将这些偶尔由运算导致的错误视为提高的方法。另一方面,看到在零效度的情况下一些自负的专家仍声称自己有很准的直觉时,我比克莱因更喜欢看好戏。然而,从长远来看,尽可能多地发现两个人观念方面的共识肯定比寻找我们在情感方面的分歧更加重要。

    示例—专家型直觉“对这个特别任务,她有多少专业技能?做过多少练习?”“他真的相信这些新成立的公司的环境有足够的规律来证明与基础比率背道而驰的直觉吗?”“她对自己的决策非常自信,但主观自信并不是评估准确性的标准。”“他真的有机会学习吗?对他判断的反馈他接受得有多快、多彻底?”第23章 努力养成采纳外部意见的决策习惯

    在和阿莫斯合作几年之后,我说服了以色列教育部的一些官员在高中开设有关判断与决策的课程。我组建了一支团队,其中包括几位经验丰富的老师,我教授的心理学专业的一些学生,以及希伯来大学教育学院的院长希莫·福克斯(Seymour Fox)。我们设计了课程内容,还编写了教材。

    我们每周五下午都开一次例会,这一惯例维持了约一年,我们制定出内容详细的教学大纲,完成了教材几个章节的编写任务,还在教室里上了几节示范课。大家都感到取得了一定的进展。一天,在讨论估测不确定参量的流程时,我突然想到可以进行一次现场操练。于是,我便请在场的所有人预测我们将完整的教材文稿提交给教育部所需的时间,并将预测结果写下来。我遵循了我们已经计划好要纳入课程体系的流程:从一个团队获取信息的合理方法并不是通过公开讨论,而是通过私下收集大家的观点来完成。这个流程与常规的公开讨论不同,它更加充分地利用了每个成员的相关知识。我收集了大家的预测,并将结果记录在黑板上。在场的各位对完稿时间的预估集中在两年左右,最低估值为一年半,最高估值则为两年半。

    随后我又有了一个主意。我问课程编制专家希莫是否能想到还有哪些和我们类似的团队曾经草拟过课程计划。那段时间,有几项类似“新数学”这样的教学革新在以色列得到引介。希莫说他能想到很多这样的团队。我又问他是否知道这些团队更详尽的情况,事实证明他对其中几个团队的情况还是较为熟悉的。我又请他回想这些团队在取得与我们当前进展相当的成绩时的状况。根据这一点,我又问他是否记得这些团队用了多长时间编完教材的。

    他陷入了沉默。当他终于张口说话时,我觉得他脸红了,在为自己的回答感到尴尬,他说道:“你知道吗,我过去从未意识到这一点,但事实上,并非所有取得与我们当前进展相当的团队都能完成任务。没完成任务的团队还是占了很大一部分的。”

    他的话让人很不安。我们从未考虑过自己可能会失败。我越发不安了,于是想请他估测失败的团队占多大比例。他说:“大约40%。”此时,整个房间仿佛笼罩在一片阴霾之中。我立刻又提了一个问题:“那些完成了任务的团队用了多长时间呢?”他答道:“没有一个团队是少于7年的,最多用了10年时间。”

    我如同抓住了救命稻草一般,说:“与其他团队的技能和资源相比,我们的团队怎么样?在这些团队中,我们团队大概处于什么位置呢?”这次,希莫并没太多犹豫,说道:“我们在平均水平以下,但也没差太多。”他的回答让我们感到震惊,甚至包括希莫自己,他先前的估测受到整个团队所持的乐观心态的影响。如果没有我的提示,他就不会将自己对其他团队过去经历的了解与对我们团队未来的预测联系在一起。

    听了希莫的话,我们当时的思想状态远非“我们都清楚了”这句话能够描述的。诚然,我们所有人当时都“清楚”与几分钟前我们写在纸上的预测时间相比,最少7年、失败概率为40%才是对项目未来更合理的预测。我们并没有承认自己清楚的事实。这个新的预测似乎仍然不真实,因为我们不能想象为何一个看似操作非常简单的项目会耗时这么久。我们没有水晶球,无法看到未来。我们能看见的,只是一个合理的计划,这个计划会使我们在大约两年的时间里完成一本书,而这与那些显示其他团队不是失败了就是用了很长时间完成任务的统计数据是互相冲突的。我们所听到的是基础比率信息,依据这个信息,能推断出一个因果关系,即如果有这么多的团队失败,或是用了很长时间才取得成功,那么编写一门课程就应该比我们想象中的难得多。但这样的推断又与我们对现阶段取得的重大进展的直接体验相左。我们对希莫提供的数据的处理就像平时对待基础比率一样:注意到其存在,但立刻选择忽略。

    我们理应在那一天选择放弃项目的。我们都不愿意为一项失败概率为40%的项目再多投入6年的时间。尽管我们认为坚持做下去并不是理性的选择,但这不足以成为我们放弃的缘由。在几分钟断断续续的争辩之后,我们达成了一种默契,那就是当做什么事都没发生,继续工作。这本书最终在8年以后才编写完成!那时,我早已搬离以色列,离开了团队。也就是说,这本书的编写经历了许多不可预知的变化。教育部对这个想法所持的热情也在等待这本书交稿的漫长时间里消退了,因此这本书从未被使用过。

    这个令人尴尬的插曲成了我职业生涯中一段最具启发性的经历。我从中悟出了三点,第一点是显而易见的,我偶然得到了两种截然不同的预测方法。后来,这两种方法被我和阿莫斯称为内部意见和外部意见。第二点是我们最初的预测,即完成项目需要大约两年的时间,体现出一种规划谬误。我花了很长的时间才悟出第三点,我将这一点称为非理性坚持,一如我们那天做的荒唐事:没有终止那个项目。面对选择时,我们因为事业心而丢掉了理性。

    比起外部意见,我们更偏向内部意见

    在很久以前的那个周五,我们的课程专家对同一个问题作出了两种判断,并得到了截然不同的结果。我们所说的“内部意见”是指包括希莫在内的所有人自发采取的对我们项目的未来进行预测的方法。我们注重具体环境,在各自的经历中寻找证据。我们有一个粗略的计划:知道要写多少章,了解已经完成的两章所用的时间。我们之中有些人会谨慎些,可能会在预测所用时间的基础上多加几个月,以免出现预测误差。

    外推法是错误的。我们根据眼前的信息进行预测,但我们写出的前几章有可能比其他章节简单,而且在写那几章时,我们对这个项目的投入程度很可能正处于最高点。然而,最主要的问题在于我们没有考虑到由唐纳德·拉姆斯菲尔德(Donald Rumsfeld)提出的著名观点:“未知的未知数。”那天,我们没能预见到接下来发生的事会导致这个项目拖延这么久。离婚、生病、与官员的协调等事情导致工作一再延迟,这些事情都是意料之外的。这样的事情不仅会减慢教材的编写速度,还会导致任务在长时间内没有任何进展或进展非常缓慢。当然,对希莫知道的那几个团队来说,情况也是一样的。那些团队的成员清楚自己的项目是切实可行的,所以他们也想象不到各种事的发生会使他们历时7年才完成一个他们曾经认为可行性很强的项目,或者最终根本就没能完成任务。他们像我们一样,并不知道自己的胜算有多少。任何计划失败的原因都有很多,尽管大多数原因人们可能无法预见,但一个大项目中“某件事”出差错的概率却是很高的。

    我向希莫提出的第二个问题将他的注意力从我们团队转移到了一些类似的团队上。他估测那些团队成功的基础比率是:40%的失败率和7~10年的完成时间。希莫的话虽然没有经过正式调查,也没有科学根据,却为基准预测奠定了合理的基础。如果你对一个事件的了解仅限于其所属类别,其他情况一概不知,此时作出的预测就是基准预测。正如前文所述,基准预测应该是进一步调整的锚定。如果你只知道某位女士住在纽约,却被问到她的身高的话,你的基准预测就是你对纽约女性平均身高的合理猜测。如果得到了与案例相关的特定信息,例如那位女士的儿子是他所在高中篮球队的首发中锋,你就会将预测转向一个合理的方向。希莫将我们团队与其他团队的对比说明,我们所作的预测较基准预测而言更糟糕,而基准预测已经是糟糕透顶了。

    在我们的这个问题中,外部意见的预测有着出奇的准确性。然而,这种准确性只是侥幸产生的,并不能作为外部意见有效性的证据。关于外部意见有效性的论证是在一般理由下构建的:如果参考类别选择适当,外部意见就会给出预测的大致范围,我们的那个项目就是如此,这就表明内部预测与事实相去甚远。

    对一个心理学家而言,希莫作出的两种判断的差异是令人诧异的。他头脑中有相应的知识,本应该能够估测出适当的数据,但他在最初估测时,却完全没有应用那部分知识。希莫由内部意见得出的预测并不是根据基准预测得到的判断。他并没有进行基准预测,他的预测只是基于我们所营造的特殊的努力氛围。正如汤姆实验中的受试者那样,希莫知道相关的基础比率,但却没想过应用它。

    与希莫不同的是,我们其他人并没有外部意见的来源,也就不能作出合理的基准预测。然而值得注意的是,我们并不认为自己需要其他团队的信息作为自己预测的参考。我寻求外部意见的举动让所有人都颇为诧异,甚至包括我自己在内!这是一个常见模式:了解个别案例的人很少会认为他们有必要了解与这个案例同类别的其他案例。

    当我们最终了解到这一外部意见时,却集体忽略了它。我们知道到底发生了什么,这与解释“教授心理学是徒劳的”那个实验有相似之处。当他们在掌握很少信息(一个简短乏味的采访)的情况下对个别案例作出预测时,尼斯贝特和博吉达的学生完全忽略了他们刚刚了解到的全局解。当“苍白无力的”统计学信息与某个人对案例的印象相冲突时,这些信息总会被舍弃。在与内部意见的竞争中,外部意见丝毫没有取胜的机会。

    偏向内部意见常带有道德的意味。我的堂兄是一位出色的律师。我曾经问过他一个与参考类别相关的问题:“被告赢得与这个案子类似的官司的可能性有多大?”他立马回答:“每一个案例都是独特的。”这位堂兄说这话时的眼神表明他当时肯定认为我的问题既不得体又很浅薄。特别强调案例的独特性在医学领域也很普遍,尽管证据型医学的最新进展指向其他方向,但案例独特性仍不可忽视。医学统计学和基准预测由医患间越来越频繁的交流催生而来。然而,医学界对外部意见依旧抱有矛盾情绪,因为整个医疗过程都由数据和清单主导,缺乏人情味。

    规划谬误:过于乐观的计划随处可见

    按照外部意见及最终结果来看,我们在当初的那个星期五午后所作的最初预测几乎是一种妄想。对下面这种说法我们也不会感到惊讶:对项目成果过于乐观的预测随处可见。我和阿莫斯创造了“规划谬误”这个新词来描述下列计划和预测:
    ·不切实际地接近理想状况(的计划和预测)。
    ·可通过参考类似案例的数据得到提高(的计划和预测)。
    关于规划谬误的例子在个人、政府、企业的计划和预测行为中皆不鲜见。骇人的事例也不胜枚举。
    · 1997年7月,爱丁堡规划中的新苏格兰议会大楼预计的最高预算是4000万英镑。到了1999年6月,建楼的预算就变成了1.09亿英镑。2000年4月,规划者将“成本上限”修改为1.95亿英镑。到2001年11月,他们又将“最终成本”预估为2.41亿英镑。这个最终成本在2002年年末的时候又上涨了两次,成为2.946亿英镑。到2003年6月,预算又增加了3次,达到3.758亿英镑。这栋大楼最终在2004年建成,最终耗资约为4.31亿英镑。。 
    ·2005年的一项研究对1969~1998年全球范围内的铁路项目进行了检测。其中,超过90%的项目都高估了新线路的乘客数量。尽管这些乘客的差额曾被广而告之,这30年间对乘客数量预测的准确度却没有什么提高。设计者对新铁路项目的乘客量的平均高估率达106%,平均成本超支45%。尽管收集了越来越多的证据,那些专家却并没有利用这些证据。
    · 2002年,针对改造厨房的美国有房者进行的一项调查发现,他们预估的厨房改造费用平均为18658美元,但实际上他们最后的平均花费是38769美元。

    规划者与决策者的乐观心态并不是造成超支的唯一原因。厨房改造和武器系统的承包人都承认(尽管不是对他们的客户承认),他们都会通过扩充最初计划而获取最大利益。客户们无法想象他们的意愿会随时间的推移而逐渐增多,而没能预测到这些情况的事实也恰好反映出这一点。如果他们制订一个较为现实的计划并严格按计划进行,最终就不会花掉这么多钱了。

    最初预算的误差并不总是无知的。制订计划的人都希望自己的计划能得到上级和顾客的认可。通常也正是这种愿望的驱使,他们才制订出了不切实际的计划。他们这样做还因为仅仅由于超支或超时不太可能会导致项目被中途叫停。在这些例子中,避免规划谬误的最大责任落在了批准计划的决策者身上。如果这些决策者没有意识到外部意见的必要性,他们就会犯下规划谬误的错误。

    减少决策错误的有效方法

    自多年前那个星期五的下午以来,判断和避免规划谬误的方法并未发生过变化,但这一理念的实施却有了很大进展。现任教于哈佛大学的丹麦籍著名规划专家本特·弗林夫伯格(Bent Flyvbjerg)曾经有过颇有说服力的总结:

    看轻或是忽略分布信息的普遍趋势可能是预测产生错误的主要原因。因此,计划者应该尽力划分出预测问题的类别,这样才能充分利用所有能够获取的分布信息。

    如何通过改进的方法提高预测的准确性?上面的说法可算做唯一一条最为重要的建议了。在预测时使用相似团队的分布信息被称为采纳“外部意见”,它是避免规划谬误的有效方法。

    对规划谬误的修正如今也有了对应的专业术语,叫做“参考类别预测”。弗林夫伯格已将此术语运用到几个国家的交通运输项目中。外部意见通过使用更大的数据库来实施,此数据库提供了全世界范围内数以百计的项目信息,包括其计划与结果的信息,能提供可能发生的超支和超时的统计学信息以及各类不尽如人意的项目信息。

    弗林夫伯格使用的预测方法与为克服对基础比率的忽视而采取的建议非常相似:
    1.识别对应的参考类别(例如厨房改建和大型铁路项目等)。
    2.获取参考类别的统计数据(每英里铁路的造价或是支出超过预算的百分比),利用这些数据作出基准预测。
    3.如果有特别的原因说明这个项目多少会比同类项目的乐观偏差更为明显,则可使用此例的具体信息对基准预测进行调整。

    弗林夫伯格的分析旨在通过提供类似项目超出预算的统计数据,为委任公共事业工程项目的官员提供指南。决策者在批准某个提议之前,需要先了解其成本和利益的实际评估。他们还希望估测出为超出预算而准备的预备金,即使这样的预防措施通常会成为自我应验的预言。正如一位官员告诉弗林夫伯格的那样,“预备金与承包者的关系就像牛羊肉与狮子的关系,狮子会吞食牛羊肉,承包者也会私吞预备金”。

    高管们为了抢占资源很容易会提出过于乐观的计划,因此,各个组织面临着控制高管这种倾向的挑战。运转良好的组织会奖励规划师,因为他们提出的方案精准而又切实可行;当然也会处罚规划师,因为他们没能对遇到的困难作出预测或是没能考虑到他们本可以规避的困难,即未知的未知数。

    而今距离那个星期五的下午已经过去了30年,但每一年我都会想起它,在演讲中也会提到它。有些朋友已经对那个故事感到厌倦了,但我还在不断从中吸取经验。大约在我第一次和阿莫斯作关于规划谬误报告的15年后,我又与丹·洛瓦洛(Dan Lovallo)一起提到了这个话题。我们一起草拟了一个关于决策的理论,即乐观偏差是人们愿意承担风险的重要原因。在经济学标准的理性模式下,人们愿意冒险是因为胜算大—他们之所以现在能承受有代价的失败,是因为他们相信最终成功的概率很大。这是替代的一个观点。

    在我们预测风险项目的结果时,高管们很容易会掉入规划谬误的陷阱。在规划谬误的支配下,他们根据脱离现实的乐观心态来做决策,而不是根据对利益得失以及概率的理性分析做决策。他们高估了利益,低估了损失。他们设想了成功的场景,却忽略了失败和误算的可能性。因此,他们所追求的行动方案不太可能在预算之内完成,也不大可能按时完成,这个方案可能也无法实现预期的回报—甚至都无法完成。

    由此看来,人们之所以经常(但不是总是)承担风险项目是因为他们对成功率过于乐观。我将在本书中反复提到这一点,因为它可能有助于解释为什么人们会对簿公堂、发起战争或者急于创业。

    多年来我一直认为关于课程那件事的主要意义就是我从希莫那里学到了一些东西:他对我们项目未来的最佳猜测并没有参考他所知道的相似项目的信息。我原以为自己很会叙述事情,而且在那件事中我还是一个聪明的询问者、机敏的心理学家。但是,直到最近我才意识到,那时的我其实是个笨蛋,是个无能的领导者。

    那个项目是由我发起的,因此我的主要责任就是赋予这个项目意义,而其他主要的问题则由团队进行讨论,但我却失职了。当我听到希莫的统计分析后,就改正了那个谬误。如果是在迫不得已的情况下,我会承认我们的项目从一开始就是错的,我们至少应该认真考虑承认失败并打包回家这个选择。但是没有人向我施压,也没有人和我讨论过这个问题,我们默许了这个项目继续下去,根本就不考虑到底需要多长时间。这样做很容易,因为我们在最开始时并没有作出这样的预测。如果在开始做这个项目时就有了合理的基准预测,那么我们就不会再将项目进行下去了,但我们已经投入了大量精力—这是一个沉没成本悖论的例子,我们将在本书后半部分重点关注这个问题。放弃这个项目会令我们很尴尬,尤其是我,而且我也没有直接的理由这样做。在危急时刻转变方向比较容易,但这并不是一个危急时刻,因为我们得到的只是一些不相干的人的实例。与我们在自身努力后得到不好的结果相比,外部意见更容易被忽略。我将我们的状态形象地描述成嗜睡症的一种形式—不愿思考发生的事情。所以我们继续进行项目。在余下这段时间里,作为团队一员的我也没有进一步尝试制订理性规划—这是作为一个致力于宣扬理性的团队尤为大意的疏忽。我希望我现在能更明智一些,自己也形成寻求外部意见的习惯。但是,这种做法永远都不是自然而然发生的。

    示例—外部意见与内部意见“他正在采纳内部意见,他应该忽略自己案例的情况,去看看其他案例是什么情况。”“她掉进了规划谬误的陷阱。她设想了一个最为理想的情景,但有多种原因可能导致计划失败,她无法预见所有原因。”“假设你除了知道某个特定的案件是针对一名外科医生的医疗纠纷以外,其他什么也不了解。你的基准预测会是怎样的呢?法庭上成功的案例有多少?有多少案件是已经结案的?这类案件的总量是多少?我们正在谈论的这个案件与其他相似的案件相比是更严重还是较为轻微?”“我们又加大了投资,因为我们不想承认失败。这是一个沉没成本悖论的例子吗?”第24章 乐观主义是一柄双刃剑

    规划谬误只是普遍存在的乐观偏见的一种表现形式。我们中的大多数人都认为世界是美好的,但世界却没有想象般美好;我们觉得自己的贡献很大,但事实上并没有那么大;我们认为自己设定的目标很容易实现,但其实实现的可能性也没有那么大。我们还容易夸大自己预测未来的能力,进而导致乐观的过度自信,这可能会影响到决策。乐观偏见也许是认知偏见中最重要的一种。如果你性情乐观,就应该既乐观又谨慎,因为乐观偏见可能有益,也可能带来风险。

    乐观主义者过度自信的代价

    抱有乐观心态很正常,但一些幸运儿比其他人更为乐观。如果你天生就有乐观偏见,无须别人告知,你就知道自己是个幸运儿,因为你已经感到幸运了。乐观心态大多是遗传下来的,是人类普遍存在的一种性情,偏向于看到事物积极的一面。

    如若让你为自己的孩子求个愿望,你应该真心希望他或她有个乐观的心态。乐观主义者通常都是开朗快乐的,也因此颇受欢迎。他们对失败和困难的承受力都比较强,患抑郁症的概率低,免疫系统良好,也更注重身体健康。他们感觉自己比别人健康,事实上他们的确更长寿。有些人会夸大自己的预期寿命,认为自己的寿命会超过保险界的统计数据。而对这些人的研究表明,他们的工作时间较长,对自己未来的收入更有信心,离婚之后更容易再婚(典型的“精神胜利法”),也更容易投资个股。当然,只有那些带有轻微偏见并且能在不脱离实际的前提下“强调积极因素”的人才能享受乐观主义带来的益处。

    乐观主义者对塑造生活起到了或大或小的作用。他们的决策产生了一定的影响。这些乐观主义者是发明家、企业家、政治和军事领导人—总之不是普通人。他们寻求挑战,承担风险,最终获得了成功。他们有天赋,也一直很幸运,几乎可以肯定地说他们比自己认为的还要幸运。他们很可能天生就是乐观派。一项对小型企业创始人的调查总结道,企业家对待生活的态度普遍比中层主管乐观。他们成功的经历印证了他们对自己的判断和掌控能力的信心。他们的自信因别人的崇拜而增强。这条推理使我们得出一个假说:对他人生活影响巨大的人可能是乐观和过度自信的,这种人承担的风险远大于自己所能意识到的水平。

    这一证据表明,当个人或是机构自愿承担重大风险时,乐观偏见都发生了作用,甚至起到了主导作用。通常冒险家经常会低估胜算,还投入了大量精力去寻求胜算。由于误算了风险,即使他们其实并不谨慎,那些乐观的企业家也会认为自己是谨慎的。他们相信自己将来会成功,因而也保持着积极的心态,这会促使他们广泛搜集资源,鼓舞员工士气,进而增加获胜的机会。当需要采取行动时,即使略带妄想,乐观主义也是件好事。

    在美国,小型企业能够生存5年以上的概率是35%,但创立此类企业的人并不认为这些数据适用于自己。调查显示,美国企业家容易相信他们的事业正处于上升期:他们对“任何类似你们企业”的成功概率的平均估值为60%—几乎是正确数值的一倍。当他们评估自己企业的胜算时,偏见就更为明显了。有81%的小型企业创办人认为他们的胜算达到70%甚至更高,有33%的人甚至认为他们失败的概率为零。

    有偏见并不奇怪。如果最近某人开了家意大利餐厅,你在采访他时就不要期待她会低估自己成功的概率或说自己缺乏经营餐馆的能力。但你肯定会纳闷儿:如果她通过一些渠道得知了胜算率,还会继续投入金钱和时间吗?或是她在得知胜算率(有60%的新餐厅3年后会歇业)以后,会考虑胜算率吗?答案是,她可能不会考虑采纳外部意见。

    性情乐观的一个好处是它使我们在困难面前坚持不懈,但是这种坚持可能需要付出很高昂的代价。托马斯·阿斯特布罗(Thomas Astebro)曾经作过一系列令人印象深刻的研究,阐明了乐观主义者收到坏消息时会发生的事。他从一家加拿大机构—发明家援助计划—中得到了所需数据,这项计划对发明家的点子的商业前景进行客观评估,这一业务收取很少的费用。这些评估按照37种标准对每项发明进行比对排名,其中包括产品用途、生产成本以及预估的需求趋向等。分析师用字母表示排名,D和E表示失败—在分析师分析的各项发明中,70%都是D或E,他们对失败的预测非常准确:411个项目中仅有5项达到了商业化的最低标准,且没有一项算得上非常成功。

    在收到自己那份意味着失败的评级结果时,约有一半发明家选择了退出。然而,即使在得知自己的项目毫无希望之后,他们之中仍有47%的人选择继续努力。这些坚持的(或是固执)人的损失平均会是放弃发明所遭受损失的两倍。值得注意的是,在乐观测试中得分较高(普遍比一般人群高)的发明家中,收到这个令人气馁的建议后仍然选择坚持的状况比较常见。总的来说,个人发明的回报很小,要“低于私募基金和高风险证券的回报“。一般说来,个体经营的财务收益属于中等:同等条件下,人们通过向雇主出售自己的技能得到的平均回报要比经营自己的企业更高。这表明乐观主义是普遍、执拗且代价昂贵的。

    心理学家已经证实,大部分人都相信自己比别人有着更为理想的特质—他们愿意为这些实验室中的信念下一笔小赌注。当然,觉得自己很优越的想法在市场中具有重大意义。大型企业的领导有时会在投资巨大的并购上下很大赌注,因为他们错误地以为自己可以比该公司现任管理层更好地管理其资产。股市一般也会对此做出反应,兼并公司的价值会降低,因为经验表明,兼并大型企业的努力失败的概率往往大于成功的概率。“自负假说”(Hubris Hypothesis)已经解释了这种被误导的兼并:那些兼并公司的高管们只是没有他们想象中那么有能力罢了。

    经济学家乌尔里克·马尔门迪尔(Ulrike Malmendier)和杰弗里·塔特(Geoffrey Tate)通过执行总裁在公司的股份持有量来鉴别他们是否是乐观主义者。他们还观察到,过于乐观的领导者承担了过多的风险。他们猜测更容易导致这些高层“向并购目标支付过高的溢价并承接毫无价值的兼并”的是债务而非股权发行或是其他方面的因素。值得注意的是,按这两位经济学家的观察结果来说,如果兼并公司的高管过于乐观,该公司的股票在公司并购中就会受到更大的影响。股票市场明显能够鉴别出过度自信的高管。观察得出,虽然对管理层的过度自信无可指摘,但他们还有其他的问题,比如:爱下不妥当赌注的企业领导之所以没有过度自信,是因为他们在拿别人的钱下赌注。相反,如果他们个人持有较多股份就会冒更大的风险。当商业媒体将过度自信的执行总裁标榜为名人时,他们造成的损失就会加重。这表明媒体界冠予执行总裁的声誉对于股东来说是代价高昂的。两位作者写道:“我们发现,若公司总裁曾被授予荣誉,则该公司的股票表现就不会很好。与此同时,执行总裁的报酬会增加,他们也会花更多的时间参与公司事务以外的活动,比如写书以及列席董事会等,还极有可能参与盈余管理。”

    多年以前,我和妻子曾去温哥华岛度假。我们找到了一家漂亮、舒适的汽车旅馆,但它位于森林中部,这条路少有人走,不免有荒凉之感。旅馆是对年轻而又漂亮的夫妻开的。在我们的鼓励下,这对夫妻讲述了他们的经历。他们曾是亚伯达省的教师,后来决定改变自己的生活现状,遂用所有积蓄买下了这座12年前建成的汽车旅馆。他们说:“在我们之前的六七位老板都没能将这家旅馆妥善经营。”所以他们才能用这么便宜的价格买下这家旅馆。他们说这话完全是无意识的,口气没有任何讥讽之感。他们还说自己有贷款修缮旅馆的计划,在旅馆旁再建个餐厅,如此一来,整个旅馆就更具吸引力了。他们觉得没必要解释为何前几位老板都失败了而自己则成功了。无论是旅馆老板还是公司高管,他们都具备勇气和乐观的精神。

    即使大多数风险承担者最终总是收获失望,但那些因乐观而承担的风险企业家毫无疑问都会为激发资本主义社会的经济活力作出贡献。来自伦敦经济学院的马尔塔·科埃略(Marta Coelho)曾经指出,小型企业的创办者要求政府在决策方面支持自己时(这些决策多半会失败),就会带来让人挠头的政策问题。政府会向这些几年后就会破产的企业家提供贷款吗?许多行为经济学家比较赞同“温和的家长式作风”,因为“温和的家长”管理可以提高他们的储蓄率。政府是否应该支持小型企业,如果应该,又该怎样支持小型企业,这些问题至今也没有令人满意的答案。

    竞争忽视:为何大片会扎堆上映?

    人们倾向于用愿望思维来解释企业家身上的乐观主义,但是情感只是乐观主义产生的一部分原因。认知偏见起了很重要的作用,特别是系统1的其中一个特征,即眼见即为事实。

    ·我们将注意力集中在目标上,锚定我们的计划,却忽视了相关的基础比率,导致规划谬误。

    ·我们只关注自己想做的和能做的,却忽视了他人的计划和技能。

    ·在解读过去和预测未来时,我们强调了技能的因果角色,却忽视了运气的影响。因此,我们产生了“控制错觉”。

    ·我们只重视自己已知的,却忽视自己未知的,因此我们对自己的信念过度自信。

    “90%的司机都相信自己的车技要高于平均水平”这一心理学发现已得到了证实,也已成了文化的一部分,还成了普遍存在的高于均数效应的主要例子。然而,对这个发现的解读在近几年发生了改变,原来认为这是一种自我膨胀,现在则认为这是一种认知偏见。请考虑下面两个问题:

    你是一个好司机吗?

    你是一个高于平均水平的司机吗?

    第一个问题很简单,人们很快就可作答,且多数司机都会答“是”。第二个问题要难很多,大多数受试者几乎都不可能谨慎而又正确地作答,因为这需要对司机的平均水平进行评估。读到这里,对于人们会用简单答案回答难题这一观点你已有所了解。虽然受试者将自己的水平与平均水平进行比较,却从未考虑过平均水平究竟是什么水平。对高于均数效应的认知解释有一项证据,即当人们被要求完成一项困难的任务时(对我们大多数人来说,这个任务可能是“你发起与陌生人交谈的技巧高于平均水平吗”),他们会不假思索地将自己划在平均水平以下。结果,只要表现还说得过去,人们就总是喜欢表现得过于乐观。

    我曾经有过几次机会询问新成立的创新型公司的创办者及其合作人一个问题:公司取得的成绩在多大程度上取决于你在公司的作为?这明显是个简单的问题;人们很快就能回答出来,而且在我所抽取的小样本中,认为自己与公司成功的关联度没有低于80%的。即使他们并不肯定此时自己是否成功,这些有胆量的人也都认为自己的命运完全掌握在自己手中。他们肯定错了:新公司的成绩更多取决于其竞争者、市场的变化以及自身的调控。然而,眼见即为事实的原则也起到了一部分作用,企业家会自然而然地将注意力放在他们最为了解的地方—他们的计划、行为、最直接的威胁和机遇等,例如筹资能力。他们对竞争者所知较少,也就自然地认为竞争者与公司未来没多大关系。

    科林·卡莫若(Colin Camerer)和丹·洛瓦洛创造了“竞争忽略”这个概念,并用迪士尼制片厂董事长的一段话阐述了这一概念。当有人问为什么有这么多高投资的大制作会同期上映时(例如《世纪大毁灭》和《独立日》),他回答道:

    一切都是因为自负。如果只关心自己的生意,你就会想:“我有一个优秀的编辑部,还有个很棒的市场部,我们会做好电影的。”你还认为其他人肯定都不会这样想。但是在一年中的某个周末,你可能就会发现竟然有5部电影同时公映,那么来看你那部电影的人肯定就不会很多。

    这个坦率的回答提到了自负,但这种自负不是指傲慢或比其他制片厂更有优越感。人们只是在决策时没有将竞争因素考虑在内,因为困难的问题再次被简单的问题替代了。这里需要解决的问题是:想想别的人会怎么做,有多少人会看我们的电影。诸位制片厂的主管考虑的问题则更为简单,无须多虑:我们的电影怎么样,有强大的部门为其作推广吗?我们熟知的系统1的眼见即为事实原则以及替代原则都引起了竞争忽略和高于均数效应的预测。竞争忽略的结果是产生了许多额外入口:众多竞争者进入市场,导致市场不能保证赢利,所以平均下来,其结果就是亏损。对于新进入市场的公司来说,这样的结果会令其失望,但是这对总体经济的影响却可能是积极的。事实上,一些创新型企业的失败标志着新的市场需要更有能力的竞争者。乔瓦尼·多西(Giovanni Dosi)和丹。洛瓦洛称这些创新型企业为“乐观主义烈士”,对经济有益,对投资者有害。

    是你太糟糕,而不是我太笨拙

    杜克大学的教授们用了几年的时间作了一项调查,调查内容为大型企业的财务总监对次年的标准普尔指数作出的估测。杜克大学的学者们搜集了11 600份这样的预测并检验了它们的准确性。结论非常明显:大型企业的财务主管对股票市场的短期走向一无所知,他们估测出的值与真实值的相关系数接近零!当他们说股市走低时,股市多半可能会上扬。这些发现并不令人吃惊。真正糟糕的消息是,这些财务总监似乎并不知道他们的预测是没有价值的。

    除了对标准普尔指数的估测外,受试者还提供了另外两项估测值:其中一项他们有90%把握的值太高,而另一项他们有90%把握的值又太低。这两个值的范围差被称为“80%的置信区间”,若结果在这个区间之外,我们则称其为“意外”。一个人在多种条件下设置的置信区间预计会有20%的可能出现意外,但通常在多种条件下进行的预测会有67%的意外发生,比预期高出两倍多。这说明财务总监过度相信自己预测市场的能力了。“过度自信”是眼见即为事实的一种表现:在估测质量时,我们会依赖大脑呈现的信息并构建一个使估测合理的、具有逻辑的解释。一个人不可能采用自己没有想到的那些信息,也许是因为他从来就不知道这些信息吧。

    两位作者计算了一下,发现置信区间可将意外的发生率降至20%。这样的结果令人惊讶。想要将意外率保持在理想水平,财务总监就应该年复一年地说:“明年标准普尔回报率在–10%和30%之间的可能性有80%。”这个置信区间恰当地反映了财务总监的知识(更确切地说是他们的无知)比他们实际阐述的区间的4倍还要多。

    此处涉及社会心理学范畴,因为一个诚实的财务总监提供的答案明显是荒谬的。

    如果一个财务总监告诉他的同事“明年标准普尔回报率很可能在–10%和30%之间”,整个办公室的人很可能都会嘲笑他。设置这么大的置信区间无异于承认了自己的无知,社会不会认同一位靠提供资金相关知识拿工资的人的这种做法。虽然这些主管知道自己所知甚少,但承认这一点将会受到处罚。杜鲁门总统就曾发表过著名的言论,说他想找一个立场明确的“独臂经济学家”(one-armed economist),他对那些总是说“另一只手……”的经济学家烦透了。 ①

    有些机构相信了过度自信的专家的言论,就要承受代价高昂的后果。关于财务总监的调查说明,对标准普尔指数最为自信和乐观的人也会对他们自己公司的前景过度自信和乐观,也就愿意比别人承担更大的风险。纳西姆。塔勒布说过,对环境的不确定性了解不足必然会导致经济行为人承担本可以避免的风险。然而,无论在社会生活中还是在股票市场中,乐观主义极其重要。个人及企业会奖励那些提供了冒险且有误导性信息的人,而不是说真话的人。我们从造成大萧条的金融危机中学到的是:总有一段时间,专家间和企业间的竞争会造成大家对风险和不确定性视而不见。

    青睐过度自信的专家的领域并不仅限于金融预测。其他专业人士必须面对这样一个事实:一位实至名归的专家需要表现出很高的自信程度。菲利普。泰特罗克的观察表明,最为过度自信的专家更有可能代表全体员工出现在新闻节目中。过度自信也会像医学上的传染病那样具有传染性。有项研究,是将在重症加护病房死亡的人的验尸报告和医生在死者生前提供的诊断进行对比。医生也表现了他们的自信,结果是:对病人临死前的诊断“完全确定”的临床医生中有40%的诊断是错误的。同样,过度自信的专家也间接受到了病人的影响:“通常,临床医生显现出的不确定是一种懦弱的表现。自信的人比对事情持不确定态度的人更受人推崇。医生将自己的不确定透露给病人会遭到大家的指责。”完全认识到自己无知的专家可能会被更自信、更能获得病人信任的竞争者取代。对不确定性的无偏见评价是理性的基石,但这并不是个人或机构想要的。在危机中,极度的不确定会造成严重后果,而且在风险高的时候承认自己只是在猜测的做法特别不易被接受。所以,假装知道通常是首选的解决方式。

    当支持夸张的乐观主义情感因素、认知因素以及社会因素共同作用时,有时就会导致人们承担一些风险,且这些风险在他们知道胜算的情况下是可以避免的。没有证据表明经济领域的风险承担者对于孤注一掷的赌博有特别大的兴趣,只是他们不像胆小的人那样有风险意识罢了。我和丹。洛瓦洛杜撰了“无谓的预测和胆小的决策”这个短语来描述风险承担的背景。

    对决策高度乐观带来的影响是好坏参半的,但乐观对顺利进行的影响肯定是积极的。乐观的主要益处是使人有了从受挫中复原的能力。正像积极心理学创始人马丁·塞利格曼(Martin Seligman)认为的那样,“乐观的解释风格”通过捍卫自我形象使人产生了复原力。从本质上来说,乐观风格包括对成功进行嘉奖和对失败少加责备。至少在某种程度上,这种风格是可以被训练出来的。塞利格曼记录了多个高失败率行业的训练效果,例如上门推销保险(网络时代以前的普遍做法)。当某个人被一个愤怒的主妇当面摔门拒之门外时,这个人肯定会想“她是个糟糕的女人”,而不是“我是个笨拙的销售员”。我一直认为,在科学研究这一领域,乐观对成功而言同样不可或缺:我遇到的成功的科学家都会夸大他或她正在进行的研究的重要性。我还相信,不爱夸大自己重要性的人在反复面对挫折和失败时会一蹶不振,这种情况也是大多数研究人员的结局。

    “事前验尸”:部分克服乐观偏见的方法

    可以通过训练克服过度自信的乐观偏见吗?对此,我并不乐观。训练人们设定置信区间的多次尝试表明了他们的判断并不精确,只有几个人是相对成功的。利用许多已经知道结果的以往案例进行训练以后,荷兰皇家壳牌公司的地质学家在估测可能的钻井场时,就变得不那么自信了。人们经常会引用这个例子。在其他情况下,在人们判断时鼓励他们考虑相互竞争的假设可降低(但不会消除)他们过度自信的程度。然而,过度自信是系统1特性的直接结果,可被驯服但不能被彻底改变。问题的主要障碍在于,主观自信是由人们构建的连贯的故事决定的,而不是由支持它的信息的质量和数量决定的。

    各个组织也许比个人更能抑制乐观主义情绪,而抑制这一情绪的最佳方法是由加里。克莱恩提出的。加里是我的“对抗性合作者”,他推崇直觉型决策,反对偏见的说法,对运算法的反对态度也很明确。他将自己的提议称为“事前验尸”。流程十分简单:当一个机构即将做出一个重要决策但还没有正式下达决议时,克莱恩提议召集对这个决策有所了解的人开一次简短的会议。在会议之前有一个简短的演说:“设想我们在一年后的今天已经实施了现有计划,但结果惨败。请用5~10分钟简短写下这次惨败的缘由。”

    加里·克莱恩关于事前验尸的观点立刻引起了巨大反响。当我在某场达沃斯会议上偶然谈到这个观点时,一个坐在我身后的人低语道:“就为这一点,来参加这次达沃斯论坛值了!”(后来,我注意到这个说话的人是一家大型跨国公司的执行总裁。)事前验尸观点有两个主要优点:决策快要制定好时,许多团队成员会受到集体思考的影响,而事前验尸则扼制住了这种影响。另外,它还激发了那些见多识广的个人的想象力,并将他们的想法引导到最需要它们的方向。

    当一个团队将注意力集中在决策上,特别是当领导宣布他的意图时,人们对计划好的步骤的可行性的疑虑就会渐渐减弱,到最后,这样的怀疑还会被认为是对团队和领导的不忠诚。如果某个团队中只有支持决策的人才有发言权,那么对怀疑的抑制就会造成这个团队的过度自信。事前验尸的主要优点是它引发了怀疑。另外,它还助长了支持决策的人去探寻他们先前没有考虑到但却可能存在的威胁。事前验尸并不是灵丹妙药,也不能提供完整措施使我们避免恼人的意外,但这一方法在一定程度上可以减少计划的损失。而这些损失一般都是因眼见即为事实的偏差以及盲目的乐观主义导致的。

    示例—乐观偏见与过度自信“他们有控制错觉,他们严重低估了障碍。”“他们好像因为竞争忽略而遭了殃。”“这是一个过度自信的例子,他们似乎认为自己知道的比实际的多。”“我们应该开一个事前验尸会议,有人也许能想到一个被我们忽略了的威胁。”

    ① 此处为双关,在英语中,人们总喜欢说“on the one hand……on the other hand……”,意为“一方面……另一方面……”。杜鲁门总统认为这样讲话表明一个人立场不明,所以他说我不喜欢总说两方面的人,此处“one-armed economist”并不是真正独臂的经济学家,而是只说“一只手”(即一方面)的人,不要再讲“另一只手”(另一方面)了。

  • 丹尼尔•卡尼曼《思考,快与慢》10-18

    第二部分 启发法与偏见

    第10章 大数法则与小数定律

    一项研究对美国3141个县的肾癌发病率进行了调查,调查显示该病的分布模式很值得注意。发病率最低的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。对此,你有何看法?

    刚刚过去的几秒钟里,你的大脑处于非常活跃的状态,这主要是因为系统2在运行。你谨慎地在记忆中搜寻着并作出假设。在这个过程中你也付出了一定的努力,你的瞳孔会扩张,心跳会适度加快。系统1也没有闲着,因为系统2的运行需要从联想记忆中获取事实和建议。你很可能会否认共和党的政策提供了肾癌防控方法这个想法,却会关注肾癌发病率低的县大多是乡村这个事实。这个例子是我从机智的统计学家霍华德·维纳(Howard Wainer)和哈里斯·泽维林(Harris Zwerling)那儿得到的,他们对这一案例的评论是:“人们很容易作出推断,认为肾癌发病率低主要是由于乡村的生活方式很健康—没有空气污染和水污染,食品没有添加剂,保证新鲜。”这一点完全说得通。

    现在,考虑一下肾癌发病率最高的县的情况吧。假设这些易发病的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。霍华德·维纳和哈里斯·泽维林半开玩笑地评论道:“人们可以很容易作出推断,导致肾癌高发病率的直接原因是乡村生活的贫困—医疗条件差、高脂肪饮食、酗酒、嗜烟等。”当然这种说法肯定有问题,因为乡村生活方式不可能既是肾癌发病率高的原因又是其发病率低的原因。

    问题的关键并不在于这些县处在乡村地区或是由共和党掌管,而在于乡村地区人口少。我们通过这个例子学到的不是流行病学知识,而是我们的大脑和统计数据之间的复杂关系。系统1非常擅长一种思维模式—自动且毫不费力地识别事物之间的因果联系,即使有时这种关系根本就不存在,它也会这样认定。当听到肾癌高发地区的情况时,你立刻会想当然地认为这些县与其他县不同是有原因的,一定有个理由可以解释这种不同。然而,正如我们所见,当系统1面对“纯统计学”的数据时是束手无策的,因为这些数据虽然可以改变结果出现的概率,却不能直接导致结果的发生。

    根据定义,一个随机事件是不需要解释的,但一连串的随机事件就有规律可循。想象有一个装有大理石弹球的瓮,其中有一半的弹球是红色的,另一半弹球是白色的。然后,再想象有一个非常有耐心的人(或一个机器人)随意从瓮中取出4个大理石球,记录其中的红球数,再把球放回去,重复这样的做法数次。总结记录结果时,你会发现“2红2白”的结果出现的次数(几乎刚好)是“4个全红”或“4个全白”这种结果的6倍。这一倍数关系是个数学事实。你可以对这种从瓮中反复抽样的结果作出自信的预测,就像你能预测到用锤子砸鸡蛋的结果一样。尽管你无法预见蛋壳破碎的具体细节,但大概结果还是很确定的。两件事的不同之处在于:你想到锤子砸鸡蛋时感受到的那种明确的因果联系,在瓮中取样的设想中是找不到的。

    相关的统计学事实与癌症那个例子也有联系。两个耐心的计数者轮流从瓮中取大理石球,杰克每次拿出4个球,吉尔拿出7个。他们都记录了每次拿到相同颜色弹球的次数—要么全白,要么全红。如果他们取球的做法持续的时间足够长,杰克拿到同颜色大理石的次数会是吉尔的8倍(两人的预期概率分别为12.5%和1.56%)。这个结果与锤子无关,也与因果联系无关,这仅仅是一个数学上的事实:一次拿4个弹球与一次拿7个相比,出现极端结果的概率更大。

    现在,将美国人口想象成一个巨大的瓮中的弹球。有些球上标有KC(即Kidney Cancer的简称)字样,表示肾癌。你抽取弹球样本,并依次按照所在县摆放,你会发现乡村地区的样本要比其他地区的少。如同杰克和吉尔所做的那个游戏一样,极端的结果(非常高或非常低的癌症发病率)容易出现在人口稀少的县,这个故事告诉我们的就是这些。

    我们从一个令人费解的事实说起:肾癌的发病率在各县有所不同,且是有规律的,我用统计学理论对此作了解释:相比于大样本,极端的结果(高发病率和低发病率)更容易出现在小样本中。这样的解释不存在因果联系。某县的人口稀少既不会引发癌症,也不能避免癌症,只会使癌症的发病率比人口稠密地方的发病率更高(或更低)。这就是真相,没什么可解释的。在某个人口稀少的县,癌症发病率并非真的比正常情况更低或更高,只是这个县正好在某个特殊的年份赶上了抽样调查罢了。如果我们在第二年重复这样的分析,也能预测到在小样本中出现极端结果的一般模式,但在前一年癌症发病率高的县,这一年发病率并不一定高。如果是这样的话,则人口稠密或稀少的因素就无法对发病率作出解释了:这些表面因素就是科学家眼中所谓的假象,即观察结果完全依赖于调查方法的某一方面,在这个案例中,则依赖于样本大小。

    我刚才说的例子也许会令你惊讶,但这并不是真相初次大白于天下。你早就知道应该更相信大样本,并且即使是对统计学一无所知的人也听说过大数法则。但是“知道”并非是非抉择问题,你可能会发现下列陈述放在自己身上很合适:

    ·当你阅读这个关于流行病学的例子时,并没有立刻注意到“人口稀少”这一特点与此次调查有何关联。

    ·对于采用4个样本还是7个样本所产生的不同结果,你至少会感到有一点惊讶。

    ·即使是现在,想要确定下面两个陈述句所说的完全是一回事,你也要费些脑力:

    (1)大样本比小样本更精确。

    (2)小样本比大样本产生极端结果的概率大。

    第一个表述清晰地陈述了一个事实,但直到感受到第二个表述传达给你的意思,

    你才意识到自己并没有真正理解第一个表述的意思。

    上述内容概括起来就是:没错,你知道大样本的结果更精确,但你现在可能才意识到你并不清楚为什么它们更精确。不仅你一人如此,阿莫斯与我在一起进行的第一个研究表明,即使是经验丰富的研究人员对样本效应也缺乏直觉,要么就是理解不到位。

    小样本的出错风险可能高达50%

    没有接受过统计学方面训练的人是出色的“直觉性统计学家”。我与阿莫斯在20世纪70年代早期的合作便始于对这个观点的讨论。他对我(在大学)的研究班及我本人讲过,密歇根大学的一些研究人员对直觉性统计抱有乐观态度。我个人对那个观点有种强烈的感觉:那段时间我发现自己并不是一个出色的直觉性统计学家,但是我也不相信别人会比我好多少。

    对于一个研究型心理学家来说,样本变差没有什么特别的。它是个烦人且损失又大的麻烦事,会把每项实验都变成一场赌博。试想你希望证明6岁女孩的平均词汇量比同龄男孩的词汇量更丰富的假设。这个假设从整体来说是成立的,女孩的平均词汇量确实要比男孩的丰富一些。然而,尽管男孩与女孩差别很大,但你很可能会抽取到男女相差不太明显的样本,甚至会抽到一个男孩比女孩词汇测试成绩还要好的样本。如果你是那个研究者,这个结果对于你来说代价就太高了,因为它浪费了你的时间和精力,却无法证实一个实际正确的假设。使用一个足够大的样本是降低这种风险的唯一方法。选择小样本的研究者只能看自己是不是能选对合适的样本了。

    想要对样本错误的风险作出评估,只需通过一个相当简单的步骤就可以实现。然而按照惯例来看,心理学家并不是通过计算来选定样本大小的。他们听从自己的判断,但这些判断往往是错的。在与阿莫斯发生意见分歧不久之前,我读过一篇文章,文章通过生动的观察结果展示了研究人员所犯的错误(他们现在仍在犯这种错误)。该文作者指出心理学家选择的样本通常都很小,致使他们有50%的风险不能够证实其正确的假设,而任何研究人员都不会在头脑清醒的情况下接受这种风险。对此有一个貌似正确的解释,即心理学家对于样本大小的决定反映了他们普遍存在的一个直觉性错误观念,即对于样本变差范围的错误看法。

    这篇文章令我十分震惊,因为我在自己的研究中碰到了一些问题,却在这篇文章中找到了相关解释。与大多数研究型心理学家一样,我也墨守成规地选择了一些过小的样本,因此得到的实验结果毫无意义。现在,我知道了原因:那些奇怪的结果实际上就是我这种研究方法的典型产物。我的错误特别令人尴尬,因为我教过统计学,也知道该怎样计算样本的大小,以便将风险降至可以接受的程度。但是,我从未通过计算来确定样本大小。和我的同事一样,我被传统所禁锢,相信自己设计实验的直觉,也从未认真考虑过样本选择会带来的那些风险。阿莫斯来参加研讨会时,我已经意识到自己的直觉是错误的。在研讨会中,我们很快达成共识—密歇根的那些乐观派是错误的。

    我与阿莫斯开始调查一个问题:只有我自己这么愚蠢还是我只是众多愚蠢的人之一,我们通过一项测试来证实这个问题,测试对象为一些数学家,想看看这些人是否也会犯类似的错误。我们设计了一份调查问卷,其中描述了真实的研究情境,包括一些成功实验的复制。问卷要求研究人员选择样品大小,对其决定可能带来的失败风险进行评估,并为那些正在设计自己实验的研究生提供建议。在“数学心理学协会”的一次会议上,阿莫斯收集了一组资深受试者(包括两本经济学著作的作者)的反应。结果很明显:我并不是唯一一个愚蠢的人。大多数受试者都会犯和我一样的错误。显然,即使是专家,在选择样品大小时也无法充分集中注意力。

    我和阿莫斯将我们合写的第一篇文章命名为“对小数定律的盲信”。我们半开玩笑地解释道,“对于随意取样的直觉似乎符合小数定律,由此可以断言大数法则对于小数定律同样适用”。在文章中,我们还收录了一个措辞有力的建议,即研究人员认为他们“对于统计直觉应抱有一些怀疑,只要条件允许,都应采用计算方法来确定样本规模,而不是依靠直觉印象作决定”。

    信任多于质疑的普遍性偏见

    在一次面向300名老年人的电话民意调查中,有60%的人支持总统。

    如果你只能用三个词来总结这句话,该怎么说呢?几乎可以肯定的是,你会说“老年人/支持/总统”。这些词概括了这句话的要点。这次民意调查被省略掉的细节—媒介为电话,样本为300人—本身意义不大,它们提供的背景信息并不怎么引人注意。即使样本数量变了,你的结论也不会发生变化。当然,一个完全荒谬的数字倒可能会引起你的注意。(例如一项对6名或6亿名老年选民的电话民意调查……)除非你是专业人员,否则不管样本是150还是3000,你都不会有什么不同的反应。这就是“人们对样本大小没有足够的敏感性”这一表述的意义。

    这项民意调查包含了两方面的信息:新闻本身和新闻的来源。当然,你关注更多的是新闻本身,而不是其结果的可信度。但当可信度明显很低时,新闻所包含的信息也就不足为信了。如果得知“某党派小组操纵一项错误且带有偏见的民意调查,使结果显示老年人支持总统……”你当然会排斥这项调查的结果,不会相信这条新闻,这项由某党派进行的民意调查以及其错误结果不但没有令你信服,反而会成为另一条关于政治骗局的新闻。在这样清晰的案例中,你可以选择不相信其中的信息。但是你能把“我在《纽约时报》读到……”和“我在办公室闲聊中听到……”这两种说法完全区分开来吗?你的系统1能够区分出信息的可信度吗?眼见即为事实的原则表明:不能。

    如前所述,系统1并不善于质疑。它抑制了不明确的信息,不由自主地将信息处理得尽可能连贯。除非该信息被立刻否定,不然,它引发的联想就会扩散开,仿佛这条信息就是千真万确的。系统2能够提出质疑,因为它可以同时包含不相容的多种可能性。然而,保持这种质疑会比不知不觉相信其真实性更加困难。小数定律是普遍性偏见的一种表现,即对事物的信任多于质疑。类似这样的偏见在下面的章节中还会出现。

    相信小样本能反映调查对象的整体情况,这一强烈偏见也是一个较大问题的一部分。这个问题就是,我们常夸大所见事物的相容性和连贯性。许多研究人员过于相信通过有限的几次观察得出的结果,这一现象与光环效应紧密相连。我们常常会觉得自己对某个人很熟悉也很了解,但事实上,我们对他却知之甚少。系统1在了解事实之前就根据零散的证据拼凑了一个饱满的形象。如果相信小数定律,急于下结论的机制就会运作起来。通常情况下,它会建构一个言之成理的说法使你相信自己的直觉判断。

    对随机事件作出因果解释必然是错的

    联想机制会搜寻原因。在统计规则方面,我们面对的困难是这些规则要求使用不同的方法处理问题。依据统计学观点,我们不应关注当前事件的成因,而应当关注其未来走向。这件事的发生并没有什么特殊原因,一切只是机缘而已。

    因为偏好进行因果思考,我们在估测真实的随机事件的随机性时就会犯严重的错误。以在某家医院依次出生的4个婴儿的性别为例,男女出生次序明显是随机的。每个婴儿的出生是各自独立的。在前几个小时内出生的男婴女婴数量并不会影响到下一个出生婴儿的性别。现在,请考虑一下可能的序列:

    男男男女女女

    男男男男男男

    男女男男女男

    出现这些序列的可能性是一样的吗?人们的第一反应都是“肯定不一样啊”。但是,这样的反应是错误的。因为每个婴儿的出生都是独立的事,并且生男生女的概率也几乎相等,6个婴儿任何一种可能的性别顺序都与别的顺序概率相等。即使是现在,你仍然认为这个结论是正确的,但它实际上是反直觉的,因为只有第三种顺序是随机的。如我们所料,“男女男男女男”比其他两种顺序更有可能发生。我们追求模式,相信所处的是一个各方面都相互联系的世界。在这个世界里,规律(例如6个女婴的顺序)并不只是偶然发生的,它还是机械的因果联系或是人的意志的结果。我们并不期待在一个随机的过程中找到规律。但当探寻到一个可能的规则时,我们就会抛开这个过程是真正随机的想法。随机过程会产生许多序列,以使人们相信这个过程完全是不随机的。如此你就可以看出来为什么假设的因果关系有进步发展的优势。它是我们从先辈那里继承的一般警觉性的一部分。我们会习惯性地搜寻环境变化的可能性。狮子可能随时都会出现在平原上,但注意到狮子出现频率的明显增长并采取行动则会安全许多,即使这种增长只是由于随机过程的波动而发生的。

    对于随机性的广泛误解有时会带来重大影响。在我和阿莫斯合作的一篇代表性文章中,我们引用了统计学家威廉·费勒(William Feller)的阐述,他说,人们很容易在根本没有模式的情况下创建模式。“二战”期间,火箭弹在伦敦密集地轰炸。人们普遍相信爆炸不可能是随机的,因为地图显示,爆炸点在各地的分布有明显区别。一些人猜测没有被炸的地点住有德国的间谍。一份严谨的统计分析显示,爆炸点的分布是随机程序的一个典型代表,同样也是令人产生它并不是随机的这一强烈印象的典型代表。费勒评论道:“在没受过专业训练的人看来,这一连串轰炸行动就好像具有某种规律或趋势了。

    “很快,我得到一次机会可以把我从费勒那儿学到的知识派上用场。1973年爆发的赎罪日战争中,我作出的唯一一项重大贡献就是建议以色列空军的高级官员停止一项调查。一开始,由于埃及地对空导弹表现出色,空战对于以色列来说很不利。以色列方面人员伤亡惨重,其人员分布也不均衡。有人告诉我说,有两支来自同一基地的空军中队,其中一支被击落了两架飞机,而另一支一架也没有被击落。为了弄明白那支不幸的空军中队到底做错了什么,相关人员对此展开了调查。我们没有理由认为其中一支空军中队比另一支更有效率,也并未发现他们在操作上有何不同。当然,飞行员的生活在很多方面会有所不同,据我回忆,其差异包括他们在任务之间回家的次数以及报告任务的执行情况等。我当时给出的建议是,司令部应该明白之所以出现不同结果仅仅只是因为他们运气不同而已,应该停止对飞行员的调查。我推断这次事件很可能是由于运气不佳,对不明显的原因进行随机调查必定是劳而无功的。与此同时,空军中队不断有人员损失,没有必要再给他们增加额外的负担,让他们觉得那些去世的伙伴做错了什么。

    几年以后,阿莫斯和他的同学汤姆·季洛维奇(Tom Gilovich)、罗伯特·瓦隆(Robert Vallone)对篮球随机性的错误直觉所作的研究引起了轰动。运动员有时投篮顺手的“事实”普遍被运动员、教练和球迷们所接受。这样的推断是顺理成章的:如果一个运动员连续进了三四个球,你就会不由自主作出判断:这个运动员正处于“投篮顺手”的状态,得分率暂时增加。两队队员都持这种判断—队员也更爱将球传给打得顺手的人,对方球队则会用两位防守球员防卫这位进攻球员。然而,对上千个投篮动作的分析结果却十分令人失望:在职业篮球比赛中,无论球是从球场上投出还是从罚球线投出的,根本没有“投篮顺手”这回事。当然,一些球员会比其他球员投篮更准,但进球与投篮未中都只是随机的。“投篮顺手”完全只是旁人所见,而且他们太快作出评判了,以至于感知不到随机事件中的顺序和因果关系。“投篮顺手”是一个影响深远的认知错觉。

    公众对于这项研究的反应也是这项研究的一部分。这个发现令人惊讶,很快就受到了媒体关注,而大家普遍的反应都是不相信。当著名的波士顿凯尔特人队教练瑞德·奥尔巴赫(Red Auerbach)听说了季洛维奇及其发现(研究)时,他回应道:“这人是谁呀?他做了个实验是吧?不过我对他的观点不敢苟同。”在随机性中发现规律的想法往往不可逆转,肯定比某个人作了一项研究更有说服力。

    对规律的错觉在方方面面影响着篮球赛场。你要用多少年的观察才能肯定一个投资顾问是有真才实学的?一个执行总裁实现多少次成功的兼并,董事会才能确定他对这项工作有着非凡的才能?简单说来,如果你听从自己的直觉,就常常会因为把随机事件看做是有规律的事件而犯错。我们都非常愿意相信生活中大多数事情并不是随机的。

    在本章开头,我引用了一个美国癌症发病率的例子。这个例子本来是有意写给统计学老师看的,我是从前文中提到的两位统计学家霍华德。维纳和哈里斯。泽维林所写的一篇有趣的文章中看到这个例子的。他们写这篇文章得到了盖茨基金会17亿美元的赞助,用以调查那些最成功的院校有哪些特点。许多研究人员在那些名声显赫的院校中作调查,希望发现这些学校的与众不同之处,从而寻求成功教学的秘密。这项研究的结论之一是,这些著名院校规模普遍较小。例如在宾夕法尼亚州对1 662所院校的调查中,排名前50的院校里有6所规模都较小,是(普通院校)的3倍多。这个数据使得盖茨基金会积极投入大量资金建立小规模的院校,有时会采取将大的院校拆分成小的院校的方法。另外,其他著名的机构中至少有一半也采取了同样的做法,例如爱林伯格基金会和皮尤慈善机构也采取了同样的做法,美国教育部还启动了“小型学习社区计划”。

    你可能会觉得上述做法很有道理。我们很容易从因果关系角度去解释小规模的院校为什么可以提供优质的教学。我们认为,比起大规模院校,小规模院校可以给予学生更多的关注及鼓励,因此能培养出成就卓越的学者。但不幸的是,这样的因果分析是无意义的,因为得到的结论都是错误的。如果那些向盖茨基金会提交报告的统计学家们调查过最差学校的特点,他们会发现那些较差的学校也比水平一般的学校的规模小一些。事实上,规模小的学校办学水平并一定更高,他们只不过更懂得变通而已。维纳和泽维林说,如果真有什么区别的话,那就是大规模院校可以提供多种多样的课程,所以容易收到好的效果,特别是学生能拿到高分。

    多亏了几年来认知心理学的发展,我们现在才能清楚地知道阿莫斯和我所瞥见的不过是冰山一角:小数定律包含在大脑工作的两个重要部分中。

    ·夸大对小样本的信任只是众多错觉中的一种—比起信息的可靠度,我们会更加注重信息本身的内容,其结果就是我们会将周围的世界变得比数据所能证明的更加简单和统一。在想象的世界中过早下结论比在现实中更有把握。

    ·统计学家的很多观察研究都可归结到因果关系的解释上,但他们却不承认是这样的。许多事实其实只是巧合,包括事件的采样。对偶发事件作出因果关系的解释必然是错误的。

    示例—小数定律“没错,自从这个新执行总裁接手后,电影制片厂已经制作了3部优秀电影。不过,现在说他老练还为时过早。”“统计学家能够估算出这个交易新手表现出来的强劲势头是否是偶然的,所以在咨询统计学家之前,我不会相信他就是个天才。”“观察的样本太小,所以不能作出任何推断。我们不要遵从小数定律。”“在我们有足够大的样本之前,我计划对实验结果暂时保密。否则,我们会有过早下结论的风险。”第11章 锚定效应在生活中随处可见

    阿莫斯和我曾临时赶制过一个幸运轮盘,上面刻有零到100的标记,但我们对它进行了改装,使指针只能停在10或65的位置上。我们从俄勒冈大学招募了一些学生做这项实验。我们两人中有一个会站在一个小组前面,转动这个幸运轮盘,并让小组成员记下转盘停下时指向的数字,当然了,这些数字只可能是10或65之后,我们问了他们两个问题:

    你刚才写下的关于非洲国家占联合国(所有成员国)的百分比的数字大还是小?

    你认为联合国中非洲国家所占的比例最有可能是多少?

    幸运轮盘的转动根本不可能为任何事情提供有用信息,即使没有经过改装的轮盘也不可能,实验的受试者应该忽略它的影响,但他们没有做到这一点。那些看到10和65的人的平均估值分别为25%和45%。

    我们研究的现象在日常生活中很普遍也很重要,因此你应该记住它的名字:锚定效应。人们在对某一未知量的特殊价值进行评估之前,总会事先对这个量进行一番考量,此时锚定效应就会发生。这一效应是实验心理学中最可靠也最稳健的结果,即估测结果和人们思考的结果很相近,就好比沉入海底的锚一样。如果有人问你甘地死时年龄是否大于114岁,你在估测他的死亡年龄时会比锚定问题是35岁(死亡)时更高。你在考量买房要花多少钱时,也会受到要价的影响。同样的房子,如果市场价格高,它就显得比市场价格低时更有价值,即使你决心抵制价格的影响也没有用。此类事例不一而足,锚定效应的事例不胜枚举。一旦你要考虑某个数字是否会成为一个估测问题的可能答案,这个数字就会产生锚定效应。

    我们不是最先观测锚定效应的人,但我们的实验是第一个揭示其荒谬性的实证研究:人们的判断明显受到没有任何信息价值的数字的影响。若想解释轮盘的锚定效应是合理的,这似乎不太可能。阿莫斯和我在《科学》杂志上发表的论文中提到了我们的实验,我们在这份杂志上发表的所有研究成果中,这是最著名的一个。

    但唯一的问题是:阿莫斯和我对锚定效应体系中的心理学现象的认识并不完全一致。他支持一种解释,我则偏向另外一种,而且我们从来没有找到解决这个分歧的方法。几十年后,无数研究者通过努力终于解决了这个问题。现在问题明确了:阿莫斯和我都是正确的,是两个不同的机制共同作用产生了锚定效应,即一个系统对应一个机制。锚定有一种形式,即它是在进行刻意调整时发生的,这也是系统2的一种运行模式。还有一种是由启发效应产生的锚定,是系统1的一种自主显示模式。

    对锚定值的调整常常是不足的

    阿莫斯喜欢将调整—锚定的启发式想法作为估测不确定值的策略:从锚定的数字开始,然后估测它是过高还是过低,接着让大脑从锚定数值上“转移”并逐渐调整你的估值。调整通常会过早结束,因为当人们不再确定他们是否应该继续移动时就会停止移动。在我和阿莫斯意见出现分歧的几十年后,也就是阿莫斯去世的几年后,两位心理学家分别提出了有关这个(调整—锚定)过程令人信服的证据,这两位心理学家在其职业生涯早期曾和阿莫斯一起共事过,他们就是埃尔德·沙菲尔(Eldar Shafir)和汤姆。季洛维奇,参加研究的还包括他们的学生—阿莫斯的“徒孙”们!

    为了验证这个想法,请拿出一张纸,从纸的底端由下而上画一条2.5英寸长的线,徒手画,不用尺子。现在请拿出另一张纸,从纸的顶端开始由上而下画一条线,在距顶端2.5英寸处停笔。比较这两条线。你很可能会估测第一条2.5英寸长的线比第二条短,因为你并不确切地知道这样的一条线究竟该是什么样的。这种估测有很多不确定的因素。你若从纸的下端开始画起,就会停在下面的不确定区域;如果你从纸的上端开始画起,就会停在上面的不确定区域。罗宾·勒伯夫(Robyn LeBoeuf)和沙菲尔在日常经历中发现很多关于这种机制的例子。为什么你在开车下了高速公路驶入城市街道时还会开那么快—如果是边聊天边开车,速度尤其容易快。调整不足就是对这一现象的最好解释。孩子在房间里喜欢把音乐开得很大声,父母却很恼火,两代人关系紧张,其原因也是调整不足。勒伯夫和沙菲尔注意到“家长要求孩子应将音乐调到‘适当’的音量,但听着特别大声音乐的孩子即使想这样做也难,还会认为家长忽视了他们真心作出的让步,这是因为他们无法从充分的高锚定值中调整过来”。这里提到的司机和孩子都有意地(将数值)向下调整,但两者都没有(将这个值)调整到位。

    请看下面的问题:

    乔治·华盛顿是何时当选总统的?

    珠穆朗玛峰峰顶上的沸点是多少?

    在思考这些问题时,最先发生的事就是你的脑海中出现了锚定数字,你知道这样是不对的,而且还知道正确答案的大致方向。你马上就知道乔治·华盛顿是1776年后成为总统的,你也知道珠穆朗玛峰峰顶上的沸水温度比100摄氏度低。你不得不去寻找从这个锚定值上移开的论据,将其调整到合适的数值。就像前文提到的那个线段的例子那样,在那个不确定区域的边缘,你不确定是否应该继续进行时就会停止。

    尼克·艾普雷(Nick Epley)和汤姆·季洛维奇发现,调整就是刻意去寻找离开锚定数字的理由:按照要求一听到锚定值就摇头的人仿佛对此有些排斥,他们会离锚定值更远。而点头则会增强他们对锚定值的概念。艾普雷和季洛维奇也证实说调整是一项需要付出努力的活动。人们在自己的大脑资源耗尽时调整较少(离锚定较近),因为他们的记忆中存储着一些数字或是因为他们有些醉了。调整不足是软弱或懒惰的系统2的一种失误。

    我们现在知道阿莫斯至少对一些锚定效应的例子的理解是正确的,这些例子中包含了系统2为离开锚定值进行的具体调整。

    暗示就是一种锚定效应

    当阿莫斯和我就锚定效应进行争论时,我同意(他说的)有时会出现调整现象,但其实心里很不服气。调整是一个审慎且有意识的行为,但锚定效应的大多数例子中并没有相应的主观经验。请看下面两个问题:

    甘地去世时比144岁大还是小?

    甘地去世时多少岁?

    你是否会把144岁向下调整来得出自己的评估?也许不会,但这个大得离奇的数字仍然会影响你的估测。我的直觉告诉我,锚定就是一种暗示。如果有人只是提起某件事,而他的话却促使我们去看、去听或是去感受这件事,此时的情形就可以用锚定来形容。例如,“你的左腿现在是否微微麻木了”这个问题常会使相当多的人回答说他们的左腿确实感到有些异样。

    阿莫斯对直觉的研究比我更谨慎,他一针见血地指出,关注暗示对我们理解锚定效应没有什么帮助,因为我们不知道如何解释暗示作用。我不得不同意他是对的,但我不同意调整不足是锚定效应的唯一原因。我们为理解锚定效应做过很多实验,但是都以失败告终,最终我们放弃了进一步研究这一课题的想法。

    现在,那个打败我们的难题得到解决了,因为暗示的概念已经明确了:暗示即一种启动效应,它会有选择地找出相应的证据。你完全不会相信甘地活到了144岁,但你的联想机制却会对一位逝去的老人产生印象。系统1理解句子的方式就是尽量相信其内容的真实性,它对相应想法的选择性激活会产生一系列的系统性误差,这些误差会使我们更容易受骗,更加坚定地相信自己的想法。我们现在明白为什么阿莫斯和我从前没有意识到锚定效应有两种类型:研究手法和理论观念,我们研究这个问题时很需要这两种类型但它们却没有出现。后来,其他人极大地发展了这两种类型。

    在很多情况下,我们都需要一个类似暗示的过程发生作用:系统1试图建立一个将锚定数字视为真实数值的世界。这是我在本书第一部分描述的联想一致性的一种表现。

    德国心理学家托马斯·穆斯魏勒(Tomas Mussweiler)和弗里茨·斯特拉克(Fritz Strack)对锚定效应中联想一致性的作用所作的实证研究最令人信服。在一项实验中,他们问了一个关于温度的锚定问题,“德国每年的平均温度是高于20摄氏度还是低于20摄氏度”,或者“德国每年的平均温度是高于还是低于5摄氏度”?

    研究人员让所有受试者快速扫过一些单词,然后让他们去识别这些词。研究人员发现,受试者看到20摄氏度后更容易识别和夏天相关的词(比如“太阳”和“沙滩”),看到5摄氏度后则能更加轻松地识别出关于冬天的词汇(比如“冰冻”和“滑雪”)。对相应记忆的选择性激发解释了锚定效应:大小不同的数字能激发起记忆中不同的观念体系,而这些带有偏见的观念则成为(受试者)估测年度平均温度的依据,据此作出的估测值也因此带有一定偏见。在另一个基于同一目的的简单实验中,研究人员让受试者估测德国汽车的平均价格。高锚定值的受试者会选择性地让奢华品牌(比如奔驰、奥迪)的汽车最先出现在脑海中,而低锚定值则会使人最先想到一些销售量大的汽车品牌(比如大众)。此前我们就知道任何启发都会唤起与之相应的信息。暗示和锚定效应都通过相同的系统1的自主运行得到了解释。尽管当时并不知道如何证实这一观点,但我对锚定效应和暗示之间存在联系这一直觉最终被证实是正确的。

    作为这幢房子的主人,你能接受的最低售价是多少?

    很多心理学现象可以通过实验得到证实,但事实上这些现象中几乎没有哪种是可以测量的。锚定的影响是一个特例,锚定效应可以测量,测量结果证实这一效应影响超大。有人曾经问过那些参观“旧金山探索馆”的游客下面两个问题:

    最高的那棵红杉树是高于1200英尺还是低于1200英尺?

    你认为那棵最高的红杉树有多高?

    这个实验中的“高锚定值”是1200英尺。而另外一组受试者看到的第一个问题则用了一个180英尺的“低锚定值”。两个锚定值相差1020英尺。

    不出所料,(关于那棵最高的红杉树有多高)两个组给出了完全不同的平均评估:844英尺和282英尺。两者的差距有562英尺。锚定指数就是两个不同答案的比率55%(562/1020)。对于那些在评估过程中过度运用锚定的人而言,锚定效应的测量结果将是100%,对于那些能够忽略锚定的人而言,锚定效应的测量结果则是零。这项实验中观察到的55%的锚定指数非常典型,在其他许多问题中也观察到了相似的锚定指数。

    锚定效应在实验室中司空见惯,在现实世界中其影响同样毫不逊色。几年前的一个实验中,实验人员让一些房地产经纪人对一幢待售房子的价值进行评估。这些经纪人亲自去看了这所房子,还仔细研究了一本小册子,里面包括这幢房子的全面信息和售价。其中一半经纪人评估的售价比标价高很多,另一半评估的售价则比标价低很多。每位经纪人都给出了自己认为合理的售价,同时(假定自己是这幢房子的房主)她们还给出了自己能够接受的最低售价。实验人员随后问这些经纪人哪些因素影响了她们的决策。出乎意料的是,售价并非影响因素之一。这些经纪人十分得意,因为她们没有被这个因素所左右。她们坚称标价没有影响到她们对这一问题的回应,但实际上她们错了:锚定指数是41%。事实上,专业人士和对房地产一无所知的商学院学生一样,都受到了锚定效应的影响。后者的锚定指数是48%。两者的唯一区别是,学生承认他们受到了锚定效应的影响,而专业人士则否认这一点。

    在人们对钱的问题所作的决定中同样体现出了强大的锚定效应,人们选择对一项事业投入多少时就会受锚定效应的影响。为了证实这一影响,我们告诉探索馆研究中的受试者,太平洋中的油管引起了环境污染,问他们是否愿意每年都捐钱“使5万只近太平洋海岸的海鸟不致受小面积海上溢油的影响,直到找到防止泄漏的方法或要求油罐所有者支付运行费用为止”。这个问题需要强度相匹配:实际上,我们是在要求调查对象预估应该捐献多少钱才能与自己对海鸟困境的感受程度相匹配。对其中一些游客,实验人员并没有直截了当地问她们愿意捐多少钱,而是先问了一个锚定问题,比如“你是否愿意花5美元来……”

    若没有提到锚定问题,这些对环境都很敏感的探索馆参观者会说他们愿意拿出的钱平均为64美元。当锚定金额只有5美元时,平均捐款则是20美元。当锚定金额达到400美元时,人们的捐款平均数就达到了143美元。

    高锚定金额和低锚定金额之间相差123美元。锚定指数高于30%,表明增长100美元的初始要价就能带来平均值为30美元的回报。

    许多估测和捐款意愿的研究都曾体现出相似甚至更大的锚定效应。例如,有人曾问过那些在法国马赛重度污染地区居住的居民,如果能住在一个污染程度较低的地方,他们能接受生活开销提高多少。锚定指数在该研究中超过了50%。在网上购物过程中也很容易观察到锚定效应,网上相同的产品经常标出不同的“立购”价。“估测”在艺术品拍卖行业中是影响第一次竞拍的锚定价格。

    锚定效应在某些情形下看起来也是合理的。毕竟,那些被问到难题的人肯定会去抓住这根救命稻草的,况且这个锚定值也是根貌似合理的稻草。如果你对加利福尼亚的树所知无几,却又被问到红杉树是否高于1200英尺,此时你可能就会认为这个数字与真实数字相差不远。因为是那些知道这种树真实高度的人想出的这个问题,所以这个锚定值也许是个有价值的提示。但是,锚定效应研究有一个重要发现,即锚定值显然是任意的,它也许和可能有信息价值的锚定值一样有效。当我们用轮盘来估测联合国中非洲国家所占的比例时,锚定指数是44%,还算是处在看似正确且能作为提示的锚定效应的影响范围内。有些实验已观察到大小相似的锚定效应,在这些实验中,受试者社保号的最后几个数字被用做锚定值(比如为估测他们城市中医生的数量)。结果很明确:锚定值没有影响,因为人们认为这些数字没有什么信息价值。

    随机锚定的影响以一些令人不安的方式出现在生活中。一些任职经历平均为15年的德国法官先是读了一份案例,讲到一个妇女在商店顺手牵羊被捉住的案例,然后他们开始掷一副骰子,这副骰子被人提前做过手脚。因此,每次掷骰子的结果不是3就是9。骰子一停,实验人员就问这些法官是否会将那位妇女送进监狱,且其服刑的时间应该比骰子上的数大还是小。最后,实验人员问这些法官,他们给这个行窃的妇女判定的服刑期具体是多少。平均来看,那些掷了9的法官说他们会关她8个月,而掷了3的法官说他们会关她5个月,锚定指数是50%。

    锚定效应何时适用,何时不适用?

    到现在为止,你已经相信锚定效应无处不在,有时是由于启发效应,有时则是因为调整不足。产生锚定效应的心理机制使我们比自己预想的更容易受影响。当然,有些人愿意且能够利用我们的轻信。

    例如,锚定效应解释了为什么限量购买是一种有效的营销策略。几年前,在艾奥瓦州的苏城的超市里,购物者遇到了坎贝尔汤罐头在作促销的情形,降价10%。有那么几天货架上写着“每人限购12罐”,而在其他几天里则写着“不限量”。购物者在限购时平均会购买7罐,是不限购时购买量的2倍。锚定效应不是唯一的解释,配给也显示货物很快就下架了,购物者应该对货物储存量感到有些紧张。但我们也知道12罐的可购买量会成为一种锚定,即使这一数字是通过轮盘产生的也不例外。

    同样的策略在商讨购房价上也适用。在许多其他的活动中也是这样,在协商中率先出击的一方往往会占有优势,例如,当价钱是买方和卖方唯一要协商的事时就会出现锚定效应。第一次在集市上讨价还价也是这样,先发锚定有着重大的影响。我在教学生谈判时,给他们的建议是如果你认为是对方作出了无礼的提议,你就不应该提出同样无礼的提议,因为两者之间有距离的话会使此后的商谈难以进行。你应该大吵大闹,夺门而出,或者威胁对方说自己也会这样做,要让对方明白以这个数字为基准的话,谈判将难以继续。

    心理学家亚当·加林斯基(Adam Galinsky)和托马斯。穆斯魏勒提出了更好的方法来抵制商谈中锚定效应的影响。他们告诉谈判者,在商谈中要集中注意力搜寻大脑记忆来抵制锚定效应。激活系统2的做法会很奏效。例如,在第二个提议人将其注意力集中在对方能接受的最低值或对方无法接受的费用上时,锚定效应就会削弱或消除。大体来讲,有意地“为对方着想”的策略也许是抵制锚定效应的好方法,因为它否定了能产生这些效应的带有偏见的想法。

    最后,试试看你能不能弄清楚锚定效应对公共政策问题的影响,即人身伤害案件的损害程度的裁定。这类案件的判决有时是很严厉的。类似医院和化工企业等单位常常是这类诉讼案件的被告,这些单位曾经游说各方为此类判决设置了一个上限。

    读本章之前你可能想过,给这些判决设置上限绝对是有利于潜在被告的,但现在你就不会这么确信了,如果上限是100万美元,其结果会怎样?这条规则会消除所有的严厉判决,但锚定也会阻止法官将许多较轻罪行的量刑判得更轻。这对违法者和大公司都有好处,比给小公司带来的好处多。

    随机锚定效应还会使我们更加了解系统1和系统2之间的关系。人们一直利用判断与选择的案例来研究锚定效应,而判断与选择最终总是由系统2完成的。但是,系统2对从记忆中提取的数据进行加工,并由系统1进行自主的、无意识的运行,因此很容易受锚定效应的影响,而这种影响会使某些信息更容易让人回想起来。此外,系统2对这种影响一无所知,也无法控制。看到随机或荒谬的锚定值(比如甘地死时144岁)的那些受试者会自信地说,这个明显无用的信息并没有对他们的估测行为产生影响。事实上,他们错了。

    在讨论小数定律时我们发现,如果一则消息没有马上被视为谎言,那么不管其可靠性如何,它都会对联想系统产生同样的影响。这个消息的重点是故事,随便根据什么信息编造的都无所谓,即使这则消息的信息量很少,质量很差劲也无所谓,因为眼见即为事实。当你读到一个拯救受伤登山客的人的英勇故事时,这个故事对你的联想记忆产生的影响和一篇新闻报道或电影简介大体差不多。锚定效应是由这个联想激发引起的。这个故事是否真实、是否可信一点都不重要。随机锚定的强大影响是锚定效应的极端例子,因为随机锚定显然没有提供什么信息。

    我在前文中讨论了启发效应纷繁复杂的表现类型,在启发效应下,你的思想和行为也许会被完全不曾留意的刺激所影响,甚至会被你完全没有意识到的刺激所影响。启发实验的主要寓意是我们的思想和行为会受当时的环境影响,且这种影响比我们了解或想象的要大。很多人发现启发效应的结果令人难以置信,因为它们和主观经验相去甚远。另外很多人则发现其结果令人不安,因为它们威胁着我们对中介和自主性的主观感受。如果不相关的大脑屏保能在你意识不到的情况下影响你对陌生人的帮助,那你到底有多自由呢?锚定效应也以相似的方式威胁着你。你总能意识到锚定,甚至会对它格外关注,但你不知道它是如何引导和限制你的思考的,因为你不能想象如果锚定改变(或不存在)你会如何思考。但是,你应该假设任何一个公开谈判时的数字都对你有锚定效应,如果概率大,你应该抵制(你的系统2)该效应。

    示例—锚定“我们想要收购的公司给我们看了他们的商业计划,其中包括他们希望得到的收益。我们不应该让那个数字影响到我们的思路。将其放置一边。”“计划是为最佳情况设计的方案。当我们预计实际结果时,要避开计划的锚定效应。想想计划出现失误的各种方式也不失为执行计划的一个方式。”“我们商谈的目标是让他们锚定在这个数字上。”“我们要清楚一点,如果那就是他们的提案,那么商谈就此结束吧,我们不想那样开展工作。”“被告律师提出一个微不足道的证明,证明中提到了一个荒谬的小损失,这些律师就是想让法官们拿这个损失做锚定。”第12章 科学地利用可得性启发法

    1971~1972年,阿莫斯和我在俄勒冈州的尤金度过了我们最为高产的研究时期。我们在俄勒冈研究院做客,在我们研究的领域—判断、决策制定和直觉性预测—中该研究院后来诞生了很多未来之星。主要负责接待我们的是保罗。斯洛维克,他曾是阿莫斯在安阿伯市时的同学,也是他一辈子的朋友。保罗当时即将成为风险心理学领域中的领军人物,他独领风骚几十年,也获得了很多荣誉。保罗和他的妻子洛兹带我们感受尤金的生活,很快我们也开始效仿尤金人,常去跑步、烧烤,带孩子去看篮球赛等。我们非常努力地工作,做了很多关于启发法的实验,也写了很多文章。晚上的时候,我就写那本《注意与努力》,那段时间我非常忙。

    我们的项目中有一项是对“可得性启发法”进行研究。我们问自己,人们在想要估计某类事件的出现频率时到底是怎么做的,这些事件包括“人在60岁之后的离婚概率”或“(是否是)危险的植物”等。我们认为这种自问就是启发法。这些问题的答案很简单:从记忆中搜寻这类问题的实例,如果搜寻过程既轻松又顺畅,这些事的发生概率就会被判断为很大。我们将可得性启发法定义为通过“实例呈现在脑中的轻松程度”来判断概率的过程。我们的系统阐述似乎已经给出了这一方法的明确定义,但可得性这一概念此后仍在不断得以精炼。我们在研究可得性的时候还没有阐发两个系统的方法,而且我们并没有费尽心思去确定启发法是可以解决问题的主观策略,还是一个自主运行的无意识行为。现在我们知道启发法其实涉及两个系统。

    我们之前思考的问题是,到底需要在大脑中搜寻多少实例才算是轻松回忆,以获得某一印象。我们现在知道了答案:一个也不用。例如,请考虑下面两组字母可以组成多少个单词。

    XUZONLCJM 

    TAPCERHOB

    你几乎不必去想什么实例,一打眼就知道其中一组字母比另一组组成单词的可能性更大,可能会多10个或者更多。同样,想要清楚地了解不同国家去年出现在新闻中的相关频率(比利时、中国、法国、刚果、尼加拉瓜、罗马尼亚等)你也无须回想具体的新闻报道。

    意识到自己的偏见有利于团队关系融洽

    与其他判断启发法一样,可得性启发法就是用一个问题替代另一个问题:你希望估测某一范畴的大小或某一事件的(发生)频率,但你却会提到自己想到相关实例的轻松程度。问题的替代必然会产生系统性错误。你会发现启发法是如何通过一个简单的过程导致偏见的,不直接说出(事件发生的)频率,而是列举那些使你轻松想起相关实例的因素,其中的每个因素都会成为偏见的潜在来源。试举几例:

    ·你可以很轻松地回想起引起自己注意的突出事件。好莱坞明星的离婚事件和政客的性丑闻事件格外引人注目,想到这些实例并不难。因此,你很容易夸大好莱坞离婚事件和政客性丑闻事件的频率。

    ·一个大事件会暂时提高此类事件的可得性。飞机失事事件会有媒体来报道,这也会暂时改变你对飞行安全的看法,接着你又看到路旁有辆汽车着火了,于是这些事故会暂时盘踞在你的脑海中,你会觉得这个世界此时充满更多难以预料的事。

    ·亲身经历、生动的图片和鲜活的例子比发生在别人身上的事、单纯的文字或是统计数据更容易让人回想起来。一个与你相关的判决错误会逐渐削弱你对司法体系的信任度,其影响程度比你在报纸上读到类似事件的影响更深。

    你可以尽可能地抵制如此之多的潜在的可得性偏见,但那样做会令你身心俱疲。你必须通过自问一些问题努力重新审视自己的印象和直觉,比如“我们是否会因为小区内最近发生了几起偷盗事件就认为青少年盗窃是个严重问题”或者“我认识的人去年没有得感冒的,我是不是就没必要打免疫针了呢”。时刻对偏见保持警惕是件累人的事—但由此便可避免一个代价高昂的错误,因此付出努力也是值得的。

    有个很著名的可得性实验表明,意识到自己的偏见可以使夫妻和睦相处,而且很可能在其他的合作计划中与他人的关系也很融洽。在一项广为人知的研究中,研究人员问夫妻双方的问题是:你为保持此地整洁作了多大贡献?用百分比来表示。此外,夫妻俩还回答了如“倒垃圾”、“发起社交互动”等类似问题。那么这两位自我估测的贡献率合计能达到100%吗,是更多或者更少?不出所料,他们自我估测的贡献率合计超过了100%。一个简单的可得性偏见就可以对此作出解释:夫妻二人记自己的努力和贡献比记对方的清楚得多,而且可得性的不同导致了对频率判断的不同。偏见不一定是自私的:这对夫妻还过多地将两人的争执归因于自己,尽管这一比例比两人在那些积极正面的事件中的自评比例小得多,但也是难能可贵了。同样的偏见对常见的观察同样适用,很多合作团队成员感觉他们做的事超出了自己的分内工作,还感到其他人并不感激自己作出的贡献。

    我通常对人们控制偏见的潜能不是很乐观,但这次例外。成功去除偏见的案例还是存在的,即我们可以很轻松地识别出功劳分配问题是何时出现的,尤其当几个人同时感到他们的努力没有得到足够的认同时更是如此。自己周围的那些人通常也会付出超出100%的努力工作,只要你看到这一点有时就足以缓和这种(心理失衡)情形。任何情况下,每个人都该牢记这一点。你做的事情偶尔会超出自己的分内事,但你应该知道,当你有可能有这种感觉的时候,你的团队里的每个成员也都可能有同感。

    可得性偏见会影响我们对自己或他人的看法

    20世纪90年代早期,人们对可得性启发法的理解有了重大进展。那时,由诺伯特·施瓦茨(Norbert Schwarz)领导的一组德国心理学家提出了一个有趣的问题:人们对某件事发生频率的印象是如何受到列举实例的具体数目这一要求的影响的?

    设想你自己就是那个实验的受试者:

    首先,列出6个你果断行事的例子。

    接下来评判一下你有多果断。

    假如有人要求你列12件自己表现得果断的事(大多数人都会觉得很难列出这么多件事)。你对自己果断程度的判定会有所不同吗?

    施瓦茨和他的同事观察到列举事件的任务可能会通过两种不同方式加强对特点的判断:

    ·能回想起的事例数量。

    ·事件在脑中呈现的轻松程度。

    列举12个例子的要求使得两个决定因素相互排斥。一方面,你刚想起了几件自己做得很果断的事;另一方面,你想起前三四件果断的事可能很轻松,可说出12件就要挖空心思了,回忆起来也没有那么顺畅。哪个更重要呢,提取的数量还是提取的轻松感和顺畅性?

    两个因素间的较量谁是赢家一目了然:那些列举了12件事的人认为和只列举了6件事的人相比,自己不够果断。而且,列举出自己表现不够果断的12件事的那些受试者最终却认为自己非常果断!如果无法轻松地想起懦弱的事例,你可能就会说自己一点也不懦弱。自我评估是由事件呈现在脑海中的轻松度来衡量的。轻松地想起某件事的体验比想起事情的数量更重要。

    同一个小组的另外一些心理学家对顺畅性的作用作了一个更为直接的实证研究,实验中所有的受试者都按要求列出了6件果断(或不果断)行事的例子,同时还保持着特定的面部表情。“微笑者”要收缩颧肌,露出浅浅的微笑:“皱眉者”要皱着眉头。如你所知,皱眉通常伴有认知紧张,且其影响是对称的:执行任务时被要求皱眉的人付出的努力更多,体验到的认知紧张也更强烈。研究者预计皱眉者在提取果断行为时会有难度,因此会估计自己缺少果断性。结果也的确如此。

    心理学家喜欢产生悖论的实验,他们怀着极大的兴趣运用了施瓦茨的发现。例如,人们:

    ·在回忆起自己多次骑自行车的经历后,依然相信他们自己不经常骑自行车。

    ·在被要求用更多的论据支撑自己的选择时自信心下降。

    ·在列出多个避免某种问题的方法后,却对避免此问题显得更加不自信。

    ·在列出某辆车的优点后,对该车变得没那么感兴趣了。

    加州大学洛杉矶分校的一位教授发现了一个利用可得性偏见的巧妙方法。他让不同组的学生列出改进课程的方法,要求不同组列出不同数量的方法。正如他所预料,列出较多改进方法的学生对这一课程的评价也更高。

    也许这个有悖论的实验中最有趣的发现就是悖论不一定会被发现:人们有时依照提取到的内容而非提取的轻松程度来作出判定。你真正了解行为模式的证据就是你知道如何让其发生逆转。施瓦茨和他的同事们接受了这一挑战,去探索在何种情况下会发生这种逆转。

    受试者想到那些行事果断的例子的轻松程度在任务实施过程中是不断变化的。前几件事情提取时很容易,但很快就变得越来越难。当然,受试者的思考顺畅性也会慢慢下降,但在列举6~12件事中顺畅性的下降速度显然要超出受试者的预料。结果表明受试者作出了推理:如果我在回想能体现自己果断行事的例子时遇到了超乎想象的困难,那说明我根本就不是个果断行事的人。请注意,这个推理建立在受试者未曾料到的情况之上—顺畅性比预期的更糟糕。此例中受试者运用的可得性启发法被叫做“无法解释的不可得性”启发法才更合适吧。

    施瓦茨和他的同事们论证道,他们为受试者解释其在回想相关经历的流畅性(发生变化的问题),由此可以干扰启发法。他们告诉受试者在回想事件时他们会听到背景音乐,而且音乐会对他们完成记忆任务产生影响。实验人员告诉一些受试者音乐能帮助他们回想起相关例子,却告知其他受试者听音乐其回忆会不那么顺畅。不出所料,那些对顺畅性有所认识的受试者没有将音乐看成是一种启发法;而那些得知音乐会使回忆更困难的受试者无论完成提取6件还是12件的任务,对自己果断程度的估测没什么两样。其他的主要实验也得到了同样的结论:若通过展示曲线或直线的文本框,或屏幕的背景颜色,又或其他与实验预期不相关的因素对体验到的顺畅性作出虚假解释的话,判断便不再受提取轻松程度的影响。

    诚如我所述,用可得性来判断的过程包括了一个复杂的推理链。受试者会体验到,他们在提取事件时,顺畅性会逐渐降低。他们显然对顺畅性的下降率事先有过预计,但那些预计是不准确的:想起新事例的困难增速远远超出了他们的预计。正是这种超出预期的低顺畅性使那些被要求列举12个事例的人将自己描述成优柔寡断之人。了解个中缘由,低顺畅性也就不会再影响判断了。这个过程看似由一套复杂的推理组成。自主的系统1能胜任这项任务吗?

    回答时其实根本就不需要复杂的推理。在系统1的基本特征中,其中一点就是这一系统具有设定预期的能力,当现实与预期相悖时它就会感到惊讶。该系统还会提取造成惊讶情绪的可能原因—通常是在近期所经历的各种惊讶体验中找到一个可能的原因。此外,系统2在运行中会重塑系统1的预期,因此一件本该令人惊讶的事就变得正常了。假设有人事先告诉过你那个住在隔壁的3岁大的小男孩经常戴着一顶礼帽坐在小推车里,那么当你真的看到他戴着礼帽时就不会像事先并不知道(这件事)那么惊讶了。在施瓦茨的实验中,受试者事先知道背景音乐可能是影响他们回想具体事例的一个原因,因此他们对提取12件事的难度也就不再那么吃惊了,这种难度也就不大可能影响他们对自己果断行事程度的判断。

    施瓦茨及其同事发现,判断涉及自身情况的人往往更有可能关注他们从记忆中提取的事件数量,对顺畅度则不大关注。他们请两组同学参加对心脏健康风险的研究,其中一半学生有心脏病家族史,他们应该比其他没有这种家族病史的人更注重这个研究。所有的学生都要回想自己日常生活中可能会影响心脏健康的3种或8种行为(按照要求,有些学生需要回想的是危险行为,其他学生需要回想的是保护性行为)。没有心脏病家族史的学生对这项任务较随意,遵循的是可得性启发法。觉得想起8件危险行为很难的学生觉得他们相对安全,而那些努力回想安全做法的学生却感觉自己处于危险中。有心脏病家族史的学生则表现出相反的模式—他们在想起很多安全做法时觉得很安全,在想起很多危险行为时感到很危险。他们还更有可能觉得自己将来的行为会受到自己对危险做法评估的影响。

    由此可见,事件在脑海中呈现的轻松程度体现出系统1的启发作用,然而当系统2越来越多地参与其中时,受试者关注的就不再是提取记忆的轻松度,而是回忆起来的若干事例的内容了。各种各样的证据都指向统一结论,即那些跟着系统1走的人更容易受可得性偏见的影响,比那些警惕性更高的人受影响的程度更大。在下面这些情况中,人们都在“跟着感觉走”,提取轻松度对他们的影响要大于其回想事例内容带给他们的影响:

    ·当他们同时忙于另一件需要付出努力的任务时。

    ·因他们刚刚想起生命中的一个快乐片段而心情大好时。

    ·如果他们在抑郁量表中得分很低的话。

    ·尽管对这项任务所给话题的了解达不到专家级水准,但他们也算是对此领域了解颇多的新手了。

    ·他们跟着感觉走却拿了高分时。

    ·如果他们(或别人令他们感到)很强大时。

    我认为最后一个发现尤其有趣。几位作者引用一句名言来介绍自己的文章:“我没有满世界做民意调查来告诉自己怎样做才对,知道自己的感受就够了。”他们进一步表明,对直觉的依赖只是个人品行特征的一部分。他们只想提醒人们,能力可以提升我们对自己直觉的信任。

    示例—可得性“因为上个月发生了两架飞机相撞事件,她现在更愿意坐火车。这真是愚蠢,风险其实并没有真正降低,这就是可得性偏见。”“他低估了室内污染的风险,因为媒体对此报道极少。这是可得性的影响。他应该看些统计数据。““她最近看的间谍电影太多了,因此她看什么都觉得有阴谋。”“这位执行总裁连续多次成功,因此失败不会轻易在她的脑海中出现。可得性偏见使得她过于自信。”第13章 焦虑情绪与风险政策的设计

    有风险意识的学生可以迅速发现可得性效应与自己的担忧不无关联。在我们的作品发表前,经济学家霍华德·昆路德(Howard Kunreuther)就已经注意到,可得性效应能够对买保险的行为模式和灾后的保护性行为模式作出解释。当时,昆路德对风险和保险的研究正处于起步阶段。受害者和近似受害者在灾后往往心存焦虑。

    每次影响巨大的地震发生之后,加利福尼亚的居民都会去买保险,采取充分的自我保护和减少损失的措施。他们固定好暖壶以防止其在地震中破碎,将地下室的门封死以抵抗洪水,还要确保紧急备用电源能正常工作。但是,随着时间的推移,对灾难的记忆就会变得模糊,担忧和防备的努力程度也会减弱。记忆的动态变化为灾难、担忧和越来越松懈的心理这一循环作出了解释。昆路德还观察到,不论是个人的还是政府的保护性行为,都能应对最糟糕的灾难。早在法老时代的埃及,人们就为周期泛滥的河水的最高水位作出标记,找出相应的治水对策,当时的人们显然认为河水不会比标记的最高水位更高,因此他们很难想到还会有更大的洪灾。

    被闪电击中与食物中毒,哪种意外致死率更高?

    对可得性偏见最具影响力的几项研究,是由我们那些身在尤金的朋友完成的,保罗·斯洛维克和他的长期合作者萨拉·利希滕斯坦(Sarah Lichtenstein)以及我们以前的学生巴鲁克·费斯科霍夫(Baruch Fischhoff)等人共同完成了这些研究。他们关于公众对风险看法的研究具有奠基意义,包括一项如今已成为可得性偏见的标准案例的调查。他们让受试者思考两组死亡原因:糖尿病和哮喘,中风和意外事故。

    每组原因中,受试者要指出更常出现的原因并估测两种可能性的比率,然后将作出的判断与当时的健康统计数据进行比较。以下是他们发现的一个样例:

    ·中风致死的数量几乎是所有意外事故致死总数的2倍,但80%的受试者却判断意外事故致死的可能性更大。

    ·人们认为龙卷风比哮喘更容易致死,尽管后者的致死率是前者的20倍。

    ·人们认为被闪电击中致死的概率比食物中毒要小,不过,前者致死率却是后者的52倍。

    ·得病致死是意外死亡的18倍,但两者却被认为概率相等。

    ·意外死亡被认为是糖尿病致死率的300倍,但真正的比率却是1∶4.

    这其中的道理很明显:对死亡原因的估测因媒体报道而有所改变。报道往往偏向新鲜和尖锐的事。媒体不仅影响了公众的兴趣,也受到公众兴趣的影响。编辑不可能忽略公众的需求,就对某些话题和观点进行大量报道。不同寻常的事件(比如腐肉中毒)会格外引人注意,人们常会低估此类事件的发生概率。我们脑海中的世界并不是真实世界的准确反映;我们对事件发生频率的估测也会受到自己接触这些信息和频率与个人情感强烈程度等因素的影响。

    对致死原因的估测几乎是联想记忆中观点激发的直接反应,也是替代效应的极佳例子。但斯洛维克和他的同事们有了更深层次的发现。他们发现,人们想到不同风险的轻松程度与其对这些风险的情感反应是紧密相连的。我们总是特别容易想起那些骇人的想法和画面,而那些流畅生动的骇人印象又会加深我们的恐惧。

    如前所述,斯洛维克最后对情绪启发式的概念作了详细探究,认为人们在作判断和决策时会受情绪的影响:我喜欢它吗?我恨它吗?我对它的感觉有多强烈?斯洛维克说,在生活的很多领域中,人们形成的观点和作出的选择直接表达出其情感和取舍的基本倾向,而这些行为完全是在毫无意识的情况下作出的。情绪启发是替代的一种,即将简单问题(我对它感觉如何)的答案当做较难问题(我对它评价如何)的答案。斯洛维克及其同事将他们的观点与神经学家安东尼奥·达马西奥(Antonio Damasio)的研究成果联系起来。达马西奥曾指出人们对结果的情感反应、身体状态,以及与之对应的取舍抉择在决策制定中都发挥了重要作用。达马西奥和他的几位同事发现,在做决策前没有表现出适当情感的人可能是因为他的大脑有损伤,也可能是因为他对做出较好决策存有障碍。无法接受糟糕结果的“健康畏惧”导向是个灾难性缺陷。

    关于情绪启发式的运作问题有一项十分令人信服的实证研究,斯洛维克的研究小组对人们对各种技术的看法进行了调查,其领域涉及饮用水氟化、化工厂、食品防腐剂和汽车等,要求受试者列举每项技术的优缺点。他们发现受试者对该技术的优势和风险的估测值存在非常大的负相关性。当人们更青睐于某项技术时,他们就会认为此项技术更有优势、风险更小;如果他们不喜欢某项技术,则只会想到其缺点和寥寥几个优点。因为几项技术刚好是从好到次排列起来的,因此无须作艰难的权衡。当研究人员要求受试者在规定时间内对风险和优点作出估测时,这两项估值会更接近。值得注意的是,英国毒物学会几位会员的反应是相似的:他们在自认为危险的物质和技术中发现的优点很少,反之亦如此。一致影响是我所提到的联想一致性的一项基本要素。

    接下来是该实验最精彩的部分。完成最初的调查后,受试者读了几篇支持不同技术的小短文。有些短文关注的是某项技术的众多优点,其他短文则强调其风险低。这些短文有效地改变了受试者对这些技术的感性认识。实验结果令人关注,那些读到对某项技术多有褒奖的短文的人,对此项技术存在的风险也有了不同认识。尽管没有佐证,但他们现在却认为自己更喜欢这项技术了,感觉其风险没那么大。同样,那些只知道某项技术风险较小的受试者也会对其优点越发青睐。其中的道理很明显:正如心理学家乔纳森·海特(Jonathan Haidt)在另一篇文章中所说的那样:“感性细节掌控理性大局。”情绪启发式通过创造一个比现实更明了的世界来简化我们的生活。好的技术在我们的虚拟世界中成本较小,不好的技术没有利益,所有的决策在这里都变得很简单。当然,在现实世界中我们常要在利益和成本中作出权衡。

    如何避免小概率的风险事件演变成公共危机?

    保罗·斯洛维克可能比其他人更加了解人类作出风险判断的特性。他的著作描述了不卑不亢的普通人形象:感性而非理性,易被琐碎细节左右,并且对较小的可能性和极微小的可能性之间差别的感知力不够敏锐。斯洛维克还对专家进行了研究,显然专家在处理数字和数量的问题时更权威。专家同普通人一样,也以衰减的形式表现出同样的偏见,但他们对风险的判断和偏见往往与普通人有所不同。

    非专业性判断中存在的偏见可以对专家和公众之间的不同之处作出一定的解释,但斯洛维克提请人们注意能反映不同价值间真实矛盾的情况。他指出专家经常通过判断死亡人数(或寿命)来测定风险,而公众的区分则更加细致,例如,“善终”和“非善终”,是意外死亡还是在类似滑雪这样的自愿活动中死亡等。这些合理的区别经常被只计数事件的统计学所忽略。斯洛维克通过这些观察报告得出结论:公众对风险的认识比专家更深刻。因此,他强烈反对专家或权威的观点,若专家与其他公民的观点和希冀相矛盾时,人们就不应该完全接受专家的观点。他说,当专家和公众对各自的优先权意见分歧时,“双方必须尊重对方的见解和智慧”。

    斯洛维克想摆脱专家对风险判断的绝对控制,因此他对专家的理论根据—风险是客观的—发起了挑战。

    “风险”并不是脱离我们的思想和文化而独立存在的,不会老老实实等着我们去测量。人类发明“风险”这个概念是为了帮助自己理解和应对生活中的危险和不确定情况。尽管这些危险是真实存在的,但却没有“真正风险”或“客观风险”这回事。

    为了阐述自己的观点,斯洛维克列举了9种界定死亡风险的方式,从“每100万人的死亡”到“每生产价值100万美元的产品造成的死亡”,这种死亡风险与向空气中释放有毒物质的做法相关联。他的观点是:风险评估依赖测试方法的选择—这种选择极有可能是在人们心中期望得到这样或那样结果的情况下作出的。他进一步总结道,“因此,风险界定是一种权利运作”。也许你从未想过竟然会有人将判断心理的实验研究与棘手的政策问题联系起来!但是,政策最终还是与人相关的,它关乎人们想要什么和什么对他们是最有利的问题。每个政策问题都包括对人性的假设,尤其是人们可能作出的抉择和他们为自己和社会作出抉择所带来的后果。

    我特别敬仰的另外一位学者兼好友卡斯·桑斯坦(Cass Sunstein)对专家和公众的看法与斯洛维克截然不同,他认为专家就是抵制“平民”越轨的壁垒。桑斯坦是美国最知名的法学家之一,与同领域的其他领军人物一样,他身上具有一种大无畏的精神。他知道自己能快速且完整地掌握任何知识体系,而且他已经掌握了很多知识体系,包括判断和决策心理学、管理问题、风险政策等。他认为美国现行的监管体系暴露出优先处理事件不明确的糟糕状况,这一体系更多的是对公众施压做出反应,而不是谨慎客观地分析具体情况。桑斯坦认为,为降低风险而采取的风险监管和政府干预手段,应该以成本和利益间的理性权衡为指导。对具体情况的谨慎而客观的分析,其自然单位是拯救生命的数量(或者是寿命,用寿命做自然单位可能会更注重对年轻人的拯救)和钱财的数量。监管不力会造成生命和金钱的浪费,两者都可以进行客观测量。斯洛维克认为风险及其测量都是主观的,桑斯坦对此并不信服。风险评估的许多方面都还有待商榷,但他对风险的客观性抱有信心,也许通过科学、专业知识和审慎的思考可以拥有这样的信心吧。

    桑斯坦越来越相信,对风险带有偏见的反应是导致公共政策中优先处理权不稳定和错位的重要原因。立法者和监管人员对民众的无理要求可能会反应过度,因为他们有着很强的政治敏感性,也因为他们和其他民众一样容易抱有同样的认知偏见。

    桑斯坦和一位合作者—法学家蒂默尔·库兰(Timur Kuran)为偏见植入政策这一机制起了个名字“效用层叠”(availability cascade) ① 。他们评论道,在社会大背景下:“所有的启发式都是平等的,但可得性相比而言更平等。”他们了解广义的启发式概念,在这个概念中,可得性为判断(而不是概率)提供了启发,尤其是我们通过想到某个概念的轻松程度(和情感的释放)来判断其重要性时,这种启发的作用就体现出来了。

    效用层叠是一连串自持事件,它可能开始于对相对次要的事件的媒体报道,然后会引起公众恐慌和大规模的政府行动。有些情况下,关于某一风险的媒体报道能抓住部分公众的注意力,这部分注意力进而会变成激愤和焦虑。这种情感反应本身就是一种宣扬,会推动媒体跟进报道,继而会令人产生更大的焦虑,波及面也更大。通过“可得性倡导者”,这个循环有时候会因为那些“可得性专业户”—专门负责连续不断地散布扰乱民心消息的个人或组织—的刻意操纵而加速运行。媒体竞相制造吸引人眼球的头条新闻,危险也随之升级。一些科学家和其他领域的人士试图抑制这种日益增长的恐惧和厌恶情绪,然而收效甚微,非但没有达成初衷,反而激起了不少敌意:所有宣称危险有些夸大其词的人都有“欲盖弥彰”的嫌疑。这是一个重要的政治问题,因为每个人对此都很上心,政治体系的回应也会受公众情感强烈程度的影响。此时效用层叠就要重新设定优先考虑的事件。其他风险和关乎公众利益的资源利用方式也都显得不那么重要了。

    库兰和桑斯坦曾经关注过两个案例,这两个案例直至今日仍备受争议:(纽约州)拉夫运河事件和所谓的艾拉恐慌(Alar scare)。拉夫运河中掩埋的有毒垃圾在1979年的雨季中显露出来,引起了水井污染超标,还散发出恶臭。当地居民当时既气愤又害怕,他们中的洛伊丝·吉布斯(Lois Gibbs)对这个问题的反应尤为活跃,一心想要维护自身利益。官方消息触发了效用层叠。在这一事件最受关注的时候,每天都会有很多拉夫运河的相关报道,当时一些科学家试图告诉公众他们夸大了危险的程度,但是这一论调不是被人们忽略就是被相反的声音淹没了。当时美国广播公司新闻档播出了一个名为“杀戮场”的节目,视频中的人们抬着婴儿用的空棺材行经立法机关门前。众多居民由政府出资迁往外地。对有毒垃圾的治理成了当地20世纪80年代的重大环境问题,当地政府出台了《环境保护赔偿责任法》,要求清理有毒地点,设立超级基金,这项立法被视为环境立法史上的重大成就。这些措施花费自然不菲,有人还说同样数额的钱如果用在其他重要的事情上可以拯救更多的生命。拉夫运河事件的真相究竟是怎样的,直至今日人们仍旧各执一词,没有人能拿出实实在在的证据证实这一事件对健康造成了实质性的损害。库兰和桑斯坦对拉夫运河事件的报道像是条假新闻,不过环保人士今天仍旧会一再提到“拉夫运河灾难”。

    关于库兰和桑斯坦用来说明效用层叠概念的第二个例子,人们的观点至今仍然存有分歧。这个例子就是1989年的艾拉事件,也就是环境问题批评者口中的“艾拉恐慌”。艾拉是种化学品,喷洒到苹果上用以调节苹果的生长周期并改善其外观。有报道称该化学品用量大,可导致大老鼠和家鼠得癌症,恐慌便由此引发。报道自然可以吓到众人,而且这些恐慌情绪也促使媒体争相报道,这就是效用层叠的基本机制。这一主题对新闻形成引导作用,进而引发了重大的媒体事件,例如梅丽尔·斯特里普(Meryl Streep)在国会前的证词。由于苹果和苹果产品引起人们的恐慌,苹果产业损失巨大。库兰和桑斯坦引用了一位打来电话的居民的话,此人问道:“是把苹果汁倒进下水道更安全,还是扔到有毒废物垃圾场更安全?”生产商回收了苹果杀虫剂产品,美国食品药品管理局也对此产品颁布禁令。此后的研究证实这种物质致癌的可能性很小,艾拉事件显然是对一个小问题做出的过激反应。这件事对公众健康的最终影响可能是致命的,因为人们吃到的好苹果越来越少了。

    艾拉事件说明,我们的大脑解决小风险的能力有一个基本限度:我们要么完全忽视风险,要么过于重视风险,没有中间地带。每位等待晚归女儿的家长都能体验到这种感觉。你也许知道真的是(几乎是)没有什么可担心的,但你的大脑会不自觉地闪现危险的景象。正如斯洛维克所言,焦虑对伤害的可能性还不够敏感。你想到了分子(即你在新闻中看到的悲惨新闻),却没有想到分母。桑斯坦发明了“概率忽视”这一短语来描述这一模式。概率忽视和效用层叠两种社会机制的组合必然会导致对小威胁的夸大,有时还会引发严重后果。

    当今世界,将效用层叠发挥到极致的人最有可能是那些恐怖分子。除了几次可怕的事件,比如“9·11”事件,恐怖袭击导致的死亡人数与其他死亡原因相比是非常小的。即使在恐怖活动猖獗的国家,比如以色列,每周的死亡人数也远不及交通事故死亡的人数多。概率忽视和效用层叠间的不同在于两种发现的可得性和呈现到脑中的轻松度和概率。媒体不断重复的可怕画面可使每个人都处于崩溃的边缘。我们都有这样的体验:想要劝自己完全冷静下来是非常难的。恐怖主义是直接和系统1对话的。

    在和朋友辩论的过程中,我是从何时开始处于下风的呢?效用层叠是真实的,它无疑扰乱了公共资源分配的重点。卡斯。桑斯坦会探索将决策制定者从公众压力中隔离开来的机制,让资源的分配由公正的专家来决定,这些人对所有风险都了如指掌,还知道可利用哪些资源来降低风险。公众比桑斯坦更相信专家,但保罗。斯洛维克却不怎么相信这些专家,他指出,将专家从公众情感中隔离出来会产生公众排斥的政策,这种情形不可能发生在民主制的国家中。两人的观点都非常有见地,他们的说法我都赞同。

    我同桑斯坦一样,对非理性的恐惧和应对风险的公共政策的效用层叠都感到不适。不过,我也认同斯洛维克的观点,即政策制定者不应该忽略普遍存在的恐惧情绪,即使这些情绪是毫无缘由的也不该忽略。不管理性与否,恐惧都是令人痛苦且身心俱疲的。政策制定者必须努力保护公众不受恐惧情绪的影响,而不是只保护其不受真实存在的危险的伤害。

    斯洛维克强调公众对那些不代表民意的不靠谱专家做出的决策心存抵制情绪,这一点的确不错。此外,效用层叠也会通过呼吁人们关注风险和增加降低风险预算总额的措施来创造长期效益。拉夫运河事件可能会使过剩资源分配到有毒垃圾的治理上,但这一事件在提升公众对环境问题的关注程度方面发挥了更大作用。民主难免无秩序,其中部分原因是引导民众信仰和态度的可得性及情绪启发式难免有失偏颇,即使这些因素都指向正确的方向也难以达成完美结局。心理学应该助风险政策的设计一臂之力,使之集专家知识、公众情感及直觉于一身。

    示例—效用层叠“她对一项创意大为赞赏,说它收益大,无成本。我认为这就是种情绪启发式。”“这是一个效用层叠的例子:被媒体和公众大肆宣扬的事还没发生,电视上就满是关于此事的报道,每个人都在谈论这件事。”

    ① 效用层叠,即集体信念形成的自我增强过程。经由该过程表示的认知触发一连串的反应。它通过在公共话语中增强影响效用而增强此感知的合理性,这一过程的驱动机制包含信息的、名声的动机:个人通过部分了解他人的外在想法,为了保持社会认可的利益而通过部分扭曲自己的公开反应而支持上述认知。效用野心家—操纵公共话语内容的行动主义分子—总是力图触发效用层叠以推进其计划。 —译者注

    第14章 猜一下,汤姆的专业是什么?

    请看下面这个简单的问题:

    汤姆是你们国家一所著名院校的研究生。请预测汤姆就读于以下9个专业的概率,并对专业进行排序。用1表示最有可能就读的专业,9表示最无可能的。

    工商管理

    计算机科学

    工程学

    人文与教育

    法学

    医学

    图书馆学

    自然科学与生命科学

    社会科学和社会工作

    这个问题很简单,你马上就知道不同专业的招生规模是解决问题的关键。就你所知,汤姆是从这所大学里随机挑选出来的一名研究生,好比从罐子里随意拿出来的一个弹球一样。想要知道这个弹球是红色的还是绿色的,你必须清楚罐子里两种颜色的弹球各有多少。某一特定种类的弹球所占比率被称为基础比率。同样,在这个问题中,人文与教育专业的基础比率指的就是这个专业的学生人数占全体学生总数的比率。在缺乏与汤姆相关的具体资料的情况下,你可能会根据基础比率进行猜测,相比计算机科学和图书馆学,汤姆更有可能被人文与教育专业录取,因为人文与教育专业的招生规模比另外两个专业的招生规模大。在没有其他信息可供参考时,采取基础比率的方法最容易。

    接下来的这个任务与基础比率并无关联。

    一位心理学家在汤姆高三时对他进行了一系列不定效果的心理测试,大体推断出他的个性,其描述如下:

    尽管缺乏创造力,但汤姆智商很高。他喜欢按部就班的简单生活,喜欢干净整洁的环境,屋子里的物件要摆放得规规矩矩。他写的文章枯燥,偶尔会写一些老掉牙的双关语,或者迸发出类似科幻小说的火花,文章还显得有那么点生动。他颇具竞争意识。此外,汤姆待人冷淡,缺乏同情心,也不愿与他人接触。尽管他总是以自我为中心,但却有强烈的道德观念。

    现在,请拿出一张纸来,按照上文对汤姆的性格描述,预测他与某个专业典型学生的相似度并进行排序。用1表示最相像的专业,9表示最不像的。

    如果能够很快完成这个任务的话,你就会从本章学到更多东西。很有必要读读汤姆的相关报告,这会帮助你对不同专业的研究生特质作出判断。

    下面这个问题同样很直接。它需要你重新获得或构建一个不同专业领域的研究生的典型形象。在20世纪70年代早期,实验刚开始进行时,平均结果所呈现的专业顺序如下所示。这与你的排序可能并没有多大不同:

    1.计算机科学

    2.工程学

    3.工商管理

    4.自然科学与生命科学

    5.图书馆学

    6.法学

    7.医学

    8.人文与教育

    9.社会科学和社会工作

    由于会想到书呆子(因为描述中有“老掉牙的双关语”这一条),你有可能将计算机科学排在首位。实际上,汤姆的性格特征就是按照计算机科学专业学生的典型形象来描述的。另一个大多数人都排在前面的专业是工程学(描述中有“规规矩矩”这一条)。你可能认为汤姆并不适合社会科学和社会工作专业(因为他“待人冷淡,缺乏同情心”)。但该专业人员的典型形象似乎在我设计描述汤姆实验后的40年内发生了少许变化。

    给这9个专业排序是一项复杂的任务,肯定需要系统2有规则、有秩序地组织,只有这一系统才能完成这项任务。然而,描述所给的提示(老掉牙的双关语及其他一些提示)很容易激活关于典型形象的联想,这是系统1控制下的自主活动。

    这项寻找相似点的任务要求我们对汤姆的描述和不同专业学生的典型形象进行比较。描述的准确性—无论这是不是对汤姆的真实写照—与任务的目的没有关系。另外,你对每个专业基础比率的了解也与任务无关,因为某个个体与某个组织典型人员的相似性并不受这个组织大小的影响,甚至在大学里根本没有图书馆系的情况下,你都可能会将汤姆的性格描述与图书馆学专业的研究生形象进行比较。

    如果你再次审视汤姆,会发现他很适合人数少的专业(计算机科学、图书馆学、工程学),并不适合人数多的专业(人文与教育、社会科学与社会工作)。的确,受试者也几乎都将人数多的两大专业排在了最后。汤姆被刻意设计成了“反基础比率”的角色,适合于人数少的专业,不适合人数多的专业。

    依据典型性作出预测是下意识的行为

    第三个排序的任务是由心理学专业的研究生完成的。这项任务尤其重要,同样是根据汤姆就读专业的概率对9个专业进行排序。不过进行这次预测的人了解相关的统计学事实:他们对不同领域的基础比率都很熟悉,也知道对汤姆的性格描述并不十分可信。然而,我们希望他们只关注描述与典型特征的相似性(我们将其称为典型性),而忽略掉基础比率以及对描述的准确性的怀疑。他们将人数少的计算机科学专业排在了最前面,因为这个专业最典型。

    在尤金工作的那一年,我与阿莫斯十分卖力,我有时还会在办公室里通宵达旦地工作。彻夜工作的任务之一就是将典型性和基础比率之间的冲突描述出来。汤姆的形象就是我努力的结果,我是在清晨时分完成了对他的描述。那天早晨第一个来上班的是我的同事兼好友罗宾·道斯(Robyn Dawes)。他是一个富有经验的统计学家,也是直觉判断有效性的怀疑者。如果说有人能意识到基础比率的话,这个人一定是罗宾。我将罗宾叫过来,给他看了我刚打出来的问题,并让他猜测汤姆的专业。我至今仍然记得他试着回答时露出的狡黠笑容,他说道:“计算机科学吗?”那是一个令人开心不已的时刻,我心想:你也有失算的时候啊。当然,我一提到“基础比率”,罗宾很快就更正了他的错误,但他开始并没有自主地想到这一点。尽管他比任何人都清楚基础比率在预测中的作用,但当他看到某个人的性格描述时,就会忽略掉这些比率。不出所料,他用对典型性的判断替代了对概率的评估。

    随后,我和阿莫斯搜集了3所重点院校里114名心理学研究生对这个问题的答案。这些学生都上过几门统计学课程。结果确实没让我们失望。他们对9个专业概率的排序与和典型形象相似程度的排序并无太大差别。在这个实例中,替换起了很大作用:并无迹象表明除了判断典型性以外,受试者还用了别的方法。因为关于概率的问题较难回答,而关于相似性的问题就比较简单,所以在回答时受试者就置换了问题。这是一个严重的错误,因为对相似性和概率的判断所遵守的并不是同一个逻辑规律。我们对相似性的判断可以完全不受基础比率的影响,不受可能会出现的不当描述的影响,但是在判断概率时,如果忽略基础比率和证据的可靠性的话,就注定会犯错误。

    “汤姆是学计算机科学的概率”并不是一个简单的概念,逻辑学家和统计学家对它的意义各执己见,还有一些人认为它根本就没有意义。对于很多专家而言,概率是信念主观程度的评估手段。有些事你确信无疑,例如今天早晨出太阳了;而另外一些事是你认为根本不可能的,例如太平洋突然结冰了。还有许多事会令你半信半疑,例如你隔壁的邻居是一个计算机科学家—这便是此事在你眼中的概率。

    逻辑学家和统计学家相互争论,提出了多个关于概率的定义,全都非常精确。然而,对于外行人来说,概率(在日常生活中和“可能性”是同义词)是一个相对含糊的概念,与不确定性、倾向性、貌似正确以及出乎意料等词紧密相关。模糊性和令人不爽的感觉不都是这个概念所特有的特性。当我们使用“民主”或“美丽”这样的词时,我们或多或少明白自己究竟要表达什么意思,我们的谈话对象也或多或少能明白我们究竟想要说什么。在我潜心研究事件的概率问题的这些年来,从来没有人举手问过我:“先生,请问概率指的是什么?”如果我问他们的是一个奇怪的概念,例如适应全球化的能力,他们肯定就会举手问问题了。尽管每一个人都表现出他们知道该怎样回答我的问题,但我们都明白要求他们去解释这个词的含义有些难。

    被要求作概率评估的人并不会感到很困惑,因为他们对概率的判断与统计学家或是哲学家的判断不同。关于概率或可能性的问题引起了思维的发散性,让人想起比较简单的问题的答案。其中一个简单的答案就是对典型(代表性)的自动评估—在我们理解语言时这种现象很常见。“猫王埃尔维斯·普雷斯利(Elvis Presley)的父母曾希望他成为一名牙医”,这一(错误的)陈述听起来有些好笑,因为我们会自动把猫王的形象与牙医联系在一起,然而这两者的形象实在相差太大。系统1能使人产生相似的印象,虽然它并没有刻意这样做。“她会赢得竞选,你明白她肯定会赢”,“他学习成绩好不了,看那一身文身吧”,听到有人这样说时,他们一定是受到了典型性启发式的影响。如果我们通过某个下巴的轮廓或铿锵有力的演讲来判断这个职位候选人是否具有领导才能,此时我们依赖的就是典型性。

    尽管通过典型性作出预测的做法很普遍,但是在统计学上这一做法并不是最优选择。迈克尔·刘易斯(Michael Lewis)的畅销作品《魔球》(Moneyball)说的就是这种预测方式的低效性。职业棒球球探在预测某个选手是否会成功时,他们大体上看的是球员的体格和相貌。这本书的主角是奥克兰“运动家棒球队”的经理比利·比恩(Billy Beane)。他作出了一个大家都不愿接受的决定:否决球探们的建议,通过选手过去表现的统计数据来挑选球员。“运动家棒球队”挑选出来的选手都以低会费入队,因为其他球队都因为没有想到用数据来判断,因而拒绝了这些选手。“运动家棒球队”很快就以低成本达成了最佳结果。

    典型性启发的两宗罪

    用典型性来判断概率有一些重要的优点,它所带来的初始印象通常比乱猜一气更为精确。

    ·在大多数情况下,表现得很友好的人实际上也很友好。

    ·又高又瘦的职业运动员很有可能是打篮球的而不是踢足球的。

    ·获得哲学博士学位的人比只读完高中的人更有可能订阅《纽约时报》。

    ·年轻的男性会比年老的女性更不要命地踩油门。

    在这些例子及其他更多例子中,典型的形象特征左右着我们对典型性的判断,受这种典型性启发得到的预测有可能是对的,这样的说法在某种程度上就是事实。然而在其他情况下这种典型形象却是错误的,因而典型性的启发也会造成误导,尤其会使人们忽略基础比率信息、找错预测方向。即使启发性具有一定的真实性,但绝对依赖启发效应就是违背统计学逻辑,是有严重“罪过”的。

    典型性的第一宗罪就是,它过于喜爱预测不可能发生的(低基础比率的)事件。

    下面就是一个例子:如果你看见一个人在纽约地铁里阅读《纽约时报》,下面哪种情况与读报者更吻合?

    她有博士学位。

    她没有大学文凭。

    典型性会告诉你应该选有博士学位那位,但这样做并不一定是明智的。你应该充分考虑第二个选项,因为纽约地铁里更多的是没有大学文凭的人,而不是有博士学位的人。如果猜测一个被描述为“羞涩的诗歌爱好者”的女士学的是中国文学还是工商管理,你也应该选择第二个答案。因为虽然学习中国文学的女学生都害羞且爱好诗歌,但几乎可以肯定的是有更多工商管理专业的学生同样也是害羞的诗歌爱好者。

    在某些情况下,没有受过统计学训练的人也会使用基础比率来进行预测。在本章开头关于汤姆的第一个问题中,我们没有提供关于他的细节,对于每一个人来说,汤姆读某个专业的概率就是那个专业招生规模的基础比率。然而,得知汤姆的个性特征后,人们再也不会将基础比率纳入考虑范围了。

    在前期证据的基础上,我和阿莫斯原本以为在了解了具体信息后,基础比率的信息“总会”被忽略,但是这样的结论太过绝对了。心理学家做过许多实验,在这些实验中,所给问题都明确地提供了基础比率信息,尽管关于个人特征的信息比单纯的数据分量更重,许多受试者还是受到了这些特征信息的影响。诺伯特。施瓦茨和他的同事表示,引导人们“像统计学家那样思考”就能够促使他们使用基础比率信息,引导人们“像临床医生”那样思考则会起到相反的效果。

    几年前,我和哈佛大学的学生做了一项实验,让我有了一个令我十分惊讶的发现:增强系统2的激活状态能有效提高回答汤姆问题的准确率。这项实验将旧问题与认知顺畅性的现有形式结合了起来。在实验过程中,我们要求一半学生鼓腮帮,另一半学生皱眉头。前文中已经提过,皱眉通常可以增强系统2的警觉性,降低对直觉的过分相信和依赖。鼓起腮帮(与感情无关的表情)的学生的预测结果与原实验结果一样:他们只依赖于典型性,而忽略了基础比率。然而不出作者所料,那些皱眉头的同学的确对基础比率表现得很敏感。这是一个具有启发性的发现。

    一旦人们作出一个错误的直觉判断,系统1和系统2都脱不了干系。系统1引起了错误的直觉,系统2采纳了这个直觉,并将其运用在判断当中。然而,造成系统2犯下此类错误的原因有两个——忽视与懒惰。许多人忽视了基础比率,因为在有个人信息的情况下他们认为基础比率与问题并无关联。另一些人犯下同样的错误则是因为他们没有将注意力集中在任务上。如果皱眉能带来不同结果的话,这说明懒惰也许是人们忽视基础比率的合理解释,至少对于哈佛大学的学生来说是这样。当具体信息缺失时,他们的系统2“知道”基础比率与问题相关,但是只有在任务中付出特别努力时,才能将基础比率的知识应用于其中。

    典型性的第二宗罪是它对证据质量不够敏感。请回想系统1的眼见即为事实的原则。在汤姆的问题中,激活你联想机制的是对汤姆的描述,且这个描述不一定是真实的。对汤姆“对人冷淡,缺乏同情心”的表述也许能让你(以及许多其他读者)相信他不太可能是社会科学与社会工作专业的学生。然而,彼时你已经清楚地知道这样的描述是不可信的。

    原则上讲,你当然知道不值得信任的信息就相当于没有信息,但是眼见即为事实使你难以遵循那条原则。除非你决定立刻否定证据(例如,你坚信的信息是从一个骗子口中得来的),否则你的系统1会自动将这一信息视为真实的。当你怀疑信息的可靠性时,可以做一件事:作概率判断时,往基础比率那方面想。别期望遵循这条原则会很容易—它需要在付出很多努力的情况下,才能实现自我监督和自我控制。

    想要得出汤姆问题的正确答案,你应该遵从最先出现在自己脑海中的想法,若认为某招生人数多的专业(人文与教育、社会科学与社会工作)被选中的概率高,则稍微降低其概率;若认为某招生人数少的专业(图书馆学、计算机科学)被选中的概率低,则稍微提高其概率。如果你对汤姆一无所知,你作出的抉择就不是你的初衷了,你手头上的那点信息也不能相信了。所以,你应该让基础比率在预测时起主导作用。

    用贝叶斯定理来约束直觉

    你认为明天会下雨的概率只不过是你的臆测,你不应该相信头脑里出现的所有想法。你的信念必须受限于概率逻辑。所以,如果你相信明天某个时候会下雨的概率是40%,就该相信不会下雨的概率是60%,那么明天早晨下雨的概率就一定不会是50%。如果你相信某个候选人当选总统的概率是30%,并且相信他在首次竞选成功后再次当选的概率是80%,你就必须相信他连任的概率是24%。

    贝式统计学(Bayesian statistics)提供了类似汤姆等相关问题的“定理”。这个研究统计学的定理影响深远,是以18世纪英国一位名为瑞福伦德。托马斯。贝叶斯神甫的名字命名的,因为人们认为他是为一个重大问题作出重要贡献的第一人,这个问题就是:如何推断人们是怎样根据证据改变自己的想法的。贝叶斯定理详细说明了最强烈的信念(在本章的实例中指的是基础比率)应该与证据分析相结合,这样才能更接近假设而不是偏离到其他方向上。例如,如果你相信有3%的研究生是被计算机科学专业录取的(基础比率),你还相信汤姆是该领域研究生的可能性是其他领域的4倍,贝叶斯定理就会认为,你必须相信汤姆是计算机科学家的概率是11%。此外,如果基础比率是80%,那你眼中的新概率就应该是94.1%,以此类推。

    数学问题与本书并无关联。关于贝叶斯定理,有两点我们要铭记在心,要知道我们总是喜欢把事情搞得一团糟。第一,基础比率十分重要,即便是在手头的案例已有证据的情况下依然如此;第二,通过分析证据得到的直观印象通常都会被夸大。

    眼见即为事实与联想一致性的结合易使我们相信自己编纂的故事。以下是对贝叶斯定理关键点的总结:

    ·以相对合理的基础比率对结果的可能性作出判断。

    ·质疑你对证据的分析。

    这两个理念都是直接明了的。当我意识到自己从未学习过怎样运用它们时,我感到非常震惊,即使是现在,我仍旧觉得自己在践行这两个理念时总有些不自然。

    示例—典型性与基础比率“草坪修整得很好,接待员看起来很能干,家具也十分抢眼,但这并不意味着这是一家经营状况良好的公司。我希望董事会不要依照典型性启示作出判断。”“这家新成立的企业看起来好像不会倒闭,但是这个行业的成功基础比率非常之低。我们又怎么能知道这家企业就是个特例(一定能成功)呢?”“他们一直在重复犯同样的错误:用并不充分的证据来预测罕见的事件。当证据不充分时,我们应该以基础比率作为判断依据。““我知道这份报告绝对是具有毁灭性意义的,也许它的证据十分确凿,但我们凭什么相信呢?我们必须在做计划时保持一定的怀疑态度才行。”第15章 琳达问题的社会效应

    我们的实验中最著名也最受争议的地方是设计了一位虚拟的女士,名叫琳达·阿莫斯和我拟造了琳达问题,用以说明启发式在判断中的作用以及它与逻辑相悖的地方。以下是我们对琳达的描述:

    琳达,31岁,单身,一位直率又聪明的女士,主修哲学。在学生时代,她就对歧视问题和社会公正问题较为关心,还参加了反核示威游行。

    20世纪80年代听到这个描述的人常常会笑出声来,因为他们马上就知道琳达曾在加州大学伯克利分校上过学,因为这个学校以有一批热衷政治的激进学生而著称。

    在一项实验中,我们给受试者看了一张单子,上面列有琳达可能会出现的8种情况。

    在汤姆问题中,有些人通过典型性对汤姆的专业进行排序,而其他人则通过概率做出排序。琳达问题也是如此,但有些新的变化。

    琳达是小学老师。

    琳达在书店工作,她还在学瑜伽。

    琳达积极参与女权运动。

    琳达是妇女选民联盟成员。

    琳达是银行出纳。

    琳达是保险推销员。

    琳达是银行出纳,还积极参与女权运动。

    这个问题从几个方面透露出年代的信息。“妇女选民联盟”如今的地位已经不再像从前那样突出了,“女权运动”虽说见证了过去30年里女性地位的变化,但这种说法今天听来也已经很陌生了。然而即使在当今这个“脸谱”时代,我们仍然很容易猜到人们会对这位女士作出高度一致的判断:琳达非常适合当一个激进的女权主义者,也相当符合在书店工作且学习瑜伽的身份特征,不过却不怎么适合做银行出纳或是保险推销员。

    琳达不可能只是一名普通的银行出纳吧?

    现在请注意这张单子上有一点很重要:琳达更像一名(普通的)银行出纳,还是更像一名积极参与女权运动的银行出纳?所有人都认为琳达更像是“主张女权主义的银行出纳”,而不是普通的银行出纳。普通的银行出纳不会热衷女权主义,加上这个细节,整个描述便更像是一个有条理的故事了。

    但是在判断概率的过程中会让人有些纠结,因为上述两种情况之间存在一种逻辑关联。按照维恩图解来说,积极参与女权主义的银行出纳的集合包含在银行出纳的集合之中,因为每个持女权主义理念的银行出纳本身还是银行出纳。因此,琳达是位积极参与女权主义的银行出纳的概率,就一定比她只是个(普通的)银行出纳的概率低。当你想更加详尽地说明某个可能的事件时,只能降低其概率。因此这个问题使典型性直觉和概率逻辑两者对立起来。

    我们的首次实验是一次受试者组间实验(between-subjects)。每位受试者都看到一组列有7个结果的单子,其中只包括几个重要结果中的一个(“银行出纳”或“积极参与女权主义的银行出纳”)。有些人通过相似度来排序,而其他人则通过概率排序。就像汤姆问题出现的结果那样,通过相似度和概率得出的平均排序结果是相同的。在两种情况下,“积极参与女权主义的银行出纳”都比“银行出纳”的排序要靠前。

    然后我们运用受试者组内设计(within-subject)对此项实验作了更深入的研究。我们设计了你此前看到的那份调查问卷,其中“银行出纳”排在第六位,“女权主义银行出纳”位于最末。我们相信受试者会注意到两个结果之间的关系,而且他们的排列也应该会符合逻辑。事实上,我们对此非常有把握,不必再专门做个实验来证实这个想法。我的助手当时正在实验室里做另一项实验,她让受试者一边在报酬表上签名(临走前要领报酬),一边完成这项关于琳达的问卷。

    后来我随意一瞥,看到助手书桌上的文件盒里已经放了10份调查问卷了,而且所有的受试者都认为(琳达是)“积极参与女权主义的银行出纳”比“银行出纳”的可能性更大。当时我太惊讶了,因为自己有了一个重大发现,因此我至今对那张灰色金属质地的书桌以及当时每张表的位置仍记忆犹新。当时我兴奋极了,赶紧给阿莫斯打电话,告诉他我们有了重大发现:我们让逻辑与典型性互相竞争,结果典型性赢了!

    我们还观察到系统2的一个缺点:既然两种结果都包含在同一列表中,受试者就有很大机会发现逻辑规则中的关联性,但他们却没有把握好这次机会。当我们把实验的规模扩大时,发现样本中89%的研究生都违背了概率的逻辑。我们相信,从统计学角度作出复杂应答的受试者表现会更好些,因此我们给斯坦福大学商学院决策科学项目的博士生发了同样的调查问卷,所有的博士生都学过概率论、统计学和决策论等学科的高级课程。我们又一次惊奇地发现:85%的博士生也认为(琳达是)“积极参与女权主义的银行出纳”比“银行出纳”的可能性更大。

    为了消除这个错误—后来我们认为“这个希望越来越渺茫”—我们让很多人了解琳达,并且问了他们下面这个简单的问题:

    下面两种情况哪种可能性更大?

    琳达是银行出纳。

    琳达是银行出纳,同时她还积极参与女权运动。

    这个直截了当的问题使琳达这个人物在某些领域中小有名气,也引起了数年的争议。几所重点大学中85%~90%的大学生选择了第二个选项,这一选择有悖逻辑,但却没有人因此感到羞耻。我曾经有些愤怒地问自己教的那些大学本科生:“难道你们没有注意到自己违背了基本的逻辑原则吗?”当时后排有些学生大喊:“那又怎样?”还有个犯了同样错误的毕业生解释道:“我还以为你只不过是问问我的看法罢了。”

    通常,当人们没能运用明显相关的逻辑原则时,就会出现“谬误”。阿莫斯和我引入了“合取谬误”(conjunction fallaly)这个想法,通过直接比较,人们总会认为两个事件(在此即为银行出纳和女权主义者)的联合出现比只出现其中一件事(银行出纳)的可能性要大,此时就出现了合取谬误。

    正如缪勒·里亚的错觉图所示,即使你对谬误有了真切的了解,也仍然难以避免这种错误。生物学家斯蒂芬·杰·古尔德(Stephen Jay Gould)曾描述他自己在琳达问题上的纠结反应。他当然知道这个问题的正确答案,然而他还是写道:“我脑中有个小人,跳上跳下的,还对着我喊:”她不可能只是个银行出纳,看看那描述就知道了。‘“这个喋喋不休的小人当然就是古尔德的系统1了。(在他写这些文字时还没有引入两个系统的说法。)

    琳达问题简短版本的正确答案只是对我们众多研究中的一项的多数回应:斯坦福大学和伯克利大学的社会科学专业大学生组中有64%的学生正确地判断出(琳达是)“女权主义的银行出纳”比“银行出纳”的可能性更小。起初列有8个结果的版本中,相似的大学生组中只有15%的人作出了正确选择,其区别颇具启发性。问题的较长版本通过在不同结果中穿插其他结果(保险推销员)来区别开两个重要结果,读者要分别判断每个结果,因此不会对所有结果进行比较。相反,(琳达)问题的较短版需要有能启动系统2的明确对比,允许多数有统计学知识的学生避免谬误。不过遗憾的是,我们没有对这组知识渊博的受试者中选择错误的少数人(36%)的推论进行探究。

    我们的受试者在汤姆问题和琳达问题中提供的概率判断与典型性判断(与原型判断类似)正相吻合。典型性属于一连串可能同时发生且联系紧密的基本评估,最具典型性的结果与特性描述结合在一起就会生成最有条理的信息。而这些最具条理的信息却不一定就是可能性最大的,但它们“貌似正确”,稍有疏忽,我们就很容易混淆有条理、貌似正确和概率这三者的概念。

    如果我们将具体描述用做预测的工具,那么不加批判地用貌似合理的判断来替代概率就会严重影响我们的判断结果。请思考下列一组问题中的两个描述,并对其可能性作出评估。

    明年北美某地将有一次洪灾,1000多人将被淹死。

    明年加利福尼亚某时将有一次地震,此次地震将导致洪水,1000多人将被淹死。

    加利福尼亚地震的情节要比北美洪灾的情节更合乎情理,尽管加利福尼亚地震的概率非常小。不出所料,人们对更详细、更丰富的描述作出的概率判断更高,这一点有违逻辑。预言家总会给其客户设下陷阱:对情节加以详述会使其更可信,却更不可能成为现实。

    为了体会“貌似合理”的作用,请看下面的问题:

    下面两个论述哪个可能性更大?

    马克长有头发。

    马克长有金色的头发。

    以及

    下面两个论述哪个可能性更大?

    简是位老师。

    简是位老师,她走路去上班。

    这两个问题与琳达问题一样,有相同的逻辑结构,但它们却没有引起谬误,因为更详细的结果只是更详细而已,不会更让人信服,或更有连贯性,或更讲得通。对貌似合理和连贯性的评估不会产生概率问题的答案。在与之相矛盾的直觉缺位时,逻辑就会起作用。

    少即是多的逻辑悖论

    芝加哥大学的奚恺元(Christopher Hsee)让人们在当地一家商店清仓大甩卖时为几套餐具标价,当地餐具的价位一般在30~60美元。他将受试者分成三个小组,其中一个组看了下面的标价,奚恺元将这组标价标注为“综合评估”,因为受试者可以对两套餐具进行对比。另外两组只看了其中一组的标价,此谓“单一评估”。综合评估是组内实验,而单个评估则是组间评估。

     [image file=Image00011.jpg]

    假设A、B两套餐具质量相当,那么哪套更值钱呢?这个问题很简单。你可以看到A套包括B套所有的餐具,另外还多出7件完好无损的餐具,所以A套“必然”更值钱。的确,综合评估组的受试者宁愿多花点钱买A套餐具也不愿买B套,A套标价为32美元,B家标价为30美元。

    在单一评估组中则出现了完全相反的结果,其中B套标价(33美元)比A套(23美元)高很多,我们都知道为何会出现这一结果。用具组合(包括餐具)通过标准和原型展示出来,因为没有人想买破损的餐具,于是你立即感觉到A套组合的平均价值比B套组合的平均价值低。如果以平均价值引导估测,人们认为B套更值钱也就不足为奇了。奚恺元将这样的结果模式称为“少即是多”。从A套中拿走16件餐具(有7件是完好无损的),它的价值就会提升了。

    实验经济学家约翰·李斯特(John List)对奚恺元的发现进行了复制,他在真正的市场上拍卖两套相同的高价值棒球卡片,每套各为10张,但其中一套附赠3张普通价值的卡片。就像餐具的例子一样,在综合评估中,数量多的组合会比少的更有价值,但在单一评估中则正好相反。从经济理论的角度来看,一套餐具或一套棒球卡片的经济价值是一种总体变量,给任何一套加上一个有价值的物件只能提升它的价值。如果是这样,这个结果就有些令人烦恼了。

    琳达问题和餐具问题的结构完全相同。概率就像是经济价值,是一种总体变量,我可以通过以下这个例子加以说明:

    概率(琳达是个出纳)=概率(琳达是个女权主义出纳)+概率(琳达是个非女权主义出纳)

    这就是为什么琳达问题的单一评估产生了一种“少即是多”的模式,这一点与奚恺元的餐具实验一样。系统1会取价值的平均值而不是累加值,因此,当我们将非女权主义的银行出纳从银行出纳的大集合中移除后,主观(判定)的概率就会加大。然而,变量的总体性对概率判断的影响要小于其对金钱的影响。因此,综合评估只是消除了奚恺元的实验中出现的错误,却无法消除琳达实验中出现的错误。

    琳达不是唯一一个在综合评估中得以存在的合取谬误,我们在其他许多判断中也发现了有悖逻辑的类似情况,其中一项研究的受试者被要求从高到低排列下一届温布尔登网球赛的4个可能结果,比约•伯格(Björn Borg)是研究进行当日的主要网球比赛运动员。以下即为结果:

    A.伯格会赢得比赛。

    B.伯格会输掉首局。

    C.伯格会输掉首局,但会赢得比赛。

    D.伯格会赢得首局,但会输掉比赛。

    上述结果中B和C两项比较重要。B囊括的内容更多,其概率“一定”比自身所包含的一个事件发生的概率大。受试者给出的答案与逻辑相悖,却顺应了典型性和貌似合理性,72%的人认为B选项比C选项的可能性更小—又一个通过直接比较得出“少即是多”的例子。这一次受试者选出的可能性最大的描述无疑貌似更合理,更符合当今世界一流网球运动员身上所具有的所有公认的特质。

    合取谬误是因为对概率的误解,为阻止可能会出现的异议,我们设计了一个需要作出概率判断的问题,但在这个问题中,事件不是用文字来描述的,而且“概率”这个词一次也没有出现过。我们告诉受试者有一个标准的六面骰子,其中四面是绿色的,两面是红色的,此骰子可被投掷20次。我们给他们看了三组预设的结果,都是绿色(G)和红色(R)的任意排列,并让他们选一组。如果他们选择的那组正好出现,他们会(假想)得到25美元。这三组是:

    1. RGRRR

    2. GRGRRR 

    3. GRRRRR

    因为这个骰子绿色面的数量是红色的2倍,第一组就很不具代表性—就像琳达是个银行出纳这一选项一样。第二组包括6次投掷结果,与预期投骰子结果更为符合,因为它有两个G。但是这个结果在设计时只是在第一种序列的开头加了个G,所以它比第一组更不可能,只是相当于“琳达是个积极参与女权主义的银行出纳”的非言语表达。与琳达的研究一样,典型性主导着上例的结果。几乎2/3的受试者更愿意在第二组上下注,而不愿赌第一组。然而,当人们看到支持两种选择的理由时,大多数人发现正确的理由(偏向第一组的)更可信。

    下一个问题是个突破,因为我们终于找到了可以降低合取谬误的条件。两组受试者看到同一个问题,但其变量稍显不同:

    不列颠的哥伦比亚省针对成年男子样本作了一个健康调查,这些男子年龄不同,职业也不同。请对以下价值给出最佳评估:在被调查的男子中,有几成人有过一次甚至多次心脏病发作的经历?在被调查的男子中,有几成人既超过了55岁又有过一次甚至多次心脏病发作的经历?不列颠的哥伦比亚省对一个由100名成年男性构成的样本进行了调查,这些男性年龄不同,职业也不同。请对以下价值给出最佳评估:100名受试者中有多少位有过一次甚至多次心脏病发作的经历?100名受试者中有多少超过55岁又有过一次甚至多次心脏病发作的经历?看左栏问题的小组的错误率为65%,而看右栏的小组的错误率仅为25%。

    为什么“在100名受试者中有多少……”的问题比“有几成人……”更容易回答?有一个可能的解释是“100名”这个参考值给大脑一种空间上的暗示。假使有很多人按照指示把自己归到一间屋子里的不同小组中去:“名字首字母是A到L之间的人到房间的左前方角落去。”然后这个小组中的人再按照指示进一步分组。这种包含的关系现在已经很明显了,你会看到名字以C字母开头的人是左前方角落中那群人的一分子。在这个医学调查问题中,心脏病患者最终会走到屋子的某个角落,他们中有些人不足55岁。不是每个人都能想象出这一场景的,但很多后续实验显示,人们所熟知的典型频率会使人们更容易理解一个组完全被另一个组包含的概念。上述问题中的“多少”使你想到了个体,但“几成”就不会使你有这种联想,从这点来看,这个难题的答案就不难理解了。

    关于系统2的工作机制,我们从这些研究中能窥见多少?有一个已经不算新鲜的说法是,系统2并非时刻处于警惕状态。参与我们那些合取谬误实验的大学生和研究生当然都“知道”维恩图解中的逻辑,但即使所有的相关信息都摆在面前,他们也没有对此加以运用。“少即是多”模式的荒谬在奚恺元的餐具实验中表现得淋漓尽致,在“多少”的事例中也非常容易识别出来,但对那些在最初的琳达问题以及其他相似问题中也犯了合取谬误的数千人来说,这一模式还不够明显。在所有这些例子中,合取谬误显得貌似合理,而且也获得了系统2的认可。

    系统2的惰性也是导致判断失误的部分原因。如果这些受试者的下一次休假要根据此次调查结果来决定,而他们又有足够的时间,被告知要遵循逻辑,直到确定答案正确才能说出来,我相信大多数受试者都是可以避开合取谬误的。然而,(事实是)他们的休假并不取决于一个正确的答案,他们几乎没费什么时间就得出了答案,而且他们也愿意用随意的方式来回答这个问题。系统2的惰性是生活中存在的一个重要事实,而对典型性会阻碍明显的逻辑原则运用的相关观察也至关重要。

    琳达问题值得注意的一个方面是:它与餐具实验的结果形成了对比。这两个问题有着相同的构造,但却产生了不同的结果。那些看到成套餐具中有破损餐具的人会给这套餐具标低价,他们的行为是直觉反应。其他能看到两套餐具并进行对比的人则能运用逻辑原则,得出多出来的餐具只是为了增加价值的结论。在组间研究情况下作判断时,直觉就会起作用,逻辑原则则在综合评估中起作用。而在琳达问题中却不是这样,直觉常会推翻逻辑,即使在综合评估中也会如此,虽然我们确定有些场合下逻辑会占主导地位,但大胆的直觉也会将其推翻。

    我们在一些明确的问题中观察到了概率公然违背逻辑的现象,阿莫斯和我都认为这种有悖逻辑的现象非常有意思,值得和同事们分享。我们还相信这些结果能进一步加强我们关于判断启发式强大作用的论证,这会让怀疑者哑口无言。然而在这一点上,我们是大错特错了,琳达问题竟然成了争论规范的研究案例。

    琳达问题引起了广泛的关注,它也引发了众人对我和阿莫斯关于判断的研究方法的批评。一些研究人员发现将指示和提示结合起来可以减少谬误的发生,这跟我们已有的发现没什么两样。有些人争论道,在琳达问题中,受试者将“概率”理解为“貌似合理”完全是合情合理的。这些争论有时波及我们的整个研究,说我们的所有结论都在误导公众:如果一种显著的认知错觉能被削弱或解释清楚,其他的系统功能也会如此。这个理论忽视了合取谬误是直觉和逻辑间的矛盾冲突这一特殊性。我们通过设计组间实验对启发式进行论证的论据没有受到质疑,简单地说就是没有被讨论过,而且因为过于重视合取谬误,这个证据的突出性也被掩盖了。琳达问题的净效应是我们的工作对于普通民众来说更透明了,而在此领域的学者中,我们的研究方法的可信度有了一点欠缺。当然我们绝不会料到事情会这样。

    如果你去法庭就会看到律师们往往采用两种批评风格:要想推翻某个案件,他们往往会去质疑支持此案的最有力证据,他们会找准证词中最薄弱的地方,让目击证人变得不值得相信。关注弱点在政治辩论中也很常见。我认为在科学争论中这是不恰当的,但我越来越相信一个事实,那就是社会科学中的辩论规则无法阻止政治辩论的风格,尤其在紧要关头的重大问题的讨论上—人类判断中普遍存在的偏见就是个重大问题。

    几年前,我和拉尔夫·赫特维格(Ralph Hertwig)有过一次友好的交流。他对琳达问题一直都持批评态度,而我想通过琳达问题解决我们之间的分歧,不过结果证明这只是徒劳之举。我问他为什么和其他人只关注合取谬误,而不关注其他可支持我们立场的更强有力的发现。他笑着说:“这个问题更有意思啊。”他说琳达问题引来了众多关注,我们没有理由抱怨什么。

    示例—少即是多“他们构建了一个非常复杂的情节,还坚持说这个情节出现的可能性很大。这不是真的,这只是个貌似合理的故事而已。”“对于贵重的产品他们还附赠一个便宜的小礼物,这样的话,整套产品就不那么吸引人了。少即是多就是这个意思。”“很多情况下,直接的比较使得人们更谨慎也更有逻辑性。不过,也不常是这样。有时即使正确的答案就在眼前,直觉也会打败逻辑。”第16章 因果关系比统计学信息更具说服力

    请考虑下列情境,凭直觉写出答案。

    一辆出租车在夜晚肇事后逃逸。

    这座城市有两家出租车公司,其中一家公司的出租车是绿色的,另一家是蓝色的。

    你知道以下数据:

    ·这座城市85%的出租车是绿色的,15%是蓝色的。

    ·一位目击证人辨认出那辆肇事出租车是蓝色的。当晚,警察在出事地点对证人的证词进行了测试,得出的结论是:目击者在当时能够正确辨认出这两种颜色的概率是80%,错误的概率是20%。

    这场事故的出租车是蓝色而不是绿色的概率是多少?

    这是“贝叶斯定理”的一个标准问题。我们可以从中得到两条信息:一个基础比率以及不完全可靠的目击者证词。若没有目击者,肇事出租车是蓝色的概率(即蓝色出租车的基础比率)为15%。若两家出租车公司规模一样大的话,基础比率就会变成无用信息,你就只需考虑目击者的证词,因而这个问题的概率就是80%。我们可以用贝叶斯定理将这两个信息源结合起来,得出正确答案是41%。然而,你可能会想到当人们面对这个问题时是怎样做的:他们会忽略基础比率,只考虑目击者的因素。因此,最普遍的答案是80%。

    因果关系基础比率与思维定式

    现在,请考虑一下上述问题的另一种表述方式,在这个表述中,只有基础比率发生了变化。

    你得到的数据如下:

    ·两家公司拥有数量相同的出租车,但是在出租车造成的事故中,绿色出租车占85%。

    ·关于目击证人的信息与上例相同。

    同一问题的两种表述从数学角度来看并没有区别,但从心理学角度来看则有很大不同。看了第一种表述的人并不知道怎样运用基础比率,通常会忽略它。相反,看到第二种表述的人会对基础比率给予一定重视,他们的平均判断与运用贝叶斯定理解决该问题得出的答案相差不多。这是为什么呢?

    在第一个表述中,蓝色出租车的基础比率是关于这座城市出租车的统计学事实。大脑极其渴望找到其中的因果关系,但却一筹莫展:这座城市绿色和蓝色出租车的数量与出租车司机肇事后逃逸到底有什么因果关系呢?

    而在第二个表述中,开绿色出租车的司机比开蓝色出租车的司机肇事率高5倍。于是你会马上得出结论:开绿色出租车的司机是一群莽撞的疯子!现在,你认为绿色出租车司机是莽撞的,并对这家公司所有你并不认识的司机都抱有这种印象,我们称之为思维定式。我们很容易将这样的思维定式设定在因果关系里,因为莽撞是使出租车司机与肇事逃逸产生因果联系的相关事实。在这个表述中,有两个因果关系需要放在一起考虑。第一个是肇事后逃逸,这件事使人很自然地认为莽撞的绿色出租车司机难脱干系;第二个是目击者的证词,证词特别强调肇事出租车是蓝色的。根据这两个因果事件对出租车颜色作出的推断是相互矛盾的,因此如果其中一个成立就相当于另一个被推翻。这两种颜色的概率大致相同(用贝叶斯定理估计出的概率是41%,这说明与目击者确信出租车为蓝色的概率相比,绿色出租车的基础比率略为极端了些)。

    这个出租车的实例阐明了两种基础比率。“统计学基础比率”(statistical base rates)是指某一事件所属类别的事实总量,与单独事件无关;而“因果关系基础比率”(causal base rates)则会改变你对单独事件的看法。对两种基础比率,人们往往会区别对待:

    ·统计学基础比率普遍受到轻视,当人们手头有与该事件相关的具体信息时,有时还会完全忽略这一比率。

    ·因果关系基础比率被视为个别事件的信息,人们很容易将这一比率与其他具体事件的信息结合起来考虑问题。

    与因果关系相关的那个出租车问题存在一种思维定式:绿色出租车的司机是危险的。思维定式是指人们会(至少暂时会)将自己对某个团体的看法延伸到这个团体中每一个成员的身上(团体存在某些问题,其中的成员无一例外也都会有这些问题)。下面有两个例子:

    这所位于市中心的学校的绝大多数毕业生都能考上大学。

    自行车风靡整个法国。

    这些陈述很容易被理解为某个团体中每个个体都具有某种倾向,符合因果关系。这所位于市中心的学校的许多毕业生都想要上大学,他们也有这个能力,原因可能是这所学校的校园生活有利于学生身心发展的特点。法国文化及社会生活中蕴涵着使法国人对骑自行车感兴趣的推动力。当你想到某学校毕业生进入大学的可能性或考虑是否与一个刚认识的法国人谈论环法自行车比赛时,你就会联想到这些事实。

    思维定式在我们的文化中是个贬义词,但我把它当成一个中性词来用。系统1的基本特征之一就是它代表了范畴规范和原型范例。这样的规范和范例决定了我们怎样看待马、冰箱及纽约市的警察,因为我们会在记忆里存储与所有这些范畴的事物或人相关的一个或多个“规范的”典型形象。当这些范畴具有社会性时,这些典型形象就被称为思维定式。有些思维定式的错误是致命的,负面的思维定式可能会产生可怕的后果,但这样的心理学事实无法避免:不管是对是错,思维定式都是我们对不同范畴事物的看法。

    你可能发现了其中的讽刺之处。在出租车问题的情境中,忽略基础比率信息是一个认知错误,是贝叶斯定理的失败;依赖因果关系基础比率才能获得令人满意的答案,形成对绿色出租车司机的思维定式便会提高判断的准确度。然而,在其他情境中,例如涉及雇佣问题或整体概述时,社会规则与思维定式会发生强烈冲突,在法律当中同样有所体现。事实就是如此,无须大惊小怪。在敏感的社会情境中,我们不想根据某个团体的相关统计数据对个人做出可能是错误的结论。我们认为应该将基础比率视为与整体相关的统计学事实,而不是与个人相关的假设性事实。换句话说,我们反对利用因果关系基础比率。

    社会规范往往反对思维定式,包括对整体概述这一做法的否定,这对于建立一个更加文明平等的社会大有益处。然而,我们也应该知道,忽略有根据的思维定式会不可避免地妨碍我们的判断。打破思维定式是值得称道的道德主张,但是如果简单地认为打破这种印象不用付出任何代价,那就错了。为了建立一个更美好的社会,付出这些代价都是值得的;然而如果只顾满心欢喜和正确的政治立场,却否认代价的存在,这种态度是经不起科学推敲的。在政治分歧中依赖情绪启发是很常见的,我们赞同的某些立场无须成本,我们反对的某些立场也没有益处。我们应该有能力可以做得更好。

    我和阿莫斯设计了许多出租车问题的衍生实验,但并没有发明因果关系基础比率这一强大概念,我们是从心理学家埃塞克·阿杰恩(Icek Ajzen)那里借用了这一概念。阿杰恩在他的实验中给受试者简单描述了一些学生在耶鲁大学参加考试这件事,然后要求受试者判断其中每个学生通过考试的概率。因果关系基础比率的影响是非常明显的:阿杰恩告诉一组受试者,那些考生中有75%的人通过了考试;而告诉另一组受试者,考生考试的通过率是25%。这项测试的困难自然在于,受试者需要用众多因果关系中的一个来判断每一个学生的考试结果。不出所料,阿杰恩的受试者都对因果关系基础比率非常敏感,在高成功率的情境中,受试者估测出的每个学生通过考试的概率都要高于在高失败率的情境中那些受试者的估测值。

    阿杰恩运用一个颇具独创性的方法指出了一个非因果关系的基础比率。他告诉受试者,那群学生是从一个样本中抽取的,而且这个样本是从已得到考试结果的学生中抽取的。例如,处于高失败率情境的那一组所看到的信息如下所示:

    研究者主要是对考试失败的原因很感兴趣,所以选取的样本中有75%的学生是没通过考试的。

    请注意其中的不同。这个基础比率是一个关于选取示例整体的纯统计学事实。这与所问的问题(即个别学生是否通过考试)并无关联。正如人们所料,这个阐述明确的基础比率对判断产生了一定影响,但相对于统计学上的因果关系基础比率而言,其影响则要小很多。系统1处理的事件中各项因素是有因果关系的,但是在统计推理中这样的关系很薄弱。当然,对于一个以贝叶斯定理为模式进行思考的人来说,所有这些表述方式都是相同的。我们很容易认为自己已经得到了一个令人满意的结论:因为我们使用了因果关系基础比率;我们只不过(或多或少)忽略了统计学上的事实而已。下面这个研究是我一直以来最中意的一项,它表明了情境是非常复杂的。

    我们并没有自己想的那样乐于助人

    莽撞的出租车司机以及高难度的考试阐明了两个从因果关系基础比率中得出的推论:一是我们容易赋予个人以典型特征,二是情境的一个重要特点就是能影响个人的思考结果。实验的受试者做出了正确的推论,他们的判断力也有所提高。可事情并不总是那么顺利。我即将要描述的典型实验表明,人们不会从基础比率信息中得到与他们的观点相冲突的推论。这个实验还证实了一个让人苦恼的结论:教授心理学纯粹是在浪费时间。

    社会心理学家理查德·尼斯贝特(Richard Nisbett)和他的学生尤金·博吉达(Eugene Borgida)很早之前就在密歇根大学做了这个实验。他们向学生描述了前几年在纽约大学进行的那个著名的“帮助实验”。他们将实验受试者分别带入房间,并要求他们对着麦克风谈论自己的生活和烦恼。他们轮流叙述两分钟,每个房间的麦克风只有在受试者讲述时才会出声。每一组有6位受试者,其中一位是我们派去扮演受试者的工作人员。这位工作人员是第一个叙述的人,他是按照研究人员准备的稿子说的。他说他很难适应纽约的生活,并十分尴尬地承认自己很容易抽搐,在紧张的时候尤其如此。接着,所有受试者都依次叙述。当那位工作人员再次对着麦克风讲述时,他变得焦虑和不连贯,他说他感到一阵抽搐,希望有人能帮助他。他最后几句说的是“有没有人……能……救救我……(喘气声)我……我要……死了,我要……死了(气哽声,然后安静了下来)”。此时,下一位受试者的麦克风被自动打开,人们再也听不到那位有可能濒临死亡的人的动静了。

    你认为这个实验的其他受试者会做些什么呢?到现在为止,受试者知道他们中的一员癫痫发作并希望得到帮助,然而他们觉得可能已经有几个人冲出去并提供了帮助,所以自己可以安然地待在隔间中。实验结果是:15个受试者中,只有3个人立刻对请求做出了反应。6个人没有踏出过房间,另外5个人在“癫痫患者”明显气哽时才冲出房间。这项实验说明当某人知道其他人也听到了同样的求救信息时,就会感到自己肩上的责任变小了。

    这样的结果令你惊讶吗?很有可能。我们大多数人都认为自己十分正直,在那样的情况下,都会义无反顾地提供帮助。当然,这项实验的意义就是去证实那样的期望是错误的。即使是普通、正直的人也不会冲过去提供帮助,因为他们希望别人能够处理这种令人不快的癫痫发作情况。这是不是意味着你也会这样做呢?

    你赞同下面的说法吗?“当我阅读帮助实验的流程时,我想我会立刻对那个陌生人施予援手,就如同当时只有我和这个癫痫病患者一样。然而,我有可能错了,如果发觉自己所处的环境中还有许多人有可能去提供帮助,我可能就不会走出去了。别人的存在会削弱我最初的责任感。“这是一个心理学老师希望你学到的。你自己也做过相同的推理吗?

    描述这项帮助实验的心理学教授希望学生能将基础比率看做是有因果关系的,就如前面提到的那个虚拟的耶鲁大学测试一样。他希望学生可由这两个例子得到推论,即高失败率意味着测试很难。学生应该懂得这个情境的显著特点,例如责任感的淡化。这个特征会引起包括这些学生在内的普通人和高尚的人意外地没有向他人伸出援手。

    改变一个人对人性的看法很难,改变一个人对自身阴暗面的看法就更难了。尼斯贝特和博吉达怀疑学生很有可能会对这项任务和不快的感觉产生抵触情绪。当然,学生能够也愿意在实验中叙述“帮助实验”中的细节,甚至会重复实验方对责任传播的“正面”解释。他们对人性的看法真的发生改变了吗?为了弄清这一点,尼斯贝特和博吉达给受试者播放了一些简短访谈的视频,被访者是在纽约所作的那项研究中的受试者。访问简短而平淡,受访者看上去都是友好而正直的普通人。他们描述了各自的爱好、课余活动以及对未来的计划,这一切完全是老生常谈了。在看过其中一个采访视频后,学生们需要猜测那个受试者会在多长时间后为陌生的发病者提供帮助。

    要想将贝叶斯推论应用到这项指派给学生的任务中,你应该先问问自己如果你并没有看过那两人的视频,你会作出怎样的猜测。这个问题可以运用基础比率得以解决。我们知道,在患病者发出第一次请求后,15个受试者中只有4个冲出去提供了帮助。所以某个受试者立刻伸出援手的概率是27%。因此,当被问到某个特定的受试者是否会立刻提供帮助时,你的第一反应是不会。接着,贝叶斯逻辑要求你通过该受试者的相关信息对自己的判断进行调整。然而,视频是经过精心设计的,不会提供什么信息。他们并没有提供任何理由以便让你推测出某个受试者的热心程度。因此,这样推测出来的结果并不比乱猜的准确率高多少。在缺乏有用新信息的时候,可同时运用贝叶斯定理与基础比率来解决问题。

    尼斯贝特和博吉达叫两组学生看了这些视频并要求他们判断两名受试者的反应。第一组学生只了解到“帮助实验”的流程,并不知道实验的结果。这组受试者的预测结果反映了他们对于人性的看法以及对情境的理解。正如你可能猜到的那样,他们作出的预测是两位受试者立刻都冲出去帮忙了。第二组学生对实验的流程和结果都有所了解。对两组受试者作出的预测进行比较,可以回答一个非常重要的问题:这组学生是否从“帮助实验”的结果中得到了一些信息,从而显著地改变了自己的思考方式?答案很明显:他们其实什么信息也没得到。第二组学生对这两位受试者所作的预测与并没有见过实验统计结果的第一组学生所作的预测没什么区别。尽管知道视频中被抽到的这个受试者所属小组的基础比率,他们还是相信自己在视频中看到的人会很快为陌生的患病者提供帮助。

    对心理学老师来说,这项研究的隐含信息无疑是令人沮丧的。在为学生讲授“帮助实验”中受试者行为的相关知识时,我们希望他们能够有新的收获;希望改变他们在某个特定情境中对于人的行为的看法。这个目标并没有在尼斯贝特和博吉达的实验中得到实现,而我们也没有理由相信假如他们选择的是另一个令人惊奇的心理实验,实验结果就会有所不同。的确,尼斯贝特和博吉达在给学生呈现另一项研究结果时,汇报了类似的发现,此发现表明轻微的社会压力会增强人们对令人痛苦的电击的承受力,且这样的承受力超出了我们大多数人的想象。如果学生没有对社会环境的影响力形成一个新的认识,他们就没有从实验中学到任何有价值的东西。他们对陌生人或是自己的行为作出的推测说明,他们并没有改变原本的想法。以尼斯贝特和博吉达的话来说,学生“默默地将自己(以及他们的朋友和熟人)排除在外”,认为实验的结果并没有令他们惊讶。然而,各位心理学老师不应感到绝望,因为尼斯贝特和博吉达想出了一个能让学生充分理解“帮助实验”内涵的方法。他们找了一组新的学生,向他们描述了“帮助实验”的流程,但没有告诉他们实验的结果。他们播放了那两个视频,然后只是简单地告诉学生视频中的两个人没有帮助那个陌生患者,然后,他们要求学生对所有受试者的行为进行猜测。实验结果是出乎意料的:学生们的猜测十分精确。

    在教授学生全新的心理学知识时,你必须得令他们感到惊讶,但什么样的惊讶才会有效果呢?尼斯贝特和博吉达发现,当他们向学生展示令人惊讶的统计学事实时,学生什么也学不到;但当学生惊讶于个体案例时,例如知道两个友好的人对求救的人袖手旁观时,他们会立刻归纳并推断出帮助他人似乎比自己想象的要困难。尼斯贝特和博吉达将结论总结为耐人寻味的一句话:

    这些受试者不愿从普遍现象中推导出特殊性,这一点与他们愿意从特殊现象中归纳出普遍性如出一辙。

    这是一个影响深远的重要结论。有些人的行为令人惊讶,了解这些行为的统计学事实的人也会将这些事实告诉别人,就在这种转述的过程中,他们的印象得以加深,但这并不意味着他们的世界观也会随之改变。学习心理学面临的考验是,你对所处环境的理解是否发生了改变,而不是你是否了解到一个新的事实。我们对于数据的想法以及我们对于个体案例的想法存在很大的差距。相较于非因果关系的信息来说,用因果关系进行解释的统计学结果对我们的想法影响更大。但即使是具有说服力的因果关系统计数据也不会改变我们在个人经历中形成的长期坚守或是根深蒂固的信念。此外,令人惊讶的个体案例影响甚大,是教授心理学更为有效的手段,因为个案与统计数据的分歧需要调解,并被嵌入一种因果关系里,正因如此,本书才包含种种直接向各位读者提问的问题。与从别人那儿听到令人惊奇的事实相比,你更有可能因为从自己的行为中发现惊人的事实而学到知识。

    示例—原因和数据“我们不能假设仅仅通过统计数据他们就能真正学到知识,需要再给他们一两个有代表性的个体案例来影响他们的系统1(作出判断)。”“不需要担心这个统计学信息会被忽略掉。相反,它会立刻被应用到形成陈规的过程中。”第17章 所有表现都会回归平均值

    我曾经为以色列空军的飞行教练们讲授过关于高效训练的心理学课程,那次经历为我带来了职业生涯中最引以为豪的发现。当时我告诉他们关于技能训练的一条重要原则:对良好表现的嘉奖比对错误的惩罚更有效。不管是对鸽子、老鼠、人类,还是其他什么动物的研究,都给这个说法提供了证据。

    就在我结束了激情洋溢的演说之后,经验最为丰富的一位教练举手示意,发表了一番自己的意见。他先是承认奖励对鸟确实管用,但他认为这不是训练飞行学员的最佳选择。他说道:“在很多情况下,我会赞许那些完美的特技飞行动作。不过,下一次这些飞行员尝试同样飞行动作的时候,通常都会表现得差一些。相反,对那些没执行好动作的学员我会大声怒吼,但他们基本上都会在下一次表现得更好。所以说,别告诉我们嘉奖有用而惩罚没用,因为事实恰恰相反。”

    这条统计学原则我已经讲授了很多年,而这一次我从一个新的角度重新认识了它,这的确是一个顿悟的时刻。那个飞行教练是正确的,但同时他也彻彻底底地错了。他的观察是精明且到位的:被他表扬之后,很多学员很有可能会表现得很糟糕;惩罚反而会促使他们进步。但是就他的推断而言,奖励和惩罚之间是毫无关系的。他所观察到的就是众所周知的“回归平均值”现象,这种现象与表现质量的随机波动相关。一般来说,只有学员的表现远远超出平均值时才能得到这位教练的表扬。但也许学员只是恰巧在那一次表现得很好,而后又变差,这与是否受到表扬毫无关系。同样,或许学员某一次非同寻常的糟糕表现招来了教练的怒吼,因此接下来的进步也和教练没什么关系。这个教练把不可避免的随机波动与因果解释联系起来了。

    这个提议确实引起了反响,不过这些教练对概率预测的代数方法没什么兴趣。所以,我用粉笔在地上画了一个靶子。我请房间里的每一位教练都转过身去,背对着靶子向里面接连扔两枚硬币。接着我们分别测量了靶子到两枚硬币的距离,并写在黑板上。然后,我们又将这些数据按第一次投掷的距离远近排列。很明显,第一次投掷得比较好的人第二次大都做得不好,而第一次没有投掷好的人第二次大都有了进步。我告诉这些教练,他们在黑板上看到的数据其实和飞行员的表现是一致的:糟糕的表现常常会有提高,而好的表现则会变得糟糕,这跟表扬与惩罚都没有关系。

    那天,我的发现是,那些飞行教练陷入了一个偶然性困局之中:因为当飞行学员表现差时,他们就会受到惩罚,而接下来的进步则很可能为他们带来嘉奖,事实上惩罚根本就没有发挥什么作用。而且,处于这种窘境之中的不仅仅是那些教练。我曾无意中发现了人类环境中一个意义重大的事实:生活给予我们的反馈常常违背常理。因为当别人取悦我们时,我们也会对他好;当别人对我们不好时,我们也会对他产生厌恶之情。然而从统计学角度来看,我们却是因为对人友好而受到惩罚,因为举止无礼而得到嘉奖。

    第二次的表现与第一次并无因果联系

    几年之前,在线杂志《边缘》(Edge)的编辑约翰·布鲁克曼(John Brockman)请一些科学家讲述他们“最喜爱的公式”。以下是我提供的信息:

    成功=天赋+运气巨大的成功=更多的天赋+更多的运气

    运气常常会促成成功,然而当我们把这个并不令人吃惊的想法用到高水平高尔夫锦标赛前两天的比赛中时,却出现了令人惊讶的结果。为了简单说明这个问题,我们假设这两天中参加比赛的选手平均绩点为72标准杆。我们关注了一位在第一天表现非常不错的选手,他在当天比赛结束时得分为66杆。我们从这个得分中能推断出什么?最直接的推断就是这个球员要比锦标赛中其他选手有更高的天赋。成功公式告诉我们另一个推断同样成立:第一天表现很好的高尔夫选手很可能在那一天有着非比寻常的运气。如果你能接受天赋和运气都能带来成功这种想法,那么“这个成功的高尔夫球手很幸运”这个结论肯定和“他很有天赋”这个结论一样可信了。

    同样,如果你关注一个当天的成绩超过标准杆5杆的球员,就可以推测他技术很糟,而且那天运气也不好。当然,你也清楚这些推测不一定都成立。某个打了77杆的运动员很可能非常具有天赋但却遭遇了极其不走运的一天。下面的推测是根据第一天的得分作出的,尽管不确定,但这种推测通常是正确的。

    第一天高于一般水平的成绩=高于一般水平的天赋+第一天的好运气

    第一天低于一般水平的成绩=低于一般水平的天赋+第一天的坏运气

    现在,假设你已经知道某个高尔夫球手第一天的得分,并且要对其第二天的得分进行预测。你希望这个选手第二天仍旧能够延续前一天的优异表现,所以你给出的最佳猜测就是第一个选手得分“高于平均水平”,而第二个选手得分则“低于平均水平”。当然,运气就很难说了。我们没办法预测出一名选手在第二天(或是任意一天)的运气如何,因此我们能作的最佳推测就是采用其平均值—既不好也不坏。也就是说,在没有其他任何相关信息的情况下,对于某选手在第二天的得分情况,我们能作出的最好推测就是:第一天的表现不会重演。你很有可能会这样说:

    ·在第一天表现很好的高尔夫选手在第二天也会表现得不错,但还是会比第一天稍差一点,因为他在第一天碰到的好运气不一定能在第二天再次碰到。

    ·在第一天表现不佳的高尔夫选手在第二天也许得分还会低于平均水平,但是会有些提升,因为他第一天的霉运不一定会持续。

    尽管我们会猜测第一名选手在第二天的表现还是会优于第二名选手,但是他们之间的差距会缩小。

    事实上,对选手第二天的表现最准确的预测通常是最保守、最接近平均值的,而不是基于第一天分数的预测。我的学生每次听到这样的结论都很惊讶。正因为如此,这种模式被称为“回归平均值”。原始数据越极端,我们所期待的回归就越明显,因为极好的分数常常表明这一天的运气很不错。这种回归式的预测是很合理的,但是准确度却得不到保证。有些高尔夫选手在第一天得了66杆的高分,如果第二天运气更佳的话,得分甚至更高。当然大部分人的表现都会变差,因为他们的运气不再处于平均值之上了。

    现在我们将时间轴反过来,将选手按第二天的得分情况排序,来看看他们第一天的表现。我们仍旧会发现同样的模式—回归平均值。第二天表现出色的选手很可能是因为当天运气好,而最好的猜测就是他们第一天的运气不佳。当你根据后期的表现来推测早期表现时,也会发现回归平均值的现象,此时你便会相信这种回归并非巧合。

    回归效应无处不在,很多可以说明这一效应的误导性因果事件同样司空见惯。有一个经典的例子,那就是“体育画报的诅咒”—凡是登上《体育画报》(Sports Illustrated)这本杂志封面的运动员都会在接下来的赛季中表现欠佳。一般来说,人们会认为过度自信以及人们对其期望过高的压力造成了这些人表现不佳。不过,这个诅咒可以用更简单的方式来解释:能够成为《体育画报》封面人物的运动员在前一赛季一定表现极为出色,也许这种出色的表现在很大程度上源于运气—运气是善变的,接下来他就没那么走运了。

    当年和阿莫斯正在撰写一篇关于直觉预测法的文章时,我碰巧看了冬奥会的男子高空滑雪比赛。在这项比赛中,每个运动员都有两次机会,最终结果由两次得分决定。每当一名选手进行第二轮时,解说员常常会说“挪威选手第一轮表现很好,现在他一定很紧张,因为想要保持领先地位,估计他在第二轮会表现欠佳”,或者“瑞典选手第一轮表现很糟糕,他明白自己已别无选择,因此也没有什么压力,大概第二轮就会做得更好”。所有这些评论都令我感到很吃惊。很明显,这个评论员已经觉察到了回归平均值的概念,而且还在没有任何依据的情况下编出了一个有理有据的故事。也许他的解释是正确的,如果我们测一下运动员的心跳,可能会发现不佳的表现之后确实会放松,当然也可能不会。有一点我们要记住,运动员第一跳和第二跳的表现之间不存在因果关系。这只是一个数学问题,其中运气起了很大的作用。这个说法不太令人满意—我们都想得到一个有因果关系的解释—但事实的确如此。

    回归现象的意义不亚于发现万有引力

    无论是没有察觉还是解读错误,这种回归现象对人类而言总是很陌生的,因此直到万有引力和微积分理论出现两百年后,这种现象才为人们所理解。而且,是19世纪英国最伟大的科学家之一经过艰苦卓绝的努力才探索出这一重要规律的。

    弗朗西斯·高尔顿(Francis Galton)爵士是19世纪英国著名的学者,也是达尔文的表兄。他发现并命名了回归平均值的现象。1886年,他发表了《在遗传的身长中向中等身长的回归》,其中涉及对连续子代的种子大小的测量以及对子代株高和母本株高的比较。在对种子的研究中,他写下了如下的话:

    实验结果看上去十分值得关注,在1877年2月9日的一次演讲中,我就先于皇家科学院将这些结果用做一次演讲的基本内容了。从这些实验可以看出,子代的高度和母本高度似乎并不相关,但似乎前者比后者更趋于平均。如果母本较高,那么子代就会变矮;如果母本较矮,则子代就会变高。实验显示,子代向平均值的回归与母本高矮的差异是成比例的。

    皇家科学院是世界上最古老的独立研究机构,高尔顿很期待该机构中博学的院士们也会对他那“值得关注的实验观察”感到惊讶。但真正值得关注的是,他为之惊讶的统计规律不过是像我们呼吸的空气一样稀松平常。回归效应随处可见,但是我们却无法识别它们的真面目。高尔顿以子代高度的回归现象为起点,逐渐发现当两个测量值之间的关联不是那么完美时,此时也会出现这种回归。他借助了当时最杰出的几位统计学家的帮助,且历时多年才得出这一结论。

    当按不同的标准衡量两个变量时—例如体重和钢琴技艺—如何测量这两个变量之间的回归是高尔顿要攻克的重大难题之一。要解决这一问题需要以人口作为参照标准。假设我们对某小学所有年级的100名儿童的体重和钢琴技艺进行测量,然后将两者按从高到低的顺序分别进行排列。比如说,简在钢琴技艺中排第三名,但按体重则排第27名,那么我们就可以说她弹钢琴的水平比她的体重排名靠前。我们来作些假设,这样就可以使这一现象更容易理解。

    不管年龄几何,

    ·钢琴技艺高低仅仅取决于每周练习的时长。

    ·体重多少仅仅取决于冰激凌的摄入量。

    ·冰激凌摄入量和每周练习钢琴的时长并不相关。

    现在通过排行(按统计学家的说法是“标准分”),我们可以得出更多的等式:

    体重=年龄+冰激凌消耗量

    钢琴技艺=年龄+每周练习时长

    你会发现,当我们通过体重预测钢琴技艺或通过钢琴技艺预测体重时,就会出现回归平均值的现象。如果知道汤姆在体重中排第12位(远高于平均值),我们就可以(从统计学上)推测他比平均年龄要大,而且可能比其他孩子吃更多的冰激凌。如果知道芭芭拉的钢琴技艺排第85位(远低于平均值),我们就可以推测她应当比大多数孩子年龄小,而且每周练习的时间也少。

    两个值之间的“相关系数”指的是两个值共有因素的相对比重。这个值在零和1之间浮动。我们拥有父母各一半的基因,对于像身高这种受环境因素影响很小的特征来讲,父母和子女的相关系数在0.5左右。下面的例子能帮助我们更好地了解相关系数:

    ·一个物体的型号用英制单位精确测量的结果与用公制单位精确测量的结果之间的相关系数为1。任何影响其中一个值的因素都会影响另一个。两者享有同样的决定性因素。

    ·美国成年男性自报的身高和体重之间的相关系数为0.41。如果将女性和儿童也包括进去,那么相关度就会更高,因为性别和年龄都会影响身高和体重,这便使得共有因素所占比例增加。

    ·学术能力评估考试成绩(SAT)和平均绩点(GPA)之间的相关系数大约是0.6。然而,研究生的潜能测试与成功之间的相关性则小得多,这在很大程度上是因为这一群体的潜能差异比较小。如果每个人都有相似的潜能,那么在衡量成功时,潜能的因素就不会占太大的比重。

    ·美国人收入和教育程度的相关系数约为0.4。

    ·家庭收入和他们电话号码后4位之间的相关系数为零。

    弗朗西斯·高尔顿用了好几年的时间才确定相关性和回归性并非两个概念—它们只是从不同视角对同一个概念作出的阐释。这个概念的原则很简单,但是影响却很深远:只要两个数值之间的相关度不高,就会出现回归平均值的情况。为了阐释高尔顿的卓见,我们来看一个例子,很多人都认为这个例子很有趣:

    聪明的女人常常会嫁给不如她们聪明的男人。

    如果你在朋友聚会时挑起这个话题,一定会引起热烈讨论,大家肯定都愿意分享自己的看法。即使有些对统计学有所了解的人也会很自然地用因果关系去解释这个现象。一些人认为高智商的女人为了避免和同样高智商的男人竞争才这么做;或者是在择偶之时不得不妥协,因为同等智商的男人不愿意与这些女人竞争……也许还会有其他更牵强的解释。现在我们来看看下面的表述:

    夫妻二人智商之间的相关性并不是绝对的。

    这个观点显然是正确的,而且很无聊。谁会期待这样一种相关性是绝对的呢?那就没有什么好解释的了。不过,你认为有趣的观点和你认为毫无意义的观点又是等值的。如果夫妻二人智商之间的相关性并不是绝对的(如果男人和女人在平均智商上没有差异),那么从数学上来讲,高智商女人嫁给那些不如她们智商高的男人是顺理成章的(反之也成立)。对于这一现象,用回归平均值效应来解释要比用并不绝对的相关性来解释更通俗,也更有说服力。

    你也许很同情高尔顿这样绞尽脑汁地解释回归的概念。统计学家戴维·弗里德曼(David freedman)曾说过,如果把回归的概念用在民事或刑事审判中,那么试图对陪审团解释“回归”的一方一定会输掉官司。为什么会这样呢?其中主要的原因也是本书中反复出现的主题:我们的思维常会对因果关系的解释带有很强的偏见,而且不善于处理统计数据。当我们把注意力集中在某一事件上时,相关的记忆就开始探寻其原因—更确切地说,我们会对所有早已存在于记忆中的原因进行自动搜索。当发现有回归效应时,因果关系解释就会被激活,但事实上这些解释都是不对的,因为回归平均值虽然可以用来解释现象,却无法找出其中原因。在高尔夫锦标赛中,那些第一天成功的选手通常在第二天发挥都很糟糕,而这场比赛总会吸引我们的注意力。对于这种现象最好的解释就是,那些选手第一天出奇地走运,不过这种解释缺乏我们的大脑所认可的因果关系因素。事实上,那些能够为回归效应提供巧妙解释的人往往赚得盆满钵满。如果一个商业评论员声称“今年的生意比去年要好,因为去年太糟了”,尽管他说得没错,但也很有可能很快就被电台噤声。

    我们理解“回归”概念存在很多困难,这些困难皆源自两个系统—系统1和系统2。在相当数量的案例中,即便提供了一些统计数据,若无特殊说明,“相关”与“回归”的关系还是相当模糊的。因此,系统2认为理解这种关系很难。因为从某种程度上讲,这是由于我们总是要求对事物进行因果关系解释,这也是系统1的一个特征。

    抑郁儿童喝了某种功能饮料,他们的情况在3个月内得到很大改善。

    这个新闻标题是我杜撰的,但这则新闻所报道的内容却是真实的:如果给一群抑郁儿童喝了某种功能饮料的话,一段时间后,他们的病情会有很大的好转。如果抑郁儿童每天都花一段时间倒立,或是把一只猫抱在怀里20分钟,这些举动也可以使病情好转。多数读者读了这则新闻之后会不由自主地认为:喝功能饮料和抱猫的行为的确使抑郁儿童的病情得到了改善,但这个结论却无法得到证实。抑郁儿童是一个极端群体,他们比大多数其他儿童要压抑得多—这些极端群体在一段时间之后会回归平均水平。一连串的测试反映出来的不同压抑程度之间并无绝对的相关性,因此回归平均值(或者更确切地说是回归平均水平)这种现象又会出现:即使他们不抱猫,也不喝功能饮料,一段时间之后这些抑郁儿童的病情同样会有所缓解。为了证明喝功能饮料或是其他治疗方法是有效的,我们必须要对两组患病儿童进行比较—实验组接受了治疗(比如喝过功能饮料),对照组没接受过治疗(或只是服用过安慰剂)。我们期望的是对照组仅通过回归就能改善病情,而该实验的目的在于判定接受治疗的病人是否恢复得更快。

    对回归效应作出错误因果解释的不仅仅是大众读者。统计学家霍华德。维纳曾经列出一长串杰出研究者的名字,他们也犯过同样的错误—将相关性和因果性混淆在一起。回归平均值是科学研究中的常见问题,有经验的科学家都会小心提防这种毫无缘由的因果推论所形成的陷阱。

    在我最喜欢的那些关于直觉产生预测错误的例子中,有一个是根据马克斯·巴泽曼(Max Bazerman)的《管理决策中的判断》(Judgment in Managerial Decision Making)一书中的内容改编而来的:

    假设你为一家连锁百货公司作销售预测。所有连锁店的规模和商品种类都非常相似,但是其地理位置、竞争状况以及其他随机因素使这些商品的销量有所不同。下列数据为2011年的营业额,请你对2012年的营业额进行预测。你已经知道自己可以接受经济学家所作的总体预测—销售额总体会增长10%。那么你将如何完成下列表格?

     [image file=Image00012.jpg]

    读过本章,你就知道将每家店的销售额增加10%显然是不对的。你应当使自己的预测具有回归性:对于业绩不好的店,预测增长率应高于10%;对于业绩较好的店,预测值应低于这个值(甚至是负值)。不过如果你咨询其他人的话,很有可能会碰钉子:这么显而易见的问题还有什么好问的?正如高尔顿历经艰难才发现的那样,回归的概念从来就不是显而易见的。

    示例—回归平均值“她说经验教会她一个道理,批评比赞扬更有用。不过她不明白这是回归平均值在发挥效用。”“也许由于惧怕让众人失望,所以他的第二次面试没有第一次那样令人印象深刻,他第一次的表现太优秀了。”“我们的筛选过程并不是很完美,所以我们会考虑回归性。有些极其优秀的候选人也会让我们失望,对此我们并不感到惊讶。”第18章 如何让直觉性预测更恰当有效?

    生活中,许多场合都会用到预测。经济学家预测通货膨胀和失业率,财务分析师预测收益,军事专家预测伤亡人数,风险资本家预测利润率,出版商和生产商预测读者和消费人群,承包商预测项目完成所需的时间,工程师预测建造某建筑需要的水泥量,火场指挥员预测扑灭大火所需的消防车数量。一些私人问题同样需要用到预测,我们预测恋人在自己求婚时的反应,预测在新工作中需要作的自我调节。

    有些预测判断,比如那些工程师所作的预测,主要就是通过查找表格、精确计算以及对类似项目的结果进行仔细分析得来的。还有一些预测则需要直觉和系统1的共同参与,主要有两种类型。有些直觉主要依靠反复训练得来的技能和经验。加里·克莱因在《力量的源泉》(Source of Power)一书中及其他场合曾提到过象棋高手、火场指挥员和内科医生所作的快速自动判断及选择,用以阐释这种经验性直觉,即由于识别出熟悉的线索,大脑中快速呈现出当前问题的解决方案。

    还有些直觉有时从一开始就难以从主观上进行区分。这种直觉受启发法的影响,通常会用简单的问题来替代难以回答的问题。即使证据很不充分,决定亦不可更改,人们依此作出直觉性判断时往往也会信心十足。当然,许多判断,特别是专业领域的判断,受到了分析与直觉的共同影响。

    偏离预测方向的直觉

    让我们再来看看下面这个老问题:

    朱莉现在是一名州立大学4年级的学生。她4岁就能流畅地进行阅读。她的平均绩点(GPA)是多少?

    熟悉美国教育体制的人很快就能得出一个数字,且这个数字通常在3.7或3.8左右。为什么呢?原因在于,系统1的几个机制共同参与了预测。

    ·人们会探寻证据(朱莉的阅读能力)与预测目标(她的平均绩点)之间是否存在因果关系。这种关系可能不是直接的。在这个例子中,很小就能阅读与较好的平均绩点都是学术天分的表现,必然会存在某种联系。你(你的系统2)可能会否定朱莉在高中曾经赢得钓鱼比赛或是在举重比赛中表现良好的说法。这个过程被有效地一分为二。系统1能够摒弃那些无关或是错误的信息,但却无法弥补证据中相对较小的瑕疵。因此,直觉性预测对证据的实际预测结果几乎毫无感觉。一旦发现某种关联,例如朱莉很小时就能阅读,眼见即为事实原则就会发挥作用:你的联想记忆会快速自动地运用可利用信息编出最恰当的故事。

    ·另外,证据的评估与相关规范联系紧密。4岁时阅读能力就很强的孩子早熟吗?什么样的名次或者说百分制下得多少分才能与这样的能力相符?与这个孩子作比较的人群(我们称之为参照人群)也没能明确说明这一点,但与我们平时说话所遵循的规则相同。如果即将毕业于这所大学的某个人被赞为“相当聪明”,你几乎不必问:“当你说他‘相当聪明’时,脑子里想到的是哪些参照人群呢?”

    ·下一部分包括替代和快速配对。对于儿童时期认知能力这个并不周密的证据进行评估的问题被替换成关于她大学平均绩点问题的答案。朱莉的平均绩点和她小时候就能阅读这项能力的百分比值是相同的。

    ·这个问题明确规定答案必须在平均绩点的范围内,这也就要求另一个强度匹配的运作,即将你对朱莉的学术成就的总体印象与能证明她本人天赋的平均绩点这一证据匹配起来。最后的步骤是转化,将你对朱莉学术水准的印象转化为相应的平均绩点。

    通过强度匹配得到的预测结果与支持这个预测的证据一样极端,会导致人们面对两个不同的问题却给出相同的答案:

    朱莉的早期阅读能力成绩是多少(百分制)?

    朱莉的平均绩点是多少(百分制)?

    到目前为止,你应该很容易就能看出所有这些运作都是系统1的特点,我按照不同步骤依次将它们列在这里,当然联想记忆的大量激活并不遵循这一顺序。你应该将这种记忆大量激活的过程想象为以下几步:由信息和问题激发起联想记忆,然后自我反馈,最后选定最具连贯性的合理性方案。

    我与阿莫斯曾经在一个实验中要求受试者对8位大学新生的相关描述作出判断,这个描述是由一名辅导老师根据对新班级的访谈而写成的。每个描述由5个形容词组成,如下例所示:

    聪明、自信、笃学、勤奋、好问

    我们问了受试者下面两个问题:

    这个描述对你关于学术能力的想法有多大影响?

    你认为这些关于新生的描述令你印象深刻的可能性有多大(百分制)?

    这两个问题要求你根据自己的标准对新生进行描述,将自己的描述与辅导老师的描述进行对比,进而评估上述描述。你自身的评判标准存在着重大影响。虽然你根本不知道自己如何形成这一评判标准的,但你对这条描述承载的热情程度非常清楚:辅导老师认为这个学生是优秀的,但还算不上是最棒的,因为我们还有很多比“聪明”程度更深的形容词(杰出、有创造力),也有很多比“笃学”程度更深的词(博学的、渊博的),更有许多程度超过“勤奋”的形容词(积极的、力求完美的)。由此可以推测,(该生)成绩很有可能在前15%,但不太可能在前3%。人们在类似的判断中得到的结果出奇地一致,至少在相同文化背景的人群中是这样。

    我们问了实验中另一组受试者不同的问题:

    你估计这个学生的平均绩点是多少?

    新生中取得较高平均绩点的学生占多大比例?

    你需要再三思考才能看出这两组问题的微小差别。这种不同本该很明显,但事实却并非如此。第一组问题只要求你作出评估,第二组问题则与第一组不同,包含了很大的不确定性。这个问题指的是在大学一年级期末的真实表现。自访谈后,这一年发生了什么呢?你怎样才能以5个形容词来预测这个学生在大学第一年的真实表现呢?如果这只是辅导老师本人通过与该生的访谈而作出的平均绩点预测,那么她的预测会准确无误吗?

    这项研究旨在比较两个判断结果(百分比成绩):受试者通过评估一个案例中的描述做出的判断结果(百分比成绩)和另一个案例中的最终预测结果。结论很明显:两个判断结果完全相同。尽管两组问题不同(一组关于该生的描述,另一组关于该生未来的学术表现),但受试者将这两个问题看成了一个。与朱莉的例子相同,受试者并没有将对未来的预测和对当前信息的估测区别开来—预测与估测相匹配。这也许是我们得到的能证明替换存在的最佳证据。当人们按要求预测时,他们总会将预测替换为对所描述问题的估测,而且没有意识到他们回答的问题并不是那个被问到的问题。这个过程证明预测时会存在系统偏见;他们完全忽略了一点,即应该回归到平均值上来。

    在以色列国防军队服役期间,很长时间我都待在一支部队里,这支部队通过一系列面试及实战测试来挑选后备实训军官。成功预测的特定标准为这些人在军官学校的最终成绩。这些等级评定的效度非常低(我会在后面的章节详细说明)。若干年后,这支部队仍旧存在,而彼时我已成为一名教授,并且正与阿莫斯合作研究直觉性判断问题。我一直与这支部队的工作人员保持着密切联系,于是便请他们帮个忙。除了他们通常使用的评估候选人的评分系统以外,我还让他们猜测每个学员将来在军官学校中可能得到的分数。他们搜集了几百份这样的预测。所有作出这些预测的军官都知道学校给学员评分时用的是字母评分系统,也知道所有学员得到的A、B、C各等级的近似比例。实验结果令人惊讶:预测出来的A和B的频率几乎与学校的结业成绩中的A、B等级的频率等同。

    这些发现提供了一个引人注目的例子,这个例子涉及替代和强度匹配两个方面。作出预测的军官完全将这两个任务混淆在一起了:

    ·他们平时的任务是对候选人在该部队的表现作出评价。

    ·我让他们执行的任务是对候选人的未来成绩作出切实预测。

    他们运用强度匹配将自己的评级简单地转换为军官学校的评分结果。由于无法解决预测中存在(相当大)的不确定性,他们的预测又一次完全无法回归(平均值)。

    对直觉性预测的偏见进行修正

    我们回过头再来看朱莉,那个儿时阅读能力就很强的阅读者。前一章已经介绍过预测她平均绩点的正确方法。我在前一章中还为连续两天打高尔夫球的例子以及体重和弹钢琴的例子分别写了一个原理公式,在这里我也要为阅读年龄和大学成绩的决定因素写一个公式:

    阅读年龄=共同因素+决定阅读年龄的特殊因素=100%

    平均绩点=共同因素+决定平均绩点的特殊因素=100%

    共同因素包括由遗传决定的潜能、家庭支持学业的程度,以及能够造成人们在孩童时期成为出色的阅读者、青年时期又在学术上有所建树的所有其他因素。当然,许多因素只会影响到其中的某个结果,却不会对其他结果产生影响。朱莉可能是因为父母对她期望过高强迫女儿读书才这么早学会阅读的,也有可能因为一段不愉快的感情经历,她的大学成绩才那么糟糕,还可能在少年时滑雪出了事故导致脑部轻微受损等。

    回想一下上面两个测量公式的关联,即当前阅读年龄和平均绩点这两个公式,你会发现两者所考虑的共同因素在决定因素中所占的比例是一样的。你对这个比例能作出的最贴近的估测是多少?我给出的答案是最多30%。有了这个估测,我们就完全有条件作出不带偏见的预测了。按照以下4个简单步骤来做,我们就可以进行无偏见预测:

    1.先估测出平均绩点的平均值。

    2.根据你对证据的印象算出与之相匹配的平均绩点。

    3.对你的证据和平均绩点的关联作出估计。

    4.如果关联度是0.3,则从估算出的平均绩点的平均值中抽出30%,放到与之匹配的平均绩点里。

    步骤1为你提供了基准线,即在你除了知道朱莉是个快毕业的大学生之外什么也不知道的情况下,预测她的平均绩点。在没有信息的情况下,你很有可能预测其为一般水平。(这一点与你对汤姆的预测相似,在对他一无所知的情况下,你便将企业管理专业毕业生的基础比率放在了他的身上。)步骤2是你的直觉性预测,这个预测将你的估计和证据进行了匹配。步骤3使你离开基准线靠向自己的直觉,但你能离开的距离取决于你对关联性的估测。在步骤4中,尽管你最终作出的预测还是受到了直觉的影响,但是这个影响力已经小很多了。

    这种预测方法很常见。在你需要预测一个定量数值时,就可以运用这个方法,例如在预测平均绩点、投资效益、公司发展的业绩时,这个方法就可以派上用场。这个方法以你的直觉为基础,但是削弱了直觉的影响,使它回归到平均值上了。当你有充分的理由对自己的直觉性预测的准确性充满信心时,即证据和预测之间联系非常紧密,进行调整的余地就会很小。

    直觉性预测需要校正是由于它并不具有回归性,因此是带有偏见的。假设我预测每一位高尔夫球员在一场锦标赛上第二天的得分与第一天的得分相同,那么这个预测并没有考虑到回归平均值的问题:第一天发挥得好的高尔夫球员第二天比赛时水平都会有所下降,而那些头天状态不佳的球员则大多会在第二天有所提高。当我们最后将预测值与实际结果进行比较时,我们会发现,缺失回归性的直觉确实带有偏见。

    这些预测普遍对第一天发挥得好的人过于乐观,对开始就发挥得不怎么样的人则过于悲观。预测与证据一样极端。同样,如果不使预测回归到平均值上来,而是根据儿童时期的成就来预测其大学时期的分数,那么你多半会对孩提时代阅读能力强的人在大学时代取得的学术成绩颇感失望,而那些较晚开始阅读的孩子的大学成绩反而会给你带来惊喜。修正过的直觉性预测消除了这些偏见,所以预测(过高或过低)高估真实值或低估真实值的可能性大致是相等的。当你不带偏见地预测时仍然会犯错,但这时的错误较小,也不会导致过高或过低的估值。

    两位教授候选人,应该选择哪一位?

    前文中,我向大家介绍了汤姆的情况,用以说明不连续结果的预测问题,比如对其所属的专业领域或者一次考试的成功概率进行的预测,这些预测是通过评估某一特定事件的可能性(或者按照结果出现的可能性大小排序)来表达的。我还曾描述过抵制不连续预测中的常见偏见的步骤,比如忽略基础比率,对信息的优劣不敏感。

    有些预测偏见是通过一个数值范围来表达的,例如某学生的平均绩点或某公司的收益,这些偏见与我们在判断结果的可能性的过程中所持偏见相似,而两种偏见的修正过程也十分相似:

    ·都包含一种基准线预测,如果你对手头这个案例的情况一无所知,便会作出这种预测。在绝对的情况下,这个基准线是基础比率;在有数字的情况下,这个基准线就是相关结果的平均值。

    ·都包含一种直觉预测,无论是可能性或是平均绩点,这种预测会将呈现在大脑中的数值通通表达出来。

    ·在上述两种情况中,你的目的都是要作出一种预测,这种预测可在基础比率和直觉性反应之间充当媒介。

    ·在没有什么有价值的信息的情况下,你会坚守基准线。

    ·在其他极端情况下,你还会坚守自己最初的预测。当然,只有在对支持自己最初预测的证据进行过严格验证之后,你才会信心十足地坚持那个预测。

    ·在大多数情况下,你会发现自己有理由怀疑自己的直觉判断和真理之间的关联其实并不完美,而你最终会给出介于两者之间的判断。

    这个过程很接近一个恰当的统计分析可能会出现的结果。如果成功的话,这个过程就会使你作出的预测偏见越来越少,作出的可能性评估越来越合理,对各种数值作出的预测也越来越适度。前述两个过程意在解决同一种偏见,即直觉性预测总是过于自信或过于极端。

    修正你的直觉性预测的偏见是系统2的任务。要想找到相关的参照物、对基准预测作出估测或者对证据的质量进行评估,往往需要付出很大的努力。只有在风险很高而你又特别渴望避免犯错误时,这种努力才显得合乎情理。此外,你应该知道纠正你的直觉也许会使你的生活变得复杂。无偏见预测的一个特征就是,只有在信息非常有效时才允许人们对罕见或极端的事件作出预测。如果你期待自己作出恰当有效的预测,那么你的预测结果就永远不会太离谱或者偏离平均值太多。而如果你的预测不存在偏见,你也就永远不会有极端事件的“愉快体验”了。当你在法学院最得意的学生成为最高法院的法官时,或者当你曾经很看好的那家新成立的公司成为商界新秀时,你永远不会说“我早就知道会这样”。如果信息量有限,你也无法预测到一个出色的高中生会成为普林斯顿大学的优等生;同理,一个风险资本家永远不会认为新创立的公司在起步阶段时成功的概率会“很高”。

    一定要严肃对待那些反对适度的直觉性预测原则的意见,因为摆脱偏见并非总是头等大事。如果不问具体情况,对所有预测的错误都同样对待,那么对无偏见预测的偏爱就是合理的了。然而总有那么一些时候,一种错误比另一种错误更糟糕。若一位风险投资家只为寻找“下一件大事”,那么他错过下一个谷歌或脸谱网的风险就会远远大于对刚刚创立的公司(最终破产)进行适度投资带来的风险。风险投资家的目标是正确判断极端情况,甚至以高估其他许多风险为代价也在所不惜。对于借出大笔贷款的保守银行家来说,某一位借款人破产带来的风险会比拒绝几位可能会履行债务的潜在客户带来的风险更大。在这种情况下,即使作出这些判断所依据的信息效度只是适中,使用极端的语言(“前景非常好”,“违约的严峻风险”)也可能会为其带来舒适感。

    对于一个理性的人来说,无偏见且适度的预测不应该引发问题。毕竟一个理性的风险投资家知道,即便是最有前景的新建公司,其成功概率也只是中等水平而已。她将自己的工作视为从所有赌注中找到的前景最好的赌注,而且关于要投资的那家新建公司的发展前景问题,她觉得没有必要欺骗自己。同样,预测某家公司收益的理性个体不会受到某个数字的束缚—他们应该考虑到最有可能出现的那个结果的不确定性。如果成功的回报足够大,一个理性的人就会考虑向一家极有可能倒闭的企业投资一大笔钱,而不会自欺欺人地抬高其成功概率。然而,我们并不都是理性的,我们中的一些人也许还需要歪曲判断作为保护来掩盖自己的无能为力。如果选择接受极端的预测来蒙蔽自己,你就会清楚地意识到自己对自己的纵容。

    也许我提出来的那几个修正步骤最难能可贵的贡献就是这些步骤会要求你思考自己对事情到底了解多少。接下来我会运用一个学术界尽人皆知的例子,其他生活领域中的例子亦可依此类推。一个部门要雇用一位年轻的教授,他们希望这位教授未来的学术能力能够达到最高水平。该部门的调查委员会最后将候选人圈定为两个:

    金最近完成了毕业设计。她的推荐信中都是对她的溢美之词,而且面试时她说得也很好,给在场的每个人都留下了深刻的印象。不过她没有什么实质性的科研成果。

    简经过过去3年的学习取得了博士后头衔,学术成果颇丰,研究也做得非常出色,但她在面试时表现得不如金出色。

    我们直觉会选择金,因为她给人的印象更深刻,而且眼见即为事实。但与简的信息相比,金的相关信息则少很多。我们可以回想一下小数原则。事实上,你从关于金的描述中得到的信息样本比简的要小,而且在小样本中更容易发现极端的结果。小样本的结果往往有更多的运气成分,因此在判断金将来的表现时,更应该回归平均值。若觉得金更有可能退步,最终你就会选择简,尽管你对她的印象并不深刻。如果按照学术能力来选人,我会投给简一票,但我得先努力克服自己对金的直觉印象—金更有希望。跟着我们的直觉走比违背直觉感觉更自然、更亲切。

    你很容易就能想象出不同情境下的相似问题,例如某位风险投资家要在位于不同市场中的两家新建公司之中选出一家进行投资,他可以相当精确地预估其中一家公司的产品需求量,而另一家是一派欣欣向荣的景象,让人觉得更有希望,但其发展前景却并不是很确定。如果把这种不确定因素考虑在内的话,你对第二家公司前景的最佳猜测是否还会优于第一家公司呢?这个问题值得认真思考。信息不足时,极端预测和预测罕见事情的愿意都源于系统1。联想机制会很自然地将极端预测和作出这些极端预测所依据的可察觉的信息极端性匹配在一起—这也正是替代的运行机制。而且系统1形成过于自信的判断也是正常的,因为自信是由你根据可得信息提炼出来的最合理故事的连贯程度决定的,这一点我们都明白。但要注意:你的直觉会产生极端预测,而你也很容易对这种极端信心满满。

    回归性也是系统2的一个问题。回归平均值这一概念很新奇,沟通和理解皆非易事。高尔顿在弄懂这一概念之前也颇费了一番心思。很多统计学老师在讲到这一问题时,心中也很没底,学生们最后对这个重要概念也是似懂非懂,只有个很模糊的概念。这个例子说明系统2需要经过特殊训练。将预测和信息匹配起来不仅是我们的直觉行为,这样做似乎也是很合理的。我们无法根据经验理解回归性。即使我们对回归性已经有了明确认识—就像我们在飞行教练员的故事中看到的那样—也只会用因果关系来解释这一特性,而这个解释往往又是错的。

    示例—直觉性预测“那家新成立的公司已经深入人心了,但我们不能指望他们将来也能做得这么好。他们的营销之路很长,回归的空间也很大。”“我们的直觉性预测的确令人鼓舞,但这个预测可能离现实太远了,还是让我们再看看手中的信息资料,让预测回归到平均状态吧。”“即使这次投资极有可能失败,我们还是觉得这项投资可能是个不错的想法。咱们还是别说什么这就是下一个谷歌这样的话吧。”“我读过关于那个品牌的一篇评论,评价极高,然而这很可能只是侥幸成功。我们应该这样想:对这个品牌的评论很多,而我们看到的这个正巧是评价最高的。”

  • 丹尼尔•卡尼曼《思考,快与慢》1-9

    目录
    序言
    第一部分 系统1,系统2
    第1章 一张愤怒的脸和一道乘法题 第2章 电影的主角与配角第 3章 惰性思维与延迟满足的矛盾 第4章 联想的神奇力量第 5章 你的直觉有可能只是错觉 第6章 意料之外与情理之中 第7章 字母“B”与数字“13” 第8章 我们究竟是如何作出判断的? 第9章 目标问题与启发性问题形影不离
    第二部分 启发法与偏见
    第10章 大数法则与小数定律 第11章 锚定效应在生活中随处可见  第12章 科学地利用可得性启发法 第13章 焦虑情绪与风险政策的设计 第14章 猜一下,汤姆的专业是什么? 第15章 琳达问题的社会效应 第16章 因果关系比统计学信息更具说服力 第17章 所有表现都会回归平均值 第18章 如何让直觉性预测更恰当有效?
    第三部分 过度自信与决策错误

    第19章 “知道”的错觉第 20章 未来是不可预测的 第21章 直觉判断与公式运算,孰优孰劣? 第22章 什么时候可以相信专家的直觉? 第23 章 努力养成采纳外部意见的决策习惯 第24章 乐观主义是一柄双 刃剑
    第四部分 选择与风险
    第25章 事关风险与财富的抉择 第26章 更人性化的前景理论 第27章 禀赋效应与市场交易 第28章 公平性—经济交易的参照点 第29章 对结果可能性的权衡 第30章 被过分关注的罕见事件 第31章 能带来长远收益的风险政策 第32章 心理账户是如何影响我们的选择的?第33章 评估结果的逆转 第34章 善用框架效应,让生活更美好
    第五部分 两个自我
    第35章 体验效用与决策效用的不一致 第36章 人生如戏 第37章 你有多幸福? 第38章 思考生活
    结语
    附录A 不确定性下的判断:启发法和偏见
    附录B 选择、价值以及框架

    序言

    我想每位作者都会在脑海中勾勒读者因为读自己的书而受益的情形。我的这本书就像是办公室饮水机旁的闲谈一样,读者对它不会感到陌生。人们在饮水机旁或交流,或闲谈,很随意。我希望这本书能丰富人们的词汇,这样大家在谈论别人的判断与决策、公司的新政策或是同事的投资时,这些新词汇就能派上用场了。书中为何还会涉及闲谈的内容呢?因为利用闲谈来发现和分析别人犯的错误比分析自己的错误更容易,也更有意思。在人生最辉煌的时候,我们很难对自己的信念和需求产生怀疑,越是在最需要质疑自己的时候越难做到这一点,但我们可以从他人的真知灼见中受到启迪。很多人都会不由自主地推想朋友和同事会对自己的选择作何评价,而这些预先推断的中肯程度和内容都是十分重要的。对别有见地的闲谈有所期待是进行严厉的自我批评的强大动力,其作用比新年计划更大,更能提升我们在工作和生活中的决策能力。

    一名内科医生要想成为优秀的诊断专家,就必须掌握多种疾病的大量特征,每种疾病都有其病理和症状,有其自身可能出现的发病前兆及病因、病情发展、结果和治疗或干预手段等。学医,当然也包括对医学用语的学习。要想对他人的判断和决策有更深入的了解,就要有更丰富的词汇,日常生活用语中的词汇还远远满足不了这一要求。我们很可能在闲谈中发现人们出错的方式各不相同,而一再出错就会令人印象深刻,而且我们可以预料到这种情况在特定环境中会再次发生。例如,一个潇洒自信的演讲者刚踏上舞台,观众往往就会对其大加赞赏,他可能并没有那么优秀,但这好评如潮的结果在他踏上舞台的一刹那便可预见。这种先入为主的情形是有据可依的,即光环效应,这一效应使我们更容易预测结果,更容易赏识和理解这位演讲者。

    当别人问你正在想什么时,你一般都能回答上来。你觉得自己知道脑子里在想什么,通常就是一种意识自然而然导出另一种来,但这不是大脑工作的唯一方式,也不是其典型的工作方式。大多数印象和想法都是从意识经验中得来的,而人们是感知不到这一过程的。你无从知道自己是如何晓得面前的书桌上有盏灯,无从知道己如何能通过电话听出爱人有些不耐烦,也无从知道自己如何毫无意识地成功规避了一场车祸。印象、直觉、决策,所有这些脑力活动都在无声地进行着。

    本书讨论的很多内容都与直觉的成见相关。然而,对过失的关注并不意味着我们在诋毁人类智慧,这就如同关注疾病并非否定健康一样。大多数人在通常情况下都是身体健康的,他们做出的决策、采取的行动往往也是恰当的。生活中,我们往往跟着印象和感觉走,凭直觉引导行事,而且我们觉得这种直觉和偏好很可靠,这种自信通常也是正当合理的。不过,也不尽然。我们经常在自己出现失误的时候还信心满满,此时,旁观者往往比我们自己更容易发现这些失误。

    因此,我和大家一起在“饮水机旁交谈”,其目的就是:给读者提供更丰富精确的语言来讨论他人乃至自己在判断和决策上的失误,提升发现和理解这些失误的能力。至少有些例子表明,正确的判断能有效地干预错误,以降低错误的判断和决策经常造成的损失。

    关于判断与决策的有趣研究

    本书展现了我对判断和决策的理解,这种理解受到近几十年来心理学领域新发现的影响。然而,本书中心思想的形成还要追溯到1969年那个幸运的日子。当时我在耶路撒冷希伯来大学的心理学系教书,那天有个研讨会,我请我的一位同事阿莫斯•特沃斯基(Amos Tversky)在会上发言。他当时被视为决策研究领域的一颗新星,不过我觉得在其涉足的任何领域中,他都是耀眼的新星,因此我知道我们那天一定会交谈甚欢。很多认识阿莫斯的人都认为,在自己所见过的人中他是最聪明的。他才华横溢,十分健谈,魅力非凡。他有着超强的记忆力,记得很多有趣的笑话。他还拥有一种超常的能力,那就是利用记住的那些笑话阐明自己的观点。有阿莫斯在,你永远也不会感到沉闷。那时,他32岁,我35岁。
    那天,阿莫斯给同学们讲了密歇根大学正在研究的一个项目,这个项目试图回答这样一个问题,即人是否是优秀的直觉型统计者。我们都知道人是优秀的直觉型文法家:4岁的孩子虽然对世界上存在语法这件事完全没有概念,但她在说话时会努力遵循语法规则。人们对统计的基本原则是否也有这种直觉感受呢?阿莫斯指出,研究得出的结论是附条件的肯定(肯定,但是附有一定条件)。我们在研讨会上进行了激烈的讨论,最终认为较为稳妥的结论应当是附条件的否定(否定,但是附有一定条件)。

    阿莫斯和我很喜欢这种交流活动,我们认为直觉型统计者是个很有意思的话题,要是一起探索的话会很有意思。那个周五,我们在里蒙餐馆吃午餐,那里是波西米亚人和耶路撒冷的教授们最中意的去处。我们两人打算对一些经验丰富的研究人员的统计直觉进行一番研究。在此前那场研讨会上我们曾得出结论:人的直觉是有缺陷的。虽然这些年来一直在教书,在运用统计学原理,但我们也没能培养出一种直觉,无法利用这种直觉感知从小样本中观察到的统计结果的可靠性。我们的主观判断是存在成见的:我们特别容易相信在没有足够证据的基础上得出的研究结果,而且研究中对观察样本的收集也不足。我们两人此番研究的目的,就是要看看其他研究人员是否也和我们一样有着同样的苦恼。

    我们准备了一项调查,其中包括一些研究中出现的实际统计问题。阿莫斯收集了数学心理学协会与会的专家小组的回复,包括曾出版两本统计学教科书的几位作者的问卷。不出所料,我们发现那些专家同行也跟我们一样,总是夸大其词,他们认为一个实验的原创性结果可以被成功复制的概率很大,即使用一个小样本也可以做到这一点。关于实验要收集多少观察数据的问题,他们给一个假定的毕业生的建议也很糟糕。如此看来,即使是统计学家,也算不上是出色的直觉型统计者。

    在撰写这些发现时,阿莫斯和我都觉得我们在一起工作是件很享受的事。阿莫斯总是很风趣,有他在的时候,我也变得幽默了,所以我们总会在轻松愉快的气氛中度过几个小时连续不间断的工作时光。工作中的乐趣使我们变得格外有耐心,人在放松惬意的情况下,更容易取得完美的结果。也许最重要的是,我们把批评的态度都抛在门外了吧。我和阿莫斯都是爱挑剔、好辩论的人,甚至比我更甚,但在我们合作的这些年里,我们从没有不假思索地否定对方。事实上,我发现我们在合作时,阿莫斯总能更清楚地看出我模糊的观点中要表达的意思。我们两人中,阿莫斯的逻辑思考能力更强,他的意见总是有据可依,言之凿凿,令人信服。我则凭直觉走,深受心理学的影响,我的很多观点也都是从心理学中得来的。我们俩有很多相似之处,因此很容易理解对方;我们也有很多不同的地方,这些差异常常令对方吃惊。我们重新安排各自的日程,这样就有很多工作日可以在一起工作,工作之余,我们常会一起散步。此后的14年里,共同合作就成了我们生活的中心,对我们两人而言,那些年里所作的研究是我们一生中最精彩的篇章。

    我们很快便形成了固定的工作模式,并且一直多年保持这一模式。我们的研究采用的是对话形式,对话中的问题是我们自拟的,那些凭直觉做出的答案也是经过我们两人共同检验过的。研究中的每个问题都是一个小实验,仅一天中就会做很多实验。我们并没有刻意寻求自己提出的那些统计问题的正确答案,只是想确认和分析直觉的回答 —大脑中最先出现的、即使知道是错的我们也愿意拿来分析的回答。当时,我们认为其他人也会有我们两个人都有的直觉,事实也正是这样。如此说来,直觉对判断的影响便显而易见了。

    我们曾经很高兴地发现,我们俩对几个认识的孩子的未来职业的预想竟如出一辙。我们确信那个3岁大却善辩的孩子将来会做律师,那个有点呆板的孩子可能成为教授,那个体谅他人、循循善诱的孩子可以做个心理咨询师。当然,这些预测都是荒谬的,不过却很有意思。我们都清楚一点,那就是我们对这些孩子的直觉,来自他们自身的特点与特定职业特点的相似度。这种有趣的做法使我们当时就在脑海中创立了一种理论,即预测角色的相似度。此后我们做了许多实验来验证和详细阐述这个理论,下面便是一例。

    在你思考下文中的问题时,请记住史蒂夫是从一个有代表性的样本库中被随机挑选出来的:

    邻居如此描述这个孩子:“史蒂夫非常腼腆,少言寡语,很乐于助人,却对他人或者这个现实世界没有兴趣。他谦恭有礼,做事井井有条,中规中矩,关注细节。”请问史蒂夫更可能从事哪种职业,图书管理员还是农民?

    很显然,史蒂夫的个性和典型的图书管理员有着惊人的相似,但这些与职业密切相关的统计学因素却很少有人关注。你们是否注意到,在美国,农民与图书管理员的比例超过20∶1.由于农民数量要多得多,所以那些“谦恭有礼,做事井井有条”的人也常常只能成为坐在拖拉机上的农民,而不可能是坐在图书馆咨询台后的管理员。但是,我们发现实验对象往往忽略这些相关的统计数据,而仅仅依赖于相似度来作出判断。于是,我们提出如下观点:人们把相似度当成一种简单的启发手段(简单地说就是经验法则)来作艰难的判断。对这种启发性手段的依赖必然会造成其预测带有成见(系统性失误)。

    还有一次,阿莫斯和我想知道我们这所大学的教授们的离婚率是多少。我们注意到这个问题立即勾起了我们脑海中的记忆,我们俩不由想起自己知道或听说的那些离了婚的教授。于是我们就凭着脑海中这些事例对这个离婚率问题作出判断。我们把这种依靠记忆作出判断的方法称为可得性法则。在一项研究中,我们让调查对象回答一个简单的问题,这个问题与指定的一篇英语课文中的单词相关:

    请思考字母 K.

    请问字母 K是更多地出现在单词的首字母位置上还是第三个字母位置上?

    玩拼字游戏的人都知道,想起以某个字母开头的单词要比想起它在第三个字母位置上的单词容易得多。字母表中任何一个字母都适用于此法则。因此我们料到,尽管有些字母(比如K、L、N、R、V)出现在第三个字母位置上的频率更高,但是被调查对象的回答肯定会夸大所有字母出现在单词首字母位置上的频率。这种情形再一次表明,对经验法则的依赖必然会导致人们判断时的成见。例如,我曾一度认为通奸在政客中较普遍,在医生或律师中则没那么多见,但我最近对此产生了怀疑。我甚至曾为原来的那个“事实”作出若干解释,包括权力的催情效果、出门在外受到的诱惑等。而我最终意识到,政客的过错只不过更容易被曝光而已,而医生和律师的过错却少有人报道。我的直觉印象可以完全归咎于记者对主题的选择和我对可得性法则的依赖。

    阿莫斯和我用几年的时间来研究并记录在不同任务中体现的直觉思考所存在的成见,这些任务包括对事件的概率赋值、对未来进行预测、对假设进行评估,以及对频率进行预估等。在合作的第五年,我们撰文将这项研究的主要发现发表在《科学》杂志上,这份杂志的读者包括很多领域的学者。那篇文章(本书的最后附有全文)描述了直觉思考的简单快捷,列出了在启发法中表现出的大约 20种成见,还包括启发法在判定中的作用。

    科学史学家常指出,某一特定领域的学者在任何时候都愿意和他人分享关于本学科的观点。社会科学家也是如此。他们把一切问题都归结为人性,认为大多数关于人类特有行为的讨论都应以此为背景,这一观点几乎从未受到质疑。关于人性,20世纪70年代的社会科学家广泛接纳了两种观点。第一,人大体而言都是理性的,其想法通常也是合理的。第二,恐惧、喜爱和憎恨这样的情感能够为人们失去理智的大部分情形作出解释。我们这篇文章虽然没有直接讨论上述观点,却是对这两种观点的挑战。我们记录下正常人思考时出现的系统性失误,认为这些失误是由认知机制的构造造成的,并非由情感引起的思想腐化导致的。

    这篇文章所受到的关注远远超出了我们的预期,而且它至今仍是社会科学著作中被引用次数最多的文章之一( 2010年有300多篇学术文章参考了这篇文章)。其他学科的学者也觉得这篇文章很有用处,启发法和成见等概念被广泛应用于众多领域中,包括医学诊断、法律判决、情报分析、哲学、金融、统计学和军事战略等。

    例如,学习政策的学生就曾注意到,可得性法则能解释为什么有些事人们记得很清楚,而有的却被遗忘了。人们是根据从记忆中提取信息的容易程度来估测事情的重要程度的,而这往往也与媒体报道的广泛程度有关。常被提到的话题就在脑中变得鲜活,而其他的则会慢慢被遗忘。也就是说,媒体选择报道的内容和人们脑中存在的信息不谋而合,所以专制政体对独立媒体施压的现象也不是偶然的了。因为重大事件和名人很容易引起公众的兴趣,媒体能借此煽动狂潮也就见怪不怪了。例如,在迈克尔 .杰克逊死后的几周里,电视台几乎未报道别的事。相反,媒体对那些带有批评性的、不能引起公众兴趣、掀不起大波澜的事往往很少报道,比如说去年日趋下滑的教育标准,还有医疗资源的投资过剩等。(我在写这篇文章的时候发现自己选择的“很少报道”的例子都是受可得性限制的。我选为例子的话题经常被提到,那些同等重要却不常被提到的事我往往想不到。)

    有一点我们当时并没有充分意识到,即“启发法和成见”这样的心理学概念在其他领域中也具有广泛的启发作用,这便是我们这项研究的一个附带成果:我们总是把为自己和被调查者设计的全部问题都写进文章里,这些问题可以为读者提供范例,使其认识到自己的想法是如何受认知性成见牵绊的。我希望你在读到“史蒂夫是个图书管理员”这样的问题时能有切身的体验,这样能帮助你更好地体会到相似度在引导可能性上的力量,并且能体验到我们多么容易忽略相关事实的统计。

    这些实证材料的使用可为不同领域的学者(主要是哲学家和经济学家)提供一次不寻常的机会,使他们关注自己在思考时可能出现的纰漏。看到自己的纰漏,这些学者才更有可能质疑当时普遍存在的那种武断想法,即人类很理性、很有逻辑性。方法的选择很重要:如果我们只报道传统实验的结果,这篇文章就不会那么令人关注,也不会令人如此难忘了。而且,那些持怀疑态度的读者会将自己的判断失误归咎于参与这些心理学研究的大学生,认为是这些学生一贯不负责任的做法使他们不愿相信实验结果。当然,我们摒弃传统的实验方法,采用事例展示的方式,并非只为影响那些哲学家和经济学家。我们采用这种方法,是因为将事例展示出来更有思。我们很幸运,因为我们选择了正确的方法,其他各方面的选择也做对了。本书重复出现的一个主题就是,幸运在每个成功的事例中都扮演重要角色。我们总能很容易地发现,这个事例中一个小小的改变就会将伟大的成就变得平淡无奇。我们展示的这些事例也不例外。

    对我们研究的反馈也不全是正面的。我们对成见予以关注的做法受到非常多的批评,反对者认为我们过分否定了人类的思维能力。与对常规科学的反应一样,有些研究者对我们的观点加以改进,有些人则另外提出了一些貌似合理的见解,但有一个观点如今是得到普遍认可的,即我们的大脑容易受系统性误差的影响。我们关于判断(能力)的研究对社会科学产生的影响远远超出我们当时的预料。

    研究完判断这一论题后,我们马上将目光转向面对不确定因素时的决策过程。我们的目标是创立一种心理学理论,研究人们在简单的赌博中如何作决定。例如:投硬币时如果是正面朝上你就能得到130美元,背面朝上就输掉100美元,你愿意打这个赌吗?这些简单的选择很久以来一直被用来检验各种与决策相关的问题,例如人们如何在确定的事物和不确定的结果之间进行权衡。我们的研究方法没有变:还是花很多天设计一些选择题,而后分析我们根据直觉进行的选择是否与通过逻辑判断作出的选择一致。在作判断时,我们会观察自己做出决策时出现的系统性成见,还会对一贯违背理性选择规律的直觉性选择进行观察。在《科学》杂志刊出那篇文章5年之后,我们又发表了《前景理论:风险下的决策分析》一文,据统计,该文中提出的决策理论比我们此前对判断的研究更具影响力,该理论也为行为经济学奠定了一定的基础。

    在合作过程中,阿莫斯和我经常交流思想,两个人的智慧总要胜过一个人的想法,良好的关系也使我们的工作有趣且高效,这段时光是我人生中宝贵的财富。后来,我和阿莫斯离得远了,很难继续共同研究这一课题。我们在判断和决策制定方面的研究使我在2002年获得了诺贝尔经济学奖。如果阿莫斯没有于1996年去世(时年59岁)的话,他应该和我一起去领这个奖。

    本书并非为展示我和阿莫斯共同合作的早期研究,过去几年里很多作者已经出色地完成了这项工作。我的主要目标是,在认知心理学和社会心理学最新发展的基础上展示大脑的工作机制,在这些发展中有一些内容比较重要,其中一项就是我们认为瑕瑜互见的直觉思维。

    阿莫斯和我没有对直觉下准确的定义,只简单说明了判断启发法“很有用,但有时也会导致严重的系统性误差”。我们的重点放在成见上,因为在人们的大脑高速运转时研究成见非常有意思,而且成见为启发性判断提供了研究依据。我们没有自问在面对不确定因素时所有的直觉性判断是否都是通过我们研究的启发法而产生的。

    不过现在我们知道事实并非如此。专家们的直觉往往很准确,这种准确性与其说是启发法在发生作用,还不如说是长期实践的结果。我们现在可以描绘一幅更加美好、更加和谐的画面,在这幅画面里,熟练和启发法皆可成为直觉性判断和决策的选择依据。心理学家加里•克莱因(Gary Klein)曾讲过一个故事:一支消防队进入一座房屋,屋子里的厨房着火了。他们刚开始用水管浇厨房,指挥官喊道:“全部撤离!”其实他自己也不知道为什么要这样做。在消防员全部撤离的一刹那,厨房的地板轰然塌陷。事后指挥官才回想自己曾意识到这场火并不大,但他的耳朵特别烤得慌。这些他所谓的“对危险的第六感”闪进他的脑海,虽然不知道哪里不对劲儿,但他知道情况不妙。最后大家才知道这场火灾的火源根本不是厨房,而是消防员脚下的地下室。我们都听过一些关于专家的直觉的故事:比如某位象棋大师路过街边棋局,无须驻足观看就知道“白方三步之内将杀”;又如某位医生只需一瞥便能作出全面的诊断。专家式直觉像谜一样吸引着我们,但它们不是谜。我们每个人每天都会多次表现出很强的直觉能力。大多数人在接电话时听到第一个词就能感知对方是否生气了;刚进门就能发现自己是大家谈论的对象;对细微的信号能迅速做出反应,断定旁边车道上的汽车司机正处于危险中。我们日常的直觉能力并不逊于一位经验丰富的消防员或者医生,只是无处施展罢了。

    魔法不属于准确的直觉心理的范畴。也许对此有最精辟论述的人要数伟大的赫伯特•西蒙(Herbert Simon)了,他对多位象棋大师进行过研究,发现在练习数千个小时之后,这些大师看到的棋盘上的棋子和我们眼里的棋子是不一样的。西蒙写道:“这个棋局已经给了我们提示,根据这个提示我们可以搜寻到大脑存储的信息,而这些信息就能给出答案。直觉只不过是人们的认知而已。”看到这种说法,你也许就能感受到西蒙对神化专家直觉的做法不以为然了。一个两岁的小孩看到一只狗时会说“小狗狗”,这没什么好大惊小怪的,因为我们已经对孩子认识事物并叫出很多事物名字这种“奇迹”习以为常了。西蒙认为灵性的直觉所创造的“奇迹”也是如此,不值得大惊小怪。如果专家在新情境中能察觉熟悉的因素,并且采取十分得体的做法来顺应这种情境,这便是正确的直觉。在喊出“小狗狗”的同时,孩子的大脑中就会出现正确的直觉性判断。

    不幸的是,专业的直觉并非全部是从真实的经验中得来的。很多年前,我采访了一家大型金融公司的首席投资官,他告诉我他刚刚买了福特汽车公司上千万美元的股票。我问他是如何做出这样的决策的,他回答说他刚参加了一个车展,感觉很好。他的解是:“这还用问,他们生产的汽车太霸道了!”他非常明确地说,他相信自己的感觉,他对自己和自己的决定都很满意。我很吃惊地发现,他忽视了一个任何经济学家都会注意到的相关问题,特公司的股票最近不是走低吗?而他反而在跟着自己的直觉行事:他喜欢汽车,喜欢福特公司,也喜欢持有其股票的感觉。按照我们的理解,买入股票要谨慎,这位仁兄恐怕根本不知道自己在做什么。

    关于这位投资官投资福特公司股票的问题,阿莫斯和我所研究的特定启发法恐怕是解释不了了,但现在关于启发法还有一种更宽泛的概念,这种概念能对上述行为作出更好的解释。这一宽泛的概念是一个重大进步,即情感因素在我们对直觉判断和决策的理解上发挥了比以往更大的作用。这位投资官的决策在今天可能会被视为受启发法的影响,而判断和决策是直接受好恶这样的情感所左右的,没有什么思忖和推理可言。

    当碰到像走哪步棋或决定是否投资股票这样的问题时,直觉思维机制就会充分发挥其作用。如果某个人有相关的专业知识,她就能更好地认清情况,头脑中形成的直觉性解决方案也很可能是正确的。象棋大师看到复杂的棋局时大脑会迅速反应:刹那间想到的那几步棋一定是好棋。要是问题很难,一时也想不到巧妙的主意,直觉就可能会发挥作用:脑海里可能马上会有个答案,但这个答案却不一定是原题的答案。这位投资官所面对的问题(我是否要投资福特公司股票)就很难,但更简单且相关的问题(我喜欢福特汽车吗)却很快在他的脑海中形成了答案,并且让他就是否作出投资这个问题也作出了相应的选择。这就是直觉启发法的核心观点:当面对难题时,我们往往会对相对简单的问题进行回答,却忽略了自己已经置换了原始问题这个事实。

    有时,我们无法自然地凭直觉找出问题的解决方案——不论是专业的解决方法还是启发式的答案。在这种情况下,我们往往想要找到一种更慢、更严谨、需要投入更多脑力的思考形式,这就是本书中提到的慢思考。快思考既包括直觉思维的不同形式,比如专家式的和启发式的,也包括感觉和记忆等所有无意识的大脑活动,这些活动会让你知道桌上有盏台灯或者想起俄罗斯首都的名字来。

    在过去的25年里,已经有很多心理学家对快思考和慢思考的区别进行了研究。我用两个因素来描述人的思维活动,即系统1和系统2,在后文中我将对分类原因进行更详细的阐述。系统1和系统2分别产生快思考和慢思考。我认为直觉和严谨思考的特点就像是大脑中两种性格的特征和性情。在近期的研究中,系统1的直觉性作用比我感觉到的还要大,它是做出的决策和判断的幕后主使。本书大部分内容是关于系统1的运作以及系统1和系统2间的相互影响的。

    主要内容

    本书共分为五部分,第一部分讲述的是通过双系统进行判断与做出决策的基本原理。这部分内容详细说明了系统 1的无意识运作和系统2受控制运作的区别,并且说明了系统1的核心,即联想记忆是如何不断对世界上所发生的事作出连贯的解释的。关于直觉性思考的自主且无意识过程的复杂性和丰富程度,以及这些自主过程如何能解释判断的启发法等问题,我试图说出自己的见解,目的是要引入一套用于思考和表达思想的语言。
    第二部分对判断启发法的研究作了更新,还探索了一个难题,即为什么很难具备统计型思维。我们思考时总是会把多种事情联系起来,会将一件事情比喻成另一件,会突然想起一件事来,但统计学要求同一时间把多件事情串联起来,而这一点系统1是做不到的。
    本书第三部分描述了我们大脑有说不清楚的局限:我们对自己认为熟知的事物确信不疑,我们显然无法了解自己的无知程度,无法确切了解自己所生活的这个世界的不确定性。我们总是高估自己对世界的了解,却低估了事件中存在的偶然性。当我们回顾以往时,由于后见之明,对有些事会产生虚幻的确定感,因此我们变得过于自信。我对这个问题的看法受《黑天鹅》(The Black Swan)的作者纳西姆·塔勒布( Nassim Taleb)的影响。我希望我这“饮水机旁的闲谈”能明智地借鉴以往经验, 同时抵制后见之明和虚幻的确定之感的诱惑。
    第四部分的重点是在决策制定的性质和经济因素为理性的前提下讨论经济的原则。1979年,阿莫斯和我发表了关于前景理论的决策模式,此部分在双系统下对前景理论的重要概念提出了新的看法。余下的几章讲的是人们从理性角度出发做出决策的几种方式。可悲的是,人们总是孤立地看待问题,表现出框架效应,即决策的制定往往因为对所回答问题不合逻辑的选择而受到影响。系统1的特征完全能解释这些观察结果,这对标准经济学所倾向的理性假设发起了很大的挑战。
    第五部分是近期研究中关于两个自我的区别性描述,即经验自我和记忆自我,两者间没有共性。例如,我们可以让人们体验两种痛苦。其中一种比另一种要更痛苦,因为体验的时间更长。系统1有一大特点,即记忆的自主形成是有其原则的,如此一来,较为痛苦的那段体验会留下更深刻的记忆。所以,此后当人们选择要回想哪段经历时,他们自然会受记忆自我的引导,将其自身(即经验自我)处于不必要的痛苦中。两种自我间的区别被用来测试人的幸福感,而我们发现使经验自我快乐的事不一定会让记忆自我满足。两种自我同时存在的个体要如何去追求幸福,这一问题引起了把居民的幸福看做政策目标的个人和社会的众多思考。

    最后的章节是按倒叙来探索本书所述的三个区别的:经验自我和记忆自我的区别,古典经济学和和行为经济学(从心理学借鉴而来)的区别,以及自主的系统1和需费脑力的系统2的区别。书中还谈及了有价值的闲谈的好处,以及哪些内容有助于提升判断和自行决策的效能。

    在最后,我附上了我和阿莫斯一起写的两篇文章,第一篇是我早期写的关于在面对不确定性因素时作出判断的评论。第二篇发表于1984年,总结了前景理论和我们关于框架效应的研究成果。文章中有被诺贝尔委员会引用的投稿,你可能会惊讶地发现这些投稿是多么简单。读这些能让你明白我们早期的知识有多少,也能让你知道我们这几十年来的进步有多大。

    第一部分 系统1,系统2

    第1章 一张愤怒的脸和一道乘法题

    想要观察你在自动模式下的大脑活动,请看图1.

    图1

    审视这位女性的脸时,你正在很自然地将我们平时所说的观察和直觉思考结合在一起。你可以确定且迅速地判断这位年轻女性的头发是黑色的,你还知道她正在生气。此外,你还可以根据自己的观察对其行为进行推测。你感觉到这位女性正要说一些刻薄话,也许声音又大又刺耳。推测被观察对象即将做出的举动并不难,这种活动是无意识的,而且毫不费力。你并非有意评论她的情绪或是推测她可能要做的事,你对这张照片的反应跟你做过的事情没有丝毫关系,一切都是自然而然发生的。这就是快思考的一个例子。

    现在,请看下面的问题:

    17×24

    你能立刻知道这是一道乘法题,也许你还会想到若有纸笔,就能算出答案。你还会对答案的大体范围有个模糊的直观认识,能很快知道12 609和123不可能是答案。但如果不花点时间来计算的话,你就无法确定568不是正确答案。由于想不出一个准确的答案,你认为自己得想想是不是要做这道题。如果你还没有做这道题的话,就该试着做一做,哪怕完成其中的一部分也好。

    按部就班的运算过程便是慢思考。首先,你会从记忆中重新提取读书时所学的乘法相关知识,然后加以运用。这个过程不容易,你得记住很多内容,你要知道自己算到哪一步了,知道下一步该怎样做,同时还要记住已得到的结果。这个计算过程是脑力工作,需要刻意、努力并且有序地进行——这也是慢思考的一个特征。这种计算不仅是大脑活动,身体也会参与其中,在计算时你的肌肉会紧张,血压会上升,心跳会加速。若在你解决这个问题时,有人在近处看你的眼睛,他会发现你的瞳孔也会扩大。结束计算时——得出正确答案(顺便提一下,答案是408)或是放弃计算都被视为结束计算——你的瞳孔便会恢复到正常大小。

    行为与注意力

    近几十年来,许多心理学家对人的两种思维模式一直保持着浓厚的兴趣,这两种思维模式是由一张愤怒女性的照片和一道乘法题所引发的,他们还指出了两种模式的许多特征。这里我且采用由心理学家基思·斯坦诺维奇(Keith Stanovich)和理查德·韦斯特(Richard West)率先提出的术语,用以说明大脑中的两套系统,即系统1和系统2.

    ·系统1的运行是无意识且快速的,不怎么费脑力,没有感觉,完全处于自主控制状态。

    ·系统2将注意力转移到需要费脑力的大脑活动上来,例如复杂的运算。系统2的运行通常与行为、选择和专注等主观体验相关联。系统1和系统2的定义广泛应用于心理学领域,但我在本书中所作的阐释更加深入,读者可将此书视为有两个人物的心理剧。

    我们在审视自己时,往往更容易采用系统2,认为自己头脑清醒,富有逻辑,抱有信仰,善作抉择,能够决定自己想要什么和该做些什么。尽管系统2的运行体现在行动中,但自主运行的系统1才是本书的重点。我将系统1描述成自主而初始的印象和感觉,这种印象和感觉是系统2中明确信念的主要来源,也是经过深思熟虑后作出抉择的主要依据。系统1的自主运作诱发了极其复杂的理念模式,但只有相对缓慢的系统2才能按部就班地构建想法。我还描述了继而发生的系统2的环境条件,在此条件下,系统1中随性的冲动及其诱发的联想都会受到抑制。读过此书后,你会觉得这两种系统各有千秋,各司其职。

    依据复杂性进行粗略预估,试举以下系统1引发的自主行为的例子:

    ·确定两件物品孰远孰近。

    ·确定突然出现的声源。

    ·将短语“面包和……”补充完整。 

    ·看到恐怖画面后做出厌恶的表情。

    ·察觉语气中的不友善。

    ·回答2+2=?

    ·读大型广告牌上的字。

    ·在空旷的道路上驾车行驶。

    ·下象棋时看出一步好棋(前提是你是位象棋大师)。

    ·理解简单的句子。

    ·听到“畏首畏尾,追求完美”的说法时,知道其意指古板的员工。

    上述所有思维活动都和那位愤怒的女性相关——这些活动都是自主发生且毫不费力的。系统1的诸多能力当中包括一些与生俱来的能力,这些能力与其他动物的本能一样。我们生来就能感知周围的世界,能够认识事物,可以集中注意力,会规避风险,会害怕蜘蛛,思维时快时慢。大脑的其他思维活动也因长期的训练而变得快速自主。系统1除了能将我们已有的知识(比如法国的首都是哪里)联系起来之外,还能使我们掌握一些技能,比如看出并理解一些社交场合的细微差别。有些技能只有专家才能掌握,比如象棋中出奇制胜的那几招;而其他的技能,普通人都能掌握。例如,要想看出刻板员工的个性有哪些相似之处,还需要我们掌握大量的语言及文化知识,而大多数人都具备这些知识,这些知识就储存在我们的记忆中,不必刻意也无须努力便可随意存取。

    以上列出的大脑活动是完全无意识的。你不必刻意学习便可领会一些母语中的简单句子;听到突然的一声响后会自发地确定声源;看到“2+2”就知道等于4;提到法国的首都时会不由自主地想到巴黎。其他一些行为可能会受到大脑的控制,比如咀嚼的动作,但大体上还是无意识的。系统1和系统2这两个系统都对注意力有控制作用。确定声源位置通常是在系统1控制下的无意识活动,随后系统2会立即被激发,产生有意识的注意力。拥挤的派对上,你也许会对大声而无礼的谈话置之不理,不过,即使你的头没转过去,你的注意力也已经转移过去了,哪怕只有一会儿。但是,要想将注意力从不想关注的对象上转移开来也容易,去关注另一个目标即可。

    系统2的运作是高度多样化的,但所有这些运作方式都有一个共同特征:所有运作都需要集中注意力,如若注意力分散,运作也会随之中断。以下是一些例子:

    ·赛跑时随时作好起跑准备。

    ·关注马戏团里的小丑。

    ·在一间嘈杂、拥挤的屋子里关注某个人的声音。

    ·寻找某位白头发的妇女。

    ·搜寻大脑记忆,判定声音是否表达惊喜。

    ·保持比平常快的步行速度。

    ·观察自己在社交场合的做法是否得体。

    ·数出文章中某页字母a的出现次数。

    ·告诉某人你的电话号码。

    ·在狭小的空间里停车(除车库管理员外,大多数人停车的车位都很狭窄)。

    ·比较两款洗衣机的总体功效。

    ·填纳税申报表。

    ·检验一个复杂的逻辑论证的有效性。

    在上述各种场景中,你都必须集中注意力。若是没有准备好或者没有将注意力集中到正在做的事情上,你的表现就会差强人意,甚至是一塌糊涂。系统2具有某些改变系统1运作方式的能力,通过控制注意力和记忆力的一般自主运行功能的方法可以实现这些改变。例如,在繁忙的火车站等亲戚时,你若是刻意去找某位头发花白的妇女或是长着胡子的人,即使隔着一段距离你也很可能发现自己的亲戚;你也可以在记忆中搜寻哪些国家的首都是以字母N开头的,或者法国有哪些存在主义小说;而当你在伦敦希斯罗机场租车时,地勤人员很有可能会提醒你“在我们国家是右驾左行”。

    在上述所有事例中,没有哪件事情是水到渠成的,你会发现始终如一地保持某种状态需要付出持之以恒的努力,至少要一直耗费精力。

    “注意力要集中”,这个耳熟能详的短语是很有道理的,如果你将原本应分配给某些活动的注意力分散开来,如果分散掉的注意力有限,还可以接受;但是如果你想透支你的注意力,将其过度分散到其他事情上,结果就会失败。这证明了有些费脑力的活动会相互影响,也说明了为什么同时进行几项活动很难,甚至是不可能的。就如同你不能一边向左转入路线复杂的道路,一边计算“17×24”这道乘法题的结果一样,两者无法兼做。当然了,最好还是不要尝试。你可以同时做几件事情,但前提是这些事简单易懂,你可以在空旷的高速公路上一边开车一边和别人交谈而不出事故。有些家长可能会感到有些愧疚,因为他们在给孩子读故事时,脑子里还在想别的事。

    每个人都能多多少少地意识到注意力是有限的,在社会生活中我们也会为此作出妥协。例如,当司机正在一条匝道上赶超一辆卡车时,车上的成年乘客会明智地停止与司机攀谈,因为他们清楚地知道,在这个时候让司机分心并不是什么好事,而且他们会认为司机此时会屏蔽掉别人的话语,仿佛暂时性失聪一般。

    当人们太过专注于某件事时,就会屏蔽掉其他事情,即使是平时很感兴趣的事也不例外。在《看不见的大猩猩》(The Invisible Gorilla)一书中,克里斯托弗 ·查布里斯(Christopher Chabris)和丹尼尔 ·西蒙斯(Daniel Simons)两位作者为我们提供了一个最具戏剧性的证明。他们设计了一部两队传篮球的短片,其中一队穿的是白色球衣,另一队穿的是黑色球衣。观看短片的人需要数出白衣球队的传球次数,忽略掉另一队传的球。这个任务比较困难,需要完全投入才行。短片播到一半时,一个套着大猩猩服装的女人出现了,她穿过球场,捶着胸,然后继续走动。这只“猩猩”出现了9秒钟。上万人看了这部短片,其中约有一半人并未注意到有什么异。之所以这样,是因为这个计数任务——尤其是那个忽略黑衣球队的要求——造成了这种屏蔽。若没有那项任务,所有观看短片的人都会注意到那只“猩猩”。观看和定位是系统1的自动功能,但在执行时需要将一些注意力分配给相关的刺激物。该书的两位作者提到,在这项研究中,最值得注意的是人们在知道结果后的吃惊反应。那些没有看到“猩猩”的观众刚开始就确信场上没有“猩猩”——他们很难想象自己会错过这件吸引人眼球的事。这个关于“猩猩”的研究阐述了与我们大脑相关的两个重要事实:我们会忽视显而易见的事,也会忽视自己屏蔽了这些事的事实。

    系统1遇到麻烦,系统2会出面解决

    本书紧扣两个系统相互作用这一主题,其内容与结构简洁明了。在书中我将指出,当我们醒着时,系统1和系统2都处于活跃状态。系统1是自主运行,而系统2则通常处于不费力的放松状态,运行时只有部分能力参与。系统1不断为系统2提供印象、直觉、意向和感觉等信息。如果系统2接收了这些信息,则会将印象、直觉等转变为信念,将冲动转化为自主行为。通常情况下,一切都会顺利进行,系统2会稍微调整或是毫无保留地接受系统1的建议。因此,你一般会相信自己的最初印象,并依自己的想法行动。通常情况下,这样也挺好的。

    当系统1的运行遇到阻碍时,便会向系统2寻求支持,请求系统2给出更为详细和明确的处理方式来解决当前问题。系统2在系统1无法提供问题答案时,就会被激活,这好比你碰到了“17×24”这样的乘法题,系统1无法给出答案,系统2便被激活来解决问题。当你遇到令人吃惊的事情时,同样会感到自己有意识的那部分注意力会瞬间激增。另外,在系统1所设定的世界里,电灯不会跳,猫不会像狗一样汪汪叫,“猩猩”也不会穿过篮球场。如若事物违反了系统1所设定的关于世界的模式,系统2同样会被激活。

    “猩猩”的实验表明,想要察觉到令人惊讶的刺激物,就要对其予以关注。然后,那种惊讶会激发并引导你的注意力:你会将目光集中在令你瞠目的对象身上,并在记忆中搜寻此事令人惊讶的原因。系统2还会起到持续监督你自身行为的作用——有了它,你在生气时也能保持应有的礼节;有了它,你在夜晚开车时也能保持警惕。

    当你就要犯错时,系统2就会受到刺激,加速运作。回想一下,在冒犯别人的话即将脱口而出时,想把话咽回去是多么困难。总的来说,你(或你的系统2)所想所做的大多数事情都是由系统1引起的,但当事情变得困难时,系统2便会接手难题,系统2出马,所有事情都会迎刃而解。

    系统1和系统2的分工是非常高效的:代价最小,效果最好。通常情况下,这种分工很有效,因为系统1很善于完成自己的本职工作:它在熟悉情境中采取的模式是精确的,所作出的短期预测是准确的,遇到挑战时做出的第一反应也是迅速且基本恰当的。然而,系统1存在成见,在很多特定的情况下,这一系统易犯系统性错误。

    你会发现这个系统有时候会将原本较难的问题作简单化处理,对于逻辑学和统计学问题,它几乎一无所知。系统1还有一个更大的局限,即我们无法关闭它。如果看到屏幕上显示一个你认识的单词,你就能读出这个词—除非你的心思完全不在它上面。

    冲突与自我控制

    图2是由一个经典的实验演变而来的,说明了两个系统之间的冲突。你可以先试着做做下面这个练习,然后再接着往下读。

    你的第一个任务是先浏览一下下面这些文字,说出哪些字较小,哪些字较大。完成第一个任务后,再看一遍这些字,说出每一个字的位置。如若字的位置偏左,则说(默默自语)“左”;如若字的位置偏右,则说“右”。

    图2

    图2在这两个任务中,你几乎可以正确无误地读出所有字,并且还会发现,两项任务中各有一部分要求比其他要求简单些。当你确认字的大小时,会发现左边一栏相对简单,而在指出右边一栏的字号大小时,速度则会变慢,甚至还会出现不确定的情形。而当你确定单词位置时,确定左边一栏时比较困难,右边一栏相对简单些。

    这些任务都需要系统2的参与,因为读出“高 /低”或是“左 /右”和平时由上到下看一列字根本就是两回事。要完成这项任务,你所做的事情中要包括为记忆编程,使相关的字(例如第一个任务中的高和低)能够“脱口而出”。浏览右边一栏文字的时候,你能很快读出该任务所选文字,不大可能将其读成其他文字。但左边一栏文字却有所不同,因为其中所包含的文字与任务所设定的要求是重叠的。你无法忽略掉这样的干扰。通常情况下,你能做出正确的回应,但战胜脑中两种相互冲突的反应会给你造成压力,使你的速度减缓。这便如同经历了一场斗争,斗争双方分别是你打算完成的任务和影响任务完成的自主反应。自主反应和控制这种反应的意图之间存在冲突,这种冲突在生活中极为普遍。我们差不多都有过这样的经历:在餐厅里,自己的邻座是一对穿着怪异的夫妻,但我们会尽量不去盯着他们看。我们也清楚,如果看书时老是重读不知所云的内容,这就说明我们在强迫自己去读一本无聊的书。在冬季严寒的地区,许多司机都有着这样的记忆:当他们的车在冰上滑行失去控制时,他们必须放弃平时的做法,竭力去按照已反复演练过的指示进行操作:“如果车打滑,做什么都行,就是别踩刹车!”另外,每一个人都有强忍着不诅咒别人去死的经历。系统2的众多任务中就包括抑制系统1产生的这些冲动。换句话说,系统2负责人们的自我控制。

    看上去不等长实际上等长的两条线

    为了理解系统1的自主性以及印象和信念的区别,请你仔细看看图 3。

    图3

    这幅图没有什么特别之处:两条不同长度的水平线,两端有朝向不同方向的箭头,并且下面一条线明显比上面那条线长。这是我们看到的所有内容,而且我们肯定相信自己的眼睛。但是,如果你曾经见过这幅图,就会认出这便是那幅著名的缪勒 –莱耶错觉图,要证实这一错觉很简单,只需要找把尺子量一量,你就会发现其实两条水平线是等长的。

    既然测量了这两条线的长度,你——你的系统2,即你称为“自我”的意识体—就会有一个新的信念:你知道这两条线是等长的。当被问及它们的长度时,你也会如实说。然而,你肉眼所见的依然是下面那条线比较长。你选择相信测量的结果,但无法控制住系统1带给你的直观感受,即使你知道这两条线长度相同,但是仍然无法把它们视为等长的线。想要消除这种错觉,唯一能做的就是当你再看到两条平行线,并且线的两端有朝向不同方向的箭头时,必须学会怀疑自己的感觉。要贯彻这一规则,你必须具备识别这种错觉模式的能力,能够回忆起你所了解的相关知识。如果可以做到这一点,你就再也不会掉入缪勒 –莱耶错觉的陷阱了。但是,你眼中所见的两条线肯定还是一条长一条短。

    不是所有错觉都是视觉上的,还有思维方面的,我们将其称为认知错觉。我读研究生的时候,选修了一些与心理疗法的艺术及科学相关的课程。记得有一次上课时,老师跟我们分享了一些坐诊艺术。他告诉我们:“有时,你会碰到一两个这样的病人—他会像说故事一样,讲述自己以前遭遇的误诊,这些诊断五花八门,让人担心。他看过几个临床医生,但都没多大效果。这个病人还能清楚地描述医生是如何误解他的,但他很快就观察到,你和其他医生是不一样的,你能感同身受,充分理解他,并可以为他提供帮助。”此时,我的老师提高了音量,继续讲道:“千万别有接收这个病人的想法!将他赶走!他很有可能是位精神病患者,而且你也帮不了他。”

    多年以后,我才知道那位老师当时是在提醒我们,要提防病态的假象。精神病研究领域的权威也证实了我们那位老师所给的建议是合理的。这与缪勒–莱耶错觉类似。没人教过我们如何体会患者的心情。所以我们的老师断言,我们对那位患者的同情心是不由自主的,这种同情心可能源自系统1.此外,也没有人教过我们不要总是相信自己对患者的感情。有人告诉我们,过多关注一个有数次治疗失败经历的病人是一种危险的信号—正如平行线两端的箭头一样,会让人产生错觉。这是一种认知错觉。我的老师教过我(系统2)如何识别这种错觉,也曾告诉我切莫相信这种感觉,更不要依照感觉行事。

    提到认知错觉,最常被问及的问题就是能否避免这种错觉。上述各例传达的信息不容乐观。因为系统1是自主运行的,我们无法随意使其停止,因此直观思维所导致的错误常常难以避免。我们不可能一直没有成见,因为系统2可能对系统1产生的错误毫无所知。即使对可能发生的错误有所察觉,也需要系统2进行强有力的调控和积极的运作才有可能避免。然而,作为一种生活方式,时刻保持警觉性并不是一件好事,想要这样做也并不实际。总是质疑自己的想法会使我们的生活非常枯燥乏味,因为系统2在代替系统1进行日常抉择时总是耗时很长且非常低效。最好的解决办法就是妥协:学会区别常会出现重大错误的情境,在风险很高的时候,尽力避免这些错误。前文中曾提到过,发现别人的错误总比发现自己的错误更容易。

    两个虚拟出来的角色

    你可以将上述两个系统想象为大脑内部的两个人,他们有着各自不同的特征、能力和局限性。在书中我常会将这两个系统当做一些句子的主语,例如“系统2统计产品数量”。

    在我所在的职业圈子中,使用这样的语言被视为一种过错,因为这种说法貌似通过一个人头脑中那两个小人的思维和行为去解释这个人的思维和行为。从语法上讲,这个关于系统2的句子与“管家监守自盗”的句型类似。我的同事指出,管家的行为实际上就解释了现金的丢失原因,由此他们也很怀疑关于系统2的那个句子同样解释了算错产品数量的原因。我的回答是,这个短小的主动句认为统计是系统2所为,而且这个句子是一种描述而不是一种解释。这样的描述只有在你已经对系统2有一定的了解后才有意义。看看下面这段让人纠结的话吧:“心算是一个需要作出努力的自主活动,人在心算时总会瞳孔放大,心跳加速,因此你绝对不能一边开车左转,一边心算得出结果。”

    同样,“通常情况下,在高速路上行驶的任务要留给系统1来完成”这句话说明驾驶这辆车转弯是自主行为,不用费脑力,也意味着一个驾车新手能够一边与别人攀谈,一边轻松地在空旷的高速路上行驶。最后,“系统2防止了詹姆士因为受到侮辱而做出愚蠢的举动”这句话则表明,如果其努力自控的行为受到干扰(比如他喝醉了),詹姆士就应该会有过分的举动。

    尽管系统1和系统2是本书的主题,但我必须要澄清一个事实,即两个系统并不是真实存在的,它们只是我杜撰出来的角色。系统1和系统2不是标准意义上的实体,没有错综复杂的组成部分,也不是大脑中某个固定的部位。你有可能会问:为什么要在如此严谨的一本书中引进两个名字并不漂亮的虚拟角色呢?答案很简单,这两个角色很重要,因为我们每个人都会有些奇特的想法无法解释。一个句子若是讲一个客体(系统2)做什么,则要比对这个客体及其特征进行描述更容易理解。换句话说,“系统2”比“心算”更适合当句子的主语。我们的大脑,特别是系统1,似乎拥有一些特别的能力,能够构想和领会施动者的故事。这些施动者有其特有的特征、习惯和能力。你很快就会对那个监守自盗的男管家产生坏印象,认为他还会继续偷盗,

    而且你暂时无法忘掉这个人。这也是我对这两个系统语言所寄予的希望。

    为什么将两个系统命名为系统1和系统2,而不是“自主系统”和“耗力系统”呢?原因很简单:说出“自主系统”比说出“系统1”所需的时间长,因此会占用更多大脑工作记忆(短时记忆)的空间。这一点很重要,因为任何事物占用了大脑的工作记忆,都会削弱你的思考能力。你可以将“系统1”和“系统2”当做昵称,就像鲍勃和乔一样,用这种拟人的方式去了解整本书中出现的各种角色。有了这两个虚拟的系统,我便能更从容地思考有关判断与决策的问题,而你也能更轻松地读懂我的文字。

    示例—系统1和系统2“他有印象,只是其中一部分是幻象。”“这纯粹是系统1的反应,她在意识到危险之前就果断采取了行动。”“这是你系统1的想法,放慢速度,听听系统2的看法吧。”第2章 电影的主角与配角

    虽说不太可能,但假设本书真的被拍成电影的话,自视为主角的系统2一定只能做个配角。在这个故事中,系统2的典型特征表现在其各项活动都需要努力,但其自身却很懒惰,除了必需的努力外,它不愿多付出,哪怕是一点点。因此,虽然系统2认为是自己选择了人们的想法和行为,可实际上,这些选择都是在系统1的引导下完成的,系统1才是这个故事的真正主角。然而,一些至关重要的任务却只有系统2才能执行,因为这些任务需要付出努力和控制自我,由此方可抑制系统1产生的直觉和冲动。

    瞳孔是人类思维活动的灵敏指示器

    如果想让你的系统2全力运转,你可以做做下面的练习。这个练习会让你在5秒钟之内达到认知能力的极限。首先,编一串不同的4位数数字,并将这些数字写在一张索引卡上。然后,在桌上放一张空白的卡片。你即将要执行的任务叫做加1,以下是其具体做法:

    敲打出稳定的节奏(最好是有一个节拍器,并将其设定为一秒一拍)。移动空白卡纸,大声读出数字。然后等待两个节拍,说出一个新的数字(这个数字是将原来那个数字的每一位都加1得来的)。例如:卡片上的数字是5294,新的数字就应该是6305。另外,跟上节奏很重要。

    很少有人在加1任务中能胜任超过4位数的数字,但如果你想挑战一下自己,可以尝试一下加3的任务。

    如果想知道大脑在快速运转时身体正在干些什么的话,你可以这样做:在书桌上堆两摞书,将你的下巴放在其中一摞上,将一台摄像机放在另一摞上。打开摄像机,在你做加1或加3任务时,盯着摄像机的镜头看。然后,你可以通过摄像机真实的记录发现,你的瞳孔大小会随着你的努力程度而变化。

    很久以前,我就开始练习加1任务了。在我职业生涯的早期,作为研究催眠实验的访问学者,我在密歇根大学待了一年。在寻找有意义的研究课题时,我在《科学美国人》(Scientific American)杂志中看到了心理学家埃克哈特·赫斯(Eckhard Hess)的一篇文章。该文章指出,瞳孔是人类心灵的窗户。最近,我又读了一遍这篇文章,备受启发。赫斯在文章的开头说道,他的妻子注意到当他在观赏美丽的风景图片时,瞳孔会扩大。文章结束处有两张吸引人的照片,照片是同一个漂亮女人,但其中一张照片中的她显得比另一张中的更加漂亮。造成这种不同的唯一原因是:在更漂亮的那张照片中,女人的瞳孔比较大,而另一张的瞳孔比较小。赫斯在文章中还提到了颠茄(belladona)—一种使人瞳孔变大的物质,曾作美瞳之用。作者还提到,一些常去赶集的人常常戴着墨镜,因为这样就能隐藏自己对商品的兴趣了。

    赫斯的一个发现让我特别感兴趣。他发现瞳孔就像是大脑运转情况的灵敏指示器—它们在人们进行乘法运算时会扩散,在人们解决更为困难的问题时扩散得更大。他的观察还表明,对脑力工作的回应与唤起情感是不同的。赫斯的这篇文章与催眠关系不大,但我认为,“大脑活动是可以看见的”这一想法是个值得研究的课题。杰克逊·比提(Jackson Beatty)是实验室里的一个研究生,他对这个课题同样很感兴趣。于是,我们一起展开了研究。

    比提和我设计了一个类似于验光仪器的装置,受试者可将头倚在可固定住下巴和前额的支架上,然后一边盯着镜头,一边听事先录好的问题,并跟着节拍器的节拍回答这些问题。每一个节拍都会触发红外闪光拍照。在每期实验结束时,我们都会很快把照片冲洗出来,并将它们投影到屏幕上,然后用尺子测量瞳孔大小。这种方法对年轻人和没有耐心的研究者而言都很适用:我们能很快知道实验的结果,而且这些结果总能说明一些问题。

    比提和我很关注有节奏的任务,例如在加1任务中,我们能准确地了解受试者每时每刻的大脑活动。我们记录了跟着节拍器说出的一串数字,并指示受试者在保持节奏的情况下,逐一重复或是转换这些数字。我们很快发现,瞳孔的大小会逐秒发生变化,这也就反映了任务的难度在不断变化。瞳孔随时间变化的曲线图最后呈倒V字形。如果去做加1和加3任务,你会发现每听到一个新数字,任务难度就会加大一些,最后达到一个几乎令人难以接受的极限。那时,你会在节拍中或停顿时极快地说出转换后的数字,这就相当于“释放”了自己的短时记忆,然后,你才渐渐感到放松了一些。瞳孔大小的数据与受试者的体验非常吻合:数字位数越多,瞳孔扩散得越大;任务的难度与付出的努力相符合;瞳孔扩散到最大的时候也正是付出努力最多的时候。与立刻重复一个7位数相比,4位数的加1任务会使瞳孔扩散得更大。加3任务则更为困难,这项任务是我所观察到的要求最高的任务。仅仅在前5秒钟,瞳孔就扩散了50%,心跳每分钟增加了7拍。这是一个人能达到的最大工作极限—如果超过这个极限,人们就会自动放弃。当我们给实验受试者的数字超过他们所能承受的范围时,他们的瞳孔就会停止扩散或是收缩。

    我们在宽敞的地下室套间里工作了几个月,套间里有相关闭路系统,可以将受试者的瞳孔投影在走廊的屏幕上;我们同时还可以听到实验室里的情况。投射出来的瞳孔直径大约是一英尺;观察受试者工作时的瞳孔变化是件非常有趣的事,引得那些来我们实验室参观的人纷纷驻足。我们预测受试者何时会放弃任务,自娱的同时也给参观者留下了深刻的印象。在心算一道乘法题时,受试者的瞳孔会在几秒之内变大并保持那样的大小,直到她算出答案或是放弃。我们在走廊里观察这些瞳孔时,时常会让受试者和参观者感到惊讶。我们会问受试者:“为什么你刚才停下来了呢?”

    实验室里的人经常会问:“你是怎么知道的?”我们回答:“因为我们看见了你心灵的窗户。”

    我们在走廊里随意的观察有时和正式的实验一样能说明问题。在两个任务的间隙,我随意看了一下某位女性的瞳孔。她把头放在了装置上,所以当她与实验人员进行例行谈话时,我能够观察到她的瞳孔变化。我惊讶地发现,她的瞳孔并没有伴随谈话和倾听而发生明显的扩散或收缩。与我们研究的任务不同的是,平常的谈话明显只需要一点努力或是完全不费力—不会比记住两位或三位数需要的精力多。这是灵感迸发的时刻:我意识到我们选择研究的任务全都是需要付出特别多努力的。我的脑中闪现一个想法:我们大脑的生活步调(现在我爱用系统2的生活步调来代替)大多像是在悠闲地散步,有时候会变成慢跑,只有在极少数的情况下,才会如短跑冲刺。

    执行加1和加3任务时,大脑就像是在短跑冲刺;而平时随意的聊天,大脑就如同在漫步。

    我们发现,如果人的大脑正处于冲刺的状态,就有可能(对次要信息)产生有效的屏蔽。前文提到的《看不见的大猩猩》一书的作者就是通过让观察者持续专注于数传球次数而对那只“猩猩”视而不见的。我们通过加1任务提供了一个不那么夸张的例子。当受试者在执行加1任务时,我们会给他们看一串快速闪过的字母。我们要求受试者对加1的数字任务给予充分的重视,但是在这个任务即将结束时,他们也需要说出字母K是否在整个实验中出现过。这个实验的主要发现是,人们锁定和报告指定字母的能力在执行任务的10秒钟内发生了变化。如果字母K出现在加1任务的开始或结尾,几乎所有观察者都不会错过,但如果字母K出现在大脑活动最为频繁的中间时段,就算彼时他们正睁大眼直直地盯着这个字母,也会生生错过它。没能发现字母K的线形图与瞳孔大小变化所呈现的倒V形是一致的,这种一致性再次证明:瞳孔是衡量与思维活动形影不离的生理刺激的标尺,我们可以通过瞳孔了解大脑的运行状况。

    就像是你家或公寓外安装的电表一样,瞳孔提供了一个关于你大脑使用率的参数。这个类比还可以有更深入的解释。你的用电量取决于你用电来做什么,是开灯还是烤面包。当你打开电灯或是烤面包机时,你就会获得所需要的电量。同样,我们也能决定自己要做什么,但做成这件事得花多少精力我们就说不准了。假设你见到一个4位数,比如9462,然后被告知,你的性命就取决于是否能在10秒内记住这个数字。无论你多想活下去,付出的努力也不会比用同样数字执行加3任务时付出的多。

    系统2和你家里的电表能力都有限,但它们对超负荷的负载反应不同。当用电超负荷时,断路器会跳闸,致使那条线路上的所有电器都断电。相反,如果大脑的使用超负荷,其处理则是有选择性且精确的:系统2会偏向最重要的活动,因此这个活动会得到其所需的注意力,其他“多出来的”注意力再慢慢被分配到其他任务中去。

    我们所做的猩猩实验要求受试者更加关注数字任务。我们确信他们按要求完成了任务,因为可视目标(指“猩猩”)出现的时候并没有对主要任务造成影响。如果那个关键字母K是在大脑活动量最大的时刻闪现的,受试者往往会将其屏蔽掉。而当数字转换任务要求并不那么高时,受试者就更有可能觉察到这个字母。

    注意力这种精细的分配是在大脑漫长的进化过程中形成的。快速判断最严重的困难或者快速锁定最佳时机并做出迅速反应能提高生存概率。当然,这种能力并不专属于人类。即使在现代人中,系统1也会承担起应对突发情况的任务,完成自我保护的最高使命。试想在开车时,车意外地滑到了一大片油区,你会发现,在充分意识到这一点之前,你就已经采取了躲避危险的行为。

    比提和我在一起工作的时间只有一年,但我们的合作对于各自今后的职业生涯都产生了很大的影响。他最终成为“认知瞳孔测量法”的权威,而我则写了《注意与努力》(Attention and Effort)一书。这本书在很大程度上是以我们此前的共同研究为基础而写的,与我后来在哈佛大学所作的后续研究也密不可分。通过类型多样的任务来测量瞳孔大小,我们知道了许多关于大脑工作的知识(现在我都把工作中的大脑视为系统2)。

    当你对执行一个任务越来越熟练时,需要付出的努力程度就会降低。对大脑的各项研究证明,与行动相关的活动模式会随着熟练程度的加强而变化,一些大脑区域将不再参与其中。天才也是如此。通过观察瞳孔变化和大脑活动,我们发现高智商的人往往需要较少的努力便可解决同样的问题。普遍的“最省力法则”不仅适用于体力活儿,还适用于我们的认知行为。这个法则主张,如果达成同一个目标的方法有多种,人们往往会选择最简单的那一种。在经济行为中,付出就是成本,学习技能是为了追求利益和成本的平衡。因为懒惰是人类的本性。

    我们研究的这些任务对瞳孔变化的影响差别很大。从基本水平来看,我们的受试者都是清醒的、有意识的,并时刻准备好投入到任务中去—也许觉醒水平和认知准备比平时还高、还充分。记住一位数或两位数或是学会将数字与词汇相联系(比如3=门)会对基准线以上的记忆觉醒产生确切的效果。但是,这样做收效甚微,只有5%的瞳孔直径增大与加3任务有关。鉴别两个音调高低的任务也能有效地使瞳孔扩大。最近的研究还表明,抑制住自己读出干扰性单词的倾向同样会产生一定的效果,而在短时间内记住6位或7位数字则需付出更多精力。如你所体验到的那样,当被要求说出你的电话号码或是爱人的生日时,你需要作一番简单却重要的努力,因为你的回应是有逻辑的,你必须将整串数字记在脑中。而心算两位数的乘法题和加3任务则已经接近人们能够做到的极限。

    为什么我们看不见那只“大猩猩”?

    是什么原因使某些认知任务较其他的更加困难、更需付出努力呢?若注意力是种货币,那我们要买些什么样的产品呢?什么又是系统2能做而系统1不能做的呢?我们现在对这些问题给出假设性的回答。

    想要同时记住不同的想法也需要耗费精力,其中有些想法需要按不同方案实施,另一些想法则需与一定的规则结合起来实施—在进超市前重新核实你的购物单,在餐馆吃饭时,在鱼和牛肉之间进行选择,或是根据小样本得来的信息归纳出一个令人惊喜的结果等,都属于此类实例。系统2是唯一一个可以按规则运行、能根据属性来对比物品、能深思熟虑作出选择的系统。自动运行的系统1不具备这些能力。系统1能察觉简单的关系(比如“他们长得一模一样”,“儿子比父亲高得多”),还擅长整合关于一件事的所有信息,但不能快速处理多个独立的话题,也不能利用纯粹的统计学信息。如果一个人被描述成“本性怯懦,做事井井有条,循规蹈矩,关注细节”,系统1就会认为这个人像是个图书管理员,但系统2在结合了直觉以及图书管理员人数少的这个事实进行思考过后,却不会这样认为。只有系统2才能作这种判断。

    系统2一个非常重要的才能是它能够处理“多重任务”,它可以提取记忆去执行抑制习惯性反应的指令。考虑以下的任务:数出这一页“的”字出现的次数。这个任务你以前从来没有做过,做起来很难得心应手,但是你的系统2却可以应付得来。着手这个练习并非易事,尽管在练习的过程中你会有所提高,但真正完成这项任务会很吃力。心理学家用“执行控制”来描述多重任务的执行和最终完成,神经系统科学家已经确认了大脑中负责执行功能的主要区域。当有冲突需要平息的时候,其中一部分区域也会活跃起来。另一部分是大脑前额叶,人类的这个区域要比其他灵长类的更为发达,它是与智力密切相关的重要脑区。

    现在,假设你在看完这一页时,接到了另一个指示:数出下一页有多少个逗号。这项任务更加困难,因为你还要克制住不久前形成的倾向,即将注意力集中在“的”字上。近几十年来,认知心理学家们有很多重大发现,其中一项就是:从一个任务转换到另一个任务上需要付出努力,在时间紧迫的情况下尤其如此。完成加3任务和心算乘法之所以困难,也是因为两项任务都需要快速转换。要完成加3任务,你必须同时在工作记忆中储存好几个数字,并且每个数字都要与一个特定的运行过程相联系:得记住转换完的数字以便稍后说出来,一个数字正在转换中,还有一些数字正等着被转换。当前关于工作记忆的测试要求个人在两个高要求的任务间不停地转换,在记住其中一个结果的同时,还要执行另一个任务。能够很好完成这些测试的人大都能在一般智力测试中取得好成绩。然而,是否能够控制自己的注意力并不是一般智力的衡量标准。要想预测空中交通指挥员和以色列空军飞行员的表现,衡量他们控制注意力的能力比让他们作智力测试更为有效。

    时间制约是人们付出努力的另一个驱动因素。执行加3任务时,你的匆忙一方面是因为节拍器,另一方面是因为记忆负荷。你就好比是同时向空中抛出好几个球的马戏团演员,无法承担减速的后果。记忆减退的速率催促你的步调,迫使你在完全忘记这些信息前不断进行更新和演练。任何需要你同时记住许多想法的任务都是匆忙的。除非你运气较好,有很大的工作记忆容量,否则你就只能硬着头皮继续工作。慢思考最耗费脑力的思考形式就是那些催你思考的形式。

    你肯定已注意到,在执行加3任务时,你的大脑会不同寻常地高速运作。即使你靠脑力劳动谋生,在日常工作中也极少有类似加3或是类似马上记住6位数这样极具挑战性的任务。我们通常会分几个简单的步骤来执行任务,以避免大脑超负荷运行。这样的话,我们可以将中间结果储存在长期记忆中或是记在纸上,而不是简单地堆积在工作记忆中。我们不紧不慢地绕着远路向目标靠近,通过最省力法则来管理我们的思维活动。

    示例—注意力和努力“我不会在开车的时候想破脑袋去解决这个问题。这是一个会使瞳孔扩散的任务,太费神了!”“他在运用最省力法则,能不多想就不多想。”“她没有忘记开会的事,只是会议开始时她完全在想别的事情,根本没有听到你在说什么。”“我的脑海中最先出现的想法是来自系统1的直觉。我必须得从头到尾思索一遍,三思而后行。”第3章 惰性思维与延迟满足的矛盾

    我每年都要在伯克利待上几个月,在那里,我最大的乐趣就是每天在山间小路上散步4英里,领略旧金山湾的风景。通常我会记录散步所用的时间,也由此对自己在这个过程中所付出的努力有相当的了解。我发现自己大概用17分钟就可以走完1英里的路程。当然我也耗费了体力,以这一速度行走比我坐在靠椅上要消耗更多的热量,但行走中我并没有感受到精神压力,也没有内心矛盾,更无须催促自己前行。以这个速度散步,我还能边走路边思考。事实上,我觉得散步能唤醒身体的感应,使大脑思维更加敏锐。

    系统2也有一个自然的速度。大脑没有专门处理某项任务时,你可以分些精力随意观察自己周围发生了什么。除非你非常小心谨慎,或者自我意识很强,否则观察周围环境或大脑的活动是不需要付出太多努力的。开车时你就能做出一些小决策,读报纸时也能汲取一些信息,和爱人或同事随意说说每天的开心事等,这些都不需要付出多少努力,也没有什么压力,跟散步没什么两样。

    边散步边思考其实是一件很轻松、很惬意的事,但在某些极端情况下,这些活动似乎在争夺系统2有限的资源。只需一个简单的实验就可证实这个假设:在和朋友悠闲地散步时让他心算出“23×78”的结果,而且要立刻就算出来,这时他肯定会停下脚步来算。我的体会是,我可以在散步时思考,却无法利用短时记忆来完成这样一项复杂的心算任务。如果我必须在规定时间内构建一个复杂的理论,我希望无人打扰,而且坐着思考要比站着强。当然,不是所有的慢思考都必须要集中精力、认真计算的。和阿莫斯悠闲散步就是我人生中的最佳思考时间。

    加快散步速度会完全改变我的散步体验,因为加快速度会使我的连贯思考能力明显下降。只要一提速,我就要注意逐渐加快行走速度,要刻意保持更快的速度,将一连串想法加以总结的能力便相应下降了。我在山上行走能保持的最快速度是每14分钟走完1英里,不过这样一来,我根本什么事都想不了。沿着小路快速行走不仅要付出体力,还需要大脑的自我控制,以防止自己减速。自我控制和仔细思考很明显要抢夺努力的有限预算。

    通常情况下,大多数人保持连贯的思维或时不时积极思考都需要自我控制力。尽管没有作过系统的研究,但我认为,不断转换任务和提高大脑运转速度从本质上说是不会让人感到快乐的,人们总是尽可能避开这种情况,这就说明了为什么最省力法则能成为法则。即使没有时间的限制,保持连贯的思维也需要此法则。有人曾观察并记录我写作的一个小时内查收电子邮件或打开冰箱的次数,这可以说明我想要逃离写作的欲望,也可以得出一个结论—我的自我控制力完全达不到工作的要求。

    好在并不是所有认知工作都令人厌恶,有时并不需要意志力的支撑,人们也能花很长时间和大量精力进行一项工作。心理学家米哈里·契克森米哈(Mihaly Csikszentmihalyi)对这种无须作出努力的状态的研究比别人都多,他将这种状态命名为心流,而且此名称已成为一个心理学术语了。体验过心流的人将其描述为“一种将大脑注意力毫不费力地集中起来的状态,这种状态可以使人忘却时间的概念,忘掉自己,也忘掉自身问题”,他们对这种状态所带来的愉悦感的描述非常吸引人,米哈里称之为“最优体验”。很多活动都能带来心流体验,不论是画画还是摩托车比赛。我认识几个作者,出书就是他们的最优体验。对于一个作者而言,这样容易满足是件幸事。心流巧妙地区分了两种努力形式:对任务的关注和对注意力的严格控制。以每小时150英里的速度骑摩托车和在象棋大赛中角逐都需要付出努力,然而在心流状态下,集中注意力关注吸引人的事并不要求自我控制。因此,我们要将所有资源都用于手头上的任务才好。

    又累又饿的保释官更可能否定保释申请

    自我控制和认知努力是大脑工作的形式,这一观点已得到广泛认同。有几项心理研究表明,人若既有认知任务在手又同时受到诱惑的影响,就容易屈从于诱惑。如果有人要求你在一两分钟内记住一串7位数的数字,并且告诉你记住这些数字是你的首要任务,而当你将注意力集中在这些数字上时,却有个人端着甜点让你选一种:是选择让人既爱又恨的巧克力蛋糕呢,还是选择什锦水果沙拉。有证据显示,尽管大脑里装满了这些数字,你却更有可能选择诱人的巧克力蛋糕。系统2在忙碌时,系统1对行为的影响会更大。而且,系统1也更偏爱甜食。

    当人们忙于认知活动时,更有可能作出自私的抉择,会用带有性别歧视的字眼,并在社交场合作出肤浅的评判。记住和重复这些数字会减轻系统2对行为的控制,当然,认知负担不是自我控制减弱的唯一因素。喝几杯酒,或者一夜没睡也会产生同样的结果。早起的人的自我控制力会在晚上受到影响,而夜猫子的自我控制能力则会在早晨受到影响。过多关注自己完成一项任务的结果,就会给其短时记忆增加毫无意义的思想负担,进而影响其整体表现。结论非常明显:自我控制需要集中注意力,需要付出努力。换种说法就是,控制思想和行为是系统2的任务之一。

    心理学家罗伊·鲍迈斯特(Roy Baumeister)和他的同事们所做的一系列令人惊讶的实验最终表明,所有自主努力的不同形式—认知上的、情感上的或者身体上的—至少都能对集思广益有所帮助。他们的实验中要求受试者进行的是连续性任务而不是同时发生(不相关联)的任务。

    鲍迈斯特的小组屡次发现,刻意掌控意志和进行自我控制很辛苦。如果你必须强迫自己去做某件事,而此时这件事又面临一个新的挑战,你就会很不情愿或是根本无法进行自我控制。这种现象被命名为自我损耗(ego depletion)。在一次典型的展示活动中,我们要求受试者一边看一部能引起感情共鸣的电影,一边抑制自己的情绪反应。在随后的耐力测试中,他们表现得很糟糕。该耐力测试的内容是握住测力计—这个动作会让人越来越不舒服—看他们能保持多长时间。受试者在实验的初始阶段作出的抑制情感的努力,会削弱其忍受维持肌肉收缩而带来的痛苦的能力,自我损耗型的人因此会很快产生退出实验的冲动。在另一项实验中,受试者要首先经过自我意志的损耗,他们会吃不同的食物,包括小萝卜、芹菜等,同时还要抑制住吃巧克力和饼干的想法。后来,当这些人面对困难的认知任务时,会表现得比通常情况下更轻易放弃。

    如今,我们知道关于自我控制的情形和任务很多,也很复杂。这些情况既包含思想斗争又要抑制自身倾向的需求,见下面的例子:

    ·不去想北极熊。

    ·对震撼人心的电影抑制情感的共鸣。

    ·对矛盾的事作出选择。

    ·试着让他人眼前一亮。

    ·对同伴不好的行为委婉回应。

    ·和其他种族的人交流(这些人还有种族偏见)

    自我损耗的前兆也多有不同:

    ·改变日常饮食。

    ·疯狂购物,花很多钱。

    ·反应过度,有挑衅的意味。

    ·对有把握的任务花费较少的时间。

    ·在认知任务和逻辑决策的制定中表现得很糟糕

    其证据很具有说服力:对系统2有高需求的活动同样需要自我控制,而发挥自我控制力既有损耗又很枯燥。与认知负担不同,自我损耗至少会令人丧失一部分动力。在一项任务中控制自我后,在另一项任务中就感受不到自己在努力,但只要你真的想做,就一定能做到。在几次实验中,如果受试者有强大的动力抑制自我损耗的影响,他是完全能够做到的。相反,如果你必须在执行某项任务的过程中以短时记忆记下6个数字,此时即使不断努力也是行不通的。自我损耗和认知投入并非同一种思维状态。

    鲍迈斯特小组最惊人的发现,用他自己的话说就是,大脑能量这一概念不仅仅是个比喻。神经系统消耗的葡萄糖比身体其他部位消耗的都要多,而且需要付出脑力活动的成本显然要比葡萄糖高。在积极进行复杂的认知推理或者忙于要求自我控制的任务时,人的血糖就会下降。这种情况和短跑运动员在短跑时肌肉中的葡萄糖储备量下降是相同的。这一概念的大致含义是,自我损耗的影响能通过注射葡萄糖得到缓解,而且鲍迈斯特和他的同事们也通过几个实验证实了这一假设。

    他们有一项研究是让志愿者们看一个无声的短片,其内容是对一位女士的采访。这些志愿者的任务是解释她的肢体语言。在这些志愿者执行这项任务时,屏幕上有一串单词慢慢闪过,而他们事先已经被告知要忽略这些词,如果发现自己的注意力转移了,他们只能再次将注意力拉回到这位女士身上。研究认为,这种自我控制行为可以引起自我损耗。所有的志愿者在执行第二个任务前都喝了些柠檬汁,其中一半的人所喝的柠檬汁加了葡萄糖,而另外一半人的饮料中混有代糖。然后所有的志愿者开始执行第二项任务,在这项任务中,他们必须克服直觉才能得到正确的答案。通常在自我损耗的人群中,直觉性的错误常有发生。结果是喝了含有代糖饮料的人出现了损耗现象,而喝了含有葡萄糖饮料的人却没有。在大脑中储存一定量的糖,可使自己表现得不那么糟糕。能导致葡萄糖降低的任务是否同样会导致瞳孔放大和心率加快等情形发生呢?要想证明这一说法,恐怕还需要些时间和更深入的研究吧。

    《美国科学院院报》最近报道了损耗对判决的影响这一问题的研究情况。在这项研究中,8位不知情的受试者全部是以色列的保释官。他们每天都要审阅保释申请,而且不是按这些保释申请的时间顺序审阅的,这些保释官在每份申请上所用的时间很少,平均只有6分钟。(弃权相当于拒绝保释,只有35%的申请能获准通过。这些保释官作出每个决定所用的时间都有精确的记录,而且他们一日三餐的餐歇时间也有记录,分别是早餐时间、午餐时间和午间休息时间。)这项研究的设计者对两次餐歇间所能获得批准的申请数量进行了预测,结果发现每次用餐过后,获得批准的申请数量都会增加,有约65%的申请得到了批准。在保释官下一次用餐前的约两个小时内,批准率就开始稳步下降,在用餐之前刚好达到零。如你预想,这种结果令人难以接受,但各位设计者已经认真审核并排除了很多其他的原因。对这个数据最合理的解释却带来了负面信息:又累又饿的保释官容易否定保释申请。疲劳和饥饿都有可能影响他们的决定。

    脱口而出的错误答案

    系统2的一大主要功能是监督和控制思想活动以及由系统1引导的各种行为,使得一些想法直接体现在行动上,或者抑制或改变其他想法。

    例如,下面是一个相对简单的难题。别费力去分析它,凭直觉做做看:

    球拍和球共花1.10美元。

    球拍比球贵1美元。

    问球多少钱?

    你会马上想到一个数字,这个数字当然就是10,即10美分。这道简单的难题之所以与众不同,是因为它能引出一个直觉性的、吸引人的但却错误的答案。计算一下,你就会发现。如果球花费10美分的话,总共就要花1.20美元(球10美分,球拍1.10美元),而不是1.10美元。正确答案是5美分。我们可以假设那些最终得出正确答案的人也想到了这个答案,只是他们不知通过什么办法成功抵制住了直觉的诱惑,最终给出了正确的答案。

    肖恩·弗雷德里克(Shane Frederick)和我对基于两个系统的判断理论进行了共同研究,他用这个球拍和球的问题来研究一个核心问题:系统2对系统1的各类方案监视得有多严密?他进行了这样的推理:那些说球为10美分的人让我们了解到这样一个重要的事实,那就是这个人没有认真验证这个答案是否正确,而且他的系统2倾向于直觉性的答案。其实他只要稍稍动脑想一下,就会否定这个直觉性的答案。此外,我们还知道给出直觉性答案的人忽视了一个明显的生活提示,他们应该想一想怎么会有答案这么明显的问题呢。没有验证答案,这是一个明显的失误,因为验证根本不费什么事,只是大脑工作几秒钟(这个问题的难度一般),或者肌肉动一动,抑或睁大眼睛而已,只要稍微动动脑子就可以避免这个令人窘迫的错误。认为答案是10美分的人显然不爱动脑筋,没有给出这个错误答案的人显然思维更活跃。

    上万名大学生都回答了这个球拍和球的问题,其结果令人吃惊。哈佛大学、麻省理工学院和普林斯顿大学中50%以上的学生给出了这个直觉性的错误答案。在声誉稍差一点的大学里,则有80%以上的学生没有验证答案就脱口而出。这个球拍和球的问题是我们所作的第一个作了观测性的研究,这一问题将是本书反复出现的主题:很多人过于自信,过于相信自己的直觉。他们显然觉得认知努力没什么意思,会尽量避免费力思考。

    现在我来为大家作一个逻辑论证—两个前提和一个结论。请你尽量快速地判定这个论证是否符合逻辑。想想结论是否与前提有关联?

    所有的玫瑰都是花。

    有些花会很快凋谢。

    因此,有些玫瑰也会很快凋谢。

    大部分大学生觉得这个推论是合理的。但事实上,这个论证是有问题的,因为玫瑰可能不会很快凋谢。就像球拍和球的问题,貌似正确的答案会马上在大脑中显现。摆脱这种现象需要作出努力,因为坚信自己的观点,认为“这是对的,是对的”,便使人很难去验证自己的答案是否符合逻辑,大多数人根本不愿费力去想明白这个问题。

    这个实验使我们对在日常生活中做出的推论丧失了信心。这个实验使我们认为,当人们相信某个结论是正确的时候,他们很可能会相信支持这个结论的论证,哪怕这些论证不正确。如果系统1也参与到活动中来,人们总会先得出结论,然后才进行论证。

    接下来,请思考以下问题,边读边作答:

    密歇根州在一年中发生了多少起谋杀事件?

    这个问题是肖恩。弗雷德里克设计的,仍旧是对系统2的挑战。回答这个问题的“诀窍”在于调查对象是否会记得底特律这个犯罪率相当高的城市就在密歇根州。美国的大学生都了解这个事实,都能准确无误地指出底特律是密歇根州最大的城市。然而,对事实的了解并不重要,重要的是在我们需要这个事实的时候却总是无法立即将其提取出来。记得底特律在密歇根州的人对该州谋杀犯罪率的估计要多于不知道这一点的人,但弗雷德里克那个实验的大多数受试者在看到密歇根州时,根本没有想到该州还有底特律这座城市。实际上,当人们被问及密歇根州和底特律市的谋杀犯罪率时,回答前一个问题的人总认为密歇根州的谋杀犯罪率低,而回答后一个问题的人则认为底特律市的谋杀犯罪率高。

    受试者在回答上面的问题时没能想到底特律市,这既是系统1的问题,也是系统2的问题。提到密歇根州时能否想到底特律市,这在一定程度上要依赖记忆的自主功能,这一功能因人而异。有些人对密歇根州的一切耳熟能详:该州的居民比其他地方的居民更容易回想起关于该州的事实;熟悉地形的人能比棒球统计员回想的更多;聪明的人在大多数事情上的表述上比其他人表述得更好。聪明不仅是指推理的能力,也指在记忆中搜寻相关信息和在必要时调动注意力的能力。记忆功能是系统1的一种属性。但是,每个人都可以选择放慢速度,在记忆中积极搜寻所有可能相关的事实,就像他们在球拍和球的问题中可以放慢速度验证直觉性答案一样。不同的人仔细核对和搜索的程度也各不相同,这是系统2的一个特征。

    球拍和球的问题、玫瑰的问题和密歇根州/底特律的问题都有共同点。在这些小实验中,答错问题显然在某种程度上说明了其原因是精神动力不足,而不是努力程度不够。能被好大学录取的学生当然能够在前两个问题上作推理判断,在密歇根州的问题上也能够进行思考,能回想起该州的大城市及其犯罪问题。这些学生只要不想接受脑海中出现的似乎是正确的答案,就能够解决更难的问题。若他们满足于现成的答案而不想去思考则会很麻烦。用“懒惰”来形容这些年轻人的自我检测及其系统2似乎有些刻薄,却并非不公平。避免思维上懒惰的人可以被叫做“勤快人”。他们更机警,思维更活跃,不会满足于貌似正确的答案,对自己的直觉也常持怀疑态度。

    心理学家基思·斯坦诺维奇认为他们更理性。

    今天得到1000美元,1年后得到10000美元,你选哪个?

    研究者曾经用各种方式来检验思考和自我控制之间的联系。有些研究者通过询问相关问题来论证其联系:如果分别根据自我控制能力和认知能力将人们分成不同等级,那么不同个体在这两个排序中是否会处于类似的等级呢?

    在心理学发展史中有个很著名的实验,瓦特·米舍(Walter Mischel)和他的学生将一些4岁大的孩子置于残酷的两难处境中。这些孩子可以自行选择,是要一个随时就可以拿到的小奖励(一块奥利奥饼干),还是在充满考验的环境中苦等15分钟,然后得到更大的奖励(两块小甜饼)。每个孩子得单独待在一个房间里,面前有张桌子,桌子上有两件东西:一块饼干和一个铃铛。孩子可以随时摇铃通知研究人员并能领到一片饼干。根据描述,实验如下:“玩具、书、图画或任何其他会使孩子们分心的东西都不在房间里。研究人员离开房间15分钟后才会回来。不过,孩子要是摇了铃、吃掉饼干、站起身来或者表情痛苦,研究人员也会回来。”

    研究人员通过一面单面镜观察这些孩子,他们等待期间的行为总会使观察者大笑。有些孩子成功地经受住了15分钟的考验,其成功原因是他们能把注意力从诱人的奖励上移开。10年或15年之后,那些忍住了诱惑和没忍住诱惑的孩子之间会出现很大差别。忍住了诱惑的孩子在认知任务—尤其是高效地重新分配注意力方面的控制力更强。当他们还年轻时,他们染上毒品的可能性更小。智力水平的巨大区别也随之出现:在4岁时表现出更强的自我控制能力的孩子在智力测验中得到了更高的分数。

    俄勒冈大学的一个研究小组从几个方面研究了认知控制和智力之间的联系,包括通过提升对注意力的控制力来提升智力的做法。研究实验由5个阶段构成,每个阶段40分钟,他们让4~6岁的孩子去玩不同种类的电脑游戏,这些游戏是为检验注意力和控制力而专门设计的。在其中一项游戏中,孩子们要在尽量避开一块泥泞区域的同时,用一个操纵杆将一只卡通猫驱赶到一个长满草的地方。长草的地方会慢慢变少,而泥泞的地方会慢慢扩大,这就需要孩子们不断提高控制的精确度。测试者发现,注意力训练不仅提升了这些孩子的执行控制能力,而且他们在智力测验中的笔试成绩也提高了,并且这种提升的状态可以维持几个月不变。同一个小组所作的其他研究确认了参与了注意力控制的具体基因,表明家长的教育方法也会影响这种能力,研究还证明了,儿童控制其注意力的能力和控制其情感的能力之间有着紧密的联系。

    肖恩·弗雷德里克组织了一个认知反应测试,其中包括球拍和球的问题以及其他两个问题,之所以选这些问题是因为它们可以引发一个吸引人但却错误的直觉性答案(我们将在第5章中讨论这些问题)。他还对这项测试中得分很低的那些学生的特点进行了跟踪研究,发现他们更倾向于用脑海中最先出现的想法来回答问题,而不愿意费事去验证自己的直觉。这些人身上的系统2的监测功能往往较弱。那些遇到各种难题都跟着直觉走的人也易于接受系统1的其他暗示,特别是在冲动、不耐烦以及急功近利的时候,这些人就更易接受系统1的各种暗示了。例如,63%的直觉型受试者说他们宁愿这个月拿到3 400美元也不愿等到下个月拿3 800美元。而那些正确答出3道难题的人中只有37%持这样目光短浅的看法—希望能马上得到一笔钱,哪怕少些也可以。当被问到要想次日就收到自己订购的书愿意付多少钱时,在认知反应测试中得分低的人比得分高的人愿意多付一倍的价钱。弗雷德里克的发现表明,我们这场心理剧中的两个角色有着不同的“人格”。系统1是冲动、凭直觉的;而系统2则具备推理能力,它很谨慎,但对一些人而言,这个系统也是懒惰的。我们从不同人的不同特点中发现了相关性:有些人倾向于系统2,而有些人则更接近于系统1。这个简单的测试可以较好地反映出惰性思考的特点。

    基思·斯坦诺维奇与其长期合作者理查德·韦斯特首先提出了系统1和系统2这两个术语(他们现在更喜欢将其称为第1类型过程和第2类型过程)。斯坦诺维奇和他的同事们用了几十年的时间来研究不同个体面对各种问题时的不同反应,这也是本书所关注的问题。他们用多种不同的方式问受试者同一个基本问题:为什么有些人比其他人更容易受判断成见的影响?斯坦诺维奇在《理性和反思性思维》(Rationality and Reflective Mind)一书中阐明了他的观点,对书中相关章节的主题进行了大胆而独到的论述。他对系统2的两个部分作了明确区分,这一区分十分明显,斯坦诺维奇称其为泾渭分明的两种“思维”。其中一种思维(他称其为算法)负责的是慢思考和要求很高的计算活动。有些人在这些脑力活动中比他人做得更好,他们在智力测试中超越他人,并且从一项任务转换到另一个任务上时,他们往往更快、更高效。不过,斯坦诺维奇认为,高智商并不能消除成见。要想消除成见,还需具备另一种能力,他称其为理性。斯坦诺维奇对理性之人的定义和我之前说到的“勤快人”有相似之处。他的核心观点是我们应当将理性和智力区分开来。在他看来,肤浅的或者惰性思考是一个反思缺陷,是一个理性错误。这是个引人注目且发人深省的想法。为了论证自己的想法,斯坦诺维奇和他的同事们发现,在某种情况下,球拍和球的问题以及此类问题比传统的智力测验(比如智商测试)更能反映出我们对认知错误的敏感度。关于智力和理性之间的区别是否会引出更多的新发现,时间最终会告知我们答案。

    示例—自我控制“连续工作几小时,她也不会感到吃力,她处于一种‘心流’中。”“在长达一天的会议之后,他的自我意识出现一定程度的损耗。因此他决定采用标准的操作规程,不再去想这个问题了。”“他从来不去想自己的话是否有道理。他是特别习惯用懒惰的系统2呢,还是总是非常累?”“不幸的是,她总是喜欢凭直觉随口就说,也许连表达感谢都词不达意吧,弱弱的系统2啊。”第4章 联想的神奇力量

    系统1的运行机制出人意料,在对其进行研究前,请先看以下两个词:

    香蕉   呕吐

    在刚才的一两秒钟里,你一定想到了很多,脑海中浮现出一些不愉快的图像和记忆,你的脸有些扭曲,露出厌恶的表情,而且你还可能不自觉地把这本书推得更远些。你的心率加快,手臂上的汗毛微微立起,而且你的汗腺开始分泌汗液。总之,你对那个令人反感的词的反应与对真实情况的反应相差无几。这些反应全是自发的,超出了你的控制范围。

    你的大脑会不由自主地将香蕉和呕吐这两个词联系起来,暂时在两者间建立了因果联系,认为是香蕉引起了不适。这就是大脑的自然反应。结果,短期内你会对香蕉失去兴趣(不过别担心,这种感觉总会消失的)。你的记忆状态在其他方面也有所改变:你现在很容易就能识别出与“呕吐”相关的物品和概念,对它们的反应也很敏感,比如不舒服、臭味或者恶心等;看到和“香蕉”有关的词,比如黄色、水果,甚至连苹果和浆果都包括在内,也会有不良反应。

    呕吐一般只在特定的情况下才会发生,比如宿醉过后和消化不良时。你肯定还能找出导致呕吐的其他相关词汇。而且,你的系统1注意到将这两个词相提并论并不常见,以前从没遇到过这种情况。你自己也有些惊讶。

    这些复杂的反应快速地呈现在你的脑海中,而且都是自主发生的,无须费力。你左右不了它,也不能让它停下来。这是系统1的一个运行过程。你看到这些词后出现的一切反应都是循着一个名为“联想激活”的过程发生的:事物在你的大脑中唤起的想法激发出许多其他的想法,而且这些联想的行为在你的大脑中迅速扩展开来。连贯性是这种复杂的思维活动的重要特点,其中每个环节都是紧密相连、相互支持的。能引发记忆的词也会引发情感,还能引发面部表情变化和其他反应,比如常出现的紧张和回避倾向。面部表情和退缩行为强化了引起这两种反应的情感,这些情感反过来还会强化相应的概念。所有这些都是瞬间发生的,形成一种认知、情感和生理反应的自我强化模式,这种模式变化多样又能形成一个整体,被称为联想的连贯性。

    在一秒钟左右的时间里,你就能自主且无意识地完成一件了不起的事。一旦发生了完全出乎意料的事—两个风马牛不相及的简单的词语被放在一起—你的系统1就将这两个词随意联系起来,试图弄清具体情况;还预估了可能会出现(从轻度到中等程度)的危险状况,帮你作好准备去面对这些极有可能会出现的事件,以便为你将来的应对创造条件。同时,系统1还会对过去情形的骇人程度进行评估,为当前的事件发展创造条件。这样你就可以透彻了解过去,从容面对未来了。

    在所发生的事情中有一点很奇怪,那就是你的系统1把两个词的简单联系看做真实的情况。你的身体对这一假想情形的反应要稍逊于对真实情况的反应,情感上的反应和生理上的反感表现可以从某个方面解释这个现象。正如近几年来许多认知科学家强调的那样,认知可以体现出来,你不只是用大脑思考,还用身体思考。

    很久以来,人们一直都知道引起这些思维活动的机制是什么,这个机制就是联想。我们都能从自己的经历中了解到,有意识的思维活动中所有的观点都是井然有序的。17世纪和18世纪的英国哲学家曾经努力探求能解释这些续发事件的规律。在1748年出版的《人类理解研究》(An Enquiry Concerning Human Understanding)一书中,苏格兰哲学家大卫·休谟(David Hume)将联想的原则缩减为三个:相似性、时空相接以及因果关系。自休谟时代以后,我们对联想的定义发生了巨大变化,但他的三原则仍可作为定义所有联想的基础。

    什么是观点?我愿意接受开放性的看法。它可能是具体的,也可能是抽象的,能通过很多方式表达出来:它可以是动词、名词、形容词或者只是握紧的拳头。心理学家认为,观点是一张巨网上的节点,他们称其为联想记忆,这些节点和其他节点相联结。联结的类型多种多样:因果联系(病毒→感冒);事物及其特性的联系(柠檬→绿色);事物及其种类的联系(香蕉→水果)。有一方面我们超越了休谟,那就是我们不再将思维活动视为一连串顺序出现的有意识的观点。联想记忆的工作原理是什么?当前的研究中有这样一种见解:一瞬间会发生很多事。思维活动唤起一个看法不仅会引发另一个看法,它还会激发出很多其他看法,而这些看法还会让我们想到另外一些看法。此外,只有几个被激发出来的看法是有意识的思维活动;多数联想思维都是无声的,隐藏在有意识的自我之后的。如果说我们对大脑的运转认识有限,我们当然很难接受这种说法,因为这种说法和我们的体验背道而驰,但事实就是如此:你觉得自己很了解自己,但其实你错了。

    启动效应:让人不知不觉微笑的铅笔

    突破是科学研究的重点,而我们理解联想机制的第一个重大突破就是对测量方式的改进。几十年前,唯一研究联想的方法是向众人提问,比如“当你听到‘天’这个词时脑海中最先出现的词是什么”,研究者记录了不同回答出现的频率,比如“夜晚”、“晴天”,或者“日间长”等。在20世纪80年代,心理学家发现,看到一个词时,人的思维就会立刻产生变化,而且这种变化是可测量的,同时,很多相关词汇会被激发出来。如果你最近看到或者听到“喝__”这个词,你可能会填上偏旁为“氵”的“汤”字而不会填成“场”。当然,如果你刚看到了“运动__”这个词,你可能就会填上“场”字了。我们将此现象称为启动效应,也就是说“喝”这个概念在“汤”之前出现,“运动”先于“场”出现。

    启动效应有多种表现形式。如果你的脑海中此时有“喝”这个概念(不论你是否注意到这一点),恰好此时有人低声跟你说了“汤”字或者在你前面远远的地方放上一碗汤,你肯定会比平时更快地意识到“汤”这个词。当然,你脑海中首先出现的不仅有汤这个概念,还有与食物相关的很多概念,包括猪肉、饿、脂肪、饮食和饼干等。如果最近用餐时几乎都是坐在摇晃的餐桌前吃饭,你的脑海中还会首先浮现摇晃这个概念。此外,启动联想的概念也能引起其他概念,尽管这种能力不算强。就像是池塘里的涟漪一样,概念的激活也是由联想概念这张大网上的一小部分向外逐渐扩展开来的。这个涟漪效应现在是心理学研究中最令人兴奋的探索之一。

    关于记忆理解的另一项重大突破,是研究者发现启动效应不只限于概念和词汇。当然,单纯通过有意识的经验,你是无法了解到这一点的,但你一定要接受这个另类的想法,即你的行为和感情有时会受制于你自己甚至都没有意识到的事件。在一项实验中,心理学家约翰·巴奇(John Bargh)和他的同事们让纽约大学的数位学生从一个包含5个单词的词组中(例如“发现、他、它、黄色的、马上”)挑出4个单词来重组句子。其中一个小组的学生重组的句子中有一半都含有与老年人相关的词汇,例如佛罗里达州、健忘的、秃顶的、灰白的或者满脸皱纹的。当他们完成这项任务时,又被叫到大厅另一头的办公室里去参加另一个实验。从大厅的一头走到另一头是这次实验的关键所在。研究者悄悄地测量了他们所用的时间。正如巴奇预料的那样,那些以老年为主题造句子的年轻人比其他人走得要慢得多。这个实验后来成了经典案例。

    这个“佛罗里达效应”包括信息启动的两个阶段。第一,尽管没有人提过“老年”这个词,但上述那组词令人想到了年迈;第二,这些想法催生了一种行为,即缓慢行走,这个行为与老年人相关。所有这一切的发生都是无意识的。这些学生在回答问题时,谁也没有提及自己注意到这些词有什么共同点,而且他们都坚持认为自己在第一个实验中看到的那些词并未对实验后的行为产生什么影响。“老年”这个概念并非他们的自觉意识,但其行为却因此有了改变。这个由概念影响行为的启动效应被称为概念运动效应,值得我们关注。尽管你自己肯定没有意识到这个效应,但读了上述文字之后,“老年”这个概念肯定对你也产生了一定的影响。假设需要站起来接杯水喝,你起身离开椅子的动作就会比平常稍稍慢上那么一点,除非你恰巧不喜欢“老年”这一概念。有研究案例表明,如果对这一概念反感,人的动作就会比平时稍稍快那么一点。

    在相反的情况下,概念运动效应也同样适用,德国一所大学曾做过的一项实验便证实了这一点。这个实验堪称巴奇和他的同事在纽约所做的那个早期实验的翻版。在实验中,研究人员要求参与实验的学生以每分钟30步的速度在房间里绕着圈走5分钟,这个速度是他们正常行走速度的1/3。这个简单的实验过后,学生们能更快地辨认出与“老年”相关的词汇,比如“健忘”、“年老”和“孤独”等。启动效应往往能产生连贯的反应:如果首先想到老年,你就会表现得像是上了年纪,而这种上了年纪的表现也会强化你关于“年老”的看法。

    相互联系在联想网络中十分常见。例如,觉得高兴时就会微笑,而微笑也会使你感到高兴。拿支铅笔放在齿间几秒钟,有橡皮的一端指向右边,笔尖指向左边。然后拿起笔来,咬住有橡皮的那一端,笔尖指向你的正前方。也许你并未意识到上述活动中有一个动作让你的眉毛皱了起来,而另一个动作却让你的脸上有了微笑。有人曾经让一些大学生给盖瑞·拉尔森(Gary Larson)的漫画《月亮背面》(The Far Side)评定幽默等级,同时要求他们在评级时咬一支笔。那些“微笑着的”学生(他们完全没有意识到自己在微笑)对这本漫画书幽默程度的评价比那些“皱着眉的”学生高得多。在另一项实验中,那些皱眉的人(眉头紧皱)在看到饥饿的儿童、争论不休的人以及事故现场等令人不舒服的图片时,往往会表现出更强烈的情感反应。

    简单地说,常见的动作也会不知不觉地影响到我们的想法和感觉。在一项实验中,受试者按照要求用新耳机听一些信息。他们被告知这项实验的目的是检测音频设备的质量,研究人员告诉他们要不断地摇晃脑袋,以检查设备是否有声音失真的问题,其中一半受试者要上下点头,而另一半则要左右摇头。他们听到的内容是电台的社论。那些点头(表示同意的动作)的受试者往往易于接受他们听到的信息,而那些摇头的受试者则易于否定那些信息。要强调的是,受试者并没有意识到上述问题,他们只是习惯性地将否定或接受的态度与其常用的身体语言联系起来而已。由此可见,老话讲“不管你怎么想的,都得心平气和”,这真是条很好的建议,只有真正做到心平气和,你才可能有回报。

    你会自觉投到盒子里多少钱?

    我们原以为自己作出的判断和选择是有意识且自主的,但那些关于启动效应的研究所带来的发现却颠覆了我们此前的认识。例如,我们中的大多数人都认为投票选举是经过深思熟虑的行为,它反映了我们对政策的认可程度与评价,不会受到不相关的事的影响。比方说,我们投票不应受到投票地点的影响,但事实上这个因素却实实在在影响了投票结果。一项关于2000年亚利桑那州选区投票模式的研究表明,当投票站设在某个学校时,加大教育投入力度的议案的支持率就会比投票站设在附近其他地方的要高。还有一项实验表明,当人们看到一些教室和学校储物柜的照片时,他们往往也倾向于支持关于教育的提案。这些图片对这些受试者的影响比其家长或其他选民与他们的意见分歧对其产生的影响还要大!对启动效应的研究从最初的实证研究—人们想到“年老”走路就会变慢—到今天已经取得了一定的发展,我们现在已经知道启动效应会影响到我们生活的方方面面。

    让人联想到钱的事物往往令人不安。在一项实验中,受试者看到一个列有5个单词的单子,按照要求,他们得在5个词中选出4个组成以钱为主题的短语(比如“高、一份、薪水、桌子、工作”可组成“一份高薪工作”)。其他一些启动想象的实验则更挑战人的领悟力,包括背景中出现一个与钱没有任何关系的东西,比如一张桌子上放着一堆仿制钱币,或者一台电脑的屏保是水里漂着的一些美钞等。

    起初脑海中就有钱的概念的人比自己没有这方面联想时更独立。他们会持之以恒地解决一个非常难的问题,付出双倍的努力也在所不惜,实在迫不得已时才会向研究人员寻求帮助。这一做法清晰地表明其自力更生能力的提升。脑海中总有钱的概念的人更自私:他们更不愿花时间去帮助另外那位假装对实验任务不大清楚的学生。当一位研究人员不小心将一捆铅笔掉到地板上时,脑子里想着钱的那些受试者(他们自己是无意识的)捡起的笔相对较少。在另一系列的一项实验中,受试者得知他们过会儿会和另一个人进行一次简短交谈,彼此熟悉一下,他们负责摆两把椅子,而研究人员则离开去找那个人。潜意识里有钱这一概念的受试者摆放椅子的距离(118厘米)会比没有这一概念的人摆放的距离(80厘米)更远。那些满脑子都是钱的受试者表现出更强烈的独处意愿。

    上述所有发现有一个共同主题,即钱这一概念会滋生个人主义:不愿和他人在一起,不愿依赖他人,也不愿接受他人的请求。心理学家凯瑟琳·沃斯(Kathleen Vohs)完成了这项意义重大的研究,值得赞赏的是,她并未将自己的众多发现向公众和盘托出,而是留给读者更多的思考空间。凯瑟琳的研究意义深远,她的发现表明我们所处的文化环境中有很多能让人想起钱的事物,这些事物以我们意识不到的方式影响着我们的行为和态度,这些方式也许并不那么光彩。有些文化常常提醒人们尊重他人,另外一些文化则常让人们想起上帝,还有一些国家的人们会对着伟大领袖的照片顶礼膜拜。在一个专制国家中,到处挂着领袖的肖像不仅能向你传达“老大哥在看着你”(Big Brother Is Watching You. 语出乔治·奥威尔所著《1984》)的感觉,还会使你逐渐丧失自主的思想和独立的行为能力。

    启动效应的研究证据显示,使人牢记“人终将一死”这一说法能让独裁的主张更得人心,因为在人们恐惧死亡的情况下,独裁的主张会让人心安。其他实验证实了弗洛伊德关于无意识关联中符号和比喻作用的见解。比方说,你可以看看下面这两个不完整的单词W_ _H和S_ _P是什么。如果有人近些天想起了自己某个难以启齿的举动,这些人往往会把这两个不完整的词填成WASH和SOAP(“洗”和“香皂”),而很少会填成WISH和SOUP(“希望”和“汤”)。此外,只是想到背后中伤某位同事就会使人更想去买香皂、消毒剂或清洁剂,而不是去买电池、果汁或者糖果。当人们感觉自己的心灵受到了玷污,往往也会引发他们清洗自己身体的想法,这种冲动被称为“麦克白效应”。

    人们清洗的身体部位往往是那些令他们深感罪恶的部位。一项实验要求受试者通过电话或者电子邮件对一位假想中的人“说谎”。在随后对不同产品的需求测试中,那些通过电话说谎的人更想要漱口水,而不是香皂;而那些通过电子邮件说谎的人更想要的则是香皂,而不是漱口水。

    当我向听众阐述关于启动效应的各项研究时,他们的反应通常是将信将疑的。这也不奇怪,因为系统2认为自己掌控一切,认为自己知道为什么要作出这样或那样的选择。你的脑海中也可能会突然出现一些问题:对情境进行微调怎么可能产生这么大的影响呢?这些实验是否表明我们完全任由情境摆布,随时要听从它的指示呢?当然不是。启动思维的影响力虽强,但并不见得很大。在100位投票者当中,只有几位开始时并不确定要选谁,如果投票点设在学校里而不是在教堂里,他们对与学校相关的问题会就作出不一样的选择,但也不排除有那么几个人会作出相反的选择。

    然而,问题的关键是要接受相关研究的结果,而不是对此心存怀疑。这些结果不是捏造出来的,也不是统计上的偶然现象。你别无选择,只能接受这些研究的主要结论是正确的这一事实。更重要的是,你必须承认这些结论对你自己来说也是正确的。如果你看到电脑屏保上有浮动的美钞,你帮那位笨手笨脚的陌生人捡起的铅笔数量可能比你没看到这些钱时更少。你不相信这些结论适用于你,因为这些结论与你的主观体验不相符,你的主观体验主要是由系统2决定的。启动效应来自系统1,而这个效应发生时,你根本就意识不到。

    我用一个关于启动效应的完美展示案例来结束上面的阐述,这个案例是在英国一所大学一间办公室的茶水间进行的。多年来,这间办公室的职员一直都是自掏腰包买茶或咖啡,他们把每杯茶水和咖啡的建议价格写下来贴到墙上,上班时每次去接茶水或者咖啡时都会把相应的费用投到一个“诚实盒”里。某一天,有人在价格表的上方贴了张横条,上面既没有什么警告,也没作什么解释。在接下来的10周时间里,每周横条都贴有一张新的图片,图片上要么是一些花,要么是一双眼睛,好像盯着看着图片的人。没有人对这些新装饰发表过什么评论,但“诚实盒”里的钱却有了明显变化,如图4所示,这值得仔细研究一番。

     [image file=Image00005.jpg]

    实验开始的第一周(从图底端你可以看到相关信息),有一双睁大的眼睛在盯着来喝茶或咖啡的人,他们投进“诚实盒”的钱的平均值是70便士。第二周,图片上是鲜花,盒子中的钱的平均值少了15便士。这个趋势持续着,凡遇到有鲜花图片的那一周,盒子里的钱数就会减少。从平均水平来看,“眼睛周”时盒子中的钱是“鲜花周”时的3倍。显然,仅仅是一种象征性的监视符号便可促使人们改善自身的行为。正如我们预料的那样,产生这个影响的过程中没有任何意识的参与。现在你相信自己也难逃同样的模式了吧?

    几年前,心理学家蒂莫西·威尔逊(Timothy Wilson)曾写过《我们是自己的陌生人》(Strangers to Ourselves)一书。现在你已经认识了自己身体中的那个陌生人,它也许在很多事情上都会为你做主,尽管你几乎从未察觉到它的存在。系统1带给你的各种印象经常会变成你的信念,而且是你作出选择和展开行动的动力源泉。它可以将当下的情形与新近发生的事情联系起来,再结合对近期的各种预期考虑,对发生在你身上或你身边的事作出心照不宣的解释。系统1包含了对这个世界的认知模式,能立即估测哪些事情是正常的,哪些是出人意料的,它是你作出快速直觉性判断的依据,且这种判断十有八九是准确的,而你的所有判断活动几乎都是在这一系统的指引下毫无意识地完成的。然而,系统1也是你直觉中很多系统性错误的根源,这一点将会在后面几章中得到佐证。

    示例—启动效应“这些人都穿着刻板的制服,看到他们时我们的大脑中是不会有什么创造性想法的。”“这个世界比你想象的要复杂得多,能否对它有个清晰的认识多半要看你的大脑的工作方式。”“他们的作用就是发现问题,而他们也的确发现了很多问题。”“系统1编了一个故事,而系统2也相信了这个故事。我们每个人都有过这种体验。”“我让自己微笑,这样做我也的确感觉好多了!”

    第5章 你的直觉有可能只是错觉

    在头脑清醒的时候——甚至在思绪并不那么清晰的时候——你的大脑一直在进行着多重运算,这些运算可以保留和更新一些关键问题的答案。例如:有什么新情况吗?存在危险吗?事情进展得顺利吗?我需要转移注意力吗?完成这个任务需要投入更多的精力吗?你可以将大脑想象成飞机驾驶座舱,里面有一套刻度盘,上面显示着这些重要变量的当前数值。系统1会自动对当前这些数值进行评估,因为这些数值的一个重要功能就是决定是否需要系统2提供额外帮助。

    其中一个刻度盘测量的是认知放松度。认知放松度介于“放松”和“紧张”之间。放松是事情进展顺利的标志——没有障碍、没有新情况、没必要转移注意力或投入更多精力。紧张说明存在某种问题,且需要不断调动系统2参与其中。如若事情进展不顺利,你便处于认知紧张状态中。认知紧张同时还会受当时的努力程度和未得到满足的需求的影响。令人惊讶的是,一个简单的认知放松过程却与有着多种输入和输出活动的庞大网络相联结。图5对此作了解释。

     [image file=Image00006.jpg]

    图5说明如果一个句子印刷清晰,或是被多次重复,或是已经深植于脑海,人们就能在认知放松的状态下顺畅地将其解读出来。听别人说话时,如果心情好,或者咬一支笔迫使自己“笑”,都能使认知放松。反之,若说明书印刷模糊,颜色浅,句子冗长,语言晦涩,也许心情也不好,甚至在皱眉,这些情形都会使人处于认知紧张状态。

    造成这种放松或紧张状态的不同原因会相互影响。处于认知放松状态时,你有可能心情不错,因此会喜欢你亲眼所见的事物,相信你亲耳所闻的消息,相信你的直觉,感到当时的状态是舒适而熟悉的。此时,你的想法也有可能相对随意、肤浅。当你感到紧张时,你更有可能警惕、多疑,会对手头上的事情投入更多精力,感觉局促,较少犯错,但你的直觉和创造相较平时会下降。

    由记忆造成的错觉

    错觉这个词会让人马上联想到视错觉,因为我们都很熟悉那些令人产生误解的图片。不过,并不是只有视觉才会产生错觉,记忆也容易产生错觉,并且这种现象更加普遍。

    戴维·斯滕比尔(David Stenbill)、莫妮卡·比格特斯基(Monica Bigoutski)、莎娜·蒂拉纳(Shana Tirana),这些名字都是我自己编出来的。如果在接下来几分钟内再次看到这些名字,你很可能还记得自己在哪里见过它们。你心里清楚这些名字并不是那些为数不多的名人的名字,而且有那么一段时间你会记住这一点。但假设几天后你看到一长串名单,其中包括一些知名度不高的名人和你从未听过的“新”名字,而你的任务是挑出名单中所有名人的名字,这时你很可能会将戴维。斯滕比尔当成名人,尽管你并不清楚自己是否在与电影、体育运动或是政治有关的新闻中听说过他的名字。心理学家拉里·雅各比(Larry Jacoby)是第一位在实验室中论证了这种记忆错觉的学者,且发表了一篇名为“一夜成名”的文章。这种情况是怎样发生的呢?要想弄明白,先问问自己是如何知道一个人是否出名的。一些真正有名的名人,例如爱因斯坦、博诺·沃克斯、希拉里·克林顿等,你会在脑海中为他们建立一个信息丰富的记忆档案。但当你在几天后再次见到戴维·斯滕比尔这个名字时,你并没有关于他的记忆档案,你有的只是一种熟悉感——你曾经在某个地方见过这个名字。

    雅各比巧妙地阐述了这个问题:“熟悉感有着简单而又强烈的‘不可复返性’,这种‘不可复返性’似乎说明这种感觉是对过往经历的一种直接反应。”其一大特性便是错觉。正如雅各比和他的许多同事所说的那样,看到戴维·斯滕比尔这个名字之所以觉得很眼熟是因为你更容易辨认出这个名字。再次见到曾经见过的词时会更容易识别出来——无论是在你面前一晃而过或是在嘈杂的环境中让你指认,你都能更加轻松地识别出这些词,而且你读出这些词的速度要比读出其他词快(快百分之几秒)。简而言之,当你指认一个早已见过的词语时,会感到更加放松。正是这种放松使你产生了那种熟悉的感觉。

    图5给出了检测这一观点的方法。挑选一个全新的单词,使其更容易被识别,它就更可能具有不可复返性。的确,如果你在测试前几毫秒时无意中瞥见了一个新词,或是在一张单词列表中看到了这个词,它跟表中的其他单词就形成了强烈对比,你也更有可能觉得这个新词很眼熟。这样的联系在相反的情况下同样适用。假设你看到了一张多少有些模糊的单词列表,其中一些单词非常模糊,另一些要稍微清楚一点,你的任务是挑出比较清楚的单词,此时你最近见过的单词就会比那些你不熟悉的单词看起来更清晰。正如图5指出的那样,引发认知放松和认知紧张的各种方法是可以相互转换的。你可能并不十分清楚是什么让认知更为放松或更为紧张。这也是熟悉感造成错觉的原因。

    什么样的信息更容易让人信服?

    “纽约是美国第一大城市”,“月亮绕着地球(公)转”,“鸡有4条腿”,在所有这些表述中,你在很短时间内便接收了大量信息,这些信息五花八门,各不相同。读过前面三个表述后,你很快就知道前两个是真实的,最后一个是错误的。但值得注意的是,判断“鸡有3条腿”是错误的,明显要比“鸡有4条腿”更容易。你的联想机制对后一种表述作出判断的速度相对缓慢,之所以这样是因为后一句话让你想到许多动物都有4条腿这一事实,你可能还会想到超市通常也会销售4只一包的袋装鸡腿。系统2负责信息转换,它也许会提出问题(关于纽约的那个问题是否太简单了),也可能要核对“(公)转”这个词的意思。

    想想你最后一次参加驾驶考试的情形吧。你真的需要一张驾驶执照去开一辆载重3吨的车吗?或许你学习认真,连答案在哪一页的什么位置都记得,还知道答案的逻辑关系。但我搬到一个新的州后通过驾驶考试所用的方法跟这些丝毫不沾边儿。我只是快速地读了一遍交规,希望自己能交好运通过考试。我开车有很长一段时间了,还是知道一些交通法规的,但一旦遇到不知怎样回答的问题时,我只能靠认知放松来解决。如果某个答案看起来比较熟悉,我就猜测它可能就是正确答案。如果某个答案看起来比较生僻(或是非常极端),我便排除它。系统1让人产生熟悉感,系统2依靠系统1产生的这种熟悉感来作出正误判断。

    我们还可从图5中得知,如果某个判断是基于认知放松或认知紧张作出的,那就一定会造成错觉。任何能使联想机制运行更轻松、更顺利的事物都会使我们心生偏见。想让人们相信谬误有个可靠的方法,那就是不断重复,因为人们很难对熟悉感和真相加以区别。权威机构和营销商都深谙这个事实。然而,心理学家发现,你不必完整地重复某件事情或某个想法,即使只说一部分,人们也可能相信你的话。经常看到“鸡的体温”这个短语的人会更容易接受“鸡的体温是144华氏度”(或其他随便什么温度都无妨)这一说法。只要熟悉其中一个短语,就会觉得对整个陈述都很熟悉,也会因此对陈述内容信以为真。如果你记不清楚某个陈述的来源,也无法将其与自己知道的事物联系起来,这时你就别无选择,只能跟着认知放松的感觉走了。

    假设你需要写一则能让接收方相信的消息,当然,这则消息是真实的,但人们并不一定相信它是真的。此时,你完全可以利用认知放松来帮助自己,真相错觉的有关知识也可以提供一些具体的建议来帮助你实现这个目标。

    这些建议总的原则是,任何缓解认知紧张的做法都会对你有所帮助,所以,你首先应该让字迹更清晰。请比较下面两个陈述句:

    阿道夫·希特勒生于1892年。

    阿道夫·希特勒生于1887年。

    上述两种说法都是错误的(希特勒生于1889年),但实验显示,第一句话更容易使人信服。其次,你的信息应该印刷在质量较好的纸上,并且文字和背景间的反差要达到极致。如果你使用彩色字体的话,亮蓝或大红的文字会比绿、黄、灰蓝等色调更容易让人相信文字内容的真实性。

    如果你很在意自己在别人眼里是否值得信赖、是否聪明睿智,那么说话时就言简意赅吧,能用简单句的时候就别用复杂句。在研究生中有一个广为流传的段子,说的是很多教授眼中那些最令人难忘的词汇。我在普林斯顿大学的同事丹尼·奥本海默(Danny Oppenheimer)反驳了这些学生的说法。在一篇名为“不切实际地运用华丽辞藻的后果:使用长句毫无必要”的文章中,他指出用浮夸的语言来表达熟悉的概念是一种智商低下、可信度差的表现。

    除了应该保持消息简洁外,还应使其易于记忆。如果可以的话,将你的想法以诗歌的形式表达出来,这样人们会更容易相信你的话。在一个多次被引用的实验中,受试者阅读了许多他们并不熟悉的格言,例如:

    危难时,敌人团结。

    水滴石穿,绳锯木断。

    亡羊补牢,为时不晚。

    另一些学生读到的格言版本则是没有什么韵脚的:

    危险团结敌人。

    再轻的击打也能放倒一棵大树。

    承认错误就相当于得救了一半。

    由上可见,押韵的格言比没有韵脚的格言显得更加深刻。

    最后,如果你需要引用一些内容,选择一些容易上口的名字准没错。在一项实验中,我们要求受试者通过两份经纪公司的报告去评估几家虚拟的土耳其公司的发展前景。每家公司都有两份相关报告,其中一份来自一家名字上口的经纪公司(比如Artan),另一份则来自一个名字很拗口的经纪公司(比如Taahhut)。两份报告有时会持不同意见。观测者能采取的最佳方法就是对两份报告进行综合评估,但他们并没有这样做。相比名字拗口的经纪公司的报告,他们更相信名字上口的经纪公司的报告。记住,系统2是非常懒惰的,它不愿付出努力。如果可能的话,消息的接收方会离所有需要付出精力的事物远远的,包括名字复杂的信息源。

    所有这些都是很好的建议,但是我们不能因此而得意忘形。如果你的信息是明显荒谬的或是与接收方已知的事实相左,那么即使你把高质量的纸、鲜艳的颜色、押韵和简单的语言全都用上,也很难提高信息的可信度。做这些实验的心理学家并不认为其他人是愚蠢和容易骗的。他们认为,我们所有人的生活都受系统1所产生的印象指引,但我们通常不知道这些印象从何而来。你怎么知道某个陈述是否正确呢?如果信息富有逻辑性、与你所持的信念或偏好有联系,或是源自你信任和喜爱的信息源,你便会有认知放松之感。但问题在于,可能还有其他的原因导致你感到放松,包括字体的清晰度和优美的韵律,你无法轻易找到这些感觉的来源。这便是图5带给我们的信息:放松或紧张之感是由多种原因导致的,难以将它们理清。虽然这很难,但也不是不可能。人在备受鼓舞时,就能克服一些导致真理错觉的外在因素。然而,在大多数情况下,系统2都会采纳系统1的建议,并继续运作。

    股票代码上口,回报率也相对较高

    联想关系的对称性是讨论联想连贯性的首要主题。正如前文所述,当人们将铅笔咬在嘴里或是把球放在眉心使自己“微笑”或“皱眉”时,也会感受到平时那种微笑或皱眉时所表达出来的情感。自我强化的相互作用同样也能在认知放松的研究中有所体现。一方面,当系统2参与到那些需要努力的事情中时,我们就会感到认知紧张。另一方面,无论是什么原因引起的认知紧张都有可能将系统2调动起来,改变人们处理问题的方式,使他们不再随意且凭直觉做事,而是转向更加专注的分析性思维。

    前文所提到的球拍和球的问题,测试出人们在回答问题时有这样一个倾向,即不假思索地将脑海中出现的第一个想法当做答案。肖恩·弗雷德里克之所以选择了球拍和球的问题及其他两个问题,是因为它们可以唤起一个最直接但却是错误的直觉性答案。这个认知反应测试的另外两个问题是:

    如果5台机器能在5分钟生产5个小零件,那么100台机器生产100个小零件需要多长时间?100分钟还是5分钟?

    湖中有一片睡莲叶子,这片叶子以每天增长一倍的速度向外扩散。如果48天后莲叶就能覆盖整片湖面,那么其覆盖湖面一半的面积需要多长时间?

    24天还是47天?

    两个问题的正确答案。(5分钟和47天)

    研究人员召集了40名普林斯顿大学的学生来做这个认知反应测试,其中有一半问卷使用的是浅灰色的小字。拿到这部分问卷的学生可以辨认出上面是些什么字,但这样的字体会导致他们认知紧张。测试结果清楚地表明:当问卷上的字体清晰时,90%的学生至少会犯一个错误;但当字体勉强能够辨认时,他们的错误率却降到了35%。是的,你没有看错:字体模糊不清时,学生的表现更好。这是因为,无论认知紧张是由什么原因造成的,它都更有可能激发系统2来抑制系统1所给出的直觉性答案。

    《大脑一放松,脸上现笑容》这篇文章描述了这样一个实验:让受试者快速浏览一些物体的图片,在播放其中一些图片时,先在整个物体出现之前用快得令人难以察觉的速度呈现其轮廓。研究发现,受试者在识别这些图片中的物体时会相对容易。实验人员对受试者面部肌肉的电脉冲进行测量,来记录肉眼难以观察到的细微而短暂的表情变化,并由此测出受试者的情绪反应。不出所料,当图片上的物体更容易识别时,人们会微微一笑,眉头舒展,可见认知放松与良好的感觉相互关联似乎是系统1的一个特点。

    正如所料,朗朗上口的单词会唤起人们的正面态度。若某公司有一个上口的名字,其股票发行第一周往往会取得比其他公司更好的成绩,虽然这样的效果会随着时间推移而逐渐消失。如果股票有一个读起来上口的代码(例如KAR或LUNMOO),这只股票就会比有着PXG或ROD这样拗口代码的股票表现优异,并且这种优越性似乎还会持续一段时间。瑞士的一项研究发现,像Emmi、Swissfirst、Comet等有着顺口名字的股票会比GeBerit、Ypsomed这样名字拗口的股票带来更多的回报。

    如图5所示,重复能引发放松状态和令人舒心的熟悉感。著名心理学家罗伯特·扎伊翁茨(Robert Zajonc)曾潜心关注重复某种刺激和这一刺激最终带来的轻微情感波动之间的关系,扎伊翁茨称之为曝光效应(mere exposure effect)(又称多看效应、(简单、单纯)暴露效应、(纯粹)接触效应等,是指个体接触一个刺激的次数越频繁,个体对该刺激就越喜欢的现象)。在密歇根大学和密歇根州立大学这两所大学的校报上所做的实验是我最满意的实验之一。在几个星期的时间里,一个类似广告的板块出现在校报的头版上,上面写着以下某个土耳其语单词(或像土耳其语那样发音的单词):kadirga, saricik, biwonjni, nansoma,iktitaf。这些词语重复的频率各不相同,其中一个只出现过一次,另外一些分别出现过2次、5次、10次和25次。(在其中一所大学校报上出现得最多的单词在另一校报上出现的频率则最低。)没有人就这个问题作出解释,如有读者询问,得到的回答都是:“买下这个板块的人不愿透露身份。”

    当这一系列神秘的广告结束后,研究人员在校园内散发调查问卷,询问学生对每一个土耳其语的印象,是有“好感”还是很“反感”。结果令人惊奇:相比只重复了一两次的词,受试者对那些重复次数较多的词更有好感。通过使用汉字、人脸和任意形状的多边形所做的实验也都再次证实了这一发现。

    曝光效应并不依赖对熟悉程度有意识的体验,事实上,曝光效应完全脱离了意识:当重复的单词或图片迅速闪过,快到观察者根本没有意识到看见它们时,观察者同样还是更为喜欢重复率高的单词或图片。现在我们应该清楚的是,系统1能对系统2意识不到的那些事的印象做出回应。事实上,当人们完全没有意识到自己看见了刺激物时,其曝光效应会更强。

    扎伊翁茨声称,这种只要不断重复接触就能增加喜欢程度的现象,是一个极其重要的生理现象,可推及所有动物身上。要想在一个危机层出不穷的世界生存,一个有机体对新奇刺激应该谨慎回应,随时保持警惕和逃离的状态。若一种动物对新奇的事物没有心存戒备,其生存概率就会很低。然而,如果了解到这个刺激物是无害的,最初的谨慎便会渐渐消失。扎伊翁茨称,曝光效应的产生是因为一个刺激的重复曝光并没有产生不好的影响,这样的刺激最终会成为一个安全信号,而安全的就是好的。显然,这样的观点并不只适用于人类,同样适用于其他物种。为了证实这一点,扎伊翁茨的一个助手给处于孵化状态的鸡蛋放不同的音乐,随后,孵化出来的小鸡在听见孵化期间所听到的音乐时,发出的哀鸣要少得多。

    扎伊翁茨为他的研究项目作了一个很有说服力的总结:

    重复曝光的结果有益于机体适应其所处的有生命和无生命的环境。这一效应能使机体鉴别出安全的物品和栖息地,是最为原始的社会性依附的基础。因此,重复曝光构成了社会组织和社会整合的基础,而社会组织与社会整合又是心理稳定与社会稳定的基础。

    积极情感和系统1的认知放松之间的联系由来已久。

    创新是发生在能让人联想无限的环境中的

    1960年前后,一个名为萨尔诺夫·梅德尼克(Sarnof Mednick)的年轻心理学家认为他已发现了创新的本质。他的观点虽然简单却很有力:创新与出众的记忆力有关(创新是极佳的联想记忆)。他设计了一个测试,名叫远隔联想测验(Remote Association Test,RAT),这个测验直到今天还常常被用来研究创造力问题。

    举一个简单的例子,请考虑下面三个词语:
    村舍 瑞士人 蛋糕
    你能想到一个与这三个词都有关联的词吗?也许你想到了答案是奶酪。再看看下面这个例子:
    潜水 灯光 火箭
    这个问题要难得多,但它的确有一个独一无二的答案。尽管这个答案是每个说英语的人都知道的,但在受试者中,只有不足20%的人在15秒内想到了这个词。问题的答案是天空。当然,不是任意三个词都能与同一个词相联系。例如,“梦、球、书”这三个词就不能引发一个人人都认为正确的共同联想。

    近些年来,由德国心理学家组成的几个研究小组都曾对远隔联想测验作过研究,对认知放松问题的研究取得了重大进展。其中一个小组提出了两个问题:在人们知道答案是什么之前,能否感知随意三个词是否有一个共同的联想意义?心情对这项任务有何影响?为了弄清这些问题,他们首先让受试者花几分钟时间回想一下自己生活中那些快乐或是悲伤的片段,这个回想的过程使一些受试者感到快乐,而让另外一些人感到悲伤。然后,他们向受试者展示一连串三个为一组的词语,这些组词语中有50%是组内的词语有一定联系的(比如潜水、灯光、火箭),而其余50%的组内词语则没有什么联系(例如梦、球、书)。随后,实验人员要求受试者快速按下两个键中的一个来表明词语是否有共同联系,按键时间限定在两秒以内。如此短的时间内,这些受试者根本无法找到问题的答案。

    实验带来了很多惊人的发现。第一个令人惊讶的地方是,参与上述实验的受试者猜测所给问题答案的准确率要比他们随便选出答案的准确率高很多。这个结果很让人吃惊。很明显,认知放松感被联想机制中一个微弱的信号激发起来,这个信号在组内三个词语的关联得到还原之前就已经“知道”它们是相关的(有共同的联系)。认知放松在这种判断中起到的作用也在另一个德国小组所做的实验中得到证实:提高认知放松(启动、清晰的字体、事先看到词)的操作同样能增加人们将词视为相互联系的可能性。

    另一个重大发现是,人的心情在这项直觉性任务中产生了重要影响。实验人员用电脑编写了一个“直觉参数”用于检测准确性。他们发现,通过让受试者想一些愉快的事,使他们在测试之前有好心情的话,猜测的准确率会提高一倍。一个更引人注目的结果是,心情不好的受试者完全无法准确地完成这个直觉性任务,他们的猜测还没有随便选择的准确率高。心情显然能够影响系统1的运行:当我们不舒服和不开心时,就会丧失自己的直觉。

    这些发现进一步证实,好心情、直觉、创造力、轻信以及对系统1不断增强的依赖性形成了一个关联群集。悲伤、警觉、怀疑、分析方法以及不断增强的努力程度等因素之间也是相互联系的。好心情使系统2放松对行为的控制:当人们心情好时,直觉和创造力会增强,但也会放松警惕,易犯逻辑性错误,这种关联与曝光效应一样,在生理上也讲得通。好心情是事情进展顺利的信号,周围的环境是安全的,卸下防备并没有什么影响;坏心情则说明事情进展不那么顺利,有可能存在威胁,必须要保持警觉。认知放松与愉快的感觉互为因果。

    除了认知放松和积极情感的关系之外,我们还可以从远隔联想测验中了解到更多信息。请简单考虑一下下面两组词:

    睡觉 邮件 开关 

    盐 深 泡沫

    在读第二组词时,你的脸上可能会露出一丝微笑,这是因为第二组词能引起一个共同的联想(答案就是“大海”)。你当然不可能知道自己的这一反应,但是只要对你的面部肌肉的电活动进行测量就能发现这一点。这种微笑反应出现在那些对于共同关联事物还并不了解的受试者的脸上。实验人员仅仅是给他们看了纵向排列的三个词语,然后指示他们看完后按下空格键。看到有共同联想意义的三个词而产生的认知放松似乎本身就能令人心情舒畅。

    正如很多科学家所言,虽然我们证实了好心情、认知放松和对连贯性的直觉之间是相互关联的,但这种联系并不是必然的因果关系。虽然认知放松与微笑同时出现,但一定是好心情引发了连贯的直觉反应吗?答案是肯定的。证据源自一个巧妙的实验方法,这种方法现在越来越受欢迎。在这个实验中,一些受试者听到了实验人员讲的一个封面故事,也许正是这个故事给他们带来了好心情:他们都戴着耳机,听着音乐。实验人员告诉他们:“先前的研究显示,现在播放的音乐会对人的情绪反应产生影响。”这个故事完全使人丧失了对相关性的觉察。这一发现证明,在看到三个词(如果三个词相关则感到愉快,不相关则不愉快)后,短暂的情绪反应事实上是对相关性判断的基础。没有什么是系统1做不到的。情感变化现在是可以预料到的,正因为这些变化不足为奇,我们才不会随意将情绪变化归因于词语。

    这项心理研究是迄今为止最为成功的一例,其成功之处在于将实验技巧与实验结果巧妙结合在一起,而这两者都是特色鲜明且极为惊人的。在过去几十年里,我们已经掌握了许多关于系统1自动运作的知识。我们现在掌握的很多知识听起来像是三四十年前的科幻小说。无论是模糊的字体会影响人们对真理的判断,还是提高认知能力,或是人们对每组三个词的认知放松感引起的情感回应会唤起他们头脑中的连贯印象,这些都不再难以想象。心理学研究已经取得了长足的发展。

    示例——认知放松“不要只是因为字体不清楚就否定他们的商务计划。”“我们一定愿意相信这个观点,因为总有人这样想,但还是三思而后行吧。”“熟悉了,就会喜欢,这就是一种曝光效应。”“我今天心情很好,我的系统2也比平时懒惰,我得格外小心了。”

    第6章 意料之外与情理之中

    前面已经介绍了系统1和系统2的主要特点及功能,尤其是系统1,其介绍更为详细。我将我们的大脑比喻成一台功能非常强大的电脑,虽然按传统硬件标准来看,它的运行速度很慢,但通过不同想法联结而成的巨大网络上的相关联结,也能为我们展现这个世界的构造。而且,联想机制的不断激活也是自动完成的。我们(系统2)具备某种能力去控制记忆的搜寻活动,也能对其进行编辑,这样一来,在特定情况下我们才可以集中精力去追踪某个事件。接下来我们将对系统1的非凡之处及其不足之处作更详细的介绍。

    从第一次的惊喜到第二次的习以为常

    系统1的主要功能是维护并更新你个人世界的模式,它呈现的都是常态下的思维模式。这个模式由许多联想和结果共同构成,这些联想由情境、事件、行为等概念引发,而结果则总是伴随某种规律出现,有可能是两者同时出现,也有可能出现时间只差那么一点点。随着这些联系的形成和加强,联想概念的模式逐渐展现出发生在你生活中的各种事件的结构,这一模式还将决定你对当下的理解和对未来的期望。

    对惊喜的承受能力是你精神生活的一个重要方面,而且惊喜本身也是最敏感的指示,它可以表明我们如何理解这个世界,我们希望从这个世界中得到什么。惊喜主要有两种形式。有些期望是积极、有意识的——你知道你正在等待某件特别的事情发生。当时间迫近时,听到敲门声,你会期望是你的孩子放学回家了;打开门时,你期望听到自己熟悉的声音。如果非常期望的事情没有发生,你会很惊讶。不过,你不怎么期盼的事情也很多。你不会等待这些事情发生,但如果真的发生了,你也不会惊讶。因为这些事在某种情境下是正常的,尽管可能不是你欣然盼望的。

    一个插曲如果反复出现就可能不那么令人惊喜了。几年前,我和我的妻子在澳大利亚大堡礁的一座小岛上度假,岛上只有40间客房。我们去吃饭时,竟然遇见了一位老朋友——心理学家乔恩,我们当时感到很意外。朋友间相互问候,都觉得很巧。第二天乔恩就离开了度假村。大约两个星期后,我们去伦敦的一家剧院看电影。剧场关灯之后,一位来迟的人坐到了我旁边。幕间休息时,我发现我旁边坐着的竟是乔恩。我和妻子事后说起这两件事时,我们两人都意识到了两个事实:第一,这次碰面比上次更巧;第二,第二次碰到乔恩时我们的感受不如第一次那么惊讶。显然,第一次碰面在不知不觉中改变了乔恩在我们大脑中的印象,他现在是“只要我们外出旅行就会碰见的心理学家”。我们(系统2)知道这样想很可笑,但系统1却使大脑认为在陌生的地方碰到乔恩是件正常的事。如果我们在伦敦的那家剧院里碰到的是其他熟人,我们会比遇到乔恩感觉更惊讶。如果单纯从可能性来看的话,在剧院里碰到乔恩的概率比碰到我们那几百个熟人中的任何一个的概率都要小得多,然而现在看来,在那里碰到乔恩却似乎更正常。

    在某些情况下,消极的期望很快会变成积极的,就像我们在又一次巧合中发现的那样。几年前,一个周日的傍晚,我们驱车从纽约赶往普林斯顿,很长一段时间以来,我们每周都会这样穿梭于两个城市之间。那天我们看见了不同寻常的景象:路旁有辆车着火了。我们第二周到达那段路时,又有一辆车着火了。我们发现与第一次相比,第二次遇到这种情况时明显表现得不那么惊讶了。这个地方现在就是“车着火的地方”。因为事件发生的情景相同,第二次事件引起了积极的期盼:每当走到这个路段时,我们都会想起着火的车,而且自己已经作好再看到一次的心理准备(当然,我们没有再看见过),几个月也好,几年也好,我们都有足够的心理准备。

    心理学家戴尔·米勒(Dale Miller)和我曾经合写了一篇文章,在文中我们试图解释为什么我们觉得很多事情是正常或是不正常的。接下来我会引用那篇文章中我们用来描述“常态理论”的一个例子,不过我对这个例子稍稍作了改动:

    在一家高级餐厅,一位观察者随意观察着邻桌的顾客。他发现第一位品汤的顾客往后退了一下,好像有些痛苦。接下来的一大堆事都因这个动作而发生了变化。一位服务生不小心碰到了一位喝汤的顾客时,这位顾客吓了一跳,而这根本没什么可惊讶的;另外一个顾客也喝了从同一个碗中盛来的汤,喝后他强忍着没有叫出来,对此我们也没有感到惊讶。这些事和其他种种事情本应是不正常的,但现在却显得正常了。因为这些事是对之前那些预期的肯定。这些事之所以看上去正常是因为它们重复了原来的情节,记忆中的这些情节相互联系,对这几个事件作出了解释。

    试想你就是餐厅中的那位观察者,第一次看到顾客对汤的反应时你感到惊讶,服务生在碰他时他吓了一跳,你也会感到惊讶。然而,第二次非正常事件会提取你对第一次事件的记忆,两件事联系起来似乎就合乎情理了。这两件事都符合一个模式,模式中的顾客是个特别容易紧张的人。另外,如果第一位顾客表现出痛苦状后,另一位顾客拒绝喝这种汤,这两件意外的事也会被联系起来,说明这碗汤肯定有问题。

    “摩西上方舟时,每种动物各带了多少?”发觉这个问题有问题的人太少了,因而有人将此称为“摩西错觉”。摩西并没有带动物上方舟,带动物上方舟的是诺亚。就像那位往后退的喝汤顾客一样,摩西错觉可以通过常态理论来解释。动物登上方舟给人们营造了《圣经》的文化背景,而摩西也出现在这个背景中,虽然你对他并没有什么特别期待,但对他的名字你也不会感到惊讶。况且,摩西和诺亚这两个名字的英文元音和音节数都是相同的,这也容易使人将二人混淆。就像那些三个一组的词语会令人产生认知放松一样,你在不知不觉中就将“摩西”和“方舟”联系在了一起,很快地接受了这一提问。但如果句中的摩西换成乔治。W.布什的话,你就会认为这是一个很蹩脚的政治笑话。

    若“关于水泥”这种说法与当前被激活观点的情境不搭,系统就会察觉到这一反常现象,就像你刚才的感受一样。你本来对“关于”之后是什么并无具体概念,但当“水泥”一词出现时,你就知道这个句子有点不对劲儿了。对大脑反应的许多研究表明,系统对违反常态的问题的察觉速度是惊人的,察觉过程也是微妙的。在最近的一次实验中,当人们听到“地球每年绕着麻烦转”这个句子时,听到“麻烦”这一莫名其妙的词之后不到0.2秒,对大脑活动进行检测就会发现一个特殊的图谱。更值得注意的是,当一个男声说“我确信我怀孕了,因为我每天早晨都想吐”,或者当有人操着上流社会的腔调在说“我后背上有一个很大的文身”时,同一个人对这些话的大脑反应速度是相同的。一定要立刻调动起来大量的知识,思考这些陈述与事实之间是否协调:一听这声音就知此人是上流社会的,而上流社会的人身上很少有很大的文身。

    我们能相互交流,因为我们关于世界的知识和对文字的运用水平都相当。我要是提到桌子,没有其他特别的描述的话,你一定知道我指的是一张普通的桌子。你能确定这张桌子的表面大致是平的,而且桌腿远远少于25条。对于很多事物的常态我们都有认识,这些常态给我们提供了背景知识,使我们能够察觉到诸如怀孕的男性和文身的上流社会人士这样的反常现象。

    要想了解标准在交际中的作用,请看“大老鼠爬过了小象的鼻子”这个句子。我敢肯定你想象中的老鼠和小象的体型和我想象的差不了太多。常态下,这些动物的体型有典型的或平均的大小,而且,常态中还包括了这一类动物的变化范围及变异性。我们都不可能在脑中想象到比象还大的老鼠爬过比老鼠还小的小象的鼻子。但我们各自都能想象到比鞋还小的老鼠爬过比沙发还大的大象。系统1理解语言,也了解分类标准,它能辨明那些貌似正确的价值,也能廓清那些最典型事例可能出现的范围。

    简的钱包是怎么丢的呢?

    “弗雷德的父母来迟了,酒席承办商应该很快就到了,弗雷德很生气。”你知道为什么弗雷德会生气,也知道他生气不是因为酒席承办商还没来。在你的联想网络中,生气和不准时被看成是可能的因果关系,但生气和盼望酒席承办商来的想法却没有这种联系。在你读到这句话时,脑海中马上就形成了一个连贯的故事,你立即知道了弗雷德生气的原因。找到这种因果联系是理解一个故事的一部分,也是系统1的一种无意识行为。而系统2——也就是有意识的自我——在接收到这个主观理解后,也接受了这种因果关系。

    纳西姆·塔勒布所著的《黑天鹅》一书中,有一个故事阐明了对因果关系的自主研究。他指出,萨达姆·侯赛因(Saddam Hussein)在伊拉克的藏身处被捕的那天,债券价格就开始上涨。早晨时,投资者显然想投资更安全的资产,而且《彭博新闻社》打出了这样的头条:美国国债上涨,萨达姆被捕不会遏制住恐怖主义。半个小时后,债券价格下跌,标题被修改为:美国国债下跌,萨达姆被捕刺激风险资产。显然,萨达姆的被捕是这一天的重大事件,因为自主搜索原因的方式影响了我们的思考,这件事就成了那天市场变动的原因了。这两个标题表面来看好像可以作为解释市场发生震荡的原因,但是对两个互相矛盾的结果作出解释的那条陈述其实什么都解释不了。

    事实上,所有的标题都要满足我们对逻辑连贯的需求:一件大事必然会带来一些后果,而这些后果也需要一些原因对其作出解释。我们对那天发生的事情所知有限,于是系统1便熟练地将这些知识片段组合成一个连贯的因果关系。

    请读这个句子:

    在纽约拥挤的大街上逛了一天,欣赏完美景后,简发觉自己的钱包丢了。

    研究人员对读过这个句子的人(这些人同时也读过许多其他故事)进行了一次突击性的回想实验,发现这些读者认为“扒手”这个词比“景色”一词与该句子联系更紧密,尽管后者在句子中出现了而前者却没有。联想连贯性原则告诉我们实实在在发生的事情。丢钱包这件事可能有很多不同的原因:钱包从口袋里掉了出去,或者落在了餐厅等。但是,丢钱包、纽约以及拥挤的街道三种想法同时存在时,这些读者都把丢钱包的原因指向了扒手。在那个喝汤的故事中,无论是第一位喝汤顾客在服务生碰他时做出的极端反应还是另一个顾客在喝汤时往后退,其结果都将对最初那次惊讶反应作出联想性关联的解释,因此整个故事看上去也是合理的。

    比利时的贵族心理学家阿尔伯特·米乔特(Albert Michotte)在1945年出版的一本书(1963年被译成英文)中颠覆了几个世纪来关于因果关系的思考,使人们至少回到了休谟对想法关联的研究时代。过去人们普遍接受一个观点,即我们通过对不同事件之间的相互关联进行反复观察,推断其在自然状态下的因果关系。我们曾无数次看到一个运动中的物体碰触另一个物体,使之随即开始运动,且运动方向相同(也并不总是相同)。这和台球相撞的情形一样;同样,当你推一个花瓶时,也会发生同样的事。米乔特却持有不同观点,他说我们能像看见颜色那样直接“看到”因果现象。为了展示自己的观点,他在纸上画了一连串黑色方块,让这些方块看起来像在连贯地运动,一个连着另一个,而这些方块也立即动了起来。那些观察者知道两者其实并没有真正相连,但他们却有种强烈的“因果关系错觉”。如果第二个物体马上开始移动,他们就会认为这个动作是由第一个物体“引起的”。很多实验表明,6个月大的婴儿会将许多事件及其续发事件看做有因果关系,而续发事件一旦发生改变,他们就会觉得惊讶。我们显然从出生时就对因果关系有感觉,当然,这种因果关系并不依存于理性思维,它们是系统1的产物。

    1944年,米乔特发表了他对物质性因果关系的实证研究。几乎就在同一时间,心理学家弗里茨·海德(Fritz Heider)和玛丽–安·西梅尔(Mary-Ann Simmel)运用一种和米乔特相似的方法展示了他们对“意向性”因果关系的看法。他们做了一部总长度只有1分40秒的电影,在这部微电影中,你能看到一个大三角形、一个小三角形和一个圆形。这些图形绕着一个貌似门开着的房子的图像转。观看者看到一个气势汹汹的大三角形正欺负一个小三角形,而那个圆形也受到了惊吓。圆形和小三角形联合起来共同对付大三角形的欺侮;他们还看到门周围(圆形和小三角形)的动作很多,最后小电影以一个爆发性的反击结束。毫无疑问,每个人对意图和情感都有很强的洞察力;只有患孤独症的人才体验不到这一点。当然,所有这一切全都在你的大脑中。你的大脑愿意甚至急切地想要辨别一些因素,确定这些因素的特点和特殊意图,并将其活动视为表达个人偏爱的举动。再次说明一下,我们生来就长于意向性归因:一岁以下的婴儿能辨别欺凌弱小的人和受害者;不管他们去抓什么东西,都知道要走最近的那条路。

    按自由意愿行事的体验与物质性因果关系没有什么联系。虽然是你的手捏起了盐,但你并不认为这件事与一连串的物质性因果关系有什么联系。你感觉这个行为是由一个“无形”的你做出的决策而引起的,因为你想要在食物里加点盐。很多人发现将自己的心灵描述成行为的根源和原因是很正常的。2005年,心理学家保罗·布鲁姆(Paul Bloom)在《大西洋月刊》(The Atlantic)上发表了有争议的观点,即我们生来就具有区分自然性和意向性的因果关系的能力,而这一能力也解释了宗教信仰的普遍性。他发现,“我们对物质世界和精神世界的感知完全不同,所以我们才可能对没有灵魂的身体和没有身体的灵魂进行想象”。我们注定能够感知得到的这两种因果关系模式使我们能够很自然地接受众多宗教中都存在的两个主要信念:无形的神是物质世界所有现象的最终原因,而不死的灵魂只是在我们活着时暂时控制我们的躯体,我们死后,灵魂也将离开躯体。在布鲁姆看来,因果关系的两个概念在进化过程中是分别形成的,同时也将宗教的起源追溯到系统1中去了。

    因果性直觉的特点是本书一再出现的主题,因为人们总是很不恰当地将因果性思考用于需要统计论证的情景中。统计性思维总是根据事物的不同类别和总体性质得出个案的结论。可惜的是,系统1并不具备这种推理能力;而系统2通过学习可以进行统计性思考,但几乎没有人接受过必要的相关训练。

    有了因果关系心理学做基础,我决心用两个比喻来描述心理过程,几乎不必考虑什么连贯性问题。我有时将系统1比喻成有着某些特性和偏好的媒介,有时又将其看做通过一个环环相扣的复杂模式来表现现实的联想工具。这个系统和工具是虚拟的;之所以用“媒介”和“工具”这两个喻体,是因为它们符合我们对原因的看法。海德的三角形和圆形并不是真正的媒介,只是把它们比做媒介来思考问题更轻松,也更自然。这样做不用那么费力思考。如果按照所发生事情的特点和意图(即两个系统)来描述它,或者有时按照呆板的规律性(即联想工具)来描述它,我觉得你(和我一样)就会发现了解思维活动更加轻松。我并不想让你相信这两个系统是真实存在的,不想像海德那样,想让你相信那个大三角形是个欺负弱小的角色。

    示例——常态和原因“若最后发现第二个申请人也是我的一个老朋友,我就不会像看到第一个来申请的朋友那么惊讶了。只要情节稍有重复,一种新体验也就不那么新鲜了。”“当我们调查人们对这些产品的反馈时,一定要确定关注的不只是平均水平。我们应该看到所有的常态反应。”“她接受不了自己只是运气不好这个解释,她需要一个有前因后果的解释,否则她会认为是有人在故意破坏她的工作。”第7章 字母“B”与数字“13”

    伟大的喜剧演员丹尼·凯(Danny Kaye)的一句话一直萦绕于我的脑际,从十几岁至今都不曾忘记。谈到一个自己很不喜欢的女人时,他说:“她最得意的姿态是忘乎所以,最喜欢做的事就是仓促下结论。”在我与阿莫斯·特沃斯基开始讨论研究统计性直觉的合理性问题时,这句话就浮现在我的脑海里。现在,我觉得这句话正是对系统1的功能恰如其分的描述。如果结论可能是正确的,偶尔的错误所付出的代价也在可接受的范围内,而且这种仓促的做法可以节省很多时间和精力,那么这种仓促的结论就是高效的。如果对情况不熟悉,在风险又高并且没有时间去搜集更多信息的情况下过早下结论就很冒险。此时,很可能会出现直觉性错误,但这种错误也许可以通过系统2的有意干涉而得以避免。

     [image file=Image00007.jpg]

    图6中三个方框的内容有何共同点?答案是,它们全都有歧义。你几乎可以确定地读出左边方框内所呈现的内容是“ABC”,右边是“12 13 14”,但这两个方框的中间那部分内容是一模一样的。你本可以将它们看做是“A13 C”和“12 B 14”的,但你却没有这样做。这是为什么呢?那是因为,同样的形状在字母的环境下就容易被看做是字母,在数字的环境下就容易被看做是数字。完整的环境能帮助你理解其中的每一个因素。那个形状是会引发歧义的,但你过早地对它的“身份”下了结论,并且根本意识不到你已经赋予了某种歧义以解释。

    看到中间框的内容,你可能会把安(Ann)想象成一个满脑子都是钱的女人,她正走入一栋有出纳员和地下金库的房子。但这个貌似可信的理解并不是唯一的可能,这个句子同样有歧义。如果在这个句子之前有“他们沿着这条河缓缓地漂向下游”这样一句话,你就会想到一个完全不同的场景。当你一直在想河流的问题时,“bank”(这个单词有“岸边”和“银行”两个意思)这个单词就与钱没什么联系了。在没有清晰情境的情况下,系统1会自行建立一个可能的情境。我们知道这是系统1判断的结果,因为你并没有意识到自己作了选择,也没有意识到还可能有别的解释。除非你最近一直在乘独木舟,否则你去银行所用的时间肯定要比在河里漂流的时间多,所以你才会根据最近所经历的事化解了“bank”一词的误解。当我们对答案不确定时,系统1就根据过往经历去赌一个答案。这种下赌的规则是明智的:最近发生的事及当前情境是作抉择时最重要的因素。如果脑中没有闪现出任何最近发生的事,那更为遥远的记忆便会呈现出来。你最早、记忆最为深刻的经历一定是唱英文字母歌,这首歌的开头一定是“ABC”,而不是“A13 C”。

    在这两个例子中最为关键的一点是:你作了一个确切的选择,但自己却没有意识到自己这样做了。你的脑海中出现的只有一种解释,而且你从未意识到这些问题会有歧义。系统1不会记得自己放弃的几个选项,甚至都不记得曾有过多种选择。有意识的怀疑需要同时在脑中记住多种互不相容的解释,需要付出努力,而这并不是系统1的长项。易变和怀疑是系统2的职责范围。

    是什么让你相信了那些荒谬之词?

    心理学家丹尼尔·吉尔伯特(Daniel Gilbert)因著有《哈佛幸福课》(Stumbling to Happiness)一书而广为人知。一次,他在一篇名为“大脑怎样产生信任”的文章中,以17世纪的哲学家斯宾诺莎的理论为基础,提出了一个关于信任与不信任的理论。吉尔伯特提出,在理解一个陈述之前,一定会先试图相信它:如果这个陈述正确的话,你必须先了解它的观点究竟是什么意思。只有这样,你才能决定是否“怀疑”它。最初你产生相信某种观点的想法,是因为系统1的自主运作,这种运作包括构建这一情况下可能性最大的解释。吉尔伯特认为,即使是一个毫无意义的陈述也会唤起人们最初的信任。你试试他给出的例子:“白鱼吃糖果。”你有可能意识到一个关于鱼和糖果的模糊印象,这个印象的产生过程,就是联想记忆自动搜索“鱼”和“糖果”这两个概念之间各种联系的过程,这一过程会使这种很荒唐的说法看起来竟有些道理了。

    吉尔伯特认为系统2的工作就是不信任/质疑,他用一个漂亮的实验来证明自己的观点。受试者看到一些很荒谬的说法,比如“一个叫丁卡的人是一团火焰”,他们要在几秒钟内说出这个句子的说法是“对”还是“错”。随后实验人员要检验一下受试者是否记得哪些句子是“对”的。这一实验还有一个条件,即受试者在执行任务的过程中还要按照要求记住一些数字。系统2的干扰产生了选择性效果:它使人们很难“不信任”那些错误的论断。在后续的记忆测试中,筋疲力尽的受试者最后竟认为许多错误的论断都是正确的。这个实验的寓意是深刻的:有系统2参与时,我们几乎会相信所有事情。因为系统1不仅好骗,还容易产生偏见,而尽管系统2掌管怀疑和不信任的大权,但是它有时很忙,不忙时也很懒惰,总会擅离职守。的确,已有证据显示,当人们劳累或是精力耗尽时,更容易受那些空洞却有说服力的信息影响,例如广告。

    联想记忆的运作是导致“确认偏误”的原因之一。如果有人问你:“山姆友好吗?”你就会想到山姆的各种行为举止;而如果有人问你:“山姆是不是很不友好?”你就很难想起他的许多举动。有一项专门针对证据确认问题进行的名为“积极测试策略”的研究,这项研究主要考察系统2是如何验证假设的。一些自然科学家认为应通过驳斥假设以证实其是否成立,但其他人(通常是科学家)则主张通过寻找符合他们当前观点的数据来证实假设是否成立。系统1产生的确认偏误不加批判地接受了建议,夸大了极端的可能性以及不可能的事件。如果被问及海啸在今后30年内袭击加利福尼亚州的可能性有多大,你脑中所呈现的图像很有可能就是海啸,你会更容易高估出现灾难的可能性。这就如同看到同吉尔伯特提出的那些类似“白鱼吃糖果”这种无意义的陈述时产生的反应一样。

    光环效应与群体的智慧

    如果你赞同一个总统的政见,你可能也会喜爱他的声音及着装。喜爱(或讨厌)某个人就会喜爱(或讨厌)这个人的全部—包括你还没有观察到的方面—这种倾向就叫做光环效应。这个术语已在心理学领域使用了长达一个世纪,但仍然没能成为日常用语。这是一件憾事,因为光环效应这个说法很好地诠释了我们生活中普遍存在的一种偏见,这种偏见在我们塑造对人与环境的看法时起着很大的作用。系统1可以通过很多比现实更简单却更连贯的方式来表现这个世界,光环效应就是其中一种。

    你在某派对上遇到了个名叫琼的女士,发现她既漂亮又善谈。现在,她的名字再次出现,并有可能是被叫去捐款。你知道琼有多慷慨吗?正确答案是:你事实上什么都不知道,因为没有理由可以让你认为善于社交的人在慈善方面会表现得慷慨。但你喜爱琼,当你想到琼时,那种喜爱的感觉会再次涌上心头。你自己慷慨,也喜欢慷慨的人。通过联想,你预先倾向于相信琼是慷慨的。现在,你认为琼是慷慨的,你可能会比以前更喜欢她,因为你又增加了一条令她讨你喜欢的特点。

    在琼的这则故事里,我们并没有她慷慨程度的真正证据,而是凭借自己对她的情感回应作出猜测,用猜测弥补证据的缺失。在其他情况下,证据会逐渐出现,由第一印象产生的感觉会影响你对事物的解读。所罗门·阿希(Solomon Asch)的一个实验堪称心理学实验中不朽的经典。他对两个人进行了描述,并要求其他人对这两人的个性进行评论。你认为艾伦和本这两人怎么样?

    艾伦:聪明—勤奋—冲动—爱挑剔—固执—忌妒心强

    本:忌妒心强—固执—爱挑剔—冲动—勤奋—聪明

    如果你像我们一样,你就会更喜欢艾伦一些。前几条列出的性格特征会改变后面出现的特征的含义。我们认为聪明人有理由固执,并且还会尊重他这一点。然而,一个忌妒心强又固执的人如果还很聪明的话,他身上就带有一些危险性。光环效应也可以化解歧义:如同“bank”这个单词一样,“固执”这个形容词也是有歧义的,但将它放在一定情境中歧义便会被化解。

    对于这个研究主题,还有许多衍生出来的实验。在一项研究中,受试者要先考虑一下描述艾伦的前三个形容词,然后再考虑剩下那三个描述艾伦的形容词,但实验人员告诉他们,后三个词是用来描述另外一个人的。随后,当受试者根据这些描述假想出两个人时,实验人员问他们,这6个形容词是否有可能用来形容同一个人时,大多数受试者都认为不可能!

    我们对一个人性格特征的观察顺序是随机的。然而,顺序的确很重要,因为光环效应注重第一印象,而后续信息在很大程度上都被消解掉了。在我刚做教授时,我评价学生论文的方式很传统。我会顺序一次取一本论文,一边读一边打分,然后计算出总成绩,之后再接着批改下一个学生的论文。最后,我注意到自己对每一本论文的评估都出奇地相似。我开始怀疑我的评分产生了光环效应,即第一次评分对接下来的所有评分都产生了一定影响。这样的机制十分简单:在我给某学生的第一份论文打了高分后,再碰到有模糊或是有歧义的陈述时都会对这个学生手下留情。这种做法看似合理。一个学生能将第一份论文写好的话,就不应在第二份论文中犯低级错误!但我评分的方法却存在一个严重的问题。如果某个学生写了两份论文,一份论点有力,另一份却经不起推敲,我则会因为批改的顺序不同而给出不同的分数。我曾经告诉学生两份论文的评分标准是一样的,但事实却并非如此:相比第二份论文来说,第一份论文对于总分的影响更大。所以这样的做法是不可取的。

    我采取了一种新的做法。我阅读并批改了某个学生第一个问题的答案,然后接着改下一个学生的相关论述,而不是按顺序读完第一个学生的整本论文才评阅下一份。我确定将所有分数都写在了论文集的封底,以避免在批改第二份论文时出现偏见(即使是无意识的)。在改变方法后不久,出现了一个令人担忧的结果:我对评分的自信程度比原来更低了。原因在于我频繁地感到一种不适。当我对某个学生的第二份论文感到失望时,便在他的论文集封底记下一个低分,但却偶然发现我给他的第一份论文打了最高分。我也注意到了我会不经意地改变尚未写下来的分数以缩小两份论文之间的分数差,并且,我很难克制住自己不这样做。我对同一个学生的论文评分通常相差巨大。这样的前后不一使我感到不确定和沮丧。

    我现在对自己的评分行为感到失望和不自信,但我认为这是件好事,因为它表明现在这个方法比原来的有进步。我先前所感到的一致性是伪造出来的,它使我有了认知放松之感,我的系统2也欣然接受了最后的分数。采用新方法之后,虽然第一个问题深深影响到我对之后学生的评估,但我允许自己这样做,因而学生某些问题答得好和不好的分数差别也就不是我有意为之的了。但我发现同一个学生在回答一个问题时表现优异,而对另一个问题的解答却很糟糕。当我改变方法时,这种令人感到不适的前后不一致就显露了出来:它不仅反映出随便拿一个问题去衡量学生水平的做法是不恰当的,还反映出我自己打出的分数同样不可靠。

    我采取的避免光环效应的评卷方法遵循了一个普遍原则:消除错误的关联!为了了解这一原则的工作原理,我们设想一下:向大量观察者展示一些装有硬币的玻璃罐,让他们估计一下每一个罐里硬币的数量。詹姆斯·索罗维基(James Surowiecki)在他最为畅销的著作《群体的智慧》(The Wisdom of Crowds)一书中解释道,一个人单独完成这个任务的效果并不理想,但一群人共同作出判断时准确率就很高。有些人高估了硬币的数量,另一些人低估了它,但对所有判断进行平均估算得出的平均值就会趋近于准确值。这种机制很容易理解:每个人都观察着同一个玻璃罐,他们的判断都基于一个共同的基础。另一方面,每个人犯的错误都与其他人的错误无关,(在没有系统性偏见的情况下)这些错误的平均值趋近于零。然而,只有在每个人的观察相互独立、每个人所犯错误之间不相关联的情况下,降低错误率的奇迹才能出现。如果观察者持有相同偏见,就算将他们的判断汇总起来也难以降低错误率。允许不同观察者之间相互影响会减少样本量,进而影响小组估值的准确率。

    想要从大量证据来源中获取最有用的信息,你应设法使这些来源相互独立。这也是警察办案时所遵循的规则。如果某个案件有多个目击证人,在录口供之前,这些证人是不能获准讨论案件的。这样做不仅是为了防止不怀好意的证人相互串通,还避免了没有偏见的证人相互影响。交流过各自目击过程的证人容易在证词中犯相似的错误,降低了他们所提供信息的总体价值。减少信息来源中的冗赘信息总是没错的。

    企业高管需要花大量时间主持会议,独立判断原则(及解除错误关联)可以直接应用到这些工作中。一条简单的规则就能发挥作用:在开始讨论某个问题之前,先让与会的每一位成员各自写下简短的意见阐明自己的观点。这个过程很好地利用了小组里不同知识和见解的价值。而开放性讨论这一常规做法总会注重那些发言早而又强势的人的意见,使得其他人一味附和他们的观点。

    眼见为实的想法往往让我们仓促作出决定

    我和阿莫斯早期合作时最美好的记忆中有一点很难忘,就是他总是乐此不疲地重复一个搞笑情节。阿莫斯能惟妙惟肖地模仿他大学时代的一位哲学老师,他用带着浓重德国口音的希伯来语咆哮着说:“你必须时刻牢记‘Primat of the Is’。”我从未弄明白他的老师所说的那句短语是什么意思(我想阿莫斯也不明白吧),但是阿莫斯却还是会说那些笑话。每当我们遇到大脑对现有信息和未知信息的处理方法严重失衡的问题时,他总会想起那句莫名其妙的短语(我最后也总是这样)。

    联想机制一个最基本的结构特点就是它只能回忆起已被激活的观点。无法从记忆中获取的信息(即使是无意识的)可能并不存在。系统1善于提取当前激活的想法来构建最可信的故事情节,但它不会(也不能)提取本系统中根本不存在的信息。

    衡量系统1是否成功的方法是看它所创造的情境是否具有连贯性,而与故事所需数据的数量和质量关系不大。信息匮乏是常事,一旦出现这种情况,系统1则会仓促作出结论。请思考下面的说法:“明迪克会是一个出色的领导吗?她聪明又坚强……”你的脑海中一定会马上闪现出一个答案—“当然会”。你根据非常有限的信息选择了一个最佳答案,但是你却行动过早。试想一下,如果紧随其后的两个形容词是“腐败“和”严酷“,你该怎么办?

    在对明迪克这位领导作出快速判断时,请注意有些事你并没有做,你没有自问:“在形成对某人是否具有领导才能的看法之前,我应该了解些什么?”系统1在第一个形容词出现后就开始自主运作了:聪明是好的,既聪明又坚强就更好了,系统1非常轻松地生成了这种想法。如果有新信息出现(例如明迪克思想腐败),这个故事就会被改写了,但是系统1并不会等待也不会出现主观上的不适。对于第一印象的偏好依然存在。

    寻找连贯性的系统1和懒惰的系统2相结合,意味着系统2将会赞同许多直觉性的信念,而这些信念又准确地反映了系统1产生的印象。当然,系统2也能对证据采取系统而谨慎的处理方法,还能在作决定之前考虑出现的众多选项—设想你正在卖房子,你就会设法搜寻一些你不知道的信息。然而,即使是深思熟虑后的决定,系统1也能对其产生影响。系统1的信息输入从未停止。

    在证据不足的情况下过早下结论对我们理解直觉性思考非常有帮助,本书也常提到这样的情况,我将会用一个冗长的缩写来代表这种情形:WYSIATI,意思为“What you see is all there is”,即眼见即为事实。系统1基本上对于引起印象和直觉的信息的质量和数量都不敏感。

    阿莫斯与他在斯坦福大学带的两名研究生作了一项与“眼见即为事实”直接相关的研究。受试者得到了一些证据并且知道这些证据是片面的,而研究者则是要观察他们拿到证据后的反应。这些受试者接触到的都是法律案例,下面就是一例:

    43岁的被告戴维·桑顿(David Thornton)是工会界代表。9月3日,他来到了“平价大药房”168号进行例行视察。他来到这家药店还不到10分钟,一名驻店经理就过来告诉他不能再站在店里和员工们说话,他只能利用员工休息时间在一间密室里见见他们。在工会与“平价大药房”的合约中,这一要求是得到允许的,但从未执行过。当桑顿拒绝这个要求时,经理告诉他,要么遵守约定,要么离开药店,否则他将被逮捕。此时桑顿暗示经理,在不妨碍生意的情况下,他一直以来都是在店里与员工交谈的,每次谈话时间也就是10分钟左右,从来也没有人反对过这一做法,他宁愿被抓也不愿改变例行的视察程序。于是,经理叫来了警察,警察以非法侵入的罪名逮捕了桑顿。在桑顿留了案底并被关押在拘留室一段时间后,所有的指控都被取消。现在,桑顿准备起诉“平价大药房”非法拘留。

    所有受试者都阅读了这些背景材料,除此之外,每一组受试者还听了控辩双方代理律师所作的陈述。情况自然是工会方的律师将逮捕视为恐吓行为,药店方的律师则认为在药店进行谈话扰乱经营秩序,经理的行为是合理的。还有一些受试者就像陪审团成员一样听了控辩双方的陈述。双方律师并没有增加任何背景材料中未提及的有用信息。

    所有受试者都充分了解了整个过程,那些只听到其中一方辩词的受试者能够很轻松地为另一方写出辩词。然而,片面的证据陈述对判断有着重大影响。另外,只掌握一方证据的受试者比掌握了双方证据的受试者更有自信。这正说明人们根据已有信息勾勒出的故事的连贯性增强了他们的自信心。一个好故事最重要的是信息的前后一致性,而不是其完整性。的确,你常会发现:知道得很少反而可以把已知的所有事物都囊括进连贯的思维模式中。

    眼见即为事实的理念有助于达成连贯性和认知放松的状态,从而使我们相信某个陈述是真实的。这一理念解释了我们能够快速思考的原因,解释了我们是如何弄清楚一个复杂领域中那些信息片段的含义的。很多时候,我们拼凑出的连贯情节与事实是无限接近的,完全可以用来支持理性活动。而我还会运用眼见即为事实原则对判断和选择中存在的很多偏见作出解释,以下便是其中的一部分:

    ·过于自信:正如眼见即为事实原则指出的那样,无论是证据的数量还是质量都与主观自信关系不大。每个人对自身想法的自信程度主要取决于他们对亲眼所见的事情的讲述效果,即使他们几乎什么都没有看到也没有关系。我们经常考虑不到自己有可能尚未掌握对判断起决定性作用的那份证据,却总是认为眼见即为事实。此外,我们的联想系统更倾向于选择已被激活的连贯模式,抑制怀疑和歧义。

    ·框架效应:同一信息的不同表达方式常常会激发人们不同的情感。“手术后一个月内的存活率是90%”的说法要比“手术后一个月的死亡率是10%”更令人安心。同样,说凉菜“90%不含脂肪”要比说“10%含有脂肪”更具吸引力。很明显,前述每组句子的深层含义都是相同的,只是表达方式不同而已,但人们通常能读出不同的含义,而且觉得自己的所见就是事实。

    ·比率忽略:回忆一下史蒂夫,那个本性怯懦、做事井井有条,常被看做图书管理员的人。这个人物性格的描述是生动形象的,尽管你清楚地知道男性农民比男性图书管理员多,但在考虑这个问题时,你总会忽略这个事实。你觉得自己的所见即为事实。

    示例—过早下结论“她对这个人的管理技能一无所知。之所以对他印象很好,是因为曾经听他作过一次精彩的报告。”“在讨论之前大家先独自考虑一下这个问题,这样可以避免观点的相互干扰,这样更利于集思广益。”“他们看了一份优质的咨询报告后就作了一个重大决定,他们并没意识到自己掌握的信息其实很少。”“他们并不想了解更多信息,因为那样可能会破坏整个故事情节。他们更愿意相信眼见即为事实。”

    第8章 我们究竟是如何作出判断的?

    你可以回答无数个问题,无论这些问题是别人问你的还是你自问的。同样,你能评价的事物特征也是无数的。你能数出这页中“的”字的出现次数,能比较自己家的窗子和马路对面那家的窗子哪个高,也能对你支持的参议员的政治前景作出评价,其前途无限光明还是前景堪忧,或是碌碌无为。这些问题由系统2来解决,系统2能调动注意力并通过搜寻记忆去寻找答案。系统2接受问题或提出问题:不管是提问还是回答,它都能引导注意力并搜寻记忆来找到答案。系统1以不同的方式运行,不断监视着大脑内外发生的一切,没有特定意图,也无须付出多少努力,只是对当时的情形作出全方位评估。这些“基本的评估”在直觉性判断中扮演了重要角色,因为人们常会拿它们来替代更难的问题—这也是启发法和偏见研究方法的基本理念。系统1其他两个特点也支持用一种判断代替另一种判断的做法。其中一个特点就是系统1具备跨维度解读价值观的能力,你可以回答一个大多数人都觉得很简单的问题:“如果山姆的身高和智商一样,那么他究竟有多高?”此时思维快捷方式便开始运行了。系统2会集中注意力回答某个特定问题,或是对某种情况的特殊属性进行评估,集中的注意力又会自动运行其他的评价程序,包括一些基本判断。

    看照片预测竞选胜出者,为何其准确率可高达70%?

    随着人类进化不断完善,系统1可以对生物体生存必须解决的主要问题提供一个连续的评估,这些问题包括:事情进展得怎么样了?我们面临的是威胁还是机遇?一切都正常吗?我应该是前进还是退避呢?这些问题也许对于生存在城市中的人而言,不像对大草原上的羚羊那样紧急,但我们有不断进化的遗传神经机制,可以持续不断地对威胁水平进行评估。我们通常用好与坏来评价不同情形,要么说要避开这种情况要么说可以泰然处之,没有问题。人的好心情和认知放松与动物对安全和熟悉程度的判断是相当的。

    如果想找一个“基本判断”的典型例子,想想只需一瞥就能区分朋友和敌人的能力就是了。这种能力能够提高人们在危险世界的生存概率,而这种专属能力也在不断增强。我在普林斯顿大学的同事亚历克斯·托多罗夫(Alex Todorov)曾经对与陌生人接触的安全性问题作出快速判断这一能力的生物学根源进行了探索。他认为我们生来就具有判断的能力,只需瞥一眼陌生人的脸,就能对这个人的两点重要事实作出判断:他有多强势(因此存在潜在的威胁性);这个人有多可信(不管他的用意可能是友好的还是充满敌意的)。脸型为判断提供了许多暗示:方下巴就是强势的信号。面部表情(微笑或皱眉)是对陌生人意图的判断提示,方下巴加上瘪嘴唇也许就预示着有麻烦了。看脸形的精确性不是很高:圆下巴并不代表温顺,笑容(在某种程度上)也是可以伪装的。不过,即使对陌生人作出判断的能力不高,具备这种能力也是我们的生存优势。

    这种古老的机制在现代社会得到重新利用:它对人们如何选举有些影响。托多罗夫向他的学生展示了一些人脸的图片,有时展示的时间只有0.1秒,他让这些学生按不同属性对这些面部图片进行评估,这些属性包括可爱程度和做事能力。结果所有学生对这些图片的评估结果非常一致。托多罗夫展示给学生的那些人脸图片并不是随意组合的,而是参加竞选的那些政治家的照片。大选结束后,托多罗夫将选举结果和普林斯顿大学学生所作出的能力评估进行了比较,这些学生当时并不了解这些候选人的任何政治背景,仅凭自己对这些照片的匆匆一瞥就作出了评估。事实证明,约有70%的参议员、国会议员和地方长官的竞选活动的胜出者也正是那些在照片评估中获得较高评价的人。这一惊人结果在芬兰的全国大选中得到证实,同样的情况也发生在英国的地区选举中,澳大利亚、德国和墨西哥的众多选举中也发生过类似事件。令人惊奇的是(至少对我而言是这样的),在托多罗夫的研究中,能力评估远比可爱程度的评估对选举结果的预见能力强。

    托多罗夫发现,人们总会结合力量和可信度两方面因素来评估一个人的能力。刚毅的方下巴和自信的微笑便可告诉我们,这个人很有能力。没有证据显示这些面部特征确实能预示某些政治家可以当选,但关于人们对胜出和出局候选人的判断研究显示,我们往往在投票前就会对那些不具备我们认可的面部特征的候选人持否定态度。在他的研究中,失败者引起的(负面)情感回应更强烈,我将这个例子称为“判断启发法”案例,接下来的章节中会沿用这个说法。投票者尝试着对候选人将来的任职表现生成一种印象,他们又转而依靠系统2快速自主地作出一种更加简单的判断,这一系统只有在必要时才会作出这一判断。

    许多政治学者也循着托多罗夫最初研究的路子继续深入研究这一问题,他们划定了一类投票者,这类投票者往往会不由自主地听从系统1的指挥。这些投票者经常看电视,对政治却所知甚少,而那些政治学者在他们身上找到了自己一直在寻找的东西。不出所料,对于那些信息贫乏、爱看电视的投票者来说,面部特征表现出的能力对其投票的影响较大,其受影响程度约为那些信息丰富、看电视少的投票者的3倍。显然,系统1对投票选择的影响因人而异,下文中我们还会遇到一些体现个体差异性的例子。

    当然,系统1理解语言,这种理解是建立在一些基本判断基础之上的,而这些判断通常又是在洞察事实和理解信息的基础上作出的。这些判断包括对相似度和代表性的判断,对因果关系的属性以及对联想和样本的可用性的判断。尽管判断的结果是用来满足任务要求的,但是没有具体任务时,这些判断活动照样也在进行着。

    基本判断的内容很多,但并不是每个可能的属性都需要判断。例如,我们可以简单看看图7。

    一眼看去,你便会对该图的很多特征有个初步印象。你知道左右两个长方体一样高,也很相似。然而,左边那个长方体的方块数和铺在平面上的方块数是不是一样,这可不是瞥一眼就能明了的事,而且你也想不出这堆方块能摞成多高的长方体。

     [image file=Image00008.jpg]

    为了证实左面长方体的方块数目和中间的方块数目相同,你需要数一下这两堆方块,对比一下结果,这个活动只有系统2能完成。

    平均长度与总长度是完全不同的数量概念

    还有一个例子,请看这个问题:图8中各条线的平均长度是多少?

     [image file=Image00009.jpg]

    这个问题很简单,系统1无须任何提示就能回答。实验显示,人们在不到一秒钟的时间里完全可以精确地记下很多线段的平均长度。此外,观察者的认知系统即使正忙于记忆,这些判断的精确度也不会受到影响。认知系统未必知道如何用英寸或厘米为单位来描述平均值,但是如果让其判断另外一条线是否符合平均值,它们的判断也是非常精确的。对于一组线的长度标准生成一个印象无须系统2的参与,系统1会自主且毫不费力地完成这一任务,就像它记一组线的颜色和它们之间不相平行的事实一样轻松。我们也可以立刻对众多物品的数量生成一个印象,如果其数量只有4个或少于4个的话,印象会很精确;如果更多的话,就会变得模糊。

    现在我们来讨论另外一个问题:图8中所有线的总长度是多少?这是一种全新体验,因为系统1无法为回答这个问题提供建议。为此题作答的唯一办法就是启动系统2,系统2会尽力估计平均值,评估或数出有几条线,用平均长度去乘条数得出结果。

    仅凭一瞥系统1计算出一组线的总长度,其结果多半不对,这一点你很清楚。你认为自己绝不会这样做。事实上,这是该系统一个重要的局限性。因为系统1通过原型或一组典型事例来代表不同事物分类,它能解决好平均问题,但对总量问题就束手无策了。一个类别的规模及其所包含的实例数量,在我们判断总额变量时常常被忽略掉了。

    在我们进行的众多实验中,有一项是根据那次损失惨重的埃克森–瓦尔德斯号(Exxon Valdez)原油泄漏事件的诉讼而设计的,我们询问受试者是否愿意掏钱买网来覆盖油池,因为这些油池常淹死迁徙的鸟类。受试者组成的不同小组分别表明了各组的意愿,他们愿意掏钱来拯救鸟的数量分别为2000只、20000只和200000只。如果拯救鸟类是个经济善举的话,其价值大小就要看总数这一变量了,即拯救200000只鸟应该比拯救2000只鸟更有价值。事实上,3个组的平均捐款分别是80美元、78美元和88美元,与鸟的数量没有什么关系。3组受试者做出反应的对象为原型—一只无助的小鸟被淹死的可怕画面,鸟的羽毛浸泡在黏稠的原油中。实验人员屡次发现,在这样的情形下,受试者几乎完全忽略了数量的概念。

    与强度等级匹配的描述

    诸如你的幸福感、总统受欢迎的程度、金融骗子的合理惩罚和政治家的未来前景等问题有一个共同的重要特点:这些问题都涉及隐含的强度或数量概念,因而我们也就可以使用“更”这个词对其进行描述:更幸福、更受欢迎、更严厉或(对政治家来说)更有力度。例如,一个候选人的政治前景可能是“她在首轮竞选就会出局”这样的背运,也可能是“她有朝一日会成为美国总统”,身居高位。

    接下来我们会了解到系统1的又一新能力。强度的等级在不同领域中都有“匹配”描述。如果罪行是颜色,杀人就应该是深红,颜色比偷窃更深。如果犯罪用音乐来表达,大屠杀就应该用强音,而停车不付钱则应该用弱音。当然,你对惩罚的强度也有类似的感觉。在传统的实验中,有些人用声音的大小来表达犯罪的严重性;其他人用声音大小来表达法律惩罚的严重性。如果你听到了两个声音,一个是表达犯罪的,一个是表达惩罚的,如果一个声音比另一个声音更响的话,你会有不公平之感。

    请思考这个例子(后文中还会提到这个例子):

    朱莉4岁时就能阅读。

    现在请将朱莉这个孩子的阅读能力与下面的强度等级进行匹配:

    若某人的身高和朱莉的早慧程度一样,那他有多高?

    你觉得6英尺(1英尺=0.304 8米)怎么样?显然太少了。那7英尺呢?也许又太多了。你希望找到一个高度能匹配4岁孩子极强的能力。虽然很强,但并不超群。15个月大就能阅读才是超群的能力,这就跟一个人身高7.8英尺一样。

    你的工作收入多高才能与朱莉的阅读能力相匹配呢?

    什么罪行的严重程度可以与朱莉的早慧程度相匹配呢?

    常春藤大学的毕业学分积点多高才能与朱莉的阅读水平相匹配呢?

    上述问题并不是很难回答,对吧?此外,可以肯定的是与你同处一个文化领域的人作出的匹配与你的回答会很相近。我们发现,人们根据朱莉的阅读年龄这一信息预估她的学分积点时,他们通过一种范畴向另一范畴的转换来回答这个问题,并且选出了相应的学分积点值。我们也明白为什么这种利用匹配进行预测的模式从统计学角度来看是错误的,尽管对于系统1来说这很正常,但对于统计学家以外的大多数人来说,系统2也可以接受这种做法。

    思维的发散性让我们作出直觉性判断

    系统1任何时候都可以同时进行多种估算,其中有些估算是持续不间断的常规评估。只要眼睛是睁开的,你的大脑就会对视觉范围内呈现出的立体事物进行评估,这种评估是对这些物体的形状、空间位置和特性等因素的全方位评价。这一评估活动的运行或对违背期望的事物进行持续监督的行为都是无意识的。与这些常规评估不同,其他评估行为只有在需要时才会进行:你不会持续评估自己有多高兴或多富裕,即使热衷政治,你也不会一直不间断地评估总统的执政前景。偶尔的判断是主观自愿的,这种判断才是有意识的。

    你不会不由自主地数出每个读到的词的音节数,但如果你选择这样做,就能数对。不过,想要使刻意计算的结果很精确并非易事:我们计算的结果往往比自己想要的或需要的要多。这种过量计算的过程就体现了“思维的发散性”。如同想用散弹猎枪瞄准一个点是不可能的一样(它射出的子弹是分散的),想要让系统1完全执行系统2的命令且不做多余的工作也很难,这一点与散弹枪很相似。我很久以前从书上看到的两个实验就表明了这一点。

    其中一个实验让受试者听几对词,若他们听出这些词是押韵的,要马上按下一个键。下面两组词都是押韵的:

    VOTE–NOTE

     VOTE–GOAT

    在你看来,区别很明显,因为你看到了这两组词,而受试者只能听到单词。“VOTE”和“GOAT”押韵,但它们的拼写不同,虽然受试者听到了这两个词,但他们也会受到拼写的影响。如果两个词的拼写不同,受试者听出它们是押韵的速度就会慢些。尽管要求是比较声音,但受试者同时也对两者的拼写进行了比较,而且与声音无关的不匹配因素妨碍他们迅速作出判断。刻意回答一个问题却引起了另一个问题,这一行为不仅没必要,而且对主要任务的完成也很不利。

    在另一项实验中,受试者听了几个句子,如果句子是真实的,就要马上按下一个键,如果是假的,就按下另一个键。对以下这些句子的正确回应是什么呢?

    有些路是蛇形的。

    有些工作是蛇。

    有些工作像监狱。

    这三个句子从表述上来看都是错的。不过,你很可能已经注意到了第二个句子比另两个句子错得更明显,实验也证实了这一本质性不同。之所以存在这种不同,是因为第一句、第三句两个难句从比喻角度看是正确的。这次又是要进行一个预估活动却引起了另一个预估行为,而且,正确答案在冲突中更明显,但这个与回答并不相关的冲突却影响了系统的正常运行。在下一章中我们会发现,思维的发散性和强度匹配结合起来就可以解释为什么我们对很多自己不很了解的事情能够作出直觉性判断。

    示例—判断问题“评价一个人是否有吸引力是一种基本判断,不管你是否想这样做,这种评价都是不由自主进行的,也会对你产生影响。”“我们的大脑中有一些线路,这些线路可以从脸型来推断一个人统领大局的能力,即他看上去有些领导气质。”“如果强度与罪行不匹配,惩罚则不可能公正。就像是你可以用光的亮度来与音量的大小匹配一样。”“关于思维的发散性,有这样一个明确的例子:他被问及是否认为这家公司财力雄厚时,他想到的却是该公司令其钟情的产品。”

    第9章 目标问题与启发性问题形影不离

    关于你的思维活动,有一点值得注意,即你很少被问题难倒。的确是这样,偶尔你会碰到这样的问题:17×24=?你无法立即想到这个问题的答案,但这种让人目瞪口呆的时刻毕竟是少数。当大脑处于正常的状态时,你几乎对眼前出现的所有事物都会有直觉和想法。对一个人不是特别了解时,你就知道自己是不是喜欢他;你也不知道自己为什么会相信或者不相信一个陌生人;你没有作过调查分析,却能感觉到一家企业一定会成功。有时,对于一些无法完全弄懂的问题,你也总能作出答案,而回答的依据是什么,连你自己也说不清道不明。

    找个相对简单的问题来作答

    我简单描述了如何从复杂的事情中提取直觉性的观点。对于有难度的问题,我们总是很难快速找到令人满意的答案,此时系统1就会找到一个相关问题来回答,这个问题比原来的问题更易作答。我把这种回答一个问题而绕开另一个问题的做法叫做“替代”。我还将采用以下术语:

    “目标问题”就是你想要作出的评估。

    “启发式问题”就是你绕开原来的问题去回答的那个更简单的问题。

    “启发”这一术语是指协助寻找各种难题的恰当答案的简单过程,虽然找到的答案常常并不完美。这个词和希腊语eureka(意为“找到了”)是同根词。

    我和阿莫斯在共同工作的早期就想到了替代这一概念,它也是启发法和偏见研究法的核心内容。我们自问:人们在对可能性没有任何了解的情况下,是如何成功作出可能性判断的呢?我们得出的结论是,人们一定不知道通过什么方式将不可能完成的任务简单化了,由此,我们开始研究他们是如何做到这一点的。我们的答案是,当人们按照要求对可能性作出判断时,他们实际上是对其他的事情作了判断,并且认为自己已经完成了判断可能性的任务。遇到很难的“目标问题”时,如果脑海中马上出现了一些与之相关联且容易回答的“启发性问题”的答案,系统1通常便会采取这种“替代”的做法,采用替代问题的答案。

    用一个问题替代原来的问题是一个解决难题的好策略,乔治·波利亚(George Pólya)在他的经典著作《怎样解题》(How to Solve It)中提到了替代问题:“如果你无法解决某个问题,就去解决另外一个简单点的问题好了—去找这个简单的问题吧。”波利亚的启发法是系统2有意实施战略性决策的过程。不过,我在本章讨论的启发法案例并不是精心挑选的,而是思维发散性造成的结果,是我们锁定问题答案控制能力不强的结果。

    请看下面的“目标问题”。它们都很难,在给出合理的答案之前,你肯定会先处理些其他难题。幸福的含义是什么?未来6个月会有哪些可能的政治动向?其他金融犯罪的标准量刑是什么?候选人的竞争有多激烈?还有哪些环境因素或者其他原因需要考虑?想要真正解决这些问题根本不可能。但是你不要受制于完全理性的答案,经过认真推理之后,可以找到启发性的替代答案,尽管这种方法有时很好用,而有时却会导致严重的错误。

    目标问题启发式问题

    你愿意为拯救濒危物种捐多少钱?

    你这些天对生活满意吗?

    今后6个月里总统受欢迎的程度如何?

    欺骗老人的理财顾问应受到何种惩罚?

    这位竞选总统的女士能在政治道路上走多远?

    启发式问题

    想到垂死的海豚时,我的情绪波动有多大?

    我现在的心情如何?

    总统现在有多受欢迎?

    想到金融骗子,我会有多生气?

    这位女士看上去像是个政治赢家吗?

    思维的发散性可以使懒惰的系统2摆脱很多繁重的工作,快速找到难题的答案。“启发式问题”相对于“目标问题”更容易让人产生联想并作出回答。你对海豚和金融骗子的感觉,你现在的心情,你对自己看好的竞选人政治能力的印象,或者总统现在的立场等,都会立即呈现在你的脑海中。启发式问题给每个有难度的目标问题都准备了一个现成的答案。

    上述说法中存在一定的不足:没有指出答案应该与原始问题存在关联。例如,我对垂死海豚的感觉一定要用钱来表示,这一点让人费解。而系统1的另一项能力,即强度匹配,可以解决这个问题。情感和捐款都是按强度分级的。我对海豚的感情可能很强烈,也可能很淡薄,而我捐款的数目会与我对海豚的感情强度相匹配,我脑海中出现的钱数就是匹配量。相似的强度匹配可能适用于所有的问题。例如,不同竞选者的政治表现可以从很糟糕到非常出众。同样,衡量政治成功等级也包括“她在首次竞选就会出局“的最差表现和”她将来会成为美国总统“的最佳表现。

    思维发散性的自主过程和强度匹配可以使能映射到目标问题的简单问题有一个或多个答案。有些情况下会有替代答案,系统2会认可这一启发式答案。当然,系统2也可以拒绝这个直觉性答案,或者通过整合其他信息来改变它。但是,一个懒惰的系统2往往会遵循最省力法则,不经检验就认可某个启发式答案。你不会被难倒,也不必非常努力,甚至都没有注意到自己其实答非所问。此外,你也许都注意不到目标问题很难,因为你的头脑中会很迅速地闪出一个直觉性答案。

    立体启发法:远处的物体看上去更高大

    请看图9并回答下面的问题。

    图9

    如图9所示,右侧的人是否比左侧的人高大?

    我们很快就想到了那个最明显的答案:右侧的人更高大。但如果你用尺子量一下,你会发现实际上他们体型一样。你对他们相对体型的印象受到强大错觉的控制,这种错觉也正是替代过程的最佳解释。

    图中人物经过的走廊被画成了透视图,显得平面越来越深。你的感知系统自动地将这幅图看做是立体的,而不是印在平面上的。在立体透视图中,右侧的人比左侧的人离我们更远,显得更高大。大多数人都会对立体图感觉很强烈。只有视觉艺术家和有经验的摄影师才具备将这幅图看成平面图的能力。对于我们这些人来说,此时就会有替代产生:对立体图像大小的印象左右了我们对平面图大小的判断。错觉的产生是由立体图的启发导致的。

    此时出现的是一个真正的错觉,不是对问题的误解。你知道是图片中3个人的体形造成了我们的错觉,因为它们是印在纸上的。如果有人让你估计这几个人的体型,我们通过实验就会知道你的答案会是用英寸来表达的,而不是英尺。你对问题没有疑问,但你会受到那个并没有被问到的问题的影响,比如:“这3个人有多高?”

    上例中启发法的那个重要环节—立体大小替代平面大小—是自主发生的。图片中包含着一些暗示,这些暗示会让图片产生立体感。尽管这些暗示和要完成的任务—判断纸上人物的体型大小—并无关联,你本该忽略这些因素,然而你却做不到。启发法的偏见是图中看上去更远的物体看上去更大。正如上例所示,基于替代的判断必然会如预想的那样有失偏颇。在这个例子中,基于替代的判断在感知系统中运作得比较隐蔽,根本就是不由自主发生的。

    一些德国学生作过的一项调查堪称替代研究的最佳案例之一。这些年轻人完成的调查包括下面两个问题:

    你最近觉得幸福吗?

    你上个月有多少次约会?

    实验人员对这两个问题的答案的关联度很感兴趣。那些回答自己有很多次约会的学生会比那些约会次数少的人更幸福吗?令人吃惊的是,答案是否定的,两个答案的关联度几乎为零。显然,学生在评价自己的幸福感时,首先想到的并不是约会。

    另一组学生也看到了这两个问题,但次序正好相反:

    你上个月有多少次约会?

    你最近觉得幸福吗?

    这一次的结果完全不同。在这种顺序下,约会次数和幸福感之间的相关度能达到心理测试的最高水平。其间发生了什么呢?

    原因很明确,这就是替代作用的典型案例。约会显然不是这些学生生活的重心(第一次调查中,幸福和约会并不相关),但当实验者要求他们回想自己的浪漫生活时,他们确实有情感上的回应。有多次约会的学生想起了自己生活中快乐的事,而那些没有约会的学生想起的都是孤独和被拒绝的情节。因此看到第二个问题时,由(第一个)约会问题引起的那些情感就在大家的脑子里徘徊,影响他们对这个问题的回答。

    上例中体现的心理活动和图9中的体型错觉带给人的心理体验很相似。评价“最近的幸福感”这种任务并不常见,也不简单,需要仔细思考之后才能给出恰如其分的回答。但是,提到约会情况,这些学生就无须努力思考了,因为他们脑海中早已有了相关问题的答案。这个相关问题就是:他们对自己的恋爱生活满意程度如何。他们将被问及的问题替换成了另一个自己心中已经有了答案的问题。

    在这个实验中,我们同样可以采用与错觉研究相同的做法,可以问一问:这些学生感到困惑了吗?他们是否真的认为这两个问题—他们被问及的问题和他们回答的那个问题—是相同的?当然不是。学生不会一下子把浪漫时光和生活混为一谈,如果让他们说说对这两个词的理解,他们肯定会说浪漫时光和生活不是一回事,但其实他们需要回答的问题并不是两个概念是否相同,他们的问题是最近是否感到幸福,于是系统1就用已有的答案来作答了。

    约会的案例并非特例,如果这些参与实验的学生先看到的问题是与父母或金钱的关系,而后马上看到那个关于幸福的问题,也会发生同样的情形。在两种情况下,满足感在特殊情况下影响了关于幸福感的表达。任何影响人心情的重要情感问题都会产生同样的效果。眼见即为事实。当人们评估自己的幸福感时,他们思维状态的作用就显得非常突出。

    情感启发式:因为喜欢,所以认同

    一旦加入情感因素,结论对论证的主导作用便会最大程度地凸显出来。心理学家保罗·斯洛维克(Paul Slovic)提出了“情感启发式”的概念,认为人们的好恶决定了他们的世界观。你的政治倾向决定了你对各类论证的看法,即它们是令人信服的还是难以服众的。如果你对当前的医疗政策还满意,就会相信该政策能给自己带来很多好处,而且你相信在这个政策下,花同样的钱能做更多的事。如果你对其他国家采取鹰的态度,就很可能会觉得其他国家相对弱小,更有可能对自己的国家俯首帖耳。而如果你的态度像只鸽子,就会觉得它们更强,不会轻易受到牵制。你对辐照食品、瘦肉、核能、文身或摩托车等事物的态度会左右你对这些事物的感受,它们是惠及生活还是充满风险。如果你对这些事物通通都不喜欢,很可能会觉得它们对你而言利少弊多,根本不会给你的生活带来什么好处。

    结论的至高无上并不意味着你的思维完全停止运转了,也不意味着你可以完全忽略信息和合理解释得出自己的结论。在了解到自己并不喜欢的一项活动的风险其实远比自己想象的小时,你的看法乃至情绪就会发生变化(至少会有那么一点变化)。然而,这种较低风险的信息同样也会改变你对该活动益处的看法(你认为益处会更大),尽管你接收到的信息中没有任何与益处相关的信息。

    在此我们又看到了系统2的另一个“特性”。到目前为止,我似乎已经将其描述成一个给系统1留有足够余地的默许监视器。我描述的系统2还具有主动搜寻记忆的功能、复杂计算功能、比较功能、规划功能和决策功能。在球拍和球的问题中以及许多其他的两个系统相互作用的例子中,系统2似乎总是处于最高决策地位,并有能力抵制系统1的建议,它能使事情放缓,开始进行逻辑分析。自我批评是系统2的功能之一。但在态度方面,系统2更像是系统1各种情感的赞许者而非批评者,也可以说是其各种情感的转让者而非实施者。它搜寻的信息和论据多半局限于与已有看法一致的信息,并不着意对其进行调查审核。积极且追求连贯的系统1为要求不高的系统2提供了各种解决方案。

    示例—替代和启发法“还记得我们绞尽脑汁去回答的那个问题吗?我们是不是把它换成了一个简单点的问题呢?”“别人问我们的问题是这位候选人是否会成功,但我们要回答的问题似乎是她是否能成功应对采访。咱们还是别顾左右而言他了。”“他喜欢这个项目,因此他认为该项目投入少、回报高。这是情感启发式的一个典型案例。”“我们将去年的表现作为依据来预测公司未来几年的表现。这个依据能作为有效参照吗?我们还需要其他什么信息才能作出正确预测?”下面列出了系统1的特点和活动。每个主动句都代替了一个陈述句,虽然表述更精确了,但却更难理解了,因此大脑便开始自主且快速地运行。我希望这个对大脑特性的描述能帮你形成一种对虚拟的系统1各种“特性”的直觉认识。与身边的很多人一样,你对系统1在不同情况下如何运作会有直觉的认识,而且其中大多数直觉都是正确的。

    系统1的特点

    ·生成印象、感觉和倾向;当系统2支持这些行为时,它们就会成为信仰、态度和意图。·自主且快速运行,只需付出较少努力,甚至不用付出努力,没有自主控制的感觉。·当发现(搜寻)特殊形式时,能接受系统2编控来调动注意力。·在接受了一定的训练后,能够做出熟练的回应,产生直觉。·为联想记忆激发出来的各种想法创造连贯形式。·将认知放松感和真理错觉、愉快的感觉以及放松的警惕感联系起来。·区分常态中令人惊奇之事。。推断原因和意图。。忽略歧义,按捺住心中的疑问。·夸大情感的一致性(光环效应)。·将注意力集中在当前的证据上,忽略不存在的证据(眼见即为事实)。·作一些基本估测。。通过常态和原型来表现集合,但不要将两者看成一个整体。·通过测量确定不同程度对应的匹配物(比如音量的大小)。·真正去计算,而不是空想(思维的发散性)。·有时用简单点的问题替代难题(启发法)。·对变化的感知比对形态的感知更敏锐(前景理论)。*·对可能性作出过高估计。*·对数量越来越不敏感(心理物理学)。*·对损失的反应比获得更强烈(损失厌恶)。*·严密设计决策问题,分别进行讨论。* *带*的内容将在本书第四部分作详细介绍。

  • 刘启君:改革开放以来中国腐败状况实证分析

    改革开放以来,中国的经济建设取得了举世瞩目的成就,但与此同时,一些社会问题也凸显出来,腐败就是其中之一。那么,改革开放以来中国的腐败交易活动到底严重到何等程度?哪些部门腐败问题最为严重?哪些人群是腐败交易活动主要群体?在中国的经济发展进程中,腐败活动水平是趋于上升还是下降?找到这些问题的答案,不仅是社会民众的热切期望,也是当前中国反腐败策略制定及制度设计的迫切需要。本文利用1978年至2012年已经审理结案的一万余起腐败案例中所包含的信息,分析了改革开放以来我国腐败活动的发展变化趋势及其主要特征。

    研究回顾

    研究一个国家或地区一个历史时期的腐败活动,需要真实可靠的数据支持。但是众所周知,与其他社会活动不同,腐败活动具有隐蔽性,不能直接观察,于是,关于腐败活动的具体统计数据也就不可能获得。没有可靠的数据,怎么能够知晓一国在一定时期内发生了多少腐败交易?又怎么能够判断在某一时段腐败活动水平的发展趋势?

    到目前为止,国内外学者绝大多数都是根据主观腐败指数开展腐败研究。腐败研究文献中使用较多的腐败指数有:商业国际(Business International)编制的“商业国际指数(Business international index,BI)”、透明国际组织(Transparency International)编制的“腐败感知指数(Corruption Perception Index,CPI)”、世界银行编制的“腐败控制指数(Control of Corruption Index,CCI)”、世界各国风险指南编制的“世界各国风险指南指数(International Country Risk Guide index,ICRG)”以及瑞士洛桑国际管理发展研究院(International Institute for Management Development,IMD)编制的“世界竞争力年鉴指数(World Competitiveness Yearbook index,WCY)”。其中一些指数已经连续编制、发布多年,如CPI指数和ICRG指数,使用起来非常方便,既可以对各国腐败水平进行横向比较、开展跨国研究,也可以对一国腐败活动水平进行纵向评估,因此,深受各国学者的欢迎。但是,随着时间的推移,上述指数的可靠性越来越受到质疑,1以它们为基础开展腐败研究经常得到相互抵触的结论。究其原因,是这些指数的测度对象不是腐败活动,而是个人对腐败活动的主观感知水平,是腐败现实状况的一个“投影”。由于主观指数这一与生俱来的缺陷,各国学者开始另辟蹊径,寻找新的研究方法。例如,有学者将实验经济学方法应用于腐败研究,通过特定的场景设计,观察来自不同文化背景的被测试者的反应,据此研究腐败与文化之间的关联性。这种方法显然比主观指数更加接近现实,不过它的研究设计或多或少含有人为控制的成分。

    努力寻求客观数据研究腐败,是近年来腐败研究的一个发展趋势。根据我们收集的资料,国内外腐败研究文献使用的客观数据一共有四种。第一种是官方数据。国内不少学者利用中国最高人民检察院、最高人民法院以及国家审计局等政府机构公开发布的贪污腐败案件侦查结果数据,研究我国腐败活动发展趋势、腐败成因、腐败效应以及反腐败成效;国外也有一些学者采用这类数据研究腐败,例如,魏德曼搜集我国中纪委和最高法院公布的腐败案件数据,研究“发展-腐败悖论”问题;科尔等人以最高人民检察院公布的腐败案件数据为基础,形成中国1998~2003年省级面板数据,据此分析中国反腐败省际差异及其对招商引资的影响。第二种是直接腐败经验数据。目前最具代表性的,是联合国区域犯罪与执法公正研究院(UNICRI)编制发布的“国际犯罪受害者调查(International Crime Victim Survey)”数据,该机构在世界各地,通过面谈或电话采访形式收集个人行贿或被索贿经历,是目前西方学术界公认的直接腐败经验数据,美国学者采用该数据分析了腐败活动的微观基础,发现不同国家、不同个体特征是腐败交易最终能否达成的决定因素;尼泊尔学者采用一项针对加德满都853位居民的调查数据,证实个体腐败倾向性和受教育程度是决定一国腐败活动水平的两个关键因素;刘启君和彭亚平运用中国高校腐败经历问卷调查数据,证明信息不完全、社会成员异质性、相互信任水平以及微观腐败环境是引起腐败均衡路径转换的重要变量。第三种是个案追踪调查数据,即通过对特定公共项目资金使用情况进行跟踪调查研究腐败。这一方法最早由世界银行研究人员使用,研究世界银行对乌干达教育、健康援助资金被截留挪用情况。最为典型的一个个案追踪研究,是哈佛大学的奥肯对印度尼西亚乡村道路建设项目的跟踪调查。在世界银行资助下,他组织了100余人的研究团队,前后历时12个月,在每条道路上采集分析样本,逐一测定筑路材料数量,向当地筑路材料供货商询问各种材料价格,向当地村民询问筑路项目实际支付的工资,然后独立构造筑路材料实际使用量的估计,再与村民反映的使用量进行逐项比对,最终形成客观数据。第四种,是研究者利用各种途径自己收集腐败案例形成的数据。早在1983年,就有学者收集中国1977~1980年间媒体曝光的275起腐败案件,对中国改革开放初期的腐败概况进行统计分析。近年来采用这种数据开展的独立研究日见增多,例如,意大利学者通过查阅司法档案、统计官员犯罪数量来研究意大利的腐败成因及其经济后果;过勇利用清华大学廉政与治理研究中心腐败要案案例库,通过建立5大类31项指标,对收入案例库的1978~2005年期间发现和惩处的594个腐败要案展开系统分析,并对经济转轨影响腐败的机制进行实证检验;王一江等人收集整理了130个政府官员腐败案例,就腐败的微观影响因素进行了剖析,发现官员的职级与受教育程度是影响腐败程度的两个显著变量;公婷、吴木銮根据《检察日报》2000年至2009年公开报道的2802起腐败案例,描述、分析了我国腐败活动的一些重要特征。

    上述四种数据有一个共同特征:都是以已经发生的腐败活动为统计对象。无疑,腐败研究最可靠、最牢固的基础,就是现实世界实际发生的腐败交易活动本身,据此分析得出的研究结论才真实可信。

    数据来源

    本文使用的数据属于上述客观数据的第四种,取材于1978年至2012年期间已经审理结案的贪污腐败案件。我们通过多种途径,收集各级各地人民法院的贪污腐败案件《判决书》,历时3年多,总共收集到一万余起腐败交易案例,建成了“中国转型期腐败案例数据库”。根据中国人民检察院和最高人民法院公布的数据,改革开放以来,我国立案查处各类经济案件和贪污腐败案件已经超过一百万起,平均每年3万余起。据此计算,本文收集的案例数量大约为全部已经立案查处案件的1%左右,这就是说,本文采用的分析样本所包含的腐败交易活动只是全部已经披露的腐败交易活动的一小部分,而已经披露的腐败活动又仅仅是实际发生的腐败活动中的一部分。尽管如此,就我们所知,这是目前已知最大的腐败案例数据库。如前所述,根据已经发现的腐败案例研究腐败活动特征和规律,也是在无法获取完整腐败数据条件下的最优选择。

    利用案例库,尤其是案例数量足够大的腐败案例库数据分析腐败活动有如下几个优点:第一,数据可靠。在我国,腐败案件一旦立案、进入案件审理程序,每一笔腐败交易都须经人证、书证、物证确认,只有在腐败交易双方对同一笔交易都有书面材料、交易细节陈述吻合或出具直接证据时才予以认可。因此,经过严格审理程序认定的每一笔腐败交易,一定是实际发生的腐败交易。第二,数据真实。研究腐败活动规律和特征,需要的是真实数据。腐败案件《判决书》忠实记录了每一笔腐败交易发生的时间、地点和场所,我们可以以实际发生时间为统计基础,从而可以确保数据的客观真实,这是官方数据所不可比拟的。第三,数据全面。我们收集的腐败案例总数达11752个,时间跨度30多年,平均每年300多个,案例涵盖全社会各个领域、各个层次发生的腐败交易活动,以此作为分析素材,可以揭示我国转型期腐败交易的基本走势,反映该时期腐败活动的基本状况。第四,可以获得反映腐败交易诸多侧面的微观数据。这是官方公布的腐败案件数据和通过媒体收集的腐败案例整理而成的数据所无法提供的。从官方总量数据中看不出具体部门、行业的腐败活动情况,也不能计算腐败交易强度;各种媒体披露的腐败案例有一部分细节,但往往又受到保密等各种限制,而且通讯报道通常更愿意选择腐败大案、要案或案情奇特、有社会渲染力的案例作为报道对象。而我们所用的案例库数据则不同,我们根据法律文本,将每一个腐败案例分解为43个指标逐一予以统计,由此形成的基础数据可以提供研究所需的诸多细节资料,这对于我们分析腐败交易活动特征、发现腐败交易活动的一些基本规律提供了有力支持。

    中国改革开放以来腐败活动总体情况

    我国改革开放以来腐败交易活动的总体发展趋势,是人们普遍关注的焦点之一。为了对这一时期的腐败交易活动总体状况形成一个基本认识,我们分别从微观和宏观两个层次来进行描述。

    (一)从微观层次来观察我国改革开放以来的腐败状况

    我们以腐败主体为统计对象,以个人腐败交易次数、每次腐败交易金额、个人从事腐败活动的时间跨度以及腐败交易发生时腐败主体的年龄等四个维度,描述我国转型期的腐败活动基本情况。表1给出了上述指标的统计结果。数据显示,样本期内个人腐败交易次数最小值为1次,最大值173次,均值3.35次。观察个人腐败交易频率分布可以发现,单次交易占47.3%,其余为多次交易,其中绝大多数为1~10次,占总量的95.0%。在多次腐败交易中,交易次数为2次的所占比例最大,达33.1%,其次为3~5次、6~10次和10次以上,分别占21.0%、13.7%和7.7%。这就是说,我国转型期的腐败交易活动,以多次重复交易为主。从个人参与腐败交易的时间跨度看,有63.1%的腐败交易在1年内完成,连续两年从事腐败交易的人数占19.9%,另有17.0%的腐败主体长期从事腐败交易活动。在长期从事腐败活动的人群中,有97.0%的人在6年之内被发现,而最长的时间跨度达18年之久!

    腐败主体的年龄最小值为16岁,最大值为78岁,均值为40.9岁,中位数为42.0岁;其中,交易频率最高的年龄为42岁,占4.7%,其次是38和40岁,各占4.0%。腐败主体绝大多数为男性,占总数的89.2%,女性仅占10.8%。案卷资料显示,女性腐败主体绝大多数为两类人群:财务工作人员或者是与机构、部门主管关系密切者。腐败主体的年龄构成基本呈正态分布,26~55岁是腐败高发年龄段,接近全部腐败交易总数的90%(88.5%),峰值落在41~45岁年龄组,占20.0%,20岁及以下年龄组和60岁以上年龄组数量最少,分别占1.6%和0.8%。上述统计结果,应该说与现实比较相符,26岁至55岁是一个人社会活动最为频繁的时期,而41岁至45岁往往是个人职业生涯的鼎盛阶段,这一阶段恰恰也是陷身于腐败活动的危险期。

    人们普遍关心的一个问题是,我国转型期的腐败交易强度到底有多大?根据我们的样本资料,历次腐败交易中交易金额最小值为1.07元,最大值为14890万元,均值268786.17元,中位数6000元;其中,交易金额500元及以下的累计占13.5%,1000元及以下的累计占22.4%,5000元以下的累计占43.5%;单次交易金额在5000元至1万元(含)的占全部交易次数的17.7%,1万元以上至5万元(含)的占19.7%,5万元以上至10万元(含)的占7.1%,10万元以上至50万元(含)的占8.5%,50万元以上至100万元(含)的占1.5%,100万元以上的占2.0%。根据我国《刑法(1997)》规定,贪污腐败案件累计金额达到5000元即可立案,据此,样本中56.5%的案例仅一次交易金额即已达到立案标准。

    进一步观察腐败交易金额频度分布,我们发现一个有趣的现象:出现频率高的腐败交易金额全部为整数额,而且部分数额的出现频率明显高于其他整数(详见图1)。其中,出现次数最多的是1万元,占总数的6.6%,其次为5000元和2000元,分别占4.7%和4.4%;此外,1万元与10万元是两个明显的整数关口,在这两个整数之后,其余整数额出现的频率基本上呈逐渐下降趋势。这表明,腐败活动经常以整数额进行交易,而且多以1千元、2千元、5千元、1万元、2万元、5万元、10万元等整数额交易。

    (二)从宏观层次考察我国改革开放以来的腐败活动情况

    依照国际惯例,我们采用腐败广度(breadth of corruption)和腐败强度(depth of corruption)两项指标从宏观层次衡量我国转型期腐败交易活动水平,腐败广度指标以年度交易次数表示,腐败强度指标则以平减后的腐败交易额年度均值表示,结果见图2。

    从图2中可以清楚地看出,改革开放以来,我国实际发生的腐败活动,就腐败交易次数而言,基本呈波浪式上升之势,先后大致经历了四个阶段性周期变化:1978~1982年为第一阶段,历时5年,波峰出现在1981年;1983~1990年为第二阶段,历时8年,波峰出现在1988年,1985年曾经出现过一次跳跃;1991~2001年为第三阶段,历时11年,波峰出现在1998年;2002年以后为第四阶段,波峰出现在2003年,随后呈逐年下降趋势,尤其是2008年之后出现锐减。出现这一情况与腐败活动的潜伏期有关。根据案例库数据分析,1978~2012年期间,腐败活动的平均潜伏期为2.86年,而一个腐败案件从交易实际发生到被发现,从立案、审理直至最终判决都存在一定时滞,据此推算,2008年以后实际发生的部分腐败交易可能尚未发现,或虽已发现并立案但尚未判决。比较四个阶段,可以发现如下几个特征:一,腐败交易活动周期在逐渐拉长;二,整体走势虽然逐渐上扬,但上升的速度却逐渐下降,这可以由两组数据予以证实:各周期的峰值环比分别为232.2%、150.4%和100.3%,各周期的平均交易次数环比分别为221.7%、188.1%和100.5%,这两组数据表明,由第一阶段到第二阶段上升速度最快,后者是前者的两倍有余,第二阶段到第三阶段上升速度下降到不到两倍,第三阶段与第四阶段则基本持平。

    与腐败交易次数波浪式上升走势不同,我国改革开放以来的腐败交易强度呈现明显的“单峰”走势:自1978年起逐步上扬,至1998年上升至顶峰,年平均交易金额达到377725.32元,随后基本呈逐年下降趋势,期间只有2002年呈现过一次跳跃,2010年又开始略有回升(见图2)。虽然各年份平均腐败交易强度起伏较大,但仍然可以清楚看出,1978年至1989年年均交易金额还处于较低水平:12年平均交易金额为2311.06元,即使是年均值最高的1989年也还在万元之内,为6548.94元;然而,1990年交易均值一举突破万元关口,骤然跃升至26239.54元,恰好为1989年均值的4倍。1990年至2010年的21年间,年均值跳上一个新高度,平均额达到69001.52元,是前一阶段均值的29.9倍!而且,自1990年起,腐败交易年度均值再也没有低于一万元。

    国内学者经常以官方公布的腐败大案、要案绝对数为指标评估我国的腐败活动状况,例如,王传利、倪星和王立京先后以这两个指标作为我国反腐败周期的分析依据。根据我国《刑法》,1997年以前的腐败“大案”标准为累计贪污腐败金额达到1万元,1997年执行新《刑法》以后该标准提高到5万元;腐败“要案”则是指腐败主体为县处级以上政府官员。考虑到腐败大案标准前后不一致这一特殊情况,我们以1997年为界,根据腐败交易实际发生年度分别予以统计,并且以“大案、要案数量在当年度全部腐败交易活动中所占比例”作为分析指标,这样,不论立案的影响因素如何变化,被查处案件终究是实际发生的腐败交易活动中的一部分,只要没有就案件类型结构加以人为控制,大案、要案比例应该可以反映样本全体的比例。统计结果见图3。

    腐败大案比重可以反映腐败交易强度变化,一年中大案比例上升则表明腐败交易强度增加。由图3可见,自1978年起,我国腐败大案占比呈逐年上升之势,直至1996年腐败大案在当年度查处腐败案件中达到75.5%。或许是出于办案效率的考虑,我国司法机关于1997年将大案标准提高到5万元,所以,图中1997年以后的大案比例明显低于前期。尽管如此,1997年以后,大案比例仍然维持在较高水平,经过6年不大的波动之后,2003年又上升至55%,而且此后依然保持在高位。以1997年为界,前18年内大案比例均值为26.4%,后14年内大案比例均值上升为32.1%,净增长21.5%。考虑到前后期大案法定标准的调整,可以确认,改革开放以来,我国腐败交易活动强度在不断增加。

    腐败要案数量变化反映腐败主体中县处级以上政府官员参与腐败交易的变化情况。由图3可知,1992年以前的数据特征表现为零星状态,表明县处级以上政府官员的腐败交易活动并不活跃;1992年以后,县处级以上官员的腐败活动明显上升。以2002年为界,腐败要案分布大致可以分为两个周期;第一个周期的峰值出现在2000年,县处级以上政府官员腐败交易在当年度腐败交易活动中所占比例达到16.2%;第二个周期的峰值出现在2006年,达13.5%。结合各年度腐败交易活动绝对数量,可以得出这样的结论:改革开放以来,我国县处级以上政府官员的腐败交易活动以1992年为界分为两个阶段,第一阶段发生数量较少,第二阶段数量明显增加;第二阶段以2002年为界分为两个周期,两个周期均呈先扬后抑的走势。

    综合以上分析,改革开放以来我国腐败交易活动状况确实令人堪忧:第一,腐败交易基本呈愈演愈烈之势,不仅一般性腐败交易次数逐级上升,而且大案、要案数量在年度交易数量中所占份额同样表现为逐步上升走势;第二,腐败交易强度大,1990年之后,腐败交易强度跃上一个新台阶,后一阶段年度均值几乎为前一阶段的30倍之多;第三,腐败交易活动猖獗,其中半数以上为重复交易,同一腐败主体的交易次数最高竟然多达173起,前后从事腐败交易活动长达18年之久而未被发现,足见监管缺位的严重程度。按部门统计的腐败活动情况

    为进一步观察腐败活动的变化情况,我们根据腐败交易实际发生时腐败主体所隶属的部门分别统计,将全部腐败交易分为五个组别,分别为“党政机关”、“国有企业”、“事业单位”、除国有企业之外的“非国有工商企业”以及“其他部门”。

    假如仅仅从腐败交易次数观察,国有企业数量最大,占全部样本总数的36.7%;其次是党政机关,占26.6%;再其次是事业单位和其他部门,分别占13.1%和13.2%;腐败交易次数最少的是非国有工商企业,占10.3%。这似乎与人们通常感知到的腐败交易情况比较吻合。从腐败交易强度指标看,初步统计结果表明,年度平均腐败交易金额由高至低分别为国有企业、事业单位、非国有工商企业、党政机关、其他部门。国有企业腐败交易水平最高,平均每次腐败交易金额为510572.16元,是位居第二的事业单位(平均交易金额188672.63元)的2.7倍,是非国有工商企业(167013.90元)的3.1倍、党政机关(133577.40元)的3.8倍、其他部门(27846.17元)的18.3倍、样本全体均值(268786.17元)的1.9倍。据此,我们可以认为,样本期内国有企业的腐败交易活动水平在所有部门中最高。

    人们最为关注的党政机关工作人员腐败问题,就腐败交易强度而言并不是最高的,在五个组别中位列第四。党政机关腐败交易活动有两个峰值。第一个峰值出现在1990年,1989年以前,各年度平均交易金额波动较小,1990年猛然跃升至481726.14元,为此前各年度均值(6429.31元)的74.9倍;随后逐年下降,分别于1994~1995年、1997~1999年出现过两次小幅反弹,及至2004年降至谷底,随后缓慢回升;2006年出现第二个峰值,平均交易金额达到270320.85元,不过,就其交易强度而言,仅为第一峰值的几乎一半,随后再次逐年下降。总体而言,党政机关的腐败活动,可以大致以1990年为界分为两个阶段:1990年以前为平稳发展期,平均腐败交易金额为6429.31元;此后为波动期,并且上升到一个新的高度,平均腐败交易金额140708.00元,为第一阶段均值的21.9倍。

    国有企业的腐败交易活动在全部五个子样本中水平最高,平均交易金额达到51万元。该子样本只有一个峰值,出现在1998年,腐败交易平均金额高达3389592.90元,是其余年份均值的12.4倍,也是样本全体均值(268786.17元)的12.6倍。国有企业部门的腐败活动不仅平均交易水平最高、最大峰值最高,而且腐败交易次数也远高于其他部门,达4316次,是党政机关的1.4倍、事业单位的2.8倍、非国有工商企业的3.6倍、其他部门的2.8倍。党政机关虽然在交易次数上位居第二且超过样本全体均值,但也仅仅是国有企业的72%。

    国有企业的腐败交易活动同样可以大致分为两个阶段:第一阶段为1989年以前,是较为平稳的阶段,平均腐败交易金额为4539.73元,各年份之间的波动较小,其中最大值为1988年的10713.32元,最小值为1978年的775.36元;1989年以后为第二阶段,1989年的腐败交易均值(21,942.14元)已经是1988年均值(10,713.32元)的2倍;此后逐年攀升,直至1998年平均交易金额达到3,389,592.90元。1989年至1998年这一阶段,是国有企业腐败交易活动的迅速上升期,随后基本呈逐步下降趋势。从腐败交易强度看,后一阶段的平均腐败交易金额(628,419.99元)也远远高于前一阶段,是1989年以前的138.4倍。

    与国有企业相比,非国有工商企业的腐败问题同样比较严重。在五个组别中,样本期内的腐败交易活动水平位居第三,平均腐败交易金额为167,013.90元。但是,该部门腐败活动表现却明显区别于其他部门,基本以1990年为界分为两个阶段。1989年以前比较平稳,平均交易金额为3,487.12元,其中最小值32.30元,最大值为7,110.25元。自1990年起,腐败活动开始不断加剧,且表现为剧烈波动的特征:平均交易金额从1989年的3,466.10元猛然跃升至1990年的45,880.56元,增幅高达12倍多;平均腐败交易金额为213,850.25元,是前期交易强度的61.3倍。1990年以后的21年间,腐败活动强度先后出现5个显著峰值,分别为1996年、1998年、2003年、2007年和2010年,其中最高峰值出现在1996年,平均腐败交易金额达到1,228,879.04元,是党政机关最大峰值(2006年的270,320.85元)的4.5倍、事业单位最大峰值(2003年的286,550.61元)的4.3倍、其他部门最大峰值(2010年的23,379.00元)的5.5倍。

    各类事业单位的腐败活动,包括教育、科研、广播电视、新闻出版、公立医院、各类社团、宗教组织等,也是近期社会关注的热点之一。从平均腐败交易金额看,事业单位的腐败活动水平仅次于国有企业,位居第二,达188,672.63元,不过,这一数额仅为国有企业均值的37%。与非国有工商企业腐败活动情况相比,事业单位的腐败走势相对“平淡”:除2002、2003两个年份外,其余年份整体表现波动不大。样本期内大致可分为两个阶段:1990年以前为第一阶段,均值为3,153.07元,最大值为11,048.92元,最小值为234.09元,各年份波动幅度较小。1990年起上升至一个新的高度,平均腐败交易金额由1989年的3,420.34元骤然升至6,271.88元,净增长83%;随后基本维持相对高位,1990年至2010年,年平均腐败交易金额为218,184.69元,是第一阶段年均值的69倍;其中,最大值出现在2002年,为2,333,276.66元。但是,如果剔除2002年的峰值,整个第二阶段的年均值仅为81,345.67元,该数值为第一阶段的25.8倍。整体而言,事业单位的腐败活动走势基本平稳,1990年以后跃升至一个新的台阶,平均腐败交易水平显著高于第一阶段,但波动幅度不大。2002年突然出现一个巨大跳跃,为其余所有年份平均交易水平(70,068.41元)的33.3倍,这一“鹤立鸡群”现象在全部五个组别中也是独一无二的,个中原委值得进一步深究。

    其他部门的腐败活动走势也有自己的明显特点:1992年以前腐败活动相对平稳,1993年起开始逐步上升,先后在1995、2007、2010年出现三个峰值,且三个峰值呈逐级抬升之势。腐败交易大致可分为三个阶段:1993年以前为第一阶段,这一阶段的平均腐败交易水平为1,884.64元,最大值4,044元,最小值345元,波动幅度较小;1993年至1997年为第二阶段,前3年逐年上升,随后逐步下降,该阶段的平均腐败交易水平为24,206.25元,最大值72,921.56元,最小值11,071.12元;1998年至2009年为第三阶段,1998年至2007年期间基本呈现单边上升趋势,虽然2002年出现过一次小幅跳跃,2007年后开始逐年下降;平均腐败交易水平为66,870.2元,最大值162,932.23元,最小值12,442.12元。纵观三个阶段的走势,不论就平均交易水平还是就最大值、最小值等指标而言,都表现出逐级攀升之势。

    比较五个子样本的统计结果,我们可以就样本期内各部门的腐败活动走势得出如下两个基本结论:第一,综合观察平均腐败交易强度以及腐败交易年度均值的最大值、最小值等基础性指标,五个部门的腐败活动由高至低的排列顺序依次为国有企业、事业单位、非国有工商企业、党政机关、其他部门,国有企业无疑是腐败活动的“重灾区”,该领域的腐败交易强度远大于其他部门,并且抬升了整个样本的平均交易水平,以至于即使是位居第二的事业单位,其平均交易金额也小于样本全体均值。第二,虽然各部门腐败活动情况存在一定差异,但大体上都可以以1990年前后为界分为前后两个阶段。比较两个阶段的腐败活动,第二阶段不仅整体水平大幅上升,波动幅度也非常大。若以由腐败交易强度大小顺序排列,第二阶段国有企业、事业单位、非国有工商企业、党政机关、其它部门的腐败交易均值分别是第一阶段的138.4倍、69倍、61.3倍、21.9倍和30.7倍。从样本全体情况来看,1990年以前的平均腐败交易金额不到5000元(4,988.15元),1990年及以后年份的平均交易金额则上升至338,840.65元,是前期均值的68倍!第三,第二阶段各部门的走势各有特点,其中,国有企业、事业单位、党政机关的腐败活动走势基本相似,均只有一个最大峰值,分别出现在1998年、2002年和1990年,基本表现为“单峰走势”:在最大峰值出现之前逐步上扬,在最大峰值之后基本上逐步下降;而非国有工商企业的腐败活动表现,虽然在最大峰值出现之前也是逐步上扬,但在此之后,又出现三个次高峰值,表现出剧烈波动走势;其他部门的腐败活动又与前四个组别完全不同,先后出现三个峰值,而且三个峰值呈现逐步抬高之势,表明其腐败活动在第二阶段有“愈演愈烈”的发展趋势,这是其他子样本都不具有的重要特征。这是否预示,继国有企业、事业单位、非国有工商企业、党政机关之后,其他部门的腐败将会越来越严重?

    上述分析结果表明,我国改革开放以来的腐败交易活动具有典型的时代特征,与我国社会、经济发展过程,尤其是国有企业改革密切相关。在国有企业放权让利、转换经营机制、产权制度改革、“抓大放小”、国退民进等过程中,出现了大量的寻租机会,同时相关制度安排相对滞后为腐败滋生提供了条件;在轰轰烈烈的经济改革浪潮冲击下,事业单位、党政机关中的部分工作人员经不住利益诱惑,也开始利用自己的社会地位、职务之便牟取私利;私人部门利用、甚至“创造”各种机会,与国有企业、党政机关中的腐败分子合谋,侵占国有资产,捞取私人利益。

    政府官员的腐败活动情况

    政府官员的腐败状况是全社会关注的焦点之一,我们按照行政级别由高至低将公务员群体分解为五组,即:省部级以上、厅局级、处级、科级和一般公务员,选择腐败交易次数和平均腐败交易金额两项指标,根据腐败交易实际发生时腐败主体的行政级别分组统计,然后分别比较分析。

    首先,静态地看,这五个级别的政府工作人员中,省部级以上官员腐败交易次数最少,但平均交易金额最高。从厅局级、县处级至科级官员,交易次数、平均交易金额两项指标均逐级上升,一般公务员的腐败交易次数略高于省部级以上官员,平均交易金额则最低(见图5)。就腐败交易次数而言,最高为科级官员,占样本总数的32.9%,其次为县处级官员,占24.8%,厅局级和一般公务员的交易次数基本相当,各占18.8%和18.5%,最少的是省部级以上官员,仅占4.9%。就腐败交易强度而言,一般公务员的腐败交易水平最低,平均不到3万元(2.96万元),最高的是省部级以上官员,平均腐败交易金额达68万元,分别是厅局级官员(18.9万元)的3.6倍、县处级官员(23.4万元)的2.9倍、科级官员(28.8万元)的2.4倍、一般公务员(2.96万元)的23倍。值得注意的是,正科级官员的平均腐败交易金额位居第四位,为39.2万元,竟然高于正省部级(32.4万元)、正厅局级(26.9万元)、正处级(29.8万元)。

    其次,动态地看,不同级别的政府工作人员的腐败交易活动在不同阶段又有着不同的表现。就腐败交易次数而言,自1978年至2000年代中期,总体呈现逐步上升趋势,随后逐步下降但各个级别政府工作人员的峰值出现的时间点并不相同,省部级以上官员是1999年,厅局级官员是2004年,县处级是2003年,科级是2006,一般公务员则是1999年(见图6)

    关于政府工作人员腐败,有学者认为党政机关正职官员是关键,提出了治理以“一把手”腐败为重点的反腐败建议。到底是否存在这种现象?我们仍以腐败交易次数和平均交易金额两项指标,分别统计各级正副职官员的腐败交易情况,结果见图7。可以清楚地看出,腐败交易次数指标在四个职级中全部都是正职高于副职;而平均腐败交易金额指标指标,除省部级之外,同样是正职高于副职。由此可以确认,“一把手”腐败之说基本成立。

    关于政府官员腐败的另一个经常讨论的议题是,存在部分官员“带病提拔”、“边腐败边升迁”的问题。样本统计数据表明,这种现象也存在,在从事腐败交易活动的同时获得职务晋升的官员占腐败公务员的9.2%,而且在这部分人群中,有三分之一(32.9%)获得过多次职务晋升。如果包括高级管理人员、高级技术人员在内,则腐败主体中有7.1%的人在从事腐败交易的过程中获得过提拔,其中30.7%的人曾经得到多次晋升机会。

    纵观国家公务员群体的腐败交易活动,可以发现如下较为显著的特点:第一,政府工作人员的腐败交易活动自1990年以来越来越活跃,不论是腐败交易次数还是腐败交易强度均呈上升之势。第二,省部级以上、科级官员是值得重视的人群,前者腐败交易次数虽少但每次腐败交易金额在所有政府公务员群体中最高,科级官员不仅腐败交易次数最高、腐败交易均值仅次于省部级以上官员位居第二,而且腐败交易总金额在所有政府工作人员中也最高。第三,党政机关“一把手”腐败现象确实存在。统计数据表明,除省部级官员之外,其余级别官员的平均腐败交易金额都是正职高于副职,其中,正厅局级官员的平均腐败交易金额(26.9万元)是副厅局级官员(10.1万元)的2.6倍,正处级(29.8万元)是副处级(10.2万元)的近3倍,正科级(39.2万元)是副科级(5.2万元)的7.5倍,正副职之间的差距随着职级的下降呈逐渐放大之势;在这五组人群中,惟有正省部级官员平均腐败交易金额(32.4万元)低于副省部级(61.3万元)。第四,腐败交易活动与职级高低并不完全对应,并非职级越高腐败越严重,相反,从厅局级、县处级到科级官员,不论是交易次数还是交易强度恰恰都是逐渐上升。上述特点,对于我国下一阶段反腐败策略的制定具有借鉴作用,省部级以上官员、科级官员应该作为重点防范人群,而各级别政府工作人员中,党政机关的“一把手”又是主要监督、审查对象。

    结语

    改革开放以来,中国的腐败状况成为全社会关注的焦点问题之一。本文采用客观统计数据,就我国改革开放以来的腐败活动总体概况、主要部门的腐败活动以及党政机关工作人员的腐败活动情况进行了统计分析。我们发现,改革开放以来,我国腐败交易活动基本呈逐渐上升之势,腐败交易强度在1990年之后大幅提高;国有企业是腐败交易最为严重的部门,其次是事业单位和非国有工商企业,党政机关仅名列第四;就腐败交易强度而言,高级管理人员最高,其次是政府工作人员和高级技术人员群体;在政府工作人员中,正职官员腐败普遍比副职官员严重,省部级以上官员腐败交易强度最高,其次是科级、县处级、厅局级官员,而科级官员不论就腐败交易次数还是腐败交易总金额而言,均位居首位。这是出乎人们意料之外的一个新发现。

    本文的分析结果表明,我国目前仍处于腐败活动的高发期,当前和今后一段时期反腐败形势依然十分严峻。反腐倡廉绝不能仅仅局限于党政机关,还应该特别关注和加强国有企业和各类事业单位的腐败治理工作。在各级政府官员中,应继续坚持重点防范“一把手”腐败,尤其要加强科级政府官员的监管工作。科级官员面广量大,是政府机构中最基层部门的主管官员,基层公务员的直接领导者,他们廉洁与否直接影响到一般公务员的从政行为,并进而通过他们影响到整个社会风气。

    本文原载《政治学研究》2013年第6期

  • 克劳迪娅·戈尔:女性能实现事业与家庭“双丰收”吗?

    1. 非升即走,艰难的抉择

    在许多职业,比如会计、法律、金融、咨询和学术界,女性和男性的竞争环境甚至更不平等。过去的半个多世纪里,这些领域的职业发展变化不大,尽管其中近半数专业人员是女性。这些领域的晋升规则都要求早期投入大量时间。在预定期限结束时,雇员(一般称为助理)要接受考评。勤奋(或幸运)的人将获得终身职位或合伙人资格,其他人则被打发。这类工作通常被称为“非升即走”职业。“升迁”的人留下来,而“出局”的人往往去更低一层级的公司、机构或大学任职。

    每个职业和部门的门槛和发展时钟并不相同,但都有一个共同点:那些得到丰厚回报的人,届时应该已经30多岁。这一点今非昔比。只是拿下高等学位以及获得第一次晋升、合伙人身份或终身职位所需的时间,都已变得更长、更晚。

    曾几何时,攻读高等学位的大学毕业生会直接进入研究生院或专业学校。而今,几乎所有人毕业后都要花一年或更长时间从事与最终职业相关的工作。在学术界,大多数博士申请者获得学士学位后都首先担任研究助理(这个职位被称为“博士预科”)。MBA群体则通常在进入商学院之前工作若干年。

    今天,攻取博士学位所花的时间比以往任何时候都要多,即便在有大把就业机会的领域也不例外。我拿到博士学位的时候,获得经济学博士学位通常需要4年时间,现在是6年。物理和生物科学的博士后培训同样延长了周期,这些职位已经在其他领域流行起来。

    接受教育和培训的年数增加倒无可厚非。但这只是“非升即走”世界的开始。学术界获得终身职位一般需要6~8年。法律行业确定合伙人身份大约需要10年;咨询和会计行业确定合伙人身份需要6~9年,具体取决于是否拥有MBA 学位。至于投资银行业,需要5~6年或可从初级银行家升级为副总裁级别。         

    所以在学术界,现在至少要有13年(更可能是16年)的学士后生涯做铺垫,个人的职业生涯方能巩固。在咨询和会计领域,考虑升职前起码得拼搏10年。而攻读MBA或法学博士课程之前,应该投入几年时间工作。因此,个人职业生涯的第一次晋升通常发生在30多岁时。

    可想而知,事业与家庭之间会出现怎样的张力。在谋求合伙人身份或终身职位的过程中,当年的22岁大学毕业生渐渐年长,进入了30多岁,甚至更老。大学毕业生的初婚年龄中位数远低于这个年龄。

    如果提早进行“非升即走”抉择,譬如在35岁之前,女性就可以先努力工作,成为合伙人或拿到终身职位,然后再开启家庭生活。然而随着晋升年龄提升,这意味着要么晚点组建家庭,要么第一次重大的晋升时刻在孩子上学前班时到来。职业道路需要长时间的工作,对于有年幼子女的人,这往往太过紧张。两种选择都有问题,尤其是对女性而言。

    职业时钟与生物时钟和家庭时钟交织同步,滴答作响。很多女性和男性必须在职业生涯稳固之前建立家庭;否则,他们可能将永远无法拥有家庭。

    2. 管道泄漏,职场流失的女性

    自20世纪70年代开始,许多专业的职业女性新人比例大幅上升。在完成各类高等学位课程方面,第四组女性取得了长足进步。可是,获得终身职位、合伙人身份或其他晋升机会的女性比例没有跟上节奏。起初,人们以为高级职位的女性比例偏低是因为晋升需要时间,但现在大家发觉事实并非如此,时间其实绰绰有余。

    过去20年间, 我所在的经济学领域的女博士比例达到30%~35%。但她们当中终身副教授为25%,正教授为15%。1974年,我是8% 的助理女教授之中的一员,到了2018 年,该比例升至27%。1974 年,正教授群体的女性比例不足3%,2018年逼近15%,进步可谓巨大,但是速度太慢。假如男性和女性候选人的晋升率相同,那么正教授的女性比例应该会更高。这种差异的部分原因是,女性发表文章的记录导致她们的晋升率降低。另一个原因是,她们在晋升之前离开了学术界。

    女性在学术、法律、咨询、管理和金融等领域的低晋升率,归因于人们通常所称的“管道泄漏”现象。“管道泄漏”是指女性和男性晋升前都有离职者,但在各个关键时刻,女性离职的比例高于男性。

    人们一直想方设法寻找女性流失率更高的原因。通过比较论文发表能力相当的男性和女性,大家发现偏见、偏袒和指导不足等因素依然存在。但是,大多数“非升即走”职业中管道泄漏的主要原因,带领我们回到了晋升所需的时间问题上。高强度的职业对所有人来说都是艰难的。尤其是年轻的父母,更加辛苦;而在通往顶峰的路上,放慢脚步并投入大量家庭时间的一方,往往就是女性。

    女性从事这些职业所面临的最大障碍,是我们熟悉的时间要求,而并非只是工作时间的问题。时间要求还包括生活中需求最大的时刻。一如上文所述,这些压力在个人的30 多岁时冲至顶点。

    工作时间对于升职非常重要,这一点不难在法律等注重工时的职业中得到验证。律师按小时(甚至按分钟)计费,律师事务所自然要密切关注时间。我们知道女律师成为合伙人的比例低于男律师。但直到最近大家才了解个中原因。美国律师协会组织了一项大规模的律师调查(称为“法学博士之后”项目),追踪他们的等级并进行分析;结果表明,成为合伙人与投入的时间之间存在显著的相关性。助理律师的工作时间和获得的收入,是造成男女晋升率差异的主要因素。         

    随着越来越多的女性开始从事这类职业,以及越来越多的男性希望与生活伴侣建立平等关系,老规矩和旧思想产生了越来越大的成本。机构并不想人才流失,而流失的人才大部分又是女性。

    3. 一丝微光,职业公平的解决方案

    大学设有最严厉的“非升即走”政策,不过,在为男女初级教员提供家庭假期和为获得终身教职按下暂停键方面,大学日益宽容。新的职位被开发出来,可以绕过严格的“非升即走”途径。

    无法忍受加班加点争取终身教职的人,或者自认无缘晋升的人可以考虑讲师和兼职职位。法律和会计领域则有非股权合伙制。个人可以沿着食物链行进,在小型机构获得终身职位,或者成为规模较小、利润较低的律师事务所或会计师事务所的合伙人。

    公司也不想失去训练有素的员工,特别是在专业服务行业,客户关系丰富,培训成本(由公司承担)通常很高。没有孩子的年轻员工几乎没有个人时间限制,一般都希望给公司合伙人和高层管理者留下好印象。他们会长时间投入工作,频频相互竞争。如果是20多岁的年轻人,拼命工作没问题。但这并不是很多人,尤其是女性,在有了年幼子女后想要的生活。高层管理者尤其是CEO(首席执行官)们,都愿意减少已经成为多数年轻员工常态的漫长且往往不可预测的工作时间。

    高盛、摩根大通、花旗集团、美国银行、摩根士丹利、巴克莱和瑞士信贷等华尔街巨头们,也纷纷决心创设更好的激励机制,化解如何留住公司困扰年轻人才的委托代理问题。金融巨头开始订立规则,保护周末和晚上的时间、带薪休假、法定假期以及快捷的晋升途径。

    2013年,高盛发起一轮大行动:“我们致力于实施下列举措,以更好地推助本公司初级银行家拥有成功且可持续的长期职业生涯。”规则很明确,几乎没有需要向执行委员会报告的例外情况。“所有分析师和员工周五晚上9点至周日早上9点必须离开办公室(自本周末开始)……所有分析员和经理预计……每年应有3周休假。”此外,不准把工作从办公室搬到家里或附近的咖啡店。一年后,瑞士信贷禁止周六上班,美银美林集团倡议初级银行家每月至少休四天周末。

    科技巨擘们同样明白,长时间工作会破坏舒适的工作环境。2016年,亚马逊为了打造“适当缩短工作时间但仍能促进成功和职业发展的环境”,宣布允许科技人员乃至经理削减25%的工作时间,同时降低25% 的薪酬。员工基本上是按小时减扣工资。

    一些咨询公司和会计师事务所已经落实政策,限制年轻员工长途出差的次数。一些公司则限定员工的工作时间,限制员工下班后发送电子邮件。这些由高级合伙人和CEO 推行的举措引人注目,他们认为,有些经理驱使年轻员工玩儿命工作,以致后者被迫辞职。每个经理和合伙人都希望自己的项目顺利完成,他们不会时时顾及疯狂工作给整个公司带来的成本。无论成功与否,为控制年轻员工过度工作所做的大量努力说明,公司及员工已经认识到,拼命工作是要付出代价的。

    20世纪90年代前半期,美国最大的两家会计师事务所察觉了自身存在的严重人事问题。他们在招聘女性层面做得很好,注册会计师有一半是女性。但这些女性很少能成为合伙人。就像一些业内人士所言,他们一直在流失女性会计师。多数高层领导并不认为可以遏制这种流失。然而,聪明好奇的德勤CEO 迈克尔·库克(Michael Cook)提出了异议,并于1992年委托一个外部审核小组调查女性离职的原因。

    调查发现,女性早在晋升前就已陆续离职。报告称,德勤的文化不断排挤她们。她们接不到利润丰厚的会计业务,不被委以重任,还被斥以不够坚毅,至少被认为没有男同事能吃苦耐劳。在库克的领导下,德勤的企业文化发生质变。女性新合伙人比例渐有上升。

    1997年,安永CEO菲尔·拉斯卡维(Phil Laskawy)发现了类似的问题。公司尝试了实行弹性工作制、开展职业辅导、建立女性网络等策略。不久,安永的女性合伙人比例也见长。

    不只德勤和安永提高了女性合伙人比例,该行业一些政策不算开明的公司也有同样的提升。目前尚无法评估这种提升有多少是由于德勤特意改变企业文化的策略,或安永的弹性工作安排。但有其他证据表明,存在更基本的结构性因素阻碍女性攀登事业高峰。

    这些职业实施的解决方案都不充分。在法律、会计和咨询行业,非股权合伙人的报酬相当低。在学术界,虽然兼职教员有男有女,但女性兼职的比例还是过高。这些职位通常提供给随行配偶(不论男性或女性)。奈何在地理位置上,女性历来更多捆绑于丈夫的职位。甚至就在最近,暂停“非升即走”考核的举措也受到了批评。研究表明,女性需要额外一个学期来照顾家庭;男人则利用这些时间发表更多的学术论文。“非升即走”制度与组建和养育家庭并不协调。这些做法均不适合任何性别,但鉴于现实情况,女性付出的代价更大。         

    毫不奇怪,工作随叫随到、时间不规律又不可预测的员工,往往比工作时间接近正常的员工挣得多。更重要的是,这种溢价给女性的职业生涯和夫妻公平造成了问题。时间长或随叫随到工作的时薪溢价越高,尤其在有孩子时夫妻双方进行分工的激励就越大。

    我所说的“分工”,并非指一人洗碗,另一人擦干。我指的是更普遍的事务:正像我们在整个旅程中看到的,一人(通常是妻子)花更多的时间为家庭待命,另一人(通常是丈夫)花更多的时间在工作中待命。

    如果有孩子的夫妇不进行分工,也即他们不做出最普遍的决定(让一方在家事上待命,另一方在工作上待命),那就意味着他们要少挣钱。两人不能同时接受无法控制时间的工作,因为要照顾孩子;就像我的狗,会在某天不可知的时间生病和需要帮助。

    当能多挣的收入并不是很多时,按照夫妻双方的意愿,少挣就少挣吧。换言之,两人都可以拒绝时间较难预测的工作。这样就好比他们用放弃的那部分薪水购买夫妻公平。可如果这笔钱数额很大,夫妻公平的成本也许就会高到难以抗拒这份工作;进而夫妻公平可能会被放置一边但这不是唯一的损失。当夫妻公平被搁置,职场中的性别平等问题也将随之而起。即便按时薪计算,女性的收入也会低于男性。问题既在于劳动力市场的工作如何计酬,也在于家庭的劳作和照顾如何按性别划分。

    关键是,正如律师和药师案例所启示的,性别(不)平等和夫妻(不)公平恰似硬币的正反两面。造成夫妻间不公平的,是我们一直在探究的艰难抉择:夫妻中有一方,通常是女性,决定在家待命。这也意味着,总体说来,哪怕按时薪计酬,女性的收入也比男性低。这继而引发了性别不平等。幸好,黑暗中突现一丝微光:越来越多人开始努力争取夫妻公平,争取与家人共度时光。

    本文整理自克劳迪娅·戈尔(Claudia Goldin)的著作《事业还是家庭?女性追求平等的百年旅程》。

  • 黄盈盈,潘绥铭:中国东北地区劳动力市场中的女性性工作者

    2002年7月到9月‚我们课题组以“入住式社区考察”的方法在东北A市、B市和C市三个地方进行了为期两个月的红灯区考察。这是一项探索式研究‚创新之处主要有二:其一‚把女性性工作者作为劳动力市场中的一分子考察她们的主要就业经历(包括性工作)‚从纵向的、过程的视角来发现这些女性进入性工作的原因;其二‚定性方法与定量方法的协作并用;以“入住式社区考察”为主要方式收集原始材料‚并把定性资料进行量化处理。

    主要发现有四:其一‚本次访谈的这三地的103个小姐几乎都是城市户口‚下岗女工占半数;其二‚其中的本市人或者附近城市的人比较多。这意味着这些小姐的“匿名性”的弱化;其三‚从下岗到做小姐只是一种“职业平移”现象。由于个人经验资源的短缺与社会就业的救济性质‚她们所获得的历次职业的社会地位一直非常接近‚并不存在“堕落”;其四‚在连续的职业流动中‚各种“关系”所发挥的作用呈现为:“无关系”(自己闯)与“亲关系”(靠亲属)渐行渐弱;“友关系”最终占上风;而“公关系”(正规的职业中介)对于这些女性来说非常陌生。

    一、目的、研究对象与方法

    (一)研究的背景与目的

    通过文献分析‚我们发现以往有关“小姐”的研究资料主要有四种类型:1.写史的人从史学角度对资料加以汇编与分析‚通常可分为“娼妓史”或“禁娼史”;2.政府、公安部门的人从社会控制的角度进行的社会调查与对策研究‚通常关注“扫黄”的问题;3.医生、防疫站从性病、艾滋病预防角度进行的调查与研
    究;4.社会科学研究者从社会学、人类学角度进行的调查与研究。

    大多数资料仅仅描绘最表面的现象‚或者局限于为政府的扫黄政策做解释‚或者对于“卖淫”进行道德谴责‚学术意义十分贫乏。一部分颇有价值的学术著作也主要是把目光集中在小姐本人的现状‚所考察的也大多是农村或城郊的红灯区情况(潘绥铭‚1999‚2000;黄盈盈‚2002)。因此‚尽管在目前的中国许多人都知道有些城市里的失业女性从事了性工作‚而且流传着许多民谣;但是很少有人了解具体深入的情况‚更没有对此进行研究与解释。

    大多数著作没有意识到“小姐”也是劳动力市场中的一分子;“做小姐”也是妇女就业的一种选择结果‚不管这种选择是主动的还是被动的。因而从研究角度讲‚小姐的这种劳动者身份受到双重忽视——研究小姐的人忽视了她们在劳动力市场中找工作的经历‚研究妇女就业的人则忽视了小姐也是需要就业的广大妇女中的一员。

    本项研究旨在弥补这方面的缺陷‚尝试把“小姐”放到整个妇女就业(包括农村进城妇女)的全局中去‚考察她们的就业机会、准备、途径、结果‚从而研究这些妇女是怎样进入性产业以及为什么会进入;本研究格外注意小姐中那些原来就是城市户口的人‚无论是从来就没有工作过的女性还是下岗人员。

    (二)研究对象

    基于我们的研究目的‚我们对研究对象进行三层界定:女性失业劳动力、女性性工作者、作为地理和时间范畴的东北地区。

    界定一‚女性失业劳动力包括:15-50岁人群中的待业者(可以劳动却没有工作‚包括农村进城的人)、完全失业者(所有那些曾经有过工作‚却完全失掉了的人‚包括城市人和农村人)、半失业者(目前无工作‚但是仍然从原来的工作中领取一定金额的人‚包括:待岗、内退、放长假等等)。

    界定二‚女性性工作者(也称为“小姐”)包括:1.性服务者‚即狭义的性工作者:目前正在提供直接的性交服务(通常称为“出台”)的‚有过一次就算。在调查中我们主要根据两个标准来判断小姐是不是直接的性服务者:小姐个人有出台行为‚或个人所在服务场所是专门提供性交服务的。2.涉性工作者‚即广义的性工作者:包括目前正在从事三陪、异性按摩、脱衣舞表演‚以及隐蔽在陪伴、保姆、计时服务等名义中的性服务者。

    界定三‚地理和时间概念包括:局限在东北地区‚以“市”为单位。凡是现在在调查地的妇女都算‚无论来自何方、居住了多长时间。

    我们在A市、B市、C市一共访谈了在中低档的歌舞厅和按摩店工作的103位正在从事直接性服务或涉性服务的待业、完全失业、半失业女性‚包括城市户口和农村户口。

    (三)研究方法与步骤

    本项研究在方法上的创新之处在于:以定性方法为基础‚定性方法与定量方法的互相结合与相互转化。这种定性方法与定量方法的结合并不是一般人所认为的在现场收集材料的过程中既做问卷又做访谈;而是在研究的不同阶段使用不同方法‚取长补短相互结合。根据我们的经验‚这种方式在红灯区考察中比较适宜。我们的具体做法是:

    (1 )准备阶段。实地考察前‚首先从研究目的出发设计好非常细化的访谈提纲‚并在电脑中形成相应的数据库。然后调查人员事先把这些问题背下来‚并转化为自己的日常语言进行练习。

    (2)实地踩点。实地考察前半个月‚课题负责人到东北地区打探红灯区情况‚落实具体调查点‚联系红灯区内或离得最近的方便于考察的住处。本次踩点共涉及性产业较发达的11个城市‚最后选定A市、B市和C市。这三地是经过挑选的‚各有特点‚有利于更全面地了解各种情况。

    (3)田野工作。基于研究对象的“非法”与“地下”的特性‚现场收集材料时‚我们还是采用定性的“入
    住式社区考察”。考察员除负责人外都是女性。是否进行匿名考察、在多大程度上告诉被考察者我们的研究目的‚要视具体情况而定。

    我们入住之后‚首先花一天时间摸清该红灯区的大概面貌‚然后根据当地性产业的具体情况‚尝试“进入”方式(即第一次接触、认识小姐)。基于东北的性产业情况‚我们认为比较成功的进入方式是:2-3个人一小组以唱歌或按摩的方式认识老板娘和小姐‚通常是一个人唱歌‚别人找机会跟没事的小姐认识、交谈‚并寻找进一步交谈的机会。

    其次‚我们“进入”以后以非正规的聊天方式‚结合听、看等其他手段‚逐渐获取所需材料。这通常需要考察员在自然的情境中‚不露痕迹地把话题引到我们的问题上。不过‚我们所获得的资料不限于事先设计好的问题。

    第三‚我们当天回来记录聊天内容‚把所有材料输入电脑或记在笔记本上‚形成原始的定性材料‚并把相关内容提炼为问卷的答案部分输进电脑。定性材料通常按时间顺序记录‚内容包括整个考察过程(进入的方式、跟小姐聊天的步骤和内容)、观察到的东西以及自己的感受与感想。问卷内容则按每个个案(小姐)记录。我们尽量把原始答案提炼后记录在数据库里‚统计时再归类分析。

    最后‚课题组在当天或隔天会进行讨论‚总结、交流经验并随时提出问题‚共同商讨解决方法。我们还会根据所获资料随时修正问卷中的变量‚补充材料。

    (4)整理材料和书写报告。本次考察我们一共获得103个小姐的详细定性资料‚同时把部分内容进行定量化处理‚形成了103份较为完整的问卷。对于问卷部分‚我们所需要做的主要是查看回答项‚并做适度的归类‚然后用SPSS10∙0进行简单的统计分析。对于所有的定性材料‚我们还需要继续做两方面的工作:其一‚整理出较为完整的个案;其二‚设计好主题标签‚把所有的定性材料根据内容贴上标签‚以备进一步的查找、归类和比较。在整理资料期间‚我们通常每周开1-2次讨论会。

    本文的定量分析的目的‚不打算、也不可能推论总体‚但至少能反映这103个东北小姐的相关情况。我们在选点的时候尽量考虑到了调查点的代表性‚从而可以对东北劳动力市场中的女性性工作者有个粗略的了解。

    二、社区基本情况

    基于篇幅‚这里简单介绍与性产业直接相关的社区基本情况。总体上讲‚A市是卫星城市‚以歌厅为主‚其他的性服务形式较少;B市的性服务规模最大‚存在歌厅、按摩、直接进行性交易等各种形式;C市也有歌厅‚但主要是以按摩为主‚而且小姐年龄较前两者偏大‚本地下岗女性偏多。

    (一)A市

    A市的性服务业主要以歌厅为主‚约有300来家歌厅‚分布在6-7条街上。据当地公安局的一个主任介绍‚A市的性产业以前都叫做洗头房‚后来打击了‚都叫做歌厅。1998年前后是性产业发展的高峰期,有上千家带小姐的歌厅。这两年减少了‚当地人认为这主要是因为:经济不好;男人不喜欢嫖了。而政府打击不是主要原因。

    此地的歌厅一般规模比较小‚仅一个门面。纯粹歌厅和带小姐的歌厅会同时在一条街上出现‚门上都写着“一元一首(歌)、高级音响”之类的字。初来乍到者一般分不清哪些是带小姐的。但后来有老板告诉我们‚可以根据两点来判断:其一就是写着“歌舞厅”的一般是带小姐的‚而写着“歌厅”的则一般是不带小姐的;还有就是以马路为隔‚马路的这一段是带小姐的‚另一段则是不带小姐的。A市的小姐基本上都是吃住在营业场所里。

    A市的“客人”以前主要是来自A省省会的富人或者干部‚因为A省省会“扫黄”比较严厉‚所以客人就到A市来‚只要开车40分钟左右。近年来‚由于经济全面不景气‚A省省会来的客人少了‚附近城镇中的富人来的较多。

    (二)B市

    B市的经济在三个地方中是最好的。性服务形式比较多样‚不仅有歌舞厅‚还有按摩、直接进行性交易等形式。B市的性服务场所最繁华的街道是jing街‚至少有80多家歌舞厅和按摩店。但是它并不是最典型的红灯区‚因为在这条街上‚性服务场所跟正规商店饭店混杂在一起‚而且很多是在正规商店的二楼上‚经常是一个过道有4-5家。B市的按摩店和歌舞厅很多是串在一起的‚即:歌舞厅缺人的时候就到按摩店叫人。有些歌舞厅自己不带小姐‚但可以帮客人叫小姐。B市的小姐很多‚流动性比较强‚不像A市那样吃住在工作场所‚而是自己在外面租房子住‚自由度更大一些。

    B市的“客人”群体主要是那些来B市“搞资源”的外地商人‚他们有钱‚见过世面‚敢嫖。其次是本地的一些“耗子”‚他们靠大批量偷取国家资源发财‚往往有后台‚也敢嫖。还有一些“领导”‚是靠包庇“耗子”发财的。

    (三)C市

    跟A市、B市相比‚C市的经济最不景气‚下岗的情况最严重。C市性服务形式主要是按摩店‚也有歌舞厅‚但不是很多。按摩店一般规模不大‚7、8个小姐的比较多。它们的数量很多‚但也比较分散‚有遍地开花的趋势。C市直接提供性交服务的比较少‚“打飞机”(为客人手淫)的情况相对要多一些。C市有不少规模比较大的浴池‚基本上都提供“打飞机”以上的性服务‚因此那里按摩的价格比一般的按摩店要高出2-3倍。在C市的小姐中‚下岗工人比较多‚30-40岁之间的女性比较多。

    C市的客人也主要是外地来的商人‚因为C市的石化厂仍然非常兴旺‚招来许多人。此外就是附近各种小企业的私营老板们。当地人形容说:“锅(国)漏了‚(所以)碗(老板)满了。”不过‚C市本地的一般客人也比较多‚因为只要不下岗‚在当地就是生活富裕的人了。

    三、研究发现

    我们把定性访谈资料整理为问卷之后‚主要涉及四个方面:(1 )小姐的基本情况‚包括年龄、教育程度、家乡所在地(离工作地远近)以及户口;(2)小姐中下岗的情况‚包括是否是下岗工人、下岗前的工人
    类别、单位所有制、下岗原因以及下岗后的待遇等;(3)小姐的工作经历‚包括做小姐前的那一次工作、倒数第二次和第三次的工作。每个工作都包括工作种类、性质、寻找途径、工资情况以及离开原因;(4)做小姐的基本情况‚包括做小姐的时间、收入、寻找途径等。
    通过统计‚再辅助以相关的定性材料的归纳分析‚本次研究主要有三个方面的发现:

    (一)发现之一:“下岗妹”群体的存在

    “下岗女工”和“小姐”可以说是两个形象差距悬殊的身份概念。在人们刻板的印象中‚下岗女工通常是受人同情、非常正面的劳动妇女的形象‚往往与“30-40岁”、“上有老下有小”、“辛劳了几十年最后被单位扫地出门”这些特征相吻合;“小姐”则通常是受人歧视、非常负面的堕落少女形象‚往往与“吃青春饭的”、“不务正业”、“贪图享乐”等特征相吻合。人们把“哀其不幸”给了下岗女工‚把“耻其不争”给了小姐。这两个相距甚远的形象很难捏合在一起。但是经济变化给人们的道德观念带来的冲击往往是巨
    大的。在下岗情况严重、经济不景气的情况下‚社会上流行的民谣首先把这两种似乎没有交点的身份融合在一个人的身上。且听:

    下岗妹‚别流泪‚挺胸走进夜总会;陪大款‚挣小费‚不给国家添累赘;
    爹和妈‚半生苦‚老来待业很凄楚;弱女子‚当自强‚开发身体养爹娘。

    这个民谣早几年就已经在社会上传诵开‚而我们的考察则给它提供了两方面的事实根据。
    1∙小姐中‚城市下岗女工占一半
    本次访谈的这103个东北小姐‚最小的16岁‚最大的47岁;平均年龄25∙1岁‚中位数是24岁。与我们以往调查到的其他地方的小姐相比‚她们的年龄更大。
    此外‚她们的“出身”有两大不同:其一‚拥有城市户口的小姐占到95%;其二‚她们当中原来在国有或者集体等正规单位工作、现在下岗或者完全失业的人比较多:在A市是47∙5%;在B市是41∙7%;在C市则高达72∙7%;三地总计为51∙0%。
    她们下岗前情况主要有这些特点:绝大多数都是在本地下的岗(98%);下岗前主要是没有技术的熟练工人(62%);下岗前主要在国有企业工作(74%);大多数人失去工作是因为单位的原因(单位裁员、破
    产倒闭、改制、被吞并等‚占74∙5%)‚而不是因为个人的原因(指自己主动辞职、请长假等)。这一规律
    在C市尤其明显‚93∙8%的人是因为企业效益不行或倒闭而被迫失去工作。
    至于另外一半左右的小姐‚虽然不是下岗女工‚却基本上是城市户口‚属于“待业青年”‚因此也可以纳入到劳动力市场的范畴里进行分析。

    2.她们曾经找过许多其他工作
    在我们的调查中‚下岗后或者待业后直接做小姐的女性只有不足9%。其余的人都是在经过相当长的时间(平均51∙5个月)、找过多种工作(平均4∙7个)之后‚才最终选择进入性产业。如果说至少干过一个月才算有过一个长期工作的话‚那么在这些小姐中‚87∙4%的人至少有过一个长期工作;65∙0%至少有过两个长期工作;38∙8%至少有过三个长期工作。尤其是‚在她们当中‚即使以前做过“三陪小姐”(不卖淫)的‚也只有3∙9%。这更加可以说明:她们并非“天生就是这块料”‚也不是“好逸恶劳”‚更不是“自甘堕落”‚而是曾经在劳动力市场中‚朝着人们认为是正常的工作‚屡屡挣扎过。
    她们曾经是国家的主人翁‚处在劳动力市场的核心地带。但是下岗之后‚她们四处奔波‚不得已才进入性产业这样一个不被正眼瞧的行业。结果‚深受社会同情的正面劳动妇女形象与痛遭社会鞭挞的负面不良少女形象‚在经济和生活压力的冲击下合二而一。由此‚我们也就可以体会到前述民谣中非凡的“民间智慧”:下岗妹=下岗女工+小姐。

    (二)发现之二:小姐的匿名性在弱化

    匿名性通常被认为是现代的“性工作”的生存基础‚因为它必须建立在一个“陌生人社会”中。“陌生
    人”指的是和我们没有私人亲密关系、只能在公共生活中遭遇的人。只有“陌生人社会”才能够使性工作
    者藏身在茫茫人海中‚才得以脱离家乡社群的监视而在城市讨生活(卡维波‚2001 )。性产业对于匿名性
    的需求‚与现代社会中对于“小姐”身份的“污名化”紧密相连。

    一个性工作者为了给自己营造一个匿名的社会‚需要采取很多措施‚比如给自己起假名、隐瞒自己的家乡、用假身份证等等‚但其中很重要的一种方法就是必须远离自己的家乡‚在一个碰不见熟人的地方开始塑造自己的“小姐”身份。

    根据我们以往的调查经验‚大多数小姐是从外省来的流动人口(例如广东、深圳的情况)‚或者是从该省距离相当远的其他地方过来(例如四川的情况)。她们最担心的问题之一就是害怕家里人知道自己在这里做小姐‚所以离家越远匿名性就越好‚受到的心理压力也就相对越小。可以说‚一个匿名的情境可以帮助她们尽快地认同自己的“小姐”身份。因而‚鲜少有人会在家门口做小姐。

    但是‚跟我们以往了解到的其他地方的小姐相比‚这103个东北小姐体现出来的最大特点之一恰恰就在于:小姐中本地或是附近城市户口的人比较多(见表1 )。

    从表1可以看出‚家乡就在本地或者附近50公里之内的小姐非常多‚两项之和占到总数的63∙1%。再加上家乡在本省的‚就达到80∙6%。也就是说‚绝大多数小姐的流动范围并没有超过本省。小姐的家乡与她们现在工作的城市的直线距离的中位数‚只有50公里‚而且其中三分之一的人就在本市范围内做小姐。这无疑体现了这部分小姐对于匿名性的需求的弱化。

    根据我们的理解‚导致这种“匿名性弱化”的原因至少有三:
    其一‚女工下岗与道德舆论的互动。由于女工下岗的情况比较严重‚再就业的可能性与选择性都非常小。因此当地整体舆论对于“做小姐”这种谋生之道的谴责‚比我们所调查过的其他地区要小得多‚甚至比人们认为是最开放的深圳还要小。①
    舆论压力的弱化降低了这些女性选择性产业的心理成本‚同时也加强了小姐们对于自己为什么干这行的合理化解释。两者相辅相成。匿名的重要性在这种互动的面前显得微不足道。

    其二‚当地娱乐生活传统与“私人空间”成长的互动。东北地区在历史上是一个“移入社会”‚因此‚中原地区那种对于各种“涉性”娱乐活动的抑制‚在这里相当弱化。例如‚“黄”一直是“二人转”中的重要内容。在日常生活中‚异性之间的“人身距离”相对较小‚也被认为是该地区的特点之一。最近20年来‚私人空间的成长‚在这个方面则表现为向这种“本地传统”的回归。

    在东北‚洗浴、歌厅、按摩、足疗这几个最容易成为性产业依托点的行业‚虽然不能说是全国最早出现的‚但是十几年来一直就非常发达。C市的普通人甚至全都坚信:所谓“足疗”‚就是当地人在1990年代首先发明‚然后才传遍全国的。②用当地人自己的解释是:东北人爱玩‚即使一家子吃了晚饭出来溜哒‚也会进小歌厅吼两声。如果乏了‚就会到足疗店按摩一下。这些都很正常‚即使估计到其中可能含有“涉性”的内容‚也很少有人会去深究。所以‚一个女性如果告诉家里人自己在浴池做按摩或是在歌厅里放碟‚也不是什么丢脸的事情。

    其三‚小姐外出与“留守”之间的互动。根据我们对于全国许多地方的性产业的了解‚“东北小姐”在各地都是一个以其开放与泼辣而闻名遐迩的群体;“东北小姐遍天下”的传闻并不是空穴来风。就在我们考察C市期间‚当地十几位女性居然被拐卖到万里之外的中东国家‚成为一个大案。这表明:我们这次所调查到的、目前仍然留在家乡而没有外出的这些小姐‚恰恰是那些缺乏足够的勇气、能力、条件去走南闯北的女性。

    我们访谈到的这些小姐‚最小年龄16岁‚最大年龄47岁。在解释自己为什么不出去闯闯时‚她们既没有提到自己太小或者太老;也没有说过因为自己漂亮或者不漂亮。她们的回答基本上都是家里离不开‚或是上有老下有小‚或是家里人生病需要照顾‚或是对离开这片土地心里茫然。也就是说‚人们通常所认为的“年轻漂亮的小姐容易外出”并不成立。小姐的外出与留守‚是由更加深刻的原因决定的。

    但是‚不管其中的原因是什么‚外出与留守之间却产生了互动。留守的小姐恰恰是因为自己的顾虑多、负担重而获得了更多的合理化解释:我都惨成这样了‚连“人往高处走”都做不到了‚还怕什么道德谴责吗?这就造成了当地留守小姐对于匿名性需求的弱化。

    当然‚这三个地方的特色也是不同的。我们不难发现:家在本地或附近的小姐比例在B市最少‚占6∙4%;在C市最多‚占81∙8%;A市则是居中。三地的这种差异主要源于三地的经济状况与下岗情况。

    简单地讲‚C市下岗情况最严重‚所以本地就业的小姐比例相对也最高。B市则是因为当地经济相对比
    较好‚性消费仍然强劲‚所以吸引来的外地小姐也多。

    也就是说‚匿名性的弱化并不是因为这些小姐已经潇洒到可以“走自己的路‚让别人说去吧”‚更不
    是“利令智昏”‚而是生活处境使然。因此‚用“恬不知耻”来对她们进行道德谴责‚是没有事实根据的。

    (三)发现之三:做小姐只是一种职业“平移”

    1.情况描述

    人们通常认为:从一个无论做什么职业的女工到“做小姐”‚这两者之间存在一道深沟险壑‚迈出这一步通常被冠以“堕落”或“失足”。因而‚如果说一般的职业之间的流动是一种量上的变化的话‚那么从女工到小姐的流动则被认为是一种质的变化‚是从良家妇女到非法娼妓的变化。

    我们在访谈中发现‚大多数小姐对于失业/下岗前的正式工作的满意度都比较高‚都很留恋那时候自己所拥有的整体状况。那么‚从国企工人这样一个社会地位比较高的位置‚跌落至“小姐”这样一个处于边缘地带的职业‚其落差到底有多大?换言之‚为什么这些女性在被迫丢下铁饭碗后‚会拾起“小姐”这样一个被社会视为藏污纳垢而丢置墙隅的破碗?这也是很多人极力寻求答案的一个问题。本次调查正是从这些女性在劳动力市场中流动的过程、从她们经历过的工作之间的比较这个角度出发试图发现一些新线索。

    我们发现‚这些东北小姐并不是直接从一个社会地位比较高的职业骤然下降至社会地位很低甚至是没有任何地位的性服务职业‚而是中间经历很多次找工作的过程。她们在那时就已经处于劳动力市场的边缘了。尤其是‚这些工作的职业地位已经与“做小姐”非常接近。因此‚从职业流动的角度来看‚她们所迈出的这一步并没有多大的落差‚反而更像是一种职业之间的“平移”‚而不是上升或者下降。

    下面我们从工作内容和工资收入这两个主要问题对“做小姐”之前的3次工作进行比较分析。我们的前提保证是:在这103位小姐中‚除1人之外‚都是自愿做小姐的。因此可以把做小姐与她们的其他职业经历等同和联系起来进行分析。

    在我们的分析框架里‚第一次下岗失业前的工作为职业流动的起点‚“做小姐”是终点‚离“做小姐”最近的三次工作则是重要的中间点。我们通过分析这几个职业的社会地位差异‚对这个群体的职业流动做一个初步的探讨‚并试图从过程和比较中来寻找这些女性选择做性工作的原因。

    (1 )做小姐之前的具体工作

    从表2可以清楚地看出三个趋势:
    首先‚无论在哪次工作中‚做各种服务员的人都是最多的‚而能够从事任何一种非体力劳动的、比较体面的工作的人都是最少的。
    其次‚她们每换一次工作‚成为“准小姐”的比例就随之剧增一次;而其他所有职业也就随之逐次减少。
    第三‚除了“较体面”的工作以外‚所有其他工作的社会地位都不怎么样‚即使是当小老板‚做的也都是些非常小的买卖。因此可以说她们均处在社会的最底层‚在阶层上的差异性并不大。
    这些情况不仅是一种职业平移的表现‚而且是其原因之一‚因为她们在那些与性产业关系密切的工作中‚更加可能接触和获得性产业的相关信息‚足以更快和更充分地作好信息准备。

    (2)“做小姐”之前与之后的工资①比较


    从表3的工资比较上看‚做小姐之前的3个工作的工资的中位数在500-600元之间。②其中那些收入不稳定的人主要是美容美发与按摩女和各种小商小贩‚她们的最低收入与最高收入相差500元左右。有些人的最低收入是负值(如-500元)‚也就是做小买卖亏本。有的人的最高收入才300元‚比服务员还少‚这是因为在东北的小商贩这个职业中‚往往是“卖的人比买的人还多”。
    很明显‚“做小姐”的工资收入(中位数1500元)比前3次工作要高出很多。这无疑是任何一种职业流动的主要原因‚无论它符合不符合道德。

    2.职业平移的确定分层社会学意义上的讨论 

    职业流动是社会科学最引人注目的课题之一‚早在20世纪20年代‚索罗金(Sorokin)就编列过有关职业流动的23个表;从60年代起‚布劳-邓肯对职业流动模型、影响职业流动相关因素等内容进行不断的探讨与修正‚极大推动了这方面的研究(M∙侯特‚2001 );国内李强教授等对于职业声望的评价(李强‚2000)以及农民工初次、再次职业流动的分析(李强‚1999)也促进了流动理论的进一步发展。

    职业间的流动到底是平移、上升还是下降‚社会学上最常见的研究是从收入、权力和声望这三个指标进行评价‚通常是把这些指标量化并计算其社会经济地位综合值。可是‚以往学者有关职业地位的调查‚从来不包括性工作者在内‚因而我们无法找到一个现成的职业地位等级来对照“小姐”这个职业在其中的排名情况。因而‚我们在这里也只能从探索性的目的出发‚作一个简略的优势—劣势权衡分析。

    毫无疑问‚小姐们的历次工作‚尤其是“最近那次工作”的职业地位‚在通常的职业排名中是非常靠后的‚往往只比进城农民工、看门人等略高一些(李强‚2000)。我们不妨结合小姐们自己对工作的评价‚从劳动强度、劳动时间、自由度、福利待遇、工资收入、心理成本等方面粗略地比较一下:“以前的”与“现在的”工作的职业地位究竟有多大的差异。

    她们以前的历次工作‚最主要的是在个体、私营性质的宾馆、歌厅、饭店里做服务员以及摆小摊的小商贩。这些工作不可能附带任何的权力‚福利待遇也几乎等于零。但相比而言‚“做小姐”的权力和福利待遇不仅没有‚而且是负值(经常遭遇扫黄和罚款‚被感染性病‚受客人欺负等各种风险也都更大)。因而以前的历次工作在这些方面略占优势。

    从职业名声来看‚尽管以前的历次工作在一般职业表中排位很靠后‚但无疑仍然比“做小姐”占优势。也可以说‚选择“做小姐”要付出的心理成本要远远大于做服务员或摆小摊。但不可忽视的是‚随着社会舆论对于性产业的相对宽容以及“笑贫不笑娼”观念的深化(正如本文在“匿名性弱化”部分所分析的)‚“做小姐”的心理成本将会逐渐降低。

    从劳动强度和劳动时间上看‚两类工作的程度是相当的。做服务员或摆小摊通常的工作时间在12小时以上‚而且非常辛苦。很多小姐在描述自己干过的这些工作时都说:太累了。与此相对照‚“做小姐”的上班时间通常是中午12点左右到凌晨2、3点‚虽然单位时间的劳动强度并不是很大(生意不好的情况下‚一天平均一个“生意”都不大可能)‚但对于女性来讲‚经常熬夜的代价也是很大的。用小姐自己的话讲‚就是“很熬人”。
    从自由度方面讲‚“做小姐”总体上的自由度往往比较高(少数受人身控制的除外)。很多小姐在讲述做小姐的好处时经常提到“自由”、“爱做就做‚不做就不做”。可是各类服务员则通常是固定时间上班‚老板通常管得很严。小商贩则是在经济强制下也不甚自由。

    与以前的历次工作相比‚“做小姐”的最大优势在于工资收入高。尽管东北地区的这种工资差距比我们以往调查的广东、深圳小许多‚但显而易见‚如果仅仅从工资收入上看‚做小姐无疑是一种上升。

    综上所述‚简而言之‚从其他职业到“做小姐”‚其实只是一种得失平衡‚只是对于一个大体不变的总量所进行的结构调整。小姐以牺牲福利待遇、可能附带的权力、社会声望等方面的利益‚来换取较高的收入、更轻的劳动强度和相对的自由。所以我们认为‚从总体上来说‚这仍然只是一种职业平移。

    对这些小姐来说‚下岗‚从国家主人翁一夜之间变成服务员‚这才是最大的和最根本的“坠落”。从那以后‚她们就再也没有进入过劳动力市场的中心地带。她们“做小姐”只是找到了另外一个谋生的工作‚仅仅是平行地换了另外一种职业。

    我们在本次访谈中不断地发现:她们自己对这一点的感觉与认知都非常明确和坚定。我们的一个最突出和最强烈的感觉就是:在深谈当初做小姐的时候‚从来没有任何一位小姐对我们提到过什么“思想斗争”、“内心折磨”、“精神痛苦”等等;反而往往是像买东西算帐一样‚一条一条地细数“做小姐”这一行的各种利弊。也就是说‚这种职业平移不仅仅是一个客观上的结果‚也是她们主观上的选择。性社会学意义上的讨论“做小姐”与女性所能够从事的其他任何职业相比‚“性”是惟一的区别。

    它的根基问题则是:灵与肉、爱与性究竟能不能分离开。如果不能‚那么肉体与性的任何形式的借、租、
    卖‚就都决不可能被女性所容忍;反之‚各种形式的“做小姐”实际上就是不同程度地做到了这种分离‚直
    至极端。

    因此从性社会学的视角来看‚在上述的职业平移中‚其实只发生了一件事:在商业活动中‚这些女性与男性顾客之间的“人身距离”被缩短;性方面的“自我防卫圈”被压缩乃至被冲破;性意义上的“信号辨识能力”被强化乃至被异化;从而被培训出了“灵肉分离”的可能性。

    可是‚这一切并不是发生在她们“做小姐”的前一天‚而是自从做任何一种女服务员时就开始了。到了做任何一种与男性有皮肤接触的工作时‚前述的“培训”其实就已经完成了;她们其实就已经“涉性”了;因为皮肤是“性”的终端感受器。只不过其中的筛选机制‚还需要运用分层社会学的视角来分析。

    3.原因分析

    出现这种职业平移现象的原因‚从宏观的角度来看‚无疑是因为在当地的劳动力市场中‚职业上升的机会非常稀缺。但是根本的问题是:这些女性在下岗或者待业之后‚被从原来的较好的社会处境中抛出来‚或者原来就无法进入。这造成了她们的经验资源、支持系统资源和经济资源不但都非常短缺‚而且在不断流失之中。因此即使她们偶遇上升的机会‚也很难把握住‚更难以坚持下来。

    从个人的经验资源(不仅仅是文化程度与技术水平)来看‚由于她们下岗或者待业之后很难在另一个类似的正规单位找到类似的工作‚所以她们原来千辛万苦积累起来的为人处世准则、人际协调能力乃至于整体的工作与生活方式‚对于她们的职业上升的帮助几乎是零。所以她们只能下降‚只能被放逐到市场中去从事服务员这样在地位上仅仅高于农民工的职业。其中‚曾经做过服务员的占47∙6%;做过各种体力劳动的占13∙6%;做过美容美发或者按摩的占28∙2%;可是做过任何一种非体力劳动的体面工作的只有6∙8%。①再者‚她们给个体经营者打工的最多‚占48∙9%;其次是在私营单位工作‚占27∙8%;自己摆小摊无照经营的占4∙4%;在国有企业工作的只有2∙2%。结果‚她们不得不一切从头学起。

    可是‚这样的工作往往是临时的、多变的和职业跨度较大的。她们很难在其中积累起足够的经验资源‚也就不大可能为她们下一次找工作提供任何有效的支持。尤其是‚这样的工作无法使她们获得从事更高级工作的任何经验资源‚甚至把原来的经验资源也废弃了。结果‚她们不得不在劳动力市场的底层屡屡挣扎‚而且基本上是永无出头之日。

    从个人的支持系统资源来看‚在下岗或者待业之前‚她们的支持系统就基本上是处于相同的阶层之中。因此‚这一资源在当时就不可能帮助她们从非技术工人或者普通待业者的地位上向上流动;一旦她们下岗或者待业‚就更加不可能给她们提供有利于上升的就业信息与帮助。

    从所拥有的经济资源来看‚她们原来的积累就不多‚下岗或者待业之后就更少。例如‚她们在下岗时所获得的经济补偿最多是23000元‚最少的则是倒欠4500元;平均数是1400元;中位数则是0。在她们当中‚目前仍然能够领到任何一种补助的人只占10∙7%‚而且每月只能领到平均不足75元‚因为其中有3人是在扣除全部补助之后还需要给原单位交钱。这充其量只能使她们保住原来的城市户口以及随之而来的高于农民的那些基本利益‚例如不大会去种地、不至于饥寒交迫等等;却不可能为她们的职业上升提供有效的帮助。例如‚她们中间有35∙0%的人曾经去做过各式各样的小商贩‚因为她们的那一点点经济积累至多只能做这个‚其结果则是大概率的一事无成。

    总结起来看‚就“小姐为什么会成为小姐”这个问题而言‚我们所发现的这种职业平移现象‚既不能支持“突变论”也不能支持“渐变论”。

    以往的针对小姐的研究‚在分析人们为什么会去“做小姐”的原因时‚给我们提供的往往是一种“突变论”的思维范式。这种思维的前提假设是:从良家女子到“做小姐”‚其间存在一种深沟险壑‚因而凡是这样做了的女性‚必然会有某些极其特殊的、非常重大的原因。这就等于仅仅把“做小姐”作为惟一的一个断裂点来单独进行分析‚而缺乏一种过程分析式的视角。在这种范式下‚很容易出现道德上的“堕落论”;或者“重大事件论”(婚姻家庭变故、情感变故等)。

    本次研究是从职业流动的角度来考察性工作‚把“做小姐”视为一种职业‚把小姐置于劳动力市场这样一个大“场域”的视角。因此‚我们才得以从小姐的工作经历这样一个连贯的纵向的角度‚来理解这些小姐之所以“做小姐”的原因。

    我们认为:真正的和惟一的“突变”‚并不是她们从良家女子变成小姐‚而是她们原来的那次下岗。
    从那以后‚她们也并没有“渐变”‚而是“职业平移”。

    (四)发现之四:劳动力市场与“关系”的走偏

    1.现有理论

    近两年‚在有关“关系”(中介人)与职业流动之间的相互作用的理论中‚比较流行的主要有格兰诺维特和林南的“弱关系假设”、林南的“社会资源理论”(林南等‚2001 )、边燕杰对于社会网络与职业流动关系的研究‚以及据此提出的“强关系假设”(边燕杰等‚2001 )。

    林南提出:一个体系中的相同阶层的人们在权力、财富、声望等资源方面的相似性高‚他们之间往往是强关系。不同阶层的人们的资源相似性低‚他们之间往往是弱关系。当人们追求工具性目标时‚弱关系就为阶层地位低的人提供了直接上升到高地位的通道‚从而获得社会资源。所以‚通过弱关系得到信息的人‚往往会流动到一个地位较高、收入较高的职位。反之‚通过亲属、朋友(强关系)得到信息的人‚向上流动的机会就大大减少(林南等‚2001;边燕杰等‚2001 )。

    边燕杰在天津地区做的调查则显示出职业流动过程中强关系的作用。他提出:职业流动者的社会网络主要由亲属和朋友这两类强关系构成。社会网络发挥作用的形成‚以提供人情为主、以传递信息为辅(边燕杰等‚2001 )。

    2.本次访谈的结果

    我们在访谈中询问了她们做小姐这次以及在此之前的3个工作‚究竟是通过什么样的途径找到的。统计结果反映在表4中:

    从表4中我们可以在她们连续的职业流动过程中‚发现这样一个鲜明的趋势:
    “看招聘广告自己找”(以下简称为“无关系”)这个途径所占的比例一直在下降;
    “亲属介绍或者给亲属干”(以下简称为“亲关系”)这个途径也在持续下降‚而且降幅超过了前一种途径;
    “朋友、老乡、熟人介绍”(以下简称为“友关系”)这个途径却一直在上升而且增幅很大;
    “职业介绍所或者劳务市场”(以下简称为“公关系”)这个途径则一直都是最少的‚而且变化甚微‚从
    未超过10%。
    这样一种强相关的“逆转”的统计现象‚恐怕不是出于样本量较小的可能误差‚而是反映了一种现实状况。

    3.我们与前述理论的视角差异

    第一‚前述研究所说的职业流动都限定于这样两种假定:求职是为了上升(向上流动);求职中是僧多粥少(资方市场)。我们所发现的情况却恰恰相反:她们不是职业上升‚而仅仅是改换工作(平移流动);是雇主更想招她们而不是相反(劳方市场)。
    第二‚前述的研究虽然调查了“通过介绍人、直接找雇主、通过正式渠道”这三种情况;但是进一步讨论的是运用了社会关系来寻找工作的被访者。
    可是我们在访谈中最鲜明的感觉却是:居然有这么多女孩子在第一次找工作的时候就纯粹是自己独闯‚仅仅是看到一个贴在店门上的招聘广告‚就进去就业了。与此相反的情况是:尽管职业介绍所和劳务市场离许多小姐的工作居住场所不过百米之遥‚可是她们中的大多数人居然从来也不知道‚当然更不会去那里找工作。

    因此我们的视角还是把“无关系”(什么也不靠‚完全自己闯)和“公关系”(全靠公共途径而不是私人关系)这两种情况也考虑进来‚才能从“有与无”的视角上‚更加广泛和全面地揭示“(私人)关系”与职业流动之间的互动。

    4.我们的认识

    由于我们讨论的是在劳方市场和平移流动中的情况‚因此对于“关系”与职业流动之间的相互作用‚我们有一些认识‚也许可以加强或者补充前述的研究成果。

    其一‚最主要的原因是:劳动力的市场化不仅极不充分而且在“走偏”。
    这些小姐在下岗或者待业之初‚曾经努力地个人奋斗过;但是后来却不得不转而依靠各种私人的“关系”‚而不是“公关系”(正规职业中介)。这是劳动力市场化极不充分的最好证明。可是与此同时‚她们越来越多地依靠“友关系”而不是“亲关系”‚说明现在的劳动力市场化进程还不仅是一个不充分的问题‚更加可能是“走偏”的问题。
    我们认为‚在“亲关系”不可避免地弱化的同时‚“公关系”却在形式主义化‚“无关系”更是日益走投
    无路‚其结果是三者共同造成了“友关系”的兴盛。可是尤其重要的是‚这同时也使得“友关系”不得不变
    质:它在急速地利益化甚至是牟利化。也就是说‚在劳动力市场中本来是名正言顺的中介获利行为‚现
    在却被积压得转移到本来应该是“知根知底、两肋插刀”的“友关系”中去了。这不仅会打垮中国传统的
    “人情”‚而且会使得“公关系”和“无关系”都很难再生。因此‚不仅在我们以往访谈的小姐中不同程度地被诱和被骗的很多;推而广之‚现在社会生活中其他方面的“杀熟”之盛‚也无疑是这种“走偏”的结果。

    其二‚关系的利益指向更重要‚而且可能改变关系的强度。
    我们发现:小姐们的“关系”(中介人)‚无论是哪一种‚实际上所发挥的主要作用只有一个‚就是“劝服”(说服她们从事该职业);而不是“卖人情”‚更不是“当作自己的事情来办”。有些情况下‚这些“关系”甚至连相关的信息都没有提供多少‚只是一个劲地“做思想工作”。这种现象不仅仅发生在从服务员到小姐的过程中‚而是在她们以前的3个工作中一贯如此‚甚至从她们刚刚下岗或者待业就已经开始了。
    这就是说‚这些“关系”的屁股在客观上其实是坐在雇主那一边。因此在大多数情况下‚“关系”仅仅是把小姐引到某个经营场所就算完‚并不是“帮人帮到底”。至于她们究竟在该场所中能够获得什么样的具体工作(例如是迎宾小姐还是上菜的服务员;是放碟还是三陪还是出台)‚“关系”所发挥的作用甚微‚往往是小姐们在进入该场所之后与雇主博弈的结果。
    这里面没什么别的原因‚就是因为“友关系”的牟利化。在劳方市场与职业平移中‚有求于人的往往不是求职者‚而是雇主‚所以他们肯于出价。而作为双方中介人的那个“关系”‚就会进行“理性选择”。
    结果‚无论这些“关系”与求职者多么“铁”‚也只能是“胳膊肘子往外拐”。
    可是在求职的小姐们看来‚中介人的这种利益指向实际上是有利于自己的‚她们必然会以此来筛选自己的“关系”。结果‚她们就与原本是强关系的亲属渐行渐远‚与原来是弱关系的邂逅之交却信赖有加。

    其三‚各种关系的取舍‚往往不在于其优越性大‚而在于其副作用小。

    在小姐们连续的职业流动中‚“亲关系”的各种优越性(可靠、温情、可持续支持等等)很可能永远都
    是无比珍贵的;可是它的各种缺陷(欠人情、受约束、越亲越无法讲理等等)却也同时与日俱增。同样‚
    “无关系”的优越性(经济独立、抬腿就走等等)也许一直不会磨损;但是它的缺陷(容易被欺负、社会交往少、很难跟雇主讨价还价等等)也会日甚一日地显露出来。结果‚通过这两种途径流动的人就都变得越
    来越少。

    反之‚“友关系”虽然不太可能具有“亲关系”和“无关系”的那些优越性‚却可以在很大程度上避免它们的副作用。例如在匿名性这个问题上‚“亲关系”的副作用是根本无法匿名;“无关系”的副作用则是匿
    名匿到了老板不拿你当人看的地步。惟有“友关系”可以恰到好处地既弱化又保留匿名性。于是只有它
    才能在连续的平移流动中茁壮成长。

    最后要说的是‚由于研究视角的不同‚我们的认识并不是直接针对“强关系假设”与“弱关系假设”的任何一种‚而是希望补充与发展对于这一问题的解释。

    四、总结:整体图像

    仅仅发现以上4点新情况是远远不够的。整合起来看的话‚这4点之间其实是互相构建的关系与互动发展的机制。

    正是由于小姐里的本地城市下岗女工多‚她们才不得不试图摆脱匿名性的束缚‚只能平移却无法上升‚才会越来越“弃亲靠友”。

    恰恰是因为她们只能处于平移这样一种状态之中‚匿名性才有可能被弱化‚“友关系”的重要性才能超过“亲关系”和“公关系”‚同时她们也就被这种平移长久地固化在“下岗妹”这个“出身”当中。

    正是因为她们虽然弱化但是仍然保持一定的匿名性‚以及她们依赖于“友关系”而不是原来的“无关系”和更加有效的“公关系”;所以她们才长期在底层平移。

    当然‚再复杂的相互作用也并不排斥重点与中心。我们认为‚它就是职业平移。这并不是由于它的作用最强烈(在我们的定性研究中‚这是无法检验的)‚而是因为它作为一种最主要的因与果‚处于链接与支承的位置之上。示意如上图。

    如果一定要从成因的角度上剪短截说的话‚那么下岗这个突变只是这些小姐的源头‚而职业平移才是河床。

  • 70万个村庄,欠了9000亿

      “小村大债”已经成为一个不容忽视的问题。

      据农业农村部抽样调查显示,截至2019年上半年,在全国70万个行政村中,村级债务总额已达到9000亿元,村级组织平均负债达130万元。

      2022年过年期间,马学梅和一位当村支书的亲戚聚餐,注意到“村级债务”的概念。作为民盟宁夏区委会参政议政处副处长,马学梅从2017年至2022年到上百个村庄参与扶贫工作,但之前未曾特别留意过这个问题。

      回家之后,马学梅收集并阅读了大量资料,又对从前扶贫去过的二十多个乡镇村干部做调查,形成了一篇以社情民意形式撰写的文章,递送到民盟中央。出乎她的意料,这篇文章不仅被民盟采用,并最终在2023年的全国两会成为民盟中央的集体提案之一。

      几十年前的旧债

      周向前是中部某省份的一位村副书记,在村子里工作接近15年。在他的记忆中,村子一直都有负债。2020年下半年,农业农村部印发《关于开展全国村级债务摸底调查的通知》,要求各地切实摸清村级债务情况。根据周向前所在村的统计,其村级债务超过200万元。

      在该村超过200万元的债务中,有几十万元是“旧债”,也就是1990年代至2006年全面取消农业税之间村集体形成的债务,这被学界称为“传统村级债务”或“旧村级债务”。

      “原来农业税费任务重,不少农户无法上缴税费,只能是村集体为农户垫付税费,借款完成税费上缴任务。”周向前告诉《中国新闻周刊》,几十年来,有一些农户经济状况好了,就把钱还给了村集体,抵了债务,还有一些农户直到现在还没有还上,因此债务延续至今。

      旧村级债务在农村是普遍存在的。武汉大学社会学院教授、中国乡村治理研究中心研究员吕德文曾到多地农村调研村级债务,他对《中国新闻周刊》说,目前村级债务总额中,有相当一部分是税费改革前形成的旧村级债务。

      旧村级债务中,除了因收缴税费导致的债务,还有一部分是村集体为完成上级的经济考核任务而举债兴办集体企业形成的。

      华南理工大学公共管理学院教授黄岩在2019年曾到湖北省某村进行了为期20天的田野调查,据他了解,该村1990年代接到上级要求,必须兴办桑树基地等三个产业,但在投入大量资金后,三个项目仅持续1年时间就在1996年全部破产,并留下了21万余元的村级债务。

      旧村级债务的债权方构成较为复杂,吕德文说,村集体除了会向银行、农村信用社以及民间金融机构借贷,也会以较高的利息向村干部和村民借款。

      根据武汉大学社会学院教授桂华所著《村级债务的“堵”与“疏”》一文,农村税费改革前,全国村级债务规模约为3600亿元。当时,学界一度将村级债务视为基层治理中的最大难题之一。

      税费改革后,旧村级债务被“锁定”,债务利息不再增长,留着逐年化解。一些村子的债务在税费改革后的十余年内已逐渐还清,但在吕德文调研的村子里,有些村直到现在还在偿还二三十年前的旧债。

      王丽惠是南京师范大学法学院副教授、中国法治现代化研究院研究员,近几年来每年暑假都会到农村进行调研。在她调研的一个村庄,一位退休村干部曾在几十年前借款给村集体,后来他罹患癌症,缺钱医治,但手中的白条始终没有兑现,直到他去世,村集体欠他的债都没有还清。

      建设性债务是主要来源

      在周向前所在的村子,村级债务更多还是来源于2006年全面取消农业税之后形成的新村级债务。

      走进村口的仿古门廊,道路两旁绿树成荫,曾经杂草丛生的堰塘,经过整治已经成为点缀村庄的风景,新建的村民广场也是全镇最大的。而在整洁的村容和崭新的楼房背后,是多年累积的村级债务。

      多位专家对《中国新闻周刊》表达了类似的观点——因村庄建设导致的建设性债务是新村级债务的主要来源,项目制则是新村级债务产生的制度背景。

      取消农业税后,国家公共财政资源是以项目制为主要形式向农村输送的。黄岩指出,中央政府为了保障专项转移支付体现政策目标,往往要求地方提供30%~60%比例不等的配套资金,村庄在承接项目时也需要一定资金投入,其目的之一在于对基层政府或地方社会产生激励作用。但是,很多村子没有能力筹集相应的配套资金,只能采取借债、欠款等方式,因而形成村级债务。

      以周向前所在的村子为例,该村从2006年到2018年陆续实施了通村公路硬化项目,目前硬化公路总公里数接近19公里,总投资额达到600万元左右。周向前说,前些年,按照3.5米宽的乡村公路建设标准,上级补助资金为每公里10万元,2018年补助资金标准上调至每公里20万元,总体计算下来,该村的通村公路硬化项目约有一半资金是村里配套的,因此形成了一定的村级债务。

      还有一些村庄建设的项目是在项目验收之后,通过“以奖代补”的形式获得资金,前期需要村里垫资。浙江省丽水市缙云县的黄碧街村在2019年开展了小城镇环境综合整治,丽水市农业农村局工作人员吴玉平对《中国新闻周刊》说,该村的小城镇环境综合整治项目先后投入基础设施建设资金3024.24万元,其中“以奖代补”的财政资金支持204万元,占比仅6.7%,其余的资金由村级向村民筹建,导致大量债务产生。

      在建设性债务之外,新村级债务中还有一种因集体经营项目产生的经营性债务。

      不过,多位专家指出,经营性债务在村庄并不多见。在王丽惠调研过的村子里,还没有产生经营性负债的。吕德文也几乎没有调研过存在经营性负债的村子,在他看来,许多村庄在2000年左右已经因为举债发展集体经济得到教训,因此不会轻易因发展集体经营项目而欠债,“极少数村庄有经营性债务,要么是村庄有得天独厚的条件,例如适合开发旅游,要么是村干部比较自信”。

      据《中国新闻周刊》了解,村级债务中经营性债务占比高的村子大多位于长三角、珠三角地区。浙江省丽水市的村庄就有这样的例子。吴玉平对《中国新闻周刊》说,截至2022年6月底,丽水市有986个村子有村级债务,负债金额共计5.93亿元,其中集体经营性负债约为3.73亿元,占比接近63%。

      值得注意的是,丽水市诸多村庄的经营性负债体现为投资,具有一定的清偿能力。2017年,丽水市青田县出资在平湖经济技术开发区建工业厂房,产业园项目首期投资1.47亿元。据青田发布报道,该产业园项目建成后每年可为青田县的村集体经济增加收益1470万元。吴玉平提供的数据显示,丽水市村级债务中,3.73亿元的集体经营性负债推动形成资产6.09亿元,年度收益4722.45万元,平均收益率达12.64%。

      但是,不是所有经营性债务都能取得收益。当村庄自身条件一般或是村集体经营能力有限,经营性债务可能会成为难以填满的窟窿。黄岩在广东调研时发现,一些城市周边的村庄为了发展经济,向银行借贷在村里建了工业园,期望工业园建成后租给企业,形成稳定收益,但是一部分工业园的设计不科学、招商不顺利,项目经营失败,因此形成村级负债。

      新村级债务中,建设性债务由于主要是各类拖欠的工程尾款,是无息债务,债权人主要是工程队老板,具有私人性。王丽惠发现,许多乡村工程在招标时就要求老板带资建设。老板同意行政村的欠债也有经济理性考量,例如工程项目有一定利润空间,即便被村子欠了几万元债务仍可盈利,并且这些债务相当于纯利,每年还一些就可以。

      经营性债务则主要是向当地农商行、信用社的贷款,还有一些是向“先富起来的村级精英”的借款,往往是有息债务。

      经营性债务可能会比建设性债务更棘手。吕德文指出,建设性债务形成后其实就锁定了,不会增长,但经营性债务可能会造成一系列连锁反应,当地为了盘活经营性项目有可能持续投入,使得债务越滚越大。

      “资源下乡的一种异化结果”

      在黄岩看来,如果说旧村级负债是一种资源挤压型负债,新村级负债则是一种资源输入型负债,形成于21世纪以来国家大规模自上而下向农村输入资源的过程中,是资源下乡的一种异化结果,“产生巨额新村级债务的原因当然不在于资源本身,而是在于资源落地的操作方式”。

      项目制对于配套资金的硬性要求往往是导致新村级债务产生的直接原因,但新村级债务形成的根源并不能完全归结于此。

      吕德文在调研中发现,一些历史上是“好村”的村庄,后来反而成了“差村”,是因为他们承担了地方的示范任务,包括美丽乡村建设、旅游开发、人居环境整治等,他们必须要推进政策硬性要求的建设项目。这其中,有很多工程是不那么必要的,“我调研的村子里,债务比较庞大的,都是因为搞形式主义工程欠了债”。

      黄岩曾经调研的湖北省某村是一座传统的农业村庄,共有村民1476人,约一半村民常年外出务工,空心化严重,该村所属镇在县域GDP排名倒数第二。在这样一座村庄,截至2019年底的负债高达270万元,最主要的原因是村办公大楼建设及其周边环境整治。黄岩说,该村的整治工程从一进村庄就可看到的“村办公大楼”开始,因为它不仅承载着公共办公职能,而且在一定程度上是看得见的“亮点”,是“需要的成绩”。

      黄岩指出,政绩工程下的利益合谋,是新村级债务形成的内在动机。“资源在下乡工程中,不单单要发挥供给农村公共品的作用,它同样承载着各个行为主体多种意图。工程就是一块‘肥肉’,是各种利益主体参与到这些项目的建设中,上级政府要政绩,村集体要面子,村干部要利益。”

      在新村级债务形成的过程中,部分村干部的“活跃”确实不容忽视。王丽惠说,堰塘、道路等基础设施建设关乎村民对村干部的评价,关乎村干部是否能够连任,也是村干部在任期间有所作为的体现,因而,即使借债某些村干部也必须推进。另外,王丽惠发现,在项目工程建设上,某些村干部多抱着“要么不建,要建就要建好”的想法去建设,所以支出常超出预算。

      需要指出的是,造成新村级债务的基础设施建设中也有相当一部分并非不合理的“脸面工程”,而是必要的村庄建设。

      周向前说,这些年来,他所在的村子对于争取各项项目很积极,因为包括开挖清洗堰塘、维修整治渠道等在内的工程是农户真正需要的,“改善了农户的生活环境,也提升了他们的生活幸福感”,所以虽然这些建设带来了负债,但周向前认为,利益大于负担。

      “新村级债务形成的另一个根源,就是村级‘造血’能力薄弱,而农村的基础设施欠账太多。”黄岩说,1990年代,村里可能有一条土路就够了,但现在农村需要更好的基础设施,村集体只能硬着头皮建设。

      新村级债务对村庄社会带来的影响是多方面的。

      周向前直言,这几年因为村子有债务,在开展各项工作时总是放不开,顾虑很多。吕德文也认为,债务对村级组织影响很大,相当于村干部的主要任务不再是搞建设和服务群众,整天为怎么化解债务焦头烂额,“债务不化解掉,等于整个村就僵死在这里了,几乎不可能把村庄发展好”。

      经过在湖北某村的调研,黄岩发现,新村级债务困局还会造成基层权力僵化和固化,多数村民和村干部不愿意接替巨额村级债务的“烂摊子”。

      还有一种更为极端的情况——尽管工程队老板作为债权人,通常希望与村级保持良好的关系,但近年来工程队老板将村委会告上法庭的案件变得越来越多。

      以山西省高平市为例,该市常住人口45万余人,辖15个乡镇或街道、304个村民委员会或居民委员会。最近几年,高平市涉乡镇(街道)政府(办事处)和农村(社区)组织债权债务案件数量飙升,2016年1件,2017年52件,2018年114件。高平市人民法院副院长吴玲玉在一篇调研报告中指出,高平市基本上所有乡镇(办事处)都涉及债权债务案件,债务金额达数千万元,而且作为被告的乡镇(办事处)、村委(居委)基本上全部败诉。

      当村集体资产有限,村委会不配合执行,不仅影响村委会及其组成人员,也会拖累整个村庄的发展。

      2019年,河南某村委会的法定代表人因为拒绝履行法院支付工程款的判决而被强制拘留。还有一些村委会成为了“老赖”,被法院纳入“失信被执行人”名单。根据《关于加快推进失信被执行人信用监督、警示和惩戒机制建设的意见》,成为失信被执行人的村委会将在参与政府投资项目、获取补贴和政策支持、获评文明村镇奖项等方面受到限制。

      马学梅说,当村干部成为“老赖”,整个村子的运行会更困难,除了在参与项目、获取补贴时受限制,村干部所有的培训活动、外出学习也会受影响,因为坐不了高铁、飞机,“往往就得换人,但这一波人下去之后,债务依旧没解决,(施工队)再告,(新的村委会)再变成‘老赖’”。马学梅指出,一定程度上,村级债务会对基层治理体系和治理能力现代化带来很大的负面影响。

      化解之难

      如今,对于存在村级欠债的村庄,化解债务已经成为头等大事。

      但在村集体经济收入较低的村庄,化解债务并不容易。根据农业农村部的数据,截至2019年底,浙江省已全面消除集体经济年收入低于10万元、经营性收入低于5万元的薄弱村。但是王丽惠指出,排除江浙沪、珠三角的省份,全国很多村子的集体经济年收入仍不超过10万元,甚至在她调研的村子中,绝大多数的村集体年收入在5万元左右。

      周向前说,其所在村子的村集体年收入就不超过10万元,对于偿还村级债务作用轻微。前几年,该村有一大部分债务得到化解,主要靠地方政府征收该村集体土地得到的收入。

      很多村子都像周向前所在的村子一样,通过寻找外部资金化解村级债务。王丽惠举例说,比如通过土地增减挂钩,“在土地上找钱”,她还调研过一些村子,会通过接受水库移民、获取移民扶持资金的方式化解村级债务。

      周向前提到了一个词语,“化缘”,当村集体经济很难增收,村干部只能到对口帮扶单位去多沟通,或者去找一些有能力的人,先“化缘”一些资金渡过难关。

      为了化解债务,周向前所在的村子还在继续“跑项目”。吕德文说,这是很多村子的选择,因为这些村庄没有能力赚钱化解债务,只能通过不断跑新项目,用新项目的资金去还旧项目的债。而申请越多,就意味着村子要配套的资金越多,于是陷入一个怪圈:往往是国家投入得越多,专项资金下达得越多,村级债务就会越多。

      “其实就是拆东墙补西墙”,王丽惠发现,当村庄以“跑项目”作为填补债务的主渠道,往往会造成“滚雪球”困局,这中间会充满了关系运作,产生资源损耗和权力寻租。

      王丽惠还指出,“跑项目”的债务化解方式也会导致村与村的建设能力失衡。“项目资源越多的村,村干部声望越高,越容易得到上级政府的认可,能争取到更多项目,且项目越多的村,村庄建设越好,上级政府也越认为村干部能做事,项目批给这样的村,也更放心,因而债务可以持续化解,但也在持续积累;而资源少、建设少的村越来越缺项目资金,村庄建设越发停滞,债务也无法化解。”

      “小村大债”的化解难题已经引起了各方关注。民盟中央在今年两会期间提交的提案中提出了一种倒逼机制,建议建立和落实“第一责任人”制度,明确各镇(街)镇长(主任)和各村民委员会主任是化解村级债务的第一责任人,把村级债权的回收率、债务偿还率、资产增长率和是否出现新增债务作为镇村干部工作考核的重要内容,同时把考核结果与干部的报酬、评优、提拔等挂钩。

      目前,已经有一些地方在推进村级债务化解时引入类似机制。2023年1月,中共丽水市委组织部和丽水市农业农村局印发了《村级债务化解工作指引(试行)》,其中指出对负债100万元以上的村,由县处级领导包村化解债务,逐村制定方案。

      除了探索化解已有村级债务,如何从源头防范新增村级债务,也是亟待探索的。周向前说,其所在村庄上级政府从2021年强调不允许举债搞建设,所有项目在动工之前要由乡镇一级把关资金筹措情况,“卡得很严”,如果想新增债务,几乎不会通过审批。

      上述丽水市的《村级债务化解工作指引(试行)》也强调要从源头上遏制债务,包括要建立新增债务负面清单和加强新增债务审批管理。

      除此之外,多位专家提到,村一级项目施工的方式还可以优化,以避免村级债务的产生。

      吕德文在北京平谷区罗营镇调研时发现,该地正在探索村民自施项目,部分工程从项目前期工作、项目建设、竣工验收到建成维护,全程由村民共同参与,相较于找施工队,工程成本显著降低。王丽惠在中部某省调研时则发现,一些地方的项目制度也在变化,以前项目资金是直接拨到村里,现在则是 60万元以下项目镇里招标,60万元以上项目县里招投标,把项目资金直接打给施工方,“甲方变了,不再是村两委,而是县级政府,村级欠债的空间也就越来越小了”。

      当然,更重要的是减少不必要的项目。吕德文指出,“形式主义的工程就不要再搞了,经营性的项目,村级组织也尽量少介入。要是能做到,可以大大减轻村子的负担,减少债务”。

  • 易继明,蔡元臻:版权蟑螂现象的法律治理—网络版权市场中的利益平衡机制

    引言

    “版权蟑螂”(Copyright Troll)一词源自近20年来倍受关注的“专利蟑螂”(Patent Troll)现象。与专利蟑螂相似,版权蟑螂或称“版权流氓”,是一种通俗意义上的贬称,它是特指那些专门通过向他人发起版权侵权诉讼或者以发起版权侵权诉讼相要挟,以获得利益的维权主体。从权利角度来看,维权主体发起侵权诉讼,本身并不违反版权法和诉讼规则,也直接或者间接地维护了权利人的权利,并为版权人带来切实的利益。但是,版权蟑螂运用资本优势介入创新市场的诉讼投机行为,可能会骚扰到创新主体或者普通的网络用户,甚至会适得其反地埋没原作品本身的社会价值。也就是说,版权蟑螂是一把双刃剑,在活化版权市场的同时,也会打破原有的利益格局及竞争秩序,反而会阻碍创新或者损及大众利益。例如,“三面向现象”中原版权人与网络服务提供者的困境,昭示的是“传统的复制售卖而获利的整个知识保护体系和文化再生产模式的危机。”

    在我国,版权蟑螂兴起于本世纪初,以华盖、三面向、磊若公司等商业维权主体为代表。但总体上,我国版权蟑螂行为尚处初级阶段:他们涉猎的作品主要包括摄影作品、美术作品和文字作品等,影视作品、音乐作品等数字版权作品较少;诉讼对象更多地指向企业、行政机关、公益性社团等———此类主体的应诉能力强,以司法判决结案的比例较高,较少涉及普通网络用户;传统版权作品的网络盗用行为居多,数字环境中下载版权作品而发起的诉讼尚未形成规模;多数版权蟑螂不是作品的原权利人,导致主体适格性问题成为其败诉的主要原因之一。此外,在诉讼策略上,我国版权蟑螂没有采取急功近利的做法,在发起诉讼前仍会向对方发出停止侵权函件,并尝试通过谈判的途径确定赔偿金额。就现状分析,版权蟑螂在我国演变为“巨兽”,尚需时日。但随着市场全球化格局的形成,对于影视产业而言,中国不但是具有无限潜力的庞大市场,也是欧美影视公司实行打击侵权的首要目标。美国贸易代表办公室在2015年3月发布的《2014年恶名市场非常规审议》报告中,对我国整治“快播”播放软件和关闭“人人影视”站点的成绩给予了积极评价,但同时也指出我国盗版现象依然严重。除了网络播放平台和盗版资源下载网站以外,近年来在我国迅速普及的电视机顶盒(Set Top Box,也称Media Box)也为国外密切关注。美国在《2015年中国履行WTO承诺情况报告》中甚至认为,机顶盒普遍具备的下载功能和便捷的特点,进一步恶化了中国的网络盗版问题。种种迹象表明,版权蟑螂正在跃跃欲试,或已悄然地布局中国市场。

    在美国,版权蟑螂的大量涌现存在两大因素:一是侵权损害赔偿额度高,权利保护力度大;二是网络空间权利边界不明确,侵权现象较为泛滥。尽管我国知识产权保护力度有待加强,但我国网络空间盗版现象更为严重;与遏制专利蟑螂相似,我们应该未雨绸缪,深入探讨版权蟑螂现象、蟑螂行为,并对此加以有效规制。而与专利蟑螂不同的是,版权蟑螂大多活跃在网络空间,由此引发了诸多新问题,例如,网络用户下载盗版作品的行为是否构成侵权?如何在规制版权蟑螂的同时,遏制网络领域的大规模侵权行为?而且,如同本文后面谈及的,版权蟑螂行为在盗版环境下发生了转换,让其身份具有了更强的隐蔽性,也给相应的法律规制带来了困难。本文试图通过分析版权蟑螂现象、行为及其危害,探讨治理版权蟑螂现象中涉及的合理使用、法定赔偿及“三振出局”机制,以寻求网络版权市场的利益平衡机制。

    版权蟑螂现象及其危害

    从维权主体考察版权蟑螂的行为,更多地涉及到诉权滥用的问题。但从权利滥用的角度来看,美国法较早地将专利滥用作为一种抗辩规则延及到了版权领域。1990年Lasercomb America,Inc.v.Reyn-olds一案中,原告在许可被告使用其软件时,要求被告在100年之内不得以此为基础进行后续开发与设计竞争性产品。该案中,法院并未认定被告破解原告技术措施并制作侵权软件复制件的行为构成侵权,而是支持了被告提出的版权滥用抗辩的主张,认为原告即版权人“试图通过其行使版权的行为在权利保护范围之外限制竞争”,其权利行使的方式涉及公共政策之衡量,自然认为禁止版权滥用原则“天然地存在于版权法之中”。诚然,这是美国法院利用衡平法技艺的法律适用,并非一种反垄断法上的规制。不过,这里的原告与被告之间,都是以创造或者利用版权为主,均属于版权实施主体,并非版权蟑螂兴起时的典型样态。

    而典型意义上的“版权蟑螂”,我们似乎可以找到更早时期的雏形。根据欧美学者考据,历史上第一例“版权蟑螂”现象出现在1870年。彼时,英国人托马斯·沃尔(Thomas Wall)在取得大量戏剧作品和音乐作品的表演权许可之后,没有遵循版权许可主体的传统经营规律而与他人签订许可合同,而是选择直接向已经涉嫌侵犯表演者权的主体提起诉讼,以2英镑的最高法定赔偿额度要挟,迫使后者无奈和解。此后的100多年中,虽然企业通过发起版权诉讼而“大捞一笔”的事件时有发生,但其主要利润来源并非侵权赔偿,往往本身也是版权实施的主体,或者尚未形成一种规模而危及创新市场,其“蟑螂”或者“寄生”的属性仍不十分显著。

    事实上,美国法学文献中出现“版权蟑螂”一词,是2007年一篇涉及版权改革的论文,迄今尚不足10年。而典型的“版权蟑螂”性质的大型“版权持有主体”,直到2010年发起了一系列的大规模诉讼之后,才真正引起人们的重视。2010年起,美国出现了众多以获益为唯一目的的趋利性诉讼,并逐渐向网络盗版领域转移,继而引发了大量的以普通网络用户为被告的“共同虚名被告案件”(Multi-Defendant John Doe诉讼,简称MDJD诉讼)。显然,这种针对普通网络用户的滥诉行为,影响到了公众的利益。

    诚然,版权蟑螂作为版权保护链条上的积极执行者,能够对原权利人起到辅助性的保护作用。版权蟑螂强大的执行力使得原版权人可以放心地将其版权保护和执行工作“外包”给前者,起到节省资源的作用。从经济学角度来看,版权蟑螂创建了一种版权保护的规模经济(Economy of Scale),提高了版权保护的效率。不过,版权蟑螂客观上存在的这些优点,并不能完全抵销它所带来的多种负面效应及社会危害。

    第一,版权蟑螂引发了大量滥诉行为。版权蟑螂通过“帮诉”(Champerty)获得侵权赔偿、并将其作为唯一利润来源的经营策略,导致了大量不必要的诉讼。出于避免“诉讼拥堵”(Trafficking in Lawsuits)的考虑,普通法长久以来将“无利害关系的帮诉”视为违反公众利益的行为。即便如此,在2013年美国联邦地区法院审理的所有版权侵权案件中,由版权蟑螂发起的MDJD诉讼仍然占到了其中的43%,该比例在2014年第一季度攀升到了46%,而这个数字在2001年到2013年期间尚不足20%。显然,此类诉讼行为不仅导致诉讼资源的浪费,而且会在合并诉讼的泛滥下失去控制。

    第二,蟑螂诉讼无法缔造市场。如果仅就维权行为本身而言,版权集体管理组织和行业协会似乎已经具有了版权蟑螂的雏形,因为二者也会针对侵犯版权的个人和企业发起大规模诉讼。但此类诉讼的意义绝不仅限于为版权人博取利益,其更多的是为了促使侵权人意识到其行为的危害性及代价,从而转向主动获取正当的版权许可。这种许可关系一旦建立,权利人就拥有了遵循版权法益的、长期稳定的利润来源,市场占有率也会随之增加。换言之,这种善意的版权诉讼发起者,同时也是市场的缔造者(market-maker)。市场缔造者发起诉讼的意义在于消减未来的潜在诉讼,这和版权蟑螂导致滥诉的效果截然相反。同理,任何积极拓展正当利润渠道的大型版权权利主体(如跨国音像制品公司),都是版权市场的缔造者,而不是通常意义上所称的版权蟑螂。

    第三,版权蟑螂埋没了作品的实际价值。版权蟑螂固然能够加强版权的保护力度,但是其效率是否能够满足社会的需要却存在疑问。为了尽可能迅速地实现收益,版权蟑螂在其维权的过程中,通常会选择跳过诉讼以外的其他环节,例如诉前警告(包括take down notice和warning letter)和签订版权许可合同。这种做法的一个明显缺陷,就是抹杀了作品在社会发展和文化传播中拥有的实际商业价值和社会价值,而只是通过诉讼形式烘托出了某种不切合实际的“诉讼价值”。尤其是,在绝大多数诉讼止步于庭外和解的情况下,由于和解金额较之损害赔偿额度更低,此时作品的真正价值已经遭到了无视。

    第四,蟑螂理念违反利益平衡、阻碍社会创新。美国总统行政办公室在2013年发布的《专利主张与美国创新》报告中,认为专利蟑螂现象的滋生和蔓延降低了社会的创新能力,进而导致社会整体福利的缩减。版权蟑螂同样能够导致上述后果。随着版权蟑螂诉讼策略的转变,越来越多的被诉侵权行为开始来自于不带有商业目的、不存在直接市场替代效果、甚至因为不了解版权规定而不慎侵权的普通个人。虽然曾有观点认为“善意侵权不能作为不负民事责任的抗辩理由”,但在现今更多学者看来,基于利益平衡的考量,权利的保护范围在实际操作中不应覆盖法律所允许的每个角落,在版权人维护权利和公众使用作品之间需要始终维持一种权利上的“实施平衡”(Enforcement Equilibrium)。为了实现这一平衡,应当在版权人与公众之间的利益边界周围设定一个灰色区域作为双方权利的缓冲;而进入该区域后的保护,实际上并不能为权利人带来多少额外的激励。“在权利人可接受的范围内允许他人对其作品的适当使用(即便这种使用是侵权),从而使权利人将精力投注在对经济影响最大的侵权行为的阻却上。”在网络版权的语境中,普通网络用户的个人侵权行为(尤其是下载行为),就属于这种灰色区域。版权蟑螂的“利润化”诉讼策略过度挤压了灰色权利区域的空间,从长远来看,会对社会创新产生寒蝉效应,可能会阻碍版权法目标的实现。

    版权蟑螂的行为特征及其转换

    版权蟑螂的商业模式是,在针对性地、有限地获取一定版权之后,围绕获取的版权权利,系统性地主张版权保护以获取收益。从行为特征分析,版权蟑螂的经营模式可以简单归结为四个方面:首先,通过购买或者原始获得的方式获取版权,并且将其针对性地指向已经、正在、以及将要发生的版权侵权行为;其次,专注于作品的诉讼价值,即通过诉讼能够从侵权方“榨取”的利益,而非作品真正的商业价值;再次,其运行模式中缺乏善意的(或积极的)许可机制;最后,倾向于利用高额法定损害赔偿和诉讼花费向侵权方施压,争取在最短的时间内迫使侵权方接受和解。

    (一)版权蟑螂与专利蟑螂的对比分析

    直观地看,版权蟑螂与专利蟑螂较为相似,其商业模式或称“经营手法”也基本相同。两者都是通过自身创造或者从原权利人手中购买作品的版权或者专利权(包括独占许可使用权),有的放矢地针对侵权人发起诉讼,或者以诉讼相要挟,以赚取巨额利润。不过,仔细分析,两者也存在一定的差异。但这种差异,主要是两者权利形成的基础及其转换成本决定的。对版权作品与专利发明这两种客体,法律保护的前提就不一样:前者“出汗”即可,自动产生;后者需要较高的创造性,且有待行政部门确权。缘此,专利制度中的有效性问题(宣告无效程序)成为一个潜在的节点。

    传统的激励理论很难解释为什么专利权人获得保护的前提是公开与其发明相关的研究成果,而版权领域却没有类似的要求;也无法解释为什么版权人拒绝授权许可,将作品束之高阁的行为可以被接受,而专利权人不实施专利的行为却被认为是有损于社会利益。马克·莱姆利(Mark Lemley)认为,这是因为二者在“转换成本”上的截然不同。就版权而言,即便作者拒绝授权许可其作品,公众仍然可以在接触到作品的内容之后,以全新的表达方式将该作品予以“二次呈现”:版权制度只控制和保护原作品的表达,而不延及其背后的思想。思想与表达的二分法,降低了版权作品的转换成本,使得版权人即使疏于开发作品,也不会导致严重损害公众利益和阻碍文化传播。相较之下,由于专利发明中包含了机械、医药、数字等专业性技术,导致其实际的呈现方式受到制约与限制,即便该项发明能够借助其它途径实现,也往往需要大量的研发力量、制造能力及财力的支撑。因此,如果专利权人不实施其专利,很可能直接导致某项技术发展的停滞,从而对科技的进步产生消极的影响。二者在转换成本上的差距,实际上减小了版权蟑螂对社会发展的危害,这也是版权蟑螂在专利蟑螂起势20年之后才形成规模的主要缘由之一。

    但另一方面,对于普通大众而言,版权蟑螂所产生的直接危害可能较之专利蟑螂要大一些。虽然从历史上看,遭到版权蟑螂起诉的主体包括普通企业、网络服务提供者以及非商业性组织等,但是随着诉讼经验的积累,版权蟑螂起诉的对象也发生了变化。版权作品低廉的转换成本不足以牵制住足够多的企业,版权蟑螂若仅以普通企业为目标,其生存无以为继。而版权蟑螂对第三方平台的策略性忽视,则是得益于唱片业版权人获得的经验教训。早期美国唱片业版权人在面临盗版问题时,认为追究下载用户的责任不切实际,便转而起诉网络分享技术提供商。这一思路虽然获得了一定效果,但是最终还是随着P2P技术的革新而遇阻。如今的版权蟑螂(乃至一些急欲维权的行业协会,如美国作曲家、作家与出版商协会,即American Society of Composers,Authorsand Publishers,简称ASCAP)更倾向于将目标锁定为未经许可下载作品的网络用户。具体做法上,版权蟑螂会采取“佯装诉讼”的策略,先起诉网络服务提供者,再以取证的名义迫使其提供有过下载行为的IP地址的相关用户姓名和详细住址,借此将数以千计的“无名氏”(John Does)钓出水面,最后一并起诉。可见,对公众而言,版权蟑螂的诉讼模式给其带来了更为直接的压力和危害,并不像专利蟑螂那样重点在于骚扰创新者而间接地损及公众利益。

    而在维权主体发起的诉讼中,版权蟑螂与专利蟑螂也存在一些不同之处。

    第一,在诉讼主体方面,版权蟑螂作为原始权利人的诉讼比例正呈现出上升趋势。以美国为例,2012年前最具代表性的版权蟑螂是一家名为Righthaven的版权代理机构,其商业运作模式与专利蟑螂非常类似,即本身不使用作品,也不是作品的原权利人,仅仅是为了诉讼目的而获取了Stephens Media等大量新闻媒体公司的文字和摄影作品的授权。但此后,由于这些授权导致原告适格性上存在漏洞,Righthaven在经历了多次败诉后宣告破产。2012年之后出现的版权蟑螂不再轻易授权代理机构或者专门从事蟑螂诉讼的律师事务所,转以原权利人的资格亲自维权。“从联邦法院最近几年受理的案件来看,早前强调‘为了诉讼而专门购买版权’的定义已经过时了。”显然,这与当下专利蟑螂仍然以非经营实体为主的情形有些不同,它具有了更强的隐蔽性。

    第二,所利用的权利武器或称“博弈工具”不同。版权蟑螂和专利蟑螂虽然都是“实施系统性诉讼的投机分子”,但二者诉讼投机行为所利用的法律武器有点差异。专利蟑螂更善于利用专利系统中的漏洞,例如权利要求界限不明确的专利和专利审查的不严密性。相反,版权作品的边界更加明确,一般不会遭到作品有效性的抗辩。版权蟑螂倚仗的是高昂的法定赔偿,而其遭到的抗辩通常是对作品的合理使用。

    第三,二者的诉讼策略有些差异。版权蟑螂更擅长采用针对侵权人心理弱点的诉讼策略。具体地说,版权蟑螂会针对性地挑选某些让侵权人羞于承认接触事实的作品(尤其是非法下载淫秽作品的行为)作为侵权客体。相较之下,虽然某些专利产品(如成人用品)也会有“伤风败俗”之嫌,但无论是从市场还是专利数量的角度来看,都不能为专利蟑螂带来同等程度的收益。

    (二)盗版环境下版权蟑螂的转型

    任何涉嫌侵犯版权权利人权益的行为都可能招致版权蟑螂发起的诉讼。但是,版权蟑螂的运营模式本身决定了其需要格外重视诉讼成本;基于这一考量,在同一诉讼中对多个侵权人发起诉讼应当最能够迎合其低成本、高回报的目的。随着社会的发展,人们文化生活需求与版权作品供给之间已经构建起了一种永久性相互增长(Ever-increasing)的关系,任何普通消费者做出的侵权行为,都可能因为庞大的人口基数而构成大规模侵权。可以说,在公众行为、侵权和版权蟑螂之间,实质上存在着一种相伴相生的微妙关系。

    版权领域中,盗版是最常见的大规模侵权行为。由于制作、销售、购买盗版商品的成本远低于正版,盗版现象在很大程度上迎合了销售者和消费者趋利的天性而产生。伴随印刷术出现的盗版行为,在缺少道德约束且极为便利的网络空间里,迅速发展成了一个全球性的产业,这也注定了盗版领域将成为版权蟑螂攻击的主要目标。

    当下版权蟑螂的主要诉讼对象是通过互联网下载盗版电影作品的网络用户。诚然,如前文所述,版权蟑螂在其诞生之初的情形并非如此。2012年以前,版权维权诉讼的被告多为未经许可在网上使用或者上传他人作品的企业和个人、以及为盗版作品提供传播平台的技术服务提供者。但经验表明,上述侵权群体为版权蟑螂带来的收益一概不及数以百万计的网络下载用户。2012年,以起诉色情影视作品的网络下载用户为生的“淫秽作品版权蟑螂”(Porn Troll)出现在人们的视野里。2013年1月到2014年6月期间,淫秽作品版权蟑螂发起的版权MDJD诉讼占据了美国所有版权诉讼的35.97%,而该比例在2010年尚不足3%。

    总括而言,与早期相比,2012年之后的版权蟑螂诉讼有四个方面的转变:第一,在授权许可上稳重处理,原始权利人诉讼增多而继受权利人诉讼减少;第二,作品领域从文字作品、摄影作品、美术作品等转向了受众更广的电影作品;第三,诉讼主体对象上,“个人”取代了“企业和技术服务提供者”;第四,诉讼主要针对的行为转变为未经许可的下载行为。这四种转变,也形成了当下版权蟑螂鲜明的诉讼风格。有的国外学者将这些专门起诉网络盗版影视作品下载行为的版权蟑螂,称之为“网络盗版版权蟑螂”(Internet Piracy Trolls,例如美国著名色情影视公司Malibu Media)。

    从版权蟑螂的角度来看,上述转变可以为其带来一些好处。

    首先,版权蟑螂从作品继受权利人到原始权利人的角色转变,意味着这些维权主体具有了更加广泛的业务领域,获得侵权赔偿不再是其唯一的利润来源。同时,还填补了原告适格性上的漏洞,避免了在该问题上遭到反诉,也使原本诸如“空壳公司”或者“寄生虫”等反面形象有所改观。某种程度上,转型后的版权蟑螂更接近于一种介于版权协会组织与早期版权蟑螂之间的维权主体。这种身份的转换,容易遮蔽法官们的视线,也为法律上的有效规制增加了一些困难。

    其次,盗版影视作品下载者的数量远远多于其他侵权群体的人数。随着观赏影视作品成为人们日常生活中不可缺少的一部分,未经许可传播影视作品的网站(即盗版影视作品网站)和使用此类网站的用户与日俱增,为版权蟑螂的滋长提供了一片更加“肥沃”的土地。相较于大型企业和组织,个人的经济实力和心理承受能力都处在绝对的劣势,其应诉能力的欠缺也会让版权蟑螂在诉讼中处在更加有利的地位。

    再次,非法下载盗版作品构成侵权行为的可能性大,受合理使用庇护的几率则小;比起早期一些蟑螂诉讼,权利人遭到反诉乃至败诉的风险几乎已是最小化。这一点,在后文中会详细阐述。

    最后,盗版影视作品的网络下载行为增强了版权侵权行为的主观故意性质,在一定程度上导致侵权赔偿额度的提高。在传统版权作品的盗用行为中,版权人常常因为未能在作品上给出警示,导致在证明侵权人存在主观故意时存在困难。如果最终无法证明存在主观故意,侵权人的行为便有可能落入合理使用的范围中。然而,这一困难在下载盗版影视作品的语境中得到了消解———影视作品片头的警示画面和P2P下载网站难以洗净的盗版气息,使得法院完全有理由判定侵权人是在明知的主观状态下做出了下载行为。美国法院对“故意”一词在司法实践中做了相当宽泛的解释,而美国《著作权法》第504条规定,故意侵权案件中法定赔偿额度以15万美元为上限,远远高于非故意侵权时的3万美元。显然,高昂的法定赔偿额将会给侵权人带来更加难以承受的应诉压力,进一步提高诉前和解的可能性。

    侵权 vs. 合理使用

    版权蟑螂的行为特征之转换,使得权利人、个体消费者和公共利益之间的关系复杂化。比如早期个体消费者从街头购买盗版光盘回家自己欣赏,一般认为系终端消费者被免责,不仅不会被认定为侵权,反而有可能被视为侵权产品的“受害者”。但是,当版权蟑螂瞄准网络环境下的灰色地带,对下载盗版作品的网络终端用户发起诉讼攻击的时候,网络用户的下载行为是侵权还是合理使用,就成为了法律争议的焦点。

    (一)侵权风险:传统版权与数字版权的对比分析

    个体消费者与作品之间的互动过程,可以分为接触、享用和使用三个阶段。在现实生活中,消费者购买商品的行为就是一种典型的接触性互动,是第一阶段的互动;购得作品后,消费者出于个人研究、学习、欣赏的目的,对作品进行直观感知的行为,例如聆听音乐、观赏电影等,都属于常见的第二阶段的享用性互动;最后进入第三阶段,个人对于作品的使用——通常指的是严格版权意义上的使用,这类行为往往会直接影响作品的传播和流通,也可能产生新的作品。美国学者德博拉·塔西(Deborah Tussey)以使用行为的目的和作品的传播程度为界线,将作品的使用分为“消费性(Consumption)使用”和“改编性(Adaptation)使用”。前者,通常包括复制以及后续传播作品的行为;后者,则主要表现为改编、注释、翻译等演绎作品的行为,这与美国版权法中的“转换性使用”(Transformative Use)基本相同。

    显然,个人对版权作品的使用与版权人的利益休戚相关。消费者未经许可消费性使用他人作品的行为一旦形成规模,会对权利人的商业利益产生直接的危害;而通过改编性使用诞生的演绎作品,由于会对原作品已经占有的市场产生替代效果,原权利人对此也应当享有相应的获酬权。网络时代,无论是“消费性使用”还是“改编性使用”,由于其规模化程度加深,加之各种使用的即时性,如果我们仍然将网络用户定义为传统意义上的个体消费者,适用个体消费者免责,显然使得版权人利益受损。从这个角度来说,将个体消费者与作品之间的互动环节区分为三个阶段,对侵权判定意义重大。

    如前所述,对于实体盗版商品而言,消费者向盗版商品卖家购买依附于有形载体的盗版商品(例如盗版图书和音像制品)的行为,现行《著作权法》一般不被视为侵犯版权。这是因为在实体盗版商品的语境中,接触、享用和使用三个互动环节可以被简明地区分开来。传统版权法中,对个体消费者的规制主要集中在其对作品的使用行为,不会延及接触或享用。因此,实践中,寄生在实体盗版商品上的版权蟑螂会将诉讼对象指向传播盗版作品的非纯粹意义上的个体消费者,这些个体消费者可能因为其传播行为涉嫌侵犯复制权、发行权和署名权而遭到起诉。

    不过,类似的侵权判定如果是以数字下载为对象,很可能得到截然不同的结论。表面看来,下载一部影片和从摊贩手中购买一张盗版电影光碟的行为,并无本质上的差异。但在数字环境中,下载是一种通过复制来获得作品的一种手段:不仅涉及对作品的获取,更意味着接触作品和使用作品两个环节的同时发生。网络用户的下载行为,其实已将第三阶段的使用,与前两个阶段的接触和享用叠加在一起。如此一来,现行版权法一方面认为下载行为包含了复制而构成了对他人作品的使用,可以被视为侵犯了权利人的复制权,但另一方面,又认为对来源不合法的作品进行私人复制却不是违法,“这样的结果显然很荒诞”。的确,用户在网络上狂欢,但我们同时意识到,任意获取“免费午餐”的行为本身已经触及社会普遍的道德底线,也抑制了社会创新文化的活力。从这个角度分析,无论是从社会观念来看还是从法理角度分析,网络用户下载盗版作品的行为应该被认定为侵权。

    (二)适用个人合理使用抗辩的困境

    当侵权人成为普通大众即广大消费者的时候,侵权人与权利人之间的利益平衡就发生了微妙的变化,因为普通消费者从一定程度上被视为公共利益的载体。事实上,版权法在维护版权人权利的时候,也会尽可能地去满足消费者使用作品的需求。在传统版权市场中,版权法允许消费者在私人空间内,在不产生针对版权作品的市场替代效果的前提下,使用他人的作品。这种使用,一般指向作品的复制和演绎。由于复制权是版权财产权利中最核心的权利,版权人和公众之间的利益争端主要便是围绕复制权而展开,其最终涉及的就是有关私人复制的合法性问题。

    受到版权人利益的制约,私人复制的生存空间自始便十分有限。实际上,私人复制作为合理使用情形中的一种,在各国版权法律中通常只是作为对版权的限制而设计的一种消极抗辩,鲜有上升为公众能够主动行使的积极权利的立法例。随着信息传播技术的革新,人们复制作品的手段渐渐丰富,复制的速度与规模也随之增长。相反,版权人限制私人复制的技术难度和成本却在不断增加。为了保持一种来之不易的利益平衡,立法者在私人复制的合法性问题上采取了愈发严厉的态度,这在许多国家的立法和判例中都有所体现。

    美国司法实务在面对网络个人侵权问题时的态度,随着侵权行为和作品类型的改变,经历了一个从宽松到严厉的变化过程。最初,由版权蟑螂发起的诉讼主要针对的是博客空间发表博文时出现的文字、图片的网络盗用行为。在绝大多数情况下,此类行为都只是对作品或者作品的一部分所进行的不带有商业目的的“实际上的转换使用”(Transformative Useperse)。对此,法院通常会判定该类使用行为因部分满足“四个合理使用要素中的主要因素”而免于侵权责任。可以说,由于博客受本身的技术、场景与篇幅所限,作品遭受大规模侵权的可能性较小,无论是作品被使用部分的篇幅和重要程度,还是市场替代的效果,都不会对版权人的利益带来实质性的损害。况且,版权蟑螂滥用诉讼的行为未能彰显作品的市场和文化价值,无法正确体现版权法的法益。若从衡平法的角度考量,限制此类权利人的诉讼空间,让公众的行为构成合理使用,这种司法政策是能够被理解的。

    但是,针对非法下载网络盗版作品行为的合理使用判定,就有所不同了。网络用户在明知盗版作品涉嫌侵权的情况下,仍然进行下载的故意侵权行为,难以用“合理使用”作为抗辩的理由。大多数国家的版权法认为,“非法下载行为毫无‘合理’或者‘轻微’(de minimis)可言”,都应当被视为侵权。

    在我国,有关网络环境下私人复制的合理使用判定问题,更加富有争议。例如,曾有观点认为,可以将现行《著作权法》第22条第1款的措辞视为私人复制适用于数字环境的依据,并且在此基础上指出,“在当今数字技术广泛运用的情况下……允许个人为欣赏而合理使用作品会严重损害著作权人的经济利益”。继而有学者建议将“个人欣赏”排除在个人合理使用的目的范围之外,该建议最终在2014年《著作权法修订草案送审稿》(以下简称《送审稿》)中受到采用。可以说,这是典型的合理使用面对全新网络环境的一次制度性回应。

    另一方面,《送审稿》第43条第1款在个人使用的限度上加上了“作品片段”的要件,又带来了新的问题。应当说,在转换性使用的语境中,“作品片段”要件仍具有一定的存在意义。使用者在原作品的基础上进行新的创作时,对原作的借鉴程度需要被限制在一个合理的范围之内,这不仅可以确保原权利人的复制权不会受到侵犯,也会促使演绎者在其创作过程中注入足以主导整个演绎作品的新元素。但是,在消费性使用中,该要件的存在价值就应予商榷。实践中,对私人复制作品的篇幅作出限制,往往只会带来“同一作品分多次复制”的饶有意味的后果。而在数字环境中,更是难以找到针对盗版作品的“片段获取”行为,因为一次下载通常就意味着对作品的完整复制,这是由数字技术本身的特点所决定的。

    若《送审稿》通过,原本在数字环境下亦可拥有生存空间的个人合理使用制度,就会遭到排挤。虽然将《著作权法实施条例》中用于合理使用判定的“三步检验法”明确到《著作权法》中,似乎昭示了版权制度的设计将在利益平衡上更倾向于公众,但是,这显然与个人合理使用制度的实际萎缩之间,产生了冲突。本次《著作权法》修订中,我国版权合理使用制度在“因素主义”立法技术的作用下趋于灵活,却又在现实问题的压力之下限缩了适用范围,其实际效果仍待检验。但可以肯定的是,就立法趋势和各界观点来看,普通网络用户下载盗版数字作品的行为不能构成合理使用,这几乎是没有疑异的。

    被异化了的法定赔偿及其理性回归

    版权侵权损害赔偿的判赔标准包括权利人损失、侵权人所得、法定赔偿等多种方式,《送审稿》在现行法律的基础上还增加了惩罚性赔偿的规定。但实践中,真正得到大量运用的是法定赔偿。而在网络传播技术的冲击下,原本旨在加强权利保护、提高司法效率的法定赔偿制度却出现了异化的现象,变相地激励了滥诉行为。

    (一)被异化的法定赔偿

    在版权蟑螂的诉讼中,通过法定赔偿方式获得赔偿是一种主要的损害赔偿承担方式。我国知识产权损害赔偿中,法定赔偿的适用几乎达到了90%。为了确定知识产权损害赔偿的数额,人们采取了诸多方法,但损害计算不精确的问题依然存在。这样,司法实践中多数情况下适用了法定赔偿,既便于法院的操作,也减少原告诉讼的举证成本。从某种角度看,法定赔偿的简便易行,在一定程度上怂恿了版权蟑螂的诉讼行为。

    有人认为,美国版权法上的法定赔偿制度之所以在面对版权蟑螂时失灵,很大程度上要归咎于不同赔偿计算方式的“平行顺位”。我国《送审稿》第76条采用了与美国类似的做法,将进一步增加业已存在的司法上滥用法定赔偿的几率。日常生活中,网络用户下载一部电影、电视剧、一张音乐专辑或是一本电子图书的行为,很难说对于版权人原本拥有的市场产生了多少替代效果。易言之,即便上述行为侵权,对版权人造成的损害也不会超过一件商品本身的价值。这时,采用“实际损失”的赔偿标准对版权人进行赔偿,显然是最为合理的。

    为了解决法定赔偿过高的问题,美国曾在1976年修订版权法时调整了法定赔偿的计赔单位,具体做法是以“每一侵权作品规则”(a per infringed work rule)取代了“每一侵权行为规则”(a per infringement rule),即将针对同一作品的多个(或多次)侵权行为所导致的法定赔偿次数限制在一次,从而减轻一部分侵权人的赔偿责任。这是传统媒体时代针对同一作品多次复制现象的矫正。

    我国的版权法定赔偿制度在计赔单位上缺乏规定,因而近年来多有学者主张效仿美国的做法而推动这一规则。这项规则本来是为了解决法定赔偿过高及频繁适用的问题,但在面对网络用户为主体的侵权下载行为时,却遇到了新的问题:无论是电影、电视剧、音乐或者图书,在大多数情况下,网络用户的下载行为都是面向多个作品的单次行使,如果以侵权客体数量为基础设计计赔规则,容易进一步引发滥诉和赔偿数额过高的情况。从这个角度看,一项旨在限制法定赔偿适用的“每一作品侵权规则”,在网络时代似乎又成为了促使法定赔偿异化的诱因之一。

    (二)法定赔偿的理性回归

    我国虽然比较普遍地适用了法定赔偿,但由于法官们在司法裁量中普遍采取了赔偿金额的低额化标准,尚未成为一项促进版权蟑螂的司法政策。美国著名P2P案件Capitol Records v.Thomas-Rasset案中,陪审团对原本侵权损害不超过54美元的文件共享行为,将法定赔偿数额裁定为192万美元,一定程度上暴露了适用法定赔偿不当的危险。显然,美国带有惩罚性色彩的法定赔偿额度不足效仿,而我们也不能因噎废食地去降低法定赔偿的限额,让司法沦为知识产权保护的漏斗。

    有学者认为,“法定赔偿的目的无疑只是补全性(compensatory)的。”这种说法,并不完全准确。事实上,法定赔偿的功能主要体现在两个方面:一是在无法精确计算赔付数额时,尽可能补偿和填平被侵权人遭受的损失;二是在侵权情节、作品价值等不同考量因素的基础上弹性运用,在适当情形下额外增加赔偿数额,对侵权人施以一定程度上的阻吓和惩罚。两项功能中,以前者的补偿功能为主,后者的惩罚功能为辅。在实践中,法定赔偿的惩罚性功能往往被过分重视,以致激励维权诉讼。但法定赔偿的惩罚性功能只是辅助性的,只有在法官自由心证的过程中,揭示了侵权人主观上的直接故意,并且权利人的实际损失存在扩大化倾向的时候,才以此以儆效尤。但是,在缔造网络环境的信息技术尚处于上升期之时,这种做法是不合时宜的。

    具体到非法下载盗版作品的情形中,应当将网络用户不带有商业目的的作品下载行为予以区别对待,避免加重普通网民的法律责任。诚然,司法实务中,法院已经积累了一些经验并提出了诸多创见。对此,学界也进行了大量的研究。但是,适用法定赔偿的问题依然存在。这些问题主要表现在:第一,过于注重权利人的损失,忽视侵权人所得;第二,片面强调侵权人的过错程度,对侵权的目的不予区分;第三,对侵权人所在地区的经济水平以及侵权人自身的经济承担能力缺乏考虑。这些情形,在非法下载盗版作品的司法适用中容易导致法定赔偿过高的结果。单纯的下载行为所导致的一次(或数次)观赏和阅读行为,给行为人带来的收获更多是在精神层面上的,这种非商业性的行为既无可量化的利润,造成的市场损害也很有限。因此,我们建议将侵权人所得和侵权行为的商业属性纳入衡量的因素,采取“基准赔付额度+”的做法,回归填平原则的同时,适当地发挥阻吓和惩罚功能。另外,还应该考虑侵权人的经济承受能力。美国商务部于2016年1月公布的《混同、首次销售和法定损害赔偿白皮书》(White Paperon Remixes,First Sale,and Statutory Damages:Copyrigh tPolicy,Creativity,and Innovation in the Digital Economy)中,在肯定“法定赔偿适用混乱无益于网络盗版现象的治理”的基础上,提出了一系列针对性的整改建议,其中包括法定赔偿额度判定因素的细化和设立针对散布网络盗版等“轻微版权侵权行为”的小额赔偿庭等。显然,其核心思路也是,即便是针对群体侵权,对那些危害性较小的非商业性的侵权群体,应该予以区别对待,降低法定赔偿的惩罚性程度,以达到法定赔偿向补偿性功能的回归。客观来看,法定赔偿的理性回归,减少了对维权诉讼产生不必要的激励。但这种做法,毕竟也存在某种局限。另外,版权蟑螂诉讼施压或者要挟行为促成诉前和解,也可以有效地避免法定赔偿的司法适用。对于涉嫌数字盗版行为的普通用户而言,法定赔偿无论如何调整,承担司法诉讼成本并进行赔偿,始终是一种难以直面的负担。

    釜底抽薪:“三振出局”机制

    从本质上讲,杜绝盗版泛滥的现象,净化版权市场,是规制版权蟑螂现象的根本途径。这方面,版权行政管理部门可以发挥行政保护的优势,利用行政执法之主动性和简便性,主动监控或者授权网络服务提供者实时监控,可以及时有效地针对侵权行为采取严格的强制性措施,回应网络社会的发展。从这个角度看,我们认为引入“三振出局”的保护机制,是一种“釜底抽薪”式的有效手段。

    (一)“三振出局”机制的由来

    “三振出局”原则(Three Strikes Policy)最早出自于美国加利福尼亚州治理累犯的刑事政策。具体到知识产权制度中,主要规定为由权力机构———法院或者行政机关(包括其授权的网络服务提供者)对网络环境中非法共享、下载版权作品的网络用户的行为展开监控,并在三次警告性提醒后仍不收敛的前提下,对其进行断网、罚款甚至追究刑事责任的处罚。尽管这一政策实施以来受到了限制言论自由之合宪性及域外适用方面的质疑,但其实效绩效却不容忽视。国外研究和统计结果表明,实行“三振出局”国家的非法下载行为已经呈现出了明显的下降趋势。由于这种做法在治理版权盗版市场方面发挥了有效的作用,逐渐为许多国家或者地区效仿,如法国、韩国、英国、新加坡、新西兰、爱尔兰以及我国台湾地区都引入了这一保护机制。

    “三振出局”机制试图在网络服务提供者所承担的法律责任之外,再将治理对象直接定位为网络用户。客观分析,由于网络服务提供者积极或者频繁地适用“避风港”原则以求自保,甚至与网络用户“共谋”以求扩大市场如涉嫌间接侵权的“百度文库”事件,版权人的利益诉求难以实现。可以说,“三振出局”机制是继“避风港”原则之后,对版权人、网络服务提供者和网络用户之间利益的再一次平衡。这一机制,一方面限制了普通用户的利益———哪怕这种利益已经蒙上了侵犯版权的灰色阴影;另一方面,也虑及版权蟑螂介入可能给公众利益造成的更为严重的侵蚀。

    “三振出局”机制的核心价值在于借助较为直接的监管手段,有效遏制上传或者下载盗版作品的行为。由于世界各国和地区的盗版现象的严重程度不同,版权保护意识也各有差异,因此,各国监管及处罚力度也有所不同,从而显示出保护强度的区别。例如,法国版的“三振出局”———Hadopi法案第5条之三规定,可以对用户的每一次非法下载行为处以最高5,00欧元的罚金,严厉程度远超其他采用“三振出局”的国家或者地区;而如韩国、新西兰都只赋予法院终止侵权用户网络服务的权力。

    (二)“三振出局”机制与避风港原则

    从某种角度说,“三振出局”机制的引入,是因为司法上适用避风港原则不足以打击日益猖獗的网络盗版现象。对于版权侵权行为所导致的损害赔偿责任,“避风港”原则一直主张归于作品的直接接触方即网络服务提供者———传播数字盗版作品的网站和获取商业利益的技术提供者。这一做法,“激励了”弱势地位的公众对作品的使用,但却迫使网络服务提供者承担了更多的管控义务和赔偿责任。但是,网络服务提供者与网民之间是一个利益交集的相对方和共同体,而且加重网络服务提供者的责任事实上又会阻碍技术进步,如奇虎360“个人云盘事件”,就是一个典型的例子。相较之下,“三振出局”机制及时回应了网络生态的版权人利益需求,也适当地减轻了网络服务提供者的侵权风险负担,将大部分监管责任归于权力机构及其所授权的网络服务提供者,这是对避风港原则的一种正向补充、乃至升级。

    “三振出局”机制以行政手段介入侵权领域,既为版权人清除了大量的非法上传或者下载行为,也减轻了网络服务提供者的管控义务和赔偿责任。这一做法,表面上看是加重了网络用户的负担,但事实并非如此。首先,“三振出局”机制将大量的潜在民事诉讼转化为行政处罚,在很大程度上为网络用户降低了诉讼的风险。而无论是断网抑或者处罚,其较之版权蟑螂索取的高额侵权赔偿,其显然更能为公众所接受。其次,相较于原本无法预测的诉讼风险,“三振出局”机制为网络用户提供了一个可以预估的侵权成本。这样的机制,既能够帮助消除盗版行为,也能够帮助公众加强版权保护意识。再次,针对不下载网络盗版的用户,非法下载行为的减少可以缓解网络阻塞(network congestion)的问题,营造一个更为高效和健康的网络环境。

    (三)创造性引入“三振出局”机制

    对于版权蟑螂来说,“三振出局”是一个釜底抽薪的行政保护机制。但我们如何引进这一机制,需要深入探讨。我们认为,我国应该因应国情,创造性地引入。

    首先是确定实施主体的问题。但这一问题,又关联到采取何种处罚措施:如果采取的是行政罚款或者刑事处罚,则必须由行政机关或者法院组织实施;但如果仅仅涉及断网处理,则可以由法律赋权或者行政机构授权,由网络服务提供者及其行业组织依法或者依授权直接组织实施。根据美国法社会学家的研究,对下载数字盗版作品的网络用户课以赔偿和罚款的做法,可能导致公众对相关法律规定是否公平正义产生疑问。从这个角度考虑,结合我国国情(如公众版权意识相对较低、普通网络用户经济责任能力有限、行政权力较为强势等),建议我国引入“三振出局”机制时,可以考虑不对普通网络用户课以行政罚款和刑事责任,仅以施以中断网络服务的处罚为宜。这种做法,能够较好地平衡了各方的实际利益,促进网络快速、健康地发展。

    从这个角度考虑,应该发挥行政权在回应知识社会的作用。“由于行政手段在应对社会变化中具有灵活的特性,因此,可以通过在政府机构内建立各种组织机构和设立相应的义务,以扩大对社会变迁的影响,如20世纪西方国家经常依法建立名目繁多的局、委员会以及用于促进特殊政治目的的各种机构。同时,对行政权赋予法律上的义务,以形成一种社会环境,以此培养社会变迁的因素。”这一机制,将版权人从“避风港”原则出发单纯聚焦于网络服务提供者的眼光,部分地转移到了网络用户自身身上,而且由行政机构负担了相应的监管成本。不过,我国版权行政部门一直以来都在根据著作权法和《信息网络传播权保护条例》强化网络服务提供者的监管义务。最近出台的《关于加强网络文学作品版权管理的通知》(2016年11月4日起实施)提出,网络服务提供者应当加强版权监管,履行版权审查和注意义务,并且应该“建立健全侵权作品处理机制”。从这个角度来说,网络服务提供者依然是行政管理部门的治理网络环境的主要抓手。这种状况,就迫使我国网络服务提供者在消极实施的“避风港”原则之外,建立起积极的侵权查处机制。

    不过,单纯由某一家网络服务提供者建立的侵权查处机制,让人担忧其利用市场优势地位的“私权力”扩张,也缺乏信息共享和执法标准的统一。从这个角度分析,按照参加自愿原则、内部治理自治原则、政府监管的外部性原则这三大原则,在主管部门指导下建立起行业组织的市场化运行机制,是一条符合市场经济的法治化途径。因此,建议由版权行政部门指导促成相应的行业协会进行协调,形成行业监管与自律的规范发展模式。同时,建议网络服务提供者及其行业组织可以创造性地引入境外实行的“三振出局”机制,建立起中国特色的“三色机制”:第一次通知黄色提醒之后,第二次采取红色预警,第三次纳入黑色名单;纳入黑色名单之后进行屏蔽,并采取断网措施。当然,对于被采取断网措施的网络用户,经过一定时间之后,应该有一个复活或者“漂白”的过程:一方面是公众言论自由的保护,另一方面是利益的一种再平衡。

    结语

    版权蟑螂现象反映出的是版权人和公众之间的一次正面冲突。通过法律的治理应该因循既有的版权制度,并在网络时代实现创造性转换:一方面,要对版权人利益群体(包括资本介入的维权实体)实行充分的保护;另一方面,又要采取不同措施,尽可能地将公众利益的损失限制在最小的范围之内。

    的确,网络发展与数字技术的进步,在扩大版权市场和方便公众获取作品的同时,也会泥沙俱下,引发网络盗版和版权蟑螂两种相生相克的泛滥现象。此时,版权人、盗版者、网络服务提供者及包括普通网络用户在内的公众利益等多元主体的利益诉求,呈现出较强的张力。就版权蟑螂的行为特征分析,其透过侵权诉讼获利的行为本身无可厚非———诚如有的法官所述,“商业维权有其天然的正当性基因”,因此网络盗版用户并不能用合理使用规则予以抗辩。不过,版权蟑螂频繁地利用法定赔偿方式获取巨额利润的做法,也让我们意识到法定赔偿制度的“异化”现象,从而期待损害赔偿应该是以填平原则为基础的理性回归。这样,将法定赔偿额度定位在“基准赔付额度+”层面上予以适度的惩罚性衡量,是较为妥当的。当然,治理版权蟑螂现象的最佳途径就是铲除这一现象滋生的土壤即网络盗版市场。这方面,诸多国家或者地区通过“三振出局”保护机制,弥补了“避风港”原则的不足,起到了较好的规制效果。对此,我们应该创造性地引入这一机制:以断网处罚为主,建立起中国特色的“三色机制”。若网络版权治理能够实行这种模式,那版权蟑螂可能就只是一条鲶鱼,在新的利益平衡中,激活了一个健康的网络版权市场。

     

  • 李宏彬 等:父母的政治资本如何影响大学生在劳动力市场中的表现?

    李宏彬 孟岭生 施新政 吴斌珍:《父母的政治资本如何影响大学生在劳动力市场中的表现?———基于中国高校应届毕业生就业调查的经验研究》,本文的数据来源于2010年的调查,文章原载《经济学(季刊)》2012年第3期。

    引言

    近年来,越来越多的经济学家开始研究经济社会地位的代际间传递问题。已有的大量研究发现,父母的健康状况、受教育程度及收入对下一代的健康状况、教育水平,以及他们的职场表现都有重要影响。 然而,关于父母的政治资本对下一代的影响的研究依然十分缺乏。 
    中国高校快速扩招之后 (从1999-2009年,高校招生规模扩大了293%),更多的年轻人有机会接受大学教育。这种情况下,代际传递更有可能影响下一代的收入,而不是影响他们的受教育年限。也就是说,即使同样拥有大学文凭,家庭出身更好的大学生可能会在劳动力市场中找到更好的工作。
    目前在中国,“官二代”和 “非官二代”在各个方面受到不同对待的现象受到了包括官方媒体在内的极大关注。例如,《人民日报》在2010年7月1日的一篇题为《为“二代”创建公平的竞技场》的文章中这样说道:“三十多年前,改革开放打破身份桎梏,社会如水流活; 三十多年后,一部分人先富起来,财富与权力的差距,在事实上形成身份的差别、阶层的分化。恰逢代际更替,也就造成了不同的‘二代’—— ‘富二代’、‘官二代’、二代农民工、二代独生子……‘学好数理化,不如有个好爸爸’、‘他们有的是背景,我们有的是背影’等灰色民谣、‘拼爹’等让人啼笑皆非的网络新词,都让人看到在社会的同场竞技中,不同‘二代’面临的不同境遇。”
    文章有几点需要说明。首先,尽管我们的数据库信息丰富,但是父母的政治资本对子女人力资本的影响有一部分是我们 (研究者)无法观察到的,但是雇主能观察到。不过,这对于大学毕业生首份工作的工资而言,这不是一个很大的问题。因为即使对雇主而言,他们的人力资本特征与老员工相比也是难以观察的。因此,研究者和雇主之间的信息不对称问题是可以忽略的。其次,我们只调查了应届毕业生第一份工作的工资。由于工资溢价很可能会随时间而变化,如果说对于缺乏工作经验的应届毕业生而言都存在工资溢价的话,那么,工资溢价很可能会随着这些学生年龄的增长而进一步提高。

    调查数据

    我们的数据来自清华大学中国经济社会数据中心于2010年5、6月间开展的第一轮中国大学生就业追踪调查 (CCSS)。调查以院校的地理位置(北京、上海、天津、东北、东部、中部和西部)1和学校类型(7种)为依据进行分层随机抽样。最终在全国2305所高校中抽取了100所院校,然后在每所大学内随机抽取学生。
    作为预调查,第一轮调查包括了全样本100所高校中的19所,其中10所为名牌大学,即211院校 (含985院校)。我们特意抽取了更多的名牌大学来检验问卷的质量以及整个调查的组织情况。被调查院校分布于全国11个省市,涵盖了各大地理区域。为了基于小样本进行统计推断,我们根据两项指标将被调查院校分为八类,并据此构建了权重用于统计分析。两项指标分别为:院校类型(211院校)和院校所在区域(东北、北部、中部和西部)。每所院校的权重为总体中该类院校的总量与样本中该类院校数量之比。
    我们在每所院校中随机抽取约300名应届毕业生。在被调查的全部6059名应届毕业生中,有3167名学生来自重点高校,2892名来自其他院校。在9所非重点院校中,6所为公立院校(2201名学生),2所为私立院校(415名学生),1所为职业学校(276名学生)。
    调查所使用的问卷是由包括经济学、社会学和教育学在内的各个领域的专家共同设计完成的。问卷内容不仅包括个人基本信息、家庭背景,还包括高考成绩、大学生活、毕业去向等问题。调查工作由各个样本院校选派的1-3名主管教学、学生工作的行政人员负责。我们在北京对他们进行了集中培训。学生填写完问卷后,问卷会被放入密封的信封里以保证匿名性。在所有问卷都填写完成之后,各校负责人收集完成的问卷并将问卷邮寄回北京。为了保证调查的整体质量,我们全程监督了各校问卷填答过程、数据收集及录入过程。
    表1为描述性统计结果,其中第 (1)列为全样本信息,第 (2)、(3)列分别为“非官二代”和“官二代”学生的信息。第四列为考虑权重后两组学生相关变量的差别,权重计算方法如前文所述。“官二代”的划分标准是学生父母中至少一人为政府官员,14%的学生符合“官二代”标准。

    表1第一部分是学生的基本信息。从平均水平上看,大学毕业生第一份工作的平均工资是2153元。“官二代”的平均工资比其他普通同学高出18%(2494元相比于2116元),但是加权后两类学生间的差距没有那么显著。我们将用多元回归的办法来检验控制了其他变量的影响后工资溢价是否依然存在。
    由表1可知,全部样本中有56.2%的学生是男生。有意思的是,“非官二代”学生中的男生比例比 “官二代”学生高 (56.9%相比于51.7%)。学生的平均年龄为22.9岁,在 “非官二代”学生与“官二代”学生之间差别很小,分别为22.9岁和22.6岁。16%的学生父母中至少有一人有大专及以上学历; 不过“官爸爸”、“官妈妈”中有大专及以上文凭的比例比普通父母高出6倍多(59%相比于8.4%)。官二代家庭收入比普通家庭收入也高很多,高出2倍有余(76924元相比于35142元)。
    表1的第二部分报告了学生文理分科情况和标准化后的高考成绩。基于省内参加同类考试的学生高考成绩的平均值和标准差,我们对所有高考分数进行了标准化,公式如下:(学生分数-平均分)/标准差。由定义可知,标准化后的分数均值为0。样本中约75%的学生为理科生。有意思的是,出身普通家庭的学生中理科生的比例更高 (74.0%相比于70.3%)。“官二代”学生的数学成绩更好,但理综/文综成绩更差。不过这两类学生的其他成绩差别不显著。

    表1的第三部分报告了学生在大学期间所获得的人力资本,包括英语等级考试成绩,是否有技术等级证书,是否有工作经验,是否是党员,以及是否有学生会干部经历。从表中可以看到,与来自普通家庭的学生相比“官二代”的更低,但是英语成绩较高。同时,大学期间普通家庭的学生从事打工兼职的可能性也更高。不过,两类学生在持有技术等级证书、入党和担任学生会干部方面没有明显区别。

    在附表中,我们还给出了“官二代”大学生和非“官二代”大学生就业行业的百分比分布。相比之下,“官二代”大学生更多地在金融业以及党政机关/群众组织/社会团体/国际组织等行业就业。

    实证研究模型

    在本部分中,我们建立了一个简单的计量模型来展示我们的研究思路。 假设收入由以下方程决定:

    lnW2 =α+βP1 +γX1 +δX2 +ε 方程(1)

    其中,lnW 为大学毕业生第一份工作工资的对数,P 为“官二代”的虚拟量,1代表父母中至少一人具有行政级别,0代表没有。这里的“官”包括任何有行政级别 (包括副科及以下)的人,他们的工作单位性质可以是党政机关、事业单位和国有企业。X表示其他影响收入的变量。X1表示父母特征变量,X2表示学生特征变量。ε为误差项。系数β是要估计的父母的政治资本给孩子带来的工资溢价。
    当且仅当P独立于误差项ε的时候,普通最小二乘法对β的估计是一致的。但是由于以下几个原因,P可能会与误差项ε相关。
    第一,父母当官对孩子收入有正影响的原因可能在于父母其他方面的特征帮助了孩子。因此除了父母的政治资本之外,我们还需要控制父母其他方面的特征,如父母的户口、人力资本和收入。
    第二,“官二代”可能能力更高,而能力和收入正相关。对这个问题最简单的处理方法是找到一个可以衡量能力的代理变量,并将其包括在回归方程中。前人在研究教育回报时采用高中考试成绩、IQ值、AFQT成绩和其他类似的能力考试的成绩作为不可观测的能力的代理变量。在我们的数据中,学生报告了高考成绩。如果高考成绩是能力的合理或近似合理的度量,那么将高考成绩加入方程会减少“能力偏差”。调查中我们不仅获得了高考总成绩信息,还获得了学生各科的高考成绩,包括数学、语文、英语、理/文综。这些成绩可以用来度量学生不同方面的能力。
    第三,“官二代”就读的院校可能更好,或者他们在本科学习中积累了更多企业需要的技能。这两个因素对学生毕业后的起薪都有促进作用。我们的调查提供了非常丰富的信息,使得我们可以对学生的大学以及大学表现的异质性进行很好的控制。
    不过,我们无法观察到所有影响大学毕业生起薪的因素。尽管我们较为全面地控制背景变量可以减少潜在的遗漏变量问题,但是我们仍然无法从根本上消除其影响。

    父母的政治资本有工资溢价吗?

    通过对回归方程式 (1)的估计,我们估计了“官二代”和非“官二代”大学毕业生在首份工作的工资上的差别。回归中,因变量是工资的对数值。 由于观察对象均为大学生,因此没有引入受教育年限作为自变量。全部的回归都考虑了权重。回归系数估计值的标准差是异方差稳健的,并在各省内聚类(cluster)。

    (一) 基 本 结 果

    表2的回归结果表明“官二代”毕业后首份工作的工资更高。第 (1)列中的回归包含3个解释变量: “官二代”虚拟变量、性别和年龄。“官二代” 虚拟变量的系数在1%的水平上显著,其估计值为0.133。这意味着相比于普通家庭学生,“官二代”的工资溢价为13.3%。根据Zhang et al. (2007) 的估计,这个溢价约为两年教育的回报。另外值得注意的是男生的工资溢价约为20%,考虑到学生之前均没有工作经验,这个差距还是相当大的。由于学生之间年龄差距不是很大,所以年龄对工资的影响并不显著。

    父母做官之所以对下一代收入有正的影响可能是因为“官爸爸”或“官妈妈”其他方面的特质影响了下一代。由表1可知,“官爸爸”和“官妈妈” 整体上的教育水平更高、收入更高。有鉴于此,我们分别引入以下因素作为控制变量:第 (2)列的父母户口虚拟变量(是否为城镇户口)、第 (3)列的父母收入(取对数)、第(4)列的父母学历虚拟变量(是否至少一人有大专及以上学历)。在第5列中,我们还控制了学生来源省份的固定效应。在控制了这些变量后,“官二代”身份对起薪的影响基本没有变化; 第5列显示,“官二代”虚拟变量前的系数依然在1%水平上显著为正,大小为12.1%。
    表2的最后一列显示进一步控制行业虚拟变量之后的回归结果。在控制了行业变量后,“官二代”身份对起薪的影响相对于先前的结果略有下降; “官二代”虚拟变量前的系数依然在1%水平上显著为正,大小为10.4%。
    正如我们所预期的那样,在所有回归中((3)-(6)列),父母收入对子女工资均有正向作用,且在1%水平上显著。由于父母收入、子女工资都是对数形式,因此收入前的系数代表弹性。估计结果表明父母收入每增加1%,子女大学毕业后首份工作的工资就增加3%,这个影响是很大的。此外,父母是否有城镇户口和父母是否有大专及以上学历对子女工资没有影响。

    (二)能力可以解释父母政治资本的工资溢价吗?

    以往研究表明中国官员的能力比普通人更强。如果 “官爸爸”、“官妈妈”的这些能力禀赋可以遗传给子女的话,那么“官二代”与“非官二代”学生之间的能力禀赋有差别,那么将两者的工资进行比较就无法得出父母的政治资本有工资溢价这个结论。由于无法利用自然实验,因此目前处理这个问题的最好办法就是在方程中引入能力的合适代理变量。中国大学生绝大部分都要参加高考,而且他们在高中时都是尽全力准备高考。因此,高考成绩可能比较好地度量能力。
    通过研究“官二代”是否更重视理科(相对于文科),以及“官二代”的高考成绩是否更好,我们首先对“官二代”是否比普通大学生能力更强这个问题予以验证。表3第(1)列研究了哪类学生在高中 (和大学)更倾向于学理科。“官二代”虚拟变量前的系数为负并在10%的水平上显著,说明“官二代”更倾向于在高中(和大学)学文科。我们同时发现男生和年龄更小的学生更倾向于学理科。不过,户口、收入甚至父母学历都没有显著影响。

    “官二代”在高考中表现更好。表3的第 (2)—(6)列中,我们分别以高考总分、数学、语文、英语和理/文综成绩作为因变量进行回归。“官二代”高考总分、数学成绩更高,但是另外几科成绩与普通大学生不分伯仲。以上结果表明,在工资方程中引入高考成绩作为控制变量是非常有必要的。

    其次,我们来研究“官二代”的工资溢价能在多大程度上能由高考成绩来解释。我们先来看 “官二代”工资高是否与他们更倾向于学文科有关系。表4第 (1)列在表2第(5)列的基础上引入理科生虚拟变量。结果显示理科生虚拟变量前的系数不显著,这说明是否为理科生不会影响到首份工作的工资。进一步的,理科生虚拟变量的引入对“官二代”虚拟变量前的系数也没有影响。

    表4的回归结果表明“官二代”并没有因为能力更强而获得工资溢价。第(2)列的结果表明,高考总分的估计系数为正但并不显著。更重要的是,它的引入没有明显改变“官二代”虚拟变量的系数估计结果,这意味着“官二代”的工资溢价不是由于难以观测到的能力或智力因素导致的。

    在第 (3)-(5)列中,我们以数学、语文和英语成绩代替高考总分作为控制变量分别进行回归。类似的,各科成绩前的系数为正但都不显著。在最后一列,我们将四科成绩同时放入方程进行回归。尽管四科成绩的系数联合显著,但是“官二代”虚拟变量的系数并没有明显变化。

    为什么父母的政治资本会有帮助?

    前面的研究结果表明,“官二代”大学生毕业后的首份工作工资更高,且这不是由于学生的能力差异或者父母其他方面的特性所导致的。本部分就“官二代”获得工资溢价的可能原因进行探讨。特别的,我们想对两类可能导致工资溢价的因素予以检验: 院校选择与大学期间的人力资本积累。

    (一)“官二代”选择更好的院校了吗?

    “官二代”在职场上更有优势可能是因为他们上了更好的学校或者在有“工资溢价”的学校读书。高考志愿填报是一个非常讲究策略的事情。考生对风险的不同态度、对院校相关信息的了解、和学校的关系、大学的费用都是影响他们填报志愿的重要因素。如果出身官员家庭的考生有信息优势,有关系,填报志愿时风险承受能力更强,经济条件更好的话,那么他们上好大学的机会就更大。
    由表5回归结果可知,“官二代”和“非官二代”上好大学的几率相当。第(1)列以各校平均的高考录取分数为因变量进行回归,录取分数越高,代表学校更好。自变量与表4类似。“官二代”虚拟变量前的系数小且不显著,说明“官二代”在上好大学(以高考平均分衡量)方面并没有优势。第(2)列中,我们采用各校应届毕业生平均工资作为因变量进行回归,结果类似。

    表5的第(3)、(4)列估计了控制了学校质量之后工资方程,结果证实“官二代”身份所带来的工资溢价不是由于“官二代”上好大学导致的。更具体的,在表4基础上,表5第(3)列、第(4)列分别加入各校学生高考平均成绩、院校固定效应来控制院校质量。加入这些控制变量后,“官二代”虚拟变量前的系数依然显著且大小基本没有变化。有意思的是,学校质量本身影响大学生的起薪,因为各校平均录取分数系数在1%水平上显著为正。

    为了控制专业对收入的影响,在表5的最后一列,我们在回归中加入了大学专业的固定效应。结果显示,“官二代”虚拟变量前的系数略有增大,而且依然在1%水平上显著为正。

    (二)大学期间的人力资本积累能否解释工资溢价?

    “官二代”在大学期间可能积累了更多有助于提升未来工资的人力资本。这些人力资本是多维度的,可以用学分积、技术等级证书、党员身份、学生会干部经历或者是打工兼职(包括实习)经历等来测量。我们在本节中研究这些人力资本特质对大学毕业生的起薪以及 “官二代”的工资溢价的影响。
    基于回归结果,我们发现“官二代”与普通同学在学习成绩、获得技术等级证书方面不分伯仲,但是他们的打工兼职 (包括实习)经历更少。表6第1列的回归以学分积为因变量,自变量与之前保持一致。“官二代”虚拟变量前的系数小且不显著,这表明“官二代”在学习成绩上没有优势。英语对大学生而言很重要,所以我们也以全国英语等级考试成绩为因变量进行了回归。虽然之前的简单统计显示“官二代”的英语成绩更高,但是表6显示,在控制其他因素的影响之后,“官二代”在英语方面没有优势(第(2)列)。同时他们获得技术等级证书的几率与普通同学相同(第(3)列),但是在校期间从事兼职工作的可能性更小(第(4)列)。

    另外一个工资溢价的解释和入党的概率相关: “官二代”更可能是党员,而党员更容易获得政府机关或国企工作。更重要的是党员本身也是一种能力的标志,在职场中是一种积极的信号。但是表6第5列的回归结果表明,“官二代”入党几率与其他同学大致相当。“官二代”也许更多地在课余活动中培养了能力,比如担任学生会干部。但回归结果却表明大学期间“官二代”并没有在社会活动中更活跃。表6最后一列表明“官二代” 担任学生会干部的机会与普通同学不相上下。

    最后,我们将以上衡量大学期间人力资本积累的因素全部包括在工资方程中,其中包括:学分积、技术等级证书、学生会干部身份、党员身份和兼职经历。表7的(1)-(5)列中,我们将这些变量逐一引入方程,在第(6)列中我们将这些变量同时引入。大学学分积、党员身份和学生会干部经历对首份工作工资有正向影响;但技术等级证书和打工兼职经历不影响工资。更重要的是,在控制了所有这些变量后(第(6)列),“官二代”虚拟变量的系数没有明显变化,这表明大学期间积累的人力资本不能解释 “官二代”身份带来的工资溢价。

    结论

    本文的研究结果表明,父母的政治资本对高校毕业生第一份工作的工资存在显 著正向的影响, “官二代”大学毕业生的起薪比其他同学高出了13% (约280元/月)。在控制父母的其他特征,如户口、收入、教育等因素的影响之后,父母政治资本的影响甚至更大了。

    尽管我们无法利用自然实验来解决线性回归中存在的遗漏变量问题,但是我们可以通过控制大量可能影响工资的变量来降低可能存在的估计偏差。其中,最为重要的是,我们将高考成绩作为学生能力或智商的代理变量。在高考中取得好成绩是所有高中生的目标,他们努力学习的目的就是为了提高高考分数。因此,高考成绩可以较好地衡量学生的能力或智商。本文的回归结果表明,“官二代”的高考总分和数学成绩更高。但是,即使引入高考成绩作为控制变量,“官二代”大学生在劳动力市场上有明显工资溢价的结论依然成立。这说明,“官二代”和非“官二代”学生之间可能存在的能力差别不能解释“官二代”的工资溢价。

    中国大学毕业生就业追踪调查所收集的信息还使得我们可以研究父母政治资本通过哪些渠道来影响子女工资。研究发现,父母的政治资本对学生进入211院校读书的可能性、在校期间人力资本的积累情况都没有显著的影响。因此在控制了所有这些可能影响工资的因素之后,“官二代”获得的工资溢价仍高达12%。这些结果进一步说明,父母的政治资本本身对子女的工资是有帮助的。其原因可能是“官二代”父母与雇主间有着某些特殊的关系、也可能是 “官二代”父母有着更好的获取求职信息的渠道。

    尽管仍然存在一些不可观测的人力资本因素可能与 “官二代”身份相关,但鉴于我们可以观察到的人力资本指标都与 “官二代”身份不相关,我们基本可以认定剩余的工资溢价就是 “官二代”身份本身在大学生劳动力市场中的回报。

    即便剩余的工资溢价仍然可能是由不可观测的能力或人力资本引起的, 本文的研究结果依然对我们进一步理解社会公平问题有一定的启发。近年来, 新闻媒体、网络论坛中有很多关于中国“官二代”享受社会、经济等方面特权的讨论,这些讨论很容易激起民众的愤怒情绪。一个毫不怀疑的事实是, 当今大多数中国人都倾向于认为“官二代”是能够获得工资溢价的。我们的实证结果表明,“官二代”身份以外的可观测的家庭特征和学生自身的特征,并不能解释“官二代”所获得的工资溢价,这说明父母的政治资本本身有助于提高大学毕业生的工资。不过影响的具体机制还有待于进一步的研究,文献对此也没有很好的解释。

  • 彭姝祎:欧洲主要国家养老金制度改革及其启示

    文章来源:《社会保障评论》,2023年第2期。

    一、引言

    作为福利国家的发源地,欧洲是全球最早建立养老金制度的地区。二战之后,欧洲各国普遍建立了以现收现付为主要融资方式的公共养老金制度。从20世纪70年代中后期起,在日益严峻的人口老龄化趋势下,各国的养老金制度普遍遭遇财政危机,收不抵支,赤字巨大。从90年代前后起,为确保养老金制度在财政层面可持续,各国陆续启动改革,改革在断断续续中持续至今。

    改革的总方向是控制支出、减少赤字,各国的做法大致相同,即综合运用参数改革和结构性改革两种方式,一方面开源节流,减少公共养老金的财政压力;一方面增建职业/企业年金、个人养老保险/储蓄等基金制的支柱,将养老责任向市场转移。改革后,公共养老金的保障水平趋于下降,政府的责任降低,企业和个人的责任增加。整体来看,改革有效改善了各国养老金制度的财政状况,具有不可否定的积极意义,但同时也削弱了整个养老金制度的再分配性质,使养老金待遇在不同代际、不同性别、不同收入水平、不同技能和学历、不同就业性质的退休者之间出现了较大甚至是巨大的差异,某些群体的老年贫困风险随之增加,养老金制度的充足性受到冲击。欧洲国家的经验表明,养老金改革是一个系统工程,要综合考虑财政可持续性和充足性两大要素,避免顾此失彼。

    鉴于绝大多数中小规模的欧洲国家人口少、经济结构单一,参考意义不大,本文以英国、法国、德国和意大利四国为主要参照,这四国的养老金改革同时也具有典型意义。

    二、养老金改革的措施与结果

    过去二三十年间,在大体相同的人口老龄化压力下,欧洲国家普遍对养老金制度进行了改革,以应对日益加剧的收支失衡。改革通常有两种方式,一是参数改革,即对公共养老金制度的相关技术参数,如退休年龄、缴费年限、缴费率、养老金计发方式等进行调整,从而改变替代率和收益率,实现增收减支目的;二是结构性改革,即增建基金积累制的市场化支柱,让企业和个人承担一定的养老责任,减轻国家的财政负担。前者属于量变,后者属于质变。

    整体来看,各国均综合采用了上述两种改革方式,区别只在于改革的节奏、程度和力度。鉴于结构性改革较为激进,容易引发民众反对,甚至导致政府下台(比如法国),各国普遍选取了由量变到质变的改革路径,先从相对温和的参数改革着手,调整相关技术参数,直接或间接降低公共养老金的待遇水平,实现节流目的。当待遇下降到一定程度后,再“水到渠成”“顺理成章”地开启结构性改革,引进基金制支柱,以此来弥补公共养老金的削减。只有瑞典一步到位,于20世纪末将普惠性的公共养老金改为“名义账户”制,保留了现收现付的融资方式,但脱离政府预算、独立运行,从根本上改变了筹资模式和给付原则。

    (一)参数改革

    参数改革的主要目的是增收减支,各国普遍采用的措施大致可划分为三类。

    1.减支措施

    减支措施主要有:改变养老金的指数化方式,将曾长期施行的养老金待遇与工资挂钩,或与工资和物价中增速较快的一个挂钩,改为只与物价挂钩(英国、法国、意大利等),以间接放缓养老金的支出涨幅;修改养老金计发的参照基数,降低替代率,如荷兰由参照职业生涯末期工资(通常末期工资水平最高)改为参照整个职业生涯的平均工资,法国由参照工资水平最高的10年扩大为25年,英国将国家收入关联养老金(公共养老金的第二层)从参照工资水平最高的20年改为参照整个职业生涯,意大利从参照最后5年零1个月改为参照整个职业生涯;瑞典和德国将养老金与预期寿命或抚养比挂钩,从而随其变化自动调整。

    2.增收措施

    增收的首要措施是提高缴费率。德国将养老保险缴费率由最初的14%提高到了20世纪末的逾20%。但缴费率关涉劳动力成本,无限制上调将损害经济竞争力,故德国经过激烈讨论,做出了将缴费率稳定在20%的政治决定,以防止非工资性劳动成本上涨过快。目前德国的养老保险缴费率为18.6%,并规定在2026年之前禁止突破20%。法国将基本养老保险缴费率由最初的不足10%调整到了目前的15.45%。其次是改善抚养比,即领取退休金的老年人口和缴费的经济活动人口之比。随着分子即退休人口的持续增加,各国纷纷在做大“分母”即增加经济活动人口、扩大缴费群体上做文章,如创造条件促进女性就业、出台反失业措施促进青年人就业、引入青壮年移民劳动力、遏制普遍存在的提前退休现象、用财政激励手段提高老年人口就业率等。

    3.减支、增收并举的措施

    延长法定退休年龄是各国普遍采用的、既能有效减支又能增收的一举两得之策。如英国政府的估算表明,退休年龄每延长一年,大约可减少占GDP0.3%的公共养老金支出;同时人们每多工作一年,还能带来相当于GDP0.1%的额外收入;荷兰政府指出,从2001到2039年,若将退休年龄延长2年,则支出将减少约10%。

    和改变养老金计发方式、调整缴费率等措施相比,延长退休年龄是高度显性的,容易引发反对,为此各国纷纷采取了渐进、弹性的方式,以“月”“季度”等为单位逐步延长,同时配套以正向和反向的激励措施,即提前退休减扣养老金、延后退休增加养老金。意大利等国则在法定退休年龄和预期寿命之间建立了自动关联上调机制。由表1可见,西欧绝大多数国家的法定退休年龄已延至65岁以上,同时以灵活的姿态,允许重体力等从事“艰苦”“有害健康”工作的劳动者或很早便开始职业生涯、缴费年限足够长的劳动者提前退休而不减扣养老金(法国、德国、瑞典等)。在退休年龄存在公私部门差异的国家(在意大利、英国、法国,公共部门退休年龄低于私人部门),为提高延迟退休的合法性、降低改革的阻力,往往先把两者的退休年龄拉齐,之后再共同延至同一水平。

    (二)结构性改革

    参数改革有效增强了公共养老金制度的财政可持续性,同时为结构性改革腾挪了空间、创造了条件:当公共养老金的给付水平随参数调整下降、养老金日渐不足时,增建基金制的支柱来弥补不足便显得水到渠成。因此,在参数改革进行到一定阶段后,各国陆续立法开启了结构性改革,鼓励创建企业/职业年金、个人养老保险/储蓄等,将养老责任向企业和个人转移,让市场发挥作用。

    经过改革,各国大体形成了三支柱的养老金体系,但三支柱的发育程度以及各支柱在整个养老金体系中的占比存在很大差异。英国、瑞典建成了比较鲜明的三支柱体系,法国和意大利处于起步阶段,德国则介于两者之间。

    从20世纪80年代撒切尔夫人执政起,英国就开始对养老金制度进行结构性改革,将养老责任大幅度向个人和企业转移:一方面压低公共养老金的给付水平,只提供最基本的保障;另一方面凭借税费减免、立法支持缴费确定型职业年金等方式鼓励发展职业年金,并立法引入“自动加入”机制,将职业年金由自愿转为半强制;同时以奖励方式鼓励人们退出国家收入关联养老金,加入职业年金或个人养老金。上述措施极大地促进了基金制的发展,使英国最终形成了由公共养老金、职业年金和私人养老金组成的三支柱的养老金体系,其中公共养老金是低水平的普惠制度,覆盖面广但保障水平有限,毛替代率仅为22.1%(2016年),不到欧盟国家平均水平的一半,反之市场支柱发达。

    瑞典经过结构性改革,建立了一个鲜明的三支柱养老金体系,将养老责任从国家和雇主转移到了国家、雇主和个人。基本养老金支柱日益薄弱,国家的责任得到较大幅度的缩减,市场的作用显著上升。

    德国的公共养老金制度在参数改革后保障水平骤降,替代率由从20世纪90年代的70%降至2000年前后的不足50%,为政府“顺理成章”地引进基金制创造了条件,按照施罗德的说法,即“以结构改革替代待遇减缩”。2000年前后,德国通过李斯特改革,从法律层面正式引入基金制,以财政补贴、税收抵扣等方式鼓励人们购买政府认可的商业性养老保险项目。同时针对企业年金不够普及的局面,以税收激励、财政补贴等措施,鼓励雇主建立企业年金。经此改革,德国单支柱的养老金制度开始向多支柱转变。

    法国以现收现付的养老金制度为绝对主导——该国不仅有强制性的、现收现付的基本养老保险(即公共养老金),还有一个同样是现收现付且强制性的补充养老保险,两者相加替代率在70%左右。因此,尽管法国在参数改革后,公共养老金的待遇水平也有一定程度的下降,但和英国、德国等国相比,养老金仍然较为充足。尽管在2000年左右,法国也立法引入了基金制的职业年金和个人储蓄计划,但是基金制的支柱发育缓慢,在整个养老金制度中的占比长期不足5%;2010年以来,法国多次就养老金的改革方式在全民范围内发起讨论,探讨深化结构性改革、加强基金制支柱的可行性,但现行养老金制度的充足性以及深刻的历史教训(见下文),使法国民众对基金制抱有高度戒心,宁愿牺牲待遇水平也不愿放弃现收现付支柱的主导地位。

    意大利的情况和法国类似,该国现收现付的公共养老金替代率高,即使在紧缩性的参数改革后仍高达80%(公共部门更高,在95%以上),因此基金制的支柱——部分引入名义账户制、立法推进企业年金等——引入较晚,发育缓慢,形成了“发育不完全的多支柱”体系。

    基金制并不是新鲜事物,德国最初建立的养老保险制度就是基金制,该制度一度维持着高水平的积累,但随后在两次世界大战、货币改革等因素的影响下,养老基金严重缩水,一度到了只够维持二周支出的地步,这使德国在1957年痛下决心将法定养老保险的融资方式改为了现收现付。法国在20世纪30年代也建立了一个基金制的养老保险制度,但该制度在随后的大萧条以及二战后的金融失序中遭遇毁灭性打击,基金断崖式缩水,退休者失去了保障、生活难以为继,这也是法国人在“降低公共养老金待遇水平”和“进行结构改革,大力发展基金制”的选择中倾向于前者的原因之一。21世纪以来英国也遭遇了类似问题,在2008年的全球性经济与金融危机中,由于基金制规模庞大,英国受到的冲击也较大,养老基金大幅度缩水,导致英国的老年贫困率大幅上升。2008年危机还使部分原本打算向基金制转型的中东欧国家废除了该支柱。近期受特斯拉政府预算改革的影响,英国养老金现暴雷风险,基金制脆弱的一面再次显现。

    (三)改革结果

    各国参数调整和结构性改革相结合的措施有效缓解了养老金制度的财政压力。2016年法国的统计表明,在2010年以来所有改革措施的作用下,法国的养老金收益将逐步下降,降幅在2020、2030和2040年均相当于GDP的1%,到2040年养老金占GDP的比重将下降1.04个百分点。意大利在2011年改革后,平均养老金与劳动者人均GDP之比出现了较大幅度的下降,预计到2046年将由2016年的17.5%降至15%。意大利社保局2016年年度报告显示,2015年公共养老金支出占当年GDP的比重为16.69%,如不实施任何改革,该比重将超过18%,之后直线上扬,预计到2026年左右将突破21%,政府的财政负担将更加沉重。

    三、改革的负面结果

    尽管改革有效提高了养老金制度的财政可持续性,但同时也带来了不容忽视的负面后果:随着公共养老金保障水平的下降,养老金制度的收入再分配功能受到削弱;未来,退休者的养老金水平差异将随着他们在代际、性别、收入、技能和学历、就业性质(正规就业或非正规就业)等方面的差异而扩大,养老金制度的充足性受到冲击。

    (一)当下退休对比未来退休:改革带来养老保障的代际差异

    改革将导致养老金待遇水平的代际差。首先,随着退休年龄的延长和养老金计发标准更加严苛,未来一代退休者整体上将工作更长、缴费更多、收益更少。以改革较温和、法定退休年龄最早(62岁)的法国为例,该国的研究表明,以“终身”为单位,养老金替代率将在代际之间递减:从“50后”(20世纪50年代生人)的55%减至“90后”的45%;养老金的缴费率和收益损失率则递增,前者从“50后”的23%升至“90后”的27.8%,后者从“50后”的1.2%升至“80 后”的4.5% 和“70 后”的5.9%。意大利引入名义账户制后,养老金收益缩水,代价将由未来几代退休者承担,这引发了有关“代际撕裂”的激烈讨论。经合组织的相关报告也表明,在职业生涯完整的前提下,最近进入劳动力市场的人(1996年生人)和大约15年前退休的人(1940年生)相比,平均退休金替代率将下降近6个百分点。

    其次,改革导致未来的退休者更多地依赖市场支柱,但市场支柱不具备再分配功能,能否从中得到充分保障主要取决于能否“进场”以及金融市场这两大因素。一方面,“进场资格”与就业企业、就业性质、个人经济状况等因素息息相关,下列因素势必导致一部分人特别是低收入群体难以进场:一是大多数国家的职业年金是自愿性质,只覆盖部分人口;二是大多数国家的职业年金有准入门槛(收入要求),这使低收入者或者被挡在外面,或者就算勉强拿到了“入场券”,低收入也只能换来低水平年金;三是低收入者往往缺乏购买养老产品或进行养老储蓄的财力,而不仅仅是一些“市场派”所宣称的投资未来的“眼光”;四是各国的职业/企业年金纷纷从待遇确定型转成了缴费确定型,这意味着收益的不稳定。另一方面,基金制支柱的增加意味着投资风险的增大,尽管金融市场有自我修复能力,但老年人的抗风险打击能力较差。经合组织的研究表明,2008年的全球性金融危机对老年雇员的打击最大,因为和年轻雇员相比,他们等待市场自我修复的时间有限,重建储蓄的时间少,再就业更难。

    综上,和当前的退休者相比,未来几代退休者的养老金收益将面临更多的变数,其贫困风险也将随之提升。正如牛津大学教授伯恩哈德·艾宾浩斯(Bernhard Ebbinghaus)指出的,“公共养老金和私人养老金相混合的制度将众多老年人置于危险之中,因为他们缺乏足够的与收入关联的补充养老金。”事实证明,在多支柱的混合制度中,公共养老金支柱占比低的国家的退休者贫困风险更高;反之公共养老金占比高的国家贫困风险更低。如图1所示:在欧盟28国中,法国作为公共养老金支柱占绝对优势的国家,退休者的贫困风险几乎最低(7.3%),是欧盟平均水平(15.3%)的一半。英国高达22.8%,是法国的3倍;德国和瑞典紧随其后。英国、德国和瑞典退休者的贫困风险在西欧国家中名列前茅。艾宾浩斯也指出,英国、瑞士等基本养老金支柱薄弱的国家具有相对中高的贫困风险;德国正在产生中等水平的贫困;而法国和一些南欧国家的贫困率较低。英国作为欧洲养老金市场化程度最高的国家之一,近三十年来老年极端贫困率和极端贫困速度的上升在西欧国家均名列前茅。2021年英国媒体指出,英国有近五分之一的养老金领取者生活在贫困中,这是自2012年以来的最高水平。

    (二)正规就业对比非正规就业:改革导致养老保障的“内部人”“外部人”分化

    改革使公共养老金的待遇水平与个人收入水平和缴费年限高度关联,进而在正规就业者和非正规就业者之间造成了养老保障的“内部人”(insiders)与“外部人”(outsiders)分化。换言之劳动者可获得的养老金水平与其就业安全日益相关。

    退休年龄延长、缴费年限增加等改革凸显了将职业生涯维持到法定退休年龄的重要性,只有能确保工作到退休的稳定就业才能够提供较为充足的养老金,而连续性和稳定性差的就业势必导致退休金减少,这就造成了养老保障的“内部人”和“外部人”分化。正规就业者因职业生涯的连贯而能够获得相对充足的保障,成为养老保障的“内部人”。而临时工、合同工、小时工等各类非全日制、非正规就业者则容易因缴费年限不足、缴费中断、缴费基数过低等因素而难以得到充分保障,甚至被抛出养老保障网(在缴费时长达不到最低缴费要求的情况下),成为养老保障的“外部人”。

    此外,和正规就业者相比,非正规就业者普遍不被职业年金所覆盖,且由于收入水平低而缺乏投资养老保险或储蓄的能力,因此不仅难以获得充足的公共养老金,而且在基金制的支柱中往往也处于不利境地。

    综上,非正规就业者未来将面临更高的老年贫困风险。早在2012年,辛里奇(Hinichs)和杰苏拉(Jessoula)就指出,“公共养老金在提供最低收入方面的慷慨对(预防)老年贫困仍然发挥着重要作用。为降低退休者的严重贫困率,我们需要最低的收入保障,特别是基本的、有保障的或最低的养老金。鉴于目前及未来劳动力职业生涯的中断和非正规就业的发展,这一点将变得更加关键”。然而最近十余年来,稳定的就业在所有欧洲国家均呈降势,取而代之的是非正规就业、临时性就业等。欧盟委员会针对欧盟国家的统计表明,从2002到2017年,非全日制就业人口在就业总人口(15—64岁)中的占比从15.6%上升到了19.4%,临时性就业也从12.4%升至14.3%,这引发了人们对未来收入不平等和养老金不充足的普遍担忧。经合组织也指出:“大多数社会保障体系是以稳定、线性的职业生涯为基础的,没有能力为非正规就业的劳动者提供足够的收入安全,他们中的很多人可能会被忽略”“新工作形式的发展有可能削弱未来几代退休者的收入前景”。典型例子是德国的小微就业。21世纪初,为促进就业,德国通过允许雇员免缴养老保险的方式支持发展“小微就业”,尽管该措施的就业促进效果十分显著,但同时导致小微就业者的养老金水平大大低于正规就业者,十余年后,小微就业者(特别是其中的女性)较高的贫困风险逐渐显现。

    (三)女性对比男性:改革带来养老保障的性别差异

    改革导致了养老金待遇水平的性别差异。和男性相比,女性因生育养育以及普遍承担更多家务劳动的缘故,其职业生涯和建立在职业生涯基础上的缴费记录面临更多的中断风险,进而面临更大的养老金待遇水平下降风险和老年贫困率上升风险。大多数欧洲国家逐步意识到了这一点,并在养老金的计发上对女性给予了一定的补偿和照顾,如将产假视同缴费期等。不过研究表明,类似的做法效果有限,无助于从根本上缩小基于性别因素的养老金待遇差。主要原因在于,出于照顾家庭等因素,女性更容易进入工作弹性较大的非正规就业部门。经合组织的统计表明,在非正规特别是非全日制就业中,女性的占比是男性的3倍;平均每4个在职女性就有1个就职于非全日制部门(见图2)。而非全日制就业的薪资水平普遍较低,按照经合组织的统计数据,非全日制雇员的平均收入比全日制雇员低一半左右。

    低收入叠加缴费时间不足,拉大了女性和男性的退休待遇差。统计表明,2015年,欧盟28国老年女性的平均退休金待遇比男性低四分之一;德国最甚,低40%,这和德国小微就业较多且从业者多为女性有关。2021年,德国女性的平均退休收入仍然比男性低将近三分之一;同年经合组织的报告显示,在全体经合组织成员国中,老年女性的平均贫困率(16.2%)均高于男性(11.6%),只有智利除外(男女几乎持平)。

    (四)法定退休对比提前退休:改革导致不同年龄退休者的养老待遇差

    改革拉大了老年人的退休待遇差,增加了一部分退休者的贫困风险,加剧了老年群体的贫富分化,特别是在养老金市场化程度较高的国家。原因在于,随着法定退休年龄的延长和与之相伴随的领取全额养老金缴费年限的增加,将职业生涯保持到最后一刻、进而获得全额养老金的难度不断加大。法国的研究表明,退休年龄从此前的60岁延至62岁以后,60岁以上劳动者的失业风险上升了7个百分点,且再就业的难度进一步加大。德国左翼政党指出,2008年金融危机以来,能满足全额养老金领取条件(65岁退休并缴费45年)的老年人只占全体老年就业者的20%,如果按计划将退休年龄延至67岁,则势必有更多的老年人失业。

    尽管如前所述,各国出于增收减支目的,纷纷出台措施鼓励老年人就业,但效果并不显著。就业与否归根结底由市场说了算,老年群体无疑缺乏竞争力,最终能否留在就业市场以及能留多久,与老年人自身的年龄、技能、学历、健康状况等息息相关。各国的经验都表明,年龄越大、学历和技能越低、健康状况越差,被劳动力市场淘汰的风险就越高。受劳动力市场青睐的老年人往往是高技能高学历者,而这部分人在任何国家都是少数。与之形成对照的是,占相对多数的低学历低技能的老年人很难将职业生涯维持到退休;对这部分人而言,即使能够继续就业,往往也是辗转在各类低薪、低技能的非正规就业岗位上。经合组织的研究表明,在65—74岁的在职老人中,只有15%在正规就业岗位;德国64岁以上的在职老人中,一半左右在餐饮、零售、家政等行业打零工,薪资微薄。法国针对2010—2015年公共养老金改革的研究也表明,改革对低收入人群和提前退出职场的人负面影响最大,50岁就退出职场的人平均退休金将减少10%。换言之,延迟退休等措施实行后,在劳动力市场的淘汰机制下,对很多人而言,延长的只能是低质低薪的就业,无法从延迟退休中受益。只有少数有良好教育背景的高收入群体才能延长“高薪高质”的就业并从延迟退休中受益。结果是,公共养老金从相对贫困的群体流向了相对富裕的群体。

    综上,退休年龄延长和缴费年限增加使很多无法将职业生涯维持到法定退休年龄的老年人受到负面冲击,进而在社会层面造成老年贫困率上升的恶果。随着问题的显现,一些国家开始反思相关政策并采取了一些补救措施:德国在2014年回调了延长退休的规定,进一步放宽了“提前退休不减扣养老金”的条件;意大利于2018年暂停退休年龄和预期寿命的自动关联,并放宽了对提前退休的限制,允许更多的群体提前退休;荷兰放缓了延迟退休的节奏——将原计划于2021年的延至67岁推迟到2024年,并计划在长期内放慢退休年龄和预期寿命的关联节奏,避免将预期寿命的所有提高都转化为退休年龄的延后;瑞典大约要到2026年才将领取全额养老金的时间调整到64岁。

    (五)低薪对比高薪:改革拉大不同工资水平退休者的养老金差距

    改革导致的公共养老金中缴费与待遇更紧密的关联,以及不具有任何再分配性质的基金制支柱的上升,对低薪者造成了严重的负面冲击。原因在于,一方面,各国的养老金几乎已悉数改为缴费确定型,因此在相同的替代率下,低薪者的养老金水平无疑更低;另一方面,低薪者往往是非正规就业者、自雇者等,难以被企业年金所覆盖,通常也缺乏足够的收入“进场”第三支柱,因此无论在现收现付支柱还是基金制的支柱都处于相对更加弱势的地位,特别是在类似英国那样的市场支柱发达的国家。在“国家保基本、其余人靠市场”的理念下,英国的老年贫困率更高,老年贫富差距更大。根据艾宾浩斯的研究,英国的基础养老金水平太低,只有平均收入的16%,而且需要长时间的缴费,这导致英国的老年贫困率长期在西欧国家排名第一。即便加上私人年金,英国的老年人也在最贫困之列。英国65岁以上极端贫困(即收入不高于国民平均收入中位数的40%)人口数量始终处于升势,所以英国很早就设立了零缴费的救助支柱,并不断提高救助标准。其他国家也大多设立了针对低薪老人的养老救助制度,或针对弱势群体的最低养老金。

    一言以蔽之,养老金改革后,女性、低学历低技能的老年人、60岁以上老年人、非正规就业者、低薪者、自雇者、被迫提前退出劳动力市场的低龄老人等群体,更容易成为改革引发的老年收入分配不公的牺牲品。这些群体通常是重叠的,譬如,一名60岁以上的老人,往往同时是低学历低技能低薪的女性非正规就业者(如家政服务人员、保洁人员、养老院护工等)。一部分人尤其是女性,很可能终身陷在保障水平极不充分的小微就业中,再难回到正规就业岗位。未来养老金水平的个体差异将日益加大。

    四、结语与思考

    由以上分析,我们可初步得出如下结论:养老金制度是个综合性的系统工程,目前普遍使用的三个评价指标,即充足性、完整性(覆盖率)和财政可持续性缺一不可。近三十年来,鉴于养老金的财政可持续性问题突出,欧洲各国纷纷聚焦于改善财政可持续性,通过改革不断降低公共养老金的待遇水平,客观上制造并加强对基金制的需求,进而引进基金制的养老计划,减轻公共养老金的财政负担。在此过程中,各国不同程度地忽略乃至损害了养老金制度的充足性,特别是那些基金制支柱占比较大的国家。

    基金制有其脆弱性的一面,法国、德国建立养老金的历史以及2008年的全球性经济与金融危机都曾不同程度地显现了这一点。2008年的危机还因“凸显了当个人的现金给付与金融市场的波动相关联时,养老金制度所面临的风险”而引发“基金制的养老计划是否适合作为养老保障资金机制的长期辩论”。客观地说,基金制和现收现付制各有利弊,不应盲目否定基金制,也不能否认多支柱的养老金体系在改善养老金财政可持续方面的重要作用。只是这方面的研究已较丰富,基金制的积极作用也已引起世界各国的充分重视。反过来,持续不断的改革对养老金充足性的损害尚未引起普遍关注和充分重视——因为其负面后果的显现需要一定的时间,因此本文着重强调这一点。

    欧洲三十余年的改革实践表明,在提高养老金制度财政可持续性的同时,不能忽略其再分配功能的降低对非正规就业者、自雇者、女性、失业者、低学历低技能者、低薪者等弱势群体的冲击,这些负面结果或许也是各国政府始料未及的。欧洲的经验提醒我们,要尽量客观而全面地认识养老金改革可能带来的消极后果,特别是对上述弱势群体的不利影响,以便未雨绸缪,做好防范或者补救工作。欧洲国家普遍采取了预防或补救措施,一是将病产假、失业、伤残等导致的缴费中断适度视同或折算成缴费。二是在改革的同时建立并加强由财政供款的“零支柱”养老救助制度,为改革后得不到充分保障甚至掉出养老金保障网的弱势群体构筑最后一道防线,这一点业已成为欧洲各国的共识,也是各种老年救助项目未在以增收减支为目标的改革中不减反增的原因。如德国于2020年出台了基础养老金制度(Grundrente),由联邦政府供款为终生工作缴费但法定养老金低于平均水平者提供一份附加养老金,该制度从2021年1月1日起实施,预计受益者将达130万。基础养老金的引入不仅提高了德国法定养老金的“底线水平”,而且缩小了低收入者与高收入者的养老金待遇差。欧洲的改革显示,在某种程度上,公共养老金和老年救助成了跷跷板的两端,当一端的支出因养老金待遇的削减而下降时,另一端的支出就会因贫困人口的增加而上升;一端下降得越快,另一端上升得越多。法国养老金改革后,政府用于失业保险、老年救助的费用有较大幅度的提高,2010年改革中节省出的140亿欧元中,15%用在了额外增加的各种救助上;1996—2013年,意大利公共养老保险支出增长了约79%,而养老救济支出增加了110%;英国每6个退休者中就有一个领取基于家计调查的救助津贴。养老金改革的目的原本是节约资金、减轻国家财政负担,但是贫困率的增加使得用于救助的费用不断提升。三是建立有效的最低收入机制,以应对福利与缴费记录关联的不断强化所导致的不充分不稳定就业者日益加剧的老年贫困风险。

    此外,对各国改革结果的比较研究再次证明了一个“老生常谈”的结论——公共养老金占比高低和老年贫困与收入不平等呈负相关,养老金责任越是从国家向市场转移,养老金制度的再分配性质就越低,减贫效果就越差,老年收入不平等现象就越严重。公共养老金无论何时何地都是预防老年贫困的最有效手段。在市场支柱占比高的国家,很多老年人被迫打零工来弥补养老金不足的现象也充分证明了这一点。

    一言以蔽之,养老金改革是一个随着经济社会和人口结构变化而不断动态调整的过程。即便是已建立现代养老金制度逾半个世纪的老牌欧洲福利国家,仍在不断地摸索改革。理想的养老金制度统筹兼顾充足性、完整性和财政可持续,但充足性和制度可持续之间存在一定的矛盾,这是世界各国普遍面临的难题。此外,没有脱离一国国情的、放之四海皆准的养老金模式;即便在一国之内,也没有放在任何历史时期皆准的模式。各国都应从本国的经济社会现实甚至历史文化传统出发,探索符合本国国情的养老金制度,使之既有能力为尽可能广泛的人口提供尽量充足的老年收入保障,也不超越特定历史阶段的经济财政能力。

  • 焦长权:“部门型”项目管理模式——中央对地方专项资金的分配与管理机制研究

    本文节选自《部门型”项目管理模式——中央对地方专项资金的分配与管理机制研究》,原载《中国研究》第29期。

    中央与地方:财政事权与支出责任

    分税制改革后,中央和地方间逐渐形成了一个极其复杂庞大的财政转移支付体系。但是,由于中国财政转移支付体系是通过渐进性的方式建立起来,尤其是专项转移支付基本都是根据中央政策“一事一议”不断累积起来,具有典型的“打补丁”特征。因此,在分税制改革近20年后,中国虽然已经建立了一个庞大复杂的转移支付体系,但其内部的各种弊病也不断显现,尤其是专项转移支付受到了社会各界的批评。为此,党的十八大后,中央对财政转移支付体系进行了一系列改革,其中的关键是中央和地方财政事权和支出责任改革。

    中央和地方财政事权和支出责任改革涉及财政支出的所有领域,各领域具体情况千差万别,为此中央采取了分领域分别制定具体方案的办法,这首先在基本公共服务领域取得了进展。改革将涉及人民群众基本生活和发展需要、现有管理体制和政策比较清晰、由中央与地方共同承担支出责任、以人员或家庭为补助对象或分配依据、需要优先和重点保障的主要基本公共服务事项,首先纳入中央与地方共同财政事权范围。目前暂定为八大类18项:一是义务教育,包括公用经费保障、免费提供教科书、家庭经济困难学生生活补助、贫困地区学生营养膳食补助4项;二是学生资助,包括中等职业教育国家助学金、中等职业教育免学费补助、普通高中教育国家助学金、普通高中教育免学杂费补助4项;三是基本就业服务,包括基本公共就业服务1项;四是基本养老保险,包括城乡居民基本养老保险补助1项;五是基本医疗保障,包括城乡居民基本医疗保险补助、医疗救助2项;六是基本卫生计生,包括基本公共卫生服务、计划生育扶助保障2项;七是基本生活救助,包括困难群众救助、受灾人员救助、残疾人服务3项;八是基本住房保障,包括城乡保障性安居工程1项。

    18项基本公共服务,被改革确立为典型的中央和地方共同财政事权和支出责任,在支出上由中央与地方按比例分担。具体分担方式如下:

    一是中等职业教育国家助学金、中等职业教育免学费补助、普通高中教育国家助学金、普通高中教育免学杂费补助、城乡居民基本医疗保险补助、基本公共卫生服务、计划生育扶助保障7个事项,实行中央分档分担办法。具体而言:第一档包括内蒙古、广西、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆12个省(区、市),中央分担80%;第二档包括河北、山西、吉林、黑龙江、安徽、江西、河南、湖北、湖南、海南10个省,中央分担60%;第三档包括辽宁、福建、山东3个省,中央分担50%;第四档包括天津、江苏、浙江、广东4个省(市)和大连、宁波、厦门、青岛、深圳5个计划单列市,中央分担30%;第五档包括北京、上海2个直辖市,中央分担10%。

    二是义务教育公用经费保障等6个按比例分担、按项目分担或按标准定额补助的事项,暂按现行政策执行。具体如下:义务教育公用经费保障,中央与地方按比例分担支出责任,第一档为8:2,第二档为6:4,其他为5:5。家庭经济困难学生生活补助,中央与地方按比例分担支出责任,各地区均为5:5,对人口较少民族寄宿生增加安排生活补助所需经费,由中央财政承担。城乡居民基本养老保险补助,中央确定的基础养老金标准部分,中央与地方按比例分担支出责任,中央对第一档和第二档承担全部支出责任,其他为5:5。免费提供教科书,免费提供国家规定课程教科书和免费为小学一年级新生提供正版学生字典所需经费,由中央财政承担;免费提供地方课程教科书所需经费,由地方财政承担。贫困地区学生营养膳食补助,国家试点所需经费,由中央财政承担;地方试点所需经费,由地方财政统筹安排,中央财政给予生均定额奖补。受灾人员救助,对遭受重特大自然灾害的省份,中央财政按规定的补助标准给予适当补助,灾害救助所需其余资金由地方财政承担。

    三是基本公共就业服务、医疗救助、困难群众救助、残疾人服务、城乡保障性安居工程5个事项,中央分担比例主要依据地方财力状况、保障对象数量等因素确定。

    以上改革方案,对十三五时期国家基本公共服务领域的中央和地方财政事权和支出责任进行了初步明确,尤其是对18项民生领域基本公共服务进行了详细规定。国家发改委最新发布的《国家基本公共服务标准(2021年版)》,则对十四五时期国家各项基本公共服务的服务标准、支出责任等进行了明确,进一步规范了中央和地方间在基本公共服务领域中的财政事权和支出责任划分,为完善这一领域的财政转移支付体制奠定了重要基础。

    根据中央的上述划分方案,各省也制定了本省基本公共服务领域省与市县共同财政事权和支出责任划分改革方案,核心就是要明确各项基本公共服务在省内各层级政府间的支出责任。在此基础上,市、县级政府还制定了本辖区的相关方案,由于相关支出责任已经基本明确,市县级方案更主要聚焦于更细致的组织实施方案。

    至此,我们简略勾勒了国家以18项基本公共服务为重点,开展中央和地方共同财政事权和支出责任改革的基本做法,它涉及中央、省、市、县等各个层级,并覆盖了诸多政府部门,是改革中央和地方关系,尤其是规范中央和地方间转移支付的关键环节。这18项基本公共服务,代表了国家公共支出在民生和公共服务领域的典型特点,即大量支出最终都按照一定标准补助到了个人和家庭,因此只要明确了各层级政府的分担比例,就很容易通过公式精确的预算和分配,并最终落实到政策主体。

    除基本公共服务领域外,过去几年,中央先后在诸多不同领域展开了财政事权和支出责任改革,比如先后发布了教育、医疗卫生等领域的具体改革方案。根据前财政部部长楼继伟的介绍,十八大以后,截止2018年4月,党中央、国务院出台的重要文件中,涉及政府间事权和支出责任划分的共50件,涵盖经济体制、生态环保、市场监管、民生保障、政法、国防、外交等多个领域。其中,15件明确界定了相关领域中央和地方的事权和支出责任范围,包括人民防空、金融监管、环保监察、司法管辖、内贸流通、优抚安置、外交、外援、海域海岛管理等方面。但总体而言,我国中央和地方间财政事权与支出责任改革仍然还有很长路要走,许多改革文件方案并未实现像基本公共服务领域那样明确划分财政事权与支出责任,不少方案以“按照中央和地方事权划分,明确各级政府支出责任”的原则表述代替了具体划分。

    专项转移支付的分配方式

    在前述财政事权和支出责任划分框架下,中央和地方间财政转移支付体系也要同步改革。基本原则和要求是:属于中央事权的,原则上应通过中央本级支出安排,由中央直接实施;随着中央委托事权和支出责任的上收,应提高中央直接履行事权安排支出的比重,减少委托地方实施的专项转移支付。属于中央地方共同事权的,中央分担部分通过专项转移支付委托地方实施。属于地方事权的,由地方承担支出责任,中央主要通过一般性转移支付给予支持;少量的引导类、救济类、应急类事务通过专项转移支付予以支持,以实现特定政策目标。

    2019年开始,财政部在转移支付预决算中,将中央和地方共同事权转移支付作为一个新的类别列入一般性转移支付中,资金规模占转移支付总量的43%。其实,共同事权转移支付也是一种典型的具有明确资金用途和支出标准的专项资金,和美国等西方国家在社会性支出中采取的专项转移支付非常相似。在中国,由于一段时期内专项转移支付的设立、分配和管理不规范,引来了社会各界的大量批评,使中央在政策上尽力压缩专项转移支付,才有了共同事权转移支付这一类别,它本质上只是专项转移支付的一种新形式。在中央大规模压缩、整合和规范专项转移支付的情况下,传统专项转移支付的规模大大缩小,2019年占转移支付总额的比重仅10%。但是,一般性转移支付中仍然有大量资金具有明确的指定用途。比如,2019年,一般性转移支付中真正没有指定用途,地方政府可统筹安排的均衡性转移支付只有15632亿元,占转移支付总量的比重仅21%。

    可见,即使在中央极力压缩专项转移支付的情况下,具有明确指定用途的资金仍然占转移支付的绝对主体,他们本质上都是专项转移支付。为何如此?主要原因在于:一方面,中国社会经济发展高度不平衡,同时又是一个特别强调全体人民逐渐实现共同富裕的社会主义国家。因此,这客观要求中央政府承担大量的宏观经济稳定、社会再分配等职能,而且随着社会经济发展,这些职能日益丰富和凸显。另一方面,与世界其他国家相比,中国中央政府的组织规模显著偏小,中央政府公务员占全国公务员总量的比重处于极低水平。这客观上造成中央政府没有能力直接组织实施许多事项和履行职能,只能将不少职能委托给地方政府行使,为了确保地方政府在履行这些职能时严格体现中央政策意图,又不得不采取专项转移支付的形式。

    目前,我国的大量中央和地方共同事权,及由此产生的共同事权转移支付,本质上都与此相关。这就必然导致两个密切相关的结果:一是中央政府本级支出占全部财政支出比重极低,近年已经下降到15%左右,这在全世界也是极低水平,这表明中央政府直接履行和实施的事权规模很小。二是中央和地方各级政府职能高度同构,“上下一般粗”。所谓“上下一般粗”是指除国防、外交等明显中央政府职能外,中央和地方各级政府在职能上高度同构,各自的主要职能事权划分不清晰,同一事权多层级政府共同参与,共同事权泛滥、行政效率偏低,背后的重要原因之一是中央政府缺乏直接履行大量事权的组织能力。因此,本质上讲,大量中央和地方共同事权实际上是中央事权委托给地方行使,共同事权转移支付只是专项转移支付的一种新形式。

    可见,分税制以来,尤其是进入新世纪后,专项转移支付在中国财政转移支付体系中的普遍采用,就不简单是政策选择的结果,而是有更深层的结构性原因。正是因此,虽然十八大以来中央一直尝试以各种方式规范整合专项转移支付,但专项转移支付仍然是财政转移支付的主体。更深层来看,既然在目前中央和地方关系中,专项转移支付的大规模存在有其内在必然性,因此与其仅仅从政策选择上对专项转移支付展开批评,或者仅仅从形式上对其进行更名换姓式的表面整治,还不如深入探讨如何对专项转移支付展开更为规范化的分配管理,这是更加实质性的问题。

    根据资金性质和具体用途,中国专项转移支付在自上而下分配过程中,一般采取因素法、项目法,以及因素与项目法相结合等分配方法。所谓因素法,就是在分配专项转移支付过程中根据各种客观因素并制定权重,设计一个分配公式,并据此对各地区分配专项转移支付。

    在具体执行中,专项转移支付在不同层级政府中也可能采取不同分配方式,典型的有以下几种组合:(1)“中央因素法、地方项目法”模式。即中央财政采用因素法确定各省专项资金规模,地方政府则需要通过项目法将资金落实到具体项目并组织实施,这里运用项目法的地方政府,既可能是省级政府,也可能是更低层级的地市级基层政府。(2)“中央因素法、地方因素法”模式。即中央和地方均采取因素法层层向下分配资金。(3)“中央因素法、地方自主”模式。即中央采取因素法分配确定各省资金规模,各省相关部门自行安排地方分配方法。

    “因素法”分配,本质上是一种资金指标分配方式。即中央主管部门并不负责将财政资金明确分配到可组织实施的具体项目,他们只负责资金指标的分配,将财政资金切块分配下去,由地方政府部门负责分配到具体项目。形象的看,专项转移支付在地方和基层由资金指标到具体项目的转化,就像一束聚焦的灯光突然散射出去一般,每个县市每年获得的数百项资金指标都会在基层细化为成千上万的具体项目。比如,一个典型的例子就是,中西部农村低保项目,项目资金基本都主要来自于中央财政转移支付,但中央部门向下分配时都是按照一定因素分配资金指标,这一直要分配到乡村两级基层政府和组织,才能最终确立到具体项目对象。

    因素法也是发达国家分配专项转移支付的主要方法。比如,美国是没有一般性转移支付的国家,他的许多专项转移支付具有一定的均衡性功能(尤其是直接对公民的转移支付项目),但他的大部分专项转移支付都采取因素法来分配。在联邦政府对州和地方政府的财政补助中,有三分之二是以现金或实物的形式发放给了符合条件的个人。运用公式性的因素法分配转移支付,基本成了现代转移支付体制最主要的共同特征,即无论是专项转移支付还是一般性转移支付,中央政府都倾向于用事先确立的公式向地方政府分配财政资金。

    专项转移支付采取项目法分配的,主要是对“用于国家重大工程、跨地区跨流域的投资项目以及外部性强的重点项目”。按照项目法分配的项目都要求实行项目库管理,明确项目申报主体、申报范围和申报条件,规范项目申报流程,发挥专业组织和专家的作用,完善监督制衡机制。学界通常对项目制所连带的申请申报、评估评审、监督检查等一系列复杂程序的批评,最典型的就表现在以项目法分配专项转移支付的过程中。项目法分配具有典型的“一事一议”特征,需要上下级政府以及不同部门间反复的协商论证,经常还伴随着一定的竞争性特征。因此,项目法分配经常导致项目预算分配周期漫长,资金支出进度和效率偏低,也容易滋生寻租腐败,是改革和完善专项转移支付分配过程的重点和难点。

    专项转移支付的不同分配方式具有不同的特征。“因素法”的优点是分配依据客观变量,结果相对公平,行政成本较低,行政效率较高,资金预算安排周期短,一般能够在预算批复后很快下拨给下级政府;其缺陷是资金针对性不强,资金拨付方对接收方的控制权较弱。“项目法”则相反,上级政府对项目资金具有很强的控制权,资金针对性也更强,但分配过程中的主观性和“寻租空间”更大,行政成本更高,行政效率较低,预算安排周期长。

    实际上,专项转移支付具体采用什么分配方式,主要与财政资金的支出功能有关。总体来看,对于教育、医疗、社会保障等典型的民生支出,其中很大部分最终会直接补助到个人或家庭,在西方国家称为“权利性支出”,因此比较容易用因素法展开分配。比如,以18项基本公共服务为代表的公共服务支出,由于具有明确的支出标准,最终很大部分也是补助到个人和家庭,因此就能够顺利用因素法在各级政府间分担。与之相反,基础设施建设、产业政策发展等经济事务支出,基本都得用项目法分配,尤其是“国家重大工程、跨地区跨流域的投资项目以及外部性强的重点项目”,必然按项目法分配。

    国家公共支出结构则与经济发展阶段密切相关。诸多经济史家的研究一致发现:在工业化和城市化的早中期阶段,国家公共支出必须履行大量公共投资职能,在基础设施建设(交通、道路等)等方面投入大量资本,当经济发展进入成熟阶段后,公共支出的主要方向才会转向教育、医疗、社保等社会服务领域。中国当前仍然处于从中高收入国家迈向高收入国家的关键阶段,国家工业化、城镇化过程中还有大量基础设施、产业政策短板需要弥补,因此公共支出中仍然会有较大量的经济事务支出,而典型西方发达国家公共支出则以社会保障等社会性支出为主体,只有极少量的经济事务支出。同时,即使是教育、医疗、社会保障等社会性支出领域,目前在中国也有不小比例是基础设施建设等资本性支出,而不同于这一领域通常的维持型支出(工资福利、办公经费等)。改革开放以来,虽然中国公共支出中经济事务支出比例逐渐下降,民生和公共服务支出比重逐渐上升,但目前仍然是一个经济事务与民生支出的“双强格局”,经济事务支出仍然占据重要位置,这在短期内还不会发生根本性的变化。

    因此,专项转移支付的分配方法才是最根本的,而这又与公共支出结构密切有关。当前,从中国专项转移支付的构成来看,它也基本是一个经济事务和民生支出的“双强格局”,近年来民生支出扮演的角色越来越重要。公共支出结构的逐渐变化,尤其是专项转移支付支出结构的变化,给进一步规范完善转移支付提供了可能,我国之所以在分税制改革20多年后才系统性地清晰划分和界定中央和地方财政事权与支出责任,也与中国公共支出结构的这一演变历程直接相关。

    “部门型”项目管理模式

    那么,自上而下的专项资金的分配具体如何实现?这就涉及专项资金的管理模式问题。实际上,无论是中央还是地方各层级政府设立的诸多项目,包括专项转移支付、非转移性项目支出、以及地方本级部门预算中的项目支出等,都是由不同政府部门来主要负责分配管理,进而形成了一种“部门型”项目管理模式。自上而下的专项资金,在资金分配和管理过程中,长时期是在各层级政府部门内部相对封闭运行,一直要到最终组织实施的层级,才在该层级政府的统筹下,由主管部门和基层政府协调组织实施。

    以中央对地方专项转移支付为例。在资金管理分配过程中,由于大多数专项转移支付都涉及到一些领域非常专业的知识和信息,财政部没有能力单独完成相关信息收集和核实评审,因此各类专项转移支付都根据业务性质划归到了不同政府部门主管。财政部和这些部门互相配合,共同完成资金分配和管理。比如,2013年,中央对地方专项转移支付多达220项,资金管理涉及56个部门;2014年,中央对地方专项转移支付共133个,实际执行中安排明细专项362个,审计署抽查的343个明细专项有43个部门参与分配。总体而言,绝大多数专项转移支付都是财政部门和主管部门共同管理的“共管资金”,只有极少数是由财政部门单独管理。

    因此,凡是参与主管中央对地方专项转移支付资金的中央部门,它实质上都拥有两类专项资金:一是中央本级部门预算中的项目支出,二是主管分配的专项转移支付。发改委等具有二次预算分配权的单位,在资金分配上的自主性更大,一方面,财政部将中央基础设施建设资金整体切块给发改委,由它进行二次分配,它就具有了“小财政部”的特征;另一方面,中央对地方专项转移支付中的基础设施建设资金,也归口到发改委管理,它在项目分配上也具有很大的决定权,这属于一种特殊性质的“共管资金”。

    从专项转移支付的设立申报审批过程来看。中央专项转移支付,都承载了一些重要政策目标,因此它一般由国务院根据相关重要社会经济发展战略和政策设立,再由相关部门代表中央负责具体管理,财政部和其他政府部门无权自行设立专项转移支付。尤其是近年来中央大大加强了对专项转移支付的规范整合,原则上不再新设专项转移支付,确因经济社会发展需要新设立的专项,要求有明确的政策依据和政策目标,并需报国务院批准。专项转移支付的申报审批,一般按照以下程序:(1)一般由中央主管部门发布申报通知或年度立项指南;(2)地方和基层相应政府部门组织项目申报,将相关申报材料汇总报送中央主管部门;(3)中央主管部门单独或会同财政部门对申报项目展开资料审核、项目评审等工作,确立资金分配方案;(4)中央主管部门会同财政部门联合下达项目计划和资金指标。

    因此,自上而下的专项转移支付,就类似于在封闭管道中流动的水流,中央政府一次性给各条管道注入了大量资金,资金达到省级后,省级部门有可能会取出少量资金在本级直接支出,但大部分资金则会由省级部门进一步细化分流导入到各个县、市主管部门的资金渠道。省级部门在向下细分专项转移支付时,会加上自身的政策意图,即根据自身的政策偏好和资金管理要求,将资金细分到县市一级政府部门。不仅如此,省级政府一般还会在这个过程进行一轮注资,结果省级部门向下下达的专项转移支付,除了中央对省级下达的部分外,还包括省级财政另外增加的对市、县的专项转移支付。这既包括省级政府按照要求对中央某些专项转移支付的地方配套,也包括省级政府根据本省工作计划另外设立的专项转移支付。

    与专项转移支付不同,在中央本级部门预算的项目支出分配过程中,政府部门会发挥更大的主导作用,因此又被称为“部门资金”。之所以如此,是因为这些项目支出的分配,专业性和政策性一般比专项转移支付更强,而且由于本身就属于中央部门支出,因此会更直接清晰的体现部门政策意图。近年来,随着中央对专项转移支付合并整合,以及进一步改革和规范中央与地方间财政事权和支出责任,中央专项转移支付也大幅指向了民生领域,“因素法”分配的比重明显扩大,因此专项转移支付分配中的规范性显著增强,主管部门的随意性明显减弱。但是,中央本级部门预算的项目支出,在具体项目确定和分配过程中,政策性和专业性都很强,基本都是“一事一议”的项目法,因此政府部门的主导性还是非常明显。

    中央部门预算中的项目支出,有些项目会由中央部门直接组织实施,但也有不少项目会在地方省市区具体组织实施。在这个过程中,很多时候就需要通过与专项转移支付相似的程序展开项目申报评审,而且这些项目基本都是“国家重大工程、跨地区跨流域的投资项目以及外部性强的重点项目”,因此评审过程更加严谨复杂。但在项目确立以后,项目在地方的组织实施管理过程,则与专项转移支付基本一致。正是这种相似性,使一些项目到底该列为中央本级项目支出,还是确定为中央对地方专项转移支付,就不容易明确区分。

    实际上,在中央对地方财政转移支付的改革完善过程中,如何明确区分中央部门直接项目支出和中央对地方专项转移支付,一直是一个难点。在目前的中央和地方间财政体制下,中央对地方专项转移支付有以下几种情况。(1)中央财政事权,中央安排专项转移支付委托地方行使;(2)中央和地方共同财政事权,中央分担部分通过专项转移支付委托地方实施;(3)地方财政事权,中央为实现特定目标,安排少量的引导类、救济类、应急类专项转移支付予以支持。前文已指出,目前共同事权转移支付成了中央与地方间专项转移支付的主体部分。

    那么,在财政预算管理过程中,如何明确区分一些事项到底是中央对地方专项转移支付还是中央部门直接项目支出呢?其关键在于区分这一项目支出是由中央直接组织实施,还是委托给地方组织实施。

    中央明确要求:属于中央事权的,原则上应通过中央本级支出安排,由中央直接实施;随着中央委托事权和支出责任的上收,应提高中央直接履行事权安排支出的比重,相应减少委托地方实施的专项转移支付;属于中央地方共同事权的,中央分担部分通过专项转移支付委托地方实施。但是,在实际预算管理过程中,仍然会时不时出现将二者部分混淆的情况。比如,2019年,在预算执行过程中,中央对地方专项转移支付中有基建支出等6个大项出现了实施主体发生变化,部分资金由对地方转移支付转列为中央本级支出,其中基建支出涉及金额约60亿元;可再生能源发展专项资金由地方实施的只占预算的66.7%,其余部分基本都转为由中央本级直接组织实施。同时,2019年共有农田建设补助资金等7个大项的共同财政事权转移支付中有部分资金被转列为中央本级支出。虽然这种预算执行中实施主体调整涉及的资金规模并不算大,但仍然反映出如何明确区分中央本级支出与对地方专项转移支付的难点。

    比专项转移支付转为中央本级支出要更为隐蔽的,是中央本级支出直接或间接的委托给地方政府组织实施。这种情况有直接明确的案例,比如,2019年中央对地方专项转移支付中的工业转型升级资金,在实际执行中就超出预算约10亿元,其原因就在于部分资金由中央本级明确转为对地方转移支付,即实施主体由中央部门委托给了地方政府。但这更多是间接隐蔽的,即这些财政资金从预决算上都是中央本级项目支出,但在具体组织实施中,却变相委托给了地方组织实施。这种情况非常隐蔽,很难清晰揭示出来,但应该说在中国政府运行中并不少见。背后的本质问题仍然是,本来应该由中央政府直接履行和组织实施的中央事权,在财政预算上也将财政资金明确给了有关部门,但由于相关部门组织规模不足等原因无法直接组织实施项目,进而不得不将项目委托给地方组织实施。在这种情况下,中央部门的直接项目支出,和中央对地方专项转移支付已经没有实质差异,本质上成了中央事权委托地方执行。

    对地方政府而言,无论是中央专项转移支付,还是中央部门直接项目支出,都是上级政府对本地的项目支持,也都需要地方政府向中央和上级进行争取。在专项转移支付中则主要争取项目法分配的项目,因素法分配的项目有些因素也与地方政府履职的积极性或绩效相关。对中央部门直接项目支出,也需要争取更多中央直接项目落地到本辖区;尤其是一些重大基础设施建设,经常由中央部门直接组织实施,但对地方发展而言却是命脉工程,因此地方尤其重视。

    中央对地方专项资金,主要就包括专项转移支付和中央部门预算中的项目支出两大块。同样,省级政府对县市级政府的项目资金,也主要由这两块组成,其具体分配管理机制,也与中央到省级之间类似。从实践来看,这些专项资金,都由相关主管部门负责管理分配,并在上下级相应部门之间相对封闭的运行,一直到其最终的组织实施部门。这就是学界所说的项目制这一国家治理体制的主要形态,即在中央和地方、上级和下级间的政府部门中相对封闭运行,最终汇聚到基层政府统筹实施的各类项目。

    这种以部门为主要管理和运行单位的项目制,可以称之为“部门型”项目管理模式。西方国家曾经采用过的项目预算(或计划-项目预算)是以跨部门的项目为中心,尝试彻底重构政府的治理模式;而中国的项目支出预算,则仍然是以政府部门为基础,是在政府部门统筹管理分配的项目制,因此可以称为“部门型”项目管理模式。

    项目制之所以采用“部门型”项目管理模式,主要是为了确保专项资金的使用方向和资金安全。由于项目资金要经过多层级政府才能最终达到项目落点或实施主体,为防止各层级政府雁过拔毛或腾挪转移,中央就直接刚性确定了资金用途和流通渠道,这无论在中央部门直接项目支出还是中央对地方专项转移支付中都是如此。这种层层规范化、程序化和相对封闭化的部门管理,是一种典型的理性化、技术化治理模式,国家希望通过这种方式,实现中央和上级政府的政策意图,并确保资金运行安全。

    “部门型”项目管理模式的影响

    项目制所采用的“部门型”项目管理模式,也蕴藏着诸多内生的不足,最典型的包括以下两方面。

    一是财政资金的“部门化”和“碎片化”。这种相对封闭的“部门型”项目管理模式,不可避免的导致财政资金的“部门化”和“碎片化”。具体实践中,不仅同一类型和用途的专项资金被切割到许多主管部门分别掌握,就是在同一个部门内部,一项专项资金也被分割成了很多细小专项分别由不同二级部门掌握,一直要细化和明确到主管部门内的基层行政单位,中央、省级部门就明确到了处(室),地市级细化到科(室),县级则分割到股(室)。这就是中央政府部门专项资金管理过程中反复出现的“司处化”和“碎片化”问题。

    党的十八大以来,中央对专项转移支付改革的一个重点,就是整合规范专项转移支付的“碎片化”问题。改革要求将“目标接近、资金投入方向类同、资金管理方式相近的项目予以整合,严格控制同一方向或领域的专项数量”;同时在资金管理中,特别强调“每一个专项转移支付都有且只有一个资金管理办法,对一个专项有多个资金管理办法的,要进行整合归并,不得变相增设专项”;“资金管理办法要明确政策目标、部门职责分工、资金补助对象、资金使用范围、资金分配办法等内容,逐步达到分配主体统一、分配办法一致、申报审批程序唯一等要求”。之所以如此要求,就是原来专项转移支付管理分配中,出现了大量的“大项套小项”,即一个大的专项转移支付,在实际执行中被主管部门再次分割成了诸多明细专项,由部门内部不同二级单位负责管理,导致一个大的专项转移支付,出现了不同的分配主体、不同分配办法、不同申报审批程序等情况,这实际上是变相增设专项。

    但是,从实践来看,项目整合仍然面临很大挑战。以2014年为例,虽然中央在专项转移支付项目上由2013年的220个压减到了133个,完成了政府工作报告提出的减少1/3专项转移支付项目的目标。但是实际执行中却又安排明细专项362个,审计署抽查的343个明细专项有43个部门参与分配,涉及123个司局、209个处室。其中,农业部就参与分配4个大项(共18个子项),“公共卫生服务补助”专项则细分为21个明细专项,其中卫计委疾病预防控制局有10个处参与13个明细专项的分配。显然,实际执行中并未有效实现专项整合的目标,专项资金的“碎片化”“司处化”问题仍然严重。

    实际上,这是精密理性科层制的科层分工逻辑的必然结果,它一方面强调明确具体的科层分工,因此要将专项资金细分到部门内的基层行政单位才能明确权责关系。因此一个专项转移支付被划归政府部门主管后,一定要落实到部门内的最基层行政单元。同时,在这个过程中还需要处理和面对政府部门内部各部门间微妙的权责平衡,如果一项专项转移支付数额巨大,若在一个中央部门中完全由一个二级部门掌握,则形成了各部门间权力-资源的严重不平衡,为平衡部门内部的权责关系,则几乎必然将大专项在部门内部切分为小专项,由不同二级部门分别管理,结果就造成了“大项套小项”。但是,从功能和用途来看,这又要求同一用途的专项资金不能过度细分,它既不利于专项转移支付的分配管理,也不利于项目在地方和基层的组织实施。

    财政资金的“部门化”和“碎片化”也明显冲击了各级政府财政预算分配权的统一。从专项转移支付的分配管理来看,虽然是财政部门和业务部门共同管理,但由于专项转移支付涉及类型和领域繁多,财政部门缺乏相关领域的专业信息和业务知识,因此业务部门在这个过程中就拥有了很大的控制权。尤其是,除部分民生支出外,目前专项转移支付中仍然有大量资金需通过“项目法”分配,这进一步扩大了业务部门对资金的分配管理权限。若是主要采用“因素法”分配,业务部门只需要负责收集审核相关客观性因素指标信息,再汇总到财政部门统一完成资金拨付。若是采用“项目法”分配,则需要依赖业务部门组织复杂的项目申报评审,实际上是赋予了业务部门二次预算分配权,像发改委等本来就拥有二次预算分配权的单位就更甚,这直接冲击了各级政府财政部门预算分配权的统一。

    二是财政支出进度慢和效率低。中国大规模的自上而下的专项转移支付,在主管部门层层规范化、程序化的管理过程中,在很大程度上造成了支出进度缓慢和效率低下。在很长时间内,由于大规模专项转移支付主要依赖项目法分配,审批权也集中在中央部门,导致年初预算时大量专项转移支付无法明确到具体地区和项目,需要等年中预算执行时进行细化分配。结果,大量专项转移支付资金都堆积到下半年才能拨付支出,甚至造成大规模的资金结转结余。专项转移支付到达地方政府后,也还需要再经过层层审批分配,进而在各层级政府中长时间“滞留”,导致其最终到达基层政府的时间太晚,严重影响资金支出进度和效率。

    最近几年,中央一方面要求各层级政府要加快专项资金审批和拨付进度,减少资金在中间层级政府的“滞留”时间。中央明确指出:除据实结算等特殊项目可以分期下达预算或者先预付后结算外,中央对地方一般性转移支付在全国人大批准预算后30日内下达,专项转移支付在90日内下达。省级政府接到中央转移支付后,应在30日内正式下达到本行政区域县级以上各级政府。但实际上,中央财政资金达到地方各层级政府后,往往还是难以按照规定时间快速下达。为此,自2020年起,中央又推出了项目资金的“直达”模式,即中央下达的部分专项资金直达到县、市基层政府,以提高资金支出进度和效率。中央“直达”资金按照“中央切块、省级细化、备案同意、快速直达”的管理和分配机制,重点用于保民生、保就业、保市场主体方面,2020年资金规模达1.7万亿,2021年达到了2.8万亿。截至2021年5月,中央下达直达资金2.579万亿元,下达比例92.1%;省级财政已分配下达2.362万亿元,达到了中央财政下达的91.6%。其中,按照有关规定,省本级使用了0.869万亿元,下达市县1.493万亿元,市县财政接到上面直达资金指标后,已将1.428万亿元分配到资金使用单位,达到省级下达的95.6%。显然,财政直达资金机制确实有效提高了资金支出进度和效率,但是它能使用的范围仍然有限,主要还是限于那些能够直接补助到个人、家庭和企业的支出项目。其他大量专项转移支付,仍然面临着支出进度和支出效率的考验。

    但是,需要特别指出的是,项目制这种“部门型”项目管理模式的一些弊病,在一定程度上具有内生性和结构性,我们不能期待简单通过政策改革来毕其功于一役。比如,中国的公共支出结构,就在很大程度上影响专项转移支付的分配管理方式,但它却是由中国社会经济发展模式和发展阶段决定的,不可能在短期内随政策改革而发生根本性的变化。又如,中国中央和地方政府的组织规模也是由新中国成立后长期历史演变所形成的,中央政府组织规模偏小的结构特征也很难在短期内发生大的变化。一旦深入到这些结构性层面,就提醒我们既要充分认识到项目制及其管理模式的弊病,也要对相关制度变革和结构变迁保持必要的历史耐心。

    结论与讨论

    分税制改革后,国家财政汲取效率明显上升,中央政府财政能力显著增强。在世纪之交,两方面因素共同作用,推动了项目制的形成。一方面,中央大力推动了公共预算体制改革,各级政府形成了以部门预算为基础、项目支出为核心的公共预算体制,这直接推动了各级政府公共支出的“项目化”。另一方面,随着中央财政能力实质强化,中央在平衡区域发展差异、引导地方政策导向等方面发挥的主导作用日益强化,专项转移支付成了一个最主要的政策工具。中央专项转移支付和各级政府的部门预算体制互相组合形塑,形成了项目制这一新型国家治理体制。

    可见,项目制是在分税制改革后,尤其是新世纪以来二十多年的国家治理变迁中逐渐形成的,它不是简单的国家政策选择的结果,而是由中央和地方关系等诸多结构性因素塑造的。首先,中国作为一个广土众民的国家,其社会经济发展存在严重的不平衡问题,这在区域、城乡和人群间都有多方面表现。新中国成立以来七十多年的治理理念和实践,又赋予了共同富裕以特殊的正当性,因此中央政府在中国承担着巨大的均衡地区、城乡和人群间发展差距的责任,即不可避免的要承担大量的再分配职能。其次,由于中国中央政府组织规模偏小,中央本级直接支出占比也很小,大量中央事权、中央和地方共同事权,不得不直接或间接委托给地方政府具体执行。这些委托事权或共同事权,在执行中还必须体现中央政策意图,这使得大规模专项转移支付就基本不可避免,同时还产生了部分中央直接项目支出变相委托给地方执行的情况。再者,中国从计划经济向市场经济转型后,一直到目前为止,中国公共支出结构仍然是一个民生支出和经济事务支出的“双强格局”,经济事务支出规模大,使得公共支出的预算难度大大增加,尤其是中央到地方转移支付中的经济事务支出,预算和分配难度更大,进而使项目法成了专项转移支付分配中的一个重要方法,这也是滋生项目制诸种弊端的关键因素之一。

    项目制采用了一种“部门型”项目管理模式,这是在中央对地方大规模转移支付实施20余年,以及国家公共预算改革推行20余年的过程中,逐步摸索形成的。党的十八大以后,中央以厘清中央和地方间财政事权和支出责任划分为核心,进一步从理论和制度上对财政转移支付体制进行了改革完善,但并未有意推翻和改变已有的“部门型”项目管理模式,而是进一步完善规范了这一模式。总体来看,“部门型”项目管理模式虽然在后续改革过程中可能还会进一步调整,但其基本框架、核心精神应该说已经基本定型。

    当前,从国家治理的角度看,自上而下的专项资金是项目制的一个关键部分,也是“部门型”项目管理模式的典型代表。在这种管理模式下,项目根据中央和上级政府的政策意图,在自上而下的部门内部相对封闭的流动和管理,一直到项目组织实施的基层政府。中央试图通过规范化、技术化的项目管理模式,将自身的政策意图跨层级的传递到地方和基层,甚至直接对接到最终的项目主体,大量直接补助到个人和家庭的民生支出就是典型例子。这种从中央跨越多个中间层级政府,直接将政策意图传递和明确到基层甚至最终政策目标群体的做法,明显超越了中国多层级政府结构中下管一级的常态治理模式,确实在一定程度上重新塑造了中央和地方间关系。同时为了确保上述政策意图的实现,中央强化了专项资金在各层级政府部门流动和管理过程中的监控,以防止资金跑冒滴漏,最大限度确保资金安全。也正是因为专项资金要“艰难”地越过多层级政府,要不断承载中央到地方各层级政府相关主体的多种意图,这就必然造成了专项资金分配和支出过程中的碎片化和低效率。

    但是,自上而下的项目制形态,在通过漫长的相对封闭运行越过多个中间层级后,它的最终组织实施,还得依赖地方和基层政府的统筹协调。也就是说,它还得必须通过基层政府与地方社会相结合,并与基层政府自身的公共预算相融汇,最终由地方和基层政府对这些上级各条线下达的多样化项目进行重新排列组合和落地实施。在项目制的组织实施过程中,已经形成了“以县为主”的格局,县级政府扮演着枢纽性的角色。因此,如何从政府内部,深入分析和揭示项目制在县级政府内部的重新排列组合过程和机制,是项目制研究亟需解决的难点。

  • 白营 等:权力之网:精英网络如何塑造中国的战争和政治

    原文信息:Bai, Ying, Ruixue Jia, and Jiaojiao Yang. “Web of Power: How Elite Networks Shaped War and Politics in China.” The Quarterly Journal of Economics (2022).

  • 陈熙:延续香火的理想与普遍绝嗣的现实—基于家谱的人口数据

    摘要:延续香火、传宗接代(本文所讨论的传嗣、绝嗣、传宗接代等皆以男性后代为判断标准,这符合中国历史的传统。在历史上尽管也有女性作为继承人的现象存在, 但是在传统观念和实际中,绝大多数都是以是否有男性后代作为是否绝嗣的判断标准)是传统社会人们的普遍愿望和理想,然而,由于传统时代人口的高死亡率和极短的预期寿命, 延续香火的理想对于大多数人来说难以实现, 绝嗣现象普遍存在。 本文依据家谱的人口信息, 通过构建虚拟的家族支脉,考察了清代两百余年间家族支脉的繁衍状况。 结果显示,仅有13.61%的人在经历了两百余年的生存竞争后, 能够拥有自己的后代, 而其他大多数都已绝嗣,传嗣的理想和现实之间存在巨大的落差。

    一、引言

    “不孝有三 , 无后为大 。” 孟子的这句话典型反映了传统社会对家族延续的强烈愿望与伦理要求, 传宗接代成为人生中最重要的使命。 费孝通曾指出, 延续 “香火” 的观念深入民间, 是中国社会最重要的信念 (费孝通,1982)。 然而这一理想在现实中究竟多大程度上能够被实现, 却鲜有实证性的证据。 明清以后民间编修了大量的家谱, 清晰地记载了家族人口的繁衍过程, 包括个人的生卒年月和亲属关系等, 这就为研究人口繁衍和香火延续问题提供了最有效的资料。

    尽管清代人口出现了爆炸性的增长, 从康熙十八年 (1679) 的 1.6 亿增加到宣统二年 (1910)的 4.36 亿 (曹树基, 2001), 但人口的死亡率仍然居高不下, 预期寿命也非常低, 人口再生产依然是处于传统的高出生、 高死亡的状态, 出生预期寿命可能低于 30 岁 (Zhao, 2000)。 根据家谱资料的研究结果显示, 18 世纪十五岁男子的人均预期寿命仅有 35-38 岁 (Yuan I-Chin, 1931; 刘翠溶, 1992; 侯杨方, 2000)。 李中清等根据辽宁户籍登记资料发现, 清朝 1-5 岁年龄组男性人口的预期寿命是 35.9 岁, 女性是 29 岁 (James Lee & Cameron Campbell, 1997)。 到了 1920 年代,中国农村人口的出生预期寿命也仅仅为 24.2 岁 (Barclay, G.W., A.J. Coale, M.A. Stoto and T.J.Trussell , 1976)。 根据寇尔-德曼的模型生命表 , 在出生预期寿命为 30 岁的情况下 , 40%的人会在 10 岁前死亡, 50%的人在 20 岁前死亡 (Coale and Demeny, 1983), 这意味着近半数的人在进入婚姻状态之前就死去, 无法完成传宗接代的使命。

    清代的婴幼儿死亡率估计较为困难, 但总体上期间婴幼儿死亡率处于很高的水平。 由于清代皇室族谱对女儿和早殇儿童的登记较为完备, 李中清等对皇室族谱的研究显示, 清代婴幼儿的死亡率为 100-400‰ (James Lee, Wang Feng, Cameron Campbell, 1994)。 而在 1774-1873 年间辽宁农村孩子中 (1-5 岁), 女孩死亡率为 316‰, 男孩为 266‰ (李中清、 王丰, 2000)。 民国以后区域性的人口调查增多, 20 世纪三十年代许士廉估计婴幼儿的死亡率在 250‰左右 (许士廉,1930)。 四十年代初, 呈贡男性婴儿死亡率为 212.1‰, 女性为 211.1‰ (陈达, 1981)。

    早婚被认为是中国历史人口的一个重要特征, 但是最近的一些研究表明, 仅仅是女性早婚,而男性有不少人是在 30、 40 岁才结婚, 超过 5%的男性甚至终生未婚 (李中清、 王丰, 2000),受高死亡率影响, 丧偶发生的可能性很高, 这都会对生育后代产生消极影响。

    已有的历史人口学研究表明, 尽管具体的数值有所差异, 但在清代以至民国, 中国人口的死亡率处在一个很高的水平, 婴幼儿死亡率尤其高, 人口的预期寿命短暂。 在高死亡率面前,传嗣的难度大大增加, 延续香火的理想与人口高死亡率之间发生了明显的冲突。

    清代人口总量快速增长和极低的预期寿命这两个宏观层面的特征, 似乎同时作用于微观家族人口的繁衍上。 通过观察家谱的世系图很容易发现, 家族中有些支脉拥有数量庞大的后代, 人口数量快速增加, 而有些支脉则人丁稀少, 逐渐绝嗣。 人口繁衍的机会在各个支脉之间并非均等分布。 在人口总量的快速增长的同时, 绝嗣现象却普遍地发生, 这两个看似相互矛盾的现象, 让我们推出这样的假设: 即清末规模庞大的人口, 可能就只是清朝初期一小部分人的后代, 而清初的1.6 亿人中的绝大多数, 在后来的两百余年间, 都陆续绝嗣了。 这就意味着传嗣的理想对于大多数人可能都是难以实现的, 只有少数人能够拥有自己的后代。

    本文利用家谱资料进行历史人口学的研究, 试图通过家谱数据来检验和测定延续香火的理想与现实之间的差距, 并在此基础上对人口再生产规律进行思考。

    二、文献回顾

    对于中国的历史人口研究, 家谱是进行定量分析的重要资料之一(另外一个重要的数据来源是户口册, 目前已经发现并建立完善数据库的是由李中清 (James Lee) 团队开发的 “中国多世代人口数据库——辽宁部分 (CMGPD-LN)”)。 家谱作为一种长时段的人口记录, 通常有几百年甚至上千年的记载, 适合用于长时段的人口分析。 与正史和方志中记载的数据不同, 由于家谱属于民间私修, 修家谱的主要目的是为了显示本族的兴旺发达, 源远流长(葛剑雄, 1999), 不像官方的人口资料, 家谱没有刻意隐瞒家族人口的必要 (Telford, 1992)。 此外, 不同于官方记载中的宏观人口统计, 家谱是基于个人层面的记载, 包括个人的出生、 死亡等信息, 将这些信息整理为数据库, 便可以获得适用于人口分析的统计指标。 这些优势条件使得家谱自上世纪七八十年代以来, 逐渐成为研究中国历史微观人口行为的核心资料。

    然而, 和其他历史人口学资料一样,家谱也存在着自身的缺陷, 其中最主要的问题是对女儿和早殇儿童漏记的问题 (Meskill,1970;Telford,1986,1990; Harrell, 1987; 刘翠溶, 1992),以及由于漏记导致的对死亡率的低估和代表性问题, 即家谱可能更多反映的是繁衍成功的家族人口状况, 不一定能够代表全部人口 (Zhao, 1994, 2001)。 因为存在这些漏记的问题, 所以在利用家谱数据做出结论时, 需要特别地谨慎 (Harrell, 1995)。 尽管不完美, 家谱仍然是研究中国历史人口的重要资料, 利用 CAMSIM 方法进行微观人口模拟与家谱数据进行比对证明, 家谱提供的诸多人口统计指标是可靠的 (Zhao, 1994), 谨慎对待这些漏记问题, 仍可以从家谱数据中得到合理和准确的人口信息 (Liu, 1978, 1985)。

    上世纪八十年代以来, 利用家谱进行历史人口学研究形成了许多重要的成果, 对明清以来的中国人口, 尤其是近两百年人口的死亡率、 结婚率、 生育率等有了深入的研究; 家庭结构也是重要的议题, 不过由于家谱无法直接提供家庭规模的数据, 因而研究家谱的学者只能从人口条件对家庭结构的制约角度对家庭问题进行探讨 (刘翠溶, 1992)。 人口条件对家庭的制约, 主要表现在较短的人均寿命限制了大家庭的实现。 由于人均寿命较短, 多代同堂难以实现, 使得核心家庭是主流的家庭模式 (Zhao, 1994, 2000)。 这些研究对历史人口的诸多方面进行了深入探讨,然而,从家族本身的延续方面进行考察的研究则相对较少。 早期 Freedman 等对中国传统宗族的研究显示, 家族内部成员之间的社会经济地位是呈现分化状态, 既包含富有的商人, 也包含落魄的贫民;既有拥有功名、 地位显赫的士绅, 也有处于社会底层的农民 (Freedman, 1958)。 这意味着财富和社会声望在家族内部的分配是不均匀的, 集中在特定的优势支脉中, 这种优势在繁衍后代过程中不断累积和放大。 通过对浙江萧山三个家族的研究, Harrell 证明了那些拥有更多功名的富有的支脉, 他们的子孙数量不成比例地占据了人口的大部分 (Harrell, 1985)。 John C. H. Fei (1982)等对十个家族人口的发展历程进行考察, 发现家族人口的增长存在一个 CMV (critical maximum value), 即当家族人口增长到最高点时 , 家族就不可避免地走向瓦解 , 这可能归因于在特定区域内土地资源的短缺带来的竞争导致。 因此, 最初占有优势的家族, 随着家族人口规模的增加, 家族优势在不同支脉之间不均衡分配, 使得族内的优势支脉与劣势支脉的分化, 家族内部开始新一轮的贫富分化, 演绎着类似家族之间的生存竞争。

    三、家谱数据与方法

    本文利用 《松源魏氏宗谱》 进行分析。 松源镇地处福建西北山区, 地形相对封闭, 属于河谷盆地, 受外界影响较小。 魏氏宗谱最早编修于明代正德八年 (1513 年), 其后历次增修, 民国六年(1917) 进行了第五次增修。 不间断地修谱可以减少因时间久远、 对祖先信息记忆模糊造成的谬误, 提高记载准确性。 家谱中与人口统计相关的记载是世系表, 包括男子的世系、父子关系、排行、 职位、功名、出生日期、死亡日期、 妻子的出生日期、 死亡日期、儿子和女儿的名字和数量以及早殇和出继子女的情况等。 此外家谱的世系图则详细地绘制了家族内部的代际传承关系,这对于考察家族人口的代际繁衍过程提供了方便。 不可避免的是, 魏氏家谱也存在着漏记的问题,比如对女儿的信息记载不全, 往往只记载女儿的数量而没有记载女儿的生卒年; 对于早殇儿童的记载存在遗漏, 往往只记载早殇儿子的个数, 对女儿早殇的记载几乎没有。不过,本文重点并不在于估计人口的死亡率, 因此女儿和早殇儿童的漏记造成的影响会相对较小。 另外,魏氏宗族的另一个优点在于,由于地理位置相对封闭,历史上受到战乱影响很小, 历史上诸如太平天国战争等造成重大人口损失的事件,对该地区的影响很小。

    与以往的研究不同, 本文的研究单位是支脉, 而不是个人或者家庭。 本文重点考察的是整个家族的传承, 即家族的延续和消亡情况。 研究存在一个实际的困难是, 历史上有些家族成功繁衍,家族规模不断壮大,而有些家族则繁衍失败, 走向绝嗣, 那些能够编修家谱的家族, 都属于繁衍成功者,而在历史上绝嗣的家族曾经在历史上出现过, 却没有家谱传世, 因而无法分析他们的人口状况。 幸运的是, 即使在一个成功家族的内部, 各个支脉的繁衍状况也是不一样的,在一些支脉繁衍壮大的同时, 家族中的另一些支脉却逐渐消亡。 家族之间生存竞争在家族内部不同支脉之间也同样存在。 然而, 成功家族内部的失败者的信息被相对完整地保存在家谱里,这使得我们有可能重新复原历史上不同支脉之间在繁衍过程中的竞争场景。

    基于这样的设想,本文将魏氏宗谱中的第 20 世设置为繁衍竞争开始的第 1 世。 第 20 世共有169个男性,以他们的嫡系子孙为各自的后代, 假设他们各自成为一个独立的家族 , 这样便可以得到 169 个虚拟的支脉, 作为本文的基本研究单位。 第 20 世中最早出生的时间是清顺治七年(1650), 作为观测开始时间 ; 1917 年是第五次修谱时间 , 作为结束时间 。 由此可以观测这 169 个支脉, 共计 1360 个男性, 在这 267 年间的繁衍和消亡历程。

    四、支脉繁衍竞争状况

    从 1650-1917 年, 魏氏家族整个家族是逐步扩张的。 在 1650-1770 年间, 该家族的每二十年新生男子数从初期的 16 人逐渐增加到 100 人左右, 1770 年之后每二十年新生男子数稳定在80-100 人。

    不过,尽管新生男子数在稳定增加, 但是新增人口在各个支脉之间的分布是极不均匀的。 在本文设定的竞争起点 1650 年, 这169 个支脉都只有一名男子 , 起点上是公平的; 但竞争开始之后,有些支脉繁衍昌盛,人口逐渐增多,而有些 支 脉 逐 渐 绝 嗣 。 每 经 历一代,都有一定数 量 的 支脉被淘汰(见图 1)。

    松源魏氏在经历第一代繁衍后,淘汰了43.8%的支脉, 即有超过四成的支脉绝嗣; 至第二代则淘汰了 62.13%的支脉, 第三代淘汰了71.60%,可见,三代之内,松源魏氏的大多数支脉的香火已断,支脉被淘汰的速度非常快。 之后由于存留的支脉总数较少, 因而绝嗣的速度逐渐放缓。 能繁衍 5 代的支脉, 大多数已经成为魏氏家族中的人丁兴旺的大支。 延续香火对于这些大支而言,变得相对容易。 直到最后观测时间 1917 年, 初期的 169 支脉中的 86.39%已经先后绝嗣。 这就意味着, 在经历 267 年的繁衍竞争之后,最后只有 13.61%的人能够有自己的嫡系后代。

    以上的分析结果与赵中维运用 CAMSIM 方法进行的微观人口模拟实验的结果相近。在赵中维的实验中, 3000 人经过 9 代的繁衍后, 只有 398 人有自己的后代,传嗣的比例也仅有13.27%(Zhao,2001)。 由于每个家族人口具有一定的特殊性,以上数据并不能直接推广到其他人口 ,但是可以反映人口繁衍的大致趋势, 即传嗣的难度很大, 绝嗣现象普遍存在, 传宗接代的使命对于大多数人都是难以完成的。

    在整个繁衍历程中,魏氏家族共生育了1360个男性,而这1360 个男性并非在各个支脉中平均分布。

    从表 1 的累计百分比一栏可以看到, 占 74.56%即将近 3 / 4 的支脉只有 5 个人及以下, 这些人丁稀少的支脉面临绝嗣的可能性很大; 而人数能达到 26 人以上的支脉只有 7.69%, 这些人口众多的支脉属于繁衍过程中的胜利者。 少数优势支脉占据了大量的人口, 而大多数的劣势支脉占据比重很小的人口比重。 人口在各个支脉之间的分布严重失衡。

    这 1360 个男性分配在 169 条支脉中分布的基尼系数是 0.719, 可见人口的分布是非常不均衡的。 这就为我们描绘了人口繁衍竞争中的一个侧面, 即少数优势支脉逐渐繁荣, 呈现不对称地壮大起来,占据了大量的人口,排挤了其他支脉的发展, 而其他大量的劣势支脉则逐步走向绝嗣。

    优势支脉的繁荣和劣势支脉的淘汰是一个循环过程, 当原先的优势支脉后代人数不断增多, 其内部也开始出现分化,有些能继承前人的优势, 而有些则衰弱下去,于是开始了新一轮的优势淘汰劣势的过程又重新上演。

    五、传嗣的影响因素

    理论上,影响支脉是否能传嗣因子有很多, 然而家谱所能够提供的解释性因素主要包括以下几个方面: 生育子女数、 妻子数、 社会经济地位指标 (是否担任族长和是否有功名)、早殇儿童数和过继。 由于因变量的取值在传嗣和绝嗣之间的二元变量 , 故 采 用 Logistic 回 归 分析,结果如表 2 所示。

    (一) 生育子女数

    生育子女数是影响传嗣与否最直接的因素。 在相同的医疗卫生条件和营养水平下, 生育子女数越多,传嗣的机会越大。在回归模型1中,只考虑儿子数和女儿数两个变量的影响, 结果显示两者对于提高传嗣几率都有显著的正向作用, 而且在模型 2、 3中分别加入职位、 功名、早殇儿童数等其他变量之后, 儿子数和女儿数这两个变量的作用因素并没有减弱,可见其影响大小是稳定的。

    需要注意的是,女儿数的系数明显大于儿子数, 这是由于家谱对女儿记载不完备导致的, 并不意味着生育女儿更容易传嗣。在全 部 记 录 中 , 每 个 男 性 平 均 生 育 儿 子 1.1个, 生育女儿 0.3 个, 这说明女儿存在严重的漏记。 更重要的是, 随着时间的推移, 对女儿的记载逐渐增多。 表 3 显示的是有出生年记载的父亲 (占总数的 70.15%) 生育的儿子和女儿数, 其中年份是指父亲出生的年份。 1750 年以后,女儿的记载逐渐增多, 而大量绝嗣的支脉已经在 1650-1750 年退出了历史舞台, 这就导致女儿大多数出现在传嗣的支脉中, 绝嗣支脉中女儿记载很少, 进而造成回归方程中女儿数的影响系数大于儿子数的反常现象。

    (二) 妻子数

    一般认为, 妻子 (包含妾和续弦) 数越多, 生育的儿子和女儿也会越多, 进而提高传嗣的概率, 然而这一假设并不能得到回归方程的支持, 如回归模型 2。 考虑到女儿的记载偏差以及女儿数理论上和儿子数量对传嗣贡献一样, 因而在模型 2 中, 去掉了女儿数这个变量, 只考虑儿子数和妻子数的影响。 妻子数这个变量对于传嗣的影响呈现微弱的负向作用,但是未能通过显著性检验, 在模型 3 加入社会经济变量后, 妻子数仍未能通过检验。

    进一步通过比较绝嗣支脉和传嗣支脉中的已婚男子娶妻状况发现, 两者也没有明显的差别。 如表 4 所示, 已婚的绝嗣男子和传嗣男子都以娶 1 个妻子为主, 均占 80%以上; 两个妻子的比例都还较高, 达到 10%以上, 多妻的比例都很低。 表 4 说明, 在妻子数量和结构上,绝嗣男子和传嗣男子并没有区别。

    需要注意的是, 绝嗣男子的未婚比例要高于传嗣男子, 这也是造成绝嗣的重要原因。 比较已婚的绝嗣和传嗣男子的婚姻状态的意义在于说明, 男子一旦进入婚姻状态后, 娶妻的多少并不影响传嗣。 未婚而亡或者不婚当然意味着绝嗣, 但是多妻也并不能明显提高传嗣的机会。 在已婚的男性中, 妻子数量和生育儿子数量之间的相关系数仅为 0.075, 相关性微弱, 这进一步说明妻子数与儿子数无关, 多妻并未能带来多子。 由于妻子的数量很少存在漏记情况, 儿子的记载也较为完备, 这个结论具有较好的可信度。 已有的研究显示, 在传统社会, 人们生育的目的是为了传嗣,如果有足够多的儿子, 那么人们就可能提早结束生育行为 (侯杨方, 1998; Zhao, 2006)。 妻子数量对传嗣没有明显影响, 这也可以说明, 在由男性主导生育行为的传统社会, 女性的生育潜力被大量闲置。

    (三) 社会经济地位

    在婚姻和繁衍后代中占据优势者, 主要归功于他们较高的社会经济地位 (Telford, 1992)。家族中那些拥有功名的人, 能够较早地结婚和生育, 这使得他们更容易获得子嗣, 可以说是 “富人拥有后代” (Harrell 1985)。 对英国工业革命以前的人口研究发现, 财富状况和子嗣数量之间有着明显的相关性, 最富有的人留下的后代数量是最贫穷的人的两倍 (Gregory Clark and Gillian Hamilton, 2006)。 贫穷推迟了男性结婚年龄 (Freedman, 1958), 并成为导致 35 岁以上男性未婚的主要原因 (陈意新、 曹树基, 2002)。 在 18 和 19 世纪, 上层贵族的儿子中到 30-40岁时只有6%的人未婚, 而下层贵族中单身的比例却达到 12% (李中清、王丰,2000), 而在安徽桐城,绅士 阶 层 的 儿 子 中 20 岁 以 上 尚 未 结 婚 的 只 有5% , 而 非 绅 士 阶 层 的 儿 子 则 有 15% 是 单 身(Telford,1994)。 穷人在婚姻市场上处于劣势地位 , 未婚比例的增加 , 自然提高了绝嗣的概率 ,而晚婚也压缩了夫妻双方的生育期, 在人均预期寿命很低的时代, 生育期的缩短对于子女数量的影响是明显的。此外, 贫穷带来的营养不良问题也降低了生育能力 (劳伦斯·斯通,2011),这些使得在前现代社会富人往往拥有更多的孩子。

    除了影响结婚率外, 社会经济因素还会影响到人们的生育决策和行为。 已有的研究显示, 传统中国的人口生育行为存在人为控制, 并非处于纯粹的 “自然的状态”,人们会根据家庭经济状况和对未来的预期进行生育控制, 当人们拥有足够保证传嗣的儿子数时, 就可能停止生育,以减轻经济负担 (James Lee & Cameron Campbell, 1997; 侯杨方,1998;Zhao,2006)。 婚后推迟生育、 提早结束生育年龄、 延长生育间隔是形成低生育的三种人口机制 (李中清、 王丰,2000)。因此, 贫困可能会影响人们生育决策和预期, 减少子女数, 同时溺婴的可能性也在增加。 另外,富裕的家庭可以为成员提供较好的生活条件和医疗条件, 并在灾荒年间降低死亡率。

    在家谱资料中, 直接对个人的收入状况的记载很少, 因而需要寻找其他的代用指标。 本文分别选取 “族长” 代表经济状况、 用 “功名” 代表社会地位。 族长是整个家族的权威代表,族长所在的支脉往往拥有更多的资源, 进而提高结婚的机会, 例如在辽宁农村, 族长的结婚概率比普通人高三倍 (李中清、 王丰, 2000); 功名则是社会地位的重要指标, 拥有国家赐予的功名,不仅可以享受到国家的物质补助, 同时也在地方上享有一定的社会地位和声望。 一方面,考取功名需要一定的经济基础, 尽管不乏穷人获取功名的例子, 但通常只有经济条件较好的家庭,才有能力供养后代读书考取功名; 另一方面, 许多的功名是花钱捐来的, 捐得的功名越多, 也反映出家族的财力。 在表 2 的模型 3 中, 族长这个变量的影响作用很大, 并通过了显著性检验;功名变量虽然没有通过检验, 但该变量对传嗣的作用也是正向的。 进一步通过卡方分析表明, 在有功名的人当中,传嗣的比例远远高于绝嗣; 而在没有功名的人当中, 这一差距要小得多 (见表 5)。功名和传嗣之间的卡方系数为 32.836 (p=0.000), 可见, 是否拥有功名对于是否拥有后代的影响是显著的。

    对族长和功名所代表的社会经济地位变量所进行的研究,再次验证了前人的研究结论,即经济上占优势的人群更容易得到后代。这种优势在近亲之间得到传播和继承(James Lee &Cameron Campbell,1997),使得优势得到进一步的扩大,进而使得所在的支脉逐渐繁荣壮大起来。

    (四) 过继

    过继是传统社会为了维持家族香火延续而常用的一种方式。 过继包括出继和入继两个方面。 这里并没有将过继的因素放在回归方程中,主要是因为,不论是出继还是入继,都同时包含对延续香火积极和消极的意义。就入继而言,一方面入继可以弥补自己没有男性后代的缺憾,有助于延续香火,但另一方面, 需要入继这一事件本身也表明该支人丁衰微,几近断了香火。因此,过继因素在延续后代方面,同时具有一正一负两相矛盾的作用,不便于直接进入方程。 表6统计了家族中出入继的情况。

    若以 “无过继” 群体为平均水平的话, 则 “入继 1 子” 群体的绝嗣比例略低于平均水平, 表明入继在一定程度上起到了延续香火的作用; 出继 1 子的人, 其绝嗣比例则明显高于平均水平,说明出继不利于传嗣。 实际上, 大多数时候是辈分较低者的儿子过继给辈分较高者, 比如弟弟的儿子过继给兄长。 这意味着在某种程度上, 家庭地位也会影响到绝嗣的发生。

    除了上述因素外, 早殇儿童数量理论上也是影响因素之一。 尽管由于家谱中对早殇儿童的记载存在严重的遗漏, 使得估计儿童的死亡率水平存在困难, 我们还是找到了 77 条早殇儿童的记载。 在回归方程中,早殇儿童的因素勉强能够通过检验, 并显示对传嗣产生负面影响, 即随着早殇儿童的增多,传嗣的概率可能下降。早殇儿童数量越多, 可能意味着营养和医疗卫生条件越差。不过由于早殇儿童漏记的问题, 此仅作参考。

    六、结论

    尽管延续香火、 传宗接代是人们的普遍理想, 人们为此也做出种种努力, 但是现实当中, 人们所向往的那种儿孙满堂的理想情景并不多见,恰恰相反, 绝嗣才是更为普遍的现实。 经历了这267年间后,只有 13.61%的人留下了自己的后代 , 尽管期间人口总量在不断增长,但是绝嗣现象仍普遍发生,人们延续香火的理想受到普遍绝嗣现实的狙击。

    在影响传嗣的诸多因子中,生子数的影响最为直接,在同等死亡率下,生子数越多, 传嗣的机会也就越大。生子数的多少最终受制于社会经济因素的影响,在家谱数据中表现为占据更多资源和声望的族长容易有后代,拥有功名的人也容易使得本支脉得到延续。 在人口繁衍的过程中,这些占据更多资源的人群在生存竞争中取得优势, 这种优势被逐步累计和放大,使得他们的后代逐渐占据了人口的主体部分。占人口大多数的弱势人群则逐步被排挤和淘汰,最终绝嗣。人数最多的 10%支脉, 占据了总人口的 62.72%; 而人数最少的 10%的支脉,只拥有总人口的1.25%,繁衍的机会在不同支脉之间是极不均等的。

    当代欧美发达国家人口不愿意多生育、 而拉美、非洲、 东南亚等发展中国家和地区维持相对较高的生育率, 进而出现了落后地区人口比重上升, 而发达国家地区的人口比重下降的局面。这种人口的逆向淘汰的出现,前提条件是生育和死亡大体已经在人类的掌控范围之内,尤其是在人们可以较为有效地控制流行病和饥荒。 然而在传统时期的中国, 人们显然还无法自主选择生育、控制死亡, 相反, 死亡水平决定并塑造了人口的再生产方式。 那么, 在这种情况下,人口的繁衍可能遵循着 “优胜劣汰” 的自然法则,那些占据较好的社会经济地位的家族,能够提供较为充足的营养、 相对清洁的居住条件,尤其是在爆发大规模流行病和饥荒时, 具有较强的应对能力,使得死亡率低于那些社会经济水平落后的人群。 这使得优势家族在繁衍过程中逐渐壮大,而劣势家族的生存空间则逐渐被挤压, 最终被淘汰。需要注意的是, 随着优势家族后代人口规模的不断扩大, 内部成员之间也逐渐出现优势和劣势的分化,只有少数后代能够继承优势, 而多数人则渐渐退化, 于是新一轮的优胜劣汰的生存竞争也随之展开。

    本文见刊于《南方人口》2012年第6期。

  • 阿瑟·刘易斯《经济增长理论》5-7

    第五章 资本

    在这一章里,我们将分别研究促使经济增长需要多少资本、储蓄的主要来源和投资过程。

    第一节 资本的必要条件

    经济的增长与人均资本的增加是有联系的。正如我们所看到的,它与其它许多问题,如与激发人们努力的制度、重视经济效率的态度和日益增加的技术知识等也是有联系的。资本并不是经济增长的唯一条件,只有资本而不同时为资本的使用提供富有成效的基础,那么资本就会被浪费。在本章的以下各节中,我们认为已经谈过的关于这些其它事情的所有情况都是正确的。因此,我们能够集中研究在使用资本的条件适当的时候资本的成效问题。
    资本的成效有多大?由于缺乏有记载的证据,这个问题极难回答。对于过去几十年资本和收入的增加情况,我们只有一些根据了解的情况进行推测的材料,而且这些材料仅仅是关于几个先进工业国的。实际上,我们关于收入和资本的数量关系的全部知识,都是从西蒙·库兹涅茨教授和科林·克拉克博士的开拓性工作中获得的,本节中的以下内容在很大程度上是根据他们的计算结果写成的。

    对资本和收入增长的价值的估计数字在以下两点上表现出明显的一致性。第一,在工业国家里,当把资本密集工业和资本稀疏工业计算在一起时,资本价值和产值的比率在边际上看来是相当稳定的;第二,如果土地和其它自然资源的价值不包括在资本里,国外资产的价值不包括在资本和收入里,那么这种边际比率达到3比1到4比1。这种结果可以用不同方式来表示,例如可以说,投资100英镑,国民收入每年平均增加25英镑到33英镑;或者说国民收入累积每年提高3%,年度净投资额就占国民收入的9—12%。工业国确实往往将它们10—15%扣除折旧以后的国民收入用于投资,它们的收入也确实往往每年增加3—4%。

    从数学上说,现有股本与收入的比率(即不同于边际比率的平均比率)仅仅是用于投资的那一部分国民收入、平均投资期限和收入增长率的函数。因此,如果总收入是常数,每年将12%的总收入用于对结构的投资,投资期限为50年,将8%的总收入用于对设备的投资,投资期限为10年,这样50年以后,平均资本一收入比率为3:4。(任何时候都存在的结构原始成本为国民收入的6倍,设备的原始成本为国民收入的0.8倍;假设资本平均消耗一半,那么它的平均值为国民收入的3.4倍)。如果所持股票比如说增加0.5,那么这个比率就达到3.9。改变收入增长率并不会产生如人们可能期望的那么大的影响;例如,如果我们现在假设国民收入每年增长3%,并且其它假设不变,那么包括股票在内的资本—收入比率就会下降到只有3.0(这没有多大关系,因为早先的资本到现在己消耗一半以上,比后来的资本少得多,由于累积的增长,后来的资本消耗不到一半。)鉴于资本的平均期限,资本—收入比率的主要决定因素是每年用于投资的那一部分国民收入。所以,一些国家从国民收入中拿出差不多一样多的钱进行投资,它们的资本—收入比率差不多也是一样的,这就毫不奇怪了。

    由于同样的原因,不发达国家现有资本与年收入的比率

    要低得多(接近于1比1),因为它们的积累率低得多。然而

    我们不知道边际资本—收入比率在工业国和欠发达国家的比

    较结果(此处以人均资本作为发展指数)。人们有许多理由不

    指望边际资本—收入比率是相同的。用于投资的那一部分国

    民收入即使是相同的,也不可能使国民收入达到同样的增长

    率,资本的平均期限可能也是不同的。有些人深信,在欠发

    达国家,边际资本—收入比率较高,他们之所以有这种想法

    是由于他们认为,产生资本的工业的效率较低,资本浪费较

    大,技术知识增长较慢,这些都是使资本的产值不是那么高

    的因素。其他人则预料这些国家的比率较低,他们的依据是

    开发新的自然资源,人口增长较快,农业、工业和公用事业

    等经济部门的相对重要性各不相同,比较鼓励采用资本主义

    特征比较少的生产方法。对以上各点中的每一点都可以发表

    一点意见。

    第一,与发达国家相比,欠发达国家生产消费品的效率比生产生产资料的效率高。如果情况是这样,那么与收入相比,这提高了这些国家的资本成本。为了解决这个问题,我们不得不将资本的形成分为两个主要组成部分,即建筑及建设工作和设备制造。至于造价,我们没有确凿的证据来说明在欠发达国家或者在比较发达的国家,它们与消费品的成本相比是否比较高。下面这种证据肯定是有的,那就是如果建

    筑业任务过重,那么造价就会急剧上升,因为在建筑业里,如

    果对工业不进行适当的计划或监督,那么工作是很容易发生

    混乱的,但是欠发达国家可能发生这种情况,发达国家也同

    样可能发生这种情况。关于机械,证据就比较多;例如有相

    当明确的证据表明,在30年代,与美国相比,苏联在机械生

    产方面无论如何处于相对的不利地位。另一方面,虽然建设

    必须在国内进行,但是机械是可以进口的,这样就可以避免

    国内生产比较不利的地位。总之,似乎有理由预料,在欠发

    达国家里,与收入相比,资本成本是比较高的,但是也许高

    得不多。

    第二,由于资本浪费较大,预料资本—收入比率较高。对

    于这一点,不可能有很多的怀疑。欠发达国家搬运生产资料

    不像比较发达的国家那样谨慎,从这个意义上说,浪费现象

    是存在的。工人不那么熟练,使用工具不那么小心;汽车司

    机和火车司机开车时损坏车辆;公路、建筑物和其它设备不

    是维护得那么仔细。因此在欠发达国家,折旧率要高得多。据

    认为,还存在这样一种浪费现象,那就是由于不大了解可能

    性,投资不适当的情况比较多。欠发达国家对土壤、雨量和

    矿物等资源的规划工作做得不那么好,对国内外的潜在市场

    不那么了解。因此它们犯了大错误,取得经验是付出了巨大

    的代价的(企图在坦噶尼喀种植可食块茎这个典型例子,仅

    仅是数以千计类似情况中宣传得最多的一个例子,它涉及私

    人企业家的程度甚至超过涉及政府的程度)。正是由于这个原因,资本往往因循守旧,结果对有些活动投资过多,对其它活动投资不足,这也造成了浪费。这些浪费确实是相对的,因为浪费资本的现象在发达国家也是存在的;例如,如果说它们的物质损耗率较低的话,那么它们的报废率往往是比较高的。即使如此,我们必须预料到,经验最少的国家浪费比较大,看来有这种看法几乎是不可避免的。

    第三,可以说,在欠发达国家,资本产生的利润较少,因为资本使用得有成效,取决于技术的不断提高,而在欠发达国家,知识是提高得比较慢的。这个论点可以用不同的方式来表达。其中的一种说法是:在发达国家,收入往往是由于知识的不断增长而增长的,即使不再增加资本,收入也会增加。而在欠发达国家,技术进步较慢,对收入的增加所起的作用较小。或者用另外一种说法来说,资本往往用于引进新技术,所以凡是技术发展缓慢的地方,资本产生的利润是比

    较少的。另一方面,同样可以说,正是由于技术落后,才有

    可能取得引人注目的进步,因此如果在比较落后的国家投资,

    并且同时在教育和训练方面作一些必要的开支,那么它们取

    得的增长率可能会比比较发达的国家快得多。许多思想家认

    为,由于这个原因,提高起点低的国家的经济增长率,比提

    高水平已经很高的国家的经济增长率要容易得多,他们引用

    苏联和日本比较高的产出增长率来证明他们的说法。

    同样,关于资源的论点也没有使人得出可以论证的结论。

    正如当资本用于引进比现有技术优越得多的新技术时产生的

    利润特别多一样,资本用于开发新的丰富的自然资源产生的

    利润也比仅仅用于改善对已有自然资源的利用所产生的利润要多。因此,人们有时争辩说,欠发达国家能够比比较发达的国家更有成效地使用资本。然而情况未必是这样。首先,欠

    发达国家的资源未必比比较发达的国家的自然资源丰富。亚

    洲和非洲尚未表明它们的土壤、燃料或其它矿藏特别丰富,人

    们并不清楚的是,在亚洲或非洲的投资是否会比增加对北美

    洲已经探明的资源的投资使资源产生更大的效益。因此,我

    们决不能使用像洲这样的大类别,相反,必须谈有限地区的

    具体项目。在不发达世界的某些地区,丰富的资源仍然有待

    开发,而在其它地区,资本的作用将主要限于使得有可能使

    用较好的技术。其次,资本甚至可能与已经投了资的企业有

    密切的关系。任何新企业的生产率,都必须依靠利用许多其

    它企业的服务(公用事业、工程服务、原料供应商等)。所以

    在许多情况下,在已经投了许多资的地方进行新的投资,比

    在尚未开发的地方投资来得经济。因此,发达国家比欠发达

    国家有利,欠发达国家资本效益较高的自然倾向是不存在的。

    尽管如此,如果差别主要是已经投了多少资的问题,那么欠

    发达国家的不利地位就会随着它们自己的投资的加速而减

    少。遗憾的是我们对欠发达国家的资源知道得太少了,或者

    对增加或减少资本收益的重要性知道得太少了,无法信心十

    足地对这些题目作概括性的论述。

    第四,我们应当按照“报酬递减律”预料人口增长缓慢的国家的资本—收入比率,比人口增长迅速的国家的资本—收入率来得高。“报酬递减律”就是,使用的劳动力增加而不是减少,资本产生的效益可能提高。在这里,人们同样决不能设想,所有欠发达国家的人口都增长得很快;例如,现在北美洲的人口比亚洲的人口增长得快得多。另一方面,如果人口增长缓慢,例如在法国,那么修建住房就不需要那么多资金,因而资本—收入比率高,这也许是更加重要的。

    我们在讨论以不同经济部门在经济中的相对重要性为依据的论点时可以稍微增加一点信心。在不同经济部门之间,资本—收入比率的差别是很大的。因此,公用事业的这个比率比制造业大得多;即使在先进的工业国,公用事业的比率也比制造业高四五倍,在经济发展的初期阶段,这个比率似乎还要高,因为随着经济的发展,这个部门具有的很大的规模经济使得这个比率迅速下降。另一方面,在公用事业部门投资不仅可以使那个部门提高生产率,而且还可以使其余经济

    部门也提高生产率;所以对整个经济的实际结果可能是资本

    一收入比率低。农业和制造业对资本的需求也有很大差别。在

    比较发达的国家里,农业的这个比率比制造业高,但是在欠

    发达国家,由于农业的机械化程度比较低,农业的这个比率

    看来比制造业低,不过手工业不算在内。现在,当我们考虑

    到不同部门的不同比率,以及在比较发达的国家和比较不发

    达国家里各部门以非常不同的比率结合在一起这个事实时,

    我们应当预料到整个经济会有非常不同的比率。在欠发达国

    家,与制造业相比,农业的地位比在发达国家的地位重要得

    多。在生产率水平低的国家,需要有60—70%工作有报酬的

    人口从事农业才能养活人民,而在发达国家,为了同样目的

    只需12—15%的人就够了。(但是所有这些比较都要遇到人

    口分类工作中固有的困难,我们在第四章第一节(三)中已

    谈到了这个问题。)在低水平上,农业也不是一个资本密集的部门(不考虑土地)。在水利方面可能需要大量开支来进行排水、土地开垦、灌溉或防洪。那些人口稀少的欠发达国家使

    用机械来增加人均耕地面积也可能得到好处,但是对于人口

    稠密的国家来说,进行机械化耕作好处不大,因为普遍使用

    机械会增加失业人数,这种害处比提高产量的好处要大得多

    (见第三章第三节(四))。除了在保持水的方面投资以外,欠

    发达国家提高农业生产率更多地依靠新技术(肥料、种籽、农

    药、轮作等),而不是依靠资本。在制造业的发展方面资本密

    集的程度要高得多,在适合发展家庭手工业的地方发展家庭

    手工业并不需要巨额资本,这是事实,但是发展工厂也是不

    能避免的,而且同处于这种发展水平的农业比较起来,资本

    是非常密集的。由于与制造业相比,农业的规模是如此之大

    (从就业人数来说为6:1到10:1),又由于农业的发展依赖

    于每年用于农业推广和农业研究的开支的程度大大超过依靠

    资本的程度,得出以下结论似乎是合理的,那就是虽然资本

    比工业国增加得少,也能使收入有一定程度的增长。另一方

    面,欠发达国家在公共工程和公用事业(港口、铁路、公路、

    电力、学校等)方面必须支出数额很大的开支,如果按这一

    数额在收入中所占的比重来说,也许比工业国还要高。所以

    总起来说,资本—收入比率由于受不同部门的相对重要性的

    影响也许没有多大差别。

    最后,我们谈谈由于资本相对短缺所造成的差别。在欠发达国家,比发达国家更节约地使用资本是经济的。因此,如果有可能使用一个投资大而日常费用低的方法,或者选择最初投资额较低而年度费用较高的方法,那么后一种方法往往是比较合适的。建造20年比建造50年好:采取使用手工劳动而不是使用机械的方法比较好:一般说,节省资本比节省劳动力好。自然必须把所有这些看作是相对的而不是绝对的;提出的论点并不是主张根本不应当使用资本,而是由于资本

    比较为发达的国家少,所以应当更加节约资本。这个论点适

    用于所有欠发达国家,但是尤其适用于那些剩余劳动力比物

    质资源多的国家,因为目前的产量用较少的劳动力就可以达

    到,而不必增加资本或改进技术。中东和南亚的某些国家就

    是这种情况,例如印度,据认为,在印度可耕地上从事农业

    生产的人口,在目前设备和技术条件下,比耕作这些土地所

    需的人数大约多四分之一。在这种国家,用资本代替劳动力

    是一种浪费,在农业、制造活动、建筑或其它活动中,机械

    的使用应当限于这样一些情况,即在仅仅使用更多的劳动力

    增加不了产量的地方使用机器。这种论点的必然结论是,我

    们可以预料,欠发达国家增加收入所需的资本数额比比较发

    达的国家少。

    现在我们已经考虑了说明发达国家和欠发达国家的边际

    资本—收入比率应当有所不同的五六条理由。这种分析的结

    果是,我们不知道任何不发达国家的边际资本—收入比率是

    多少,而只能随便猜测它是否可能比美利坚合众国高或低。尽

    管如此,如果我们由于缺乏任何更好的比率而使用以往为工

    业国找到的比率的话,那么就很容易看出欠发达国家收入增

    长得如此缓慢的原因。据估计,一个像印度这样的国家每年

    将大约4%或5%的国民收入用于投资。将这种数字与工业国

    的投资数字作比较是危险的,因为我们对欠发达国家的估计数字不是那么有把握。例如,我们不知道自给农民在他们的田地上开垦新土地、排水或土壤保持、改善房舍等方面为他们自己积累了多少资本。所以,可以想象,对农村地区的资本形成是估计得低了。可是如果我们接受这些数字,那么每年4%或5%的净投资额可能使国民收入仅仅提高大约1.25%,这是印度目前的人口增长率——或者甚至不到1.25%,如果对建房的投资在不大的投资总额中所占的比重比较大,而生产投资所占的比重比较小的话,这种情况是可能出现的。所以目前的投资至多只能赶上人口的增长速度;再腾不出任何资金来提高生活水平了。如果印度要将它的生活水平每年提高1%,那么它就必须将它的投资率提高将近1倍。印度和美国的生活水平之间的差距每年都在扩大。要使这个差距不再扩大,印度的生活水平就必须与美国的生活水平以同样的速度提高,比如说每年大约提高1.5-2%。为了达到这个目标,印度的净投资额必须从目前占国民收入4%或5%的水平,提高到比如说占国民收入的12%。

    这反过来又提出了这样一个问题,即在不降低资本效益的情况下,可以以什么样的速度来加速资本形成。现在比较发达的所有国家在过去的某个时候都经过一个迅速加速的阶段,在这个过程中,它们的年度净投资率从5%或不到5%提高到12%或12%以上。我们所说的工业革命就是这个意思。遗憾的是,使我们能够说明在任何具体情况下过渡时期要持续多久,或者说在过渡时期资本的生产率受到多大影响的数字并不存在。我们已在日本、德国、北罗得西亚和苏联等国看到了一些非常迅速的过渡(例如在10年左右的时间内),但是我们不能说变化的速度是否降低了这种努力的生产率。尽管如此,人们预先还是可以说,一个国家能够富有成效地加速它的资本形成的速度是有限制的。其中两个最重要的限制(假使财政状况好,有适当的自然资源和合适的制度)是缺乏技术和公用事业不足。

    缺乏技术不仅妨碍人们富有成效地使用资本,而且可能

    使他们根本无法使用资本。正如我们过一会儿就会看到的,资

    本形成有一半以上是由建筑工程构成的。因此,资本的扩大

    取决于建筑业扩大的速度。如果没有木工、石工、电工和工

    程师来从事必要的建筑工作,不论工程是公路、桥梁、水坝、

    工厂、电站、房屋还是其他的建筑物,那么计划就无法执行。

    所以加速资本形成可以达到什么样的速度这个问题首先取决

    于扩大建筑业可以达到什么速度的问题。另一个限制是公用

    事业不足,因为新企业需要通讯、码头设施、供水、电力和

    其它这样的服务。可是要扩大公用事业(假如财政状况良

    好)又涉及这些项目的建设速度问题,这与扩大建筑业的速

    度是同一个问题。所以限制吸收资本速度的最重要障碍是缺

    乏技术。

    现在技术可以从国外引进,或者可以进行培训。在北罗

    得西亚,技术是按需要引进的,所以资本形成迅速扩大,没

    有具体限制。在别的地方,提高技术在更大的程度上取决于

    培训,虽然在任何情况下,即使仅仅为了做培训工作而聘请

    外国技术熟练人员也会使资本形成容易得多。训练建筑工人

    和监工的工作在任何训练计划中都占有重要地位,当然许多

    其它技能也是需要的,其中包括那些要在投资以后使用资本的人的技能。发展计划造成的许多挫折是由于在这种计划中未把训练放在主要地位。虽然与国民收入相比,发展计划几

    乎都是不大的,但是执行起来几乎总是落后的,因为执行过

    程中存在着实际困难。如果与此相反执行庞大的训练计划,比

    如像苏联那样,或者像爆发战争时军队迅速扩大那样,那么

    缺乏技能看来没有理由成为10年内资本形成速度提高1倍

    的障碍。如果提供训练设施,如果还谨慎地从外国聘请有经

    验的监工,那么建筑业在10年内就可以翻一番。一开始生产

    率自然是低的;但在另一方面,新就业的工人的生产率也总

    是低的,无论发展的速度是快还是慢。

    下面我们研究资本构成问题,这个问题可以从三个方面来看:资本形成净值与总值的比率,使用资本的工业部门和资本的组成。

    关于投资总额与投资净额的比率,我们知之甚少。即使在工业国家的经济中,这种分法在理论上产生了难以克服的困难,实际上使用的数字仅仅是一些根据情况进行的推测,和资本一收入比率一样,这些推测是以对过去的投资和资本的平均使用期限的估计数字为基础的。在这个基础上,通常的估计是,在工业国,更换过时的或者耗损的资本大约需要5-10%的国民生产总值。例如在美国,在直到发生大衰退的漫长的几十年中,投资净额平均约为13%,更新资本约为7%,

    使投资总额约占国民生产总值的20%。就美国的情况来说,

    据认为,有证据证明,与投资净额相比,更新开支有增长的

    趋势。这似乎是非常可能的,因为在经济发展的最初阶段,公

    用事业需要许多新的资本,而在以后各个阶段,由于规模经济的作用,它们所需的资本用于维修开支部分增加,用于新建项目的部分减少。我们对此不能太自信,因为技术在不断

    发展,使得一些公用事业过时了,并且要求在其它公用事业

    上增加巨额开支,此外,我们期望的服务标准也在不断提高。

    不能把现有的数字看成是最后的,因为这些概念不够确切,或

    者说这些数字不够精确。目前我们需要注意的是,很大一部

    分经济活动仅仅是为了使股本保持完整才进行的。

    在欠发达国家的经济中,更新资本所需的那一部分国民

    收入少得多,因为与收入相比,它们的资本的股本少得多。在

    工业国,可以用于再生产资本的股本比国民收入多两倍以上,

    而在最贫穷的国家,不包括土地的资本的股本比国民收入少,

    或者不比国民收入多多少。因此,折旧费只占国民收入的2%

    或3%,而在最富裕的国家,则占7—10%。随着投资净额的

    增加,资本的股本和折旧费比率都迅速提高。

    下面我们谈谈经济各部门投资的分配。我们只有先进工业国的数据,在这些国家里,投资总额约占国民总产值的20%左右。这些国家之间是有差别的,但是如果我们愿意考虑一下“典型的”方案,那么固定投资总额(即不包括股本)可以作如下分配:
    住房约25%
    公共工程和公用事业约35%
    制造业和农业约30%
    其它商业  约10%  
    100%
    这些数字是长期的平均数,逐年有明显的波动,目前我们无需去研究它。

    关于这些数字,要说的话是很多的。先说住房。人们发

    现下面这种情况通常是感到很吃惊的,那就是仅仅为了向全

    体居民提供住房,就需要从投资总额中拨出很大一部分钱,但

    是实际上,这无论如何是工业国的特点。这个比例是随着人

    口增长率的不同而不同的。在人口从农业向工业转移的过程

    仍在进行的国家里,这个比例大概也是特别高的,因为这需

    要城市迅速扩大。这些大概就是英国的这个比例接近20%,

    美国接近30%的原因。在住房方面需要支出巨额款项的事实

    很容易被忽视。苏联在起草第一个五年计划时似乎忽视了这

    一点。如果随着发展工作的进行欠发达国家的人民将要迁入

    的城市想不重复大多数工业革命最严重的弱点之一的话,那

    么这些国家(在住房方面所需的投资大概要超过投资总额的

    25%。

    这些数字也说明公共工程和公用事业(公路、码头、运

    输、水、电力、学校、医院、政府建筑物)是十分重要的。即

    使在工业国家里,这一项所消耗的资金始终比用于制造活动

    的资金还要多。我们很想知道关于在经济发展过程中这个比

    例如何变化的更多的情况,但是现有的数字不允许我们满怀

    信心地作出判断。有理由认为,在发展的头几十年中,这个

    比例是特别高的,以后逐渐下降。这是因为在发展的最初阶

    段,需要建立公用事业的基础,虽然也有必要花一些钱来维

    持、改善和扩大基础设施,但是以后这些开支比较起来可能

    不会像最初阶段那样多。这一看法与我们前面用以说明据认

    为同投资总额相比投资净额下降的趋势的看法是一样的。我们一会儿在说明与设备开支相比投资总额内建筑开支下降的

    趋势时还会遇到这个问题。再往后,作为某些经济学家提出

    的理由之一,我们还会遇到这个问题,这些经济学家预料,很

    发达的国家在它们积蓄的资金“成熟”时,要为这些资金寻

    找足够的出路将变得越来越困难。

    公共工程和公用事业的重要性的另一个有趣的必然结果

    是与私人投资相比,政府投资的重要性。在那些政府将公用

    事业交给私人企业经营的国家里,政府的投资只占投资总额

    的一小部分——10%以下。然而,当公用事业收归国有时,这

    个比例就急剧上升,如果政府负责住房开支的话,它还会上

    升得更猛,更不要说对采矿业和制造业的投资了。许多欠发

    达国家决心将这些投资的责任接过来,结果发现所涉及的款

    项意味着政府开支大增,超过了它们的财力。

    制造业和农业之间投资如何分配,这取决于这两项活动在经济中的相对重要性。在英国,农业在投资总额中只占5%,但是它只雇佣5%的人。在美国,投资的比例看来接近于8—10%。在每一个国家,人均国民收入的增长使制造业比农业发展得快,因为人们富裕了,他们购买制成品的数量比他们的食品消耗量增加得快。因此,必定会出现一种对制造业投资比例上升,对农业投资比例下降的趋势。此外,相对

    比例取决于一个国家的自然资源与其人口的比例,因为这反

    过来决定它是否人口过剩,是否必须出口制成品以换取粮食,

    或者靠出口初级产品以换取制成品能否繁荣。在日本或印度

    等人口过剩的国家,人们期望发展计划包括对制造业的比较

    大的投资,因为没有其它办法能使所有的人都就业,或者为进口粮食付款。而在缅甸或泰国等拥有充裕肥沃土地的国家,

    人们则期望那种提高人均农业产量的投资占优势。

    最后,我们谈谈建筑、设备和增加股本之间资本形成的

    分配问题。我们先谈谈股本,因为这一项常常受到忽视。在

    任何时候,现有股本都占国民收入的三分之一到一半。因此,

    如果国民收入一年增加3%,那么股本需要增加的数额约为

    国民收入的1—1.5%,这可能相当于投资净额的12%。在

    制订发展计划时,这个大项的必要性常常遭到忽视,结果是

    原料和消费品的短缺现象变得更加严重,因而妨碍了产出的

    增加。

    建筑和设备在固定资本形成总额中所占的相对份额的大

    小,取决于国家在公路、铁路、房屋和公用事业等方面已经

    具备的条件如何。在1951年,建筑所占的份额英国为48%,

    美国为56%,黄金海岸为59%,尼日利亚为61%。我们掌握

    的关于美国的数字可以追溯到1870年,它们已显示出同样的

    趋势:建筑业已从最初的大约三分之二的水平不断下降。英

    国的这个比例之所以异常低,其部分原因是由于近几年故意

    限制对公用事业的投资作为反通货膨胀的一种措施。在公路

    方面开支非常少,这就非常明显地反映了这一点。1952年,英

    国的政府投资(不包括公营公司和公用事业)只占固定投资

    总额的9%,而美国为16%。

    建筑业的极大重要性并不是得到人们普遍理解的;许多

    人主要是从安装机器的角度来考虑资本形成的,而实际上它

    在更大的程度上是由这种或那种建筑结构组成的。在资本形

    成中,土木工程是主要行业,机械工程则比它落后一段距离。

    这种情况会产生一些必然的结果,其中之一就是我们已经提

    出的论点,即阻碍迅速加快投资的真正的障碍是建筑业自我

    扩充的能力。另一个必然结果是,在经济发展的早期阶段,最

    需要资本的是公共工程和公用事业,眼下它们是不直接对外

    国私人投资者开放的;所以外国私人投资对欠发达国家的资

    本需求关系不大。但是我们将在第二节(三)中再回过来谈

    这一点。

    为了表明下面这一点,我们所说的话已经够多的了,那就是本节中出现的任何数字在很大程度上都是推测性的,不存在应当期望某个国家遵循的典型的投资模式。尽管如此,即使考虑到各国之间理所当然地存在的重大差别,而且这些差别是可以解释的,这些数字也清楚地显示了某些典型的误解,仅仅由于这一点,它们也是有价值的。例如,它们表明了建筑业在资本形成中的重要性,股本的重要性,以及住房的重要性,由于忽视了这一点,许多发展计划失败了。在每一个国家,如果人们想制订投资计划,那就必须详细调查资源和潜力,这项工作是代替不了的;但是考察一下其它地方所发生的事情也是有益的,即使只是弄清楚某个重要项目没有遭到忽视也是好的。

    第二节 储蓄

    (一)储蓄的必要性

    我们在前一节中确立的看法是,投资对经济的增长是必要的。由此,我们在被动的意义上可以说。储蓄是经济增长

    所必须的,因为要投资就必须进行储蓄。尽管如此,人们仍

    然要问,投资过程是否会自动创造所需的一切储蓄。因此我

    们不必为储蓄的数额担心,而集中力量进行投资。我们还可

    以进一步提出这样的问题,储蓄是否可能因破坏商品需求而

    抑制投资,所以鼓励人们花钱比鼓励人们储蓄要好。这些问

    题已经提出很久了,我们在详细分析储蓄的来源之前必须先

    谈谈这些问题。

    在任何收入水平上,人们只能消费现有的那么多消费品。

    由于他们的收入来源于生产的消费品和投资货物,又由于他

    们只能购买消费品,所以他们必须把自己的收入中相当于已

    经生产的投资货物的价值的那一部分钱储蓄起来。从这个意

    义上说,人们的储蓄额始终与投资额一样多。然而,他们这

    样储蓄的数额,可能并不等于他们在那个收入水平上愿意储

    蓄的数额。如果他们希望多储蓄一些,他们就要减少消费品

    的开支;如果他们希望少储蓄一些,他们就将增加消费品的

    开支。无论是哪一种情况,他们的开支不会与消费品所产生

    的价值完全一致。如果人们希望自己储蓄的数额超过投资的

    数额,那么生产消费品的厂商就要亏本,因为他们作为成本

    付出的那部分收入就不会作为销售额回到他们那儿来了;如

    果人们希望自己的储蓄数额少于投资的数额,那么这些厂商

    就会赚取意想不到的利润。无论哪一种不平衡现象都会引起

    进行调整的运动。如果人们希望自己储蓄的数额超过投资的

    数额,那么亏本的厂商就会减少支出,收入和就业人数就会

    减少。如果反过来投资超过储蓄,厂商就会增加支出,因而收入增加。如果存在着可以吸收的闲散劳动力、土地和资本

    等资源,那么收入的这种增加也将反映在实际产出和就业人

    数的增加上。但是如果扩大产出所需的某些资源或所有资源

    都短缺,那么收入的增加将仅仅表现为价格的通货膨胀性上

    涨。

    因此,这就是对储蓄是否有关系这个问题的答案。它确有关系。鉴于投资水平,如果人们的储蓄愿望过于强烈,物价就会下跌,如果他们的储蓄愿望不够强烈,那么就会出现这样的情况,要么产出增加,如果有这种可能的话,要么价格上涨。鉴于投资水平,人们同样有可能希望储蓄过多或过少。

    在维多利亚时代人们的思想中,没有产生这些问题,因

    为人们不习惯于将投资水平看作是一种可以独立于储蓄水平

    的东西。按照他们对这个问题的看法,企业家将他们自己的

    或借来的储蓄进行投资。他们不能将并不存在的储蓄用于投

    资,一切储蓄金都自动地用于投资。因此,储蓄永远等于投

    资,投资的水平决定于储蓄的水平。由于维多利亚时代的人

    希望增加投资,他们就能集中心思改进刺激储蓄的办法。然

    而在我们这个时代,我们既认识到储蓄金不一定总是用于投

    资的(有些储蓄可能贮藏起来了),也认识到某些投资可能超

    过当前的储蓄额(人们可能将贮藏的钱拿出来或筹集额外资

    金用于投资)。因此,我们对决定储蓄的力量和决定投资的力

    量单独进行分析,并认识到任何时候都十分可能存在对当时

    的投资水平来说储蓄过多或过少的现象。

    此外,当我们研究决定投资的力量时,我们看到了另一种可能性,而大多数维多利亚时代的人都忽视这种可能性。这是一种理论上的可能性,即储蓄额的增加可能抑制投资,而

    不是像他们所认为的那样自动导致投资的增加。这种理论是

    基于这样一种假设,即社会资本与其消耗量之间的比率是固

    定的,因为如果情况并非如此,资本积累的速度可能比消耗

    增长的速度快,资本消耗的增长率的下降不一定会制止资本

    的增长率。资本与消耗的比率是固定的吗?不一定是固定的。

    首先,生产消费品的工序的资本密集度可能比较高也可能比

    较低,作何选择在某种程度上取决于资本比其它资源便宜多

    少——也就是说取决于利率的水平。现在,进一步履行节约

    似乎会使利率下降,如果利率已经是很低了,那么下降的幅

    度不会很大,但是如果利率很高,那么下降幅度就会很大。因

    此,进一步履行节约可能会鼓励生产者使用资本密集度比较

    高的工序,所以可能为生产消费品而刺激资本的生产,哪怕

    消费品的需求量增长的比较慢也罢。这是一种理论上的可能

    性;限制消费量的增长朝一个方向拉,利率下降则朝另一个

    方向拉,所以最后会产生什么样的净效果,我们没有把握。也

    许更为重要的是,当我们问及消耗是什么意思时会出现什么

    样的情况。正如我们在前一节中所看到的,即使在富裕的工

    业社会中,固定投资总额中也只有大约30%的资金用于制造

    业和农业,因此与商店中的这些东西的消耗直接有关。大约

    60%被房屋、公用事业和公共工程吸收了,这些东西的需求

    量——或者无论如何是这些东西的投资需求量——与消费者

    目前在商店里的花钱水平并不是非常密切地相适应的,因为

    这些是期限很长的投资,从比较长远的观点来看,同所预期的需求量也是同样适应的。这些投资的资本密集度也是非常高的,资本—收入比率比制造业和农业的资本—收入比率高四五倍;由于这个原因,它们对利率的变动特别敏感。因此,进一步履行节约会减少对制造业的投资,同时对住房、公用事业和公共工程超比例增加投资,这看来是十分可能的。从理论上说,增加储蓄有可能抑制投资,但是增加储蓄同样有可能促进投资。

    那些资本已经非常充裕因而投资动力微弱的国家,必须

    考虑储蓄水平过高的可能性,否则可能遇到长期缺乏投资机

    会的危险。是否存在任何这样的国家,这是可以争论的,因

    为甚至连最富裕的国家也在不断提高它们所期望的住房、通

    信、医院等的标准,并在发明新的消费品和新的生产方法,这

    些都需要新的资本。我们将在下面(本章第三节(四))讨论

    这些国家的问题。在欠发达的国家里,不存在这种危险。这

    些国家的情况正好相反,私人如能筹到资金,他们很愿意投

    资,此外,政府需要对公路、供水、抗洪、灌溉、电力、工

    厂、学校、房屋、医院等许多工程进行投资。对这种投资起

    限制作用的并不是没有需求,而仅仅是缺少储蓄来为这种投

    资提供资金。在这些国家中,将比如说占国民净收入12%的

    富有成果的政府投资计划保持几十年是可能的,但是人们只

    愿意储蓄4%或5%。因此,如果筹措资金来弥补储蓄和投资

    之间的差额,那么得到资金的人就会在消费者市场花钱过多,

    因而会出现通货膨胀的趋势。另一方面,如果人们比较自愿

    地进行储蓄,那就可能增加投资而不会发生通货膨胀。不管

    比较发达的国家的情况如何,妨碍到欠发达国家进行数额比较大的投资的因素是,目前人们太不愿意储蓄了。

    现在,有些人认为,在这些国家,为了提高生活水平,进行投资是极其必要的,即使要付出通货膨胀的代价也要投资。因此,必须继续进行分析,看一看如果在超过自愿储蓄的水平的情况下进行投资会发生什么情况。

    一般说来,答案是货币收入将不断增加,直到它达到储蓄与投资相等的水平时为止。进行分析的目的是要发现这种平衡是如何达到的,需要多长时间,其间价格和产出会发生什么情况。

    首先谈谈产出。我们必须将产出立即发生的情况同在适

    当的时候这个过程创造的新的资本货物开始产生效果时产出

    发生的情况区别开来。新的资本货物创造的产出是一样的,不

    论它们的资金来源于储蓄还是来源于新筹集的资金。它对价

    格的影响也是一样的,也就是它使价格下降。在这方面,对

    于目的在于创造有用的资本货物的通货膨胀与其它通货膨胀

    要作重要的区别。当通货膨胀的目的是为了把货物腾出来用

    于毁灭目的时,我们之中的大多数人都把通货膨胀与战争联

    系起来。这种通货膨胀会变得越来越严重,因为不断增加的

    货币供应量可能会面临不断减少的货物供应量。与此相反,创

    造有用资本的通货膨胀会自行消失,因为它们迟早会造成市

    场货物供应量增加。产出有多快和多大,这取决于以这种方

    式集资的企业的性质。如果一项建校计划用这种方式筹资,那

    么价格将长期上涨,当表现在离校学生人数增加的效果开始

    显示出来时,价格可能不会下跌很多。但是如果新的资金在

    乡村用于保护水源,实施只需要几个月的时间就可以建成、花钱很少而水浇地的产量可以翻一番的计划,那么价格将上涨

    很少,并将很快下降,下降的幅度会比上涨大得多。

    记住下面这一点是很重要的,创造有用资本的通货膨胀

    最后会自行消失。尽管如此,分析一下在新资本产生效果之

    前的过渡时期所发生的情况也是重要的。在过渡时期产出发

    生什么情况,因此也就是价格发生什么情况取决于经济是否

    有闲散资金,这种资金很容易地被吸收来用于增加产出。在

    工业国,在发生衰退期间,工厂倒闭,工人失业。当投资增

    加时,因此有了工作做的人们用他们的一部分收入购买消费

    品,这就鼓励生产消费品的厂商生产更多的消费品,从而提

    供了更多的就业机会。所以这种螺旋形上升继续下去。可是

    在欠发达国家,情况就不同了。它们没有那种许多有用的设

    备闲着无用的工厂——或者就是有,为数也不多,甚至连最

    小的需求压力也会很快使产出达到极限。在其中有些国家

    ——尤其是在非洲——失业的人也很少,这种失业者是指如

    果以目前的工资向其提供就业机会马上就能工作的人。其它

    一些国家——尤其在亚洲——则人口过剩,特别是在农村,但

    是没有与人口相应的设备。如果将更多的货币投入流通,那

    就会使农业和手工业的产量略有提高,但是很快这些行业的

    生产能力就会达到极限,进一步增加货币收入只会起到使物

    价上涨而不是使消费品产量增加的作用。

    尽管如此,即使在由于缺乏生产粮食的土地或者生产制成品的机器而使消费品的产量无法提高的经济中,仍然有可能利用剩余劳动力来生产某些形式的资本,而不需将土地或设备从其它用途中抽回来。我们已经看到,大约50—60%的固定资本形成出现在建筑业中。现在有许多种建筑可以用手工进行,实际上不使用稀有的设备——从建造金字塔到19世纪中叶修建铁路大隧道的人类各项成就就是见证。剩余劳动

    力可以用来修筑道路,修建灌溉沟渠、蓄水池、房屋和其它

    许多种类的工程,无需减少任何其它东西的产量。其中有些

    工程,尤其是那些与农田用水或开垦土地有关的工程很快就

    能产生丰硕的成果。因此,从某种意义上说,有剩余劳动力

    的国家比没有剩余劳动力的国家优越,因为后一类国家不从

    生产消费品的部门抽回劳动力就不能增加它们的资本形成,

    而有剩余劳动力的国家则可以增加资本形成而不必在其它货

    物方面付出代价。

    妨碍使用这种剩余劳动力的一个因素并不是缺乏固定资

    本,而是缺乏流动资本。如果向雇来挖灌溉渠道的工人支付

    工资,工人们将把他们的工资拿到市场上去花掉。货币需求

    量将源源不断地增加,而消费品的产量不会相应地增加。因

    此,价格往往会上涨。这种情况,加上需求量的增加,也会

    刺激消费品的进口,这对国际收支会产生不利影响。如果用

    严格控制进出口的办法来防止这些影响,其结果只会使国内

    流通的货币数量增加,从而增加对国内价格的压力。

    这种价格上涨的前因后果是消费品从经济的其余部分转向新就业工人的再分配。这些新就业的工人原先以某种方式勉强餬口,也许是靠亲戚的接济过日子。现在他们境况好转了(否则他们大概不愿就业了),因此,别人的境况必定更差了,因为消费品的产量没有增加。所以价格的上涨仅仅代替了纳税,因为如果政府向整个社会征税,并用这些收入来支付开挖灌溉渠道的工人的工资,那么所得的结果是完全一样的,虽然价格没有上涨。是让通货膨胀还是征税,这在很大程度上是一种政治抉择。如果政府认为用通货膨胀的办法集资造成的政治困难少于征收同样数额的税所造成的政治困难,它们就用通货膨胀的办法。

    在通货不膨胀或者不征税的情况下完成基建工程的另一种办法是,说服人们为这些工程工作而不取报酬。我们已经看到(第三章第1节(一)),如果上述工程完全是对当地有利的,如果它们可能对村子里的几乎每一个人都有好处,那么这种办法确实是可行的。对这种活动,政府也是要花钱的。首先,它必须设立一个行政机构,以便在村子里为这种活动作宣传,组织村民们讨论和规划他们要做的事情,对活动的实施进行监督,一般说还要同受这些活动影响的所有其它政

    府部门进行联络(企图组织“社区发展”而没有专人来做这

    项工作是决不会有多大作为的)。其次,政府一般必须提供在

    当地不易得到的原料,还要支付帮助工作的熟练工人或其它

    技术人员的工资。人们已经发现,政府必须为以这种方法完

    成的工程提供30—50%的费用,其余50—70%无偿劳动的价

    值。这种努力是有价值的,这不但是因为这种投资将提高产

    量,或者采用这种方法可以避免通货膨胀和征税。它们之所

    以有价值还因为它们在乡村培养集体精神,因为它们使得村

    民们感到他们可以自助——这种感情一经唤起,可能在其它

    许多方向开花结果。这也是最好的计划工作,因为村民们不

    是被迫进行集体劳动,他们只为他们需要的项目工作;而在

    行政管理中心规划和支付报酬的工程,往往不能满足人民的实际需要,即使它们确实没有完全忘却遥远的农村地区的话。

    完全有理由将“社区发展”工作能够得到的一切资金全部用

    于这种发展工作。另一方面,必须认识到,这对资本形成可

    能做出的贡献,受到这样一个事实的限制,那就是人们将只

    为严格符合当地利益的项目工作。因此,决不能将它看成是

    可以代替大规模资本形成的其它方法的东西。在实行强制劳

    动的国家里,无偿劳动可能是非常重要的,但在其它国家,它

    的规模是受限制的。

    让我们继续设想资本形成是靠创造货币来集资的,并且

    继续讨论通货膨胀,看一看发生什么情况。首先,我们必须

    消除国际收支方面的危险。如果让通货膨胀而不控制进口,那

    么外汇储备很快就会枯竭。还可能有必要控制出口,否则国

    内需求量的增加将促使公众消费本来可以出口的国内商品。

    如果出口商品由那些并不在国内消费的商品(橡胶、可可)组

    成,那么就不会发生这种困难。但是如果出口商品也是国内

    可以消费的(大米、棉花、油菜籽),它可能是很重要的。控

    制出口并不容易,因为这涉及发放某种许可证或征购问题,对

    大工厂或种植园实行这些措施容易,对手工业工人或农民实

    行这些措施比较困难。然后还有由于国内提价而在出口市场

    上造成的困难。如果一个国家的出口是为了竞争,这是从该

    国的产出仅仅占世界产出的一小部分这个意义上来说的,那

    么世界价格不会受其通货膨胀的影响,当与世界价格相比国

    内成本上升时,它的出口额可能减少。可采取给予出口补贴

    等各种办法,但是任何大规模的通货膨胀的最后结果必然是

    货币贬值。这对小国来说并没有不利的影响,因为它的贸易条件并没有受到货币贬值的不利影响,又因为它的国外资产和负债通常是根据外汇来确定的;但是这对大国可能具有比

    较重大的意义。除了出口方面的这些困难以外,还必须再次

    强调控制资本外逃的必要性。通货膨胀促使人们保存外汇而

    不是本国货币,尤其是如果他们预料本国货币会贬值的话。如

    果把所有这些都考虑进去,那么要全面控制外汇情况,使通

    货膨胀对国际收支不产生某种不利影响,这显然是极其困难

    的,但是有些国家发现这些事情比其它事情容易处理。

    我们假定不许国际收支情况恶化,并继续进行分析。我

    们接着注意到,即使产出不变,某些欠发达国家在价格不受

    压力的情况下创造一些资本也是可能的。凡是经济越来越货

    币化的地方,就是这种情况,这是从这样一种意义上来说的,

    即与为了维持生计或物物交换而进行的生产相比,使用货币

    的数额越来越大了。由于人们需要更多的货币进行交易,就

    可将更多的货币投入流通,而价格不会受到压力。同样,在

    产出日益增加的任何经济中,可以将更多的货币投入流通而

    不会使物价上涨,不管这种增加是因为人口不断增加,还是

    因为有更多的土地用于耕种,或者因为生产率提高了。在任

    何日益增长的经济中,人们需要持有更多的货币,所以政府

    可以发行更多的货币而不会使价格上涨。令人遗憾的是,这

    种财源实际上并不很大。流通货币与国民收入的比率始终大

    大低于1。因此,即使换算成货币的产出每年增加2%,筹措

    用于投资的资金很难超过国民收入的大约1%,否则就会造

    成压力。

    超过这个水平,如果创造更多的货币用于投资,那么投资就会越过储蓄。于是货币收入就会不断增加,直到储蓄赶

    上投资时为止。达到这种新的平衡需要多长时间,这取决于

    储蓄水平是与货币收入密切相关,还是仅仅与实际收入密切

    相关。如果储蓄仅仅是与实际收入密切相关,那么储蓄不能

    靠增加货币收入来增加。因此,直到新的资本货物开始使消

    费品的产量增加之后,是无法达到这种平衡的。如果通货膨

    胀将收入从非储蓄阶级转向储蓄阶级,那么是可以在不增加

    实际收入和新的消费品到达市场之前达到平衡的。

    让我们比较充分地探讨一下通货膨胀逐步消失的可能性

    如何,即使不考虑它最后会给市场带来的消费品产量的增加。

    从这个角度来考虑,可以设想如下最有利的情况。假设政府

    雇用失业工人筑一条拦河大坝,并修建灌溉沟渠。这些失业

    工人将工资在市场上花掉,结果是价格上涨。如果我们假设

    这样做的结果只会使利润增加,并把这些利润全部储存起来,

    或者用于购买公债,那么就不会发生通货膨胀。价格上涨的

    数额相当于投资的数额,但是储蓄额也增加那么多,所以,虽

    然投资过程继续下去,价格也不会再涨了。这是一个极端的

    情况。如果我们假设,价格一上涨,全体社会成员为了使他

    们的实际收入和消费水平保持不变,要求并得到较高的工资、

    薪金和支付的利息,那么我们还可以看到另一种极端的情况。

    根据这一假设,在可以得到消费品新产量之前,是无法达到

    均衡的,因为在这种情况下,通货膨胀的过程不会使收入转

    入可能储藏钱财的阶级。

    因此可以说,实际上,通货膨胀限制在狭窄范围内的可能性取决于(1)通货膨胀是否会使收入转入储蓄阶级;(2)他们将储蓄金派什么用场;(3)多快能得到新生产的消费品。

    关于(1),一般说来,从通货膨胀中得到好处的阶级是

    企业家、农民,在某些情况下还有政府,企业家能得到好处

    是因为他们出售的商品价格的上涨速度往往比工资、薪金、房

    租、债券利息、养老金和他们其它一些开支增加的速度来得

    快。农民能得到好处是因为在一般情况下粮食上涨的幅度比

    其它价格的上涨幅度大,这是由于粮食的需求量是无弹性的。

    现在农民和企业家都比社会上其它阶级节约,所以几乎可以

    肯定,通货膨胀会使储蓄额增加。相反的意见是一种局部的

    意见。通货膨胀使拿薪金的中产阶级的储蓄额减少,因为它

    使他们的实际收入减少了;由于这个原因,又因为中产阶级

    比其它阶级说得多和写得多,于是往往有人断言,通货膨胀

    使储蓄额减少了。可是情况并非如此。中产阶级的实际收入

    减少了,而企业家和农民的实际收入增加了,这些阶级都比

    中产阶级更愿意储蓄。考虑一下通货膨胀对政府储蓄额的影

    响也是重要的。通货膨胀对政府收入的影响是根据收入中边

    际纳税额是比平均纳税额多还是少而各不相同的。如果边际

    纳税额超过平均纳税额,那么货币收入的增加就会使国民收

    入中纳税的份额提高。这样,到最后,开始靠发行货币来为

    其开支集资的政府,就达到了这样的地步,即它的收入已经

    增加了如此之多,以至于现在能保持新的开支水平而无需进

    一步发行任何货币。许多现代国家的政府都处于这种地位(例如英国、美国和苏联);而相反,在许多其它国家,政府收入在通货膨胀中落后于货币收入,其结果是通货膨胀使政府的赤字增加了而不是减少了。

    至于(2),即使通货膨胀使储蓄额增加,这也不会使通货膨胀停止,除非储蓄金被储藏起来,或者用以代替更多的新货币来作为一直在造成通货膨胀的投资资金。因此,如果企业家像他们乐于做的那样将其新获得的利润用作更多的新

    投资的资金,这对资本形成是非常有利的,但是它也可以使

    通货膨胀继续下去。如果在另一方面他们用自己的利润去购

    买公债,政府就能停止发行新的货币来为它的计划提供资金。

    (或者,如果从银行借钱的企业家制造了通货膨胀,那么如果

    现在获得利润的企业家用它们支付银行垫款,或者将它们储

    藏起来,或者购买正在进行新的投资的企业家的证券,通货

    膨胀将得到制止。)农民用他们的利润偿还债务,购买更多的

    土地,其效果如何取决于放债人和出卖土地的人将这些钱派

    什么用场。放债人也许把它储藏起来,等待“更好的”日子

    (即农民再次缺钱的日子),出卖土地的人可能以不同的方式

    作出反应。如果政府希望通货膨胀尽快停止,同时又保持其

    较高的(实际)开支新水平,如果它不能依赖将自己的储蓄

    金贮藏起来的储蓄者,那么它必须以某种方式得到这些储蓄

    金,不是以征税的方式把它们拿走,就是通过出售公债的优

    惠条件把它们拿走。

    储蓄金是贮藏起来还是投资于公债的可能性取决于通货

    膨胀率有多高,通货膨胀的时间持续多长。如果价格迅速上

    涨,或者持续时间相当长,那么人们就会对货币丧失信心,既

    不会保存货币,也不会保存公债。他们宁愿保存不动产,因

    为不动产的价格是随着通货膨胀而上涨的,人们普遍抛出货

    币而购买货物,这会加剧通货膨胀。人们是否抛出货币而贮存商品或固定资产,这部分是一个调节问题;总是有人抛出

    货币而购买商品或固定资产的。做股票投机对经济是有害的,

    因为它使原料更加短缺,甚至可能使生产缓慢下来,从而使

    价格上涨得甚至更快。购买固定资产的结果会使一些新的资

    产建立起来——建造房屋,改善农场,还可能出现许多新工

    厂。通货膨胀使固定资本形成增加;即使是恶性通货膨胀,例

    如1919—1923年德国的通货膨胀,也会产生这种结果。从长

    远的观点来看,这是一种非常好的结果,因为它使实际产量

    增加,使生活水平提高。但是在这种创造资本的方式发生的

    时候,它会使通货跟着膨胀,甚至可能像购买股票那样,由

    于从消费品工业抽走资金,使消费品的产量暂时下降,因此

    使价格更加急剧地上涨。

    如果一个国家的政府有一个有效的行政管理机构,它就

    可以用规定最高价格、配给基本消费品和发放新投资许可证

    的办法来防止通货膨胀失控。如果这些政策获得成功,它们

    也能从根本上抑制通货膨胀,因为人们往往把他们不能用于

    购买配给商品的钱储蓄起来,所以储蓄将同投资保持均衡。这

    就是第二次世界大战期间英国和美国战时财政获得成功的秘

    密之一。在此期间,尽管做出巨大的战争努力,物价只上涨

    了50%左右。(另一件重要武器是很高的边际税率,它吸收

    50%或更多的支出,其速度和它产生收入一样快。)目前,管

    理通货膨胀使其不至于失控的方法,比20年前得到人们更深

    切的理解。然而这些方法只有拥有有效行政机构的政府才能

    使用,这些政府主要是先进工业国的政府。欠发达国家的行

    政机构的效率相当低,它们控制通货膨胀的尝试所造成的害处往往和它们带来的好处一样多,尤其是如果这些尝试的主要效果是使得毫无控制地生产非基本必需品变得更加有利可图或者建立黑市网和鼓励贪污腐化的话。

    通货膨胀的最严重后果是物价大幅度上涨或者持续时间很长,以致使人们对货币丧失信心。短时间幅度不大的通货膨胀不会发生这种情况。如果在二三年内物价每年上涨5%,人们是不会感到恐慌的,因为他们相信,物价不久会再次下降。管理得比较好的国家的货币当局维持了这种信心,它们的习惯并不是逐年不断增加货币供应量,而是使短期货币膨胀阶段与严格限制阶段交替出现。银行信贷上升三步,下降一步,而不是连续上升。这样,创造新货币有助于资本形成,

    而不会引起恶性通货膨胀,也不会严重影响人们对货币和公

    债的信心。原则是,如果要将通货膨胀用于资本形成,那么

    最好是一次用一点,而不要连续使用。

    至于(3)我们已经看到,在任何情况下,用于创造有用

    资本的通货膨胀会自行消失,因为到适当时候,新资本源源

    不断地生产出消费品,这些消费品不但会制止物价上涨,甚

    至还会使物价下跌。此外,实际产量的这种增加也可能使储

    蓄增加,因而提供了使投资保持在较高水平的储蓄金。储蓄

    增加不一定意味着实际产量也增加,因为储蓄水平是与收入

    分配密切相关而不是与人均实际收入水平密切相关;可是我

    们无需马上讨论这一点,因为我们一会儿就要讨论决定储蓄

    的各种因素了。

    如果要将通货膨胀用于资本形成,它只应间歇地和少量地使用;除了这条原则,我们不妨再加上这样一条原则,即它只应当用于很快就能完成的,此后利润率很高的投资。要说明用新资金资助一项农业推广业务,传播高产新技术知识的例子,或者那些向农民提供更多的水而又不涉及在河流上修建工期长、造价高的工程的措施,或者使新的肥沃地区迅速可以耕种的清理土地、排水和开垦土地的计划的理由,是

    比较容易的。而需要大量外汇的计划(例如为工厂购买机

    器),或者实施起来要经过很长时间的计划(例如多用途河流

    流域工程),或者资本和产量的比率很高的计划(例如建造幼

    儿园),用创造新货币的办法来筹资是不适当的。人们可能认

    为,这条“原则”并不是特别有意义的,因为所有投资来源

    于全部储蓄,所以从一个规划中挑选出几项计划是没有用处

    的,这些计划被说成是通过自愿储蓄来集资的,而其它计划

    则被说成是靠创造新货币来集资的。因此,也可以认为,比

    较好的“原则”将是避免所有这样的计划,它们与产出相比

    费用很高,或者实施时间很长,或者需要大量外汇,在这种

    情况下,边际计划将是那些从这些观点来看最不可取的计划,

    从某种意义上说,用新货币来提供资金的永远是这些边际计

    划。可是实际上,情况并非如此。许多计划不顾这些标准都

    在一项投资规划中找到了一个位置(例如公共卫生计划或工

    业化计划),实际情况并不是不包括在内的计划引起通货膨胀

    的可能性永远比包括在内的计划大。因此,考虑这样一项投

    资规划是有意义的,即在制订这项投资计划时首先假定不创

    造货币,然后再加上这样一点,即如果允许一定程度的通货

    膨胀,那么现在加到规划中去的计划在要不然不包括在内的

    计划中是最不会引起通货膨胀的。(除了通货膨胀,如果最后的收获是丰硕的,那么就不应当排除要经过很长时间才能产生效果的投资;这些投资和其它投资之间的抉择,仅仅取决于利率的高低。)

    (二) 国内来源

    我们在本章第一节中已经看到,人均国民收入不增加的

    社会,每年的投资占它们国民收入的4%或5%或更少,而进

    步的经济每年将12%或更多的国民收入用于投资。经济增长

    理论中的主要问题是理解一个社会从储蓄5%变为储蓄12%

    的过程——以及伴随这种转变而来的态度、制度和方法的变

    化。

    人们习惯于从进一步履行节约和更有效地使用储蓄金的

    角度来说明这种转变。进一步履行节约是事实,但是如果因

    此认为主要的变化是社会上所有阶级都变得更加节约或者减

    少了浪费,那也会使人产生很大误解。因为主要变化是社会

    上出现了一个新的阶级——营利企业家——它比所有其它阶

    级(地主、雇佣劳动者、农民、领薪金的中产阶级)都更节

    约,与所有其它阶级相比,它在国民收入中所占的份额增大

    了。在私人资本主义社会,这些企业家赚取私利并为了自己

    的利益将它们用于再投资;而在苏联,大幅度增加的利润作

    为“营业税”被掩盖起来了,为了公众的利益,计划人员将

    这些利润用于再投资。但是,无论何种情况,从储蓄5%转变

    为储蓄12%的主要特点是利润在国民收入中所占的份额大

    幅度增长。

    利润的相对增加不一定与收入分配不平等现象的增加是一样的,因为这种增加同租金收入相对重要性的相应下降是联系在一起的。事实上,收入分配得极其不公平的社会,并

    不是那些具有巨额利润的富裕社会的经济,而是那些交纳巨

    额租金的贫穷、人口过剩的国家的经济。在斯里兰卡或波多

    黎各,10%收入最多的人,他们的收入大约占个人收入总额

    的40%,而在英国或美国,这部分人的收入在纳税之前接近

    30%。这些数字是有点令人误解的,因为公司未分配利润不

    包括在个人收入的估计数字里;如果将未分配利润考虑进去,

    那么两者不可能有多大差别。无论如何,就不平等现象而言,

    不可能对比较发达的经济和欠发达的经济进行一般性比较。

    欠发达的经济之间是有差别的,这要看土地是多还是少,所

    有权是很分散还是很集中,还要看在它们内部,矿山或种植

    园等资本主义企业是否很发达。比较发达的经济也是有差别

    的,它们的个人收入的分配今天也比20年前公平(在纳税之

    前。虽然这主要是由于与分配的利润相比,未分配利润增加

    了)。然而,比较发达的经济和欠发达经济之间在这方面没有

    特别的差别这个事实,只对我们的结论有利。储蓄金和国民

    收入的比率不仅是与不平等现象密切相关,而且更确切地说

    是与利润和国民收入的比率密切相关。

    巨额租金收入不会被储蓄起来,因为拥有土地的贵族并

    不考虑将他们的收入用于生产性投资——无论如何,在有一

    个资本主义的例子可以仿效之前,他们是不会有这种考虑的。

    租金收入历来用于购买更多的土地,雇佣大批侍从(如果中

    央政府很弱,则包括一支私人军队),建造教堂、庙宇、陵墓

    和纪念碑,创办慈善事业,寻欢作乐。随着时间的推移,在资本主义的压力下,这些习惯改变了。租金要征税,再加上有利可图的资本主义投资的例子,往往使得地主变得更加节

    约;在先进的资本主义社会,租金甚至可能成为用于生产性

    投资的储蓄来源(次要的来源)。可是这是在事件以后发生的;

    所以不能以地主变得更加节约来解释社会从储蓄5%转变为

    储蓄12%这种变化。

    农民阶级的情况也是如此。农民是一个阶级,他们既有

    节俭的美德,又动辄就要借债,这是自相矛盾的。农民之所

    以学习节约是因为他们知道自己离灾难的边缘是多么近。在

    某些社会里,差不多年年发生水灾、旱灾、蝗灾、牛疫或某

    种其它天灾,除了那些有点积蓄可以垫补的农民以外,使得

    全体农民变得一贫如洗。这些经常发生的灾害是农民动辄就

    要借债的部分原因。与此同时,那些有积蓄的农民,往往不

    是将钱借给遭到不幸的农民,就是用来购买土地,无论哪种

    情况,结果都不是使资本形成增加。购买土地使价格上涨,并

    使土地的分布情况发生变化,但这并没有使土地出产更多的

    东西。如果农民拥有土地,他们可能投资改善土地,但是大

    部分改善土地的方法都会使土地的产量暂时下降(休耕、轮

    作、造林、种草、控制侵蚀),在土地遭受压力大的地区是不

    受欢迎的。农民还喜欢对牲畜进行投资,但是亚洲和非洲的

    许多农民对牲畜的态度不是以获利为目的的,所以在许多情

    况下,这种投资是一个负担,而不是利润的来源。考虑到农

    民的生活很不稳定,他们对土地和牲口采取不为营利的态度,

    所以农民的资本形成净额在国民收入中只占很小一部分就不

    足为奇了。

    拿工资和薪金的阶级比农民有比较固定的收入,在一般

    情况下,甚至连城市非熟练工人的收入也比普通农民多。然

    而这些阶级储蓄很少,因为他们想的是花钱而不是储蓄。工

    人的储蓄金很少。拿薪金的中产阶级储蓄不多,但是在几乎

    每一个社会,中产阶级用他们的薪金存的钱对生产性投资没

    有什么意义。这在统治阶级在种族上不同于中产阶级和下层

    阶级的国家里尤其如此,因为在那种情况下,中产阶级似乎

    要以摆阔气的挥霍浪费以及表明他们同外国统治者一样优越

    的热情来显示自己(第二章第一节(二))。在任何情况下,用

    薪金进行储蓄的数额是不多的,这几乎是普遍现象。中产阶

    级的大多数成员永远在为赶上同伴而斗争;如果他们设法存

    了足够的钱来购买他们所住的房子,那他们的日子就算过得

    不错了。他们可能存一点钱做子女的教育费或者在年纪老了

    的时候补贴生活,但是这种储蓄实际上被为了同样目的而用

    掉的储蓄金抵销了。如果收入或人口在增加,那么这种抵销

    是不完全的,因为每一代人储蓄的数额都比前一代人储蓄的、

    现在正在使用的数额大。这些储蓄金对于进行储蓄的个人来

    说自然是很重要的,存一点钱以便在遇到困难的时候使用,这

    是很重要的,即使在福利国家也是如此,社会改革家历来敦

    促人们储蓄,他们是正确的。可是,这些储蓄金仅仅是推迟

    未来的消费,因此在很大程度上被其它推迟的消费抵销了,这

    个事实意味着,它们对于生产性投资并不具有重要意义。

    拿薪金的中产阶级储蓄额少这个事实也证明,储蓄和收

    入的不平等现象并不是直接有联系的。中产阶级的收入比平

    均收入或者小农或非熟练工人的收入多,两者之间的差距,欠发达国家比工业国大得多。其部分原因是由于欠发达国家更缺乏中产阶级的技能。出现这种现象也是由于中产阶级在比

    较富裕的国家和比较贫穷的国家之间的流动性比较大,这就

    使得他们能在比较贫穷的国家要求过他们在比较富裕的国家

    所过的同样高的生活水平;事实上,由于穷国不得不从富国

    吸引中产阶级的技能,中产阶级在穷国的生活水平往往比他

    们在富国的生活水平高。因此,收入的更加不平等与被中产

    阶级消耗掉的国民收入部分增加有关。

    没有什么证据可以证明储蓄来源于工资、薪金和农民的

    收入。有证据证明,即使在最富裕的国家,这些储蓄很少超

    过国民收入的4%。日本是一个引人注目的例外,据说日本的

    这些数字高达8%或10%。根据迄今所作的最好的计算,欠

    发达国家小额储蓄似乎接近于国民收入的1%。无需说,即使

    占国民收入的1%、2%或3%,也不应小看:采取措施使小

    额储蓄从1%上升到2%或3%是很值的。这些措施在于确定

    机构、宣传和财政刺激的方向。可以设立一系列储蓄机构——

    邮局储蓄、友好协会、信用合作社、零售合作社、保险单、建

    筑协会等,经验表明,储蓄额的大小,部分地取决于这些机

    构的分布有多广;如果它们就设在人们的眼前,达到街道有

    储蓄所,工厂有储蓄所,或者甚至发工资时扣除储蓄金的程

    度,那么人们会比最近的储蓄机构也在一段距离以外的情况

    下存更多的钱。储蓄也是一种习惯,它在某种程度上可以通

    过宣传来养成。如果向人们说明进行储蓄的某种可以接受的

    理由,他们会存更多的钱。他们在战时储蓄较多的钱,其部

    分原因是他们相信这是一种爱国行动;他们也可能在实行发展计划的国家储蓄较多的钱,如果这些计划引起他们的兴趣,

    如果他们相信这是作贡献的一种方式的话。此外,还可以说

    服人们相信储蓄是符合他们个人或家庭利益的,说服他们为

    接受教育,安度晚年,购置房屋,举行婚丧仪式,或者作为

    预防疾病或灾害的一种保障措施而储蓄。即使这些储蓄在很

    大程度上被消费抵销了,但是养成自力更生的习惯和避免受

    穷这两条理由迫使我们尽自己所能来促使人们储蓄。保险的

    原则很容易被人们所接受,实行便宜的、广为宣传的个人人

    身保险制度对储蓄会起刺激作用。此外,对储蓄实行财政刺

    激应当适当,就是说利率应当有吸引力。小额储蓄的利率一

    般只有2—3%,其部分原因是收集和使用小额储蓄的费用往

    往很高;但是很可能有理由对小额储蓄的利率实行补贴,这

    样就能提供比较有吸引力的利率。如果社会也在利用通货膨

    胀来促进资本形成,结果使币值下降,那么对小额储蓄的实

    际价值应予保证。否则小储蓄户会受到歧视(因为其它资产

    的价值随着价格的上涨而提高),小额储蓄受到抑制。

    由于农业在经济发展中所起的作用,鼓励农民储蓄是特

    别重要的。经济增长的结果是,与农业相比,所有其它活动

    都扩大了——因为粮食需求的收入弹性还不到1。因此,相对

    地说,其它职业时刻在增长,从事那些职业的人必须靠仍然

    从事农业的农民所生产的东西来养活。因此,经济的增长要

    求每个农民生产的东西必须增加,每人提供越来越多的剩余

    农产品来养活不是农民的人口。在农业生产率最低的时候,每

    个农户生产的粮食除自己食用外,还可养活半个非农户家庭;

    而在当代生产率达到最高水平的情况下,每个农户生产的粮食除了自己食用外,还可养活其它7个家庭。

    储蓄从两个方面进入这个过程。首先,所需农业生产率

    的提高,一般意味着必须增加对农业的投资。为此,政府可

    以拨出款项通过农村银行或信用社借给农民。可是这涉及到

    将其它经济部门的资本吸收到农业中去(除非这些钱来自地

    主所缴的税款)的问题,由于所有其它部门同时也在要求得

    到资本,所以农民自筹的资金越多越好。这就使得在农村地

    区开展储蓄运动和设立储蓄机构具有特殊的意义。

    储蓄也可能以另一种方式进入这一过程。如果农业生产

    率提高,并提供更多的剩余农产品供应城市,那么政府往往

    会情不自禁地以征税的形式将这些剩余农产品从农民手中拿

    走,用作其它部门扩充的资金,包括公用事业或制造业的资

    本形成。这是一种双重的诱惑,因为向农民征税为寻找急需

    的资金提供了一个机会,还因为如果不向农民征税,那么他

    们实际收入的增加,可能使得有必要在城市和其它职业中增

    加实际工资和薪金,以便继续从农业方面吸引劳动力。实际

    工资和薪金的这种增加,减少了利润在国民收入中的份额,因

    而也就是减少了储蓄在国民收入中的份额。因此在许多情况

    下,在农业生产率提高的同时,对农民征收重税,用以为其

    它部门的资本形成提供资金。在这些情况下,如果人们说远

    不是农业从其它部门吸收资本,而是农民不得不为工业革命

    提供资金,那是符合实际情况的。日本就是一个恰当的例子。

    在那个国家,从1885年至1915年,从事农业生产的人的人

    均生产率提高了1倍,但是正如B.F.约翰斯顿先生令人钦

    佩地描述的那样(见本章的书目注释),增加的产品有很大一部分以提高租金或税收的形式从农民手里拿走去资助其余的

    经济部门了。苏联是另一个例子,在两次世界大战之间,尽

    管实行农业机械化并向城市输送了许多劳动力,苏联的人均

    农业收入一直保持在很低的水平。他们这样做采取两种办法,

    即提高制成品对农产品的比价和对集体农庄征收重税。如今,

    黄金海岸,缅甸和乌干达也提供了例子,从1945年起,这三

    个国家政府将农产品价格上涨部分的很大一部分扣住不给农

    民,而将收入的一部分用于资助其它经济部门的经济发展。

    如果某个其它集团提供必要的储蓄,那么即使不对农民

    征税来为资本形成提供资金,经济也能发展。实际上,储蓄

    的唯一其它主要来源过去一直是商业企业的利润,正如我们

    一会儿将要看到的,如果情况有利,那么与国民收入相比,欠

    发达国家商业企业的利润往往是增长的。如果想在利润仍占

    国民收入一小部分的时候加速资本形成,那么实际上除了向

    农业多征税以外,用其它办法是做不到这一点的,这是因为

    农业在国民收入中占50—60%,还因为作为经济增长过程的

    一部分,扩充其它部门是可取的,由于这个事实,向其它部

    门征税有困难。正如苏联所发现的,向农业征税在政治上也

    是非常难以做到的,除非农业生产率迅速提高,征税不会降

    低农民的生活水平。如何才能做到这一点的样板不是苏联提

    供的,而是日本提供的。原则是,工业化和巨额资本形成的

    任何计划,都应当同时采取迅速提高农业生产率的措施——

    主要不是使用拖拉机或实行新的经济结构,而是使用新种籽、

    肥料、农药和水,在这种做法的后面,又存在一个政治问题,

    即农民拥有政权的国家是否能实行这种计划。关于这一点,我们将在第七章里再讨论。

    除了为促进资本形成而对农民进行榨取的情况之外,任

    何经济中储蓄的主要来源是分配的或未分配的利润。如果有

    人要问为什么营利阶级比所有其它阶级都更倾向于履行节约

    和进行生产性投资,答案也许可以从它在社会等级制度里所

    占的地位中找到。与拿薪金的中产阶级不同,资产阶级不必

    为了使其他人对他们在社会上的重要性有深刻印象而大肆挥

    霍,因为他们作为营利者和其他人的雇佣者的独立地位,以

    及他们众所周知的财富,保证他们在社会上有一定的威信;中

    下层阶级决无可能存很多的钱,不论他们的实际收入可能提

    得多么高,因为他们始终模仿那些比他们自己更富裕的人的

    消费标准,而富人能够储蓄,因为他们的收入除了维持他们

    公认的消费标准外还有富余。营利者的社会地位比拥有土地

    的贵族低,但是他们知道,仅仅靠大肆挥霍,他们是无法获

    得贵族的威望的,所以只有少数营利者试图这样做。和贵族

    一样,他们渴望得到权力,但是他们通往权力的道路的方向

    不同。贵族是靠增加地产来获得权力的,(在封建和早期资本

    主义阶段)是靠垄断最高政治、军事和宗教职务来获得权力

    的。另一方面,营利者知道,他的权力在于金钱;因此他将

    钱储蓄起来,并将钱用于投资以获得尽可能多的利润。和农

    民投资一样,营利者也将其一部分钱仅仅借给其他人用于消

    费,或者仅仅用来购买土地,这两种“投资”形式都不会增

    加资本形成。但是营利者知道,最有利可图的投资是利用新

    技术或开发新资源的投资,这些也迎合他渴望获得权力的心

    理,因为他的生产性投资越多,在他手下工作的人也越多。因此,只有资本家的抱负是朝着用自己的收入来建立一个砖块

    和钢铁的帝国的方向发展的;所有其它阶级都以其它方式实

    现其抱负——拿薪金的中产阶级摆阔气,农民阶级购买土地

    或担任职务。在资本主义后期各阶段,这些界线混淆了;资

    本家通过金钱或婚姻进入有土地的贵族的圈子,并且企图担

    任政治职务;地主们进了城,并用他们的租金进行生产性投

    资;甚至连农民也想到,花钱改良已有的土地与花钱买更多

    的土地一样有利。在后期各阶段,履行节约和进行生产性投

    资扩大到社会上的所有阶级,但是最初进行生产性投资却是

    资产阶级的特点。

    由于这个原因,人们有时断言,节约主要是资本家的美

    德,有些历史学家将资本主义的加速扩大同宗教改革运动联

    系起来,想用卡尔文学说来解释越来越爱好储蓄的倾向。这

    种联系过于简单了。资本主义哲学有三个组成部分,即抑制

    消费,愿意尽量多生产,喜欢进行生产性投资。第一点即抑

    制消费,在所有时代已被几乎所有宗教公认为一种美德。然

    而许多鼓吹抑制消费的哲学也将这一点同劝说人们不要重视

    生产和生活中物质性的东西这种理论联系起来。相反,这些

    哲学鼓励人们得过且过,把时间花在精神修养上,或者花在

    军事、恋爱、运动、骑马、学习、诗歌或交际等这些艺术上。

    资本主义哲学的第二个组成部分使得它不同于这批人,它把

    工作和效率视为美德,并认为人类在道义上有义务最大限度

    地利用上帝赋予他的才能和智慧。如果我们有道义上的义务

    生产尽可能多的产品,再加上有道义上的义务抑制消费,那

    么我们就可以说,我们有道义上的义务生产剩余产品。然而,即使这个概念也不限于新教神学。资本主义哲学的特点是它的第三个组成部分。这一部分为这种剩余产品规定了特定用

    途,即生产性投资。其它哲学规定了其它用途——剩余产品

    应用于慈善事业,或者雇用一批侍从,或者用于进行战争,或

    者建造金字塔、陵墓、乡间宅第、庙宇或教堂,或者用于开

    办大学。鼓吹抑制消费或努力劳动的并不是只有资本主义哲

    学。但是只有它将这些主张同认为进行生产性投资是正确利

    用剩余产品这种观点联系起来。这些主张最后披上了宗教外

    衣,在这种外衣下,节约成了美德,慈善事业是破坏别人性

    格的一种手段。但是从分析资本家在社会等级制度中的地位

    和抱负来寻找对这个极其重要的主张,即进行生产性投资的

    主张的真正解释,也许比从对宗教经文的解释中来寻找更为

    有用。

    如果利润是储蓄的主要来源,那就必须用利润在国民收

    入中所占的份额增大这个理由来解释经济从储蓄5%到储蓄

    12%的转变。何以如此?

    一个显而易见的答案是:由于资本家连续将利润用于再

    投资,所以与其它部门相比,资本主义经济部门增长了。在

    欠发达国家的经济中,资本极少,资本家提供的就业机会也

    极少。随着资本主义部门的扩大,它从许多来源吸取力量。经

    济中的农业部门通常是有剩余劳动力的,因为并不是所有家

    庭成员都忙于耕种土地,人们慢慢地到城里资本主义企业中

    干活。手工业中也有这种情况,尤其是如果资本家采用新技

    术破坏手工业生产的话。资本家还从家庭服务业中吸引工人,

    他们还提供就业机会来吸引家庭中的妻子和女儿,从而使“从事有收益的工作的”成人妇女在人口中的比例增加了。如果社会上人口过剩,那么大概还有许多剩余劳动力当临时工

    和做小买卖,这些人很愿意有固定工作做,哪怕工资只够餬

    口。此外,如果人口不断增长,那么资本主义企业即使不从

    其它部门招工,也可以从新增加的人口中吸收一部分工人。从

    亚当·斯密起,古典经济学家常常强调,经济的发展使工人

    从非资本主义雇佣转为资本主义雇佣——他们称之为从“非

    生产性”雇佣变为“生产性雇佣”,这种转移率的高低取决于

    储蓄的程度和资本的增长率。如果要进行生产性投资的话,必

    须发展资本主义经济部门。因此,与整个经济相比,它是否

    发展取决于其余经济部门发展的速度——取决于人口增长

    率,尤其是取决于农业部门的生产率是否也提高。资本主义

    部门比其余经济部门发展得快不是不可避免的。

    首先,许多事情取决于资本投资的政治安全性。在资本

    主义之前的大多数文明社会中,资本家是任凭政治贵族摆布

    的。他们应将自己的财富借给挥霍无度的贵族消费,借给进

    行冒险的王子们用于军事方面;如果他们的投资取得了突出

    的成绩,他们就很容易突然面临任意的征收。在这种情况下,

    资本家行事小心谨慎;首先他们寻求有权势的老爷们的保护,

    将他们很大一部分财富变为私人贷款;他们还将资金变为容

    易隐藏和容易转移的财富,如黄金和宝石,而不是像固定资

    本那样可能失去的东西。因此,在生产性投资变得相当安全,

    不会受到任意劫掠之前,资本主义经济部门是不可能迅速扩

    大的。

    如果政治上安全而投资机会又是非常有利可图,那么资本主义部门很可能迅速发展。在资本主义发展初期,只要付给维持生活的最低工资,就可以从已经提到的来源雇佣无限

    劳动力,这是因为与总人口相比,资本家雇佣的劳动力为数

    很少,要是人口过剩,或者人口增长很快,那么情况就更加

    如此了。在这样一种情况下,资本主义部门生产率提高所带

    来的好处,几乎全部变成利润了。这些增长可能与技术进步

    有关,或者可能由于通讯条件的改善或地理上的发现,贸易

    机会扩大了。生产性投资机会扩大得越快,利润增长得也越

    快,资本积累就越多。在一个技术上无变化,或者地理上无

    发现的社会,利润增长得慢,资本增加得慢,它们增长的速

    度可能不比其余经济部门快。但是,一旦出现富有成果的投

    资机会,那么几乎可以肯定,利润将会比国民收入增长得快,

    因此,国民收入中用于再投资的份额将不断增大。

    这就是说,任何“工业革命”的根本原因,也就是说,资

    本形成速度突然加快的根本原因是赚钱的机会突然增加,不

    论这种新机会是新发明,还是制度改革,使得有可能利用现

    有的可能性。英国、日本和俄国的工业革命都属于这种模式。

    在每一种情况下,直接结果是,提高生产率的好处,并不是

    为那些将会增加消费的阶级——农民和靠工资为生的人——

    所得,而是变成了私人的利润或政府的税收,在那里,收入

    用于进一步的资本形成。越来越多的劳动力进入拿工资的工

    人行列,但是实际工资不得增加得像生产率那样快。

    通货膨胀也使资本家的利润增长速度加快了,在所有资

    本主义国家的经济中,通货膨胀是经常发生的,有时以与经

    济周期的高涨阶段有关的温和形式出现,有时则以与战争和政府铺张浪费有关的剧烈形式出现。与其它收入相比,通货

    膨胀使利润增加,还促使人们抛出货币购买砖块和钢材。每

    次通货膨胀后必定出现通货紧缩,那时利润少,投资受抑制。

    但是通货紧缩阶段很少像通货膨胀阶段那么长。长远的趋势

    是货币供应量增加,物价上涨,或者至少下跌得不像日益提

    高的生产率所要求的那么快。大多数产量迅速增加,与国民

    收入相比投资迅速增大的历史时期,物价也是上涨的,利润

    也是增加的——例如1780年以后的英国工业革命,或者英国

    1890年至1913年的投资率(国内加国外)比1870年至1890

    年高,或者第一次世界大战结束以后法国和德国通货膨胀期

    间比较高的投资水平,或者从1870年至1913年日本经济迅

    速增长,或者俄国的第一、第二和第三个五年计划,或者就

    此而言,经济周期与其稳定或下降时期相比的高涨时期。通

    货膨胀并不是经济增长的根本原因。即使不发生通货膨胀,利

    润也可能增加,投资也将进行。另一方面,不时发生一点通

    货膨胀会使利润增加,加速资本形成。

    如果经济由储蓄5%转变为储蓄12%的过程主要取决于

    与国民收入相比利润增加,那么,因此可以说,穷国为什么

    储蓄得如此之少的正确解释并不是因为它们穷,而是因为它

    们的资本主义部门太小了。如果自己愿意,没有一个国家穷

    得不能将12%的国民收入储蓄起来;贫穷从来没有妨碍过国

    家发动战争或以其它方式浪费钱财。这些国家根本不能以贫

    穷作为不储蓄的借口,在这些国家里,40%左右的国民收入

    被10%收入最多的人浪费掉了,他们靠租金过着奢侈的生

    活。在这种国家里,生产性投资少并不是因为没有盈余,而是因为盈余被用来维持大批不生产的侍从,修建金字塔、庙

    宇和其它耐用消费品,而不创造用于生产的资本。要是这些

    盈余作为利润归资本家所有,或者作为税收归注重生产率的

    政府所有,那么在不发生通货膨胀的情况下投资水平将会高

    得多。还应当指出,当我们说,由于资本主义部门小,所以

    储蓄额少时,我们并不仅仅是指私人资本家,而是用这个词

    也指国家资本主义,或者任何其它经济组织形式,在这些组

    织形式中,资本用于雇佣人员,在支付工资和薪金以后,仍

    然有数额可观的盈余,其中很大一部分用于生产性投资。实

    际上,根据苏联的情况来判断,国家资本家积累资本的速度

    可以比私人资本家快,因为它为了达到这个目的不仅可以利

    用资本主义部门的利润(伪装成税收),而且还可以利用它从

    农民那里强征来的东西或征来的税收,或者通过通货膨胀从

    整个国民经济中榨取的东西。

    在对资本家利润增加的情况所作的这种经济分析后面,

    也存在着出现资产阶级,也就是说,出现一批考虑将收入用

    于生产性再投资的人的社会学问题。在资本主义之前的经济

    中,占支配地位的阶级——地主、商人、放债人、教士、士

    兵、王子——一般是不作这种考虑的。是什么因素使一个社

    会产生资产阶级,这是一个非常难以回答的问题,大概没有

    答案。大多数国家似乎是从国外引进资本家开始的。外国商

    人或外国投资者开辟了新机会,获得利润,并将其中一部分

    利润在该国进行再投资;于是他们的榜样受到人们的仿效。本

    地资本家的出现是与新机会的出现联系在一起的,不论这些

    机会是从国外学来的,还是在国内独立发现的。这些机会可能是新技术,也可能仅仅是市场扩大的结果,由于外贸有了

    新机会,或者国内通讯条件改善,或者国内平静,市场扩大

    了。如果机会仅仅是贸易方面的,那么新阶级的观点主要是

    商业观点,但是如果也出现了新技术,或者有了资本可使其

    产生效果的新资源,那么也将有一批资本家,他们主要考虑

    固定资本形成的问题。我们在第三章里已经看到了政治、宗

    教和种性制度在帮助还是扼杀企业家阶级的出现方面的重要

    性;机会和制度互相起作用,共同决定这个阶级的成长速度

    以及允许它活动的范围。

    日本的例子特别令人感兴趣,因为正如I.I克雷默先生

    最近所指出的,它使地主和贵族很快就变成了资本家。这种

    情况是在国家出钱使贵族放弃封建权利并剥夺他们的行政职

    务之后出现的;与此同时,它还接管了封建贵族的债务。有

    些贵族发现自己有很多钱(或者更确切地说是公债),又不承

    担义务,于是首先转向银行业,1880年当政府决定它准备出

    售一些它为了开拓目的而开设的工厂时,它发现了一个现成

    的市场。从老式贵族到新式资产阶级的这种迅速转变在19世

    纪极其重要的最后25年对日本企业精神的增加是极其重要

    的。与此同时,虽然以前封建贵族靠商业阶级来养肥自己,并

    将商业资本变为消费贷款,但是商业阶级现在找到了进行生

    产性投资的新自由,并且由于日本一些最富有和最有权势的

    家族参加了他们的行列,他们的实力是大大加强了。

    我们还注意到一个新的国家资本家阶级在现代世界上成

    长起来了(例如俄国和印度),由于某种原因,他们决心迅速

    为政府创造资本。这些国家资本家和私人资本家一样重要,因为他们对储蓄和生产投资的重要性持有类似的观点。民族主义、加强军事力量的愿望以及向老百姓的贫穷全面开战的迫

    切要求的发展,大大加强了这种趋势。

    迄今,我们一直在讨论一个国家的经济从5%的储蓄水

    平提高的过程。现在还应当指出,与国民收入相比,资本主

    义部门不能继续迅速扩大了,因为如果它迅速扩大的话,它

    迟早必须逐渐将整个经济包括进去。在有足够的资本为每一

    个人提供资本主义就业机会的时候,这种相对的扩大就停止

    了。此外,由于资本主义部门雇佣更多的人,与其它部门相

    比不再是小规模的了,所以它仅仅靠支付相当于维持最低生

    活水平的固定实际工资来进行扩充已经不再可能了。如果农

    业仍然按农民的方式组织,如果不采取特殊措施来提高农业

    的生产率,那么这种情况可能像在法国那样发生得比较早。因

    此就出现资本的进一步积累使实际工资增加的时期。技术进

    步所带来的一切好处也不再全部变成利润,因为投资利润率

    的提高使劳动力的需求量增加了,因而使实际工资增加。所

    以就出现了这样一个悬而未决的问题,那就是资本的进一步

    积累和技术的进一步发展是使工资增加还是使利润增加,或

    者如果两者都增加的话,哪一个增加得快。过去大多数经济

    学家预料,在资本主义的这个后期阶段,利润率将会下降;也

    就是说,他们预料在进一步发展所带来的好处中,工资将占

    最大的份额。但是实际上,过去80年里先进的工业经济所发

    生的情况似乎是,利润率未变,工资和利润的增加比例是相

    同的。在资本主义初期各阶段,与国民收入相比,利润增加

    得快;但是在后期各阶段,利润在国民收入中所占的比例是稳定的(但受周期性的和长期波动的影响)。因此,在初期各阶段与国民收入相比,储蓄率高得多;但是在后期各阶段,净

    储蓄额在国民收入中所占的比例变得固定了——这个比例有

    多大,取决于资本主义部门在缺乏劳动力或者农业生产效率

    不高的情况下能扩大到什么地步。这样,以前一个自相矛盾

    的现象得到了解释。由于富人比穷人存钱多,人们就常常预

    料随着人均收入的增加,每一个国家都必定储蓄更多的钱。可

    是人们发现,在比较富裕的国家,在50年到70年的时间里,

    在储蓄率没有任何提高的情况下,人均实际收入翻了一番。对

    这种情况的解释是,储蓄率不是由国家穷富决定的,而是由

    利润和国民收入的比率决定的,一旦达到一定的发展阶段,这

    两个比率就停止提高了。自然决不能得出这样的结论,这是

    一条永恒的法则。我们并不确切知道,在先进的资本主义社

    会,利润和国民收入的比率是由什么因素决定的,因此,我

    们自然无法预言这个比率将来会是一种什么样的情况。

    为了使对储蓄的分析成为一个完整的分析,我们现在还

    必须把政府的储蓄考虑进去。我们在本章第一节中看到,在

    先进的工业经济里,固定投资总额的35%左右用于公共工程

    和公用事业——比如说占国民收入总额的大约7%。其中大

    约2—3%的国民收入用于规定得很严格的公共工程(公路、

    港口、学校、医院、公共建筑等),其余4—5%用于公用事业,

    它们可能是,也可能不是由政府管理的(铁路、公路运输、电

    话、电力、煤气等)。因此,政府在投资总额中所占的份额部

    分地取决于它在多大程度上把公用事业交给私人企业管理。

    在许多国家,这个份额高达国民收入的7%(例如在新西兰),只有极少数国家在2%以下。

    即使仅仅由于公共工程的需要,所有国家的政府也必须

    储蓄。它们可以先花钱后储蓄,也可以只花储蓄的钱,但是

    结果是一样的。那就是说,有些国家的政府起初宁愿用贷款

    而不是用本期税收支付资本形成,但是结果是一样的,因为

    国库必须设立一笔偿债基金来偿还贷款,钱还是从本期税收

    中来的。如果一个国家的政府以不变的年率将借来的钱花在

    资本形成上,那么它的偿债基金还债的数额很快就将与它的

    年借债额相等。

    经济增长的一个不变的特点似乎是政府开支在国民收入

    中所占的份额增大。在人均国民收入最低的国家,政府开支

    的份额可能只有5%;而现代工业国政府的经常开支占实际

    资金的10%左右,用于军事目的的钱不算在内(目前军费比

    这个比例更高),除此之外,将2—7%的实际资金用于资本形

    成,再加上10%左右用于转账(年金、支付保险费,付息

    等)。因此,边际税率必须超过平均税率,这样税款收入才能

    比国民收入增加得快。如果政府把通货膨胀作为迅速增大它

    在国民收入中的份额的一种手段,特别需要边际税率超过平

    均税率,因为边际税率高是在将更多的货币投入流通时防止

    价格迅速上涨的一个办法。

    随着政府的需要的增加,它对较高的收入征税越来越重。

    正如我们已经看到的,在落后的经济中,对租金收入所征的

    税,对储蓄也许没有什么影响,因为这种收入不是储蓄的来

    源。这种税迫使地主减少侍从人数,生活在比较小的房子里,

    减少他们对慈善事业、教堂等的捐款,但是它们对储蓄大概没有什么影响。对利润征税时,情况就十分不同了,这些税

    几乎全部落在储蓄上而不是落在消费上。因此对利润征税妨

    碍了经济的增长,除非将收入用于生产。

    在某种意义上说,如果一个国家的政府办事不浪费,那

    么它的支出是全部用在生产上了。它的教育经费和公共卫生

    经费——现代政府最大开支中的两项——在不同程度上促进

    了生产,甚至连防御性军事开支在某些情况下可能也是保护

    国民收入不遭掠夺的费用。不言而喻,政府只应当花钱做有

    益的事情。政府所用的一切资金,都是从那些归它的公民私

    人所有的资金中扣下来的,如果政府使用这些资金的方式不

    如公民们使用的方式那么有价值,那就是浪费。征收来的税

    款不管是牺牲了消费还是牺牲了投资,情况都一样;但是,如

    果人们认为减少投资比减少消费危险(这种观点并不是所有

    人都接受的),那么政府在估计它的边际支出时应当格外小

    心,如果这些支出用的是减少储蓄的钱的话。

    最近几年里,先进工业国的利润税很重,所以税后红利

    大大减少了,私人可支配收入的储蓄下降到了很低的水平。税

    后红利的下降并不完全是由于纳税的缘故;这也是由于宣布

    的红利额并没有随国民收入的增加而增加的缘故。利润多多

    少少是随国民收入的增加而增加的,但是各公司留下的未分

    配部分的利润增加了,而作为红利分配掉的部分大大减少了。

    因此股票价格没有随着它们所代表的资产价值的增加而上

    涨。这可能仅仅是一种暂时的现象,因为由于通过发行股票

    为工业筹集资金是为了创造新的实物资产,股票的价值和资

    产的价值必须再次保持一致——目前的偏离是由战争以及使红利率保持低水平的战后政策造成的。为了使红利保持低水

    平而征税的作用可能是比较长期的,因为所有现代国家的政

    府都已实行对利润征收重税的做法,也许这只是因为它们认

    为这是符合平均原则的。

    个人储蓄的下降并没有产生使制造业投资减少的影响,

    因为投资与不分配给股东的利润的比例增大有关,这些利润

    足以维持和扩大目前制造业的资本了。个人储蓄下降的主要

    作用是不受公司控制的可支配储蓄金数额减少了,而这对各

    类借主的前景有很大的影响。制造部门和商业部门的几乎所

    有新投资历来都是来自它们自己的利润,此外,这些部门还

    有盈余可以作为红利进行分配,一部分红利用作新企业、外

    国借款人、农业、公用事业和政府借款的资金。但是,根据

    C.T.桑德斯先生最近的计算,扣除对非公司工商业组织、农

    场和住房的投资额以后剩下的个人储蓄额,1952年在英国只

    占个人收入的1.8%,在美国只占个人收入的2%。即使这

    种纳税后的红利枯竭现象完全被其它形式的储蓄的增长抵消了。它对某几种投资也是一个沉重的打击。它对新企业的打击有多么沉重,这还不十分清楚。老牌制造企业的资金历来

    在很大程度上来源于自己的未分配利润,但是新企业一开始

    则必须从某个外部来源筹集资金,由于不受其它企业控制的

    资金减少,新企业要找私人借钱就更困难了。很难说其重要

    性如何。有钱人还是很多的,如果他们想支持某个新企业,他

    们可以把自己的资产卖掉(例如公债)。有些人担心影响太大,

    担心这会使新企业向老企业挑战并取而代之的机会减少,从

    而加强经济中的垄断倾向以及技术停滞的倾向。这些人建议政府将部分税收交给一个或几个专门为新企业集资的机构处理。然而,由于缺乏资料,所以情况不明。

    农业、对外投资、公用事业以及政府本身遇到的问题大

    致相似。如果政府以征税的形式将这些借款者以前依赖的储

    蓄金拿走,那就要由政府用部分税收来资助这些部门的资本

    形成。农业在集资方面一向是有困难的。在英国,地主和佃

    户之间在资金的提供方面历来是有分工的,地主用租金改善

    土地和建房,农民用利润购买机器和用作其他流动资本。实

    际上,双方往往都不储蓄足够的钱来作为他们全部投资净额

    的资金,农业一向是其他经济部门的纯借户。在最近几年里,

    由于税重,租金固定,地主的经济比任何时候都更为困难,虽

    然农民处于比较有利的地位,可以用高额利润进行再投资。由

    于可支配储蓄的减少,为对外投资提供资金也变得更困难了。

    公司完全能够为其海外资产的扩大提供资金,但是对矿山或

    种植园或工厂的直接投资在对外投资额中所占的分额永远是

    最小的。不时还有某些资本向外英镑区外流的现象,各中央

    银行将其用作支付进口货物的费用。但是大部分对外投资是

    借钱给政府或公用事业(如今大部分公用事业属于政府所

    有),由于缺乏可支配的储蓄,这种借款受到不利影响。正如

    我们在后面有一节中将要看到的,这就是对外投资现在依赖

    政府间转拨的程度要大得多,依赖私人贷款的程度小得多的

    一个原因。至于国内的公用事业,长期以来的做法是将其价

    格和利润控制在低水平,因此它们一直无法储备很多资金,不

    得不用新贷款来为它们的发展提供资金。在这种新情况下,它

    们要末像制造业所做的那样提高价格,获得大笔未分配利润,要末更多地依靠政府拨款。对于这两种办法中的第一种办法,政治气氛似乎是不利的。

    由于政府征收的利润税日益加重,因而使私人储蓄额减

    少,所以如果要使储蓄总额不下降,政府本身不可避免地必

    须储蓄更多的钱,并设立机构,向迄今一直依靠可支配的私

    人储蓄的某些借款人阶级提供储蓄金。因此,在第二次世界

    大战结束以后的几年里,英国中央政府与战前的做法完全相

    反,不仅用税收来为自己的整个资本形成提供资金,而且用

    税收支付地方当局的全部借款。后来它停止了这种做法;如

    果它的目的是为了减轻利润税来刺激私人储蓄,这样做是正

    确的,但是如果它的目的或效果是为了刺激消费,那么它这

    样做是不对的,除非现在为了提高个人消费率而降低资本形

    成速度是适宜的。如果利润税仍保持目前的水平,那么就很

    难看出英国政府如何能逃避它不仅用税收为中央和地方一切

    资本支出提供资金,而且成为新企业、农业、对外投资和公

    用事业的储蓄金来源的义务。

    对利润收入征收重税使私人储蓄额下降,这个事实使有

    些人感到高兴,这些人反对通过私人投资使经济增长,反对

    私人财富增加。他们希望国家成为资金的主要来源和唯一的

    大的财富拥有者。如果国家将更多的利润征收来装入自己的

    国库,并用这些钱进行进一步的投资,这样的事情确实是可

    以做到的,但是它在不削弱对投资的刺激的情况下朝这个方

    向能走得多远,这是一个尚未解决的问题。在英国,许多人

    深信,已经达到并超过了限度;其他人则指出,事实上,尽

    管征税水平很高,目前英国的投资总额仍比过去几十年高。即使政府几乎将全部利润都征收去了,投资大概也仍能保持在

    高水平,要是国家对管理阶级进行足够的刺激,使他们愿意

    继续为国家投资者效劳的话。如果国家将税收用于经常开支,

    而不是储蓄起来进行生产投资;如果管理阶级在经济上和社

    会上得不到报偿,那么对利润征收重税会使发展工作遭到破

    坏。但是如果其它机构发挥私人投资者的作用,那么私人投

    资者的消失不一定会使发展工作停顿下来。

    除了征收利润税的问题以外,许多人认为,在欠发达国

    家,政府有特殊的责任将征税作为储蓄的来源,以便将投资

    率提高到本来可能达到的水平之上。由于在那些社会中,利

    润仅占国民收入的一小部分,所以这在很大程度上是一个对

    工资、薪金、农民的收入和租金征税的问题。在那些社会中,

    大地主的租金收入多半用于雇用仆役,支持地方慈善事业,而

    不是将它们储蓄起来;对这些收入征税会迫使地主不得不减

    少依靠他们供养的人数以减少“消费”。当前,向大地主征税

    在政治上比向工人或农民征税容易,但是一般说来,要征得

    数目可观的税收,就必须在收入表上把征税范围扩大一些。获

    得所需数目的最省事的办法也许是对收入的增加部分征税,

    但是这种办法只有在人均收入实际上在增加的社会里才是可

    行的。缅甸和加纳等国已经做到了这一点。自第二次世界大

    战结束以来,这些国家的政府已将很大一部分贸易盈余储存

    起来。日本在1914年以前也做到了这一点,当时,旨在提高

    农田单位面积产量的有力措施,是与同样严格的征税联系在

    一起的,通过征税,增加的产量有很大一部分进入国库了。

    任何国家如果想把12%的国民收入储蓄起来,都可以毫无困难地做到这一点,这也许是对的。只有在利润已成为国

    民收入中的很大一部分的时候,国家才能自愿地将12%的国

    民收入储蓄起来,这似乎也是对的。如果它不希望它的发展

    依赖于私人的利润,或者如果它不希望等待私人利润缓慢地

    增加到那个水平,那么它可以迫使自己通过通货膨胀或者通

    过征税进行储蓄。只是近来,我们才逐渐把政府视为一个潜

    在的巨大的储蓄来源。在20世纪,它看来很可能逐渐变得比

    任何其它来源都更重要,即使在经济多半由私人企业掌握的

    国家也是如此。由此产生的问题,我们将在本章第三节

    (一)和第七章第二节(二)中再讨论。

    (三) 外来资金

    几乎每一个发达国家在其发展的各初期阶段,都有外国

    资金的援助来补充自己数量有限的储蓄金。在17和18世纪,

    英国从荷兰借款,到19和20世纪,又把钱借给世界上几乎

    每一个其它国家。美国现在是世界上最富裕的国家,在19世

    纪,它大量借外债,到20世纪,又应请求成为主要债权国。

    一个发展中国家即使自己愿意,也会发现难以完全用国

    内储蓄来支持它的资本计划,因为发展计划通常涉及从国外

    进口一些资本货物。例如,假设一个国家的政府计划花x镑

    进口资本货物,y镑支付工资和薪金,为此,它征税x十y镑。

    在表面上,这个行动似乎既不会引起通货紧缩,也不会引起

    通货膨胀,因为支出与税收正好相抵,但是实际上,它会引

    起通货紧缩,使国际收支吃紧。就其对当地的购买力和国际

    收支的影响来说,当地支出的y镑多多少少被征收的y镑税收抵消了。但是在国外花去的x镑不能靠从当地的购买力中征税x镑来筹措,当地的购买力动用的外汇只有mx镑,其中

    m是边际进口倾向。此外,在国外花去的x镑,也从国内流

    通中吸收了一些购买力,而没有用任何东西去代替它,这样

    通货就紧缩了。这些令人不愉快的后果是可以避免的,如果

    出口和国内消费互相代替的话,这样,当国内消费量下降时,

    就自动出口较多的货物,因为这既提供外汇,又维持国内收

    入。这种情况的发生在某种程度上是这样,而不完全是这样。

    在适当的时候,国际收支达到平衡,国内通货紧缩使得进口

    萎缩,价格下跌使得出口扩大。一旦作了必要的调整,一个

    国家就能在无外援的情况下维持一定水平的资本形成。但是

    加快资本形成速度的影响几乎肯定会造成外汇短缺,外汇短

    缺的情况必须用三种办法来弥补,那就是,如果有国外资产,

    就动用国外资产;控制外汇;或者利用外国援助。

    如果一项靠征税或国内储蓄提供资金的计划对国际收支

    造成压力,那么可以作这样的推测,一项使失业者创造资本,

    并将新的货币用于这一目的的计划,甚至会造成更大的压力。

    如果要使这样一项计划不在国内引起通货膨胀,那么几乎整

    个计划的费用必须用外汇来支付,一部分支付为此项计划进

    口资本货物的费用,一部分用于支付进口消费品的费用,以

    抵销当地支付的货币。如果进口货与本地商品不能完全互相

    代替的话,那么当地仍然会发生幅度不大的通货膨胀,这将

    有利于吸收进口货。实际上,并不是当地的全部费用必须用

    外汇来支付。因为在当地花掉的一部分钱将贮存起来,不必

    投入相应的消费品。另一方面,一个投资行动通常会引起别的投资行动,因此,几乎可以肯定,以这种方式储蓄的任何

    外汇都将在进一步的发展中用光。

    我们这里讨论的是联合国国际复兴开发银行和未来的借

    款国之间争论的核心,因为该银行在成立时把它的权限解释

    为它应当只出借为发展项目从国外进口资本货物所需的外

    汇,而不应当出借供当地支付工资或薪金的钱。根据这种解

    释,如果当地的工资和薪金用税收支付,或者用一种相应地

    减少其它国内支出的借款支付,那么该银行将提供所需的一

    切外汇;但是如果目标是利用剩余劳动力来创造资本货物而

    又不减少其它国内开支,那么这是不够的。鉴于欠发达国家

    的储蓄水平,如果它们要在不征税或不发生通货膨胀的情况

    下加快国内资本形成的速度,那么它们就需要几乎相当于新

    增计划的全部费用的追加外汇。

    鉴于国内储蓄的水平,可通过动用现有的贮藏或以贷款、赠款的形式获得外援来筹措追加的外汇。

    私人拥有黄金、珠宝和外汇的数量,各国有很大的差别。

    在南亚、东南亚和中东各国,人们习惯于贮藏黄金和珠宝;在

    其它国家,现有的贮藏则比较少。现在究竟贮藏着多少黄金

    和珠宝,那就不得而知了,但是最接近实际的猜测数是不超

    过国民收入的20%,虽然所涉及的数额的绝对值看来可能是

    很大的。获得这些贮藏的任何简单办法也是不存在的。有几

    个国家(例如英国)规定,拥有黄金或外汇而不向财政部申

    报是违法行为,但是这种法律的效力有一部分取决于人民守

    法的程度,一部分取决于这些法律实施的严厉程度如何。通

    货膨胀促使人们去贮藏黄金,所以使人们自愿把贮藏的黄金拿出来的一个条件也许就是建立对本国货币的信心。也可以暂时实行有吸引力的价格政策使人们把一部分贮藏的黄金拿

    出来。冷酷无情的政府几乎一执政就能使私人将他们所贮藏

    的黄金拿出来,但是在不是那么冷酷无情的国家里,把贮藏

    拿出来的速度是缓慢的,对提供发展所需的外汇的贡献是很

    小的。

    有些国家的政府本身就大量贮藏,因为它们仍然完全用

    外汇来支持本国货币。例如英国殖民地的所有政府都是这种

    情况,因为殖民地的货币制度要求一切殖民地的货币都百分

    之百地用英镑作为支柱。用外汇支持一种货币达到这种程度

    显然是没有必要的,因为不能想象会出现全部本国货币从国

    内流通中消失的情况。人们有时会说,就英国殖民地而言,采

    取这种做法关系不大。支援剩余货币用于购买金边证券,这

    种证券产生长期的利率,如果这些殖民地需要钱,它们能毫

    无困难地以类似的利率在伦敦借款。只要情况确实如此,那

    么百分之百的支援不会妨碍发展。只有在一块殖民地借款的

    利率难以与它放款的利率相一致的情况下,这一点才是重要

    的。

    还必须提一提一些国家在第二次世界大战期间和第二次

    世界大战结束以后不久积累的英镑结余。现在,这些国家中

    的大多数国家已将它们的结余减少到为货币储备所需的数额

    多不了多少的水平,但是有一两个国家的结余仍在增加,因

    为它们的外汇收入比它们的进口额增加得快。由于有这些结

    余,印度或埃及等国才有可能实行发展计划而没有出现外汇

    紧缺的情况,这些结余的存在也是在第二次世界大战结束以后,尽管国际投资恢复缓慢,世界生产还是全速发展的原因之一(另一个原因是美国的援外计划)。

    人们可能认为,在从动用贮藏讲到获得外援的可能性之

    前,我们也应当考虑通过降低供国内消费的进口货与出口商

    品的比率来为发展提供更多外汇的可能性问题。但是不增加

    储蓄是做不到这一点的;因此它属于我们在前面讨论的国内

    储蓄问题,而不属于这一节关于外来资金的问题。生产进口

    货代用品,扩大出口或者对外汇实行配给就可以提供更多的

    外汇。如果进行相当有效的管理,那么为发展获得外汇并不

    是很难的;比较难以处理的是后果。因为如果不允许民众花

    费他们希望花掉的那么多的钱来买进口货,他们就将花更多

    的钱购买本国货。要是出口商品就是国内消费的商品,那么

    这可能使出口商品减少,因而可能使进口控制措施的目的无

    法达到。如果这个问题不发生,或者解决了,那么额外的国

    内开支将会在国内引起通货膨胀,这是一种储蓄形式。或者,

    如果要避免通货膨胀,那就要在减少进口的同时,必须通过

    征税或者增加自愿储蓄来减少购买本国商品的支出。因此,必

    须把控制外汇收入看作增加国内储蓄政策的一部分,而不是

    把它看作额外的投资来源。

    下面我们谈谈作为投资来源的外援,无论它是以赠款的形式还是以贷款的形式提供的。在第二次世界大战爆发之前,外援几乎完全取决于私人的主动性,而这种主动性又主要取决于国内投资机会与国外投资机会的比较结果。一般说来,放款国是发达国家,借款国是欠发达国家,以雇佣人数的人均资本作为衡量发展的尺度;但是不存在这样简单的规律,即在欠发达国家投资比在比较发达的国家投资更为有利可图,或者说随着国家的发展,它自动从债务国地位转变为债权国地位。

    期望发达国家输出资本的一个原因是人们相信,随着资本的积累,发达国家的利润率否则必然下降。利润率下降的理论至少可以追溯到18世纪,并且已被几乎每一个学派的经济学家所接受,尽管他们用以支持这种理论的论据并不总是相同的。经济学家艾尔弗雷德·马歇尔是不同意这种一致看法的最引人注目的例外。他在《官方文件》(第49页)里表示了通常的看法。但是他在《原理》(第681页)里却说,虽然人均资本的增加往往使资本的利润减少,但是在另一方面,

    技术的进步却为资本的使用提供新的机会,从而往往使利润

    率提高。因此,他说,英国的资本收益从中世纪的10%下降

    到18世纪中叶的3%——长期内技术进步缓慢——此后,由

    于利用资本的机会大大增加,这种下降被制止了。如果这就

    是观察事物的正确方法——看来这是正确的——那么就不存

    在资本收益在发达的经济中必定下降的规律;它可能下降,也

    可能不下降。

    然而,如果我们从一般资本利润率转到特殊投资领域的

    利润率,那么我们就会得到不同的答案。在任何特殊领域,进

    一步扩大的可能性很快就消失了,或者无论如何是大大减少

    了。一切行业都是按照一种合乎逻辑的格局发展的,一开始

    增长得相当缓慢,接着迅速增长,后来又增长得很缓慢。因

    此,任何特殊领域的投资者迟早都会达到在国内的那个领域

    没有更多投资余地的地步。他们可以将越积越多的利润用于对十分不同的行业的投资。但是他们也会情不自禁地坚持他

    们具有专业知识的领域,并用他们的利润将工厂搬到新的国

    家去办。因此,英国的铁路公司在国内修建了铁路以后,到

    外国创办和修建铁路。英国各锡公司将资本转移到马来亚和

    尼日利亚办锡矿;就像美国的石油公司和铜公司在海外同样

    的行业中投资一样。海外限制从发达国家进口商品的规定往

    往有助于资本的这种转移,这些限制促使美国的制造公司到

    拉丁美洲投资开设分公司。来自低工资国家新兴工业的竞争

    往往也促使资本的这种转移,例如英国到印度投资开办黄麻

    厂和棉纺厂。

    可是资本的这种转移不仅受到发达国家始终存在着新的

    投资机会这个事实的限制,而且受到欠发达国家投资条件不

    利的限制。因为决不能理所当然地认为,在欠发达国家投资

    有利可图就是因为它们是欠发达国家。事实是,这些国家在

    投资方面具有某些明显的不利条件。例如,社会结构并不总

    是合适的。就潜在的生产率而言,即使各国人民的发展素质

    可能是十分相同的,他们的文化天赋也是很不相同的。文盲、

    缺乏现代技能和不适应工资关系使生产率很低:而治理形式

    和社会态度的不同使投资的不稳定因素增加了。因此,在发

    达国家可能产生丰厚利润的新技术,在欠发达国家不一定就

    是有吸引力的投资项目。资本短缺也会出现恶性循环。如果

    要着手办一个新企业,那么这个企业的生产率不仅取决于它

    本身,而且也取决于为这个新企业服务的所有其它行业的效

    率——尤其是一般性的工程服务、部件供应、运输和其它公

    用事业。这反过来又部分地取决于这些其它服务业的利用程度有多高。所以一项投资的生产率取决于在此之前已在许多方面进行的其它投资。至少在某种程度上说,资本投资的利

    润在增加,而不是在减少。花那些已有许多资本的国家投资

    很可能比在一个新的国家投资更加有利可图。如果情况永远

    如此,那么资本就不会输出了;比较发达的国家的生活水平

    和欠发达国家的生活水平之间的差距将不断扩大;我们甚至

    可以冒昧地设想这样一条规律,即自然的趋势是资本从欠发

    达国家向比较发达的国家转移。实际上,资本的国际流动量

    很少,各种生活水平之间的差距确实在扩大,因此,这至少

    是一种警告,提醒人们不要接受那种仅仅基于发展水平的判

    断。

    如果要使判断正确,那么比较可靠的办法可能是根据现有自然资源而不是根据人均资本水平来作。最有利可图的投资是开发容易开发的丰富自然资源的投资,例如肥沃的土地、

    石油、煤或矿砂。即使在没有新资源的情况下,投资开发新

    技术也是有利可图的,但是这不像用资本既提供新技术又提

    供新资源那样有利可图。这就是在过去100年里大部分输出

    的资本输往美洲和澳大利西亚而不是输往印度或中国的主要

    原因,因为美洲和澳大利西亚新的资源丰富,而印度或中国

    所提供的机会在更大的程度上在于更好地利用已知的资源。

    这也是英国和西欧迅速成为资本输出国(它们很快就达到了

    自己的自然资源的极限),而加拿大、美国和澳大利亚虽然与

    世界上其余国家相比人均财富很多,但是到了很晚的时候才

    达到资本输出阶段的原因。

    因此,我们能够作的最近似的判断是,资本往往流向那些新的丰富自然资源可以相当容易地开发的地方,而且总是从那些资源已经高度利用,新资源远不是那么丰富的地方流

    出来的。这并不等于说,当一个国家需要进口原料或粮食的

    时候,它就成了一个资本输出国。在19世纪,凡是英国认为

    可以赚钱的地方,它都投资,无论它的进口情况如何。在19

    世纪初期,它到拉丁美洲投资,到那个世纪中叶在欧洲修建

    铁路,后来它又借钱给埃及为各种活动提供资金。同样,美

    国到国外投资主要并不是因为美国缺乏供应品。美国在成为

    铜和石油进口国之前,早就源源不断地在铜和石油业投资了。

    美国对拉丁美洲的制造业投资也并不是因为美国把它作为潜

    在的供应品来源。

    有人往往还断言,如果英国不必购买数量越来越多的初

    级产品,它本来是不可能适应债权国的地位的,但是事实并

    不支持这种说法。首先,英国并不将它在国外投资的收入和

    偿还的本金用于进口商品,而是用于增加它在海外的资本;它

    仅仅将它得到的钱用于在海外进行再投资。1913年英国保留

    进口额在国民收入中所占的比例(28%)与1873年相同,尽

    管在这40年里,英国的无形收入有了很大的增长。(作为这

    一计算的依据的A.R.普雷斯特先生对1873年国民收入的

    估计数可能是相当低的,但是即使将估计数提高相当大的数

    量,我们的结论仍然是,对外贷款的利息主要不是用来提高

    进口额与国民收入的比率,而是用于提高国外投资的比率。)

    然而这种论述形势的方法涉及国外投资率的迅速增长,而这

    种增长也许会以牺牲国内投资为代价,除非与国民收入相比,

    国内储蓄增长得更快。如果要使利润、储蓄、国内投资和国

    外投资在国民收入中所占的比例保持不变,那么长期进行国

    外投资到适当时必定会产生这样的结果,即与国民收入相比,

    有形进口额上升,或者有形出口额下降。

    这些尴尬的局面是由于利息和分期偿还款项的流入赶上

    资本外流的速度造成的。例如,如果国民收入不变,对外贷

    款不变,20年以后偿还,那么20年以后,偿还的数额将与支

    出的数额相等,此外,还会有过去20年的投资的利息收入,

    只有进口的倾向加强,或者有形出口额下降,这些收入才能

    被吸收。如果相反,我们假设国民收入增加,外国借款所占

    的比例不变,那么正如多马教授最近所表明的,20年以后,如

    果贷款利率与国民收入增长率一致,那么外流和流入正好相

    等;但是如果利率超过收入增长率,这种情况更有可能出现,

    那么流入的比例将稳定在高于外流的水平上。如果像英国的

    情况那样,有形进口额和出口额与国民收入的比例保持不变,

    流入的利息和偿还款项全部用于再投资,那么结果甚至会更

    加令人难堪。因为在这种情况下,如果利率和收入增长率相

    同,国外投资与国民收入的比率始终以等差级数增长,如果

    利率超过收入增长率,那么国外投资与国民收入的比率甚至

    会增长得更快。例如,假设一个国家每年将2%的国民收入用

    于国外投资,它获得的5%的利息也用于再投资,国民收入每

    年增长3%。那么即使贷款是不偿还的,年度投资额也将从第

    一年的国民收入的2%提高到第20年的6%,并将以越来越

    快的速度继续提高。从1870年至1913年,英国国外投资的

    情况大体上就是这样的。如果要避免这种情况,并使进口倾

    向也保持不变,那么与国民收入相比,有形出口额必定下降。

    英国发生的情况是,除周期性和长期性的波动以外,有形出口额在它的国民收入中所占的比例保持不变,但是它在世界制成品出口额中的份额在此期间却迅速下降,如果它不愿将

    它在国外的无形收入用于再投资,这个份额本来还可能下降

    得更快。

    由于对英国所发生的情况持有错误的认识,有些观察家

    担心,美国替代英国成为世界主要债权国是不行的,但是这

    些担心是没有根据的。首先,如果把收入用于再投资,那就

    不必发展入超;其次,没有理由认为美国的食品和原料进口

    额不如美国的收入增长得快(许多人预料进口额增长得较

    快);第三,现在,与世界制成品出口总额相比,美国的制成

    品出口额很大,所以通过制止美国制成品出口额的增长率来

    保持世界平衡的余地很大。只要全世界的初级产品的需求量

    继续增长,投资者开发新的自然资源将是有利可图的。投资

    国没有理由也必须是进口这些产品的国家。

    如果最有利可图的投资是那些开发新自然资源的投资,

    那么要说现在国际投资的范围比19世纪少似乎是有理的,因

    为像美国、加拿大和澳大利西亚那样富饶的未开垦土地已经

    没有了。如果情况确实是这样,那么国际投资必须在更大的

    程度上依靠转让新技术谋利,以便在欠发达国里兴办那些在

    比较发达的国家里已经证明是有利可图的,以及现在正显示

    出在国内增长速度下降的行业和工程。(这种投资不一定与粮

    食和原料有关,因此不一定产生那些被错误地说成初级产品

    会产生的问题。)确实可以说,随着比较发达的国家和欠发达

    国家之间差距的扩大,引进新技术的好处也变得越来越大,所以到现在为止,资本从比较发达的部门(这是从技术上说的)大量转移到比较落后的部门——例如农业——的余地是

    存在的。可是转让技术并不仅仅是一个投资问题,一般说它

    取决于制度的改革,尤其取决于教育和推广设施的强化,而

    这需要在许多不同的级别上采取行动。这种行动有很大一部

    分必须由各国政府采取;例如在农业方面,建立推广服务机

    构,扩大灌溉设施,建立农村信用社网等。如果私人国外直

    接投资是一个转让新技术的问题,而不是一个开发新的自然

    资源的问题,那么这种投资的范围所受的限制也许会大得多。

    对外资的需要量可能一样大,对产量的影响也可能一样大,但

    是老的渠道不再是那么重要了。这一点我们过一会儿再谈。

    国际投资额当前的下降,至少首先并不是我们迄今所讨

    论的问题中的任何一个问题直接造成的。相反,它是由30年

    代的大萧条以及随后发生的事件造成的。

    在第一次世界大战结束以后,国际投资完全恢复了。战

    前不久,国际投资额约为16亿美元,到20年代末,增加到

    大约20亿美元,如果将价格变动的因素考虑进去,那么这两

    个数额的实际价值大体上是相等的。来源和流动方向发生了

    引人注目的变化。美国已不再是纯借款国了,现在它提供的

    贷款额占借款额的一半,英国的贡献已经大大减少了。在第

    一次世界大战之前大量借钱给其它国家的德国,现在它所借

    的钱将近占贷款额的一半。因此,初级产品生产国海外的情

    况已经恶化;实际上,它们在20年代得到的钱大约只相当于

    它们在第一次世界大战爆发之前所借的数额的一半。有些人

    很重视流动方向的这种变化,他们说,对德国重建工作的投资,必然不如在海外初级产品生产国投资来得保险,因为海外初级产品生产国家可以用初级产品偿还,这是可以接受的,而德国只能用制成品偿还,这是不能接受的。我们已对这种推理方法的正确性表示怀疑。事实上,在30年代发生大萧条时,初级产品生产国遭到的打击与德国遭到的打击一样严重,

    在履行它们的义务时遇到了同样多的困难。

    美国成为主要贷款国,在发生萧条的时期似乎具有特别

    的意义,因为哪个国家没有外国借款的传统和机构。人们认

    为,缺乏信用机构增加了贷款的费用,并且造成了贷款时差

    别对待不够,因此在美国贷款中能够经受风险的部分比英国

    贷款中小。缺乏向外国放款的传统也使贷方更加紧张。有经

    验的贷方知道,衰退时期过去以后会出现繁荣时期,所以他

    在出现衰退时不会感到紧张,美国有许多放款人在20年代受

    过分乐观的宣传的欺骗,到了30年代则变得过分悲观。不管

    传统和机构方面的弱点是否是真正的原因,事实是,在发生

    大萧条,许多借主无法履行他们的承诺时,美国的放款人对

    向外国放款的整个概念产生了强烈的反感。不遵守战争债务

    的行为尤其令人气愤。1934年一项联邦法案规定,在美国出

    售任何不履行对美国政府的义务的政府债券是违法行为,除

    了芬兰政府,这项法案适用于世界上几乎每一个重要国家的

    政府。与此同时,好几个州的立法机构通过法案,禁止借款

    机构持有外国公债。由于政府是最大的借主,这对国际投资

    是一个重大打击。甚至到1954年,要在美国成功地发行外国

    公债仍然是不可能的。在第二次世界大战结束成立联合国国

    际复兴开发银行的时候,该行行长不得不用将近两年时间到各州立法机构去劝说它们通过法案,允许投资机构持有国际复兴开发银行发行的债券。

    不偿还战争贷款是一项政治决定,这项决定是按照债务国于1932年在洛桑达成的协议作出的,即如果美国放弃欠它的债务,那么其他国家也愿意放弃欠它们的债务。美国拒绝放弃它的债权,但是其它每一个国家(芬兰除外)决定把战争债务看作已经销帐了。可是不偿还其它贷款在更大的程度上是由于债务国无法控制的环境造成的。大萧条格外严重。世界贸易中的美元价值三年中下跌了60%。世界制成品产量下降了30%,虽然初级产品的产量保持得比较好,但是初级产

    品生产国的收入因贸易条件变得对它们极为不利而受到了严

    重影响。结果,除了美国以外,世界上大多数国家在国际收

    支方面遇到了非常严重的困难。外汇必须严格实行配给,在

    某些情况下,如果要保持必不可少的粮食和原料进口额,那

    确实就不能动用外汇来偿债。同样确实的是,陷入这种漩涡

    的国家无法为私人或政府借款。在30年代,国际投资减少到

    零。在这10年里,债务偿还额平均超过了新的借款额。

    自从第二次世界大战结束以来,世界生产和贸易已经恢

    复到超过两次战争期间的水平,但是国际投资额平均每年只

    有大约20亿美元,其中不包括美国政府的赠款,也不包括从

    一个共产党国家向另一个共产党国家转移的款项。如果与20

    年代相比,或者与第一次世界大战爆发之前不久的年头相比,

    这个数字自然是非常小的。如果扣除价格上涨的因素,那么

    20年代的投资额到现在应为大约30亿美元。如果假定投资

    额随着世界产量的提高而增加,那么正确的数字差不多将近45亿美元。如果我们要问目前的水平为什么如此之低,答案可以从供求两方面的不足中去找。

    在供给方面,我们可以列出的不足如下:(1)西欧相对

    衰落,(2)可支配的储蓄额减少,(3)要求担保。在需求方

    面,我们可以指出私人投资领域减少。

    而欧的衰落并不是生产的下降,而是可以用于国外投资

    的国际收支顺差额的下降。用贸易条件不利这个原因是无法

    解释这种下降的,因为现在欧洲的贸易条件与1913年的贸易

    条件并无很大的不同。也没有证据可以证明现在西欧比1913

    年储蓄得少了,相反倒是有证据可以证明,西欧正将比过去

    大得多的一部分储蓄额用于国内投资。德国正在实行大规模

    建设计划。法国经过25年工业近于停滞的阶段以后正在振

    兴,并已开始进行国内投资,其水平是自第一次世界大战结

    束以后的重建初期以来所没有达到过的。英国现在的国内投

    资率,与它的国民收入相比,是19世纪70年代以来所没有

    达到过的。这些国家无法腾出货物来用于国外投资,因为它

    们在国内把这些货物用光了。即使在联合王国允许外国政府

    借款,或者用掉英镑结余的时候,国际收支方面并不总是能

    实现所需的变动,因为不出口所需的资本货物。因此,不论

    在纸面上可能作了什么许诺,在资金的国内使用额减少之前,

    期望西欧再次成为大的资本输出者是没有用处的。究竟什么

    时候出现这种情况,这是无法预测的。目前投资活动方兴未

    艾——在住房建筑、电力、农业机械、采煤和其它各方面。在

    这些方面的某一方面,例如在住房建筑或农业方面达到希望

    达到的水平的时候可能会到来。如果国内投资额下降,而国内其它需求量没有增加,那就有可能到国外投资。政府使用

    资金的数额也可能减少,因为这个数额已大大增加了,尤其

    是在重整军备方面。英国现在(1953年)将大约13%的国民

    生产总值用于军事目的,而1938年为6%。在政府使用资金

    的数额的下降部分中,有一部分钱用在直接消费上,但是几

    乎可以肯定,同时税款也会实行一些减免,这种减免使储蓄

    额增加,而不是使消费额增加。

    假设西欧将它自己的储蓄用光了,那么可支配的私人储

    蓄额相对下降这种情况在其中起多大作用很难确定。如果外

    国公债在欧洲市场上出售,谁能购买这些公债呢?例如,在

    战前的英国,扣除所得税以后的股利占公司净收入(未纳

    税)的55%,政府拿32%,各公司保留13%作为未分配利润。

    而在1952年,股利已下降到18%(相当于国民收入的4%),

    其中还要缴附加税。在这些情况下,只有各公司或政府愿意

    提供资金,那么到国外进行大规模投资才是可行的。各公司

    能够而且确实在为对设在外国的子公司或联合公司进行直接

    投资提供资金。但是最大的国外投资项目往往是购买外国公

    债,而这不大可能吸引公司的资金。因此,现在向外国政府

    提供资金差不多完全得依靠政府间转账。美国的情况表明,那

    里的趋势与西欧是相同的——与公司和政府的储蓄增加有联

    系的个人可支配储蓄减少了。这种改变不如欧洲明显,但是

    无论如何,由于已经作了说明的原因,美国私人投资者要么

    不愿意,要么不能够购买外国公债。因此,未来的国外投资

    主要应是一个公司直接投资和政府间转账的问题。

    由于担心外国政府任意采取行动,尤其是害怕拒绝用外汇调拨利润或抽回资本,害怕实行国有化,直接投资受到了进一步的限制。拒绝使用外汇这种事情在30年代是经常发生

    的,其理由往往是没有外汇。输入资本的国家的政府现在被

    要求宣布它们不会限制转移利润或资本,有好几个国家已经

    这样做了。宣布这种决定是商誉的重要证据,但是在发生严

    重外汇危机时,即使最好的商誉也可能不得不向外汇短缺的

    情况让步。因此,有人已向资本输入国政府建议,在出现严

    重衰退时,它们在为此目的发放临时外汇贷款方面是有作用

    可以发挥的。例如,假设A国的一家外国公司在没有外汇的

    时候申请允许它将利润或资本转移到B国,这时B国可以将

    为此目的所需的款项借给A国中央银行,借期为三年(到那

    时,危机被认为已经过去)。这样一项计划在华盛顿已经得到

    赞同,现在正在某几类投资中实行。

    国有化是一个比较困难的问题。外国公司希望保证它们

    不会被收归国有,有些国家的政府正在作出这样的保证,即

    在一定时间内,比如说公司成立以后的头25年里,不会实行

    国有化。这种保证有多大用处,这是值得怀疑的,因为没有

    一个国家的政府能够约束它的继承者。一个比较好的保证是,

    如果公司被收归国有,它们的所有人将得到由独立的仲裁者

    确定的公平的赔偿,这种保证可以写入一个国家的宪法,这

    样就不是那么依赖于不断变更的政府的一时的兴致了。人们

    经常说,现在应该制订某种国际法典或公约,宣布对外国投

    资者采取差别待遇征税、无偿收归国有、限制转移利润等任

    意行动为非法。制订这样一项公约将有助于改善国际投资气

    氛,从而有助于促进它的流动,但是由于规则只有在它们能够实行时才是最有效的,所以资本输入国制订能在它们自己的法庭上对它们的政府实施的国内法律,甚至比通过只能进

    行道义制裁的国际宣言更为有用。

    除了对已经进行的直接投资提供保护以外,还存在着允

    许什么样的直接投资这个范围更加广泛的问题。如果外国资

    本的供给量由于我们刚才指出的原因已经减少,那么需求量

    也减少了,因为在好几个极其重要的领域不再允许进行直接

    投资了。1913年,英国的海外投资分配如下:铁路和其它公

    用事业为46%,政府股份为30%,采矿9%,其它各种投资

    15%。如今,大多数国家的政府已将铁路和其它公用事业收

    归国有,或者打算收归国有,其它许多国家政府反对矿山和

    种植园由外国经营。结果是外国私人能够进行直接投资的余

    地就所剩无几了。外国资本是允许进入商业系统的,但是一

    般说来,商业系统中国内资本是充足的,而为销售农产品设

    立法定代理机构的趋势进一步限制了外国私人在商业系统进

    行投资的范围。在制造业,外国资本通常是很受欢迎的,可

    是在大多数不发达国家,制成品的需求量很小,所以拉丁美

    洲是世界上将许多外国资本吸引到制造业的唯一地区。鉴于

    现在私人直接投资的余地有限,最近几年里美国将70%的国

    外投资用于石油工业就不足为奇了。

    外国直接投资在经济发展中的作用,通常被不喜欢这种

    投资的人和支持这种投资的人误解了。支持外国投资的理由

    是它提供外汇,提高国内收入,并提高国内技能。国内收入

    增加是因为企业付给当地人民工资和薪金,购买当地供应品,

    并在当地纳税;所付的这些钱不仅增加了消费量,从而促进当地的生产,而且使得有可能增加当地的储蓄额,还使改善学校、医疗设施和其它固定机构的工作有了资金。如果要在

    当地资本和外国资本之间作出选择的话,选择前者可能比较

    有利,但是如果要在外国资本和让资源得不到开发这两者之

    间作出选择——这种情况比较多——的话,那么毫无疑问,外

    国投资在提供收入来支付提高消费、教育和国内投资水平方

    面会发挥非常有益的作用。外国人提供技术可能比他提供资

    金更为重要。在大多数发展水平低的国家里,带来新技术的

    是外国人,这些新技术在人民中间的推广使得国家发展起来。

    由于这个原因,许多国家在过去千方百计地邀请外国人来开

    办新工业。如果外国人对他们的技术保密,那么这个国家就

    得不到最大的好处,因此,接纳外国人可能附有一个条件,那

    就是新来的外国人必须对当地人进行培训。现在,外国人掌

    握的最重要的技术是管理大企业的技术。大多数其它技术可

    以在高等技术院校学到,而企业管理只能在管理企业的实践

    中学到。所以,如果外国人拒绝雇佣当地人担任管理职务使

    他们取得经验,那么外国人可能获得并保持控制经济的手段。

    这就是如今有那么多的国家通过法律,要求外国企业至少雇

    佣一定比例的当地人担任管理职务的原因。人们可以想一想,

    有哪一个国家,包括英国、俄国和日本在内,在它们最初的

    发展阶段不是由外国企业通过提供额外的收入和传授新技术

    来发挥重大作用的。

    欠发达国家由于政治和经济原因害怕外国投资。在政治

    方面,它们非常害怕接受外国投资可能会导致丧失独立。如

    果债务国的制度和习惯不同于债权国的制度和习惯,债权国确实可能情不自禁地采取帝国主义行径。如果借钱给加拿大,债权人知道,他们在加拿大的法庭上将会得到与在本国法庭

    上一样好的保护。但是许多其它国家不提供这种保证。债权

    国可能害怕在法庭上受到歧视,或者在行政上受到歧视,因

    而情不自禁地仅仅作为保护自己的投资的一种方式而采取帝

    国主义的办法。除了这种要求得到保护的愿望,还有一种要

    求得到特别优惠的强烈欲望——得到强迫劳动力,或者免税,

    或者获得条件有利的合同,或者将运输设施建立在适当的地

    方——这种欲望也可能促使一个力量强大的国家使它的比较

    弱的邻国丧失独立地位。丧失独立地位可能是部分丧失,也

    可能是完全丧失。如果资本家仅限于贿赂政客或者支持一个

    政治集团反对另一个政治集团,那是部分丧失独立地位;如

    果债务国沦为殖民地地位,那就是完全丧失独立性。这种担

    心是很普遍的,但是它们的实际情况在某种程度上显然取决

    于债务国本身——它的制度是否对外国提供适当保护,它的

    政治生活是否健全得足以抵制外国的贿赂。在19世纪,这些

    担心的实质内容也比在20世纪多得多,因为公开的帝国主义

    行径现在已变得不是那么时髦了。但是恐惧心理仍然存在,并

    且是欠发达的国家急于要求联合国建立转让资本的适当机

    构,以免它们变得依赖于接受任何一个大国的资本的最有力

    的原因之一。

    除了政治原因以外,有些人不喜欢外国投资还因为他们

    害怕外国投资会产生过多的利润。现在有一种夸大外国投资

    的利润的强烈倾向。有证据证明,外国投资的利润并不比国

    内投资的利润大多少,如果扣除被没收的投资,那就尤其如此了。例如,英国1913年的投资大约有40%投在铁路上,事实已经证明,其中很大一部分投资是无利可图的,因为在第一次世界大战结束以后公路运输迅速发展,或者因为实行物

    价控制,或者因为按战前的价格收归国有。同样,在战争期

    间,对初级产品(橡胶、锡、茶叶、糖等)的直接投资遭受

    严重损失,明显获利的投资只有以下几种情况,那就是利用

    无知或者通过政治欺骗租借到矿产丰富的土地,而租借费又

    极低。将那些涉及垄断地位的外国投资与没有涉及这种地位

    的外国投资区别开来也是非常重要的。如果让外国人垄断蕴

    藏着矿产的土地或者最好的土地,那么当地人民就无法取代

    他们,无论他们有多大的能力。但是经营商业或制造业的外

    国人的危险要小得多,因为不存在自然垄断妨碍当地人民在

    财务上和技术上能够胜任时取而代之的因素。

    如果一个国家自己能够筹集资本和获得技术知识,那么

    它就能在没有外国进一步援助的情况下进行发展。有时候它

    能够筹集资本,但是无法获得知识;在这种情况下,最好的

    办法可能是进行合作。一些欠发达国家的政府正在同外国私

    人公司建立合伙关系来创建新工业,由外国公司提供管理知

    识,并多多少少提供一部分资本(从零到90%)。这种合伙关

    系受到双方的欢迎。它受到政府的欢迎,因为政府可以对方

    针行使某种控制权,或者能将大部分利润保留在国内,如果

    它提供大部分资本的话;它受到外国公司的欢迎,因为同政

    府建立合伙关系能为它赢得友谊,并得到某种保护,使自己

    不受歧视或压力。政府也赞成外国资本家和本国资本家建立

    合伙关系,其原因又是一部分为了将利润保留在国内,一部分是为了使本国资本家获得更广泛的知识和经验。外国直接

    投资很可能主要按这些合伙方式发展,当一个项目涉及数十万英镑的时候尤其是如此。

    另一方面,不论主张外国直接投资的人提出的理由多么

    有力,从适当的角度来看,这种投资形式显然必定是微不足

    道的。认为直接投资一直是或者可能是外国投资的最重要形

    式,是完全错误的。

    正如我们已经看到的,在1913年外国投资的全盛时期,

    英国在国外的投资有四分之三是购买公债或公用事业股票。

    如果我们也考虑到通过政府机构提供资本来发展小规模农业

    的必要性,那么可以毫不夸大地说,今天所需的外国资本,有

    80%是政府需要的。直接投资在外国投资问题中仅占极次要

    的地位,差不多只与矿业和制造业有关。如果要恢复外国投

    资,那么主要问题并不是与恢复直接投资有关的问题,无论

    这种投资多么有吸引力,而是向外国政府提供资本的问题。

    外国直接投资为什么总是小规模的,其中一个原因是因

    为放款的私人难以摸清数千英里以外的借款的私人经济底

    牌,难以对他的所作所为进行监督。设在霹雳或者库马西或

    者斐济的小种植园或者工厂或者贸易公司或者采矿公司,几

    乎不能希望发行股票到伦敦证券交易所去买卖。投资者不可

    能知道这种企业有什么价值,也不可能对它们的管理抱有信

    心。所以许多外国投资必须通过中间人来进行。设在英国在

    非洲的殖民地的金矿开采公司已在数目较少的信贷公司的主

    持下组成集团。这些信贷公司为在它们庇护下的公司行使某

    些秘书和销售等职能,这样做通常是要收费的。它们也可能投一点资。然而,从私人投资者的观点来看,它们的主要职能之一是保证在它们庇护下的公司是真诚的。当这些公司中

    的一家公司发行股票时,它们在伦敦较易为人们所接受,因

    为人们知道这家公司有很好的保证人。东方的茶园和胶园也

    发生了同样的情况。其中许多种植园是由几家著名的信贷公

    司管理和做保证人的,这些公司的名字同样起着保证具有诚

    意的作用。如果没有这种保证人;中小公司就无法直接进入

    外资市场。这产生了进一步的后果。其中一个后果就是在外

    国经营的公司中出现了大规模走向合并,组成控股公司和实

    行垄断的趋向,例如在锡矿或铜矿业中就是这样。如果中小

    公司无法直接进入市场,那么唯一的出路是由许多中小公司

    组成大公司。这种成立垄断企业的趋势,在出现这种趋势的

    国家是不受欢迎的,但是它是以下事实不可避免产物,即外

    资市场无法应付独立的小公司。另一个后果是外资通过已经

    在先进国家建立的公司进行流动,在欠发达国家设有分公司

    或子公司。这种情况一直是锡、铜或石油开采业的一个特点。

    这实际上也是外国资本流入制造业的唯一渠道;实际上,欠

    发达国家里一切由外国出资开办的工厂,都是在先进工业国

    经营的公司或海外大贸易公司的分公司或子公司。

    我们在这里找到了为什么外国私人资本多半购买公债和

    公用事业股票,只有很小一部分直接投资到工业、农业或贸

    易的主要原因。不通过中间人,这件事情是无法做得有成效

    的。在过去,这些中间人一直是信贷公司、秘书服务公司或

    者设立在工业国的公司;否则就必须走向垄断,将所有权集

    中起来,以便在资本市场获得立足点。最近,一个新的中间机构以政府开办的金融机构的形式出现了,如农业银行、开发银行或工业金融公司,它们由政府担保,从外资市场借款,

    并且将这些资金重新投资到国内的小公司。但是这种做法只

    是着重说明了从国际投资的角度来看政府借款的重要性,以

    及私人股东的直接投资所发挥的必然是微小作用。在恢复外

    国投资方面,主要问题是如何向外国政府提供更多的资本。

    在1929年之前,外国政府可以在资本市场上向私人放款

    人借钱。而现在不再有可能大规模借钱了,这或者是因为美

    国通过了法律,或者是因为欧洲对外汇实行管制,可支配的

    私人储蓄减少,或者仅仅因为公众对这种贷款作出不利反应。

    因此,如果政府要借钱,它们不得不主要向其它政府借钱。国

    际私人贷款的伟大时期已在1929年结束;如果国际投资得到

    恢复,那将是政府间提供资金的时期。

    为政府间贷款所采取的第一个重大措施是在1933年成

    立了美国进出口银行,这家银行主要是向各国政府放款,但

    是并不完全如此。接着在第二次世界大战结束时,联合国用

    大多数会员国交纳的会费开设了国际复兴开发银行。这种银

    行也有借款权,它在美国和欧洲行使了这种权利。这两家银

    行发放低息(3—5%)贷款,偿还期比较长。此外,宗主国

    在它们的殖民地设立了投资机构。英国成立了由政府提供资

    金的殖民地开发公司,成立这家公司主要是为了进行直接投

    资,但是它也向私人企业、公用事业和公营公司放款。其它

    欧洲宗主国政府也有类似的机构。

    虽然政府间贷款的这些机会是存在的,但是贷款总额很

    小,现有的机构根本没有得到充分的利用。其主要原因是这些贷款实际上只限于“自我清偿”项目,也就是说,只限于那些本身直接产生收入的项目——例如电力或钢铁公司——

    这样可以用这些收入还本付息。现在,这些国家需要的许多

    发展项目是用于教育、公路、公共卫生、研究、农业推广或

    社会开发等非自我清偿开支。许多其它项目只有一部分是自

    我清偿的,如农村供水、水土保持或开垦土地。而在大多数

    欠发达国家,这些计划正好是最紧急的优先项目。在1929年

    以前,一个有偿债力的政府可以为实现它喜欢的任何目标,或

    者甚至没有规定任何目标而在资本市场借款。这些新机构并

    不能代为提供这种已经消失的方便条件。它们能代为提供公

    用事业借款,而不提供政府的杂项借款,前项借款往往占外

    国贷款的三分之一。

    此外,政府无法仅仅为了扩大公共事业的规模而借款,这

    本身就限制了它们为公用事业及其它自我清偿项目借款的能

    力,一般说来,一切投资都取决于是否具有足够的公共基础。

    说得比较具体一点,如果投资的速度加快,那么一切教育和

    培训机构马上就会受到压力。必须有工程师、科学家和管理

    人员来制订计划,并加以实施,还要有其它各种水平的熟练

    人员,如石工、木工、焊工和电工等。由于联合国、美国和

    参加科伦坡计划的英联邦国家提供援助,以及宗主国向它们

    的殖民地提供技术援助,这种缺乏专门人才的情况有所缓和;

    但是除了缺乏大批专家这个事实以外,这些国家的基本需要

    是培训它们自己的人民。它们必须花费许多钱来办各种形式

    的教育,在它们能够找到用于这一目的的资金之前,它们使

    用自我清偿贷款的能力就会受到限制。

    因此,对于建立负责政府间转拨为非自我清偿开支提供

    资金的机构已经进行了许多讨论。从理论上说,这些机构也

    完全可以成为贷款机构,因为提高国民生产率的任何开支,都

    能还本付息。但是由于所提高的生产率并不直接进入国库,所

    以用贷款为非自我清偿开支提供资金的政府,到还本付息的

    时候,在财政上就会遇到困难,除非它有第一流的财政制度。

    因此,这个问题一直是从政府间援助赠款的角度来讨论的,而

    不是从贷款的角度来讨论的。

    在这方面宗主国带了头,在第二次世界大战期间和战后,

    宗主国设立了殖民地开发基金,用以补贴它们的殖民地的公

    共开支。英国有殖民地开发法,其它宗主国也有这种法律,英

    国殖民地开发法规定,每年开支为1500万到2000万英镑。采

    取的另一个步骤是美国在1948年制订了经济援助计划。这种

    援助的最大部分是给欧洲的,但是在最近几年里,欠发达国

    家也一直在得到援助(不包括军事援助),数额为每年3—4亿

    美元。联合国还决心支持成立一个联合国机构,为发展经济

    提供补助金或低息贷款,但是它仍然还得决定这个机构应当

    在什么时候开始活动。

    如果人们考察一下外来资金的情况,那就很难不得出这

    样的结论,那就是国际转拨款项能否恢复到战前的(实际)水

    平首先取决于建立一个适当的补助金制度。外国直接投资只

    与不发达国家所需的一小部分资金有关系。外国投资在它的

    盛行时期多半是借款给政府或者在公用事业投资,现在和那

    个时候一样,问题主要是为现在的国营经济部门寻找资金。现

    有的政府借款机构是与自我清偿项目有关的,在这方面看来是足够了。所缺的是政府扩大生产性的但是非自我清偿的开支的资金。在1929年以前,政府可以为实现这些目标而借款,

    所借的款额几乎和公用事业的直接投资相等。在消除这个差

    距之前,无论是通过取消对目前的贷款机构的限制来消除,还

    是通过设立补助金来消除,所有其它外国投资大概都会遇到

    障碍,因为一切投资在某种程度上都取决于公用事业是否有

    足够的基础。

    第三节 投资

    (一) 制度基础

    我们在第三章里已经泛泛地讨论了鼓励采取主动行动和

    冒风险所需的制度基础。下面我们只谈谈与储蓄和投资之间

    的联系有关的若干特点。

    应当指出的第一个特点是从这样一个事实中产生的,即

    许多投资必须具有相当大的规模。在这个问题上,有些作者

    描绘了一幅田园诗般的资本形成的图景,其中“普通人”为

    了适应环境,储蓄了或者借了一小笔钱,并逐渐改善了他的

    处境。有些投资是属于这一类的。普通人可以改善他自己的

    房屋或他的小农场,或对一家商店或一辆卡车投资,但是这

    在发展经济所需的投资中所占的份额还不到一半。最大的一

    部分投资必须是在公共工程和公用事业方面。虽然普通人可

    以通过社会发展计划对公共工程作出有益的贡献,但是公共

    机构和公用事业机构必须对公路、铁路、港口、电力和其它大项目进行大量投资,而这是远非适应环境的普通人力所能及的。持悲观态度的人说,有许多例子说明,这些巨额开支

    没有产生任何效果,因为使用不当,但是如果由此得出结论,

    认为不花这些钱经济也有可能发展,那是荒谬的武断的推理,

    因为他的观察结果不会使他看到有任何不支出这类巨额开支

    经济也会发展的社会。其它大规模投资项目是采矿、制造、进

    出口批发、银行和保险、灌溉工程、某些农产品加工,以及

    某几种农业生产;甚至连随着经济增长而迅速扩大的城市住

    房建筑业也吸收大笔资本,因为城镇工人阶级拥有他们所住

    的房子是异乎寻常的。经济增长的特点并不是普通人进行储

    蓄并提高他的生产能力。这是一个必要的和可取的特点;但

    是经济增长的特点是少数人、私人、法人或政府机构在昂贵

    的项目上进行巨额投资。

    由此可以得出这样的结论,即经济增长的特点是企业家

    精神,也就是说,一小批人、私人投资者或政府官员出现了,

    他们支配大笔资本,雇佣大量的其他人。我们已在各种地方

    考虑了由此产生的问题;我们已对这个集团的起源、它的动

    力以及它所需的训练作了猜测。我们也已指出,后果是社会

    上很大一部分人无产阶级化,他们必须在这些大单位中为工

    资或薪金而工作,没有所有权或控制权。这种情况所产生的

    进一步的问题即纪律、合作和工厂安定方面的问题,是属于

    本世纪最难以解决的问题之列,我们在第三章中已经谈到了

    这些问题,可惜没有找到任何容易的解决办法。

    如果投资者不使用他们自己的储蓄,就有必要建立一些

    机构,对储蓄者提供保护,足以鼓励他们把钱借给投资者。在先进的工业社会里,投资者在很大程度上动用由他们直接控制的储蓄。例如,制造业的扩大主要靠未分配利润,而在更

    早的阶段,它在更大程度上依靠外部筹资。同样,各国政府

    现在通过税收筹集自己投资所需资金的程度高于30年以前

    的水平,而通过借款来筹集这种资金的程度低于30年以前的

    水平。从理论上说,未分配利润属于股东,税金属于纳税人,

    要保持股东对董事的适当控制,或者公众对政府的适当控制

    自然存在着许多实际问题。但是从狭义来说,未分配利润和

    政府储蓄是投资者的储蓄,因为这些储蓄的数额和用途首先

    既不是股东确定的,也不是一般公众确定的。这比较像资本

    主义发展初期的情况,而不像50年以前的情况。在资本主义

    发展初期,自由储蓄用于投资的情况是很少的,没有经过适

    当组织的资本市场,只有为生产目的借贷资金的初步机构

    (放债人和典当商自然始终是存在的)。在这个阶段,生产投

    资大部分来源于未分配利润。只有在经济得到很大发展的时

    候,储蓄功能和投资功能才在很大程度上分开了。

    要使储蓄从放款人顺利流向借款人,在制度上必须具备

    的主要条件是有限责任和很容易销售的资产。

    有限责任的原则产生于债权人和合伙人的区别。按照这

    些概念的原义,债权人是以固定条件出借资本的人:他按规

    定获得利息,有权到某个日期收回本金,他对企业没有控制

    权。而合伙人为了获得一份利润进行无限期的投资,他有管

    理权;法律也规定,他个人的整个财产要对他所参加的任何

    企业的债务负责,而不仅仅是他投资到企业的那一部分财产。

    有限责任使这两个概念形成交叉:投资者为了获得一份利润而进行无限期的投资,并在投资伙伴的同意下可以行使管理

    权(通常是授权给在他控制下的董事们),但是他只是在投资

    上对企业的债权人负责。之所以有必要规定有限责任是因为

    出现了这样一些事业,这些事业所需的资本超过两三个合伙

    经营的伙伴所能筹集到的——尤其是运河、铁路等大规模的

    投资。有限责任使数以千计的人有可能参加承担风险的事业,

    他们有管理权,但同时又不必将他们全部私人财产都牵涉进

    去。

    18世纪的经济学家并不很重视这个原则。他们认为,对

    于像公用事业那样非常大的事业来说,这个原则是必要的,但

    是他们又认为,将管理与资本的所有权联系起来是十分重要

    的,所以在所涉及的资本数量比较少的情况下,事实将会证

    明合伙经营比成立联合股份公司有效得多,并能站住脚根。他

    们没有预见到,到19世纪,在那些希望将他们的投资分得很

    散的许多人中间,购买有限责任股票的习惯将变得十分普遍,

    最终将使得有限责任投资成为典型的形式。实际上,也许正

    是由于这种资金容易筹集,才使资本家对储蓄的态度扩大到

    社会的其余部分。我们在讨论储蓄时说过,在资本主义以前

    的社会里,农民、地主、贵族、专业人员和中产阶级等,不

    是没有盈余,就是用他们的盈余办慈善事业,豢养随从,修

    建庙宇和纪念碑,或者用于其它非生产性用途;但是在资本

    主义发展的后期各阶段,所有这些阶级接受了资本家的思想,

    认为盈余应当用于生产投资。在后期各阶段,地主购买有限

    责任股票,甚至连教士也购买这种股票,这种资金的存在也

    许对储蓄和生产投资思想的普及起了最大的作用。

    刺激放款的第二个条件是,放款人应当能够很容易地收

    回他的资金,办法是或者出卖他的清偿权,或者如果借款人

    丧失清偿能力,则出售借款人的资产。前者主要是一个是否

    有适当的方便条件来销售债券、股票、抵押品和汇票的问题。

    这样一种市场的存在自然需要有人或机构愿意经营信贷业

    务,这样,希望收回资金的放款人就可以收回,不会因要求

    立即偿还而使借款人难堪。这些金融经纪人往往遭到他们的

    同胞的敌视,但是他们行使的职能显然是很重要的,因为如

    果他们不存在,那么储蓄者就不大愿意放款了,因为放款以

    后他们就没有流动资金了,因此生产投资将减少。如果人们

    研究一下任何迅速发展的社会的经济史,金融市场的扩大始

    终是初期各阶段的一个显著特点,并且几乎是进一步发展的

    一个先决条件,这决非偶然。在一切土地都属公有,一切活

    动都由政府提供资金的社会里,这种市场是不需要的,但是

    凡是有私人投资的地方,这种市场是必不可少的,如果不出

    现一批普通的银行家、商人、证券经纪人和金融家来行使这

    个职能,那就有必要设立履行这种职能的政府机构。设立一

    个随时可以购买抵押品、股票、商业票据,或放款人希望脱

    手的其它金融证券的政府机构在技术上自然是没有困难的,

    但是由一个政府垄断机构进行这些担风险的活动,能否比在

    存在着竞争的市场上进行这种活动更有成效或更加便宜,这

    看来是很值得怀疑的。

    在可销售的金融证券的后面是为这种证券作担保的可销

    售的物质资产——土地、房屋、珠宝、库存商品、机器、工

    厂等。这一部分是市场问题,一部分是法律问题。在交易额大得需要有一个市场的地方,市场很快就形成了。那些专门创造这种方便条件的人——经营不动产的商人、律师、珠宝

    商和商品批发商——在我们的同胞中间又是并不总是最受人

    爱戴的,因为他们这一行业的资本价值是难以预测的并且有

    时波动很大,这种风险迫使他们在做生意时表现得精明、无

    情和狠心,如果他们的生意要获得成功的话。但是他们所行

    使的扩大资产市场的职能,增加了获得流动资金的机会,因

    此使储蓄者将钱借给生产投资者的风险减少。

    除了市场问题以外,与土地所有权和出售土地有关的法律也是十分重要的。在处于发展初期的社会里,土地是借款人拥有的最重要的资产,他们可以把土地用作贷款的抵押品。有些国家已采取步骤来限制抵押,以防止小农过分落入放债人的手中。除了这个问题以外,如果想鼓励借贷,那么土地应当是可以抵押和出售的,而在法定权利上不会引起许多混乱,这是非常必要的。实行土地登记制度,如有可能,以土地丈量结果为基础,可以减少因界限不明而引起的法律纠纷。有些社会在确定所有权方面也有困难,在那些社会里,继承法复杂,家族庞大,或者所有者、占用者和社会当局之间权利分配情况复杂,这些因素加在一起使得任何一个人或几个人拥有有效所有权的权利受到怀疑。各类抵押品的权利在出售时可能也是一个麻烦,除非法律规定购买者可以获得没有任何负担的所有权。由于欠发达国家的土地法不但是不明确和不确定的,而且通常是极其复杂的,所以处于经济发展初期阶段的立法机构始终有许多工作要做,它们要设法使买卖土地的法律制度即使不井井有条,也至少要很明确。

    为了补充私人贷款,欠发达国家的立法机构也参与建立贷款机构的工作;这是因为国家拥有自己可以支配的额外储蓄,或者因为它特别希望鼓励某几类投资。

    我们已经讨论了将来政府可能控制许多储蓄的原因。这

    可能仅仅是它们用征税的方式将本来由私人控制的储蓄拿

    走:这是高税率对利润的影响。或者可能是政府迫使社会储

    蓄比它本来愿意储蓄的数额更多的钱,办法是对农民或地主

    或为了纳税而减少消费量的其它阶级征收高税,或者借助于

    建立信用或通货膨胀。或者可能是除了向私人借款者开放的

    资金以外,还有外部资金来源,在当今实行政府间转账的日

    子里尤其如此,这些外部资金来源或者采取贷款形式或者采

    取补助金形式。如今,许多国家的政府已经承担了保证与国

    民收入相比使资本形成达到高水平的责任,这是它们以前的

    各届政府所不接受的。它的必然结果是,必须建立机构来处

    理因此由它们控制的储蓄。

    迫切要求建立政府金融机构的另一个原因是想为那些向

    私人放款者筹集资金有特别困难的集团提供资金。有五个阶

    级一直受到特别照顾,它们是农民、手工业工人、小消费者、

    房产主和实业家。

    小农无法以低利向私人放款者借钱,因为这类放款要冒

    风险,因为管理这种借款要支付费用。如果通过乡村信用合

    作社来放款,那么风险和费用就会大大减少,这种合作社很

    小,成员们对彼此的事务和信誉一清二楚。这些合作社有时

    能向商业银行等普通私人放款者借款,或者甚至接受一般公

    众的存款。然而,通常需要由政府来监督它们的事务,并保证进行有效的管理。一般说,除了信用社从它们自己的社员

    的储蓄或向私人放款者筹集资金以外,政府还有必要向它们

    提供更多的资金。政府需要多少钱,作为农贷,一部分取决

    于它们对其它放款者的态度,一部分取决于它们执行农业发

    展计划的劲头如何。如果它们不想使农民落入私人放债者之

    手,尤其是如果它们为了这个目的不让农民把自己的土地抵

    押出去,或者不在法庭上承认农作物置留权,那么它们更有

    必要拿出钱来资助农民。同样,在农民在某种程度上依赖地

    主提供资金的那些国家里,如果政府向地主课以重税,或者

    将土地所有权转让给农民,那么它必须取代地主提供资金。如

    果同时它有有力的农业推广服务,成功地说服农民使用肥料,

    改良牲畜,或者拥有更好的设备、谷仓、建筑物或蓄水设施,

    那么它必须满足农民对资金的大笔需求,虽然这可能仅仅是

    一只手从农民那里拿钱(通过土地税或出口税),用另一只手

    将钱借给他们。对农业所需资金的数额往往估计得过低。在

    欠发达的经济中,农业产出占国民收入的一半左右。所需流

    动资本很多,因为农作物是季节性的,目前,借来的资本大

    部分用在这一方面。如果除此之外将10%的产出用于再投资

    (比较发达的国家把将近20%的农业产出用于再投资),那么

    仅此一项就将用去5%的国民总收入。

    在亚洲,手工业是一个重要经济部门,虽然在非洲或拉

    丁美洲,手工业远没有那么重要。我们在第三章(第四节

    (五))中已经讨论了手工业工人生存的条件,并且已经看到

    他们在人口过剩亦缺乏资本的国家里发挥着多么重要的作

    用。我们也已经看到,如果对这些工人进行培训使他掌握新技术,如果改善销售组织,提供更好的原料和更好的设备,那么他们的工作效率可以大大提高。所有这些事情都需要设立

    政府机构,用由它们支配的相当多的资金来资助研究工作、购

    买新设备,贮存原料、在制品和制成品。由于贮藏设备不足

    目前是这些行业的大弱点之一,预计光是这一点就可能消耗

    许多资金。

    事实证明,在印度尼西亚,就像在荷兰一样,国营典当

    业是受欢迎的、有用的,取价低廉的和非常有利可图的。当

    铺在城乡到处都有。它是一种“社会服务”,旨在使人民不受

    放债人的剥削,而不是生产投资设施,但是它在某些国家设

    立的金融机构的名单中是不能省掉的。

    有些国家的政府还在建立为新建房屋提供资金的机构,

    不仅比较发达的国家设立这种机构,而且欠发达国家也设立

    这种机构,不仅为城市建房提供资金,而且也为农村建房提

    供资金。在某些情况下,政府本身正在建造房屋,例如在新

    开垦的土地上或者在贫民窟拆除后的地方建造房屋。在有些

    情况下,企业为其雇员提供住房,例如种植园,或矿山,或

    铁路部门就是这样,政府借钱给雇主修建房屋。在其它情况

    下,得到资金的是房主,他们用这些资金自己建造房子,比

    如在农场上建造房子,或者从投机营造商那里购买房子。政

    府提供建房资金或者是由于它们想控制房租,或者还由于它

    们想通过提供一些房贴来提高住房标准。(美国政府和英国政

    府现在也提供建房资金以鼓励人们购买房屋。)如果既不控制

    房租,也不提供房贴,那么通常有许多私人提供建房资金,因

    为这种投资很保险。但是在有些国家里,建房标准也是相当低的,因为人们宁愿将额外的收入花在寻欢作乐上,而不愿建造较好的房子。

    然后是发展工业的资金供应问题。在筹集资金方面,小

    厂主遇到了与小农所遇到的同类的困难。此外,政府特别急

    于鼓励地方小企业,这种企业不同于否则可能垄断制造业的

    外国大公司,因此,它们常常为此目的而设立特别的金融机

    构。我们在第四章(第三节(四))中讨论了这个问题,并且

    看到,小企业的困难不仅是由于缺乏资金造成的,而且往往

    也是由于缺乏管理技术造成的。尽管如此,我们还是一致认

    为,设立一个既进行监督和提供管理方面的意见,又向小工

    业家提供资金的机构是适宜的。可是设法从政府得到资本的

    不仅仅是小实业家或地方实业家。由于资本市场不完善,大

    资本家要为制造业筹集资本也有困难。国内大资本家有困难

    是因为在欠发达国家,地方资本不敢从事制造等新式活动。地

    方资本很容易流入大规模的农业、贸易或抵押业,在制造成

    为一种人们熟悉的活动之前,不会提供给制造业。外国资本

    市场也不向任何大规模的制造活动开放。它们成立了特殊机

    构向海外采矿业或种植园或公用事业公司提供资金,但是不

    向制造业提供资金。因此,供制造业使用的外国资本要么是

    通过设在工业国的决定在欠发达国家开设分厂的工业公司渗

    透进来的,要么是通过偶尔也办工厂的海外大贸易公司渗透

    进来的。所以一个愿意在欠发达国家办厂的外国人往往无法

    在他自己的国家里筹集他所需的全部资本。除了那些无法筹

    集的人以外,还有一些人不希望筹集,因为他们宁愿与当地

    人所拥有的资本合伙经营,即使只是以此作为取得政治保护的一种形式。有些国家的政府喜欢合资经营;它们希望参加工业企业,尤其希望参加那些由外国人管理的工业企业,因

    为这样一来,它们为发展工业而必须寻找的资本就增加了。

    向工业企业提供资本的方法各有不同。有些企业是全部

    由政府提供资金,并由政府机构管理,或者由收费的私人公

    司管理。此外还有工业发展公司或银行,它们也许全部为政

    府所有,或者它们也有一些私人股份,反过来不是借钱给私

    人资本家就是购买股票,以此向他们提供资金。有些国家的

    政府则出钱建造工业区或孤立的工厂,然后租给实业家,租

    金往往是有补助的。除了补助金,有些实业家喜欢这种合作

    形式,因为这比他们自己建造也许可以少筹5万镑或更多的

    资本。政府也喜欢这种合作形式,因为它风险小,如果公司

    失败,工厂可以租借给其他人。

    在我们已经提到的所有方面——农业、手工业、典当业、

    住房建筑和制造业——政府放款的作用通常是补充而不是代

    替私人放款,试图填平私人资本市场留下的空白。市场本身

    也建立特殊机构来满足这些需要中的某些需要,例如成立建

    筑信用社为建造住房提供资金,成立“动产银行”式的银行

    来为制造业提供资金。只要思想上没有歧见,政府资金就能

    与私人资金一起发挥作用。例如在某些地方,商业银行和政

    府分工为农业信用合作社提供资金。在工业金融中,有些新

    的金融公司也既有政府资金又有私人资金。值得注意的是,支

    持这些公司的并且愿意贷款给它们的联合国国际银行喜欢提

    出这样的建议,那就是大部分国内资金应当由银行或私人金

    融家来提供,管理工作应当由私人来担任,或者至少应当尽可能摆脱政治控制。

    人们对于这些机够能够做些什么事情来在资金方面帮助

    他们这个问题往往存在错误看法,在小借款人中间尤其如此。

    有些人指望从这些来源得到他们所需的全部资本,或者接近

    于他们所需的全部资本。没有一个放款人,无论是私人还是

    政府,能够提供超过担保物价值的贷款。这些借款人以为,他

    们使用所借款项的货物应当成为担保物,但是作为担保物,任

    何货物的价值都是低于它的价格的。如果一台机器是花了

    1000英镑买来的,那么这台机器一安装好,它的市场价值就

    开始下降了。所以,如以一台机器作担保物,放款人出借的

    钱很少是超过这台机器的价格的一半左右的。因此可以说,除

    了使用所借款项的东西以外,未来的借款人永远必须有一部

    分他们自己的私人资本,或者有一些可销售的资产作为附属

    担保品。在欠发达国家,这个作用往往是由土地和珠宝来发

    挥的,因为它们是人们普遍拥有的仅有的两项可销售资产

    (在大城镇以外的地方,房屋往往很破烂,市场价值很低)。要

    借钱给没有土地的人特别困难,所以在那些农民多半不拥有

    土地,而作为佃农或分成佃农而劳动的国家里,信用社给每

    一个人的贷款数额,与农民有他们自己的土地作担保时可能

    得到的贷款数额相比,是很少的。这个问题的一个解决办法

    是成立有无限责任的合作社。这种合作社在它的发源地(德

    国)似乎经营得很顺利,但是企图把它移植到欠发达国家的

    一些尝试却失败了,因为农民们不愿为彼此的债务承担无限

    的责任。从长远看,最好的解决办法似乎是提倡耕者有其地。

    政府资金的有一个值得注意的局限性是,它通常只提供信贷而不提供资本,因为资金不足迫使政府用它的资金进行

    周转,除非它有机构可以为它在私人资本市场放款再提供资

    金。我们对信贷和资本所作的区别取决于偿还。如果一家企

    业靠发行股票来筹集资金,这些股票是不必偿还的;因此除

    了个人消费所需的费用以外的利润,可以用于扩充企业。如

    果企业靠以信用债券或抵押借款来筹集资金,那么剩余利润

    首先必须用于偿还贷款。政府金融机构通常是指望偿还的,这

    样在第一家企业能够独立以后它们就能用收回来的钱为第二

    家公司提供资金,但是就在一家公司将要在市场上站牢脚跟的时候,偿还贷款的必要性很可能妨碍这家公司的发展。自然并非所有私人企业都希望有一个政府机构作为永久性的伙

    伴,尤其是因为这样一个机构必将相当严格地监视该企业的

    所作所为。但是有些人希望在偿还贷款方面有更大的灵活性,

    其他人实际上可能喜欢与这个机构发生关系,以便得到保护

    或者建立威信。如果将来很大一部分公众储蓄(和外来资

    金)流入政府的国库,它的金融机构可以动用的资金就能逐

    年增加,这些机构就能够比较多地提供资本,少发放信贷。

    与政府金融机构相比,私人金融机构的相对重要性一直

    在发生变化。一个世纪之前,人们认为金融当然是私人的事

    情,政府在市场上仅仅以借款者出现。后来政府开始向在国

    内市场上似乎得不到适当照顾的阶级提供资金,如今,甚至

    连世界上最富裕的国家美国也有一个照顾国内外特殊的借款

    人阶级的庞大的政府金融机构网。除此之外,还有税收对储

    蓄的影响——将储蓄由私人控制转为由政府控制,或者迫使

    社会储蓄比它本来会储蓄的更多的钱。因此,我们就会明白为什么在各个发展水平上,政府现在是为投资提供资金的重要渠道。如果我们除此之外再考虑到以下这一事实,即来源

    于可支配的收入的私人储蓄额在任何地方都是少的,大部分

    私人储蓄都是通过保险公司、房屋建筑会和其它机构投资者

    流动的,那么我们就会明白,为什么现在投资远比一个世纪

    以前制度化了,在那时,个人储蓄者更多地与个人放款者见

    面,并直接同他谈判。与过去同样重要的是,储蓄者应当储

    蓄,投资者应当投资,但是在两者属于不同的人的地方,现

    在他们之间的联系纽带越来越可能是某种公私金融机构了。

    (二) 起点

    一旦一个国家变得习惯于将12%的国民收入用于投资,

    及由此带来的态度和制度,那就很容易明白它为什么继续这

    样做。在经济增长的过程中,令人迷惑的问题是开始和末尾;

    一个国家如何脱离5%或更少的那一类,或者说在发展的后

    期为什么投资表现出缓慢下降。在这一章里,必须对这两个

    问题中的每一个问题作一些说明。下面我们先从加速阶段说

    起。

    我们已经相当详细地讨论了在这个转折点所涉及的态度

    和社会制度的变化,在最后一章里,我们在这个问题上还有

    更多的话要说。在本节中,我们只讨论这个问题的一个比较

    有限的方面,即一个经济部门在开始时所遇到的困难。

    首先,我们可以这样说,这个困难是由于以下事实产生

    的,那就是资金的流动并不是循环的,除非得到资金的人全

    部把它花光。请考虑一下一位新出现的企业家雇佣人员从而使这个国家的就业水平比过去有所提高的情况。雇佣人员和从其他厂商购买货物和劳务的行动使资金进入流通渠道,当

    我们的企业家这样做时,他指望将他的资金赚回来。但是他

    会赚回来吗?你付给人家钱,人家马上转过身来用这些钱购

    买你的货物,这是极不可能的。他们用其中一部分钱购买其

    他人的货物,而这些人则可能用一部分钱购买原来的雇主的

    货物。如果收入全部花光,他得等到这个增值过程结束以后

    才能将他的资金收回来。但是并不是所有收入都重新进入流

    通过程;其中一部分被获得收入的人用来购买进口商品了,一

    部分向政府缴税了,一部分存起来了。因此一位新雇主不能

    只依靠他雇佣的人直接产生的需求;他还必须指望能把别人

    占有的一部分需求夺过来。如果这种需求是国内需求,那么

    他一定要相信,他只要出售新商品,或者提供更方便或更有

    吸引力的服务,或者采用某种新的生产技术而降低价格,他

    是能够将其他人的顾客抢走的,他必须是一位革新者。要不

    然,他一定要能够出口,把外国需求夺过来。

    所以,在经济活动处于低潮时,为外国市场进行生产通

    常是使一个国家走上经济增长道路的转折点。靠为国内市场

    进行生产求发展在这个阶段是极其困难的。除非进行某种革

    新,否则仅仅为国内市场生产更多的产品是无利可图的,因

    为额外的收入抵不过额外的支出,除非将一部分需求从其它

    某个厂商那里夺过来,而这需要进行革新。在经济活动处于

    低潮时,为国内市场进行革新是异乎寻常的。这不仅是因为

    进行革新需要有新技术,而处于低潮的时候,新技术通常是

    从国外引进的,而且更为重要的是,在低潮时,社会气氛对于那些想从其他生产者那里“窃取”一部分市场而使自己富

    起来的人通常是非常不利的。因此,革新通常是在对外贸易

    方面首先进行的,其中一部分原因是带来新思想的是外国人,

    另一部分原因是社会对争夺国内市场的斗争并不是很赞成

    的。

    边际收入用得不够——这是这个论点的一部分依据——是经济停滞的表现,而不是经济发展的表现。因为可以设想,用于储蓄、缴税和购买进口商品的那一部分边际收入,不会得到额外投资、政府开支,或者出口的同样程度的补偿,或者至少是不经过很长的时间间隔不会得到这样的补偿。经济一旦走上增长的道路,那么投资、政府开支和出口额本身就会有一种增加的势头,落在后面的是储蓄、税收和进口额。增长的经济具有通货膨胀的明显趋向,即使这仅仅是幅度不大

    的通货膨胀,或者在通货膨胀的过程中,有规则地出现通货

    紧缩的危机。由于通货膨胀使资本家获得进行再投资的利润,

    并在资本家面前展现了获得巨额利润的前景,从而对投资产

    生促进作用,所以已经走上增长道路的经济往往就停留在那

    里了。同样,停滞的经济往往会停滞下去。根据定义,投资、

    出口额和政府开支并不靠它们自己的势头增加。因此,如果

    部分新开支用于储蓄,进口商品或者变为政府的收入,那么

    即使在以后某个阶段其影响可能是促使投资、出口额和政府

    开支增加,眼前的需求不旺也会抑制经济活动。在储蓄试图

    跟上投资,或者进口要跟上出口,或者收入要跟上政府支出

    的气氛中,生意比在投资落后于储蓄,出口落后于进口,或

    支出落后于收入的经济中兴隆。

    但是即使是不存在边际需求量长期不足的趋势,并且非常倾向于进行革新和在国内市场进行竞争的经济,也还有一个障碍要克服,即各个经济部门要在彼此保持正确关系的情况下增长,否则它们根本就不可能增长。例如,假设为国内市场生产粮食的农业部门进行许多革新,其结果不是有剩余粮食可以销往城镇,就是农业部门有剩余劳动力要到非农业部门寻找职业,或者两者兼而有之。如果制造业同时以合适

    的速度增长,那么它既能吸收剩余粮食,也能吸收剩余劳动

    力。如果制造业没有发展,那么贸易条件将对农业不利,由

    于农业劳动力和农产品过剩,农业收入将受到抑制,这个部

    门的进一步投资和革新活动可能受到影响。如果这个过程仍

    然使农民比较富了,而不是比较穷了,他们将购买更多的进

    口商品,这个因素将引起通货紧缩,除非现在代替进口货的

    国产商品的产量有了适当的增长,或者出口额有了适当的增

    长。一个经济部门的革新活动将受到抑制,除非其它部门也

    适当地扩大。

    如果经济的发展集中在工业化方面而忽视农业,就像苏联所发生的情况那样,那就会产生完全一样的困难。于是农产品严重短缺,农产品价格上涨,从而使所有其它物品的价格螺旋形上涨。要在营利的情况下卖掉工业品也是有困难的。如果农民的实际收入增加,产业工人的实际工资也必须相应增加,同时工业产品的价格要保持在比较低的水平。如果农民的实际收入保持在低水平,他们就买不起工业品,这样就无法推销工业品赚钱了,除非开发国外市场,或者除非像苏联政府所做的那样,政府将剩余工业品接收过来用于资本形成和国防——但是在一个农民的收入并不在提高的经济中,这样做就会产生购买这些工业制品的资金问题。这种情况与我们在第二节(二)中对储蓄所作的分析也是有联系的。如果农业停滞不前;资本主义部门就不能增长;资本家的利润仍占国民收入的一小部分,因此储蓄额和投资额也是少的。经济的顺利发展要求工业和农业一起增长。

    如果我们将经济分成三个部门来考虑,那就可以比较正式地表示这种关系了。A代表供应国内市场的农产品,M表示供应国内市场的工业品,X代表供出口的产品。如果M扩大,A产品的需求量就会增加。如果增加的M产量替代进口商品,那就可以用节省下来的外汇支付进口更多的A的费用。如果不是这样,如果A停滞不前而M不断扩大,那么不

    是A的价格上涨,就是进口额增大,从而造成国际收支逆差,

    这些情况都会限制M的扩大。另一方面,不断增大的需求量

    可以通过扩大X来满足,扩大X可以提供外汇来支付进口商品的费用。所以在扩大M的同时必须扩大A或X,或者采取进口替代措施,如果要使M的扩大继续下去的话。同样,在

    扩大A的同时,必须扩大M或X,或者采取进口替代措施。

    只有X能单独不断扩大,不会因A或M不扩大而受到限制:

    出口额扩大以后所产生的需求量,可以用进口商品来满足,因

    为出口为进口提供外汇。正如我们过一会儿就会看到的,这

    是扩大通常从出口开始,而不是从供应国内市场的生产开始

    的一个原因,无论生产工业品还是生产粮食,情况都是这样;

    这也是一个国家的出口工业能够欣欣向荣而国内消费品的生

    产仍然比较落后的一个原因。

    如果我们暂时只谈封闭的经济,虽然必须使工业和农业一起得到发展,但是它们不必以同样的速度增长。对工业品需求量的收入弹性大于1,而对粮食需求量的收入弹性小于1。对劳务需求量的收入弹性甚至大于工业品。因此,经济的增长与增长得极其迅速的劳务有关,也与工业总产量比农业总产量增长得快有关。当我们谈论在封闭的经济中制造业和农业“一起”增长,或者“以适当的速度”或“平衡地”增长时,我们是指社会消费农产品多于工业品的边际倾向性所

    决定的速度。开放的经济比较复杂,因为供国内消费的工业

    品的增长,可以用供出口的工业品的增长而不是用农产品的

    增长来平衡(或者反过来也是一样,用“农产品”替代“工

    业品”),所以在现实世界上,我们必须使进口、出口、工业

    和农业保持平衡,而不仅仅使其中任何两项保持平衡。

    工业生产的扩大并不要求农业生产也扩大,如果它得到

    工业品不断增加的出口额支持的话,这个事实对于有些人口

    过剩的国家来说特别重要,因为那些国家不能希望它们的粮

    食产量与粮食的需求量增加得一样快,无论它们作出多大的

    努力。在这种国家里,工业化绝不取决于农业的扩大,虽然

    事实仍然是,它们应当十分重视农业生产。因此,这种国家

    必须立即十分注意扩大它们的工业品的出口市场,因为归根

    到底,是它们的出口额增长速度决定它们国内扩大的限度。很

    明显,英国的经济就是这种情况。工业革命伴随着农业革命,

    但是国内需求量不久就超过了农业生产的可能性,从拿破仑

    战争结束到美国内战爆发,决定英国经济增长速度的因素是,

    累积起来,英国工业品的出口额每年将近增长6%。同样,英国经济在过去80年里的增长速度慢得多这一点用以下事实或许可以得到最好的解释,那就是英国在面临外国新的竞争

    的情况下,即使在和平时期也未能使出口额的增长率每年超

    过2%。在英国、日本或印度等人口过剩的国家,工业品出口

    额的增长率也许是限制国内增长的最重要因素。我们在下一

    章里再回过来谈这个问题。无论如何,这些国家必须同时努

    力提高农业产量,因为它们的农业产量提高得越多,它们依

    靠在国际市场上推销它们的工业品的必要性就越小。

    实际上,在非常落后的经济中,通常最不能响应其它部

    门的增长的,因此对一切经济增长都起阻碍作用的部门,是

    生产供国内消费的粮食的农业部门。这是因为当农业掌握在

    小农的手里时,革新成果的推广取决于政府的主动性而不是

    取决于私人企业家的主动性。如果在制造业等其它部门,需

    求量的增加会把一些私人企业家吸引到这个行业中来。然而

    要提高农业产量需要采取一些行动,这些行动基本上是政府

    范围内的行动,首先是在农业研究和农业推广方面,以及在

    公路、农村供水、农业信用机构等方面花费大量资金。日本

    的经验表明,政府在这些方面的适当开支对农业产量可能产

    生惊人的效果(就他们的情况而言,人均生产率在30年内翻

    了一番),农业远不是落在其它部门的后面,也没有对其余经

    济部门起阻碍作用,而是能够变成一个带动因素,为其它部

    门产生需求,还为它们提供资金。但是处于这种情况下的大

    多数其它国家的政府都忽视农业,其结果是农业得不到发展,

    其它部门的增长率也提不高。与英国相比,法国相对来说是

    停滞的,或者与日本相比,中国相对来说是停滞的,在对这种现象作出的种种解释中,在本作者看来,农业生产率提高得比较慢是最根本的原因。法国仍然需要四分之一的人口从

    事农业才能使粮食够吃,而最先进国家只需12—15%的人口

    从事农业就够了。

    国内市场的这些不足之处,无论是在总需求量方面,还

    是在重要部门的响应方面,或者是在对因进行革新而造成争

    夺市场的竞争的态度方面,都说明了为什么通常由对外贸易

    带动经济走上发展道路的原因。为出口进行生产不存在像为

    国内市场进行生产那样的不利条件。它不依赖其它部门的需

    求量的适当增长;它在国内不引起竞争,因为在初期各阶段,

    与一个国家的个人生产者的产量相比,世界需求量是很大的;

    而且它不依赖于国内的有效需求。此外,出口为其它商品创

    造新的实际需求,所以对为国内市场进行生产的一切行业都

    是一种刺激。出口还以其它方式刺激国内工业。为出口工业

    建造的一些设施,例如通信和培训设施或者工程服务机构,对

    国内工业也是有用的。出口工业在为国内工业部门创造更多

    的需求量的同时,也悄悄从国内工业部门拉走劳动力,这促

    使国内工业部门进行旨在提高生产率的革新。当马尔萨斯和

    利斯特等19世纪的经济学家强调对外贸易在经济发展初期

    各阶段的重要作用时,他们不仅常常想到出口的作用,也常

    常想到进口的作用。进口引起新的爱好,所以他们认为能激

    发新的工作干劲,以及最好地利用现有资金的新的愿望,以

    便有额外的收入来购买新的商品。几乎可以肯定,进口商品

    在那些已知的消费品缺乏花色品种的国家里也会产生这种影

    响,因为进口会使人们追求享受的愿望比较高。但是即使在这种影响不大的地方,对外贸易也会通过增加出口商品生产的影响改变整个经济的气氛。

    在发展初期的各个阶段,对外贸易的重要性也是在这个

    阶段领导权通常掌握在外国企业家手里的原因之一。本国企

    业家发展出口工业并到国外去寻找市场显然是可能的。但是

    消费量不断增加的发达国家派人去寻找新的供应来源这种情

    况比较普遍。此外,比较发达的国家的企业家不论对生产技

    术还是销售或运输技术都略知一二,这使他们处于比欠发达

    国家企业家有利的地位。经过一段时间,本国企业家学到了

    技术,人数增加,并且具有在本国经营成本较低的有利条件,

    他们就能把外国企业家赶走。不论你读从14世纪到16世纪

    英国的经济史,它同低地国家的关系的经济史,也不论你研

    究19世纪最后25年的日本历史,还是研究斯里兰卡最近的

    发展,情况大体上都差不多。

    虽然扩大出口是开始发展经济的最容易的手段,因此它

    是一种有利条件,但是过分集中于出口业就像过分集中于任

    何其它部门那样是不利的。这种不利条件表现在不利的贸易

    条件上。如果不采取措施来提高农民生产粮食的生产率,它

    们就会变成矿山、种植园或其它出口企业获得廉价劳动力的

    后备军。热带不发达国家的情况在很大程度上就是这样,这

    也是工业国能够以如此有利的条件买到热带经济产品——如

    茶叶、棉花、油籽和各种矿产品的原因。生产这些商品所需

    的劳动力可以以便宜的价格获得,因为这些劳动力否则就要

    留在农场里生产粮食,每人的生产率是很低的。只要农场的

    生产率低,温带地区就能以很低的价格得到热带劳动力的服务。此外,当为出口而生产的农作物的生产率提高时,不必同劳工分享增加部分,实际上,降低价格的好处全部被工业

    消费者享受了。蔗糖是一个说明问题的极好例子。按任何生

    物学标准来衡量,蔗糖生产是一个生产率极高的部门。它也

    是一个在过去70年里每英亩产量大约翻了两番的部门,这个

    增长率是世界上任何其它主要农业行业所无法比拟的——肯

    定是小麦行业所无法比拟的。尽管如此,蔗糖业的工人仍然

    赤脚走路,住在棚户里,而生产小麦的工人的生活水平则是

    世界上最高的。无论制糖业的生产率可能达到多么高的水平,

    好处主要是属于消费者的,热带国家的一个不利条件(对工

    业国有利)是,它们的经济的发展集中在经济的出口部门,外

    国企业家和外国资本首先主要致力于扩大出口,其结果是,它

    们的出口对工业国有利。

    教训并不在于扩大出口不对,而在于完全集中在这个经济部门是不对的。采取措施提高为国内市场进行生产的部门首先是农业部门的生产率同样是重要的。而如果这样做了,出口部门工人的实际工资将以同样的速度增加。忽视出口与过分集中于出口一样,也是错误的,因为出口业很可能成为一个拖经济发展后腿的因素。例如,人们可能很愿意为国内消费投资,仅仅由于缺乏外汇,国内消费得不到满足。私人企业家可能有许多计划,打算在供国内消费的制造业或农业投资,政府可能也有一个在教育、公用事业和类似项目投资的庞大计划。然而,所有这些开支都会对国内投资所需的进口机械或材料,或者进口消费品产生额外的需求。所有发展计划需要有更多的外汇,所以如果不提高赚取外汇的能力,所有发展工作可能就要停止。不少国家目前就是处于这种状况。

    因此,任何全国发展计划都必须适当规定扩大出口,或者生产进口商品的代用品。但是这仅仅是以另一种方式强调对外贸易在经济增长初期各阶段所起的作用。

    在经济增长的以后各阶段,能动作用不再由对外贸易垄断了,甚至可能从对外贸易完全转移到国内市场。在美国,这种过渡大约是在19世纪末某个时候实现的。随着时间的推移,首先受到出口刺激的国内需求量的增大,对国内企业家是一个鼓舞,过不多久,对国内消费的投资可能成为经济增长的主要支柱。如果农业部门不按资本主义方式进行改革,这种过渡可能长期推迟,法国就是那样,因此继续成为需求和劳动力供应方面的阻力。或者如果像英国那样,与自然资源相比,人口规模迫使国家严重依赖于进口,因此将全面增长率降低到外汇收入增长率或生产进口商品代用品的生产率,那就根本不可能完全过渡。

    这种分析的一个必然结果是,它说明了在外汇不受压力的情况下使经济得到发展的条件。如果经济增长的主要原因是,它的出口商品的需求量迅速增大,那么经济将处于消费品的进口往往落后于出口的有利状态之中。与此成对照的是,如果经济主要是由于国内市场而得到发展,那么进口额往往会增长(除非它正在发展进口货的代用品)而出口额不会得到相应的增长。除非得到巨额外国援助(贷款或赠款),否则发展计划可能不得不在外汇受到管制的情况下实行。出口商品需求量的不断增加永远是一件好事。

    这个分析得出的结论并不是非常惊人的;那就是在发展计划中,一切经济部门都应当同时增长,以便使工业和农业之间,为国内消费进行的生产和为出口进行的生产之间保持适当的平衡。虽然这是一个相当明显的结论,但是它既不符合目前的做法也不符合目前的建议。例如,工业国有整整一个学派的“开明”经济学家,他们通常以高傲的教训人的口吻告诫农业国要集中力量发展农业,不应做任何事情来促进工业。这一派经济学家还宣扬出口的好处,并对那些可能具有减少对对外贸易的依赖性的作用的计划表示惊恐。这个学派与马克思主义和民族主义的教条一样愚蠢,根据这些教条,通往经济发展的道路在于集中力量实现工业化。在由这些争论引起的热潮中,采取这样一种态度似乎差不多等于是胆怯,那就是,事实是,一切部门都应当同时发展,但是这种论点的逻辑性与它的简单化一样是攻不破的。

    (三) 稳定性

    私人投资的一个重要特点是它没有规律,这种情况反过来又使收入和就业机会产生很大的波动。在过去150年里,论述这个问题的著作很多。在本书中详细论述这个问题既无必要又无可能。另一方面,一本论述经济发展的书不谈投资的波动看来是非常奇怪的,所以在这里必须简单地谈一谈这个问题的主要特点。

    每一个国家都有它自己的国内不稳定的根源,除此之外,每一个国家都要受通过对外贸易从外界传入的波动的影响。国内不稳定的根源与新发现的矿藏、某些资源的枯竭、新土地的开垦、新发明的应用、政府的通货膨胀或通货紧缩政策,与迁移、内乱、流行病、地震、火灾、旱灾和其它许多因素是有联系的。即使世界贸易额稳定增长,不出现波动,那么每一个国家都会出现它自己的波动。然而事实上,在大多数欠发达国家,国内的这些波动被比较先进的国家的波动所造成的外贸额的波动掩盖了。世界贸易额的这些波动,与贸易额和价格的大起大落有关,而贸易额和价格的大起大落是由先进国家需求量的交替增减造成的。在这个意义上,世界上一切私人企业经济如今与美利坚合众国相比都是“欠发达的”,全世界约五分之二的收入是在美国产生的。在19世纪,英国和德国也是独立的波动的根源,在某种程度上,它们现在仍然是波动的根源,但是与美国相比,现在它们造成世界收入波动的影响已经很小了,它们本身受美国经济活动水平的影响大大超过受本国独立波动的影响(战时和通货膨胀时期除外)。所以,如今在美利坚合众国,或者从最广义的角度来说在高度发达的在业国,造成经济活动波动的根源是经济周期问题。

    造成经济活动波动的原因并非只有一个,而是有几个。某

    一个原因在这个周期中可能起重要作用,而在另一个周期中

    也许是次要的。分析经济周期的一个困难也在于当几个可能

    的原因一起发生作用,而且可能彼此影响的时候,了解每一

    个可能的原因有多大的重要性。经济周期理论集中在创造简

    化的模型,以检验好几个可能的孤立原因中的每一个原因,但

    是,迄今所采取的从这一点到详细解释任何特定波动,并且

    恰当地估计它的每一个原因的重要性的步骤,并非人人都满

    意。即使是可能的原因也没有取得完全一致的意见,就是在抽象模型这一级也是如此。在以后的各节中,我们不想提出一个经济周期模型,或者说不打算通过对上下转折点和介于

    两者之间的自我加强过程进行通常的分析,将这个体系讨论

    下去。如要进行适当的讨论,那就要扩大本书的篇幅,就这

    个题目而言,这是不值得的,因为本书的重点是讨论在长期

    而不是短期的变化中影响经济增长的诸因素。因此,我们下

    面只向那些对这个题目并不十分熟悉的读者,简单地说明一

    下人们已经提出的投资额为何不能稳步增长的一些主要原

    因。挑选出来在这里进行讨论的原因有:创新的不规则性、银

    行信贷的灵活性、投资和收入增长之间的不稳定关系,以及

    收入分配的变化。

    创新的不规则性很容易理解。我们常常谈到创新有一个

    显示逻辑增长模式的趋势。汽车发明以后,它需要经过很长

    的时间使自己站住脚,然后才能普及。随之而来的是一个汽

    车迅速发展,取代其它交通工具,尤其是取代马匹的阶段。在

    这个阶段需要进行巨额投资,不仅要对生产汽车的工厂进行

    投资,而且还要对公路以及一批供应橡胶、锡、钢材、玻璃

    等原料和部件的辅助行业进行投资。最后,如在美国那样,达

    到再也无马可取代,几乎家家有汽车的阶段。此后,汽车工

    业不可能以与中间阶段相同的速度发展,投资率相应下降。实

    际上,用“逻辑的”这个词来描写每一项创新所发生的情况

    太顺利了,因为投资是间歇性的。当事实证明汽车很受欢迎

    时,就会有许多公司满怀热情地转入汽车制造业,并将生产

    能力扩大到超过当前需求量的程度。有些公司破产了,汽车

    工业变得不景气。然而需求量继续增长,经过一段时间以后赶上了生产能力。接着又爆发出另一阵热情,并且再次竞相扩大生产能力,随后又出现暂时的停滞状态。正是由于经济

    增长的性质,人们才不知道会发生什么情况,因此人们就要

    犯错误,不能希望永远能精确地避免这些错误,使得投资额

    平稳增长。即使在并不涉及多少创新的公认的投资领域,我

    们也注意到了同样的趋势。人口增长率或多或少是平稳的,但

    是房屋数量的增长就不平稳了。相反,在每一个工业社会,建

    房是阵发性的。在一个时期内,到处建房,这种情况大约持

    续10年,其间建造了许多房屋,到处都有空闲的房子,大概占1C10。接着是十来年停建时间。其间人口赶上了住房。于

    是又开始了新的循环。

    由于各行各业投资行为的这种不规律性,因此如果不同

    的投资方式彼此协调配合,使投资总额不断增长,那是纯属

    偶然。这要求每一项新的创新都要恰好在其他创新即将失去

    作用时出现,从而使某一行业投资的波动恰好为其他行业中

    与其相反的波动所抵消。诚然,总有一些投资机会有待利用,

    但并无理由说明事情一定会配合得如此天衣无缝。恰恰相反,

    由于投资的另一种倾向,即一起升降的倾向,这些波动往往

    互相加强,而不是互相抵消。当对一个重要行业,比如对汽

    车业和建筑业的投资增加时,所有其他行业也都因由此产生

    的收入和需求而繁荣起来;此时其他行业的投资者对投资充

    满信心,并且也加快了其投资速度。另一方面,当对某一重

    要行业的投资减少时,所有其他行业也转入萧条,投资者失

    去信心,投资普遍减少。

    就所涉及的投资数量,以及达到投资高峰所需时间而言,投资的行业不同,其重要性亦不同。因此,投资活动的水平主要是由重要行业而不是由次要行业决定的;例如,假若建

    筑业平均占国民总收入的5%,那么它的繁荣(比如增至7%

    左右)或萧条(比如降至3%左右)对于整个投资活动的水平

    是大不一样的,而新开奶品店的开业比率的波动则远没有那

    么重要。同样,如果某一社会着手修建铁路,那么这一活动

    不仅会吸收大量资本,而且会长期保持高水平,比如说持续

    二、三十年。在此期间,其他领域的投资会有一些波动,但

    只要对铁路的投资保持不变,就不会出现大萧条,这就是为

    什么衰退的程度并不都一样的原因所在。当建筑业或某一项

    重大革新方兴未艾时发生的衰退不会变得严重,也不会持久;

    但当建筑业处于发展周期的淡季,或某项重大革新刚过一个

    顶峰(例如1929年美国的汽车)以后发生的衰退可能既严重

    又持久。由于建筑业平均占投资总额的25%,其周期为18—

    20年,因此,在经历了几十年的繁荣之后,往往会出现几十

    年增长较慢的时期也就不足为奇了。

    投资往往是一起行动的,这一点我们已经提到,但如果

    不是由于银行信贷的灵活性,那就不可能达到同样的程度。这

    是造成波动的第二个主要原因。在19世纪银行合并运动深入

    开展之前,工业化国家有数千家银行,每一家银行在信贷发

    放上又都各行其事。正像投资往往一起行动一样,银行也往

    往深受经济活动大气候的影响,经济繁荣,则易于扩大信贷

    (因而进一步促进繁荣);经济萧条,则信贷紧缩(因而加剧

    萧条)。中央银行在过去的50年中所形成的主要职能之一就

    是对商业银行发放信贷加以控制。中央银行根本没有成功地稳定信贷水平,也没有防止银行信贷的弹性对繁荣的保持和严重的衰退起促进作用,但中央银行的工作毕竟十分有效地

    防止了极端情况的发生。如果我们把有关19世纪任何一次危

    机的记载与20世纪的英国和自实行“新政”以来的美国任何

    一次危机加以对比,这一点就看得再清楚不过了。19世纪发

    生每一次危机,都有一些银行因在繁荣时期贸然过分发放贷

    款而遭破产,都有储户害怕银行会被迫关闭而去挤兑。而到

    了20世纪中期,这种情况就没有发生。一些经济学家认为应

    当努力使货币“中立化”,也就是说防止实际流通中的货币数

    量出现周期性的增加或减少。假如能够做到这一点,不论是

    繁荣还是衰退,在程度上都会比较轻,但是这一点是否可行

    很值得怀疑。此外,另外一些经济学家意识到,繁荣时期发

    放信贷会使投资水平超过不发放信贷时的水平。他们将这种

    呈周期性出现的幅度不大的通货膨胀看作是经济增长过程中

    一个不可避免的特征。

    下面我们再来看看投资与收入增长这两者之间的关系。如果资本、收入与消费三者之间有着固定比率,那么只要这三者均以适当的比例增长,平衡就能保持。例如,如果投资随着消费增长率的变化而变化,那么即便消费仍在增长,只要消费增长率受到抑制,投资就会减少;投资的减少又会使收入减少,进而使就业机会和消费量减少。迄今,经济周期理论仍未超出对可能存在的抽象关系加以阐述的阶段,这些关系说明了如果增长率偏离了平衡率会如何发生灾难。至于确定它们之间究竟是什么实际关系,这些关系的相对稳定性如何,增长率平衡状态的偏离具有什么定量意义,我们尚未达到这一阶段。但是,“加速原理”(人们这样称收入增长率与投资活动之间的关系)显然已有了某些用途,其中之一就是用于研究库存商品的动态。假定一般要求商品的库存量保持在相当于国民收入的40%的水平上。现在再假定一开始时失业人数保持在合理水平上,国民收入在两年内增加了

    10%,达到了充分就业,然后每年仅增长2%。在头两年里,

    要求库存量增加10%,表明每年的投资率相当于国民收入的

    2%(实际增长可能多于或少于这个数字)。第三年要求增加

    的库存量仅相当于国民收入的0.8%;因此库存所需要的投

    资额减少了1.2%的国民收入相当于投资总额减少了比如

    6%,而这本身可能导致螺旋形下降。实际上,波动会由于失

    误而进一步加剧。许多商人由于头两年的销售额增加了

    10%,于是就希望第三年还会以同样的比率增加。由于达到

    了充分就业,销售额实际上仅增加了2%,这时他们才发现自

    己的订货过多,库存超过了预期的数量。此时,为了减少绝

    对库存量,商界可能会大幅度地减少订货,而不是使积压的

    库存量从占国民收入的2%下降到占0.8%,这样做当然会

    引起失业。库存积压量的波动是经济周期的一个显著特点。几

    乎每一次经济繁荣都与存货,特别是与不顾一切地进行原料

    的投机买卖有关,原料价格先是狂涨,随后又暴跌。实际上,

    根本不能指望投资,不论是对建筑业,机械业还是对库存的

    投资,会以某种平稳持续的比率进行,恰好与收入或消费的

    平稳增长相对应。正相反,投资是以一种碰运气的方式进行

    的,在正好适合稳定增长的比率上下波动。

    产生波动的第四个原因是经济增长对收入分配所产生的影响,人们不时对这个原因进行辩论。比如,卡尔·马克思

    所描述的经济周期大致是这样的:经济繁荣时,资本积累起

    来,对劳动力的需求扩大,最终争夺劳动力的竞争使工资的

    增长快于物价的上涨,因此使利润减少。随着利润的下降,投

    资受到抑制,于是就开始衰退。这时工资减少的速度比物价

    上涨的速度快,直到新投资又有利可图时为止。根据这种理

    论,工资与物价的关系会保持“适当”的水平,正好能维持

    稳定,但由于工资总是偏离适当水平,或过多或过少,所以

    无法保持稳定。非马克思主义的社会主义者提出了一个类似

    的但截然相反的模型(一些马克思主义者误认为这是马克思

    本人的教导)。在这个模型中,经济繁荣时期工资并不比利润

    增加得快,而是恰恰相反,物价的上涨快于工资的增加,这

    有利于获取利润,但利润大都被储蓄起来,而不是用于消费,

    因此消费不如收入增长得快,也不如资本积累得快。这些人

    认为这是一种不稳定状态,经过一段时间,资本和生产能力

    这种不成比例的增长会由于消费未同步增长而变得更难办。

    利润率下降了,投资减少了,收入和就业人数下降了。由于

    这种模型同样以维持各种规模之间界限十分接近的比率为基

    础,它与我们在前一段中所讨论的内容有关。由于与马克思

    主义理论的冲突提出了一个事实问题,情况自然是,与工资

    相比,经济繁荣时利润增加,衰退时利润减少,然而投资对

    消费的依赖关系究竟有多密切这一点则颇有争议,这是因为

    考虑到在工业国对农业和制造业的直接投资大约仅占投资总

    额的约30%,即便在制造业中,许多投资也不是针对当前的

    需求的,而是通过革新产生新的需求(新的商品或可降低成本的新方法);同时考虑到在比较资本主义化和不那么资本主义化的方法之间做出某种选择是可能的。(其余70%的投资总额也间接地取决于消费,但是取决于预期的未来消费水平的程底,比取决于任何一个特定时间消费情况的程度要大得多。)

    鉴于这里提到的波动的所有主要原因皆源于经济增长本

    身,因此任何有关经济增长的专论都不可不论述波动,这一

    点现在已是显而易见的了。陈旧的商品或过时的工艺被新商

    品和新工艺所取代,这种替代形成了创新的逻辑模式。于是,

    正如在经济活动突然大量增加时所表现的那样,出现了这样

    一种倾向,先是超越目标,然后暂时停滞。一旦静止状态被

    打破,这是不可避免的,于是人们又开始提高需求水平,否

    则难以在资本与消费,库存与需求,工资与利润之间保持适

    当比例。这并不是说如果经济不增长就不会有波动,但是在

    黑暗中摸索(这是增长的必经之路)使投资更没有把握,更

    有可能出现失误。这也是为什么许多经济学家都认为波动是

    经济增长的代价,没有衰退也就没有繁荣,而假如没有繁荣,

    资本形成一般说来也不会像现在那样快。

    本书没有必要对已经提出的关于稳定美国经济的各种建

    议加以论述。关于这个题目已有相当多的文献作了论述。我

    们只需提及关于不论美国和其他大国的经济如何波动也要保

    持世界贸易额稳定的建议就足够了,联合国组织经常就这些

    建议进行辩论。我们仅就欠发达国家面对世界贸易的波动采

    取什么行动才能自救发表一点意见,然后就不再涉及这个题

    目了。

    经济周期对欠发达国家的影响通常大于对工业国的影

    响,这是因为前者对粮食和原料价格的依赖程度更大,而在

    经济周期中粮食与原料的价格比制成品的价格波动得更厉

    害。经济繁荣时物价暴涨,使欠发达国家的工资也随之猛增

    (如果有强大的工会组织,更是如此)。这种增长并不仅限于

    出口业工人。由于国内支出增加,包括食品,房租,服务等

    在内的国内物价统统上涨,由此造成的生活费用的提高使工

    资薪水和利润螺旋上升。政府岁入增加,但用于支付公务人

    员的薪水以及用于提供额外服务的开支也随之增加,随后出

    现暴跌,出口商品的价格可能因此在一年之内下跌30—

    50%,然后出现竞相降低国内物价,工资,房租和薪水等的

    局面。这种局面很困难,往往引起严重分歧和内乱。如果农

    业部门是以种植国雇佣劳动,而不是以小农生产为基础的,那

    么这种分歧的内乱就尤其严重;如果雇主与雇工的种族和宗

    教信仰不同,则分歧和内乱更加尖锐。如果这些国家能够在

    某种程度上使自己与国际上的价格狂涨暴跌相脱钩,那将大

    大增加实现国内和睦的希望。此外由于利润的波动不那么剧

    烈,这些国家的产出也许不会发生那么剧烈的波动(在衰退

    时期因为难以降低工资产出急剧减少)。如果这些国家省下部

    分外汇收入以便在萧条时期价格低廉时使用,而不是在经济

    繁荣时大肆挥霍,它们的外汇收入将获得较高的价值。

    这些国家中没有哪一个国家能使本国的国际收支免受世界贸易波动的影响。如果出现世界范围的衰退,一个国家出口产品的价值必然下跌。此时该国所能期望的至多是不要让这种下跌影响到国内经济。假如要想做到这一点,这个国家显然必须在国内生产者的收入与出口所得收入之间建立某种壁垒。这样做的一个方法是通过政府的一家代理机构出口商品,正像英属西非,乌干达,缅甸或泰国在主要出口产品上的作法那样。这个代理机构确定一个价格,按照这一价格付

    钱给国内生产者,这种价格不随出口产品的价格波动。如果

    波动的话,波动的幅度小得多。如果目的仅在于稳定国内物

    价,一般多选择未来预期价格的平均值来定价。那么,如果

    价格定的适当,该代理机构在经济繁荣时会赚很多钱,这些

    利润作为储备金保存起来;在衰退时期会有很大亏空。实际

    上,谁也不知道未来的价格是多少,因此,如果为使利润和

    亏空相抵而确定的价格确实起到了这一作用,那将是最不可

    能发生的巧合竟然发生了。在所有成功的例子中,稳定物价

    是与税收结合在一起的,这样,失误的主要后果只是政府的

    税收增加或减少,而不是代理机构将资金耗尽。还应指出,在

    经济繁荣时抑制国内购买力的同时必须储备相应数量的外

    汇。因为在衰退时期维持国内收入水平就得在出口减少时保

    持进口,除非代理机构保持的储备得到外汇的支持,否则,要

    做到这一点是不可能的。

    这种通过政府的代理机构出口产品的做法,会使政府承担风险和责任,而这种风险和责任是许多人都希望避免的。政府只需与出口产品价格成反比改变征税,就可收到差不多同样起稳定作用的效果,而不会使销售渠道受到影响。这样做最直接的方法就是直接对出口征税,但也可通过调节进口税,或调节其他任何税收来实现,尽管这种方法不那么有效。直接的方法只是当价格上涨时,征收的出口税也急剧增加。比如说每吨价格100镑时出口税为0,当价格为每吨100一150镑时,价格每增加1镑,每吨的出口税就增加10先令,价格超过每吨150镑,则价格每增加1镑,出口税就增加15先令。如果还想获得更加精确的稳定效果,价格超过每吨100镑时所征收的出口税可参照价格跌至低于每吨100镑时的相应补贴定出。

    实际上,绝对的稳定既达不到,也不可取。要想准确地

    预测出未来价格的发展趋势是不可能的,而且应当允许世界

    价格的变化对那些在国际贸易中起重要作用的商品的产量产

    生某种影响,这是可取的。此外,还有管理方面的问题也使

    那些组织欠佳的政府难以实行这类稳定计划而又不遇到麻

    烦。但在一定程度上与世界范围的波动脱钩却是大多数国家

    所能够做到的,更多的国家并没有试图减少国内的波动,阻

    止他们这样做的原因与其说是现有手段存在技术上的困难,

    不如说这些国家出于政治上的原因,不愿在经济繁荣时对本

    国的发展加以抑制。只有当经济繁荣时消费受到相应节制,衰

    退时才能维持不下跌,因为只有在经济繁荣时储备了外汇才

    能在经济衰退时用来维持进口。而目前这些国家中的大多数

    国家在经济繁荣时开销无度。有关在此时应征重税的建议遭

    到强烈抵制。即使真能征以重税,各国政府也很可能将其用

    于扩大自身开支,而不会将其留作储备金,并用外汇来支持

    这些储备。而这样做是很合算的,因为任何一笔外汇在经济

    衰退时所能购买的进口商品都要比在上一次经济繁荣时所能

    买的要多(这是因为价格下跌)。认为欠发达国家如果愿意的

    话,能够使国内经济完全不受外部波动的影响的意见是错误的,但是如果这些国家有决心的话,在避免经济繁荣和经济衰退时期最极端情况的发生方面,它们是大有可为的,这一点却无疑是对的。

    以上这些意见只适用于使欠发达国家的经济不受出口商品价格变化的影响,而不适用于出口商品数量的变化,一些国家在经济衰退时期也不减少其出口额,而是能卖到什么价钱就卖什么价钱,剩余存货都集聚到那些消费国家去了。在另一些国家,产量的下降仅仅是因为价格下跌,因此如果国内物价稳定,出口额在经济衰退时也可保持不下降,但是,并非所有国家的情况都是如此。在一些其他国家,只有政府保证买下可出口的商品并将其储存起来直到出口市场复苏时为止,才能在经济衰退时维持住这些出口货物的产量。如果做不到这一点,产量将减少;如果这种商品是通过雇佣劳动生产的,失业人数就会增加。一些欠发达国家的政府确实很大胆,在出口需求降低时储存这些商品。如果市场很快复苏,存货可在经济繁荣时销售一空,这样做则可望获得大笔利润,但如果市场迟迟不复苏,政府被迫在价格依然很低时处理掉存货,这样做同样则有可能遭受重大损失。在价格长期趋于下降的几十年间,事实证明奉行这种政策是很危险的,而在价格趋于上升的几十年间,奉行这种政策则是有利可图的。但是当经济衰退开始时,有谁能说得清这到底是暂时现象,还是价格长期下跌的开始?

    欠发达国家使本国经济获得相对稳定的最大希望在于比较先进的国家正试图控制本国经济的波动,和使国际贸易更为稳定。在这些领域,政策仍然未定,带有试验性质,但是当前似乎有充分理由相信,在不远的将来,经济增长将不会像在刚刚过去的那些日子里那样无规律可循。

    (四) 长期性停滞

    在许多国家的历史上,都有过先是数十年或数百年蓬勃

    发展,继之以数十或数百年相对停滞的情况。实际上,在有

    些情况下,这种衰落竟是如此彻底,致使整个国家从此人迹

    皆无。富饶的平原与城市变为沙漠与一片废墟。有时,人们

    可以用自然现象来解释这些变迁,如发生地震,火山爆发或

    发生洪水;有时是由于政治原因,发生革命,爆发战争或仅

    仅是由于治理不善。这类原因我们将在下两章里谈到。另一

    些原因是基于以下这种主张的,即在某一个国家的经济经历

    了一个或几个世纪的飞速增长之后,投资必然要下降、对此

    我们将在本章的最后几段里加以简要的阐述。

    除了自然现象和政治外,支持长期停滞不可避免性的论点是以下列因素为基础的:技术,心理、垄断、收入的分配、人口和国际竞争。

    从技术出发的论点假定技术知识的增长率下降。在过去

    的几个世纪中技术改进的速度变化很大,这一点毋庸置疑,尽

    管人们承认要确切衡量这一概念是不可能的。用每年登记的

    专利作为对近几十年的衡量标准已受到怀疑。一些工业国每

    年人均专利登记数确有增长速度放慢的趋势,但并不能由此

    就推断技术知识的增长也更加缓慢。这也许是因为办理专利

    诉讼所需费用不断增加,从而减少了专利制度的利用,或者

    是由于发明者的文化程度提高,减少了那种有个不值一提的小玩意也去办理专利的情况,或者是由于规格的进一步标准化以及由于成批生产的产品占据主导地位已经没有什么必要

    再去搞一些仅仅是变变花样的发明,或者是由于在技术上物

    理、化学比奇巧的机械装置更加重要,研究小组比单个的发

    明家更加重要,因此尽管发明仍以和从前一样的规模继续进

    行,但专利的数量却减少了。除了专利的数量之外,认为今

    天技术知识增长的速度低于70年前无疑是没有根据的。即便

    在知识的增长速度明显降低的那些历史时期,由于这种现象

    不能只从科学技术本身去寻求解释,因此也不能被看作是造

    成长期停滞的一个单独原因。科学发明的用武之地并没有缩

    小,有待于发现的领域实际上是无穷无尽的。同样,没有理

    由认为人类头脑的学习能力从生物学意义上说一代不如一代

    (但见第六章第1节(一))。因此,如果知识增长的速度不如

    过去快,我们必须找出人类不那样重视增长知识的原因。答

    案也许在于政局不安定,因此减少了资本家对生产性投资的

    兴趣;或者在于阶级结构发生变化;或者在于自然灾害;或

    者在于因政治因素和垄断而使相互之间更加保守秘密,或者

    由于前一自然段中所列举的诸因素中这个或那个因素。因此,

    我们必须把技术的停滞主要视为更普遍的社会弊病的一种症

    状,而不是其原因。

    从心理学出发的论点认为人们态度发生变化是对增长过

    程本身的一种自然反应。有一个学派认为在人类社会中,重

    视物质的时期与重视精神的时期交替存在,周而复始。因此

    当人们在长达几十年的时间里狂热地致力于物质条件的改善

    之后,他们会对经济增长及其条件感到厌烦,会重新采取较为冷静的思考态度。这一学派的一些成员认为,社会上占支配地位的小群体在一个时期是这种生物类型,在另一时期则

    被另一个不同的生物类型所取代。如果仅从这个意义上说,实

    际上会发生生物变化。但是人们也可以设想,从事发明创造

    的动力消失,使社会进入一个漫长的最杰出的人才不致力于

    科学或发明,或者从另一方面说,其努力一无所获的时期还

    有其它原因。但由于我们不具备对这些心理现象加以评价的

    手段,所有这些都纯属推测。这些我们已在第三章第5节

    (二)中讨论过了,在此不再就此多说什么了。

    从垄断出发的论点是以下列两种说法为基础的,即垄断

    使投资减少,和垄断的程度随着经济的增长而提高。我们已

    经在第三章里讨论过第一种说法,并看到了认为它正确的理

    由。第二种说法则较有争议,用来支持这一说法的论点有两

    个:首先,有人说技术进步使一般公司的规模长期扩大。一

    般公司在相继的每个世纪内不断扩大是有其技术上的原因

    的,就这个意义来说,这个论点无疑是正确的,但不够充分。

    为了证明垄断不断扩大,人们必须说公司规模比市场规模扩

    大得快,而这一点并不明确。由于运输的实际成本长期趋于

    下降,而人口趋于增加,所以长期来潜在市场的规模趋于扩

    大。市场的规模从乡村扩大到世界。这种趋势虽受到关税和

    货币方面的限制的影响,但我们在这里不能说存在着什么长

    期的趋势,这些限制时而扩大,时而缩小,如果我们回顾过

    去若干世纪的经济史,我们所能说的差不多只有这些了。

    其次是有人认为,金融资本家势必占主导地位。根据这

    一论点,“在开始阶段”,典型的资本家是一心致力于自己的工厂,致力于生产和销售自己工厂产品的实业家,而在“最后”,在资本家中占主导地位的是金融家,这些人也许从未进

    过工厂,但他们致力于创立控股公司,企业兼并、联合公司,

    子公司和其他金融帝国。因此,即使在技术发展不足以实行

    垄断的地方,金融家们略施计谋照样会产生垄断。可以认为

    这些金融资本家的崛起是必然的,因为是他们,也只有他们,

    爱钱如命,唯利是图。农民爱土地,因此也就容易在自己的

    土地上过多地投资而使自己破产。同样,实业家也非常爱听

    自己机器的轰鸣;喜欢自己的雇员,产品,或者一砖一石,并

    在某种程度上让情感影响自己在金融方面的聪明才智。只有

    那些经营货币的职业金融家才爱钱如命,并且因此才免于落

    入其他人难以逃避的陷阱。因此,这种论点认为,对工业的

    控制权将不可避免地转到金融家手中,此外,随着市场扩大

    到全球,金融家之间的垄断安排也将成为世界范围的。实际

    上,这种论点是一些人在专门研究了德国工厂工业的兴起之

    后提出的,在德国,银行在实行工业主义方面所起的作用比

    其他国家大得多。这种论点是自相矛盾的。人们可以说,“开

    始时”工业筹措资金依赖于资本市场。实业家很容易落入金

    融家手中,但是在资本主义的“后期阶段”工业以未分配利

    润的形式产生大量储蓄,资本市场比较起来不是那么重要了,

    实业家也不那么依赖外界的支持了。随着工业的发展,情况

    非但不是工业落入金融投机家之手,相反,情况似乎是工业

    企业的管理者变得越来越不受外部金融家的控制了。

    撇开这些推测不谈,我们无法回避一部分工业企业多年来确实被垄断这一事实。这对于所有工业企业来说也许确实是一种自然趋势,只不过有的工业企业比其它工业企业受这种趋势的影响更大。一个明显的因素是我们已经提到过的逻辑增长原则;每一种新兴的工业都要经历一个高速发展的时期,在取代其前身之后,又会进入增长缓慢的时期。当它进入增长缓慢阶段时,与市场相比,大公司要扩大比较容易;如果大公司不把小公司完全排挤出市场,他们至少得奉行一种自己活也让别人活的政策,因为他们明白市场增长较为缓慢时,任何争夺市场的斗争都必然要付出很高的代价。这是工业可能从发明家手中转到官僚手中的阶段,是管理人员接管的阶段,是重要的技术革新结束的阶段。但是,符合每一个工业部门实际的情况不一定符合整个经济的实际。因为新兴工业不断地相互提出挑战。如果一个工业部门多年后被垄断,失去了对革新的兴趣,这也许正是它会被某个生产出竞争产品的新兴工业取而代之的原因所在。只要新产品不断涌现,那么即使各个工业部门变得更加垄断化,在新人的管理下的整个经济也不会那样。

    但是也可能发生这种情况,经济变得更加垄断化首先并

    不是由于企业家的行为所致,而是由于社会对这种行为所作

    出的反应所致。竞争制造出了自己的敌人,因此辩证地看也

    可能将自己扼杀。竞争使弱者、效率低下者、因循守旧者和

    倒霉者受到损害,由于这些人的人数远比与他们命运相反的

    人多,因此要组织许多人对竞争观念抱敌对态度是比较容易

    的,对经济增长的作用心怀不满的首推农民、小商贩、手工

    业工人和小实业家。熟练工人也因其技术不断受到技术革新

    的威胁而充满敌意。因此,经济增长刺激了各类同业公会和工会的建立,其目的在于用施加垄断压力的方法来抵制各种变革。它们还得到了政治家的帮助,这些政治家毫不犹豫地

    通过立法,保护在他们看来是大多数人的利益免受被他们视

    为仅是富于进取精神的少数人的利益的侵害。当今的哲学家

    们也使他们的哲学适应似乎是时代的需要;牧师们呼吁回到

    中世纪的“平衡的”社会;经济学家发现并抨击竞争论点的

    缺陷;律师们则寻找法律上的漏洞,使垄断协议得以通过。在

    这场论争中,竞争的观点并非注定要失败,因为人们已经尝

    到了经济增长的成果的滋味,这个事实本身就使人们意识到:

    普遍利益与局部利益并非一回事。尽管如此,增长给自身带

    来了如此巨大的阻力,以致在有些情况下它们同样有可能产

    生放慢革新和重新投资速度的作用。下面让我们再来研究一

    下以随着经济的增长收入分配方面的变化为基础的那些论

    点。我们先研究一下理论,然后再研究一下事实。如果在充

    分就业时,分配的变化使得消费欲望与国民收入相比有所增

    长,那么我们可预料结果将是用于投资的资源的比例相对下

    降,从而导致国民收入相对停滞。但是,认为消费倾向的加

    强会刺激投资,储蓄的不足可通过发放信贷加以弥补的观点

    是可以争论的。因此,面对持续的通货膨胀(其间无疑有时

    会发生衰退,这种衰退有助于维持人们对于货币价值的信

    心),必须维持投资的水平。相反,人们也一直在争论说,如

    果经济增长的结果就是相对于消费的储蓄额增加,那么,随

    着收入的增加,一个国家将会发现越来越难以处理其储蓄,并

    且极易受到长期萧条的影响。在本章前面几节(第二节(一)和第三节(三))中我们已经谈到了这些论点,并且看到由于这些论点是以假定消费与投资之间有较为固定的关系为基础的,因此不能按表面价值接受。但是,指出下面这一点是合适的,那就是正像维多利亚时代大多数经济学家把储蓄不足视为对他们那个时代经济增长的主要威胁一样,也许大多数当代经济学家也认为储蓄过剩更有可能阻碍美国经济的增长。

    如果再让我们看看事实,那么我们要问的一个有关问题

    是:既然高额利润与高额储蓄是互相联系的,那么随着国民

    收入的增长,利润会发生什么情况?在本章的前面一节中,我

    们已经看到,在经济增长的各个阶段,当劳动力可从其他经

    济部门以不变的实际工资吸收到经济的资本主义部门来时,

    相对于国民收入的利润就增长。一旦资本积累赶上以前从农

    业、家庭服务业、小商小贩,由女性组成小家庭、临时性行

    业或增长的人口中获得“剩余”劳力时,工资就随资本积累

    的增长而增长,没有任何证据说明在这个方向或那个方向不

    可避免地会发生长期变化。在早期阶段,利润的增长并不抑

    制投资,而是恰恰相反鼓励投资。既然可得到劳动力,资本

    积累也并不改变资本与就业劳动力之间的比例,因此利润率

    也不会出现下降的趋势。在随后的阶段,当劳动力紧缺时,如

    果革新没有不断提供投资的新机会,利润率将下降。更多的

    经济学家(亚当·斯密,李嘉图,马克思和凯恩斯等)曾预

    料在这一阶段,利润率将下降而不是上升。与当今流行的观

    点截然不同的是,这些人中的大多数认为这将抑制而不是刺

    激投资。在经济发展史的早期阶段,利润也许会因此而下降,

    但在过去的100年间似乎并没有出现利润率长期下降的情况。这里同样要对政府的行为加以考虑,如果政府有什么长期趋势的话,那就是对利润征税,并刺激消费,但是在“成

    熟”的经济里这会抑制投资还是刺激投资有待于进一步讨论。

    事态的发展也未能实现卡尔·马克思的另一预见,即无

    产阶级的日益贫困。在马克思的理论体系中,尽管知识的增

    长和资本的增加,使生产率得到了提高,但实际工资仍然保

    持在仅能餬口的水平上,(周期性的波动除外)。技术进步的

    所有好处都为资本家所享有。资本家的利润与工资相比相应

    增长。我们已经看到,这种分析适用于资本主义的早期阶段,

    但并不适用于资本积累赶上了劳动力供应的资本主义后期阶

    段。马克思同时还预料工业日益垄断化将通过使小资本家破

    产并取而代之而使资本家的队伍缩小,无产阶级的队伍扩大。

    这将增加失业后备军,使工资水平受到威胁并扩大各阶级之

    间的差别。就阶级差别而言,实际情况恰恰与此相反,经济

    的增长产生了一个庞大而多样化的中产阶级。事实上,中产

    阶级在很大程度上消除了社会差别,以至在先进的工业社会

    几乎人人都自认为属于中产阶级的这一部分或那一部分。此

    外,按照马克思的理论,机械的扩大应用将代替劳动力,并

    造成不断增加的技术失业。所有这些因素加到一起,加剧了

    工人阶级的苦难,工人阶级不断受到只能餬口的工资和失业

    人数不断增加的双重压力的刺激,而且由于阶级差别的意识

    日益强烈而团结一致,总有一天他们会揭竿而起进行成功的

    革命。由一场革命结束一种社会制度,这种可能性始终存在,

    而不论这种革命究竟原因何在。在资本主义制度的后期阶段

    工人的生活更舒适了,而不是像马克思所预言的那样更加悲惨;然而马克思认为这种苦难是革命的原因也同样可能是错误的。在所有的资本主义国家的经济中,与100年前相比,工

    人阶级现在都享有更大的经济与政治权力。谁也不知道他们

    会如何行使这种权力:他们也许会接受资本主义制度,仅对

    其加以改良(如实现更大程度的社会稳定,或向弱者与不幸

    者提供社会保险);他们也可能由于限制主义,过度征税或有

    损信心的敌对言行而摧毁这一制度。谁也无法预见,有哪种

    经济制度不会因为内部意见分歧而发生停滞,导致这种结果

    的可能性始终存在,并且是经常产生的。另一方面,收入分

    配与内乱之间并无明确的联系。因此,即便我们能够预见与

    工资相比利润将发生什么情况(而这一点我们无法做到),我

    们还是不能就此推断这将使社会更加协调或更加意见不一。

    我们现在来看看另一些论点,这些论点是以对人口随着

    经济的发展将发生什么变化这一点所做的预见为其基础的,

    在这方面也存在着相互对立的不同学派。根据一派的观点,经

    济增长必然引起人口增长,而人口增长又反过来使自然资源

    枯竭,森林被砍伐,土壤遭侵蚀,矿物被采挖一空,实际上

    产出可能减少,人们可能死于饥荒,否则就必须以不利的贸

    易条件增加食品的进口来应付人口的压力。那时人口与资本

    流向条件比较好的地区,国家陷入停滞状态。历史上有过许

    多这样的例子,例如19世纪后半叶人口与资本从英伦三岛的

    外流。但是,并不能认为人口必定增长到自然资源的极限,正

    如我们在下一章中将要看到的那样,死亡率的长期下降不久

    就使导致出生率下降的社会力量发挥作用。因此,在国家出

    现任何意义上的人口过剩之前,低出生率和低死亡率之间实现平衡并非不可能。

    正是这种可能性使与之对立的学派感到不安。根据这一

    派的论点,经济的增长必然随即引起人口增长速度放慢,甚

    至出现绝对下降,从而引起难以应付的后果。不论是由于经

    济变得更加缺乏弹性,还是由于人们不像以前那样勇于承担

    风险,经济变得不那么富于竞争性,还是由于投资机会减少,

    他们担心这些后果将导致经济的长期停滞。

    经济变得更加缺乏弹性是由于每年新进入劳动市场的劳

    动力减少。在任何一种经济制度中,供求关系总在不断变化,

    因此行业和职业之间必须进行劳动力的再分配。如果这种再

    分配意味着让一部分人改变他们已经从事的工作,而不仅仅

    是把新就业的人吸收到那些最需要他们的职业中去,那么进

    行这种再分配就较为困难,因此,预计每年都吸收大批新劳

    动力的行业比每年吸收劳动力比较少的行业的经济更富有弹

    性。这一因素的重要性可能被夸大了,但是在任何情况下,在

    任何一个提供相当充分的就业机会的经济中,都有大批的劳

    动力流动。那些据说缺乏劳动力的行业之所以缺人,往往是

    由于留不住雇来的劳力,而不是由于无法招到足够的新工人。

    当然,任何经济都会发现,不同职业之间突然进行大规模的

    劳动力转移都是困难的,例如由战争,或战后余殃所致的那

    种转移,但是仅就平时所要的一般边际转移而言,每年招收

    或不招收大量的劳动力是否会对局势产生很大差别,这一点

    颇值得怀疑。

    还需要再加以说明的是,在一个稳定的经济里,投资风

    险增大的问题。在一个人口年增长率为2%,实际收入增长率亦为2%或更高的国家里,是不会在投资上犯大错误的。如果

    企业家对任何一种行业的投资多投了10%,这种行业会暂时

    陷入萧条,但是在5年或更短的时间内,需求就会赶上供给,

    并有某些缺货利润可赚。资本的自然贬值使供应减少,收入

    与人口的增加则使需求增加,这两者使投资方面的失误得以

    纠正。如果人口不增长,失误只能靠资本的贬值和人均收入

    的增加来纠正,那么这将是个长期、痛苦的过程,因此,一

    切投资的风险也就更大。这把我们直接引到了第三个论点。如

    果不鼓励承担风险,那么经济就会变得不是那么具有竞争性。

    企业家们会比在需求一直在迅速增加的经济中更急于就分享

    市场作出安排。承担风险的减少与垄断的扩大这两种因素都

    阻碍了投资,因此也促成了长期的停滞。然而人们也可轻而

    易举地反过来论证说,当市场不再扩大时,争夺市场的斗争

    将激化。依靠演绎出来的论点无法得出明确的结论,而且也

    没有适当的论据可以做出明确的判断。

    由于人口增长速度放慢减少了投资机会,因此预计投资

    也会下降。为了安置增加的人口需要部分投资:新的住房,新

    的农业区,新的道路,更多的交通设施,更多的工厂等等。因

    此,当人口增长率下降时,投资机会也相应减少。但是,关

    于人均收入增长率是否下降的问题切不可与保持充分就业的

    问题混为一谈。如果困难仅仅在于人们的储蓄超过了使人均

    资本保持不断增长所需要的水平,那么这个困难可通过增加

    消费,不鼓励储蓄等措施加以克服。政府可增加影响储蓄的

    税收种类,减少影响消费的税收种类,或者用剩余的储蓄扩

    大它自己在住房,道路,医疗设施等等方面的开支。只要措施得当,人们可以预期人口增长率的下降会使人均收入增长率提高,因为一些资本不再需要用来安置增加的人口,这些

    钱现在可用来增加人均资本。在另一方面,如果人均资本增

    加,资本的利润率将下降,除非有大量的革新涌现,而这可

    能影响人们投资的意愿(如果人们认为投资取决于高消费,而

    不是取决于高额利润,如果利润率的下降提高了与利润有关

    的其他收入,从而促进了消费的倾向,他们就会更愿意投

    资)。关于长期增长的大多数论点最终回到革新的源源涌现上

    来,回到是否有理由认为源源涌现的革新会枯竭。

    因此,有关人口的论点是不能使人信服的,我们无法满

    怀信心地说,在发展的后期阶段人口的增长将超过资源的增

    长。恰恰相反,危险也许在于发展的后期阶段将导致人口数

    量稳定或下降。对于这种威胁一旦成为现实将会有多大的危

    险,我们同样不得而知。表面上看起来,我们希望人口增长

    率的不断下降可使人均资本增长得更快,但是我们不能全然

    无视使经济变得日益缺乏灵活性和垄断更加扩大的可能性。

    最后让我们看看国际竞争。根据这种论点,“老牌”国家

    在经过一段时间后必然会丧失它在国际贸易中的地位,因此,

    或者由于利润下降,或者由于向新崛起的国家投资更有利可

    图,对老牌国家的投资率下降。“老牌”国家由于国际贸易格

    局的改变可能会丧失其地位。正像发现美洲那样,新的贸易

    路线会使这些国家丧失其在地理位置上的优势。技术进步可

    能破坏对其矿物或其他得天独厚的自然资源的需求,例如对

    智利硝酸盐的需求就发生过这种情况。除了世界贸易格局发

    生的这些变化之外,“老牌”国家在公认的贸易中的领导地位可能输给新崛起的对手,如果这种领导地位仅仅是建立在把革新置于优先地位这种基础之上的话。因为其他国家迟早会

    掌握这些新技术,而当它们一旦这样做了,“老牌”国家就会

    丧失其垄断地位、较高的生产率和超额盈余能力。因此,只

    有当一个国家在引进新思想方面仍然站在前列才能保住其以

    革新为基础的领导地位,但这种领导地位难以保持。考虑到

    与自然资源有关的需求的变化,以及几十年保持技术上的优

    势如何之难,因此没有一个国家在国际贸易中保持领导地位

    的时间超过几十年这一点也就不足为奇了。从投资与国民收

    入的比例下降这个意义上说,失去领导地位不一定导致经济

    停滞,但是如果伴之以不利的贸易条件,或者导致投资被吸

    引到海外的新兴国家,那么将完全可能产生这种结果。英国

    的人均产量增长率自1870年以来似乎一直低于19世纪前

    75年的水平,一些人用上述原因解释这一现象。在第六章中

    我们将就国际竞争做进一步的论述。

    因此,由于长期增长,一个国家可能会落入许多陷阱;它可能对物质的东西感到厌倦,它的企业家可能会表现得缺乏竞争性,它的公众可能会设置种种障碍阻止变革,收入的分配可能变得不利,它可能耗尽其自然资源,可能丧失它在国际贸易中的地位;它或者会智穷才尽,再也拿不出什么革新成果来。除此之外,一个国家还可能遭受自然灾害,或毁于战争,内乱或治理不当,而所有这些因素没有一个是必然要发生的。另一方面,当一个国家有可能落入这样多的陷阱时,一些国家过去曾落入其中的一个或几个陷阱也就毫不奇怪了。谁也无法预见某一国的投资率何时开始下降,不论是几十年还是几个世纪之后。但是我们对过去4000年经济史的知之不多的一点知识似乎完全证实了这样的预测,即长时期的增长到适当时候将被增长缓慢、停滞、甚至下降所取代。

    第六章 人口和资源

    在这一章中,我们首先探讨资源、人口和产出之间的关系,第二步探讨资源、人口和人与商品进出国际边界的流动之间的关系。

    第一节 人口和产出

    (一) 人口的增长
    经济的增长对人口的增长有什么影响?马尔萨斯对这个问题的回答从他在世的时候到现在一直使人们争论不休。他说,第一,日益提高的生活水平将引起人口增长。第二,人口的增长将超过粮食产量增长的速率。所以,第三,人口的增长总是为生活资料的限度所制约。第四,因此他的主张概括起来就是,粮食增产能力的增长,必将使人口增长到这种能力的极限。不管怎样,这些都曾是马尔萨斯原来对这个问题作出的答案。在后来的说法中,他比较强调,只要人类有意节制生育,就有可能打破人口增长和粮食供应之间的联系。更确切地说,这种退步有损于他的理论的光辉,从那以后,追随他的一些人已不大愿意接受他的理论了。另一方面,原来的说法也从来没有为人们完全接受,因为始终有人怀疑这种论点所依据的每一个论据。

    让我们首先探讨一下日益提高的生活水平对人口自然增长的影响。要解决这个问题,必须分别探讨对出生率的影响和对死亡率的影响。

    在世界史的大部分进程中,出生率和死亡率都很高,两

    者几乎相等。确切的统计数字在时间上距今不很远。在当代

    最原始的国家中,死亡率高达4%,在这些国家里,无论是经

    济方面还是医疗方面的进步都尚未发生重大作用。这一数字

    有很大一部分是由于儿童大量死亡造成的;在原始的条件下,

    近半数的儿童活不到十岁就死了,这几乎占死亡率的一半。我

    们从这一数字推算不出历史上死亡率有多高。有些国家比其

    他国家体质强一些(如不大容易患疟疾),而且饥荒、战争和

    传染病的发生也一定使每年的死亡率很不一样。尽管如此,在

    漫长的历史上,死亡率必定平均在3—4%左右。因为人口增

    长得非常之慢,出生率也必定是在差不多同样的水平上。据

    认为,公元1年到1500年,世界人口递增率每年不超过1%,

    所以出生率只比死亡率高一点点,因为要考虑到突发性灾害

    会造成死亡率大起大落。

    国与国之间的出生率也不一样。在西欧国家,从有记载

    的时候起,出生率很少超过35D的,而在亚洲或拉丁美洲,出

    生率超过40D则十分普遍。一种可能的解释是结婚比较早。

    在以只有两三个孩子为时尚的社会里,晚婚对出生率可能没

    有多大影响,但是在不实行节育的社会里,晚婚必定有重要

    意义,因为生育能力是随着年龄的增长而下降的。另一种解

    释是单身妇女的百分比各有不同,产生这种情况的部分原因是成年人口的两性比率各有不同,另一部分原因是婚姻风俗不同。印度和爱尔兰是当前的两个极端;在印度,年到45岁

    尚未结婚的妇女只占1%,而爱尔兰的相应数字是26%。在

    西欧大部分国家,15—20岁的妇女从来没有结过婚,其部分

    原因是因为成年妇女的人数超过成年男人的人数;虽然这个

    数字并非总是这样高,但是看来总比亚洲和非洲的相应数字

    高出许多。如两国已婚妇女的生育率相同,要是一国的所有

    妇女都结了婚,出生率是40D,而另一国有20%的妇女没有

    结婚,后者的出生率将比较接近32D。人们必须考虑到单身

    妇女非法生孩子,还要考虑到未婚妇女如果结婚的话,其生

    育率比那些实际上结了婚的妇女的生育率低这种可能性;尽

    管如此,单身妇女多,再加上晚婚,就足以说明欧洲的出生

    率为什么不超过35D的原因。

    没有表明出生率随着经济增长而日益提高的证据;倒是

    有表明出生率下降的证据。在马尔萨斯的时代,有些作者倾

    向于认为出生率随着经济发展而提高的看法,没有实行节育

    的社会的情况大概是结婚年龄随着经济条件的改善而下降。

    结婚率确实随着经济周期而有起有伏的,但是在比较长的时

    期内,没有表明结婚年龄在经济发展的初期阶段下降的证据。

    这种论点对18世纪英格兰和爱尔兰的情况是适用的,但是拿

    不出证据来支持这种论点,而且正像我们马上就要看到的那

    样,爱尔兰人口的变动情况很容易解释,无需援用出生率的

    变化。按目前我们的认识,最合理的结论看来是,在发展的

    最初阶段,一切影响都集中在死亡率方面。

    死亡率看来在三个阶段有所下降,或者换句话说由于三组因素而有所下降。第一,死亡率下降是因为粮食供应得到改善,这或者是由于产量增加了,要不就是由于分配改善了。

    以爱尔兰为例,那里的人口从1700年到1840年增加了三倍,

    主要因素是由于种植马铃薯而使粮食产量增加,每英亩马铃

    薯提供的粮食要比以往从谷物中获取的粮食多得多。在另一

    些国家,主要因素则是分配得到改善,这是由于战争停止了,

    粮食贸易开展起来了,建设了比较好的交通网。如果不进行

    贸易,交通不便,每个地区所需要的粮食要靠本地区自己供

    应,如果当地作物歉收,那就可能意味着饥荒和死亡,哪怕

    本国其他地区的粮食充足也无济于事。所以,在那些全国每

    个地区的雨量年年变化很大的国家,要是交通不发达,就可

    能发生严重饥荒,单是建设了交通网,即使这些国家的粮食

    产量没有什么变化,也可能使死亡率大大下降。

    经过了这一阶段的国家可能使它的死亡率降低10点多。这就意味着,如果一个国家的出生率不变,它的人口将开始每年上升1%,70年内将增加一倍,140年内将增加三倍。爱尔兰的情况似乎就是这样。爱尔兰的情况是由于结婚年龄非常之低还是由于生育率非常之高,就没有必要去说明了。那里的情况完全符合35D左右的出生率,同由于普遍食用马铃薯而使死亡率下降到25D有关。同样,印度和非洲人口的增长完全是由于贸易、交通和消除当地的饥荒所致。印度和非洲某些国家的人口在过去50年里以1%的年率增长,这同40D的出生率和30D的死亡率是一致的。这些国家的死亡率仍然很高,因为它们进入医疗改善的阶段还不久。

    医疗阶段有两个,这两个阶段在欧洲是相继出现的,但是这两个阶段在世界上的其他地方往往是同时出现的。其中一个阶段是采取公共卫生措施,消除传染病。另一个阶段是把医疗方便广泛普及到家家户户。推广有疗效的药品所需的时间比普及公共卫生工作所花的时间要长,因为它所需的资源要多得多;要建设医院,要训练和向全国派出开业医生。欠发达国家进入这一使它们的死亡率下降的最后阶段的还很少很少。但是很多国家已进入第二或者说公共卫生阶段,在这阶段中,严重的传染病——瘟疫、天花、斑疹伤寒、霍乱、伤寒、疟疾、黄热病(以及最后还有结核病)——已被消灭。在这第二阶段中,死亡率再下降10点。如果出生率还是40D,人口每年将增加2%,每35年增加一倍。斯里兰卡、埃及、毛里求斯、西印度群岛以及非洲和拉丁美洲的许多国家已经经过了这个阶段。印度才刚刚进入这一阶段,这就是它的人口为什么现在每年仅增加大约1.25%的原因;在一个很短的时间内,由于公共卫生设施的扩大,预料印度将消灭霍乱和疟疾以及现在那里流行的其它传染病,如果印度的出生率不下降,那么它的人口每年将增加2%左右。

    到第三个阶段,死亡率将下降到10D左右,是多还是少,取决于人口的年龄结构。这是由于人人都能得到医疗照顾的结果。如果出生率还是40D,人口每年将增加3%,在25年中将增加一倍。有些社会已达到这一阶段,如波多黎各,另一些社会已接近于这阶段,如斯里兰卡。

    我们从这一分析中可以看出,首先把人口增长直接同粮食供应联系起来未免太武断。粮食供应对人口增长可能起制约作用,但是粮食供应的改善不是死亡率下降的唯一原因。粮食供应的改善仅仅在最低生活水平时起作用,而且在这种水平上,粮食供应的改善不过使人口每年增加1%。如果这就是要解决的全部问题,那么粮食供应在很长一段时间里可能赶上人口的增长。然而事实是,死亡率由于医疗改善而下降的那一部分甚至比由于粮食供应改善而下降的那一部分还要大。

    但是,不管人口是因为粮食供应还是因为医疗改善而增

    长,马尔萨斯断言,这种增加到时候必定由于粮食供应不能

    增长得那样快而告结束。19世纪发生的事件已经证明他的这

    一部分分析是没有根据的。我们掌握的最可靠的估计数字说

    明,在第一次世界大战爆发之前的半个世纪或更长的时间里,

    世界粮食供应量的增长率每年略低于2%,而世界人口每年

    仅增长0.7%左右。据我们所知,欧洲、美洲和澳大利亚的

    工人阶级的饮食有了很大的改善,畜产品的消耗量相应地大

    大增加了。马尔萨斯过高估计了粮食供应的改善会引起人口

    增长的速率(他说是3%,但任何欧洲国家都没有接近过这样

    的速率)。他曾考虑到了不断增长的人口只有用开垦新土地的

    办法才能养活自己这种可能性,但是他没有预见到这在19世

    纪将以多快的速度办到;而且他还低估了每英亩土地产量可

    能的年度增长率。然而,这样说决不是贬低他提请人们注意

    的这一问题的重要性。如果说在19世纪没有哪个国家达到了

    3%的人口增长率,那么在20世纪有好几个国家达到了这样

    的增长率,而且新土地并不是开垦不尽的。

    有人认为,如果死亡率从40D下降到10D,世界将很快陷入一片混乱,除非出生率也下降到同样的程度。对于这种论点,没有必要详加论证。这种论点并不完全取决于关于粮食供应的种种论据。关于粮食供应的论据现在具有重要意义,可是在往后的世纪里可能不成其为问题。世界目前的承担能力有多大,无人知晓。按照对饮食和生育力的不同假设,所做的估算也不同。目前人口大约有25亿,最低的估计是,在使用目前农业技术的条件下,这是能够为之提供一份适当饮食的最大人口数目了;这就是说,如果把现在尚未开垦的一切可耕地都耕种起来,结果是仅仅够把各地的饮食标准提高到欧洲的水平。另外的估计是,假设按目前饮食的平均水平,则有供应多达100亿人的能力。作这种估计的困难有一部分在于对比如说位于北纬30度和南纬30度之间的世界热带地区灌溉不是那么充足的土地的最后承担能力有多大不能肯定。这一地区有数百万平方英里的可耕地,年降雨量为25到

    40英寸,大部分集中在一年的几个月里,旱季很长,在这期

    间,植物枯死,土地龟裂。19世纪发生在欧洲的农业技术革

    命,适用于终年有雨、从来没有受过酷热烘烤的土地。在欧

    洲和北美富有成果的技术,在热带地区并不全能直接应用,而

    且照样搬用反而会造成损害,譬如机械化会使水土流失。由

    于人口增加,人类可能不得不解决的一个大问题是怎样最有

    效地利用现在人烟非常稀少的这几百万平方英里的土地,现

    在我们没有把握,这些土地是否很快就会证明是产量很高的

    呢,还是继续长期对世界的粮食供应作用甚微。

    哪怕对当前世界的能力作最充足的估计,余地也不大,因为按目前的增长率,世界人口在一个世纪多一点的时间内将达到100亿。不过,世界的承担能力也时时在增长。在最先进的农业国家,每英亩的产量长期来一直在增加,每年增长的幅度从0.7%到1.5%不等(最落后的国家具有最大的技术可能性)。对今后30年世界供养自己的能力感到担忧是理

    所当然的,在这30年中,人口和粮食可能是你追我赶地竞赛,

    看来这是十分可能的。但是,人人都在猜测,我们生产粮食

    的技术在30年以后将发生怎样的情况。举例来说,如果我们

    不仅懂得利用植物的果实而且懂得利用植物的叶子,世界提

    供食物的能力将不知增加多少倍。又如,1954年曾报道过光

    合作用已在实验室完成,如果这在经济上是大规模可行的,粮

    食将足以养活任何可以想象的人口。

    因此,关于粮食的论据同对空间的探讨是相辅相成的。我

    们可以学会用氢原子制造食物,生产出几乎是无限量的食物,

    但是我们对空间准备怎么办呢?地球陆地总面积,包括沙漠、

    冰层和山脉,只有5600万平方英里。假设我们分配给每个人

    仅仅一平方码作为容身之地。那么,如果世界人口每年增加

    的幅度小到1%,从现在起也只有在1120年内还有容身之

    地。也许1120年以后,人类将再一次寄生海洋,或者用摩天

    大楼把地面覆盖起来,或者从氢原子中合成更多的土地,或

    者把别的星球变成殖民地。对这个问题不予理会是可以的,其

    理由或者是将来会发生某种新情况,或者是我们无需为后代

    烦恼。但是如果对这两种遁词一个都不接受,甚至连我们当

    中那些最喜欢由我们的同胞作伴的人都会认为,世界人口在

    今后1000年每年以1%的速率增长是不可取的。一旦死亡率

    降下来,那么如果人类要在由我们目前的星球的陆地面积所

    限定的范围内舒舒服服地生活下去,出生率必须下降到同样的程度,这一点是必然的。

    除了这些全球性的考虑之外,那些正经历高出生率和低

    死亡率的个别国家,必须为此付出巨大的经济代价。首先要

    负担抚养儿童的费用。15岁以下的儿童仅占英国人口的20%

    左右,而15岁以下的儿童却占波多黎各人口的40%左右。英

    国的比例确实太小了一点,以致难于保持人口的稳定。另一

    方面,波多黎各的比例却是加在成年人口身上的相当大的负

    担,它因此不得不把本来可以用来提高成人的生活水准的时

    间和资源投到抚养孩子身上。我们将会看到,把这种情况看

    作是一种负担大概是说明为什么在死亡率下降之后出生率往

    往早晚也会跟着下降的最重要的原因之一。出生率和死亡率

    不平衡的另一个代价是人口不断增长对人均产出的影响。有

    少数几个国家仍处在利润不断增加的阶段,在这个阶段,人

    口越多,对制造业来说就意味着公用事业的设备和设施利用

    得越好。这些国家主要是在非洲和拉丁美洲(见本章第一节

    (二))。不过,这些国家为数很少。在世界上的大多数国家,

    人口增加必然使人均产出减少,除非为新手从事劳动提供额

    外的资源而把资金花光。这种资本本来可以用于筹集资金和

    提高现有人口人均产出的。我们没有把握,到底需要多大的

    资本才能防止生活水平下降而不管人口增加多少。如果我们

    按4∶1的资本—产出比率,那么,一国的人口如果增长1%,这个国家为此需要的纯投资占国民收入的4%,人口如果增长2%,纯投资占8%,人口如果增长3%,纯投资占12%。如果我们记住最不发达国家每年只能安排5%的国民收入作为投资,那么可以清楚地看出,要是这些国家放手让它们的人口每年以2%或3%的速度增加,它们的生活水准必定下降。

    幸运的是,现有的证据说明,死亡率下降到一定的时候

    将使出生率也下降。我们对这一点还没有绝对的把握,因为

    我们确实不像我们了解死亡率下降的原因那样了解出生率下

    降的原因。在过去的100年中,有些欧洲国家的出生率已从

    35D左右下降到15D。这种下降有些是由于未婚妇女数量增

    加,有些甚至可能是由于晚婚,但是最大部分是由于不愿意

    生孩子。我们不知道造成这种不愿意生孩子的原因是什么。我

    们推想并且认为,这是在出现经济增长过程以后不可避免地

    随之而来的现象,因此在一切国家经历同样的过程时都会出

    现这种现象,但是我们不能肯定事情一定会以这样的方式发

    生。

    设想出生率下降是由于对生孩子的态度发生了变化,不

    仅仅是由于有了节育新方法,这种看法还是相当有把握的。这

    种看法之所以有把握有两个原因。第一,出生率下降在使用

    新方法之前就开始了。法国的出生率在19世纪一开始就已开

    始下降,其他欧洲国家的出生率从19世纪中叶开始下降,而

    新的节育用品到那个世纪末才有。第二,甚至到今天,很大

    一部分成功地实施节育的人并没有使用现代用品。他们使用

    的方法是圣经上记载的方法,是经过久远的年代为人类所熟

    知的方法。如果说节制生育在两个世纪之前没有实施,其原

    因并不是人们不知道怎样去做,而是他们不愿意这样做。当

    然,一旦改变了态度,有这种经过改良而且比较方便的新方

    法可供使用就能使更多的人们愿意实施节育,但是如果不改变对生育孩子的态度,这些方法肯定不会推广得这么迅速。

    是什么原因使得态度发生这样的变化呢?最重要的原因

    大概就是因为死亡率下降了。在一个出生的孩子有60%活不

    到成人的社会里,如果一个普通家庭希望有三个孩子长大成

    人,它必须生八个小孩,其中平均有五个要在孩提时代死去。

    现在,当生孩子没有限制的时候,每个母亲平均生八个孩子

    差不多就达到了人类生育力的极限,所以照这样的死亡率水

    平,不加限制的生育对一个普通家庭来说有两三个孩子长大

    成人就足够了。不加限制的生育不会使出生率大大超出

    40D。所以,如果死亡率在40D左右,即使让妇女能生多少

    孩子就生多少孩子,人口亦只能勉强保持。这样,生孩子就

    成为了传宗接代的一种宗教义务,生育力最强的妇女享有崇

    高的荣誉,受到高度的尊重,而不生育却为人所不齿。到死

    亡率下降的时候,这种态度自然而然地改变了。因为儿童成

    活的多了,生这样多的孩子就没有必要了。就人口的稳定性

    来说,如果一生能活到68岁,出生率和死亡率只要保持在

    15D左右,人口就能保持稳定,这相当于平均每个家庭只有

    两个多一点的孩子。人口迅速增长的坏处迟早会使国家的领

    导人看清楚,主张生孩子越多越好的宗教戒条被抛弃了。许

    多原始的社会非常之幸运,它们的死亡率在40D以下,它们

    采用种种措施控制人口,包括生孩子之后两年内禁止性交、打

    胎,甚至溺婴。(爱尔兰采用很晚结婚的办法,全国有四分之

    一的妇女根本不婚嫁。)父母也改变了他们的态度;如果有人

    希望有三个孩子长大成人,再也不需要生八个孩子了。早先,

    能把这么多的儿女抚养好似乎是了不起的,但是由于能够生养10个孩子的人数迅速增加,对这种成绩的新奇感和荣誉感消失了,如果粮食供应不上、工作难找或没给他们留下什么

    土地的话,就尤其如此。人们开始感到,养这么多孩子很不

    利,对节育方法逐渐关心起来。如果这样分析不错的话,那

    么可以认为,随着时间的推移,死亡率下降以后,出生率会

    自然而然下降。人口每年增长3%只是暂时的现象——但是

    暂时仅仅是相对而言的,因为大家庭的坏处明显到使社会改

    变态度也许要经过两三代人的时间。

    还有别的因素在起类似的作用。妇女的地位有所改善,这

    是由于妇女受教育和妇女在家庭以外就业机会扩大的结果;

    这使得一些妇女把生孩子看成是她们一生中的一个临时阶

    段,她们很快就能自由地把时间用于做别的事情。然后其他

    事情增加,要人们有时间去做。经济增长意味着有更多的收

    入用在享受方面,这样的享受要花时间。特别是家庭以外的

    娱乐活动增多了,如看电影和到海滨旅游。19世纪有些属于

    低收入集团的妇女,要是没有佣工帮助料理家务,除了上教

    堂以外很难离开家门一步;而现在,她们要求有多得多的行

    动自由。有时有人说,节育的秘诀是给家家户户装上电灯,以

    便让一家子人在晚上有许多事情可干,而不是天一黑就上床

    睡觉,但是不要把这种说法当真了。人们利用时间的方式增

    加,其意义并不是使生孩子的机会减少,而在于使抚育孩子

    更加成为一种负担。另一个变化是,养育孩子的花费更多了;

    再不能在七、八岁时就把他们送出去劳动了,而必须让他们

    上学读书,读到十五岁或更晚些时候。在西方世界,对孩子

    的态度在过去两个多世纪里也起了变化,对儿童时代的关怀备至盛行起来。在17世纪或17世纪以前,对孩子并不那么高度重视,他们能长多大就算多大,不多加照顾。然而,在

    现在,在儿童时代培养个性被看作是最重要的。父母们感到

    为每个孩子尽心尽力是一种本分,照应不过来就不要有那么

    多的孩子则是一种相应的义务。经济增长也促进社会流动。随

    着社会流动,有些父母渴望让他们的孩子受到他们负担得了

    的最良好的教育,使他们的生活有一个尽可能好的开端,以

    便孩子们将来能够爬到社会的上层;这也使抚养孩子的费用

    增加并使生育孩子的数目减少。特别引人注目的是,社会地

    位不断上升的人比那些社会地位没有上升的人养育的孩子要

    少;虽然很难说这是因为那些希望自己的地位上升的人发现

    “轻装快步”容易呢,还是因为那些孩子比较少的人上升更容

    易呢?这一切的原因是人类的行为更有理智了;人们不再把

    孩子们看成是“上帝的恩赐”;他们认为他们有权为他们自身

    的享受来计划自己的生活,不要超过计划的孩子。曾是宗教

    和道德的一个课题的问题,变成为寻求方便和要深谋远虑的

    问题。这些因素中的许多因素都同城市化——妇女受教育的

    人多了,在家庭之外就业的人多了,利用闲暇的机会多了,儿

    童的就业机会受到限制,社会流动性增大了,生活方式更加

    理智——有关,所以农村的出生率往往高于城镇是不足为奇

    的。

    所有这些因素都是经济增长的成果,所以说得出经济增长使出生率下降并使原来为经济增长所破坏的平衡得以恢复,这样的结论看来是合乎道理的。这一分析同使人口政策制订者发生分歧的一个争议有关。一派的意见认为,如果你希望使出生率下降,就要集中宣传新的节育方法。另一派意见则认为,除非首先改变对生孩子的态度,否则这些方法不会得到采用。态度的这种改变是由经济增长引起的。因此,降

    低出生率的办法就是要集中力量发展经济。这显然是一场虚

    伪的争论。人们需要把所有佐料都放入这个馅饼:要使社会

    领袖们转而相信高出生率的种种危险,这样各种清规戒律和

    宗教法令就会反对高出生率,而不是赞成高出生率;要迅速

    提高生活和教育水准,这样妇女们就会发现孩子少一些就是

    方便;要对节育方法作广泛的宣传。需要在各条战线上同时

    采取行动。

    这当中哪一件事要办都不容易。劝说社会领袖们给予正

    确指导也许是最容易的任务了。如果人口每年只以1%的速

    度增长,一千年后将仅有立足之地。这一事实是容易理解的,

    特别会为近一二十年在欠发达国家掌权的人们所理解,他们

    多半具有西方唯理主义的观点。神职人员比政界人士要更困

    难一些,在这些问题上采取强硬态度的唯一教会是罗马天主

    教会,即使这个教会也赞同对家庭有所限制,条件是不得使

    用现代的节育用品。东正教各大教派关于这个问题没有明确

    的教义,在每一个教派中,都有一些宗教领袖表示赞成节制

    生育。任何出生率最高的国家都还没有节育的紧迫感,但是

    这种紧迫感可能到来。不管怎样,节育运动风行全欧洲,宗

    教界和官方都未提供赞助。

    在不开化的社会开展宣传就不像在西欧那样容易了,有

    些社会的妇女是大门不出二门不迈的。此外,西欧使用的用

    品,与较为贫穷的国家的人民收入相比是昂贵的,从居住条件和他们的生活方式来说也不方便。因此最好发明一些价钱比较便宜或使用比较方便的节育形式。这就是从事节育工作

    的人士目前非常关心能不能制造一种没有副作用的避孕丸的

    原因。关于这一课题的研究正在积极进行中。

    提高生活水平是一切任务中最困难的任务。如果人口每

    年增长1.5%,我们能够确定的最低目标就得是使总产量每

    年提高2%。这样只有在140年以后才能使生活水平提高一

    倍,而西欧和美国的生活水平提高一倍仅用了40年到80年

    的时间。但是总产量每年提高2%并非是轻而易举的事情。它

    要求把大量资金用在教育和其他公共事业上,目前的资本形

    成增加一倍,并在信仰和制度方面要有许多变化。人口如果增加2-2.5%,产量就得增加3%,这甚至更难于达到。产量每年增加4%是美国从1870年到1930年达到的极限,这是由于它有唯物主义的眼光和制度,把巨额经费用在了资本和教育方面。没有迹象表明铁幕这一边的欠发达国家开始采取量每年提高2—3%所要求的那种果敢措施。也没有任何迹象表明,比较发达的国家认识到这一问题的严重性,以致愿意为解决这问题作出适当的贡献。如果提高生活水平是使出生率下降的一个必要条件,看来人口问题还要存在一段漫长的时间。

    欠发达国家的人口问题比欧洲曾经存在过的问题更加尖锐,因为欧洲每年的人口增长率从未接近过3%。(在马尔萨斯的时代,美国人口的年自然增长率可能如他所说为3%,相当于约50D的出生率,20D的死亡率;但是50D的出生率要求每个母亲平均生8个以上的孩子,而这是人类生育能力的极限。)欧洲国家的人口增长率比较低,其部分原因是变化开始时这些国家的出生率是35D左右,而不是40D到45D左

    右。另一部分原因是欧洲国家的死亡率下降得非常缓慢,以

    致在死亡率下降到最低水平之前,出生率已开始下降了。欧

    洲把死亡率降低20点用了一个多世纪的时间,近来有些其它

    国家在40年或不到40年的时间里就达到了这一目标。因为

    在出生率对不断下降的死亡率作出反应之前需要经过一些时

    间——在欧洲,死亡率下降了半个世纪或更长的时间之后,出

    生率才开始下降——死亡率迅速下降可能使它下降到10D,

    而出生率仍为40D,因而可能造成人口的大量增加。增加越

    多,要抑制这种增加就越费力,因为为提高生活水平所需的

    总产量的增长率也越大。另一方面,欠发达国家的出生率开

    始下降时,将像死亡率那样比西欧的出生率下降得快,这不

    是不可能的。出生率下降10D在法国用了70年时间才完成,

    瑞典和瑞士用了40年,英国和丹麦用了30年,而在从1924

    年到1936年的12年间,保加利亚的出生率从40D下降到

    26D,波兰从35D下降到26D,捷克斯洛伐克从26D下降到

    17D,日本从35D下降到27D。在这些年代里,什么事情都

    比19世纪发生得快。

    虽然鉴于上述原因,有些比较贫困的国家的人口问题确

    实非常严重,但是认为人口的增长,无论是实际的增长还是

    潜在的增长,是这些国家的生活水平提不高的主要原因则是

    不确实的。譬如,印度的人口目前每年增长1.25%。这一增

    长率比美国目前的人口增长率还要低,而美国的人均产量却

    每40年增长一倍;而且这一增长率并不比19世纪欧洲的人口增长率高,当时欧洲的生活水平却大大提高了。如果说日本从1880年起,能使人均产量每25年增加一倍,那么尽管人口增长,亚洲或非洲的其他国家同样能够做到这一点。日

    本的自然资源并不特别丰富;正相反,它的煤炭和矿砂比印

    度要少。今后二三十年内的人口增长率对于经济的增长可能

    并不是一个不可逾越的障碍。在人口每年增长2%的情况下,

    要提高人均增量,比之人口每年增长1%时更为困难,但是这

    些国家提高人均产量的主要障碍不是人口的增长率,而是这

    些国家的资本形成率低得太多,仅为5%左右。如果这些国家

    每年投资10—12%,它们的人均产量就会提高,这种情况本

    身就会使出生率下降,从而使人口增长率降低。

    限制家庭人口的做法一旦流行,它就会像其他的时尚一

    样不胫而走;这就是说,社会地位最高的阶级最先采取这种

    做法,然后下层也跟着采取这种做法。所以,处于过渡时期

    的社会始终表现出生育力回收入和文化程度成反比。从论证

    “随着人们收入(或文化程度)的提高,他们的生育力下降”

    这个意义来说,上述说法有时候被解释为对马尔萨斯的某种

    回答,这是不正确的。除了过渡期间之外,这种相互关系是

    否存在是令人怀疑的。没有可靠的证据可以证明,在稳定的

    社会中,富人的孩子比穷人的孩子要少,无论是在出生率很

    高的时候——如在18世纪的欧洲和当代的印度——还是在

    出生率很低的时候——如在当代的法国。虽然必须承认,有

    某些证据证明,升入社会地位最高的阶级的人往往是生育较

    少的社会成员。

    属于过渡时期的和由生育的阶层差异造成的另一个现象是害怕智力下降。如果社会地位最高的阶级有最高的智力,而且生育的孩子比较低的阶级要少,那么就可以说社会的平均

    智力必定下降。那些否认较高的社会阶级有较高的智力的人

    对这种论点提出非议,他们比较多的财富为他们受比较好的

    教育提供了保证,但是他们的天赋并不一定优异。这一争议

    由于缺乏可以接受的证据而一直没有深入下去。除了阶级差

    异之外,有证据证明,在每个社会阶级里,大家庭的孩子的

    智力测验成绩不如小家庭的孩子好。有人解释说,这种情况

    意味着,智力比较发达的社会成员最可能限制他们家庭的人

    口,这种解释再一次引起人们对社会的平均智力必定下降的

    担心。然而,也许同样说得通的是,家庭人口少的孩子比较

    聪明,这仅仅是因为他们的父母能给予他们每一个人以更多

    的个别照料,并且因为他们能在更大程度上模仿他们的双亲

    和同他们的双亲斗智。而大家庭的孩子们却多是同其它孩子

    玩耍。

    不管人口是继续增加还是下降,使得一些优生学家同样

    感到不安的是他们预料由于死亡率下降而出现的问题。这些

    优生学家争辩说,死亡率高的时候,那些没能活到生儿育女

    年龄的人或没有来得及有个大家庭就死去的人,从生物学上

    来说在更大程度上比在死亡率低的时候死去的人要低劣;所

    以他们得出结论认为,如果死亡率低,连续几代人的平均生

    物学素质就不如死亡率高时连续几代人的平均生物学素质

    高。有人认为死亡率高时活下来的青年人从生物学上来讲一

    般比死亡率低时活下来的青年人优秀。这种论点并非人人都

    同意。正如我们已经看到的,死亡率高同近半数的孩子出生后活不到10岁就死去有关,这些死去的孩子占了死亡率大约

    一半。有没有理由认为,死去的一半在体质上一般不如活着

    的一半健康,在智力上不如活着的一半机敏,或者说他们的

    死亡是由于生活条件恶劣、照顾不周或偶然发生流行病等有

    关因素造成的呢?现代的社会千方百计地使许多成年人活下

    来,否则他们会在竞争性的斗争中死去,因为他们临时生病

    或身体不适、因为他们患精神病或神经错乱,或者因为他们

    懒惰、没有责任心或愚笨使得他们没有谋生的能力,这肯定

    是事实。这些特点有些是生物学上遗传的,有些则不是。关

    于这些问题的可靠结论有待于对素质的优劣下更明确的定

    义,以及更明确地了解每一种素质对生物学遗传所依靠的程

    度。

    死亡率的下降还引起其他更富有过渡性的问题。死亡率

    下降的一方面影响是活到60岁以上的人的比例提高很多。如

    果60岁是正常的退休年龄,这就意味着分享年轻人产出的老

    年人人数增加。提高退休年龄只能部分地解决这个问题,因

    为哪怕把退休年龄提高到70岁,70岁和70岁以上的人数在

    平均估计寿命为68岁的稳定人口中也是非常多的。另一方

    面,这个问题的重要性通常被夸大了。因为虽然老年人人数

    由于死亡率下降而增加,但是我们必须估计到由于出生率下

    降,儿童人数下降得更多。譬如,英国15岁到64岁的人口

    所占的比例,在过去一个世纪里已从60%左右上升到70%左

    右;这是由于儿童人数下降了,但是比之过去出生率高的年

    代,所占比例仍将高出许多。这些变化仅仅是过渡性的,因

    为如果人口和死亡率稳定下来,所占的比例也将稳定下来。如果人口稳定,人人都活到75岁,那么15岁到64岁的年龄组将占总人口的67%。只有出生率急剧上升,年龄为15岁到64岁的人口才可能再度降到占60%的水平以下。

    除了同增长率暂时有关的困难以外,也还存在着同人口

    数字的稳定有关的担心。正如我们已经看到的,预言长期停

    滞的人们担心,在人口稳定的情况下,经济可能变得不那么

    灵活了,投资机会可能出现不足(第五章第三节(四))。除

    了经济上的这些担心,还必须加上有些人在政治上的担心,这

    些人渴望他们的国家,无论是为了防御还是为了侵略的目的,

    拥有大量的、越来越多的人口。

    出生率一旦开始下降,就会正好下降到使人口保持稳定

    的水平,这不是不可避免的。西欧有几个国家,出生率在20

    世纪30年代曾下降到这一水平之下,虽然此后在其中大部分

    国家已上升到稳定率并超过稳定率。同样,我们不能肯定,出

    生率在欠发达国家是否会下降到在欧洲已经达到的那样的低

    水平。如果要在死亡率低的情况下稳定人口,那么孩子不少

    于两个不多于三个必须成为风尚。在20年代的欧洲,只要一

    个孩子曾经成为风尚(按这样的水平,人口必定下降),但是

    现在这不再流行了。亚洲、非洲或欧洲的风尚可能已变为有

    三个或四个孩子亦未可知(按这样的水平,人口将在大约一

    个世纪内翻一番)。目前,这些风尚看来主要是由关于个人方

    便的想法决定的,其特点一方面是爱孩子和家庭生活,另一

    方面是养育孩子花钱多,很麻烦。当前讨论人口问题的一大

    好处是,这种讨论可能使得父母们把社会问题考虑进去,因

    为如果养育少于两个或者多于三个的孩子成为流行的风尚,就会引起社会问题。我们或许应在教育妇女和未婚少女方面做多得多的工作,让她们意识到存在这个社会问题。

    总之,我们能够看到马尔萨斯修正他原来的理论是多么

    正确。认为生活如何决定人口增长率是不符合实情的。在处

    于人类历史上出生率和死亡率都高的阶段的社会中,这种认

    识是完全符合实情的,但是一旦人类懂得要控制出生率和死

    亡率,这种认识就不符合实际情况了。人类的历史随之进入

    一个新时代,在这个时代中,我们的命运已掌握在我们自己

    的手里。人类可能因为我们没有足够的孩子而绝种,要不人

    类也可能由于生存条件容许而使自己繁衍到这样一个阶段,

    在这个阶段,要是我们还是局限于在这个星球上生活的话,我

    们将仅仅有立锥之地。我们将朝着这种方向中的哪个方向走,

    谁也不知道。

    (二) 规模和产出
    我们讨论经济增长对人口多寡的影响,将直接导致人们有时提出的下一个问题,即按国家的资源有多少人口才算合适?

    这基本上不是经济方面的问题。譬如,也许有人会问,要

    使人均产出提高到最大限度人口有多少才算合适。对这个问

    题,没有多大希望找出确切的答案,因为产出取决于许多其

    他因素,但是这个问题是有根据的,有意义的。然而,不能

    设想,适度的人口是使人均产出达到最大限度的人口。一个

    国家也许宁可要比这更少的人口;其原因据说是作为一个小

    国有种种好处,人民精悍,全国较容易团结,没有对外的政治责任;要不就是因为不喜欢人口赖以增长的过程——移民或者要有许许多多的孩子。另一种情况是,有的国家也许希

    望有超过达到最大人均产出所需的人口,因为人口多对防御

    或侵略都有价值;或因为想在世界事务中发挥重大作用;或

    因为愿意收容移民,特别是逃避宗教或政治迫害的难民;或

    因为喜欢同其他民族一起相处,特别喜欢同大量的孩子相处。

    因此,人口多少才算适度的问题所引起的问题,远远超出经

    济分析的范围。

    我们只限于从经济方面来考察有时候使用“人口过剩”这

    个词的四种不同的意义。第一,如果一个国家人口较少而人

    均产出较高,这个国家可说人口过剩。第二,有时候这个词

    只不过意味着,要是没有进口的粮食,就养活不了那么多的

    人口。第三,这个词在某种极端意义上是用来表示,国家的

    人口同国家拥有的资源相比,国家人口太多,以致人口的变

    化不会对总产出产生任何影响。最后,这个词还有某种含混

    的意义用来表示,一个国家正以超速度消耗无法补偿的资源。

    让我们先来解释这最后一个意义,因为正如我们将要看到的,

    它不会使人们得出积极的结论。

    其他情况如果都一样,人口的多少将决定矿物资源消耗的速度。我们消费的石油、煤炭、铁、锡或其他矿产品越多,地球表面留下来供将来使用的东西越少。我们能不能定出这些资源消耗的“适当”的速度呢?

    保护资源引起三个不同的问题。第一,在耗尽一种资源的时候,我们能不能创造另一种具有同等价值的资源?第二,为了慢一些耗尽这种资源,要付出多大的代价?第三,同我们自己的消费要求相比,我们对后代的消费要求要重视到什么程度?此外,在回答这些问题时,我们必须分清任何一个国家的情况和整个世界的情况,因为一方面随随便便耗尽自己的矿产资源,同时又希望将来能从别处进口,这样做对一个国家行得通,但是目前对整个世界行不通。

    我们先以耗尽一种资源以便创造另一种资源这种情况为

    例,如果我们考虑一个国家的情况,我们就能十分清楚地看

    到这一点。一个生活水平低的国家,如北罗得西亚或马来亚

    或特立尼达,可能发现自己拥有在世界其他地方极为珍贵的

    某种矿产资源。如果它不肯耗尽这一资源,它的生活水平就

    仍要保持很低。另一方面,如果它开发这一资源,它就有可

    动用的资金来改善它在其它方面的资本设备。有更多的钱可

    以花在教育、改良农田、灌溉设施、公用事业,研究以及勘

    探新资源或为其他资源找新用途等方面。因此,一个国家的

    矿产资源用光以后,这个国家将来在求生存方面反而可能处

    于有利得多的地位:一种资源已被转换成另一种资源。当然,

    情况并非永远是这样。收益往往被浪费掉,或主要用在经常

    性的消费上,所以一旦资源枯竭,一无成绩可言,而且经济

    陷入停滞;这是以前的矿业城镇和本来矿产丰富的某些国家

    的一种通病。收益也常常归某个其它国家所有;外国股东们

    可能在采矿收益中占最大份额,并利用这些资金来改善他们

    本国的资本设备,而不去改善矿产品产国的资本设备;开采

    工作也许由移民来做,他们一涌而进,开采他们能够开采的

    一切,到矿产枯竭的时候,他们就移居国外,留下一堆烂摊

    子。有些资源正在枯竭,开矿可创造与这些资源具有同样价值的资源,但是除非国家坚持把很大一部分收益用于投资新资源(包括教育),否则上述情况是不会出现的。同样,新资

    源并不总是代替得了老资源。拿一个发现自己拥有煤炭或铁

    矿砂的原始国家作例子。这些资源都是建立大工业的基础。这

    个原始国家也许没有能力建立这样的工业,因为它的人民缺

    乏必要的教育与资本。所以它可能暂时决定出口它的矿石或

    煤炭,作为赚取用来增强它的生产能力的资金的手段。但是,

    如果它出口矿石和煤炭,那么到它能够在这些基础上建立工

    业的时候,可能就没有矿石和煤炭了。特别是有了这两种矿

    产品,要作出以下决定并不总是容易的,是应当把它们作为

    资金的来源现在就出口呢,还是把它们作为本地工业的基础

    保存到将来不知什么时候。

    当我们从个别国家的水平谈到全世界的水平时,也出现

    了非常相似的困难。在耗尽一种资源之后,人们可以创造具

    有同等价值的另一种资源,这种情况只有在非常有限的意义

    上才是符合实际情况的。在过去的两个世纪里,虽然矿产资

    源迅速消耗,但是我们的知识大大丰富了,我们的生产能力

    大大提高了;如果我们把地下的矿藏留给后代而没有留给他

    们如何利用这些矿藏的知识或他们将要继承的一切其他科学

    知识的话,他们是不会受益的,这是事实。但是,如果他们

    没有同时得到可以应用这些知识的资源,大量的知识对他们

    有什么用呢?这种知识也可能使他们能发现新资源或者为以

    前被认为是没有什么用处的东西找到新用途(直到不久前铝

    矾土和铀还只不过是两种“石头”而已)。知识甚至可能使得

    他们能用空气合成他们所需的一切,用氢原子来制造。换句话说,我们现在耗尽资源如果是对我们的子孙后代做了什么坏事的话,那么很难估计这种坏事有多么严重。他们可能情况较好,因为作为交换我们能把知识和其他资本留给他们;要不他们可能咒骂我们没没有远见,就像有些中东和北非国家的人民现在可能想咒骂他们的祖先那样,因为他们的祖先毁掉了那里曾经存在过的森林,由于没有森林,沙漠的面积扩大了。

    我们消耗资源的速率也是由比较审慎地使用资源的代价

    所决定的。譬如,在采矿时,有各种纯度的矿石。用同时开

    采低品位矿石的办法,从某一片土地中获得更多矿石始终是

    可能的。同样,采伐森林时可以破坏得多些,也可以破坏得

    少些,复种时可以细心一些,也可以不那么细心。确切地说,

    对农业也是一样。在大部分国家,一定必须保持土壤的肥力

    已成为一条道德法律(有时候甚至使用法律制裁)。这决不是

    普遍的态度。恰恰相反,在许多国家,轮作仍然过于普遍,那

    就是说如果我们耗尽这块土地的肥力,没有什么关系,因为

    明年我们可以转到另一块土地上去种;如果土地在休耕时能

    够复壮,那么情况同矿产是稍有不同的,但是事实上,用这

    种办法使用的许多土地已失去它们所含的矿物质,甚至失去

    了它再造腐殖质的能力。在所有这些事例中,付出一些代价,

    是能够使自然资源得以保护的,无论是绝对的还是仅仅在比

    较大的程度上加以保护。商业用户用收益来衡量这种代价;用

    低品位矿石的价格来衡量开采这些矿石的成本;衡量复种森

    林,或较为有选择地砍伐木材的成本;采取水土保持措施的

    成本。如果社会不接受这种判断,它要有诱导或实行比较谨慎地利用资源的办法。诱导主要是采取补贴方法的形式,促使比较完全地使用资源;现在南非政府使用的对金矿征收矿区使用费的办法;或对植树给予补贴;对耕种低产土地给予补贴:对采取水土保持措施给予补贴等措施就起这种作用。另外的办法就是制订法律规定比较仔细地使用资源,规定复植或水土保持标准,对破坏这些标准的行为予以惩罚。

    所有这一切都有这样一个问题,就是我们这一代人应当为未来做些什么?为什么我们现在不应当利用我们所想要的一切,让子孙后代自己去谋生呢?为什么认为他们未来的幸福比我们现在的幸福更为重要呢?譬如,就说人口问题吧。假设一个国家有足够供100亿人口一年消耗的煤,为什么让2000万人消耗500年倒比让5000万人消费200年要好呢?或拿水土保持的情况来说,如果我们现在为此目的投入足够的劳动力,那么我们留给后代的土地的条件不仅像我们已经见到的那样好,而且还要好得多。但是为什么我们要为他们付出这些代价呢?或者说,在这件事情上,为什么我们现在要对我们在自己的有生之年不能充分享受其成果的项目投资——例如为了获得水电对拦河筑坝进行投资呢?这些问题是无从回答的,除非从我们尊重人类传宗接代的延续性这个角度来考虑。我们大部分人都有一种感情——这种感情是一种固有的本能,还是我们学到的某种东西,这不好说——这就是我们社会的未来是重要的,具体说我们每个人,笼统说我们这一代人,都应当为了子孙后代牺牲一些眼前的舒适。这种牺牲应当多大并没有衡量的尺度,因此对“什么是消耗资源的适度速度?”这个问题没有客观的答案。每个社会都必须由自己对这些问题作出决定。

    在我们对当前的产量和当前的人口之间的关系进行调查

    以后,我们所处的地位就更加安全了。人口和人均产量之间

    的关系,是一个一方面有专业化优势和大规模生产的经济,另

    一方面比较集中和大量使用自然资源的不经济问题。人口越

    多,实行专业化的机会也越多,不仅对人员,而且对厂家和

    工业部门都是这样。“劳动分工受市场大小的限制。”诚然,不

    论国家大小,国际贸易的存在在某种程度上使专业化成为可

    能——实际上,从另一种意义上讲,国家越小,专业化的程

    度通常越高。但是由于有许多活动是对外贸易无法提供的

    ——住房、个人服务、国内运输等等——所以将来国内专业

    化越扩大,国内市场也越大,这仍然是符合实际的。此外,对

    外贸易有它自身的不利条件和不稳定性,使它同国内贸易相

    比较时削弱了吸引力。所有这一系列论证同样地适用于大规

    模生产的经济。这种经济有时候可以通过生产出口产品而得

    到保证,但是在许多情况下(有些公用事业),产品是不能出

    口的;而且无论如何,因为对外贸易的风险比较大,对国内

    市场实行规模经济的可能性比在投资者不得不依靠国外市场

    来销售其大部分产品的条件下更大。

    从一个大市场得益最多的工业部门是公用事业和一些用金属进行生产的工厂,在金属生产的初期阶段尤其如此。公用事业——运输、电力、煤气、自来水——在人口变得稠密起来时,其经济性显示得非常明显,因为公路、管道和传输线,比过去得到更充分的利用。总起来说,除了装配厂之外,制造消费品和机器的工厂企业很快就达到最佳的规模。享有最大的规模经济的工厂主要是从事金属矿石加工的工厂和那些制造基本化学品的工厂。同样,如果一个国家大得足以支

    持一系列的其他工业部门,哪怕一般的工厂规模不大,大部

    分工业部门也能从在这个国家的经营中获利,因为各企业无

    论是作为原材料、部件和劳务的来源,还是作为中间产品或

    副产品的买主,都是互相依赖的。另一方面,在农业和采矿

    业中最快出现规模不经济。随着人口的增加,有必要耕种不

    那么肥沃的土地,或对肥沃的土地更加进行精耕细作,无论

    是哪一种情况,结果都是收益减少。

    因此,一个国家在不减少收益的情况下所能负担的人口,

    要看它的自然资源是否适合它成为一个金属制品和重化学产

    品的制造国,或者取决于它们是否基本上适合于它从事农业

    生产。如果属于前者,这个国家可能继续得到越来越多的收

    益,不怕人口大量增加,而如果是后一种情况,出现收益越

    来越少的日子就会早得多。我们也看到一种自相矛盾的情况,

    一个国家的人口与它的农业资源相比,可能是人口过剩,但

    是与它发展工业的能力相比,人口又不足。有些很小的国家,

    像牙买加和毛里求斯,它们面临的问题是,与农业相比,它

    们的人口实在是太多了,而同时要支持范围广泛的工业发展

    又太少。

    因此,也不能单单因为一个国家靠它自己的土地养活不了它的全部人口,就说它人口过剩。这是有时使用这个词的另一种意义。如果国际粮食贸易不可能进行或非常费钱,或者如果人们主要从军事战略角度来研究这个问题,这的确是一种有益的意义。在西欧,如果我们把每个儿童作为一个单位包括在内,如果我们把三英亩草地大致折算成一英亩可耕地,那么养活一口人大概要一英亩土地。在美利坚合众国,饮食标准大致相同,但土地的生产力低得多,因此养活一口人要两英亩多土地。其他国家的状况一方面取决于它们的饮食标准,另一方面取决于生产力。所消费的畜产品(肉类、奶、黄油等等)数量的多少起很大作用,因为从土地来说,这些产品的成本是很高的。譬如,印度消耗的热量不到欧洲人均消耗热量的三分之二,摄取的蛋白质只有一点点,但是这被土地的生产力比较低抵销了;因此印度大约用五分之四英亩土地就能养活一个人。

    如果有进口粮食的可能性,那么农地的负担能力在确定

    人口的最大限度应是多少时将不再是决定性的。一个国家也

    许能够用集中力量发展其他更有价值的技术和资源的办法来

    增加它的收入,并且可能有意撂荒土地和进口粮食,虽然它

    如果必须养活自己的话也能养活自己。一个没有足够的土地

    养活自己的人口的国家,如果它有其他的资源和技术,也可

    能人口不足,因为人口的进一步增加会使人均产出增加。这

    并不是说,一个国家只要能够从事制造业或一些别的活动,人

    口就不会过剩,因为如果比较少的人口显示人均产出比较大,

    在制造业和农业或别的活动中人口过剩是非常有可能的。这

    一段要说明的问题仅仅是,在判断一个国家是不是人口过剩

    的时候,人们必须把一切活动考虑进去,而不只是考虑农业

    资源。

    然而,个别国家仅仅因为它不能养活自己,确实不一定就是人口过剩,而同样的论点并不适用于整个世界。正如我们已经看到的,对世界当前的承担能力的估计在25亿人到100亿人之间,按目前的增长率(每年1.25%),世界人口在一个世纪多一点的时间里将达到100亿人的最高数字。另一方面,我们生产粮食的技术时时在改进。农业先进的国家每英亩土地的产出过去已经证明大大增加了,而要预见未来

    技术进步的速度是极不可能的。世界人口比全世界每英亩土

    地的产出增长得快,这一事实使得许多人更加重视这样一个

    论点,即对任何国家来说,依靠进口粮食都是危险的。譬如,

    他们认为,如果英国的人口不超过2500万,英国的前途会稳

    固得多,理由是,以这样的水平,人口将多得足以实际上耗

    尽公用事业和制造业的所有大规模经济,同时又少得足以将

    对外部粮食供应的依赖减少到很小的比例。不过,所有这些

    论点必定是以对极其捉摸不定的未来所作的推测为依据的。

    还有必要说明,即便我们能够确定,如果人口减少譬如

    说20%,人均产出会增加,也不能因此认为,如果20%的人

    口移居国外或出生率下降,人均产出将会提高。对人口所作

    的这些比较是以假设人口的结构不变为基础的,就是说老人

    和青年的比例、男女比例、熟练和非熟练人口的比例都保持

    原样。但是,由于人口发生变化,人口的结构也将改变,而

    且并不是总是往好里变。我们已在本章第一节(一)中讨论

    过过渡问题。

    人口过剩这个词的其余意义是指这样一种情况,一个国家的人口已经很多了,如果再增多,产出也不会增大了。这个词的第一个意义的极端形式就是这样。按第一个意义来讲,人均产出因人口增加而下降,但总产出增加;这样说来,总产出也并没有增加。天啊,人口过剩的这种极端状况,人们并不是不知道。这从依附于某些经济部门的人数过多,特别是当佣人、小商贩、打短工和从事农业的人数过多这种情况是能够认识到的。佣人的人数膨胀是因为这种经济随每个人的需要而调整,使他提供尽可能多的就业机会;社会风气要求每个人如有可能就雇仆人,比较富有的社会成员的家庭必须雇用大批侍从,这些侍从的地位同一条看门狗差不多。这种情况的一个极端的例子是巴巴多斯岛,据人口普查记录,那里16%的人是当佣人的。经营小商贩的人数也很多;市场上摆满货摊,每个商贩做不了几件生意,在闲聊中几乎不知不觉就把时间消磨掉了。此外,还有成批的看门人、临时园艺工人和其他只要可能就打零工的人,一般也许一星期干一天,或者干不到一天。在农业方面,种种现象表明农场的规模都不大;一般家庭耕种的地块很小,家庭成员用不着把全部时间花在土地上。人口过多主要表现在农业方面呢,还是主要表现在当佣工、做买卖和打短工方面呢,这要看农业是由雇工经营还是由农民经营。如果是用雇工经营(如在巴巴多斯),受雇人数不会多于耕种所需的人数,多余下来的人必须要在农业以外的行业谋生。但是如果由农民经营,多余的人就要靠家庭农场生活,从事其他职业的多余人员可能为数很少。人口过剩国家的一般趋势是大地主把他们的土地租给农民收地租,而不是雇用农业工人耕种。他们这样做收入多,因为他们付给工人的工钱,比农民交租之后留下来的还要多。已做过各种尝试来衡量这种绝对意义的人口过剩。衡量农村的多余人口,要看在作物、技术和所使用的设备一定的情况下,耕种一英亩土地估计需要多少从事农业有利可图的人员。有些作物比另一些作物费力得多;种植稻谷比种植小

    麦费力得多,种植甘蔗或茶叶比种植玉蜀黍、可可或橡胶费

    劳力。设备也会造成很大的差别,因为一个家庭使用锄头种

    地至多种三、四英亩地,如果使用耕畜和犁,可耕种10到15

    英亩地,使用拖拉机能种30英亩土地或者还要多。还要记住,

    对劳动力的需要因活路不同而不一样;有些作物犁地时需要

    劳力最多,而另一些作物收获时需要劳力最多。因此,人口

    过剩的程度不能用一刀切的办法来估算,而必须按地区分别

    计算。在为欠发达国家的经济作这种计算时,用犁和耕畜种

    植100英亩谷物(不包括稻谷)所需要的劳力大约为14到20

    人。印度目前每耕种100英亩土地,有偿从事农业的人约为

    27人,经过这样详细的计算,可得出这样的结论,就是印度

    的农业人口中至少有四分之一的人力超过需要。这等于约有

    2000万人长期失业;所以这种现象时常被称作“隐蔽的失

    业”。这种现象在非洲和拉丁美洲很少见,而在中国、印度尼

    西亚、埃及和东欧的许多国家却屡见不鲜。

    这种人口过剩,除经常浪费劳动力以外,还会使土地的肥力下降。一个原因可能是,因为牲畜吃得太多,人们养活不起牲畜,所以土地得不到厩肥。(印度农民养活不起他们现在所养的那么多的牲畜,但是因为宗教原因还是要饲养,不过土地并没有因此而受益,因为牲口粪有一半当作燃料烧掉了。)另一个原因是要使每一寸土地都得到利用的压力;本应留在森林中或应留下来用于水土保持的土地,现在都开垦了。

    还有情不自禁地要过量种植使土地贫瘠;一年当中收成太多,要不就缩短土地的休耕期。收益递减律说明,如果太多的人耕种太少的土地,劳动的边际产品将是负数,人们对人口过剩国家的这一特点太熟悉了。

    既然有这样多的人口,明摆着的政策就是尽可能多地开

    辟土地以外的就业门路。这不仅是增加非农业产出的明显手

    段,而且也可能是设法增加土地肥力的必要步骤。如果能让

    一些人离开土地,使一些土地重新成为森林,再用一些土地

    来控制侵蚀和延长休耕期,农业产量肯定会增加,虽然不一

    定会马上增加。扩大一般的农场主的土地面积也是可能的,但

    是这并不一定会使农业产量增加,因为亩产最高的多在最小

    的农场;不过,如果现在情况较好的农场能够多储蓄一些钱

    来投资改良他们的土地,农业产出可能增加。但是,要迅速

    扩大非农业就业机会来解决人口增加的问题,甚至使农业多

    余人口有所减少,也绝非易事。假设农村人口占总人口的

    70%,人口每年以1.5%的速率增加。那么,如果要减少农

    村的多余人口,非农业就业机会每年必须扩大5%以上。经济

    欠发达国家能以迅速工业化来使它们的农业人口绝对减少

    的,为数并不多。日本和苏联已设法这样做了,但是它们的

    工业发展速度同比如美国或德国比较,已经是了不起的了。

    让更多的人离开土地去就业提供不了粮食;正相反,与

    供应相比,这将增加对粮食的需求。因此,任何这种政策都

    必须伴之以实施增加亩产的有力方案,办法是建立广泛的农

    业教学网,增加肥料的使用量,繁殖和分配良种,加强保持

    和分配用水以及日本的经验已经证明能够迅速增加农业产量

    的一切其它办法。但是这种政策还牵涉比这多得多的问题。在生活水平低的时候,家庭对制成品的需求量不大——按制造业产生的收入(即不包括所使用的原材料的价值)来计算,不

    到国民收入的15%,按雇佣人数来说,甚至比这个百分比还

    要低。因此如果雇佣人员生产制成品,很快就会达到许多制

    成品在国内市场出售无利可图的地步,所以如果要达到充分

    就业,多余的制成品必须出口。这是一切按其农业资源来说

    人口过剩的国家——英国、日本、埃及、德国、印度或其他

    国家——的共同命运,它们只有出口制成品换回粮食和原料,

    它们的全体人民才能谋生。所有这类国家的发展计划都必须

    规定努力占领制成品的国外市场(如德国、日本),要不(像

    印度的“第一个五年计划”),它们就不得不放慢工业化的速

    度,让农村的多余人口照样留在那里。

    要在世界制成品市场上占有较大的份额并非易事。金属

    商品和工程产品的市场一般说稳步扩大,但是其他商品的市

    场扩大得很缓慢,或在某些情况下(如纺织品),市场绝对缩

    小了。因此,煤炭和矿砂蕴藏量丰富的国家如想增加它们在

    世界制成品贸易中所占的份额,是比较易于办到的。另一方

    面,那些煤炭或金属矿砂很少而人口过多的国家,只能在销

    售越来越困难的商品(纺织品、皮革制品、制成小商品)方

    面进行有效的竞争。不过,这样说仅仅是为了说明,一个国

    家同它的自然资源相比,如果让它的人口过分增长,这个国

    家要为它的人民提供充分的就业机会和保证他们有过得去的

    生活水平,就将遇到很大的困难。

    如此说来,能不能对世界上各种各样的国家当前人口不足或过多的程度得出结论呢?这是一个风险极大的课题,因为各个国家的资源不清楚,因为所知道的东西的潜在可能性随着新技术和新需求的变化而变化。然而,对于各洲的情况,我们妄作如下猜测也许是值得的。从非洲大陆还有渺无人烟的可耕地来说,从它由于当前人口稀少使得提供公用事业非常费钱来说,非洲是人口不足的;如果非洲有较多的人口,那么公路、电力、供水、铁路、医院和其他服务设施的人均费

    用将会下降,同时质量也能得以改善。非洲也有一些人口稠

    密的地区,如尼日利亚东部、肯尼亚的部分地区和在南非联

    邦的部分地区,但是从整体来讲,撒哈拉以南地区人口不足。

    拉丁美洲和澳洲在同样的意义上说或许都是人口不足的,虽

    然对它们的渺无人烟可耕地的范围有多大更加没有把握。另

    一极端是亚洲人口严重过剩,虽然东南亚的有些地区并不是

    这样。时间也许会改变亚洲的天然资源的价值,新技术也许

    会使亚洲的土地生产出比我们目前能够想象的要多得多的东

    西,或者还有现在不为人们所知的新的大矿藏可供开发。然

    而,就当前所知,张着口要吃饭的人数使亚洲的生活水平很

    低,这是无可怀疑的。欧洲和北美的经济状况则处在这两者

    之间。这些地区的情况是能互为补充的,应当一起加以探讨。

    如果欧洲能像1939年以前的情况那样从北美得到廉价的粮

    食和原料,那么欧洲的人口并不过剩。考虑到加拿大新发现

    的资源,该国的人口可能是不足的。人们对美国的情况非常

    没有把握,大概它的人口既非过剩亦非不足。对欧洲和北美

    的判断颇费踌躇,这着重说明,要在一边是人口众多,从粮

    食和原料方面来说是不经济的,而另一边从制造业、公用事

    业和其他服务业来说又是经济的来进行衡量是多么困难。

    (三) 职业
    人口的职业结构是随着人口的年龄结构、人力资源的性质、人口多少和人均实际收入的变化而变化的。

    从人口普查这个意义上来说,“从事有报酬的职业”或“从事经济活动”的人口所占的比例,一部分取决于年龄结构,一部分取决于妇女就业的范围。要在国际上可比较的基础上计算从事有报酬的职业的人是困难的,因为要弄明白把农妇划在那一类不太容易。因此,对人口普查的结果始终要有所保留。不过,这些数字只要经过调整,接近于可比的程度,看来从事有报酬的职业的人口比例约在33%到45%之间,较贫穷的国家处在这个比例的下限,较富裕的国家处于上限。

    年龄结构很重要。15岁以下的儿童占人口的20%、还是

    占40%,65岁以上的成人是占人口的5%、还是占15%关系

    甚大。所以青年人和老年人有工作还是没有工作关系也很大。

    随着经济的增长,在校儿童的比例和上学受教育的年数也增

    加了。退休年龄也趋于下降,因为保险和养老金计划扩大了。

    不过,尽管有这些因素,儿童的比例不断下降产生了这样的

    影响,如果我们只考虑男性,那么富国从事有报酬的职业的

    人口所占的比例差不多全都比穷国要高出许多。

    从事有报酬的职业的妇女所占的比例,部分取决于成年人口中男女的比例,部分取决于妇女从事家务劳动的程度。这两个因素合在一起造成巨大的差别。在联合王国,从事有报酬职业的妇女人数相当于男人的47%,而在成年男女人数几乎相等的美国,类似的数字仅为33%,在妇女的机会受到很大限制的埃及,这一数字仅仅为17%。

    人口中男女人数的差异是由战争、移民、出生的男孩比

    女孩多和妇女的寿命比男人长等因素造成的。在联合王国,

    20—64岁的年龄组中男人比妇女多11%,这就是从事有报酬

    职业的妇女对男人的比例为什么比美国要高得多的主要原

    因。(儿童死亡率下降对男孩的影响大于对女孩的影响,正使

    得妇女的多余人数降下来。)另一方面,如果我们拿发达国家

    同不发达国家比较,妇女就业比率高的主要原因是妇女从事

    家务以外的劳动的机会多。

    妇女离开家庭去就业达到什么程度,主要要看经济发展

    已经到了什么阶段。经济增长使妇女从家务中解放出来。她

    们一直在家里做的许多工作效率不高而且单调乏味,现已转

    到外单位去了,那里专业分工细,资本多,这些工作是向家

    庭运水、碾谷物、做午饭、纺纱、织布和做衣服、教育儿童、

    照顾病人,等等。因而妇女从家务劳动中摆脱出来,转到这

    些外面的企业去工作,她们在那里干同样的工作,要不就是

    到办公室、商店、工厂去工作,到以前不向她们开放的各单

    位去做专业工作。所以,在类似的基础上所作的大部分普查

    表明,由于经济的增长,在家庭以外从事有报酬的职业的妇女所占的比例不断增大。(如果人口迅速增加而经济得不到发展,就可能发生相反的情况;在争夺就业机会的斗争中,男人取代妇女,从事有报酬的职业的妇女所占比例下降。英属西印度群岛的人口普查中有一些这样的证据,但是由于定义发生变化,难于信心十足地对这些统计数字做出解释。)从事有报酬的职业的妇女所占比例的增大,并不都能使产量增加,因为在家里干的工作相应地减少了。但是没有理由怀疑,这代表一个净增数,因为在外面的企业里,由于更加专业化、资本多和机械动力大,所做的工作具有优越的生产率。在提高妇女地位和增加对妇女开放的机会方面所产生的影响也是了不起的。

    妇女就业的程度甚至在同一个国家的各个地区之间也是千差万别的。譬如在1939年,兰开夏郡从事有报酬的职业的男人和妇女的比例为100∶52,而在南威尔士只有100∶15。这种差别首先是由于每个社会的基本工业不同造成的,妇女在轻工业集中地区的就业机会比在重工业、采矿业、农业或其他历来不雇佣妇女的职业集中的地区要多。这就是说,在后一类的各个地区,有一大批可以雇佣的妇女劳动力后备军,如果某个有事业心的雇主要在那里兴办新的轻工业,她们将

    进入劳动力市场。事实上,自1939年以来,英国就业机会的

    扩大有很大一部分,就是因为在这种地区建立了新工厂,为

    妇女劳动力创造了新的机会。这是欠发达国家增加国民收入

    最可靠的途径之一。在许多这类国家中,特别是在非洲和拉

    丁美洲,男劳动力短缺,只要更好地使用妇女劳动力,就可

    弥补男劳动力的不足。在那些男劳动力无论如何有剩余的亚

    洲国家,问题没有这么重要,但是即使在那些亚洲国家,扶

    持一些特别适合于妇女干活的工厂,收入就能增加。像英国

    那样的高度工业化国家的经验表明,虽然存在着一种私营企

    业向没有充分利用妇女劳动力的地区转移的自然趋势,但是

    私人采取主动步骤起作用是缓慢的——否则兰开夏和南威尔

    士的数字之间就不会有那样悬殊的差别了。这是各个劳动部和其他关心劳动力市场供求调节的人极须牢记的问题之一。

    决定从事有报酬的职业的人在人口中占多大比例的因素

    就讲那么多。下面我们研究一下从事有报酬的职业的人在不

    同的活动之间的分布方式。这在一定程度上取决于国家的资

    源,甚至在更大程度上取决于这个国家已经达到的经济发展

    阶段。经济调查这一分科要归功于科林·克拉克博士,他的

    名著《经济进步的条件》一书曾是近代研究这一课题的起点。

    人口普查为这些研究提供了原料,但是在作进一步论述之前,

    要对这些我们一定会提到的普查结果进行解释是有困难的。

    第一个困难是由随着经济的增长分工越来越专业化造成

    的。例如,在发展的低水平上,一个人可盖他自己的住房,生

    产粮食,把粮食运到市场上去销售,买回纺织品,给自己做

    衣服。在人口普查中他是作为一个农民出现的。到了一个晚

    得多的发展阶段,这些活动中的每一项活动都由专业人员来

    做——由建筑工人、农民、运输工人、代理商和制造商来做

    ——所以普查结果显示这些行业大大发展了,农民所占的比

    例下降了。普查结果显示的是专业化程度,而不是所做工作

    的工种。要说明家务活动转化为各个行业的发展情况,存在

    着同样的困难,因为家庭主妇不再自己提水了,不自己碾谷

    了,不自己照护病人了,等等,普查结果表明专门从事这些

    行业的人数急剧增加,大大超出社会实际上消费的这类服务

    量的净增数。还有一个困难是,在人口普查数字中缩小的某

    些行业,并不是因为这些行业所做的工作量下降而缩小,而

    仅仅是因为这些行业的从业人员工作更忙了。在人口过剩的国家中,农民、小商贩、佣人和各种临时工并不是整天都有工作做。随着经济的发展,出现了新型的就业门路,而且“隐蔽的失业”的减少在原来一直承担多余人口的行业的相对收缩中显现出来。这其中的教训是,人口普查数字只是间接地反映了对种种服务的需求,所以在我们对连续的普查结果加以比较时,我们应当严格地只谈记录在从事不同职业的人数中的变化,只能更加小心翼翼地把这些变化看作反应需求的变化。

    在把富国的人口普查结果同穷国的人口普查结果作比较

    时,我们观察到,不管是同一时期的不同国家,还是不同时

    期的同一国家,最突出的特点是,在我们由穷变富时,经营

    农业的人口比例急剧下降。最穷的国家经营农业的人口占

    70%或70%以上,而最富的国家只用12—15%的人口经营农

    业就能养活两倍于他们自己的人口。正如我们刚刚看到的,这

    70%或70%以上的比例把所做的农活工作量估计过高——

    这样多的农民除干农活外要做多得多的事情,可能存在着某

    些“隐蔽的”失业,而且很难把农民的妻子们划到哪一类。同

    样,需求和供应方面的实际力量也使所做的实际农活减少了。

    在需求方面,事实是对粮食需求的收入弹性少于统一性;那

    就是说,在人均实际收入增加的时候,对粮食的需求量并不

    增加得那样快。在供应方面,由于用在农业上的资本增加,使

    得每个农业工人有可能耕种的土地亩数越来越多;由于技术

    知识多了,使得每亩土地提高了生产力。从事农业的人口比

    例的升降,完全要看对粮食的人均需求量是比农业的人均生

    产率增加得快还是慢。如果这两个速度是一样的,那么农业

    所需的人口比例是不变的,举例来说,如果人均需求量每年增加0.8%,而人均生产率每年提高1.3%,那么50年后,农业所需的人口比例将下降22%(比如说从60%下降到47%)。随着人均收入的增加从事农业的人口所占的比例下降的主要原因是,人均农业生产率比人均消费量提高得快。

    实际上,人们可能把这种关系颠倒过来,并且可以说,在

    一个封闭的经济中,经济增长的条件之一是农业生产率应迅

    速提高。因为如果生产率不如需求量提高得快,农业就不会

    腾出为发展其他工业所需要的劳动力,这些工业的发展也会

    被逐渐对它们不利的贸易条件拖后腿(即粮食价格与一切其

    他商品价格相比不断上涨)。甚至在一个开放的经济里,要不

    断提高农业生产率是非常方便的,因为没有农业生产率的不

    断提高,经济增长将使粮食进口额增加,由于这会打乱贸易

    平衡,除非其他商品的进口额能够削减或者除非出口额能同

    步增长,否则经济的增长到那时就会变得取决于出口额增长

    的快慢了。此外,如果农业生产率提高得非常快,农民被迫

    的或者自愿的积蓄就可用作在其他经济部门投资的资金。经

    营农业的人口比例和农业生产率增长速度之所以是经济增长

    的程度和速度的两个最说明问题的指数,原因就在于此。

    几乎与农业人口比例下降同样可观的是从事制造业的人

    口比例上升。在这方面,我们又不得不对数字打点折扣,要

    知道上升的比例有一部分不过是从无记录的家务劳动转到有

    记录的工厂劳动。同样无可怀疑的是,制造活动的比例大大

    提高是因人均收入增加了。普查数字显示,在最贫穷的国家

    从事制造业的人口只占5—10%,这要看家庭手工业是多多

    少少保留下来了(如在印度),还是在早期被廉价的工厂进口品破坏了(如在斯里兰卡)。在最富有的国家,如果相对来说它们不进行什么制成品贸易,这个比例上升到25%左右(如美国),如这些国家靠在对外贸易中出口比如说三分之一制成品来赚钱维持生计,这个比例就提高到35%或更多(如英国、比利时)。制成品所占比例提高是因为随着收入的增加,对制成品的需求量比生产率提高得快得多,在人口过剩的国家还因为出口制成品是提供充分就业和粮食的唯一出路。因此从事制造业的人口比例像从事农业的人口比例一样,是表明经济增长程度的最明确的指数之一。

    在制造业领域内,正如霍夫曼博士所指出的,在不同的制造业之间也存在着相当大的变化。在经济发展的最初日子里,人均资本不大,对机器的投资和机器的更换的需求都不大。所以,消费品生产在制造业的就业人员中所占的比例最大——特别是服装生产。然而,在发展的以后各个阶段,总投资增大了——可能从比如说占国民收入的6%提高到占20%,而且生产钢、机器、水泥和其他建筑材料的工业部门,

    比之消费品工业都有了相应的发展。这种变化的速度是可以

    加快的。从理论上说,在积累大笔资本之前推迟扩大消费的

    同时经过巨额投资的阶段,使经济得到增长,这是可能的,这

    是30年代苏联制订计划的基础。如果发生这种情况,生产资

    料工业部门首先会大发展,然后才是消费品工业的发展。这

    种进程的主要障碍当然是在实际收入仍然很低的时候,要为

    庞大的资本投资计划筹措资金。生产资料工业方面的开支将

    引起消费者的需求,其结果是,如果生产资料工业比消费品

    生产发展得快,国家除非有日益浓厚的储蓄风气,否则必定会遇到通货膨胀在经济上和政治上造成的种种结果。大部分国家发现用发展消费品工业的办法来开始它们的工业化较为容易一些,因为它们完全靠储蓄或提高税收来为高水平的投资筹措资金有困难。

    消费品工业和生产资料工业的相对重要性还取决于自然

    资源以及对外贸易的可能性。最重要的生产资料工业是以廉

    价燃料和金属矿石为基础的,那些没有这种燃料和矿石的国

    家无法建立很多这样的工业。我们能用多种多样的指数来检

    验金属的重要性。譬如,加纳需要的制成品大部分是进口的,

    它进口的制成品(不包括矿物油)中,大约有40%是金属制

    品。或者以联合王国为例,从事制造业的人中有47%的人是

    从事冶金或使用金属的工业。再以世界制成品贸易为例,其

    中56%是金属制成品。因为燃料和金属矿石的分布并不很

    广,有些国家必须比另外一些国家在更大程度上专事金属工

    业。有些国家进口金属商品,另一些国家则出口金属商品。所

    以,正如我们在前面已经看到的,那些与农业资源相比人口

    过剩的国家,如果燃料和矿产也贫乏,就会处在十分不利的

    境地,因为它们不得不为了出口专事生产那种每个国家都可

    为本国制造的制成品;譬如日本,1936年只有28%的工业人

    口从事金属工业,出口的制成品中只有20%是金属产品。

    农业人口所占比例的下降并不能被制造业人口所占比例的提高所完全抵销。如果我们举最富有的国家为例,虽然农业可能已下降比如说55点(如从67%下降到12%),制造业可能只增加25点(如从5%增加到30%),其余的30点则为其他各类就业机会的扩大。政府活动、教学、医疗服务、各种各样的娱乐活动以及商务和金融发展通常很迅速。这种活动有多少算是国民收入的净增部分(如用于旅游的那部分交通运输),有多少作为使国民产出可资利用的成本(如载运货物或者载运职工去上班的那部分交通运输),这还是一个有争议的问题。有些试图计算国民产出实际增加部分的人会把这些服务性行业的大部分排除在外。他们计算农场、矿山和工厂的产出指数,为住宅建筑、教育、卫生和娱乐只留出有限

    的余地,从而把公共行政、交通运输和商业部门的增加部分

    大部分排除在外。我们在这里不需要深入探讨这些问题,因

    为讨论国民收入应如何计算不属本书的目的(见第一章)。随

    着经济的增长,人口普查记录表明,既不从事农业也不从事

    制造的人口比例,在从事有报酬的职业的人口中从占25%左

    右或不到25%上升到50%或多于50%,对于我们当前的目

    的,只要指出这一点就够了。有些最近的人口分布情况列表

    如下。

    埃及 日本 意大利 英国
    1937 1947 1936 1931
    农业、采矿业71 56 49 12
    制造业8 17 22 35
    商业8 7 9 16
    通讯2 5 4 7
    建筑2 4 5 5
    政府3 4 5 8
    其他服务业6 7 6 17
    总计100 100 100 100

      值得注意的是,服务性职业扩大的一个后果是,为挣工资而劳动的人口比例下降了——无论如何在城市地区是如此,独立经营者和业主的比例增大了。这是因为在服务业中挣工资的人所占的比例比较低。这一结果同卡尔·马克思的预言正好相反。

    因为经济增长使农业在经济中的重要性下降了,经济增长就必然同城市化联系在一起。居住在人口不到2000的城镇的人口比例,从80%或80%以上下降到30%或不到30%。这是因为在做那种在城镇做的事情——制造、批发、公用事业、中央政府行政管理、戏剧娱乐等——时实行规模经济。H.W.辛格博士已经表明,在任何国家,大小城镇的数目都遵循特定的统计分布(帕累托定律),就是说城镇的大小和数目之间有一种简单的倒对数关系。不过,这并不是说,人均实际收入达到一定水平的所有国家都已城市化到同样程度,或者需要城市化到同样程度。

    不把农村人口降到80%以下的水平,期望人均实际收入增长是没有用的,道理很简单,只有2000或者不到2000居民的城镇不允许规模经济发挥作用。如果农业需要的人口比例下降到12%,即便大力奉行把那种不要求非常集中的制造业保持在农村地区的政策,也阻止不了2000或不到2000居民的城镇人口下降到30%以下的水平。也不能想当然地认为城市化就是不可取的。正如我们在第三章中已看到的,许多人认为,我们极为珍视的一切——科学、宗教、艺术等等都是来自城镇。在产量或文化价值不受重大损失,而且在其他方面或许还有相当大的益处的情况下,人们能够做到的事情就是要压缩人口超过100000人的城镇数目。建立一些“鲁尔”区将永远有其必要,那里出产的燃料和矿石,供拥有大量人口的广阔工业地区使用。危险在于这种地区往往会把那些在别的地方发展也不会有重大损失的其他工业吸引过来。所以,如果人们希望防止过于城市化的话,就有必要对工业的布局有所控制,就是对在那些被认为规模已达到适量水平的地区进行建设要严加控制。

    在经济刚刚开始增长的所有国家,城市化发展的速度就

    是一个问题。在这些国家里,人口通常增长得十分迅速。农

    村地区也许还存在就业严重不足的现象,人们的倾向是逐渐

    涌入城市去当临时工。大城镇也特别具有吸引力,因为大城

    镇首先享受到经济增长的成果——有电影院、电灯、自来水、

    运输系统,等等;而且大城镇的社会服务应有尽有,有保健

    服务、学校、住房补贴、穷人救济之类。因此,即便经济没

    有什么大发展,城市人口在20年内增加一倍也是很平常的。

    在这种情况下,那些积极奉行工业化政策的政府必须决定,它

    们是鼓励在几个大城镇建立工厂呢,还是把新工厂尽可能广

    泛地分散,甚至就建立在农村。这个问题引起非常广泛的问

    题。有政治性问题;在有些地区,为了平息失业者的愤怒,工

    业必须放在大城市,而在另一些国家,边远省份可能的不满

    使人们更有理由感到关切。还有喜欢大城市生活方式的人和

    另外一些认为大城市是地球表面污秽之地的人之间的争论。

    所有那种经济分析能对这种争论做出的贡献是,把工厂集中起来——布在一个点上,在某种程度上是经济的。由此可得出结论,从经济观点来看,在工业化的初期阶段,最好是集中力量建设少数一体化程度很高的工业中心。在这些工业中心牢牢确立和工业化已经度过早期发展过程中经历的困难之后,其他的中心可用差不多同样的办法开始兴建。

    我们已经指出的职业结构的变化——从农业到制造业和其他服务行业——受报酬的差别的影响。因为农业正在衰落和城市的职业正在增加,在农业的人均收入和工业的人均收入之间通常有很大的差别。货币收入的某些差别是人们的错觉;农村工人的有些收入是以实物形式,他们购买的许多东西花钱较少(特别是食品和住房),有些生活和享受的其他费用(如交通)不必像城市人花得那样多。尽管如此,如果把这一点考虑进去,那么在农业与其他职业相比正在衰落的国家,农业的人均实际收入还是低于制造业的人均实际收入,这仍然是实情。条件是重要的,因为如果出现经济增长而农业生产率不提高,那么与工业收入相比,农业收入将会提高;这两者之间的差别一般只不过意味着对粮食的需求并不像农业生产率提高得那样快。

    人们如果把除了农业和制造业以外的一切服务行业归在

    一起,就会发现其他服务行业的人均收入超过制造业的人均

    收入,正如后者超过农业的人均收入一样。然而,人均收入

    是一个使人误解的整体概念。实际情况并不是赚工资的人在

    这些其他服务行业所得比他们在制造业所得的要多。看来认

    为这些服务行业的独立工人、拿工资的工人和熟练工人合在

    一起所占的比例比在制造业所占的比例为高倒是真实情况。

    这个集团包括店主、理发师、卡车车主、专业人员阶层和其

    他靠自己本事谋生的人。这个集团的所得比较高,这也许主

    要是由于它的阶层结构所致。

    因为农业、制造业和其他服务行业的人均收入各不相同,所以这些部门对国民收入的贡献多少同有职业的人口的分布不完全成比例。农业的人均收入为平均人均收入的50%到75%,其结果是,即使农业人口占80%,农业收入超过国民收入60%的情况也非常罕见。(据统计学家们计算,农业在国民收入中所占的份额有很大的差别,要看他们计算农场消费的粮食是按批发价格计算还是按零售价格计算。)制造业的人均收入从大致的平均人均收入,到或许超过平均数50%不等,从事其他活动的人均收入可高到平均数的两倍。

    从这些平均人均收入的差别中偶尔会得出非常令人误解的结论。制造业的人均收入低于“其他活动”的人均收入,但是不能因此就说增加实际国民收入的办法就是迅速从制造业转到零售业、政府部门或其他人均收入比较高的服务行业。仅仅把人员从农业转到制造业,实际收入也是不会提高的。随着经济的增长,从农业转到其他职业是增长的结果而不是增长的原因。要使这种转移顺利进行,农业生产率必须不断提高,要不非农业商品的出口额不断增加。如果不首先提高农业生产率就实现这种转移,结果将是农产品短缺,这会使国际收支出现逆差,要不就造成生活费用增加,由于工资不断提高,使得经营制造业的新企业难于维持。如果劳动力从农业转移而生产率不提高,他们必定转到那些不是用减少进口就是用增加出口的办法赚取购买粮食的外汇的工业部门,而这样做是否有利可图则完全取决于国内和国外的比较成本。(见本章第二节(一))。

    第二节 国际关系

    (一) 国际贸易
    一个国家参加国际贸易到什么程度,部分取决于它拥有的资源,部分取决于它在贸易上设置的障碍,部分取决于它发展的阶段。

    一个拥有各种自然资源——土地肥沃、气候相宜、矿产

    丰富——的国家实际上能自给自足。最佳的例子就是美利坚

    合众国,它的进口额只占其国民收入的大约4%,而联合王国

    的进口额占其国民收入的大约25%,在严格控制进口之前要

    占国民收入的30%左右。因此可以说,对外贸易额的大小在

    某种程度上是一个国家幅员的问题,或换句话说,在某种程

    度上是政治疆界划在哪里的问题。

    其次,对外贸易额的大小取决于政策,任何国家都能按

    它们的愿望做到相对来说比较自给自足或不是那么自给自

    足。自从400年前政治经济成为一个公认的课题以来,人们

    对赞成或反对政府控制对外贸易的理由一直争论不休,我们

    在这里无需对这个课题说得太多。赞成自由贸易的经济理由

    是国际专业化具有种种优越性,这对大家是不言自明的。反

    对自由贸易的经济理由是自由企业制度有种种缺点,这使得

    价格不能成为反映社会成本的真实指数。这些缺点在某些领

    域特别明显。存在着过分专业化的趋势,这种趋势无视整个

    经济可能承担的风险:战时供应品短缺,贸易条件大幅度波动,或者由于单一栽培造成流行病蔓延。制造业存在着规模经济,这要经过一定的时间才能产生结果,因此在工业化初

    期,要采取特殊措施来保护制造业。还有失业问题,这对与

    农业资源相比人口过剩,因而有理由设置壁垒来保护新工业

    发展的国家特别困难。除了这些经济理由之外,进行保护还

    要加上政治上和感情上的理由,这些理由直接涉及整个民族

    的经济利益。在贸易壁垒的范围内没有看到长期趋势。如果

    只有经济问题才起作用,那么各国就会在它们工业化的初期

    阶段设置相当高的关税,在它们的工业牢牢确立之后实行非

    常低的关税。英国在18世纪和19世纪遵循这个模式,美国

    在20世纪似乎在遵循这个模式;苏联是否也照着做还要看一

    看。但是要作出把关税行为同经济增长联系起来的判断是轻

    率的,因为关税行为同样是由政治利益和政治潮流决定的。

    因为得不到外汇来支付公众喜欢购买的进口货,进口额也可能受到限制。这通常是国内消费品生产和出口商品生产之间比例失调的一个迹象。正如我们(在第五章第三节(二))已经看到的,如果欠发达国家发展国内生产而不同的经济部门之间缺乏适当的平衡,它们特别容易陷入这种困境。由于通货膨胀(第五章第三节(一)),或由于投资速率加快而使进口的倾向发生变化,也可能发生货币困难。由于初级产品的价格波动较大,欠发达国家的经济又必须克服比工业国面临的广泛得多的外汇收入周期性波动(第五章第三节(三))。因此,如果它们要应付自如而不限制外汇,它们需要有比较富裕的外汇储备。

    在原始经济中,对外贸易与国民收入的比率在经济开始发展之前通常是很低的,但是随着经济的发展急速上升。我们已看到对外贸易对促进经济发展起着多么重要的作用(第五章第三节(二))。一个后果是,在发展的初期阶段,对外资易比收入增长得快。无论我们想到的是一个国家还是全世界的贸易,情况都是这样。一个国家在初期阶段是自给自足的,因为它的一大部分产品是由自给自足的农民生产的,他们手中没有什么钱,只出售很小一部分产品。为什么进口额

    只占尼日利亚国民收入的10%,只占印度国民收入的7%,这

    就是主要原因;我们十分肯定,随着人均收入的增加,只要

    把与世隔绝的地区同世界经济联系起来的国内交通有所发

    展,这些百分比就会提高。整个世界贸易大体上也是同样情

    况。从1870年到1913年,世界粮食产量每年增长2%不到一

    点,世界制成品产量每年增长4%不到一点。全世界的实际收

    入大概年增长2.5%到3%。在这个阶段,世界贸易额大概

    每年增长3.25%。经济增长初期阶段的特点显然是同交通发

    展相联系的国际专业分工的加强,结果是贸易比国民收入增

    长得快。

    晚期阶段就不那么清楚了。英国的进口额同英国的国民

    收入的比率在19世纪头75年急剧提高,但是如果我们把再

    出口除外并考虑到贸易条件的变化,在以后的60年中似乎变

    化不很大。美国则显示那种拥有大量未利用资源的经济。美

    国的进口额不如其国民收入增长得快,因为它开发了这些资

    源,现在,它的进口额与国民收入的比率仅为80年前的一半。

    现在美国的某些矿产资源即将达到极限,它正在变成比过去

    任何时候更大的原料进口国。有人预计,美国的进口额今后至少与其收入增长得一样快;但是我们必须等着瞧。两次世界大战给国际贸易造成那样大的混乱,使得我们无法信心十足地来谈论在今后几十年内可能会发生什么事。不论是否可靠,下面是最近的数字。从1948年到1952年,世界制成品产量增加27%,世界农业产量增加9%,世界贸易额增加34%(所有的数字都不包括苏联)。这些数字说明,世界贸易额继续比世界产量提高得快一些——虽然这个高增长率有一部分仅仅是由于从战时的低水平恢复过来。

    经济的增长还影响世界贸易的构成,不论是商品的相当重要性还是不同国家的相当重要性都是如此。

    有时人们预料,同原料和粮食相比,经济的发展会降低制成品在世界贸易中的重要性,因为据认为,随着每个国家的发展,它进口制成品的数量会相对减少,进口原料的数量会增加。不过,情况并非如此。按价值计算,制成品在世界贸易中所占的份额80年来始终未变(占35%到40%),我们有这方面的数字。原料在世界贸易中所占的份额连续增大,但是粮食下降了,对粮食的需求比收入增长得慢。世界贸易是在这样的基础上发展起来的,即某些国家主要进口粮食和原

    料,并主要用出口制成品和无形劳务(海运、股息、佣金,等

    等)来支付进口货款。这并不能说明世界贸易的全貌。生产

    制成品的国家有专业分工并相互大量购买,农业国家也有专

    业分工并相互购买产品。比较成本定律像它适用于工业与农

    业之间一样,也适用于这个制造业和那个制造业之间。同样,

    工业国购买投入世界贸易的三分之二初级产品和仅仅四分之

    一制成品,所以交易主要是在工业国和初级产品生产国之间进行。如果工业国多买初级商品,这些商品的生产国会相应地多进口制成品。所以初级产品贸易和制成品的贸易相继增长。这种关系发生变化总是有可能的,也许会有较多的制成品交换制成品,或者较多的初级商品交换初级商品,在这种情况下,制成品在世界贸易额中所占的比例将改变。目前我们只能说,在过去的80年中一直没有发生重大变化。

    假设制成品在世界贸易中的比例值不变,制成品贸易额

    同初级产品贸易额的比例则由这两者的比价来决定。如果制

    成品的相对价格上涨,它的相对数量将下降,反之亦然。因

    此,30年代曾是制成品贸易额非常低的一个时期,自50年代

    迄今一直是贸易额非常大的时期,但是无论哪一种情况,相

    对数额可以用比价来说明。所以比价的变化对决定世界制成

    品贸易是不景气还是兴旺起着巨大的作用。

    虽然制成品在世界贸易中所占的份额一直是相当稳定

    的,但是这种贸易的构成已发生明显的变化。纺织品的重要

    性已经下降,金属和机械产品稳步增大。1899年,纺织品和

    服装在世界制成品贸易中占40%;1950年,它们仅占20%,

    所占比例逐步下降。金属产品从31%上升到56%;所有其他

    制成品则从29%下降到24%,下降幅度不大。这些变化是容

    易理解的。由于工业化的发展,各国首先缝制自己的衣服。这

    种制成品差不多到处都能生产,因为原料轻便,运输容易,所

    要求的技术容易学会。金属却是另外一回事了。金属的生产

    同那些拥有廉价燃料和矿石的国家的联系要密切得多。工程

    方面的技术也不断进步,所以老牌国家总有一些技术使得它

    们比新来者占有优势。因而有各种理由预期这些趋势将继续下去。金属制成品与其他一切产品的比例将继续提高,燃料和矿石蕴藏量丰富的国家在国际贸易方面将有最为美好的前景。

    世界制成品贸易在各国间的分布情况,在过去的50年里

    也发生了显著的变化。拿1899年同1937年相比,美国、加

    拿大和日本所占的份额大大提高了,挤了法国和英国所占的

    份额。加拿大的份额的提高几乎全部在有色金属、纸浆和纸

    的方面。日本主要在纺织品方面,但是也到处进行有效的竞

    争。美国主要是由于进行战争,也是到处得益。譬如,美国

    所占的份额从1899年到1913年只从11%上升到12.5%;由

    于爆发战争一下子跳到20.5%,但是在1937年仅仅是19.5%;又是由于战争,1950年跳到29%。美国是否能在世界制成品贸易中保持这样大的份额,这有一部分必须取决于它通过进口和对外投资把多少美元投入流通,有一部分取决于世界其余地区是否不得不在更大的程度上靠它提供粮食。除对外投资,美国不可能是初级产品和制成品的纯出口国,这两种出口商品中哪一种将减少,这还要看一看。

    英国在世界贸易中所占的份额下降,这本身并不是引起

    不安的原因。一个国家所占份额的变化不过是意味着这个国

    家的出口额和世界出口额以不同的速率增加罢了,没有理由

    要求所有国家以相同的速率提高它们的出口额。如果比较老

    的工业国在世界制成品贸易中所占份额的百分比下降,只要

    它们的绝对份额仍然足以使它们有能力达到国内充分就业和

    支付它们需要的一切进口商品,这些国家就不必感到忧虑。就

    英国而言,重要的问题不仅仅是它的相对份额下降(从1899年的32%下降到1933年的22%),而是在1920年以后它所占的份额不足以提供充分的就业,从1930年以来一直不足以支付所需要的一切进口商品。

    这些情况使人想起18世纪有些经济学家持有的经济发

    展理论。这是一种长期停滞论。他们争辩说,一个在国际贸

    易中处于支配地位的国家,会自然而然地按照使它在一定时

    候丧失其领导地位的方式行事。由于其出口商品的需求量很

    大,所以价格相对地高于其他国家的价格,这就刺激别的地

    方竞相生产。资本流入别的国家,其部分原因是要在那里开

    办工厂,开创国已经表明这些工厂有成功的潜力,另一部分

    原因是要利用比较低的工资和其他价格,再一部分原因是由

    于如下的逻辑原则:在老国家集团中,每个国家的工业已增

    长到它在那里的市场的极限,所以其资本家必然着眼于其他

    地方以便把他们的利润在那里投资(关于这一点见第五章第二节(三))。然后还有所谓早开始不利:老的国家墨守(比如说)1850年的技术和固定设备,并发现很难同用(比如说)1880年的最新技术和固定设备装备起来的新国家竞争。

    这种所谓的不利条件看来是极为可疑的:如果两个国家在

    1880年用于投资的资本数额相同,那么自1850年以来也一

    直在投资的那个国家在同1880年才开始投资的国家竞争时,

    很难说处于不利地位,因为新国家花钱购买的任何新设备,老

    国家也能买得起。老国家可能发现保持它的旧设备比较合算,

    但是这样它就有了能够利用它的节蓄来发展新的作业线这种

    有利条件,而新国家却要在旧的作业线上追赶。下面这种说

    法似乎更有道理,就是比较老的国家由于专业分工而受损失;从1850年起,比较老的国家发展了它的设施(银行、销售、培训、运输、工程,等等)来供应1850年所缺少的东西;然后它开始墨守成规,或者说得好听一些,它被自己在19世纪

    50年代所作的努力形成的势头推着走,而未能适应19世纪

    80年代不断变化的需求。所以新工业一旦发展起来,这些新

    工业就向尚未受到那么严重束缚的比较新的国家发展。这种

    墨守成规可能还表现为技术领导地位的丧失;优秀的人才致

    力于解决老工业的问题。同时,新兴国家的人才在旧工业中

    不单单是追赶或抄袭老国家,而且还在新工业中突飞猛进,在

    当前正在发展的行业中夺取老国家在技术上的领导地位。

    英国正是这种情况。造成亚洲纺织工业的兴起和世界纺

    织品市场的丧失,低工资起了很大作用。关于投资的论点也

    很说明问题;从1870年起,英国把它越来越多的积蓄投资海

    外,就在1913年以前的那几年多达其积蓄的一半,这当然有

    助于加强其他地方具有竞争性的工业,特别是在北美、印度

    和日本,而技术进步在英国却落后了。此外,英国未在化学、

    机床、电气设备等迅速发展的工业中占据适当的份额,或者

    在这些领域中未取得技术领先地位,这是引人注目的。产生

    这一情况可能是由于全神贯注于公认的纺织业,由于轻视它

    古老的大学和这些大学的科学技术研究成果。另一方面,有

    两个因素使人怀疑这种程式是否适用于英国。第一,到1913

    年为止,虽然商品出口额增长缓慢,英国的收支顺差却不断

    增长,其部分原因可能是因为出口额增长缓慢抑制了生产并

    从而抑制了进口额的增长。但是也可能仅仅是因为英国发现

    发展航运、保险和其他“无形”收入比推动商品出口更为有利可图。第二,这种程式意味着,如果英国设法这样做,它也可能做不好。在组织出口贸易运动方面,没有什么事情是德国人和日本人能做而英国人想做却不能做得一样好的。这些事情过去没有做只是因为贸易对英国来得容易,但是这些事情在最近的将来也许不得不做了,而如果不得不做,那么是否会允许英国人个性中“翩翩绅士风度”起阻碍作用是非

    常令人怀疑的。此外,由于在日益扩大的市场上夺得世界贸

    易最大份额的是美国,不是日本,也不是德国,所以可能比

    过去出于良心认为对待比较穷的对手,不应太严厉的时候更

    加肆无忌惮地摆好架式来对待比较富有的国家。

    要在世界贸易中居领先地位,除了仅仅占有适当的份额

    之外,那就要靠创新了。英国曾在创新方面居领先地位达一

    个多世纪,但是创新(这同科学或者发明不是一回事)方面

    的领先地位现在转到了别的地方,领先地位的这些变化是不

    可避免的,因为谁也不能长期垄断智力,也不能长期垄断活

    力。在英国、德国和美国,由于在生产和使用金属与化学品

    方面的创新成为竞争对手之前,法国和荷兰曾在发展贸易方

    面成为竞争对手。在这之前,领先地位曾一时为西班牙所占

    有,所以我们还能继续往前追溯,追溯到罗马和迦太基之间

    处于敌对状态的时代之前。大国为什么把他们的地位让给别

    人,这不是用一个简单的经济模式就能解释清楚的。还有心

    态、内部紧张关系、政治发展、制度的变化、战争和许多其

    他因素。国际竞争力的变化大概仅仅反映出国内深刻得多的

    变化。和先进的工业国之间领先地位连续变动一样有趣的是,

    欠发达国家没有打入这个小圈子,只有日本一个例外。这有时也可以从一国对另一国的影响来解释。根据这一理论,国际贸易机制是发达国家和欠发达国家之间的差距势必扩大。

    当一个国家经历技术革新从而提高生产力的时候,它的出口

    货价格就下降。这些出口货打入欠发达国家的经济,它们在

    那里的作用就是破坏与之竞争的工业。到目前为止,一切顺

    利,譬如我们知道,这就是19世纪印度所发生的事情。印度

    十分发达的手工业受到来自兰开夏和伯明翰的廉价进口货的

    不利影响。这种理论还争辩说,这种作用是日积月累的。制

    造业中有大规模经济,所以,当(比如说)英国的工业发展,

    (比如说)印度的工业萎缩时,这两国在生产力方面的差距就

    会扩大。印度被迫越来越专门经营没有规模经济可言的农业,

    而英国部分地以牺牲印度为代价越来越富。

    这种理论同我们刚刚探讨过的理论完全是对立的,根据

    我们探讨过的理论,累积力量的作用是缩小而不是扩大这个

    差距。简单地把一国生产力日益提高的效果扩大到一切其他

    国家是靠不住的,因为这些效果为数很多。如果一个国家的

    生产力提高了,它不一定以比较便宜的价钱出售它的商品;它

    的货币收入可能增加,它的贸易条件仍然不变。如果它确实

    以比较便宜的价钱把商品出售给其他国家,其他国家由于自

    己的专长在其他方面也不一定受损失,而对这些国家的经济

    的影响可能证明恰恰是使它们摆脱停滞状态所需要的。我们

    在前面常常见到,对外贸易的发展常常是一个停滞不前的国

    家走上经济发展道路的起点。同样,欠发达国家因为先进工

    业国的竞争在开始工业化进程时有巨大的困难,这肯定是符

    合实际情况的,我们必须更详细地探讨这个问题。

    从经济观点来看,凡是能以更便宜的价钱从国外购买制

    成品的国家,自己生产这类制成品是不可取的。然而,这不

    仅仅是一个将国内货币成本同国外货币成本相比的问题,因

    为货币成本同实际成本往往是没有关系的。它也不是一个只

    比较时价的问题,因为发展的全部意义就是它使成本降低。所

    以当决定什么是要遵循的正确的政策时,人们必须考虑到工

    业化对成本的影响。如果把工业化的速度完全留待私人企业

    去做决定,工业化的速度会差不多永远低于经济增长的速度。

    先说起步的困难。创始成本总是要解决的,这就是一旦

    开始就要坚持某一行的原因之一。专业化的经济是规模经济。

    这些经济将在大多数生产部门显示出来,这种经济总是不让

    人们从这一行转到那一行。因此专门经营农业的国家用适当

    的运输设施、训练设施和类似的其它设施装备自己,而不用

    由专门经营制造业的国家发展的各种服务业来装备自己。于

    是可能出现这样的情况,虽然临界资源的转移会无利可图,但

    是一次要用巨额资金去发展新行业的大转移,到时候会证明

    比继续从事原来的专业要节约得多。实际上,这些大转移不

    能很快实现。如果要进行大转移,必须采取老老实实的行为,

    让国家经历一段或长或短的期间,在这个期间内新行业的生

    产力比较低。有些私营企业主愿意采取这种老老实实的行为,

    但是一般来说,这种老老实实的行为必须由政府来采取,而

    且要用保护或者补贴新行业的办法来支持。这种论点用于工

    业化特别有力量:在工业部门刚刚开始发展的时候,它的生

    产力是低的;它的劳动大军从农村生活转过来以后,要用一

    两代人的时间来取得工业才能;公用事业还没有得到充分利用,收取的服务费很高;许多相互支持的公司的网络还没发展起来。如果有理由认为现在付出的高昂代价不过是“初期

    发展过程中经历的困难”,支持制造业渡过这个阶段是值得

    的。这仅仅是对“新建工业”论的一种发挥而已,这一论点

    一个半世纪以来几乎为所有的经济学家所接受,并且为所有

    处于工业化初期阶段的国家所采纳。譬如,直到1700年左右,

    英国的工业技术落后于欧洲。在那时之前,英国工业增长最

    快的时期有三个,当时它鼓励手工业工人移居国外,从欧洲

    大陆引进技术——爱德华三世、伊丽莎白和后来的斯图亚特

    统治时期尤其如此。所有这一切都是在精心的保护下进行的,

    直到英国大大超过其他工业国家,它才采用自由贸易。德国、

    法国、美国和一切其他工业化国家在工业化的初期阶段也都

    跟着采取了同样的保护模式。不过,必须记住这种论点仅适

    用于工业化的初期阶段。一个国家一旦到达了已经具有规模

    经济的阶段,这种主张进行保护的论点就不适用了。

    除了创始成本之外,还有初创时期的无知要加以克服,因为即使在新工业没有保护也会获得成功的情况下,无知也会使这些工业无法起步。在先进的工业国,有许多富有经验的企业家探索新的努力领域,但在欠发达国家情况就不是这样。在增长的初期阶段,企业家们专事经营农业和贸易;他们不熟习新的制造业,因为他们既不懂得制造业的技术,也不知道从事新行业要担多大的风险。如果政府认为,事实将证明有利可图的新工业由于无知而遭到忽视,那么它就要行使创业的职责。政府可以着手研究需求,研究生产问题并把研究结果公布出来,启发潜在的企业家们。如果这样做还不够,政府可以邀请国外有经验的企业家来国内建立工业,作示范。如果障碍是怕担风险,政府自己可以承担创业的风险,办法无非是出资本或出一部分资本,保证私人资本的利益,签订购买这些工业的产品的合同(供自己的医院、办公室、监狱等使用,或者转卖),要不就用其他办法补贴或保护这些工业。

    日本已比任何其他国家都更明显地表明这种领导作用是多么见效:从1870年到1900年日本新建的行业差不多全部是政府倡议建立的,大部分工厂是由政府创办和经营的,当事业开始时的暂时困难过去之后,就将这些工厂出售给私营企业。创业职能特别重要,因为哪怕是在最后证明非常有利可图的行业,倒闭率也是很高的。当推广一项革新的时候,无论是

    一台新机器、一项新产品、一条铁路还是一个新的国外市场,

    经常发生这样的情况,创业的公司破产,经过两三个他人之

    手之后才在商业上获得成功。这种创业的高昂代价吓跑了企

    业家们,特别是在欠发达国家,那里的企业家数量既不多,经

    验也不丰富。因此政府作为创办者在欠发达国家所起的作用

    要比在较发达国家所起的作用大得多。

    在一些小国,工业化不仅需要暂时保护国内市场,而且

    如果要建立关税同盟的话还要暂时保护关税同盟。以两个小

    国A和B为例,其中哪一国也没有大到足以享有规模经济的

    市场。如果A国专门经营某些行业,B国经营另一些行业,而

    且它们分享市场,那么这两国到时候将成为卓有成效和有利

    可图,用不着继续保护,出现这种情况是可能的。如果没有

    关税同盟,A国可能无法使它的工业起步,因为A国可能从

    一开始就无力在B国的市场进行竞争。所以无论A国或B国可能都办不成自己的工业。要不A国和B国都办起了工业,各自保护它自己的市场,而两国的工业哪个都是不经济的。如

    果两国都要工业化,各自专门经营不同的行业,那么关税同

    盟对两方都有利。如果只有A国实现工业化,B国得不到好

    处,除非允许B国居民移居A国,以便分享新的就业机会。当

    然,如果这些工业本来就不应该办,即便有关税同盟也不应

    该办,因为这些工业是不经济的,那么双方都要受损失。所

    以,关税同盟作为促进经济增长的一种手段,它的长处和短

    处必须按照每一情况非常仔细地予以考虑。不过,毫无疑问

    也有这样一些情况:现在为关税壁垒相互分开的国家,如果

    不是用对全世界完全降低它们的关税壁垒的办法(这样做,它

    们的新建工业就不能诞生),而是用同其他邻国做出有限的安

    排,按这些安排各自在有限的范围内经营专业的办法,就会

    得到好处。

    推销问题,新行业的创始成本和无知在今天对欠发达国

    家实现工业化的抑制作用比在19世纪时大得多,因为最先进

    的工业国现在对所有其他国家的技术优势比在它们开始自己

    的工业历程的时候更大。如果欠发达国家不采取特别的保护

    措施,那么仅仅因为专业化的势头,它们和工业国之间的差

    距就将继续扩大。为经典经济学家所承认的主张对工业进行

    暂时的保护的理由现在比以往任何时候都更加充足。

    这种理由同样适用于人口过剩和人口不足的国家。除了

    到现在为止已经谈到的情况之外,那些与农业资源相比人口

    过剩的欠发达国家,更有理由保护它们的制造业,那就是说,

    在这些国家里,价格关系不幸未能反映实际的社会成本。这是因为它们过剩的劳动力所得的报酬比其边际生产率要多,

    而剩余劳动力的农业边际生产率按定义为零或者是负数。从

    实际的社会意义来说,利用这种劳动力从事制造业是有利可

    图的,只要它生产净产出;而从财政意义上说,利用这种劳

    动力并非有利可图,除非他们的净产出超过他们得到的工资。

    许多这种国家,如印度,已经因允许(或被迫允许)在制造

    业中进行自由贸易而受到损失,其结果就是破坏了它们本地

    的生产,加重了它们的失业问题,而无任何所得来弥补这一

    损失。在这种国家,正确的政策倒是在制造业尽量提供就业

    机会,只要制造业劳动力的净产出是正数,就不要介意竞争

    进口货的价格。这一论点决不能应用于一切欠发达国家;它

    适用于那些人口过剩的国家,如印度、埃及或牙买加,而不

    适用于那些人口不足的国家,如加纳或巴西。

    虽然这些人口过剩的国家比任何其他国家需要更快地实

    现工业化,但是它们的困难也比其他国家大,因为它们面临

    的问题是如何处理它们的产品。这些国家的生活水平低,这

    使得它们对粮食的需求量比较大,对制成品的需求量比较小。

    所以,从某种意义上讲,它们工业化的主要目的之一是出口

    制成品换回它们需要的粮食;这就是说,这些国家必须在世

    界制成品贸易中占有越来越大的份额。这是能够做到的;英

    国、德国和日本已先后做到了这一点,到一定时候印度和其

    他国家也将做到这一点。但是现在做起来比英国做到这一点

    的时候困难多了,因为这样做会遇到激烈的竞争。日本和德

    国都是在得到政府支持的出口运动的帮助下打入世界市场

    的,它们推行种种富于进取性的政策:把大量推销人员派到世界各地市场,提供大量信贷,降低价格,对消费者的愿望

    予以极大尊重。另一个办法是,一个国家占领世界市场可以

    不靠在销售中进行竞争,而是邀请其他国家已经有了销路的

    商人来建工厂,从这些来源来供应它们现有的市场。英国大

    约在六个世纪以前就是用这个办法开始打入世界市场的。许

    多国家已仿效英国的榜样,波多黎各邀请美国制造商取得成

    功也许是近来最引人注目的例子了。进入一处市场是那么困

    难,如果一个国家开始与已经开辟了销路的企业家合作,它

    就赢得这场战斗的一半胜利了。此外,如果工业国由于它们

    自己的商人及其资本流向国外而失去市场,它们不会像以其

    他方式失去市场时那样小题大做。往往抵制用这种方式使自

    己强大起来的是欠发达国家(见第五章第二节(三))。

    这些欠发达国家的一个困难是把它们的工资保持在使它

    们能在世界市场上进行竞争的水平。如果工业部门仅仅为国

    内市场生产,那么即使它的价格超过其他国家的价格,靠保

    护也能使这些工业维持下去,但是一个谋求在世界市场上占

    有份额的人口过剩的国家,国内的保护对它帮助不大,因为

    如果它不能以维护其国内市场的价格进行生产,它占领其他

    市场的机会就少了。这一困难是由我们已经谈到过的货币成

    本和实际成本之间的差别引起的。假设有剩余劳动力,制造

    业使用劳动力的实际成本是微不足道的,但是货币成本却很

    高。制造业的工资必须保持高过农民收入的一般水平,以便

    吸引和保持住城镇的劳动力,而城镇的生活费用也较高。除

    此之外,还有工会,工会往往是专门组织工业劳动力的,不

    断提高货币工资的水平。若保持这样高的货币工资水平,一个应当实现工北化的国家就不能这样做,因为它的生产的货币成本太高了,这种情况是经常发生的(牙买加当前的情况

    就是这样)。补救办法是对生产进行补贴,要不就使货币贬值。

    公开补贴会引起工业竞争者的不满;所以大部分工业国采取

    那种不那么明显的援助办法,如以低于商业租金的租金出租

    工厂,免税,低价供电、供水或运输,等等。往往这还不够,

    开展出口运动时可能还要像在日本那样使货币贬值。欠发达

    国家进行货币贬值的地位比发达国家优越,因为这对它们的

    贸易条件只产生微小的影响(因为用外币计算它们进口的货

    物和它们出口的初级产品的价格并不受货币贬值的影响),因

    为它们的对外债务和资产不管怎样通常是以外币计算的。使

    得货币贬值的效用比较令人怀疑的是,它对生活费用的影响

    以及从而对货币工资可能发生的影响。如果货币工资也提高

    到同样的幅度,贬值货币就没有用了。但是谈到这一点不过

    是说,除非人民愿意合作,否则一个国家解决不了它的经济

    问题。

    要打入世界市场存在着那么多的障碍,所以只有有勇气

    和决心的国家才能打入世界市场。英国在19世纪上半叶打入

    了世界市场,办法是把它的推销人员派到世界各个角落。那

    时候比现在要容易,因为英国当时没遇到比它强大得多的对

    手。跟着打入世界市场的是德国,它作了更坚决的努力,得

    到政府更加深思熟虑的帮助;这对德国更困难一些,但是它

    得到了它需要份额。日本运气不佳,在大萧条时期进入世界

    市场,当时整个世界贸易在萎缩,但是这并未妨碍它从1929

    年到1937年使它的出口额增加一倍。有些所需份额和德国一样大的国家,譬如印度和意大利,由于缺乏这种意愿,它们在世界制成品贸易中所占的份额分别从1899年的2.3%和3.7%下降到1937年2.1%和3.6%。这两个国家不能为

    它们的全体人民提供就业和充足的食品,除非它们把从事制

    造业的人口比例提高到35%左右,这一点它们又做不到,除

    非它们把制成品出口贸易运动摆在经济政策的首位。地位最

    优越的是那些拥有进行金属贸易所需的燃料和矿砂的国家,

    像印度。其它国家则处境困难,像埃及,因为它们能进行竞

    争的部门不大可能满足迅速扩大的需求。如果要让它们人口

    有工作做有饭吃,这些国家需要进行更加艰苦的斗争。毫无

    疑问,一个结果是把工业国分成两类,一类是出口金属和化

    学品的国家,另一类由于矿藏贫乏,专门出口纺织品和其他

    非金属商品或所用金属的成本与出售价格相比占很小一部分

    的商品。

    不用说,老牌工业国对这种贸易运动是愤懑的。它们攻

    击这种作法——派推销员、发放信贷、给予补贴、对进来的

    制造商采取种种有吸引力的做法,贬值货币、低工资、免税

    ——而且工业国严正指出,这种贸易运动必得有政府在后面

    支持。但是新兴的工业国有一个无可回答的辩解,因为它们

    卖多少买多少,它们用不着挤任何其他国家的市场。如果比

    较老的工业国对初级产品的额外需求要求额外供应,它们用

    其制成品交换初级产品的能力是不会受到损害的。如果世界

    初级产品的产量不能以同等的速度提高,新国家的工业化将

    给老国家带来困难。这是一个世界经济整体平衡的问题。很明显,扩大初级产品供应量的责任主要落在那些拥有资源的国家——首先在人口稀少的南北美洲、澳洲和非洲——的肩上。如果这些国家既排斥移民又不开发它们的主要资源,以致不能用世界其他地方所需的剩余资源供应它们,责任(如果有什么责任的话)将主要归咎于这些国家。

    因此,我们又回到我们前面提出过的问题——保持世界贸易的平衡取决于全世界制成品、原料和粮食的均衡增长。在1929年以前的半个世纪里,当世界制成品产量每年增长4%左右时,如果世界的原料产量每年大约增长3.5%,世界粮食产量每年增长2%,贸易条件仍将保持不变。我们不知道这种关系是否还是这样,但是没有理由说明这种关系为什么应当发生急剧的变化。增长率也许有较大的变化。实际上,欠发达国家的工业化对增长率的影响比通常所担心的要小得

    多。因此,亚洲国家工业增长率任何可以想见的变化都不能

    像美国工业增长率比较微小的变化那样对世界制成品产量的

    增长产生那么大的影响。举例来说,如果美国学会控制它的

    经济萧条,它的平均增长率随之提高对世界初级产品供应量

    造成的压力比之如果印度现在每年增长10%所造成的压力

    要大得多。同样,由于亚洲和非洲加在一起消费的粮食远远

    不到世界粮食产量的一半,这两个洲的发展要过一段很长的

    时间后才能对世界需求量产生欧洲和美洲的增长率发生比较

    小的变化时所产生的影响。除非从世界的整个供需情况来看,

    否则我们不能正确看待这些洲经济发展的影响。如果今后二

    三十年内出现初级产品短缺,那主要将是因为欧洲和美洲已

    经很大的需求量迅速扩大,而不是因为非洲或者亚洲相当小

    的需求量可能发生什么变化,无论从人口增长的角度还是从工业化的角度来说都是这样。

    当前令人非常担心的是,1929年以前达到的均衡增长现在无法恢复。有人认为,世界工业产量的平均年增长率现在可能超过4%,因为工业国控制它们的衰退,也还因为其他国

    家推进工业化。这取决于原料产量的增长,没有原料产量的

    增长,工业产量就不能增长得那样快。不过,原料生产大部

    分是在商业基础上进行的,因此除了某些矿产品短缺之外,没

    有理由说明为什么原料生产不能适应需求的增长。

    粮食生产的前景是很难预料的。到1929年为止,每年平

    均增加2%,其部分原因是由于在美洲和澳大利西亚开垦新

    土地。由于开垦新土地的速度减慢,要保持产量的这种增长

    率,将在更大的程度上取决于提高每亩地的产量。没有理由

    怀疑亚洲和非洲的亩产在二三十年内可以以适当的速率提

    高,这完全是因为当前的产量太低了,但是这些国家中的多

    数国家要达到日本曾经达到过的那种结果,在政治上和教育

    上有重大障碍,所以我们不能相信,世界粮食产量在今后二

    三十年内将以适当的速率提高。并非人人都有这样的担心。相

    反,有些人认为我们正处在新的农业革命的前夕,这一革命

    可能使世界的粮食多得无法处理。如果他们估计错了,那就

    只能依靠世界的一个地区来弥补别处的不足,那就是北美。那

    些担心世界粮食短缺的人能够举出过去20年里已经发生的

    变化。同1934—1938年相比,拉丁美洲的农产品净出口量在

    1952年下降了37%,近东和远东的农产品净出口量分别下降

    了22%和60%。其他地区的提高并没有完全弥补这些地区的

    下降。非洲的净出口量上升了19%,大洋洲上升了21%。不过,提高得最多的是美国。美国的农产品(总)出口量增加了一倍。不平衡的危险并不在于世界粮食总产量不会有适当

    增长这种可能性,而在于世界其他地方可能越来越依赖美国

    来弥补它们的不足这种可能性。如果美国的人口继续按它目

    前这样高的速度增长,它不可能永远出口粮食;但是就短时

    期来说——即今后25年或更长一点时间——美国能够填补

    世界的不足,如果它这样做有利可图的话。

    依靠美国提供粮食为什么会令人为难有两点理由:第一

    是对贸易条件的影响,第二是对美元的需求和供应的影响。这

    种依赖会使贸易条件对其他工业国十分不利。美国的巨大优

    势在于它的制造业的生产力,而不在于农业。所以,如果美

    国出口粮食,他要求买主支付的价格按制成品计算是非常高

    的。于是其他工业国发现,它们为了支付它们所需的粮食而

    不得不出口大量制成品。同时,美国也不大愿意进口制成品。

    如果美国要出口更多的粮食,它不会进口更多的制成品,相

    反必定用少出口制成品的办法来结算它的帐目。所以制成品

    在世界贸易中所占的份额将减少。因为美国的制成品在世界

    贸易中很有竞争力,要减少其份额是要经过斗争的,这场斗

    争将以美元短缺的形式出现。因此美元短缺就是一种迹象,表

    明其他国家在本应少买美国制成品,多买其他国家制成品的

    时候,试图继续购买美国的粮食和美国的制成品。

    战后的美元短缺完全是这种性质。由于第二次世界大战

    的影响使德国和日本的工业产量和欧洲和亚洲的农业产量下

    降,世界依靠美国同时提供粮食、原料和制成品的程度提高

    得多得多了。只有这种依赖减弱了,美元短缺的现象才会消失。在1939年以前,世界其他地区曾变得不依靠美国提供粮食,美国曾是一个纯粹的粮食进口国。如果世界其他地方的

    粮食产量提高得非常之快,这种情况将再度发生。但是如果

    粮食产量提高得不够快,那么与制成品相比,粮食价格将很

    高,工业国将面临一场为减少美国制成品在世界市场上所占

    的份额而进行的斗争。这场斗争激烈到什么程度,这主要取

    决于物价适应形势的速度。美元“短缺”的存在不过是表明,

    美国出口制成品索价太低,或者说它进口初级产品支付得太

    少。只要调整价格,这种短缺现象将自然而然地消失,但是

    调整价格需要时间。

    总之,要预言世界贸易将发生什么情况是不可能的。因

    为世界上有些国家粮食短缺,世界分成纯初级产品进口国和

    纯初级产品出口国这种状况必将继续下去,当有些人口过剩

    的国家(印度、意大利、中国、爪哇,也许还有苏联)发展

    起来并大规模打入市场的时候,这种状况必将加剧。当这些

    国家的工业增长时,可以预料它们对粮食和原料的需求量会

    比过去任何时候都大。决定哪些其它国家是初级产品的纯进

    口国还是纯出口国的问题,在很大程度上是相对价格和供应

    的问题。美国已反复两次(从纯出口国成为纯入口国,又翻

    回来),它倒底会停在哪一边无法肯定。我们认为世界贸易额

    当然会继续增长,至于哪些国家将在供应初级产品方面占重

    要地位,或者为了得到适当的供应必须付给什么样的价钱,这

    还是不知道。

    (二) 移居国外

    国际上移居国外的原因很多,并不全同经济增长有关。有

    些人移居是出于宗教、政治或种族原因,不是逃避在国内的

    迫害,就是本着传教热情到其他地方去传道。历史上有许多

    例子:犹太人迁离埃及、清教徒移居美洲、胡格诺派教徒迁

    离法国,等等。由于自由和宽容没有随着科学的发展或财富

    的增加而扩大,在20世纪,前半叶,由于这些原因而移居的

    人数比任何其他有记载的时间都多。在这50年间,由于共产

    主义和法西斯主义的兴起以及巴勒斯坦、印度和朝鲜的分裂,

    发生了大逃亡和大屠杀。人类在它的5000年文明史上并没有

    去掉他们的任何邪恶。

    如果我们把自己局限于经济上的原因,那么历史上几次

    规模最大的迁移仅仅是为了避免饥荒和饥饿。亚洲中部平原

    的大爆发——譬如匈奴人和蒙古人的迁移——通常归因于气

    候变化的影响,虽然实际上我们对这种事情知道得不够多,没

    有把握。除了饥饿之外,人们迁移是因为他们认为在他们要

    去的国家能够更为安全或找到更好的机会。大迁移运动始于

    19世纪中叶,到第一次世界大战之前达到高潮,当时每年有

    100多万欧洲人、中国人和印度人离开他们的国家永不再回

    来。这种运动主要基于这样的希望:大洋彼岸情况会好一些。

    不可避免的人口过剩学说把移居国外同经济增长的理论

    联系起来。根据这种学说,任何有幸找到某种提高生活水平

    的办法——如开展对外贸易的机会,某种新的农业技术如灌

    溉、良种或新的轮作——或找到降低死亡率的办法——如改善供水或公共卫生——的国家必定不可免地由于它的人口增长而使生活水平再度低下来。所以任何经历经济增长的国家

    终会“开绽”而不得不为它的人民寻觅新的土地。这种情况

    在历史上是经常发生的:老一点的例子是从公元前750年到

    550年希腊建立殖民地;而在近代从迁离爱尔兰、英国、印度、

    意大利、中国和日本的人中可以看到差不多同样的情况。自

    相矛盾的是,同样的推论可以导致这样的结论,移居国外并

    不能真正减轻人口过剩的问题。因为如果人口多到生存的极

    限,由于移居国外暂时造成的缺口很快就会再被填补起来。有

    的事例可能说明情况确实是这样。同样,正如我们已经看到

    的,爆炸性的人口增长不是不可避免的——或者说如果过去

    是不可避免的,现在再不是这样了。人类已学会像有效地控

    制死亡那样实行节制生育了,而且未来什么事情都可能发生。

    此外,正如我们也已经看到的,从负担比本国的土地能

    够养活的更多的人口这一意义来说,移居国外并不是解决人

    口过剩问题的唯一办法。另一个办法是参加对外贸易,发展

    制造业或航运业、保险业、旅游业、电影业或能用以购买粮

    食的其他外汇来源。从一国的公民在别的地方能赚较多的钱

    ——对英国的产业工人来说,移居新西兰干农活有利可图

    ——这一意义来说,这种办法也许防止不了这个国家人口过

    剩,但是从人民吃不饱(如印度和中国的当前情况)的意义

    来说,这种办法能防止人口过剩。然而,即便是这样,我们

    也说服不了那些长期停滞论者。正如我们已经看到的,他们

    争辩说,制成品出口贸易的发展只能暂时减轻人口过剩问题,

    因为必要的贸易份额保持不了;由于某些力量发挥作用,一

    个国家丧失它在市场的地位(见上面第二节(一))。所以他们认为,经济成就的一个不可避免的后果是人口过剩和移居国外。无可否认这种事情已经发生,人们只是不同意“不可

    避免”这个词。

    有时候,人口过剩的国家急于为移居国外提供方便,但

    是情况并不总是这样。有些部族把它们一些成员当作奴隶出

    卖。在其他地方如中国和印度,政府为从其他国家招募代理

    人提供方便,这些代理人按契约把劳工带走,他们差不多等

    于暂时沦为奴隶。英国鼓励本国人民移居国外,它的做法从

    17、18和19世纪流放罪犯和叛乱分子到20世纪资助移居各

    自治领。

    移居国外给人民流失的国家带来种种问题。不仅有保护

    移民不受招募代理人的欺骗、免遭乘船过于拥挤或不适于航

    运的危险、不受移居国雇主们的虐待的问题,而且还有保护

    他们不受种族和宗教迫害的问题。这些问题是够大的,不满

    情绪几度使印度政府禁止进一步移居它认为它的人民在那里

    受不公平待遇的国家。效忠问题是最困难的问题之一。有些

    接受移民的国家急于同化这些移民,以便尽可能少发生少数

    民族问题。因此这些国家在它们的学校和法庭不承认移民的

    语言,使移民的孩子尽可能像当地的其他孩子一样。这就是

    美国移民政策的基础。英国在16和17世纪对它的大陆移民

    采取同样的政策,法律规定他们收土生土长的英国人为徒,另

    方面从行政处置上不让他们抱成团或以其它方式抗拒同化。

    这些政策遭到那些喜欢在新国家保持他们自己的文化和语言

    的移民的反对,譬如中国移民就不愿意放弃他们对中国的忠诚。如果移民拒绝同化,或者如果他们迁出的国家谋求干涉它们的人民移居的主权国家的内部事务,那么因移居引起的

    政治困难的确无法解决。另一方面,如果不让移民受同化或

    他们遭到歧视,他们的祖国肯定要提出抗议,就像19世纪英

    国向中国提出抗议,20世纪印度向南非联邦提出抗议一样。

    除了这些政治困难之外,移居国外还会造成经济困难。二

    三十岁的移民所占比例最大。国家不得不负担抚养和教育他

    们的费用,待他们到了工作年龄,又失去了他们。由于青年

    人离去了,老人和受赡养的人在人口中所占的比例就会上升,

    到了工作年龄的人的负担相应地加重了。另一方面,如果移

    民汇款回来赡养他们留在国内的人,那就不存在负担的问题,

    这种汇款在人员流失的国家的国际收支中有时是一个受欢迎

    的大项目。因为男性移民多于妇女,也造成性别的不平衡。在

    20世纪20年代,由于人们大量移居国外,巴巴多斯人口中成

    年妇女几乎两倍于男人。失掉熟练人员往往也是很不情愿的,

    特别是如果担心这些人在新国家开办竞争性工业不利于母国

    的时候,许多国家,如18世纪的英国,曾为此设法阻止熟练

    的手艺工人移居国外。

    让我们转过来看看接受移民的国家的态度。它们的态度

    和人员流失的国家的态度一样是多种多样的,由经济、政治、

    种族和宗教动机的支配。

    在经济方面,几乎所有的国家都欢迎熟练移民,尤其是

    如果他们有能力开办新工业的话。新的移民如希望完全同化,

    就更受欢迎,因为大部分国家对它们自己国内的外国人集团

    有疑虑。如果移民愿把他们的技艺教给当地的学徒,也会更受欢迎。实际上,1484年制订并在1523年重申的英国立法曾禁止移民招收外籍学徒,他们自己的子女除外。如果技艺不新,特别是如果移民全都是同一行业的专门人才,困难就比

    较大。大批医生或矿工移居国外比之一群各种各样熟练工人

    移居国外可能会遇到更大的阻力。外国企业人员移居国外会

    引起同样的种种问题。许多国家坚持认为它们必须雇用本国

    人。有些国家希望把他们限于开办新工业,并制订条例不让

    他们同国内的小商人竞争。带来新工厂等新工业的企业家几

    乎肯定会受到某种有条件的欢迎,而仅仅同当地商人进行竞

    争的商人,如在西非的叙利亚人或在西印度群岛的中国杂货

    商,比较容易遇到敌意。

    不过,具有专门资格的人移居国外同大批非熟练人员移

    居国外相比是个比较小的政治问题。大批移居国外只在十分

    有限的情况下才是受欢迎的。如果一个国家空地很多,如果

    人们认为人口多一些能享受规模经济,那么大批外来移民可

    能受到欢迎;所以只要国境开放,进入美国的大门一直是开

    着的,一旦空地没有了,反对外来移民的事情就多了,直到

    阻挡不住时为止。外来移民也许由于政治原因受到欢迎,澳

    大利亚接受外来移民不是出于经济考虑,而主要是作为对付

    亚洲的防范措施。以色列不顾经济考虑而继续接受外来移民,

    因为它认为接受所有在受迫害的气氛中生活的犹太人是它的

    义务。为逃避迫害的人提供家园的愿望在好几个国家的移民

    政策中起非常大的作用,诸如英国和美国。

    就经济考虑来说,赚工资的职工与资本家和地主之间很

    可能发生冲突。如果有规模经济,各个阶级的居民一定会得益于外来移民,但是即便如此,好处可能主要为资本家和地主所得。大批外来移民可能使工资被压低,接近于人们出来

    的国家的工资水平,使房租和利润提高。地主和资本家也许

    愿意把他们的利益提高到进口奴隶(见第三章第四节(二)),

    或者从印度或中国引进契约劳工的程度。这到一定时候就会

    产生混合社会的社会问题,但是资本家和地主很少顾及这些。

    只要有大量的土地,或者只要新工业像移民到来一样快地创

    建起来,当地的农民或拿工资的职工对新来的人可能采取容

    忍态度。但是他们早晚会对大批外来移民组织抵抗,要是付

    诸表决,他们早晚会制止住外来移民。

    有时候还有一个十分容易引起争议的关于移民汇款的问

    题,如果出口赶不上国内的增长,移民汇款可能确是一个棘

    手的问题。不过,外来移民汇款在国际收支中通常是个小项

    目,只有作为反对进一步移民的大运动的一部分时,才会成

    为一个政治问题。

    一个国家多快会变得外来移民充斥,除别的因素外,这

    取决于外来移民的性别分布。如果只有男性移民,就不会有

    第二代,形不成一批当地居民。从这一意义来说,只是男性

    移居是一种浪费。譬如,数以百万计的非洲人曾被当作奴隶

    运到西印度群岛,但没有什么结果。因为没有运去足够的妇

    女,外来移民不能繁衍后代,所以逐年所需的大宗奴隶买卖

    纯粹是为了保持奴隶人口的稳定。所有的外来移民社区都是

    男性过多,一代接一代地大量浪费,除非设法使性别保持平

    衡。这就是现在有些帮助移民的国家通常都很周到地像帮助

    男人一样帮助妇女移居国外的原因。无论如何,在妇女的职业范围比过去要广泛得多的今天,妇女凭本身的能力作为有报酬的职业工人以及作为妻子和母亲而提供的服务是受到欢

    迎的。

    即便对大批外来移民采取欢迎的态度,外来移民能够被

    同化的速度也取决于许多因素。种族、宗教和文化决定他们

    被同化的速度,有些国家(如美国和澳大利亚)在决定接纳

    什么人和接纳多少人的时候很重视这些因素。在经济方面,外

    来移民需要住房、土地或工作,对他们同化的速度不能快过

    向他们提供这些条件的速度。提供这些条件需要资本。有些

    移民自带资本,或者也许可能由国家从国外借贷。如果国外

    没有资本可以利用,外来移民率则为国内储蓄率和为国际收

    支的巨额逆差所限,如果国内投资额超过国内储蓄额,这种

    逆差便会出现。即便有资金可用,物质因素也可能限制资本

    形成的速度。正如我们已经看到的(见第五章第一节),资本

    投资的50—60%为建筑业,因此投资受建筑业的能力的限

    制。当然如果对扩大建筑业多给予照顾和考虑,那么这件事

    情始终是可能的,但是仅仅由于未保证建筑业能应付要求它

    做的工作,投资计划遭受挫折的现象出现得多么频繁,这是

    令人惊讶的。只要记住这些财力和物力方面的限制,那么哪

    怕是过去一个世纪规模最大的移民,也很少一年超过接受人

    口的1—2%,就不足为奇了。

    外来移民在他们初来的时候通常有一段艰难的时期,总

    有一部分人回国去。外来移民定居的意愿在某种程度上要看

    为接待他们所作的准备工作怎样。他们看到等待他们的是住

    房呢,还是被安置在营房或帐篷里,还是让他们自谋生路?他们一到来就为他们找好了职业呢,还是不得不在大街上闲逛,把他们一点可怜的积蓄花光?要是期望他们在土地上劳动,土地是准备好了呢,还是他们不得不自己去披荆斩棘?能不能

    进得去,附近有没有水源,还是他们必须自己修路和自己打

    井?在第一次作物收获之前,他们怎么生活,怎么弄钱去买

    肥料、买牲口,是否有别的资金?事实证明,要人们在土地

    上定居的人显得特别困难。有些国家的政府已答应花大笔的

    钱整理好土地,并且借给定居的人很大数目的款项作建房之

    用和作劳动的资本。另一种办法是,譬如在苏门答腊,外来

    定居的移民头一季度是同别的农民一起住,干活挣工资,以

    便对这个国家有些了解,积攒些钱,还可交些朋友。这样做

    已证明很方便。因为移民中仅有一小部人是熟练农民,正如

    吉本·韦克菲尔德所说的,在他们担起经营他们自己的农场

    的责任之前,他们首先要觅得职业,别管是在城镇还是在农

    场,这也许是非常可取的一种办法。

    当国际移居把具有不同种族、宗教或文化的两个民族集

    聚在一起的时候,产生的问题最大。在过去,移居国外的作

    用常常是把本国的土著居民全部或部分地消灭掉。单是这些

    新来的人带来的奇怪的病症就时常使土著居民大量死亡,他

    们的体内对这些疾病没有产生抵抗力——虽然也有截然相反

    的情况,就像西非沿海各国人民因为有采采蝇而免遭来自北

    方的入侵一样,采采蝇曾使穆斯林的马匹死掉,因为有蚊虫

    而免除来自海上的移民,蚊虫曾使欧洲人死于疟疾和黄热病。

    除了疾病以外,土著居民可能由于遭受奴役、被赶出他们的

    土地或他们遭到的其他待遇而被消灭——就像凯尔特人在盎格鲁—撒克逊人之前衰落,霍屯督人在祖卢人之前衰落,红种印地安人在美国人之前衰落,毛利人在新西兰人之前衰落

    一样。在很大程度上取决于被入侵者的文化同入侵者的文化

    相比多么强大。有时候是被征服者同化他们的征服者,如伊

    斯兰教徒同化了土耳其人,中国人同化了蒙古人。

    如果同一个国家有两种文化,两种文化具有平等的竞争

    力是很少见的。犹太人和阿拉怕人、马来人和华人、印度人

    和非洲人、希尔人和英格兰人、印度人和缅甸人、英裔加拿

    大人和法裔加拿大人、伊博人和穆斯林——这种格局反复出

    现。这些差别有时候被归因于种族,如果是从生物学意义上

    谈种族,这似乎没有多大道理,因为我们对种族生物学知道

    得多么少啊。这些差别还常常被归因于宗教,但是我们已经

    看到这同样是难以置信的(第三章第四节(一))。(毕竟布尔

    人是加尔文派教徒,过去常有一种理论,认为加尔文主义是

    最可能鼓动生气勃勃的生意经的宗教。)从外来移民的心理状

    态中找到主要原因的可能性要大得多。首先外来移民是一个

    有选择性的集团:他们是为了改善自身的处境而移居国外的,

    他们就是这么一类人。移居国外本身会磨炼他们的智慧,使

    他们接触新的环境,提高他们进行批判的才能(批评一切看

    不惯的东西几乎是每个外来移民的第一个反应)。他们自然瞧

    不起当地人,希望表现他们会一样能干或干得更好。在某些

    情况下,外来移民社会的成员还特意互相帮助、互相找职业

    或互相借钱;结果是这种社区作为一个整体比当地的社区繁

    荣,它并不那么特别为自己保留机会。在移居国外从记忆中

    消失以后,这些态度就发生变化,到第三代或第四代,可能很难区分移民和早先的血统了(如在斯里兰卡的印度人),如果另一个种族的成员开始到来,可能轮到他们把他们的前辈

    当作一伙游手好闲的人而瞧不起。

    如果两个种族的成员共同生活在一个国家而没有磨擦,

    种族必定不是一个具有经济意义的因素。这就是说,在一切

    社会阶级、在一切收入水平、在一切职业中都必须有这两个

    种族的成员,他们的竞争力必须是平等的。这首先是个教育

    问题,在教育他们的孩子方面必须对每个人花同样多的钱,如

    有可能上同样的学校。其次,还有土地所有权,有些移民社

    区有专门经营并“垄断”零售业的趋势;相对的城市化程度

    等问题。如果这些种族在这些事情上一开始就不平等——譬

    如外来移民的文化程度比本地人高,或者他们做生意的经验

    多得多——那么只有对外来移民课以重税以支付教育经费和

    采取其他使两个种族平等的政策的费用,才能达到平等。事

    实上,在平等条件下共同生活要求某种程度的容忍,而这是

    罕见的,除非硬要他们这样做。最有成就的帝国政权——罗

    马帝国、奥匈帝国、奥斯曼帝国和大英帝国——的伟大德政

    就是它们有能力让不同种族的成员在最少磨擦的情况下一起

    生活。它们的秘诀往往是态度公正,要让每个人都忙他自己

    的事情,使他们和睦相处这种开明愿望来冲淡帝国种族对少

    数民族的蔑视。

    另一方面,只要政府掌握在帝国种族的少数几个成员手

    中,而这些成员自己又设法在同人数多得多的本地人的竞争

    中谋生,这种帝国政权就会被认为是最恶劣的政权。于是就

    会情不自禁地要把本地人赶出他们的土地,以便为帝国定居者让路;强迫他们不是以奴隶的身份就是在重税或其他经济力量的逼迫下到矿山、种植园或主人家中干活;建立就业的

    种族壁垒,以便保证把最有利可图的工作和行业保留给帝国

    种族的成员。哪一个种族要统治另一个种族都是不合适的,因

    为它自己的经济利益使它不可能公正无私。

    19世纪欧洲各国人民向美洲和澳大利西亚的大迁移并

    没有尖锐地引起这些问题,因为这些大陆上的土著种族对空

    空荡荡的空间来说人数不多,而且太弱,难于发动有力的抵

    抗。欧洲人移居亚洲和非洲,或者日本人、印度人和中国人

    移居其他亚洲国家,或者移居非洲、澳洲或美洲则是另外一

    种情况。如果今天用世界观点来看问题,那么印度人、爪哇

    人、中国人和日本人移居印度尼西亚群岛、非洲、澳洲和美

    洲显然是最有必要的。不过,世界观点之类的事情是不存在

    的。这些接受移民的国家哪一个也不欢迎这样的移民,因为

    它会引起种族问题。此外,在美洲和澳洲,如果真的大规模

    地接受移民,那会使已经在那里的人的生活水平大大下降。欧

    洲人有时候提出的一种口实是,印度人和中国人没有权利繁

    殖得那样快,没有权利指望别的国家承担他们没有远见的生

    儿育女的后果。但是,事实上,美洲和澳洲的人口自然增长

    率要高过印度或中国,即便是印度人和中国人的出生率为

    10D,还是同样会以种族的和经济的理由不允许他们大规模

    移居。

    这个问题将来会怎样发展,现在还很难说。感到自己生

    活空间狭窄的各国人民一直在采取行动,力图征服那些拥有

    他们垂涎的土地的人。日本为此目的已经发动了两次侵略战争,没有明显的理由说明印度和中国有朝一日不会做同样的事情。要是能够认为经济的增长必定是一个和谐的进程,使

    人类比较容易在没有摩擦的情况下共同生活,这样当然让人

    高兴,但是情况绝不是这样。恰恰相反,许多不同的学派一

    直在争辩说,经济的发展将不可避免地产生帝国主义和爆发

    战争,现在我们来论述这个问题。

    (三) 帝国主义

    产生帝国主义并非完全由于经济方面的原因,但是即便

    是政治方面的原因同经济增长的阶段也不是完全无关。我们

    首先考察一下所谓的经济原因,然后看一看政治原因,随后

    转到帝国主义对臣民和帝国的影响方面来。这是一个庞大的

    问题,仅在边沿上涉及经济分析,我们只能很简要地谈一谈

    这个问题。

    首先,有些国家被推向帝国主义和战争,因为它们想要

    更多的或更好的土地,好在这些土地上安置它们的人民。我

    们已经看到,这可能是经济增长的后果之一。经济增长的第

    一个后果是人口开始增长,人口的增长十分可能超过国家养

    活他们的能力。所以,供选择的解决办法就是移民,或者发

    展制成品出口贸易或向某些其他国家征收贡税,这三种办法

    中无论哪一种都可能导致战争。

    移民可能导致战争,因为其他国家拒绝接纳外来移民,或

    者因为别的国家虐待移民,或者因为移民想夺取当地人的财

    产,把他们从自己的土地上赶走,或者剥夺他们的政治权力,

    或者甚至把他们统统消灭。夺取弱小民族的土地是经济上比较强大的民族用以解决它们人口问题的最喜欢用的办法。纳贡是一种与此有关的办法,这种办法也有多种形式。消灭被

    征服的人民并不总是有利的。可以让他们当奴隶,可以把他

    们当作农奴或奴隶在矿山或种植园里为他们的征服者干活。

    可以使他们变成他们自己的土地的佃农,要他们交纳相当于

    其产品的50%或者还要多的地租和赋税。人类剥削同胞的欲

    望实际上是没有限度的。

    既有这种剥削的欲望,帝国主义显然不一定是经济需要

    产生的。驱使一个国家征服另一个国家的原因可能是人口的

    增长和对饥荒的恐惧,但是也可能不是。进攻者同样很可能

    是人口并不怎么多的民族,期望人们像奶牛产奶那样为他们

    劳动。同样,进攻欠发达国家的也并不总是较为发达的国家。

    妒忌心驱使不开化的人去掠夺一个富裕而和平的文明国家同

    样是很可能的。公元前约4000年,当时伟大的城市文明已经

    开创,欧亚大陆从那时以来的历史表明,骑马的游牧民族时

    常从草原大举出动掠夺较为富庶的农业居民。游牧民这种定

    期的进攻直到近代才结束,当时由于技术的发展,城市文明

    具有决定性的军事优势。类似的紧张局面在非洲、在苏丹西

    部一直延续到19世纪末。如果经济增长诱使一个民族以牺牲

    别的民族的利益来施展它的实力,那么它往往也同样使爱好

    和平的民族面临其他情不自禁地要掠夺他人财富的民族的威

    胁。

    除了移民和纳贡之外,解决人口过剩的第三个办法是发

    展制成品对外贸易,专门从事运输业,或以其他形式出口劳

    务。在一个开明的世界里,这样做不会发生战争,但是我们生活的世界不是一个开明的世界。其他国家也许不想购买制成品,也许执意保护它们自己的海运业,所以可能发动战争

    来迫使不开明的国家开放贸易。这在16和17世纪曾是欧洲

    国家在拉丁美洲同西班牙打仗的一个借口。这种借口在19世

    纪曾支配欧洲、中国和日本之间的关系,也是欧洲国家要在

    非洲占一席之地的理由。发动一场“开明的”战争可能是为

    了开辟贸易,而发动一场“不开明的”战争则是为了确保贸

    易的某些特殊优惠。帝国的作用之一就是迫使臣属的民族用

    高价购买帝国的产品,以低于他们在别的地方可能得到的价

    格把他们的产品出售给宗主国。大英帝国从1846年到1919

    年放弃了这种做法,但是它这样做是非常特别的。不得不靠

    海运业或靠出口制成品为生的国家,几乎无一不是推向战争,

    不论是“开明”战争还是“不开明”战争。最近的例子就是

    德国和日本;毫无疑问以后还会有更多这样的例子,除非世

    界能够创建消除战争的新的政治制度。

    开拓市场、追逐外国货币和寻觅粮食与原料来源是同一

    现象的各个方面。切不可将这一点与下面这种论点混淆起来,

    那就是一个从事制造业的国家因为它消费不掉它自己的产

    品,必须到国外找出路。我们必须把下面两种出口区别开来,

    一种出口是为了带动进口,另一种出口是为了维持消费和生

    产之间的差距。一个从事制造业的国家为了能进口粮食,可

    能为制成品找出路。如果这个国家的人口比其国土能够养活

    的人口还要多,这种情况实际上是难于避免的。或者说它可

    能谋求出口,因为它是个小国,无法享有大规模生产的经济,

    除非它专门从事几个行业,每个行业生产的产品都多于它国内的需要量,把多余的产品出口。这些出口商品还要以进口品多少为度,因为进口品可能同样是制成品或初级产品。一

    切经营制造业的小国(如荷兰和瑞典)都是因为这个道理才

    出口的。这也是从事制造业的国家本身又是制成品大进口国

    的原因;譬如荷兰和瑞典,粮食能自给自足,出口制成品是

    为了交换其他制成品和原料。所有这一切同因为国内市场存

    在着消费需求量的净亏现象而出口制成品完全是两码事。如

    果存在着这种净亏现象,就无法承受同出口商品等值的进口

    商品。

    认为先进的工业国因为国内需求量的净亏而不得不输出

    资本的论点,又使我们回到我们在第五章第三节(四)探讨

    过的长期性经济停滞的命题。如果储蓄额比消费增长得快,如

    果投资主要受消费的制约,国内可利用的投资机会可能不足

    以吸收一切可利用的储蓄,或者至少吸收被认为是合情合理

    的资本回收率的储蓄。正如我们已经看到的,大部分经济学

    家期望到经济发展的“较后期”阶段,由于资本的积累资本

    的利润率会下降。我们还看到,如果新的发明以适当的速度

    源源不断地出现,在这一进程中没有不可避免的事情,因为

    这将保持对资本的需求量。在经济发展方兴未艾的时候,投

    资率并非不可避免地要下降。另一方面,我们还看到有许多

    理由说明有些外国投资可能证明是有利可图的(第五章第二

    节(三)),也有许多理由说明国际贸易方面的领先地位为什

    么从一国转到另一国(本章第二节(一))。因此,虽然比较

    发达的经济允现在欠发达国家进行一些投资并非一定有利可

    图,但是它们进行投资是并不奇怪的。

    不能由此认为,因为一个国家想进行对外投资,它就必

    须实行帝国主义和发动战争。事实上,大部分对外投资并不

    是投在殖民地;美国、加拿大、澳大利亚和阿根廷都是最大

    的借款国——在任何情况下,它们的政府都是独立自主的。外

    国投资不一定挑起战争,但是如果外国人希望在那里投资的

    国家不肯为此给予特许权,或在放款国之间有所歧视,或者

    试图拒绝履行义务,就可能挑起战争。任何这样的行动都可

    能导致一场“开明”战争,目的是维护门户开放、待遇均等

    和履行契约。欠发达国家十分容易发现自己卷入了这种战争,

    因为它们对外国人常有怀疑,或者不肯给予特许权,或者不

    严格履行它们的义务;埃及或许是个典型的例子。观点、文

    化和法律制度相类似的两个国家之间的放款不一定导致战

    争,而先进工业国的资本家们几乎不可避免地会对欠发达国

    家的关税和制度失去耐心,从而不在这种国家投资,要不就

    是想使它们受帝国的统治。同样可能发生“不开明”战争,在

    这种战争中,一国试图为本国的投资者取得特殊的有利条件,

    不是把其他外国人排除在外,就是牺牲当地人民的利益。帝

    国的有利条件之一就是能采取措施保证为矿山和种植园提供

    充足的劳动力,保证在外国资本最需要公路和港口的地方修

    建公路和海港,等等。许多强国总是情不自禁地利用弱小国

    家的人民。

    因此,出现帝国主义和爆发战争有许许多多经济上的理

    由,从“需要”——饥荒,需要土地、市场和初级产品——

    到“贪婪”——妒忌,渴望剥削或寻求更加有利可图的出路。

    那些认为经济原因是爆发战争的主要原因的人提出的解决办法同这些原因是一致的。因此,“开明的”看法认为,如果一切国家都采取自由贸易和门户开放,战争的危险就会消失;当

    然,这样一来,保持帝国也就不是那么有利可图了,因为这

    样一来,人们用不给其它外国人移民、进行贸易或投资机会

    的办法就不能得到好处,并且没有必要为了防止自己被别人

    排除在外,而去获得殖民地了;但是谁能肯定其他人都坚持

    门户开放呢?于是就有了被统治者和统治者之间的关系问题;

    只要形形色色的剥削是可能的,有些国家就想要统治别的国

    家。所以有一派意见希望减少爆发战争的危险,办法是让一

    切帝国都受国际监督,甚至把一切殖民地都转为国际托管。又

    是显而易见的是,如果要求一切帝国花很多钱来开发它们的

    殖民地而无利可得,帝国主义就不会那么盛行了。所以有一

    派意见认为,消除战争的唯一途径是使欠发达国家迅速发展

    起来,这样它们就不再软弱可欺,不再受剥削。还有一点也

    是无可怀疑的,那就是如果弱国成了强国,强国就不会那么

    情不自禁地去进攻弱国了。于是就有了现在为列宁主义者所

    采纳的霍布森观点,认为战争起因于外国投资,外国投资起

    因于国内的利润率不断下降,而利润率下降又起因于消费不

    足。如果在资本主义范畴内,这可以用通过税收结构提高消

    费的办法,或者用增加政府开支的办法来解决;如果是在社

    会主义范畴内,既可以用同样的办法,也可以用使投资率同

    消费水平脱钩的办法来解决。社会主义对于防止战争既不是

    一个必不可少的条件,也不是一个充足的条件。如果战争是

    由于人口过剩,由于需要粮食和原料,或者由于渴望剥削其

    他种族而爆发的,所有这些原因在社会主义社会可能像在资本主义社会一样地起作用;斯巴达就原来斯巴达人之间的关系来说曾是一个近似共产主义的社会。

    毫无疑问,发生战争的有些原因是经济原因,针对这些

    原因而采取的行动会消弭战争。但是单用经济政策并不能消

    除战争,因为战争就其根源来说不完全是,甚至主要不是经

    济方面的。亚历山大并没有征服东方,凯撒也没有征服西方,

    因为这些先生们主要是从贸易、投资或土地方面来思考问题

    的。经济因素在发动战争方面起了什么作用是很难估计的。如

    果我们把历史上所有的战争列出单子,就会看到其中大多数

    战争同市场或者同人口的压力没有什么关系;这些战争就其

    根源来说主要是王朝战争、宗教战争或意识形态战争,要不

    就是由军事冒险或纯粹为了建立帝国的愿望而鼓动起来的。

    即使这些战争也有经济因素,但是经济因素很少是占支配地

    位的因素。如果取得经济成就以后产生了建立伟大帝国的愿

    望,经济增长可能就起作用了。如果一个国家在经济上有所

    成就,比其他国家富有,它在经济上的优势可能使它产生成

    为政治大国的念头,这种念头会使它走上军事道路。但是这

    种情况并非总是这样。在历史上富国往往是和平的贸易国,比

    较贫穷但军国主义色彩比较浓厚的国家忌妒它们过奢侈生

    活,于是就向它们发动进攻。

    是什么原因使一个国家以崇尚武力为荣,这是全人类没

    有解开的谜之一。阶级的结构稍稍有助于说明这个问题,因

    为这种国家通常是受一个贵族军事特权阶级统治的,这个阶

    级使一切其他阶级——包括各商人阶级,这些阶级从整体来

    说惧怕战争并反对军国主义分子——处于相对的被统治地位。总有一些企业家赞成战争——军火或军队其他供应品的制造商以及其他希望在征服之后取得特许权或在战争中发财

    的人——但是这些人同其他企业家相比通常是少数,其他企

    业家懂得战争会增加税收,打断他们同国外商界朋友的关系,

    而且会给军事贵族以凌驾一切的权力,企业界整个来说并不

    信任军事贵族。由企业家统治的社会发动战争的愿望比由军

    事特权阶级统治的社会低得多。不过,驱使一个国家发动战

    争的并不总是军事特权阶级。偶尔也有对权力和荣誉以及帝

    国梦寐以求的大军事冒险家——诸如亚历山大王朝和苏莱曼

    王朝的王子们,或者墨索里尼和拿破仑等新贵。但是如果我

    们要深究为什么有些国家不沉迷于军事,而另一些国家却在

    军事特权阶级的统治下进行军事冒险,我们不得不承认,对

    这个问题,我们还没有找到完全令人满意的答案。

    如果在荣誉梦和经济发展阶段之间有什么联系的话,人

    们发现那是在经济增长的“中期”阶段。最富的国家往往是

    爱好和平的,享受它们已有的一切,不妒忌任何国家;最穷

    的国家太死气沉沉,一盘散沙无法发动战争。正是那种胜于

    其邻国一筹的富于进取性的国家,才时常产生进行侵略性的

    愿望,希望为自己争得显要的地位。同比较老的和比较富有

    的国家进行争夺市场和原料的日益剧烈的竞争,可能把它们

    引向同一个方向。对世界和平具有危险性的国家经常是那些

    认为自己前途似锦的国家,而不是那些能以光辉历史为荣的

    国家。因此,世界上的军事领先地位也像国际贸易方面的领

    先地位一样,可能因为同样的理由从一个国家转移到另一个

    国家(见本章第二节(一))。

    分析所有的战争起因不属本书论述的范围。我们的目的

    是很有限的,只想说明经济增长和战争的联系。因为战争的

    根源不完全是,或者甚至主要不是经济的,从经济方面分析

    弄不大清楚引起战争的根本原因。对战争的解释是心理学、外

    交、法学、宗教和人类学学者们的问题,而不是经济学家的

    问题。

    我们从帝国主义的起因经过谈谈它对经济的影响。帝国

    主义对于被统治人民的影响,按他们所受的待遇来说,从一

    个极端到另一个极端各有不同。一个极端是他们可能统统被

    消灭。另一个极端是他们可能在经济上和文化上取得比他们

    在历史上的任何时候都更为迅速的进步。甚至同一个帝国可

    能用不同的方式对待不同的人民;英国人在中部非洲在就业

    方面实行严格的肤色障碍,而他们在西部非洲则奉行同非洲

    人几乎完全社会平等的政策。最好的帝国大大增进了人们的

    幸福;它们在广大地区建立了和平、修建了公路、改善了公

    共卫生、鼓励了发展贸易、带来了完善的法制、推广了新的

    技术知识,等等。而最坏的帝国却带来掠夺、屠杀和奴役。

    对帝国的影响还取决于它如何作为。一切帝国都必须承

    担帝国的代价。有些帝国得大于失,但另一些帝国到一定时

    候被它们本身的帝国主义所毁掉。

    帝国要付出许多代价。有它应付的发动战争的直接代价。

    必须征召和供应军队,即使有大量征召的殖民地部队,战争

    对宗主国的资源仍是沉重的负担。和平时期也必需维持大量

    军队,守卫帝国,帝国越大,消耗于这方面的宗主国人力越

    多。帝国还必须得到治理,这可能要占用它一些最优秀的人才。总是不由自主地派出第二等人才去统治帝国,但是如果这样办了,这个帝国就可能垮下来。另一方面,如果派出最

    优秀的人才,宗主帝国的事务就可能因此遭受损失。一方面

    宗主国的第二等人才在帝国称王称霸,另一方面殖民地的头

    等人才在宗主国得以发迹,这种情况在一些帝国中并非不常

    见。帝国还有助于维护特权制度;士兵在一个帝国里十分重

    要,军事特权阶级享有一种威望,这种威望是为了履行其职

    责才保持的。那样多的最大的帝国(如罗马帝国和奥斯曼帝

    国)都是在它们的士兵的摆布下灭亡的,这并非出于偶然。

    经济的增长使得有可能进行比过去任何时候规模更大,

    代价更高的战争。在原始社会,单是为了提供粮食就需要

    70%或更多的人口从事农业,能够参加军队的人数很少。打

    仗局限于从收获到播种的时期。要不就是军队在很大程度上

    要靠它在战役中能够掠夺的粮食。要是用20%的人口就能提

    供足够的粮食,那就不一样了;那时军队就能大量增加,能

    从国内的基地得到粮食供应。同时可以有更多的人来制造武

    器,科学的发展使得这些武器越发令人恐惧。因此战争对原

    始国家人民的生活影响不大,而在经济高度发达的国家,战

    争可能消耗掉50%或更多的资源。

    有时有人认为,战争刺激经济增长。在有限的限度上情

    况可能如此。战争可能产生某些有益的发明,但是根据内夫

    教授的研究,由于战争而产生的有益的发明的数量是非常非

    常少的。战争可能促进工业的发展,工业的发展在任何情况

    下都是可取的——如举英国为例,在对拿破仑作战期间,促

    进了钢铁工业的发展,在第一次世界大战结束以后,促进了化学工业的发展,在第二次世界大战中,促进了电子技术和喷气推进的发展;但是战争往往也同样造成专门供应战争的

    工业部门的过度发展和持续几年的失业。战争还使企业家能

    因通货膨胀而获得利润,其中有些用于固定资本形成,但是

    战争对资本形成的净影响通常是使资本形成在战争期间减

    少。还有对外投资和黄金的损失,不得不用它们从中立国购

    买供应品。财产遭到破坏并不总像可能预计的损失那样大;因

    为财产不管怎样总是要折旧的,或早或晚总得更新,所以主

    要的代价是那种加速折旧的财产。如果在战争期间能够利用

    闲散资源或在战后补偿折旧,战争的代价也不像想象的那样

    大。美国就是在这方面的一个突出的例子;第二次世界大战

    结束了历时10年的停滞局面,产出增加得那样快,以致能打

    这场战争而不降低老百姓的生活水平。另一方面,即便不爆

    发战争,美国的经济大概迟早也会复苏,因为美国住房和其

    他资本的折旧或早或晚会引起新的投资景气。打一场战争可

    能是为了得到市场,但是,同样可能导致失去市场。从两次

    世界大战中,得到市场的主要是美国,它在第一次大战期间

    额外得到了世界制成品贸易额的8%,在第二次大战期间额

    外得到了9%,持久地保持了它的收益。最后,由于在战场上

    损失了年轻一代中的一些最优秀的人才,经济也可能受到损

    失。法国人就是这样解释他们在两次世界大战之间在政治和

    经济上缺乏活力的,这可能有些道理。

    战争的经济代价无疑是很高的。为补偿这些代价,可能

    要用从征服当中获得的任何好处。当代的反战宣传认为这些

    是无足轻重的,但是并非总是这样。征服者可以得到富饶的土地,或者奴隶,或者受益匪浅的通商特权。即使他们不过在先前一片混乱的地方恢复秩序,他们和任何其他人也能从

    随之而来的贸易发展中得到利益,他们所得利益要比战争的

    代价多得多。近乎势均力敌的双方之间在集权主义基础上所

    打的现代战争,其代价肯定比每一方所得的利益都大,但是

    并非打所有的战争都要付出这样大的代价,或者都是这样一

    无所获。富有进取精神的国家打一场短促的速决战(1870年

    的德国,1898年的美国,1894年的日本),可能干出看来是

    用相当少的代价取得重大收获的事情。

    最后,那些挥舞战刀的人终将死在战刀之下。实行帝国

    主义可能在两三个世纪或更多的时间内使你在奴隶、贡赋或

    贸易方面得到很大的利益,但是它将为自己带来复仇者。在

    帝国内部,被统治的各国人民迟早要起来反抗——如果他们

    受到的待遇好一点,起来反抗就更早,因为那时他们在经济

    和文化方面会大大受益,并且会更快地对他们所处劣等地位

    感到不满。在最开明的帝国内,劣等地位多少消失一些,人

    们会看到来自远方属国的人在宗主国一些最高的职位上任

    职,但是即使这样也从来不足以把一个帝国的各族人民团结

    在一起;地方民族主义的离心力总是要把帝国弄得四分五裂。

    然后长期来习惯于以行政管理、商业、旅游业和宗主国生活

    中其他职业谋生的宗主国各族人民,发现很难使自己适应一

    个工农业的新世界。或者,甚至在附属国人民脱离之前,帝

    国可能已被外部敌人毁灭了。帝国愈大、愈富裕,一无所有

    的国家对它愈妒忌。它们联合起来对付它,从各个方面把它

    围困起来。帝国的防务费用越来越增加。帝国的战争次数越来越多,到头来一无所获,因为战争纯粹是防御性战争,即便取得胜利,也得不到新的土地或特权来抵销战争的代价。帝

    国的人民会失去信心,甚至会对他们自己有没有权利统治这

    么辽阔的一片地区提出疑问。这时帝国由于屈服于内外压力

    而解体就只是个时间的问题了。

    有些人怀疑一个帝国在经济上是纯受益者,他们有时也

    认为最幸福和最繁荣的国家是那些背后有帝国作后盾的国

    家。它们是幸福的,因为它们有过去的荣誉可以回忆,知道

    这比在展望光荣的未来时感到心恢意冷要好一些。但是它们

    不一定更加繁荣。瑞典是繁荣的,西班牙则不是。土耳其在

    失去它的帝国并开始照顾它自己的事务的时候,它得到了新

    的生机。荷兰是加入前帝国行列最晚的一个国家,谁能够说

    它将枯萎下去呢,还是将在经验中找到新的活力呢?

    第七章 政府

    政府的行为同企业家、父母、科学家或牧师的行为一样,

    在促进或阻碍经济活动方面起着重要的作用。但是,由于政

    治偏见,要对此得出一个正确的看法则比较困难。一方面,有

    人不相信个人的主动性,一味夸大政府的作用。另一方面,有

    人不相信政府,一味夸大个人主动性的作用。双方都可以引

    经据典。如果没有高瞻远瞩的政府的积极推动,没有一个国

    家能够在经济上取得进展,尤其是英国,它成为一个伟大工

    业国的基础是由自爱德华三世起的一批高瞻远瞩的统治者奠

    定的;美国也是一样,它的政府,不管是州政府还是联邦政

    府,在组织经济活动方面始终起着巨大的作用。另一方面,说

    明政府干预经济生活造成不良后果的例子很多,因此很容易

    提出种种警告要人们提防政府参与经济生活。聪明人不会去

    争辩取得经济进展是由于政府进行活动的缘故还是个人发挥

    主动性的缘故;他们知道,这是由于两个方面的缘故,他们

    只想提出这样的问题:两者作出什么样的贡献才是适当的贡

    献。

    政府可能会由于做得太少或做得太多而遭到失败。本章

    的前两节考虑的是政府能做些什么有益的事情来促进经济发

    展。最后一节谈的是政府行为不当如何妨碍增长或者带来停

    滞和衰退。

    第一节 企业的体制

    在本节中,我们谈的是政府和整个经济之间的关系。下

    节具体谈到公共经济部门;因此,本节比较侧重谈与私营部

    门的关系。

    (一) 政府的职能

    政府在许多方面的活动是同经济增长有关的。我们认为,

    政府的九种职能如下:维持公共事业、影响态度、确定经济

    制度、影响资源使用、影响收入分配、控制货币数量、控制

    波动、保证充分就业和影响投资水平。在前面几章中,当我

    们在比政府活动广泛得多的范围内谈及这些问题时,我们已

    经谈到过这些问题了。因此,在下面几段中,我们只需对有

    关问题作一总结。

    第一,公共事业。政府的主要职能是维护法律和秩序。除

    此之外,随着时间的推移,又增加了其他公用事业——公路、

    学校、公共卫生、调查、研究等等,项目还在不断增多。与

    这些对内职能并列的是政府与其他国家政府关系中的对外职

    能——保护公民、缔结条约、宣布战争等等。关于公共事业,

    无需说得很多,因为在本章的下一节中将谈及这些问题,在

    本节中,我们只谈政府和私营经济部门之间的关系。

    第二,态度——对工作、节约、家庭规模、外国商人、收

    入差别、等级制度、社会流动、赚钱、视牛为神物的现象和

    新技术的态度。我们已多次看到,经济增长在多么大的程度上取决于社会采取一种有利于经济增长的态度,而不是采取一种不利于经济增长的态度。政府在决定这种态度方面起着

    重大的作用。诚然,政府受到舆论的限制;它们不能远远走

    在舆论之前。也不能远远落在舆论之后。但是,同样正确的

    是,它们对舆论有导向作用。著名官场人物的言论和文章,加

    上立法机构采取某种行动或拒绝采取某种行动的决定,是造

    舆论过程的一部分。某些国家的政府与别的国家政府相比在

    制造舆论或违背舆论方面的活动余地大一些,其原因是它们

    的人民或者对它们更为信任,或是对它们更为害怕。

    在这种情况下,政府行使领导职能。它们与社会上的其

    他许多人——牧师、报纸主编、工会领袖、教师及其他讲话

    有份量的所有人——共同行使这种职能。在稳定的社会中,政

    府干预的事情极少:它愿意让牧师去对出生率发表意见,或

    者让科学家去对人造肥料发表意见,但是在迅速转变的社会

    中,政府对任何事情都不能掉以轻心。由停滞走向经济增长

    的社会在生活的各个方面——宗教、阶级关系、伦理、家庭

    生活等等——都会出现紧张,因此政府领导人对各种问题,即

    使不去规定法规,也得经常发表看法,而在比较稳定的社会

    中,政治家们愿意把这类问题交给其他机构去处理。也正是

    由于这个原因,在一次革命(不管是暴力革命还是和平革

    命)以后,新政府通常随即在生活的大多数方面——教会、报

    纸、法律、专业、军队、银行、大学、工业等等——将旧领

    导人撤换,而代之以政见相同的新人,因为只有这样,政治

    家们才能放心地去再次只管理他们“正常的”事务,因为他

    们知道,在其他方面,会朝着他们所赞成的方向引导舆论。革命者如果不把革命扩展到每一个主要的社会机构,就休想达到他们的目标或者保住政权。

    下面谈谈经济制度。每一个政府都必须表明对这样一些

    问题的态度,即它赞成大规模还是小规模企业、竞争还是垄

    断、私人企业、合作社还是公营企业,以及它的态度靠法律

    还是靠行政行动来支持。它还必须使法律条文既公平,又富

    有鼓励性。因此,法令全书载有有关合同、土地所有权、公

    司、合伙、合作社、工会、垄断及家庭财产的详细法律。还

    有一套行政机构来管理或帮助(以资金或咨询来帮胁)私人

    机构:反托拉斯机构、合作部门、农业推广机构、政府信贷

    机构等等。在所有这些问题上,尚未出现经济增长的国家的

    法律和惯例往往不适合于经济增长。因此,在经济发展的初

    期,花许多时间来为经济增长创造比较合适的新的法律和行

    政机构是大有裨益的。

    需要由政府来影响资源的使用,因为决定资源使用的主

    要因素价格机制所产生的结果并不总是为社会所接受。我们

    已经碰到过好几个这样的例子。例如,保护资源的问题(第

    三章第三节(三)和第六章第一节(二));个人使用土壤、水、

    森林或矿藏地层的方式可能被认为过于浪费,或者政府希望

    开发某些基本资源——例如,整个江河流域——的方式可能

    需要它在整个地区对土地的使用加以控制。与此有关的是通

    过区域划分活动控制土地使用的整个问题;如果要使城镇象

    样地发展,使工作区、住宅区和文娱区适当分开,这在城镇

    中尤其重要;但是,在乡村,也需要在某种程度上划分区域,

    以防非农业活动侵占过多的肥沃土地;还需要对工业的地点有所控制,以防过于集中、过于分散和出现萧条地区(第二章第二节(二)和第四章第一节(三))。还有普遍存在的过

    分专业化的问题,从而使得限制某些活动(例如对有成为单

    一经营危险的出口作物征税或对公路运输颁发许可证)或以

    保护、补贴等方法来鼓励另一些活动(例如工业化)看来可

    能是可取的。有些国家的政府为了改变消费格局还直接控制

    资源,例如它们限制生产或进口奢侈品或者它们对生产牛奶

    进行补贴,而另一些国家的政府则通过影响收入分配来间接

    影响消费。

    收入分配使欠发达国家遇到的问题特别困难,因为它们

    希望既要做到平等,又要富有刺激性和实行高度节约。经济

    增长要求对有技能、从事艰苦劳动、受过教育、承担风险和

    愿意负责的人的报酬有适当的差别。经济增长还要求在增加

    的国民收入中,应有适当的部分作为储蓄,而不是落入那些

    把收入用于消费上的人的腰包。收入最低的阶级——非熟练

    工人,甚至也许还有农民——不属于其收入增加有利于经济

    增长的两类人;如果只考虑差别和储蓄,那么与其他阶级的

    收入相比,他们的收入就不得不减少而不是增加(见第四章

    第二节(二)和第五章第二节(二))。另一方面,在那些地

    主不作什么生产性投资的国家里,惩罚地主对增长不会有多

    大作用。但是,惩罚赢利可能会严重阻碍增长,因为这会使

    人失去投资的积极性,也会使公司失去进行新投资的资金。因

    此,作出通过税收来收取大量利润的决定会产生严重后果。如

    果国家把收入花在扩大穷人的消费上,结果会降低储蓄率,利

    润税收应当用于生产,用在教育和资本形成上。第二,应通过政府金融机构,比如开发银行,把一部分收入留出来用于为生产性企业提供资金。第三,如果要减少刺激,政府本身

    必须率先建立新工业,在肯冒大风险的刺激太小的情况下,必

    须更加愿意保证获得适当的收入。在欠发达国家觉醒的时候,

    它们看到的是这样一个世纪:人人都愿意同时骑两匹马,一

    匹是经济平等的马,一匹是经济发展的马。苏联已经发现,这

    两匹马不会朝一个方向走,因此,已放弃其中的一匹马。其

    他欠发达国家也必须作出自己的选择。

    如果货币全部是由贵金属制成的,政府无需控制其数量,

    虽然,为了保证其纯度,可控制钱币的铸造。但是目前,货

    币通常是由实值低于面值的材料制成的,所以如果政府对货

    币的数量不加控制,私人就会大量铸造,以致物价飞涨,直

    至每个钱币或每张纸币的票面价值与实值相等时为止。如果

    货币是由纸张或贱金属制成的,对其数量必须严加控制。可

    采用自动的制度加以控制。例如,在实行金本位制的情况下,

    中央银行发行的货币量由它掌握的黄金量决定。在英国的殖

    民地货币制度中,银行或货币机构发行的纸币必须以同样数

    量的英镑证券为后盾。另外,对货币数量可能不是实行自动

    控制,而是有意加以控制;这就是说,政府有权根据自己的

    判断发行或收回货币,而不管是否有黄金或证券作为后盾。同

    样,作为工业国家最重要的货币的银行存款量可由各银行自

    行决定,或者由中央银行以某些自动规则加以控制,或者由

    政府实际上根据自己的判断通过中央银行加以控制。根据判

    断控制货币数量很难做得十分明智得体。在有记载的历史上,

    由于政府对这种判断力使用得不明智,许多国家一再吃苦头,所以普遍使用自动控制制度被认为是19世纪的一大胜利。但是,20世纪出现的战争、大萧条及政府权力的增大葬送了自动控制制度,当前流行的做法是由政府根据判断控制货币数

    量。在明智的政府的手中,根据判断控制货币量具有很大的

    优点;但在软弱、腐败和不明智的政府手中,这种方法同样

    可以造成很大的危害。

    工业国家目前之所以喜欢采用根据判断进行控制的方法

    的主要原因之一是,可以利用货币量的波动来推销经济方面

    的其他波动,从而使经济制度更加稳定。大多数国家的政府

    已接受了这样一种意见:它们的职能之一是增加稳定。我们

    在第五章第三节(三)中已提及这个问题,因此在这里,对

    工业国控制波动无需赘述了。在前面的论述中,我们还看到,

    欠发达国家的主要波动是由它们无力控制的世界贸易额的波

    动引起的。它们所能做的充其量就是减少这种波动对它们的

    国内经济的影响,办法就是防止国内价格像外贸价格那样波

    动和在繁荣期间建立能帮助它们度过萧条期的外汇储备。这

    是一个难以活动的领域,因为谁也无法预料未来的价格情况

    如何。尽管如此,大多数欠发达国家在自我保护方面可以比

    现在做得更好。

    工业国还根据判断控制货币供应量,因为它们已接受了

    在本国经济中保证充分就业的义务。但是,就它们而言,这

    主要是一个解决波动的问题。另一方面,在欠发达国家,失

    业的主要原因是缺乏人们借以劳动的资源。这只有靠资本形

    成才能解决,因为资本形成会增加新资源或者使现有资源

    (例如土地)更为有用。因此,就业问题是同经济发展的所有问题并存的。根据判断控制货币供应量只有有助于资本形成才有意义。正如我们在(第五章第二节(一))中所看到的,

    在某些情况下,可以用设立信贷来促进资本形成;在另一些

    情况下或者为不适当的人所掌握,设立信贷只会产生通货膨

    胀的弊端,而不会带来好处。

    下面再来谈谈某些政府所承担的职能中的最后一个职

    能,即强行提高投资水平来加快发展速度。我们在第五章

    (第二节)(二))中已经看到,在政府不干预的情况下,国内

    储蓄率主要取决于利润与国民收入的比率。利润少储蓄就少,

    随着资本主义部门的扩大,储蓄就增加。为什么这样确定的

    比率被认为是最理想的比率,原因并不很清楚。此外,拥有

    剩余劳动力的国家实际上不用实际成本就可以进行某些形式

    的资本形成;在这种情况下,不采取一些有用的措施是没有

    意义的。另一方面,只有用强制手段——向农民和地主征税

    ——或通过通货膨胀才能提高国内储蓄率。是否应采用这种

    强制手段是一个政治问题,各国必须根据自己的情况自行解

    决。日本政府在一种情况下“解决了这个问题”,加纳政府在

    另一种情况下解决这个问题,但是俄国政府在30年代采取的

    强制手段遭到了农民的激烈反对,造成数百万人死亡。像印

    度这样的国家现在不得不面临的最大政治问题是,它能否用

    强制手段使国内储蓄率提高一倍或两倍,而又不招致人民的

    仇恨和引起大规模的暴力行动。

    正如上面所列的政府职能所表明的,政府可以进行有益

    活动的范围是非常广泛的。而且,在欠发达国家,这种活动

    范围甚至比在发达经济中还广泛。例如,在欠发达经济中,研究在更大程度上取决于公共基金,而不是私人基金;政府必须更加关心态度问题;价格机制的作用还发挥得不够充分;政

    府需要做更多的开拓工作;储蓄问题还比较大;需要减轻的

    贫困现象较多,等等。另一方面,欠发达国家的政府承担范

    围广泛的职能的能力不如比较发达国家的政府。它们的行政

    管理往往比较落后,效率较低,可用于政府活动的那部分国

    民收入更小。这是经济增长中的另一个矛盾现象。正如穷国

    需要比富国多储蓄而又不能储蓄那么多一样,穷国也需要比

    富国有更多和更好的政府活动而得到的却是更少和更差的政

    府活动。事实上,如果不考虑有关政府的能力,抽象地考虑

    一个政府应行使什么样的职能是无益的。很容易使经济欠发

    达国家的政府承担过多的职能,很明显,让它们仅限于承担

    力所能及的职能比让它们承担范围过广的职能要好。

    这同国际技术援助计划特别有关。正如国内储蓄得到外

    来资金的补充一样,国内治理也可得到外来帮助的补充。因

    此,帝国政府如果愿意有能力帮助它们的臣民,即对行政费

    用提供补贴、提供合格的人才、为那些国家建立比它们以其

    它方式建立的效率高和不那么腐败的政府。但是,殖民地政

    府在意志方面往往缺少它们在效率方面的提高,因为并不是

    所有的殖民地政府在它们的计划中都把提高人民生活水平的

    措施列于首位。帝国政府未能使它们的臣民相信,这是它们

    的意图,结果到处为民族主义领导人所利用,他们声称,他

    们更加关心人民的利益。但是,并不是所有独立国家的政府

    都特别关心提高生活水平;在这方面,有些国家远远落在帝

    国政府后面。另一些国家意志虽坚强,但往往缺乏能力。自由提供和自由接受的国际技术援助有助于弥补资金或技术之不足,对那些知道怎样使用这些援助的政府来说,事实已经

    证明这种援助是非常有益的。但是,技术援助不能替代发展

    的意志或施政的诚实态度。

    (二) 生产计划

    为一种经济拟订一项全面的计划,表明政府希望把国家

    的资源用于何处,是可能的。这样一项计划的统计部分采取

    的形式是各种表格,每种表格代表经济的一个不同方面。一

    种表格表明(具有各种技能的)各类劳动力以及雇用人的行

    业和服务业。同样的表格可表明原料、土地、建筑物和机器

    的使用情况。另一种表格可表明根据拟议中的资源分配情况

    期望各个产业的产出。还有一种表格可表明取得的收入及其

    用途;这份表格将表明国民收入如何在消费、资本形成和政

    府服务之间进行分配。再一种表格可表明预计的出口收入和

    预计的进口付款,不管是有形的还是无形的。显然,为一种

    经济拟订的一项全面计划可能有长达几十页的统计材料。

    在拟订生产计划方面,产生了若干问题。第一个问题是,

    这样做的意义何在?第二个问题是,怎么知道应怎样使用资

    源——平衡增长问题。第三是连贯性问题。第四是如何使计

    划的愿望成为现实。

    这样做的意义何在?答案取决于经济主要是受价格指导

    的还是主要是受发放许可证指导的。如果有关劳动力、建筑

    物或原料的使用或者有关进口、消费或资本形成的水平的决

    定一贯由政府作出,那么仅仅为了保证它的决定的连贯性,它就需要对整个经济掌握相当全面的数字。另一方面,要作出的决定越少,它需要汇集的信息也就越少。那些受价格指导

    的经济没有生产计划照样运转自如;每个人都执行自己的计

    划,由市场机制协调一切活动,中央只作有限的控制。

    因此,拟订一项全面的生产计划的理由存在与否,取决

    于由一个中央机构制订详细的经济计划的理由存在与否。在

    这里论述这个问题的一切细节会使我们离题太远,本作者已

    经出过一部专门论述这个题目的书。大致说来,不应由中央

    作详细计划的理由是,这是不民主的、官僚主义的、不灵活

    的,可能会造成极大的错误和混乱。这也是不必要的。逐项

    作计划的理由充分得多;这就是说,应集中力量解决几个特

    别适于施加影响的问题,如出口、资本形成、工业生产或粮

    食生产的水平问题;而让经济的所有其他部分通过自我调节

    去适应供求关系。作某些计划是必要的,因为供求结果并不

    完全为社会所接受;但是计划可限于这样一些方面,在这些

    方面,改变只是由市场力量的作用产生的结果被认为是十分

    重要的。

    在经济的某些部门,非常需要作逐项计划,因为在这些

    部门,按市价需求和供应是不平衡的。如果发生通货膨胀,特

    别是如果政府试图用控制价格的办法来对付通货膨胀,实际

    上整个经济都会如此。通货膨胀造成短缺,因此需要对某些

    基本资源进行配给或颁发许可证,特别是粮食、某些原料、外

    汇及建筑能力;除非每种配给商品都有预算,表明预料的供

    求情况,否则不可能进行有效的配给。除了通货膨胀以外,经

    济发展常常使某些部门受到压力,虽然另一些部门可能减轻压力。全体熟练劳动力,特别是建筑业几乎肯定会受到压力,所以对熟练劳动力的供应,特别是对这种劳动力的可能的需

    求,最好能掌握尽可能充分的统计材料。如果国内生产的发

    展超过出口的发展,而又没有足够的进口品取代物,那么外

    汇也可能受到压力。如果农业生产率落后于经济其他部门的

    发展,粮食供应也可能受到压力。由于不能希望所有经济部

    门都协调一致地发展,经济发展必然会使有些东西过剩,有

    些东西短缺,正是在经济中供求之间的不平衡最明显和最严

    重的地方,需要收集最充分的情报,以确保有限的资源得到

    最充分的利用。

    决定大多数生产计划的形式的三种最重要的短缺是缺少资本、缺少熟练劳动力和缺少外汇。每种短缺又分别造成了三种限制,即总计划的规模决不可超出现有总资源的范围,执行项目的方法必须是最能节省稀少的资源的,必须把能最快增加稀少物资供应的项目置于首位。最后一点是根本的,虽然经常被忽视,对计划的真正考验不是如何有效地为稀少物资颁发许可证或进行配给,而是如何迅速通过增加供应来消除短缺。

    并不是所有国家的经济都缺少资本。在第二次世界大战

    结束后不久,甚至有不少国家拥有足够的资本和足够的外汇

    来资助大规模的投资计划,其困难倒是在于缺少适当的劳动

    力或者实际缺少钢及水泥等商品。但是,这只是由战时金融

    储备积累造成的暂时现象。大多数不发达国家现在再次处于

    长期没有什么资本可积累的情况之下。因此既需要使投资计

    划的总规模保持在现有资金的范围之内,也需要通过限制消费来增加资金。在投资和储蓄之间保持适当的平衡是必要的,因为两者之间的实际差别会造成通货膨胀。我们看到,有一

    点通货膨胀有助于资本形成,但是在工业经济中的作用比在

    农业经济中大,如果要使其不破坏经济,需要加以非常仔细

    的控制(第五章第二节(一))。因此,决不可让整个投资计

    划超过现有储蓄额加上被认为是可以允许的通货膨胀率,如

    果通货膨胀的话。同时,必须使限制消费的措施成为任何旨

    在加快资本形成率的计划的一个组成部分,不管这种限制采

    取的形式是志愿储蓄、分配奢侈品消费还是收税。我们在本

    章的后面一部分(第二节(二))还要再谈这个问题。

    资本短缺既影响为计划选择项目,也影响选择执行项目

    的方法。在选择项目时,规则是只在每个资本单位产出的边

    际利润最高的方面投资。这不能光从产品能卖多少钱的角度

    来计算,因为有些项目带来的利益远远超出货币收入;公用

    事业尤其是这样——改进运输、水利或电力供应使其他产业

    增加的产出可能远远超过公用事业的收入本身表现出来的利

    益。这一规则也不符合主要在资本与劳动力的比率低的项目

    中使用资本的情况,因为资本使产出增加得最多的某些产业

    恰恰也是资本相当密集的产业,比如某些公用事业、矿山和

    钢铁厂。

    其次,几乎任何项目都可以用节约地使用资本的方法或

    以资本主义色彩较浓的方式来执行。如果资本少,就应选择

    资本主义色彩较淡的方法,因为用这些方法创始成本对连续

    成本的比率低,酝酿阶段短。如果在计算不同方法的比较成

    本时使用的利率高(高于政府证券的利率,这种利率通常低于资本对社会的实际价值),就会自然而然地使用这种方法。

    非熟练劳动力大量过剩的国家必须特别小心谨慎,因为

    在这种情况下,货币工资不反映使用劳动力的实际社会成本。

    在这种情况下,如果用资本来做的事情用劳动力来做同样可

    以很好地完成,资本就不具有生产性;鉴于工资水平,这种

    投资对资本家来说可能是十分有利可图的,但是对整个社会

    来说,却是无利可图的,因为它们使失业人数增加,而产出

    不增加。在农业机械化和在同家庭手工业的竞争中,最有可

    能发生这种浪费资本的情况(第三章第四节(四)和(五)),

    因此,防止这种投资可能是可取的。有时候,这种投资即使

    不增加产出,也特别具有吸引力,因为它是那么节省劳动力

    (比如使用推土机),或从钱的角度来说,与手工方法相比是

    那么便宜,那些难以找到钱来进行公共投资的财政部长们肯

    定不愿使用较贵的劳动密集方法;但是,事实仍然是,从社

    会观点看,在那些国家用机器来做剩余劳动力同样能很好地

    完成的事情是一种浪费。如果把资本用来增加就业机会,实

    施那些不能用手工来工作或手工的成本高得惊人(这是财政

    部长们的例外条款)的项目,资本就能产生最大的效果。如

    果把资本用于已经由手工做的工作,而额外的产出在不减少

    就业人数的情况下,由于需求的弹性或者由于使用资本后产

    品本身有了改进而能够被吸收的话,资本可以产生同样的效

    果。也有这样一些行业,在那里资本增加了国民产出,但是

    也减少了就业;比如,供人们消费的粮食增加了,但是由机

    器代替了人和畜。对经济的决定性考验是整个国民产出的情况怎样,而不是就业或货币成本的情况怎样,但是,实际上,在货币成本低得多的情况下,要防止用资本来代替劳动力的浪费在欧治上是不容易的,同样,在会造成大批人失业的情况下,要防止用劳动力来代替资本的浪费在政治上也是不容易的。

    缺少熟练劳动力会造成同缺少资本一样的问题。如果缺

    少熟练工人,就必须节约使用,选择那种减少对熟练工人的

    需求的方法。几乎可以肯定,短缺之一是管理大型企业的技

    术,所以不发达国家在考虑计划时应注意小规模组织,而不

    是大规模组织(第三章第二节(三))。如果要避免混乱和浪

    费的话,还必须使总计划保持在现有技术的范围内。建筑计

    划更应如此。我们已经看到(第五章第一节),50%到60%的

    投资在建筑业,而缺少建筑能力常常是妨碍加快资本形成速

    度的主要障碍。这不是一个不可逾越的障碍,因为如果认真

    对待这个问题并采取措施来招收和培训必要的劳动力的话,

    迅速扩大建筑业并不比迅速扩大军队困难。但是,令人惊讶

    的是,生产计划常常不写入这一条。

    一个国家是否缺乏外汇取决于发展是否主要靠出口部门

    (第五章第三节(二))以及引进多少外国资本。如果发展主

    要在国内部门(印度,澳大利亚),外汇几乎可以肯定是困难

    的。在这种情况下,特别吸引人的生产方法就是节约使用进

    口机器或原料的生产方法,支持赚取或节约外汇——比货币

    成本或货币收入多出的那部分——的产业也是可取的。每一

    项发展计划都应谋求在内外贸之间保持适当的平衡。在欠发

    达国家的经济中,进口额上升的速度至少同收入一样快,通

    常是更快。拥有多种自然资源和气候的国家,如苏联、中国或美国,随着它们的发展,可以用国内生产来代替进口,它们的收入有可能在不相应扩大进口的情况下增加。大多数其

    他国家都太小,所以做不到这一点。随着它们的收入的增加,

    它们需要范围更加广泛的商品和原料,如果它们的人口迅速

    增加,它们可能还需要进口更多的粮食,因此在任何发展计

    划中,需要把扩大能够出口的产品及开发新市场放在首位。获

    得外国投资或赠款来支付部分进口的可能性使情况变得更为

    复杂;这暂时减少了出口的需要,但是到了需要偿还本金和

    利息的时候,最终的影响是,甚至必须使出口增长得比进口

    还快。在两种情况下,这个问题特别困难。一种情况是,出

    口商品是粮食。如果粮食产量不迅速提高,国内需求的增长

    可能使国内消费者吃掉本来可用于出口的粮食;阿根廷就发

    生过这种情况。另一种情况是人口过多的国家,它必须实现

    工业化和打入世界工业品市场(第六章第二节(一))。发现

    出口商品和市场并不总是很容易的,但是,不能仅仅由于这

    种原因而把这个问题撇在一边。

    缺少外汇往往只是反映了未能在制造业和农业的增长之

    间保持适当的平衡。如果其中一个部门扩大了产出,其影响

    就是增加了对另一个部门的产品的需求,任何短缺都会造成

    国际收支的紧张。工业的迅速增长要求农业也迅速增长。产

    业工人需要更多的粮食。工厂需要从农村招收劳动力;需要

    扩大农民的市场来吸收生产出来的消费品;或者需要农民的

    储蓄或税收来为工业建设提供资金。同样,如果农业发展了,

    它需要工业也发展,以吸收它的产品和劳动力以及向农民提

    供更多的消费品和资本货物。人均农业生产率如停滞不前,就会妨碍工业的发展和造成国际收支的紧张,因为工业的发展需要增加进口,可能不得不把它的剩余产品作为出口品处理

    掉。反之,如果农业生产率上升,工业生产必须更快发展,因

    为对粮食的需求比人均收入增长得慢,而对制成品的需求比

    人均收入增长得快。平衡增长并不是同步增长,而是根据不

    同的需求增长率按比例增长。如果像澳大利亚或阿根廷那样

    忽视工农业之间的平衡或者像苏联那样拙劣地处理这种平

    衡,就会妨碍进一步取得进展;日本的发展计划在这方面显

    然比提到的其他国家优越。

    只要测验生产计划的各个部分的内部协调性,就可看出

    这个计划是否缺乏平衡。首先,可测验整体平衡,看看整个

    计划与可动用的资源是否相当。例如,一项列出各类熟练劳

    动力的人力预算将表明这项计划所需的各类劳动力是否超过

    实际能得到的劳动力。对原料、资本、外汇、运输设施、建

    筑物或其他任何可能是稀少的资源都可以作出同样的预算。

    这种全面的测验应考虑整个经济对投入的需求。其次,可测

    验对产出的需求。从对预算的研究中可以看出,消费是如何

    随着收入的增长而增长的。这种测验表明,根据预测的收入

    水平,预测的粮食供应是否同预测的需求相符。同样的测验

    表明,同预测的供应相比,消费工业品的市场有多大以及同

    要求消费者储存的储蓄额相比,预测的储蓄额有多大。然后,

    就可使用里昂惕夫的投入—产出方法对个别产业进行测验。

    可以把预测的投入同扩大预计会提供部件、运输能力、水和

    技术服务等产业的产出的计划相比;可以把预测的产出同预

    计将扩大的出口、消费需求及将吸收副产品和其他中间产出的工业相比。由于关键部分往往是建筑,必须特别注意预测的建筑材料和部件——特别是水泥、砖、钢材和木材——的

    产出,以确保这些材料得到充分供应,不管是国内生产的还

    是进口的。在农村地区,主要困难之一是水,所以要研究的

    重点之一是计划谋求在多大程度上保护和扩大乡村的水源。

    如果得到必要的信息,有许多统计测验可以表明生产计

    划是否缺乏平衡。当然主要困难是得不到信息。所需的统计

    资料——预算研究报告、消费函数、人力调查、产出调查、投

    入—产出表、国民收入表等等——并不总是存在的,或者可

    能有很大的误差。即使数字是正确的,需求和产出的关系也

    会发生难以预料的变化。所有的产出和出口预测都取决于执

    行计划的措施和效率,而这肯定是难以预料的。一项生产计

    划在很大程度上是实现一种希望;它的确切数量是无法确定

    的;它只不过表明希望在各个部门达到的一般数量级。同样,

    不管计划多么初步,都应测验其内部的协调一致性,不管这

    种测验是多么初步,因为否则的话,各个部门之间可能完全

    失去平衡。在这种问题上,最好依靠数字和预测,而不要光

    靠预测,即使数字本身有一部分也是以预测为基础的。

    迄今,我们的论述还只同文字工作有关:为经济的各个

    部门确定目标。但是,归根结底,真正重要的自然不是纸上

    的目标,而是把资源用于正确方向的措施——培训劳工、提

    高粮食生产率、节制消费、刺激投资等等。这是计划中最困

    难的部分,也是常被忽视的部分。如果计划同公营经济部门

    有关,执行起来就比较容易;困难在于使私人经济部门做需

    要它做的事情——使劳动力进入正确的部门或参加培训班;使企业家投资或使公众储蓄;使农民采用新技术;或者使外国人发挥他们作为放款人、买主或技术人员所应起的作用。对

    一项生产计划的重要考验是它对私人的效率如何。

    为了取得私人的合作,政府依靠说服、力量和报酬。说

    服只是一种佐料;人们决不会仅仅因为政治家告诉他们说他

    们的行动符合公众利益而行事长期违背自己的私人利益。为

    阐明计划的主要目标而发表演说和进行宣传是有用的,取得

    人民的热情支持是非常可取的,但是如果人人都看到能从计

    划中得到什么,计划取得成功的可能性就会大一些;如果计

    划要人们去做他们得不到什么好处的事情,计划取得成功的

    可能性就会小些。力量的用途也是有限的。可以从反面使用

    力量来防止人们做你不希望他们做的事情。但是如果要让人

    们做你希望他们做的事情,力量用途的局限性就大得多,在

    民主国家更其如此。因此,粮食可以实行配给,对原料或建

    筑材料可以发放许可证,以防止有人得到过多的东西;但是

    正如苏联所发现的那样,不能强迫企业家对工业投资,不能

    强迫农民有剩余粮食。发放许可证有些可能是需要的,只有

    限制不可取的东西,可取的东西才更有可能出现。但是执行

    发展计划的主要手段必须是报酬。如果要劳工做需要他做的

    事情,就必须使工资有适当的差别。如果要农民合作,就必

    须使他们的劳动环境值得进行这种合作。如果要使企业家投

    资,就必须有获得适当利润的很大可能性。保证一项生产计

    划成功的最好方法在很大程度上是对希望予以阻止的活动征

    税,对希望予以鼓励的活动提供(某种)补贴。

    另一个教训是,如果生产计划需要取得私营部门的合作,在作计划时应征求私营部门的意见。这在政治上并不总是容易的。欠发达国家的一些政府对整个私人企业,特别是对外

    国企业是敌视的,不会让这些阶级参加生产计划的制订工作。

    只有企业家认为参加合作有利可图时,它们的生产计划才能

    行之有效,但是这些政府却极力避免得益和合作,当它们的

    计划一无所获时,它们感到十分意外。对付农民也是同样困

    难的。有些国家的政府是地主统治的,他们不愿意实行土改,

    而不实行土改,农民就没有增产的积极性。另一些国家的政

    府眼睛只盯着用农民的部分盈余来为资本形成提供资金。如

    果一个政府得到资本家和农民两者的支持,它就很可能有所

    作为,但是在实行痛苦的措施时能保持政治信心的政府太少

    了,至少在民主世界是如此。

    为了执行计划,可能需要进行非常密切的合作。政府希

    望企业家对某些方面投资,企业家肯定是不愿意的。它的机

    构必须进行研究,提供信息,它还可能必须提供一些资本和

    对市场或红利作出担保。在政府试图鼓舞、指导和刺激私人

    企业家的经济中,企业和政府在很大程度上是彼此混杂的,日

    本的情况就是这样。同农民也需要进行同样密切的合作。政

    府机构进行研究,试图说服农民改变方法,向他们提供贷款,

    帮助销售,增加对村庄的供水等等。除非得到农民的信任,否

    则许多工作会一事无成。

    由于难以从个人那里得到所需要的反应,无论如何,难

    以得到符合政府要求的反应,有些政府就想不要私人生产者

    的合作而进行发展。如果农民行动迟缓、持怀疑态度或坚持

    高粮价,这些政府就建立国营农场,集中力量增加在其控制范围内的产出。这就是苏联在19世纪20年代(集体化以前)实行的政策,这种态度也导致英国政府在非洲实施大规

    模的农业机械化计划,而不是把钱花在刺激非洲农民的生产

    上。当苏联的这一政策失败时,政府就迫使农民组织集体农

    庄,农民必须叫怎么干就怎么干,而不是放宽它的高税收和

    低价格的政策。对工业家也可能采取差不多的态度。有些国

    家的政府认为,私人企业作为刺激和作为进一步发展的资金

    来源所需要的利润太高了,为繁荣付不起这笔代价。它们规

    定低价格,低利润。当这种做法影响投资时,它们就采取公

    共行动来做这件事情。这就把寻找资本、技术知识、管理技

    巧和为实现工业化所需要的进取精神的过重的担子揽到了自

    己的身上。在欠发达国家的经济中,所有这些因素都是缺少

    的。经济发展是如此困难,以致人们认为,调动现有的一切

    知识和积极性是可取的,至少在起步阶段是如此,但是,显

    然,并不是所有人均产量很低的国家的所有政府都同意这种

    看法。

    第二节 公营部门

    (一) 政府开支计划

    不管一项生产计划是否是为整个经济制定的,都需要有

    一项政府开支计划,即使这只是为了对政府官员施加控制。实

    际上,世界上每个国家的政府都在预计中有一项年度开支计

    划。大多数欠发达国家也都有这样的计划,时间超过一年,有的长达五、六年,甚至十年。实际上,有些国家是作为取得国际援助的一个条件必须这样做。当英国政府1945年准备用1.2亿英镑作为给各英国殖民地政府的赠款时,它要求每个

    政府提出一项十年发展开支计划;同样,1950年,要求参加

    科伦坡计划的国家提出一项六年计划。联合国国际复兴开发

    银行也希望看到这样的计划,乐于向欠发达国家派出专门小

    组去帮助制定这样的计划。当美国政府向欧洲提供马歇尔计

    划的援助时,它走得更远;每个受援国都需提出一项涉及公

    私经济的各个部门的四年计划,而这是一个人们最不相信

    “计划”这个字眼的国家所要求的!

    作出多年规划的好处是显而易见的。在草拟第一个这样

    计划的过程中,政府的几个部门和机构也许得第一次明确地

    确定各自的详细目标。展望未来,可以使它们的工作有个目

    标,并可能使它们看到在其他方面的不足之处。然后,当各

    机构的计划放在一起时,就有机会确保它们既协调一致,又

    对轻重缓急的次序予以应有的遵守。政府的左手并不总是知

    道右手在干什么,对政府的一切活动作出计划的必要性提供

    了一个协调的机会。有些部门的负责人也比别人主动,因此

    会为他们的部门得到比真正按轻重缓急的制度分配的更多的

    钱。即使有一项全面的计划,这种情况也可能会发生,但是

    如果要求各部门都同时提出计划,如果作出最后选择的那个

    机构意识到协调一致和分清轻重缓急的重要性并拥有必要的

    权力来实现合理的平衡,那么发生这种情况的可能性就会减

    少。许多事情取决于这个中央规划机构的效率和权力。由于

    提出的计划必定会大大超过可动用的资源,必须作出和实行困难的选择,规划机构需要得到政府总理的充分支持和关心。

    一旦制定了计划,它对必须执行计划的人就有很大的价值。政

    府财政官员可以展望未来,及时地制定计划。工程师可把蓝

    图准备好。采购部门可及时地订货,等等。最后,有了计划,

    就可以测定进展的程度。人人都知道每个机构应该干什么,它

    的成绩就可以根据计划规定的目标来衡量。

    制订多年计划的危险也同样明显。由于谁也不能对未来

    未卜先知,哪怕对短短五年也很难预测,受计划规定的严格

    限制是个不利条件。这些计划很快过时。物价可能急剧上涨,

    可动用的资金可能比预料的多或少(通常是少!)。少数项目

    提前完成;多数项目则由于难以预料的原料、熟练劳动力、科

    学家或资金的短缺而延误工期。因此,任何这样的计划都必

    须经常修改。为了对付这种困难,波多黎各政府每年修改它

    的六年计划,每年都为今后六年作一项计划。没有任何办法

    能保证计划总是考虑到情况的变化。另一方面,一项计划是

    需要的,因为虽然我们不预测未来,但是如果不根据当前获

    得的信息为未来制定计划,我们就不可能采取合理的行动。

    有些计划限于列出政府部门、公共公司、政府金融公司

    和其他政府机构的拟议中的资本开支。另一些计划则要列出

    通常在预算中出现的所有开支,不管是资本开支还是经常项

    目开支。对所有开支作出计划比只是作资本开支计划好。首

    先,资本开支常常伴随着经常开支;建造学校以后,就得支

    付教师的工资,或者买了拖拉机,就得雇用驾驶员。如果只

    说资本开支而不说经常开支,就很难看出一个项目要多少费

    用,财务规划可能错误百出。其次,如果要求计划人员提出仅限于资本开支的计划,计划人员自己可能上当受骗。发展不光依靠资本开支,例如,在诸如农业技术推广等各种教育

    计划方面,它需要很多经常开支。如果把重点放在资本开支

    上,这些计划往往会被忽视。

    在拟定政府开支计划时,最好能确定正确的轻重缓急次

    序,但是要为确定轻重缓急规定规则是不可能的。我们在这里所能做的充其量也只是指出有些计划比较簿弱的一些方面。

    第一,使公营部门的计划同私营部门的情况适当联系起

    来是很重要的。例如,公用事业——铁路、码头、供水、电

    力等——的整个计划必须根据私人投资者的意图来制订,这

    样,何时何地需要这些设施,就可提供这些设施。同样,培

    训熟练劳动力的计划取决于需要什么样的技能。因此,政府

    开支计划和生产计划必须一起制订。政府机构需要知道私人

    企业打算做什么,私人企业应参与制订政府计划的工作。

    第二,有些计划为都市制订的色彩太浓,对乡村的影响

    太少。许多计划与为大多数人居住的农村所做的事情相比,为

    美化城市或为城市提供较好的住房、学校、供水或医疗服务

    所做的事情太多。从城镇为乡村作的计划往往也很壮观,因

    为可用以向参观者炫耀。为建造几条漂亮的公路花的钱太多,

    为修建许多从农场到市场的小路花的钱太少,而后者更有助

    于增产。或者把大量资金花在控制一条河流上,而如果将同

    样的钱花在大量的水井、水池和小溪上,得到的收获就会多

    得多。求大有时候也是正确的政策;一个大项目对发展的作

    用可能比许多小项目大得多,而所需成本是一样的。补救办法不是舍大求小,而是注意使规划进程适当分散。应当鼓励农村地区制订自己的计划,在规划过程中,农村应有充分的

    代表,以保证不忽视他们的需要。保证做到这一点的最好办

    法当然是采用“社会发展”方法(第三章第一节(一)和第

    五章第二节(一))。由于这依赖于志愿劳动,只有人民真正

    需要的计划才能实施。社会发展是最好的发展,每一项计划

    都应拨出一笔相当于国民产出的1%或2%的款项用于这一

    工作。

    社会发展的另一优点是减少资本开支中的铺张浪费,这

    是若干计划的第三个缺点。在不发达国家资本奇缺,应当节

    约使用。所需要的往往是能派用场的最便宜的结构。建造能

    够用50年的学校、医院或热电站都是错误的,因为建造用30

    年的结构要便宜得多——无论如何,在30年中,由于标准的

    变化和收入的提高,许多这样的建筑都得拆掉。同样,旧机

    器往往比新机器更适用,购买比较先进的国家认为是过时的

    设备,甚至可能大有好处,如果能便宜地买到的话。一个好

    的政府希望做什么都做得恰如其分,把一些永久性的突出的

    结构让后人去建造,但是,从这个意义讲,大多数穷国无法

    把事情做得恰如其分。滥用水泥和钢材是发展计划的比较普

    遍的弊端之一。

    实际上,这种计划的另一个普遍的弊端是,它们在考虑

    发展时对具体事物的投资想得太多,而对人的投资想得太少。

    在公共卫生计划和教育计划的缺陷方面,这一点显得尤为突

    出。至于公共卫生,我们已在前面看到(第二章第二节

    (一)和第四章第三节(三)),改进饮食和消除使人衰弱的疾病可以大大提高生产率。关于教育,我们已建议,除了在小学、中学、技术和大学教育上的通常支出外,农业国的政府

    应拿出1%的国民产出用于农业研究和农业技术推广上(第四章第三节(二))。

    最后,还需记住政府作为用在公营部门以外的资本提供

    者的作用。我们在(第五章第三节(一))中已经看到,为什

    么国内储蓄少可能使政府成为向小农、向工业发展、向公用

    事业和向住房建筑提供资本的主要渠道,不管这种资本来自

    政府自己的储蓄、来自国外还是由于通货膨胀而不得不投资

    的。在拟订政府开支计划时,危险之一是,过分注意公共事

    业机构的要求,把过多的社会资金用于这一方面,而忽略了

    其他经济部门。这是说明为什么制订政府开支计划的工作应

    当与调查整个经济的工作同时进行的又一个原因。归根结底,

    公用事业的费用要靠经济的“生产”部门来支付,因此,保

    证社会和福利事业的资金不超越经济的生产能力是很重要

    的。

    (二) 财政问题

    政府对资金的需要是不断增长的,因为公营部门的发展

    速度比整个经济增长的速度快。我们可以用多种方法来衡量

    这一点,可以根据政府雇员的人数来计算,可以根据政府使

    用的资金来计算,或者根据税收在国民收入中所占的比例来

    计算。先说根据雇员人数来计算。不包括防务在内的文职雇

    员在拿工资的职工中所占比例很少有低于2%的,在美国占

    10%左右,在英国占11%(包括中央和地方政府雇员)。除此之外,还必须加上武装部队的人数,各国情况有所不同,丹

    麦几乎没有,英国占4%(1954年),这在和平时期是最高的,

    而希腊、土耳其等国则更高。如果我们再加上公用事业和国

    有化工业的人数,英国政府雇员人数的比例为25%,即公用

    事业文职人员占11%,武装部队人数占4%,国有化工业人

    数占10%。然后我们再来看所用资金情况,不包括国有化工

    业的资金。所用资金的比例大于雇员的比例,因为政府也向

    私营经济部门购买供应品(从墨水到飞机都买)。美国政府和

    英国政府所用资金在国民产出中所占的比例与1938年差不

    多,即约占14%;现在,由于防务计划的扩大,它们的开支

    增加了,大概占22—24%。但是,这也不是全部费用,因为,

    除了它们所用的资金外,它们还需要经费来作不包括在它们

    买来自己用的货物或劳务中的转移性支付——养老金、国债

    利息、失业补助等等。因此,英国目前的税收在国民收入中

    占35%左右,而印度占8%左右,尼日利亚占5%左右。

    当然,政府使用的资金在国民收入中所占的比例的上述

    差别是和施政的质量有很大差别联系在一起的。去过欠发达

    国家的人常常抱怨公用事业差——道路难行、水不干净、卫

    生差、蚊子多、管理差等等。回答是,用占国民收入5%的费

    用是不可能搞好公用事业的。除了防务和转移性费用外,西

    欧和北美各国用于公用事业的费用占国民收入的12%左右,

    欠发达国家甚至需要支付更多的费用才能达到同样的标准,

    因为它们的人均收入低。

    欠发达国家的军事负担不必像工业大国那么重。另一方

    面,如果欠发达国家决定增加私人部门的资本形成,它们为此目的可能需要大量资金。例如,如果它们希望整个经济的纯资本形成每年达到国民收入的12%,而它们的经济只能节

    蓄5%,相差7%,需从别处来补充。12%的目标不算过高。

    这是欧洲国家的经济在工业革命初期达到的比例,比苏联和

    日本的比例低。假如我们把资本—收入比率定为4∶1,那么

    如果投资为12%,每年的实际收入就要提高3%;如果每年

    人口增长率为1.5%,那么每年的人均实际收入将提高1.

    5%,约50年翻一番。以这一速度,欠发达国家的生活水平

    的提高速度将与西欧一样,但是穷富国之间的差距不会缩小。

    如果要想消除这一差距,就需要有比这更大的投资。

    欠发达国家政府筹集的岁入比发达国家少的原因并不是

    它们需要的岁入少,而是筹集起来比较困难。根据实际资源

    来考虑这个问题是最方便的。如果一个国家需要有70%的人

    从事农业来提供粮食,在剩下的30%的人口中可以腾出来从

    事政府想从事的事业的劳动力,比一个只需要12%的人从事

    农业的国家能腾出的劳动力显然要少得多。欠发达国家的经

    济能够用以支付税收的收入的百分比不如较发达国家那么

    大。但是,大多数欠发达国家的经济如果愿意的话,是可以

    多缴些税收的。在这些国家,筹集更多的岁入是困难的,但

    也不像有时想像的那样困难。如果在本章中去肤浅地论述公

    共财政,那就会文不对题;本节仅限于对穷国的一些特殊问

    题发表一点看法。

    首先是技术问题。税收的原则之一是,应避免那种收起

    来代价高的税收,因为这种税得从大量只交少量税的个人那

    里去收。这一点对直接收税和间接收税都是适用的。这就是把所得税限于收入较多的个人的原因之一。例如,在大多数国家内,向年收入少于150英镑的人收所得税被认为是不合

    算的。但是,在穷国,年收入高于150英镑的人的比例是很

    小的。因此,从所得税中得到的岁入穷国比富国少。事实上,

    穷国在更大程度上得依靠间接税,这并不是因为它们希望以

    不同的方法分配税收负担——也不一定这样做,而是因为在

    一个可行的豁免期限内,国民收入的比例要少得多。这涉及

    漏税问题,因为需纳税的很大一部分收入是小商贩的收入,他

    们没有适当的帐目,要实行所得税条款,得付出极大代价。如

    果比较严格地实行税法,大多数欠发达国家会得到很大好处,

    但是即使最严格地实行税法,也不能使所得税成为主要岁入

    来源,除非有几个大采矿公司或其他公司可以纳税。

    有些国家在征收间接税方面还有很大的技术困难。在很

    大一部分国民收入经过少数人之手的地方,征收这种税最容

    易。进出口通常由少数批发商经营,从他们那里征收进出口

    税最方便。在工业国,很大一部分产出是由少数大公司生产

    的,因此,可以很方便地征收货物税和购物税。并不是所有

    欠发达国家都有这样的有利条件。出口约占斯里兰卡国民收

    入的40—50%,所以那个岛国很容易通过征收进出口税获得

    很大一部分国民收入,而行政管理费用很少。但是在邻国印

    度,出口不到国民收入的10%,因此对外贸易的税收收入是

    很少的。像印度这样的国家得在更大程度上依靠内贸税收,但

    是收税要付出很大代价,因为产出不集中于少数公司,产出

    由数以百万计的小生产者生产,通过数以百万计的渠道销售。

    因此,要防止相当数量的漏税是不可能的,收税的代价也必然是高的。

    在某些欠发达国家,另一个困难是,很大一部分产出根本不进入交易。农民生产自己的粮食及一些自己的用品,只有少量剩余产品拿到市场去出售。如果只对农民的货币收入

    征税(也许对他们购买的货物征收进口税或货物税),他们多

    半会漏税。如果农民种植供出口的经济作物(可可、橡胶、棉

    花等等),情况就不同了,很容易向他们征收出口税。对自给

    自足的农民,必须直接征税。非洲部落为此征人头税,而印

    度的王子则主要依靠土地税。有些土地税带来了很多的岁入,

    日本和苏联的情况就是这样。事实上,在人口过多的国家,租

    金和税收加起来经常占去了农民产出的50%以上。另一方

    面,土地税是直接税,因此,它引起的敌视比间接税大得多,

    因为后者的存在并不总是那么明显或那么尽人皆知的。苏联

    政府为了向农民征收足以支持国民收入的40—50%的税收

    遇到了强烈的反抗,苏联这样做是为了促进资本形成、加强

    防务及作其他开支用。因此,只要一有可能,土地税就让位

    于进出口税。

    因此,我们要考虑欠发达国家税收负担的分配。收入分

    配比发达国家均衡还是不均衡,首先取决于人口和土地之间

    的关系,其次取决于经济部门资本化的程度。在人口过多的

    国家,租金高昂,也许高达占农业产出的40—50%,因此,收

    入分配往往比发达的工业国更不均衡。在资本化部门,利润

    与工资的比率往往比工业国高,实际上,在某些情况下,比

    如在中非的铜矿中,利润可能占纯产出的一半以上。因此,无

    法对欠发达国家经济的情况作出一般的概括;在一些国家,收入分配比美国更加不均衡,而在另一些国家,比如加纳或尼日利亚,就比美国均衡得多。

    在收入表上,税收应达到何种程度在一定程度上取决于

    收入分配的不均衡程度如何,但是有一部分也取决于税收对

    积极性和储蓄的影响如何。后者在欠发达国家内比在发达国

    家内更重要。在比较发达国家的经济中,这也是重要的,但

    是这些国家的经济已经形成了某种发展势头,即使积极性和

    储蓄减少一些,这种势头也会继续下去。在欠发达国家中,征

    税最容易的阶级是地主阶级,其原因有二,一是这不涉及到

    积极性和储蓄,二是从政治意义上讲,地主几乎在各个地方

    (但不是每个地方)现在在政治上都处于不利地位。农民的税

    收负担总是很重的,但是在一些农民最近取得了选举权的国

    家(如印度),他们造成的政治动荡使他们免除了一定程度的

    高额税,这使政府感到很尴尬。在大多数欠发达国家,向拿

    薪金的中产阶级征税也是困难的,部分原因是他们在新的民

    族主义政府中拥有政权,部分原因是为扩大这个阶级需要予

    以刺激;经济发展的主要影响之一是使社会上半熟练、熟练

    和专业人员的人数大大增加了。如果对这几类人征收高额税,

    可能会产生不利影响。利润也属于困难之列。从政治上说,对

    利润征税很容易,特别是如果资本属于外国人的话,但是对

    利润征税可能损害积极性和储蓄。储蓄这一点倒不是很重要

    的,因为明智的政府可以用公共储蓄来代替私人储蓄,但是

    在企业精神还欠缺的国家,积极性这一点可能是很重要的。一

    些急于鼓励发展的国家,实际上朝相反的方向行动:它们对

    创建新工业的资本家暂时免征所得税。

    对一些国家的政府来说,对富人怎么办是个严重问题,因

    为这些政府得到的支持主要来自穷人,但它们同时急于推进

    发展。不进行耕种的地主不是一个太大的问题。可以用钱使

    他们让出产权,然后像在日本那样,当他们发现自己带着钱

    不交税时,就可变为资本家,提供亟须的企业精神(第五章

    第二节(二))。即使没收他们的财产,对经济发展也不可能

    有什么不利的影响,除非他们自己在大庄园上用现代方法耕

    种土地。工商业资本家的情况则完全不同,他们是储蓄和企

    业的主要源泉。在初期阶段,经济增长使利润在国民收入中

    的比例上升(第五章第二节(二)),在过去,这意味着大量

    私人财富集中在极少数人手中。不难理解,为什么各民主政

    府非常怀疑这一进程,很不愿意让资本家从经济发展中获得

    大量利润;另一方面,如果压低利润或高额征税,私人储蓄

    就会很少,私人企业就没有积极性。摆脱这一困境的开明办

    法是鼓励私人资本家在活着的时候能赚多少就赚多少,在他

    们死去以后再课以重税。如果无情地这样去做(迄今还没有

    这样做过),这意味着每一代人开始时的机会多少是均等的;

    发财的积极性会减少一些,但是机会的增加可能会绰绰有余

    地抵销这一点(第三章第三节(二))。社会主义的解决办法

    是不要私人资本家,由国家创办企业、赚取利润和进行储蓄。

    这一办法的可行性取决于国家的进取心如何及它从事生产性

    投资的愿望如何。这种解决办法无疑能起作用,特别是那些

    只需仿效、不需开拓的国家能使其起作用(第三章第三节

    (一))。在下列情况下就不会起作用:如果国家对私人企业的

    征税达到使积极性和私人储蓄都不足的程度,而国家又不以自己的主动性和储蓄来加以补充。

    这种分析也使人认识到在税收工作中进行政治考虑的重

    要性。大多数国家的政府认为,向反对它们的人征税和对它

    们所依靠的人免税最容易,这一事实在决定分配税收负担时

    所起的作用与对平等、刺激或储蓄的考虑一样大。但是,事

    实仍然是,在大多数这样的国家中,除非政府对所有阶级征

    的税都比现在多,否则它在经济发展中就不可能发挥它想发

    挥的作用。在大多数这样的国家中,主要政治问题是使人民

    相信情况确是如此,并得到他们对必要的措施的赞同。在这

    方面,与民主政府相比,极权主义政府所处的地位比较有利。

    它们可以使国民收入的20%或30%归政府所有,把一半的收

    入用于资本形成,而不用担心在选举中会发生什么事情,如

    果进行选举的话。民主政府就比较困难。各地都会出现某个

    伟大的民主领袖,他能带领人民为了建设国家而度过比较艰

    苦的阶段,同时又能使他们保持信心和热情。但是,这样的

    领袖非常少。在其他许多国家内,民主成了加快经济发展速

    度的障碍。也许情况应当是这样的;在本章中,我们不想谈

    经济增长的可取性或其他事情(见附录)。

    虽然增加政府在某国国民收入中所占的份额是困难的,

    但是,保证增加的国民收入大部分归政府所有在政治上并不

    那么困难。这是增加政府在国民收入中所占份额的主要希望。

    在欠发达国家的经济中,应当始终使边际税率大大高于平均

    税率。实际上,比较发达的国家也采用了这一原则。这是它

    们用以同国民收入的波动作斗争的主要方法之一,因为它的

    影响是,在衰退时,政府收入急剧下降,在繁荣时,政府收入急剧上升。这也是它们同通货膨胀作斗争的方法;例如,这是英美两国在第二次世界大战中的物价上涨率低于50%的

    原因之一,而其他许多国家虽然战争负担小得多,但物价上

    涨率达到200%或300%以上;这也是英国的物价自战争结束

    以来没有上涨得更快的原因,尽管货币需求对资源造成了很

    大的压力。在这些国家中,约40—50%的边际收入变成了税

    收。如果这样做的结果造成岁入增加太快,那么在不降低边

    际税率的情况下,减轻平均税收负担是可能的。

    与此相反,在欠发达国家,边际税率常常低于平均税率

    ——政府收入增加得比国民收入慢。这是由于在价格上涨时

    不愿意提高政府控制的价格的缘故。铁路运费、邮资、电话

    费及其他政府价格上涨缓慢:土地税如以货币来确定则落在

    形势后面;进出口税固定在从量而不是从价的基础上等等。通

    货膨胀由于在收入中所占的边际额很高,应能使一个政府富

    起来;但是在许多欠发达国家的经济中,价格的上涨造成了

    预算赤字。目前,当价格的长期趋势似乎是上涨时,税收始

    终应以从价而不是以从量为基础,为改变公用事业和公共服

    务的价格作出的安排应允许随着费用的变化而迅速作出调

    整。

    保证边际税率高的方法是征收高边际率所得税、对需求

    量增加得非常快的消费品征重税和征收高边际率出口税。

    关于所得税,没有多少可说的。税收的平均负担取决于

    在实行边际税率时的减免和折扣。因此,边际税率可为40%

    以上,而平均税率仅为5%或更低。边际税率高造成的问题是

    它对积极性的影响。这一点虽然常被夸大,但确实是个问题。

    间接税对积极性就没有同样的影响,因为人们对其没有多大感觉。因此,舆论正转向采用间接税,而不是直接税。有人认为,间接税必然不如直接税进步,这是错误的。穷人、富

    人和中产阶级以不同的比例消费不同的产品。只要人们使用

    他们的收入,如果对穷人的消费品征收的间接税低,对富人

    的消费品征收的间接税高,那么间接税可以同所得税一样进

    步。差别在于,间接税只涉及花掉的那部分收入,而所得税

    还涉及储蓄,但是,这种差别也可能是夸大的,因为两种税

    都可加以调整,使其对储蓄总额产生同样的影响,虽然对个

    人的影响会随着支出方式的不同而不同。

    在征收间接税时,原则是对奢侈品及需求量迅速增长的

    其他物品,不管是否完全是奢侈品,实行高税率。在某些国

    家,后一类物品范围非常广泛,因为西方化的扩大使电气设

    备、收音机、自行车、汽车、啤酒、香烟、留声机或傢具等

    物品的需求量迅速增大。对批发价征收100%的进口税或消

    费税可能只等于零售价格的30—40%。有些国家的政府不愿

    意收100%的进口税,但是如果要使边际税率达到40—50%

    的话,可能需要征收不少这样的进口税。大多数国家都收进

    口税,但是,在与国民收入相比进口额很低或者通货膨胀抬

    高了国内价格而不抬高进口价格的国家内,这是不够的。在

    这两种情况下,如果政府要在增加的货币收入中占有一个很

    大比例的话,它可能需要征收一定数额的消费税和销售税。

    我们已经论述过出口税与强制储蓄(第五章第二节(二))及与经济稳定的关系。原则是根据事先确定的比例增减制使征收的税随着商品价格的上涨而急剧上升。政府销售机构使国内商品价格不像出口价格上涨得那么快,这就产生差不多同样的影响。我们已经看到,有些国家,尤其是缅甸和加纳,已经用这种方法取得了巨大的储蓄。实行这种计划

    的最好时机是在美国出现衰退的时候。那时价格低,实际税

    收也低。比例增减制在衰退时期实行比在物价高时实行容易

    为人们所接受,而且一实行就可征收重税。

    应当指出,讨论高边际税率是为了应用于不断增加的货

    币收入,而不只是应用于不断增加的实际收入。在最需要作

    出这一努力的国家内,实际人均收入根本没有增加(如印

    度),所以,如果政府仅限于从增加的实际人均收入中得到较

    大份额的话,可能永远办不了任何事情。如果实际人均收入

    上升,那更好,但是,同样重要的是要在不变的实际收入中,

    控制越来越大的一部分。不管实际收入的情况可能如何,货

    币收入都可能会增加。工业国的价格趋势是上升的,部分原

    因是通货膨胀的压力,另一部分原因是工会的行动使货币工

    资比生产率提高得快。工业国货币需求的这种不断增长往往

    使农产品价格上涨,但有些上下波动,用于出口的剩余农产

    品没有和工业需求同步增长,这一事实在今后几年内可能还

    会继续产生同样的影响。鉴于价格上涨的趋势,一个政府如

    果财政结构正确,在国民收入中所占的份额就会不断增长,不

    管实际收入增加与否。

    如果一个政府想通过税收在国民收入中得到更大的份额

    在政治上困难太大的话,它通过通货膨胀可以取得同样的结

    果,如果这样做不会在政治上遇到同样困难的话。在欠发达

    国家,通货膨胀和税收具有同样的效果(第五章第二节(一))。它们使消费品从社会其他成员那里转向那些从事资本形成的人。在有人失业的工业国经济中,用建立信贷的办法

    为资本形成提供资金比税收优越,因为这种做法同时可以创

    造更多的消费品,但是在欠发达国家的经济中,即使它们有

    剩余劳动力,要想在很大程度上这样做是不可能的。通货膨

    胀与税收的差别还在于,它往往会使利润提高,因此会刺激

    私人企业家积累资本。一定程度的通货膨胀如果加以控制,对

    经济发展是有帮助的。如果价格的上涨速度低于利率,投机

    就没有利润了。因此,如果价格每年平均上涨3—4%,我们

    就可以收到通货膨胀为资本形成服务的一切好处,而不会造

    成引起投机浪潮和抛出货币的很大危险,特别是如果其间每

    隔三四年价格略有下降的话。此外,正如我们所看到的,为

    资本形成搞通货膨胀到一定时候会自拆台脚。通货膨胀有三

    个阶段。在第一阶段,当创造资本的时候,价格急剧上涨。在

    第二阶段,通货膨胀可能自行逐步消失,因为价格的上涨改

    变了收入的分配,以致自愿储蓄迅速赶上投资。在第三阶段,

    价格下跌,因为由于资本形成而增加的消费品已开始进入市

    场。只有第一阶段是危险的和痛苦的。

    通货膨胀对资本形成的影响取决于通货膨胀的目的。如

    果通货膨胀是由于政府花钱向公务员支付高薪或进行战争,

    就没有理由期望通货膨胀会增加资本形成,除非那个国家有

    相当多的工业资本家把从通货膨胀中获得的利润作为固定资

    本投资,而这种情况在先进国家出现的可能性比在不发达国

    家出现的可能性大。另一方面,不论这个国家是不是不发达

    国家,如果通货膨胀是由于政府把钱花在创造有用的资产上,如修建灌溉系统,那么立即产生的效果将是这些有用资产增加,而不管通货膨胀带来的利润的情况如何。在最近的一些

    文章中,有些幼稚的调查者声称,通货膨胀没有增加资本形

    成,因为他们表明,在一些发生通货膨胀的地方(尤其是拉

    丁美洲),并没有增加资本形成。这样来概括通货膨胀的影响

    是不明智的。用于破坏目的的通货膨胀产生破坏性的影响,而

    由于为加速资本形成而创造货币的通货膨胀则加速了资本形

    成,苏联、日本或每一商业周期的上升阶段的情况都是这样。

    某些国家无论从经济上来说还是从政治上来说,创造信

    贷的能力比别国强。在经济方面,有关的问题是:谁将获得

    通货膨胀的利润及他们用它做什么?花在消费上、进行商品

    投机、创造新的固定资本、储藏起来还是购买公债?消费品

    的产量能否迅速扩大?或者通货膨胀的第一阶段是否会很长?

    它是否是这样一种经济,即基本必需品的价格很容易控制,而

    不会使黑市大大增加?是否会有使需求膨胀转变为成本膨胀

    的强大的工会运动?能否使外汇形势得到保障?是否有高边

    际税率把通货膨胀带来的货币收入的50%一出现就吞掉?各

    国对这些问题的答案是大不相同的,结果是,创造一定数量

    的信贷在一个国家会使价格上涨10%,而在另一个国家可能

    会使价格上涨一倍。对通货膨胀的政治反应也是大不相同的。

    在某些国家,从政治上说,政府必须采取措施来大幅度提高

    实际收入,即使这样做会引起某种程度的通货膨胀,因此,通

    货膨胀可能是政治生存的条件。在另一些国家,公众在最近

    几年内已受够了通货膨胀的祸害,因此希望政府严格控制货

    币供应。因为通货膨胀主要取代了税收,所以是否采用通货膨胀方法的决定主要是政治决定,必须根据各种不同的政治方案来作出。

    反对通货膨胀的一个最有力的政治理由是,一旦承认了

    采用这种办法的可能性,就无法相信政府会知道把界线划在

    哪里。奉行预算必须平衡的原则的最大好处是,它使财政部

    长能够在内阁里约束他的同事。他们可能十分雄辩地为扩大

    某种服务申述理由,但是只要财政部长的预算必须是平衡的,

    他的地位就是无懈可击的。一旦放弃这一原则,对政府开支

    还有什么控制呢?解决这一难题的一个办法是有两个预算,一

    个预算的经费只能来自岁入,另一个预算只包括那些迅速增

    加产出的服务(尤其是用于土地开垦、乡村水利、培训设施

    和农业推广的开支,)它可通过建立信贷来获得经费。但是,

    这并没有把问题全都解决了,因为随后就可能对什么应转入

    第二个预算发生争论。什么行政手段都不能使政府摆脱既要

    勇敢又要克制的必要性。

    除了税收和建立信贷以外,另一个岁入来源是政府机构

    中的小额储蓄,其中最重要的是邮政储金局。在那些为这一

    运动作过努力的欠发达国家内,各种小额储蓄,包括合作运

    动中的储蓄和友好团体中的储蓄,数额各不相同,在国民收

    入中所占的比例从零到2%左右都有。毋庸说,促进这种储蓄

    是多么重要。对储蓄者来说,这种储蓄表示独立、自尊和有

    备无患,这一点甚至比这种储蓄对国家财政问题作出的贡献

    更为重要。在这方面,取得最大成功的国家是日本,据估计,

    那里的小额储蓄在国民收入中所占的比例高达8%。这无疑

    是值得效法的榜样(第五章第二节(二))。

    最后,还存在着在国外筹集资金的可能性,不管是靠赠

    款还是贷款。有些国家这样做的条件比别的国家好。但是,把

    欠发达国家作为一个整体来看,前景似乎并不十分光明。非

    洲和亚洲(不包括中国、日本和苏联)的年国民收入加起来

    为750亿美元。这个数字的1%为7.5亿美元,远远超过现

    在流入那两个洲的所有外国投资和外国援助。如果要使那两

    个洲的资本形成达到占国民净收入的12%,所需数额远远超

    出任何可能的外国投资或外国援助。因此,不管这些国家能

    从国外得到什么,如果它们要想取得很大的进展,就必须依

    靠自己的力量。

    没有理由怀疑,大多数欠发达国家如果愿意的话,是可

    以大大增加资本形成的。摆在它们面前的是苏联和日本的榜

    样,这两个国家的实际人均产出上升得比别国快,即年率为

    3%左右,而居第二位的美国,不到2%。自1929年以来,苏

    联一直是那个速度,而日本自19世纪70年代以来也一直是

    那个速度。(产出增加同消费增加是不一样的;由于用于国防

    和资本形成的产出大量增加,苏联1939年的人均消费水平并

    不比1929年高。)这种高速的增长同人们生活的每个方面发

    生的变化都有联系,包括净资本形成每年的年率达到15%以

    上。在这两种情况下,通货膨胀和高税收都发挥了重大作用。

    苏联把注意力集中在工业化上,同农民进行斗争,而不是教

    他们如何提高每英亩的产量。在10年的时间内,它的大规模

    工业产出增加了两倍,而农业产出的增长速度仅略高于人口

    的增长速度。这种不平衡造成了物价猛涨,在10年时间内,

    物价差不多上涨了6倍。日本人比较明智,整个说来,他们的产出增长很快,同苏联差不多,但是他们对工业和农业予以同样的重视。在第一次世界大战前的30年内,他们的人均

    农业产出增加了一倍。但是即使如此以及大量征税,他们的

    价格在这一时期内也只涨了一倍。看来,如果没有某种程度

    的通货膨胀,要达到这种高度的资本形成率和增长率是不可

    能的,因为除此以外,要达到为15%以上的净资本形成所需

    要的税收和储蓄水平是做不到的。但是,如果政府和人民都

    抱有经济增长的目标,即使没有通货膨胀,通过税收和自愿

    储蓄,要达到10—12%的资本形成水平仍然是可能的,而且

    应当更易达到,因为在那两国的经济中,都存在着剩余劳动

    力,这使得有可能创造某种形式的有用的资本,而且在这样

    做的时候,不降低消费水平。

    使人产生疑问的并不是加快资本形成的速度在经济上是

    否可能,而是在民主社会中这样做在政治上是否可能。主要

    问题是,对农民适当征税在政治上是否可行。正如我们已经

    看到的(第五章第二节(二)),在不发达国家,不征收大量

    农业税来促进资本形成,要大大加快资本形成的速度是不可

    能的。极权主义政权可以做到这一点,它们基本上就是这样

    做的;但是它们无需担心投票箱的情况。民主政权也可以这

    样做——加纳和缅甸目前就是这样做的,但是只有在它们的

    政治领导人得到民众的广泛信任和支持时,它们才能这样做。

    在世界上的许多国家内,新兴民族主义政权已经在高涨的民

    族情绪潮流中执政;有待分晓的是,它们是否具有使它们的

    国家摆脱贫困的勇气和决心。

    第三节 权力和政治

    政府可以对经济的增长产生明显的影响。如果政府处事

    正确,就会促进增长。如果它们做得太少或太多,或处事错

    误,就会妨碍增长。在本节中,我们首先研究为什么会妨碍

    增长,最后问一下什么样的社会条件才能产生好政府。

    (一) 通往停滞之路

    我们认为在9种情况下政府可能会使经济停滞或下降,

    这就是:维持不了秩序,对公民进行掠夺,鼓动一个阶级剥

    削另一个阶级,阻碍对外交流,忽视公共服务,过分放任自

    流,控制过严,花钱过多和进行劳民伤财的战争。对每一点

    都可以说几句话。

    软弱的政府在国内维持不了秩序。抢劫和纵火使财产难

    以保持安全。土匪、劫匪和拦路强盗抢劫旅客,使国内的商

    业减少。地方首领叛乱,使贸易受损失,把国家投入内战之

    中。每当统治者去世,必发生争夺继承权的斗争。世界的大

    部分历史都可以这样写,只是有时候出现了某个强大的帝国,

    维护了广大地区的和平。这基本上是一个在全国范围内保持

    一支有效的警察部队、有效的法庭和一个忠诚的政府的问题。

    但是,世界各国人民并不普遍知道这样做的奥秘。政府靠服

    从来统治,一旦服从的意志崩溃,要维持秩序就极为困难,需

    要付出很大的代价。因此,问题并不仅仅在于建立正确的机

    构,而是要以自己的行动使人民认识到服从是一种权利并甘愿服从。经济发展可能会使服从比较容易,因为可以把更大的权力集中在政府手里,并以新的武器——报纸及电台——

    来影响人们的思想。尽管如此,1900年的世界秩序没有1954

    年那么混乱。

    不腐败的政府极少,而腐败是妨碍经济增长的第二个因

    素。在大多数国家内,文官或政治家,或两者认为自己有权

    靠贪污、盗用公款、裙带风或使自己得到有利的合同来发财。

    实际上,19世纪是怎样制止这种行为的,使人感到有点迷惑

    不解。在1800年,英国的官场生活同其他大多数国家的官场

    生活一样腐败,但是到1900年,舆论发生了很大的变化,从

    而使腐败风气大大减少了。毫无疑问,在某些国家内,腐败

    的原因之一是公务人员薪金太低;如果公务人员的薪金相当

    优厚,而不比同行业的同行低得多,那么消除腐败风气就会

    容易得多。无论如何,腐败对经济增长的有害影响可能被大

    大夸大了。从商人的观点来看,贪污只是对服务的一种支付

    形式。如果所需贿赂数量不大,同与他们有关的交易的利润

    有关,如果这种贿赂在签订合同时是可以预料到的,那么像

    其他成本一样,它们也只是一种成本,在价格中转嫁给消费

    者。对生意起妨碍作用的是官员们出人意料的行为;不知道

    谁会突然蹦出来要钱,不知道用多少钱才能收买他。在资本

    主义前的社会里,商人阶级通常受贵族及王子们的摆布,他

    们要求提供贷款而无意偿还,他们随心所欲地征税,迫使资

    本家以易于隐藏和易于转移的方式保存财富。结果妨碍了生

    产性投资,这就是那些国家的经济中资本主义部分发展得如

    此缓慢的主要原因之一(第五章第二节(二)。

    第三是阶级对阶级的剥削。历史上的例子比比皆是:事

    实上,马克思主义者认为,只有这样理解历史,才能懂得历

    史。剥削有许多种形式。最普通的形式是地主剥削农民,在

    人口过剩的条件下,地主可能拿走农民的一半产品。在历史

    上,奴隶制和农奴制也很普遍。这种划分可能完全以少数人

    拥有财产为基础。另外,还有旨在维护某个种族、宗教或文

    化集团的特权的其他障碍——比如工业国家里对有色人种的

    歧视,可能是少数人维护这种障碍,但多数人对少数人保持

    这种障碍也是同样可能的。当然,还有“阶级战争”,现在预

    计雇主和雇员将彼此进行这种战争。

    几乎所有的政府都在促进某种分化,因为政府通常都从

    某一个集团得到支持。有反对地主和城市的农民政府;反对

    农民和工业家的地主政府;白人至上的政府、反白人政府、奴

    隶主政府、天主教政府、新教政府、资本家政府、劳工政府

    等,事实上,所有政府几乎都是建立在人类之间可以想像得

    到的一切分化的基础之上的。“中立”政府从未存在过。某些

    最好的极权主义政权试图在各阶级之间保持公允的面貌,但

    是,即使保持公允也不过支持现状而已。民主政府要装得公

    允没有极权主义政府那么容易,因为大多数的选票总是倒向

    那些能够鼓动起最大热情的人,除非选民已有一种容忍和理

    智的传统。

    我们感兴趣的是阶级剥削对经济增长的影响。有关的几

    点是其对社会流动性及对积极性的影响。奴隶制、农奴制、财

    富集中在少数人手里以及以等级、出生、种族或宗教为基础

    的一切划分都减少了纵向流动性和职业之间的流动性,从而使社会无法利用一些优先人才担任高级职位,迫使它依靠一些庸才来担任本来可以由优秀人才来担任的职位(第三章第

    三节(二))。这一点的重要性如何取决于特权阶级的大小及

    其气量如何。如果它的人数很多,它可以为所有高级职位提

    供所需人才。如果它气量大,它会破例起用被排斥在外的阶

    级的最优秀人才,甚至可能为了加强自己的力量而破例利用

    聪明的奴隶、犹太人或其他下层人民的才华,同时把其余人

    牢牢置于俯首听命的地位。为了繁荣,只需要有少量的纵向

    流动,只是下层集团中最优秀人才的流动。但是,为了繁荣,

    需要更为广泛地调动人们的积极性,因为最好是人人都积极

    地充分利用自己面前出现的机会。

    对于从前的农奴、奴隶、农民及大多数其他下层阶级的

    人缺乏积极性带来的影响,现在已经普遍取得一致的看法。对

    积极性的兴趣主要集中在目前时髦的阶级战争,即雇主和雇

    员之间的战争上。目前,所有资本主义政府都在朝着对资本

    家课以重税,利用这种收入来向雇员提供广泛的社会服务这

    个方向前进。这种政策的两个部分都受到了攻击;攻击对资

    本家征税的理由是这样做不利于投资,攻击提供社会服务的

    理由是这样做使工人失去了劳动的积极性以及直接为工人的

    孩子的教育或者为防止失业、疾病等保险提供经费。从理论

    上说,由穷人掠夺富人可能会葬送繁荣,这是毫无疑问的;实

    际问题只是在什么限度内这样做才是安全的。(历史上的事例

    有:对公元前2500—2000年期间埃及繁杂的衰落的原因所进

    行的一些非常可疑的猜测,对公元3世纪任意征税在破坏罗

    马帝国的繁荣方面所起的作用所进行的同样可疑的猜测,海地革命的后果的有关例子也是可疑的。如果罗马帝国的例子能够成立,从中得出的结论大概是起破坏作用的是任意征税

    而不是高额征税。企业界大概能够使自己适应几乎是任何水

    平的征税,如果它知道该期望什么的话。至于腐败,具有破

    坏性的可能是无法预料的东西:就像罗马人受到的突然征税

    一样。)我们可以接受这样的看法,即停滞既可能是掠夺富有

    创业精神的少数人造成的,也可能是剥削多数人造成的,至

    于哪种情况适合于这些类别则仍然是不可知的。

    第四,政府由于对同外国人交往设置障碍可能妨碍经济

    增长。我们已经看到了为什么外贸常常是经济加速发展的起

    点的原因(第五章第三节(二))。外国人带来了新技术、新

    趣味、资本和不断扩大的市场。他们也可能带来剥削。但是

    如果为了防止剥削而把他们完全关在门外,国家也同样失去

    了他们带来的刺激。大多数国家的政府会情不自禁地阻碍同

    外国人的交往,因此排外是笼络人心的最可靠的途径之一。另

    一方面,同样有一些软弱的政府,它们签订协定,为了一点

    小利而向外国人出让有价值的东西,或者任由外国金融家摆

    布而失去主权(第五章第二节(三)和第六章第二节(三))。

    只有最好的政府才能最大限度地利用外国的资金和技术。目

    前,大多数欠发达国家都处在对19世纪的帝国主义作出反应

    的状态之中。它们讨厌外国资本和外国管理,它们急于做的

    是保护自己不受进一步的剥削,而不是利用目前的机会。

    第五,政府由于在公共服务方面花钱不够而阻碍经济的

    增长。发展需要公路、供水、教育、公共卫生等等。如果有

    足够的机会让私人企业来弥补这种不足,这一缺点并不严重。

    政府做的一切事情,私人公司在某个时候也都几乎做了,其中包括修筑公路、提供警察、消防和仲裁。实际上,在公共服务的大多数领域,私人企业是开路先锋,政府只是后来才

    介入的。但是,它们在各地介入以后,都把这些服务从私人

    企业家那里接管过去了,因为各地似乎都认为,“公共”服务

    还是由“公共”当局操办好。无论如何,不管是否需要由政

    府来操办这些服务,它们能够促进经济增长的方法之一是发

    展足够的公共服务,因为这些服务是其他事业发展的必要基

    础。

    政府也有重要的开拓工作要做,而许多政府却没有这样做。它们需要做多少事情取决于它们的私人企业家的人数、质量和冒险精神。国家越落后,政府开拓的余地越大。(非常说明问题的例子是伊丽莎白一世时期伯利的经济活动及日本政府19世纪末期的经济活动。)需要由政府来支持研究、请移民来建立新工业、保护新兴工业、支持外贸工作、建立农业推广服务、低息提供信贷等等。因此,如果一个落后国家的政府不管是由于懒惰还是由于哲学信念,采取自由放任的态

    度,那是不幸的。这正是19世纪和20世纪的大英殖民帝国

    的不幸。对大英殖民帝国的剥削比对历史上其他任何帝国的

    剥削都少。在将近一个世纪的时间内,对贸易特惠没有加以

    限制,没有征收贡赋,在经济生活中没有什么等级制度。和

    平建立了,腐败现象减少了,司法公平地实施了,外贸前进

    了,公共服务建立和扩大了。但是,这个帝国在经济上失败

    了,原因正是它奉行自由放任的政策。在农业方面,没有教

    农民学会新方法,也没有向他们提供新的种子或肥料;在工业方面,没有做任何事情来扶植新的制造业,没有帮助它们

    度过发展中的困难阶段。因此,总产出的增长速度始终是缓

    慢的,与受到其他福利措施鼓励的人口增长速度差不多。并

    不是所有现代帝国都实行自由放任的政策。20世纪30年代,

    荷兰人在印度尼西亚放弃了自由放任的政策,实行一系列非

    常有趣的措施,可惜为时已晚,无法赢得臣民的忠诚。比利

    时人在刚果实行强有力的经济政策,看看它的结果是很有意

    思的。

    与自由放任相反的是,政府对管理经济过分热情也可能

    会阻碍它的增长。科尔伯特认为有必要规定布的宽度,苏联

    政府认为有必要压制私人零售业。因为任何一个政府都不能

    取代人民的积极性和常识,所以一个不许人民发挥积极性和

    运用常识的政府必然会限制经济的增长。例如,苏联把经济

    成就归功于中央计划,但这是错误的。它的成功是由于高度

    的资本形成,就像日本取得的成就一样,而日本并没有采用

    俄国的计划方式,而且通货膨胀率也没有俄国那么高。如果

    苏联允许人民发挥更大的积极性,消费者用同样的钱得到的

    服务的质量就会好得多,农业的产量就会高得多。政府在经

    济生活中的问题是在计划过多和过少之间以及在国有化过多

    和过少之间寻找一条正确的道路。这里不宜对这个问题扯得

    过多,因为本作者在以前的一本书中已经谈过这个问题了。

    其次,政府如果把过多的社会资源用于做自己的事情

    ——修建纪念碑、市政厅、金字塔、公园、公路、学校或其

    他公共服务——也可能阻碍经济增长。政府所有的活动几乎

    都间接有助于增加其他产出,但是,在这个意义上讲,有些活动产出多些,有些则少些。如果政府把大量的钱用在自己的服务上,就可能把本可以投资在私人部门并产生更大效益的钱用光。在有剩余劳动力的国家里,有时有人为这种大手大脚的花钱辩护,理由是,如果不把劳动力用于这些方面,他们也是失业的。诚然,如果在使用剩余劳动力时不同时使用其他稀少的资源——物资、机器等,那费用是微不足道的,但并不总是能做到这一点。此外,即使浪费地使用剩余劳动力不减少其他产出,有成果地使用这种劳动力则会增加产出。如

    果有剩余劳动力,用它来扩大灌溉系统比用它来造金字塔好。

    如果作为政府经费的税收是用挫伤积极性的办法征来

    的,那么政府大量用钱除了实际浪费资源外,还可能阻碍经

    济增长。这基本上是一个方法问题。如果人们知道,他们得

    把很大一部分收入交给别人,他们可能不愿意作出额外的努

    力;这一点还不能绝对肯定,因为作用可能是一样的,即为

    了达到想往的生活水平,有必要更加努力地工作,但是这可

    能是一种反作用。如果人们作出这样的反应,按产出比例征

    收所得税和土地税就会妨碍积极性,如果这些税收比方说高

    于三分之一,情况也许会更其如此。但是,如果征收间接税

    而不是直接税,这种影响基本上可以避免。纳税者通常不知

    道他购买的物品的价格中含有多少税收,所以只要税收的消

    极影响是心理上的,采用间接税而不用直接税的办法就可以

    避免。(我们在前面的第二节(二)中已经看到,间接税可以

    同直接税一样进步。)

    此外,税收的变化可能比税收的绝对水平更为重要。人们讨厌增加税收,对任何增税可能都是反对的,直至在他们头脑中的印象消失为止。如果增加的是间接税,效果则可能是使人们增加努力,而不是减少努力。正如我们在第二章第二节(一)中所看到的,随着人们做出努力的报酬的增加,他们工作的时间减少了,因为他们用不断增加的收入买来了更多的空闲时间。由此得出的结论是,提高税率的效果必然是增加努力,如果所征的税是间接税的话。人们还特别讨厌税务机关可以随意变化的反复无常的税收。如果不是根据收入而是根据商品征收的税收稳定,人们就会使自己适应任何水平的税收,使自己保持“合理的”生活水平。因此,高税率对人们的努力的影响同贫瘠土壤或其他贫乏的自然资源对人们的努力的影响是一样的;生产率低可能激励人们作出努力,也可能使人们泄气,或者与人们的努力毫不相干;对此我们也说不准(见第二章第三节)。(对提高税率的影响感到有把握是可能的,但是对实行高税率的影响则仍然不得而知。因为对一种税的眼前的反应和最后的反应并不一定是一样的。)因此,如果征收的是间接税,如果避免变化,那么在长期内税收可达到的比例并没有简单的限度,比如25%或50%。所以,如果人均实际收入增加,边际间接税增加的幅度大于平均间接税,那么政府的份额将一直增加,但人民的生活水平也将提高,而且由于税收未变,大多数人对此将漠不关心。因此,高税率如处理不当可能会挫伤积极性,但如使用适当的方法,可能不会影响积极性。高税率对经济增长造成的实际负担是,它可能把本来可以作为效益更高的投资的资源用光。

    浪费资源的极端的例子是把资源用于不成功的侵略战争,或用于虽取得成功但得不偿失的战争。战争降低了资本形成的速度,使许多有才华和有进取心的年轻人丧生,加强具有军事头脑的人对具有经济头脑的人的力量,而且与群众的看法相反,对刺激有用的发明毫无作用(见第六章第三节(三))。为战争付出代价的最近的例子是德国;谁能怀疑如果德国人能避免1914年和1939年的战争,他们现在还会繁荣得多?

    政府可能阻碍经济增长的方面就是这些。显然,施政得

    当是很困难的,所以丝毫也不奇怪,大多数国家在大部分历

    史上经济都未取得增长,而一些最繁荣的国家由于官场腐败

    而走向衰落。政府花钱既不可太多,也不可太少,控制既不

    可太严,也不可太松;主动性既不可太多,也不可太少;对

    外国人既要予以鼓励,又不可受其摆布;既不允许阶级剥削,

    也不助长阶级战争,等等。看来有些国家在度过这些对立的

    危险方面比另一些国能干得多。其原因何在呢?

    (二) 治国才能的背景

    需要研究的不是持续一二十年的治国好坏的偶然时期,

    而是持续一两个世纪以上的长期特征。所有国家在不同时期

    都会有或好或坏的政府,不管总的施政情况是好、是坏还是

    不好不坏。延续一个世纪以上的好政府往往会自行长期延续

    下去,因为它为官员们确立了很高的行为标准,这会成为国

    家的传统,影响后代的行为。同样,不好的政府长期执政会

    减少建立好政府的可能性,因为新的一代人生下来看到的就

    是低标准,无优良传统可循。因此,在一个国家历史上的任

    何时期,人们基本上可以根据它以前的历史以及这种历史遗留下来的传统来解释官场的品德。问题在于为什么这个国家有比较好的政府或比较糟的政府的历史。

    我们得再次研究一下自然资源及其与人的品质可能的联

    系。有些人认为,有些种族的治理能力比另一些种族强。如

    果从文化意义上使用“种族”一词,这不过是重述了我们正

    谋求解决的问题;如果从生物学意义上使用这个词,这种假

    说在我们对不同民族的遗传因素有了更多的了解之前,不可

    能再前进一步了。迄今我们所知道的一点情况否定了这样一

    种观念,即有利于建立好政府的基因有特殊的地理分布。关

    于气候的假说也无济于事。看来,在世界各种气候中,在各

    个种族中,在自然资源贫乏和自然资源丰富的各种条件下,都

    有好政府和坏政府。人类对资源的反应不能用资源本身来解

    释。

    自从柏拉图以来,政治哲学家们一直试图从体制形式的

    角度来解释出现好政府的原因,他们说,在民主制、专制制、

    仁慈的独裁制、君主制成某个哲学家或当时的风尚所支持的

    任何体制的条件下,好政府存在的可能性就比较大。如果对

    历史很熟悉的话,就知道这种说法是站不住脚的。例如,意

    大利有文字记载的历史始于2500年以前,其间经历过每一种

    体制。要排出任何一种体制——比如说民主制时期、君主制

    时期或独裁时期——并说意大利在这种体制下始终比在其他

    体制下治理得好,那是不可能的。这同样适用于有文字记载

    的历史更长的希腊、埃及、印度和中国。好政府需要把统治

    者的智慧和被统治者的拥护结合在一起,这种结合并不是君

    主、民主派或独裁者所垄断的。这样说并不是要贬低制度的牵制作用或体制形式的重要性。民主形式的政府如果对执政者的权力予以充分的限制,就能消除统治过严的弊病。但是,

    并不是所有的民主体制都包括充分的限制,即使最好的宪法

    也无法保证选出一个好政府。政府的质量与其说取决于政府

    的形式,不如说取决于被统治者的素质。

    20世纪的制度理论有时候提出自治的要求,以此与帝国

    主义相对立。但是,为了尊重历史,我们不能说,国家实现

    自治时就一定比被别国统治时治理得好。正相反,历史上最

    幸运的一些时期是处于鼎盛时期的大帝国,在广泛的地区内

    实现和平,提供范围相当广泛的公共服务的时期。20世纪诞

    生的新的民族主义政府比它们所取代的帝国主义政府具有某

    些优点。它们不那么倾向于自由放任,在落后的条件下,自

    由放任是不合适的。它们比较关心农民的福利,更加迫切地

    想保护农民不受地主和高利贷者的剥削。大多数民族主义政

    府反对种族歧视和妨碍本地人进取心的其他限制。它们有时

    候能够在强调自尊的基础上唤起参与发展的热情,而在它们

    以前的帝国是做不到这一点的。另一方面,它们又有很大的

    缺点。它的稳定程度低得多,有时候甚至不能维持国内的秩

    序。它们作为一个阶级(有个别例外)比它们的前任腐败。它

    们往往同城市利益过多地牵连在一起,非常愿意以向农民征

    税为代价来增进城市的利益。它们很容易产生排外主义。它

    们所取代的帝国可以在宗教、阶级和种族之间保持崇高的中

    立,它们却往往放弃这种中立,而进行自相残杀的斗争,等

    等。在支持自治的人中间,有些比较玩世不恭的人支持自治

    的根据是,“自治比善于治理好”。当然,不能根据下面这一点来支持自治,即自治始终会带来比别的办法更好的治理。

    对待我们这个问题的另一种态度认为,解决办法在于同

    一种文化。如果一个国家的成员都是同一种族,信仰同一宗

    教,使用同一语言,他们就会减少争吵,可能养成一种宽容

    的习惯。如果财富也广泛地分配,没有巨富和赤贫,政治生

    活就会比较简单。另一方面,同一种文化虽然会消除产生某

    些斗争的原因,但不能保证政府会积极地或明智地行动。此

    外,一些最好的政府却是比较公正地统治着许多种族、宗教

    和文化的帝国政府。宽容是在许多土地上生长的植物。

    对那些相信原罪的人来说,好政府在一个国家的历史上

    始终是一个暂时的阶段,因为人类无法防止政府走向导致经

    济停滞的某个方向。于是,野心勃勃的国家就会情不自禁地

    发动一系列的侵略战争,在几十年内,可能会带来收获,但

    是最终会使国家毁灭(第六章第三节(三))。或者如果和平

    保持了几十年,官僚们就会出来过分增大政府开支,沉重的

    税收会把国家毁掉。或者控制经济和纠正错误的欲望过于强

    烈,无法抑制,大量的控制条例会窒息个人积极性。或者政

    府不可避免地卷入阶级纠纷,干扰企业家,把农民置于农奴

    状态,支持剥削或者限制积极性。如果我们这样看问题,那

    么鉴于人类智慧的局限性及等待着不谨慎的政治家的无数的

    诱惑,令人感到奇怪的倒并不是人类历史上好政府多么少,而

    是与此相反,好政府多么多。

    如果我们想在本书中找到了解人类历史的线索,我们是

    找不到的。也许线索是不存在的。我们对人类行为作出的每

    一个解释本身只是提出了另一个问题。如果我们要问为什么每个民族作出了某种选择,答案通常要从该民族的历史中去

    找。但是如果我们要问它为什么会有那种历史,我们就会重

    新回到神秘莫测的宇宙中去。幸运的是,并不是所有的答案

    都得依靠历史。如果一个国家在适当的时候很幸运地拥有正

    确的领袖,它就有可能开创新的局面。归根结底,历史只不

    过是人们对他们时代的挑战如何作出反应的记录。所有国家

    只要鼓起足够的勇气和决心,都有它们可以抓住的机会。

    附录 经济增长是否可取?

    像其他任何事情一样,经济增长是要付出代价的。如果

    经济增长可以在不产生任何不利条件的情况下实现,那么人

    人都会完全赞成。但是,由于经济增长有其实际的不利条件,

    人们根据其对利弊的不同估计对经济增长采取不同的态度。

    他们可能不喜欢同经济增长联系在一起的社会,而喜欢在稳

    定的社会中盛行的那种态度和制度。或者即使他们适应增长

    社会的制度,他们也可能不喜欢由稳定社会转变为增长社会

    的那个过渡过程;因此,他们可能会得出这样的结论:增长

    带来的好处与增长造成的动荡的代价相比是不值得的,或者

    增长应当逐步实现,这样社会就有尽可能长的时间来适应经

    济增长所需要的变化。我们首先谈增长的有利条件,然后再

    从增长所需要的态度以及在过渡过程中出现的动荡的角度来

    考虑增长的代价。

    (一)经济增长的好处

    经济增长的好处并不是财富增加了幸福,而是财富增加

    了人们选择的范围。把财富和幸福联系起来是很难的。幸福

    来自一个人对生活的看法:随遇而安,乐观开朗和不为未来

    担心。财富增加的财力如超过财富增加的欲望,会增加幸福,

    但情况不一定如此,还没有证据证明,富人比穷人幸福,或者个人的幸福会随着收入的增加而增加。如果在获得财富以后,不再随遇而安,而是对财力和前途更加担心了,那么财

    富会减少幸福。的确有一些说明这种情况的证据。只要经济

    增长来自机警地捕捉经济机会,那么与人们不那么关心增长

    的社会相比,幸福必然会少一些。证据表明,美利坚合众国

    精神上的动荡比其他国家严重得多,即使考虑统计报告中的

    差别,至少可以相信,自杀率高同在一个已经富有的社会中

    追求更大的成功的努力是有因果关系的。我们当然不能说,增

    加财富会增加幸福,我们也不能说,增加财富会减少幸福,即

    使我们能这样说,那也不能成为反对经济增长的决定性理由,

    因为幸福并不是生活中唯一的好事。我们不知道生活的目的

    是什么,但是,如果是幸福,那么演变可能老早就停止了,因

    为没有理由认为,人比猪或比鱼更幸福。人与猪的差别在于,

    人有控制自己的环境的更大的能力;而不在于人更加幸福。在

    这一较量中,经济增长是十分可取的。

    经济增长的理由是,它使人类具有控制自己环境的更大

    能力,因此增加了人类的自由。

    我们首先可以在人与自然的关系中看到这一点。在原始

    阶段,人类得为生存而斗争。他们经过极其艰苦的劳动,从

    土地上得到仅够维持生活的东西。每年,他们有几个月的时

    间忍饥挨饿,因为当年的收获吃不到下一个收获期。他们经

    常遭到饥荒、瘟疫和传染病的危害。他们的孩子有一半不到

    10岁就死去了,他们的妻子到40岁就是满脸皱纹的老妇了。

    经济增长使他们能够摆脱这种无能为力的状态。技术的改进

    减少了劳动量,增加了食物的数量和品种。饥荒消除了,婴儿死亡率从30%下降到3%;死亡率从4%下降到1%。霍乱、天花、疟疾、钩虫病、黄热病、瘟疫、麻疯病和肺病完全消失了。因此,生活本身摆脱了一些自然威胁。并不是人人都

    认为这是一种进步。如果你认为活着不如死了好,最好是不

    生,那么你就不会认为经济增长使死亡率下降这一事实了不

    起。但是我们大多数人仍然很原始,以致理所当然地认为,活

    着比死好。

    经济增长也使我们有了选择更多空闲时间的自由。在原

    始状态,我们仅仅为了活命就得拼命劳动。经济增长以后,我

    们就能希望有更多的空闲时间或更多的物品,实际上,我们

    的确希望既有更多的空闲时间又有更多的物品。如果贫穷的

    农业国与富有的工业国相比,会得到一个相反的印象,因为

    在农业国,当天气不利于农业的时候,在一年的很大一部分

    时间里,人们都无事可做,而在工业国,人们一年到头都正

    常地劳动;但是这是一种错误的比较。如果我们不是用工业

    去与农业相比,而是用富国的工业部门与穷国的工业部门相

    比,同样再对这两类国家的农业部门进行比较,我们将会几

    乎毫无例外地发现,随着收入的增加,每个部门的劳动时间

    都会缩短随着使用的机械力量的增加,劳动的艰苦程度也会

    减轻。

    另外,经济增长除了使我们得到的货物和空闲时间增加

    以外,得到的服务也会增加。在最穷的社会里,为了获得粮

    食,需要有60%或70%的人从事农业,而在最富的国家里,

    有12—15%的人从事农业就足以提供好一倍的营养标准。因

    此,越富的国家就越能腾出人来从事其他的活动——当医生、护士和牙科医生;当教师;当演员和表演者;当艺术家和音乐家。哲学家们所珍视的许多“高等”活动——艺术、音乐、

    研究哲学本身——在某种意义上是一种奢侈品,只有随着经

    济的增长使越来越多的人摆脱生产粮食的基本任务,社会才

    能开展那些活动。诚然,只需要较少的剩余就可以支持艺术

    活动,一些最高的艺术成就是在广大群众还很贫穷的社会中

    产生的。上世纪生活水平的提高扩大了欣赏和实践艺术的机

    会,而不一定会对最好的艺术的质量和数量产生什么影响。但

    是,且不说最高的艺术,群众的空闲时间以及欣赏以前只供

    极少数人欣赏的奢侈品的机会无疑大大增加了。今天,听最

    优秀的作曲家的作品的人比莫扎特或巴赫时代听他们作品的

    人多得多了,看伦勃朗和埃尔格雷科的作品的人也多得多了。

    从这些变化中,妇女得到的好处甚至比男人还多。在大

    多数不发达国家里,妇女是苦役,在家里做那些在比较先进

    国家中已由机器做的事情——连续几小时碾磨谷物,走好几

    里路去提水,等等。经济增长把这些任务及其他许多任务——

    纺织、教育孩子、照顾病人——交给外单位去做了,那些单

    位专业化程度高,资本雄厚,具有大生产的一切有利条件。在

    这个过程中,妇女摆脱了沉重的劳动,不再关在家庭的圈子

    里,终于得到了成为完全的人的机会,可以像男人一样进行

    思考和发挥才能。男人可以辩论经济进展对他们是否有好处,

    但如果由妇女来辩论经济增长是否可取,这无异于辩论妇女

    是否应该有机会不再当牛马和加入人类的行列。

    经济增长还使人类能够享受更多的人道主义。例如,在处于仅能维持生计的最低水平时,那些自身难保的人哪有能力顾及旁人,最弱者只能以失败而告终。只有随着剩余产品的增加,人们才会越来越关心麻疯病患者、精神错乱者、残废者、盲人及其他不幸者。关心病人、无能者、不幸者、寡妇和孤儿的愿望在文明社会里不一定比在原始社会里强烈。

    但是在文明社会里,可用于这一目的手段比在原始社会里多,因此,事实上,表现出来的人道主义就多。有些人对这种做法感到不安;他们认为,保护那些在竞争性的斗争中不能自立的人是违背社会的优生利益的,他们认为,除非使这种人失去生育能力,否则长期的后果将有伤生物元气。但是,这种人目前仍占少数。

    在那些目前的政治欲望超过资源的社会里,经济增长可

    能特别重要,因为经济增长可能会防止否则可能会出现的难

    以容忍的社会紧张局面。例如,在英国等某些国家内,工人

    阶级或他们的发言人不断要求增加工资,不断要求增加住房、

    教育、卫生和其他设施的开支。如果在这样的社会中,人均

    收入保持稳定,一个集团的欲望只能靠牺牲其它集团的利益

    来满足,这必然会导致内乱。在当今的民主时代,世界上大

    多数国家都处在这样的阶段:除非迅速增加人均产量以使资

    源更接近于欲望,否则严重内乱不可避免。经济增长的这一

    方面给政治家留下的印象最深,所以难怪各地的民主政治家

    都深信促使经济迅速增长的迫切性。同时必须承认,经济增

    长并不是总能减少斗争。相反,经济增长可能会打乱比较平

    稳的社会关系,引起嫉妒和欲望,引起阶级、种族或宗教冲

    突。这同那种认为经济增长不一定增加幸福的看法有关。经

    济增长也不一定能增加政治自由。它增加独裁者通过大众传播媒介控制人的思想和通过组织严密的警察机构来控制人身自由的机会。所以不能说经济增长一定会改善政治关系。

    欲望和力量不相称的另一个方面在国际地位低的国家的

    政治态度中可以看到。现在处于殖民地地位的人民渴望独立。

    人口众多但收入低微的独立国家渴望在国际会议上获得较高

    的地位。不管是对是错,这些国家的人民认为,如果他们更

    富一些,尤其是如果他们富得足以建立起强大的武装力量,他

    们在世界事务中的份量就会增加,他们的国民和他们的生活

    方式就受到比较多的人的尊重。有些民族主义者对现代世界

    的反应是敬而远之,要求他们的人民恢复旧的生活方式。但

    是,已经掌权的大多数民族主义者认为,需要使经济迅速增

    长。许多人认为,各国在财富或经济发展方面的巨大差别是

    引起战争的根源,如果生活水平方面的差距不是很大,世界

    就会更加接近和平。这种看法非常可疑,因为经济迅速增长

    的社会常常会情不自禁地进攻邻居。无论如何,战争的原因

    是多种多样的,是同经济考虑间接有关的,所以从对和平或

    战争可能产生的影响的角度来讨论经济增长的理由是没有助

    益的。

    有时候人们说,期望世界上所有国家都能不断提高生活

    水平必然是幻想,因为其后果只会使世界累积起来的矿物和

    燃料库存迅速枯竭。这种说法所依据的两个假设都难以肯定。

    第一个假设是,人的才智到适当时候就会枯竭,无法找到新

    的东西来取代已经用光的东西,由于我们懂得了原子的性质

    以及从一种元素到另一种元素的转变,这种假设越来越可疑

    了。第二个假设是,子孙后代会对世界的资源有同样的要求。

    为什么我们为了使今后几世纪的人类生活再延长一世纪左右而应该保持贫穷?难道没有同样充分的理由使目前几代人充分利用他们发现的资源而让不知多少世纪以后的人去自己照

    管自己?即使对这些问题的回答都是否定的,也还有另一点

    理由,即把矿物和燃料迅速用光的并不是世界上最穷的国家,

    而是最富的国家。如果这种说法言之有理,可将其视为对欧

    洲和北美的劝告,叫它们不要再进一步提高生活水平,但是

    如果用以劝告亚洲人和非洲人继续保持目前的贫困,那其说

    服力就差远了,因为亚洲人和非洲人目前对累积的资源储藏

    量的利用是微不足道的。

    (二)贪得无厌的社会

    如果不用付出代价就可以得到上述好处,几乎人人都会

    赞成。但是许多人认为,为经济增长所需要的态度和制度本

    身是不可取的;他们喜欢属于稳定的社会的那种态度和制度。

    首先,他们不喜欢节约精神,而这是经济增长的条件之

    一。如果其他条件相同,增长最快的社会就是人们用心通过

    增加利润或降低成本来捕捉经济增长机会的社会。看来,这

    种节约的倾向,除非同或者为了财富本身或者为了财富带来

    的社会威望或对别人的权力而取得财富的愿望联系起来,否

    则实际上不可能得到充分的发展,虽然仅仅为了减少艰苦劳

    动和增加空闲时间来享乐或从事精神活动的愿望,也很有可

    能产生这种倾向。可以说,节约是一种美德,因为憎恶浪费

    和最充分地利用资源就像憎恶谋杀和照顾寡妇和孤儿一样,

    都同样是人类的神圣职责——事实上,关于才能的寓言就是这样说的。并不是每个人都同意,关心和爱护资源或关心和爱护消逝的时间是我们的神圣职责;这些人会说,节约使人

    在精力和幸福方面付出的代价太大,因此它不是美德,而是

    邪恶。他们可能承认有责任履行节约或进行足够的劳动,以

    便达到某种为健康和舒服(一个含糊的概念)所需要的最起

    码的生活水平,但是他们会说,超过这个程度的努力节约是

    不值得的。此外,即使那些承认节约是美德的人也可能同样

    对下面这个事实(如果是事实的话)感到遗憾,即只有在与

    物质主义的邪恶(如果是邪恶的话)联在一起时,才能发现

    这种美德。希望教孩子们最充分地利用他们得到的资源和机

    会(节约的美德),同时不要希望得到比已有的更多的东西

    (避免贪婪的邪恶)是可能的。如果这样做了,如果教育是卓

    有成效的,那么经济仍然会增长;只是这种增长不表现在越

    来越高的物质生活水平上,而表现在在物质水平不变的情况

    下,空闲时间越来越多上;如果也不让这种空闲时间造成越

    来越大的无所事事的邪恶(如果是邪恶的话),还必须教孩子

    们在利用空闲时间时既不要无所事事,又不要生产商品和劳

    务。实际上,这样探讨问题是不可能取得很大结果的,因为

    这是以假设人性与目前的人性不同为基础的。人都希望增加

    财富,希望节约和无所事事。所有这些欲望从本质上说似乎

    都称不上美德或邪恶,但是如果不顾别的责任、义务或权利

    极端地追求某种欲望,其结果就会造成个性的不平衡,也会

    损害他人。对一个社会来说,“过于注重物质”和“注重物质

    不够”同样是可能的。或者,换句话说,经济增长是可取的,

    但是肯定不能增长得太多(超过了对精神或社会健康有益的程度),正如不能增长得太少一样。

    关于个人主义,完全可以说同样的话,这是经济增长受到攻击的第二个原因。看来,如果个人主要关心自己的利益及他们较近的亲属的利益,经济增长的可能性就会大一些,而

    如果他们与广泛得多的社会义务网联系在一起,增长的可能

    性就会小一些。这就是经济增长无论作为原因还是作为后果

    都与下列现象联系在一起的道理:大家庭和联合家族制度的

    消失,以地位(奴隶制、农奴制、等级制、年龄、家庭、种

    族)为基础的社会制度的逐步消亡并为以契约和机会均等为

    基础的制度所取代;社会高度的纵向流动性;部落联系减少

    及对社会集团的要求的承认普遍减少。这是又一个不能用把

    一种说法的一面看作是美德而把它的另一方面看作是邪恶的

    方法来解决的问题。所有个人都应有某些权利,应当保护这

    些权利不受一切社会要求的损害,但与此同时,每一个人都

    属于一个集团或一系列集团,集团的存在是为个人的社会健

    康所必要的,而集团的继续存在则取决于个人承认集团的要

    求并忠实地接受它的权威。在过去的500年中,个人主义的

    发展有其不好的一面,但是也产生了可贵的起解放作用的影

    响。因此,不能攻击经济增长与个人主义联系在一起,好像

    人类关系中的唯一的好东西就是部落主义、社会地位、大家

    庭关系和政治上的极权主义。

    对经济增长的第三种攻击是由于它与依靠理性联系在一

    起。经济增长依靠改进技术,而当人们对自然和对社会关系

    均采取理性的态度时,才能最大限度地改进技术。现在理性

    的头脑是可疑的,要么因为它被认为会导致宗教上的不可知论或无神论,要么也因为它被认为与接受权威是不相容的。至于宗教信仰,我们时代的弊病是否是由于对上帝或各种神仙

    的信仰的衰落造成的,或者我们时代的弊病是否比以前宗教

    信仰比较普遍的时期的弊病还大,这个问题是可以讨论的。但

    是,无论如何,说相信理性的重要性与相信上帝是矛盾的,那

    是不对的。不能以理性的手段来证明或否定上帝的存在,所

    以没有任何理由可以说明,为什么最有理性的人也不应相信

    上帝的存在。理性并不损害宗教,而是损害权威,只有当宗

    教是以权威为基础时,理性的头脑才对宗教是敌视的。但是

    在这个意义上讲,理性的头脑对科学同对宗教一样敌视;因

    为它敌视任何这样的企图,即说什么目前的理论是不能从下

    而上重新进行检查的,或者只有首创者才有权利怀疑它的可

    靠性。但是,在这里,对待理性的态度也应当同对待物质主

    义和个人主义一样;在两个对立的方面中,只把一个方面看

    作是美德是找不到真理的。因为正如物质主义和精神力量都

    是可取的,社会同样需要理性和权威。美好生活的基础应是

    把对立的原则编织在一起,而不是拒绝某些原则,只利用另

    一些原则。

    第四种攻击是那些不喜欢同经济增长联系在一起的规模

    增长的人发动的。首先,规模经济表现在分工和使用机器上。

    有人不喜欢这样,因为他们不喜欢机器制造的产品,而喜欢

    熟练手工艺人制造的产品。经济增长破坏了旧的手艺。虽然

    它创造了更多的新工艺、机器工艺和其他工艺(因为专业化

    大大增加了工艺的范围),但是许多人仍对旧工艺及旧的手工

    产品的消失感到遗憾,对新工艺的发展或大规模生产带来的丰富而便宜的产品并不感到高兴。专业化原则本身也受到攻

    击,因为专业化使人们不得不反来复去做同一件事情,不管

    是往螺栓上拧螺帽、巧克力装箱、在大学里反来复去讲同样

    的课、练习音阶或是去掉附录,这必然是枯燥无味的,直至

    人们非常习惯于自己的职业,以致不把全部心思放在工作上

    也可以应付自如。

    规模经济还表现在他们自身的管理单位的规模的扩大

    上。因此,商业部门、管理单位及其他组织的规模也扩大了。

    在这一过程中,人们不再拥有工具,变成了无产者。大规模

    的组织也带来了特殊的社会紧张;这种组织必须按等级管理,

    这就意味着少数人发号施令,多数人俯首听命,不管你花多

    大力气去使这一进程民主化也没有用。这样的组织还必须找

    到某种方法来分配工作和报酬,这既要行之有效,还要被认

    为是公正的。我们还没有学会如何管理大规模组织而又不引

    起动乱,因此,许多人认为,没有这种组织反而好。

    人们不喜欢大规模组织还因为它实行严格的纪律;日复

    一日,人们必须同时起床,同时到达工作地点,做大致同样

    的事情和同时回家。有人认为,这使生活枯燥单调,使人只

    起机械的作用,像是大轮子上的颗颗齿轮。他们不希望把人

    拴在时钟上,而希望每天有更多的选择自由,虽然他们根本

    不清楚个体劳动是否就不是时钟的奴隶,或者按时劳动是否

    就令人遗憾的。

    大规模组织的经济还使城镇得到发展,当这与增加人均

    实际收入联系在一起时尤其如此。与对农产品的需求相比,这

    增加了对制成品和劳务的需求。因为反对大城镇是与喜欢农业职业联系在一起的,所以这实际上是反对技术进步。因为

    正是技术进步使一个国家只需15%的人就能生产出全国所

    需的口粮,如果我们要回到需要70%的人来生产粮食的时代

    去,我们就得放弃农业科学教给我们的一切,或者我们必须

    把劳动时间减少到每周10小时左右。正是农业的技术进步使

    城市职业增加,但是大规模组织的经济使这些城市职业集中

    在越来越大的城市内。这是否是不可取的,根本不清楚。大

    多数人如果有机会在城镇或乡村工作,都选择在城镇工作,这

    就是城镇以乡村为代价得到发展的原因;只有少数人喜欢乡

    村而不喜欢城镇,在谴责城镇的人中,有许多人实际上却千

    方百计避免生活在乡村。如果城镇是匆匆忙忙兴建起来的,没

    有适当的规模或管理,它们的确可能破败不堪、单调、丑陋

    和不卫生;但是当今没有任何理由说明为什么新城镇(或者

    甚至老城镇)不能像乡村那样漂亮、优美、卫生和令人鼓舞,

    而且还能提供任何村庄所望尘莫及的广泛得多的锻炼身心的

    机会。

    最后,对经济增长感到遗憾的可能是因为它依赖收入的

    不平等。存在这种依赖性是无法否认的,因为如果对艰苦的

    劳动、自觉的劳动、技术活、负责精神和主动性不给不同的

    报酬,那经济增长将会是微小的或出现负增长。在任何具体

    情况下,现有的差别是太大还是太小是可以争议的,这只是

    从大于或小于为取得人们希望的增长率所需的差别这个有限

    的意义上说的。但是,正如苏联的统治者很快发现的,无可

    争议的是,即使根本没有差别,经济也可以取得较大的增长。

    现在在这方面反对经济增长的部分理由只不过是说,在某时某地,现有的差别大于为取得当时的增长水平所需的程度,是

    由于社会组织的缺陷造成的。在这个意义上说,这种说法仅

    仅是主张改变社会制度(继承财产、拥有土地、税收、受教

    育的机会等等),以便改变收入或财产的分配,而不降低经济

    增长率。但是在另一些情况下,经济增长所要求的差别程度,

    即使完全承认缩小差别会降低增长率,也是不能接受的,例

    如,如果不支付以当地标准来衡量很高的薪金,就请不到外

    国教师或技术人员,或者如果不给国内外的开拓型企业家赚

    取和保持远远超出当地认为是“合理”水平的利润的机会,他

    们就不愿意发展。在这种问题上,对经济的考验就是供求关

    系的考验:“合理的”差别就是为取得所需要的技术或主动性

    而客观需要的那种薪金或利润。但是在这一考验中“合理

    的”东西根据某种其他的价值或社会正义标准来衡量就“不

    合理了”。

    从这一分析中可以得出三个结论。第一,经济增长的某

    些所谓代价根本不是增长的必然结果——比如,城镇的丑陋

    和工人阶级的贫困。第二,某些所谓邪恶从本质上说实际上

    并不是邪恶——比如,个人主义、说理或城镇的发展。像在

    人生的一切方面一样,这些事情可能会做得过分一些,但是,

    这些事情从本质上说,是同其对立面一样可取的。但是由此

    可以得出第三个结论,即经济增长率过高可能不利于社会。经

    济增长只是许多好事中的一件好事,我们可能会做得过分一

    些。过分的增长既可能是造成下列现象的原因,也可能是下

    列现象造成的结果,这些现象是:过分追求物质、过分的个

    人主义、人口过分流动、收入过分悬殊等等。社会决意提高增长率,使其高于目前的水平,并不一定明智;如果它们这

    样做,他们会得到很大的好处,但是也会在社会和精神方面

    付出很大的代价,可能的得是否超过可能的失,这必须尽量

    根据每一种情况分别加以估计。正因为经济增长有得有失,所

    以我们对经济增长的态度几乎毫无例外地都有两重性。我们

    要求消灭贫困、文盲和疾病,但是我们又拼命抓住我们所喜

    欢的信念、习惯和社会安排不放,哪怕这些东西正是造成我

    们感到悲痛的贫困的原因也罢。

    (三)过渡问题

    如果要在已存在几百年的增长率很低、经济多少处于停

    滞状态的社会里实现经济增长,那就会产生一些特殊的问题。

    因为这需要改变信念、习惯和制度,虽然等到新的信念、习

    惯和制度实施一段时间并牢固地扎下根的时候,可能会达到

    一种从任何意义上说都比静止的旧的社会平衡优越的新的动

    态平衡,但是过渡时期可能会出现暂时的但却是非常痛苦的

    情况。

    其中比较明显的情况之一是改变人们的劳动习惯。例如

    假设在一个非常原始的国家里发现了铜,而在那个国家里,人

    们都有自己的土地,这使他们都能过上自己感到满意的生活,

    虽然卫生、物质或文化水平都很低。这些人不愿意去铜矿劳

    动,他们可能不会自愿去铜矿就业,尽管领取的工资会使他

    们在铜矿劳动变得有利可图。另一方面,如果迫使他们到矿

    上劳动,他们因此而创造的财富可能会使他们的物质福利、卫

    生、教育和文化水平大大提高。再假设在最初受强迫后,他们过一段时间会非常喜欢这种新的劳动,非常欣赏高水平和非常瞧不起以前的生活方式,以致到适当时候,在取消了强

    迫以后,他们也会乐于到矿上劳动。在这种情况下,暂时采

    用强迫手段是应该的吗?这个抽象的例子绝不仅仅是学术探

    讨,因为它同非洲某些地区发生的情况极为相象,在那里人

    们被迫去矿上或种植园劳动,不管是由于他们的首领发布的

    命令还是因为这是挣钱来交纳为迫使他们到这些地方去劳动

    而强加给他们的税收的唯一办法,或者是因为他们被从自己

    的土地赶走。实际情况比我们的抽象例子所列举的事实更为

    复杂。因为还有个事实是,那些采用强迫手段的人这样做首

    先是为了自己发财,而并不是因为他们希望造福非洲人。在

    有些情况中,还有一个事实是,非洲人甚至得不到物质上的

    好处;与此相反,他们以前的村庄在经济上遭到毁灭,他们

    的生活方式遭到破坏,而他们自己则住在贫民窟和棚户区的

    简陋房屋内,物质生活与精神生活一样贫乏。我们在本调查

    报告中始终强调,有可能取得表现为人均产出增加的经济增

    长,但大多数人的境况并未得到改善,因为增加的产出只使

    少数有势力的人发了财。世界上的大多数人会同意,这样的

    发展是不道德的,会谴责以牺牲许多人为代价使少数人发财

    的经济政策,不管这种政策会使产出有多大的增加。但是这

    种情况同我们研究的抽象例子是大相径庭的,因为这种例子

    的假设之一是,增长的结果会大大提高参与者的物质水平和

    文化水平。因此,到一定时候,他们自己会喜欢新的生活方

    式而抛弃旧的生活方式。对于这一例子,人们的反应是不同

    的。有人反对强迫的理由是:他们说,不管最终的结果如何好,都不应强迫人们为自己或为子孙后代的利益去劳动。有

    人则以幸福为理由,他们说,即使人们喜欢新的生活方式而

    抛弃旧的生活方式,他们的境况实际上也未有任何改善,因

    为他们并不更幸福;因此,他们进行痛苦的过渡是徒劳的,因

    为他们得不到任何重要的东西——正如我们已经看到的,这

    种论点是大可怀疑的,因为幸福是否就是检验变化的适当尺

    度是值得怀疑的。另一些人的反应则不同,他们认为如果强

    迫使被强迫者大受其益,强迫就是应该的。因此,新世界的

    黑人谴责把他们带到那里去的奴隶制,但是实际上,并不是

    所有的人都会对他们的先辈离开西非的丛林村落感到遗憾。

    所以,只要世界存在下去,也总还会有一些政治家和国务活

    动家会毫不犹豫地为了被强迫者的最大利益而强迫他们的公

    民去从事某项事业。

    可以强迫到何种程度的问题目前十分尖锐,因为苏联已

    经表明,一个残酷无情的政府如果愿意严厉处置那些反对它

    的计划的人的话,可以很快地提高它的实际产出。所有不发

    达国家都正受到共产主义或其他宣传的引诱,想放弃自由来

    换取经济迅速增长的前景。这种引诱带有某种程度的欺骗性。

    它们被告知,失去自由是暂时现象;“无产阶级专政”——或

    者国家元首、军队领导人等等的专政——只是一个过渡阶段,

    其后将是“国家的消亡”;但是,我们十分怀疑,一旦抛弃了

    自由,是否还能轻易恢复。这种引诱也不能保证生活水平不

    断提高;产出可能迅速上升,但是独裁者可能决定将产出用

    于别的方面,而不是提高老百姓的生活水平。无论如何,十

    分明显的是,无需用专政的办法来达到经济增长的目的。一两个不发达国家的民主政府——缅甸和加纳——已经表明,

    它们有决心和勇气来找到发展所需要的资源,受到普遍信任

    和支持的领导人可以在民主的范围内这样做。该由其他民主

    国家来表明,它们也能这样做。

    另一个痛苦的过渡是,必须在社会关系方面进行过渡。公

    理和权力的对立、从地位到契约的转变以及从社会稳定到社

    会纵向流动的转变都会打乱目前的关系,在阶级、宗教、政

    治服从或家庭联系上都是如此。如果过渡以暴力革命的形式

    出现,那显然会出现这种情况,即使不发生暴力革命,过渡

    也同样是痛苦的,因为它会破坏目前在各个方面存在的期望

    和权利。许多人因此而反对经济增长。一些人认为,旧关系

    同新关系一样好,或者甚至更好,他们不喜欢新的家庭关系

    的自由、“普通人”的所谓“权利”及旧的融洽的社会关系遭

    到破坏。另一些人虽然并不认为旧关系特别融洽而喜欢新关

    系,但是仍然怀疑新旧差别与付出的代价相比是否值得。显

    然,这个问题只能用人们赋予下面这些问题的价值来解决,即

    知识增长、机会的质量、卫生标准提高、寿命延长及经济增

    长的其他成果。

    再者,在道德价值方面也必须进行过渡。在旧的社会,从小就向孩子灌输一套行为、责任和忠诚的准则。新的社会则有其不同的准则。一个社会中的好行为可能是另一个社会中的坏行为。责任和忠诚由一批人和机构转向另一批人和机构——由年龄组转向工会、由首领转向雇主或者由家庭转向一般的顾客。假以时日,新准则可能会确立起来,可能会像旧准则一样运用自如,但与此同时,社会可能会经历一段痛苦时期,在此期间,在新道德确立以前旧道德已被抛弃。这种过渡过去特别痛苦,因为我们不理解发生什么情况。如果旧社会的道德和新社会的道德都是众所周知的,如果那些负责确立或捍卫社会道德标准的人(尤其是牧师、教师和议员)有意从变革一开始起就宣传新道德,过渡就会容易得多。但是,

    首先我们只是到最近才了解这些问题,特别是了解道德准则

    与某种社会和经济形式的联系程度。其次,那些捍卫社会道

    德标准的人常常把捍卫旧准则看作是他们的职责,他们敌视

    变革,把新准则看作是不道德的。第三,即使终于把他们争

    取过来支持新准则,他们的许多权力也会在过渡阶段消失,因

    为人们依靠公理的程度提高了,而且对这些卫士迄今所捍卫

    的制度和惯例失去了信心。因此,新准则不是靠制度或权力

    实施的,而是逐步地和一点一点地为人们所接受的。新信仰

    和旧信仰不协调地交错在一起。当人们做他们认为该做的事

    情而受到嘲笑、指责或惩罚时,他们就会感到非常失望和难

    以理解。

    在一个社会由一种生活方式向另一种生活方式的转变

    时,痛苦的过渡是不可避免的。除非不进行改革,否则就不

    可能完全避免过渡。谁也做不到这一点。倾向改革是人的天

    性。因为人从本质上说是好奇的,因此不断积累知识,这就

    改变了他的生活方式。人也不会满足,他希望得到比已有的

    更多的东西,或者到处活动,或者羡慕邻居的地位或资产。人

    还有一种冒险感和造反感,前者使他利用各种机会,后者对

    等级关系则始终是一种挑战。因此,想制止社会变革是浪费

    时间,对一切现有制度都必定消失感到遗憾是浪费感情。因为社会变革正产生于人的天性中那些使我们不同于其他动物的部分。

    同样,虽然我们不能防止变革,但是我们可以加快变革

    或阻碍变革。我们已经强调指出,变革的速度既可以太快,也

    可以太慢。在目前情况下,我们的问题不是适当的产出增长

    率,而是由一种社会态度和制度转变到另一种社会态度和制

    度的过渡期的适当长度。因此,不易作笼统的概括;既有充

    分理由说明应很快完成过渡,也有充分理由说明应该有足够

    的时间进行调整。

    实际上,我们并没有进行阻碍的机会。由于过去80年中

    所达到的世界联系——通过轮船、帝国主义、飞机、无线电、

    移民、好莱坞和报刊进行的联系,在每个社会——甚至西藏

    也不例外——中,经济变革的力量已经在发挥作用。特别是

    两种情况使得人们必须加快增长速度,而不是加以阻碍。其

    中之一是,欲望的增长速度比产量快。另一个情况是,死亡率下降的速度比出生率快。

    在整个不发达世界,现在欲望已大大超过产出,差距在扩大。人民大众开始认为,他们的贫困是不必要的,改变忠诚可以结束贫困。少数人认为,靠自身的努力可以改变贫困的面貌,但是更多的人认为,解决办法在于抛弃他们的地主、雇主、牧师或目前的政治统治者。一些政治家也有很大的欲望,不管是想提高本国人民的物质和文化水平还是想提高本国在世界事务中的地位。现在欲望和产出之间的巨大差距可能是十分危险的,因为它会引起失望,而由于失望,几乎一切事情都是可能发生的。许多人担心,结果会出现“共产主义”(一个不再有确切意义的名词)。有些人担心本地的各种“法西斯主义”会扩散(对这个词的解释必须包括许多东方国家传统的军阀主义以及拉丁美洲的“元首”)。另一些人再次看到了这种明显的可能性:力量将转入宗教狂热分子之手(转入毛拉、马哈萨巴,拉比等人之手)。因此,许多不发达国家的领导人把迅速提高产量的措施置于非常优先的地位是不足为奇的。他们是否有筹集资金的勇气及必要的内外支持,那可能是值得怀疑的。在任何情况下,欲望是否不会继续超过产出,那也是值得怀疑的。但是那些认为加速生产会影响社会关系和道德准则因而是错误的人,通常忘记下面两件事,即这些关系和准则已经在迅速变化以及欲望得不到满足的结果对现有格局造成的危险可能比加速生产更大。

    人口方面的困境甚至更难避免。不受外部影响的不发达国家的人口似乎是稳定的,出生率和死亡率按目前的标准来衡量都很高。一旦一些国家进入了现代世界,从而消除了本地的饥荒和实施了公共卫生和医疗,死亡率便会迅速下降,在不到两代人的时间内,可能从40%下降到10%。因此,为了赶上人口的增长,每年的总产出必须开始增加1%或2%或3%。此外,除非有大量的土地,否则还必须采取步骤来大大降低出生率,就像降低死亡率一样。但是看来这几乎肯定需要使产出比人口增加得更快,因为限制家庭规模的大多数理由最后都归结为需要提高生活水平。在这种情况下,实际上,我们无法选择限制生产增长的道路;相反,在通常被称为不发达国家的几乎每一个国家内,情况都是当前的生产增长率还不足以使人口问题得到真正的解决。那些主张限制生产增长的人又往往忽视了人口方面的情况,忘了人口爆炸的后果对现行社会结构和道德准则的破坏性可能比任何可能的产量增加的后果大得多。