从此走进深度人生 Deep net, deep life.

标签: 科普

  • 朱利平:大数据面前,统计学的价值在哪里[节]

    01 统计学对大数据的意义

    在讲大数据之前,我们首先来看看什么是数据。……凡是可以被数据化的信息载体,我们都可以认为是数据。
    比如说,我们接触的文本,包括平时看到的一些文字,现在我们都可以把它量化。我们看到的图片、视频和音频,现在也都可以量化。包括阿拉伯数字、文本、图片、视频和音频,我们都称之为数据。
    现在我们理解的数据,从来源上来说更加广泛了,从类型上说变得很复杂了。这些不同来源、类型复杂的数据组合在一起,达到一定的体量之后,就可以认为是一个大数据了。

    ……统计学是什么呢?……大不列颠百科全书对统计学有个定义,说这是一门收集数据、分析数据的科学和艺术。定义中提到统计学是一门科学,这个容易理解。那为什么说统计学是一门艺术呢?这个问题,就和我今天主要回答的一个问题很有关系。顺便说一句,现在美国很多高校的统计系,它并不设在理学院下面,而是设在艺术学院下面。

    下面,我主要回答一个问题:在大数据时代,我们究竟是否需要基于抽样的统计学?
    有些人认为,现在计算机科学非常发达,可以收集海量的数据。为了特定的研究目的,我们现在甚至有能力通过计算机技术收集与特定的研究目的相关的全部数据。今天,基于抽样的统计学就没有那么重要了,甚至都不在被需要了。事实真的是这样吗?

    02 统计学是一门收集数据的艺术

    既然统计学被认为是一门收集数据、分析数据的科学和艺术。我们暂时不谈科学,先来看看统计学为什么被认为是一门收集数据的艺术。

    我们来看第一个案例。这个案例是希望调查15个国家的国民的诚实情况。调查人员想要知道,哪些国家的国民最倾向于撒谎,哪些国家的国民很诚实。
    如果直接去问被调查的人员:“您是否撒过谎?”十之八九,是问不到真实答案的。如果被调查人员以前撒过谎,也不在乎多撒这个谎了。被调查人员可能出于不同的动机,不愿意给出真实答案。
    那么,调查数据怎么得来呢?这显然不是简单地通过计算机技术、通过某些爬虫软件就容易收集到适合研究目的相关数据的。
    如何利用统计学方法来收集数据呢?这就需要统计学的智慧了。调查人员设计了两组实验。
    调查人员先从每一个国家找1000人参与测试,15个国家一共找了15000人,找这么多不同国家的人来面对面调查,这是非常困难的,所以调查人员通过互联网找到了这15个国家共计15000人。两组实验都是在互联网上进行的。
    在第一组中,他们先做了一个测试,请受调查者在家里抛硬币,硬币有正反两面,调查者事先规定,受调查者抛硬币之后要告诉我结果,如果硬币正面朝上,我就奖励你十块钱,如果反面朝上,我就不给你奖励。这个调查不需要提供你抛硬币的证据,只是由你告诉调查者,抛硬币的结果。这也就是说,受调查者有没有撒谎,只有他自己知道。这个最后的结果,实际上调查者是有参照的。因为,每个国家有1000人参与测试。正常情况下,1000次抛硬币的结果,应该是500次左右正面朝上。某个国家参与实验的1000个人之中,如果有900个人声称自己抛出来的硬币正面朝上,甚至1000人声称抛出来硬币正面朝上。那么,很大概率就是其中有人撒谎了。这是第一组实验。
    第一组的实验有价值,但是它也不一定能够全面反映真实的情况,所以调查人员还有第二组实验。
    第二组实验,是要求受调查者回答五个问题。这五个问题在回答之前,需要受调查者承诺,他不能为了答题去查阅任何资料,不能去寻求任何帮助,也就是说,看了这五个问题之后,受调查者需要立即给出答案。
    调查者承诺,如果五个问题中,回答对了四个以上,就奖励给受访者十块钱,如果答对三个或者三个以下,就没有奖励。
    而这五个问题中,其中有三个问题特别简单,类似于像1+1等于几这种问题。另外两个问题则非常生僻。如果受调查者不去查阅资料或咨询他人的话,基本是不太可能回答出来的。
    因此,如果有受调查者答对了这两道难题,十有八九就说明他违反了自己事先承诺的“不去查阅资料寻求帮助”,由此可以推论他在这件事情上不诚实。
    然后统计人员通过这两组实验结果,互相验证。这两组数据收集的过程都非常恰当地体现了统计学在收集数据方面的智慧。
    所以说,即使在大数据时代,不是说有了计算机,有了爬虫技术,我们就能收集到适合研究目的的所有数据。统计学是一个收集数据的艺术,针对特定的研究目的,设计非常漂亮的数据收集方案,就是一个非常艺术的收集数据的过程了。

    我们再举一个例子。这是最近美国麻省理工刚刚完成的一个实验,大致在2018年左右完成的,实验结果也公布出来了,目的是想了解大家目前的婚姻观念,100人受到邀请来到一个封闭的场所参与这个实验。
    参加实验时,每人都会被贴上一个编号。男的编号是单数一三五七九,女的编号是双数二四六八十,以此类推。参与实验的这100人不知道自己的编号,也不知道究竟有多少人参加了这次实验。换句话说,他们不知道参加这次实验的正好是50个男人和50个女人,受访者仅仅知道,这次实验有很多人参加。
    在这里统计人员采取了一点小花招,就是当受访者进门的时候,把编号贴在受访者后背上,受访者知道自己有编号,但是不知道自己的编号是多少,不过他能够看到别人后背上的编号。实验规则说,允许100人中的任何两个人进行交谈,除了不能告诉对方他的后背编号是多少,其他话题都可以谈。
    然后实验者把这100人带到一个很小的一个房间里,宣布给大家5分钟时间,在这5分钟内,大家自行配对,每人只能配一名异性。5分钟结束之后,如果配对成功了,两个人背后的数字加起来乘以十,就是两人能够拿到的奖金。
    也就是说,如果编号是100的那个女性找到了那个编号为99的男性,那么两人就可以拿到(100+99)×10的奖金,也就是1990美元,这笔钱已经很可观了。但是如果你是一个编号为2的女性,而你找到的是那个编号为1的男性,那么你俩只能得到(1+2)×10也就是30美元,你俩用这奖金一起吃顿饭都不一定够。但是5分钟之后,如果还没有配对成功的话,你就连一美分都拿不到。
    因此,参加者必须在5分钟之内,在一个很小的拥挤空间内,尽快找到愿意跟自己配对的那个人。而且在这个过程中,要尽可能让自己的奖金数额变得很大。
    实验人员之所以把100人故意安排在非常拥挤的小房间内,就是考虑到,一方面要让大家能够很快速地看到一些人的编号,另一方面又能保证一个人不可能看到所有人的编号。在人挤人的情况下,有些编号是肯定看不到的。实验开始了。
    一些人很快就发现,自己连续跟别人配对三四次,大家都拒绝他。这很可能说明,自己后背的编号数字不够大,别人不感兴趣。
    于是这其中就有人采取了应对策略,他跟别人讲,如果你愿意跟我配对的话,那我愿意把奖金全部给你,反正我数字也不大,所以我的钱不要了。还有人说,只要你这次跟我配对成功了,我们出去以后,我再单独请你吃顿饭。
    另外还有一些人,虽然他不知道自己后背的编号,但是他发现有很多人过来找他,所以他很快就意识到,自己后背的编号很可能很大,但具体多大,他并不知道。而且要尽可能让两个人组合出来的数字变得很大。
    于是他很快就把眼前这批他能看到数字的人拒绝掉了,因为他理所当然地认为接下来肯定还有更大的编号,但是他并不知道最大的编号是多少,同时他还必须要在5分钟内快速决定跟谁配对。
    这个实验的结果是,编号99的男性并没有与编号100的女性配对成功。那位编号100的女性,找到的是编号八十几的一位男性。那些数字在中间的人,大体都配对了跟自己差不多的另一个人。

    这我们现在来看这个实验的结果,它基本上跟中国男女婚姻观念的现实比较类似。比如说,实验者因为自己编号小,就让渡自己的奖金给对方甚至于承诺事后请对方吃饭,以求得成功配对,这个跟现实中“我的个人条件差一些,但是我父母同意我们两个结婚之后送给我们一套房子”的承诺是类似的。
    而且我们在生活中也发现,一些最优秀的男性女性,他们身边不乏追求者,但是他们并没有找到自己的“最佳匹配对象”。
    这个数据的收集过程也是非常漂亮的。

    03 数据并不是越多越好

    统计本身是一门收集数据的科学,但是数据是不是越多越好呢?很难说。

    历史上有一个非常有名的例子。大约500年之前,丹麦有一个天文学家叫第谷,他从当时的丹麦国王那里要了一笔钱,建了一个实验室。第谷天天去观察每颗行星的运动轨迹,并且每天记录下来。于是第谷观察了20年,记录了大量的数据。不过,这个数据太多了,第谷花了大量时间、精力来分析这个数据,但没有发现任何规律。
    这时候,一个叫开普勒的人出现了。开普勒认为,第谷每天去观测,一年365天每一颗行星都会有365个数据,这样20年观测记录积累下来,要分析处理的数据就太多了,而且那个时候的数据分析只能依靠手工计算,这个处理工作量实在太大了。
    于是开普勒就说,能不能每年只给我一个数据,比如说你可以只告诉我每年的1月1日,地球在什么位置,土星在什么位置,太阳在什么位置等等。这样20年的观测数据筛选之后,每一颗行星的数据就只有20个了。开普勒知道,地球每隔365天会回到同一个位置,然后他把地球的位置固定,再分析其他行星跟地球的相对位置。
    开普勒通过固定地球的位置,对其他行星位置20年的数据进行分析,就成功得到了其他行星的运行轨迹。此后开普勒就发现,如果地球位置不变的话,那么其他行星的20年运行轨迹画出来之后,这些行星都是围着太阳运转,运行轨迹都是椭圆形的。由此开普勒发现了行星运动的规律。
    从这个天文学上的著名案例,我们可以看出来,数据太多可能会导致信息量变得巨大,反而增加寻找到规律的难度。从而需要通过科学的方法简化数据。

    关于这方面的案例还有不少。比如说美国总统富兰克林·罗斯福,他是美国历史上唯一一位连任四届的总统。1932年的时候他第一次当总统,当时美国和许多国家正在遭受经济危机,罗斯福面临的压力也很大。
    因此到了1936年罗斯福想竞选自己的第二任总统的时候,美国许多人预测罗斯福很难连任。那一次,罗斯福的主要竞选对手是兰登。当时就有两个机构在预测总统选举结果,其中一个是《文学文摘》杂志,它在当时是一个非常有影响力的刊物,因为这个杂志此前几次对总统选举结果的预测都成功了。
    到了1936年美国总统选举的时候,文学文摘搞了一个大的调查统计,它调查了240万人。具体方式就是在杂志里面夹上关于总统选举的调查问卷,然后收集反馈。其实当时文学文摘调查的还不止240万人,还要更多,只不过最后收回来的有效问卷是240万份。正是根据这个调查结果,文学文摘宣布他们预测兰登将战胜罗斯福赢得大选。
    而当时还有一个机构,准确地说是一个年轻人,叫盖洛普,他的预测结果跟文学文摘的预测正好相反。起初盖洛普做这类调查统计,是因为他的母亲要竞选众议员,他是给他母亲帮忙,于是就在经费不多的情况下做了对较小人群的相关调查,然后这个调查结果很成功,他母亲当上了众议员。
    接下来他就想调查一下,罗斯福和兰登谁会赢得1936年竞选。但是他比不了文学文摘的财大气粗,所以他只调查了5000个人,根据这5000人的调查结果,盖洛普预测罗斯福当选。
    结果罗斯福果然成功连任总统,盖洛普的预测胜利了。
    这个选举结果出来之后,对《文学文摘》杂志的声誉造成了巨大的冲击:毕竟文学文摘调查了240万人,最后却发布了一个错误的预测,而盖洛普只调查了5000人,发布的预测却是正确的。结果,文学文摘因为这个事情后来就关门倒闭了。而那个年轻人盖洛普,就此成立了一个民意调查公司,也就是现在的盖洛普咨询公司。
    这是事情的结果。那么为什么调查了5000人的预测,要比调查240万人的结果更准确呢?我们先不说240万这种海量数据,它在规模变大以后会带来计算效率的下降,我们也不提这类海量收集数据会导致成本居高不下的问题。
    根本的原因,是当时文学文摘通过杂志夹带问卷进行调查的这种方式。因为当初问卷是夹在杂志中发放的,所以文学文摘收集来的240万份有效问卷,实际面对的都是订阅了这份期刊的用户。
    那么,当时什么样的家庭会订阅这样的杂志呢?一般来说都是家境比较好的家庭,所以,文学文摘虽然号称调查了240万人之多,但是它调查的主要群体,是当时美国国内相对而言有钱的那部分人。而穷人群体的意见,它这个调查实际并没有覆盖到。
    数据的量多不一定就代表准确,收集来的数据质量好、有代表性,才有可能分析出准确的结果。

    04 统计学是一门分析数据的艺术

    前面举了一些例子,提醒我们需要非常小心地设计方案收集数据。数据收集上来之后,我们还要做数据分析。按照前面大不列颠百科全书的说法,统计学同样是一门分析数据的艺术。

    讲到数据分析,在这里我只讲两个基本概念:相关与因果。为什么讲这两个概念呢?这是因为人们常常混淆这两个概念,常常会把相关关系误以为是因果关系。在许多科学研究和政策问题评价中,我们更关心因果关系。但是,当我们看到了某种形式的相关关系后,常常会误以为这就是我们追求的因果关系了。

    比如说,在中世纪的欧洲,很多人相信,虱子对人的健康是有帮助的。这是因为当时人们发现,得病的人身上很少有虱子,而健康人的身上反而是有虱子的。这是长期的观察累积下来,形成的经验。
    在中世纪的欧洲,很长一段时间里人们都根据这个经验,得出这样一个因果推论:这个人身上有虱子,所以他身体健康,那个人身上没虱子,说明他身体不健康。
    当时,人们确实观察到虱子的存在与否跟人是否健康构成了相关关系,但是,这是因果关系吗?
    有了温度计以后,人们就发现了,这不是真正意义上的因果关系:因为虱子对人的体温非常敏感,它只能在一个很小的温度区间范围生存下来。而人体一旦生病的话,很多时候会出现发烧症状。人体一发烧,温度变化,虱子就无法适应发烧时候的热度,于是跑掉了。
    如果我们只停留在观察到健康与否和虱子多寡之间存在关系,那实际只是相关关系,而不是因果关系。与之类似的例子还有很多,比如说,我们看到每年冰淇淋销量增加的同时,各地不幸溺亡的人数也在增加。那么这两件事情是不是构成因果关系呢?
    常识告诉我们,肯定不是。其实是因为每年气温升高之后,游泳的人可能就多了起来了,随之溺亡人数也就相应增加了。而同样是因为气温升高,冰淇淋的销量也会增加。
    也就是说,如果我们观察到一个因素出现了一点点变化,另外一个因素也会随着跟它变化,它们之间可能就有相关关系,但是这种相关关系,并不意味着这两个因素构成因果关系。
    如何判断因果关系呢,这就需要我们非常小心,而且要非常艺术地做数据分析了,我们最终还是要回到统计学上来。

    这里,我们举一个历史上的疾病案例,这就是小儿麻痹症,也就是脊髓灰质炎。现在大家看到的小儿麻痹症病例比较少,因为现在有相应的疫苗。历史上,脊髓灰质炎曾经是一个让人非常害怕的疾病。
    在20世纪50年代,当时美国一所大学的实验室,做出了一种针对这个疾病的疫苗,已经证明它在实验室条件下能够产生有效的抗体。但是他们不知道,如果应用到实际生活中的大规模实验,这个疫苗还会不会有效。
    所以当时美国政府部门就决定要做实验,这个时间大致在1954年。因为当时脊髓灰质炎的患者主要是孩子,所以当时的实验人群定为小学一二三年级的学生。怎么做实验才能够真正说明疫苗是否有效呢?为了确保统计结果最终反映真实的因果关系,当时提出了五套实验方案。

    第一套方案是,因为1953年之前是没有这个疫苗的,所以就从1954年开始,给所有的一二三年级小学生接种疫苗,最后再来看一下,1954年的发病率,跟1953年相比,会不会有差别。
    这个方案是个办法,但是它有问题,因为之前每一年的脊髓灰质炎发病率的差别比较大。比如说1951年全美可能有3万名脊髓灰质炎患者,1952年则有6万名,而1953年又可能缩减到不足4万名。
    这个脊髓灰质炎每年发病率的波动都比较大,万一到时候实验结果是3万名到4万名之间,如何判断这个结果是随机变化的,还是疫苗发生了作用?

    第二个方案则提出要按照地区来做。比如,在纽约地区,就给一二三年级小学生们全部接种疫苗,而在芝加哥地区的就全部不接种疫苗,然后来统计,纽约和芝加哥这两个地区的脊髓灰质炎发病情况。
    这个方案后来发现也不行。因为脊髓灰质炎本身就是传染病,一个地区可能流行这个疾病了,而另外一个地区就可能没流行,那么这两个地区的数据看起来就会有差异,但是这不是疫苗的效果,不具有可比性。

    于是就有人提出了第三个方案。因为当时这个疫苗接种,谁也不知道有没有副作用,因此是有一定风险的。所以这个方案就提出,让接种疫苗的孩子们的父母来自行选择。有的家长选择给孩子接种疫苗,有的就不选择接种,这样同一批孩子就会出现不同的对照。
    但是这么做,也有问题。因为当时人们已经发现,脊髓灰质炎的患者一般来自于家境比较好的家庭。
    这是因为,那些家庭经济状况比较差的家庭,因为生活条件差,卫生条件不好,可能一个人很早就接触过脊髓灰质炎的病毒了,甚至很可能在刚刚出生的时候就接触了脊髓灰质炎的病毒,但是刚出生的婴儿是有母体的免疫力的,婴儿凭借母体的免疫力,接触这个病毒之后能够产生抗体,反而不会得病。
    当时的这类数据情况已经展现了这种现象。如果采用自愿接种的方式,那些经济状况比较好的家庭,往往愿意让自己的小孩去接种,而经济状况不好的家庭由于经费原因,同时也知道自己这个阶层染病率稍微低一些,他可能就不愿意接种了。这样就造成了对实验结果的干扰,你无法判断到底是疫苗有效还是经济原因导致的不同结果。

    然后是第四个方案。有人提出,只让二年级的学生接种,而一年级和三年级学生不接种。之后再比较接种的跟不接种的学生之间的区别,看他们的发病率会不会有差别。这个方案是当时的一个脊髓灰质炎防治委员会提出的方案。
    这个方案同样行不通,第一,它同样无法避开接种孩子家庭贫富差距导致的患病概率差异。第二,脊髓灰质炎是一种传染疾病,人群的年龄是对这种传染有影响的,一、二、三年级的学生年龄层次有差别,可能就会导致各个年级学生得病概率的差异。
    此外这个方案还有第三个重大缺陷,那就是可能会对医生形成心理上的诱导。如果按照这个方案执行下去,医生们就是知道的,一、三年学生没有接种疫苗,而二年级同学中有部分同学接种了疫苗。
    当时脊髓灰质炎的诊断还不太容易,如果医生已经知道了这个疫苗接种方案,而且也提前知道这个疫苗在实验室阶段是管用的,那么医生在面对一年级学生时,一旦这个疾病还无法确诊,那么这个医生就很可能根据“一年级学生没有接种疫苗”“疫苗是有效的”这两个提前的认知,就直接诊断这名一年级学生得了脊髓灰质炎。
    而且这种区别对待的方案,接种的学生本身心理也会受到影响的。
    当时还有第五个方案,也就是最终执行并被采纳了调查结果的方案。这个方案具体来说,就是在征得学生家长同意之后,仍旧会告诉家长:你即使同意接种疫苗,我给你家孩子接种的,也不一定是疫苗,而是一种看起来跟疫苗一模一样的安慰剂,没什么副作用也没有什么效果。
    因为这个安慰剂跟疫苗长得一样,所以医生和学生都不知道到底接种的是疫苗还是普通的安慰剂,但是疫苗提供方是知道的,它对每一个药品都加了编号,因此疫苗提供方知道哪些是安慰剂,哪些是疫苗。
    通过这样的方式,实验室实现了随机的方式接种疫苗,而且无论家境好坏,这个接种疫苗都是随机的。同时医生们也不知道,到底是哪一些小孩接种了疫苗。这就规避了年龄、经济条件等各种扰动,有助于确定脊髓灰质炎与疫苗之间真正的因果关系。
    1954年,这个实验大约有74万名小学生参与。最终的实验结果是,如果接种疫苗,孩子罹患脊髓灰质炎的概率大约是十万分之28,如果不接种疫苗,患病概率大约是十万分之77,二者相差一倍多。之后又经过各种努力,脊髓灰质炎疫苗在美国获得了通过。

    许多科学结论、政策评价都依赖于因果分析而不是相关分析。统计学能够帮助我们证明那些我们所需要的因果关系。很多时候,真正的因果关系,不能简单地建立在相关关系的基础之上。还有很多科学问题,仍需要我们去发现真正的因果关系,这正是统计学可以提供数据收集以及分析方案的地方,也是统计学的魅力所在。

    本文转自《光明日报》

  • 徐一鸿:物理学的十大基础理念[节]

    我想阐述的是物理学的基础理念。我将仅仅探讨那些经过时间的洗礼,被无数经验验证了的观念。因此,我并不会涉及弦论或是量子引力。

    什么是物理学中最重要的基础理念?几乎可以肯定的是,如果要求别的物理学家写下物理学中最重要的十条基础理念,恐怕得到的结果会和我给出的不同——但希望不会差异太大。我只能说,我所总结的这些基础理念得益于我自身对理论物理学习和研究的旅程、我自己接受的教育以及影响我的人。当然,“十”这个数字只是出于人类在地球上演化的偶然,它没有任何特殊的含义。

    1 最不可理解的事是世界竟是可理解的

    这句话出自爱因斯坦。这或许是整个人类有史以来最具有创造性的想法,显然任何杂志的审稿人都会拒绝其发表。只有很少的一批人最早认识到了这一点。但据我所知,大多数的古文明都没有明确地阐述这一想法。

    为什么自然能被人类理解?在一个极其平凡普通的星系、在围绕着一颗毫不起眼的恒星旋转的地球上演化出的人类,到底有什么特殊之处?为什么物理学的定律总是简洁而优美的?如爱因斯坦所说,我们完全可以设想自己生活在一个极端“丑陋”的宇宙里,一个完全随机的宇宙,没有任何现象能够通过思考来理解。或许另一种解释是,最终只有能够被理解的那部分自然才能被我们理解。

    2 物理学定律在任何地点和时间都是一致的

    从诞生第一天起,人就能看到超凡缥缈的月亮悬浮在天空,像潮汐一般盈亏变换。但在数百万年之后,直到牛顿,人类才意识到,月亮事实上在“下坠”。不止如此,下坠的月亮和下坠的苹果一样,由相同的物理学定律所支配。

    物理学的定律是普适的,永恒的。在牛顿之前,人们会分别研究地球物理学和天体物理学,认为地上的领域和天体的领域所遵循的规则可能是不同的。在牛顿之后,天体物理学和宇宙学变成了物理学的一个分支。

    当然,某些长期以来物理学家所认为不言自明的物理规则也可能被认定是错误的。20世纪50年代,物理学家首次在实验上观察到弱相互作用会区分左右,这一发现震惊了物理学界。“物理学定律在任何时间地点都是一致的”这一断言也可能被推翻,但目前为止,支持这一原则的证据是非常显著的。

    3 物理世界是量子的

    有关量子物理,有许多非常熟悉的引言,事实上,我们当中的一些人在当学生时可能说过完全类似的话。对我这一代的物理学家而言,我们秉承了费曼“shut up and calculate”的理念。在以前学习物理时,如果我们问任何有关量子力学的问题,老师都会让我们去计算就好。

    我想谈谈量子物理,特别是贝尔不等式相关的内容。二三十年前我曾试图阅读贝尔所著的书,但里面有很多词语我不理解,阅读有很多障碍。我不倾向于使用“实在”一词,而是用“反事实确定性”来描述经典物理和量子物理的区别:经典物理是反事实确定的,而量子物理不是。

    要理解这一点,假设有一位性格怪异的朋友,因为某些不可知的原因不愿意告诉我们他所拥有的一条围巾的颜色,而是让我们猜。他告诉我们,这条围巾有百分之七十的可能性是蓝色的,而有百分之三十的可能性是红色的。但我们所有人都知道,这条围巾有一个确定的颜色,无论我们是否亲眼看见了它。由于他知道自己围巾的颜色,他所言的概率完全是对这一概念的误用,仅仅是想引诱我们进行猜测所说的花言巧语罢了。这本质上和问别人“猜猜我上个周末干了什么”是一样的:无论是颜色还是周末所干的事,都是确定存在的,这大约就是所谓“实在”的含义。无论我们朋友的围巾是什么颜色的,或者在周末干了什么,这一问题的答案在我们问出这一问题时是不会改变的。这是“反事实确定性”的内涵,也是经典物理学和量子物理学最基本的不同。

    而至于贝尔不等式,它事实上也可以看作是对经典物理学的一个断言。根据法国物理学家米歇尔·勒·贝拉克(Michel Le Bellac)的说法,这一不等式最早源自英国逻辑学家乔治·布尔,反映的是最基本的布尔代数法则。

    因此,理解贝尔不等式并不需要知道量子力学,这是许多人的一个误解。

    4 永恒的场:爱因斯坦的挚爱

    宇宙是由许多不同的量子场交织在一起相互作用涌现而成的,每一个场都影响着别的场如何演化。

    在20世纪20年代的量子力学中,电磁场是一个相对论性的场,但电子仍被当成非相对论性的点粒子。在狄拉克发现了描述电子的相对论性方程之后,约当说服了狄拉克,认为电子也应该被当成一个场来描述——事实上,温伯格(Weinberg)告诉我大部分的物理学教材都把历史弄错了:狄拉克并不是最早提出电子也应当被当成场来处理的人,他一开始甚至有些排斥这一想法。在我看来,这标志着物理学一个重要的分水岭:自此之后,所有的物理对象都由一个场来描述。

    量子场论对许多问题都提供了非常简洁的答案。在我是学生的时候,我不理解为何宇宙中所有的电子都是同一的。宇宙中有巨量的电子,但在非相对论性的量子力学中,电子的同一性只能被当成一个事实来对待,无法进一步解释。理论物理总希望将假定的基本事实变得越少越好,而量子场论对此提供了一个非常简明的答案:这是因为只存在一个电磁场,而所有的电子都只是这一个电磁场的激发而已。

    奥本海默也曾于1966年写到,爱因斯坦“全心全意地认同场的概念……这使得他早在提出广义相对论很久之前就知道,引力必定是由场描述的。”

    5 可畏的对称:充满了对称的宇宙

    宇宙所遵循的基本定律出于某些原因满足许多的对称性。可以说,20世纪的物理学一个重要的主题就是对不断增长的对称性的发掘和欣赏。

    当19世纪的数学家发明了群论时,一部分人曾声明他们终于发明了一个物理学家无法偷走的理论。但显然,那时的数学家无法预测量子力学的发现。量子物理极度依赖群的概念和工具来表述叠加态。经典物理没有叠加性原理,因此它本质上不需要用到群论。

    历史学家和科学哲学家彼得·加里森(Peter Galison)曾给我看了一篇论文。这篇论文由物理学家和科学史学家霍耳顿(Gerald Holton)所写,阐述了一个非常令人震惊的事实:他曾检查过20世纪20年代的物理学百科,而在整本书中只有一处涉及了对称性,是在声明爱因斯坦的度量张量的角标在交换下保持不变。20世纪的物理学几乎只有晶体学在讨论对称性。

    下述历史也很少有人知道。魏格纳(Wigner)将群论引入量子力学的研究影响十分深远。他在柏林获得学位后,回到了他父亲位于匈牙利的皮革工厂。他在那里非常不开心,他曾说如果他的后半生将在为女性制作皮包为男性制作皮鞋中度过,他会疯掉的。因此他询问他的父亲能否回到德国工作。对于物理学的历史来说,完全偶然的是他申请到的工作恰好是一位晶体学家的助手,也是由此,他将群论引入了物理。

    魏格纳曾回忆,薛定谔对他讲过五年之后没有人会再使用群论了。魏格纳将他的困惑告诉了冯·诺伊曼,后者的话语则使他安心:“噢,这些都是老骨头了。五年之后,所有的学生都将学习群论。”显然,冯·诺伊曼说的是对的。我向本科生教授群论课程已经超过十年了,也写过一本群论的教科书。因此,圣巴巴拉分校所有物理系的本科生都应该学过群论。

    20世纪的物理学也因此揭示了自然丰富的内部结构:从SU(2)对称性到SU(3)对称性以及夸克的发现。强子的性质和数量与群表示论的深刻联系已经无法分割,这最终导致了杨-米尔斯场论以及量子色动力学的发展。

    爱因斯坦曾这样描述过艾米·诺特(Emmy Noether):“在找寻逻辑美的努力下,她发现了充满神性的公式,更深刻地揭示了自然定律的本质。”诺特是对物理学作出杰出贡献的伟大的数学家之一。她的工作揭示了物理学的守恒定律是来自对称性。

    我们都知道物理学中许多物理量,例如能量、动量都是守恒的。但这些守恒定律是从哪来的?在我还是本科生的时候,如果我问我的物理教授为什么这些量是守恒的,我的教授是没有办法回答我的,除非他知道诺特定理。

    6 爱因斯坦:消灭相对性

    “相对性”一词从未在爱因斯坦原本的论文中出现过。“相对论”这一不幸的名称事实上是一位名不见经传的德国物理学家阿尔弗雷德·布舍勒(Alfred Bucherer)在1906年给出的。该人早就被遗忘在了历史的长河中。

    之后,爱因斯坦曾后悔他没有将他的理论命名为“不变性理论”,因为爱因斯坦理论的核心思想恰恰是物理规则不是相对的,而是不变的,不同的观测者所见的物理规律是一致的。

    我曾与一些哲学家有过碰面,他们告诉我:“你们物理学家证明了真理是相对的!”如果爱因斯坦将其理论命名为不变性理论,我就不用浪费我的时间向他们解释事实与此正相反了。

    爱因斯坦曾反对过哲学家:“我相信哲学家对科学的进步起到了相反的作用,因为他们将许多重要的基础概念从经验主义中剥离了出去……对时间和空间的概念来说更是如此。”

    事实上,爱因斯坦最著名的公式E=mc2并没有出现在他原本的论文当中,而是他在几个月后的一个小注释中提出的。那时他曾对这一公式的正确性非常怀疑,他对一位朋友写道:“这一论证是令人愉悦甚至是诱人的,但就我所知上帝可能正嘲笑我写下的东西,正牵着我的鼻子走呢。”

    我想要强调爱因斯坦对物理学的两个重要影响。首先,爱因斯坦的工作使得同时性在物理学中不存在了。这对物理学而言十分重要,因为它直接导致了所有的物理定律都应是局域的,而不是全局的。在之前的物理学中,守恒定律可以是全局的,一个电子可以同时在北京消失而出现在非洲,并不影响电荷的守恒。但在爱因斯坦的理论中,由于同时性的丧失,电子在北京消失后对某个观测者而言它可能是在昨天出现在了非洲。这显然违背了守恒定律,因此也是不可能发生的。自此之后,所有的守恒定律都是局域的,是对同一时空点而言的。其次,爱因斯坦将相对性变为了时空变换的不变性,也是他意识到了牛顿的力学定律在洛伦兹变换下保持不变。

    7 宇宙中力的统一

    物理学的发展总是迈向统一的。牛顿将地球物理学和天体物理学统一了起来,麦克斯韦和他同时代的其他物理学家统一了电和磁。若从生活现象出发,这种统一性完全不是显然的。声和光表面看起来如此不同,但它们最终都可被归结于电磁场的相互作用。

    当物理学的统一迈进了19世纪晚期20世纪初,引力、天体物理、地球物理以及声学都被归纳进了力学的范畴,而光学、电学和磁学都归为了电磁学。爱因斯坦曾想统一电磁学和引力,但他失败了。可以说,他失败的原因是他忽略了辐射这一现象,而辐射现象的背后潜伏着强相互作用和弱相互作用。

    到了1983年,电磁学和强相互作用与弱相互作用也统一了起来。至此,若我们相信大一统理论,则剩下没有统一的只有引力。我们希望超弦理论能达到这一目标,但目前并不知道它是否会成功。

    8 造物者使用数学的语言

    我们都认同造物者使用数学的语言,这一观念至少可以追溯到伽利略。但之后魏格纳写了一篇很有影响力的文章,题目为“数学在自然科学中不可理解的有效性”。一些人认为这一观察是不值一提的,而另一些人则认为其非常深刻,甚至还有一部分人同时认同这两种说法。在我看来,这是非常深刻的一个观察。物理学家对此有过很多的争论,为什么数学在物理中这么有效?

    物理学和数学的发展相互牵连,谁也离不开对方。在19世纪末,二者的发展看起来相背离,其中一个原因是数学走到了一个需要严谨公理化的阶段。

    毫无疑问,物理学需要数学。在弦论之前,物理学与数学最重要最紧密的结合包括电磁学与偏微分方程,引力与微分几何,以及量子力学、粒子物理与群表示论。但同样令人惊讶的是,对于大部分物理来说,除开证明结果的严谨性,理解自然所需要的数学几乎只涉及这些科目的本科教授前几周的内容。当然,不同的物理分支所需要的数学内容以及深度都是不同的。弦论需要非常多的数学,而天体物理所需要的数学内容则较少。

    在广袤的数学海洋中,我自己的感受是只有极少的一部分数学内容看起来和物理是相关的,至少目前来说是这样。回到20世纪50年代,在发现很多新粒子后,面对这些看起来完全没有头绪的谜题,物理学家曾自然地设想一些更高深的数学内容能够帮助我们理解这些物理现象。但最终,随着弱电统一以及量子色动力学和大一统理论的发展,一些基础的群论知识加上对于李群SU(3),SU(5)以及 SO(10)的理解就已经足够了。

    许多物理学的分支,如宇宙学和原子物理,只需要很少的数学,仍在向前蓬勃发展。但基础物理如粒子物理的研究,目前来看似乎停滞不前了。或许我们需要很多的数学内容,也许是数学家也还不知道的数学内容,来帮助物理学。又或许物理学家需要自己解决自己的问题。

    9 熵和热:核心是分享

    在宇宙中,不同的系统有不同的能量,但它们都以某种方式想要相互分享这部分能量,某种意义上这就是熵和热的核心。我喜欢把傅立叶称为18世纪“多即不同”的倡议者。他曾在他热学论文的前言中写道:“牛顿是个伟大的人!用他的理论,我们能解释从大炮发射到月亮运行的所有问题了,留给我去解释的只有热和冷。”有人提到,年轻人经常觉得物理学所有重要的事都已经被研究过了。我想说,傅立叶也一样,认为牛顿做了物理学所有的工作。但他对于热学的研究让他发现了函数可以分解为无穷多正余弦函数的和,这毫无疑问是非常伟大的数学发现。

    另一位重要的人是鲁道夫·克劳修斯(Rudolf Clausius),他引入了“Verwandlungshinhalt”这一概念,意即内容的变换。值得感恩的是,他随后将其重新命名为了“entropy”,也就是熵。“entropy”一词选择得非常好,因为它有很多近亲,如“tropical”,还有例如“zoetrope”——该词是“movie”一词的前身,相比而言,我更喜欢前者,因为它的前缀“zoo”是表示动物、生命;而“trope”意为变换、运动。换言之,当事物动起来时它就变得有生命了。

    玻尔兹曼对熵和热力学第二定律的研究将热学带领向了微观世界。香农则将信息这一概念和熵联系了起来。

    现在,基于这些人的工作,黑洞的信息熵或许是我们最有希望一窥量子引力奥秘的切入口,是物理学前进的希望。

    10 作用量所在之处就是物理

    对我来说,相同的物理原理有不同的表述方式,这是非常神奇的,甚至有些“不合理”。费马的最小作用量原理、反射折射的斯涅尔定律以及麦克斯韦的波动方程都描述了光线的轨迹。牛顿的力学方程、欧拉-拉格朗日变分原理以及哈密顿最小作用量原理也都描述了力学体系的运动。

    在我还是学生的时候,我曾问我的教授,为什么我们需要拉格朗日作用量或哈密顿作用量?因为只要理解了牛顿的力学定律,我们已经可以解决经典力学的所有问题了。当然,这些作用量真正的闪光之处是在量子力学发展以后,使用哈密顿的最小作用量原理,我们能得到薛定谔方程。而在量子场论发展后,拉格朗日量变成了最为重要的作用量,因为它是相对论意义下的标量,而哈密顿量不是,这直接导致了场论的狄拉克-费曼路径积分表述。

    我一直认为这是一个未解之谜:所有经验验证过的物理,一直到大一统理论,都可以归结为某种作用量原理。显然,一个人可以写下无法被作用量原理解释的运动方程,但因为某些非常深刻的原因,所有基础物理的定律都可以由作用量原理得到。为何如此?我们不知道。

  • Zack Savitsky:熵是什么

    生命是一本关于破坏的文集。你构建的一切最终都会崩溃。每个你爱的人都会死去。任何秩序或稳定感都不可避免地湮灭。整个宇宙都沿着一段惨淡的跋涉走向一种沉闷的终极动荡状态。

    为了跟踪这种宇宙衰变,物理学家使用了一种称为熵的概念。熵是无序性的度量标准,而熵总是在上升的宣言——被称为热力学第二定律——是自然界最不可避免的宿命之一。

    长期以来,我一直被这种普遍的混乱倾向所困扰。秩序是脆弱的。制作一个花瓶需要艺术性和几个月的精心策划,但用足球破坏它只需要一瞬间。我们一生都在努力理解一个混乱和不可预测的世界,在这个世界里,任何建立控制的尝试似乎都只会适得其反。热力学第二定律断言机器永远不可能达到完美效率,这意味着无论宇宙中结构何时涌现,它最终都只会进一步耗散能量——无论是最终爆炸的恒星,还是将食物转化为热量的生物体。尽管我们的意图是好的,但我们是熵的代理人。

    “除了死亡、税收和热力学第二定律之外,生活中没有什么是确定的”,麻省理工学院的物理学家Seth Lloyd写道。这个指示是无法回避的。熵的增长与我们最基本的经历深深交织在一起,解释了为什么时间向前发展,以及为什么世界看起来是确定性的,而不是量子力学上的不确定性。

    尽管具有根本的重要性,熵却可能是物理学中最具争议的概念。“熵一直是个问题,”Lloyd告诉我。这种困惑,部分源于这个词在学科之间“辗转反侧”的方式——从物理学到信息论再到生态学,它在各个领域都有相似但不同的含义。但这也正是为何,要真正理解熵,就需要实现一些令人深感不适的哲学飞跃。

    在过去的一个世纪里,随着物理学家努力将迥异的领域整合起来,他们用新的视角看待熵——将显微镜重新对准先知,将无序的概念转变为无知的概念。熵不被视为系统固有的属性,而是相对于与该系统交互的观察者的属性。这种现代观点阐明了信息和能量之间的深层联系,现在他正在帮助引领最小尺度上一场微型工业革命。

    在熵的种子被首次播下200年后,关于这个量的理解从一种虚无主义转为机会主义。观念上的进化正在颠覆旧的思维方式,不仅仅是关于熵,还是关于科学的目的和我们在宇宙中的角色。

    熵的概念源于工业革命期间对双面印刷机的尝试。一位名叫萨迪·卡诺(Sadi Carnot)的28岁法国军事工程师着手计算蒸汽动力发动机的最终效率。1824年,他出版了一本118页的书,标题为《对火的原动力的反思》,他在塞纳河畔以3法郎的价格出售。卡诺的书在很大程度上被科学界所忽视,几年后他死于霍乱。他的尸体被烧毁,他的许多文件也被烧毁了。但他的书的一些副本留存了下来,其中藏着一门新科学“热力学”的余烬——火的原动力。

    卡诺意识到,蒸汽机的核心是一台利用热量从热物体流向冷物体的趋势的机器。他描绘了可以想象到的最高效的发动机,对可以转化为功的热量比例建构了一个界限,这个结果现在被称为卡诺定理。他最重要的声明是这本书最后一页的警告:“我们不应该期望在实践中利用可燃物的所有动力”。一些能量总是会通过摩擦、振动或其他不需要的运动形式来耗散。完美是无法实现的。

    几十年后,也就是1865年,德国物理学家鲁道夫·克劳修斯(Rudolf Clausius)通读了卡诺的书,他创造了一个术语,用于描述被锁在能量中无法利用的比例。他称之为“熵”(entropy),以希腊语中的转换一词命名。然后,他提出了后来被称为热力学第二定律的东西:“宇宙的熵趋于最大”。

    那个时代的物理学家错误地认为热是一种流体[称为“热质”(caloric)]。在接下来的几十年里,他们意识到热量是单个分子碰撞的副产品。这种视角的转变使奥地利物理学家路德维希·玻尔兹曼(Ludwig Boltzmann)能够使用概率重新构建并深化熵的概念。

    玻尔兹曼将分子的微观特性(例如它们的各自位置和速度)与气体的宏观特性(如温度和压力)区分开来。考虑一下,不是气体,而是棋盘上的一组相同的游戏棋子。所有棋子的精确坐标列表就是玻尔兹曼所说的“微观状态”,而它们的整体配置——比如说,无论它们形成一个星形,还是全部聚集在一起——都是一个“宏观态”。玻尔兹曼根据产生给定宏观状态的可能微观状态的数量,来定义该宏观状态的熵。高熵宏观状态是具有许多相容的微观状态的宏观状态——许多可能的棋盘格排列,产生相同的整体模式。

    棋子可以呈现看起来有序的特定形状的方式只有这么多,而它们看起来随机散布在棋盘上的方式要多得多。因此,熵可以被视为无序的度量。第二定律变成了一个直观的概率陈述:让某物看起来混乱的方式比干净的方式更多,因此,当系统的各个部分随机地在不同可能的配置之间切换时,它们往往会呈现出看起来越来越凌乱的排列。

    卡诺发动机中的热量从热流向冷,是因为气体颗粒更有可能全部混合在一起,而不是按速度分离——一侧是快速移动的热颗粒,另一侧则是移动缓慢的冷颗粒。同样的道理也适用于玻璃碎裂、冰融化、液体混合和树叶腐烂分解。事实上,系统从低熵状态移动到高熵状态的自然趋势似乎是唯一可靠地赋予宇宙一致时间方向的东西。熵为那些本可以反向发生的进程刻下了时间箭头。

    熵的概念最终将远远超出热力学的范围。艾克斯-马赛大学的物理学家Carlo Rovelli说,“当卡诺写他的论文时……我认为没有人想象过它会带来什么”。

    扩展熵

    熵在第二次世界大战期间经历了重生。美国数学家克劳德·香农(Claude Shannon)正在努力加密通信通道,包括连接富兰克林·罗斯福(Franklin D. Roosevelt)和温斯顿·丘吉尔(Winston Churchill)的通信通道。那次经历使他在接下来的几年里深入思考了通信的基本原理。香农试图测量消息中包含的信息量。他以一种迂回的方式做到这一点,将知识视为不确定性的减少。

    乍一看,香农想出的方程式与蒸汽机无关。给定信息中的一组可能字符,香农公式将接下来出现哪个字符的不确定性定义为每个字符出现的概率之和乘以该概率的对数。但是,如果任何字符的概率相等,则香农公式会得到简化,并变得与玻尔兹曼的熵公式完全相同。据说物理学家约翰·冯·诺伊曼(John von Neumann)敦促香农将他的量称为“熵”——部分原因是它与玻尔兹曼的量非常一致,也因为“没有人知道熵到底是什么,所以在辩论中你总是占优势”。

    正如热力学熵描述发动机的效率一样,信息熵捕捉到通信的效率。它与弄清楚消息内容所需的是或否问题的数量相对应。高熵消息是无模式的消息;由于无法猜测下一个角色,这条信息需要许多问题才能完全揭示。具有大量模式的消息包含的信息较少,并且更容易被猜到。“这是一幅非常漂亮的信息和熵环环相扣的画面,”Lloyd说。“熵是我们不知道的信息;信息是我们所知道的信息”。

    在1957年的两篇具有里程碑意义的论文中,美国物理学家E.T.Jaynes通过信息论的视角来观察热力学,巩固了这一联系。他认为热力学是一门从粒子的不完整测量中做出统计推断的科学。Jaynes提议,当知道有关系统的部分信息时,我们应该为与这些已知约束相容的每个配置分配相等的可能性。他的“最大熵原理”为对任何有限数据集进行预测提供了偏差最小的方法,现在应用于从统计力学到机器学习和生态学的任何地方。

    因此,不同背景下发展起来的熵的概念巧妙地结合在一起。熵的增加对应于有关微观细节的信息的损失。例如,在统计力学中,当盒子中的粒子混合在一起,我们失去了它们的位置和动量时,“吉布斯熵”会增加。在量子力学中,当粒子与环境纠缠在一起,从而扰乱它们的量子态时,“冯·诺伊曼熵”就会增加。当物质落入黑洞,有关它的信息丢失到外部世界时,“贝肯斯坦-霍金熵”就会增加。

    熵始终衡量的是无知:缺乏关于粒子运动、一串代码中的下一个数字或量子系统的确切状态的知识。“尽管引入熵的动机各不相同,但今天我们可以将它们都与不确定性的概念联系起来,”瑞士苏黎世联邦理工学院的物理学家Renato Renner说。

    然而,这种对熵的统一理解引发了一个令人不安的担忧:我们在谈论谁的无知?

    一点主观性

    作为意大利北部的一名物理学本科生,Carlo Rovelli从他的教授那里了解了熵和无序的增长。有些事情不对劲。他回到家,在一个罐子里装满油和水,看着液体在他摇晃时分离——这似乎与所描述的第二定律背道而驰。“他们告诉我的东西都是胡说八道,”他回忆起当时的想法。“很明显,教学方式有问题。”

    Rovelli的经历抓住了熵如此令人困惑的一个关键原因。在很多情况下,秩序似乎会增加,从孩子打扫卧室到冰箱给火鸡降温。

    Rovelli明白,他对第二定律的表面胜利不过是海市蜃楼。具有强大热视觉能力的超人观察者会看到油和水的分离如何向分子释放动能,从而留下更加热无序的状态。“真正发生的事情是,宏观秩序的形成是以微观无序为代价的,”Rovelli说。第二定律始终成立;有时只是看不见。

    在Gibbs提出这个悖论一个多世纪后,Jaynes提出了解决方法(他坚称吉布斯已经理解了,但未能清楚地表达出来)。想象一下,盒子里的气体是两种不同类型的氩气,它们相同,只是其中一种可溶于一种称为whifnium的尚未发现的元素中。在发现whifnium之前,没有办法区分这两种气体,因此抬起分流器不会引发明显的熵变化。然而,在whifnium被发现后,一位聪明的科学家可以使用它来区分两种氩物种,计算出熵随着两种类型的混合而增加。此外,科学家可以设计一种基于whifnium的活塞,利用以前无法从气体的自然混合中获得的能量。

    Jaynes 明确指出,系统的“有序性”——以及从中提取有用能量的潜力——取决于代理人的相对知识和资源。如果实验者无法区分气体A和B,那么它们实际上是相同的气体。一旦科学家们有办法区分它们,他们就可以通过开发气体混合的趋势来利用功。熵不取决于气体之间的差异,而是取决于它们的可区分性。无序在旁观者的眼中。

    “我们可以从任何系统中提取的有用功,显然也必然取决于我们拥有多少关于其微观状态的’主观’信息,”Jaynes写道。

    吉布斯悖论强调需要将熵视为一种观察属性,而不是系统固有的属性。然而,熵的主观视图是难以被物理学家接受的。正如科学哲学家肯尼斯·登比(Kenneth Denbigh)1985年在书中写道,“这样的观点,如果它是有效的,将产生一些深刻的哲学问题,并往往会破坏科学事业的客观性”。

    接受熵的这个有条件的定义需要重新思考科学的根本目的。这意味着物理学比某些客观现实更准确地描述了个人经验。通过这种方式,熵被卷入了一个更大的趋势,即科学家们意识到许多物理量只有在与观察者有关时才有意义(甚至时间本身也被爱因斯坦的相对论所重新渲染)。“物理学家不喜欢主观性——他们对它过敏”,加州大学圣克鲁斯分校的物理学家Anthony Aguirre 说,“但没有绝对的——这一直都是一种幻觉。”

    现在人们已经接受了这种认知,一些物理学家正在探索将主观性融入熵的数学定义的方法。

    Aguirre和合作者设计了一种新度量,称之为观测熵(observational entropy)。它提供了一种方法,通过调整这些属性如何模糊或粗粒度化观察者对现实的看法,来指定观察者可以访问哪些属性。然后,它为与这些观察到的特性相容的所有微观状态赋予相等的概率,就像 Jaynes 所提出的那样。该方程将热力学熵(描述广泛的宏观特征)和信息熵(捕获微观细节)连接起来。“这种粗粒化的、部分主观的观点是我们有意义的与现实互动的方式,”Aguirre说。

    许多独立团体使用 Aguirre 的公式来寻求第二定律更严格的证明。就Aguirre而言,他希望用他的度量来解释为什么宇宙一开始是低熵状态(以及为什么时间向前流动)并更清楚地了解黑洞中熵的含义。“观测熵框架提供了更清晰的信息”,巴塞罗那自治大学的物理学家Philipp Strasberg说,他最近将其纳入了不同微观熵定义的比较。“它真正将玻尔兹曼和冯·诺伊曼的思想与当今人们的工作联系起来。”

    与此同时,量子信息理论家采取了不同的方法处理主观性。他们将信息视为一种资源,观察者可以使用它来跟日益与环境融合在一起的系统进行交互。对于一台可以跟踪宇宙中每个粒子的确切状态的具有无限能力的超级计算机来说,熵将始终保持不变——因为不会丢失任何信息——时间将停止流动。但是,像我们这样拥有有限计算资源的观察者总是不得不与粗略的现实图景作斗争。我们无法跟踪房间内所有空气分子的运动,因此我们以温度和压力的形式取平均值。随着系统演变成更可能的状态,我们逐渐失去了对微观细节的跟踪,而这种持续的趋势随着时间的流逝而成为现实。“物理学的时间,归根结底,是我们对世界无知的表现”,Rovelli写道。无知构成了我们的现实。

    “外面有一个宇宙,每个观察者都带着一个宇宙——他们对世界的理解和模型”,Aguirre说。熵提供了我们内部模型中缺点的度量。他说,这些模型“使我们能够做出良好的预测,并在一个经常充满敌意但总是困难的物理世界中明智地采取行动。

    以知识为驱动

    2023年夏天,通过Aguirre于2006年共同创立的一个名为Foundational Questions Institute(FQxI)的非营利研究组织,在英国约克郡一座历史悠久的豪宅庄园连绵起伏的山脚下,Aguirre主持了一次闭门研讨会(retreat)。来自世界各地的物理学家齐聚一堂,参加为期一周的智力安睡派对,并有机会进行瑜伽、冥想和野外游泳。该活动召集了获得FQxI资助的研究人员,以探讨如何使用信息作为燃料。

    对于这些物理学家中的许多人来说,对发动机和计算机的研究已经变得模糊不清。他们已经学会了将信息视为真实的、可量化的物理资源,即一种可以诊断从系统中提取多少功的手段。他们意识到,知识就是力量(power)。现在,他们开始着手利用这种力量。

    一天早上,在庄园的蒙古包里参加了一次可选的瑜伽课程后,这群人聆听了Susanne Still(夏威夷大学马诺阿分校的物理学家)。她首先讨论了一项新工作,针对可以追溯到一个世纪前,由匈牙利出生的物理学家利奥·西拉德(Leo Szilard)所提出的思想实验:

    想象一个带有垂直分隔线的盒子,该分隔线可以在盒子的左右壁之间来回滑动。盒子中只有一个粒子,位于分隔线的左侧。当粒子从壁上弹开时,它会将分隔器向右推。一个聪明的小妖可以装配一根绳子和滑轮,这样,当分隔器被粒子推动时,它会拉动绳子并在盒子外举起一个重物。此时,小妖可以偷偷地重新插入分隔器并重新启动该过程——实现明显的无限能量源。

    然而,为了始终如一地开箱即用,恶魔必须知道粒子在盒子的哪一侧。西拉德的引擎由信息提供动力。

    原则上,信息引擎有点像帆船。在海洋上,利用你对风向的了解来调整你的帆,推动船向前行进。

    但就像热机一样,信息引擎也从来都不是完美的。他们也必须以熵生产的形式纳税。正如西拉德和其他人所指出的,我们不能将信息引擎用作永动机的原因是,它平均会产生至少同样多的熵来测量和存储这些信息。知识产生能量,但获得并记住知识会消耗能量。

    在西拉德构思他的引擎几年后,阿道夫·希特勒成为德国总理。出生于犹太家庭并一直居住在德国的西拉德逃离了。他的著作几十年来一直被忽视,直到最终被翻译成英文,正如Still在最近的一篇信息引擎历史回顾中所述。

    最近,通过研究信息处理的基本要素,Still成功地扩展并泛化了西拉德的信息引擎概念。

    十多年来,她一直在研究如何将观察者本身视为物理系统,受其自身物理限制的约束。趋近这些限制的程度不仅取决于观察者可以访问的数据,还取决于他们的数据处理策略。毕竟,他们必须决定要测量哪些属性以及如何将这些细节存储在有限的内存中。

    在研究这个决策过程时,Still发现,收集无助于观察者做出有用预测的信息会降低他们的能量效率。她建议观察者遵循她所说的“最小自我障碍原则”——选择尽可能接近他们物理限制的信息处理策略,以提高他们决策的速度和准确性。她还意识到,这些想法可以通过将它们应用于修改后的信息引擎来进一步探索。

    在西拉德的原始设计中,小妖的测量完美地揭示了粒子的位置。然而,在现实中,我们从来没有对系统有完美地了解,因为我们的测量总是有缺陷的——传感器会受到噪声的影响,显示器的分辨率有限,计算机的存储空间有限。Still展示了如何通过对西拉德的引擎进行轻微修改来引入实际测量中固有的“部分可观测性”——基本方法是通过更改分隔线的形状。

    想象一下,分隔线在盒子内以一定角度倾斜,并且用户只能看到粒子的水平位置(也许他们看到它的阴影投射到盒子的底部边缘)。如果阴影完全位于分隔线的左侧或右侧,则可以确定粒子位于哪一侧。但是,如果阴影位于中间区域的任何位置,则粒子可能位于倾斜分隔线的上方或下方,因此位于盒子的左侧或右侧。

    使用部分可观测的信息引擎,Still计算了测量粒子位置并在内存中对其进行编码的最有效策略。这导致了一种纯粹基于物理的算法推导,该算法目前也用于机器学习,称为信息瓶颈算法(information bottleneck algorithm)。它提供了一种通过仅保留相关信息来有效压缩数据的方法。

    从那时起,和她的研究生Dorian Daimer一起,Still研究了改进的西拉德引擎的多种不同设计,并探索了各种情况下的最佳编码策略。这些理论设备是“在不确定性下做出决策的基本组成部分”,拥有认知科学和物理学背景的Daimer说。“这就是为什么研究信息处理的物理学对我来说如此有趣,因为在某种意义上,这是一种完整的循环,最终回归到对科学家的描述。”

    重新工业化

    尽管如此,他并不是约克郡唯一一个梦想西拉德引擎的人。近年来,许多FQxI受资助者在实验室中开发了有功能性的引擎,其中信息用于为机械设备提供动力。与卡诺的时代不同,没有人期望这些微型发动机为火车提供动力或赢得战争;相反,它们正在充当探测基础物理学的试验台。但就像上次一样,信息引擎正在迫使物理学家重新构想能量、信息和熵的含义。

    在Still的帮助下,John Bechhoefer已经用漂浮在水浴中的比尘埃还小的二氧化硅珠重新创建了西拉德的引擎。他和加拿大西蒙弗雷泽大学的同事用激光捕获硅珠并监测其随机热波动。当硅珠碰巧向上晃动时,它们会迅速抬起激光阱以利用其运动。正如西拉德所想象的那样,他们通过利用信息的力量成功地提起了重量。

    在调查从他们的真实世界信息引擎中提取功的限制时,Bechhoefer和Still发现,在某些状态下,它可以显著跑赢传统发动机。受到Still理论工作的启发,他们还追踪了接收部分低效信息的硅珠的状态。

    在牛津大学物理学家Natalia Ares的帮助下,信息引擎现在正在缩小到量子尺度,她曾与Still一同参加了闭门研讨会。在与杯垫大小相当的硅芯片上,Ares将单个电子困在一根细碳纳米线内,该纳米线悬挂在两根支柱之间。这个“纳米管”被冷却至接近绝对零度的千分之一,像吉他弦一样振动,其振荡频率由内部电子的状态决定。通过追踪纳米管的微小振动,Ares和她的同事计划诊断不同量子现象的功输出。

    Ares在走廊的黑板上写满了许多实验计划,旨在探测量子热力学。“这基本上就是整个工业革命的缩影,但尺度是纳米级的,”她说。一个计划中的实验灵感来源于Still的想法。实验内容涉及调整纳米管的振动与电子(相对于其他未知因素)的依赖程度,本质上为调整观察者的无知提供了一个“旋钮”。

    Ares和她的团队正在探索热力学在最小尺度上的极限——某种意义上,是量子火焰(quantum fire)的驱动力。经典物理中,粒子运动转化为有用功的效率限制由卡诺定理设定。但在量子领域,由于有多种熵可供选择,确定哪个熵将设定相关界限变得更加复杂——甚至如何定义功输出也是一个问题。“如果我们像实验中那样只有一个电子,那熵意味着什么?”Ares说道。“根据我的经验,我们仍然在这方面非常迷茫。”

    最近一项由美国国家标准与技术研究院(NIST)的物理学家Nicole Yunger Halpern主导的研究表明,通常被视为同义的熵生成的常见定义,在量子领域中可能会出现不一致,这再次出于不确定性和观察者依赖性。在这个微小的尺度上,不可能同时知道某些属性。而你测量某些量的顺序也会影响测量结果。Yunger Halpern认为,我们可以利用这种量子奇异性来获取优势。“在量子世界中,有一些经典世界中没有的额外资源,所以我们可以绕过卡诺定理,”她说道。

    Ares正在实验室中推动这些新的边界,希望为更高效的能源收集、设备充电或计算开辟道路。这些实验也可能为我们所知道的最有效的信息处理系统——我们自己——的机制提供一些洞见。科学家们不确定人脑是如何在仅仅消耗20瓦电力的情况下,执行极其复杂的脑力运动的。也许,生物学计算效率的秘诀也在于利用小尺度上的随机波动,而这些实验旨在探测任何可能的优势。“如果在这方面有某些收获,自然界也许实际上利用了它,”与Ares合作的埃克塞特大学理论学家Janet Anders说道。“我们现在正在发展的这种基础理解,或许能帮助我们未来更好地理解生物是如何运作的。”

    Ares的下一轮实验将在她位于牛津实验室的一个粉色的制冷室中进行。几年前,她开玩笑地向制造商提出了这个外观改造的建议,但他们警告说,金属涂料颗粒会干扰她的实验。然后,公司偷偷将冰箱送到汽车修理厂,给它覆盖了一层闪亮的粉色薄膜。Ares将她的新实验场地视为时代变革的象征,反映了她对这场新的工业革命将与上一场不同的希望——更加有意识、环保和包容。

    “感觉就像我们正站在一个伟大而美好的事物的起点,”她说道。

    拥抱不确定性

    2024年9月,几百名研究人员聚集在法国帕莱佐,为纪念卡诺(Carnot)其著作出版200周年而举行的会议上。来自各个学科的参与者讨论了熵在各自研究领域中的应用,从太阳能电池到黑洞。在欢迎辞中,法国国家科学研究中心的一位主任代表她的国家向卡诺道歉,承认忽视了卡诺工作的重要影响。当天晚上,研究人员们在一个奢华的金色餐厅集合,聆听了一首由卡诺的父亲创作、由一支四重奏演奏的交响乐,其中包括这位作曲家的远亲后代。

    卡诺的深远见解源于试图对时钟般精确的世界施加极致控制的努力,这曾是理性时代的圣杯。但随着熵的概念在自然科学中逐渐扩展,它的意义发生了变化。熵的精细理解抛弃了对完全效率和完美预测的虚妄梦想,反而承认了世界中不可减少的不确定性。“在某种程度上,我们正朝着几个方向远离启蒙时期,”Rovelli说——远离决定论和绝对主义,转向不确定性和主观性。

    无论你愿不愿意接受,我们都是第二定律的奴隶;我们无法避免地推动宇宙走向终极无序的命运。但我们对熵的精细理解让我们对未来有了更为积极的展望。走向混乱的趋势是驱动所有机器运作的动力。虽然有用能量的衰减限制了我们的能力,但有时候换个角度可以揭示隐藏在混沌中的秩序储备。此外,一个无序的宇宙正是充满了更多的可能性。我们不能规避不确定性,但我们可以学会管理它——甚至或许能拥抱它。毕竟,正是无知激励我们去追求知识并构建关于我们经验的故事。换句话说,熵正是让我们成为人类的原因。

    你可以对无法避免的秩序崩溃感到悲叹,或者你可以将不确定性视为学习、感知、推理、做出更好选择的机会,并利用你身上蕴藏的动力。

  • 薛其坤:探究微观量子世界

    本文系讲演稿整理而得

    欧姆定律是接近200年前,由德国物理学家欧姆提出的一个非常经典的电学规律,它说的是通过一个导体,导体的电阻与加在导体两端的电压差成正比,与流过这个导体的电流成反比。大家都非常熟悉。换一句话来说,流过这个导体的电流正比于加在这个导体两端的电压,反比于这个材料的电阻。这个材料的电阻越大,它越绝缘;在额定的电压下,它的电流就越小。

    欧姆定律讲的是沿着电流流动方向关于电压、电阻、电流基本关系的科学规律。我们很好奇,自然就想问“在垂直于电流流动的方向上,是不是也会有类似欧姆定律关于电流、电压、电阻关系的东西呢?”答案:“是!”

    这就是欧姆定律提出50多年以后,在1879年由美国物理学家埃德温霍尔发现的霍尔效应。霍尔效应实验是一个非常精妙的实验,他把这个导线变成了这样一个平板,当时用的材料是金。在垂直于这个金的平板方向上,再加一个磁场,当然沿着电流流动的方向仍然有欧姆定律的存在。但是由于这个磁场下,流动的电子受到洛伦兹力的作用,它会在垂直于电流的方向也发生偏转。

    在这样一个磁场下,电流除了欧姆定律方向的电流在流动以外,电子还在横向发生偏转,形成电荷的积累,形成电压。这个电压就叫霍尔电压,这个现象就是霍尔效应。加一个磁场就可以产生霍尔效应,那么我们自然想问,是不是不需要磁场也能实现这样一个非常伟大的霍尔效应呢?答案也是“是”!

    他发现霍尔效应一年以后,就做了这样一个试验,把材料金换成铁,靠铁本身的磁性产生的磁场,也发现了类似的霍尔效应。因为科学机理完全不一样,命名为反常霍尔效应。

    不管怎么样,霍尔效应、反常霍尔效应是非常经典的电磁现象之一。为什么呢?它用一个非常简单的科学实验、科学装置就把电和磁这两个非常不一样的现象在一个装置上完成了。

    当然了,霍尔效应非常有用。今天我给大家列举了一些大家非常熟悉的例子。比如测量电流的电流钳,我们读取信用卡的磁卡阅读器,汽车的速度计,这都是霍尔效应的应用。它已经遍布在我们生活的每一个方面,是一个极其伟大的科学发现,同时对我们社会技术进步带来了极大的便利。

    这不是这个故事的结束。100年以后,德国物理学家冯·克利青把研究的材料从金属变成半导体硅,结果他就发现了量子霍尔效应,或者说霍尔效应的量子版本。他用了一个具体材料,就是我们熟知的每一个计算机、每一个芯片都有的场效应晶体管。这个场效应晶体管中有硅和二氧化硅的分界面,在这个界面上有二维电子气。就是在这样一个体系中,在半导体材料中,他发现了量子霍尔效应。

    在强磁场下,冯·克利青先生发现了霍尔电阻,右边这个公式,=h/ne2,h是以普朗克科学家命名的一个常数,是一个自然界的物理学常数。n是自然数——1、2、3、4、5。e就是一个电子带的电量,这是一个非常伟大的发现。为什么呢?我一说就明白,因为测到的霍尔电阻和研究的材料没有任何的关系。硅,可能任何材料都会有这个,它只和物理学常数,和自然界的一些基本性能相关,和具体材料没有任何关系。因此它就打开了我们认识微观世界、认识自然界的大门。

    同时,量子霍尔效应给我们材料中运动的电子建造了一个高速公路,就像左边大家看到的动画一样,电子的高速公路上,它的欧姆电阻,平行于电流方向的电阻变成0,像超导一样。因此,用量子霍尔效应这样的材料做一个器件的话,它的能耗会非常低。

    大家今天看到的是两条道的情况,是n=2。如果n=3,这个高速公路的一边就有3条道;如果n=4,电子的高速公路就变成4条道,所以这样一种理解就把自然数n,1、2、3、4、5、6、7、8和微观世界的电子高速公路密切结合起来。大家可以看到,我们对自然界的理解,对量子世界的理解又大大前进了一步。

    冯·克利青在1980年发现量子霍尔效应以后,由于这个巨大的科学发现,五年以后他被授予诺贝尔物理学奖。

    硅有量子霍尔效应,是不是其他半导体材料也会有量子霍尔效应呢?有三位物理学家在第二年,1982年就把研究的材料从硅变成了可以发光的砷化镓,结果,他们发现了分数化的,不是一二三四了,三分之一、五分之一,分数化的量子霍尔效应,1998年这三位物理学家获得诺贝尔物理学奖。

    在我们这个世纪,大家都知道石墨烯,有两位物理学家利用石墨烯这个量子材料继续做一百年前的霍尔效应实验,结果发现了半整数的量子霍尔效应。随着量子霍尔效应的不断发现,我们对自然界,对材料,对量子材料,对未来材料的理解在电子层次上、在量子层次上逐渐加深,所以推动了科学,特别是物理学的巨大进步。

    量子霍尔效应有很多应用,今天我讲一个大家比较熟悉的应用,那就是重量的测量。我们每天都希望测测体重,重量的测量无处不存在。1889年国际度量衡大会定义了公斤千克的标准,是9:1的铂铱合金做成的圆柱体,以后的一百多年,全世界都用这个做为标准称重量。

    但是在118年以后的2007年,我们发现这个标准变化了:减轻了50微克。一个标准减少50微克是一个巨大的变化,全世界的标准就不再标准了,而且随着时间的推移也会进一步变化。因此我们需要更精确,可以用得更久的重量标准。

    在2018年的时候,国际度量衡大会重新定义了公斤的标准,那就是基于刚才我提到的量子霍尔效应,和另一个诺奖工作、约瑟夫森效应提出了一个全新的称,叫量子称或者叫基布尔称,它对重量的测量精度可以达到10的负8次方克,而且是由物理学的自然界常数所定义的,1万年、10万年、1亿年也不会发生变化。这是我举的一个大家能理解的例子。

    刚才我提到了三个不同版本的量子霍尔效应。它们需要一个磁场,就像霍尔效应一样,而且一般情况下需要的磁场都特别强,一般是10个特斯拉,10万个高斯,这是非常强大的磁场,我们庞大地球产生的磁场只有0.5高斯,我们要用的磁场是地球磁场强度的20万倍。能不能把它去掉磁场也能观察到量子霍尔效应呢?我带领的团队与合作者一起,在2013年的时候完成了这个实验,在世界上首次发现了不需要任何磁场、只需要材料本身的磁性而导致的量子霍尔效应,或者叫量子反常霍尔效应。

    这样一个发现是不是也是材料驱动的呢?是的。我在这里给大家复习一下我们所熟悉的材料。在我们一般人的概念中,我们自然界的材料只有3类,导电的金属,不导电的绝缘体,还有一个是半导体,介于两者之间。

    第一代半导体有硅、锗,第二代半导体有砷化镓、锑化汞,第三代、第四代还有氮化镓、碳化硅、金刚石等等。在研究材料和材料的相变基础上,包括量子霍尔效应上,有两个物理学家,一个是大家可能比较熟悉的华人物理学家张首晟,和宾夕法尼亚大学的Charles Kane,在这基础上他们提出了一个全新的材料:拓扑绝缘体,也就是大家在屏幕的最右边所能看到的。

    什么是拓扑绝缘体?我给大家简单解释一下。这个图大家可能比较熟悉,最左边是一个陶瓷的碗,是绝缘的、不导电的。再朝右是一个金做成的碗,是导电的,叫导体。拓扑绝缘体就是一个陶瓷碗镀了一层导电的膜。如果把这个镀了膜的碗进一步进行磁性掺杂,使它有磁性的话,它就会变成一个只有边上镀金的碗。这个边上镀金碗就叫磁性拓扑绝缘体材料。

    按照张首晟等的理论,它就可以让我们能观察到量子反常霍尔效应。但是,这个材料是一个三不像的矛盾体:它有磁性,它要拓扑,它还要绝缘,我们还要把它做成薄膜,这就要求一个运动员篮球打得像姚明那么好,跑步像博尔特那么快,跳水要全红蝉那么伶俐,这样的材料非常难以制备。为什么呢?因为大部分磁性材料都是导电的,铁、钴、镍都是导电的;另外,磁性和拓扑在物理上是很难共存的;还有一点,在两维薄膜的情况下,很难实现铁磁性,使这个才有真正的磁性。因此真正观测到量子反常霍尔效应,在实验室看到它,这是一个极其具有挑战性的实验。

    我带领的团队和另外三个团队紧密合作,我们动员了20多位研究生,奋斗了4年,尝试了一千多个样品,最后在2012年10月份,全部完成了量子反常霍尔效应发现,完成了实验。我们证明了确实在边上镀金的碗(磁性拓扑绝缘体)中,存在量子反常霍尔效应这样一个新的规律。

    今天,我特别把当时发现量子反常霍尔效应的样品带到了现场。大家可以看到,看到很多电级,电级之间有方块,每个方块上就是首先观察到的量子反常霍尔效应的样品。

    这里我再给大家讲一下制备这个材料,对原子磁场的控制,对科学发现非常重要。这是其中一个例子,我们学生制备的,采集的一些照片。中间大家会看到,拓扑绝缘体碲化铋薄膜的扫描隧道显微镜照片,上头每一个亮点代表一个原子,更重要的是,在这个范围内你找不到一个缺陷。说明我们材料的纯度非常高,我们在其他材料中也能做到这个水平。

    这是另一个拓扑绝缘体材料:硒化铋。大家可以看到,这么大的范围内,你只看到你想要的原子,没有任何缺陷,而且薄膜是原子级的平整,这为我们最后发现量子反常霍尔效应奠定了非常好的基础。

    最近,我们继续在朝这个方向努力,我们正在攻克的一个问题就是高温超导机理这个重大科学问题。我再次放了博士后制备的研究高温超导机理异质结样品的电镜照片,大家从上可以看到有5个样品,不同的颜色代表这个异质结的结合部。大家可以看到,每个亮点几乎是接近一个原子,我们制备的异质结,两个材料的结合部几乎达到了原子尺度的完美,只有这样,我们才能在这样一个非常难以攻克的高温超导机理上有所作为,我们会沿着这个方向继续努力下去。