卡尔·波普尔《科学发现的逻辑》

第一章对于若干基本问题的考察

一个科学家，不论是理论家还是实验家，都提出陈述或陈述系统，然后一步一步检验它们。说得具体一些，在经验科学的领域里，他们构建假说或理论系统，然后用观察和实验，对照经验来检验它们。

我想，对这个程序作出逻辑的分析，也就是说，分析经验科学的方法，就是科学发现的逻辑，或者说知识的逻辑的任务。

但是，“经验科学的方法”是些什么？我们所说的“经验科学”又是什么？

1．归纳问题

按照流行的观点（本书反对这种观点），经验科学的特征是它们运用所谓“归纳方法”。按照这种观点，科学发现的逻辑等同于归纳逻辑，即这些归纳方法的逻辑分析。

一般把这样一种推理称作“归纳的”，假如它是从单称陈述(有时也称作“特称陈述”），例如对观察和实验结果的记述，过渡到全称陈述，例如假说或理论。

从逻辑的观点来看，显然不能证明从单称陈述（不管它们有多少）中推论出全称陈述是正确的，因为用这种方法得出的结论总是可以成为错误的。不管我们已经观察到多少只白天鹅，也不能证明这样的结论；所有天鹅都是白的。

归纳推理是否证明为正确，或者在什么条件下证明为正确，被称作归纳问题。

归纳问题也可以被表述为如何确立根据经验得出的全称陈述真理性的问题，经验科学的假说和理论系统就是这样的全称陈述。因为许多人相信这些全称陈述的真理性是“根据经验得知的”；但是，显然，观察或实验结果的经验的记述，首先只能是单称陈述，不能是全称陈述。因此，人们说从经验得知一个全称陈述的真理性，意思常常是这样：我们能用某种方法把这个全称陈述的真理性还原为一些单称陈述的正确性，而这些单称陈述根据经验得知是真的；这就等于说：全称陈述是以归纳推理为基础的。因此，问是否存在已知是真的自然定律不过是用另一种方法问归纳推理在逻辑上是否证明为正确。

然而，如果我们要设法证明归纳推理是正确的，我们就必须首先确立归纳原理。归纳原理是我们借以能把归纳推理纳入逻辑上可接受的形式中去的陈述。在归纳逻辑拥护者的眼里，归纳原理对科学方法来说是极重要的。Reichenbach说：“……这个原理决定科学理论的其理性。从科学中排除这个原理就等于剥夺了科学决定其理论的真伪的能力。显然，没有这个原理，科学就不再有权利将它的理论和诗人的幻想的、任意的创作区别开来了。”

这个归纳原理不可能是如重言式或分析陈述那样的纯逻辑真理。的确，假如有什么纯逻辑的归纳原理的话，就不会有归纳问题了。因为在这种情况下，所有的归纳推理就必须被看作纯逻辑的或重言的变形，就和演绎逻辑的推理一样。因此，归纳原理必须是一个综合陈述；就是说，这种陈述的否定并不自相矛盾，而在逻辑上是可能的。所以，问题发生了：为什么我们必须接受这样一个原理呢？我们根据理性的理由如何能证明接受它是正确的呢？

相信归纳逻辑的人同Reichenbach一起急于指出：“归纳原理是为整个科学无保留地接受的，在日常生活里也没有人能认真地怀疑这个原理”，然而，即使假设情况是如此（毕竟，整个科学也可能是错的），我仍然认为，归纳原理是多余的，它必定导致逻辑的矛盾。

归纳原理易于产生矛盾，这在Hume的著作里，已经说清楚了；那里还说到：即使有可能避免这种矛盾，也是很困难的。因为这个归纳原理本身也必须是一个全称陈述。假如我们试图认为它的真理性来自经验而得知，那么，导致引入归纳原理的同一个问题就再一次产生了。为了证明这个原理，我们就必须运用归纳推理；而为了证明这些归纳推理，我们就必须假定一个更高层次的归纳原理；如此等等。这样，想把归纳原理建基于经验之上的试图就破产了。因为这样做必定导致无穷后退。

Kant试图摆脱这个困难，办法是他把归纳原理（他称作“普遍因果性原理”）看作是“先验地正确的”。但是我认为他为综合陈述提供一个先验的证明的这种试图，虽则机敏但并不成功。

我自己的观点是：这里概述的归纳逻辑的各种困难是不可克服的。现在很流行这样一种学说：归纳推理虽然“严格地说”是不“正确的”，但能达到某种程度的“可靠性”或“概然性”。我认为，在这一种学说里同样存在着不可克服的困难。按照这种学说，归纳推理是“概然推理”。Reichenbach说：“我们将归纳原理描述为科学借以判定真理性的手段。更确切地说，我们应该说：它的作用是判定慨然性。因为科学并不能到达真理或谬误……科学陈述只能达到一系列不同程度的概然性，这种概然性不可达到的上限和下限就是真理和谬误。”

在这个阶段，我可以不考虑归纳逻辑信仰者持有的这种概率观念，我在后面将要把它作为极不符合他们自己的论题而加以拒斥（参看下面第80节）。现在我可以这样做，因为求助于概率甚至并未触及上面已经提及的那些归纳原理所遇到的困难。因为，假如我们对根据归纳推理得来的论述给予一定程度的概率，那么为了证明它就必须援引一条新的经过适当修改的归纳原理。而这条新原理本身也必须被证明，如此等等。而且假如这条归纳原理本身也被说成不是“真的”，只是“概然的”，也得不出什么结果。简言之，和归纳逻辑的其他任何一种形式一样，概然推理的逻辑，或“概率逻辑”，不是导致无穷后退就是导致先验论的学说“。

在下面展开论述的理论是与所有运用归纳逻辑观念的试图直接对立的。这理论可以称之为检验演绎法理论，或者说就是这样的观点：假说只能以经验来检验，而且只是在这假说被提出以后。

在我详细论述这个观点（可以称为“演绎主义”，以与“归纳主义”相对立）以前，我首先必须将涉及经验事实的知识心理学和只与逻辑关系相联系的知识逻辑清楚地加以区别。因为对归纳逻辑的信仰多半是由于心理学问题和认识论问题的混淆。顺便说一下，可值得注意的是：这种混淆不仅对知识的逻辑而且对知识的心理学同样带来了麻烦。

2．心理学主义的排除

我在上面已说到：科学家的工作是提出和检验理论。

在最初阶段，设想或创立一个理论，我认为，既不要求逻辑的分析，也不接受逻辑的分析。一个人如何产生一个新的思想（不论是一个音乐主题，一个戏剧冲突或者一个科学理论），这个问题对于经验的心理学来说，是很重要的，但是对于科学知识的逻辑分析来说，是无关的。科学知识的逻辑分析与事实的问题（Kant的quid facti［事实问题］？）无关，而只与正当或正确的问题（Kant的quid juris［权利问题］？）有关。它的问题是下列这一类的：一个陈述能被证明为正当吗？假如能够，则如何证明？它是可检验的吗？这个陈述在逻辑上是否依赖于某些别的陈述？或者与它们相矛盾？为了能以这种方式对一个陈述进行逻辑的考察，这个陈述必须已经被提到我们面前。必须有人已经表述了它并将它交付逻辑的考察。

因此，我要在设想一个新思想的过程与逻辑上考察它的方法和由此得到的结果，这二者之间加以截然的区别。关于知识的逻辑（与认识的心理学相区别）的工作，我假定它仅在于研究在系统的检验中运用的方法，每一个新思想必须经受这种检验，如果要对它加以认真考虑的话。

有人会反对说，把已导致科学家作出一个发现——找到某一新的真理——的步骤加以“理性重建”看作认识论的事更为合适。但是，问题在于，确切地说，我们要重建什么？假如要重建的是灵感的激起和释放的过程，那么我将不认为它是知识逻辑的工作。这种过程是经验心理学要研究的，而不是逻辑要研究的。假如要我们要理性地重建随后的检验，那就另当别论了；通过这个检验，灵感成为一项发现或变成一项知识。科学家批判地评判、改变或抛弃他自己的灵感，就此而言，他们可以（如果我们愿意）把这里所进行的方法论的分析看作一种相应的思维过程的“理性重建”。但是，这种重建并不能描述这些过程的真实情况，它只能提供一个检验程序的逻辑骨架。不过，有些人谈到我们借以获得知识的途径的“理性重建”，大概也就是指的这个意思。

我在这本书里的论证完全不依赖于上面所说的问题。不过，不论其是否正确，我对这问题的看法是，并没有什么得出新思想的逻辑方法，或者这个过程的逻辑重建。我的观点可以这样表达：每一个科学发现都包含“非理性因素”，或者在Bergson意义上的“创造性直觉”。Einstein也说过类似的话：“探求高度普遍性的定律……从这些定律出发，用纯粹的演绎就能从这些定律获得世界的图景。达到这些……定律并没有逻辑的通路，只有通过基于对经验对象的智力爱好（‘Einfuhlung’）的直觉，才能达到这些定律”。

3.理论的演绎检验

按照这里我要提出的观点，批判地检验理论和根据检验结果选择理论的方法，总是按下列路线进行的。借助演绎逻辑，从尝试提出来且尚未经过以任何方式证明的一个新思想——预知、假说、理论系统，或任何其他类似的东西——中得出一些结论；然后将这些结论，在它们相互之间，并和其他有关的陈述加以比较，来发现他们之间存在的逻辑关系（如等价性、可推导性、相容性、不相容性）。

我们可以（如果我们愿意）区别出四条不同的检验理论的路线。第一，在这些结论之间加以逻辑的比较，以此来检验理论系统的内部一致性。第二，考察理论的逻辑形式，目的是确定这理论是否具有经验的或科学的理论的性质，或者它是否是，比如重言的命题。第三，同其他的理论作比较，主要目的是确定，假如这理论经受住我们的各种检验，它是否构成科学上的进展。最后，通过能从理论推导出的结论的经验应用来检验理论。

这最后一种检验的目的，是要找出理论的新推断（不论它自认为如何新法）耐受实践要求考验的程度。这种实践要求或是由纯科学实验引起的；或是由实际的技术应用引起的。在这里，检验的程序也是演绎的。我们借助其他过去已被接受的陈述，从理论中演绎出某些单称陈述，我们称作“预见”，特别是那种易检验或易应用的预见。从这些陈述中，选取那些从现行理论中不能推导出的，特别是那些与现行理论相矛盾的。然后我们将它们与实际应用和实验的结果相比较，对这些（以及其他）推导出的陈述作出判决。假如这判决是肯定的，就是说，假如这些单称结论证明是可接受的或被证实，那么，这理论眼下通过了检验，我们没有发现舍弃它的理由。但是，假如这判决是否定的。换句话说，假如这结论被证伪，那么它们之被证构也就证伪了它们从之合乎逻辑地演绎出来的那个理论。

应该注意：肯定的判决只能暂时支持这理论，因为随后的否定判决常会推翻它。只要一个理论经受住详细而严格的检验，在科学进步的过程中未被另一个理论取代，我们就可以说它已“证明它的品质’，或说“它已得到验证”。

在这里概述的程序中，没有出现任何类似归纳逻辑的东西。我从不认为我们能从单称陈述的真理性论证理论的真理性。我从不认为理论能借“已证实”的结论的力量被确定为“真的”，即使仅仅是“概然的”。

在本书中，我想对演绎检验的方法作一更详细的分析。我将试图说明，通常称作“认识论”问题的所有问题都可以在这个分析的框架内得到处理。尤其是，由归纳逻辑产生的那些问题能够排除，而不会代之以产生新的问题。

4．划界问题

对这里提出来的观点，大概会有许多反对意见，其中最严重的或许是下面这种意见。反对者说，我由于摈弃了归纳法，就剥夺了经验科学最重要的特性；并且意味着我撤除了分隔科学和形而上学的思辨之间的屏障。我对这个反对意见的回答是：我摈弃归纳逻辑的主要理由，正在于它并不提供理论系统的经验的、非形而上学性质的一个合适的区别标志，或者说，它并不提供一个合适的“划界标准”。

找到一个标准，使我们能区别经验科学为一方与科学和逻辑以及“形而上学”系统为另一方，这个问题我称之为划界问题。

Hume知道这个问题，并试图解决它，Kant把它看作知识理论的中心问题。假如我们按照Kant那样把归纳问题称作“Hume问题”，我们也可以把划界问题称作“Kant问题。”

我想，在这两个问题（几乎所有其他知识理论问题的根源）中，划界问题是更基本的。的确，带有经验论倾向的认识论学者所以信赖“归纳法”，其主要理由似乎是由于他们相信只有归纳法才能提供一个合适的划界标准。特别是那些信奉实证主义的经验论者是如此。

老式的实证主义者只愿意承认那些他们所谓“导源于经验”的概念（或观念、思想），才是科学的或合理的；就是说，他们认为，这些概念可以在逻辑上还原为感性经验要素，如感觉（或感觉资料）、印象、知觉、视觉或听觉、记忆等等，现代实证主义者更明确地认为，科学不是概念的系统，而是陈述的系统“。因此，他们只愿意承认这样一些陈述是科学的或合理的，它们可以还原为基本的（或“原子的”）经验陈述——还原为“知觉判断”，或“原子命题”，或“记录语句”，如此等等”。很清楚，隐含着的划界标准就是要求归纳逻辑。

既然我拒斥归纳逻辑，我也就必须拒斥所有这些想解决划界问题的尝试。由于这种拒斥，这个划界问题增加了它在当前研究中的重要性。对于不接受归纳逻辑的任何认识论来说，找到一种可接受的划界标准，是一项关键性的任务。

实证主义者通常以一种自由主义方式来解释划界问题，他们把它解释为仿佛它是一个自然科学的问题。他们不认为他们的工作是提出一个合适的约定，他们相信，必须在经验科学和形而上学之间发现一种似乎在事物的本性中存在的区别。他们不断地试图证明：形而上学按其本性不过是无意义的蠢话，正如Hume所说：“诡辩和幻想”，我们应该将它们“付之一炬”。

假如想要通过定义用“胡说”或“无意义”等词表达的只是“不属于经验科学”，那么将形而上学表征为无意义的胡说就没有价值；因为形而上学通常被定义为非经验的。但是，当然，实证主义者认为，关于形而上学他们可以说得更多一些，不只是说它的某些陈述是非经验的。“无意义”或“胡说”这些词表示或意在表示一种贬抑的评价。毫无疑问，实证主义者真正想完成的与其说是成功的划界，不如说是彻底推翻和消灭形而上学。不管是哪一种情况，我们发现，每次实证主义者试图把“有意义的”一词的意思说得更清楚一些时，总是导致同一个结果——导致“有意义语句”（区别于“无意义伪语句”）的定义，不过是重申他们归纳逻辑的划界标准。

这一点在Wittgenstein那里“表现”得很清楚。按照他的看法，每一个有意义的命题必须可以在逻辑上还原为基本（或原子）命题。他把基本命题表征为“实在的图画”或描述（顺便说一下，这一表征包括所有有意义的命题）。我们从这一点可以看到：Wittgenstein的“有意义”的标准和归纳主义者的划界标准是相符合的，只要我们用“有意义的”代替他们的“科学的”或“合理的”等词。这个想解决划界问题的试图正是在归纳问题上遭到了失败：实证主义者在急于消灭形而上学的同时消灭了自然科学。因为科学定律也不能在逻辑上被还原为基本的经验陈述。Wittgenstein的有意义标准，假如首尾一贯地加以应用，就会把那些自然定律也作为无意义的而加以拒绝；它们决不能作为真正的或合理的陈述而接受。而探索自然定律，正如Einstein所说，是“物理学家的最高使命”。试图揭示归纳问题为一个空洞的假问题这一观点，曾被Schick“表达如下：“归纳问题在于要求关于实在的全称陈述的逻辑证明……，我们与Hume一样承认：不存在这种逻辑证明，其所以不可能有，只是因为它们不是真正的陈述”。

这表明，归纳主义的划界标准如何不能在科学系统和形而上学系统之间划出一条分界线，以及为什么必定使二者处于同一地位；因为实证主义关于“意义”的教条判定二者都是无意义的假陈述的系统。这样一来，实证主义没有从经验科学中把形而上学根除掉，却使得形而上学侵入了科学的领域。

和这些反对形而上学的策略（就是说，意图反对形而上学）相反，我的工作不是去推翻形而上学，而是表述概括经验科学的合适特征，或对“经验科学”和“形而上学”这两个概念下一定义，使得我们对于一个给定的陈述系统，能说对它的仔细研究是否属于经验科学的事情。

因此，我的划界标准必须被看作对一个协议或约定的建议。对于任何一种这样的约定的适宜性，人们可以有不同的意见；而对这些问题的合理的讨论，只可能在有着某些共同目的的人们之间进行。当然，这种目的的选择最终是一种决定，超出理性论证的范围“。

因此，任何把绝对确定的不可改变的真的陈述看作科学的目的和目标的人，一定会拒绝我在这里提出的建议。下面这样一种人也会拒绝，他们认为“科学的本质……在于它的尊贵”，他们认为这种尊贵寓于科学的“整体性”和“实在的真理性和本质性”中。他们大概不会认为现代理论物理学具有这种尊贵，而我和其他人则认为，现代理论物理学是直到目前为止我称作“经验科学”的最完全的体现。

在我的心目中，科学的目的是不同的。然而，我并不想把它们说成是科学的真正的、本质的目的，来证明其正确性。这样做只能歪曲这个问题，而且这样做将意味着陷入实证主义的教条主义。就我所知，只有一种方法才能合理地论证我的建议，这就是：分析它们的逻辑推断，指出它们的丰富性——它们阐明知识理论问题的能力。

因此，我坦率地承认，归根结底，是价值的判断和偏爱指导我达到我的建议的。但是我希望我的建议会被下面这样一种人接受；这些人不仅重视逻辑的严格性，而且重视摆脱教条主义；他们追求实际应用性，但是更吸引他们的，是科学的探险和科学的发现。这种发现一再使我们面对预料不到的新问题，并迫使我们作出直到现在梦想不到的新解答。

价值判断影响我的建议这一事实，并不意味着我在犯我责备实证主义者所犯的错误——试图用谩骂来消灭形而上学。我甚至并不主张形而上学对于经验科学是毫无价值的。因为无可否认，与阻碍科学前进的形而上学思想一起，也曾有过帮助科学前进的形而上学思想，例如思辨的原子论。而且从心理学的角度来看这问题，我想，假如没有对纯思辨的有时甚至相当模糊的思想的信仰，科学发现是不可能的。这种信仰，从科学的观点来看，是完全没有根据的，因而在这个限度内是“形而上学的”。

虽然我发出了这些警告，我仍然认为知识逻辑的第一项任务是提出一个经验科学的概念，这是为了使现在有点不明确的语言学的用法尽可能地明确，也是为了在科学和形而上学观念之间划下一条清楚的界线——即使这些形而上学观念可能在科学的历史中，曾经促进过科学的进展。

5．作为方法的经验

表述“经验科学”概念的一个可接受的定义的工作，不是没有困难的。某些困难是由于这一事实：必定有许多个理论系统，其逻辑结构和一个在任何特定时候被认为是经验科学的系统很相似。这个情况有时也可以这样说：存在着许多个（可能有无限多个）“逻辑上可能的世界”。但是，称作“经验科学”的系统是意在只表示一个世界：“实在世界”或“我们的经验世界”。

为了把这个思想说得稍微确切一些，我们可以区别我们的经验理论系统必须满足的三个要求。第一，它必须是综合的，这样它能表示一个不矛盾的可能的世界。第二，它必须满足划界标准（参看第6、21节），就是说，它必须不是形而上学的，而必须表示一个可能的经验世界。第三，作为表示我们的经验世界的系统，它必须以某种方式和其他这类系统区别开来。

那么，这种表示我们经验世界的系统是如何被区别出来的呢？回答是：根据它经历了并且经受住了对它的检验。这就是说，它是应用我要分析、描述的演绎方法区别出来的。

根据这个观点，“经验”就成为分辨各种理论系统的辨别方法。这样，经验科学的特征就不仅在于它的逻辑形式，而且还要加上它的辨别方法（当然这也是归纳主义者的观点，他们试图以使用归纳方法作为经验科学的特征）。

因此，知识理论的任务是分析经验科学特有的方法或程序，可以说知识理论是经验方法的理论——通常称作“经验”的理论。

6．作为划界标准的可证伪性

归纳逻辑固有的划界标准——就是实证主义关于意义的教条－－和下列要求是等价的：所有经验科学的陈述（或所有“有意义的”陈述），必须是能最后判定其真和伪的；我们说：它们必须是“可最后判定的”。这意味着，它们的形式必须是这样：证实它们和证伪它们，二者在逻辑上都是可能的。因此，Schlick说：“……真实的陈述必须能得到最后的证实；”Waismann说得更清楚：“假如不可能确定一个陈述是否真的，那么这个陈述就没有任何意义。因为一个陈述的意义就是它的证实的方法。”

我的观点是，不存在什么归纳“。因此，从“为经验所证实的”（不管是什么意思）单称陈述推论出理论，这在逻辑上是不允许的。所以，理论在经验上是决不可证实的。假如我们想避免实证主义者所犯过的错误，按我们的划界标准，实证主义者排除了自然科学的理论系统，那么我们就必须选择一个标准，它允许我们把即使不能证实的陈述也纳入经验科学的范围。

但是，我当然只在一个系统能为经验所检验的条件下，才承认它是经验的或科学的。这些考虑提示：可以作为划界标准的不是可证实性而是可证伪性“。换句话说，我并不要求科学系统能在肯定的意义上被一劳永逸地挑选出来；我要求它具有这样的逻辑形式；它能在否定的意义上借助经验检验的方法被挑选出来；经验的科学的系统必须有可能被经验反驳。

（因此，这样的陈述：“明天这里将下雨或不下雨”，不能被看作经验的，就只因为它不可能被反驳；而这样的陈述：“明天这里将下雨”就被看作经验的。）

对于这里提出的划界标准可以提出各种反对意见。首先，科学应该给我们肯定性信息，而我的建议却认为，它的特征是能满足例如可反驳性这样的否定性要求，因此这种建议似乎是有些刚愎自用。但是，我将在第31-46节说明，这个反对意见无足轻重，因为一个科学陈述由于它的逻辑特性与可能的单称陈述冲突的可能越大，它所传达的关于世界的肯定性信息量就越大（我们称自然定律为“律”，不是没有道理的。所禁越多，所述越多）。

其次，可以试图把我对归纳主义划界标难的批判转过来反对我自己；因为，对作为划界标准的可证伪性的反对意见，似乎和我自己反对可证实性的意见相类似。

这个攻击并不能烦扰我。我的建议是以可证实性和可证伪性的不对称为根据的。这个不对称来自全称陈述的逻辑形式“。因为，这些全称陈述不能从单称陈述中推导出来，但是能够和单称陈述相矛盾。因此，通过纯粹的演绎推理（借助古典逻辑的否定后件的假言推理），从单称陈述之真论证全称陈述之伪是可能的。这样一种对全称陈述之伪的论证可以说是朝“归纳方向”（就是从单称陈述到全称陈述）进行的惟一严格的演绎推理。

第三种反对意见似乎更为严重。人们可能这样说：即使承认不对称性，由于各种理由，任何理论系统最终地被证伪，仍然是不可能的。因为找到某种逃避证伪的方法总是可能的，例如，特设性地引入辅助假说，对一个定义特设性地加以修改。甚至有可能采取简单地拒绝承认任何起征伪作用的经验的态度，而并不产生任何逻辑矛盾。无可否认，科学家通常并不这样做，但是，从逻辑上说这样做是可能的。人们会说，这个事实就使得我提出的划界标准的逻辑价值，变得至少是可疑的。

我必须承认，提出这个批评是正当的。但是我不需要因此就撤回我那采取可证伪性作为划界标准的建议。因为，我正要提出（在第20节以后），经验方法应被表征为明确地排除那些逃避证伪的方法，这些方法正如我想象中的批评者所正确坚持的，是逻辑上可能的。按照我的建议，经验方法的特征是，它使待检验的系统以一切可设想的方式面临证伪的态度，它的目的不是去拯救那些站不住脚的系统的生命，而是相反，使这些系统面临最剧烈的生存竞争，通过比较来选择其中最适应者。

我建议的划界标准也引导我们到Hume的归纳问题——自然定律正确性问题——的解决。这个问题的根源在于下述二者之间明显的矛盾：可以称作“经验主义的基本命题”的那个命题——只有经验才能判定科学陈述的真伪——和Hume认识到归纳论证不可接受二者之间的矛盾。只有假定所有经验的科学陈述必须是“可最后判定的”，就是说，假定它们的证实和证伪二者在原则上都是可能的——只有在这样的条件下，上述矛盾才会产生。假如我们放弃这个要求，并把那仅在一种意义上可判定的——单方面可判定的，更具体地说，可证伪的——并且可以为证伪它们的系统尝试所检验的那些陈述，也承认是经验的陈述，那么，上述矛盾就消失；证伪法不以任何归纳推理为其前提，而只是以正确性没有争议的演绎逻辑的重言式变形为其前提。

7．“经验基础”问题

假如可证伪性作为划界标准是可应用的，那么就必须得到在证伪推理中可作为前提的单称陈述。因此，我们的标准似乎只是变换一下问题——使我们从理论的经验性质问题退回到单称陈述的经验性质问题。

然而，即使如此，我们也有所收获。因为在科学研究实践中，与理论系统相联系的划界问题有时是迫切需要解决的，而至于单称陈述，则很少对它们的经验性质产生怀疑。的确，会发生观察的错误并因而产生假的单称陈述，但是科学家几乎从来没有理由把单称陈述称作非经验的或形而上学的。

因此，经验基础问题——即关于单称陈述的经验性质以及如何检验它们的问题——在科学逻辑内所起的作用，和大多数其他与我们有关的问题所起的作用有点不同。因为大多数问题和研究的实践有密切的关系，而经验基础的问题几乎只属于知识的理论。然而，我必须讨论这个问题，因为它们产生了许多含糊不清之处，特别是在知觉经验和基础陈述之间的关系方面。（我称作“基础陈述”或“基础命题”的是在经验的证伪中能够作为前提的陈述：简言之，个别事实的陈述。）

知觉经验经常被认为为基础陈述提供一种证明。人们认为，这些陈述的“基础”是感性知觉经验；认为通过知觉经验的“检查”，显示出这些陈述的真理性；或者认为知觉经验使它们的真理性成为“明显的”，等等。所有这些说法都显示一种强调基础陈述和知觉经验之间的紧密联系的完全正确的倾向。但是，因为陈述只能够根据逻辑由陈述来证明，这也是对的。因此，在知觉和陈述之间的联系依然不清楚，并且这种联系被同样模糊的说法描述，这些说法没有阐明什么东西，而是略过这些困难，或者至多用些比喻暗示这些困难。

假如我们把这问题的心理学方面同它的逻辑、方法论方面清楚地区分开来，我想也能找到这问题的解决办法。我们必须区别下列两方面：一方面是我们的主观经验或我们的确信感，它们决不能证明任何陈述（尽管它们可以作为心理学研究的对象）；另一方面是客观的逻辑关系，存在于各种科学陈述系统之间和每个系统内部。

经验基础问题将在第25－30节中作详细的讨论。现在我最好转入科学客观性问题，因为，我刚才用过的术语“客观的”和“主观的”需要加以阐明。

8．科学客观性和主观确信

“客观的”和“主观的”是在历史上充满着各种矛盾用法和无结论、无休止讨论的哲学术语。

我对“客观的”和“主观的”术语的用法不同于Kant。他用“客观的”这个词来表示科学知识应该是可证明的，不依赖于任何人的一时想法：一个证明是“客观的”，假如原则上它能被任何人所检验和理解的话。他写道；“假如某个事物对任何一个有理性的人都是合理的，那么它的基础就是客观的和充分的。”

而我认为，科学理论不可能完全得到证明或证实，然而它们是可检验的。因此我要说：科学陈述的客观性就在于它们能被主体间相互检验。

Kant用“主观的”一词表示我们（各种程度的）确信感。考察这些确信感如何产生是心理学的事情。例如，它们可以“根据联想定律”产生。客观的理由也可以成为“判断的主观原因”，只要我们考虑了这些理由并确信它们有说服力。

Kant或许是第一个认识到：科学陈述的客观性是和理论的构建——和运用假说和全称陈述密切相关的。只有当某些事件能按照定律或规律性重复发生时，像在可重复的实验里的情况那样，我们的观察在原则上才能被任何人所检验。在我们重复和检验它们之前，我们甚至对自己的观察也不大认真对待，也不承认它们是科学的观察。只有根据这些重复，我们才确信我们处理的并不仅是一个孤立的“巧合”，而是原则上可以主体间相互检验的事件，因为它们有规律性和可重复性。

每一个实验物理学家都知道，有些惊人的不可理解的外观“效应”在他的实验室里也许一度可以重复，但是最后消失得无影无踪。当然，在这种情况下，没有物理学家会说他已经作出一个科学发现（虽然他可以重新安排他的实验，以求得到可重复的效应）。的确，科学上有意义的物理效应可以定义为：任何人按照规定的方法进行适当的实验都能有规则地重复的效应。任何严肃的物理学家都不会把这种“神秘效应”（我建议的称呼）作为科学发现去发表——他不能提供如何重复它们的指示。这个“发现”会很快被当作幻想而摈弃，只是因为检验它的尝试都得到否定的结果。（因此，关于是否确有在原则上不可重复、独一无二的事件发生这个问题的争论，科学是不能判定的；这是一个形而上学的争论。）

现在我们可以回到在前一节中提出的我的论点：主观经验或确信感决不能证明科学陈述，除了作为经验的（心理学的）研究对象外，它在科学中不可能起什么作用，不管确信感是如何强烈，它决不能证明一个陈述。因此，我可以完全深信一个陈述的真理性，确信我的知觉提供的证据，具有一种极强烈的经验，任何怀疑对我来说都是荒谬的。但是，这是否为科学提供丝毫理由来接受我的陈述呢？能否因为K．R．P．完全确信它的真理性就证明任何陈述呢？回答是，“不”。任何其他的回答都是和科学客观性的观念不相容的。我正在体验着一种确信感，对我来说是确定无疑的事实，甚至这个事实也不能在客观科学的领域里出现，除非以心理学假说的形式出现，这种假说当然要求主体之间的相互检验：心理学家可以从我有这种确信感的猜测中，借心理学的和其他的理论之助，演绎出某些关于我的行为的预见，然后在实验检验的过程中，这些预见可得到确证或者被反驳。但是，从认识论的观点来看，我的确信感是强还是弱，这是来自一种强烈的甚至不可抗拒的、确定性无可怀疑（或者“不言自明”）的印象，还是只不过来自一个可疑的臆测，这是毫不相干的。这些和科学陈述如何能被证明的问题是没有丝毫关系的。

这样一些考虑，当然对经验基础问题并未提供一个解答。不过这些考虑至少帮助我们看到它的主要困难。由于要求基础陈述和其他科学陈述具有客观性。我们就丧失了我们希望把科学陈述的真理性还原为经验的任何逻辑手段。而且我们就不能给予那些描述经验，比如描述我们知觉的那些陈述（有时称作“记录语句”）任何优惠的地位。它们只能作为心理学陈述在科学中出现；而这就意味着：作为一种假说，它的主体间相互检验的标准肯定是不很高的（考虑到心理学的现状）。

无论我们对经验基础问题的最后解答是什么，有一件事必定是清楚的：假如我们坚持我们的要求，科学陈述必须是客观的，那么那些属于科学的经验基础的陈述也必须是客观的，即可主体间相互检验的。但是，可主体间相互检验性总是意味着：其他的可检验的陈述能从待检验的陈述中演绎出来。因此，如果基础陈述自身也是可主体间相互检验的，那么在科学中就不可能有最终的陈述；在科学中不可能有不能被检验的陈述，因而就不可能有在原则上不能被反驳的陈述，通过证伪可从它们演绎出来的某些结论来检验和反驳这些陈述。

因此，我们就达到下列观点：理论系统被认它们演绎出普遍性水平较低的陈述来检验。因为这些陈述是可主体间相互检验的，它们也必定是以同样的方式可检验的——这样以至于无穷。

人们可能想到：这个观点导致无穷的后退，因此它是站不住脚的。在第1节里，当我批判归纳时，我提出了反对意见：归纳会导致无穷的后退；现在读者也许会认为，可以提出同样的反对意见，反对我自己提倡的演绎检验程度。然而，这并非如此。检验的演绎法不能确立或证明受检验的陈述；也没有打算要它这样做，因此并不存在无穷后退的危险。但是，必须承认：我引起注意的境况——无限的可检验性和没有无需检验的最终陈述——的确产生了一个问题。因为，显然事实上检验不能无限地进行，迟早我们必须停止。我在这里不详细讨论这个问题，只想指出：检验不能永远进行下去这个事实和我对每个科学陈述必须是可检验的要求并不矛盾。因为我并不要求每一个科学陈述，在被接受以前必须在事实上已被检验。我只要求每一个这样的陈述必须可能被检验；或者换句话说，我拒绝接受这样的观点：在科学中存在着我们必须顺从地当作真的陈述来接受的陈述，只是因为由于逻辑上的理由似乎不可能检验它们。

第二章论科学方法理论问题

根据我在上面提出的建议，认识论或科学发现的逻辑，应该就是科学方法的理论。方法的理论，就其超出对科学陈述之间关系的纯逻辑分析之外而言，与方法的选择有关——与关于处理科学陈述的方式的决定有关。而这些决定当然又将根据我们从许多可能的目的中选择那个目的而定。这里建议的决定是为了规定我称作“经验方法”的适当的规则，这种决定是和我的划界标准密切联系的。我建议采取这些规则，它们可以保证科学陈述的可检验性，也就是可证伪性。

9．为什么方法论决定是不可缺少的

什么是科学方法的规则？为什么我们需要它们？可能存在这些规则的理论——方法论吗？

人们回答这些问题的方式，主要依赖于他们对科学的态度。像实证主义者那样的人，他们把经验科学看作满足诸如有意义性或可证实性等一定逻辑标准的陈述系统，会做出一种回答。有些人包括我在内，看到经验陈述易于修正的突出的特性——人们可以批判它们，也可以用更好的陈述来代替它们；这些人认为它们的工作就是去分析科学取得进展的能力，以及在决定性的场合，在互相矛盾的理论系统之间作出选择的独特方法。这些人对上述问题就会做出很不同的回答。

我很愿意承认有必要对理论进行纯逻辑的分析，这种分析不考虑理论的变化和发展。不过，这种分析并没有阐明经验科学的那些我所高度评价的方面。一个系统，例如经典力学，也许是非常“科学的”；但是教条主义地坚持它的那些人——也许他们相信，他们的任务就是在它没有被最终否证以前，保卫这样一个取得成功的系统免遭批判——他们就是采用一种和批判态度相反的态度，而我认为这种批判态度是科学家应该采取的。事实上，不可能产生对理论的最终否证；因为人们总是可能说：实验结果是不可靠的，或者说，人们断言在实验结果和理论之间存在的不一致仅仅是外观的，它们将随着我们的理解的深入而消失（在反对Einstein理论的斗争中，这两种论证都曾被用来支持Newton力学，在社会科学领域里，类似的论证很多）。如果你在经验科学领域里坚持严格的证实（或者严格的否证”），你就决不会从经验中得到益处，决不会从经验中知道你是怎么错的。

所以，假如我们仅仅以科学陈述的形式的或逻辑的结构作为经验科学的特征的话，我们就将不能从经验科学中排除那种流行的形而上学，这种形而上学是把一个过时的科学理论格高为不可辩驳的真理的结果。

这些就是我所以建议必须以经验科学的方法作为它的特征的理由。这里说的方法就是：我们处理科学理论的方式；我们用它做些什么，我们对它做些什么。因此，我将设法建立一些规则，或者可以说规范，来指导科学家去进行研究，或者说，在这里所理解的意义下的科学发现。

10．对方法论的自然主义观点

我在前一节里谈到的关于我的看法和实证主义者的看法之间的深刻区别，需要加以展开论述。

实证主义者不喜欢这样的观念：在“实证的”经验科学的领域以外，还应存在着有意义的问题——真正的哲学理论所处理的问题。他们不喜欢这样的观念：应该有真正的知识理论，认识论或方法论。他们期望在所谓哲学问题中只看到“假问题”或“疑难”。他们的这种期望——顺便说一说，他们并不称之为期望或建议，而是称之为事实的陈述——总是可以被满足的。因为很容易揭示一个问题为“无意义的”或“假的”。你所要做的只是给“意义”这个词一个合适的狭窄含意就行，因此你就很快不得不说你在任何不合适的问题中，不能发现任何意义。而且，只要你认为除了自然科学的问题以外，就没有有意义的问题，任何关于“意义”概念的争论也就成为没有意义的了，关于“意义”的教条一旦建立起来，就被抬高成为永远不可争论的东西。它再也不受攻击。用Wittgen－stein的话来说，它已变成“不能攻击的和确切无疑的”了。

关于哲学是否存在或者有无权利存在这一易引起争论的问题，几乎和哲学本身一样古老。一种完全崭新的哲学运动一再兴起，它们自以为已把古老的哲学问题最终地揭露为假问题，把哲学的邪恶的无意义和有意义的、实证的、经验的科学的良见卓识加以对照。而“传统哲学”的受鄙视的捍卫者，则一再试图对最近进行实证主义攻击的领导人解释：哲学的主要问题是对诉诸“经验”权威进行批判分析——正是这个“经验”，每一个实证主义的最新发现者和过去一样，自然而然地认为它是理所当然的。然而，对待这样一些反对意见，实证主义者只是耸耸肩，回答说：这些反对意见对他们来说没有意义，因为它们不属于经验科学，而只有经验科学才是有意义的。“经验”对他们来说，是一个纲领，而不是一个问题（除非它为经验心理学所研究）。

我想实证主义者大概不会有任何其他不同的反应，来对待我自己分析“经验”的尝试，我把经验解释为经验科学的方法。因为他们认为只存在两种陈述：逻辑的重言式和经验的陈述。因此，假如方法论不是逻辑，他们就会得出结论，它就必定是某种经验科学的分支——正在工作的科学家的行为的科学。

这种观点可以称之为“自然主义的”。按照这种观点，方法论本身也是一种经验科学，它研究科学家的实际行为，或“科学”的实际程序。毫无疑问，自然主义的方法论（有时称作“科学的归纳理论”）有它的价值。一个学习科学逻辑的学生，会对它发生兴趣并从中学习到东西。但是我称作“方法论”的东西不应被当作一种经验科学。我相信，不可能用经验科学的方法来判定如科学是否真正运用归纳原理这样的有争议的问题。当我想到，什么东西应被称为“科学”，什么人应被称为“科学家”这种问题总是一种约定或决定的事情时，我这种怀疑就增加了。

我想这样一类问题应该用不同的方式来对待。例如，我们可以考虑和比较两种不同的方法论规则的系统；一种运用归纳原理，一种不运用。然后，我们可以考察，这样一种原理一旦被引进了，是否能应用而不产生矛盾，是否对我们有帮助；我们是否真正需要它。就是这种探究使我舍弃了归纳原理，不是因为这样一种原理事实上在科学中从不被使用，而是因为我认为，它不是必需的；它对我们并没有帮助；甚至会产生矛盾。

因此，我摈弃自然主义观点。它是非批判性的。它的赞成者没有注意到：凡是他们认为自己已经发现一个事实的时候，他们只不过提出了一种约定。因此这种约定易于变成一种教条。对自然主义观点的这个批判，不仅适用于它的意义标准，而且也适用于它的科学观念并且因而适用于它的经验方法观念。

11．作为约定的方法论规则

在这里，方法论规则被当作约定。它们被描述为经验科学的游戏规则。它们不同于纯逻辑的规则，与奕棋规则相当相象，很少人会把奕棋规则当作纯逻辑的一部分；因为纯逻辑的规则支配着语言学公式的变形。对奕棋规则的研究结果也许可以称作“奕棋的逻辑”，不过不是纯而简单的“逻辑”。（同样，对科学游戏——即科学发现——的规则的研究结果，可以称作“科学发现的逻辑”。）

可以举两个简单的方法论规则为例。它们足以表明，把方法的研究和纯逻辑研究放在同一层次上是不适当的。

（1）科学的游戏原则上是没有终点的。有一天有人决定，科学陈述不再要求任何进一步的检验，可以认为这些陈述得到最终证实，他就退出这个游戏。

（2）一旦一个假说被提出、被检验、被证明它的品质，没有“正当理由”就不允许它退出。“正当理由”可以是，比如：这一假说为另一个更可检验性的假说所代替；或者对这一假说的某个推断的证伪（“更可检验的”这一概念以后要作更充分的分析）。

这两个例子表明方法论规则是什么样子的。很清楚，它们和通常称作“逻辑的”规则是很不同的。虽然逻辑也许可以建立判定一个陈述是否可检验的标准，但是它肯定不涉及是否有人尽力去检验这一陈述这个问题。

在第6节里，我曾试图用可证伪性的标准来定义经验科学，但是由于我不得不承认某些反对意见的正当性，我曾允诺对我的定义作一方法论的补充。正如可以用适合于奕棋的规则来对它下定义一样，也可以用经验科学的方法论规则来对它下定义。建立这些规则时，我们可以系统地进行。首先要规定一个最高规则，作为判定其他规则的一种规范，因而它是一种更高类型的规则。这一规则就是：科学程序的其他规则必须这样来设计，它们并不保护科学中的任何陈述不被证伪。

因此，方法论规则既与其他的方法论规则密切联系，又与我们的划界标准密切联系。但是，这种联系不是一种严格的演绎的或逻辑的联系。更确切地说，这是由于构建这些规则的目的是，在于保证我们的划界标准的可应用性；因此，它们的形成和为人们接受都是根据一个更高类型的实用规则来进行的。关于这点的一个例子已经在前面说到（参看规则1）。我们决定不提交任何进一步的检验的理论就不再是可证伪的了。正是在规则之间的这种系统的联系，才使得我们谈论方法的理论是恰当的。大家承认，这种理论的宣布，就如我们举的例子所表明的那样，绝大部分是一种相当明显的约定。方法论并不是什么深奥的真理。不过，方法论在许多情况下，可以帮助我们弄清逻辑境况，甚至解决某些迄今已证明不好对付的广泛的问题。比如，其中之一就是判定概率陈述何时应该接受或者拒斥的问题（参看第68节）。

人们经常怀疑，知识理论的各种问题相互之间是否有系统的关系，以及它们能否得到系统的处理。我在本书里希望表明这些怀疑是不合理的，这一点是相当重要的。我所以提出我的划界标准的惟一理由是，它是很有成效的，它可以帮助我们弄清和解释很多问题。Menger说：“定义是教条，只有认定义引出的结论才能给我们某些新的洞察力”这肯定也适用于“科学”概念的定义。正是从我的经验科学的定义的推断和根据这个定义得出的方法论决定，科学家才能看出我的定义和他对他的努力的目标的直觉观念是如何的一致。

哲学家也只有他们能接受从我的定义引出的推断时，才会接受我的定义。我们必须使哲学家感到满意：这些推断使得我们能够发现在过去知识理论中存在的矛盾和不恰当之处，以及追溯到这些矛盾和不恰当从之而来的基本假定和约定。我们也要使他们感到满意：我们的建议并不受到同类困难的威胁。这个发现和解决矛盾的方法也适用于科学本身，但是它在知识理论里有其特殊的重要性。正是依靠这种方法（假如依靠的话），方法论约定才可得到证明，并可证明它们的价值。

我担心，哲学家是否会把这些方法论的研究看作属于哲学，这是十分可疑的，但是实际上这并没有多大关系。不过在这方面值得提及的是，不少形而上学的因而肯定是哲学的学说可以被解释为方法论规则的典型的实体化。其中一个例子，即所谓“因果性原理”将在下一节讨论。另一个我们已经遇到的例子是客观性问题。因为科学客观性的要求也可以解释成一条方法论规则：只有那些可以主体间相互检验的陈述才可被引进科学中（参看第8、20、27节和其他地方）。的确可以这样说：理论哲学的大部分问题，而且是最有趣的问题，都能用这种方式被重新解释成为方法的问题。

第三章理论

经验科学是理论的系统。所以，科学认识的逻辑可说是理论的理论。

科学理论是全称陈述。像所有的语言表示的一样，科学理论是记号或符号的系统。因此，我认为用下列的说法来表示全称理论和单称陈述之间的区别是毫无裨益的：单称陈述是“具体的”，而理论则仅是符号公式或符号图式。因为，甚至对最“具体的”陈述也可以完全同样地说是符号公式或符号图式。

理论是我们撤出去抓住“世界”的网；使得世界合理化，说明它，并且支配它。我们尽力使得这个网的网眼越来越小。

12．因果性、解释和预见的演绎

给予某一事件以因果解释就是演绎出一个描述这一事件的陈述，运用一条或更多条的普遍性定律以及某些单称陈述即初始条件，作为演绎的前提。例如，我们可以说已经给一根线的折断作了因果解释，如果我们发现这根线的抗张强度是1磅，而我们放了2磅的重物在它上面。假如我们分析这个因果解释，我们就发现有几个组成部分。一方面，有一个假说：“凡是一根线上面放一重量超过这根线的抗张强度，这根线就要断”，这个陈述有着普遍性自然规律的性质，另一方面，我们有单称陈述（在这个例子里有两个），它只应用于这里说的特殊事件：“这根线的抗张强度是1磅”和“放在这根线上的重物重2磅”。

因此，我们有两个不同种类的陈述，它们都是一个完全的因果解释的必要成分。它们是：（1）全称陈述，就是带有自然定律性质假说：（2）单称陈述，它应用于所讨论的特殊事件上，我称之为“初始条件”。我们正是从和初始条件合取的全称陈述中，演绎出这个单称陈述：“这根线要断”。我们称这个陈述为一个特殊的或个别的预见。

初始条件描述该事件的通常被称作“原因”的东西（2磅重物放在只有1磅抗张强度的线上是这根线断的“原因”）。预见描述通常被称作“结果”的东西。我将避免使用这两个术语。在物理学里，“因果解释”这个表达方式的应用通常只限于一种特殊情况，在这种情况下，普遍定律具有“接触作用”定律的形式，或者更确切地说，用微分方程表示的无穷地接近零的距离的作用。我在这里不假定这种限制。而且，我并不想对这个理论解释的演绎方法的普适性作出一般的断言。因此我并不断言任何“因果性原理”（或者“普遍因果性原理”）。

“因果性原理”主张：对任何事件都能作出因果解释——能用演绎对它作出预见。按照人们对这个论断里的“能”这个词的不同解释，这个论断或者是重言的（分析的）或者是关于实在的论断（综合的）。因为，如果“能”的意义是：作出因果解释在逻辑上总是可能的，那么这个论断就是重言的，因为对任何预见我们总能找到可以由之演绎出这个预见的全称陈述和初始条件。（这些全称陈述是否在其他场合已被检验和验证，当然是一个不同的问题。）然而，如果“能”的意义是表示，世界为严格的定律所支配，世界是这样构成的：每一个特殊事件都是普遍规律性或定律的一个实例，那么这个断言显然是综合的。但是在这种情况下，这个断言是不可证伪的。这一点将在下面第78节中讨论。所以，我既不采纳也不拒绝“因果性原理”；我满足于简单地把它当作“形而上学的”原理从科学领域里排除出去。

然而，我要提出一条方法论规则来，它和“因果性原理”是如此一致以至后者可以被当作它的形而上学翻版。正是这条简单的规则，我们不放弃对普遍性定律和自治的理论系统的追求，也不放弃对任何种类我们能加以描述的事件作出因果解释的尝试。这条规则指导着科学研究者的工作。这里我不赞成这样的观点：物理学的最近发展要求放弃这条规则，或者说，现在物理学已确证，至少在一个领域里继续寻找定律再也没有意义了。这一点将在第78节里讨论。

13．严格的和数的全称性

我们可区别两种全称综合陈述：“严格的全称”和“数的全称”。到此为止，当我讲到全称陈述（理论或自然律）时，我指的是严格的全称陈述。另一种，数的全称陈述实际上等于某些单称陈述，或者说，一些单称陈述的合取。在这里，它们被归入单称陈述一类。

例如，比较下列两个陈述：（a）谐波振荡器的能量决不会降到一定数量之下（即hv／2），适用于所有的谐波振荡器；（b）人的身高不超过一定数量（比如8英尺）适用于所有生活在地球上的人。只涉及演绎理论的形式逻辑（包括符号逻辑）将这种陈述同样地当作全称陈述（“形式的”或“一般的”蕴涵）。然而，我认为必须强调它们之间的区别。陈述（a）要求在任何地方任何时间都是真的。陈述（b）只涉及在有限的个别的（或特殊的）时空区域内特殊元素的有限类。后一种陈述原则上可以为单称陈述的合取所代替；因为只要有足够的时间，人们可以列数有关的（有限）类的所有元素。这就是为什么我们在这种情况下称之为“数的全称”。与之相对照，对于振荡器的陈述（a），就不能为在一定的时空区域内有限数量的单称陈述的合取所代替；或者更确切地说，它只能根据下列假定被代替：世界在时间上是有限的，在此时间内只存在有限数量的振荡器。但是我们并不作任何这种假定；特别是，在对物理学的概念下定义时，我们不作任何这种假定。我们宁可把如（a）类型的陈述当作全陈述（all－statement），即关于无限个体数的全称断言。这就清楚地解释了它不能为有限数量的单称陈述的合取所代替。

我使用严格全称陈述（或“全称述”）这一概念是和下列观点相对立的：原则上每个综合的全称陈述必定可被翻译成有限数量的单称陈述的合取。主张这种看法的人或者援引他们的要求可证实性的意义标准，或者某种类似的考虑，坚持认为我称作“严格全称陈述”的陈述决不可能得到证实，所以他们拒绝这些陈述。

很清楚，根据这种抹煞单称陈述和全称陈述之间的区别的自然律观点，归纳问题就似乎被解决了；因为，显然，以单称陈述推论到数的全称陈述是完全可接受的。但是同样清楚的是，这个解决办法并不影响归纳的方法论问题。因为，要证实一个自然定律只能用经验来肯定这定律可以应用到的每一个个别事件，并发现每一个这样的事件都真正地与这定律相符合，很清楚，这是一项不可能完成的工作。

在任何情况下，科学定律是严格的全称还是数的全称的问题不能用论证来解决。这是只能用协议或约定来解决的那些问题之一。鉴于上述的方法论境况，我认为把自然律看作综合的和严格的全称陈述（“全陈述”）即有用又有成效。这就是把它们当作不能证实的陈述，（我们可以用下列形式来表示它：“……适用于在时空中的所有点（或者在时空的所有区域）”。与此相对照，仅仅涉及一定的有限时空区域的陈述，我称之为“特称的”或“单称的”陈述。

严格的全称陈述和只是数的全称陈述（实际上是一种单称陈述）之间的区别只应用于综合陈述。不过，我可以提到把这种区别也应用到分析陈述的可能性（比如，某种数学陈述）。

14．普遍概念和个别概念

在全称陈述和单称陈述之间的区别与在普遍概念或名称和个别概念或名称之间的区别是密切联系的。

通常用下列这种例子来说明这种区别：“独裁者”、“行星”、“H2O”是普遍概念或普遍名称；“Napoleon”、“地球”、“大西洋”是单一的或个别的概念。在这些例子里，个别概念或名称的特征是专有名词或者必须用专有名词来定义，而普遍概念或名称能够不用专有名词来定义。

我认为在普遍概念或名称和个别概念或名称之间的区别，具有基本的重要性。科学的一切应用的基础就是从科学假说（它们是普遍的）推知个别情况，就是演绎出个别预见。但是，在每一个单称陈述里，个别概念或名称一定会出现。

在科学的单称陈述里出现的个别名称，常常出现在时空坐标形式中。这是容易理解的，只要我们考虑到时空坐标系的应用总是关联到个别名称。因为我们必须固定它的原点，而我们只有采用专有名词（或者与之等价的东西）才能做到这一点。“格林威治”和“耶稣诞生之年’这些名称的采用说明了我的意思。用这种方法可以把有着任意大的数量的个别名称还原为很少的一些个别名称。

有时这种模糊的一般用语如，“这里的这个东西”，那里的那个东西”等等，可以用作个别名称，也许还和某种直接表示的手势联系在一起，简言之，我们可以使用一些记号，它们虽然不是专有名词，但是在某种程度上和专有名词或个别坐标是可以互换的。但是，普遍概念也可以用直接表示的手势表示出来，但只是模糊地表示。我们可以指着某些个别事物（或事件），然后用短语“以及其他类似的事物”（或者“等等”）来表示我们想把这些个体看作只是某一个类的代表，我们应该给这个类一个适当的普遍名称。毫无疑问，我们正是从直接表示的手势以及类似的手段中学习普遍词的运用，也即它们之应用于个体。这样一种应用的逻辑基础是，个别概念不仅可以是类的元素的概念，而且可以是类的概念，因而它们和普遍概念的关系不仅可以是元素和类的关系，而且也可以是子类和类的关系。例如，我的狗路克斯（Lux）不仅是个别概念维也纳狗这一类的元素，而且也是普遍概念哺乳动物这一（普遍）类的元素。而维也纳狗不仅是奥地利狗这一（个别）类的一个子类，而且也是哺乳动物这一（普遍）类的一个子类。

用“哺乳动物”这一个词作为普遍名称的例子可能引起误解。因为像“哺乳动物”、“狗”等等这些词在通常的用法中是模棱两可的。这些词被认为是个别类名称还是作为普遍类名称，取决于我们的意图，即取决于我们想说的是生活在地球上的动物的一个种（个别概念）呢，还是想说的是具有某些特性的一种自然物体，这些特性能用普遍术语来描述。同样的模棱两可也出现在使用“Pasteurized”（“消毒的”）、Linnean System”（“林奈系统”）和“Comtinism”（“拉丁语惯用法”）这样一些概念的使用中，因为有可能去除它们所涉及的专有名词（或者用这些专有名词来定义它们）。

上面说的这些例子和解释应使大家明了“普遍概念”和“个别概念”在这里是什么意思。假如要我下定义，我就不得不如上面那样说：“个别概念是这样一种概念，对它下定义时，专有名词（或等价的记号）是必不可少的。假如能完全不提及任何专有名词，那么这个概念就是一个普遍概念。”不过任何这样的定义只有很小的价值，因为它所做的一切只是把个别概念或名称的观念还原为专有名词的观念（在一个个别的自然物的名称的意义上）。

我相信我的用法与“普遍的”、“个别的”等词的习惯用法相当接近。但是不管这是否是这样，我当然认为这里的区别是必不可少的，如果我们不想去模糊在全称陈述和单称陈述之间的相应区别的话（在普遍概念和归纳问题之间存在着完全类似的关系）。鉴别一个个别事物，只根据它的普遍的性质和关系，这种性质和关系似乎是专属于它而不属于任何其他事物。这种试图是预先注定要失败的。这样的程序不是去描述一个个别事物，而是描述一些性质和关系所属的所有个体的普遍类。即使用一个普遍的时空坐标系也不能改变这一点。因为是否存在任何与用普遍名称描述相符的个别事物，假如存在，又有多少，必须始终是一个待解决的问题。

同样地，任何用个别名称对普遍名称下定义的试图也是注定要失败的。这个事实经常为人们忽视。人们广泛地相信有可能用所谓“抽象”的方法从个别概念上升到普遍概念。这个观点和归纳逻辑有着密切的关系，归纳逻辑是从单称陈述过渡到全称陈述。从逻辑上说，这些程序是同样不可行的。不错，人们用这种办法能够得到个体类，但是这些类仍然是个别概念——用专有名词来定义的概念（这样的个别的类概念的例子有：“Napoleon的将军们”，“巴黎的居民们”）。因此，我们看到，我所说的在普遍名称或概念和个别名称或概念之间的区别与在类与元素之间的区别无关。普遍名称和个别名称两者都可以作为某些类的名称出现，也可以作为某些类的元素的名称出现。

因此，Carnap用下面的论据来除去个别概念和普遍概念的区别是不可能的。他说“……这个区别是不能证明的，”因为“……按照所采取的观点，每一个概念都能被看作个别概念或者普遍概念。”Carnap想以下列论断来支持这个看法：“……正如普遍概念那样，（几乎）所有的所谓个别概念都是类的名称”。正如我已经表明的，这个论断是很正确的，但是和这里所讨论的区别不相干。

在符号逻辑（曾经叫做“logistics”）的领域里的其他工作者曾同样混淆了普遍名称和个别名称的区别与类和它们的元素之间的区别。用术语“普遍名称”作为“类的名称”的同义语，用“个别名称”作为“元素的名称”的同义语，当然是允许的；但是这样的用法没有什么意义。问题并不能这样得到解决。另一方面，这种用法却很妨碍人们看到这些问题。这里的情况和前面讨论全称陈述和单称陈述之间的区别时遇到的情况很相似。符号逻辑这一工具用来处理普遍概念问题和用来处理归纳问题一样是不合适的。

15．严格全称陈述和严格存在陈述

把全称陈述说成是没有个别名称在其中出现的陈述当然是不够的。如果“渡鸦”这词用作一个普遍名称，那么，显然“所有渡鸦都是黑的”就是一个严格全称陈述。但是，在许多其他的陈述中，诸如“许多渡鸦是黑的”、“有些渡鸦是黑的”、“有一些黑渡鸦”等等，也只出现普遍名称；然而我们当然不应称他们为全称陈述。

只有普遍名称没有个别名称出现的陈述，我们叫它“严格的”或“纯粹的”陈述。其中最重要的就是我们已经讨论过的严格全称陈述。此外，我特别对“有一些黑渡鸦”这样形式的陈述感兴趣。这一陈述可以被认为与下列陈述同一意思：“至少存在一只黑渡鸦”。我称这种陈述为严格或纯粹存在陈述（或“有”陈述）。

严格全称陈述的否定总是与严格存在陈述等值，反过来说也是一样。例如，“不是所有的渡鸦都是黑的”就等于说：“存在着一只不黑的渡鸦”或“有非黑渡鸦”。

自然科学的理论，特别是所谓自然定律，具有严格全称陈述的逻辑形式；因此它们可以被表达成严格存在陈述的否定形式，或者可以称作非存在陈述（或“无”陈述）。例如，能量守恒定律可以表达为这样的形式“不存在永动机”，基本电荷的假说可以表达为这样的形式：“除了基本电荷的倍数以外，不存在任何电荷”。

在这个表述里，我们看到：自然定律可以和“排斥”或“禁止”相比拟。它们并不断言什么东西存在着或具有某种状态；而是否定它。它们坚持一定的事物或状态的不存在，可以说是排斥或禁止这些事物或状态：自然定律排除它们。正因如此，它们是可证伪的。如果有一个单称陈述断言为定律所排除的某一事物存在（或某一事件发生），因而可以说违反了禁令，而我们认为这个陈述是真的，那么这个定律就被反驳了（一个例子是：“在某个地方，有一个装置是永动机”）。

与严格全称陈述相反，严格存在陈述不能被证伪。任何单称陈述（就是“基础陈述”、关于某一观察事件的陈述）都不能反驳存在陈述“有白渡鸦”。只有全称陈述司以做到这点。根据我在这里采取的划界标准，我必须把严格存在陈述当作非经验的或“形而上学的”陈述来对待。乍一看来，这样的说法似乎是可疑的，和经验科学的实际不大符合。人们可以提出反对意见，（合理地）断言：甚至在物理学里，有些理论具有严格存在陈述的形式。一个例子是一个可从化学元素周期系统中演绎出的陈述，它断言有一定原子序数的元素的存在。但是假如这个假说（存在一种具有一定原子序数的元素）这样提出，使它成为可检验的，那么就需要比一个纯粹存在陈述更多得多的东西。例如，具有原子序数72的元素（铪）的发现，并不仅仅根据一个孤立的纯粹存在的陈述相反，直到Bohr成功地从他的理论中演绎出它的若干性质的预见以前，所有发现它的尝试都失败了。而Bohr的理论以及其结论与这个元素有关并帮助发现它的那些理论都远不是孤立的纯粹存在陈述它们是严格全称陈述。我决定把严格存在陈述当作非经验的——因为它们是不可证伪的——是有益的，而且是和日常用法相符合的。这一点从它应用于概率陈述和应用于用经验来检验这种陈述的问题中可以看到（参看第66－68节）。

严格的或纯粹的陈述，不论是全称的还是存在的，对于空间和时间来说，都是不受限制的。它们并不涉及一个个别的、有限的时空区域。这是为什么严格存在陈述不是可证伪的理由。我们不能去搜索整个世界来确定某个事物不存在，过去从未存在过，将来也不会存在。正由于同一个理由，严格全称陈述不是可证实的。同样，我们不能去搜索整个世界来确定定律所禁止的事物不存在。然而，两种严格的陈述，即严格存在陈述和严格全称陈述，原则上都是可用经验判定的；不过，每一种的判定都只是单向地，单方面可判决的。每当发现某个事物在某个地方存在，一个严格存在陈述因此而被证实，或一个全称陈述被证伪。

这里描述的不对称以及由此引出的推断，即经验科学的全称陈述的单方面可证伪性，现在也许比在以前（在第6节中）不那么引起怀疑了。现在我们看到，这里没有涉及任何纯逻辑关系的不对称，相反，逻辑关系显示对称性。全称的和存在的陈述是对称地构建出来的，仅仅是我们的划界标准画出的一条线产生了不对称性。

16．理论系统

科学理论永远在变化着。这不是仅仅由于偶然的缘故，而是按照我们对经验科学的特征的理解，完全可以预期到的。

也许这就是为什么，一般地说，只有科学诸分支——而且只是暂时地——达到精致的、逻辑上建构严密的理论系统的形式。尽管如此，一个试验性的系统通常完全能够作为一个整体来加以考察，包括它所有的重要推断，这是非常必要的。因为对系统的严格检验预先假定，这系统当时在形式上是足够的确定和不可更改，使得新的假定不可能偷运进来。换句话说，系统必须表述得足够的清楚和明确，使得我们易于辨认出每一个新假定是一种系统的修改，因而是一种修正。

我相信，这是为什么一个严密的系统的形式被作为目的来追求的理由。这种形式是所谓“公理化系统”——例如，Hilber能够赋予理论物理学某些分支这种形式。人们试图收集所有必需的假定（但是不多于必需的）来形成系统的顶点。它们通常被称作“公理’（或“公设”、“原始命题”；在这里使用的“公理”这个术语，并不意味着认为它是真理）。公理是这样来选择的：所有其他属于这个理论系统的陈述都能用纯逻辑的或数学的变换从这些公理中推导出来。

一个理论系统可以说是公理化了，假如已表述的一组陈述，即公理，满足下列四个基本的要求。（a）公理系统必须是没有矛盾的（不论是自相矛盾还是相互矛盾）。这等于要求，不是每一个任意选择的陈述可以从这系统中推演出来。（b）这系统必须是独立的，即它不准包含任何可以从其他公理中推演出来的公理（换句话说，只有一个陈述不能从系统的其余部分中推演出来，它才能被称为一个公理）。这两个条件是关于公理系统本身的；至于对公理系统和理论的主体的关系来说，公理必须是（c）充足的，足以使所有属于要公理化的那个理论的陈述得以推演出来；为了同样的目的，必须是（d）必要的；这意味着它不应包含多余的假定。

在这样的公理化的理论里，考察这系统的各个部分的相互依赖性是可能的。例如，我们可以考察理论的一定部分是否可以从公理的某一部分中推演出来。这种考察（在第63和64、75-77节里对此将要更多地谈到）对于可证伪性问题有重要的关系。它们使我们弄清楚为什么一个逻辑上演绎出的陈述的证伪有时不影响整个系统，而只是影响这系统的某个部分，这个部分因此可被看作已被证伪。这是可能的，因为虽然物理学理论一般并没有完全公理化，但是这理论的各部分之间的联系可以很清楚，使得我们能够判定它的哪一个子系统受到某一特定的起征伪作用的观察所影响。

17．公理系统解释的几种可能性

在这里不讨论古典惟理论的观点：某些系统的“公理”，比如Euclid几何学的公理，必须被看作直接地或直觉地确定无疑的，或不证自明的。我只是表示我不同意这个观点。我认为对于任何公理系统的两个不同的解释是可以接受的。公理或者可以被看作是（i）约定，或者可以被看作是（ii）经验的或科学的假说。

（i）假如公理被看作约定，那么它们就限制公理所引进的基本观念（或原始术语或原始概念）的用法或意义；它们决定关于这些基本观念能说什么和不能说什么。有时公理被描述为它们引进的观念的“隐定义”（implicit definitions）。这个看法也许能用公理系统和（自指的和可解的）方程式系统之间的类比来说明。

在方程式系统中出现的“未知数”（或变量）的可允许值是以某种方式由这方程式系统所决定的。即使方程式系统不足以提供惟一的解，它也不允许每一个可设想的数值组合代人“未知数”（变量）。更确切地说，方程式系统认为一定的数值组合或数值系统是可接受的，其他的则是不可接受的；它将可接受的数值系统类和不可接受的数值系统类区别开来。同样，概念系统可以用称作“陈述方程式’的方法，分为可以接受的和不可接受的。陈述方程式是从命题函项或陈述函项（参看第14节注6）中得出的；这是不完全的陈述，在其中有一个或更多的“空位”出现。这种命题函项或陈述函项的两个例子是：“元素x的同位素具有原子量65”，“x＋y＝12”。用一定的值代入这些空位，x和y，每一个这种陈述函项就变换成陈述。按照代入的值（或值的组合），得出的陈述将或者是真的，或者是假的。例如在第一个例子中，用“铜”或“锌”代人x产生一个真的陈述，而代入其他字得出假的陈述。假如我们对某个陈述函项决定只允许那些能使这函项变成真陈述的值代人，我们就得到了我所说的“陈述方程式”。用这种陈述方程式，我们定义某一确定的可接受的值系统类，即那些能满足这一方程式的值系统类。与数学方程式的类同是明显的。如果我们的第二个例子不解释为陈述函数，而是解释为陈述方程式，那么这就变成一个普通（数学）意义的方程式。

因为公理系统的未定义的基本观念或原始术语能被看作空位，公理系统开始时可以被作为陈述函项系统来处理。但是，假如我们决定只有那些能满足这系统的值系统或值组合可以代人，那么它就变成一个陈述方程式系统。它本身隐含地定义了一个（可接受的）概念系统类。每一个满足一个公理系统的概念系统可以被称作“这个公理系统的模型。”

公理系统解释为约定系统或隐定义系统，也可以表述为：它等于只允许模型可作为代人物这样一种决定。但是，如果代入一个模型，那么结果就是一个分析陈述系统（因为它是因约定而成为真的）。因此用这样的方法解释的公理系统不能被看作（在我们意义上的）经验的或科学的假说系统，因为它不能因它的推断的被证伪而被反驳；因为这些推断也必定是分析的陈述。

（ii）可以问：那么，公理系统怎样才能被解释为经验的或科学的假说系统呢？通常的看法是，在公理系统里出现的原始术语不能看作被下了隐定义的，而应看作“逻辑外的常数”。例如：出现在每一个几何学公理系统里的概念“直线”和“点”，可以被解释为“光线”和“光线的交叉点”。人们认为，用这样的方法，公理系统的陈述就变成关于经验对象的陈述，也就是说，变成综合陈述。

初看起来，这个观点似乎能使人完全满意。然而这导致和经验基础问题相联系的困难。因为，什么是定义一个概念的经验方法是很不清楚的，人们习惯地谈到“直指定义”（“ostensive definitions”），它的意思就是给予概念以一定的经验定义，把这个概念和属于实在世界的一定对象联系起来。因此，它被认为这些对象的符号。但是，本来应该很清楚，只有个别名称或概念才能用下列方法来确定：直接指示“实在的对象”——比方说指向一定的物体，同时说出一个名称，或者贴上一个带有一个名称的标签，等等。然而，在公理系统里使用的概念应该是普遍名称，而普遍名称是不能用经验的表示、指向等等来定义的。假如可以下定义的话，它们只能用其他普遍名称下显定义（explicitly defined）；否则，它们只能仍是未定义的概念。所以，有些普遍名称必定仍然是未定义的，这是完全不可避免的。困难就在这里，因为，这些未定义的概念总是可以被用于非经验的意义（i），就是说，好像它们是被下了隐定义的概念。然而，这种用法必定不可避免地破坏了系统的经验性质。我相信，这个困难只能用方法论决定的办法来克服。为此，我将采用一条规则：不要这样使用未定义的概念，仿佛它们被下了隐定义似的（这点将要在下面第20节中谈到）。

在这里，我也许可以补充说明：一个公理系统（例如几何学）的原始概念通常是可能和另一个系统（例如，物理学）的概念相联系的，或者为后者所解释。在某一门科学的进化过程中，当一个陈述系统正在用一个新的（更加一般的）假说系统来解释的时候，上述可能性特别重要。从这个新的假说系统中，不但可以演绎出属于第一个系统的陈述，而且可以演绎出属于其他系统的陈述。在这样的情况下，用原来在某个旧的系统中使用的概念来定义新系统的基本概念是可能的。

18．普遍性水平否定后件假言推理

在一个理论系统内，我们可以区别属于各种普遍性水平的陈述。普遍性水平最高的陈述是公理；较低水平的陈述能由它们演绎出来。较高水平的经验陈述相对于从它们演绎出来的较低水平的陈述来说，总是具有假说的性质：它们能为这些不那么普遍的陈述之被证伪所证优。但是，在任何假说的演绎系统中，这些不那么普遍的陈述本身仍然是（在这里所理解的意义上）严格全称陈述。因此，它们也必定具有假说的性质——在较低水平的全称陈述的情况下，这点往往被忽视。例如，Mach称Fourier的热传导理论是“物理学的模型理论”，他有一个古怪的理由：“这个理论的基础不是一个假说，而是一个观察事实。”然而，Mach用下列陈述来描述他所指的这个“观察事实”：“……假定温度差别很小，温度差消除的速度正比于温度差本身。”这是一个全陈述，它的假说性质应该说是够明显的。

我甚至要说，某些单称陈述也是假说的，因为（依靠一个理论系统的帮助）可以从它们演绎出结论，使这些结论的被证优可以证伪这些单称陈述。

这里提到的证伪的推理方式——用这个方式，一个结论的被证协必然得出这结论从之演绎出来的那个系统的被证伪——是古典逻辑的否定后件假言推理。这个方法可以描述如下：

，读作：“如果P可从t推导出，而且如果P是假的，那么t也是假的。”

用这个推理方式我们证伪了整个系统（理论和初始条件），这个系统是演绎出陈述P，即演绎出被证协的陈述所必需的。因此，不能断言系统中的任何一个陈述，说它特别受到或不受到证伪的影响。只有当P对系统的某个部分是独立的，我们才能说：这个部分不受证伪的影响。与此相关的是下列可能性：在某种情况下，也许考虑到普遍性的水平，我们可以把证伪归之于某个确定的假说——比如，一个新引进的假说。假如一个得到充分验证并继续得到进一步验证的理论，可从一个更高水平的新假说演绎出来因而获得解释，上述情况就可以发生。必须努力用它的某些尚未得到检验的推断来检验这个新假说。如果任何这些推断被证伪，那么就完全可以把证伪单独归之于这个新假说。然后，我们将寻找其他高水平的概括来代替它，但是我们不必认为那个概括性较低的旧系统已被证伪（参看第85节关于“拟归纳”的论述）。

第四章可证伪性

关于是否存在可证伪的单称陈述（或者“基础陈述”）的问题，将在以后考察。这里我假定对这个问题采取一个肯定的回答；我将考察我的划界标准可以在何种程度上应用到理论系统上来——假如可以利用的话。对一种通常称作“约定主义”的立场进行批判性讨论，首先会提出若干方法问题，我将采取一定的方法论决定来对付这些问题，其次，我将试图表征那些可证伪的理论系统的逻辑性质——可证伪的，即假如采用我们的方法论决定的话。

19．约定主义的若干反对意见

对于我采取可证伪性作为我们判定一个理论系统是否属于经验科学的标准的建议，一定会有反对意见。例如，那些受约定主义这一学派影响的人们就会提出反对意见。在第6、11、17节里我们已经接触到某些这种反对意见，现在要稍微详细一些加以考察。

约定主义哲学的根源似乎是，对物理定律中显示出来的世界朴素优美的简单性感到惊奇。如果我们不得不与实在论者一起相信，自然定律给我们揭示了在外表丰富的多样性下面世界内在的结构的简单性，约定主义者却似乎感到，这种简单性是不可能理解的，实在是神秘的。Kant的唯心主义没法解释这种简单性，说：是我们自己的知性把它的定律赋予自然。同样地，甚至更加大胆地、约定主义者把这个简单性看作我们自己的创造。然而，他们认为，这种简单性并不是由于我们的知性把定律加于自然，因而使得自然成为简单的；因为他们并不相信自然是简单的。仅仅“自然定律”是简单的。约定主义者还认为，这些自然定律是我们自己的自由创造，我们的发明，我们的任意决定和约定。对于约定主义者来说，理论自然科学不是自然界的图景，只是逻辑建构。决定这种建构的不是世界的性质；相反，正是这种建构决定着一个人工世界的性质：一个概念的世界，这些概念由我们选择的自然定律隐含给予地定义。科学所谈论的只是这个世界。

按照这个约定主义的观点，自然定律不能为观察所证伪；因为需要这些自然定律来决定观察，特别是科学的测量是什么。正是这些我们制定的定律为钟的调节和所谓“刚性”量杆的校正形成必不可少的基础。仅当用这些工具来测量的运动满足我们决定采用的力学公理时，才能称钟是“准确的”，量杆是“刚性的”。

约定主义哲学帮助我们澄清理论和实验的关系是很值得称赞的。它认识到，在进行和解释我们的科学实验时，按照约定和演绎推理设计的我们的动作和操作所起作用的重要性，这种重要性归纳主义者是很少注意到的。我认为约定主义是一种独立完整的可加以辩护的系统。想从其中发现矛盾大概不能得到成功。但是不管所有这些，我发觉它是完全不能接受的。它的基础是一种关于科学、关于科学的目的和功能的观念，这种观念是和我的观念完全不同的。我并不向科学要求任何最终的确定性（因此我也没有得到），而约定主义者在科学中追求“基于最终根据的知识系统”，这是Dingler的用语。这个目的是可以达到的；因为把任何给定的科学系统解释为隐定义的系统是可能的。在科学发展缓慢的时期，很少机会引起倾向于约定主义的科学家和赞成与我类似观点的科学家之间的冲突，除非是纯学术性的冲突。在科学危机时期，情况就完全不同了。每当当时的“经典”系统受到新的实验结果的威胁（按照我的观点，这可以解释成为证伪）时，约定主义者都认为这理论系统是不可动摇的。他们会把这些已出现的矛盾解释过去，也许归咎于我们对这系统没有掌握，或者他们会特设性地建议采用某些辅助假说，或者对测量工具作某些校正，以此来消除上述的矛盾。

在这种危机时期，关于科学目的的这个冲突变得尖锐起来。我们以及同意我们态度的人们，希望作出新的发现；我们希望新建立的科学系统会帮助作出新发现。因此我们对起证伪作用的实验有着最大的兴趣。我们将欢呼它的成功，因为它开辟新的远景，进入一个新经验的世界，即使这些新经验供给我们新论据来反对我们自己的最近才提出的理论，我们也要欢呼它。但是约定主义者却把这个新出现的结构（我们赞美这个结构的大胆）看作“科学总崩溃”的纪念碑。正如Dirgler所说的那样，在约定主义者的眼里，只有一个原理能够帮助我们从所有可能的系统中选出一个这当然实际上是指目前的“经典”系统：这就是选择最简单的系统——最简单的隐定义的系统的原理；当然这实际上就是当时的“经典”系统（关于简单性问题，参看第41－45节，特别是46节）。

因此，我和约定主义者的冲突不是可以仅仅用超然的理论讨论所能最终解决的。然而我想从约定主义者的思想方式中抽出若干反对我的划界标准的有趣论据来，这是可能的；例如下面所说的论据。一个约定主义者可能这样说：我承认自然科学的理论系统是不可证实的，但是我认为它们也是不可证伪的。因为总是有可能……使任何合意的公理化系统达到所谓它“和实在相符”；可以用多种方法达到这一点（前面已经建议过几种方法）。例如我们可以引进特设性假说，或者我们可以修改所谓“直指定义”（或者修改“显定义”，如在第17节所表明的，它们可以代替“直指定义”）。或者我们可以对实验者的可靠性采取怀疑态度，我们可以把威胁我们系统的实验者的观察从科学中排除出去，根据这样的理由：这些观察的根据不充分、不科学，或者不客观，甚或根据这样的理由：实验者是一个说谎者（这是物理学家有时对所谓神秘现象所采取的那种正确态度）。作为最后的手段，我们总能对理论家的才智表示怀疑（例如，假如一个理论家如Dingler那样不相信电的理论将来有一天从Newton的引力理论中推导出来）。

因此，按照约定主义的观点，把理论系统分为可证伪的和不可证伪的是不可能的；或者更确切地说，这样一种区分是模糊的。结论就是，我们的可证伪性标准作为划界标准必定证明是无用的。

20．方法论规则

我认为，一个想象中的约定主义者的这些反对意见，正如约定主义哲学本身那样，是无可争辩的。我承认我的可证伪性标准并不导致一个毫不模糊的分类。的确，不可能靠分析一个陈述系统的逻辑形式来判定，它是一个由不可反驳的隐定义组成的约定系统还是一个在我的意义上是经验的也就是可以反驳的系统。然而，这不过说明我的划界标准不能直接应用到陈述系统上去——这个事实我已经在第9、11节中指出过。因此，一个给定的系统本身应该被认为是一个约定主义的系统还是一个经验的系统问题是错误的。只有参照应用于理论系统的方法才可能问，我们处理的是约定主义的还是经验的理论。避免约定主义的惟一方法是采取一个决定：决定不应用它的方法。我们决定，假如我们的理论系统受到威胁，我们将不用任何种类的约定主义策略来挽救它。因此我们将防止利用那总是存在着的刚才提及的可能性：“……使任何合意的……系统达到所谓它‘和实在相符’”。

在Poincare之前一百年，BComck表达了约定主义方法的得失的清楚理解。他写道：“巧妙地适应条件，能使得几乎任何假说和现象相符合。这个将满足我们的想象，但是不能推进我们的知识。

为了表述防止采取约定主义策略的方法论规则，我们必须熟悉这些策略可能采取的各种形式，以便针对每种形式采取适当的反约定主义的对抗手段。而且，我们应该决定，每当我们发现一个系统为约定主义策略所挽救时，我们就要重新检验它，假如情况需要，就摈弃它。

在前一节的末尾，已经列举了四种主要的约定主义策略。这个列举并不完全，必须让研究者，特别是在社会学和心理学领域里的研究者（物理学家不大需要这样的警告），经常保持警惕，不受使用新的约定主义策略的诱惑——例如，心理分析家常常屈从于这种诱惑。

关于辅助假说，我们建议规定这样的规则：只有那些引进以后并不减少，反而增加该系统的可证伪度或可检验度的辅助假说才是可接受的（如何计算可证伪度，将在第31-40节中说明）。如果可证伪度增加了，那么引进假说真正加强了这理论：这系统比以前排除更多的东西，禁止更多的东西。我们也可以这样说：辅助假说的引进总应被看作构建新系统的尝试；然后这个新系统总是应该根据它被采用后，能否构成我们对世界的认识的一个真正的进展来判断其优劣。一个在这个意义上能被接受的辅助假说的突出例子是，Pauli的不相容原理（参看第38节）。一个不能令人满意的辅助假说的例子是，Fitzgeralid和Lorentz的收缩假说，它没有可证伪的推断，只是为了恢复理论和实验——主要是Michelson和Morley的发现——的一致。在这里进展只有靠相对论才获得的，它预见了新推断，新的物理效果，因而开辟了检验和证伪理论的新的可能性，我们的方法论规则可以用下列的话来加以限制：我们不需要把每一个不能满足上述标准的辅助假说都当做约定主义的而加以摈弃。特别是，有一些单称陈述实际上根本不属于理论系统。它们有时被称作“辅助假说”，虽然它们被引进来帮助理论，它们是完全无害的。（一个例子是这样的假定：一个不能重复的观察或测量可能是由于错误所致。参看第8节注⑥，第27、68节）。

在第17节里，我提到过显定义。凭着这种定义，我们用一个普遍性水平较低的系统来给出一个公理系统的概念的意义。假如有用，改变这些定义是可以允许的；不过他们必须被认为是系统的修改，以后就必须重新审查这个系统，仿佛它是新的系统一样。关于未定义的普遍名称，必须区别两种可能性：（1）有某些未定义的概念只出现在普遍性水平最高的陈述中，它们的使用是基于这样的事实：我们知道其他概念和它们处于什么样的逻辑关系中。在演绎过程中，它们能被取消掉（一个例子是“能”）。（2）其他的未定义的概念也出现在普遍性水平较低的陈述中，它们的意义是由惯用法确定的（例如，“运动”、“质点”、“位置”）。与此相联系，我们要禁止惯用法的偷偷改变，而在其他方面就如前面说的那样按照我们的方法论决定来行事。

关于我们列举的其他两点（涉及实验家或理论家的能力），我们要采用类似的规则。可以接受或根据相反的实验拒绝一个可主体间相互检验的实验。去诉诸要在未来被发现的逻辑指导可以不予考虑。

21．对可证伪性的逻辑考察

只是在（如按照我们的经验方法规则处理它）可证伪的系统的情况下，才需要注意防止约定主义的策略。让我们假定，我们已经用我们的规则成功地禁止了这些策略，现在可以要求说明这种可证伪的系统的逻辑特征了。我们将试图以理论和基础陈述类之间的逻辑关系来说明理论的可证伪性的特征。

我称作“基础陈述”的单称陈述的性质，还有它们是否也是可证伪的问题，将在下一章中作更充分的讨论。这里我们假定：存在可证他的基础陈述。必须记住：当我讲到“基础陈述”时，我并不是指已接受的陈述系统。毋宁说我使用基础陈述系统这一术语时，它包括具有一定逻辑形式的所有自相一致的单称陈述——可以说是关于事实的所有可设想的单称陈述。因此，由全部基础陈述组成的系统包含着许多互不相容的陈述。

作为第一次尝试，每当单称陈述能从某一理论演绎出来时，人们也许会称该理论为“经验的”。然而，这个尝试失败了，因为，为了从一个理论中演绎出单称陈述来，我们总是需要其他的单称陈述——初始条件，它告诉我们用什么去替代理论中的变量。作为第二次尝试，假如依靠作为初始条件的其他单称陈述的帮助可以演绎出单称陈述来，人们就称这个理论是“经验的”。但是这样也不行，因为，即使非经验陈述，例如重言陈述，也允许我们从其他的单称陈述中演绎出某些单称陈述来（例如，按照逻辑规则，我们可以例如说：从“2×2＝4”和“这里有一只黑渡鸦”的合取中，除了别的以外，可以得出“这里有一只渡鸦”）。即使要求从和一些初始条件在一起的理论中，我们应该能够演绎出比我们仅仅从这些初始条件中能演绎出的更多的陈述，也是不够的。这个要求的确排除重言的理论，但是它并不排除综合的形而上学陈述（例如，从“每一事件都有原因”和“这里发生一场灾难”，我们能演绎出：“这个灾难有原因”）。

这样就引导我们得出这样的要求：大致说来，理论应该允许我们，演绎出比我们单单从初始条件中能演绎出更多的经验的单称陈述。这意味着：我们必须把我们的定义建筑在特殊的单称陈述类上；而这正是我们需要基础陈述的目的。由于要详细地说出一个复杂的理论系统是如何帮助演绎出单称陈述或基础陈述是不很容易的，因此我建议采用下面的定义。一个理论应被称作“经验的”或“可证伪的”，如果它把所有可能的基础陈述类明确地分作下面两个非空的子类。第一，所有那些和理论不一致的（或理论排除的、禁止的）基础陈述组成一类，我们称这类为这个理论的潜在证伪者类；第二，那些和理论不矛盾的（或理论“允许”的）基础陈述组成一类。我们可以更简短地说：一个理论是可证伪的，如果它的潜在证伪者类不是空的。

还可作这样的补充：理论只作出关于它的潜在证伪者的断言（它断言它们的谬误）。关于“允许的”基础陈述，它什么也没有说，特别是，它不说它们是真的。

22．可证伪性和证伪

我们必须清楚地区别可证伪性和证伪。我们引进可证伪性只是作为陈述系统的经验性质的标准。至于证伪，必须引进特殊规则来决定一个系统在什么条件下应被看作已被证伪。

我们说一个理论已被证伪，只有当我们已经接受和理论相矛盾的基础陈述时（参看第11节，规则2）。这个条件是必要的，但不是充分的，因为我们知道，不能复制的个别偶发事例对于科学是没有意义的。因此少数偶然的与理论矛盾的基础陈述不会促使我们把理论作为已被证伪而摈弃。只有当我们发现一个反驳理论的可复制的效应时，我们才认为它已被证伪。换句话说，只有当描述这样一种效应的一个低水平的经验假说被提出和确认时，我们才接受这个证伪。这种假说可以称作证伪假说。证伪假说必须是经验的因而是可证伪的，这一要求的意思只是，它必须和可能的基础陈述具有一定的逻辑关系；因此，这个要求只与假说的逻辑形式有关。这假说应该得到验证，这一个附加条件是指它应该通过检验——使它面对着已接受的基础陈述的检验。

因此，基础陈述有两个不同的作用。一方面，我们使用所有在逻辑上可能的基础陈述的系统，是为了借助它来得到我们正在探求的经验陈述形式的逻辑特征。另一方面，已接受的基础陈述是假说得到验证的基础。如果已接受的基础陈述和理论相矛盾，那么我们就认为仅当它们同时验证了一个起征伪作用的假说时，它们就为理论的证伪供给了充足的理由。

23．偶发事件和事件

可证伪性的要求在开始时有一些模糊，现在已经分裂成两部分。第一，方法论的公设（参看第20节）不大可能把它搞得很精确。第二，逻辑标准，一旦我们弄清楚了哪一些陈述应被称作“基础的”，它是非常确定的（参看第28节）。这个逻辑标准迄今已经以某种形式的方式表达为陈述之间的逻辑关系——理论陈述和基础陈述之间的逻辑关系。假如我现在用更“实在论的”语言来表述我的标准的话，也许会使它更清楚、更直觉。虽然这是和形式的言语方式等价的，但是可能比较接近于日常用法。

在这个“实在论的”言语方式里，我们可以说，一个单称陈述（基础陈述）描述一个偶发事件。因此我们不说被理论排除或禁止的基础陈述，而是说理论排除某些可能的偶发事件，并且说假如这些可能的偶发事件事实上发生了，理论将被证伪。

使用这个模糊的词“偶发事件”也许会遭到批评。有时有人说，像“偶发事件”或“事件”这种词应从认识论的讨论中全部驱除出去，我们不应该说“偶发事件”或“非偶发事件”或者“事件”的发生，而应该说陈述的真或伪。不过，我赞成保留“偶发事件”这种词。很容易将它的用法加以定义，使之不会引起反对。因为我们可以这样来使用它：每当我们说到一个偶发事件时，我们也能说出与之相应的某个单称陈述来代替它。

给“偶发事件”下一定义时，我们可以记住这样的事实：说两个逻辑上等价的（就是说，可以相互演绎出来的）单称陈述描述同一偶发事件，这是很自然的。这提示下列定义：设Pk为一单称陈述（下标“k”指发生在Pk里的个别名称或坐标）。则我们称所有与Pk等价的陈述类为偶发事件Pk。例如，现在这里正在打雷，我们说这是一个偶发事件。我们可以认为这个偶发事件是下列陈述类：“现在这里正在打雷”；“1933年6月10日下午5时15分，在维也纳第13区，正在打雷，”还有所有其他与这些陈述等价的陈述。因此实在论的表述“陈述Pk代表偶发事件Pk”可以被认为与有点繁琐的陈述“陈述Pk是所有与它等价的陈述的Pk类的一个元素”有相同的意义。同样，我们认为陈述“事件Pk已经发生”（或者“正在发生”）的意义和“Pk和所有与它等价的陈述是真的”的意义相同。

这些翻译规则的目的不是说，不管谁以实在论的言语方式使用“偶发事件”这个词都在想到一类陈述；它们的目的只是为了给出一个实在论言语方式的解释，这个解释使得有些说法容易理解，例如说：一个偶发事件Pk和一个理论t相矛盾。现在这个陈述的意思不过是：每一个与Pk等价的陈述和理论t相矛盾，因而是这理论的一个潜在证伪者。

现在要引进另一个术语“事件”来表示什么是一个偶发事件的典型的或普遍的东西，或者在一个偶发事件中什么东西可以用普遍名称来加以描述。（因此，我用并不根据事件来理解复杂的或者也许长时间的偶发事件，不管这些词的日常用法提示什么。）我们定义：设：Pk，P1，……为偶发事件类的元素，这些偶发事件只在有关个体（时空位置或区域）方面是不同的；则我们称这个类为“事件（P）”。遵循这个定义，例如，关于陈述“一杯水刚刚在这里被打翻”，我们要说，和这陈述等价的陈述类是事件“一杯水的打翻”的一个元素。

说到代表偶发事件Pk的单称陈述Pk，我们可以以实在论的言语方式说：这个陈述述说事件（P）在空时位置k的发生。我们认为这个说法的意义和“等价于Pk的单称陈述类Pk是事件（P）的一个元素”相同。

现在我们要将这个术语应用于我们的问题。我们说，一个理论，假使它是可证伪的，它就不仅排除或禁止一个偶发事件，而且总是至少排除或禁止一个事件。因此，被禁止的基础陈述类，也就是理论的潜在证伪者类，假如它不是空的，总是包含无限数量的基础陈述；因为理论并不指个体本身。我们可以把属于一个事件的单称基础陈述称作“同型的”（homotypic），以表示描述一个偶发事件的等价的陈述，与描述一个（典型的）事件的同型的陈述之间的类似。因此我们可以说理论的潜在证伪者的每一个非空类至少包含同型基础陈述的一个非空类。

现在让我们想象，一个圆形面积代表所有可能的基础陈述类。这个圆面积可以被看作代表经验的所有可能的世界或所有可能的经验世界的总体。我们进一步想象，一条半径（更精确地说，沿着一条半径的一个很窄的面积，或者说一个很窄的扇形）代表每一个事件，并且想象具有相同的坐标（或个体）的任何两个偶发事件的位置和圆心的距离相等，因而在同一个同心圆上，然后我们可以这样来用图说明可证伪性这一公设：要求每一个经验理论在我们的图形里必须至少有一条理论禁止的半径（或很窄的扇形）。

这个图解可以证明，在讨论我们的各种问题时是有用的，比如关于纯粹存在陈述的形而上学性质问题（在第15节里曾简短地涉及过）。显然，一个事件（一条半径）属于每一个这种陈述，因而属于这个事件的各种基础陈述，每一个都将证实这个纯粹存在陈述。然而，它的潜在证伪者类是空的；所以，从纯粹存在陈述那里，不能得出任何关于可能的经验世界的知识（它不排除或禁止任何半径）。相反，从每一个基础陈述中得出一个纯粹存在陈述，这个事实不能用来作为支持后者的经验性质的一个论据。因为每一个重言式也可从每一个基础陈述中得出，由于重言式可从任何陈述中得出。

在这里我也许可以说一说自我矛盾的陈述。

虽然可以说重言式陈述，纯存在陈述以及别的不可证伪的陈述对于可能的基础陈述类断言太少，而自我矛盾的陈述则是断言太多。从一个自我矛盾的陈述中，任何陈述都可以正当地演绎出来。因此，它的潜在证伪者类就等于所有可能的基础陈述类：它为任何陈述所证伪。（也许人们可以说：这个事实是我们的方法的一个优点的例证，就是说，考虑可能的证伪者不考虑可能的证实者的方法。因为假如人们能以一个陈述的逻辑推断的证实来证实这个陈述，或者以这种方式仅仅使它成为可几的，那么，人们就可以期望，不管接受何种基础陈述，任何自我矛盾的陈述就会成为被确证的，或成为被证实的，或者至少成为可几的陈述了。）

24．可证伪性和无矛盾性

在一个理论系统或公理系统必须满足的各种要求中间，无矛盾性要求起着特殊的作用。它可被看作每一个理论系统，不论它是经验的还是非经验的，都要满足的第一个要求。

为了说明这个要求的基本重要性，只提到明显的事实，即必须摈弃自相矛盾的陈述，因为它是“伪”的，这样做是不够的。我们经常和这样一种陈述打交道：它虽然实际上是伪的，然而产生适合于一定目的的结果（一个例子是Nernest关于气体平衡方程式的近似）。但是，如果人们认识到，自相矛盾的陈述不传达任何信息，无矛盾性要求的重要性就会得到认识。它所以不传达任何信息是因为，我们喜欢的任何结论都能从它推导出来。因此，不能挑选出或作为不相容的或作为可推导的任何陈述。因为所有的陈述都是可推导的。在另一方面，无矛盾的陈述把这组所有可能的陈述分为两种：与它相矛盾的陈述和与它相容的陈述在后者中间，是能从它推导出来的结论。这就是为什么无矛盾性对一个系统来说是最一般的要求，不论它是经验的还是非经验的，如果它想有任何用处的话。

在无矛盾性以外，经验系统必然满足进一步的条件：它必须是可证伪的，这两个条件在很大程度上是类似的。不满足无矛盾性条件的陈述，不能在所有可能的陈述的总体中区分任何两个陈述。不满足可证伪性条件的陈述，不能在所有可能的经验的基础陈述的总体中区分任何两个陈述。

第五章经验基础问题

现在我们已把理论的可证伪性问题，归结为我们称作基础陈述的那些单称陈述的可证伪性问题。但是，何种单称陈述是基础陈述呢？它们如何能被证伪？对于实际的研究工作者来说，对这些问题可能很少关心。但是，围绕这个问题有一些模糊和误解，因而在这里较详细地讨论它是有益的。

25．作为经验基础的知觉经验：心理学主义

经验科学可以还原成感觉、知觉，因而还原成我们的经验，许多人接受这个学说，认为明显得毫无疑问。然而，这个学说是和归纳逻辑共命运的，在这里我把它和归纳逻辑一起加以提除。我不想否认，数学和逻辑的基础是思维，而事实科学的基础是知觉，这个观点里是有一点真理的。但是这个观点中的真理和认识论问题没有什么关系。的确，在认识论中，几乎没有一个问题比这个经验陈述基础问题更严重地受心理学和逻辑之间的混淆之害了。

经验基础问题对思想家的困扰很少如Fries那样深，他说，假如科学陈述不被教条地接受，我们必须能够证明它们。如果我们要求用推理的论证在逻辑的意义上去证明，那么我们就得接受这样的看法：陈述只能为陈述所证明。因而，要求所有的陈述都要被合乎逻辑地证明（Fries称作“对证明的偏爱”）一定会导致无穷后退。假如我们想避免教条主义和无穷后退的危险，似乎我们只能求助于心理学主义，即这样的学说：陈述不但可以为陈述所证明，也可以为知觉经验所证明。面对这个三难推理（trilemma）——教条主义、无穷后退和心理学主义——Fries以及几乎所有想说明我们的经验知识的认识论学者都选择心理学主义。他说，在感觉经验里，我们有“直接知识”，用这种直接知识。我们可以证明我们的“间接知识”——用某种语言符号表达的知识。这种间接知识当然包括科学陈述。

通常对这个问题的探讨并不进行得如此之远。在感觉主义和实证主义的认识论里，经验科学陈述“述说我们的经验”这点被视为当然之理。因为，假如不经过感觉－知觉，我们如何能够得到任何事实知识呢？仅仅依靠思考，一个人不能对他关于事实世界的知识加进一丁点儿。因此，知觉经验必须是所有经验科学的惟一任“知识源泉”。所以，关于这个事实世界我们知道的一切都必定可以用关于我们的经验的陈述的形式表达。这张桌子是红的还是蓝的只能诉诸我们的感觉经验才能知道。感觉经验传达我们一种直接的确信感，我们凭此就能区别出真陈述（它的术语和经验一致）和伪陈述（它的术语和经验不一致）。科学只是试图分类和描述这种知觉知识，我们不能怀疑这些直接经验的真理性，科学是我们的直接确信的系统表述。

照我看来，这个学说在归纳问题和普遍概念问题上失败了。因为我们说的科学陈述没有一个不远远超过我们“在直接经验的基础上”所能确定无疑地知道的东西（这个事实可以看作“在任何描述中固有的经验超越”）。每一个描述都使用普遍名称（或符号，或观念），每一个陈述都具有理论、假说的特性。陈述“这里有一玻璃杯水”不能为任何观察经验证实。理由是，在这陈述中出现的普遍概念不能和任何特殊的知觉经验发生相互关系。（一个“直接经验”的“直接给予”只有一次；这是独一无二的。）例如，玻璃杯这个词表示一种物体，它显示一定似定律行为，“水”这个词也是如此。普遍概念不能还原为经验类；它们不可能由经验“组成”。

26．夫于所谓“记录语句”

在我看来，上一节讨论的我称为“心理学主义”的观点，似乎仍然是经验基础现代理论的基础，即使它的拥护者并不说经验或知觉，而代之以“语句”——代表经验的语句。Neu－rath和Carnap称之为“记录语句”。

Reininger主张类似的理论甚至更早，他的出发点是这样的问题：在一个陈述和它描述的事实或事态之间的对应或一致在哪里？他达到的结论是：陈述只能和陈述相比较。按照他的看法，陈述和事实的对应不是别的，只是属于不同的普遍性水平的陈述之间的逻辑对应：这是“……较高水平的陈述和具有同样内容的陈述，最后和记录经验的陈述之间的对应。”（Reininger有时称这些陈述为“基本陈述”）。

Carnap从有点不同的问题出发。他的命题是，所有哲学的研究谈的是“言语的形式”。科学的逻辑必须研究“科学语言的形式”。它不谈（物质的）“客体”，只谈词；不谈事实，只谈语句。Carnap用这个正确的“形式的言语方式”和日常的，或他称之为“内容的言语方式”相对比。假如要避免混乱，内容的言语方式就只能用在有可能把它翻译成为正确的形式的言语方式的地方。

这个观点——我同意它——导致Carnap（和Reininger一样）主张：在科学逻辑里，我们不应说，检验语句是把它们和事态或经验相比较；我们只能说，检验语句是把它们和其他语句相比较。然而Carnap实际上是在保留着对待这问题的心理学主义方法的基础思想；他正在做的只是把它们翻译成“形式的言语方式”。他说，科学的语句“借助记录语句”接受检验；但是因为记录语句被解释为“不需要确证但是可作为科学的所有其他语句的基础”的陈述或语句，这就等于说——在日常的“内容的”言语方式里——记录语句指的是“给予”、“感觉资料”。它们描述（正如Carnap自己说的）“直接经验的内容，或现象；因而最简单的可知的事实”，这十分清楚地表明，记录语句的理论不过是翻译成形式的言语方式的心理学主义。对于Neurath的观点也完全可以这样说。他要求在记录语句里，如“感到”、“看见”这些词应该和记录语句的作者的姓名一起出现。记录语句，就如这个术语所表明的，应该是直接观察或知觉的记载或记录。

Neurath像Reininger一样认为，记录经验的知觉陈述——即“记录语句，”——不是不可取消的，而有时它们是可以被摈弃的。他反对Cernap的下列观点，自从Cernap修改观点以后：记录语句是最终的，不需要确证。但是，当Reininger描述一个在发生怀疑时用其他陈述来检验他的“基本”陈述的方法——这是演绎然后检验演绎所得结论的方法——时，Neurath没有给出这样的方法。他只是说，我们能够或者“删除”和系统矛盾的记录语句，“……或者接受它，用这样的方法来修改系统，使得加上这语句以后，系统仍然是无矛盾的”。

在我看来，Neurath关于记录语句不是神圣不可侵犯的观点，代表一个值得注意的进展。但是除了以知觉陈述来代替知觉——仅仅是翻译成形式的言语方式——外，记录语句可以修改这一学说，就是他在知觉认识的直接性理论（来自Fries）上的惟一进展了。这是在正确方向上前进的一步；但是假如不跟上另一步，它就得不出什么结果：我们需要一组规则来限制“删除”（或者“接受”）记录语句的任意性。Neurath未能给出这种规则，因而在无意中抛弃了经验主义。因为没有这些规则，经验陈述就不再从任何其他种类的陈述中区别出来。假如允许人们（在Neurath看来，允许每一个人）在感到一个记录语句不方便时，就可以干脆“删除”它，那么，每一个陈述系统就都成为可辩护的了。人们不仅能够用约定主义的方式挽救任何系统；而且，由于有了许多记录语句的供应，人们根据证人的证言（他们证明或记录他们的所见所闻）甚至可以确证任何系统。Neurath避免了教条主义的一种形式，然而他却为自称为“经验科学”的任何随意的系统开辟了道路。

因此，不很容易看出在Neurath的图式里记录语句应该起什么作用。Carnap的初期观点是，记录语句系统是经验科学的每一个主张必须据以判定的试金石。这就是为什么它们必须是“不可反驳的”。因为只有它们能够推翻语句——当然是在记录语句以外的语句。但是，假如它们被剥夺了这种作为试金石的功能，而且它们自己可以被理论推翻，那么它们起什么作用呢？由于Neurath不想解决划界问题，他关于记录语句的观点似乎只是一种遗迹——认为经验科学始于知觉的传统观点的一种残留纪念物。

27．经验基础的客观性

我建议对科学采取一种和各种心理学学派的观点稍有不同的看法。我希望在客观科学和“我们的知识”二者之间加以明确的区别。

我很愿承认，只有观察能给我们“关于事实的知识，”我们“只有通过观察才能觉察事实”（如Hahn所说），但是这种觉察，这种知识并不证明或确立任何陈述的真理性。所以我不相信，认识论必须提出的问题是：“……我们的知识建筑在什么基础之上？…或者更确切些，我有了经验S，如何能证明我对这经验的描述和捍卫它不受怀疑？”这点是做不到的，即使我们把术语“经验”改为“记录语句”。在我看来，认识论必须提出的问题应该是：我们如何根据科学陈述的演绎推断来检验他们假如这些推断本身也必须是可以在主体间相互检验的，那么为了这个目的，我们能选择哪一种推断？

现在，就逻辑的或重言的陈述而言，这种客观的、非心理学的看法被相当普遍地接受了。然而在不久以前，人们还认为，逻辑是一门科学，它研究精神过程及其规律——我们的思维规律。按照这种观点，所能找到的对逻辑的正确性的惟一证明，就是他们提到的这样的事实：我们就是不能用其他的任何方式来思维。逻辑推理似乎被证明了，就因为它被体验到是一种思维的必然性，一种不得不沿一定路线进行思维的感觉。在逻辑领域里，这种心理学主义现在也许已成为过去的事情了，没有人想象为了证明某一逻辑推理的正确性，或者捍卫它不受怀疑，在这个推论的旁边空白处写上一个记录语句：“记录：今天我在校核这一连串推理时，我体验到一种强烈的确信感。”

当我们谈到科学的经验陈述时，情况就很不一样。在这里每人都相信，这些陈述的基础是如知觉那样的经验，或者是以形式言语方式的记录语句。大多数人认识到，把逻辑陈述建筑在记录语句的基础上的任何试图，都是一种心理学主义。但是很奇怪，涉及经验陈述时，同样的做法现在却被称作“物理主义”。然而不管问题涉及逻辑的陈述还是经验科学的陈述，我想回答是一样的：我们的知识，可以被模糊地描述为意向系统，可以和心理学有关，在这两种情况下，它都可以和信念感或确信感联结着。在一种情况下，也许和不得不以一定方式思维的感觉联结着。在另一种情况下，和“知觉的自信”的感觉联结着。但是所有这些都只有使心理学家感兴趣。它甚至没有触及如科学陈述之间的逻辑关系这样的问题，只有这些问题才使认识论学者感兴趣。

（有一种广为传布的看法是，从认识论观点看来，陈述“我看见这里的这张桌子是白的”与陈述“这里的这张桌子是白的”比较，具有某种深刻的优点。但是，从评价它可能的客观检验这一观点看来，述说我的情况的第一个陈述，似乎并不比述说这里的桌子的情况的第二个陈述更可靠些。）

只有一种方法可以确定一连串逻辑推理的正确性。就是把它置于最容易接受检验的形式中：我们把它分解成许多小步骤，每一步骤都易受任何学习过变换语句的数学或逻辑技巧的人检查。如果在这样做了以后，任何人仍然提出怀疑，那么我们只能请他指出在证明的步骤中的错误，或者请他自己再想一下这个问题。在经验科学的场合，情况很相像。任何经验科学陈述都能这样来表述（通过描述实验安排，等等），以至任何学习过有关技巧的人都能检验它。假使结果他拒斥这个陈述，那么，如果他只是告诉我们他对他的知觉的怀疑感或确信感，这是不能使我们满意的。他必须做的是提出一个和我们的断言相矛盾的断言，并且提供给我们如何检验他的断言的指示。假如他不能这样做，我们就只能请他对我们的实验更加仔细地考察一番，重新想一想。

一个由于它的逻辑形式而不可检验的断言，至多在科学内起一种刺激物的作用：它能提示一个问题。在逻辑和数学的领域里，Fermat问题可以作为一个例子。在博物学领域，例如关于海蛇的报告。在这种情况下，科学并不说，这些报告是无根据的，Fermat是错误的，或者，所有关于见到海蛇的记录都是谎言。反之，科学暂不作出判断。

可以从不同的角度来考察科学，不仅是从认识论的角度。比如，我们能把它当作一种生物学的或社会学的现象。科学本身可以被描述为一种工具、器械，也许可以和某种工业机器相比。科学可以被认为是一种生产手段——“间接生产”中的最新品种。即使从这一观点看，科学和其他工具或生产手段相比，并不与“我们的经验”有更密切的联系，即使我们把科学看作是满足我们智力需要的东西，它和我们的经验的联系，在原则上与任何其他客观结构和我们的经验的联系并无不同。一般公认，这样讲并不错：科学是“……一种工具，”它的目的是“……从直接的或已知的经验中预见以后的经验，甚至尽可能地控制他们。”但是我不认为这段关于经验的谈话有助于澄清问题。它和下面的话一样不解决问题：谈到石油钻井并非不正确的特点时断言：它的目的是提供给我们一定的经验：不是油，而是关于油的视觉和嗅觉；不是钱，而是有钱的感觉。

28．基础陈述

已经简略地指出，在我主张的认识论理论内，基础陈述起什么作用。我们需要它们，为了判定一个理论是否能被称作可证协的，即经验的（参看第21节）。我们需要它们，也是为了验证起证协作用的假说，为此也就证伪理论（参看第22节）。

因此，基础陈述必须满足下列条件。（a）从没有初始条件的全称陈述中，不能演绎出基础陈述。

另一方面，（b）全称陈述和基础陈述可能互相矛盾。只有在一个基础陈述的否定有可能从和它矛盾的理论中演绎出来时，条件（b）才能得到满足。从这一点和条件（a）中，可以得出：基础陈述必须有这样一种逻辑形式，以致它的否定不能是基础陈述。

我们已经遇到过这样一种陈述，它们的逻辑形式和它们的否定的逻辑形式不同，这些陈述就是全称陈述和存在陈述。全称陈述存在是陈述的否定，反之亦然，它们的逻辑形式不一样。单称陈述能用类似的方法构建。陈述：“在时空区域k，有一只渡鸦”，可以说在它的逻辑形式上——不仅是在它的语言学形式上——不同于陈述：“在时空区域k，没有渡鸦”，具有“在区域k有某物”或“在区域是k一事件发生’（参看第23节），这种形式的陈述可以称作一个单称存在陈述，“或单称有（there－is）陈述”。而从否定这个陈述得出的陈述，即：“在区域k没有某物”或“在区域k某种事件没有发生”，可以称作“单称非存在陈述”，“单称无（there－isnot）陈述”。

我们现在可以规定下列关于基础陈述的规则：基础陈述具有单称存在陈述的形式。这个规则意味着：基础陈述将满足条件（a），因为单称存在陈述决不能从严格全称陈述即严格非存在陈述中演绎出来。它们也将满足条件（b），这能从下列事实中看出：从每一个单称存在陈述中，只要不提及任何个别的时空区域，就能推导出一个纯粹存在陈述；我们已经知道，纯粹存在陈述确实可以和理论相矛盾。

的否定）。

这些是对基础陈述的形式要求；所有单称存在陈述都满足这些要求。除了这些要求外，基础陈述还必须满足一个实质要求——一个和事件有关的要求，正如基础陈述告诉我们的，这个事件发生在k地。这个事件必须是一个“可观察的”事件；这就是说，基础陈述必须是可以用“观察”在主体间相互检验的。由于它们是单称陈述，这个要求当然只能涉及适当地处于空间和时间中的观察者（这一点我不想作详细说明）。

无疑地由于要求可观察性，我毕竟已允许心理学主义悄悄地溜回到我们的理论中来。然而并不是如此。无可否认，以心理学的意义解释可观察事件的概念是可能的。但是我在这样一个意义上使用这个概念，它完全可以用“涉及宏观物体的位置和运动的一个事件”代替它。或者我们可以更确切地规定：每一个基础陈述本身必须或者是关于物体的相对位置的陈述，或者它必须等价于某种“机械论的”或“唯物论的”基础陈述（这个规定是可行的，这和下列事实相联系：一个在主体间能相互检验的理论，也就是在感觉间能相互检验的。这就是说，涉及我们感觉的一种知觉的检验，在原则上能为涉及其它感觉的检验所代替）。因此，批评我由于诉诸可观察性已偷偷地重新承认心理学主义，和批评我已承认机械论或唯物论一样地无力。这表明，我的理论实际上是完全中立的，这些标签都贴不上。我讲这些都只是为了从心理学主义的恶名声中挽救我用的术语”可观察的”。（观察和知觉可以是心理学的、但是可观察性不是）。我不想对“可观察的”“或“可观察事件”下定义，虽然我很愿意用心理学的或力学的例子来阐明它。我想它应该作为一个未定义的术语引进，这种术语在使用中是足够确切的：作为一种原始概念，认识论学者必须学习它的用法，正如他必须学习术语“符号”的用法一样，或者如物理学家必须学习术语“质点”的用法一样。

因此，基础陈述——在质料的言语方式中——就是断言在空间和时间的一定的个别区域里一个可观察事件正在发生的陈述。在这个定义里使用的各种术语，除了原始术语“可观察的”以外，已在第23节里较精确地解释过；对“可观察的”未下定义，但是，就如我们已在这里看到的，也可能对它予以相当确切地说明。

29．基础陈述的相对性 Fries的三难推理的解决

一个理论的每一次检验，不论它的结果是验证还是证伪，都必须中止于某一个我们决定接受的基础陈述。假如我们没有到达任何决定，没有接受某一个基础陈述，那么这检验就没有导致任何结果。但是从逻辑观点来考虑，决不会有这样的情况：它迫使我们只能中止于这一个特定的基础陈述，不能中止于那一个特定的基础陈述，否则就放弃整个检验。因为任何基础陈述本身也能接受检验，使用任何能够借助某个理论（正接受检验的理论或者另一个理论）从它演绎出来的基础陈述作为试金石。这个程序并没有自然的终点，因此，如果检验引导我们到达某一点，不过是中止于这一点或那一点，并且说：我们暂时满意了。

很容易看出，我们这样到达了一个程序，按照这种程序：我们仅仅中止于特别易于检验的陈述，因为这意味着，我们中止于这样的陈述上：关于它们的接受或拒绝，各种研究者易于达到一致意见。假如他们没有取得一致，他们就继续检验下去，或者重新开始再做一遍。假如这也没有得到什么结果，我们就可说，该陈述不是可在主体间相互检验的，或者说我们毕竟没有在和可观察的事件打交道。假如有一天科学的观察者不再可能取得关于基础陈述的一致意见，这就等于语言不能作为普遍的交往工具了。这将等于一场新的“语言混乱”：科学发现将化作荒谬。在这个新的混乱里，高耸入云的科学大厦将迅速化为废墟。

恰如逻辑证明到达了一个令人满意的形态，那时困难的工作已经过去，一切都易于核查，这样，在科学已经做完它的演绎的或解释的工作以后，我们就中止于易于检验的基础陈述。关于个人经验的陈述——就是记录语句——显然不是这类陈述。因此，它的作为我们在那里中止的陈述，是不很合适的。我们当然利用记载或记录，例如科学的和工业的研究部门发出的检验证明书，如果需要，这些证明书能够接受重新审查。因此，例如，检验这些实行检验的专家的反应时间（即：确定他们在观察上的个人误差）可能成为必要。但是一般说，特别是“……在关键情况下”，我们中止于易于检验的陈述，而不是如Carnap建议的，中止于知觉或记录语句；即我们不……中止于这些……，因为对知觉陈述作主体间相互检验……，是相对复杂和困难的”。

那么，关于Fries的三难推理，在教条主义、无穷后退和心理学主义之间的选择，我们的观点是什么呢（参看第25节）？不可否认，我们中止于其上的，我们认为满意并已经过充分检验因而决定接受的基础陈述，具有教条的性质，但这只是在我们不再进一步的论证（或进一步的检验）来证明它们的条件下才是如此。但是这种教条主义是无害的，因为假如需要，这些陈述能容易地接受进一步的检验。我承认这也能使得演绎的链条原则上成为无限的。但是，这种“无穷后退”也是无害的。因为在我们的理论里，没有试图用它来证明任何陈述的问题。最后，关于心理学主义；我也承认，决定接受一个基础陈述，对它感到满意，和我们的经验——特别是我们的知觉经验——有因果联系。但是我们不想用这些经验来证明基础陈述。经验能够推动一个决定，因而推动对一个陈述的接受和拒绝，但是基础陈述不能被经验证明，——就如不能以拍桌子来证明一样。

30．理论和实验

基础陈述是作为一个决定或一致意见的结果而被接受的；在这个程度内，它们是约定。达到决定遵循由规则所支配的程序。在这些规则中，特别重要的是一条这样的规则：它告诉我们，我们不应接受零散的基础陈述——就是在逻辑上不联系的陈述——，但我们应该在检验理论的过程中，在提出关于这些理论的探索性问题（接受基础陈述应回答这些问题）的过程中接受基础陈述。

因此，真实情况是和朴素的经验主义者或归纳逻辑的信仰者所看到的完全不同。他们认为，我们从收集和整理我们的经验开始，就这样沿着科学的梯子上升。或者，使用比较形式的言语方式，假如我们希望建立一门科学，首先我们必须收集记录语句。但是如果我接到命令：“记录下你现在正在经验着的东西”，我将不知道怎样执行这个模糊不清的命令。我是否该报告我正在写字；我听到铃响；一个报童在叫卖；一个扩音器发出嗡嗡之声；或者，也许我是否该报告这些噪音使我恼怒？而且即使能够执行这个命令，不论你用这种方法积累的陈述收集得如何丰富，它决不能加在一起成为一门科学。科学需要观点和理论问题。

在基础陈述的接受或拒绝上达到一致意见，一般是在应用理论的情况下做到的；事实上，意见一致是使理论接受检验的应用的一部分。就像其他种类的应用一样，在基础陈述上达到一致是在各种理论考虑的指导下进行的有目的的行动。

我想，现在我们有条件来解决诸如Wbitehead问题那样的问题了。Whitehead的问题是：为什么对可触的早餐总是伴随可视的早餐呢，为什么可触的泰晤士报总是伴随着可视的和瑟瑟可闻的泰晤士报呢，这种有规律的同时发生一定使得那些相信所有科学始于零散的原始知觉的归纳逻辑家感到迷惑不解，他们认为，它们一定是完全“偶然的”。他们不能用理论来解释规律性，因为他们的看法是，理论只不过是有规律地同时发生的事件的陈述而已。

但是按照这里已经达到的观点，在我们的各种经验之间的联系是可以用我们正在对之进行检验的理论来说明并演绎出来的。（我们的理论并不导致我们期望：可见的月亮伴随着可触的月亮，我们也不期望被一可听见的恶梦所困扰。）当然，有一个问题仍然存在——一个显然不能用任何可证伪的理论来答复的问题，因而是一个“形而上学’问题：为什么在我们构建理论中时常是这要幸运——为什么存在“自然定律”？

所有这些考虑对于实验的认识论理论来说都是重要的。理论家提出某些确切的问题给实验家，后者力图用他们的实验来对这些问题而不是对任何其他问题，给出一个判决性的回答：他努力排除所有的其他问题。（在这里，理论的子系统的相对独立性可能是重要的。）因此，他使得他的检验对这一个问题“……尽可能地敏感，而对所有其他有关问题尽可能地不敏感……这个工作的一部分在于排除所有可能的错误来源。”但是，设想实验家这样做，“是为了减轻理论家的工作”，或者也许是为给理论工作者提供进行归纳概括的基础，那是错误的。相反，理论家必须在很久以前已经作了他的工作或至少是他工作的最重要部分：他必须已经尽可能清楚地提出了他的问题。因此，正是理论家给实验家指示道路。不过，即使实验家，他的大部分工作也不是进行精确地观察，他的工作也主要是理论性的。理论支配着实验工作，从它开始计划一直到在实验室里最后完成。

下列情况为这一观点作了很好的说明：理论家成功地预见某一可观察的效应，这个效应以后为实验所产生；也许最出色的例子是de Broglie预见物质的波动性质，首先为Davisson和Germer用实验确证。也许下列情况为这一观点作了甚至更好的说明：实验对理论的进步有着引人注目的影响。在这种情况下，迫使理论家寻求一个更好的理论的，几乎总是对一个迄今被接受和验证的理论的实验证伪，这又是理论指导的检验的结果。著名的例子是导致相对论的Michelson－Morley实验和导致量子论的Lummer和Pringsheim对Rayleigh－Jeans辐射公式和Wien公式的证伪。当然，偶然的发现也发生，但是它们是比较罕见的。Mach正确地说到这种情况是，“科学的意见为偶然的情况所改正”（因而违反了他的本意，承认了理论的意义）。

现在我们可以回答这样的问题：怎样和为什么我们优先于其他理论接受一个理论？

这种优先选择当然完全不是由于经验证明组成理论的陈述所致；它不是由于在逻辑上把理论还原成经验所致。我们优先选择在和其他理论的竞争中最能坚持住的理论；在自然选择中证明自己最适于生存的理论。这种理论不仅迄今为止已经受住最严格的检验，而且仍然可以用最严格的方法进行检验的理论。理论是工具，我们通过应用它来检验它，我们通过它的应用结果来判断它的适应性。

从逻辑的观点看来，理论的检验依靠基础陈述，而基础陈述的接受或拒绝则依靠我们的决定。因此，解决理论的命运的是决定。在这个程度内，我对“我们怎样选择理论”这一问题的回答和约定主义者给出的回答相似；而且像他一样，我说这种选择部分地决定于对效用的考虑。但是，尽管如此，在我的观点和他的观点之间仍然存在很大的不同。因为，我认为经验方法的特点正是：约定或决定不直接决定我们对全称陈述的接受，而是相反，它进入我们对单称陈述即基础陈述的接受。

约定主义者认为，他的简单性原则支配着全称陈述的接受；他选择最简单的系统。

我则相反，建议首先应该重视的应该是检验的严格性。（在我称为“简单性”的东西和检验的严格性之间有着密切的联系；但是，我的简单性观念和约定主义者的有着很大的不同，参看第46节。）而且我认为，最终决定理论的命运的是检验的结果，即关于基础陈述的一致意见。我与约定主义者一样认为：任何特定理论的选择是一个行动、一个实践的问题。但是，我认为这选择受到理论的应用以及与这种应用相联系的基础陈述的接受的决定性影响；而约定主义者则认为，美学的动机是决定性的。

因此，我和约定主义者不同，认为：为意见一致所决定的陈述不是全称的而是单称的。我和实证主义不同，认为：基础陈述不能为我们的直接经验所证明，而是从逻辑观点看来，因一个行动、一个自由的决定而接受。（从心理学的观点看来，也许这是一种有目的的和适应良好的反应。）

在证明和决定——遵循由规则支配着的程序达到的决定——之间的这个重要区别，也许可以用一个类比来阐明：通过陪审团进行的古老的审判程序。

陪审团的裁定（vere

dictum＝说实话），像实验工作者的裁决一样，是对事实问题（guid facti？）的回答，这问题必须以最鲜明、最确定的形式提给陪审团。但是，问什么问题，问题如何提出，主要视法律境况，即现行的刑法系统（相当于理论系统而定）。由于意见一致，陪审团通过它的决定接受关于事实发生的陈述——可以说是基础陈述。这个决定的意义在于：从它和（刑法）系统的全称陈述一起，能演绎出一定的推断。换句话说，这决定形成应用刑法系统的基础；这裁决起着一个“事实的真陈述”的作用。但是显然，这陈述不一定仅仅因为陪审团已经接受它就成为真的。这个事实是在允许废止或修改裁决的规则里得到承认的。

达到裁决遵循由规则支配的程序。这些规则建立在一定的基本原则的基础之上，设计这些基本原则，主要是（如果不是仅仅是）为了发现客观真理。有时这些规则不仅为主观确信甚至也为主观偏见留有余地。然而即使我们不考虑古老程序的这些特定方面，想象出一个完全建立在促进发现客观真理的目的的基础上的程序，情况仍然是如此：陪审团的裁决决不证明它所断言的真理性，也不给这真理性提供根据。

也不能认为陪审团员的主观确信证明所达到的决定的正确性；虽然在主观确信和所达到的决定之间当然存在着密切的因果联系——这联系可以用心理学规律陈述；因此这些确信可以称为这决定的“动机”。与确信不是证明这一事实相联系的是这样的事实：可以有不同的规则来调节陪审团的程序（例如，简单多数或限定多数），这一点说明，在陪审团员的确信和他们的裁决之间的关系可以有很大的变化。

和陪审团的裁决相反。法官的判决是“推理性的”。它需要，也包含着证明。法官试图用其他陈述即法律系统的陈述，和起初始条件作用的裁决结合起来，来证明判决。或者从中合乎逻辑地演绎出判决来。这就是为什么可以用逻辑的报据对判决提出异议。另一方面对陪审团的决定提出异议，就只能质问决定是否遵循公认的程序规则而达到的，就是说，只涉及决定的形式，不涉及它的内容。（决定的内容的证明被称作“动机报告”而不称作“逻辑证明报告”，这是意味深长的。）

在这个程序和我们借以决定基础陈述的程序之间的类似是清楚的。比如，这种类比帮助我们理解基础陈述的相对性和基础陈述如何依赖理论提出的问题的方式，在陪审团审判的情况下，除非首先通过决定达到一个裁决，显然不可能应用“理论”；然而，这裁决必须在遵循因而应用一般法规的一部分的程序中才能作出。这种情况和基础陈述的情况类似。接受基础陈述是理论系统的应用的一部分；只有这个应用才使得这理论系统的进一步应用成为可能。

因此，客观科学的经验基础设有任何“绝对的”东西。科学不是建立在坚固的基岩上。可以说，科学理论的大胆结构耸立在沼泽之上。它就像树立在木桩上的建筑物，木桩从上面被打进沼泽中，但是没有到达任何自然的或“既定的”基底；假如我们停止下来不再把木桩打得更深一些，这不是因为我们已经达到了坚固的基础。我们只是在认为木桩至少暂时坚固得足以支持这个结构的时候停止下来。

追记（1972）

（1）我的术语“基础”具有反语的含意：这是一种不坚固的基础。（2）我采取一种实在论和客观主义的观点，我试图用批判的检验来代替作为“基础”的知觉。（3）我们的观察经验决不能不受检验，它们浸透着理论。（4）“基础陈述”是“检验陈述”：它们和所有语言一样，浸透着理论（即使允许形成如“现在这里红”这样的陈述的“现象”语言，也浸透着关于时间、空间和颜色的理论）。

第六章可检验度

理论是或多或少可以严格地检验的；这就是说，或多或少可以容易地证伪的。它们的可检验性的程度对于理论的选择是有意义的。

有这一章里，我要通过比较理论的潜在证伪者类来比较它们不同的可检验度或可证伪度。这个考察完全独立于是否有可能在绝对意义上区别可证伪的和不可证伪的理论这一问题。人们的确可以说，这一章通过表明可证伪性是一个程度问题而把可证伪性的要求“相对化”。

31．纲领和例证

就如我们在第23节中看到的，假如至少存在一个同型基础陈述的非空类，而这些基础陈述为一个理论所禁止；就是说，假如这理论的潜在证伪者类不是空的，这个理论就是可证伪的。第23节中也说到，假如我们用一圆面积代表所有可能的基础陈述类，用圆的半径代表可能的事情，那么我们可以说，至少有一条半径——也许更确切地说，一条窄的扇形，它的宽度可以代表事件应是“可观察的”这一事实——必须是和这理论不相容的，是为这理论所排除的。因此，人们可以用不同宽度的扇形代表各种理论的潜在证伪者。按照这些理论排除的扇形宽度的大小，可以表明理论具有或多或少的潜在证伪者（暂时不谈这个“或多”“或少”是否可能精确测定的问题）。因此可以进一步说，假如一个理论的潜在证伪者类比另一个理论的潜在证伪者类“大”，那么第一个理论就有更多的机会为经验所反驳；因此，和第二个理论相比较，第一个理论可以说具有“更高的可证伪度”。这也就意味着，第一个理论关于经验世界比第二个理论说得更多，因为它排除的基础陈述类较大。虽然允许的陈述类因而变得更小，这并不影响我们的论证；因为我们已经看到，理论对于这个类并不断言任何东西。因此可以说，一个理论传达的经验信息量，或者它的经验内容，随着它的可证伪度的增加而增加。

现在我们设想：给我们一个理论，代表这理论禁止的基础陈述的扇形变得越来越宽，最后只留下一条窄的扇形代表着不为这理论所禁止的基础陈述（假如这理论是无矛盾的，就必定会有这样的扇形留下）。像这样的理论显然很容易证伪，因为它只允许经验世界有一个很小范围的可能性；因为它排除了几乎所有可设想的，即逻辑上可能的事件。它对经验世界断言如此之多。它的经验内容如此之大，以至可以说很少有逃脱被证伪的机会。

确切地说，理论科学的目的就在于获得在上述意义上易于证伪的理论。它的目的在于限制允许的事件到最小的范围，假如能够做到的话，小到这样的程度，任何进一步的限制就会导致这理论的实际的经验的证伪。假如我们能成功地获得这样一个理论，那么这个理论就能描述“我们的特殊世界’精确到理论描述所可能达到的程度；因为它会用理论科学所可能达到的最大的精确性，来从所有在逻辑上可能的经验世界类中挑选出“我们的经验”世界来。所有我们实际遭遇到和观察到的所有事件或偶发事件类，而且只有这些，才称作“被允许的”。

32．如何比较潜在证伪者类

潜在证伪者类是无限类。直觉的“较多”和“较少”，不要任何特殊保证条件就可应用于有限类，却不能同样地应用于无限类。

我们不容易躲开这个困难。即使我们为作比较而考虑被禁止的事件类，而不考虑被禁止的基础陈述或偶发事件，为了弄清其中哪一个含有“更多的”被禁止的事件，也不易躲开上述困难。因为某一经验理论所禁止的事件数也是无限的，这点可以从下列事实中看出：一个被禁止的事件和任何其他事件（不管它是否是被禁止的）的合取又是一个被禁止的事件。

我将考虑三种方法，即使在无限类的情况下，也给予这直觉的“较多”或“较少”一个精确的意义，以便找出其中哪一种可用来比较被禁止的事件类。

（1）类的基数（或幂）的概念。这个概念不能帮助我们解决我们的问题，因为很容易看出，潜在证伪者类对所有的理论有着同一的基数。

（2）维的概念。立方体以某种方式包含比直线更多的点，这个模糊的直观的观念，能够通过集合论的“维”概念以逻辑上无懈可击的术语清楚地表述。这种概念对点的类或集是按照在它们的元素之间的“邻域关系”的丰度加以区别的：更高维的集具有更丰富的领域关系。维的概念，使我们能比较“较高”和“较低”维的类，这里将被用来处理比较可检验度的问题。这是可能的，因为基础陈述通过和其他基础陈述的合取结合起来又产生基础陈述，这个新产生的基础陈述比它们的组成部分“具有更高的复合度”；而基础陈述的这个复合度可以和维的概念联系起来。不过，必须使用被允许的事件的复合而不是被禁止的事件的复合。理由是，一个理论禁止的事件可以有任何复合度；另一方面，某些被允许的陈述之所以被允许，只是因为它们的形式，或者更确切地说，因为它们的复合度太低，以致使它们不能和该理论相矛盾；可以利用这个事实来比较维。

β）。那么，或者β的所有元素也是α的元素——在这种情况下，我们说这两类具有相同的外延或者说它们是等同的——或者β的有些元素不属于a。在后一种情况下，不属于α的β的元素形成“余类”或称为α对于β的补类，α是β的一个真子类。子类关系和直觉的“较多”和“较少”非常对应，但是，它的不利之处是，这种关系只能用来比较两个互相包含的类。所以，假如两个潜在证伪者类不是互相包含，而是互相交叉，或者它们没有共同的元素，那么，相应的理论的可证伪度就不能用子类关系来比较；它们对于这种关系来说，是不可比的。

33．用子类关系比较可证伪度

暂时引进下列定义，以后在讨论理论的维数时将加以改进。

（1）说陈述x比陈述y“更高度可证伪”或“更可检验”，或用符号表示：Fsb（x）＞Fsb（y），当且仅当x的潜在证伪者类包含作为一个真子类的y的潜在证伪者类。

（2）如果两个陈述x和y的潜在证伪者类同一，则它们有相同的可证伪度，即：Fsb（x）＝Fab（y）。

（3）如果这两个陈述的潜在证伪者类并不作为真子类相互包含，则这两个陈述没有可比的可证伪度（Fsb（x）‖Fsb（y））。

假如（1）适用，总是有一个非空的补类。在全称陈述的情况下，这个补类必定是无限的。因此，两个（严格全称）理论不可能有这样的区别：其中一个理论禁止为另一个理论所允许的有限数量的单个偶发事件。

所有重言的和形而上学的陈述的潜在证伪者类都是空的。所以，按照（2），它们是同一的。（因为，空类是所有类的子类，因而也是空类的子类，所以，所有空类是同一的；这一点可以表示为：只存在一个空类。）如果我们用‘e’表示经验陈述，用‘t’或‘m’分别表示重言的或形而上学的陈述（例如，纯粹存在陈述），那么我们可以给重言的或形而上学的陈述一个零可证伪度，我们写作：Fsb（t）＝Fsb（m）＝0Fsb（e）＞0。

自相矛盾的陈述（可以用（c）来表示），可以说是具有所有在逻辑上可能的基础陈述作为它的潜在证伪者类。这个意思就是说，任何陈述，就其可证伪度而言，都是和自相矛盾陈述可比的。我们得出：Fsb（c）＞Fsb（e）＞0。如果我们任意地设Fsb（c）＝1，即任意地把1赋予某一目相矛盾的陈述的可证伪度，那么我们甚至可以用条件1＞Fsb（e）＞0来定义经验陈述e。按照这个公式，Fsb（e）总是在0和1之间的间隔内，不包括两端，即在以这两个数字为界的“开放间隔”内。由于把矛盾陈述和重言陈述（形而上学陈述也一样）排除在外，这个公式同时表达了无矛盾性的要求和可证伪性的要求。

34．子类关系的结构逻辑概率

我们已经用子类关系对两个陈述的可证伪度的比较下了定义。因此，可证伪度的比较就具有子类关系的所有结构性质。可比较性问题可以用一个图（图1）来说明。在这个图中，左边画的是某些子类关系，右边画的是相应的可检验性关系。右边的阿拉伯数字对应于左边的罗马数字，某一罗马数字表示相应的阿拉伯数字所表示的那个陈述的潜在证伪者类。在这个图里表示可检验度的箭头，从具有更可检验的或更可证伪的陈述走向不那么可检验的陈述（因此它们相当准确地与可推导性箭头相当：参看第35节）。

从图中可以看出，各种子类序列可加以区别和追溯，例如，序列Ⅰ－Ⅱ－Ⅳ或Ⅰ－Ⅲ－Ⅴ；并且可以看出，引进新的中间类，可以使得这些序列更加“密集”。所有这些序列在这个特殊情况下都始于1和终于空类，因为空类被包含在每一个类里（在左面的图里，不可能画出空类，只是因为它是每一个类的子类，因此可以说必须出现在每一个地方）。如果我们选择类Ⅰ作为所有可能的基础陈述类，那么Ⅰ就变成矛盾陈述（c），而0（相当于空类）就可以表示重言陈述（t）。从Ⅰ到空类，或者从（c）到（t），可能通过各种途径；从右边的图中可以看出，某些途径可以互相交叉。因此我们可以说，这种关系的结构是一种网络结构（由箭头或子类关系排列成的“序列的网络”）。在节结点（例如，陈述4和5）网络部分地联结起来。只有在普遍类和空类里，对应于矛盾陈述c和重言陈述t；关系才完全联结起来。

是否可能把各种陈述的可证伪度排列在一个标尺上，即把按照它们的可证伪度排列的数字同各种陈述相关起来？显然，我们不可能用这种方法把所有的陈述排列起来，因为，如果能够的话，我们就会随意地使得那些不可比的陈述成为可比的。但是，我们完全可以从网络中挑选出某个序列，用数字来表示该序列陈述的次序。这样做时，我们必须给离矛盾陈述c较近的陈述的数字，比给离重言陈述t较近的陈述高。由于我们已经分别以0和1赋予重言陈述和矛盾陈述，我们就必须以真分数赋予所挑选的序列中的经验陈述。

然而，我并不真正想挑选出某一个序列来。赋予这序列中的陈述以数字也是完全任意的。不过，可能给以分数这一事实有很大意义，特别是因为它说明了在可证伪度和概率观念之间的联系。每当我们能比较两个陈述的可证伪度时，我们就能说，可证伪度较小的陈述由于它的逻辑形式，也是概率较大的，这种概率我称为“逻辑概率”。不可把它和在博奕论和统计学中使用的数值概率相混淆。陈述的逻辑概率和它的可证伪度是互补的：它随可证伪度的减少而增加。逻辑概率1相当于可证伪度0，反过来也是如此。具有更可检验度的陈述，即具有更高可证伪度的陈述，是在逻辑上更少可几的陈述；而可检验性较差的陈述是在逻辑上更可几的陈述。

在第72节中将看到，数值概率能和逻辑概率联结起来，因而也能和可证伪度联结起来。有可能把数值概率解释为适用于（从逻辑概率关系中挑选出来的）子系列的东西，可以在频率估计的基础上为这子系列规定一种测量系统。

这些对可证伪度比较的考察不仅适用于全称陈述或理论系统；它们也可推广应用于单称陈述。例如，它们适用于和初始条件合取的理论。在这种情况下，潜在证伪者类不可被误认为事件类——同型的基础陈述类——，因为它是偶发事件类（这点和将在第72节中分析的逻辑概率和数值概率之间的联系有某种关系）。

35．经验内容、衍推和可证伪度

在第31节中说到，我称之为陈述的经验内容的东西随着它的可证伪度而增加：陈述禁止越多，它对经验世界所说越多（参看第6节）。我称为“经验内容”的东西和比如，Carnap定义的“内容”概念有密切的关系，但不是同一的。对于后者，我使用术语“逻辑内容”，以与经验内容相区别。

我定义陈述p的经验内容为它的潜在证伪者类（参看第31节）。逻辑内容，借可推导性概念之助，被定义为从该陈述中可推导出的所有非重言陈述类（可以称作它的“后承类”）。所以，p的逻辑内容至少等于（即大于或等于）陈述q的逻辑内容，如q可从p中推导出来（符号表示：如‘p→

q’）。如果可推导性是相互的（符号‘p←→q’），则说p和q有相同的内容如q可从p中推导出，而p不能从q中推导出，则q的后承类，一定是p的后承类的一个真子集；则p具有更大的后承类，并且从而具有更大的逻辑内容（或者逻辑力）。

我的经验内容的定义的一个推断是，两个陈述p和q的逻辑内容和经验内容的比较导致相同的结果，假如作比较的陈述不包含形而上学要素的话。因此我们要求：（a）有着相等的逻辑内容的两个陈述也必定具有相等的经验内容；（b）陈述p的逻辑内容大于陈述q的逻辑内容，也必定具有更大的经验内容，或者至少相等的经验内容；最后（c）假如陈述p的经验内容大于陈述q的经验内容，那么它的逻辑内容必定更大，否则就是不可比的。在（b）里必须加上“或者至少相等的经验内容”，这个限制因为p例如可能是q和某个纯粹存在陈述或其他某类形而上学陈述（我们必经赋以一定的逻辑内容）的合取；因为在这种情况下，p的经验内容将不大于q的经验内容。相应的考虑使得在（c）上加上“否则就是不可比的”这条限制成为必要。

因此，在比较可检验度或经验内容度时，我们通常——就是说，在纯粹经验陈述的情况下——达到和比较逻辑内容或可推导性关系时所达到的相同的结果。因此，可能把可证伪度的比较在很大程度上建立在可推导性关系的基础之上。两种关系都表明网络的形式，这网络在自相矛盾陈述和重言陈述里完全地联结起来（参看第34节）。这一点可以下列说法表示：自相矛盾陈述衍推每一个陈述，而重言陈述为每一个陈述所衍推。而且，我们已经看到，经验陈述可被描述成这样的陈述：它们的可证伪度落在以自相矛盾陈述的可证伪度为一端，以重言陈述的可证伪度为另一端的开放间隔中间。相同地，一般的综合陈述（包括非经验的陈述）也由于衍推关系，被放置在自相矛盾陈述和重言陈述之间的开放间隔中间。

因此，和所有非经验的（形而上学的）陈述都是“无意义的”实证主义命题相对应的就会是这样的命题：我在经验的陈述和综合的陈述之间，或在经验内容和逻辑内容之间所作的区别是多余的；因为所有综合陈述必须是经验的——即所有都是真正的而不只是伪陈述。但是，我认为，这种使用词的方式，虽然是可行的，并不能把问题澄清，反而把问题混淆了。

因此，我把对两个陈述的经验内容所作的比较，看作等同于对它们的可证伪度所作的比较。这就使得我们的方法论规则，即应该选择那些能经受最严格的检验的理论（参看第20节中反约定主义的规则），等同于这样的规则：选择具有最大可能的经验内容的理论。

36．普遍性水平和精确度

还有其他的方法论要求，可以还原为对最大可能的经验内容的要求。其中两个要求是突出的：对可能达到的最高水平（或程度）的普遍性的要求，和对可能达到的最高精确度的要求。

考虑到这些要求，我们来考察下列可设想的自然律：

p：所有在封闭轨道中运行的天体作圆形运动，或者更简洁地说，所有天体轨道是圆。

q：所有行星轨道是圆。

r：所有天体轨道是椭圆。

s：所有行星轨道是椭圆。

在这四个陈述中存在的可推导性关系在我的图中用箭头表示。从p可以得出所有其他的陈述，从q可以得出s，s也可从r得出；所以s可以从所有其他陈述得出。

从p移动到q，普遍性程度减少，q表达的比p少，因为行星轨道形成天体轨道的一个真子类。因此，p比q更易于被证伪：如q被证伪，p也被证伪，但是反之不然。从p移动到r，（谓语的）精确度减少：圆是椭圆的其子类；如r被证伪，p也被证伪，但是反之不然。相应的话可以应用到其他的移动上：从p移动到s，普遍性程度和精确度二者都减少；从q到s，精确度减少；而从r到s，普遍性程度减少。和较高程度的普遍性或精确度相对应的是较大的（逻辑的，或）经验的内容，因而有较高的可证伪度。

全称陈述和单称陈述二者都可以写成“全称条件陈述”的形式（或者经常称作“一般蕴涵”）。假如我们把我们的四个定律写成这个形式，那么我们也许能更容易和更准确地看到两个陈述的普遍性程度和精确度是如何进行比较的。

全称条件陈述（参看第14节注）可以写成下列形式：‘（x）（φx→fx）’，或者读为：“所有x的值，满足陈述函项φx的，也满足陈述函项fx”。我们的图中的陈述s产生下列例子：“（x）（x是一颗行星的轨道→x是一个椭圆）”的意思是：“不论x是什么，如果x是一颗行星的轨道，则x是一个椭圆”。设p和q是写成这种“标准”形式的两个陈述；那么我们可以说，p比q有着更大的普遍性，如果p的前件陈述函项（可以用‘φpx’来表示）是重言地蕴含于（或可合乎逻辑地推导于），但是不等同于q的相应的陈述函项（可以用‘φqx’来表示）；或换言之，如果‘（x）φqx→φpx’是重言的（或逻辑上真的）。同样，我们说，p比q有着更大的精确性，如果‘（x）（fpx→fqx）’是重言的。即如果p的谓词（或者后件陈述函项）比q的谓词更窄，这就意味着：p的谓词衍推q的谓词。

这个定义可以推广到有着不止一个变量的陈述函项中。基本的逻辑变换从它导致我们已断言过的可推导性关系，这种关系可以用下列规则来表示：如果两个陈述的普遍性和精确性都是可比的，那么，较不普遍或较不精确的陈述可以从较普遍或较精确的陈述中推导出来；当然，除非一个更普遍而另一个更精确（如在我的图中q和r的情况）。

现在我们可以说，我们的方法论决定——有时被形而上学地解释成因果性原理——应不让任何事情得不到解释，即总是试图从其他具有更高普遍性的陈述中推导出陈述来。这个决定是从可达到的最高普遍性程度和精确度的要求中推导出来的，而这个要求可以还原成这样的要求或规则：应该选择能经受最严格检验的理论。

37．逻辑域略论测量理论

如果陈述p，由于具有更高水平的普遍性或精确性，比陈述q更易于证伪，那么，为p所允许的基础陈述类是为q所允许的基础陈述类的一个真子类。适用于被允许的陈述类之间的子类关系，是适用于被禁止的陈述（潜在证伪者）类之间的子类关系的对立物：这两个关系可以说是相反的（也许可以说是互补的）。为一个陈述所允许的基础陈述类，可以称作它的“域”。一个陈述允许实在有的“域”，可以说是它允许实在“自由活动”的范围（或者自由度）。域和经验内容（参看第35节）是相反（或互补）的概念。因此，两个陈述的域的相互关系和它们的逻辑概率的相互关系一样（参看第34、72节）。

我引进域概念，因为它帮助我们处理和测量的精确度相联系的某些问题。假定两个理论的推断在所有的应用领域里区别是如此之小，以至在计算可观察事件之间的细微差别，由于在我们的测量中可达到的精确度不够高而不能检测到。因此，不首先改进我们的测量技术，就不可能用实验在这两个理论中作出判定。这表明，现行的测量技术决定了一定的域——一个范围，在这个范围内观察其间的差别为理论所允许。

因此，理论应该有可达到的最高可检验度（因此只允许最窄的域），这一规则衍推这样的要求：测量的精确度应尽可能提高。

人们经常说，所有测量都在于确定点的重合。但是任何这种确定只能在某些限度内才是正确的。在严格的意义上，不存在点的重合。两个物理“点”——比如，在量杆上的一个标记，在被测量物体上的另一个标记——它们至多能做到靠得很近；但不能重合，即不能合并成一点。不管在其他场合这个说法是如何的平凡，它对测量的精确性来说是重要的。因为它使我们想到，测量应该用下列术语来描述。我们发现，被测量的物体的点落在量杆的两个级别或标记之间，或者比方说，我们的测量仪器的指针落在刻度的两级之间。然后我们可以或者把这些级别或标记看作我们误差的两个最佳界限，或者去估计（比方说）指针在刻度间隔内的位置，因而得到一个比较准确的结果。人们可以这样描述这后一情况：我们使指针落在两个想象中的分级标记之间。因此，一个间隔、一个域总是存留着。物理学家的习惯是每一次测量都要估计这个间隔。（因此，例如他们效法Milliken用静电单位测量电子的基本电荷，得出e＝4．774·10-10，加上：不精确范围是±O．005·10－10。）但是这里发生一个问题。人们用两个标记——即间隔的两个边界——来代替刻度上的一个标记的目的究竟是什么，对于这两个边界的每一个，又一定会提出同样的问题：对于这间隔的边界，什么是准确性的界限呢？

给出间隔的边界显然是无用的，除非这两个边界本身能以大大超过我们对原来的测量所希望达到的精确度确定下来；即在它们不精确的间隔内确定下来，这些间隔因此应该比它们为原来的测量值确定的间隔小几个数量级。换句话说，间隔的边界不是截然分明的，而实际上是很小的间隔，这个间隔的边界本身仍然是更小得多的间隔，等等。就这样我们达到了可以称为间隔的“不分明的边界”或“缩聚边界”的观念。

这些考虑并不以误差的数学理论和概率论为前提。这走的是另一条迂迴的路；通过分析测量间隔的观念，这些考虑提供了一个背景，如果没有这个背景，误差的统计理论就没有什么意义。如果我们测量一个量许多次，我们得到的数值以不同的密度分布在某一间隔——精确性的间隔依赖现行的测量技术。仅当我们知道我们追求什么——即这个间隙的缩聚边界——我们才能把误差理论应用到这些数值上，并确定间隔的边界。

现在我想所有这些多少说明了使用测量方法对于纯定性方法的优越性。即使在定性估计的情况下，例如对一个乐音的音高的估计，有时也可能为这种估计给出一个准确性的间隔，这是正确的；但是，没有测量，任何这样的间隔只能是很模糊的，因为在这种情况下，不能应用缩聚边界的概念。这个概念只能在我们可以谈到数量级的地方因而只能在规定了测量方法的地方才适用。我将在第68节中，联系到概率论，进一步运用精确性间隔的缩聚边界这一概念。

38．联系维来比较可检验度

直到现在为止，我们仅在理论可以借助子类关系来作比较的范围内来比较它们的可检验度。在某些情况下，这个方法在指导我们选择理论方面很成功。因此现在我们可以说，在第20节中举例说到的Pauli的不相容原理的确证明是一个令人满意的辅助假说。因为它极大地增加了旧的量子论的精确度，因而增加了可检验度（如新量子论的相应的陈述断言：电子具有反对称状态，而不带电粒子和某些带大量电荷的粒子具有对称状态）。

然而，对于很多目的来说，用于类关系的方法来进行比较是不够的。因此，例如Frank指出，具有高水平的普遍性的陈述——例如PComnck公式里的能量守恒原理——易于变成重言的，失去它们的经验内容，除非初始条件可以“……用少数测量，……即依靠系统状态特有的很少几个量值”来确定。关于必须确定和代入公式的参量的数目的问题是不能借助子类关系的帮助来阐明的，尽管它是显然与可检验性和可证伪性以及它们的程度密切联系着的。确定初始条件需要的量值越少，足以使理论被证伪的基础陈述就越不是复合的；因为起证伪作用的基础陈述，是由初始条件和推导出的预见的否定二者的合取组成的（参看第28节）。因此，通过弄清一个基础陈述必须有的最小复合度（如果它能够与理论矛盾的话），就有可能比较理论的可检验度；只要我们能找到一种方法来比较基础陈述以弄清它们是否更（或不那么）复合的，即是否是大量（或小量）比较简单的一种基础陈述的复合物。所有复合度没有达到必要的最低限度的基础陈述，不管它们内容如何，只是由于它们的低复合度，就都是为理论所允许的。

但是，任何这样的纲领都面临着困难。因为一般地说，单靠检查，是不容易说出一个陈述是否是复合的，即是否等于更简单的陈述的合取。在所有的陈述里，都出现普遍名称，通过分析它们，人们往往能把陈述分解为合取的组分（例如，陈述：“在k地有一玻璃杯水”也许可以被分析和分解成两个陈述：“在k地有一玻璃杯盛着一种液体”和“在k地有水”）。用这种方法来分解陈述，没有希望找到任何自然的终点，特别是因为，我们为了使进一步分解成为可能，总能引进新的已定义的普遍名称。

为了使得所有基础陈述的复合度成为可比的，可以建议：我们必须选择一定的陈述类作为基本的或原子的陈述，然后通过合取和其他的逻辑运算就能够从这些基本或原子陈述中得到所有其他陈述。如果成功，我们就应用这种方法来定义复合的“绝对零度”，然后可以把任何陈述的复合表示为可以说是绝对复合——度。但是由于上面已经说过的理由，这样一种程序必须被认为是非常不适当的；因为它会给科学语言的自由使用施加苛刻的限制。

然而，比较基础陈述的复合度，因而也比较其他陈述的复合度，仍然是可能的。可以这样做：任意选择一个相对的原子陈述类，我们把它作为进行比较的基础。这样一种相对原子陈述类可以用生成的图式或母式来定义（例如，“在……地方为了……有一个量器，它的指针指在刻度……和……之间”）。然后，我们可以把通过代入确定值，从这种母式（或者陈述函项）中得到的所有陈述类定义为相对原子的，因而定义为等复合的。这些陈述类，与所有可从这些陈述形成的合取一起，可以称之为一个“场”。一个场的n个不同的相对原子陈述的合取，可以称之为“这场的n组复合”，并且我们可以说，它的复合度等于数n。

如果对一个理论t，存在这样一个单称（但是不一定是基础）陈述场：对某个数目d，理论t不能为这场的任何d组复合所证伪，虽然它能为某些d＋1组复合所证伪，那么我们称d为理论对于那个场的特性数。因此，这场的复合度低于d或等于d的所有陈述是同这理论相容的，是为这理论所允许的，不管这些陈述的内容是什么。

现在就有可能把对理论的可检验度的比较建立在这个特性数d的基础之上。但是为了避免在使用不同的场时可能造成的不一贯，有必要使用一个比场这一概念更窄的概念，就是应用场的概念，如果已知理论t，我们说一个场是这理论t的一个应用场，假如对于这个场，存在理论t的一个特征性数字d，而且假如它满足其他一些条件。

一个理论t对于一个应用场的特性数d，我称之为t对于这个应用场的维。“维”这个词本身就说明了问题，因为我们可以把场的所有可能的n组复合看作有空间结构的（在无限维的构型空间中）。例如，若d＝3，则那些可允许的陈述（因为它们的复合度太低）形成这个构型的一个三维的子空间。从d＝3过渡到变为d＝2，相应于从立体过渡到为平面。维数d越小，容许的陈述类（这些陈述由于它们的复合度低，不管内容如何，不能与这理论矛盾）受到的限制就越严格，这理论的可证伪度就越高。

应用场的概念不限于基础陈述，但各种单称陈述都被容许作为属于一个应用场的陈述。但是通过借助场比较它们的维，我们能估计基础陈述的复合度（我们假定，与高度复合的单称陈述相应的是高度复合的基础陈述）。因此可以假定，与较高维的理论相应的是一个较高维的基础陈述类，这个类的所有陈述为这理论所容许，不管它们断言的是什么。

这回答了两种比较可检验度的方法如何联系的问题——一种方法通过理论的维，另一种方法通过子类关系。有这样一些情况：这两种方法都不适用，或者只有其中一种方法适用。在这种情况下，在这两种方法之间当然没有发生冲突的余地。但是如果在一种特殊情况下，这两种方法都适用，那么可以想象会发生这种的事：两个理论有相同的维，但是，假如用建基于子类关系的方法来评价，可能有不同的可证伪度。在这种情况下，从后一种方法得出的判断应该被接受，因为这一种方法证明是比较灵敏的方法。在这两种方法都适用的所有其他情况下，它们一定会导致相同的结果；因为，借助维理论的一条简单定理可以表明：一个类的维一定大于或等于它的子类的维。

39．曲线集的维

有时我们可把我所说的一个理论的“应用场”很简单地等同于它的图形表示场，即图纸上的一块面积，我们在这张图纸上用图形表示理论：可认为这个图形表示场的每一点相应于一个相对原子陈述。因此理论相对于这个场的维，就等于相应于这理论的曲线集的维。我将用第36节中的两个陈述q和s来讨论这些关系（我们用维作比较适用于具有不同谓词的陈述）。假说q——所有行星轨道都是圆——是三维的：要证伪它，至少需要这场的四个单称陈述，相应于它的图形表示的四个点。假说s：所有行星轨道都是椭圆，是五维的，因为要证伪它，至少需要六个单称陈述，相应于图形上的六个点。我们在第36节里看到：

q比s更易证伪：因为所有圆都是椭圆，所以有可能把比较建基于子类关系之上。但是使用维使我们能比较以前不能比较的理论。例如，我们现在可以比较一个圆假说和一个抛物线假说（它是四维的）。“圆”、“椭圆”，“抛物线”，每一个词表示一个曲线类或集；这些集中的每一个集有d个维，假如挑选出这集中的一条特定曲线，或者给以特征描述，d点是必要和充分的话。在代数表示式里，这曲线集的维依赖于参量的数目，这些参量的值我们可以自由选择。所以我们可以说，用以表示一个理论的一个曲线集的、可以自由测定的参量的数目，是那个理论的可证伪（或可检验）度的特性数。

与我的例子中的陈述q和s相联系，我愿意对Kepler发现他的定律作一些方法论的评论。

我并不想提出这样的看法：完美的信念——指导Kepler作出发现的助发现原理——是有意或无意地由对可证伪度的方法论考虑所引起的。但是，我的确认为，Kepler取得成功部分地由于这一事实：作为他出发点的圆假说，相对地说是易于证伪的。假如Kepler从由于其逻辑形式不是如圆假说那样易于检验的假说出发，考虑到计算的困难，这种计算的基础是“在空中”——可以说，漂浮在天空中，以不知道的方式在运动，他很可能得不到任何结果。Kepler通过证伪他的圆假说达到的毫不含糊的否定结果，事实上是他的第一个真正的成功。他的方法也被证明完全正确，因而他可以继续进行下去；特别是因为，即使这第一步尝试也已经产生一些近似值。

无疑，Kepler定律可以用另外的方法找到。但是我想，这是引致成功的方法，这一点不仅是偶然的。这相当于消去法，仅当理论足够易于证伪——足够精确，能够和观察经验相冲突时，这种方法才是可应用的。

40．两种减少曲线集维数的方法

非常不同的曲线集可以有相同的维。例如，所有圆的集是三维的；但是所有通过一个给定点的圆的集是一个二维集（和直线集一样）。如果我们要求圆应该都通过两个给定点，则我们得一个一维集，如此等等。每一个添加的要求，即一个集的所有曲线必须通过多一个给定点，减少这个集的一个维。

零维类

一维类

二维类

三维类

四维类

直线

圆

抛物线

通过一个给定点的直线

通过一个给定点的圆

通过一个给定点的抛物线

通过一个给定点的圆锥曲线

通过两个给定点的直线

通过两个给定点的圆

通过两个给定点的抛物线

通过两个给定点的圆锥曲线

通过三个给定点的圆

通过三个给定点的抛物线

通过三个给定点的圆锥曲线

除增加给定点数的方法以外，还有其他方法也可以减少维数。例如，给定长短轴比的椭圆集是四维的（和抛物线集一样），已知偏心率数值的椭圆集也是这样。从椭圆过渡到圆，当然等于指定一个偏心率（0）或者一个特定的长短轴比（1）。

因为我们对评价理论的可证伪度感兴趣，现在我们要问：这些减少维数的种种方法对于我们的目的来说是否是等价的，或者我们是否应该更仔细地考察它们的相对价值。一条曲线必须通过一定的单一点（或小区域），这样的规定常常是联接于或相应于某一单称陈述即一个初始条件的接受。另一方面，比方说从一个椭圆假说过渡到一个圆假说，显然相应于理论本身的维的减少。但是，如何区别清楚这两种减少维的方法？一种减少维的方法并不根据有关曲线的“形式”或“形状”的规定来进行；即例如通过指定一个或更多的点，或者通过某种等价的规定来减少维，我们可以给这种方法一个名称：“内容的减少”。在另一个方法里，曲线的形式或形状规定得更窄，例如，我们从椭圆到圆或从圆到直线等等，我称之为维数的“形式的减少”的方法。

然而，要使得这个区别截然分明是不很容易的。这一点可以这样来看：减少理论的维用代数术语来说意味着以常数代替参数。现在，我们如何能区别不同的以常数代替参数的方法，是不大清楚的。从椭圆的一般方程过渡到圆的方程这种形式的减少，可以被描述为使一个参数等于0，使第二个参数等于1。但是，如果另一个参数（绝对项）等于0，那么这就意味着内容的减少，就是规定椭圆的一个点。但是，我想，如果我们看到它和普遍名称问题的联系，就有可能使得区别清楚起来。因为内容的减少引进一个个别名称到有关曲线集的定义中，而形式的减少则引进一个普遍的名称。

让我们设想，也许根据“直指定义”，给予我们某一个别的平面。在这个平面上的所有椭圆集可以用椭圆的一般方程来定义；圆集可以用圆的一般方程来定义。这些定义不依赖于我们在这平面的什么地方画与它们有关的（Descartes）坐标；因此，它们不依赖于坐标的原点和方向的选择。特定的坐标系统只能由个别名称来决定；比方说由直接指定它的原点和方向来决定。由于椭圆（或圆）集的定义对于所有Descartes坐标是相同的，它不依赖于这些个别名称的规定：它对Euclid群的所有坐标变换（位移和相似变换）是不变的。

另一方面，假如人们想定义共同的在平面上有着一个特殊个别点的椭圆（或圆）集，那么我们就必须运用一个方程，它对于Euclid群的变换不是不变的，而是和一个单称的，即个别地或直指地规定的坐标系统相联系的。因此，它是和个别名称相联系的。

可以把这种变换安排在一个等级系统里。对于比较一般的变换群是不变的一个定义，对于比较特殊的变换群也是不变的。对于一个曲线集的每一个定义，有一个它特有的（最一般的）变换群。现在我们可以说：一个曲线集的定义D1与一个曲线集的定义D2“同样一般”（或比它更一般），假如D1和D2（或一个更一般的定义）对于同一个变换群都是不变的话。一个曲线集的维的减少现在可以被称为形式的，假如这个减少并不减弱定义的一般性；否则它可以被称为内容的。

如果我们通过考虑它们的维来比较两个理论的可证伪度，显然我们必须在考虑它们的维的同时考虑它们的一般性，就是它们对于坐标变换的不变性。

按照理论（如Kepler理论）事实上是否作出了关于世界的几何陈述，或理论是否只是在它可以用图形来表示的意义上是“几何的”——例如，表示压力依赖温度的图形，上述程序当然必定是不同的。对后一种理论，或相应的曲线集提出这样的要求：它的定义必须对于比方说坐标系统的旋转是不变的，这是不适当的；因为在这些情况下，不同的坐标可以表示完全不同的东西（一个是压力，另一个是温度）。

这就是我对用以比较可证伪度的方法的阐述的结论。我相信这些方法能帮助我们阐明认识论问题，例如简单性问题，我们接着就要讨论这个问题。但是，我们将要看到，还有其他问题通过我们对可证伪度的考察而得到新的说明；特别是所谓“假说的概率”或验证的问题。

追记（1972）

这本书的比较重要的思想之一是关于理论的（经验的或信息的）内容的思想（我们称自然律为“律”不是没有道理的：“它们禁止越多，它们说得越多”。比较：上面第41页和第112页以后）。

在前一章里我强调两点：（1）理论的内容或可检验性（或简单性：参看第七章）可以有度，因此可以说这度使得可证伪性概念相对化了（它的逻辑基础仍然是否定后件假言推理）。（2）科学的目的——知识的增长——可以是和我们的理论的内容的增长完全一致的。（参看我的论文：‘The Aim of Science’，载Ratio Ⅰ，1957 PP．24－35，〔经过修改〕重载Contempo－rary Philosophy．ed R．Klibansky 1969，PP．129－142；现又为我的书Objective Knowledge：An Evolutionary Approach的第5章，这书即将由CComrendon Press出版。）

最近我进一步发展了这些思想；特别参看我的Conjectures and Refutations第10章，1963年版和以后的版本。两个新观点是：（3）内容或可检验性概念联系到正在讨论的问题或问题集而进一步相对化（在1934年我已经把这些概念联系到应用场而相对化了）。（4）引进理论的真性内容和它对真理的近似或接近（“逼真性”）的概念。

第七章简单性

关于所谓“简单性问题”的重要性几乎没有一致意见。Weyl在不久前说：“简单性问题对于自然科学的认识论是最重要的”。然而，近来对于这个问题的兴趣低落了；也许是因为似乎很少有机会来解释这问题，特别是在Weyl进行透彻的分析之后。

直到最近，简单性观念一直在无批判地使用，仿佛简单性是什么，为什么它应该是有价值的，是很明显的。不少科学哲学家在他们的理论里给予简单性概念一个关键性的重要地位，甚至没有注意到它引起的困难，例如，Mach，Kirchhoff，Avenarius的追随者试图用“最简单的描述”这一观念来代替因果解释的观念。没有形容词“最简单的”或者类似的词，这个学说就什么也没有说。当应该解释为什么我们认为用理论对世界进行的描述，优于用单称陈述对世界进行的描述时，就似乎预先假定，理论比单称陈述更简单。然而很少有人曾经尝试解释过，为什么理论应该是更简单的，或者更确切地说，简单性是什么意思。

而且，如果我们假定，使用理论是由于简单性，那么显然，我们应该使用最简单的理论。Poincare（他认为理论的选择是一个约定的问题）就是这样来表述他的理论选择原理的：他选择可能的约定中最简单的。但是，哪一个是最简单的？

41．排除美学的和实用的简单性概念

“简单性”这个词用于很多不同的意义。例如Schr odinger理论在方法论意义上具有很大的简单性，但是在另外一种意义上，完全可以说它是“复杂的”。我们可以说，一个问题的解决不是简单的而是困难的，或者说，一个描述或一个说明不是简单的而是难以理解的。

首先，我要从我们的讨论中排除简单性这一术语应用于任何像描述或说明这类东西。有时，我们说到同一个数学证明的两种说明，其中一个比另一个更简单或更优美。从知识理论的观点看来，这种区别意义很小；它不在逻辑的范围之内，只是表示一种美学性质或实用性质的选择。当人们说，一项工作比另一项工作可以“用更简单的办法完成”时，意思是，它可更容易地完成，或者，为了完成它，需要较少的训练或较少的知识，这情况是类似的。在所有这些情况下，很容易排除“简单”这个词；这一词的使用是逻辑外的。

42．简单性的方法论问题

在我们排除了美学的和实用的简单性观念以后，如果有什么东西余留下，那是什么呢？是否有对于逻辑学家是重要的简单性概念？是否可能按照它们的简单度来区别在逻辑上不等同的理论？

对这个问题的回答似乎是很可疑的，因为大部分想定义这个概念的尝试得到很小的成功。例如，Schlick给了一个否定的回答。他说：“简单性是……一个概念，它表示的选择性质上，部分地是实用的，部分地是美学的”。值得注意的是，他给出了这个回答，是在他写到这里使我们感兴趣的概念，我称之为简单性的认识论概念的时候；因为他继续说道：“即使我们不能解释简单性在这里的真正意思是什么，我们仍然必须认识到这样的事实：任何科学家成功地用一个非常简单的公式（例如：一个线性的，二次的，或指数的函数）来描述一系列观察，他就立即确信，他已发现了一条定律。”

Schlick讨论了用简单性概念来定义似定律的规律性概念，特别是“定律”和“机遇”区别的可能性。他最后排除了这个可能性，说道：“简单性显然是一个完全相对和模糊的概念；用它不能得到因果性的严格定义，定律和机遇也不能精确地区别开”。从这一段话中真正期待简单性概念完成什么就很清楚了：它要提供一种事件的似律性或规律性程度的量度，Feigl说出了同样的看法，他说到“用简单性概念来定义规律性或似律性的程度”。

简单性的认识论观念在归纳逻辑理论里起着特殊的作用，比如联系到“最简单曲线”问题。归纳逻辑的信仰者假定，我们通过概括特殊的观察到达自然律。如果我们设想在一系列观察中的各种结果，作为在一个坐标系统中标绘的点。那么定律的图形表示就将是一条通过所有这些点的曲线。但是，通过有限数目的点，我们总能画出形式极为多样的数目无限的曲线。因此，由于定律不是单单由观察决定的，归纳逻辑面临在所有这些可能的曲线中决定选择哪一条曲线的问题。

通常的回答是：“选择最简单的曲线”。例如，Wittgenstein说：“归纳过程在于发现可以使之和我们的经验相协调的最简单的定律”。在选择最简单的定律时，通常不言而喻地假定，比方说，线性函数比二次函数简单，圆比椭圆简单，等等。但是，没有给出任何理由，或说明选择这个特殊的简单性等级，而不是任何其他的等级，或说明相信“简单的”定律优于比较不简单的定律——除了美学的实用的理由以外Schlick和Feigl提到Natkin的一篇未出版的论文，按照Schlick的叙述，Natkin建议称一条曲线比另一条更简单，如果它的平均曲率更小的话，或者按照Feigl的叙述，如果它偏离一条直线更小的话（这两种叙述是不等价的）。这个定义似乎和我们的直觉符合得相当好；但是，它没有抓住关键之处，例如，它使得双曲线的一部分（渐近线部分）比圆简单得多，等等。实在说，我不认为，问题能为这样的“技巧”（Schlick这样称呼它们）所解决。而且，为什么我们应该给予简单性（如果用这个特殊方法来定义它）以优先权，这仍然是个谜。

Weyl讨论了并否定了一个非常有趣的把简单性置于概率基础之上的尝试。“例如，假定同一函数y＝f（x）的20对坐标值（x，y），当标绘在方格图解纸上时，落在一条直线上（在预期的精确度内）。因此我们推测，我们在这里面对一条严格的自然律，y线性地依赖于x。我们所以这样推测是由于直线的简单性，或者因为，如果该定律是一条不同的定律，这20对任意选择的观察正好非常接近地落在一条直线上，是极端不可几的。假如，现在我们用这条直线来进行内插和外推，我们会得到超出观察告诉我们的东西之外的预见，然而，这个分析是可以批判的。总有可能来定义……会被这20项观察所满足的各种数学函数；而这些函数中的某些会相当大地偏离直线。对这些函数中的每一个，我们都可以说，除非它代表真的定律。这20项观察正好落在这条曲线上，是极端不可几的。因此，函数，更确切地说，函数类，由于它的数学简单性，必定是先验地由数学提供给我们的，这毕竟是必不可少的。应该注意，这个函数项不必依赖与应满足的观察数一样多的参数”。Weyl关于“函数类，由于它的数学简单性，必定是先验地由数学提供给我们的”这段话以及他提到的参数的数目，和我的观点（在第43节中展开）是一致的。但是，Weyl没有说“数学的简单性”是什么，而且，最重要的，他没有说较简单的定律，与较复杂的定律相比较，应该具有什么逻辑的或认识论的优点。

以上引证的几段话是很重要的，因为它们和我们现在的目的有关，这目的是分析简单性的认识论概念。因为这个概念尚未精确地加以确定。所以有可能摈弃任何想通过下述办法使这个概念精确化的尝试（比如我的尝试）而说：认识论家感兴趣的这个简单性概念，实际上是一个完全不同的概念。对于这种反对意见，我可以这样回答：我不赋予“简单性”这个词丝毫重要性。这个术语不是我引进的，我也知道它的缺点。我所要说的只是，如我的引证所表明的，我要澄清的这个简单性概念帮助我们回答的问题，正好就是科学哲学家常常提出的与他们的“简单性问题”相联系的问题。

43．简单性和可证伪度

与简单性概念相联系而产生的认识论问题都可得到解答，只要我们把这个概念等同于可证伪度。这个断言可能遭到反对；所以我首先试图使它在直觉上更易于为人所接受。

我已经说明，具有低维的理论比高维理论更易于证伪。例如，具有一次函数形式的定律比用二次函数表示的定律更易于证伪。但是后者在具有代数函数的数学形式定律中间，仍然属于最可证伪的定律之列的。这一点和Schlick对简单性的评论完全一致：“我们当然应该倾向于认为一次函数比二次函数简单，虽然后者无疑地也描述一条很好的定律……”。

我们已经看到，理论的普遍度和精确度和它的可证伪度一起增加。因此我们也许可以把理论的严格度——可以说理论把定律的严格性加于自然的程度——等同于它的可证伪度；这一点表明，可证伪度正是做的Schlick和Feigl期望简单性概念做的事情。我还可以说，Schlick希望在定律和机遇之间作出的区别，也能借可证伪度概念之助弄清楚。关于具有似机遇特征的序列的概率陈述，证明具有无限的维（参看第65节）；不是简单的而是复杂的（参看第58节和第59节的后半部分）；而且只是在特殊的保证条件下才是可证伪的（第68节）。

可检验度的比较已经在第31到40节里详细地讨论过。那里提供的某些例子和其他细节可以容易地转用到简单性问题上来。这一点特别适用于理论的普遍度，一个比较普遍的陈述能代替许多较不普遍的陈述，并由于这个理由时常被称作为“比较简单”。理论的维的概念可以说是使得Weyl的用参量的数目来确定简单性概念的思想精确化了。通过我们在理论的维的形式的减少和内容的减少之间所作出的区别（参看第40节），可以对付对Weyl理论的某些可能的反对意见。这些反对意见之一是，轴比和偏心率数值给定的椭圆集虽然它显然不是那么“简单的”，具有和圆集正好一样多的参数。

最重要的是，我们的理论解释了为什么简单性是如此高度的合乎需要。为了理解这一点，我们不需要假定“思维经济原理”或者任何这类原理。假如知识是我们的目的，简单的陈述就比不那么简单的陈述得到更高的评价，因为它们告诉我们更多东西；因为它们的经验内容更多，因为它们更可检验。

44．几何形状和函数形式

我们关于简单性概念的观点使我们能够解决了一些矛盾，直到现在这些矛盾曾使得这个概念是否有任何用处成为疑问。

很少人会认为，比方说对数曲线的几何形状是特别简单的；但是一个由对数函数表示的定律常常被认为是简单的定律。同样地，一个正弦函数通常被说成是简单的，纵然正弦曲线的几何形状也许不是很简单的。

假如我们记住在参数数目和可证伪度之间的联系。假如我们又在维的形式减少和内容减少之间加以区别，像这样的困难可以得到解决。（找们也必须记住对于坐标系统的变换的不变性的作用。）如果我们说到一条曲线的几何形式或形状，那么我们所要求的是，对于所有归属位移群的变换的不变性，我们还可以要求对相似变换的不变性；因为我们并没有想把几何图形或形状和一定的位置联结起来。因此，如果我们把一条单参数对数曲线（y＝logax）的形状看作置于一个平面的任何地方，那么它就有五个参数（假如我们允许相似变换）。因此它就完全不是一个特别简单的曲线。另一方面，如果用一条对数曲线来表示一个理论或定律。那么描述过的那种坐标变换是无关的。在这种情况下，进行旋转、平移或相似变换，都是没有意义的。因为一条对数曲线通常是一种坐标不能互变的图形表示（例如，x轴可以表示大气压力，y轴表示海拔高度）。由于这个理由，相似变换在这里同样没有任何意义。类似的考虑适用于沿着一根特殊的轴，例如时间轴的正弦振荡；还有许多其他情况都是如此。

45．Euclid几何学的简单性

在相对论的大部分讨论中起着主要作用的问题之一是，Euclid几何学的简单性。从未有人怀疑过，Euclid几何学本身是比任何有一定曲率的非Euclid几何学更简单些——更不要说具有随地方而变化的曲率的非Euclid几何学了。

乍一看来，这里涉及的这种简单性似乎和可证伪性很少关系。但是，如果讨论中的陈述被表述为经验的假说，那么我们发现，在这种情况下这两个概念，简单性和可证伪性，也是重合的。

让我们考虑什么实验可以帮助我们检验这样的假说：“在我们的世界里，我们必须运用具有某一曲率半径的一种度量几何学”。仅当我们把一定的几何学实体和一定的物理客体——例如直线和光线、点和几根线的交点——等同起来时，检验才是可能的。如果采取了这样的等同（一个相关定义，或者也许是一个直指定义；参看第17节），那么可以看出，Euclid光线几何学的正确性假说的可证伪度，比任何断言某种非Euclid几何学的正确性的与前者相匹敌的假说的可证伪度高。因为如果我们测量一个光线三角形的角度之和，那么对180度任何显著偏离都将证伪Euclid假说。另一方面，具有给定曲率的Bolyai－Lobatschewski几何学的假说是和任何不超过180度的特定测量相容的。而且，为了伪证这个假说，必须不仅测量角度之和，而且还要测量三角形的（绝对）大小；这意味着，在角度之外，必须再定义一个测量单位，例如面积单位。因此我们看到，证伪需要更多的测量；假说和测量结果的更大的变化相容；因此更难于证伪：它的可证伪度较小。换句话说，Eu－clid几何是惟一的具有确定曲率的，在其中可能进行相似变换的度量几何学。因此，Euclid几何图形能对比较多的变换保持不变；即它们可能是维数较少的：它们可能是较简单的。

46．约定主义和简单性概念

约定主义者所说的“简单性”并不对应于我所说的“简单性”。任何理论都不是为经验所毫不含糊地决定的，这是约定主义者的中心思想，也是他们的出发点；这一点我同意。他们相信，他们因此必须选择“最简单的”理论。但是，由于约定主义者并不把他们的理论当作可证伪的系统，而是当作约定的规定，显然他们认为“简单性”的意义是和可证伪度不同的。

约定主义者的简单性概念证明确实是部分地美学的和部分地实用的。因此，下列Schlick的评论（参看第42节）适用于约定主义者的简单性概念，而不适用于我的：“人们只能用约定来定义简单性概念，这约定必定总是任意的，这一点是确定无疑的”，奇怪的是，约定主义者自己没有看到他们自己的基本概念——简单性概念的约定性质。他们必须是忽略了这一点，这是明显的，因为否则他们本来会注意到，一旦他们已选择了任意约定的方法，他们求助于简单性决不可能使他们避免任意性。

从我的观点看来，假如有人按照约定主义者的实践，坚持某一系统是一个永远确立了的系统，每当它处于危险中时，他就决意引进辅助假说去挽救它，那么必须说这个系统是最高度复杂的。因为，这样保护起来的系统的可证伪度等于零。这样我们就被我们的简单性概念引回到第20节的方法论规则；特别是也引回到限制我们过度使用特设性假说和辅助假说的规则或原理：使用假说的节约原理。

追记（1972）

在这一章里，我试图表明简单度能够和可检验度等同到什么程度。没有什么东西依赖于“简单性”这个词：我从不就词进行争论，我也不设法揭示简单性的本质。我所试图说明的只是这样：

有些大科学家和大哲学家已经论述了简单性和它对科学的价值。我认为，假如我们假定，当说到简单性时，他们有时在心里想的是可检验性，就能够更好地理解其中一些论述。这一点甚至说明了Poincare的某些例子，虽然这些例子和他的观点是冲突的。

现在我应该进一步强调两点：（1）我们能在可检验性方面比较理论，仅当在这些理论应该解决的问题中，至少有一些是重合的。（2）不能用这种方法比较特设性假说。

第八章概率

在这一章，我将只讨论事件的概率以及它引起的问题。这些问题的产生同博奕论和物理学的概率定律有关。我将什么可称之为假说的概率问题——例如一个经常受到检验的假说是否比一个很少受到检验的假说更可几等问题——留到第79至85节在“验证”题目下进行讨论。

与概率论有关的观念在现代物理学中起着决定性的作用。然而我们仍然缺乏一个满意的、前后一致的概率定义；也就是说，我们仍然缺乏一个满意的概率计算的公理系统。概率和经验之间的关系也仍然需要澄清。在研究这个问题时，我们将发现对我的方法论观点几乎不能克服的反对意见最初是什么。因为虽然概率陈述在经验科学中起着如此重要的作用，可是结果它们却在原则上不受严格证伪的影响。然而，这块绊脚石将成为检验我的理论，以便查明它有什么价值的试金石。

因此我们面临两项任务。第一项任务是为概率计算提供新的基础。我将试图通过把概率论发展为频率理论做到这一点，沿着Richard

von Mises所遵循的路线，但不用他称之为的“收敛公理”（或“极限公理”），而使用有点削弱了的“随机公理”。第二项任务是阐明概率和经验之间的关系。这是指解决我所说的概率陈述的可判定性问题。

我希望这些研究将有助于减轻目前的不满意的情况，物理学家在这种情况下大量使用概率，而未能前后一致地说明他们所说的“概率”是什么。

47．概率陈述的解释问题

我将从区别两类概率陈述开始：相数字表示某一概率的陈述——我称之为数值概率陈述——以及不用数字表示的概率陈述。

例如，“用两颗骰子掷11的概率为1／18”，这种陈述就是数值概率陈述一个例子。非数值概率陈述可以有各种各样。“把水和酒精混合获得均匀的混合物是十分可几的”，这类陈述如得到适当阐明，就能转变为数值概率陈述（例如，“获得……的概率很接近1”）。另一种很不同的数值概率陈述例如“发现一种与量子论相矛盾的物理效应是高度不可几的”；我认为这种陈述不可能转变为数值概率陈述，或者与某种数值概率陈述等价，而不歪曲它的意义。我将首先讨论数值概率陈述；非数值概率陈述，我认为不那么重要，容后再考虑。

与每一个数值概率陈述有联系的是这样一个问题：“我们应如何解释这类陈述，特别是这类陈述所作出的数值方面的断言？”

48．主观解释和客观解释

古典的（CompComce的）概率理论把某一概率的数值定义为用同样可能的情况数除有利的情况数所得的商。我们可以不理会已经提出来的反对这个定义的逻辑上的异议，如“同样可能的”不过是“同样可几的”另一种说法。但是甚至在那时我们也很难承认这个定义提供了一个可毫不含糊地应用的解释。因为其中隐含着若干种不同的解释，我要把这些解释分为主观的和客观的两类。

概率论的主观解释常常使用的带有心理学味道的说法，如“数学期望”，或者比方说，“误差的正态定律”等等，使人想起概率论的主观解释；其最初的形式是心理学主义的。它把概率的大小看作为确定或不确定、相信或怀疑的感觉的量度，这些感觉可由某些断言或推测在我们心中引起。关于某些非数值陈述，“可几的”一词可用这种方法颇为满意地加以转译；但是我认为沿着这些路线对数值概率陈述所作的阐释是十分不能令人满意的。

然而，主观解释的较新变种应该在这里给予更认真的考虑。还不是在心理学上，而是在逻辑上把概率陈述解释为关于可称之为陈述“逻辑近似”的断言。正如我们全都知道的那样，陈述能互相处于各种逻辑关系中，如可推演性、不相容性或相互依赖性；而逻辑－主观理论（Keynes是它的主要阐述者）把概率关系看作是两个陈述之间的特种逻辑关系。这种概率关系的两个极端情况是可推演性和矛盾：有人说，如陈述p从陈述q推导出，则q把概率1“给予”p。如p和q相互矛盾，则q给p的概率为0。在这两个极端之间有其他概率关系，大概可以下列方法解释：陈述声（给定q）的数值概率越大，则它的内容超出陈述q已包含的内容越少，p的概率依赖q（并且q把某种概率“给予”p）。

从Keynes把概念定义为“理性信仰程度”这一事实可看出这个理论与心理学主义理论之间的密切关系。他的“理性信仰程度”是指信赖量，可以根据我们从”给予”陈述p概率的那个陈述q中得到的信息或知识赋予p以信任量。

第三种解释，客观解释，把每一个数值概率陈述看作为一种相对频率的陈述，某一种类事件在一偶发事件序列内以这种频率发生。

根据这种解释，“用这颗骰子下一次掷五的概率等于1／6”这陈述实际上不是一个关于下一次掷骰子的断言；宁可说，它是一个关于整个一类掷骰子的断言，下一次掷骰子不过是其中一个元素。这个陈述所说的不过是在这类掷骰子中得5的相对频率等于1／6。

按照这个观点，如果我们能够对数值概率陈述作出濒率阐述，这些陈述才是可接受的。不能作出频率解释的那些概率陈述，尤其是非数值概率陈述，常常被频率理论家回避。

下面我将尝试重新把概率理论作为一种（经过修改的）频率理论建立起来。因此我宣布我信仰客观解释；主要是因为我相信只有客观理论才能解释概率计算在经验科学中的应用。大家承认，主观理论能够给如何判定概率陈述的问题提供一个前后一致的解决办法；并且一般地说，它面临的逻辑困难比客观理论少。但是它的解决办法是：概率陈述是非常经验的；它们是重言的。当我们想起物理学利用概率论时，这种解决办法就证明是完全不能接受的了。（我摈弃主观理论的这种变种：认为客观频率理论应从主观假定中推导出来——也许利用Bernoulli定理作为“桥梁”；由于逻辑上的理由我认为这种纲领是不能实现的。）

49．机遇理论的基本问题

概率理论的最重要应用是用于我们可称之为“似相遇的”（chance－like）或“随机的”事件，或偶发事件。它们的特征是一种特殊的不可计算性，这使得人们经过许多次不成功的尝试后倾向于相信，一切已知的理性预测方法用于这些事件必定失败。可以说，我们感觉到除了先知以外没有一个科学家能够预测它们。然而正是这种不可计算性使我们得出这样的结论：概率的计算能够应用于这些事件。

如果我们接受主观理论，那么从不可计算性达到可计算性（即达到某种计算的可应用性）这个有点悖论性质的结论，确实不再具有悖论性质了。但是这种避免悖论的方法是极不令人满意的。因为它包含着这样的观点：概率计算与经验科学的所有其他方法相反，不是一种计算预测的方法。按照主观理论，它不过是一种使我们已知的东西或者更确切地说，使我们未知的东西实行逻辑变换的方法；因为正是在我们缺乏知识时我们实行这些变换。这种观念确实使悖论消解，但它不能解释被解释为频率陈述的无知陈述如何能够在经验上受到检验和得到验证。然而这正好是我们的问题。我们如何能够解释这个事实：我们可从不可计算性——即从无知——中作出能够解释为经验频率陈述的结论，并且尔后我们发现它们在实践中得到光辉的验证呢？

甚至频率理论直到现在还不能对这个问题——我将称之为机遇理论的基本问题——提供一个令人满意的解答。在第67节将表明这个问题与“收敛公理”有联系，后者是目前形式的这个理论的一个组成部分。但是在这个公理消除后，在频率理论框架内找到一个令人满意的解决办法是可能的。通过分析这样一些假定就会找到这种解答，这些假定使我们能够从单个偶发事件不规则序列推论到它们频率的规则性或稳定性。

50．von Mises 的频率理论

为概率计算的所有主要定理提供基础的频率理论首先由Richard von

Mises提出的。他的基本思想如下。

概率计算是似机遇的或随机的事件或偶发事件序列，即例如连续掷骰子那种重复**件序列的理论。借助两个公理条件把这些序列定义为“似机遇的”或“随机的”：收敛公理（或极限公理），和随机公理。如果一个事件序列满足这两个条件，von

Mises就称它为一个“集合”（collective）。

大体上说，一个集会就是一个事件或偶发事件的序列，它在原则上可以无限地延续下去；例如掷骰子序列。假设骰子是破坏不了的。在这些事件中，每一个都有一定的特性和性质；例如可以掷个5，因而具有性质5。如果我们选取直到序列某一元素以前已出现的所有具有性质5的掷骰子次数，除以直到那个元素以前掷骰子的总数（即序列中它的基数），那么我们就获得直到那个元素以前的5的相对频率。如果我们确定了直到这个序列每个元素以前5的相对频率，我们就用这种方法获得一个新的序列——5的相对频率序列。这种频率序列不同于它与之相应的原先的事件序列，后者可称为“事件序列”或“性质序列”。

我选取我们称之为“二择一”（alternative）作为一个集合的简单例子。我们用这个词指假定只有两种性质的事件序列——例如掷一个钱币猜正反面的序列。一种性质（正面）用“1”表示，另一种性质（反面）用“0”来表示。于是事件序列（或性质序列）可用下式表示：

（A） 0 1 1 0 0 0 1 1 1 0 1 0

1 0……

与这种“二择一”相应——或更精确地说，与这种二择一的性质“1”相关——的是下列“相对频率序列”，或“频率序列”：

……

收敛公理（或“极限公理”）假定，随着事件序列越来越长。频率序列将趋向一个确定的极限值。von Mises使用这个公理是因为我们必须弄清楚我们能够借以工作的某个固定的频率值（即使实际的频率值有一些波动）。在任何集合中至少有两种性质；如果我们得到与某个集合所有性质相应的频率极限值，那么我们就得到集合的“分布”。

随机公理或有时称之为“排除赌博系统原理” （the principle of the excluded gambling system），是打算用来为序列的似机遇性质提供数学表现。显然，如果掷硬币的序列有规律性，比方说在每三次掷正面后就出现反面相当有规律，那么一个赌徒就会用某种赌博系统来改善他的运气。随机公理就一切集合假定，不存在能够成功地应用于这种集合的赌博系统。它假定，不管我们可以选取何种赌博系统以选择认为有利的掷猜（tosses），我们将发现，如果赌博有足够长的时间继续下去，认为有利的掷猜序列中的相对频率接近的极限值与所有掷猜序列的极限值是一样的。因此存在着一种赌徒能借以改善他运气的赌博系统的序列不是von Mises意义上的集合。

对于von Mises来说，概率是“集合中相对频率极限度”的另一个术语。所以概率概念仅应用于事件序列；从Keynes等人的观点看来，这样的限定大概是完全不能接受的。对于批评他的解释太窄的人，von Mises的回答是强调科学的使用概率（例如在物理学中）与一般的使用概率之间的不同。他指出要求定义恰当的科学术语非要在一切方面去适应不确切的、前科学的用法是个错误。

按照von Mises的意见，概率计算的任务只不过在于此：从具有某些给定“初始分布”（initial distributions）的某些给定“初始集合”（initial collectives）推论出具有“导出分布”（derived distributions）的“导出集合”（derived collectives）；简言之，根据给定的概率计算出那些没有给定的概率。

von Mises把他的理论的独特特点概括为四点：集合概念先于概率概念；定义概率概念为相对频率的极限值；提出随机公理；以及规定概率计算的任务。

51．新的概率理论计划

von Mises提出的两条公理或公设以定义集合概念曾遇到强烈的批评——我认为这个批评不是没有道理的。特别是反对把收政公理和随机公理结合起来，理由是不允许把极限或收敛的数学概念应用于按照定义（即由于随机公理）必定不服从任何数学规则或定律的序列。因为数学极限值不过是决定序列的数学规则或定律的特有性质。数学极限值不过是这种数学规则或定律的一种性质，如果任意选定一个接近于零的分数，序列中都有一个元素，使得在它之后的所有元素与某个一定的值的差小于这个分数——于是这个值称为它们的极限值。

为了对付这些反对意见，有人建议不要把收敛公理和随机公理结合起来，仅假定收敛，即被限值的存在。至于随机公理，建议或者全然放弃它（Kamke），或者用较弱的要求代替它（Reichenbach）。这些意见的前提是认为引起麻烦的是随机公理。

与这些观点相对照，我倾向于责怪收敛公理不亚于责怪随机公理。因此我认为有两项任务要做：改进随机公理——主要是一个数学问题；以及完全消除收敛公理——认识论家特别关心的一个问题（参阅第66节）。

下面我首先讨论数学问题，然后讨论认识论问题。

这两项任务中的第一项，即数学理论的重建，其主要目的是从一个修改了的随机公理推导出Bernoulli定理——第一个“大数定律”；修改为实现这个目的所需，不要求更多。更确切地说，我的目的是推导出二项式公式（Binomial FormuCom，有时称为“Newton公式”），我称为“第三式”。因为能用通常的方法从这个公式中获得Bernoulli定理和概率论的其他极限定理。

我的计划是首先制定一个有穷类（finite cComss）的频率理论，并且尽量在这个框架内发展这个理论——即直至推导出（“第一”）二项式。这个有穷类频率理论原来是类理论（the theory of cComsses）一个十分基本的部分。它之得到发展只是为了获得讨论随机公理的基础。

接着我将通过引入收敛公理的老方法进而到无穷序列，即能够无限延续的事件序列，因为我们需要它来讨论随机公理。在推导出和考察Bernoulli定理之后，我将考虑如何能消除收敛公理，以及哪一类公理系统我们应该作为结果保留下来。

在数学推导的过程中，我将使用三个不同的频率符号：F”示有穷类的相对频率；F’示无穷频率-序列相对频率的极限值；最后F示客观额率，即在“不规则”或“随机”或“似机遇”序列中的相对频率。

52．有穷类内的相对频率

让我们考虑一类α的有穷数目的偶发事件，例如昨天用这粒特定的骰子掷猜这类偶发事件。设这类α为非空类（non－empty），可以说它起着参考系的作用，将称之为（有穷的）参考类（reference－cComss）。属于α的元素数目，即它的基数，用“N（α）”表示，读作“α数”。另一类β，可以是有穷的，也可以不是有穷的。我们称β为性质类（property－cComss）。例如它可以是所有掷5的类，或（如我们将要说的）所有具有性质5的掷猜类。

属于α又属于β的那些元素类，例如昨天用这粒特定的骰子掷并有性质5的掷类被称为α和β的乘积类（product-cComss），用“α·β”表示，读作“α和β”。由于α·β是α的子类，它至多能含有有穷的元素数（它可以是空类）。α·β中的元素数用“N（α·β）”表示。

当我们用N表示（有穷）的元素数时，用F”示相对频率。例如，“在有穷参考类α内性质β的相对频率”写作“αF”（β）”，可读作“β的α频率”。我们现在能定义

（定义1） αF”（β）＝N（α·β）/N（α）

根据我们的例子这意味着：“昨天用这骰子掷时出现5的相对频率，按照定义等于昨天用这骰子掷5的数被昨天用这骰子掷的总数来除所得的商。”

从这个颇为平凡的定义中，能够十分容易地推导出有穷类中频率计算的定理（更具体地说，一般乘法定理；加法定理；以及除法定理，即Bayes规则）。在这种频率计算的定理中，以及在一般的概率计算中，其特征是基数（N数）从不在其中出现，出现的是相对频率，即比值，或F数。N数仅发生在一些基本定理的证明中，这些基本定理是直接从这个定义中演绎出来的；但N数并不发生在定理自身中。”（读作“β的补数”或简单地读作：“非β”）来表示不属于β的一切元素类。于是我们可写出：）＝1

虽然这个定理仅包含F数，它的证明要利用N数。因为这定理认定义（1）中得出，借助于来自断言N（α·β）十N（α·β）＝N（α）的类的计算的一个简单定理。

53．选择、独立、无影响、无关

在能够用有穷类相对频率作的运算中，选择（selection）的运算对以下所述有特殊重要性。

设给定一个有穷参考类α，例如一只匣子中的钮扣类，以及两个性质类，β（比方说，红钮扣）和γ（比方说，大钮扣）。我们现在可把乘积类α·β看作一个新的参考类，并提出α·βF”（γ）值的问题，即在新的参考类内γ的频率的问题。新的参考类α·β可称为“从α中选择β元素的结果”或“按照性质β从α中选择”；因为我们可以想到它是通过从α中选择那些具有性质β（红）的一切元素（钮扣）。

γ发生在新的参考类α·β中的频率与发生在原先的参考类α中的频率相同，这恰恰是可能的；即

α·βF”（γ）＝αF”（γ）是正确的。在这种情况下，我们（遵循Hausdorff）说性质β和γ“在参考类a内是相互独立的”。独立关系是三项关系，在性质β和γ上是对称的。如果两种性质α和β在参考类α内是（相互）独立的，我们也可说性质γ在α内不受β元素的选择的影响；也许可说参考类α，就性质γ而言，不受按照性质β所作的选择的影响。

β和γ在α内相互独立或不受影响也可——按照主观理论的观点——解释如下：如果我们被告知类α的某一特定元素具有性质β，那么这个信息是无关的，如果β和γ在α内是相互独立的话；也就是对于这个元素是否也有性质γ这个问题是无关的。如果另一方面我们知道，γ更经常（或不那么经常）发生在子类α·β（已根据β从α中选择出来）中，那么某个元素有性质β的信息对于这个元素是否也有性质γ的问题便是有关的了。

54．有穷序列、顺序选择和邻域选择

设有穷参考类α的元素是编了号的（例如盒子中的每一个钮扣都写上一个数目），并且把它们按照序数排列成序列。在这种序列中我们可以区分出两类具有特殊重要性的选择，即按照元素的序数进行选择，或简称顺序选择，以及按照它的邻域进行选择。

顺序选择是根据依赖于元素序数的性质β从序列α中进行选择，元素的选择必须根据序数决定。例如β可以是性质偶数（even），因此我们从a中选择的一切元素，其序数是偶数。因此选择出来的元素形成一个所选子序列（selected

sub-sequence）。如果性质γ独立于根据β的顺序选择，那么我们也可说，顺序选择对γ而言是独立的；或者我们也可说序列α就γ而言，不受β元素的选择的影响。

邻域选择之有可能是由于这个事实：在把元素排列为编号序列时，某些邻域关系就形成了。这使我们例如有可能选择那些其直接先行者具有性质γ的所有成员；或者比方说，选择那些其第一和第一个先行者，或其第一个后续者具有性质Y的所有成员，如此等等。

因此如果我们有一个事件序列——比方说掷钱币猜正反面——，我们就必须区分两类性质：如“正面”或“反面”那样一些的主要性质，这些性质属于与其在序列中位置无关的每一个元素；以及如“偶数”或“反面的后续者”等那样一些次要性质，这些性质是一个元素由于它在序列中的地位而获得的。

具有两个主要性质的序列称为“二择一”。正如von Mises业已表明的（如果我们小心仔细），有可能把概率论的基本点发展为二择一理论，而不牺牲普遍性。用“1”和“0”表示二择一的两种主要性质，每一种二择一可表示为许多1和0的序列。

一种二择一的结构可以是有规律的，或者它也可能是多少不规则的。下面我将更周密地研究某些有穷二择一的这种规律性或不规则性。

55．有穷序列的n-自由度

让我们以有穷二择一α为例，它由一个个1和0组成，有规律地排列如下：

（α）

1 1 0 0 1 1 0 0 1 1 0 0 1 1 0

0……在这种二择一中，我们有均等的分布，即1和0的相对频率是均等的。如果我们用“F”（1）”示性质1的相对频率，用“F”（0）”示性质0的相对频率，我们可写：

（1）αF”（1）＝αF”（0）＝1/2

现在我们从α中选择（在α序列内）具有直接接在1后面的邻域性质的所有项。如果我们用“β”表示这种性质，我们可称为所选子序列“α·β“。它有这样的结构：

（α·β）

1 0 1 0 1 0 1 0 1 0……

这个序列又是具有均等分布的一种二择一。而且，1和0的相对频率都没有变化；即

（2）α·βF”（1）＝αF”（1）；α·βF”（0）＝αF”（0）

用第53节采用的术语，我们可以说二择一α的主要性质不受根据性质β作的选择的影响；简言之，α不受根据β作的选择的影响。

的元素，我们得到这样的二择一：）

0 1 0 1 0 1 0 1 0 1 0……

作的选择的影响；所以我们可以说，α都不受根据直接先行者的性质所作的每一种选择的影响。

并非不受根据先行者的性质所作的选择的影响。

现在我们可以研究二择一α，看看它是否也不受其他选择，尤其是根据一对先行者的性质所作的选择的影响。例如，我们可从α中选择那些是一对1，1的后续者的所有元素。并且我们马上看到α并非不受四种可能的对即1，1；1，0；01；0，0中任何一对后续者的选择的影响。在这些情况下，得到的子序列都没有均等分布；反之，它们全都由不间断的块（blocks，或“反复”iterations）组成，即只由1，或只由0组成。

α不受根据单个先行者作的选择的影响，但是并非不受根据成对先行者的选择的影响，这个事实可用主观理论的观点表述如下。关于α中任何元素一个先行者性质的信息，对于这个元素的性质问题是无关的。另一方面，关于元素的成对先行者的性质的信息则是高度有关的；因为给定α据以建立的定律，它使我们能够预测所讨论的元素的性质：关于元素成对先行者性质的信息，可以说给我们提供演绎出预测所需的初始条件。（a据以建立的定律要求一对性质作为初始条件；因此就这些性质而言，它是“二维的”。详细说明一种性质仅是在成为复合时作为初始条件不充分时才是“无关的”。参阅第38节。）

我没有忘记因果性——原因和结果——概念与预测的演绎的关系是多么密切，同时我要利用下列术语。以前作出的关于二择一α的断言：“α不受根据单个先行者作的选择的影响”，我现在用下列说法来表示：“α不受单个先行者任何后效的约束”，或简言之，“α的自由度为1（1－free）”。不像以前那么说α“不受（或受）根据成对先行者所作的选择的影响”，我现在说：“a不受（或受）成对先行者后效的约束”，或简言之，“α的自由度是（不是）2”。

用自由度为1的二择一作为我们的原型，我们现在能够容易地建立也具有均等分布的其他序列，这些序列不仅不受一个先行者的后效约束，即（像α一样）自由度为1，而且还不受一对先行者后效的约束，即自由度为2；此后，我们可以继续达到自由度为3等等的序列。这样把我们引导到对下述是基本的一般概念。这就是不受直至某个数n的一切先行者后效约束的自由度概念；或者如我们将要说的，n-自白度概念。更精确地说，我们称一个序列“自由度为n”，当且仅当它的主要性质的相对频率是“n重无影响”，即不受根据单个先行者和根据成对先行者和根据三个一组的先行者……和根据n个一组先行者作的选择的影响。

自由度为1的二择一α可以用重复任何倍数的生成周期（generating period）。

（A）

1 1 0 0……

来建立。同样我们获得具有均等分布的自由度为2的二择一，如果我们把

（B）

1 0 1 1 1 0 0 0……

作为它的生成周期，自由度为3的二择一从生成周期

（C）

1 0 1 1 0 0 0 0 1 1 1 1 0 1 0 0……

中获得，而自由度为4的二择一从生成周期

（D）

0 1 1 0 0 0 1 1 1 0 1 0 1 0 0 1 0 0 0 0 0 1 0 1 1 1 1 1 0 0 1 1……

中获得。将会看到：面临一个不规则序列的直觉印象随它n自由度的数n的增长而越强烈。

具有均等分布的一个具n自由度的二择一的生成周期必须包含至少2n＋1个元素，作为例子给定的周期，当然可以开始于不同的位置；（C）例如可从它的第四个元素开始，于是我们获得的不是（C），而是

（C’）

1 0 0 0 0 1 1 1 1 0 1 0 0 1 0 1……

有使序列的n-自由度不变的其他变换。为每一个数目n建立n-自由度序列生成周期的方法则在别处描述。

如果我们把下一生成周期的最初的n个元素加在一个自由度为n的二择一上，于是我们得到一个长度为2[n＋1]＋n的序列。除了其他性质外，这个序列还有以下的性质：n＋1个0和1的每一种排列，即每一个可能的n＋1个组，至少在其中发生过一次。

56．节段序列二项式的第一形式

给定一个有穷的序列α，我们称由n个连续元素组成的α的子系列为‘’α的n长度节段”；或更简单地说，“α的n-节段”。如果除了序列α以外，还给定某个定数n，那么我们能够把α的n-节段排列在一个序列中——α的n-节段序列。给定一个序列α，我们就可以从α的最初的n个元素的节段开始这种方式，建立一个新的序列，即α的n-节段序列。其次是α的2到n＋1的元素的节段。一般地说，我们把α的从x到x＋n－1的诸元素组成的节段看作新序列的第x个元素。如此获得的新序列可称为“α的交迭n-节段（over Compping n一segments）序列”。这个名称表示，新序列的任何两个连续元素（即节段）以这种方式交迭；使它们共有原先序列α的n－1元素。

现在我们通过选择可以从一个交迭节段的序列中，获得其他序列，尤其是毗邻n-节段（adjoining n-segments）的序列。

一个毗邻n-节段序列只含这样一些n-节段，它们在不交迭的α中，互相直接接续。例如开始也许是原先序列α的编号为1至n的元素的n-节段，续在后面的是n＋1至2n，2n＋1至3n如此等等的元素的n-节段。一般来说，一个毗邻节段的序列将以α的第k个元素开始，而它的节段将包含α的编号为直至n＋k－1，n＋k至2n＋k－1，2n＋k至3n＋k-1如此等等的元素。

下面将用“α（n）”示α的交迭n-节段的序列，用“αn”示毗邻n-节段序列。

现在让我们更详细一点考虑交迭节段α（n）的诸序列。这样一种节段的每一个元素是α的一个n－节段。我们可以把例如组成节段的n个一组的有序的0和1看作是α（n）一个元素的主要性质。或者我们可以更为简单地把它的1的数目看作是这个元素（不管1和0的次序）的主要性质。如果我们用“m”表示1的数目，则显然m≤n。”（非m）赋予α（n）的所有其他元素的话。因此α（n）的每一个元素必定有这两个性质中的一个或另一个。

现在让我们再次设想，给定一个具有主要性质“1”和“0”的一个有穷二择一。设1的频率αF”（1）等于p，0的频率αF”（0）等于q。（我们设分布是不均等的，即p≠q。）

现在让这个二择一α至少有n－1个自由度（n是任意挑选的自然数）。于是我们可向下列的问题：性质m在序列α（n）中出现的频率是多少？换言之，α（n）F”（m）的值是多少？

除了α至少有n－1个自由度外，我们什么也不假定，我们就能用初等算术解决这个问题。答案包含在下列公式中：

“二项”式（1）的右边是由Newton在论述有关别的问题时提出的（有时称为Newton公式）。我将称它为“二项式的第一形式”。

由于推导出了这个公式我就不再在有穷参考类内考察频率理论。这个公式将提供给我们一个基础来讨论随机公理。

57 无穷序列频率的假说性估计

把为n－自由度有穷序列获得的结果推广到用生成周期（参阅第55节）定义的n－自由度无穷序列是十分容易的。起着参考类（我们的相对频率与此有关）作用的一个无穷的元素序列可称为“参考序列”。它多少与von Mises意义上的“集合”相对应。

n－自由度的概念以相对频率的概念为前提；因为n－自由度的定义要求不受影响——不受根据一定的先行者所作的选择的影响——的是一种性质在其中发生的相对频率。在我们讨论有穷序列的定理中，我将暂时使用（直到第64节）相对频率极限值（用F’表示）概念代替有穷类的相对频率（F”）。只要我们把自己限于根据某个数学规则建立的参考序列，这个概念的使用就不会发生问题。对于这些序列我们总可以确定相应的相对频率序列是否是收敛的。相对频率极限值概念只是在没有数学规则只有经验规则（与例如钱卜序列有关的）的序列的情况下才会引起麻烦；因为在这些情况下，极限值概念是未定义的（参阅第51节）。

建立序列的数学规则的一个例子如下：“序列α的第n个元素应该是0，当且仅当n可被4除”。它定义的无穷二择一是

（α）

1 1 1 0 1 1 1 0……

其相对频率的极限值αF’（1）＝3／4； αF’（0）＝1／4。借助数学规则用这种方法定义的序列我简称为“数学序列”。

与之相对照，建立经验序列的规则是例如“序列α的第n个元素将是0，当且仅当硬币c的第n次掷猜出现反面时”。但是经验规则不一定总是定义随机性质的序列。例如，我应该把下列规则称为经验规则：“序列的第n个元素将是1，当且仅当第n秒（从某个零时算起）时，发现摆p摆到这标记的左方时”。

这个例子表明有时——例如根据与摆有关的一些假说和测量——可用数学规则代替经验规则。用这种方法我们会找到一个数学序列，它以按我们的目的也许使我们满意，也许不能使我们满意的精确度接近于我们的经验序列。有可能（我们的例子可用来建立这种可能）获得一个其各种频率接近于那些经验序列的频率，在我们目前的情况下具有特殊的意义。

我把序列分为数学序列和经验序列时，我利用的是“内包”上的差别，不是“外延”上的差别。因为如果用“外延”方法，即用一个接一个地列举其元素的方法使我们得一个序列－－因此我们就只能知道它的一个有穷的片段，一个有穷的节段，不管它有多长——，那么就不可能根据这个节段的性质确定其一部分的序列是学序列还是经验序列。仅当给定一个建构规则——即“内包”规则—一时，我们就能判定一个序列是否是数学的还是经验数的。由于我们希望借极限值（相对频率）概念之助处理我们的无穷序列，我们必须把我们的研究限于数学序列，实际上就是限于相应的相对频率序列是收敛的那些数学序列。这种限制等于引入收敛公理。（与这公理有关的问题到第63－66节再讨论，因为与“大数定律”一起讨论它们比较方便。）

因此我们将只谈数学序列。然而我们将只谈那些数学序列：我们期望或推测它们就频率而言接近于具有似机遇或随机性质的经验序列，因为它们是我们的主要兴趣所在。但是期望或推测一个数学序列，就频率而言它接近于经验序列，不过是提出一个假说——一个关于经验序列频率的假说。

我们对经验随机序列的频率的估计是假说这一事实，对我们用以计算这些频率的方法没有任何影响。显然，在有穷类方面，它对我们如何获得我们的计算由此开始的频率，丝毫没有关系。这些频率可借实际计算获得，或根据一条数学规则，或根据某种假说获得。或者我们简直可以虚构一些频率。在计算频率时我们接受某些频率作为给定的，并从中推导出其他频率。

无穷序列中的概率估计同样如此。因此关于我们频率估计的来源问题不是一个频率计算问题；然而这并不是说把这个问题从我们关于概率论问题的讨论中排除出去。

在无穷经验序列的情况中，我们能区分出我们假说性频率估计的两种主要“来源”——就是说两种方法，我们用这两种方法就可估计出频率。一是基于“均等-机遇假说”（equal chance hypothesis），（或等概率假说equi－probability hypothesis）的估计，另一是基于统计结果的外推（extrapoComtion of statistical findings）。

我用“均筹-机遇假说”，是指这样一种假说，它断言各种主要性质的概率是均等的：它是断言均等分布的假说。均等-机遇假说常常基于对称性的考虑。最典型的例子是掷骰子时均等频率的推测，其根据是立方体六面的对称性和几何等值。

至于基于统计学外推的频率假说，死亡率的估计提供一个很好的例子。在这里关于死亡率的统计资料是用经验查明的，并且根据过去的趋势将继续足十分接近稳定的，或者它们不会有很大变化——至少在最近时期内——的假说从已知事例，即从已用经验加以分类和计算的偶发事件外推到未知事例。

具有归纳主义倾向的人容易忽视这些估计的假说性质，他们会把假说性估计，即基于统计外推的频率预测同它们的经验“来源”之——过去的偶发事件和偶发事件序列的分类与实际计算混为一谈。往往提出这样的主张；我们从已加以分类和计算的过去的偶发事件（如死亡统计）中“推导出”概率估计——即频率预测。但是从逻辑观点看，这个主张并没有得到证明。我们根本没有作什么逻辑推导。我们已经做的是提出一个不可证实的假说，这个假说在逻辑上是永远得不到证明的，这个假说就是推测频率仍将稳定不变，因此允许外推。甚至均等-机遇假说也被一些相信归纳逻辑的人认为是“经验上可推导的”，或“经验上可说明的”，他们认为这些假说基于统计经验，即基于经验上观察到的频率。然而就我来说，我相信，我们在作出这种假说性估计时，往往单独爱关于对称意义的想法以及类似的考虑的引导。我看不出有任何理由为什么这些推测应该只是由于积累大量归纳观察而产生的。然而，我并不赋于我们估计的起源或“来源”这些问题以很大意义（参阅第2节）。我认为，更重要的是对这个事实要十分清晰，即频率的一切预测性估计，包括我们从统计外推中得到的频率——当然还有所有与无穷经验序列有关的频率——总是纯粹的推测，因为它总是超出我们有权根据观察肯定的任何东西。

我对均等－机遇假说和统计外推的区分与“先验”和“后验”概率的经典区分是完全符合的。但是由于这些术语是用于如此多的不同意义。而且由于这些术语因哲学上的联想而被严重玷污，最好还是避免用它们。

我在下面考察随机公理时，将试图寻找逼近随机经验序列的数学序列；这就是说我将考察频率假说。

58 随机公理的考察

顺序选择（即按位置选择）的概念和邻域选择的概念均已在第55节中引入和说明。我现在将借助这些概念检查von Mises的随机公理——排除赌博系统原理——以希望找到一个能代替这个公理的较弱的要求。在von Mises的理论中，这个公理是他的集合概念的定义的一部分：他要求一个集合中频率的极限一定要对任何种类的系统选择（systematic Selection）不敏感（他指出，赌博系统总是可被认为是一种系统选择。）。

对这个公理提出的大多数批评集中于它的表述的相对不重要的和表面的方面。这与下列事实有关，即在各种可能的选择中，会有这样的选择：比方说选择那些接近5的掷；显然在这种选择内，5的频率会与在原先序列内5的频率迥然不同。这就是为什么von Mises在他的随机公理表述中谈到他所说的“选择”或“选取”是“独立于”掷的“结果”，因而不用所选元素的性质去定义。但是只要指出我们可以根本不用成问题的措词来表述von Mises的随机公理，就可以完全答复针对这种表述的许多非难。因为例如我们可以表述如下：在一个集合中频率的极限一定都不受顺序选择和邻域选择的影响，而且也不受可用作赌博系统的这两种选择方法的所有组合的影响。

上述困难随这个表述而消失。然而其他困难仍保留。因此也许不可能证明，借助如此强的随机公理定义的一个集合概念，不是自相矛盾的；换言之，不可能证明“集合”的类不是空的。（Kamke曾强调证明这一点的必要）至少，建构某个集合的例子，并用这种方式说明集合的存在，这似乎是不可能的。这是因为满足一定条件的某一无穷序列的例子只可能由数学规则来提供。但是对于von Mises意义上的集合，根据定义不可能有这种规则，因为能够把任何规则都用作一种赌博系统或选择系统。如果所有可能的赌博系统都被排除，这种批评确实是无法驳斥的。

然而也可提出另外的异议来反对排除所有赌博系统的概念：它的要求实在太多了。如果我们要使某个陈述系统公理化——在这个场合是概率计算定理，尤其是特殊的乘法定理或Bernoulli定理——，那么所选的公理不仅应该对系统定理的推导是充分的，而且也是（如果我们能这样推导出定理）必要的。然而可以表明排除所有选择系统对Bernoulli定理及其系统定理是不必要的。要求排除特殊类的邻域选择是十分充分的：它是以要求序列应该不受根据任意选取的n个一组的先行者所作的选择的影响；也就是说，它应该有n个自由度，不受每个n的后效的约束，或简言之，它应该是“绝对自由的。”

所以我建议用不那么严格的“绝对自由”的要求（对每一个n有n-自由度的意义上）来代替von Mises的排除赌博系统原理，并且相应地把似机遇的数学序列定义为满足这个要求的序列。其主要优点是不排除所有赌博系统，因此有可能提供建构在我们的意义上“绝对自由的”序列的数学规则，从而有可能建构实例。因此也就满足了上面讨论的Kamke的异议。因为我们现在能够证明似机遇数学序列的概念不是空的，所以是前后一致。

也许有点奇怪：我们应该试图借助必须符合最严格规则的数学序列来勾划机遇序列极不规则的特点。von Mises的随机公理起初似乎使我们的直觉更为满意。一个机遇序列必定是完全不规则的，因此只要我们继续努力试图通过把这个序列延伸得足够长来证伪这个推测的话，任何推测的规则性一定会在序列的后面部分遇到失败，知道这一点是颇为令人满意的。但是这个直觉的论证也有利于我的建议。因为如果机遇序列是不规则的，那么，不容置疑，它们就不会是某种特殊类型的规则序列。而我们的“绝对自由”要求不过是排除一种特殊类型的规则序列，尽管是一种重要的类型。

它是一种重要的类型这一点可以从这个事实中看出，即根据我们的要求不言而喻地排除下述三种典型的赌博系统（参阅下一节）。首先我们排除“正态的”或“纯粹的”邻域选择，在其中我们根据邻域的某种恒定的特征进行选择。其次，我们排除“正态的”顺序选择，这种选择选取的元素，它们的间距是恒定的，例如标号为是k，n＋k，2n＋k……等等的元素；最后，我们排除这两种类型选择的许多组合（例如一切第n个元素的选择，假如它的邻域具有某种具体的恒定特征）。所有这些选择的独特性质是，它们与序列的绝对的第一元素无关；如果原先的序列从另一个（相应的）元素开始标号，它们就可产生同样的所选的子序列。因此被我的要求排除的赌博系统是那些无需知道序列的第一元素而可使用的赌博系统。被排除的系统总涉及某些（线性）变换。它们是简单的赌博系统。（参阅第43节）。我的要求不予排除的只是涉及诸元素与绝对的（初始的）元素间有绝对距离的赌博系统。

对一切n有自由度n——“绝对自由”——的要求也与我们大多数自觉地或不自觉地认为对机遇序列也适用的东西完全一致；例如一粒骰子下一次掷的结果不依赖以前几次掷的结果（掷以前摇摇骰子的做法就是想要保证这种“独立性”）。

59．似机遇序列客观概率

鉴于我已说过的那些东西，我现在提出下列定义。

我们说一个事件序列或性质序列，尤其是一个二择一，是“似机遇”或“随机的”，当且仅当它的主要性质的频率极限是“绝对自由的”，即不受根据任何n个一组的先行者的性质所作的一切选择的影响。与随机的序列相应的频率极限被称为在有关序列内该性质的客观概率；用F表示。这也可表述如下。设α为具有主要性质B的似机遇或似随机序列；这时下式成立：

αF（β）＝αF’（β）

现在我们必须证明我们的定义足以推导出数学概率论的主要定理，尤其是Bernoulli定理。随后——在第64节——这里给定的定义将予以修改使之独立于频率极限的概念。

60．Bernoulli问题

在第56节提到的第一个二项式公式，即

适用于交迭节段的有限序列。它可根据这样的假定推导出来，即有限序列α至少有n－1个自由度。根据同样的假定，我们直接获得一个有限序列的正好相应的公式；那就是说，如果α是有限的，并且至少有n－1个自由度，那么

由于似机遇序列是绝对自由的，即对于每一个n有n个自由度，公式（2），即第二个二项式公式也必须适用于那些序列；并且确实它必须适用于它们，不管我们选择的n的值是多少。

下面我们将只涉及似机遇序列，或随机序列（如在前节中定义的那样）。我们就要证明，对于似机遇序列，除了公式（2），第三个二项式公式（3）也必定适用；这个公式是

公式（3）在两个方面不同于公式（2）：第一，它所断言的涉及毗邻节段αn的序列，不是交迭节段α（n）的序列。第二，它不包含符号F’，而包含符号F。这意味着，根据蕴涵它断言邻近节段序列也是似机遇或随机的；因为从F，即客观概率的定义仅涉及似机遇序列。

（3）所回答的在邻近节段序列中性质m的客观概率问题——即αnF（m）的值的问题——，我效法von Mises，称之为“Bernoulli问题。对于这个问题的解决，从而对于第三个二项式公式（3）的推导，假定α是似机遇或随机的也就够了。（我们的任务等于说明特殊的乘法定理适用于一个随机序列α的毗邻节段序列。）

公式（3）的证明可用两步实现。首先，我们证明公式（2）不仅适用于交迭节段α（n）的序列，而且也适用于毗邻序列αn的序列。第二，我们证明后者是“绝对自由的”。（这两步的次序可以颠倒，因为交迭节段α的序列肯定不是“绝对自由的”；事实上，这种序列提供了一个可称之为“具有后效的序列”的典型例子。）

第一步。毗邻节段αn的序列是α（n）的子序列，它们可通过正态顺序选择从α（n）中获得。因此如果我们能证明在交迭序列α（n）F’（m）中频率的极限不受正态顺序选择的影响，我们就是已经采取了第一步（以及甚至走得更远一点）；因为我们将证明这个公式：

（4）

αnF’（m）＝α（n）F’（m）

我将首先以n＝2为例概述这个证明；即我将证明

（4a）

α2F’（m）＝α（2）F’（m）（m≤2）

为真；因此很容易概括这个公式以适用于一切n。

从交迭节段α（2）的序列中，我们能够选择毗邻节段的两个以及仅仅两个不同的节段α（2）；一个用（A）表示，包含α（2）的第一，第三，第五……节段，即由数1，2；3,4；5，6；……组成的α的元素对另一个用（β）表示，包含α（2）的第二，第四，第六，……，节段，即由数2，3；4，5；6，7；……等组成α的元素对。现在假定公式（4a）不适用于两个序列中的一个，（A）或（B），结果节段（即对）0，0太经常出现在比方说序列（A）中；于是在序列（B）中必须出现一个余离差（complementary deviation）；即节段0， 0将不很经常出现（“太经常”，或“不很经常”是与二项式公式相比较而言的）。但是这与所假定的α的“绝对自由”是矛盾的。因为如果0，0对在（A）中出现比在（B）中更经常，那么在α的足够长的节段中，0，0对在某些表示特征的间距内出现比在其他间距内出现更经常。如果0，0对属于两个α2序列中的一个，更为经常出现的间距就是那些占优势的间距，如果0，0对均属于两个α2-序列，不那么经常出现的序列就是那些占优势的序列。但是这与所假定的α的“绝对自由度”是矛盾的；因为根据第二个二项式公式，α的“绝对自由度”意味着，在任何α（n）序列中一个特定的长度为n的序列出现的频率只依赖在该序列中出现的1和0的数目，而不是依赖它们在序列中的排列。

这证明（4a）；由于这个证明能容易推广到任何n，（4）也就得到证明；这就完成了证明的第一步。

第二步。αn序列是绝对自由的这一事实可用一个类似的论据来说明。我们仍可以首先只考虑α2序列；而就这些序列而言，开始只会证明它们的自由度为1。设两个α2序列中的一个，即节段（A）并不是自由度为1。那么在（A）中，在至少由两个元素（一个特定的α对）组成的一个节段之后，比方说在0，0节段之后，另一个节段比方说1，1，必须比如果（A）是“绝对自由的”时更为经常地跟随着；这就是说，节段1，1出现在根据先行节段0，0从（A）中选择的子序列中的频率比二项式公式使我们期望更大。

然而，这个假定与序列α的“绝对自由度”是矛盾的。因为如果节段1，1在（A）中跟随节段0，0过分经常，那么通过补整（compensation），相反情况也必须出现在（B）中；因为否则四个一组0，0，1，1在α的一个足够长的节段中，会太经常地出现在某些特征性间距内——即在如果所说的两对属于同一α2序列就会占优势的那些间距内。此外，在其他特征性间距内，四个一组会不那么经常地出现——即在那些如果它们均属于两个α2序列就会占优势的间距内。因此我们面临的正好是与以前同样的情况；而且我们能用类似的考虑证明，假定事件在一些特有的间距内优先发生，是所假定的α的“绝对自由度”是不相容的。

这个证明又可加以推广，结果我们可以说α序列不仅自由度为1，而且对每一个n，自由度为n，因而它们是似机遇的，或随机的。

这就完成了我们对这两步的概述。因此我们现在有权在（4）中用F代替F’；这就是说，我们可以同意这个主张：第三个二项式公式解决了Bernoulli问题。

顺便说一句，我们已证明交迭节段的序列α（n）不受正态顺序选择的影响，只要α是“绝对自由”时。

这同样适用于毗邻节段序列αn，因为从αn中作的任何一个正态顺序选择可被认为是从α（n）中作正态顺序选择；所以它必须应用于序列α本身，因为α与α（1）和α1都是等同的。

因此我们也还证明了，不受正态顺序选择的影响是从“绝对自由度”——它意指不受某一特殊类型的邻域选择的影响——中得出的必然结论。容易看出，更进一步的结论是不受任何“纯”邻域选择（即根据它的邻域的某个恒定的特征——不随元素序数而变化的特征——进行选择）的影响。最后它的必然结论是“绝对自由度”蕴含着不受这两类选择的所有组合的影响。

61．大数定律（Bernoulli定理）

在假定我们能使n趋向极限。即n→∞的条件下，Bernoulli定理，或（第一）“大数定律”可以用纯粹数学的推理从第三个二项式方式中推导出来。所以它能断言的只是无限的序列α；因为正是仅仅在这些序列中αn-序列的n-节段长度能无限增加。并且它能断言的只是这些“绝对自由”的序列，因为正是仅在假定对每一个n自由度为n的条件下，我们能使n趋向极限，n→∞-p]＜δ时；换言之，节段具有性质‘△p’。现在Bernoulli定理回答了频率或概率值的问题，在αn序列内这种节段——具有性质△p的节段的值的问题；因此它回答了αnF（△p）值的问题。

人们在直观上可以猜测：如果值δ（δ＞0）是固定的，如果n增加，那么具有性质△p的这些节段的值，因此αnF（△P）的值，也将增加（并且它的增加将是千篇一律的）。Bernoulli的证明（在任何一本概率计算教科书中都可以找到这种证明）接着下去便是借助二项式公式来评价这种增加。他发现如果n的增加没有极限，αnF（△P）值便逼近最大值1，不管&的固定值有多少。这可用下式来表示。

F（△p）＝1

（对任何△p值）

这个公式从改变毗邻节段序列的第三个二项式公式而来。对于交迭节段的序列，类似的第二个二项式公式用同样的方法直接导附相应的公式。

F’（△p）＝1

这个公式对于交迭节段序列以及从它们之中作正态顺序选择是正确的，因此对于具有后效的序列（Smoluchowski曾研究过这些序列）也是正确的。公式（2）本身产生（1），假如所选的序列不交迭，所以自由度为n。（2）可描述为Bernoulli定理的一种变式；而我在这里将要就Bemoulli定理所说的话经过必要的修正（mutatis mutandis）以适用于这种变式。

Bernoulli定理，即公式（1），可用下面的话表示。让我们称从一随机序列α中选择的长度固定的一个长的有穷节段为一“中等样本”（fair

sample），当且仅当在这个节段内1的概率，即在随机序列内1的概率值与p的离差只有某一小的固定的分数（我们可以自由挑选这个分数）。因此我们可以说，只要我们使这些节段有足够长，偶然碰到一个中等样本的概率如我们所喜欢的那样逼近于1。

在这个表述中，“概率”（或“概率值”）一词出现两次。在这里如何解释或翻译它？在我的频率定义的意义上，这词不得不翻译如下（我将“概率”一词译为频率语言的两种译法用黑体表示）：所有足够长的有限节段中绝大多数有“中等样本”；即它们的相对频率与该随机序列频率值p的离差为一任意固定的很小的量；或简言之：频率p近似地实现在几乎所有足够长的节段中。（我们如何达到p值与我们现在的讨论是无关的；比方说它可以是一种假说性估计的结果。）

记住Bernoulli频率αnF（△p）一成不变地随节段的长度n的增加而增加，一成不变地随n的减少而减少，所以，相对频率值在短的节段中实现是比较罕见的，我们也可说：

Bernoulli定理说明，“绝对自由的”或似机遇的序列的短节段经常表现在与p有比较大的离差，因此有比较大的涨落，而较长的节段，在大多数情况下，将表现出随长度的增加与P的离差越来越小。结果，在足够长的节段中大多数离差将变得如我们希望的那样小；换言之，大的离差将变得如我们希望的那样罕见。

因此，如果我们取随机序列的一个十分长的节段，为了通过计算或也许利用其他的经验的和统计的方法，求在它的子序列内的频率，那么在大多数情况下我们将得到如下结果。有一个特征性平均频率，使整个节段中以及几乎所有的长的子序列中，相对频率与这个平均值的离差很小，如果我们挑选的子节段越短，较小的子节段的相对频率与这个平均值的离差就越大和越经常，这个事实，即有穷节段这种可在统计学上得到确定的行为，系指它们的“拟收敛行为”；或系指这样的事实：随机序列在统计学上是稳定的。

因此，Bernoulli定理断言，似机遇序列的节段较小，经常表现为大的涨落，而大节段总表现恒定或收敛；简言之，我们在小节段中发现无序和随机，在大节段中发现有序和恒定。“大数定律”式所指的正是这种行为。

62．Bernoulli定理和概率陈述的解释

我们刚刚看到，用言语表述的Bernoulli定理中“概率”一词出现了两次。

频率理论家在两种情况下根据它的定义翻译这个词没有困难：他能对Bernoulli定理和大数定律提供一个清楚的解释。主观理论的拥护者也能以它的逻辑形式做到这一点吗？

想把“概率”定义为“理性信仰程度”的主观理论家，当他把“……的概率如我们希望的那样逼近1”这些话解释为“……几乎是确定无疑的”时，他前后完全一致，并且有权这样做。但是当他继续说：“……相对频率与它最可几的值p

的离差小于一定量……”，或用Keynes的话说，“事件出现的比例与最可几的比例p的离散小于一定量……”时，他只不过模糊了他的那些困难。这听起来似乎蛮有道理，至少乍一听来是这样。但是如果在这里我们也把“可几的”（有时省略）一词，用主观理论的意义加以翻译，那么整个问题变成这样：“相对频率与理性信仰程度p值的离差小于一定量几乎是确定无疑的，”我认为这是十足的废话。因为相对频率只能与相对频率作比较，只能与相对频率有离差或没有离差。很清楚，在演绎Bernoulli定理之后，把一个不同于演绎之前给予p的意义给予它是不允许的。

因此我们看到主观理论不能用统计学的大数定律来解释Bernoulli定理。统计定律的推导只有在频率理论的框架内才有可能。如果我们从严格的主观理论出发，将永远达不到统计陈述——即使努力填补同Bernoulli定理之间的鸿沟也不能达到。

63.Bernoulli定理和收敛问题

从认识论观点看，我对上述大数定律的演绎是不满意的；因为收敛公理在我们的分析中所起的作用是很不清楚的。

实际上通过把我的研究限于具有频率极限的数学序列已不言而喻地引入了这类公理（参阅第57节）。结果甚至容易使人认为我们的结果——大数定律的推导——是无关紧要的；因为“绝对自由”的序列在统计学上是稳定的这一事实可被认为是它们的收敛所蕴含的，而它们的收敛如果不是不证自明也是不言自明地被假定的。

但是正如von Mises已清楚地表明的那样，这个观点是错误的。因为有些序列满足收敛公理，虽然Bernoulli定理对它们不适用，因为具有频率接近1的任何长度的节段，出现在与p有一定程度离散的频率中。（极限p在这些情况下的存在是由于这个事实：虽然离散可无限增加，但它们相互抵销。）这些序列看起来仿佛它们在任意大的节段中是发散的。即使相应的频率序列事实上是收敛的。因此大数定律根本不是收敛公理的无关紧要的推断，而且，这个公理对于推导大数定律完全不充分。这就是为什么我对随机公理的修改，“绝对自由”的要求是不可缺少的。

然而，我们的理论重建，提示了这样一种可能性：大数定律也许是独立于收敛公理的。因为我们已经看到，Bernoulli定理是直接从二项式公式中得出的；此外，我已证明，可为有穷序列推导出第一个二项式公式，因此当然无需任何收敛公理。还必须假定的一切是参考序列α的自由度至少是n－1；这是一个从中得出特殊乘法定理的可靠性以及第一个二项式公式的可靠性的假定。为了过渡到极限，为了获得Bernoulli定理，只需假定我们使n如我们希望的那样大。因此就能看出，Bernoulli定理大概是对的，即使对于有穷序列也是如此，如果对于一个足够大的n它们的自由度为n的话。

所以看来Bernoulli定理的演绎并不依赖于假定频率极限存在的公理，而是仅依赖于“绝对自由度”或随机性。极限概念仅起次要的作用：它用来把相对频率的概念（在第一个例子中给它下定义只是为了有穷类，没有它，n-自由度的概念就不能提出）应用于能无限延伸的序列。

此外，不应忘记，Bernoulli本人是在经典理论的框架内演绎他的定理的，这个理论不包含收敛公理；也不应忘记，作为频率极限的概率定义只是经典形式体系的一种解释——而且不是惟一可能的一种解释。

我将试图用除n－自由度（应适当地加以定义）外无需假定任何东西就可推演出这个定理来证明我的推测——Bernoulli定理独立于收敛公理。并且我将试图证明它甚至适用于其主要性质并不具有频率极限的那些数学序列。

只要能够证明这一点，我就会认为我之推演出大数定律从认识论家的观点来看是令人满意的。因为似机遇经验序列证明，我已描述为“收敛”或“统计学上稳定的”那种特殊行为，是一个“经验事实”——或至少有时人们这样告诉我们（参阅第61节）。通过用统计方法记录长节段的行为，人们能够确定相对频率越来越逼近一个限定的值，相对频率在其中涨落的间隔变得越来越小。对这种所谓的“经验事实”，已进行过如此多的讨论和分析，确实往往认为它是大数定律的经验验证，对这种“经验事实”可以从不同角度来看。具有归纳主义倾向的思想家大多数认为它是基本的自然律，不能还原为任何更简单的陈述；认为它是必须完全加以接受的我们世界的特性。他们认为以适当形式——例如以收敛公理的形式——表示的这个自然律应该作为概率论的基础，从而使概率论具有一门自然科学的性质。

我对这种所谓“经验事实”的态度是不同的。我倾向于认为，它可还原为序列的似定律性质；可从这些序列的自由度为n的事实中推导出来。我认为Bermoulli和Poisson在概率论领域的成就正是在于他们发现了一种方法以表明这种所谓“经验事实”是重言式，表明从小规模的无序（假如它满足表述得合适的n－自由度条件）合乎逻辑地得出一种大规模的稳定性秩序。

如果我们能够无需假定收敛公理而演绎出Bernoulli定理，那么我们就可把大数定律的认识论问题还原为一个公理独立性问题，因而还原为一个纯粹的逻辑问题。这种演绎也说明为什么收敛公理在各种实际应用（试图计算经验序列的近似行为）中起了很好的作用。因为即使对收敛序列的限制结果弄清是不必要的，利用收敛数学序列来计算经验序列的近似行为（它根据逻辑上的理由在统计学上是稳定的）肯定不是不合适的。

64．收敛公理的排除“机遇理论基本问题”的解决

迄今频率极限除了具有提供一个可应用于无穷序列相对频率的明确概念外，在我们的概率论的重建中没有其他功能，因此我们可以借助它来定义（不受后效约束的）“绝对自由度”。因为正是相对频率被要求不受根据先行者作出选择的影响。

我们早就把我们的研究限制在具有频率极限的二择一，因此不言而喻地引入了收敛公理。现在，为了使我们摆脱这个公理，我将摆脱这个限制，而不用任何其它限制来代替它。这就是说我将不得不建构一个频率概念，它能接管被排除的频率极限的功能，并可应用于所有的无穷参考序列。

满足这些条件的一个频率概念是相对频率序列聚点的概念。（如果在任何给定的元素之后有一些与α的离差小于一定量，即使这个量很小，就说α值是某一序列的聚点。）这个概念可不加限制地应用于所有无穷序列，这一点可从这个事实中看出，即对于每一个有穷的二择一，与之相应的相对频率序列中必有至少一个这样的聚点存在。由于相对频率决不可能大于1，也不可能小于0，相对频率序列必定由1和0连结起来。而且作为一个无穷的连结起来的序列，它必须（根据著名的Bolzano和Weierstrass）至少有一个聚点。

简而言之，与一个二择一α相应的相对频率序列的第一个聚点被称为“α的中频率（middle frequency）”。因此，我们可以说：如果一个序列α有一个并且只有一个中频率，那么同时这就是它的频率极限；反之亦然：如果它没有频率极限，那么它就有不止一个中频率。

将会发现中频率概念十分适合于我们的目的。正如前面p

是序列α的频率极限这一点是我们的估计——也许是假说性估计——一样，我们现在也可以使用p是α的中频率这一估计。而且假如我们采取必要的预防措施，我们能够借助这些估计的中频率进行计算，类似我们用频率极限计算一样。此外，中频率概念可应用于所有可能的无穷参考序列，没有任何限制。

如果我们现在试图把我们的符号αF’（β）解释为中频率，而不是频率极限，并且我们因而改变客观概率的定义（第59节），我们的公式大多数仍然是可推导的。然而有一个困难：某一中频率不是惟一的。如果我们估计或推测一个中频率是αF’（β）＝p

，那么这不排除αF’（β）有除了p以外的值。如果我们假定这并非如此，那就不言而喻要引入收敛公理。如果在另一方面，我们定义客观概率无需这种具有惟一性的假定，那么我们就获得（至少在第一个例子中）一个模棱两可的概率概念；因为在某些条件下一个序列可同时拥有都是“绝对自由的”若干中频率。但是这是难以接受的，因为我们习惯于用不含糊的或惟一的概率；也就是假定在同一参考序列内对于同一性质，可能有一个，并且只可能有一个概率p。

然而，无需极限公理定义惟一的概率概念的困难是容易克服的。我们可引入惟一性要求（毕竟是最自然的程度）作为最后一步，在假定了序列将是“绝对自由的”以后。这使我们对我们的似机遇序列定义以及客观概率定义提出下列修改作为对问题的一种解决办法。

设α为一个二择一（有一个或数个中频率）。设α的1有一个或只有一个“绝对自由的”中频率p；于是我们说α是似机遇或随机的，并且p是1在α内的客观概率。

这有助于把这个定义分为两个公理性要求。

（1）随机性要求：对于似机遇的二择一，至少必须有一个“绝对自由的”中频率，即它的客观概率p。

（2）惟一性要求：对于同一似机遇的二择一的同一性质，必定有一个且只有一个概率p。

前面建构的实例保证了这个新公理系统的无矛盾性。有可能建构不具有频率极限的序列，虽然它们有一个且只有一个概率。这表明新的公理要来实际上比老的更广泛，更不确切。如果我们以下列形式陈述（如我们可以陈述的那样）我们的老公理，这个事实甚至会变得更加明显：

（1）随机性要求：如上。

（2）惟一性要求：如上。

（2’）收敛公理：对于同一似机遇二择一的同一性质除了它的概率p外不存在其他中频率。

我们可从建议的要求系统中演绎出Bernoulli定理，以及同它一起的经典概率计算定理。这就解决了我们的问题：现在有可能在频率理论的框架内演绎出大数定律，而无需利用收敛公理。此外，不仅第61节公式（1）和Bernoulli定理的文字表述仍然不变，而且我们给予它的解释也仍然不变：在一个没有频率极限的似机遇序列情况下，几乎所有足够长的序列表明与p只有小的离差，这仍然是正确的。在这些序列中（正如在有频率极限的似机遇序列一样）具有拟发散行为的任何长度的节段，也就是与p的离差有任何量的节段，当然不时会出现。但是这些节段比较罕见，因为它们必定被其中所有的（或几乎所有的）节段具有拟收敛行为的序列极端长的部分所补偿。正如计算所表明的，这些延伸部分一定会比它们补偿的具有发散行为的节段长几个数量级。

这也就是解决“机遇理论基本问题”（在第49节就是这样称呼的）的地方。从单个事件的不可预测性和不规则性到概率计算规则对这些事件的可应用性，这看起来自相矛盾的推论实际上是可靠的。假如根据这样一个假说性假定，即在根据先行者所作的任何选择中只出现一个循环的频率——“中频率”——因而没有后效发生，我们就能够以相当的逼近度来表示不规则性。因为根据这些假定，有可能证明大数定律是重言的。坚持这样的结论，即在可以说任何事情在这时和那时都会发生的——虽然某些事情的发生只是罕见的——不规则序列中，某种规则性或稳定性将出现在十分大的子序列中，这是可以允许的，并非自相矛盾的（有人有此主张）。这个结论也不是不重要的，因为为了这个结论我们就需要特殊的数学工具（Bolzano和Weierstrass定理，n－自由度概念，以及Bernoulli定理）。当我们知道，不规则性的假定可以置于某种频率假说（不受后效约束的假说）的形式中，并且知道，如果我们要证明从不可预测性到可预测性，从无知到知识的推论的可靠性，它就必须置于这种形式中，那么这种推论外表的自相矛盾就消失了。

现在已变得很清楚，为什么老的理论不可能适当处理我所说的“基本问题”。大家承认，主观理论能够演绎出Bernoulli定理；但是在大数定理时兴以后它决不能用频率前后一致地解释它（参阅第62节）。因此它决不能说明概率预测统计学上的成功，另一方面，老的频率理论，根据它的收敛公理则明确要求有规则性。因此在这个理论内不会有从小规模的不规则性推论到大规模的稳定性问题，因为它只涉及从大规模的稳定性（收敛公理）同小规模的不规则性（随机公理）结合在一起，推论到大规模的特殊形式的和稳定性（Bernoulli定理，大数定律）。

收敛公理不是概率计算基础的一个必要部分。我用这个结果来结束我的数学计算分析。

现在我们回来考虑性质截然不同的方法论问题，尤其是如何判定概率陈述问题。

65．可判定性问题

无论我们可给概率概念下什么定义，或我们选择什么样的公理表述：只要二项式公式在系统内是可推导出来的，概率陈述就是不可证伪的。概率假说并不排除任何可观察的东西；概率陈述不可能同一个基础陈述发生矛盾，或被它反驳；它们也不可能被任何有限数目的基础陈述所反驳；因此也就不会被任何有限数目的观察所反驳。

让我们假定我们已对某个二择一α提出某个均等机遇假说；例如我们已估计到用一块硬币作掷猜出现“1”和“0”的频率是均等的，因此 αF（1）－

αF（0）＝1/2；再让我们假定我们在经验上发现无例外地一次又一次出现“1”：于是我们无疑会在实际上放弃我们的估计，认为它已被证伪。但在逻辑的意义上不可能有证伪问题。因为我们可以肯定观察的只是一个有限的掷猜序列。并且虽然根据二项式公式，碰巧出现与1/2的离差很大的十分长的有限节段的频率是极小的，然而它必定总仍然是大于0。因此具有甚至最大离差的有限节段十分罕见的出现决不可能反驳这个估计。实际上，我们必定会期望它出现：这是我们估计的一个推断。任何这种节段可计算的罕见性将是证伪概率估计的一种手段，这种希望证明是要落空的，因为甚至一个长的、离差大的节段的频率出现，也总可以说不过是一个更长、离差更大的节段的一次出现。因此不存在在外延方面给定的事件序列，所以不存在能够证伪概率陈述的有限的几个一组的基础陈述。

只有一个无穷的事件序列——根据某项规则在内包上加以定义的——能反驳一个概率估计。但是鉴于第38节阐述的考虑（参阅第43节），这就是说，概率假说是不可证伪的，因为它们的维（dimension）是无限的。所以我们实际上应把它们描述为经验上没有信息的、没有经验内容的。

然而面对物理学利用从概率假说性估计那里得到的预测所取得的成功，任何这种观点显然是不能接受的。（这里所用的论据同早些时候用来反对主观理论把概率解释为重言的论据是一样的。）许多这些估计的科学意义不亚于其他任何物理学假说（例如，不下于某一决定论性质的假说）。并且物理学家常常很能判定他是否可暂时接受某种特定的概率假说为“经验上得到确证的”，或他是否应该把它作为“实践上被证伪的”而加以摈弃，即对于预测设有用处。十分明显，这种“实践上被证伪”只能通过方法论上的判定才能获得，以把高度不可几的事件认作被排除的——被禁止的。但是根据什么理由可认为它们如此呢？我们应从什么地方获得这种思路？这种“高度不可几性”从哪里开始？

由于从纯逻辑观点看，概率陈述不可能被证伪这个事实是不可能有什么疑问的，我们在经验上使用它们这个同样不容置疑的事实似乎必定是对我关于方法（我的划界标准决定性地依赖于它）的基本思想的致命打击。然而我将通过果敢地应用这些思想来试图回答我已提出的问题——什么是可判定性问题。但是要做到这一点，我将首先不得不分析概率陈述的逻辑形式，既考虑到它们之间逻辑上的相互关系，又考虑到它们与基础陈述所处的逻辑关系。

66．概率陈述的逻辑形式

概率估计不是可证伪的。当然，它们也不是可证实的。同样理由这也适用于其他假说，因为看到任何实验结果，不管多么多和多么有利，最后总能确定“正”的相对频率是1/2，并且将总是1/2。

因此概率陈述和基础陈述不可能相互矛盾，也不可能彼此蕴含。然而由此得出结论说概率陈述和基础陈述之间没有任何逻辑关系，那就错了。并且同样不能认为虽然在这两类陈述之间有逻辑关系（因为观察序列同频率陈述显然或多或少是接近一致的），这些关系的分析迫使我们引入一种突破经典逻辑的特殊概率逻辑。与这些观点相反，我认为这些关系完全能够用可推演性和矛盾的“经典”逻辑关系来分析。

从概率陈述的非可证伪性和非可证实性可以推论出，它们没有可证伪的推断，它们本身不可能是可证实陈述的推断。但是相反的可能性并未排除。因为它可以是（α）它们有单向可证实推断［纯粹存在推断，或有推断（there－is－consequences）］或（b）它们本身是单向可证伪全称陈述[所有-陈述（all—statements）]的推断。

可能性（b）对于弄清概率陈述和基础陈述之间的逻辑关系鲜有帮助：一个非可证伪陈述，即一个说得很少的陈述能够属于可证伪的、因而说得更多的陈述的推断类，这是非常明显的。

对我们意义更大的是可能性（α），它无论如何不是没有意义的，并且事实上结果证明对我们分析概率陈述和基础陈述之间关系是基本的。因为我们发现能够从每一个概率陈述中演绎出无限类的存在陈述，但反之不然。（因此概率陈述断言的比任何这些存在陈述断言的更多。）例如，设p是对某一二择一假说性估计的概率（并设0≠p≠1）；那么我们能从这个估计中演绎出例如1和0都将出现在这序列的存在推断。（当然也还有许多远不是那么简单的例子——例如，会出现与p的离差仅为一非常小的量的节段。）

但是我们从这个估计中能演绎出的多得多；例如“一遍又一遍地”出现一个具有性质“1”的元素和具有性质“0’的另一个元素；那就是说，在任何元素x之后，在序列中会出现一个具有性质“1”的元素y，并且也出现一个具有性质“0”的元素x。这种形式的陈述（“对于每一个x有y具有可观察的、或外延上可检验的性质B”）既是不可证伪的——因为它没有可证伪的推断——又是不可证实的——由于使之成为假说性的“所有”或“对于每一个”。虽然如此，它能够得到更好地或不那么好地“确证”——指我们可以证实它的许多或很少存在推断，或者不能证实它的存在推断；因此它与基础陈述处于似是概率陈述特有的关系中。上述形式的陈述可称为“全称化的存在陈述”或（全称化的）“存在假说”。

我的主张是，概率估计对基础陈述的关系，以及这些估计或多或少得到很好“确证”的可能性，考虑到这一事实就能理解：存在假说在逻辑上可从所有概率估计中演绎出来。这对概率陈述本身是否可有存在假说的问题是有启发的。

一切（假说性的）概率估计蕴含着这样的推测：所说的经验序列几乎是似机遇和随机的。这就是说，它蕴含着概率计算公理的（近似的）可应用性，以及真理性。所以，我们的问题就是这些公理是否代表我所说的“存在假说”的问题。

如果我们检查一下第64节中提出的两个要求，那么我们发现随机性要求实际上具有存在假说的形式。另一方面，惟一性要求则没有这种形式；它不可能有这种形式，因为这种形式的陈述“只有一个……（There is only one……）”必然具有全称陈述的形式。（可译为“至多一个……”或“所有……是同一的”。）

在这里我的论点是，正是概率估计的（可称之为的）“存在成份”，因而正是随机性的要求，概率估计和基础陈述之间才建立起一种逻辑关系。因此，惟一性的要求，作为全称陈述，没有任何外延的推断（extensional consequences）。具有所要求性质的p的值存在这一点确定能够在外延上得到“确证”——虽然只是暂时地；但是只存在一个这样的值这一点则不能。这后一个全称的陈述可能在外延上有意义，仅当基础陈述能够同它发生矛盾时；这就是说，仅当基础陈述能够肯定存在的值不止这一个时。由于它们不能够（因为我们记得不可证伪性与二项式有密切关系）做到这一点，惟一性的要求必然在外延上是没有意义的。

这就是为什么如果我们从系统中消去惟一性要求，概率估计和基础陈述以及前者的分级“可确证性”之的分级之间所有的逻辑关系不受影响的缘故。在这样做时，我们能够给予系统以纯粹存在假说的形式。但是我们因此不得不放弃概率估计的惟一性，并且因而（就惟一性而言）获得某种不同于通常概率计算的东西。

所以惟一性的要求显然不是多余的。那么它的逻辑功能是什么？

虽然随机性要求有助于确立概率陈述和基础陈述之间的某种关系，惟一性要求调节着各种概率陈述本身之间的关系。没有惟一性要求，作为存在假说的某些陈述，可以从其他陈述中推导出来，但是它们决不可能彼此矛盾。只有惟一性的要求才保证，概率陈述能彼此矛盾；因为根据这个要求它们获得其成分为一个全称陈述和一个存在假说的合取形式；并且这种形式的陈述能够彼此处于同样基本的逻辑关系中（同义、可推导性、相容性和不相容性），正如任何理论——例如一个可证伪的理论——的“正常的”全称陈述那样。

如果我们现在考虑收敛公理，那么我们发现，在它具有一种不可证伪的全称陈述的形式这一点上它类似惟一性要求。但是收敛公理要求的比惟一性要求的更多。然而这种附加要求也不可能有任何外延上的意义；此外，它没有逻辑或形式的意义，而只有内包上的意义：它要求排除所有没有频率极限的用内包定义的（即数学的）序列。但是从应用观点看，这种排除证明甚至在内包上也没有意义，因为在应用概率论中我们当然不涉及数学序列本身，而只涉及经验序列的假说性估计。所以排除没有频率极限的序列，只能用来告诫我们不要把那些经验序列着作为似机遇或随机的，对于那些经验序列我们假定它们没有频率极限。但是对这种告诫，我们能够采取何种可能的行动？鉴于这种告诫，我们应该容许或避免哪类关于经验序列可能收敛或发散的考虑或推测，保证收敛标准同发散标准一样可应用于这些序列？一旦摆脱了收敛公理，所有这些尴尬的问题也就消失了。

因此我们的逻辑分析使系统各部分的要求的形式和功能都一目了然，并且表明反对随机性公理和支持惟一性要求的理由是什么。同时可判定性问题似乎变得越来越重要。并且虽然我们不一定称我们的要求（或公理）“无意义”，看来我们被迫把它们描述为非经验的。但是概率陈述的这种描述——不管我们用什么话来表达它——是否同我们研究的主要思想相矛盾呢？

67．思辨形而上学的概率系统

概率陈述在物理学中最重要的用处是这样：某些物理学规律性或可观察的物理效应被解释为“宏观定律”；也就是说，它们被解释或说明为大数现象，或假说性的、不能直接观察的“微观事件”的可观察结果。宏观定律用下列方法从概率估计中演绎出来：我们证明，与所说的观察到的规律性一致的观察结果，应该期望其概率十分接近于1，即其概率与1的离差为一个能达到按我们选取的那样小的量。当我们已证明这一点时，那么我们就说，我们已经用我们的概率估计把所说的可观察效应“解释”为一个宏观效应。

但是如果我们以这种方法使用概率估计来“解释”可观察的规律性而不采取特定的预防措施，那么我们会马上陷入某些思辨，根据一般的用法，完全可以把它们描述为思辨形而上学的典型。

因为概率陈述是不可证伪的，以这种方法用概率估计“解释”我们喜欢的任何规律性必定总是可能的。以万有引力定律为例。我们可以下列方法设想出一些假说性的概率估计来“解释”这个定律。我们选择某类事件作为基本事件或原子事件；例如某一小粒子的运动。我们也选择某方面作为这些事件的主要性质；例如粒子运动的方向和速度。于是我们假定这些事件显现出似机遇的分布。最后我们计算出所有的粒子在某一有限的空间区域内，在某一有限的时期内——某一“宇宙期”——将以规定的精确性（附带地说，以万有引力定律要求的方式）运动的概率。计算出的概率当然将十分小；实际上小得微不足道，但是仍然不等于零。因此我们可以提出这样的问题：这个序列的某个n－节段得有多长，或换言之，整个过程必须假定有多长，我们才可期望这种宇宙期出现的概率接近1（或与1的离差不超过某一任意小的值E），在这宇宙期内，作为偶发事件积累的结果，我们的观察将会完全与万有引力定律一致。对于任我们选取的接近于1的任何值，我们获得一个确定的、虽然极端大的有限数。于是我们可以说：如果我们假定序列的节段有这十分大的长度——或换言之，“世界”延续得足够长——那么我们的随机性假定使我们能够期望出现一个方有引力定律似乎也适用的宇宙期，虽然“实际上”除了随机发散外什么也没有出现。借助某种随机性假定，这类“解释”可应用于我们选取的任何规律性。事实上，我们可用这个方式把我们整个世界，以及它的所有被观察到的规律性，“解释”成随机混沌中的一个阶段——纯粹偶然巧合的一种积累。

我认为很清楚，这类思辨是“形而上学的”，它们对科学没有任何意义。并且同样清楚的是：这个事实同它们的不可证伪性——我们能在任何时候和任何条件容许它们这个事实是有联系的。因此我的划界标准似乎同“形而上学的”一词的一般用法是完全一致的。

所以涉及概率的理论，如果它们不加特定预防措施而加以应用，就不应被认为是科学的。如果它们应在经验科学的实践中有用处，我们就必须排除它们的形而上学用法。

68．物理学中的概率

可判定性困难的问题只是方法论的，不是物理学的。如果要求提出一个实践上可应用的概率概念，物理学家也许会提供某种物理学的概率定义，其思路如下：有些实验，即使在受控条件下进行也得出不同的结果。在某些这类实验——“似机遇的”实验，例如用硬币做掷猜——的情况下，经常重复导致具有相对频率的结果，进一步重复，这些相对频率越来越逼近某个固定值，我们可称之为所说事件的概率。这个值是“……可用经验通过一长系列实验确定到任何逼近度”；顺便说，这说明为什么证伪一个假说性的概率估计是可能的。

数学家和逻辑学家会对根据这些思路下的定义提出异议，尤其是下列异议：

（1）这个定义与概率计算并不一致，因为根据Bernoulli定理，只有几乎所有非常长的节段才是统计学上稳定的，即其行为仿佛是收敛的。由于这个理由，概率不能用这稳定性，即用拟收敛行为来定义。因为“几乎所有”一词——它应该出现在定义中——本身只是“十分可几的”一个同义语。因此这定义是循环的；这个事实容易通过去掉“几乎”一词隐避起来（但不能取消）。这就是物理学家的定义所做的事；所以这是不能接受的。

（2）什么时候应说一系列实验是“长的”？不提供一个应称之为“长的”标准，我们不能知道我们何时，或是否已达到逼近这个概率。

（3）我们如何能知道所需要的逼近实际上已达到？

虽然我认为这些异议是合理的，然而我认为我们能够保留物理学家的定义。我将通过上节概述的论据来支持这种见解。这些论据表明当概率假说被允许无限应用时，它们就失去所有信息内容。物理学家决不会以这种方式使用它们。我将遵循物理学家的范例，不允许概率假说的无限应用：我建议我们作为方法论的决定决不把物理效应，即可复制的规律性，解释为偶发事件的累积。这个决定自然修改了概率概念：它使这个概念变窄了。因此异议（1）并不影响我的观点，因为我根本不主张概率的物理概念和数学概念是同一的；反之，我否认这种同一性。但是代替（1），出现了一个新的异议。

（1’）什么时候我们能谈到“累积的偶发事件”？大概在概率很小的情况下。但是什么时候一个概率“小”？我们可以承认的是，我刚提出的建议排除了使用通过改变数学问题的提法，从小概率中制造任意大概率的方法（前节已讨论）。但是为了执行所建议的决定，我们得知道我们应把什么看作是小的。

下面几页将表明所建议的方法论规则与物理学家的定义是一致的，问题（1’）、（2）和（3）提出的异议能借助它得到解答。开始，我脑子里只有一个典型的概率计算应用例子：我脑子里有一些可复制的宏观效应例子，这些效应能够借助精确的（宏观）定律——如气体压力——加以描述，并且我们把这些效应解释或说明为由于微观过程，如分子碰撞大量积累所致。其他典型例子（如统计涨落或似机遇的个别过程的统计）可没有很多困难地还原为这个例子。）＝ε。根据Bernoulli定理，随n增加至无限，ε趋向零。

我们假定ε“小”到可以不计（在这个假定中有“小”是什么意思的问题（1’），马上就要讨论它）。显然，△p应解释为间距，测量在此间距内逼近p值。由此我们看到三个量：ε，n，和△p与三个问题（1’），（2）和（3）相应。△p或ε可任意选取，它限制了我们选取ε和n的任意性。由于我们的任务是演绎出确切的宏观效应p（±φ），我们不去假定δ大于φ。就可复制效应p而言，如果我们进行的演绎满足δ≤φ

，它就是令人满意的。（这里φ是给定的，由于它是由测量技术来确定的。）现在让我们选取δ使它（近似地）等于φ。于是我们就将问题（3）还原为两个其他问题（1’）和（2）。

通过选取δ（即△P）我们已在n和ε之间确立了一种关系，因为对于每一个n，现在都有一个ε值惟一地与之相应。因此（2），即什么时候n有足够长这个问题已还原为（1’），即什么时候ε小这个问题（反之亦然）。

但是这意味着只要我们能够判定ε的哪一个特定的值可被认为“小到微不足道”而不计，所有三个问题都可得到回答。现在我们的方法论规则等于是决定忽略不计小的ε值；但是我们不准备老是去讨论某个确定的ε值。

如果我们把问题交给物理学家，即如果我们问他，他准备不计什么样的ε——0．001或是0．000001，或是……？他大概会回答E根本不使他感到兴趣；他选取的不是ε而是n；他已这样选取n，使n与△P之间的相关大大独立于我们愿意造成的ε值的任何变化。

由于Bernoulli分布的数学特点，物理学家的回答是有道理的：对每一个n，确定ε和△p之间的函数关系是可能的。对这个函数作一检查就可表明，对于一切（“大的”）n都存在一个表示特征的△p值，使得在这个值的邻域，完全不受ε的变化的影响。这种无影响性随n的增加而增加。如果我们取我们在极端大数现象情况下应该期望的一个数量级的n，那么在它的特征值的领域△p完全不受ε的变化的影响，以致即使ε的数量级改变，△p也几乎根本没有变化。现在物理学家将把很小的值附加于规定得更明确的△p界限上。并且在研究所限的典型的大数现象的情况下，我们记得，能够使△p与精确度为±φ（取决于我们的测量技术）的间距相对应；并且这个间距没有明确的界限，只有我在第37节所说的“缩聚界限”（condensation bound）。所以当△p在它的特征值（我们能够确定这个值）的领域的无影响性至少有如此之大，甚至ε数量级的改变引起的△p值仅在±φ的缩聚界限内涨落时，我们才称n是大的。（如果n→∞，则△P变得完全不受影响）。但是如果是如此，我们就无需再操心ε的精确测定：即使我们没有精确地说出必须把什么看作是“小的”，决定置小的ε于不顾也就够了。这等于是决定利用上述不受ε的变化的影响的△p的特征值。

必须把极度不可几性置于不顾的规则（只有根据上述才成为十分明确的一条规则）与要求科学的客观性是一致的。因为对我们的规则的明显反对显然是，最大的不可几性始终是一种概率，不管这种概率有多么小，因此甚至最不可几的过程——即我们建议置之不顾的过程——终有一天会发生。但是这个反对意见可通过恢复可复制的物理效应概念来予以解决，这个概念与客观性概念有密切联系（参阅第8节）。我不否认不可几事件会发生的可能性。例如我并不断言在小量气体中的分子在一短暂时间内不会自发地聚集成为这容量的一部分，或者在大量气体中压力的自发涨落永远不会发生。我断言的是，这些偶发事件不是物理效应，因为根据它们的极度不可几性，它们不能随意复制。即使一个物理学家碰巧观察到这种过程，他也完全不可能去复制它，因此永远不能判定在这种情况下实际发生了什么，他是否有可能犯了一次观察上的错误。然而，如果我们发现一些可复制的离差，这些离差不同于按上述方式从概率估计中演绎出的宏观效应，那么我们必须假定概率估计已被证伪。

这些考虑可帮助我们理解Eddington的下述看法，他区别了两类物理定律：“某些事情永远不会在物理世界中发生，因为它们是不可能的；另一些则因为它们也是不可几的。禁止前者的定律是一级定律；禁止后者的是二级定律”。虽然这种表述也许并不能摆脱批评（我宁愿不去对极度不可几的事情是否发生作出不可检验的断言），但它与物理学家对概率论的应用完全一致。

可应用概率论的其他场合，如统计涨落，或似机遇个别事件的统计，可还原为我们一直在讨论的场合，即可精确测定的宏观效应场合。我理解的统计涨落就是Brown运动那样的现象。在这里测量精确度的间距（±o）小于对效应起促进作用的微观事件数n特有的间距△p；因而可期望不同于p的可测定离差是高度不可几的。发生这些离差这一事实是可检验的，因为涨落本身成为一种可复制效应；并且我以前的论证可应用于这种效应：涨落超过某一大小（超过某个间距△p），根据我的方法论要求，必定不是可复制的，朝同一方向涨落的长序列也是如此，如此等等。相应的论证也会适用于似机遇个别事件的统计。

我现在总结我的关于可判定性问题的论证。

我们的问题：概率假说——我们已看到它们是不可证伪的——如何能在经验科学中起自然律的作用？我们的回答是：概率陈述，就它们是不可证伪的而言，是形而上学的和没有经验意义的；就利用它们作为经验陈述而言，利用它们作可证伪的陈述。

但是这种回答提出了另一个问题：概率陈述——是不可证伪的——可用作可证伪陈述，怎么可能呢？（它们能如此使用这个事实是毋庸置疑的：物理学家知道得十分清楚，什么时候认为概率假定已被证伪。）我们发现这个问题有两个方面。一方面，我们必须根据其逻辑形式使利用概率陈述的可能性成为可理解的，另一方面，我们必须分析支配它们用作可证伪陈述的原则。

根据第66节，公认的基础陈述可以多少令人满意地与某种所提出的概率估计一致；它们可更好或稍差一些代表概率序列的一个典型节段。这为某种方法论规则的应用提供了机会，例如要求基础陈述和概率估计之间的一致应该符合某种最低限度标准这一规则。因此规则可引出某种任意的思路，并且规定只有适当代表性的节段（或适当“公平的样本”）才得以“允许”，而不典型的或没有代表性的节段是被禁止的。

对这种意见作更仔细的分析向我们表明，什么被允许和什么被禁止之间的分界线的划定并不一定像起初想象的那样任意。尤其是无需“宽容地”划定这条分界线。因为有可能用这种方式形成这条规则，使什么被允许和什么被禁止之间的分界线，正如其他定律的情况一样，由我们的测量能达到的精确度来决定。

我们根据划界标准提出的方法论规则，不禁止不典型节段的出现；它也不禁止离差（当然，对于概率序列是不典型的）的重复出现。这条规则禁止的是系统离差的出现可预测和可复制，例如朝特定方向的离差，或肯定是不典型的节段的出现。因此它要求的不单是粗略的一致，而是对于可复制和可检验的一切，简言之，对于所有的可复制效应可能是最佳的一致。

69．定律和机遇

人们有时听说，行星的运动服从严格的定律，而一粒骰子的掷下是碰运气，或受机遇支配。我认为区别在于这个事实：迄今我们已能成功地预测行星的运动，但还不能预测掷骰子的个别结果。

为了演绎出预见，人们需要定律和初始条件；如果没有合适的定律或不能确定初始条件，科学的预见方法就垮台。掷骰子时我们所缺乏的显然是初始条件的充分知识。有了初始条件的足够精确的测定，也就有可能在这种情况下作出预见；但是选定正确掷骰子的规则（摇摇骰子盒）是为了防止我们测量初始条件。游戏规则以及确定某一随机序列的各种事件必将发生的那些条件的其他规则，我称之为“框架条件”。它们由这样一些要求组成，如骰子应该是“纯的”（由同质物质组成），应该把它们好好地摇摇等等。

有一些其他情况，预见是不成功的。也许迄今还不可能提出合适的定律；也许发现一个定律的所有尝试都已失败，并且所有的预见也被证伪。在这些情况下我们可能对究竟是否会找到一个满意的定律已失望。（但是大概我们不会放弃尝试，除非问题已使我们不大感兴趣——例如如果我们满足于频率预测，就是这种情况。）然而，无论如何，我们不能定论地说，在某个特定的领域没有定律。（这是证实不可能性的一个结果。）这就是说，我的观点使机遇概念成为主观的。当我们的知识不足以作出预见时我就说“机遇”；正如掷骰子时，我们说“机遇”，因为我们对初始条件没有知识。（可以设想，仪器设备精良的物理学家，能观测其他人预测不到的一次掷骰子的结果。）

与这种主观观点相反，人们有时支持一种客观的观点。就这种观点利用事件本身是指决定的还是不决定的这种形而上学观念而言，我将不在这里对这种观点作进一步的考察（参阅第71和78节）。如果我们的预见获得成功，我们可以谈到“定律”；否则我们对定律或不规则性的存在或不存在不可能有任何知识。

也许比这个形而上学观念更值得考虑的是下面的观点。可以说，当我们的概率估计得到验证时，我们遇到客观意义上的“机遇”；正如当我们遇到因果规律性时一样。

蕴涵在这观点中的机遇定义可能不全是无用的，但是应该有力强调，如此定义的概念并不与定律概念相对立：正是由于这个理由我称概念序列是似机遇的。一般地说，一个实验结果的序列是似机遇的，如果定义序列的框架条件不同于初始条件的话；当在同一框架条件下进行的个别实验，在不同的初始条件下进行时，就会产生不同的结果。其元素根本不可预测的似机遇序列是否存在，我不知道。我们甚至不能从某个序列是似机遇的这个事实，推论出它的元素是不可预测的，还是或者推论出它们“由于”在主观的知识不足意义上的“机遇”所致；我们尤其不能从这个事实推论出定律不存在的“客观”事实。

不仅不可能从序列的似机遇性质中推论出任何与定律一致的东西，或者在另一方面与个别事件一致的东西；甚至不可能从概率估计的验证推论出序列本身是完全不规则的。因为我们知道似机遇序列是存在的，这些序列是根据数学规则建构的。一个序列具有Bernoulli分布这个事实不是不存在定律的征候，与“根据定义”不存在定律完全不是一回事。我们在概率预测成功中看到的不过是在序列结构中不存在简单定律的征候（参阅第43和48节）——与构成序列的事件相反。不受后效约束的假定相当于这样的假说：这种简单的定律是不可发现的，这个假定得到验证，但这就是一切。

70．从微观定律推演宏观定律的可能性

有一种学说几乎已成为偏见，虽然它在最近已受到严厉的批评——所有可观察的事件必须解释为宏观事件，即解释为一些微观事件的平均数或累计或总和的学说（这个学说有点类似某些形式的唯物主义）。像其他这种学说一样，这似是某一方法论规则的形而上学具体化，而这条规则本身是完全无可非议的。我指的是这条规则：我们应该看看我们是否能用上述类型的解释性假说简化、概括或统一我们的理论。在评论这些尝试的成功时，认为关于微观事件的非统计假说及其相互作用定律就能足以说明宏观事件，这是个错误。除此以外，我们应该需要假说性的频率估计，因为从统计前提中只能推导出统计结论。这些频率估计总是独立的假说，当我们从事研究与微观事件有关的定律时，这些假说的确不时出现在我们脑中，但是它们决不能从这些定律中推导出来。频率估计形成一类特殊的假说：一般地说，它们是与规律性有关的禁律。Von Mises对这一点说得十分清楚：“没有统计学性质的补充假定，在气体动力理论中甚至最微不足道的定理也不是单从经典物理学中推导出来的”。

统计学估计或频率陈述决不能从“决定论”性质的定律中推导出来，理由是为了从这些定律中演绎出任何预见，需要初始条件。在初始条件那里，关于初始条件统计学分布的假定——也就是说特定的统计学假定——进入了演绎过程，统计学定律就是通过演绎从决定论性质或“精确”性质的微观假定中获得的。

理论物理学的频率假定在一定程度上是等机遇假说，这是一个令人惊异的事实，但这无论如何并不是意味着它们是“自明的”，或先验地正确的。它们远非如此，这一点从经典统计学、Bose－Einstein统计学和Fermi－Dirac统计学之间的广泛差异中就可看到。这些表明特定的假定如何可与一个等机遇的假说结合起来，在每一种情况下都导致参考序列的主要性质（假定其分布是均等的）的不同定义。

下面的例子也许可证明这个事实：甚至当我们想摆脱频率假定时，它们也是必不可少的。

想象一个瀑布。我们可辨认某种奇特的规律性：组成瀑布的水流的大小是变化的；不时地飞溅从主流中甩出来；然而在贯穿所有这些变化中，某种规律性明显可见，它强烈提示有一种统计学效应。尽管有一些尚未解诀的液体动力学问题（与涡流的形成有关等等），我们在原则上能够以任何所需程度的精确性，预测任何量水——比方说一组分子——的路线，如果给定足够精确的初始条件的话。因此我们可以假定，有可能预言远在瀑布之上的任何分子，在哪一点上它将越过边缘，到达底部等等。这样原则上可计算出任何数量分子的路线；并且给定充分的初始条件，我们就能在原则上演绎出瀑布的任何一种个别的统计学涨落。但是只能是这种或那种个别的涨落的，而不是我们已描述过的反复发生的统计学规律性，一般统计学分布就更不行了。为了说明这些，我们需要统计学估计——至少假定某些初始条件对于许多不同组的粒子（等于一个全称陈述）将一次又一次地反复出现。我们获得一个统计结果，当且仅当我们作出这些特定的统计学假定——例如关于反复出现的初始条件频率分布的假定——时。

71．形式上单称的概率陈述

我称一个概率陈述为“形式上单称的”，当它把某一概率赋予某个单一偶发事件或某类偶发事件的单个元素时；例如，“用这个骰子掷下一次得5的概率是1／6”或“（用这个骰子）掷任何一次得5的概率是1／6”。从频率理论观点看，一般认为这些陈述是不十分正确的表述，因为不能把概率归之于单个偶发事件，而只能归之于偶发事件或事件有限序列。然而借助客观概率或相对频率概念用适当定义的形式上单称的概率把这些陈述解释为正确的陈述是容易的。我用“Pαk（β）”表示这形式上单称的概率：作为序列α的一个元素，某一偶发事件k有性质β——符号为kεα——于是我定义形式上单称的概率如下；

Pαk（β）＝αF（β）（kεα）（定义）

这可用文字表达如下：事件k具有性质β——设k为序列α的一个元素——的形式上单称的概率，根据定义等于性质β在参考序列α内的概率。

这个简单的几乎一目了然的定义证明令人惊异地有用。它甚至可帮助我们澄清现代量予理论的某些复杂问题（参阅第75－76节）。

正如定义所表明的，如果一个形式上单称的概率陈述没有明确说出一个参考类，它就是不完全的。但是虽然α常常没有明确提及，在这些情况下我们往往知道α是什么意思，因此上述第一个例子没有具体规定任何参考序列α，但是十分清楚它与掷真的骰子的所有序列有关。

在许多情况下，对一个事件K可以有若干不同的参考序列。在这些情况下非常明显，对同一事件可以作出不同的形式上单称的概率陈述。因此一个个别的人K将在一定时期内死亡这种概率可根据我们认为他是他的年龄组的一员，还是他的职业组的一员等等来假定十分不同的值。对于应该从若干可能的参考类中选定哪一个，不可能制定一个一般规则。（最窄的参考类往往最合适，假如它多到足以使概率陈述立足于合理的统计外推，并且得到足够量验证证据的支持的话。）

Pk（β）＝0。告诉给我们关于单个偶发事件实际结局的陈述——不是关于某个频率，而是关于“kεφ”形式的陈述——不能改变这些偶发事件的概率；然而，它们可提示我们选取另一个参考类。

形式上单称的概率陈述概念提供了一种通向主观理论，从而也就通向域（range）理论的桥梁，正如下节将表明的那样。因为我们会同意把形式上全称的概率解释为“理性信仰程度”（依照Keynes）——假如我们允许我们的“理性信仰”受某一客观的频率陈述指导的话。因此这种陈述还是我们的信仰所依靠的信息。换言之，也可能有这样的事：我们除了知道某个事件属于某一参考类，某个概率估计在其中受到了成功的检验外，对它一无所知。这个信息并不能使我们预见这个事件的性质将是什么；但是它能使我们表达借助某种形式上单称的概率陈述知道它的一切，这种陈述看起来像关于所谈论的特定事件的不确定预见。

因此，我不反对关于单个事件概率陈述的主观解释，即解释为不确定的预见——可以说，承认我们对所谈论的特定事件缺乏知识（的确，关于这个事件什么结论也不能从某个频率陈述中得出）。那就是说，我不反对概率陈述的主观解释，只要我们明确承认客观频率陈述是基本的，因为只有它们是可用经验检验的。然而，我反对把这些形式上单称的概率陈述——这些不确定预见——解释为关于客观事态的陈述，但不反对解释为客观统计事态的陈述。我脑子里有这样一种观点：关于掷骰子概率为1／6的一个陈述不仅是承认我们不知道任何确定的事情（主观理论），而且是关于掷下一次的断言——断言它的结果客观上既是不确定的又是非决定的——是关于某种仍悬而未决的事情的断言。我认为所有作出这种客观解释（除了别人外，Jeans作过充分的讨论）的尝试都是错误的。不管这些解释可能造成一些什么样的非决定论气氛，它们全都包含这样的形而上学思想：不仅我们能演绎出和检验预见，并且除此之外自然界或多或少是“决定的”（或“非决定的”）；因此预见的成败不应用它们由之演绎出来的定律来解释，而是首先由这样一个事实来解释：自然界实际上是（或不是）根据这些定律组成的。

72．域理论

我在第34节中说，一个可证伪程度比另一陈述更高的陈述可被描述为逻辑上更不可几的陈述；而不那么可证协的陈述则是逻辑上更可几的陈述。逻辑上不那么可几的陈述衍推出逻辑上更可几的陈述。在逻辑概率概念和客观的或形式上单称的数值概率概念之间有密切关系。某些概率哲学家（Bolzano，von Kries，Waismann）曾试图把概率计算立足于逻辑域，因此立足于一个与逻辑概率一致的概念（参阅第37节）；并且他们在这样做时，也试图弄清逻辑概率与数值概率之间的密切关系。

Waismann曾建议用与不同陈述相应的相对频率测定它们逻辑域之间的相互关系程度（可以说它们的比值），从而把频率看作为决定一个测定域的系统的东西。我认为在此基础上建立概率论是可行的。的确我们可以说，这个计划就是使相对频率同某些“不确定的预见”相关起来——正如当我们定义形式上的单称概率陈述时在前一节已经做的一样。

然而必须说，仅当一个频率理论已经建构时，这种定义概率的方法才是可行的。否则人们就得问在定义测定系统时使用的频率本身又是如何定义的。然而，如果我们手中已经有某个频率理论，那么引入域理论实际上就成为多余的。但是尽管有这种异议，我认为Waismann建议的可行性是重要的。发现一个更全面的理论能够填补解决这个问题的各种尝试之间，尤其是在主观和客观解释之间的鸿沟——起初似乎是不可填补的。然而Waismann的建议要求作一点修改。他的域比值概念（参阅第48节注）不仅要求域能借助它们的子类关系（或它们的衍推关系）加以比较；而且它更一般地要求使甚至只是部分交迭的域（不可比较的陈述的域）也能够成为可以比较的。然而这后一个假定有相当的困难，它是多余的。有可能表明，在有关的情况下（为随机情况）子类的比较和频率的比较必定导致类似的结果。这证明为了测定域而把频率与域相关起来的方法是对的。我们在这样做时，就使所谈论的陈述（按子类方法是不可比较的）成为可以比较的。我将粗略地表明所描述的方法如何可得到证明。

B成立，则：

（K）〔Fsb（kεγ）≥Fsb（kεβ）〕（参阅第33节）

因此逻辑概率或陈述（kεγ）的域必须小于或等于（kεβ）的域。它将是相等的，仅当有一个参考类α（它可以是全称类）时，对于这个参考类下列规则成立，这个规则可以说具有“自然律”的形式：

（x）{[xε（α．β）→（xεγ）]}

α．β

如果这种“自然律”不成立，因此我们可假定在这个方面有随机性，那么不等性就成立。但是在这个情况下我们就得到下式，假如α是可数的，并可承认为一个参考序列：

αF（γ）＜αF（β）

这就是说，在随意性情况下，域的比较必须导致同样的不等性，正如相对频率的比较一样。因此，如果我们有随机性，我们就可把相对频率同域相关起来，以使域成为可测量的。但是这正是我们在第71节中当我们定义形式上单称的概率陈述时所做的（虽然是间接地）。的确，我们可以从这些假定中直接推论出

αPk（γ）＜αPk（β）

这样我们就回到了我们的出发点，概率解释问题。并且我们现在发现，客观和主观理论之间的冲突，初看似乎是如此难办，可用某种一目了然的形式上单称的概率的定义来完全消除。

第九章对量子论的若干意见

我们对概率论的分析，已使我们掌握一些工具，我们现在可通过应用它们于现代科学一个主要问题来检验它们；并且我将借它们之助试图分析和澄清现代量子论若干更为模糊不清的论点。

我用哲学或逻辑方法解决物理学中心问题之一的有点大胆的尝试，必定会引起物理学家的怀疑。我承认他的怀疑是正当的，他的怀疑是有充分根据的，然而我希望我也许能够克服他们。同时，值得注意的是在每门科学分支中，成堆的问题主要是逻辑的。量子物理学家一直渴望参与认识论讨论，这是事实。这提示他们本身感到量子论中某些仍未解决的问题的解法不得不在逻辑与物理学之间的无人岛上寻找。

我将开始就预先记下将从我的分析中得出的主要结论。

（1）量子论中有一些数学公式被Heisenberg用他的测不准原理加以解释；即关于由于我们在测量时达到的精确性的限制所致的测不准域的陈述。我将试图证明，这些公式应解释为形式上单称的概率陈述（参阅第71节）；这意味着它们本身必须用统计学来加以解释。对这个公式作如此解释就是断言：在统计学上“分散”或“方差”或“离散”的某些域之间有一定的关系（它们在这里被称为“统计学的离散关系”）。

（2）我将要试图证明，比测不准原理允许的精确性程度更高的测量与量子论的公式系统或及其统计学解释并不是不相容的。因此如果这样一种精确度终究成为可能，量子论不一定被反驳。

（3）所以Heisenberg所断言的可达到的精确性极限的存在，并不是从理论公式中演绎出来的逻辑推断，更确切地说，它是一个孤立的或附加的假定。

（4）此外，正如我将试图证明的那样，如果量子论的公式在统计学上得到解释，那么Heisenberg的这个假定实际上与这些公式是矛盾的。因为不仅更精确的测量与量子论相容，而且甚至有可能描述表明更确切的测定有可能的想象实验。在我看来，正是这个矛盾引起了所有那些困难，现代量子物理学的令人赞叹的结构就受这些困难困扰；以致Thirring谈到量子论时说，它“留下了一个难解的秘密给它的创始人，这是他们自己承认的”。

下面所述也许可描述为对量子论基础的研究。在这个研究中，我将避免一切数学论证和一切数学公式，除一个例外。这是可能的，因为我将不对量子论数学公式系统的正确性提出疑问，我将只关心归功于Bohn的物理解释的逻辑推断。

至于“因果性”的争论，我提出不同于现在如此流行的非决定论形而上学的意见。非决定论形而上学与直到最近才在物理学家中风行的决定论形而上学的区别，与其说在于它非常清晰，不如说它极无成果。

在清晰性方面，我的批判常常是严厉的。所以不妨可以在这里说我认为现代量子论创始人的成就是整个科学史上最伟大的成就之一。

73．Heisenberg的纲领和测不准关系

当然尝试在新的基础上建立原子理论时，Heisenberg从一个形而上学纲领开始：摆脱“不可观察的东西”，即摆脱不能作实验观察的量值（magnitudes）；人们可以说是摆脱形而上学因素。这些不可观察的量值发生在先于Heisenberg的理论的Bohr理论中：可被实验观察的任何东西与电子的轨道，甚至与电子旋转的频率均不一致（因为可被观察为光谱线的发射频率不可能就是电子旋转的频率）。Heisenberg希望通过排除这些不可观察的量值，他能够克服Bohr理论的缺点。

这个情况与Einstein试图重新解释Lorentz－Fitzgerald假说时面临的情况有一定的相似之处。这个假说试图利用像对Lorentz的不动的以太作相对运动这样不可观察的量值，即无法用实验检验的量值，来解释Michelson和Morley实验的阴性结果。不管是在这种情况还是在Bohr理论的情况下，需要改革的理论都说明了某些可观察的自然过程；但是它们都用了令人不满意的假定：存在着一些物理事件和物理上可定义的量值，而自然界使它们永远不能接受观察检验，从而成功地把它们隐藏起来不让我们知道。

Einstein表明了如何能消除包含在Lorentz理论中的不可观察的事件。人们可能会说，Heisenberg理论，至少它的数学内容也是如此。然而，似乎仍然有改进的余地。即使从Heisenberg自己对他理论所作的解释的观点看，并不是说他的纲领已经完全实现了。自然界仍然能够非常狡黠地把包含在理论中的某些量值隐藏起来不让我们知道。

这种事态与Heisenberg所阐明的所谓测不准原理有联系。也许这个原理可解释如下。一切物理测量都包含着被测量物体和测量仪器（它也可是观察者本身）之间的能量交换。例如一束光线照射到物体上，物体反射的一部分色散的光可被测量仪器吸收。任何这种能量交换将会改变物体的状态，物体在被测量以后将处于一种与以前不同的状态之中。因此可以说，测量产生刚被测量过程本身破坏的那种状态的知识。测量过程干扰被测量物体，在宏观物体情况下可以忽略不计，但在原子物体的情况下则不行；因为这些物体可受到例如光辐射十分强烈的影响。因此不可能在一个原子已被测量后直接从测量结果中推论出它的状态。所以测量不能作为预测的基础。大家承认，借助新的测量总有可能在前次测量以后确定物体的状态，但是系统却因而又以不可预测的方式受到干扰。并且大家承认，总有可能以这样的方式安排我们的实验，使要测量的状态的某些特征——例如粒子的动量——不受扰动。但是，这只有以更严重地干扰要测量的状态的某些示性量值（在这种情况下是粒子的位置）为代价，才有可能做到这一点。如果两个量值以这种方式相关，那么下列定理就适用于它们；它们不可能同时精确加以测量，尽管每一个都可如此分别加以测量。因此如果我们增加两个测量之一的精确性——比方说动量Px，从而缩小△Px误差的域或间距——那么我们就必然会降低位置座标x测量的精确性，即扩大△x的间距。这样，根据Heisenberg的意见，可达到的最大的精确性是受测不准关系限制的。

△x.△Px≥h/4π

同样的关系也适用于其它坐标。这个公式告诉我们，两个误差域的积至少是h个数量级，h是PComnck的作用量子。从这个公式得出的结论是：这两个量值之一的完全精确的测量将不得不以另一个的完全不确定性为代价。

根据Heisenberg的测不准关系，对位置的任何测量干扰了相应的动量部分。因此原则上不可能预测一个粒子的轨迹。“在新的力学中，‘轨迹’概念没有任何确定的意义……”

但是在这里出现了另一个困难。测不准关系只应用于属于已进行测量后的粒子的（表示物理状态特性的）量值。一个电子的位置和动量直到测量那瞬间以前原则上能够以无限的精确性加以确定。这是这一事实的必然结果，即毕竟有可能前后相继地进行若干次测量操作。因此，通过把（a）位置的两次测量结果，（b）先作动量测量的位置测量结果，以及（c）后作动量测量的位置测量结果结合起来，就可借助所得数据计算出两次测量之间整个时期内精确的位置和动量坐标。（开始我们可把我们的考虑限于这个时期。）但是根据Heisenberg的意见，这些精确的计算对于预测是无用的：所以也就不可能去检验它们。之所以如此，是因为这种计算对于两次实验之间的轨迹是有效的，仅当第二次实验是第一次的直接后继者，即在它们之间没有干扰发生时。为检查两次实验之间轨迹而安排任何检验必然会干扰得如此厉害，以致使我们对确切轨迹的计算变得无效。Heisenberg谈到这些精确计算时说：“……人们是否应把任何物理实在赋予计算出的电子的过去历史，这是一个纯粹的趣味问题。”显然他通过这句话要想说的是，这些不可检验的轨迹计算，从物理学家的观点看没有任何意义。Schlick对Heisenberg这段话评论如下：“我要表示我自己与Bohr和Heisenberg两人的基本观点是完全一致的，我认为他们这些观点是无可争辩的。如果有关在原子范围内一个电子的位置的陈述是不可能证实的，那么我们不可能把任何意义赋予它；谈论在两点（在这两点观察到了某一粒子）之间该粒子的轨迹是不可能的”。（在March）Weyl和其他人那里可找到类似的评论。

然而正如我们刚才听到过的那样，用新的形式体系计算这样一种“无意义的”或形而上学的轨迹是可能的。并且这表明Heisenberg不能把他的纲领贯彻到底。因为这种事态只允许有两种解释。第一种解释是，粒子有一个确切的位置和确切的动量（因此也有确切的轨迹），但是我们不可能同时测量它们二者。如果是如此，那么自然界仍然倾向于隐藏某些物理量值不让我们的眼睛看见；隐藏的实际上既不是粒子的位置，也不是它的动量，而是这两个量值的组合，“位置加动量”或“轨迹”。这种解释认为测不准原理是我们知识的一种限制；因此它是主观的，另一可能的解释是客观的解释，它断言把某种界限截然分明的“位置加动量”或“轨迹”赋予粒子是不允许的或不正确的，或是形而上学的：它根本没有“轨迹”，只有结合着不确切动量的确切位置，或结合着不确切位置的确切动量。但是如果我们接受这种解释，那么理论的形式体系又包含形而上学的因素：因为正如我们已看过的那样，在用观察检验粒子原则上是不可能的那些时间内，粒子的“轨迹”或“位置加动量”是可精确计算的。

测不准关系的支持者如何在主观看法和客观看法之间摇摆，是看得很清楚的。例如，正如我们已看到的，Schlick在支持客观观点之后立刻写道：“关于自然事件本身，说什么、‘模糊性’或‘不准确性’，是不可能有什么意义的。这类词只能用于我们自己的思想（尤其是如果我们不知道哪些陈述……是真的）”：这种评论显然反对的正是那个客观解释，这种解释认为不是我们的知识，而是粒子的动量，可以说由于使它的位置得到精确测量而被弄得“模糊”。其他许多作者也显示了类似的动摇。但是不管人们决定支持客观观点还是主观观点，事实仍然是：

Heisenberg的纲领并没有得到贯彻，他在他给自己布置的把一切形而上学因素驱逐出原子论的任务中并未取得成功。所以，Heisenberg试图把两个对立的解释融合在一起并没有获得任何成就，他说“……在这个意义上的‘客观’物理学，即把世界截然划分为客体和主体实际上已不再是可能的了。”Heisenberg迄今尚未完成他给自己布置的任务：他尚未清除掉量子论中的形而上学因素。

74．量子论的统计学解释概要

Heisenberg在推导测不准关系时仿效Bohr，利用了这样一个思想：原子过程可以用“量子论的粒子图象”表示，也可以用“量子论的波图象”表示，二者表示得一样好。

这个思想是与现代量子论沿着两条不同的道路进展这个事实是有联系的。Heisenberg从经典的电子粒子理论开始，他按照量子论重新解释了这个理论：而Schradinger则从（同样经典的）de-Broglie的波理论出发：他把“波包”（Wave－packet）、即一组振荡（通过干扰这个振荡在一个小范围内互相增强，在此小范围外则彼此抑制）同每一个电子协调起来。Schrodinger后来表明，他的波动力学导致数学上与Heisenherg的粒子力学等价的结果。

粒子图象和波图象这两种根本不同的图象却是等价的，这种佯谬先由Born对这两种理论的统计学解释解决的。他证明波理论也可被看作为粒子理论；因为Schrodinger的波方程式能作这样的解释：它提供给我们在一定空间范围内发现粒子的概率。（概率是由波幅平方决定的；在波包内波互相增强，概率就大，在波包外波就消失。）

量子论应作统计学解释是由不同的问题境况方面提示的。自从Einstein提出光子（或光量子）以来，量子论的最重要的任务－－原子光谱的演绎——不得不被认为是一种统计学的工作。因为这个假说把观察到的光效应解释为大数现象，解释为由于许多光子射入所致。“原子物理学的实验方法……在经验指导下，已成为惟独与统计学问题有关。为观察到的规律性提供系统理论的量子力学在每一方面都与实验物理学的现状相一致；因为它从一开始就把自己限于统计学问题和统计学解答。

只是把它应用于原子物理学问题时，量子论才获得不同于古典物理学的结果。在把它应用于宏观过程时，它的公式产生十分近似古典力学的结果。March说：“根据量子论，如果把古典力学定律看作为统计学平均数之间关系的陈述，那么它们就是有效的”。换言之，古典的公式可演绎为宏观定律。

在某些著作中试图用这事实来说明量子论的统计学解释，即测量物理量值时所能达到的精确性，受Heisenberg测不准关系的限制。有人论证说，由于在任何原子实验中测量的这种测不准性，“……结果一般不是确定的，即如果实验在相同条件下重复若干次，可获得若干不同的结果。如果实验重复的次数很大，就会发现每一个特定的结果都是在总次数中确定的几次获得的，因此人们可以说，在从事实验的任何时候结果的获得有一个确定的概率”。（Dirac）March也就测不准关系写道：“在过去和将来之间……只有概率关系；由此可清楚看出，新力学的性质必定是统计学理论的性质。”

我认为对测不准公式和量子论的统计学解释之间的关系的这种分析是不能接受的。在我看来逻辑关系正好相反。因为我们能从Schrodinger的波方程式（它是应作统计学解释的）中推导出测不准公式，但不能从测不准公式推导出前者。如果我们对这些可推导性关系给予足够的重视，那么测不准公式的解释就得修改。

75．用统计学对测不准公式作重新解释

自从Heisenberg以来，以超出他的测不准关系所允许的精确性同时测量位置和动量是与量子论矛盾的这一事实已被承认为确定的事实。人们认为，“禁止”精确测量，能够从量子论或波动力学中合乎逻辑地推导出来。根据这个观点，如果进行的实验能够得到的测量结果具有“被禁止的精确性”，就不得不认为这个理论被证伪。

我认为这个观点是错误的。大家承认，Heisenberg公式（△x·△Px≥h/4π）等等）确实是从这个理论引出的逻辑结论；但是按照Heisenberg的意思把这些公式解释为限制可达到的测量精确性的规则则不是从这个理论得出的必然结论。所以比按照Heisenberg所允许的更为精确的测量逻辑上不可能与量子论或波动力学发生矛盾。因此我要在公式（“Heisenberg公式”的简称）与把它们解释——也由Heisenberg提出的——为测不准关系（即对可达到的测量精确性加以限制的陈述）之间加以明确的区分。

当人们在从事Heisenberg公式的数学推演时，不得不使用波方程式或某个等价的假定，即能作统计学解释的假定（正如我们在前节看到的那样）。但是如果这个解释得到采纳，那么用波包描述单个粒子无疑不过是一个形式上单称的概率陈述（参阅第71节）。我们已知，波幅决定在一定地点发现这粒子的概率；并且正是这种概率陈述——涉及单个粒子（或事件）的这种陈述——我已称之为“形式上单称的”。如果人们接受量子论的统计学解释，那么人们就必然要把例如Heisenberg公式那样一些陈述（它们能从这个理论的形式上单称的概率陈述中推导出来）反过来解释为概率陈述，并且如果它们应用于单个粒子的话，又要解释为形式上单称的。所以它们也必然最终解释为统计学断言。

与“我们对粒子位置的测量越精确，我们对它的动量所能知道的越少”这种主观解释相反，我建议，应该把对测不准关系的客观解释和统计学解释作为基本的解释来接受；可表述如下。给定一个粒子的聚合体（在物理分离的意义上），选择一些粒子，它们在一定瞬间，以一定程度的精确性，具有一定的位置x，我们就会发现，它们的动量Px将展示出随机离散（random scattering）；并且因而离散的域△Px越大，我们得到的△x，即允许位置所具有的离散范围或不精确性越小，反之亦然；如果我们选择或分离出那些粒子，它们的动量Px全落在预定的范围△Px内，那么我们将发现，它们的位置在某一范围△x内随机离散，△x越大，则我们得到的△Px即允许动量所具有的离散范围或不精确性就越小。最后如果我们试图选择那些粒子既有性质△x又有△Px，那么我们就能在物理学上进行这种选择——即在物理学上分离析这些粒子——仅当这两个域都足够大以满足方程式△x·△Px≥h/4π时，对Heisenberg公式的这种客观解释把这些公式看作为断言在某些离散域之间有某种关系；如果它们用这种方式解释，我将称它们为“统计学离散关系。”

在我的统计学解释中，我迄今尚未提及测量；我仅提及物理选择。现在有必要澄清这两种概念之间的关系。

我谈到物理选择或物理离析，就是指例如我们从粒子流中筛去除了通过狭孔△x，即通过粒子的位置在△x域的一切粒子。并且在谈到属于如此被分离出的那粒子束的粒子时，我要说它们已根据它们的性质△x，被物理上或技术上选择了出来。惟有这种过程或它的结果，物理上或技术上被分离的粒子束，我才把它们描述为“物理选择”——与只是“精神的”或“想象的”选择加以区别，当我谈到已通过或将通过△p域的一切其他粒子类，即谈到一个更广泛的粒子类（它已经在物理上从这一更广泛的粒子类中被筛出）内的一个类时，我们就是作的物理选择。

现在一切物理选择当然可被看作是一种测量，并且实际上也可这样使用。如果比方说，一束粒子通过筛去或排除一切没有通过某一位置域（“地点选择”）的那些粒子而被选择出来，那么我们认为这地点选择就是位置测量，因为我们由此知道粒子已经通过一定的位置（虽然它什么时候在那里，我们有时也许不知道，或只能从其他测量中知道）。另一方面，我们必不可把一切测量都看作为一种物理选择。例如一股飞向x的单色电子束。我们用一架Geiger计数器就能记录那些到达一定位置的电子。通过对计数器的作用之间的时间间隔，我们也可以测量空间间隔；也就是说，我们测量它们在作用那瞬间以前在x方向上的位置。但是在从事这些测量时，我们并未根据它们在x方向上的位置对粒子进行物理选择。（实际上这些测量一般得到的是在x方向上位置的完全随机的分布）。

因此我们的统计学离散关系在其物理应用中得出了如下这一点。如果人们不管用什么手段试图获得一个尽可能均匀的粒子聚合体，那么这个尝试在离散关系上将碰到确定无疑的障碍。例如我们可以通过物理选择获得一个平面的单色射线——比方说等动量的电子束。但是如果我们尝试使这个电子聚合体更为均匀——也许通过排除其一部分－－以便获得不仅具有同样动量，而且已经通过了确定位置域△x的某个狭缝的电子，那么我们就必然失败。我们之失败是因为根据粒子的位置所作的任何选择就是对系统的干扰，这种干扰将使动量成分Px的离散增加，因而使离散随缝的变窄而增加（与Heisenberg公式表示的定律相一致）。反之：如果我们有一束射线，使其通过一个缝，根据位置加以选择，如果我们试图使之成为“平行的”（或“平面的”）和单色的，那么我们就一定要破坏这种根据位置所作的选择，因为我们不能避免增加射线的宽度。（在理想情况下，——例如如果粒子的Px成分全都变成等于0——宽度就一定会成为无限的。）如果选择的均一性尽可能地增加（即尽Heisenberg公式所允许的，以致在这些公式中相等的符号成为有效），那么这种选择可称为纯例（a pure example）。

我们用这种术语就可表述统计学离散关系如下：没有一种粒子聚合体比纯例更均一。

到现在还没有加以充分考虑的是，从量子论基本方程式的解释中推导出Heisenberg公式的解释恰恰必须同从这些基本方程式中用数学推导出的Heisenberg公式一致。例如March已描述了正好相反的情况（前节已表明）：在他的论述中，量子论的统计学解释呈现为Heisenberg对可达到的精密度所加限制的结果。另一方面，Weyl从波方程式——他用统计学术语解释的方程式——严格地推导出Heisenberg公式。然而他把Heisenberg公式——他刚从用统计学解释的前提中推导出这些公式——解释为对可达到的精密度的限制。并且他这样做不顾如下的事实：他注意到对公式的这种解释在某些方面同Born的统计学解释是背道而驰的。因为按照Weyl的意见，鉴于测不准关系，Born的解释应加以“校正”。“当一个粒子的位置和速度在每一个单个情况下被测定时，正好服从统计学规律，情况不仅如此。更确切地说，这些概念的意义本身取决于确定它们所需的测量；并且位置的精确测量剥夺了我们确定速度的可能性。”

Weyl感觉到的Born的量子论统计学解释和Heisenberg对可达到的精密度的限制之间的矛盾的确存在着；但是这个矛盾比Weyl认为的更尖锐。不仅从用统计学解释的波方程式推导出对可达到的精密度的限制是不可能的，而且可能的实验和实际的实验结果都与Heisenberg的解释不一致，这个事实能够被认为是支持量子论统计学解释的一个决定性论据，一种判决性实验。

76．通过倒转Heisenberg纲领排除形而上学因素的尝试及其应用

（“这次掷实际上没有得5”）之一之间可发现矛盾一样站不住脚。

这些简单的考虑提供给我们反驳任何这些证明的手段，据说，这些证明是设计出来表明位置和动量的精确测量与量子论是矛盾的；或许设计出来表明单单假定任何这类测量在物理上是可能的，就必定导致理论内部的矛盾。因为任何这类证明必须利用应用于单个粒子的量子论考虑；这意味着它不得不利用形式上单称的概率陈述，而且意味着必定有可能把证明——可以说逐字地——翻译为统计学语言。如果我们这样做，那么我们就发现在认为是精密的单个测量与作统计学解释的量子论之间没有矛盾。在这些精密的测量和理论的某些形式上单称的概率陈述之间只有表面上的矛盾。

但是，虽然说量子论排除精确的实验是错误的，然而说从量子论特有的公式——如对它们作统计学解释——中不可能推导出精确的单个预测仍是正确的。（我不把能量守恒定律或动量守恒定律列在量子论特有的公式中。）

之所以如此是因为鉴于离散关系，我们必然不能用实验操纵系统（即用我们所说的物理选择）产生精确的初始条件。实验者的正常技术是要产生或建构初始条件，这是对的；并且这使从统计学离散关系中推导出这样一个定理——然而只适用于这种“建构性的”实验技术——：我们不可能从量子论中获得任何单个预测，只能获得频率预测。

这个定理概括了我对Heisenberg（他在这里主要是遵循Bohr）讨论的所有那些想象实验的态度，目的是证明不可能作出他的测不准原理禁止的精确的测量。这一论点在所有情况下都是一样的：统计学离散使之不可能预测在测量操作后粒子的轨迹将会是什么。

很可能我们对测不准原理的重新解释所得到的并不很多。因为即使Heisenberg大体上也不过断言我们的预测服从这个原理（正如我已试图证明的那样）；并且由于在这个问题上我每一点都同意他，也许会认为我争论的只是字眼，不是实质问题。但是这很难说是对我的论证的公正评价。实际上我认为Heisenberg的观点和我的是正好对立的。这在下节将充分加以说明。同时我将尝试解决Heisenberg解释中固有的典型困难；并且我将努力弄清这些困难如何和为什么发生。

首先我们必须考察如我们已看到的那样，使Heisenberg纲领遭到失败的那个困难。这就在那个形式体系中，出现位置加动量的精密陈述的困难；或换言之对轨迹（参阅第73节）作精确计算的困难，对这轨迹的物理实在性Heisenberg是必然要怀疑的，而其他人例如Schlick则干脆否认它。但是实验（a），（b）和（c）——参阅第73节——都能用统计学术语来解释。例如，组合（c），即测量位置后紧跟着测量动量，可以如下的实验实现。我们借助有一狭缝的光阑（diaphragm）根据位置选择一束射线（位置测量）。然后找们测量正从狭缝按一定方向传播的那些粒子的动量。（这第二次测量当然会使位置产生新的离散）。这两次实验加在一起将精密地测定所有那些属于第二次选择的粒子的轨迹，只要这个轨迹在两次测量之间：两次测量之间位置和动量都能精密计算。

与诸要素精确一致的这些测量和计算，在Heisenberg的解释中被认为是多余的，而按照我对这个理论的解释则根本不是多余的。大家承认，它们不起初始条件或预测推导的基础的作用；但是它们是必不可少的：它们是检验我们的预测所必需的，我们的预测是统计预测。因为我们的统计离散关系所断言的是，当位置更为精确地测定时动量必定离散，反之亦然。这是一种不是可以检验、可以证伪的预测，如果我们不能借助于已描述的那类实验来测量和计算，那么在根据位置所作的任何选择后就会马上出现各种离散的动量。

所以用统计学解释的理论，不仅不排除精确的单个测量的可能性，并且如果这些测量不可能，这个理论便是不可检验的，因而是“形而上学的”。因此，Heisenberg纲领的实现形而上学因素的清除在这里完成了，但用的是一种与他十分对立的方法。因为当他试图排除他认为不允许的量值（尽管不完全成功）时，我都把这种尝试倒过来，办法是证明正因为这些量值不是形而上学的，包含这些量值的形式体系是正确的。一旦我们放弃了Heisenberg对可达到的精密度所加的限制中包含的教条，就不再有任何理由，为什么我们应该怀疑这些量值的物理意义。离散关系是关于轨迹的频率预测；所以这些轨迹必定是可测量的——正好与比方说掷个5必定可用经验确定一样——如果我们能检验我们关于这些轨迹或这些掷猜的频率预测的话。

Heisenberg之摈弃轨迹概念，及其谈论“不可观察的量值”，清楚地表明哲学思想的影响，尤其是实证主义思想的影响。March在同样影响下写道：“人们也许可以不怕误解地说……对于一个物理学家来说，一个物体仅在他观察它的时刻才有实在性。自然，没有人如此疯狂以致断言一个物体在我们背对着它时不再存在；但是它在那时不再是物理学家研究的对象，因为没有可能根据实验对它说些什么了。”换言之，当一个物体不在被观察时它以这种或那种轨迹运动这个假说是不可证实的。这当然是明显的，但是无聊的。然而重要的是这个或类似的假说是可证伪的：根据它沿一定轨迹运动的假说，我们能够预测物体将在这个或那个位置上可观察到；这是一个可被反驳的预测。量子论并不排除这类程序将在下节看到。但是事实上我们在这里说的已经很充分了；因为它解决了与轨迹概念“无意义性”有联系的一切困难。如果我们记得从轨迹概念所谓的失败中引出的极端结论，就可以更好地认识到这对澄清气氛有多么大的帮助。Schlick表述这些结论如下：“也许描述所考察情况的最简练方法是说（正如最杰出的量子问题研究者所做的那样），平常时空概念的有效性仅限于宏观上可观察的范围，不能把它们应用于原子的尺度。”这里Schlick可能在暗示Bohr，后者写道：“所以人们可假定，在与量子论的一般问题有关的地方，不只是一个力学和电动力学理论的改变，一个用普通物理学概念可以描述的改变，而是我们时空图象的根深蒂固的失弃，直到现在还用这些时空图象来描述自然现象。”Heisenberg采纳了Bohr的思想，即放弃时空描述作为他的研究纲领的基础。他的成就似乎表明这个放弃是富有成效的。但是事实上，这个纲领从来没有贯彻过。鉴于我们的分析，时空概念频繁的、不可避免的，即使是偷偷摸摸的使用，现在似乎可证明是正当的。因为这已表明统计离散关系是关于位置加动量离散的陈述，所以是关于轨迹的陈述。

由于我们已经证明测不准关系是形式上单称的概率陈述，我们也能理清对测不准关系的客观解释和主观解释纠缠在一起的乱丝。我们在第71节中知道，一切形式上单称的概率陈述都能主观地解释为不确定的预测，关于我们知识不确定性的陈述。我们也已看到，在哪些假定下，客观地解释这种陈述的合理的和必要的尝试必定会失败。如果人们试图通过把不确定性直接赋于单个事件，用单个的客观解释来代替统计的客观解释，就必定要失败然而如果人们在主观的意义上（直接）解释Heisenberg公式，那么物理学作为一门客观科学的地位就受到了损害；因为为了前后一致，人们不得不主观地解释Schrodinger的概率波。这个结论是由Jeans作出的，他说：“简言之，粒子图象告诉我们，我们对一个电子的知识是不确定的；波图象则告诉我们电子本身是不确定的，不管是否对它作了实验。然而测不准原理的内容在这两种情况下必定是完全一样的。只有一种办法使之如此：我们必须设想，波图象提供给我们的不是客观自然界的描述，而只是我们关于自然界知识的描述……”因此对于Jeans来说，Schrodinger的波是主观概率波，关于我们知识的波。并且随着这一点整个主观主义概率论就侵入了物理学领域。我已摈弃的论据——利用Bernoulli定理作为从无知到统计学知识的桥梁以及类似的论据（参阅第62节）——就成为不可避免的了。Jeans表述现代物理学的主观主义态度如下：“Heisenberg通过放弃主要的谜——客观宇宙的性质——抨击物理宇宙之谜不可解，而集中于协调我们对这个宇宙的观察这个次要疑点上。因此最后出现的波图象应该证明仅与通过我们的观察获得的我们关于宇宙的知识有关，就不奇怪了。”

这些结论无疑非常容易为实证主义者接受。然而我自己的有关客观性的观点犹未涉及。量子论的统计陈述必须像任何其他物理学陈述一样是可以在主体间检验的。并且我的简单分析不仅坚持了时空描述的可能性，也保持了物理学的客观性。

有趣的是对Schrodinger波的这种主观解释有一个对于非统计学的，因而是直接的（即单个的客观描述）。Schrodinger本人在他的著名的Collected Papers on Wave－Mechanics中曾对他的波方程式（正如我们已经看到的它是形式上单称的概率陈述）提出了某种这样的解释。他试图把粒子直接同波包本身等同起来。但是他的尝试直接导致这类解释：我指的是把测不准归之于物理客体本身（客观化的测不准性）所特具的那些困难。Schrodinger不得不假定，电子电荷在空间（以及由波幅决定的电荷密度）被“模糊或涂污”；这个假定结果证明与电的原子结构是不相容的。Born的统计学解释解决了这个问题；但是统计学解释与非统计学解释之间的逻辑关系仍是模糊不清的。结果其他形式上单称的概率陈述——例如测不准关系——的独特性质仍得不到承认，这些陈述继续破坏理论的物质基础。

也许我们可以把本节所说的应用于Einstein所提出的并被Jeans称为“新量子论最困难的部分之一”的想象实验作为结语；虽然我认为我们的解释使这个实验极为清晰，即使没有使它通俗些”。

设想一面半透明的镜子即反映部分光线并让光线一部分通过的镜子。某一光子（或光量子）穿过镜子的形式上单称的概率陈述αPk（β），可被看作等于它被反射的概率；因此得：）＝1/2，不是α——实验结果，即信息k∈β

分别强烈地提示我们的一种选取。谈到这种选取的逻辑结果（或者这个信息的逻辑结果）时说：“以超光速传播”，其助益几乎等于说二乘二以超光速等于四一样。Heisenberg的进一步的评论大意是物理作用的这种传播不可能用来传递信号，这种评论虽然是正确的，但对情况并无改善。

这个想象实验的命运说明迫切需要区分和定义统计学的和形式上单称的概率概念。它也表明量子论的引起的解释问题只有用对概率陈述解释的逻辑分析才能解决。

77．判决性实验

我现在已经完成了第73节前面的导言中概述的我的纲领的前两部分。我已证明（1）Heisenberg公式可用统计学加以解释，所以（2）把它们解释为对可达到的精密度的限制并非从量子论中合乎逻辑地得出的结论，因此不可能仅因我们测量时达到更高的精密度就反驳了量子论。

“现在为止，一切顺利”，有人也许反驳说：“我不否认也许有可能这样看量子力学。但是我仍然不认为你的论证甚至触动了Heisenberg理论真正物理核心：作出精确的单个预测的不可能性。”

如果要求用一个物理学的例子来详述他的论点，我的对手也许会这样说：“设想有一束电子，像阴极射线管中的一束电子那样。设这电子束的方向指向x。我们可以从这电子束中获得各种物理选择。例如，我们可以根据它们在x方向上的位置（即根据它们在某一时刻的x坐标）选择或分离出一组电子；这也许用一个在很短时间内打开的闸板来做到这一点。这样我们就应该获得一组电子，这些电子在x方向上的广延非常小。按照离散关系，这组不同电子的动量在x方向上也是十分不同的（因此它们的能量也如此）。你说得很对，我们可以检验这些关于离散的陈述。我们用测量单个电子的动量或能量就能做到这一点；并且由于我们知道位置，因此我们将既得到位置，又得到动量。可以进行这类测量，例如使电子撞击一块金属片，激发金属片的原子：于是我们就将发现某些被激发的原子，它们受激发要求的能量超过了这些电子的平均能量。因此我承认在你强调这些测量既是可能的又是重要的时，你是完全正确的。但是——现在我的反对意见来了——在进行任何这种测量时，我们必定扰动了我们正在考察的系统，或是单个电子，或是整个电子束，如果我们测定得多的话（如在我们的例子中）。大家承认，如果我们知道扰动前该组不同电子的动量，这个理论在逻辑上不会被反驳（当然只要它并不使我们能够利用我们的知识来影响一个被禁止的选择）。但是没有办法获得任何有关单个电子的知识而不去扰动它们。结论是精密的单个预测是不可能的，这仍然是对的。”

对于这个反对意见，我应该首先答复说，如果它是正确的，那也并不奇怪。精确的单个预测块不能从统计学理论中推导出来，能推导出来的只是“不确定的”（即形式上单称的）单个预测，这毕竟是很明显的。但是我眼下断言的是，虽然这个理论并不提供任何这类预测，但它也并不排除它们。仅当可以断言对系统的扰动或干扰必定妨碍一切种类的预测测量时，人们才能说单称预测的不可能性。

“但是那正是我断言的”，我的对手会说。“我恰恰断言任何这类测量的不可能性。你假定有可能来测量这些运动着的电子之一的能量而并不会迫使它离开它的轨迹和电子群。这个假定我认为是站不住脚的。因为假定我拥有能够进行这类测量的任何仪器，那么我用这某种类似的仪器就能产生一些电子聚合体，这些电子（a）就它们的位置而言，它们全是有限的，而（b）全有同样的动量。这些聚合体的存在会反驳量子论，这当然也是你的观点，因其存在是被你称之为‘离散关系’所排除的。因此你只能回答说，有可能设想一种仪器，它使我们能够进行测量，但不是作出选择。我承认这个回答在逻辑上是可允许的；但是作为一个物理学家我只能说，我的本能反对这种想法：我们能够测定电子的动量，而不能消除其动量超过（或不足于）一定量的所有那些电子。”

我对这一点的第一个回答是，这一切听起来似乎十分令人信服。但是如果一种预测测量是可能的，相应的物理选择或分离也会是可能的，这种主张并未得到严格的证明（我们马上会看到不可能得到这种证明）。这些论据都不能证明精密的预测与量子论是矛盾的。这些论据都引入了一个补充假说。因为（按照Heisenberg的观点）精确的单个预测是不可能的这个陈述，结果证明与预测测量和物理选择有不可分割的连系这个假说是等价的。我的意见确实必定同这个新的理论系统——量子论与这个辅助的“连系假说”的合取——是冲突的。

这样我的纲领的第（3）点也就落实了。但是第（4）点仍需证明：即我们仍需证明把用统计学解释的量子论（我们假定包括动量和能量守恒定律）同“连系假说”结合起来的系统是自相矛盾的。我认为有一个根深蒂固的成见：预测测量和物理选择总是连系的。这个成见的流行说明为什么证明对立看法的简单论据从来没有提出来过。

我要强调指出，迄今介绍的主要是物理学的考虑并未形成我对测不准关系逻辑分析的一部分假定或前提，虽然可以说这些考虑是分析的成果。实际上，迄今进行的分析与后面的考虑是完全无关的，尤其与下面描述的想象实验无关，这个实验意图证明对单个粒子轨迹作出任意精密的预测是有可能的。

我将借助于这个想象实验首先讨论一些简单的例子。这些例子意图表明我们能够毫无困难地作出任意精密的轨迹预测，并且检验它们。我暂时只考虑不涉及确定的单个粒子的预测，只涉及在一确定的小的时空区（△x．△y．△z．△t）内的（一切粒子）。在每一种情况下，只有粒子存在于这区内的概率是确定的。

我们再设想一束（一个电子或光束）粒子朝x方向传播。但是这次我假定它是单色的，因此，所有粒子以已知的同样动量沿着朝x方向的平行轨迹传播。于是朝其他方向的动量也将是已知的，即已知等于零。现在我们不借助物理选择测定一群粒子在x方向上的位置——即不用技术手段把这群粒子同这束其余粒子分离开（我们在上面已这样做过）——我们将只满足于仅用集中注意于这群粒子把它同其余的区分开。例如，我们可集中注意于所有那些粒子，这些粒子（以一定的精密度）在一定时刻有地点坐标x，所以并未越出任意小的域△x。我们精确地知道这些粒子中每一个的动量。所以我们精确地知道在每一个未来时刻这群粒子将在哪里。（显然仅仅存在这样一群粒子并不与量子论发生矛盾；只是它的孤立的存在，即在物理上选择它的可能性，才与这理论有矛盾。）我们能够进行同样性质的与其他空间坐标有联系的想象选择。经物理选择的单色束在y和z方向上一定非常宽（在一个理想的单色束情况下无限宽），因为在这些方向，动量应该是精确选择的，即应该等于0；因此在这些方向上位置必定是伸展得很宽的。虽然如此，我们再可以集中注意于一条十分狭窄的部分射线。我们将又一次不仅知道每条射线每一个粒子的位置，而且知道它们的动量。因此我们将能够预测这条狭窄射线（可以说我们是在想象中选择它的）的每一个粒子它将在哪一点上用多少动量，撞击在一块挡着它轨迹的摄影底片上，当然我们能用经验（用前面的实验）检验这一点。

类似从一种特定类型的“纯例”中进行选择一样，想象选择也能从其他类型的聚合物中进行。例如，我们取一单色束，借助非常小的缝△y，从中进行物理选择（因此把仅根据前面例子的想象选择进行的物理选择作为我们的物理起点）。我们不知道哪些粒子在通过缝以后将转向哪一个方向；但是如果我们考虑某个确定的方向，我们就能精确计算出所有转向这特定方向的粒子的动量分量。因此，通过缝后朝某个确定方向传播的那些粒子又形成一个想象选择。我们也能预测它们的位置和它们的动量，或简言之它们的轨迹；并且把一张摄影底片放在它们的轨迹上我们又能检验我们的预测。

这个情况原则上与我们考虑过的第一个例子的情况，即根据它们在传播方向上的位置选择粒子一样（即使经验检验有点更加困难）。如果我们根据这个情况作出物理选择，那么由于动量距的增加不同的粒子将以不同的速度传播。因此这群粒子随着它的前进在x方向上将伸展一个日趋增大的域（波包将变得更宽）。于是我们可算出这些粒子（想象中选择的）群部分的动量，这些粒子在一定时刻将在x方向上的一定位置上：动量越大，选择的那部分群越靠前面（反之亦然）。用这个方法作出的预测的经验检验可用一个活动的带状电影片代替摄影底片来进行。由于我们对带上的每一点能够知道它接触电子冲击的时间，我们也能够对带上每一点预测冲击会以多少动量发生。我们可以检验这些预测，例如在活动带前面，或者也许在Geiger计数器前面插进一个滤光器（如光线则是滤光器；如电子则对射线方向形成直角的电场），接着根据方向进行选择，只允许那些具有某一最小动量的粒子通过。于是我们可以确定这些粒子在预测的时间实际上是否到达。

与这些检验有关的测量的精密度不受测不准关系的限制。我们已看到测不准关系本意主要应用于那些用作推演预测而不是用作检验预测的那些测量。那就是说它们本意应用于“预测性测量”，而又是“非预测性测量”。在第73和76节中我考察了这种“非预测性”测量的三种情况，即（a）两次位置测量，（b）测量动量后测量位置或（c）测量位置后测量动量。上面讨论的借助放在电影片前面的滤光器或Geiger计数器前面的测量就是（b）的实例，即根据动量选择后测定位置。这大概恰好是按照Heisenberg（参阅第73节）所说的允许“计算电子的过去”那种情况。因为虽然在（a）和（c）时只有计算两次测量之间的时间才是可能的，在（b）时则有可能计算第一次测量以前的轨迹，假如这种测量是根据一定动量进行选择的话。我们知道，Heisenberg对这种测量的“物理实在性”提出了疑问，因为它使我们仅能根据粒子到达某个精确测定的位置和精确测定的时间计算它的动量：这种测定似乎缺乏预测内容，因为不能从它推导出任何可检验的结论。然而我将把我的想象实验（意图证明有可能精确预测一个确定的粒子的位置和动量）立足于这个特定的测量安排上，这种安排乍看起来显然是非预测性的。

由于我就要从这类精密的“非预测性”测量是可能的这个假定推导出这些具有深远意义的结果，讨论这个假定的可允许性似是适宜的。

下面我用想象实验直接向Bohr和Heisenberg的论证方法挑战，他们曾用这种方法证明把Heisenberg公式解释为对可达到的精密度的限制是正确的。因为他们试图通过证明不可能设计任何想象实验来产生更精确的预测性测量来证明这种解释。但是这种论证方法显然不能排除这种可能性，即终有一天可设计出一种想象实验，（利用已知的物理效应和定律）证明这些测量毕竟是可能的。任何这类实验与量子论的形式体系发生矛盾已被认为理所当然，并且似乎这种思想决定了探索这些实验的方向。然而我的分析——落实我的纲领（1）和（2）点——显然已经扫清了设计一种想象实验的道路，这种实验完全符合量子论，证明所说的精密测量是可能的。

为了落实这个实验，我将如前一样利用“想象选择”；但我将选定这样一种安排，使得如果用这种选择表征的一个粒子实际存在着，我们就将能够确定这个事实。

我的实验在某种程走上形成一种Compton－Simon和Bothe－Geiger实验的理想化。由于我们希望获得单个预测，我们不能仅使用统计学假定。必须使用能量和动量守恒的非统计学定律。我们可以利用这一事实：这些定律使我们能够计算出当粒子相撞时发生了什么，假如我们已知描述碰撞的四个量值（即碰撞前的动量a1和b1，和碰撞后的动量a2和b2）以及第三个量值的一个分量。（这种计算方法已知为Compton效应理论的一部分。）

现在让我们设想下列的实验安排（见图3）：我们使两条粒子束交叉（其中一条至多是一条光线，而一条至多是电荷非中性），这两条粒子束在下列意义上都是纯例，即A束是单色的，即根据动量a1作的选择，而B束通过狭缝SL，从而接受根据位置作的物理选择。可设B粒子具有（绝对）动量b1。这两束的一些粒子相撞。我们现在设想两条窄的部分射线［A」和［B」，他们在P处相交。［A」的动量是已知的；它是a1。部分射线（B）的动量是可计算出来的，只要我们已经判明它某个确定的方向；设它为b1。现在我们选定方向PX。注意到碰撞后在PX方向传播的部分射线（A）的粒子，我们就能计算出它们的动量a2以及b2，即在它们与之碰撞的那些粒子碰撞后的动量。与以动量a2在P沿X方向偏转的［A］的每一个粒子相应必定有「B」的第二个粒子在P以动量b2沿可计算的方向PY偏转。我们现在置一仪器于X上——例如一架Geiger计数器或一卷活动的电影片——以记录粒子从P到达任意限制的区域X的冲击力。于是我们可以说：由于我们注意到关于一个粒子的这种记录，我们同时知道第二个粒子必定以动量b2从P向Y传播。并且我们根据纪录也知道这第二个粒子在一定时刻在什么地方；因为我们从第一个粒子冲击X的时间及从它的已知的速度，可计算出它在P点碰撞的动量。通过在Y处使用另一架Geiger计数器（或活动电影片），我们能够检验我们对第二个粒子的预测。

这些预测的精密度以及用来检验它们的测量的精密度，就位置坐标和在PY方向动量的分量来说，原则上不受测不准原理所致的任何限制。因为我的想象实验把对在P偏转的B粒子作出预测的精密度问题归结为在X测量时可达到的精密度问题。首先这些测量似是相应的第一个粒子「A」的时间、位置和动量的非预测性测量。这个粒子在PX方向的动量，以及它冲击X，即它在PS方向上位置的时间可以任何所需的精密度测量，如果我们在测量位置前设置一个电场或滤器在Geiger计数器前面进行动量选择的话。但是由于这样做的缘故，我们就能够以任何精密度作出关于在PY方向传播的B粒子的预测。

这种想象实验使我们有可能不仅看到能够作出精确的单个预测，而且看到在什么条件下能够出这种预测，或更确切地说，在什么条件下它们与量子论可以相容。仅当我们能够获得关于粒子状态（不能任意创造这种状态）的知识时，就能作出这些预测。因此可以说我们实际上是在事件之后获得我们的知识的，因为在我们获得知识时，粒子已经采取了它的运动状态。然而我们仍然能够利用这种知识从中演绎出可检验的预测。（例如如果所说的B粒子是，光子，我们能计算出它达到天狼星的时间。）到达X的粒子的冲击将在不规则的时间间隔内接连发生；这就是说，我们对之作出预测的部分射线B的粒子也将在不规则的时间间隔后接连发生。如果我们能通过例如使这些时间间隔成为均等来改变事情的这种状态，它就与量子论发生矛盾。因此可以说，我们能够瞄准和预先测定子弹的力量；我们也能（在子弹打中靶Y以前）计算出在P开枪的确切时间。然而我们不能自由选定开枪时刻，而不得不等待开枪。我们也不能防止（从P的领域）射向我们的靶的不受控制的射击。

很清楚，我们的实验和Heisenberg的解释是不相容的。但是由于进行这种实验的可能性可从量子物理学的统计学解释（加上能量和动量定律）中演绎出来，看来与这个实验矛盾的Heisenberg解释也必然同量子论的统计学解释发生矛盾。鉴于Compton－Simon和Bothe－Geiger实验，看来进行我们的实验是可能的。可以把它看作为在Heisenberg的概念和量子论的前后一致的统计学解释之间判决的一种判决性实验。

78．非决定论的形而上学

自然科学家的任务是探索使他能够演绎出预测的定律。这个任务可分为两部分。一方面，他必须努力发现将使他能够演绎出单个预测的那些定律（“因果性”或“决定论”定律或“精确陈述”）。另一方面他必须努力提出关于概率的假说，即断言概率的定律，以演绎出频率预测。在这两项任务中没有任何东西使它们互不相容。显然情况并不是这样：只要我们作出精确陈述，我们就不会作出频率假说；因为我们已经看见，某些精确陈述是可以从频率假定中推导出来的宏观定律。情况也不是那样；只要在某一特定的领域内，频率陈述得到充分的确证，我们就要作出结论说，在这个领域内不可能作出精确陈述。这种情况是十分明显的。然而我们刚摈弃的两个结论中的第二个却一再得出。我们也一再遇到这样的信仰：在运气占支配地位的地方就排除规律性。我已在第69节批判地检查了这种信仰。

从科学发展的现状来判断，宏观和微观定律的二元论——我的意思是指我们都利用这两种定律这一事实——是不容易克服的。然而，逻辑上有可能的是把一切已知的精确陈述——通过把它们解释为宏观定律——还原为频率陈述。逆向还原是不可能的。我们在第70节已经看到，决不能从精确陈述中演绎出频率陈述。频率陈述需要自己的假定，这些假定必须是统计学的。概率只能从概率估计中计算出来。

逻辑境况就是如此，它既不支持决定论观点，也不支持非决定论观点。并且如果物理学只用频率陈述工作终于成为可能，那么我们仍然不应该作出非决定论的结论；那就是说我们仍然不应该断言“自然界没有精确的定律，没有由之可演绎出关于单个或基本过程进程的预测的定律”。科学家决不让有什么东西阻止他探索定律，包括这类定律。不管我们可以多么有成效地运用概率估计，我们也不可作出探索精确定律是白费的结论。

这些考虑无论如何不是第77节描述的想象实验的结局；完全相反。让我们假定测不准关系没有被这个实验反驳（不管什么理由）：即使那时测不准关系也只能作为频率陈述受到检验，并且只能作为频率陈述得到验证。因此无论如何我们不应从它们得到充分验证这个事实引出非决定论结论。

世界是否受严格的定律支配？我认为这是一个形而上学问题。我们发现的定律总是假说；这就是说它们总是可以代替的，它们有可能从概率估计中演绎出来。然而否认因果性同样是试图说服理论家放弃他的探索；并且这样一种尝试不可能得到刚刚已经说明的证明的支持。所谓：“因果性原理”或“因果律”，虽然可以表述，但性质上与自然律迥然有别；并且我不能同意Schlick，他说：“……可以在与任何其它自然律完全一样的意义上检验因果律的真理性。”

对因果律的信仰是形而上学的。这不过是一条得到充分证明的方法论规则的一种典型的形而上学实体化，这条规则是科学家决不放弃他探索定律的决心。因此对因果性的形而上学信仰在其各种表现中比Heisenberg支持的那种非决定论形而上学更富成效。确实我们能够看到Heisenberg的评论对研究有一种摧残作用。如果继续重复说，探索任何这类联系是“无意义的”，就可能很容易忽视去寻找并不很远的联系。

Heisenberg的公式——正如只能用它们的统计学推断验证的类似陈述一样——不一定导致非决定论结论。但是这本身并不证明不可能有证明这些或类似结论的其他经验陈述：例如这样的结论，上述方法论规则——决不放弃探索定律的决心——不可能实现它的目的，也许因为探索定律和单个预测是无成效的，或无意义的，或“不可能的”。但是具有能迫使我们放弃探索定律的经验陈述是不可能的。因为一个被认为是摆脱了形而上学因素的陈述可能有非决定论结论，仅当这些陈述是可证伪时。但是可以证明它们是假的，仅当我们能提出定律，并且从这些定律演绎出得到验证的预测时。因此，如果我们认为这些非决定论结论是经验假说，我们就应该严格地检验它们，即证伪它们。并且这就意味着我们应该探索定律和预测。因此我们不可能听从放弃这种探索的劝告，而不否认这些假说的经验性质。这表明认为有可能存在会迫使我们放弃探索定律的任何经验假说是自相矛盾的。

这里我不想详细证明：多次尝试确立非决定论如何揭示了一种只能在形而上学意义上描述为决定论的思维方式（例如Heisenberg试图对因果解释为什么不可能提供一种因果解释）。我恰恰要提醒读者注意企图证明测不准关系关闭了若干可能的研究途径的尝试，正如光速不变原理所做的那样：两个常数c和h，即光速和普朗克常数之间的类似，通过说它们二者都在原则上对研究的可能性施加了限制，而得到了解释。在试图摸索越出这些障碍时提出的问题由于把令人讨厌的问题作为“假问题”而取消的众所周知的方法取消了。在我看来，在c和h两个常数之间确实存在着类似之处；顺便说一句，这种类似是保证常数h同常数c一样不是研究的障碍。光速不变（以及超过光速不可能性）原理并不禁止我们去探索大于光速的速度；因为它只是断言我们将不会发现什么；也就是说，我们将不能产生比光传播得更快的信号。同理Heisenberg公式不应该被解释为禁止探索“超纯”例：因为它们只是断言我们将不会找到什么；尤其是我们不能产生什么。禁止速度大于光速和“超纯”例的定律，像其他经验陈述一样，鞭策研究人员去探索被禁止的东西。因为他只能通过试图证伪它们来检验经验陈述。

从历史观点看，非决定论物理学的出现是很可理解的。长期以来，物理学家信仰决定论物理学。因为逻辑境况没有得到充分的理解，从原子的力学模型中演绎出光谱－－它们是统计学效应——的种种尝试的失败必定产生决定论的危机。今天我们看得很清楚，这种失败是不可避免的，因为从一个非统计学的（力学的）原子模型中演绎出统计学定律是不可能的。但是在那时（1924年左右Bohr，Kramers和SComter理论提出时）似乎在每一个单个原子的机制中概率代替了严格的定律。决定论的大厦倒坍了——主要是由于概率陈述被表达为形式上单称的陈述。在决定论的废墟上，非决定论起来了，得到了Heisenberg测不准原理的支持。但是我们现在看到，它的崛起同样是由于误解了形式上单称的概率陈述的意义。

这一切的教训是我们应该努力去发现能够与经验冲突而垮台的严格定律——禁律。然而我们应该避免对研究的可能性施加限制的禁律。

第十章验证或理论如何经受住检验

理论是不能证实的，但是它们可被“验证”。

常常尝试把理论描述为既非真的又非假的，而是或多或少可几的。尤其是归纳逻辑已发展为一种不仅把“真”和“假”两个值，而且把不同程度的概率赋于不同的陈述；这类逻辑在这里将称为“概率逻辑”。按照那些相信概率逻辑的人看来，归纳应该确定一个陈述的概率程度。并且归纳原理应该，或者使归纳出来的陈述是“可能正确的”这一点成为确实可靠的，或者使这一点成为可几的——因为归纳原理本身只是“可能正确的”。然而我认为整个假说概率问题是被误解了的。我们不应去讨论一个假说的“概率”，而是应该努力去评价它通过经受住检验在多大程度上能够证明它适宜生存。简言之，我们应该努力评价它在多大程度上得到“验证”。

79．关于假说的所谓证实

理论是不能证实的这一事实常常被忽视。人们常常谈到一个理论时说，当从它推导出的某些预测被证实时它就被证实了。他们也许会承认从逻辑观点看，证实是不完全没有缺点的，或者承认通过确定某一陈述的某些推断决不能最终确定这个陈述。但是他们易于把这些异议看作是由于某种不必要的顾虑所致。他们说，我们不能确定地知道太阳明天是否会升起，这是很对的，并且甚至是平凡浅显的，但是这种不确定性可以不予考虑：理论不仅可改进，而且能被新的实验证伪这个事实给科学家提供了一个在任何时候都可成为现实的重大可能性；但是从来还没有认为一个理论由于一个得到充分确证的定律突然垮台而必须被证伪。决不会发生老的实验有一天产生新的结果这种事。发生的只是新的实验判定反对旧的理论。旧的理论，即使当它被取代时，也常常保持它的正确性作为新理论的一种极限情况；它仍然至少以高度的近似应用于那些以前它在其中富有成效的情况。简而言之，可用实验直接检验的规律性没有改变。大家承认，它们会改变这是可以设想的，或者在逻辑上是可能的；但是这种可能性为经验科学所忽视，并且不影响它的方法。相反，科学方法以“自然过程不变性”或“自然界均一性原理”为前提。

对于上述论证有一些话要说，但它不影响我的论点。它表示对我们世界存在规律性的形而上学信念（我也有这种信念，并且没有这种信念实践行动是不可设想的）。然而，在我们面前的问题——则是在完全不同的侧面上。与我对其他形而上学问题的态度相一致，我避免去支持或反对对我们世界存在规律性的信念。但是我将努力证明理论的不可证实性在方法论上是重要的。正是在这个侧面我反对刚才提出的论据。

所以我将认为只是这个论据中一个论点是有关的——提到所谓“自然界均一性原理”。我认为这个原理以十分浅显的方式表达了一个重要的方法论规则，这个规则正是从理论的不可证实性的考虑中有效地推导出来的。

让我们设太阳明天将不升起（并且虽然如此我们将继续生活着，并从事着我们感兴趣的科学工作）。如果发生这样的事情，科学就不得不努力解释它，即认定律中把它推导出来。大概要求对现存的理论作重大修改。但是修改的理论不仅应解释新事态，我们旧有的经验也应可以从修改的理论中推导出来。从方法论观点看，人们看到自然界均一性原理在这里被既要考虑到空间又要考虑到时间的自然界不变性的公设取代了。所以，我认为断言自然规律性不变是错误的。（这是一种既不能反对又不能赞成的陈述。）更确切地说，如果我们假设它们不随空间和时间而变化，并且假设它们没有例外，这种陈述是我们自然律定义的一部分。因此从方法论观点看，证伪一个得到验证的定律无论如何不是没有意义的。它帮助我们发现，我们对自然律的要求和期望什么。并且“自然界均一性原理”也可被认为是对某个方法论规则——如与它十分接近的“因果律”的一种形而上学解释。

人们尝试用方法原理代替这种形而上学陈述，这导致“归纳原理”，这个归纳原理被认为是支配归纳方法的，从而支配证实理论的方法。但是这个尝试失败了，因为归纳原理本身在性质上是形而上学的。正如我在第1节已指出的，归纳原理是经验的这一假定导致无穷的后退。因此只能作为原始命题（或公设，或公理）引入。如果归纳原理并非在任何情况下都得被看作不可证伪的的陈述，这也许没有什么关系。因为如果这个原理——它应证明理论的推论正确——本身是可证伪的，那么它就会随第一个被证伪的理论而证伪，因为这个理论在那时是一个借助归纳原理推导出的结论；而这个原理作为一个前提，只要从这前提推导出的一个理论被证伪，当然就将被否定后件的推理（modus tollens）所证伪。但是这意味着一个可证伪的归纳原理将随着科学的进展而一再被证伪。所以就必须引入一个假定不可证伪的归纳原理。但是这等于是对一个先验地正确的综合陈述，即关于实在的一个不可反驳的陈述理解错误的观念。

因此如果我们试图把我们对自然界均一性和理论可证实性的形而上学信念转变为基于归纳逻辑的知识理论，留给我们的只是在无穷后退和先验论之间进行选择。

80．假说的概率和事件的概率：概率逻辑批判

即使承认理论决不能最后被证实，我们是否能够确保它们在或大或小的程度上是可靠的——更可几的或不那么可几？毕竟也许有可能把一个假说的概率问题还原为比方说事件的概率问题，因而使之容易接受数学和逻辑的处理。

像一般的归纳逻辑一样，假说概率理论似乎是由于把心理学问题和逻辑问题混为一谈而产生的。大家承认，我们对确信的主观感觉具有不同的强度，并且我们等待某一预测的实现和某个假说的进一步确认的信心程度，很可能取决于（除了其他以外）这个假说迄今业已经受住检验的方式——取决于它过去的验证。但是这些心理学问题并不属于认识论或方法论这一点甚至得到概率逻辑信仰者的充分承认。然而他们争辩说，根据归纳主义者的决定，把概率程度归于假说本身是可能的；并且进一步争辩说把这个概念还原为事件概率概念是可能的。

一个假说的概率主要被认为只是关于陈述概率的一般问题的特例；而后者本身又被认为不过是用特定术语表达的一个事件的概率问题。因此例如我们在Reichenbach那里读到：“不管我们把概率归于陈述还是归于事件只是一个术语问题。迄今我们认为分配给一粒骰子某一面朝上的概率为1／6是事件概率的一种情况。但是我完全可以说正是‘点1将朝上’这个陈述被分配到1／6的概率。”

如果我们想起第23节所说过的，就可以更好地理解事件概率和陈述概率的这种等同。在那里“事件”概念被定义为一类单称陈述。所以说用陈述概率代替事件概率也必定是可允许的。因此我们能够认为这仅是一个术语的改变：参考序列被解释为陈述序列。如果我们想到陈述所代表的一种“二择一”，或更确切地说它的元素，那么我们就能用“k是正面”这个陈述来描述正面朝上，并且用这个陈述的否定来描述它不朝上。这样我们就获得一个这种形式的陈述序列Pi，Pk，PI，Pm，Pn，……，其中Pi有时表征为真，有时（上面加一划）为“假”。因此能够把在一个二择一内的概率解释为陈述序列内陈述的相对“真频率”（而不是某种性质的相对频率）。

如果我们愿意，我们可以称经过如此改造的概率概念为“陈述概率”或“命题概率”。并且我们能够证明在这个概念和“真理”概念之间有十分密切的联系。因为如果陈述序列变得越来越短，最后只包含一个元素，即只有一个单个的陈述，那么根据这单个陈述是真还是假，序列的概率或真频率只可能有1和0两个值中一个值。因此可把一个陈述的真或假看作是概率的特例；反之，就概率把真理概念作为一个极限情况包括在内而言，可把概率看作为真理概念的一般化。最后有可能以这种方式定义真频率运算，即经典逻辑常用的真值运算是真频率运算的极限情况。这些运算的计算可称为“概率逻辑”。

但是我们实际上能否把假说概率与以这种方式定义的陈述概率，因而间接地与事件概率等同起来呢？我认为这种等同是混淆的结果。这个思想是，某一假说的频率，由于它显然是一种陈述概率，必须在刚才定义的意义上的“陈述概率”的名目下。但是这个结论证明是没有根据的；并且因此这个术语是很不合适的。也许终究最好不要用“陈述概率”这个词，如果我们心里指的是事件概率的话。

不管这可能怎样，我断言假说概率概念引起的问题甚至未被基于概率逻辑的考虑触及。我断言如果人们谈到一个假说时说，它不是真的，但是“可几的”，那么这个陈述无论如何不能译为关于事件概率的陈述。

因为如果人们试图把假说概率观念还原为使用陈述序列概念的真频率观念，那么他马上面临这个问题：根据哪些陈述序列，能够把一个频率值赋予一个假说？Reichenbach把一个“自然科学的断言”——他用它指一个科学假说——本身与一个陈述参考序列等同起来。他说，“……自然科学的断言决不是单称陈述，事实上是陈述序列，严格地说我们必须把一个较小的概率值，而不是概率度1赋予这些陈述。所以惟有概率逻辑才提供能够严格代表适合于自然科学知识概念的逻辑形式。”现在让我们把假说本身是陈述序列的意见追根究底。解释它的一个方法是取可能与假说矛盾或一致的种种单称陈述作为这样一个序列的元素。于是这个假说的概率决定于与它一致的那些陈述的真值频率。但是如果平均起来该假说被这个序列的每隔一个的单称陈述所反驳，那么这个假说的概率为1/2！为了避免这个毁灭性的结论，我们再试试两个权宜之计。一个是根据对它通过的所有检验与尚未尝试的所有检验的比值的估计把一定的概率——也许不很精确——赋予这个假说。但是这种办法也没有什么结果。因为这种估计碰巧能够精确计算，并且结果总是概率等于零。最后，我们可以努力使我们的估计立足于导致有利结果的那些检验与导致中性结果——即不产生清楚决定的结果——的那些检验的比值上（用这种方法人们确实可以获得某种类似主观信心感的量度，实验者就是用这种信心看他的结果的）。即使我们不顾这个事实：我们由于这种估计已经离开真值频率概念和事件概率概念很远了，这最后一种权宜之计也不行（这些概念基于真陈述与假陈述的比值，并且我们当然必须把中性陈述同客观上假的陈述等同起来）。为什么这最后的尝试也不行的理由是所建议的定义使一个假说的概念成为不可救药地主观：一个假说的概率不是依靠客观上可复制的和可检验的结果，而是依靠实验者的训练和技能。

但是我认为接受可把某个假说看作是陈述序列这种意见是完全不可能的。如果全称陈述有这样的形式：“对一切k值，在k处某某事发生，这是真的”，这是可能的。如果全称陈述有这种形式，那么我们就可把基础陈述（与全称陈述矛盾或一致的陈述）看作陈述序列——被视为全称陈述的序列——的元素。但是我们已经看到（参阅第15和28节），全称陈述并不具这种形式。基础陈述决不是仅仅从全称陈述中推导出来的。所以全称陈述不能被认为是基础陈述序列。然而，如果我们试图考虑是从全称陈述推导出来的基础陈述的否定的序列，那么对每一个自相一致的假说的估计将导致相同的概率，即1。因为我们必须考虑能被推导出的未被证伪的否定的基础陈述（或其他可推导陈述）与已被证伪的那些陈述的比值。这就是说，我们不考虑真频率，而应考虑假频率的补值。这个值无论如何等于1。因为可推导的陈述类，甚至可推导的基础陈述否定类，都是无限的；另一方面，已接受的起征伪作用的基础陈述数目是有限的，不可能比它更多。因此即使我们不顾全称陈述决不是陈述序列这个事实，并且即使我们试图把它们解释为这类东西，把它们与完全可判定的单称陈述序列相关起来，即使如此我们也达不到一个可接受的结果。

然而我们得考察用陈述序列解释假说概率的另一个十分不同的可能性。也许还记得我们已称某一单称事件是“可几的”（在“形式上单称概率陈述”的意义上），如果它是以一定概率发生的事件序列的一个元素的话。但是这个尝试也失败了——完全不是确定参考序列的困难（它可用许多方法选定；参阅第71节）。因为我们不能说假说序列内的真频率，只是因为我们决不能知道一个假说是否是真的。如果我们能够知道这一点，那么我们就根本不需要假说概率概念。现在我们如上述那样，试图取假说序列内假频率的补数作为我们的出发点。但是如果比方说我们借助未证伪与已证伪的假说序列的比值来定义一个假说的频率，那么如前所说，每一个无穷参考序列内每一个假说的概率等于0。并且即使选定一个有穷的参考系列，我们也未处于更好的地位。因为让我们假定我们能把与这种程序相应的在0与1之间的概率程度——比方说值3／4——赋予某个（有穷的）假说序列的诸元素。（如果我们获得信息，说某个假说属于已被证伪的序列，就能作到这一点。）就这些已被证伪的假说是序列元素而言，我们正由于这个信息就得把3／4而不是零值赋予这些元素。一般来说，一个假说的概率由于知道了它是假的，就要降低1／n，n是参考序列中的假说数。所有这一切显然同用“假说概率”表达我们必须根据支持性或破坏性证据赋予某一假说可靠性程度的纲领是矛盾的。

我认为这已详尽地研究了使假说概率概念立足于真陈述频率（或假陈述频率）概念，从而立足于事件概率频率理论的可能性。

我想我们不得不认为把假说概率与事件概念等同起来的尝试完全失败了。这个结论完全不依赖于我们是否接受（Reichenbach的）这个主张：物理学的所有假说“实际上”是，或者“仔细检查时”不过是概率陈述（关于观察结果序列内某些平均频率陈述，观察结果总是表明与某个均值有离差），或者不依赖于我们是否倾向于在两类不同的自然律之间——一方面“决定论的”或“精确的”定律与另一方面“概率定律”或“频率假说”之间作出区分。因为这两类都是假说性假定，这些假定决不能成为“可几的”：它们只能在这样的意义上得到验证，即它们能够在烈火中——检验的烈火中“证明它们的品质”。

我们该如何解释概率逻辑的信仰者已经达到某种对立的观点这一事实呢？Jean写道——首先在我可以完全同意的意义上——“……我们对任何东西也不能……确定无疑地知道”，但是他接着说：“我们至多只能涉及频率。（并且）新量子论的预测（与观察结果）是如此完全一致，以致有利于与实在相符合的这个图式的机会是极大的。确实，我们可以说这个图式几乎肯定是定量正确的……”，当他这样写时，他的错误在哪里？

无疑最常见的错误在于认为频率的假说性估计，也就是关于概率的假说，本身只能是可几的；或换言之，在于赋予概率假说以某种程度的所谓假说概率。如果我们记得，就其逻辑形式而言（无需参照我们的可证伪性的方法论要求），关于概率的假说既不能证实也不能证伪，那么我们也许能够提出一个令人信服的论据来支持这个错误结论（参阅第65至68节）。它们不是可证实的，因为它们是全称陈述，它们不是可严格证伪的，因为它们决不能在逻辑上与任何基础陈述发生矛盾。因此它们是（如Reichenbach认为的那样）完全不可判定的。现在正如我们已证明的那样，它们能够更好地或不太好地得到“确证”，那就是说，它们可或多或少地与已接受的基础陈述一致。看来正是在这一点概率逻辑起了作用。经典归纳主义逻辑所承认的可证实性与可证伪性之间的对称提示了这样一个信念：把某种可靠性程度的标尺，某种其可达到的上限和下限是真和假的“连续概率程度”（引自Reichenbach），同这些“不可判定的”概率陈述相关起来必定是可能的。然而，根据我的观点，概率陈述正因为它们是完全不可判定的，它们是形而上学的，除非我们使它们因接受某一方法论规则而变得可证伪。因此它们不可证伪的简单结果，并不是它们能更好地或不那么好地得到确认，而是它们根本不能在经验上得到验证。因为否则——假如它们什么也不排除，因而与一切基础陈述相容——就可以说它们被（任何组成程度的）一切任意选取的基础陈述所“验证”，假如它描述某种有关事例的出现的话。

我认为物理学使用概率陈述仅在我在有关概率论已充分讨论的这一方面；更具体地说，它把概率假定，正如其他假说一样，用作可证伪的陈述。但是我应该拒绝参加关于物理学家“实际上”如何工作的这一争论，因为这必定主要是一个解释问题。

我在这里对我的观点与我在第10节中称之为“自然主义”的观点之间的对比作了很好的说明。能够证明的首先是我的观点具有内在的逻辑一致性；其次，摆脱了困扰其他观点的那些困难。大家承认证明我的观点是正确的，这是不可能的，并且与另一种科学逻辑学的支持者进行争论也许毫无裨益。能证明的一切是我对这个特定问题的观点是我一直为之论证的科学概念的一个结果。

81．归纳逻辑和概率逻辑

假说的概率不能还原为事件的概率。这是从前节进行的考虑中引出的结论。但是一种不同的看法可否导致假说概率概念令人满意的定义？

我不认为有可能建立一种假说概率概念，可被解释为表达假说的“可靠性程度”，与“真”和“假”的概念类似（而且它与“客观概率”概念，即与相对频率有如此密切的关系，因而证明使用“概率”一词是正确的）。虽然如此，我现在为了论证起见，要假设这样一种概念事实上已成功地建立，以便提出这样的问题：这会如何影响归纳问题？

让我们假设，某一假说——比方说Schrodinger理论——在某个确定的意义上被承认是“可几的”；或“可几到某一数值程度”，或仅仅是“可几的”，没有具体规定程度。把Schrodinger的理论描述为“可几的”这种陈述我们可称为对理论的评价。

一个评价当然必定是一个综合陈述——关于“实在”的断言——，正如陈述“Schrodinger的理论是真的”或“Schrodinger的理论是假的”一样。所有这些陈述显然说的是关于这个理论的适宜性，因此当然不是重言的。他们说一个理论是适宜的或不适宜的，或者在某种程度上是适宜的。其次，对Schrodinger理论的评价必须是一个不可证实的综合陈述，正如理论本身一样。因为一个理论的“概率”——即理论仍然可接受的概率——看来不可能决定性地从基础陈述中演绎出来。所以我们不得不问：评价如何能得到证明？它如何能受到检验？（因而又发生了归纳问题；参看第1节。）

至于评价本身，也可断言这个评价是“真的”，或者也可说它是“可几的”。如果认为它是“真的”，那么它必定是一个经验上尚未证实的真的综合陈述——先验地真的综合陈述。如果认为它是“可几的”，那么我们需要一个新的评价：可以说是评价的评价，所以是更高水平上的评价。但是这意味着我们陷入了无穷后退。诉诸假说概率不能改善归纳逻辑这种靠不住的逻辑境况。

相信概率逻辑的大多数人坚持这样的观点：借助赋予归纳出来的假说以概率的“归纳原理”可达到这种评价。但是如果他们把概率赋予这个归纳原理本身，那么这个无穷后退仍继续着。如果另一方面他们把“真理”赋予它，那么他们就不得不在无穷后退和“先验论”之间进行抉择。Heymans说，“概率论永远不可能说明归纳论证；因为正是同一个问题隐藏在一方，也隐藏在另一方（概率论的经验应用）。在两种情况下，结论都超出了前提中所给予的”。因此，用“可几的”一词代替“真的”一词，用“不可几的”一词代替“假的”一词毫无收获。仅当考虑到证实和证伪之间的不对称性——那种不对称性产生于理论和基础陈述之间的逻辑关系——时才有可能避免归纳问题的覆辙。

信仰概率逻辑的人也许试图用这种方法来对付我的批评：他们断言概率逻辑产生于人的心智，而人的心智“与经典逻辑的框架紧紧束缚在一起”，所以不能遵循概念逻辑使用的推理方法。我坦白地承认我不能遵循这些推理方法。

82．积极的验证理论：假说如何可“证明它的品质”

我刚刚提出的反对归纳概率理论的异议是否可能转变为反对我自己的观点？似乎它们是可能的；因为这些异议基于“评价”概念。并且显然我也不得不使用这个观念。我谈到一个理论的“验证”；而验证只能被表达为一种评价（在这方面，验证与概率之间没有区别）。此外我也认为不可能断言假说是“真的”陈述，只能断言它们是“暂时的推测”（或这类东西）；并且这个观点也只能用评价这些假说的方法来表达。

这个异议的第二个部分容易回答。我确实不得不使用的。描述为“暂时的推测”（或这类东西）的假说的评价具有重言式的地位。因此它不发生归纳逻辑发生的那类困难，因为这种描述仅仅是解说或解释严格全称陈述，即理论不能以单称陈述中推导出来这个断言（按照定义，这种描述与这个断言是等价的）。

至于异议的第一部分，有关陈述理论得到确认的评价，情况也类似。确认的评价不是一种假说，但是如果给定理论和公认的基础陈述就可以推导出来的。它断言这些基础陈述与理论并不矛盾这一事实，并且在它断言这个事实时考虑到这个理论的可检验性程度，以及直至陈述时间为止理论已经受的检验的严格性。

我们说只要一个理论经受住了这些检验，它就得到“验证”。断言验证的评价（验证评价）确定某些基本的关系，即相容性和不相容性。但是单单相容性不允许我们把某种正的验证度赋予理论：单凭一个理论尚未被证伪的事实显然不能被认为是充分的。因为没有比建立任何数目的、与公认的基础陈述的任何系统相容的理论系统更容易的了。（这个评价也适用于所有“形而上学”系统。）

也许可以提出，如果一个理论与公认的基础陈述系统一致，并且如果再加上这个系统的一部分可从这理论中推导出来，就应该给予某种正的验证度。或者，考虑到基础陈述不是可以从纯理论系统中推导出来的（虽然基础陈述的否定可如此推导出来），人们会提出，应该采取下列的规则：如果一个理论与公认的基础陈述相容，并且如果再加上这些基础陈述的非空子类可以从这个理论与其他公认的基础陈述的合取中推导出来，就应给予它一个正的验证度。

我对这最后的表述并无严重的异议，除了我认为这对一个理论正验证度的适宜表征是不充分的。因为我们想说理论得到更好地或不那么好地确认。但是一个理论的验证度肯定不能只靠计算验证事例的数目，即可用已表明的方法推导出来的公认的基础陈述的数目来确定。因为会有这样的事发生：一个理论得到的验证似乎比另一个差得多，即使我们已借助它推导出非常多的基础陈述，而借助后一个理论推导出的基础陈述却很少。作为一个例子我们可以比较假说“一切乌鸦皆黑”同假说（第37节提到的）“电子电荷有Millikcan测定的值”。虽然在前一类假说的情况下，我们大概遇到许多更为验证的基础陈述，然而我们将判断Millikcan的假说是二者之一得到更好验证的假说。

这表明决定验证度的与其说是验证实例的数目，不如说是所说的那个假说能够并且已经经受的种种检验的严格程度。但是检验的严格程度本身取决于可检验性程度，并且因此取决于假说的简单性：高度可证伪的假说，或更简单的假说，也是高度可验证的假说。当然实际达到的验证度不仅依赖于可证伪度：一个陈述也许是高度可证伪的，然而它也许只得到一点儿验证，或它事实上也许被证伪了。并且它也许虽未被证伪，却被它可从中推导出——或是它的极为密切的接近——的一个可更好检验的理论所代替。（在这种情况下，它的验证度也是低的。）

两个陈述的验证度也许同可证伪度一样并不是在所有情况下都是可以比较的：我们不可能规定一个数值上可计算的验证度，但是只能用正的验证度、负的验证度等等粗略地说。然而我们可制定种种规则；例如这一条规则：我们不应继续把一个正的验证度给予一个已经被主体间可检验的实验证伪的理论，而这些实验基于起证伪作用的假说（参阅第8和22节）（然而，我们在某些条件下可把一个正的验证度给予另一个理论，即使它遵循一条类似的思路。一个例子是Einstein的光子理论，它与Newton的光的微粒说有密切联系）。一般说来，我们认为一个主体间可检验的证伪是最后的（假如它受到充分的检验）：正是通过这种方式使人们感觉到理论的证实和证伪之间的不对称。这些方法论要点每一点都以它自己独特的方式推进作为一步步逼近过程的科学的历史发展。在后来作出的验证评价——即在把新的基础陈述加于那些已经得到承认的基础陈述上面作出的评价——可以用一个负的验证度代替正的，但是反之则不然。并且虽然我认为在科学史上总是理论而不是实验，总是思想而不是观察，开辟通向新知识的道路，我也认为总是实验把我们从死胡同中挽救出来：帮助我们跳出老框框，激起我们去发现新的道路。

因此一个理论的可证伪性或简单性程度进入了理论验证的评价。并且这个评价可被认为是理论和公认的基础陈述之间的一种逻辑关系：考虑到理论已经经受的检验严格程度的一种评价。

83．可验证性、可检验性和逻辑概率

在评价一个理论的验证度时我们考虑到它的可证伪度。一个理论越能更好地得到验证，它就越可检验。然而，可检验性与逻辑概率的概念是相反的，因此我们也能说一个验证评价考虑到了该陈述的逻辑概率。而逻辑概率本身，如我们在第72节已表明的那样，与客观概率——事件概率——的概念有关。因此，通过考虑到逻辑概率，把验证概念与事件概率概念连结起来，即使也许只是间接地和松散地。我们认为这里也许同上面批评的假说概率学说有某种联系。

当试图评价一个理论的验证度时，我们可推理如下：它的验证度将随它验证实例的数目而增长。这里我常常给予第一个验证实例比后面几个大得多的重要性：一旦一个理论得到充分验证，进一步的实例只能提高它的验证度很少一点儿。然而如果这些新的实例迥然不同于早先的实例，即如果这些实例在一个新的应用领域验证这个理论，这条规则就不适用。在这种情况下，它们就可极大地增加验证度。普遍性程度更高的理论的验证度因此可比普遍性程度较低（所以可证伪度也较低）的理论的验证度更大。同样，精确度更高的理论比精确度较低的理论可得到更好的验证。为什么我们不把一个正的验证度给予手相者和占卜者的典型预言的一个理由是他们的预测是如此小心谨慎和不精确，以致这些预言是正确的逻辑概率极高。并且如果我们被告知说，一些更为精确、因而逻辑上不那么可几的这类预测曾经是成功的，那么一般说来，我们怀疑的往往不是它们的成功，而是它们所谓的不可几性：因为我们倾向于认为这些预言是不可验证的，在这些情况下我们也往往从它们低的验证度推论到它们低的可检验度。

如果我们把我的这些观点同蕴涵在（归纳）概率逻辑中的观点加以比较，我们就会得到一个真正值得注意的结果。根据我的观点，一个理论的可验证度——以及一个真实上已通过严格检验的理论的验证度，可以说均与它的逻辑概率处于反比关系中；因为它们都随它的可检验性和简单性程度而增加。但是概率逻辑蕴涵的观点正好是这种观点的对立面。这种观点的支持者使一个假说的概率的增加与它的逻辑概率成直接比例——虽然无疑他们想要他们的“假说概率”所要代表的与我试图用“验证度”所表明的完全是同一件事。

在那些以这种方法论证的人中间是Keynes用了“先验概率”一词来指我称之为“逻辑概率”的东西（参见第113页注）。他就一个“概括”g（即一个（假说）以及“条件”或前件或条件从句φ和“结论”或后件或结论句f作了下列完全确切的评论：“条件φ内容越丰富和结论f内容越贫乏，我们赋予概括g的先验“概率就越大。这个概率随着φ中的每一次增加而增加，它随着f中的每一次增加而减少。”正如我说的，这完全正确，即使Keynes并没有在他称之为“某一概括的概率”——与这里被称为“假说概率”的相一致——与它们的“先验概率”之间作出明确的区分。虽然如此，Keynes用他的“概率”所指的与我用“验证”所指的是一回事，这一点可从他的“概率”随验证实例数目以及（最为重要的）也随实例之间多样性的增加而增加中看出。（但是Keynes忽视了这一事实：其验证实例属于各种各样应用领域的理论常常相应地具有高度的普遍性。因而他的两个要求，即获得高的概率——最小可能的普遍性和验证实例最大可能的多样性——一般是不相容的。）

用我的术语来表达，Keynes的理论蕴涵着验证（或假说概率）随可检验性而降低。他对归纳逻辑的信仰引导他达到这个观点。因为使科学假说尽可能确定无疑，正是归纳逻辑的倾向。只有在种种假说能被经验证明为正确时才赋予它们以科学意义。只是因为理论和经验陈述之间密切的逻辑接近，一个理论才被认为科学上有价值。但是这不过意味着理论的内容必须尽可能少地超越经验上确定的。这个观点与否认预测的价值有密切的联系。Keynes写道：“预测的独特优点，……完全是想象性的。被考察的实例的数目和它们之间的类似是基本要点，碰巧在检查它们之前还是之后提出某一特定假说的问题是完全无关的。”Keynes在援引“先验地提出的”——即我们在对它们已有充分的支持以前根据归纳的理由提出的——假说时，写道：“……如果它不过是一种猜测，在它之前有一些事例或所有的事例都证实它，这一饶悻事实对它的价值丝毫不增添什么。”这种预测观点当然是前后一贯的。但是它使人们感到奇怪为什么我们总是要进行概括。有什么可能的理由要建立所有这些理论和假说？归纳逻辑的立场使这些活动成为完全不可理解的。如果我们评价最高的是可得到的最可靠的知识——并且如果预测本身对验证无所贡献——，那么为什么我们依然不满足于我们的基础陈述？

引起十分类似的问题的另一个观点是KaiCom的观点。虽然我认为正是简单的理论，以及那些很少利用辅助假说（参阅第46节）的理论能得到很好的验证，正因为它们的逻辑不可几性，KaiCom根据类似Keynes的理由正好以相反的方式解释这种情况。他也看到我们常常把一个高概率（用我们的话说，高的“假说概率”）赋予简单的理论，尤其是那些需要很少辅助假说的理论。但是他的理由是与我的对立的。他不像我所做的那样把一个高概率赋予这些理论，因为它们是可严格检验的，或逻辑上不可几的；那就是说因为它们可以说是先验地具有与基础陈述矛盾的许多机会。相反地，他把高概率赋予具有很少辅助假说的简单理论，是因为他认为由很少假说组成的系统先验地比由许多假说组成的系统与实在发生矛盾的机会更少。人们在这里又一次不明白为什么老是要费神去建立这些冒险的理论。如果我们怕与实在发生冲突，为什么通过作出断言把理论招来？我们最安全的方针是采取一个没有任何假说的系统。〔“言多必失，不说为佳”］

我自己的规则要求所用的辅助假说要尽可能地少（“利用假说的节约原理”）与KaiCom的考虑毫无共同之处，我对仅仅减少我们陈述的数目不感兴趣：我感兴趣的是它们在高度可检验性意义上的简单性。正是这种兴趣一方面导致我的应尽可能少地利用辅助假说的规则，另一方面导致我的公理——最基本的假说——数目应尽量减少的要求。因为这后一点出于这一要求：应选取普遍性水平高的陈述，以及由许多公理组成的系统如有可能应从具有更少“公理”和普遍性水平更高的系统中演绎出来（因此用后一系统解释）。

84．论关于“真的”和“被验证的”概念的使用

在这里概述的科学逻辑学中，避免使用“真的”和“假的”概念是可能的。它们的地位可由关于可推导性关系的逻辑考虑来代替。因此我们不一定说：“假如理论t和基本陈述b是真的，预测p就是真的。”我们可以说，陈述p是从t和b（非矛盾的）合取中得出的结论。一个理论的证伪可用同样方法描述。我们不一定说这理论是“假的”，但我们可以说它被一组公认的基础陈述反驳。关于基础陈述我们也不一定说，它们是“真的”或“假的”，因为我们可以把它们的得到承认解释为协约决定的结果，而公认的陈述是这种决定的结果。

这当然不是说，我们禁止使用“真的”或“假的”概念，或它们的使用造成了任何特殊的困难。我们可以避免它们这一事实本身表明它们不可能引起任何新的基本问题。“真的”和“假的”概念的使用十分类似像“重言”、“矛盾”、“合取”、“蕴涵”和诸如此类这些概念的使用。这些是非经验概念、逻辑概念。它们描述或评价一个陈述，不考虑经验世界中的任何变化。虽然我们假定物理对象（Lewin意义上的“发生同一的［genidentical］对象”）随时间的推移而变化，我们仍然决定以这种方式使用这些逻辑谓词，因而陈述的逻辑性质成为无时间性的了：如果一个陈述是重言的，那么它永远是重言的。我们也把这同样的无时间性赋予“真的”和“假的”概念，这与日常的用法是一致的。说一个陈述昨天是完全真的，但今天变成假的，这不是日常的用法。如果昨天我们评价一个陈述是真的，今天评价它是假的，那么我们今天不言而喻地断言我们昨天错了；甚至昨天这个陈述也是假的——无时间性地假的——但我们错误地“把它当作真的”。

这里人们能十分清楚地看到真理和验证之间的不同。评价一个陈述得到验证或没有得到验证也是一个逻辑评价，因此也是没有时间性的；因为它断言在某一理论系统和某种公认的基础陈述系统之间有一定的逻辑关系。但我们谈到一个陈述时决不能简单地说它本身或自己“得到验证”（以我们说它是“真的”这种方式）。我们只能说它就某种基础陈述系统而言得到验证——直到某一特定时刻以前得到承认的系统。“一个理论直到昨天得到的验证”与“一个理论直到今天得到的验证”在逻辑上不是等同的。因此我们必须给每一个验证评价添上一个下标——表征验证与之有关的基础陈述系统的下标。（例如用它得到承认的日期）。

所以验证不是一个“真值”；即它不能与“真的”和“假的”概念（它们没有时间标志）处于同等的地位；因为对于同一陈述可以有任何数目的不同的验证值，这些值确实都可能同时是“正确的”或“真的”。因为它们是一些可从理论和在不同时期承认的不同组基础陈述中合乎逻辑地推导出来的值。

上述的评论也可帮助阐明我的观点和实用主义者的观点之间的对立，他们建议用一个理论的成功——因而用它的有用性，或它的确证或它的验证来定义“真理”。如果它们的意图只是要断言一个理论成功的逻辑评价不过是它的验证评价，那我可以同意。但是我认为把验证概念同真理概念等同起来远不是“有用的”。这在日常用法中也是要避免的。因为人们谈到一个理论时完全可以说，它迄今根本末被验证，或它仍未被验证。但我们一般不应说一个理论迄今不是真的，或它仍然是假的。

85．科学的道路

人们在物理学进化中可以辨认出某种总方向——从普遍性水平较低的理论到水平较高的理论的方向。这通常被称为“归纳”方向；也许会认为物理学沿这个“归纳”方向进展这个事实可被用作支持归纳方法的一个论据。

然而沿归纳方向进展不一定由归纳推理序列组成。实际上我们业已表明它可用完全不同的术语－－用可检验性和可验证性程度——来解释。因为一个已得到充分验证的理论只能被一个普遍性水平更高的理论来代替；即被一个可更好检验的、并且此外包含旧的、得到充分验证的理论（或至少很接近于它）的理论来代替，所以把那种趋向——向普遍性水平越来越高的理论进展——描述为“拟归纳”趋向更好。

这种拟归纳过程应设想如下。提出具有某种普遍性水平的理论，并用演绎法检验；在这以后，又提出普遍性水平更高的理论、又借助具有以前水平的普遍性的理论检验，如此等等。检验方法是不变地根据从较高水平到较低水平的演绎推理；另一方面普遍性水平按时间次序通过从较低水平到较高水平而达到。

也许提出这个问题：“为什么不直接发明普遍性水平最高的理论！为什么等待这种拟归纳进化？也许这不就是因为毕竟有归纳要素包含在其中吗？”我不认为如此。具有一切可能的普遍性水平的意见——推测或理论——一次又一次被提出。那些普遍性水平太高的理论（即离开当时可检验的科学达到的水平太远）也许产生一种“形而上学系统”。在这种情况下，即使陈述应该可以从这个系统中演绎出来（或只是不完全地推导出来，例如在Spinoza系统的情况下），这些陈述属于流行的科学系统，在其中也不会有任何新的可检验陈述；这意味着没有任何判决性实验能被设计出来检验所说的系统。如果在另一方面，可以为它设计一个判决性实验，那么系统作为第一个近似将包含某个得到充分验证的理论。并且同时也包含某种新的东西——能够接受检验的东西。因此，该系统当然不是“形而上学的”。在这种情况下，可把所说的系统看作为科学拟归纳进化上的新进展。这说明为什么一般只是由那些提出来试图应付当时问题境况，即当时的困难、矛盾和证伪的理论来建立与当时科学的联系。在对这些困难提出一种解决办法时，这些理论可指出通向判决性实验的道路。

为了获得一个这种拟归纳科学进化的图景或模型，可把种种思想和假说看作为悬浮在液体中的粒子。可检验的科学是这些粒子在容器底下的沉淀物：它们是分（普遍性的）层沉淀的。沉积的厚度随这些层次数目而增长，每一个新的层次相当于比在它下面的那些理论更为普遍的理论。这个过程的结果是以前在较高的形而上学区漂浮的思想有时可因科学的增长而被触及，因而与它接触而沉淀。这些思想的例子是原子论；单一物理“本原”或最终元素（其他东西由此衍生出来）的思想；地动理论（被Bacon认为虚构而反对）；古老的光微粒说；它的液体理论（作为金属传导的电气假说而复活）。所有这些形而上学概念和思想，即使在其最初的形式，也许已帮助把秩序引入人的世界图景中，并且在一些情况下也许甚至已导致富有成效的预测。然而这样的一个思想获得科学的地位，仅当它存在于可证伪的形式时；那就是说，仅当用经验在它与某个对立理论之间作出抉择成为可能时。

我的研究已探索了本书开头所采取的一些决定和约定——尤其是划界标准——的种种结果。我们在回顾时可以试图最后全面地看一看已经呈现的科学和科学发现的图景（我在这里想到的不是作为一种生物学现象，作为一种适应工具，或作为一种迂迴的生产方法的科学图景：我想的是它的认识论方面）。

科学不是一个确定的或既成的陈述的系统；它也不是一个朝着一个终极状态稳定前进的系统。我们的科学不是绝对的知识（episteme）：它决不能自称已达到真理，甚或像概率一样的真理的替代物。

然而科学具有的价值不只是生物学的生存价值。它不仅是一个有用的工具。虽然它既不能达到真理，也不能达到概率，追求知识和探索真理仍然是科学发现最有力的动机。

我们不知道：我们只能猜测。并且我们的猜测受到对我们能够揭示——发现的定律、规律性的非科学的、形而上学的（尽管在生物学上可以说明的）信仰指导。像Bacon一样，我们可把我们自己的当代科学——“人们现在通常应用于自然界的推理方法”——描述为由“轻率的和过早的预感”组成的，描述为“偏见”。

但是，我们的这些不可思议的富有想象力的和大胆的推测或“预感”受系统的检验仔细而清醒的控制。我们的任何“预感”一旦提出，都不能被教条地坚持。我们的研究方法不是维护它们，为了证明我们是多么正确。相反，我们努力推翻它们。我们努力利用我们的逻辑的、数学的和技术的武库中的所有武器来证明我们的预感是错的——为了代替它们提出新的未被证明的和不可被证实的预感，Bacon嘲弄地称它们为新的“轻率的和过早的偏见”。

有可能更为乏味地解释科学的道路。人们会说，进步“……只有两种方法获得：通过收集新的知觉经验，以及通过把已经得到的那些经验更好地组织起来”。但是科学进步的这种描述，虽然实际上并不错，似乎没有抓住要害。它也是Bacon归纳法的残余：太使人想起他的勤奋收集“无数成熟的应时的葡萄，他期望科学之酒从中流出：想起他的始于观察和实验，然后进到理论的科学方法神话（顺便说一句，这种神话方法仍然激励一些试图实践它的新近出现的科学，原因是普遍认为它是实验物理学的方法）。

科学的进展并不是由于越来越多的知觉经验随时间而积累这一事实。它也不是由于我们正在越来越好地利用我们的感觉这个事实。科学不可能从未被解释的感觉经验中提炼出来，不管我们多么勤奋地收集和挑选它们。大胆的想法，未被证明的预感，以及思辨的思想是我们解释自然的惟一手段：我们把握自然的惟一的工具，我们惟一的仪器。并且我们为了获奖，就必须使它们冒风险。在我们之中不愿意使他们的思想去冒反驳的风险的人，不能参加科学游戏。

甚至用经验仔细地认真地检验我们的思想本身也受思想启发：实验是有计划行动，其中每一步受理论支配。我们并不是偶然地碰见我们的经验的，我们也让它们像溪流那样在我们身旁流过。宁可说，我们必须是主动的：我们必须“制造”我们的经验。正是我们总是向自然界提出问题；正是我们一而再、再而三试图提出这些问题，为了得到明确的“是”或“否”（因为自然界不给答案，除非逼着它）。最后，正是我们给出答案；正是我们自己在认真仔细研究之后决心回答我们向自然界提出的问题——在持久地和诚挚地试图从自然界那里得到一个毫不含糊的“否”之后。Weyl说，“我永远要记录我对实验家在他的斗争中工作的无限敬意，他在这种斗争中从毫不让步的造物主那里夺取可解释的事实，造物主清楚地知道如何用一个决定性的不——或用一个听不见的是来对付我们的理论”。我完全同意他。

关于episteme——绝对的确定的可证明的知识——的古老的科学理论已证明是一个偶像。科学客观性的要求使每一个科学陈述必定仍然永远是试探性的成为不可避免。它当然可被验证，但是每一次验证是相对于其他陈述而言的，这些陈述又是试探性的。只有在我们确信的主观经验中，在我们的主观信仰中，我们才可能是“绝对确定无疑的”。

蒙昧主义的防御工事随着确定性的偶像（包括不完全确定性或概率的偶像）而垮台了。蒙昧主义阻碍科学前进的道路，妨碍我们问题的大胆性，危害我们检验的严格性和完整性。这种错误的科学观表现于渴望成为正确；因为造就科学家的不是他之拥有知识、不可反驳的真理，而是他坚持不懈地以批判的态度探索真理。

那么我们的态度不得不是一种无可奈何的态度吗？我们是否不得不说，科学只能完成它的生物学任务；即至多它只能在可验证它的实际应用中证明它的品质吗？它的智力问题是不可解的吗？我不认为如此。科学决不追求使它的回答成为最后的甚至可几的这种幻想的目的。宁可说，它的前进是趋向永远发现新的、更深刻的和更一般的问题，以及使它的永远是试探性的回答去接受永远更新的和永远更严格的检验这一无限然而可达到的目的。

追记（1972）

我书的前一章（即最后一章）中，我试图阐明，我说的一个理论的验证度是指总结该理论如何经受住检验以及这些检验如何严格的简要报告。

我从未偏离过这个观点。这里我将补充以下几点：

（1）逻辑的和方法论的归纳问题不是不可解决的，但是我的书提供了一个反面的解决：（a）我们决不能合乎理性地证明一个理论，这就是说，我们决不能合乎理性地证明对一个理论真理性的信念，或对它可能是真的信念。这种否定解决同下述包含在优先选择比其他理论得到更好验证的理论的规则中的肯定解决是相容的；（b）我们有时能够合乎理性地证明根据理论的验证，即根据竞争理论的批判讨论的现状（从评价它们接近真理性，即逼真性的观点对它们进行批判讨论和比较）优先选择某一理论。这种批判讨论的现状，原则上可以它们验证度的形式报告。然而，验证度不是逼真性的量度（逼真性的量度必须是没有时间性的），而只是关于我们到某一时刻为止能够确定什么的报告，关于根据对可得到的理由（这些理由已被提出来支待或反对理论的逼真性）所作的判断比较竞争理论主张的报告。

（2）逼真性观念提出的一个形而上学问题是：自然界中有没有真正的规律性？我的回答是：“有”。支持这个回答的论据（非科学的，但也许是“超验的”；参阅P．368）是：如果自然界中没有显而易见的规律性，那么观察和语言都不可能存在：描述性语言和论证性语言都不可能存在。

（3）这个回答的力量依赖某种常识实在论。

（4）实用的归纳问题也就自行解决了：在实践上优先选择根据理性讨论更接近于真理的理论是冒风险的，但是合乎理性

（5）我认为心理学问题（为什么我们相信如此选择的理论继续值得我们信任？）是没有什么意义的。

（6）这种方法并未解决所有可能的“归纳问题”（参阅我即将出版的书：Objective Knowledge：An Evolutionary Approach）。

Post Views: 246

卡尔·波普尔《科学发现的逻辑》

第一章 对于若干基本问题的考察

第二章 论科学方法理论问题

第三章 理论

第四章 可证伪性

第五章 经验基础问题

第六章 可检验度

第七章 简单性

第八章 概率

第九章 对量子论的若干意见

第十章 验证或理论如何经受住检验

追记（1972）

评论

发表回复 取消回复

第一章对于若干基本问题的考察

第二章论科学方法理论问题

第三章理论

第四章可证伪性

第五章经验基础问题

第六章可检验度

第七章简单性

第八章概率

第九章对量子论的若干意见

第十章验证或理论如何经受住检验

发表回复取消回复