死的。当我们掷两个骰子的时候,我们可以说:“大概我们不会掷成双六”,因为我们知道大390 多数掷出的结果不是双六。另一方面,假定我有证据可以认为但并没有证明某种疾病总有某种杆状菌出现;我就可以说,就这种疾病的一个实例来说,大概会有所说的那种杆状菌出现。在每一种情况下都有一种三段论法。在第一种情况下,大多数A 是B;这是一个A;所以这大概是一个B。在第二种情况下,大概凡A 都是B;这是一个A;所以这大概是一个B。可是第二种情况却更难以变为一个频率。让我们探讨一下这是否可能。在某些情况下,这显然是可能的。例如,大多数的词都不包含Z 这个字母。因而如果我们随便选取某个词,那么大概它的所有字母都不是Z。这样,如果A=所说的那个词的字母组成的类,B=Z 以外的字母组成的类,我们就得到一个属于我们的第二个假三段论法的实例。当然我们必须通过某种方法来给这个词下定义,使得我们暂时对它毫无所知,例如《汉姆莱特》的第8000个词。或者《简明牛津字典》的第248 页上第三个词。假定你现在不知道它们是什么词,你打赌说它们不包含Z 就不失为聪明。在我们的第二种假三段论法的所有实例中,显然我一直把它叫作“基本类”的东西是作为由类组成的类来给出的,因而它的逻辑结构是十分重要的。概括一下上面的例:设x 是这样一个由类组成的类,它的大多数分子都包括在某一类β中;那么我们就可以从“x 是一个a”和“a 是一个x”得出“x大概是一个β”的结论。(就上面的例来说,x 是由词组成的类,a 是由某一个词的字母组成的类,β是不包括z 在内的全部字母。)奇怪的现象是用“x的和”来表示由x 的分子组成的类,我们的前提不足以证明x 的和的一个分子大概是β的一个分子。例如,设x 由STRENGTH,QUAIL,MUCK 三个词,再加上所有不包括在这三个词里出现的字母的词组成。那么x 的和就包括字母表全部的字母,可能不包括Z①。但是“x 391 是一个a 并且a 是一个x”使得x 大概不是在上面这三个词里出现的字母之一,而“x 是x 的和的一个分子”并不能使这个现象带有概然性。这就具体说明了基本类具有与概率相关的结构时所产生的复杂情况。但是在类似上面的情况中,我们仍然可能用频率来确定可信性,尽管不那样简单。可是还有另外一类更为重要的情况,我们只有把它们和归纳连系起来看才能对它们进行适当的讨论。这些就是我们具有使得所有的A 都是B 具有概然性的归纳证据,以及我们推论一个个别的A 大概是一个B 的情况;例如,大概凡人都有死(不是凡人大概都是有死的),因此苏格拉底大概是有死的。这是属于我们第二种的一个假三段论法。但是如果我们可以把“大概凡人都有死”中的“大概”改变为一个频率,它的改变方法一定不那么简单。因此我将把这一类情况的讨论留给下一阶段。我们将发现许多不是从频率得出的可信度的例子。对于这些例子我现在就要加以考察。C.与件的可信性在这一节里我要提出一个非正统的意见,即与件可能不带确定性。到现在为止存在着两种看法:第一,在知识的明确表达上我们是从本身带有必然性的可以被定义为“与件”的一些前提开始的;第二,既然任何知识都不带确定性,所以并不存在与件,但是我们的合理信念形成了一个关闭的系统。前一种看法是传统的看法,是从希腊人传下来的,在欧几里得几何学和神学中得到了至高无上的地位;后一种看法,如果我没有弄错的话,是黑格尔首先提出的,但在我们这个时代为杜威所拥护而产生了最大的影响。我392 要提出的是一个折衷的看法,但是大体却偏向于传统的看法而不赞成黑格尔和杜威所主张的那种看法。我把“与件”定义为不依靠从其它命题得出的任何论证,本身就具有某种程度的合理可信性的命题。显然一个论证的结论不能从论证得到比属于前① 是否包括Z 要看我们是否把“Zoo”当作一个词来决定。提更高的可信度;因此,如果有合理的信念这类东西的话,那就必然有不完全依靠论证的合理信念。由此并不能得出这个结论:有着完全不是从论证得出其可信性的信念,因为一个命题可能同时本身可信而又是从其它本身可信的命题得出的结论。但是由此却可以得出这个结论:每个不管具有多大程度的合理可信性的命题一定不是(a)只靠它本身,就是(b)只作为本身具有合理可信性的前提的结论,不然就是(c)因为它本身具有某种可信度,并且还是通过证明性的或概然性的推理从本身带有某种可信度的前提得出的结论。如果所有本身多少具有可信性的命题都带有必然性,(c)这种情况就没有什么重要性,因为任何论证也不能使这类命题带有更多的必然性。但是按照我所主张的看法,(c)这种情况却具有最大的重要性。凯恩斯采用了传统的看法,他在他写的《概率论》第16 页上曾经提出这种看法。他说:“为了使我们对于具有低于必然性的概率的p 可以抱有合理的信念,我们就必须知道一组命题h,并且还要知道某个断言p 与h 之间的概率关系的次要命题q。”“在上面这个说明中,我们排除了一种可能性。人们假定我们对于p 不能抱有程度低于必然性的信念,除非靠知道属于上面所说类型的一个次要命题。换句话说,这类信念只能通过觉察到某种概率关系而产生。..所有通过对于直接认知的客体的观照这种完全直接的方式,而不是掺有任何论证以及通过对于任何其它知识对它的逻辑关系的观照,而得到的知识相当于必然的合理信念而不是只具有概然程度的合理信念”。我想批驳这种看法。为了这个目的我将考察(1)模糊的知觉,(2)不确实的记忆,(3)对于逻辑关系的模糊不清的认识。1.模糊的知觉看下面这类常见的经验。(a)你听见一架飞机掠空而过;最初你确信你听见了这种声音,最后你确信你听不见这种声音,但是中间有一段时间你却不能确定你仍然听到还是不再听到这种声音。(b)你在天明时观看金星;最初你看见这颗行星照耀得很明亮,最后你知道日光已经使它看不见了,但是介乎这两个时间之间这一段时间你可能怀疑你是否仍然看得见这颗行星。(c)你在旅途中可能带上许多跳蚤;你开始驱除它们,最后你确信你已经达到目的,但是在中问一殷时间你却不时受到可疑的痒的感觉的袭击。(d)你错用了盛醋的壶来煮茶;结果糟不可言。你把壶刷洗一遍再用,但是那种不好的味道无疑仍然存在。经过第二次刷洗,你就怀疑你是否还能尝到醋的味道;经过第三次刷洗,你就确信不再尝到醋的味道了。(e)你的下水道坏了,你请来一位管匠。最初在他修理之后你确信那股难闻的气味已经消失,但是经过不同程度的怀疑阶殷,你会逐渐确信又闻到了那股气味。这类经验是大家都熟悉的,任何关于以感官知觉为基础的知识的理论都必须把它们考虑进去。2.不确实的记忆在《暴风雨》(第一幕,第二场)中,普罗斯波罗让米兰达探索一下“过去时光的黑暗深渊”;她说:“我不是有四五个侍女照管过我吗?”接着普罗斯波罗证实了她的带有怀疑的回忆。我们大家都有过这类感到不十分确实的记忆。一般来说,如果值得做的话,我们能够从其它证据来判断记忆是否确实,但是这对于我们当前的题目却没有关系,我们当前的题目是记忆本身具有某种程度的可信性,尽管这种程度远远够不上完全的必然性。一个具有相当大的可信度的记忆对于使我们相信某件我们对之具有其它证据的过去发生的事件的理由来说也构成一个增添的因素。但是这里必须明确一点。记得不确实的过去事件本身就有部分的可信性;但当我把回忆当作相信的一个理由时,我就不再把过去发394 生的事件当作与件,因为作为与件的并不是过去发生的事件而是现在的回忆。我的回忆给予被忆起的事件以某种可信性;至于可信性有多少,这一点我们可以根据关于记忆错差的频率统计研究以归纳方法大体断言出来。但是这与作为与件来看的过去发生的事件却是两回事。这类与件必须由记忆补充是一个我已经在别的地方讨论过的题目。3.对于逻辑关系的模糊认识任何一个不具超人数学能力的人,如果他研究过数学的话,一定经常遇到几乎不能“看出”一个证明中某一步的经验。理解一个证明的过程由于把步骤划得很小而变得比较容易,但是不管我们把步骤划得多么小,在问题非常复杂的情况下总有一些步骤是困难的。显然如果我们已经尽可能地把步骤划得很小,每个步骤就必然是一个与件,因为不然的话,每一个企图证明的努力都会陷入没有止境的后退。比方说让我们看一个巴巴拉式的三段论法。我说:“凡人皆有死”,而你的意见也和我一致。然后我说:“所以苏格拉底有死”,而你却说:“我看不出这个结论是怎样得出来的”。在这种情况下我怎么办呢?我可以说:“你看不出如果f(x)..永远为真,那么( )为真吗?你看不出因此如果( )永远蕴涵着x yf j (),那么(苏格xj(a) 拉底)就蕴涵着(苏格拉底)吗?你看不出我能让y‘x是一个人’代替‘jxx yx’吗?你’,并且让‘是有死的’代替‘看不出这就证明我的论点了吗?”一个学生能够理解这套说法而不能理解原来的三段论法肯定是个心理学上的怪物。而且即使有这样一个学生,他还是必须“看出”我的论证中的步骤。由此可以看出,当我们把一个论证讲得尽可能简单的时候,每一步中所断言的关联就必须是一个与件。但是每一步中的关联都具有最高度的可信性却是不可能的,因为即使是最好的数学家有时也会出错。事实上,我们对于命题之间的逻辑关连的认识就像我们的感官知觉和记忆一样,是可以按照它们的可信度来排列的。在有些认识中,我们对于逻辑关联看得清楚到无可怀疑的地步,而在另外一些认识中,我们对于逻辑关连的认识却模糊到没有把握说出我们是否看到这种关联。以后我将假定一个与件,按照在本节开始所规定的意思来讲,在或多或少程度上可能是不确定的。我们在理论上可以把这种不确定性和那种从数学的概率得到的不确定性连系起来,如果我们认为一种不确定性可能大于,等于,或小于另一种不确定性的话。举例来说,当我认为我听见一种很轻的声音而不能确定有无声音的时候,在理论上我就可以说:这种声音的发生与掷骰子出双六具有同样程度的合理可信性。在某种程度上,这类比较可以通过收集关于模糊感觉的错误证据并找出它们的频率来加以检验。所有这些话都是含糊不清的,我看不出怎样才能把它讲清楚。但是无论如何它让我们想到与件的不确定性具有数量的性质,可以等于或不等于从一个概率推论得到的不确定性。我将假定这是事实,同时也承认在实际应用上难以对与件的不确定性进行数值测定。我们可以说在怀疑使得相信与不相信处于平衡状态时,不确定性就是一半。但是这种平衡只有通过内省才能得到,是不能用任何检验来证实的。承认与件的不确定性使得计算一个命题的合理可信性的方法变得复杂起来。让我们假定某一个命题P 本身具有可信度x,这就作为一个与件;并且让我们假定还有若干命题的一个合取命题h,它本身具有可信性y,根据这个合取命题我们可以通过一个具有可信性z 的论证而使p 具有可信度w。在这种情况下p 的全部可信性是多少?也许我们想说它是x+yzw。但是h 显然除了本身的可信性以外还有推导出来的可信性,这一点也会增加了的可信性。事实上,这些复杂情况很快就变得难于驾驭。这就产生了某种接近黑格尔和杜威的理论的东西。如果已知许多命题,其中每个命题本身都具有相当高的可信度,并且已知一个推理系统,通过这个系统这些不同的命题可以增加彼此的可信性,那么最后就可能得出一组从整体来看具有根高的可信度的互相关联的命题。在这一组命题之内,一些命题只是通过推理才得出来的,但是没有任何命题仅仅是前提,因为那些是前提的命题同时也是结论。我们可以把知识的大厦比作由许多桥墩支持的一座桥梁,每个桥墩不仅支持着车行道而且通过互相连结的铁梁还能帮助其它桥墩的稳定。这些桥墩相当于本身具有某种可信性的命题,而桥的上部则相当于只是通过推理才得出的命题。但是尽管每个桥墩可以从其它桥墩得到力量,支持全部重量的还是坚实的地面;同样,支持整座知识大厦的还是本身的可信性。D.主观必然性的程度主观必然性是一个心理学的概念,而可信性则是一个至少有一部分是属于逻辑的概念。它们之间是否具有任何关联的问题是我们是否具有任何知识的问题的一种形式。这样一个问题在绝对怀疑论的基础上是无法讨论的;除非我们愿意断言某种东西,否则任何论证都是不可能的。让我们首先区分三种必然性。1.一个命题函项对于另一个命题函项来说具有必然性,如果满足第二个命题函项的项目组成的类是满足第一个命题函数的项目组成的类的一部分。例如,“x 是一个动物”对于“x 是一个有理性的动物”来说就具有必然性。这种意义的必然性属于数学的概率。我们将把这种必然性叫作“逻辑上的”必然性。2.一个命题具有必然性,如果它有着最高度的可信性,不管可信性来自本身还是来自论证。就这种意义来讲,也许任何命题都不具有必然性;换句话说,不管这个命题对于一个特定的人来说带有多么大的必然性,更多的知识还是可能增加它的可信度。我们将把这种必然性叫作“认识论上的”必然性。3.一个人在他对于一个命题的真理不抱任何怀疑时就认为这个命题具有必然性。这是一个完全属于心理学的概念,我们将把它叫作“心理学上的必然性”。由于确信的程度达不到主观的必然性,一个人可能或多或少确信某种事物。我们感到确信明天会出太阳,拿破仑也确有其人;我们相信量子论和有过佐罗亚斯德这个人的程度就差一些;对于397 爱丁敦得出的电子数完全正确,或者在特洛伊城被围时有个名叫亚加梅农的国王,我们相信的程度就更差了。这是一些已经取得一致意见的问题,但是另外还有一些意见分歧的问题。有些人确信丘吉尔是个好人而斯大林是个坏人,其它一些人的意见却正好相反;有些人完全确信上帝站在协约国一边,其它一些人则认为上帝站在德国一边。因此主观的必然性不是真理的保证,甚至也说不上是高度的可信性的保证。谬误不仅包括那种相信虚伪事物的绝对谬误,还包括那种相对于相信者的知识来说,相信的程度超过或不及被相信的命题应有的可信度所保证的程度而产生的数量性质的谬误。一个完全相信某一匹马在德贝赛马中定能获胜的人即使这匹马真地获胜也算是犯了错误。从广义上说,科学方法是由目的在于使相信程度和可信度尽可能完全符合的技术与规则组成的。可是除非我们从一些在认识论上看来可信在主观上也接近必然的命题出发,我们是不能着手寻求这种和谐的。这就让我们想到一种笛卡尔式的探讨,但是这种探讨必须具有某种非怀疑论的主导原理才可能获得结果。如果在可信性与主观必然性之间没有任何关系,那就不可能有知识这种东西。在实际应用上我们假定一类信念可以被认为是真的,如果(a)所有仔细研究过它们的人都完全相信它们,(b)没有反对它们的正面论证(c)没有任何已知理由可以认为如果它们不真人类还要相信它们。在这个基础上,人们一般认为一方面是知觉判断,另一方面则是逻辑与数学,囊括了我们知识中最带必然性的东西。我们将看到如果我们要得到科学的知识,除了逻辑与数学之外,还需要补充某些超出逻辑范围以外的原理,其中归纳是迄今为止(我认为这是错误的)获得最普遍承认的一个原理。这些超出逻辑范围以外的原理提出了一些我们要去研究的问题。完全的合理性不在于相信真理而在于给予每一个命题以相当于它的可信度的相信程度。就经验命题来讲,可信度是随着新的证据的发现而改变的。在数学中,一个不是数学家的有理性的398 人会相信别人告诉他的知识;所以在数学家发现他们的前辈著作中的错误的时候,他就会改变他的信念。数学家尽管可能发生错误,他本人还不失为一个完全有理性的人,如果这个错误在当时很难被人发现的话。我们是否应当把合理性作为目的是一个伦理上的问题。我将在下一节里考察这个问题的某些方面。E.概率和行为巴特勒主教所说的概然性是人生的指南这句话是大家都熟悉的。让我们简单看一下它可能表示的意思是什么,它在什么范围内是真的,以及相信它具有它似乎具有的真理程度这件事包含着什么内容。大多数伦理学说都属于两种类型之一。按照第一种类型的说法,好的行为就是遵守某些规则的行为;按照第二种类型的说法,好的行为是为了实现某些目的。还有一些不属于这两种类型的学说,但是就我们的目的来讲,我们可以不必去管它们。康德和十诫是属于第一种类型的学说的例证。诚然十诫不是这类学说中的完全例证,因为十诫中有些条是有理由根据的。你一定不要崇拜偶像,因为这样上帝会感到妒忌:你应当尊敬父母,因为这样可以减少你的死亡机会。当然,人们可以很容易找到不去杀人和偷窃的理由,但是十诫中却没有讲到这些。如果讲出理由,那就会有例外,一般来说常识已经承认这些例外,但是圣经原文中却没有提到它们。当我们把伦理学当作一些指导行为的规则的时候,概率在这里就不起什么作用。只有在第二种类型的伦理学说,即那类认为善就在于完成某些目的的伦理学说中,概率才是有关宏旨的东西。只就对于概率的关系而论,选择什么样的目的所产生的差别是很小的。为了明确起见,让我们假定选择的目的是使快乐最大限度地超过痛苦,而一次快乐和一次痛苦被认为相等,如果一个具有机会的人对于他是否具有两者或者两者都不具有感到无动于衷。我们可以把这个目的简单叫作得到最大限度快乐的目的。我们不能说善良的人将按照事实上会得到最大限度快乐的方式行事,因为他可能没有理由期待这种结果。如果希特勒的母亲在他婴儿时期就把他杀死,这会是一件好事,但是她却不可能知道这一点。因而我们必须说善良的人将在他的知识限度之内按照大概会得到最大限度快乐的方式行事。这里所涉及的那种概率显然就是可信度。我们所谈的这些概率可以用计算“预料”的规则来确定大小。这就是说,如果有一个概率p,它表示某一件行为的结果当中可能有x 那样大的快乐,那么这对于预料就提供了px 的分量。因为遥远的结果很少有可以看出的概率,这就使得讲求实际的人有理由把目光通常只注意到他的行为的不太遥远的结果上去。另外还有一种要考虑到的情况:这里涉及的计算常常是很困难的,并且在两种可能行为产生快乐的性质几乎相等时最为困难,在这种情况下选择就变得不重要了。所以一般来讲不值得小心地去确定哪种行为产生最大的快乐。这是使人们赞成行为规则的理由,即使我们的最基本的伦理观并不承认这些行为规则:这些行为规则在最大多数的情况下可能是对的,使我们免于在估计概然性的结果上耗费精力和时间。但是对于行为规则本身人们却应该看其产生快乐的性质而小心地给以肯定,人们在作出真正重大的决定时有必要想到这些规则并不是绝对的东西。币制改革通常就包含着某种类似盗窃的行为,而战争就要杀人。决定是否改革币制或宣布战争的政治家必须深入考察这些行为规则,尽全力估计到可能的后果。只有在这种意义下,概然性才能作为人生的指南,并且只有在某些外界条件下才是这样。可是这句格言还有另外一种比较平易近人的意思,也许这是巴特勒主教所要说的意思。这就是我们在实际生活中把具有很高程度概率的事物看成带有必然性的东西。这仅是一个常识问题,不会引起有关概串论的任何争论。第七章概率与归纳法A.问题的提出归纳的问题是一个复杂的问题,它有着不同的方面和分支。我将从叙述单纯列举的归纳法这个问题开始。1.那个与它比较起来其它都是次要的基本问题是:已知一个类a 中许多实例都已发现属于一个类β,那么这种情况使得(a)下一个a 将是一个β,或者(b)所有的a 都是β,具有概然性吗?2.如果这两者之一并不普遍为真,那么对于a 和β有没有可以发现使它为真的限制?3.如果加以适当限制这两者之一都为真,那么在这样的限制下,它是一个逻辑的定律还是一个自然界的定律?4.它可以从某个其它原理推导出来吗?例如自然界的种类,凯恩斯的有限变异说,法则的支配,自然界的齐一性,或者其它原理。5.归纳原理应当用一种不同形式说出来吗?也就是说:已知一个假设h具有许多已知的真的后果并且没有已知的假的后果,这件事实能使h 具有概然性吗,如果在一般情况下不能,在适当情况下它能做到这一点吗?6.在归纳公设为真的情况下将使已被公认的科学推论正确有效的归纳公设的最低限度形式是什么?7.有没有任何理由,并且如果有的话是什么理由,使得我们认为这个最低限度的公设为真?或者,如果没有这类理由,是否还有按照假定它为真来行动的理由,在这些讨论中我们需要记住一般所用的“概然的”这个词在意义上的含混不清。当我说在某些情况下,“大概”下一个a 将是一个β时,我希望能够按照有限频率说来解释这个现象,但是如果401 我说归纳原理“大概”是真的,我一定是在用“大概”这个词来表示高度的可信性。如果不把“概然的”这个词所具有的这两种意义适当划分开来,就很容易发生混淆。我们将要进行的这个讨论具有一段可以认为是从休谟开始的历史。就很多次要问题来说,我们已经取得了确定的看法;有时这些次要的问题人们当初并没有看出来。但是我们现在进行的研究已经使我们看得相当清楚:得出成果的技术上的讨论对于主要问题的阐明并没有起多大作用,这个主要问题大体上仍然和休谟留下来的情况一样。B.单纯列举的归纳法单纯列举的归纳法就是下面这个原理:“已知有n 个数目的a 已经发现为β,并且没有a 已经发现不是β,那么这两个陈述:(a)‘下一个a 将是一个β’,(b)‘所有的a 都是β’就都具有一种随着n 的增加而增加的概率,并且当n 接近无限大时接近必然性而以它为极限”。我将把(a)叫作“特殊归纳”,而把(b)叫作“一般归纳”。这样(a)将根据我们关于过去人类都有死的知识推断某某先生也有死,而(b)则将推断大概所有的人都有死。在我们还没有接触到较难或有疑问的论点之前,某些比较重要的问题却可以比较容易地得到解决。这些问题是:1.如果归纳要完成我们期望它在科学中所完成的任务,“概率”的解释就必须使得一个概率陈述断言一件事实;这就要求所涉及的那种概率应当从真与伪推导出来,而不是一个不能下定义的概念;而这一点又能使有限频率的解释或多或少成为不可避免的解释。2.归纳在应用到自然数列的时候显然是无效的。3.归纳作为一个逻辑原理是无效的。4.归纳要求它所根据的实例是一个级数,而不仅仅是一个类。5.为了使这个原理有效,不管需要规定什么限制,必须通过给a 和β这些类下定义的内包的说法表达出来,而不是通过外延的说法。6.如果宇宙中的事物数目是有限的,或者只有某个有限类对于这种归纳