1+1y。如果y 的值小,那么这将是一个很大的概率。现在有两个条件可以使y 的值小:(1)如果P/h 的值大,(2)如果pq/h 的值小,也就是p 伪而使q 变得不大可能的那种情况。计算这两个因子所遇到的困难正和凯恩斯的讨论中所出现的困难一样。为了算出p/h,我们需要具有某种在发现使我们想到p 的个别证据之前,计算p 的概率的方法,而这种方法却是不容易找出来的。我们看得清楚的只是如果一个让我们想到的定律在发现任何有利于它的证据之前就具有相当大的概率,那就一定要依靠一个大意是说某种相当清楚的简单定律必然为真的原理。但这却是一个困难的问题,我在以后还要谈到它。在某些种类的情况下,对于pq / h 进行近似计算具有更大的可能。让我们拿海王星的发现作例。就这个实例来讲,p 是万有引力定律,h 是海王星发现以前关于行星运动的观察,而q 是海王星存在于计算表明它所应该存在的地方。这样pq/h 就是在万有引力为伪的情况下,海王星出现于它所在的地方的概率。这里我们必须对于我们所用的“伪”这个词的意思做出一条规定。就这个词的适当意思来讲,认为爱因斯坦的理论证明牛顿的理论为“伪”是不正确的。在肯定一切表示数量的科学理论时都应该保留误差范围;如果做到了这一点,牛顿的万有引力学说对于行星运动来说就仍然为真。下面的论证看来似乎今人抱有希望,但是在事实上却是不正确的。就我们所举的实例来讲,脱离开p 或者某个一般定律,h 对于q 就是无关的;这就是说,对于其它行星的观察不能使海王星的存在具有比原来更多或更少的概率。至于其它定律,我们也许可能411 认为波得定律使得有一个大体具有海王星轨道的行星存在从大体上看是可能的,但是它却不能指明在某一特定日期行星已经走过的一段轨道。如果我们假定波得定律以及万有引力以外的任何其它有关定律给予认为有一个大体沿着海玉星轨道运行的行星的假定以概率X,并且假定对于海王星的视位置的计算带有误差范围,那J么海王星在它所在的位置被发现的概率就将是J /2 。现在的值很小而的pJ x值也不能认为很大。所以pq / h ,这个值等于xxJ /2 p,就必然很小。假定我们把X 作为1/ 10 ,J作为分钟,那么pq /h =1/ 10x ×3600=1/ 36 ,6000。所以如果我们假定p/h=1/36,我们就将有y=1/1000 和p / qh =1000。1001这样,即使在海王星被发现之前,万有引力定律象掷骰子出双六那样不大可能,在发现之后它却具有1000 比1 的有利情况。这个论证如果推广到所有观察到的有关行星运动的事实,显然表明如果万有引力定律在最初被人提出来的时候即使具有很小的概率,它不久就几乎成了带有必然性的东西。但是它却丝毫不能帮助我们估计这种最初的概率,因此即使它真,也不能为我们从观察到理论中间所做的理论性质的推理提供稳固可靠的基础。另外,上面这种论证由于以下的事实也可以受到人们的反对,即万有引力定律并不是使人预料海王星在它原来的地点出现的唯一定律。假定万有引力定律在时间t 以前一直为真,这里t 是发现海王星之后的任何一个时刻;那么我将仍然有q/p’h=1,这里p'表示认为这个定律只是到t 以前一直为真的假设。所以我们有比纯粹机会或者纯粹机会和波得定律加起来更多的理由来预料海王星的发现。这个定律直到那时一直为真这件事已经成为具有很大概然性的事情。推论它在将来有效就需要一个绝不能从数学的概率论中推导出来的原理。这种想法破坏了建设一般理论的归纳论证的全部力量,除非这种论证受到某种类似人们所认为的自然的齐一性的原理的支援。在这里我们又一次看到归纳需要某种超出逻辑范围、不依靠经验的普遍原理的支持。D.莱新巴哈的理论莱新巴哈的概率论的特点在于归纳就包含在概率的定义之中。这个理论有如下述(略加简化):已知一个统计上的系列——例如生死统计上的系列——并且已知包含该系列中某些分子的部分重合的两个类a 和B,我们常常发现当项目数大时,a的分子为B 的分子的百分数大体上保持不变。假定当项目超过了比方说10,000 时,人们发现记录下来的a 为B 的比例永远不能大大超过或不及m/n,并且这个有理分式比任何其它分式都更加接近平均观察到的比例。这样我们就“假定”不管这个系列怎样扩展,比例将永远接近M/n。我们把一个a 为一个B 的概率定义为在观察次数无限增加时观察到的频率的极限,借着我们的“假定”,我们认为这个极限是存在的并且就在m/n 的邻域中,这里m/n是可能得到的最大实例中所观察到的频率。莱新巴哈明确断言任何命题都不带必然性;所有命题都只具有不同程度的概然性,并且每个概率都是一个频率的极限。他承认,根据这种理论,计算频率所用的那些项目本身也只具有概然性。拿死亡率作例来看:当我们判断一个人死了之后,他可能仍然活着;因此死亡统计中每一项都是可以怀疑的。根据定义,这就表示一次死亡的记录一定是一系列记录当中的一个,而这个系列中有些记录是正确的,有些则是错误的。但是那些我们认为正确的记录也只具有概然的正确性,并且必定是某种新的系列的分子。这一切他都承认,但是他说到了某个阶段我们就结束了这种无止境的后退,而采取一种他所谓的“盲目假定”①。一个“盲目假定”是认某个命题为真的一次决定,尽管我们并没有这样做的充分理由。在这个理论中有两种“盲目的假定”,也就是:(1)在这个统计系列中我们选取当作基本项目的那些最终项目;(2)认为在有限次数的观察中发现的频率,不管观察次数怎样增加,大体上会保持不变的那个假定。莱新巴哈认为他的理论是完全属于经验范围的,因为他并不断言他的“假定”为真。我现在并不是要研究莱新巴哈的一般理论,这种理论已经在前面一章里谈论过。我现在要研究的只是他关于归纳的理论。他的理论的要点是:如果他的归纳假定为真,那么预测就是可能的,否则预测就是不可能的。因此我们唯一能够得到支持一种预测而不是另一种预测的概率的途径就是设想他的假定为真。我并不是想否认要得到支持预测的概率就需要某种假定,我想否认的是所需要的那种假定就是莱新巴哈的假定。他的假定是:已知a 和B 两个类,并且已知a 的实例是按照时间顺序排好的,如果我们在观察了充分数目的a 之后,发现a 为B 的比大体上永远是m/n,那么不管以后可能观察到多少个a 的实例,这个比例将仍然继续保持下去。我们首先看到这个假定仅仅在表面上比那个应用到所有观察到的a 都是B 的情况上的假定具有更大的普遍性。因为在莱新巴哈的假设中由a 组成的系列的每一段落都具有大约M/n 的分子为B 的性质,并且我们可以把那个比较狭义的假定应用到这些段落上去。因此我们可以只研究那个比较狭义的假定。因此莱新巴哈的假定和下面的话意义相同:在我们观察了大量的a,并且发现所有的a 都是B 之后,我们就将假定所有的a 几乎可以都是B。这个假定对于概率的定义,以及一切科学预测来说都是必要的(他这样认为)。我认为这个假定可以证明是错误的。假定a1,a2,..an是已经观察过并且发现是属于某一类B 的a 的分子。假定an+1 是要观察到的下一个a。如果它是一个B,那么把不包括an+1 在内的由B 组成的类来代替B。对于这个类来说,这种归纳就无能为力。这种论证显然还可以推广。由此可以看出,如果要让归纳具有正确有效的机会,a 和B 就不能是任意的类,而必须是具有某些性质或关系的类。我的意思并不是说X 和B 之间存在着一种适当关系时归纳就一定正确有效,我只是说在这种情况下归纳可能正确有效,而就它的一般形式来讲,它却可以证明是错误的。a 和B 一定不是可以叫作“制造出来”的类,这一点似乎是明显的。我想把上面出现的不包括an+1 在内的B 叫作一个“制造出来”的类。广义来讲,我所说的一个“制造出来”的类是一个通过说出某某一项是或不是它的一个分子而得出至少是它的一部分定义的。这样,“人类”就不是一个制造出来① 《经验与预测》,第401 页。的类,但是“不包括苏格拉底在内的全部人类”却是一个制造出来的类。如果以a1,a2,.an+1是a 的最先观察到的n+1 个分子,那么a1,a2,..an就具有不是an+1 的性质,但是我们一定不能用归纳的方法推论出an十1具有这种性质,不管n 可能有多么大。a 和B 这些类必须通过内包,而不是通过说出它们的分子来得到定义。任何为归纳提供合理根据的关系一定是一种概念的关系,并且由于不同的概念可能给同一个类下定义,所以可能出现一对在归纳上相关并分别替a 和B 下定义的概念,而另外一些成对的概念虽然也替a 和B 下定义,在归纳上却不相关。例如,我们可以根据经验推论出无羽毛的两足动物是有死的,但却不能推论出地球上居住的理性动物是有死的,尽管存在着这两个概念碰巧替同一个类下定义这件事实。数理逻辑就它迄今为止的发展来看,是以尽可能做到外延的处理为其目的的。也许这是一个多少带有偶然性的特点,来自算术对于逻辑学家的思想和意图所产生的影响。与此相反,归纳的问题却要求做到内包的处理。固然在一个归纳推论中出现的a 和B 这些类,就观察到的实例a1,a2,..an来讲,是以外延方式表达出来的,但是超过了这一点,重要的却是这两个类直到现在只以内包方式表达出来。举例来说,a 可能是血液中有某些杆状菌的那一类人,而B 则可能是出现某些症状的那一类人。归纳的最重要的性质就是人们事先并不知道这两个类的外延。在实际应用上,我们认为某些归纳值得证实,而另外一些归纳则不值得证实,我们还似乎受着一种对于很可能具有联系的那些种类的内包的觉察力的引导。因此莱新巴哈的归纳假定不仅过于广泛而且还太偏重外延。如果莱新巴哈的假定不想成为可以证明是错误的东西,我们就需要有某种范围较窄和偏重内包的假定。我们对于莱新巴哈关于不同等级频率的理论还要谈论一下,这些不同等级频率最后导致一组“盲目假定”的概率。这是和他认为在逻辑中应该用概卒来代替真理的学说分不开的。让我们通过一个实例来看这个理论,比方说一个六十岁的英国人在一年内死去的机会。第一阶段是简单明白的:把文件上的记载当作完全正确的东西,然后以总人数去除去年死去的人数。但是我们现在记得统计中每一个项目都可能是错误的。为了计算这个概率,我们必须得到某组经过仔细研究的类似的统计,并且发现其中所含错误的百分比。我们还记得那些认为他们发现错误的也可能弄错,于是我们就开始去统计关于错误的错误。在这种后退的某一阶段我们势必停顿下来;不管我们在什么地方停顿下来,我们习惯上总会给它一种“分量”,这种分量人们认为大概不是必然性就是我们猜想在后退的下一阶段会出现的那种概率。作为一种认识论来看,这种方法有着许多可以反对的理由。首先,在后退中靠后的阶段通常比靠前的阶段要困难和不确定得多;我们不大可能,比方说,在对于官方统计的错误所作的估计上,达到官方统计本身所达到的正确性。其次,那些我们必须当作出发点的盲目假定是一种想使心灵与肉体两个世界取得调和的努力:盲目假定要完成的任务就是数据在我的体系中所要完成的任务,数据可能是错误的,但是莱新巴哈想通过把它们叫作“假定”而逃避开认它们为“真”所承担的责任。在选择一个假定而不是另一个假定的时候,除了他认为这个假416 定更有可能为“真”以外,我看不出还有什么别的理由;并且因为,照他自己的话来讲,这并不表示(当我们处在盲目假定这个阶段时)存在着使这个假定具有概然性的某种已知的频率,所以他才不得不凭借频率以外的某种其它标准来挑选假设。他并没有告诉我们这可能是什么东西,因为他并没有觉察出它的必要性。第三,如果我们为了结束无止境的后退而抛弃盲目假定完全属于实用方面的需要,并且从纯粹理论方面观察莱新巴哈的概率可能表示的意思,我们就会感到自己陷进了难以解决的复杂情况之中。在第一等级,我们说一个a将为一个B 的概率是m1/n1;在第二等级,我们对于这个陈述给予概率m2/n2,..这是通过使这个陈述作为某一系列类似陈述当中的一个陈述而得到的;在第三等级,我们对于认为有一个概率m2/n2支持我们的第一个概率m1/n1的那个陈述给予概率m3/n3;这样一直继续下去。如果我们能够完成这种无止境的后退的话,那么支持我们最初估计m1/n1的最后的概率会是一个无限乘积m2 m3m4×× ..n2 n3n4而我们可以预料这个乘积为零。因此看来在选择第一等级上概然性最大的估计时,我们几乎肯定是会错的;但是一般来说这仍然是我们可以得到的最精确的估计。在“概然的”定义中就存在的这种无止境的后退是今人难以接受的。如果我们想避免这种无止境的后退,我们就必须承认我们原来统计中每个项目不是真便是伪,并且承认我们得到的第一个概率的值m1/n1 不是对便是错;事实上我们对于概然性判断必须和对其它判断一样完全使用真—或—伪这种二分法。详尽来讲,莱新巴哈的立场有如下述:有一个命题p1,比方说“这个a 是一个B”。有一个命题P2,说p1具有概率x1。有一个命题p3,说P2具有概率X2。有一个命题p4,说p3具有概率x3。这个系列是无尽止的,并且导致(人们要这样认为)一个极限命题,只有对这个命题我们才有权力加以肯定。但是我却看不出怎样才能把这个极限命题表达出来。困难在于:就这个系列中所有先于417 它的分子来说,根据莱新巴哈的原理,我们没有理由认为它们为真的可能性比为伪的可能性大;事实上它们并不具有我们可以估计的概率。我的结论是:想不用“真”和“伪”这些概念的努力是个失败,并且概然性的判断和其它判断并没有本质上的不同,而是同样包含在完全的真—伪二分法的范围之内。E.结论自从休谟以来,在科学方法的讨论中归纳一直起着非常重大的作用,所以弄清楚上面的论证所得出的结论(如果我没有弄错的话)是很重要的。第一:数学的概率论并没有任何东西可以使我们有理由认为不管是一个特殊归纳还是一个普遍归纳具有概然性,不管有利于它的实例的确定数目有多么大。第二:如果对于一个归纳中所涉及的A 和B 这些类的内包定义的性质不如什么限制,那么我们就能证明归纳原理不仅可以怀疑而且是虚妄的。这就是说,已知某一个类A 的n 个分子属于另外某一个类B,那么使A 的下一个分子不属于B 的那些“B”的值比起使下一个分子属于B 的值更多,除非n不太小于宇宙中事物的总数。第三:在一般所谓的“假言归纳”中,由于迄今为止所有它的观察到的后果都得到证实而使我们认为某一普遍理论具有概然性,这种归纳与单纯列举的归纳并没有什么重要的不同。因为如果P 是所说的那种理论,A 是由有关现象组成的类,而B 是由P 的后果组成的类,那么P 和“所有的A 都是B”就具有相同的意思,P 的证据就是通过单纯列举得到的。第四:如果一个归纳论证可以正确有效的话,那么归纳原理的叙述就必须加上某种迄今尚未发现的限制。在实际应用上,科学的常识在各种不同的归纳面前畏缩不前,这一点我认为是对的。但是那种指导科学的常识的东西到现在却一直没有得到明确的表述。第五:如果科学的推理一般来说正确有效的话,它们之所以正确有效必然是借助于自然界的某个或某些定律,而这个或这些定律说出了现实世界的一种或几种综合性质。肯定这类性质的一些命题的真实性靠着来自经验的论证是连概然性也得不到的,因为这类论证一旦超出了迄今记载下来的经验的范围,它们的正确性就要依靠我们所说的那些原理。这些原理是什么,并且如果有意义的话,那么又是在什么意义上。我们能够名符其实地认识这些原理,仍然是有待我们探讨的问题。第六部分科学推理的公设第一章知识的种类找寻科学推理的公设存在着两类问题。一方面存在着关于大家公认的正确推理的分析,分析的目的在于发现正确推理所包含的原理;这种研究完全属于逻辑的范围。另一方面存在着这样的困难,那就是初步看来并没有多少理由可以假定这些原理为真,更没有理由可以假定人们认识到这些原理为真。人们在什么意义上,假定存在这种意义的话,可以认识这些原理?我认为这个问题需要对于“知识”这个概念做出分析。人们过多地把这个概念看作是个具有明显和统一含义的概念。我个人的看法是:许多哲学上的困难和争论都来自对于不同种类的知识之间的区别,以及对于我们自以为认识到的大部分知识所特有的模糊不清和不够明确之处认识不足。另外还有一件在讨论心理概念时有必要记起的事情,那就是我们和低等动物之间在演化上的连续性。我们不应假定介乎我们与我们那些不会使用语言的祖先之间有着一条不可逾越的鸿沟,因为在这种假定下,特别不适于给“知识”下定义。一般所说的知识分为两类:第一类是关于事实的知识;第二类是关于事实之间的一般关连的知识。与此紧密相关的还有另外一种区分;有一种可以叫作“反映”的知识,还有一种能够发挥控制熊力的知识。莱布尼兹的单子“反映”宇宙,在这种意义上单子也就“认识”宇宙;但是由于单子之间永不互相作用,它们也就不能“控制”它们身外的任何东西。这是一种关于“知识”的看法在逻辑上推到极端的表现形式;另一种关于“知识”的看法在逻辑上推到极端就是实用主义,正如首先由马克思在《费尔巴哈论纲》(1845)中422 所提出的:“人的思维是否具有客观的真理性,这并不是一个理论的问题,而是一个实践的问题。人应该在实践中证明自己思维的真理性,即自己思维的现实性和力量,..。哲学家们只是用不同的方式解释世界,而问题在于改变世界。”①我认为莱布尼兹和马克思的看法都是不完全的。非常简略地从大体上讲,前者适用于关于事实的知识,后者适用于关于事实之间的一般关连的知识。就这两种知识来讲,我所说的都是指非推理的知识而言。我们对于概率的研究已经证明非推理的知识一定存在,这种知识不仅是关于事实的知识,而且是关于事实之间的关连的知识。就其不属于推理的知识而论,我们对于事实的知识有两个来源,即感觉与记忆。其中感觉具有更基本的性质,因为我们只能回忆已经成为感觉经验的东西。尽管感觉是知识的一个来源,但它本身却不是通常所说的知识。当我们谈到“知识”时,我们通常有意把认识和认识对象区别开来,但是在感觉上却没有这种区别。按照大多数心理学家的用法,“知觉”具有知识的性质,但是知觉之所以如此是由于经验,也许可能是由于先天的气质,加在纯粹感觉上面的附加条件而造成的。但是人们只有在下面的情况下才把这些附加条件看作知识,那就是在感觉与我暂时的心理状态之外的其它事实之间要有一些关连,而这些关连又一定要和纯粹感觉与叫作知觉的心理状态的其它部分之间的关连具有适当的关系。所以从感觉过渡到知觉不仅涉及到事实,① 马克思《费尔巴哈论纲》,人民出版社1962 年版。而且涉及到事实之间的关连。可是只有在把知觉当作知识的一种类型时,它才涉及这些关连;作为一种心理现象,知觉只是一种事实,但是就它所加给感觉的来说,它却是一种可能与实在不相符合的事实。只有在事实之间存在着某些关连的情况下,比方说铁的外形与坚硬之间的关连,知觉才能和实在相符合。记忆是反映的知识的最完全的范例。当我记起一支乐曲或一张朋友的面孔时,我的心理状态类似我听到那支乐曲或看见那张脸时我的心理状态,尽管两者之间有着差别。如果我有足够的本423 事,我就可以凭着记忆演奏那支乐曲或者画出那张脸来,然后把我的演奏或画像与事物的原样进行比较,或者不如说与我有理由相信确与原样极其相似的事物进行比较。但是在一定限度内我们相信自己的记忆,即使它不能通过这种考验。如果我们的朋友眼睛有些青紫,我们会问:“你怎么受的伤?”而绝不会说:“我忘记你眼睛受伤了”。记忆的考验,正如我们已经注意到的那样,只不过是一些证实;记忆本身就带有相当程度的可信性,在记忆清楚、时间较近的情况下尤其是这样。记忆的准确不在于它对控制现在和将来的事实上提供多少帮助,而在于它对一件过去的事实相似到什么程度。赫伯特?斯宾塞在五十年后遇见他年轻时钟情过的那位女子,他一直记着她年轻时的面貌,正是由于他的记忆的准确才使得他瞠目不知所对。对于记忆来说,符合“真理”以及因而也就成为“知识”的条件在于目前的想象与过去的感觉经验之间的相似。控制现在和将来的事实的能力在某些情况下可能具有证实的作用,但却绝对不能确定我们把某次记忆叫作“知识”时所表示的那种意思。感觉、知觉和记忆基本上是先于文字的经验;我们可以假定动物的感觉、知觉和记忆与我们的感觉、知觉和记忆并没有很大不同。一旦接触到用文字表达的知识,我们似乎就不可避免地失掉一些我们想要叙述的经验的特殊性,因为所有的文字都表示类别。但是这里却有一点需要加以强调:尽管在某种意义上讲,文字有表示类别的作用,使用文字的人却不一定这样做。小孩学会用“猫”这个词来表示对某类刺激的反应;这是一个因果律,正和火柴对某类刺激作出的反应相似。但是火柴并没有把刺激划入“燃烧的”一类,而小孩在作出“猫”这个反应时也无须给刺激分类。事实上,如果我们对于使用“猫”这样的词并不需要假定存在着分类这一点缺少认识,我们就会陷入永无止境的倒退。没有人能够重复说出“猫”这个词的一个实例;把各个不同的实例归类,作为这个词的实424 例,这与把动物归类,作为一个种属的实例是完全相似的过程。所以事实上分类发生在语言开始之后。所有在原来活动中看来类似分类的东西乃是由于对某些刺激作出的反应之间比起这些刺激本身之间具有更多的相似。这就是为什么语言有助于我们考虑一切动物的共同性。当我在记忆中有着某个事件的映象时,如果我们说这个映象为“真”,那绝不是指这个词的通常用法。它之所以为“真”是就意象与它的原型之间所具有的那种相似来说的。如果我们不是把意象作为单纯的想象而是作为记忆,那么它之成为“知识”的程度也就和它为“真”的程度一样。但是我们只要一接触到文字,一种习惯性的东两就随之而来。小孩子看见鼹鼠可能要叫它“老鼠”;这是不合习惯的错误,正象对姑姑不礼貌违反习惯一样。但是一个完全熟悉这种语言的人用眼角瞥见鼹鼠而叫它“老鼠”,