图7.4. 在看见平静图片之前,平均心率由于期待略有上升,随即递减,受试者“知道”下一张图片是放松的。相比之下,在看见情绪化图片之前平均心率便开始上升,就象受试者硬起心肠准备看震撼性的图片。图 7.5. 在显示目标图片两秒钟之前,对于情绪化的图片指尖血容量变小,对于平静图片保持不变。请注意血容量开始下降发生在显示情绪化图片之前1秒。独立重复实验正如前面强调的,科学问题的证实取决于独立重复。这些预感实验的结果在1996年8月超心理学会年会上发表了之后,阿姆斯特丹大学心理学家狄克·比尔曼做了重复实验。我们向他提供了一套我们用的目标照片,他另外采用他自己的皮肤电测量的硬件及软件。14比尔曼把这些图片放给16位受试者,每人看40幅图片,有时候是“长”时段,要看3秒;有时候是“短”时段,只看0.2秒。图7.6显示了汇总后的结果,它成功重复了我们观察到的实验结果。在看到情绪化图片之前的皮肤电活动明显强于看见平静图片之前。图7.6. 比尔曼教授的重复实验结果。置信区间为65%。15图7.7. 拉斯维加斯内华达大学在受试者观看暴力性或淫秽图片时采集到的皮肤电活动数据。这是33位受试者看完158幅阴性、278幅阳性情绪化照片之后的综合结果。置信区间65%。16示情绪化图片之前1秒。为了更加细致分析预感实验结果,我们把情绪化图片又分为两类:阳性(一般是淫秽题材)和阴性(暴力和受伤的题材)。图7.7显示了我们实验室所得结果。我们发现在看见两种图片之前,皮肤电活动就有明显差别,而真正看见图片之后却基本没有区别。图7.8显示的是比尔曼教授的结果,两者何其相似。对于这种差异很难找到“正常”的解释,象常规的期待效应无法解释。这说明,如果预感真能体现对于将来事件的认识,那么自律神经系统不仅能对将来的神经系统变化作“提前反应”,而且能对不同的情感意义做出反应。图7.8. 阿姆斯特丹大学比尔曼教授采集的观看暴力及淫秽图片时的皮肤电活动数据。置信区间65%。现在是什么时候?让人试去吧,反正我不会说要去抓住时间,人只能留意或关注当下一刻。最令人迷惑的体验来了。现在是哪里?在我们试图抓住它之前,它就已经消逝无影无踪了。威廉·詹姆斯(William James)威廉·詹姆斯可能意识到了什么。现在可能与我们想的某时某地不一样。克林特曼的响应时间实验以及生理学预感实验,验证了受限选择预知实验的整合分析结果。在一定条件下我们可能有意识或下意识地对将来的事件作出反应,而在正常情况下这些事件是我们所不知道的。在写本章的时候,爱荷华医学院的神经科学家在著名杂志《科学》上发表了关于直觉预感的一项实验。他们请10位正常人和6位脑功能受损者依次玩一种扑克游戏,同时监测他们的皮肤电活动。在游戏中一共有四副牌,当事人要自行先选出一副牌,然后一张一张地摊开。有些牌能赢钱,有些则输钱。其中有两副是“坏”牌,输张牌多,另两副牌是“好”牌,赢张牌多。尽管不知道这几副牌有好坏之分,也不知道每副牌的输张在什么位置,正常人和脑损伤病人都“在真正知道好牌、坏牌之前,就由于选择所面临的风险性而产生对应的期望(皮肤电位出现变化)。”17 在讨论这项惊人结果的时候,研究者推测“这里所看到的倾向性与其它影响判断的神经机制截然不同……换句话,为解释该现象必须在现有理论之外提出新的见解……”18 在看到本章所列举的有关预知的证据之后,现有神经科学无法解释的这个另外机制有可能就是特异功能。在19世纪80年代刚开始做特异功能实验的时候,人们就已经意识到在思维传感、实时非眼视觉、预知等现象之间只存在文字描述上的差别──而不是在特异感知的本质上有差别。再后来就开始通过实验研究心-物效应,这才是与前者完全不同的东西。第8章 心-物作用生命要远比所有人类心智所创造出的东西深奥得多。连最普通的存在也是我们所不敢构思的。夏洛克·福尔摩斯对华生的谈话精神愿望能否影响物质世界?在一定意义上,回答显然是肯定的。汽车工程师想出一个造汽车的新方法,经过几个月或几年时间之后获得成功。象这种从精神到物质的转换并不稀罕,因为事件的每步过程已经很清楚。然而,另一个问题就不是不言而喻的了:精神愿望能否直接影响物质世界,不通过中介媒体?该问题涉及物理世界中人脑的终极地位,激发了几千年来哲学家的浓厚兴趣。精神超越物质的观念根植于东方哲学以及古代巫术信仰之中。在过去几百年里,这种信念被西方科学视为迷信而完全否决。至今这个基本问题仍与五千年前一样神秘。精神是什么,它与物质又是什么关系?精神是因还是果呢?意识近些年里对意识本质的猜测有明显上升趋势。每个学科对于意识之为何物都有自己的看法,已经有不少神经科学家、认知科学家、计算机科学家和生物学家就此写了不少论述。物理学上,观察会改变物理系统本身这个无可避免的事实,促使现代物理学的奠基人,包括魏尔勒·海森堡、艾尔文·薛定谔、阿尔伯特·爱因斯坦都深入地思考人类意识的特殊角色。1由于现代物理学中一些令人极为困惑的现象,越来越多的科学家继续猜测意识、精神、物质是怎么回事。2物理学家伯纳德·德斯帕拉特(Bernard d’Espagnat)在《科学美国人》杂志上写道,“认为世界由不依赖人的意志为转移的客观物质所组成的经典观念与量子理论以及实验事实相违背。”3 有不少这类文章发表在科学杂志里,包括《美国物理学杂志》、《物理学信件》、《科学美国人》、《物理学基础》和《物理评论》等等。4 《欧洲物理杂志》于1987年发表了物理学家尤安·斯奎尔斯(Euan Squires)的文章,谈到直接与特异功能研究有关的这个问题:如果意识选择可以决定我去做何种测量,我的意识为此被分裂成什么态,难道意识就不能影响测量的结果吗?意识可能是通过量子效应影响物质。象考察意念能否影响原子核衰变率的这类实验做起来不难,可能真是值得试一试。5在量子力学中有关意识为何物的推测由来已久,按说在物理学文献中能找到相当一些原始实验。奇怪的是找来找去仅见三项实验。实验第一篇是1977年麻省理工学院的物理学家霍尔(Hall)、金(Kim)、麦克罗依(McElroy)和西蒙尼(Shimony)的文章,实验“慎重地研究了心-身作用导致量子波包塌缩的设想,这种作用使两个系统都被改变。”6 他们用实验检验了一个人能否发觉另一个人已对某个量子态作了观察(这里所说的是钠-22的伽玛辐射)。他们的思路如下,如果某人的观察的确改变了某系统的物理状态,那么再有一人观察该系统的时候,后面这人的经历可能因为前面那个人是否观察而有所不同。他们做了554次测量,结果不支持该假说。实验观察到的“击中”数量恰好是概率期望值。第二项实验是麻省理工学院科学家在文章里引证的。他们曾采用放射性钴-57做过一次成功的实验,在67次测试中获得40次击中,相比于50%的概率期望获得了60%的击中率。7第三项是普林斯顿大学工程教授罗伯特·杰恩、心理学家布兰达·杜恩(Brenda Dunne)和罗杰·尼尔森(Roger Nelson)及同事进行的长期实验。8 1986年,他们报道了为期7年,对33位受试者的数百万次测试的结果。他们采用电子“随机数发生器”,一种类似掷钢币的电子器件作为物理目标。这些从未加筛选个体身上采集数据的长期实验,得出充分证据表明在精神愿望和随机物理器件的输出之间存在联系。于是,在主流物理学杂志上发表的三项实验,一项结果恰是概率,另两项得出阳性结果。鉴于该效应所具有的奇妙的理论意义,很奇怪物理论文中不再有此类实验。这倒不是说没人在做实验。实质上,特异功能研究者做了数以百计的同等概念的实验。其实,主流物理学文献只提到三份报告毫不奇怪。虽说理论物理学家对心-物作用的可能性做过认真探讨,但实际研究这个效应──爱因斯坦称之超距“鬼怪”效应,却是科学禁区,这反映出存在认定自然界必然如何运作的一组基本假定。在第15章我们将讨论这些假定的来源,但是,由于各个学科之间相差甚远,由于对超心理学存在着普遍的不安,绝大多数特异功能实验都不为外界科学家所知。曾经有几位怀疑者对这些文献做过几次浮浅的评述。他们声称在一两项实验里发现了漏洞,但谁也不愿检验通盘的证据。动机研究心-物作用,除开其诱人的科学及哲学价值外,也有实用意义。下一章,我们将结合心-物作用影响生命体的证据探讨其意义。在这里我们主要考察在非生命系统中的心-物作用。澄清精神可否直接影响物质的一个实际理由,是因为这种“主动”的特异功能可能导致了计算机及其它复杂机器的故障。为什么有些人整起机器非常拿手,而另一些人老是奇怪地把它们搞出毛病?为什么在工程界常见“有意义的失误”,人们半开玩笑地称之“默菲定律”?是不是某种情况下,计算机故障是“特异功能引发”的?9这不仅是学术问题。这个问题对于解释某些复杂系统有时何以失灵正变得越来越重要。大量的关键应用,比如核武库、航空交通控制、重要保健部门都完全依赖计算机的正常运作。在制造容错计算机方面已经取得了重大进展,今天的绝大多数计算机故障都可以归为两类:人的因素和机器因素。人的因素包括不良人机界面、压力的工作环境、逻辑或计算设计错误、软件错误。10 机器因素包括电路板故障、电源供应以及电磁兼容性。11不幸,并非总能把故障归为某类已知错误。12 若是检测充分,倒也能解决一些不可解释的毛病,可是随着计算机系统越来越复杂、分散各地、相互依赖,想查找出故障的真正原因变得越来越难。实际上,近来的非线性动力系统理论(复杂性与混沌理论的一部分)证明,对包括计算机在内的决定性系统,我们预测未来的能力极其有限。13 即使特殊设计、非常复杂,容错计算机系统有时仍会不可思议地出错。14 所以,除开从人及机器因素方面寻找故障原因之外,也有必要检查另一类尚不太理解的因素:直接的人-机作用。小鬼与天使有些人以擅长快速修理机器而著称。另有些人则在重要场合不许走近电子设备,因为怕设备闹毛病。有些心理学家把后一类现象叫作“小鬼效应”(Gremlin Effect)。 15有些东西容易在关键时候出毛病,这种观点非常普遍,在工程界默菲定律被看作“第一法则”,毫无疑问许多小鬼传奇只不过是选择性记忆和迷信,可是对奇怪的巧合予以仔细审定之后,从剩下的奇闻和少量研究看,“实验室故事”好象并非空穴来风。在数以百计的非同寻常的人-机作用事例中,物理学家乔治·伽莫夫(George Gamow)所谈的“泡利效应”相当有趣:众所周知,理论物理学家不善操作实验设备,甚至可以检验身边站的是否是理论物理学家,只要让他的手一摸,再好的仪器也会坏掉。依此标准沃夫冈·泡利便是一位很好的理论物理学家;他一走进实验室,设备就会翻倒、中断、抖动甚至燃烧。16而另一些实验者,比如托马斯·爱迪生,则有高超的能力让复杂的实验室设备不可思议地更快地运作。17 当然,并非所有的“计算机小鬼”和“计算机天使”都找不到正当解释。例如20世纪80年代的一次最高苏维埃会议上,总统米哈依·戈尔巴乔夫向470位代表提议,采用克里姆林宫新装自动投票系统,大厅的两侧是巨型屏幕。戈尔巴乔夫给出信号请代表投票,所有的眼睛都转向屏幕……一片空白。据《泰晤士日报》的文章,戈尔巴乔夫说,“机器不灵了,还是老办法吧”, 18 又回到最高苏维埃过去的惯用的信任票方式。到了本次大会的后半段,设备恢复正常。这一次技术人员记着打开了电源。机器出乱子的故事有些正点有些很荒诞。有个恐怖故事说有台苏联超级计算机把赢了它的棋手给电死了。据说这台计算机被指控为谋杀,因为它让棋板带电打死了棋手。苏维埃警官阿莱克谢·辛涅夫(Alexei Shainev)对莫斯科记者们说,“这绝非意外,而是一场冷血谋杀”。 19把计算机送上审判台的决定让全世界的“法律专家被吓倒”,但苏联人坚信该计算机出“荣誉和智力而衍生出对象棋大师古德科夫(Gudkov)的愤恨,进而想办法杀害了对手”。警方解释说,“计算机程序是让它赢棋,当它无法做到的时候,就杀死了对手”。他接着,“指控计算机杀人听起来很滑稽,可这家伙既能解决问题、想得也比人要快,它当然该为自己的行为负责”。 20这是个滑稽的故事,然而现实生活里确有一些人把汽车、自动售货机和微机人格化甚至怀有感情,要么是爱要么讨厌。要是谁承认在人-机作用中存在着特异功能,这一切便不再纯是幻觉而是可能性。21在这些技术推测的背后的根本问题仍然是:到底有没有证据表明精神可以直接影响物质?就这个问题所作的长期、系统研究之一就是掷骰子。主动与被动的期望在4万年前,远古的人类相信煅烧甲骨可以预知命运,献祭和祈祷能够改变命运。古时候到处都有骨棒算命或骰子预测,从非洲部落到伊纽特人再到玛雅人都能找到“煅烧占卜”的证据。诸如机会与命运的概念充斥在先民信仰之中,比如象印度教的主神湿婆就常常有一副掷骰子定人命运的形象。时至今日,摩登的男人、女人仍在赌场里“转骨头”,热切地期盼撞好运。“期盼”是什么意思?一种是被动的期待,是希望命运之神降到自己的头上。再有一种主动的愿望,是促使或请求命运以某种方式起作用。主动与被动之间的差异也反映在看待运气的不同态度上。有些人持被动的观点,认为那是命运,或好或坏都不以人的意志为转移的力量。有些人持主动的观点,认为能用个人的愿望影响世界。在对心-物作用实验的认识和表达上,也存在同样的分岐。对于心-物作用的实验结果,有些研究者认为受试者凭借特异感知选择了有利的作用时机,而另外一些人则认为这证明了系统被迫按受试者的愿望发生了改变。两种可能说起来差异很明显,可是在一些特异功能实验中却非常难以区分。正如谁也无法(起码到现在为止)设计出截然区分纯思维传感与非眼视觉的实验一样,假使精神作用的对象是随机系统,谁也无法设计实验把“纯”预知与“纯”心-物作用区分开来。实际上,要想做最近乎于纯的心-物实验,就需让原本不可能的事情发生。作用目标通常是稳定的物体,不会自发涨落。迄今对于稳定系统所做的研究包括意念弯曲钢勺之类的金属条、移动小物体。这类事件虽然吸引公众的注意,却往往缺乏由不同实验者经年累月进行系统的、受控的实验重复,这与本书所述实验有很大差别。因此,“宏观精神致动”效应很有趣,也很值得研究,但现在要在科学界谈讨金属弯曲和致动物体还不太站得住脚。掷骰子骰子里面有奥妙。朱利奥斯·凯撒(Julius Caesar)有没有办法用意念控制“骰子丢出”的点数?许多怀疑者认为回答是“否”,正因如此,赌场才有很大利润。赌场获利主要因为规则订得对组织者有利。每年的赌资高达数十亿美元,长线看总是赌客输钱,赌搏业绝对有赚无赔。此外,由于各自先天数学能力和记忆技巧的差别,有些人赢得多,有些老是输,这令人犯疑是否有些赢钱者通过意念力打破了自然概率(假定是公平的赌局)。受莱因夫妇及其在杜克大学同行工作的启发,自1935年以来,研究者便对意念干预骰子的设想展开研究。半个多世纪以来,有52位研究者发表了148项实验结果(仅限于英文资料)。22 实验说起来很简单:先确定一个面,然后掷骰子(可能好几只),与此同时让人用意念使该面朝上。假使该骰子的这一面果然冲上,就算一次“击中”。如果击中次数超出概率,便视为有利于心-物作用的证据。多年来骰子实验曾被评述和批评过无数次,虽说有这么多的实验和评述,意见却大相径庭。23 之所以争议,一个因为心-物作用效应极难重复,因此极其可疑,其次在简单的掷骰子动作背后存在着大量缺陷,每一条都足以把实验结果推翻。再有一点,几乎过去所有评述都只限谈某些实验在设计上的失误,而从没有把全部数据合在一起分析。研究质量有些批评者说,新一代特异功能研究者总是从零开始,不能继承前人工作。这条意见常用来批判超心理学是伪科学,因为它不象“真科学”在研究方面具有连续性。28只要看看实验研究质量是否随时间发生变化就能对这条批评作出检验。怀疑者认为实验质量不会改变,因为荒谬的伪科学家是不会关心过去的实验以及相应的批评意见。图8.2显示了检查结果,趋势不为零,上升势头明显,该结果巧合发生的概率为1/1,000,000。可见后期的研究者们的确参考了此前的批评。图8.2.骰子实验质量随着时间显著改善,该结果巧合发生的概率为1/1,000,000。怀疑者还认为当实验质量提高以后,实验效应就会下降。按他们的设想,只有做“完美的”实验,才能反映真实情况,而这时特异功能不存在。我们检验了这个说法,考查各年的研究质量与击中率之间存在什么关系。我们发现两者之间基本不相关,所以此条批评并不成立。对骰子面的分析早在20世纪30年代,莱因及其同事认识就到,某些骰子实验可能存在着问题,骰子各个面的出现几率未必一致。因为骰子上的点数是挖出来的,有些骰子获得6点的概率要高于1点。由于在6点的这个面上挖了6个孔,这个面就比别的面稍轻一点。如果随机地掷骰子,质量上的这一点差别就使得6点这个面更容易冲上,接下来依次是5、4、3、2、1几个面。所以若是实验中完全锁定6点作为目标,实验就有问题,除非做了不加意念的对照实验,否则就不知道高过概率的结果算是心-物作用,或者只是因为出现6点的概率更大。为了看清在骰子实验中是否存在这个问题,我们仔细地检查了实验数据,分别计算在实验及对照条件下6个面的击中率各为多少。果然发现了差异,如图8.3所示。不论是在实验条件下还是对照条件下击中率的变化趋势都是从1逐步上升到6。但是,在实验条件下的击中率大多高过对照条件,这说明除开上面的因素之外还另有原因。比如,在实验条件得到6点的机会明显地高于对照条件,该结果巧合发生的概率为1/5,000。正因为知道骰子的各个面略有不同,我们专门分析了施加控制的一组实验──采取了专门措施保证骰子各面出现机会相同。我们称之为经方案“校正”的实验。符合方案校正标准的实验共有69项。从中得出三点结论:仍然表现出极显著的心-物作用,结果巧合发生的概率仅为一万亿分之一;无论实验质量如何评价,效应保持恒定;假如存在“文件柜效应”,需要有20倍的未发表非显著实验。所以巧合、实验质量、选择性报道都无从解释实验结果。图8.3. 实验及对照条件下骰子的点数与击中率之间的关系。误差范围为65%的置信区间。骰子实验结论通过整合分析我们得出结论,在骰子实验中的确看到真实的心-物作用效应。半个多世纪以来,该效应得到了50余位研究者的100多项实验的成功重复。倘若事情果真这样,我们自然期望能在其它的实验中用其它物理目标也看到一样牢靠的证据。事实的确如此。抛掷比特随机数发生器(RNG)实验是现代版的掷骰子实验。每台RNG都是一套电子线路,能够不断地重复抛掷电子“硬币”,产生一组或“正”或“反”的序列并予以记录。在典型的实验中参试者要用意念影响RNG的输出,使得在确定的时间段里更多出现“正”更少出现“反”。实际上,RNG产生的是比特序列(或1或0),所以任务就成了要让RNG产生更多的1或者更多的0,依指令而定。现代的RNG电路通常选自两种随机信号源之一,或者是采用电子噪声或者是放射衰变时间。两种都是物理信号源,通过适当的电路设计,可以在不可预期的时候产生电子脉冲。这些每秒达数千个的随机脉冲与每秒1000万次震荡的石英控制精确时钟叠加后,就得到一组随机顺序的比特值。在随机脉冲打断时钟的时候,时钟所处状态(“1”或“0”),便是一个随机比特。再用低于每秒1000万次的频率采样,比方每秒1000个随机脉冲,就得到每秒1000个或1或0的真正随机序列。RNG与微机相联,记录每秒1000比特的随机序列丝毫不成问题。在实验中参试者常常通过数码显示、声音反馈、微机图像或机器手的动作及时掌握随机事件的动态分布情况。29 大多数的现代RNG在技术上都很先进,具有电磁屏蔽、自动防故障系统、全自动数据记录等特征。30关于随机性RNG实验有时也叫“微观精神致动”实验,这是指心-物作用的规模很小。为什么要采用微观的随机系统作为实验目标,而不用金属棒等稳定的宏观物体呢?若是精神可以影响物质,为何不直接观察该效应呢?比如意念弯勺子,就用不着统计。这要从四点上予以回答。首先,诸多的实验经验证明,想在非生命系统中观测大规模的心-物作用极为困难。倒也有一些案例,但基本上属于传闻,或者得自于非严格的受控条件之下。其次,即使是重物或钟摆等稳定的宏观系统,微观上也处在涨落之中,所以任何精密实验说到底仍是建立在统计基础上。其三,RNG实验的目的在于改进以往的骰子实验,并非着意要看大规模的效应。其四,从心理学角度看,精神影响随机系统要比影响大的物体更“容易”,因为前者勿需违反物理学的守恒定律。随机物理系统的行为不是取决单个事件,而是依赖于整个系统的集体行为。最后一点很重要。这使得单个事件异常而不致于影响整个系统。因为大多数的RNG实验只在短期时间内收集数据,在这期间有可能出现异常而并不必违背RNG的长期稳定性。自打以统计为基础的物理学理论(如量子力学、随机电动力学、统计力学和热力学等)出现后,人们已经认识到物理定律的基础是统计,是基于事件的趋势,而非确定性。所以在绝对意义上并不会“违反定律”。非常事件,比如说溶在一杯咔啡中的奶粉自动集聚,虽说反常,但在物理意义上并非不可能。RNG相比骰子的最大优点是能够完全自动地运行,数据的采集和分析都很快。此外,一些RNG的随机信号源自身建立在量子力学的不确定性基础之上。这使物理学家能够从量子力学的角度探讨系统中的观察者效应,在我们则称之为微观精神致动。现代RNG实验肇始于物理学家赫尔穆特·施密特,从60年代起他就在波音实验室着手有关研究。31 事实上今天所有的RNG实验都建立在施密特当年的思路之上,只是包括显示、一次一次的反馈以及数据的存储和分析做到了完全自动化。这就防止了实验者不留意弄错了数据,也使实验者本人可以自行参加实验而不必担心自己的倾向影响结果。整合分析假如某台RNG产生的是随机的或0或1的序列,按照零假设(即不存在心-物作用)这相当于50%的击中率。如果一组相似的RNG实验得出的平均结果高于50%,而且显著超过概率,我们就能肯定这中间有东西。1987年,普林斯顿大学心理学家罗杰·尼尔森和我一起就RNG实验做了全面的整合分析。30 整合分析的所有实验都在问同一个问题:电子RNG的输出是否与事前指定观察者的意念方向相关?若是实验的输出与意念一致,击中率便会高于50%。若是相反,那么击中率便低于50%。而概率期望值是精确的50%。整合分析1989年,心理学家戴安娜·费拉利和当时仍在普林斯顿大学的我,一起就骰子实验中的心-物作用证据进行了整合分析。24分析所要回答的问题是:意念能否使骰子摇出来之后某个面向上?正如所有整合分析,首先要找出所有实验,否则便容易由于个人倾向而只看“好”的实验,把“坏”的弃之不顾。我们查阅了所有相关英文杂志上直至1989年为止的骰子实验,25然后记下每次实验的受试者人数、确定的骰子点数、掷出骰子次数,等等。再根据这些信息换算成50%的等效击中率。此外,再分析每项实验,看其包含有13项质量标准中的哪几项,这些标准包括是否是自动记录、是否有监察者在场、是否做了对照实验。26我们的文献检索一共找到73篇论文,这是从1935-1987年之间52位研究者的工作。在半个多世纪里,共有2569个人在148次实验里做了260万次意念干预骰子的测试,不加意念的对照实验做了31次,共掷骰子15万余次。每项实验中掷骰子的次数少则60次,多则24万次;受试者的人数少则1 人,多则393人。图8.1按年份汇总了骰子实验结果。对照实验的整体击中率(即无人影响骰子)为50.02%,置信区间位于概率期望之中,事件巧合发生率为1/2。而对所有的意念作用实验,整体击中率为51.2%。看上去似乎不起眼,但从统计上来看,该结果的巧合发生概率只有十亿分之一。图8.1. 按年份汇总的掷骰子实验的50%等效击中率,95%的置信区间。对于一年仅有一次实验的情况,图上只标出一个没有置信区间的点。最右边是综合后的整体击中率。回应批评意见前面已然看到,对于综合实验结果得出的整体效应,有人总说那只反映极少数研究者的结果。每位研究者所做骰子实验次数是在1-21次之间,绝大多数人(64%)只报道了1至2项实验。为检验这条批评,我们只把报道实验次数3次以下的25位研究者的实验(共42项)合在一起看其自然发生率。所得结果仍然非常显著,巧合发生的概率为10亿分之一。所以整体成功并非由于少数几位研究者。但也可能整体击中率被少数几个特别实验给夸大了呢,而它们又含有某些漏洞?为检查这种说法,我们采用标准的规整程序删去“异常”实验,就象侯诺顿与费拉利对预测所作的整合分析一样。27结果显示在148项实验中,需要删去其中的52项(35%)以使结果均匀化。35%的这些异常数据可以与物理科学相比,在某些情况下后者需删除的可能高达45%(如第4章的讨论)。在剩下来的96项实验中所观察到的整体效应与自然概率相比较,巧合发生的概率为300万分之一。所以,即使删去异常数据,实验效应仍然是可以独立重复的,在96项实验中重复性地看到同样的效应。或者因为成功实验要比实验效应不显著的更易于发表?为了评价非显著实验所带来的“文件柜”效应,我们算了一下需要多少项未发表的、非显著实验才能使观察结果的事件发生率高过1/20。相对已发表实验,要有17,974篇未发表实验。即对应每项实验各要有121项隐匿的不成功实验。这也就是要参预实验的52位研究者每月都做一项不显著而未发表的实验,连续做28年。这显然不可能,选择性报道解释不了上述结果。研究质量有些批评者说,新一代特异功能研究者总是从零开始,不能继承前人工作。这条意见常用来批判超心理学是伪科学,因为它不象“真科学”在研究方面具有连续性。28只要看看实验研究质量是否随时间发生变化就能对这条批评作出检验。怀疑者认为实验质量不会改变,因为荒谬的伪科学家是不会关心过去的实验以及相应的批评意见。图8.2显示了检查结果,趋势不为零,上升势头明显,该结果巧合发生的概率为1/1,000,000。可见后期的研究者们的确参考了此前的批评。图8.2.骰子实验质量随着时间显著改善,该结果巧合发生的概率为1/1,000,000。怀疑者还认为当实验质量提高以后,实验效应就会下降。按他们的设想,只有做“完美的”实验,才能反映真实情况,而这时特异功能不存在。我们检验了这个说法,考查各年的研究质量与击中率之间存在什么关系。我们发现两者之间基本不相关,所以此条批评并不成立。对骰子面的分析早在20世纪30年代,莱因及其同事认识就到,某些骰子实验可能存在着问题,骰子各个面的出现几率未必一致。因为骰子上的点数是挖出来的,有些骰子获得6点的概率要高于1点。由于在6点的这个面上挖了6个孔,这个面就比别的面稍轻一点。如果随机地掷骰子,质量上的这一点差别就使得6点这个面更容易冲上,接下来依次是5、4、3、2、1几个面。所以若是实验中完全锁定6点作为目标,实验就有问题,除非做了不加意念的对照实验,否则就不知道高过概率的结果算是心-物作用,或者只是因为出现6点的概率更大。为了看清在骰子实验中是否存在这个问题,我们仔细地检查了实验数据,分别计算在实验及对照条件下6个面的击中率各为多少。果然发现了差异,如图8.3所示。不论是在实验条件下还是对照条件下击中率的变化趋势都是从1逐步上升到6。但是,在实验条件下的击中率大多高过对照条件,这说明除开上面的因素之外还另有原因。比如,在实验条件得到6点的机会明显地高于对照条件,该结果巧合发生的概率为1/5,000。正因为知道骰子的各个面略有不同,我们专门分析了施加控制的一组实验──采取了专门措施保证骰子各面出现机会相同。我们称之为经方案“校正”的实验。符合方案校正标准的实验共有69项。从中得出三点结论:仍然表现出极显著的心-物作用,结果巧合发生的概率仅为一万亿分之一;无论实验质量如何评价,效应保持恒定;假如存在“文件柜效应”,需要有20倍的未发表非显著实验。所以巧合、实验质量、选择性报道都无从解释实验结果。图8.3. 实验及对照条件下骰子的点数与击中率之间的关系。误差范围为65%的置信区间。这些惊人的结果理应激发所有心理学家们的兴趣。在后面的7项实验中,发送者与接收者之间相隔着厚厚的一堵墙,但依然取得了惊人结果。