不确定的科学与不确定的世界 出版说明 自中西文明发生碰撞以来,百余年的中国现代文化建设即无可避免地担负起双重使命。梳理和探究西方文明的根源及脉络,已成为我们理解并提升自身要义的借镜,整理和传承中国文明的传统,更是我们实现并弘扬自身价值的根本。此二者的交汇,乃是塑造现代中国之精神品格的必由进路。世纪出版集团倾力编辑世纪人文系列丛书之宗旨亦在于此。 世纪人文系列丛书包涵“世纪文库”、“世纪前沿”、“袖珍经典”、“大学经典”及“开放人文”五个界面,各成系列,相得益彰。 “厘清西方思想脉络,更新中国学术传统”,为“世纪文库”之编辑指针。文库分为中西两大书系。中学书系由清末民初开始,全面整理中国近现代以来的学术著作,以期为今人反思现代中国的社会和精神处境铺建思考的进阶;西学书系旨在从西方文明的整体进程出发,系统译介自古希腊罗马以降的经典文献,借此展现西方思想传统的生发流变过程,从而为我们返回现代中国之核心问题奠定坚实的文本基础。与之呼应,“世纪前沿”着重关注二战以来全球范围内学术思想的重要论题与最新进展,展示各学科领域的新近成果和当代文化思潮演化的各种向度。“袖珍经典”则以相对简约的形式,收录名家大师们在体裁和风格上独具特色的经典作品,阐幽发微,意趣兼得。 遵循现代人文教育和公民教育的理念,秉承“通达民情,化育人心”的中国传统教育精神,“大学经典”依据中西文明传统的知识谱系及其价值内涵,将人类历史上具有人文内涵的经典作品编辑成为大学教育的基础读本,应时代所需,顺时势所趋,为塑造现代中国人的人文素养、公民意识和国家精神倾力尽心。“开放人文”旨在提供全景式的人文阅读平台,从文学、历史、艺术、科学等多个面向调动读者的阅读愉悦,寓学于乐,寓乐于心,为广大读者陶冶心性,培植情操。 “大学之道,在明明德,在新民,在止于至善”(《大学》)。温古知今,止于至善,是人类得以理解生命价值的人文情怀,亦是文明得以传承和发展的精神契机。欲实现中华民族的伟大复兴,必先培育中华 民族的文化精神;由此,我们深知现代中国出版人的职责所在,以我之不懈努力,做一代又一代中国人的文化脊梁。 上海世纪出版集团世纪人文系列丛书编辑委员会 2005年1月 献给拉纳、约翰和萨拉……我生命中的至爱 对本书的评价 科学充满着不确定性。科学是如何发展,又是如何繁荣的?《不确定的科学与不确定的世界》在这方面给予外行人一个很好的了解机会。波拉克分析了社会不能或不愿处理全球环境问题的诡辩——常常借口没有足够的科学确定性对全球问题釆取措施——然而同时保险业和其他行业只不过是按惯例预防未来的不确定性所造成的风险。此书写作清晰,没有辩论和公式,希望能够得到普通公众和政策制定者的广泛阅读。 ——保罗·克鲁岑(Paul Crutzen,因其在臭氧洞方面的工作,1995年获诺贝尔化学奖) 人们对于科学有许多根本性和普遍性的误解。《不确定的科学与不确定的世界》一书能够澄清其中的一种误解——科学是精确和确定的。波拉克通过列举一些简短而清晰的事例,说明不确定性对于科学是常见的,瘫痪和无法行动的原因并不是不确定性,从而驳倒了“科学是确定的”神话。这本写作优秀的书有助于减轻那些将科学不确定性滥用到制定政策并推进他们自己议程的特殊行业的误解。 ——斯蒂芬·施奈德(Stephen Schneider,斯坦福大学环境生物学教授,《地球实验室:我们输不起的行星赌博》的作者) 这本优秀的书将强有力地抨击两种危险的态度:一种是在用人们难以理解的概率进行描述的复杂世界中拼命寻找不可能的确定性;另一种是非常相信科学家是当今通过科学实验产生确定性的魔术师。波拉克生动而清晰地描述了诸如地球变暖等重大问题。阅读此书能够帮助我们在彼此冲突的“事实”面前作出很好的鉴别,这种能力对于21世纪是极为重要的。 ——奥布里·曼宁(Aubrey Manning,爱丁堡大学荣举退休教授,《动物行为研究》的作者) 公共政策争辩经常陷入科学不确定性及其风险所造成的困境之中。其实,科学与人类经历的许多其他领域一样,对于不确定性和风险是无法避免的。波拉克通过列举日常生活的例子,以一种通俗而有趣的叙述,揭开了围绕着科学不确定性的神秘面纱。 ——约翰·霍顿爵士,气候变化政府间专门委员会副主席,《全球变暖》的作者 最后,我们对不确定性——这个令人困惑的主题有了可靠而科学的了解。当你读完这本书,也许会有一些主题,你对它们更加不确定,但你理解了为什么。 唐姆斯·特赖菲尔(James Trefil,乔治梅森大学物理学教授,《一名城巿科学家》的作者) 科学家常常陷入技术术语的泥潭,而无法与普通公众成功地交流重要信息。在《不确定的科学与不确定的世界》中,波拉克运用平实的语言和极具吸引力的事例探索了科学和日常生活中的不确定性。 ——尼尔·莱恩(Neal Lane,赖斯大学教授,美国总统克林顿前科学顾问和美国国家科学基金会前会长) 内容提要 重大问题: 地球正由于温室效应而变暖吗? 恐怖主义释放炭疽孢子意味着什么危险? 应该采取什么措施应对口蹄疫或疯牛病的爆发? 为什么我们不能预测地震的发生? 科学的不确定性令许多人困惑。当科学家之间具有不止一种答案而且这些答案彼此冲突时,困惑就发生了。 《不确定的科学与不确定的世界》将帮助人们穿越矛盾和不确定性组成的迷宫。此书向,科学家如何适应和利用不确定性以及科学家如何在不确定性面前得出结论,从而使读者根据自己的日常经验从自身角度自信地评价不确定性。 致谢 我非常感激我的妻子拉纳和儿子约翰,在我写作的几个阶段阅读了我的手稿,并提出了尖锐但极具洞察力的评论和建议。他们本身都是多产和出色的作者,家里有这样优秀的编辑使我受益匪浅。斯默登、基弗、査普曼、艾萨克斯和凯恩也阅读了全部或部分的手稿,在许多方面对我帮助很大。我也感谢剑桥大学编辑劳埃德早期的鼓励和后来重要的评论。当然,所有这些给予我帮助的读者对书中的错误以及尖锐的观点无需负责。 作者自我介绍 所有的书都免不了介绍作者的背景和经历,因此请允许我稍微介绍一下自己吧。 我出生在美国农业的中心地带——内布拉斯加州,并在那里接受教育。我母亲是一位传统的家庭主妇,我父亲在自家的农场里饲养家畜。在内布拉斯加州,儿时的我以为这个世界是由泥土组成的,肥沃富饶的土壤经过辛苦劳作之后可以长出能吃的好东西。1954年,18岁的我进入了离中部家乡很远的纽约北部的康奈尔大学。在些小溪流蜿蜒流入卡尤加湖,基岩暴露于这些小溪流流过的大峡谷。在那里我知道了土壤只不过是层层岩石之上的薄薄一层,是真正的陆地;而在那些岩层之中是化石,记录着地球过去的生命。我对其揭示的时间的广袤性深感敬畏,实际上,很快我就被地质学深深吸引了,并将其作为自己的职业选择。整个地球都是我的研究领域,而且在某种意义上,我从来没回过家:“一个在农场长大的人被外面的精彩世界深深吸引以后,怎么还愿意回到原来的小农场呢?”我确实为了一个硕士学位(受到地质学方面出色的教师和每学期90美元低廉学费的吸引)回到内布拉斯加大学,随后继续在密歇根大学攻读博士学位,在哈佛大学做博士后。在密歇根大学与哈佛大学学习之间,我与一位名叫拉纳·舍恩伯格的密歇根女孩结了婚。几年后我在密歇根大学看到一个招聘教师的广告,于是就去面试,并且非常高兴地得到了这份工作。从此我和拉纳就在密歇根大学的本部安阿伯安了家。我们有两个孩子,萨拉和约翰,萨拉在14岁时由于意外事故去世了。约翰是一位作家,住在华盛顿特区。我们全家曾两次旅居海外,1970-1971年住在赞比亚,1977-1978年住在英国。 在密歇根大学,我讲授过各种层次的课程,从为那些不是以培养科学家为目标的本科生开设的入门性地球科学课程到为研究生开设的专门讨论班。实际上,我也讲过各种类型的课:讲座、实验课、研讨班和野外实践。我们系与其他系不同,入门课程的任务分给了更有经验的教师,结果我给那些不会从事科学职业的本科生讲的课多了起来。这种课程的挑战就是培养学生形成一种意识,即科学与他们生活的联系,并使之领会“科学方法”的优势和弱点。我曾教过地质学一般性的入门课程,“地质学101”,以及其他名为国家公园地质概况、气候与人类、行星的地质概况与气候、全球变暖的科学与策略等课程。 多年来我主要的研究方向是,研究地球内部的热能以及热能是如何随着时间推移而消失的问题。地球的热能是推动板块构造和大陆漂移的巨大“发动机”的燃料,地震和火山是它们的副产品。塑造地球表面的那些大规模运动,实际上是使这颗行星慢慢冷却下来的地球内部运动的体现。多年来,我和我的学生在非洲、南美和美国对地球内部的热能损失进行了实地测量。当有人让我用简单术语描述那个过程时,我回答说我到全球许多非常遥远的地方去测量地球的温度。 在过去的10年里,我的地热研究有了一个新的方向。我和我的同事开始认识到,地壳外部几千英尺的温度变化线图是记录了这颗行星过去1000年气候变化的档案。基本的理论是,如果地球表面变暖(或就此而言变冷),地表下的岩石将会感觉到这一变暖并且将其记录下来。表面变化的持续时间越长,变暖渗透到地表以下就越深。在呆于全球变暖和导致全球变暖的可能原因存在重要争论的背景下,地壳这些深度所包含的温度信息,能够让人们把工业时代和前工业时代的地球表面温度作一对比。上述对比为评估人类对气候变化施加影响的大小提供了一种依据。 在这期间的学术生涯中,我也有获得管理经验的机会。我曾做过一段时间的地质科学系主任,还以研究所副所长的身份参与过学院管理。在国家的科学团体内,我曾是美国国家科学基金会地球科学部的几个顾问小组的成员。这些小组负责评估来自全国各地为寻求资金支持的科学家们的研究项目。我还在美国关于全球和环境变化的地球物理学联合会委员会工作过4年,我的任务之一就是负责准备这个专业机构在全球气候变化问题上的状况报表。我所在的大学就像许多其他大学一样,教师除了主要从事教学和研究以外,还要参加大学、团体、州和国家的各种活动。在我所在的系,我负责校友之间相互联系的事宜。除了有校友向本系学生和教师捐款这样明显的善举以外,还有更多来自于工作日之外与毕业生定期交流的微妙之处,这些问题和解决方案有一种意识,他们对诸如水的质量标准、环境清理以及全球气候变化这些以科学为基础的问题有自己的领悟。这些交流有助于学术在过去的10年中,我有很多机会与大学以外的许多团体一起讨论诸如全球变暖、放射性废料的处理和地震预测之类的科学话题,参加这些讨论的人一般是没有科学背景、有思想又受过良好教育的成熟人士。这些讨论发生的地点各不相同,但是包括与来自全国和世界各地的密歇根大学的校友们的会晤,对扶轮社(扶轮社是个国际性的企业家组织,最早建于20世纪初的芝加哥。那时美国社会崇尚金钱万能,“孔方兄”差不多成为所有人追求的目标,大家都不择手段,商业道德败坏。美国青年律师哈里斯有感世风日下,便与三个朋友策划成立一个组织。哈里斯的最初目的是为了促进会员间相互信任,公正地进行各种商业活动,让人们能将商场上淡漠的合作关系变成亲密的伙伴。四人约定组织的聚会在彼此的事务所轮流举行,于是就有了“Rotary”(扶轮、轮流)这个名字。——译者)和基瓦尼俱乐部(Kiwanis,美国工商业人士的一个俱乐部。——译者)等团体服务组织的谈话,与专业记者进行的研讨会,与生态旅行者一起进行的南极探险,在美国参议院所做的证词,在白宫做的简要汇报,为州或联邦政府立法成员举行的研讨班,在报纸、电台和电视台上进行的访谈,以及在公共电台进行的电话釆访。通过这些丰富多彩的活动,我大体了解了来自社会各个阶层受到良好教育的人们对科学事业所持有的诸多误解。也许这些误解中排在最前头的就是不确定性(uncertainty)概念。 科学的不确定性(scientific uncertainty)之所以令许多人困惑,并不是因为“科学家们不能回答所有紧迫的问题”这一事实让他们很难接受,而是因为当科学家们给出不止一个答案而这些答案又彼此冲突时,困惑就发生了。我发现我作为教师所作的主要贡献之一,就是帮助人们穿越矛盾和不确定性组成的迷宫。通过让人们了解不确定性在科学中发生的方式、科学家是如何适应并利用不确定性,以及科学家们如何在不确定性面前得出结论,我能够让他们根据自己的经泛的人能够分享这些观点,所以写就了本书。 亨利·N·波拉克 安阿伯,密歇根 目录 对本书的评价 内容提要 致谢 作者自我介绍 第一章 奠定基础 第二章 科学的不确定 第三章 媒体能帮忙吗? 第四章 不熟悉导致不确定 第五章 发烧还是着凉? 第六章 对半的机会 第七章 我不太确定这是如何工作的 第八章 如果……让我们来看看会发生什么 第九章 重建过去 第十章 预測未来 第十一章 完全出于意外 第十二章 在一种不确定性的氛围里 译后记 第一章 奠定基础 这是一本关于不确定性,特别是与科学相联系的不确定性的书。多少年来,科学不确定性一直受到自然科学家、工程师、医学研究者、社会科学家和哲学家的关注。但是对于从小短文到学术专著所展示的所有观点来说,科学不确定性的丰富性,常常没有得到那些不是专门从事科学的普通民众的重视,而且(或者)经常被他们所误解。当然,不确定性并不局限于科学世界。它也是日常生活常见的事实。我们经常会以多种方式面对不确定性。今天会下雨吗?多萝西姑妈乘坐的飞机会按时到达吗?股市会下跌吗?下班高峰时发生一个事故会让高速公路混乱吗?这些日常的不确定性来回穿梭,我们继续前行,有时为它们做好了准备,但更多的是在其中艰难行进。 但是,不确定性也影响长期关怀。我的退休金够不够我和妻子在今后的20年里过上我们希望的丰足而舒适的生活呢?我们的健康状况允许我们在未来的30年内以一种自由独立的生活方式生活吗? 这些长期性问题很难回答,都掩藏在更大的不确定性之中。由于我们仅能选择一种生活,因此不可能回到“过去”走另外一条路。无法避免的事情是我们必须制定计划,做出决定,尽自己最大努力,始终根据当时最好的判断对我们的行动作评估和中期方向修正。 不确定性绝不仅仅局限于将来;它也具有过去知识的特征。收养的孩子想知道他们的亲生父母,家人很难重建让他们曾祖父母迁移出去的环境。军事历史学家继续重建戈登(戈登,全名为査理士·詹姆斯·戈登,苏丹总督。他曾被围困在苏丹城内,英勇无畏地与死亡和命运搏斗,坚守了一年之久,最后,终被砍死。在威斯敏斯特教堂内的纪念碑上,刻有这些发人深省的文字,“他把他的钱财捐赠给穷人,他的怜悯转向悲痛之人,他的生命献给国家,他的灵魂交给了神。”——译者)将军在喀土穆(苏丹首都)的最后岁月或者卡斯特少校最后矗立于山头俯瞰小加拿大盘羊(Bighorn,北美洲西部山区产的一种野羊)的各种场景。地质学家远不能确定冰河时代的原因,古生物学家仍然在为鸟的进化而争论不休。由于过去的记录是不完全的,某种程度上是不准确的,因此我们对过去的理解是不确定的。我们持有的证据经常是互相矛盾的。 纵观生活,人们陷入不确定性之中。他们会以合理的、可接受的和非敌意的反应例行公事地适应这些不确定性。在简单层面上,城市居民会有带把伞来应对下雨的可能;较复杂层面上,农民可能会参加商品期货市场防止受到可能的干旱的影响。退休金管理者在面对长期相当大的经济和政治不确定性时,会例行公事地做投资决定。房主和车主会买保险来预防在不可预料的将来发生大灾难。这些都是面对不确定性釆取的理性措施。然而,就做决定者而言,在面对类似层面的不确定性时,他们有时不情愿采取措施处理以科学为基础的复杂问题,部分原因在于他们可能感到对随之而来的科学不确定性进行研究和评价还没有作好足够的准备。全球气候变化的主题既说明了科学的复杂性(scientific complexities)和不确定性,也说明了在制定合理政策来处理地球气候变化的许多方面遇到了困难。 一些主题,无论是日常的还是科学的,会贯穿本书的各个章节,它们或多或少解释了我在适应不确定性方面的观点: ●不确定性总是伴随我们,它决不可能从我们的生活(无论是个人还是作为社会整体)中完全消除。由于不确定性的存在,我们对过去的理解和对未来的预测总是模模糊糊。 ●因为不确定性永远不会消失,对于未来的决定,无论其大小,总是在缺乏确定性的情况下做出的。在做决定之前一直等到不确定性完全消除是对现状的含蓄支持,常常是维持现状的一个借口。 ●预测长期的未来是一件危险的事情,很少能做出与现实非常接近的预言。随着未来的逐渐展开,需要做“中期方向修正”以便考虑到新信息和新进展。 ●不确定性,远非前进的障碍,它实际上是创造性的强烈剌激因素和重要组成部分。 不确定性花园 整本书将带着你进行一些科学远足,说明不确定性是如何被编进科学事业的结构之中。这些艰难旅行,许多在我进行科学研究的领域——地球和环境科学之中。特别是,对当代全球关注的话题——全球性气候变化在许多地方都要涉及。在20世纪90年代也许没有哪一个话题能像全球气候变化一样一直吸引着人们的注意力,并且围绕它产生如此激烈的争论。不同时期成为焦点的问题是,气候变化的现实性、原因、结果,以及因气候变化导致的政治反应、经济反应和社会反应。作为缓慢发展的复杂的全球性现象,总体上它展示了科学不确定性许多迷人方面,说明了科学家是如何在不确定性环境下工作和发展的。 本书所列出的科学远足可能被认为是在“不确定性花园”中进行的游览,是对广袤而不规则的土地进行的探索。这片土地由生长着一年生植物和多年生植物的小块土地、一些新开垦的土地、稀有品种、杂草、灌木丛以及迷宫构成。这个花园中的每一个领域都揭示了不确定性的不同方面。对来自科学不确定性的每一次洞察来说,通常都会在科学王国之外发现具有启迪作用的经历,这种经历让读者意识到科学世界与他们自己的世界并非如此不同。的确,科学是我们生活的世界中一个重要的、可理解的又极具影响力的组成部分。 通过对科学和日常生活中存在的不确定性进行比较和类比,我的目标是让读者用与处理生活中的不确定性相类似的那种方式去理解和适应科学的不确定性。我希望读者在读完这本书之后有着这样的感觉:科学不确定性与人们在日常生活中遇到的并例行公事般适应的许多其他不确定性相比,并不会让人更加困惑或产生怀疑。随着对科学不确定性的更好理解,读者能够识破偶尔让科学对于社会问题的价值及其相关性模糊不清的疑云。在理解不确定性的进程中,对于回答“科学能够提供什么和不能提供什么”的问题,他们会更加充满自信。 第二章 科学的不确定 “科学”是日常生活之外的独立组成部分,我坚决向这种观念挑战。我们生活在一个科学的时代;然而我们却认为知识只是一小部分人的特权……这种观念是不正确的。科学的素材也是生活的素材。科学是活生生的现实,是我们经历的每一件事情是什么、怎么样和为什么的问题。 ——雷切尔·卡森(Rachel Carson,1907-1964,美国生物学家。主要著作有《在海风的吹拂下》、《围绕我们的海洋》、《寂静的春天》。真正让她获得广泛关注的是《寂静的春天》,它的诞生标志着现代环境运动的开始和环境新闻走向成熟。——译者)在接受1952年国家图书奖(因《围绕我们的海洋》一书而获奖)时的演讲 科学,正如卡森所观察到的那样,是生活的一个组成部分。它具有自身的优势和弱点、成功和失败、疑问和不确定。当科学家试图理解一个细胞异常是如何引起癌症,一个基因是如何传递信息促进机体发育,一个生态系统是如何应对城市的拓展或者整个地球是如何应对大气中化学成分的长期改变时,这些研究的每一个阶段都被包围在不确定性之中。不确定性的产生有许多方式,它的本质也许会随时间而改变,但是搞科学的人决不可能游离于不确定性之外。 科学会因为不确定性而衰弱吗?恰恰相反,许多科学的成功正是由于科学家在追求知识的过程中学会了利用不确定性。不确定性非但不是阻碍科学前行的障碍,而且是推进科学进步的动力。科学是靠不确定性而繁荣的。遗传性状如何被复制的不确定性,最终导致了双螺旋分子结构的发现。的确,也许有人会争辩,是确定性而不是不确定性阻碍着科学。17世纪哥白尼、开普勒、伽利略为了推翻地球是太阳系中心的观念所进行的长期斗争,在当时盛行的“地球在宇宙结构中占据一个非常特殊的位置”的神学确定性面前,继续进行着。 实际上,科学家面对的不确定性同我们日常生活中遇到的不确定性没有如此大的不同。在许多文化中,冒险作为成功人士应该具有的品质受到人们的赞美。但是风险恰恰是因为不确定性而产生。在不确定性面前阐明风险、采取措施和接受风险的意愿和能力,被认为是一种特别的优势。虽然有一些冒险后来被证明是不明智的,但是没有冒险,就是对现状的含蓄接受。不愿意受不确定性的激励,才是前进的真正障碍。 具有讽刺意味的是,不是科学家的那些人经常将科学等同于确定性,而不是等同于不确定性。他们要求对以下事情进行高度精确和准确的预测:日食,海洋潮汐的日常进展,当地日出日落的准确时间,在一个遥远的行星上着陆的航天器内时钟的精确度。确定性的另一个方面是和技术可靠性相关的,当人们拿起电话,打开电视,或者转动轿车的点火钥匙时,都期待着设备正常运转。确实,当事物不是按期望或预料的发生时,通常会出现某种程度的惊奇和不满。 绝大多数人都不喜欢意外,而且对不可预测性(unpredictability)和不确定性感到某种程度的不适。 其他背景下的确定性是满意的一个来源。让信徒对死后生活放心的宗教信念可减轻对死后进入地狱的担忧。诸如“较小的政府是更好的政府”或者“没有比税收更好的事情”这样的政治颂歌,可将这些人从评估广泛的公共政策问题的负担中解脱出来。如果将一个充满灰色阴影的世界重塑成一个只是由黑色和白色组成的更简单、更坚实的实体,就会消除那种掂量细微差别的艰巨任务,取而代之的是确定性提供的舒适性。 在对复杂自然系统的理解中,当科学家不能说明高水平的确定性时,有时在普通公众中会有一种不耐烦和不满的潜在倾向。2001年末,在美国的政府大楼和邮政设施中出现了以炭疽孢子形式出现的生物恐怖主义。然而,一段时期以来,在公共健康团体和国家疾病控制中心内,存在着对以下问题的不确定和困惑:炭疽病是如何被传播的?多高的孢子浓度会有危险?炭疽孢子如何引起身体虚弱?公众想要知道答案,公共健康从业者却不能立即提供。与此类似,在英国,2001年口蹄疫的爆发遇到一系列关于如何遏制这种疾病的科学观点。釆取的遏制策略是大量宰杀周围的畜群,但是科学观点远未达成一致。疾病得到控制以后的很长时间,关于宰杀策略是否必要或有效的争论还在继续着。 当科学家承认,他们不知道诸如“疾病在一个生态系统传播”这样一种复杂自然现象的所有方面时,公众有时会将此理解为科学家对这一事件一无所知。这样就会导致公众对科学共同体能力的不信任,而不信任的副产品是普通公众更加频繁地对一些狂人、吹牛者和十足怀疑论者所发布的毫无价值的谬论怀有兴趣。在科学权威和确定性的氛围下,这些伪科学家做出了一些从未经过严格检验的断言,而严格检验正是真科学的基础。 算命者、看手相者、透视者、占星学家(名单可能会继续延长),所有这些人都是靠不让或不愿意让他们的顾客辨别出这些实践完全缺乏逻辑基础和科学观察而发家的。无论如何,绝对没有任何东西会提供给这些骗子以使其获得信任。但是他们的宣言总是经过精心构思以便给顾客留下这样的印象——有一种非凡的力量在客观地运行着。在下一章,我将描述有关这方面一个特别让人吃惊的例子,太多的对地震理应更加了解的人对大地震所做的预测是过于严重了。 当然,有一些严肃的学者对以下观念提出挑战:科学是通向宇宙真理的唯一途径。有一个哲学流派,笼统称呼的话可称为后现代主义,对“科学家是中立的和客观的”和“科学知识是毫无偏见的理性思考的结果”这些观点表示怀疑。极端的情况是,它会质问在人类建立的智力结构之外是否存在着一个确定的自然世界。这种边缘性观点把科学视为由科学家创建的拥有一套规则的游戏,并声称如果我们不接受这些科学游戏的规则,那么在对自然界的理解中,科学显而易见的成功将无法维护。此立场的一个子题目就是科学是一个自我服务的概念和实体。 1996年,当纽约大学的物理学教授索科尔博士,向一家被认为是支持这一特别哲学的杂志提交一篇文章以供发表时,后现代主义的观点成为引人注目的焦点并被大加嘲讽。这份稿件的标题为《超越边界:针对量子引力的变形解释学》,这篇文章似乎是在传递一种后现代的味道。由于一名物理学家已经提交了手稿,杂志社的编辑们欢迎给似乎能够从内部腐蚀科学基础的科学家发表文章的机会。但是索科尔的文章是一匹特洛伊木马,是经聪明构思的骗局,本文说明的并不是科学方法在哲学上的脆弱性,而是表明编辑们很容易上当受骗。索科尔运用绕来弯去的语言和结构,写了一篇看似博学的论文,其实只是掩藏在伪科学行话之下的胡言乱语。过分渴望的编辑们上了圈套,发表了索科尔的文章。一旦文章印了出来,索科尔揭露了这个骗局。“索科尔事件”就像它的称号一样,含义有许多,但就我的目的而言,主要的观点是这样:有些人,无论其受过教育与否,他们只是相信科学不提供任何特殊的东西。他们怀疑或者完全忽略科学结果。 还有另一种类型的人,除非科学同他们挚爱的其他信仰发生了冲突,一般情况下他们会接受科学结果。就在写作本书时,我读了国际平坦地球研究协会主席约翰逊的讣告。除了行星形状这一特殊的困扰之外,约翰逊先生看起来就像飞机机械师一样过着相当正常的生活。除了有关地球的形状之外,他很少有与科学共同体不一致的意见。他这样解释“阿波罗号”宇宙飞船的宇航员从月球上拍摄的地球照片:月球登陆不过是精心策划的骗局,照片只是这一骗局中的一个道具。我们也许会对这一怪论一笑置之,但是科学不确定性的水池,却由每一位成功关注从另类角度观察自然界的约翰逊一步步加深了。1994年,一份民意测验显示差不多有1/10的美国人认为月球登陆是伪造的。好莱坞在诸如1998年拍摄的电影《做大英雄》(此电影的剧情如下:在新一轮大选开始前两周,现任美国总统遇到了麻烦。新闻媒体大肆攻击他在白宫召见一位专为名人物色美女的皮条客。总统的幕后人马没一个关心这事是真是假,反正支持率肯定会下降,现在他们关心怎么把支持率再搞上去。——译者)等影片中也添油加醋。在这部影片中,美国总统通过编造对阿尔巴尼亚的虚假战争,包括用描绘破坏和屠杀的虚假电影脚本在内的虚假入侵的方式,试图将注意力从个人的困境中转移出去。 在科学和个人信仰之间一个更广为人知的冲突,集中在《创世记》中对上帝创造万物的《圣经》的描述上。这一争端是关于《圣经》上的每一个字是否都是正确的。上帝是否在仅仅6天之内创造了整个宇宙以及其中的每一个生命?地质学家和进化生物学家提出了很有说服力的理由:并不是所有的现代生命形式在地球诞生之日就出现了,今天绝大多数的生命都是经漫长的地质年代由其他生命形式进化而来的。但是拘泥于对《圣经》字面解释的人并不接受对《创世记》哪怕是极小的偏离。如果《创世记》的每一个字都是正确的,那么现代地质学和生物学必定是错误的。 神创论者目前正从事着以下事情:通过证明一种“创世科学”(creation science)的努力,证明进化生物学的原则是不正确的。这种所谓的“创世科学家”试图找出进化生物学的逻辑缺陷或观察错误来“否证”它。然而,他们还没有运用同样的精力来检验《创世记》中建立的假说。他们甚至不愿意承认《创世记》中的叙述是一个假说,更不要说检验了。他们无法想象运用实验和观察否证《创世记》,因为“创世科学”的从业者不是真正的科学家。神创论者在他们基本的立场面前决不会退让,即所有活的生物都是上帝直接同歩创造的。他们不允许出现这样的可能性:《圣经》中关于创世的描述是不正确的或有朝一日被证明是站不住脚的。相比较而言,真正的科学从业者,很容易承认不确定性,而且在不确定的环境中工作感觉如鱼得水。在真实科学(real science)中,很少有概念被认为是绝对正确或被绝对确定地接受。 的确,真科学(genuine science)是建立在假设的基础之上,这个假设中的概念有可能是错误的。当一个概念被证明在逻辑上不一致或与直接的观察相反时,证伪(falsification)就发生了。考德威尔(Lynton Caldwell)在对齐默尔曼(Michael Zimmerman)的《科学、非科学和谬论》一书的评论中,将科学描述为“从可能的正确中分离出可论证的错误”的过程。仅仅是谬误能被证明,而真理是不能被证明的,这是科学的根本基础。真理仅仅是多次努力后未被切割的幸存者。事实上,科学部分是通过“不断探索概念的最薄弱部位”这样的方式获得进展的,而这些概念在解释某些自然现象时取得了部分成功。这种对弱点的无止境的研究可能会揭示理论的微妙矛盾,最终导致对最初概念进行修改或抛弃。 同行评议 这些科学对抗发生的环境是什么?核心的过程叫做同行评议(peer review)。当科学家希望告诉世界他们从事的某些研究时,应当遵循已制定的路线。通常情况下,第一步是要在专业学会会议上做有关研究的口头陈述。这需要他们将自己的贡献做成一简短的书面摘要,并提前交给为会议制定议程的委员会。接着,将这一摘要在议程中公布出来,以便其他人决定自己是否要出席。在会议上,比较典型的做法是,作者要对其工作做10到20分钟的口头陈述,在此之后,会有听众提问或讨论。在讨论中表达的观点范围很广:同意、不同意、怀疑、赞美、嘲笑等等。 如果科学家的口头陈述受到充分鼓励,那么他或她接着要为其工作准备一份比较长的书面报告,交给学术期刊以待发表。接下来编辑会将手稿送交在所交论文的大致领域工作的其他科学家,征求他们对此项研究是否适合发表的意见。要求同行评议者从几个方面评估这项研究。该项研究是否具有新颖性和独创性?所运用的方法是否与研究目的相匹配?实验设计或理论推导中有错误吗?结论是从观察和数据中直接得出来的吗?结果具有的不确定性水平是什么?让有经验的从业者对研究进行检验是杜绝有错误研究的过滤器,但是允许满足一定标准的研究成果发表以供其他读者阅读、评估、竞争或复制。事实上学术期刊发表的所有论文都要经过同行评议的检验。 同行评议过程并非没有错误,但是经同行评议过滤掉的有缺陷科学远比其偶尔的失败要多。有时同行评议对后来被证明是不正确的特别重要的主张虽然持有怀疑,但考虑到自我修正的过程,仍然做出有利或较宽大的决定。1999年,一组物理学家为一种新的超重元素的存在提供了实验证据,该元素在元素周期表中编号为118号。然而其他实验室的实验人员,包括最初那组实验人员,尝试通过重复实验重复实验结果,但都没有成功。经过两年的失败之后,最初的研究小组宣布撤销他们的声称,承认他们可能是曲解了第一次实验的数据。2002年初又发生了一次类似事件,有一篇发表在一家颇有声望的杂志上的论文宣称观察到了核聚变的证据,即先是有小泡形成,接着受声波激发,在有机溶剂中发生内爆。在同行评议过程中,这篇论文非常具有争议性,但是由于实验的结果一旦是真的,就会有着非同寻常的意义,因此编辑决定发表它。毫无疑问,许多其他实验室的科学家为了要证实所报告的结果或想证明此结果无效,将会对此实验进行重复。 因特网作为一种新的媒体,对同行评议提出了重大的挑战。任何拥有计算机的人,都能将他或她的研究,无论是合理的还是有缺陷的,相关的或不相关的,重要的或微不足道的,放入公众领域让任何人阅读。这种现象大大增加了此项研究的用户进行检验和评估的负担。同行评议的角色在于过滤掉有缺陷的研究并防止其发表在科学杂志上,现在这种守门员的角色(gate-keeping role)变成了让所有的单个读者在因特网上冲浪。因特网是很卓越的平均主义者,因为任何人几乎能邮寄任何东西,但是确定邮寄的东西是否真实或有价值则是个人用户的事情。在因特网发展之前的早些时期,不经过编辑审査就让自己的思想或观点公诸于众仅仅是某些有钱人的特权,他们能够通过籍籍无名的出版社自掏腰包出版。将评估的责任转交给每一个浏览万维网的个体,使得公众理解科学和不确定性更加必不可少。 不确定性的传播者 不喜欢科学所述东西的那些人,常常准备对科学发动微妙或并不微妙的攻击。当他们发现某种特定研究结果具有威胁性时就实行这种形式的攻击。他们常常争辩道,如果科学是经“合适地”构想或执行的话,就会出现一个不同的结果(暗示着他们喜欢不止一个的含义)。对科学可信度进行这种特别攻击的代码,常常出现的有“不健全科学”(unsound science)、“未决定科学”(unsettled science)、“不确定科学”(uncertain science),“拙劣的科学”(poor science)、“垃圾科学”(junk science)等类似话语。与同行评议层次的批评不同,这些批评总是发生在平常的科学渠道或科学标准之外。它们通过付广告费出现在报纸上,或出现在致编辑的信件中,或通过参加电台或电视台的访谈节目来表现。 这些代码描述被石油和煤炭工业定期用于有关全球气候变化的原因和结果的评论。在刊登广告的醒目位置,埃克森美孚公司频繁贬低证明气候变化或提供“使用化石燃料会引起气候变化”这样证据的科学研究。作为最大的国际受益者,它试图推迟立法或让限制二氧化碳或其他“温室气体”(greenhouse gases)排放到大气中的国际条约出轨。人们可以想象,如果化石燃料工业有检验温室气体在气候变化中作用的重要观察资料,那么他们将会战斗在科学的竞技场——常常发生科学争论的受到同行评议的科学杂志,而不是战斗在媒体里或街道上。但是化石燃料工业对赢得伦敦、柏林、华盛顿等国家首都的政治斗争更感兴趣;他们将时间浪费在公众竞技场,迷惑并逐渐破坏公众对科学结果的信任。 通过散布对科学的怀疑和不确定性以对决策人产生重要影响的策略并非没有成效。2001年3月,惠特曼(Christine Todd Whitman),布什(George W. Bush)政府新任命的环境保护局局长,取消了前政府公布的对饮用水里砷含量的更严格限制,并开始重新评估建立那些规则的科学基础。“我们将会运用强大的科学……确定新的限制应该是什么。”这种陈述的目的只有一个:逐渐破坏公众对以前科学研究的信任。而刚刚废止的规则就建立在这些科学研究的基础之上。在制定那些规则之前,评估环境中砷的科学、砷对公众健康的影响,以及美国国家科学院关于砷的检测报告已有超过10年的历史。这显然不足以战胜以下两方面的反对意见:一是釆矿工业,在矿石加工中必然排放砷这种副产品;二是社区,人们若想继续饮用更好的水,就必须改进净化装置。当然环境保护局仅对白宫的立场做出回应。 2001年4月24日,布什总统在白宫国宴厅对一群环境青年奖获得者说:“我们将要在健全科学的基础上做决定,而不是根据周围的时尚或听起来可能很好的东西做决定。”6个月之后,国家科学院在政府的要求下对相关证据作了评估之后,确定对砷实行新的较低含量限制是完全恰当的,实际上也许还不够严格。当然,没有新的科学数据,也没有另外的“健全科学”出现支持这种含义,即先前宣布的修订案是建立在不健全的科学基础之上。 对科学的这些攻击几乎不是什么新现象。1952年,当卡森宣布杀虫剂DDT的广泛使用对鸟类繁殖具有毁灭性的影响时,杀虫剂工业将其见解当作建立在脆弱科学基础上加以嘲笑。数十年来,烟草行业一直否认存在任何证明吸烟有害健康的科学证据。20世纪70年代,人们开始认识到环境中的铅会对健康产生危害,产品中含铅的汽油生产者却嘲笑这一科学。在位于美国东北部的那些州,当人们发现酸雨是由中西部的发电厂燃烧高硫含量煤引起的时候,电力工业对这项研究不屑一顾。20世纪80年代,当遇到氯氟碳化合物(CFCs)正在破坏平流层(平流层,英文为stratosphere,也译作同温层。包围着地球—的那层空气叫做“大气层”或简称为“大气”。大气的密度随着髙度而减小,最后和星际气体连接,所以,它们之间不存在一个截然的界限。以气温变化为基准可将大气分为对流层(变温层)、平流层(同温层)、中间层、暖层(电离层)和散逸层等五层。平流层位于对流层之上,顶端离地面大约30公里,其特点是:温度大体不变,平均在-56.5度左右,几乎不存在水蒸气,所以没有云、雨、雾、雪等天气现象,只有水平方向的风,没有空气的上下对流。——译者)臭氧这样的论断时,化学工业争辩道,这种论断后面的科学是脆弱的和不确定的: 国际化学工业坚决否认臭氧层状况和日益增长的CFCs的销量之间存在任何关联。为了对此理论进行质疑,工业界迅速开展他们自己的研究和公共关系。 当公共关系运动迷惑民众的时候,科学仍然坚定着自己的立场。1995年,诺贝尔化学奖被授予罗兰(Sherwood Rowland)、莫利纳(Mario Molina)和克鲁岑,表彰他们阐明了CFCs引起臭氧损耗的机制。这是诺贝尔奖第一次也是唯一一次对环境化学研究予以承认。 所有经过同行评议的科学研究都会被认可为伟大科学吗?当然不是。我定期阅读科学杂志,提交供发表的研究报告,也为他们做同行评议。绝大多数科学家会承认,杂志除了有大量重要的研究结果外,还包含一些正确但价值不大的稿件和一些后来被证明在方法上有缺陷的其他稿件。偶尔(但是会很少)有一次欺骗性的投稿,描述从来没有完成的工作或子虚乌有的结果,当时会成功地溜掉,直至后来有人足够仔细开始怀疑并且检查它时,才揭开它的假面具。当然,科学家不想让不可靠、不细致、没有价值的科学搅乱杂志和扰乱知识体系。但是不确定的科学,未决定的科学,几乎完全不同于不可靠的科学。科学中事情的正常状态是未决定的和不确定的,没有哪项新研究会完全消除不确定性。当较早的问题被回答时,新的问题又出现了。为了避免这听起来像无用踏车,我向你保证它肯定不是。不确定性根本不会让你失望或无力,相反它是科学家力量和创造性的源泉。不确定性是一种挑战,是科学进步的催化剂。 “人们热爱科学,他们只是不理解它” 为什么许多人在接受和适应科学不确定性方面都有一个如此艰苦的时期昵?有比宗教信仰给予安慰的确定性、骗子提供的显著确定性或一些工业为了维护它们的经济利益而散播的让人迷惑的烟幕这些原因更深层次的理由吗?我认为,发生此类问题在更大程度上取决于以下事实:通常绝大多数人缺乏对科学的初步理解。这种科学文盲(scientific illiteracy)为确定性的呼吁和不确定性的混乱提供了生根发芽的肥沃土壤。 斯诺(C. P. Snow)在其著名的《两种文化》一书中,概略说明了在现代大学和社会中普遍存在的科学学科和人文学科相互分离的理解性鸿沟。这一观点隐含在本章开头卡森的引文中。1996年,有一篇讲述美国科学教育的文章是这样讲述的: “美国人热爱科学,他们只是不理解它。”的确,时常会听到这样悲观的论调:普通公众从来就不理解科学,更不要说领会不确定性的奥妙了。如果我们不是在科学理解的如此之薄的冰层上行走,我们还会那么容易遭受狂人宣言或者特殊行业施放的迷惑烟幕的攻击吗?如果我们对科学不是如此陌生,也许就不会如此轻易受到这种迷惑的捕获。 理解科学的这些问题很早就始于教育系统的不完备。在一种非常重要的意义上,孩子们天生就是自然科学家。他们沉浸在奇特的世界里,对他们周围的一切事物充满好奇。他们看,他们摸、听、闻和尝。他们观察这个新的世界,并且处理和评估从每个方向到达他们的信息流。他们探索、实验,从自身的错误中学习。接下来他们就去上学了。 美国的学校教育,至少就科学调査来说,向孩子们介绍了一种新的方法论。这种新的方法论强调科学并不是像当初学步的孩子经历的好奇和探险的继续。相反,学校的科学不是作为探究的过程,而是更频繁地作为成就的复述出现。事实是最重要的。学生被告知:世界是圆的;地球绕太阳旋转;一年有365天;昆虫有6条腿;亚马孙河是世界上最大的河;珠穆朗玛峰是最高的山峰;岩石可以被分成火成岩、变质岩和沉积岩等种类;原子包含质子、中子和电子。新的强调是用人们确认的每一个受到良好教育的人必须知道的“事实”填满小小的脑袋。科学展现的是答案而不是问题。降级到这种遥远的背景,是对“事实”如何被确定、“事实”可能是多么的持久或短暂和我们相信这些“事实”是多么的确定或不确定等进行探究的过程。 答案,就像我早先提到的一样,对一些人来说比问题更让人受到鼓舞。在简单背景下,不确定性可能被解释为“它可能是这样或可能是那样”,但是这样的看法常常被认为是非常危险地接近文化和道德相对主义的深渊。在这种相对主义里,在正确与错误之间有一道灰色的阴影会把年轻人引入迷途。“不”,文化绝对主义者说,“有一些事情我们是确定的,我们不能试图将这个问题和模糊真理的不确定性相混淆。” 考试,考试…… 学校教育的成功,常常是通过“对学生实行地方性和全国性的标准化考试来评价他们在阅读、数学和科学方面的成就”这样的方式来衡量的。一些学校系统和它们的老师被按照学生在标准化考试中的成败划分等级。把政府对学校的拨款与标准化考试的成绩联系起来的提议,被执行得有条不紊。一些学校认识到他们的政治支持、甚至财政支持可能取决于考试成绩,因此他们“为了考试而教书”就不足为奇了。然而,从国际性眼光来看,即使是为了考试而教书并没有让美国的中学产生引人注目的成果。1999年,第三届国际数学和科学竞赛,对23个国家的学生进行了测试,结果显示美国8年级学生(13岁学生)的科学和数学成绩在国际平均线以下。就美国国内而言,国家教育进步评估机构每隔几年要对4年级、8年级和12年级学生(分别是9岁、13岁和17岁)进行一次数学测试,结果划分为“初级以下”、“初级”、“熟练”和“高级”几个等级。2000年举行的测试中,9岁和13岁的孩子中仅有三分之一、17岁的孩子中不足五分之一达到熟练水平。 当然,我承认科学进步,实际上任何生活努力中的进步,一定有着包括基本的文字能力和数字能力的教育基础。阅读、书写和运算能力,确实成为生活要素的一部分。但是,就必要性来说,如果仅仅将它们作为教育的目标,我们将会欺骗学生和社会。其他重要的技能,例如如何仔细观察、如何批判性地思考、如何处理冲突、如何发展团队精神,都是难以被测试的,但是对于学生的成功和学生整体来说,可证明是同等重要的或者是更加重要的。 这种对获得“知识”的强调,在整个初等和中等教育体系中持续存在,在许多高等教育课程中也未被削弱。用于对科学做引导性纵览的课程的教科书,太多的是对我们确实知道的知识的一种无趣的概述,对于我们不知道的知识却没有做一个激励性的总结。在这些教科书中对科学前沿的描述在哪里昵?什么是没有回答的问题?这些问题可能会让富有想象力的学生兴奋起来,重新点燃他们在孩提时代曾经拥有的对自然的好奇。为什么他们没有了解到那个领域具有的不确定性? 科学随时间如何进化的历史揭示了科学家在过去的时间里有一个不成功的开始,是沿着死胡同前进的。马査多(Antonio Machado,1875-1939,西班牙诗人。出版的诗集有《孤独、长廊和其他诗》、《卡斯蒂利亚的田野》等。——译者)20世纪早期西班牙的一名诗人,表达了这种思想:“对于行人来说,是没有路的。当你行走时你就创造出了路。”一个学科的历史,虽然通常没有在包含此领域的不确定性方面进行表达,但是它能够突出某一特定时期传统的知识,显示在冲突性的观察和竞争性的思想面前,传统知识如何被拆散并被较新的概念替代。对时间和历史的透视为了解以下问题提供了机会:科学作为探究的领域是如何发展的?探究性的问题和批判性的思考是如何促进人们更好地理解的?没有任何历史的背景,学生们必定只是满足于快速得到今天的答案,而不是对昨天或明天的问题进行探究。 在研究生学位计划中,原则上主要是训练职业科学家和未来的教授,然而大学却在尽力取消这一切。学生进入研究生院以后,长时间集中在给出答案而不是提出问题。他们对阐述一个研究项目感到困难,而此研究项目能够提出一个有趣而重要的问题,并且能够设计一条解决问题的大致通道。在我所在的大学里,许多科学界的同事并不乐于帮助学生摆脱束缚学生好奇心的教育限制。虽然许多系的教师自身对研究作过想象,但更多的是把研究生视作他们个人研究机器的嵌齿。他们没有让学生构想一个研究问题并提出解决这一问题的方法。相反,学生经常是被分配一个范围縮小的项目,此项目很少放在更大的研究视野下进行解释。他们被指导如何使用最复杂的研究设备测这测那,但就测量相关性来讲,经常被认为是不重要的而不加考虑。他们学到了知其然,却很少学到知其所以然。当然,当他们获得的技能随着下一代仪器的使用而变得过时的时候,许多人醒悟到他们已背离了科学。 因此为什么我们有这么多的科学文盲?为什么人们容易受过分简单的思想和虚假宣言的影响?为什么他们对科学不确定性感到迷惑?我认为,部分原因在于大多数学生接受的科学教育抑制了他们的自然科学直觉。许多学生在小学和初中就对科学丧失了兴趣,原因在于没有利用他们对自然的好奇。接着高等教育系统让这一问题延续下来,主修科学专业的毕业生是吸收了所有的“事实”而不是准备向这些事实挑战。同样愚蠢的体制用于培训新的小学和初中教师,这些受培训的教师再重复这些模式。研究生阶段,培训出的新科学家更多的是有能力的执行者而不是富有想象力的设计师。简而言之,许多国家共有的教育实践已经导致了成年人普遍对科学满怀兴趣同时又对科学感到迷惑,主要原因是他们不理解科学家是如何着手做提出问题和评估答案这样的事情。继续不确定性花园的比喻,我们已经开始了在东方帐篷的旅行,那里的展览已经说明了科学和不确定性的一些社会学的、政治的和教育的方面。下一章仍旧固定在东方帐篷中,在那里我们将要集中到位于科学和大众之间的特殊机构——大众传媒。媒体有助于向大众传播科学吗?不仅仅是根据科学的成功、成就和确定性,而是将其作为一种探究过程或探究方法来传播吗?这种探究过程或探究方法是受失败刺激,而且是在不确定性投射的阴影的微弱暗淡的光亮中繁荣发展的。 第三章 媒体能帮忙吗? 科学是一部长电影,新闻媒体则通常拍快照。 ——约翰·施瓦茨(John Schwartz) 公众理解科学真的有必要吗?为什么不让科学家做自己的工作,而其他人干好自己的事呢?不幸的是,在现代社会,那只是一条行不通的路线。不管我们是否认识到,科学已经成为我们生活的重要组成部分,我们不能将它当作好玩的附属品视而不见。与以前相比,经济、国防、环境和健康更需要依靠科学进步。信息技术在经济生产中的突出角色、弹道导弹防卫保护的可行性、人类燃烧化石燃料引起的气候改变、新的人类基因组图完成的含义,所有这些都提醒我们不能离开科学,即使我们想这样做。然而对于所有的科学与我们日常生活的明显相关性,许多人仍然没有准备在科学基础之外了解很多。 就像我在前一章讨论的,如果我们的学校不能发展对科学的意识和评价,那么我们可以构想第二道防线来抵制科学文盲:科学家同大众传媒紧密合作来告知和教育公众。当科学问题的理解或误解出现时,我们能求助于电视、电台、报纸、杂志和因特网来澄清和深入了解吗?有了10亿美元的财政预算、有才能的工作人员和有时同实践科学家紧密的工作关系,人们理解科学的潜在性似乎很高。科学家和新闻记者通常都接受过良好教育,也具有相似的智力基础:好奇、怀疑和将不完整、有时是不准确的信息拼凑成一个故事的能力。的确,被学校忽视的科学教育,后来能够通过科学家和媒体的努力得到弥补。 对于科学家和媒体而言,这是个重大的责任,不幸的是他们都没有作好充分准备来承担这种责任。科学家不善于交流,媒体内部充满竞争而没有耐心,这两个团体相互误解,在一定程度上互不信任,双方都缺乏教育公众理解科学的强烈责任感。再加上工作中许多复杂因素的影响,例如,像烟草行业和化石燃料工业这样有着特殊利益的群体,它们不想让某些科学问题得到澄清,也不想认出不确定性并对其评估。但是在媒体中,还有一些力量正有效地破坏着人们对科学的理解。广播和电视上的访谈节目主持人认为自己的首要角色是娱乐;科学很少有机会找到聊天的话题,而且科学通常很少能够在谈话中互动起来。并不是节目主持人有意将科学变得含糊,而是许多人不愿意把时间花费在理解科学的复杂性上。他们肯定不想让科学或其他任何被特别报道的话题,变得过于复杂或蒙上灰色的阴影。轻视性的简单化是一种逗乐的好方法,科学在一个能说会道的节目访谈主持人的解释下,往往很快被简化为一颗颗小石头。 这一想象的媒体:科学教育联盟也富含其他弱点。将这些有着共同目标的潜在合作者联合起来,存在多方面的问题,其失败两个群体也都负有责任。俗话说,推卸责任应当受到谴责。首先让我们看看科学家设置了什么障碍。 科学家 新闻记者需要资料来源。如果科学家不愿意对他们讲科学的事情,他们就不能对此做报道。科学家喜欢他们的工作得到认可。难道他们能从媒体之外得到重要认可吗?不幸的是,至少从科学教育的观点来看,对这一问题的回答无疑是肯定的。 科学家寻求认可的主要形式是得到同行的承认。这主要通过以下方式来体现:他们的研究结果在经同行评议的科学杂志上发表;在同行评议的具有竞争力的提议的基础上获得研究基金;在同行评估基础上加薪和升职;对于极少数人来说,还意味着获得荣誉奖,如数学中的菲尔兹奖(Fields Medal,1863-1932,加拿大数学家。在数学方面的研究集中于代数函数。由他倡议的菲尔兹奖,是世界上最高的数学奖,同诺贝尔奖一样享有国际盛名。——译者),地球科学中的克拉福德奖(Crafoord Prized,1908-1982,瑞典商人。1980年,克拉福德捐献了300万瑞典克朗给基金会,也就是后来的克拉福德基金会。基金会的目的是促进诺贝尔奖之外的几门基础科学方面的研究工作。克拉福德奖从1982年开始,奖励类别包括数学、天文学、地球科学和生物科学(特别是和生态、进化有关的生物学),此外还有多发性关节炎方面的研究工作。——译者)或者诺贝尔物理学、化学、医学、经济学奖。但是,通常对学院科学家的奖励体系并不重视非学术界的贡献。事实上,在学术生涯中存在一种潜在意识,即在非学术努力上花费时间会阻碍科学的进展。卡尔·萨根(Carl Sagan)是康奈尔大学天文学家,也是多产作家,他把许多科学带到普通大众王国,却从未当选国家科学院院士。当选国家科学院院士是美国科学家能获得同行认可的最高形式之一,相当于英国的皇家学会会员。推断之所以对他拒绝认可,主要原因在于他的非凡成功无论是作为作家还是在电视上,都只是作为科学的普及者和解说者。许多成功的科学家,即便不是完全的不屑一顾,也对这类通过媒体的努力评价甚低。 尽管与萨根或古尔德(Stephen Jay Gould,1941-2002,美国古生物学家,世界著名的进化论者、科学史学家和科学散文作家。主要著作有《自达尔文以来》、《熊猫的拇指》、《母鸡的牙与马的蹄》、《火烈鸟的微笑》、《为雷龙喝彩》、《八头小猪》和《鼎盛时期的恐龙》。——译者)相比显然是在很小的范围内,但我的确是在努力缩小这一差距。除了实际的教学工作和研究工作,我付出了很多的努力来为非科学读者描述科学、为非科学观众讲述科学,当我(或他人)的研究结果发表时,我会接受媒体釆访,并帮助他们向公众传播研究的重要性。我已经从我们大学的副校长处收到愉快的信件,感谢我抽出时间同媒体合作(当然我的大学的名字也出现在文章或广播中)。我记得同克林顿总统科学与技术办公室主任、美国国家科学基金会前会长莱恩博士进行过交谈,探讨了我对本书的想法。他催促我立即动笔,并评论说帮助公众更好地理解科学是一件紧要的事情。我收到美国副总统的便条,感谢我为国会工作人员举办关于全球气候变化的讨论班。 自然,关于帮助公众理解复杂科学问题的重要性,写了许多,也讲了很多。然而,在承担着绝大多数科学研究的大学中工作的科学家,由于奖励体系的性质,丧失了参与媒体工作的信心。当同事们认真考虑成绩评估,将其作为年度薪金调整的一部分时,公共服务所占的分量很小。所有非学术认可再加几美金可以为你买到一杯上好咖啡,这种老掉牙的笑话绝非毫不相关。有分量的问题(文字上我使用这一术语)是:你发表了多少篇研究论文,你指导了多少研究生和博士后学者,你教了多少大学生,你获得了多少研究基金。更广泛的关于公众教育的问题,如本书部分章节所阐述的以及构成我的职业生涯一部分的更公众化的活动,在学校价值评估中很少得到较高评价。因此,遇到下列情况一点也不奇怪:如果科学家同媒体合作以便更广泛的非学术听众能够理解科学这件事情受到的实质性鼓励很小,那么他们很少再进行这方面的努力。 即使具有一个合适的奖励系统,训练科学家与媒体友好合作也不是一项简单的任务。也许首先遇到的困难是这一事实:通常科学家和新闻记者不是在同样的时间框架下工作。典型的是,科学不会产生诸如矿井坍塌、板球比赛、政治辩论或者芭蕾表演这样的日常事件来引起媒体的注意,科学家很少会面对按日计算的截稿期限。 也许将长期的科学努力制作成新闻事件的最恰当时机,是当研究结果在会议上被提出或在专业杂志上被发表时。现在我们越来越习惯于新闻报道这样开始,“在今天发表于《新英格兰医学杂志》的一项研究中……”或者“本周在欧洲地球物理学会会议的一个报告中……”。但是,在每年发表的成千上万篇文章和论文中,媒体专业人员如何鉴别出其中真正有重要价值的昵?可以肯定,很少有记者会定期阅读《柳叶刀》、《美国医学会杂志》或者《地球物理研究杂志》,做这种事情对于大多数新闻记者来说,其痛苦无异于长期折磨致死。然而,近几年,大学、专业协会、科学杂志出版商作出很大努力,在他们知道和喜爱的科学家与向大众传播科学的媒体专业人员之间搭建桥梁。这是对绝大多数学院科学家和他们的专业协会所拥有的孤立主义传统的重大背离。 我自己所在的大学就很注意自己的公众形象,它有一个新闻和信息服务办公室,此办公室拥有一支能力非凡的工作队伍。他们未雨绸繆,从科学部门负责人那里索取教职员参加的专业会议的日程表,然后与科学部门负责人坐在一起以便确认具有特殊重要性的陈述。 接着就会对发表陈述的教职员进行采访,然后将准备好的新闻稿发送到媒体。有时这会导致对陈述之后的报告人做釆访。 科学刊物本身也是给人以深刻印象、有效的新闻机构,促使媒体注意他们的出版物中出现的重大进展。两家享有盛誉的国际性科学刊物是出版于英国的《自然》杂志和由美国科学促进会出版的《科学》杂志。这些刊物在科学共同体内被广泛阅读,每周出版一次,特别推出15到20篇由世界各地科学家撰写的研究报告。在每周出版之前,《科学》杂志和《自然》杂志都提供各种论文的新闻稿、经过挑选的少量论文的编者按、使媒体能够与涉及该项研究的科学家进行交流以便获得其他观点的联络信息。最近我和同事在《自然》上发表了一篇关于“岩石温度如何证明地球变暧”的研究报告,然而,如果没有科学家们的参与和合作,研究机构、科学协会及出版社再怎么努力也无法把科学带给大众。揭开科学神秘面纱的最终责任落到专业人员肩上。他们必须与报刊新闻记者、电视广播新闻记者进行有效的交流,而这些记者希望帮助科学家与公众一起分享科学殿堂里发生的一切。对于那些工作在大学的科学家来说,有效交流并非是不可逾越的障碍。他们面临的任务是始终把科学传播给教室里济济一堂的学生。成功的教师不会把自己藏在专门术语的障碍后面,而是学会组织和简化他们的资料,帮助学生既见树木又见森林。许多人已经认识到,将科学作为一种探究过程比作为成就的汇集向公众传播更为重要。他们知道所有的科学都是试探性和不确定的,正是这种不确定性刺激着创造性,推动科学不断向前发展。与媒体合作需要遵循与学生交流相同的原则。科学家们必须警觉,并且对产生误解的可能性保持敏感,他们必须努力说清他们工作的意义以及不具有的意义。 记者们不仅需要科学家提供材料,还需要他们的深刻见解。对于记者来说,看杂志中带有某种神秘色彩标题的科学报告是一回事,而辨识出这篇报告的重要性(或不重要性)则是另一码事。然而,确实也有例外,有些研究只有活跃的研究者才能评估。事实上,这就是在文章刊登之前对其进行评估和筛选的同行评议系统的基础。相同的评估系统,通过征求活跃科学家对提交的寻求基金以便开展科学研究的提议的优点和弱点的意见,也指导着国家机构和州级机构的研究基金分配。我也相信大学层次的教学是通过积极地从事研究来提高的。没有人能比一位研究人员更能认识到大量实验数据的粗略性或者确认一个理论的薄弱环节。无论多么贪婪的读者,无论谁对科学著作多么能综合,也无法与那些工作在科学第一线的科学家相比。 记者们是忙于面对截稿日期的人,他们欣赏能切中要点的科学家。他们既不渴望听到也不擅长整理科学家创造的用于保护自己研究结果的无尽的限制条件。当记者们意识到结论有某种不确定性这样的事实时,他们也会感激科学家能把不确定性置于某种熟悉的背景中。 霍廷斯基(Roberta Hotinski)是宾夕法尼亚州立大学地球科学专业的研究生,1999年,她整个夏天都在《美国新闻和世界报道》新闻工作室工作,该工作室是美国地球物理学联合会(American Geophysical Union)发起的,她的角色是担任科学与工程的大众传媒会员。她在描述自己的经历时,提供了以下建议:“如果你用可能性或熟悉的比喻表达你的确定性水平,报道者将有一些具体的东西可以强调。例如,你描述对全球变暖的确定性,可与你的信念作对比:a)太阳明天将升起;b)你的小孩将要上大学或c)你将要赢得彩票。”科学家一般通过确定定量的范围的方式描述他们结果的不确定性,此量的范围被称为“误差棒”,他们的结果位于其中。把误差棒翻译成记者能够理解的普通语言,以便研究结果能够被理解,还要走很长的一段路。 媒体 阻碍科学和媒体紧密合作的所有障碍并不都来自科学阵营。让我们了解以下由媒体设置的几个障碍吧。就像施瓦茨在本章开头引论中评述的那样,媒体,拥有快速照相机,通常没有时间或耐心拍一部长长的电影。即使当一部长电影正在播放时,媒体也会因最近发生的事件而转移注意力,他们可能甚至都没有意识到自己是在剧院里。而且,由于全球气候变化这样的话题已经讨论了几十年,媒体认为此类话题缺乏新鲜感或流行性。但是,与气候相关的显著效应不断发生,从而可以推知气候变化也在持续发生,所有这些又把人们的注意力引向正在缓慢发生的变化。在议院或国会的另一个辩论是陈旧的,但是尺寸如苏格兰大小的冰山与南极冰层的突然分离却是新闻。一份来自一家国际石油公司要求为气候变化作更多研究的新闻稿让人厌倦,但是“发现从北冰洋到北极的路径上没有冰”的一艘破冰船又把媒体的注意力拉回到气候变化的另一个方面。而且当一个关于乞力马扎罗山(位于坦桑尼亚东北部,是非洲的最髙峰,被誉为“非洲屋脊”、“非洲大陆之王”。海拔5895米,在茫茫无边的大平原上拔地而起,显得格外雄伟。山麓地处赤道,气温酷热,最高可达59°C,但峰顶温度在-34°C,终年积雪,寒风怒号。这奇异的自然现象使它又有“赤道雪峰”之称。——译者)的流动冰的调査表明海明威(Ernest Hemingway,海明威有篇名为《乞力马扎罗的雪》的短篇小说。一开头寥寥几笔便勾勒出一种神奇的意境:“乞力马扎罗是一座海拔19710英尺的常年积雪的髙山,据说它是非洲最高的一座山。马基人称西高峰为鄂阿奇-鄂阿伊,意为上帝的庙殿。在西高峰的近旁,有一具已经风干冻僵的豹子尸体。豹子到这样高寒的地方来寻找什么,没有人作过解释。”乞力马扎罗山紧靠赤道之南,它的诱惑力很大一部分来自赤道与雪山的强烈反差。2001年,根据《环球时报》报道,科学家发现:乞力马扎罗的雪正在融化,并可能在15年内完全消失。——译者)笔下“不朽的雪”也许会在下个15年消失时,新闻室就有人记录下来。 很多串在一起的快照对于公众来说就像是一部电影。通过重复,最终这些大尺度的环境概念能够进入公众的意识之中。1987年,当《蒙特利尔议定书》(一个规定逐渐停止制造和使用破坏臭氧的化学品的国际性协议)初具规模时,在国际会议之前有一个10年或更长时间的“快照”可见性是非常有意义的。本尼迪克(Richard Elliot Benedick)写道: ……知识和公众观点的力量对于蒙特利尔的成功是个难以应付的因素。见多识广的公众是推动政府的政治意愿和削弱工业界捍卫化学品的决心的先决条件。科学家的发现不得不被了解和传播……媒体,特别是报刊和电视,在把这一主题带到公众面前和由此激励政治利益方面发挥着非常重要的作用。 就像我已经提到的,许多小学和初中,实际上还有一些更高层次的学习机构,在科学教育和一般计算能力方面的不完备性现在已经影响了好几代学生。大多数从业记者也包含在其中。大多数媒体记者受到的科学教育与他们的小学、中学和大学同学几乎没有什么不同,这也导致他们随后在向公众传达科学的意义和重要性方面遇到困难。 而且当科学家自己提供的一些东西缺乏一致的解释时,当不确定性被表达时,媒体报道者通常不能评估这些不同的观点,不能帮助公众理解和适应不确定性。 其他的因素与教育之不足也不是没有关系,包括将科学视为无趣和很少有新闻价值的过低评价。这一态度显然是由于工作人员缺乏约束、科学报道的时间和出版者、制造者、编辑的分析引起的。这一态度受以下观点的支持:科学在日常基础上受时间和空间的限制,实际上不具有竞争性。另外,不幸的是,一些媒体的“看门人”感到公众教育不是媒体的责任;他们认为他们的责任是报道和记录每天的事件,而不是解释那些事件和将事件置于相关背景之中。更有甚者,他们仅仅希望取悦其读者。 对于一个以熟练使用语言为荣的职业,媒体在评估特殊利益群体使用的语言时经常粗心大意,这种语言影响了描述问题的方法。这些巧妙歪曲主题的代码字常常被无意地并入文章。将大气的二氧化碳和甲烷描述为“所谓的温室气体”,产生了一种不该产生的印象,大气科学家绝对不支持这种印象。当记者使用诸如“温室理论”的词汇时,他们产生了一种印象:大气温室效应也许只是一个概念,根本没有现实基础。没有什么比这更加远离真理;纵观地球的历史,地球表面由于温室效应而变暖。合适的辩论不是我们这颗星球是否具有温室效应,而是温室效应因为人类活动正在改变多少。重复使用“健全科学”、“垃圾科学”和“创世科学”这些词语,而不仔细留意是谁在使用这些语言以及他们可能的动机是什么,对于公众来说是极为有害的。 媒体经常认为争论比科学本身更有趣。科学辩论差不多就像一场体育竞赛,由于具有竞争性肯定会产生一个获胜者。但是不像每天都可以产生一个非常重要的报道的体育运动,科学主题没有大规模媒体队伍和深度分析的益处。大型报纸也许拥有一个体育记者团队,这些记者都是高尔夫球、网球、板球、足球、篮球和棒球方面的专家。许多星期以来,我们也许了解到有关训练课程、训练战略和世界杯足球赛球队的群体心理,或者一名环法自行车赛选手深刻的内心思想的许多细节。但是科学评论经常如此报道“他说,她说”,很少出现提供给读者或观众以便帮助他们理解奥妙的深刻见解。因为新闻记者希望避免成为一边倒的拥护者,他们承认自己不能充分地分析形势,因此经常感到必须拿出相等的时间给相互对立的观点,不考虑支持科学争论的任何一方。结果常常导致将注意力不必要地投向并由此相信一些轻率的宣言和不重要的争论。 媒体新闻走入歧途 之前:“断层线的威胁一触即发” 之后:“媒体在新马德里地震的错误报道让人吃惊” 媒体新闻走入歧途方面一个具有教育意义的例子是,预言1990年12月3日发生的一次大地震将会摧毁美国中部大陆,或中加利福尼亚,或东京,或其他某个地方所带来的威胁。这一预言是由布朗宁(Iben Browning)博士发布的,他是一名商业顾问,其最高学位是在生物学方面获得的,而不是在地质学或地震学方面。在美国,特别是中部的州,媒体报道这一预言时并没有做任何重大努力来评估它的可信度或发生的可能性,结果酿成了大事件,导致学校关闭、商铺停业、预防突发训练、保险欺诈,以及在地面零点利用几乎像狂欢节一样的氛围举办非同寻常的企业活动,给当地造成了混乱。 布朗宁关于地震的预言基于这一思想:1990年12月3日,太阳、月亮和地球将排成一线,结果太阳和月亮的万有引力将达到非同寻常的水平。这些额外的作用力将加到地球地震带不断累积的结构压力上,从而引发一次大地震。这是一种“压垮骆驼背的最后一根稻草”的概念。虽然布朗宁让人们注意的行星排成一线的现象的确发生了,然而作出这一预言只需要读一本历书,不需要更多专门的科学技能。布朗宁有什么能够证明预言将要发生地震的地方已经达到断裂点,正等待最后一根稻草致命一击的证据吗?绝对没有。显然他只是选择了历史上曾经发生过大地震的地区,宣布这些地区将面临又一次的冲击。 幸运的是,12月3日来了,又安然无恙地走了,在预言中的密苏里东南的震中(在世界任何其他地方也未发生大地震)没有发生一次能被察觉的震感。震中地带马戏团的帐篷收起来了,媒体又把它们的注意力转向随后发生的其他更具“新闻价值”的事件。原本能够为公众提供更好的服务吗?绝对可以。记者有许多机会更深入地探测新闻报道中的问题和实际判断的科学基础,但是通常都没有做到。 媒体可能会做什么?布朗宁地震预言中的“可信性”,显然起源于他于1989年10月10日对旧金山制造业经理的讲演,在讲演中他宣称一周之内世界上某个地方将会发生一次大地震。果不其然,那周就在加利福尼亚发生了洛马普列塔地震,导致67人死亡,给旧金山造成巨大破坏。但是这一“预言”真的就这么成功吗?仅仅作了一点调查,记者就可非常容易地了解到在全球范围内平均每年大约发生120次大地震(震级6级以上),大约每3天就发生一次地震(为了简便起见,假设地震在时间上均匀分布)。因此布朗宁可以高枕无忧地对时间做出合理猜测。一个初出茅庐的记者同样能够有这样的先见之明。 除了指定地震发生的“时间”,地震学家需要对以下因素作出可靠预测:地点、震级以及那种规模的地震发生在那个地点的概率估计。就布朗宁指出的地点而言,世界上某处确实是一个安全带,预报“大的”地震为解释地震活动的大小留下了回旋的空间。如果目标足够大,就很有可能实现。至于对概率估计的需求,可以用一个例子很好地说明:旧金山湾地区将在某天经历一次2级地震,即使果真像预言那样地发生了,也不会把它当成有任何重大意义的预言。为什么昵?因为在那一地区每年要发生几百次2级地震,所以在任何给定的一天发生地震的概率都是非常高的。如果布朗宁在他对商业经理的讲话中预言在即将到来的一星期内中加利福尼亚将发生一次7级地震,这就与声称世界上某个地方将会发生一次“大”地震完全不同了,接着洛马普列塔地震的发生将会显著提升他作为预言家的地位。标枪直接击中一个小的目标要比击在一堵大墙上某处给人留下的印象深刻得多。 科学共同体一致认为:布朗宁的预言不具有科学价值。那么为什么媒体对这一事实大打折扣?美国地质调查局国家地震预测评估委员会宣布布朗宁的预言无可信度,附近大学大多数专业地震学家也是这么认为。然而这里有一个例外,一位来自东南密苏里州立大学的地震学家,对布朗宁的预言给了相当大的公开支持。对于媒体来说,这一孤独的支持者很明显地对坚定坐在跷跷板另一端的大众科学观点提供了一种应有的抗衡。如果媒体对这位持支持立场的地震学家的背景做深入调査,那么他们会发现此人对地震预言的业务并不陌生,他已经同一个通灵人合作预言了1974年北卡罗来纳州的一次地震。如果媒体深人研究布朗宁博士自己的背景,他们也会发现他把纳粹党人的出现归因于潮汐力!无论发生什么情况,记者都要对背景和资源的可信性进行检査。 布朗宁曾经预测1990年12月3日,行星排成一线会对那个地区施加一个强大的万有引力。媒体原本也可发现在这一预言背后是陈旧的和不成功的科学。由于对太阳、月亮和行星的位置能够进行可靠的预测,因此这总是其他预测主题的极具吸引力的组成部分。在有关过程的物理性质能够被很好理解的自然系统中,诸如海洋潮汐沿着海岸线以及海港的潮起和潮落这样的预言取得了显著的成功。但是在关于灾害的预测业务中,由于自然系统复杂和难以理解,记录显示没有成功。 有一本在1974年出版时受到广泛关注的书的作者说,行星排成一线将在1982年发生,这种结构每隔179年才发生一次,它将在南加利福尼亚引发一场灾难性的地震。这种引发地震的物理过程比布朗宁在他的1990年预言中所包含的物理过程更复杂,但宣传是同样的: 地球物理学家报告圣安德列亚斯断层(圣安德列亚斯断层:断层实质上为地壳上的裂缝,它们的长度有时候会长达数百公里。当覆盖着地球表面的板块(tectonic plates)移动时,断层所在的位置,常常也是大地震发生的地点。圣安德列亚斯断层是美国加州著名的断层,它也是地球表面最长和最活跃的断层之一。圣安德列亚斯断层的深度有15公里,存在的时间已经超过两千万年。巨大的太平洋板块(Pacific Plate)沿着圣安德列亚斯断层,相对于北美板块(North American Plate)向北漂移,平均每年移动数厘米,以这种移动速率经过数百万年后,地球表面的陆块分布和现在比起来,就会有很大的不同。——译者)早就成形了……一触即发。我们感到没有什么疑问的是:在罕见的行星排成一线之后,行星和太阳的影响……将会触发。特别地,我们认为洛杉矶地区将要遭受本世纪大型人口中心经历的最严重的地震。 不用说,1982年南加州的圣安德列亚斯断层在1982年并没有剧烈震动,洛杉矶也仍然屹立。但是这一事件在布朗宁给出他的1990年的预言时,很大程度上(彻底地?)已被媒体忘记了。新闻编辑室文件箱内标签为“地震预测”的淡黄褐色文件夹,记者本可用来查阅背景和历史观点,却明显是空的。我没有料到在布朗宁的媒体疯狂时期对木星的“无效果”仅提到一次。有另外一本具有类似主题的书,预测2000年5月5日将有一次全球性灾难,尽管这时媒体新闻限制并避免宣传,又一次显示出对这种特别灾难主题的频繁再现没有显著意识。 为什么媒体不去揭开布朗宁预言的假面具,说它的荒谬可笑昵?为什么他们反而将他描绘成一个偶然发现“预言地震的超常简单策略”的非正统的、未被欣赏的天才?的确,要回答这些问题并不很简单,但是一个方面也许是对专家队伍和传统学问根深蒂固的不信任。在许多背景下,这种态度能够被描述为“反精英主义”、“怀疑主义”、“敌对主义”或者“对弱者的支持”。如果所有大人物都说某件事不会发生,那么当此事发生时,看着他们丢脸难道不可笑吗?当没有成为团体会员的某人不顾轻蔑的反对而取得成功时,难道我们不可以开怀大笑吗?当所有专家都告诉我们某件事非常复杂,让一些不被承认的外行人表明这件事情其实非常简单难道不好吗?复杂性(complexity)是理解的真正障碍,它引起人们寻求更简单的答案,而不管这些答案是多么的不充分或者具有多么明显的错误。 这种态度以一种有趣的方式展现在地震预测的另一个例子中。20世纪70年代早期,在美国矿物局工作的一名科学家,在实验室压力测试中有关岩石如何破碎的研究基础上,建立了一套地震预测理论。接着他把他的理论应用到现实(实验室外)的世界,1976年他预测一场20世纪最大的地震将于1981年6月28日在秘鲁海岸发生。很自然地,秘鲁人对这一即将到来的灾难所进行的预测非常关注,并对其价值寻求评估。因为这一预言由一名美国政府的科学家发布,所以起初秘鲁通过外交途径同美国进行了协商。美国政府转而让美国地质勘探局——掌管评估地震灾害的联邦机构,评估这一预测的理论和方法论。美国地质勘探局评估组做出结论,称那位美国矿物局科学家的方法不可信,不应相信他的预测。特别是,他们下结论说秘鲁在历史上曾经发生过严重的地震,该国的地震灾害绝不会在美国矿物局科学家概念的基础上加剧了。 事情到此并没有画上句号。一些人开始是私下里后来就公开质疑美国地质勘探局否定美国矿物局的方法是否是出于嫉妒。众所周知,美国地质勘探局在地震预测研究方面已经投入了相当大的精力,却收效甚微。如果美国矿物局单个的研究者发现了地震预测的秘密,然而整个美国地质勘探局却没能做到,那不是非常尴尬吗?这不就是一个小伙子主要利用业余时间成功地阐明了一个复杂的过程,而所谓的专家仍然在一条又一条黑漆漆的小巷里摸索的实例吗?一个不被赏识的天才不是让专家显得很无能吗?这一事件具有后来的布朗宁传奇故事的所有特点,包括将要发生的预测事件的明显失败。 那一天到来了又过去了,在秘鲁没有感受到多少地震波。正像地震专家预测的那样,美国矿物局的预测结果毫无意义。 正确是非常困难的 就像让科学家成为媒体友好的同伴遇到的困难一样,让记者成为科学的成熟评论员同样是困难的。我们希望记者不只是文字报告者,他们应当能够提供一些见解和观点。记者最出色的状态是必须具有怀疑性,而且能够搜索出弱点和矛盾。对科学的理解和熟悉达到一定水平的那些人,做了以下典型评论:达到这么舒服的高度是一个多么艰难的过程。《纽约时报》的布朗(Malcolm Browne)评论说:“一个科学作家必须是永久的学生。……意识到一个精妙实验的价值需要有准备的头脑。”克朗凯特(Walter Cronkite)为国家电视网报道美国的空间计划,他通过“很长时间的学习”战胜他对科学的紧张情绪。但并不是很多记者都有增强科学背景和洞察力的机会。更为典型的例子是一个新的年轻科学记者的经历,她刚开始工作时感受到巨大的压力。几星期内她不得不报道关于大脑的疼痛中枢、低频电磁波辐射对人类健康的影响、测定沉积岩年代的新技术、阿耳茨海默病(Alzheimer's disease,俗名帕金森综合征。是一种进行性神经退化性疾病,主要症状为记忆力减退,随着智能慢慢衰退,最后甚至忘记吃饭、忘记走路,其临床表现多为运动功能的缺损,包括颤动、僵直、运动迟缓、运动技能减退、姿态异常等。——译者)的潜在疫苗、纤维光缆的使用和全球变暖的预测等内容。 幸亏,也有一些引人注目的例外:伦敦的《泰晤士报》和英国的《卫报》、加拿大的《全球邮报》、美国的《纽约时报》都提供了超出一般水准的科学新闻。当然,2001年人类基因组图谱的完成几乎在世界各地都被当作头条新闻来报道,但是《纽约时报》却又用了满满10版的篇幅来讨论这一杰出科学成就的医学意义和伦理意义。过了大概一个月的时间,《纽约时报》在头版突出刊登了几个不同的科学故事:火星干冷的侵蚀特征的发现,暗示地质上较近时期的水是从地下渗出的;对暗示鸟类有着一种不同进化起源的一些羽毛化石需要重新解释;中子家族中发现了一种难以捕获的粒子;基因检测的社会后果。另外,每个星期二,《纽约时报》都会提供一个完整的版面——科学时报版,该版的文章由15名科学作家共同撰写。 但这就是要庆祝的理由吗?在英国只有一小部分的报纸读者阅读伦敦《泰晤士报》或《卫报》,在美国阅读《纽约时报》的人可能就更少了。而且所有这些报纸都用比建立在每周基础上的科学报道大得多的空间报道建立在日常基础上的财经新闻、娱乐、艺术、体育。2000年7月21日,《纽约时报》有5篇重要的科学或与科学相关的文章,对于科学可见性来说是非常好的一天。然而,就在同一天,有38版是关于人文和娱乐,6版关于体育。而且我们必须记住,绝大多数的媒体分部甚至没有雇用一名科学记者;他们只是从通讯社简单地拷贝故事,然后不加选择地随意切割以填充能够获得的空间或时间。大多数地方电视频道都有一位“气象主持人”,此人也许会有一个气象学学位。无论何时当科学闯入日常程序时,常常会让气象员或女人来处理它。 我有点悲哀地得出结论:科学教育结构的缺陷不会因为获得媒体的援助而奇迹般消失。无论是科学家还是记者,对其不作出足够努力都有着自己的原因。指望实践科学家和媒体在科学教育停止的地方继续努力,我想恐怕是太奢华的一个梦。那里可能有潜在性,但是要想实现,就像是海市蜃楼一般虛幻。科学教育和媒体对科学的关注会得到改善,我对此满怀希望,但要彻底转变,路还很漫长。 现在是离开东方帐篷,进人到科学不确定性花园的时候了。就像前边提到的,花园中有许多区域和小块土地显示了不确定性的多面性特征。然而,许多花卉陈设区和未被注意的自然区域,灌木丛和巧妙的迷宫,它们通过在各自不确定性的区域突出的图像共同构成了一幅镶嵌画。它们一起展示了不确定性如何产生、如何刺激创造性、为什么类似于一个半满而不是半空的杯子。接下来的一章,将探索在理解复杂现象时我们的直觉引导常常是不够的,由此允许不确定性覆盖着我们日常经验之外的不熟悉领域。 第四章 不熟悉导致不确定 经历就像一名严厉的老师,因为她先进行测试,然后再讲课。 ——弗农·桑德斯·劳(Vernon Sanders Law) 当我们在生活中经历一些事情时,我们会熟悉它们,也许会理解它们,进而接受它们,并把它们当作生活中很自然的一部分。但当我们遇到先前从未经历过又不熟悉的某事物时,很自然我们会怀疑它。而且如果我们面对的是一个抽象概念的话,而这又完全超出我们的经验,那么怀疑或甚至不相信都是一个自然的反应。 在这种情况下,不确定性与不熟悉紧密相关。对于我们所不熟悉的事物,我们对其也不确定。而且科学中的很多东西对于许多人来说是不熟悉的领域。尽管爱因斯坦不这样认为,但科学的确并不仅仅只是“常识”。如果科学真的是常识的话,稍有一点常识的人也不会对科学感到迷惑。科学需要一定的抽象,需要把观察数据放到一定的背景或框架中去。当框架是一个人目前的环境,这就很容易熟悉和理解。但当空间框架像在粒子物理中那样小或者像在天文学中那样大时,就只有那些有心人才能探索这个不熟悉、不确定的领域。同样的,它们运行过程的时间尺度与日常人们经历的时间尺度有很大不同。瞬间化学反应的完成或者非常缓慢的地质变化都需要智力的延伸。 经历能够将不熟悉的东西转化成熟悉的东西。早期人类组织他们经历所处的概念框架不是抽象的。生存要求他们敏锐地观察周围的环境。对于他们来说,捕获猎物以及避免被猎捕是生死攸关的事情。充分认识周围的环境是生活的必需。当早期农业刚刚出现时,那些整年能够察觉当地的降雨模式、干湿季节的交替、气温的季节性变化的人,就更能成功地生产食物。但是早期的人类关心过全球温度长达一世纪的变化吗?尤其是当温度每隔24小时有20°C或30°C的改变或者季节性变化更多时,他们能够记录、甚至关注今年的年均温度比去年高了十分之一吗?或者他们能够想象出他们对土地的耕耘将对地球的另一边产生影响或改变全球大气的化学性质吗? 当家里发生大事的时候,人们就很难关注全球范围内增长很小的变化。当最大的威胁是地方性的并日益增大时,处理眼前事情的策略非常有效。例如,在现代社会,当人们被要求考虑“在行星范围内且时间尺度超出了常见的政治术语的界限甚至几代人寿命的范围”的全球气候变化这一概念时,人们往往会犹豫甚至产生怀疑,因为这超出了由日常生活得出的日常经验的范围。因此我们要慎重,这是一种小心翼翼进入到不熟悉领域的自然趋向。不确定性伴随不熟悉。 引起我们的注意 我们可以调节感官来察觉快速的变化。我们开车时,对汽车的喇叭声、警报器的尖叫声、车前方突然亮起的刹车灯、冲到街上的狗,都很警觉。所有这些变化都是在我们称之为“正常”的背景下进行登记的。喇叭声或警报器声是发生在日常持续不断的交通、噪音的背景之下的;刹车灯在先前没有照明的地方会闪光;狗也是作为一个不同尺寸的物体在横穿马路的方向上快速移动突然出现的。每一个对正常背景的干扰都引起了我们的注意,警告我们可能有危险。(相反,当我们想入睡,并想放松警惕时,我们可以借助于听音乐或电台、电视上无须留神的谈话,或者是聆听特殊设计的波涛拍打海岸或风吹过叶子的声音等背景音。) 当高速公路上发生车祸时,随后的车流会立即减缓并开始阻塞。同样地,当我们开车到达两个车道合为一个车道的交叉口,并且这个车道只允许一辆车通过时,我们注意到了减速。当修路工人在施工和交通阻塞发生时,我们注意到了一天中工作往返的路程要比往常多花费半小时的时间。但我们是否注意到我们日常往返的路程因为城巿的扩张而非常缓慢地延伸?我们是否注意到今天在路上花的时间与高速公路上车辆少得多的10年前相比要多出30分钟?答案也许是否定的,因为这种变化进行得很慢。由于微量延误的积累,日益增长的交通的放缓效应出现了,但却因为建立在日常基础上通常未引起注意。我们的感官还没有进化到让我们注意一些微量增加的变化,而这些变化又是经历了很长的时间间隔。只有通过我们个人的记忆,或者通过我们所谓的历史记录的集体记忆,我们才能注意到曰常生活背景下的缓慢变化。当高速公路工程师发表报告说,15年前设想并建造的每天接纳10万辆车的州际高速公路系统中的一段,现如今承载的数量已经超出原设计的两倍时,我们才想起这些变化。 呵!原来这就是现在我每天上班时花在路上的时间要比高速公路刚开通时多半小时的原因。1999年美国人平均花费在交通堵塞上的时间是36个小时,而在1982年这个数字只有11个小时。人们之所以接受和适应这一路上花费时间的增加,部分是因为这是许多年来逐渐积累而成的。 气候是你期待的事情,天气是你得到的东西。基于同样理由,要察觉到气候的变化也是同样困难的。气候不同于天气。天气的变化是显著的——昨天是大风,今天是暴风雨,明天阳光灿烂。因为天气是每天变化的,我们能够察觉到它的变化,并乐于知晓每天天气预报中提供的未来几天天气的大概情况。 相比较而言,气候是“平均”天气的长期特征。我们使用大陆性、内地的、海洋的等术语来描述一个地区的气候。每一个术语都隐含地描述了年平均温度、季节性温度变化范围、年均降水量、地面有积雪覆盖的平均天数。当我们计划围绕冰岛进行一次夏季自行车旅行时,我们需要查阅相关的气候图册以便知道需要带什么东西。这样的图册将告诉我们那儿日常温度在5°C到25°C(41°F到77°F)之间,任何一天都有30%的降水概率。 这种类型的信息是气候性的,因为它描绘的是长期的平均情况。气候上的缓慢变化是很难察觉的,因为它并不是建立在具有显著性的日常基础上的。只有当日平均温度被观察到有上升的趋势或几十年来年降水量有下滑的趋势时,那些保存着日常气象观测历史记录的气候学家,才提醒我们注意:我们正在经历一个气候变化。 但也有一种倾向是把短期内偏离正常看作是长期的趋势。北美中部大陆的许多居民会把1988年的夏天回忆成是苦难的一个预演。 那年夏天气温达到了历史记录并又保持了很长的时间。我住在密歇根,位于北美五大湖区当中。那里的居民忍受了持续40多天超过32°C(90°F)和10天超过38°C(100°F)的高温。草晒死了,树枯了,庄稼枯萎了。报纸称全球变暖已经到来,这是对人类的报复。相比较而言,在2000年的夏天,没有一天的温度高达32°C,雨水也很充足。很显然,无论是1988的夏天还是2000年的夏天,都不能决定长达一个世纪的气候趋势,气温超出其年平均温度的任何一个地方都不能决定全球的平均温度。至少在确定长期变化趋势的背景下,我们必须小心,不要对短期现象给予过分关注。 对于个人而言,要察觉出年平均温度上的长期缓慢变化是非常困难的,部分原因在于把这些变化同昼夜之间,或冬夏之间发生的温度变化相比,这种变化是很小的。从生理学或心理学上讲,我们都无法注意到加在巨大迅速变化上的那些微小缓慢的变化。“不要拿小事来烦我”这句熟悉的格言表达了人们有以下自然倾向:关注现在正发生的大事,而不是长时间发生的微小变化,即使这些不断增加的微小变化也许最终具有一个大的影响。其实,即便是“大海中的一滴水”,如果水滴积累足够多,也可以让海平面上升到可以觉察的程度。 另外,生活在现代技术世界通常意味着,就温度而言,我们把自己隔离在自然界发生的变化之外了。这种隔离来自于这一事实:我们中的许多人生活和工作在经“气候控制”的环境中,即大楼里。 在我们的温度隔离中,我们设定和调节机器让室内保持一个狭窄的温度范围,其结果就是我们接触不到自然界的变化。可以想象人们能够意识到年平均温度的长期变化趋势的唯一方法,是通过测定控制我们室内气候的机器消耗的能量多少的变化来实现。 超出范围 如果说我们意识到发生在我们周围的长期变化是困难的,那么意识到地球上其他地方所发生的事情同样也是困难的。事实上,人类完全可以想象我们在某地区经历的事情也在世界上其他地方发生。如果我们在密歇根有一个很少降雪的暖冬,那么很容易想到其他任何地方也有一个类似的暖冬。然而,可以告诉一下生活于西伯利亚的人们以下事情,他们在同样的冬天要经历寒冬和创记录的降雪。 我们作为个人所经历的是一个全球性的过程在局部的表现。地球上区域气候变化的第一级模式是赤道地区气候变暖,极地地区变冷,这通常反映出地球表面每平方米接收到的太阳能的数量变化。然而主要由地球旋转轴的倾斜引起的半球的季节变化和通过大气环流和洋流进行的地球热量的再分布也改变了这一受太阳影响的基本模式。大气环流和洋流进行的地球热量的再分布尤其受大陆地形所影响,它们限制和引导海水的流动方向。 随着这样的地区性变化的发生,一些地方变得比平均冷些,而另一些地方比平均暖和些,因此全球平均温度的概念就变得有点抽象(在下一章中我将描述全球平均温度是如何通过许多地区观察数据累积获得的)。以下情况是非常可能的,地球上没有一个地方每天的温度实际上都是全球平均温度。但是在一个有30个学生的教室里,人们可以计算出这些学生的平均身高和体重,即使这个班上没有一个人的身高和体重与平均值一样,上述情况并不比这更为抽象。 尽管我们经历的天气是全球气象系统的地区表现,尽管环境学家一再劝告,但是我们仍然不习惯进行全球化思考。然而我们的视野范围依靠环绕地球的卫星已经大大扩展了,能够让我们全球性“察看”。从离我们22000英里的卫星上可以观察到整个大陆的天气状况,现在我们每天也可以通过电视或者互联网来了解。我们能够看到形成于大西洋的飓风向西不断推进,一直到美洲东海岸的某处登陆。同样的卫星技术使我们能够容易地、快速地、清晰地观察到世界的每个地方。下述情形都是过去的事情了:一个人要想从非洲或南美向欧洲或北美打电话,不得不提前一两天预约,而且当最后接通时,声音效果听起来很差,比我小时候玩的一种“用罐子听声音”的游戏声音效果好不了多少。手机、电子邮件、经由卫星传送的电视信号为全球所有地方带来了即时通讯。巴伦支海的一个水下灾难,南极的一种疾病,哥伦比亚灌木丛林中的游击战争,或者南太平洋一座新喷发的火山将其火山锥喷出海平面,所有这些现象现在在地球上任一角落都能立即被观察到。 远程通讯革命引起了全球的经济变化,而这又冲击了我们地理上的乡土概念。全球化现在是一个用于描述国际商业和贸易关系的常见词。跨国公司、政府和工人都意识到世界上某一个地区所发生的事情会影响到世界所有地区。东南亚的货币不稳定会在全世界的交易所引起金融风暴;伦敦和香港的债券价格的微小差异会导致瞬间内大量资金的电子转移。有关国际贸易团体会议以及由其引发的抗议浪潮,成为头版要闻,不再被深藏在报纸的商业版块内。 然而颇具讽刺意味的是,全球化也有微妙的方面,使得我们很少意识到经济和气候的地区性变化。在地球上人类的史前早期,当农业成为人类食物供应的重要组成部分时,长期的干旱会迫使人类迁移到降水量多的新地区发展农业。那些迁移村落的成员一定会意识到地区气候的变化和气候变化对他们的生活造成的压力。今天,在全球一体化的经济中,一个地区的产量减少能够通过其他地区的增长来弥补。就消费者而言,无论产量是减少还是增加,都离消费者很远,反正供应看起来是稳定的,所以他们对气候变化状况漠不关心。对于典型的消费者来说,橘子是来自佛罗里达还是以色列并不要紧,只要它们定期出现在超市的货架上就可以了。 全球化并不仅仅意味着通过远程通信把世界连接在一起。它有时也被看作是“边界的终结”。在欧洲的大部分地区,很少需要签证,许多国家的货币已经被一种单一欧洲货币——欧元代替了。它受欢迎的“搭便车的旅行者”(hitch-hikers)的全球化:病毒的传播把疾病带到了以前从未出现过这种疾病的新地区。诸如斑马贻贝等外来物种已经在北美五大湖区找到了新家,这些来自欧洲的客人是通过货船船底的污水来到这里的。2001年蔓延于不列颠群岛的口蹄疫疾病的爆发夺走了很多农场动物的生命,它是从亚洲经过迂回路线传入的。 然而,全球化的环境方面与经济方面相比,引起的注意少多了。公众对环境问题的全球化所知甚少。公众很容易理解全球经济的观点,但是要让许多人思考全球性环境看起来要困难得多。为什么在公众的心里,对于全球气候的变化,或者全球的平流层臭氧损耗有这么多的不确定性?当然,这种非连接性,部分起因于为了既得利益,有意竭力传播对这些问题的怀疑和迷惑。然而对于怀疑论还有一个更深层次的原因,就是认为人类在巨大的自然力面前是软弱无力的。人类只能眼睁睁看着他们的房屋在洪水或龙卷风中消失,他们的通讯和能源供应线路被一场冰暴毁坏,他们的高速公路因暴风雪而关闭,他们的海滨在一场飓风中消失,他们的村庄被山体滑坡埋葬,他们的城市被地震摧毁。一个人很难把他或她自己想象成大自然的弄潮儿。 当然,在某种程度上,有着上述想象的那个人是正确的。单独的他或她不是自然中的巨大力量。然而联合起来的话,情况就完全不同了。现在地球上的人口数量已经超过60亿,对环境具有巨大的影响。通过引入损耗臭氧的化学品和导致气候变化的温室气体,大气中的化学组成发生了深远的变化。海洋中的噪声污染,来自于轮船昼夜不停地穿梭、近海处石油钻井平台的钻探和抽取、设计用于让“全世界听到”的水下传导物发出的强烈信号,所有这些已经导致了一个令人震惊的情况:无论多远,没有哪个海域能逃脱人类活动所产生的声音。 人类作为一个整体正在全球环境中留下他们的印迹,其功效至少与人类通过远程通讯和经济在地球一体化中显示的那样大。然而,我们在承认“我们整体的自然力量在改变全球性环境”方面是滞后的。 以蜗牛的速度 如果一个人很难判断长达一个世纪的变化趋势的原因在于他的寿命通常小于一个世纪,那么判断更长时间的趋势就几乎是不可能的了。然而这里有更长期的力量在起作用,它们在地球气候中扮演一个重要角色,提供了一个非常慢的变化背景,在这个背景中,仅仅在一个世纪内发生的显著变化趋势看起来像是在稳定的交通嘈杂声中发出的刺耳警报声。长达一个世纪的变化趋势于是成了吸引我们注意的事件。 影响地球气候的长期因素来自地球围绕太阳运动的轨道形状的变化和地球相对太阳方位的变化。地球围绕太阳的运行轨道几乎是但不完全是一个圆,而且这点对于完美圆形的最细微的偏差就使轨道呈现轻微的椭圆形,其结果就是地球与太阳的距离在一年中并不非常固定。当地球离太阳近一点时,它就能获得较多的热量;当距离远一点时则少些。一年当中太阳热量的变化对于地球上出现我们称之为季节的现象起到一些作用(但形成季节性的更重要的因素是地球旋转轴的倾斜度)。地球轨道呈椭圆形的显著之处,至少根据气候领域的长期趋势来看,就是这个椭圆会随着时间的推移非常緩慢地发生变化。这个围绕太阳的轨道在形状上会发生波动,拉紧、放松、拉紧、放松,如此循环。一个完整周期大约起码要花10万年。在这个进程中,当轨道的拉紧在最大限度时,辐射热量的年度变化最大;当放松时,阳光强度的年度震荡就会减小,使得一年到头地球热量更加均匀分布。 当地球和太阳这种长达100000年的运动发生时,地球本身也在按照自己的某种节奏运行着。地球每天旋转所围绕的旋转轴,今天正在偏离与地球环绕太阳的轨道平面相垂直的线。这一倾斜导致半球的季节变化如果地球是垂直的,不存在倾斜,那么,“多伦多的冬天正是布宜诺斯艾利斯的夏天”这种现象将不复存在。但目前大约是23.5°的倾斜角度,也是慢慢在22°和24°之间变化的,大约每40000年完成一个周期。向24°倾斜使季节对比更为明显,然而向22°的倾斜则减少这一季节性对比。 在这行星运行进程中仍然还有第三种运动。旋转轴,每40000年或上或下,同时也在作一个25000年的脚尖旋转,类似于一个旋转陀螺的慢速摆动。其结果是引起了一年中季节的缓慢变化。尽管今天北半球在6月、7月和8月是向太阳倾斜,北美洲人、欧洲人和亚洲人在此期间享受夏季,但仅在12500年之后,相应的时间段将变为北半球的冬季。 所有这3种长期的因素——地球轨道的周期性收缩、旋转轴角度的变化和旋转轴方位的变化——一起构成了一种气候“太极”,从而影响地球接受太阳热量的多少和这些热量在地球表面如何按地理和季节分布。这些周期性的变化进行得很慢,要数万年的时间才能完成一个周期。在这种背景下,一个世纪内所出现的重要气候改变,例如20世纪由于人类活动而增强的温室效应,确实可以看作是非常快的。 即使更慢些的变化也会改变地球和它的气候,这些变化不是发生于数万年内,而是发生于数千万年内。在这一非常缓慢的改变的背景下,发生在仅仅数万年内的事物看起来是很快的!这一速度上的差异确切地说就如同一秒和千分之一秒之间的差异一样。当上述差异应用于曝光时,摄影师将喜欢这一差异。一个千分之一秒的曝光能够抓住活动中的运动员一个清晰图像,然而一秒的曝光将只能获得一个模糊的印象。刚才我们描述为太极的过程对于变化更加缓慢的背景而言就变成了闪电般的武术动作。 重新排列家具 什么是影响地球气候真正以蜗牛般速度发展的进程昵?板块构造和大陆漂移(Continental drift)作为地球内部大规模运动的反应,岩石构成的外壳碎片也在慢慢地移动(这些岩石构成了地球的固体表面),这样地球表面的地形不断地被重排。这些巨大的镶嵌地砖被动地在内部流上方运动,其速度仅为每年一两英寸(几厘米),大约是指甲生长的速度。如今美洲正以这样缓慢的速度远离欧洲和非洲,大西洋正在逐年、逐世纪、逐千年地变得更宽了。如果我们看1000万年前的地图,当时处在这种慢速分离的早期,就会发现那时的大西洋比今天大约窄500公里。而且在2亿年前,大西洋根本就不存在,人们不沾一滴含盐的水就能从南美洲走到非洲。 地表的地形结构决定着洋流的模式。海洋占据了低的地方,大陆则占据了它上面的所有部分。大陆的位置决定了洋流能够到达和不能到达的地方。大陆地形最近的主要变化,至少就海洋洋流变化来说,发生在大约300万年前。当时巴拿马地峡上升,切断了大西洋和太平洋之间的联系。在赤道地区不再有一个东西向的环流,大西洋里洋流的流向主要变成南北模式:一个是发生在表层向北的暖流——墨西哥湾暖流;一个是海洋底部向南的寒流。它们一起形成了一个巨大的流体传送带,其表面的主要货物是热。 由于受北上穿越赤道到达北方高纬度区的大西洋的墨西哥湾暖流的影响,加拿大沿海地区、格陵兰岛南部、冰岛、英国和挪威的气候就远比北半球同纬度但远离大海的其他地方如加拿大中部或西伯利亚要暖和得多。甚至位于北极圈内很北处的俄罗斯港口摩尔曼斯克,由于受到围绕挪威极北点进入巴伦支海的墨西哥湾暧流的影响而终年不冻。如果海洋环流模式改变了,气候也一定会随之改变。 在巨大气候调节快速进行的时候,其他缓慢演化的地形重构也发生了。在南半球,大约300万年前围绕南极洲大陆开辟的一条连续的海洋路线,允许从西向东的洋流形成。这一洋流阻碍了温暖的水进入南部的高纬度区,有效地在气候上隔离了南极洲。随之出现了南极洲冰帽的累积,而且一直持续到现在。尽管地理学家对这些气候变化十分着迷,但这些变化对于评估20世纪气候变化的意义仅有边缘相关性。这些近来的变化必须根据地质年代上的最近全球气候系统背景特征进行评估,在这个时间间隔内海洋洋流大体呈现代形式。 这一时间间隔本质上就是自巴拿马地峡消失以后的300万年。 在某些方面,这过去的300万年可以被看作是一个“已打破的记录”。在那一时间间隔,洋底累积了层层的沉积物,其中包含微小的海底生物体的壳。这些壳讲述了约30次大规模的大陆冰河形成的周而复始的故事。由巴拿马包围而形成的洋流循环模式,以一种尚未被完全理解的方式,为周期性的冰河形成奠定了基础。但是在海洋底部的沉积层发现的冰河重复形成的记录是显而易见的。 海洋中的沉积物是如何讲述冰河形成的故事的?海洋中各种化学物质的含量取决于海洋中水的多少——水越多导致化学成分的浓度越低;水越少,浓度越大。生物体壳的化学组成反映了这一生物体存活时海水的化学组成。那些冻结成大冰原的水来自海洋,蒸发、流动,然后以雪的形式落到大陆上。当大陆上有更多的冰时,海洋中将有更少的水,反之亦然。最近的冰河期,在大约20000年前达到最大程度,也只不过是这一反复进行的交响乐的最后章节。从那以后,冰开始退融,虽然并不总是以一种平滑和稳定的后退方式进行。 在理解地球气候的自然变化中,地质记录的确能为我们提供一些素材。但是这些经由过去的方法也让人们产生了很多的曲解。我们试图往回看得越久远,图像就变得越模糊。观察资料变得更少,在地球上的分布变得更不规律,解决短期时间间隔的能力变得更困难,确定某事是多长时间以前发生的就更不准确。在对过去2000年的气候变化的讨论中,人们认为科学文献中有一些根深蒂固的气候学概念需要重新评估。有关气候学的入门教科书写到中世纪变暖时期(MWP,约800-1200)和小冰河时代(LIA,约1300-1850)是由于全球气候的偏移。MWP是指斯堪的纳维亚人在冰岛和格陵兰岛定居及其文化和贸易在欧洲扩展的这段时期;与此相反,LIA是指气候恶化的时期,在这个时期内斯堪的纳维亚人放弃了他们在格陵兰岛的定居点,冰岛周围冬季海冰区域极大扩展,欧洲的高山冰川不断增加,农业生产下降。 就像我们也许很容易认为我们在某地区经历的事情是全球的特征一样,当人们考虑过去遗留下的迹象时,也容易陷入同样的错误逻辑中去。现在一些科学家怀疑,MWP和LIA是否发生在全球范围内。这一怀疑起因于上面提到的证据以欧洲为中心的特性。因为许多的历史记录是欧洲的,因此很有可能是欧洲人记录了这两个事件的影响,MWP和LIA只是主要影响北大西洋地区的区域性气候现象。 如今我们对于北大西洋气候的敏感性以及它和北冰洋所发生的紧密联合了解得更多。除了通过遥远的北大西洋,北冰洋与世界上其他海洋并没有什么有效连接。在遥远的北大西洋,北冰洋的变化能够对与北大西洋接壤的陆地产生显著影响。但是在北大西洋地区有很好记载的那些影响,就构成了一个全球气候的变化吗?或者它们就是“把重要的地区气候事件曲解成全球变化”的很好例子吗? 这些问题回答起来不是很容易。即使MWP和LIA在北大西洋地区有自己的起源和重要影响,那里发生的变化也许能够以缓和的形式,通过大气流和海洋洋流模式传到全球的其他地区。对于地球某一部分的气候变化是如何与其他地方的变化联系起来的问题,还存在着相当大的不确定性。然而我们通过地区有限的观察资料做全球性解释时必须谨慎。一个全球性的描述通常需要全球性的观察。 小变化能够产生大影响吗? 人类除了很难察觉全球广大区域缓慢发生的变化之外,对全球气候变化重要性的怀疑还有另一个来源:所经历或预测的变化的大小。 当气候学家指出20世纪地球的年平均温度增长约1°C(差不多2°F)或者在21世纪还将增加几度时,询问“这样的变化是否重要”就很合理。毕竟,昼夜间的变化和季节性变化与之相比,变化要大得多。 回答以上问题的答案,部分在于生物通常能够适应相当大的短期变化而不会受到严重伤害这一事实。生理学机制已经进化到能让大大小小的动植物适应或者至少能忍受短期极端的状况,只要明天或下月或明年状况能够减轻一些。因此地球生物区的各个组成部分即使没有食物也能坚持一天,或者特别冷的情况下维持一周,或者降雨少的情况下支撑一年。但是我们都能够想象到一年没有食物,或者10年干旱的后果。生物体系所具有的保护性机理并不具有无限的弹性。即使干扰很小,因为小的影响会随着时间积累,它们也是能够被拉长到转换点的。我们都听过“压垮骆驼背的稻草”这个谚语,即使最后添加在骆驼上的负担是很小的,但这累积的后果是灾难性的。总有个临界点,也就是承受的限度,一旦超过了这个限度,不管达到这一限度的速度是如何慢或如何递增,最终将导致一个系统的崩溃。我们开始讨论全球性气候系统是否有可能到达一些转换点的问题,在后面一章我将重新回到这个话题上。 许多复杂系统对于小的变化非常敏感。大多数读者会很熟悉AM和FM电台波段。当上下班开车时,他们可以把收音机调到他们最喜爱的新闻报道、脱口秀或体育新闻上。我习惯将收音机调到89.1兆赫,它是服务我所在社区的几个公共电台中的一个。频率的标示意味着电台信号是由以每秒89.1兆赫传播的电磁波组成。然而,如果稍微调动一下到89.2兆赫,国家公共广播电台则被噪声取代。调到89.7兆赫可以听见古典音乐。百万波段中的一个小变化却意义非凡,因为收音机被设计得要对细微变化很灵敏。 人体提供了一个很好的例子,这一复杂体系构造要在某个固定的温度下才能正常运转,即37°C(98.6°F)。如果我们体内温度超过正常温度1度左右,这就说明我们病了,人体系统遇到了一些问题。1度在理论上可能看不出有多大变化,但是对于一个调控良好的系统,如拥有对温度敏感的器官和构造精巧的温度自动调节器的人体,一个小的偏差都不是件小事情。 一个小的改变对于全球气候系统也不是件小事情。全球气候系统也是一个相互联系、相互交织的复杂体系,它吸收或反射太阳光,通过大气和海洋系统循环传输热,在系统内部进行化学物质的交换。系统的一个部分遭到破坏,系统的其余部分也会受到影响。在这个极其平衡的全球气候系统中,如果1度既是全球性的也是长期性的,则意义非凡。 关于进化的思考 本章所谈到的很多问题,在著名的生物学家威尔逊(Edward Wilson,1929-,美国著名生物学家,美国总统的长期顾问。在北美和欧洲拥有27个名誉博士学位,先后获得75个具有囯际影响的奖项。他的著作《论人性》(1978年)、《蚂蚁》(1990年)曾先后荣获普利策奖。——译者)最近出版的书中也都有所提及。在《生命的未来》(《生命的未来》主要是以一个生物学家的立场来论述生物多样性问题的,大量扎实的数据和例证,再加上亲身的研究和体会,他确凿地论证了生物多样性丧失的危险,并提出了解决危机的若干方案和办法。详见《生命的未来》,陈家宽、李博译,上海人民出版社,2003年1月。——译者)中他这样写道: 人脑的确进化到在情绪上对一小片土地、有限的亲属和未来的两三代负责。这种眼光既不太超前也不太离开家乡,在达尔文(Charles Darwin)的意义上是初步的,为什么我们眼光如此短浅呢?原因很简单:它是我们旧石器时代遗留下来的固定不变的部分。 如果威尔逊的观点“进化是根植在大脑中的空间和时间的乡土观念”,确实是正确的,那么我们也许怀疑,为什么自然没有选择把更多的先代积累的知识赋予给每代新人呢?思想家桑塔亚纳(George Santayana,1863-1952,美国哲学家。主要著作有《怀疑与动物信仰》、《存在王国》、《智的人生》。——译者)忠告道,“凡是忘掉过去的人注定要重蹈覆辙。”为什么每一代的孩子们必须进学校学习基础算术?为什么我们一生下来不把乘法表根植在大脑昵?为什么几个世纪以来科学与工程系的学生还要重新学习牛顿(Isaac Newton)和莱布尼茨(Gottfried Leibniz)在17世纪就发明的微积分?如果孩子们天生就具有这些有力而不变的工具,而不是一次次地努力获得它们,这样不是更有效率吗?即使忘记了至少还可以记住一些。抛弃先辈们遗留下来的许多东西,又不断对下一代人灌输已获得的知识,这种进化策略的优势何在?当然,大自然的确教给了我们基本的原理。我们的基因赋予了我们身体和大脑:身体提供了可动性和感知器官,通过它们我们可以获得信息;大脑则是控制中心和数据库。几乎每个人都由具备这些必需要素的生产线生产出来。接着学习便开始了。就像前面刚刚提到的,孩子们生来是具有好奇心的。他们使用自己的感知器官,去观察、去触摸、去倾听、去品尝。在他们的脑海里,他们分类、比较、评价这些经历。最后他们去学校里学习乘法表,有一些人甚至去学微积分。 没有把算术根植在我们脑子里的代价就是,我们每个人和每代人都必须重新学习加、减、乘、除。但是强迫每代人了解世界就是激发每代人的创造性的自然方式,这可行吗?也许自然已经选择不用太多的传统智慧去偏袒每一代人。世界总是在变化,人类不管喜欢与否,也必须进行改变。他们面对或适应未来变化的方式不会在过去的传统智慧中找到。这是威尔逊所解释的困境;过去的教训阻碍我们适应未来的困难。 自然没有给我们施加沉重的包袱,这些包袱会抑制创造性并妨碍我们顺利朝着未来发展,这对我们有益吗?我们脑子里熟悉的“十进制”算法可能会妨碍我们对现代数字计算机的“二进制”算法的概念化吗?无论我们怎么努力,我们都不能让世界静止。变化是正常的,也许承认和适应变化的能力在人类发展进程中比集中在传统智慧和保持现状的其他技能更为重要。 在本章中我们已经看到,诸如全球变暖这种现象是很难在个人经验的基础上进行评估的。我们可以很好地理解我们周围短时间内发生的事,但要了解全球平均温度的长期变化趋势却难得多。长期全球现象无论是在时间上还是在空间上都超越了我们个人感知的能力范围。我们只能通过世界各地几个世纪以来搜集到的观测资料和共享的信息来推导这一现象。接受和确信这些集体经验的精髓需要我们超越个人经验,迈入这个不熟悉和不确定的领域。谨慎地采取措施是自然的,对不熟悉世界的综合概括遇到一些怀疑也是自然的。在下一章中,我们将着手讨论测量和数据集合的不确定性,这是学科学的学生在迈进实验室时会面临的问题。有人曾经说过:“如果你不能测量它,那么它就不是科学。”但用什么工具来测量?又有多少与之相联系的不确定性?在我们进行了一些测量之后,怎么来处理测量数据?不确定性花园的这部分是一个更悠久、发展更好的领域,它提供了一些与当代有关的颇为有趣的历史性观点。 第五章 发烧还是着凉? 我们试图用码尺测量细菌。 ——保罗斯(John A. Paulos)教授,坦普尔大学 从基础水平上讲,当我们进行测量时,科学不确定性就开始了。我们用什么来进行测量?测量工具如何能够很好地完成测量?我们测量某一物体的尺寸、质量或温度能有多高的准确度?如果我们多次重复一个测量,这些单次的测量结果彼此间有多大的一致性? 保罗斯教授对细菌测量发表的评论是在一种不同寻常的背景下进行的,对此我将在后边加以详谈。评论强调选择与手头工作相适应的测量仪器是非常重要的。一个人无需具备实验科学家的经历也能知道用一个码尺准确无误地测量出一个细菌的长度的可能性是非常小的。码尺最小的衡量标度通常为1/16英寸,虽然比2毫米小些,但比任何一个细菌都要大得多(实际约大出10000倍)。因此一方面,人们除了知道细菌长度比1英寸的1/16小得多之外,可能也说不上更多的什么了;另一方面,原则上讲,1码尺是可以测量首尾相连排列起来的500万个细菌的长度的。 绝大多数的物理或化学教科书都介绍了测量中的不确定性。这些讨论典型地集中在测量仪器的灵敏度(或精确度)和准确度以及测量同一物体或测量条件的可重复性方面。灵敏度与仪器对变化的反应以及测量仪器能够探测或觉察的数量差别的大小是相关的。准确度描述的是测量值与实际值的接近程度。温度计通过其液体柱高度的微小但可注意到的变化来表示1/10度的改变,而不是表示1/100度的改变,说明它具有1/10度的灵敏度。考虑以下的例子:沸水的温度按摄氏标准被定义为正好100°C。如果一个置于沸水中的温度计上显示的是99.7°C或100.3°C,那它就具有0.3的准确度或误差范围。另一种规定准确度的方法是采用百分比误差,在这个例子中就是0.3%。如果在一个特殊的实验中,化学家没必要知道实际温度测量的准确度在半度以内,那么不太精确的(也更便宜的)温度计就足够了。 如果你对同一物体测量两次或者更多次,直觉上你会认为每次的测量数据都是相同的。那么,不管是测量地毯的长度,还是用温度计测量地毯的温度,每次当我们对卷尺或温度计读数,并且当读数落在测量仪器的最小刻度之间时,我们都要把这个数字估读出来。由于观察角度和观察者的经验不同,因此每次对测量进行的估计可能都有所不同。同样地,如果我们计算某一血样中白细胞的数量,原则上无论是哪个实验室的技术员进行计数,人们会认为每次的计数是相同的。但事实上,每个实验室技术员的结果都可能互不一样,甚至同一名技术员每次结果可能也不同。在任何重复测量的数据集合中,都有一个值的范围。如果有的话,哪一个是正确的呢?我们经常依赖统计数据来确定平均值,并对从多次测量中计算出的平均值是真实值的概率进行估计。如果我们进行多次测量,这种概率一般较高;如果仅测量几次,此概率会低一些。但是,这个概率绝不会达到完全符合真实结果的地步,依然存在着一些不确定性。 不同的人对同一事物进行测量时,重复测量中当然同样存在着上述问题。但他们使用的是不同的测量工具或不同的技术。例如:使用不同的实验方法确定光速的大小,光速就会有与实验方法相联系的一些不确定性。但不确定性会随着更敏感设备的设计和利用而变小。 可重复性是科学的一个基本原则。如果一位科学家宣布一项令人震惊的科学发现,其他的人将会试图通过重复实验或测量来证实这种现象。1989年,当一项关于原子在低温下聚变(—般称之为冷聚变)的实验公诸于世时,立即引起了人们的兴趣。如果冷聚变被证明实际是可能的,就有希望产生无限廉价的能量。世界各地的研究人员冲进实验室,亲自尝试这个实验。在这种情况下,可重复性变得难以理解,冷聚变的前景就像用过的罗马焰火筒(roman candle)落到地上一样。最近的关于冷聚变的声称以及第二章中提到的气泡内爆声称,相信世界各地的实验室会很快对它们进行实验。 由于要测量的量是变化的,因此并不是所有的测量都能重复。室外的温度计将会显示温度一直都在变化。购买旧房子的人发现墙与地板、天花板之间的夹角,随着时间的推移,由于居住和下垂会变得不再是90度。逐天看来,几何形状也许呈现静止状态,但很多年下来,变化就累积起来了。当地球表面的地壳由于板块构造力而向上提升以及因侵蚀而减小时,珠穆朗玛峰的高度也在改变。随着时间流逝,我们可以获得一系列测量数据,但由于时间在进展,我们永远不会有机会来重复许多早期的测量。 不准确的另一方面,因此具有的不确定性,在任何测量中都与测量仪器的刻度有关。我们怎么能知道卷尺或码尺或温度计上的标记是被均匀隔开的昵?我们能肯定这些测量工具上的1英尺是实际的1英尺距离吗?我们能确信体温计读数为98.6°F时,实际的温度真是这样吗?或者也许是98.5°F,或者甚至更糟,也许是102°F呢?温度计的制造商们是如何确定多高的液体柱实际代表98°F、99°F和100°F呢?答案就是:他们利用另一支“更好的”温度计来判断一个物体或液体的温度实际上到达98°F时,然后就在被校准的温度计里的液体水平面的外面玻璃上做个适当的标记。 但是这“更好的”温度计是如何有了标记的昵?讲到这,有人会马上认识到需要一个标准:我们假定的就是确切的1米长或确定的某一特定温度的一个状态。在美国,国家标准和技术协会对此有最终发言权。任何测量仪器的性能都可以和公认的标准值进行比较。 那些测量数据与标准很相近的仪器要比那些测量数据与标准出入大的仪器好些(好的通常成本更高)。但是,除了读仪器时的不确定性以外,无论用哪种仪器,对于仪器测的是否是真实值也有一定程度的不确定性。 标准量度 美国第六任总统亚当斯(John Uincy Adams,1825-1829)曾说过:重量和尺寸也许被列入人类社会每一个人生活的必需品中。它们成为每个家庭经济安排和日常生活的一部分。 对于距离、时间、温度、质量和许多其他物理量的测量,已经建立了测量的标准。随着新技术方法的开发,这些标准也随时间而不断发展。“米”作为测量公制中长度的基本单位,其标准的发展历史,为人们了解物理量是如何定义以及标准是如何建立的,提供了极具吸引力的深刻见解。 标准“米”的故事开始于18世纪早期。在那时,科学界仍然惊讶于半个世纪前牛顿在力学上的发现。特别是他根据万有引力作用下简单的运动定律成功地描述了行星围绕太阳运动,这为他赢得了巨大的赞誉。但是他的力学定律并不仅仅局限于解释行星轨道。它们也与许多其他的自然现象有关,比如地球的形状等。在这方面,万有引力所起的作用是让地球上所有的质量都尽可能紧地吸引到万有引力的中心,从而压进尽可能小的体积里。其结果是地球和其他行星将被这一过程理想地定形为球体。 然而,如果这个球体也像所有行星那样围绕一个轴旋转,那么另一种力——旋转的离心力,开始发挥作用,行星结构就必须适应这个附加的力。牛顿力学预言行星的旋转会造成它在赤道向外膨胀一点和在两极点稍微向内收缩一点。在万有引力和离心力两者的平衡下,行星就形成了一个椭圆,其长轴在赤道平面,其短轴通过极点。 科学理论总是要经历测试和检验,以便检査其是否不完善或是否存在缺陷。牛顿力学也不例外。这样,对旋转地球形状的预言所进行的直接测量也是牛顿力学的另一个证实或证明。由此,在1734年,也就是牛顿逝世后不到10年,法国科学院构想出一个实验,此实验为牛顿建立的革命性物理学提供了一个极其重要的检验。法国派出地质学家和调査员去北斯堪的纳维亚和秘鲁测量地球曲率,而这些地方分别接近于极点和赤道。历经3年的野外调查证实,地球的确在低纬度膨胀,在极地附近扁平。牛顿物理学通过了另一个重要检验。 那么,上述故事和建立测量标准,特别是与定义长度标准(我们称为米)有什么关系昵?作为这次地质考察的自然结果,法国科学院做出一个决定,利用地球本身而不是地球的某个部分,作为一个测量标准。他们决定沿着子午线把从赤道到极点的距离分成1千万等份,把每一单元长度称为1米。如此一来,米作为一种长度测量单位,最初的定义为沿着一个子午线从赤道到极点的距离的1/10000000。当然,他们实际上没有从赤道到极点摊开一个长卷尺测量距离。他们知道这个距离与90°纬度相符合。如果他们对高纬度和低纬度处的1°纬度的长度进行仔细的测量,那么通过简单的测量就能推出全部的长度。釆用这种新标准,科学就不再依赖于某个国王脚的长度,或者其他相似的“非科学的”尺寸。科学家们自此以后有了一个量度标准,这个标准直接与永久的地球有关,而不是维系在会死亡的人类的尺寸上。最后这个地质测量规定被转化为一支铂铱合金棒上的标记,它保持在一个标准和不变的压力与温度下,以避免因环境改变而造成的尺寸轻微改变。这一金属棒存放在巴黎,被国际上一致认可为1米长的最终的物理参考。 尽管如此,多年以来测量学的改进和对地球尺寸更好的测量导致出现了与1734年法国确定的标准的偏离。今天,大地测量工作者们认为沿着子午线从赤道到极点的距离是10002286米,而不是10000000米。1734年最初的误差只有大约万分之二,或者每米大约0.2毫米误差。这对那个年代来说已经是相当准确的测量了,其误差在1米中只有1根头发的宽度。很明智的是,我们没有根据对地球进行的这一更新和更精确的测量数据重新定义米。另外,随着时间的推移,地球的自转逐渐变慢,赤道的膨胀和极地的扁平将逐渐地、不断地调整,这使得地球的尺寸也一直在变动着,结果对国际测量标准来讲也不利。 最近对米的定义实际上已经完全脱离了地球表面形状,而倾向于赞成更加稳定的、从不变化的事物。1960年,根据从受激原子氪86所发出的电磁辐射中的光谱线中某一特定谱线的波长的特定倍数(确切值是1650763.73倍),米被重新定义了。米不再直接地与地球的几何形状有关。然而,1960年对米的重新定义的使用期是短暂的。1983年,米又一次被重新定义。这一次是光在真空中1/299792458秒内所传播的距离。这个定义有效地说明了光在真空中的速度是每秒299792458米,同时也含蓄地承认了没有什么能比光速更能准确地描述米的标准了。 类似的情况也会出现在测量系统其他基本单位的确立中。公制中的质量,最初也是法国人定义的,被称为克,其值相当于在某一特定温度下1立方厘米水的质量。然而,这一标准在物理上是一个非常小的量,大约有一小管水那么多,是很难精确测量的。今天这一量的标准是千克(1000克),由在巴黎国际度量衡局的金库中保存的一个圆柱形的铂铱合金(美国的国家标准和技术协会中也有一个复制品)代表。这个1千克圆柱体是保留的仅有的用实物人工制品代表质量的标准。时间的标准为秒,最初的定义为地球绕轴旋转1次时间的1/86400,旋转1次是1天,1天是24小时,每小时包括60分钟,每分钟包括60秒。然而,现代对地球旋转更详细的测量表明地球的旋转不是固定不变的,因此作为时间标准也是不可靠的。今天,官方把秒定义为从铯133原子放射特定波长的电磁波周期的9192631770倍。就像米的定义一样,秒的定义也与地球特征分开了,被更加稳定的特殊原子行为所代替。 在大海中迷路 需要也许是发明之母,但不确定性的确是她的孪生姐妹。不确定性一直是创造性的一个刺激,就对时间进行测量的天文钟而言更是如此。某人在不熟悉的环境里,最常见的不确定表述之一就是:“我在哪里?”当水手们在大海中看不见为他们指明方位的路标时,他们对上述不确定性尤其深有体会。航海的整个艺术和科学起源于人们渴望知道自己在地球表面的位置。没有路标,海员用天上的恒星和行星这些“天空标志”来判断方位。但是由于地球每天都围绕轴旋转,天上的向导也并不是在天上原位不动,似乎也随着其下边地球的旋转而运动。但是有个例外,那就是北极星,北极星位于地球旋转轴延长线的北极点的正上方。在夜空中它看起来是静止的,观察者只要测量北极星与地平线之间的角度就可以知道自己目前所处的位置。如果你在北极点,北极星就在你头顶,或者是与地平线成90度角--—这就是北极的纬度,北纬90度。北半球的水手很早以前就知道用北极星简便地确定纬度。 然而,经度也有另外一个故事。经度衡量离任意出发点的东西距离。今天国际上一致认为,经过英国格林威治的那条子午线为零经度,称为本初子午线(prime meridian)。但历史上也有其他有关本初子午线的选择,多年来法国把经过巴黎的子午线作为本初子午线。当一名海员测量地平线与天上某颗缓慢运动的星星(由于下方的地球在转动)间的角度时,判定某个位置的经度问题本质上相当于对时间进行仔细测量。太阳就是一个很好的例子——它升起,慢慢成曲线向上到达一个高点,接着开始下降一直到日落。如果知道日升、最高点、日落的时间(或者是其中任何位置的时间),而且知道是一年中的哪一天,就可以确定观察者离本初子午线的东西距离。其中的要诀就是只要在观察时有一个能够很好读取时间的好时钟就可以了。在早期的探索中,大多数的时钟是机械装置,带有齿轮和发条。 它们并不完善,速度易变,或快或慢。机械钟的偏差取决于当地温度、大气压和相对湿度、润滑油的自然特性、发条的松紧,以及它是水平还是垂直安放的等等。对于大海中的船只来讲,在海上航行数月而没有路标,准确判定船在地图上的正确方位或将新发现的陆地或暗礁标定在航海图上的能力,与准确地保持时间的能力是相关的。因此就需要设计和建造一个稳定和精确的航海天文钟来减小处于茫茫大海上哪一位置的不确定性。英国海军部对开发这样一种仪器有很浓厚的兴趣,并提供极其丰厚的奖金奖励发明满足海军部要求的航海天文钟的发明者。18世纪的钟表制造商之间随之展开的竞争,以及以后海军部一直拖延不给获胜者奖励的故事,成为索贝尔(Dava Sobel,美国作家。著有国际畅销书《经度》。2002年3月,上海译文出版社出版的由谢延光译的名为《伽利略的女儿——科学、信仰和爱的历史回忆》的传记也出自她的笔下。——译者)笔下一本引人入胜的书的主题。 “鹰已着陆” 当宇航员阿姆斯特朗(Neil Armstrong,1930—,美国宇航员。1969年,曾与奥尔德林(Buzz Aldrin)和科林斯(Mike Collins)驾驶阿波罗11号飞船完成了人类首次征服月球的壮举。——译者)以清晰无误的话语“鹰已着陆”(指阿波罗11号在月球成功着陆。1969年7月20日,当登月舱在月球表面安全着陆时,宇航员阿姆斯特朗立即向地球报告:“休斯顿,我们在月球静海报告,鹰已着陆!”——译者)宣布阿波罗11号宇宙飞船到达月球表面时,也许没有什么比收到这样的无线电广播更令人兴奋的了。然而,在早期的无线电通信中,无线电广播发射机和接收器按现在的标准来看都是粗制滥造的东西。任何发消息给远距离接收器的人喜欢听到的话是“响亮和清楚的”,而不是“微弱和混乱的”。为了能让接收到的信号声音响亮和清楚,它就不能被其他的声音,比如静电噪声、噼啪声、嘶嘶声或嗡嗡声遮住。在传播时,信号也不能变形得听不懂。当其他声源干扰接收所需要的信号时,我们说我们处在“嘈杂的”环境下,很难听到“信号”。同样的描述可用于婚宴中,在那里充斥着舞曲声和其他人的闲聊声,你的声音在嘈杂声中很难听清楚。信号迷失在噪声中。相反的,警车警笛声或者一辆救护车的高音喇叭声则是有目的的:它们被设计成很容易就能从通常的交通噪声中辨别出来。实验室的科学实验报告和测量仪器就好像一个无线电接收器,原因在于科学家只想测量关系重大利益的量,并把来自其他方面的不相关的数据最小化。由于避免所有的噪声是不可能的,当信号处于足够小的水平时,信号声将消失在噪声中。因此在设计科学仪器时,能够估计信号和噪声两者的大小是非常重要的,以便仪器可以满足敏感度和精确性方面的要求。 现在从广义上来讲,任何干扰信号的东西都可被称作噪声,它的来源是很多的。在树木气候学(通过研究树木的年轮,揭示树木存活期间当地的气候状况)领域,科学家分析某个地区中的许多树木,而不是单一的一棵树。他们这样做是因为任何单棵树也许只是显示了树所处区域特有的重要地区性噪声。一棵生长在流域盆地偏远地方的树也许比另一棵生长在水分充足的山谷中的树更容易受到降水量的影响。森林中的树木要为争取接受更多的阳光进行竞争,然而分布稀疏的树木可能就不会有这样的竞争。一场地震也许会阻碍树根汲取水分,但仅距几英里之遥,地震就不会产生这样的影响。简而言之,没有单独的一棵树木能够可信地讲述一个可靠的故事。但是,一个地区许多树木组成的整体,其中每一棵树都受到所处位置特有的影响和地区气候变化的影响,能够让科学家把地区信号从所处位置特有的噪声中分离出来。 清点选票 保罗斯教授对用码尺试图测量细菌的评论不是在实验室中测量细菌的背景下,而是在候选人实力相近的选举中确定其结果的背景下作出的。(参见《我思故我笑——哲学的幽默一面》,约翰·艾伦·保罗斯著,徐向东译,上海科技教育出版社,2002年。——译者)2000年11月,美国人对于谁当选为美国总统,陷人了一场旷日持久的不确定性当中。 在大多数的民主选举中,确定谁获胜在概念上是简单的:清点选票,选票最多的候选人就是获胜者。佛罗里达州在决定谁将成为总统方面被证明是关键的一个州。两名主要候选人布什和戈尔(Al Gore)差不多均分了初始的近600万张选票。两名候选人的选票总数只差不到1000张,这意味着每6000张选票中,每名候选人的选票数仅差一票。自然,由于此事非同小可,因此明显落后的一方就要求重新计数来确保统计选票中没有发生错误。 任何曾试图统计大量事物的人,比方说清点一个大罐子里的硬币数目,都知道要得到一个完全精确的数字并不像看起来的那样简单。举一个例子,让我们想象一个装满10000个绿色弹球和蓝色弹球的桶,我们想要知道桶中每种颜色弹球的数目(这是对两名候选人竞选投票的模拟计算)。如果我们把弹球倒在地板上,然后根据颜色将其分开并进行统计,不确定的结果常常会出现。也许是计数时不注意、分心、错认或者是计算错误,不同的人每次在数蓝色和绿色弹球时得到的最终数目可能会有所差异。 如果仅仅是确定绿色弹球是否比蓝色弹球多,那么通常计数结果之间的差异就不重要了。如果在10000个弹球中,实际上有6000个蓝色弹球和4000个绿色弹球,那么,如果一个人计数的是5984个蓝色弹球和4016个绿色弹球,而另一个人数的是6007个蓝色弹球和3993个绿色弹球,这并不重要。即使第三个人的数目是5991个蓝色弹球和4007个绿色弹球,总共加起来只有9998个弹球(也许有两个滚到附近的橱柜下而没有被看到),这也不重要。就算有人得到的数目超过了10000个也没关系(也许是一些弹球碎成了两半,而在计算的时候把每一半都包括在内了)。也许因为染料的变化问题或因为计数的人是色盲,甚至会存在着难以分辨弹球是蓝色或绿色的困难。 所有这些不确定因素都没有让人对“蓝色弹球明显多于绿色弹球”这样一个结果产生怀疑;蓝色候选人赢得了选举,绿色候选人则失败了。这是因为不确定性的范围比候选者选票总数间的差异小得多。让我们加上或减去10张选票并把计数看作是精确的(这意味着最终的计数会因增加或减少10张选票出现错误),由于蓝色候选人和绿色候选人大约有2000张选票的差异,20张选票的不确定性范围只占差异的1%。信号比混乱的噪声要清晰得多,结果中的不确定性显然并不重要。信号声音大且清晰:蓝色赢了。然而,如果桶里的弹球实际上在颜色上是平分的,即分别有5000个蓝色弹球和5000个绿色弹球,那么在每次计数中,20个弹球的不确定性就很容易产生不同的获胜者。测量工具,即计数弹球的总过程,没有判定蓝色弹球和绿色弹球是相等的所需要的准确性。 在2000年美国总统大选中,差不多600万张选票中,两位候选人各自赢得的选票在佛罗里达州只有几百张的差距。关于一张选票是否包括在最后计数中的不确定性的主要来源集中在选举程序上。选举程序是,选民从一张所有候选者列表的投票卡上,通过在其中一位候选人的选票上打一个小孔,即孔屑来进行投票。然而有些孔屑还是粘在一起,并没有完全分离。吊在一个连接点上的孔屑能被统计进去吗?吊在两个或三个连接点上的孔屑又如何昵?或者根本就没有发生粘连,但孔屑呈锯齿状,也许表明投票者已经打算投票选那个候选人,而只是在使用所提供的工具时把孔屑从投票中分离出来没有成功呢? 程序的其他方面也让人对一些缺席选举人实际投票的正确性产生怀疑。缺席选票申请正确填写了吗?缺席选举人的选票是在截止日期前邮寄并接收到的吗?一些缺席选举人的选票被放错地方但后来又发现了。一些投票者对设计不同的其他选票感到迷惑从而导致没注意就把选票投给不同的候选人,而不是选举者想要选举的那个人。而且少数一些选票可能是由一些没有资格的投票者、一些未登记的人或一些非公民投的,也许还有一些投票者甚至在不同的选区投了两次票。也有人宣称一些合法选民无法参加投票,因为他们的名字被错误地从登记投票者的名单中删掉了。 在佛罗里达州出现的投票和计票过程中的缺陷并不是唯一的。它们会多多少少、不同程度地出现在各地的选举中。选举过程中出现这些问题是不可避免的,但值得欣慰的是这些缺陷通常并不很重要。我们在确定选举获胜者中所用的测量工具已经够精确了。但是在实力十分接近的选举中,由于候选人选票的差异和测量的不准确度大小相同,那么内在的不精确性就会凸显出来。这种差异正好在选举过程和计票过程中的不确定性范围之内,因此选举结果也就陷入选举过程的不确定性之中。佛罗里达州的投票和计票过程,以及其他大多数选区,面对选票总数中这么小的差距,缺乏足够的准确度以确定谁是获胜者。在佛罗里达州投票和计票过程中,选举双方势均力敌。一些报纸后来进行的重新计票支持了这个结论。这个媒体协会认为结果取决于如何清点选票。在更严格的解释标准下,对竞选者得票数的检査会产生一个获胜者;在不太严格的解释标准下,会产生另一个获胜者。 当然,正常的投票和计票程序不能确定选举的获胜者,并不意味着没人就职,而只是说明就职的人是通过其他方式选出来的。美国人确信在宪法规定的日子他们肯定会有一个新总统宣誓就职。因此当选举了无结果时后备程序就会发挥作用,这包括立法和司法的干预。立法的解决方案仅是承认选举无结果,并取代立法机构的选举,无论此立法机构是州立法机关还是美国国会。法院的干预是针对“灰色”选票,例如那些没有完整分离的孔屑所代表的选票或邮戳不清晰的选票,是批准还是否决得作出判决。 在2000年竞争激烈的总统选举中,美国最高法院仅仅通过以下方式有效地选举了新总统:在佛罗里达州的重新计票中,当布什领先几百票时,就命令该重新计票必须停止。不确定性在选择总统的过程中并不是无限存在,宪法规定的程序明确规定面对不确定性时必须做出一个决定。根本没有无限的“研究这个问题”的选择余地,尽管许多人可能会提出争议,他们认为还有充足的时间来对最初由机器数出来的选票进行人工检査。 美国2000年的总统选举提出了一个问题,就是我们是否能够设计出更好的计量工具,这样就能够得到一个更完整和更精确的投票数。实力十分接近的选举的不确定性迫使投票者和他们的州长以及立法者去思考怎样才能改进投票和计票的程序;不确定性已经激励了创造性和灵活性。如果所有的选举产生的获胜者拥有60%的选票,目前的标准是足够了。但在2000年的总统选举中是不够的,因为当时每名候选人获得了大约50%的选票,相差不过0,0001%。这次国家因为测量仪器的不完善所经历的事情促使人们就如何改进美国的选举程序提出了许多建议。 在测量之外 绝大多数科学和统计学教科书中关于不确定性的讨论都结束于处理测量、标度和重复的不确定性。尽管这些不确定性的概念很重要,但事实上,在整个科学领域它们并不是不确定性的最大根源。不确定性的更大问题来源于远在测量工具的精确性和准确性之外的其他方面。其中的一个问题集中在我们怎么样才能把一次的观察集中到一个更大的图景中。法国艺术家修拉(Georges Seurat,1859-1891,(修拉,法国画家,后期印象画派代表人物。他把文艺复兴传统的古典结构和印象主义的色彩试验结合起来。把最新的绘画空间概念、传统的幻象透视空间,以及在色彩和光线的知觉方面的最新科学发现结合起来。对20世纪几何抽象艺术有很大的影响。——译者)创立的绘画的点彩派风格(点彩派是法国新印象派的一个分支,在这一分支中视觉混频或碎色的原则被推向极端——即以细小的点或小而分散的笔触来上色。只有隔开一段距离,当观察者通过视觉作用将那些色彩斑点调和起来而产生可见物体轮廓时,点彩派画中的人或物的形状方可见到。点彩派的发明者和主要代表人物是修拉,另一领导人是西涅克。——译者),非常接近于色彩涂抹的集合。从远处看,这些点就变成了有代表性的图画和艺术杰作。这个问题简化为:“对于森林来说,在单棵树木测量基础上建立森林的数据集,还有比这更重要的吗?” 1998年初,一家报纸的标题宣称“1997——历史记载中最暧的一年”。读过这篇文章,人们就会了解到有一项对数以百万计的温度测量数据的分析,这些数据由世界各地的气象站以及海洋上的浮标和船只所测得。这项分析表明,1997年的全球平均温度超过自进行系统化温度测量和搜集以来的任何其他年份。但是全球年平均温度究竟意味着什么呢?平均温度是如何被确定的?为什么在这样的数字上也存在不确定性呢? 让我们先从测量某一给定时间和给定地点的温度开始吧。你可以很容易想象一个人早上醒来,透过窗户扫视室外的温度计,希望得到今天该穿什么衣服的线索。假如这个人每天都记下温度,到年底时把所有的读数平均一下你就可以判定当年早晨的平均温度。但是,偶尔我们这位认真的观察者忘记了读数或者在读数以前没有戴眼镜,或者是计数有误,或者去度假了,或者不小心打破了温度计,所有这些过错和疏忽都导致了数据差距或数据错误。此外,假如要换温度计,或许我们的观察者会决定买一个不同类型的温度计,它有着不同的灵敏度和精确度。因而对于同样的温度它的读数和原来温度计的读数会稍有不同。而且我们应该如何比较室内阴影处的温度计显示的温度和隔壁向阳处的温度计显示的温度呢?所有的这些问题都可以提出和调和,但每个问题让确定那一地点的年平均温度都增加了一点不确定性。 确定某一地点的年平均温度的另外一个考虑,是和以下两个问题相关的:如何选择温度测量的时间;如何平均不同时间测得的温度。 一个人每天早晨当他拿起报纸时勤奋地观察并记录温度读数,这样经过整整一年,把这些观测值进行平均,就可以得到年平均值。但它可能是上午6点的年平均值,而不是代表24小时的年平均值。我们的观察者或许还会记录下下午6点回家时的温度,并根据早上和晚上的温度估计全天的平均温度。除了早上和晚上观察外,如果他还在中午和午夜记录温度,那就做得更好了。你看到了关键所在:要获得某一地点的较正确的日平均温度,必须通过代表在白天和夜晚间摆动的所有阶段的温度的观察来确定。一旦我们很好地估计了某地日平均温度,我们原则上能够很容易地推出按月算和按年算的温度平均值。 当然,在现实世界里,我们并不靠业余观察者每天读取室外温度计的读数。这项工作是由工作在官方气象站的专业气象学家承担的。在这样的气象站里,测量温度是主要的工作;在一个标准的房间里放着一个标准的温度计,温度至少每小时记录一次,有时是连续记录。在理解过去几十年甚至几个世纪气候变化的原因方面,逐小时的详细信息是非常珍贵的,因为它对于确定“是平常的白天暖和的夜晚或是暖和的白天平常的夜晚引起变暖,还是变暖影响了白天和晚上的温度”这个问题的答案是非常重要的。每一种模式的产生都是对不同的气候刺激的反应。正如我们假想的业余观察者一样,气象站偶尔也会出现温度计受损、动力故障而短时间停电、因为资金不足和战争而关闭,以及从城市迁址到郊区等各种情况,所有这些都会造成数据差距和数据错误,从而导致测量的不确定性。 确定全球年平均温度的不确定性的另一个来源与温度的测量地有关。并不是在地球表面的每一点都进行温度测量,而仅仅是对全球不规则分布的几千个点进行收集。例如,欧洲和美国的气象站要比西伯利亚、亚马孙河盆地、撒哈拉沙漠、南极洲的气象站要多得多,而后者中任何一个地域都和欧洲或美国差不多大小或更大一些。为了便于讨论,让我们设想欧洲有400个气象站,而西伯利亚、亚马孙、南极洲、撒哈拉加起来总共有100个。如果我们把所有这些气象站的读数简单地直接平均一下,我们得到的结果就会在很大程度上向欧洲大量气象站的读数倾斜,这一平均值由于在欧洲具有许多的测量数据当然就会产生地区性偏差。很明显,人们必须很谨慎地不能让地球上某区域的大量观察数据在对整个地球平均值的计算上占支配地位。相对于那些来自易于观察的区域的测量值,人们必须让来自边远地区的较少测量值在平均时占有相当的比重。一个更好的办法就是把地球表面等分成许多区域,确定每一区域的平均温度,然后从每一份区域的平均温度确定全球的平均温度。但是很显然如果某地区的数据只是从几个气象站获得的,而另外的区域则是从成百个气象站获得的,那么由少量观察数据得出的地区平均值要比由更多观察数据得出的地区平均值有更大的不确定性。决定于区域平均值的全球值将反映与区域平均值相关的变化的不确定性。 与观察地点的地理分布相联系的问题,使得在1860年以前不可能直接根据温度计的读数来确定全球平均温度。其中的原因很简单:南半球没有建立足够多的气象站来测量在全球平均温度中代表那一巨大区域的温度。自从大约1860年以来,有足够的气象站分布到全球的很多地方,从而使得确定代表每一区域的平均温度成为可能。而且通过集合,也可以得出全球的平均温度。每一地区平均温度都带有自身的一些不确定性,从而给确定全球平均温度增加一些不确定性。 统计人口 大规模数据收集和综合的其他例子也可以帮助我们想象大量观察数据集合和分析中固有的复杂性和不确定性。例如,每10年宪法授权的全国人口普査都会提出“美国有多少居住人口”的问题。像温度一样,人口数量也是易变的对象,它不是静止不变的,而且一直在变化。 进行人口普査,就像测量温度一样,也有许多不确定性来源。进行人口普査的一个中心战略是确定国家的每一居住地居民的数目。 因此,通过邮件,把人口调査问卷送到每一位居民住处,询问基本的人口统计问题。但是,一些接受者会直接把表格扔进字纸篓,有些人也许会忘记填写表格。一些答卷者因为担心他们违反了一些居住标准的规章或是他们知道一些居民是非法移民,而不会如实地回答问题。一些人住在非住宅区。还有一些人,例如无家可归者,根本就没有地址。 人口普查中的少计并不是人口普査中出现错误或不确定性的唯一来源。人口多计的情况也是存在的。父母离异的孩子有时会在父母双方的表格中都被登记。寄宿学校的学生或者大学生有时会在家和学校都被统计了。也有同一家庭多次填表的可能。在2000年的人口普査中,表格被邮往从大量不同的表格中搜集到的地址。为了尽可能的全面,人口调査局把最初的邮件发送清单与来自美国邮政部门和地方政府的信息进行了合并。尽管进行了努力来排除重复邮寄,但肯定还是有疏忽。表格在政府办公室和便利超市随手可得。通过电话或因特网也可以进行人口普查,因此也很有可能出现重复统计。 通过电话或人口调查员走访乡邻的跟踪调查,会略微改进数据的收集,但在最后的分析中,人口普查结果依然还是不完全和不准确的,因此也是不确定的。就像直接清点选票并不能总是出现清晰的选举结果一样,直接点査全国每个人的人口普査战略也是有缺点的。2000年美国人口普查的最终结果是人口大约为281000000,这是除去由于重复或多次统计而造成的多出的约3600000人口之后而得到的数字。人口调查局估计实际低估的人数可能在2700000到4000000之间,或者占清点的人口的大约1%-1.4%之间。而且就像在选举投票统计中一样,人口普査的缺陷并不是均匀分布在所有人口区域。最后人口普查估计中的不确定性也是不均匀地来自不同区域和不同人口。对西班牙后裔的低估率在2.0%-3.5%之间,美裔非洲人大约为1%-2.7%,印第安人是2.8%-6.7%,18岁以下儿童大约是1.2%-1.8%。下一章我们将分析为了提高准确性,如何使用统计方法改善人口普査结果。但是潜在的改进也涉及政治的卷入,而这可能会延缓更精确的人口普査。 读出言外之意 让我们转到从事聚集观察数据引起的实际问题上去。例如,地震发生后,考虑一下确定有多广的区域经受超过某一特定水平的地面加速度的问题。以下现象很有代表性:在震中附近,地面震动最大;离震中越远,震动就越小。地震周围经受大的加速度的区域有多大昵?对此问题的回答非常重要,因为对于在地震危险区确立学校、医院和核电站的建设标准,它扮演着非常重要的角色。与这项任务相关的测量仪器是一种被称为加速度计的仪器。这些仪器在地震可能发生的地区广泛使用,而且在诸如洛杉矶这样坐落于高地震危险区的一些城市中数目可达数百个。在远离这些地区的其他区域也使用这种仪器,但数目要少多了。洛杉矶的加速度计可能比整个北达科他州的还要多。 这些仪器并不全是来自同一个制造商,甚至设计也不相同。但是通过校准,地震学家认为它们完全可以确定地震附近或者几千公里外的地区的加速度(在可接受的不确定性范围之内)。因此地震过后,地震学家把所有的读数汇总到一起,把它们标记到地图上仪器所在的位置。接着困难就来了:从离地震不同距离和方向上获得的零散读数的集合,科学家是如何估计经受超过某一确定值的加速度的区域呢? 让我们把0.1g的加速度(重力加速度的十分之一)作为影响值。在一个加速度计上我们看到的是0.12g,明显超过我们刚选定的级别。在另一个距离地震更远处的一个站点记录的读数是0.03g,这又明显低于选定的标准。事实上,在所有的仪器中有些标记高于0.1g,而有些低于0.1g,也许没有任何仪器读数正好在0.1g上。 地震学家面对的任务是通过这些不规则分布的点画一条线,从而把超0.1g和低于0.1g的值分开。实际上,这条线是地震学家对仪器记录的加速度值为0.1g的地点的一个最好估计。一旦画出了这条线,就很容易确定这条线所包围的区域,但是在那些拥有仪器读数的地点之间恰当地画出这条线,则需要对很多判断进行检验。 估计一个给定的值处于两个已知值间的哪一位置的过程被称为内插法,类似于当玻璃管中的液体顶端处于玻璃上的刻度之间时读取温度计的读数。在温度计的例子中,我们通常认为超过较低标记的温度增量直接与包括液体柱顶端的两个刻度间的距离成比例。对于地震,也许有人认为加速度减小的线正好是离震中距离增加的那些圈,就像石块投掷到池塘,水面泛起的波纹向外扩散一样。但是地震变化的模式决不像几何学那样简单。地面加速度对地球表面土壤或岩石的类型以及它是否渗透了水非常敏感。震级也受地震与记录仪器之间亚表层的地质结构的影响。几十公里内可能造成两个仪器的读数不同,而且所有这些因素在两个地区之间也有很大的不同。 确定经受某一特定地面加速度的地区所具有的不确定性会带来进一步的后果。为了便于讨论,假定引起上述加速度的震级是6级,早期的研究确定经受同样加速度的更小地区是5级地震和4级地震引起的。每种情况都因为上面提到的同样原因存在着不确定性。所有这些调查结果表明了当地震级别增加时,更广的区域感受到了这样的加速度。运用这些结果,我们现在就想估计有多大的区域受到如震级是7级或8级这样真正的大地震同样的震动。很明显,在确定受3个更小地震影响的地区中出现的不确定性,会对“由于受到更大级别的地震的影响而发生震动的地区的估计”带来一些不确定性。这些更大级别的地震比到目前为止经历的任何地震级别要大,而且是即将要发生的地震。 在设计一个像核电站这样能够经受住地震震动的建筑时,对这个建筑可能经受的地震级别进行仔细评估是非常重要的。反过来,这需要确定可能影响该建筑地点的最大地震的位置和范围。此事件被认为是该地区有可能经历的“最大可能地震”,从精确度上说,要比该地区已经经历的任何地震级别更大些。估计最大可能地震需要在迄今为止我们已经观察的范围之外进行考虑,即超出我们过去经历之外。这个过程被称为外推法。估计最大可能地震需要大量的资金,较大的估计意味着更坚固和更昂贵的建筑,较小的估计则意味着更少的花费。从这个观点来看,与测量仪器的设计和校准、加速度计相关的不确定性就显得无关紧要了。这些不确定性与以下两种不确定性相比显得不重要:一、通过读取安装在这个地区的加速度计的读数从而确定遭受严重震动的地区的不确定性;二、将那些观察得到的数据外推来预测多大的区域将会遭遇更大但还未经历的地震的不确定性。反过来,估计那个地区可能遭受的最大可能地震的范围的不确定性又增加了所有那些不确定性。显然,当把与加速度计读数的准确度和精确度相联系的不确定性,置于从那些读数推导的重要的量所具有的总体不确定性的背景中时,这种不确定性就很小了。 然而,所有这些不确定性并不能妨碍人们做出决定。行政官员决定在哪里建造新学校、高速公路天桥和发电厂以及如何建造它们。当时的传统工程知识,和经济的、人口统计学的、政治的因素一起,共同指导着建筑标准。考虑到不确定性,这些建筑标准都有一个有益的减震装置。随着经验的累积,从成功设计中学到的经验和失败设计中吸取的教训,会导致对建筑标准进行修订。我们从错误中汲取教训,从成功中总结经验。实际上,标准并不是固定不变的。 因此,现在我们已经看到测量的复杂性了。我们已经考虑了一个特别的测量工具对我们从事的测量的合适性;也考虑到了集合许多单次的测量来判断更大和更重要的变化的方式。下一章讨论的是运用统计学和概率工具对测量数据集合进行定量描述。 第六章 对半的机会 这个国家对信息非常渴望:凡是有着统计特性的每样东西,甚至是一个统计的外观,人们都会对其怀有一种近乎可悲的热情;团体对这些统计性的陈述没有半点怀疑和全面评价。 ——弗朗西斯·A·沃克(Francis A. Walker),1870年美国人口普查总监 前一章集中讨论了测量的问题。在此我们将更多地谈论如何从所收集的测量数据中提取定量信息。这个讨论将会带领我们进入诸如洪水和地震发生的频率、民意测验及人口普査等多个方面的主题。只有少数投票人参与的民意测验对于即将举行的选举的可能结果能告诉我们什么呢?我们从沿河流域爆发洪水的历史能知道些什么,这些历史对于将来可能发生的事情会给出什么指示?每一个主题都包含着不确定性,来源于不同资料的不确定性,其量化的方法也不同。 我们有很多方法和途径建立测量数据集。一个非常常见的数据来源是对单个物体进行多次测量——当地小学一个班的每位同学测出他们老师的身高,或者是一个地区所有地震观测站测出前一天地震的强度。第二种常见的数据集包含了同一时间内对不同物体测量的数据——或者是新学期第一天上午测量班上每位同学的体重,或者是一个县每口水井在某一天砷的含量。第三种数据集是一段时间内的一组测量资料——一个学校很长一段时间以来在新学年初测得的8岁孩子的平均体重,或者是过去75年中,当地河流每天的水位。我们如何来定量地描述这些数据集的性质昵?从每组数据集中我们能学到什么昵? 统计学和概率 统计学是定量描述数据集并用已定义的数学程序进行计算的一门科学。学生们把他们各自测得的老师身高集中起来,发现这些值都在5尺9英寸(1.75米)左右,有些稍微小点,有些稍微大点。在这里有价值的统计项仅仅是所有测得数据的平均值:所有数据相加除以数据的个数。这个平均值就是老师身高的最佳估计值,平均值两侧测量值的分布情况确定了数据不确定的程度。正是由于学生使用和读取测量仪器的技能不同,造成了数据的不确定性。 第二种数据集,班上学生的体重,呈现出一个53-81磅的范围,由此得到的平均体重是66磅(30千克)。在这种情况下,之所以出现一个数据范围,小部分原因是读数不准确造成的,主要原因是因为班上学生的体重不同。我们从这些测量数值得到的信息比仅从平均值得到的信息要多。我们可以确定每个学生的体重偏离平均体重的程度,也可以计算出平均偏离值大小。当我们把学生体重同平均体重相比时,我们能够知道学生体重分布的密集程度或分散程度。由此可以知道我们班是学生体重几乎相同的单调班级,还是体重超重和厌食学生很多的高度变化的班级。 同样,我们也可以确定在平均体重值周围包含中间2/3学生的体重范围,或者找到一个值,使得一半学生的体重超过该值,一半学生的体重轻于该值。以上所有这些都是对体重测量集合的定量描述。这些测量及其定量描述可以作为对这个群体以及其他地区8岁孩子进行科学研究的起点。这个学校的学生在多大程度上代表了这个县其他学校的学生呢?我们能把这一平均体重或体重范围与这个县的社会经济学因素联系在一起吗? 概率就是可能性估计。对于8岁孩子的情况,我们也许想知道学生的体重介于60磅和70磅(27-32千克)之间的可能性。分析显示学生的体重落在这一范围的概率是75%。同样的计算结果也说明了没有落在这一范围的概率是25%。在本例中,任意选定一个学生,他的体重落在这个范围之外的概率是1/4,所以说存在不确定性。概率为我们定量不确定性提供了一种工具。 很多科学家用下表中的语言描述与不确定性相关的概率的定量估计。有时不确定性用黑色或白色表示,但通常情况下是用灰色。或者如罗素(Bertrand Russell,1872-1970,英国哲学家,同时又是著名的数学家、散文作家和社会活动家。他是20世纪分析哲学最具影响力的人物之一,曾因《婚姻与道德》获1950年诺贝尔文学奖。在哲学上,他的观点大抵早期是属于新实在主义的,晚年逐渐转向逻辑实证主义。——译者)所说,“当一个人承认没有什么是确定的时候,他必须增加一条,有的事情比别的事情更加确定。”以该表作为指导,一个人赢得抽彩的概率我们可以称之为“极度不可能”;太阳明天升起的概率是“几乎确定”。你孩子上大学的概率则落在极端之间的灰色区域。