思考，快与慢-思考，快与慢-10

为了证明记忆自我的决策能力，我和我的同事设计了一个实验，用的是温和却有些残忍的方式，我将这种方式称为冰手方式（正式名称为冷升压试验）。我们要求受试者将手浸入冰冷的水中且让冰水没过手腕，一段时间后可以拿出来，并能得到一条温暖的毛巾。受试者可用另一只手控制键盘上的左右键以不断记录自己所承受的痛苦，这种方法可作为与其经验自我的直接交流。我们选择的水温会让人感觉疼痛，但能忍受。当然，受试者在任何时候都可以自由地移动他们的手，但没有人这么做。每位受试者都做了两次冰手实验：短期实验情况就是在14摄氏度的水中浸泡60秒，受试者会感到水特别凉，但还能忍受。60秒结束后，实验者让受试者把手从冷水中拿出来，并给他们一条温热的毛巾。长期实验情况会持续90秒。其最初的60秒和短期实验的情况一样，在60秒结束时，实验者什么也不会说，但是他会打开一个阀门，让温水流入容器中。在后30秒内，水温大约会上升1摄氏度，刚好可让受试者觉察到疼痛感略有缓解。贼吧Ｚei８。ＣＯＭ电子书下载受试者被告知会进行3次实验，但事实上，他们只经历了短期和长期两种情况，分别用不同的手。两次实验间隔7分钟。第二次实验结束7分钟后，受试者可选择是否参加第三次实验。而且第三次试验是对前面某次实验的重复，而且使用哪只手可自己决定。当然，一半的受试者用左手做短期实验，一半用右手做；一半选择先做短期实验，一半选择先做长期实验，等等。这是一个被严格控制的实验。该实验的目的是为了在经验自我和记忆自我间引起冲突，也是在体验效用和决策效用间引起冲突。从经验自我的角度看，长期实验明显更糟糕。我们希望记忆自我会有另一种见解。峰终定律认为短期实验的记忆要比长期实验的记忆更糟，而过程忽视则认为90秒和60秒疼痛之间的区别会被忽略。因此，我们预测受试者将对长期实验会有更好的（或更不好的）记忆并且选择重复此试验。他们也确实这样做了。有80%的受试者（在做长期实验时认为最后一个阶段的痛苦减轻了）选择在第三次实验时重复长期实验，称自己愿意忍受后30秒不必要的痛苦。那些选长期实验的受试者并不是受虐狂，也不是想使自己置身于更糟糕的体验中，他们只是犯了一个错误。如果我们问他们：“你是喜欢泡90秒，还是只是前60秒？”他们肯定就会选择短期实验了。然而，我们没有这样问，受试者只是选择脑海中自然想到的：他们选择的是记忆中不那么令人厌恶的实验。我在问他们时，他们知道两次所受痛苦哪个时间更长，但他们并没有将这种认识与实际联系起来。他们的决定是出于一种简单的直觉：即选择你最喜欢的或最不喜欢的。记忆规则决定了他们有多不喜欢这两种选择，反过来，这种不喜欢的程度又决定了他们的选择。冰手实验，就像我之前说的注射测验题，都揭示了决策效用和体验效用之间的差异。在本实验中，我们观察到的偏向是我们在之前讲到的“少即是多”的另一个例子。其他“少即是多”的例子包括奚恺元的实验，即给低于总价值的24个盘子附加上几个盘子，因为附加的盘子中有的是坏的。还有一个例子是琳达问题，即激进的妇女会被认为更像是主张女权主义的银行出纳，而不是普通的银行出纳。其中的相似性并非偶然。系统1同样的操作特点说明了三种情况：系统1是用平均水平、规范和原型来表示集合，而不是用各条件的集合。冰手实验就是多个时刻的集合，而记忆自我会将每个时刻作为典型时刻记下来。这又会导致冲突。对于通过经验自我来评估各个时刻的客观观察者来说，最重要的是“曲线下的区域”，因为它表示的正是这段时间内受试者承受的所有痛苦，这本质上属于总结。相比之下，记忆自我保存的记忆是对代表性的时刻的感受，受到高峰和结束时刻的强烈影响。当然，动物对整体信息的存储记忆可通过进化而得以加强，某些情况下确实是这样。对于一只松鼠来说，“知道”已储存的食物总量是很重要的，只知道存储坚果的平均量不足以让它安心。然而，一段时间里的痛苦和快乐的总量对身体来讲不是那么重要。例如，老鼠对快乐和痛苦都会表现出过程忽视。在某项实验中，老鼠会先看到一束光，之后会遭电击，老鼠很快就会对光产生恐惧感。恐惧的程度可以通过一些生理反应来测量。实验的主要结论是，电击的持续时间对恐惧没有任何影响，有影响的是电击产生的痛苦程度。其他的经典研究表明，对老鼠大脑内的特殊区域（老鼠的大脑和人类的大脑相似）进行电刺激会产生强烈的快乐感，这种快乐感很强烈，以至于在某些情况下，老鼠（实验者可通过操纵杠杆刺激其大脑）会很兴奋，连停下来进食都不可能，最终被饿死。实验者可用不同电流强度和持续的电刺激能使大脑产生快乐的区域。需要再次强调的是，只有电流强度会起作用。在一定程度上，增加电刺激的持续时间并不会使动物更能感受到这种快感。支配人类记忆自我的规则有一个漫长的发展史。记忆没那么可靠几年前就一直困扰我的注射难题中最有用的一个想法就是：多次使人同样痛苦的注射，其体验效用可用计算注射次数的方法进行测量。如果所有的注射都同样令人厌恶，那么其中20次注射的痛苦程度会是10次注射的2倍，并且从20次注射减少至18次与从6次减少到4次给人们带来的减少痛苦感受的程度是相同的。如果决策效用与体验效用不相符，那么肯定是决策出错了。冰手实验也体现了这样的逻辑：持续90秒浸在冷水里比其前60秒在冷水里更痛苦。如果人们愿意选择忍受较长时间的浸泡，则说明他们的决定是错的。在我之前遇到的难题中，决策和体验之间的差异源于越来越小的敏感度：18次和20次之间的差异并不是很明显，似乎还没有6次和4次注射之间的差异明显。在冰手实验中，这种错误则反映出了记忆的两个原则：过程忽视和峰终定律。这些机制虽然不同，但结果却是一样的：决策与体验不协调。决策不会产生最有可能的体验，对未来感觉的预测也会是错的，这对于相信选择中是有理性的人来说不是好消息。冰手实验的研究表明，我们不能完全相信我们的偏向会反映出自身的爱好，即使这种偏向是基于个人经验的，甚至那些经验的记忆是刚刚才建立的！品位和决策受记忆影响，但记忆可能是错的。因此，像“人们的偏向不会改变，且知道如何让偏向达到最大值（这是理性代理人模式的基础）”这种说法就会受到质疑。我们的大脑在运作时，常会出现不一致的情况。我们对痛苦和快乐体验的持续时间有着强烈的偏向。我们希望痛苦的时间缩短，而愉快的时间能够延长。然而，我们的记忆（系统1的作用）已变成痛苦和快乐的最强烈感受（高峰时）以及感受结束时的自身感觉。忽视过程的记忆不会为我们的偏向带来长期的愉快和短暂的痛苦。示例：体验效用“你完全是从记忆自我的角度思考你失败的婚姻的。离婚就像是以刺耳的音符结束的交响乐。事实上，它虽然结束时很糟糕，但这并不意味着整首交响乐都那么糟。”“这是关于过程忽视的一个负面例子。尽管好的体验的时间要比不好的体验时间多10倍，但你还是将好的体验和不好的等同并加以权衡了。”第36章人生如戏在我研究的早期，我看了威尔第的歌剧《茶花女》（La Traviata）。这部歌剧以华丽的音乐著称，讲述了一位年轻贵族与出身风尘的薇奥莉塔之间动人的爱情故事。这个年轻人的父亲因为想要保护家族声誉，不希望薇奥莉塔的出身妨碍到自己女儿的婚姻，便找到薇奥莉塔并劝她离开自己的儿子。于是，薇奥莉塔假装不爱自己的心上人了，拒绝了他。后来，她的肺结核开始复发。在最后一幕中，薇奥莉塔即将死去，她躺在床上，周围有几个朋友。薇奥莉塔的爱人知道了她病危的消息，匆匆赶往巴黎。而她在听到这个消息后，也仿佛看到了希望，感受到了喜悦，尽管她的病情还是在快速恶化。无论你看了多少次这部歌剧，还是会为这个紧张而危险的时刻揪心：这位年轻的爱人会及时赶到吗？对他来说，在薇奥莉塔死之前与她团聚有着重要的意义。当然，他做到了，美妙的爱情二重唱响起，但薇奥莉塔也在这10分钟美妙的音乐过后死去。比起整个人生，我们更在意人生的结局看完歌剧后，在回家的路上我想：我们为什么会那么在意最后的10分钟呢？我很快意识到我忽然感到自己完全没有注意薇奥莉塔活了多长时间。如果我知道她是27岁死去的，而不是我认为的28岁，就算她错过了一年的快乐生活也丝毫不会令我动容，但是，错过了这最后的10分钟却关系重大。另外，就算我知道他们重聚后在一起的时间是一周而不是10分钟，我的情绪也不会有什么改变。然而，如果她的爱人来得太迟，《茶花女》就会是一个完全不同的故事了。故事所关注的应该是其中有意义的事件和值得珍藏的时刻，而不是时间的流逝。过程忽视常出现在故事中，故事的结局也总能将故事的角色定型。我们在叙述的规则以及对结肠镜检查、假期、电影的回忆中都能找到与这则故事相同的主要特征。这也是记忆自我的工作机制：编故事，并将其作为将来的参考保存在记忆中。我们并非只在歌剧院才会感受到人生如同故事，并希望它会有个好结局。当我们听说一位和女儿疏远多年的妇人逝世时，也想知道她在死前是否已经与女儿冰释前嫌。我们所关心的不只是女儿的心情，而是希望这位母亲的故事更为圆满。关怀某个人通常体现在关心这个人故事的完整性，而不是他的感觉。一些事情还会改变已经去世的人的故事，这些事情也可能使我们深深动容。例如：一个男人到死都深信自己的妻子很爱他。所以，当我们听说他的妻子多年前就有了情夫，与这个男人在一起只是为了他的钱时，就会为这个男人感到悲哀。尽管，这个丈夫一生都很快乐，我们还是会同情他。若某位科学家的某项重要发现在她死后被证实是错误的，我们也会为她感到耻辱，尽管她自己并没有体验过这种耻辱。当然，更重要的是，我们都极度关注自己的人生故事，并希望故事的主角正派，结局完美。心理学家埃德·迪耶内（Ed Diener）及他的学生们对过程忽视和峰终定律是否会主宰我们对整个人生中所作的评估感到好奇。迪耶内简要地描述了简的一生（简是虚构出来的人物）：简从未结婚生子，一场车祸让她丧命，但死的时候并不痛苦。对于简的故事有这么一个版本：她一生都非常幸福（这种幸福可能持续了30年或60年），她将工作视为享受，喜爱度假，花了很多时间与朋友聚会，培养自己的爱好。在故事的第二个版本中，简的寿命被延长了5年，她于35岁或65岁逝世。迪耶内描述说简生命的最后5年很快乐，但不及从前那样快乐。每位受试者在读过其中一份为简设计好的“传记”以后，都需要回答两个问题，“纵观简的一生，你认为她的人生有多圆满”以及“你认为简的一生经历了多大的幸福或不幸”。研究的结果进一步证实了过程忽视和峰终定律。在组间实验中（不同受试者看到的实验情景不同），将简的寿命延长一倍不会使受试者对她人生的圆满度或是整体的幸福度改变观点。显然，她的一生是由一个典型的时间段代表，与总体的时间无关。因此，她的“总体幸福”是生命中一段典型时期体验到的幸福，而不是整个生命过程中体验到的幸福。由这个观点可以得知，迪耶内和他的学生们也发现了“少即是多”的效应。这个效应清楚地表明，平均（典型）可替代总体。若给原本一直都非常幸福的生命增加5年“还算幸福”的日子，会导致人们对这个生命总体幸福度的评估大幅降低。在我的鼓励下，他们还收集了一些组间实验数据，数据是关于增加5年寿命的影响；每一名受试者都必须在实验过后迅速作出判断。尽管我长期研究判断错误，我也不相信理性的人会作出增加5年还算幸福的日子会使生命更加糟糕的判断，然而我错了，增加那令人失望的5年会使整个生命都显得很糟糕。这种判断模式似乎极为荒谬，所以一开始，迪耶内和他的学生们还认为是这些年轻受试者的问题。然而当这些受试者的父母和较为年长的朋友回答相同的问题时，他们的判断模式也没有发生改变。在评估整个生命以及一些有趣的事时，高潮与结尾很重要，过程通常会被忽略。人们经常会用工作的劳累和假期的舒适来反驳过程忽视的观点：我们都有直觉，工作24小时肯定会比工作6小时累，工作6小时比工作3小时更累。过程在这些情况中似乎很重要，但实际上是故事的结尾让整个事件过程的长度发生了改变。对于前面提到的那位母亲，等24小时会比等待6小时更为痛苦和绝望；旅游者休息6小时也会比休息4小时感到更为放松。当我们用直觉来评估这些事件时，真正起作用的是现有体验的不断恶化或改善，以及这个人的最终感受。关于上一次旅行，你还能记起多少？请思考度假时的选择。你是希望在去年去过且很熟悉的海滩度过愉快的周末，还是想充实新的记忆？为了满足这些不同的选择，两种截然不同的行业随之出现：度假村提供了恢复元气的休闲方式；旅游业则帮助人们构建故事、收集记忆。许多旅行者会近乎疯狂地拍照，这说明储存记忆是人们旅游的重要目的，这个目的会影响我们旅游的计划和体验。照相的人并不认为当时的景色只能供自己欣赏片刻，他们将景色当做未来的记忆来收藏。照片对于记忆自我来说很有用，尽管我们很少会长时间或多次观看这些照片，有的照片我们甚至没再看过，但是拍照并不一定就是旅行者的经验自我欣赏风景的最佳方式。很多时候我们都通过自己想要储存的故事或记忆来评估旅行。“难忘”这个词常都用来描述旅行中的亮点，明确地阐述旅行的目的。在其他情况下，我们会想到“喜爱”这个词，这是对此刻永生难忘的宣言，尽管这并不总是准确，会随着时间的变化而变化。有自我意识的记忆体验会得到重视、被赋予意义，这是其他体验无法实现的。埃德·迪耶内及他的团队提供的证据表明，是记忆自我选择了旅行方式。他们要求一些学生记日记，记录下春假期间他们对自己经历的评估。学生在假期结束之时，还需提供自己对整个假期的整体评估。最后，他们还需说明自己是否愿意再次这样度假。统计分析说明，他们是否想要重复假期的意愿完全取决于最后的评估，即使是最后的评分也不能代表他们在日记中描述的经历，他们依然会这样选择。就像冰手实验一样，无论对错，当人们在作是否重复某个经历的决定时，他们都会由记忆作出选择。有关你下次旅行的思考性实验能使你察觉到你对自己的经验自我的态度。在假期结束之时，你拍的照片和录像将被全部销毁。另外，你会服下一剂药，这剂药会消除你关于这次旅行的所有记忆。以上情况对你的假期计划有多大影响？与普通的旅行相比，你会花多少钱在这次旅行上？在我还没有正式研究人们对这种情境的反应之前，我曾与他人讨论过，得出的结论是，记忆的消除会大大降低这次体验的价值。有时候，人们对待自己就如对待其他失忆的人一样，他们通过回到曾令自己愉快的地方以增强自己的愉悦感。然而，许多人说他们完全不想去那些地方，这表明他们只关注自己的记忆自我，而且相对于失去记忆的陌生人来说，他们更少关注失去记忆的经验自我。许多人指出他们不会让自己或是失忆的人去爬山或是穿越丛林，因为这些体验在当时大都是痛苦的，只能靠提醒自己达成目标的痛苦与快乐都是值得的才能坚持下去。另一个思考性实验需要你想象自己正面临一场痛苦的手术，整个手术过程你都是清醒的，别人告诉你你会痛苦地叫出来，还会请求医生停止手术。然而，你事后肯定能得到一颗“忘忧草”，彻底忘掉这件事。你对此有何看法？我无心的观察再次得出这样的结论：大多数人对于他们经验自我遭受的痛苦都是漠然的。许多人说他们毫不在乎。另一些人和我有一样的看法，我为我的经验自我感到遗憾，但遗憾的程度不会比我对痛苦的陌生人的遗憾感受强。我就是自己的记忆自我，也是自己的经验自我，两者主宰我的生活，但它们对我来说就像是个陌生人，这感觉很奇怪。示例：谈到人生如戏“他一生正直磊落，但生命的最后一段却不得人心，为此，他要竭力维护自己的一生。”“为了能有一晚的相处时间，等多久都愿意的现象就是过程忽视的例子。”“你似乎将整个假期都用在了构建记忆上。也许你应该放下相机，享受这一刻，即使这一刻并不令你感到难忘。”“她是老年痴呆症患者。没有了人生故事，但是她的经验自我对于美与高贵依然敏感。”第37章你有多幸福15年前，在我刚开始对幸福的研究感兴趣时，我发现我们对幸福的认识都是通过让无数人回答一些差别不大的问卷调查得到的，这是被普遍接受的测量幸福的方法。这些问题是为记忆自我而设计的，会使你思考自己的生活：从各方面考虑，你对自己目前生活的满意程度如何？在从结肠镜检查以及冰手实验的错误记忆的研究谈到幸福这个话题时，我自然而然地对生活满意度是衡量幸福程度的标准这一观点产生了怀疑。由于记忆自我对实验没有什么帮助，我将注意力集中在了经验自我的幸福感上。我提出这样的说法：“海伦在3月份很快乐。”我认为这种说法是合理的，其前提是：她将大多数时间用在了她愿意继续、不想停止的活动上，很少将时间用在不想做的事情上。更重要的是，人生苦短，所以她也没将时间花在自己不在乎的事情上。有许多事是我们愿意继续、不想停止的，包括心理和生理上的愉悦。我想到的海伦想要继续做下去的事情是全身心投入到某项工作中去，这种全身心投入的状态被米哈里称为心流。心流是艺术家在创作时、人们在被电影和书籍或是填字游戏深深吸引住时的一种状态。人们处于这些情境时，往往不愿被打扰。我也有过类似的记忆：我小时候，当我母亲从我手中把玩具拿走，要带我去公园时，我总会哭。在公园里，当她将我从秋千上抱走，带我去玩滑梯时，我也会哭。抗拒中断当前事情表明：无论是玩玩具还是荡秋千，我当时都正玩得愉快。我建议测量海伦的客观幸福感要和评估两位做结肠镜手术的病人的方法一样，通过海伦对其生活中连续时刻的幸福感来评估。我采用了埃奇沃思在一个世纪以前就提出的快乐测量仪的方法。最初采用这个方法时，我认为海伦的记忆自我对实际的幸福与其经验自我体会到的真实幸福相比会更容易犯错误，因而，对其不予考虑。我怀疑自己的这个观点过于极端，后来证实这果然是极端的，但却是个很好的开始。测量经验自我的幸福感我召集了一个“梦之队”，其中包括除我在内的三个不同领域的心理学家以及一位经济学家。我们一起提出了一套测量经验自我的方法。不幸的是，对经验的持续记录难以实现，因为一个人不可能一边不停地报告自己的体验，一边像平常那样生活。最接近于真实情况的选择是使用经验取样法，这是由米哈里发明的方法。自首次使用以后，这个方法已经有了一定的改进。现在，我们可以通过手机来采集经验样本。具体方法是：将某个人的手机设置为在每天任意的时间响或振动，随后，手机会在打断这个受试者后，显示一些关于她正在做什么以及和谁在一起的问题。手机还会显示评定量表，以供受试者报告她各种感受的强度，这些感受有：快乐、紧张、愤怒、担心、投入程度、身体上的疼痛等。经验取样法成本高且烦琐（尽管没有大多数人一开始觉得的那样令人烦扰，回答这些问题只需很少的时间）。因此我们需要一个更为实际的方法，所以，我们开始采取昨日重现法（Day Reconstruction Method，DRM）。我们希望这个方法可以得到接近于使用经验取样法的结果，并提供关于人们如何利用他们时间的额外信息。我们邀请受试者（在研究早期时都为女性）参与一个两小时的会议。首先，我们请他们将昨天的生活分为如同电影一样的多个片段，然后详细叙述出来。然后，他们还需回答关于每个片段的一些选择题，这些问题是基于经验取样法提出的。他们从一个列表中选择了参与的活动，并说明是哪一个活动吸引了自己最多的注意力。还列出了与他们在一起的人，并将自己几种感觉的强度划分了等级，等级范围为0~6，其中0等于没感觉，6等于感觉最强烈。这种方法证明，能够详细回忆过去情境的人也能重新感受到过去事情发生时的感受，甚至可以体验到他们先前对这些情绪的生理反应。我们假设受试者能够非常准确地还原某个场景的典型时刻。几个与经验取样法进行的比对证实了昨日重现法的有效性。由于受试者还说出了各个场景开始与结束的时间，我们还可以计算出他们清醒时感受的过程权重。在对我们每天受到的影响的综合测量中，持续时间较长的场景比稍短的更有价值。我们的调查问卷还包括估测生活满意度，我们将此时的满意度理解为记忆自我的满意度。我们采取了昨日重现法研究决定情绪上的幸福感和生活中满足感的因素，受试者是几千位来自美国、法国和丹麦的女士。单一的幸福价值很难代表某一时刻或场景的经历。积极感受有很多种，包括喜爱、快乐、投入、希望、乐趣等。消极情绪也有许多种，包括生气、羞愧、忧郁和孤独。尽管积极和消极的情绪可能同时存在，但将生活中大多数时刻区分为完全积极和完全消极还是有可能的。通过比较积极与消极的形容词的等级，我们可以辨别出令人不悦的场景。如若在某个场景中，某种消极感受比所有积极感受都要强烈，我们就认定这个场景是令人不悦的。我们发现，美国女性有19%的时间都处于不愉快的状态，比法国女性（16%）或丹麦女性（14%）都要高。我们将个人处于不愉快状态的时间比称为U指数。例如，某个人在16个小时醒着的时间内，有4小时处于不愉快状态，其U指数就是25%。U指数并不是基于评定量表，而是基于对时间的客观测评。各种活动的U指数也可以被测量。例如，我们可以测量出人们在交谈、工作，或是与父母、爱人、孩子交流时处于消极情绪的时间占总时间的比例。对于美国中西部城市的1000位女士来说，晨间交流的U指数是29%，工作时交流的U指数是27%，照顾小孩时是24%，做家务时是18%，社交时是12%，看电视时是12%，做爱时是5%。工作日的U指数会比休息日高6%左右，主要是因为人们在周末会更少将时间花在他们不喜欢的事情上，也不用承受与工作相关的紧张和压力。最令我们惊讶的是人们与孩子相处时的情绪经历，美国女性与孩子相处的时候感到比做家务还要无趣一些。法国女性和美国女性的U指数有少许不同的地方，下面是其中一点：法国女性比美国女性与孩子相处的时间少，但是更享受其中，可能是因为她们有更多使孩子受到照顾的方法，而且也不用在中午花太多时间接送孩子去参加各种活动。人在任何时刻的心情都由他的性情和整体的幸福感决定，但情绪上的幸福也会在一天或一周之内出现巨大的波动。人在某个时刻的心情主要取决于当时的情境。例如，工作时候的心情主要不会受大体上的工作满意度（包括待遇和职位的满意度）的影响。更重要的是情境因素，例如与同事交流的机会、被噪音烦扰、时间压力（这是消极影响的重要来源），以及突然看到老板（在我们的第一项研究中，这一点是唯一一个比孤独更糟糕的因素）。注意力是关键。我们的情绪状态绝大部分取决于我们关注的事情，我们通常都会关注正在进行的活动以及直接环境。也有例外的时候，那时，主观经验的质量是由再现的想法来主导的，而不是由当时发生的事件主导的。处于恋爱中的人即使在堵车的情况下也可能感到快乐，而处于哀悼中的人就算是看搞笑电影也可能会继续悲伤。然而，在正常情况下，我们只因此刻正在发生的事或喜或悲，但前提是我们必须关注这件事。例如，从吃中得到快乐，你必须注意到你正在吃东西。我们发现法国女性和美国女性花在吃东西上的时间大约是相同的，但对于法国女性来说，她们对吃的关注是美国女性的一倍。美国人更有可能在吃的同时兼顾其他事情，所以，她们从吃中得到的快乐也相应减少。这些观察对于个人和社会而言都是有意义的。对时间的利用是生活的一部分，是人们可以掌控的。少数人可以用意志使自己更为开朗、乐观，但是许多人可能会安排他们的生活，使自己少花些时间交谈，多花些时间做喜欢的事、见喜欢的人。由不同活动产生的感受表明，人们可以用另一种方法提高经验的质量：将消极休闲的时间用在其他事情上，例如将看电视转换为更为积极的休闲方式，包括社交和锻炼。以社会的角度来看，为劳动工人提供更好的交通条件，为职业女性提供照顾儿童的渠道以及为老人提供社交的机会等都是降低社会U指数的有效方法。即使是1%的降低也是显著的成就，因为这可以使人们避免成千上万个受苦的小时。将利用时间的全国性调查和经验自我的幸福感相结合可为社会政策提供多种参考。我们团队的经济学家艾伦·克鲁格（Alan Krueger）就是致力于将这种方法介绍给国家统计局的第一人。幸福的方法测量经验自我的幸福感已被普遍应用于美国、加拿大、欧洲等国的全国性测试中，盖洛普世界民意调查还将这种测试应用到了美国及150多个国家成千上万的受试者身上。这些民意调查使受试者回想起前一天所经历的情绪变化，尽管并没有昨日重现法那样详细。这个巨大的样本使得我们可以进行全面的分析，证实了情境因素、生理健康以及社会接触等对于经验自我幸福感的重要性。当然，头痛也会使人痛苦，而某人某天感受的第二个最佳参照点就是这个人是否与朋友和亲人接触。说快乐就是将时间用在你爱的人和爱你的人身上的确有一点儿夸张。盖洛普获得的数据使我们能对幸福的两方面进行对比：人们生活中经历的幸福。当人们评估自己的生活时作的判断。盖洛普的生活总体评价是通过名为坎特里尔自我定位奋斗量尺问题来实现的，具体如下：〖贼吧Ｚei8。Ｃom电子书下载：Zm 贼吧电子书〗请想象有一架阶梯，每级台阶都标有数字，最低一级是零，最高一级是10。最高的台阶代表你最美好的生活，最低的台阶代表你最糟糕的生活。此时此刻，你认为自己站在哪一级台阶上？比起生活经历，生活中的某些方面会对某个人对生活的估测产生更大的影响。教育程度就是一个例子。若某个人接受过更高的教育，那他对自己生活的评估也会更高，但这并不意味他的经验自我更幸福。的确，至少在美国，教育程度越高的人压力也会越大。另一方面，身体不健康对经验自我幸福的不利影响会比对生活方面的评估大很多。与孩子生活在一起也会给日常感受带来坏的影响，有报告表明，父母普遍感到压力与愤怒，但是这对生活评估的不利影响却不大。参与宗教活动对于积极情绪与压力都有有利影响，对生活评估的影响很大。然而，令人惊奇的是，宗教并不会让人们沮丧或担心的感受有所减少。钱可以买到快乐吗？这是人们最常问的关于幸福的问题。对45万名受试者回应的盖洛普海斯威斯幸福指数分析以及对1000名美国人的每日调查，为我们提供了惊人而又明确的答案。结论是贫穷使人悲惨，富有可能会提升某个人的生活满意度，但总体来说来却不能提高经验自我的幸福感。极度的贫穷会增强经验对生活中其他不幸经验的感受。这尤其体现在生病上，生病对于贫穷的人来说会比家道小康的人有更糟糕的感受。位于收入分配前三分之二的人中，因为头痛，原本19%说自己忧郁和担忧的个人会增长到38%。而在收入分配最后10%的穷人中忧郁和担心的人则会从38%增加到70%，其基线水平越高，增加的也越多。穷人与其他人的重大区别还体现在离婚和孤独的影响方面。另外，对穷人来说，周末对于经验自我的幸福的有利影响会比其他大多数人小得多。当某位住在高消费地区的人的家庭收入约为7.5万美元时（此收入标准在低消费地区相应减少），他的经验自我的幸福的满足水平就不会再提升。经验自我的幸福感也会随着收入增加，但超过那个标准后，也就不会再提升了。这令人惊奇，因为更高的收入无疑能使人们获得更多快乐，包括可以在有趣的地方度假、听歌剧、改善生活环境等。为什么这些增加的快乐没有在情绪经验的报告中显示出来呢？其合理的解释为，更高的收入会削弱人们享受生活中小乐趣的能力。有证据支持这个观点：向学生过早地灌输金钱观会影响他们在吃巧克力时的快乐感受！收入对经验自我的幸福感的影响和对生活满意度的影响有着明显的区别。我们得出的关于幸福的一般结论与结肠镜那个实验的结论一样清晰明了：人们对自己生活的评估与他们的真实体验可能有关，但也有不同。正如我几年前的想法一样，用生活满意度来衡量经验自我的幸福感并没有错。这完全是另外一回事。示例：幸福感“客观的政策可以减少人们的痛苦。我们以降低社会的U指数为目标，解决沮丧和极端贫穷是首要问题。”“增加幸福感的最简单方法是分配好你的时间。你能抽出更多时间做自己喜欢做的事情吗？”“如果你的收入超过了满意水平，你能够拥有更多使人愉快的经历，但你将会丧失一些享受小乐趣的能力。”第38章思考生活德国社会经济小组成员安德鲁·克拉克、埃德·迪耶内和雅尼斯·基尔格里斯每年都会询问同一群受试者有关生活满意度的问题，以及他们在前一年经历了什么大变动。小组成员对受试者的回答进行了分析，就是分析的一部分，是这些受试者在每一年回答对自己结婚期间的满意度情况。生活满意度：一个很难回答的问题肯定会使读者紧张地淡然一笑，这种紧张感也很容易理解：毕竟决定结婚的人不是希望婚姻能使他们更快乐，就是希望建立稳定长久的关系以维持自己目前的幸福状态。丹尼尔·吉尔伯特和蒂莫西·威尔逊引入了情感预测这个有用的名词。而对于许多人来说，作出结婚的决定就反映出了因情感预测而引起的重大错误。即使在结婚当天，新娘和新郎都知道离婚率很高，对婚姻失望的例子更是数不胜数，但是他们还是不相信自己也会这样。最令人惊讶的是人们在结婚后的生活满意度陡然下降。这个图被普遍认为是对人们适应过程的追踪记录，在这个适应过程中，由于婚姻生活的反复，人们起初感到的婚姻带来的快乐会很快消逝。然而，以另一种强调直观判断法的方法来追踪适应过程同样可行。我们想知道，当人们正在评估自己的生活时，他们的大脑有什么样的活动。“你对自己生活的整体满意程度如何”以及“最近你有多快乐”等问题并不像“你的电话号码是多少”这个问题那样简单。所有的受试者是怎样在短短几秒内回答这样的问题的呢？结论是：将此问题想成是另一个判断会有助于回答。对于其他问题来说也是如此，有些人可能已经有了现成的答案，这个答案是他们在另一种情况下评估自己的生活时得出的。还有些人，也可能是大多数人，在不能很快想到某个问题的确切答案时，会自动地将答案替换为更为简单的问题的答案。系统1参与到了这个过程当中。当我们以这个观点来看图时，其意义就会有所不同。许多简单问题的答案都能由对生活的总体评估替换。你一定还记得这项研究：刚回答过在前一个月有多少次约会的学生在回答他们“最近的快乐程度”时，就会将约会当做他们生活中唯一重要的因素。在另一个基于同样目的的著名实验里，诺伯特。施瓦茨和他的同事邀请了一些受试者来到实验室，并请他们完成一份关于生活满意度的问卷调查。然而，在他们开始调查之前，施瓦茨请受试者们为他复印了一张纸。其中，有一半的受试者会发现复印机上有一个一角的硬币（是实验者预先放在那儿的）。即使是这样小小的幸运却极大地提高了受试者对于他们生活整体满意度的评估。心情启发式是回答生活满意度的一种方式。与约会有关的调查和机器上有硬币的实验表明了我们应该对关于总体幸福度问题的回答持保留态度。当然，当别人要求你评估自己的生活时，你的大脑并不是只有当前这一种情绪。你很可能会想到最近刚发生或即将要发生的重要事件；会想到反复担心的问题，比如爱人的健康或是经常与你儿子在一起的那些坏伙伴；还会想到重大的成就和使你痛苦的失败。你可能会想到几个与总体幸福度这个问题相关的观点，但多数其他观点你还是想不到的。即使你快速得到的关于自己生活幸福感的评分不会受与之完全无关的事情（例如机器上的硬币）的影响，此评分还是会取决于少数极易想到的观点，而并非取决于对你生活中所有领域的仔细衡量。刚结婚或马上要结婚的人当被问到对生活的整体评价时，很有可能就会联想到结婚这件事。在美国，绝大部分婚姻都是出于自愿的，几乎所有人在想到自己的婚姻或即将开始的婚姻时都会感到高兴。所以这个问题的关键就是注意力。我们可以从图中看出当人们被问到自己的生活时，他们想到最近或即将到来的婚姻生活的可能性。这个想法肯定会随时间的流逝而越来越不受重视，因为其新鲜感会有所消退。人们在结婚前后一两年的生活满意度都非常高。然而，如果这种明显的涨幅反映了回答问题时启发式的时间过程，我们从中得到的关于幸福或是对婚姻适应过程的信息就会很少。我们不能由此推断出为何幸福感会在几年内提升但又逐渐下降的趋势。即使是那些在被问到关于他们生活的问题时就会想到婚姻、就会快乐的人在其他时候也未必会感到很快乐。除非他们常想到自己幸福的婚姻，否则婚姻的幸福与否并不能直接影响到他们整体上的幸福感。即使是那些足够幸运，能完全处于享受幸福婚姻状态的新婚夫妇最终也会回归到现实中，他们体验到的幸福感也会像其他人一样，再次依赖于当前自己身处的环境和参与的事情。在对昨日重现法的研究过程中，有伴侣的女性和无伴侣女性的经验自我的幸福感在大体上并没有不同。这两类女性对时间的分配可以解释这一发现。有伴侣的女性很少独自一人，和朋友在一起的时间也很少。她们会花更多的时间在美妙的性生活上，也会花很多时间做家务或照顾孩子，这些事当然是人们不想做的。当然，对于一部分已婚女性来说，长时间和丈夫在一起会更快乐，而另一部分女性却不这么认为。平均来说，经验自我的幸福感不受婚姻的影响，原因并不是婚姻不能影响幸福感，而是其对于生活某些方面的影响对一些人来说是积极的，而对于另一些人来说却是消极的。经验自我的幸福感和生活满意度在总体上取决于性情的遗传，这也是个人生活环境与其生活满意度相关性低的原因之一。体验幸福的性情像身高和智力那样，是可遗传的，对出生之后就分开的双胞胎进行的实验就证明了这一点。那些似乎是同样幸运的人却对幸福感的体验有很大差别。在某些情况下，例如由于平衡效应的影响，婚姻与幸福感的相关性低。这是因为，同样的情况对一些人来说是好事，对另一些人来说却是坏事，新的环境对人的影响也是有利有弊。在其他情况下，比如高收入对生活满意度的影响普遍都是积极的，但某些人可能会更在意钱，事情也会因此而变得复杂。有人出于另一个目的，对高等教育的影响进行了大规模的研究，其研究结果显示了年轻人设定目标对其终身的影响。这些数据是由1995~1997年对近12000人做的调查问卷得来的，这些受试者都在1976年进入名牌大学读书，在十七八岁时填写了一份关于过上“富裕”生活重要性的调查问卷，从“不重要”到“必不可少”共有4个等级可供选择。他们在20年后又填写了一份调查问卷，其中涉及了他们在1995年的收入水平和对自己生活满意度的总体评价。目标不同，结果也会有很大的不同。在写下抱负的19年后，许多希望能有高收入的人都实现了这个愿望。例如，在597位心理学家和其他医学专家的样本中，他们对金钱重要性的观点每升高一个层次，工资收入就都会增加14000美元（1995年时的美元价值）！不工作的已婚女性也有可能实现她们对金钱的渴望。对于这些女性来说，她们对金钱的渴望每升高一个级别，就会增加12000美元的家庭收入，这些钱显然是由她们的丈夫赚的。人们在18岁时对钱看重的程度同样也预示着他们在成年以后对自己收入的满意程度。我们比较了高收入人群（收入超过20万美元）和低收入人群（少于5万美元）的生活满意度。对于那些认为有钱很重要的人来说，收入对生活满意度的影响更大（总分为5，其影响为0.57分）；而对那些认为钱不重要的人来说，收入对其生活满意度的影响则只有0.12分。相对于普通人来说，想要且能得到钱的人对生活明显更为满意；想要却没有钱的人则对生活更为不满。同样的原则也适用于其他目标，对生活不满的成年人，解决这个问题的一个方法就是设定非常难以实现的目标。在20年后对这些受试者生活满意度的调查表明，年轻人最难以实现的目标是“在表演艺术方面功成名就”。年轻人的目标会影响他们将要经历的事、他们的未来，以及对生活的满意程度。在一定程度上，这些发现改变了我对于幸福的看法。人们为自己设定的目标对于他们要做什么，以及对只关注经验自我的幸福感是难以维持的这一事实的感受都极为重要。幸福不是忽略人们想要得到的。此外，说幸福是忽略自己活着的真实感受而只关注自己对生活的想法也是不成立的。我们必须接受幸福是各个方面的综合体的观点，必须把记忆自我和经验自我的感受都考虑在内。被放大了的幸福错觉受试者在评估自己的生活时，并没有仔细思考。这个看法是由受试者回答问题的速度以及他们受当前情绪的影响程度推测出来的。他们肯定会使用启发法（替换和眼见即为事实的例子）。尽管受试者关于生活的看法会受到有关约会的问题或是放在复印机上的硬币的影响，但他们并没有忘记生活不仅仅是约会或走运。幸福的概念并不会随着突然发现一枚硬币而发生改变，但是系统1常会作为生活的一部分替代整个生活。人们所关注的生活的任意方面会在整体评估中被放大。这就是聚焦错觉的实质，下面的这个句子可以描述这一点：在你思索某件事时，这件事就不会像你想的那样重要了。这个概念源自一场关于从加州搬到普林斯顿的家庭辩论。在这场辩论中，我的妻子说加州的人比东海岸的人幸福。我反驳道，气候肯定不是决定幸福的重要因素，斯堪的纳维亚人可能是世界上最幸福的人。我还注意到永久的生活环境对幸福的影响也很小，但是我还是没能说服我的妻子，她依然相信加州人更幸福，这是一种情感预测的错误。不久之后，我参与了一个关于全球变暖的社会科学的研讨会，而那个家庭辩论的话题依然在我的脑海中徘徊。研讨会上，一个同事根据他对下个世纪地球人口幸福度的观点提出了自己的看法。我反驳道，预测在一个更温暖的行星生活是何种情形是荒谬的，因为我们甚至不知道住在加州的感觉会如何。交流不久后，我和我的同事戴维·施卡德（David Schkade）得到了一笔研究资金，主要研究两个问题：住在加州的人比其他地方的人更快乐吗？人们普遍认为加州人相对快乐的程度如何？我们召集了许多来自加州、俄亥俄州和密歇根州的学生，组成了一个大的样本。在其中一些学生的帮助下，我们得到了关于他们生活各个方面满意程度的详细报告。通过另一些学生，我们得到了关于某个“与你有同样兴趣和价值观”但却住在别处的人会怎样完成同样的调查问卷的预测。分析了数据以后，我显然赢得了那场家庭辩论。正如预期的那样，两个地区的学生对天气的态度是不同的：加州人很享受当地的气候，而中西部人却厌恶当地的气候。然而，气候并不是决定幸福感的重要因素，甚至加州学生与中西部学生的生活满意度也根本没有任何不同。我们还发现，我的妻子并不是唯一一个认为加州人更为幸福的人。两个地区的学生都犯了和我妻子同样的错误，我们还能追溯到此错误的根源，即他们都夸大了气候的重要性。我们将这种错误称为聚焦错觉。聚焦错觉的本质是眼见即为事实，就上面例子来看，即是对气候给予过多的权重，却忽略了其他影响幸福的因素。为了理解这种错觉强大的影响力，请花几秒钟思考下面的问题：你从自己的车上能得到多大快乐？你能立刻得到答案，因为你知道自己有多喜爱和欣赏自己的车。你将其替换成了另一个不同的问题：“你在什么时候能从车中得到快乐？”这个问题的答案可能会令你惊奇，但也是简单直接的：当你考虑到自己的车时，你就能从车中得到快乐（或不快）。当然，你也不会常想到自己的车。正常情况下，你平时开车时是不会花很多时间思考自己的车的，你会想一些其他的事情，而你的心情也由你所想的事决定。当你尝试评估自己有多喜爱车时，你实际上回答的是另一个更为具体的问题：“当你考虑自己的车时，你能从车中得到多少快乐？”这个替换导致你忽略了自己很少想起车的事实，这是过程忽视的一种形式。其结果就是聚焦忽略。如果你喜欢自己的车，你就有可能夸大从其中得到的快乐，这会使你在想到当前这辆车的优点或是考虑是否要买辆新车时出现错觉。类似的偏见使得人们对加州人幸福感的判断发生了偏差。当被问到加州人的幸福感时，你可能会想到加州比较特别的活动，例如夏天可以爬山，或是羡慕那里冬天气候温和。但事实上，加州人很少参与那些活动。不仅如此，加州的常驻居民在对自己的生活进行总体评估时，根本没怎么想到气候这个问题。如果你一生都住在加州，而且不怎么去旅游的话，那么加州就像自己的10根脚趾一样，会觉得它们很重要，但却不会时常想到它们。如果生活中任意一方面的想法有很强的可替代性的话，此方面就更有可能被凸显出来。而搬到加州的人则会有不同的回应。假设某个企业的核心人员搬到了加州，想从这宜人的气候中得到快乐。搬家后的几年内，当问他对自己生活的满意度时，他可能会想到这次搬家，进而会对比搬家前后两州的气候。对比的结果肯定是加州更胜一筹，而对于生活中气候这一方面的关注就会使他对自己真实经验的权重发生偏差。无论这个人在搬家后是否真的更快乐，他都会说自己感到更快乐了，因为关于气候的想法导致他相信自己更快乐。聚焦错觉能使人们对自己当前的幸福状态、他人的幸福感以及自己未来的幸福感判断错误。半身瘫痪的人一天中有多长时间情绪低落？这个问题肯定会让你想到某位半身瘫痪的人正在思考自己的身体状况。在这个瘫痪者发生事故后的前几天里，你的这个猜想很可能还是正确的。但是随着时间的流逝，瘫痪者会开始慢慢习惯，对自己身体状况的注意力就会转移到其他新的情况上去（只有少数例子除外），最主要的例外情况包括长时间的疼痛、持续处于吵闹声中以及严重的抑郁。疼痛和吵闹声是吸引注意力的生理信号，抑郁则会使难受的想法不断强化。因此，对于类似情况，人们是不可能完全适应的。半身瘫痪者也并不例外：观测表明，半身瘫痪者在事故发生的一个月内心情大都是相当好的。尽管当他们想到自己的境况时，也肯定会感到悲伤。然而，在大多数时候，这些半身瘫痪者工作、阅读、看笑话、交朋友，在报纸上读到政治新闻时同样也会生气。当他们参与到任意一项活动中时，与其他人并没有多大的差别，我们也可以说，半身瘫痪者的幸福感在大多数时候都是接近于正常水平的。想要适应一个新的环境，无论这个环境是好还是坏，在很大程度上取决于慢慢地不去想这个环境。从这个意义上来看，生活的长期状况（包括半身瘫痪和婚姻）只在部分时间会对人们的状态产生影响，即当人们关注于这些状况的时候。在普林斯顿大学教书有个好处，即能带聪明的学生完成研究论文。其中，指导波特鲁利亚·科恩（Beruria Cohn）的论文就给我留下了深刻的印象。她的论文数据来自于某家调查公司，这家公司请受试者估测了半身瘫痪者处于坏心情的时间比例，科恩收集并分析了得来的数据。她将受试者分成两组：第一组被告之导致患者瘫痪的事故发生在一个月前，另一组被告知事故发生在一年前。另外，每一个受试者都需要说明自己是否认识半身瘫痪的人。从这一点出发，她又将受试者分成两个组。这两个组对半身瘫痪不久的人的判断非常接近：认识瘫痪者的受试者估测他们有75%的时间处于负面情绪中；需要靠想象才知道瘫痪者是何状况的受试者的估测值是70%。相较而言，这两组受试者对事故一年后瘫痪者情绪的估测则大不相同：认识瘫痪者的人认为他们有41%的时间处于负面情绪中；现实生活中不认识半身瘫痪者的受试者的平均估测值则为68%。很明显，那些认识瘫痪者的人观察到瘫痪者对自己境况的注意力会逐渐转移，而那些不认识瘫痪者的人就不能预测到这种适应性的发生。判断某人赢得彩票一个月后和一年后的心情也是这样的模式。我们能够预测出，对于那些半身瘫痪者以及有慢性病且难以负荷身体状况折磨的人来说，他们的生活满意度与幸福感关系并不大，因为在要求他们评估自己的生活时，不可避免地会使他们想到其他人的生活以及自己曾经的生活状态。最近关于结肠造口术病人的研究结果也与这个看法一致。此研究结果表明，病人的幸福感与他们对自己生活的评估有着极大的不同。在经验样本中，并没有发现这些病人的幸福感与健康人有何不同。但结肠造口术病人却想要以自己几年的生命换取健康的身体。而没有得结肠造口的人会认为自己若得了这种病情况会很糟糕，因此他们宁愿失去几年的寿命也不愿再次做这个手术。这个时候，记忆自我似乎是受到了聚焦错觉的支配，而聚焦错觉则将焦点放在了经验自我忍受的痛苦上。丹尼尔·吉尔伯特和蒂莫西·威尔逊引入了错误想法（miswanting）这个词组来描述因情感预测的错误而导致不佳决策的这种情况。这个词组理应成为我们的日常用语。聚焦错觉（丹尼尔·吉尔伯特和蒂莫西·威尔逊称之为过度聚焦）是产生错误想法的主要原因。值得注意的是，错误想法会导致我们易于夸大购买大件商品或变换环境对我们未来幸福感的影响力。请比较两个会使你的生活某些方面发生改变的决定：买一辆舒适的新车和加入每周都有聚会的小组，有可能是扑克小组或是读书小组。这两种经历在开始时都是新鲜且令人兴奋的体验。其主要的不同在于，买了车后，你对它就会越来越不关注；但加入小组却能常参加社交活动，当然前提是你愿意常去。由于眼见即为事实的关系，你可能会夸大汽车的价值，但不太可能在社交活动或其他需要注意力的活动方面犯同样的错误，这样的活动有打网球或学习拉大提琴等。聚焦错觉会产生一种偏见，这种偏见会导致人们更加看好本身就能令人兴奋的事物或经历，即使这些事物或经历最终也会失去吸引力。人们忽视了时间，致使维持人们长久的注意力价值的经验很少受到关注，至少比这种经验应得到的关注要少。千万不要忽略时间的作用本书中不断重复时间的重要性。将经验自我的生活描述为一系列有价值的时刻是符合逻辑的。某个生活阶段的价值（我曾称其为快乐总量）就是这一阶段所有价值的总和。不过，这不是大脑呈现各个阶段的方法。我曾提到过，记忆自我同样也会讲故事和作出选择，而且它讲的故事和作出的选择都不能恰当地表示时间。在讲故事时，一些关键的时刻，特别是开始、高潮和结尾，代表了整个生活阶段，过程因此就被忽略掉了。在冰手试验和薇奥莉塔的故事中，我们可以看到将注意力完全集中在某一特定时刻的情形。我们在前景理论中看到了另一种不同形式的过程忽视，在这种过程忽视中，状态由其过渡状态所代表。彩票中奖会创造一种新的财富状态，此状态能持续一段时间，但决策效用会随着对彩票中奖这则消息的反应强度的改变而改变。人们忽略了对注意力的减退以及对新状态的适应，只注意到了短暂的时间片段。在对慢性疾病的预测以及聚焦错觉的过程中，都有同样的对过渡到新状态的关注、时间忽略和适应性。人们在聚焦错觉中犯的错误包括关注选定的时刻，忽略其他片段发生的事。大脑善于处理故事，但却似乎不能很好地处理时间。在过去的10年里，我们了解了许多关于幸福的新发现的事实。我们也明白了，幸福这个词并不只有一个简单的含义，我们也不该将其简单地随意使用。有时，科学的进步会使我们更加困惑。示例：生活的思考“她认为买一辆豪车会使自己更为快乐，但这其实是个情感预测错误。”“今天早上，他的车在上班途中坏掉了，因此，他的心情非常糟糕。今天并不适合问他关于工作满意度的问题。”“她平时看起来都很开心，但当我们问她是否快乐时，她说自己并不快乐。这个问题肯定使她想到了自己最近离婚这件事。”“买一座更大的房子可能不会使我们永远感到快乐。我们可能会因为犯聚焦错觉的错误而遭殃。”“他选择了在两座城市间之间奔波往返。这可能是一个错误想法的典型例子。”结语我在本书的开头引入了两个虚拟的人物，随后讨论了人类的两种存在形式，最后又介绍了两种自我。两个虚拟人物分别是运用直觉、进行快速思考的系统1和需付出努力、运行更慢的系统2。系统2进行的是慢思考，能监督系统1的运作，并在其自身有限的能力下尽可能地占据控制地位。两个物种分别是活在理论世界的虚拟经济人以及活在现实世界的人类。两个自我指的是感受当下的经验自我以及记录并作出选择的记忆自我。最后一章是对这三组概念的某些应用，我将逆序进行讲解。两个自我记忆自我与经验自我相抗争的可能性问题比我最初想象的更加复杂。在早期的冰手实验中，过程忽视和峰终定律的结合会使人们作出明显荒谬的选择。为什么人们愿意承受没有必要的痛苦呢？这是受试者的记忆自我作出的选择，更愿意去回忆那些给他们留下更好记忆的体验，尽管这些选择会使自己承受更多的痛苦。或许在一些极端例子中，以记忆的质量为标准进行选择是恰当的。例如，创伤后产生压力是有可能发生的，但手冰凉的体验并不是一种创伤。客观的旁观者在为别人作选择时，肯定会选择受创期短的那一个，会更加考虑别人经验自我的感受。但人们为自己作的选择，有一半都可被认为是错误的。在像茶花女的歌剧和对简的生活判断的故事中，过程忽视和峰终定律都经不起推敲。以某个生命的最后时刻来评估整个生命，或在判断哪种生命更为理想时，完全忽略其过程都是没有道理的。记忆自我是系统2的一部分。系统2评估生活中某些情节及生活本身的方法有着显著的特点，这些特点也是我们记忆的特征。由系统1产生的过程忽视和峰终定律并不一定与系统2的评判标准相符合。我们相信过程是重要的，但记忆却告诉我们，过程并不一定重要。规定评估过去事件的原则对决策制定不能起到很好的导向作用，因为时间在其中也起了重要作用。人类的存在有一个核心的事实，即时间最终还是有限的资源，但人类的记忆自我却忽略了这个事实。比起细水长流的幸福来说，人们更偏好享受短暂却强烈的快乐。这种偏见是由结合了峰终定律的过程忽视造成的。与这种偏见相反，另一种偏见使我们更为害怕短期、强烈的疼痛，而对于长时间但较轻微的疼痛却更容易接受。过程忽视还使我们容易接受长期但轻微的不愉快，因为其结局会更好；若某件事的结局不好，即使其过程是长期且快乐的，我们也会忽略掉。以同样的观点来看待不适，请考虑这个普遍的警告，“不要这样做，否则你会后悔的”，这个建议听起来很明智，因为其所能预见的后悔出自于记忆自我的判断，我们也倾向于将这个判断看做是最终结论。然而，我们不应该忘记，记忆自我的观点不总是正确的。一个测量快乐的客观观察者会更注重经验自我，会提供不同的建议。记忆自我对过程的忽略、对峰终和结局的重要性的夸大，以及对后见之明的怀疑共同作用，歪曲地反映着我们真实的体验。相反，对过程加权的幸福观使我们将生活中的所有时刻都看做是相似的，其将生命中所有时刻都分为值得纪念或不值得纪念两种。有些时刻最终会比其他时刻得到更多的权重，并不是因为它们值得纪念或是很重要。人们花在思考某个值得纪念的时刻的时间应被考虑在内，增加这个时刻的权重。通过改变某个时刻之后时刻的经验也能增强这个时刻的重要性。例如，练习拉一个小时的小提琴可能会增强多个小时的演奏经验或几年后听音乐的鉴赏能力。同样，引起创伤后应激障碍（PTSD）的短暂且可怕的事件应该通过其引起的长时间的痛苦来权衡。从过程加权的角度来看，我们只能在事情发生后才能决定某个时刻是值得纪念的还是毫无意义的。“我会一直记得……”或“这是一个意义非凡的时刻”的说法可以被看做是承诺或是预测，但即使我们在说这些话时是百分之百真诚的，我们还是常常无法实现这些承诺或正确进行预测。我敢打赌，10年后，许多我们曾经说过想要一直记住的事都会被忘记。过程权重的逻辑具有强迫性，但我们并不能将其视为关于幸福的完整理论，因为人们只认同记忆自我，而且只关心自己的故事。忽略了人们想要的关于幸福的理论是站不住脚的。另外，忽略了真实发生的事并只关注于人们对自己生活的想法的理论同样也站不住脚。我们必须将记忆自我和经验自我都考虑在内，因为它们对生活的诠释不总是一致的。哲学家可能会长时间在这些问题上纠结。对于这两个自我哪一个更重要的问题，并不是只有哲学家才需要考虑的。这个问题对于某些领域的政策问题都有一定的影响，特别是医药和福利领域。请考虑对治疗不同的病应该作的投资，包括失明、耳聋和肾衰竭。这些投资应该受人们对这些疾病的恐惧程度的影响，还是该受病人真实的痛苦体验的刺激？是受病人想要恢复健康的愿望的强烈程度还是病人为了健康而愿意付出代价的大小来决定？关于失明和耳聋，或结肠造口术和透析的投资意愿强度，可能会因为对痛苦严重程度评估方法的不同而有所不同。当前对此问题还没有简单的解决办法，但这个问题却非常重要，不容忽视。最近，用对幸福的测量来引导政府决策的可能得到了包括学者和欧洲几个政府机构在内的关注。将来，社会痛苦总量指数可能会和失业、残疾和收入指数一起包含在国家统计数据中。比起几年前，这个想法在现在看来还是有可能实现的。这个项目已经取得了一定的进展。经济人和人类如果我们能与某个人进行理性讨论，此人的信念能顺应现实，而且他的倾向也与其兴趣和价值观相符合，我们就可以说这个人是通情达理的。在说到理性这个词时，人们往往会想到审慎、深思熟虑且缺少热情的人物形象，但在日常用语中，一个理性的人肯定是通情达理的。但对于经济学家和决策理论家来说，“理性”这个形容词有着完全不同的意义。判断某个人是否理性的唯一标准并非是看这个人的信念或是偏好是否合理，而是看它们是否一致。一个理性的人可以相信鬼，只要他的其他信念也与世界上有鬼存在这个信念相一致。一个理性的人可以有好恶，但他的偏好要前后一致。理性指的是逻辑上的一致，即合理与否。根据这个定义，经济人就是理性的，但有很多证据表明，人类并不理性。经济人不会受启发式、眼见即为事实、窄框架、内部意见或偏好逆转的影响，但人类却无法避免这些影响。将理性定义为一致性是会受到限制的。理性要求人们遵守逻辑原则，但我们有限的大脑却不能够实现这一点。从这个定义来看，通情达理的人并不一定就是理性的人，但也不能因此就被认为是非理性的。“非理性”是一个较重的词，包含了冲动、感情用事以及对合理辩护的顽强抵抗等含义。当我与阿莫斯的研究成果被认为证明了人类的选择是非理性的时候，我总想要退缩。因为事实上，我们的研究仅仅表明了人类不应该被描述为处于理性代理模式中。尽管人类不是非理性的，人类仍然时常需要帮助才能作出更准确的判断和更好的决策。有时，相应的政策和机构就能够提供这种帮助。这样说虽然没什么不对，但实际上却颇具争议。正如比较权威的芝加哥学院派解读的那样，对人类理性的信心和防止人们作出错误选择是没必要甚至不道德的这一观念联系紧密。理性的人应该是自由的，他们应该为自己的选择负责。米尔顿·弗里德曼是芝加哥学院派的主要代表人物，其主要观点在他的一本畅销书的标题上得到了体现，《自由选择》（Free to Choose）。经济人是理性的这一设想为用自由主义的方法制定公共政策的观点提供了思想基础：不要干涉个人选择的权利，除非这些选择对他人有害。将物品分配给愿意付钱最多的人是市场效率的体现，对市场效率的赞叹是对自由主义政策的支持。有一篇《理性成瘾理论》支持芝加哥学院派的这一观点，它解释了对强烈且即时满足有极度偏好的理性代理人会做出理性的决策，把对未来的沉迷当做一个结果。加里·贝克尔是这篇文章的作者之一，也是芝加哥学院派中的一个诺贝尔奖获得者。他曾以轻松但不失严肃的口吻说过，我们应该考虑通过某种信念，即人们能很快找到治愈糖尿病的方法，来解释所谓的肥胖流行病的病因。他提出了一个有价值的观点：当我们观察那些行为看似怪异的人时，应该考虑到一种可能，他们这样做有合理的理由。只有当理由变得不合理时，才会引发心理学上的解释。其中，贝克尔对于肥胖症的解释可能就是不合理的。在经济人的国度里，政府应该让经济人在对他人不造成危害的前提下自己作选择，不横加干涉。如果骑摩托车的人选择不戴头盔，那么自由主义者就会认为这是他的权利，并支持他这么做。无论是决定不存养老金还是选择吸食毒品，公民们都知道自己正在做什么。不过，往往难以界定这种情况：没有存够养老金的老年人并不会比在餐厅吃完大餐后抱怨价格太高的人得到更多怜悯。因此，在芝加哥学院派与行为经济学家的辩论中，有许多理论都是相互矛盾的。行为经济学家抵制极端的理性代理人模式。辩论的所有参与者都认为自由不是争辩而来的价值。但是相比人类理性的真正信徒，生活对于行为经济学家来说更加复杂。没有行为经济学家会赞同强迫市民均衡膳食，以及只看有益电视节目的规定。然而，对于行为经济学家来说，自由是需要付出代价的，做了不明智决策的个人以及认为有义务帮助这些人的社会都需要付出代价。因此，该不该帮助个人避免错误的决策就成为了行为经济学家的两难。芝加哥学院派的经济学家们不存在这个问题，因为理性代理人不会犯错。对于这个学派的人来说，自由是免费的。在2008年，经济学家理查德·泰勒和法学家卡斯·桑斯坦合著了《助推》。这本书很快成为了全球畅销书，还被视为行为经济学的《圣经》。书中引入了几个新的词语，包括经济人和人类，还提出了一系列方案来解决在不剥夺人们自由的前提下帮助人们做出良策的难题。泰勒和桑斯坦主张自由家长制的做法，即允许国家和其他机构“推动”人们做决策，并使这些决策服务于该国或该机构的长远利益。将参与养老金计划指定为默认选项就是助推的一个例子。不可否认，人们会因为不自觉地加入了这个计划而觉得自己的自由少了，因为他们在当初填表时，只需确认一个复选框，就可以退出这个计划。在之前已经提过，个人决策的框架（泰勒和桑斯坦将其称为选择架构）对结果有着巨大的影响。助推基于坚实的心理学，我在之前已阐述过。默认选项自然而然地被认为是普通选项。而偏离普通选项是一种委任的行为，需要考虑更多，承担更多的责任，比什么都不做更有可能让人后悔。如果某个人不确定该怎么做时，就会有强大的助推力来引导这个人做出决策。与经济人相比，人类同样需要保护，以免受那些蓄意利用他们弱点的人的危害，特别是系统1的怪异模式以及系统2懒惰的弱点。理性代理人被认为能谨慎地作重要的决定，并充分利用知道的已有信息。经济人会在签署一份合约之前，阅读并理解所有条文，但是人类通常不那样做。某家不道德的公司设计出的合约在显而易见的地方隐藏着重要的信息，这些信息能使公司在法律范围内有回旋的余地，但人们不经阅读就签下了合约。对理性代理人模式有害的极端解读是：除了确保相关信息公开外，顾客被假定为不需要保护，合约中字体的大小和语言的复杂程度不被认为是相关信息，但是一个经济人知道如何处理小字体的信息。《助推》这本书给出的建议是要求公司提供足够简单的合约以供人类客户阅读和理解。因为顾客得到了更详细的信息，这可能使一些公司的利益受到损害，因此，一些建议遭到了这些公司的强烈反对，但这是一个好的迹象。公司通过提供更好的产品来提高竞争力要比公司独自赢利更为可取。因此，通过提供好产品来提高竞争力的公司更受到人们的青睐，也就是说更受青睐的公司往往是提供的信息不明确的公司。自由家长制的显著特点是其在广泛的政治方面的吸引力。行为政策的绝佳例子是“为明天储蓄更多”计划，这是由国会中的极端保守主义者和自由主义者联合提出的议案，而这两者的联合并不常见。“为明天储蓄更多”是公司为其员工提供的养老金计划。签了这份合约的员工在加薪时增加一定的存储比率，这样，员工就能为储蓄计划贡献得更多。储蓄率随工资的上涨而自动上升，直至员工注意到存得太多，进而选择退出该计划。现在，这个由泰勒和桑斯坦于2003年提出的伟大革新使储蓄率有了一定的提高，也使成千上万工人的前景更加光明。这个计划有坚实的心理学理论作为基础，本书的读者们对这些理论知识肯定都有所了解了。此计划通过要求非立即改变或尝试来提高存储以支付工资的方法避免了直接损失，将损失转变成了未得收益（foregone gains），也就更容易使人接受。另外，其自动性的特点还将系统2的懒惰与工人的长远利益结合在了一起。当然，所有这些特点都没有强迫任何人做任何他们不想做的事，也不含任何误导或欺诈。自由家长制在许多国家都得到了认可，包括英国、韩国，还得到了很多政党的认可，包括英国托利党以及奥巴马政府等。的确，英国政府成立了一个新的小部门，这个部门的任务就是将行为科学原则用于帮助政府实现目标。这个部门的正式名称叫做“行为研究小组”，但是，无论是政府内部的人还是政府外部的人，都将这个小组简单地称为“助推小组”。泰勒是这个小组的顾问之一。继《助推》一书之后的一本书中，奥巴马总统邀请了桑斯坦在政府信息与规制事务办公室任职。这个职位为桑斯坦提供了很多将心理学和行为经济学的课程应用于政府机构的机会。这个任务在管理与政府预算办公室在2010年所作的报告中有所描述。本书的读者应该可以理解一些特定提议背后的逻辑，包括鼓励“清晰、简单、显著及有意义的披露”。读者还需读懂背景陈述“描述非常重要，例如，如果某个可能的结果被构架成一种损失，这种结果会比构架成收益有更大的影响”。关于助推的例子有很多，比如之前已经提过的关于耗油量公开信息的框架规则，而其他方面的应用还包括自动参加健康保险，用新的膳食指南代替令人费解的膳食宝塔（新的膳食指南是由一个盛满营养均衡的食物的盘子所表示），以及美国农业部门（USDA）所指定的规则，即允许在肉制品标签上写上类似“90%无脂肪”等信息，而“10%的脂肪”也可以说成“接近于瘦肉率颜色的表述方法，即描述出与同脂肪率的肉相同的色泽、大小及种类”。与经济人不同的是，人类需要帮助才能作出好的决定，且这种帮助可以通过告知或不介入的方式得以实现。两个系统本书将大脑的运作描述成了两个虚拟人物不稳定的相互作用，这两个虚拟人物就是自动的系统1以及需要付出努力的系统2。现在，你对这两个系统的个性已经相当熟悉了，也能够预测他们在不同情境下可能的回应方式。当然，你也知道这两个系统并不是真正存在于大脑或其他地方中。“系统1做了某事”是“某事自主发生”的简略说法。“系统2被动完成了Y”是“更兴奋，瞳孔扩散，注意力集中，Y活动开始进行”的简略说法。我希望你能和我一样，交谈时使用关于两个系统的语言，这样的话，交谈就会更方便，还能在不知两个系统存在与否的问题时凭直觉判断系统的运作方式。作出这些简要说明后，在后面的内容中，我会继续使用两个系统的说法。我们对自己的看法就是对系统2的看法。系统2会进行判断和选择，但它会认可系统1形成的观点和感觉，或将这些观点和感觉合理化。你可能没有意识到你对某个项目持乐观态度，只是因为此项目的领导使你想到了自己亲爱的姐姐。或是，你或许会厌恶和你的牙医长得像的人。如果你想寻求一个解释，就要搜寻记忆，寻找一些像样的理由，你最后肯定能找到一些。另外，你还会相信自己编造的故事。系统2不仅是系统1的辩护者，它也能避免许多愚蠢的想法和不当表达而引起的冲动。投入注意力能提升众多活动的表现（试想在思想混乱时在狭窄的路上开车的风险），对于一些任务来说，注意力的集中还是必要的，例如在进行比较、选择和推理时。然而，系统2并不是理性的模范，其能力以及能够掌握的信息都是有限的。我们在推理时，头脑不会总是很清醒，我们犯错也不全是因为突然想到的不恰当的直觉。通常，我们犯错是因为我们（系统2）无法再了解到更多的信息。我花了更多的时间来描述系统1，也用了很大篇幅描述我源于直觉判断和选择的错误。然而，相对的篇幅并不是评判直觉思考优劣的好指标。系统1是我们许多错误的原因，但也是我们许多正确做法的原因，而且我们也常做正确的事。我们的想法和行动通常由系统1指导，是当机立断的。系统1的一个优点就是储存在我们联想记忆中丰富而详细的世界：在这个世界里，人们能在不到一秒的时间内，从普通事件中区分出令人惊奇的事件；立即对自己所期望的事生成想法，并对令人惊奇之事和正在发生的事自动搜寻有因果关系的解释。记忆能记录我们一生中习得的技能，因而也会自主产生解决方法来应对不断出现的挑战（比如绕过路上的一块大石头走，避免让顾客挑出错误）。技能的习得要求有固定的环境、练习的机会，以及对自己想法和做法快速且明确的反馈。当这些条件都满足时，就能掌握技能了，且此后快速闪现在大脑中的直觉性判断和选择都会是正确的。这些都是系统1来完成的，也就是说这些是快速且自主发生的。有技能的行为是能快速有效地处理大量信息的能力。若挑战碰上了有技能的应对方法，这个应对方法就能被唤起。如果没有技能，又会发生什么呢？此时，系统2显然要介入，就如同回答“17乘以24等于？”这个问题，其结果肯定是确定的。但想要系统1对系统2的能力表现出吃惊，不介入进来却不太可能。系统1不会受能力的限制，在计算时不要求确切数值。在搜寻某问题答案时，它能自动生成对相关问题的回答，还可能会将所问问题的答案替换成很容易出现在头脑中的回答。在启发式的概念中，启发式的回答并不一定比原来的问题更简单或需要更少的努力，启发式的回答只是更容易想到，更快、更容易被发现而已。启发式的回答不是随意想出来的，它们“似乎”是正确的答案。不过，有时也错得离谱。系统1在处理信息时，可能会产生认知放松。当信息不可信时，系统1也不会生成警告信号。人们会快速且自信地进行直觉性回答，不管这些回答是否源于技能或启发式。系统2没有简单的方式来区分有技能的和启发式的回答。唯一的方式是放慢速度、自身构建出一个答案，这个答案可能不会被轻易接受，因为系统2比较懒惰。系统1的很多建议常常没有通过最基本的检验就得到了人们的支持，就像球拍和球的问题。这就是系统1得到“错误和偏见的起源”这个负面称号的原因。系统1的运行特征，包括眼见即为事实、强度匹配和联想一致性等，会产生可预测的偏见和认知错觉，比如锚定效应、回归平均值的预测、过度自信，以及许多其他错觉。对于偏见我们能做什么呢？我们如何提升判断和决策（这些判断和决策来自我们自身和那些我们为之服务也服务于我们的机构）的质量呢？从自身经验来谈，系统1的运行方式是不能教给别人的。我除了认为年龄会有些影响外，我们的直觉思考就像我之前对这些问题作的研究那样，包括过度自信、极端预测和计划失误的倾向。我只提升了对易犯错误的情境的识别能力，“这个数字会成为一种锚定……”，“如果问题被重新架构，决策会改变……”而我在识别别人错误的过程中，也取得了更多的进步。避免系统1出错的方法从原则上讲是很简单的：认识到你正处于的认知领域，放缓并要求系统2来加以强化。当再次碰到缪勒，莱耶错觉图时，你会怎么做？当你看到有箭头的线段指向不同的方向时，你会意识到现在你不能相信自己对长度的直觉。不过，这种明智的过程在最需要的时候不会被应用到生活中。我们都希望在自己要犯错时能有个铃声提醒自己，但这是不可能的，认知错觉比感知错觉更难以识别。理性的声音也许比错误的直觉响亮又清晰的声音更微弱。当你面临着重大决策的压力时，质疑自己的直觉会让你感到不愉快。当你处于麻烦中时，最不愿意看到的就是有更多的质疑。这样的结果就是，相比自己要犯错时，你在观察别人是否要犯错时，能更容易辨认出雷区。观察者会比实施者在认知上更为放松，更愿意接收信息。我写本书的一个原因就是指导批评家和传闲言碎语的人，而不是指导决策制定者。机构要比个人更容易犯规避错误，因为机构的人多，自然就会思考得很慢，也更有能力按规则行事。机构可以制定和有效使用检查表，还可以深入开展，比如参考类别的预测以及“事前验尸”练习。机构能够鼓励其成员形成一种在靠近雷区时互相留意和提醒的文化，而这种文化的形成一部分是通过为其成员提供一些独特的词汇。无论机构是干什么的，都涉及判断和制定决策，就像是工厂生产产品，每个工厂都应该有保障其产品在最初设计、装配及最后检查时的质量的方法。决策产生的相关阶段包括解决框架问题、收集引导决策的相关信息、反馈以及检查。想要提高其决策质量的机构应该经常在每一个阶段里搜寻可提高效率的环节。这个运作的概念是有规律的。持续的质量控制通常是在危机产生后机构采取的对过程的全面回顾。其中一个例子就是明显缺乏主持高效会议必要技能的系统训练。基本上，更为丰富的语言对于建设性批评来说是必不可少的技能。与医疗相似，辨别判断性错误就像是在诊断病人，需要一些精确的词汇。从某种疾病的名字中，我们希望得到所有关于这一疾病的信息，包括其易感染性、环境因素、症状、预断及治疗等。与其相似的是，如“锚定效应，”“窄框架”、“过度一致性”也能使我们想到关于某个偏见的所有信息，包括其原因、影响以及我们能对其做些什么。在办公室饮水机旁的闲谈与决策有直接的联系：闲谈越多，所做的决策就可能更好。有时，决策制定者能听到大家当时传的闲言碎语和批评，这比听自己内心疑虑更容易。当他们相信批评自己决策的人经验丰富且公平正直，或当他们希望自己的决策能通过制定的方式而不是结果来评判的话，就会做出更好的决策。附录A 不确定性下的判断：启发法和偏见（本文首次刊登于1974年的《科学》杂志上，第185卷。美国国防部高级研究计划局为此项研究提供了支持，海军研究办公室也与位于尤金的俄勒冈研究院签订了合约，监督该研究。另外，该研究还得到了位于以色列耶路撒冷的希伯来大学研究与开发部门的支持。）我们所做的许多决策都是基于对不确定事件概率的信念，这些不确定事件包括选举结果、被告的内疚感或是美元的未来价值。这些信念通常被表述为“我想……”“概率是……”“它是不可能的……”等。对于不肯定事件的信念有时还能以概率或主观概率等数字形式表现出来。那么，是什么决定了人们的信念？人们又是怎样评估不确定事件的概率和不确定数量的价值呢？本文将会告知你们，人们依赖于数量有限的启发式原则，而这些原则能将测量概率以及预测价值的任务简化，使其成为更为简单的判断过程。总的来说，这些启发法相当有用，但有时也会导致严重的、系统性的错误。对概率的主观评估与对距离或大小等物理量的主观测量相类似。这些判断都依赖于效度有限的数据，是根据启发式的规则进行的。例如，某物体的距离取决于其清晰程度。物体看上去越清楚，其距离就显得越近。这条规则有一定的效度，因为在任何给定的情境中，距离较远的物体都会比距离较近的物体更不清楚。然而，对这条规则的信赖会导致我们在测量距离的过程中产生系统性错误。特别是在能见度较低时，物体轮廓就会模糊，而其距离就常常会被高估。另一方面，在能见度较高时，物体轮廓就会清晰，其距离也就会被低估。因此，如果依赖于清晰度，将清晰度作为测量距离远近的标尺的话，就会导致普遍的偏见。这样的偏见在对概率直觉性的判断中也会出现。本文将描述三种应用于判断概率和预测价值的启发式，列出由这些启发式引起的偏见，并讨论这些偏见的实际应用和理论内涵。代表性人们考虑的许多概率问题都包含在以下某个类型当中：物体A属于类别B的概率是多少？事件A起源于过程B的概率是多少？过程B引起事件A的概率是多少？人们在回答这些问题时，会典型地依赖于代表性启发法，即通过用A来代表B，也就是通过比较B与A的相似程度来对概率进行评估。例如，如果A能高度代表B，人们就会认为A源自B的概率高。但如果A与B并不相似，人们就会认为A源自B的概率低。若想通过代表性对判断进行阐述，请考虑下面这个情况，若有某个人被他原来的邻居描述为：“史蒂夫非常腼腆，少言寡语，很乐于助人，却对他人或这个现实世界没多大兴趣。他谦恭有礼，做事井井有条，中规中矩，关注细节。”人们如何从一个可能的职业列表中（例如农民、售货员、飞行员、图书管理员或是医生）评估他从事某个特定职业的概率？又如何根据可能性的大小来将这些职业进行排序呢？在代表性启发法中，例如，史蒂夫是个图书管理员的概率是通过其与典型的图书管理员形象的代表性或相似性来进行评估的。事实上，对于这类问题的研究已经表明，人们对职业概率的排序与对职业相似性的排序方法完全是相同的。而这种关于概率的判断方法会导致严重的错误，因为相似性或代表性不会受到某些因素的影响，而这些因素却能影响对概率的判断。对结果的先验概率（prior probability）不敏感。对代表性没有任何影响而对概率有重要影响的其中一个因素是结果的先验概率，或基础比率。例如，在史蒂夫的那个例子中，在我们作出史蒂夫是个图书管理员而不是农民的理性评估时，是应该将农民比图书管理员人数更多的事实考虑在内的。然而，对基础比率的考虑并不会影响史蒂夫与图书管理员以及农民的典型形象的相似性。因此，如果人们通过代表性来评估概率，先验概率就会被忽视掉。我们在运用了先验概率的实验中检验了这个假设。在实验中，我们向受试者简要概述了几个人的性格，这几个人是从100位工程师及律师的样本中随意抽取出来的。而受试者需要通过对每个人的描述来评估其是工程师还是律师。在某个实验情境中，受试者被告知这些被描述的100人中，有70位工程师、30位律师。而在另一个实验情境中，受试者被告知这100人中，有30位工程师、70位律师。在第一种情境下，受试者判断任意一个描述是关于工程师的而不是关于律师的概率都应该高于第二种实验情境。因为第一种情境中工程师更多，第二种情境中律师更多。值得注意的是，我们通过贝叶斯定理还能知道每个描述的概率比率应该是（0.7、0.3）2，或是5.44。然而，这些受试者在这两个实验情境中都得出了同样的概率判断，这严重违反了贝叶斯定理。很明显，受试者认为某个特定的描述是在说工程师而非律师是通过描述对于这两个典型职业的代表程度而来的，而很少或根本就不考虑其所属类别的先验概率。当这些受试者没有其他信息来源时，他们会正确地利用先验概率。在没有人物描述的情况下，受试者判断某个人是工程师或律师的概率分别是0.7和0.3，这与基础比率正好符合。然而，当某个描述存在，就算这个描述没有任何信息，先验概率还是会被彻底忽略掉。对于以下描述的回应就阐明了这个现象：迪克是位30岁的男性，已婚，但无子女。他能力强，干劲足，承诺一定要在自己的领域功成名就。他很受同事的欢迎。这个描述所传达的信息与迪克是工程师还是律师的问题完全没有关系。因此，迪克是工程师的概率应该与工程师占样本总人数的比率相同，就如同我们没有得到任何有关迪克的描述时一样。然而，受试者却将迪克是工程师的概率判断为0.5，并不关注工程师占总人数的比率是0.7还是0.3。很明显，在没有任何证据和得到了一些无用的证据之后，人们的回应是不同的。在没有任何特定证据的情况下，先验概率能够被合理地应用；而在得知一些无用证据的情况下，先验概率就会被忽略。对样本大小的不敏感。在某个指定大小的样本中，评估获得某个特定结果的概率时，人们总会应用代表性启发法。即他们会通过某个样本结果与相关参数的相似性来评估这个结果的概率。例如，人们会认为随机抽取的10位男性的平均身高是6英尺，而这个结果就是由与相应参数（这个参数即是男性人口的平均身高）的相似性得来的。某个样本的统计数据与人口参数的相似性并不是由样本的大小来决定的。其结果就是，如果我们通过代表性来评估概率，判断出的某个样本的统计数据实质上就是独立于样本大小的。的确，当受试者评估大小不同样本的平均身高分布时，他们得出的分布是相同的。例如，人们在评估平均高度高于6英尺的概率时，无论样本大小是1000、100还是10位时，其得出的分布都是相同的。另外，即使样本大小的重要性在问题形成之时就被强调过，受试者还是不能体会其所起的作用。请考虑下面的问题：某个城镇有两家医院。在较大的那家医院里，每天大约有45个婴儿降生，而在较小的医院里，每天有15个婴儿降生。如你所知，其中50%的婴儿应该是男婴。然而，男婴实际的百分比每天都会有所变化，有时会高于50%，有时会低于50%。在一年的时间里，每家医院都记录了新生婴儿中男婴比率大于60%的天数。你认为，哪一家医院记录的天数更多？更大的医院：（21）更小的医院：（21）大致相同：其天数的不同在5%的范围内，（53）括号中的数值表示的是选择该答案的大学生人数。无论是大医院还是小医院，多数受试者判断出的60%以上新生儿是男婴的概率都是相同的。这可能是因为这些事件都来自于同样的统计资料提供的描述，因此关于总体情况的代表性相同。相反，以样本理论进行分析的话，在小医院里，超过60%的婴儿是男婴的天数肯定应该比大医院的多，因为大样本的男女比率不太可能偏离50%。很明显，这个统计学的基本概念与人类的直觉不相符。在对后验概率（即从一个整体而不是另一个整体中抽取样本的概率）的判断中，人们对样本大小的问题也不是很敏感。请考虑下面这个例子：想象有个装满球的罐子，其中有三分之二的球是一种颜色，三分之一的球是另一种颜色。某个人从罐子里取出了5个球，发现有4个是红色的，1个是白色的。另一个人取出了20个球，其中有12个是红色的，8个是白色的。这两个人中，谁更会认为罐子里三分之二的球是红色的，三分之一的球是白色的？每个人给出的概率各是多少？在这个问题中，假设两次抽取的先验概率相同，那对于4：1的那个样本来说，其正确的后验概率应为8：1；而对于12：8的样本来说，其后验概率为16：1。然而，大多数人却认为第一个样本为罐子里主要是红球的这个假设提供了更为有力的证据，因为第一个样本的红球比例要比第二个样本的高。这再次证明了，直觉性判断由样本比例主导，本质上并不受样本大小的影响。然而，样本大小却对实际的后验概率起着至关重要的作用。此外，对后验概率的直觉性评估比起正确的值来说并没有那么极端。在这类对概率的评估中，低估证据的影响反复出现。这种情况被称为“保守主义”。误解机会。人们期望由随机过程产生的事件序列能够代表这个过程的基本特征，即使这个序列很短。例如，人们在考虑抛硬币看正反面的问题时，总会觉得其顺序更可能是正，反，正，反，反，正，而不是正，正，正，反，反，反，因为后者并不能体现出抛硬币的公正性。因此，人们期望过程的基本特征不仅表现在整个序列中，还表现在局部的序列中。然而，局部代表的序列系统地脱离了概率的期望：因为局部代表的序列中选择很多，但可供选择的项却很少。抱有局部代表性这个想法的另一个后果就是有名的赌徒谬误。例如，在看到轮盘赌的指针长时间连续指向红色以后，大多数人就会错误地认为现在该是指向黑色的时候了。这是因为，相比再次出现红色，出现黑色会使序列更具代表性。人们普遍将概率视为可进行自我纠正的过程。在这个过程中，某个方向的偏离能引起其相反方向的偏离，以达到恢复平衡的目的。事实上，在概率的结果揭晓之时，偏离并不是被“纠正”了，而只是融为一体了。不只是天真的受试者才会误解概率。一项关于统计直觉的研究以有经验的心理学家为受试者，揭示了人们长期抱有的“小数法则”这一信念。这些受试者认为，他们抽取的样本即使很小，也具有很强的代表性。他们这样的回应反映了一个有效的假设：某个具有统计意义的样本结果可以代表样本所属的整个群体的性质，这与样本大小并无关联。因此，研究人员过于信任小样本的结果，高估了这些结果的可复制性。在实际的研究中，这些偏见会导致研究人员选择的样本不够大，并对仅有的发现作过多的阐释。对可预测性的不敏感。有时，人们需要作一些数值上的预测，例如，预测某只股票的走势、某种商品的需求量或是某场球赛的最后比分。这样的预测经常是通过代表性作出的。例如，假设有个人在听了关于某家公司的描述之后，需要预测这家公司的未来收益。那么，如果这个人听到的描述是正面的，他就会预测这家公司将有非常高的收益，因为高收益最能代表那个描述；如果描述是普通的，这个人就会觉得公司的表现也会很普通。描述的好坏程度并不受该描述的可信程度以及精确程度的影响。因此，如果人们仅仅依靠描述的好坏来预测，那么他们的预测就会对证据的可靠性和预测的预期精确度不敏感。这种判断模式违反了标准的统计理论。在标准的统计理论中，出于对可预测性的考虑，极端和预测范围受到了控制。当某件事的可预测性为零时，该预测的结果在任何情况下都应该是相同的。例如，如果在一些公司的描述中，没有听到有关其收益的信息，那么对所有这些公司未来收益的预测都应该是相同的。当然，如果某件事的可预测性非常高，那么预测值就会符合实际值，预测的范围也会等同于实际结果的范围。总之，可预测性越高，预测值的范围就会越广。一些关于数值预测的研究表明：直觉性预测违反了这条规则，因为受试者很少甚至没有考虑过可预测性的问题。在其中一项研究里，受试者看了几段文字，每段文字都描述了一位实习老师在特定实习课上的表现。一些受试者需要根据那几段文字描述以百分制来评价特定总体的课堂质量，其他受试者则需要预测这些实习老师在5年以后的成就，同样要以百分制来打分。这两种情况下作的判断是相同的，即预测某一未来事件（老师在5年以后的成就）与评估当前事件所依据的信息（实习课的课堂质量）是相同的。作这些预测的人肯定也意识到了用某位老师5年以前的实习课来预测她的教学能力过于局限。不过，他们的预测与评估一样极端。效度错觉。前面已经介绍过，人们常会挑选输入信息（例如对某个人的描述）中最具代表性的特点（例如职业）来进行预测。他们在预测时的自信程度主要取决于相关信息代表性的高低（即所选特点与输入信息的吻合程度），与限制预测准确性的因素关系不大。因此，人们在听到与图书管理员的典型形象相符合的性格描述后，就会极有自信地作出所描述的人就是一个图书管理员的预测，即使这个描述是片面的、不可靠的或是过时的。由于预测特点与输入信息非常吻合而产生的没有保证的自信就被称为效度错觉。即使当判断者意识到限制其预测准确性的因素时，这种错觉仍然存在。许多文献已经证实：甄选面谈的出错率很高，但即使心理学家知道这一点，在甄选面谈时，他们还是常会在预测中表现出很大的自信。尽管不断有证据表明甄选面谈是不恰当的，但临床上仍然持续依赖这种访谈方式，这也充分说明了效度错觉强大的影响力。预测需要依靠输入，而输入模式的内部一致性就是决定人们在预测时自信程度的主要因素。例如，相比某个在一年级得了许多A但也得了许多C的学生来说，人们在预测一年级得了许多B的学生的平均绩点时会更有自信。高度一致的模式最常出现在输入变量过多或相关度高的时候。然而，相关统计学的结果证实，若规定了输入变量的效度，基于几个这种输入的预测会比输入过多或相关情况下的准确性高。因此，输入变量过多虽然可以增加自信程度，但却会降低预测的准确性。而人们在预测时所抱持的信心常会超出他们的能力范围。误解回归性。假设让一群儿童做两套等效的能力测试题。如果你挑选出了在其中一套能力测试题中表现最好的10个人，那么他们在另一套测试中的表现通常会让你失望。相反，如果你挑选的是在其中一套能力测试中表现最差的10个人，你就会发现，他们在下一次测试中平均都比前一次测试表现得好。一般来说，假设变量X和Y有相同的分布。如果你挑选的X的平均分数偏离了X的均值K个单位，那么，Y的平均分通常偏离Y的均值的程度就会少于K个单位。这些观察表明了一个普遍的现象，即回归平均值现象。这个现象是高尔顿在100年前首次证明的。在正常的生命过程中，你会遇到许多回归平均值的例子。例如，在比较父亲与儿子的身高，丈夫与妻子的智力水平或是某个人连续测试的不同表现时。不过，人们没能对此现象产生正确的直觉。首先，人们不能预料一些肯定会发生回归平均值的情境。其次，当他们辨别出回归平均值的发生时，总会捏造出虚假的因果解释。有这样一个信念：预测结果应该最大程度代表输入信息，因此，结果变量的值也应与输入变量的值一样极端。我们提出，回归平均值的现象之所以难以掌握就是因为与上述信念不相容。未能意识到回归平均值的重要性将会带来严重的后果。下面这个例子就说明了这一点：在一次关于飞行训练的讨论中，有经验的指导员注意到，若赞扬某位飞行员着陆非常平稳，该飞行员下一次着陆就会表现得糟糕；若某位飞行员着陆较差，该飞行员下一次着陆就会有很大进步。这些指导员总结道，口头表扬对学习是有害的，而口头批评却大有益处，这与广为接受的心理学定律相左。由于回归平均值的存在，这个结论是没有根据的。就像其他重复的测试一样，每次表现糟糕以后总会有进步，而表现优异以后又总会变得糟糕，即使指导员没有对学员的第一次表现给予任何回应。指导员形成了惩罚比奖赏更有效这个错误且有潜在危害的结论，因为他们正好在着陆表现优异后表扬了这些学员，在着陆表现糟糕后批评了这些学员。因此，未能理解回归效应会导致人们高估惩罚的有效性，低估奖赏的有效性。无论是在社会交往中，还是在训练中，表现得好都会有奖赏，表现得差也都会有惩罚。因此，行为最有可能在惩罚之后得到改进，在奖赏之后变得更坏，这其实就是一种回归现象。其结果就是：人们碰巧因为惩罚他人得到了奖赏，因为奖赏他人得到了惩罚。然而，人们通常不会意识到这种偶然性。事实上，难以掌握回归性主要是因为奖赏与惩罚带来的结果非常明显，因此，这个领域的学者也没有注意到它。可得性有时候，人们会通过能想到例子或事件的容易程度来评估这类事的频率或概率。例如，你可能会通过回忆自己认识的人中有多少位是心脏病患者来估测中年人患心脏病的风险。同样，你也可能会通过想象某个企业可能会遇到的各种难题来估测其倒闭的概率。这种判断启发式被称为可得性。可得性对于评估频率或概率来说，是个很有用的线索，因为相比频率较低的类别的例子来说，我们可以更好、更快地得到频率较高的类别的例子。然而，可得性并不受频率和概率的影响。因此，依赖于可得性会导致预测的偏见。我接下来将说明其中的一些偏见。因例子的可提取性导致的偏见。当用某个类别的例子的可得性来判断该类别的大小时，例子很容易提取的类别会比频率相同但例子较难想到的类别显得更大。在证明此效应的基本研究中，受试者听到了一串知名人士的名字，男女均有。接着，他们需要判断这串名字中男性是否比女性多。不同组的受试者听到的名字并不相同。在一些名单中，男性更有名；而在另外一些名单中，女性则更有名。受试者都错误地判断了所有名单的类别（性别）。他们的判断显示，名人更多的类别，其数目也越大。除了熟悉度以外，显著程度也会影响例子的可提取性。例如，看见房子失火对这类事件主观概率的影响可能会比在报纸上读到失火这件事的影响要大。另外，最近发生的事有可能会比之前发生的事更容易获得。对于交通事故的主观概率会在见到一辆翻倒在路边的车后暂时升高，这很平常。因搜索集合的有效性导致的偏见。假设从某个英文文本中随机抽取一个词（含有3个或更多字母的词）。这个词更有可能是以r开头还是以r作为第三个字母？人们在回答这个问题时，会回忆首字母为r的单词（例如road）以及第三个字母为r的单词（例如car），然后通过想到这两个词的容易程度来评估相对频率。因为从记忆中搜寻单词的首字母要比搜寻其第三个字母更为容易，所以大多数人都判断以某个辅音开头的单词要比第三个字母为该辅音的单词多。但实际上，例如r或k的辅音字母，出现在第三个字母的频率都要比出现在开头的频率高。不同的任务会引发不同的搜索集合。例如，假设你被要求评估抽象词（比如想法、爱）和具体词（比如门、水）出现在书面英语中的频率。回答这个问题自然而然的方法就是搜寻这些词可能出现的情境。联想起提到抽象概念（爱情故事中的爱情）的情境似乎要比联想起提到具体词（例如门）的情境更为容易。如果用单词出现情境的可得性来判断这些单词的频率，抽象词就会多于具体词。这一偏见在最近的研究中已被发现，此研究表明，判断出抽象词的出现频率比具体词的出现频率高很多，与客观频率相等。相较于具体词，抽象词还会出现在更多的语境中。想象力的偏见。有时，你需要评估某类事件发生的频率，这类事件的实例没有储存在你的大脑中，但你可以通过一定的规则构建一些实例。在这样的情况下，你通常会构建几个实例并通过构建这些实例的容易程度来评估其频率或概率。然而，构建实例的容易程度并不总能反映出真实的频率，这种评估模式很容易导致偏见。下面这个例子将会说明这一点：请考虑一个10个人的团体，他们想组成一个有K个成员的委员会（2小于或等于k小于或等于8）。他们可以组成多少个不同的且有K个成员的委员会？这个问题的正确答案是二项式系数（10k），当K等于5时，达到其最大值252。这明确表明了，K个成员的委员会数量等于（10减k）个成员的委员会数量，因为任何有K个成员的委员会界定了一个独有的（10减k）个非成员的团体。若想不通过计算就回答这个问题，则需要在心里构建有K个成员的委员会，然后通过构建这些委员会的容易程度来评估它们的数量。人数较少的委员会（比如只有两人的委员会）会比人数较多的委员会（比如有8人的委员会）更容易构建。因此，如果通过想象力或是构建的可得性来评估频率的话，规模小的委员会似乎就会比规模大的委员会的数量更多，这与对称的钟形函数正好相反。事实上，在要求天真的受试者评估规模不同的委员会的数目时，他们的估计是委员会规模的单调递减函数。例如，他们评估的有两个成员的委员会的中值是70，有8个成员的委员会的中值是20（正确答案应该是两种情况下都是45）。在真实情境中，想象力对概率的评估起着重要的作用。例如，通过想象某次探险中无法应对的意外事件来评估这次探险的风险。如果能想到许多这样生动的意外事件，这次探险就会显得尤其危险，尽管想到这些灾难的容易程度并不能反映出它们实际发生的可能性。相反，如果没能想到某些可能的危险，那将要承担的风险就会被低估。相关性错觉。L·J·查普曼与J·P·查普曼曾描述过一种有趣的偏见，这种偏见是在判断两个同时发生的事件的频率时产生的。他们向受试者提供了几个假设的精神病患者的信息。信息包括每位病人的临床诊断数据和一幅由病人画的人像画。然后，受试者需评估每个诊断（例如妄想症或疑心病）以及人像画中不同特征（例如奇怪的眼睛）的频率。受试者明显高估了自然的联想物同时发生的频率，例如疑心病和奇怪的眼睛的频率。这种效应被称为相关性错觉（illusory correlation）。受试者错误地判断了得到的数据，“重新发现”了许多普遍但无根据的临床知识，这些临床知识就涉及人像画测试的相关解释。相关性错觉效应极度抗拒相互矛盾的数据。即使在症状与诊断呈负相关的情况下，相关性错觉仍然存在，它使受试者不能察觉到真正存在的关系。可得性为相关性错觉效应提供了自然的解释。根据两个事件相互关联的强度，可以判断出它们同时发生的频率。当两个事件关联性强的时候，你可能会认为它们经常同时发生。因此，强关联常被判断为经常同时发生。根据这个观点，疑心病与奇怪的眼睛的关联性错觉就是由疑心病常会与奇怪的眼睛而引起的，而不是因与人体其他部位相联系而引起的。从我们的人生经历可知，总的来说，相比发生频率低的例子，我们更能又好又快地回忆起发生频率高的例子，更容易想到可能发生的事，而不是发生概率不高的事。当事件频繁地同时发生时，这两个事件之间的关联性会得以增强。所以，人们可以自由使用可得性启发式的程序，具体是通过提取、构建和联想等相关大脑运作的容易程度来估测类别的数量、事件的可能性或是事件同时发生的频率。然而，前面的例子已经说明，这个有价值的估测过程会导致系统性错误。判断与锚定在许多情况下，人们都会通过初始值来确定最后的答案。初始值或起始点，可能是从问题形成之时得到的提示，也可能是在稍微计算之后得到的结果。但无论是前者还是后者，其调整都不会太过充分。不同的起始点会产生不同的估测，都会偏向于初始值。我们将这个现象称为锚定。不充分的判断。在某个证明锚定效应的实验中，受试者需要估测不同的数值，并以百分比来进行评定（例如非洲国家在所有联合国成员国中所占席位的百分比）。在猜测每一个数值的时候，受试者面前一个范围为0~100的幸运转盘都会旋转一次。受试者首先需要说明，转盘指针指向的数值比起实际值来说是高了还是低了，然后，再将转盘的指针拨向自己估计的值。不同的小组面对的是不同的初始数字，而这些随机的数值对估计有着巨大的影响。以非洲国家占联合国成员国的百分比为例，转盘指针指向10的小组估测的中值是25，而指针指向65的小组估测的中值是45，其中，10和65就被受试者视为起始点。对于估计要精确的要求也并没能削弱锚定效应的影响。锚定不只是在受试者被给予相关起始点的情况下发生，当受试者依赖于未完成的计算结果进行估测时，这种情形也会发生。关于直觉性数值估计的研究就说明了这一效应：在黑板上写出一些算式，让两组高中生在5秒之内估计结果。