妙趣横生博弈论-妙趣横生博弈论+事业与人生的成功之道-3

由此产生了很多问题。有些问题属于博弈论的更一般的方面。如果只有一个参与者有优势策略会怎样？如果参与者都没有优势策略又会如何？当每个参与者的最佳选择取决于对方的同时选择时，他们是否能看穿彼此的选择，然后解决这个博弈呢？我们将在以后的章节中继续讨论这些问题，那时我们会介绍一个更一般的解决同时行动博弈的概念--约翰?纳什的美丽的均衡。本章我们集中讨论关于囚徒困境博弈本身的问题。一般情况下，每个参与者可选的两个策略分别被记为“合作”和“背叛”（或者有时候称为“欺骗”），我们将沿用这个用法。对每个参与者而言，背叛都是优势策略，而对双方而言，他们均选择背叛的策略组合得到的结果，比双方均选择合作得到的结果更糟。∷解决困境的初步思想深知囚徒困境危害的参与者，有强烈的动机达成联合协议，避免陷入这种困境。例如，新英格兰的渔民们可以达成协议，限制捕捞，为将来储备鱼类资源。困难在于，当大家都面临欺骗的诱惑时，例如都想得到超过分配限额的鱼，怎样才使这样的协议比较稳固？关于这个问题，博弈论是如何解释的呢？在实际的这种博弈中，又会发生什么？自从囚徒困境发明50年来，其理论已经有了很大的进展，而且积累了大量证据，这些证据不仅来自对真实世界的观察，还来自实验室中的可控实验。让我们来考察一下这些资料，看看能从中学到什么。达成合作的另一面就是避免背叛。通过给予参与者一个适当的奖励，将可以激励参与者选择合作而不是选择最初的优势策略“背叛”；或者，通过制造一种适当的惩罚的可能性，亦可以吓阻参与者选择背叛。基于以下原因，奖励方法可能会有问题。奖励可以是内部的，一方对另一方的合作进行奖励。有时也可以是外部的，可以由从双方合作中获利的第三方对双方的合作进行奖励。不论哪种情形，都不能在参与者做出选择之前给予奖励；否则，参与者一定会把奖励揣入口袋，然后再选择背叛。如果奖励仅仅是一个许诺，那么这个许诺可能是不可信的：在受诺方选择了合作后，许诺方有可能会食言。一段小小的历史（6）尽管困难重重，有时奖励还是可行的、有用的。发挥最大的创造性和想象力，参与者可以同时、相互许诺，然后通过把许诺的奖金存入由第三方控制的托管账户中，使这些许诺显得可信。更切实际的是，参与者可以在多个方面相互作用，一方在一个方面的合作可以换来对方在另一个方面合作的奖励。比如，在雌性黑猩猩群中，分享食物、帮忙照看幼崽，可以换来梳理毛发的帮助。有时候，博弈第三方可能有非常强烈的利益动机促成合作。例如，为了结束世界范围内的各种冲突，美国和欧盟不时地许诺向战争国提供经济援助，作为对它们和平解决争端的奖励。1978年，美国以这种方式奖励了以色列和埃及，因为它们合作签署了戴维营协议。惩罚是解决囚徒困境的更为常用的方法。它可能即时见效。电影《洛城机密》中有这样一个场景，警官埃德?埃克斯利向他正在审讯的嫌犯之一雷若伊?方丹许诺，如果他为国家作证，就可以比其他两个嫌疑犯少判几年。但雷若伊知道，一旦他出狱，他会发现另两个人的朋友正等着报复他！然而，在这种背景下自然而然想到的惩罚，产生于这样的事实，即大多数此类博弈都只是一段持续关系的一部分。欺骗可能使一个参与者获得短期利益，但却会损害这种持续关系，产生更长期的成本。如果该成本非常大，这就可能从一开始就起到了阻吓欺骗的作用。由于发展了重复博弈中隐含合作的一般理论，罗伯特?奥曼（Robert Aumann）于2005年被授予诺贝尔经济学奖。一个引人注目的例子来自棒球比赛。美国联盟队的击球员被投球击中的概率是11％，而国家联盟的击球员被击中的概率是17％。据道格?德林恩（Doug Drinen）和约翰-查尔斯?布拉伯瑞（John Charles Bradbury）所说，这种区别的主要原因在于指定的击球手规则。在美国联盟队，投球手不击球。因此，攻击击球手的美国联盟队投球手，不必担心对手队的投球手会直接报复。虽然投球手不太可能被击中，但如果他们刚刚在上半场攻击了某个人，那么，他们被击中的机会就会增加1/4。担心遭到报复是显然的。就像王牌投球手科特?谢林（Curt Schilling）所解释的：“当你面对兰迪?约翰逊（Randy Johnson）时，你还会郑重其事地向某个人投球吗？”大多数人在考虑一个参与者如何惩罚对方过去的欺骗行为时，就会想到“以牙还牙”的说法。这的确是关于囚徒困境最有名的实验结果。让我们详细叙述在实验中发生了什么，以及我们能从中学到什么。以牙还牙（1）以牙还牙20世纪80年代初，密歇根大学政治科学家罗伯特?阿克谢罗德（Robert Axelrod）邀请了世界各地的博弈论学者以电脑程序形式提交他们的囚徒困境博弈策略。这些程序两两结对，反复进行150次囚徒困境博弈。参赛者按照最后总得分排定名次。冠军是多伦多大学的数学教授阿纳托?拉普波特（Anatol Rapoport）。他的取胜策略就是以牙还牙。阿克谢罗德对此感到很惊奇。他又举办了一次比赛，这次有更多的学者参赛。拉普波特再次提交了以牙还牙策略，并再次赢得了比赛。以牙还牙是“以眼还眼”行为法则的一种变形：人家怎么对你，你也怎么对他。说得更准确点，这个策略在开局时选择合作，以后则模仿对手在上一期的行动。在《旧约?出埃及记》（Exodus，21：22）中，我们看见，“人若彼此争斗，伤害有孕的妇人，甚至坠胎，随后却无别害，那伤害她的，总要按妇人的丈夫所要的，照审判官所断的，受罚。若有别害，就要以命偿命，以眼还眼，以牙还牙，以手还手，以脚还脚，以烙还烙，以伤还伤，以打还打。”《新约》则提倡更具合作精神的行为。在《新约?马太福音》（Matthew，5：38）中，我们读到，“你们听见有话说：‘以眼还眼，以牙还牙。’只是我告诉你们，不要与恶人作对。有人打你的右脸，连左脸也转过来由他打”。我们从“以其人之道，还治其人之身”转到“你们愿意人怎样待你们，你们也要怎样待人”（《新约?路加福音》，Luke，6：31）的金科玉律。假如人们当真遵守这一金科玉律，也就不会存在什么囚徒困境了。此外，只要我们看得更深远一些，不难发现，虽然合作可能在某一特定博弈中降低你的赢利，但是以后可能带来的回报却足以使一个自私的人相信，合作应该算是一个理性策略。你认为不存在以后吗？帕斯卡尔的赌博说明了，在此假设基础上行动的后果可能相当惨烈，所以这就是冒险的原因。因为每个失败者都必须和一个胜利者组对，所以结果一定是某个参赛者的胜利的次数大于失败的次数，不然就是失败的次数大于胜利的次数。（唯一的例外就是每个单场比赛都打成平局。）阿克谢罗德认为，以牙还牙法则体现了任何一个有效策略应该符合的四个原则：清晰、善意、报复性和宽容性。再也没有什么字眼会比“以牙还牙”更加清晰、简单。这一法则不会引发欺骗，所以是善意的。它也是报复性的--也就是说，它永远不会让欺骗者逍遥法外。它还是宽容的，因为它不会长期怀恨在心，而愿意恢复合作。以牙还牙（2）以牙还牙一个非常引人注目的特征在于，它在整个比赛中取得了突出的成绩，虽然它实际上并没有（也不能）在一场正面较量中击败任何一个对手。其最好的结果是跟对手打成平手。因此，假如当初阿克谢罗德是按照“赢者通吃”的原则打分，以牙还牙的策略只可能失败或是打成平手，而不可能取得最后的胜利。不过，阿克谢罗德并没有按照“赢者通吃”的原则给结对比赛的选手打分，只有比赛结束才算数。以牙还牙策略的一大优点在于它总是可以将比赛引向结束。以牙还牙最坏的结果是，以遭到一次背叛重击而告终，也就是说，它让对手占了一次便宜，此后双方打成平局。以牙还牙策略之所以能赢得这次锦标赛，是因为它通常都会竭尽全力促成合作，同时避免互相背叛。其他参赛者则要么太轻信别人，一点也不会防范背叛，要么太咄咄逼人，一心要把对方踢出局。不过，尽管如此，我们仍然认为以牙还牙策略是一个有缺陷的策略。只要存在一丁点儿出现错误或误解的可能性，以牙还牙策略的胜利就会土崩瓦解。这个缺陷在人工设计的电脑锦标赛中并不可能，因为此种情况下根本不会出现错误和误解。但是，一旦将以牙还牙策略用于解决现实世界的问题，错误和误解就难以避免，结局就可能是灾难性的。以牙还牙策略的问题在于，任何一个错误都会犹如“回声”一般反复出现。一方对另一方的背叛行为进行惩罚，从而引发连锁反应。对手受到惩罚之后，不甘示弱，进行反击。这一反击又招致第二次惩罚。无论什么时候，这一策略都不会只接受惩罚而不做任何反击。举个例子：假设弗勒德和德雷希尔都采取以牙还牙策略。没有人先发起背叛，一段时间内，一切都顺利进行。然后，到了第11轮，假设弗勒德错误选择了背叛，或者选择了合作但德雷希尔却误以为他选择了背叛，不论是哪种情况，德雷希尔在第12轮都会选择背叛，而弗勒德却会选择合作，因为德雷希尔在第11轮中选择了合作。到了第13轮，角色就会转换过来。这种一方合作而另一方背叛的模式会继续反复进行下去，直到又一个错误或误解的出现恢复了合作或导致双双背叛。以牙还牙（3）在西弗吉尼亚与肯塔基的交界处，哈特菲尔德家族（Hatfields）与麦科伊家族（McCoys）家族的长期争斗可谓令人难忘。而在虚构世界中，马克?吐温笔下的格兰杰福特家族与谢泼德森家族的世代仇恨，为我们提供了另外一个生动的例子，说明以牙还牙的行动是怎样导致循环报复的。当赫克?芬恩试图了解格兰杰福特家族与谢泼德森家族世仇的源头究竟是什么时，他却遇到了“鸡生蛋还是蛋生鸡”的难题：“这究竟是为了什么，巴克？--为了土地吗？”“我估计是--我不知道。”“那么，究竟是谁开的枪呢？是格兰杰福特家的人还是谢泼德森家的人？”“天哪，我怎么会知道？那是多久以前的事啊。”“有没有人知道呢？”“噢，有的，老爸知道，我估计，还有其他一些老头子，不过现在他们也不晓得当初究竟发生了什么事。”以牙还牙策略缺少的是一个宣布“到此为止”的方法。它实在太容易被激发起来了，而且不会轻易地宽恕。确实，后来的阿克谢罗德比赛的版本考虑了错误和误解的可能性，结果表明，其他那些更宽宏大量的策略优于以牙还牙策略。2004年，诺丁汉大学的格雷厄姆?肯德尔（Graham Kendall）为了庆祝阿克谢罗德首届比赛的20周年，举行了一次比赛。“胜出”者是来自英格兰南安普敦大学的小组。南安普敦小组总共推荐了60个参赛者，包括59只“雄蜂”、1只“蜂后”。他们所有的参赛者都以独特的模式开始，这样他们就可以辨认出彼此。接着，雄蜂们牺牲了自己，以便让蜂后得到好的结果。蜂后也拒绝了与任何对手合作，以降低对手们的得分。虽然让一群雄蜂为了你的利益而牺牲自己是增加你的赢利的一种方法，但它并没有教给我们许多关于如何进行一个囚徒困境博弈的知识。在这里，我们甚至可以从猴子那里学到一些东西。棉头狷猴被置于一个博弈中，每只猴子都有机会拉动一个杠杆，给另一只猴子喂食。但是拉动杠杆需要力气。对每只猴子而言，最理想的策略就是自己偷懒，而它的搭档拉杠杆。但是为了避免遭到报复，猴子们学会了合作。只要一个参与者不连续背叛两次以上，棉头狷猴的合作就会一直持续下去，这种策略类似于以牙还牙策略。9较新的实验（1）在西弗吉尼亚与肯塔基的交界处，哈特菲尔德家族（Hatfields）与麦科伊家族（McCoys）家族的长期争斗可谓令人难忘。而在虚构世界中，马克?吐温笔下的格兰杰福特家族与谢泼德森家族的世代仇恨，为我们提供了另外一个生动的例子，说明以牙还牙的行动是怎样导致循环报复的。当赫克?芬恩试图了解格兰杰福特家族与谢泼德森家族世仇的源头究竟是什么时，他却遇到了“鸡生蛋还是蛋生鸡”的难题：“这究竟是为了什么，巴克？--为了土地吗？”“我估计是--我不知道。”“那么，究竟是谁开的枪呢？是格兰杰福特家的人还是谢泼德森家的人？”“天哪，我怎么会知道？那是较新的实验成千上万的关于囚徒困境的实验是在课堂和实验室进行的，这些实验涉及不同参与者人数、不同重复次数以及其他方面。下面是一些重要发现。10首先最重要的是，合作发生得相当频繁，即使每对参与者只达成一次合作。平均而言，几乎一半参与者选择了合作。确实，对此最引人注目的例证来自游戏秀网络产品“朋友还是敌人”。在这个节目秀中，两人一组，每组都被问了一些琐碎问题。答对的人赚得的钱存入“信托资金”，在105集中，资金总额为200~16 400美元不等。为了分配这笔资金，参赛者双方进行一个单次囚徒困境博弈。每个人私下里写下“朋友”或“敌人”。当双方同时写下朋友时，他们平分这笔资金。如果一方写了敌人而另一方写了朋友，那么，写敌人的那个人将得到全部资金。但若双方都写敌人，他们都将一无所获。不论对方写什么，你写敌人得到的钱至少等于或者可能大于你写朋友所得到的钱。然而，几乎一半参赛者写下的是朋友。甚至当资金总额增大时，合作的可能性也没有改变。资金低于3 000美元时人们合作的可能性，与资金高于5 000美元时相等。以上就是从菲利克斯?奥本豪泽尔-吉（Felix Oberholzer Gee）教授和乔?沃德弗格（Joel Waldfogel）教授，以及马修?怀特（Matthew White）教授和约翰?李斯特（John List）教授所进行的两项研究中发现的一些结果。11如果你还在疑惑看电视如何算得上是学术研究，可结果已有过700 000美元的资金分给了参赛者。这是史上奖金最多的囚徒困境实验。我们能从中学到许多东西。实验结果表明，女性比男性更倾向于合作，在第一季，女性和男性合作的概率分别是47 5%和53 7%。第一季的参赛者不具有可以在决策前看到其他比赛结果的优势。但到了第二季，前40集的结果已经公布了，这个模式变得显而易见。参赛者可以从其他人的经验中学到一些策略。当某一组是由两个女性组成时，合作的概率增至55％。但是当一个女性与一个男性组对时，这个女性的合作概率降到了34 2％。而这个男性的概率也降到了42 3％。总体而言，合作率降低了10个百分点。如果一群实验对象集中起来进行几次配对，且每次的配对不同，那么，选择合作的比率一般会随时间下降。不过，它不会降至零，而是总有固定的一小部分人坚持合作。多久以前的事啊。”“有没有人知道呢？”“噢，有的，老爸知道，我估计，还有其他一些老头子，不过现在他们也不晓得当初究竟发生了什么事。”以牙还牙策略缺少的是一个宣布“到此为止”的方法。它实在太容易被激发起来了，而且不会轻易地宽恕。确实，后来的阿克谢罗德比赛的版本考虑了错误和误解的可能性，结果表明，其他那些更宽宏大量的策略优于以牙还牙策略。2004年，诺丁汉大学的格雷厄姆?肯德尔（Graham Kendall）为了庆祝阿克谢罗德首届比赛的20周年，举行了一次比赛。“胜出”者是来自英格兰南安普敦大学的小组。南安普敦小组总共推荐了60个参赛者，包括59只“雄蜂”、1只“蜂后”。他们所有的参赛者都以独特的模式开始，这样他们就可以辨认出彼此。接着，雄蜂们牺牲了自己，以便让蜂后得到好的结果。蜂后也拒绝了与任何对手合作，以降低对手们的得分。虽然让一群雄蜂为了你的利益而牺牲自己是增加你的赢利的一种方法，但它并没有教给我们许多关于如何进行一个囚徒困境博弈的知识。在这里，我们甚至可以从猴子那里学到一些东西。棉头狷猴被置于一个博弈中，每只猴子都有机会拉动一个杠杆，给另一只猴子喂食。但是拉动杠杆需要力气。对每只猴子而言，最理想的策略就是自己偷懒，而它的搭档拉杠杆。但是为了避免遭到报复，猴子们学会了合作。只要一个参与者不连续背叛两次以上，棉头狷猴的合作就会一直持续下去，这种策略类似于以牙还牙策略。9较新的实验（2）如果同一对实验对象重复进行基本的囚徒困境博弈，他们常常逐渐达成连续的相互合作，直到其中一个参与者在临近这一连续重复博弈结束时选择了背叛。在第一次进行的困境实验中就发生了这样的事。弗勒德和德雷希尔一设计出这个博弈，就立即招呼他们的两个同事进行了100次这个囚徒困境博弈12。其中60次双方都选择了合作。较长的一次连续相互合作是从第83轮持续到第98轮，直到其中一方在第99轮偷偷背叛。事实上，按照博弈论的严格逻辑，这种情况本来不应该发生。当这个博弈恰好重复100次时，它就是一个同时行动博弈序列，我们可以用倒后推理的逻辑来解决这样的博弈。展望一下在第100次博弈时会发生什么。因为往后不再有更多的博弈了，所以背叛不可能在以后的任何一轮遭到惩罚。根据优势策略的推理，双方都应该在最后一轮选择背叛。但是，一旦确定了双方都会在最后一轮选择背叛，第99轮实际上就成了最后一轮。尽管后面还有一轮，在第99轮的背叛也不会在第100轮遭到对方的选择性惩罚，因为对方在第100轮中的选择是预先注定的。因此，优势策略的逻辑也适用于第99轮。我们可以用这个序列逻辑一直倒后推理到第1轮。不过，在实际博弈中，不论是在实验室还是在真实世界中，参与者似乎忽略了这个逻辑，结果反而受益于相互合作。事实证明，只要其他人同样都是 “非理性”的，那么，乍看上去可能是非理性的行为，偏离参与者的优势策略却是一个正确的选择。针对此种现象，博弈论学者做出了一种解释。现实世界中存在一些“互惠主义者”，只要对方合作，他们也愿意合作。假设你并不是这些相对友好的人中的一员。如果你在一个有限次重复囚徒困境博弈中按照自己的风格行事，那么你会从一开始就欺骗。而这会向对方参与者暴露出你的本性。为了掩盖真相（至少掩盖一会儿），你不得不表现出友好的样子。为什么你愿意这么做呢？假设你一开始就表现得友好。那么，即使对方参与者不是一个互惠主义者，他也会认为你可能是周围少有的几个友好的人中的一员。合作一段时间将会带来一些实实在在的好处，于是对方会打算报答你的善举，以获取这些好处。这对你也有好处。当然，你正计划在临近博弈结束时偷偷欺骗，就像对方一样。但你们仍然能够在最初阶段维持一段互利互惠的合作。虽然各方都假装善良等着占对方便宜，但双方都会从这种共同欺骗中获得好处。较新的实验（3）有些实验不是将一群实验对象两两配对，进行几个双人囚徒博弈，而是让所有人进行一个多人囚徒困境博弈。下面我们介绍一个来自课堂的例子，它非常有趣并具有启发性。得克萨斯A&M大学的雷蒙德?巴特里奥（Raymond Battalio）教授让班上27名学生进行以下博弈。13假设每一个学生都拥有一家企业，他必须决定（同时且独立地做出决定，并把决定写在一张纸条上）是生产产品1，帮助维持较低的总供给及较高的价格，还是生产产品2，在损失别人的利益的情况下获利。根据选择1的学生总数，将收入按照下面的表格分配给学生：写1的学生分配给写1的学生的钱（美元）分配给写2的学生的钱（美元）00 5010 040 5420 080 5830 120 62………251 001 50261 041 54271 08把这个表用下图表示出来，我们可以看得更加清楚，效果也更加明显：这是博弈“事先设计好”的，目的是确保选择2（欺骗）的学生总是比选择1（合作）的学生多得50美分，不过，选择2 的人越多，他们的总赢利就会越少。假设全体27名学生一开始都打算选择1，这样每个人将得到1 08美元。现在，如果一个学生打算偷偷改变决定，选择2，那么，选择1的学生就会变成26名，每个人将得到1 04美元（比初步计划少了4美分），而那个背叛者将得到1 54美元（比初步计划多了46美分）。不管最初计划选择1而不是2的学生有多少，他们都一样。选择2是一个优势策略。每一个把选择1改成选择2的学生都使自己的赢利增加46美分，却使他的其他26个同学每人少得4美分，结果全班损失58美分。等到人人都采取自私的行动，都想使自己的赢利最大化时，他们每人得到50美分。如果他们成功地合谋起来，协同行动，不惜将个人的赢利减到最小，他们将各得1 08美元。如果是你，你会怎么选择？演练这个博弈的时候，起初不允许集体讨论，后来允许一点讨论，以便达成“合谋”，结果愿意合作而选择1的学生总数从3到14不等。在最后的一次带有协议的博弈里，选择1的学生总数是4，全体学生的总赢利是15 82美元，比全体学生成功合作可以得到的赢利减少了13 34美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么，他自己又是怎么选择的呢？“噢，我选了2。”他答道。尤塞里安一定早就知道这一点了。新近的关于多人囚徒困境博弈的实验室实验，采用了一种叫做捐款博弈的形式。每个参与者得到一笔初始资金：10美元。每人可选择保留其中一部分，再把另一部分捐给共同储金。然后，实验者把累积的共同储金翻倍，在所有参与者之间平分，捐款人和非捐款人都同等对待。较新的实验（4）假设在这个组中总共有四个参与者：A、B、C和D。不论其他人怎么做，A只要向共同储金捐献1美元，共同储金翻倍后就会增加2美元。但是，增加的2美元中，会有1 5美元分给B、C和D；而A只能得到50美分。因此，A提高了其捐献量，最后却亏了本；相反，他减少捐献量反而会获益。不论其他人捐多少（如果有捐款的话），这一点都是成立的。换句话说，对A来说，一分钱也不捐是优势策略。对B、C和D来说亦是如此。这个逻辑是说，人人都应当希望成为一个分享别人成就的“免费搭车者”。如果四位参与者都采取他们的优势策略，共同储金便空空如也，每个人只保有他们的初始资金10美元。当人人都想成为免费搭车者时，车就会停滞不前。如果人人把他们所有的初始资金捐给共同储金，那么，翻倍后的共同储金将是80美元，每个人将分到20美元。然而，每个人都有背叛这样协议的个人动机。这就是他们的困境。捐款博弈不仅仅是实验室或理论上的奇事；它还发生在现实世界的社交活动中--只要群体成员自愿捐款就能共同受益，但却不能阻止没有捐款的人也能享受到这些利益。村庄对洪水的控制、自然资源的保护就属于这种情形：不可能建了堤坝后，洪水就会有选择地绕道而行，只淹没那些没有捐款帮忙建设堤坝的人的田地；拒绝以后把鱼分给那些过去消耗太多的人，也是不可行的。这就产生了多人囚徒困境：每个参与者都有偷懒或保留贡献的动机，却指望能享受别人的贡献带来的利益。如果大家都这么想，总的贡献量就会很少甚至为零，结果大家都遭受了损失。这些情形普遍存在而且如此严重，以致所有社会理论和政策都需要深入思考才能走出困境。在该博弈中的最有趣的变体中，参与者有机会惩罚那些背叛隐含社会合作契约的人。但是，他们必须为此承担个人成本。在捐款博弈结束后，参与者被告知其他参与者的个人捐款量。然后开始第二阶段的博弈，参与者可以采取降低其他人赢利的行动，而其他人的赢利每降低1美元，他自己要付出33美分的成本。也就是说，如果A选择把B的赢利降低3美元，那么A这样做之后，他的赢利就会减少1美元。这些减少的赢利不会再分配给其他任何人；而是返还到实验者的总资金中。实验结果表明，人们对“社会欺骗者”实施了大量的惩罚，惩罚的可能性也大大提高了博弈第一阶段的贡献量。这样的惩罚似乎是促成合作、增进群体利益的一个有效机制。但是人们实施惩罚的事实首先就是令人惊讶的。以私人代价惩罚他人的行为，本身就是对集体利益的贡献，所以它是一个劣势策略；如果它以后成功地引导欺骗者采取了更好的行为，这将对整个集体有利，而惩罚者将只得到该利益中属于他的一小部分。所以，惩罚不是自私估计的结果。情况的确如此。在关于该博弈的实验进行的同时，参与者的大脑接受了正电子放射扫描仪的扫描。14结果表明，实施惩罚的行为会刺激某个大脑区域，该区域被称为背侧纹状体，它与体验快乐或满足有关。换句话说，人们从惩戒社会欺骗者的行为中，实际上得到了心理上的受益或满足。这种本能必定有着很深的生物根源，而且可能是因为其进化优势而被选择出来的。15如何达成合作（1）如何达成合作这些例子和实验已经说明了成功合作的几个先决条件和策略。让我们更系统地介绍这些概念，并利用它们解决更多的现实生活实例。成功的惩罚机制必须满足几个要求。下面我们逐一列出。觉察欺骗惩罚欺骗之前，必须觉察到欺骗。如果觉察快速而且准确，惩罚的实施就能够即时无误。这在提高欺骗成本的同时，减少了欺骗的好处，从而提高了成功合作的可能性。比如，航空公司时常监视对手的票价；如果美国航空公司打算降低其纽约至芝加哥的票价，联合航空公司可以在5分钟内就做出反应。但是在其他情况下，想降价的公司可能会跟顾客秘密交易，或者通过一笔涉及飞行时间、服务质量、安全保证等许多方面的复杂交易来掩饰其降价。极端情形下，每个公司只能观察到自己的销售和利润，它们不仅取决于其他公司的行动，还取决于一些机会元素。比如，一家公司的机票销售量还可能取决于需求的变化，而不是仅仅取决于其他公司的秘密降价。这样，觉察和惩罚不仅变得缓慢，而且也不准确，更增强了欺骗的动机。最后，当同一个市场上有三家以上公司同时行动时，他们不仅需要找出是否存在欺骗，还要找出欺骗者是谁。否则，惩罚不但不能针对性地惩戒坏人，而且会变得迟钝无效，或许还会引发价格战，以致伤害所有人。惩罚的性质接下来是惩罚的选择。有时候，参与者会采取惩罚他人的行动，这些行动会被欺骗行为激发起来，即使在单次互动博弈中也是如此。就像我们在《洛城机密》中的囚徒困境中指出的，如果雷若伊因为替国家作证而从轻判刑，那么，他出狱后将遭到苏格和蒂龙的朋友的报复。在得克萨斯州A&M大学的课堂实验中，如果学生们可以觉察出是谁背叛了所有人的合谋而选择了1，他们就可能对欺骗者施以社会制裁，比如排斥这个欺骗者。这样，就不会有几个学生愿意为了多得50美分而冒这个险了。在博弈的结构里还存在其他类型的惩罚。一般而言，这种情况发生的原因在于这个博弈是重复进行的，这一轮欺骗的所得将导致后面几轮的损失。这些是否足以觉察出哪个参与者打算欺骗，取决于得失的大小以及将来相对于现在的重要性。我们很快就会继续讨论这个方面。如何达成合作（2）清晰性可接受行为的界限，以及欺骗的后果，对潜在的欺骗者而言应当是清晰的。如果这些是复杂的、含糊不清的，参与者就可能因为失误而欺骗，或者不能做出理性的计算，而是根据某种直觉行事。举个例子，假设彩虹之巅（RE）和比比里恩（BB）正重复进行定价博弈，RE决定，如果RE过去17个月内的平均折扣利润比同期产业资本的平均真实回报率低10％，它就推断BB欺骗了。BB不能直接知道这个规则；它必须通过观察RE的行动来推断RE所采用的规则。但是，这里陈述的规则太复杂了，BB根本无法弄清楚。所以，这不是一个阻吓BB欺骗的好方法。而像以牙还牙这样的策略就表达得相当清楚：如果BB欺骗，它就会看到RE在下次降低价格。确定性参与者应该确信，背叛将受到惩罚，合作则会得到回报。在像世界贸易组织（WTO）贸易自由化这样的国际协议中，这是一个主要问题。当一个国家投诉另一个国家违背了贸易协定时，WTO就会发起一个行政诉讼程序，而一拖就是几个月，甚至好几年。案件真相几乎对判决没有任何影响，判决通常更多地取决于国际政治规定及外交政策。这种强制执行的判决程序显然不可能发挥什么作用。规格这样的惩罚应该有多严厉？似乎没有限制。如果惩罚严厉到足以阻吓欺骗，惩罚就无须实际执行了。因此，要阻吓欺骗，最好把惩罚设定在尽可能严厉的水平。比如，WTO可以这样规定，任何国家要是违背了其将保护性关税维持在协定低水平之内的承诺，都会遭到核武器袭击。当然，大家会被这个规定吓得退缩不前，不敢欺骗；但大家至少部分会认为某个失误也可能导致核攻击的发生。在大多数情况下，当失误可能发生时，正如实际中常会发生的那样，惩罚的规格应该保持能够成功阻吓欺骗的尽可能低的水平。在极端情况下，原谅偶然的背叛甚至可能是最优的策略，例如，一家明显为生存而竞争的公司的对手可能会允许它降一点价，而不会进行报复。重复性现在来考察一下RE和BB之间的定价博弈。假设一年又一年过去了，它们彼此相处愉快，一直都把价格维持在其联合利益的最佳点，80美元。有一年，RE的经理考虑降价至70美元的可行性。他们估计，70美元的价格将会给他们带来额外的利润110 000美元－72 000美元＝38 000美元。但是这可能导致彼此信任关系的瓦解。RE应该预计到，以后几年内BB也将选择70美元的价格，每家公司将每年只获利70 000美元。而如果RE遵守了最初的协议，每家公司本可以获得 72 000美元的利润。因此，RE的降价行为将给它带来以后每年72 000美元－70 000美元＝2 000美元的损失。为了38 000美元的一次性赢利值，BE值得以后每年损失2 000美元吗？如何达成合作（3）决定现在与未来的报酬是否均衡的一个关键变量是利率。假设年利率为10％。那么，RE可以把它赚的额外的38 000美元存进银行，然后以后每年赚取3 800美元的利息。这远远超过了以后2 000美元的年损失。因此欺骗符合RE的利益。但如果年利率只有5％，那么，在以后每年，38 000美元只能给RE带来1 900美元的利息，它小于协议瓦解后的2 000美元的年损失；这样，RE就不会欺骗了。使二者均衡的利率应为2/38＝0 0526，即每年5 26％。这里的关键点在于，利率较低时，未来相对更有价值。例如，如果年利率为100％，那么未来相对现在而言价值很低，一年后的1美元只值现在的50美分，因为你可以在一年内把50美分变成1美元，另外赚到50美元的利息。但是，如果年利率为零，那么一年后的1美元的价值与现在的1美元相等。如果大家读读财经报刊，就一定经常会看到如下表述：“利率与债券价格反向变动。”利率越低，债券价格越高。债券是未来收入的保证，反映了未来的重要性。这是牢记利率作用的另一种方法。在我们所举的例子中，当实际利率稍高于5％时，对每家公司而言，把他们的最佳联合价格80美元降低10美元的动机非常小，重复博弈中的合谋可有可无。我们将在第4章中探讨，如果没有对未来的顾虑，且欺骗的诱惑无法抗拒，价格会降到多低。另一个需要考虑的相关因素是关系延续的可能性。如果这种衬衫仅仅是风靡一时的时尚商品，第二年可能根本卖不出去，那么，任何未来损失的可能性都不足以抵消今年欺骗的诱惑力。但是除了衬衫外，RE和BB还销售很多其他商品。在衬衫价格上欺骗，将来会不会招致对于对其他商品的报复？这种极大报复的可能性是否大到足以吓阻背叛？唉，对维持合作关系而言，多产品相互作用的方法是否有用没这么简单。多产品报复的可能性，伴随着立即从所有其他方面的同时欺骗中获益的可能性，而不仅仅是指一个方面。如果所有的产品都有完全相同的赢利表，那么得益和损失都会增加相同的量，这个量与产品的数量相等，因而，不论最后的均衡赢利是正的还是负的，这种变化趋势都不会改变。因此，在多产品囚徒困境博弈中，成功的惩罚必须以更微妙的方式，这取决于产品之间的差异。如何达成合作（4）第三个需要考虑的相关因素是经济规模随着时间的预期变化。这种变化包括两个方面--稳定的增长或衰退，以及波动。如果预期经济会增长，那么，现在想要背叛的公司就会认识到，由于合作关系破裂，它很可能在将来损失得更多，于是对欺骗更加犹豫。反之，如果经济正走下坡路，那么，企业知道将来没什么可拿来冒风险的，就会更倾向于欺骗。至于在经济波动期，公司更倾向于在暂时的繁荣到来时欺骗；欺骗能为它们带来更多的即时利润，但是根据平均的定义，在将来经济容量只达到平均水平时，由合作瓦解造成的利润下滑会打它们个措手不及。因此，我们预计在需求旺盛时期会爆发价格战。但情况并不总是如此。如果某时期的低需求是由普遍的经济萧条造成的，那么，顾客的实际收入就会降低，结果他们可能成为更精明的购物者，他们对某家公司或其他公司的忠诚度可能会降低，而且可能对价格差异反应更加灵敏。这种情况下，降价的公司就可以指望从其对手那里吸引来更多的顾客，从而从背叛中获得更大的即时利益。最后，参与者群体的构成十分重要。如果结构稳定而且预期会这样保持下去，就有助于维系合作。合作协议中无关的或没有参与史的参与者更可能违约。如果当前的这群参与者预计将来有新成员加入，从而动摇这种心照不宣的合作关系，这就会增加他们自己欺骗的动机，谋取一些额外的利益。康德定然律令解康德定然律令解有时候人们认为，在囚徒困境中一些人之所以选择合作，是因为他们不仅在为自己做决定，而且也在为其他参与者做决定。实际上这种说法错误的，但某些人的行动好像确实是这样。某些人真正希望的是对方也合作，并且推测对方也和他一样正经历着同样的逻辑决策过程。所以，对方一定得出与他相同的逻辑结论。因此，如果这个参与者选择合作，他推测对方也将合作，而如果他选择背叛，他推测这会导致对方也背叛。这与德国哲学家伊曼纽尔?康德（Immanuel Kant）的定然律令非常相似：“只采取那些你有望看到它成为普遍法则的行动。”当然，事实远远不是如此。在此类博弈中，一个参与者采取的行动对另一个参与者没有任何影响。但人们仍然认为他们的行动或多或少会影响其他人的选择，即使他们的行动是隐藏的。由艾利达尔?夏弗（Eldar Shafir）和阿莫斯?特维斯基（Amos Tversky）对普林斯顿大学生进行的实验，揭示了这种思维的力量。在他们的实验中，他们把16名学生置于囚徒困境博弈中。但是与普通的困境博弈不同，在某些处理方法上，他们会告诉其中一方另一方做了什么。当学生们得知对方选择背叛他们时，只有3％的学生选择了合作作为回应。而当他们得知对方选择合作时，这会使选择合作的水平增加到16％。结果仍然是大多数学生更愿意采取自私的行动。但是，很多人愿意报答对方表现出来的合作行为，即使这会让他们自己付出代价。当学生们对对方的选择一无所知时，你认为会发生什么？合作的比率会在 3％~16％之间吗？不是；而是增加至37％。从某种程度上来说，这毫无道理。既然你在得知对方背叛的情况下选择不合作，在得知对方合作的时候也选择不合作，那么，你为什么会在根本不知道对方的选择时选择合作呢？夏弗和特维斯基把这种现象称为“准神奇式”思考。它是说，通过采取某种行动，你能够影响对方的行动。一旦人们被告知对方的选择，他们就会意识到自己不可能改变对方已经做出的决定。但是，如果对方的选择仍然悬而未决，或者是保密的，那么他们就会假设自己的行动也许会对对方产生一些影响，或者对方也正采取与自己相同的推理链，并得出相同的结果。既然合作-合作优于背叛-背叛，这个人当然选择合作了。我们想要说明，这种逻辑是完全不合逻辑的。你做了什么，以及你是如何推理做出决定的，对于对方的思维和行动根本没有任何影响。他们必须在没有读懂你的想法或者看清你的行动的前提下，自己做出决定。然而，这种说法依然成立：如果社会中的人都进行这样的准神奇式思考，那么，他们就不会成为许多囚徒困境的牺牲者，反而都能从彼此之间的相互作用中获得更高的赢利。人类社会团体有可能为了这样一个最终目标，有意地向其成员灌输这种思维方式吗？商界中的困境（1）商界中的困境有了前几节实验发现和理论思想的工具装备，现在我们可以走出实验室，去看一看现实世界中的一些囚徒困境实例，并尝试克服这些困境。让我们先看看某个行业竞争企业之间的囚徒困境。通过行业垄断或组成卡特尔，维持高昂的价格，他们本可实现共同利益最大化。但是，每家企业通过背叛这种协议，秘密降价以从对手那里“偷”走生意，都可以得到更大的赢利。这些公司该怎么做呢？一些有助于成功合谋的因素，比如，不断增长的需求或者缺少破坏性的进入者，可能至少有一部分不在他们的掌控之中。不过，他们可以利用侦查欺骗的手段，设计有效的惩罚策略。如果这些公司之间定期召开会议进行沟通，合谋便更容易实现。这样，它们便可以就什么是可接受的行为，以及什么行为构成了背叛的问题，进行谈判和妥协。谈判的过程以及谈判记录，有助于保持惩罚的清晰性。如果某种行为乍看起来像是欺骗，那么下一次会议就可以澄清，它是某个参与者不小心犯下的无关紧要的、不伤大雅的错误，还是蓄意的欺骗行为。因此就可以避免不必要的惩罚。而且，这个会议还有助于集团实施适当的惩罚。并非所有的政府都非常关心大众的利益。有些政府只看重生产者的特殊利益，于是无视卡特尔组织，甚至为它们提供便利。我们不打算指明任何一个这样的政府，因为我们担心它们可能会禁止本书在该国出现！问题在于，企业集团成功地解决了自己的困境，却伤害了公众的利益。消费者必须支付更高的价格，而这些公司却为了维持高价而减少供给。就像亚当?斯密说的那样：“同一交易的人们很少全部聚在一起，即使是对于娱乐和消遣的交易也是这样，但对话总是最终以对抗公众的合谋或提高价格的诡计结束。”17政府想要保护公众的利益，于是加入博弈，制定反托拉斯法，规定公司以这种方式合谋是不合法的。在美国，《谢尔曼反托拉斯法案》禁止“以限制贸易或商业为目的”的合谋，在这些合谋中，价格配合或市场份额配合是最基本的，也是最常发生的。事实上，最高法院已经规定，不仅这种明确的合谋协定是被禁止的，而且公司之间的任何有价格配合作用的显性或隐性的协定，无论其主要意图是什么，都违反了谢尔曼法案。公司一旦触犯这些法律，其执行总裁就会有牢狱之灾，而不仅仅是作为法人的公司缴纳罚款。这些公司努力想规避对非法行为的制裁。1996年，ADM公司--美国主要的农产品加工商，与其日本竞争对手味之素公司陷入了这样一场合谋官司。它们商定了各种产品的市场份额和定价协议，包括赖氨酸（它由玉米制成，用于养鸡和猪）。这样做的目的是以顾客利益受损为代价维持高昂的价格。它们的理念是：“竞争者是我们的朋友，顾客则是我们的敌人。”由于ADM公司的某个谈判代表当了联邦调查局（FBI）的线人，他对多次会议进行了录音或录像，于是这两家公司的恶行得以曝光。18商界中的困境（2）在反垄断史和商学院案例分析中，一个著名的案例是关于大涡轮发电机的。1950年，美国市场有三家公司生产涡轮发电机：通用电气公司最大，占有大约60％的市场份额；其次是西屋电气公司，占大约30％的市场份额；爱科公司则占10％的份额。它们采用了一种很精明的协调方法，来维持各自的占有率，并获得高价。下面是这种方法的运作过程。电力公共事业为打算购买的涡轮发电机招标。如果招标在历月的1~17日发布，西屋和爱科必须各自提交一个非常高的竞价，且该竞价必定失败，这样，通用就会以最低的竞价（但仍是可获得高额利润的垄断价格）成为合谋推举出来的胜出者。类似地，如果招标是在18~25日发布的，西屋就是指定胜出者，而爱科则是26~28日的指定胜出者。由于电力公共事业并不根据月历发布他们的招标计划，因此久而久之，每家生产商都得到了协议的市场份额。任何违背协议的公司很快会被对手发现。但是，只要司法部门不把胜出者跟月历联系起来，合谋就不会被法律觉察。不过，当局最终确实找出了这种规律，这三家公司的一些执行总裁锒铛入狱，有利可图的合谋就此瓦解。稍后我们还会讲到其他不同的合谋阴谋。19后来，1996~1997年，无线电波段拍卖的竞标中出现了“涡轮机阴谋”的变体。一家公司如果想得到某个特定地区的许可权，它就会通过把该地区的电话区号作为其出价的后三位数字，向其他公司暗示自己争取该许可权的决心。这样，其他公司就会让它胜出。只要同一个公司集团能长期在大量的这种拍卖中相互影响，只要反垄断当局没有察觉出这种规律，这种阴谋就可能继续维持下去。20更普遍的情形是，某个行业中的公司会尽力达成，并维持未经明确沟通的、隐含的或心照不宣的协议。这消除了反托拉斯犯罪行为的风险，尽管反托拉斯当局可以利用其他方法结束隐含的合谋。不利之处在于协议不够清晰，且欺骗难以觉察，不过公司可以设计一些方法来改善这两个方面。商界中的困境（3）公司可以按照地域、生产线或某种类似的方式协议分割市场，而不是协议定价。这样，欺骗就更加显而易见，一旦其他公司“偷”走了分给你的部分市场，你的销售人员很快就会知道。借助于“匹配竞争或殊死一搏”政策或最惠顾客条款之类的方法，商家可以更加简便地察觉降价，而报复也将得以迅速、自动地执行；在零售业尤其如此。许多销售家用产品和电子产品的公司高调地宣称，其价格将低于任何竞争对手的价格。有些公司甚至保证，如果你购买产品后一个月内发现其他同类产品价格更低，它们会退回差额，有时甚至双倍退回差额。乍一看，这些策略似乎以承诺低价促进了竞争。但只要有一点点博弈论思维就会知道，实际上它们所起的作用恰巧相反。假设彩虹之巅（RE）和比比里恩（BB）都采取了这样的政策，且它们的隐含协议是将衬衫定价为80美元。现在，每家公司都知道，如果它偷偷降价至70美元，对手很快就会发现；事实上，该策略最精明的地方在于，它让那些对低价最敏感的顾客承担了侦查欺骗的职能。而且潜在的背叛者也知道，对手会立即降低自己的价格来报复它，甚至不用等到明年的产品目录印刷出来。因此，这就更有效地吓阻了背叛者。匹配竞争或殊死一搏的承诺可以是灵活的和间接的。在普惠公司（P&W）和劳斯莱斯公司（RR）争夺波音757和767的喷气式飞机引擎市场的竞争中，普惠公司向所有潜在购买者承诺，它的引擎相对于劳斯莱斯公司的引擎可以节省8％的燃料，否则它将赔付燃料成本的差额。21最惠客户条款是说，所有客户将享受公司向最惠客户提供的最优惠价格。从表面上看，这些生产商是在保证最低价。不过，让我们深入考察一下。该条款意味着，这些生产商不能展开竞争，不能通过提供一个带有选择性的折扣价格，将其对手的顾客吸引过来，同时却只向它的熟客提供原来的较高价格。否则，它们必须一起降价，而那样做的代价会大得多，因为它们卖出的所有产品的利润都下降了。你可以看出这个条款对一个卡特尔有什么好处：欺骗所得小于欺骗所失，因此卡特尔也更容易维持。美国反托拉斯执法系统的部门之一，联邦贸易委员会曾经评估过这个条款，杜邦公司、乙烷基公司和其他生产抗震汽油添加剂的公司都被指控使用了该条款。联邦贸易委员会裁定其存在反竞争效果，并且禁止这些公司在它们与客户签订的合同里使用这个条款。商界中的困境（4）这一裁决并非没有争议。委员会主席詹姆斯?米勒（James Miller）就不同意。他写道，这个条款“按理说能够减少买家的搜索成本，使他们能够在众多卖家里找到具有最佳性价比比的卖家”。要想得到更多关于此案例的信息，请参阅“In the matter of Ethyl Corporation et al ”FTC Docket 9128，FTC Decisions，pp 425~686。产权确立问题实际发生在英国。两次“圈地”浪潮，第一次由都德王朝时期的地方贵族发起，第二次由18~19世纪的议会行动发起，使得过去的公有土地归私人所有。一旦土地成为私有财产，那只“看不见的手”就会恰到好处地把门关上。土地所有者将收取放牧费，使其租金收入最大化，而这降低了土地的使用率。此举将提高总体经济效益，但也改变了分配状况；放牧费将使土地所有者更加富有，使牧民更加贫穷。即使不考虑这种分配的后果，这种方法也不总是可行的。公海或SO2、CO2排放的产权很难在缺少一个国际政府的前提下界定和执行：鱼和污染物会从一个海域漂流到另一个海域，风会携带SO2越过国界，任何国家排放的CO2也升到了同一个大气层中。由于这个原因，捕鲸、酸雨或全球变暖问题都必须通过更直接的控制来解决，但是保障这种必要的国际协议的执行并非易事。公财悲剧（1）公财悲剧在本章开头所列举的例子中，我们提到了过度捕捞之类的问题，这些问题产生的原因在于，人人都想拿走更多，从中获益，而他的行动却危害了其他人甚至以后几代人。加利福尼亚大学生物学家盖勒特?哈丁（Garrett Harding）把这种问题称为“公财悲剧”，他在他的例子中引用了15~16世纪英国公有土地上的过度放牧问题。22现在，“公财悲剧”这个名字已经使这个问题变得非常有名了。如今，全球变暖的问题是一个更为严重的实例；没有一个人能从减少二氧化碳排放的行动中得到足够的私人利益，但若每个人都只追逐自身利益，所有人都会遭受严重的后果。这正是一个多人囚徒困境，就像《第22条军规》中尤塞里安在战争中所面临的生命危险那样。当然，社会团体已经认识到对此类困境放任不管的代价，开始尝试一些努力，试图达到更好的结果。这些努力能否成功取决于什么呢？印第安纳大学政治科学家埃莉诺?奥斯特罗姆（Elinor Ostrom）与她的拍档和学生们，实施了一系列令人印象深刻的研究，试图克服公财悲剧困境，即从整体利益角度使用并保护公共财产资源，避免过度开发和快速损耗。他们研究了某些成功或不成功的做法，并得到了达成合作的某些前提条件。23第一，必须有清晰的规则界定谁是博弈参与者群体中的一员--那些拥有资源使用权的人。界定的标准通常是地域或住所，但也可以以种族或技能为基础，成员资格也可以通过拍卖或支付报名费获得。第二，必须有清晰的规则界定所允许和所禁止的行为。这些规则包括对使用时间（狩猎/渔业开放及禁止的季节、可种植的作物种类、特定年份休耕的要求）、地点（近海捕捞的固定位置或指定轮作）、技术（渔网大小），以及资源量或份额（允许每个人从森林砍伐并拿走的木材量）的限制。公财悲剧（2）第三，对违反上述规则的惩罚机制必须明确，并让各方了解。这不一定是详细的书面准则；稳定社区中的分享准则同样也可以清晰有效。对违反规则者的制裁，可以是口头警告或者社会排斥、罚款、剥夺未来权利，以及在极端情况下的监禁。每种惩罚的严厉性还可以适当调整。对于第一次疑似欺骗的行为，处理方法通常只是与违规者直接面谈，要求其解决问题。而且第一次或第二次违规的罚款较低，只有在违规行为持续发生，或者变本加厉时，惩罚才会升级。第四，必须建立一个察觉欺骗的有效机制。最好的方法就是在参与者的日常生活过程中建立自动侦查机制。例如，有好坏区域之分的渔业，可以指派渔民轮流在好的区域捕捞。被分配到好区域的人会不自觉地注意是否有人违反规则，并且他们有最强的动机向其他人检举违规者，让集体能够实施合适的制裁。另一个例子是关于一条规定：必须以集体的形式从森林及类似的公有地区收割；这个规定有利于大家共同监督，而无须雇人看护。有时，规定什么是允许行为的规则，必须按照可行的侦查手段来设计。比如，渔民的捕捞量通常难以精确监督，即使是善意的渔民也很难准确控制其捕捞量。因此，基于捕捞数量配额的规则很少被使用。当数量更容易、更精确地观测时，数量配额规则就能更好地发挥作用，正如储水供应和森林砍伐一样。第五，当上述几项规则和执行机制设计好后，事实证明，具有前瞻眼光的使用者可以轻松获得的信息特别重要。虽然每个人都有事后欺骗的动机，但他们有共同的先验利益，去设计一个优良的制度。他们可以充分利用自己对资源及资源开采技术，察觉各种违规行为的可行性，以及在集体中实施各种制裁的可信度的认识。事实证明，集中式和自上而下的管理模式会让此类事情大量出错，不能很好地发挥作用。关于人们可以利用局部信息及规范机制，找到许多集体行动的解决方法这个问题，虽然奥斯特罗姆和她的拍档持总体乐观态度，但她给出了事情并非完美的忠告：“困境永远不会彻底消失，即使在最佳的运作机制中……监督和制裁无论怎样也不能将诱惑降低至零。不要只想着如何克服或征服公财悲剧，有效的管理机制比什么都管用。”自然界的腥牙血爪自然界的腥牙血爪正如你所料，除了人类，在其他物种之间也会发生囚徒困境。在搭建住所、采集食物、逃避捕食者之类的事情中，动物的行为可能是对自己或直系亲属有利的自私行为，也可能是对较大的群体都有利的行为。什么样的环境能促成好的集体结果？进化生物学家们已经研究了这个问题，并发现了一些有趣的例子和观点。这里给出一个简单的例子。24曾经有人问过英国生物学家J B S 霍尔丹（Haldane）这样的问题：他是否会冒着生命危险去救一个同伴，霍尔丹回答：“如果是救2个以上的兄弟，或者8个以上的堂兄弟，那么我会的。”你和你的兄弟拥有一半相同的基因（同卵双胞胎除外），和堂兄弟有1/8的基因相同；因此，你这样做，会使复制到下一代的你的基因数的期望值增加。这样的行为具有很大的生物学意义，因为进化过程会促进这种行为。这种近亲之间合作行为的纯基因基础，解释了在蚁群和蜂房中所观察到的令人惊叹的复杂的合作行为。在动物中，没有这种基因纽带的利他行为非常罕见。但是，如果一个动物群体中的成员之间的相互作用足够稳定和长久，那么即使没有太多的基因一致性，互惠的利他行为也有可能发生，并持续下去。结群猎食的狼及其他动物就是这样的例子。下面的例子有点儿可怕，却令人吃惊：哥斯达黎加的吸血蝙蝠通常12只左右群居在一起，但是单独猎食。每天，总有一些吸血蝙蝠运气较好，而其他蝙蝠运气不好。幸运的吸血蝙蝠饱餐后飞回到整个群体居住的洞穴，可以把他们从猎物吸食的血液反刍出来，分给其他蝙蝠。三天没有吸到血的蝙蝠会面临死亡的危险。这个群体通过这样的分享，形成了相互“保险”、对抗死亡危险的有效方法。25马里兰大学生物学家杰拉尔德·威尔金森（Gerald Willkinson）将不同地区的吸血蝙蝠集中起来放在一起，探讨了这种行为的原因。他有规律地扣留其中一些蝙蝠的血，观察其他蝙蝠是否会把血分给它们。他发现，只有当蝙蝠快要饿死时，才会有其他蝙蝠把血分给它。蝙蝠似乎能够将真正的需要和暂时性的坏运气区分开来。更有趣的是，他发现只有在以前群体中彼此相识的蝙蝠才会相互分食，而且它们也更愿意分给以前帮助过自己的蝙蝠。也就是说，蝙蝠能够认出其他蝙蝠，记住它们过去的行为，从而形成有效的互惠利他制度。捷足先登（1）捷足先登加拉帕戈斯群岛是达尔文雀的故乡。在这些火山岛上生存十分艰难，因而进化压力巨大。即使雀喙的一点微小变化，也会使得生存竞争变得截然不同。这个例子最先出现在乔纳森?韦纳（Jonathan Weiner）的著作The Beak of The Finch: A Story of Evolution in Our Time（New York: Knopf, 1994），详见chapter 20: “The Metaphysical croosbeak”。每座岛的食物来源都不同，雀喙正反映了这些差异。在戴费尼岛上，仙人掌是主要的食物来源。在这个岛上，名为仙人掌雀的鸟已经进化出理想的喙，很适合在仙人掌开花时采集花粉和花蜜。鸟类不会有意识地彼此博弈。然而，每种鸟喙的演变都可以看做它生存的策略。有利于采集食物的策略，将促进生存、配偶选择和繁殖后代。雀喙是这种自然选择与性别选择相结合的产物。即使看来一切正常，遗传也会给这种结合带来些许波折。有句老话说得好，早起的鸟儿有虫吃。在戴费尼岛上，是早起的雀儿有花蜜吃。很多雀鸟不是等到上午九点仙人掌自然开花的时候去采集花粉和花蜜，而是尝试一种新方法。它们会掰开仙人掌花，抢占先机。乍一看，这样做似乎使这些雀鸟比它们晚到的对手们更有优势。唯一的问题在于，在掰开花的过程中，雀鸟们往往会弄断花柱。正如温纳解释的：［花柱］是中空管的顶端，它像一根直长的吸管那样从花中心伸出来。花柱断了，花就会绝育。因为花粉中的雄性细胞触不到花蕊中的雌性细胞。于是，仙人掌花没有结果便枯萎了。26仙人掌花一旦枯萎，仙人掌雀的主要食物来源就没有了。你可以预测这个策略的最终结果：没有花蜜，没有花粉，没有种子，没有果实，于是就没有了仙人掌雀。这是否意味着，进化导致雀鸟陷入了囚徒困境，而这个困境的最终结果是灭绝？案例讨论不完全是这样，原因有两点。由于雀鸟是区域性的，所以那些仙人掌灭绝地区的雀鸟（及其后代）结果会成为失败者。不值得为了今天能多采一点儿花粉，就切断来年邻近地区的食物供给。因此，相对于其他鸟类来说，这些变异的雀鸟看起来不具有适应优势。但是，如果该策略能得到普遍运用，结论就大不相同了。变异雀鸟可以扩大它们的食物搜寻范围，即使是那些等在那儿的雀鸟也救不了仙人掌花柱。假定接下来一定会发生饥荒，那么最有可能生存下来的是那些从一开始就处于最强势地位的雀鸟。额外的一点儿花粉可能会导致这种差别。捷足先登（2）我们这里讨论的是癌扩散式的适应性。如果这种适应性一直很微弱，它可能会消失。但是，如果它变得很强，它就会成为处于正在下沉的船只上的最佳策略。一旦这种策略变得有利--即使是相对有利，解决它的唯一方法是淘汰整个种群，重新开始。戴费尼岛上没有了雀鸟，就不会有鸟弄断花柱，仙人掌就会再开花。当两只幸运的雀鸟飞落在这个岛上，它们就有了重新开始进化的机会。关于卢梭的猎鹿博弈，还有一些其他的解释，我们将在第4章再继续讨论。我们接下来讨论的博弈类似于囚徒困境，它是关于哲学家让-雅克?卢梭分析的“猎鹿”博弈的一个生死攸关的例子。在猎鹿博弈中，如果人人合力捕鹿，他们就能成功，所有人吃得很好。但一旦某些猎人在猎鹿过程中突然碰上野兔，问题就产生了。如果太多猎人转而追逐野兔，就没有足够的猎人去捕鹿。在这种情形下，每个人都最好去追逐野兔。当且仅当你有信心确定大多数人都会猎鹿的时候，你最好的策略才是猎鹿。你就没有任何理由不去猎鹿，除非你缺乏信心，不确定其他人会怎么做。结果就成了一个信心博弈。博弈进行的方式可以有两种：齐心合力，生活美好；或者，各为己利，生活穷困短缺。这不是经典的囚徒困境，因为在经典囚徒困境中，不论别人怎么做，人人都有欺骗的动机。而在这里，只要你相信别人跟你做的一样，就不存在欺骗的动机。但你能信任他们吗？即使你信任他们，你能相信他们也同样信任你吗？或者，你能相信他们会相信你信任他们吗？就像富兰克林?德兰诺?罗斯福（在不同的背景下得出）的名言：除了恐惧本身之外，我们没什么可恐惧的。更多关于囚徒困境的实例，请参阅第14章中的案例研究：“1美元的价格”和“李尔王的难题”。天天读书网（www.book.d78i.com）整理