第十二章 好人终有好报 · 3(1/1)
你也许还记得,进化稳定策略在众多的种群策略中占有许多席位,也一直得到不错的结果。如果说“针锋相对”是一种进化稳定策略,这便是说,“针锋相对”策略在充满“针锋相对”策略的大环境下能得到不错的结果。这便是一种特殊的“强劲”。作为进化论者,我们一直很想找到一种唯一的、可以直接决定结果的“强劲”。为什么这很重要呢?因为在达尔文主义的世界里,成功并不是赢得金钱,而是获得后裔。对于一个达尔文主义者,一个成功的策略将是一个在种群策略中数量众多的策略。如果这个策略要保持成功,它必须在同类众多时——也就是充满了自身复制的大环境中得到特别好的结果。
阿克塞尔罗德又模仿自然选择,进行了第三场竞赛来寻找进化稳定策略。事实上,他并没有称之为第三次竞赛,因为他并没有邀请新的参赛者,而只是使用了第二次竞赛中的63个策略。但我觉得称它为第三次竞赛比较合适,它和前两次“循环赛”有根本性的不同。
阿克塞尔罗德将这63个策略再次丢给计算机,来制造进化演替的“第一代”。 “第一代”的大环境中由这63个策略组成。结束后,赢家不再得到“金钱”或者“分数”,而是与其完全相同的“后代”。世世代代如此传递,一些策略逐渐变得数目稀少,甚至完全绝迹,另一些策略则数目众多。当环境中策略的比例变化,博弈中策略的出牌也在随之变化。
最终在1 000代之后,种群不再变化,环境也没有再改变,稳定的状态已经形成。在此之前,各种策略的命运起伏不定,正如我模拟的“骗子”、“傻瓜”和“斤斤计较者”的命运一样。一些策略在博弈开始便已经灭绝,大多数则在200代之后彻底灭绝。在那些恶意策略中,有一两个一开始蓬勃发展,但它们的繁荣正如我的模拟预测一样,只是昙花一现。唯一活过200代的一个策略叫做“哈灵顿”(harrgton)。它的数目在前150代中直线上升,而后逐渐减少,在1 000代之后终于完全灭绝。“哈灵顿”短期繁荣的原因跟我的“骗子”是一样的。当那些如“两报还一报”之类的老实人(过于宽容)还在世时,它欺负它们以获得发展。但当这些老实人已经消失之后,“哈灵顿”失去了猎物,也跟随着它们的命运而灭绝。剩下的策略都类似于“针锋相对”,既善良又容易被煽动报复。
“针锋相对”本身在第三轮竞赛中,6次中有5次得了第一,重复其在第一、二次竞赛时的好运。另外5个虽善良但容易报复的策略则几乎和“针锋相对”一样成功(在种群数目上),还有一个策略甚至赢了第6次博弈。当所有恶意策略都灭绝后,所有的善良策略与“针锋相对”都无法辨认彼此了,因为它们都很善良,只是简单与所有对手“合作”到底。
这种“无法辨认”情况使得“针锋相对”在严格意义上不是一个真正的进化稳定策略,即使它看起来确实很像。一个策略要成为进化稳定策略,当它是常见策略时,它不可被少数变异策略所同化。虽然“针锋相对”不会被任何恶意策略同化,但另一个善良策略则可能做到。正如我们所看到的,在善意策略的群体里,它们面目模糊,行为相同,始终合作。因此,有一些其他善良策略,比如“永远合作”这种选择优势不如“针锋相对”的策略,也可以溜进种群里而不被发现。所以严格地说,“针锋相对”并不是进化稳定策略。
你也许会认为,如果世界充满善良,我们便可以认为“针锋相对”是一个进化稳定策略了。但即使如此,你可以看到接下来的故事。“永远合作”与“针锋相对”不同,它并不能抵挡一些恶意策略的入侵。比如,“永远背叛”的攻击便可以打败“永远合作”,它可以每次都得到“背叛诱惑”的最高分。类似“永远背叛”这样的恶意策略会减少过分善良策略的数目,比如“永远合作”。
虽然严格来说,“针锋相对”并不是一个真正的进化稳定策略,但在实际操作中,将这一类基本善意又宽容、与“针锋相对”类似的策略近似看做进化稳定策略,也是可行的。这一类策略里甚至可以包括一小部分恶意策略。阿克塞尔罗德的研究后继有人,罗伯特·博伊德与杰弗里·洛伯鲍姆则是在这些后续研究者中得出最为有趣的成果。他们将“两报还一报”与另一个“针锋相对多疑版”(spicio tit for tat)的策略组合到一块儿。“针锋相对多疑版”近似于“针锋相对”,但本质上是一个恶意策略,虽然恶意程度不高。它只在第一回合采取“背叛”行动,之后的所有出牌与“针锋相对”完全相同。在一个“针锋相对”占主要地位的环境中,“针锋相对多疑版”并不走运,因为它的先行背叛导致了系列互相背叛的恶性循环。但当它遇上了“两报还一报”时,这场冤冤相报则由对方的慈爱宽恕而化解了,双方都能至少得到满分,而“针锋相对多疑版”还会因为其最初的背叛而获得更高的分数。博伊德和洛伯鲍姆的结果表明,“针锋相对”的群体可以被“两报还一报”与“针锋相对多疑版”的组合入侵影响。从进化论角度上说,则是“两报还一报”与“针锋相对多疑版”共生繁荣,进而影响了“针锋相对”的种群。这种组合几乎可以肯定不会消亡,而是以这种方式入侵相对稳定的种群。事实上,也许还有很多其他由稍微恶意与极度圣洁策略的组合可以入侵种群。有人也许可以从这里看到人类生活的对照。
阿克塞尔罗德意识到“针锋相对”并不是严格意义上的进化稳定策略。他于是又创造了一个术语:集体稳定策略。由于在真正的进化稳定策略中,可以有不止一个策略同时达成集体稳定。另一方面,决定一个策略是否可以控制种群,更取决于其运气。“永远背叛”的策略也可以和“针锋相对”一样稳定。在一个被“永远背叛”控制了的种群中,没有任何其他策略可以取胜。我们也可以将这种系统称为“双稳态”,而将“永远背叛”作为其中一个稳定点,“针锋相对”(或者其他最善良宽容策略的组合)为另一个稳定点。无论哪一方首先在种群中达到数量优势,则将继续保持稳定。
然而,这个数量优势如何量化?一个群体中,究竟需要多少“针锋相对”来保证其战胜“永远背叛”?这取决于银行家愿意在这场博弈中付出的具体数额。我们可以将此概括为一个决胜点。如果“针锋相对”可以超过这个决胜点,自然选择便会愈加偏爱“针锋相对”。另一方面,如果“永远背叛”超出了这个决胜点,自然选择则会更加偏爱它。你也许还记得,我们在第十章中斤斤计较者与骗子的故事里,也曾与这个决胜点相遇过。
于是,获胜的关键显然取决于哪一方首先超过决胜点。而且我们还需要知道,有时主导种群还会变化,从一方变成另一方。我们假设现有的种群已经由“永远背叛”作为主导了。少数派的“针锋相对”难以互相碰面从而得到共享利益。自然选择于是将该种群推向了“永远背叛”的极致。只有该种群通过随机转换,使主导的一方变为“针锋相对”,它才能继续推进“针锋相对”的发展,使得所有人都能从银行家(或者自然)处得到利益。然而,种群没有集体意愿,也没有集体意识或目的。他们不能控制发展走向。主导方的转换只能发生在自然界间接力量的作用下。
这种情况如何发生呢?一种回答是“运气”。但这个单词只能显示无知。它表示“由一些尚未知道、未能分辨的方式来决定”。我们可以比“运气”做得更好一些。我们可以想象少数派的“针锋相对”个体如何从一个实际方法来增加其关键数目,探索“针锋相对”个体如何集合成足够的数量,使它们都可以从银行家处得到回报。
这种想法貌似可行,但实际上机会渺茫。这些相似的个体如何在一个小范围内集合到一起?在自然界中,最明显的方式是由基因关系——亲属而集合。大多数动物喜欢同自己的兄弟姐妹与表亲们,而不是种群中其他成员居住在一起。这并不一定是出于选择,而是自动跟随种群中的“黏性”。这里的“黏性”指的是任何使个体持续居住于出生地的趋势。比如在人类历史上,大部分地区的人们都只居住在出生地以外几英里的地方(虽然现代社会已经不再如此)。因此,亲属的小团体们逐渐形成。我曾经到访过爱尔兰西海岸一个偏远的岛,令我吃惊的是,那里几乎所有人都拥有巨大的耳朵。其中的原因很难解释为大耳朵适应当地天气(那里岸边的风特别大)。这只能是因为岛上大多数居民都是亲缘相近的亲属。
基因相近的亲属们不仅在面部特征上相似,其他方面也有相近之处。比如,他们会因其基因趋势而互相模仿着采用(或不采用)“针锋相对”。于是,即使“针锋相对”在种群整体里已经稀少,它依然可能在局部中广泛使用。在这个小圈子里,“针锋相对”的个体可以互相博弈,采取互相合作的方式来达到数目繁荣,即使在总体计算里它们依然处于弱势地位。由此,最初仅占领小片地区的“针锋相对”个体,将随着小团体的逐渐扩大,逐渐向其他地区分散,甚至包括“永远背叛”群体占主导的地区。如果用区域地理的方式思考,我举的爱尔兰岛的例子则有些误导,因为那里的人们被自然地理隔绝了。想象另一个例子:一个迁移不多的人群中,即使这片地区的人们已经有了广泛持续的亲缘关系,所有人也只复制近邻(而不是远邻)的行为。
回头看看,“针锋相对”是可以超越决胜点的,它所需的只是这些个体的聚合,这一点在自然选择里可以很自然地发生。这个与生俱来的优点使得“针锋相对”即使在数目稀少的时候,还可以成功跨越决胜点而获得成功。但这个跨越只是单向的。“永远背叛”作为一个真正的进化稳定策略,并不可以使用个体聚合来跨越决胜点。相反的是,“永远背叛”个体的聚合,不仅不能彼此互助而获得群体繁荣,还会使各自的生存环境更加恶劣。它们无法暗自帮助对方获得银行家的奖赏,而只能把对方也拖下水。于是与“针锋相对”相反,“永远背叛”从亲属或种群聚合中得不到任何帮助。
所以,即使“针锋相对”并非真正的进化稳定策略,它却拥有更高的稳定性。这意味着什么?如果我们采用长远的目光来看,“永远背叛”可以在相当长一段时间内抵制其他策略的影响,但如果我们等上很长一段时间,也许是几千年后,“针锋相对”将最终聚集到足够的数目,跨越决胜点,其数量终将反弹。而反方向的发展并不可能,“永远背叛”无法在个体聚集中获得好处,因此也无法得到这种更高的稳定性。