你也许还记得,进化稳定策略在众多的种群策略中占有许多席位,也一直得到不错的结果。如果说“针锋相对”是一种进化稳定策略,这便是说,“针锋相对”策略在充满“针锋相对”策略的大环境下能得到不错的结果。这便是一种特殊的“强劲”。作为进化论者,我们一直很想找到一种唯一的、可以直接决定结果的“强劲”。为什么这很重要呢?因为在达尔文主义的世界里,成功并不是赢得金钱,而是获得后裔。对于一个达尔文主义者,一个成功的策略将是一个在种群策略中数量众多的策略。如果这个策略要保持成功,它必须在同类众多时——也就是充满了自身复制的大环境中得到特别好的结果。
阿克塞尔罗德又模仿自然选择,进行了第三场竞赛来寻找进化稳定策略。事实上,他并没有称之为第三次竞赛,因为他并没有邀请新的参赛者,而只是使用了第二次竞赛中的63个策略。但我觉得称它为第三次竞赛比较合适,它和前两次“循环赛”有根本性的不同。
阿克塞尔罗德将这63个策略再次丢给计算机,来制造进化演替的“第一代”。“第一代”的大环境中由这63个策略组成。结束后,赢家不再得到“金钱”或者“分数”,而是与其完全相同的“后代”。世世代代如此传递,一些策略逐渐变得数目稀少,甚至完全绝迹,另一些策略则数目众多。当环境中策略的比例变化,博弈中策略的出牌也在随之变化。
最终在1000代之后,种群不再变化,环境也没有再改变,稳定的状态已经形成。在此之前,各种策略的命运起伏不定,正如我模拟的“骗子”、“傻瓜”和“斤斤计较者”的命运一样。一些策略在博弈开始便已经灭绝,大多数则在200代之后彻底灭绝。在那些恶意策略中,有一两个一开始蓬勃发展,但它们的繁荣正如我的模拟预测一样,只是昙花一现。唯一活过200代的一个策略叫做“哈灵顿”(Harrington)。它的数目在前150代中直线上升,而后逐渐减少,在1000代之后终于完全灭绝。“哈灵顿”短期繁荣的原因跟我的“骗子”是一样的。当那些如“两报还一报”之类的老实人(过于宽容)还在世时,它欺负它们以获得发展。但当这些老实人已经消失之后,“哈灵顿”失去了猎物,也跟随着它们的命运而灭绝。剩下的策略都类似于“针锋相对”,既善良又容易被煽动报复。
“针锋相对”本身在第三轮竞赛中,6次中有5次得了第一,重复其在第一、二次竞赛时的好运