贾宝玉与主教米里埃-帕布莉卡

《红楼梦》第二十二回写到贾府给宝钗过生日，众人看戏，好不热闹。凤姐为了讨好贾母，暗示贾母喜欢的小戏子打扮起来像黛玉，却不说破，反要众人猜。众人心里明镜似得，却无人敢说出口，因都知黛玉小性儿，说出来怕得罪于她，只湘云直着脖子喊了出来，宝玉连忙给湘云使眼色，眼神却被黛玉逮个正着。湘云怪宝玉心中只有他的林妹妹，不能让林妹妹受一点气；黛玉嫌宝玉袒护湘云，心中亦气不过。儿女之间的情丝，理清楚也难，黛玉湘云间的纠葛不是一天之功，宝玉的善意举动，不过是个药捻子，同时引着了两桶火药，自己也落了两头的不是。

《悲惨世界》开篇男主人公冉阿让的出场令人动容。饱受19年牢狱之苦的冉阿让对世界充满了仇恨，整个世界对他同样冷漠至极，直到遇到了米里埃主教。主教在一个他饥寒交迫却走投无路的夜晚接纳了他，供他以热腾腾的饭食，干净整洁的床铺。不相信这个世界的冉阿让，当晚就偷了主教的银器逃之夭夭，不想天还没亮就被警察截获并再次送到主教面前。戏剧性的一幕展开了，主教不但没有指证冉阿让，却跟警察解释银器都是自己送给冉阿让的礼物，还嗔怪他忘记带走一并赠予他的那两支银烛台。主教善意的举动，融化了一颗早已被冻硬的心，冉阿让重新拾起了希望，随着全书的展开，最终完成了自我救赎。

很难说，一个善意的举动，就一定会让事情朝自己期待的方向去发展。甚至从一而终的善意行事，也不一定保证会有善意的回报：红楼梦全书中，宝玉的一举一动，自始至终无一星一点恶意，到罢呢？曹雪芹落笔道，“满纸荒唐言，一把辛酸泪”，一声叹息。

一个广为人知的理论，“囚徒困境”：甲乙两名嫌犯，被警方隔离开来，分别审讯，并向双方提供相同的选择：要么认罪并检举对方，要么沉默不认罪。如果一人认罪并检举了对方，本人即时无罪释放，对方服刑10年；如果两人都保持沉默，则两人同样判刑半年；如果两人都认罪并指控对方，则二人同坐5年牢狱。

在这样一种被阻断交流的环境下做选择，从利己角度出发，个人都寻求自身利益的最大化，那对于甲乙两名囚犯，无疑二人同时选择认罪是最佳策略。因为甲如果选择沉默，就要承担乙选择认罪的后果——甲坐牢10年，同时乙无罪释放。10年牢狱的和无罪释放，天壤之别，对比的差距大到无法承受，个人一定会极力避免这种可能性的发生。最重要的是，一个人选择了沉默，在信息隔绝的情况下，对方并不知晓，那么善意的选择，就成了风险最大选项。这个经典案例之所以被冠以“困境”之名，是因为个人以自身利益最大化做选择时，得出的结果并不是团体的最佳选择，甚至是双输的结局：只有甲乙都沉默，承担自身被判10年的风险，才有可能达到二人都只判半年的团体最优解。现实中，一些国家的司法机构也避免在审讯过程中出现囚徒困境，也禁止使用“坦白从宽”的策略：如果甲真的是无辜的，选择沉默，乙是犯法者，选择认罪并且冤枉清白者甲，那结果是乙坦白从宽得到了减刑，坚持自己无罪的甲却也得跟着蹲监狱。

如果从数学家精心假设出的囚徒困境试验中得出结论，“人最好还是学聪明点，不要对别人那么好，到头吃亏的是自己”，未免操之过急。关键的一点是，正常的人际交往中，信息并不是绝对封闭的，应用囚徒困境的前提不成立，结果即不必然是双输的局面。不审视前提的胡乱解读科学研究结论，难保熬出的不是一碗碗毒鸡汤。数学家们还做了更多扩展性的实验来模仿人际交往，比如著名的重复囚徒困境，与单次囚徒困境不同，做选择的甲乙不再一局定胜负，而是进行多次博弈，并且信息不再完全封闭：前一轮的选择结果会同时公布给甲乙双方，继而影响下一轮的选择。几十种选择策略经过厮杀，结果令人称奇却也不感意外：大凡善意的策略，尤其是不首先选择背叛的策略，最终获得分数最高。具体游戏过程和结果请参看文末附上的补充阅读，也可以去KK的成名作《失控》中找更多的解读。

一个有趣、也极易令人尴尬的问题：如果自己不幸在生活中陷入到了类似囚徒困境的状态，我会不会承担高昂的风险，选择善意的信任？有多少人可以牺牲眼前触手可及的利益来选择善意处事，特别是当并不能确定自己是、或自己根本不会是长期利益的受益者时。

佛说，我不下地狱，谁下地狱。耶稣说，我愿代所有人受罪。历经千年，流传于世的宗教，大凡是劝人向善的，又大凡是提倡牺牲精神的。为什么选择了善，却要承受牺牲？信任和牺牲仿佛成了一对感情特别好的双生子，难分难解。放在单次囚徒困境的例子下去想，似乎就不难理解：选择善意，极有可能是牺牲自我，成全他人。然而，利他行为在宗教的语境下，备受推崇，似乎又和重复囚徒得到的结果相符：善意、信任、自我牺牲，是人群以合作的方式生存于世的基石。

这里引用一段熊培云谈信任的文字：

“……信任固然是好，但不信任也并非都是坏事。套用尼布尔的话，人有恶的倾向，所以不信任成为必要；人有善的倾向，所以信任成为可能。而洛克和孟德斯鸠的分权理论、梭罗的公民不服从主张也是基于对政府的不信任，防止人性中恶的倾向。同样，对于普通民众而言，适当的不信任也是一种自我保护，因为信任一个人是需要成本的。打个比方，隔壁老王让一位朋友给他买速效救心丸，结果这位朋友满脑子都是单位评职称的事，忘了买药。这时候老王不光是错失了找其他人救自己的机会，甚至可能连命都搭上了。”

信任一个人是需要成本的。选择善意是有代价的。生活不是童话，不是做了好事一定有好报，做了坏事一定遭报应，如果真是这样，那做坏事的人一定是脑子坏掉了。我也并不想与我的读者兜售所谓的“善意哲学”，那些告诉你采取善意在任何时候都一定是最优策略的故事。然而，当充分了解选择善意处事的风险后，依然秉持此道立于天地间，你或者是一位心怀怜悯之人，甘愿牺牲；或者是一位强者，有给予的能力。同时，这二者，不会把善意当做人际交往的筹码或是拿来做自己道德的垫脚石。

宝玉心怀善念在人间历劫一世，终了遁入空门，“落了片白茫茫大地真干净”；主教米里埃，用怜悯唤醒了别人心中的善，让善意的甘泉得以在人间流淌不息。

文学家笔下的两位人物，皆是我心中所爱。

附录

以下内容摘自维基百科：

美国政治学家罗伯特·阿克塞尔罗德（Robert Marshall Axelrod）在其著作《合作的进化》（The Evolution of Cooperation）中，探索了经典囚徒困境情景的一个扩展，并把它称作“重复的囚徒困境”（IPD）。在这个博弈中，参与者必须反复地选择他们彼此相关的策略，并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略，并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面：算法的复杂性、最初的对抗、宽恕的能力等等。

阿克塞尔罗德发现，当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后，从利己的角度来判断，最终“贪婪”策略趋向于减少，而比较“利他”策略更多地被采用。他用这个博弈来说明，通过自然选择，一种利他行为的机制可能从最初纯粹的自私机制进化而来。

最佳确定性策略被认为是“以牙还牙”，这是俄裔美籍数学心理学家阿纳托尔·拉波波特（Anatol Rapoport）开发并运用到锦标赛中的方法。它是所有参赛程序中最简单的，只包含了四行BASIC语言，并且赢得了比赛。这个策略只不过是在重复博弈的开头合作，然后，采取你的对手前一回合的策略。更好些的策略是“宽恕地以牙还牙”。当你的对手背叛，在下一回合中你无论如何要以小概率（大约是1%-5%）时而合作一下。这是考虑到偶尔要从循环背叛的受骗中复原。当错误传达被引入博弈时，“宽恕地以牙还牙”是最佳的。这意味着有时你的动作被错误地传达给你的对手：你合作但是你的对手听说你背叛了。

通过分析高分策略，阿克塞尔罗德指定了策略获得成功的几个必要条件。

友善：

最重要的条件是策略必须“友善”，这就是说，不要在对手背叛之前先背叛。几乎所有的高分策略都是友善的。因此，完全自私的策略仅仅出于自私的原因，也永远不会首先打击其对手。

报复：

但是，阿克斯洛德主张，成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终合作。这是一个非常糟糕的选择，因为“下流”策略将残酷地剥削这样的傻瓜。

宽恕：

成功策略的另一个品质是必须要宽恕。虽然它们不报复，但是如果对手不继续背叛，它们会一再退却到合作。这停止了报复和反报复的长期进行，最大化了得分点数。

不嫉妒：

最后一个品质是不嫉妒，就是说不去争取得到高于对手的分数（对于“友善”的策略来说这也是不可能的，也就是说“友善”的策略永远无法得到高于对手的分数）。

因此，阿克塞尔罗德得到一种给人以乌托邦印象的结论，认为自私的个人为了其自私的利益会趋向友善、宽恕和不嫉妒。阿克塞尔罗德关于重复囚徒困境的研究的重要结论之一，是友善的家伙能先完成交易。

作者：张三儿

编辑：殊白

贾宝玉与主教米里埃

相关推荐

QQ咨询

回顶部