1
《红楼梦》第二十二回写到贾府给宝钗过生日,众人看戏,好不热闹。凤姐为了讨好贾母,暗示贾母喜欢的小戏子打扮起来像黛玉,却不说破,反要众人猜。众人心里明镜似得,却无人敢说出口,因都知黛玉小性儿,说出来怕得罪于她,只湘云直着脖子喊了出来,宝玉连忙给湘云使眼色,眼神却被黛玉逮个正着。湘云怪宝玉心中只有他的林妹妹,不能让林妹妹受一点气;黛玉嫌宝玉袒护湘云,心中亦气不过。儿女之间的情丝,理清楚也难,黛玉湘云间的纠葛不是一天之功,宝玉的善意举动,不过是个药捻子,同时引着了两桶火药,自己也落了两头的不是。
《悲惨世界》开篇男主人公冉阿让的出场令人动容。饱受19年牢狱之苦的冉阿让对世界充满了仇恨,整个世界对他同样冷漠至极,直到遇到了米里埃主教。主教在一个他饥寒交迫却走投无路的夜晚接纳了他,供他以热腾腾的饭食,干净整洁的床铺。不相信这个世界的冉阿让,当晚就偷了主教的银器逃之夭夭,不想天还没亮就被警察截获并再次送到主教面前。戏剧性的一幕展开了,主教不但没有指证冉阿让,却跟警察解释银器都是自己送给冉阿让的礼物,还嗔怪他忘记带走一并赠予他的那两支银烛台。主教善意的举动,融化了一颗早已被冻硬的心,冉阿让重新拾起了希望,随着全书的展开,最终完成了自我救赎。
很难说,一个善意的举动,就一定会让事情朝自己期待的方向去发展。甚至从一而终的善意行事,也不一定保证会有善意的回报:红楼梦全书中,宝玉的一举一动,自始至终无一星一点恶意,到罢呢?曹雪芹落笔道,“满纸荒唐言,一把辛酸泪”,一声叹息。
2
一个广为人知的理论,“囚徒困境”:甲乙两名嫌犯,被警方隔离开来,分别审讯,并向双方提供相同的选择:要么认罪并检举对方,要么沉默不认罪。如果一人认罪并检举了对方,本人即时无罪释放,对方服刑10年;如果两人都保持沉默,则两人同样判刑半年;如果两人都认罪并指控对方,则二人同坐5年牢狱。
在这样一种被阻断交流的环境下做选择,从利己角度出发,个人都寻求自身利益的最大化,那对于甲乙两名囚犯,无疑二人同时选择认罪是最佳策略。因为甲如果选择沉默,就要承担乙选择认罪的后果——甲坐牢10年,同时乙无罪释放。10年牢狱的和无罪释放,天壤之别,对比的差距大到无法承受,个人一定会极力避免这种可能性的发生。最重要的是,一个人选择了沉默,在信息隔绝的情况下,对方并不知晓,那么善意的选择,就成了风险最大选项。这个经典案例之所以被冠以“困境”之名,是因为个人以自身利益最大化做选择时,得出的结果并不是团体的最佳选择,甚至是双输的结局:只有甲乙都沉默,承担自身被判10年的风险,才有可能达到二人都只判半年的团体最优解。现实中,一些国家的司法机构也避免在审讯过程中出现囚徒困境,也禁止使用“坦白从宽”的策略:如果甲真的是无辜的,选择沉默,乙是犯法者,选择认罪并且冤枉清白者甲,那结果是乙坦白从宽得到了减刑,坚持自己无罪的甲却也得跟着蹲监狱。
如果从数学家精心假设出的囚徒困境试验中得出结论,“人最好还是学聪明点,不要对别人那么好,到头吃亏的是自己”,未免操之过急。关键的一点是,正常的人际交往中,信息并不是绝对封闭的,应用囚徒困境的前提不成立,结果即不必然是双输的局面。不审视前提的胡乱解读科学研究结论,难保熬出的不是一碗碗毒鸡汤。数学家们还做了更多扩展性的实验来模仿人际交往,比如著名的重复囚徒困境,与单次囚徒困境不同,做选择的甲乙不再一局定胜负,而是进行多次博弈,并且信息不再完全封闭:前一轮的选择结果会同时公布给甲乙双方,继而影响下一轮的选择。几十种选择策略经过厮杀,结果令人称奇却也不感意外:大凡善意的策略,尤其是不首先选择背叛的策略,最终获得分数最高。具体游戏过程和结果请参看文末附上的补充阅读,也可以去KK的成名作《失控》中找更多的解读。
一个有趣、也极易令人尴尬的问题:如果自己不幸在生活中陷入到了类似囚徒困境的状态,我会不会承担高昂的风险,选择善意的信任?有多少人可以牺牲眼前触手可及的利益来选择善意处事,特别是当并不能确定自己是、或自己根本不会是长期利益的受益者时。
佛说,我不下地狱,谁下地狱。耶稣说,我愿代所有人受罪。历经千年,流传于世的宗教,大凡是劝人向善的,又大凡是提倡牺牲精神的。为什么选择了善,却要承受牺牲?信任和牺牲仿佛成了一对感情特别好的双生子,难分难解。放在单次囚徒困境的例子下去想,似乎就不难理解:选择善意,极有可能是牺牲自我,成全他人。然而,利他行为在宗教的语境下,备受推崇,似乎又和重复囚徒得到的结果相符:善意、信任、自我牺牲,是人群以合作的方式生存于世的基石。
这里引用一段熊培云谈信任的文字:
“……信任固然是好,但不信任也并非都是坏事。套用尼布尔的话,人有恶的倾向,所以不信任成为必要;人有善的倾向,所以信任成为可能。而洛克和孟德斯鸠的分权理论、梭罗的公民不服从主张也是基于对政府的不信任,防止人性中恶的倾向。同样,对于普通民众而言,适当的不信任也是一种自我保护,因为信任一个人是需要成本的。打个比方,隔壁老王让一位朋友给他买速效救心丸,结果这位朋友满脑子都是单位评职称的事,忘了买药。这时候老王不光是错失了找其他人救自己的机会,甚至可能连命都搭上了。”
信任一个人是需要成本的。选择善意是有代价的。生活不是童话,不是做了好事一定有好报,做了坏事一定遭报应,如果真是这样,那做坏事的人一定是脑子坏掉了。我也并不想与我的读者兜售所谓的“善意哲学”,那些告诉你采取善意在任何时候都一定是最优策略的故事。然而,当充分了解选择善意处事的风险后,依然秉持此道立于天地间,你或者是一位心怀怜悯之人,甘愿牺牲;或者是一位强者,有给予的能力。同时,这二者,不会把善意当做人际交往的筹码或是拿来做自己道德的垫脚石。
宝玉心怀善念在人间历劫一世,终了遁入空门,“落了片白茫茫大地真干净”;主教米里埃,用怜悯唤醒了别人心中的善,让善意的甘泉得以在人间流淌不息。
文学家笔下的两位人物,皆是我心中所爱。
附录
以下内容摘自维基百科:
美国政治学家罗伯特·阿克塞尔罗德(Robert Marshall Axelrod)在其著作《合作的进化》(The Evolution of Cooperation)中,探索了经典囚徒困境情景的一个扩展,并把它称作“重复的囚徒困境”(IPD)。在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面:算法的复杂性、最初的对抗、宽恕的能力等等。
阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。
最佳确定性策略被认为是“以牙还牙”,这是俄裔美籍数学心理学家阿纳托尔·拉波波特(Anatol Rapoport)开发并运用到锦标赛中的方法。它是所有参赛程序中最简单的,只包含了四行BASIC语言,并且赢得了比赛。这个策略只不过是在重复博弈的开头合作,然后,采取你的对手前一回合的策略。更好些的策略是“宽恕地以牙还牙”。当你的对手背叛,在下一回合中你无论如何要以小概率(大约是1%-5%)时而合作一下。这是考虑到偶尔要从循环背叛的受骗中复原。当错误传达被引入博弈时,“宽恕地以牙还牙”是最佳的。这意味着有时你的动作被错误地传达给你的对手:你合作但是你的对手听说你背叛了。
通过分析高分策略,阿克塞尔罗德指定了策略获得成功的几个必要条件。
友善:
最重要的条件是策略必须“友善”,这就是说,不要在对手背叛之前先背叛。几乎所有的高分策略都是友善的。因此,完全自私的策略仅仅出于自私的原因,也永远不会首先打击其对手。
报复:
但是,阿克斯洛德主张,成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终合作。这是一个非常糟糕的选择,因为“下流”策略将残酷地剥削这样的傻瓜。
宽恕:
成功策略的另一个品质是必须要宽恕。虽然它们不报复,但是如果对手不继续背叛,它们会一再退却到合作。这停止了报复和反报复的长期进行,最大化了得分点数。
不嫉妒:
最后一个品质是不嫉妒,就是说不去争取得到高于对手的分数(对于“友善”的策略来说这也是不可能的,也就是说“友善”的策略永远无法得到高于对手的分数)。
因此,阿克塞尔罗德得到一种给人以乌托邦印象的结论,认为自私的个人为了其自私的利益会趋向友善、宽恕和不嫉妒。阿克塞尔罗德关于重复囚徒困境的研究的重要结论之一,是友善的家伙能先完成交易。
因此,阿克塞尔罗德得到一种给人以乌托邦印象的结论,认为自私的个人为了其自私的利益会趋向友善、宽恕和不嫉妒。阿克塞尔罗德关于重复囚徒困境的研究的重要结论之一,是友善的家伙能先完成交易。
作者:张三儿
编辑:殊白