1.3 “囚徒困境”下的社会交换关系与最优策略选择

1.3.1 重复博弈下的社会交换关系

社会交换关系建立的基础是博弈双方的相互信任,即自愿赋予对方损害自己利益的机会。在单次博弈情形下(a single game),“囚徒困境”中的参与者很难达成默契而都选择“合作”策略。这是因为每一方都会担心对方采取“背叛”行为,并且在单次博弈情形下“背叛”行为是不会受到对方惩罚的(对企业而言,采取背叛行为时的收益大于采取合作时的收益,如C>A且D>B),那么在双方之间就不能可靠地形成“信任”。例如,游客往往因害怕买到假货而不敢在旅游景点买纪念品。在这种情形下,要促成双方的“合作”行为,就需要借助第三方(third party)的监督和惩罚手段,强制性地对双方的行为进行规范和约束,才能达到促成合作的目的。但是,一旦第三方缺失,在单次的“囚徒博弈”中,博弈双方就不能都选择“合作”策略而实现社会福利的最大化。

当单次“囚徒困境”博弈转变成重复博弈(repeated game),即双方重复交易时,任何一方都可以在随后的博弈中根据前一次对方所选择的策略而做出反应。也就是说,一方可以对另外一方的“合作”行为予以回报而继续选择“合作”策略,也可以就另外一方的“背叛”行为进行惩罚而转向选择“背叛”策略。重复博弈中“惩罚”的出现有可能成为维持双方之间信任关系和保持合作的有效机制。例如,企业间合作关系的形成,如建立战略联盟的前提是双方有长期合作。

|CSR聚焦1-10|

战略联盟:企业间重复博弈的理性选择

自从美国DEC公司总裁简·霍普兰德和管理学家罗杰·奈杰尔提出战略联盟的概念以来,战略联盟引起管理学界和企业界的广泛关注。特别是20世纪90年代以后,战略联盟迅速发展成为一种普遍性制度安排。战略联盟一般是由具有共同利益关系的单位之间组成的合作共同体,他们可能是供应商、生产商、分销商之间形成的合作联盟,甚至是竞争者之间形成的合作联盟。战略联盟是企业间相互博弈,形成集体理性,进行合作的结果。

赵庚科和郭立宏(2009)运用重复博弈理论,对区域产业集群内的企业怎样通过多次重复博弈,理性选择合作并形成企业间战略联盟的过程进行理论分析。研究发现,在市场交易中,当多个企业长期处于一个特定区域时,交易过程中企业间会经过多次反复的长期博弈,从而建立区域产业集群内企业的长期稳定合作激励机制,进而促使集群内企业间合作。

资料来源:赵庚科,郭立宏,2009.基于重复博弈的区域产业集群内多企业间合作激励机制研究[J].管理评论,21(08):122-128.

对应到图1-5中的企业与利益相关者之间的博弈情形,就转化为当企业在上一年选择“合作”策略,即履行社会责任行为(如提高员工福利)而给某利益相关者(如员工)提供好处时,如果员工没有给予企业正向回馈(如提升忠诚度)反而采取“背叛”策略(如旷工),那么企业就会在下一年放弃继续履行社会责任转而采取严格管理员工、强制加班、克扣工资等“背叛”行为,以作为对员工在上一年选择“背叛”行为的惩罚。

如果由于惩罚机制的存在并且也是可信的(企业以很低的成本惩罚利益相关者的背叛行为),利益相关者预测到企业会对其“背叛”行为进行报复,那么对利益相关者而言,当面对企业的合作行为时,最佳的回应方式也是“合作”。这就能建立起互惠关系(reciprocity)。同时,随着企业和员工合作关系的持续发展,双方的信任不断强化,从而有效保障企业和员工都能持续选择“合作”策略。

需要强调的是,在重复“囚徒困境”博弈中,维持双方“合作”的关键在于对“背叛”行为的惩罚要可信(credible),即一方相信对方会对自己的“背叛”行为进行实质性惩罚。这就涉及以下几点:第一,一方知道对方采取了“背叛”行为而损害了自身的利益;第二,施加惩罚的成本不太高,即采取惩罚行为给自身带来的损失不大;第三,一方施加的惩罚对另一方的利益产生显著的负面影响。

上述三点保障了施加惩罚行为是可能的并且会因产生实质性影响而可信。如果一方缺乏对另外一方施加惩罚的能力,如施加惩罚的成本过高或不掌握惩罚对方的资源,那么这种惩罚机制就不可信,故而也就难以在双方之间建立起长效的合作机制。例如,企业给投资者分红希望投资者能长期持有股票,但是如果投资者抛售股票,企业也没有有效的途径去惩罚这些投资者。故而,在企业和投资者之间也很难基于分红来形成长效的合作机制;投资者往往会根据企业的未来业绩来选择是否继续持有股票。同样的问题也存在于企业与消费者之间的合作中,企业低价销售产品并不能保证消费者不去购买其他商品,因为企业如果惩罚某些消费者,限制其购买企业产品,对消费者而言并没有多大损失。更可怕的是当消费者不能给企业施加可信的惩罚时(例如,消费者并不知道被企业欺骗),企业无良行为就会出现。

|CSR聚焦1-11|

三鹿毒奶粉事件:基于信任的互惠机制被打破

2008年9月,河北省石家庄市三鹿集团股份有限公司生产的三鹿牌婴幼儿配方奶粉受到三聚氰胺污染,导致全国多名曾食用该奶粉的婴幼儿出现泌尿系统结石。除三鹿外,众多国产乳品企业均涉及三聚氰胺问题。

“三聚氰胺”事件引发了人们空前的恐慌。本是让宝宝健康成长的奶粉,却因为部分无良商家掺入了三聚氰胺而成为“毒奶粉”。据通报,截至2008年11月27日,全国共有294万名婴幼儿因食用问题奶粉患泌尿系统结石,重症患儿154人,死亡11人。这些数字触目惊心!2009年2月,三鹿集团正式宣告破产,相关负责人受到法律惩罚。然而,消费者对国产乳业的信任也被彻底打破,纷纷转向购买进口奶粉。

不可否认,在三鹿毒奶粉事件发生后,国产奶粉质量的进步有目共睹。国家有关部门为确保乳品安全,也陆续出台了《乳品质量安全监督管理条例》《原料乳与乳制品中三聚氰胺检测方法》等规定。即便如此,多数消费者还是认为,国产奶粉质量不如进口奶粉;市场上,很多“奶爸奶妈们”仍选择购买进口奶粉。“一朝被蛇咬,十年怕井绳”,基于信任的互惠机制一旦被打破便很难重建。

资料来源:任震宇.黑色记忆[N].中国消费者报,2009-03-13(17);顾仲阳.国产奶粉路还很长[N].人民日报,2013-05-13(17).

1.3.2 重复“囚徒困境”博弈下的最优策略选择

1.固定合作对象之间的重复博弈

在重复“囚徒困境”博弈中,不排除一方会利用对方的信任而选择“背叛”行为。但是,根据重复“囚徒困境”博弈中的最优策略选择的研究来看,这种用“背叛”回应对方“合作”的行为并不是最优策略。最常见也是最有效的策略就是此前所描述的“以牙还牙”(tit for tat)策略。无论是企业还是利益相关者,实际上都会遵循这一策略原则来发展与对方的交换关系。这一策略的好处是无须第三方的存在就能维持合作关系,并且也很容易在交易过程中得以运用。实际上,如果放弃采取这一策略,如背叛与自己合作的人,或者与背叛自己的人合作等,长期来看都会使自己的利益受损。“以牙还牙”策略本质上也是在面对错综复杂的外部环境时,确保对方保持合作的最优手段。

在现实生活中,我们也经常能看到类似的例子,广泛存在于企业与利益相关者之间的交换关系中。例如,企业董事会给经理制定高工资,经理便更加努力工作;公司关心员工的身心健康,改善工作环境,能提升员工的工作满意度、忠诚度、工作效率等;公司支持政府改善民生,也会得到政府的政策优待,从而得到更多的发展机会。许多研究表明企业履行社会责任能提高企业绩效,其中的原因就是企业履行社会责任能得到利益相关者的正面回馈,从而有利于企业获得更多的资源而提高经济效益。这些实际上都是典型的互惠行为,并且都是在“以牙还牙”策略机制的保障下才能得以实现的。

|CSR聚焦1-12|

企业社会责任对利益相关者影响的研究

从20世纪70年代开始,关于企业社会责任后果的研究(consequences)不断增加,很长一段时期研究主要关注企业社会责任对企业财务绩效的影响,也就是说,企业是否受益于企业社会责任活动。

20世纪90年代后,越来越多的学者开始关注企业社会责任对企业非财务绩效(non-financial performance)的影响,认为企业履行社会责任可以获得利益相关者的认可,提升企业声誉和形象并增强与利益相关者之间的关系。企业履行社会责任还具有保险作用(Godfrey, 2005),即当这些企业发生负面事件时,企业受到的“惩罚”会更少。另外,高声誉的企业可以提高对求职者的吸引力(Jones et al., 2014)、客户满意度(Conlon and Murray, 1996)、首席执行官继任率(Gomulya and Boeker, 2014)等。

资料来源:WANG H, TONG L., TAKEUCHI R, et al., 2016. Corporate social responsibility:An overview and new research directions[J].Academy of Management Journal, 59(2):534-544.

当然,随着对重复“囚徒困境”下的最优选择策略的深入研究,人们发现了一些比“以牙还牙”更为优秀的策略。例如,“宽容以牙还牙”策略就能给交易双方带来更高的收益,其核心思想是在面对“背叛”行为时,并不是像“以牙还牙”策略那样确定性地进行惩罚而采取“背叛”行为,而是也可能继续采取“合作”的策略来原谅对方一次(注意,当面对“背叛”时随机选择是否“合作”)。因为有时候,对方采取“背叛”行为并非有意的,也可能是无意而为之,如果沿用“以牙还牙”策略,就丧失了与其重归合作的可能,这无疑会损害双方利益和社会整体福利。如果采取“宽容”的态度,试图原谅“背叛”,那么就有可能挽救濒临破裂的合作关系。

|CSR聚焦1-13|

博弈竞赛与“以牙还牙”策略

1980年,密歇根大学阿克塞尔罗德(Axelrod)教授发起了一场比赛,邀请许多博弈论学者玩一场200轮的“多重囚徒困境”的游戏,要求参赛者每人设计一个程序,通过程序模拟合作策略进行多轮循环赛,每个程序会根据上一轮的合作结果,得到一个分数,总分最高的就是冠军。

赛前预测结果时,大多数人认为根据不同的合作情况,设计出最复杂、最全面策略的人更可能赢得比赛。然而最后的冠军是一个最简单的程序,这个程序由计算机科学家拉波彼特(Lapopite)编写,名叫“Tit for Tat”,即“以牙还牙”。“以牙还牙”策略具体为:第一步合作,之后每一步重复对手的行动,即你合作我合作,你背叛我背叛。比赛结果引发了社会各界的兴趣,因此举办了规模更大的第二场比赛,最后胜利的依然是最简单的“以牙还牙”策略。

然而,在现实合作中一方可能因为疏忽大意而选择背叛,即“并非故意欺骗”。对于这类错误,如果双方都采取“以牙还牙”策略,就会引发永无止境的报复行为,造成两败俱伤。后来哈佛大学诺瓦克(Nowak)教授设计了一系列的合作策略,如永远不欺骗的策略、永远欺骗的策略、以一定的小概率(随机)惩罚对方的“宽容以牙还牙”策略等。结果显示,“以牙还牙”策略输给了更加友善的“宽容以牙还牙”策略,即当对方犯错时,适当地采取“宽容”态度,原谅对方并争取下一次的合作。

资料来源:湛庐文化.哪种合作策略能让你在竞争中胜出?[EB/OL].(2020-05-20)[2022-12-05]. https://baijiahao.baidu.com/s?id=1667138112237666680&wfr=spider&for=pc.html.

虽然理论是美好的,但是对合作方而言,其是否会采取这种“宽容以牙还牙”策略,则受到许多因素的影响,如个人的合作倾向、对对方的信任程度等。这就使得在现实环境中一方如何回应另一方“背叛”行为的决策变得复杂。

|CSR聚焦1-14|

蜜雪冰城安全事件:宽容以牙还牙?

2021年5月,知名加盟连锁茶饮品牌“蜜雪冰城”被媒体曝光个别门店存在篡改开封食材日期标签、违规使用隔夜冰激凌奶浆、柠檬表皮不清洗等卫生问题和食品安全隐患。5月15日,郑州市市场监管局全面检查蜜雪冰城郑州所有门店,发现部分门店确实存在违法违规问题,责令35家门店限期整改、3家门店立即停业整改,并对9家门店下达行政处罚决定书。

事件发生后,蜜雪冰城第一时间向监管部门、媒体和社会公众真诚地道歉,并表示将积极配合各级政府的监督检查,组织专项处理小组对门店存在的严重违规行为进行调查整改,对涉事门店做出停业整顿处理。此外,蜜雪冰城还将紧急召回部分经营团队,对其进行二次深化培训,进一步从严管理门店,为消费者提供放心健康的产品。

在事件发生后,有媒体联系到郑州的部分蜜雪冰城门店,大多表示客流并未受到太大影响,只是检查和管控更仔细和严格了。同时,大部分受访的顾客表示虽然看到相关事件的报道,但是没太关注。线上网友的评论进一步印证了消费者对于蜜雪冰城的宽容态度。

资料来源:耿记安. 35家门店被责令限期整改[N].中国消费者报,2021-05-20(1);新浪财经.食安风暴半个月后,蜜雪冰城怎么样了?[EB/OL].(2021-05-31)[2022-12-05]. https://baijiahao.baidu.com/s?id=1701272781238476193&wfr=spider&for=pc.html.

2.陌生合作对象之间的重复博弈

以上所介绍的交换关系都是发生在两个固定的交易对象之间的,也就是双方是熟悉的。我们很容易理解,在熟悉的双方之间信任关系是容易建立起来的,从而能保证合作的持续进行。此外,在现实生活中,即便是在陌生人之间,也能建立起信任和互惠关系。在这个过程中,参与方的声誉,即此前与利益相关者合作时是否有背叛行为,就显得非常重要。

|CSR聚焦1-15|

救助巧克力工厂

新西兰但尼丁的鲍德温街全长仅350米,但倾斜角度达到惊人的35°,被载入吉尼斯世界纪录,吸引了许多游客前来旅游打卡,同时也是当地孩子们的游乐园。另外,孩子们非常喜欢镇上的吉百利(Cadbury)巧克力工厂,经常光顾。在家乡人民的支持下,再加上背靠著名景区,吉百利工厂迅速发展成为远近闻名的公司。

工厂厂长牢记公司的发展离不开当地人的支持,因此希望能回馈当地,尤其是回馈镇上的孩子。因此,自2002年开始,“巧克力豆奔跑大赛”应运而生。该比赛将巧克力豆球分为三组,从鲍德温大街倾洒而下,最先冲过终点的15个巧克力豆的主人会得到一份丰厚的大礼。同时,吉百利工厂会把该活动售卖收入捐给慈善机构,用于帮助无家可归的孩子、老人,以及绝症儿童。这一活动受到了广泛的欢迎。吉百利工厂连续15年举办慈善活动,截至2016年,该公司一共筹到了善款90万元纽币(大约443万元人民币)。

然而,2017年7月,吉百利工厂突然因资金断裂而宣布倒闭,追问之下厂长道出实情:由于物价飞涨,金融危机,工厂却始终坚持巧克力豆不涨价,因而连年亏损,使得工厂不得不宣布破产。虽然工厂员工曾提议取消举办该比赛或提高巧克力豆的价格,但是工厂负责人为了能帮助孩子及老人,即使面临破产的局面也仍旧坚持举办该比赛。当小镇居民得知该工厂将破产之后,都认为这样一家有良知和善心的公司不应该倒闭,因而自发组织了众筹,甚至国外网友也参与进来。短短两天时间,就众筹了300万元纽币(大约1 386万元人民币),最终帮助公司渡过了难关,“巧克力豆奔跑大赛”也持续进行。

资料来源:搜狐网.这家公司倒闭了,竟有450万人抢着捐款,硬生生给救活了[EB/OL].(2022-05-20)[2022-10-16]. https://www.sohu.com/a/549149881_121124291.

对一家具备良好声誉的企业而言,哪怕某一利益相关者此前没有与之发生交换关系,也会通过了解其声誉而决定如何与之开始合作。另外,一方也可能并没有掌握另一方的声誉信息,即出现信息不对称,从而影响合作的开展。例如,银行在发放贷款的时候都倾向于与大企业合作,而对于中小企业的贷款申请则非常谨慎。这也是中小企业贷款难的一个重要原因,即银行没有这些企业声誉的信息。

总结来看,在对重复“囚徒困境”博弈最优策略的研究中,信任是合作关系产生的基石,宽容是维护合作关系的缓冲剂,而声誉则是扩大合作网络的催化剂。这一点对于我们理解企业为何履行社会责任,履行社会责任有何效果,以及如何履行社会责任至关重要。简言之,企业履行社会责任的目的就是建立和利益相关者之间的信任关系,树立企业声誉;履行社会责任的效果就是与众多利益相关者建立起这样的信任关系;而如何履行社会责任则取决于合作方式能否有效地达成企业建立信任和树立声誉的目的。