原创 罗数君 罗博深数学
博弈论和我们日常的生活也有不小的关系,我们在做决定的时候,对博弈论的了解能够帮助我们更好地了解对方的状况、分析身边的处境,从而作出更优决定。那么到底什么是博弈论?如何应用博弈论?相信这篇文章中一定有你想要的答案。
作者 | Jason
全文字数 | 3562 阅读时间 | 9分钟
博弈论(Game Theory),又被称为对策论或赛局理论,是经济学中一个非常重要的分支。博弈论通过数学模型来分析理性决策者(rational decision-makers)的策略互动行为(strategic interaction),并帮助人作出最优决定。
1944年,约翰诺伊曼与摩根斯特恩合著《博弈论与经济行为》一书,标志着现代系统博弈理论的初步形成。自此博弈论被广泛认为是20世纪经济学最伟大的成果之一。博弈论不仅在经济学的发展中起到举足轻重的作用,还在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他学科有着广泛的应用。
博弈论和我们日常的生活也有不小的关系,我们在做决定的时候,对博弈论的了解能够帮助我们更好地分析身边的处境,从而作出更优决定。在博弈论的分析中,我们不仅要依靠数学逻辑思维,很多时候,对于人性的了解也极其关键。接下来,让我们通过一些经典的博弈游戏,来更好的了解博弈论的神奇。
最后通牒赛局的规则十分简单,参加比赛的两个人分别是提议者和响应者。提议者和响应者两人会一起分配一些固定的资源(10元),提议者将提出一种分配方法,例如提议者5元,响应者5元;或提议者8元,响应者2元。面对提议者提出的分配方法,如果响应者同意,这两个人就会按照提议者提出的分配方法来分配这10元。但是,如果响应者不同意提出的分配方法,两个人则什么都得不到。
通过简单的思考,我们可以了解到,对于完全理性的响应者来说,不同意提出的分配方法对自己没有任何好处。也就是说,提议者提出的分配方法里所给予响应者的任何资源(1元),响应者都应该接受。这样,对于完全理性的提议者来说,如果知道响应者会接受任何分配,那么为了利益的最大化,他就应该提出给予响应者最少资源的分配方法,也就是给予响应者1元。这样,赛局的结果即是提议者给予自己9元,给响应者1元,而且响应者同意这样的分配方法。
然而,大多数人都不是完全理性的。最后通牒赛局在不同的国家与不同的时期被研究者反复试验,而赛局的结果也远远不同于上述完全理性者得到的理想结果。平均下来,提议者提出的分配方式给予响应者4-5元,且大多数的参赛者给予了响应者5元。而在那些少于2元的分配方式中,有一半的响应者拒绝了分配方式,并放弃了自己可以得到的资源。
有趣的是,最后通牒赛局在世界不同的地区都被实验过,所得到的结果也大不相同。在美国,提议者的分配方法往往都比较公平,而响应者的拒绝率也相对较高。而在蒙古国,提议者平均只分配给响应者2元,令人惊奇的是,响应者的拒绝率却非常低,甚至少于百分之5。由此可见,在不同的文化背景下,人们对公平的理解也多少有些不同。
在最后通牒赛局中,通过人们的真实表现,我们看出了他们对公平的向往,人们虽然有机会得到更多的资源,却在很多时候无私地给予他人资源。而在独裁者赛局中,研究者想了解的是,人到底是不是真正的无私。
独裁者赛局的规则相比于最后通牒赛局更加简单。参加比赛的两个人分别是独裁者和接受者。独裁者可以随意分配所有的资源(10元)。而接受者只能接受独裁者的分配方法。
我们可以清楚的看到,独裁者在这里享有绝对的权力,若独裁者完全理性并追求利益最大化,他大可全盘收下所有资源,完全不顾及接受者的利益。然而,在这个实验中,独裁者平均给予接受者资源的20%。实验的结果让人感到些许欣慰,独裁者的分配让我们看到大多数参赛者还是怀有一颗无私的心,愿意与接受者分配资源。
然而,人真的都是无私的吗?很多社会学家认为人们的无私很多时候建立在对未来回报的期望之上。同时,很多人也认为人们无私的行为是为了让他们看起来不那么自私。社会学家在独裁者赛局的条件上增加了一个“悄悄离开(quit exit)”的选项。如果独裁者在游戏中选择了这个选项,他们所做的选择则不会被人知道。而“悄悄离开”的选项只需要独裁者花费1元。在拥有“悄悄离开(quit exit)”选项的独裁者赛局中,有28%的参与者选择了“悄悄离开”,而这些选择“悄悄离开”的参与者则不出所料地将所有的资源都收入囊中。由此看来人们所表现出来的无私行为的动机也许不总是那么纯粹。
参加信任游戏的两个人分别为投资者与受托人。投资人会先得到10元的资产,它可以选择将这些资产的一部分交给受托人,受托人则将会得到这部分资产的三倍,然后受托人可以选择将得到资产的任何一部分还给投资人。
这个游戏相比前两个游戏稍微复杂一些,但是如果我们仔细分析,仍不难得理解。若想让两人受益最大化,投资人与受托人必须互相信任,投资人应该将所有的资产(10元)交给受托人,当受托人得到3倍资产的时候(3*10 = 30元),他将其中一半的资产还给投资人。这样两人各拿15元,皆大欢喜。然而,若参加游戏的两人都是完全理性的,投资人若将所有的资产都交给受托人,得到三倍资产的受托人则不会需要将这些资产还给投资人。这样,无论投资人给予了受托人多少资产,这些资产都是无法被收回的,完全理性的投资人则不会给予受托人一分钱。
在真实的实验中,我们可以看到投资人与受托人给予对方的资产大不相同,一些参与者揽下全部的资产,一些参与者则非常相信对方,将大部分资产给予给了对方。值得注意的是,投资者从受托人所得到的资产往往都小于他们所给予的。
囚徒困境是博弈论中非常著名的问题。游戏的规则是这样的,两个囚徒同时被逮捕了,在被审讯的时候,两个囚徒被关在了不同的房间里且不知道对方的回答是什么。囚徒可以选择坦白自己的罪行,也可以选择死不承认。若两个囚徒同时坦白,两个歹徒将同时获得六年的牢狱之灾。若两个都选择死不承认,两人将被同时关押一年。若两人中一个人坦白,一个人死不承认,那么坦白的囚徒将被释放,而没有坦白的囚徒则需要在牢房中度过10年。通过下面的图可以我们可以更直观的了解游戏的规则:
“我”在牢房的时间
但是,在现实的游戏中,坦白真的能够给你带来最少的坐牢时间吗?若两人都不坦白,得到的结果对两人来说不是更好么?在1980年的时候,来自密歇根大学的政治学教授罗伯特阿克赛尔罗德举办了阿克赛尔罗德比赛,在比赛中,两个玩家不断的进行囚徒困境游戏,但是玩家的策略可以不断的变化,以更了解对手。阿克赛尔罗德想知道怎样的策略能够换来最少的牢房的总时间。这个比赛吸引了来自世界各地知名的策略学家。比赛中的策略不仅包括了坦白或不坦白策略之外,也囊括了马科夫过程,贝叶斯推理等复杂的策略。经过多轮的比赛,阿克赛尔罗德发现针锋相对策略(tic for tat)是最成功的,针锋相对的策略即是重复对手上一轮的策略。这个策略有四大优点:
友好:不在对手坦白之前坦白
有一定报复性:当对手开始占便宜的时候需要适当报复对手
宽恕性:当对手愿意继续合作时,不会记仇,愿意重新合作
不嫉妒:只在乎最后的结果,而不在乎是否战胜对方
这四大优点似乎也在很大的程度上告诉了我们在博弈游戏中所要选择怎么样的策略。
在面对这些难题的时候,我们不能盲目地通过理论选择来寻找最优解决方法,因为你的对手在很大程度上并不是完全理性的,但是为了得到更优的结果,我们需要通过换位思考,通过预判他人的决定来作出最终自己的决定。
博弈游戏从来都不是仅仅与数学的博弈,也不仅仅是与人性的博弈,将两者综合在一起,你才能最终笑傲江湖。
*图片来源于pexel。文章内容属罗博深数学及其母公司Expii Inc所有,转载需注明作者及来自“罗博深数学”公众号。欢迎转发本文与全世界的朋友分享数学、教育的乐趣。
原标题:《重度选择困难症患者?博弈论让你不再做后悔的决定!》