博弈论主要讲什么?

栏目:古籍资讯发布:2023-08-05浏览:2收藏

博弈论主要讲什么?,第1张

博弈论(Game Theory),有时也称为对策论,或者赛局理论,是研究具有斗争或竞争性 质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。目前在生物学、经济学、国际关系学、计算机科学、 政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。

  博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。

  具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

  生物学家使用博弈理论来理解和预测进化论的某些结果。例如:John Maynard Smith 和George R Price 在1973年发表于Nature上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。还可以参见演化博弈理论(evolutionary game theory)和行为生态学(behavioral ecology)。

  博弈论也应用于数学的其他分支,如概率、统计和线性规划等。

博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

  对于博弈论的研究,开始于策墨洛(Zermelo,1913)、波雷尔(Borel,1921)及冯·诺伊曼(von Neumann, 1928),后来由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)首次对其系统化和形式化(参照Myerson, 1991)。随后约翰·福布斯·纳什(John Forbes Nash Jr, 1950, 1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。

  当代博弈论的“三大家”和“四君子”

  "三大家" 包括约翰·福布斯·纳什、约翰·C·海萨尼以及莱因哈德·泽尔腾。这三人同时因为他们对博弈论的突出贡献而获得1994年的瑞典银行经济学奖(也称诺贝尔经济学奖)。

  "四君子" 包括罗伯特·J·奥曼、肯·宾摩尔、戴维·克瑞普斯以及阿里尔·鲁宾斯坦。

博弈要素:

  (1)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

  (2)策略(strategiges):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

  (3)得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

  (4)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

  (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。

  纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a,局中人B也采取其最优策略b,如果局中人仍采取b,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a的支付。这一结果对局中人B亦是如此。

  这样,“均衡偶”的明确定义为:一对策略a(属于策略集A)和策略b(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b)≤偶对(a,b)≤偶对(a,b)。

  对于非零和博弈也有如下定义:一对策略a(属于策略集A)和策略b(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略 b(属于策略集B),总有:对局中人A的偶对(a, b) ≤偶对(a,b);对局中人B的偶对(a,b)≤偶对(a,b)。

  有了上述定义,就立即得到纳什定理:

  任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。

  纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。

  纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。

  但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。

  塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。

博弈论之一:博弈论不是“三十六计”

任何一本讲博弈论的书都会先告诉你博弈论有多重要,不过我想咱们应该先面对现实。现实是博弈论是个奇怪的话题。

人们非常愿意了解博弈论,每个商学院都要给MBA开博弈论课程,几乎每一本流行的讲博弈论的英文书都有中文版,我们经常在媒体看到“博弈”这个词 —— 但是,人们很少真正使用博弈论。

你不太容易听到有人说,这件事根据博弈论应该怎么办。

并不仅仅在中国是这样。美国《快公司》杂志曾经有一篇文章说,专家学者们整天说博弈论多么多么重要,可是他们做了一个调查,问企业家你们在过去五年内是否曾经使用博弈论做出过商业决策 —— 调查结果是,没有。这个说法让博弈论爱好者火冒三丈,但是你得承认,博弈论好像不是那么好用的。

为什么会这样?

以我之见,不是博弈论没用,而是人们对博弈论的用法有误解。

要想知道博弈论有什么用,我们先来思考一个明摆着、但是从来不被提起的问题。

如果博弈论是讲谋略的,那像“三十六计”这样传统的计谋,跟博弈论是什么关系?博弈论是科学版的三十六计吗?

1计谋和战略

传统中国文化给世界人民的印象,中国是个武术之国;而在我们中国人心目中,中国更是计谋之国。我们有《三国演义》《三十六计》和各种兵法,像诸葛亮、吴用、刘伯温这些军师形象特别深入人心。但是你注意到没有,“计谋”这东西,好像都是民间在谈 —— 计谋不是严肃的学术课题。

战略,好像很高大上。计谋,好像上不了台面。这是为啥呢?

因为计谋不值得被认真对待。

咱们看看《三十六计》里的计谋 —— 瞒天过海、声东击西、暗度陈仓、笑里藏刀、欲擒故纵、偷梁换柱、上屋抽梯、美人计、空城计、反间计等等,这些“计”,本质上都是骗术。自己要做A,就让对手以为自己要做B;不希望对手做C,就吸引对手去做D。《三十六计》在很大程度上是一本阴谋诡计之书。

诡计有三个问题,一个比一个严重。

首先,诡计都有巨大的风险。诡计要想成功,你不但必须严密封锁信息,而且还得假设对手是比较愚蠢的。

比如说“空城计”。司马懿领兵来打,诸葛亮手里没有兵,自己故意在城头抚琴,做出一副胸有成竹的样子,让司马懿以为城内有兵,然后就真的被吓跑了。我们想想这可能吗?最起码的一点,司马懿作为一个军事指挥官,带领一支军队去攻打一个城,居然事先对这座城的兵力部署没有丝毫了解吗?你的情报系统呢?反过来说,城里这么多老百姓,诸葛亮就一点都不担心走漏消息吗?

真实历史中诸葛亮并没有对司马懿使用过小说里那个空城计。这个操作风险太大了。诸葛亮不但要假设信息被完全封锁,还得假设司马懿知道自己是个谨慎的人,而且还得假设司马懿不知道自己已经知道司马懿知道自己是个谨慎的人,而且司马懿居然连骚扰一下都不敢就跑了。

诡计的第二个问题是不能长期使用。骗人一次也许真能成功。有些卖假货的人为了应付检查,不会只卖假货,让真货和假货混合 —— 这不就是“瞒天过海”吗?这个手段的确比生硬的欺骗高级,但仍然是欺骗,而欺骗是不能长久的。

当然《三十六计》中也有很多计谋不是骗术,比如围魏救赵、远交近攻、借刀杀人、趁火打劫等等。但即便是这样的计谋,也跟骗术一样,还有一个更大的问题,那就是它们说的都是“零和”游戏。

零和的意思就是我要想赢你就得输,我想要得到什么你就得失去什么,咱俩的得失之和等于零。真实世界中,除了战争,很少有这样你死我活的局面。商业竞争也好,平时人和人相处也好,一般都不是零和游戏。两个集团想要长期共存,就必须得找到一个能够双赢的方法,而不是互相使用计谋。

计谋的故事听多了容易产生幻觉。我们看各种演义故事,因为过分相信计谋的作用,给人感觉好像实力都不重要了。我们动不动就要以弱胜强,要打“聪明仗”,好像以弱胜强是个普遍情况、四两拨千斤是个常规操作一样。

鲁迅先生说《三国演义》“状诸葛之多智而近妖”。其实小说里的诸葛亮之所以那么算无遗策,是被对手的愚蠢衬托出来的。计谋的本质,是一厢情愿。

中国也许是个计谋大国,但真不是战略强国。考察历史,中国对外战略大约是失败的多,成功的少;被意识形态裹挟的多,头脑清醒的少。北宋和辽国因为澶渊之盟长期和平共处,辽国已经几乎被汉化、成了大宋的一个很好的屏障的局面下,看到金国崛起,大宋居然想对辽国来个“趁火打劫” —— 结果金灭了辽马上就攻打大宋。等北宋变成南宋,好不容易又跟金国和平共处了一段时间,一看蒙古崛起,又对金国来了个趁火打劫。我相信大宋必定有不少明白人,但是一厢情愿的人显然更多,竟然让同样的错误犯了两次!

作为计谋大国,中国有很多想当“国师”的人。而用六神磊磊的话说 [2],所谓“国师”,其实都是“师师”。

计谋要是太多,愚蠢的人就不够用了。博弈论研究的是理性人之间的博弈。

2什么是理性

因为现在流行“行为经济学”,人们爱说人是非理性的,连有的学经济学的人都不敢理直气壮地说经济学假设人是理性的了。但是地道的经济学必须得假设人是理性的 —— 如果人不是理性的,所有数学模型、包括供求关系之类的基本结论就都灰飞烟灭了。

人的确经常表现得不理性,但经济学的理性人假设并不算错。这是因为人在做熟悉的事情、重要的事情、涉及到钱的事情的时候,通常是相当理性的 [3]。

而这些事情恰恰是经济学、也是博弈论的研究对象。博弈论假设人是理性的,表现为三个要求。

第一,你得知道你想要什么,并且对你想要的东西有一个明确的排序。

第二,你的行动是在一定的规则之下,争取得到你想要的东西。

第三,你知道对手也是这么想的,而且对手也知道这些规则。

这三个要求都很简单,但是我们得承认,有些人在有些时候真做不到。比如说前段新闻中的“高铁霸座男”,他是个博士,我觉得你要是问他是个人的形象和声誉重要还是一个座位重要,他会更想要形象和声誉 —— 可是在高铁上那一刻,他的情绪战胜了理智。

人有时候会被某种情绪劫持,这种情况不是博弈论的研究内容。

但如果一个人长期这么做事,其中可能就有理性的成分。比如现在一个热门话题是老年人容易上当受骗,买一些不靠谱的保健品。这些老人都是非理性的吗?

不一定。那些推销保健品的人卖的并不仅仅保健品,同时也是一种情感服务,比如认干爹干妈之类。老人未必不知道保健品没啥用,但是老人可能认为反正吃保健品也没什么坏处,他花点钱满足一下情感需求未尝不可。

如果一个现象长期存在,那就有可能是博弈论的研究内容 —— 博弈论称之为“均衡”。再比如说,像百度、莆田系医院、拼多多APP这些东西,充斥着假货和骗局,为什么能长期存在呢?也许这就是当今中国的博弈格局所决定的,这个结果可能是各方的理性选择。

3博弈论的用处

因为要求各方是充分理性的,有时候博弈论会得出一些非常怪的结论。

比如你可能听说过这个故事。老师让全班所有同学都想一个数字,说谁想的数字最接近全班平均值的2/3,谁就获胜。那如果我们假定所有同学都足够聪明的话,正确答案应该是0。这是因为不管你猜测全班人的共识是多少,你都会把这个共识乘以2/3 —— 但别人也能想到这一点,他们也会把你的数字再乘以2/3……你们的每一步推理都会让共识变得越来越小。而事实上哪个大学的学生都不会得出这么极端的答案来。

生活中绝大多数人不会聪明到那个程度,去做那种极端的推理。那难道说博弈论真的没用吗?博弈论的实际应用,并不是这种数学谜题。

博弈论能帮助我们理解长期存在的各种现象。如果你观察到社会上有很多不合理的现象,而这些现象还长期存在,你会认为这是因为社会上的人都太愚蠢了吗?博弈论会让你考察现象背后的博弈规则。

当然,这绝对不是说可以理解的现象就应该长期存在。博弈论更重要的作用,是告诉我们如何改变不好的局面。

可能这个坏局面是因为博弈是单次的,可能其中有信息不完全的问题,可能是因为那个许诺不可信。现在博弈论已经能够提供各种工具,帮我们达成更好的局面。

我认为人们之所以用不上博弈论,是因为缺少识别博弈格局的眼光和改变博弈规则的意识。我们希望你能拥有这种眼光和意识。

对个人来说,最起码的一点,你应该时刻提醒自己要理性。研究博弈论就好像下棋一样,你要考虑你的每一个行动都是有后果的,你要事先想好对方会有什么反应,然后你再怎么应对,然后对方再反应……一直到最后是个什么结果。

而我觉得一个更深层的意识是,你应该首先做一个“player”。

Player,在游戏中叫玩家,在体育比赛中叫选手,在博弈论中叫参与者 —— 其实都是一个意思,博弈论(Game Theory)说的都是 game。有一点参与游戏的精神,你就有权在规则范围内采取对自己最有利的行动,你就是积极主动的,你就会平等对待对手 —— 你就既不是一个浑浑噩噩整天根据别人设定做事的人,也不会有整个世界绕着自己转的幻觉。

参考文献

[1] MARTIN KIHN, You Got Game Theory! Fast Company magazine,February 2005

[2] 六神磊磊,《国师没有好东西》,六神磊磊读金庸,2016-12-10

[3] 关于理性和行为经济学,David Levine 的 Is Behavioral Economics Doomed The Ordinary versus the Extraordinary(2012)一书中的论述很好。

对博弈论的研习始于大学时期,十余年来,虽有间断但从未终止,最近以阅读《博弈论》(在我读过的博弈论书籍中,它不算写的最好的,但较为通俗,观点基本正确)为契机,简短的记录下了我对博弈论的一些通俗认知和思考。

我认为,生活的美好需要你我都学一点博弈论,博弈论是一门深奥的学问,更是一种思维方式,当然,博弈论也有它的局限性,要求博弈论能够完全刻画真实的世界,注定是徒劳无功。

1文化人都需要懂一点博弈论

保罗·萨缪尔森曾说过,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”。

事实上,不论是否了解博弈论,在波云诡谲的商业竞争局中、在风云变色的政治角力场里,各自发力的个体与个体、群体与群体甚至个体与群体,无一不在相互博弈。

每一个博弈都是你中有我、我中有你的情形。不同的博弈参与者,可以选择不同的行动,但由于相互作用,一个博弈参与者的利益不仅取决于自己采取的行动,也取决于其他博弈参与者所采取的行动。

博弈论的精髓在于基于这种策略性相互依赖基础上的理性换位思考,即在选择你的行动时,还是考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。

也就是说,博弈论其实是关于有理性且利益关联的各方在竞争性活动中制定最优策略的理论,是一种有关“互动行为”的科学。

2博弈论是一门深奥的学问

博弈论问世不久就得到了学术界的热情肯定。当时有人预言:“我们的子孙将把这看作是20世纪上半叶最重要的科学成就之一。”目前,博弈论被广泛应用于经济学、政治学、生物进化学、军事战略问题以及计算机科学等领域。

简单的博弈案例看上去似乎有趣,但博弈论始终是一门深奥复杂的学问,是研究具有斗争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论偏重方法论研究,局中人地位平等,没有明确的设计主体,注重定量模型化分析,研究的目的是求得博弈问题的纳什均衡解。

博弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产生影响的其他因素,从而分析其结果。因此它被称为“社会科学的数学”。

尽管如此,博弈论仍然改变了世界,成为人类理性认识世界的一个重要工具。而纳什均衡的提出无疑丰富了博弈论的理论体系,它是人类文明的一片砖瓦。可以肯定的是,百年之后,人们依然不会忘记约翰•纳什的名字,亦不会忘记那个神奇的纳什均衡。

3博弈论更是一种思维方式

尽管博弈论以数学为基础(而且本身也是数学的分支学科),但它也有平易近人的一面:

即使一个人没有很好的数学基础,也读不懂其中复杂、繁琐的论证过程,仍会有所收获。它的模型案例就如同寓言故事,可以用某种生动、直观的方式揭示现象背后的原理,而且这种揭示过程往往是不乏乐趣的。

与其说博弈论是一门科学,不如说它是一种思维方式。生活在这个世界上的“理性人”都希望实现利益的最大化,而这个目的又不可避免地受到环境、制度和他人的制约,因此人们必须作出选择(也就是策略)。而人们策略的相互作用(这正是博弈研究的课题)又可能导致更多的、更高层次(群体、国家乃至人类)的问题的选择。对于这些问题,我们可能不会找到最佳答案,但是思考这些问题,无疑将大大提高我们的理解能力和决策能力。

博弈论是一种简单明了、人人都该具有的思维方式,这可以让我们避免许多不必要的麻烦。可惜的是事实并不是这样,很多人似乎从来就没有机会建立起一种正常的观念,结果正如那个晴天发愁、雨天流泪的老太太一样,生活中总是麻烦不断。

世界不是一个“幸存者”游戏。在这个“零和”游戏中,胜利是排他的:一人胜利,意味着其他人失败,但在生活中,并不一定这样。

世界复杂,不局限于一个标准。人的追求不同,对“成功”的理解也不同,有人追求金钱,有人追求某种卓越表现,有人追求生活的平衡,他们都有道理,不必强求一致。

我们对博弈论的关注,不应只是为了学会如何战胜别人,而是为了明了人生为什么如此,并从中汲取知识,致力于实现更合理,也更符合群体利益的合作方式,换言之,我们要追求的不仅是“术”——如何打败对手赢得胜利,更应该是“道”——寻求更好的合作关系,获得更多的成就和快乐。

4博弈论也是有局限性的

《哥德尔不完备定理》认为:任何一个理论体系必然是不完全的,它包含了既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能只有其本身,博弈论也是如此。

要求博弈论能够完全刻画真实的世界,注定是徒劳无功,这也是博弈论的局限性。

正如诺贝尔经济学奖得主莱因哈德·泽尔滕教授所说:“博弈论并不是疗法,也不是处方,它不能帮我们在赌博中获胜,不能帮我们通过投机来致富,也不能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西,这是计算机或者字典的任务” 。

尽管如此,人类至今还没有找到一种比博弈论更好的思考工具,可以对现实的客观世界进行如此近似的描述。

就像并不完美的力学是自然科学的哲学和数学一样,博弈论是社会科学的力学和数学。没有牛顿力学我们连最简单的物理现象都无法理解;同样的道理,没有博弈论我们也无法解释分析很多现实的社会现象。

为了协调缺陷与现实之间的矛盾,也许我们要听一下博弈论大师鲁宾斯坦的教导:“一个博弈模型是我们关于现实的观念的近似,而不是现实的客观描述的近似” 。

博,就是博那个我们所期待的结果;弈,也是期望能够推动对手往我们期待的方向移动。我们学习博弈,就是为了让我们的人生顺利地朝着我们期望的目标行进。

   《博弈论》系列读书笔记到此为止。全剧终。

热门文章
    确认删除?
    回到顶部