时间:2023-10-12 10:26:20
导言:作为写作爱好者,不可错过为您精心挑选的10篇日常生活中的博弈,它们将为您的写作提供全新的视角,我们衷心期待您的阅读,并希望这些内容能为您提供灵感和参考。
而在脏脸博弈中,我看到了公共知识的巨大力量。那个印象深刻的,因为一个公共知识而导致村庄死了100个男人的故事,依然感到很不可思议。在日常生活中,有很多事情人们都心照不宣。他们各自知道某件事情,但不知道别人知不知道他们知道。而一旦这件事情成为公共知识,就可能引起很大的影响。而公共知识也是人们日常生活中必不可少的交流基础,比如地球是圆的,我们都知道地球是圆的,那么在这一点上就能达成共识,当许多事情都达成共识,那么人们的交流也就更加顺畅。
(武汉科技大学中南分校 文法学院,湖北 武汉 430223)
摘要:本文把博弈论基础课程中介绍的策略式思维方法和能力纳入到成功素质的五大体系之中,论述了博弈意识和策略思维能力是现代竞争社会中成功人士的必备素质。通过分析博弈论课程中的经典案例,探讨了如何处理博弈中的策略问题,并由此引出了博弈意识的两个核心要点:一是换位思考、改变观点;二是向前展望、倒后推理。通过分析案例探讨了成功素质教育的策略观。
关键词:成功素质教育;博弈论;策略思维
一、成功素质教育理念与博弈论和策略思维
成功素质教育是武汉科技大学中南分校率先提出的一种以促进人的成功为最终目的的教育理念。研究成果表明:成功素质的外延包括五大体系,即:观念体系,主要包括世界观、价值观、人生观和敬业精神、拼搏精神、创新精神等;品格体系,主要包括人格、道德、诚信、毅力、性格、风度、气质、修养、心态等;方法体系,主要包括学习方法、思维方法和操作方法等;能力体系,主要包括领导、组织、管理、观察、分析、表达、协调、沟通、应变、公关、体能等;知识体系,主要包括专业知识和非专业知识。在成功素质的五大体系中,观念体系是核心体系。能力体系和方法体系是五大体系的重要组成部分。当代中国已经实施了市场经济,国际化的步伐日益加快,在日常生活、学习和工作的方方面面,显现出越来越明显的竞争态势,正逐步形成越来越严峻的竞争格局。如何在政治经济、军事体育乃至于日常生活中看清楚竞争对手的策略、并战而胜之或取得双赢,是国家或组织或个人所面临的重要问题。
策略思维是关于了解对手打算如何战胜你,然后战而胜之的艺术。是在竞争环境下必须具备的能力或者方法。我们每个人都会在工作和日常学习、生活中用到策略思维。学习需要策略,就业需要策略,生意人和企业必须借助有效的竞争策略才能生存发展,政治家必须设计竞选或施政策略等等。总之,学业成功、就业成功、创业成功和事业成功离不开策略思维的能力和方法。关于策略思维的科学称为博弈论,博弈论原本是数学的一个分支,是一门相对年轻的科学,虽然其历史尚不足50年,但由于它较好地解决了对竞争等问题的可操作性分析,已经成为经济学中激荡人心的一个研究领域。随着研究的深入,人们认识到我们身边的许多行为、现象都可用博弈来概括。当代“最后一个经济学全才”保罗•萨缪尔森教授说,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解”。成功素质教育的作用对象是在校的大学生,他们是将要掌握先进科学技术知识和把握先进文化方向的即将走进社会的中高级应用型人才,理应对博弈论知识和策略思维的方法有一定的理解,并能应用到实践中去。
二、博弈论中的经典案例及其对成功素质教育的启示
成功素质教育认为,塑造大学生的成功素质,必须围绕专业素质和非专业素质两大领域展开。专业素质是指人们实现成功所必备的具有专业特性的素质;非专业素质是指虽不具有专业特性但同样是人们实现成功所必备的且对专业素质的形成与发挥起“倍增器”作用的素质。专业素质和非专业素质共同构成成功素质,两者缺一不可。博弈意识和策略式思维能力已经成为各界成功人士必须具备的成功素质。分析和研究博弈论中一些经典案例,可从中体会到策略式思维的基本方法,感受到策略式思维的巨大魅力,从而有利于培养学生的成功素质。
(一)囚徒困境
假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。
两个囚徒该如何选择呢?
对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险。换句话说,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。因此,囚徒在考虑自己策略选择的时候,必须站在对手的角度来考虑策略。对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。这就是该博弈问题的解,是一个纳什均衡。该问题反映了个体理与集体理之间的矛盾和冲突,叫做囚徒困境。
我们可以利用囚徒困境模型来分析日常生活中的许多不合作现象。例如出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。又如住户在公共楼道里堆满了杂物,结果大家都极不方便。但你如果不占用公共楼道,别人也会占用。每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。但占用的结果却最终损害了大家的利益。
在博弈论分析中,一定场合中的每个局中人在决定采取何种行动时都策略地、有目的的行事,他考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。该案例启示我们换位思考、改变观点。我们希望你可以站在竞争对手的位置来进行策略思考,进而从别人的角度观察这个世界。正确做到这一点对于找到你自己的最佳策略是必不可少的。不过,从别人的角度思考和观察这个世界做起来并不容易。人们习惯于把别人看做和我们一样的人,而不是完全不同的类型。博弈论的思维方式则要求你哪怕完全不能同意他们的见解,也要设身处地,仔细分析自己若处于对方的境地,思路会有什么变化。
(二)海盗分金
有5个海盗抢得了窖藏的100块金币,并打算瓜分这些战利品。他们的习惯是按下面的方式进行分配:在5张纸条上分别写了1、2、3、4、5这五个数字,然后抓阄,抓到1的海盗就先提出分金币的方案,然后所有的海盗(包括提出方案者本人)就此方案进行表决。如果有超过一半的海盗同意,就按照1号提出的方案分配,否则,1号海盗被扔进大海,再由2号海盗提出分配方案,规则同上...请问1号海盗应提出什么样的分配方案?
所有的海盗都乐于看到他们的一位同伙被扔进海里,不过,如果让他们选择的话,他们还是宁可得一笔现金。他们当然也不愿意自己被扔到海里。所有的海盗都是有理性的,而且知道其他的海盗也是有理性的。这些金块不能再分,也不允许几名海盗共有金块,因为任何海盗都不相信他的同伙会遵守关于共享金块的安排。这是一伙每人都只为自己打算的海盗。
分析这个策略游戏的奥妙就在于应当从结尾出发倒推回去。当游戏快要结束时,你很容易看出应如何分配这些金币。如果从游戏的开头出发进行分析,那是走不了多远的。其原因在于,所有后续人员的决策方案都是要确定:“如果我这样做,那么下一个人会怎样做?”
记住了这一点,就可以知道我们的出发点应当是游戏进行到只剩两名海盗(假设前面3个海盗都被仍进大海了)――即4号和5号――的时候。这时提出分配方案的海盗是4号,而他的最佳分配方案是不存在的,因为不论他提出什么方案,5号海盗都是反对。5号海盗独自得100枚金币。
倒退回到上一步,现在加上3号海盗。4号海盗知道,如果3号的方案被否决,那么最后将只剩2个海盗,而4号将肯定一无所获――此外,3号也明白4号了解这一形势。因此,只要3号的分配方案给4号一点甜头使他不至于空手而归,那么不论3号提出什么样的分配方案,4号都将投赞成票。因此3号需要分出尽可能少的一点金子来贿赂4号海盗,这样就有了下面的分配方案:3号海盗分得99块金子,4号海盗得1块金子,5号海盗一无所获。简写为(99,1,0)。
2号海盗的策略也差不多。他需要有50%以上的支持票,因此需再找二人做同党。他可以给同党的最低贿赂是1块金子,而他可以用两块金子来收买4号和5号海盗。因此,4号的分配方案应是:(98,0,1,1)。
1号海盗的策略稍有不同。他需要收买另两名海盗,因此至少得用2块金子来贿赂,还要比2号的方案多拿出一块才能使自己的方案得到采纳。他的分配方案应该是:(97,0,1,0,2)或(97,0,1,2,0)。
该案例启示我们向前展望、倒后推理。这里说的是做出一系列行动和反行动,预计沿着你现在前进的道路走下去,最后你会到达哪里。“向前展望、倒后推理”法则告诉你,应该首先确定自己最后希望达到什么目标,然后从这个结果倒后研究,直到找出自己现在应该选择哪条道路,这样才能保证以后可以达到那个目标。
在企业管理中人们经常谈到学习邯钢经验,邯钢成本控制经验的核心其实就是“向前展望、倒后推理”方法的典型应用。“海盗分钻石”据说是美国著名软件公司招收员工时的考题,20分钟内给出正确答案的人,年薪可以达到8万美元。从中可以看出,世界最成功企业之一的软件公司对员工素质提出的要求或标准;而成功素质教育的办学理念中提出的超前发展、创新教育和实用教学等理念,要求把最新的最有用的知识传授给学生,培养学生的成功素质,这与世界一流公司的用人理念有着相同的地方。
三、成功素质的策略观
成功者离不开拼搏,博就是博弈,博弈是离不开策略的。构成一个博弈最基本的三个要素就是局中人、策略空间与得益函数。成功素质教育的策略观,即要求人们具备博弈意识,也要求人们在各种博弈中必须把握和采用几种共性的策略。其中威胁和反威胁、合作与不合作、先动与后动等策略是最重要的几种。
在博弈中,人们经常采用威胁策略,但其他博弈方也会采取对威胁的辨别和反威胁策略。介绍一个前面提到过的托马斯•谢林教授的小故事。若干年前,哈佛大学一帮学生来到谢林的课堂,他开始对学生讲学这门课有多难,有些学生便离开了教室。之后,他详细讲述了他就这门课对学生提出的要求:极端严格和极其刻苦,更多的学生溜掉了。最后,只剩下几个人在座位上惴惴不安,直冒冷汗,他却告诉这几个人放松。刚才那番强硬的说词是他的一个计策,为的是让上这门课的人数降到可以控制的范围内,保证只有最刻苦的学生上他的课。后来,他的确让这些学生很刻苦地学习。他们顺利完成这门课之后,都觉得这个理论真的至关重要,教授也棒极了。在这场师生博弈中,托马斯•谢林采用了一种比较温和的“威胁”策略。对博弈论不够坚定的学生相信了威胁,失去了机会;而对博弈论坚定不移的学生终于得到了世界一流大师的教诲,终生受益。
美国密西根大学的罗伯特爱克斯罗德经过计算机模拟“囚徒困境”发现,在重复博弈中,如果博弈的次数是无限的,博弈方会选择相互合作的策略。但如果重复博弈的次数较少,则合作就不可能实现。这就是重复“囚徒困境”的结论。在我国的反腐败斗争中。
1983年美洲杯帆船赛前4轮结束后,丹尼斯康纳的“自由号”在这项共有7轮比赛的重要赛事中暂时以3胜1负的成绩排在首位。在第5轮比赛开始时,由于对手“澳大利亚二号”抢在发令枪之前起步,不得不退回到起点线后再次起步,这使“自由号”获得了37秒的优势。澳大利亚队的船长约翰伯特兰打算转到赛道左边,满心希望风向发生变化,可以帮助他们赶上去。丹尼斯康纳则决定将“自由号”留在赛道右边。这一回,伯特兰大胆押宝押对了,因为风向果然按照澳大利亚人的心愿偏转了5度,“澳大利亚二号”以1分47秒的巨大优势赢得这轮比赛。人们纷纷批评康纳,说他策略失败,没能跟随澳大利亚队调整航向。再赛两轮之后,“澳大利亚二号”赢得了决赛桂冠
一般来讲,成绩领先的帆船,通常都会照搬尾随船只的策略。一旦遇到尾随的船只改变方向,那么成绩领先的船只也只会照做不误。这就是博弈论中的后动优势,如果双方的技术实力相当,帆船比赛的输赢在很大程度上是赌风向的比赛。在1983年的那场比赛中,当以3∶1的场数领先的美国人又以37秒领先时候,他们就获得了后动优势:澳大利亚人押什么风向,他们就跟随押什么风向。这样,他们就可以做到万无一失,因为如果澳大利亚人押对了,他们也跟着押对,尽管可能因为决策晚一点而输掉几秒,却很难把37秒输光,同样,如果澳大利亚人押错了,那么大家都错,那37秒的优势仍然管用。
总之,成功素质教育的策略观至少应该包括识别威胁或许诺是否可信,更加善于思考,具备深邃的洞察力;学会和竞争对手合作,共同获得双赢;学会掌握竞争中的主动权等。
参考文献
[1]张维迎.博弈论与信息经济学[M].上海:上海三联书店,上海人民出版社,1996.
一、博弈论教学
博弈论也称对策论,是研究在特定情境中互动决策问题的一门学科。著名的经济学家萨缪尔森说过,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”。
博弈论作为一门经济学专业重要的专业课,在各大高校经管类专业中都有开设,而且以专业必修课居多。而且博弈论的方法,在我们日常生活决策中有重要的应用。它教给我们一种理性思维去分析生活当中的事情。其实博弈论的思想在我们的生活当中已经广泛渗透。比如,小时候石头剪刀布的游戏;小学语文课本中“田忌赛马”的故事;生活中的讨价还价等,都是博弈思想。只是当时我们还没有接触到这个概念,没有系统完整的去学习。
大学课堂给了我们这个机会去更加深化思维,更深入的学习博弈知识,从而更好的在生活中应用博弈方法。但是目前博弈论课堂教学方法单一,主要依托讲授习题练习,结合案例。学生的参与不足,理论与实践的结合不足。所以怎样丰富博弈论课堂,加大信息量,更多的体验博弈论思想在生活中的积极应用,调动学生的积极参与,是博弈论教学改革的一个方向。而慕课不失为一种有效的手段。
二、慕课
慕课是二十世纪兴起的一种网络课程模式。以大范围,形式新颖等特点,为大家广泛地应用于现代教学中。目前慕课在国内外已经得到了长足发展,中国2014年在网注册的慕课学员已经达到60多万,这个数字还在继续增长。现在已经有很多专业从事制作慕课的团队,也完全能满足各类学员各类课程的要求。
三、慕课与博弈论教学的结合
慕课具有完整的知识体系。作为一种方便的自学方式,慕课完整的知识体系可以作为博弈论课程的补充。弥补传统课程课时不足,信息量有限的弊端。传统课堂一节课50分钟,各大高校博弈论课程安排34-51课时。有限的时间内,很难去更多地教授博弈论的知识,很难有更多的时间去体会博弈论思想在现实生活当中的应用。但如果能在传统博弈论课程当中结合慕课,那么部分知识,包括大量的案例,情景O定等都可以通过慕课来完成。
慕课具有范围广的特点。博弈论作为一门专业课程,在经管类院校中被广泛开设,基本上所有专业都要学习该课程。但是学校资源有限,老师的精力有限,而且各专业课时不一致,深度要求不同。仅凭传统课堂,无法完全满足学生的学习需要。慕课作为一种网络课程,范围广,不受时间地点的限制,学生只要网上报名就可以学习,可以很方便的去弥补传统课堂实体资源有限的缺点。完全可以满足全校所有专业学生同时学习的要求,既方便又快捷。
慕课具有开放性。慕课作为一种网络课程,对学员没有限制。任何学员只要在线注册就可以参与,有利于博弈论教学在全校的开展。虽然博弈论是经管类专业的专业课。但是很多非经管类专业的学生也有很大的需求想要学习该课程,所以当资源有限,不能全部安排课程的时候。慕课就起到了良好的作用,可以供任何专业的学生学习。同时去全民推广博弈论课程也有利于经济素养的提高,有利于国家政策的制定和执行。
慕课形式新颖。能方便的演示实验,模拟情境,可以充分激发学生的兴趣,能让学生更真实感受博弈思想在日常生活中的应用是怎么影响个人的决策,充分的体现理论应用实际的现实意义。比如一个很经典的博弈案例“智猪博弈”,博弈故事描述的是大猪和小猪谁去按食槽开关的决策问题。实际上,这样的博弈思想应用到实际生活中,可以模拟大小企业共存的问题。传统课程只是结合案例简单的分析了这种应用。如果在传统课堂讲授外能再更多的结合慕课深入案例,那么学习效果是事半功倍的。也可以让学生更多的去切实的融入到生活情境当中,感受博弈对决策的影响。
慕课具有自检性。学习不光要听,更要练习巩固。通过检验考察自己掌握的情况。传统课堂老师能面对面地观察学生,通过表情以及学生的课堂反应了解到学生的接受情况,并及时调整课堂具有高度的灵活性。还有课堂练习测验的方式,也可以很方便的考察学生。慕课作为网络课程也考虑到了这一问题。安排了作业,测验,在线讨论等方式,力求学生能尽可能地掌握所学。而且慕课的网络特点是可以重复播放任意片段,一旦有知识不理解的,学员可以反复听课,直到完全理解。
慕课具有约束性。注册慕课后,学员只有完全学完课程,完成课程安排的学习任务,并在考试合格后才能获得相应学分。这样的约束性可以保证学习的有效性。应用到博弈论教学当中,在全校学生都能学习的情况下,还能保证学习质量。确实可以作为传统博弈论课堂的补充。现在许多高校已经开始和特定的慕课平台建立合作培养,承认学员在慕课中心拿到的学分,并计如总学分。这样既有利于学生课程的学习,也有利于慕课在现代教学中的进一步推广。
四、结论
慕课的特点可以很好的将其结合运用到博弈论教学当中。去弥补传统的博弈论教学方式单一,课时有限的缺点。但是慕课作为一种新兴的网络教学方式,在发挥自己优势特点的同时,我们也要注意到它的弊端。首先,在没有老师的强制约束下,学生是否能自觉地独立完成所有课程。其次,学生虽然能够反复观看视频,反复理解学习内容。但是如果反复学习之后,仍然不能透彻理解时该怎么答疑解惑要怎么办。这都是网络课程所不能给予的,必须通过传统课程去更好地实现。再者,慕课对学生的考核包括测验,讨论等方式,合格的评判标准是什么,所有学员都采用同样的标准是否合理。这些都是将慕课应用到实际教学中面临的问题。所以必须要明确,慕课作为一种新型的网络课程,在帮助学员学习课程,辅助传统堂的时候。更多的只能定位为一种辅的学习方式,绝对不能代替传统课堂。
【参考文献】
[1] 何国平,杨云帆,陈嘉等.“慕课”在护理教学中的应用与展望.中华护理杂志[J].2014(49)1095-1099.
[2] 胡珊邢涛.慕课视域下“教育心理学”课程教学.现代教育技术[J].2015(24)78-82.
[3] 张长海,焦建利.地方高校大学生慕课接受度影响因素研究.远程教育与网络教育[J].2015(345)64-68.
[4] 姜泓冰.“慕课”,搅动大学课堂[N].人民日报,2013-07-15(15).
文章编号:ISSN1006―656X(2013)12-0043-01
一、博弈论的概述
博弈论(game theory),又称对策论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,也就是一些个人或组织,面对特定的环境条件,在一定的规则约束下,同时或先后,一次或多次,从各自的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
一个完整的博弈一般包含几个要素:参与者,行动,策略,结果,均衡等。参与者、行动和结果统称为博弈规则,博弈分析的目的是使用博弈规则来决定均衡。但是,博弈的行动不等同于博弈的策略,博弈的结果不等同于博弈的均衡。根据参与人的数量,可分为二人博弈和多人博弈;根据参与人是否合作,可分为合作博弈和非合作博弈;根据博弈结果的不同,可分为零和博弈、常和博弈和变和博弈。
博弈论对我们的经济生活有重要意义,人们之间决策行为相互影响的例子有很多:从国家角度出发,在国际贸易中合理运用博弈论可使本国和其他国家都受益,取得双赢效果;从个人角度出发,在生活中合理运用博弈论可使自己选择最优策略,减少不必要的成本开支。
二、非合作博弈――纳什均衡
非合作博弈是指不允许存在有约束力协议的博弈。完全信息静态博弈属于非合作博弈,该博弈中,每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念“纳什均衡”。
用表示一个博弈,如果有个博弈方,每个博弈方的全部可选策略的集合称为“策略空间”,用表示;表示博弈方的第个策略,其中可取有限个值(有限策略博弈),也可取无限个值(无限策略博弈);博弈方的得益用表示,是各博弈方策略的多元函数。个博弈方的博弈常写成。在博弈中,如果由各个博弈方的每一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略组合的最佳对策,即
,对任意都成立,则称为的一个“纳什均衡”。
纳什均衡的求解,常采用得益矩阵法。在囚徒困境中,每个参与者都能猜出对方策略,称该纳什均衡为纯策略纳什均衡。囚徒困境问题反映了非合作博弈的根本特征,体现了个人理性与集体理性的矛盾。两寡头企业选择产量的博弈就是囚徒困境问题在经济学上的应用。若两企业联合形成卡特尔,选择垄断利润最大化的产量,每个企业都能得到更多利润。但卡特尔协定不是纳什均衡,给定对方遵守协议,每个企业都有增加产量的冲动,最后每个企业只能得到纳什均衡产量的利润,它严格小于卡特尔产量下的利润。
在某类博弈中,每个理性人都不能猜出对方的策略,参与人是以一定的概率选择某种策略的,这样的策略称为混合策略,相应的均衡称为混合策略纳什均衡。纯策略是混合策略的特例。相关的例子有日常生活中的打扑克、划拳等。
三、治理河流污水排放的制度设计
环境保护,人人有责,限制企业的污水排放符合社会各界的呼声。检查和制止排污是政府的职责,对于以利润最大化为目标的企业,其一直采取各种措施尽可能降低生产成本。政府和企业间的关系可用经济学中的监督博弈来解释。
该博弈的参与者是政府和企业,政府的策略选择是检查或不检查,企业的策略选择是排污或不排污。假设是企业治理污水(不排污)增加的生产成本,若排污,为自己多得的收益。是政府检查所需成本。是政府对企业排污的罚款金额。是企业排污对社会利益的损害。假设且,即政府对排污企业采取重罚措施。对应不同策略组合的得益矩阵可见下表。
政府和企业的得益矩阵
在以上假设条件下,政府和企业都猜不出对方会采取何种策略,因而不存在纯策略纳什均衡,只能求解混合策略纳什均衡。如果假定条件不成立,通过劣策略剔除可得到占优策略,即(检查,不排污)或(不检查,排污)为占优均衡。
在得益矩阵中,用表示政府检查的概率,表示企业排污的概率。给定,政府检查和不检查的期望收益分别为:
由,得。即如果企业排污概率小于,政府的最优选择是不检查;如果大于,政府的最优选择是检查;如果等于,政府随机地选择检查或不检查。
政府的最终目标是降低企业排污概率并保护环境。据的结果,有两种措施:一是增大分母,即采取重罚措施,使企业平日不敢排污;二是减小分子,即降低检查成本。现阶段可行做法是设立举报电话,避免政府盲目检查,提高办事效率。
再者,给定,企业选择排污和不排污的期望收益分别为:
由得,即如果政府的检查概率小于,企业的最优选择是排污。现实中,政府对排污的惩罚越重,企业因排污获得的收益越低,企业的排污概率就越小。反之,企业的排污概率就越大。
企业因排污获得收益的大小,政府难以准确把握。前面谈到的企业都是以利润最大化为目标的企业,适于民营企业。现实中大多排污者是国有企业,这就涉及企业经营的控制权收益问题。企业因排污获得的生产成本降低部分可以很容易转化为企业经营者的控制权收益,这些收益包括奖金、福利或者因企业效益上升而带来的升迁机会。反过来,如果企业因为排污而受罚,经营者并没有控制权损失,因为罚款由企业出,经营者只是没有控制权收益而已。
四、小结
本文以纳什均衡为理论基础,分析了纯策略纳什均衡和混合策略纳什均衡在经济生活中的应用。但本文探讨的只是博弈论中一个很小的方面,对均衡问题中的子博弈精炼纳什均衡等没有涉及到,但它们的应用也很广泛。在日常经济生活中,小到购物时的讨价还价,大到企业间的竞争与合作、国家间的倾销与反倾销等,都可归结为博弈问题。
经济学是经济管理类专业的专业基础课程,学生学习的好坏不仅会影响到后续课程的学习,对学生综合素质的提高也会有着直接影响。由于经济管理类专业大多是以招收文科考生为主,数学基础比较差,对经济学有些难以理解。有时候,尽管老师在讲台上讲得天花乱坠,学生听起来却觉得干巴巴的、索然无味,像是过眼烟云,很难有好的教学效果。作为科任老师,我们可以改变自己的教学方法,用经济理论解释现实生活,用现实生活说明经济理论。现结合我自己多年来教学的经验,谈谈我对应用型人才经济学教学的一些看法。
1 善于挖掘日常生活中的事例作为教学案例
经济学是一门研究资源的配置与利用的科学,而生活中处处都面临的各种各样的选择,这就涉及到经济学。生活中处处都有经济学,从起床到睡觉,从穿衣到吃饭,从睡眠到读书、游戏、身体的锻炼以及购物、聊天、休息,从生活起居到谈情说爱,都存在着资源配置与利用,存在着经济学问题。经济学的问题比比皆是、俯首可拾,比方说,我们通常会遇到这种情况:一个人在外面走路,会感到孤单,甚至有时候会有一种不安全的感觉,于是,见了陌生人他也可能会跟对方主动打招呼聊天、一起走一段路。经济理论很容易就可以解释这些事情,因为跟他人聊天可以增加自己的效用,两个人走路跟一个人走路相比,两个人走路可以打发寂寞时光、可以增加安全感,从而增加他们的效用,这也是一个帕累托改进。用这些日本文由收集整理常生活中司空见惯的事情,来谈经济学,学生容易接受,也容易引发学生的兴趣。带着兴趣与没有兴趣来学习同一门课程,其效果将是天渊之别。
2 善于用经济学知识解释日常生活中的现象
生活中虽然处处都有经济学,但要利用经济理论解释它们却需要我们经常去思考。例如,关于物质与爱情之间的关系问题,一般人认为,物质是基础,但有了一定的物质基础之后,物质和爱情何者更加重要,他们的关系如何,这可以用经济理论来分析。
我们可以用u表示效用,m表示物质,l表示爱情,a、b、α、β、γ为不为零的常数,它们的关系式可以表示为:u=amα+bmβlγ。这个式子就较好的描述了一般人的物质与爱情的关系的观点。当m=0时,不管l是否为零,u都等于0,说明物质是基础,没有物质基础爱情也不能当饭吃。β、γ的大小代表物质与爱情孰轻孰重,当β>γ时,更加看重物质;当β<γ时,说明他有了一定的物质基础之后,更加注重爱情。物质与爱情到底各占多大比重的问题,是一个效用最大化问题。
只要我们用心的去思考,就可以发现日常生活中存在太多的现象可以用经济理论来解释。甚至我们所说的一些在理的话,都包含了经济学原理。例如,在电视连续剧《乔省长和他的女儿们》的大结局中乔省长有一句台词:“如果一个人有了害人之心就不可救药了。”用经济理论如何解释这句话呢?经济学有一个经济人假设,人总是在谋求自己的利益,有害人之心的人总是把别人情况变好当作是件使自己效用减少的事情,为了增加自己的效用水平,在自己情况不能变好的情况下,他只能通过损害别人利益来提高自己的效用水平。
3 善于用经济学知识解释社会现象
经济理论不仅应该解释日常生活中的现象,而且要解释社会现象。几乎所有的社会现象都可以用经济理论来解释。最常见的社会现象如失业、通货膨胀、经济增长、房产问题、三农问题、人民币汇率问题、经济危机、欧洲债券危机等等,这些典型的经济现象无一不是经济问题,都可以用经济理论来分析。有些社会现象,看起来不是经济问题,但也可以用经济理论来解释,如很多人在感叹物质文明取得长足进展的同时,惊呼道德沦丧问题。著名的经济学家加利·s·贝克尔(gary s·becker)就因把经济分析方法推广到人口增长、家庭、教育、犯罪和处罚、歧视等社会问题研究领域,在1992年获诺贝尔经济学奖。同样地,经济理论还可以解释我国的文凭热、证件热、国考热、宰客门,甚至可以解释考生的作弊现象;也可以解释日本因地震而造成核泄露后中国出现的“抢盐风波”,甚至可以解释为什么我国反腐倡廉将是一件长期而艰巨的工作。有人对城乡居民的幸福因子做过调查,结果显示:生活条件差得多与收入低得多的农村居民比城市居民的幸福指数更高。这种结果让常人难以理解,但在经济学里面,解释这种现象却是一件轻而易举的事情。正如常人所说的“幸福不是你拥有的多,而是你计较得少”。
转贴于
4 善于用经济学理论解决生活中存在的问题
经济理论不仅可以解释日常生活中的现象和社会现象,而且,还可以用于指导解决生活中存在的问题。经济理论不仅来源于实际,而且自产生之日起,就是用来指导并解决“经济”问题的。因此,经济理论也可以用于解决生活中存在的问题。比方说,有的同学不能正确处理好恋爱与读书、打工与读书、游戏与读书、锻炼与读书等关系问题。有的同学甚至产生厌学情绪,这部分人来到学校忘记了读书就是自己的天职。对他们可以用机会成本理论、消费理论来教育他们好好读书,让他们算一算自己来到学校读书的机会成本,不要以高昂的代价借入明天的钱用于今天的消费。
大学生中还存在着另一类极端的观点:有一部分同学认为,只要读书读好了,其它方面都可以不必考虑。这部分人是学习至上主义者,他们可以忘我的读书,而不顾自己的身体承受能力。还有一种人,他们为了自己的利益,即使是损害他人利益,甚至伤天害理也在所不惜。这种情况可以用产出函数来说明。我们知道有个这样的柯布道格拉斯生产函数:y=alαkβ。y表示产出;a表示技术,在这里可以具体化为所学的知识或者本事。值得注意的是,这里的a与普通的柯布道格拉斯生产函数稍有不同,a的符号可正可负,当它是用来造福人类的时候,a>0;当它是用来破坏他人幸福、损害他人利益的时候,a<0;l表示劳动;k表示资本;指数α、β为常数。这个式子说明,如果不好好锻炼身体,身体搞垮了,使得l=0,产出y也将等于0;如果思想道德品质败坏,尽做一些损害他人利益的事情,他的产出将是负数,也就是危害社会的“产出”。因此,我们不仅要学习好,而且要锻炼好身体,尤其是要保证思想道德品质不要出现问题。
5 善于应用经济理论正确引导学生为人处世
经济理论不仅可以解释日常现象和社会现象,而且还可以引导学生为好人、处好事。前面的产出函数就是一个引导学生做人的非常好的例子。其实,经济理论中有很多知识可以与为人处世联系在一起。比如生产与消费的外部性问题教导学生不要做那些对社会、对他人有不利影响的事情,要多做一些好事情,至少不要做对他人造成不好的影响的事情。如某人生日party,寝室几个人一起在寝室里唱歌跳舞猜拳饮酒,彻夜狂欢、好不快乐。可是,他们的行为却具有很强的外部性,他们影响了别人正常的生活与休息。为了减少甚至消除他们的行为的外部性,他的生日party可以不要开得太晚,以免影响他人的正常休息,或者找一个不会影响他人的地方做他的生日party,如在酒店或娱乐场所。另外,可以用博弈论中囚徒困境的知识来分析为什么要构建和谐社会、为什么要与人为善、为什么要懂得尊老爱幼尊师重教、为什么要懂得感恩等等。福利经济学的社会效用函数知识告诉我们,公交车上把座位让给老弱病残孕的乘客可以增进整个社会的福利水平;洛伦兹曲线与基尼系数的知识告诉我们应该关心弱势群体,以促进整个社会的和谐发展;凯恩斯的边际消费倾向理论从经济学的另一个角度告诉我们,社会经济平等也有利于社会经济发展。
6 学生综合素质的提高也涉及到经济学
知识是素质的一个重要方面,要提高学生素质,就要让学生掌握更多的包括经济学在内的知识。学生综合素质提高的问题也可以归结为一个经济学问题,可以看作是固定成本下的产出最大化问题,但这个问题与普通的投入产出问题有所区别。首先,人的综合素质是有很多方面决定的,我们不妨把每一个方面也称为一种素质;其次,每一种素质的培养又需要一定量各种“要素”的投入,同时,在培养这种素质的同时,其它素质也会发生变化。如果用z表示综合素质,yi表示n个素质中的第i方面的素质,xj表示m个要素投入中的第j种要素的投入,假设第j种要素的价格为pj,总成本c为常数,用f和g表示某种函数关系。我们同样可以将它们的关系用函数表示:
z=f(y1,y2,y3,…,yn)=g(x1,x2,x3,…,xm) x1p1+x2p2+x3p3+…+xmpm=c
(1)式有两个方程,后面的等号表示m种要素的投入,有n个方面素质的产出,这是一个投入产出方程;前面的等号表示人的综合素质是由y1、y2、y3……yn几个方面的素质决定的,z为综合素质,可以看作是由于获得y1、y2、y3……yn所得的好处或者效用,因此,前面的等号可以看成是效用函数。(2)式为约束函数,表示资源的有限性。因此,如何使得学生综合素质最大化,就可以归结为有限资源如何配置的问题,这就是典型的经济学问题。
一、引言
水是万物之源。没有水,社会将寸步难行。然而生活中,总会由于各种原因导致临时停水,给人们生活和生产带来不便。解决不可控因素下多方供水需求,单独的救急中心远远不够,必须调度多个救急中心的应急资源。由于各需水点对应急资源存在竞争关系,因此,寻找一种能够反映各个需水点的缺水严重程度和救助响应时间的应急资源调度策略和模型,以达到利益均衡是一个值得研究的课题。
二、调度策略的非合作博弈模型建立
(一)模型假设
在解决本文提出的不可控因素发生时对应急资源合理调度的问题前可以做出如下假设:
1.对各子系统在相同情况下对应急资源的需求量做出分级,1表示严重缺水,2表示重度缺水,3表示中度缺水,4表示轻度缺水。
2.现实中单一救急中心往往无法解决所有需水点对水资源的需求,因此需联合多个救急中心。假设当某一区域的应急资源难以解决问题时,可从邻近区域调水。
3.成本函数作为一个多元复合函数,其影响因素包含很多,比如本事件中子系统的缺水程度,资源调度到救援响应的时间以及需水点到救急中心的距离等。因此在解决问题前需要对各子系统(即需水点)对救急中心的调度成本进行从大到小的排序。
(二)博弈模型的相关参数与数学表达式
1.调度成本函数C■■
理论上以其为调度策略的依据。C■■的函数表达如下所示:
C■■=H■*(■)∞(4)
公式中,H■表示需水点i的缺水级别,Y■■表示需水点i到救急中心k的距离。
2.效益函数Pi
在实际调度过程中,收益函数等于调度成本的倒数:
P■■=■(5)
其中k∈M。公式中,C■表示需水点i在救急中心k未能得到资源而从其他救急中心进行资源调度而产生的额外成本。需水点i从全部救急中心集合M中调度其所需资源的效益函数满足叠加定理。
三、非合作博弈模型的算法求解
(一)求解水资源调度的非合作博弈模型Nash均衡解的步骤
1.对救援资源初始分配,确定各需水点向救急中心调度资源所产生的成本;
2.不考虑各救急中心可提供水资源的上限,按成本最小化原则向各需水点分配资源;
3.考虑各救急中心实际资源量,若可以满足同一级别各需水点,则按需分配。若不能,同级别各需水点对该救急中心的资源将产生竞争,形成博弈;
4.构造非合作博弈调度模型,求解Nash均衡解,并按Nash均衡解对救急中心的水资源进行调度;
5.同一级别的需水点若存在按照Nash均衡解分配后仍不满足需求的部分,则按成本最小化原则从其他救急中心调度资源,直到满足需求;
6.重复步骤(3)。
(二)求解纳什均衡
根据纳什均衡的定义,对所有纯策略组合进行逐一检验,得出纯策略纳什均衡。应用最多的一种算法称为迭代算法。
在实际迭代计算中可以从任意的s(0)∈S(策略空间)开始,假设初始点s(0)与纳什均衡点s*之间的距离为d(0),经过m次迭代以后,d(s(m),s*)≤?灼0d(s(0),s*)=?灼■■d(0),因为0≤?灼0≤1,因此可以采用迭代公式s(m+1)=Xs(m)来任意逼近纳什均衡点s*。
四、实例计算与分析
问题描述如下:现因某地区发生山体滑坡塌方,导致自来水厂源水浑浊度超标,从而导致城市G临时停水,期限不明。城市G有四个区a,b,c,d,分别报告了不同的缺水程度。城市G市内只有一处救急中心A,邻市F有两处救急中心B、C。为了不影响市民的日常生活,现有关部分组织进行水资源救助工作。数据假设如下。
表一 需水点缺水情况表
■
表二 救急中心资源情况表
■
现假设四个区域向各救急中心调度水资源所产生的成本是相同的。运用3.2提出的求解纳什均衡解的迭代方法可以求出该博弈的纯策略Nash均衡解:
s■■=(10,0,0) s■■=(1,5,2)
s■■=(2,5,1) s■■=(0,0,6)
将上述数据代入公式可求得:
总成本Ci,p=Ca,q+Cb,q+Cd,q=10+15+17+18=60是为最优化成本调度策略。
根据公式可求得此组合策略的各个收益函数,将各个需水点的收益函数代入公式,可得总的效益目标函数为:
F=Pa+Pb+Pc+Pd=21
综上所述,利用迭代算法求得的Nash均衡解:
s■■=(10,0,0);s■■=(1,5,2);s■■=(2,5,1)s■■=(0,0,6)可以实现向区域a,b,c,d进行水资源公平合理调度,并且能够保证调度策略的成本最小,效益最优。
五、结束语
该论文本着实用性原则针对日常生活中常见的临时供水不足问题进行了相关研究,论文方法通俗易懂,且延展性较强,相关的思想方法也可以用来处理类似求解最优化组合的问题,比如解决自然灾害发生时,不同地区受灾点的资源调配问题或者用于公司经营中解决客户售后服务的技术人员调配问题,商业中物流配送问题等。不足之处仍然存在,但客观讲,本文思想方法仍具有一定的理论及现实意义,具有较好的可操作性,值得广泛推广。
参考文献:
[1]Sun J, Xu WB.A global search strategy of quantum- behaved particle swarm optimization [C].Proceedings of IEEE Conference on Cybernetics and Intelligent Systems, 2009.:111- 116.
[2]HWANG H-S. A food distribution model for famine relief [J]. Computer and industrial Engineering, 2011, 37 (1 /2) :335-338.
[3]Wan Xiaoyu,Pu Yifei, Li Bingjun, Fractional Differential Amplitude Hierarchical Feature of MPSK Signals[G].8tth INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING PROCEEDINGS,2010,
[4]王万良,蒋一波,李祖欣等.网络控制与调度方法及其应用[M].北京:科学出版社,2009.
[5]杨继军.面向非常规突发事件的应急资源博弈调度模型与优化策略研究[D].上海:同济大学经济与管理学院,2009.
[6]姚杰,计雷,池宏.突发事件应急管理中的动态博弈分析[J].管理评论,2005(3):46-50.
Gábor Lugosi, Universitat Pompeu Fabra, Barcelona
Prediction, Learning and
Games
2006, 394pp.
HardcoverUSD65.00
ISBN 978-0-521-84108-5
Nicolò Cesa-Bianchi(意大利) 等著
日常生活中,有关预测的例子如预报给定地点明天的温度,或者是猜测在下一个月内哪些资产将会获得最佳效益,尽管它们内容不同,这些任务在一个抽象的层次上是类似的。在给定的有关过去的元素的某些知识以及其他可利用信息的条件下,预测一个未知序列的下一个元素,对这个过程的研究,就是预测研究。
本书的主题是单一序列预测。人们在各种不同的领域中对它进行研究如统计决策理论、信息理论、博弈理论、机器学习及数学金融领域。这个主题最早的形成可以追溯到20世纪50年代。与预测的标准统计学方法不同,单个序列预测对于数据产生机制并不强加任何概率统计的假设。此外人们还可以构建预测算法,该算法对于所有可能的序列都能很好地工作。在这个意义上讲,单序列预测的性能与在一个给定参考类中的最佳预测策略是一样好的。本书列举的单序列预测模型使用的是专家咨询预测模型。重复博弈,自适应数据压缩,股票市场顺序投资序列模式分析和其它几个问题都可以看作是专家框架的示例。从一个普通的非随机观点进行分析,经常会揭示元素之间新的、令人感兴趣的关系。作者对各种预测方法用精确的数学方式描述,以便表征这些预测方法在理论上存在哪些限制和可能性。
本书共有12章。第1章绪论;第2章预测与专家咨询;第3章特殊损失的紧限界;第4章随机化判断;第5章用于大专家类的有效预测;第6章具有有限反馈的预测;第7章预测和进行博弈;第8章绝对损失;第9章对数损失;第10章顺序投资;第11章线性模式识别;第12章线性分类。本书的附录中收集了书中使用的技术工具。附录A1概率论中的不等式;附录A2基本的信息理论;附录A3分类基础。
作者撰写本书是为了促使有关单一序列预测的概念在上述这些领域中更加顺畅地流传。本书可以用作机器学习、博弈论、统计学和信息理论专业的研究人员及学生的参考书和教科书。
胡光华,高级软件工程师
中图分类号:F069.9文献标志码:A文章编号:1673-291X(2009)29-0240-02
“博弈论”这一名词的流行仅仅始于几十年前,但是,博弈论思想本身却有着悠久的历史,如两千多年前的“田忌赛马”就是出色利用博弈论的典型生动的例子,至今仍然为中国的许多学者、老师应用来作为博弈论的入门例子。
一、博弈论的发展进程
博弈论思想虽然有着悠久的历史,但是作为一门系统的学科来说还相当的年轻。近代以来,在学术研究的过程中许多学者逐渐认识到了博弈论的重要作用,对博弈理论进行了探索研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(W aldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Coumot)和波特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反应函数。但是作为一种理论来说,1944年,冯・诺依曼(Von Neumann)和奥・摩根斯坦(Morgenstern)合著了《博弈论与经济行为》在总结了以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提出了较系统的博弈理论,因此这被认为是博弈理论初步形成的标志。50年代初,纳什(J.Nash)的两篇非合作博弈论奠基性之后,博弈论飞速发展。作为博弈论的一部分,非合作博弈比合作博弈的发展更加迅速,在经济学等其他学科中的应用也更为广泛。提起博弈论,现在差不多总是指非合作博弈论。50年代以来,纳什(Nash)、泽尔腾(Selten)、海萨尼(Harsanyi)等人是博弈论成熟并最终进入使用。
最近三四十年,经济学经历了一场“博弈论革命”,经济学者们引入博弈论的概念和方法改造经济学的思维,推进了经济学的研究,可以说博弈论在一定程度上已经改写了微观经济学,成为推动经济学发展的一大动力。一方面,纳什均衡概念以及更多的博弈论知识的引入使寡头竞争理论得到改造,在现实中应用的普遍性更明显,严格而深入的探讨竞争现实的现代寡头理论迅速发展起来;另一方面,在经济社会中,每个人的决策都是根据他所掌握的有关信息做出的,非对称信息博弈论这种分析方法彻底改变了微观经济学的面貌,极大地促进了信息经济学的发展,信息经济学已经真正成为当今经济分析的主流。
二、博弈论的主要内容
博弈论(Game Theory)又称作对策论,是专门研究理性个体之间相互冲突和合作的学科。一个最基本的博弈结构,至少包括三个要素:局中人(player)、战略空间(strategy space)和支付结构(payoff structure)。
博弈论的基础假定是博弈的参与者即局中人是理性而明智的;在每个局中人的所有可选行动范围(战略空间)内,该局中人是独立的,不受其他局中人任何形式的胁迫;一个局中人的支付结构表示在不同情况(不同战略组合)下博弈终了时他的收益(或“得分”)。在典型的支付结构中,一个局中人所得的支付不仅与他自己选择何种战略有关,而且还是其他局中人所选战略的函数,任何一个局中人改变自己的战略都将影响所有局中人所获的支付水平。这就是说,局中人之间的利益是相互牵连和相互制约的。除上述3个要素以外,要对一个博弈进行分析,对博弈定义一个信息结构也是必不可少的。研究者必须明确每个局中人知道什么和不知道什么。在局中人追求自己的支付最大化假定下,博弈论研究这些理性个体的行为选择。一个博弈的“解”,也就是该博弈最可能出现的结果,称为“均衡”(equilibrium)。一般情况下,博弈双方的目的就是能够得到一个均衡结果。
一个完整的博弈应该包含五个方面的内容:第一,博弈的参与人,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈的行动空间,即博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策后的得失。
三、博弈论的应用和对博弈论反向应用的思考
自从将博弈论引入经济学以后,经济学改变了传统经济分析地那种以个人孤立决策,其他经济活动者的行为影响则被典型地简化为价格信号为基础的分析方法,而侧重于经济活动中多个利益主体的行为所产生的相互作用和影响的分析,从而使经济分析更能反应经济系统的本质。
博弈的过程在一定程度上更接近经济生活中的实际,具体来说,博弈论是怎样应用到实际事务上的,下面将举例说明,并且讨论探索反向应用博弈论是否可能、是否有意义。
我们以日常生活中最常见的学生与家长的博弈为例:
假设一小学生和其家长,学生每天都必须完成老师布置的家庭作业,家长可能检查也有可能不检查其完成状况。如果学生按时完成家庭作业,玩的时间减少;家长检查,学生没有完成就会得到惩罚。家长当然希望孩子按时完成作业,如果检查发现学生没有做作业,家长会感到生气,而且天天检查对家长来说是额外的负担。因此如果学生做了作业家长也检查了,那么学生得到的效用是-2,家长得到的效用是2;如果学生做了作业家长没有检查,那么学生得到的效用是-4,家长得到的效用为3;如果学生没有做作业家长检查了,学生增加了玩耍的时间却受到了惩罚,得到的效用是0,家长得到的效用是-2;如果学生没有做作业家长也没有检查那么学生得到的效用是4,家长的实际得到的效用是-1.博弈矩阵如图1:
博弈的结果是学生会选择不做作业,家长会选择不检查,实际影响是无论是对学生自己还是对家长来说,得到的都是最差的结果。
面对这样不尽如人意的博弈结果,我们应该怎么办呢?
博弈总是在一定的条件下进行的,这些条件决定了博弈的结果。那么根据现有的博弈结果,我们是否可以反向应用,找出可以改变的条件从而改变整个博弈的格局,改变博弈结果,改善博弈双方的效用水平呢?
仍然以上面的学生家长博弈为例:
1950年和 1951年纳什的两篇关于非合作博弈的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈极其均衡解 ,并证明了均衡解的存在性,即著名的“纳什均衡”,从而揭示了博弈均衡与经济均衡的内在联系奠定了现代非合作博弈论的基石。
要了解纳什均衡,首先要知道什么是非合作博弈问题。“囚徒困境”是该问题最经典的例子,我们也从该例为切入点进行探讨:
首先,一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做 出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
“囚徒困境”:两个嫌疑犯(A和 B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判 1O年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯 A和 B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和 B均坦白或均不坦白、A坦白 B不坦白或者 B坦白A不坦白,是博弈的结果。在此,两个嫌疑犯 A和 B面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判 1年。但由于两人处于隔离情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利 己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到最好的解决办法——释放,但前提是同伙抵赖,显然要比自己抵赖要坐 1O年牢好得多。这种策略是损人利 己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐 1O年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判 8年,总 比被判 10年好。结果 ,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(各被判1年刑)就不会 出现。这样两人都选择坦白的策略以及因此被判 8年 的结局被称为“纳什均衡”,也叫非合作均衡因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发 ,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇 了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利 己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象:
(1)电信价格竞争
根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商 A与B,他们在电信某一领域展开竞争,一开始的价格都是 PoA(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则 刚成立不久 ,翅膀还没长硬 ,是政府为了打破垄断鼓励竞争而筹建起来的。
正因为 B是政府扶植起来鼓励竞争的,所以 B得到了政府的一些优惠,其中就有 B的价格可以比Po低 10%。这一举动,还不会对 A产生多大的影响,因为 A的根基实在是太牢固了。在这样的市场分配下,A、B可以达到平衡,但由于 B在价格方面的优势,市场份额逐步壮大,到了一定程度对 A造成了影响。这时候,A该怎么做?不妨假定:
A降价而B维持,则A获利 15,B损失5,整体获利10;
A维持且B也维持,则 A获利5,B获利10,整体获利15;
A维持而 B降价,则 A损失 10,B获利 15,整体获利5;
A降价且 B也降价,则 A损失 5,B损失 5,整体损失10。
从 A角度看 ,显然降价要 比维持好,降价至少可以保证比 B好,在概率均等的情况下,A降价的收益为 15 x50%一5 x 50% =5,维持的收益为 5 x 50%一10 x 50% =一2.5,为了自身利益的最大化,A就不可避免地选择了降价。从 B角度看,效果也一样,降价同样比维持好,其降价收益为 5,维持收益为2.5,它也同样会选择降价。在这轮博弈中,A、B都将降价作为策略,因此各损失 5,整体损失 10,整体收益是最差的。这就是此博弈最终所出现的纳什均衡。我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象,各个局部都寻求利益的最大化,而整体利益却不是最优,甚至是最差。
许多其他行业的价格竞争都是典型的囚徒困境现象,如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。
(2)OPEC组织成员国之间的合作与背叛
“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
上述我们在对电信价格竞争的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降价的纳什均衡。而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。比如中东石油输出国组织(Organization of PetroleumExporting Countries简称 OPEC)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈的话,基于个人利益最大化,得到纳什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解 ,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解。这也是博弈论上著名的“大众定理”(Folk Theorem)的含义。
但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺(Credible commit.r em),向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。这里“可信的承诺”是一个很牵强的翻译,“Credible commitment”并不是什么空口诺言,而是实实在在的付出。所以合作是非常困难的。所以 OPEC组织经常会有成员国不遵守组织的协定私 自增加石油产量。每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌 ,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降——结果,陷入一个困境大家都增加产量,价格下跌,大家再增加产量,价格再下跌理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟 )不是一个纳什均衡没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作 ,双方考虑长远利益他们的合作是会成功的。但只要是有限次的合作 ,合作就不会成功。比如合作 10次,那么在第九次博弈参与人就会采取不合作态度 ,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。 还存在其他一些“非合作博议”的情况:
(1)污染博弈
假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价也绝不会主动增加环保设备投资。按照看不见的手的原理 ,所有企业都会从利己的 目的出发,采取不顾环境的策略 ,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染 ,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加 ,价格就要提高,它的产品就没有竞争力 ,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到 20世纪 90年代中期 ,中国乡镇企业的盲 目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。
(2)贸易自由与壁垒
这个问题对于刚刚加入 WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。x国试图对 Y国进行进口贸易限制,比如提高关税 ,则 Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如 x和 Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易 自由中获得了最大利益,而且全球贸易的总收益也增加了。
以上是运用博弈论中的经典案例“囚徒困境”对现实经济生活的一些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多,但是 ,博弈论作为现代经济学的前沿领域,始终是一个强有力的分析工具。
参考文献
中图分类号:G642文献标识码:A 文章编号:1003-2851(2010)01-0025-02
一、概念
博弈论是经济学中的一个重要的理论, 它在日常生活中有着广泛的应用。现在博弈论也越来越多的被引人到体育领域, 结合具体的体育项目进行研究。
(一)博弈论
博弈论, 英文为game theory, 是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。博弈论是一种方法论, 它是一种思维方式、技术方法和理论体系, 应用的范围不仅包括经济学, 而且包括政治、军事、外交、体育等。博弈论可以分为合作型博弈和非合作(竞争)型博弈。合作博弈,指人们达成合作而得到的收益,即收益分配问题;非合作博弈,指人们在利益相互冲突的局势中如何确定决策使自己的收益最大化,即策略选择问题。因为人们之间的相互依存和相互制约作用以及自利的本性产生了博弈,而博弈简单的论述就是双方或多方在一维或多维之间斗智斗勇,作出决策分析,达到均衡解决,求得双赢的结果。
一个完整的体育博弈应当包括五个方面:1.博弈的参加者,即博弈过程中独立决策、独立承担所果的个人和组织;2.博弈信息,即博弈者所掌握的对手对选择有帮助的情报资料;3.博弈方可选择的全部行为或策略的集合;4.博弈的次序,即博弈运动员做出策略选择的先后;5.博弈方的收益,即胜算或取得胜利。“囚徒困境”是博弈论的经典例子,经济学家把大量的看似最优却导致次优或较差的结果的行为称“囚徒困境”。“囚徒困境”是用来说明博弈论及其在经济环境中如何运用的一个例子,它很有说服力而又易于理解。然而不是所有参赛者,策略和后果的情形都会导致囚徒困境。
(二)体育博弈现象
是指体育实践中存在的各种冲突、对抗与竞争。体育博弈现象表现在竞技运动的方方面面。从申办之争、组织管理之争、劳资大战、仪器设备的研制, 到选材、训练方法之争。如高原训练、力量训练、兴奋剂之争、药物与体能的恢复、消除疲劳等, 以及竞赛之争, 如中长跑的领先战术、世界杯的斗智斗勇、竞赛中的心理战等等。现代化的社会也增加了体育竞争的激烈程度。排球比赛中也有不少的博弈现象,如发球阶段,发球方可选择发到前排也可选择发到后排,还可选择发给接一传不稳得队员,发球阶段的博弈策略主要以破坏对方一传为目的。网前技术的博弈现象更多,时间差进攻、位置差进攻、空间差进攻、梯次进攻、快球进攻等,纷繁交错的技战术让对手防不胜防。面对对方强势的拦网阵型,“尤其是在快速多变的战术体系中,有针对性地运用吊球技术,可以使得战术组合更加变化多端,从而扰乱对方的防守布局,破坏对方的防守节奏,甚至涣散对方的士气,边不利为有利。” 四两拨千斤的吊球,有时可收到意想不到的效果。对方的吊球可与各种进攻战术的扣球相结合, 即“ 打吊”结合,吊球可与各种进攻战术的扣球相结合, 即“ 打吊”结….合,吊球可与各种进攻战术的扣球相结合, 即“ 打吊”结合,吊球可与各种进攻战术的扣球相结合, 即“ 打吊”结合,
二、排球比赛中发球策略的博弈分析
(一)比赛前对对手的情报资料的收集与分析
体育博弈论的精髓是对对手的情报资料的收集与分析,相对应地采用何种策略来对应。例如对对手技、战术特点的了解。如以前苏联、保加利亚、波兰男排为代表,他们身材高大,弹跳力强,以凶狠扣杀取胜的“力量排球”。以捷克斯洛伐克男排为代表,他们善于用脑,轻打软吊,以巧取胜的“技巧排球”。以日本、中国男排为代表,他们主要 依靠默契配合,集体智慧,快速善变来达到取胜的目的的“配合排球”。因此,在参加比赛之前必须发挥团队作用和临场灵活的策略运用,才能提高胜算,最终取得胜利。
(二)策略的选择
1.利用发球控制节奏
现代排球的实践证明,比赛节奏主动权的掌握在临场比赛中起着举足轻重的作用。发球是破坏对方比赛节奏先发制人的进攻技术,准确而有威胁的发球不仅可以直接得分,还可以破坏对方一传的质量,迫使对方打调整球,扰乱其战术组合,减轻本方防守的压力,力争防反主动权。用“稳、狠、准”的发球,通过找点或找人发出速度、线路、性能、落点各不相同的球去破坏对方的一传,使对方在一传、二传、扣杀等环节不能顺利衔接,扰乱对方接发球反攻的节奏,达到破坏对方战术节奏的目的[5]。
2.接发球策略
在排球比赛中,发球的策略尤为重要,达到破坏对方一传的作用。但是双方运动员都不可能运用单一的比赛策略,选择单一的策略必然是愚蠢的,也不可能能够打败对手,因此,通常都是采用混合策略来对抗,让对方不可预测才是明智的。例如A 队与B队进行比赛,A 队的比分已领先,B队在赛前已经掌握到A 队的大量资料信息,A队的强项是致命的大力跳发球与高拦网,似乎很显然,在比赛到关键时刻,在接下来的比赛中,B 队应该避免一传不稳的队员接发球或网前强攻;同样很显然A 队很清楚地知道这个策略的人。因此A 队在意识上和体力上都很好地做好大力跳发球和高拦网的准备,这样,针对强项所进行的攻击对B队就很具有杀伤力。
A队猜是快攻 A队猜是吊球
B队网快攻B赢得40% B赢得60%
A赢得60%A赢得40%
B队网前吊球 B赢得60%B赢得50%%
A赢得40%A赢得50%
B队在网前的时候有两个选择,进攻或吊球。相应地,A队也有两种策略,即预计对方可能进攻和预计对方可能吊球。如果A选手正确地猜到对手强攻,A队将有60%的可能赢得该球;如果A队正确地猜到吊球,A选手将有50%的可能赢得该球。如果A选手猜是快强攻,而B选手却是吊球,那么A选手赢得该球的概率是40%;如果A 选手错误地猜是吊球,B 选手赢得该球的概率也是40%。
与囚徒困境的例子不一样,这种情形并没有单一的均衡结果。比如,假设B 选手一直对A 选手的吊球,A 选手看到这一点,于是A 选手总是作好接吊球的准备,这样A 选手将赢得60%的球。B 选手意识到,如果能够骗过了A 选手将会更好,于是B 选手发A 的快攻就赢得60%的球。A 选手很快也知道了B 的新策略,于是预料B 选手会快攻,赢得50%的球。B 再次调整,现在改为针对A 选手的强项―高拦网。因为A 仍然预计B 选手会发吊球,所以B 选手赢得60%的球。然而A 选手再次明白了,正确预料到会是强攻或快攻。这样,A 与B又会到了出发点,赢得40%的球,真所谓的斗智斗勇。
既然长期中没有任何战略是最优的,那么只有通过骗过A 选手,发那种“A 预料不到”的球,B 才能获得最大的优势。这意味着B 选手必须采取一种混合策略,时而发吊球,时而强攻或快攻。如果A 选手猜对了,A 选手的反击是致命的。因此,B 选手必须频繁地交叉的改变战术,以至于A 选手从猜中B 发正手还是发反手当中,根本得不到好处。
3.排球比赛中的一个概率问题
假定B 选手的策略是以概率p 发A 选手的吊球,因而针对A 的快攻或强攻的概率就是1-p,进一步假定A 选手的策略是预料为吊球的概率为q,因而预料为快攻或强攻的概率就是1-q。如果A 选手预料此球为吊球,那么,根据上表A 选手赢得此球的概率是p1=0.6+0.4(1-p)因为当A 选手预计为吊球时,A 赢得发给自己的吊球的60%,赢得发给自己快攻的40%。同理,如果A 选手预料此球为快攻,那么,赢得此球的概率为p2=0.6+0.5(1-p),B 选手的最优策略就应当是发吊球的概率要使得A 选手从猜吊球还是快攻中占不到任何便宜。换句话说,B 选手的最优策略是选择一个p 值,使得p1=p2,解得,p=1/3。就会发现,B 选手的最优策略是1/3 的球发吊球,2/3 发快攻。这样,无论A 选手猜什么,B 选手都会赢得53.3%的球。进而提高了胜算,取得最终的胜利。
排球比赛的各阶段都需要博弈的思想来解决,找出最佳的最适合的发展对策,博弈贯穿于整个排球比赛中。尽管决定排球竞赛的胜利因素很多,但是,教练员和运动员在某一项战术上的策略运用得当,可以提高胜算的,所以运动员在提高自己的技术水平的基础上,要发扬团队精神,教练员和运动员在赛前对比赛对手的技术特点加以认真细致的研究,在临场的战术策略的运用要随临场的变化而变化,要使对手摸不着、猜不透,提高比赛心理素质,还得通过学习博弈理论在战术运用上苦心钻研,提高胜算,最终获得胜利。
参考文献