进化博弈理论样例十一篇

时间：2024-04-16 16:05:05

序论：速发表网结合其深厚的文秘经验，特别为您筛选了11篇进化博弈理论范文。如果您需要更多原创资料，欢迎随时与我们的客服老师联系，希望您能从中汲取灵感和知识！

进化博弈理论

篇1

一、研究背景

云南绿大地生物科技股份有限公司（简称绿大地）创立于 1996 年 6 月， 2007 年 12 月，公司向社会公开发行股票在深圳证券交易所挂牌上市，成为国内绿化苗木行业首家上市公司。2011 年 3 月中旬，绿大地公司公告称，其董事长何学葵因涉嫌欺诈发行股票罪被公安机关逮捕。调查发现，公司涉嫌虚增资产、虚增收入、虚增利润等多项违法违规行为。其实，在此之前，绿大地造假事件早已露出端倪，上市三年多来，公司频繁更换高管人员和会计师事务所。可是问题如此之多的绿大地，为何能通过层层关口上市融资，并直至三年后才被揭穿呢？

从银广厦到绿大地，上市公司涉嫌财务造假背后总有会计师事务所如影随形。本来，中介机构的任务是将真正优秀的公司输送到市场中，可事实却是中介机构与上市公司串通起来蒙骗投资者。这是由于这种行为的成本与收益不对称：与上市公司串通可以获得很大的收益，而一旦东窗事发，处罚却十分有限。显然，造假成本小而收益大。针对这种会计信息失真现象，本文从动态博弈的角度出发，对这种现象进行了分析，并提出了减少会计信息失真现象的建议。

二、博弈模型的建立与假设的提出

在会计信息的披露过程中，有披露方和监管方这样两个参与者，其中会计信息的披露方主要指企业的管理层即经营者，会计信息的监管方指会计师事务所等外部监督管理机构（这里暂不讨论股东这个角色）。每个博弈方都有两个纯策略可供选择，对于披露方可以选择披露虚假的会计信息即不诚信，也可以选择披露真实的会计信息即诚信；对于监管方则可以选择实行监管，也可以选择不监管。这里用I和H分别表示监管方和披露方的策略集合，Ii和Hi分别表示第i个纯策略（i=1，2），即I={I1，I2}={监管，不监管}，H={H1，H2}={不诚信，诚信}。同时可以作出如下假设：

假设1：披露真实的会计信息为企业带来的效用是Y，而披露虚假的会计信息为企业带来的效用是X（X>Y），其中伪造虚假会计信息的成本是a，这里a相对于X来说特别的小即X-a>Y，只有在这种条件之下，企业才有可能对会计信息进行造假。

假设2：若披露虚假的会计信息，则监管方遭受的损失是m，若披露真实的会计信息，则监管方既无收益也无损失。如果监管方发现企业有造假行为，则企业应向监管方交纳f的罚款，而监管方在监管过程中需要付出c的成本。

假设3：如果披露方披露虚假会计信息，监管方进行监管，就一定能查出该造假行为，且需满足f-c>0，否则根据理性人的假设，监管方不会实施监管。同时也假定监管方监管的惩罚力度是很大的，实施的是有效监管，使企业在被处以罚款之后的效用低于披露真实会计信息的效用，即X-a-f

从以上假设可以得到监管方和披露方的得益矩阵（见表1）

三、会计信息披露与监督的静态博弈分析

基于上述假设可以得出，在静态博弈分析中，如果监管方选择I1监管，则披露方就会选择H2披露真实会计信息即诚信；如果监管方选择I2不监管，则披露方就会选择H1披露虚假会计信息即不诚信；如果披露方选择H1不诚信，则监管方就会选择I1监管；如果披露方选择H2诚信，则监管方就会选择I2不监管。这样博弈双方就一直在博弈矩阵里循环往复下去，显然这个博弈不存在占优策略，但是纳什均衡存在性定理告诉我们：每一个有限博弈至少存在一个纳什均衡（纯策略的或混合战略的）。从以上分析可以看出这个博弈不存在纯策略纳什均衡，因此它必然存在一个混合策略纳什均衡。

假定监管方的混合策略为p={p，1-p}，披露方的混合策略为 Q={q，1-q}，这表示监管方以P的概率选择监管，披露方以q的概率选择不诚信即披露虚假的会计信息。这样就可以推出博弈双方的期望得益：

监管方选择监管的期望得益值为：

Up=q（f-m-c）+（1-q）（-c）（1）

监管方选择不监管的期望得益值为：

U1-p=q（-m）（2）

披露方选择不诚信的期望得益值为：

Uq=p（X-a-f）+（1-p）（X-a）（3）

披露方选择诚信的期望得益值为：

U1-q=PY+（1-p）Y（4）

在混合策略纳什均衡中，应该使得无论披露方选择哪一种策略，监管方选择监管和不监管的期望得益都是相同的，同时，也应该使无论监管方选择哪一种策略，披露方选择不诚信和诚信的期望得益是相同的。因此可以得到以下两个等式：

Up=U1-p，Uq=U1-q

计算可以得到P*=（X-a-Y）/1，q*=c/f，，这表示监管方分别以概率P*和1-P*选择“监管”与“不监管”，披露方分别以概率 q*和1-q*选择“不诚信”和“诚信”，即监管方和披露方博弈的唯一的混合策略纳什均衡为{（（X-a-Y）/f，（f+a+Y-X）/f），（c/f，（f-c）/f）}。从中可以得出当p>P*时，诚信是披露方的最佳策略，即q=0；当pq*时，监管方会选择监管，即p=1；当q

四、会计信息披露与监督的进化博弈分析

在有限理性下人们不一定有能力找到纳什均衡，每个博弈方通过把不同策略的得益与平均得益进行比较，然后逐步调整策略。这与生物进化过程很类似，在物种进化过程中，生物调整自身行为很缓慢。在这里，假设由披露方和监管方组成的大群体学习速度很慢，这样就可以用复制动态来模拟博弈方的动态调整，在整个复制动态过程中，如果出现一种适应性较高的策略，就会被大多数人采用，否则就会被淘汰。

在演化博弈分析框架下，监管方博弈群体中采用监管策略的比例为p，披露方博弈群体中采用不诚信策略的比例为q，因此，由方程（1）和（2）得到监管方群体的平均得益UI为：

UI=pUp+（1-p）U1-p=pqf-pc-qm（5）

由方程（3）和（4）得到披露方群体的平均得益UH为：

UH=qUq+（1-q）U1-q=q（X-a-Y）-pqf+Y （6）

由方程（1）、（5）可以得到监管方采用监管策略比例的复制动态方程为：

从上述分析可以得出以下结论：

第一，适当提高罚款额有助于降低披露方不诚信的可能性。

上述不等式说明监管方监管的可能性和披露方不诚信的可能性是罚款额的减函数。对于披露方而言，罚款额越高，越会选择诚信即披露真实的会计信息，这与现实也是相符合的，一旦被发现会计信息造假，企业不仅要承担因虚假会计信息带来的损失，还要额外地支付罚款，这样企业将会承担更大的成本和风险，因此披露方会更倾向于选择诚信的策略。同时，对于监管方来说，他们考虑到由于罚款额上升会使披露方不诚信的可能性降低，因此他们监管的可能性也会降低；相反，较低的惩罚力度会使披露方产生不诚信的心理，使得监管方监管的可能性增强。

第二，降低监管成本可以减小披露方不诚信的可能性。

这个不等式表明披露方不诚信的可能性会随着监管成本的降低而降低，是因为较低的监管成本使得监管方实施监管的可能性增加，披露方考虑到监管方的这种心理，自然就减少会计信息造假的可能性。所以，为了尽可能地减少会计信息失真的现象发生，监管部门应该采取一切可能的方法来降低监管成本，有效遏制会计信息造假的发生。

第三，诚信遵从的改善是缓慢的，即监管方监管的概率p*较高时，披露方处于规避风险的考虑，他不诚信的概率q*较低，同时，一旦监管方觉察到会计信息造假的事件比较少时，也会放松监管，即选择监管策略的可能性就会降低，这样就会使得披露方偏向于选择不诚信，提高不诚信的概率q*。这就表明，提高披露方的诚信遵从度是一个非常缓慢的过程，并非在短时间内可以实现，为减少会计信息失真的现象，应该尽量使得p>p*，从而使披露方不诚信的概率q保持在一个较低的水平上。

五、总结

本文从理论的角度分析了会计信息的披露和监管过程中的静态博弈和动态进化博弈，克服了经典博弈模型中要求参与者具有完全理性的缺点，而进化博弈正是有限理性的研究框架，降低了参与者的理性程度，更贴近现实。除此之外，动态进化博弈提供了各种可能的均衡状态，并给出了均衡状态下的方程，同时将罚款金额、监管成本和造假成本纳入动态分析过程，更符合现实，还得出了降低监管成本和加大惩罚力度是减少会计信息失真的有效途径。

【参考文献】

［1］李敏.上市公司会计信息失真博弈分析［J］.合作经济与科技，2008（2）：80-81.

［2］徐焕章，管慧芳，刘丽华.基于博弈论的会计信息失真研究［J］.西安工程大学学报，2009（2）：126-130.

篇2

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

篇3

[中图分类号] F270.7 [文献标识码] A [文章编号] 1673 - 0194（2013）12-0052-03

0 序言

低碳经济是为了为应对全球气候变化而提出的经济发展模式，核心是能源技术和减排技术创新、产业结构和制度创新以及人类生存发展观念的根本性转变。因此，“高效率、低能耗、低污染、低排放”的经济模式对供应链成员企业提出了更高的要求，实现供应链的低碳化发展是一个重要的形式和途径。如何使企业实施低碳供应链管理的行为成为当下必须解决的问题，由于传统供应链仍存在利润空间，供应链低碳化过程中必然出现传统供应链与低碳供应链间的竞争与协作，煤炭和电力是两种主要的能源形式，两者同时又是碳排放较多的企业，因此研究煤电企业供应链之间的低碳化演进路径具有较为重要的意义。

1 文献综述

现阶段关于煤电企业供应链的研究主要涉及煤电企业供应链合作与冲突、煤电价格联动博弈及煤电企业纵向联盟博弈。包建华[1] （2002）提出可以通过建立战略联盟，获取竞争优势，运用博弈论方法构造了联盟的利益分配模型，并给出了解；王晓晔[2]（2007）对煤电价格联动进行了博弈论分析；赵晓丽[3]（2008）研究了煤电企业供应链合作冲突规制，认为自我规制可以通过可自执行协议模型和借鉴“关系性租金最大化”解决合作冲突问题；刘慷[4]（2009）建立了中国煤电企业纵向战略联盟的重复博弈模型，从构建信用机制的角度分析约束煤、电企业纵向战略联盟稳定性的内外部因素。模型结果表明，煤炭、发电企业可建立长期战略联盟，实现煤、电上下游产业的协调发展，限制相关企业的道德风险与机会主义行为；李丽[5]（2011）建立博弈模型对煤电企业是否联营与煤电价格联动的收益进行定量分析，证明了煤电价格联动方案使电力成本压力得到缓解；张伟[6]（2009）进行了煤炭产业链稳定机制的博弈模型分析。

针对企业低碳供应链研究尚处于概念提出和碳成本对供应链性能影响方面，Bojarski[7]等（2009）采用LCA生命周期评估法衡量了整个供应链在加进环境因素后考虑的成本，降低了赋值主观性，并给出了基于上述成本的供应链设计模型和供应链环境模型；Cholette[8]等（2009）基于红酒分销物流选择的案例对碳及能线图（energy profile）进行分析，提出不同的供应链结构设计对于整体能源和碳排放有很大影响，Balan[9]等（2010）运用拉格朗日盒模型和欧拉盒模型对供应链建模，计算碳排放量，运用解析有限差分法，基于一个最典型的供应商、制造商、仓储和物流提供商的模型，估算碳三维无限足迹，并依据从公共服务网站上获得的基础数据计算出供应链中每一阶段产生的碳排放数量，有效跟踪碳产生途径、为优化供应链碳排放建立了量化方法；钱宇[10]（2010）提到NIKE、IKEA及Boeing等公司都积极倡导低碳供应链。

上述研究集中于煤电企业合作与冲突博弈及碳排放对供应链的影响和低碳供应链绩效评价，而对企业供应链低碳化进程中出现的传统供应链与低碳供应链并存的问题以及其演进路径缺乏研究，这表明企业供应链低碳化理论方法体系尚不完整。因此，对煤电企业供应链低碳演进路径进行演化博弈分析，找出演进路径，为供应链研究引入新的视角。

2 演化博弈理论及博弈模型构建

2.1 演化博弈理论介绍

4 结论

本文利用演化博弈理论对煤电企业低碳供应链演进路径进行了分析，结果表明企业由传统供应链向低碳供应链演进的动力主要取决于博弈双方的支付矩阵、双方所支付的另一方进行低碳供应链演进的损失，只有当双方都采取低碳演进策略时，整个煤电供应链才会实现低碳化，而且其收益也越大。反之，系统运行处于不稳定状态，不利于煤电供应链的可持续发展，但是对于双方所支付的低碳供应链演进的损失及政府应当进行的激励和惩罚机制本文未进行深入讨论。

主要参考文献

[1]包建华.煤电冶产业战略联盟及其利益分配的博弈分析[J].运筹与管理，2002，11（5）：106-110.

[2]王晓晔.煤电价格联动的博弈论分析[J].西安电子科技大学学报：社会科学版，2007（5）：106-110.

[3]赵晓丽.煤电企业供应链合作冲突规制模型[J].中国管理科学，2008（4）：106-110.

[4]刘慷.中国煤电企业纵向战略联盟的博弈分析[J]. 吉林工商学院学报，2009（5）：11-15.

[5]李丽.煤电一体化趋势下煤电联营的博弈分析[J].中国煤炭，2011（1）：29-32.

[6]张伟.煤炭产业链稳定机制的博弈模型分析[J].煤炭经济研究，2009（11）：54-56.

篇4

中图分类号：F42 文献标识码：A

原标题：基于进化博弈理论对我国车载DVD行业的市场分析

收录日期：2011年12月26日

一、我国车载DVD行业发展历程概述

车载电子产品是一类新兴的汽车电子产品，主要作用包括提高汽车的娱乐性、为驾驶员和乘客提供各类信息，以及提高汽车通信能力等。就目前来看，汽车上主要应用的车载电子产品有：GPS、车载电视、车载DVD、车载MP3、车载音响、TPMS、车载通信系统、车载网络系统、CarPC等。就车载DVD产品来看：在行业发展初期，产品价位高市场认知度低，普及率较低；随着时间的延续和经济的发展，汽车相关产业快速发展。同时，生产厂商的增加，产品数量的增大使车载DVD的价位逐渐下降，市场普及率逐渐提高。

二、我国车载DVD行业发展的经济学理论模型

（一）基本理论――有限理性和进化博弈。在博弈理论中，将理性分为完全理性和有限理性。其中，完全理性是指那种具有完美的理性意识、行为准确的理性经济人，而与之相对的有限理性则是指理性程度高但偶尔犯错误的正常人。进化博弈就是有限理性博弈方的博弈，这种博弈对均衡稳定性存在一定程度的偏差，但经过一段时间的调整就可以获得均衡的博弈。

（二）基本理论――最优反映动态博弈与复制动态博弈。进化博弈中的最优反应动态博弈是指那些能迅速调整策略的有限理性博弈方的动态策略调整，他们通常会采用针对上次博弈对方策略的最优对策。复制动态博弈是对优势策略仅具有简单模仿能力的有限理性博弈方所使用的动态策略调整机制，这一机制的核心是在群体中采用较为成功的策略（比平均水平较好的策略）的个体逐渐增加。

（三）进化博弈典型模型――鹰鸽博弈（表1）

在鹰鸽博弈模型中，鹰代表战争，是市场中较为强势的厂商经常使用的策略。这类厂商在市场中或者占据较大市场份额，或者拥有较为雄厚的资本和自主品牌，多为某行业的龙头老大或领军企业；鸽代表和平，是较为平和的市场策略。一些进入某一行业较晚的厂商或者产品处于成熟阶段的厂商往往倾向于采取这一策略。模型中，V代表收益，是厂商执行某一市场策略成功所获取的利益；C代表成本，是策略失败所付出的代价或成本，而博弈各方胜败概率假设均为1/2。

三、基于进化博弈理论对车载DVD行业的分析

车载DVD行业形成初期，市场上存在的厂商数量较少，产品品种有限，参加博弈的博弈方数量较少；而当车载DVD产品逐渐为消费者所熟知，有越来越多的生产厂商进入到这一市场来，瓜分市场份额，此时的博弈方也大幅增加，众多厂商便可以分为两个大的博弈群体：早期进入市场的拥有相对较大市场份额的厂商和待市场较为成熟才进入市场企图瓜分市场份额的厂商，我们可以称之为守擂者和攻擂者。基于以上原因，车载DVD行业发展历程正好与上述鹰鸽博弈分析方法的适用背景相符合，因此可以运用进化博弈中的鹰鸽博弈分析方法对我国车载DVD行业进行分析：

（一）市场形成初期博弈分析

1、模型背景。车载DVD市场形成初期，竞争厂商数量较少，新产品上市价格较高，同时新产品前期成本主要为研发成本和生产成本。假设博弈方只有两家厂商分别是厂商一和厂商二，收益V为8，成本C为4，博弈双方胜败的概率均为1/2。

2、建立模型

（1）鹰鸽博弈基本模型（表2）

（2）期望得益与平均期望得益。设X：采用“鹰”策略博弈方的比例；1-X：采用“鸽”策略博弈方的比例。所以，期望得益：

ux=x・2+（1－x）・8，u1-x=x・0+（1-x）・4

平均期望得益：

■=x・ux+（1-x）u1-x

=x［2x+8（1-x）］+（1-x）［4（1-x）］=4-2x2

随着时间的推移，越来越多的厂商模仿鹰策略，想要赚取更多收益，所以有：

dx/dt=x・（ux-■）

=2x3-6x2+4x=2x（x－1）（x-2）

随着复制动态过程的持续，采用两种策略的博弈方比例不再发生变化，博弈达到稳定状态，此时dx/dt，即x=0，1，2。

根据微分方程的“稳定性”定理可以求出进化稳定策略下达到稳定状态时“鹰”策略博弈方的比例。

设dx/dt＝F（x），随着时间t增加，x的变动逐渐减小，达到稳定状态的x*使得F'（x*）＜0。由此，dx/dt＝F（x）=2x3-6x2+4x，得F'（x*）=6x2-12x+4，而稳定状态下dx/dt=0的得益x*=0，1，2，带入F'（x*）。得F'（0）＝4＞0，F'（1）＝－2＜0，F'（2）＝4＞0。

（3）结论。在进化稳定策略下，达到稳定状态时的x*=1，说明鹰策略的博弈方数量稳定在1的水平。

（二）产品市场成熟期博弈分析

1、模型背景。车载DVD市场逐渐成熟，竞争厂商数量迅速增多，产品价格逐渐降低，同时产品的生产成本降低，但是维护成本大幅度提高。来自外界巨大的竞争压力使得厂商收益缩水幅度很大，而成本上升的却很快。假设博弈方为两个竞争集团，分别代表前期进入市场和后期进入市场的两个博弈方，称之为“守擂者”和“攻擂者”。收益V为2，成本C为12，博弈双方胜败的概率仍均为1/2。

2、建立模型

（1）鹰鸽博弈基本模型（表3）

（2）期望得益与平均期望得益。期望得益与平均期望得益的计算方法同上。随着时间的推移，越来越多的新厂商进入市场，企图瓜分市场份额。市场上的产品品种、品牌数量逐渐增加。

经计算，有：

dx/dt=6x3-7x2+x=x（1-x）（1-6x）

随着复制动态过程的持续，采用两种策略的博弈方比例不再发生变化，博弈达到稳定状态，此时dx/dt＝0，即x=0，1，1/6。

设dx/dt＝F（x），随着时间t增加，x的变动逐渐减小，达到稳定状态的x*使得F'（x*）＜0。由此，dx/dt＝F（x）=6x3-7x2+x，得F'（x*）=18x2-14x+1，而稳定状态下dx/dt=0的得益x*=0，1，1/6，带入F'（x*）。得F'（0）＞0，F'（1）＞0，F'（1/6）＜0。

（3）结论。在进化稳定策略下，达到稳定状态时的x*=1/6，说明鹰策略的博弈方数量稳定在1/6的水平。

四、结束语

经过上述分析可知，车载DVD产品已进入生命周期的成熟阶段：产品品牌众多，产量巨大。通过利用进化博弈理论对其分析可对其发展脉络有所了解，车载DVD行业内厂商竞争激烈，新进入厂商应在产品创新与改善售后方面加大投入力度，以求从激烈的竞争中脱颖而出。

主要参考文献：

篇5

企业内部的知识有多种形式，如个人经验、产品信息、客户信息、工作流程、各种文档。企业知识共享，就是员工互相交流彼此的知识，使知识由个人的经验扩散到企业的层面，从而提高企业的工作效率。知识共享在企业中产生的是一种知识放大效应，它通过知识管理等手段，使企业的知识资源不断得到整合与利用，从根本上推动企业竞争能力的提升。

进化博弈理论与企业知识共享机制

对于企业知识共享机制问题，可以用博弈理论进行研究。目前，国内一些研究已对此做出了初步的探索，如用“囚徒困境”模型解释不愿知识共享的问题，但是这些分析研究均是应用经典博弈理论进行分析。经典博弈理论从博弈方的完全理性出发，在信息充分的前提下找到了博弈的均衡解。然而对现实中的决策行为者来说，完全理性是很难满足的高要求。当社会经济环境和决策问题较复杂时，人的理性局限是非常明显的。因此要保证博弈分析的理论和应用价值，必须对有理性局限的博弈方之间的博弈进行分析，进化博弈论从有限理性的个体出发，以群体行为为研究对象，合理解释了生物行为的进化过程。生物进化中生物性状和行为特征动态变化过程的“复制动态”，在有限理性博弈分析中正是模拟有限理性博弈方学习博弈和调整策略过程最主要的动态机制之一，而生物进化理论中具有在动态调整过程中达到，在受到少量干扰后仍能“恢复”的稳健性均衡概念“进化稳定策略”，正是有限理性博弈分析最核心的均衡概念，或者说动态策略稳定性概念。

一般来说，在企业内部的知识共享行为上，行为主体的理性层次较低。这主要是因为这类决策是群体决策，而行为是企业行为。此时行为主体意识到错误和调整策略的能力较差，其行为变化更多的是一种缓慢进化而不是快速学习与调整机制。因此可以用生物进化的复制动态机制模拟，即进化稳定策略（ESS）。在重复博弈中，具备有限信息的个体根据其既得利益不断地在边际上对其策略进行调整以追求自身利益的改善，不断地用较满足的事态代替较不满足的事态，最终达到一种动态平衡。在这种平衡中，任何一个个体不再愿意单方面改变其策略，这种平衡状态下的策略称为进化稳定策略。因此，利用进化博弈的方法分析企业知识共享机制更加接近于现实情况，也更有实际意义。

理论基础和模型构建

（一）理论基础

假定两类行为主体均采用纯策略，令S是行为主体所有纯策略的集合，(S)代表所有在t阶段采用纯策略s∈S的行为主体集合，定义状态变量θt(S)表示在t阶段采用纯策略 s的行为主体的群体比例向量，于是有：

根据前面的假设，有限理性的行为主体有一定的统计分析能力和对不同策略收益的事后判断能力，收益较差的行为人迟早会发现这种差异，并开始学习模仿另一类行为人，因此行为人的比例是随时间而变化的，是时间的函数。上述比例随时间变化的速度取决于行为主体的学习模仿速度。学习模仿速度取决于两个因素：一是模仿对象数量的大小（可用相应类型的行为人的比例表示），因为这关系到观察和模仿的难易程度；二是模仿对象的成功程度（可用模仿对象的策略收益超过平均收益的幅度表示），因为这关系到判断差异的难易程度和对模仿激励的大小。于是，有以下连续时间的动态模型：

这是一个模仿者复制动态方程，在本模型中，有如下的定理：

定理(Fudenberrg,1998)模仿者动态的一个稳定稳态是一个纳什均衡，更一般地说，具有源于内部路径限制的任何稳态都是纳什均衡。反之，如果对于一个非纳什均衡，存在一个σ＞0，所有内部路径最终将从该稳态的σ邻域内被清除。

（二）模型构建

假设与前提条件。

1.博弈方：假设该博弈方都是有限理性，且划分为两类，即同事群体1和同事群体2。分析的框架是反复在两个群体中各随机抽取一个成员配对进行博弈。博弈方的学习和策略模仿局限在他们所在的群体内部。这样我们就可以分别对两类群体进行复制动态和进化稳定策略分析。

2.行为策略。博弈方都有两种行为方式：共享；不共享。如果他们的知识都不愿共享，相互封锁，那么个人的知识就会出现低水平重复，使他们各自获得的利益不多，假设为0收益；如果有一个企业成员打破常规，进行知识共享，那么他就获得m(0.5＜m＜1)发展机会,但共享者是有学习成本z的;如果他们的知识都实行共享,就会获得更多的发展机会p(m＜p＜1),此时各有学习成本z。

3.行为策略的采取比例。博弈方中可能采取“共享”与“不共享”的比例分别为x、1－x。

4.得益矩阵。用w表示参与人的收益。随机博弈中双方的得益矩阵如图1所示。

企业知识共享行为的博弈分析

由得益矩阵可知，该博弈的纳什均衡取决于其中P、m、z的具体水平或者说相对水平。根据上述假设，按照博弈的一般公式：

博弈方1中，“共享”类型参与人的收益为：

根据进化稳定策略的性质，一个稳定态必须对微小扰动具有稳健性才能称为进化稳定策略。也就是说，作为进化稳定策略的点x*，除了本身必须是均衡状态外，还必须具有这样的性质，即如果某些博弈方由于偶然的错误偏离了它们，复制动态还会使x恢复到x*。在数学上，相当于要求当干扰使x出现低于x*时，必须大于0，当干扰使x出现高于x*时，必须小于0。这就是微分方程的“稳定性定理”。

当0＜(m-x)/(1-P)＜1时，上述进化过程复制动态的三个稳定状态都是合理的，因为都处于0≤x≤1的有效范围。这时候复制动态方程的相位如图2所示。

由图2可以看出，x*=(m-z)/(1-P)是进化稳定策略。这意味着一旦企业内少数成员开始共享，那么随着获得利益的机会增多，就有更多的成员进行仿效，开始共享，直到组织中成员共享的数量比重为x*=(m-z)/(1-P)。如果超出这个比重，甚至所有的成员都进行共享，那么就会出现有些成员不愿贡献自己的知识让他人共享，反而利用其他成员创造环境氛围，从中牟利，出现“搭便车”的现象，最终仍然回到了x*=(m-z)/(1-P)的均衡比例。

随着支付矩阵的不同取值，x*可能与其它的两全解相等或者不存在第三个解，博弈退化为只有两个稳定态。

当(m-z)/(1-P)＜0，也就是m由图3不难看出，这时候复制动态的唯一稳定的均衡点为x*=0，也就是说企业所有的成员都是不愿共享的。只要不是一开始所有成员都是共享型的极端情况，最终都会在长期的动态变化中趋于不共享。即使是所有成员都共享，只要在组织内部有不共享的人出现，就会破坏共享学习的氛围，破坏整个企业的现状，企业去管理就会增加成本，这样企业反而不去管，最终会趋向所有成员都不愿共享的均衡。

当(m-z)/(1-P)＞1,也就是m-z＞1-P的情况。此时，复制动态的三个不动点中也只有x*=0和x*=1两点符合要求。复制动态方程的相位如图4所示。

由图4可以看出，现在的进化稳定策略是x*=1，也就是所有的成员都共享，整个企业组织就是学习共享型的。在社会环境和成员的素质都很好以及从学习中获得的收益远远大于成本代价时，这样的条件下是合理的。

通过对以上三种情况的分析，我们可以知道，企业知识共享机制是个长期的问题，无法以短期来解决。企业中的成员不是每个都是知识共享型的，而是存在着“搭便车”的现象，在有限理性的条件下，不是所有的企业都是知识共享型的，不是所有的企业都能做到长期性的知识共享。这也可以解释我国有很多的企业在实施知识管理，但真正取得好的结果的却并不多。

企业知识共享的行为演化机制

通过进化博弈的参数分析，可以看出企业知识共享机制的进化博弈包括如下几种可能的行为演化机制。

企业知识共享机制的选择机制，即在博弈中能够获得较高收益的策略，在以后演化过程中被更多的参与者选择。通过进化博弈的得益矩阵分析，使企业知识共享机制容易实现较高效率进化策略均衡。只要调整好P、m和z的大小，就可以保证较高效率的企业知识共享机制顺利进行。具体来说是要求用更低的成本z，创造更多的发展机会P和m，企业就会促使更多的工作人员去实施知识共享。为此企业需要加大内部不共享行为的机会成本，务必对企业内部成员的知识自私行为进行惩罚和压制，以提高这种变异的门槛，使这种不愿知识共享的行为成为一种风险很大收益很小的活动，从而压缩不实现知识共享者的生存空间，避免企业内部的知识共享机制向不利的方向演进。

企业知识共享机制的放弃机制，即在博弈中获得较低收益的策略，在以后演化过程中被更多的参与者放弃。在进化博弈分析的第二种情况下，由于m企业知识共享机制的突变机制，即参与者以随机（无目的性）的方式选择策略，其中包括突变策略，参与者将选择获得较高收益的策略。通过进化博弈的得益矩阵分析，使p-z 变大或1-m 变小，促使(p-z)-(1-m)增大，保证企业较易地实现较高相互支持、相互协作、相互沟通，鼓励和促进企业内部的知识共享行为，褒扬部门、同事的团队精神，把知识共享变成一种自动机制，从而使企业内部采取知识共享行为者获得较高的收益，这样使企业内部采取少数不共享行为的人所占的比例越来越小，提高企业知识共享机制向理想方向进化的可能性和比例，从而促进企业知识共享机制向最理想的方向演进。

参考文献：

篇6

在行为金融学和进化博弈论中都有关于“有限理性”概念，那么，这两门学科中“有限理性”的内涵是否一致，本文从这两门学科的发展历程来说明“有限理性”概念的区别和联系。

行为金融学中的“有限理性”的内涵

由于传统的金融学是建立在理性人假设和有效市场假说两大基石之上的，投资的目标是收益最大化，投资者之间无差别，他们都是对风险持厌恶态度的，并且面对不同资产的风险态度始终是一致的。但是，随着金融学研究的不断深入，人们发现金融市场上存在着大量无法用传统金融理论解释的异常现象；同时实验经济学研究表明，投资者在不确定条件下进行投资决策时并不总是理性的，随着上世纪80年代心理学在研究人的非理方面的重大发现，金融学便借鉴了心理学、社会学等研究成果，对证券投资者的认知偏差和有限理及其深层次的原因进行了大量的研究，形成了创新的行为金融学。

行为金融理论从心理学对人类决策行为的研究成果出发，比较圆满地解释了金融市场上存在的一些无法用传统金融理论阐述的异常现象，比较切合实际的阐释了投资者在不确定条件下的决策行为，并由此否定了传统金融学中的投资者“完全理性”的假设，提出了“有限理性”的概念。

经济心理学家Slovic (1972)从行为学的角度出发研究了投资者的非完全理性决策的过程。诺贝尔奖得主Simon最早提出投资者“有限理性”的观点。普林斯顿大学的Kahneman和斯坦福大学的Tversky (1979)的“期望理论”(prospect theory)认为：投资者预期和感觉的变化而导致投资行为的变化不能简单地从“理性”的角度来解释。Shefrin (2000)指出：证券投资者总是试图做出理性的决策，但是如果无法把握自己行为的后果或对投资前景模糊不清时，其有限的能力和人类固有的行为模式就会不自觉地主宰着他们的行为。行为金融学家Debondt和Thaler(1985)认为过度自信 (Over confidence)是人类最为稳固的认知偏差，它会使投资者的投资行为偏离理性的轨道，并在其经典文献“股票市场过度反应吗?”中正式提出了证券投资者的“过度反应”的行为倾向。odean(1999)的研究发现投资者具有非理性的过度交易的行为特征。

进化博弈论中“有限理性”的内涵

上世纪50年代后，经济学家开始转而强调个人理性，信息问题成为经济学家关注的焦点，同时也开始关注参与者的决策之间的相互影响，即所谓的时序问题。而博弈论在此阶段刚好解决了这两个方面的问题，从而使博弈论在经济中的应用得到了快速的发展。博弈论是在考虑到决策主体行为互动情形下，研究理性人如何决策及决策的均衡问题的理论。但是，博弈论对理性人的理性要求过于苛刻，那种“共同知识”要求决策者近乎全知全能，并且碰到博弈的多重均衡时也无法确定究竟选择哪一个均衡，这无疑是理论本身的局限。上世纪70年代以来，从进化生物学发展起来的进化博弈论，运用有限理性假设来解释经济现象使博弈论重获生机。进化博弈论的核心思想在博弈中是用群体来代替个体作为局中人，用群体中选择不同纯策略个体比率来代替局中人的混合策略。特别是从该理论的基本概念―进化稳定策略(Evolutionarily Stable Strategy，ESS )提出以来，早已超出了生物进化理论的使用范围，现己被广泛地应用于经济领域、社会领域来解释并预测人的群体行为。

行为金融学中的“有限理性”的表现

普遍的“售盈持亏”倾向

“售盈持亏”倾向，即投资者愿意卖出当前盈利的股票并继续持有亏损股票的心理倾向，行为金融理论称之为“处置效应”（disposition effect）。

赵学军、王永宏（2001）实证研究发现，中国个体证券投资者的“售盈持亏”倾向比美国投资者更严重；吕岚、李学（2002）通过卖盈比例/卖亏比例和持股时间检验表明，中国股市同样存在处置效应，与美国股市不同，中国股市的处置效应在年末相对增强，中国个体证券投资者的处置效应比中国机构投资者的处置效应更强烈；陈斌等（2002）通过问卷调查的结果显示，在个体证券投资者处理套牢股票的方式方面，选择“长期持有，直到解套”的投资者为数最多，选择“不断补仓拉低价位”的投资者数量次之，而选择“忍痛割肉”者最少。上述对处置效应的研究反映了中国个体证券投资者的损失厌恶（loss aversion）倾向，这会削弱投资者对投资风险和股票未来收益状况的客观判断。

总体上存在“过度自信”倾向

心理学家发现，人类往往过于相信自己的判断能力，高估自己成功的机会，把成功归因于自己的能力，而低估运气和机会等外因在其中的作用，这种心理偏差被称为“过度自信（overconfidence）”。

李心丹、王冀宁和傅浩（2002）采用统计分析方法，发现投资者进行了一些并非能带来收益最大化的交易，在排除合法避税、流动性需求和平衡收益与风险等三个可能影响因素后确定我国个体证券投资者进行上述非理易的原因是对自己的能力过度自信，故我国个体证券投资者进行投资决策时总体上存在“过度自信”倾向。

“过度自信倾向”对于投资者正确处理信息有直接和间接两方面影响。直接影响是，如果投资者有过度自信倾向，那么他们就会过分依赖自己收集到的信息，而轻视公司财务报表的信息；间接影响是，具有过度自信倾向的投资者在处理各种信息时，重视那些能增强他们自信心的信息，而忽视那些有损其自信心的信息，以至于不愿承认自己投资决策失误，这会导致“售盈持亏”、对某些信息反应过度（over-reaction）或反应不足（under-reaction）、进行大量盲目交易等非理。

显著的“羊群行为”倾向

“羊群行为（herd behavior）”是一种特殊的非理，它是指投资者在信息不对称的条件下，行为受到其他投资者的影响，模仿他人决策或者过度依赖舆论，而不考虑自己拥有的信息的行为。具体表现为大量的投资者在某段时期内买卖相同或相近的股票，同时进出证券市场。中国证券市场中存在着明显的“羊群行为”，无论是机构投资者还是个体投资者，羊群行为均表现十足。施东晖（2002）根据资本资产定价模型（CAPM）建立了用以检验羊群行为的回归模型，并据此对中国证券市场进行检验，结果表明，在政策干预频繁和信息不对称严重的市场环境下，存在一定程度的羊群行为。

证券市场上的“羊群行为”使投资者的买卖行为和证券价格变化具有联动性和趋同性，从而导致个股价格变化和市场指数变化之间存在很强的相关性，引起大量的“跟风”和“跟庄”行为的出现，而这些行为往往被某些别有用心的庄家所利用，所以在我国证券市场上，大部分中小投资者成为庄家获取暴利的牺牲品。

进化博弈论中“有限理性”的表现

选择与突变

一般而言，进化博弈模型主要是基于选择(Selection)和突变(Mutation)这两个方面而建立起来的。选择是指本期中的赢者策略(获得较高的支付)在下一时期将更为流行(由于有更多的后代、被竞争对手学习与模仿等方式而被更多的参与者采用)；突变一般很少发生，它指种群中的某些个体以随机的方式选择策略，那些获得更高支付的变异策略经过选择后将变得流行，那些获得更低支付的变异策略则自然消亡。进化博弈模型的选择形成机制通常有三种意义解释：生态学意义上的适应度(即后代数量)、个体意义上的反应变更(试验、刺激反应等)和社会意义上的策略变更(学习与模仿等)。不管是哪种情形，进化博弈的基本思想是适应性，是不断改进的，即较好的策略将变得更为流行。

进化稳定策略

进化稳定策略是由Maynard Smith (1973)在考察种群中个体的适应度由各个个体行为共同决定的环境下，个体对成功策略的选择时提出来的。进化稳定策略的基本思想是：假设在一个全部选择某一特定策略的大群体中，进入一个选择不同策略的小群体(变异或外来入侵等)，如果该突变小群体在混合群体的博弈中所得到的支付(适应度)大于原群体中个体得到的支付，则该小群体能够侵入大群体，在演化过程中该小群体将逐步壮大并可能取而代之成为大群体；反之，该小群体在演化过程中将自然消亡。如果一个群体能够消除任何小群体的入侵，那么就称该群体达到了一种进化稳定状态，此时该群体选择的策略就是进化稳定策略。

两种“有限理性”表现的区别与联系

行为金融学所表现出来的“有限理性”与进化博弈论中的“有限理性”有差别，行为金融学侧重于心理、习惯、社会风俗方面等影响人类的一些固有行为模式（这些固有模式人类往往自己不知道，比如过度反应和反应不足，情绪，性格）对自身的经济行为的影响；而进化博弈论的研究不侧重于发现这些人类的固有行为模式，虽然进化博弈论中的参与人也不知道这些固有模式，或者是无意识的，或者是在行为金融学发现人类固有行为模式的影响后，进化博弈论中很少一部分的参与者尝试着改变既有的策略，反而使自己的效用增大了，于是成为其他参与者可以模仿的对象，从而使采用不同策略的参与者的比例发生了变化。

那么，综上所述，可以得出以下结论，行为金融学研究人类静态的固有行为模式的影响，而进化博弈论研究的是这些固有模式的演化过程与结果，这种演化过程是无意识的，是“自然选择”的结果。

参考文献：

1.Slovic, Paul.，psychology Study of Human Judgment：Implications For Investment Decision Making[J]，Journal of Finance , 1972

2.Kahneman and Tversky, Prospect theory：An Analysis of Decision Under Risk[J], Econometrica, 1979

3.DeBondt, & Thaler，Does the stock market overreact?[J] ，Journal of Finance, 1985

4.Odean, Terrance ，Do investors trade too much[J], American Economic Review,1999

5.Maynard Smith, G. Price, The logic of animal conflict[J]，Nature, 1973；246： 15-18

6.赵学军，王永宏.中国股市惯性策略和反转策略的实证分析[J].经济研究，2001（6）

7.吕岚，李学.中国股市投资者的处置效应.深圳证券交易所综合研究所研究报告，2002

篇7

>> 基于进化博弈论的金融创新与金融监管动态博弈分析美国金融监管与金融创新的博弈金融监管与金融创新的博弈实证金融创新与金融监管的动态博弈分析金融监管协调机制的进化博弈研究基于进化博弈论的我国金融创新和金融监管问题研究次贷危机―金融监管与金融创新的博弈的必然结果论金融创新与金融监管金融创新与金融监管研究试论金融创新与金融监管浅析金融创新与金融监管的和谐发展金融博弈:创新与监管金融监管的思维变革与制度创新国际金融危机下的金融创新与金融监管金融创新与金融监管：互联网金融的发展思辨* 我国互联网金融环境下的金融创新与金融监管金融创新与金融监管：互联网金融的发展思辨我国金融监管的博弈分析互联网金融监管的博弈分析金融监管覆盖模式与金融创新关系研究常见问题解答当前所在位置：l.

[5]参见《中国统计年鉴2012》.

[6]参见《中国经济普查年鉴2011》.

[7]参见刘扬.美国金融监管改革对我国的启示[J].经济纵横，2011（1）.

[8]参见楼建波.从CDS看金融衍生品的异化与监管——以瑞银集团诉Paramax案为例.《China Academic Journal Electronic Publishing House 2010》.

[9]包容MBS，ABS，CDO，CDO平方等一系列金融产品.具体参见张明《透视CDO：类型、构造、评级与市场》、《国际金融研究》2008年第6期.

[10]参见何纯.进化博弈：对金融创新与金融监管关系的辩证审视.《理论探讨》总第376期第43页.

[11]参见郭敏.浅议金融创新与金融监管的博弈关系[J].《时代金融》2009（12）.

[12]参见现代博弈理论匈牙利大数学家冯·诺依曼和奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，1994年出版。指参与博弈的双方，在严格竞争下，一方的收益必然意味着另一方的损失，博弈双方的收益和损失相加总和永远为“零”，不存在合作的可能性.

[13]参见《新浪财经》http：//.cn/g/20110322/23239575768.shtml.

篇8

一、问题的提出

学校是培育人才的摇篮，班级是学校的基本构成单元。班级安全文化是指班级在教学、科研以及生活等领域所创造的理念、形象、设施与行为等的总和，班级安全文化建设是学校安全文化建设的基本立足点。学生是班级的主体，班级安全文化是全班学生共建共享的，一个班级的安全文化氛围浓厚只是一枝独秀，只有当学校所有班级的安全文化不断优化，才能有助于学校安全文化的提升，为学生的学习和生活提供安全保障。彻底否定传统博弈论赖以成立的基础即“理性人假设”的进化博弈理论从具有有限理性的“社会人”出发，分析参与人的行为从而建立起崭新的分析框架。自从1973年生态学家史密斯和普赖斯引进进化稳定策略，TaylorandJonker于1978年提出模仿者动态概念后，进化博弈论被广泛应用于各学科。经典的博弈论建立在完全理性的假设基础上，在解释现实行为方面具有明显不足。而进化博弈论用于解释群体之间的行为是如何相互影响的动态变化过程，因而适用于班级安全文化建设的解释性分析及探索性研究。

二、有限理性条件下学生之间的安全文化建设进化博弈分析

学生作为行为主体，具有有限理性，在班级安全文化建设中的策略选择也是可模仿学习的。运用进化博弈原理对具有有限理性的学生间的相互行为及班级安全文化建设进行分析，颇具理论及现实意义。

（一）基本假设

学生之间是无差异的，由学生组成的群体成员间进行了随机配对博弈，形成两人对称博弈，学生的策略选择受其他学生的策略影响，策略的调整是一个缓慢的动态调整过程。

（二）模型构建

第一，博弈参与者。根据进化博弈原理，将随机配对的两名学生分别记作“学生1”和“学生2”。在班级安全文化建设中，学生有认真参与和敷衍了事两种选择。第二，博弈方的行为策略。在班级安全文化建设中，学生采取的博弈策略有两种：一是积极主动，另一种是敷衍应付，分别记作“主动”和“敷衍”。第三，博弈得益。通过开展班级安全文化建设，假设两名学生都能够认真学习安全知识和技能，可以在很大程度上避免和防范常见校园安全事故，即使遇到安全事件也能尽其所能成功应对的概率为1，从而获得一定的效用，记作V。假设两名学生中，一名学生在班级安全文化建设中采取“主动”策略，安全素质得以提高，从而获得了安全文化建设效用，另一名学生选择“敷衍”策略。严格来讲，学校安全事故的发生具有偶然性，即两名学生在防范和应对校园安全事故时也有一定的成功概率，分别记作R和r。因此，采取“主动”策略的学生获得的效用水平为V*R，采取“敷衍”策略的学生获得的效用水平为r*V，且r≤R，0≤r≤1，0≤R≤1。假设在班级安全文化建设中，两名学生都采取“敷衍”策略，则获得的效用均为M，可正可负，在学校安全形势比较稳定的条件下，学生即使不积极主动参与班级安全文化建设，也不会有任何损失，此时M为正值。相反，校园安全事件的发生会造成一定的人身财产损失以及不良声誉，此时M为负值。

（三）随机配对的两名学生

对称博弈模型的纳什均衡求解根据划线法对博弈模型进行分析，班级安全文化建设中“主动”的学生都能获得较高的效用，即V*R≥M。根据班级安全文化建设实际，运用划线法求解得：当r≤R，V*R＞M时，“主动”是每名学生在任何情况下都不会改变的占优策略，因此（认真学习，认真学习）成为随机配对的两名学生对称博弈模型的唯一纳什均衡。当r≥R，V*R＜M，存在两个纳什均衡，即两名学生会相互影响，（认真学习，认真学习）和（敷衍学习，敷衍学习），学生以一定的概率选择参与班级安全文化建设策略，要么都“主动”，要么都“敷衍”。当r≥R，认真学习安全知识和技能，即“主动”参与班级安全文化建设的学生仍然不幸遇到安全事故，当事故具有偶然性时，“主动”参与班级安全文化建设的学生会改变策略，转为“敷衍”参与班级安全文化建设。

（四）有限理性条件下学生之间的安全文化建设进化博弈分析

当进行班级安全文化建设，对学生开展安全教育和安全管理时，假定以y（t）表示选择纯策略———“主动”参与班级安全文化建设策略的学生人数在群体中所占的比重，则选择“敷衍”策略的学生人数所占比重为1-y（t）。

三、结论及建议

通过构建学生参与班级安全文化建设的进化博弈模型并进行分析求解，得到不同条件下两种不同的进化稳定策略，从而得出学生在参与班级安全文化建设过程中，受其他同学的影响非常明显，要么都“主动”，要么都“敷衍”。安全文化建设是一种居安思危、预防为主、防患于未然的系统工程，如同温水煮蛙实验。从学生参与班级安全文化建设的演化过程看，要改变目前多数学生都存在“敷衍”的现状，应注重对学生学习安全知识和技能的引导，强化安全防范意识，提高“主动”参与班级安全文化建设的效用。采取多种形式开展班级安全文化建设，对学生开展人性化的安全管理尤其是参与式管理，例如通过应急演练、情境模拟等方式吸引学生参与，激发学生的学习力，提高学生安全素质，提升班级安全文化建设实效。

参考文献：

篇9

1、博弈理论的早期研究。一般认为，对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫（Waldegrave）在1713年提出了两人博弈的极小化极大混合策略解。古诺（Cournot）和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型，两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型，确定了在竞争之下各自的最优反映函数。这些都是关于博弈问题的早期的零星研究。

2、博弈论发展的不同阶段。一般认为博弈论萌芽于20世纪20年代初。博弈论创立的标志是冯・诺伊曼和奥・摩根斯坦（Morgenstern）在1944年的《博弈论与经济行为》这部著作，他们的贡献现在看来主要是创立了博弈论研究的基本概念、二人零和博弈的完全解决和对合作博弈的贡献。现在应用更为普遍的非合作博弈理论的创立，则是以纳什（John Nash）1950年的博士论文《非合作博弈》为标志，该文的主要贡献是提出了纳什均衡的概念。此后(20世纪70年代)，美国海萨尼（Harsanyi）和德国塞尔顿（Selten）的不完全信息博弈理论工作进一步完善了非合作博弈理论。当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时，博弈论逐渐成为经济学的基石。

1944年，冯・诺伊曼（Von Neumann）和奥・摩根斯坦（Morgenstern）合著的《博弈论与经济行为》被认为是博弈理论初步形成的标志。该书在总结以往关于博弈的研究成果的基础上，提出了博弈论的概念术语、一般框架和表述方法，提出了较系统的博弈理论。而且，在该书以前，博弈论主要是数学家们研究的课题，主要是一种数学理论而不是经济学理论。《博弈论与经济行为》极大地促进了博弈论和经济学研究的联系。从此，博弈论开始被经济学家们所接受，对博弈论的发展起了巨大的推动作用。虽然《博弈论与经济行为》的出版标志着博弈论的初步形成，但是这个时候的博弈论还是比较幼稚的，研究的范围也较小，总体影响也很小。研究的主要对象是少数类型的合作博弈和零和博弈。

20世纪的40年代末到50年代初，是博弈论的发展史上一个重要阶段。越来越多的学者进行了博弈理论的研究。1950年，纳什（John Nash）在他的博士论文《非合作博弈》中，将博弈论扩展到了非零和博弈，最终形成了非合作博弈理论的思想源泉，纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明，发展了以纳什均衡概念为核心的非合作博弈理论。纳什均衡是对古诺模型和伯特兰德模型中均衡概念的一般化，纳什均衡的概念是有关均衡概念的最基本的概念，后来的子博弈精炼纳什均衡，贝叶斯纳什均衡、精炼贝叶斯纳什均衡等概念的提出都是以纳什均衡为研究出发点的。

20世纪50年代中后期一直到70年代也是博弈论发展历史上较为重要的一个时期。“微分均衡”、“强均衡”、“重复博弈”以及在此基础上的完全信息动态博弈等概念就是在这一时期提出来的，而且在60年代初开始了博弈论在进化生物学中的应用的研究。这个时期产生的里程碑式的成果是海萨尼（Harsanyi）关于不完全信息博弈理论，他在1967-1968年的三篇关于不完全信息博弈理论的论文中，提出了关于不完全信息静态博弈的“贝叶斯纳什均衡”的概念，此外还在1973年提出了关于“混合策略”的不完全信息解释，以及关于不完全信息动态博弈的严格“纳什均衡”概念。同时这个时期也是进化博弈论发展的重要阶段，提出了“进化稳定策略”等概念。当然，这个时期产生的博弈论成果还有很多，博弈论更多地应用到经济学理论的研究当中，为80-90年代博弈论的成熟以及经济学理论的博弈论革命起了很大的推动作用。

20世纪80-90年代到现在是博弈论走向成熟的时期，期间产生了大量的研究成果和文献,表明博弈论已经作为一种一般的分析方法逐渐走进了政治学、军事学、生物学、统计学等多门学科中。尤其是在经济学中，博弈论占据了核心地位。这个时期，是对非合作博弈理论的进一步深化，产生了博弈论基础上的经济学分支，如信息经济学，以及一些关于特殊问题的理论，如拍卖理论、激励理论。早在1983年，因一般均衡理论而得到诺贝尔经济学奖的德布鲁(J・Debreu)表明，如果没有博弈论中纳什均衡的重要概念，也就没有他对一般均衡的存在性的证明。到了90年代，克莱普斯(D・Kreps)、克鲁格曼(P・Krugman)和格罗斯曼(S・Grossman)都是因为在博弈论上的贡献而获得了美国的克拉克奖(Clark Prize)，这是美国对40岁以下经济学家的最高奖。之后，博弈论两度夺得诺贝尔经济学奖，1994年颁给纳什(Nash)、海萨尼(John Harsanyi)和塞尔顿(Reinhard Selten)三位博弈论专家；2005年颁给罗伯特・奥曼(Robert J・Aumann)和托马斯・谢林(Thomas C・Schelling )。

二、博弈的类型及其均衡概念

博弈理论有合作博弈和非合作博弈之分。合作博弈强调团体理性，强调效率、公平和公正，非合作博弈更强调个体理性、个体的最优决策。按照参与人行动的先后顺序，博弈可以分为静态博弈和动态博弈。完全信息博弈是指每个参与者对所有其他参与者的特征、策略空间和支付函数有准确的知识；否则，就是不完全信息博弈。下图是基于上述分类方法的博弈类型以及各自的均衡概念。

三、博弈论的研究趋势及未来

篇10

一、进化博弈理论介绍

进化博弈论是以有限理性的博弈方作为博弈分析的基础，研究的是博弈群体成员的策略调整过程、趋势和稳定性。其中，最重要的概念是“进化稳定策略（Evolutionary stable strategy――ESS）”和“复制动态方程”。

1.进化稳定策略（ESS）的数学描述

进化稳定策略ESS是这样的一种策略，如果群体中所有成员都采用这种策略，而这种策略的好处为其它策略所不及，那么在自然的影响下，将没有突变策略能侵犯这个群体。梅纳德・斯密斯（Maynard Smith）在1982年给出了2×2博弈的ESS数学描述(见文献[5])。

设某一种群中的某一个体，从其策略空间s中选用一种策略s1，当它的对手采用另外一种策略s2，它的收益为E(s1,s2)。称策略s1是一个ESS，

假如对所有的可选策略s2，满足以下两个条件之一：

(1)E(s1,s1)>E(s2,s1),即s1一定是一个关于它自己的最好策略。

(2)E(s1,s1)=E(s2,s1)，且E(s1,s2)>E(s2,s2)，即若s2是关于s1的一个等价可选策略，且s1是关于s2的一个最好策略，则s1一定是一个比s2关于它自己的最好策略。

若一个进化博弈存在ESS，则称该博弈存在进化稳定策略。

2.进化博弈复制动态方程

“复制动态方程”是描述某一个特定策略在一个种群中被采纳的比例的动态微分方程。由进化原理可知，一种策略的收益比种群的平均收益高时，那么这种策略就会在种群中被模仿、学习和发展，即适者生存体现在这种策略的变化率。

可以用以下微分方程来表示:。其中，xk 表示种群中采用策略k的比例，u(k,s)表示采用策略k的期望收益， u(s,s)表示种群的平均期望收益；k表示不同的策略。

二、商业银行与企业的博弈分析

为了方便起见，我们将所有的商业银行简称为银行，将借款的国有企业、非国有企业、居民和个体工商户统称为企业。银行与企业间的博弈，实际上是银行信贷经理（假定完全代表银行）与企业经理（假定完全代表企业）之间的博弈。下面的讨论中银行信贷经理是符合“经济人”假设的、有趋利避害倾向的人；银行信贷经理和企业都开始寻租。

1.商业银行与国有企业的寻租行为的博弈分析

(1)基本假设：假设银行贷出款项为L，进行贷中检查则会对银行信贷经理造成BL的声誉损失，如果不进行检查当贷款成为不良贷款，则会对其造成βL的损失（其中β为不进行检查，贷款成为不良贷款的概率）；如果银行信贷经理检查出贷款企业有骗贷行为则会得到αSL（α为比例，SL为检查出企业有逃债行为时对企业的罚款）的奖励；如果企业经理逃债被发现后对其造成的损失为NL；如果企业经理逃债，则企业经理向银行信贷经理做公关活动费用RL（由企业承担），银行信贷经理接受就不再检查这笔贷款，不接受就会检查这笔贷款，如果银行信贷经理接受，企业经理会因为与银行关系改善而获益TL万元（纯粹个人获益）其中L,S,B,N,R,T均大于零，则我们可以得到收益矩阵如表1所示。

由于本博弈是一个非对称博弈。现在存在两个不同的博弈群体，一个是在博弈方1位置的银行信贷经理群体，一个是在博弈方2位置的国有企业经理群体，每次博弈实际上都是前一个群体中的一个成员与后一个群体的一个成员进行的。因此现在我们的分析框架是，反复在两个群体中各随机抽取一个成员配对进行上述博弈，博弈方的学习和策略模仿局限在他们各自所在的群体内部，策略调整的机制仍然是与两人对称博弈中相似的复制动态。

我们首先来看特殊情形，当α=β＝0，即对银行信贷经理没有奖惩措施时，此时上面的博弈存在Nash均衡（不检查，逃债）。也就是说此时银行信贷经理存在检查惰性。很明显，在这一博弈中，受损失的是商业银行，L万元的贷款分文不能回收；受益的则是银行信贷经理、国有企业经理和国有企业。即使银行是国有商业银行，这一过程也会造成社会福利的净损失，因为银行损失L万元，其中银行信贷经理会分得RL万元、国企经理也会分得一部分，还有一部分在这一寻租、受租的过程中挥霍掉了，国有企业只分到L-RL-X万元，其中X部分便是福利净损失。因此，这种情况必须要避免，在下面的讨论中我们假设αSL-RL-BL＞RL-βL,在此假设下，银行信贷经理的检查惰性问题可以避免了。

在一般情形下，假设在博弈方1位置的银行信贷经理群体中采用检查策略的人数比例是x，那么采用不检查策略的比例为1-x；国有企业经理群体中采用逃债策略的比例为y，那么采用不逃债策略的比例就为1-y。这样，银行信贷经理群体中采用检查、不检查策略的期望收益和群体平均收益分别为：

此时的复制动态方程为：

国有企业经理群体中采用逃债、不逃债策略的期望收益和群体平均收益分别为：

此时的复制动态方程为：

(2)讨论。先讨论在博弈方1位置的银行信贷经理群体的复制动态方程。根据该动态方程和进化稳定策略的性质可知:当这意味着所有x轴水平都是稳定状态，当则分别是两个稳定状态，其中当即此时检查为上策；当时，即此时不检查为上策。

再讨论在博弈方2位置的国有企业经理群体的复制动态方程。根据该动态方程和进化稳定策略的性质可知:当这意味着所有y轴水平都是稳定状态，当则分别是两个稳定状态，其中当即此时逃债为上策；当>0是ESS,即此时不逃债为上策。

2.商业银行与非国有企业的寻租行为的博弈分析

(1)基本假设。由于私营企业经理往往是企业的所有人，所以与上面的情形有很大差别。当企业有逃债动机时，向银行信贷经理提供租金，如果银行信贷经理不接受而进行检查，则银行信贷经理会损失RL的租金和BL声誉损失，同时会获得奖金αSL万元，私营企业经理则会被处以SL万元的罚款和承担ML万元的声誉损失；如果银行信贷经理接受贿赂而选择不检查，则银行信贷经理的收益RL万元，但会被罚款βL万元，而私营企业经理的收益L万元的贷款和因与银行关系改善而获得的TL万元收益。当私营企业经理没有逃债的动机时，若银行信贷经理检查，则银行信贷经理损失BL万元的声誉损失，企业没有损失；若银行信贷经理不检查，则银行信贷经理不会损失或收益什么，而企业则损失L万元的贷款（机会成本）。则可以得到收益矩阵如表2所示。

假设条件同上面的一样，我们可以得到当α=β＝0，即对银行信贷经理没有奖惩措施时，此时上面的博弈存在Nash均衡（不检查，逃债）。也就是说此时银行信贷经理存在检查惰性。因此在下面的讨论中我们假设αSL-RL-BL＞RL-βL,在此假设下，银行信贷经理的检查惰性问题可以避免了。

设银行信贷经理群体中采用检查策略的人数比例是x，那么采用不检查策略的比例为1-x；非国有企业经理群体中采用逃债策略的人数比例为y，那么采用不逃债的比例就为1-y。这样，银行信贷经理群体中采用的检查、不检查策略的期望收益和群体平均收益分别为：

此时的复制动态方程为：

非国有企业经理群体中采用的逃债、不逃债策略的期望收益和群体平均收益分别为：

此时的复制动态方程为：

(2)讨论。先讨论在博弈方1位置的银行信贷经理群体的复制动态方程。根据该动态方程和进化稳定策略的性质可知：当这意味着所有x轴水平都是稳定状态，当则和1分别是两个稳定状态，其中当即此时检查为上策；当即此时不检查为上策。

再讨论在博弈方2位置的非国有企业经理群体的复制动态方程。根据该动态方程和进化稳定策略的性质可知:当这意味着所有y轴水平都是稳定状态，当则分别是两个稳定状态，其中当x＜1是ESS,即此时逃债为上策；当,,即此时不逃债为上策。

三、分析与建议

1.分析

(1)当企业的逃债比例大于某一数值（这一数值和对银行信贷经理检查的奖惩力度负相关，与检查时对银行信贷经理的负效用正相关）时，银行信贷经理的检查的概率会慢慢增大到1，也就是说如果加大对银行信贷经理对检查的奖惩力度，那么检查的力度会加大，同时如果减少检查对银行信贷经理带来的负效用同样会加大检查的力度；反之，当逃债的比例越低于这一数值时，银行信贷经理的检查概率会慢慢减少到0。

(2)当银行信贷经理的检查比例大于某一数值（其大小与国有企业经理从与银行关系改善中的获利率成正相关，与国有企业经理的声誉损失率成负相关）时，国有企业的逃债概率会慢慢减少到0；反之，当检查的比例越小于这一数值时，国有企业的逃债的概率会慢慢增大到1。

(3)当加大对非国有企业的罚款率、声誉损失率以及降低非国有企业经理从与银行关系改善中的获利率可以有效的降低非国有企业的逃债的概率。

2.建议

(1)在银行内部制定更明确的权力制度和激励约束制度，改变现在人人负责而又人人不负责的现状。

(2)加大银行内部的监督机制，形成交叉的监督机制，能够互相牵制、互相监督，任何人的权限不能没有限制。

(3)在社会上建立完善的信用体系，加大对无信用企业的声誉损失和加大对无信用企业的惩罚力度。

(4)建立完善的法律制定，减少企业通过与银行关系的改善而得到的获利。

参考文献：

[1]杨筱燕:金融寻租行为透视[J].煤炭经济研究，2001年第11期

[2]徐艳何泽荣:国有商业银行经营中的机会主义行为[J].财经科学，2005年第5期

[3]董玉飞杨成良:我国信贷市场寻租活动探究[J].商业时代，2003年第17期

篇11

二、相关概念阐述

（一）影子银行

影子银行一词来源于美国次贷危机爆发后，首次被Paul Mcculleys提出的。后来FBS（2011）正式指出，影子银行是传统银行体系之外所涉及信用融资活动的机构。这成为了国内外学者接受度最大的界定。

我国对影子银行的界定一直与体制外金融、民间金融、民营金融、地下金融等概念混用的现象。但是大家对影子银行的基本认知都包括未受国家法律规范，游离于监管当局监管之外等等。有的学者还指出，除了金融机构外，还应包含金融创新产品、服务以及产品和服务适用的金融市场。不过由于本文讨论的是两个主体间的合作关系，故而本文所指的影子银行即是游离于传统银行管理体系之外的非银行金融机构。

（二）有限理性

由于现实生活中许多现象无法用传统金融学来解释，故而后起之秀――行为金融学因合理解释了这些金融现象被广大学者所接受，行为金融学与传统金融理论最大的不同之处就在于，行为金融学认为是投资者不是完全理性人，而是有限理性人。他们总是会受到心理、环境、他人的影响而作出决定。投资行为不全是根据利益最大化原则，还包括安全最大化等等。

（三）进化博弈模型

进化博弈论博弈是一个动态的博弈过程，是有限理性博弈双方群体在一定的前提下对当前局面进行选择，在一个群体中得益较差的博弈方迟早会发现这种差异，并开始学习模仿得益较高的博弈方，后经过自我体验以及学习其他人的选择，而不断改变自己的策略。最终市场会根据“优胜劣汰”的自然规律，形成一个稳定的策略。这种类似于生物进化论的动态博弈方式被称为进化博弈论。最终形成的策略成为进化稳定策略（ESS）。

本文基于进化博弈论的研究方法，对传统银行和影子银行二者的合作进行预测，并判断何时能够达到二者自然选择“合作”策略。基于进化博弈论的基本理论，我们假设传统银行和影子银行都是有限的理性人，对两个博弈方不再细分其内部的个体，并且假设传统银行与影子银行的最大的区分是是否受监管当局监管。

三、影子银行和传统银行合作问题的进化博弈分析

我们粗略地假定我国金融市场中有传统银行机构和影子银行两类机构，而双方面临的选择只有“合作”和“不合作”两种策略，自我的选择和其他群体的选择都将影响自身与他人的收益。他们都将依据这种相对收益率不断地调整自己的策略。两个群体不断地博弈交流，最终通过“物竞天择、适者生存”的进化法则自发进化到具有稳定性的均衡状态――进化稳定策略（ESS）。

1.博弈双方的得益

我们先假设传统银行和影子银行在非合作状态下的收益分别为Rc和RY。我们假设，当二者采取合作时，由于渠道拓宽，客户量增大以及销售效率提升，双方的收益将会增加πc和πY，此时双方存在一个合作的成本分别Cc和CY，且我们假定πc大于Cc，πY大于CY。根据上述假设，可以得到如表1所示的矩阵图。我们发现，如果传统银行与影子银行都是理性“经济人”时，表1的结果必然存在一个纯战略的纳什均衡（合作、合作）；但是如果我们把前提假设放宽至“有限理性”，我们发展最后的进化稳定策略并非都是（合作，合作）

2.传统银行和影子银行的期望得益及其动态微分方程

假定当t时，x是传统银行群体中选择合作策略的银行占传统银行的且X∈（0，1），则选择不合作策略银行比例为1-x；同理，在影子银行群体中，y是选择合作策略的银行占影子银行的比例，且Y∈（0，1），则选择不合作策略的银行比例为1-y。

在传统银行群体中采取“合作”和“不合作”策略两类博弈方的期望得益分别为μCHZ和μCNH，群体平均期望得益为μC：

3、基于传统银行群体和影子银行复制动态微分方程的分析

从（7）式可知，传统银行群体中选择“合作”策略博弈方的比例x的变化率与该类型博弈方的超额期望得益呈正相关关系，也与该类型博弈方的比例x呈正相关。

当y=时，，传统银行中选择 “合作 ”策略的银行的比例的变化率为0，即采取“合作”策略的博弈方比例不会发生变化，此时传统银行群体处于稳定状态。当，即采取“合作”策略的银行获得超额收益，那么，选择“不合作”策略的银行将逐渐发现并调整策略的策，选择“合作”策略，选择“合作”的比例x会向趋近1，此时是该群体复制动态下的一个ESS。当，即采取“合作”策略的博弈方的期望得益小于群体平均得益。那么，选择“合作”策略的银行也会逐渐选择“不合作”策略，采取“合作”策略的博弈方数量会逐渐减少，直到X=0 ，此时是该群体复制动态下的另一个ESS。下图1给出了上述三种情况的动态变化的相位图和稳定状态。

同理可知影子银行群里的情况。当，在影子银行里选择“合作”策略银行比例y的变化率为0 ，即y不会发生变化，此时影子银行群体处于稳定状态。当0，即选择“合作”的影子能够获得超额收益，此时采取“不合作”策略的银行将会调整策略，最终选择“合作”，之后y会向趋近1，当y=1时，该群体处于进化稳定策略。当，表示，选择“合作”的影子银行不能获得超额收益，甚至所获得的收益低于平均收益，故而采取“合作”策略的银行数量会调整策略，y会向趋近0，此时是该群体复制动态下的另一个进化稳定策略。下图2给出了上述三种情况的动态变化的相位图和稳定状态。

4. 传统银行与影子银行合作的进化博弈系统复制动态分析将传统银行和影子银行两个特殊群体类型的比例变化复制动态的关系用一个坐标平面图表示，可得到下图3：

免责声明：以上文章内容均来源于本站老师原创或网友上传，不代表本站观点，与本站立场无关，仅供学习和参考。本站不是任何杂志的官方网站，直投稿件和出版请联系出版社。

进化博弈理论样例十一篇

篇1

篇2

篇3

篇4

篇5

篇6

篇7

篇8

篇9

篇10

篇11

进化博弈理论

生物进化

昆虫分类学报

文秘服务

杂志订阅