admin 管理员组文章数量: 1086019
2024年4月15日发(作者:源代码 在线)
第23卷第6期
20O8年l2月
成都信息工程学院学报
VoI.23 No.6
Dee.20o8
JOURNAL OF CHENGDU UNIVERSITY OF INFORMATION TECHNO1X)GY
文章编号:1671 1742(2008)06—0698—06
非对称博弈的一种一般描述及其ESS
张春华, 丁占文
(江苏大学理学院,江苏镇江212013)
摘要:考虑到博弈进化过程中群体状态的改变会影响参与人的收益支付,给出非对称博弈的一种一般描述,在
相应的描述下定义非对称博弈的ESS。相关结果表明,所定义的非对称博弈的ESS具有和对称博弈ESS的一些相
似性质,并且在支付线性的条件下,还具有和对称博弈ESS相似的一阶和二阶最优反应条件。最后研究了支付线
性的刻画方式,给出了具有这种描述特征的一个矩阵博弈实例。
关键词:非对称博弈;ESS;线性支付映射;矩阵博弈
文献标识码:A 中图分类号:0225
1 引言
进化博弈理论最重要的基本概念是进化稳定策略ESS。Maynard Smith和Price针对单个无限种群的对称
博弈提出了最原始的ESS的概念_l J。该概念提出以后,为了使其与现实更加接近,许多学者就种群内个体数量
规模有限情形(有限种群)及多种群非对称博弈情形下的ESS概念进行了拓展和研究。Vickery证明如果ESS的
定义放在有限种群下考虑,该种群就可能被突变者入侵,同时得到有限群体的ESS并不是纳什均衡的结论[2I。
Schaffer放开种群规模无限大的假定,考察了有限种群的进化稳定性并提出了有限规模种群ESS的概念[3。3]
Daniel B.Neill在分析Schaffer有限规模群体模型的基础上定义了大种群的ESS[ ,证明该种群不会被突变者入
侵(如果假设群体规模足够大,但不是无穷大)。这些研究是单种群对称博弈在种群规模不是无穷大情形下关于
ESS概念的拓展。现实中许多博弈可能发生在两类或者多类群体的个体之间,他们进行的是非对称博弈,Tay—
lor,Swinkels,Cressman和Hofbauer等给出了非对称博弈的一种ESS的概念,但最后都等价于严格纳什均衡。
Garay和Varga对多种群非对称博弈定义了严格N种群ESS的概念l5 J。Cressman、Garay和Hofbauer认为
Garay和Varga定义的ESS条件要求太严格,最终状态可能不会实现。于是他们研究了N类频率依赖的种群进
化稳定策略,并提出了此博弈下ESS充要条件,然后分别从单态和多态两方面对ESS进行了研究l6]。这些研究
工作是ESS概念在非对称多种群博弈下的一些推广,但这些工作中关于个体收益及种群平均收益都能够由各种
群的策略组合确定,而且可以由支付矩阵刻画。试图给出非对称博弈的较为一般的描述,并在此描述下定义相应
的ESS。
对称博弈考虑仅有一种类型的博弈群体,每个参与人都有 种纯策略e ,e ,…, ,策略空间为Sf={( 1,
l
2,…,z ):∑ =1},博弈的收益是对称的,使用策略z的参与人与策略Y的参与人博弈时,其收益支付为U
(z,Y)。对称博弈就描述为G={S,;“(.37, )}。Maynard Smith定义,策略 称为博弈的一个ESS,如果它满足
以下一阶和二阶最优反应条件:
“(y-, ) “(Y,2),Vy6Sl
U(Y, )2“( , ) “( ,Y)>“(Y,Y),Y ≠
(1)
(2)
非对称博弈则考虑参与人有多种类型,例如两种类型从而有两个群体:群体1和群体2。类型1有 个纯策
略 , ,…, ,类型2有77"/个纯策略 , ,…, 。类型1和类型2的策略空间分别为S ={( l' 2,…,
” il,l
z ). =1}及s ={(Yl,Y2,…,Y ). =1}。博弈在类型1和类型2的参与人之间进行,类型1的策略
与类型2的策略Y构成的策略组合(z, )完全确定了两种类型参与人各自的支付:类型1的支付a( ,Y)及类
型2的支付b( ,Y),此时两种类型的非对称博弈就描述为G={S S ;a(.Tg,Y),b(.27,Y)}。这是博弈只在不
收稿日期:2008.04—22
基金项目:国家自然科学基金资助项目(90610031)
第6期 张春华等:非对称博弈的一种一般描述及其ESS 699
同类型之间进行时人们通常使用的非对称博弈的一种描述方式。
虽然只研究不同类型之间的博弈,博弈只在不同类型之间进行,但参与人的收益是否完全取决于自己和其他
群体的策略选择呢?以生态进化为例,不同类型的种群相互博弈而演化。种群演化的收益是适应度,可以认为,
每个个体其策略选择的适应度除了与自己和其他群体的策略选择有关外,还应该与其所在群体目前的进化状态
有关,个体适应度与其所在群体休戚相关。博弈进化过程中,从一般意义讲,群体状态的演化和改变同时改变了
参与人个体的博弈环境,从而影响收益支付。所以非对称博弈的描述可以更具一般性,把参与人的收益还与自己
所在群体的状态有关这一因素纳入到模型中去。对非对称博弈进行这种更具一般性的描述,并在此描述下定义
博弈的ESS。
2非对称博弈的一种一般表示
博弈不对称时,存在多种类型的参与人,博弈只在不同类型之间进行。为了叙述方便,后面以两种类型为例
一
(文中的分析方法对多种类型同样适用)。设两种类型都只有有限个纯策略,但参与博弈的参与人数量很大。第
种类型的纯策略设为 , ,…, ,第二种类型的纯策略用 , ,…, 表示。类型l的策略空间S =
{( 1,z2,…, ). =1},类型2的策略空间S ={(Yl,Y2,…, ).
J一■
=1}。类型1的混合策略z∈S 可
以表示为.27: z ,类型2的混合策略 ∈S 可以表示为Y= 。设群体l使用纯策略 的参与人比例为
z ,则 =( 。,z2,…,z )表示其状态向量,作为策略组合它也可以解释为在此状态下群体中每个参与人都在使
用的同一个混合策略。群体2的状态向量记为Y:(Yl,Y2,…,Y )。(z, )称为两个群体的联合状态,或称为博
弈的状态。
类型l的参与人使用策略与群体2进行博弈时,他的支付取决于3个方面:(1)类型1的状态z;(2)类型2
的状态Y;(3)自己使用的策略P。故其期望支付可以表示为
U=“( ,Y)(P) (3)
其中,“(.27, )是S 上的实值函数,是类型1的参与人个体策略P的函数。在博弈状态(z, )下,参与人选择策
略P后,其支付收益就由函数“(z, )确定。或者说,存在S ×S 到定义于S 上的函数空间F(S )的映射U:
S ×S 一F(S ),使得在任意博弈状态(z, )下,确定了类型1的参与人的支付函数U(z,Y):当他使用策略P
参与博弈时,他的收益是U(z,Y)(P)。
同样,博弈状态( , )下,类型2的参与人使用策略q的(期望)支付可以表示为
=
( ,Y)(q) (4)
( , )是由状态(.27, )决定的类型2的参与人的支付函数。
定义1(支付映射) 映射U:S ×S 一F(s ),7,3:S ×S 一F(S ),分别称类型1和类型2的支付函数映
射,简称支付映射。
于是两种类型的非对称博弈其一般描述可以表示为G={S ,S ;“, },其中“, 分别是该类型1和类型2
的支付映射。
3非对称博弈的ESS
3.1非对称博弈ESS的定义
现在考虑两种类型的非对称博弈G={S ,S ,;U, }。假设博弈位于状态(土,夕),即群体1和群体2使用各
自纯策略人数的比例向量分别为 和9,或者群体1的参与人都在使用混合策略 ,群体2的参与人都在使用混
合策略 。
若群体l中有策略P入侵,入侵比例为e(群体中比例为£的参与人使用策略P),则入侵后群体1的状态为
e +(1一e) 。 能成为类型1的进化稳定策略,是指量能抵抗变异策略P的人侵。
定义2称为类型1关于类型2的状态. 的进化稳定策略(ESS),如果对任意的策略P∈S (pva ),存在
700 成都信息 工程学 院 学报 第23卷
(P)>0,使得当0<£< (P)时,成立不等式
“(£ +(1一e) , )( )>“(£ +(1一£) , )(P) (5)
不等式(5)的含义是,在变异策略入侵后的状态下,在位策略 比变异策略P获得更高的收益。从进化选择
的观点看,变异策略P最终会被淘汰。
定义3(ESS)博弈状态(y-, )称为博弈的一个进化稳定策略(ESS),如果萱是类型1关于9的ESS,并且
也是类型2关于 的ESS。也就是说,对任意的(P,q)∈S ×S (户≠ ,q≠ ),存在 (P)>0,否(q)>0,使得
当0<£<;(P),0< < (q)时,下面两个不等式都成立
“(£ +(1一£)皇, )(5c)>“(ep+(1一£) , )(P) (6)
( ,曲+(1一 )夕)夕)> (y-,曲+(1一 ) )(q) (7)
下面去推导,当类型1与类型2的支付映射“(z, ), (z, )都是线性映射时,这样定义的ESS具有和对称
博弈相似的一阶和二阶最优反应条件刻画方式。
3.2线性支付映射下的ESS的等价形式
当“, 是线性映射时,(6)、(7)式可化为
£[“(P, )( )一“(P, )(P)]+(1一e)[“(士, )( )一“( , )(P)]>0 (8)
艿[ (卫,q)( )一 ( ,q)(q)]+(1一 )[ ( , )(夕)一 ( ,夕)(q)]>0
由于£可以充分小,(6)式等价于以下两个条件:
“( , )( ) “(堂,夕)( ),V P∈S
(9)
(10)
“( ,夕)( )=“( , )(P)= (P,夕)(2)>“(P, )(P),VP≠2 (11)
(12)
(13)
同样(7)式等价于以下两个条件
(2,夕)(夕) (土, )(q),V q∈S
( , )(夕)= (卫, )(q)= ̄vCt,q)( )> (2,q)(口),V qC:p
(8)一(9)式以及(10)一(11)式就是类似于对称博弈中ESS所满足的一阶和二阶最优反应条件(1)一(2)。
当然,这样的结果是由“, ,线性条件保证的。后面第4部分研究在非对称博弈中,线性支付映射U, ,的
刻画方式。
3.3 ESS与纳什均衡
对于上述非对称博弈G={S ,S ;“( , ), (z,.y),(z,_),)∈S ×S },容易定义它的纳什均衡。
定义4(纳什均衡)策略组合(士,夕)称为博弈的一个纳什均衡,如果它满足下面两个不等式:
“( , )( )三三三“( ,夕)(P),VP∈S (14)
(土, )(夕) (童, )(q),V q∈S (15)
如果户≠ ,q≠夕时(14)和(15)严格不等式成立,则称(2,夕)为博弈的严格纳什均衡。
性质1如果类型1与类型2的支付映射“( , ), ( , )都是连续的,则博弈的任何ESS都是纳什均衡。
证明在(6)、(7)式中分别令e一0, 一0,即得(14)、(15)式。证毕。
用△ ,z ̄Ess分别表示博弈的纳什均衡集合与ESS集合。性质1指出,△£SS △ 。这一结果与对称博弈完
全一致。
性质2如果支付映射“( , )与z无关, ( ,_y)与 无关,则博弈的ESS等价于严格纳什均衡。
证明 当“( , )与z无关, ( ,.y)与 无关时,“( ,y)--“(.y), (z,.y)三 (z),则不等式(6)、(7)式等
价于
“( )(2)>“( )(P)VP∈S ,户≠
( )( )> ( )(q)V q∈S, ,q≠
显然,(16)和(17)就是此时严格纳什均衡的定义。证毕。
(16)
(17)
引言中已经指出,Taylor,Swinkels,Cressman和Hofbauer等给出的非对称博弈ESS概念,最后都等价于严格
纳什均衡。在那些模型中他们使用的都是非对称博弈的描述:一个类型的支付只取决于其他类型的状态和自己
的策略选择,而与所在类型的状态无关。在这里,条件“( , )与 无关、 ( , )与 无关正好对应那样的情
第6期 张春华等:非对称博弈的一种一般描述及其ESs 70l
形。性质2表明,在这种特殊情形下ESS概念与Hofbauer等正好是一致的。
4线性支付映射
4.1纯支付函数矩阵
已经知道,ESS的一阶和二阶最优反应条件是由支付函数的线性保证的。对称博弈其支付的线性由支付矩
阵决定,下面讨论非对称博弈其支付映射线性的刻画方式。
对任意的( , )∈S, ×S ( , )=(墨 ,. )。注意到∑z =1,∑∞=1,有
(X,Y):z1( ,Eyj ̄j)+ 2( ,∑ , )+…+z ( ,∑ )
=Xl Eyj( , )+x2∑ ( , )+…+ Eyj( , )
=
∑∑z ,( , ) . (18)
记“ “( , ),它是博弈状态( , )下确定的类型1的支付函数,称为类型1关于纯策略状态( , )的
支付函数。注意,“f 是定义在-s 上的函数,“ F(S ),类型1的参与人使用策略P参与博弈,其(期望)支付是
uij( )。
如果U是线性映射,由(18)式得到
“( ,Y)=∑Y]xiyju( , ):∑Exiy ̄u = ・uy (19)
其中U=(“ ) ,“ “( , )是定义在在s 上的函数。
反之,对任意的“f ∈F(s ),S 上的函数矩阵【,按照(19)式可以确定(类型1)的支付映射U。
定义5(纯支付函数矩阵) U=(U 称为支付映射U确定的(类型1的)纯策略状态支付函数矩阵,
简称为映射“的纯支付函数矩阵。
根据上面的讨论,有
性质3(类型1的)线性支付映射“由其纯支付函数矩阵U:(“ ) 唯一确定,(类型2的)线性支付
映射 由其纯支付函数矩阵 :( ) 唯一确定。
已知u和V后,根据(19)式,状态(z, )下类型1的策略P和类型2的策略q各自的支付分别由以下(20)
式和(21)式确定:
“( ,Y)(P)=z・U(p)y (20)
( ,Y)(q)=z・V(q)Y (21)
其中u(p)、V(g)分别是纯支付函数矩阵己,和V确定的策略P和q的支付矩阵。
4.2特殊情形
如果类型1的纯支付函数矩阵U=(“ ) 各行是同一个函数向量U=(“l, 2,…,U ),注意到∑ f=1,
则类型1策略P的支付为
U( ,Y)(P)= ・U(P) =“(P)・y (22)
如果每个 (P)也是P的线性函数,则存在 维向量A 使得,U (P)=P・A ,于是类型1策略P的支付又
可以化为
U( ,j,)(P)=户・ (23)
其中A是以A ( 1,2,…, )为列向量的矩阵。(23)式就是非对称博弈人们常用的关于支付的矩阵表示,A
就是通常的支付矩阵。
5一个实例・I矩阵博弈
最后,给出具有文中描述特征的非对称博弈的一个示例——可有支付矩阵刻画的矩阵博弈。
考虑两个群体,每个群体内部进行对称博弈的同时还进行两个群体之间的非对称博弈,这些博弈都使用矩阵
成都信息工程学 院学报 第23卷
描述。用S 、S 分别表示群体l和群体2的策略空间。群体ll中进行对称博弈Gl={S ;A},群体2中进行对
称博弈G2={S ;B},其中A、B分别是G1和G2的支付矩阵。两个群体之间进行非对称博弈G12:{s ,S ;
Cl,C2},其中Cl为类型1的支付矩阵,C2为类型2的支付矩阵。博弈G要求每个参与人的策略选择同时参与
两个子博弈,即与所在群体进行的内部对称博弈及与另一群体的外部非对称博弈。参与人的支付为内外两个子
博弈的支付之和。若群体l的状态为z,群体2的状态为Y,则类型1的参与人策略P的期望支付为
“=P‘ +P’Cry (24)
类型2的参与人策略q的期望支付为
=q。C2x+q。By (25)
(26)
对任意(z,Y)∈Sl×S2,(24)式定义了Sl上的函数“( ,Y):
U( ,Y)( )=P・Ar+P‘C1Y,V P∈S1
对任意( ,Y)∈Sl×S2,(25)式定义了S2上的函数 (z,Y):
(z, )(q)=q・C2x+q・B ,V q∈S2 (27)
于是,博弈G:{S ,S ;“, },U、 由(26)式和(27)式定义,表示类型1和类型2的支付映射。显然映射
(z, )一“( ,j,)及( , )一 (z, )都是线性的。
下面两个命题给出子博弈Gl、G2、G12和博弈G之间纳什均衡和ESS的关系。命题l的结论很明显,证明
从略。
命题1如果dr是Gl的对称纳什均衡, 是G2的对称纳什均衡,并N_(dr,夕)是Gl2的纳什均衡,则( ,夕)是
博弈G的纳什均衡。
命题2如果 是对称博弈Gl的ESS,夕是对称博弈G2的ESS,并且(卫,夕)是Gl2的纳什均衡,则( , )是
博弈G的EsS。
一
证:由于G中支付映射是线性的,只需验证策略组合(dr,夕)满足一阶和二阶最优反应条件(1O)一(13)式。
阶最优反应条件(10)式及(12)式就是纳什均衡条件,由命题1可以推出。下面验证二阶最优反应条件。
设U(土,夕)( )=“( ,夕)(P),由(26)得 ・A + ・C1 :P・Ayc+P・C1 ,或者
P。A 一2。 : ‘C1.9一P。C1.9 (28)
因为(2, )是Gl2的纳什均衡,(28)式的右端非负。又因为Gl的ESS也是Gl的纳什均衡,又得到(28)式的左
端非正。所以(28)式的两端为零。从而 ,
P・A卫= ・A (29)
根据对称博弈的二阶最优反应条件,(29)式意味着P・Ap<dr・Ap。又因为( , )是G12的纳什均衡,P・
C19. ・C19。所以有P・Ap+P・Cl.夕< ・Ap+ ・C1 ,由(26)式得M(P,夕)( )<“(P, )(士)。于是证得二
。
“( , )(dr)=“( ,夕)(P)=>“(P, )(P)<“(P,夕)(dr)
阶最优反件(11):
同样可证二阶最优反件(13)。证毕。
参考文献:
[1]Maynard Smith,J.,G.R.Price.The logic of anima1 conflict[J].Nature,1973,246:15—18.
[2]Vickery,W.L.Reply to Maynard Smith[J].Theor.Biol,1988,132:375—378.
[3]Schaffer,M.E.Evolutionary Stable Strategies for a finite population and variable conest size[J].Theor.Bid,
1988,132:469—478.
[4]Daniel B.Neil1.Evolutionary stability for large populations[J].Theor.Biol,2004,227:397—401.
[5]Jozsef Garay,Zoltan Varga.Strict ESS for n-species systems[J].Biosystem,2000,56:131—137.
[6] CRESSMAN,GARAY,H0FBAUER.Evolutionary stability concepts for N—species Frequency-dependent inter.
actions[J J.Theor.Bio,2001,21l:1一l0.
[7]Cressman,R.The Stability Concept Of Evolutionary Game Theory[M].Berlin:Springer Verlag,1992.
[8]Cressman,R.,Gaunersdorfer,A.Evolutionay rand Dynamic Stability in Symmetric Games[J].International
第6期 张春华等:非对称博弈的一种一般描述及其ESS 703
Game Theory Review,2000,2(1):67—81.
[9]Hofbauer,J.,Sigrnund,K.Evolutionary(}ames and Population Dynamics[M].Cambridge:Cambridge Univer_
sity Press,1998.
[10]
Maynard Smith,J.The Theory of Games and the Evolution of Animal Conflicts[J].Journal of Theoretical Bi—
ology,1974.47:209—221.
[11]
Samuelson,L.Evolutionary Games and Equilibrium Selection[M].Cambridge,Massachusetts:MIT PreSS.
1997.
[12]
Swinkels,J.Evolutionary Stability with Equilibrium Entrants[J].Journal of Economic Theory,1992,57:306
—
332.
[13]
Taylor,P.Evolutonary Stable Strategies with Two Types of Player[J].Joumal of applied Probability,1979,
16:76—83.
[14]
Weibull,J.Evolutionary Game Theory[M].Cambridge,Massachusetts:MIT Press.1995.
A general form of asymmetry game and its ESS
ZHANG Chun—hua,DING Zhan—wen
(Faculty of Science,Jiangsu University,Zhenjiang 212013,China)
Abstract:Taking into consideration the influence of the population states on the individual payoffs in the evolutionary
dynamics a general form of the asymmety rgame is presented.The ESS of the asymmetry game in this general form
is then defined.The results show that the ESS has the similar properties of the ESS of the symmety rgame and meets
the similar first—order and second—order best—reply conditions of the symmetry game when the payoff is linear
Finally
.
the formulation of the linear payoff is given and as an example of the extensive form a matrix game is studied
Key words:asymmetry game;ESS;linear payoff—mapping;matrix game
.
版权声明:本文标题:非对称博弈的一种一般描述及其ESS 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1713178503a622690.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论