本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
* ]5 s9 t2 o5 x7 t8 x& l# m8 c$ s, ]. s1 [+ p8 d
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ x0 T3 o; }8 j7 ^: q 以下三个定义:
. ^8 E: C% G- { 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ X. I; e1 S \& }2 W
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 l- P. R& O6 Q1 o* ~4 Y' I O 所谓的双方优势策略则是指双方利益总和最大的策略。
1 U) A6 L: R- I4 C8 e/ w[编辑本段]严格优势策略举例分析* o7 Q0 N( X. T: o W
一、经典的囚徒困境
`% g/ Z2 u1 @! a0 d7 h 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ) A3 s. R4 f) A) i. k: }
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
) E* D% g; ]' x: C) p/ A/ } 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 n; x, F* [. V; ~ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , T% ^" a. F, ]3 \1 Q, s1 R& s5 @
若二人都互相检举(互相“背叛”),则二人同样判监2年。5 n% I* w' P* P1 W1 q
9 N6 E+ s4 a5 g9 a
用表格概述如下:+ e" u/ A% o+ ?- Y! [/ X
. m& s+ F, s& c( Y8 K* n( r% X
甲沉默(合作) 甲认罪(背叛) * E- J( z2 y, s" N( `1 g
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 : U Z8 D. E. j) C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
2 i5 a9 t& o4 Z( v! I! I1 t$ I: a' x O# i/ K0 Y
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 g% N) B+ ?8 \* M 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' d) s3 a8 x1 ]
若对方沉默、背叛会让我获释,所以会选择背叛。 - L4 ]' V" i. q) y0 @$ W6 F
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' u4 B! F5 f o/ @8 e 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, T1 J* t8 T$ N 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : f X8 n# h( j4 H6 t
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 _2 C% W9 y' N. c3 h U; X, J[编辑本段]二、智猪博弈理论
1 U: \) a- t' X/ K l 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 m% K5 u0 T' ]( m* A/ S 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : G# b$ g- t% s7 c
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* A2 @. U5 ~8 @4 @, p% l Z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 M$ h" P8 E. h% O8 P# O3 a; N6 b
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ S: D" B. a# g5 _ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , F- A- J$ N4 u
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 a- j. k2 Z! u
/ d$ y! z3 V* `7 J, {# e# `) z三、关于企业价格策略/ b! n* N: X, I- x& J+ \3 \" R
' L4 Q9 A) ^( i
' Q$ T4 B: y/ {: i- _, U 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! W. v! D: n' d1 p- g2 v
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% C5 |2 m8 B! `$ F# x
以下三个定义:
5 `- z* [& N; p# ^- p, S 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 T) [4 r1 i9 ]* C; J 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 + v9 F3 n/ F7 ], Q* L
所谓的双方优势策略则是指双方利益总和最大的策略。 * n A/ u/ }$ B: q& E/ k
[编辑本段]严格优势策略举例分析( c) y1 t! d: ?. b& I; N% b E n
一、经典的囚徒困境
0 C1 _7 m6 X) }6 r, ] 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! A: J8 v8 N3 C, w7 |- e
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ `1 ?4 o* v- V7 S) c 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : R; a" u6 h H/ p
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 G- |% A) w8 C# G$ s8 M
若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 H" h! C" J+ t1 Y/ b
! |, O8 M4 H3 S6 J s用表格概述如下:6 U% O7 G h% z: ?: v
! V" w% m* j. e4 ?, H' O
甲沉默(合作) 甲认罪(背叛)
* i/ J* P( A+ D2 }# G$ {乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ P6 o- S6 Y( A3 W1 b/ V乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 5 L) D! L$ c. E5 O- F# d G5 _- c; K
- s5 r2 o* v/ {! O: y 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 X: A6 X1 e7 s4 |/ r
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % V8 w- c j; L* S5 t
若对方沉默、背叛会让我获释,所以会选择背叛。
$ o& n+ O% `/ A" Y; Z! u 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 R* p6 U# W3 e) c7 @+ h0 U 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% e8 ]& ?& j. X. u" b 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ ]7 E0 N7 P7 N8 H5 X' f2 V 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( F# r' _: u" W( w, H, {& O9 u1 T[编辑本段]二、智猪博弈理论
9 z# Z. ~8 |, p4 Y 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 X3 W3 o0 t$ ^ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& [$ u6 D/ m6 n6 y5 P. p6 { 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, r9 Q8 \6 @8 f( \' B) y+ d B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ O, h/ i: M+ }6 @3 w" M' S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 ]9 T, t8 K& [! n
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 o3 |1 q5 l4 A! D( @. ]
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ E1 {) @, w/ q+ z4 d, [ ! ` A6 O( y: G% w1 _! d
三、关于企业价格策略! H+ H7 B% {# i9 e( f; {% [
$ Z: c) P) e2 j4 F, K; g8 _
3 m, h" H& U* O! L2 a 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 U5 D/ u3 |5 A" G% ~% u 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);: Y9 G& m6 t+ ~) e
以下三个定义:
& R$ c0 ^% T( [ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 a' r9 _" c! R* V0 [4 j( s
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- y* @1 A3 Q9 o! b 所谓的双方优势策略则是指双方利益总和最大的策略。 U. \9 R0 Z, r+ c. Q' o, B
[编辑本段]严格优势策略举例分析& n- _/ V0 {8 L. r I
一、经典的囚徒困境 ! n, r; A% ]( O
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 k+ G4 H. ~+ G: l* c0 \) x( G3 l
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' ~" L9 B/ r. o) p3 l
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" Y* U2 U2 A" \. w2 J" c: { 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& J3 _) q* F9 m 若二人都互相检举(互相“背叛”),则二人同样判监2年。
' l1 [4 u# i2 U; l' a8 u+ T 1 C! L0 N" W5 K
用表格概述如下:
: `7 f; E- l' j9 J, }/ X% O, o1 {$ |5 U5 g* b
甲沉默(合作) 甲认罪(背叛) + ]0 P6 \) N7 z& p0 f
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & {( i {+ E ~. T
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) \4 y5 D) |$ L
' ]7 k3 _7 O* p1 @ t 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 / M# Z: L2 V' ?! x; B
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 h9 k4 H5 S/ p: A( s/ w# ?. J
若对方沉默、背叛会让我获释,所以会选择背叛。
( d7 }5 y4 `. \; r' j2 Y! ?7 V 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& o/ Y- u: m1 C% T8 J) b" K: c. ^ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 T/ E) k- G0 a 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 ]' A x& R4 o( X" Y+ t' K, f 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; a- ]1 s, J/ T+ w1 ?: w" ?( _" v, r[编辑本段]二、智猪博弈理论
$ A1 k8 s' }" r 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- K# i/ [. |# I& a& n 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 U& M* G5 W. r: M( ^1 L
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + A$ K# ?" Z+ }+ e
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
: Z+ A6 Y- Z9 @4 {& L “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& J# T/ M; D+ c$ p1 D! R% x: \ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 Z, D+ i1 y- k# _! F1 P& K
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ S0 I8 q7 V7 M# E( n
. d: ^8 G8 J1 Q* h3 ^
三、关于企业价格策略! k6 p9 h) K8 _3 d/ M+ f- b
3 _* O( X$ p0 n$ o5 K- q7 ?% G & r4 b5 Q/ ]0 m/ Y6 a7 p( v6 q
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ h4 h1 z/ T2 I$ p1 s( X# t 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: [1 C( Q7 \$ x" f 以下三个定义:
& `/ w; S6 [5 w Y: ~2 { 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ S9 W" J, [4 c- Z- c( F3 `* g 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 H7 M9 d3 F4 M! b; G8 Q3 _" v$ u! l/ T 所谓的双方优势策略则是指双方利益总和最大的策略。
- t8 n( p8 ~( e) G1 B+ M[编辑本段]严格优势策略举例分析( H: S, L: [* P' b
一、经典的囚徒困境 % ^0 D9 H5 O9 v$ }; ]8 M8 h! S7 n
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, n8 r6 X" ]7 Q5 S6 c" h 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 c9 t" h: q$ z( i. T z* _! E
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
" E+ r9 J _- }3 V+ m: b 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) o% q7 N, O- r$ W% r( ]
若二人都互相检举(互相“背叛”),则二人同样判监2年。8 ?! J; n! m# }7 z3 D
1 s% u2 m( d# C6 ~# u5 G用表格概述如下:
; }% P- i w, ?4 l5 t$ R' n: ]" k+ P# X, C! I
甲沉默(合作) 甲认罪(背叛) 1 `" `7 i1 S0 l
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - ^" |! F7 A4 z3 {: Y$ `
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; c1 {0 c, ?2 s1 q0 M* _, V" V5 @* O- U' Y* @
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. a, ~3 A3 f: _7 R% r1 {+ A 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - R$ y) D7 ~8 p4 h9 _$ \! h. f, [
若对方沉默、背叛会让我获释,所以会选择背叛。
4 U% t) _( b B# p 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 Q. w2 n/ b) ]5 x2 ]6 }9 u# J/ E& Z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. H% r( K, Q0 v, l8 m4 R9 U; {' o 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" P0 k0 ?! l1 Y ~" [* n 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ x1 j2 A( N! l[编辑本段]二、智猪博弈理论
. h/ `# ~9 ^- s 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 V Q6 f* j; M8 N 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* k, S3 n: |- e$ R 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! M" I2 E0 s4 [1 p' d, ?3 _- e, Y7 o 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , U5 g5 [' {6 X" X
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - F3 l6 @# F0 q" Y% V3 ?
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / \) `4 q; q8 [4 E) Q* H( O
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
5 x9 {2 `' E: s1 g
( i) l, t4 X7 l5 o7 i2 u三、关于企业价格策略
7 `9 {% D$ J! {" Y7 w
7 ?$ l' y& `# S3 q; }) o7 ~; A
7 S5 W2 w9 O3 V- B& K8 `& t) e- f8 B 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . \" ]/ f& Y/ Z4 J- ~) n& D6 b
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |