本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
/ k# H! c! M( }& x1 g3 ~ F1 D: D1 K+ R. o
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- G! L: Y5 D4 k' ~4 q; B 以下三个定义:! [' B& b t, X3 w0 v' m
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 Z! r( G+ ` A7 `0 f 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & Y0 G4 `7 G; R$ [/ Q- z J2 t
所谓的双方优势策略则是指双方利益总和最大的策略。 - q/ \# ~+ t. u
[编辑本段]严格优势策略举例分析3 [- {' c! d" ]/ u. X" }, Z
一、经典的囚徒困境 * i+ U9 P1 O" V- z" N F% ^
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " |% g+ t, B- A/ r
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 a* j4 r! I/ f1 ]2 _# W
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 l G) O. y: I
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; y* |. J1 Q4 _ H7 O% N 若二人都互相检举(互相“背叛”),则二人同样判监2年。; n9 p. ?+ v- Z" `9 p6 [
! _* x9 j! u$ E' N _
用表格概述如下:2 J* u% ^/ @" c: c$ b
2 [. p u5 [8 M8 U; P 甲沉默(合作) 甲认罪(背叛)
, r6 G1 F& K7 F1 i0 W乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
- C0 a& w% g T% N# }3 w乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
/ ~( U; E0 L5 D* N8 O, s( P. m3 c( S7 y( j- r0 q$ y m0 R: }
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 Y# x% j* Z# U! t 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' w+ X1 Z, M+ o3 P0 } 若对方沉默、背叛会让我获释,所以会选择背叛。 9 M2 ^$ U6 f) s9 R* \# @. s5 J
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ S+ \, R2 g& t4 i! T, M5 j+ V; K 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* a3 T$ [! i8 E& b% z& ` 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
9 r6 h. P3 ?8 w5 B" @" r. `0 j$ q4 b9 x 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 ~2 U2 Q* H1 n
[编辑本段]二、智猪博弈理论! N8 H+ v5 @' H- |/ O
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 G/ z4 a1 g5 i+ h( ~; N( [* R# X$ K
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 g' o6 H! a, q7 i6 M, j6 D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ B' N2 `0 f& `; b9 [2 K 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , V( T8 L1 A% ^* D. H: R2 j
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 ~( t- J/ x4 C/ v% O m2 F8 Z, z! c
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 [& s, F5 e3 |7 A. I: D7 |
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; U f0 B F5 i8 n5 A. Q9 s) `
, ^1 ]) w* b6 [6 p3 w三、关于企业价格策略. S1 V3 i6 v: l# F$ F1 k6 [9 M
6 F; J' s, Q( }8 W6 v
* w. g1 F \. j2 \/ D& H0 n 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ) M4 p8 A- L9 e' N5 F; l
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. H! i1 J% Z$ F2 x. [
以下三个定义:2 E5 Q" P' Q* A$ s' p2 ~
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : f1 x5 J3 L$ T2 d- X4 z d6 k
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' ?6 y1 i, k5 l# E- e% T6 R# _& Y
所谓的双方优势策略则是指双方利益总和最大的策略。 9 y/ a1 P4 J6 F
[编辑本段]严格优势策略举例分析; R. x! `0 C6 W
一、经典的囚徒困境 ' V& |) y. L+ b6 L
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: : F/ E# ]( @/ T- x) d) V
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& e, u8 Q8 P( x# g- I& U6 B8 f 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; t$ E2 g1 Q6 f5 E% p0 a6 g8 y- I" P 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 F4 B/ O+ r3 y$ [3 n. }0 D 若二人都互相检举(互相“背叛”),则二人同样判监2年。
% h* Q* i9 r& t7 a7 ? ~2 B. Q4 n; ^- a- v
用表格概述如下:
8 j: G+ V( C! ~1 h6 n7 e/ ~
* p. D* J% A- D 甲沉默(合作) 甲认罪(背叛) % e7 v; h6 K4 k( w0 }
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 Y# X6 l3 @- z0 D% V
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
( o/ |3 x/ l$ o9 V" G3 Z1 p2 n0 w* q o: v K& C
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 p' G8 U- I- C8 U2 `7 \
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! o1 ]6 T& U" C/ `- _ 若对方沉默、背叛会让我获释,所以会选择背叛。 ! q, a: J$ Z/ x. j
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + u1 W- l5 @9 Z" g5 @4 ?
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 3 `5 W8 ?* v L! H2 f& Q6 B Z9 `/ h% F
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, ^ l/ {7 T: S8 K. C0 G9 N7 n 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. h: y' ]4 ]2 r$ c" M/ o- a
[编辑本段]二、智猪博弈理论) w+ _3 t9 ^1 l4 _3 O" `9 R
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & H5 e, f( {5 l( z
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 - I- n) z, A$ a% h2 T6 a) D
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 x4 @4 K) r3 _$ b) P 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" k5 x) x' b" b: i “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, m- @5 V9 C9 m3 M3 T8 L: t* @ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ v/ f- F8 ]: K; y/ C$ w 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# Y5 |6 [' g4 g+ s, f; i/ u
( q& f! c( i2 M# r! V# j三、关于企业价格策略4 M6 u }- p9 U d' R0 P1 p* X
@( ?2 D" b- ^/ u# F
/ `$ y" y2 \# @* b' f0 n
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % X7 O1 r0 H3 E" T7 d1 G- s
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ l% X, \6 v' n' B4 V$ f% E
以下三个定义:
/ \( ]+ a% c- R. K6 H) t7 u$ x 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ S$ R6 F' |9 Y1 r9 {# F 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 m. v& q- B8 f8 p* w3 m
所谓的双方优势策略则是指双方利益总和最大的策略。
! {' I6 N0 j# U, ~[编辑本段]严格优势策略举例分析0 {! c- o" o& `$ F9 `& e( P
一、经典的囚徒困境
9 k- y e% ]7 {# I 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
& p' g7 E6 j/ D 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % E8 d% x. m; y& I2 X' d6 F+ c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! E2 z0 ~' F0 R8 p' o 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- I; y1 v; f E* k. M% p# ?$ Q 若二人都互相检举(互相“背叛”),则二人同样判监2年。
- D& D$ [9 Q5 n2 o0 W9 S8 d 9 t0 c6 m3 v* H7 \9 r9 M% }# Q% l; N
用表格概述如下:7 \0 R" |1 ]4 y6 ^: X4 t
6 b, B5 R6 ?* Y, \% t5 I 甲沉默(合作) 甲认罪(背叛) ( |; y' u3 d. d
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
# S/ V% y7 y0 I! k6 v2 `3 `乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) h/ [ j4 c, ?% e# U5 @
; d3 S( S$ E9 X7 }1 c% o4 D6 f
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 m g) F- e# a% J3 L
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- ^8 s _. j9 n7 S 若对方沉默、背叛会让我获释,所以会选择背叛。 $ L H. b& h" k2 ^9 }
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ t- L8 U. r( v6 _' v3 a 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 v' d2 a+ ]1 L# \8 q0 G# U" n 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + |$ T4 N; |% t- d
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 ]( t6 B$ ^! N) A, d
[编辑本段]二、智猪博弈理论
$ y, Y6 ~* {& l# }' o+ J 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 J0 ^. v4 `# j
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # I1 w- k3 y" I
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" V" D( I. A$ c' {+ S4 S0 I 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, v7 {0 k @1 F1 e S& S “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, c/ l0 I3 F. ]( o! D* s9 z 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 u) }" {' {# t# F, T 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 n- k( V7 ]3 X' D' ^ ) n6 H. q2 T1 B
三、关于企业价格策略
: U4 o0 }. q$ \5 `# q; K, W9 \. q$ \" [* @
# s; p- q& ~, |* e" v( \( w
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ Z* S8 e( N* `7 s) [ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: z2 g. h# g, P8 b) _ 以下三个定义:: u- `* \8 {. r0 d/ K, d
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 V Q! c, |0 y6 t+ x1 ^
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& Y% `5 x* _/ D9 x) z; E7 |- ~ 所谓的双方优势策略则是指双方利益总和最大的策略。
# e* d8 s) V3 J, M* o- D+ y[编辑本段]严格优势策略举例分析
; f9 g" _% n& f% e) l+ Y 一、经典的囚徒困境
8 i; j' _0 r1 G- B8 O! C; T 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% t0 J( Q2 S' S/ \ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' D7 }+ t9 ?) v 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 ?$ Q5 ], w/ f; _
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 u1 `' t3 W+ x+ O; S2 J4 m8 x
若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 f- q6 D {* o/ n& ?. b
8 ^4 {9 l! C% s3 L$ L/ ^9 l用表格概述如下:9 H+ Q/ W& F+ g
( f: z- L! J3 i' A 甲沉默(合作) 甲认罪(背叛)
( ~/ L2 D& r/ g, |$ v乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * n) d; Q$ p/ b! ~4 Y5 U- u
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 5 F1 ?- y& \1 D8 T! U9 J& i* @
+ D2 p$ Y* f+ d# X
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- G- ~9 e- o0 |6 p, E0 N( y 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 Z% W' s1 F1 D: n
若对方沉默、背叛会让我获释,所以会选择背叛。
0 y% R' A* Q1 E( R& q, I 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 d9 Z6 ^- J8 o+ V
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 V {8 Z5 i7 B/ ^1 X X# M( `+ r: x 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& m$ b) {& }$ w8 x1 ^. Y: S 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( M: |( Q7 T; n6 q
[编辑本段]二、智猪博弈理论
7 T. w8 n1 ]- [$ t- y2 i( ? 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 [" v- y0 B' d6 U0 L 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ _+ U9 d) V+ G 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
w4 R, A2 ] o% n( v 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 X6 C$ i4 d: o5 |
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - J4 y: c; k1 @$ {5 H. M. P
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % d6 f5 a) R3 d& @/ U+ B; P
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' C' D7 M/ N* w3 m2 t1 u- p
) V9 ?4 \( T% Y' s6 D三、关于企业价格策略3 L3 Q/ _2 d6 }' G
[) f" b3 S8 X9 j- P# z- ^4 _
- W& p# y) m9 l, l+ ?$ @6 T
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 d* A# q$ L, s7 U1 q" v1 `/ g
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |