关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
/ k# H! c! M( }& x1 g3 ~  F1 D: D1 K+ R. o
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- G! L: Y5 D4 k' ~4 q; B  以下三个定义:! [' B& b  t, X3 w0 v' m
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 Z! r( G+ `  A7 `0 f  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & Y0 G4 `7 G; R$ [/ Q- z  J2 t
  所谓的双方优势策略则是指双方利益总和最大的策略。  - q/ \# ~+ t. u
[编辑本段]严格优势策略举例分析3 [- {' c! d" ]/ u. X" }, Z
  一、经典的囚徒困境 * i+ U9 P1 O" V- z" N  F% ^
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " |% g+ t, B- A/ r
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 a* j4 r! I/ f1 ]2 _# W
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 l  G) O. y: I
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; y* |. J1 Q4 _  H7 O% N  若二人都互相检举(互相“背叛”),则二人同样判监2年。; n9 p. ?+ v- Z" `9 p6 [
  ! _* x9 j! u$ E' N  _
用表格概述如下:2 J* u% ^/ @" c: c$ b

2 [. p  u5 [8 M8 U; P    甲沉默(合作)  甲认罪(背叛)  
, r6 G1 F& K7 F1 i0 W乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
- C0 a& w% g  T% N# }3 w乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
/ ~( U; E0 L5 D* N8 O, s( P. m3 c( S7 y( j- r0 q$ y  m0 R: }
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 Y# x% j* Z# U! t  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' w+ X1 Z, M+ o3 P0 }  若对方沉默、背叛会让我获释,所以会选择背叛。 9 M2 ^$ U6 f) s9 R* \# @. s5 J
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ S+ \, R2 g& t4 i! T, M5 j+ V; K  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* a3 T$ [! i8 E& b% z& `  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
9 r6 h. P3 ?8 w5 B" @" r. `0 j$ q4 b9 x  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 ~2 U2 Q* H1 n
[编辑本段]二、智猪博弈理论! N8 H+ v5 @' H- |/ O
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。   G/ z4 a1 g5 i+ h( ~; N( [* R# X$ K
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 g' o6 H! a, q7 i6 M, j6 D  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ B' N2 `0 f& `; b9 [2 K  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , V( T8 L1 A% ^* D. H: R2 j
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 ~( t- J/ x4 C/ v% O  m2 F8 Z, z! c
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。   [& s, F5 e3 |7 A. I: D7 |
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; U  f0 B  F5 i8 n5 A. Q9 s) `
  
, ^1 ]) w* b6 [6 p3 w三、关于企业价格策略. S1 V3 i6 v: l# F$ F1 k6 [9 M

6 F; J' s, Q( }8 W6 v  
* w. g1 F  \. j2 \/ D& H0 n  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ) M4 p8 A- L9 e' N5 F; l
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. H! i1 J% Z$ F2 x. [
  以下三个定义:2 E5 Q" P' Q* A$ s' p2 ~
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : f1 x5 J3 L$ T2 d- X4 z  d6 k
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' ?6 y1 i, k5 l# E- e% T6 R# _& Y
  所谓的双方优势策略则是指双方利益总和最大的策略。  9 y/ a1 P4 J6 F
[编辑本段]严格优势策略举例分析; R. x! `0 C6 W
  一、经典的囚徒困境 ' V& |) y. L+ b6 L
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: : F/ E# ]( @/ T- x) d) V
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& e, u8 Q8 P( x# g- I& U6 B8 f  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; t$ E2 g1 Q6 f5 E% p0 a6 g8 y- I" P  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 F4 B/ O+ r3 y$ [3 n. }0 D  若二人都互相检举(互相“背叛”),则二人同样判监2年。
% h* Q* i9 r& t7 a7 ?    ~2 B. Q4 n; ^- a- v
用表格概述如下:
8 j: G+ V( C! ~1 h6 n7 e/ ~
* p. D* J% A- D    甲沉默(合作)  甲认罪(背叛)  % e7 v; h6 K4 k( w0 }
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年    Y# X6 l3 @- z0 D% V
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
( o/ |3 x/ l$ o9 V" G3 Z1 p2 n0 w* q  o: v  K& C
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 p' G8 U- I- C8 U2 `7 \
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! o1 ]6 T& U" C/ `- _  若对方沉默、背叛会让我获释,所以会选择背叛。 ! q, a: J$ Z/ x. j
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + u1 W- l5 @9 Z" g5 @4 ?
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 3 `5 W8 ?* v  L! H2 f& Q6 B  Z9 `/ h% F
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, ^  l/ {7 T: S8 K. C0 G9 N7 n  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. h: y' ]4 ]2 r$ c" M/ o- a
[编辑本段]二、智猪博弈理论) w+ _3 t9 ^1 l4 _3 O" `9 R
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & H5 e, f( {5 l( z
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 - I- n) z, A$ a% h2 T6 a) D
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 x4 @4 K) r3 _$ b) P  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" k5 x) x' b" b: i  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, m- @5 V9 C9 m3 M3 T8 L: t* @  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ v/ f- F8 ]: K; y/ C$ w  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# Y5 |6 [' g4 g+ s, f; i/ u  
( q& f! c( i2 M# r! V# j三、关于企业价格策略4 M6 u  }- p9 U  d' R0 P1 p* X
  @( ?2 D" b- ^/ u# F
  / `$ y" y2 \# @* b' f0 n
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % X7 O1 r0 H3 E" T7 d1 G- s
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ l% X, \6 v' n' B4 V$ f% E
  以下三个定义:
/ \( ]+ a% c- R. K6 H) t7 u$ x  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ S$ R6 F' |9 Y1 r9 {# F  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 m. v& q- B8 f8 p* w3 m
  所谓的双方优势策略则是指双方利益总和最大的策略。  
! {' I6 N0 j# U, ~[编辑本段]严格优势策略举例分析0 {! c- o" o& `$ F9 `& e( P
  一、经典的囚徒困境
9 k- y  e% ]7 {# I  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
& p' g7 E6 j/ D  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % E8 d% x. m; y& I2 X' d6 F+ c
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! E2 z0 ~' F0 R8 p' o  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- I; y1 v; f  E* k. M% p# ?$ Q  若二人都互相检举(互相“背叛”),则二人同样判监2年。
- D& D$ [9 Q5 n2 o0 W9 S8 d  9 t0 c6 m3 v* H7 \9 r9 M% }# Q% l; N
用表格概述如下:7 \0 R" |1 ]4 y6 ^: X4 t

6 b, B5 R6 ?* Y, \% t5 I    甲沉默(合作)  甲认罪(背叛)  ( |; y' u3 d. d
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
# S/ V% y7 y0 I! k6 v2 `3 `乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ) h/ [  j4 c, ?% e# U5 @
; d3 S( S$ E9 X7 }1 c% o4 D6 f
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 m  g) F- e# a% J3 L
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- ^8 s  _. j9 n7 S  若对方沉默、背叛会让我获释,所以会选择背叛。 $ L  H. b& h" k2 ^9 }
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ t- L8 U. r( v6 _' v3 a  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 v' d2 a+ ]1 L# \8 q0 G# U" n  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + |$ T4 N; |% t- d
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 ]( t6 B$ ^! N) A, d
[编辑本段]二、智猪博弈理论
$ y, Y6 ~* {& l# }' o+ J  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 J0 ^. v4 `# j
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # I1 w- k3 y" I
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" V" D( I. A$ c' {+ S4 S0 I  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, v7 {0 k  @1 F1 e  S& S  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, c/ l0 I3 F. ]( o! D* s9 z  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 u) }" {' {# t# F, T  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 n- k( V7 ]3 X' D' ^  ) n6 H. q2 T1 B
三、关于企业价格策略
: U4 o0 }. q$ \5 `# q; K, W9 \. q$ \" [* @
  # s; p- q& ~, |* e" v( \( w
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ Z* S8 e( N* `7 s) [  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: z2 g. h# g, P8 b) _  以下三个定义:: u- `* \8 {. r0 d/ K, d
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 V  Q! c, |0 y6 t+ x1 ^
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& Y% `5 x* _/ D9 x) z; E7 |- ~  所谓的双方优势策略则是指双方利益总和最大的策略。  
# e* d8 s) V3 J, M* o- D+ y[编辑本段]严格优势策略举例分析
; f9 g" _% n& f% e) l+ Y  一、经典的囚徒困境
8 i; j' _0 r1 G- B8 O! C; T  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% t0 J( Q2 S' S/ \  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' D7 }+ t9 ?) v  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 ?$ Q5 ], w/ f; _
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 u1 `' t3 W+ x+ O; S2 J4 m8 x
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 f- q6 D  {* o/ n& ?. b  
8 ^4 {9 l! C% s3 L$ L/ ^9 l用表格概述如下:9 H+ Q/ W& F+ g

( f: z- L! J3 i' A    甲沉默(合作)  甲认罪(背叛)  
( ~/ L2 D& r/ g, |$ v乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  * n) d; Q$ p/ b! ~4 Y5 U- u
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  5 F1 ?- y& \1 D8 T! U9 J& i* @
+ D2 p$ Y* f+ d# X
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- G- ~9 e- o0 |6 p, E0 N( y  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 Z% W' s1 F1 D: n
  若对方沉默、背叛会让我获释,所以会选择背叛。
0 y% R' A* Q1 E( R& q, I  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 d9 Z6 ^- J8 o+ V
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 V  {8 Z5 i7 B/ ^1 X  X# M( `+ r: x  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& m$ b) {& }$ w8 x1 ^. Y: S  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( M: |( Q7 T; n6 q
[编辑本段]二、智猪博弈理论
7 T. w8 n1 ]- [$ t- y2 i( ?  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 [" v- y0 B' d6 U0 L  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ _+ U9 d) V+ G  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
  w4 R, A2 ]  o% n( v  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 1 X6 C$ i4 d: o5 |
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - J4 y: c; k1 @$ {5 H. M. P
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % d6 f5 a) R3 d& @/ U+ B; P
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' C' D7 M/ N* w3 m2 t1 u- p  
) V9 ?4 \( T% Y' s6 D三、关于企业价格策略3 L3 Q/ _2 d6 }' G
  [) f" b3 S8 X9 j- P# z- ^4 _
  - W& p# y) m9 l, l+ ?$ @6 T
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 d* A# q$ L, s7 U1 q" v1 `/ g
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )