欢迎光临 我们一直在努力

囚徒困境的意思,囚徒困境是什么意思???

日期:来源:囚徒困境的意思收集编辑:土味情话

囚徒困境是什么意思???

在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。

那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。

企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。

囚徒困境原理是什么意思?

两个囚徒为了追求各自的利益最大化,得到的结果一定是两败俱伤;如果双方可以同时放弃各自的最优策略,选择合作,这样才可以双赢。所谓困境,在于如果任何一方选择了合作而对方不合作,己方将万劫不复;而如果对方选择合作而自己选择最优策略,自己则有机会一步登天,将万劫不复留给对方,这就是为什么即使双方都知道唯有合作才能双赢,双方仍然无法合作。

囚徒困境隐含的意思

本文由汪龙耀编辑,严禁转载

纳什均衡定义:

  假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡经典案例:囚徒困境

  (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)

  假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

  单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

  在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

  囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

  若对方沉默、背叛会让我获释,所以会选择背叛。

  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

探索了经典囚徒困境情景的一个扩展,并把它称作“重复的囚徒困境”(IPD)。在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面:算法的复杂性、最初的对抗、宽恕的能力等等。

  阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。

通过分析高分策略,阿克塞尔罗德指定了策略获得成功的几个必要条件。

  友善

  最重要的条件是策略必须“友善”,这就是说,不要在对手背叛之前先背叛。几乎所有的高分策略都是友善的。因此,完全自私的策略仅仅出于自私的原因,也永远不会首先打击其对手。

  报复

  但是,阿克斯洛德主张,成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终合作。这是一个非常糟糕的选择,因为“下流”策略将残酷地剥削这样的傻瓜。

  宽恕

  成功策略的另一个品质是必须要宽恕。虽然它们不报复,但是如果对手不继续背叛,它们会一再退却到合作。这停止了报复和反报复的长期进行,最大化了得分点数。

  不嫉妒

  最后一个品质是不嫉妒,就是说不去争取得到高于对手的分数(对于“友善”的策略来说这也是不可能的,也就是说“友善”的策略永远无法得到高于对手的分数)。

注释

  注解1:获知其他人策略不被考虑的理由是:即使有人能获知他人策略,“背叛”仍然是最佳的策略,无论他获知对方选择“合作”或“背叛”都是如此。如果人的自私不改变的话,囚徒困境还是存在,永远达不到团体最大利益。所以知不知他人策略对囚徒困境的存在几乎没有影响。

  注解2:道格拉斯·霍夫斯塔特 (1985年). 元逻辑命题:追问思维和模式的本质. 班坦·戴尔出版集团. ISBN 0-46--9. - 参阅 第29章 囚徒困境计算机竞赛和合作的进化。

  3. 除了解释没有小偷小摸,异想还用于解释志愿投票之类的事情(在非投票者被认为是搭便车者的地方)。可能,这还可以用来解释维基百科贡献:文本在如下的假定下被添加——如果没人贡献,相似的人也将不会去贡献(即从效果到缘由的争论)。或者,解释要依赖于可预料的未来行动(不需要神奇的联系)。为未来的交流作模型需要增加有限的维,就像在重复的囚徒困境一节中给定的。

  4. 例如参看2003年的研究贝叶“斯纳什均衡;假说的统计检验”:关于概念的讨论,和是否能运用于真实的经济或统计情形(来自特拉维夫大学)。

  5. 2004年度囚徒困境锦标赛结果显示高波·拉姆琼的南安普敦大学策略位于前3名,尽管与GRIM策略相比,有较少的胜利和更多的失败。(注意,在囚徒困境锦标赛中,博弈的目标不是“赢得”比赛——通过经常背叛,这很容易就能达到。)同样需要指出的是,即使在软件策略(由南安普敦大学的小组开发)之间没有隐含结论,以牙还牙也不总是任何既定竞赛的绝对赢家。说得更确切些,它在一系列竞赛中的最终结果胜过它的对手。(在任何项目中,给定的策略能稍微比以牙还牙更适应竞赛,但是以牙还牙更稳固)。这同样适用于附加宽恕变量的以牙还牙和其他最佳策略:在任何一天,它们可能无法“赢得”一个对抗策略的特别组合。

  6. 这个争论——关于出于信任的合作的发展——出自《群众的智慧》,此书表明,长久的资本主义能够围绕教友派信徒的核心形成,这些教友派信徒们总是体面地同他们的生意合伙人交易(而不是背叛和食言——一种已经阻碍了早先的、非强制履行的长期境外合同的现象)。这表明,和可靠的商人作交易使合作拟子(meme)传播给其他交易者,这些交易者又把它传播到更远的地方,直到高水平的合作在一般商业活动中成为有利可图的策略。

什么是囚徒困境?

《博弈圣经》囚徒困境的定义;囚徒困境中的两点一空间,堪称大自然的三维时空游戏,它会引起两个灵性对三维实体变异的思考、也会引起对三维实体错位的焦虑。

……

【摘要】

最终纳什的家人和朋友、决定将他送进医院治疗,在医院他认为医生是苏联人、要追杀他。经医生诊断,他得的“妄想型精神分裂症”也更加严重。一个被“妄想型精神分裂症”伤害的大脑、一个胡言乱语的精神病人、妄想出来的“纳什均衡”博弈占优理论,你们认为可信吗?

……

来源:美国资讯网;博弈圣经著作人对纳什的嘲讽

博弈圣经著作人的经典名句;0、1、二维平均,称平衡,0、1、2、三维平均,称均衡。

在0、1、二维记录的系统中,0、1、这两种输赢粒子,必需构成博弈进程中的基本单元,冯·诺伊曼发现,有一个“极小极大定理”存在其中,(极小极大定理,就是要么极端的输、要么极端的赢),从长远来看,两种粒子出现的一次平均、是一次平衡,多次平均、就是多次平衡,里面并不存在两种粒子扯平的趋势。两种粒子的未来、不受过去所发生的、任何粒子事件的影响。0、1、两种粒子趋于平衡的预期,已经被极小极大定理彻底否决。

在0、1、二维粒子随机走动的系统中,只存在平均、不存在平均律,也就是不存在三维均衡。博弈圣经著作人的经典名句;策略,就不存在0、1、二维系统中。纳什均衡提出时,当场就遭到冯·诺依曼的贬低、嘲笑和断然否定。

谈到“纳什均衡”,有位记者请纳什用通俗的语言来解释他的理论。纳什说;“‘纳什均衡’并不高深,它就像中国人发明的一种、三个人玩的扑克游戏,“纳什均衡”就是一个简单的三人博弈游戏”。中国有那么多人玩扑克,又玩了那么多年,纳什还提醒了中国人半个多世纪,纳什均衡并不高深,中国人竟没有一个人发现三个人玩的扑克游戏中、还有一个‘均衡占优理论’。人们不禁要问;纳什他自己玩过几次三人扑克游戏?他和谁玩的?他是怎么发现的均衡?均衡理论又是怎么单方占优的?在他所有的文章中,为什么没有对中国的扑克游戏展开叙述。一副扑克三个人玩,一个人18张牌,在连续记录的0、1、2、三维系统中,18张牌只能记录成、18个红蓝小点而已,它是怎么个均衡法呢?他在60多年的时间里,没有人见过他、用中国的扑克表演过什么是、非合作纳什均衡,什么是纳什均衡占优策略,他既没有实际表演,也没有给出明确的理论说明,这令关注纳什占优策略的人,大为失望。

博弈圣经著作人的经典名句;科学家在纳什均衡理论中、尚未发现博弈占优策略的任何迹象。

博弈圣经著作人的经典名句;策略,来自0、1、2、三维结构的自然属性。粒子、私湍、实体,简称为,粒、湍、体。它是博弈取胜、计算单方占优策略的标准模型。

在纳什的语文学中,就没有出现过一次0、1、2、三维均衡的概念,纳什均衡哪里来。

博弈圣经著作人的经典名句;纳什均衡理论没有任何明确的说法,纳什均衡是美国伪造的产物,传到了世界各地,当然也传遍了中国。“纳什均衡”的本质,是对中国人的智商,对发现、发明、创造精神的一种羞辱。

博弈圣经著作人的经典名句;二维平衡是指生物的竞争行为,三维均衡是指自然的优劣特性。

博弈圣经著作人的经典名句;揭开纳什均衡的画皮,露出真相。【如果纳什均衡是以纳什的名字、命名的一个博弈论术语;假如我把纳什名字去掉、只剩下均衡一词、均衡也就是纯净的博弈论术语;倘若所有博弈论的文章中、都把纳什名字去掉只剩下均衡;再读一篇篇博弈论文章、也都是围绕着均衡一词展开的叙述;发现通篇文章逻辑不通、词意变异、不知所云;只要是属于纳什均衡的理论文章、去掉纳什名字之后、纳什的鬼魅就出现了;通篇文章,捕风捉影、张冠李戴、以讹传讹,添油加醋又像是疯言疯语,更不能被常人所理解。】

博弈圣经著作人的经典名句;纳什-是纳什,均衡-是均衡。纳什均衡二者相提并论、就是;驴唇马嘴。

博弈圣经著作人的经典名句;“纳什均衡” 之所以鬼魅,纳什自己不知道什么是纳什均衡,追随他的门外汉,都假装懂得纳什均衡。“纳什均衡”把所有的门徒变成了精神病、变成了不懂装懂;任何人谈到纳什均衡,就像掉进了魔鬼坑,开口就是自问自答、自说自话、反复无常、自己感到莫名其妙时,还会自圆其说。博弈圣经著作人的经典名句;纳什均衡是一份内容不明的谜语,它似乎和任何可理解的逻辑语言都对不上。博弈圣经著作人把“纳什均衡”戏称为“傻吊的博弈图腾”。

博弈圣经著作人的经典名句;如果说纳什均衡是一份学术遗产,那就是学术中、独一份的滑稽遗产,他的滑稽级别、足够七星级。纳什均衡是什么,纳什自己不知道,中国的傻吊全都知道……。

博弈圣经著作人的经典名句;“纳什均衡成了中国的一个宗教,追随他的门徒;有无知的青年、有无畏的傻吊、还有无耻的教授。”

博弈圣经著作人的经典名句;中国的傻吊谈博弈,必谈纳什均衡。

博弈圣经著作人的经典名句;中国人醒来吧,应该扪心自问;“纳什均衡”既然像是中国人发明的三人扑克游戏,它的游戏规则是什么?游戏理论又是什么?中国人从三人扑克游戏中、也可以说从“纳什均衡”中、到底学到了什么?纳什演示“纳什均衡”用的数学符号,用的游戏规则、进行了毫无意义的重组。纳什是被媒体炒作、捧杀、逼得骑虎难下,他在纸上写写画画、作出的符号游戏、是无可奈何时的一个姿态。按照博弈圣经著作人对虚拟经济的解释,虚拟经济使用的是、单纯一性的物品,(也许是因为诺贝尔经济学奖错发给了纳什,他又不肯退回奖金的缘故。)纳什均衡的行为姿态,不是演示博弈论术语,他演示的纳什均衡、如同艺人玩猴。更为滑稽的是;纳什让人们明白了,滑稽的世界大师、滑稽的精美绝伦、滑稽的经典课程、滑稽的纳什均衡,变成了滑稽的虚拟经济。

博弈圣经著作人给虚拟经济下了一个难以启齿的定义;犹如看魔术大师让一群狗争夺一块骨头,让众人押注的赌博游戏。【通俗的解释虚拟经济是由单纯一性的一个物品(字画或古董)、单纯一性的一个姿态(逞能摆架子,装大官、充大款)、单纯一性的一个玩物(艺人玩猴)、统称为虚拟经济。】纳什单纯一性的一个姿态(在纸上写写画画的那些数字符号),演示从没人看懂过的纳什均衡,如同艺人玩猴,它符合虚拟经济的定义。

纳什在20多岁时患上了,妄想型精神分裂症。在他想象的世界里,全是魔鬼、武士和纳粹,他觉得自己一直生活在别人的威胁下。他担心自己,随时会被其他人杀害,他对世界毁灭和自己的死亡有深深的恐惧。

一天早晨,纳什拿着一份《纽约时报》走进办公室,对着空气说,报纸头版左边的文章里、包含着一条来自另一个星球的数字信息,只有他能破解。并且认为自己、是政府对抗苏联的间谍,他整天在数字中寻找拯救美国的密码,他的幻觉也日益严重。

最终纳什的家人和朋友、决定将他送进医院治疗,在医院他认为医生是苏联人、要追杀他。经医生诊断,他得的“妄想型精神分裂症”也更加严重。一个被“妄想型精神分裂症”伤害的大脑、一个胡言乱语的精神病人、妄想出来的“纳什均衡”博弈占优理论,你们认为可信吗?

博弈圣经著作人的经典名句;【“纳什均衡”一词,像是宗教的“圣言”,追随它的门徒,各自像精神病人一样、在纳什均衡中寻找理由,都想找到合理的理由解释“纳什均衡”,其结果把纳什均衡变成了博弈宗教、纳什变成了教主,门徒解释纳什均衡的疯言疯语,其实就是胡说八道。】

博弈圣经著作人的经典名句;如果中国的教授抄袭“纳什均衡”作为标题,捕风捉影、以讹传讹的炒作,是为了编书、售书、挣钱,假如读者想通过“纳什均衡”想占优、想赢钱,就应该先查查纳什60年以来、讲过一句“赢钱”吗,他赢过一次吗?因为没有在赌场中验证,他受到了爱因斯坦的冷遇。【纳什既然是个数学家,他就应该把占优策略给出一个、数字量化的数学公式、或者是一个数学模板,让所有的人都能成功模仿,也就是说,无论是傻吊或天才操作它,都是一样的赢。】

科学的有效性,就应该像打电话一样,只要给出一个电话号码,无论是傻吊或天才有序的按下按键,都是一样的打通电话。

科学的操作性,就应该像用计算器、加减乘除一样,无论是傻吊或天才、无论时间或地点、只要计算同一道题,有序的按下按键,都会得出一模一样的计算结果。

博弈圣经著作人的经典名句;科学家的博弈功能,是让其傻吊与天才同等水平。人们等到纳什车祸身亡、也没有人等到纳什的“非合作博弈占优策略”,历史证明他就没有、所谓的占优策略。

博弈圣经著作人的经典名句;

——策略,是一个0、1、2、三维的文化私湍;

——策略,是在个体性质、私湍结构、实体特性的,三个分形中蠕动;

——策略,是博弈哲学、对粒子行为论的三维思考;

——策略,是私湍边际效应的运算、也是私湍边际常数1.007813短暂的显现;

——策略,是私湍边际常数、在飞秒瞬间搁浅凝固时,也就是占优策略(一个小目标)的终结。

美国学术传媒疯狂炒作,把纳什说成天才,吹捧了半个多世纪的纳什均衡,什么子博弈精炼纳什均衡,什么子博弈完美纳什均衡,什么非合作博弈策略、什么博弈占有策略,全世界经过半个多世纪的寻找、验证、竟然没有一个人找到赢的策略。“纳什均衡”它会是什么?它像UFO一样诡异、令人百思不解。“纳什均衡”的鬼魅让人想入非非,层出不穷的解释让人匪夷所思。纳什均衡荒唐的理论属性、确定了它是学术界丑闻的特征。纳什天才的“纳什均衡”,一定会沦为世界的一大笑柄。

1958年,从《财富》杂志、对纳什的炒作,把纳什评为新一代天才数学家中、最出色的人物之后,纳什就迅速赢得了荣耀。他到处讲学、演说,与各国大牌数学家会面,事业如日中天。

博弈圣经著作人的经典名句;电影《美丽心灵》用构思、杜撰的艺术形式、编造了纳什戏剧性的一生,“纳什均衡”像西方宗教的“经文”一样,演变成了博弈宗教传奇。诺贝尔经济学奖意外地、砸到纳什头上的那种巧合,给了纳什幸运的一生、羞羞答答的一生、不愿见人的一生、学术欺骗的一生、也是他难堪的一生。

博弈圣经著作人的经典名句;纳什均衡是半个世纪前,一个“驴唇不对马嘴”的概念,纳什之所以一直沉默,是因为他没法说,他不敢说,他到死都不会说。【来源:美国资讯网;麻省理工福布斯纳什-著名大学名人-正文-时间:2013-12-02,从博弈圣经著作人对纳什的嘲讽,到纳什2015年5月23号出车祸死亡,中间有一年半时间他没有作出回应。】

博弈圣经著作人的经典名句;纳什均衡,是黑暗中的教唆、无知中的误判、猎奇中的杂耍。

博弈圣经著作人的经典名句;几个(因为博弈论)获得诺贝尔经济学奖的得主、管理股票的炒股公司,因亏空、也关门大吉了。

瑞典皇家科学院、诺贝尔经济学奖委员会委员,斯塔尔说;纳什均衡是一个博弈取胜的幻想,他自己也不知道怎么均衡、不知道怎么单方占优、不知道怎么取胜。因此,纳什在世期间不会向世人做出博弈如何取胜的解释,所以他一直保持沉默。斯塔尔还说;我们今天,既然把纳什均衡带到公众面前,可以断定,未来一定会出现博弈的取胜理论,大家担心纳什均衡可能一败涂地,若干年后将变成一大丑闻。

来源:美国资讯网;麻省理工福布斯纳什-著名大学名人-正文-时间:2013-12-02

博弈圣经著作人对纳什的嘲讽

......。

纳什均衡 捕风捉影 以讹传讹 是什么玩意儿

博弈圣经著作人笑谈博弈论,人们在寻找一粒爆香的黄豆时,还不如老鼠能选择最近的路程。

《博弈圣经》中《人类未知的蓝色档案》一文给出了博弈论的定义:“我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成三维均衡的语文学理论,称为博弈论。”

博弈圣经著作人说;博弈论是青年人的毒品,是无知者的兴奋剂,是沉默者的摇头丸。

博弈圣经著作人对博弈、宗教、伟人,有过美妙的阐述

博弈圣经著作人说;博弈,是人与宇宙的宗教。博弈的使命是探索自然界里和思维世界里,所显示出来的崇高、庄严、不可思议的秩序。人们对宇宙,实体、知识、未知的神秘,以及对个体,性质、经验、已知的恐惧——产生了宗教。人们认识到,有些为我们所不能洞察的东西存在其中,感觉到有一种最原始的形式、最深奥的理性、最灿烂的壮美、所产生的博弈情感,构成了真正的宗教感情。没有宗教、没有信仰、没有博弈感情,就不会出现时代伟人。

博弈论就是 张冠李戴 捕风捉影 以讹传讹

【典故】讽刺博弈论的最高博弈水平;

有人问博弈圣经著作人,什么是博弈论。

他回答说;博弈论就是,一问、二答、三无知。

也就是说;问者无知、回答者无知、听者更无知。

有人追问,到目前为止,那么多博弈论图书,那么多作者,他们的最高博弈水平是什么?博弈圣经著作人一听就笑了;目前他们的最高博弈水平,就是想卖给你一本书,就想赢你一本书钱。

博弈圣经著作人通俗的谈菜鸟与金鸟

一个人想变得伟大,从一个菜鸟变成一个金鸟,就要利用国家实体特性造个金鸟笼。日后,就可以在媒体的报道中、绘声绘色地描述那个金鸟笼;他是某某大学院校、某某著名教授、某某首席科学家、某某诺贝尔奖得主、甚至某某政府官员,他就自然的钻进了金鸟笼。

博弈论理论,是停滞不前的理论,它是太过于急躁、太过于草率的理论。由于博弈论新奇、古怪、原始,一个“囚徒困境”的三维谜团像似神话,人们又错误的认为博弈论能够取胜,因此受到了人们盲目的吹捧和疯狂的参与。人们把博弈取胜的欲望作为动力,博弈竞争的欲望在远古就出现了,一个人有了欲望,就要有实现欲望的对象和博弈对局的背景,加上自己行为的结果,才能取得想要的东西。欲望的天性就是进行交往,建立行为二特性对局,就是博弈的合作。

《博弈圣经》赢的定义;赢不是大小、不是多少、不是均衡平衡、不是战略战术,而是在未来国正论的0、1、2,三维随机状态中,一粒期望的粒子(常数0.007813,也是私湍边际效应的一个小目标)优先达成。

赢也不是福,输也不是罪,输赢与均衡属于第三空地论的内容。

但明眼的人都能看得出,所谓那些自称的博弈专家抄来的无效理论、编成的一本本博弈论,就是张冠李戴、捕风捉影、以讹传讹,不管他从外国哪个地方抄来的,不管他抄了多少、编了多少本书、多少篇文章,究其低劣的学术品质,他仍然是一个菜鸟。

假如博弈论大师,走出那个金鸟笼,再靠讲课赚大钱,靠卖书赚小钱,靠博弈取胜策略赚不到一毛钱,他就是骗子,也许是一个罪犯。

更为讽刺的是,一本本博弈论著作,古老的内容千篇一律,里面没有几句精彩的话,没有几个经典的词,更没有定理、定律、定义和法则。至今一个个博弈论专家、矛盾论专家、概率论专家和外行知道得一样多。

以往经济学家为了降低风险,建议投资多元化,“不要把鸡蛋放在一个篮子里”,这种分散投资的经济思想,实在是经济学家对博弈取胜的无奈。《博弈圣经》在453节有一段风趣的表述:“我们根本不能完全理解大自然,或许人们不如老鼠在寻找食物时能选择最近的路程,那是大自然的拓扑几何图像的捷径。”

看看权威媒体上发表的理论文章,标题或者落款,都是什么什么单位(一个金鸟笼)、某某某人的大名(一个金鸟),即使有一个金鸟笼做背书、做包装,再看他那排列整齐错落有致的垃圾文章,如果只看外观不读内容,真像是一篇好文章出笼了,假如读者直接读内容,就会得出结论;理论文章就是破碎的八卦,假如他再发一篇文章,又是卜上一卦?文章的内容就是拼凑的垃圾、金鸟笼就是忽悠人、金鸟其实就是一个菜鸟。中国新领导人形容过“笼子政治”的概念,因此中国就是一个笼子政治,金鸟笼里豢养了很多菜鸟,(政治菜鸟、经济菜鸟、学术菜鸟、司法菜鸟、还有博弈论菜鸟等)。他们的罪恶,给中国百姓制造了无数的冤假错案和人间悲剧。(受害者等待机会,等新领导人依法治国的社会稳定了、等忠诚合格的人到位了、等到司法环境改善了,就开始用罪恶者的犯罪事实、向最高司法机关举报他,国家只要用法律的尺度、度量他,他一定是个罪犯。)

中国百姓很善良,面对、遍地强盗;面对、遍地流氓;面对、中共暴力机器;面对、公检法菜鸟的黑恶势力;面对、学术痞子的打压;都先忍耐着,别上访告状、上访就会倾家荡产。期盼着中国特色社会主义之后、中国实体社会的黎明……。博弈圣经著作人的经典名句;中国实体社会主义的民主与自由——民主是罪恶者的坟墓、自由是中国梦的故乡。

新领导人面临着,历代罪恶造成的、各种人间悲剧;中国特色社会主义制造的、冤民遍地;冤民到联合国上访、演绎了中国特色社会主义的国际景观;至今还遗留几个、无人触碰的雷区;新领导人开始了真正的国家思考,开始了全面依法治国的“谨慎变革”。所以新领导人说;把权力关进笼子里,就是先把菜鸟的权力关进笼子里……。

……。

囚徒困境现象告诉我们什么?

囚徒困境现象告诉我们:个人理性和集体理性之间存在矛盾,个人理性的正确选择会降低大家的福利。

如何摆脱“囚徒困境”

从所给条件,我们可以判断出该博弈为一个完全信息的静态重复博弈。(这肯定是个反复进行的重复博弈,因为单次的囚徒困境只会导致双方选择纳什均衡,即均不合作)

题设条件告诉我们彼此信息不透明也不能互相了解,我们将其理解为双方在每次决策之前是不能交流的,但是双方对于在上一轮次决策之后的得益是知道的,这就是完全信息,双方可以根据自己的选择和得益分析对方的选择及想法。

如果我们排除完全信息的假设,这道题应该是无解的。

既然双方知道博弈会进行多次,所以会觉得进行具有风险性的合作决策也无妨,当然这与博弈的次数也有关系。

当一方选择合作时,如果裁判告诉他这轮的得益是最好的得益,那么他便知道对方也选择了合作,如果裁判告诉他这轮他得到了比双方不合作时更差的收益,则他会明白对方选择的是不合作。

这个原理明白之后,我们就该讨论到底双方该采取怎样的策略原则去进行他们的策略选择从而使双方合作的机会增加。

答案是先人给出的,经过多年的计算机测试以及各种研究发现,

最优的策略叫做tit for tat,一报还一报策略。

即决策方在第一轮选择合作,其后每轮决策与对手的上轮决策相同,对手合作,我下轮就合作,对手背叛我下轮就背叛。

这样的报复性决策其实目的是为了警告对手,让对手趋于多选择合作。

说的比较粗略,例子也来不及举了,要睡觉了。

推荐你看冯诺依曼的《囚徒的困境》一书,其中对该问题有十分详细的叙述。

论述囚徒困境中两个囚徒之间的博弈过程(西方经济学)

囚徒困境可以简单的用图上的表格表示出来,

针对甲而言,如果乙选择了沉默,则对于甲而言,选择沉默是判罪一年,如果坦白,是立即获释;

如果已选择了认罪,则对于甲而言,选择沉默是判罪十年,选择坦白,是判罪一年。

因此,无论乙做何种选择,甲的最优策略只有选择坦白。

同理,无论甲做何种选择,乙的最优策略也只有选择坦白。

所以,囚徒困境的纳什均衡就是甲乙都选择坦白。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。该例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

关于囚徒困境,高手来!经典囚徒困境是2个选择,3个结果。有没有3种选择结果多至6个的囚徒困境博弈例

囚徒困境的关注点有两个。

1.存在强势策略。两人囚徒困境中,背叛属于强势策略,合作属于弱势策略。

2.都选择强势策略的收益低于都选择弱势策略的收益。

以上两点导致囚徒博弈的纳什均衡倒向都选择强势策略的结果。如果增加选择,整个博弈情况并没有太大改变,最强势的策略会被选择,而在这种情况下,总收益却小于都选择弱势策略。这就是囚徒所处的博弈困境。

囚徒困境博弈对经济学的意义

个人感觉囚徒困境的博弈分析是给大家展示了一个纳什均衡与直观的最优相背的现象,当大家都考虑自己利益最大化的时候,双方利益都受损,这与微观经济学中大家都将自己利益最大化时总体利益也最大是相背的。这种现象提供给经济学更多的解释与思考空间,比如怎样避免囚徒困境啊,合作啊,遵守协议啊等等。不过我觉得出了经济学,这个意义更大,毕竟经济人假设只是人的一面,不是全部,不该由完全的经济视角来解读人性。

相关阅读

  • 囚徒困境的意思,囚徒困境是什么意思???

  • 囚徒困境是什么意思??? 在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在

热门文章

  • 孔子语录原文,孔子语录原文及翻译

  • 孔子语录原文及翻译 语文七年级下的 孔子语录 子曰:“学而时习之,不亦说(yuè)乎?有朋自远方来,不亦乐乎?人不知而不愠(yùn),不亦君子乎? 《学而》 曾子曰:“吾日三省(xǐng
  • 日语情话最暖心短句,日语暖心短句

  • 日语暖心短句 1、いくつになったら、オレは、何かに伤ついたり、凹んだり、あがいたりしなくなるんだ。 到了多少岁之后 ,我才能变得不会轻易地被某些东西伤害, 沮丧 ,旁徨失

最新文章

  • 囚徒困境的意思,囚徒困境是什么意思???

  • 囚徒困境是什么意思??? 在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在
  • 入洞房视频,秒怕闹洞房视频微信

  • 世上最污的闹洞房视频 额 这个太污了 建议楼主不要关注这些 思想容易产生混乱 打开衣服,进入洞房视频 …… 刚刚看了一个视频,是闹洞房的。不知道是哪里,也太恶心了吧。闹就闹
  • 比水还要干净的句子,经典语句、好句子

  • 经典语句、好句子 七堇年: 《大地之灯》 因为是血肉相连的亲人,所以许多话反而成了禁忌。交流是耻辱,亲近是羞耻,惟有通过相互苛求和中伤来表达对彼此的爱,才是理所当然,这是多么
  • 沉默的语言,作文《沉默是最好的语言》600字

  • 作文《沉默是最好的语言》600字 思想家说:沉默是一种美德。 教育家说:沉默是一种智慧。 是的,沉默与思索挛生。他是人深沉,而深沉的人更趋成熟。 是的,沉默即力量。它使人充
  • 名人名言大全经典,经典的名人名言

  • 经典的名人名言 1、自己选择的路,跪着也要把它走完。 2、世上没有绝望的处境,只有对处境绝望的人。 3、平凡的脚步也可以走完伟大的行程。 4、有志者自有千计万计,无志者只感