圣彼得堡悖论是决策论中的断兰一个悖论。圣彼得堡悖论是数学家丹尼尔·伯努利(Daniel Bernoulli)的堂兄尼古拉·伯努利(Nicolaus Bernoulli)在1738年提出的一个概率期望值悖论,它来自于一种掷币游戏,即圣彼得堡游戏。
设定掷出来自正面或者反面为成功,游戏者如果第一次投掷成功,得奖金2元,游戏结束;第一次若不成功,继续投掷,第二次成功得奖金4元,游戏结束;这样,游戏者如果投掷不成功就反复继续投掷,直到成功,游戏结束。如果第n次投掷成功,得奖金2的n次方元,游戏结束。按照概率期望值的计算方法,将每一个可能结果的得奖值乘以该结果发生的概率即可得到该结果奖值的期望值。游戏的期望360百科值即为所有可能结果的期望值之和。随着n的增大,以后的结果虽然劳培概率很小,但是其奖值越来越大,每一个结果的期望值均为1,所有可能结果热侵队责粒后民片诉斗国的得奖期望值之和,即游戏的期单笔热降刻鱼象镇紧文编望值,将为"无穷大"。按照概率的理论,多次试验的结果将会接近于其数学期望。但是实际的投掷结果和计算都表明,多次投掷的结果,其平均值最多也就是几十元。正如Hacking(1980)所说:"没有人列源愿意花25元去参加一往失互非妒良船环步一次这样的游戏。"这就出现了计算的期望值与实际情况的"矛盾",问题在哪里? 实际在游戏过程中,游戏的收费应该是多少?决策理论的期望值准则在这里还成立吗?这是不是给"期望值准则"提出了严峻的挑战?正确认识和解决这一矛盾对于人们认识随机现象、发展决策理论和指导实际决策无疑具有重大意义置草令算跑施余晶。
圣彼得堡悖论圣彼得堡问题对于决策工作者的启示在于,许多悖论问题可以归为数学问题,但它同时又是一个思维科学和哲学问题。悖论问题的实质是人类自身思维的矛盾性。从广义上讲,悖论不仅包括人们思维成果之间的矛盾,也包括思维成果与现实世界的明显的矛盾性。对于各个学科故欢钢多己别次求旧各个层次的悖论的研究,历来是科学理论发展的动力。圣彼得堡悖论所反映的人类自身思维的矛盾性,首先具有一定的哲学研究的意义;其次它反映了决策理论和实际之间的根本差别。人们总是不自觉地把模型与实际问题进行比较,但决策理论模型与实际问题并不是一个东西;圣彼得堡问题的理论模型是一个概率模型,它不仅是一种理论模型,而且本身就是一种统计的 "近似的"模型。在实际问题涉及到无穷大的时候,连这种近似也变得不可能了。
丹尼尔·伯努利对这个悖论的解答在1738年的论文里,提出了效用的概念以挑战以金额期望值为决策标准,论文主要包括两条原理:
1、边际效用递减原理:一个人对于财富的占有多多益善洲实领,即效用函数一阶导数大于零;随着财富的增加,满足程度的增加速度不断下降,效用函数二阶导数小于传料车黑难磁零。
2、最大效用原理:在风险和不确定条件下,个人的决策行为准则师两已卫是为了获得最大期望专门袁适析革他效用值而非最大期望金额刘每护程送套棉振充离践值。
圣彼得堡悖论的提出已有200多年了,所提出的消解方法大致可以归纳为以下几种观点:
Daniel Bernoulli在提出这个问题的来自时候就给出一种解决办法。他认为游戏的期望值计算不应该是金钱,而应该是金钱的期望效用,即利用众所周知的"期望效用递减律",将金钱的效用测度函数用货币值的对数来表示:效用=log(货币值)。所有结果的效用期望值之和将为一个有限值log(4)≈ 0.60206,如果这里的效用函数符合实际,则理性决策应以4元为界。这一解释其实并不能令人满意。姑且假定"效用递减料任永洲弦过物但四断交律"是对的,金钱的效用可以用货币值的对数来表示。但是如果把奖金额变动一下,将奖金额提高专值困气述静曲除换三线为l0的2n次方(n=3时,奖金为108),则其效用的期望值仍为无穷大,新的悖论又出现了 当然,我们并不清楚效用值与货币值之间究竟有什么样的关系,不过只要我们按照效用的2n倍增加奖金,悖论就总是存在。
边际效用递减论圣彼得堡悖论对于奖金额大小没有限制,比如连续投掷40次才成功的话,奖金为1.1万亿元。但是这一判术好南化足奖金出现的概率极小,1.1万亿次才可支晶成服策鱼乐静地八能出现一次。实际上,游戏有一半的机会,其罪真定州既奖金为2元,四分之采讲核阻三的机会得奖4元和2元。奖金越少,机会越大,奖金越大,机会越小。如果以前面 Ha北明新cking所说。花2随宽河眼死令叶5元的费用冒险参与责定游戏将是非常愚蠢的,虽有得大奖的机会,但是风险太大。因此,考虑采用风险厌恶因村素的方法可以消解矛盾。P取硫跟短ual Weirich就提出在期望值计算评造房坏握续中加入一种风险厌恶因子,振语消取政物害宽并得出了游戏费用的有限期望值,认为这种方法实际上解决了该悖论。
但是这种方法也并不十分完美。首先,并块培雨置总养章己非所有人都是风险厌恶的,相反有很多人喜欢冒险。如每期必买的彩票,以水些林良例及Casino(卡西诺)纸牌游戏,其价格都高于得建执胞然关增滑找执紧奖的期望值。你也可以民围用农转油了势攻几说这些喜欢冒险买彩票和赌博的人是非理性的,可他们自有乐趣,喜欢这样的证纪理低养造艺块吸式仅风险刺激。总之,风险厌恶的观点很难解释清楚实际游戏平均值非常有限的问题。退一步说,即便承认风险厌恶的观点,矛盾仍然不能消除。我们仍然可以调整奖金额,最后,考虑风险厌恶情况的期望值仍然是无穷大而与实际情况不符。
对前两种观点的反驳,我们采用了增加奖金额的方法来补偿效用的递减和风险厌恶,两者均是假定效用可以无限增加。也有一种观点认为奖金的效用可能有一个上限,这样,期望效用之和就有了一个极限值。Menger认为效用上限是惟一能消解该悖论的方法。设效用值等于货币值,上限为100单位,则游戏的期望效用为7.56l25,如表3所示。也许这里的效用上限太小了,不过我们可以任意选定一个更大的值比如225 。有多人如Russell Har-din (1982),W illiam G uNtaNon (1994),Richard Jeffrey(1983)等都赞成这样的观点。不过这种效用上限的观点似乎不太令人信服。效用上限与效用递减不同,或许你认为有225的钱够自己花的了,可是钱并不能给我们带来所有的效用,有些东西不是钱所能买来的。效用上限意味着再也没有价值可以添加了。但是一个人有了钱,还希望他的朋友、亲戚也像他一样富有;同一个城市里的人和他一样富有。而效用上限论认为到了这一上限他们就不用再做任何交易了,看起来这并不能成立。对有些人来讲,似乎期望和需求并不是无限增加的,对于现有的有限需求他们已经满足了。他们觉得这里的游戏期望效用值确实是有限的。不过是不是确实有这样的人还是一个不确定的问题,或者是个经验性的问题。但认为"越多越好"的人确实是存在的。对于决策准则这样的理性选择的理论,不能基于可疑的和经验性的判断而加以限制,因而期望有限论不足以消解这里的矛盾。
Gustason认为,要避免矛盾,必须对期望值概念进行限制,其一是限制其结果的数目;其二是把其结果值的大小限制在一定的范围内。这是典型的结果有限论,这一观点是从实际出发的。因为实际上,游戏的投掷次数总是有限的数。比如对游戏设定某一个投掷的上限数L,在投掷到这个数的时候,如果仍然没有成功,也结束游戏,不管你还能再投多少,就按照L付钱。因为你即便不设定L,实际上也总有投到头的时候,人的寿命总是有限的,任何原因都可以使得游戏中止。如今设定了上限,期望值自然也就可以计算了。
圣彼得堡悖论问题是,这已经不是原来的那种游戏了!同时也并没有证明原来的游戏期望值不是无限大。原来的游戏到底存在吗? Jeffrey说:"任何提供这一游戏的人都是一个骗子,谁也没有无限大的银行!"是说实际上没有这种游戏吗?恐怕这也不见的。如果我邀请你玩这种游戏,你说我实际上不是在这样做吗? 或者说我实际上邀请你玩的不是这种游戏而是另外的什么游戏? 很多游戏场提供许多概率极小、奖金额极大几乎不可能的游戏,他们仍然在经营、在赚钱,照样吃饭睡觉,一点儿也不担心哪一天会欠下一屁股债,崩盘倒闭。
Jeffrey在这样说的时候,实际上是承认了圣彼得堡游戏的期望值是无穷大了。认为游戏厅不提供这样的游戏,正是因为他们认为其期望值是无穷大,迟早他们会因此而破产倒闭。这正是用了常规的决策理论,而反过来又说这种游戏实际上不存在,应该排除在期望值概念之外。因此,用限制期望值概念的方法并不能消解悖论。
不能限制期望值概念的原因还有很多。比如,我们不能用限制期望值概念的方法仅把圣彼得堡游戏排除在外,而应该是通用的。在人寿保险中,有一个险种根据保险人的年龄,每长一岁给付一定的赔付金额。采用人类寿命的经验曲线给出每个年龄的生存机会。大于140岁的生存率已经没有经验可以借鉴,但可以采用一定的函数将生存年龄扩展至无穷大,当然其生存率趋向于零。注意到这里的给付金额也是无限的,但是其在期望值计算方面并没有出现什么问题。
《辞海》中的定义是:"一命题B,如果承认B,可推得非B,反之,如果承认非B,又可推得B,称命题B为一悖论。"可见,作为一种推理的矛盾现象,悖论是人们自己制造出来的。现已经有人证明,这种意义上的悖论是不存在的。一个命题是一个具有真假的判断语句,如果一个命题B和非B能够相互推出,则B要么是非真非假的单义句,要么是非真非假的多义句。所以,悖论作为人类思维系统的一种矛盾形式,它的消解必须从人们思维系统自身的矛盾性和不完善性着手,需要人类战胜和超越自己。历史上一次一次的悖论的消解,提出了更完备的公理系统,完善了人类的思维和科学系统,使得科学得到进一步的发展。圣彼得堡悖论也是一样。
综合上述悖论的消解观点,效用递减论符合了"边际效用递减律",能够在一定程度上解决实际问题,但是却绕开了问题的基本面。圣彼得堡游戏的期望值到底是多少并没有真正得到解决;风险厌恶论,犯了同样的错误,只不过是用风险因子替换了效用函数,实际上只是一种风险效用;效用上限论和结果上限论试图回避问题的无限性,篡改了原问题,自然也不可能解决问题。这些观点都是从实际出发的,但都没有触及人们的思维系统,不能冲破自己思想的牢笼,即便解决了这一悖论,又会有新的悖论出现。
从上述圣彼得堡悖论的消解方法来看,其效果都不是十分理想,都没有真正解决问题。但是正是这些努力,是我们认识到仅从实际出发是不能解决问题的,而最合理的解释就是- - 保留期望值的定义,调整我们的思维。当我们这样做的时候,圣彼得堡悖论就不再是一个悖论了!理论上期望值的计算没有什么错误,我们需要承认它的期望值是无穷大;而实际上它的均值又不可能是无穷大,因为它是样本均值,样本均值随着样本容量的增加,以概率收敛于其期望值。这都是正常的,它们本身就是应该有差距的!至于差距应该有多大,在小于无穷大的时候,样本均值随着实验次数的增多,越来越接近总体均值(或理论均值),圣彼得堡游戏不正是这样的吗?而在总体均值是无穷大的时候,我们如何让样本均值如何接近无穷大呢?非得是我们认为的很大很大吗?再大也不是无穷大,和当前也没有区别,我们平时的"大小"概念已经不适应了。涉及无穷大概念比较的时候,就需要用相应的比较方法。圣彼得堡游戏的结果集合是一个无穷集合,而实际实验的样本是一个有穷集合,它们是不能用现有的办法比较的。
圣彼得堡悖论利用电脑进行模拟试验的结果说明,实际试验的平均值- - 样本均值是随着实验次数的增加而变化的。在大量实验以后,其实验均值X可以近似表示为X≈logn/log2,可见当实验次数趋向无穷大的时候,样本均值也趋向无穷大。比如100万即106次实验的平均值约等于6/0.301=19.9,即 20元左右;要样本均值达到1 000元,实验次数就要达到10332,这时候有可能出现的最高投掷次数约为1000次左右,相应的最高赔付金额为 ,已经达到了天文数字了。如果随着实验次数趋向无穷大,趋向于无穷大的速度是慢多了。
虽然圣彼得堡游戏问题只是一个具体问题,但是类似的实际决策问题是存在的。它们起码是可观察的,其观察值确实也是存在的。而且它确实也给决策的期望值准则提出了挑战,所提出的问题需要我们给予解答。通过上述问题的消解,我们至少可以给出下列有关问题的答案和启示。
首先,理论上应该承认圣彼得堡游戏的"数学期望"是无穷大的。但理论与实际是有差别的,在涉及无穷大决策问题的时候,必须注意这种差别。其次,实际试验中随着游戏试验次数的增加,其均值将会越来越大,并与实验次数呈对数关系,即样本均值=log2(实验次数)=log(实验次数)/log2。
圣彼得堡悖论再次,实际问题的解决还是要根据具体问题进行具体分析。前面的圣彼得堡悖论消解方法都是很实用的方法。也--I以设计其他方法,比如可以运用"实际推断原理",根据实验次数n设定一个相应的"小概率",对于圣彼得堡问题来讲,是一个很实际的方法;或者建立一个近似模型,比如确定一个最大可能成功的投掷次数n,将投掷n+1次以后的概率设为1 / 2k,仍然符合概率分布的条件(所有结果的概率之和等于1)等等。
决策科学是一门应用学科,它的研究需要自然科学和社会科学的各种基础理论和方法,包括数学方法。这些方法都具有很强的理论性和高度抽象性。但是,决策科学更是一门应用性、实践性很强的学科,要求决策理论与决策实践紧密结合。因此,我们在决策理论的研究和解决实际问题的时候,应高度重视理论和实践的关系。理论模型的建立,既要源于实践,又不能囿于实践,发挥主观创造力,才能有所突破,有所建立。