生活中的统计

您当前的位置: 首页 > 生活中的统计

赌徒谬误的统计解析——一个事件发生两次与一件事再次发生的概率

时间:2015-09-18

 

 

  人类先天就对不确定性事物感到困惑,因其难以把握和预测,往往把随机结果看成是某种神秘力量的作用。古代先哲执着并擅长于通过逻辑和公理证明来获取真理,却没能概括发展出最基本的概率理论,人们对概率理论的探讨直至17世纪中叶才初现端倪,真正将概率理论应用于对大量随机现象进行系统研究的统计学,是近百年发展起来的学科。尽管随机性的基本原理产生于日常的逻辑,但其导致的许多后果是违反直觉的,应用不慎就会造成许多判断失误、决策失当,概率统计中的“赌徒谬误”就是典型的一例。

 

  “赌徒谬误”及其表现所谓“赌徒谬误”是指根据某事件近期发生情况,而觉得某个具有确定发生概率的事件,其发生的可能性是增加或减少了。即人们在预测未来时倾向于把过去的表现作为判断的依据,也就是根据事情最近是否发生过,而认为它应该更可能或更不可能发生。这是人们习惯性地误解随机事件的惯常表现。“赌徒谬误”就是一个简单例证,指错误地相信既然一个硬币已连续抛出几次正面,那么下一次抛出反面的可能性会增大。千万不要这样认为,这正是“赌徒谬误”的表现,即使对方一连掷出8次、10次正面,下次掷出反面的可能性大小(概率)仍为对半(0.5)。

 

  “赌徒谬误”在现实生活中的表现比比皆是,当你看到邻居家一连生了4个女孩后是否觉得再生一胎是男孩的可能性会更大?人们总是期待好运气出现在坏运气之后,有人在买大乐透彩票时总是盯着历史上出现次数最少的号码买,这便是例证。彩民从30个号码中选取7个的所有方法是2035800种,并且每一种的概率都是相同的,比起选取123456715913172125等看起来有规律的号码,绝大多数彩民更愿意选取看上去更无规律且更随机的36712192327等彩票,这种现象背后同样体现着“赌徒谬误”的影响。

 

  “赌徒谬误”的认识根源美国著名演讲家、幽默作家阿蒂默斯•沃德(ArtemusWard)指出:“令我们身陷困境的不是那些我们不懂的事,而是那些我们自以为理解的事。”“赌徒谬误”就印证了这一点,从认识论角度看产生“赌徒谬误”的根源主要来自对概率统计原理的误解。

 

  1.对独立事件概率的误解。在我们周围的现实世界中每时每刻都在发生着随机事件,大多数情况下它们之间是没有任何关联的独立事件,即一个事件的发生与否不会影响另一个事件的发生,如连续掷硬币前后正反面的出现就是相互独立的事件。概率原理告诉我们,两个独立事件发生的概率等于两者各自发生概率的乘积,这称为概率的乘法法则。用公式表示为:P(AB)=P(A)P(B),乘法法则也适应于多个独立事件。如掷硬币时(记正面为1反面为0)连续3次出现正面即出现“111”时的概率为0.5×0.5×0.5=0.125,同样当出现000001010011100101110等特定情况时其概率也均为0.125

 

  “赌徒谬误”犯的错误在于混淆了一个事件发生两次(或多次)的概率与一件事再次发生的概率。即使你已经一连9次掷出的硬币都是正面朝上,下一次掷硬币也不可能增加出现反面的可能性,出现正反面的可能性还是均等的。

 

  2.对统计大数定律的误解。所谓大数定律是指当随机试验次数足够多时,某事件出现的频率将无限接近于该事件发生的概率。这是瑞士数学家雅各布•伯努利(JokobBernoulli)利用极限思想来处理概率与随机事件结果之间关系20年的研究结果,首次以严格的数学形式表达了概率的频率稳定性。以掷硬币为例,在进行了足够多的硬币投掷后,正反面各占50%的情况就会出现,但在有限的投掷情况下即便是做上千次、上万次也很难出现正反面正好各占50%的情况(历史上的确有人进行过这样的投掷试验)。“赌徒谬误”在利用大数定律时犯的一个错误是他们不仅希望掷硬币正反面等概率的情况能在一个长序列中时常出现,也希望能在一个长序列的局部区域或短序列中出现。如果10次抛掷硬币人们就会不自觉的期待正反面大体各有5次(当然这也完全符合伯努利二项分布原理),且相对来说正反面要间隔出现,若出现大的偏离人们就会感到不可思议。其实仅通过几次有限的投掷,结果更可能是不均衡的正反面分配比例,因为现实中不存在小数定律。在此类问题上出人意料的是,绝大多数人并不会意识到,随机事件有时看起来是出奇的有顺序。概率统计的真谛在于随机事件的单体具有不可预测性,而反映群体的频率具有统计稳定性。

 

  随机事件连续发生的概率解释为说明问题方便,以掷硬币为例。在掷硬币赌输赢的游戏中,当正面(或反面)连续几次出现后,人们就会感到无法理解,甚或想到意念、魔法、魔力等根本不存在的东西,并有“他的运气快到头了”“该轮到我了”之类的想法,其实在正反面确切值方面硬币都会表现的非你所愿。

 

  由概率原理得知,在一系列掷硬币结果序列中,我们期待从某给定点开始至少连续出现x个正面(或反面)的概率为0.5x,若对于这样的序列存在m个可能的起始点,则出现至少连续x次正面的平均串数是m0.5x串。例如,若有16个可能的起始点,则可期望出现序列长度至少是4的正面有1串,同样出现连续反面长度至少是4的也是1串;在连续20次掷硬币中,对于连续出现4次相同结果的连串有17个可能的起始点,正反面都算在内就会出现平均串数稍大于2串,所以长度为4的串是很可能出现的。一般地我们有如下结论:若连续n次掷硬币,那么期望最长串的正面或者反面的长度略大于以2为底n的对数。例如,连续掷32次硬币,则可期待至少出现5个正面或者反面的序列。如果你有耐心掷上1000次硬币,那么在某处连续出现10个正面或者反面,请你不要感到惊讶。

 

  综上所述,某些非凡的事情可以在没有非凡的原因时发生,一个过程本身是随机的,并不同于这个过程产生的结果看起来是随机的。“赌徒谬误”的产生除对概率统计原理的误解外,还与这种误解影响下的心理认知偏误有关。随机事件往往看似非随机,在解释世事时必须注意不能把两者相混淆。当今社会已进入大数据时代,迫切需要我们掌握基本的概率统计知识去顺应时代潮流,理性地认识现实世界,更好地实现决策的科学性。(作者:胡顺奇/山东枣庄学院)