三门问题与贝叶斯公式

By Z.H. Fu
切问录 www.fuzihao.org

三门问题

三门问题是一个很出名也受到了很多争议的问题,这个问题出自美国的电视游戏节目Let’s Make a Deal。问题名字来自该节目的主持人蒙提·霍尔(Monty Hall)。参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机率?

关于这个问题有两个思路,看起来都很有道理,然而却得出了截然不同的结论,我们先来看一下两种解法。

  1. 主持人排除了一个门之后,还剩两个门,随便选哪个都是\(\frac{1}{2}\)

  2. 选手选择的那扇门的概率是\(\frac{1}{3}\),而主持人手上的门打开后,那\(\frac{1}{3}\)的概率就跑到另一个门上了,所以另一个门的概率是\(\frac{2}{3}\)

这两个思路看着都有道理,可是为什么会出现两个截然不同的答案呢?其实,问题出在题目里面,题目并没有说主持人是任意选择了一个门,还是只选择空门。玩了一个语言上的trick,把一个很重要的隐含假设一语带过,大家各自采用了自认为显然的隐含假设,便导致了两种不同的结果。我们先介绍一下贝叶斯公式,再用贝叶斯公式理解下这两种思路。

贝叶斯公式

贝叶斯公式是关于条件概率的公式,假设我们有两个事件\(A\)\(B\),我们可以根据\(A\)\(B\)下发生概率去求得\(B\)\(A\)下发生的概率。其公式表述为: \[P(A|B)=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|\overline{A})P(\overline{A})}\] 其中\(\overline{A}\)表示\(A\)不发生的概率。

三门问题的贝叶斯表述

假设我们的选手选择了盒子\(A\)。如果主持人是随机选了一个盒子\(B\)\(P(A)\)表示\(A\)有东西的概率,\(P(\overline{A})\)表示\(A\)没有东西的概率,选手面临的问题用贝叶斯公式描述为: \[P( A|\overline{B})=\frac{P(\overline{B}|A)P(A)}{P(\overline{B}|A)P(A) + P(\overline{B}|\overline{A})P(\overline{A})}\] 即在\(B\)没东西的条件下,\(A\)有东西的概率。我们来看不同的解释下的差异:

  1. 主持人随意选择一个门 在这种情况下我们有: \(P(A)=\frac{1}{3}\)\(P(\overline{B}|A)=1\)(若\(A\)有东西,那么\(B\)一定没有东西); \(P(\overline{A})=\frac{2}{3}\)\(P(\overline{B}|\overline{A})=\frac{1}{2}\)(若\(A\)没有东西,那么\(B\)没有东西的概率为二选一)。 带入到上面的公式得 \[P( A|\overline{B})=\frac{1\times\frac{1}{3}}{1\times\frac{1}{3} + \frac{1}{2}\times\frac{2}{3}}=\frac{1}{2}\] 可见,如果主持人只是随便选了一个门的话,那么剩下的两个门概率是一样的,因为主持人并未引入额外的信息。我们再来看第二种情况。
  2. 主持人选择一个没有东西的门 \(P(A)=\frac{1}{3}\)(和上面相同); \(P(\overline{B}|A)=1\)(和上面相同); \(P(\overline{A})=\frac{2}{3}\)(和上面相同); \(P(\overline{B}|\overline{A})=1\)(主持人一定会选一个没有东西的门!)。 带入到上面的公式得 \[P( A|\overline{B})=\frac{1\times\frac{1}{3}}{1\times\frac{1}{3} + 1\times\frac{2}{3}}=\frac{1}{3}\] 可见,如果主持人知道哪个门没有东西,这时候选手手上的门里有东西的概率只有\(\frac{1}{3}\),为了增大或升级率,他一定要换一个门。

拓展

另一个类似的题也是这样的:一对夫妇先后生了两个孩子,其中一个孩子是女孩,问另一个孩子是女孩的概率有多大? 令 \(A\):女孩个数 \(B\):其中一个是女孩 我们可以选算出\(A\)的分布为: \[P(A=0)=\frac{1}{4};P(A=1)=\frac{1}{2};P(A=2)=\frac{1}{4}\] 下面来计算\(A\)\(B\)下的条件分布,由于对“其中一个孩子是女孩”这句话理解不同,分两种情况来理解。 1. 如果\(B\)是任意选一个孩子是女孩,那么: \[P(B|A=0)=0;P(B|A=1)=\frac{1}{2};P(B|A=2)=1\] 从而,另一个是女孩的概率等于女孩个数为2的概率,其分布为: \[P(A=2|B)=\frac{P(B|A=2)P(A=2)}{P(B|A=0)P(A=0)+P(B|A=1)P(A=1)+P(B|A=2)P(A=2)} \] \[= \frac{1\times\frac{1}{4}}{0\times\frac{1}{4}+\frac{1}{2}\times\frac{1}{2}+1\times\frac{1}{4}} \] \[= \frac{1}{2}\]

  1. 如果\(B\)是至少有一个孩子是女孩,那么: \[P(B|A=0)=0;P(B|A=1)=1;P(B|A=2)=1\] 从而,另一个是女孩的概率等于女孩个数为2的概率,其分布为: \[P(A=2|B)=\frac{P(B|A=2)P(A=2)}{P(B|A=0)P(A=0)+P(B|A=1)P(A=1)+P(B|A=2)P(A=2)} \] \[= \frac{1\times\frac{1}{4}}{0\times\frac{1}{4}+1\times\frac{1}{2}+1\times\frac{1}{4}} \] \[= \frac{1}{3}\]

综上,如果是随机选一个孩子是女孩的话,另一个孩子为女孩的概率为\(\frac{1}{2}\),如果是至少有一个女孩的话,另一个孩子为女孩的概率为\(\frac{1}{3}\)

总结

这类问题的关键就在于大家对题目中的某句话持有不同的理解。更巧妙的是,这两种解法的下游(如何计算概率)更能引起大家的讨论,大家争论的地方是在这个理解的下游,所以题目却是用了一个很trick的手段,玩了一个文字游戏。