三门问题与贝叶斯公式

三门问题与贝叶斯公式

By Z.H. Fu

切问录 www.fuzihao.org

三门问题

三门问题是一个很出名也受到了很多争议的问题,这个问题出自美国的电视游戏节目Let’s Make a Deal。问题名字来自该节目的主持人蒙提·霍尔(Monty Hall)。参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机率?

关于这个问题有两个思路,看起来都很有道理,然而却得出了截然不同的结论,我们先来看一下两种解法。

  1. 主持人排除了一个门之后,还剩两个门,随便选哪个都是$\frac{1}{2}$;

  2. 选手选择的那扇门的概率是$\frac{1}{3}$,而主持人手上的门打开后,那$\frac{1}{3}$的概率就跑到另一个门上了,所以另一个门的概率是$\frac{2}{3}$。

这两个思路看着都有道理,可是为什么会出现两个截然不同的答案呢?其实,问题出在题目里面,题目并没有说主持人是任意选择了一个门,还是只选择空门。玩了一个语言上的trick,把一个很重要的隐含假设一语带过,大家各自采用了自认为显然的隐含假设,便导致了两种不同的结果。我们先介绍一下贝叶斯公式,再用贝叶斯公式理解下这两种思路。

贝叶斯公式

贝叶斯公式是关于条件概率的公式,假设我们有两个事件$A$和$B$,我们可以根据$A$在$B$下发生概率去求得$B$在$A$下发生的概率。其公式表述为:
$$P(A|B)=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|\overline{A})P(\overline{A})}$$
其中$\overline{A}$表示$A$不发生的概率。

三门问题的贝叶斯表述

假设我们的选手选择了盒子$A$。如果主持人是随机选了一个盒子$B$,$P(A)$表示$A$有东西的概率,$P(\overline{A})$表示$A$没有东西的概率,选手面临的问题用贝叶斯公式描述为:
$$P(
A|\overline{B})=\frac{P(\overline{B}|A)P(A)}{P(\overline{B}|A)P(A) + P(\overline{B}|\overline{A})P(\overline{A})}$$
即在$B$没东西的条件下,$A$有东西的概率。我们来看不同的解释下的差异:

  1. 主持人随意选择一个门
    在这种情况下我们有:
    $P(A)=\frac{1}{3}$;
    $P(\overline{B}|A)=1$(若$A$有东西,那么$B$一定没有东西);
    $P(\overline{A})=\frac{2}{3}$;
    $P(\overline{B}|\overline{A})=\frac{1}{2}$(若$A$没有东西,那么$B$没有东西的概率为二选一)。
    带入到上面的公式得
    $$P(
    A|\overline{B})=\frac{1\times\frac{1}{3}}{1\times\frac{1}{3} + \frac{1}{2}\times\frac{2}{3}}=\frac{1}{2}$$
    可见,如果主持人只是随便选了一个门的话,那么剩下的两个门概率是一样的,因为主持人并未引入额外的信息。我们再来看第二种情况。
  2. 主持人选择一个没有东西的门
    $P(A)=\frac{1}{3}$(和上面相同);
    $P(\overline{B}|A)=1$(和上面相同);
    $P(\overline{A})=\frac{2}{3}$(和上面相同);
    $P(\overline{B}|\overline{A})=1$(主持人一定会选一个没有东西的门!)。
    带入到上面的公式得
    $$P(
    A|\overline{B})=\frac{1\times\frac{1}{3}}{1\times\frac{1}{3} + 1\times\frac{2}{3}}=\frac{1}{1}$$
    可见,如果主持人知道哪个门没有东西,这时候选手手上的门里有东西的概率只有$\frac{1}{3}$,为了增大或升级率,他一定要换一个门。

拓展

另一个类似的题也是这样的:一对夫妇先后生了两个孩子,其中一个孩子是女孩,问另一个孩子是女孩的概率有多大?

$A$:女孩个数
$B$:其中一个是女孩
我们可以选算出$A$的分布为:
$$P(A=0)=\frac{1}{4};P(A=1)=\frac{1}{2};P(A=2)=\frac{1}{4}$$
下面来计算$A$在$B$下的条件分布,由于对“其中一个孩子是女孩”这句话理解不同,分两种情况来理解。

  1. 如果$B$是任意选一个孩子是女孩,那么:
    $$P(B|A=0)=0;P(B|A=1)=\frac{1}{2};P(B|A=2)=1$$
    从而,另一个是女孩的概率等于女孩个数为2的概率,其分布为:
    $$P(A=2|B)=\frac{P(B|A=2)P(A=2)}{P(B|A=0)P(A=0)+P(B|A=1)P(A=1)+P(B|A=2)P(A=2)} $$
    $$= \frac{1\times\frac{1}{4}}{0\times\frac{1}{4}+\frac{1}{2}\times\frac{1}{2}+1\times\frac{1}{4}} $$
    $$= \frac{1}{2}$$

  2. 如果$B$是至少有一个孩子是女孩,那么:
    $$P(B|A=0)=0;P(B|A=1)=1;P(B|A=2)=1$$
    从而,另一个是女孩的概率等于女孩个数为2的概率,其分布为:
    $$P(A=2|B)=\frac{P(B|A=2)P(A=2)}{P(B|A=0)P(A=0)+P(B|A=1)P(A=1)+P(B|A=2)P(A=2)} $$
    $$= \frac{1\times\frac{1}{4}}{0\times\frac{1}{4}+1\times\frac{1}{2}+1\times\frac{1}{4}} $$
    $$= \frac{1}{3}$$

综上,如果是随机选一个孩子是女孩的话,另一个孩子为女孩的概率为$\frac{1}{2}$,如果是至少有一个女孩的话,另一个孩子为女孩的概率为$\frac{1}{3}$。

总结

这类问题的关键就在于大家对题目中的某句话持有不同的理解。更巧妙的是,这两种解法的下游(如何计算概率)更能引起大家的讨论,大家争论的地方是在这个理解的下游,所以题目却是用了一个很trick的手段,玩了一个文字游戏。