考虑这样的一个问题:
一个铲屎官有三只猫猫🐱。有一天,铲屎官买了两种颜色的项圈(橙色和蓝色),给主子们带上。然而,主子们并不知道自己被戴上的是什么颜色的项圈,而且每只猫猫的项圈颜色是铲屎官完全随机选择的。每只猫只能看到另外两只猫猫的项圈颜色。这时,铲屎官让猫猫各自猜测自己的项圈颜色(同时说出猜测),或者也可以选择不进行猜测。如果三只猫猫中至少有一只猜对了,且没有猫猫猜错的话,就可以得到一把小鱼干🐟。在戴上项圈之后,猫猫们之间就不能交流了,但是他们可以在开始之前进行讨论。
能否帮主子们设计一个策略,使得他们吃到小鱼干的可能性最大?
直觉上来说,由于给每只猫分配什么颜色的项圈都是独立的,似乎看到其他猫的项圈颜色对于猜测自己的项圈并没有什么帮助。由于每只猫猜对和猜错的概率为0.5,因此看起来猫猫们能够吃到小鱼干的概率并不会大于0.5。
假如猫猫们没有策略,完全随机地选择三种选择中的一种,他们吃到小鱼干的概率为:
\begin{aligned}\text{P}(吃到小鱼干!)&=C_3^1(\frac{1}{3})(\frac{1}{3})^2+C_3^2(\frac{1}{3})^2(\frac{1}{3})+C_3^3(\frac{1}{3})^3\\ &=\frac{7}{27}\\ &\approx0.259 \end{aligned}
即成功的概率为:一只猫猜对+两只猫猜对+三只猫猜对。
但实际上,当对于独立的事件进行整体地考虑时,会发生一些有趣的事情。
我们来看这样的一个策略:
对于每只猫,假如ta看到另外两只猫的项圈颜色是一样的,则猜测与这种颜色相反的颜色;假如ta看到另外两只猫的项圈颜色不一样,则不进行猜测。
这样吃到小鱼干的概率是多少呢?所有可能的情况如下:
仔细观察会发现,有两只猫的项圈颜色一样,而剩下那只猫的项圈颜色与他们不一样,这样的情况在8种情况中占了6种!这样一来,按照上面的策略,除了三只猫的项圈颜色一样(全为蓝色和全为橙色)的两种情况下会猜错,其他情况猫猫们都能吃到小鱼干!此时我们成功的概率为:
\text{P}(吃到小鱼干!)=\frac{6}{8}=0.75
3/4的成功概率比随机猜测要大多了!猫猫们的小鱼干有着落了!
猫猫们望着你——还有没有更好的策略呢?其实是没有了,这一策略给出的成功概率是最大的。但是猫猫们不信。
你耸了耸肩,那让我们证明给猫猫们看。
证明1:
对于任何一个确定的策略,由于给每只猫猫的项圈都是完全随机地分配的,因此不管这一策略让每一只猫怎样进行猜测,猜对的概率总是1/2。所以,对于每一只猫,其给出错误猜测和正确猜测的数量的期望是相同的。因为期望是线性的,所以对于三只猫组成的整体来说也是如此。假如我们定义随机变量g_c和g_i来分别代表正确猜测的数量和错误猜测的数量,那么对于三只猫的整体,这两个变量对应的期望值\text{E}[g_c]和\text{E}[g_i]是相等的。如果这个策略成功的概率为p,那么我们有
p\leq\text{E}[g_c]=\text{E}[g_i]\leq3(1-p).
这个等式中,左边的不等式是因为任何一个成功的局面(三只猫给出的猜测)中,必须至少有一个正确的猜测;而右边的不等式是因为①任何一个成功的局面中没有错误的猜测,且②其他情况下最多只能有3个错误的猜测。
因此我们得到
p\leq3(1-p)\\ p\leq\frac{3}{4}
猫猫们听得有点晕,摇了摇头,让你说人话。你低头沉思了一会,给出了第二个证明。
证明2:
由于项圈的颜色只有两种,有计算机专业の直觉的同学们可以很快地想到能够用0和1来表示这两种颜色。因此所有的情况可以用0和1组成的长为3的码字(word)来表示,即
{000,001,010,011,100,101,110,111}
我们将猫猫们进行编号,从1到3. 那么码字中的第i个位置就代表了第i号猫猫的项圈颜色。而我们把代表了真实情况的码字叫做真码字(true word)。对于第i只猫猫来说,因为它可以看到另外两只猫的项圈颜色,因此它能够确定除i位之外剩下两位的数字是0还是1. 因此,在猫猫i的角度来说,它作出的猜测可能是0或者1,对应着两个在第i位相反的码字,我们将这两个码字叫做猫猫i的一致码字(consistent words)。
给出一个固定的策略,就意味着对于每一对一致码字,我们都会决定是否给出猜测。而如果给出猜测,则要决定在这一对码字之中选择哪一个。这意味着一种策略可以用一个有向图G来表示。其中,图的每个结点都是一种可能出现的情况(即一个码字)。当且仅当两个结点可以作为某种情况下的一对一致码字时,这两个结点之间才有边。
给出一个策略和其对应的图G,假设这个策略应用在真码字u所代表的实际情况中。猫猫们成功吃到小鱼干的情况对应于是否存在猫猫能够从一对一致码字中选择真码字u,同时没有猫猫会放弃码字u而选择一致码字中的另外那个码字。对于这对应的有向图G来说,一个策略如果在真实情况u下能够成功,就意味着存在边指向u(所代表的结点),同时不存在从u指出的边(即结点u的入度大于零,且出度等于零)。
至此,我们成功地把给猫猫们的猜测策略转换为了一个有向图中边的方向的指派问题。有向图中结点u和v之间的边,可以从u指向v或是从v指向u,也可以没有方向(代表不进行猜测)。由于每一种可能出现的真实情况都在图中有一个对应的点,因此一种策略成功的概率等于其对应的图中满足入度大于零且出度等于零的结点所占比例。要让成功的概率尽可能地大,就是让这样的结点的数目最大化。很容易想到,因为一个结点只要出度大于0,其所代表的情况就会失败。因此我们会尽可能地把所有出度大于0的情况集中在少数几个点之上,才能让出度为0的点尽可能地多。而每一个结点最大的出度为3. 因此,选择两个相隔最远的结点,使它们的出度为3,就能够让满足成功条件的结点所占比例最大。
这就对应着我们之前提出来的策略。举个栗子🌰:假如实际情况为010,2号猫猫将看到另外两只猫猫的情况都为0,那么2号猫猫做出判断,真实情况可能为000或者010. 而按照我们的策略以及上图中000结点和010结点之间边的方向,2号猫猫应该选择使得情况为010的猜测,即做出猜测1.
当然,实际上选择这样的策略也是一样的。
猫猫们点了点头,表示满意。
但我们一开始的直觉为什么会出错呢?实际上猫猫们能够吃到小鱼干的概率并不会大于0.5这一直觉并没有错。这里之所以能够得到大于0.5的概率是因为我们允许不确定的猫猫不给出猜测。而如果每只猫猫都必须给出自己的猜测且全部都要猜对,那么成功吃到小鱼干的概率确实不会大于0.5。问题的变种还有很多:要求猫猫们全部做出猜测且全对才能成功,所有猫猫做出猜测且至少有一只猫猫猜对等等。
目前我们讨论的都是3只猫猫的情况,那如果有5只、7只或者n只猫猫呢?
为了给出更大规模问题的解,我们引入一些编码理论(coding theory)的概念。汉明距离(Hamming distance)\text{d}(u,v)代表两个相同长度的码字之间相异的位数。中心为u的单位球(unit ball)为所有和u长度相等,且和u至多有一个位置符号不同的码字集合。也就是集合
\{v:\text{d}(u,v)\leq1\}.
单位球的表面(surface)就是移除了中心u之外的单位球。
在我们的问题中构造出的图里,一个结点w的所有邻居就是中心为w的单位球的表面。对应地,我们之前给出的策略可以写成:只有结点000和结点111的有出边,且这两个结点都分别指向以其为中心的单位球的表面上的所有结点。
这一简单的策略对于n大于3的情况也同样适用。对于所有长度为n的码字,选择一个子集C,令所有在C中的结点(码字所对应的结点)指向以该点为中心的单位元的表面上所有不在C中的结点。如果我们选择了一个集合C,其中C中码字的单位球两两互不相交,则这些单位球的表面上的所有结点都满足入度大于零且出度等于零这一要求。怎样让这样满足要求的结点数量最多呢?当C中码字的单位球构成所有长度为n的码字集合的划分的时候,这样的结点是最多的。能够构成这样的划分的码字集合在编码理论中被称为完美一位纠错码(perfect one error correcting codes)。
而借用编码理论中的证明,当n=2^k-1,且k是一个大于零的自然数时,存在长度为n的完美一位纠错码[1][2]。因此,我们只要有一个长度为n的完美一位纠错码,就可以对应地给出相应的策略。而这样的集合C中码字(结点)所占的比例为1/(n+1),因为它们的单位球构成所有码字集合的划分,且每一个球都由一个中心结点和n个在表面上的结点组成。(长度为n的码字中,对于其中一个码字,有n个码字和它只有一位不一样。)因此,在有n只猫猫的问题中,按照这样给出的策略,猫猫们成功吃到小鱼干的概率为1-1/(n+1)。
这个听起来很高端的完美一位纠错码是什么呢?其实就是对于长度为3的码字,当编码集合为{000,111}时,假如传输时其中有一位出错了,我们也能够找出正确的码字。因为在长度为n的完美一位纠错码的编码集合C中,对于长度为n的任何一个码字w,都有且仅有一个编码c属于C,且满足\text{d}(w,c)\leq1。而满足条件的这个编码c就是错误发生之前的原编码。
注:其实这个问题的正统形式是猜帽子问题或者囚徒问题,这里尝试换了一种叙述方式w。这个问题的提出本来是用来说明the problem of autoreducing random sequence,但是由于其有趣的puzzle形式引起了许多关注。这个问题还有很多很多不同的变种,有兴趣的同学可以看看[3]。
参考文献:
- Ebert, Todd & Merkle, Wolfgang & Vollmer, Heribert. (2002). On the Autoreducibility of Random Sequences. SIAM J. Computing. 32. 10.1137/S0097539702415317.
- J.H. VAN LINT, Introduction to Coding Theory, 3rd ed., Springer-Verlag, Berlin, 1999.
- Hardin, Christopher & Taylor, Alan. (2013). The mathematics of coordinated inference. A study of generalized hat problems. 10.1007/978-3-319-01333-6.
更多:
发现了两个有趣的帖子,也是讨论这个问题: