《决战中途岛之贝叶斯定理大作战》

认真阅读下面的文章,并思考文末互动提出的问题,严格按照 互动:你的答案 格式在评论区留言,就有机会获得由清华大学出版社提供的优质科普书籍《什么是高中物理

1943年吉尔伯特和马绍尔群岛战役期间,美国海军SBD-5侦察机在华盛顿号和列克星敦号上空巡逻

介绍:贝叶斯统计和日本海军密码JN25

二战期间,美国和英国的密码分析师们都在竭力破译轴心国军队之间通信的密码。在这众多努力当中,位于布莱切利庄园的英国解码中心由于诞生了解码机“不列颠炸弹”(British Bombe)、破解了德国臭名昭著的恩尼格码密码机(ENIGMA)而闻名。在不列颠炸弹和后续的模型机如此瞩目的同时,我们不能忽略统计方法的支持。这篇文章就将要介绍其中之一——贝叶斯方法、以及它是如何破解轴心国密码的。

布莱切利庄园的1号小屋。摄影:Toby Oxborrow,来源:Flickr

这篇文章主要基于曾经在布莱切利庄园进行解码工作的爱德华·辛普森所写的文章,笔者会用更易懂和正式的表述以及一些数学公式对其进行转述,主要对贝叶斯方法如何破译了日本海军JN25密码进行了介绍。

贝叶斯定理

贝叶斯定理像其他出名的理论一样,惊人的简单:

这个公式本身很容易推导,而且在贝叶斯统计之外还有许多应用。然而,由于定理的大部分含义取决于对概率P涉及的概念的阐释,它并没有看起来那么简单。对于贝叶斯定理持续了几个世纪的争论,源于这个定理的用法挑战了更传统的频率论方法。当时所谓的频率学派将事件发生的概率定义为“多次试验下相关频率的极限”,而贝叶斯学派将概率阐释为个人主观信念衡量的结果。

提出这样质疑的大有人在:在数学理论当中怎么敢包含如此主观的内容?许多像费希尔、皮尔森这样德高望重的统计学家,都因为类似质疑而拒绝接受贝叶斯的概率阐释

为了理解两种方法之间的区别并做出合理的判断,我们来考虑下面这个例子:

假如一个朋友邀请你玩个抛硬币的游戏,并主动提供了一枚用在游戏中的硬币。在答应之前,出于怀疑的本能,你应该会质疑他递出硬币的公正性——比如两面落地的机会不同。

频率学方法

频率学派会将这个问题构造成一个假设检验,其中零假设代表硬币是公平的(两面落地机会相同),备择假设代表硬币不公平,再确定检验次数(比如次)和置信度1-α(比如),记录抛出硬币次每次的结果。如果用代表硬币正面朝上的次数,代表正面朝上的概率,按照二项分布可以获得一个这样的概率结果:

用置信度1-可以算出对应的拒绝域,意思是可以放心推翻零假设(也就是p=0.5)对应的k的区间,可以通过下式求解出k*:

还好过去关于这个问题人们已经进行了充足的运算,现在只需要在表格或是统计软件上查询出对应的k*=10,所以当|k-50|&10即k<40或k&60时,假设便不成立。

假设经过抛掷100次硬币,得出了k=73次正面的结果,于是频率学派终于可以认为硬币被动过手脚,而且这个结论出错的可能性(也就是α)不超过5%。

贝叶斯方法

但如果是贝叶斯学派,便会认为以上都是在“浪费时间”,问题本可以通过减少多次检验实现。在操作前,我们先回顾一下贝叶斯定理:

其中将变量A、B替换成了有明确含义的标记

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章