生活不是掷骰子:理性决策的贝叶斯思维_刘雪峰_AZW3_MOBI_EPUB_PDF_电子书(无页码)_刘雪峰
内容节选
第4章贝叶斯定理的要素二:观测 4.1 什么样的证据可以扭转你的认知 我们在前面介绍了贝叶斯定理的第一个要素:先验概率。那么,当拿到证据以后,我们该如何扭转先验概率,让后验概率和先验概率有所差别呢?从公式 可以看出,要扭转先验概率,我们只能从“标准化的似然概率”入手,而要改变“标准化的似然概率”,靠的是里面的“观测”。 此外,不是所有的观测都可以扭转先验概率,要想让后验概率和先验概率有很大的差别,我们需要“信息量大”的观测。我们现在重点说说观测的信息量。 4.1.1 信息量大的观测 我们在日常生活中,经常会听人说:“哇,这个消息真的信息量大。”这里的“信息量大”,到底是什么意思呢? 某个消息的信息量,和它让人出乎意料的程度、改变认知的程度挂钩:越出乎意料,越能改变你的认知,那么这个消息的信息量就越大,反之就越小。所以说: 信息量=出乎意料的程度、改变认知的程度 例如,某公司现有一个副总的空缺,要在几个候选人之间选择。大家之前都看好资历深、业务能力也很强的老张。可是,突然有一天你的同事悄悄告诉你,另外一个并不被大家看好的小王被提拔了。 “小王被提拔”这个消息对你来说的信息量就很大,因为大大出乎你的意料。而如果最后是老张被提拔了,那么你听完之后并不会感到吃惊,因为这本来就是意料之中的事。 从贝叶斯定理的角度来剖析一下信息量,就可以看得更清楚。 假设当前的观测是A,那么在当前观测的前提下,某个原因H的后验概率P(H|A)的表达式为: 先验概率P(H),本质上是你拿到当前观测A之前对原因H的认知;后验概率P(H|A),是你拿到观测A之后对原因H的认知。 如果先验概率P(H)和后验概率P(H|A)之间的差距很大,说明观测A对你的认知调整幅度很大,那么,这个观测的信息量就很大。 出现下面两种情况,观测的信息量会很大: 第一,在先验概率很低的时候,可以让后验概率升到1的观测。 第二,在先验概率很高的时候,可以让后验概率降为0的观测。 我们分别来看看这两种情况。 1. 在先验概率很低的时候,可以让后验概率升到1的观测 在先验概率P(H)很低的时候,什么样的观测A可以让后验概率P(H|A)升到1呢? 这句话通俗的解释是:对于某个原因或假设H,如果你开始认为它发生的概率很低,但是当你观测到某个现象A之后,你立刻认为H的概率极高,这个观测A,就一定是一个信息量很大的观测。 大多数人脑子里的直觉是,一个可以完美地被H解释的观测A,可以让后验概率P(H|A)升到1。 举个例子,我们试图通过观察一个人身上的特点,来判断他在将来是否能成功。现在有两个假设,H=“成功者”,H-=“普通人”。那么,当我们从这个人身上观察到何种特点A,可以让我们认为这个人在将来极有可能成功呢?如图4.1所示。 图4.1 何种特点A可以让我们认为这个人在将来极有可能成功 很多人的直觉是,如果发现他身上有一个所有成功者都具备的特点,例如“坚韧不拔的毅力”“良好的沟通能力”“持续的学习能力”等,那么他就极有可能成功。 这个对吗?我们从数学上来分析一下。 所有成功者都具备的一个特点A,从概率的角度来说,就是P(A|H)=1,注意这是一个似然概率。那么,让P(A|H)=1的A,能否让后验概率P(H|A)=1呢? 我们看看贝叶斯定理的表达式: 注意,P(A)是这个特点A平均发生的概率。根据全概率公式,它可以在所有的原因上展开。对于我们的例子来说,原因只有两个:H(成功者)和H-(普通人),因此P(A)可以写成: P(A)=P(A|H)P(H)+P(A|H-) P(H-) 所以,后验概率可以写成: 把P(A|H)=1代入,我们得到: 很显然,对于观测A而言,单凭P(A|H)=1,无法让后验概率P(H|A)升到1。 那什么时候能让后验概率P(H|A)=1呢?我们可以看出,若此时公式(4-2)中P(A|H-)=0,则后验概率P(H|A)=1。 我们把P(A|H-)=0翻译一下,即这个特点A在所有的普通人中都没有。 所以,综合起来看,当我们从一个人身上观察到成功者的某个特点A时,并不能保证这个人在将来能成功,我们还需要一个条件:这个特点A在所有普通人身上都找不到! 因此,我们就可以看出社会上所谓“成功学”的底层问题了。 现在有很多和成功学相关的书籍和文章。这些文章大致的套路是这样的:先介绍一些经历艰难困苦、最终成就梦想的成功者,进而根据这些成功者的共有特点,总结出一套成功学的理论。总体来说,无外乎成功者需要具备几个特点:坚毅的性格、百折不挠的勇气、不怕失败的精神,以及独立思考、勤奋,等等。 很多文章里往往还会直接或间接地总结出一两句类似这样的话:根据对无数成功者的分析总结发现,成功可以复制,只要有样学样,你也可以成功! 成功学隐含了这样一种思维方式:因为成功者具备某个特点A,因此只要你有了A,那么......
- 信息
- 序
- 自序
- 第1章 无处不在的推理
- 第2章 贝叶斯定理
- 第3章 贝叶斯定理的要素一:先验概率
- 第4章 贝叶斯定理的要素二:观测
- 第5章 多个观测下的贝叶斯
- 第6章 在线贝叶斯估计
- 第7章 分层描述法
- 第8章 法庭上的贝叶斯:克拉克的审判
- 第9章 医学中的贝叶斯
- 第10章 网络时代的贝叶斯
- 总结和寄语
- 附录