56星座屋
当前位置: 首页 星座百科

贝叶斯算法实例讲解(数据分析入门贝叶斯定理)

时间:2023-05-29 作者: 小编 阅读量: 2 栏目名: 星座百科

事实上,不懂贝叶斯定理不会让我们的生活崩塌,不会让我们的生活一团乱麻,但是一旦掌握了贝叶斯定理,在很多决策场景中,我们将会变得更加明智。然而事实并非如此,小明得病的概率仅有3.17%!检验为阳性的时候,小明患病的概率竟然只有3.17%!条件概率认识贝叶斯定理之前,我们有必要先了解下条件概率以及它的一些性质。无论事件A、B之间是否相互独立,这个等式都成立,它就是贝叶斯定理的基础。等式的前半部分就是贝叶斯定理的公式。

贝叶斯定理是什么,有什么用处?可能很多人都听过这个贝叶斯定理,却对它一知半解。事实上,不懂贝叶斯定理不会让我们的生活崩塌,不会让我们的生活一团乱麻,但是一旦掌握了贝叶斯定理,在很多决策场景中,我们将会变得更加明智。

今天我们将通过一个实际生活中的案例,用最通俗的方式帮助大家理解它。后续的话,我会为大家讲解如何用Python在实际案例中应用贝叶斯定理,感兴趣的朋友欢迎关注哦

小明到底有没有得癌症?

这是一个非常经典的案例,令人难以想象的是,很多时候一些医生的误诊竟是因为他们不懂贝叶斯定理!

考虑这样的场景,医生常通过某种血检来辅助判断病人是否罹患某种癌症。但是这种血检返回的结果并不是百分百的精准,当患者的确患病时,血检返回阳性的概率为98%;当患者没有患病时,血检返回阴性的概率为97%。已知有千分之一的人会得这种癌症。

现在小明做了这种血检,并且检测结果显示阳性,那么请问他得病的可能性大,还是没病的可能性大呢?

用直觉来判断,是不是第一反应就是小明大概率得了这种癌症了?

然而事实并非如此,小明得病的概率仅有3.17%!是不是非常难以置信?检验为阳性的时候,小明患病的概率竟然只有3.17%!现在应该很多同学不认可这个结果,那么接下来我们就看一下贝叶斯定理是个什么东西。

条件概率

认识贝叶斯定理之前,我们有必要先了解下条件概率以及它的一些性质。

条件概率是指在某些背景约束(或前提条件)下某事件发生的概率,比如令一名学生考上清华大学作为事件A,其概率为P(A),学生是女生作为事件B,其概率为P(B),那么在学生是女生的前提条件下,学生考上清华的概率就是P(A|B)。下面我们分别考虑事件A与事件B之间是否相互独立的情况。

  • 事件A与事件B相互独立:
  • 如果事件A和时间B是相互独立的,那么P(A)=P(A|B),无论B是否发生,对于事件A的发生没有影响,这时也有P(AB)=P(A)P(B),即事件A、B同时发生的概率是两个事件各自发生概率的乘积。
  • 事件A与事件B之间不相互独立:
  • 事件A、B同时发生的概率为P(AB),那么P(AB)=P(A|B)P(B)=P(B|A)P(A),也就是说两事件同时发生的概率为其中一个事件发生的概率乘以在该事件发生的前提下另一事件发生的概率。无论事件A、B之间是否相互独立,这个等式都成立,它就是贝叶斯定理的基础。
贝叶斯定理

从式(1)可以得知:

式(2)就是鼎鼎大名的贝叶斯定理了,我们来从另一个角度理解一下它的意义。我们用数据集D替换事件B,用假设H替换事件A,得到:

这就给我们提供了一种方法,可以根据数据集D的变化不断更新假设H发生的概率,这种方式被称作“历史诠释”。

  • P(H)可以理解为假设H发生的先验概率;
  • P(H|D)则可以理解为假设H发生的后验概率,是在我们获得了更多数据的情况下推断出的更先进的概率;
  • 我们每次获得的新知识,也就是后验的数据,都会作为下一次计算的先验数据;
  • P(D|H)可以被理解为似然度,也就是在假设H发生的情况下,数据分布刚好是D的概率;
  • P(D)则是在任何假设下数据分布刚好为D的概率,我们把它称为标准化常量。

那么我们现在来回头看小明是否得癌症的问题。

等式的前半部分就是贝叶斯定理的公式。而在后边计算P(阳性)的时候,可以看到我们用了两部分相加得到了P(阳性)。这里我们不得不介绍一下全概率公式:

拿我们这个例子来说,P(B)就是P(阳性),然而P(阳性)的数据我们无法直接获取,但是我们知道在患病和无病的条件下血检为阳性的概率,也知道患病和无病的概率,因此把患病情况下血检为阳性的条件概率乘以患病的概率,再加上无病情况下血检为阳性的条件概率乘以无病的概率,就是所有情况下血检为阳性事件发生的概率了,即:

那么最后我们给出完整的计算过程:

你学会了吗?有任何问题都可以在下方留言,我会一一回答!

    推荐阅读
  • 晏子使楚背景资料(晏子使楚已失传近千年)

    《晏子使楚》(已失传近千年,全网首发。)晏子使楚,至楚都鄢郢。偶植一老妪伏地而呼,其声哀而衰,闻之不忍,察行见者众,犹未有稍顿而助之者。使左右助立其身,问其故,妪谢而告之。留一人送家归,遂入宫。晏子携左右辞归。本打算立刻上交国家,奈何本市恰逢疫情。本人才疏学浅,仓促间难免有所疏漏,若发现有断句问题,以及标点使用错误等,请及时联系我进行修正。

  • 什么叫等价除权(金融术语什么是除权)

    除权,涉及两种情况,一种是指股票的发行公司依一定比例分配股票给股东,作为股票股利,此时增加公司的总股数,还有一种是指股票的发行公司向股东配股。凡在股权登记日拥有该股票的股东,就享有领取或认购股权的权利,即可参加分红或配股。除权日确定后,在除权当天,上海证券交易所会依据分红的不同在股票简称上进行提示,在股票名称前加XR为除权,XD为除息,DR为权息同除。

  • 普通家庭选瓷砖应该注意哪些(买瓷砖不要只关注价格)

    ⑴瓷砖生产地对于瓷砖生产地来说,目前主要有广东、福建、山东、江西、湖南、四川、辽宁等等,这其中最让人知道和了解的就是广东砖和山东砖。因为广东砖代表着价高、质量好,山东砖代表着价格实惠,质量也是可以的。⑶送货事项购买瓷砖后,通常来说商家是免费提供一次送货、搬运上楼的,同时作为业主只需要在家里等到验收和清点数量即可。

  • 闻讲左氏春秋爱之译文(闻讲左氏春秋爱之译文是什么)

    闻讲左氏春秋爱之译文译文:司马光字君实,陕州夏县人。司马光7岁时,已经像成年一样特别喜欢听人讲《左氏春秋》,了解其大意后回来讲给家人听。从此对《左氏春秋》爱不释手,甚至忘记饥渴和冷热。光生七岁,凛然如成人,闻讲《左氏春秋》,爱之,退为家人讲,即了其大指。自是手不释书,至不知饥渴寒暑。

  • 汽车长时间不开要注意什么(汽车久停不开该注意哪些问题)

    在长期停放前,可以洗一次车,避免污渍长期停留损坏车漆。汽车长时间停着不动,轮胎与地面接触的部分由于长期受力,容易出现龟裂和变形。

  • 小儿麻疹水痘出疹顺序(急疹湿疹风疹)

    其中上学或入托的小儿,一般可在家中隔离,家中如有其他未患过的水痘的小孩,应另择居住处或不与患者同住一房间。6个月内婴儿因有来自母亲的抗体,所以发病者少。6个月以内的婴儿由于具有通过母体获得的被动免疫力,一般较少发病。常见于出生6个月至1岁左右的宝宝。

  • 有车没货怎样才能找到货源啊(还在为货找车发愁)

    货源问题一直是物流货源行业的一大痛点,因为有大量的货车司机都在为货源问题发愁,经常吐槽说找货源太难了。其实,物流货运这一行的货源并不难找,只是你没有找到合适的方法而已。今天小帮给大家安利一个找货小帮手,让你高效找货!在此之前,小帮先插播一条今日货运资讯信息,找不到货源的司机师傅们,赶紧和老板联系,快速去进行拉货吧!且在途可视化,随时查看物流信息,省事又方便!

  • 字节大佬级鬼才终于把JavaScript整理成了修仙小说(字节大佬级鬼才终于把JavaScript整理成了修仙小说)

    如果你厌倦了厚厚的、如同字典般的编程书籍,不妨尝试一下新的口味,话不多说,直接上干货!

  • 瑞士手表前十名的手表(只生产机械手表)

    长动力,开放式表盘、骨架镂空,这一切让豪利时这个品牌的新品引起5万以下价位市场的注意。豪利时全球联合执行总裁RolfStuder先生、豪利时大中华区总裁DavidWeber先生出席活动。2014年再度推出独立研发并制造的ORIS110机芯,重归自主研发机芯之路。最新发布的ORIS115机芯可提供长达10天的动力储存。为了面向更广大的受众,必须控制住价格。豪利时大表冠飞行员X115自主机芯腕表是品牌第一款搭载ORIS115机芯的腕表。