56星座屋
当前位置: 首页 星座百科

贝叶斯算法实例讲解(数据分析入门贝叶斯定理)

时间:2023-05-29 作者: 小编 阅读量: 2 栏目名: 星座百科

事实上,不懂贝叶斯定理不会让我们的生活崩塌,不会让我们的生活一团乱麻,但是一旦掌握了贝叶斯定理,在很多决策场景中,我们将会变得更加明智。然而事实并非如此,小明得病的概率仅有3.17%!检验为阳性的时候,小明患病的概率竟然只有3.17%!条件概率认识贝叶斯定理之前,我们有必要先了解下条件概率以及它的一些性质。无论事件A、B之间是否相互独立,这个等式都成立,它就是贝叶斯定理的基础。等式的前半部分就是贝叶斯定理的公式。

贝叶斯定理是什么,有什么用处?可能很多人都听过这个贝叶斯定理,却对它一知半解。事实上,不懂贝叶斯定理不会让我们的生活崩塌,不会让我们的生活一团乱麻,但是一旦掌握了贝叶斯定理,在很多决策场景中,我们将会变得更加明智。

今天我们将通过一个实际生活中的案例,用最通俗的方式帮助大家理解它。后续的话,我会为大家讲解如何用Python在实际案例中应用贝叶斯定理,感兴趣的朋友欢迎关注哦

小明到底有没有得癌症?

这是一个非常经典的案例,令人难以想象的是,很多时候一些医生的误诊竟是因为他们不懂贝叶斯定理!

考虑这样的场景,医生常通过某种血检来辅助判断病人是否罹患某种癌症。但是这种血检返回的结果并不是百分百的精准,当患者的确患病时,血检返回阳性的概率为98%;当患者没有患病时,血检返回阴性的概率为97%。已知有千分之一的人会得这种癌症。

现在小明做了这种血检,并且检测结果显示阳性,那么请问他得病的可能性大,还是没病的可能性大呢?

用直觉来判断,是不是第一反应就是小明大概率得了这种癌症了?

然而事实并非如此,小明得病的概率仅有3.17%!是不是非常难以置信?检验为阳性的时候,小明患病的概率竟然只有3.17%!现在应该很多同学不认可这个结果,那么接下来我们就看一下贝叶斯定理是个什么东西。

条件概率

认识贝叶斯定理之前,我们有必要先了解下条件概率以及它的一些性质。

条件概率是指在某些背景约束(或前提条件)下某事件发生的概率,比如令一名学生考上清华大学作为事件A,其概率为P(A),学生是女生作为事件B,其概率为P(B),那么在学生是女生的前提条件下,学生考上清华的概率就是P(A|B)。下面我们分别考虑事件A与事件B之间是否相互独立的情况。

  • 事件A与事件B相互独立:
  • 如果事件A和时间B是相互独立的,那么P(A)=P(A|B),无论B是否发生,对于事件A的发生没有影响,这时也有P(AB)=P(A)P(B),即事件A、B同时发生的概率是两个事件各自发生概率的乘积。
  • 事件A与事件B之间不相互独立:
  • 事件A、B同时发生的概率为P(AB),那么P(AB)=P(A|B)P(B)=P(B|A)P(A),也就是说两事件同时发生的概率为其中一个事件发生的概率乘以在该事件发生的前提下另一事件发生的概率。无论事件A、B之间是否相互独立,这个等式都成立,它就是贝叶斯定理的基础。
贝叶斯定理

从式(1)可以得知:

式(2)就是鼎鼎大名的贝叶斯定理了,我们来从另一个角度理解一下它的意义。我们用数据集D替换事件B,用假设H替换事件A,得到:

这就给我们提供了一种方法,可以根据数据集D的变化不断更新假设H发生的概率,这种方式被称作“历史诠释”。

  • P(H)可以理解为假设H发生的先验概率;
  • P(H|D)则可以理解为假设H发生的后验概率,是在我们获得了更多数据的情况下推断出的更先进的概率;
  • 我们每次获得的新知识,也就是后验的数据,都会作为下一次计算的先验数据;
  • P(D|H)可以被理解为似然度,也就是在假设H发生的情况下,数据分布刚好是D的概率;
  • P(D)则是在任何假设下数据分布刚好为D的概率,我们把它称为标准化常量。

那么我们现在来回头看小明是否得癌症的问题。

等式的前半部分就是贝叶斯定理的公式。而在后边计算P(阳性)的时候,可以看到我们用了两部分相加得到了P(阳性)。这里我们不得不介绍一下全概率公式:

拿我们这个例子来说,P(B)就是P(阳性),然而P(阳性)的数据我们无法直接获取,但是我们知道在患病和无病的条件下血检为阳性的概率,也知道患病和无病的概率,因此把患病情况下血检为阳性的条件概率乘以患病的概率,再加上无病情况下血检为阳性的条件概率乘以无病的概率,就是所有情况下血检为阳性事件发生的概率了,即:

那么最后我们给出完整的计算过程:

你学会了吗?有任何问题都可以在下方留言,我会一一回答!

    推荐阅读
  • 貔貅戴脖子上佩戴方法(有什么说法)

    貔貅戴脖子上佩戴方法貔貅戴脖子上佩戴方法是以貔貅的头部朝上佩戴为佳。人们认为,这样可以集日月之精华,融天地之度量,为我们带来更好的招财效果,貔貅带脖子上可以将貔貅放置衣服之内,也可以将貔貅放置衣服之外。但是禁忌他人触摸,这会影响到貔貅的招财效果。日常生活中,洗澡或是房事的时候需要将貔貅取下放好,放置早干净平稳的地方,以免貔貅吊坠跌落损坏。开闪光灯照相的时候要把貔貅取下或放入衣内,貔貅忌强光。

  • 控释肥不浇水可以吗(缓释肥不浇水会释放吗)

    回答施用控释肥之后可以不浇水,但是在缺少水分的情况下它的养分会无法被有效地释放,这可能会导致农作物因为无法吸收到足够的养分而影响到自身的长势,严重时甚至会造成减产,因此建议在施肥后适量浇一点水。

  • 兰花养殖方法和注意事项(兰花养殖方法和注意事项简单介绍)

    兰花养殖方法和注意事项土壤:栽培基质要疏松肥沃、排水良好,透水性是最主要的原则。如果是肥份不足可以通过后期施肥的方式来补充,但是一定要透水,不能过于细腻。通常在5度以上到25度以下,这个温度环境下它会生长的比较健壮。

  • 可乐加牛奶出现的沉淀可以喝吗(一长一排好搭档)

    最典型的例子就是出租车司机和货车司机,他们是肾结石的高发人群。可乐是碳酸饮料,一直流传的可乐排肾结石,是希望可乐中的碳酸能溶解结石。所以,可乐既没有溶解结石的作用,也不可能促进结石的排出,甚至有的肾结石患者,喝完可乐后还会加重病情。

  • 古代园林设计特点(古代园林设计和现代园林景观设计)

    说起园林景观,一般都会想到古代皇帝的后花园和有钱人的大院。一般园林景观设计分三大类:1.城市区域性的园林景观设计:主要是针对城市的整体区域规划和城市公共区域设计规划,梳理整体的水系、山脉及交通等布局。更多园林设计了解,关注BuildMost平台,不迷路!

  • 被抛弃的小王子建模(一位25岁的模型玩家去世了)

    几个月前,这家店的关注数还不到1000▼这家店的店主叫王任飞,25岁,因心脏问题,已于今年5月21日去世。这种病症表现为肌肉萎缩,会导致下肢瘫痪、心肌问题等,诱因是先天基因缺陷,因为没有家族病史,所以医院的推断是基因突变。5月21日下午,牛牛照常在工作间制作模型,却突然晕倒,后被家人发现。在差评君介绍RELIC芯片时,牛牛母亲并不知情,而听完后她几近失声。

  • 元宵冷冻可以保存多久(元宵放冰箱冷冻很久了还能吃吗)

    元宵冷冻可以保存2-3个月。准备好保鲜袋或者是密封的保鲜盒,将元宵放入袋子或者盒子里,然后再放入冰箱进行冷冻,不过冷冻时间太久,会对于食物的口感以及品质有影响,因此尽量在1-2个月之内将其吃掉。

  • 中华书局各版本二十四史(几十年如一日打造最权威的)

    2月刚刚推出的《隋书》修订本很快便位居京东“二十四史”相关图书销量第一。中华书局对于这一修订工程的重视程度可见一斑。审定委员会及各史审定者,负责修订本各环节的审定工作。任何疑难问题,需经修订工程审定委员会以书面或会议研讨方式研究解决。各史清样需送交修订承担者审阅,以便共同把关,确保修订本的编校质量。据介绍,修订本对点校本进行了全面复核,并按照当代学术规范,大量增加校勘记。

  • 经期可以洗澡洗头吗(经期能洗澡洗头吗)

    经期可以洗澡洗头吗?下面希望有你要的答案,我们一起来看看吧!洗澡最好是选择淋浴,不能盆浴,以免污水感染引起妇科炎症。在月经期间,要注意外阴的清洁卫生,可每天晚上用温水清洗。由于血液是细菌的良好培养基,容易导致细菌生长、繁殖。所以来月经的时候,女性更要重视清洁卫生的问题,注意勤换卫生巾,避免妇科疾病的发生。

  • 二手车如何检查车况是否良好(二手车跑多少公里就不要买了)

    了解车辆的历史车况信息,所有数据一查便知,足不出户即可查询。