56星座屋
当前位置: 首页 星座百科

分类模型的常见度量指标(模型评估指标之间的一些联系)

时间:2023-05-22 作者: 小编 阅读量: 2 栏目名: 星座百科

TPR为预测为正例且实际为正例的样本占所有正例样本的比例,即所有好样本中通过样本的占比。由于KS值是取TPR和FPR之差的最大值,可以理解为两个累计分布之差。还有一根蓝色的曲线是累计的Lift曲线,是将累计的坏样本比例除以整体的坏样本占比所得,这条线是的临界点是1。

信贷评分模型的评估指标常见的有P-R曲线、AUC、KS、混淆矩阵、AR、洛伦茨曲线等,各个评估指标之间都有或多或少的联系和区别,从而从不同角度对模型进行评估。本文尝试写一些各个评估指标间的联系,从而对模型评估指标有更加深入的理解。

目录

  1. 正负样本的选择
  2. 混淆矩阵与概率密度分布
  3. 提升图与洛伦茨曲线
  4. 洛伦茨曲线与KS
  5. KS与AUC值
  6. 参考资料

一、正负样本的选择

直观上,在信贷风控建模中都以好样本为正样本,以坏样本为负样本。其实正负样本的选择不同直接影响的就是混淆矩阵,在以好样本为正样本的情况下,信贷业务的一些指标如通过率与坏账率如下:

通过率,即模型判断为好样本的数量占总样本的数量。

坏账率为模型判断为好样本(P)中真正的坏样本(FP)所占的比例。

而模型的准确率Precison定义为模型判断为好样本中真正的好样本所占比例,即:

由此可见,坏账率就是1-Precison,在模型优化时设法让Precison值更高,即通过样本中的好样本占比尽可能高,这是一个很好的性质,也是将好样本作为正样本的优点。但同时其他的一些指标比如F1指标,这个时候就是无效的。

在机器学习中,往往是将少数样本定义为正样本,在信贷模型也就是将坏样本定义为正样本,表示希望模型在训练时更加关注坏样本,控制模型对坏样本的预测能力,这也更符合业务场景。

总结一下,正负样本的选择没有强制要求,根据自身需求而定,不同正负样本的选择会对指标的表现方式产生影响。

二、混淆矩阵与概率密度分布

为了便于理解,以好样本为正样本,将混淆矩阵与正负样本的概率密度函数对应到一张图上:

虚线左边为拒绝的样本,即经模型预测低于cutoff值的坏样本;右边为通过的样本,即经模型预测高于cutoff的好样本。FN为模型预测为坏样本但实际为正样本,即被误拒的好人;FP为模型预测为好样本但实际为坏样本,即误准入的坏人。

TPR为预测为正例且实际为正例的样本占所有正例样本的比例,即所有好样本中通过样本的占比。

FPR为预测为正例但实际为负例(误准入)的样本占所有负例样本的比例,即所有坏样本中被误准入的样本占比。

由于KS值是取TPR和FPR之差的最大值,可以理解为两个累计分布之差。以上图中的cutoff值为例,虚线往左移则TP增加的比例要小于FP增加的比例,虚线往右移则TP减少的比例大于FP减少的比例,因此只有在虚线处TP的占比与FP的占比差值最大,也就是KS的取值。所以上图中三条线交叉的地方取到的cutoff值,正好为KS值对应的cutoff值。

三、提升图与洛伦茨曲线

提升图比较的是采用模型与不采用模型带来的改善,即采用模型后对坏样本识别能力的提升程度。计算过程如下图:

上图中的右侧有两条曲线,绿色的这根是Lift曲线,它是将每一组的坏样本占比除以整体的坏样本占比得到。这条曲线是趋于0的,且越陡说明模型的区分度越高。还有一根蓝色的曲线是累计的Lift曲线,是将累计的坏样本比例除以整体的坏样本占比所得,这条线是的临界点是1。

如果将用模型判断得到的每组累计坏样本占比与随机判断每组的累计坏样本占比进行绘图,就得到洛伦茨曲线,计算方式如下图:

洛伦茨曲线如下:

用洛伦茨曲线比较模型性能时,较好的模型的洛伦茨图应该更偏向于左上方坐标轴,这种比较模型性能的方式与ROC曲线相同。上图中洛伦茨曲线上一点的含义是:在通过率为50%的情况下,模型可以识别出80%的坏样本。

现在知道洛伦茨曲线越往左上方说明模型的性能越好,因此可以用一个指标来量化这种性质,如上图将图形分为A、B、C三块区域,理想状态下A的面积等于A B的和,此时可以完美地识别所有坏样本。因此,将A和A B的比值定义为基尼系数,也叫作AR值。

四、洛伦茨曲线与KS

洛伦茨曲线中在给定通过率后,只能得到对坏样本的识别能力,并没有反应对好样本的识别能力。而K-S曲线的本质是对坏样本的洛伦茨曲线和好样本的洛伦兹曲线构成的。

所以,上图中坏样本的累计占比曲线就是FPR,好样本的累计占比曲线就是TPR。上图中KS值为0.36,其含义是在通过率为62%时,模型能识别70%的逾期用户,但有34%的好样本被误判为坏样本拒绝。

KS值的高低与建模样本中的坏样本浓占比相关,并不是KS值越高风控就越好。下面是知乎"独孤qiu败"文章中的一个例子:

(1)如果建模样本中好坏样本比例good/bad=50/50,坏账率为50%;k-s值0.6指的是如果在误杀20%好用户的情况下可以识别80%的坏样本;那么使用模型之后的结果为good/bad=40/10,坏账率变为20%;这个我们做风控策略的人都知道在使用一些较好的变量的情况下是有可能的,因为毕竟做到50%的坏账已经是够烂的了。(2)如果建模样本中好坏样本比例good/bad=80/20,坏账率为20%;k-s值0.6指的是如果在误杀20%好用户的情况下可以识别80%的坏样本;那么使用模型之后的结果为good/bad=64/4,坏账率变为5.88%,其实我们知道这个一个模型是很难做到。

五、KS与AUC值

这一部分直接搬运求是汪的文章了,风控模型—区分度评估指标(KS)深入理解应用。

因为KS = |TPR - FPR|,如果添加辅助线TPR = FPRKS,那么这条直线的截距就是KS值。当与ROC曲线相切时,截距最大,也就对应max_ks。

在理解KS和ROC曲线的关系后,我们也就更容易理解——为什么通常认为KS在高于75%时就不可靠?我们可以想象,如果KS达到80%以上,此时ROC曲线就会变得很畸形,如下图:

六、参考资料

1.《Python金融大数据风控建模实战》

>【作者】:Labryant

>【原创公众号】:风控猎人

>【简介】:某创业公司策略分析师,积极上进,努力提升。乾坤未定,你我都是黑马。

>【转载说明】:转载请说明出处,谢谢合作!~

,
    推荐阅读
  • 欢乐颂蒋欣穿绿色的衣服哪一集(细数欢乐颂里给我们种的草)

    中国上海,欢乐颂小区19号楼22层住着五个女人。灵感来源于纪梵希高级定制,将高级手工蕾丝融入护肤领域,与独家专利配方具有非凡生命力的"墨藻生命精萃"融合,带来出乎意料的抗老功效。第七集里,樊胜美手上拿的这款纪梵希小羊皮唇膏,也让本公举盯上了!↓兰芝气垫BB霜SPF30PARMB305特殊科技舒缓降温使用后即刻令肌肤温度下降3度,双重容器隔离炎热,维持海绵的温度。《欢乐颂》才播出了13集,就给我们安利了这么多好东西!

  • 梅雨季节衣服不干有味怎么办(梅雨季节衣服不干有味解决方法)

    梅雨季节衣服不干有味怎么办?以下内容希望对你有帮助!黑色能吸收热量及紫外线,并有杀菌功能,并不会出现捂坏的情况,比自然晾晒干得快,特别适合在阴雨天晾衣服用。如果是袜子这样的小件,可以放在正在使用的显示器上烘干。把铁丝衣架两端1/3处用力向前弯曲,衣架变成立体的,晾晒衣服时,前、后身就不会贴在一起,衣物内侧通风可以大大缩短晾晒的时间,阴雨天晾衣服可以快速晾干。

  • 沙漠鹰有哪些(盘点那些生不逢时的战鹰们)

    但是军方却不买账。美国空军于1991年4月23日宣布YF-22获选优胜。YF-23一共只有生产两架原型机,目前都已经不再飞行。1991年4月8日,美国陆军宣布波音、西科斯基公司小组获胜,LHX随之进入原型机研制阶段。运-10由于各种原因最终没有投产。,2000年2月29日首飞,只有1架技术验证机。1969年1月,在完成了最后一次试验飞行之后,被送进俄亥俄州的怀特,帕特森空军基地博物馆。

  • 海贼王热血航线怎么参加狙击王的试炼(海贼王热血航线如何参加狙击王的试炼)

    下面更多详细答案一起来看看吧!海贼王热血航线怎么参加狙击王的试炼工具/原料:华为P40,MIUI12.0.0.1,海贼王热血航线1.0.7。第一步玩家们登录自己的大区,在游戏的主页面找到玩法选项。这里我们需要选择的是第一个游戏狙击王点击进入。

  • 阿胶糕速冻一年还能不能食用(阿胶糕速冻一年还能食用吗)

    阿胶糕放这种食物在冰箱中冷藏了一年,这个时候是不可以食用的冷藏通常至少可以保质一个星期左右,即便是冷冻,也只只可以保质2个月到3个月之间,接下来我们就来聊聊关于阿胶糕速冻一年还能不能食用?阿胶糕速冻一年还能不能食用阿胶糕放这种食物在冰箱中冷藏了一年,这个时候是不可以食用的。而到了七八月的炎热天,高温也有可能导致阿胶融化。因此,不建议食用保存超过两个月的阿胶。

  • 2021广州国际汽车展览会门票多少钱(广州国际汽车展览会2020门票)

    第十九届广州国际汽车展览会将于2021年11月19日至28日在中国进出口商品交易会展馆举办,11月19日为媒体日。欢迎全球观众、媒体及业内人士前来参观。2021广州国际汽车展览会门票多少钱?11月19日为媒体日,仅对国内外媒体及特邀嘉宾开放。

  • 孩子咳嗽感冒流鼻涕小妙招(小孩感冒咳嗽流鼻涕)

    闺女感冒了,咳嗽,流鼻涕。按照医嘱按时吃药会很快好起来。于是改用第二方案,拿个吸管,放在奶瓶盖中,让小家伙吸,无效,屁孩知道是药仍抗拒。改用第三方案,拿小勺子喂,无效,甚至打翻药。于是又软下来苦口婆心地劝说,让她乖点,喝药,妈妈就不离开了,可这小家伙仍拒药,比革命烈士更坚决立场。改用第六方案,滴管滴,可小家伙很快发现是药,只让滴一次,决不上第二次当了。终于搞定这小家伙了。

  • WE战队的成员都是谁啊?(WE战队的成员简述)

    WE战队的成员都是谁啊WE.IGE的队员包括有:WE.IGE.Suho:中国第一精灵,左手会跳舞的男人。在第二届中韩对抗赛上勇夺冠军,并在Acon4上取得了季军的成绩。WE.IGE.Sky:Sky流创始人,WCG2005全球总决赛魔兽冠军。我们毫不怀疑其世界顶尖选手的实力。WE.IGE.WyW:中国星际Zerg第一高手。WE.IGE.DuCui:原Lion战队主力,国内顶尖orc玩家。WE.IGE.TeD:国内亡灵新秀,第一届“SoulWar激战台”擂主。

  • 新工科专业有哪些(有这五种)

    新工科专业有哪些?大数据类大数据是众多学科与统计学交叉产生的一门新兴学科,涉及数据挖掘、云计算等数学,我来为大家科普一下关于新工科专业有哪些?云计算,是指“超级计算集群”经过网络输送各种计算机服务及数据。智能科学与技术类。智能科学与技术专业面向前沿高新技术的基础性本科专业,覆盖面很广。光电信息科学与工程类。该专业主要学习光学、机械学、电子学及计算机科学基础理论及专业知识。

  • 人和自然的关系(关系有哪些)

    不论是以屈从于“神”的方式,还是以屈从于“道”的方式,敬畏都是人存在的统一姿势。在这个时期,西方艺术以描绘“神”为主题,东方艺术则以领悟“道”为宗旨。科学革命打破了人类的一切禁忌。神不再是世界的主体,而承载“道”的宇宙则被解释成不过是一群根据万有引力漂浮在太空的平凡球体。于是,无论是西方的神还是东方的道都变得不值一提。战争与环境问题挑战了人类理性的绝对地位。