风控模型高频面试问题精选(附答案)

关注“金科应用研院”,回复“礼包

领取风控资料合集

FAL近三年培养了万人风控学员,帮助学员通过体系授课+一对一辅导形式实现目标企业意向岗位的就业转岗或提升。在辅导过程中,逐渐积累沉淀出丰富的行业经验与面试真题库。


本文从风控面试真题库的风控模型真题库中,精选5个高频面试问题,并附答案,与FALers共享之。


1.数据驱动型金融场景下,风控模型的种类有哪些?

获客阶段:用户响应模型,风险预筛选模型

授信阶段:申请评分模型,反欺诈模型,风险定价模型,收益评分模型

贷中阶段:行为评分模型,交易欺诈模型,客户流失模型

贷后阶段:预催收模型,早期催收模型,晚期催收模型

2.简单描述一些风控建模的流程?

前期准备工作阶段:

不同的模型针对不同的业务场景,在建模项目开始前需要对业务的逻辑和需求有清晰的理解,明确模型的业务目标和作用,项目周期时间和安排进度,以及模型效果的要求。

模型设计阶段:

包括模型的选择(评分卡亦或是集成模型);单个模型还是做模型的细分-子模型。是否需要做拒绝推论;观察期、表现期、目标好坏用户的定义;数据的获取途径等。

数据归集与清洗阶段:

根据观察期和表现期的定义从数据集市(或数据仓库,一般不太建议建模人员从生产上拿数据)中取数,并进行前期的数据清洗和稳定性验证工作。数据清洗包括用户唯一性检查,Missing值检查,异常值检查,Zero-rate等。稳定性验证主要考察变量在时间序列上的稳定性,衡量的指标有PSI、平均值/方差,IV等。

特征工程阶段:

这一阶段是风控建模流程的重点。

注意,是风控建模,对于类似NLP、Graph那些模型开发中,特征工程已被自动化取代,详细可参照:

2001-2021,一文读懂NLP发展简史

NLP核心模块以及在商品推荐上的应用案例

主要做特征的预处理和筛选。如果是评分卡,需要对特征进行离散化(有时也需归一化)等处理,再对特征进行降维,降维的方法有IV筛选,相关性筛选,显著性筛选等。另外,会基于对业务的理解做特征构造工作,包括特征交叉,特征转换,对特征做四则运算等。

模型建立和评估阶段:

选择与业务/企业适配的模型,像评分卡可以用逻辑回归,如果只需要做出二分类预测可以选择Xgboost等集成模型,模型构建好后需要做模型评估和验证,计算AUC,KS,并对模型做交叉验证来评估模型泛化能力及模型的稳定性。

模型上线部署阶段:

在风控后台上配置模型规则,对于一些复杂的模型还需要将模型文件进行转换,并封装成一个类,用Java等其他形式来调用。

模型监控阶段:

前期主要监控模型整体及变量的稳定性,衡量标准主要是PSI,并每日观测模型规则的拒绝率与线下的差异。后期累计一定线上用户后可以评估线上模型性能和资产质量。模型性能可以参照AUC,KS等量化指标,与线下进行比较,衡量模型的线上实际效果。

3.评分卡,集成模型在线上如何部署?

评分卡的部署较为简单,因为评分卡将变量映射到了一个个区间及得分,所以在普通的风控决策引擎上就可以配置。

像一些比较复杂的模型,比如Xgboost和lightgbm,一般是将模型文件转换成pmml格式,并封装成pmml,在风控后台上传pmml和变量参数文件,并配置好模型的阈值。Python和R开发的模型都可以用这种方式来部署。

4.模型转化为规则后决策点(cutoff)怎么设定?

规则只是判断用户的好坏,而不会像模型输出违约概率,所以设定决策点时要考虑到规则的评估指标(精准率、查全率、误杀率、拒绝率),一般模型开发前会设定一个预期的拒绝率,在这个拒绝率下再考量精准率、查全率和误杀率的取舍,找到最佳Balance point。

好的模型能接受更多的好用户,拒绝掉更多的坏用户,也就是提高好坏比例。所以可事先设定一个预期目标的好坏比例来选择最佳的决策点。

5.怎么做风控模型的冷启动?

风控模型的冷启动是指产品刚上线时,没有积累的用户数据,或者用户还没有表现出逾期、违约等状态,用于标记“好与坏“。

此时,需要做模型就是一个棘手的问题,常用的方法如下:

  • 不做模型,只做规则。
    凭借专家业务经验,做一些Hard Check,比如设定用户的准入门槛,考量用户的信用历史和多头风险,而且可以接入第三方提供的反欺诈服务和数据评分等。值得一提的是,可以结合人工审核来对早期用户的申请资料做风险评估。
  • 借助相同模式产品的数据来建模。
    如果两个产品的获客渠道,产品设计,风控逻辑,用户特征都差不多的话,可以选择之前已经上线的那个产品所累计的用户数据来建模,不过在模型上线后需要比较线上用户的特征是否与建模用户有较大的差异,如果差异较大,则需要对模型做快速调整。
  • 规则+专家评分卡。
    对于早期缺少用户label时,考量结合风控业务专家经验,开发一套专家评分卡,也是一个不错的选择。
  • 无监督模型+评分卡。
    这种方法适用于产品上线一段时间后,表现出好坏的用户比较少,但老板要求做一个模型出来。此时可以用线上的申请用户做无监督模型,找出一部分坏样本和好样本,用这些数据来做评分卡模型。当然这种模型的准确性是存疑的,需要后续对模型不断迭代优化。

以上,是本次为FALers分享的关于风控模型的高频面试问题与答案,希望读者朋友们受用。

如果你喜欢、想要看更多的干货类型的文章,可以关注公众号【金科应用研院】并设为星标,顺便转发分享~

感谢您看到这里微信公众号【金科应用研院】对话框回复“小福利”,领取粉丝专属优惠券。