如何搭建和实现互联网金融授信领域的风控模型?

感谢各位关注问题,求业内人士分享。问题背景:在美国,传统的授信一般是FICO,但因为中国没有征信局的存在,所以FICO应用不广。不同的企业都有自己的方法,比如宜人贷、京东白条、阿里小贷等,有没有不涉及
阅读全文
请先 登录 后评论
  • 0 关注
  • 0 收藏 84 浏览
  • 略问用户 提出于 2020-10-22 17:37:52

4 个回答

xxxxxa

简单回答一下,权当抛砖引玉,希望能有专家出来回答 :-D


首先要解释风控和授信

  • 风控是风险控制,主要是控制业务流程中作弊和欺诈行为的发生
  • 授信是指企业向客户提供资金支持的行为

所以,互联网金融授信过程中的风控,目的主要是控制欺诈,核实本人身份和资料真假


领域限定:互联网上的个人信贷

不同领域的风控业务相差较大,其他领域不太熟悉。


目前主要的风控方式有3种:

  • 线下风控:就是靠人工面对面确定身份、居所和工作单位等;
  • 线上风控:银行卡实名认证、手机号实名认证、央行征信、第三方征信、其他黑名单数据、自己黑名单、防伪冒欺诈数据……主要是各种自己获取的数据和第三方数据交叉验证,训练自己的风控模型;
  • 线上和线下结合风控:部分高风险业务,可以投入人力审核,但要注意ROI。

如果是线上风控,核心3要点有:

  • 数据
  • 模型
  • 规则

其中,最重要的是数据,因为核心数据资源是稀缺的。

线上风控使用的数据大多属于2类:行为数据和资质数据。

做个人信贷,比较重要的资质数据是:个人身份信息、社交信息、电商购物信息、信用信息。

常用的数据采集点包括:

  • 个人身份信息(身份证、学生证、学信网)
  • 社交信息(通讯录、通话记录、搜索引擎、微博人人等社交网站)
  • 电商购物信息(电商购物、快递记录)
  • 信用信息(信用卡、贷款情况)

以上资料,主要是由客户主动提供,再加上企业从各种渠道拿到的数据,进行交叉验证。

比较重要的行为数据有:设备数据(cookie、MAC、IMEI)、位置数据(IP/LBS/GPS)、时间属(填写速度、时间)、业务行为(资料修改)等等。


业界使用的风控模型差距不大,比较通用。

从线性的LR模型,到GBDT、随机森林,再到最近很火的神经网络,性能逐步提升。

模型的选取,主要考虑业务需求和技术能力,虽然LR比较简单,但也有很多优点,所以在特定领域特定问题上表现很好,仍被广泛采用。

具体到个人信贷业务上,需要一个非常抗过拟合、非线性能力的模型。


规则一般由经验丰富的专家来人工定义,在业务量不大的初期,完全可以通过人工规则来处理风控问题。

当然,随着业务量的增大,后期还是很依赖模型的学习能力。


常见的应用案例

paypal/支付宝在支付领域的风控:https://gigaom.com/2015/03/06/how-paypal-uses-deep-learning-and-detective-work-to-fight-fraud/


如何评估效果

有2个关键指标:准确率/召回率,分别对应误警和漏警。

  • 准确率/误警:错误识别,将好客户当做风险点处理。需要平衡用户体验和可解释性,处罚规则不应过于粗暴。
  • 召回率/漏警:漏掉了风险,将风险客户当做好客户处理。

模型和规则的更改,在上线前,需要做很多离线和在线的测试,确保最终效果是可以接受的。


暂不清楚业界是否有其他方法,请专家补充。


其他

  • 除了风控模型,整体的风控流程也非常重要。
  • 风控与业务高度相关,更换客户群体和领域后,风控策略、模型特征、规则就会发生巨大的变化,所以很多东西是不能通用的。比如大学生消费贷款和白领的信用贷款,所需要的数据特征就很不一样。
请先 登录 后评论
xxxxxa

谢邀!感觉回答完你的问题,可以写本书了,哈哈。。今天先尝试第一个问题:风控模型是如何搭建的?

我本身并不是专门从事风控这一块的,但一直对风控建模这块挺有兴趣,加之在银行的工作,对风控模型的理解如下,如有错误之处欢迎指正:

1)风控模型的作用,四个字“量化风险”;

2)进行量化的话,有两种方法:一是评级,主要是对各个指标进行打分,然后;二是建模,数学模型或计量模型。FICO就是一种评级的方法。

3)无论是评级,还是建模,第一步就是选取量化因子,通俗的说就是哪些指标可以反映客户的风险情况

4)第二步,确定模型。如果是评级的话,需要确定每个指标的分数等级和指标间的权重;如果是建模的话,需要确定具体采用哪种模型,我对计量比较熟悉,如果是计量模型的话,还要考虑指标间的多重共线性、模型的拟合优度等等问题。

3)第三步,就是需要大量数据和信息验证模型的正确性和精确性。

请先 登录 后评论
xxxxxa

互联网金融其实就是互联网+金融的简称,这个词语算是属于中国特有,其实就是通过互联网的手段进行金融的交易,毕竟国有的金融机构覆盖人群范围还是比较狭窄。风控模型是互联网金融的核心,能够决定一个款互金产品的生死,毕竟这个是关系到钱的安全的存在。今天我们就用一篇文章来讨论下风控模型的设计方式。

第一:什么是风控?

风控其实是包含风险管理和风险控制。风险管理,它是指如何在项目或者企业在一定的风险的环境里,把风险减至最低的管理过程。它的基本程序包括风险识别、风险估测、风险评价、风险控制和风险管理效果评价等环节。 风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或者减少风险事件发生时造成的损失。所以其实风险控制是风险管理中的一个环节。

fetch_file980be5d1d744f9c3917fac7213751c08-picture

用一句话介绍互联网金融的风控模型其实就是: 互联网金融风控模型就是通过人为的建规则对用户的真实信用进行评估,估算出信用等级,指导金融机构给出合理的授信额度,从而识别和减少在金融交易中存在的交易风险。

第二:风控模型的应用场景和流程

应用场景非常广泛,只要牵扯互联网金融的行业就缺少不了风控模型的存在,同时,风控模型在不同的阶段体现的方式和功能也不一样。从资金的角度来看,风控模型是为了评估用户还款能力和还款意愿,反欺诈反作弊,防止用户薅羊毛和保证平台安全等功能;从行业的角度,互联网风控模型体现在消费金融/供应链金融 /信用借贷 /P2P /大数据征信等方面。

fetch_file6a5436805af8448b8cb0fdc830396f8a-picture

第三:风控模型的设计纬度

从下面面的流程我们可以看到,风控模型的审核流程一般都是要经过机器审核和人工确认的相结合的方式。模型审核同时大致分为三个阶段,它通过用户提交的数据,对用户的资质进行审核,最终得到一个评分卡的分数。对于存疑和通过的进见,需要人工进行确认。所以说,风控模型的计算策略和机制在一个公司属于绝密,规则出了核心的员工,其他人是不能知道风控规则的。

fetch_fileef978166fa1f7e5393ce318ae6d19dad-picture

fetch_filef6982764131a951609b7d7d45ee62d00-picture

第四:如果说金融产品的核心是风控,那么风控的核心是什么?

答案其实就是: 信用评估 + 模型规则。

第一步就是获取数据

信用评估来自于用户数据,模型规则其实就是用户数据规则,信息的纬度也比较广泛,大致可以分为基本信息/行为信息/信用信息/社交信息和消费信息等。

当然获取信息的方式也是千奇百怪,主要的来源有用户提交/接口用户授权/爬虫/信息购买/黑白名单等方法。

fetch_file13c73b0a5f9f7209eda821efdc95095a-picture

第二步:确定用户数据的变量,分配变量的计算权重确定用户变量和分配权重,一两句话讲不明白,贴图大家看看吧!

fetch_file41982f7c8418eecc5c825b4000ce95e1-picture

第三步: 调整指标分数,给出评分。建立每个指标的评分规则,反复调试指标分,保证模型准确性。

fetch_file2212670f8b309ad293d74c0d9ad67ccc-picture

笔者也只是短暂接触互联网金融方面的知识,贻笑大方了!

请先 登录 后评论
xxxxxa
请先 登录 后评论