随着金融科技、科技金融等概念的热起,以及在互联网金融、无金融服务群体的刚性需求下,大数据风控技术也获得越来越广泛地重视和应用。但是,如何利用大数据、机器学习等前沿技术做金融风控?如何通过海量数据与欺诈风险进行博弈?壹诺君有几点不成熟的小建议与大家分享。
整个风控体系包括几个环节:
事前:在风险发生之前就要通过对风险舆情的监控发现风险,比如在某些恶意的欺诈团伙即将发动欺诈攻击前就采取措施来提前防御,例如通过规则加紧,把模型阈值调高等方法;
事中:信贷借款申请,在线上注册激活的过程中,根据自动风险评估,包括申请欺诈,信用风险等来选择是否拒绝发放贷款;
事后:贷款发放以后的风险监控,如果借款人出现与其他平台的新增申请,或者长距离的位置转移,或者手机号停机等信号,可作为贷后风险预警。
对欺诈风险的防范
恶意欺诈用户一般不会采用真实身份借款,身份真实性识别是反欺诈的核心。身份证、银行卡、姓名、手机号四要素如果无误,欺诈概率是其他群体的1/3左右。通过大数据储存用户与各种ID对应的数据库,在用户进行借贷时进行身份匹配,能够及时辨别潜在的欺诈嫌疑用户。这些数据库包括:姓名、身份证号的实名ID,手机号、地址、银行卡号等准实名ID,QQ号、微博号、设备指纹(PC或手机硬件设备编号)等的匿名ID。
对信用风险的防范
主要指还款能力(经济实力)与还款意愿(道德风险)。大部分用户在申请阶段并非恶意,这就考验借款人对信用风险的判断,而行为数据挖掘是信用风险防范的核心。要预测借款人的信用风险,更多地需要依赖于分析海量用户的行为数据(强弱变量),从中挖掘出可以多次复用的规律。数据显示,坐过商务仓以上或一年乘坐飞机四次以上的客户违约率较低;在本地生活方面花钱越多的人违约率越低;访问财经媒体天数越多,违约率风险越低;同一手机号使用九年以上的用户违约率大概仅为6‰;而三四线城市打游戏花钱较多的人违约率比较高。
贷中管理及不良催收贷中管理
通过及时监测借款人信用的变化、共债的新增、流水的异动、联系状态的异常等数据,采用全自动的风险识别流程,提早识别风险,提高人工处理效率。消费金融不良资产,主要由道德水平不高和还款能力不强造成。据统计,70%-80%的不良资产是因为债务人失联导致,大数据网络可重新建立起与债务人的联系,通过关联匿名ID、联系家人朋友追回欠债,从而降低整体不良率。