大数据风控同传统风控在本质上没有区别,主要区别在于风控模型数据输入的纬度和数据关联性分析。据统计,目前银行传统的风控模型对市场上70%的客户是有效的,但是对另外30%的用户,其风控模型有效性将大打折扣。
大数据风控作为传统风控方式补充,主要利用行为数据来实施风险控制,用户行为数据可以作为另外的30%客户风控的有效补充。大数据风险控制的作用就是从原来被拒绝的贷款用户中找到合格用户,识别出已经通过审核的高风险客户和欺诈客户。
金融行业信用风险控制的挑战
金融行业在过去主要依靠经验和宏观经济形式来实施风险控制,以定性为主,更多依赖风险管理精英的个人能力,特别在经济发展很好的时期,风险管理偏好不太科学,不能够反应出真正的风险水平。定性的风险管理占主体,定量的风险管理起到很小的作用。
现在,越来越多的银行正在重视定量风险管理,积极利用风控模型来实施风险评估。巴塞尔III协议的推行,推动了定量风险评估。大多数中国银行的风控模型大多从国外引入,经过自己定制和改良之后用于信用风险评估。但是信用风险和操作风险比较复杂,由于信息不全以及其他问题,很多国外的信用风险模型效果不太明显。于是大多数中国银行参考国外信用风险评估模型,做了一个中国版本。包括著名的FICO风控模型,现在银行很少直接采用。
在这个中国版本的风控模型中,企业信用贷款过于依赖政府授信和国有企业,这种粗放型信用风险管理在经济结构调整过程中,引发了很高的不良贷款率。对私业务中,过高的信用审核标准,无法为更多的贷款申请人提供贷款,造成了无法为更多人提供服务,特别是在信用消费领域,无法实现普惠金融服务。
互联网金融行业的风控挑战
中国的互联网金融企业愿意从美国挖一些风控人才来提高自身风控水平。但是美国的征信环境比中国简单,很多信息可以拿得到,美国已经是一个成熟的信用社会,复杂的欺诈场景和复杂的信用风险场景不多。很多风控模型到了中国之后并不适合,因此很多中国领先的互联网金融公司并没有采用美国的风控模型,大多是自己开发风控模型。中国目前互联网金融的风控环境和东欧的信用环境相似,东欧的一些征信公司在中国很有市场就是这个原因。中国互联网金融公司在信贷风险管理方面面临的挑战如下。
1、客户风险较高
传统金融主要服务70%左右的客户,他们共同的特征就是还款能力强或者背景好。其他的客户包括中小企业和收入较低的白领、蓝领客户,银行不愿为他们提供服务。互联网金融公司主要为这些客户提供短期贷款、过桥贷款、消费贷款、发薪日贷款等。
大多数互联网金融客户收入较低,在银行那里拿不到较好的贷款额度,不是银行的目标客户,其信用评分较低。传统金融认为这批客户还款能力较差,不愿意降低信贷审批要求,为他们提供融资。
特别在目前中国经济调整的阶段,这些小企业经营者或者中低收入人群缺少原始积累,受宏观经济影响较大,企业经营和收入波动较大,他们的还款能力不稳定。互联网金融客户中,还款能力不稳定的客户占很大比例,他们的信用风险较高,对互联网金融企业的信用风险控制提出了很大的挑战。
2、客户信用信息不全
传统金融行业可以借助于人民银行的企业征信和个人征信数据实施信用风险评估,各个银行和信用卡中心也可以及时更新客户金融信贷信息,共享黑名单。在传统金融领域,个人和企业的信用信息集中在一起,容易进行风险评估。
在互联网金融领域,大多数互联网金融公司没有接入人行征信系统,无法拿到客户全维度信用信息,例如客户财产、学历、收入、贷款、金融机构交易信息等信息。互联网金融企业在实施信用风险评估时,仅能够依靠客户提供信息进行验证,但是客户在传统金融领域的借款信息,互联网金融客户的信用信息是不全的。
互联网金融企业无法拿到客户所有的信用信息,包含传统金融环境和民间借贷领域,缺少这信息对其实施信用风险评估影响很大。这也是互联网金融反欺诈公司或征信公司兴起的原因,他们主要的作用就是解决了客户信用信息不对称的问题。
3、恶意欺诈和薅羊毛比例较高
信用风险体现在两个方面,一个是客户恶意欺诈,另外一是客户信贷违约。依据互联网金融企业的经验,恶意欺诈占了其60%左右的信用损失。
互联网金融企业还面对了另外一有趣的问题,专门有一批薅羊毛的人,利用互联网金融企业的营销漏洞,通过新用户注册,用户推荐,积分兑换,短期投资来攥取超额收入。经过精心设计,薅羊毛的收入可以达到20%/月。很多互联网金融企业风险控制部门主要任务就是找出羊毛党,拒绝他们的贷款请求。
互联网金融的不良贷款率没有对外公布,但是依据行业经验,5%的不良贷款率是一个较好的水平,主要损失来源于过高的互联网恶意欺诈、过高的信贷审批成本、以及过高的获客成本。
恶意欺诈基本上以团伙作案为主,并且这些人越来越聪明,技术手段越来越先进,越来越进化,很难找到公共特征,也很难归纳,不容易及时发现。恶意欺诈的共性信息较少,即使有大量的坏种子,也不好建立风控模型来实施控制,互联网金融公司只能依靠风控经验、客户信息验证、部分行为数据来实施反欺诈。
4、客户违约成本低,债务收回成本较高
互联网金融公司的客户违约比例较高,并且建立了自己的贷款催收团队。互联网金融公司遇到贷款违约时,一般采用三种方式进行解决。
第一种是将资产打包,以3-4折的方式卖给资产管理公司,由他们去催收,效果不是太好,损失较大,还有法律分线风险,因此不是主流。
第二种方式是由担保公司承担,客户承担2%左右的担保费用,这个较为普遍,但是一旦借款规模较大,也不太适合。另外加大了客户贷款成本,产品竞争力下降。
第三种是自己催收,大部分逾期的贷款可以催收回来,恶意不还款的客户较少。逾期之后又还款的客户反倒是互联网金融的优质客户,其给公司带来的收益最高。但是缺点就是催收成本太高,客户违约成本很低。
中国缺少个人征信评分,造成客户信贷违约成本较低,个人贷款的违约,不会影响客户的正常社会生活和商业行为。
5、风控模型冷启动问题
每年都有大量互联网金融公司出现,风控成了所有互联网金融公司的核心竞争力。每一家互联网金融公司都会建立风控模型,实施信用风险管理。
坏种子和数据是风控模型重要输入,决定了风控模型的有效性。新兴的互联网金融公司,面对新的客户,缺少足够的种子用户来优化模型,同时也缺少用户的行为数据来完善用户风险评估卡。
互联网金融公司做风控时,缺少坏种子用户和数据的冷启动对其风控是一个较大的挑战。这种信贷违约和恶意欺诈的坏种子,不能够通过其他方式来解决,例如线下和向第三方购买。互联网金融公司只能依靠自己的业务不断积累,利用自己平台积累的数据和种子来解决这个问题,一旦管理不好,会对新兴的互联网金融公司造成较大影响。
大数据风控的优势
1、用户行为数据成为风控数据
风控最好的数据还是金融数据,例如年龄、收入、职业、学历、资产、负债等信用数据,这些数据同信用相关度高,可以反映用户的还款能力和还款意愿,这些数据因子在风控模型中必不可少,权重也很高,是信用风险评估最好的数据。
但是除了这些强相关的数据,一些用户行为数据对信用风险评估也具有较大的影响,例如用户是否经常去中国澳门赌博,用户是否经常刻意隐藏自己,用户是否参与高利贷,用户是否具有吸毒倾向,是否患有重大心理疾病等等,这些信息在一定概率下决定了用户风险水平。
在某些条件下这些因素会成为决定信用风险事件的强相关数据。过去这些用户行为数据,并没有放到信用风险评估模型中,没有参与客户的信用风险评估。金融企业和互联网金融企业在分析已经发生的信用风险事件之后,发现的这些用户行为信息在很多风险事件中起到了很关键的作用。小概率风险事件会导致很严重的后果,同信用风险事件的发生具有较强的关联性。
现实世界的用户行为可以揭示信用风险,互联网上的用户行为也同信用风险高度相关。例如全部用大写字母填写资料的人,信用贷款逾期率较高;凌晨1点登陆网络申请贷款的人,恶意欺诈的比较多;手机上只有贷款App,没有其他App的人,其恶意欺诈比率高;缺少社交活动的人,其贷款逾期可能性较高。这些用户行为信息都同信用风险高度相关,可以作为一个重要因子进行录入,影响客户的信用评分。
大数据风控的一个最大的优势就是丰富了信用风险评估的数据纬度,这些用户行为信息,很大程度是大数据采集和分析的结果,用户一般是不会提供给金融行业的。很多信息是规律性信息,需要大数据分析才有可能得到,其在信用评估中的权重,也需要不断的优化模型去完善。
2、实时输入和实时计算,解决风险视图实效性问题
传统风控的另外一个缺点是数据录入和评估结果的滞后性,缺乏实效性数据的输入,风控模型反映的往往是滞后数据的结果。利用滞后数据的评估结果来管理信用风险,本身产生的结构性风险就较大。
银行现有的风险控制机制是参考历史数据+模型+专家经验。但是风险事件的联动效应已经变大,一个小的风险事件可能在很短的时间内产生巨大的影响后果,风险事件撬动的杠杆变大了。历史数据反应未来趋势的相关程度正在变弱,因此信用风险管理需要大量实时的数据,已有的模型对风险事件(尤其是内部欺诈,外部欺诈)的识别能力在下降,需要新的风险控制模型和实时数据。
大数据的数据采集和计算能力,可以帮助企业建立实时的风险管理视图。借助于全面多纬度的数据、自我学习能力的风控模型、实时计算结果、坏种子数据,企业可以提升量化风险评估能力。
数据、技术、模型、分析将成为信用风险评估的四个关键元素,其背后的力量就是大数据的技术和分析能力。企业利用大数据的风控能力,实时输出风险因子信息,为金融企业提供实时风险管理视图,提高风险管理的及时性。
3、丰富数据输入纬度以及较细的颗粒度,对传统风控的补充
传统风控模型已经不能适应复杂的现代风险管理环境,特别在数据信息录入纬度上,影响客户信用评分的信息较多,很多都没有引入到风险评估流程。例如企业所处行业的竞争环境以及同业产品的竞争、企业产品的生命周期、企业的关联交易信息和司法信息、贷款个人的心理和性格、上下游产业经营情况、市场需求变化、客户对企业产品的评价等。
大数据风控可以提供全面的数据(数据的广度),强相关数据(数据的深度),实效性数据(数据的鲜活度)。这些数据颗粒度可以很小,同内部数据以及原有数据打通和整合之后,会影响风险评估结果,提升信用风险管理水平,客观地反映用户风险水平。
信用风险管理中还款意愿也较为重要,多维度、全量的用户行为数据可以客观揭示用户的还款意愿,另外细小的颗粒度信息在打通之后,可以更加客观了解客户的还款能力。全量数据加用户行为分析,可以充分了解客户行为,帮助企业识别出恶意欺诈客户。这些多纬度,细颗粒度,全面的信息正是大数分风控的优势所在,同时也是传统风控的一个很好的补充。