图片:1578719.png
风控策略通常会包含很多种类型的规则,每个规则都是结合产品、业务基于经验和数据分析产生出来的,用于区分线上交易中产生的针对不同场景的问题交易,包括欺诈,洗钱,账户盗用等等。
策略更多地会结合用户体验和业务来平衡损失跟业务发展的关系,不同企业应该根据自身的业务情况选择适合的策略体系。以下是个人对风控策略的理解,仅供参考。
规则类型
名单规则
使用黑名单来设置规则,例如用户的ID、设备指纹、个人邮箱、个人手机等等。这种归属于个人且不容易产生公用的资源,通常来自于历史产生损失的订单或者通过损失关联出来的订单信息。
另外引入的是灰名单的概念,不同于黑名单,灰名单是通过一些准确率较高的规则或者黑名单通过多级关联产生的,这些名单没有黑名单准确率高,但是在一定准确率条件下补充了黑名单的覆盖情况。
用户注册手机号在征信黑名单
用户注册手机号在历史欺诈黑名单
用户身份证信息在历史刷单黑名单
业务规则
业务规则通常由业务自身决定,例如某业务会限定单个用户的单日交易量,每个用户输入密码的次数,每个用户绑定银行卡的张数等等。对于业务的规则一般用户都会在页面中能够找到相应的提示,这种设定非常微妙,就像是国家限定哪些是走私哪些是代购。如果涉及到一些绕过固定策略去进行“薅羊毛”行为,则需要更加严格的规则限制,避免业务上更多的资损。
图片:微信图片_20180508005116.jpg
行为异常
行为异常的概念比较广泛,贯穿了用户从打开网站到完成支付的所有行为,包含了用户操作行为和用户交易行为。
操作行为则是指用户在网页中的浏览、点击、键鼠操作等。不同的人会有不同的操作习惯,正常的操作在页面浏览时的顺序、时长、点击量的数据大多都会处于某一固定区间段,针对异于该行为的操作行为则提升风控等级。
图片:微信图片_20180508005119.jpg
图片:微信图片_20180508005122.jpg
交易行为是指在交易中一般会按照账户、IP、设备指纹等对用户进行频率和频次的限制,如1天内一个用户更换支付卡的频次大于3次,一个用户5分钟交易量大于10次等。
频率颗粒度需要根据不同情况划分天、小时、分钟等,并且需要规定一个时间窗口,比如一个自然天,一个整点时或者自当前交易时间点往前推60分钟等等。
频次则是根据不同的时间窗口和维度以及考虑正常用户的交易行为所设定的阈值,通常在相同条件下值越大,风险也越大。
需要补充的是,在频率和频次的统计中有三个维度很重要,设备,设备,设备(重要的东西说三遍)。交易行为的限制其实就是成本的对抗,永远不要小瞧敌人手里的资源,在设备指纹系统不易被篡改的情况下,换设备的成本是最高的。(这里我推荐使用我们携程风控经过不断更新迭代的设备指纹系统—chloro设备指纹系统,准确率高达98%)。
个体异常
个体异常是指某一用户的交易行为异常于该用户的历史行为,比如用户的登录地址与其常用的登录地不一致;用户IP与常用IP不一致;用户单笔交易金额远大于历史交易金额等等。通常个体异常是针对单个用户被盗或者存在养号的行为进行控制。
群体异常
群体异常通常发生在某个较集中的弱关联维度上,某个维度在一段时间内较为集中,但在交易中没有其他关联,比如某月份中发现有一批同一IP地区但是不同IP的订单问题交易,某一段时间内单个产品的购买量异常变高等等。
值得一提的是,群体异常的特征经常会受到业务促销活动的影响,所以风控规则必须考虑业务发展的影响,第一时间排除正常业务发展带来的干扰。
策略算法
决策树
机器学习中决策树是一个预测模型,它表示对象属性和对象值之间的一种映射,树中的每一个节点表示对象属性的判断条件,其分支表示符合节点条件的对象。树的叶子节点表示对象所属的预测结果。
在风控数据挖掘中,决策树算法是比较常见的机器学习算法之一。它是附加概率结果的一个树状的决策图,是直观的运用统计概率
图片:微信图片_20180508005124.jpg
决策树算法的可解释性很强,得出的结果容易理解,算法相对比较简单且速度很快,但是产生的结果比较单一,只能告诉我们订单是否存在风险,并不能在风险订单中算出哪个风险高哪个风险低。决策树只是整个机器学习领域的冰山一角,而机器学习领域是当前风控大数据分析领域的热点,还有很多很多值得我们去研究和学习。
评分卡
这个算法比决策树要更深一层次,它能够量化每个交易的风险等级,目前不少银行信贷都在使用评分卡,优点是该算法可以量化每一个变量的风险值,可以按分值区间去划分风险等级,并且在理解和分析上也比较容易,在每笔交易中可以查询到每个影响变量打分的情况以及原因。
图片:微信图片_20180508005127.jpg
该算法的难点在于变量的选择,由于这是一个拟合或回归的算法,需要一个很长的调参过程。Logistic,CART都可以对参数进行比较和调优。
策略评估
风控策略中最重要的两个指标是准确率和覆盖率,当然不同的公司或领域叫法也不一样,我们可以利用混淆矩阵来说明:
图片:微信图片_20180508005131.jpg
图片:微信图片_20180508005134.jpg
图片:微信图片_20180508005136.jpg
Precision,准确率或查准率,反映策略发现高风险中有多少实际的高风险。
Recall,召回率或查全率或覆盖率,反映真实高风险中有多少被策略识别。
理想情况下,我们希望两个指标都很高,实际上往往都是互斥的。如果准确率高,那覆盖率就低,覆盖率高,准确率就低。如果两个指标都高,那整个风控效果就非常差了。所以对于风控策略来说,需要在保证准确率的情况下,尽量提高覆盖,在保证用户体验的前提下,尽可能多覆盖欺诈订单。
总结
风控是一个对抗性很强的工作。当你有了比较强的防御措施之后,敌人就会知道他们的某些行为触犯风控规则,此时他们不会无谓地尝试浪费手里的资源。目前黑产非常庞大,他们可能拥有比风控策略还要全的一套流程和资源。这要求风控策略要不断的更新升级,而且监控、回顾和分析历史规则是一项基本的风控工作,你必须要及时地更新策略以及策略的玩法,保证你的风控策略的灵活性,你要记住你的研究对象是一群善于伪装,不断调整和改进,想尽办法模仿成正常人,享受着与风控对抗并获利的一群人,所以风控策略无时无刻不在攻防。
申明:感谢作者的辛勤原创!若在本网站转发过程中涉及到版权问题,敬请与管理员联系!以便及时更改删除,谢谢!
另:法财库目前成立了多个行业微信群【银行高管群】【商业银行群】【信托群】【券商群】【理财师群】【投行群】【私募群】【基金群】【股权投资群】【期货群】【现金贷】【第三方支付】【金融高管群】【总裁群】【互联网高管群】【汽车金融群】【融资租赁群】
扫码加群主申请入群