1.标签体系概览
1.什么是标签
标签是人为设定的、根据业务场景需求,对某一类特定群体或对象的某项特征进行的抽象分类和概括,其值(标签值)具备可分类性。例如,对于“人”这个群体,可将“男”、“女”这类特征进行抽象概括,统称为“性别”,“性别”即一个标签。
2.什么是标签体系
简单来说就是把用户分到多少个类里面去。当然,每个用户是可以分到多个类上的。这些类都是啥,彼此之间有何联系,就构成了标签体系。企业需要的多种标签进行归类、同时对标签属性加以定义,从而更方便的对标签进行管理维护。
3.用户画像标签体系
用户画像可以用标签的集合表示,当然标签类目、分类方式很多,建议采用按业务场景的分类方式,当然很多时候也会使用按统计方式分类。
2.信贷场景画像体系
信贷场景用户画像体系可以针对贷前、贷中和贷后、营销 4个场景,选取合适的数据维度来进行搭建。根据不同的业务场景,首先给出每个场景下的可用数据维度,然后给出可用特征维度,构建每个业务场景下的特征画像。最后构建一个信贷标签体系。
1.贷前画像特征
贷前画像特征可以用于很多场景,例如反欺诈、风险定价、和信用风险评估等阶段。以新客在申请阶段中的信用风险评估和风险定价为例进行介绍。在我们决定是否对客户进行授信和放款时,这时候需要考虑客户的偿还能力、消费水平、信用等很多因素。这些需要考虑的因素,我们可以从用户的基本信息、资产情况、收入情况、历史借贷情况、社交关系和行为习惯上获取,上述的数据是贷前画像主要依赖的数据。大部分信贷公司和银行信贷都会在刚开始收集用户数据的时候都会考虑必填个人基本信息的数据。很多数据来自客户申请时自填或授权获取,当然也有些数据来自外部接入,可用维度数据如下:
客户基本信息:客户基本信息是所有业务的基础,当然他也是贷前画像必须依赖的一类数据,不仅可以体现客户的来源,也可以体现客户偿还能力等。基本信息主要来自客户注册时自填,所以很多金融机构在用户注册时的信息都是必填项,还有部分数据来自客户征信报告中的基本信息项。通过搜集客户这些基本信息,我们可以描绘客户的贷前特征画像,如下图所示。
客户行为数据:客户行为数据一般都是从系统上采集下来,也是所有用户数据中比较重要的一部分数据,包括App埋点数据、消费行为数据和网页浏览数据。这些数据可以描述客户在操作行为上的偏好。对于我们更好的去营销用户有很大的帮助,贷前基于客户行为数据搭建的画像特征如下图所示。
历史订单数据:历史订单数据是用户在系统内进行贷款交易行为产生的数据,反映客户历史订单的贷款、守约或者违约情况,是贷前画像依赖的重要数据来源。可以从不通的角度分析历史订单数据,并生成我们需要的特征画像,如图所示。
设备与授权数据:客户授权数据是指用户填写或授权抓取的数据。这部分数据也是有很大的帮助,授权数据体现了客户平时的生活习惯、社会关系,有助于我们对客户进行贷款的风险评估。举个例子,比如客户使用的手机的品牌、手机价格是消费习惯的一种直观体现,我们在结合客户的职业、收入情况等,可以评估客户的整体风险,如收入偏低但短期内用多个高端手机申请借款的客户,其违约的概率会偏高。基于这类数据数据创建的画像特征,如下图所示:
2.贷中画像特征
贷中画像特征可以使用贷前的所有数据,只是他们的发生点和贷前的时间点不同而已,如“客户使用贷款类App的个数”在贷前时间点和贷中时间点的变化值可以反映客户在本公司贷款以后对资金的需求情况。当然除此之外,贷中也有贷前没有的画像特征,比如可以使用当前未完结订单数据、贷中行为埋点数据、审批结果和还款提醒数据。
使用上述数据可以创建的画像特征如图所示:
3.贷后画像特征
贷后特征画像的重点集中在还款和违约上,要反应客户在贷后的违约风险,我们将其用于贷后风险模型或规则中。贷后特征画像可使用历史订单的审批结果和贷后跟进记录,贷后客户行为数据,以及贷前与贷中的所有数据维度来挖掘不同时间点信息变化类特征。
贷后特征画像可用数据维度分为两类:一类是与贷前、贷中相比较下变化的信息。比如额度,信用等,另外一个就是关注能不能正常还款的问题,可以创建的画像特征如下图所示:
4.营销画像特征
营销特征也是我们做业务比较关注的一个方向,反应我们到底怎么去营销,营销那些人;具体营销数据分老客和新客,老客包括客户基本信息、历史申请记录信息和多头借贷信息等;对于全新客户,我们的数据积累比较少,有浏览行为数据、部分基本信息和买来的第三方数据。
基于上述信息,我们可以描绘出某一类客户的营销特征画像: