中国电信大数据普惠金融应用实例研究报告.pptx
,中国电信大数据普惠金融应用实例研究报告,数据来源:XX,报告说明,I. 数据来源,主要涵盖了中国电信运营服务中所产生的各类基本数据及通信娱乐、交互行为、位置轨迹等全域数据。,II. 概念定义, 普惠金融:指以可负担的成本为有金融服务需求的社会各阶层和群体提供适当、有效的金融服务,小微企业、农民、城,镇低收入人群等弱势群体是其重点服务对象。, 大数据:指为了适应海量、高增长率和多样化的信息资产,采用各类软硬件技术优化处理模式,使数据能够具备更强的,决策力、洞察发现力和流程优化能力。, 金融科技:指将大数据、云计算、区块链、人工智能等多项高新技术整合创新,从而使其可以全面应用于支付、清算、,融资租赁、保险、互联网金融等方面,提升金融产业的效率。, 权益方案 :指根据人群的特性兴趣,设定一系列不同的权益吸引受众。 特征映射:对字段进行相关的特征处理,映射成为建模所需要特征变量。 训练集:指在利用机器学习建模过程中,用来估计模型的样本集。, 测试集:指在利用机器学习建模过程中,用于测试训练好的模型的分辨能力的样本集。 原始变量:直接将初始字段用于建模的变量。,数据来源:XX,报告说明, 衍生变量:通过对原生变量进行加工而产生的变量。,III. 数据定义, 网络行为覆盖率:指具有相关行业网络行为的人群占总体人群的比例。, ROC曲线:受试者工作特征曲线 (receiver operating characteristic curve),是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。, AUC:Area Under Curve,ROC曲线下面面积与整个图形的占比,用来评定分类模型区分度的值。通常,AUC的,值介于0.5到1.0之间,较大的AUC代表了较好的模型效果。, 正样本:还款时间小于等于N天(约定还款期限)的用户,N值会根据业务和建模需求进行调整 负样本:还款时间大于N天(约定还款期限)的用户,N值会根据业务和建模需求进行调整。, 短信响应率:短信响应是指用户接收到短信后,按照短信内容提示点击链接或者回复相关内容;短信响应率=响应,短信的人数/发送短信的人数。,数据来源:XX,报告说明, 进件率:进件是指用户提交业务申请并填写相关资料,进件率=有相关操作的人数/短信响应的人数。 批核率:批核是指银行审核用户的资质后,准予对用户进行发卡,批核率=批核人数/进件人数。 一卡批核率:一卡批核是指首次申请该行信用卡的批核人数,一卡批核率=一卡批核人数/批核人数。 综合营销效果:综合营销效果=短信响应率*进件率*批核率*一卡批核率=一卡批核人数/发送短信人数。 促活率:促活率=响应行方活动的人数/筛选出需要营销的人数。 有值:指匹配到相关数据的客户样本。 无值:没有匹配到相关数据的客户样本。, 准确率:准确率=预测正确(将正样本预测为正和将负样本预测为负)的数量/所有样本数。, 召回率:召回率=将正样本预测为正的数量/(将正样本预测为正的数量+将正样本预测为负的数量)。 KS:KS值表示模型将正样本及负样本区分开来的能力,值越大,模型的预测准确性越好。一般,KS>0.2即可认为,模型有比较好的预测准确性。, 区间违约率:表示该评分区间内,坏样本的数量占该评分区间内所有样本数量的比例。,CONTENTS,目录,01020304,我国普惠金融发展现状电信大数据的特点及优势电信大数据金融行业应用案例解析数据融合为普惠金融发展提供空间,2005年,联合国会议, 完善金融基础设施 成本可负担 向欠发达地区和社会低收入人群扩展 价格合理、方便快捷,2013年, 发展普惠金融 鼓励金融创新 丰富金融市场层次和产品我国十八届三中全会数据来源:XX,2014年,习主席阐述经济新常态, 普惠金融关乎经济结构调整和发展方式转型、关系人民福祉,2015年, 推进普惠金融发展规划(20162020年) 从国家层面确立普惠金融的实施战略 各大金融机构也相继成立普惠金融事业部国务院正式发布规划,“一带一路”开幕式主旨演讲, 发展普惠金融; 完善金融服务网络,2017年,规划引领发展战略路线明确地位日益重要,国家大力推进普惠金融的发展,数据来源:XX,普惠金融的优势和作用,普惠金融为经济发展的转型升级提供积极的促进作用,同时增强了金融服务的可得性、获得感以及满意度。,优势价格合理 中小企业、个人可以以较低成本获得金融服务可持续性 是指可提供长期的金融服务,覆盖范围广覆盖范围广 为广大客户提供更高效、更多选择的金融服务,作用支持双创 解决初创企业融资困难问题,推动大众创业、万众创新支持三农 解决欠发达地区金融服务的可触达性问题支持经济转型升级 不再局限在个别重点行业,为多类型企业解决资金问题,当前普惠金融的制约因素,我国普惠金融虽然取得了一定成果,但也受到传统方式的各种制约,从而影响了普惠金融的发展。,制约因素数据来源:XX,信息不精准 无法有效掌握新客户的各类偏好信息 无法进行有针对性的营销信息触达营销成本高, 线上广告难以准确触达,浪费较高 线上单个用户营销成本越来越高昂,覆盖不充分 线下门店无法覆盖每一个区域 线下门店无法覆盖每一个人群征信识别难, 央行征信系统人群覆盖较少 央行征信系统接入成本较高,金融科技从三方面赋能普惠金融,云计算大数据,金融科技,利用金融科技特别是大数据手段能够提高金融机构的市场洞察能力有效解决传统金融业务中的营销和风控问题,实现精准营销并且有助于完善风控机制金融需求精准发掘能力 人群画像精准分析、用户行为精准分析 深度学习的技术建立高效模型,信用安全快速识别能力 多角度收集用户信息、人群征信维度补充 全方位的人群风险评估,提高覆盖降低成本能力 打破地域限制、人群覆盖更广泛、样本更丰富 有效降低单体成本数据来源:XX,提高促进,CONTENTS,目录,0102,我国普惠金融发展现状电信大数据的特点及优势,0304,电信大数据金融行业应用案例数据融合为普惠金融发展提供空间,电信大数据的特点提高营销的精确度和成功率提高信贷周期的风控水平和能力,数据来源:XX,中国电信大数据的优势和特点中国电信大数据资产涵盖了电信运营服务中所产生的各类基本数据及通信娱乐、交互行为、位置轨迹等数据,数据资产具有中立、横跨移固两网、多屏幕、高价值密度、基础信息完善、天然位置关联等优势。,1.数据中立性 区别于互联网公司,数据最大特点是中立,2.数据跨多行业 横跨垂直网站、电商、政府、金融、社交、服务多领域数据,3.移固数据融合 通过宽带账号、手机号码、终端串码、Cookie实现用户全网络多屏幕收敛,4.内容独特准确 现实生活交往圈、全天候位置轨迹、准确的用户信息等;多维度数据可准确关联并,高效处理和传输,基本信息,语音通信,宽带网络,移动通信/移动网络,用户位置,WiFi网络,用户触点,场景挖掘提升用户价值电信移动端用户各类网络行为覆盖率,86.8%,80.3%,64.8%,59.6%,38.9%,38.2%,29.7%,19.9%,18.8%,16.4%,15.0%,13.1%,12.2%,7.6%,6.6%,4.4%,社交通讯,电商,生活娱乐,金融,生活服务外卖团购新闻资讯交通出行,商旅,汽车,运动健身母婴亲子房产家居保健医疗社交社区教育培训数据来源:XX,可以通过网站访问、关键词搜索、APP下载、页面浏览等不同网络行为,挖掘,用户在互联网上连续的各种行为画像。通过对用户画像数据的监测,利用大数据模型,可以有效推测用户的潜在金融,需求,并进行场景化关联。,CONTENTS,目录,0102,我国普惠金融发展现状电信大数据的特点及优势,0304,电信大数据金融行业应用案例数据融合为普惠金融发展提供空间,电信大数据的特点提高营销的精确度和成功率提高信贷周期的风控水平和能力,数据来源:XX,数据拼接,数据融合可有效的发掘潜在营销需求点权益设计,用户画像,用户筛选,触达用户,模型迭代,场景化营销方案设计,采集整理各行业相关数据发掘客户实时需求将消费场景转化成营销场景用户画像补全,融合各类数据了解客户:,电商的交易数据,社交类数据网络行为数据,客户价值判定,运用深度学习预测用户多元化的金融需求交叉营销促进,对用户身份、社交、金融等属性,进行关联分析,结合业务特征交叉营销增强客户粘性,减少成本,数据来源:XX,精准用户画像能有效提高新客获取的成功率,01潜在新客识别 对样本客户分析 补全新客用户画像 挖掘需求人群用户画像用户筛选,02行为分析及场景化分类 分析用户互联网金融行为 把目标客户分群 采取不同场景进行营销权益设计用户筛选,03线索触达用户 不同用户采用不同权益 不同用户采用不同场景 多样渠道精准触达用户触达用户,04数据反馈及模型迭代 反馈各种方式营销的结果 进一步优化营销模型 提升转化率模型迭代,场景化挖掘可有效激活存客用户的消费需求,01,数据拼接,02,场景挖掘,03,价值名单,04,数据反馈,金融数据运营商数据 金融机构数据敏感度高 金融机构数据合规要求高 由运营商将数据导入银行内部进行数据融合挖,掘数据来源:XX,场景细分权益优化 确定营销方向 确定营销场景 优化不同场景下的营销方案和权益设计,维度交叉锁定用户 根据模型进行维度选择 多维交叉分析,细分客户价值 锁定场景营销的的目标客户,循环反馈迭代优化 营销方式持续反馈 根据结果循环优化模型 模型再指导营销,迭代推进 最终持续提升营销效果,CONTENTS,目录,0102,我国普惠金融发展现状电信大数据的特点及优势,0304,电信大数据金融行业应用案例数据融合为普惠金融发展提供空间,电信大数据的特点提高营销的精确度和成功率提高信贷周期的风控水平和能力,数据来源:XX,中国电信大数据征信应用技术框架,依托于运营商大数据和云计算的技术优势,可挖掘大量数据碎片中的关联性,推动征信模型不断完善,提升风控力度。,反欺诈、信用评估、决策支持、营销服务等数据可视化、人机交互技术数据分析、数据挖掘、机器学习、智能算法数据聚合储存管理:GFS MapReduce BigTable数据清洗、去噪、修正,得到可信贷数据数据整合得到数据关联性 数据采集得到数据实体结构化数据RDBMS 半结构化数据HTML 非结构化数据Document,数据应用数据管理数据源,征信机构技 交术 易服 合务 作机 平构 台数据公司,应用框架数据使用机构,提高信贷全生命周期风控质量,反馈数据,优化风控模型,实时进行贷后跟踪,监测贷款用户的网络行为,根据其通讯记录,有效寻找相关联系人数据来源:XX,普惠金融的本质是金融,但核心是风控,良好的风控体系可以使机构规避许多风险,而全生命周期的渗透可以帮助企业保持良好的运行状态,实现健康有序的发展。贷前删选,通过互联网访问行为找到新客,贷前用三元组校验用户真实身份信息,通过黑名单过滤高危用户,沉淀优质用户。贷中管理通过信用评分和资产水平评估用户等级划分,选择合适的的授信额度,避免贷后出现还款风险。贷后预警,运营商大数据,贷前:高价值用户挖掘,降低风险成本,负面信息核查 黑名单查询 不良信息核验 多头申请 异常线上行为,身份核验 冒名信息识别 “养卡”欺诈识别,通信行为欺诈 夜间通话行为分析 通话静默情况分析 联系人号码数量分析 特殊号码通话情况分析, 近三个月停机次数查询数据来源:XX,数据来源:XX,贷中:风险评分模型精准快速识别逾期风险,以多维数据联合,建立合适的贷中评分模型,加速放款速度。,数据输入,数据处理及变量筛选,特征映射,模型建立,网络数据学信数据.数据,运营商数据外部数据,统一用户标识数据降噪数据去重完整性校验原生变量 衍生变量,通信数据身份数据金融数据高法数据,数据降噪数据转化数据聚合,信用评分报告及风控审核建议,特征选择数据降维模型评估 非银线上小额现金贷模型 非银大额现金贷、消金模型, 银行信用卡模型,贷后:可实现贷后风险有效监控预警,通信行为,社交关系,消费能力,生活方式,通话行为上网情况人员属性,数据来源:XX,联系时间联系频率,社交属性偏好分析,消费层级消费方式,出行方式职住区域特征,运营商通过合规的手段,帮助金融机构获取更高价值的数据,实现更好的贷后预警,CONTENTS,目录,010203,04,我国普惠金融发展现状电信大数据的特点及优势电信大数据金融行业应用案例,数据融合为普惠金融发展提供空间,案例1某银行信用卡新客户推广案例2某银行信用卡存客用户精准营销案例3某小额贷款产品的贷中评估产品应用,选择推广信用卡范围10款主题信用卡 标准,白金,境外游,车主卡,女人卡.数据来源:XX,利用运营商数据进行存量客户画像,根据画像匹配人群属性、预测借贷意愿、匹配消费场景,促进行方信用卡的营销推广。,用户属性分析价值属性兴趣偏好信用卡需求习惯偏好 分析各类信用卡人群的属性特征,建立筛选模型,构建营销模型 通过模型输出营销指导建议,步骤1:构建信用卡新客获取营销模型,步骤2::根据数据反馈对模型进行迭代优化,模型训练及结果输出,强需求低需求,高用户价值低用户价值高用户价值低用户价值,电话、短信营销短信营销投放相应偏好场景广告用户借贷产品需求跟踪及分析,用户及渠道价值选择,模型输出指导, 采用真实样本,根据实际业务场景训练模型; 训练集AUC表现为0.75,测试集AUC为0.68,发送相同的投,放量,模型筛选出的正样本最高是旧规则的2倍。数据来源:XX,根据投放结果反馈,不断迭代优化模型,5.50%,70%,28.40%,12.00%11.20%,35%,95%,0.00%,10.00%,20.00%,30.00%,40.00%,50.00%,60.00%,70.00%,80.00%,90.00%,100.00%,短信响应率,批核率进件率,一卡批核率,模型数据,银行历史数据,步骤3:营销效果提升了8倍通过模型筛选后,信用卡营销各阶段相关指标均高于历史水平,备注: 短信响应率:点击营销短信人数/营销执行人数 进件率:填写申请材料人数/点击营销短信人数数据来源:XX,0.13%,1.13%,银行历史数据,模型数据,综合效果8倍,批核率:批核通过人数/填写相关申请材料人数一卡批核率:首次在该行办理信用卡批核人数/批核通过人数综合营销效果:响应率*进件率*批核率*一卡批核率,25%,30%5%,22.9%,0.8%,CONTENTS,目录,010203,04,我国普惠金融发展现状电信大数据的特点及优势电信大数据金融行业应用案例,数据融合为普惠金融发展提供空间,案例1某银行信用卡新客户推广案例2某银行信用卡存客用户精准营销案例3某小额贷款产品的贷中评估产品应用,步骤1:建立存客信用卡激活营销模型,通过模型训练得出,用户的历史刷卡次数、刷卡金,额、年龄、借记卡余额、客户等级,是影响客户能否被顺利激活的重要原因效果呈现: 训练集:测试集 =7:3 训练集AUC:0.81 测试集AUC:0.79数据来源:XX,营销模型特征曲线,模型相关说明有效变量:,参,照,融合数据使用,行内对照组,低分模型组,高分模型组,组细 分,仅仅使用银行内部数据进行筛选。主要包含用户的历史刷卡次数、刷卡金额、年龄、借记卡余额、,数据来源:XX 客户等级等,模型组除采用行内相关数据字段外,还使用了各类互联网场景数据,匹配后进行综合建模通过机器学习方法建立的模型,候选池样本超过总人群的20%,可营销范围极大扩充,从银行现有客户出发,结合银行内数据和运营商数据;以用户使用场景为切入点进行场景化营销。促活的可能性概率:<0.3促活的可能性概率:0.3,步骤2:构建多个用户参照组进行对比实验引入运营商数据,数据来源:XX,步骤3:针对两个模型组用户进行精准权益设计权益匹配:,根据我方数据匹配行内促活权益(吃的开心、玩的开心、淘的开心、购的开心),银行内数据,运营商数据,需求标签,生活娱乐需求,商旅出行需求消费分期需求养身保健需求,餐饮美食需求,餐饮娱乐优惠劵,商旅出行险赠送分期消费返现活动养身保健次数优惠,意外险赔付活动,权益方案需求标签,数据融合,需求匹配,权益匹配, 维持人群:该类人群金融需求多样,数量占比一般在20%以内,投入一定资源维持即可; 鸡肋人群:该类客户占比在30-40%,金融需求基本在其他渠道实现,抢回客户较为困难; 潜在人群:该类客户占比在20-30%,目前金融需求不足,继续培育用户的使用习惯 重点人群:一般占比在20-30%,已经建立一定使用习惯,需要通过手段强化使用习惯*备注:互联网金融活跃度根据用户互联网相关金融行为建模判别数据来源:XX,步骤4:选定高价值的用户触达群体手机银行促活客群价值矩阵图,鸡肋人群 维持人群潜在人群 重点人群行内手机银行业务活跃程度,高互联网金融活跃度低,高,低,针对模型组中的用户群体,筛选高价值的人群作为本次活动的触达用户,6.70%,5.40%,2.610.70%,2.8,4.2,高评分模型组数据来源:XX,低评分模型组,行内对照组,促活率,历史刷卡次数,步骤5:模型组促活率提高了2倍,三个用户组促活率对比图,图表结果分析,对照组人群的历史人均刷卡次数最高,但促活率依旧低于联合模,型筛选组,低评分模型组促活率高出对照组20%,高评分模型组促活率达到,对照组的2倍,提升2倍,CONTENTS,目录,010203,04,我国普惠金融发展现状电信大数据的特点及优势电信大数据金融行业应用案例,数据融合为普惠金融发展提供空间,案例1某银行信用卡新客户推广案例2某银行信用卡存客用户精准营销案例3某小额贷款产品的贷中评估产品应用,整体样本,总和,正样本 负样本,负样本比例,有值总和,有值正 有值负,有值负样本比例,无值总和,无值正,无值负,无值负样本比例,201606 14768 12615 2153 14.58% 11204,9905,1299 11.59%,3564,2710,854,23.96%,201607 13683 11840 1843 13.47% 11400 10201 1199 10.52%,2283,1639,644,28.21%, , ,201612 13310 10855 2455 18.44%,9381,8207,1174 12.51%,3929,2648 1281,32.60%,总和,100569 86123 14446 14.36% 80281 71479 8802 10.96%,20288 14644 5644,27.82%,步骤1:构建逾期风险评估模型,备注: 样本来源:随机抽取某贷款机构16年6月-12月放款的10万客户; 样本比例:正负样本比例为8:2 负样本(坏客户)定义:逾期大于30天的用户; 正样本(好客户)定义:逾期小于等于30天数据来源:XX,通过对用户身份数据的核验,并结合客户标签行为数据,挖掘高价值用户,降低风险成本与运营商数据总体匹配率80%,其中有值80281个,无值20288个,步骤2:模型达到了较好的预期效果,KS=0.342Ks检验:20%以上认为显著相关,40%以上认为极显著相关该模型评分的KS值为34.2%,认为和用户是否逾期是强显著相关的。AUC=0.72总体来看,该模型评分的覆盖度比较高。从各方面检验来看,其与用户是否逾期也显著相关,具有很好的参考利用价值。数据来源:XX,模型的主要指标KS值为0.342,AUC值为0.72,模型效果达到理想水平,准确率:74%,召回率:51%,若以505分作为通过阈值为例,与原模型对比,新模型将降低坏账率4.9个百分点,提升通过率,步骤3:坏账率降低了4.9%,2.2个百分点提高了识别速度、增强了识别准确率,有效降低坏账损失、提高通过率并增加收入评分较好,直接通过评分适中,人工审核评分过低,拒绝数据来源:XX,CONTENTS,目录,01020304,我国普惠金融发展现状电信大数据的特点及优势电信大数据金融行业应用案例数据融合为普惠金融发展提供空间,数据融合为普惠金融未来发展提供较大的优化空间,目前大数据金融应用还处于探索阶段,各类方案尤其是多维数据融合仍有较大的优化空间在各方推动下,大数据应用整合也在不断加速,助力普惠金融更快发展,数据整合 各方数据源统一整合应用 打破信息孤岛 关联数据能够得到有效应用,应用整合 风控应用、营销应用相关应用还较为割裂 营销和风控一体化解决方案出现并更加成熟,平台整合 具备多方整合能力的大平台将提供多样化服务 为金融机构提供全面的一站式服务解决方案, 助力金融服务发展数据来源:XX,谢谢观看,