2018年中国大数据风控调研报告.pdf
2018年中国大数据风控调研报告联合发布 爱分析 百度金融金融科技赋能普惠金融与金融基础设施2 普惠金融主旋律 中国金融服务不均衡,促使国务院发布 推进普惠金融发展规划( 20162020年) ,为社会各阶层和群体提供适当、有效的金融服务成为发展重心。但各类银行机构在客群下沉过程中,难以做到商业可持续,因此,通过大数据等科技手段提收增效成为金融机构核心诉求。 行业趋于合规 网络小贷专项整治、现金贷规范整顿、网贷暂行管理办法等一系列法律法规颁布,标志着监管套利空间消失。非持牌互联网金融公司必须积极寻求与持牌金融机构的深度合作,将积累的用户、经验以科技手段赋能金融机构。 金融基础设施建设 中国金融基础设施不健全,比如普惠金融信用信息体系、普惠金融统计体系等。新的数据获取、存储、交易、分析技术不断涌现,中国金融基础设施将完成越级式发展。2018年中国大数据风控调研报告3 金融科技最重要的是数据创新技术 从数据收集到数据应用的数据流中,涉及到大数据、 AI、区块链、物联网等各项技术。我们定义金融大数据,是覆盖数据全部流程的新技术,而不仅仅是数据分析技术。 以互联网巨头 百度 为例,百度积累了数十亿搜索数据、百亿级的定位数据和图像视频数据,形成了一张 170亿个顶点、 680亿条边的关联网络,可以有效识别骗贷团伙。 大数据技术最为成熟,区块链技术尚处于早期 现阶段,大数据不论从技术还是场景应用上都最为成熟, AI技术在算法与业务场景结合上还存在提升空间。物联网技术应用环境较小,更多是作为线上数据的补充,区块链技术还处于早期阶段,技术本身还不够成熟,距离落地应用还需要一定时间。数据是金融科技的核心2018年中国大数据风控调研报告4 根据爱分析调研成果,大数据在各领域成熟度与市场规模、基础设施和应用范围直接相关。 从三方面评估,金融大数据和其他行业相比渗透更为深入,已经进入成熟期。业务监测 业务洞察 业务优化 数据盈利 业务重塑 应用范围基础设施电子商务金 融电信公安电力制造医疗餐饮农业教育能源政务金融大数据进入成熟期数据来源:爱分析气泡大小表示大数据在该行业的市场规模2018年中国大数据风控调研报告5 从基础设施看,金融领域基础设施好,信息化、数据标准化程度高 信息化是数据化的基础,只有积累大量业务数据才能进行大数据分析,金融是最早推行信息化建设的行业,也是电子化业务渗透率最高的领域。同时,国内银行等传统金融机构多数效仿国外的信息化建设方案,与医疗、工业相比,金融领域以结构化数据为主,数据标准化程度高,数据清洗相对容易。 从应用范围看,业务由数据驱动,应用范围广 即使传统金融机构,业务也基于 IT系统,金融业务与 IT紧密结合,完全由数据驱动。大数据会对金融机构的各项业务产生变革,在金融领域应用范围广,能够影响到核心业务。 从市场规模看,金融大数据市场规模大,金融机构每年 IT投入高于其他行业 以银行为例, 2017年中国银行业整体 IT投资规模近千亿,占中国 IT投入约 5-10%。高 IT投入,意味着金融机构在大数据业务的付费意愿更高,付费能力更强,金融大数据的市场空间更大。金融大数据进入成熟期数据来源:爱分析2018年中国大数据风控调研报告7 大数据覆盖信贷领域各个流程,重点是获客、身份验证和授信环节。 获客环节建立用户画像,跟踪用户完整生命周期; 身份验证环节,通过活体识别等技术解决申请人是否本人的问题,关联分析则是利用图关联技术,找出欺诈团伙; 授信环节汇聚多方数据源,通过建模进行风险定价,金融科技服务商输出信用评分给机构使用。金融大数据在信贷领域的应用2018年中国大数据风控调研报告8金融大数据在信贷领域的应用案例(一):智能营销 基于海量多维数据构建全渠道智能化客户经营体系,真正做到智能营销2018年中国大数据风控调研报告9金融大数据在信贷领域的应用案例(二):反欺诈2018年中国大数据风控调研报告 百度金融 科技 产品服务体系在反欺诈领域的应用,通过数据和技术甄别信贷领域的潜在风险10金融大数据在信贷领域的应用案例(三):关联分析2018年中国大数据风控调研报告 依托图关联技术,帮助金融机构有效识别隐藏在网络中的黑产信息,在团伙欺诈、黑中介识别等领域广泛应用11金融大数据在信贷领域的应用案例(四):风险定价2018年中国大数据风控调研报告 从数据收集到风险定价,构建基于场景的多维度风控系统12 大数据在理财领域的应用重点是营销获客和智能投顾 营销环节与信贷领域类似,通过建立用户画像实现精准营销; 智能投顾包含 KYC和匹配环节,重点是分析用户风险偏好,同时将 KYC与 KYP结合,实现智能匹配; 未来,金融大数据将向理财的上游资产管理延伸,提升资管效率。金融大数据在理财领域的应用2018年中国大数据风控调研报告13金融大数据在理财领域的应用案例:智能匹配2018年中国大数据风控调研报告14 大数据改变保险领域产品理念,降低各环节人力投入 借助大数据技术,保险公司能够跟踪用户行为数据,产品设计更加关注用户全生命周期价值; 通过在各险种建立垂直知识图谱,能够缩短客服人员的培训周期,提高客服效率; 在核保核赔环节,可以利用图像识别等技术,用技术手段降低欺诈风险。金融大数据在保险领域的应用2018年中国大数据风控调研报告15金融大数据在保险领域的应用案例:智能理赔2018年中国大数据风控调研报告16 大数据在支付领域的核心应用是交易反欺诈 通过设备指纹、人脸识别、用户行为习惯等方面预先建立交易反欺诈引擎,并根据事后的反馈数据不断优化模型。金融大数据在支付领域的应用2018年中国大数据风控调研报告17金融大数据在支付领域的应用案例:交易反欺诈 基于大数据分析的风险监控系统,通过分析用户网上交易行为,快速侦测异常行为并作出反馈。2018年中国大数据风控调研报告19 对机构而言,大数据风控是金融机构的通用需求 不论是银行还是消费金融公司,金融机构普遍有风控需求,底层业务逻辑几乎完全相同,只是面对客群、风险偏好存在差异。 对机构而言,风控是金融机构核心能力 银行等传统机构本质上是风险经营。一方面,监管层对金融机构的风控能力提出很高要求,另一方面,风控直接会影响金融机构的利润水平。因此,大数据风控直接解决金融机构的核心需求,价值度最大。 对金融科技服务商而言,以风控切入的大数据公司未来发展空间更大 风控是金融机构的根基,因此金融机构会采取审慎态度选取大数据风控厂商,建立信任周期长,但合作紧密度更深。风控合作涉及用户全生命周期数据,风控厂商有机会借数据切入到其他应用场景,未来发展空间更大。 对金融科技服务商而言,大数据风控门槛高,综合能力要求高 与精准营销相比,大数据风控门槛更高,对厂商的要求不光是技术和数据,还需要对金融业务场景的深入理解。大数据风控综合价值最大,领跑应用领域2018年中国大数据风控调研报告20大数据风控发展历程:行业趋于合规2018年中国大数据风控调研报告21 大数据、 AI技术的融合和优化,提升大数据风控效果 活体识别、 OCR、声纹识别、虹膜识别等多种技术融合,提供更加全面的身份识别,降低欺诈风险的发生。 通过算法调优和计算能力提升,半监督学习等新技术正在应用到反欺诈等风控场景,降低对专家经验和数据的依赖。 区块链技术使数据共享成为可能,彻底解决数据孤岛问题 区块链解决了数据共享的信任问题,规定了数据使用的边界,保证了数据的一致性。通过区块链建立多方数据共享平台,解决数据孤岛问题,将降低金融机构获取数据的门槛与成本。 物联网提供线下数据,丰富数据维度 通过传感器等设备采集线下数据,如车联网数据,将丰富车险驾驶行为数据维度,从而实现风险定价。 建立金融云平台,毫秒级响应 通过金融云平台,金融机构可以处理 PB级数据,同时应对百万流量,极大提高风控系统的响应速度。大数据风控技术趋势:新技术融合提升风控效果2018年中国大数据风控调研报告22 优质客群集中于大型金融机构 普惠金融市场集中度虽然分散,但由于 Tier I和 II等大型金融机构占据客户资源优势、资金成本优势,必将在普惠金融领域处于绝对主导地位,是金融大数据公司最佳客群。 强监管时代到来,非持牌金融机构市场规模逐步萎缩,金融大数据客户总量在减少。同时,头部客户的市场份额进一步提升,争夺 Tier I和 II客户是金融大数据公司重中之重。 由于数据匮乏,农村金融市场尚未崛起。一旦数据基础设施完善,农商行等金融机构将上升为 Tier III甚至 II级别客群。 需求深度从数据提升到分析 金融机构早期需求以数据为主,通过补充不同维度数据弥补风控缺陷。随着数据源市场集中度提升, Tier I金融机构已经不满足于单纯的数据合作,对于联合建模的需求在不断加强。未来,大数据风控市场规模一半来自数据,另一半来自分析。大数据风控客群分析:优质客群是抢夺重点2018年中国大数据风控调研报告23 根据 Burton-Taylor研究, 2015年北美(含加拿大)Credit, Fraud, Risk and Compliance Data/Analysis市场规模 148.7亿美元 根据美国行业统计数据, 2010年,三大征信局在美国征信市场占有率 61.8%, 2015年微升至 63.5%。由此推断,美国整体征信市场规模约 100亿美元 两组数据交叉验证,同时由于美国市场基本成熟,行业增速低,预测 2017年大数据风控市场规模在100-120亿美元120亿美元2017年美国大数据风控市场规模140亿元2017年中国大数据风控市场规模 大数据风控市场规模的基础是居民消费贷款余额(不含住房贷款): 2017年 Q3末,美国 3.77万亿美元,中国 9.1万亿元,美国与中国比例 2.7: 1 中国市场大数据风控所覆盖人群不及美国,同时大数据风控应用依然集中于信贷领域,其他领域应用尚不成熟 综合分析, 2017年中国大数据风控市场规模约 140亿元。大数据风控市场规模分析: 2017年国内市场规模 140亿2018年中国大数据风控调研报告24 从数据调取到评分卡 +专家咨询 大数据风控公司目前以征信报告等数据输出为主,建模等分析能力输出为辅,因此收费方式以数据调取量为核心。随着金融机构第一方数据积累以及第三方数据源壁垒降低,输出数据分析能力将成为大数据风控公司更好的商业模式。因此,提供标准评分卡产品 +数据科学家咨询能力,将成为新的商业模式。 效果付费是未来终极商业模式 数据驱动成为金融机构共识,搭建统一大数据平台,解决内部数据孤岛问题,是越来越多金融机构的发展方向。以风控切入的公司可以逐步成为整个数据平台的供应商,与金融机构一起开发更多基于数据的应用。 未来,具备流量优势的大数据风控厂商有机会帮助金融机构解决从获客到风控的全流程需求,实现按业务流量收费的终极商业模式。大数据风控商业模式分析:效果付费是未来终极商业模式2018年中国大数据风控调研报告25大数据风控市场格局:四类玩家竞争2018年中国大数据风控调研报告 中国市场,互联网巨头、产业类公司、创新型公司和 IT类公司等四类玩家通过数据、技术、客户三个方面切入大数据风控领域。 美国市场的玩家则通过数据和技术两个方面切入大数据风控领域。26 安全法落地提升数据源市场集中度 网络安全法实施打击数据黑市交易,合规数据价值提高。 百行征信入场,降低数据获取门槛 百行征信,由行业协会主导的数据共享平台即将成立,有助于解决非央行征信覆盖人群的数据孤岛问题,降低了整个行业获取数据的门槛。互联网巨头和产业类公司原有业务中积累了大量高附加值数据,但百行征信入场后,数据源价值将被降低。 与央行征信中心具备行政命令权不同,百行征信属于互联网金融协会主导的市场化公司,在数据采集能力上存在一定不确定性,数据源领域依然存在变数。大数据风控市场集中度:百行征信入场提升数据源集中度2018年中国大数据风控调研报告 开源降低技术门槛,产品化趋势影响 IT外包厂商,促使数据分析趋于集中 Tensorflow、 Hadoop等开源技术,从基础设施层面降低大数据分析、机器学习算法的研发门槛,数据分析厂商很难靠单一技术建立门槛,必须与业务场景结合,数据分析市场的综合门槛反而在提高。 传统数据分析市场存在大量 IT外包厂商,处于碎片化市场,新技术的发展促使碎片化市场有望集中。一方面,容器技术大大缩短产品部署上线的周期,另一方面, PaaS平台提升了产品的自定义性和配置性,能够满足企业个性化需求。 客群趋于集中,头部风控厂商占据大部分市场份额 大数据风控的客群集中在持牌金融机构,客户数量减少。同时,头部风控厂商能够与标杆客户进行深度合作,占据单个客户的大部分风控预算,因此,大数据风控市场的集中度会逐步提高。 数据分析领域,互联网巨头技术领先 数据获取门槛降低之后,数据分析能力的价值度得以凸显。互联网巨头入局早,而且拥有强大的自营业务,大量数据训练出的建模分析优势明显,将成为数据分析领域规模最大的市场占有者。大数据风控市场集中度:数据分析市场,互联网巨头占据先机272018年中国大数据风控调研报告29 大数据风控业务依赖数据和建模 即使受到百行征信影响,数据依然是个重要竞争力。建模能力一方面与技术、算法积累有关,另一方面与业务场景的理解有关,因此,技术和场景理解是另外两个重要竞争力。 营收增长与客单价和客户数有关 大数据风控厂商在技术研发上会长期高投入,因此更加关注营收增长。营收增长主要与客单价和客户数有关,客单价与客户群体的付费能力直接相关,客户数则是考验获客能力。技术、数据、场景理解、客群和获客是核心竞争力2018年中国大数据风控调研报告30 从底层系统搭建到上层算法调优,大数据风控需要构建完整技术架构。从开源技术及算法到企业级产品中间还需要解决很多技术问题。 经验丰富、具备前瞻性的技术负责人 快速研发算法的能力 搭建能够处理海量数据的底层技术架构能力 开发企业级产品的能力,良好的用户交互界面,稳定可靠的系统互联网巨头凭借多年互联网业务的技术积累,从底层技术架构到上层算法都占据绝对优势,创新公司在技术上的投入要大于产业公司和 IT类公司。技术2018年中国大数据风控调研报告以百度金融 科技产品 为例31 除了金融相关数据,大数据风控还需要大量用户行为数据进行模型训练和调优。 海量数据,覆盖足够多的用户 用户数据价值密度高、噪音少,数据清洗容易 用户数据维度多,能够形成丰富的用户画像 自身业务场景能够获取有价值数据 拥有大量反馈数据,利于模型调优互联网巨头积累了大量用户行为数据,同时也拥有大规模自营金融业务数据。因此,不论是数据量还是数据维度都远超其他公司。产业类公司自身业务积累了大量高附加值数据,创新型公司和 IT类公司数据资源相对较少。数据内部数据源外部数据源百度 金融科技产品 数据来源2018年中国大数据风控调研报告以百度金融 科技产品 为例32 建模能力要求厂商对客户的业务场景非常理解。 经验丰富的建模团队和行业专家队伍。 服务过行业标杆客户,了解客户的业务场景。 有自营金融业务基础,深度理解业务需求。互联网巨头、产业类公司通过自身业务积累对金融场景的理解,创新型公司核心团队拥有丰富金融背景,对场景的理解要强于 IT类公司。场景理解2018年中国大数据风控调研报告33 大数据风控是 To B业务,客户决策周期长,获取标杆客户非常重要。 搭建一支能够服务大型客户的销售团队 服务过行业标杆客户 搭建完善的渠道、合作伙伴体系 在行业中建立品牌影响力IT类公司长期服务金融机构,具备很强的客户关系。互联网巨头入场不久,已经和四大行达成战略合作,获取了行业标杆客户,未来成长性强。获客2018年中国大数据风控调研报告34 To B领域获客成本高,生命周期价值高的客群更有价值。 客户自身业务规模,在 IT领域的投入规模 客户自身未来发展空间、成长性 客户对风控的依赖程度,技术渗透情况。Tier I客群生命周期长,而且客单价高, LTV(生命周期总价值)最为显著。非持牌金融机构本身竞争激烈,而且受政策监管,生命周期短、客单价低,LTV较差。各类公司都在持续提升目标客群等级。百度金融等互联网巨头已经与 Tier I中的典型客户四大国有银行展开合作,占据行业中的优质客群。客群2018年中国大数据风控调研报告35 互联网巨头在数据、技术和场景理解方面都占据优势,发展前景最好,未来市场空间最大。 创新型公司的技术能力、场景理解能力强,但在获客层面有瓶颈,很难与大型金融机构形成深度合作。 产业类公司具备数据优势,但百行征信入场后,数据优势会被削弱,未来需要补强技术方面的短板。 IT类公司具备较强客户资源,对金融业务场景的理解弱于其他厂商,发展前景会受影响。互联网巨头机会最大2018年中国大数据风控调研报告37 百度 2013年开始互联网金融业务, 2015年 12月 14日,百度整合原有金融业务成立金融服务事业群组( FSG),由高级副总裁朱光全面负责,并上升为百度战略级位置。 百度金融在支付、消费信贷、理财、资产管理、银行、保险等领域都有自营业务,将百度 AI技术注入金融,通过自营业务打磨和验证,将成熟的金融科技能力和产品对外输出,打造金融科技开放平台。 2017年 6月,百度与农业银行达成战略合作,是百度金融科技输出的里程碑。案例分析 -百度金融科技2018年中国大数据风控调研报告38 百度金融科技开放平台 :以百度云计算、大数据和人工智能的科技能力为基础,为银行、互联网金融机构等提供身份识别、反欺诈、信息核验、信用分等系列产品能力及一体化解决方案的金融科技开放平台。产品类别业务痛点应用场景百度金融科技产品2018年中国大数据风控调研报告39 百度金融自 2013年探索互联网金融业务,在信贷、理财等金融业务耕耘多年,有较深的经验积累。 与农业银行等战略级客户深度合作,在服务众多头部金融机构的过程中进一步增强业务场景的理解能力。从自营到金融科技输出,业务场景理解能力强2018年中国大数据风控调研报告40 百度在全球有三大实验室(深度学习实验室、硅谷人工智能实验室、大数据实验室)、六大研发中心和上万研发人才。百度技术基因注入百度金融,技术与产品行业领先2018年中国大数据风控调研报告41 百度每天拥有数十亿级的搜索数据、百亿级的定位数据和图像视频数据,形成了一张 170亿个顶点、 680亿条边的关联网络,可以有效识别骗贷团伙。 百度数据有自营业务的事实结果数据和合作机构的统计数据反馈,可不断修正完善模型。数据规模大、维度丰富且形成闭环2018年中国大数据风控调研报告42 随着自营金融业务和金融科技业务的发展,百度海量数据的金融属性在不断增强。3000+个四级标签6.8亿用户14款过亿用户 APP8亿移动设备行为数据源金融属性不断增强2018年中国大数据风控调研报告43 技术 /产品: 百度在 AI领域重金投入多年,有三大实验室和上万研发团队,以及中国最大的 GPU集群,技术实力雄厚,将百度 AI技术不断注入金融业务,在通过自营业务验证和沉淀后对外输出,可直接通过 SDK或 API调用,产品化率高。 数据: 百度体系内生数据量庞大,数据维度丰富,且数据金融属性不断变强,同时辅之以外部数据和客户数据;自营金融业务和合作伙伴能形成数据闭环反馈。 获客: 有农业银行、招商银行卡中心和泰康人寿等标杆客户;半年内合作头部金融机构众多,获客能力强。同时, 百度依托自身的流量优势及对于人群画像的精准优势 ,能够帮助金融机构解决更多问题。 客群: 以银行、保险公司和持牌消费金融机构等大客户为主,目标客群是行业中 Tier I级别机构,客单价高,生命周期长。同时,从标杆客户深度合作做起,从大客户往下做客群下探,产品和解决方案的可复制性强。 场景理解: 自 2013年开始探索互联网金融业务,多年业务经验积累,覆盖信贷、理财、支付、银行、保险等各领域金融业务,覆盖范围广;且百度金融与头部金融机构的合作中,进一步加深对业务场景的理解能力。百度金融科技 -核心竞争力2018年中国大数据风控调研报告44关于爱分析2018年中国大数据风控调研报告爱分析 ifenxi是一家专注于创新领域的投研机构,以企业价值研究为内核,服务机构投资者和企业决策者。爱分析重点关注技术和数据创新,以及由此带来的商业模式、行业与市场以及产业链变革机会,覆盖领域包括新金融、企业服务、大消费、医疗健康等。截至当前,爱分析已调研以上领域优质企业超过 1000家,涵盖一、二级市场及新三板,并撰写超过百份行业和企业调研报告,系统积累了各个细分赛道及企业标的研究方法和评价体系,并形成了独到的洞见。爱分析成立于 2015年 8月,已拥有一支规模为 30人以上专业投研团队,核心团队及分析师主要毕业于清华、北大、人大等高校。自 2017年 8月开始,爱分析正式对外提供投研和咨询服务,并已服务众多客户,包括国内主流一二级机构投资者、行业标杆企业以及上市公司。45关于百度金融2018年中国大数据风控调研报告百度金融服务事业群组 (FSG)成立于 2015年 12月 14日,由百度高级副总裁朱光全面负责,是百度又一大战略级业务布局。百度金融以“用科技为更多人提供值得信赖的金融服务”为使命,积极布局涵盖消费金融、理财资管、钱包支付、互联网银行、互联网保险等多个金融领域板块在内的全业务版图,已与中国农业银行、南京银行、维信金科等金融机构达成战略合作,力求通过搭建智能金融服务平台与合作伙伴实现共赢。百度金融科技开放平台( fintech.baidu)是百度金融以人工智能、大数据、云计算为代表的科技能力为基础搭建的金融科技产品开放接入平台,旨在为银行、互联网金融机构等接入身份识别、反欺诈、信息核验、信用分等系列产品能力提供一体化方案。