2017-2018中国计算机视觉行业研究报告.pptx
<p>2017-2018中国计算机视觉行业研究报告,2,。,摘要深度学习主要提升的是计算机视觉领域分类任务的准确率;开源环境仅降低计算机视觉领域的入门技术门槛,前沿算法的技术壁垒依然存在;计算机视觉比赛成绩、论文成果不直接代表技术团队解决实际业务问题的能力。SMS2017年中国计算机视觉规模预期为40亿,凭借安防领域的爆发性增长,预期2020年将增长至725亿。前端嵌入式智能系统的渗透率将逐步提升,与后端协同智能计算,加速产业智能升级。算法迭代将不断提升限定场景识别准确率,加速渗透为各行业应用赋能。前沿算法之外,计算机视觉公司的商业壁垒有赖于产品、服务、市场等综合建设。来源:XX研究绘制。,3,计算机视觉技术概述计算机视觉行业概况计算机视觉的应用场景计算机视觉典型公司案例计算机视觉行业发展趋势,12345,4,计算机视觉的概念与行业主要应用计算机视觉横跨感知与认知智能,现阶段应用以感知为主视觉使人类得以感知和理解周边的世界,人的大脑皮层大约有70%的活动在处理视觉相关信息。计算机视觉即通过电子化的方式来感知和理解影像,以达到甚至超越人类视觉智能的效果。从1966年学科建立(MIT:The Summer Vision Project)至今,尽管计算机视觉在感知与认知智能方向仍有大量难以解决、尚待探索的问题,但得益于深度学习算法的成熟应用(2012年,采用深度学习架构的AlexNet模型,以超越第二名10个百分点的成绩在ImageNet竞赛中夺冠),侧重于感知智能的图像分类技术在工业界逐步实现商用价值,助力金融、安防、互联网、手机、医疗、工业等领域智能升级。2017年下半年,数家计算机视觉公司单笔融资上亿美元,再次将计算机视觉推向人工智能领域最受关注的方向之一。本报告聚焦于计算机视觉技术现阶段在工业界的应用与研发,将在对相关技术热点及产业整体做概述性介绍的基础上,对典型应用的具体使用场景分领域论述,希望理清现状,写明征途,供产业界、投资界、政策制定者及关注人工智能领域的社会各界以参考。因报告研究对象以技术层创业公司为主,偏颇遗漏之处,敬请指正。,涉及常识推理、语义理解、规划决策等问题难以定义或用函数逼近认知智能感知智能通常为对声、光、电等物理信号做简单分类大致可用函数来逼近来源:XX根据专家访谈、XX等研究绘制。,安防领域 金融及互联网领域自动驾驶领域环境感知 高精地图 定位,手机及娱乐领域影像分类 影像处理 AR特效工业领域产品质检 3D分拣无人机/机器人领域环境感知 定位 自动避障,计算机视觉的典型应用,视觉感知小有所成,视觉认知道阻且长,通过电子化的方式感知和理解影像,计算机视觉,疑犯追踪 视频结构化 刷脸认证零售领域 广告营销领域商品识别 自动化挖掘影像内容广告位医疗领域医疗影像分析,5,计算机视觉的学术研究任务现阶段有较好商业化进展的主要为语义感知中的分类任务与人类实时选择性处理视觉信息不同(如人在驾驶时不需在意公路边草地的纹理或形状,也不用知道每辆车的确切形状),计算机仍难以从实际需求出发自主选择性输入并计算影像信息,通常需要人类对具体任务进行分解并使用与之匹配的计算方法,建立完整理想的智能视觉系统仍有很大挑战。另外,与可结合常识做猜想和推理进而辅助识别的人类智能系统相比,现阶段的视觉技术往往仅能利用影像表层信息,缺乏常识以及对事物功能、因果、动机等深层信息的认知把握。计算机视觉的学术研究任务(部分)来源:XX。,6,核心算法之深度学习深度学习的概念及成就深度学习算法由多重非线性变换构成多个处理层,辅以复杂结构设计和各种梯度技术,通过对大量样本的输入与对应输出数据的抽象计算,拟合出一个可处理新输入信息的函数模型,解决其分类或预测问题。尽管神经网络(可理解为深度学习算法的前身或别称)的研究历史其实比计算机视觉的研究历史还要长,但在之前的研究过程中,深度神经网络的方法并未得到有效验证。直到2011年,语音识别领域凭借深度学习取得重大突破;2012年,AlexNet,一个8层的神经网络,以超越第二名10个百分点的成绩在ImageNet竞赛中夺冠(图像分类的Top 5错误率为16.4%),深度学习终迎来包括学术探索与工业应用中的热潮。不断提升的层数逐步提升计算机分类视觉的准确率,2015年夺冠的 ResNet 深达152层,以3.57%的错误率超越人类视觉的5.1%。,深度学习与传统方法的区别,样本数据,人工设计特征,分类模型,样本数据,分类模型,端到端学习,传统方法,针对不同类别的物体,一般首先由研究员充分发挥聪明才智,手工定义不同的特征,然后利用不同的机器学习算法(分类器学习),这时的算法一般仅有两到三次非线性变换,学到的参数较少(浅层学习);深度学习则通过机器学习自身来产生特征,因此特征和分类器学习不再有区分。如今深度学习的算法已可达上千层。传统方法,深度学习机器学习特征,分类器学习,ImageNet Large Scale Visual Recognition 2010-2015,28.2%,11.7%,7.3%,6.7%,152,82012,82013,192014,222014,3.6%2015,错误率(5 Guesses),神经网络层数,浅层学习2010 2011,25.8%深度学习夺冠16.4%,7,核心算法之深度学习数据与算力是深度学习的重要支撑日益丰富的影像内容为深度学习算法提供了大量的数据支撑。据思科公司评估,2021年单月上传至全球网络的视频总时长将超过500万年,每秒将诞生1百万分钟的网络视频内容,网络视频流量将占据全球所有网络用户流量的81.44%。需要说明的是,现在的学习多为有监督学习(需要对数据进行充分标注),而且并非所有类型的影像数据都易得易标注(比如医疗影像数据需由专业医师标注病灶),业界领先的视觉公司一般会有数百人的标注团队(多为外包,但需专业培训,实时指导)。另一方面,深度学习学习过程中的“训练”与应用部署后的“推断”均涉及大量并行计算,传统CPU算力不足,而GPU、FPGA (现场可编程门阵列) 、ASIC (TPU、NPU等AI专属架构芯片)等具有良好并行计算能力的芯片可提供数十倍乃至于上百倍于CPU的性能,与云服务一起,大幅缩短计算过程(在过去,往往数周甚至数月才能跑出一次结果,然后调整模型架构,效率极低),易于短期调整多种模型架构,显著提升分类模型的进步速度。2010年以后,CPU内部晶体管数量的增长明显放缓,传统摩尔定律失效, 而GPU类处理器依然保持着快速增长的势头(2016年GPU的计算力为10个TFLOP/S ,2017年达到了120个TFLOP/S ,TPU则实现了惊人的180个TFLOP/S ),验证着AI时代的摩尔定律。,来源:XX研究绘制。,并行计算能力有效提升模型计算效率,57116,75109,98182,125853,159161,74.73%,77.00%,79.02%,80.42%,81.44%,2017-2021年全球网络视频用户流量,2017e 2018e网络视频用户流量 PB/月,2019e 2020e 2021e网络视频用户流量在总流量中的占比,GPU、FPGA、ASIC等并行运算处理器,在云端服务器、用户终端等助推模型训练与推断,8,热门技术之人脸识别人脸识别是当下视觉领域热门应用的重要技术支撑人脸识别可看做语义感知任务中针对人脸影像的分类问题,也是当下视觉领域热门应用的重要技术支撑,各个环节都因深度学习算法的推进实现了更优的计算结果。泛金融领域的远程身份认证、手机领域的刷脸解锁一般属于人脸验证(技术相对成熟);安防影像分析一般为人脸识别,刑侦破案对亿级甚至十亿级比对有刚性需求,目前技术仍有很大进步空间,更,人脸检测检测出图像中人脸所在位置,人脸配准定位出人脸的五官关键点人脸提特征,人脸属性识别识别出人脸的性别、年龄、种族、表情等,女性 28岁平静 不戴眼镜颜值92,女性 28岁平静 不戴眼镜颜值92,多新功能、新场景的解锁依赖于最先进的算法团队和相关业务领域开拓者的共同努力。人脸识别的技术流程,将人脸图像转化为人脸特征(固定长度的数值串)人脸比对 衡量人脸间的相似度,人脸验证1:1识别判断两张人脸是否为同一人来源:XX根据专家访谈、XX等研究绘制。,人脸识别/检索1:N识别将人脸与库中N个身份逐一比对,人脸聚类将库中人脸根据身份进行分组身份来自相似度分析,9,来源:XX根据专家访谈、XX等研究绘制。,数据处理与实际业务场景相关的数据才有价值,基,于对影像数据的不同理解所选择的不同筛选及标注策略会对模型训练的效率及最后的性能产生重要影响。,算法模型训练没有普适的深度学习框架,需要贴合自身应用场景优化甚至开发自己的深度学习框架,便于及时调整满足个性化需求。,计算集群管理结合GPU、CPU等多种计算硬件的不同特性为各类AI 系统的研发提供基础设施层面的保障,分布式、高性能、可扩展,降低AI 系统和新技术的研发时间成本。,应用端性能优化需提升运算效能以匹配不同设备特性。在,应用端计算能力有限的情况下,需要对网络架构进行调整,可在保持精度的同时显著降低功耗。,公司能否提出引领业界的创新网络模型进而率先突破工业化红线,或能否在开源后快速重现、超越论文实验结果有重要影响。,网络设计深度学习人才极度稀缺,相关技术积累对,开源环境与技术壁垒开源环境仅降低计算机视觉领域的入门技术门槛工业界和学术界先后推出了用于深度学习模型训练的开源工具和框架,包括Caffe、Theano、Torch、MXNet、TensorFlow、PaddlePaddle、CNTK等等,极大降低了人工智能技术在工业实践中的入门门槛。尽管不同框架各有所长,但它们并不能真正满足企业在处理实际复杂业务时所面对的挑战,性能、显存支持、生态系统完善性、使用效率等不同层面的不足要求企业需要针对性的调整框架以适合自身业务所需。而在数据处理、计算集群管理、网络设计、应用端性能优化等若干重要环节都存在各种各样非开源技术或已成熟方案所能解决,极度依赖相关技术专家去探索求解的重要问题。对于前沿算法的突破创新以及算法在不同使用环境中的优化升级,不同公司的技术高低差异依然很大。深度学习算法研发中的重要环节,10,计算机视觉比赛的是与非比赛的意义在于推动算法思想的进步2007年由李飞飞教授发起的ImageNet计划将人工智能领域的影像数据推向了前所未有的规模,至今已有1400万张经过人工清洗标注的图片,含有2万个分类,为计算机视觉领域做出巨大贡献。自2010年每年一度的ImageNet物体识别竞赛(对1000类接近50万张图片的单标签识别),更是成为了计算机视觉领域最受关注的比赛。2017年,ImageNet举行了最后一届图像分类竞赛,Top 5的错误率降至2.25%(大幅领先人眼),该竞赛完成了历史使命,而更多的关于图像语义分割(像素级的分类问题)、1:N人脸识别、图像及视频理解(看图写话)方向的数据集与比赛将逐步登上舞台,推动更多领域更贴近真实世界场景的算法革新。,计算机视觉的数据竞赛成果(部分),计算机视觉比赛的价值,算法思想视觉比赛的算法设计一般不太考虑对计算资源的消耗和实际场景的可用性,所以相关算法不能直接用于实战。比赛成绩或许可用来判断对方技术是否位于世界前十,但并不代表相关公司服务客户、解决实际问题的能力。比赛的意义在于推动算法思想的进步,能否提出创新的思想更重要。来源:XX根据专家访谈、XX等研究绘制。,11,计算机视觉技术概述计算机视觉行业概况计算机视觉的应用场景计算机视觉典型公司案例计算机视觉行业发展趋势,12345,12,服务器 芯片 传感器,计算平台,数据,公共安全,金融,互联网,手机,交通,医疗,零售,智能硬件,说明:本报告的调研对象以2012年深度学习爆发以后的创业公司为主,未能对起步于传统方法做视觉相关业务的公司做充分研究,因此本图谱未包含OCR、传统门禁等相关领域。,基础层数据及计算资源,应用层技术使用者,工业,安防影像分析,泛金融身份认证,手机及互联网娱乐,自动驾驶,医疗影像分析,批发零售商品识别工业制造,技术层算法、产品及解决方案提供者,嵌入式智能系统广告营销,2017年中国计算机视觉行业图谱计算机视觉行业图谱,13,SDK向客户提供核心算法模块在用户端或客户的服务器端完成视觉计算基于对数据的保护或实时性要求手机及互联网娱乐公司多采用此种形式结合授权设备量及授权周期定价SDK服务多采用此种收费方式解决方案也可能采用,解决方案向客户提供较为全面的软硬件集成解决方案可能涉及软件系统、嵌入式解决方案前端硬件设备、专有服务器部署等公安、银行多采用此种形式结合具体项目收费后续每年可有升级维保收入解决方案多采用此种收费方式API和SDK也可能采用,计算机视觉公司的主要商业模式主要服务方式,API提供云端比对识别服务弹性、灵活、高效互联网金融公司多采用此种形式主要收费方式按调用量或包时收费API服务多采用此种收费方式来源:主要为技术层公司的商业模式,XX根据专家访谈、XX等研究绘制。,14,计算机视觉行业市场规模中国计算机视觉行业市场规模2016年下半年,1:N人脸识别、视频结构化等计算机视觉相关技术在安防领域的实战场景中突破工业化红线,敲响了计算机视觉行业市场大规模爆发的前奏。伴随人脸识别、物体识别等分类、分割算法不算提升精度,在2017年占比较高的安防、视频广告、泛金融、手机及互联网娱乐领域之外,医疗影像、工业制造、批发零售等现阶段的创新领域也将逐步解锁,成为行业整体快速发展的重要支撑。,来源:XX研究绘制。市场规模的统计推算以产业图谱中的技术层企业收入为主,侧重于以视觉算法为主要构成的云服务、SDK及软件产品的相关收入,也包含一定集成视觉算法及其他丰富功能的软件系统,还有服务器、传感器、整体硬件设备系统的收入,其中泛金融解决方案以后两种收入为主。鉴于自动驾驶技术相对综合且处于早期研发阶段,与驾驶相关的视觉技术(包括司机疲劳检测、ADAS、自动驾驶等)收入并未包含在内。,67.9%,18.1%,4.0%,3.8%,3.7%,1.7%,0.9%,2017年中国计算机视觉行业市场构成,安防影像分析,广告营销,泛金融身份认证(解决方案),互联网娱乐 泛金融身份认证(云服务、SDK等) 手机创新领域来源:XX研究绘制。2017年中国计算机视觉行业市场构成为预期构成。,11,40,120,319,725,264%,200%,166%,127%,2016,2017e,2018e,2019e,2020e,市场收入/亿元,增长率,2016-2020年中国计算机视觉行业市场规模,15,实时性好降低带宽压力保护数据隐私提升后端效率和整体分析质量前端设备计算(边缘计算)来源:XX根据专家访谈、XX等研究绘制。,资源强大可运行复杂算法实现高级功能设备配置与故障筛查相对简单后端服务器计算(计算中心计算),嵌入式感知系统加速产业智能升级前端智能的渗透率将逐步提升,与后端协同智能计算伴随AI专用芯片及嵌入式感知系统的成熟研发,前端设备即可完成相对基础的视觉感知,并将识别、分类的结果实时应用,实现前端智能。对于需要大量计算、存储资源,利用多维度数据关联分析的诸多场景,后端服务器计算依然是当前主流。前端智能的渗透率将逐步提升,与后端智能协同加速产业升级,不仅可满足特定场景对实时性、隐私性的要求,还可在前端成像(千万像素、千帧/秒)提供越来越多数据信息的背景下,让前端智能选择预处理过的结构化的高质量数据及分析结果传输至后端,减少因带宽压力过大导致的丢包、压缩所引起的信息丢失或误差,提升智能分析的准确性。前端智能系统的功耗、稳定性、存储空间、数据及系统更新的网络传输等诸多重要问题仍有待解决,现阶段主要通过压缩算法模型、挖掘硬件潜力以及在压缩模型的同时针对现有芯片进行优化的方式来解决功耗有限、运算能力低的问题。前端智能 VS 后端智能,结构化数据协同渗透 助推AI产业升级,16,计算机视觉技术概述计算机视觉行业概况计算机视觉的应用场景计算机视觉典型公司案例计算机视觉行业发展趋势,12345,17,道路卡口,车站,地铁站,机场,黑名单库,动态,视,频,人脸比对,人脸抓拍,比中,出警来源:XX根据专家访谈、XX等研究绘制。,安防影像分析领域主要应用场景之人脸识别对道路卡口、车站、地铁站、机场等地方的监控视频进行智能分析,检测出动态视频中的人脸与黑名单库中的影像记录做实时比对,比对成功则立即报警推送给警务人员处置。安防影像分析之人脸识别,18,海量视频内容,结构化视频,智能分析自动化处理,识别出特定的人、车辆、物体或者事件实现对关键目标的监测、跟踪、属性分析来源:XX根据专家访谈、XX等研究绘制。,大幅提升破案效率,有效利用视频数据,安防影像分析领域主要应用场景之视频结构化2012年南京“16”案件发生后,南京警方从全市1万多个摄像头共提取了近2000T的视频数据,调动1500多名公安干警查阅搜索视频线索,共耗时一个多月。海量视频的有效利用存在巨大挑战,完全依靠人工费时费力,而安防影像智能分析则可有效缓解这一问题。视频结构化可针对已经生成的海量视频内容进行自动化处理,提供行人、机动车、非机动车等关键目标的监测、跟踪、属性分析,辅以以图搜图等检索功能,让案件侦办和治安布控更加智能便捷。安防影像分析之视频结构化,19,来源:XX根据专家访谈、中安网等XX研究绘制。,3100亿,1900亿,410亿,报警运营服务及其他产值安防产品产值,安防工程产值,7,5410亿2016年中国安防行业总产值,74万亿,2016年中国GDP,24%,18%,16%,13%,12%,7%,5% 5%,平安城市,智能交通,智能楼宇,文教卫,金融,能源,司法监狱,其他,视频监控,出入口控制,962亿防盗报警,152亿 266亿楼宇对讲/智能家居,193亿 67亿 260亿平台 实体防护及其他,计算机视觉在安防领域的爆发点,安防影像分析领域安防行业的千亿市场为视觉智能改造提供充分空间2016年中国安防行业总产值为5410亿,占据2016年中国GDP的7,其中1900亿属于安防产品产值。从产品结构角度,安防产品可划分为视频监控、防盗报警、出入口控制等,安防影像的智能分析属于视频监控产品的升级改造,是各地区平安城市项目建设中的重要组成。2011年至2016年中国安防市场连续5年保持2位数增长,结合国家政府对建设更高水平的平安中国、进一步提升人民安全性的要求,未来中国的安防市场依然会保持稳定增长,对人工智能、计算机视觉技术的升级改造也提出了更高的期待。2016年中国安防行业市场结构,国务院办公厅,20,来源:XX根据XX研究绘制。,2003年,北京、苏州、杭州、济南四个视频监控试点城市,2005年,2015年,中共中央办公厅、国务院推进“3111”工程,九部委关于加强公共安全视频监控建设联网应用到2020年,基本实现“全域覆盖、全网共享、全时可用、全程可控”的公共安全视频监控建设联网应用,国家持续政策加码各地市亦响应中央号召推出数百部相关政策,2016年,公共安防区域示范,加快重点公共区域安防设备的智能化改造升级互联网+”人工智能三年行动实施方案发改委、科技部、工信部、网信办,2017年,5月,公安部发起“科技强警”发改委、网信办、标准委国家新型智慧城市评价指标公共安全视频情况成为,智慧城市发展重要指标,促进人工智能在公共安全领域的深度应用,推动构建公共安全智能化监测预警与控制体系。研发集成多种探测传感技术、视频图像信息分析识别技术、生物特征识别技术的智能安防与警用产品,建立智能化监测平台,新一代人工智能发展规划国务院,11月,5月,7月,10月,十九大报告,推动互联网、大数据、人工智能和实体经济深度融合关于县域创新驱动发展的若干意见加快实施“雪亮工程”,推进县域公共安全视频监控建设和联网应用,建设平安中国,安防影像分析领域智能安防相关政策分析伴随从平安城市、智慧城市到雪亮工程等公共安全相关政策,以及人工智能相关国家战略政策的逐步深化,智能安防也将与高清联网一样,由重点区域、有条件的地区起步,开始新一轮的从局部到整体的全国性拓展。公共安全与人工智能相关政策研发集成图像与视频精准识别、生物特征识别、编码识别等多种技术的智能安防产品。支持部分有条件的社区或城市开展基于人工智能的,21,重点区域100%联网率智能化人脸识别在公安实战中达到可用,清晰度GB28181标准发布,2020年,2016年,2011年来源:XX根据专家访谈、XX等研究绘制。,安防影像分析领域视频监控步入智能时代2015年,国家发展改革委、中央综治办、公安部等九部委下发关于加强公共安全视频监控建设联网应用工作的若干意见,提出到2020年基本实现“全域覆盖、全网共享、全时可用、全程可控”的公共安全视频监控建设联网应用,视频监控的清晰度和联网率得到快速发展,为智能升级奠定了较好的基础条件。需要说明的是,相比高清联网的“看到、看清”,智能升级的“看懂”对前端设备的部署位置、高度及角度等有着更苛刻的要求,现公安联网的数千万摄像头中的80%90%仍然需要针对性的调整改造。清晰度与联网率为视频监控的智能升级提供基础保障1080P+100%,集成商每路监控可获收益210万,台软件的附加,集成商,22,计算机视觉技术供应商,平台软件厂商,SDK软件平台嵌入式设备解决方案,实力强劲的大型设备厂商也在往下游集成商业务拓展,自建渠道直接面向客户,软件厂商依托于大型设备厂,直接面向客户可获得较高单价公安来源:XX根据专家访谈、XX等研究绘制。,供需双方合作之中有竞争设备厂商也在研发人脸识别算法和前端嵌入式设备,分给技术厂商15万+,商或集成商,智能技术的进步不断提升平值系统日益复杂 现阶段集成商门槛不断提高 渠道优势往往大于技术优势,安防影像分析领域智能安防相关产业链条分析计算机视觉技术供应商在提供智能安防影像分析的时候,可能面对监控设备及平台软件厂商、集成商、公安等三大类客户。在最终的使用者公安以外,其他三类参与者关系复杂,各自的业务定位都在发展变化,合作间有竞争。智能安防相关产业链条分析监控设备厂商,23,5,27,2016,2017e,2018e,2019e,2020e,市场规模/亿元来源:XX根据专家访谈、XX等研究绘制。可能高估的风险来自平安城市推进及人工智能、计算机视觉相关技术的发展、渗透不及预期,或成熟技术大规模落地后成单价降低;可能低估的风险来自相关技术的发展、渗透速度高于预期。,安防影像分析领域智能安防影像分析的市场规模中国安防行业“十三五” (2016-2020年)发展规划中提出到2020年,安防行业总收入达到8000亿元左右。结合对计算机视觉技术进步在视频监控前后端、软硬件、公安刑侦各场景迅速渗透的预期,我们认为未来三年智能安防影像分析的相关收入在安防产业中的占比将以12倍速度增长,由此得出如下市场规模以供参考。2016-2020年中国智能安防影像分析的市场规模55224890,24,安防影像分析领域多模态融合、大数据多维分析共同增强智能安防分析能力不足够理想的人脸影像捕捉及人脸本身的相似性导致识别精度有限,因此融合多种生物特征的多模态识别加多维数据的大数据分析等智能技术的交叉融合可大幅提升身份识别精度,结合公安战法有效辅助断案效率,从而进一步提升人工智能在安防领域的落地速度及渗透率。,分辨率低距离人脸远,光线暗 雾霾成像环境差,遮挡非正面角度,外形、表情变化,若干因素限制人脸识别精度,人脸相似性,人脸,指纹,虹膜,三大生物特征(共占全球生物识别市场份额的80%+),指静脉,步态,声纹,多模态生物特征+大数据多维信息分析,WiFi探针,手机信号,话单信息,社交关系,上网记录,交易记录,住行信息,来源:XX根据专家访谈、XX等研究绘制。,性别 装束,25,泛金融身份认证领域主要应用场景及相关影像采集设备与安防影像分析中人脸的“1:N”识别不同,目前泛金融领域以人脸“1:1”身份认证为主,部分场景涉及“1:N”识别,如银行网点中对VIP客户的智能识别。泛金融身份认证的主要应用场景及相关影像采集设备来源:XX根据专家访谈、XX等研究绘制。,26,密码,短信验证码,手机号U盾,人脸来源:XX根据专家访谈、XX等研究绘制。,人脸识别与多种方式组合认证,银行卡 身份证(号)替代与互补,无卡刷脸取款示意图,ATM,选择刷脸取款,刷脸认证,输入取款金额输入密码,提取现金,活体检测攻击预防,人脸比对输入手机号或身份证号选择用户名下银行卡,泛金融身份认证领域刷脸认证与其他认证方式的关系在实际应用场景中,人脸识别通常需与其他认证方式进行组合,共同保障交易安全。刷脸认证可在部分场景替代具体实物(如银行卡、优盾等)或操作较为繁琐的身份认证方式(如短信验证码),甚至成为唯一的身份验证方式(如小额交易场景),提升用户体验,较低交易成本。,27,通过率,实时性,误识率,误识率越低则安全性越好,但通过率随之越低,合规用户的体验将越差2017年,实用于金融行业大范围推广的标准如下误识率为0.001%时,典型场景通过率为99%以上误识率为0.0001%时,典型场景通过率在95%以上来源:XX根据专家访谈、XX等研究绘制。,并发稳定性大型机构每秒数万笔交易系统将不一致识别为一致,场景鲁棒性不同光环境 不同角度是否佩戴饰品 面部有无遮挡有没有化妆 复杂背景系统将一致识别为一致,泛金融身份认证领域刷脸认证,各种限制因素下的取舍平衡泛金融领域中,银行对人脸认证的各项技术指标的要求相对较高,需要在实时性、误识率、通过率等各种限制因素下取舍平衡。少数银行和第三方支付已开始小范围尝试刷脸转账、刷脸消费及刷脸购物,个别鼓励技术创新的银行已开始在全国全面试点刷脸取款,刷脸认证在银行领域的商业化刚刚开始。金融级人脸认证的三大技术指标与工程实践要求需3s以内(考虑网络传输情况),28,容易获取 银行无需过多改造 人脸天然性 公安部已有人脸数据 手机等影像采集设备较为普及容易落地容易使用 免签约 免学习 非接触与指纹、指静脉等不同刷脸不需要肢体接触传感器来源:XX根据专家访谈、XX等研究绘制。,人脸认证 防范冒名开户互联网冒名开户比率从万分之五几乎降为零 防范黑产交易核实客户身份及投资、申贷意愿防范风险人脸存档 辅助交易举证 辅助内部管控防止银行内外勾结诈骗资金,降低人力成本 人工审核成本降低交易成本 部分场景可替代短信验证码某行可节省3600万/年的短信费用降低成本降低风险损失 欺诈交易带来的损失某行信用卡欺诈案件预防成功概率已达95%预计减少损失800万/年,泛金融身份认证领域刷脸认证的优势与功效刷脸认证容易落地,并可帮助企业有效防范风险,降低成本,29,为客户提供服务器部署、生物识别系统集成、硬件改造集成等各类软硬件定制产品及服务2017年已有单一客户千万元项目,为客户提供人脸识别云服务一般按次计费,人脸识别算法模块客户可将其部署于移动端或服务器端可结合授权设备量及授权周期定价来源:XX根据专家访谈、XX等研究绘制。,自助机具改造数千元 100万客单价 全国机具存量,智慧网点改造数百万 20万+客单价 全国网点量,API,1,一体化解决方案,3,SDK为客户提供,2,泛金融身份认证领域泛金融身份认证的主要服务方式与计算机视觉公司的主要商业模式一致,泛金融身份认证也有API、SDK及解决方案三种服务方式。相比API及SDK的服务方式,一体化解决方案拥有更高的客单价和市场空间,但因包含诸多软硬件集成服务,难以将核心视觉技术相关收入单独剥离计算。泛金融身份认证领域的三种服务方式,30,非接触识别点亮并面对屏幕即可解锁刷脸解锁,智能识别焦点与背景的距离模拟大光圈单反的自然背景虚化背景虚化,智能调节曝光、噪点风格精准匹配 智能转换滤镜贴合个人特点 智能美颜影像处理,黄色、暴力等敏感信息及广告过滤内容、场景智能识别检索 个性化推荐影像内容审核及分类,AR特效精确定位视频中人物特征轮廓准确分割主体 自定义背景效果智能跟踪人物并识别特定交互动作,相册分类可基于人物、事物、建筑场景、证件、文字等对照片进行分类及搜索,拍照优化智能识别拍照场景自动调校拍照参数来源:XX根据专家访谈、XX等研究绘制。,手机及互联网娱乐领域为消费级产品带来全新智能体验计算机视觉技术的成熟进步为同质化的手机产品及互联网娱乐应用带来了新的活力。2017年诸多国内外手机厂商推出了具有刷脸解锁的旗舰机型,而手机与影像相关的拍照优化、相册分类、编辑处理等也于近几年得以智能升级。人脸识别、特征点定位以及场景识别、物体识别等技术也丰富了直播、短视频等互联网应用的娱乐性,同时为影像内容的智能审核及分类做出贡献。手机及互联网娱乐领域的主要应用,31,来源:XX根据专家访谈、XX等研究绘制。,电商,以图搜图提升购物效率智能推荐提升成交转化率,线下零售智能识别所购商品 提升结账体验智能监督 降低店面货品损耗,优化商品摆放运营,生产制造拍摄样品给出专业制作流程智能质检保证生产品质,结合设计趋势推荐相关原料以图搜图提升采购效率,原料采购,实时呈现系统化色彩逻辑,设计为设计师提供配色参考可对时装周走秀图片做智能分析,商品识别领域拓宽信息边界,连接人与商品键入关键词,搜索引擎可连接人与信息,大幅提升人类获取信息、搜集知识的效率,为世界创造巨大价值。计算机视觉则将信息的边界再度拓宽,缩短设计、原料采购、生产制造、线上与线下零售等各个环节的人与商品的距离,为商品供应链带来效能提升。计算机视觉赋能商品供应链,32,工业制造领域产品质检及3D分拣伴随年轻人从事重复性体力劳动的意愿降低,相关领域的劳动力成本极速上升,工厂对智能自动化设备的需求日益凸显,为计算机视觉技术在工业制造领域的研发落地提供了市场基础。产品(尤其3C产品)质检是现有视觉技术有望在未来3-5年在工业制造领域大规模落地的应用场景,目前产品质检依然依靠大量人力做肉眼判断,效率低、成本高、漏检误检严重,而深度学习算法可支持多种缺陷类型,增量学习也能不断提升产品适用性。另外,工业场景中存在大量的冲压件、组合件等不规则物体,不规则物体的分拣(无序抓取并有序放置,涉及物体识别、姿态估计、尺寸测量、运动规划等)需借助3D视觉技术,即使技术相对领先的国外产商相关产品也不足够成熟,出现问题难以即时相应(往往邮件沟通,售后服务难以保障),给予目前尚处于产品研发测试阶段的国内新兴厂商反超机会。,3D分拣需求相对杂乱技术不够成熟 依赖售后服务国内厂商拥有地域及价格优势,智能质检中国集中了全球70%的3C产能单个智能检测系统的成本大致相当于2.5个质检人员2年薪资3C智能质检在中国的市场空间预计在千亿级别来源:XX根据专家访谈、XX等研究绘制。,</p>