人工智能行业研究:奇点临近.pdf
人工 智能 行业 研究 奇点临近 2016 年 5 月 11 日 分析师 邓世杰 行业 研究员 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 1 - 人工 智能 行业 研究 奇点临近 相关研究报告 报告要点: 从人工智能的发展历程上来看,人工智能总共经历了三次浪潮。 1996 年,人工神经网络的兴起使得机器学习成为现实, 2006 年深度学习的兴起,人工智能才再度迎来春天。 从 基础层面,以 IBM TrueNorth 为代表的高性能芯片问世表明满足人工智能技术的 “ 人脑 ” 芯片已经成为现实 ; 同时,互联网与物联网迅猛发展积淀的海量数据为机器学习训练奠定了基础 ; 技术层面,深度学习与 并行 计算模式的出现实现了计算能力与算法的实质性突破;应用层面, 弱 人工智能已 在安防 、教育、金融、医疗、电力等众多领域实现规模化应用。 随着风口到来,人工智能的市场规模呈现高增长态势。根据艾瑞咨询数据预测,截至 2020 年全球AI 市场规模将达到 1190 亿元,年复合增速约19.7%;同期,中国人工智能市场规模将达 91 亿元,年复合增速超过 50%,远超全球增速。 咨询公司 Venture Scanner 统计, 2016 年全球人工智能公司已突破 1000 家,跨越 13 个子门类,融资金额高达 48 亿美元。整体来看, AI 产业不论是行业规模、还是吸金能力都在飞速扩张中。从未来市场空间和行业增速来看,发展速度最快、市场空间最大的三个领域是 机器学习 、 图像识别和 智能机器人 。 重点关注 : 科大讯飞 、 东方网力 、机器人 风险提示: 市场拓展 不及预期 、 技术瓶颈 大数据主题深度研究:数据爆炸的大数据时代 云计算深度研究:像使用水电一样使用互联网资源 大数据 引用研究:传统产业与 大数据的深度结合 请通过合法途径获取本公司研究报告,如经由未经许可的渠道获得研究报告,请慎重使用并注意阅读研究报告尾页的声明内容。 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 2 - 目 录 2 人工智能简介 . - 4 - 2.1 什么是人工智能 . - 4 - 2.2 人工智能的发展 . - 6 - 2.3 人工智能迎来技术拐点 . - 6 - 2.3.1 大数据为机器学习装上引擎 . - 7 - 2.3.2 算法突破 :深度学习将人工智能带到全新高度 . - 8 - 2.3.3 计算能力突破:“类人脑芯片 +GPU 并行 ”破冰仿人脑计算 . - 9 - 2.3.4 人工智能表现超预期: AlphaGo 战胜李世石 . - 10 - 3 人工智能的商业价值 . - 11 - 4 科技巨头动作频频 . - 14 - 5 人工智能市场规模 . - 16 - 6 人工智能细分领域 . - 17 - 7 上市公司 . - 21 - 免责条款: . - 27 - 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 3 - 图表目录 图 1 电脑的计算能力不断提升 . - 4 - 图 2 人工智能 . - 5 - 图 3 人工智能的三个阶段 . - 5 - 图 4 人工智能的发展历程 . - 6 - 图 5 技术突破助力人工智能步入快车道 . - 7 - 图 6 全球数据量快速增长 . - 7 - 图 7 深度学习模型架构 . - 8 - 图 8 浅层学习和深度学习比较 . - 8 - 图 9 IBM 类人脑芯片 . - 9 - 图 10 GPU、 CPU 运算能力比较 . - 10 - 图 11 AlphaGo 战胜李世石 . - 10 - 图 12 人工智能相关公司数量 . - 11 - 图 13 人工智能细分领域融资额度 . - 11 - 图 14 人工智能将引发产业跨越式升级 . - 12 - 图 15 沃森机器人未来的健康管理 . - 12 - 图 16 谷歌无人驾驶汽车 . - 13 - 图 17 工业机器人 . - 13 - 图 18 智能灌溉 . - 14 - 图 19 插秧机器人 . - 14 - 图 20 外国人工智能公司布局 . - 14 - 图 21 谷歌旗下公司推出的人形机器人 . - 15 - 图 22 中国人工智能公司布局 . - 15 - 图 23 百度小度机器人 . - 16 - 图 24 蚂蚁金服人脸识别 . - 16 - 图 25 全球人工智能市场规模 . - 16 - 图 26 中国人工智能市场规模 . - 17 - 图 27 人工智能细分领域 . - 17 - 图 28 人工智能产业结构 . - 18 - 图 29 机器学习相关企业 . - 18 - 图 30 自然语言处理相关企业 . - 19 - 图 31 语音识别相关企业 . - 19 - 图 32 图像识别相关公司 . - 19 - 图 33 手势控制相关企业 . - 20 - 图 34 虚拟私人助手相关企业 . - 20 - 图 35 智能机器人相关企业 . - 20 - 图 36 推荐引擎和协助过滤算法相关企业 . - 20 - 图 37 语音翻译相关企业 . - 21 - 图 38 人工智能相关上市公司 . - 22 - 图 39 中国智能语音企业市场份额 . - 23 - 图 40 全球智能语音企业市场份额 . - 23 - 图 41 讯飞超脑作文自动评分系统 . - 24 - 图 42 公司财务情况 . - 25 - 图 43 公司视云天下产品体系 . - 25 - 图 44 公司财务情况 . - 26 - 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 4 - 数据来源 : 互联网, 优品金融研究所 图 1 电脑 的计算能力不断提升 1 奇 点临近 “奇点 ”本是天体 物理学术语,是指 “时空中 的一个普通物理规则不适用的点 ”。 在 美国 未来学家 雷蒙德库兹韦尔的理论中,“奇点”是指人类与其他物种(物体)的相互融合。确切来说,是指电脑智能与人脑智能兼容的那个神妙时刻。 库兹韦尔在 一次 采访中做出预言,到了 21 世纪 20 年代末的时候,电脑可以达到与人脑智力相平衡的水平,而到了 2045 年,电脑能力更会大幅增长,且电脑能力的增长周期与成本成反比。 2 人工智能 简介 2.1 什么 是 人工智能 人工 智能( Artificial Intelligence, 缩写 AI) 。 狭义的 人工 智能是指基于人工智能算法和技术进行研发及拓展应用的企业 ; 广义的人工智能指包括计算、数据资源、人工智能算法和计算研究、应用构建在内的产业。 人工 智能是计算机学科的一个分支,二十世纪七十年代以来被称为世界三大尖端技术( 空间 技术、能源技术、人工智能)之一 , 也被认为是二十一世纪三大尖端技术 (基因 工程、 纳米科学 、人工智能)之一 。这是因为近三十年来它获得了迅速的发展,在很多学科领域都获得了广泛应用,并取得了丰硕的成果,人工智能已逐步成为一个独立的分支, 无论在理论和实践上都已自成一个系统。 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 5 - 图 3 人工 智能 的 三个阶段 数据来源 :优品金融研究所 图 2 人工 智能 数据来源 : Gartner, IDC, 优品金融研究所 关于 什么是 “智能 ”, 这就涉及到意识( Consciousness) 、自我 ( Self) 和 思维( Mind) (包括 无意识思维( Unconscious Mind) 等等 问题 。 从 现 阶段来看 , 人唯一 理解 的智能是人本身的智能,但这种 理解十分 有限 , 对构成人的智能的必要元素也了解有限,所以很难定义 “人工 ”的 “智能 ”。 对于人工智能,现在普遍将其分为三 大类 : “弱 人工智能 ”、 “强 人工智能 ”、“超 人工智能 ”。 现阶段 的人工智能 都 还 属于 “ 弱人工智能 ” 阶段, 谷歌 研制的 AlphaGo 也 属于弱人工智能,它 只是 在一方面上的能力( 围棋 ) 达到 了人类的水平, 但 它 还不能 实现综合各方面信息处理各类问题 。 当 人工智能的智力 水平 和人脑 相 近 , 能像人类一样处理各种各样的问题时, 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 6 - 图 4 人工 智能的发展历程 数据来源 :优品金融研究所 人工智能才到达了 “ 强人工智能 ” 阶段 。 这 一 方面, 国内外 科技公司研究的各种虚拟助手、智能机器人、智能驾驶 、 深度学习系统等等都是在向这个方向在努力 。 而当人工 智能达到了 “超 人工智能 ”阶段 , 人工智能就会全面超越人类,能够快速处理各种各样的 连 人类都不能处理的问题,甚至自我进化出独立的意识。 2.2 人工智能 的发展 1956 年 ,以麦卡 赛 、明斯基、罗切斯特和申农等一 批 有远见的年轻科学家共同研究和探讨用机器模拟智能的一系列有关问题,并首次提出了 “人工 智能 ”这 一术语,它标志着 “人工 智能 ”这门 新兴科学的正式诞生。至今 的 近 60 年 来,人工智能学科已经取得了长足的发展,成为一门广泛的交叉和前沿科学。 从人工 智能的发展历程上来看,人工智能总共经历了三次浪潮。第一次 浪潮的高峰在 1970 点 ,当时由于机器能够自动证明数学原理中的大部分原理,人们认为第一代人工智能机器甚至可以在 5-10 年 达到人类智慧水平 , 但由于算法的局限性在 1980 年 跌入 低谷 。 伴随 递归网络 法 的出现,人工智能迎来第二次高超 , 1987-1993 又 由于财政缩减、以及算法问题再次跌入 低谷。 直到 1996 年 ,人工神经网络 的 兴起使得机器学习成为现实,以及 2006 年 深度学习的兴起, 人工 智能 才再度迎来 春天。 2.3 人工 智能 迎来技术 拐点 通常 将人工智能的结构分为基础层、技术层、应用层,其中基础层包括数据资源及计算资源,技术层主要通过不同类型的算法及模型形成各种可供应用的技术 , 是支撑人工智能 产业 发展的坚实根基 , 应用层则是人工智能技术在各行业的具体应用。 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 7 - 图 6 全球 数据量快速增长 数据来源 : EMC, 优品金融研究所 数据来源 : 艾瑞咨询 ,优品金融研究所 图 5 技术 突破 助力 人工智能步入快车道 从 基础层面,以 IBM TrueNorth 为代表的高性能芯片问世表明满足人工智能技术的 “人脑 ”芯片 已经成为现实 ; 同时,互联网与物联网迅猛发展积淀的海量数据为机器学习训练奠定了基础 ; 技术层面,深度学习与 并行 计算模式的出现实现了计算能力与算法的实质性突破;应用层面, 弱 人工智能已 在安防 、教育、金融、医疗、电力等众多领域实现规模化应用。 2.3.1 大数据 为机器学习装上引擎 机器 学习是人工智能的核心 , 是使计算机具备智能的根本途径。通常机器学习主要是基于数据或以往的经验优化计算机程序的性能标准。 对数据量与数据分析处理能力要 求极高。 数据量激增为机器学习提供丰富土壤。 数据资源在机器学习的过程中扮演极其重要的作 用,其可为机器学习训练提供绝佳素材,使机器在学习过程中不断优化参数进而变得更加“聪明”。近年来,互联网、物联网及移动智能设备等蓬勃发展,由此导致数据呈几何级增长,为提升机器学习能力提供海量训练资源。依据 EMC 数据,全球数据资料存 储量将于 2020 年达到 40ZB,比之前预估的高出14%,未来 5 年的 CAGR 接近 40%。 可以预见的是,随着互联网的触角逐渐渗透至社会生活的方方面面,以及物 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 8 - 图 7 深度 学习模型架构 数据来源 : 互联网, 优品金融研究所 图 8 浅层 学习和深度学习比较 数据来源 :优品金融研究所 联网的蓬勃发展,数据量的产生与积累都将进一步加速增长,数据来源也将更为全面, 是机器学习 的绝佳土壤, 由此推动人工智能的加速突破。 2.3.2 算法突破:深度学习将人工智能带到全新高度 深度学习的概念源于人工神经网络的研究,是机器学习的分支,旨在建立、模拟人脑进行分析学习的神经网络。通过将底层特征形成更加抽象的高层属性类别或特征,以发现数据的分布式特征。深度学习采取与神经网络相似的分层结构,系统由包括输入层、隐层 (多层 )、输出层组成的多层网络,且只有相邻层节点之间有连接。其之于人工智能的 重要作用主要体现在其可模拟人脑的“分层”与“抽象”的认知过程。 历史上,机器学习历经浅层学习与深度学习两次浪潮。深度学习曾一度遭“冷藏”,主要原因是深度学习模型的参数调优较难,导致训练速度慢,且在层级较少 (小于或等于 3)的情况下效果并不比其他方法更优。直到 2006 年 Geoffrey Hinton 教授与其学生基于 多层神经网络系统提出分两步走,即首先每次训练一个单层网络,然后使用 wake-sleep 算法进行调优才解决上述问题。 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 9 - 图 9 IBM 类 人脑芯片 数据来源 : 互联网 ,优品金融研究所 2.3.3 计算能力突破:“类人脑芯片 +GPU 并行 ” 破冰仿人脑计算 深度学习能完美模拟人脑神经元多层深度传递的过程,解决机器学习过程中的复杂问题。但人脑大致有 1000亿神经元,每个神经元有大约 5000个神经突触。意味着模拟 神经元与神经突出将会带来巨大的计算挑战。一方面,传统计算机体系结构阻碍了大规模并行计算的实现,导致计算能力无法迅速提升;另一方面,芯片性能较低无法提供计算跃升所需的能耗。类人脑芯片与 GPU 并行计算的成熟与应用为上述难题提供完美的 解决方案。 传统计算机体系面临能耗困境。 目前,硬件层面主要通过对大型神经网络进行仿真,比 如 Google 的深度学习系统 Google Brain 及微软的 Adam 等。但是需要大量传统计算机 集群,而传统计算机体系的特点是内存与处理信息的处理器分离,且处理器只能按照线序执行指令,必须不断与内存通过总线反复交换信息,导致能耗大运行速度易受拖累。以 Google Brain 为例,其采用了 1000 台各带 16 核处理器的计算机,尽管该架构展现 出相当能力,但是能耗依然巨大。 为从硬件层面打破传统计算机体系在计算层面的桎梏, IBM 联袂 美国国防部研究机构 DARPA 于 2011 年推出首款仿人脑计算的芯片 TrueNorth。 经过近几年的更新迭代, IBM 类人脑芯片性能突破迅猛。 2011 年 IBM 推出首款单核芯 片原型仅含 256 个神经元, 256*256 个突触和 256 个轴突。当时的原型芯片已经可以 处理类似 Pong 这样复杂游戏任务,但是单核脑容量仅相当于虫脑水平。 14 年, IBM 便将内核数提升至 4096,神经元个数提升至 100 万,突触个数提升至 2.56 亿, 且集成直径仅为原型的 1/6,功耗仅 65 毫瓦。复杂性与使用性层面取得质的飞跃。 目前, 该芯片已能够识别出用 30 帧每秒的正常速度拍摄的十字路口视频中的人、自行 车、公交车、卡车等,且准确率超 80%。相比之下,一台笔记本编程完成同样的任务用 时要慢 100 倍,能耗却是 IBM 芯片的 1 万倍。 GPU 并行架构突破大规模并行计算限制。 GPU(Graphic Processing Unit),即图 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 10 - 图 11 AlphaGo 战胜 李世石 数据来源 : 互联网 ,优品金融研究所 图 10 GPU、 CPU 运算 能力 比较 数据来源 : 互联网 ,优品金融研究所 形处理 器,其在处理能力与存储器宽带层面相较 CPU 具有明显优势,可通过增加并行处理单 元和存储器控制单元提高处理能力和存储宽带。与 CPU 利用复杂控制单元和缓存提高 少量执行单元的效率不同, GPU 将更多晶体管用作执行单元,可并行处理多个任务, 更符合人工智能对计算能力的需求。 通过优化基于 GPU 架构的算法,一方面可以大幅提升 GPU 的整体速度;另一方面可以将 DNN 等环节进行优化压缩,以科大讯飞的语音识别 DNN 框架为例,其通过算法优化取缔了 40%的 DNN 网络环节,大幅提升了运行速度与效率。 2.3.4 人工 智能表现 超 预期 : AlphaGo 战胜 李世石 AlphaGo 和世界围棋冠军 李世石围棋 比赛 之前, 李开复 在知乎上表示: “如果对弈一盘, AlphaGo 尚有 11%的获胜的可能性,而整个比赛五盘胜出三盘或更多, AlphaGo 就只有 1.1%的可能性了。 ”在 围棋界,几乎是一边倒的认为, AlphaGo不可能 战胜李世石 。 赛前 , 聂卫平对于谷歌 AlphaGo 的前景完全不看好,他表示:“我认为电脑最多赢 1 分 。 ”柯洁表示:“李世石肯定能以 5-0 获胜。 ” 但 最终 AlphaGo 以 4:1 的 比分战胜李世石 。 赛后 ,聂卫平更是直接表示谷歌AlphaGo 刷新了他的认知, “我上场能保持前半盘领先 ”。第二场再度输掉之后,柯洁直言已经对李世石绝望,谷歌 AlphaGo 上下双线的落子布局让柯洁 感叹 “一辈子都没有见过这样的棋 。 ” 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 11 - 图 12 人工 智能相关公司数量 图 13 人工智能细分 领域 融资 额度 数据来源 : Wind,优品金融研究所 3 人工 智能 的商业价值 人工 智能的崛起已 是 必然,不论是国内还是国外,巨头们都瞄准了 AI 市场背后的巨大潜力 。 2014 年 谷歌以约 5 亿 美元的价格收购主营深度学习的英国 初创 公司DeepMind Technologies,而 苹果 、 Amazon、 Faccebook 及特斯拉等行业巨头也纷纷展开布局。国内 百度 也与 2014 年 在硅谷成立深度学习研究中心。 依据 权威数据,布局深度学习的公司数量与投资额均 占据 榜首,表明资本市场对深度学习、人工智能市场前景的 充分 认可。 作为万物互联时代最前沿的基础技术,人工智能能够渗透至各行各业,并助力传统行业实现跨越式升级。 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 12 - 图 14 人工智能将 引发产业跨越式升级 数据来源 : Wind,优品金融研究所 图 15 沃森 机器人未来的 健康管理 数据来源 : 互联网 ,优品金融研究所 AI+医疗:颇负盛名的当属 IBM 的沃森机器人,其具备强大的自然语言处理能力, 可协助医疗工作人员从多个信息源了解病人病情,包括病历、药学、医疗索赔信息、移动应用、健身设备。 AI+教育:机器人辅助教学是指师生以机器人为主要教学媒体和工具进行的教与学 活动,具有智能性、自动化、人性化、自学习性等特征。 目前,国内已经出现诸多智慧教育类产品与服务,以科大讯飞为例,其联袂乐知行推出的“数字校园 V6 新产品”,包括口语评测、全学科阅卷、听课不停学、新中高考全栈解决方案,是业内首款具备学习过程大数据和海量学习资源的智慧校园平台。 AI+金融:通过大数据、精准计算及人工智能等手段,传统 的财富管理能力已经从 过去的粗放式逐渐变得稳定而精准。 比如高频程序化交易 Virtu Financial LLC 公司 在 1238 个交易日中,仅有一个交易日出现亏损;第一个以人工智能驱动的基金 Rebellion 预测了 2008 年股市崩盘;掌管 900 亿美元的对冲基金Cerebellum 也使 用人工智能技术进行交易,且自 2009 年以来,没有一个月是亏 2016 年 5 月 11 日 请务必阅读正文后免责条款 - 13 - 数据来源 : 互联网 ,优品金融研究所 图 16 谷歌 无人驾驶汽车 图 17 工业 机器人 数据来源 : 互联网 ,优品金融研究所 损的。 AI+汽车:在产业与资本的推动下,无人驾驶呈加速发展态势。 2016 年 4 月,谷 歌宣布将无人驾驶汽车测试拓展亚利桑那州凤凰城,这是作为自主汽车试验场的第四个美国城市。目前谷歌无人驾驶汽车每天模拟驾驶 300 万英里,相当于往返 北京与上海 2000 多趟。 AI+工业 : 工业 4.0 项目 主要分为两大主题, 一 是智能工厂,重点研究智能化生产系统及过