2017-2018新一代人工智能发展报告.pdf
新一代人工智能发展白皮书( 2017年) 顾 问 潘云鹤 中国工程院院士 指导 单位 工业和信息化部信息化和软件服务业司 指导委员会 谢少锋 工信部信软司司长 李冠 宇 工信部信软司副司长 徐晓兰 中国电子学会副理事长兼秘书长 张宏图 中国电子学会 总部党委书记兼副秘书长 商 超 工信部信软司软件处处长 傅永宝 工信部信软司 软件处 调研员 专家 委员会 (排名不分先后,按姓氏笔画排序) 王士进 科大讯飞研究院副院长 韦 青 微软中国公司首席技术官 宋 波 国安瑞(北京)科技有限公司总经理 刘志坚 京东金融总法律顾问 吴甘沙 驭势科技联合创始人兼 CEO 季向阳 清华大学 自动化系教授 陈丽娟 阿里巴巴人工智能实验室负责人 梁家恩 云知声信息技术有限公司董事长兼 CTO 崔 岩 中德人工智能研究院院长 蔡雄山 腾讯研究院法律研究中心副主任 编写 单位 中国电子学会 编写人员 李 颋 周岷峰 马 良 凌 霞 李 岩 张雅妮 许华磊 张 婵 张 力 陈 濛萌 樊江洋 朱 毅 李俊平 阎德利 谢中业 陈 岩 内容摘要 随着信息时代的来临,人类生产生活的数据基础和信息 环境有了大幅提升,人工智能正从 学术驱动转变为应用驱动,从 专用智能迈向通用智能 ,比 历史上 任何一个时期都要更加接近 于 人 类智能 水平,进入了新的 发展阶段。全球各国均围绕新一代人工智能技术及产业发展进行前瞻布局,我 国也已 将 其 提升到了国家战略层面。基于此, 本白皮书重点围绕新一代人工智能 面临的新形势、驱动的新因素、呈现的新特征,对 架构、算法、系统等 技术演进方向 作出研判 , 详细 梳理了包括云计算、大数据两大基 础平台和机器学习、模式识别、人机交互三大通用技术的技术体系,深入论证了 新一代人工智能产业边界 和范围,划分了基础层、技术层、应用层三大产业化领域, 研究了 智能传感器、智能芯片、算法模型、语音识别、图像视频识别、文本识别、智 能机器人、智能制造系统、智能安防、智能驾驶等具体产业化方向的产业 规模、核心技术、主要产品、典型企业, 归纳了 近年来全球和我国在人工智能领域的投融资特征趋势, 并 对国内外人工智能 的技术及 产业 发展状况进行了系统对比 和趋势展望,最后提出了发展理念、治理体系、创新能力、发展基础、资本环境、行业组织、全球统筹共七项措施建议, 进一步推动我 国人工智能相关的前沿新兴产业持续健康快速发展,有力支撑信息化与工业化深度融合迈上新台阶。 I 目 录 一、编制概要 . 1 (一)编制背景 . 1 (二)编制目标 . 2 (三)编制方法 . 2 (四)特别声明 . 3 1、研究主题充分考虑了与国家规划的互动和呼应 . 3 2、研究范围聚焦技术和产业发展 . 4 3、研究内容仍 有待进一步丰富完善 . 4 二、新一代人工智能研究综述 . 5 (一)人工智能简要发展历程 . 5 1、第一次浪潮:人工智能诞生并快速发展, 但技术瓶颈难以突破 . 6 2、第二次浪潮:模型突破带动初步产业化,但推广应用存在成本障碍. 7 3、第三次浪潮:信息时代催生新一代人工智能,但未来发展存在诸多隐忧 . 8 (二)新一代人工智能的主要驱动因素 . 9 1、人机物互联互通成趋势,数据量呈现爆炸性增长 . 10 2、数据处理技术加速演进,运算能力实现大幅提升 . 10 3、深度学习研究成果卓著,带动算法模型持续优化 . 11 4、资本与技术深度耦合,助推行业应用快速兴起 . 11 (三)新一代人工智能主要发展特征 . 12 1、大数据成为人工智能持续快速发展的基石 . 13 2、文本、图像、语音等信息实现跨媒体交互 . 13 3、基于网络的群体智能技术开始萌芽 . 14 4、自主智能系统成为新兴发展方向 . 14 5、人机协同正在催生新型混合智能形态 . 15 三、新一代人工智能技术框架 . 15 (一)新一代人工智能的技术演进 . 16 1、从原有的 CPU 架构,转变为 GPU 并行运算架构 . 16 2、从单一算法驱动,转变为数据、运算力、算法复合驱动 . 17 3、从封闭的单机系统,转变为快捷灵活的开源框架 . 18 4、从学术研究探索导向,转变为快速迭代的实践应用导向 . 18 II (二)新一代人工智能技术体系 . 20 1、云计算:基础的资源整合交互平台 . 20 2、大数据:提供丰富的分析、训练与应用资源 . 21 3、机器学习:持续引导机器智能水平提升 . 23 4、模式识别:从感知环境和行为到基于认知的决策 . 23 5、人机交互:支撑实现人机物交叉融合与协同互动 . 24 (三)国内外技术 对比分析 . 26 1、发达国家基础平台布局完善,国内仍缺乏自主核心技术 . 26 2、发达国家在机器学习和人机交互领域具备先发优势,国内企业存在技术差距与人才短板 . 27 3、国内外模式识别研究水平基本处于同一起跑线,重点聚焦于语音识别与图像识别 . 28 四、新一代人工智能的产业化应用 . 29 (一)新一代人工智能的产业边界 . 29 (二)基础层 . 32 1、智能传感器:智能转型引领行业发展 . 33 2、智能芯片:初创企业蓄势待发 . 36 3、算法模型:通过开源构建生态已是大势所趋 . 38 (三)技术层 . 40 1、语音识别:正在步入应用拉动的快速增长阶段 . 41 2、图像视频识别:在安防监控市场具有巨大增长潜力 . 44 3、文本识别:全面进入云端互联时代 . 47 (四)应用层 . 50 1、智能机器人 . 51 2、智能金融 . 54 3、智能医疗 . 57 4、智能安防 . 60 5、智能驾驶 . 62 6、智能搜索 . 65 7、智能教育 . 68 8、智能人居 . 70 (五)国内外产业对比分析 . 72 1、基础层产业国外多点布局产品种类丰富,国内技术相对薄弱但初创企业表现活跃 . 72 III 2、技术层产业国外业已打通应用端,国内围绕特定领域实施产品精准投放 . 73 3、应用层产业国外较多依赖技术内生发展驱动,国内较为注重商业模式创新 . 74 五、投融资特征及趋势 . 75 (一)全球人工智能领域融资总额持续增长但增速放缓 . 75 (二)国内人工智能投资规模有望出现 V型反转且大额项目频发 . 76 (三)深度学习、图像视频识别和文本识别是资 本市场当前力捧的热点 78 (四)全球科技巨头通过投资并购围绕人工智能构筑差异化竞争力 . 79 六、新一代人工智能中长期技术及产业发展趋势 . 81 (一)技术趋势 . 81 1、既有架构面临挑战,新型人工智能芯片呼之欲出 . 81 2、经济社会发展存在迫切需求,专用智能向通用智能升级 . 82 3、技术平台开源化已成趋势,围绕超级智能生态系统的竞争即将展开. 83 (二)产业趋势 . 84 1、人工智能产业仍将保持爆发式增长 . 84 2、我国将成为全球人工智能产业发展的重要推动者 . 85 3、智能芯片、智能机器人及智能驾驶等热点应用将持续受到关注 . 86 4、 “平台 +场景应用 ”主导的新型商业模式即将出现 . 87 5、科技巨头企业的优势地位将受到初创公司的挑战 . 87 6、行业监管问题迫切需要引起各方重视 . 88 七、推动新一代人工智能发展的措施建议 . 89 (一)引导树立正确发展理念 . 89 (二)构建政府新型治理体系 . 90 (三)持续加强核心创新能力 . 90 (四)着力夯实关键发展基础 . 91 (五)完善资本市场支撑环境 . 92 (六)充分发挥行业组织作用 . 93 (七)实现全球统筹协调发展 . 94 参考文献 . 95 致 谢 . 96 IV 图 表 目录 图 1 人工智能发展历程示意图 . 6 图 2 新一代人工智能主要驱动因素示意图 . 10 图 3 新一代人工智能主要发展特征 . 12 图 4 新一代人工智能当前核心产业链 . 30 图 5 全球人工智能核心产业规模及年增长率 . 31 图 6 我国人工智能核心产业规模及年增长率 . 31 图 7 2020 年全球及我国人工智能基础层各产业 规模占比 . 32 图 8 2020 年全球及我国人工智能技术层各产业 规模占比 . 41 图 9 2020 年全球及我国人工智能应用层各产业 规模占比 . 50 图 10 全球人工智能企业 投 融 资金额总量及增长率( 2015-2020 年) . 76 图 11 中国人工智能 企业 投 融 资金额 总量 ( 2015-2020 年) . 77 表 1 云计算主要共性技术 . 20 表 2 大数据主要共性技术 . 22 表 3 机器学习主要共性技术 . 23 表 4 模式识别主要 共性技术 . 24 表 5 人机交互主要共性技术 . 25 表 6 主要智能传感器及生产企业 . 35 表 7 主要智能芯片及生产企业 . 38 表 8 主要算法模型及相关机构 . 40 表 9 语音识别主要产品及典型企业 . 44 表 10 图像视频识别主要产品及典型企业 . 47 表 11 文本识别主要产品及典型企业 . 49 表 12 智能机器人主要产品及典型企业 . 54 表 13 智能金融主要产品及典型企业 . 57 表 14 智能医疗主要产品及典型企业 . 59 表 15 智能安防主要产品及典型企业 . 62 表 16 智能驾驶主要产品及典型企业 . 65 表 17 智能搜索主要产品及典型企业 . 67 表 18 智能教育主要产品及典型企业 . 70 表 20 智能人居主要产品及典型企业 . 72 表 21 全球各领域人工智能企业融资额前五名 . 78 表 22 全球科技巨头主要收购企业 . 80 中国电子学会 1 新一代人工智能 发展 白皮书 ( 2017年) 一、编制 概要 (一) 编制 背景 自 1956 年概念 得以 确立以来,人工智能发展至今已逾60 年,随着所处信息环境和数据基础的深刻变革,开始迈进新一轮发展 阶段,呈现出大数据、跨媒体、群体性、自主化、人机融合的 发展 新特 征,从学术牵引式发展迅速转变为需求牵引式发展,相比历史上的任何时刻,都要更加接近于人类智能, 既能为进一步掌握城市发展、生态保护、经济管理、金融风险等 宏观系统 提供指导,也能为设计制造、健康医疗、交通管理、能源节约等 微观领域提供解决方案。我国正值工业化、城镇化、信息化、农业现代化的攻坚阶段,迫切需要加快推动人工智能在国民经济社会各行业、各领域的创新应用,促进产业提质增效,改善人民生活水平,切实解决经济运行的重大结构性失衡。针对于此,有必要研究编制 新一代人工智能发展 白皮书,明确人工智能在新时期、新形势下的技术框架 、关键环节、 应用前景,为 推动人工智能关键技术进步和产业化应用推广提供措施建议 ,进一步推动我国 智能相关的前沿新兴产业持续 健康 快速发展, 有力支撑我国信息化和工业化深度融合迈上新台阶。 中国电子学会 2 (二)编制 目标 一是 明确新一代人工智能的主要发展方向,系统归纳其主要驱动因素及最具典型意义的特征。 二是 研究 新一代人工智能的技术框架, 梳理技术演进轨迹,提出基础性、通用性技术体系 。 三是 探索新一代人工智能的产业边界,划分产业类别和应用场景,研判相关的投融资特征及趋势。 四是 提出促进新一代人工智能及相关技术及产业发展的可行性措施建 议,为相关行业主管部门提供决策参考,为行业健康有序发展提供指导依据。 (三)编制方法 一是研究学习国内外 相关战略政策文件 ,充分借鉴参考国内外主要研究动态和成果 。 主要包括:美国白宫发布的为人工智能的未来做好准备、国家人工智能研究与发展战略规划;英国下议院科学和技术委员会发布的机器人和人工智能、英国政府科学办公室发布的人工智能对未来决策的机会和影响,以及英国政府在 2017 年 1 月宣布的现代工业战略和 3 月公布的数字战略;日本政府制定的人工智能产业化路线图;我国出台的国务院关于积极推进 “互联网 +”行动的指导意见和 “十三五 ”国家战略性新兴产业发展规划中关于人工智能的部分。同时,针对欧盟中国电子学会 3 的 “人脑项目”、德国的“智慧数据项目”、日本的“超智能社会”和“高级综合智能平台计划”进行了学习了解。 二是 访谈国内知名专家学者,围绕新一代人工智能的内涵、外延及特征趋势展开充分研讨。 新一代人工智能既有创新性又有继承性,与过往所谈论的人工智能既有联系又有区别,在研究内 容上既要有突破又要有充分吸收和借鉴。通过与 国内人 工智能相关领域的知名院士、高校学者、行业专家的座谈交流,尤其是围绕 中国工程院潘云鹤院士人工 智能迈向 2.0一文进行的深入学习研讨,为白皮书的编制奠定了系统的理论基础。 三是调研国内外知名人工智能企业, 汇集整理和分析来自实践应用的典型案例。 高度重视人工智能领域的具体产品、服务及解决方案提供方式,走进国内外一批在技术或产业方面具备领先水平和特色优势的人工智能企业展开深度调研,并邀请部分企业的技术或战略负责人共同参与了白皮书的编制工作。 (四 ) 特别声明 1、 研究主题 充分考虑了与国家规划的互动和呼应 人工智能的概念从诞生之日开始计算,已经超过 60 年,并非横空出世的新兴事物。只不过受近年来算法模式持续优化 、数据信息海量增长、运算力大幅提升的影响和带动,表现出了不同以往的发展水平 和特征。本白皮书一开始 研究 主中国电子学会 4 题名为 “人工智能 2.0”,目前已更改为 “新一代人工智能 ”,是为了呼应院士研究文章、部委领导讲话,以及即将出台的国家级规划,重点针对人工智能的新趋势、新特征、新模式展开研究,并非是要提出一个全新的研究对象。 2、 研究 范围 聚焦技术和产业 发展 在 人工智能 领域,正孕育着堪与相对论、量子理论、计算机、互联网相提并论的重大创新、变革及突破。人工智能历史性地站在了时代的风口,将对人类经济社会发展带来智能化浪潮的 颠覆性 猛烈 冲击。 研究人工智能,就要研究其在人类生产生活中的详细地位和作用,涉及到方方面面,包括了道德、法律、伦理、文化等领域。本白皮书的编制,主要是为了给相关行业主管部门和企业提供决策参考依据,集中在技术和产业两大层面展开研究,暂未涉及其他方面。 3、 研究内容仍有待 进一步 丰富完善 当前,各类研究咨询机构纷纷推出 围绕人工智能主题的相关报告,各自观点既有一致性,也存在 部分不同意见。本白皮书的主要观点和内容仅代表编制组在目前对人工智能的研判和思考,欢迎各方专家学者和企业代表提出宝贵意见,共同推动白皮书的及时更新和纠偏。同时 ,随着人工智能技术的进步、产业的发展、模式的变革,白皮书的内容将得到进一步丰富完善。 中国电子学会 5 二、新一代人工智能研究综述 人工智能发轫于 1956 年在美国达特茅斯( Dartmouth)学院举行的 “人工智能( Artificial Intelligent,简称 AI)夏季研讨会 ”,在 20 世纪 50 年代末和 80 年代初先后步入两次发展高峰,但因为技术瓶颈、应用成本等局限性而均落入低谷。当前,在新一代信息技术的引领下,数据快速积累,运算能力大幅提升,算法模型持续演进,行业应用快速兴起,人工智能发展环境发生了深刻变化,跨媒体智能、 群体智能、自主智能系统、混合型智能成为新的发展方向,人工智能第三次站在了科技发展的浪潮之巅。 (一)人工智能简要发展历程 从诞生至今,人工智能已有 60 年的发展历史,大致经历了三次浪潮。第一次浪潮为 20 世纪 50 年代末至 20 世纪80 年代初;第二次浪潮为 20 世纪 80 年代初至 20 世纪末;第三次浪潮为 21 世纪初至今。在人工智能的前两次浪潮当中,由于技术未能实现突破性进展,相关应用始终难以达到预期效果,无法支撑起大规模商业化应用,最终在经历过两次高潮与低谷之后,人工智能归于沉寂。随着信息技术快速发展和互联网快速普及,以 2006 年深度学习模型的提出为标志,人工智能迎来第三次高速成长。 中国电子学会 6 图 1 人工智能发展历程示意图 资料来源:中国电子学会整理 1、第一次浪潮:人工智能诞生并快速发展,但技术瓶颈难以突破 符号主义盛行,人工智能快速发展。 1956 年到 1974 年是人工智能发展的第一个黄金时期。科学家将符号方法引入统计方法中进行语义处理,出现了基于知识的方法,人机交互开始成为可能。科学家发明了多种具有重大影响的算法,如深度学习模型的雏形贝尔曼公式。除在算法和方法论方面取得了新进展,科学家 们还制作出具有初步智能的机器。如能证明应用题的机器 STUDENT( 1964),可以实现简单人机对话的机器 ELIZA( 1966)。人工智能发展速度迅猛,以至于研究者普遍认为人工智能代替人类只是时间问题。 模型存在局限,人工智能步入低谷。 1974 年到 1980 年。人工智能的瓶颈逐渐显现,逻辑证明器、感知器、增强学习只能完成指定的工作,对于超出范围的任务则无法应对,智能水平较为低级,局限性较为突出。造成这种局限的原因主中国电子学会 7 要体现在两个方面: 一是 人工智能所基于的数学模型和数学手段被发现具有一定的缺陷; 二是 很多计算的复杂度 呈指数级增长,依据现有算法无法完成计算任务。先天的缺陷是人工智能在早期发展过程中遇到的瓶颈,研发机构对人工智能的热情逐渐冷却,对人工智能的资助也相应被缩减或取消,人工智能第一次步入低谷。 2、第二次浪潮:模型突破带动初步产业化,但推广应用存在成本障碍 数学模型实现重大突破,专家系统得以应用。 进入 20世纪 80 年代,人工智能再次回到了公众的视野当中。人工智能相关的数学模型取得了一系列重大发明成果,其中包括著名的多层神经网络( 1986)和 BP 反向传播算法( 1986)等,这进一步催生了能与人类下象棋的高度智能机器( 1989)。其它成果包括通过人工智能网络来实现能自动识别信封上邮政编码的机器,精度可达 99%以上,已经超过普通人的水平。与此同时,卡耐基 梅隆大学为 DEC 公司制造出了专家系统( 1980),这个专家系统可帮助 DEC 公司每年节约 4000 万美元左右的费用,特别是在决策方面能提供有价值的内容。受此鼓励,很多国家包括日本、美国都再次投入巨资开发所谓第 5 代计算机( 1982),当时叫做人工智能计算机。 中国电子学会 8 成本高且难维护,人工智能再次步入低谷。 为推动人工智能的发展,研究者设计了 LISP 语言,并针对该语言研制了 Lisp 计算机。 该机型指令执行效率比通用型计算机更高,但价格昂贵且难以维护,始终难以大范围推广普及。与此同时,在 1987 年到 1993 年间,苹果和 IBM 公司开始推广第一代台式机,随着性能不断提升和销售价格的不断降低,这些个人电脑逐渐在消费市场上占据了优势,越来越多的计算机走入个人家庭,价格昂贵的 Lisp 计算机由于古老陈旧且难以维护逐渐被市场淘汰,专家系统逐也渐淡出人们的视野,人工智能硬件市场出现明显萎缩。同时,政府经费开始下降,人工智能又一次步入低谷。 3、第三次浪潮:信息时代催生新一代人工智能,但未来发展存在诸多隐忧 新兴 技术快速涌现,人工智能发展进入新阶段。 随着互联网的普及、传感器的泛在、大数据的涌现、电子商务的发展、信息社区的兴起,数据和知识在人类社会、物理空间和信息空间之间交叉融合、相互作用,人工智能发展所处信息环境和数据基础发生了巨大而深刻的变化,这些变化构成了驱动人工智能走向新阶段的外在动力。与此同时,人工智能的目标和理念出现重要调整,科学基础和实现载体取得新的突破,类脑计算、深度学习、强化学习等一系列的技术萌芽中国电子学会 9 也预示着内在动力的成长,人工智能的发展已经进入一个新的阶段。 人工智能水平快速提升,人类面临潜在隐患。 得 益于数据量的快速增长、计算能力的大幅提升以及机器学习算法的持续优化,新一代人工智能在某些给定任务中已经展现出达到或超越人类的工作能力,并逐渐从专用型智能向通用型智能过渡,有望发展为抽象型智能。随着应用范围的不断拓展,人工智能与人类生产生活联系的愈发紧密,一方面给人们带来诸多便利,另一方面也产生了一些潜在问题:一是加速机器换人,结构性失业可能更为严重;二是隐私保护成为难点,数据拥有权、隐私权、许可权等界定存在困难。 (二)新一代人工智能的主要驱动因素 当前,随着移动互联网、大数据、云计算等新一代信息技术的加速 迭代演进,人类社会与物理世界的二元结构正在进阶到人类社会、信息空间和物理世界的三元结构,人与人、机器与机器、人与机器的交流互动愈加频繁。人工智能发展所处的信息环境和数据基础发生了深刻变化,愈加海量化的数据,持续提升的运算力,不断优化的算法模型,结合多种场景的新应用已构成相对完整的闭环,成为推动新一代人工智能发展的四大要素。 中国电子学会 10 图 2 新一代人工智能主要驱动因素示意图 资料来源:中国电子学会整理 1、人机物互联互通成趋势,数据量呈现爆炸性增长 近年来,得益于互联 网、社交媒体、移动设备和传感器的大量普及,全球产生并存储的数据量急剧增加,为通过深度学习的方法来训练人工智能提供了良好的土壤。目前,全球数据总量每年都以倍增的速度增长,预计到 2020 年将达到 44 万亿 GB,中国产生的数据量将占全球数据总量的近20%。海量的数据将为人工智能算法模型提供源源不断的素材,人工智能正从监督式学习向无监督学习演进升级,从各行业、各领域的海量数据中积累经验、发现规律、持续提升。 2、数据处理技术加速演进,运算能力实现大幅提升 人工智能领域富集了海量数据,传统的数据处理技术难以满足高强度、 高频次的处理需求。人工智能芯片的出现加速了深层神经网络的训练迭代速度,让大规模的数据处理效率显著提升,极大地促进了人工智能行业的发展。目前,出现了 GPU、 NPU、 FPGA 和各种各样的 AI-PU 专用芯片。相比传统的 CPU 只能同时做一两个加减法运算, NPU 等专用中国电子学会 11 芯片多采用 “数据驱动并行计算 ”的架构,特别擅长处理视频、图像类的海量多媒体数据。在具有更高线性代数运算效率的同时,只产生比 CPU 更低的功耗。 3、深度学习研究成果卓著,带动算法模型持续优化 2006 年,加拿大多伦多大学教授杰弗里 辛顿提出了深度学习的概念 ,极大地发展了人工神经网络算法,提高了机器自学习的能力,例如谷歌大脑团队在 2012 年通过使用深度学习技术,成功让电脑从视频中 “认出 ”了猫。随着算法模型的重要性进一步凸显,全球科技巨头纷纷加大了这方面的布局力度和投入,通过成立实验室,开源算法框架,打造生态体系等方式推动算法模型的优化和创新。目前,深度学习等算法已经广泛应用在自然语言处理、语音处理以及计算机视觉等领域,并在某些特定领域取得了突破性进展,从有监督式学习演化为半监督式、无监督式学习。 4、资本与技术深度耦合,助推行业应用快速兴起 当前,在技术突破和 应用需求的双重驱动下,人工智能技术已走出实验室,加速向产业各个领域渗透,产业化水平大幅提升。在此过程中,资本作为产业发展的加速器发挥了重要的作用,一方面,跨国科技巨头以资本为杠杆,展开投资并购活动,得以不断完善产业链布局,另一方面,各类资本对初创型企业的支持,使得优秀的技术型公司迅速脱颖而出。据美国技术研究公司 Venture Scanner 的调查报告显示,中国电子学会 12 截至到 2017 年 12 月,全球范围内总计 20