人工智能之认知图谱.pdf
人工智能之认知图谱 Research Report of Cognitive Graph 2020 年第 6 期 清华大学人工智能研究院 北京智源人工智能研究院 清华 中国工程院知识智能联合研究中心 阿里集团 新零售智能引擎事业群 2020 年 08 月 人工智能之认知图谱 Research Report of Cognitive Graph 2020 年第 6 期 清华大学人工智能研究院 北京智源人工智能研究院 清华 中国工程院知识智能联合研究中心 阿里集团 新零售智能引擎事业群 2020 年 08 月 摘要 认知图谱( Cognitive Graph)旨在结合认知心理学、脑科学和人类知识等, 研发融合知识图谱、认知推理、逻辑表达的新一代认知引擎,支持大规模知识的 表示、获取、推理与计算的基础理论和方法,实现人工智能从感知智能向认知智 能的演进,建立可解释、鲁棒性的第三代人工智能。 本报告围绕认知图谱的概念内涵、关键技术、人才研究、应用场景、发展趋 势等方面展开深入研究,主要内容包括: 一、认知图谱基本概念、产生历程、机遇与挑战。详细介绍了认知图谱的产 生背景和基本概念,以及在演化过程中出现的代表性事件,并总结了认知图谱在 当前环境下的机遇与挑战。 二、认知图谱基础理论和技术研究现状分析。根据认知图谱的概念,分别对 知识图谱、认知推理、逻辑表达等领域的概念背景、发展历程、关键技术、应用、 问题与挑战、未来研究方向等方面进行了详细介绍和深入分析。 三、认知图谱领域人才现状分析。基于 AMiner 平台 提供的论文和学者大数 据,从学者分布、学术水平、国际合作、学者流动等维度,对国内外相关研究学 者和机构进行了对比分析,总结中国科研学者队伍建设过程中的弱势环节和问题, 并提出对策建议。 四、认知图谱典型应用场景分析。首先以阿里巴巴电商平台为例,详细介绍 了认知图谱如何赋能电商平台的搜索、推荐等核心业务。然后介绍了认知图谱在 智慧城市、司法行业、金融行业、安防行业、精准分析、智慧搜索、智能推荐、 智能解释、自然人机交互等行业技术的应用场景和案例。 最后分析了认知图谱相关技术研究发展趋势和创新热点,以及中国的专利数 据 和国家 自然科学基金支持 情况,并展望了认知图谱未来发展方向。 目录 1 概述篇 . 2 1.1 认知图谱概念 . 2 1.2 认知图谱产生历程 . 4 1.3 认知图谱机遇与挑战 . 8 2 技术篇 . 12 2.1 知识图谱 . 12 2.1.1 知识图谱概念 . 12 2.1.2 知识图谱发展历程 . 14 2.1.3 知识图谱关键技术 . 15 2.1.4 知识图谱应用 . 54 2.1.5 知识图谱研究问题与挑战 . 55 2.1.6 知识图谱未来研究方向 . 56 2.2 认知推理 . 58 2.2.1 知识图谱推理概念 . 58 2.2.2 知识图谱推理关键技术 . 59 2.2.3 知识图谱推理应用 . 74 2.2.4 知识图谱推理研究问题与挑战 . 76 2.2.5 知识图谱推理未来研究方向 . 77 2.3 逻辑表达 . 80 2.3.1 自然语言生成概念 . 80 2.3.2 自然语言生成关键技术 . 82 2.3.3 自然语言生成应用 . 91 2.3.4 自然语言生成研究问题与挑战 . 92 2.3.5 自然语言生成未来研究方向 . 94 2.4 论文主题分析 . 95 2.5 经典论文解读 . 99 2.6 技术情报挖掘 . 104 3 人才篇 . 110 3.1 学者情况概览 . 110 3.1.1 学者分布地图 . 110 3.1.2 学术水平分析 . 112 3.1.3 国际合作分析 . 115 3.1.4 学者流动情况 . 117 3.2 代表性学者画像 . 119 3.2.1 国外代表性学者 . 121 3.2.2 国内代表性学者 . 131 3.3 中国学者问题与对策 . 140 4 应用篇 . 144 4.1 电商平台 . 144 4.1.1 认知推荐 . 145 4.1.2 基础数据层 . 145 4.1.3 推理引擎层 . 147 4.1.4 用户交互的文本和视觉智能 . 154 4.2 其他应用场景 . 167 4.2.1 行业应用 . 167 4.2.2 技术应用 . 169 5 趋势篇 . 176 5.1 技术研究发展趋势 . 176 5.2 技术研究创新热点 . 177 5.3 中国专利数据情况 . 179 5.4 国家自然科学基金支持情况 . 180 6 总结与展望 . 184 参考文献 . 187 附录 1 认知图谱相关的关键词列表 . 201 附录 2 代表性期刊和会议列表 . 202 附录 3 国家自然科学基金 NSFC 项目 . 210 图表目录 图 1 人工智能发展的几个阶段 . 2 图 2 双通道理论框架 . 3 图 3 认知图谱的演化历程 . 5 图 4 知识图谱样例 . 13 图 5 知识图谱发展历程 . 14 图 6 TransE 模型的简单示例 . 17 图 7 TransH 模型的简单示例 . 18 图 8 TransR 模型的简单示例 . 19 图 9 KG2E 模型的示例 . 21 图 10 传统模型和 TransG 模型比较 . 22 图 11 RESCAL 模型的简单图解 . 23 图 12 DistMult 模型的简单图解 . 24 图 13 HOlE 模型的简单图解 . 25 图 14 SME 模型的神经网络结构 . 26 图 15 NTN 模型的神经网络结构 . 27 图 16 MLP 模型的神经网络结构 . 27 图 17 NAM 模型的神经网络结构 . 28 图 18 知识图谱的体系架构 . 30 图 19 实体抽取样例 . 31 图 20 实体链接案例 . 38 图 21 RDF 图示例:电影知识图谱 . 45 图 22 属性图示例:电影知识图谱 . 46 图 23 属性表存储方案示例 . 49 图 24 Neo4j 中顶点和边记录的物理存储结构 . 52 图 25 VS*树 . 54 图 26 描述逻辑的语义表 . 61 图 27 描述逻辑与 OWL 词汇的对应表 . 61 图 28 Tableaux 的运算规则 . 62 图 29 Tableaux 的相关工具简介 . 62 图 30 逻辑编程改写的相关工具简介 . 63 图 31 基于一阶查询重写方法的处理流程 . 64 图 32 产生式规则系统的执行流程 . 65 图 33 产生式规则方法的相关工具 . 65 图 34 使用逻辑规则用于知识图谱推理任务的示例 . 66 图 35 RESCAL 模型 . 70 图 36 自然语言产生框架 . 81 图 37 询问天气场景中的句子模板 . 82 图 38 询问天气场景中的词汇模板 . 83 图 39 ELMo 模型架构 . 84 图 40 Transformer 模型架构 . 86 图 41 GPT 模型结构 . 87 图 42 BERT 模型的架构 . 89 图 43 XLNet 的 Attention Mask 原理机制 . 91 图 44 LDA 结构图 . 96 图 45 认知图谱相关技术概览 . 105 图 46 全球学者分布地图 . 111 图 47 中国学者分布地图 . 112 图 48 中国与其他国家的论文合作情况 . 117 图 49 全球学者的流动情况 . 118 图 50 中国学者的流动情况 . 119 图 51 AMiner 平台学者画像示例 . 120 图 52 阿里巴巴认知智能计算平台 . 145 图 53 阿里巴巴数据生态 . 146 图 54 ATRank 的网络结构 . 148 图 55 从用户行为学习解离化表征模型实现架构总览图 . 153 图 56 背包颜色维度示例图 . 154 图 57 背包大小维度示例图 . 154 图 58 KOBE 模型的基本框架 . 156 图 59 商品个性化推荐示例图 . 157 图 60 多模态表征学习框架 . 158 图 61 买家秀视频推荐的两个实际应用场景 . 161 图 62 商品关联属性信息图 . 162 图 63 Gavotte 模型结构图 . 163 图 64 GLA 模型结构图 . 165 图 65 部分实验结果示例图 . 167 图 66 M-Recnet 和 M-LiveBot 模型的结果对比图 . 167 图 67 认知图谱领域的技术研究发展趋势 . 177 图 68 认知图谱领域的技术创新热点词云图 . 178 图 69 中国历年的专利数量分布( 2010-2019 年) . 179 图 70 2010-2019 年中国专利数量 TOP 10 机构 . 180 图 71 认知图谱相关领域国家自然科学基金项目支持历年分布情况 . 181 图 72 认知图谱相关领域国家自然科学基金项目支持数量 TOP 10 机构统计 . 182 表 1 认知智能和感知智能的异同点 . 5 表 2 知识图谱产品统计 . 13 表 3 三元组表示例 . 49 表 4 认知图谱领域论文主题分布 . 96 表 5 h-index TOP 5000 全球学者的国家统计 . 111 表 6 h-index TOP 5000 中国学者的省市统计 . 112 表 7 论文总被引频次排名前 10 的国家 . 113 表 8 论文总被引频次排名前 10 的全球机构 . 114 表 9 论文总被引频次排名前 10 的中国机构 . 115 表 10 合作论文数量排名前 10 的国家列表 . 115 表 11 学术指标说明 . 119 表 12 认知图谱研究热点子领域的代表性学者的学术指标统计 . 178 表 13 认知图谱相关领域国家自然科学基金项目分类情况( 2010-2020 年) . 180 表 14 认知图谱相关领域的关键词列表 . 201 表 15 认知图谱领域代表性期刊和会议列表 . 202 表 16 认知图谱领域国家自然科学基金支持的相关项目( 2010-2020 年) . 210 1 1 概述篇 人工智能之认知图谱 Research Report of Cognitive Graph 2 1 概述篇 1.1 认知图谱概念 大规模常识知识库与基于认知的逻辑推理是人工智能发展的瓶颈问题。 1968 年图灵奖获得者 Edward Feigenbaum 研发出世界首个专家系统 DENDRAL,并随 后在第五届国际人工智能会议上提出,将知识融入计算机系统是解决只有领域专 家才能解决的复杂问题的关键; 1999年互联网发明人、图灵奖获得者 Tim Berners- Lee 爵士提出语义网的概念,核心理念是用知识表示互联网,建立常识知识; 2019 年图灵奖获得者 Yoshua Bengio 在 NeurIPS 大会上的主题报告中指出深度学习应 该从感知为主向 基于认知的逻辑推理和知识表达方向发展,这个思想和清华大学 张钹院士近期提出的第三代人工智能思路不谋而合。总的来说人工智能的发展经 历了表示、计算到感知两个阶段,下一个阶段的核心是认知(见 图 1)。近期图 灵奖获得者 Manuel Blum 夫妇提出意识 AI(意识智能)的思想,这是一个既经 典又全新的概念和思路。核心的理念就是构造一个新型的可用数学建模、可计算 的机器认知 /意识模型。 图 1人工智能发展的几个阶段 阿里巴巴达摩院发布 “2020 十大科技趋势 ”报告中提到 , 人工智能已经在 “听 、 说 、 看 ”等感知智能领域达到或超越了人类水准 , 但在需要外部知识 、 逻辑推理 或者领域迁移的认知智能领域还处于初级阶段 1。 复旦大学肖仰华教授在报告 “知识图谱与认知智能 ”中描述了 , 让机器具备认知智能具体体现在机器能够理解 3 数据、理解语言进而理解现实世界的能力,体现在机器能够解释数据、解释过程 进而解释现象的能力,体现在推理、规划等等一系列人类所独有的思考认知能力 上,需要去解决推理、规划、联想、创作等复杂任务 2。如何实现认知智能,阿 里巴巴新零售智能引擎事业群总监杨红霞在 CNCC2018会议上的报告 “Extremely large scale cognitive graph representation in practice”详细介绍了阿里电商认知图 谱,以更好地认知用户需求为目标,将助力搜索推荐等从基于行为的方式迈向基 于行为与语义融合的认知智能时代 3。 清华大学唐杰教授在 “人工智能下一个十年 ”报告 4中 , 结合认知科学和计算 机理论,给出了一个实现认知智能的可行思路:认知图谱 =知识图谱 +认知推理 + 逻辑表达,希望利用知识表示、推理和决策,包括人的认知来解决复杂问题。这 个思路的基本思想是结合认知科学中的双通道理论,在人脑的认知系统中存在两 个系统: System 1 和 System 2,如 图 2所示。 System 1 是一个直觉系统,它可以 通过人对相关信息的一个直觉匹配寻找答案,它是非常快速、简单的;而 System 2 是一个分析系统 , 它通过一定的推理 、 逻辑找到答案 。 比如 , 针对以下问题 : “找到一个 2003 年在洛杉矶的 Quality咖啡馆拍过电影的导演 ”。 System 1 首先找 到相关的影片,然后用 System 2 来做决策,如果是标准答案,就结束整个推理的 过程。如果不是标准答案,而相应的信息又有用,就 把它作为一个有用信息提供 给 System 1, System 1 继续做知识的扩展, System 2 再来做决策,直到最终找到 答案。图灵奖获得者 Bengio 在 NIPS 2019 大会的 Keynote 也提到, System 1 到 System 2 的认知是深度学习未来发展的重要方向。 图 2 双通道理论框架 4 到目前为止,认知图谱在学术界和工业界还没有一个统一定义。百度百科给 出的认知图谱定义如下:认知图谱( Cognitive Graph)旨在结合认知心理学、脑 科学和人类知识等,研发知识图谱、认知推理、逻辑表达的新一代认知引擎,实 现人工智能从感知智能向认知智能的演进。认知图谱是计算机科学的一个研究分 支,它企图了解智能的实质,并实现感知智能系统到认知智能系统的重大技术突 破 5。 清华大学唐杰教授的 “认知图谱 人工智能的下一个瑰宝 ”文 章中 , 认知图谱 的核心是以实现融合知识驱动和数据驱动相结合的知识表示和推理的认知引擎 为目标,研究支持鲁棒可解释人工智能的大规模知识的表示、获取、推理与计算 的基础理论和方法;建设包含语言知识、常识知识、世界知识、认知知识的大规 模知识图谱以及典型行业知识库,建成知识计算服务平台。 清华大学丁铭博士的 “从知识图谱到认知图谱 : 历史 、 发展与展望 ”文章中 , 认知图谱被解释为 “基于原始文本数据 , 针对特定问题情境 , 使用强大的机器学 习模型动态构建的 , 节点带有上下文语义信息的知识图谱 ”。 让机器具备认知智能,其核心就是让机器具备理 解和解释能力。这种能力的 实现与大规模、结构化的背景知识是密不可分的。认知图谱是实现机器认知智能 的使能器,一方面通过建立从数据到认知图谱中实体、概念、关系的映射,让机 器理解数据的本质;另一方面利用认知图谱中实体、概念和关系来解释现实世界 中事物和现象,让机器解释现象的本质。 1.2 认知图谱产生历程 从现阶段人工智能的发展来看,随着计算力的不断发展,储存手段的不断升 级,具有快速计算和记忆存储能力的计算智能可以说已经实现;而随着移动互联 网普及,大数据、云计算等技术发展,更多非结构化数据的价值被重视和挖掘, 语音、图像、视频、触点等与感知相关的感知智能也在快速发展;在计算智能和 感知智能发展基础上,人工智能正在向能够分析、思考、理解、判断等认知智能 延伸,真正的智能化解决方案已经显现端倪。下表展示了认知智能和感知智能的 5 异同。 表 1认知智能和感知智能的异同点 差异点 认知智 能 感知智能 特点 强调认知、理解 以人控为主,由人告知机器 如何行动 要求能力 有学习、推理能力,能通过分析做出恰当 决策,为人们提供参考 接受人的训练、培养 与外界关 系 与人、环境之间有互动,增加人类智慧 没有互相的反馈,主要由人 控制,根据人类的需求而工 作 衡量标准 没有统一标准,遇到具体问题具体分析 有像图灵测试这样的衡量标 准 计算行为 以大规模数据为背景,模拟人的思考行为 统计分析大规模数据 认知图谱结合大规模、结构化的背景知识,利用知识表示、推理和决策,通 过了解智能的实质,让机器具备理解和解释事物本质的能力,是实现感知智能系 统到认知智能系统的重大技术突破一种有效手段。 图 3 展示了认知图谱演化过 程中出现的代表性事件。 图 3 认知图谱的演化历程 认知图谱的历程发展可以追溯到语义网络( Semantic Network)。 1968 年, Quillian 在文献 Semantic Memory in M. Minsky6研究人类长期记忆模型时,描述 了人类长期记忆的一般结构模型,认为记忆由概念之间的联系来实现并存储在复 杂的网络中,并基于此提出了语义网络的概念。语义网络是通过概念及其语义关 系来表达知识的一种网络图 。 随着互联网的发展 , 语义网络有了新的应用场景 语义网 ( Semantic Web)。 6 1968 年,美国斯坦福大学的 Edward Feigenbaum(图灵奖获得者)等人在文 献 Heuristic DENDRAL: A program for generating explanatory hypotheses7中,提出 了首个专家系统 DENDRAL,旨在帮助化学家判断某待定物质的分子结构。专家 系统是一个具有大量的专门知识与经验的程序系统,它应用人工智能 技术和计算 机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟 人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题。 自二十世纪 70 年代中期以来, 人工智能 (简称 AI)领域的研究人员认识到, 知识的获取乃是构建强大 AI 系统的关键所在,他们借助于来自哲学本体论的灵 感,认为通过将本体( Ontology)创建 成为计算模型,可以成就特定类型的自动 推理。二十世纪 80 年代, AI领域研究人员开始将本体应用到信息科学领域。 1991 年美国斯坦福大学的 Thomas R. Gruber 在文献 The role of common ontology in achieving sharable, reusable knowledge bases8中介绍了一种构建可共享、可重用 知识库的策略,其中本体作为知识耦合构造角色,在其中发挥核心作用。本体是 (特定领域)信息组织的一种形式,是领域知识规范的抽象和描述,是表达、共 享、重用知识的方法。本体是知识体系构建的关键技术,通过对知识建模,使计 算机能够识别人类知识,相当于知识图谱的模式架构( Schema)。 1984 年,美国 微电子与计算机技术公司 的 Douglas Lenat设立的 Cyc项目是最早的本体知识库, 旨在。 1994 年, Cyc 项目从该公司独立出去,并以此为基础成立了 Cycorp 公司。 1989 年,英国的计算机科学家 Tim Berners-Lee(万维网联盟 W3C 主管)发 明了万维网( World Wide Web)。万维网通过超文本标记语言( HTML)把信息组 织成为图文并茂的超文本,利用链接从一个站点跳到另个站点,以此摆脱以前查 询工具只能按特定路径一步步地查找信息的限制 。 2017 年 , Tim Berners-Lee 因 “发明万维网 、 第一个浏览器和使万 维网得以扩展的基本协议和算法 ”获得 2016 年度的 图灵奖 。 1998 年, Tim Berners-Lee 再次在文献 Semantic Web Road Map9中提出语义 网( Semantic Web)。语义网的核心是:通过给 万维网 上的文档(如: HTML 文 档 、 XML文档 ) 添加能够被计算机所理解的语义 “元数据 ”( Meta Data), 从而使 7 整个互联网成为一个通用的信息交换媒介。语义网是能够根据语义进行判断的智 能网络,它不但能够理解词语和 概念 ,而且还能够理解它们之间的逻辑关系,可 以使交流变得更有效率和价值。 2006 年, Tim Berners-Lee 提出链接数据( Linked Data)的概念,数据不仅仅 发布于语义网中,而要建立起数据之间的链接从而形成一张巨大的链接数据网。 链接数据提出的目的是构建一张计算机能理解的语义数据网络,而不仅仅是人能 读懂的文档网络,以便于在此之上构建更智能的应用。链接数据 也可以是开放数 据,在这种情况下通常称为链接开放数据( Linked open data, LOD)。 2012 年, Google 的 Singhal 等人在博客 Introducing the Knowledge Graph: things, not strings10中介绍了知识图谱( Knowledge Graph)的概念。知识图谱以 语义网络的结构化方式描述客观世界中概念、实体、事件以及它们之间的关系, 相对于传统的本体和语义网络而言,实体覆盖率更高,语义关系也更加复杂而全 面。 Google 使用语义检索从多种数据来源收集信息构建知识图谱,以提高 Google 搜索的质量。 2018 年,阿里巴巴新零售智能引擎事业群总监杨红霞在 CNCC2018 会议上 的报告 “Extremely large scale cognitive graph representation in practice”详细介绍了 阿里电商认知图谱,以更好地认知用户需求为目标,将助力搜索推荐等从基于行 为的方式迈向基于行为与语义融合的认知智能时代 3。 2020 年,清华大学唐杰教 授在 “人工智能下一个十年 ”报告 4中 , 结合认知科学中的双通道理论和计算机理 论,给出了一个实现认知智能的可行思路:认知图谱 =知识图谱 +认知推理 +逻辑 表 达,希望利用知识表示、推理和决策,包括人的认知来解决复杂问题。 人工智能作为新一轮产业变革的核心驱动力和引领未来发展的战略技术,引 起了世界各国的高度重视,并取得了快速发展。然而大规模常识知识库与基于认 知的逻辑推理是人工智能发展的瓶颈问题。认知图谱以实现融合知识驱动和数据 驱动相结合的知识表示和推理的认知引擎为目标,是实现鲁棒可解释人工智能的 关键技术手段。 8 1.3 认知图谱机遇与挑战 尽管人工智能依靠深度学习和机器学习技术的进步取得了巨大的进展,例如, AlphaGo 通过自我强化学习击败了人类顶尖的围棋选手,但人工智能在很多方面, 如语言理解、视觉场景理解、决策分析等,仍然举步维艰。当前的人工智能识别 做的只是比对 , 缺少信息进入大脑之后的加工 、 理解 、 思考等步骤 , 因此仅仅停 留在 “感知 ”, 而并非 “认知 ”。 要让人工智能有类似大脑的活动 , 走到认知阶段 , 需要让它掌握知识、进行推理。机器必须要掌握大量的知识,特别是常识知识才 能实现真正类人的智能。 目前的智能系统在感知方面已经达到甚至超越人类水平,但在鲁棒性、可解 释性、安全可靠等方面还存在很多不足。感知智能技术存在的缺陷,包括但不限 于: ( 1)模型鲁棒性差,难以与准确性共生。为了揭示深度神经网络模型的鲁 棒性和准确性之间的关系,来自 IBM 研究院,加州大学戴维斯分校,麻省理工 学院以及京东 AI 研究院的研究人员,系统性地度量了 18 个被学术界和工业界 广泛接受并使用的 ImageNet 深度神经网络模型,如 AlexNet、 VGG Nets、 Inception Nets、 ResNets、 DenseNets、 MobileNets、 NASNets 等的鲁棒性。该研究发现: 1)准确度越高的模型的鲁棒性普遍越差,且分类错误率的对数和模型鲁棒性存 在线性关系; 2)相比 于模型的大小,模型的结构对于鲁棒性的影响更大。 ( 2)模型可解释性差,对于可靠性要求高的任务很难胜任。比如大部分阅 读理解方法都只能看做黑盒,从输入问题和文档到输出答案文本块,问题与答案 中间的练习部分处于黑盒中心。用户无法看到从问题到答案的推理过程,从而无 法验证答案的对错。要使认知图谱具有可解释性,需要向用户展示推理路径或者 子图,每个推理节点上的支撑事实,或是用于对比的其他可能答案和推理路径。 ( 3)缺乏积累知识的能力,也没能和人类已有的知识体系进行很好的关联, 缺乏可靠的推理方法。比如对于多跳问答的问题,问题 和答案间拥有多少相似词 汇已经不能作为答案检索的重要依据。检索时需要有知识支撑,通过知识理解问 9 题与答案之间的联系。若知识的涵盖度不够,或检索时仅仅理解局部片段,而非 整个文档,缺乏在知识层面上的推理能力,就会出现短视检索的问题。 人类社会已经进入智能时代,智能时代的社会发展催生了大量的智能化应用, 智能化应用对机器的认知智能化水平提出了前所未有的要求。繁杂的应用场景、 深度的知识应用、密集的专家知识给认知图谱的研究带来了巨大挑战 11。 近年虽 然人工智能取得快速发展,但如何将深度学习与大规模常识知识结合起来,实现 认知推理与逻辑表达还面临很大挑战。 ( 1) 繁杂的应用场景 。 由于企业与领域应用呈现出鲜明的复杂特性 , 因此 构建企业知识图谱面临的场景是 “小而杂 ”, 比如员工报销的审批流程涉及员工基 本信息、天气、交通、财务报销制度等。而计算机喜欢用通用模型处理问题,如 果需要针对不同场景定制模型,给数据处理、模型学习等方面都会带来 巨大挑战。 ( 2) 深度的知识应用。通过构建数据驱动的统计模型在用户行为数据丰 富、应用模式简单的搜索与推荐等场景中应用效果良好,但是难以解决面向复杂 决策的智能运维、医疗诊断、司法研判等应用场景的实际问题。这些应用场景需 要知识驱动的智能系统,通过大规模背景知识支撑模型学习、推理和决策。 ( 3) 密集的专家知识。由于大部分领域应用需要密集的专家知识,比如故 障排查、医疗问诊等。而专家知识的获取渠道通常是行业从业人员,难以直接从 开放数据源中抽取,导致专家知识的数量稀少,无法满足现阶段领域应用的需求。 ( 4) 复杂的数据资源。如今时代虽然产 生了海量数据,但是 大数据环境下 数据的分布、异构、动态、碎片化和低质等特征给知识工程和知识服务提出了新 挑战,也使得 高度依赖数据规模和质量的机器学习和深度学习模型在部分场景问 题中难以达到预期的解决效果。 针对既需要从感知角度学习数据的分布表示,又 需要从认知角度解释数据语义的需求,构建新一代开放常识知识图谱和研发认知 推理核心技术成为实现下一代人工智能技术突破的关键 。 ( 5) 自适应的知识推理。人工智能时代多样化的数据特征和任务需求,对 研究大规模多粒度自学习的知识推理技术提出了新挑战:基于深度学习与逻辑推 10 理相结合的大规模多粒 度知识推理,基于本体、规则与深度学习相结合的大规模 知识推理,以及实现亿级三元组和万级规则的快速推理;基于时空特性的知识演 化模型和推理规则的自学习,研制知识、推理、逻辑的演化系 统,能够根据外界 反馈实时对知识进行更新,实现推理规则的自学习和逻辑表达的自学习。 总之,无论是在具备智能理解能力还是安全性方面,以感知智能技术为主的 人工智能与人类智能相去甚远。随着数据红利消耗殆尽,以深度学习为代表的感 知智能遇到天花板。认知智能将是未来一段时期内人工智能发展的焦点,是进一 步释放人工智能产能的关键,而结合知识图谱、认知推理 、逻辑表达的认知图谱 是实现认知智能技术突破的关键,不仅让机器理解数据本质,还可以让机器解释 现象本质。 11 2 技术 篇 12 2 技术篇 基于前述内容,认知图谱的研究内容主要包括知识图谱、认知推理和逻辑表 达,因此本章节重点介绍以上 3 个研究方向的概念、发展历程、关键技术、问题 与挑战、未来研究方向等信息,旨在为读者了解认知图谱领域的基础、应用研究 的代表性成果、研究动向和进展提供信息窗口。 2.1 知识图谱 知识图谱被认为是从感知智能通往认知智能的重要基石。一个很简单的原因 就是 , 没有知识的机器不可能实现认知智能 。 图灵奖获得者 , 知识工程创始人 Edward Feigenbaum 曾经提到 : “Knowledge is the power in AI system”。 张钹院士 也提到 , “没有知识的 AI不是真正的 AI”。 从感知到认知的跨越过程中 , 构建大 规模高质量知识图谱是一个重要环节,当人工智能可以更结构化地表示理解人类 知识并进行互联,才有可能让机器真正实现推理、联想等认知功能。 2.1.1 知识图谱概念 知识图谱( Knowledge Graph, KG)将互联网的信息表达成更接近人类认知 世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识 图谱给互联网语义搜索带来了活力,同时也在智能问答、大数据分析与决策中显 示出强大威力,已经成为互联网基于知识的智能服务基础。知识图谱与大数据和 深度学习一起,成为推动人工智能发展的核 心驱动力之一。 知识图谱以结构化的方式描述客观世界中概念、实体、事件以及它们之间的 关系,本质上是一种语义网络,网络节点表示实体或者概念,边表示实体或者概 念之间的关联关系。其中,概念是指人们在认识世界过程中形成的对客观事物的 概念化表示,如国家、城市、人物等;实体是客观世界中的具体事物,如中国、 北京等。属性也是一种实体,用于描述事物的内在信息,比如中国的面积、人口 等。关系描述概念、实体之间客观存在的关联,如首都描述了城市和国家的关系, 国家和城市之间概念和子概念的关系等。 图 4展示了知识图谱样例。 13 图 4 知识图谱样例 虽然知识图谱的概念由谷歌在 2012 年提出,但早在此之前,出现了大量的 相关产品。尤其在 2006 年, Berners-Lee 提出了数据链接( linked data)的思想, 通过对 URI( uniform resource identifier)、 RDF( resource description framework) 和 OWL( web ontology language)等技术标准的推广和完善,掀起了一场语义网 络研究热潮,基于语义网络的研究成果,衍生了很多知识库成果。 表 2介绍了一 些著名的通用领域知识图谱产品的规模。我国对中文知识图谱的研究虽然起步较 晚,但取 得了很多有价值的研究成果。比如早期由中国科学院计算机语言信息中 心发布的知网( HowNet),清华大学构建的 XLORE 是第一个大规模中英文跨语 言知识图谱,复旦大学推出的中文知识图谱项目,上海交通大学发布的中文知识 图谱研究平台 zhishi.me 等等。中文知识图谱对中文信息的处理和检索具有重要 的应用价值,近年来吸引了大量的研究。 表 2 知识图谱产品统计 知识图谱 名称 实体数量 事实三元组 数量 访问网址 WordNe 117,597 207,016 wordnet.princeton.edu OpenCyc 47,000 306,000 Cyc 250,000 2,200,000 YAGO 1,056,638 5,000,000 mpii.mpg.de/suchanek/yago DBpedia 1,950,000 103,000,000 wiki.dbpedia/develop/datasets 14 Freebase - 125,000,000 NELL - 242,453 rtw.ml.cmu.edu/rtw/ Wikidata 14,449,300 - wikidata/wiki Probase IsA 12,501,527 85,101,174 ownload Google KG 500 million 3.5 billion XLORE 2,466,956 16,284,901 xlore/ 2.1.2 知识图谱发展历程 知识图谱实质上是一种图形化知识表示形式。知识表示在逻辑和人工智能领 域经历了漫长的发展历史。图形化知识表示的思想最早可以追溯到 1956 年 Richens12提出的语义网概念,而符号逻辑知识可以追溯到 1959 年文献 13提出的 一般问题解决方法。知识库首先被用于基于知识的推理和问题解决系统。 MYCIN14是最著名的基于规则的医学诊断专家系统之一,其中知识库约有 600 条规则。 后来,人类知识表示社区推动了基于框架的语言、基于规则的表示和混 合表示的发展。大约在这个时期的末期, Cyc 项目 15开始了,旨在汇集人类的知 识。资源描述框架( Resource Description Framework, RDF) 16和 Web 本体语言 ( OWL) 17相继发布,成为语义 Web18的重要标准。然后,许多开放知识库或 本体被发布,如 WordNet、 DBpedia、 YAGO 和 Freebase。 Stokman 和 Vries19在 1988 年提出了一个使用 图进行知识结构化表示的现代概念。然而, 2012 年谷歌 提出利用知识图谱,提升搜索引擎的质量,知识图谱的概念才得到了广泛关注, 当时谷歌利用 Knowledge vault20(一种知识融合框架)来构建大规模的知识图 谱。 图 5展示了知识图谱的发展路线 21。 图 5 知识图谱发展历程 15 从上图可以看出,知识图谱的发展历程大致可以归纳为:从 20 世纪五六十 年代提出语义网络, 20 世纪 70 年代出现了语义网络和一阶逻辑谓词的关系, 20 世纪 80 年代开始完善语义网络理论(语义推理), 20 世纪 90 年代产生了概念关 系建模, 21 世纪出现了新的应用场景(语义 web):通过 W3C 的标准拓展 web, 实现数据在不同应用中的共享和重用,用户上传各种图结构的数据( W3C 的标 准 RDF)形成连接数据,最后 2012 年谷歌提出知识图谱( Knowledge Graph)概 念。谷歌于 2012 年月推出谷歌知识图谱,旨在增强其搜索引擎的搜索结果, 标志着大规模知识在互联网语义搜索中的成功应用 。 通过以上介绍,可以发现知识图谱的前身(比如 WordNet、 Cyc项目、 HowNet) 主要通过专家制定规则或者提供专业知识进行构建的。这类知识资源的质量虽然 有保证,但是规模较小、领域局限性较强。后来为了扩大知识规模,出现了基于 群体智能的构建方法,具体是利用维基百科、百度百科、互动百科等百科类数据 源中的半结构化信息(比如信息框),比如 DBpedia、 Freebase 以构建本体的形式 对维基百科中的知识条目进行组织, YAGO 融合了 WordNet 中良好的概念层次 结构和维基百科中的大量知识条目数据。清华大学和上海交 通大学通过利用维基 百科、百度百科、互动百科,建立了大规模知识图谱 XLORE 和 Zhishi.me22。其 中, XLORE 是融合中英文维基、法语维基和百度百科,对百科知识进行结构化 和跨语言链接构建的多语言知识图谱,是中英文知识规模较平衡的大规模多语言 知识图谱。大数据时代,互联网上存在海量的信息资源,为 了提高知识图谱的覆 盖度,满足智能化信息发展的需求,从互联网数据自动获取知识是建立可持续发 展知识图谱的发展趋势。面向互联网上大规模、碎片化、异构的数据环境,学术 界和工业界研发了一系列利用机器学习和信息抽取技术自动抽取知识的方法。比 如华盛