2022-2023人工智能研究报告.pdf
2022-2023人工智能研究报告前 言 在新科技革命和产业变革的大背景下,人工智能与产业深度融合,是释放数字化叠加倍增效应、加快战略新兴产业发展、构筑综合竞争优势的必然选择。当前,人工智能加快向各产业渗透,正在促进新兴产业之间、新兴产业与传统产业之间以及技术与社会的跨界融合发展 。在 “十四五 ”开端 ,全面梳理人工智能的发展态势,具有十分重要的参考意义。 本白皮书重点从人工智能政策、技术、应用和治理等维度进行了阐述。 政策层面 ,国内外不断强化人工智能的战略地位 ,推动释放人工智能红利 。 技术 及应用 层面 ,以深度学习为代表的人工智能技术飞速发展, 新技术开始探索落 地应用; 工程化能力不断增强,在医疗、制造、自动驾驶等领域的应用持续深入 ; 可信人工智能技术引起社会广泛关注。与此同时, 治理层面 工作也受到全球高度关注,各国规制进程不断加速,基于可信人工智能的产业实践不断深入。 总体来看,本白皮书认为人工智能 逐步 进入新的阶段, 下一步的发展方向,将由 技术创新 、 工程 实践 、 可信 安全 “三维”坐标来定义和牵引。具体来看,第一个维度突出创新 , 围绕着算法和算力方面的创新仍会不断涌现 。 第二个维度突出工程 , 工程化能力逐渐成为人工智能大规模赋能千行百业的关键要素 。 第三个维度突出可信 , 发展负责任和可信的人工智能成为共识,将抽象的治理原则落实到人工智能全生命流程将成为重点 。 由于人工智能发展速度之快、辐射范围之广、影响程度之深前所未有,我们对人工智能的认识还有待进一步深化,白皮书中存在的不足之处,欢迎大家批评指正。 目 录一、 人工智能发展概述 . 1 (一 ) 全球不断升级人工 智能战略,纷纷抢抓重要发展机遇 . 1 (二 ) 人工智能开始迈入 全新阶段,持续健康发展成为焦点 . 4 二、 人工智能技术及应用沿着 “创新、工程、可信 ”三个方向持续演进 . 7 (一 ) 人工智能在追求极 致创新方面不断突破 . 8 (二 ) 人工智能工具链成 为工程实践能力核心 . 14 (三 ) 安全 可信人工智能 技术朝着一体化发展 . 16 三、 全球高度关注人工智能治理工作,人工智能安全可信成重点 . 18 (一 ) 人工智能风险 不断 增多,全球初步建立 治理 机制 . 18 (二 ) 人工智能治理迈入 软硬法协同和场景规制新阶段 . 23 (三 ) 人工智能安全框架 成为有效防范风险的关键指 引 . 26 (四 ) 可信人工智能已成 为落实治理要求的重要方法论 . 29 四、 总结与展望 . 32 参考文献 . 34 图 目 录图 1 人工智能演进的三个维度示意图 . 5 图 2 大模型参数量和训练数据规模增长示意图 . 9 图 3 人工智能治理机制示意图 . 21 图 4 人工智能安全框架 . 28 图 5 可信人工智能总体框架 . 30 1 一、 人工智能发展概述 人工智能是引领未来的新兴战略性 技术,是驱动新一轮科技革命和产业变革的重要力量。习近平总书记多次作出重要指示,强调“要深入把握新一代人工智能发展的特点,加强人工智能和产业发展融合,为高质量发展提供新动能 ”。近年来,人工智能相关技术持续演进 ,产业化和商业化进程不断 提速 ,正在 加快 与千行百业深度融合 。站 在 “十四五 ”开端这一特殊的节点 , 我们坚信全面 梳理人工智能政策、技术、应用以及治理的发展态势, 能够有益于凝聚业界共识,推动人工智能持续健康发展 。 (一 )全球不断升级 人工智能战略 ,纷纷抢抓重要发展机遇 人工智能已成为科技创新的关键领域和数字经济时代的重要支柱。 自 2016 年起,先后有 40 余个国家和地区将推动人工智能发展上升到国家战略高度。近两年来,特别是新冠疫情的冲击下,越来越多的国家认识到,人工智能对于提升全球竞争力具有关键作用,纷纷深化人工智能战略。 欧盟 发布 2030数字化指南:欧洲数字十年、升级 2020新工业战略等,拟全面重塑数字时代全球影响力,其中将推动人工智能发展列为重要的工作。 美国 陆续成立了国家人工智能倡议办公室、国家 AI研究资源工作组等机构,各部门密集出台了系列政策,将人工智能提到“未来 产业”和“未来技术”2 领域的高度,不断巩固和提升美国在人工智能领域的全球竞争力,确保“领头羊”地位。 日本 继制定科学技术创新综合战略 2020之后,于 2021年 6月发布“ AI战略 2021” 1,致力于推动人工智能领域的创新创造计划,全面建设数字化政府。 英国 于 2021年 9月发布国家级人工智能新十年战略,这是继 2016年后推出的又一重要战略,旨在重塑人工智能领域的影响力。 中国 中共中央关于制定国民经济和社会发展第十四个五年规划和 2035 远景目标纲要的建议指出,要瞄准人工智能等前沿领域,实施一批具有前瞻性、战略性重 大科技项目,推动数字经济健康发展。 面向人工智能领域创新需求的投资不断加大。 主要经济体通过激励计划和直接投资项目等推动人工智能发展已广泛实践。 欧盟不断加大人工智能产业资金支持力度,大力促进欧洲的数字变革。 欧盟有史以来最大的支持研发和创新项目 “地平线欧洲”计划总投资额达 955亿欧元,明确将人工智能列入资金支持范围。 2021年4月,欧盟以条例的形式通过“数字欧洲计划”,对包括人工智能在内的项目进行投资,总额达 75.9亿欧元 2。 美国以保持领先地位为战略目标并持续加大人工智能领域投入 。 美国 2021年人工智能非国防预算增加约 30%,总额达到 15 亿美元 3。此外在美国创新与竞争法案中,将人工智能、量子计算等列为 2022财年美国研发预算优 1 8.cao.go.jp/cstp/ai/aistrategy2021_gaiyo.pdf 2 资料来源:欧盟委员会。 3 3 先事项,未来对包括人工智能在内的多个领域共投入 1000亿美金进行研发工作。 英国将投资和规划人工智能生态系统作为长期战略 ,启动国家人工智能研究与创新计划,支持人工智能先进研究等。据统计, 2014年到 2021年之间对人工智能的投资已经超过 23亿英镑 4。 通过应用牵引推动人工智能技术落地成为各国共识 。 美国引导人工智能技术在行业领域的创新和融合应用 。 2021年 7月, 美国国家科学基金会联合多个部门和知名企业等,新成立 11 个国家人工智能研究机构,涵盖了 人机交互、人工智能优化、动态系统、增强学习等 方向,研究项目更是涵盖了建筑、医疗、生物、地质、电气、教育、能源等多个领域。 英国支持人工智能产业化 ,启动人工智能办公室和英国研究与创新局联合计划等,确保人工智能惠及所有行业和地区,促进人工智能的广泛应用。 日本将基础设施建设和人工智能应用作为重点 ,提出加快建设相关基础设施,重点强调了跨行业的数据传输平台以及人工智能相关标准等,全面推动人工智能在医疗、农业、交通物流、智慧城市、制造业等 各个行业开展应用,并加大对中小企业的支援。 我国十四五规划纲要明确大力发展人工智能产业,打造人工智能产业集群以及深入赋能传统行业成为重点 。2021年 4月,工信部支持创建北京、天津(滨海新区)、杭州、广州、成都等第二批国家人工智能创新应用先导区,不断强化应用牵 4 gov.uk/government/news/new-ten-year-plan-to-make-britain-a-global-ai-superpower 引作用。科技部支持建设多个人工智能创新发展试验区,陆续批复北京、上海、天津、深圳、杭州等 15个国家新一代人工智能创新发展试验区。 (二 )人工智能 开始 迈入 全新 阶段 ,持续健康发展成为焦点 人工智能自 1956年诞生以来,相关理论和技术持续演进。直到近十年,得益于深度学 习等算法的突破、算力的不断提升以及海量数据的持续积累,人工智能才得以真正大范围地从实验室 研究 走向产业 实践 。 产业发展和赋能的过程中,一方面,大量的实践场景均能看到从“可用”到“好用”的发展路径,这离不开技术自身的持续迭代,工程实现的不断优化,以及管理体系的支撑保障。另一方面,随着人工智能应用暴露出各种风险和挑战,以及人们对人工智能认识的不断深入, 人工智能治理 已经成为全球各界高度关注的议题,对可信安全的呼声不断增多。 未来人工智能除了重视技术创新以外,还更加关注工程实践和可信安全,这也构成了新的“三维”发展坐标,牵引人工智能技术产业迈向新的阶段 。 事实上,业界在各个维度上的努力早已开始,并且从未停止过,只是时至今日,工程实践和可信安全被摆在了更为重要的位臵。三维坐标并非完全独立,而是相互交织、相互支撑。图 1 给出了本轮人工智能浪潮以来沿着各个方向演进的示意图,概述了各坐标下的发展脉络。 来源:中国信息通信研究院 图 1 人工智能演进的三个维度示意图 追求特定场景下的 技术创新 一直是人工智能发展的目标和驱动力 。 以深度学习为代表的算法爆发拉开了人工智能浪潮的序幕,在计算机视觉、智能语音、自然语言处理等领域 广泛应用,相继 超过6 人类识别水平 5。 人工智能算力 的多元化以及单点算力的不断提升,有力支撑了人工智能的发展。再到 近期 ,国内外 超大规模 预训练 模型频繁涌现, 不断刷新各个应用领域的榜单。未来,在算法、算力等方面仍将持续变革,为迈向更加智能的时代奠定基础 。 工程 实践 能力日益成为释放人工智能技术红利的重要支撑 。 在工程 实践方面的努力, 最早可追溯至 Caffe、 TensorFlow、 PaddlePaddle等开源框架的诞生,通过屏蔽底层硬件 和操作系统 细节,大幅降低模型 开发和部署 难度 ,有效推动了人工智能技术的扩散 。当前,人工智能与云计算、大数据等支撑技术的融合不断深入, 围绕着 数据处理、 模型训练 、部署运营和安全 监测 等 各 环节的工具链不断丰富 。人工智能研发管理体系日益 完善 ,以 MLOps为代表的自动运维技术受到越来越多的关注 。 随着工程实践能力的不断提升,“小作坊、项目制”的赋能方式正在成为历史,未来将会更加便捷、高效地实现人工智能落地应用和产品交付。 可信 安全 逐渐成为人工智能赋能过程中不可或缺的保障 。可信人工智能最早由学术界提出, 近年来 围绕着 安全性、 稳定性、可解释性、隐私保护、公平性等方面的 可信人工智能 研究持续升温。可信人工智能理念得到了国际组织的广泛关注,二十国集团( G20)在2019 年 6 月提出的 “G20人工智能原则 ”中明确建议促进可信赖的人 5ai100.stanford.edu/2021-report/gathering-strength-gathering-storms-one-hundred-year-study-artificial-intelligence 7 工智能创新发展 ,成为了重要的共识 。可信人工智能 的理念逐步贯彻到人工智能的 全生命周期之中 ,产业实践不断丰富, 已经 演变为落实人工智能治理 相关 要求的 重要 方法论。 总的来看,人工智能正在迈入 “创新驱动、应用深化、规范发展 ”的新阶段。 从人工智能自身产业化的角度来看,技术迭代升级是发展的源动力,目前人工智能尚不完善,智能化路径还在加快探索,技术的创新驱动将有助于拓展新的发展空间。从人工智能赋能传统产业的角度来看,特别是疫情以来,数字化、智能化转型不断提速,推动人工智能应用迈入加速轨道,相关应用不断深化。从治理角度来看,技术和产业发展要领先于监管和制度,治理问题日益严峻,保障人工智能的健康发展成为全球共同关注。这里面既有渐进的变化,也有结构性甚至方向性的调整,需要全面、系统地提升各方面能力,从而推动人工智能持续且健康的发展。 二、 人工智能技术及应用沿着“创新、工程、可信”三个方向持续演进 在新的背景下,人工智能技术亦需要适应新的变化。本章按照新三维坐标对人工智能技术及应用的发展态势进行了梳理。围绕着算法、算力和数据的技术创新始终是前进主旋律;工程实践中的相关技术开始覆盖人工智能全流程,加速人工智能大规模落地应用;人工智能可信技术是破解治理难题的重要支撑,愈发受到各界关注。 8 (一 )人工智能在追求极致 创新 方面不断 突破 一直以来,算法、算力和数据被认为是人工智能发展的三驾马车,也是推动人工智能发展的重要基础。 在算法层面 , 超大规模预训练模型等成为近两年最受关注的热点之一,不断刷新各领域榜单 1, 2;知识驱动的人工智能等方向研究成为提升认知能力的重要探索 3, 4;人工智能与各科学研究领域的融合创新日益受到关注,人工智能成为基础科学研究的重要工具。 在基础算力层面 ,单点算力持续提升, 算力定制化、多元化成为重要发展趋势; 计算技术围绕数据处理、数据存储、数据交互三大能力要素演进升级 ,类脑芯片、量子计算等方向持续探索 5。 在数据层面 ,以深度学习为代表的人工智能技术需要大量的标注数据,这也催生了专门的技术乃至服务,随着面向问题的 不断具体化和深入,数据服务走向精细化和定制化;此外,随着知识在人工智能的重要性被广泛提及,对知识集的构建和利用不断增多。 1. 新算法 不断涌现 ,技术融合成重要趋势 超大规模 预训练模型 推动技术效果不断提升,继续朝着规模更大、模态更多的方向发展 。 自 OpenAI 于 2020 年推出 GPT-3 以来,谷歌、 华为、智源研究院、 中科院、 阿里巴巴等 企业和研究机构 相继推出超大规模 预训练 模型 ,包括 Switch Transformer、 DALL E、MT-NLG、盘古、悟道 2.0、紫东太初和 M6 等,不断刷新着 各榜单9 纪录,百度 ERNIE3.0 模型 6在自然语言理解任务上的综合评分( GLUE)已达 90%以上,智源悟道文澜模型 7在 多源图文数据集评分 ( RUC-CAS-wenlan)相比 OpenAI的 CLIP模型大幅提升 37.0%。当前,预训练模型参数 数量、训练数据规模 按照 300倍 /年的趋势增长,继续通过增大模型和增加训练数据仍是短期内演进方向;另外,跨模态预训练大模型日益普遍,已经从早期只学习文本数据,到联合学习文本和图像,再到如今可以处理文本、图像、语音三种模态数据,未来使用更多种图像编码、更多种语言、以及更多类型数 据的预训练模型将会涌现,这也是实现人工智能通用化的有益探索。 来源:中国信息通信研究院 图 2 大模型参数量和训练数据规模增长 示意图 轻量化深度学习技术不断探索, 计算效率 显著 提升。 复杂 的深度学习 模型往往需要消耗大量的存储空间和计算资源 ,难以在端、边等资源受限情形下应用,具备低内存和低计算量优势的技术成为10 业界需求。轻量化深度学习成为解决这一挑战的重要技术,包括设计更加紧凑和高效的神经网络结构、对大模型进行剪枝(即“裁剪”掉部分模型结构),以及对网络参数进行量化从而减少计算量等方向。例如,谷歌提出的 MobileNet和旷视提出 ShuffleNet等成为紧凑模型的典型代表;百度推出的轻量化 PaddleOCR 模型规模减小至2.8Mb,在 GitHub上开源后受到热捧 6。 “生成式人工智能”技术不断成熟,未来听、说、读、写等能力将有机结合起来。 目前 ,“生成式人工智能”技术被广泛应用于智能写作、代码生成、有声阅读、新闻播报、语音导航、影像修复等领域,通过机器自动合成文本、语音、图像、视频等正在推动互联网数字内容生产的变革。听、说、读、写等能力的有机结合成为未来发展趋势。例如央视、新华社、光明网等均推出了数字人主播,支持从音频 /文本内容一键生成视频,能够实现节目内容快速、自动化生产,相关数字人主播和数字人记者,已在全国两会、春节晚会等大型报道和节目中广泛应用。 知识计算成为推动人工智能从感知智能向认知智能转变的重要探索。 知识凝聚了人的智慧,知识和数据的双驱动有助于解决不完全信息、不确定性和动态环境下的推理决策问题,可以提高人工智能系统的智能化水平。目前,围绕着知识获取、知识建模、知识管 6 11 理、知识应用等过程,已经形成了涵盖知识图谱、知识库、图计算等技术,覆盖知识表示、知识计算、知识推理与决策能力的体系,可实现对知识的管理与利用。学术界和产业界都已经开始推出基于知识的人工智能应用平台或解决方案,例如清华大学、浙江大学、华为云、智源研究院、百度、竹间智能、国双等推出的知识计算引擎、知识中台、知识工程平台、知识智能平台等解决方案。未 来,知识计算将着力在深度学习算法中嵌入先验知识建立可解释模型,让知识深入参与模型求解,进一步提高人工智能的效率、水平以及鲁棒性、可解释性、可迁移性。 人工智能与科学研究融合不断深入,开始“颠覆”传统研究范式 。近年来,人工智能对海量数据的分析能力能够让研究者不再局限于常规的“推导定理式”研究,可以基于高维数据发现相关信息继而加速研究进程。 2020 年, DeepMind 提出 AlphaFold2 在国际蛋白质结构预测竞赛( CASP)拨得头筹,能够精确地预测蛋白质的 3D结构,其准确性可以与使用冷冻电子显微镜等实验技术解 析的 3D结构相媲美。 中美研究团队 使用 AI的方法, 在保证 “从头计算( ab initio) ”高精度的同时, 将分子动力学极限提升了数个量级 ,比过去同类工作计算空间尺度增大 100 倍,计算速度提高 1000 倍,获得 2020 年ACM戈登贝尔奖 7。 更为惊喜的是 人工智能 与 力学、化学、材料 学 、 7 12 生物 学 乃至工程领域 等融合探索不断涌现,未来将不断拓展人工智能应用的深度和广度 。 2. 单点算力持续突破,新技术仍处于探索阶段 当前人工智能算力持续突破,面向训练用和推断用的芯片仍在快速演进。这主要源于算力需求的驱动,一方面体现在模型训练阶段, 根 据 Open AI 数据, 模型计算量增长速度远超人工智能 硬件算力 增长速度, 存在万倍差距 8;另一方面,由于推断的泛在性,使得推断用算力需求持续增长 。 与此同时,新的算力架构也在不断研究中,类脑芯片、存内计算、量子计算等备受关注,但总体上处于探索阶段。 训练芯片创新加速,推断芯片朝着专用定制化发展 。 基于 GPU的 训练芯片持续增多 , 面向 GPU创新的企业开始发力,出现了摩尔线程、天数智芯、壁仞科技等一批专注 GPU赛道的初创公司。 基于ASIC 等架构云端训练芯片能力提升显著 , 寒武纪 的 思元 370、 燧原科技的 “邃思 2.0”以及百度的昆仑 2等相对上一代产品均有 3-4倍以上的 算力 提升。 专用定制的端侧推理芯片百花齐放,面向手机应用的智能芯片成为亮点 。 2021 年 1 月,联发科推出了高端手机芯片Dimensity 1200,可边缘处理 5G、 AI和图像数据等。 8月,谷歌为其 Pixel系列手机专门推出了首款智能手机芯片 Tensor。 类脑 芯片 、存内计算、量子计算等 依旧是重点探索方向 。 类脑13 芯片 、存内计算、量子计算等技术在理论层面可实现高算力、低功耗 等优点 , 取得了一些进展,但总体上来看目前 技术成熟度相对 较低。北京大学类脑 智能芯片中心在 2021年 ISSCC发布 “超低功耗智能物联网芯片 (AIoT)”等成果。 新型人工智能芯片受到投资资金青睐,2021年以来多家企业完成了亿元级 A轮或 A+轮融资,包括 3D视觉AI芯片厂商埃瓦科技,专注神经拟态感存算一体芯片研发的九天睿芯,以及 AI视觉芯片研发公司爱芯科技等。 3. 数据规模不断提升,构建领域知识集成热点 人工智能的快速发展推动数据规模不断提升 。 据 IDC测算 , 2025年全球数据规模将达到 163ZB,其中 80%-90%是非结构化数据 8。 数据服务进入深度定制化的阶段 , 百度、阿里巴巴、京东等公司推出根据不同场景和需求进行数据定制的服务;企业需求的数据集从通用简单场景向个性化复杂场景过渡,例如语音识别数据集从普通话向小语种、方言等场景发展,智能对话数据集从简答问答、控制等场景向应用场景、业务问答等方向发展 。 各方积极探索建立高质量知识集,支撑未来知识驱动的人工智能应用发展 。 知识集中包含语音、图像、文本等传统数据和定义、规则、逻辑关系等,是知识的数据化呈现,业界著名知识集有 Wordnet、Hownet等。例如阿里巴巴联合香港理工大学基于服装设计知识开发 8 数据时代 2025 IDC 14 FashionAI知识集 ,加速了 AI在服装设计产业落地应用。 (二 )人工智能工具链成 为 工程 实践 能力核心 随着人工智能技术不断发展,近年来工程落地应用呈现加速态势。金融领域,人工智能技术开始深入前台、中台、后台全过程;医疗人工智能开始迈入市场化阶段, 截至 2021 年 8 月底,共有 28款产品获批三类医疗器械注册证 ; 制造 领域 人工智能 快速发展,德勤 预计 我国 未来五年将保持年均 40%以上的增长率 。目前企业应用人工智能呈现出从初步探索到规模应用的过渡,总体上来看,不断提升工程实践能力成为未来应用的关键。 人工智能工程化开始成为 各界 关注焦点。 学术界, 卡耐基梅隆大学软件工程学研究所于近年启动人工智能工程化研究,并联合高校和工业界承担了一项由美国官方机构资助的国家研究计划;世界知名人工智能专家乔丹( Michael I.Jordan)、邢波等认为人工智能工程化是一门新兴的工程科学,是人工智能从理论学科到工程学科发展的趋势。 产业界, Gartner连续两年把人工智能工程化列为年度战略技术趋势之一,阿里云等企业把人工智能工程化视作将 AI变为企业生产力的关键。 人工智能工程化聚焦工具体系、开发流程、模型管理全生命流程的高效耦合。工具体系层面 , 体系化与开放化成为研发平 台技术工具链的发展特点。 围绕机器学习和深度学习等技术,已初步构建15 起较为完备的工具体系,大幅降低数据处理 、 模型开发 和 部署 、 运维管理等难度, 其中关键的软件框架多采用 TensorFlow、 PyTorch、Paddle、 MindSpore、 OneFlow 等 开源框架 ; 开发流程层面 ,工程化关注人工智能模型开发的生命流程,追求高效 且 标准化的持续生产、持续 交付和 持续 部署,最终以最佳的模型进入应用层面产生商业价值。例如 MLOps就是为了连接模型构建团队、业务团队和运维团队,建立起标准化的模型开发、部署与运维流程 。 模型管理层面 ,随着企业智能化应用的逐步加深,模型种类和数量大幅增长,企业需要建设对模型生命周期的管理机制,对模型的版本历程、性能表现、属性、相关数据、衍生的模型档案等进行标准化的管理运维。 自动机器学习 技术是提升工程化能力的重要能力 。 自动机器学习是指在机器学习开发应用全流程的部分环节或者全部环节实现自动化,可以有效降低当前阶段人工智能开发门槛高、技术人才匮乏等挑战。该技术主要包括自动数据预处理、自动特征工程、自动超参数搜索、自动模型网络结构设计、自动模型部署等内容,低代码开发、预训练模型等技术也与自动机器学习密切相关,并呈现融合发展的趋势。当前,头部互联网企业和创新企业已经开始积极布局AutoML技术 和工具 ,但受限于技术成熟度, AutoML的应用场景还停留在某些开发环节(如特征工程)或者某些特定的 技术领域 (如语音识别、目标检测、智能对话 等 ) 。 云边端协同管理的技术需求逐渐凸显,人工智能上云进程不断16 加速。 随着人工智能与各个行业的深度融合,人工智能边缘端和终端设备将得到越来越广泛的应用,同时开发者也将面临边端设备繁杂不易适配、运维管理难等问题。一方面,平台通过模型压缩、自适应模型生成等技术实现边端设备的模型适配和部署;另一方面,通过对编译优化、中间表示等的设计和配臵,实现云边端设备的协同管理和运维。 (三 )安全 可信人工智能 技术朝着一体化发展 随着社会各界对人工智能信任问题的不断关注,安全可信的人工智能技术已成为研究热点。研究的焦点主要是提升 人工智能系统稳定性、可解释性、隐私保护、公平性等 ,这些技术构成了可信人工智能的基础支撑能力 9。 人工智能系统稳定性技术重点逐步从数字域扩展到物理域。 人工智能系统面临中毒攻击、对抗攻击、后门攻击等特有攻击 ,这加大了安全性方面的挑战 。这些攻击技术既可互相独立也可以同时存在 , 例如通过打印对抗样本 眼镜 等能够直接对人脸识别系统造成物理层面的干扰 ,攻击者在路牌上粘贴对抗样本扰动图案,使得自动驾驶系统错误地将“停止”路牌识别为“限速”路牌等 10。围绕着人工智能系统的稳定性测试技术也成为了关键,华为、百度等纷纷推出基于模糊理论的相关测试技术 ,致力于探索提高人工智能系统的稳定性 。 17 人工智能可解释性增强技术仍处在初期阶段,多种路径持续探索。 增强人工智能系统的可解释性成为热点工作 11, 12, 13,主要路径包括建立适当的可视化机制尝试评估和解释模型的中间状态;通过影响函数来分析训练数据对于最终收敛的人工智能模型的影响;通过方法分析人工智能模型利用哪些数据特征做出预测;通过使用简单的可解释模型对复杂的黑盒模型进行局部近似来研究黑盒模型的可解释性等。 隐私计算技术助力人工智能数据安全可信地进行协作 。人工智能系统需要依赖大量数据,然而数据的流转过程以及人工智能模型本身都有可能泄漏敏感隐私数据。 AI结合隐私计算技术,可从数据源端确保原始数据真实可信。利用隐私计算技术,数据 “可用不可见 ”,形成物理分散的多元数据的逻辑集中视图,可以保证 AI模型有充足的、可信的数据可供利用。 提升 人工智能公平性的关键在于 从 数据 和技术两方面入手 。 随着人工智能系统的广泛应用,不公平决策行为以及对部分群体的歧视 等问题越来越突出, 导致这些决策偏见主要原因如下:受数据采集条件限制,不同群体 在数据中所占权重不均衡;在不平衡数据集上训练得到的人工智能模型,造成模型决策不公平。为了保障人工智能系统的决策公平性, 从数据层面来看, 主要通过构建完整异构数据集,将数据固有歧视和偏见最小化;对数据集进行周期性检查,18 保证数据高质量性。 从技术层面来看,需要 通过引入 公平决策量化指标的算法,来减轻或消除决策偏差及潜在的歧视。 体系化推进 人工智能可信 安全技术 将是重要趋势。 一方面,当前 相关 研究多是从 稳定 、隐私、公平等单一维度展开。已有研究工作表明, 稳定 性、公平性、可解释性等不同要求之间存在相互协同或相互制约的关系,若仅考虑某一个方面的要求则可能会造成其他要求的冲突。 如何 构建 系统的 研究框架 ,从而 保持不同特征要素之间的最优动态平衡 成为关键 。 另一方面,需要从系统层面开展可信安全的研究 14,这一问题不仅仅是人工智能算法层面问题,还涉及到整个系统,例如人工智能承载操作系统、软件框架、第三方库,以及硬件设备自身的安全问题等,需要构建人工智能全链条、全生命周期的可信安全。 三、全球 高度关注人工智能治理工作,人工智能安全可信成 重点 人工智能发展的空间越大、影响越深、挑战 越多,对它的治理就越重要、越紧迫。当前, 全球已经形成多元主体参与、协同共治的治理模式,各国及各组织推出了一系列治理原则,立法进程取得实质性进展,行业组织及企业主体积极探索可信落地实践。 (一 )人工智能风险 不断增多,全球初步建立 治理 机制 1. 人工智能深入赋能引发挑战 19 人工智能带来的风险与挑战是多方面的。除了人工智能技术自身存在天然的缺陷外,区别于纯粹的技术风险,人工智能风险的渊源是人工智能系统的应用对现有的规范体系以及伦理与社会秩序的冲击 15。 人工智能固有技术风险持续放大。 以深度学习为核心的人工智能技术正在不断暴露出由其自身特性引发的风险隐患。一是深度学习模型存在脆弱和易受攻击的缺陷,使得人工智能系统的可靠性难以得到足够的信任。二是黑箱模型具备高度复杂性和不确定性,算法不透明容易引发不确定性风险。三是人工智能算法产生的结果过度依赖训练数据,如果训练数据中存在偏见歧视,会导致不公平的智能决策产生。 现有法律及规范体系受到的挑战不断扩大。 人工智能对就法律及规范体系造成 了 多个方面 冲击: 在 主体资格界定 方面 ,沙特阿拉伯授予机器人索菲亚以公民资格引发全球争议,此外还产生了人工智能是否能够成为专利的发明者等问题,如 2021年 7月澳大利亚联邦法院裁定人工智能系统可被列为专利申请中的发明人,与美国、英国持截然不同的态度 9。 在 隐私保护 方面 ,人工智能的发展伴随侵犯个人隐私问题时有发生,央视 “315”晚会曝光,大量企业违规采集 9.au/news/2021-08-01/historic-decision-allows-ai-to-be-recognised-as-an-inventor/100339264?utm_campaign=news-article-share-2-control&utm_content=twitter&utm_medium=content_shared&utm_source=abc_news_web 20 顾客人脸信息用于商业目的 10。 在 责任划分 方面 , 2015 年英国首例机器人手术致人死亡 11,特斯拉 “失控门 ”事件使得自动驾驶辅助系统受到 质疑 12。 伦理及社会秩序受到的冲击愈发严重。 人工智能存在对人类权利造成 冲击的风险,人工智能引发歧视、对人类行为提出新规则、劳动力的变革更替等问题。 2021年 8月,俄罗斯在线支付服务公司Xsolla使用算法判断员工 “不敬业且效率低 ”,并解雇了公司占总人数三分之一的 147名员工 13。人工智能直接或间接伤害人类,冲击社会秩序。 2020年 11 月有媒体报道伊朗核科学家被 “人工智能 ”控制的 武器 刺杀 14, 2019年亚马逊智能音箱曾给出劝人类自杀的建议 15。 2. 全球掀起人工智能治理浪潮 当前,面临人工智能深入赋能而引发的多方面风险及挑战,全球各国越来越重视人工智能治理。人工智能治理是一项复杂的系统工程,根据人工智能治理白皮书 16,人工智能治理体系由政府、行业组织、企业以及公众等多元主体共同参与、协同合作,形成了 10 11 12 13 14 15 dailymail.co.uk/news/article-7809269/Amazon-Alexa-told-terrified-mother-29-stab-heart-greater-good.html 21 伦理原则等 “软法 ”以及法律法规等 “硬法 ”相 结合的治理手段,旨在实现科技向善、造福人类的总体目标愿景,推动人工智能健康有序发展。人工智能治理机制如图 3所示。 资料整理:中国信息通信研究院 图 3 人工智能治理机制示意图 世界主要经济体聚焦人工智能治理焦点议题的讨论,政府间国际组织成为重要发声阵地, 联合国、 G20、 OECD、 G7 等成为引导全球人工智能治理的重要组织。 OECD 相关研究成果对于推动全球人工智能治理起到了重要作用, 是 G7人工智能监管相关决议、 G20人工智能原则 的重要参考。 联合国( UN) 积极推动人工智能伦理治理进程。联合国科教文组织( UNESCO) 于 2021年 11月 25日发布人工智能伦理问题建议书,这是全球首个针对人工智能伦理制定的规范框架,是迄今为止全世界在政府层面达成的最广泛的共识,同时赋予各国在相应层面应 用该框架的责任。 世界卫生组织 ( WHO)于 2021 年 6 月 2822 日发布了第一份关于在医疗卫生中使用人工智能的指南医疗卫生中人工智能的伦理和管制, 确保人工智能技术能够为全球所有国家的公共利益服务 。 二十国集团( G20) 于 2019 年 6月在参考 OECD人工智能原则的基础上,批准了倡导人工智能使用和研发 “尊重法律原则、人权和民主价值观 ”的 G20人工智能原则,成为人工智能治理方面的首个政府间国际共识,确立了以人为本的发展理念。中国支持围绕人工智能加强对话,落实 G20人工智能原则, 推动 全球人工智能健康发展。 经济 合作与发展组织( OECD) 于 2019年 5月 22日发布了全球首个人工智能政府间政策指导方针,形成 OECD人工智能原则,确立了负责任地管理可信赖的人工智能的五项原则。 OECD 于 2020年 2 月设立了人工智能政策观察站( OECD.AI) , 通过分享人工智能政策及实践的最佳案例,促进国际合作,帮助成员国打造可信赖的人工智能系统以实现全社会利益。 七国集团( G7) 在全球发达经济体间就人工智能治理开启了共识性的探索。 2021 年 1 月举行的 G7 峰会表示 各成员国 将合作研究国际人工智能标准 16; 9 月 ,在 G7 数据保护和隐私当局会议上, 表示未来 将 把 数据保护和隐私监管 作为 人工智能治理的核心 工作,并 16 23 推动业界设计满足数据保护要求的人工智能产品 。 (二 )人工智能治理迈入软硬法协同和场景规制新阶段 自 2017年阿西洛马人工智能原则问世以来,全球掀起了探索制定人工智能伦理原则的热潮。当前, G20 人工智能原则被国际社会普遍认同,政府间组织成为引导人工智能治理方向的重要力量,全球 各国加速完善 人工智能治理 相关 规则 体系。 2021年欧盟率先推出人工智能法草案标志着人工智能治理从原则性约束的 “软法 ”向更具实质性监管的 “硬法 ”加速推 进;与此同时,随着人工智能与实体经济融合程度不断加深,对人工智能治理越来越聚焦到具体 的场景上。 1. 人工智能治理实质化进程加速推进 当前,各国人工智能治理侧重各有不同,但整体上呈现加速 演进态势,即 从初期构建以 “软法 ”为导向的社会规范体系 ,开始 迈向以 “硬法 ”为保障的风险防控体系。 欧盟从伦理向监管稳步推进,欲引领全球人工智能监管规则。2021年 4月 21日,欧盟公布了人工智能法草案,是全球范围内首部系统化规制人工智能的法律,细化了人工智能四级风险框架,重点针对高风险系统作出规制,并提出了较为完善的监管配套措施。这是欧盟继发布可信人工智能伦理指南( 2018)和人工智能白皮书 通往卓越和信任的欧洲路径( 2020)后的又一重要举措,24 标志着全球人工智能治理从伦理原则等软性约束,迈向全面且具有可操作性的法律规制阶段。 美国强调审慎监管以促进创新发展。 最早由 2019年行政令保持美国在人工智能领域的领导地位奠定了美国在人工智能治理方面以强化全球领导地位为核心的总基调。美国 2019年提出算法问责法案,要求对 “高风险 ”的自动决策系统进行影响评估; 2020年,美国参议院发布国家生物识别信息隐私法案,在个人隐私数据保护的基础上,针对人工智能赋能的生物信息识别进行了隐私保护;2021年 5月,美国算法公正与在线平台透明度法案从用户、监管部门和公众三个主体维度提出算法透明的义务要求。 2021年 7月,美国政府问责局发布人工智能问责框架,以确保人工智能 系统 的公平、可靠、可追溯和可治理 等 。 中国软法硬法双兼顾,齐头推进人工智能治理。原则伦理层面,国家新一代人工智能治理专业委员会继 2019年 6月发布新一代人工智能治理原则 发展负责任的人工智能之后,于 2021年 9月发布新一代人工智能伦理规范,旨在将伦理道德融入人工智能全生命周期,积极引导全社会负责任的开展人工智能研发与应用活动。 法律进程方面, 我国尚未出台人工智能相关的统一法律,但是2021年 11 月正式实施的个人信息保护法,与网络安全法数据安全法共同形成了治理人工智能底层要素的坚固法律体系。此外,地方层面积极探索,深圳于 2021年 7月出台深圳经济特区人25 工智能产业促进条例(草案),助力人工智能产业健康发展。 与此同时,英国、法国、日本、韩国等国家也针对人工智能治理开展了相关工作。英国强调人工智能规范发