中国模式识别白皮书.pdf
中国模式识别白皮书中 国 人 工 智 能 学 会二 一 五 年 十 一 月中 国 模 式 识 别 白 皮 书1 中 国 人 工 智 能 系 列 白 皮 书 编 委 会主 任 : 李 德 毅执 行 主 任 : 王 国 胤副 主 任 : 杨 放 春 谭 铁 牛 黄 河 燕 焦 李 成 马 少 平 刘 宏蒋 昌 俊 任 福 继 杨 强委 员 : 陈 杰 董 振 江 杜 军 平 桂 卫 华 韩 力 群 何 清黄 心 汉 贾 英 民 李 斌 刘 民 刘 成 林 刘 增 良鲁 华 祥 马 华 东 马 世 龙 苗 夺 谦 朴 松 昊 乔 俊 飞任 友 群 孙 富 春 孙 长 银 王 轩 王 飞 跃 王 捍 贫王 万 森 王 卫 宁 王 小 捷 王 亚 杰 王 志 良 吴 朝 晖吴 晓 蓓 夏 桂 华 严 新 平 杨 春 燕 余 凯 余 有 成张 学 工 赵 春 江 周 志 华 祝 烈 煌 庄 越 挺 中 国 模 式 识 别 白 皮 书 编 写 组刘 成 林 杨 健 周 杰 孙 哲 南 陶 建 华 黄 凯 奇 吴 毅 红冯 建 江 王 昌 栋 高 蔚 李 俊 李 雅 刘 斌 申 抒 含樊 彬中 国 模 式 识 别 白 皮 书2目录第1章前言.11.1 模 式 识 别 概 述 .11.2 本 白 皮 书 内 容 组 织 .2第2章模式识别研究现状.32.1 模 式 识 别 基 础 理 论 .32.2 计 算 机 视 觉 .92.3 应 用 基 础 研 究 .152.3.1 生 物 特 征 识 别 .162.3.2 文 字 识 别 .192.3.3 语 音 识 别 .21第3章技术应用情况.233.1 图 像 与 视 频 检 索 .233.2 智 能 视 频 监 控 .253.3 生 物 特 征 识 别 .273.4 文 字 识 别 .273.5 语 音 识 别 .29第4章国内研究特色与差距.314.1 模 式 识 别 基 础 .314.2 计 算 机 视 觉 .314.3 生 物 特 征 识 别 .334.4 文 字 识 别 .334.5 语 音 识 别 .34第5章未来挑战和发展趋势.35第6章结束语.39中 国 模 式 识 别 白 皮 书3参考文献. 40中 国 模 式 识 别 白 皮 书1第1章前言1.1模式识别概述模 式 识 别 (Pattern Recognition)是 通 过 分 析 感 知 数 据 ( 图 像 、 视 频 、 语 音 等 ) ,对 数 据 中 包 含 的 模 式 ( 物 体 、 行 为 、 现 象 等 ) 进 行 判 别 和 解 释 的 过 程 。 模 式 识 别能 力 普 遍 存 在 于 人 和 动 物 的 认 知 系 统 , 是 人 和 动 物 获 取 外 部 环 境 知 识 , 并 与 环 境进 行 交 互 的 重 要 基 础 。 我 们 现 在 所 说 的 模 式 识 别 一 般 是 指 用 机 器 模 拟 人 的 感 知 过程 实 现 对 感 知 数 据 的 模 式 分 析 与 识 别 , 是 人 工 智 能 领 域 的 一 个 重 要 分 支 。 模 式 分类 是 模 式 识 别 的 主 要 任 务 和 核 心 研 究 内 容 。 分 类 器 设 计 是 在 训 练 样 本 集 合 上 进 行优 化 ( 如 使 每 一 类 样 本 的 表 达 误 差 最 小 或 使 不 同 类 别 样 本 的 分 类 误 差 最 小 ) 的 过程 , 也 就 是 一 个 机 器 学 习 过 程 。 近 年 来 , 模 式 识 别 与 机 器 学 习 的 方 法 也 被 广 泛 用于 感 知 数 据 以 外 的 数 据 ( 如 文 本 、 互 联 网 数 据 、 传 感 网 数 据 、 基 因 表 达 数 据 等 )分 析 问 题 , 形 成 了 数 据 挖 掘 领 域 。由 于 模 式 识 别 的 对 象 是 存 在 于 感 知 数 据 中 的 物 体 和 现 象 , 它 研 究 的 内 容 还 包括 信 号 /图 像 /视 频 的 处 理 、 分 割 、 形 状 分 析 、 运 动 分 析 、 上 下 文 分 析 等 。 具 体 地说 , 模 式 识 别 的 研 究 内 容 主 要 包 括 : 模 式 描 述 和 分 类 。 模 式 分 类 是 建 立 在 适 当 的 模 式 ( 这 里 指 单 个 模 式样 本 ) 和 类 别 描 述 基 础 之 上 的 。 按 照 模 式 和 类 别 的 描 述 方 式 , 模 式 分 类 方 法可 以 分 为 统 计 模 式 识 别 、 句 法 结 构 模 式 识 别 、 人 工 神 经 网 络 、 核 方 法 、 集 成分 类 方 法 等 。 模 式 的 特 征 提 取 、 特 征 选 择 、 分 类 和 聚 类 等 同 时 也 是 机 器 学 习的 重 要 研 究 内 容 。 计 算 机 视 觉 与 图 像 /视 频 分 析 。 视 觉 是 人 类 获 取 信 息 的 最 主 要 来 源 。图 像 /视 频 信 号 处 理 、 分 割 ( 模 式 /背 景 分 离 及 模 式 与 模 式 分 离 ) 、 三 维 视 觉 建模 、 场 景 分 析 、 运 动 分 析 、 形 状 建 模 和 匹 配 等 都 是 模 式 识 别 的 重 要 研 究 内 容 。 模 式 识 别 和 视 觉 技 术 应 用 。 模 式 识 别 技 术 广 泛 用 于 工 业 生 产 、 社 会生 活 和 国 防 安 全 等 领 域 , 进 行 自 动 信 息 处 理 和 判 别 , 以 提 高 生 产 、 管 理 、 生活 、 安 全 监 控 等 的 效 率 。 具 体 应 用 包 括 工 业 视 觉 检 查 、 机 器 人 感 知 、 文 字 识别 /文 档 分 析 、 语 音 识 别 、 生 物 认 证 、 医 学 图 像 分 析 ( 计 算 机 辅 助 诊 断 ) 、 遥感 图 像 分 析 、 网 络 内 容 分 析 与 检 索 等 。中 国 模 式 识 别 白 皮 书220 世 纪 50 年 代 可 以 认 为 是 模 式 识 别 学 科 的 形 成 期 , 当 时 发 表 了 一 些 关 于 统计 模 式 识 别 的 重 要 论 文 , 人 工 神 经 网 络 “感 知 机 ”(Perceptron)也 对 模 式 识 别 和 人 工智 能 产 生 了 重 要 影 响 。 60 年 代 召 开 了 第 一 个 以 “模 式 识 别 ”为 题 的 学 术 会 议 。 1972年 , 第 一 届 国 际 模 式 识 别 大 会 (ICPR, 前 几 届 称 为 IJCPR)召 开 。 国 际 模 式 识 别 学会 (IAPR)在 1974 年 第 二 届 ICPR 上 筹 建 , 并 于 1978 年 正 式 成 立 。模 式 识 别 领 域 早 期 的 方 法 主 要 是 统 计 模 式 识 别 , 其 数 学 基 础 可 以 追 溯 到 18世 纪 出 现 的 贝 叶 斯 规 则 及 后 来 的 高 斯 分 布 、 伯 努 利 分 布 、 Fisher 判 别 分 析 等 。 20世 纪 70 到 80 年 代 , 句 法 和 结 构 模 式 识 别 方 法 受 到 高 度 重 视 。 80 年 代 末 到 90 年代 中 , 人 工 神 经 网 络 非 常 热 门 , 后 来 逐 渐 被 支 撑 向 量 机 和 核 方 法 盖 过 了 风 头 。 90年 代 末 到 21 世 纪 以 来 , 随 着 模 式 识 别 应 用 普 及 和 面 对 的 问 题 越 来 越 复 杂 , 多 种新 的 模 式 分 类 器 学 习 方 法 快 速 发 展 , 如 集 成 学 习 、 半 监 督 学 习 、 多 标 签 学 习 、 迁移 学 习 、 多 任 务 学 习 等 。 近 几 年 , 在 多 层 神 经 网 络 基 础 上 发 展 起 来 的 深 度 学 习 和深 度 神 经 网 络 在 很 多 模 式 识 别 应 用 领 域 产 生 了 领 先 的 性 能 , 成 为 当 前 最 热 门 的 方法 。 21 世 纪 以 来 也 是 计 算 机 视 觉 领 域 和 机 器 学 习 领 域 快 速 发 展 的 时 期 , 相 关 学术 会 议 Computer Vision and Pattern Recognition (CVPR), International Conferenceon Computer Vision (ICCV), International Conference on Machine Learning (ICML)等 日 益 受 到 高 度 重 视 。1.2本白皮书内容组织本 白 皮 书 旨 在 介 绍 模 式 识 别 领 域 的 基 本 状 况 , 近 几 年 ( 尤 其 是 过 去 5 年 ) 在基 础 理 论 与 方 法 、 计 算 机 视 觉 、 应 用 技 术 研 究 方 面 的 重 要 进 展 , 产 业 应 用 情 况 ,面 临 的 挑 战 和 发 展 趋 势 等 。 供 模 式 识 别 及 其 应 用 相 关 领 域 的 研 究 生 、 研 究 者 和 技术 开 发 人 员 参 考 。下 面 第 2 章 介 绍 近 几 年 模 式 识 别 领 域 研 究 进 展 状 况 , 包 括 模 式 识 别 基 础 、 计算 机 视 觉 、 应 用 ( 主 要 是 生 物 特 征 识 别 、 文 字 识 别 、 语 音 识 别 ) 基 础 研 究 。 第 3章 介 绍 主 要 技 术 应 用 和 产 业 发 展 状 况 。 第 4 章 分 析 国 内 在 模 式 识 别 领 域 的 研 究 特色 及 与 国 际 前 沿 的 差 距 。 第 5 章 分 析 模 式 识 别 领 域 的 当 前 挑 战 和 发 展 趋 势 。 第 6章 为 结 束 语 。中 国 模 式 识 别 白 皮 书3第2章模式识别研究现状2.1模式识别基础理论模 式 识 别 的 基 础 理 论 主 要 包 括 特 征 表 示 与 学 习 、 聚 类 、 分 类 器 学 习 等 。 最 近几 年 的 主 要 研 究 进 展 如 下 。2.1.1 特 征 表 示 与 学 习特 征 表 示 与 学 习 是 模 式 识 别 的 核 心 问 题 之 一 。 如 何 学 习 获 得 高 效 、 鲁 棒 的 特征 表 示 是 模 式 系 统 成 功 的 关 键 。 近 几 年 的 研 究 主 要 在 稀 疏 表 示 和 低 秩 分 解 两 个 方面 展 开 。 传 统 的 特 征 提 取 与 特 征 选 择 仍 然 有 研 究 者 关 注 , 但 相 对 来 说 进 展 不 多 。( 1) 稀 疏 表 示有 关 生 理 学 的 研 究 成 果 表 明 : 人 类 的 视 觉 系 统 具 有 对 图 像 的 稀 疏 表 示 特 性 。科 学 工 作 者 们 揭 示 了 在 低 层 和 中 层 的 人 类 视 觉 系 统 中 , 视 觉 通 道 中 的 许 多 神 经 元对 大 量 的 具 体 的 刺 激 , 比 如 目 标 的 颜 色 、 纹 理 、 朝 向 和 尺 度 等 , 具 有 选 择 性 。 若将 这 些 神 经 元 视 为 视 觉 阶 段 的 超 完 备 集 中 的 信 号 基 元 的 话 , 神 经 元 对 于 输 入 图 像的 激 活 机 制 具 有 高 度 的 稀 疏 性 。稀 疏 性 思 想 方 法 已 经 成 功 应 用 到 模 式 识 别 领 域 。 美 国 UIUC 大 学 的 J. Wright等 1 利 用 模 式 间 的 稀 疏 性 设 计 出 一 种 基 于 稀 疏 表 示 分 类 (Sparserepresentation-based classification)方 法 , 该 方 法 的 基 本 思 想 是 , 一 个 待 识 别 的 图像 样 本 , 在 各 类 训 练 样 本 总 体 构 成 的 基 底 上 的 表 示 系 数 ( 表 示 系 数 通 过 求 解 一 个通 用 的 稀 疏 表 示 模 型 得 到 ) 是 稀 疏 的 , 也 就 是 说 , 表 示 系 数 大 部 分 为 零 , 不 为 零的 部 分 应 为 在 同 类 样 本 上 的 表 示 系 数 。 在 稀 疏 表 示 分 类 的 基 础 上 , E. Elhamifar等 2提 出 了 结 构 化 的 稀 疏 表 示 分 类 器 。 J. Yang 等 3讨 论 了 稀 疏 表 示 分 类 器 的 机理 问 题 , 为 基 于 L1 范 数 的 稀 疏 表 示 分 类 提 供 了 理 论 依 据 。 他 们 指 出 , 稀 疏 表 示分 类 器 只 所 以 有 效 的 根 本 原 因 在 于 L1-optimizer 解 的 邻 近 性 , 而 不 是L0-optimizer 解 的 “稀 疏 ”性 。 稀 疏 表 示 分 类 器 的 有 效 性 依 赖 于 L1-假 设 ( 邻 近 性 假设 ) : 在 所 有 的 样 本 中 , 依 赖 于 同 类 样 本 的 表 示 所 产 生 的 表 示 系 数 的 L1-范 数 最小 。 利 用 了 商 多 面 体 的 k-睦 邻 ( k-neighborly) 理 论 , 揭 示 了 L1-optimizer 在 模 式分 类 中 的 作 用 。中 国 模 式 识 别 白 皮 书4从 理 论 上 讲 , 基 于 L1范 数 的 稀 疏 表 示 对 服 从 Laplacian分 布 的 噪 声 是 最 优 的 ,对 更 为 复 杂 的 噪 声 显 然 不 是 最 优 的 。 为 了 进 一 步 提 升 稀 疏 表 示 的 稳 健 性 , M. Yang等 4借 鉴 稳 健 回 归 的 思 想 , 提 出 了 正 则 化 的 稳 健 稀 疏 编 码 方 法 , R. He 等 5提 出了 基 于 半 二 次 型 的 稳 健 稀 疏 表 示 方 法 。 这 两 种 方 法 的 性 能 优 势 在 存 在 复 杂 噪 声 的人 脸 识 别 实 验 中 得 到 了 证 实 。除 了 分 类 以 外 , 稀 疏 表 示 的 方 法 还 被 广 泛 应 用 于 特 征 抽 取 领 域 , 典 型 的 例 子如 稀 疏 主 分 量 分 析 、 稀 疏 鉴 别 学 习 以 及 是 在 深 度 学 习 的 稀 疏 自 动 编 码 器 模 型 等 。( 2) 低 秩 分 解在 很 多 工 程 问 题 中 , 数 据 矩 阵 中 常 常 有 部 分 元 素 缺 失 或 受 噪 声 污 染 , 在 该 情况 下 如 何 恢 复 数 据 矩 阵 成 为 一 个 非 常 重 要 的 问 题 。 低 秩 先 验 为 数 据 矩 阵 的 完 善 和恢 复 提 供 一 种 可 能 。 当 噪 声 较 小 且 独 立 同 分 布 于 高 斯 分 布 , 经 典 的 主 分 量 分 析 提供 了 一 种 数 据 矩 阵 估 计 的 最 优 工 具 。 然 而 实 际 中 数 据 的 污 染 形 式 可 能 是 任 意 的 ,比 如 噪 声 较 大 且 是 非 高 斯 的 , 此 时 主 分 量 分 析 无 法 提 供 一 种 准 确 的 估 计 。 针 对 这一 问 题 , E. J. Candes, Y. Ma, 和 J. Wright 等 提 出 了 稳 健 主 分 量 分 析 ( Robust PCA)理 论 与 方 法 6,7, 该 理 论 假 设 污 染 是 稀 疏 的 而 数 据 矩 阵 是 低 秩 的 , 从 而 将 数 据 矩阵 分 解 为 两 部 分 : 低 秩 部 分 ( 真 实 数 据 的 估 计 项 ) 和 稀 疏 部 分 ( 噪 声 等 污 染 项 ) 。稳 健 主 分 量 分 析 的 基 本 模 型 如 下, * 1min | | | | subjectto L S L S L S A . (1)其 中 矩 阵 A,L,S,分 别 代 表 观 测 到 的 数 据 ,低 秩 数 据 和 稀 疏 数 据 。受 稳 健 主 分 量 分 析 启 发 , G. Liu 8 等 提 出 了 低 秩 表 示 方 法 并 用 于 子 空 间 分割 。 两 种 方 法 均 假 设 噪 声 是 稀 疏 的 , 但 低 秩 表 示 假 设 表 示 系 数 矩 阵 是 低 秩 的 , 而稳 健 主 分 量 分 析 则 假 定 真 实 数 据 是 低 秩 的 。当 前 的 稀 疏 表 示 或 稳 健 稀 疏 表 示 方 法 都 是 基 于 一 维 向 量 的 残 差 刻 画 , 这 些 方法 面 临 着 两 个 基 本 的 问 题 : ( 1) 假 设 残 差 像 素 是 独 立 同 分 布 的 , 而 实 际 中 连 续 遮挡 所 产 生 的 噪 声 往 往 是 高 度 相 关 的 ; ( 2) 独 立 刻 画 残 差 像 素 的 方 式 完 全 忽 视 了 残差 的 整 体 结 构 信 息 。 针 对 这 两 个 问 题 , Chen 等 假 设 噪 声 服 从 矩 阵 变 量 分 布 , 从而 导 出 采 用 核 范 数 来 刻 画 噪 声 , 提 出 了 矩 阵 变 量 稀 疏 表 示 方 法 。 另 外 , Zhang 等假 设 数 据 矩 阵 是 低 秩 的 , 而 每 个 噪 声 图 像 也 是 低 秩 的 , 据 此 提 出 了 基 于 双 核 范 数的 矩 阵 分 解 方 法 。中 国 模 式 识 别 白 皮 书52.1.2 聚 类作 为 模 式 识 别 最 基 本 的 分 类 方 法 之 一 , 数 据 聚 类 在 各 科 学 领 域 的 数 据 分 析 中扮 演 着 重 要 的 角 色 , 如 计 算 机 科 学 、 医 学 、 社 会 科 学 和 经 济 学 等 。 给 定 一 个 由 样本 点 组 成 的 数 据 集 , 数 据 聚 类 的 目 标 是 将 样 本 点 划 分 成 若 干 类 , 使 得 属 于 同 一 类的 样 本 点 非 常 相 似 , 而 属 于 不 同 类 的 样 本 点 不 相 似 。 下 面 我 们 将 介 绍 最 近 几 年 聚类 研 究 的 主 要 代 表 性 进 展 , 包 括 非 线 性 聚 类 、 集 成 聚 类 、 多 视 图 聚 类 等 , 以 及 展望 聚 类 研 究 中 的 诸 如 大 规 模 聚 类 、 聚 类 中 的 无 监 督 特 征 选 择 等 的 前 沿 挑 战 。( 1) 非 线 性 聚 类根 据 类 的 分 布 形 状 , 聚 类 问 题 可 以 分 成 线 性 可 分 聚 类 问 题 和 非 线 性 可 分 聚 类问 题 。 对 一 个 数 据 集 , 若 至 少 包 含 一 个 非 凸 形 状 边 界 的 类 , 则 该 数 据 集 称 为 非 线性 可 分 的 , 也 称 为 是 具 有 任 意 形 状 边 界 或 非 球 状 的 类 , 如 图 1 展 示 了 线 性 可 分 数据 集 和 非 线 性 可 分 数 据 集 。 由 于 现 实 数 据 的 复 杂 流 形 分 布 , 非 线 性 可 分 聚 类 是 最流 行 且 最 被 广 泛 研 究 的 聚 类 问 题 之 一 。 最 经 典 的 方 法 是 发 表 于 1996 SIGKDD 的DBSCAN 算 法 11。 除 此 之 外 , 核 方 法 12、 多 中 心 点 模 型 13也 是 典 型 的 非 线性 聚 类 算 法 。 特 别 是 , Science 杂 志 2004 年 发 表 了 一 个 结 合 了 密 度 和 距 离 信 息 的非 线 性 聚 类 算 法 14, 把 非 线 性 聚 类 研 究 推 向 了 研 究 高 峰 。 该 算 法 结 构 简 单 、 极具 技 巧 性 , 但 缺 乏 全 局 目 标 函 数 以 及 存 在 若 干 极 度 敏 感 的 阈 值 。(a) 非 线 性 可 分 数 据 集 (b) 线 性 可 分 数 据 集图 1. 非 线 性 可 分 数 据 集 与 线 性 可 分 数 据 集( 2) 集 成 聚 类已 有 聚 类 算 法 各 有 优 势 , 也 各 有 局 限 性 ; 在 缺 少 先 验 知 识 的 情 况 下 , 从 众 多聚 类 算 法 中 选 择 一 个 合 适 的 聚 类 算 法 是 非 常 困 难 的 ; 甚 至 , 给 定 一 个 聚 类 算 法 ,中 国 模 式 识 别 白 皮 书6为 其 选 择 出 合 适 的 参 数 都 是 不 容 易 的 。 相 对 于 使 用 单 一 算 法 得 到 单 一 聚 类 的 传 统作 法 , 集 成 聚 类 ( ensemble clustering) 可 以 将 多 个 聚 类 算 法 所 得 的 聚 类 结 果 ( 每一 个 输 入 聚 类 称 为 一 个 基 聚 类 ) 集 成 为 一 个 更 优 、 更 鲁 棒 的 聚 类 结 果 , 如 图 2所 示 。 近 年 来 集 成 聚 类 的 研 究 热 点 包 括 有 以 下 几 方 面 : (1)基 聚 类 加 权 15,即 如 何对 基 聚 类 质 量 进 行 估 计 并 进 行 加 权 ; (2)基 聚 类 筛 选 16, 即 从 基 聚 类 集 合 选 择 得到 一 个 子 集 , 并 对 此 (选 择 得 到 的 高 质 量 )子 集 进 行 集 成 以 期 得 到 更 佳 集 成 效 果 ;(3)自 动 聚 类 个 数 估 计 17, 即 如 何 自 动 确 定 最 终 聚 类 中 类 的 个 数 。图 2. 集 成 聚 类 基 本 框 架图 3. 多 视 图 数 据 示 例 : 网 页 数 据 中 包 括 超 链 接 、 视 频 、 图 像 、 文 本中 国 模 式 识 别 白 皮 书7( 3) 多 视 图 聚 类随 着 信 息 技 术 的 发 展 , 我 们 能 够 获 取 越 来 越 多 的 多 视 图 数 据 , 也 称 为 多 源 数据 , 即 一 个 数 据 集 中 的 每 个 样 本 存 在 着 来 自 不 同 特 征 空 间 的 多 个 表 达 , 每 一 个 表达 称 为 一 个 视 图 或 者 数 据 源 。 来 自 多 个 视 图 的 数 据 一 般 具 有 相 类 似 的 类 结 构 。 基于 这 个 假 设 , 多 视 图 聚 类 就 是 将 来 自 多 个 视 图 的 数 据 进 行 有 效 整 合 , 以 得 到 比 单视 图 分 别 聚 类 更 加 准 确 的 聚 类 结 果 。 代 表 性 的 工 作 有 基 于 典 型 相 关 分 析( canonical correlation analysis) 的 多 视 图 聚 类 18与 多 视 图 谱 聚 类 19, 如 图 3所 示 。 此 外 , 带 缺 失 数 据 的 多 视 图 聚 类 也 是 一 个 研 究 热 点 问 题 20。2.1.3 分 类 器 学 习分 类 器 学 习 方 面 , 近 几 年 最 引 人 注 目 的 进 展 在 深 度 学 习 方 面 , 即 采 用 深 度 神经 网 络 的 特 征 学 习 和 分 类 。 深 度 学 习 被 MIT 技 术 评 论 评 选 为 2013 年 突 破 性科 学 技 术 之 一 , 它 在 人 工 智 能 的 各 个 领 域 取 得 卓 越 性 能 , 尤 其 是 在 图 像 识 别 、 自然 语 言 理 解 和 语 音 识 别 领 域 21。 与 传 统 人 工 特 征 抽 取 方 法 不 同 , 深 度 学 习 本 质在 于 自 主 地 学 习 大 数 据 内 在 的 复 杂 结 构 特 征 , 它 是 运 用 误 差 反 向 传 播 算 法 (BackPropagation, BP)训 练 机 器 (如 : 深 度 前 馈 网 络 和 递 归 网 络 等 )如 何 从 数 据 中 学 习 到分 层 的 抽 象 特 征 。 下 面 我 们 将 介 绍 深 度 学 习 的 典 型 模 型 , 包 括 无 监 督 预 训 练 、 深度 卷 积 网 络 和 递 归 神 经 网 络 等 , 以 及 展 望 其 未 来 挑 战 。图 4. 左 图 为 深 度 信 度 网 络 , 右 图 为 深 度 玻 尔 兹 曼 机( 1) 无 监 督 预 训 练众 所 周 知 , 直 接 运 用 BP 算 法 训 练 深 度 网 络 往 往 会 陷 入 局 部 解 而 得 到 差 强 人中 国 模 式 识 别 白 皮 书8意 的 结 果 。 2006 年 Hinton 等 人 发 表 了 对 深 度 结 构 有 着 决 定 性 意 义 的 预 训 练 技 术 ,即 采 用 无 监 督 预 训 练 模 型 的 逐 层 去 初 始 化 网 络 参 数 在 一 个 “ 好 ” 的 局 部 最 优 解 ,再 通 过 BP 算 法 对 参 数 进 行 微 调 , 进 而 提 升 深 度 网 络 的 分 类 和 降 维 能 力 22。 经典 的 方 法 有 : 深 度 信 念 网 络 和 深 度 玻 尔 兹 曼 机 等 (如 图 4 所 示 )。 虽 然 从 正 则 化 和优 化 的 角 度 可 以 揭 示 预 训 练 技 术 的 优 势 , 但 其 有 效 性 仍 缺 乏 完 善 的 理 论 解 释 。图 5. 深 度 卷 积 网 络 (图 片 引 自 Yu CVPR12 Tutorial)( 2) 深 度 卷 积 网 络源 于 神 经 生 物 学 的 局 部 感 受 野 原 理 , LeCun 等 人 提 出 采 用 BP 算 法 训 练 的 深度 卷 积 网 络 (Deep convolutional nets, DConvNets) 23, 它 是 由 多 个 单 层 卷 积 神 经网 络 组 成 , 每 个 单 层 卷 积 神 经 网 络 包 括 卷 积 、 非 线 性 变 换 和 下 采 样 3 个 阶 段 , 如图 5 所 示 。 此 结 构 对 图 像 的 平 移 、 小 尺 度 缩 放 和 扭 曲 等 具 有 高 度 不 变 性 。 随 着GPU、 ReLU 激 活 函 数 、 DropOut 和 数 据 增 广 的 引 入 , DConvNets 在 图 像 分 类 问题 上 获 得 了 惊 人 的 结 果 , 即 在 ImageNet 挑 战 库 上 将 前 5 选 项 错 误 率 从 26.5%降到 15.3%24 (2015 年 已 降 至 4.94%25)。 除 此 之 外 , 它 还 在 目 标 探 测 、 目 标 跟踪 、 场 景 识 别 和 3D 物 体 识 别 等 方 面 取 得 了 优 异 的 性 能 。图 6. 递 归 神 经 网 络 21( 3) 递 归 神 经 网 络与 前 馈 神 经 网 络 不 同 之 处 是 , 递 归 神 经 网 络 (recurrent neural networks, RNN)将 神 经 元 的 输 出 反 馈 到 输 入 , 并 采 用 通 过 时 间 的 反 向 传 播 算 法 (BPTT)进 行 训 练 ,中 国 模 式 识 别 白 皮 书9如 图 6 所 示 。 作 为 一 类 经 典 的 RNN 模 型 , 长 短 时 记 忆 网 络 (long short-term memorynetworks, LSTM)26能 有 效 地 学 习 和 长 期 保 存 时 间 序 列 信 息 , 并 广 泛 地 应 用 到 自然 语 言 理 解 和 语 音 识 别 领 域 。 特 别 是 , 结 合 DConvNets 和 LSTM27, 深 度 学 习能 使 机 器 从 图 像 像 素 生 成 人 类 语 言 描 述 , 进 而 像 人 一 样 去 感 知 外 界 。2.1.4 多 分 类 器 集 成 学 习集 成 学 习 28是 机 器 学 习 最 基 本 的 方 法 之 一 , 曾 被 列 为 机 器 学 习 四 大 研 究 方向 之 首 29, 广 泛 应 用 于 生 物 、 医 学 、 计 算 机 视 觉 、 图 形 图 像 处 理 等 。 其 基 本 原理 是 利 用 一 系 列 学 习 器 进 行 学 习 , 并 使 用 某 种 规 则 把 各 学 习 结 果 进 行 整 合 从 而 获得 比 单 一 学 习 器 更 好 学 习 效 果 的 一 种 学 习 方 法 。 实 际 应 用 中 的 问 题 一 般 都 是 多 类学 习 问 题 。 因 而 , 我 们 将 介 绍 最 近 几 年 多 分 类 器 集 成 学 习 研 究 的 主 要 代 表 性 进 展 ,其 中 包 括 理 论 分 析 与 算 法 设 计 , 以 及 展 望 多 分 类 集 成 学 习 在 大 数 据 背 景 下 一 些 研究 的 前 沿 挑 战 。( 1) 理 论 研 究学 习 理 论 的 研 究 对 机 器 学 习 的 发 展 有 着 重 要 的 支 撑 和 指 导 作 用 。 在 学 习 理 论中 , 可 学 习 性 刻 画 了 一 个 多 分 类 学 习 问 题 能 否 通 过 学 习 得 到 最 优 分 类 器 ; 泛 化 性刻 画 了 从 已 有 数 据 中 建 立 的 模 型 能 否 很 好 地 处 理 新 的 数 据 ; 一 致 性 研 究 通 过 凸 优化 获 得 的 分 类 器 是 否 是 多 分 类 学 习 的 最 优 分 类 器 。 近 年 来 多 分 类 器 集 成 学 习 理 论研 究 热 点 包 括 以 下 几 方 面 : 可 学 习 性 研 究 30、 泛 化 性 研 究 31、 一 致 性 研 究 32。( 2) 算 法 设 计Boosting 是 一 类 著 名 的 主 流 集 成 学 习 方 法 , 其 基 本 原 理 是 将 很 多 弱 分 类 器 进行 有 效 结 合 、 从 而 获 得 学 习 效 果 更 好 、 更 鲁 棒 的 学 习 方 法 。 Boosting 方 法 是 多 类学 习 中 较 为 经 典 的 学 习 方 法 之 一 , 被 广 泛 研 究 。 近 年 研 究 热 点 包 括 以 下 几 方 面 :i)基 于 特 征 互 享 ShareBoost 多 分 类 学 习 算 法 33; ii)基 于 深 度 基 学 习 器 DeepBoost多 分 类 学 习 算 法 34; iii)基 于 非 对 称