欢迎来到报告吧! | 帮助中心 分享价值,成长自我!

报告吧

换一换
首页 报告吧 > 资源分类 > PDF文档下载
 

20240517_国海证券_计算机行业动态研究:GPT_4o、Gemini新品接连发布多模态技术奇点加速到来_19页.pdf

  • 资源ID:174531       资源大小:1.45MB        全文页数:19页
  • 资源格式: PDF        下载积分:9.9金币 【人民币9.9元】
快捷下载 游客一键下载
会员登录下载
三方登录下载: 微信开放平台登录 QQ登录  
下载资源需要9.9金币 【人民币9.9元】
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付说明:
本站最低充值10金币,下载本资源后余额将会存入您的账户,您可在我的个人中心查看。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,下载共享资源
 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

20240517_国海证券_计算机行业动态研究:GPT_4o、Gemini新品接连发布多模态技术奇点加速到来_19页.pdf

国 海 证 券 研 究 所 请 务 必 阅 读 正 文 后 免 责 条 款 部 分2 0 2 4 年 0 5 月 1 6 日行 业 研 究 评 级:推 荐(维 持)研究所:证券分析师:刘熹 S 0 3 5 0 5 2 3 0 4 0 0 0 1l i u x 1 0 g h z q.c o m.c n T a b l e _ T i t l e G P T-4 o、G e m i n i 新 品 接 连 发 布,多 模 态 技 术奇 点 加 速 到 来 计 算 机 行 业 动 态 研 究最 近 一 年 走 势行 业 相 对 表 现 2 0 2 4/0 5/1 6表现 1 M 3 M 1 2 M计算机 5.1%6.2%-2 5.0%沪深 3 0 0 3.7%8.2%-8.5%相 关 报 告计算机事件点评:运营商 A I 服务器订单超预期,国 产 化 不 断 提 速(推 荐)*计 算 机*刘 熹 2 0 2 4-0 4-2 2 计 算 机 行 业 动 态 研 究:阶 跃 星 辰 发 布 S t e p-2 万亿参数模型,A I 应用+算力景气上行(推荐)*计算机*刘熹2 0 2 4-0 3-2 6 A I 算 力 月 度 跟 踪(2 0 2 4 0 3):N V I D I A B 2 0 0 再创 算 力 奇 迹,液 冷、光 模 块 持 续 革 新(推 荐)*计算机*刘熹2 0 2 4-0 3-2 4 计 算 机 行 业 事 件 点 评:N V I D I A H 2 0 或 将 与 国 产算 力 同 步 高 增(推 荐)*计 算 机*刘 熹 2 0 2 4-0 3-0 3计算机行业月报:英伟达业绩再超预期,国产算力 需 求 再 扩 大(推 荐)*计 算 机*刘 熹 2 0 2 4-0 2-2 8事 件:2 0 2 4 年 5 月 1 4 日,O p e n A I 在 官 网 正 式 发 布 新 旗 舰 模 型 G P T-4 o 多 模态 大 模 型,其 中 o 代 表 的 是 o m n i,即“全 能”,G P T-4 o 可 以 实 时 对 音频、视 觉 和 文 本 进 行 推 理,相 较 于 G P T-4 T r u b o 速 度 更 快、价 格 更 便 宜。2 0 2 4 年 5 月 1 5 日,2 0 2 4 年 谷 歌 I/O 大 会 正 式 召 开,会 上 谷 歌 将 搜 索 业务 做 了 最 彻 底 的 A I 改 造,更 新 升 级 了 G e m i n i 1.5 P r o 版 本,推 出G e m i n i 1.5 F l a s h 轻 量 化 小 模 型、生 成 视 频 模 型 V e o、A I 智 能 体 P r o j e c tA s t r a,并 展 示 了 与 G P T-4 o 相 似 的 语 音 视 觉 交 互 功 能 G e m i n i L i v e。投 资 要 点:G P T 持 续 迭 代,G P T-4 o 推 动 人 机 交 互 再 上 新 台 阶O p e n A I 持 续 升 级 G P T 版 本,2 0 2 3 年 3 月 发 布 G P T-4 在 图 片 识 别、图 文 数 据 综 合 处 理 及 逻 辑 推 理 等 能 力 实 现 质 变;2 0 2 3 年 1 1 月 发 布G P T-4 T u r b o,支 持 1 2 5 万 t o k e n s 的 同 时 也 在 上 下 文 等 多 个 领 域 实 现 显著 进 步。本 次 发 布 G P T-4 o 带 来 各 种 能 力 升 级:多 模 态 交 互,具 有 更 优 质 的 视 频 和 音 频 理 解 以 及 图 像 生 成 能 力:G P T-4 o 能 够 接 受 文 本、音 频 和 视 频 的 任 意 组 合 作 为 输 入,并 生 成 文 本、音 频 和 图 像 的 任 意 组 合 作 为 输 出。与 现 有 模 型 相 比,G P T-4 o 在 视 觉 和 音频 理 解 方 面 有 更 好 的 表 现;在 理 解 和 生 成 图 像 方 面 的 能 力 优 于 现 有 模 型,能 完 成 过 往 模 型 无 法 完 成 的 任 务。情 绪 感 知:G P T-4 o 能 够 结 合 视 频 和 音 频 感 受 对 话 者 的 情 绪,并 给出 充 满 人 类 情 感 的 反 馈。例 如:在 根 据 工 作 人 员 要 求 讲 故 事 时,工 作 人员 可 以 随 时 插 话 打 断 并 提 出 新 要 求,G P T-4 o 能 几 乎 毫 无 停 顿 地 接 上 话 题并 按 照 要 求 变 化 音 色、语 调、情 感 等。毫 秒 级 响 应:G P T-4 o 对 音 频 输 入 的 响 应 时 间 可 以 快 到 2 3 2 毫 秒,平 均 为 3 2 0 毫 秒,这 与 人 类 在 对 话 中 的 响 应 时 间 相 近,此 前 G P T-4 的 语音 响 应 约 5.4 秒。性 能 成 本 优 势:在 传 统 基 准 测 试 中,G P T-4 o 在 文 本、推 理 和 编码 智 能 方 面,达 到 了 G P T-4 T u r b o 级 别 的 性 能,同 时 在 多 语 言、音 频 和视 觉 能 力 方 面 创 下 了 新 高。相 比 G P T-4 T u r b o,G P T-4 o 推 理 速 度 提 升 2倍 的 同 时,价 格 降 低 5 0%。证 券 研 究 报 告请务必阅读正文后免责条款部分 2 打 造 全 新 G P T 语 音 助 手 且 免 费 开 放,合 作 苹 果 微 软 加 速 端 侧 落 地O p e n A I 通 过 G P T-4 o 打 造 的 语 音 版 C h a t G P T 助 手,当 前 已 在C h a t G P T 中 开 放 使 用,同 时 模 型 A P I 同 步 放 出。G P T 语 音 助 手 主 要 功能 包 括 与 用 户 跨 音 频、视 频 进 行 交 流,例 如,让 G P T-4 o 进 行 实 时 翻 译、唱 歌、做 数 学 题、讲 笑 话 等。未 来,O p e n A I 将 会 在 C h a t G P T P l u s 中 推出 新 版 语 音 模 式 G P T-4 o 的 a l p h a 版。O p e n A I 与 苹 果 合 作,加 速 C h a t G P T 在 端 侧 落 地。O p e n A I 宣 布 推出 一 款 适 用 于 m a c O S 的 桌 面 级 应 用,使 用 键 盘 快 捷 键 就 可 向 C h a t G P T提 问。用 户 可 通 过 电 脑 与 C h a t G P T 语 音 对 话,G P T-4 o 的 新 音 频 和 视 频功 能 后 续 将 推 出。据 每 日 经 济 新 闻 援 引 彭 博 社 5 月 1 0 日 报 道,苹 果被 曝 正 与 O p e n A I 敲 定 一 项 协 议,今 年 将 后 者 的 部 分 技 术 引 入 i P h o n e。借 此 苹 果 将 能 提 供 由 C h a t G P T 支 持 的“聊 天 机 器 人”,作 为 i O S 1 8 中人 工 智 能 功 能 的 一 部 分。谷 歌 发 布 P r o j e c t A s t r a、V e o 等,多 模 态 技 术 奇 点 加 速 到 来2 0 2 4 年 5 月 1 5 日 凌 晨,G o o g l e I/O 开 发 者 大 会 上 发 布 了 通 用 A I 智能 体 P r o j e c t A s t r a,可 实 现 跨 文 本、音 频、视 频 多 模 态 实 时 推 理。同 时,谷 歌 正 式 发 布 一 款 全 新 的 视 频 生 成 模 型 V e o,谷 歌 声 称,V e o 能 够 根 据文 本、图 像 创 建 超 过 6 0 秒 的 高 质 量 1 0 8 0 P 视 频,用 户 可 以 对 光 照、镜头 语 言、视 频 颜 色 风 格 等 进 行 设 定。我 们 认 为,O p e n A I、谷 歌 等 新 品 的 推 出,体 现 出 多 模 态 大 模 型 技 术的 持 续 升 级,G P T-4 o 的 发 布 将 革 新 人 机 交 互 模 式,推 动 大 模 型 在 终 端 加速 推 广。随 着 多 模 态 技 术 奇 点 加 速 到 来,未 来 基 于 大 模 型 的 创 新 应 用 将更 值 得 期 待,大 模 型 技 术 将 全 面 赋 能 教 育、办 公 等 行 业 和 场 景。行 业 评 级 及 投 资 策 略:G P T-4 o、G e m i n i 新 品 陆 续 发 布,多 模 态 大模 型 技 术 奇 点 加 速 到 来,大 模 型 的 商 业 价 值、A I 应 用 的 创 新 突 破 以及 A I 算 力 需 求 的 持 续 增 长 可 期,维 持 对 计 算 机 行 业“推 荐”评 级。相 关 个 股:(1)大 模 型:科 大 讯 飞、三 六 零、拓 尔 思、云 从 科 技;(2)A I 应 用:金 山 办 公、万 兴 科 技、福 昕 软 件、焦 点 科 技、虹 软 科技、彩 讯 股 份、佳 发 教 育、鸥 玛 软 件、拓 维 信 息;(3)A I 终 端:华 勤 技 术、软 通 动 力、海 康 威 视、大 华 股 份、芯 海 科技、联 想 集 团、飞 荣 达;(4)A I 算 力:浪 潮 信 息、工 业 富 联、中 科 曙 光、神 州 数 码、紫 光 股份、中 际 旭 创、沪 电 股 份、新 易 盛、海 光 信 息、寒 武 纪 等。风 险 提 示:宏 观 经 济 影 响 下 游 需 求、大 模 型 发 展 不 及 预 期、市 场 竞争 加 剧、中 美 博 弈 加 剧、相 关 公 司 业 绩 不 及 预 期 等。YWDWwPnQoNrQrPtQmRrOqR7NdNaQtRmMpNrNiNnNqNeRnMpQbRmMzRvPqMxPNZrQsQ证 券 研 究 报 告请务必阅读正文后免责条款部分 3重 点 关 注 公 司 及 盈 利 预 测重点 公司 股票 2 0 2 4/5/1 5 E P S P E 投资代码 名称 股价(元)2 0 2 3 2 0 2 4 E 2 0 2 5 E 2 0 2 3 2 0 2 4 E 2 0 2 5 E 评级0 0 2 2 3 0.S Z 科 大 讯 飞 4 2.8 4 0.2 8 0.3 6 0.5 7 1 5 0.9 0 1 1 9.5 1 7 4.8 6买 入6 0 1 3 6 0.S H 三 六 零 8.5 1-0.0 7 0.0 1 0.0 3-1 2 3.4 7 1,2 9 3.7 7 2 6 6.7 0未 评 级3 0 0 2 2 9.S Z 拓 尔 思 1 6.6 3 0.0 5 0.3 0 0.4 1 3 6 2.6 9 5 4.8 2 4 0.2 3未 评 级6 8 8 1 1 1.S H 金 山 办 公 2 7 9.5 0 2.8 5 3.6 5 4.9 2 9 7.9 5 7 6.6 0 5 6.8 6买 入3 0 0 6 2 4.S Z 万 兴 科 技 8 3.3 5 0.6 3 0.7 7 0.9 5 1 3 3.1 4 1 0 7.2 7 8 7.6 2增 持6 8 8 0 9 5.S H 福 昕 软 件 5 4.8 8-0.9 9-0.2 6 0.2 6-5 5.2 1-2 0 9.0 9 2 0 8.6 7未 评 级0 0 2 3 1 5.S Z 焦 点 科 技 3 1.9 5 1.2 0 1.5 1 1.8 4 2 6.7 1 2 1.1 8 1 7.3 7未 评 级6 8 8 0 8 8.S H 虹 软 科 技 3 1.0 9 0.2 2 0.3 5 0.4 8 1 4 2.6 5 8 9.2 6 6 4.5 6未 评 级3 0 0 6 3 4.S Z 彩 讯 股 份 1 8.7 0 0.7 3 0.8 4 1.0 4 2 5.7 9 2 2.3 6 1 7.9 5未 评 级3 0 0 5 5 9.S Z 佳 发 教 育 1 1.2 7 0.3 3 0.4 9 0.6 5 3 4.3 6 2 3.0 5 1 7.3 0未 评 级0 0 2 2 6 1.S Z 拓 维 信 息 1 2.3 0 0.0 4 0.0 7 0.1 0 3 4 2.8 6 1 7 3.2 1 1 1 9.5 0未 评 级6 0 3 2 9 6.S H 华 勤 技 术 7 1.2 1 3.7 3 4.3 0 4.9 3 1 9.0 9 1 6.5 7 1 4.4 5买 入3 0 1 2 3 6.S Z 软 通 动 力 3 8.9 0 0.5 6 0.6 8 1.0 5 6 9.4 3 5 6.9 4 3 7.1 1增 持0 0 2 4 1 5.S Z 海 康 威 视 3 3.0 9 1.5 1 1.7 8 2.0 7 2 1.8 9 1 8.5 4 1 6.0 1未 评 级0 0 2 2 3 6.S Z 大 华 股 份 1 7.3 9 2.2 3 1.1 9 1.3 9 7.7 8 1 4.5 6 1 2.5 1增 持6 8 8 5 9 5.S H 芯 海 科 技 2 8.0 2-1.0 1-0.2 8 0.1 4-2 7.8 2-9 9.7 7 1 9 9.5 4买 入3 0 0 6 0 2.S Z 飞 荣 达 1 4.0 5 0.1 8 0.6 5 0.8 9 7 8.6 9 2 1.7 2 1 5.7 1买 入0 0 0 9 7 7.S Z 浪 潮 信 息 3 9.9 5 1.2 1 1.6 4 2.2 5 3 2.9 9 2 4.4 0 1 7.7 1买 入6 0 1 1 3 8.S H 工 业 富 联 2 5.5 8 1.0 6 1.2 3 1.5 4 2 4.1 5 2 0.7 4 1 6.6 6买 入6 0 3 0 1 9.S H 中 科 曙 光 4 4.5 3 1.2 5 1.5 7 1.9 6 3 5.5 0 2 8.3 1 2 2.7 2买 入0 0 0 0 3 4.S Z 神 州 数 码 2 9.0 0 1.7 5 2.1 5 2.5 8 1 6.5 7 1 3.5 1 1 1.2 2买 入0 0 0 9 3 8.S Z 紫 光 股 份 2 2.1 9 0.7 4 0.9 0 1.0 8 3 0.1 8 2 4.7 7 2 0.6 4未 评 级3 0 0 3 0 8.S Z 中 际 旭 创 1 7 0.5 0 2.7 1 6.1 2 8.2 2 6 2.9 8 2 7.8 6 2 0.7 5未 评 级0 0 2 4 6 3.S Z 沪 电 股 份 3 2.8 8 0.7 9 1.1 8 1.4 7 4 1.6 0 2 7.9 4 2 2.4 3未 评 级3 0 0 5 0 2.S Z 新 易 盛 8 2.7 3 0.9 7 2.0 4 2.9 5 8 5.3 2 4 0.4 6 2 8.0 9未 评 级6 8 8 0 4 1.S H 海 光 信 息 7 2.5 4 0.5 4 0.7 2 0.9 8 1 3 3.4 8 1 0 0.3 0 7 4.3 4买 入6 8 8 2 5 6.S H 寒 武 纪-U 1 8 1.6 6-2.0 4-1.2 5-0.4 4-8 9.2 0-1 4 5.1 4-4 0 9.3 1未 评 级资料来源:W i n d 资讯,国海证券研究所(注:已评级标的盈利预测来自国海证券,未评级标的盈利预测来自 w i n d 一致预期)证 券 研 究 报 告请务必阅读正文后免责条款部分 4内 容目 录事 件:.6评 论:.61、G P T 持 续 迭 代,G P T-4 o 推 动 人 机 交 互 再 上 新 台 阶.62、打 造 全 新 G P T 语 音 助 手 且 免 费 开 放,合 作 苹 果 微 软 加 速 端 侧 落 地.1 03、谷 歌 发 布 P r o j e c t A s t r a、V e o 等,多 模 态 技 术 奇 点 加 速 到 来.1 34、相 关 个 股.1 55、风 险 提 示.1 6EscYhOmVUiLEuCpRVjlW05KvZxvDHl7CnYBIQwX/6MMcyyXqc5hkAQ6TLbS1En0E 证 券 研 究 报 告请务必阅读正文后免责条款部分 5图 表目 录图 1:G P T 发 展 历 程.6图 2:G P T 视 频 解 题.7图 3:G P T-4 o 将 O p e n A I 的 l o g o 印 到 杯 垫 上.7图 4:G P T-4 o 将 输 入 的 文 字 排 版 为 手 写 体.7图 5:输 入 几 段 文 字 就 可 以 得 到 一 组 漫 画 分 镜.8图 6:由 生 活 照 生 成 海 报.8图 7:研 发 负 责 人 现 场 演 示 与 G P T-4 o 对 话 并 展 现 其 情 绪 感 知 能 力.8图 8:英 伟 达 科 学 家 J i m F a n 评 论.9图 9:G P T-4 o 在 5-s h o 常 识 问 题 上 创 8 7.2%高 分.9图 1 0:G P T-4 o 显 著 提 高 所 有 语 言 的 语 音 识 别 性 能.9图 1 1:G P T-4 o 语 音 翻 译 在 M L S 基 准 测 试 优 于 W h i s p e r-v 3.1 0图 1 2:在 所 有 语 言 基 准 测 试 中 G P T-4 o 都 比 G P T-4 更 强.1 0图 1 3:A P I 速 度 飙 升 2 倍,价 格 减 半.1 0图 1 4:O p e n A I 的 员 工 与 G P T-4 o 视 频.1 1图 1 5:两 个 G P T-4 o 语 音 助 手 互 相 对 话 并 唱 歌.1 1图 1 6:G P T-4 o 以 家 教 的 方 式 一 步 步 引 导 解 题.1 1图 1 7:G P T-4 o 实 时 翻 译.1 1图 1 8:O p e n A I 将 G P T-4 o 在 免 费 套 餐 中 提 供.1 2图 1 9:适 用 于 m a c 的 桌 面 级 应 用.1 2图 2 0:桌 面 端 可 直 接 截 图 提 问.1 3图 2 1:总 结 截 图 的 内 容.1 3图 2 2:G P T 完 美 理 解 了 代 码 中 的 内 在 逻 辑.1 3图 2 3:概 述 代 码 生 成 的 图 表 并 回 答 问 题.1 3图 2 4:A s t r a 对 所 有 听 到、看 到 的 东 西 进 行 解 读.1 4图 2 5:A s t r a 对 草 图、物 品 进 行 深 度 解 读 和 联 想.1 4图 2 6:V e o 根 据 文 字 内 容 生 成 视 频 1.1 4图 2 7:V e o 根 据 文 字 内 容 生 成 视 频 2.1 4证 券 研 究 报 告请务必阅读正文后免责条款部分 6事 件:2 0 2 4 年 5 月 1 4 日,O p e n A I 在 官 网 正 式 发 布 新 旗 舰 模 型 G P T-4 o 多 模 态 大 模 型,其 中 o 代 表 的 是 o m n i,即“全 能”,G P T-4 o 可 以 实 时 对 音 频、视 觉 和 文 本 进行 推 理,相 较 于 G P T-4 T r u b o 速 度 更 快、价 格 更 便 宜。2 0 2 4 年 5 月 1 5 日,2 0 2 4 年 谷 歌 I/O 大 会 正 式 召 开,会 上 谷 歌 将 搜 索 业 务 做 了最 彻 底 的 A I 改 造,更 新 升 级 了 G e m i n i 1.5 P r o 版 本,推 出 G e m i n i 1.5 F l a s h 轻 量化 小 模 型、生 成 视 频 模 型 V e o、A I 智 能 体 P r o j e c t A s t r a,并 展 示 了 与 G P T-4 o 相似 的 语 音 视 觉 交 互 功 能 G e m i n i L i v e。评 论:1、G P T 持 续 迭 代,G P T-4 o 推 动 人 机 交 互 再 上 新 台阶G P T 持 续 迭 代 历 程:O p e n A I 自 2 0 1 8 年 发 布 第 一 代 G P T 以 来,持 续 对 其 能 力与 版 本 进 行 迭 代 更 新;2 0 2 3 年 3 月 发 布 的 G P T-4,在 图 片 识 别、图 文 数 据 综 合处 理、逻 辑 推 理 等 能 力 实 现 质 变 飞 跃,也 引 发 了 全 球 A I 领 域 的 热 潮;2 0 2 3 年1 1 月,O p e n A I 发 布 G P T-4 T u r b o,支 持 高 达 1 2.8 万 t o k e n s 的 同 时 也 在 上 下 文等 多 个 领 域 实 现 显 著 进 步。对 于 G P T 5,S a m A l t m a n 表 示“O p e n A I 今 年 将 会 推 出 一 个 非 常 棒 的 模 型,G P T-5 将 带 来 类 似 于 G P T-3 到 G P T-4 那 样 的 能 力 飞 跃。”图 1:G P T 发 展 历 程资料来源:国家发改委、澎湃新闻、A P P S O 等、国海证券研究所2 0 2 4 年 5 月 1 4 日,G P T-4 o 加 持 的 C h a t G P T 再 次 实 现 能 力 上 的 颠 覆 性 跨 越,将 人 机 交 互 推 入 新 时 代,兼 具 多 模 态 交 互+情 绪 感 知 能 力,同 时 实 现 毫 秒 级 响 应。证 券 研 究 报 告请务必阅读正文后免责条款部分 7 多 模 态 交 互,具 有 更 优 质 的 视 频 和 音 频 理 解 以 及 图 像 生 成 能 力。此 次 更 新 后,G P T-4 o 可 以 接 收 文 本、音 频 和 图 像 的 任 意 组 合 作 为 输 入,并 实 时 生 成 文 本、音频 和 图 像 的 任 意 组 合 输 出。与 现 有 模 型 相 比,G P T-4 o 在 视 觉 和 音 频 理 解 方 面 有 更 好 的 表 现:研 发 负 责人 B a r r e t 手 写 了 一 个 方 程,并 打 开 摄 像 头 拍 给 C h a t G P T,让 它 扮 演 老 师 的角 色 帮 助 自 己 解 题,最 终 G P T 随 着 B a r r e t 在 摄 像 头 中 解 题 实 时 给 出 鼓 励 和引 导,并 在 要 求 下 一 步 一 步 说 出 解 题 步 骤。图 2:G P T 视 频 解 题资料来源:机器之心 G P T-4 o 在 理 解 和 生 成 图 像 方 面 的 能 力 优 于 现 有 模 型,可 以 完 成 许 多 以 前 的模 型 无 法 完 成 的 事 情,图 3:G P T-4 o 将 O p e n A I 的 l o g o 印 到 杯 垫 上 图 4:G P T-4 o 将 输 入 的 文 字 排 版 为 手 写 体资料来源:机器之心 资料来源:机器之心证 券 研 究 报 告请务必阅读正文后免责条款部分 8图 5:输 入 几 段 文 字 就 可 以 得 到 一 组 漫 画 分 镜 图 6:由 生 活 照 生 成 海 报资料来源:机器之心 资料来源:机器之心 情 绪 感 知。研 发 负 责 人 M a r k C h e n 向 其 表 述 略 有 紧 张 的 情 绪 时,G P T 可 以 通过 带 有 情 感 的 方 式 给 予 安 慰。此 外 在 交 互 过 程 中,G P T-4 o 与 过 往 的 语 音 助 手 最大 的 不 同 表 现 在:1、可 以 随 时 打 断 A I,开 启 下 一 轮 对 话;2、充 分 理 解 人 类 情感,同 时 自 身 也 可 以 表 现 情 感,具 备 共 情 能 力。图 7:研 发 负 责 人 现 场 演 示 与 G P T-4 o 对 话 并 展 现 其 情 绪 感 知 能 力资料来源:机器之心 跨 越 语 音、文 本、视 觉 多 种 形 式 直 接 进 行 推 理,响 应 速 度 平 均 3 2 0 毫 秒。传 统 语 音 助 手:在 G P T-4 o 发 布 之 前,通 过 语 音 模 式(V o i c e M o d e)与C h a t G P T 对 话,平 均 延 迟 为 2.8 秒(G P T-3.5)和 5.4 秒(G P T-4)。主 要原 因 系 语 音 模 式 通 常 需 要 通 过 一 个 简 单 模 型 将 音 频 转 录 成 文 本;G P T-3.5 或 G P T-4 接 收 文 本 并 输 出 文 本;第 三 个 简 单 模 型 将 文 本 转 换 回音 频;以 上 三 个 步 骤,导 致 信 息 丢 失 的 同 时 无 法 直 接 观 察 语 气、也 无 法 表 达情 感。G P T-4 o 实 现 跨 越 语 音、文 本、视 觉 多 种 形 式 直 接 进 行 推 理,达 到 毫 秒 级 响应。G P T-4 o 是 O p e n A I 首 个 端 到 端 训 练 的 跨 越 文 本、视 觉 和 音 频 的 新 模 型,意 味 着 所 有 输 入 和 输 出 都 由 相 同 的 神 经 网 络 处 理,能 以 平 均 3 2 0 毫 秒 做 出响 应,最 快 可 以 在 2 3 2 毫 秒 的 时 间 内 响 应 音 频 输 入。证 券 研 究 报 告请务必阅读正文后免责条款部分 9 英 伟 达 科 学 家 J i m F a n 对 此 评 论:从 技 术 角 度 来 看,O p e n A I 已 经 找 到 了一 种 方 法,可 以 将 音 频 直 接 映 射 到 音 频 作 为 一 级 模 态,并 将 视 频 实 时 传 输 到t r a n s f o r m e r。这 些 需 要 对 t o k e n 化 和 架 构 进 行 一 些 新 的 研 究,但 总 体 来 说是 一 个 数 据 和 系 统 优 化 问 题。图 8:英 伟 达 科 学 家 J i m F a n 评 论资料来源:机器之心 性 能 和 成 本 优 势 有 望 加 速 A I+场 景 应 用 性 能:在 传 统 基 准 测 试 中,G P T-4 o 在 文 本、推 理 和 编 码 智 能 方 面,达 到 了G P T-4 T u r b o 级 别 的 性 能,同 时 在 多 语 言、音 频 和 视 觉 能 力 方 面 创 下 了 新 高。图 9:G P T-4 o 在 5-s h o 常 识 问 题 上 创 8 7.2%高 分 图 1 0:G P T-4 o 显 著 提 高 所 有 语 言 的 语 音 识 别 性 能资料来源:机器之心 资料来源:机器之心证 券 研 究 报 告请务必阅读正文后免责条款部分 1 0图 1 1:G P T-4 o 语音 翻译 在 M L S 基准 测试优于 W h i s p e r-v 3 图 1 2:在所 有语言基 准测试 中 G P T-4 o 都比 G P T-4 更强资料来源:机器之心 资料来源:机器之心 成 本:在 处 理 英 语 文 本 和 代 码 方 面,G P T-4 o 的 性 能 与 G P T-4 T u r b o 相 当,但 在 处 理 非 英 语 文 本 时 有 显 著 改 进。同 时,相 比 G P T-4 T u r b o,推 理 速 度 提升 2 倍,且 价 格 降 低 5 0%。图 1 3:A P I 速 度 飙 升 2 倍,价 格 减 半资料来源:新智元2、打 造 全 新 G P T 语 音 助 手 且 免 费 开 放,合 作 苹 果 微 软 加 速 端 侧 落 地O p e n A I 通 过 G P T-4 o 打 造 的 语 音 版 C h a t G P T 助 手,可 以 与 用 户 跨 音 频、视 频进 行 交 流,例 如,让 G P T-4 o 进 行 实 时 翻 译、唱 歌、做 数 学 题、讲 笑 话 等。具 体给 的 功 能 展 示 如:应 用 场 景 1:通 过 手 机 与 G P T-4 o 视 频,让 其 解 读 使 用 者 的 想 法;G P T-4 o可 以 描 述 O p e n A I 的 员 工 拿 着 手 机 拍 摄 的 周 围 场 景,可 以 回 答 员 工 让 其 猜 测的 问 题,也 会 像 人 一 样 表 现 出 惊 讶 和 停 顿,这 是 以 往 任 何 语 音 助 手 都 不 具 备的 技 术 特 征。证 券 研 究 报 告请务必阅读正文后免责条款部分 1 1 应 用 场 景 2:O p e n A I 总 裁 兼 联 合 创 始 人 G r e g B r o c k m a n 让 两 个 G P T-4 o语 音 助 手 互 相 对 话 并 唱 歌。图 1 4:O p e n A I 的 员 工 与 G P T-4 o 视 频 图 1 5:两 个 G P T-4 o 语 音 助 手 互 相 对 话 并 唱 歌资料来源:A I G C 开放社区 资料来源:A I G C 开放社区 应 用 场 景 3:G P T-4 o 不 会 像 以 往 的 C h a t G P T 一 样 直 接 给 出 答 案,而 是 会一 步 步 引 导 的 方 式 帮 助 解 答,充 当 教 教 的 角 色;应 用 场 景 4:通 过 G P T-4 o 实 时 翻 译 了,当 说 完 一 句 话 时,G P T-4 o 已 经 翻译 好 并 实 现 语 音 输 出。图 1 6:G P T-4 o 以 家 教 的 方 式 一 步 步 引 导 解 题 图 1 7:G P T-4 o 实 时 翻 译资料来源:A I G C 开放社区 资料来源:A I G C 开放社区G P T-4 o 的 文 本 和 图 像 功 能 已 经 在 C h a t G P T 中 开 放 使 用,免 费 注 册 用 户 也 可 以体 验 该 功 能,P l u s 用 户 则 提 升 5 倍 消 息 限 制。同 时 G P T-4 o 模 型 的 A P I 也 被 同步 放 出,可 以 部 署 各 种 下 游 应 用 程 序 上。开 发 人 员 通 过 A P I 可 以 访 问 G P T-4 o 的文 本 和 视 觉 功 能。未 来 几 周 内,O p e n A I 会 在 C h a t G P T P l u s 中 推 出 新 版 语 音 模式 G P T-4 o 的 a l p h a 版。证 券 研 究 报 告请务必阅读正文后免责条款部分 1 2图 1 8:O p e n A I 将 G P T-4 o 在 免 费 套 餐 中 提 供资料来源:A n y 硬科技苹 果 P C+移 动 端 布 局,G P T 加 速 端 侧 落 地。P C 端:O p e n A I 宣 布 推 出 一 款 适 用于 m a c O S 的 桌 面 级 应 用,使 用 键 盘 快 捷 键 就 可 向 C h a t G P T 提 问。用 户 可 通 过电 脑 与 C h a t G P T 语 音 对 话,G P T-4 o 的 新 音 频 和 视 频 功 能 后 续 将 推 出。移 动 端:据 每 日 经 济 新 闻 援 引 彭 博 社 5 月 1 0 日 报 道,苹 果 被 曝 正 与 O p e n A I 敲 定 一项 协 议,今 年 将 后 者 的 部 分 技 术 引 入 i P h o n e。借 此 苹 果 将 能 提 供 由 C h a t G P T支 持 的“聊 天 机 器 人”,作 为 i O S 1 8 中 人 工 智 能 功 能 的 一 部 分。图 1 9:适 用 于 m a c 的 桌 面 级 应 用资料来源:新智元证 券 研 究 报 告请务必阅读正文后免责条款部分 1 3 桌 面 级 G P T 支 持 在 应 用 程 序 中 直 接 截 图 并 进 行 提 问。图 2 0:桌 面 端 可 直 接 截 图 提 问 图 2 1:总 结 截 图 的 内 容资料来源:新智元 资料来源:新智元 看 代 码 能 力。桌 面 级 G P T 可 以 理 解 画 面 中 的 代 码 并 给 出 完 整 的 描 述,比 如 准确 对 应 了 函 数 名 及 其 功 能,并 识 别 出 了 其 中 取 平 均 值、最 高 值 等 操 作 的 意 图。图 2 2:G P T 完 美 理 解 了 代 码 中 的 内 在 逻 辑 图 2 3:概 述 代 码 生 成 的 图 表 并 回 答 问 题资料来源:新智元 资料来源:新智元此 外 据 I T 之 家 消 息,O p e n A I 在 官 方 公 告 中 表 示 G P T 端 侧 应 用 今 年 晚 些 时 候 将推 出 W i n d o w s 版 本。3、谷 歌 发 布 P r o j e c t A s t r a、V e o 等,多 模 态 技 术 奇点 加 速 到 来A I A g e n t 是 指 人 工 智 能 代 理,是 一 种 能 够 感 知 环 境、进 行 决 策 和 执 行 动 作 的 智能 实 体,其 核 心 驱 动 力 是 大 模 型,在 此 基 础 上 增 加 规 划、记 忆 和 工 具 使 用 三 个 关键 组 件。原 理 是 基 于 感 知 与 理 解、知 识 表 示 与 推 理、决 策 与 执 行 以 及 学 习 与 自 适应 等 技 术 来 实 现 的。它 能 够 模 拟 人 类 的 智 能 行 为,处 理 复 杂 的 任 务,并 根 据 环 境的 变 化 进 行 自 适 应 和 学 习,从 而 提 高 智 能 化 水 平 和 性 能。证 券 研 究 报 告请务必阅读正文后免责条款部分 1 4表 1:A I A g e n t 的 技 术 原 理技术 原理 主要 内容感知与理解A I A g e n t 能够通过传感器、摄像头、语音识别等 技术感知环境信息,并理解任务需求和目标,知识表示与推理A I A g e n t 通常采用知识表示和推理技术来处理感 知和理解的信息。知识表示是 将信息转 化为可理 解和可用 的格式,而 推理则是 基于这些 知识进行逻辑分析和推断。决策与执行基于感知和理解的信息以及知识表示与 推理的结果,A I A g e n t 需要制定相应的决策并执行相应的动作学习与自适应 A I A g e n t 通过不断的学习和自适应,能够逐渐改进自身的性能和表现。资料来源:电子发烧友网、国海证券研究所谷 歌 I/O 开 发 者 大 会 发 布 多 项 重 大 更 新。2 0 2 4 年 5 月 1 5 日 凌 晨,G o o g l e I/O开 发 者 大 会 上 发 布 了 通 用 A I 智 能 体 P r o j e c t A s t r a,可 实 现 跨 文 本、音 频、视 频多 模 态 实 时 推 理。同 时,谷 歌 正 式 发 布 一 款 全 新 的 视 频 生 成 模 型 V e o,谷 歌 声 称,V e o 能 够 根 据 文 本、图 像 创 建 超 过 6 0 秒 的 高 质 量 1 0 8 0 P 视 频,用 户 可 以 对 光 照、镜 头 语 言、视 频 颜 色 风 格 等 进 行 设 定。图 2 4:A s t

注意事项

本文(20240517_国海证券_计算机行业动态研究:GPT_4o、Gemini新品接连发布多模态技术奇点加速到来_19页.pdf)为本站会员(13265894233)主动上传,报告吧仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知报告吧(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642号


收起
展开