欢迎来到报告吧! | 帮助中心 分享价值,成长自我!

报告吧

换一换
首页 报告吧 > 资源分类 > PDF文档下载
 

20230319_国金证券_传媒互联网产业行业深度研究:AIGC步入快车道游戏行业降本增效或超预期_20页.pdf

  • 资源ID:171973       资源大小:3.02MB        全文页数:20页
  • 资源格式: PDF        下载积分:9.9金币 【人民币9.9元】
快捷下载 游客一键下载
会员登录下载
三方登录下载: 微信开放平台登录 QQ登录  
下载资源需要9.9金币 【人民币9.9元】
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付说明:
本站最低充值10金币,下载本资源后余额将会存入您的账户,您可在我的个人中心查看。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,下载共享资源
 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

20230319_国金证券_传媒互联网产业行业深度研究:AIGC步入快车道游戏行业降本增效或超预期_20页.pdf

敬请参阅最后一页特别声明 1 AIGC 发展步入快车道。据 Gartner,生 成 式 AI(AIGC)预 计未 来 2-5 年内达到成熟阶段。1)基础层技术的进步推动 AIGC 爆发。生成算法持续突破,其中,2017 年 Transformer 模型发布,2018 年谷歌 基于该模型 发布 了 BERT模型,开启预训练模型时代,对生 成式 AI 带来质的突破。2)目前预训练模型已经从单一模型演进到多模态模型,且已出现面向 C 端的应用,单一模型主要包括 NLP(自然语言处理)、CV(计算机视觉)领域,比如 自然语言处理模型 GPT 3;多模态模型涉及文字、图片、音视频等多种内容形态,比如 Stable Diffusion,能实现文本转换为图片,2023 年 3 月 15 日 Open AI 推出的 GPT-4 能实现输入文本或图像,输出文本。3)应用:AIGC 技术场景涵盖内容生产各环节,目前发展较成熟的是文本生成、图像生成及文字生成图像/音视频。对于游戏领域,AIGC 可赋能游戏制作、运营环节。1)游戏制作:目前原画领域较成熟,Midjourney 等 AI 绘画工具 能实现输入文本、生成图像,但 目前 的产出 尚有不合理之处,尤其是对“手”的处理,需要 人 工调 整 才可用于游戏制作。2D 游戏美术环节中,角色设计较成熟,动作/特效有待发展。2D 角色:AIGC 成熟 度从 高到 低为,角色模型角色表情角色动作=角色特效,AI 工具已可辅助快速、高质量生成 2D 素材,但 生 成内 容连 续度、风格统一度不够,无法生成游戏中可使用的角色动作,Stable Diffusion 将 2D 视频直接生成动画的方式提供了角色动作/特效生成的路径,一定程度解决了画面抖动问题;2D 场景和物体:成熟度低于 2D 角 色设 计,但已有 DALL E2 等工具进行辅助。3D 游戏美术环节中,角色设计及表情较成熟,动作生成在发 展中,3D 扫描生成物体及场景的路径已较清晰。3D 角色:目前 AIGC 成熟度从高到低为,角色模型=角色 表情 角 色 动作 角 色特效,NVIDIA Omniverse 和 Unreal Metahuman 目前可生成 3D 角色模型和表情,NVIDIA ASE 虽可实现 3D 角色动作,但目前直接应用性较低且动作生成较局限。3D 场景和物体:Image to 3D、Text to 3D、ChatGPT to code to DCC、3D Scan 四种方式中,目前 3D Scan 最成熟,随 GPT 系列持续迭代,从 ChatGPT 到 DCC 的模式 有望快速发展。其他环节:策划及代码逻辑均出现较成熟的工具。策划 环节 代表性工具是 ChatGPT,文本生成能力较强且脑洞较大,GPT-4 在此基础上进一步加强,且能回答“文本+图像”形式呈现的问题;Github Copilot 等可辅助代码编写。2)游戏运营:AI 辅助生成广告素材,实现自动化广告投放。AIGC 在游戏领域应用的作用:降本增效,提升内容质量。1)辅助游戏制作和运营,降本增效。以网文、游戏为例,内容生产成本较高:阅文集团内容成本占在线阅读收入比例整体在 30%以上,游戏研发成本约 15%-35%,AI工具 可大幅降低美术等环节的成本。据伽马数据,22 年中国游戏收入 2659 亿元,以 25%的研发成本、40%的成本可被 优化 计,可优 化成 本约 266 亿;游戏 大作 制作 时间 在2 年以 上,以 原 神 为例,从立 项到 公测 耗时 3 年+,AI 工具 赋能 下,预计 游戏 制作 时间 有望 缩短,NFT 游戏 Bearverse 开发 应用 AI 技术 后,工时 从6 个月压缩至1 个月,减少 80%+。2)AIGC 有望助力 激发 创意,提升画质 以及交互性,进而提高游戏体验。关注游戏上线节奏 及 AIGC 在游戏领域的应用情况。我们认为,AIGC 技术及产品目前已在游戏行业 有部分应用,中长 期来 看,对游 戏制 作的 降本 增效、内容 质量 提升 有较 强的 促进 作用;当前 游戏 版号 常态 化发 放,政策 端不 确定性 降低,预计 产品 周期 是业 绩的 关键 驱动,关注 游戏 产品 上线 情况,个股方面,建议关注腾讯控股、网易、巨人网络、三七互娱、完美世界。AIGC 技术发展及应用不及预期风险,监管风险 行业深度研究 敬请参阅最后一页特别声明 2 内容目录 一、技术进步加快 AIGC 发展及应用.4 1.1 AIGC 产业:从底层基础设施到应用.4 1.2 底层技术 持续进步,AIGC 发展步入快车道.4 1.3 AIGC 应用:各模态内容生产的变革.6 1.4 现象级产品 ChatGPT 推动 AIGC 出圈,AIGC 发展有望加快.7 二、游戏领域应用:美术环节较成熟,未来有望辅助各环节.9 2.1 AIGC 可赋能游戏制作、运营.9 2.2 游戏制作美术环节:原画设计已出现可投入应用的 AI 工具.10 2.3 2D 游戏美术环节:角色设计较成熟,动作/特效有待发展.11 2.4 3D 游戏美术环节:角色设计及表情较成熟,动作生成在发展中,3D 扫描生成场景及物体较成熟.12 2.5 其他环节:策划及代码逻辑均出现较成熟的工具.13 三、AIGC 在游戏领域应用的作用:降本增效,提升内容质量.14 3.1 辅助游戏制作和运营,降本增效.14 3.2 从创意、美术、交互性等角度,提高 游戏内容质量.15 四、投资建议.16 五、风险提示.17 图表目录 图表 1:AIGC 产业各层级一览.4 图表 2:2022 人工智能技术成熟曲线.4 图表 3:主流生成模型.5 图表 4:国内外主要预训练模型.5 图表 5:AIGC 技术场景一览.6 图表 6:AIGC 应用现状一览.7 图表 7:从 Transformer 模型 到 GPT-4:自然语言处理(NLP)模型的进化.7 图表 8:ChatGPT 聊天截图.8 图表 9:海内外 ChatGPT 相关 AI 布局(ChatGPT 发布后).8 图表 10:GPT-4 对输入 文本+图像 形式内容的解答.9 图表 11:GPT 3.5、GPT 4(no vision)、GPT 4 多种考试的测评结果.9 图表 12:GPT-4 对安全性指标的改进.9 图表 13:游戏产业链及 AIGC 可赋能环节.10 图表 14:游戏制作领域 AIGC 应用现状一览.10 1ZFUyRnQmPoPpRnOrMpQqRaQdNbRsQmMtRsRiNrRnOlOoMnNaQoOzRuOsOyQMYsPoQ行业深度研究 敬请参阅最后一页特别声明 3 图表 15:获奖 AI 画作太空歌剧院.11 图表 16:借助 Midjourney 生成 的 2D 场景图.11 图表 17:AI 绘画工具 Midjourney 自动生成图片.11 图表 18:NVIDIA vid2vid Cameo 捕捉真人面部表情.12 图表 19:使用 DALL E 2 对图片二次创作.12 图表 20:Stable Diffusion 将 2D 视频制作成动画.12 图表 21:NVIDIA Omniverse Audio2Face 功能.12 图表 22:NVIDIA ASE 3D 角色动作训练.12 图表 23:NVIDIA GET3D 效果.13 图表 24:NVIDIA Magic3D 效果.13 图表 25:ChatGPT 生成代码.13 图表 26:Quixel 3D 扫描物体.13 图表 27:Meta AudioGen 工作原理:Decoder+Encoder.14 图表 28:Github Copilot 辅助代码生成 准确识别西班牙语并成功实现指令.14 图表 29:昆仑万维旗下 StarX Music Lab AI 生成曲目.14 图表 30:阅文集团内容成本及其占在线阅读收入的比例.14 图表 31:完美 世界/三七互娱/吉比特研发费用中职工薪酬占收入比例.14 图表 32:游戏行业上市公司研发费用占收入比例.15 图表 33:以 22 年游戏收入计,可优化制作成本 约 266 亿.15 图表 34:原神 VS 羊了个羊画质对比.15 图表 35:传媒互联网领域上市公司 AIGC 相关布局.16 图表 36:上市公司游戏储备.17 行业深度研究 敬请参阅最后一页特别声明 4 AIGC 1.1 AIGC 产业:从底层基础设 施到应用 从底层基础设施到应用,AIGC 爆发有赖底层技术的持续进步 及成熟。AIGC 产业可分为 基础层、中间 层和 应用 层。基础层:指基础 设施 层,目前 主要 是以 预训 练模 型为 基础 搭建的基础设施。中间 层:在大 模型 基础 上训 练垂 类小 模型,比如 适配 不同行业的 AI 工具、不同风格的 AI 绘画工具。应用层:指面向C 端的产品或服务,比如智能客服、AI 绘画、AI 写作 等。图表1:AIGC 产业各 层级一览 来源:腾讯研究院,国金证券研究所 1.2 底 层 技术 持 续进 步,AIGC 发展步入快车道 在前期技术的持续积累、进步下,AIGC 发展已步入快车道。据 Gartner,生成式 AI(AIGC)预计未来 2-5 年内达到成熟阶段。目前已有 Midjourney 等成熟的 AI 工具。图表2:2022 人工智能技术成熟曲线 来源:Gartner,国金证券研究所 基础层:生成算法持续突破,预训练模型加速 生成式 AI(AIGC)发展。1)生成 算法 持续 突破:从 2014 年的 VAE 到 2021 年的 可跨 内容 模态 的 CLIP 模型。其中,2018 年谷歌发布的、开启预训练模型时代的预训练模型 BERT 基于 Transformer以预训练模型为基础搭建的基础设施基础层中间层应用层垂直化、场景化、个性化的模型To C 文字、图片、音视频等内容生成服务内容生成工具或服务比如:Stable Diffusion(程序和模型均开源)、Mid Journey(AI 绘画)、智能客服等。从单一模型到多模态、跨模态模型1)NLP 模型:比如:谷歌 LaMDA;Open AI GPT 系列;2)CV 模型:比如:微软 Florence;3)多模态预训练模型:融合文字、图片、音视频等多种内容形式。比如:NVIDIA Audio 2 Face大模型基础上的小模型比如:Novel-AI,基于开源的Stable Diffusion开发的二次元风格AI绘画工具。各层级 主要内容截至2022年7 月合成数据期望值技术萌芽期 期望膨胀期 泡沫破裂低谷期稳步爬升复苏期 生产成熟期通用人工智能基于管理的人工智能因果人工智能以数据为中心的人工智能人工智能工程化决策智能复合型人工智能人工智能信任、风险和安全管理运营人工智能系统M odelO ps神经形态计算生成式人工智能尽责人工智能基础模型智能机器人边缘人工智能知识图谱自然语言处理(NLP)数字伦理人工智能创客和教学套件人工智能云服务深度学习自动驾驶汽车智能应用数据标记和注解计算机视觉(CV)距 离 达 到 成 熟 阶 段 的 时 间:2 年 2-5 年 5-10 年 10 年行业深度研究 敬请参阅最后一页特别声明 5 模型 搭建,Open AI 推出的 GPT 系列也基于 Transformer 模型搭建。图表3:主 流 生 成模 型 模型 提出时间 模型描述 变分自动化编码(Variational Autoencoders,VAE)2014 基于变分下届约束得到的 Encoder-Decoder 模型对 生成对抗网络(GAN)2014 基于对抗的 Generator-Discriminator 模型对 基于流的生成模型(Flow-based models)2015 学习一个非线性双射转换(bijective transformation),其将训练数据映射到另一个空间,在该空间上分布是可以因子化的,整个模型架构依靠直接最大化 log-likelihood 来完成 扩散模型(Diffusion Model)2015 2 个过程:分别为扩散过程、逆扩散过程。在前向扩散阶段对图像逐步施加噪声,直至图像被破坏变成安全的高斯噪声,然后在逆向阶段学习从高斯噪声还原原始图像的过程。经过训练,该模型可以应用这些去噪方法,从随机输入中合成新的“干净”数据。Transformer 模型 2017 基于自注意力机制的神经网络模型,最初用来完成不同语言之间的文本翻译任务,主体包含 Encoder 和 Decoder 部分,分别负责对源语言文本进行编码和将编码信息转换为目标语言文本 神经辐射场(Neural Radiance Field,NeRF)2020 提出了一种从输入图像中优化连续 5D 神经辐射场的表示(任何连续位置的体积密度和视角相关颜色)的方法,要解决的问题是给定一些拍摄的图,如何生成新视角下的图 CLIP(Contrastive Language-Image Pre-Training)模型 2021 进行自然语言理解和计算机视觉分析;使用已经标记好的“文字-图像”训练数据。随文字 进行模型训练的同时,对另一个模型训练,不断调整两个模型的内部参数,使得模型分别输出文字特征和图像特征值,并确认匹配。来源:腾讯研究院,国金证券研究所 2)预训练模型 带来质的突破,已出现跨模态模型。预训练模型是基于大量数据训练的 大模 型,参数 规模 较大,内容 生成 质量 提升 明显,且目 前已 出现 基于预训练模型的C 端产品。2018 年谷歌发布基于 Transformer 的自然语言处理预训练模型 BERT,开启预训练模型时代。目前预训练模型已经从单一模型演进到多模态模型,单一模型主要包括 NLP(自然语言处理)、CV(计 算机 视觉)领域,比如 自然 语言 处理 模 型 GPT 3;多模 态模 型:涉及 文字、图片、音视 频等 多种 内容 形态,比如 Stable Diffusion,能实现 文本转换为图片,2023 年 3 月 15 日 Open AI 推出的 GPT-4 能实现输入文本或图像,输出文本。图表4:国内 外 主要 预训 练模 型 公司 预 训 练 模型 应用 参数量 领域 国内 百度 ERNIE 3.0 语言理解与生成 千亿级 NLP ERNIE(比如 ERNIR-ViLG)文字-图片 千亿级 多模态 VIMER 视觉-语言等 百亿级 CV 腾讯 HunYun-NLP 语言理解与生成 万亿级 NLP HunYun-cvr 视觉识别-CV HunYun-tvr 文字-视频等-多模态 阿里 通义-AliceMind 语言理解与生成 270 亿 NLP 通义-CV 视觉识别-CV 通义-M6 文字-图片等 10 万亿 多模态 华为 盘古 语言理解与生成 视觉识别 文字-图片等 千亿级 NLP CV 多模态 海外 谷歌 BERT 语言理解与生成 4810 亿 NLP LaMDA 对话系统-NLP PaLM 语言理解与生成、推理、代码生成 5400 亿 NLP Imagen 语言理解与图像生成 110 亿 多模态 Parti 语言理解与图像生成 200 亿 多模态 行业深度研究 敬请参阅最后一页特别声明 6 公司 预 训 练 模型 应用 参数量 领域 微软 Florence 视觉识别 6.4 亿 CV Turining-NLG 语言理解与生成 170 亿 NLP Facebook OPT-175B 语言模型 1750 亿 NLP M2M-100 100 种语言互译 150 亿 NLP Deep Mind Gato 多面手的智能体 12 亿 多模态 Gopher 语言理解与生成 2800 亿 NLP AlphaCode 代码生成 414 亿 NLP Open AI GPT4 语言理解与生成、推理等-NLP GPT3 语言理解与生成、推理等 1750 亿 NLP CLIP&DALL-E 图像生成、跨模态检索 120 亿 多模态 Codex 代码生成 120 亿 NLP ChatGPT 语言理解与生成、推理等-NLP 英伟达 Megatron-Turning NLG 语言理解与生成、推理 5300 亿 NLP Stability AI Stable Diffusion 语言理解与图像生成-多模态 来源:Open AI 官网,腾讯研究院,量子位,IDC,华为云公众号,央广网,国金证券研究所整理 1.3 AIGC 应用:各模态内容生 产的变革 AIGC 技术场景 涵盖内容生产各环节,目前发展较成熟的是文本生成、图像生成及文字生成图像/音视频。1)文本生成:以 2022 年 12 月 Open AI 推出的 ChatGPT 为代表,能输入输出文本,ChatGPT 能实现更加顺畅、符合人类思维的答案,对未知问题的回答也更优。2)图像生成:比如 Midjourney,可实现输入文本,生成图像,且可以持续优化迭代。3)音视 频生 成:比如 通过 NVIDIA 旗下 Vid2Vid Cameo,创作 者可 以从 标准 2D 视频中捕捉面部动作和表情。4)跨模态:NVIDIA Audio2Face 可根据音频驱动人脸。传媒领域,在线 阅读 读物、游戏 制作、影视 剧制 作、音视 频制 作、广告 素材 生成、虚拟 人生成等各种形态的内容的生成方式均会发生质的变化,生成内容的速度、质量预计也将发生跃迁。图表5:AIGC 技术场景一览 来源:量子位智库,国金证券研究所绘制,注:蓝色为较广泛使用、技术细节有待进一步提升;绿色字体为底层技术原理基本明确,预计 1-2 年规模化应用;红色为底层技术原理仍待完善,增长可期 AIGC 技 术场 景视频生成音频生成图像生成文本生成非交互式 文本图像、视频、文本间跨模态生成策略生成(以Game AI 中Al bot 为代表)Game Al虚拟人生成交互 性文 本结构化写 作(新闻播报 等,有 比较 强的规律)非结 构化 写作(剧情 续写、营销文 本等,需 要一定 创意 和 个性化)辅助性写 作(推荐 相关内 容、帮 助润色,不属于 严格AIGC)闲聊机器 人(虚拟男/女 友、心 理咨 询等)文本交互 游戏等(Al dungeon 等)语音克隆文本生成 特定语 音(生成虚拟 人歌 声/播报等)乐曲/歌曲生成(包 含作曲 及编曲,在实际 应用中 常包含 自动作 词)图像 编辑 工具(去除 水 印、提 高分 辨率、特 定 滤镜 等)图像自主 生成创意图像 生成(随机或 按照特 定属 性生成画 作等)功能 性图 像生 成(根据 指定要 求生 成营销类 海报、模特图、logo 等)视频属性 编辑(特定主 体、生 成特 效、跟踪 剪辑等)视频自动 剪辑(对特定 片段进 行检 测及合成)视频部分 编辑(视频换 脸等)文字生成 图像(根据文 字promnpt 生成创意 图像)文字生成 演示视 频(拼接 图片素 材生成视 频)文字生成 创意视 频(完全从头 生成 特定主题 视频)图像/视频到 文本(视觉问 答系统、自动配 字幕/标盟 等)AI BotNPC 逻辑及剧 情生成数字资产 生成虚拟人视 频生成虚拟人实 时交互行业深度研究 敬请参阅最后一页特别声明 7 图表6:AIGC 应用现状一览 来源:红杉资本,国金证券研究所 1.4 现 象 级产 品 ChatGPT 推动 AIGC 出圈,AIGC 发展有望加快 ChatGPT 展现出较强的文本处理能力。2018-20 年,基于 Transformer 模型,OpenAI相继推出 GPT-1、GPT-2、GPT-3,22 年在此基础上先后推出 InstructGPT、ChatGPT,相较之前的自然语言模型,ChatGPT 能实 现更 顺畅、符合 人类 思维 的答 案,对未 知问题的回答更优,Similarweb 数据显示,23 年1 月,ChatGPT 独立访问用户 已超1 亿。图表7:从 Transformer 模型到GPT-4:自然语言处理(NLP)模 型的 进化 来源:OpenAI,arXiv,国金证券研究所 M ARKETINGTextSALESSUPPORT(CHAT/EM AIL)OTHERKNOW LEDGEGENERAL W RITINGM ODELS:OPENAI GPT-3DEEPM IND GOPHERFACEBOOK OPTHUGGING FACE BLOOM COHERE ANTHROPICAI2ALIBABA,YANDEX,ETCVideoVIDEO EDITING/GENERATIONPERSONALIZED VIDEOSM ODELS:M ICROSOFT X-CLIPM ETA M AKE-A-VIDEOlm ageTM AGEGENERATIONCONSUM ER/SOCIALM EDIA/ADVERTISINGDESIGNM ODELS:OPENAI DALL-E 2STABLE DIFFUSIONCRAIYONCODE GENERATIONCodeDOCUM ENTATION W EB APP BUILDERS TEXT TO SQLM ODELS:OPENAI GPT-3 TABNINESTABILITY.AI3D3D M ODELS/SCENESM ODELS:DREAM FUSIONNVIDIA GET3DM DMSpeechM ODELS:OPENAIVOICE SYNTHESIS GAM INGRPAM USICAUDIOBIOLOGY/CHEM ISTRYO therM ODELS:TO COM ETransformer 模型Google Brain 推 出,基于self-attention,首次用于 自然语 言处理。对 比之前 主流的 自然 语言处 理领域 的模型 RNN:1、训 练时长 更短;2、训 练出 的 模型 可用 语法解 释。GPT-1OpenAI推出,基 于Transformer 模型,用生 成型预 训练提 高特定 问题/场景 下模 型 的语 言理解 力。1、参 数量:1.17亿;2、pre-training 后fine-tunning,在问答、文本 相似性、语义 蕴含判 定及文 本分类 领域比 基础的Transformer 模型更 优。GPT-2OpenAI 推 出,在GPT-1 基础 上,提 高模型面 对未知 任务的 解答能 力。1、参 数量:15 亿;2、UnsupervisedMultitask Learner模 型:较GPT-1 更通用,可回 答未知 问题。GPT-3OpenAI 推 出,在GPT-2 基础 上,进 一步提高 模型面 对未知 任务的 解答能 力。1、参 数量:1750 亿;2、Few-Shot Learner模 型:用 户不提 示或仅 提供少 量提示 下提问 就能获 得高质 量答案;3、初 次 商 业化:提供GPT-2 API,完 成 语言 任务;20年9 月微软 获得该 模型 独占许 可,可 独家接触GPT-3 的 源代码。2017 2018 2019 2020InstructGPTOpenAI 推 出,在GPT-3基 础上,训练参 数量大 幅减少,但生 成的答 案更符 合人类 思维习 惯。1、参 数量:13 亿;2、引 入RLHF(基于 人类 反馈的 训练模 型):用 数据对GPT-3 supervised learning 答案 样本 数据标 记团队 打分排 序,基 于这些 结果建立reward 模型 持续 迭代 InstructGPTChatGPTOpenAI 推 出,基 于GPT-3.5,对 话更即 时,增 加聊天 功能。1、参 数量:20亿;2、支 持聊天,更智 能;3、商 业化:推出ChatGPT Plus 服 务,售价20 美元/月。2022.03 2022.11ChatGPT训 练方式大小 价 格(美 元/张)1024*1024 0.020512*512 0.018256*256 0.016基础模型 价 格(美 元/千 t o k e n s)Ada 0.0004Babbage 0.0005Curie 0.0020Davinci 0.0200模型 训练价格(美元/千tokens)使用价格(美元/千tokens)Ada 0.0004 0.0016Babbage 0.0006 0.0024Curie 0.0030 0.0120Davinci 0.0300 0.1200模型 使用价格(美元/千tokens)Ada 0.0004Embedding模型(嵌入模型)图像模型语言模型Fine-tuned模型(微调模型)API 价格GPT-4OpenAI 推 出,跨 模态,输 入文本 或图像,生成 文本;对文本 处理更 加顺畅,接近 人类。1、可 跨模态,在各 种专 业和学 术基准 上表现 出人类 水平的 表现,包 括以约 前10%的分 数通 过模拟 律师考 试;2、对 代码 处 理更 成 熟;3、对 文本理 解能力 更强,伦理 问题减 弱,能 理解网 络梗图。2023.3行业深度研究 敬请参阅最后一页特别声明 8 2)海内 外企 业 AIGC 布局 突显,有望 加快 AIGC 技术进一步突破及未来应用。ChatGPT发布后,海内外多行业的企业宣布目前的相关 AI 布局或在研 产品或未来布局,高度智能化的对话引爆各企业、市场关注及讨论后,后续步伐有望加快,且 ChatGPT 的应用也逐步显现,比如在文案撰写等内容生产方面、与搜索引擎的合作、智能客服等。图表8:ChatGPT 聊天截图 来源:Open AI,新京报,国金证券研究所 图表9:海内外 ChatGPT 相关AI 布局(ChatGPT 发布后)时间 事件 2022/11/30 ChatGPT 发布 2022/12 多语言版本的 ChatGPT 推出 2023/1/24 微软官方博客宣布扩大与 OpenAI 的合作伙伴关系,追加数十亿美元的投资 2023/2/1 ChatGPT Plus 服务推出,收费为 20 美元/月。2023/2/7 百度官方微信公众号宣布将上线大模型新项目“文心一言”。2023/2/8 谷歌发布对话 AI 系统 Bard。2023/2/8 微软推出 ChatGPT 支持的必应和 Edge 浏览器。2023/2/8 据 21 财经,阿里达摩院正在研发类 ChatGPT 的对话机器人,目前已开放给公司内部员工测试。2023/2/8 据上证报,网易有道未来或将推出 ChatGPT 同源技术产品,应用场景围绕在线教育。2023/2/20 复旦发布国内首个类 ChatGPT 模型 MOSS。2023/2/24 截至 2 月24 日,澎湃新闻等媒体机构、兴业银行等银行机构、中手游等游戏公司,多个行业中多家公司宣布接入百度“文心一言”。2023/3/3 Open AI 在其官方博客宣布,公司将开放 ChatGPT 和 Whisper 的模型 API,允许第三方开发者通过 API 将 ChatGPT 或 Wisper 集成至他们的应用程序和服务中。2023/3/15 Open AI 发布 GPT-4。2023/3/16 百度新闻发布会,主题围绕文心一言。来源:wind,Open AI,财联社,上证报,21 财经,各公司官网/官方公众号,国金证券 研究所 时隔 4 个月,Open AI 推出自然语言处理能力更强 的 GPT-4。2023 年 3 月 15 日,Open AI 推出 GPT-4,相较 ChatGPT,GPT-4 可跨 模态,能输 入文 本、图像,输出 文本,且对文本、代码 的处 理都 更成 熟、顺畅,对安 全性 问题(比 如如 何制 造炸 弹等)的解 答进一步 改进,甚至 可以 成功 解读 网络 梗图,在各 种专 业和 学术 基准 上表 现出 人类 水平 的表现,对比 GPT 3.5 和 GPT 4(no vision)模型,GPT 4 在多种专业考试中的排名都更靠前,且部分考试排名在前 10%,比如模拟律师考试。行业深度研究 敬请参阅最后一页特别声明 9 图表10:GPT-4 对输入“文本+图像”形 式 内容 的解 答 图表11:GPT 3.5、GPT 4(no vision)、GPT 4 多种考试的 测 评 结果 来源:Open AIGPT-4 Technical Report,国金证券研究所 来源:Open AIGPT-4 Technical Report,国金证券研究所 图表12:GPT-4 对安全性指标的改进 来源:Open AIGPT-4 Technical Report,国金证券研究所 2.1 AIGC 可赋能游戏制作、运 营 从游戏产业链看,AIGC 对游戏制作、运营的内容生产具有变革性作用。1)对游戏制作 的赋能:从策划,到美术素材,到简单代码生成。游戏 制作 中 策划、美 术素材、代码、音效 为不 同模 态的 内容,结合 前文 AIGC 技术场景及应用现状,文本、图像、音视频生成,乃至跨模态内容的生成,均有相应的工具出现,且已有 Midjourney 等较成熟的产品。预计随技术进一步成熟,产品进一步迭代,AIGC 的赋能作用会越来越突出。2)游戏运营:AI 生成 广告 素材,实 现自 动化 广告 投放。目前抖音等平台的广告分发、内容推荐已通过算法实现,且效果较高;广告素材主要是图像及音视频内容,预计AIGC 的加持下广告素材生成会更高效、高质量。行业深度研究 敬请参阅最后一页特别声明 10 图表13:游 戏 产 业链 及 AIGC 可赋能环节 来源:国金证券研究所,注:红色字体环节为 AI 可赋能环节 图表14:游 戏 制 作领 域 AIGC 应用现状一览 来源:国金证券研究所,注:底色体现 应用 成熟度,从高到低为:深绿浅绿橙色红色(NULL)2.2 游 戏 制作 美 术环 节:原画 设计 已出 现可 投入 应用 的 AI 工具 Midjourney 等 AI 绘画工具大幅提高原画生产效率。Midjourney 是搭 载 在 Discord平台的 AI 绘画工具,可实现输入文 本,生成图像,并不断调整,已可辅助生成质量较高的 2D 角色、场景,2022 年使用 Midjourney 生成、Photoshop 人工 润色 的 太 空歌剧院获得美国科罗拉多州举办艺术博览会中的 数字艺术类别冠军。但目前Midjourney 及相关工具所生成的图片尚有不合理之处,尤其是生成人物时对“手”的处 理,目前 仍需 人工 调整 才可 用于 游戏 制作,但可 以大 大提 高生 成效 率及 减低 用工成本。游 戏 分 发渠 道文学/影 视机 构 电 信 资 源提 供 商电 信 资 源提 供 商研发发行游戏媒体广告商游戏用户游 戏 研 发商 游 戏 运 营商作品 改编 授权产品分成/代理金广告 费用自主 发行、联 运分成佣金 流水官 方 运 营商 店 第 三 方 应用 市 场超级APP 视频网站游戏门户广告 收入 分成 广告 投放营销/广告游 戏制 作策划美术素材音乐和音效代码逻辑图像和文 本素材ChatGPT原画设定(2D)MidjourneyStabled Diffusion3D 游戏3D 角色3D 场景和 物体3D 角色模 型3D 角色 动 作3D 角色表 情3D 技能持 效NVIDIA OmniverseUnreal MetahumanNVIDIA ASENVIDIA Audio2FaceUnreal MetahumanNULLphoto-to-3Dtext-to-3DChatGPT-Code-DCC3D Scan(Laser+Photos)NVIDIA Get3DHUAWEI 3D Modeling KitNVIDIA Magic3DGoogle DreamFusionChat GPTAutodest ReCap proUnreal QuixelProMAX2D 角色2D 角色设 计2D 角色 动 作2D 角色表 情2D 技能持 效MidjourneyStable DiffusionNULLNVDIA Vid2VidNULL2D 游戏2D 场景 和 物体MidjourneyStable DiffusionDALLE2Meta AudioGenGithub CopilotOpenAl Codex行业深度研究 敬请参阅最后一页特别声明 11 图表15:获奖 AI 画作 太 空歌 剧院 图表16:借助 Midjourney 生成的2D 场景图 来源:新浪财经,国金证券研究所 来源:CSDN,国金证券研究所 图表17:AI 绘 画工 具Midjourney 自 动生 成图 片 来源:Cocos 引擎视频号,国金证券研究所,注:红色圈中为部分不合理部位 2.3 2D 游戏美术环节:角色设计 较成熟,动作/特效有待发展 1)2D 角色:AIGC 成熟度从高到低为,角色模型角色表情角色动作=角色特效。角色设计较成熟,Midjourney、Stable Diffusion 等 AI 工具已可辅助快速、高质量生成 2D 素材,不过 手等 部位 需要 进行 再调 整。AI 生成角色表情应用成熟度 较 2D角色设计低。NVIDIA Vid2Vid Cameo 可捕 捉表 情,用于 简单的 虚拟形象或动画生成。动作/特效:AI 生成内容连续度、风格统一度不够,无论是 序列帧动画,还是 骨骼动画 的 方式,AI 均无法 直接 采用生成,甚至 AI 生成、人工 再打 磨的 方式 会非 常耗 费精力,目前 尚待进一步发展。但通过 Stable Diffusion 可以对 2D 真人视频风格化,直接完成动漫制作,AI 生成图像不确定导致画面抖动的问 题被较大程度解决,虽然精美程度较当前市场上的动画仍有差距,但已呈现出较强的 AI 制作动画能力。2)2D 场景和物体:成熟度低于 2D 角色 设计,但已 有 Midjourney、Stable Diffusion、DALL E2(三者均为文字生成图像)为代表的工具辅助完整的 2D 场景和物体的生成。比如输入文字,DALL E2 可以对图片进行二次加工,将不同场景图结合起来。不过,同样面临其他图像生成工具面临的问题,目前仍需人工调整、润色。行业深度研究 敬请参阅最后一页特别声明 12 图表18:NVIDIA vid2vid Cameo 捕捉真人面部表情 图表19:使用 DALL E 2 对 图片 二次 创作 来源:NVIDIA,知乎,国金证券研究所 来源:CSDN,国金证券研究所 图表20:Stable Diffusion 将 2D 视频制作成动画 来源:哔哩哔哩,Corridor digital,国金证券研究所 2.4 3D 游戏美术环节:角色 设计及表情较成熟,动作生成 在发展 中,3D 扫描生成场景及物 体 较 成熟 1)3D 角色:目前 成熟度从高到低为,角色模型=角色表情角色动作角色特效。角色模型/表情相对成熟,NVIDIA Omniverse 和 Unreal Metahuman 目前 可生 成 3D角色模型和表情,比如 NVIDIA 的 Audio2Face 功能可实现面部表情随音频变动,叠加Midjourney 等多个工具,可实现 3D 角色的表情变动。角色动作:目前较不成熟,但已出现 NVIDIA ASE 可实现 3D 角色动作,主要基于物理逻辑进行大规模训练生成,“飞天入地”等动作难实现。角色特效:目前无 AI 工具覆盖。图表21:NVIDIA Omniverse Audio2Face 功能 图表22:NVIDIA ASE 3D 角色 动作 训练 来源:NVIDIA,国金证券研究所 来源:NVIDIA,国金证券研究所 2)3D 场景和物体:4 条 实现 路径,3D 扫描目前最成熟。行业深度研究 敬请参阅最后一页特别声明 13 image 2 3D:代表性工具为 NVIDIA GET3D,根据 2D 图片生成 3D 物体和场景,但仍 较粗糙,再加工工作量较大,无法应用于游戏制

注意事项

本文(20230319_国金证券_传媒互联网产业行业深度研究:AIGC步入快车道游戏行业降本增效或超预期_20页.pdf)为本站会员(18709673099)主动上传,报告吧仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知报告吧(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642号


收起
展开