欢迎来到报告吧! | 帮助中心 分享价值,成长自我!

报告吧

换一换
首页 报告吧 > 资源分类 > PDF文档下载
 

20240221_国信证券_传播与文化行业专题:AIGC系列专题之月度回顾多模态大模型与应用快速迭代主题驱动板块投资热度回升_51页.pdf

  • 资源ID:169763       资源大小:3.61MB        全文页数:51页
  • 资源格式: PDF        下载积分:9.9金币 【人民币9.9元】
快捷下载 游客一键下载
会员登录下载
三方登录下载: 微信开放平台登录 QQ登录  
下载资源需要9.9金币 【人民币9.9元】
邮箱/手机:
温馨提示:
用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
支付说明:
本站最低充值10金币,下载本资源后余额将会存入您的账户,您可在我的个人中心查看。
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,下载共享资源
 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

20240221_国信证券_传播与文化行业专题:AIGC系列专题之月度回顾多模态大模型与应用快速迭代主题驱动板块投资热度回升_51页.pdf

请务必阅读正文之后的免责声明及其项下所有内容证券研究报告|2024年02月21日AIGC系列专题之月度回顾:多模态大模型与应用快速迭代,主题驱动板块投资热度回升行业研究 行业专题 投资评级:超配(维持评级)证券分析师:张衡021-S0980517060002证券分析师:陈瑶蓉021-S0980523100001请务必阅读正文之后的免责声明及其项下所有内容报告概要AI带动近期市场表现,Chatbot用户活跃表现良好。1)从海外看,由于OpenAI、谷歌等大模型进展迅速,美股AI近期表现较好,英伟达、META、C3等涨幅较大,海外Chatbot网页访问量稳中有升。2)从国内看,海内外AI进展迅速带动国内人工智能板块反弹,Wind人工智能指数年初至今涨12.1%,交易量也大幅增长;3)从个股维度看,年初至今人工智能板块涨幅较大的为万兴科技、昆仑万维等;传媒板块涨幅较大的有中视传媒、神州泰岳、凤凰传媒、中南传媒、姚记科技等。海内外大模型及算法持续演进,多模态成为行业热点。1)海外多模态大模型持续更新:谷歌发布Gemini1.5和视频生成模型Lumiere、Meta团队推出视频模型FlowVid和Fairy、OpenAI推出在线商店GPT Store,模型“视野”拓宽、AI生态逐步完善。2)国内大模型生态改善、多模态持续推进:商汤“书生浦语”模型开源、华为诺亚方舟实验室推出新大语言模型架构;网易有道推出子曰教育大模型 2.0、百川智能发布角色大模型。3)创新型模型持续发布:OpenAI推出文生视频模型Sora,字节跳动推出创新性视频模型Boximator。2B应用:办公、图片、视频及营销领域持续落地。1)办公方面,Meta发布AI调试工具HawkEye用于运维、AI小说生成工具Midreal更新Beta版本、科大讯飞发布数字员工产品、企业版ChatGPT已签约260家客户。2)视频方面,AI视频创作工具不断升级,Pika推出视频画面扩充功能,Runway推出运动笔刷功能。3)图片方面,图库巨头GettyImages与英伟达合作推出AI图像生成器,生成后的图像版权受到法律保护。4)营销方面,腾讯广告发布一站式AI广告创意平台。2C应用:搜索、教育、娱乐(音视频)逐步推进。1)微软上线Copilot GPTs功能、推出独立AI工具“阅读教练”、测试AI写作功能,生态逐步完善。2)搜索/电商方面,亚马逊推出能回答购物者特定商品问题的AI工具。3)教育方面,微软推出独立AI工具“阅读教练”;国内硬件与AI逐步结合,网易有道发布新一代学习机、小度推出学习机K16。4)娱乐方面,Tiktok内测AI生成歌曲功能、阿里云通义千问APP上线“通义舞王”。投资建议:关注底层技术演进及海内外应用落地映射,持续看好AIGC所带来的长周期投资机会。中长期来看,AIGC有望在降本增效的基础上重构互联网产品乃至商业形态,重点把握产品化、商业化落地关键环节核心标的:a)大模型、IP及数据:大模型及应用推荐昆仑万维,数据及IP推荐浙数文化、奥飞娱乐、光线传媒、华策影视、捷成股份、视觉中国、中国科传、阅文集团、掌趣科技等标的;b)多模态持续推进,场景落地关注AI+视频营销游戏等领域,建议关注恺英网络、三七互娱、掌趣科技、华策影视、奥飞娱乐、汤姆猫、巨人网络、蓝色光标、天娱数科、浙文互联等标的;c)结合当前当前AIGC底层技术进展,从落地角度推荐出海业务占比较高、具备良好的落地可能的网文、短剧、游戏、营销服务等领域相关上市公司(昆仑万维、汤姆猫、蓝色光标等)。风险提示:监管政策风险;宏观经济波动风险;利润不达预期风险;商誉及资产损失计提风险;新科技落地不及预期等。WUCXyRsPtQnMoQnOtOqPnMaQaO9PmOpPoMtPkPqQsQeRsQnP9PoOvNMYtQtRNZtRpR请务必阅读正文之后的免责声明及其项下所有内容总览01大模型和算法02工具&垂类应用(2B)03应用及服务(2C)04目录投资建议05请务必阅读正文之后的免责声明及其项下所有内容1.总览:AI带动近期市场表现,Chatbot用户活跃表现良好请务必阅读正文之后的免责声明及其项下所有内容海外:英伟达、META等标的涨幅较好表:海外AI相关标的情况 公司代码 公司简称 近一个月涨跌幅 市值(亿美元)PE-TTMNVDA.O 英伟达 22.1%17,935 95.0AMD.O 超威半导体-0.2%2,809 329.0INTC.O 英特尔-9.6%1,840 108.9MSFT.O 微软 1.4%30,023 36.4GOOGL.O 谷歌-4.0%17,543 23.7META.O 脸书 23.4%12,067 30.9IBM.N IBM 9.4%1,713 22.8AMZN.O 亚马逊 9.1%17,608 57.9AI.N C3 15.8%34-13.1资料来源:Wind,国信证券经济研究所整理美股AI近期表现较好,英伟达、META、C3等涨幅较大。近一个月,英伟达、META、C3涨幅较大,分别为22.1%、23.4%、15.8%,亚马逊、IBM也有接近10%的涨幅。请务必阅读正文之后的免责声明及其项下所有内容海外Chatbot访问量稳中有升,国内Chatbot访问量增长迅猛海外Chatbot访问量稳中有升。ChatGPT今年1月访问量1609百万次,环比提升4%,Character.AI 1月访问量181百万次,环比提升1%。此外,Pi、Poe、Perplexity等访问量环比稳中有升。近期国内Chatbot访问量增长迅猛。文心一言今年1月访问量1498万次,相比2023年10月增长95%;阿里通义千问访问量今年1月访问量达640万次,近一个月以来增长223%。此外,Kimi、抖音豆包近期访问量增长较快。图:海外Chatbot网页访问量(百万次)资料来源:similarweb,国信证券经济研究所整理图:国内Chatbot网页访问量(万次)资料来源:similarweb,国信证券经济研究所整理ChatGPTChatGPTChatGPT ChatGPTChatGPTChatGPTGoogle BardGoogle BardGoogle BardGoogle BardGoogle BardGoogle BardCharacter.AICharacter.AICharacter.AI Character.AICharacter.AICharacter.AI-5001,0001,5002,0002,5002023年8月 2023年9月 2023年10月 2023年11月 2023年12月 2024年1月ChatGPT Google Bard Claude Pi Poe Perplexity Character.AI文心一言文心一言文心一言文心一言文心一言文心一言讯飞星火讯飞星火讯飞星火讯飞星火讯飞星火讯飞星火-5001,0001,5002,0002,5003,0003,5002023年8月 2023年9月 2023年10月 2023年11月 2023年12月 2024年1月文心一言 阿里通义千问 讯飞星火 抖音豆包AI Kimi百度搜索AI伙伴 360智脑Chat 百川智能 昆仑万维天工AI请务必阅读正文之后的免责声明及其项下所有内容海内外AI进展迅速,带动国内人工智能板块反弹图:Wind人工智能指数行情图资料来源:Wind,国信证券经济研究所整理近期海内外科技进展迅速,带动国内人工智能反弹。Wind人工智能指数年初至今涨幅12.1%,主要由于春节期间OpenAI发布Sora、谷歌发布Gemini1.5,大模型特别是文生视频进展超出预期;同时伴随股价上涨、交易量也大幅回升。020,00040,00060,00080,000100,000120,000140,000-24.0%-14.0%-4.0%6.0%16.0%26.0%36.0%46.0%2021-02-22 2021-09-22 2022-05-05 2022-12-05 2023-07-12 2024-02-19成交金额(百万元)(右)人工智能指数请务必阅读正文之后的免责声明及其项下所有内容海内外AI进展迅速,带动国内人工智能板块反弹从个股维度来看,涨幅较大的为万兴科技(+6.8%)、昆仑万维(+2.9%)、科大讯飞(+0.3%)、江南化工(+0.3%)等;跌幅较大的为思创医惠、劲拓股份、读客文化等。表:人工智能板块个股涨跌幅前五 涨幅前十 跌幅前十序号 公司名称 年初至今涨跌幅 序号 公司名称 年初至今涨跌幅1 万兴科技 6.8%1 思创医惠-47.0%2 昆仑万维 2.9%2 劲拓股份-41.6%3 科大讯飞 0.3%3 读客文化-38.3%4 江南化工 0.2%4 天玑科技-38.2%5 浪潮信息 0.0%5 川大智胜-36.3%6-6 平治信息-36.1%7-7 安妮股份-35.5%8-8 中电兴发-35.4%9-9 科大国创-35.3%10-10 格灵深瞳-35.1%资料来源:wind,国信证券经济研究所整理 请务必阅读正文之后的免责声明及其项下所有内容传媒板块走势、ChatGPT日活及AI发展大事件一览01020304050607080400.00450.00500.00550.00600.00650.00700.00750.00800.00850.00900.002022-10-10 2022-11-10 2022-12-10 2023-01-10 2023-02-10 2023-03-10 2023-04-10 2023-05-10 2023-06-10 2023-07-10 2023-08-10 2023-09-10 2023-10-10 2023-11-10 2023-12-10 2024-01-10传媒(申万)ChatGPT日活用户合计(百万)20231222国家新闻出版署发布网络游戏管理办法(草案征求意见稿),征求意见稿包括限制游戏过度使用和高额消费等20221130OpenAI发布ChatGPT20230525算力需求带动英伟达业绩超预期20230323OpenAI推出ChatGPT插件系统20230208嵌入ChatGPT的New Bing上线20230315 OpenAI发布GPT420230316 微软发布大模型应用Copilot20230316百度发布文心一言20230227国务院印发数字中国建设整体布局规划20230410-0413阿里、商汤、知乎发布大模型20230411生成式人工智能服务管理办法(征求意见稿)发布20230417昆仑万维发布大语言模型天工20230713生成式人工智能服务管理暂行办法发布,8月15日起施行。20230920OpenAI推出新版图像生成器DALL-E 320230925ChatGPT集成语音、图像功能20231128Pika Labs推出视频生成器Pika 1.0引发关注,AI+视频领域技术发展加速20231207谷歌发布多模态大模型Gemini 1.0,性能提升加速AI应用落地20231030完蛋!我被美女包围了!Steam中国区火爆登顶,真人互动游戏及短剧引发关注20240215OpenAI发布文生视频模型Sora;Google发布Gemini 1.5,大模型能力全面升级资料来源:wind、Similarweb、公司官网,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容海外AI进展迅速,带动国内人工智能板块反弹从个股维度来看,涨幅较大的为中视传媒(+59.0%)、神州泰岳(+2.9%)、科大讯飞(+0.3%)、江南化工(+0.3%)等;跌幅较大的为龙韵股份、文投控股、电声股份、佳云科技等。表:人工智能板块个股涨跌幅前十 涨幅前十 跌幅前十 序号 公司名称 年初至今涨跌幅 序号 公司名称 年初至今涨跌幅1 中视传媒 59.0%1 龙韵股份-49.7%2 神州泰岳 27.8%2 文投控股-48.7%3 凤凰传媒 17.1%3 电声股份-42.7%4 中南传媒 17.1%4 佳云科技-40.0%5 中文传媒 13.7%5 国旅联合-38.9%6 姚记科技 13.1%6 天龙集团-38.7%7 山东出版 6.0%7 读客文化-38.3%8 恺英网络 5.7%8 卓创资讯-37.7%9 昆仑万维 2.9%9 荣信文化-37.2%10 省广集团 2.9%10 引力传媒-36.9%资料来源:wind,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容2.大模型及算法:多模态成为行业热点请务必阅读正文之后的免责声明及其项下所有内容海外:OpenAI发布Sora、谷歌发布Gemini1.5OpenAI发布文生视频模型Sora,可以根据文本生成复杂场景下1分钟的视频2月15日,OpenAI发布Sora模型,可以根据用户输入的文本描述,生成一段视频内容,视频时长可达1分钟且视觉质量较高。对于任何需要制作视频的艺术家、电影制片人或学生来说,这都带来了无限可能。Sora 可以创建包含多人、特定运动类型和详细背景的复杂场景。它能生成准确反映用户提示的视频。例如,Sora 可以制作时尚女性走在霓虹闪烁的东京街头的视频、雪地里的巨型长毛象视频,甚至是太空人冒险的电影预告片。(OpenAI官网)谷歌Gemini1.5上线,大模型“视野”被史诗级地拓宽2月15日,谷歌DeepMind首席科学家Jeff Dean,以及联创兼CEO的Demis Hassabis激动地宣布了最新一代多模态大模型Gemini 1.5系列的诞生。其中,最高可支持10,000K token超长上下文的Gemini 1.5 Pro,也是谷歌最强的MoE大模型。1.5 Pro能够一次性处理海量信息比如1小时的视频、11小时的音频、超过30,000行的代码库,或是超过700,000个单词。这意味着大模型的“视野”被史诗级地拓宽,新大模型可以深入理解海量信息、横跨不同的媒介、高效处理更长的代码、分析和掌握复杂的代码库、长篇复杂文档的推理。(新智元)图:Sora生成“雪地里的巨型长毛象”资料来源:OpenAI,国信证券经济研究所整理图:Sora生成“时尚女性走在霓虹闪烁的东京街头”资料来源:OpenAI,国信证券经济研究所整理图:谷歌Gemini1.5模型参数资料来源:谷歌,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容海外:Meta AI 视频模型密集更新Meta GenAI 团队推出 FlowVid,支持快速合成、修改视频并保持一致性来自得克萨斯大学奥斯汀分校的 Meta GenAI 团队成员,提出了一个能够保持一致性的V2V(视频到视频)合成框架FlowVid。仅需1.5分钟,就能生成一段4秒,每秒30帧、分辨率为512x512的视频。同时,FlowVid 能够无缝与现有 I2I 模型配合,支持多种修改方式,包括风格化、物体替换和局部编辑。(新智元)Meta GenAI 团队推出 Fairy,可轻松替换视频人物、改变风格1月8日报道,Meta 的 GenAI 团队推出了视频到视频综合模型“Fairy”,该模型比现有模型更快,时间上更一致。研究团队展示了 Fairy 在几个应用中的表现,包括角色/物体替换,风格化和长形式视频生成。Fairy 使用交叉帧关注机制,确保时间上的一致性和高保真度合成。该模型可以在仅 14 秒内生成大小为 512 x384 像素、120 帧(30 fps 下的 4 秒)的视频,比以前的模型至少快44 倍。但该模型目前在处理如雨、火灾或闪电等动态环境效果方面存在问题,这些效果要么无法很好地融入整个场景,要么会产生视觉错误。(站长之家)图:FlowVid 视频合成技术资料来源:AiTechYun,国信证券经济研究所整理图:FlowVid 框架核心合成能力升级资料来源:AiTechYun,国信证券经济研究所整理图:Meta 的 Fairy 模型给模特加墨镜资料来源:Meta 官网,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容海外:Meta AI 视频模型密集更新Meta 推出 audio2photoreal AI 框架Meta 1月9日公布了一项名为 audio2photoreal 的 AI 框架,该框架能够生成一系列逼真的 NPC 任务模型,并借助现有配音文件自动为任务模型“对口型”“摆动作”。(IT之家)Meta 正训练 Llama 3,将花费数十亿美元购买英伟达人工智能芯片1月19日报道,Meta 正在花费数十亿美元购买英伟达人工智能芯片。扎克伯格在周四的 Instagram Reels 帖子中表示,公司的人工智能“未来路线图”要求其建立“大规模的计算基础设施”。扎克伯格说,到 2024 年底,该基础设施将包括 35 万块来自英伟达(Nvidia)的 H100 显卡。扎克伯格没有透露公司已经购买了多少 GPU,但 H100 直到 2022 年底才上市,而且供应量有限。Raymond James 的分析师估计,Nvidia 的 H100 售价在 2.5 万至 3 万美元之间,而在 eBay 上售价可能超过 4 万美元。如果 Meta 按低端价格支付,支出将接近 90 亿美元。此外,扎克伯格表示,Meta 计划“负责任地”开源其尚未开发的“通用智能”,该公司也正在对其 Llama 系列大型语言模型采取这种做法。扎克伯格说,Meta 公司目前正在训练 Llama 3,并使其基础人工智能研究团队(FAIR)和 GenAI 研究团队更加紧密地合作。(CNBC)图:Photoreal 可以输入配音创建人物对话场景资料来源:Meta官网,国信证券经济研究所整理图:Meta将花费数亿美元购买英伟达人工智能芯片资料来源:CNBC,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容海外:AI 视频合成技术取得新突破谷歌发布视频生成模型 Lumiere,运动幅度和一致性表现良好1 月 24 日报道,谷歌发布视频生成模型 Lumiere,专门用于将文本转换为视频。Lumiere 通过在空间和关键的时间维度进行上下采样,并利用预先训练好的文本到图像扩散模型,使得该模型能够直接生成全帧率、低分辨率的视频,并且在多个空间-时间尺度上进行处理。据介绍,该模型演示视频质量非常高,运动幅度和一致性表现也很好。(站长之家)Adobe 发布 AI 视频模型 ActAnywhereAdobe 发布 AI 视频模型 ActAnywhere,可根据动作生成背景:1 月 22 日报道,HuggingFace 页面显示,Adobe 发布全新视频模型 ActAnywhere,它可以根据前景主体的运动和外观,为电影和视觉特效社区生成视频背景。ActAnywhere 模型通过引入跨帧注意力进行时间推理,将用户的创意想法快速地融入到动态的虚拟场景中。模型的训练数据集包含 240 万个包含人类与场景交互的视频,并通过自监督的方式进行训练。评估结果表明,ActAnywhere 能够生成具有高度真实感的前景与背景互动、相机运动、光影效果的视频,并能够推广到分布于训练数据之外的样本,包括非人类主体。(品玩)图:谷歌发布视频生成模型 Lumiere 资料来源:X,国信证券经济研究所整理图:ActAnywhere 根据动作生成背景资料来源:品玩,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容海外:AI 产业生态持续更新OpenAI 正推出新的嵌入模型和 API 更新1 月 26 日,OpenAI 宣布将推出两个新一代的嵌入式模型,分别为小文本嵌入模型 text-embedding-3-small 以及大文本嵌入模型 text-embedding-3-large、更新的 GPT-4 Turbo 预览模型 gpt-4-0125-preview 和审核模型、新的 API 使用管理工具,并更新 GPT-3.5 Turbo 的型号为 gpt-3.5-turbo-0125,输出价格降低 25%。(AI新智界)微软微型 LLM Phi-2 现已开源1 月 6 日报道,微软以 MIT 开源许可证发布 Phi-2。MIT 许可证允许对许可软件进行商业使用、分发、修改和私人使用。去年 12 月,微软发布 27 亿参数语言模型 Phi-2,据称,其性能与 Google Gemini Nano 2 不相上下,甚至更胜一筹。(The Decoder)资料来源:OpenAI,国信证券经济研究所整理图:OpenAI 正推出新的嵌入模型和 API 更新 图:微软 Phi-2 开发博客 资料来源:微软官网,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容海外:OpenAI推出GPT Store和Vision Pro版ChatGPTOpenAI推出Vision Pro版ChatGPT5日讯,OpenAI近日在X平台发文宣布,ChatGPT已正式登陆苹果Vision Pro,用户可以在visionOS App Store下载应用。据悉,这款应用在visionOS的显示效果与iPad版本差别不大,并没有为visionOS提供额外的风格效果。(科创板日报)OpenAI 推出在线商店 GPT Store 和新付费产品 ChatGPT Team1 月 11 日凌晨,OpenAI 宣布正式向 ChatGPT Plus、开发团队和企业用户推出 GPT Store,自发布 GPTs 两个月以来,用户已经创建了超过 300 万个 ChatGPT 自定义版本。GPT Store 汇集了用户为各种任务创建的 ChatGPT 的自定义版本,例如可以教孩子数学的聊天机器人,以及编程导师、读书指南等。OpenAI 还为团队规模较小的企业用户推出了新的付费套餐“ChatGPT Team”:套餐内每位用户按年计费时,为每月 25 美元;按月计费则为每月 30 美元。与 Enterprise 用户一样,Team 的套餐也配备数据隐私保护功能。据悉,OpenAI 已经为 ChatGPT 提供了两个付费计划,一个是面向个人用户的 ChatGPT Plus,另一个是面向大型企业的 ChatGPT Enterprise。(AI新智界)图:OpenAI 推出在线商店 GPT Store 和新付费产品 ChatGPT Team资料来源:OpenAI 官网,国信证券经济研究所整理图:OpenAI推出Vision Pro版ChatGPT资料来源:IT之家,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容海外:AI 语音识别和文生模型不断创新英伟达推出 AI 语音识别模型 Parakeet1 月 8 日报道,开源对话 AI 工具包 NVIDIA NeMo 宣布推出 Parakeet ASR 模型系列,这是一系列最先进的自动语音识别(ASR)模型,能够以出色的准确性转录英语口语。英伟达宣布推出了四个 Parakeet 模型,这些模型基于 RNN Transducer/Connectionist Temporal Classification 解码器,并且具有 0.6-1.1 亿参数。它们能够应对各种音频环境,并且在仅使用了 64000 小时的数据集进行训练后,在基准数据集上实现了出色的词错误率(WER)表现,优于以往的模型。根据开发人员的说法,这些模型对音乐和静音等非语音片段具有鲁棒性,并且在基准测试中优于 OpenAI 的 Whisper v3。它们还通过预先训练的控制点提供用户友好的集成到项目中。(站长之家)Hugging Face 开发 8 亿参数文生成图模型 aMUSEd1 月 5 日报道,Hugging Face 团队正试图通过一款名为 aMUSEd 的新模型加快速度,该模型可以在短短几秒钟内生成图像,比其他竞争对手如 Stable Diffusion 更快。这款轻量级的文本到图像模型基于谷歌的 MUSE 模型,参数规模约为 8 亿。aMUSEd 可以部署在移动设备等设备上。它的速度来自于它的构建方式。aMUSEd 采用了一种称为 Masked Image Model(MIM)的架构,而不是 Stable Diffusion 和其他图像生成模型中的潜在扩散。Hugging Face 团队表示,MIM 减少了推理步骤,从而提高了模型的生成速度和可解释性。而且它的小尺寸也使得它运行速度很快。(站长之家)图:Parakeet RNNT 1.1B(en)-NVIDIA自动语音识别模型信息页面资料来源:Hugging Face,国信证券经济研究所整理图:aMUSEd 使用界面资料来源:Hugging Face,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容海外:Stability AI 推出新模型Stability AI 发布编程模型 Stable Code 3B1 月 17 日,Stability AI 发布其 2024 年的第一个新 AI 模型可商业授权的 Stable Code 3B。据悉,这是一个拥有 30 亿参数的模型,主要用于软件开发的代码自动补全功能,可在没有专用 GPU 的笔记本电脑上本地运行,同时还能提供与 Meta 的 CodeLLaMA 7B 等大型模型相比具有竞争力的性能和功能。Stability AI 声称,Stable Code 3B 在多种语言的基准测试中表现出了领先的性能。该模型涵盖 Python、Java、JavaScript、Go、Ruby 和 C+等流行语言。早期的基准测试表明,它的完成质量可以媲美甚至超过两倍于它的模型。(VentureBeat)Stability AI 推出 Stable LM 2 1.6B 模型1 月 19 日,Stability AI 发布了其最小的模型之一 Stable LM 2 1.6 B,是其继本周早些时候推出 Stable Code 3 B 之后,在 2024 年发布的第二个模型。根据 Stability AI 的说法,该模型在大多数基准测试中都优于其他参数低于 20 亿的小型语言模型,包括微软的 Phi-2(2.7B)、TinyLlama 1.1B 和 Falcon 1B。新的小型 Stable LM 甚至能够超越一些大型模型,包括 Stability AI 自己早期的 Stable LM 3B 模型。(VentureBeat)资料来源:Stability AI,国信证券经济研究所整理 资料来源:Stability AI,国信证券经济研究所整理资料来源:Stability AI 编程模型 Stable Code 3B 资料来源:Stability AI Stable LM 2 1.6B 模型请务必阅读正文之后的免责声明及其项下所有内容国内:AI 大模型持续推进商汤“书生浦语”2.0 大语言模型开源1 月 17 日报道,商汤科技与上海 AI 实验室联合香港中文大学和复旦大学今日发布了新一代大语言模型书生浦语 2.0(InternLM2)。据介绍,InternLM2 是在 2.6 万亿 token 的语料上训练得到的。沿袭第一代书生浦语(InternLM)设定,InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本,继续开源,提供免费商用授权。目前,浦语背后的数据清洗过滤技术已经历三轮迭代升级,号称仅使用约 60%的训练数据即可达到使用第二代数据训练 1T tokens 的性能表现。据介绍,通过拓展训练窗口大小和位置编码改进,InternLM2 支持 20 万 tokens 的上下文,能够一次性接受并处理约 30 万汉字(约五六百页的文档)的输入内容。InternLM2 在 20B 参数的中等规模上,整体表现接近 ChatGPT。(IT之家)华为诺亚方舟实验室等联合推出新型大语言模型架构盘古-1 月 2 日报道,华为诺亚方舟实验室等联合推出新型大语言模型架构:盘古-。通过增强非线性,该架构在传统 Transformer 上做出改进,由此可以显著降低特征塌陷问题,模型输出表达能力更强。据悉,在使用相同数据训练的情况下,盘古-(7B)在多任务上超越 LLaMA 2 等同规模大模型,并能实现 10%的推理加速。在 1B 规模上可达 SOTA。同时华为还基于这一架构炼出了一个金融法律大模型“云山”。该工作由 AI 大牛陶大程领衔。(量子位)资料来源:商汤科技SenseTime微信公众号,国信证券经济研究所整理图:商汤“书生浦语”2.0 大语言模型开源 图:华为诺亚方舟实验室等联合推出新型大语言模型架构盘古-资料来源:GitHub,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容国内:AI 大模型持续推进元象开源大模型 XVERSE-Long-256K1 月 16 日消息,元象发布了全球首个上下文窗口长度为 256K 的开源大模型 XVERSE-Long-256 K,支持输入 25 万汉字,无条件免费商用。(站长之家)MiniMax 国内首个 MoE 大语言模型 abab6 全量上线今天,MiniMax全量发布大语言模型abab6,为国内首个MoE大语言模型。在MoE结构下,abab6拥有大参数带来的处理复杂任务的能力,同时模型在单位时间内能够训练足够多的数据,计算效率也可以得到大幅提升。(MiniMax 开放平台)资料来源:51CTO,国信证券经济研究所整理图:元象开源大模型 XVERSE-Long-256K 图:MiniMax 国内首个MoE大语言模型 abab6 全量上线资料来源:MiniMax 开放平台微信公众号,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容国内:AI 大模型持续推进面壁智能联合清华发布大模型智能体 GitAgent1 月 15 日报道,面壁智能联合清华大学自然语言处理实验室发布了 GitAgent,这是一种可以自主扩展工具箱的大模型智能体应用框架。通过 GitAgent,大模型智能体可以从 GitHub 上扩展工具集合,以应对复杂任务需求。GitAgent 的工具箱扩充过程包括搜索、配置、应用和存储四个阶段。在搜索阶段,GitAgent 会在 GitHub 上搜索适合用户需求的仓库,并判断仓库是否能用来解决问题。在配置阶段,GitAgent 会根据仓库的 README 文件执行配置命令,还可以通过学习人类经验来解决问题。在应用阶段,GitAgent 使用配置好的仓库来解决用户需求,如果仓库没有清晰的使用入口,GitAgent 还可以通过学习人类经验来解决问题。在存储阶段,GitAgent 将配置好的仓库及其执行环境存储下来,以便未来使用。(站长之家)智谱 AI 推出新一代基座大模型 GLM-41 月 16 日,智谱 AI 发布新一代基座大模型 GLM-4。据智谱 AI CEO 张鹏介绍,GLM-4 的整体性能相比上一代大幅提升,逼近 GPT-4。具体表现上,GLM-4 可以支持 128 k 的上下文窗口长度,单次提示词可以处理的文本可以达到 300 页。同时在多模态能力方面,文生图和多模态理解都得到了增强。除此之外,GLM-4 还提升了智能体能力,可以根据用户意图,进行自动理解和规划复杂指令,也能自由调用网页浏览器。据了解,此次 GLM-4 的发布及上线,是智谱 AI 大模型研发上的一则关键突破。(界面新闻)资料来源:面壁智能官网,国信证券经济研究所整理图:大模型智能体 GitAgent图:SD 社区图生视频插件 I2V-Adapter资料来源:X,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容国内:AI 大模型持续推进澜舟科技孟子大模型开放公众服务1 月 26 日消息,近日,澜舟科技孟子 GPT 大模型正式通过网信办生成式人工智能备案,现正式面向公众开放服务。本次对外开放将上线四款大模型产品,分别是孟子大模型-轻量、孟子大模型-标准、孟子大模型-金融和孟子大模型-编程。(站长之家)猎户星空大模型发布1 月 21 日报道,在 2024傅盛的开年 AI 大课暨猎户星空企业应用大模型发布会上,猎豹移动董事长兼 CEO、猎户星空董事长傅盛宣布猎户星空大模型发布,专为企业应用而生。据介绍,猎户星空大模型通过 140 亿参数实现了千亿参数大模型才能实现的效果,面向素质教育等七大应用领域进行微调,且可以在千元显卡算力上运行。(新浪科技)资料来源:澜舟科技官网,国信证券经济研究所整理图:澜舟科技孟子大模型 图:猎户星空大模型资料来源:猎户星空官网,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容国内:多模态大模型陆续发布腾讯推出视频生成模型 VideoCrafter21 月 19 日报道,腾讯 AI 实验室团队开发了视频生成模型 VideoCrafter2,旨在克服数据限制,提供高质量的视频扩散模型。VideoCrafter2 是一个视频处理工具,致力于提高视频的视觉质量、动态效果以及概念组合。通过独特的算法和先进的技术,VideoCrafter2 能够生成精美影片。(站长之家)网易有道推出子曰教育大模型 2.01 月 3 日,网易有道在北京举行子曰教育大模型创新成果发布会,正式推出子曰教育大模型 2.0,上下文窗口扩大到 16 K,同时还发布了基于大模型研发的三大创新应用及一款智能硬件新品:AI 家庭教师“小 P 老师”,有道速读,虚拟人口语私教 Hi Echo2.0,以及有道 AI 学习机 X20。此外,网易有道还宣布将开源基于子曰教育大模型自研的 RAG 引擎“QAnything”,以便与开发者社区共享技术成果。(中国新闻网)资料来源:AIGC学院,国信证券经济研究所整理图:网易有道推出子曰教育大模型 2.0资料来源:AIbase,国信证券经济研究所整理图:VideoCrafter2请务必阅读正文之后的免责声明及其项下所有内容国内:多模态大模型陆续发布国内首个视频大模型新壹视频大模型通过备案1 月 18 日,新壹科技推出的国内首款聚焦视频领域生成式人工智能(大语言模型)新壹视频大模型,通过了生成式人工智能服务管理暂行办法备案,全面向社会开放服务。新壹科技是国内领先的网络视频应用和 AIGC 技术服务商。凭借领先的视频场景识别、文本理解技术,实现高效的 AI 视频生成、AI 数字人服务,并致力于为用户和企业提供基于 AI 视频大模型的全栈式 AIGC 解决方案。新壹视频大模型发布于 2023 年 7 月 27 日,现已具备从视频脚本生成、素材匹配原生 AI 视频生成、声音克隆、智能剪辑到数字人播报的全流程 AI 视频生产能力,是目前国内首款聚焦视频领域的人工智能大模型。(AI新智界)通义千问视觉理解模型 Qwen-VL 升级推出 Max 版本1 月 25 日报道,阿里云公布多模态大模型研究进展。通义千问视觉理解模型 Qwen-VL 再次升级,继 Plus 版本之后,再次推出 Max 版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩。(36氪)资料来源:新壹科技官网,国信证券经济研究所整理图:新壹视频大模型 图:通义千问视觉理解模型 Qwen-VL 版本一览资料来源:36氪,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容国内:多模态大模型陆续发布华科阿里等联合打造 TF-T2V 视频方案1 月 7 日报道,与图片生成相比,视频生成仍存在巨大挑战。首先,视频生成需要处理更高维度的数据,考虑额外时间维度带来的时序建模问题,因此需要更多的视频-文本对数据来驱动时序动态的学习。然而,对视频进行准确的时序标注非常昂贵。这限制了视频-文本数据集的规模,如现有 WebVid10M 视频数据集包含10.7M 视频-文本对,与 LAION-5B 图片数据集在数据规模上相差甚远,严重制约了视频生成模型规模化的扩展。为解决上述问题,华中科技大学、阿里巴巴集团、浙江大学和蚂蚁集团联合研究团队于近期发布了TF-T2V视频方案。该方案另辟蹊径,提出了基于大规模无文

注意事项

本文(20240221_国信证券_传播与文化行业专题:AIGC系列专题之月度回顾多模态大模型与应用快速迭代主题驱动板块投资热度回升_51页.pdf)为本站会员(18709673099)主动上传,报告吧仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知报告吧(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2022 报告吧 版权所有
经营许可证编号:宁ICP备17002310号 | 增值电信业务经营许可证编号:宁B2-20200018  | 宁公网安备64010602000642号


收起
展开