2018-2019内容交互技术应用型公司分析报告.pptx
,2018-2019内容交互技术应用型公司分析报告,2. 交互视频应用代表公司3. 交互语音及其技术,4. 交互语音应用代表公司,CONTENTS 1. 交互视频及其技术,交互视频及其技术,什么是“交互视频”, 交互视频即让用户真正和视频互动起来,用户在观看到视频的某个节点时,可以选择不同的路线甚至是不同的结局,让视频由单故事线变成有开放式结局的多故事线。, 以任意剧集为基础,按照故事情节进展可划分为出若干个节点,每个节点用户可以选择不同走向的片段4,“交互视频”的分类:定制式,5, 视频本质上仍是线性的;, 允许用户在观看时调整一些视频的变量元素,使得每个人看到的视频都一样,又都不一样。最基础的体验是在视频观看时,鼠标移动到某物体上能显示该物体信息的tag,通过tag可进入对这一物体更深入内容(背景)的说明/介绍;, 最常用的场景是在广告视频中,实现用户的“边看边买”。此外在新闻报道、教育培训等非剧情性视频中也较常使用,“交互视频”的分类:会话式,6, 视频真正突破线性限制,多线程发展;, 用户以类似会话的方式直接参与改变视频的顺序甚至结果,视频的设计者准备好多个结局和段落,让观看者自行选择, 更多应用于影视剧、游戏、动画等具有强剧情,的内容产品中,“交互视频”在国外的应用,7,2010年开始,欧美公司就开始交互视频技术的研发和应用探索,至今这项技术已成为较成熟应用截止目前,欧美至少已有10多家专门提供交互视频制作工具和技术应用平台的公司,YouTube这样的大型视频平台已内嵌交互视频制作工具供内容生产者制作初级互动视频,“交互视频”的技术发展交互视频技术的发展, 主要实现的都是短小的可点击型互动视频(ClickableVideo),用于商业营销方向:当播放视频时,鼠标光标放在或单击画面的特定位置(特定人物、物件等)时,将弹出与该事物相关的信息,或是引导观众做选择互动的新的内容等。观众无需暂停视频便可以得到自己想要的相关信息 视频交互场景从网页端向移动端迁移,Flash2005年,H52014年, 视频识别技术,加上一套互动工具所构成的互动体系 初级IVA是依据音视频样本库标记视频流中与样本库匹配的视频片段,比如从视频流中识别广告时段和广告主、识别节目片头、根据录音识别用户正在观看的节目等 中级IVA则能够利用图像处理技术、大数据技术和深度学习技术,识别视频流中的场景、形状、纹理和人物等 高级IVA是识别音视频对受众的感性刺激和情绪影响,比如识别一部电影中的泪点、笑点等,IVA(In Video Action)2011年, 核心是视觉捕捉与即时成像,在摄像头摄录视频信号之后,会实时分析找出视频中“特殊识别符”,并实时捕捉该特殊符号的变化,实时渲染与“特殊识别符”对应的视频。 最主要功能之一就是脸部跟踪识别,即根据摄像头中人脸的位置,实时渲染画面元素,并随着脸部移动而移动。 互动视频起到了现实环境与虚构世界的桥梁作用8,AR2017年,“交互视频”的核心技术原理,9,目标跟踪与检测技术, 实现交互式视频技术的另一大基础, 难点在于众多因素干扰因素对目标跟踪算法产生不利影响;多数视觉应用要求具备实时性能;目标跟踪算法要能发现错误,并及时更正错误, 基于在线学习的长时目标跟踪算法是主要解决方案,积分图, 减少某些视觉特征计算量, 处理大数据集的算法,随机森林, 将空间上相关、内容上相关的镜头聚合起来成一个视频场,景,而不考虑时间的连续性 难度在于要获取视频目标在每一帧中的区域坐标数据, 实现交互视频的一大基础,视频场景分割,交互视频应用代表公司,“交互视频”应用代表公司:Wirewax 2010年在伦敦成立,“全球第一个制作互动视频的平台”,用户只要上传视频,就可以在内容上添加用户可互动的热点按钮或者标签。 2011年获得英国投资机构Passion Capital的投资 主要应用领域是广告和电商,其次在教育、新闻、影视宣传等领域,产品性广告电商,服务性广告电商,影视剧 宣传片介绍性节目 2018年获得英国“年度技术公司”大奖11,12, 用户可以在不同的视频之间来回滑动切换、或是在不同的摄影机视角中来回切换,“交互视频”应用代表公司:Wirewax主要的互动方式热点互动 视频中可互动的人或物上显示出“热点”,用户点击、触碰热点就能与视频形成互动分支视频 在视频中设置决策点,用户可在决策点上选择不同的观看内容360度全景视频 2016年wirewax和US TV Network合作,推出了全球第一支360度全景互动视频。用户可将视频中的人或物360度移动,从而与之形成互动多视频流,“交互视频”应用代表公司:Wirewax,13, Wirewax Studio提供一整套交互,视频的解决方案:, 用户借助技术工具制作编辑交互,视频;, 制作完成后全网一键分发; 跟踪测量视频的发行播出效果,“交互视频”应用代表公司:Wirewax,14,分析界面:,制作界面: 视频制作完成之后,可在平台上进行全球分发(社交, 用户上传视频以后,系统可自动识别视频中出现的不同人脸、 媒体、垂直网站等),物体,并打上“热点”标签,提示可以在此处加上互动内容; 对视频在各渠道的播出效果进行实时分析(包含120 系统可以自动生成63种不同语言的字幕 项数据指标),帮助了解用户对视频的收看行为,“交互视频”应用代表公司:Wirewax,15, 根据不同功能模块进行收费,提供按月收费和按年收费两种模式,基础功能月费59美元,企业级功能月费,2000美元。此外,还可根据项目需求定制收费,5000美元起价,“交互视频”应用代表公司:Verse,16, 成立于2014年的美国交互视频技术应用公司,创始人是两个资深记者,创办Verse的初衷是让内容生产者能用更有效率和更具吸引力的方式来讲述故事, 主要应用场景在新闻、科教、纪录片之类的纪实性内,容,其次在广告电商行业的应用,“交互视频”应用代表公司:Verse,17,案例1:华盛顿邮报新闻节目:特朗普VS希拉里(选民的声音)案例2:NASA科普节目,案例3:大西洋月刊的新闻纪实性节目案例:4:时尚节目(边看边买), 华盛顿邮报大西洋月刊新闻周刊纽约客等众多媒体都采用Verse的技,术平台生产交互式新闻报道,为新闻视频增加更强的互动色彩,“交互视频”应用代表公司:Verse,18, 制作后台:制作、分发视频及分析,收看效果, 设置视频互动点;可添加图片文字等幻灯片式内容、对互动点的内容进行深度解释(原因、背景、相关内容);不同的内容推进路径;最后形成的是一个完整的故事章节时间线,“交互视频”应用代表公司:Verse,19, 根据不同功能模块进行收费,提供按月收费和按年收费两种模式,专业版月费25美元(除了交互视频之外,,360度全景视频和竖屏视频的改造也是最基础的功能模块),“交互视频”应用代表公司:Eko2010年Eko在以色列成立, 是一家互动视频新媒体运营商,致力于探索互联网环境下内容运营形态、互动节目形态和互动营销形态,成立之初主要对音乐视频、广告以及营销性内容进行交互改造。2014年开始,逐步把应用场景的重点转向影视娱乐内容,Theme color makes PPT more convenient to change.,Adjust the spacing to adapt to Chinese typesetting, usethe reference line in PPT.Eko已获得与其交互系统相关的15项专利的批准,还有超过15项专利正在等待审批20, 南希特勒姆:执行,董事长兼首席媒体官,前派拉蒙电视娱乐集团,总裁,前微软娱乐工作,室总裁,“交互视频”应用代表公司:Eko 已获得索尼影业、红杉、英特尔、米高梅、三星、WPP、华纳音乐等一系列明星投资人的总计近7000万美元的投资, Tal Zubalsky:联合创始人兼首席产品官尤尼之前组建的乐队成员之一,同时也是计算机工程师,曾在2家科技创业公司担任创始合伙人,负责监督众多国际网络项目的设计和开发21, 尤尼 布罗齐:联合创始人兼CEO以色列音乐家,同时还是计算机工程师。在以色列已经发行三张唱片,担任过以色列版“American Idol”的评委技术+娱乐跨界团队,“交互视频”应用代表公司:Eko 与沃尔玛成立合资公司W*E,以开发尖端娱乐和广告内容。,沃尔玛将在合资公司中投入2.5亿美元,同时还计划向Eko进行下一轮投资 新的合资公司将基于Eko的交互式视频技术为沃尔玛网站及公司旗下Vudu流媒体平台独家开发一系列内容,与亚马逊竞争,其中一些内容可能是品牌娱乐和广告导向,还有一些可能是纯娱乐内容。例如观众可以在观看时在线购买所需要食材的厨艺秀等。除导流外,观众的每个选择也可以帮助沃尔玛了解观众的喜好和态度 Eko的CEO尤尼 布罗齐将担任W*E Interactive Ventures的CEO,好莱坞知名制片人简罗森塔尔将担任战略顾问 “在沃尔玛庞大的平台上测试概念和技术特性的潜力,是与这家全球最大零售商合作的吸引力之一” 。此外,沃尔玛的投资还允许Eko继续从事与沃尔玛无关的项目。22,01020304,Unified fonts make reading more fluent.Theme color makes PPT more convenient to change.Adjust the spacing to adapt to Chinese typesetting, use the referenceline in PPT.,studio,“交互视频”应用代表公司:Eko视频互动技术提供商及平台(2010-2016),012010-2013年初Eko主要作为技术服务方为内容生产者提供视频互动的解决方案,客户包括:广告商、品牌主、影视生产者/机构以及唱片公司等,022013年底-2014开发出一套制作编辑视频交互的技术工具可供内容生产者、广告商付费使用,自己生产并分发交互视频。2014年开始将影视作为技术主要的应用方向,032015年开始和好莱坞各大制片公司开展合作,包括CBS、米高梅、索尼、时代华纳等,042016年专门针对影视娱乐内容,开发出一整套交互视频制作(从剧本创作开始直到具体拍摄和最后剪辑)的操作手册和系统平台eko23,2017年至今,“交互视频”应用代表公司:Eko2017年开始Eko将自己为其他内容生产者提供交互技术的生产的部分视频内容(包括音乐、动画、影视剧等)发布在自有内容平台,facebook和自有APP eko上互动视频内容生产商及播放平台,2017年开始Eko还自己原创交互性视频,包括2017年底与索尼共同创作的交互喜剧 That Moment When;2018年3月出品悬疑剧集#战争游戏2018年开始Eko与知名KOL、内容生产者达成协议,免费给他们提供交互模板制作娱乐内容,要求制作完成的内容在Eko自有平台播出24,“交互视频”应用代表公司:Eko,25,纯交互视频广告,在交互性的剧情内容中植入广告/中插广告,“交互视频”应用代表公司:Eko,针对开发者(懂技术)的工具平台(可编程),针对内容生产者(不懂技术)的工具平台(模块化拖拽)26,“交互视频”应用代表公司:Eko,27, 详细的gudieline指导内容生产者如何制作交互剧的剧本、如何拍摄视频、如何剪辑、如何设计用户界面等,大纲范例,剧本范例,“交互视频”应用代表公司:Eko,28,设计范例,“交互视频”应用代表公司:Eko,29,HBO在“交互视频”上的应用,30, 索德伯格和HBO联手打造的互动剧集马赛克(索德伯格一人包办导演、编剧、制片和摄影。莎朗斯通主演),2018年1月播出, 除了电视及流媒体播放的常规模式,还开发了同名App,,提供了总共6个视角的故事,31,HBO在“交互视频”上的应用通过两种截然不同的形式观看: 传统电视剧的形式,一共六集,传统线性叙事(导演剪辑版)。播出平台是HBO的电视频道和流媒体点播平台。 App的形式,采取了树状的故事结构,共分15个章节,每一章节相当于一集短剧,从20分钟到30分钟不等。整个App里差不多有七个半小时的视频素材(用户互动版) 观众需在苹果、谷歌应用商店下载App后观看,只针对美国地区IP地址的观众。,宣传片1,宣传片2,宣传片3,Netflix在“交互视频”上的应用,32, 2017年6月,Netflix尝试播出第一部互动剧Puss in Book: Trapped in an Epic Tale ( Netflix认为儿童剧是启动观众节目互动的最佳领域),视频在播放时共有十几个剧情决策点,用户可以使用智能电视机、手机设备等,自行选择剧情的分支,以左右最后结局的走向,Netflix在“交互视频”上的应用,33, 2018年10月,Bloomberg报道Netflix正在开发一系列的特别节目,以支持用户选择电视剧或电影的结局。首先会在今年底上映的科幻美剧黑镜(Black Mirror)第五季中,推出一集互动剧,这也是第一个为成年观众设计的“互动剧” 。此外,Netflix还在和更多的剧组谈判以推动“互动影视剧”的拍摄,Facebook加码“交互视频”, 2018年8月,Facebook收购来自犹他州的小型创企Vidpresso(7人团队)Videpresso 是一家专门为电视广播公司与线上视频创作者提供互动元素工具的公司。用户可以在社交平台上的视频或直播中加入实时投票、评论、图片互动等功能,且这些功能与主流网站 Facebook、YouTube、Periscope 等均可兼容 目前的客户中包括了 Nasdaq、TED、NBC、华盛顿邮报、路透社、BuzzFeed、特纳广播集团旗下的 Turner Sports等大型视频内容提供商 加入 Facebook后,将为 Facebook 上大批视频创作者提供互动性工具,让他们更加专注于优质内容的产出,实现平台内容质量的整体提升34,01020304,Unified fonts make reading more fluent.Theme color makes PPT more convenient to change.Adjust the spacing to adapt to Chinese typesetting, use the referenceline in PPT.,010203, 2014年成立于上海,让视频平台实现在视频中的购物,百科,虚拟植入,卡牌互动,投票,发红包等互动功能,为观众提供新型的互动体验 2015年1月完成900万天使轮融资; 2015年5月完成数千万A轮融资 2017年7月完成云峰基金,阿里巴巴的1.49亿人民币B轮融资 2018年4月完成阿里巴巴、旷视科技领投,云锋基金、国投创业、头头是道跟投的3.49亿人民币C轮融资 2018年9月完成天狼星资本、新华文轩、文轩资本、瑞力投资、汉富控股的C+轮融资 将继续聚焦AI科技打造新文娱经济体战略。一方面,在自研的文娱人工智能系统“VideoAI”与视频互动操作系统“VideoOS”的基础上赋能AI产品线的深度和广度;另一方面,合作更多的品牌及电商放大商业变现,并以自制新商业IP和赋能传统内容的方式实现新文娱经济的万亿产业升级。”35,国内交互视频技术应用代表公司:Video+(极链科技) AI视频服务提供商,专注于为消费级视频大,流量场景、互联网视频平台提供视频互动操作系统、视频电商整体解决方案及视频搜索技术,以视觉识别和大数据为基础, 实现广告自动投放和电商自动投放,高,大幅减少人工审核,国内交互视频技术应用代表公司:Video+(极链科技),Video Data视频内的大数据应用系统全面监测视频互动数据支持实时数据 / 用户分析,Video AI视频AI应用系统以视觉识别为基础的视频结构化数据平台已实现场景、物体、人脸、品牌、表情、动作、地标、视觉特征检索8大维度的数据结构化,同步生成轨迹流数据,ASMP视频AI情景营销平台利用VideoAI积累的视频内容标签在视频与广告间进行复合双向匹配,在用户对广告品牌文化接受度最高的节点推送内容关联广告进行品牌曝光,提升用户体验,进而改善广告效果,Video OS点播视频内的应用系统点播视频智能互动操作系统提供视频内互动应用即刻变现PC Android iOS OTT,ACAPAI内容审核平台对视频中的图像进行检测,及时发现涉黄、政治敏感等风险内容同时支持自定义视频黑库,识别准确率36,国内交互视频技术应用代表公司:Video+(极链科技),37,潜伏归来,38,潜伏归来创新性真人互动影视APP(橙光授权改编新作),交互语音及其技术,1,2,3,4,5,语音识别 ASRAutomaTIc Speech RecogniTIon自动语音识别,是一种通过声学模型和语言模型,将人的语音识别为文本的技术,对话式交互的流程和关键技术语义理解 NLU,Natural Language Understand自然语言理解,是 NLP(Natural Language Processing,自然语言处理)的一个子集,专注于“口语表达和对话”方向的自然语言处理 分词:将汉字序列切分成词序列 词性标注:识别词的词性(名词、形容词、动词等),来确定其在上下文中的作用, 命名实体识别:在句子中定位并识别人名、地名、机构名、数字、日期等实体 文本分类:将一篇文档归入预定义类别中的一个或几个情感分析:找出说话者或文本作者对某个话题的两极性观点,(积极或消极)、情绪(高兴、悲伤、喜欢、厌恶等)。,对话生成 NLGNLG(Natural Language Generation)自然语言生成,即对话生成的技术。 对于任务导向的对话来说,NLG 基本以模板形式来实现。模板中的回复信息可由词槽,或通过内容服务得到的数据来替换。 对话生成的原则是符合自然语言交互的习惯,易于用户理解,最快完成对话。,对话管理 DMDM(Dialog Management)对话管理,是对话式交互系统的核心,负责控制整个对话过程。 对话上下文(Dialog Context):记录对话的领域、意图和词槽数据,每个领域可能包含多个意图的数据, 一般以队列的形式存储。对话状态跟踪:每轮对话开始后,会结合本轮对话提供的语义信息和上下文数据,确定当前对话状态,同时会补全或替换词槽。对话策略:根据对话状态和具体任务决定要执行什么动作,比如,进一步询问用户以获得更多的信息、调用内容服务等,语音合成 TTSTTS(Text To Speech)语音合成技术:对话系统的输出是文本形式的 NLG 或者指令,当对话返回的内容是 NLG 时,通过 TTS 技术能将这些文本转换成流畅的语音,播放给用户。 TTS 技术提供语速、音调、音量、音频码率上的控制 40,41,对话式交互产品分类当下的对话式交互产品,主要分两类,在开放域聊天中,准确理解用户的话并给出正确答案的难度很大开放域聊天更像是一个信息检索系统,基于已有知识库,为用户的输入匹配到一个答案重点和难点在于构造一个完善的知识库,以微软小冰为代表的开放域(Open Domain)对话系统,任务导向的对话系统旨在帮助用户完成特定领域的任务,比如”查询天气“、“订酒店”领域特定的对话系统的最大优势是实现起来相对有效并且易于产品化。,以亚马逊 Alex 为代表的任务导向(Task Oriented)对话系统,对话式交互产品设计步骤,1,24,3,选择正确的用户场景,提供优质对话体验,创建符合当前场景的对话风格和形象进行测试,编写对话,技术算法+内容策划42,交互语音应用代表公司,“交互语音”应用代表公司:Xandra,44,2016年由曾任职于英国国防部的工程师扎克 约翰逊创立,他将Xandra定位为一家“智能对话设计工作室”,致力于嫁接好莱坞内容公司和硅谷科技巨头,设计出最为智能的剧情沉浸式语音体验。(内容和科技的嫁接、融合),公司的主要业务是结合媒介内容本身(影视、游戏等),与智能家居设备实现较完整的语音交互:为科技赋能的服务提供对话设计,使之便捷、人性化,助力产品规模化,为人工智能AI做用户体验,目前已与HBO、尼克罗迪恩、AT&T, 亚马逊等进行合作,为它们提供剧情沉浸式的AI语音互动内容,“交互语音”应用代表公司:Xandra,45,主要业务,Xandra的业务内容主要包含角色设计、对话设计、音频设计、对话咨询:即结合提前固定的话术、定制的语音和AI人工智能,设计出混合的对话,核心特点,擅于创造叙事体验,推动技术构建语境,为各种智能语音设备、应用提供内容,提升设备、应用与用户的的语音互动体验:, 没有以技术为壁垒,采用内容创意人才和技术人才并行的工作模式,由技术人员为系统堆积大量的语料,构建算法,实现多轮对话,创意人员完善内容体验。, 公司的团队构架中,技术人员和内容创意人员基本,是1:1的比例,“交互语音”应用代表公司:Xandra,46,Xandra设计的语音交互内容包括向语音导览询问关键人物情况,也可询问剧中原有的“重复演绎”的剧情设定,语音导览同样会反向问玩家问题,作为通关测试。整体的故事框架依照原版,由Xandra的编剧对游戏中的剧情和问答进行设计。用户可以在任何搭载 Alexa 语音助手的设备上,通过“Alexa,打开西部世界” 语音指令启动游戏。,Xandra参与游戏开发、配音和定制音效,HBO与亚马逊联合推出;用户可与智能音响Amazon Echo就西部世界内容剧情、线索进行长达两小时的对话,好莱坞各大媒体评价为“迄今为止好莱坞在智能音箱上显露出来的最大野心”,西部世界:迷宫Alexa语音游戏,游戏以西部世界的剧情为基础线索,共设置了 60 多条故事线和 400多个不同的选择,一条故事线玩完大概 20 分钟左右。除了玩家与Alexa进行互动外,同时在游戏中,不同的玩家之间也还能进行互动。整个设计开发到测试的周期大概在12周左右时间。但玩家只能用指定的词或句子来与 Alexa 进行互动,游戏基本架构,“交互语音”应用代表公司:Xandra,47,行业痛点:智能硬件/应用与用户(人)之间的增强/沉浸式互动体验,“有了像 Alexa 和 Google Home 那样的聊天机器人和语音助手,与电脑对话变得不再稀奇。这里的挑战是如何使语音交互因人而异,使人机交互更加亲密。”,“那些在语音体验领域已经领先的公司为保存和留住用户,正在抓紧机会根据目标听众调整他们的语音机器人的性格。在信息平台上,为语音机器人设计性格,以便和消费者对话和互动变得至关重要。这些真实的体验不是由工程师,而是由作家和设计师牵头的,他们通过讲故事的方式,使科技更加贴近人们。”,48,技术应用型公司的路径聚焦深挖垂直行业/场景,行业理解,技术能力,垂直细分行业应用(解决方案),垂直细分行业平台(基础设施),跨界团队,细颗粒度,Thanks,2018-11,