本报记者 李静 北京报道
每当AI技术有重大突破之时,人们在感叹技术发展之快的同时,也在担心被AI替代的问题。
近期,美国人工智能公司OpenAI发布了旗下首款文生视频模型Sora,再次引发世界关注。按照OpenAI的介绍,Sora可根据文本指令创建近似现实且富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。该模型还能够根据静态图像生成视频,或对现有视频进行扩展或填充缺失的帧。
“听说Sora的出现,其实有紧张和焦虑的情绪。”刘润对记者坦言。她是北京快道互动网络科技有限公司视频部总监,Sora出现之后,她主动从各种渠道去了解、学习Sora。
360创始人周鸿祎在Sora出现后不久开启了AI免费课,面向公众用普通人能听懂的语言讲解AI知识。在首堂AI公开课上,周鸿祎谈到Sora时这样说道:“Sora生成的视频不在于好看,而在于逼真,背后是Sora通过观察理解了世界常识。外界不应对Sora太苛刻,因为相比以往的技术,Sora已经有了颠覆式的进步。”
每一项颠覆性的进步都会给行业带来或大或小的影响。“用克莱顿·克里斯坦森在其所著的《创新者的窘境》理论来解释的话,就是当一项革命性的新技术出现的时候,先被取代的是不被注意的低端产品。”一览科技创始人、CEO 罗江春说,在产业,图文肯定会最先被颠覆,随后是视频影视行业。
视频领域的商业应用场景中,视频广告占据着非常庞大的市场份额,那么,Sora的出现对于视频广告领域会产生怎样的影响?
重构生产流程?
其实,随着ChatGPT的出现,在文字和图片广告领域,AI已经带来了改变。
在全渠道运营、私域运营、布局视频号等风靡业内的情况下,零售企业对营销素材的需求更加强烈,视频类脚本、社群运营、“种草标题+笔记”,以及公众号推文撰写是高频使用的场景。
微盟针对零售营销领域曾打造了一款垂直大模型应用WAI。微盟集团AI负责人裘皓萍在接受记者采访时透露,WAI在2023年5月推出,以SaaS融合形态为例,从采用率来看,商品描述占比最高,达到40%;种草笔记正文达36%,如果针对单个客户进行模型微调,采用率可以提升到70%—80%,而商家最为关注的口播稿的直接采用率也达到22%。这意味着,在微盟WAI为商家生成的中,平均2—3条中就有1条可以被商家直接采用。“目前包括创意图片在内的广告生成效率已提升50%以上,AI生成在广告业务的可用率已经高达70%。”
在文字、图片和视频广告中,图片广告的难度高于文字、低于视频。裘皓萍告诉记者,在传统图片广告生产流程中,需要两类工种,一类是和广告客户对接的客户经理,了解和收集客户需求;一类是图片素材设计师。随着AI的引入,这两类工种有可能合二为一。“我们给客户测试过,请客户对人工生产的广告素材图和 AI 生产的素材图进行审核,客户已经无法分辨出两者的差别,只需要关注哪些是他想要的效果。另外从最后广告的投放追踪效果来看,AI设计的图和人类设计师做的图的投放效果也差不多。”裘皓萍对记者说道,“未来文生视频的发展,也有可能把多个工种合一。当然这也要看Sora的可控性。”
相较于文字和图片广告,视频广告的生产制作流程更长更复杂。
传统短视频广告的生产中,前期包括拍摄之前的沟通、脚本制作等环节,中期是视频的拍摄生产制作环节,其中视频拍摄需要录制场地/场景、出镜人物、灯光等,另外需要多台摄像机录下多个机位的现场素材,之后需要对拍摄的素材进行剪辑处理和包装。视频生产出来之后还有后期的客户审核、运营投放等环节。视频广告的整个过程耗时耗力,一般需要一个10人以上的团队去完成,从筹备到录制到出成本可能需要耗时半个月以上。
罗江春对记者表示:“Sora的出现可以看作是AI在视频创作方面的里程碑式技术跃升,包括时长的突破、复杂多角度的镜头切换、富有情感的多角色呈现、对长文本的快速深度理解能力、三维空间的连贯性等,如果它现在呈现出来的效果都是真的,那么在短视频营销、广告等领域的应用场景就非常广阔了,一定会对这些行业带来颠覆性的影响。”
“文生视频大模型的出现,意味着只要对大模型进行文本指令,大模型就可以生成高质量或接近真实情景的视频,也就不需要很庞大的团队进行复杂的拍摄、剪辑。过去需要几天时间才可以产出一条视频广告,Sora出现之后可能只需要几分钟就能产出一条视频广告。”刘润还认为,Sora或许可以实现对于视频广告的实时反馈和持续调优。在传统营销视频的生产方式中,对于已经发出的视频进行快速、频繁的调整或优化的能力相对较差,在投放之后想要对一个视频进行优化的时间较长,而Sora可能会大大缩短这一时间。
从品牌方甲方和广告商乙方合作模式的角度来说,Sora这类AI工具会让制作、品牌传播的门槛大大降低,能给品牌方带来全新的营销机遇。以前品牌方要做一个宣传片必须聘请专业的乙方公司来做,投入成本高、制作周期长,最后效果也很难保证。罗江春指出:“通过AI工具,甲方的市场部或品牌部人员自己就能够用更短的时间、更低的成本得到一个高质量的、视觉效果俱佳的视频广告,甚至可以根据目标受众的需求和喜好,通过Sora模型制作出更具创意和吸引力的广告,提高传播效果。”
裘皓萍也认为,甲乙双方的合作模式会发生变化,但依然需要专业的人去做专业的事情。“以前大部分客户在提诉求的时候只能用简单的文字,大家磨合沟通的时间会比较长。Sora出现之后可能会反过来,变成品牌方甲方先用Sora这样的工具做成简单的片子,广告商乙方对视频进行专业的优化、微调就可以了。”
不过,目前关于文生视频领域的更多的还只是畅想,因为Sora还没有对外开放测试的具体时间表。
需要看到的是,在领域,目前AI已经陆续应用到文字、图片和相关流程领域,数字视觉综合服务商丝路视觉的交互类业务负责人于翔对记者透露:“现在我们部分项目在前期都会使用到AI,包括文字、图片和影像层面,以及流程方面的一些问题。在日常工作中利用AI节省了非常多的人力,举个例子,比如在前期美工的层面,提高了好几倍的工作效率。”
于翔解释道,AI解决的第一个难题就是快速了解的问题,介入一个新行业、新领域,往往需要两周以上的时间才能了解相关行业的知识,形成自己的观点,而AI仅需半天就可以整理出来。AI的另一个好处是不存在知识边界,例如,去做一个美术领域的项目,前期需要画师尽快画出符合项目类型的、风格的原画,或者是前期的一组分镜头。前期美术人员可能需要一周的时间才能探索出客户想要的风格和,而现在利用文生图大模型,一晚上可以画出800张前期图。
而且从这些业内人士接触到的市场反应来看,市场客户对于AI生成的不抵触、不讨厌。
文生视频落地面临的几个问题
在专业人士看来,从技术的角度看,文生图大模型Sora和此前的文生文大模型、文生图大模型之间存在代差。
视频的原理本质上是连续播放的图片,造成人眼的视觉残留,形成的连续的动态视频。一秒的视频至少由25张静态图片构成。
在Sora之前,其实已经有能生成几秒钟级别的文生视频大模型,例如曾火爆一时的Pika。“Sora之前的文生视频其实就是生成一秒14帧—25帧的动图或者短视频,但更多能生成的是镜头在缓慢移动,或者是镜头内一些物体的跳动、海浪的波动等,它的震撼力远远不及Sora。”裘皓萍说道,而 Sora将生成视频的时间从几秒拓展至60秒,并且生成的是接近真实世界、能产生一些有视觉冲击力、富有想象力的。
但大模型要在实际的工作中落地,仍有许多需要注意的地方。
以目前已经在一些工作中落地的文生文、文生图大模型来说,“AI生成的东西需要人类自己去鉴别、审核。”于翔表示,例如过往的案例中曾在地图上出现过问题。OpenAI目前放出来的演示中明显有一些物理层面的Bug。
“在文生视频中,这个问题会更严重。”裘皓萍说道,在文生图大模型中,客户如果对于生成图片的一些细节不是很满意,可以对图片做贴图、覆盖等局部改图,一般而言,设计师用一天时间就能调整完一张图。一个60秒的视频,一秒至少25帧,这意味着60秒的短视频中至少有1500帧图。“视频中间如果有一帧画面客户不满意,Sora这类文生视频大模型的二次到底应该怎么做?如果让大模型重新运行一遍,可能产生的视频是和前一个视频完全不一样的。”
大模型在广告领域应用面临的第二个问题是可控性。文生图大模型Stable Diffusion开源之后,很多团队基于开源控制的能力做各类AI产品,包括如何把客户的商品图和大模型进行有机融合。这当中的一个难题在于,大模型绘图的时候,对于上传产品的形状、角度、细节不能发生改变或者变形。Sora等文生视频大模型如果想要在营销场景中生成视频,必须有一些东西是可控的,比如明星的脸、品牌的产品。
第三个问题就是成本和成功率。首先生成60秒的视频,对于显卡或计算资源的开销应该不低。其次,Sora的成功率到底有多少?裘皓萍对记者说道:“Sora究竟是根据一段文本生成了10个视频能采纳其中的一个,还是生成了100个视频采纳了其中一个,还是每一个生成的视频都是优质的视频?目前还没有掌握实测的数据,这和使用者的能力也会有很大的关系。”
于翔则从另一个方向给出了在成本方面的思考。“我们目前在测试用AI产生全景图像,现在考虑比较多的是成本问题,因为AI不会考虑项目预算和后期的施工问题,比如AI还不会根据项目的预算和报价孵化一个你想要的图像。”
广告从业人要怎么办?
AI时代的到来,普通人关注比较多的是被AI替代的问题。
罗江春认为,可能每个行业都会受到冲击,但速度有所区别。因为越专业的工作,越能用程序描述清楚的东西,硅基超越碳基是有机会的。如果是一些要发挥创造力、想象力的工作,这些职业改变应该会慢一点儿。
视频广告既是需要创意的行业,生产过程又涉及很多具体的工作环节。
“当AI工具越来越普及,人人都能用它来做出一个效果不错的营销的时候,广告公司的价值又在哪里体现呢?这么说并不是要给大家传播焦虑,更重要的是希望大家能够认清现实,主动求变,要更积极地拥抱AI而不是排斥AI。”罗江春说道,广告营销的本质还是在创意,无论AI技术怎么发展,它都是用来实现创意的一种工具,创意本身的价值仍然是不可替代的。
“AI不会替代人,它只是一个工具而已。”于翔指出,对于文化创意行业来说,最重要的是创意和创造,AI在一定程度上能帮助进行试错。“产出后一定会有修改、迭代的过程,AI产生之后,生产的环节严格意义上并没有减少,但是整体的量增加了。比如A组一个月能做3—5个项目,现在通过AI可能会增加到8—10个项目。”
所以在未来,能够快速拥抱AI技术,并把这项技术结合原有的品牌策略与创意优势的广告公司会更有可能得到品牌主的青睐。罗江春说道:“AI将加速一场分化,会使用好AI工具的团队和个人会越来越好,不想用、不会用AI工具的团队和个人一定会被市场淘汰。”
虽然接受采访的大多数广告业内人士认为,大模型的发展还需要一定的时间,并且这些大模型工具还不能完全取代某一个工作链路中的环节或者工种,但广告从业者肯定需要进行能力升级。这就需要从业者以一个相对开放的心态去快速拥抱新工具,并且把工具用起来。
“公司会鼓励大家去学习一些AI知识或接受相关的培训,也会鼓励员工使用大模型的产品进行工作。”刘润说道。
于翔在公司也会鼓励员工自行学习和尝试各类大模型产品,还适当地提供一些费用补贴。
刘润认为,大模型其实对于使用人员的能力要求非常高,尤其是文学素养方面的挑战。ChatGPT、Sora等AI软件都很依赖文本提示,但不是谁都能用好这个东西。Sora考验的是,如何把人脑中的画面或者创意、诉求,通过使用更精细、更充分的文字表达出来,然后和大模型进行反馈调优。
“可以预见,能用好Sora的人凤毛麟角。就像拍电影的摄像机,现在人人都拥有,但不是谁都能拍出一个好电影。”裘皓萍说道。
(:张靖超 :刘军)
结论:近年来,随着AI技术的不断突破和应用,越来越多的新兴公司开始研发并推出自己的文生视频模型,如OpenAI的Sora。然而,这也引发了一些担忧,即人们担心会被AI替代,尤其是文字和图片广告领域。然而,正如克莱顿·克里斯坦森在其著作《创新者的窘境》中提到的,每一次革命性的技术创新都伴随着对低端产品的取代,Sora的出现实际上是对高端产品的一大革新。
本文介绍了Sora模型的特点和特点,并强调了其在视频广告领域的潜力。张靖超提出,虽然当前的大模型在制作过程中花费大量时间和人力,但它们也可以为企业提供更快、更有效的广告解决方案。此外,他提醒人们,由于技术的发展,未来的许多任务可能会由AI自动完成,从而降低了人力成本和提高工作效率。
裘皓萍也认为,虽然传统广告视频的生产流程较长,复杂,但在文生视频大模型出现后,这一过程可能会大大简化。这种变化可能会导致AI成为制作和营销的重要工具,特别是在电商领域。不过,她也强调,AI生成的仍然需要经过审查和调整才能满足客户的需求。
在文生视频的大规模生产和使用方面,面临着三个主要问题:一是如何确保生成的视频质量;二是如何确保生成的视频能够在广告业的各个环节顺利运作;三是如何管理来自消费者和供应商的反馈。她提到,企业需要准备应对这些问题,以便更好地利用AI工具进行制作和营销。
总的来说,虽然AI的发展可能会对某些行业产生颠覆性影响,但它也将创造出新的机会。广告从业者应该积极拥抱AI技术,同时不断提升自己的技能和知识,以适应这种变化。