一镜到底60秒,GPT-3点亮Sora视频!技术报告揭露6大核心优势,AGI未来1年内或成真?

2024-02-18 热点资讯 关注公众号
    【导语】:近日,OpenAI首席执行官阿尔特曼在X平台上发布的一系列由最新视频生成模型Sora制作的视频引发了业界轰动。这些精美绝伦的场景,如“金毛猎犬山顶播客”、“火星未来感无人机比赛”以及“高科技生态朋克城市漫游”,无不让人惊叹不已。用户对这款被赞誉为“前所未见”和“颠覆游戏规则”的Sora给予了高度评价。
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    2月15日,OpenAI推出的创新视频生成模型Sora,以令人惊艳的表现震撼了用户。该模型依托于强大的文生图模型DALL-E 3技术,能够将短短的文字描述转化为长达一分钟的高清视频。对比测试中,当主流工具如Pika、RunwayML和Stable Video面对相同的提示输入时,它们生成的视频通常仅有5秒左右,而Sora却能在一段长达17秒的视频场景中保持动作与画面的连贯一致性,这一卓越性能得到了业界大佬Gabor Cselle的高度认可,并将其比喻为视频生成领域的“GPT-3时刻”。
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    英伟达人工智能研究院首席研究科学家Jim Fan更是对Sora的能力发出赞叹,认为它如同一个“数据驱动的物理引擎”,是一个可学习的模拟器或称“世界模型”。360集团创始人、董事长周鸿祎则预测,随着Sora的诞生,人类距离实现AGI(通用人工智能)已不再遥远,可能在一两年内就能看到实质性的突破。
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    OpenAI随后发布的技术报告深入剖析了Sora的强大性能及其背后的关键技术支持,并客观分析了其局限性。《每日经济新闻》记者梳理总结出Sora六大核心优势:
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    1. 准确多样:Sora能精准诠释用户的文本输入,生成涵盖丰富主题、多样场景和人物的高质量视频片段,从人物动物到自然风光、都市景象乃至水下纽约城,都能根据用户需求提供多样化的,甚至可以处理多达135个单词的长篇提示。
    2. 强大语言理解:通过应用Dall-E模型的re-captioning技术和GPT技术,Sora不仅能提高文本解释的准确性,还提升了整体视频质量,使其能够依据用户简短提示创作出细节丰富的高品质视频。
    3. 多模态输入:除了接受文本输入,Sora还能处理图像和现有视频等其他类型提示,具备广泛的能力,包括制作循环视频、将静态图片转为动画、延伸视频时间线等,展示了其在图像和视频领域广阔的应用前景。
    4. 视频扩展功能:Sora可以根据图像或现有视频进行扩展,作为基于Transformer的扩散模型,能够沿时间轴向前或向后延展视频,展现了灵活多变的时间线操控能力。
    5. 优异设备适配性:Sora支持多种视频尺寸输出,无论是宽屏1920x1080p还是竖屏1080x1920,都能轻松应对,保证生成的与各种设备原始纵横比完美匹配。此外,它还可在生成高分辨率前快速创建小尺寸原型。
    6. 场景连续性和物体一致性:Sora生成的视频拥有动态视角变化,场景中的三维元素运动表现得更为自然,且能有效处理遮挡问题,即使主体暂时离开视野也能确保画面一致性。
    外媒报道指出,Sora的推出标志着AI研究的重要里程碑,其模拟和理解现实世界的能力为迈向AGI奠定了基础。伊利诺伊大学厄巴纳-香槟分校信息科学教授Ted Underwood表示,Sora展现的持续、连贯视频制作水平超乎预期,相较于其他文本到视频工具,“容量显著提升”。
    目前,Sora已面向红队成员及部分创意人士开放使用。英伟达的Jim Fan强调,不应将Sora视为简单的生成式工具,而应视作一个数据驱动的物理引擎和可学习的模拟器,它的出现象征着文本生成视频的GPT-3级突破。马斯克也在社交媒体上回应道,AI加持的人类将在未来几年创造最优秀的作品。
    然而,Sora的革新力量也将给影视、广告制作、教育、游戏、新闻和动画等多个行业带来巨大变革,甚至可能产生颠覆性影响。尽管如此,Sora对于复杂场景物理原理的理解仍有不足,可能出现违背物理常识的现象。同时,由于可能存在的滥用风险,监管机构也正加强对这类技术的管理,例如美国联邦贸易委员会提出禁止利用AI工具冒充个人的新规。
    综上所述,Sora不仅预示着视频生成技术的巨大飞跃,更揭示了AI在未来理解和模拟真实世界方面所蕴含的巨大潜力,同时也提醒我们关注技术创新所带来的伦理挑战和社会影响。

上一篇:全球最小仿人机器人纪录被刷新:高 141 毫米,能跳舞、踢足球
下一篇:2024年社交媒体的六大趋势
更多更酷的内容分享
猜你感兴趣
智谱AI首秀2024 ICLR,展示未来AGI技术发展趋势

智谱AI首秀2024 ICLR,展示未来AGI技术发展趋势

该文本摘要是关于 GLM 大模型技术团队在 ICLR 2024 会场发表的主题演讲。主要讨论了GLM-4、GLM-4.5 及其升级模型、GLM-OS 概念以及GLM-zero 技术等方面。GLM 大模型团队表示,未来应注重各种模态的融合训练,并提出以大模型为中心的通用计算系统,实现模仿人类的 PDCA 循环机制和无意识学习机制。此外,他们还介绍了 GLM-zero 研究的目标和方法。

生活常识 05.10
Sora提醒:核心技术,我们仍需努力。

Sora提醒:核心技术,我们仍需努力。

OpenAI推出Sora,生成逼真视频引关注。全球产业界震撼,中美AI差距或被拉大。中国公司快速反应,但面对Sora,距离正在被拉开。AI技术背后的互联网产业面临挑战,效率最高的主体代表也感到茫然。技术鸿沟扩大,弯道超车并不现实。

热点资讯 02.24
Sora技术路线深度解读:伯克利核心团队,CVPR曾拒之门外的奠基论文

Sora技术路线深度解读:伯克利核心团队,CVPR曾拒之门外的奠基论文

Sora,OpenAI 的最新 AI 生成视频技术,引发全球风投关注。基于 Diffusion Transformer(DiT)的新模型,产生高清晰度、画面可控的60秒视频。展示生成式模型在多模态生成方面的巨大潜力,未来发展尚待探索。团队由13位核心成员组成,包括研发负责人 Tim Brooks 和 William Peebles。

热点资讯 02.19
微软打算把Sora视频生成技术加入到Copilot,但还需等待一段时间。

微软打算把Sora视频生成技术加入到Copilot,但还需等待一段时间。

微软广告和网络服务首席执行官Mikhail Parakhin表示,Sora最终会加入Copilot,但需要时间。Sora是由OpenAI开发的文生视频大模型,能通过文字描述生成长达60秒的连贯流畅视频。Copilot是微软在Windows 11中加入的AI助手,能依据用户语言指示完成任务。将两者整合意味着人们可以用文字描述生成高质量视频,为开发人员创造高效工作环境。目前,Sora仍在测试阶段。

热点资讯 02.25
美国副国务卿声称:中国是重大挑战, 冷战不再具有重要性

美国副国务卿声称:中国是重大挑战, 冷战不再具有重要性

根据您提供的文本,我们可以提取出以下几个关键信息: - 中国是美国“史上最大挑战”,被视为美国面对的最大挑战。 - 坎贝尔对中国提出的挑战进行回应,并将其定义为“军事实力或经济主导地位的较量,以及影响21世纪和全球力量平衡的规则之争”。 - 双方之间的分歧主要集中在国防开支上,认为增加国防开支不能解决问题。 - 主席麦考尔强调中国威胁的存在,并对中国提出了“军事实力或经济主导地位的较量,以及影响21世纪和全球力量平衡的规则之争”的观点。 总结起来,文本突出了中美之间存在的战略挑战和分歧,同时也强调了中国在这一过程中所承担的责任。

热点资讯 09.19
中国象棋协会对王天一等人的处罚决定曝光,撤销特级大师称号,终身禁赛进行公示

中国象棋协会对王天一等人的处罚决定曝光,撤销特级大师称号,终身禁赛进行公示

中国象棋协会决定永久封禁王天一和王跃飞,并禁止二人参与任何象棋比赛和活动。此外,他们还将接受严厉处罚,包括终身禁赛和技术等级称号的撤销。中国象棋协会将展开全面清理,并要求社会各界对此保持监督。

热点资讯 09.19
炽烈之声:聆听一代代中国军人的誓言

炽烈之声:聆听一代代中国军人的誓言

这一代代中国军人向生死宣誓,始终忠于党,为人民和国家付出。他们挑战恶劣环境,克服困难,忠诚勇敢地履行职责。

热点资讯 09.19
明天下午至晚上海台“普拉桑”将影响浙江沿海地区,建议关注并做好防范措施

明天下午至晚上海台“普拉桑”将影响浙江沿海地区,建议关注并做好防范措施

今年第14号台风“普拉桑”预计于19日下午到晚上在浙江温岭到舟山一带沿海登陆(热带风暴级或强热带风暴级,9-11级,23-30米/秒)。请注意,大风将持续到20日。

热点资讯 09.19
金钟:美联储首次降息,中美经济可能有哪些波动?

金钟:美联储首次降息,中美经济可能有哪些波动?

美联储今年首次降息50基点引发市场热议,部分人质疑其应对经济不稳的措施,但也有市场将其视为降低资金成本的信号。不论何种解读,这一决定都将加大金融市场的波动性,带来潜在的风险。

热点资讯 09.19
中秋假期楼市交投平淡,二手房活跃度高

中秋假期楼市交投平淡,二手房活跃度高

衡6万一”的让利活动。此外,一些开发商也推出了购房优惠政策,如首付比例降低、优惠利率、赠品等。然而,无论是新房还是二手房,由于疫情的影响以及市场需求的变化,整体市场表现依然平淡。专家预测,随着九月底的临近,楼市政策有望迎来优化,四季度市场的成交量将有所回升。对于购房者来说,可以关注一下即将到来的购房优惠活动,以获取更多的购房优势。

热点资讯 09.19
揭秘低空经济新探索:应用场景及落地策略

揭秘低空经济新探索:应用场景及落地策略

2024年首次被写进政府工作报告的低空经济,近30个省份和城市的政府工作报告提出大力发展低空经济及通用航空。其中,长三角地区城际间低空航线正在密集开通,昆山到浦东的载客直升机航线仅需飞行不到半个小时。 从2小时缩短到半小时,苏州高新广场直航中心到南通仅需25分钟,无锡硕放机场仅需12分钟。同时,航空运动、空中旅游、飞行培训、应急救援等领域都具有巨大的发展潜力,有望成为低空经济的重要增长点。例如,长沙湘江新区的航空应急救援基地,能快速响应临近事故点开展应急救援任务。

热点资讯 09.19
洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

洋河、徽酒与“茅五泸”的竞争:一个洋河可以比肩四大名酒

江南五虎在江浙地区崛起,占江苏白酒市场份额近40%,竞争日益激烈。 黄山归来,犹如一幅画卷,把古老的中国文化装点得独具魅力。

热点资讯 09.19
女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

女子不堪男子频繁性侵,向公司反映却被回复:这是你的问题,不是我们的责任。

深圳男子PPT揭露出轨事实,自称曾下跪哀求女友不要举报。

热点资讯 09.19
外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

外交部强烈呼吁:保障所有在华外国人的生命财产安全,加强与涉事学校的沟通合作

9月18日,深圳日本人学校10岁学生遭男子刺伤,已被现场捕获。中方继续采取有效措施,保障在外中国人的安全。

热点资讯 09.19