一镜到底60秒,GPT-3点亮Sora视频!技术报告揭露6大核心优势,AGI未来1年内或成真?

2024-02-18 热点资讯 关注公众号
    【导语】:近日,OpenAI首席执行官阿尔特曼在X平台上发布的一系列由最新视频生成模型Sora制作的视频引发了业界轰动。这些精美绝伦的场景,如“金毛猎犬山顶播客”、“火星未来感无人机比赛”以及“高科技生态朋克城市漫游”,无不让人惊叹不已。用户对这款被赞誉为“前所未见”和“颠覆游戏规则”的Sora给予了高度评价。
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    2月15日,OpenAI推出的创新视频生成模型Sora,以令人惊艳的表现震撼了用户。该模型依托于强大的文生图模型DALL-E 3技术,能够将短短的文字描述转化为长达一分钟的高清视频。对比测试中,当主流工具如Pika、RunwayML和Stable Video面对相同的提示输入时,它们生成的视频通常仅有5秒左右,而Sora却能在一段长达17秒的视频场景中保持动作与画面的连贯一致性,这一卓越性能得到了业界大佬Gabor Cselle的高度认可,并将其比喻为视频生成领域的“GPT-3时刻”。
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    英伟达人工智能研究院首席研究科学家Jim Fan更是对Sora的能力发出赞叹,认为它如同一个“数据驱动的物理引擎”,是一个可学习的模拟器或称“世界模型”。360集团创始人、董事长周鸿祎则预测,随着Sora的诞生,人类距离实现AGI(通用人工智能)已不再遥远,可能在一两年内就能看到实质性的突破。
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    OpenAI随后发布的技术报告深入剖析了Sora的强大性能及其背后的关键技术支持,并客观分析了其局限性。《每日经济新闻》记者梳理总结出Sora六大核心优势:
60秒一镜到底,文生视频的GPT-3时刻!Sora技术报告揭秘 6大核心优势,AGI或在1年内实现?    1. 准确多样:Sora能精准诠释用户的文本输入,生成涵盖丰富主题、多样场景和人物的高质量视频片段,从人物动物到自然风光、都市景象乃至水下纽约城,都能根据用户需求提供多样化的,甚至可以处理多达135个单词的长篇提示。
    2. 强大语言理解:通过应用Dall-E模型的re-captioning技术和GPT技术,Sora不仅能提高文本解释的准确性,还提升了整体视频质量,使其能够依据用户简短提示创作出细节丰富的高品质视频。
    3. 多模态输入:除了接受文本输入,Sora还能处理图像和现有视频等其他类型提示,具备广泛的能力,包括制作循环视频、将静态图片转为动画、延伸视频时间线等,展示了其在图像和视频领域广阔的应用前景。
    4. 视频扩展功能:Sora可以根据图像或现有视频进行扩展,作为基于Transformer的扩散模型,能够沿时间轴向前或向后延展视频,展现了灵活多变的时间线操控能力。
    5. 优异设备适配性:Sora支持多种视频尺寸输出,无论是宽屏1920x1080p还是竖屏1080x1920,都能轻松应对,保证生成的与各种设备原始纵横比完美匹配。此外,它还可在生成高分辨率前快速创建小尺寸原型。
    6. 场景连续性和物体一致性:Sora生成的视频拥有动态视角变化,场景中的三维元素运动表现得更为自然,且能有效处理遮挡问题,即使主体暂时离开视野也能确保画面一致性。
    外媒报道指出,Sora的推出标志着AI研究的重要里程碑,其模拟和理解现实世界的能力为迈向AGI奠定了基础。伊利诺伊大学厄巴纳-香槟分校信息科学教授Ted Underwood表示,Sora展现的持续、连贯视频制作水平超乎预期,相较于其他文本到视频工具,“容量显著提升”。
    目前,Sora已面向红队成员及部分创意人士开放使用。英伟达的Jim Fan强调,不应将Sora视为简单的生成式工具,而应视作一个数据驱动的物理引擎和可学习的模拟器,它的出现象征着文本生成视频的GPT-3级突破。马斯克也在社交媒体上回应道,AI加持的人类将在未来几年创造最优秀的作品。
    然而,Sora的革新力量也将给影视、广告制作、教育、游戏、新闻和动画等多个行业带来巨大变革,甚至可能产生颠覆性影响。尽管如此,Sora对于复杂场景物理原理的理解仍有不足,可能出现违背物理常识的现象。同时,由于可能存在的滥用风险,监管机构也正加强对这类技术的管理,例如美国联邦贸易委员会提出禁止利用AI工具冒充个人的新规。
    综上所述,Sora不仅预示着视频生成技术的巨大飞跃,更揭示了AI在未来理解和模拟真实世界方面所蕴含的巨大潜力,同时也提醒我们关注技术创新所带来的伦理挑战和社会影响。

上一篇:全球最小仿人机器人纪录被刷新:高 141 毫米,能跳舞、踢足球
下一篇:2024年社交媒体的六大趋势
更多更酷的内容分享
猜你感兴趣
Sora提醒:核心技术,我们仍需努力。

Sora提醒:核心技术,我们仍需努力。

OpenAI推出Sora,生成逼真视频引关注。全球产业界震撼,中美AI差距或被拉大。中国公司快速反应,但面对Sora,距离正在被拉开。AI技术背后的互联网产业面临挑战,效率最高的主体代表也感到茫然。技术鸿沟扩大,弯道超车并不现实。

热点资讯 02.24
智谱AI首秀2024 ICLR,展示未来AGI技术发展趋势

智谱AI首秀2024 ICLR,展示未来AGI技术发展趋势

该文本摘要是关于 GLM 大模型技术团队在 ICLR 2024 会场发表的主题演讲。主要讨论了GLM-4、GLM-4.5 及其升级模型、GLM-OS 概念以及GLM-zero 技术等方面。GLM 大模型团队表示,未来应注重各种模态的融合训练,并提出以大模型为中心的通用计算系统,实现模仿人类的 PDCA 循环机制和无意识学习机制。此外,他们还介绍了 GLM-zero 研究的目标和方法。

生活常识 05.10
微软打算把Sora视频生成技术加入到Copilot,但还需等待一段时间。

微软打算把Sora视频生成技术加入到Copilot,但还需等待一段时间。

微软广告和网络服务首席执行官Mikhail Parakhin表示,Sora最终会加入Copilot,但需要时间。Sora是由OpenAI开发的文生视频大模型,能通过文字描述生成长达60秒的连贯流畅视频。Copilot是微软在Windows 11中加入的AI助手,能依据用户语言指示完成任务。将两者整合意味着人们可以用文字描述生成高质量视频,为开发人员创造高效工作环境。目前,Sora仍在测试阶段。

热点资讯 02.25
Sora技术路线深度解读:伯克利核心团队,CVPR曾拒之门外的奠基论文

Sora技术路线深度解读:伯克利核心团队,CVPR曾拒之门外的奠基论文

Sora,OpenAI 的最新 AI 生成视频技术,引发全球风投关注。基于 Diffusion Transformer(DiT)的新模型,产生高清晰度、画面可控的60秒视频。展示生成式模型在多模态生成方面的巨大潜力,未来发展尚待探索。团队由13位核心成员组成,包括研发负责人 Tim Brooks 和 William Peebles。

热点资讯 02.19
亚马逊海外官方旗舰店入驻京东:跨境巨头的激战升级还是新一轮较量?

亚马逊海外官方旗舰店入驻京东:跨境巨头的激战升级还是新一轮较量?

亚马逊海外官方旗舰店已正式入驻京东,旨在为全球消费者提供更多选择。亚马逊中国副总裁李岩川表示,他们将扩大采销、售前服务和支付方式的合作机会。同时,两家公司也将探索社交媒体电商和直播电商领域的投资和布局。

热点资讯 11.23
纳芯微王升杨:中国模拟芯片行业并购整合的必然趋势,你的浏览器可能需要更新一下

纳芯微王升杨:中国模拟芯片行业并购整合的必然趋势,你的浏览器可能需要更新一下

芯片制造商面临毛利率下降的压力。然而,纳芯微有限公司董事长王升杨表示,他有信心带领企业走出困境,走向更广阔的发展空间。他在采访中指出,在未来,中国芯片企业在市场竞争中将更加注重产品的定位和定义,以及与用户的深入沟通。此外,他也认为,当前的芯片行业正逐渐迈向稳健发展的阶段,关键在于企业的技术进步和创新能力。最后,他表示,中国汽车芯片产业将持续发展,为全球汽车行业注入新的动力。

热点资讯 11.23
苹果即将对Siri进行重大变革:发布会日期曝光!

苹果即将对Siri进行重大变革:发布会日期曝光!

苹果正开发更强大且具有对话功能的Siri数字助手,旨在赶超OpenAI的ChatGPT和其他语音服务。此新型Siri将采用高级的语言模型,支持双向对话,并且更精准地控制第三方应用。此项目已进行了13年,但仍然落后于Google的Gemini等竞争对手。苹果计划最早在2025年发布新的Siri,但确切日期仍有不确定性。此外,近期发布的招聘信息也显示,苹果计划推出更强大的Siri。

热点资讯 11.23
37岁导演再次开山之作:《庆余年2》演绎主角,他的新挑战引行业热议

37岁导演再次开山之作:《庆余年2》演绎主角,他的新挑战引行业热议

本文主要讲述了悬疑剧《宿敌》上线后引发的关注度,以及多个演员在其中的角色塑造。包括男主角廖凡、女主角黄萧、胡夏峰和国安警官肖波等,他们分别在剧中表现出层次感分明、立体饱满的人物形象和出色的表演。沈晓海作为一名熟知多年的老戏骨,在《宿敌》中的出色表现也受到了观众的一致好评。这些演员们在剧中共同营造了一个引人入胜的故事,并且展现出各自的特色和魅力。文章最后强调了这部电视剧的价值所在,呼吁更多优秀的影视作品出现。

热点资讯 11.23
《小巷人家》全体告别成员致敬与告别:王安宇手书歌词,周洁琼弹琵琶,闫妮蒋欣言简意赅

王安宇告别《小巷人家》,留下手写歌词与心声;周洁琼、闫妮、蒋欣齐唱,歌曲简单却深情。告别日常,致敬同行!

《小巷人家》全体告别成员致敬与告别:王安宇手书歌词,周洁琼弹琵琶,闫妮蒋欣言简意赅 王安宇告别《小巷人家》,留下手写歌词与心声;周洁琼、闫妮、蒋欣齐唱,歌曲简单却深情。告别日常,致敬同行!

度,乐观且坚强的林栋哲,犹如一缕阳光照亮了整个小巷。面对结束,四人分别发布告别信,感谢付出与陪伴。蒋欣饰演的宋莹圆满告别华妃的角色,闫妮塑造的黄玲突破难关,郭晓东塑造的庄超英深具责任感,李光洁扮演的林武峰则令人称赞。最后四位主角以微笑告别,完美谢幕。剧中情感深厚,让人感慨万千。

热点资讯 11.23
李行亮为何没有朋友?原因解析:朋友被麦琳清空

李行亮为何没有朋友?原因解析:朋友被麦琳清空

麦琳炒热了自己的名声并造成争议,同时也揭露了好友的贪婪行为。尽管如此,500哥并未因此生气,并表示对朋友充满了尊重。

热点资讯 11.23
韩国「标志」三人组合能否延续传奇,新曲能否引发争议?

韩国「标志」三人组合能否延续传奇,新曲能否引发争议?

BigBANG即将推出的新曲将在11月22日下午2点在和韩国国内外各大音乐平台发布。权志龙(G-Dragon)与BIGBANG成员太阳(Taeyang)、大声(Daesung)一起参与新曲创作,并邀请银河公司旗下的银河乐团担当伴奏。BigBANG计划在2024年MAMA颁奖礼上首秀新曲,但银河公司还未对此消息进行确认。关于权志龙的回归,银河乐团表示相信他会带来一场标志性的舞台表演。BigBANG上一次以团体形式发布作品是在2022年,共有四名成员参与其中,其中权志龙、太阳、大声和崔胜铉均退出组合。BigBANG目前仍在法律争议中,除崔胜炫外,李胜利因“ Burning Sun”夜店丑闻而退团。

热点资讯 11.23
泰国女总理与全球小姐冠军,30厘米高差背后的气质实力较量

泰国女总理与全球小姐冠军,30厘米高差背后的气质实力较量

泰国新任总理接见环球小姐季军奥帕尔,对其在墨西哥比赛的表现表示赞扬,并邀请其来政府大楼做客,意图通过文化交流和推广泰国文化走向世界。两人交谈中探讨了传播泰国历史和文化、展示传统纺织艺术和手工艺品等问题,旨在提升泰国文化的国际影响力。奥帕尔以其过人的身高和气质赢得了现场观众的认可。尽管在身高上存在差距,但佩通坦凭借自身的魅力和气场成功吸引了人们的眼球。

热点资讯 11.23
中美高层会谈:拜登坚持不希望改变台海现状

中美高层会谈:拜登坚持不希望改变台海现状

拜登在亚太经合组织会议上对中国表达了坚定的立场,不支持任何形式的“台独”。同时,他也警告了中国不要利用台湾问题来影响美国与其他国家的关系。然而,在台湾问题上,拜登并没有做出根本性的改变,仍然坚持强硬态度。在会晤中,拜登不仅向解放军提出了要求,还在强调要和平解决分歧,并呼吁两岸以和平方式解决问题。目前来看,中美之间的僵持局面可能难以化解,而中国已经做好了充分的准备应对可能出现的情况。

热点资讯 11.23
特朗普内阁成形遇阻 玛斯克紧急划清反华立场

特朗普内阁成形遇阻 玛斯克紧急划清反华立场

特朗普胜选后,筹谋内阁人选,两大反华鹰派人物马特·盖茨和皮特·海格塞斯因深陷丑闻位置不保,特朗普提名前佛罗里达州检长帕姆·邦迪为司法部长提名人,但盖茨因吸毒、未成年人性交易丑闻主动放弃司法部长提名。马斯克被质疑与特朗普内阁成员选择有关,他急忙澄清,避免引火烧身。特朗普亲自撤回对马斯克的提名,称不需要浪费时间在无谓的争斗上,盖茨在参议院确认过程中将面临严峻挑战,特朗普对此感到欣慰。特朗普认可盖茨为提名做出的努力,但对于是否会影响新政府注意力,特朗普没有明确表态。

热点资讯 11.23