又出新品了!微软推出了Sora复刻版。我们团队也在努力打造一款针对华人的产品。

2024-03-22 热点资讯 关注公众号

白交 发自 凹非寺

量子位 | 公众号 QbitAI

Sora复刻版出现了——

Mora,还是多智能体那种。

Sora有的能力它基本都有,比如文本转视频、扩展视频、视频、视频拼接、模拟数字世界等等。

还支持生成1024*576分辨率的12秒视频。

这项研究来自理海大学微软研究院的华人团队。他们运用多个视觉agent,在多个任务中表现接近Sora。

既如此,且来看Mora究竟实力如何。

Mora复刻Sora

先来看效果。

首先是文本到视频的生成。

In the middle of a vast desert, a golden desert city appears on the horizon, its architecture a blend of ancient Egyptian and futuristic elements.The city is surrounded by a radiant energy barrier, while in the air, seve

(在广袤的沙漠中,一座金色的沙漠城市出现在地平线上,其建筑融合了古埃及和未来元素。)

效果还不错,有点三体内味了。

再来看,基于文本提示的图像到视频生成。

不妨就拿Sora视频比较一下。

除此之外,还支持视频,比如修改一下视频里的车、给车铺上一条彩虹之路。

这个效果嘛,就还有进步空间~

不过跟Sora同款的视频拼接,是可以Hold住的。

多智能体框架

研究团队提出了一个多智能体框架Mora。

他们认为解决不同视频生成任务,需要不同专业能力agent协作。为此,Mora框架中有5个基本角色组成:

Prompt选择和生成agent、文本到图像生成agent、图像到图像生成agent、图像到视频生成agent、视频到视频agent。

每个agent负责特定的输入和输出,通过设置agent的角色和操作技能,团队定义了各种任务基本工作流程。

根据任务不同,采用特定的agent组合。

目前他们主要设计了六个工作流:

文本到视频生成;文本条件图像到视频生成;扩展生成的视频;视频到视频;连接视频以及模拟数字世界。

最终,在各个任务中,Mora的表现都接近Sora。

团队认为,Mora作为开源多agent框架,具有一定的灵活性和效率,还能无缝集成各种模型。

但与此同时,也有一定的进步空间。比如高质量视频数据集的需求、指令遵循能力的提升、人类视觉偏好对齐等。

理海微软团队

此次研究来自理海大学孙力超团队,此外还有微软研究院研究员参与。

前段时间,同样也是这个团队用37页论文逆向工程解剖Sora。

他们对模型背景、相关技术、应用、现存挑战以及文本到视频AI模型未来发展方向进行了全面分析。

感兴趣的朋友可戳下方链接:

https://arxiv.org/abs/2403.13248

https://github.com/lichao-sun/Mora


结论:根据研究结果,Mora作为开源多agent框架,具有一定的灵活性和效率,能无缝集成各种模型。然而,也存在一些改进空间,如高质量视频数据集的需求、指令遵循能力的提升、人类视觉偏好对齐等。
建议:
1. 加大对高质量视频数据集的研究力度,以满足Mora的设计需求。
2. 提高指令遵循能力,使Mora能够更好地适应不同的应用场景。
3. 尽可能提高人类视觉偏好的对齐程度,使Mora的生成结果更符合人的视觉习惯。
4. 优化Mora框架的结构和参数配置,使其更加高效和易于使用。

上一篇:物质一共有几种状态?
下一篇:令人惊叹!X射线下的博物馆动物数字“解剖”影像
更多更酷的内容分享
猜你感兴趣
剖析Sora:37页论文揭示逆向工程秘密,微软联手,华人团队打造!

剖析Sora:37页论文揭示逆向工程秘密,微软联手,华人团队打造!

华人团队发布首个Sora研究综述,通过逆向工程剖析其技术细节和整体架构,并对模型背景、相关技术、应用、现存挑战以及未来发展方向进行全面分析。文章还列举了计算机视觉领域的AI生成模型发展史和近两年出现的视频生成模型。不少网友表示综述全面有条理,建议全文阅读。

热点资讯 03.02
清华明星团队打造的「中国版Sora」再创佳绩,获巨额投资刷新行业格局

清华明星团队打造的「中国版Sora」再创佳绩,获巨额投资刷新行业格局

生数科技、阿里云、百度等公司在这一轮大模型浪潮中占据主导地位,纷纷推出类似“搬家”的活动,这与中国版Sora的发布时间正好吻合。作为国内首个提出Diffusion Transformer融合架构的公司,生数科技已经在资本市场上得到一系列支持。此外,哈勃也参与了对AI公司的投资,使得该股在关键时刻得到了广泛关注。在这个信息爆炸的时代,如何抓住这些热点并快速抢占市场份额,成为了众多公司的挑战。总的来说,这场事件是中国国产人工智能发展的缩影,也是当前市场的一个重要时刻。

热点资讯 07.07
微软启动AI代理时代:10款新产品引领打造全套AI工具

微软启动AI代理时代:10款新产品引领打造全套AI工具

出10个新的自主代理。这些代理可以取代传统的客户服务代表,并通过机器学习技术来提供更好的客户体验。 ## 微软计划从下个月开始允许企业制造个性化的自主人工智能代理 微软将在下个月开始允许企业制造个性化的自主人工智能(AI)代理。他们计划推出10款全新的AI自动代理,包括Copilot Studio和Dynamics 365中的新代理。 ## Copilot Studio是微软推出的一款供公司定制和打造Copilot助手的平台 Copilot Studio是微软推出的一款供公司定制和打造Copilot助手的平台,其功能包括模拟对话、语音识别和翻译等。微软希望Copilot Studio能帮助用户提高工作效率。 ## 未来微软将增加在Copilot Studio中创建自主代理的功能 微软还将增加在Copilot Studio中创建自主代理的功能,以便更多企业和组织可以使用这一创新技术。

热点资讯 10.23
微星确认新款 Claw 掌机定价:有望与现有产品接近,将推出 7 英寸版

微星确认新款 Claw 掌机定价:有望与现有产品接近,将推出 7 英寸版

微星系统即将推出新的爪式智能手机——Claw 8 AI+,采用8英寸屏幕,搭载英特尔Lunar Lake处理器,并将在2022年发布3、4代产品,目前预定售价在5000-6000美元之间。此外,该手机还将支持M.2盘位,方便用户更换存储设备。

热点资讯 06.08
穿越时空的交错,深度探索俄罗斯历史:漫步莫斯科-中国电车的奇迹

穿越时空的交错,深度探索俄罗斯历史:漫步莫斯科-中国电车的奇迹

11月18日,中俄东线天然气管道工程全面完工,并进入试运行阶段。这条天然气管道长度达到5111公里,覆盖黑河到上海,有望保障全国近13000万居民的冬季用气需求。 该管道输送的是俄罗斯天然气,对改善我国空气质量起到重要作用。同时,此次投资将带动中国新能源车的发展和石油产业的转型升级。 虽然目前仍缺乏新能源车在俄罗斯的市场份额,但专家预测随着技术进步和政策推动,未来一定会有更多新能源车进入市场。然而,进口伪二手车以及价格高昂等问题依然困扰着购买者。

热点资讯 11.23
丰田全新车型‘威兰达’再降5万,仅售12.08万能否入手抄底?

丰田全新车型‘威兰达’再降5万,仅售12.08万能否入手抄底?

丰田威兰达在2024年中国国内面临严峻挑战,销量下滑严重。新一代威兰达即将上市,售价亲民。新车采用全新家族式前脸设计,大气且充满力量感;车身尺寸和轴距均较紧凑型SUV车型稍大。内饰设计延续丰田传统风格,配色丰富,科技感强。入门版配备丰富配置,如7个安全气囊、自动驾驶系统等。动力方面,提供2.0L和2.5L两种选择。

热点资讯 11.23
数字世界中的惊人骗局:一项研究揭示中国近1.6亿人在陷入网络钓鱼的陷阱中

数字世界中的惊人骗局:一项研究揭示中国近1.6亿人在陷入网络钓鱼的陷阱中

乐欣户外作为全球最大的钓鱼装备制造商之一,其市场份额占据全球25.4%;近两个财年的业绩表现不佳,营业收入分别下滑31.5%和17.8%。乐欣户外积极开启自主品牌化转型,收购英国鲤鱼垂钓品牌Solar,未来计划在招股书中全面加强OBM业务,扩大自有品牌组合,打造新增长引擎。

热点资讯 11.23
爱玛电动车:业绩下滑,新日继续亏损,电鸡巨头三季度艰难

爱玛电动车:业绩下滑,新日继续亏损,电鸡巨头三季度艰难

电动汽车巨头的日子不那么好过:业界关注的焦点是需求整体放缓,同时面临国标新规实施带来的挑战。其中,爱玛科技2024年前三季亏损严重,主要原因是销售费用增加。此外,张剑被留置、立案调查的消息也引发了市场关注。

热点资讯 11.23
甘肃银行资产规模遭遇‘退步’情况,需要关注并进行应对措施

甘肃银行资产规模遭遇‘退步’情况,需要关注并进行应对措施

甘肃银行资产规模增长放缓,近7年来股价缩水90%;资产规模增长速度落后全国平均水平;市场份额倒数第三;罚金25万元;合规管理和金融违规受到关注。未来,甘肃银行还需面对内外挑战。

热点资讯 11.23
黄仁勋:英伟达股价将持续上涨,他预测的关键因素包括营收增长和技术创新

黄仁勋:英伟达股价将持续上涨,他预测的关键因素包括营收增长和技术创新

Nvidia 公司宣布,在 2025 财年第三季度其营收达到创历史最高纪录的 351 亿美元。该成就得益于两个关键趋势:一是价值万亿美元的传统 IT 架构的现代化改造,二是人工智能工厂的兴起,前者以支持机器学习和人工智能为目标,后者则旨在制造具有自主 AI 特性的基础设施。Nvidia Hopper 和 Blackwell 架构芯片、Omniverse 平台等产品对这两个趋势起到了重要作用。此外,随着新技术的发展,Nvidia 还受益于新的业务增长机会,包括在全球范围内加速建设和运营区域性的 AI 基础设施。

热点资讯 11.23
中国顶级数据服务商幻方量化,或因涉及‘券商业务’被查!高管团队人已神秘失踪

中国顶级数据服务商幻方量化,或因涉及‘券商业务’被查!高管团队人已神秘失踪

上海一家知名量化对冲基金公司幻方量化市场总监李橙因涉嫌涉及“券商会佣”被抓。据公司消息,李橙目前正在进行协助调查。公司确认李橙正参与此事,但具体情况尚未得知。该事件未对公司的正常运营产生负面影响,且产品表现尚可。此外,该公司年内已自购2.5亿元,并购买了一只名为“九章幻方沪深300量化多策略1号”的产品,该产品的收益超过10%。对此,业界人士认为,该公司所在的行业佣金水平相对较低,此次事件可能与这个因素有关。

热点资讯 11.23
中小商家渴望“流量平权”

中小商家渴望“流量平权”

今年双11,各大电商平台将商家减负作为比拼重点,并采取措施降低流量成本,同时电商需要将流量控制权部分交还给商家以实现所有商家的成本下降。面对越来越多的商家,特别是中小商家对双11高度内卷say no,他们选择退出大促。流量价格问题仍未得到真正缓解,中小商家要想在这场竞争中获胜,就需要提高获取自然流量的能力。电商平台需要寻找平衡,既要保护商家权益又要保证消费者的购物体验。

热点资讯 11.23
中颖电子受益于AMOLED显示驱动芯片量产后,有望释放强劲业绩驱动力

中颖电子受益于AMOLED显示驱动芯片量产后,有望释放强劲业绩驱动力

中颖电子强调专注芯片设计,尤其是偏专用MCU领域的份额。在全球市场,AMOLED显示驱动芯片正处于品牌市场进攻期。四季度为销售旺季,预计公司将实现营收增长。但需等待导入品牌后方可带来较好业绩驱动力。

热点资讯 11.23
中国联通准备与华为和中兴开展5G设备竞争性谈判采购,争夺市场份额

中国联通准备与华为和中兴开展5G设备竞争性谈判采购,争夺市场份额

中国联通将启动2024年5G网络设备集中采购,建议关注合作谈判供应商的竞争性谈判结果。

热点资讯 11.23