谷歌AI视频放大招!VideoPrism,万能通用视觉编码器,超越30项SOTA性能!

2024-02-25 热点资讯 关注公众号
    谷歌团队近日推出一款名为VideoPrism的通用视觉编码器,在视频理解领域刷新了30项SOTA性能记录。这款强大的AI模型,经过在包含3600万高质量视频字幕对和5.82亿个视频剪辑的大型数据集上训练,能够通过单一冻结模型处理多种视频理解任务,包括分类、定位、检索、字幕生成及QA问答。
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA    在Meta和谷歌等科技巨头纷纷跟进OpenAI的步伐,探索AI视频模型之际,VideoPrism以其独特的两阶段训练法脱颖而出。它首先利用对比学习将视频编码器与文本编码器进行对齐,然后通过全局蒸馏和标记式嵌入提炼进一步提升性能。实验中,VideoPrism在分类和时空定位任务上展现出卓越的能力,不仅超越了所有基准测试中的基线方法,而且在零样本视频文本检索、字幕生成以及科学领域的CV任务上也取得了显著进步。
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA    值得注意的是,VideoPrism在广泛的视频理解任务上均表现出了极强的通用性和泛化能力,其高效的预训练策略结合噪声并行文本数据,使得模型能够从各种视频信号中提取丰富的语义、外观线索、运动信息以及时空上下文,并且具备跨不同视频源的鲁棒性。
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA    此外,研究者们进行了消融研究,证明了VideoPrism设计架构的有效性,尤其是在促进模型理解和解析视频动作方面。综上所述,谷歌团队研发的VideoPrism通用视觉编码器为构建真正意义上的基础视频模型树立了新的标杆,并预示着视频分析技术将在各个科学领域取得重大突破。
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

上一篇:特朗普再赢一州!
下一篇:健康小站丨学会科学泡脚,就是关爱人体的“第二心脏”
更多更酷的内容分享
猜你感兴趣
谷歌宣布Android将转向libdav1d编码器,提升AV1视频支持

谷歌宣布Android将转向libdav1d编码器,提升AV1视频支持

阿里夫·迪基奇确认改用VideoLAN开源libdav1d编解码器来改善对AV1编码视频的支持,并表示大部分安卓手机都能通过该编解码器解码720p30的视频。 IT之家此前报道,与libgav1相比,libdav1d运行在CPU上的效率更高,即使低端设备也能流畅播放高画质的AV1视频,并且不会消耗过多电量。

热点资讯 04.20
英特尔终止SVT-HEVC开源视频编码器项目,推动技术进步与行业发展

英特尔终止SVT-HEVC开源视频编码器项目,推动技术进步与行业发展

英特尔开发的开源H.265/HEVC编码器(SVT-HEVC)计划中的 SVT-HEVC 在停止开发。此外,其上游代码库被归档为只读状态,缺少维护、错误修复、新版本或更新等支持。此外,英特尔不再提供对该项目的维护、错误修复、新版本或更新的支持。因此,如果您感兴趣独立开发项目或想为开源软件社区维护补丁,请创建自己项目分支。

热点资讯 08.25
国内AI视频大模型Sora究竟实力如何,能否在实际应用中挑战超越?

国内AI视频大模型Sora究竟实力如何,能否在实际应用中挑战超越?

美OpenAI发布的AI视频生成模odel Sora让国内视频大模型竞争更加激烈,其中国内有四大国产Sora已经上线。这些模型分别提供文生视频和图生视频功能,支持最长10秒视频生成,并且具备运镜控制、自定义首尾帧等功能。清影、Vidu等新成立的AI公司也在此过程中纷纷推出自家产品。测试结果显示,清影以30秒内快速生成而闻名,而Vidu则提供了全新的动画风格视频片段生成。可见,四种国产大模型在处理和理解语言的能力上存在较大差异。

热点资讯 08.08
Meta AI视频模型震撼:让视频编辑轻松无比,让P图逊色无几

Meta AI视频模型震撼:让视频编辑轻松无比,让P图逊色无几

Meta Movie Gen 是 Meta AI 发布的新款视频生成模型,它具有个性化视频生成、精确视频编辑和音频生成等功能。Meta Movie Gen 可以生成 1080P、16 秒、每秒 16 帧的高清长视频,并且可以简单输入文本实现复杂视频编辑。Meta Movie Gen 支持多种高级视频编辑功能,例如自动缩放、平移、旋转等。Meta Movie Gen 目前尚未公布具体的开放时间表,但已经取得了良好的反响。总的来说,Meta Movie Gen 是一款优秀的视频生成工具,未来可能会被集成到 Meta 自家的产品和服务中。

热点资讯 10.05
五十铃全新2.2升发动机,实现高效启程与持久续航提升
56%增扭与10%燃油效率的升级体验,让五十铃2.2升发动机焕然一新
五十铃新款2.2升发动机,大幅度提升了动力和燃油经济性

五十铃全新2.2升发动机,实现高效启程与持久续航提升 56%增扭与10%燃油效率的升级体验,让五十铃2.2升发动机焕然一新 五十铃新款2.2升发动机,大幅度提升了动力和燃油经济性

五十铃汽车推出全新D-Max皮卡和MU-X SUV搭载的2.2升“MaxForce”涡轮增压柴油发动机,功率提高56%,燃油效率提升10%,达到符合全球排放法规的要求。这款发动机使用了低摩擦活塞技术,有助于五十铃满足日益严格的排放法规,目前官方还未公布更多细节。

热点资讯 11.23
比亚迪负债率揭秘:正常运营还是隐藏危机?

比亚迪负债率揭秘:正常运营还是隐藏危机?

积极扩大产能的表现,同时也是为了保证公司有足够的现金流来应对可能的风险。根据相关数据显示,比亚迪第三季的负债为5113.33亿元,占总负债的77.91%,这是一个比较健康的负债水平。然而,如果未来业绩出现下滑,可能会对公司的现金流产生影响,因此比亚迪需要注意销量波动对现金流的影响,并且要合理管理和运用负债。 比亚迪的负债率虽然较高,但是由于公司有着较强的偿债能力和良好的现金流管理,所以并不会出现所谓的“暴雷”危机。而且,在新能源、智能化等领域投入巨大且增长迅速的新势力企业也面临着同样高的负债率,如赛力斯、北汽蓝谷、蔚来的2024年第三季度资产负债率分别高达89.02%、85.02%,79.39%。这说明比亚迪在拓展业务和扩大规模的过程中,需要谨慎对待负债问题。 总的来说,比亚迪目前的负债情况处于一个相对合理的范围内,未来若能保持良好的发展前景,企业可以更好地应对债务问题。

热点资讯 11.23
2024广州国际车展:MG有望推出四款新车,除了销量还有品牌提升期待

2024广州国际车展:MG有望推出四款新车,除了销量还有品牌提升期待

2024年广州车展,MG狂发新品!当天上午,MG ES5发布;下午,2025款 MG7震撼登场,持续发布两款新车。俞经民表示明年,MG将在全球推出四款新车,每季度都有新品上市活动。同时,线上还举行全民颠球挑战,邀请用户体验ES5。 MG始终坚持打造“全球轿跑世家”,打造运动性能、动感驾趣的品牌基因。此外,也将推出中大型新能源SUV和搭载固态电池的新款轿车。推广方面,MG率先开启宠物友好模式展厅,开展全民颠球挑战等用户活动,吸引更多用户到展厅感受友好氛围、体验顶级驾趣。

热点资讯 11.23
哪吒释然放下压力,成功实现互联网逆袭

哪吒释然放下压力,成功实现互联网逆袭

哪吒汽车疑似寻求外部资源资金扶持。目前,南宁产业投资集团已与合众汽车达成了战略合作,为哪吒汽车的海外供应链提供了支持。此外,南宁产业投资集团还将提供供应链金融支持,帮助哪吒汽车管理原材料采购、生产、物流等业务。同时,哪吒汽车国内三个生产基地也已经停产近一个月,部分生产线工人被裁员。在海外市场方面,哪吒汽车急需找到新的“落脚点”。此次合作将帮助哪吒汽车保障海外供应链的稳定,并确保其海外车型的生产与交付。最后,哪吒汽车已经寻求到了外部资源的支持,而这些都对公司的未来前景产生了积极的影响。

热点资讯 11.23
数据统计:中国钓鱼爱好者数量惊人,钓鱼第一股概念升温!

数据统计:中国钓鱼爱好者数量惊人,钓鱼第一股概念升温!

随着中国的钓鱼市场规模持续增长,2023年将达到318亿元,同比增长6.3%;同时,乐欣户外已成为全球最大的钓鱼装备制造商,市场份额为20.4%。在当前社会环境下,钓鱼运动吸引了大量年轻人,中国钓鱼参与者数量持续增加。此外,乐欣户外计划通过IPO募集资金来支持品牌开发及推广、产品设计及开发等。

热点资讯 11.23
金融危机爆发:Synapse公司破产引发储户大量财产损失

金融危机爆发:Synapse公司破产引发储户大量财产损失

遭遇欺诈事件,导致大量客户资金被冻结和受损,凸显了金融科技领域系统的风险性。Synapse及其合作银行在处理客户资金账户方面的行为引发了一场金融危機。

热点资讯 11.23
中国红牛再发声:传递品牌精神与价值,引领行业发展

中国红牛再发声:传递品牌精神与价值,引领行业发展

泰国天丝指责华彬集团在合资公司体系外生产红牛产品;中国红牛反驳指责,称50年协议书奠定红牛在中国市场基本的商业模式和合资各方的合营规则;最高人民法院终审判决驳回泰国天丝关于华彬集团存在利益输送行为的指控。 泰国天丝已就华彬集团侵犯其50年商标协议提起诉讼;华彬集团反驳声明认为已签署协议,并指中食、中浩两家公司亦为合营方;最高人民法院终审判决认定华彬集团不存在利益输送行为,泰国天丝败诉。这起涉及跨国品牌的纠纷将对中国乃至全球饮料行业产生深远影响。

热点资讯 11.23
更严厉的监管手段:上交所年内已罚多起撤单项目投行与保代

更严厉的监管手段:上交所年内已罚多起撤单项目投行与保代

华泰联合证券及刘鹭等3名保荐代表人在南京轩凯生物科技股份有限公司首次公开发行股票并在科创板上市申请过程中,未充分关注并审慎核查相关事项,导致申请人撤回申报文件,审核终止。上交所对其予以监管警示,并决定对华泰联合证券予以监管。

热点资讯 11.23
固态电池生产线:引领者已现 媒体报道中,众品牌竞争激战

固态电池生产线:引领者已现 媒体报道中,众品牌竞争激战

安徽安瓦新能源科技有限公司全面冲刺量产固态电池,降低固定资产投入30%,计划2025年推出第二代固态电池和第三代固态电池,力图在2026年推出固态电池,覆盖1500km以上车型。

热点资讯 11.23
AI制作3A画质的逼真视频!无限生成在线互动平台

AI制作3A画质的逼真视频!无限生成在线互动平台

第一个AI基础世界模拟器The Matrix问世,可实现无限长、高保真720p真实场景视频,实时交互。是由全华人团队打造,作者分别来自阿里巴巴、香港大学、滑铁卢大学和加拿大AI研究机构Vector Insititute的研究人员。该模型具有丰富的交互体验和强大的计算能力。

热点资讯 11.23