YOLOv9登场:全新实时目标检测神器,轻量级与大型模型通通秒杀!v7作者力作。

2024-02-25 热点资讯 关注公众号
    【量子位 | 公众号 QbitAI】最新报道:在YOLOv8发布仅仅一年后,科研界再度沸腾,因为YOLOv9横空出世!这一次,它凭借“可编程梯度信息”这一创新概念,为深度学习目标检测领域带来颠覆性变革,不仅轻松超越YOLOv8,在轻量级到大型模型的全维度表现中一举登顶SOTA!
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    YOLOv9的核心亮点在于其运用“可编程梯度信息”,旨在解决深度网络在传输数据过程中造成的大量信息丢失问题,特别是在应对复杂多变的目标检测任务时。该技术通过提供全面的输入信息以计算目标函数,从而获取精确可靠的梯度信息来更新网络权重。这一革新性的PGI(可编程梯度信息)结构如图所示,包括路径聚合网络、可逆列以及提出的PGI机制,巧妙地通过主分支、辅助可逆分支和多级辅助信息三大部分组成。
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    值得注意的是,YOLOv9针对可逆架构在浅层网络性能不足的问题,设计了独特的方法,允许主分支通过辅助监督机制生成有效梯度而非强制保留完整原始信息,使得该方法同样适用于较浅层网络。
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    此外,YOLOv9的第二大贡献是提出了一种全新的轻量级网络架构GELAN,它借鉴并融合了CSPNet和ELAN的设计理念,能够灵活支持任何计算块,并验证了PGI的有效性。
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    在MS COCO数据集上进行的严格效果验证显示,YOLOv9无论是在小型、中型还是大型模型上均取得了显著提升。与现有实时目标检测算法相比,YOLOv9在减少参数量的同时,提升了检测精度,其中YOLOv9-C相比于YOLOv7 AF,参数量减少了42%,计算量减少21%,却实现了相同的53% AP;而YOLOv9-X则在YOLOv8-X基础上,参数量减少15%,计算量降低25%,AP值大幅提高了1.7%。
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    更令人惊叹的是,当比较预训练于ImageNet的模型时,YOLOv9在大模型参数利用效率上甚至优于RTDETR,尤其在深度模型中,YOLOv9借助PGI的优势,仅需64%的参数就达到了与RT DETR-X相媲美的准确率。
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    此次YOLOv9的研发团队由Chien-Yao Wang等科研人员组成,这位一作曾参与开发了YOLOv7及YOLOv4,现任职于台湾省Academia Sinica信息科学研究所。
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    最后值得一提的是,几个月前知乎上的一条提问如今成真:“如果开题使用YOLOv8做毕业设计,期间YOLOv9发布了怎么办?”虽然新版本迭代迅速,但正如网友所言,最重要的是选取合适的基准算法,并在此基础上进行创新突破。
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    YOLOv9论文地址:https://arxiv.org/abs/2402.13616
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    源码GitHub链接:https://github.com/WongKinYiu/yolov9
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    参考资料:
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    1. https://twitter.com/skalskip92/status/1760717291593834648
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7    2. https://www.zhihu.com/question/618277378
YOLOv9来了:实时目标检测新SOTA,完胜各种轻量或大型模型!出自v7

上一篇:这个研究生一年发表SCI论文426篇,平均影响因子10.99,2023年中国科学院遗传与发育生物学研究所
下一篇:长途旅行警惕“经济舱综合征”
更多更酷的内容分享
猜你感兴趣
智谱AI视频大模型上线,实时生成6秒短视频,记者现场体验实测效果

智谱AI视频大模型上线,实时生成6秒短视频,记者现场体验实测效果

据报道,Sora引发公众对大模型生成视频能力的期待后,国内企业纷纷开启文生视频领域的探索。国内视频公司快手近期推出了模型可灵,以便于用户生成文生视频;另一家AI公司智谱AI则宣布进军视频生成领域,发布AI生成视频模型清影。 7月26日,智谱CEO张鹏在智谱Open Day上宣布,AI生成视频模型清影正式上线智谱清言。新京报贝壳财经记者实测了清影的视频生成能力,并现场采访了张鹏。记者实测发现,清影可选择文生视频与图生视频两种模式,其中文生视频可通过输入不超过1000个文字的方式进行视频生成,进阶参数还包括视频风格、情感氛围、运镜方式等。记者尝试生成一段30秒的视频时,清影仅耗时约一分钟,成功生成了一段约6秒长的草原牛仔视频。 此前,记者也测试过可灵,但结果显示其生成的视频长度相对较短,可能是因为需要收集更多bug的原因。对于这种新推出的AI生视频大模型,张鹏表示正在收集bug过程中,并欢迎用户提出建议和反馈。清影有潜力生成高达1440x960分辨率的高清视频,同时仍在优化中,需等待一段时间才能全面展示其优势。

热点资讯 07.27
基于空间大模型和通用机器人的新视角——Coatue重量级报告

基于空间大模型和通用机器人的新视角——Coatue重量级报告

本文介绍了Coatue在最新研究报告中的重点观点,他们认为AI机器人具有巨大的潜力,并预测这将是一场颠覆性的科技浪潮。尽管存在商业化难题和早期资本开支巨大等问题,但随着深度学习和空间感知技术的进步,未来的机器人可能会成为“通用机器人”。文章还讨论了当前机器人面临的挑战和解决方法。

热点资讯 07.22
斯坦福AI项目作者对中国大模型致歉,承诺撤下相关模型

斯坦福AI项目作者对中国大模型致歉,承诺撤下相关模型

斯坦福大学AI团队研发的开源模型“Llama3-V”抄袭国内清华大学和面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V。斯坦福团队两名作者承认错误,并表示将撤下该模型。斯坦福人工智能实验室主任表示谴责并对其抄袭行为表示赞赏。事件起源于5月29日,该团队声称只需500美元就能训练出超越GPT-4V的多模态大模型。随后,网友发现其模型结构和代码与面壁智能的模型极其相似,仅修改了一些变量名。此外,该团队的Llama3-V模型还具有与其相似的分词器,包括后者的特殊符号。

热点资讯 06.04
苹果大模型震撼登场:300亿参数、多模态、MoE架构,华人作者占半数以上!

苹果大模型震撼登场:300亿参数、多模态、MoE架构,华人作者占半数以上!

苹果宣布放弃10年造车项目后,一部分团队转向生成式人工智能。近日,苹果公布自家30B参数的多模态大模型研究成果,并探讨了不同架构组件和数据选择的重要性。该研究发现图像分辨率、视觉编码器损失和容量以及视觉编码器预训练数据对建模设计的重要性顺序排列。同时,交错和纯文本训练数据对于少样本和纯文本性能很重要,而字幕数据对零样本性能最重要。这些趋势在微调后仍然存在,表明预训练期间呈现出的性能和建模决策在微调后得以保留。

热点资讯 03.17
苹果即将在中国台湾厂批量生产4纳米A16处理器,这标志着未来移动设备性能的大飞跃

苹果即将在中国台湾厂批量生产4纳米A16处理器,这标志着未来移动设备性能的大飞跃

苹果公司将利用台积电的4nm工艺在其位于美国亚利桑那州的晶圆厂进行生产移动处理器。这一消息标志着台积电在亚洲地区的布局即将完成,也预示着苹果将向半导体行业注入更多的资本和技术。此外,考虑到苹果对于高质量制造和环保要求,这也将推动半导体产业的进步和发展。未来,台积电将在美国亚利桑那州凤凰城建设三座晶圆厂,分别负责制造4nm、3nm和更先进的制程技术的芯片。这一举措表明台积电将继续加强其在亚洲市场的地位,并在未来几年继续投入资源进行创新和投资。

热点资讯 09.18
以色列释放5000部手机进行军事行动

或者:

以色列秘密安置了5000部爆炸装置,未引起公众关注

以色列释放5000部手机进行军事行动 或者: 以色列秘密安置了5000部爆炸装置,未引起公众关注

黎巴嫩寻呼机大规模爆炸事件,外界普遍认为以色列为袭击策划者。真主党订购5000台寻呼机中安置爆炸物,消息人士指其阴谋暴露。黎巴嫩安全领域高级消息人士证实真主党近几个月引进的AP924型寻呼机为诱发此次爆炸原因。调查发现以色列情报机构在生产阶段修改炸弹内部电路板,导致无人察觉。近3000名黎巴嫩居民受伤,其中真主党武装人员及伊朗驻黎巴嫩大使受伤。

热点资讯 09.18
专家预测:气候变暖催生更多罕见水龙卷现象

专家预测:气候变暖催生更多罕见水龙卷现象

水龙卷是由强烈风切变引导上升气流形成的旋转空气柱,常呈现出漏斗云形态。在极端不稳定的大气环境下,以及近地面存在强风切变时,水龙卷往往会出现。

热点资讯 09.18
阿联酋AI公司G42与英伟达签署合作协议:中国将获得AI芯片采购许可

阿联酋AI公司G42与英伟达签署合作协议:中国将获得AI芯片采购许可

美国批准英伟达向阿联酋提供H100和H200加速器,为AI布局增添信心;G42由于美国出口管制政策受限无法购买英伟达GPU,押注于美关系以推动技术成长并摆脱石油依赖;G42数据中心采用西方供应商硬件构建,仅保留中国部件以防黑客入侵。微软投资15亿美元与G42合作拓展Azure云业务,加强两国关系。

热点资讯 09.18
岳欢:是否存在中国势力对韩国的威胁?韩国民众疑虑加剧

岳欢:是否存在中国势力对韩国的威胁?韩国民众疑虑加剧

支付宝

热点资讯 09.18
56岁谢广坤老来得子,在豪华酒店大办百日宴,赵四拖着一大箱子随礼

56岁谢广坤老来得子,在豪华酒店大办百日宴,赵四拖着一大箱子随礼

唐鉴军老来得子喜庆十周年的百日宴上发生笑料:众明星前来祝福却仅收到数百元红包。

热点资讯 09.18
惊现美丽海南,全新物种——金樽水玉杯引人瞩目!

惊现美丽海南,全新物种——金樽水玉杯引人瞩目!

中国科学家发现了新物种“金樽水玉杯”,它是一种小型全菌根异养草本植物,生长于热带雨林中。这一发现标志着海南热带山地雨林保护状况良好,并提供了丰富的植物物种多样性资源。

热点资讯 09.18
山西高中生夜深仍坚持学习遭通报:一份自我认识手册发放至全班

山西高中生夜深仍坚持学习遭通报:一份自我认识手册发放至全班

山西怀仁一高中生被记严重警告处分,系在晚10点10分左右上厕所所致。据称,校方规定睡前10点20分熄灯,学生不得上厕所或走动,如有特殊原因可提前通知。而今这名学生因身体不适才上厕所,受到处罚。校方表示,该规定已录入学生管理手册中,将于开学前进行复习。

热点资讯 09.18
秋收黄金季,鱼虾满仓,各地农业丰收再创新高

秋收黄金季,鱼虾满仓,各地农业丰收再创新高

河南全力打造玉米、小麦高产示范区 山东沿海城市迎来海产品收获黄金季 河北沧中捷产业园区高粱平均亩产超700斤 各地区加速推进粮食产能提升行动 聚焦国家新一轮千亿斤粮食产能提升行动

热点资讯 09.18
完美世界剧场版蝉联第一?网友惊叹:黑幕一目了然!

完美世界剧场版蝉联第一?网友惊叹:黑幕一目了然!

《完美世界》动画剧场版“火之灰烬”开播后评分下降引发争议,上线仅3万票房却翻倍。此外,剧中抄袭现象严重且质量不高,使得剧场版遭受大量骂声并引起官方不满。

热点资讯 09.18