科学家们创新神经网络架构,为下一代超大规模神经形态模型铺路

2024-03-16 生活常识 关注公众号
    【神经形态计算:革新范式,挑战极限】
科学家为脉冲神经网络引入新架构,为未来基于神经形态网络的超大模型奠定基础    神经形态计算,这一类脑计算领域的新兴力量,正在以其独特的脉冲神经网络(Spiking Neural Network, SNN)在神经形态芯片上构建起一场低功耗智能革命。它不仅是算法驱动硬件设计的新范式,更是有望取代传统AI的潜力股,凭借其显著的节能优势。
科学家为脉冲神经网络引入新架构,为未来基于神经形态网络的超大模型奠定基础    要全面理解神经形态计算,必须从系统层面着眼,兼顾算法与硬件的相互融合。其中,“类脑”特性表现为脉冲神经元能够模拟生物神经元结构与功能,通过仿生复杂时空动态和利用脉冲信号传递信息,使得脉冲神经元模型理论上超越了基于传统人工神经网络(Artificial Neural Network, ANN)的人工神经元模型,在计算特征上独具一格。
科学家为脉冲神经网络引入新架构,为未来基于神经形态网络的超大模型奠定基础    运行在神经形态芯片上的脉冲神经网络展现出独特优势:只有当输入脉冲信号时才会触发稀疏计算,其余时间保持静息状态,这种脉冲驱动机制成为实现低功耗神经形态计算的核心要素。
科学家为脉冲神经网络引入新架构,为未来基于神经形态网络的超大模型奠定基础    尽管当前脉冲神经网络在任务性能上尚无法匹敌传统人工神经网络,但在边缘计算场景中,对低功耗、低时延的需求为神经形态计算带来了巨大的应用潜力。一旦解决算法层面的性能瓶颈,结合神经形态芯片的优势,神经形态计算将在实际应用中爆发性地展现其巨大价值。
科学家为脉冲神经网络引入新架构,为未来基于神经形态网络的超大模型奠定基础    中国科学院自动化所李国齐研究员及其团队深入挖掘神经形态计算的性能潜力,指出该领域目前主要围绕脉冲卷积神经网络(Convolutional Neural Network, CNN)展开,而忽略了如Transformer架构这样的深度学习创新成果。直至他们提出一系列Spike-driven Transformer模型,才将脉冲驱动范式成功融入Transformer架构,从而拓宽了神经形态计算的研究边界。
    李国齐早期在清华大学类脑计算中心施路平教授团队的工作中,已着手解决脉冲神经网络训练的基础问题,但受限于编程框架匮乏、二值脉冲不可导等问题,脉冲神经网络长期以来停留在浅层网络阶段,远落后于传统深度学习的性能表现。然而,随着技术难题的逐一破解,例如2021年李国齐团队在AAAI会议上发表论文解决了深层脉冲神经网络的训练问题,并随后推出开源训练框架SpikingJelly,不仅降低了学习门槛,还提出了通用残差架构,使脉冲神经网络能构建数百层深度且避免脉冲退化现象,有效突破了大规模脉冲神经网络训练的技术瓶颈。
    面对脉冲神经网络与Transformer架构的结合问题,李国齐团队决定以“脉冲驱动自注意力算子”作为突破口。他们创造性地将Transformer的关键组件——自注意力机制改造成脉冲驱动形式,并通过反复实验设计出可行的脉冲驱动自注意力算子,展现了优异的线性运算和稀疏计算特性。在此基础上,团队进一步探索了脉冲神经网络的meta架构,旨在缩小与传统人工神经网络在架构设计上的差距。
    经过不懈努力,团队成功研发出仅包含稀疏加法操作的脉冲驱动Transformer,并将其纳入下一代神经形态芯片设计的蓝图之中。这一开创性研究成果被收录于2024国际表征学习大会(ICLR 2024),题为《脉冲驱动Transformer V2:元脉冲神经网络架构启发下一代神经形态芯片设计》。
    该成果不仅可用于边缘神经形态计算场景,比如采用“神经形态视觉+神经形态计算”的组合方案,实现低至0.42mW的超低静息功耗和低于10mW的典型神经形态视觉任务场景功耗,赋予芯片“永远在线”的特性;同时,也为超大规模神经形态网络设计提供了关键技术支撑,尤其是在大模型时代背景下,纯加法的Transformer架构及线性算子设计有望大幅降低能耗,为未来低功耗类脑脉冲大模型的发展铺平道路。
    展望未来,李国齐研究员充满信心地预测神经形态计算领域即将迎来大发展,尤其是在人工智能大模型时代,能耗问题愈发凸显之际,融合类脑时空动态的新一代线性脉冲神经网络架构的探索显得至关重要。他带领的团队将持续攻克难关,包括实现更大规模的脉冲神经网络模型、推广至更多任务类型、构建类脑脉冲大模型架构以及设计适配新型硬件计算架构,力求在训练方法、架构设计、模型规模、任务性能等方面取得系统性突破,引领神经形态计算迈向更广阔的实用领域。

上一篇:为什么女性“那几天”会性情大变?经期的五大疑问
下一篇:男性治脱发 勿触四误区
更多更酷的内容分享
猜你感兴趣
中国开启大规模光子芯片开发,迈向百万神经元级别光神经网络的新时代

中国开启大规模光子芯片开发,迈向百万神经元级别光神经网络的新时代

清华大学研究团队成功打造全球首款大规模干涉-衍射异构集成芯片“太极”,实现大规模光子芯片的创新应用。此次研究成果不仅开启了AI的新篇章,更有望满足AI的需求,助力中国走向亿像素大场景智能分析和智能化无人系统的时代。

热点资讯 04.12
科学家揭示深度神经网络的线性性质:未来构建更优模型融合算法的关键探索

科学家揭示深度神经网络的线性性质:未来构建更优模型融合算法的关键探索

ine Mode Connectivity,认为它是一个显著的现象,与典型的多模态跨层感知(MMSE)相区别。通过多次独立优化并采取相应的策略,可实现不同最优点之间的关联,并可能达到较高的L2范数,这是一种理想状态,意味着损失或准确性之间几乎没有差值。这为深度学习中的最优化问题提供了新的视角和解决思路,进一步推动了理论与实践的交叉研究。

生活常识 07.16
探索顶刊:大语言模型如何开创神经科学新机遇?

探索顶刊:大语言模型如何开创神经科学新机遇?

大语言模型(LLMs)是用于处理和生成自然语言文本的新工具。本文介绍了LLMs的属性定义,并反思了它们如何被用来重新构建经典的神经科学问题,以提供新的答案。LLMs有潜力通过添加有价值的元信息来丰富神经科学数据集、总结大量信息来源、促使不同信息源融合以及帮助确定最有效地把握大脑中的现象的认知概念。此外,LLMs还可以应用于生物序列的研究,例如通过蛋白质语言模型预测遗传变异的表型后果。

生活常识 03.05
超越常规:基于异质学习框架HIFI的高效、创新和强大的神经网络研究

超越常规:基于异质学习框架HIFI的高效、创新和强大的神经网络研究

北京航空航天大学邓岳教授和清华大学郭雨晨助理研究员提出了一种基于自抑制神经元的异质脉冲框架(Heterogeneous spiking Framework with self-inhibiting neurons,HIFI),显著提升了神经网络的效率和准确性,展示了其在复杂认知任务中的应用潜力。相关研究成果以“Biologically inspired heterogeneous learning for accurate, efficient and low-latency neural network”为题发表于《国家科学评论》。HIFI原理图HIFI模型在生物学中,自抑制突触通过调节过去脉冲对当前输入的影响,使单个神经元能够实现自我调控的记忆效应。基于这一概念,研究团队在经典的Leaky Integrate-and-Fire(LIF)模型中引入了自抑制环路,构建自抑制脉冲神经元( self-inhibiting neuron),实现了神经元层次的记忆效应。在此基础上,团队受到大脑神经元异质性的启发,提出了一种双层嵌套优化的异质学说

生活常识 11.22
这些现象可能预示肺癌风险,请务必进行CT检查。

这些现象可能预示肺癌风险,请务必进行CT检查。

肺部结节在发展过程中可能伴有其他部位转移灶,其中即使是最小的结节也可能转化为恶性。这种情况下可能会出现杵状指,这是一种常见的肺癌早期症状。为了准确判断结节是否为恶性,建议进行活组织检查或手术取样。此外,观察结节的变化也很重要。

生活常识 11.22
掌握两项关键要点,迎接小雪节气!让寒冷无法侵袭你的生活

掌握两项关键要点,迎接小雪节气!让寒冷无法侵袭你的生活

小雪节气到来,北方降雨变雪,南方湿度升高,且易引发疾病,小雪节气养生要注意防湿寒热、避寒暖身。要特别注意泡脚、背部保暖、晒太阳,多喝水、保证充足睡眠,吃些养肝的食物如小米、核桃等。同时,中医认为,“久卧不动则伤肾”,小雪后需定时做运动,提高免疫力。

生活常识 11.22
10种富含蛋白质的素菜,让你每天都有丰盈能量!

10种富含蛋白质的素菜,让你每天都有丰盈能量!

吃干锅肉片、干锅毛豆,这样既能满足口感的需求,又能控制脂肪摄入量。 1. 每次外出就餐,尝试点几道素菜。 2. 干煸蔬菜时,油量通常比炒菜高出两倍。 3. 面对不同素食菜品,不要只注重油脂数量,更要注意营养成分。 4. 多样搭配烹饪方式,避免过多依赖油炸食物。 5. 尽可能选择蒸、炒、拌等健康烹饪方法,减少油脂摄入。 6. 注意食材的新鲜度和营养价值,合理选择菜品。 7. 在饮食习惯上要多样化,不偏食,均衡摄入各种营养物质。 8. 学会识别油炸食品是否含有较高脂肪量,保证身体健康。

生活常识 11.22
颠覆性科技突破!AI重塑定向蛋白质进化机制,提升了100倍特异性

颠覆性科技突破!AI重塑定向蛋白质进化机制,提升了100倍特异性

方面,复杂的人工生物过程导致迭代次数增多,延长了实际应用的时间。本文提出了一种名为 EVOLVEpro 的新型 AI 平台,利用深度学习算法对蛋白质序列进行优化,实现了对多步骤生物化学过程的高度智能化控制。该平台在多项临床试验中的结果证明了其优秀的性能和广泛的应用前景,将成为未来蛋白质设计、基因编辑以及药物开发的重要工具。研究成果以 "Rapid in silico directed evolution by a protein language model with EVOLVEpro" 为题,在顶级科学期刊《Science》上发表。这为跨领域的应用提供了全新的解决方案,并将深刻影响生物医学领域的发展。

生活常识 11.22
详解:哈尔滨冰雪大世界的冰层藏身处具体位置是怎样的?

详解:哈尔滨冰雪大世界的冰层藏身处具体位置是怎样的?

"随着农历十二月的到来,东北地区的冰雪季即将来临,关注度极高。为了满足这个季节的需求,位于哈尔滨冰雪大世界的存冰工作已经顺利完成,共有20万立方米天然冰体储备,部分经过特殊处理,具有很高的保存价值。"

生活常识 11.22
了解为何青海的湟鱼满湖皆是:我国成功保护20多年的珍贵物种

了解为何青海的湟鱼满湖皆是:我国成功保护20多年的珍贵物种

青海湖湖面清澈如镜,被誉为“东方明珠”。其湖岸草原美丽壮观,是候鸟的天堂。这里的鱼类特别多,有保护20多年的湟鱼。然而,为何这些数量庞大的鱼类仍被视为二级保护动物呢?原因在于它们的身体形态和习性与鲤科鱼类有所不同,因此被命名为“湟鱼”。

生活常识 11.22
发现宇宙最快速恒星可能并非人类驾驶:智能外星人的探索可能开启新的天文学领域

发现宇宙最快速恒星可能并非人类驾驶:智能外星人的探索可能开启新的天文学领域

的机体会沿着相反的轨道移动,而如果他们尝试在不同地点启动机器,可能会形成两个相反的恒星轨道。这些外星文明可能希望通过这样的方式影响恒星运动,以使其更接近目的地。但是,由于他们需要长时间的星际旅行,并且要避免太阳等外部干扰源的影响,这个方法对于这些外星文明来说可能并不是最佳选择。

生活常识 11.22
亲子合作:共筑孩子美好未来的关键

亲子合作:共筑孩子美好未来的关键

只是家长与孩子日常交流的表面现象,而真正关键在于理解孩子的需求,才能引导孩子健康发展。此外,家长还需要学习一些实用的育儿技巧,如设立适当的规则,给予孩子足够自由的空间,并及时处理孩子的情绪问题。总的来说,这场家长课堂是一次有益的分享和学习机会,家长们收获颇丰。

生活常识 11.22
警惕!网络安全威胁正袭中小学生,网络诈骗近万元事件频发

警惕!网络安全威胁正袭中小学生,网络诈骗近万元事件频发

最近中小学生群体中掀起了一场名为“谷子”的热潮,其中部分地区出现了一些欺诈行为。一些诈骗分子以低价出售“谷子”为诱饵,对未成年人实施诈骗。郭静是一位高中生,平时特别喜欢收集动画角色的“谷子”,会留意各种购买渠道,但有时会被骗。李由也在网上遇到类似的情况,他曾高价购买一款游戏角色,但结果却发现卖家已经将他拉黑。

生活常识 11.22
孩子们的冬季食积不用愁!揭秘几个穴位,帮你解决困扰

孩子们的冬季食积不用愁!揭秘几个穴位,帮你解决困扰

寒冷来临时,不少人体内油脂增加,导致口臭、睡眠不安等症状出现。广东省中医院治未病中心健康咨询门诊主治医师尹翎嘉建议,孩子若食用过多食物而引发上述问题,应减少晚餐摄入量,并可按上述穴位推拿促进消化。同时,要注意控制糖分摄入,防止血糖过高引发并发症。此外,在临床上,对于糖尿病的误区有很多,敬请关注。11月25日,首都医科大学附属北京中医医院心血管科副主任医师来晓磊将在直播间分享相关知识,助力大家更好地管理自身健康。

生活常识 11.22