破万亿参数,推翻大模型内存壁垒!万字深度解读:神经网络量化的本质探索

2024-02-16 热点资讯 关注公众号
    【新智元报道】
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    :桃子 好困
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    【导语】随着大模型的推理和训练日益复杂化,全球科技巨头如英伟达、AMD、英特尔、谷歌、微软、Meta、Arm、高通、MatX以及Lemurian Labs等纷纷投入到全新的硬件解决方案研发之中,以应对这一挑战。量化技术在加速神经网络性能上发挥了关键作用,从32位逐步精简至8位,通过较低精度数字格式成功突破了数十亿参数模型的内存瓶颈。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    Semianalysis近期发表的文章深度剖析了神经网络量化的现状,文章丰富详尽,涵盖了浮点与整数原理、电路设计注意事项、块浮点、MSFP、微缩格式、对数系统等关键技术,并特别讨论了量化与推理中数字格式的区别,以及高低精度训练方法。同时,面对量化带来的精度损失问题,展望了未来模型发展的可能方向。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    各硬件开发商正在积极探索如何扩展当前流行的8位格式(如FP8和Int8),其中就包括英伟达、AMD、英特尔等企业所采用的技术。矩阵乘法作为现代机器学习模型的核心计算单元,在GPT-3这样的大型语言模型中,每层涉及大规模矩阵运算,单个元素的计算就需要高达12288次乘法及加法操作。芯片上的融合乘加(FMA)单元通过并行处理,极大地提高了运算效率。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    数字格式的设计目标主要分为两点:一是实现卓越的能源和面积效率,这主要取决于权重和激活所使用的数字格式;二是既要精确存储海量权重,又要尽可能减少位数占用,以节省内存容量和带宽,这就依赖于存储权重的数字格式。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    针对芯片效率目标,文章深入探讨了各种基本数字格式,包括无符号整数、负整数、定点数以及浮点数。浮点数凭借其科学记数法的优势,有效解决了表示大动态范围的问题,而整数格式在低精度场景下更具成本效益。然而,当追求更高准确度时,浮点格式因其能更好地匹配神经网络中的数值分布而受到青睐。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    为了进一步提升准确性,业界提出了诸如对数系统、区块数字格式等多种创新方案。例如,NVIDIA在HotChips大会上提出的对数系统虽然能降低四舍五入误差,但存在加法器成本过高的问题。此外,像PAL等新兴格式也声称能在保持较低硬件成本的同时,提供超越FP16和BF16的精度和范围表现。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    推理阶段尤为注重成本和功耗优化,因此往往倾向于使用更经济、更紧凑的数值格式。市面上涌现多种工具可进行模型格式转换,既有无需重新训练的训练后量化技术,也有通过量化感知训练来适应新精度的方法。而在训练过程中,由于涉及到复杂的反向传播,对精度的要求更为苛刻,尤其是在权重更新环节。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    各大硬件厂商紧随黄氏定律的步伐,积极投入研发,寻求更低比特数、更高准确率与更好能效比的解决方案。Lemurian Labs和MatX等初创公司专注于独特数字格式的研发,而英伟达、AMD、英特尔、微软、Meta、Arm和高通则共同聚焦于Microscaling格式的应用。值得注意的是,尽管有统一标准的存在,但每个供应商仍需根据具体需求调整各种格式参数,以实现最大程度的优化。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化    总的来说,这场围绕神经网络量化技术的竞赛不仅关乎比特数的削减,更是关于挖掘硬件内部深层次复杂性的探索之旅,而各大厂商的前沿努力正为未来的AI硬件发展绘制出一幅激动人心的蓝图。
推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化

上一篇:英特尔俄亥俄州新晶圆厂设备运输遇阻,投产日期进一步推迟
下一篇:黄仁勋评OpenAI“7万亿”造芯传闻:用不上这么多钱,科技革新会降低AI成本
更多更酷的内容分享
猜你感兴趣
科学家揭示深度神经网络的线性性质:未来构建更优模型融合算法的关键探索

科学家揭示深度神经网络的线性性质:未来构建更优模型融合算法的关键探索

ine Mode Connectivity,认为它是一个显著的现象,与典型的多模态跨层感知(MMSE)相区别。通过多次独立优化并采取相应的策略,可实现不同最优点之间的关联,并可能达到较高的L2范数,这是一种理想状态,意味着损失或准确性之间几乎没有差值。这为深度学习中的最优化问题提供了新的视角和解决思路,进一步推动了理论与实践的交叉研究。

生活常识 07.16
阿里通义千问开源全新320亿参数模型,将七款大语言模型悉数全公开,打破行业壁垒,推动技术进步

阿里通义千问开源全新320亿参数模型,将七款大语言模型悉数全公开,打破行业壁垒,推动技术进步

阿里云开源的320亿参数Qwen1.5-32B模型,将为性能、效率和内存占用实现平衡,为企业和开发者提供更高性价比的选择。

热点资讯 04.09
中国科学院通过数学创新,探索解析深度学习在神经网络中的有效性

中国科学院通过数学创新,探索解析深度学习在神经网络中的有效性

度就是空间的高度和深度的复杂结合,而这种结合恰好对应了复杂的多重变化过程,而这个过程正是激活函数工作的核心。因此,盖阔决定寻找一种新式的激活函数,它能够在简化后仍保持高度的拟合能力。他尝试了许多不同的方法,并最终发现矩阵指数函数能够达到良好的效果。实验结果证实了他的理论猜想:当网络越深时,两层网络的拟合能力通常会是单层网络的两倍。 简单来说,盖阔试图找出能够使网络在处理复杂问题时表现得更好,从而可能在许多实际应用场景中取得成功的方法。

生活常识 10.29
【15分钟内完成定制化3D大模型训练,质量高个性化】——您的个人数字形象一站式解决方案

【15分钟内完成定制化3D大模型训练,质量高个性化】——您的个人数字形象一站式解决方案

浙江大学与字节跳动提出MimicTalk算法,在15分钟内可训练高质量、个性化的数字人模型。该项目已公开源代码和预训练权重,对未来基于数字人通用模型的个性化数字人算法研究提供参考。叶振辉在NeurIPS等会议上发表论文,钟添芸硕士学位论文提出个性化精品数字人概念。

热点资讯 11.02
2021年全球汽车市场排行榜:哪些车企全年表现不佳?- 一句话点评

2021年全球汽车市场排行榜:哪些车企全年表现不佳?- 一句话点评

的。汽车市场依然呈现出了增长趋势,尤其是新能源领域的表现,各自主企业和合资企业在市场占有率方面都有所提升,而特斯拉由于受到其他因素的影响,其销售表现并不理想。本文主要分析了10月份狭义乘用车批发销量的变化情况,以及各大自主和合资企业的表现和趋势。

热点资讯 11.23
蔚来换电冷清无人问津,奇瑞依靠固态电池弯道超车,中国电动汽车再创辉煌!

蔚来换电冷清无人问津,奇瑞依靠固态电池弯道超车,中国电动汽车再创辉煌!

固态电池将是未来新能源车的重要发展趋势。然而,其安全性和生产成本等问题还需解决。据报道,一块搭载固态电池的电动汽车在被切块后仍能正常工作,并有望在2026年上市,预计其纯电续航将达到1500km。尽管如此,固态电池的成本仍较高,且良品率还需提高。对于蔚来的蔚来ET7车型,其搭载的正是全固态电池。

热点资讯 11.23
天弘余额宝投资价值增长放缓:富裕人群流失严重?

天弘余额宝投资价值增长放缓:富裕人群流失严重?

天弘余额宝曾经作为最大的货币基金之一,在2018年开启混合策略,后来逐渐减弱吸引力,至2024年夏天达到最高份额1.95亿份,占比仅为0.03%。同时,与其他货币基金相比,天弘余额宝的收益表现也有所下滑,其7日年化收益已经从历史高峰降至1.31%。 尽管如此,天弘基金在非货基金领域仍然面临挑战。数据显示,目前管理规模超过10亿元的基金经理非常稀少,且在非货基金市场的表现糟糕。 为了提高非货基金的表现,天弘基金将加大培养知名基金经理的努力。事实上,早在成立之初,黄辰立和韩歆毅都是公司的创始人之一,曾共同创立了天弘余额宝。在此之后,两者的关系一度变得复杂,特别是在蚂蚁集团发生合并后,人们对天弘基金的未来持谨慎态度。 近年来,天弘余额宝遭遇了一些挑战,包括如何保持竞争力以及吸引更多的投资者。最近,该公司发布了一项重要信息,即原董事长韩歆毅因为工作原因离职,由黄辰立接替担任公司的新一任董事长。 值得关注的是,黄辰立与韩歆毅均出生于蚂蚁集团(原“蚂蚁金服”),这显示了他们在这家公司内部的密切联系和相互依赖。对于天弘基金来说,接下来的挑战可能会更为复杂和充满不确定性。

热点资讯 11.23
国君集团与海通证券达成合并重组协议,百亿元资金注入重要领域

国君集团与海通证券达成合并重组协议,百亿元资金注入重要领域

国泰君安、海通证券合并重组进度显著,前者吸收后者后,拟募集不超过100亿元配套资金。该交易或将在年底前完成,这标志着中国资本市场史上最快的大规模并购案例。此次收购有望使两公司更快地扩大市场份额,提高在证券市场的竞争力。然而,跨国并购还面临各种挑战,如文化融合、组织结构调整、人员安置和业务协同等。此外,证监会已经批准了该交易,这也表明监管层对此交易持开放态度。这一过程表明,随着中国资本市场的发展,大型金融机构之间的并购交易将会更加频繁。

热点资讯 11.23
比特币影子股MSTR的热度:基金经理大喊,是不同于怪兽的另类投资选择

未来可期!比特币影子股MSTR引基金经理高呼:这可能是一只不同的怪兽

比特币影子股MSTR的热度:基金经理大喊,是不同于怪兽的另类投资选择 未来可期!比特币影子股MSTR引基金经理高呼:这可能是一只不同的怪兽

市场出现了对"比特币大户"公司的提振,尤其是MicroStrategy成为最大的受益者。然而,这引来了股市动荡和限制了MSTR的一些衍生品交易。由于受到交易所规模、敏感度和成本等因素的影响,一些主要经纪人和客户被迫限制了这款ETF的交易。随着市场的变动,这种限制可能会继续存在一段时间。MSTR ETF的表现强劲,目前资产已接近50亿美元,三个月内增长了近600%。投资者对此表示乐观,并预计它将继续增长。对于管理MSTU的Tuttle Capital Management来说,面临的风险更大,必须寻求其他方式来满足其目标。

热点资讯 11.23
住建部与财政部公布:全国300个重点城市房价或将迎价格上涨趋势

住建部与财政部公布:全国300个重点城市房价或将迎价格上涨趋势

住建部、财政部联合发布通知,扩大城中村改造政策支持范围至近300个地级及以上城市,有助于解决棚户区问题,推动城市更新进程。随着政策执行,有望带动二线甚至三线城市的发展动力,改善居住条件,提高生活质量。此举有望促使房价止跌回稳,为楼市带来积极影响。

热点资讯 11.23
美国大选结果公布:消费者信心低迷,长期通胀预期再次触及上限顶点

美国大选结果公布:消费者信心低迷,长期通胀预期再次触及上限顶点

美国大选尘埃落定后,消费者信心及通胀预期均低于预期,反映了人们对特朗普政府经济前景的看法分歧。11月消费者信心指数终值创历史最高,预计2023年通胀率也将高于2020年,需警惕通胀失控的风险。

热点资讯 11.23
国产手机厂商的海外扩张之路:理想与现实的深度探索

国产手机厂商的海外扩张之路:理想与现实的深度探索

国产手机厂商正在走向海外市场以摆脱国内市场的“内卷”困境和追求更高的利润与品牌溢价。他们在欧洲、东南亚、印度和非洲等地成为主要出海地区,特别是欧洲市场的重要性不言而喻。然而,全球复杂的外部环境如关税、汇率波动等问题给他们的出海带来了挑战。虽然一些厂商已经取得了显著的成果,但是要想在全球市场上占有一席之地仍然需要面对许多困难。他们需要了解并精确把握不同市场的特点,并且在出海时考虑各种因素,包括文化差异和消费者需求偏好多样性。尽管面临诸多挑战,但是中国智能手机市场的未来仍然充满希望。

热点资讯 11.23
电商平台:双11拼数据而非拼力量的转变

电商平台:双11拼数据而非拼力量的转变

今年“双11”电商竞争策略转向补贴用户和商家,以满足消费者需求并提升平台竞争力;京东数据显示,AI学习机成交额同比增长超10倍;天猫平台上,国际大牌备受青睐,国货品牌表现依旧亮眼;电商平台的竞争策略开始转变,不再热衷于传统的价格战、广告战等做法,而是把资源更多投入于补贴用户、补贴商家等环节;新一轮的以旧换新补贴也为“双11”期间的家电销售再添动力。

热点资讯 11.23
迪士尼、谷歌等广告商暂停使用马斯克 X 平台,消息称其逐渐回归

迪士尼、谷歌等广告商暂停使用马斯克 X 平台,消息称其逐渐回归

《马斯克撤回广告与迪士尼回归给 X 平台带来希望》\n\n近期,某知名电商平台宣布部分企业已重返该平台投放广告。此举措被业界视为对马斯克撤回广告言论的回应。\n\n分析数据显示,由于马斯克的一次攻击性言论导致部分企业撤回X平台的广告,但这并未阻止企业如迪士尼、康卡斯特、狮门娱乐和华纳兄弟探索等回到平台上投放广告。\n\n据统计,这些企业在2024年1月至9月期间在X平台的广告支出总计约为330万美元,其中康卡斯特占近150万美元,华纳兄弟探索支出约110万美元,迪士尼约55万美元,狮门娱乐接近23万美元。\n\n虽然这并非大规模广告预算,但对于马斯克和X平台而言,此次举动无疑是具有象征意义的成功。马斯克在接受媒体采访时表示,他对此感到非常感谢,并欢迎各大品牌重新在X平台投放广告。\n\n未来,随着X平台适应和调整,其广告生态正在逐步回归主流视野。这显示出,无论何种情况,只要有决心和毅力,就有可能实现从困境到胜利的转变。

热点资讯 11.23