英伟达新引擎上阵,可顶多个超级计算机。全新智能运算速度提升30倍!

2024-03-19 热点资讯 关注公众号

梦晨 克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

AI春晚GTC开幕,皮衣老黄再次燃爆全场。

时隔两年,英伟达官宣新一代Blackwell架构,定位直指“新工业革命的引擎” ,“把AI扩展到万亿参数”。

作为架构更新大年,本次大会亮点颇多:

宣布GPU新核弹B200,超级芯片GB200

Blackwell架构新服务器,一个机柜顶一个超算

推出AI推理微服务NIM,要做世界AI的入口

新光刻技术cuLitho进驻台积电,改进产能。

……

8年时间,AI算力已增长1000倍。

老黄断言“加速计算到达了临界点,通用计算已经过时了”。

我们需要另一种方式来进行计算,这样我们才能够继续扩展,这样我们才能够继续降低计算成本,这样我们才能够继续进行越来越多的计算。

老黄这次主题演讲题目为《见证AI的变革时刻》,但不得不说,英伟达才是最大的变革本革。

GPU的形态已彻底改变

我们需要更大的GPU,如果不能更大,就把更多GPU组合在一起,变成更大的虚拟GPU。

Blackwell新架构硬件产品线都围绕这一句话展开。

通过芯片,与芯片间的连接技术,一步步构建出大型AI超算集群。

4nm制程达到瓶颈,就把两个芯片合在一起,以10TB每秒的满血带宽互联,组成B200 GPU,总计包含2080亿晶体管。

没错,B100型号被跳过了,直接发布的首个GPU就是B200。

两个B200 GPU与Grace CPU结合就成为GB200超级芯片,通过900GB/s的超低功耗NVLink芯片间互连技术连接在一起。

两个超级芯片装到主板上,成为一个Blackwell计算节点。

18个这样的计算节点共有36CPU+72GPU,组成更大的“虚拟GPU”。

它们之间由今天宣布的NVIDIA Quantum-X800 InfiniBand和Spectrum™-X800以太网平台连接,可提供速度高达800Gb/s的网络。

在NVLink Switch支持下,最终成为“新一代计算单元”GB200 NVL72

一个像这样的“计算单元”机柜,FP8精度的训练算力就高达720PFlops,直逼H100时代一个DGX SuperPod超级计算机集群(1000 PFlops)。

与相同数量的72个H100相比,GB200 NVL72对于大模型推理性能提升高达30倍成本和能耗降低高达25倍

把GB200 NVL72当做单个GPU使用,具有1.4EFlops的AI推理算力和30TB高速内存。

再用Quantum InfiniBand交换机连接,配合散热系统组成新一代DGX SuperPod集群。

DGX GB200 SuperPod采用新型高效液冷机架规模架构,标准配置可在FP4精度下提供11.5 Exaflops算力和240TB高速内存。

此外还支持增加额外的机架扩展性能。

最终成为包含32000 GPU的分布式超算集群。

老黄直言,“英伟达DGX AI超级计算机,就是AI工业革命的工厂”。

将提供无与伦比的规模、可靠性,具有智能管理和全栈弹性,以确保不断的使用。

在演讲中,老黄还特别提到2016年赠送OpenAI的DGX-1,那也是史上第一次8块GPU连在一起组成一个超级计算机。

从此之后便开启了训练最大模型所需算力每6个月翻一倍的增长之路。

GPU新核弹GB200

过去,在90天内训练一个1.8万亿参数的MoE架构GPT模型,需要8000个Hopper架构GPU,15兆瓦功率。

如今,同样给90天时间,在Blackwell架构下只需要2000个GPU,以及1/4的能源消耗。

在标准的1750亿参数GPT-3基准测试中,GB200的性能是H100的7倍,提供的训练算力是H100的4倍。

Blackwell架构除了芯片本身外,还包含多项重大革新:

第二代Transformer引擎

动态为神经网络中的每个神经元启用FP6和FP4精度支持。

第五代NVLink高速互联

为每个GPU 提供了1.8TB/s双向吞吐量,确保多达576个GPU之间的无缝高速通信。

Ras Engine(可靠性、可用性和可维护性引擎)

基于AI的预防性维护来运行诊断和预测可靠性问题。

Secure AI

先进的加密计算功能,在不影响性能的情况下保护AI模型和客户数据,对于医疗保健和金融服务等隐私敏感行业至关重要。

专用解压缩引擎

支持最新格式,加速数据库查询,以提供数据分析和数据科学的最高性能。

在这些技术支持下,一个GB200 NVL72就最高支持27万亿参数的模型

而GPT-4根据泄露数据,也不过只有1.7万亿参数。

英伟达要做世界AI的入口

老黄官宣ai.nvidia.com页面,要做世界AI的入口。

任何人都可以通过易于使用的用户界面体验各种AI模型和应用。

同时,企业使用这些服务在自己的平台上创建和部署自定义应用,同时保留对其知识产权的完全所有权和控制权。

这上面的应用都由英伟达全新推出的AI推理微服务NIM支持,可对来自英伟达及合作伙伴的数十个AI模型进行优化推理。

此外,英伟达自己的开发套件、软件库和工具包都可以作为NVIDIA CUDA-X™微服务访问,用于检索增强生成 (RAG)、护栏、数据处理、HPC 等。

比如通过这些微服务,可以轻松构建基于大模型和向量数据库的ChatPDF产品,甚至智能体Agent应用。

NIM微服务定价非常直观,“一个GPU一小时一美元”,或年付打五折,一个GPU一年4500美元。

从此,英伟达NIM和CUDA做为中间枢纽,连接了百万开发者与上亿GPU芯片。

什么概念?

老黄晒出AI界“最强朋友圈”,包括亚马逊、迪士尼、三星等大型企业,都已成为英伟达合作伙伴。

最后总结一下,与往年相比英伟达2024年战略更聚焦AI,而且产品更有针对性。

比如第五代NVLink还特意为MoE架构大模型优化通讯瓶颈。

新的芯片和软件服务,都在不断的强调推理算力,要进一步打开AI应用部署市场。

当然作为算力之王,AI并不是英伟达的全部。

这次大会上,还特别宣布了与苹果在Vision Pro方面的合作,让开发者在工业元宇宙里搞空间计算。

此前推出的新光刻技术cuLitho软件库也有了新进展,被台积电和新思科技采用,把触手伸向更上游的芯片制造商。

当然也少不了生物医疗、工业元宇宙、机器人汽车的新成果。

以及布局下一轮计算变革的前沿领域,英伟达推出云量子计算机模拟微服务,让全球科学家都能充分利用量子计算的力量,将自己的想法变成现。

One More Thing

去年GTC大会上,老黄与OpenAI首席科学家Ilya Sutskever的炉边对谈,仍为人津津乐道。

当时世界还没完全从ChatGPT的震撼中清醒过来,OpenAI是整个行业绝对的主角。

如今Ilya不知踪影,OpenAI的市场统治力也开始松动。在这个节骨眼上,有资格与老黄对谈的人换成了8位——

Transformer八子,开山论文《Attention is all you need》的八位。

他们陆陆续续已经悉数离开谷歌,其中7位投身AI创业,有模型层也有应用层,有toB也有toC。

这八位传奇人物既象征着大模型技术真正的起源,又代表着现在百花齐放的AI产业图景。在这样的格局中,OpenAI不过是其中一位玩家。

而就在两天后,老黄将把他们聚齐,在自己的主场。

要论在整个AI界的影响力、号召力,在这一刻,无论是“钢铁侠”马斯克还是“奥特曼”Sam Altman,恐怕都比不过眼前这位“皮衣客”黄仁勋。

……

直播回放:

https://www.youtube.com/watch?v=Y2F8yisiS6E


结论:
本文认为当前全球AI浪潮所面临的挑战主要在于日益强大的计算能力,传统的大规模存储模式难以满足海量数据的需求。因此,我们需要寻找新的解决方案,这其中包括更大容量的GPU、更高效的芯片和更强大的网络连接。在这个过程中,旧一代的架构、设计理念和产品都无法满足需求,只有全新的技术和创新才能突破现有困境。英国人工智能公司的联合创始人兼CEO黄仁勋博士在此次大会上的演讲中就表达了类似的观点。
然而,老黄却表示自己并不认同这种看法。他认为,尽管现有的GPU存在一些问题,但是随着AI的发展,这些问题正在逐渐得到解决。例如,黑白数字架构的新服务器设备可以更好地整合大量的处理器,并且能够实现更高的利用率。此外,他还暗示,未来的计算系统可能会出现更多的模块化设计,以适应不同的应用场景和不同规模的计算任务。
总的来说,虽然面临着诸多挑战,但是我们可以预见,未来的AI将会更加先进和强大。而那些不接受新技术挑战的人,只能被淘汰出局。

上一篇:苹果宣传云存储:128GB的iPhone 15,也有充裕空间存储海量照片
下一篇:说到做到,马斯克开源Grok,3140亿参数免费可商用|焦点分析
更多更酷的内容分享
猜你感兴趣
英伟达揭晓超速AI超级计算机Eos:装载了4608个H100!

英伟达揭晓超速AI超级计算机Eos:装载了4608个H100!

英伟达推出全球第九大AI超级计算机Eos,配备4,608个H100 GPU和1,152个英特尔处理器,采用Mellanox Quantum-2 InfiniBand技术,峰值性能达188.65 Peta FLOPS。Eos不仅供英伟达内部使用,其架构也为其他公司提供参考。此外,Eos的强大软件设计使其能够应对各种AI应用。

热点资讯 02.19
全球最大云计算公司暂停英伟达超级芯片采购,原因竟是升级速度太快?

全球最大云计算公司暂停英伟达超级芯片采购,原因竟是升级速度太快?

亚马逊云服务暂停采购英伟达在售的最强大算力芯片,以等待新版本上市。这主要是因为新的芯片比旧款提高了能源效率和性能。此举动可能会对美股市值产生影响,尤其是如果GPT-MoE推理性能方面表现优越。此外,由于此更新可能涉及大量资源的转移,投资者需要密切关注财报以了解潜在影响。

热点资讯 05.22
科学家提出机械与数据结合的新理论推动计算能力提升,迈向智慧科技新篇章:无限潜能的电子机械计算机模型

科学家提出机械与数据结合的新理论推动计算能力提升,迈向智慧科技新篇章:无限潜能的电子机械计算机模型

刘静冉与团队成功研发出“迟滞子”,该概念主要针对机械计算机的迟滞现象,并在此基础上研究和控制装置的状态转换行为。研究成果不仅限于机械载荷领域,还能拓展至其他物理场景,适用于航天、深海等领域。利用简单结构实现复杂计算,但面临极限环境可能导致计算结果不稳定的问题,未来还需进一步研究。

热点资讯 06.24
马斯克正在研发人工智能超级计算机,对抗黄仁勋和英伟达。

马斯克正在研发人工智能超级计算机,对抗黄仁勋和英伟达。

英伟达CEO黄仁勋拒绝停止在马斯克旗下X平台上的广告,认为马斯克并未获得授权,并反驳称其公司不会发表针对其他企业的声明。英伟达最新财季营收增长265%,市值超2万亿美元,但仍面临激烈的竞争。马斯克否认将推出复杂的AI产品,但仍会购买大量英伟达技术产品。

热点资讯 03.22
2023年中国MCU市场规模持续扩大至282亿美元,领先全球

中国MCU市场规模稳步增长至282亿美元,占据全球主导地位

2023年中国MCU市场有望突破282亿美元,引领全球消费电子趋势

中国MCU市场增长强劲,已超全球平均水平,未来前景广阔

2023年中国MCU市场规模持续扩大至282亿美元,领先全球 中国MCU市场规模稳步增长至282亿美元,占据全球主导地位 2023年中国MCU市场有望突破282亿美元,引领全球消费电子趋势 中国MCU市场增长强劲,已超全球平均水平,未来前景广阔

新冠疫情期间加剧芯片供应紧张,推动MCU价格上涨;厂商逐渐转向成本更低、性能更强的Arm生态系;但取代率上升可能促使MCU价格继续下滑。预计未来几年MCU平均单价会跌至0.88美元。整体来看,MCU价格将持续波动。

热点资讯 09.19
越南欲通过新铁路项目加强与中国老挝的合作

越南欲通过新铁路项目加强与中国老挝的合作

越南政府成立特别工作组,负责实施连接越南与中国和老挝的铁路投资项目。

热点资讯 09.19
重庆紧急发布高温红色预警,最高温预计将达40摄氏度以上!

重庆紧急发布高温红色预警,最高温预计将达40摄氏度以上!

重庆市气象局发布高温红色预警信号,预计未来15小时内,重庆市13个区县海拔400米以下地区将出现高温天气,并伴有强烈日照和酷热感,需注意防暑降温。 详细信息:重庆气象局发布高温红色预警信号,预计未来15小时内,重庆市13个区县海拔400米以下地区将出现高温天气,并伴有强烈日照和酷热感,需注意防暑降温。

热点资讯 09.19
蔚来将收购比利时奥迪工厂:激进还是稳健之举?

蔚来将收购比利时奥迪工厂:激进还是稳健之举?

蔚来打算收购奥迪在比利时沃斯特的工厂,以降低关税并提升产品在欧洲的销售能力。尽管面临国内市场竞争和欧洲不确定性的风险,但收购被认为是一个合理的决策。目前,该工厂已在挪威、德国、荷兰、瑞典和丹麦等地启动运营,并已成功交付首批用户。

热点资讯 09.19
港媒揭示:美国持续投入巨额补贴仍未能撼动中国稀土的地位

港媒揭示:美国持续投入巨额补贴仍未能撼动中国稀土的地位

场上的领导地位不可动摇。在稀土资源开发方面,中国将继续占据主导地位,这得益于其丰富的资源储备和多年的技术积累。然而,西方国家为了摆脱对中国的依赖,正在采取一系列措施,包括投资建设稀土工厂以增强供应链自主性,但成效有限。面对稀土价格波动这一难题,中国政府增加了稀土开采配额并遏制了市场供应过剩,这让其他国家的稀土项目发展受到了影响。同时,一些企业也面临着资金困境和市场竞争压力。综合来看,中国将继续掌控全球稀土市场,并有望在未来发挥更大的影响力。

热点资讯 09.19
Marvell联合创始人周秀文逝世,科技界损失一位重要人物

Marvell联合创始人周秀文逝世,科技界损失一位重要人物

周秀文于9月18日在印度尼西亚雅加达出生并学习汽车配件店零件组装知识,然后在美国攻读了电机工程学士和博士学位,并在加州大学伯克利分校获得硕士和博士学位。其团队创建了Marvell Technology公司,希望制造出能产生“奇妙”效果的设备。周秀文去世的消息引发广泛关注,尽管传统观点认为这种方法不切实际,但Marvell很快成为了许多全球领先的科技公司的重要合作伙伴。

热点资讯 09.19
国产光刻机进展为何落后于国际大厂?关键并非此点

国产光刻机进展为何落后于国际大厂?关键并非此点

中国的工业部发布了最新的光刻机技术——第六代光刻机,相较于第二代和第三代设备,具有较强的迭代升级空间。此款设备被广泛认为是阿斯麦15-20年前的产品,主要用于55-65纳米的工艺。尽管相比七纳米工艺存在一定差距,但随着技术的不断升级,其发展空间依然很大。未来几年,先进的国产光刻机将有机会大规模应用,而十年内,有望实现大规模生产。关于这个问题,有些人将其归咎为引进阿斯麦的技术,但实际上,这两款设备都是公认的第四代光刻机,与第三代和第二代并无区别。我国通过不断迭代升级,已经达到了可以生产7纳米工艺的水平,这使得我们无需过分纠结于光刻机的细节参数。重要的是,光刻机的研发和生产已经得到了广泛认可,且完全满足了市场需求。所以,我们应该理性看待此类问题,积极寻找更有利于国内光刻产业发展的解决方案。

热点资讯 09.19
电子通讯市场的一次重大震动:中国消费者对美国产品态度的转变

电子通讯市场的一次重大震动:中国消费者对美国产品态度的转变

黎巴嫩多地发生涉及通讯设备爆炸事件,致死30多人,伤者3000多;中国有警惕,电子武器化提防。[[2]()]。

热点资讯 09.19
详尽解读五老星的五大能力:死神仅为一例!

详尽解读五老星的五大能力:死神仅为一例!

五老星五名老人听命于神秘人物伊姆,同时具备不死之身、魔法阵和心灵感应等能力,可能是由伊姆赐予的共同能力。这些能力分别可以让五位老人在各种情况下迅速恢复生命力、建立或破坏防御性魔法阵以及进行心灵沟通。

热点资讯 09.19
娃哈哈、农夫山泉供应商遭遇“烂苹果”危机

娃哈哈、农夫山泉供应商遭遇“烂苹果”危机

事件是安德利果汁公司供应商遭遇“烂苹果”危机,引起公众关注。该公司主要客户为统一、娃哈哈、农夫山泉等企业,而汇源却否认与该事件有关。公司位于礼泉县工业园区,入驻了17家企业。经市场监管局抽检发现,公司的同类型果汁产品质量存在问题。目前,公司正在进行整顿,暂停部分产品出库。

热点资讯 09.19