重大新闻!我们又有了新工具。英伟达已经发布了最新款的AI芯片,它的性能比上一代提高了25倍。

2024-03-19 热点资讯 关注公众号

每经:毕陆名

号称今年全球头号人工智能(AI)领域开发者大会的英伟达2024 GTC AI大会于美东时间3月18日周一拉开帷幕。今年是英伟达时隔五年首次让年度GTC重回线下,也是此前分析认为英伟达要“拿出点真家伙”的AI盛会。

当地时间周一下午,英伟达创始人兼CEO黄仁勋在美国加州圣何塞SAP中心进行主题为“面向开发者的1#AI峰会”(1#AI Conference for Developers)演讲。黄仁勋介绍了运行AI模型的新一代芯片和软件。英伟达正式推出名为Blackwell的新一代AI图形处理器(GPU),预计将在今年晚些时候发货。

Blackwell平台能够在万亿参数级的大型语言模型(LLM)上构建和运行实时生成式AI,而成本和能耗比前身低25倍。

另据媒体报道,英伟达CEO黄仁勋在GTC宣布,将在其企业软件订阅中增加一款名为NIM的新产品。NIM可以更容易地使用旧的英伟达GPU进行推理,并允许公司继续使用他们已经拥有的数亿个英伟达GPU。该产品将使新人工智能模型的初始训练推理所需的算力更少。该公司的策略是让购买英伟达服务器的客户注册英伟达企业版,每个GPU每年收取费用4500美元。黄仁勋表示,该软件还将帮助在配备GPU的笔记本电脑上运行人工智能,而不是在云服务器上运行。

此外,英伟达CEO黄仁勋宣布推出下一代人工智能超级计算机,英伟达还发布6G研究云平台,以便用AI技术推进无线通信。

英伟达推新AI芯片

据外媒报道,英伟达于周一宣布推出新一代人工智能芯片和用于运行人工智能模型的软件。该公司在美国圣何塞举行的开发者大会上宣布了这一消息,正值这家芯片制造商寻求巩固其作为人工智能公司首选供应商的地位。

自OpenAI的ChatGPT于2022年末掀起人工智能热潮以来,英伟达的股价上涨了五倍,总销售额增长了两倍多。英伟达的高端服务器GPU对于训练和部署大型AI模型至关重要。微软和Meta等公司已经花费了数十亿美元购买这些芯片。

图片来源:视频截图

新一代AI图形处理器命名为Blackwell。首款Blackwell芯片名为GB200,将于今年晚些时候发货。英伟达正在用更强大的芯片吸引客户,以刺激新订单。例如,各公司和软件制造商仍在争相抢购当前一代的“Hopper”H100芯片及类似产品。

“Hopper很棒,但我们需要更大的GPU,”英伟达首席执行官黄仁勋周一在该公司于加利福尼亚州举行的开发者大会上表示。不过,周一盘后交易中,英伟达股价下跌超过1%。该公司还推出了名为NIM的创收软件,该软件将简化AI的部署,为客户提供了在日益增多的竞争者中坚持使用英伟达芯片的另一个理由。

英伟达高管表示,该公司正从一个唯利是图的芯片提供商转变为更像微软或苹果的平台提供商,其他公司可以在此基础上构建软件。

“Blackwell不仅仅是一款芯片,而是一个平台的名称,”黄仁勋表示。

英伟达企业副总裁Manuvir Das在接受采访时表示:“可销售的商业产品是GPU,而软件则是为了帮助人们以不同的方式使用GPU。当然,我们现在仍然这样做。但真正改变的是,我们现在真的有了商业软件业务。”

Das表示,英伟达的新软件将更容易在任何英伟达GPU上运行程序,甚至是那些可能更适合部署而不是构建AI的老旧GPU。“如果你是开发者,你有一个有趣的模型,你希望人们采用它,如果你把它放入NIM中,我们会确保它可以在我们所有的GPU上运行,这样你就可以覆盖很多人,”Das说道。

Blackwell拥有六项革命性技术

英伟达每两年更新一次其GPU架构,实现性能的飞跃。过去一年发布的许多AI模型都是在该公司的Hopper架构上训练的,该架构被用于H100等芯片,于2022年宣布推出。

图片来源:视频截图

据悉,英伟达称,Blackwell拥有六项革命性的技术,可以支持多达10万亿参数的模型进行AI训练和实时LLM推理:

全球最强大的芯片:Blackwell架构GPU由2080亿个晶体管组成,采用量身定制的台积电4纳米工艺制造,两个reticle极限GPU裸片将10 TB/秒的芯片到芯片链路连接成单个统一的GPU。

第二代Transformer引擎:结合了Blackwell Tensor Core技术和TensorRT-LLM和NeMo Megatron框架中的英伟达先进动态范围管理算法,Blackwell将通过新的4位浮点AI支持双倍的计算和模型大小推理能力。

第五代NVLink:为提高数万亿参数和混合专家AI模型的性能,最新一代英伟达NVLink为每个GPU提供了突破性的1.8TB/s双向吞吐量,确保最复杂LLM之间多达576个GPU之间的无缝高速通信。

RAS引擎:Blackwell支持的GPU包含一个专用引擎,实现可靠性、可用性和服务性。此外,Blackwell架构还增加了芯片级功能,利用基于AI的预防性维护进行诊断和预测可靠性问题。这可以最大限度地延长系统正常运行时间,并提高大部署规模AI的弹性,使其能连续运行数周甚至数月,并降低运营成本。

安全人工智能:先进的机密计算功能可在不影响性能的情况下保护AI模型和客户数据,并支持新的本机接口加密协议,这对于医疗保健和金融服务等隐私敏感行业至关重要。

解压缩引擎:专用解压缩引擎支持最新格式,加快数据库查询,提供数据分析和数据科学的最高性能。未来几年,在企业每年花费数百亿美元的数据处理方面,将越来越多地由GPU加速。

图片来源:视频截图

Blackwell GPU体积庞大,将两个单独制造的晶粒组合成一个由台积电制造的芯片。它还将作为一款名为GB200 NVLink 2的整个服务器提供,该服务器结合了72个Blackwell GPU和其他旨在训练AI模型的英伟达部件。

亚马逊、谷歌、微软和甲骨文将通过云服务提供对GB200的访问。GB200将两个B200 Blackwell GPU与一个基于Arm的Grace CPU配对。英伟达表示,亚马逊网络服务将构建一个包含20000个GB200芯片的服务器集群。

英伟达没有提供新款GB200或其使用系统的成本。据分析师估计,英伟达基于Hopper的H100芯片成本在2.5万至4万美元之间,而整个系统的成本高达20万美元。

英伟达还宣布,将在其英伟达企业软件订阅中添加一款名为NIM(英伟达推理微服务)的新产品。NIM让使用较旧的英伟达GPU进行推理(或运行AI软件的过程)变得更加简单,并允许公司继续使用其已经拥有的数亿个英伟达GPU。与新AI模型的初始训练相比,推理所需的计算能力较少。对于那些希望运行自己的AI模型,而不是从OpenAI等公司购买AI结果作为服务的企业来说,NIM无疑是他们的得力助手。

英伟达的策略是吸引购买基于英伟达的服务器的客户注册英伟达企业版,每个GPU每年的许可费为4500美元。

英伟达将与微软或Hugging Face等AI公司合作,确保他们的AI模型能够在所有兼容的英伟达芯片上运行。随后,开发者可以使用NIM在自有服务器或基于云端的英伟达服务器上高效运行模型,无需繁琐的配置过程。

“在我原本调用OpenAI的代码中,我只需替换一行代码,将其指向从英伟达获取的NIM即可。”Das说道。

英伟达表示,该软件还将助力AI在配备GPU的笔记本电脑上运行,而非仅限于云端服务器。

每日经济新闻综合第一财经、公开消息


随着英伟达(NVIDIA)的年度开发者大会拉开帷幕,这家全球领先的芯片制造商终于要展现自己作为AI领域的领导者的一面了。据悉,该公司计划在今年晚些时候交付全新的黑研石(Blackwell)系列GPU,并且发布了名为NIM的新产品,将让传统硬件变得更加灵活易用。
然而,作为一家基于AI芯片的大企业,英伟达需要做的不仅仅是制造更强大的GPU,还需要推动AI技术的普及。为此,英伟达CEO黄仁勋在峰会上宣布了一系列的战略,包括将推出适用于各种工作负载的应用程序,并加速AI开发工具的发展。
具体来说,黄仁勋表示,英伟达希望通过改进其企业软件订阅的选项,让更多用户能够利用自己现有的服务器来部署AI模型。此外,他还表示,英伟达将致力于开发一系列创新的AI应用程序,从而进一步扩大其在市场上的影响力。
英伟达的黑研石(Blackwell)系列GPU采用了最新的设计和技术,其中包括两个独立的向量核(也称为CUDA)和一个核心线程池。这两个核可以帮助AI模型更快地进行计算,而核心线程池则可以更好地管理GPU资源,避免出现过载的情况。
尽管如此,尽管英伟达取得了显著的进步,但面对来自微软、Meta等竞争对手的压力,这家芯片制造商仍需要不断努力。尤其是在计算性能和性价比方面,竞争对手正在逐步逼近,因此英伟达需要不断创新,以保持领先。
总的来说,尽管面临着众多挑战,但英伟达的未来发展仍然充满信心。随着更多AI应用程序的推出,以及企业软件订阅选项的升级,我们可以期待英伟达在未来的AI竞赛中取得更大的成功。

上一篇:华为P70发布在即 机构称有望带动手机产业链新一轮机遇
下一篇:未经同意用AI“复活”已逝明星遭声讨
更多更酷的内容分享
猜你感兴趣
提升推理速度超30倍!英伟达发布了全新的AI芯片。黄仁勋表示,对AI的发展,我们更需要更强的GPU支持。

提升推理速度超30倍!英伟达发布了全新的AI芯片。黄仁勋表示,对AI的发展,我们更需要更强的GPU支持。

英伟达在GTC会议上推出了新的GPU芯片——Blackwell B200和GB200,这是为了满足人工智能模型的计算需求。这款芯片比上一代Hopper GPU提升了性能,并且能源效率提高了25%。目前,这些新芯片已经应用于训练大型、复杂的AI模型,对中国的GPU芯片公司来说是一个巨大的机会。 黄仁勋强调,尽管美中之间存在算力大战,但他认为中国有时间和精力来逐步取代美国。他认为Blackwell GPU是推动这场新工业革命的引擎。

热点资讯 03.19
英伟达新一代AI芯片GB200订单爆发出炉:H100芯片却遭遇冷落

英伟达新一代AI芯片GB200订单爆发出炉:H100芯片却遭遇冷落

英伟达新AI芯片需求强劲,推动H100芯片价格下跌50%,多家小型算力供应商被迫清仓。

热点资讯 10.27
科技新闻:英伟达称年内推出Blackwell下一代芯片,详情曝光已开始筹备

太硬核了!英伟达官方透露新芯片名为Blackwell,计划在年内发布

科技新闻:英伟达称年内推出Blackwell下一代芯片,详情曝光已开始筹备 太硬核了!英伟达官方透露新芯片名为Blackwell,计划在年内发布

英伟达CEO黄仁勋预测,他们正在研发的新一代AI芯片将在2025年推出,最快明年市场就能获得R100 AI GPU。然而,亚马逊因AI芯片迭代速度太快而暂停了向英伟达采购的订单,这引发了市场对于英伟达芯片更新速度可能导致公司当代产品滞销的担忧。黄仁勋认为,随着市场向H200和Blackwell过渡,英伟达的销售有望超过供应。

热点资讯 05.24
华为 Ascend 910C AI芯片有望升级至超越英伟达H100的华为将推出全新AI芯片,性能提升潜力巨大

华为 Ascend 910C AI芯片有望升级至超越英伟达H100的华为将推出全新AI芯片,性能提升潜力巨大

华为正在测试最新的人工智能加速器 Ascend 910C(昇腾910C),并预计最快10月开始出货。然而,由于美国恐将在今年8月底祭出更严厉制裁,让华为无法取得最新AI芯片所需的生产设备及所需的HBM內存,这可能导致华为未来的业绩受到影响。此外,英国芯片制造商TikTok的母公司字节跳动、搜索引擎巨头百度和电信营运商中国移动也已经开始讨论关于Ascend 910C的采购计划。

热点资讯 08.14
晨鸣纸业债务危机:这是造纸行业的第一个多米诺骨牌吗?

晨鸣纸业债务危机:这是造纸行业的第一个多米诺骨牌吗?

晨鸣纸业面临债务暴雷,涉及产能过剩、需求不振与高负债运营模式。由于金融机构对晨鸣纸业的信贷支持降低,晨鸣纸业陷入流动性危机。疫情、原材料价格上涨等因素使行业景气度下降,导致纸价下跌,进一步加剧了公司的财务负担。公司能否顺利度过此难关仍需关注行业动态及公司经营状况。

热点资讯 11.23
多重政策叠加下,房贷利率上涨是否会影响购房?专家观点:目前是购房最佳时机

多重政策叠加下,房贷利率上涨是否会影响购房?专家观点:目前是购房最佳时机

房市出现暖意,热点城市二手房需求上升。根据专家预测,未来可能会出台更多楼市政策,但具体实施还需等待观察。

热点资讯 11.23
ABC创始人因卫生巾问题向用户道歉,背后的生产与销售策略曝光

ABC创始人因卫生巾问题向用户道歉,背后的生产与销售策略曝光

事件起因:ABC创始人邓景衡公开鞠躬致歉承认公司危机舆情处理出现失误,导致多日来连续上热搜。 焦点:事件关注的重点在于ABC品牌的卫生巾生产线存在问题,影响了卫生巾的实际长度,并引发了消费者对产品质量的关注。 启示:对于任何企业来说,诚信经营、严格把控生产流程都是至关重要的。同时,解决产品质量问题也不能忽视消费者的反馈和建议,及时调整和改进产品,才能真正赢得消费者的信任和尊重。

热点资讯 11.23
2025年投资策略:展望机构的前瞻展望——A股走向何处?

2025年投资策略:展望机构的前瞻展望——A股走向何处?

2023年三季度起,A股市场逐渐由低迷走向反弹。各机构对未来前景看法不一,有人看好2025年,也有人悲观。其中,中信证券表示2025年A股将经历一轮年度级别上涨行情;中金公司则认为基本面有所改善,市场风险偏好有望提高。开源证券预计2025年股市表现总体优于债券。此外,宏观环境、估值等因素均给市场带来不确定性。预计在未来的几个月里,A股市场将继续波动。综合上述信息,可以得出结论:未来一段时间内,A股市场可能会出现波动。

热点资讯 11.23
男子在江苏公园内发现元代“玉泉宫碑”,枣庄文物部门正在协调归还,警方已介入

男子在江苏公园内发现元代“玉泉宫碑”,枣庄文物部门正在协调归还,警方已介入

述问题,我们已经协调过各方资源,将尽快处理完成石碑的运输和保存工作。石碑上显示的信息表明,它可能是2008年从山东枣庄被盗的元代古碑"玉泉宫碑"。这一发现引起了很多网友的关注,有人称赞陆先生的举动让他们看到了文物保护的重要性,也有人建议加大对文物盗窃的打击力度。目前,相关部门已经介入调查,并正计划将石碑运回枣庄妥善保存。

热点资讯 11.23
Meta挑战元宇宙的黑暗面:开启开源AI模型时代的曙光

Meta挑战元宇宙的黑暗面:开启开源AI模型时代的曙光

发式AI研发的企业),并承诺将其应用于开源项目。这意味着Meta有可能选择开放“Llama 2”,并借助开源的优势吸引更多的用户和开发者,以便在这个领域取得领先地位。这场讨论对于Meta来说是一次重要的决策,因为它不仅关乎AI产品的未来,也可能影响元宇宙的发展路径。不过,考虑到潜在的法律风险以及用户习惯改变的可能性,Meta可能需要谨慎对待这次选择。

热点资讯 11.23
谷歌的Graviton在亚马逊云科技的新实例中崭露头角,开启新的数据中心革命

谷歌的Graviton在亚马逊云科技的新实例中崭露头角,开启新的数据中心革命

云计算巨头AWS于2024年第一季度对EC2 M7系列通用实例的成本支出进行调查,发现采用亚马逊Graviton的M7g系列超过30%,成为最受欢迎的实例方案之一。这一数据反映了亚马逊云科技在自研芯片领域的强大实力。其先进的芯片技术帮助客户提升效率、安全性和可持续性,并降低整体成本。这表明,亚马逊云科技不仅仅是一家提供云计算服务的公司,还是一家深入研发自研芯片的领先企业。

热点资讯 11.23
OpenAI的o1第1豆包与所有其他测试都不及格,中文真实性评估结果公布!

OpenAI的o1第1豆包与所有其他测试都不及格,中文真实性评估结果公布!

1. 阿里巴巴集团的研究者提出中文简短问答作为首个全面的中文基准。 2. 它具备“中文、多样性、高质量、静态、易于评估”的特性。 3. 旨在评估语言模型回答简短问题的真实性能力。

热点资讯 11.23
朝鲜警告美国,提升战备状态以回应挑衅和敌对行动

或

朝鲜加强战备,警告美国等跟随国停止挑衅与敌对行动

朝鲜警告美国,提升战备状态以回应挑衅和敌对行动 或 朝鲜加强战备,警告美国等跟随国停止挑衅与敌对行动

朝鲜国防省警告美国并宣布将提高其军队级别以应对潜在的军事对抗风险。

热点资讯 11.23
走上俞敏洪不想走的路,与辉同行粉丝超2500万直逼东方甄选

走上俞敏洪不想走的路,与辉同行粉丝超2500万直逼东方甄选

与辉同行获得MCN资质许可证,距离单飞过去125天。公司发展迅速,抖音账号粉丝超2500万,与东方甄选差距逐渐缩小。最近100天内直播带货场次超160场,总GMV超25亿元。与辉同行逐渐摆脱与东方甄选的关联,加大新主播培养力度,探索多元业务板块。东方甄选坚守线上,发力线下,与辉同行在互联网中强关联逐渐减弱。公司发展与主播培养计划均有所改变。在与其他MCN机构的互动中,与辉同行正在走向独立化道路。公司计划进一步强化多元化业务板块,并尝试自建电商平台。同时,公司也将努力构建一个自己的平台生态。

热点资讯 11.23