升级版MindSpore2.3已推出!包含20个实操性强的热门训练模型,让您立即投入实战!

2024-03-23 热点资讯 关注公众号

3月22日,在昇思人工智能框架峰会2024上,昇思MindSpore 2.3正式发布。华为公司ICT Marketing总裁周军表示,华为将从三方面推动昇思MindSpore的发展,首先是聚焦根技术支持伙伴孵化原生大模型,其次是面向行业场景加速大模型应用落地,最后是使能开发者成长成功,打造开源社区。

大模型已经成为了通用人工智能的关键路径,参数达到了万亿级别,华为预计,未来几年大模型参数会达到百万级别,真正达到通用人工智能的程度。

但是受摩尔定律的限制,算力的增长非常缓慢,与大模型的需求形成了鸿沟,严重制约了大模型的快速发展,人工智能框架的并行计算能力、简洁编程能力、便捷部署能力等,逐渐成为大模型训练的关键成功要素。

大模型训推挑战

昇思MindSpore技术总经理于璠在会上提到,目前大模型分布式训推的过程当中,主要存在几个关键挑战,开发效率、训练性能以及推理运行成本。

他表示,在使用万卡集群训练的时候,系统之间需要频繁通信,导致计算利用率急剧下降,当前业界平均水平也就达到了40%。此外,在千亿参数模型训练的过程中,大概18-19个小时就会有一次故障,故障恢复大概要耗时3-4个小时。

有观点认为,未来万卡集群、十万卡集群的训练中,故障频率可能会进一步提高,可能接近小时级,算力真正有效的时间不足四分之一,这是极大的浪费。

当大模型训练好之后到生产环境做推理,转换过程也要耗费海量成本,如果用以前的技术手段,把大模型导出再部署到端侧、边侧的设备上,有经验的工程师需要以月为周期的时间完成,严重拖累大模型的部署。

大模型在推理侧依然要面临成本问题,于璠透露,SORA刚刚发布时,华为使用SORA进行一次推理的时候,大概60秒的视频推理时间要1个小时,花费几十美金。

此外,在性能和成本之外,大模型的开发也面临着一些新的挑战。科学家或者开发者既要懂算法,又要懂并行技术,而且在调试过程中每次训练的时间也非常长,开发侧的隐形成本非常高,目前业内很难实现快速大模型快速落地。

昇思MindSpore 2.3发布

华为于2020年3月28日开源了昇思MindSpore框架,开源后访问量数千万,社区核心贡献者超过2.5万,社区贡献比例超过20%,MindSpore社区开源500多种模型,支持伙伴孵化,适配50多个大模型。

从2020年发布1.0版本到2023年发布2.2版本,昇思MindSpore 从支持端、边、云,全场景,到原生支持大模型分布式训练,到部署的全流程,并成为业界首个原生支持科学智能的人工智能融合框架,超过687万用户下载安装使用。

大模型技术快速迭代演进,业界主流模型也从千亿的稠密走向万亿的稀疏模型,昇思MindSpore 2.3的升级也对应这些需求。

周军表示,昇思MindSpore提供开源开放的训推全流程的开发套件,支持伙伴基于昇思孵化原生大模型,在模型开发阶段提供20多个开箱即用的业界主流训练模型,模型开发的周期缩短30%

昇思MindSpore通过原创的多副本、多流水交织等8种并行技术,使集群线性度达到90%(业界不足60%),通过整图优化及下沉执行等,使得算力利用率达到55%(业界不足40%);针对集群故障率高,恢复时间长的普遍问题,通过编译快照,确定性CKPT技术实现20分钟完成故障恢复。

为了帮助行业场景加速大模型应用落地,昇思MindSpore人工智能框架作为算法应用和硬件算力之间的桥梁,推出训推一体解决方案。

在大模型部署方面,昇思通过训推一体的架构升级实现脚本、分布式策略,运行时的统一,Baichuan2-13B的推理部署只需1天。在大模型推理上,通过LLM Serving 实现推理吞吐提升2倍多;升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。

为降低开发门槛,昇思持续升级MindSpore TransFormers大模型套件,并提供MindSpore One生成式套件,全流程开箱即用,一周即可完成大模型全流程的开发。

在AI for Science方面,MindSpore已在AI生物计算探索多年,联合顶级科研机构和伙伴打造了AI生物计算套件,包含蛋白质结构预测、生成等20多个SOTA模型,加速相关领域创新。

从行业维度观测,企业和开发者选择开源框架主要关注模型整体的丰富度以及训练的速度,与此前的AI开发者相比,大模型和AIGC开发者还会关心基于框架算法的领先性,部署性价比、落地效果以及芯片的适配度,这也将成为未来一段时间人工智能框架发展的主线。


结论:虽然大模型已经成为通用人工智能的关键路径,但由于摩尔定律的限制,算力的增长非常缓慢,这严重影响了大模型的快速发展。同时,开发效率、训练性能以及推理运行成本也成为了大模型训练的重要挑战。
建议:
1. 研发人员应重视模型的整体丰富度,以满足不同场景下的需求。此外,还应注重模型训练的速度,通过不断优化算法和简化流程来提高效率。
2. 针对大模型的部署问题,应研究如何降低成本并提高效率。例如,可以研究跨平台和大规模部署的技术,以及优化机器学习算法以提高推理性能。
3. 企业和开发者在选择开源框架时,不仅要关注其丰富的模型和技术,还要考虑其在理论上的前沿性和实际应用中的表现。例如,要考虑框架是否能够帮助加速AI生物计算的研发和应用,以及其与其他AI技术和系统的兼容性。
4. 利用现代科技如大数据、云计算等技术,可以帮助加速模型的训练和部署,从而解决上述挑战。例如,可以通过数据分析和机器学习算法来优化模型的训练过程,通过云计算和虚拟化技术来实现实时部署和管理。
5. 最后,要强调开源的精神和价值观,鼓励更多的开发者参与到大模型的开发和推广中来,共同推动人工智能的发展。

上一篇:回眸 | 她获得世界杰出女科学家成就奖,揭开远古生命起源之谜
下一篇:鲁东大学徐文龙课题组本科生AFM:基于溶剂交换策略的抗溶胀凝胶传感器用于水下通信
更多更酷的内容分享
猜你感兴趣
深度学习:让GPT-4替代人力训练吗?OpenAI推出新的CriticGPT模型,让我们一起探索这个未来的可能性

深度学习:让GPT-4替代人力训练吗?OpenAI推出新的CriticGPT模型,让我们一起探索这个未来的可能性

OpenAI研发CriticGPT,利用AI识别ChatGPT代码错误 提升审查效果。通过实验证明,相比人工评审,CriticGPT可提高训练师准确率并减少错误。

热点资讯 06.28
何小鹏:AI训练投入超35亿元,短短四个月已实现自主驾驶

何小鹏:AI训练投入超35亿元,短短四个月已实现自主驾驶

练方面已经投入了数十亿元资金,并且已研发出1000多种AI芯片和大规模数据处理系统。此外,小鹏还与多家国内顶级科技公司合作,共同推进AI技术的研发。

热点资讯 07.31
20倍计算量的卓越优化:使用大模型预训练数据并节省20倍计算量

20倍计算量的卓越优化:使用大模型预训练数据并节省20倍计算量

随着计算能力的发展和应用范围的拓宽,深度学习模型已经在许多领域取得了突破性成果,但在大规模预训练语料质量和可扩展性方面存在不足。ProX框架提出,通过语言模型自动生成优化程序,能够提高预训练语料的质量,并适用于广泛的领域。 2. 简介 ProX框架是由上海交通大学生成式人工智能实验室、上海人工智能实验室和新加坡 Sea AI Lab 合作研发,旨在提升大规模预训练语料的质量。它通过语言模型自动生成优化程序,适应多样化的样本特征,实现了大幅提升了预训练语料的质量。 3. 使用场景 ProX框架为在小规模模型训练中超过以往多个人工设计的规则过滤方法提供了新选择,并在多种标准化测试数据集上表现出良好的性能。这表明ProX可以作为一个高效的工具,可用于大规模预训练语料质量的提升和定制化领域的解决方案。 4. 具体优化 为了进一步提升模型性能,ProX还将继续优化数据质量,探索更加灵活的接口,以覆盖更多专用领域,并降低推理代价。这表明ProX在未来有望更好地服务于人工智能研究和实践。 5. 愿望和目标 希望您能通过将ProX应用于您的工作,充分发挥其优势,推动相关领域的研究进展。欢迎您随时向我们投稿或联系报道。感谢您的关注和支持!

热点资讯 09.29
【15分钟内完成定制化3D大模型训练,质量高个性化】——您的个人数字形象一站式解决方案

【15分钟内完成定制化3D大模型训练,质量高个性化】——您的个人数字形象一站式解决方案

浙江大学与字节跳动提出MimicTalk算法,在15分钟内可训练高质量、个性化的数字人模型。该项目已公开源代码和预训练权重,对未来基于数字人通用模型的个性化数字人算法研究提供参考。叶振辉在NeurIPS等会议上发表论文,钟添芸硕士学位论文提出个性化精品数字人概念。

热点资讯 11.02
拜登正式宣布,国际刑事法院对戈兰高地问题提出逮捕令!这是怎样的惊人之举?

拜登正式宣布,国际刑事法院对戈兰高地问题提出逮捕令!这是怎样的惊人之举?

最近,以色列在地中海东南岸受到国际法庭的拘留,美国总统拜登表示震惊,并指出美国将会坚定站在以色列一边应对安全威胁。此外,由于媒体报道加沙地区的悲惨情况,以色列的声誉受损,一些国家对其提出了诉讼,要求国际法院采取行动。最近,国际法院宣布对以色列总理和前国防部长以及哈马斯领导人发出逮捕令。对此,美国总统拜登称这是一个令人惊恐的消息,美国不会支持这一行为,并强调美国会始终站在以色列一边,保障国家安全。此外,随着中东地区的问题日益严重,美国的能源安全与市场前景受到担忧。尽管如此,以色列作为中东的重要参与者,对于美国来说仍具有战略意义,它的科技创新与绿色能源开发也为美国提供了一种可能的合作方式。

热点资讯 11.23
普京指示下,俄方向中方发出邀请:南北运输走廊或能成为下一剂分享盛宴的甜点

普京指示下,俄方向中方发出邀请:南北运输走廊或能成为下一剂分享盛宴的甜点

事件起因是乌克兰爆发冲突导致国际南北运输走廊计划中断,关注的爆点在于切断美国等西方国家的制裁对俄罗斯的影响以及缓解被战争拖累的波罗的海海运问题。为了打破西方地缘政治封锁,俄罗斯决定重启南北运输走廊项目,并寻求与中国等国家的合作。目前,三条分支各有特点:西部、东部和跨里海,预计未来会有更多发展。该项目有助于提高俄罗斯的出口和贸易潜力,促进国际贸易多元化发展。然而,由于制裁原因,这条路线面临巨大挑战。

热点资讯 11.23
墨西哥总统坚定反对中国产品涌入美国市场,声称并非通道或后门

墨西哥总统坚定反对中国产品涌入美国市场,声称并非通道或后门

墨西哥称中国产品不是墨西哥进入美国和加拿大的"后门",反批特朗普贸易政策,强调比亚迪在墨西哥建厂问题,中美两国正担忧墨西哥加入"美墨加贸易协定"。墨西哥政府附和美国特朗普贸易政策,但警告可能影响汽车产业,而中美两国政府已经采取措施保护本国汽车产业不受潜在关税影响。

热点资讯 11.23
斗破绝技:前脚删除熏儿戏份,后脚美杜莎上场

斗破绝技:前脚删除熏儿戏份,后脚美杜莎上场

关于斗破苍穹动漫中萧炎魂幻境戏份删除引发的争议,萧熏儿离开后只剩下了小医仙与美杜莎的存在,对比之下显得不太公平,萧炎的回忆杀反而成为了最大的亮点,让人感到非常满足。这场游戏也让很多人重新审视了剧情平衡的问题,只有一位女王出现在主角的脑海中。总的来说,斗破的钓鱼技巧非常出色,不论是删除萧熏儿戏份还是加入美杜莎,都能够保持故事的吸引力。

热点资讯 11.23
弟弟大理古城神秘出现星盘占卜现象,哥哥放喇叭躲避雷击。警方称:无明令禁止,一般不干涉。

或者

大理古城星盘占卜事件引热议,哥哥放喇叭避雷,警方称未明确禁止,一般不干涉。

弟弟大理古城神秘出现星盘占卜现象,哥哥放喇叭躲避雷击。警方称:无明令禁止,一般不干涉。 或者 大理古城星盘占卜事件引热议,哥哥放喇叭避雷,警方称未明确禁止,一般不干涉。

在大理古城一个名为“算命摊”的地方被一个名叫张丽的女孩以高价算命。根据梁先生的说法,他在一次聚会中得知弟弟在这里被坑骗,总共花费了3333元,但摊主并未告诉他具体的价格是多少。由于被骗金额已经超过3000元,警方暂时并未介入处理,建议当事人报案。然而,大理市城市管理综合行政执法局和市场监督管理局均表示,他们并不管辖这里的算命摊,建议当事人自行报警。梁先生认为,尽管他们的求助无果,但他仍然希望其他人能够注意防范此类欺诈行为,并提醒大家不要轻易相信街头算命摊。

热点资讯 11.23
梦幻西游:昨日打破全服纪录,第五开新套路出炉,单开环境严重堪忧!

梦幻西游:昨日打破全服纪录,第五开新套路出炉,单开环境严重堪忧!

小编介绍了一位拥有三个固伤技能的垃圾号,并从中获取了一套性价比高的装备。另一名玩家认为由于当前环境不佳,无法继续游戏;最后一部分玩家分享了一个级别的炸裂灵饰,该灵饰上排为法术防御+29,下排为伤害+21等属性,被认为是全服前三之一。 概括:有一位名为“无邪”的资深玩家提供了一份有关梦幻的个人观点。在这份文中,他介绍了如何通过5开新手练号和化身为109级五无底洞获得装备。另外一名玩家提到,在当前环境下,单开环境可能并不理想,因此他希望寻找更具挑战性的游戏模式。最后,一位玩家分享了一款可出售的顶级灵饰,并认为其性能不容忽视。

热点资讯 11.23
网上热议:新一届TES韩援阵容曝光,Jkl一人难以力挽狂澜?WBG再签新成员,xiaohu有望提升团队实力?

网上热议:新一届TES韩援阵容曝光,Jkl一人难以力挽狂澜?WBG再签新成员,xiaohu有望提升团队实力?

S15季未世杯名单外露!曝tes明日崛起将成腐烂队伍 提示:原话摘要中已删除;以下是压缩后的句子概述: 今年夏季赛已结束,各队伍转会上较为引人关注的是tes战队。据业内曝光,tes战队近况不佳且可能较难夺得世杯资格。然而tes原有核心选手已离队、阵容变动颇大。 据专业人士分析,tes战队将在s15赛季引入新阵容,并面临招揽新星导致团战不足的问题。目前尚未明确最终阵容具体构成,队员年龄结构呈新老交替趋势。这一变故无疑对tes战队带来不利影响,但能否回归往日实力尚待观察。未来世杯竞争形势和tes夺冠之路将产生关键变化。 综上所述,按照tes新阵容推测,该战队士气低落,不易进入世界赛,而若能迅速补充新鲜血液并优化团队配置,则有望重返昔日辉煌。值得关注的是该战队近年来备受关注的关键成员将随着新阵列浮现,因此欲深入了解全新阵容请关注后续进展。

热点资讯 11.23
吴国都督天选战法与兖州最强形态:2天狂拉横幅攻略指南

吴国都督天选战法与兖州最强形态:2天狂拉横幅攻略指南

白耳兵以其极高的伤害和优秀的生存能力再次证明了自己的实力,无论是对阵多核输出的队伍还是单独出战,都能发挥出色。对于玩家而言,这套体系具有很大的吸引力,因为其强大的功能性不容忽视。然而,要成功地搭配这套体系,还需要考虑其他因素,例如合理地安排攻击顺序,以及确保有足够的奶量来保证游戏的持续性。总的来说,白耳兵是一套非常值得一试的战术体系,值得玩家花费时间和精力去学习和实践。

热点资讯 11.23
江苏汽车换新补贴提前发放超25亿元,海量补贴申请已破30万份,详情可参看最新政策

江苏汽车换新补贴提前发放超25亿元,海量补贴申请已破30万份,详情可参看最新政策

江苏省汽车以旧换新补贴已经过30万份,达到25亿多元。其中报废更新补贴和汽车置换补贴已通过审核并发放。新车发票应在2024年7月25日至2024年12月31日期间有效。近年来,这项活动受到了广泛关注,消费者希望早日拿到补贴。

热点资讯 11.23
特朗普宣布放弃《纽约时报》的独家报道权,但遭质疑是否涉及违法行为

特朗普宣布放弃《纽约时报》的独家报道权,但遭质疑是否涉及违法行为

美国纽约一名法官批准了特朗普撤销其“封口费”刑事案件的请求。特朗普将面临可能的惩罚,包括罚款和最长十年监禁。特朗普律师提出,该案件将违反宪法,他需要撤销。目前,特朗普尚未提交书面动议陈述案情。

热点资讯 11.23