升级版MindSpore2.3已推出!包含20个实操性强的热门训练模型,让您立即投入实战!

2024-03-23 热点资讯 关注公众号

3月22日,在昇思人工智能框架峰会2024上,昇思MindSpore 2.3正式发布。华为公司ICT Marketing总裁周军表示,华为将从三方面推动昇思MindSpore的发展,首先是聚焦根技术支持伙伴孵化原生大模型,其次是面向行业场景加速大模型应用落地,最后是使能开发者成长成功,打造开源社区。

大模型已经成为了通用人工智能的关键路径,参数达到了万亿级别,华为预计,未来几年大模型参数会达到百万级别,真正达到通用人工智能的程度。

但是受摩尔定律的限制,算力的增长非常缓慢,与大模型的需求形成了鸿沟,严重制约了大模型的快速发展,人工智能框架的并行计算能力、简洁编程能力、便捷部署能力等,逐渐成为大模型训练的关键成功要素。

大模型训推挑战

昇思MindSpore技术总经理于璠在会上提到,目前大模型分布式训推的过程当中,主要存在几个关键挑战,开发效率、训练性能以及推理运行成本。

他表示,在使用万卡集群训练的时候,系统之间需要频繁通信,导致计算利用率急剧下降,当前业界平均水平也就达到了40%。此外,在千亿参数模型训练的过程中,大概18-19个小时就会有一次故障,故障恢复大概要耗时3-4个小时。

有观点认为,未来万卡集群、十万卡集群的训练中,故障频率可能会进一步提高,可能接近小时级,算力真正有效的时间不足四分之一,这是极大的浪费。

当大模型训练好之后到生产环境做推理,转换过程也要耗费海量成本,如果用以前的技术手段,把大模型导出再部署到端侧、边侧的设备上,有经验的工程师需要以月为周期的时间完成,严重拖累大模型的部署。

大模型在推理侧依然要面临成本问题,于璠透露,SORA刚刚发布时,华为使用SORA进行一次推理的时候,大概60秒的视频推理时间要1个小时,花费几十美金。

此外,在性能和成本之外,大模型的开发也面临着一些新的挑战。科学家或者开发者既要懂算法,又要懂并行技术,而且在调试过程中每次训练的时间也非常长,开发侧的隐形成本非常高,目前业内很难实现快速大模型快速落地。

昇思MindSpore 2.3发布

华为于2020年3月28日开源了昇思MindSpore框架,开源后访问量数千万,社区核心贡献者超过2.5万,社区贡献比例超过20%,MindSpore社区开源500多种模型,支持伙伴孵化,适配50多个大模型。

从2020年发布1.0版本到2023年发布2.2版本,昇思MindSpore 从支持端、边、云,全场景,到原生支持大模型分布式训练,到部署的全流程,并成为业界首个原生支持科学智能的人工智能融合框架,超过687万用户下载安装使用。

大模型技术快速迭代演进,业界主流模型也从千亿的稠密走向万亿的稀疏模型,昇思MindSpore 2.3的升级也对应这些需求。

周军表示,昇思MindSpore提供开源开放的训推全流程的开发套件,支持伙伴基于昇思孵化原生大模型,在模型开发阶段提供20多个开箱即用的业界主流训练模型,模型开发的周期缩短30%

昇思MindSpore通过原创的多副本、多流水交织等8种并行技术,使集群线性度达到90%(业界不足60%),通过整图优化及下沉执行等,使得算力利用率达到55%(业界不足40%);针对集群故障率高,恢复时间长的普遍问题,通过编译快照,确定性CKPT技术实现20分钟完成故障恢复。

为了帮助行业场景加速大模型应用落地,昇思MindSpore人工智能框架作为算法应用和硬件算力之间的桥梁,推出训推一体解决方案。

在大模型部署方面,昇思通过训推一体的架构升级实现脚本、分布式策略,运行时的统一,Baichuan2-13B的推理部署只需1天。在大模型推理上,通过LLM Serving 实现推理吞吐提升2倍多;升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。

为降低开发门槛,昇思持续升级MindSpore TransFormers大模型套件,并提供MindSpore One生成式套件,全流程开箱即用,一周即可完成大模型全流程的开发。

在AI for Science方面,MindSpore已在AI生物计算探索多年,联合顶级科研机构和伙伴打造了AI生物计算套件,包含蛋白质结构预测、生成等20多个SOTA模型,加速相关领域创新。

从行业维度观测,企业和开发者选择开源框架主要关注模型整体的丰富度以及训练的速度,与此前的AI开发者相比,大模型和AIGC开发者还会关心基于框架算法的领先性,部署性价比、落地效果以及芯片的适配度,这也将成为未来一段时间人工智能框架发展的主线。


结论:虽然大模型已经成为通用人工智能的关键路径,但由于摩尔定律的限制,算力的增长非常缓慢,这严重影响了大模型的快速发展。同时,开发效率、训练性能以及推理运行成本也成为了大模型训练的重要挑战。
建议:
1. 研发人员应重视模型的整体丰富度,以满足不同场景下的需求。此外,还应注重模型训练的速度,通过不断优化算法和简化流程来提高效率。
2. 针对大模型的部署问题,应研究如何降低成本并提高效率。例如,可以研究跨平台和大规模部署的技术,以及优化机器学习算法以提高推理性能。
3. 企业和开发者在选择开源框架时,不仅要关注其丰富的模型和技术,还要考虑其在理论上的前沿性和实际应用中的表现。例如,要考虑框架是否能够帮助加速AI生物计算的研发和应用,以及其与其他AI技术和系统的兼容性。
4. 利用现代科技如大数据、云计算等技术,可以帮助加速模型的训练和部署,从而解决上述挑战。例如,可以通过数据分析和机器学习算法来优化模型的训练过程,通过云计算和虚拟化技术来实现实时部署和管理。
5. 最后,要强调开源的精神和价值观,鼓励更多的开发者参与到大模型的开发和推广中来,共同推动人工智能的发展。

上一篇:回眸 | 她获得世界杰出女科学家成就奖,揭开远古生命起源之谜
下一篇:鲁东大学徐文龙课题组本科生AFM:基于溶剂交换策略的抗溶胀凝胶传感器用于水下通信
更多更酷的内容分享
猜你感兴趣
深度学习:让GPT-4替代人力训练吗?OpenAI推出新的CriticGPT模型,让我们一起探索这个未来的可能性

深度学习:让GPT-4替代人力训练吗?OpenAI推出新的CriticGPT模型,让我们一起探索这个未来的可能性

OpenAI研发CriticGPT,利用AI识别ChatGPT代码错误 提升审查效果。通过实验证明,相比人工评审,CriticGPT可提高训练师准确率并减少错误。

热点资讯 06.28
何小鹏:AI训练投入超35亿元,短短四个月已实现自主驾驶

何小鹏:AI训练投入超35亿元,短短四个月已实现自主驾驶

练方面已经投入了数十亿元资金,并且已研发出1000多种AI芯片和大规模数据处理系统。此外,小鹏还与多家国内顶级科技公司合作,共同推进AI技术的研发。

热点资讯 07.31
OpenAI声明将启动新一代前沿模型训练,目标是推动AGI愿景的实现变得更加切实可行

OpenAI声明将启动新一代前沿模型训练,目标是推动AGI愿景的实现变得更加切实可行

OpenAI宣布新系统将到达AGI水平,并透露“GPT-5”已开搞。这标志着AI发展的一大里程碑,但也有投资者担忧未来的AI将超越人类智能。 OpenAI即将发布下一代大模型,可能要在明年才会与公众见面。

热点资讯 05.28
重庆北碚公安局:全面强化警犬实战化训练,提升警察工作效率与安全防护能力

重庆北碚公安局:全面强化警犬实战化训练,提升警察工作效率与安全防护能力

背景介绍:近年来,重庆市北碚区公安分局积极推进警犬现代化建设,致力于打造一支能够适应复杂环境、执行高强度任务的专业团队。在训练模式上,该局始终坚持“一人多岗、一犬多能”的训练管理模式,针对不同岗位和职责,分别组建相应的警务辅助力量。 事件转折点:自2012年起,北碚公安警犬基地建成了,并曾多次受到表彰,其中4名警犬在省级技能大赛及警犬技术大比武中获得了集体一等奖。 突破点与要点:在训练中,公安人员会在训练场提前摆放好多个箱包,并在一个箱包中藏有感染毒品气味的纱布。训练员引导训导员在箱包间穿梭,使警犬通过嗅觉进行搜索。警方还会根据训练结果,给警犬分配不同的专业岗位,包括侦查、搜救等。训练中,警方还会定期组织专项“月考”,考核训练成果。 总结:北碚公安采取科学的训练方式,不断优化警犬技术,使其既能适应复杂的环境,又能发挥出色的任务执行能力。他们坚持练为战的实训思路,旨在提高警犬的工作效率和服务实战能力。

生活常识 06.23
电子通讯市场的一次重大震动:中国消费者对美国产品态度的转变

电子通讯市场的一次重大震动:中国消费者对美国产品态度的转变

黎巴嫩多地发生涉及通讯设备爆炸事件,致死30多人,伤者3000多;中国有警惕,电子武器化提防。[[2]()]。

热点资讯 09.19
详尽解读五老星的五大能力:死神仅为一例!

详尽解读五老星的五大能力:死神仅为一例!

五老星五名老人听命于神秘人物伊姆,同时具备不死之身、魔法阵和心灵感应等能力,可能是由伊姆赐予的共同能力。这些能力分别可以让五位老人在各种情况下迅速恢复生命力、建立或破坏防御性魔法阵以及进行心灵沟通。

热点资讯 09.19
娃哈哈、农夫山泉供应商遭遇“烂苹果”危机

娃哈哈、农夫山泉供应商遭遇“烂苹果”危机

事件是安德利果汁公司供应商遭遇“烂苹果”危机,引起公众关注。该公司主要客户为统一、娃哈哈、农夫山泉等企业,而汇源却否认与该事件有关。公司位于礼泉县工业园区,入驻了17家企业。经市场监管局抽检发现,公司的同类型果汁产品质量存在问题。目前,公司正在进行整顿,暂停部分产品出库。

热点资讯 09.19
华为新挑战:竞争加剧!三折屏卷轴屏能否满足你的需求?

华为新挑战:竞争加剧!三折屏卷轴屏能否满足你的需求?

华为折叠屏手机的预约人数已达642万,预计2024年第二季度全球折叠屏智能手机出货量同比增长48%。 三星计划在2025年推出卷轴屏智能手机,屏幕将比MateXT更大,最高可达12.4英寸,并采用屏下摄像头。 由于中国手机厂商的进入,三星折叠屏市场份额逐渐下滑,今年一季度全球出货量暴跌42%,市场份额同比降25个百分点。 另外,小米公司获得了一项“手机及其主体”的外观设计专利,展示了小米三折叠手机的设计。

热点资讯 09.19
郑钦文确认参加2023年联合杯,引领中国国家队阵容连续两年征战世界大赛

郑钦文确认参加2023年联合杯,引领中国国家队阵容连续两年征战世界大赛

中国选手郑钦文将于2025赛季引领国家队参加联合杯。 联合杯是中国与多个国家和地区球队之间的混双比赛,将于今年举行。郑钦文将带领中国女子组合参加比赛。她将在第一轮对阵西班牙选手塞雷娜·威廉姆斯,如果获胜,她将成为第一位进入女单八强的亚洲球员。

热点资讯 09.19
内蒙古车祸:一辆小车与收割机相撞,造成一人死亡和四人受伤,目击者称该车似为逆向行驶

内蒙古车祸:一辆小车与收割机相撞,造成一人死亡和四人受伤,目击者称该车似为逆向行驶

一位名叫刘欣荣的中央广播网记者经过采访得知,9月18日在内蒙古赤峰市阿鲁科尔沁旗的一农田市场附近发生了一起交通事故,现场可见一辆小车和一辆收割机发生了碰撞,导致其中一辆收割机受损严重,同时一名乘客被困车内无法自行离开。据当地政府通报,事故发生的原因是车主在送孩子上学的路上发生了意外。目前,事故已造成1人死亡4人受伤,相关部门正在进一步调查中。

热点资讯 09.19
乌克兰外交困境:盟友分裂与全球南方团结的挑战

乌克兰外交困境:盟友分裂与全球南方团结的挑战

表达了对乌克兰的强烈不满。不过,各方的态度仍然存在分歧。波兰、斯洛伐克和匈牙利等国的质疑声逐渐汇聚成一股力量,而乌克兰则试图通过访问加拿大的方式改变美国及欧盟的核心国家的看法。然而,由于西方内部分歧加剧,乌克兰的国际形象受到了影响,非洲国家对乌克兰的支持萨赫勒地区的分离主义势力的反应加剧了这一问题。贸易争端和外交危机的出现,使得这场战争仍在进行中,但西方支持俄罗斯的“统一战线”却出现了裂缝。对于未来的前景,各方的态度仍存在分歧,但乌克兰的情况仍然令人担忧。

热点资讯 09.19
美国副国务卿声称:中国是重大挑战, 冷战不再具有重要性

美国副国务卿声称:中国是重大挑战, 冷战不再具有重要性

根据您提供的文本,我们可以提取出以下几个关键信息: - 中国是美国“史上最大挑战”,被视为美国面对的最大挑战。 - 坎贝尔对中国提出的挑战进行回应,并将其定义为“军事实力或经济主导地位的较量,以及影响21世纪和全球力量平衡的规则之争”。 - 双方之间的分歧主要集中在国防开支上,认为增加国防开支不能解决问题。 - 主席麦考尔强调中国威胁的存在,并对中国提出了“军事实力或经济主导地位的较量,以及影响21世纪和全球力量平衡的规则之争”的观点。 总结起来,文本突出了中美之间存在的战略挑战和分歧,同时也强调了中国在这一过程中所承担的责任。

热点资讯 09.19
中国象棋协会对王天一等人的处罚决定曝光,撤销特级大师称号,终身禁赛进行公示

中国象棋协会对王天一等人的处罚决定曝光,撤销特级大师称号,终身禁赛进行公示

中国象棋协会决定永久封禁王天一和王跃飞,并禁止二人参与任何象棋比赛和活动。此外,他们还将接受严厉处罚,包括终身禁赛和技术等级称号的撤销。中国象棋协会将展开全面清理,并要求社会各界对此保持监督。

热点资讯 09.19
炽烈之声:聆听一代代中国军人的誓言

炽烈之声:聆听一代代中国军人的誓言

这一代代中国军人向生死宣誓,始终忠于党,为人民和国家付出。他们挑战恶劣环境,克服困难,忠诚勇敢地履行职责。

热点资讯 09.19