自2022年我国启动“东数西算”工程以来,各算力枢纽节点建设提速。随着人工智能等新技术的不断发展,也对全国一体化算力网建设提出了更高要求。
国家数据局局长刘烈宏日前在《求是》发表署名文章(下称“文章”)时表示,数字经济时代,算力是新质生产力,算力网是促进全国范围内各类算力大规模调度运营的数字基础设施,构建全国一体化算力网、推动算力基础设施化是国家现代化的重要标志之一。
目前全国一体化算力网建设进度如何?八大算力枢纽节点建设有哪些重点?
八个算力枢纽进展如何
近年来,AGI(通用人工智能)的发展推高了算力需求。今年的政府工作报告提出,适度超前建设数字基础设施,加快形成全国一体化算力体系。工信部数据显示,截至2023年6月底,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到197 EFlops,位居世界第二,算力总规模近五年年均增速近30%。
就在2022年2月,国家发改委等四部门印发通知,同意在京津冀、长三角、粤港澳大湾区等8地启动国家算力枢纽节点建设,并规划了10个国家数据中心集群,标志着“东数西算”工程正式启动。目前八个枢纽节点2023年新开工的数据中心项目近70个,其中,西部新增数据中心的建设规模超过60万机架。
第一财经梳理各地官方数据发现,八个国家算力枢纽节点的建设方案已进入深化实施阶段。
3月14日,随着中国电信东数西算国家枢纽庆阳算力中心1000台GPU服务器稳定运行,全国一体化算力网络甘肃枢纽节点庆阳数据中心集群算力规模突破5000P,达到5300P。
截至目前,长三角一体化示范区数据中心集群取得全面建设。这个位于江苏吴江的全国一体化算力网络国家枢纽节点计划今年5月开始启用部分算力大楼。此外,经过近2年的建设,芜湖集群起步区数据中心项目17个、设计装机规模64万架、投资额约2588亿元;已投产数据中心项目6个、在建未投产项目6个、待建项目5个。
2023年,宁夏建成全国首个万卡智算基地,算力质效指数全国第四、西部第一,数字经济占GDP比重为35%以上。中卫集群互联网出口带宽达到18T,实现中卫到北京的单向时延8~10毫秒以内,到上海的单向时延15毫秒以内。
内蒙古数据中心服务器在运行已达到260万台,和林格尔新区数据中心标准机架达到22万架,服务器装机能力达到150万台,通用算力总规模达到1000P;推动建设11个超算项目,超级算力规模达到195P。
此外,截至2023年底,张家口市投入运营的数据中心为27个、标准机柜33万架、服务器153万台,算力规模达到7600P;截至2023年7月,四川全省算力规模约为10EFlops,其中智能算力占比约为10%,主要分布在成都及周边地区;2023年,重庆全市算力规模超过1000P;目前,贵州总算力规模增长28.8倍,智算规模占比超过八成,贵州全省在建及投运数据中心39个,大型以上数据中心22个。
对于八个节点的具体定位,刘烈宏在上述文章指出,在“东数东算”、“西数西算”与“东数西算”协同推进的过程中,要充分发挥各个国家枢纽节点优势,探索优化异属异构异地算力资源并网调度技术方案和商业模式,加大低成本、高品质、易使用的算力供给,切实推动算力供需平衡。
具体来看,京津冀、长三角、粤港澳大湾区、成渝四个节点,立足服务重大区域发展战略实施的需求,进一步统筹好城市内部和周边区域的数据中心布局。贵州、内蒙古、甘肃、宁夏四个节点,在清洁能源供给方面具有天然的优势,适宜建设绿色算力基地,通过积极承接东部地区中高时延业务,推动东部人工智能模型训练推理、机器学习、视频渲染、离线分析、存储备份等业务有序转移,并承担本地实时性数据处理,形成全国算力发展“一盘棋”。
还有哪些关注重点
近年来,我国通用算力布局已初步实现向西聚集,西部国家枢纽节点数据中心集群平均上架率近六成,东西部算力资源空间分布不均衡局面得到较大改善。随着算力应用市场逐步扩大,算力资源不应只关注“量”的增长,也应注重“质”的提升。
“‘质’的方面,应推动存量资源优化,加强各类资源整合。‘量’的方面,应避免盲目上马、无序建设。推动各类新增算力向国家枢纽节点集聚,将国家枢纽节点打造成为国家算力高地,坚定不移地走算力规模化、集约化、绿色化发展道路。”文章认为。
刘烈宏表示,随着“东数西算”工程推进,非国家枢纽节点地区参与热情高涨。为推动非国家枢纽节点地区加快融入“东数西算”工程,鼓励东部、中部算力需求城市以“结对子”方式开展与国家枢纽节点协同联动,积极利用国家枢纽节点算力资源,构建跨区域算力调度体系,探索通过算力“飞地”等模式开展算力网合作共建,实现算力资源高效供需匹配。
上海新兴信息通信技术应用研究院首席专家贺仁龙接受第一财经记者采访时表示,建成全国一体化算力网络,通俗来说就是哪里缺算力可以弹性调配周边闲置算力资源。“好比打电话路由选择一样——会绕开拥塞路线,自动选择空闲合理路线。当前还根本没有做到全程全网的弹性算力调度功能。”
在他看来,解决算力负载均衡问题,除了东数西算,在国产算力供给“质”不够的情况下,需要的“量”更大,这样超级智算集群一定会出现。所以需要多管齐下,构建全国范围内,全程全网柔性的一体化智算平台尤其重要,同时还要有新技术同步解决。
“我们国产智算能力还有提高空间,需要成倍的算力集群,超大算力集群的叠加效应,是需要远程万兆以上高速光纤直连,同时要满足IPv6+的网络可定义可编程能力——实现不同区域多处算力资源的同网协同。更重要的是,智算是海量数据的吞吐和运送,智算速度的瓶颈更多体现在各计算单元之间的数据通量大小,这样就需要区间协同的DPU(超级智能网卡)做到跨算力单元的一体化高效协同。”贺仁龙说。
中国信息通信研究院院长余晓晖在今年全国两会期间接受采访时表示,我国算力基础设施建设已达到世界领先水平,算力总规模位居世界第二。然而标准化普惠化算力服务统一大市场尚未形成,存在算力供给紧张而同时部分算力未能有效利用的矛盾,算力新质生产力作用未充分释放,存在需要进一步思考和解决的问题。
他分析说,这些问题主要集中在三个方面:如何在多元化算力供给的状况下统合形成标准化、可调度的算力服务;如何在算力资源和需求区域差异突出的情况下实现全国资源优化配置和算力高效服务;如何将算力并网调度的局域化探索扩展为构建全国统一大市场。
例如,我国东部经济发达地区算力供不应求,但区域内算力资源供给能力和增长潜力有限。西部地区具有大规模算力设施发展的资源禀赋优势,但本地需求不足,资源利用率不高。“需要在统筹全国算力设施区域优化布局的基础上,解决好算力服务统一市场构建和资源全域有效利用问题。”余晓晖说。
这篇文章讨论了我国推进“东数西算”工程的重要性以及面临的一些挑战。总体而言,未来全国一体化算力网建设将更加完善,以支撑我国经济的高质量发展。为了克服当前面临的挑战,各方应该共同努力,推动算力基础设施建设和使用效率的提高。具体来说,国家应加强政策引导和支持,企业则需要创新技术和管理方法,确保算力资源的有效利用。同时,教育和公众也应该加强对云计算和大数据技术的理解和应用。