中国地理学家胡焕庸1935年提出了一条划分我国人口密度的对比线,即著名的“胡焕庸线”。而今天,这条线同样存在于我国数据版图中。“胡焕庸线”以东的地区国土面积占据总面积的1/3,但数据资源总量占到85%以上。“胡焕庸线”以西,国土面积达2/3,但数据资源总量只有15%。为推动东西部算力资源和需求的高效匹配、进一步解放数据生产力,“东数西算”这个国家战略级项目应运而生,并快速在全国范围内铺开。
东部枢纽节点要“精算”
上有天堂,下有苏杭。长三角地区自古以来就有“富庶之地”的美称。当地数字经济发展全国领先,与此同时,算力需求也一直处于高位。根据《中国城市算力服务网发展指数报告(2021)》,在长三角地区,除无锡市、淮南市外,其余样本城市均为算力需求大于供给,凸显了长三角地区算力需求旺盛、算力供给较为紧张的态势。
UCloud基础设施中心技术总监付东明在接受《中国电子报》记者采访时指出:“长三角经济体量较大、高端业务较多,比如股票交易等金融业务就有低时延、高安全性的要求,在长三角布局枢纽节点可更好地满足实时性高的需求。‘东数西算’并不是东部就不要‘算’了,而是要分层、错位地部署算力。”
同时,“东数西算”工程对数据中心的PUE提出更高的要求,东部数据中心PUE要低于1.25。而长三角地区,气候潮湿炎热,对数据中心的散热不是很有利。因此需要采取更新、更高效节能的创新技术方案。
华云数据董事长、总裁许广彬对《中国电子报》记者说道:“长三角算力网络及相关配套设施目前尚处于建设起步期和市场培育期,资金投入大、建设周期长、核心技术缺乏,叠加双碳目标和东西区域一体化目标,算力网络国家枢纽节点建设任重道远。”
“在‘东数西算’工程中,长三角地区承担着引领的角色和定位。”许广彬建议,“应充分发挥在市场、技术、人才、资金等方面的优势,发展高密度、高能效、低碳数据中心集群,提升数据供给质量,优化东西部间互联网络和枢纽节点间直连网络,通过云网协同、云边协同等优化数据中心供给结构,扩展算力增长空间,实现大规模算力部署与土地、用能、水、电等资源的协调可持续。”
西部枢纽节点亟须完善产业链生态
北纬42度,中国正北方,全年平均气温4.3℃。“曾经的乌兰察布‘地上无草、地下无宝’,唯一令人印象深刻的是‘灰头土脸’的马铃薯。土地贫瘠、天冷风大和穷困落后是乌兰察布贴了很久的标签。近几年,‘草原云谷’成为乌兰察布的科技新名片,一座座数据中心拔地而起,华为、快手、阿里巴巴等科技公司纷纷入驻,不仅带来了更多就业机会,也给当地增添了不少科技底色,可以明显感觉到整座城市的面貌焕然一新。”土生土长的乌兰察布人赵强对《中国电子报》记者说道。
据不完全统计,乌兰察布现已签约落地13个数据中心企业,共计22个数据中心项目,总投资约540亿元,服务器规模约266万台。根据2022年乌兰察布市政府工作报告,以全国一体化算力网络国家枢纽节点建设为契机,乌兰察布将推动形成一批“东数西算”典型示范场景和应用,数字产业产值突破10亿元。
付东明指出:“计算是一项高耗能的工作,分析数据中心的运营成本,电力成本往往占到总成本的50%以上。而内蒙古恰好是全国净供电量最大的省份,是算力枢纽节点的理想选择。”同时,内蒙古地区较低的气温有助于数据中心利用自然冷源对服务器进行冷却,实现节能、降本。“首都一小时经济圈”的地理位置优势则为其带来了网络传输便利。
西部枢纽节点要善于发挥冷数据优势。中国工程院院士邬贺铨表示,通常冷数据占到整个数据总量的80%。像AI模型训练、视频渲染、工业生产仓储、金融备份等数据都属于适合西部处理的冷数据。
需要注意的是,算力产业包括但不限于大数据产业,发展东数西算同时需要向上下游产业延伸。与东部相比,西部的大数据产业链有明显的短板,如数据中心上架率偏低、市场吸引力不够、数据中心价值难以体现以及人才缺乏等问题依然存在。
邬贺铨建议,西部地区要从全产业链角度出发,进一步完善数据中心生态。一方面,西部数据中心需要向上游数据预处理(标注、清洗、脱敏)业务拓展,并开展本地数据的挖掘业务。另一方面,西部可引进大数据产业链中的硬件产品(服务器、边缘计算和机房设施等)的生产,通过建立工程及运维服务队伍,面向全国开展数据中心工程服务。
下好全国算力“一盘棋”
实际上,我国算力结构不均衡、核心城市能耗指标紧张等问题早已引起了业界的重视,“东数西算”并不是一个新鲜的概念了,只不过此前一直未能形成站在全国整体角度的一体化布局。
如何理解“一体化”?国家信息中心大数据发展部规划处处长王建东表示,首先要一体化考虑数据中心、云、数据流通治理、数据应用、数据安全等领域工作,做好各层次间的衔接联动;其次要一体化推动政企资源融合发展,政府向社会公众开放公共算力资源和数据资源,企业为政府提供专业化服务;此外,还要一体化运用政策引导、规范制定、体制机制改革、技术创新、工程牵引等多种手段,协同解决大数据发展问题。
“东数西算”不是简单地将东部数据放在西部计算,而是将东、西部算力进行优化配置,统筹协调。这绝不是一蹴而就的,而是一项长期的、持续性的、复杂的系统工程。
王建东指出:“未来十年是‘连接大爆炸’时代,随着5G、工业互联网等技术的普及和应用,每个人、每个企业、每个家庭所拥有的数据流量规模都会出现十倍甚至几十倍的增长。‘云+智能’模式正在向‘云边协同’‘数智协同’模式裂变与升级。”
他建议,应从“上云、用数和赋智”三个层面去设计“东数西算”的推进路径。首先要探索“第四方云”的云数网联动转型模式,构建能够独立于各个工业云之上的统一算力调度云解决方案,解决企业上云和迁移成本高的问题,实现东西部云资源的自由调度。其次,要构建“前店后厂式”新型数据应用架构,把“前店”放在东部,“后厂”放在西部,实现东西部数据之间的流通。第三,要构建人工智能算力资源密集型的外包服务模式。在人工智能领域,大部分的算力消耗非常巨大,但时延要求并不高,可以把很多放在东部的AI算力模型训练任务转移到西部去,从而实现成本的有效降低。
世纪互联创始人陈升表示,东西部的八大节点和十大集群仅是冰山一角,“东数西算”作为国家战略性工程的巨大潜能还隐藏在水面以下。“东数西算”长期的演进目标是打造人人互联、发光发热的国民级“人海智网”,成为超越互联网的新一代网络空间基础设施,让数据真正取用于民、造福于民,这也是IDC行业奔赴未来的方向。