全国首次!3分钟!百卡算力完成800公里跨省迁移

作者/ IT时报 毛宇

编辑/ 郝俊慧 孙妍

12月5日,《IT时报》记者从中国电信2025年数智科技生态大会“AI+绿色智算生态合作论坛”现场获悉,临港算力(上海)科技有限公司(以下简称“临港智算谷”)联合国网上海电力、中国电信集团研究院,成功落地“沪闽”AI百卡智算集群多任务跨省转移项目。

这是国内首次实现跨省(市)百卡算力集群的自动化、高精度迁移技术验证。

初冬的上海临港智算谷内,屏幕上“3分钟”倒计时逐秒减少,104张昇腾910B算力卡正高速计算着三类AI任务——语言大模型、打车策略模型、视频智慧识别模型,正精准“跃”至800公里之外的福建省福州市。

倒计时归零!刹那间,算力节点成功连通,业务分毫未断流,上海本地算力负荷同步骤降50千瓦,瞬时降幅达80%,一场无声的算力“跨省接力”完美落定。

这一突破,是继今年7月临港智算谷首次将生产环境下的算力迁移至湖北十堰后的再次跨越,标志着算电协同技术正式从点对点试点迈向可商用、规模化应用的新阶段。

“近在咫尺”的沪闽算力交互

曾经,传统数据中心参与电网调度多依赖柴油机、UPS(不间断电源)等硬件设施,灵活性和可持续性均有限,而此次沪闽百卡集群的迁移,则真正激活了算力本身的调节能力,让其从单纯的生产力转变为电网的调节力。

今年3月,临港智算谷敏锐捕捉到国网上海电力调峰的需求,联合中国电信研究院获得政策和资源支持;7月,算力首次迁移至湖北十堰验证其可行性;12月5日,实现首次沪闽百卡集群跨省迁移。

“整个过程就像搭积木,每一步都得扎扎实实。”临港算力副总经理姜鎏直言,项目能实现“秒级调控+分钟级响应”,核心是攻克了从算力任务组合、指令响应到跨省转移的全链路技术,搭建起一套自动化闭环调度体系,而这背后,靠的是五大关键技术环环相扣。

第一步便是筑牢“互联互通的底座”,让调度指令先跑通。上海侧算力中心接入电力、算力双内网,能精准对接上海市级虚拟电厂平台与电信“息壤—云霆”算力调度平台;福建侧则提前备好匹配规格的算力资源,复刻与上海一致的任务运行环境,让AI任务迁移时无缝衔接,不用重新适应。

第二步,便是再建一条“跨省高速”。依托中国电信跨省专线,项目在电力与算力内网间搭建安全API接口通道,低延迟、高带宽的网络保障,让沪闽两地算力数据传输“快且稳”,为后续任务迁移扫清障碍。

如何实现“全链路贯通”?指令从上海市级虚拟电厂平台出发,经上海电信虚拟电厂运营平台核验,再传至“息壤—云霆”算力调度平台执行,全链路顺畅衔接,确保调度指令“不卡顿、不跑偏”。

路跑通了,还需要一个“智能大脑”。基于Kubernetes(K8s 开源容器编排系统)容器平台,算力任务能灵活部署、扩缩容与迁移。“息壤—云霆”平台会自动核对指令,筛选出适合迁移的低时延推理任务,生成转移策略后,再定向引导业务流量到福建节点。

同时,实时追踪服务器功耗、GPU利用率等指标,一旦出现问题,跨节点审计会自动触发回滚,保障业务“零中断”。

“这不是一家企业能完成的事。”临港算力(上海)科技有限公司“双碳”事业部总监袁潇洋在接受《IT时报》记者采访时强调,国网上海电力提供成熟的电力调度体系,明确需求方向;中国电信研究院的“息壤—云霆”平台奠定技术底座。大家各司其职、优势互补,才让算电协同从想法变成了现实。

调度周期结束后,业务需回到上海。临港智算谷搭建了“回切高速恢复”机制,这也是最后一步。系统会自动或按指令,将业务无感迁回上海原始数据中心,并快速进入活跃状态,整个过程不影响使用。

从“AI底座”到“调峰电站”

在上海临港智算谷园区,成群机柜组成的算力集群正平稳运行,这里正是此次验证的“发源地”。

作为中国电信全资子公司,临港智算谷正在这里搭建涵盖海陆双节点的算力谷,向新征程迈进。

《IT时报》记者了解到,此项目中,临港智算谷还做了一次创新型测试。

“104张算力卡的调度并非终点,我们还做了多场景测试——比如将104卡拆分为两个50卡任务分别迁移,或整体迁移后再根据电网指令迁回,实现‘削峰填谷’的灵活调节。”袁潇洋表示。

上述基于临港智算谷全量适配的算电协同技术,理论上可形成数兆瓦级虚拟电厂响应能力,相当于为城市建起一座“数字调峰电站”,每年能减少数千吨碳排放。

能力背后,是临港智算谷完善的基础设施与技术储备:这里不仅有充足的算力资源池,更有成熟的监控体系、灵活的调度平台与专业的运营团队,能为不同行业提供从算力部署到运维管理的全流程服务。

“未来,我们将以此次沪闽百卡集群验证为起点,进一步纳管更高量级负荷,扩大跨域算力调度与电力调度协同响应与技术适配的范围。”袁潇洋透露,临港智算谷计划探索兆瓦级虚拟电厂响应能力与海陆一体算电联动能力,持续强化在智算领域的领先优势。目前已启动与福建、湖北等省份的算力节点对接,计划明年实现跨区域算力调度常态化,“让每个智算中心都成为电网的‘弹性储能单元’,这才是‘双碳’目标下的算力新生态”。

从支撑AI任务高效运行,到参与城市电网调节,临港智算谷正推动算力从“生产力”向“生产力+调节力”的双重角色转变,重塑算力中心核心价值。