
发布日期:2025-07-21 05:05 点击次数:127
上海东说念主工智能推行室于7月19日发布了一项具有里程碑道理的效力,其研发的DeepLink超大限度跨域混训时期决策,凯旋应用于中国联通蚁集,将相隔1500公里的两个异构智算中心“拼成”一个“超等节点”,并完成千亿参数的AI大模子熟悉。此举在寰球初次已毕长距离跨域异构智能算力的高效整合,不仅可化解世界算力资源漫步不均、期骗率不高的瓶颈,更可裁减AI行业对特定芯片的依赖,一朝出现供应链波动,将为AI产业提供紧迫的兜底算力搭救,幸免被“卡脖子”。
据上海AI推行室先容,本年2月,他们集结十余家息争伙伴,在上海建成了超大限度跨域混训集群的原型,已毕了千亿参数大模子20天不间隔熟悉。在此基础上,他们交融中国联通AINET算力智联网,越过1500公里,畅达了上海和济南之间的智算中心,完成了千亿参数大模子混训。
所谓“跨域混训”,便是将位于不同地域、使用不同芯片架构(即“异构”)的多个算力集群互联起来,“拧成一股绳”用于熟悉;与之相对的是“单集群+单芯片”熟悉。对AI大模子熟悉而言,“跨域+异构”的组合,看起来不错带来“1+1”的算力资源,但效果上却远小于“2”,以致可能为“0”。此前,国表里尚无期骗“跨域+异构”算力集群完成坐褥级模子熟悉的前例,原因在于互联时期破损难以越过,导致模子混训效力低下,难认为继。这次,上海AI推行室凯旋已毕“零的打破”。实测数据泄漏,其与中国联通息争开展的跨域混训,等效算力高达单集群单芯片算力的95%以上。
曩昔几年,稳妥AI大模子的爆发,国内算力诞生轰轰烈烈,但同期也存在区域算力资源漫步和使用不平衡的情况,比如在西部一些地区,因为存在抽象本钱上风,超前部署了不少算力集群,但因为需求波动和运营问题,算力资源的骨子使用率并不高,出现了一定经由的算力闲置。同期,跟着AI芯片的快速迭代,以及国产芯片的百花皆放,各个智算中心使用的硬件架构也多有不同。由此,期骗创新的模范和时期,整合和周转跨域异构算力资源,变得越来越有战术价值。
上海AI推行室后生科学家、DeepLink系统团队精良东说念主王辉告诉记者,DeepLink决策创新性地选拔“3D+PS”的高内聚低耦合架构,某种道理上不错说是“以算法换带宽”。它将超大限度熟悉任务分发到隔离沉的各个智算中心,通过算法创新,灵验松开了对蚁集的压力;用户只需使用粗鄙专线蚁集,就可开展大模子熟悉。此外,该决策还能确保在跨域熟悉中,即使某地智算节点发生故障,全体熟悉也能不息,显贵进步了褂讪性。
骨子上,除了中国联通,上海AI推行室还与中国电信、商汤、仪电等智算平台进行了息争。其中,基于中国电信息壤算网,在不到10G带宽的蚁集条款下,已毕了北京、上海、贵州三地智算中心的互联和大模子混训,等效算力也曾在90%以上。王辉示意,表面上,DeepLink可通过动态设置搭救数千公里的跨域混训,这意味着,国内恣意两地的智算中心都可借助该决策已毕算力整合。
中国联通询查院下一代互联网数据中心蚁集团队司理徐博华告诉记者,中国联通诞生高通量、高性能、高智能的算力智联网AINET,研发了长距无损条约及硬件架构;DeepLink则在算法和软件层面已毕一系列草创效力。这次“双向奔赴”的息争,为世界算力资源的高效期骗带来很多思象空间。比如,它可将多地“碎屑化”的算力握合在一齐,化零为整,酿成高价值的资源。着眼改日,一朝限度达到当今10倍乃至更大的AI模子出现,对算力提倡新的创新性需求,该决策也有可能让用户无谓花天价新建超大型智算中心,而是通过将上一代智算中心进行“低本钱组合”,得志熟悉需求。
上海AI推行室示意,下一步,他们还将进一步通过DeepLink超大限度跨域混训时期决策,组建算力生态,扩大应用鸿沟,激动DeepLink决策能被更多干事商所整合,从而让用户不错像逛超市那样,在世界解放弃取高质地、高性价比的算力供给,为世界算力一体化布局注入中枢动能。同期,他们也会面向多元算力在AI大模子夹杂推理、漫步式强化学习等需求,进一步完善时期决策。