特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

澎湃新闻首席记者 贺梨萍
2023-06-04 07:43
来源:澎湃新闻

2022年1月24日,商汤科技在上海自贸区临港新片区布局的人工智能计算中心AIDC正式启动运营。当时这家人工智能公司未必能精准预测,2022年即成为了所谓的AIGC(AI Generated Content)元年。

“今天,我们的临港AIDC已经有接近3万块的GPU(图形处理器),我们目前的算力已经达到5000 PetaFLOPS(1 PetaFLOPS等于每秒1千万亿次浮点运算),在这之上我们相信未来可以有更好的开发者效率,并且都能够支持更多千亿规模的大模型算力训练。”在6月2日的“AI引领时代,算力驱动未来”——临港新片区智算大会上,商汤科技董事长兼CEO 徐立如是表示。

据澎湃新闻(www.thepaper.cn)记者从商汤方面了解,“目前还有大量的需求在路上排着队”。而在商汤科技联合创始人、大装置事业群总裁杨帆看来,人工智能对于更大数据、更大规模、更大算力的追求并不是“始于今天”,“整个人工智能技术迭代、进步的历史,我们可以把它看成是一个对于‘暴力美学’的追求,以及算法、算力、数据三要素由量变产生质变的一个技术迭代的过程。”

聚焦前沿产业的临港新片区对这种新的热潮迅速做出了响应。6月2日当天,临港新片区党工委副书记吴晓华在上述大会上发布了《临港新片区加快构建算力产业生态行动方案》。该《方案》的蓝图之下,至2025年,临港将成为具有全国影响力的算力产业集聚区,含相关硬件、软件、应用、服务等的算力产业总体规模将突破100亿元。

临港新片区党工委副书记吴晓华发布《临港新片区加快构建算力产业生态行动方案》。

“我们看到AI大爆发的时代已经来临了,AI进入到我们生产和生活的各个领域,那么随着 AI应用的大爆发,它其实也驱动了算力需求的大爆发。”对于上述《方案》的出台,临港新片区管委会高科处处长陆瑜对澎湃新闻(www.thepaper.cn)在内的媒体表示,临港前期已具备了很好的优势,“就是我们的算力资源非常丰富。”

更为重要的是,在人工智能公司选择是否落地临港时,算力资源已经成为尤为重要的决策因素。

算力是新时代的能源,而成功又不仅仅在于“暴力美学”

何谓算力?徐立认为,算力其实是整个模型能力的表达,“算力等于算法或者说大模型的参数,去乘上它所处理的数据量。大模型时代参数越大,乘上的数据量越大,所需要的算力就越大。”算力已然成为新时代的能源,“某种程度上,算力决定了市场的竞争力。”

杨帆也谈到,从去年到今年整个人工智能领域非常火的一个概念叫内容生成,同时大家都熟悉了一个名词即大模型。简单来看,这是一种“暴力美学”,例如,GPT-3模型使用了超过1750亿个参数,需要高性能的处理器来支持训练,使用V100训练耗卡量为10000张卡训练14.8天,整体算力需求约625 PetaFLOPS。

杨帆认为,这种“暴力美学”也可以理解为量变产生质变,“其实人工智能从它诞生的第一天起到今天,一直都在追求通过规模化带来更强的智能化。”他提到,实际上就人工智能领域来说,在过去的5-6年时间里,业内最顶级的人工智能模型对算力的消耗量,“每4-6个月就要翻一番,也就是说过去的这几年时间里翻了近30万倍。”

当然,“暴力”和“智能”并不是完全成正比,“拥有更大的资源、更大的规模,它仅仅是一个必要而非充分的条件。”杨帆强调,真正在“暴力美学”背后支撑产生重大的技术创新和成果的,恰恰又是在于对每一个环节的持续性的优化和改进。

以数据为例,“GPT-4所用的数据其实只是OpenAI收集到的所有数据的1%,因为他发现当把更多的数据去灌给机器人的时候,有可能反而不那么聪明,应该把更加有效、更加高价值的数据提供给这个算法,然后才能去创造出一个更加聪明的大脑。”

其认为,至少在今天,数据的有效性远比数据的总量更加重要。而如何定义有效的数据,“这其实就需要数据科学家大量的努力,OpenAI其实让他们最优秀的科学家去做数据了,并非大家觉得的去搞算法了。”

这种每个环节的优化同样包括算力,在英伟达缺货的情况下,为什么没人在用国产芯片做商业化的大规模训练?为什么最新这波浪潮到来后,第一时间钱都被英伟达挣走了?这些问句背后的解释是,“并不是我们把算力量堆到一个数值就能够产生最终的价值,1000张卡100台服务器放在一起跑同一个任务,这中间还需要大量的配套软件、通信网络,它是一系列软硬件联合调优的过程,这样的工作积累我们过去没有做,我们今天就需要去补课。”

顺势而为,临港加快形成多元算力供给体系

据吴晓华介绍,临港新片区算力产业已在上游软硬件、中游的数据中心、调度平台,下游应用进行了相应布局,目前临港总算力超过3EFLOPS(FP32,1 EFLOPS等于每秒1百亿亿次浮点运算),其中智能算力占比近80%,总算力规模约占上海市近20%。

前述《方案》提出,目标到2025年,新片区将形成以智算算力为主、基础算力和超算算力协同的多元算力供给体系,总算力超过5EFLOPS(FP32),AI算力占比达到80%,算力产业总体规模(含相关硬件、软件、应用、服务等)突破100亿元,建成公共算力服务平台,规范算力交易机制,实现区域算力调度,打造具有全国影响力的算力产业集聚区,建设一批算力示范应用标杆场景。

“智能算力也就是当下最为火热的AI企业所需要的,我们也发现,AI企业落地到临港来,他们不再是仅仅关注给他他多少政策支持,给他多少补贴,他会关注落地在这边,能不能解决他的算力需求,因为现在市场上算力是非常紧缺的。”陆瑜提到了这一显著变化。

据商汤方面介绍,截至今年5月,商汤大装置已累计服务超40个核心客户。“特别是在大模型的浪潮之下,我们现在支撑了10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。”杨帆也提及。

成立于2018年的深势科技是算力需求方之一。该公司核心团队由中国科学院院士鄂维南等人领衔,是“AI+Science”科学研究范式的先行者,其首创的“多尺度建模+机器学习+高性能计算”范式,突破性地实现了多尺度分子模拟中精度与效率的统一。

据澎湃新闻(www.thepaper.cn)记者此前报道,深势科技已推出Lebesgue科学计算平台、Hermite药物设计平台以及Bohrium微观计算与设计平台等。例如在医药领域,深势科技与多家客户携手,将物理建模+AI的计算范式与临床前药物研发更广泛的结合,通过Hermite Uni-FEP、Uni-Fold、RiD等模块,将自由能微扰理论、分子动力学、增强采样算法与高性能计算相结合,精准预测蛋白质结构及构象变化,并以化学精度高效评估蛋白与配体的结合自由能,为药物研发人员提供高效精准的理论指导,提升药物设计与优化效率。

去年12月29日,总部位于北京的深势科技在临港注册成立了深度势能生物科技(上海)有限公司。深势科技政企事务副总裁刘会师在接受澎湃新闻(www.thepaper.cn)记者采访时表示,公司在临港布局新一代分子模拟算法研发中心和AI辅助药物设计业务中心,主要也是因为看到临港正在大力发展算力,“我们在训练模型过程中,对算力是有需求的,另外临港尤其是要大力发展国产化算力,我们也想为这方面添砖加瓦。”

从业务层面来说,“我们在临港主要是布局我们的药物研发业务,包括我们自有管线的研发。”刘会师提到,深势科技的业务和临港甚至上海的人工智能、生物医药这样的先导产业有正相关的直接合作关系,“我们愿意把我们的研发以及产品纳入到临港的大的生态圈里来。”

上述《方案》同时提及,临港新片区也制定了一系列保障措施,包括加强人才保障、完善支持政策、推动开放合作等。据陆瑜介绍,如果AI企业到临港来,将优先提供临港的智能算力,同时通过发放算力券等形式,让企业优惠使用算力,“甚至对重点的AI企业,政府对它的算力成本直接可以给予不超过30%的补贴,这些政策我们都会出来。”

值得关注的是,在此次大会现场,中国电信临港公共智算服务平台暨国产GPU联合创新基地也正式发布。中国电信成立临港算力(上海)科技有限公司,将开展临港算力园区建设,并将分批次投放4万个适用于智算、超算的高功率机架。

上海市经济和信息化委员会副主任汤文侃当天表示,当前,以“网络为基础、数据为核心、算力为关键、安全为底线”的新一代信息基础设施已成为建设现代化产业的重要基础支撑。上海已提出构建“2+(3+6)+(4+5)”的现代化产业架构,这对以算力为代表的新型信息基础设施建设提出了更高需求。

而就在5月16日,上海市经济和信息化委员会公布了通过 《上海市数据中心建设导则》符合性评估的数据中心项目名单,共支持了16个项目,其中位于临港的项目有2个。“截至目前,我委共支持新片区包括,商汤AIDC、有孚网络、信息飞鱼等8个项目,合计2.8万个6kW标准机柜,占全市已批机柜数量近1/5。”

汤文侃同时提出建议之一,即利用临港充沛算力资源构建公共算力服务。“目前,临港的商汤AIDC已经接入了公共算力服务平台。在此也希望今天参会的各单位,特别是电信运营商,结合临港的网络特点,积极在临港建设极速算力承载网,助力实现网络无所不达、算力无所不在、智能无所不及,推动算力成为与水电一样的公共服务。”

成立智算产业联盟,商汤当产业链链主

基于现有优势及未来需求,临港希望构建的是一个上中下游一体化的算力产业联盟,进行协同式、体系化发展。

陆瑜将临港的算力供给视作整条产业链的“中间一段”,一端为落地到临港的AI企业提供算力保障,另一端则涉及到对算力来说极为关键的“芯片、软件、系统”,“我们希望有了需求端,也有了这样一个平台端,那么我们把计算的芯片企业、软件企业、系统企业集聚在这里,让他们深度地参与到这样一个系统的建设过程当中。”

杨帆也强调,“今天看到的大模型所有的成绩的发展,它既是暴力出奇迹,通过人工智能三要素的持续规模上升带来的技术价值的提升,同时也是基础的研发能力和系统的工程化能力之间的深度结合,算法优化、数据的整理和选取、平台性算力的优化提供,这三者往往是互相连通的,很难把它变成割裂的环节独自去做。”

他表示,智能算力产业链的重要价值在于,“只有链上有更多的企业,大家去促进彼此的交流思考,更深度地去进行一些合作,才能够在这样新的关键性的重大技术浪潮中,去做到更好的技术进步和支持。”

大会现场,新片区智算产业联盟也正式成立,联通作为联盟首任轮值理事长单位。据悉,未来联通将在新片区成立长三角创新研究院,进一步助力新片区智算产业发展。

新片区智算产业联盟成员代表由智算算力、基础算力和超算算力中心等算力提供企业,GPU、FPGA、ASIC等算力芯片企业,以及大模型、AI for science等算力需求企业,共计25家企业,以及中国信通院华东分院、西安电子科技大学、电子科技大学共计3所高校与科研院所共同组成,后续将开展资源共享、技术交流和项目合作。商汤科技则被授予“新片区智算产业链链主”。

GPU芯片厂商沐曦当天即表示,分别满足AI推理计算、AI训练/通用计算、高性能渲染功能的三类GPU产品,应用于AI推理、AI训练、数据中心、元宇宙、云游戏等领域,将赋能各领域转型发展。

汤文侃也对临港新片区此次智算产业联盟的成立寄予厚望,“依托商汤科技这样的链主企业,结合自身优势,探索产业链上下游全要素协同,形成数字经济新的爆发点。”

在当天的大会现场,有12家企业共同签署了新片区智算产业上下游企业协同采购协议。陆瑜提到,新片区也将出台协同采购正面清单,“如果企业在建设国产化算力平台的过程当中,购买国产GPU等上游产品,我们就会给予补贴,这样也是鼓励上下游企业去更好地合作。”

    责任编辑:孙扶
    校对:刘威