通用人工智能已经成为人类最具想象力与创新力的未来景象,而大模型无疑是这幅未来图景当中最耀眼的一颗明星。眼下,中国已成为全球拥有大模型数量最多的国家,在全国超二百个大模型中,商汤已凭借独特技术优势和硬科技门槛打造出一条“大装置+大模型”的业务闭环。
3月26日盘后,商汤在港交所发布2023年业绩。截至2023年12月31日,商汤总收入人民币34亿元,核心业务生成式AI收入增长200%达12亿元,占集团总收入比例升至35%;毛利润15亿人民币,毛利润率44.1%。
商汤集团董事会执行主席兼首席执行官徐立博士表示:“2023年,商汤生成式AI业务实现了同比200%的飞速增长,占总收入比例超过35%。生成式AI对商汤来说已不仅仅是技术领域的变革性创新,更成为公司的核心业务。商汤生成式AI业务的增长,得益于各行各业对大模型的训练和推理的广泛需求,这预示着中国硬科技投资的新周期正式开启。商汤通过在各业务层面深入融合生成式AI能力,正在赢得新客户,并推动效率和生产力的全面提升。”
生成式AI收入暴增,“大装置+大模型”带来业绩共振
2023财报中最为引人注目的一点,是商汤生成式AI收入突破11.837亿元人民币,实现200%的飞速增长,率先完成“大模型业务闭环”,成为生成式AI收入最早突破11亿的公司之一。2023年,商汤“日日新”大模型性能快速提升,实现了万卡万参的大模型训练能力,在基模型、多模态、编程和工具调用、百万字无损上下文、终端小模型方面都达到国内领先水平。
人工智能行业毫无疑问是“新质生产力”,但也有技术壁垒高、商业化难度大的特点。而生成式AI长期支柱价值在大模型上得以体现,被称为未来“变现之王”的大模型,也因此炙手可热。不过,业内人士预测,全国200多个大模型很快就会进入收敛期,最终市场需要的大模型或许不过一两家。
为何商汤能在上百家大模型厂商中率先“杀出重围”?最大的原因无疑还是多年的技术沉淀、自有算力、AI1.0和AI2.0的商业化洗礼、和有“人工智能黄埔军校”之称的人才储备。在全国超二百个大模型企业中,能够集齐以上优势的屈指可数,而只有全面的优势才能在竞争激烈且商业化难度极高的生成式AI领域最终转化为高速增长的收入。
作为亚洲领先的AI企业,商汤在硬件基础设施兼容性、产业链合作情况、模型训练优化模块、智能标注技术能力、预训练模型技术水平等多方面具有先发优势。以上全方面优势加持之下,商汤科技2023年财报显示,商汤已经在商业化方面开始了多元化,生成式AI收入显著增长,取代智慧城市成为商汤的核心业务。该业务预计在2024年将继续保持高速增长。
前瞻性战略布局为商汤大模型赢得“时间窗口”
弗若斯特沙利文发布的《2023年中国AI开发平台市场报告》显示,商汤在增长指数和创新指数两大评估维度的综合评分中位居国内首位。
这一成绩不仅展示了商汤在生成式AI领域的领先地位,更是对其创新能力和市场扩张速度的国际认可。但只有长期关注人工智能领域的人,才明白如此认可有多来之不易。
早在2018年前后,商汤已开始每年数十亿投入到SenseCore大装置,并建设了上海临港超算中心。这在当时并没有为商汤赢得普遍认同,相反,如此巨额的投入还给商汤带来了大额亏损。可以说,如此亏损是商汤的主动选择,随着大模型的爆发式发展,商汤所持有的大算力也成为行业稀缺资源。
凭借基础设施方面的先发优势,商汤最早在业界研发和发布了大模型产品,也是国内首个发布超过千亿参数级大模型和性能超越GPT3.5模型的厂商。目前,商汤更是成功研发了320亿参数量的全球最大的通用视觉模型,实现了高性能的目标检测、图像分割和多物体识别算法,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。而算力的持续增长,更成为生成式AI业务长期发展的保障。
“日日新”大模型体系何以“日日更新”?
要回答“日日新”大模型体系为何能出奇制胜,就先要了解“大装置+大模型”的前瞻性布局。
在人工智能大装置SenseCore持续扩大的算力和数据规模支持下,商汤科技得以构建起“日日新”大模型体系。早在2021年至2022年间,商汤训练了百亿参数规模的超大视觉模型,相当于千亿参数语言模型的训练量。2023年4月,商汤推出“日日新1.0”版本,不仅标志着商汤推出国内首个千亿级参数的大语言模型,同时还包括文生图、3D内容生成等多种生成式AI模型,成为当时国内最全面的大模型系列之一。今年2月,“日日新”已经迭代至4.0版本,商汤还开源了InternLM2-7B与20B两种不同参数规格的基模型,开源模型在性能方面超越了Meta的Llama2和谷歌的Gemma等同级别的开源模型。
可以说商汤大模型“日日新”在技术力、落地成绩和同行业评测对比方面都具有领先地位。
据弗若斯特沙利文报告,商汤“日日新”综合能力排名位于中国大模型第一梯队,在推理速度、精度达到开源模型最佳水平,还是支持多芯片的平台。值得注意的是,商汤推出“模型即服务”的商业模式也受到广泛关注。经由此模式,客户能在无需管理底层基础设施下,轻松在大装置微调和调用各类生成式AI。“日日新”大模型的代码生成及工具调用能力也在赋能数字化办公的领域中表现卓越,特别是在赋能金山办公的Copilot应用中展现了显著的技术优势。在SuperClue举办的代码评测中,“日日新”大模型荣登榜首,在HumanEval测试集的一次性通过率高达76%,这个成绩甚至超越了GPT-4。
经过华为的综合评测,SenseCore商汤大装置AI云与商汤“日日新”大语言模型通过与华为Atlas系列服务器的相互兼容性测试,获得HUAWEI COMPATIBLE证书及认证徽标的使用权,为商汤服务客户及生成式AI的发展奠定了基础。
自有算力+“大装置&大模型”战略+应用前景=生成式AI领跑者
如前所述,“大装置+大模型”的前瞻性战略实施,为商汤赢得了AI2.0时代发展的“时间窗口”和先机。此外,必须提到的是,从AI1.0时代开始,商汤就积累了大量优质客户。从智慧城市和智慧商业领域积累的客户资源和场景运用,为商汤生成式AI技术的快速应用和推广奠定了坚实的基础,这些客户如今正极其迅速地转换为生成式AI客户。由此带来的虹吸效应,更成功吸引了大量优质客户选择商汤大模型服务。2023年财报显示,在生成式AI业务中超过70%的客户在过去12个月内是商汤的新客户。
智能终端业务方面,商汤赋能的手机数量已经超过了20亿台,为商汤端侧生成式AI业务的发展提供了广阔的空间。
展望未来,商汤会继续聚焦生成式AI业务,保持业务的持续高速增长和行业领先地位。一方面,通过进一步发挥“大装置+大模型”深度协同优势,持续扩充算力规模、提升基础设施和大模型的综合服务能力,为行业伙伴提供优质的算力和模型服务;另一方面,通过“云+端”结合等创新优化策略,让模型推理成本迅速降低,从而打开更广阔的应用前景。继续滑动看下一个轻触阅读原文
财联社向上滑动看下一个
原标题:《拆解商汤生成式AI爆长200%之谜:自有算力+“大装置&大模型”战略+应用前景=生成式AI领跑者》