Token涨价潮开启,是时候警惕“词元垄断” 了

2026-04-23 06:31
江苏

作者/金典

1、2026年大模型涨价潮全面袭来:腾讯云API输入价格单轮暴涨463%,智谱AI年内三度提价,阿里云停售低价套餐——AI的“低价时代”  正式终结。

2、词元(Token)是大模型的计价单元,也是AI时代最重要的生产资料。从芯片到模型到API,少数巨头通过三层结构掌控定价权,形成“复杂的中心化”  垄断。

3、旗舰模型与廉价小模型之间价差已达33倍,能负担前沿算力的机构将拥有更强的智识优势,“词元鸿沟”  正成为AI时代新的社会不平等断层线。

4、 破解路径三管齐下:监管层强制互操作性和数据可携带权;市场层扶持开源生态;政策层建立“词元普惠券”  制度,让公共算力服务真正普惠落地。

价格战打了两年,Token(词元)的账单却越来越贵。

2025年,国内大模型市场掀起一轮激烈的降价潮,阿里云、字节跳动、月之暗面相继宣布降价,部分轻量模型的API价格一度跌入每百万词元不足一元的区间,推理算力的毛利率随之跌至负数。彼时,外界普遍预判:词元将像流量一样廉价,AI能力终将成为普惠基础设施。

然而,这个判断来得太早了。

4月18日(今天),阿里云AI算力、存储等产品全线涨价,最高涨幅34%,此前的4月13日,阿里云旗下大模型平台百炼的Coding Plan Lite基础套餐便已经停止续费和升级。也就是说,不再提供最低版套餐服务。

阿里并不是第一个宣布Token涨价的大模型厂商。

4月8日,智谱发布旗舰开源模型GLM-5.1,OpenRouter显示,伴随此次发布,GLM系列API价格再度上调10%,4月12日,智谱Coding Plan(海外版)涨价,月付价格几乎翻倍。这已经是智谱今年第三次提价。

4月9日,腾讯云正式发布价格调整公告,宣布将于5月9日起对AI算力、容器服务TKE-原生节点及弹性MapReduce(EMR)相关产品刊例价统一上调5%。

需求的结构性变化是这轮涨价的直接导火索。国内日均词元调用量从2024年初的约1000亿,飙升至2026年3月的140万亿,两年间增长超过1400倍。

推动这一爆发的核心力量,是AI智能体(Agent)的大规模普及——Agent场景的词元消耗量是普通对话的10至100倍,算力需求的量级完全不在同一维度。OpenRouter平台的最新周度数据显示,仅平台前十大模型在一周内的词元总调用量已达8.7万亿,算力资源的紧张程度前所未有。

与此同时,旗舰模型的价格从未真正“便宜”  过。在国际市场,Claude Opus 4.5的输出价格高达每百万词元25美元,GPT-5的输出价格为每百万词元10美元。2026年2月全球主流API市场的价格调研显示,最低端模型与最高端旗舰之间的单价差距已扩大至33倍。

词元鸿沟,正在成为继数字鸿沟之后,信息社会最新的不平等断层线。当少数机构掌控了前沿模型的训练能力与推理服务,词元的定价权便不再属于市场,而属于垄断者。对其可能产生的垄断进行监管,迫在眉睫。

词元正在形成新时代垄断

在最上游,GPU、TPU等AI专用芯片是词元生产的物质基础。英伟达在AI训练芯片领域拥有超过80%的市场份额,其CUDA生态系统更是形成了深度的技术锁定。谷歌的TPU是少数能够与英伟达竞争的替代方案,但也对中国企业设限。半导体制造则高度集中于台积电,其先进制程的全球排他性进一步强化了这种集中化格局。

在中游,具备训练前沿大模型能力的机构极为有限:OpenAI、谷歌、Anthropic、Meta、百度、阿里、腾讯、华为等……大量中小企业和政府机构无力独立训练大模型,只能依赖上述机构提供的API或开源模型。

在下游,大多数词元的消耗发生在推理阶段,而推理服务的提供者——主要是大型云服务商(AWS、Azure、Google Cloud、阿里云、腾讯云)和模型提供商的API——构成了词元流通的关键节点。这些节点不仅控制了词元的价格,还控制了词元使用的条款、内容审查的规则以及数据的归属。

这一所有权结构揭示了大模型时代生产关系的若干重要特征。词元生产能力高度集中于少数科技巨头,形成了具有垄断倾向的市场结构,这与工业时代铁路、电报等基础设施的初期垄断历史高度相似。个人用户依附于应用层服务商,应用层服务商依附于API提供商,API提供商依附于云服务商,云服务商依附于芯片制造商,芯片制造商依附于半导体制造商。这一层层依附的结构,使词元生产的权力呈现为一种“复杂的中心化”  ——看似竞争繁荣,实则控制权高度集中于少数节点。

词元垄断的形成,根植于大模型产业的若干核心技术经济规律。

训练规模效应是垄断形成的第一个根源。模型能力与训练规模高度正相关,大规模训练的资本门槛极高,形成了天然的市场进入壁垒,使得具备竞争力的模型训练能力集中于极少数机构。

推理网络效应让领先者的优势持续自我强化——用户越多、数据越多、模型越强,赢家通吃的正循环由此形成。

生态锁定是第三个机制。大模型提供商通过构建插件生态、开发者工具和企业应用集成,创造了强烈的用户迁移成本,形成了对词元消费者的“生态锁定”  。

API定价:市场化流通的内在缺陷

词元的流通,目前主要通过市场化的API定价和自建私有算力两种机制实现。以市场化定价为主导的词元流通,依赖于大型模型提供商的API服务。这种定价机制的经济逻辑与自来水的按量收费高度一致,使词元成为可以精确计量、按需购买的“服务商品”  。

定价的不透明性:API价格由服务提供商单方面制定,用户对定价成本构成缺乏了解,议价能力极弱;价格可能随提供商战略需要而突然调整,对依赖该API的应用开发者造成不确定性。

垄断溢价的可能性:当市场上具有竞争力的大模型API供应商极为有限时,提供商具有强烈的动机索取垄断租金。词元价格可能远高于其算力成本,形成超额利润。

数据主权的隐患:通过API调用大模型时,用户的输入数据会传输至服务商的服务器,存在数据隐私与安全风险,对政府机构和处理敏感数据的行业(医疗、金融、法律)尤为关键。

针对上述缺陷,越来越多的机构选择自建私有算力,部署开源大模型。私有算力模式的优势在于数据不出境、成本结构可控、无API定价风险;劣势则是初始投资巨大、运维复杂,且开源模型的能力通常仍弱于商业前沿模型。私有算力与API服务之间的边界,将是未来若干年词元市场格局演化的核心博弈线之一。

词元垄断的经济危害不仅体现在消费者剩余的损失,更体现在其对社会创新生态的系统性抑制:当API价格过高,大量有潜力的创业公司和独立开发者将被排除在词元经济之外,社会的技术创新活力受到压制;当单一或少数提供商控制了词元流通,其内容审查、价值观对齐和访问控制策略将对信息流通产生深远影响,形成私权力对公共话语空间的隐性控制。

AI算力应像水电一样被监管

词元的流通基础设施——即API网络、算力互联协议与推理服务平台——正在获得与水、电、气等传统公用事业高度类似的公共属性,理应被纳入公共基础设施的治理框架。

普遍服务义务:当词元消费成为社会成员参与经济活动、获取教育机会、享受公共服务的必要条件时,保障每个社会成员获得基本词元服务的能力,将成为政府的公共责任。

自然垄断倾向:大规模算力基础设施存在显著的规模经济效应——规模越大,单位词元生产成本越低,规模壁垒越高。这种自然垄断倾向与电网、铁路等传统基础设施高度相似,同样需要通过公共监管(或公有化)来防止垄断定价和歧视性服务。

在词元经济中,开源大模型的出现,具有类似“公地”  的政治经济学意义:它代表了一种将词元生产能力从私有垄断中解放出来、使其成为社会共有资源的尝试。

Meta于2023年发布Llama系列模型并开源模型权重,开创了大型基础模型开源的先例。随后,Mistral、阿里巴巴(Qwen系列)、智谱AI(GLM系列)等陆续发布开源或半开源的竞争力模型。开源模型的发布,使得中小机构无需依赖商业API即可部署相当质量的词元生产能力,极大地降低了词元服务的准入门槛。开源大模型是一种对词元生产资料的“去私有化”  尝试——通过将模型权重公开,将私有生产资料转变为社会共有资源。这一趋势与开源软件运动的历史逻辑高度一致:通过共同体协作,将关键数字基础设施从私有垄断中解放。

然而,开源并非万能——算力门槛、能力差距和训练数据不开放,使开源模型尚无法真正替代商业旗舰。

打破垄断:制度的刀该往哪里砍?

面对词元经济中的垄断风险、数据安全挑战和社会公平隐患,有效的制度设计是构建良性词元治理体系的关键。

在竞争监管层面,对大型词元服务提供商实施类似电信、银行等行业的特许经营制度和竞争监管,具体措施包括:互操作性要求——强制要求大型API服务提供商支持标准化的接口协议,允许用户无缝迁移至其他服务商,降低“生态锁定”  效应;数据可携带权——赋予用户将其在某一大模型平台产生的对话历史、个性化数据携带至其他平台的权利;市场进入保障——对中小企业和创业公司提供词元使用补贴或优先准入政策,维护市场竞争活力。

在数据安全监管层面,针对政府机构和关键行业在词元消费中的数据安全风险,建立分级分类的词元使用安全规范:高度敏感数据(如个人健康信息、国家机密)禁止通过境外API处理;一般政务数据要求在国内数据中心处理;公开性数据则无特殊限制。

在算法透明度与问责层面,对于直接影响公民权利和公共资源分配的AI系统,要求提供商公开模型的决策依据,建立“词元决策可解释性”  标准;建立AI决策申诉机制,确保公民能够对AI辅助决策结果提出质疑。

政府应兜底“公共词元”

所谓公共化,并非简单地将所有词元基础设施收归国有,而是通过多元主体的协同,确保词元基础设施的公共服务属性得到充分体现。

建立国家级或城市级的公有算力平台,为公共服务领域提供低价或免费的词元服务。公有算力平台可以采用政府投资、委托运营的模式,也可以借鉴中央银行的独立性设计,建立独立于政府行政的“算力央行”  ,通过发行“公共词元”  支撑社会公益应用。

政府通过资助开源大模型的研发与维护(类似于开源软件基金会的资助模式),培育词元公地的生长土壤。具体可以包括:建立国家级开源大模型研究中心、向开源模型项目提供算力资源补贴、将开源模型纳入政府采购优先目录。

参照教育券、医疗券等社会政策工具,建立面向低收入群体、残障人士、农村地区居民的“词元普惠券”  制度——政府为上述群体提供定额的词元消费补贴,用于在任何符合条件的词元服务平台使用,兼顾普惠性与市场竞争的保留。

结语

词元垄断不是一个简单的商业竞争问题,而是大模型时代生产资料所有制结构的集中体现。当单一或少数机构控制了词元的生产链条,就掌握了决定谁能参与智识生产、谁能享受AI红利的权力。美国通过对华半导体出口管制,本质上是在限制中国的词元生产能力,这充分说明对词元生产资料的控制已经上升为国家战略层面的博弈。

词元基础设施的公共属性不仅是监管约束,更是商业机遇的来源——公共词元服务市场、词元基础设施建设与运营、词元普惠化解决方案,均代表着巨大的产业发展空间。

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。