Token涨价潮开启，是时候警惕“词元垄断” 了

智能经济上海邮电经济研究会

2026-04-23 06:31

上海

作者／金典

1、2026年大模型涨价潮全面袭来：腾讯云API输入价格单轮暴涨463%，智谱AI年内三度提价，阿里云停售低价套餐——AI的“低价时代” 正式终结。

2、词元（Token）是大模型的计价单元，也是AI时代最重要的生产资料。从芯片到模型到API，少数巨头通过三层结构掌控定价权，形成“复杂的中心化” 垄断。

3、旗舰模型与廉价小模型之间价差已达33倍，能负担前沿算力的机构将拥有更强的智识优势，“词元鸿沟” 正成为AI时代新的社会不平等断层线。

4、破解路径三管齐下：监管层强制互操作性和数据可携带权；市场层扶持开源生态；政策层建立“词元普惠券” 制度，让公共算力服务真正普惠落地。

价格战打了两年，Token（词元）的账单却越来越贵。

2025年，国内大模型市场掀起一轮激烈的降价潮，阿里云、字节跳动、月之暗面相继宣布降价，部分轻量模型的API价格一度跌入每百万词元不足一元的区间，推理算力的毛利率随之跌至负数。彼时，外界普遍预判：词元将像流量一样廉价，AI能力终将成为普惠基础设施。

然而，这个判断来得太早了。

4月18日（今天），阿里云AI算力、存储等产品全线涨价，最高涨幅34％，此前的4月13日，阿里云旗下大模型平台百炼的Coding Plan Lite基础套餐便已经停止续费和升级。也就是说，不再提供最低版套餐服务。

阿里并不是第一个宣布Token涨价的大模型厂商。

4月8日，智谱发布旗舰开源模型GLM-5.1，OpenRouter显示，伴随此次发布，GLM系列API价格再度上调10%，4月12日，智谱Coding Plan（海外版）涨价，月付价格几乎翻倍。这已经是智谱今年第三次提价。

4月9日，腾讯云正式发布价格调整公告，宣布将于5月9日起对AI算力、容器服务TKE-原生节点及弹性MapReduce（EMR）相关产品刊例价统一上调5%。

需求的结构性变化是这轮涨价的直接导火索。国内日均词元调用量从2024年初的约1000亿，飙升至2026年3月的140万亿，两年间增长超过1400倍。

推动这一爆发的核心力量，是AI智能体（Agent）的大规模普及——Agent场景的词元消耗量是普通对话的10至100倍，算力需求的量级完全不在同一维度。OpenRouter平台的最新周度数据显示，仅平台前十大模型在一周内的词元总调用量已达8.7万亿，算力资源的紧张程度前所未有。

与此同时，旗舰模型的价格从未真正“便宜” 过。在国际市场，Claude Opus 4.5的输出价格高达每百万词元25美元，GPT-5的输出价格为每百万词元10美元。2026年2月全球主流API市场的价格调研显示，最低端模型与最高端旗舰之间的单价差距已扩大至33倍。

词元鸿沟，正在成为继数字鸿沟之后，信息社会最新的不平等断层线。当少数机构掌控了前沿模型的训练能力与推理服务，词元的定价权便不再属于市场，而属于垄断者。对其可能产生的垄断进行监管，迫在眉睫。

词元正在形成新时代垄断

在最上游，GPU、TPU等AI专用芯片是词元生产的物质基础。英伟达在AI训练芯片领域拥有超过80%的市场份额，其CUDA生态系统更是形成了深度的技术锁定。谷歌的TPU是少数能够与英伟达竞争的替代方案，但也对中国企业设限。半导体制造则高度集中于台积电，其先进制程的全球排他性进一步强化了这种集中化格局。

在中游，具备训练前沿大模型能力的机构极为有限：OpenAI、谷歌、Anthropic、Meta、百度、阿里、腾讯、华为等……大量中小企业和政府机构无力独立训练大模型，只能依赖上述机构提供的API或开源模型。

在下游，大多数词元的消耗发生在推理阶段，而推理服务的提供者——主要是大型云服务商（AWS、Azure、Google Cloud、阿里云、腾讯云）和模型提供商的API——构成了词元流通的关键节点。这些节点不仅控制了词元的价格，还控制了词元使用的条款、内容审查的规则以及数据的归属。

这一所有权结构揭示了大模型时代生产关系的若干重要特征。词元生产能力高度集中于少数科技巨头，形成了具有垄断倾向的市场结构，这与工业时代铁路、电报等基础设施的初期垄断历史高度相似。个人用户依附于应用层服务商，应用层服务商依附于API提供商，API提供商依附于云服务商，云服务商依附于芯片制造商，芯片制造商依附于半导体制造商。这一层层依附的结构，使词元生产的权力呈现为一种“复杂的中心化” ——看似竞争繁荣，实则控制权高度集中于少数节点。

词元垄断的形成，根植于大模型产业的若干核心技术经济规律。

训练规模效应是垄断形成的第一个根源。模型能力与训练规模高度正相关，大规模训练的资本门槛极高，形成了天然的市场进入壁垒，使得具备竞争力的模型训练能力集中于极少数机构。

推理网络效应让领先者的优势持续自我强化——用户越多、数据越多、模型越强，赢家通吃的正循环由此形成。

生态锁定是第三个机制。大模型提供商通过构建插件生态、开发者工具和企业应用集成，创造了强烈的用户迁移成本，形成了对词元消费者的“生态锁定” 。

API定价：市场化流通的内在缺陷

词元的流通，目前主要通过市场化的API定价和自建私有算力两种机制实现。以市场化定价为主导的词元流通，依赖于大型模型提供商的API服务。这种定价机制的经济逻辑与自来水的按量收费高度一致，使词元成为可以精确计量、按需购买的“服务商品” 。

定价的不透明性：API价格由服务提供商单方面制定，用户对定价成本构成缺乏了解，议价能力极弱；价格可能随提供商战略需要而突然调整，对依赖该API的应用开发者造成不确定性。

垄断溢价的可能性：当市场上具有竞争力的大模型API供应商极为有限时，提供商具有强烈的动机索取垄断租金。词元价格可能远高于其算力成本，形成超额利润。

数据主权的隐患：通过API调用大模型时，用户的输入数据会传输至服务商的服务器，存在数据隐私与安全风险，对政府机构和处理敏感数据的行业（医疗、金融、法律）尤为关键。

针对上述缺陷，越来越多的机构选择自建私有算力，部署开源大模型。私有算力模式的优势在于数据不出境、成本结构可控、无API定价风险；劣势则是初始投资巨大、运维复杂，且开源模型的能力通常仍弱于商业前沿模型。私有算力与API服务之间的边界，将是未来若干年词元市场格局演化的核心博弈线之一。

词元垄断的经济危害不仅体现在消费者剩余的损失，更体现在其对社会创新生态的系统性抑制：当API价格过高，大量有潜力的创业公司和独立开发者将被排除在词元经济之外，社会的技术创新活力受到压制；当单一或少数提供商控制了词元流通，其内容审查、价值观对齐和访问控制策略将对信息流通产生深远影响，形成私权力对公共话语空间的隐性控制。

AI算力应像水电一样被监管

词元的流通基础设施——即API网络、算力互联协议与推理服务平台——正在获得与水、电、气等传统公用事业高度类似的公共属性，理应被纳入公共基础设施的治理框架。

普遍服务义务：当词元消费成为社会成员参与经济活动、获取教育机会、享受公共服务的必要条件时，保障每个社会成员获得基本词元服务的能力，将成为政府的公共责任。

自然垄断倾向：大规模算力基础设施存在显著的规模经济效应——规模越大，单位词元生产成本越低，规模壁垒越高。这种自然垄断倾向与电网、铁路等传统基础设施高度相似，同样需要通过公共监管（或公有化）来防止垄断定价和歧视性服务。

在词元经济中，开源大模型的出现，具有类似“公地” 的政治经济学意义：它代表了一种将词元生产能力从私有垄断中解放出来、使其成为社会共有资源的尝试。

Meta于2023年发布Llama系列模型并开源模型权重，开创了大型基础模型开源的先例。随后，Mistral、阿里巴巴（Qwen系列）、智谱AI（GLM系列）等陆续发布开源或半开源的竞争力模型。开源模型的发布，使得中小机构无需依赖商业API即可部署相当质量的词元生产能力，极大地降低了词元服务的准入门槛。开源大模型是一种对词元生产资料的“去私有化” 尝试——通过将模型权重公开，将私有生产资料转变为社会共有资源。这一趋势与开源软件运动的历史逻辑高度一致：通过共同体协作，将关键数字基础设施从私有垄断中解放。

然而，开源并非万能——算力门槛、能力差距和训练数据不开放，使开源模型尚无法真正替代商业旗舰。

打破垄断：制度的刀该往哪里砍？

面对词元经济中的垄断风险、数据安全挑战和社会公平隐患，有效的制度设计是构建良性词元治理体系的关键。

在竞争监管层面，对大型词元服务提供商实施类似电信、银行等行业的特许经营制度和竞争监管，具体措施包括：互操作性要求——强制要求大型API服务提供商支持标准化的接口协议，允许用户无缝迁移至其他服务商，降低“生态锁定” 效应；数据可携带权——赋予用户将其在某一大模型平台产生的对话历史、个性化数据携带至其他平台的权利；市场进入保障——对中小企业和创业公司提供词元使用补贴或优先准入政策，维护市场竞争活力。

在数据安全监管层面，针对政府机构和关键行业在词元消费中的数据安全风险，建立分级分类的词元使用安全规范：高度敏感数据（如个人健康信息、国家机密）禁止通过境外API处理；一般政务数据要求在国内数据中心处理；公开性数据则无特殊限制。

在算法透明度与问责层面，对于直接影响公民权利和公共资源分配的AI系统，要求提供商公开模型的决策依据，建立“词元决策可解释性” 标准；建立AI决策申诉机制，确保公民能够对AI辅助决策结果提出质疑。

政府应兜底“公共词元”

所谓公共化，并非简单地将所有词元基础设施收归国有，而是通过多元主体的协同，确保词元基础设施的公共服务属性得到充分体现。

建立国家级或城市级的公有算力平台，为公共服务领域提供低价或免费的词元服务。公有算力平台可以采用政府投资、委托运营的模式，也可以借鉴中央银行的独立性设计，建立独立于政府行政的“算力央行” ，通过发行“公共词元” 支撑社会公益应用。

政府通过资助开源大模型的研发与维护（类似于开源软件基金会的资助模式），培育词元公地的生长土壤。具体可以包括：建立国家级开源大模型研究中心、向开源模型项目提供算力资源补贴、将开源模型纳入政府采购优先目录。

参照教育券、医疗券等社会政策工具，建立面向低收入群体、残障人士、农村地区居民的“词元普惠券” 制度——政府为上述群体提供定额的词元消费补贴，用于在任何符合条件的词元服务平台使用，兼顾普惠性与市场竞争的保留。

结语

词元垄断不是一个简单的商业竞争问题，而是大模型时代生产资料所有制结构的集中体现。当单一或少数机构控制了词元的生产链条，就掌握了决定谁能参与智识生产、谁能享受AI红利的权力。美国通过对华半导体出口管制，本质上是在限制中国的词元生产能力，这充分说明对词元生产资料的控制已经上升为国家战略层面的博弈。

词元基础设施的公共属性不仅是监管约束，更是商业机遇的来源——公共词元服务市场、词元基础设施建设与运营、词元普惠化解决方案，均代表着巨大的产业发展空间。

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。