红星资本局6月18日消息,备受关注的Token价格在6月又迎来了调整。有消息称包括OpenAI在内的多家大厂先后被曝将下调Token价格。 这场反转来得猝不及防。就在几个月前,高端GPU供不应求,亚马逊、微软及国内主流云厂商纷纷上调API定价,Token进入词元通胀;5月底开始,全球商用大模型有史以来降幅最大的一轮价格调整,多款模型单价下跌75%–99%。 从“奢侈品”走向“白菜价”,Token价格接下来还将下探。摩根大通预测,未来12个月内,Token单位价格还会再降40%以上,普通模型接近“商品化”。
▲创意配图 据图虫创意
Token要“廉价”
才能释放技术潜力
据上海证券报,头部AI公司OpenAI被曝将于6月启动新一轮调价,计划大幅下调Token计费标准。其对标竞品Anthropic或将跟进降价。
国内则先一步开启了降价潮。5月底,Deepseek、小米先后宣布“API永久降价”,其中前者的旗舰模型V4-Pro的API价格永久降价75%,输入(缓存命中)价格低至每百万Token0.025元,接近“零毛利”,创下全球新低;后者的MiMo-V2.5系列API永久降价,最高降幅达99%。
6月降价节奏进一步加快。腾讯云、火山引擎、MiniMax、智谱等云厂商批量下调Token计费。就在6月16日,字节跳动火山引擎上线Seedance 2.0 Mini视频生成模型,生成成本较标准版降低约50%。
为什么短短几个月时间Token价格变化如此明显?
以DeepSeek为例,其逆势降价更多源于技术突破,其自研稀疏注意力机制与混合专家模型使V4系列处理百万级Token长上下文时,算力消耗仅为上代产品的27%,KV Cache占用降至10%。同时,深度适配昇腾等国产算力,摆脱了对海外高端算力的依赖。
而OpenAI和Anthropic的此番调价则更多指向了市场竞争。面临客户流失压力,被迫计划降价防御。
有AI行业从业者对红星资本局分析,AI行业正在发生Token分化,Token并不是无限降价的。现在按Token收费的方式未来很可能进化到按任务价值收费。低价值场景的Token不值钱,但高价值场景的Token就应该是贵的,这才是健康的生态。
中国工程院院士王坚近日也公开表示,要让Token(词元)变得像一张纸、一支笔一样廉价,才能真正释放技术的潜力。
中小开发者和创业团队
是降价的最大赢家
降价之后,中小开发者和创业团队将是最大赢家。在预算不变的前提下,可调用的Token数量跃升数倍至近百倍。
有短剧编剧测算,百万Token约可处理六七十万汉字,输出一部长篇小说体量的文本,成本仅约6元。
以中小商家AI在线客服为例,按行业平均水平,大概月输入Token总量810万,月输出Token总量270万。红星资本局测算,用ChatGPT若按之前计费,一个月在Token花费上就要近3000元左右,降价之后,Token费用可以降至400多元。如若用国内大模型则价格更低。
短期来看,降价尚未结束。摩根大通预测,未来12个月内,Token单位价格还会再降40%以上,普通模型接近“商品化”。
短期是开发者的福音,长期则是行业的洗牌。长期而言,行业正呈现清晰的K型分化。
汇丰研究近期报告指出,当前降价高度集中于通用大模型的“走量层”,而非全行业普降——中国AI行业正在经历K型分化:通用模型价格持续走低,而具备复杂推理能力的高端模型可能维持溢价。
中国企业资本联盟副理事长柏文喜对红星资本局表示,底层模型靠规模效应摊薄成本。他认为,模型能力会趋于“水电煤”化,DeepSeek等通过低成本和开放生态推动基础推理价格持续下降;同时,Agent、工具链和行业解决方案成为主要价值创造点,按效果或按量计费。
“高端抗跌、低端内卷”。这在一些大模型厂商上也得到印证。智谱AI的CEO张鹏在今年3月业绩说明会上披露一组数据:2026年一季度智谱API涨价83%后,调用量不降反升,市场依然供不应求,调用量增长400%。“这印证了高质量 Token是当下的稀缺资源,谁掌握了智能上界,谁就掌握了相应的定价权。”
红星新闻记者 王田
编辑 郭庄