人工智能产业链正经历一场前所未有的价值重构。曾经在利润分配中占据主导地位的芯片制造商,如今正面临下游模型厂商的强势崛起,而上游环节的利润空间仍远未达到天花板。这场变革的背后,是供需关系的结构性失衡与技术创新带来的成本重构双重驱动。
行业研究机构SemiAnalysis的数据显示,AI模型厂商的盈利能力正在突破性增长。以Anthropic为例,其年化收入在数月内从90亿美元跃升至440亿美元,推理业务的毛利率从38%飙升至70%以上。这种增长并非偶然,而是源于智能体AI(Agentic AI)的实用化突破。2025年12月成为关键转折点,随着这类技术真正走向商业应用,AI的经济逻辑被彻底改写。SemiAnalysis披露,其团队在AI模型上的年化支出已接近员工薪酬的30%,每位员工每月消耗的Token量高达50亿个,是meta内部人均用量的5倍以上。财务建模、数据可视化等原本需要初级分析师数小时完成的工作,现在仅需数美元的Token支出即可实现。
技术进步带来的成本下降是模型厂商利润扩张的核心驱动力。在硬件层面,经过软件优化的B300系统在标准推理任务上实现了14倍的吞吐量提升,而最新一代GB300 NVL72的算力较H100提升最高达32倍,成本仅增加70%。更关键的是定价结构的变化——智能体任务具有极高的输入输出比和缓存命中率,使得绝大多数Token落入最低计费档。SemiAnalysis测算,Opus 4.7在智能体任务上的实际成本仅为每百万Token0.99美元,远低于标价的5美元。即便Anthropic对高端产品进行大幅降价,其单位毛利反而因硬件升级和用户迁移效应得到提升。
定价权争夺成为产业链博弈的新焦点。SemiAnalysis指出,前沿闭源模型与开源模型的能力差距短期内难以弥合,这为模型厂商构筑了护城河。以Kimi K2.6为代表的开源模型,其定价对Anthropic的Opus系列几乎不构成威胁。更关键的是算力约束——任何一家前沿实验室都无法独自满足市场需求。Anthropic通过设置100美元以上的月订阅门槛和限制第三方接入,主动管理需求侧。这种供需失衡使得模型厂商能够按照Token创造的经济价值而非竞争成本来定价,其高端产品线仍保持定价主导权,Mythos系列的定价是常规Opus的5倍,而用户仍愿意为生产力提升支付溢价。
芯片制造商的定价策略却显得异常克制。英伟达作为GPU市场的领导者,至今未对其定价框架进行实质性调整。SemiAnalysis分析认为,这既源于监管层面的顾虑——其市场主导地位已引发反垄断关注,也出于战略考量——通过适度让利维持下游生态扩张,确保长期主导地位。但这种策略正在产生机会成本:在算力需求持续超过供给的背景下,掌握稀缺资源的厂商未充分定价,相当于将价值让渡给中下游企业。台积电在N3制程上的定价策略也被指为"战略失误",其产能利用率预计在2026年下半年超过100%,却未要求更大规模的预付款安排。
转机可能出现在新一代产品上。英伟达即将推出的Vera Rubin VR NVL72系统,其定价框架存在40%以上的上调空间。关键在于其采用的SOCAMM(小型化压缩附加内存模组)技术——这种由英伟达主导开发的新型内存标准,允许内存作为独立计费项目单独定价。SemiAnalysis测算,英伟达在SOCAMM上收取60%的毛利率具有合理性:内存供应全面紧张,其在采购上具有优先权;VR NVL72在性能和总拥有成本上远超竞品,客户缺乏替代选项;采购成本的大幅上涨也为价格传导提供了依据。更重要的是,内存定价不像GPU那样面临反垄断审查,这为差异化定价提供了空间——英伟达已在其网络设备上对特定客户收取两倍价格,这种策略完全可以延伸至内存领域。
这场价值重构正在重塑AI产业链的权力格局。当模型厂商通过技术进步和需求管理获得定价权,当芯片制造商在监管压力与战略考量间寻求平衡,一个由供需关系和技术创新共同驱动的新经济秩序正在形成。在这场变革中,谁能更精准地把握技术趋势与市场结构的变化,谁就能在未来的竞争中占据主动。
