国家数据局局长刘烈宏在中国发展高层论坛2026年年会上提出,Token(中文官方译名为"词元")已成为智能经济时代的核心价值载体。这一技术术语不仅承担着连接算法创新与商业落地的关键角色,更通过量化计算能力为人工智能产业发展提供了可衡量的价值尺度。数据显示,我国人工智能领域正经历着前所未有的爆发式增长。
据最新披露,截至2025年末全国已建成超10万个高质量数据集,形成支撑人工智能发展的坚实底座。更引人注目的是,今年3月我国日均词元调用量突破140万亿次,较2024年初的千亿级规模实现千倍跃升,较去年底又增长40%。国际数据平台监测显示,中国AI大模型周调用量已连续三周超越美国,标志着技术竞争力进入全球领先行列。
在人工智能运行机制中,词元作为信息处理的最小单元具有核心地位。无论是用户输入的自然语言指令,还是模型输出的结构化代码,都需要被拆解为词元进行运算处理。以近期引发热议的智能应用"龙虾"为例,其复杂任务执行需要调用海量词元,消耗量是普通模型的数十倍乃至百倍,直观反映出技术应用的深度与广度。
词元调用量的指数级增长,折射出中国人工智能产业的三大突破:应用场景从基础对话向决策执行等复杂领域延伸,产业竞争力实现质的飞跃;数据要素供给体系持续完善,高质量数据集规模效应显现;技术创新与商业落地形成良性循环,数据价值得到充分释放。这种发展态势在智能客服、工业质检、医疗诊断等多个领域均有所体现。
国家数据局透露,下一步将围绕场景需求推动数据要素市场建设,通过先行先试机制打造技术可靠、使用便捷、质量过硬的数据集产品。此举旨在实现数据供给在数量与质量上的双重提升,为人工智能创新发展提供更强劲的动力支撑。随着数据要素市场的不断完善,智能经济将进入更高质量的发展阶段。



