发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

智能体深度应用词元消耗激增 降本增效路在何方?

2026-04-04来源:快讯编辑:瑞雪

随着人工智能技术在各领域的渗透,关于大模型使用中Token消耗与成本控制的讨论日益成为焦点。Token作为大模型处理信息的最小单元,无论是日常提问还是生成内容,每一次交互都伴随着它的消耗。近期,智能体应用如“龙虾”的兴起,进一步推高了Token的使用需求,也让成本问题愈发凸显。

记者调查发现,智能体产品落地初期,简单交互场景的成本变化并不显著,但深度使用场景中,Token消耗量会呈指数级增长,直接推高使用成本。个人用户秦先生表示:“任务复杂度稍有提升,成本就明显增加,Token消耗与任务难度不成正比,超出预期。”企业层面的感受更为强烈——规模化应用AI的企业日均Token消耗已达百亿级,以中交AI中心为例,其开发的数千个智能体日均消耗上百亿Token,对应成本约十万元。

持续增长的Token需求对算力系统构成挑战。MiniMax稀宇科技副总裁严奕骏透露,公司每周都要进行算力扩容,算力资源始终处于“紧平衡”状态。中国电信北京公司AI技术负责人陈哲诗观察到,大模型技术演进拉动了应用层需求,算力租赁市场火爆,但客户对成本敏感度较高,优化基础设施效率、降低Token成本成为行业共同诉求。

Token与手机流量的计费逻辑本质不同。手机流量按传输量计费,缓存内容可重复使用,成本清晰可控;而Token作为AI处理信息的计量单位,用户需支付模型空间占用费、服务套餐费,每条指令执行都会产生实时消耗,功能扩展或权限开放还会带来额外支出。这种差异导致深度使用场景下,Token成本增长远高于流量成本。

降低Token成本已成为行业共识。中国信息通信研究院云计算与数字化研究所主任马飞分析,当前成本偏高源于行业处于发展初期,高端算力硬件成本高、资源利用率不足等多重因素叠加。随着技术成熟和算力供给优化,单位Token成本将逐步下降,需求爆发也将倒逼产业加速迭代。

企业正在通过多路径降本。月之暗面Kimi企业业务负责人黄震昕表示,公司通过底层模型架构创新提升效率,直接降低Token成本;阶跃星辰首席技术官朱亦博提出“智价比”概念,强调在保持模型智力水平的同时尽可能压缩成本。云服务机构则从资源配置入手,天翼云智算平台产品专家王曼介绍,通过算电协同、算网融合调度等技术,持续优化成本结构。

国家层面算力布局为普惠化提供支撑。中国信通院发布的《算力互联网体系架构研究报告》显示,我国智能算力规模已居全球第二,但高端算力、核心算法仍存在外部依赖。当前,全国一体化算力网络建设加速推进,通过统一调度优化资源配置,算力服务可触达性显著提升。同时,轻量化、低功耗本土大模型的发展,让更多普通用户能够以较低成本享受AI服务。

中国信通院云计算与数字化研究所副所长栗蔚认为,Token作为AI产业度量衡,其消耗总量反映应用深度,成本则体现算法算力效率。要实现Token普惠化,需构建优质算法、持续优化模型,降低单Token算力消耗,并搭建随需接入的算力节点网络,让AI服务真正走进千家万户。

国网黑龙江电力“人机协同”新实践:双臂机器人助力电网春检更安全高效
人民网哈尔滨4月3日电 3月31日,在黑龙江省七台河市10千伏中心线电网检修作业现场,智能带电作业机器人在地面作业人员的远程操控下,精准完成负荷侧接地环加装任务。这是国网黑龙江电力首次应用双臂带电作业机器人进…

2026-04-04

FAIR plus2026即将启幕!500余家企业齐聚深圳共探机器人产业新未来
FAIR plus2026作为全球首个面向机器人产业链、聚焦机器人开发与二次开发的专业展会,本次展览面积达15000平方米,将汇聚500余家机器人产业链上游及整机企业带来实物展示,覆盖50余个具身智能机器人…

2026-04-04

OpenAI Codex推插件系统:企业可管控AI编程,行为标准化成亮点
OpenAI为其AI驱动的软件工程平台Codex推出了插件系统,让企业IT团队能够将编程工作流、应用集成和外部工具配置打包成版本化的可安装包,在开发组织内进行分发或阻止使用。Dai表示:"与GitHub …

2026-04-04