在武汉举办的AI创新巡展上,火山引擎公布了一组令人瞩目的数据:截至今年3月,豆包大模型的日均Token(词元)使用量已突破120万亿,较过去三个月增长一倍,与2024年5月发布时相比更是激增1000倍。与此同时,火山引擎宣布其多模态模型Seedance 2.0的API接口正式面向企业用户开放公测,引发行业广泛关注。
随着国家数据局局长刘烈宏正式将Token命名为“词元”,这一技术概念在国内云服务领域迅速升温。火山引擎作为国内最早强调Token消耗的云厂商,其战略眼光在此轮技术浪潮中得以验证。公司总裁谭待在接受采访时表示:“两年前我们提出Token概念时,行业普遍认为其粘性差、利润薄,但事实证明,通过持续优化组织和产品,我们已建立起显著优势。”
市场研究机构IDC的报告显示,2025年上半年中国AI云市场规模达536.7万亿Tokens,其中MaaS层外部客户调用量占比突出。这一数据印证了火山引擎对Token消耗趋势的判断——模型能力的提升与多模态应用的发展正持续推动Token使用量增长。以Seedance 2.0为例,生成一个1分钟720P视频的Token消耗量超过百万,而智能体场景中,单次任务涉及的工具调用轮次可达数十至上百次,对应消耗数十万Token。
近期,类智能体产品“龙虾”OpenClaw的火爆引发国内科技企业竞相布局,形成“百虾大战”格局。谭待认为,当前市场仍处于蓝海阶段,用户规模仅百万量级,远未触及天花板。他强调:“企业更关注模型的实际能力,而非单纯的价格竞争。Seedance 2.0的代际优势已证明,技术差距才是决定产品竞争力的关键。”
在技术架构层面,火山引擎透露其豆包手机与ArkClaw均基于“智能体驾驭”(Agent with Harness)理念开发。这种设计思路与Cloud code、coworker等工具异曲同工,标志着Agent技术进入成熟应用阶段。谭待解释称:“从预训练到环境记忆,模型技术的全链条发展,为智能体产品提供了坚实基础。”
对于字节跳动版“龙虾”ArkClaw的差异化竞争策略,谭待指出其核心优势体现在模型、安全与技能开放三个维度。在模型层面,豆包系列的多模态、语音及编程模型构成技术护城河;安全方面,公司投入大量资源构建防护体系;技能生态上,通过ClawHub中国镜像站实现全球资源整合,避免封闭式发展。他以多模态创作能力为例:“将Seedance的强项整合到ArkClaw中,自然能形成独特竞争力。”
展会期间,OpenClaw开源项目创始人彼得·斯坦伯格通过视频宣布,与火山引擎共建的ClawHub中国镜像站正式上线。这一合作被视为中国智能体生态建设的重要里程碑,预示着国内外技术资源将进一步深度融合。随着更多企业加入赛道,AI智能体领域的创新竞争正进入全新阶段。