在人工智能领域,一场围绕“Token”的变革正悄然兴起,成为行业关注的焦点。从英伟达创始人兼首席执行官黄仁勋在GTC大会上的演讲,到阿里巴巴集团CEO吴泳铭宣布的组织调整,Token正从幕后走向台前,成为推动AI发展的核心要素。
黄仁勋在演讲中反复强调“Token即商品”这一全新定义,将Token的地位提升到了前所未有的高度。他指出,随着生成式AI、推理AI以及能够实际投入工作的AI(如Claude Code)的相继出现,Token的使用量呈现出指数级增长。从ChatGPT开启生成式AI时代,让Token成为人与机器对话的语言;到ChatGPT o1等推理AI使模型开始“思考”,Token用途扩展至反思、规划、问题拆解;再到Claude Code让AI能够读取文件、编写代码、测试、迭代,Token已成为AI运行不可或缺的“血液”。
这一趋势带来了对计算能力的巨大需求。黄仁勋透露,去年英伟达与AI原生企业的合作呈爆炸式增长,AI初创企业获得的风险投资高达1500亿美元,而这些公司普遍都需要大量的计算能力来创建、构建或整合Token。市场对英伟达GPU的计算需求因此“爆表”,他相信过去几年计算需求增长了100万倍,并预测2025到2027年期间,这一需求增长将至少为英伟达带来1万亿美元收入。
为了适应这一变革,黄仁勋提出了“数据中心即Token工厂”的颠覆性概念。他表示,传统的文件数据中心正转变为Token生产工厂,每瓦特电力的Token产出成为衡量效率的核心指标。在这个新工厂里,目标是在有限的能源和空间内,最大化Token的吞吐量。因为每个数据中心从定义上来说都是电力受限的,所以在给定功率下,每瓦吞吐量越高,就能产生越多的Token。未来,每一家CSP、计算机公司、云公司、AI公司乃至所有企业,都会关注其Token工厂的效率。黄仁勋展示的一张关键图表,以Token吞吐量为纵轴、推理速度为横轴,揭示了AI工厂未来发展的核心方向——吞吐量和Token生成速度将直接决定企业明年的收入。
英伟达在这一变革中占据了领先地位。黄仁勋宣布,英伟达的Token成本是全球最低的,无可匹敌。通过架构创新,在一个1吉瓦的工厂里,英伟达将把Token生成速度从200万提高到7亿,增长350倍。当天发布的Vera Rubin平台是这一创新的集中体现,它包含7款芯片、5套机架级系统以及一台面向代理式AI的超级计算机。与Blackwell平台相比,Vera Rubin NVL72机架仅需四分之一数量的GPU即可训练大型混合专家模型,每瓦特推理吞吐量最高可提升10倍,同时每Token成本仅为原平台的十分之一。而Groq 3 LPX机架与Vera Rubin的联合,更使每兆瓦的推理吞吐量提升高达35倍,为万亿参数模型带来了多达10倍的营收机遇。
Token的变革不仅限于技术层面,还催生了全新的“Token经济学”。黄仁勋提出,不同层级的AI服务对应不同的Token定价策略。高吞吐量低生成速度的方案可用于免费层级,而更大、更快、支持更长上下文的模型属于中间层级,免费、每百万Tokens收费3美元、每百万Tokens收费6美元等阶梯定价模式将逐步形成。随着AI模型越来越智能,每一次点击都可能推动价格上涨,未来甚至可能出现每百万Tokens收费45美元甚至150美元的高级模式。黄仁勋描绘了一个Token驱动的未来:未来公司每一位工程师都需要年度Token预算,每一家软件公司都将成为Token制造商,为员工、为客户制造Token。
无独有偶,阿里巴巴也在积极布局Token领域。阿里巴巴集团CEO吴泳铭宣布成立Alibaba Token Hub事业群,围绕“Token的创造、输送与应用”整合阿里内部多个AI相关业务板块,标志着阿里AI战略正式进入“Token驱动”阶段。在吴泳铭看来,Token正成为阿里AI战略的全新引擎。
从英伟达到阿里巴巴,Token正成为人工智能领域的新焦点。它不仅是技术的产物,更是新时代的语言与货币,正在重塑从数据中心到太空、从智能汽车到机器人的各个领域。围绕Token的变革,正在开启一个全新的AI时代。