在人工智能大模型领域,短短两年间,行业格局与认知已发生深刻变革。2024年初,壁仞科技联合创始人徐凌杰告别GPU市场,投身创立魔形智能(Magik Compute),立志打造“AI Token Factory”,彼时这一概念尚显陌生。然而,到2026年,随着OpenClaw、Seedance等应用的广泛普及,“Token经济学”迅速在行业内外走红。
今年3月,中国Token日均调用量突破140万亿大关。同月,英伟达年度盛会GTC 2026上,黄仁勋预言“未来的数据中心将转变为生产Token的工厂”,这与魔形智能的愿景不谋而合。3月底,在上海,徐凌杰分享了魔形智能的目标愿景与业务模式,并从“局内人”视角,剖析了Token工厂、Token经济学以及电力出海等概念背后的真相。
徐凌杰的创业选择,源于对行业趋势的敏锐洞察。他曾在英伟达、AMD、三星北美研究院从事GPU研发与管理工作,并担任阿里巴巴阿里云智能事业群总监。2019年壁仞科技成立后,他作为联合创始人,负责产品规划与市场拓展。2024年,壁仞多款产品进入量产阶段,营收快速增长,同年9月还启动了上市辅导。然而,徐凌杰却选择在这个关键时刻离职创业。
对于创业时机,徐凌杰表示,他和联合创始人金琛看到,在AI大模型与芯片之间,存在大量工作待完成。2024年他40岁,认为人生的黄金年龄有限,既然预见到Token大潮即将来临,便决定抓住机遇,勇敢尝试。让他看清这一趋势的,有两件关键事件。
一是2024年GTC大会上,英伟达发布的GB200 NVL72。这是一个集成了36个Grace CPU、72个Blackwell GPU,拥有60万个零件、重达3000磅的“超节点(SuperPod)”机架系统,代表了英伟达“超节点”产品路线。二是同年5月,开源模型DeepSeek V2发布,凭借MoE(混合专家模型)、MLA(多头潜注意力)等技术,将模型推理成本降至行业最低,每百万Token成本相比同年发布的GPT-5降低约96%。算力以“超节点”形式极致堆叠,模型通过结构创新压缩单位Token成本,供给与效率同时跃迁,使Token具备了工业化生产、精细化定价的可能性。
徐凌杰将魔形智能定位为“软硬件协同的AI Infra”。在写给壁仞同事的离职信中,他提到虽告别造芯之路,但仍将坚守智能算力赛道。当时外界对此感到困惑,因为在很长一段时间里,AI三要素“算力、算法和数据”是理解AI公司市场定位的坐标系,芯片公司常被视为算力的代表。
在徐凌杰看来,Token工厂与数据中心、智算中心有显著差异。借用黄仁勋提出的五层蛋糕理论,Token将能源、芯片、infra、大模型封装在一起,更贴近生活,消费者对Token作为购买智力单元已有感知。此前行业关注算力中心落成、千卡/万卡集群打造,主要因产业处于模型训练阶段,模型未被广泛使用。2025年DeepSeek V3爆发后,众多应用涌现,推理相比训练未来成长性更高,这是经济效益再分配过程,如今很多公司已给工程师配额Token用于生产。
对于魔形智能的位置,徐凌杰表示,市场对更快、智力更高、更大规模生产的Token有需求,这需要更大集群。中国存在大量优质开源模型,当模型统一开源后,未来需关注如何更好组织硬件、让模型运行更佳,这是Infra的工作。魔形智能对标Nebius,但走得更深、全栈自研。Nebius部分服务器自研,通过改配统一配置提高稳定性,降低故障中断率,使模型训练更快。魔形智能强调软硬件都要做,而目前大部分Infra企业仍以软件方式运营。
当被问及如何衡量Token工厂性能时,徐凌杰提出“用多少电,产生多少Token”的指标,这与黄仁勋“谁的每瓦Token吞吐量最高,谁的生产成本就最低”的观点一致。电力决定装机量上限,进而决定每天生产Token数量,但不同品牌、型号芯片性能不均等,模型能力不同,产生的Token智力也不同,参数量越大的模型Token越聪明,生产效率也更高。对于Token单位电力吞吐量,徐凌杰认为可关注芯片性能升级、超节点升级以及计算格式不同等变量条件。
谈及英伟达在Token工厂范畴的地位,徐凌杰表示英伟达仍是技术极限的追求者和定义者,其文化推动员工追求“speed of light”(光速)这一极限指标。当前市场比拼绝对性能和单位性价比,对中国公司而言,追求单位性价比更为重要。
对于建立Token工厂的要素,徐凌杰认为长期要走向超节点系统化工程,现阶段可优化运营成本,搞定硬件、掌握供应链关键环节。目前中国每秒产生的Token(TPS)大概在30到60个,美国可能达到100、200,主要受限于算力供给。当被问及魔形智能是否会自研芯片时,徐凌杰表示这相对遥远,不在当前规划中,魔形智能面向提供Token,服务器、集群是副产品。
面对国内AI Infra赛道的竞争,徐凌杰认为市场尚未到互相竞争阶段,AI Infra市场盘子比芯片更大,但资本投入远未达到芯片赛道程度,大家面对的是百倍千倍的成长机会,三年后赛道可能跑出千亿级别人民币以上的公司,且不止一家。对于AI Infra的商业模式,徐凌杰表示目前魔形智能更接近与算力中心合作,用他们的机器生产Token,未来算力消纳模式可能是扩大资源的一种方式。而对于“token出海”“电力出海”概念,徐凌杰认为电力成本在Token成本中占比不到10%,算力成本才是核心,当前中国算力无优势,算力都不够用,未来随着芯片水平提高,这种愿景或许可能实现,但目前并非现实命题。
