对话魔形智能徐凌杰：Token工厂崛起，谈Token出海为何当下不具可行性-家电行业-发现者网

在人工智能大模型领域，短短两年间，行业格局与认知已发生深刻变革。2024年初，壁仞科技联合创始人徐凌杰告别GPU市场，投身创立魔形智能（Magik Compute），立志打造“AI Token Factory”，彼时这一概念尚显陌生。然而，到2026年，随着OpenClaw、Seedance等应用的广泛普及，“Token经济学”迅速在行业内外走红。

今年3月，中国Token日均调用量突破140万亿大关。同月，英伟达年度盛会GTC 2026上，黄仁勋预言“未来的数据中心将转变为生产Token的工厂”，这与魔形智能的愿景不谋而合。3月底，在上海，徐凌杰分享了魔形智能的目标愿景与业务模式，并从“局内人”视角，剖析了Token工厂、Token经济学以及电力出海等概念背后的真相。

徐凌杰的创业选择，源于对行业趋势的敏锐洞察。他曾在英伟达、AMD、三星北美研究院从事GPU研发与管理工作，并担任阿里巴巴阿里云智能事业群总监。2019年壁仞科技成立后，他作为联合创始人，负责产品规划与市场拓展。2024年，壁仞多款产品进入量产阶段，营收快速增长，同年9月还启动了上市辅导。然而，徐凌杰却选择在这个关键时刻离职创业。

对于创业时机，徐凌杰表示，他和联合创始人金琛看到，在AI大模型与芯片之间，存在大量工作待完成。2024年他40岁，认为人生的黄金年龄有限，既然预见到Token大潮即将来临，便决定抓住机遇，勇敢尝试。让他看清这一趋势的，有两件关键事件。

一是2024年GTC大会上，英伟达发布的GB200 NVL72。这是一个集成了36个Grace CPU、72个Blackwell GPU，拥有60万个零件、重达3000磅的“超节点（SuperPod）”机架系统，代表了英伟达“超节点”产品路线。二是同年5月，开源模型DeepSeek V2发布，凭借MoE（混合专家模型）、MLA（多头潜注意力）等技术，将模型推理成本降至行业最低，每百万Token成本相比同年发布的GPT-5降低约96%。算力以“超节点”形式极致堆叠，模型通过结构创新压缩单位Token成本，供给与效率同时跃迁，使Token具备了工业化生产、精细化定价的可能性。

徐凌杰将魔形智能定位为“软硬件协同的AI Infra”。在写给壁仞同事的离职信中，他提到虽告别造芯之路，但仍将坚守智能算力赛道。当时外界对此感到困惑，因为在很长一段时间里，AI三要素“算力、算法和数据”是理解AI公司市场定位的坐标系，芯片公司常被视为算力的代表。

在徐凌杰看来，Token工厂与数据中心、智算中心有显著差异。借用黄仁勋提出的五层蛋糕理论，Token将能源、芯片、infra、大模型封装在一起，更贴近生活，消费者对Token作为购买智力单元已有感知。此前行业关注算力中心落成、千卡/万卡集群打造，主要因产业处于模型训练阶段，模型未被广泛使用。2025年DeepSeek V3爆发后，众多应用涌现，推理相比训练未来成长性更高，这是经济效益再分配过程，如今很多公司已给工程师配额Token用于生产。

对于魔形智能的位置，徐凌杰表示，市场对更快、智力更高、更大规模生产的Token有需求，这需要更大集群。中国存在大量优质开源模型，当模型统一开源后，未来需关注如何更好组织硬件、让模型运行更佳，这是Infra的工作。魔形智能对标Nebius，但走得更深、全栈自研。Nebius部分服务器自研，通过改配统一配置提高稳定性，降低故障中断率，使模型训练更快。魔形智能强调软硬件都要做，而目前大部分Infra企业仍以软件方式运营。

当被问及如何衡量Token工厂性能时，徐凌杰提出“用多少电，产生多少Token”的指标，这与黄仁勋“谁的每瓦Token吞吐量最高，谁的生产成本就最低”的观点一致。电力决定装机量上限，进而决定每天生产Token数量，但不同品牌、型号芯片性能不均等，模型能力不同，产生的Token智力也不同，参数量越大的模型Token越聪明，生产效率也更高。对于Token单位电力吞吐量，徐凌杰认为可关注芯片性能升级、超节点升级以及计算格式不同等变量条件。

谈及英伟达在Token工厂范畴的地位，徐凌杰表示英伟达仍是技术极限的追求者和定义者，其文化推动员工追求“speed of light”（光速）这一极限指标。当前市场比拼绝对性能和单位性价比，对中国公司而言，追求单位性价比更为重要。

对于建立Token工厂的要素，徐凌杰认为长期要走向超节点系统化工程，现阶段可优化运营成本，搞定硬件、掌握供应链关键环节。目前中国每秒产生的Token（TPS）大概在30到60个，美国可能达到100、200，主要受限于算力供给。当被问及魔形智能是否会自研芯片时，徐凌杰表示这相对遥远，不在当前规划中，魔形智能面向提供Token，服务器、集群是副产品。

面对国内AI Infra赛道的竞争，徐凌杰认为市场尚未到互相竞争阶段，AI Infra市场盘子比芯片更大，但资本投入远未达到芯片赛道程度，大家面对的是百倍千倍的成长机会，三年后赛道可能跑出千亿级别人民币以上的公司，且不止一家。对于AI Infra的商业模式，徐凌杰表示目前魔形智能更接近与算力中心合作，用他们的机器生产Token，未来算力消纳模式可能是扩大资源的一种方式。而对于“token出海”“电力出海”概念，徐凌杰认为电力成本在Token成本中占比不到10%，算力成本才是核心，当前中国算力无优势，算力都不够用，未来随着芯片水平提高，这种愿景或许可能实现，但目前并非现实命题。