从Gemini到千问：周浩携前沿技术，能否引领千问开启新征程？-移动智能-发现者网

阿里旗下千问团队近日迎来重大人事变动，原后训练负责人林俊旸深夜发布告别动态后，曾在DeepMind主导多项核心技术的周浩正式接棒。这一调整发生在千问完成混合架构升级、加速布局消费级AI硬件的关键节点，引发业界对阿里AI战略转型的广泛关注。

周浩的学术履历堪称豪华：中科大本科毕业后，在威斯康星大学麦迪逊分校取得机器学习与计算机视觉博士学位，随后在meta积累大规模模型训练经验。2023年加入DeepMind后，他迅速晋升为高级主任研究科学家，主导Gemini系列模型的事实性保障体系构建。该体系通过设计奖励函数和训练策略，使模型在生成内容时主动区分已知事实与不确定推测，在MMLU基准测试中以90.04%的准确率首次超越人类专家水平。

在视频理解领域，周浩团队提出的VideoPrism框架突破传统AI"逐帧分析"的局限。该模型通过对比学习匹配视频与文本描述，结合掩码自编码预测遮挡内容，在33个基准测试中31个取得最优成绩。这项技术直接支撑了Gemini的多模态能力，使其能理解"切菜-热油-下锅"的烹饪流程而非仅识别画面元素。

接任千问后训练负责人后，周浩面临双重挑战：技术层面需弥补Qwen 3.5在复杂推理任务上的短板。当前版本虽采用Gated DeltaNet与稀疏混合专家架构，参数量达3970亿但推理仅激活170亿，成本降低60%的同时在GPQA Diamond科学推理测试中落后Gemini 3.1 Pro近6个百分点；组织层面则需适应阿里从"研究优先"向"指标驱动"的转型，将考核重点从模型性能转向业务提效与商业化ROI。

千问团队正在推进的消费级AI硬件布局或成为破局关键。3月2日亮相MWC的千问AI眼镜已展示情境感知雏形，若能整合VideoPrism的时序理解能力，将实现从"语音应答"到"环境交互"的质变。内部人士透露，年内还将推出AI指环、耳机等设备，形成覆盖出行、购物、办公的全场景生态。这种硬件与模型深度绑定的模式，恰与周浩在Gemini 3.0中开发的多步骤强化学习形成呼应——该技术使模型能拆解"安排杭州周末行程"这类复合任务，自动完成订票、订酒店、规划路线等子任务。

阿里CTO周靖人主导的架构调整为此次转型奠定基础。原垂直整合的预训练、后训练团队被拆分为多个平行模块，沟通链路延长但专业分工更细。这种变化在千问App接入淘宝、支付宝等阿里系应用时已显成效：用户可通过自然语言完成"2000元内带行李额的北京机票"自动比价支付，但航班取消后的方案切换仍需人工干预。周浩团队正在开发的多步骤推理系统，有望使模型具备自主纠错与动态规划能力，真正向"AI秘书"形态演进。

值得关注的是，千问的战略转型与阿里集团资源倾斜密切相关。CEO吴泳铭在财报电话会中明确表示要打造"AI原生C端超级入口"，而千问眼镜等硬件的全球预约启动，标志着阿里开始复制"手机+操作系统"的生态构建模式。这种软硬件协同的策略，或将帮助千问在Gemini、ChatGPT等通用模型之外，开辟出垂直场景深度整合的新赛道。