发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

从Gemini到千问:周浩携前沿技术,能否引领千问开启新征程?

2026-03-07来源:快讯编辑:瑞雪

阿里旗下千问团队近日迎来重大人事变动,原后训练负责人林俊旸深夜发布告别动态后,曾在DeepMind主导多项核心技术的周浩正式接棒。这一调整发生在千问完成混合架构升级、加速布局消费级AI硬件的关键节点,引发业界对阿里AI战略转型的广泛关注。

周浩的学术履历堪称豪华:中科大本科毕业后,在威斯康星大学麦迪逊分校取得机器学习与计算机视觉博士学位,随后在meta积累大规模模型训练经验。2023年加入DeepMind后,他迅速晋升为高级主任研究科学家,主导Gemini系列模型的事实性保障体系构建。该体系通过设计奖励函数和训练策略,使模型在生成内容时主动区分已知事实与不确定推测,在MMLU基准测试中以90.04%的准确率首次超越人类专家水平。

在视频理解领域,周浩团队提出的VideoPrism框架突破传统AI"逐帧分析"的局限。该模型通过对比学习匹配视频与文本描述,结合掩码自编码预测遮挡内容,在33个基准测试中31个取得最优成绩。这项技术直接支撑了Gemini的多模态能力,使其能理解"切菜-热油-下锅"的烹饪流程而非仅识别画面元素。

接任千问后训练负责人后,周浩面临双重挑战:技术层面需弥补Qwen 3.5在复杂推理任务上的短板。当前版本虽采用Gated DeltaNet与稀疏混合专家架构,参数量达3970亿但推理仅激活170亿,成本降低60%的同时在GPQA Diamond科学推理测试中落后Gemini 3.1 Pro近6个百分点;组织层面则需适应阿里从"研究优先"向"指标驱动"的转型,将考核重点从模型性能转向业务提效与商业化ROI。

千问团队正在推进的消费级AI硬件布局或成为破局关键。3月2日亮相MWC的千问AI眼镜已展示情境感知雏形,若能整合VideoPrism的时序理解能力,将实现从"语音应答"到"环境交互"的质变。内部人士透露,年内还将推出AI指环、耳机等设备,形成覆盖出行、购物、办公的全场景生态。这种硬件与模型深度绑定的模式,恰与周浩在Gemini 3.0中开发的多步骤强化学习形成呼应——该技术使模型能拆解"安排杭州周末行程"这类复合任务,自动完成订票、订酒店、规划路线等子任务。

阿里CTO周靖人主导的架构调整为此次转型奠定基础。原垂直整合的预训练、后训练团队被拆分为多个平行模块,沟通链路延长但专业分工更细。这种变化在千问App接入淘宝、支付宝等阿里系应用时已显成效:用户可通过自然语言完成"2000元内带行李额的北京机票"自动比价支付,但航班取消后的方案切换仍需人工干预。周浩团队正在开发的多步骤推理系统,有望使模型具备自主纠错与动态规划能力,真正向"AI秘书"形态演进。

值得关注的是,千问的战略转型与阿里集团资源倾斜密切相关。CEO吴泳铭在财报电话会中明确表示要打造"AI原生C端超级入口",而千问眼镜等硬件的全球预约启动,标志着阿里开始复制"手机+操作系统"的生态构建模式。这种软硬件协同的策略,或将帮助千问在Gemini、ChatGPT等通用模型之外,开辟出垂直场景深度整合的新赛道。

MWC2026看中国移动:5G-A筑基、算力赋能,携手全球共绘AI+数智新图景
本次MWC2026,中国移动全面展示算力基础设施与场景化应用成果,打通“算力—网络—应用”全链路,赋能产业与民生双向升级。 依托“通信+算力”双底座,中国移动以九天大模型为智能基座、梧桐大数据为核心支撑,推动…

2026-03-07