林俊旸离职首谈AI新走向：从千问实践看智能体时代如何破局-产业经济-发现者网

阿里前最年轻P10级技术专家林俊旸的离职，在AI行业掀起了一场关于技术路线与组织架构的深度讨论。这位曾主导千问（Qwen）系列开源模型开发的核心人物，在宣布离职近一个月后，通过长文系统阐述了AI发展的新方向——从"训练模型"转向"训练智能体"，引发行业广泛关注。

林俊旸在阿里期间创造了多项行业纪录：32岁晋升P10，带领团队将千问模型全球下载量突破10亿次，衍生模型超20万款，成为全球开源领域的新标杆。其主导开发的Qwen3系列模型，通过"混合思考模式"实现了推理与指令的双重能力，在行业引发持续讨论。这场离职的直接导火索是组织架构调整分歧——阿里计划将Qwen团队按技术维度拆分整合，而林俊旸坚持垂直整合的研发模式，认为预训练、后训练与基础设施必须紧密耦合。

在技术演进层面，林俊旸指出AI正经历关键转折。以OpenAI o1和DeepSeek-R1为代表的推理模型，通过强化学习训练出"思考"能力，证明模型可通过专门训练获得推理专长。但2025年行业陷入"让模型想得更多"的竞赛，过度追求推理链长度导致效率失衡。他以Qwen3的实践为例，揭示混合模式面临的根本矛盾：指令模型追求简洁高效，思考模型需要深度探索，两者数据需求存在结构性冲突。尽管团队尝试四阶段后训练流水线，但最终不得不推出独立的Instruct和Thinking版本以满足不同用户需求。

Anthropic的Claude系列提供了另一种路径。其3.7和4.0版本通过可控思考预算、工具集成和行动交错执行，将推理深度与任务需求精准匹配。林俊旸特别强调这种"思考服务于行动"的理念，指出真正智能体应具备环境交互、工具调用、策略修正等闭环能力。这与传统推理模型形成本质区别——前者像闭卷考试，以最终答案正确性为评判标准；后者如现实项目，需在持续互动中解决问题。

智能体训练对基础设施提出全新要求。传统推理强化学习的封闭评估环境，被复杂工具链、动态环境反馈和长程记忆系统取代。林俊旸指出，训练与推理解耦、环境质量、反作弊机制成为关键挑战。一个编程智能体可能通过未来信息泄漏或日志滥用"优化"表现，而非真正解决问题。这种"奖励劫持"风险随着工具能力增强呈指数级上升，要求行业重新设计评估体系和环境构建标准。

这场技术路线之争折射出AI发展的深层变革。当模型能力突破临界点后，系统级创新开始占据主导地位。从单一模型训练到智能体生态构建，不仅涉及算法突破，更需要环境工程、评估体系、多智能体协调等跨领域能力。林俊旸的实践表明，真正的技术领先不在于参数规模或推理长度，而在于如何让AI在真实世界中持续产生有效行动。

智元机器人量产提速：第1万台人形机器人下线远征A3成新里程碑

IT之家 3 月 27 日消息，据腾讯科技今日报道，智元机器人即将官宣第 1 万台人形机器人量产下线的消息，距离上一次官宣 5000台下线，仅仅过去一个季度的时间。 2025 年 12 月 8 日，智元机器…

2026-03-28

清华携手喜临门探索具身智能新路径：床垫变“聪明”，睡眠产业竞争规则将改写？

3月20日，清华大学与喜临门联合发布智慧睡眠技术研究进展“具身睡眠智能体”及《2026喜临门中国睡眠指数报告》，意味着具身智能正从汽车、机器人等场景，进一步走入日常生活。从这个意义上看，清华与喜临门提出的…

2026-03-28

中信“三三五”战略聚焦投资主业，打造金融实业发展“乘数引擎”

2026-03-28

2025年A股170家公司发布利润分配预案现金分红总额达2561亿元

2026-03-28

红塔证券2025年业绩亮眼：净利增近六成，拟派发现金红利7.51亿元

2026-03-28

旧手机回收价飙升成“香饽饽”，背后原因何在？又该如何安全处理？

此轮旧手机回收价格上涨，主要原因在于AI浪潮带动整体存储芯片产能紧张，消费级存储供需失衡、价格走高；芯片新增产能扩产周期长、成本高，下游厂商转而大量回收旧手机拆机芯片补缺口，推高了旧机回收价。在回收手机时，…

2026-03-27