发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

AI智能体赋能科研:从“七步马拉松”到“智能驱动”的范式跃迁

2026-03-25来源:快讯编辑:瑞雪

科研工作,长久以来被赋予了浓厚的理想化色彩,实则它更像是一条精密分工的流水线。从浩如烟海的文献中检索筛选,到逐篇研读构建知识体系,再到提出假设、设计实验、验证结果,最终撰写论文发表,这七个步骤构成了科研工作的基本框架。然而,这条路径上的每一环节都耗时费力,却并非所有环节都能直接创造价值。

文献检索往往需要在成千上万篇论文中大海捞针,阅读阶段则需逐篇消化方法与结论,构建起初步但脆弱的认知框架。直到问题定义阶段,研究者才真正踏入“创造”的领域,而此时,大量时间已被消耗。这些环节,本质上属于“确定性劳动”,虽可拆解、描述与重复,却仍需人工完成,导致最宝贵的认知资源被大量消耗在易被替代的部分。

过去十年,人工智能(AI)虽已涉足科研领域,但多停留在辅助层面,如加速论文查找、文本翻译、甚至撰写综述等,却未能从根本上改变科研的基本模式。科研依旧是一场“七步马拉松”,只是速度略有提升。然而,一个更为激进的设想正在浮现:若将整个科研流程交由智能体执行,将会怎样?

近期,升级后的AI学术智能体——切问学术(WisPaper中文版),为这一问题提供了新的答案。它将确定性的劳动交由算力处理,将不确定的灵感留给人,重新分配了科研的生产方式。切问学术并非直接生产论文,而是嵌入科研流程,成为一种贯穿始终的能力。从文献检索到实验设计,再到结果输出,它都能自主完成,无需人工持续介入。

AI在科研中的角色因此发生转变。过去,AI更像是研究者的“助手”,提供局部性建议或完成特定任务,如翻译、总结或代码补全。研究者需不断接管流程,维持整体推进,同时复审AI工作以规避学术欺诈风险。而切问学术则更像“执行者”,能在无持续人工介入的情况下,自主完成部分内容,使科研流程首次出现“被托管”的可能。

这一变化,类似于自动驾驶技术的引入。在自动驾驶中,人类设定目标,系统负责路径规划与执行。同样,在科研中,研究者定义问题,切问学术则负责推进过程。科研流程因此发生变革,原本需人工逐步完成的任务,被整合为可由系统整体接管的过程。检索、阅读、整理等环节,不再需要逐一介入,而是在同一逻辑下连续处理。

AI智能体的介入还使科研工作方式从串行转向并行。多个假设可同时展开,多个方向可并行验证。研究者的工作方式从解决问题转向管理问题组,科研节奏随之加快。切问学术通过“解耦”传统科研路径,实现了指数级别的效率提升。据公开资料显示,其在文献检索方面预估提效10至100倍,论文阅读提升20倍,问题识别速度提升50倍,几乎重塑了科研生命周期。

切问学术的提效建立在有效且可靠的基础上。其文献搜索准确率高达93.78%,远超主流模型的70%左右;文档版式、公式与表格解析准确率均在90%以上,整体高于行业水平。这些能力虽不直接产生结论,却决定了信息如何进入后续处理。变量关系、实验结构、数据分布被提前拆解,阅读从逐篇处理转为结构化接收。

尤为值得一提的是,切问学术在测试中的综述一致性达到22.26%,引用真实性接近99.8%,有效杜绝了生成式模型的机器幻觉问题。其嵌入科研流程的价值,因此得以成立。本次升级的一大亮点在于实验环节的深入。上传论文后,系统可自动完成阅读、理解、拆解核心任务与算法逻辑,解析实验方法,生成可执行实验方案,并自动搭建计算环境、生成代码、执行实验流程,最终输出结果与完整实验报告。

整个过程无需人工逐步介入。切问学术可基于已有文献或识别出的研究空白,自动生成实验路径,自主匹配或寻找数据,完成环境搭建,执行实验并输出结果。传统科研流程中的“认知”与“执行”分离状态被打破,理解虽可加速,但验证仍依赖人。而现在,原本需人反复切换、试错的一整段流程被整体提速,科研流程从“人驱动”变为“智能驱动”。

这一切的实现,并非通用大模型所能及。科研场景依赖模型在上下文中快速建立规则理解的能力,而传统大模型在面对新知识时存在学习障碍。切问学术针对真实环境推进任务进行了针对性优化,采用AgentGym-RL训练方式,使模型在网页操作、实验流程等任务中不断调整路径,执行不依赖预设答案,而是在反馈中不断修正。

同时,切问学术在训练过程中针对推理、代码等关键能力相关的Token赋予更高权重,使能力提升与训练指标对齐。然而,即便具备在真实环境中推进任务的能力,模型进入科研流程仍需解决训练稳定性问题。RLHF虽是大模型对齐能力的核心路径,但PPO训练极不稳定。切问学术通过PPO-max技术,以更细粒度的约束与奖励机制保持训练过程稳定,不再依赖运气。

当这些能力聚合,科研的生产方式正发生真正的范式转变。科研工作方式从亲自完成每一步转向在关键节点做判断。执行被系统接管后,研究者逐渐退出具体操作,转而站在更上层的位置理解问题、选择路径、审视结果。这种变化重写了科研的角色分工,最聪明的大脑从执行者转向架构者或领导者。

同时,科研的进入门槛也在降低。在很多领域,idea与结果之间隔着代码、算力与实验环境。这部分需求一旦被切问学术等智能体解决,科研的进入门槛将被重新定义。科研竞争因此前移,从谁能做出来变成谁能更早看到问题,回归到了定义问题的“人”。一些原本受限于技术条件的研究者也能更直接地参与到问题本身的研究中。

科研的本质是知识生产。当知识生产的周期被压缩,影响的是整个技术体系的节奏。除了时间成本下降外,知识库更新频率也在加速。在新材料、靶向药、清洁能源等受验证成本限制的领域,验证一旦被压缩,路径筛选将明显加快,错误方向更早被淘汰,可行路径更快浮现。这意味着研究将在更高密度的试探中不断逼近答案,原本需要多年积累的试错过程被压缩到更短周期内反复发生。

三星Galaxy Glasses AR眼镜今年晚些时候亮相 携手XR头显打造XR生态
【环球网科技综合报道】3月24日消息,据多家外媒报道,三星移动业务执行副总裁JayKim透露,三星将于“今年晚些时候”推出首款搭载Android XR系统的智能眼镜Galaxy Glasses,与同期发布…

2026-03-25

远程办公上网行为管理难?五个实用方法搭配安企神系统轻松搞定
远程办公,它能实时查看每一位员工的网络流量使用情况,上传、下载流量,还有每个程序占用多少流量,都看得明明白白。 我可以设置整体的网络流量限速,也能针对单个程序设限制,比如限制视频、下载类程序的流量,优先保障…

2026-03-25

阿里玄铁C950处理器问世:性能跃升全球高端序列,AI算力新标杆来了
阿里巴巴于2018年起布局RISC-V,2019年发布的玄铁C910首次突破运行频率2GHz门槛;2025年发布的C930在SPECint2006测试中达到15分/GHz,迈过服务器芯片入门门槛;此次C95…

2026-03-25

2026年Steam手机应用总断连?三招教你轻松化解连接难题
时至2026年,Steam移动应用连接中断依然是困扰众多玩家的常见问题,它不仅影响了正常的游戏进程,还会导致社交聊天、社区互动和商店浏览等功能意外终止。 针对因网络环境不佳导致的连接问题,使用网络加速工具是行…

2026-03-25

卫宁健康陷技术委托开发合同纠纷 浦东新区法院裁定讯飞医疗撤诉结案
2026年3月20日消息,天眼查数据显示,中国裁判文书网近日公布了一则卫宁健康科技集团股份有限公司作为被告的裁判文书,案号为(2025)沪0115民初117347号,案由为技术委托开发合同纠纷,法院为上海市…

2026-03-25