发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

Anthropic报告:AI智能体自主性提升 软件工程应用近半风险需关注

2026-02-22来源:快讯编辑:瑞雪

AI智能体正从技术概念加速融入现实应用场景,全球主要科技企业均已推出相关产品,但用户对其实际运行模式仍存在认知盲区。近日,AI研究机构Anthropic发布的最新报告,通过分析数百万次人机交互数据,首次呈现了AI智能体在真实环境中的行为特征与潜在风险。

研究团队对旗下编程助手Claude Code的长期运行数据追踪发现,该模型单次自主执行任务的最长时长在三个月内增长近一倍。2025年10月至2026年1月期间,其"任务执行周期"第99.9百分位时长从25分钟延长至45分钟以上,而中位数时长稳定在45秒左右。这种增长趋势与模型版本迭代无显著关联,更多源于用户信任度提升、任务复杂度增加以及产品交互优化。

用户行为数据显示,经验积累显著影响人机协作模式。新用户(使用次数少于50次)仅在20%的会话中启用全自动模式,而资深用户(使用超750次)的该比例超过40%。值得注意的是,随着使用时长增加,用户主动中断模型运行的频率从5%上升至9%,同时模型因自身不确定性主动请求澄清的次数达到人类中断次数的两倍以上,形成双向监督机制。

不同复杂度任务呈现差异化协作特征。在修改单行代码等简单任务中,87%的操作需要人工参与,而在查找软件漏洞或开发编译器等复杂场景中,人工介入比例降至67%。研究指出,复杂任务往往由技术熟练的用户发起,其步骤的不可分割性导致人工审批难度增加,这促使系统更依赖模型自主判断。

风险评估显示,当前AI智能体操作集中在低风险领域,软件工程相关活动占比近半,但医疗、金融等高敏感领域已出现应用案例。尽管高风险操作占比不足1%,其潜在危害不容忽视。研究特别指出,现有监控体系对公共API的会话级行为存在观测盲区,且分析样本仅覆盖单一模型提供商,结论外推需谨慎。

基于研究结果,报告提出四项建议:构建实时监控基础设施以捕捉异常行为,强化模型对自身不确定性的感知能力,开发支持用户监督的交互界面,以及避免过早制定标准化协作规范。这些措施旨在平衡技术创新与风险管控,为AI智能体的规模化应用提供参考框架。

春晚“真假蔡明”同台引温情后续:仿生机器人成艺术与科技交融的暖心见证
节目中与蔡明同台、高度仿真的仿生机器人,在引发后台误认趣闻后,迎来了一个充满情怀的归宿,研发公司松延动力正式将其作为一份特殊礼物,赠送给了蔡明本人。当“假蔡明”成为蔡明家中的一件特殊藏品,这个故事提醒人们:最…

2026-02-22

谷歌高管直言:大模型封装应用与AI聚合平台或难走远,未来方向在哪?
AI 聚合平台则是封装应用的一个分支:它们将多个大模型整合到一个界面或 API 层,把用户请求路由到不同模型,让用户一次访问多种模型。 他表示,总体来看,聚合平台如今增长乏力,因为用户想要的是“内置真正知识…

2026-02-22

百度地图AI副驾互动破亿!岳云鹏人设备受青睐 出行陪伴更有趣
新榜讯2月21日讯,自百度地图春节版本推出后,其AI陪伴式出行功能呈现爆发式增长态势。用户活跃度与互动深度均创下新纪录,这一标志性成果宣告AI副驾正式从尝鲜期步入高频使用阶段。据统计,截至2月17日,百度地图…

2026-02-22

2025年AI应用:规模化落地下的机遇、挑战与安全协同新路径
在当前全球数字化与智能化进程不断加快的背景下,人工智能技术正以前所未有的速度推动产业形态、业务模式及生产力结构的深刻变革。2025年,AI的应用已从局部试点进入规模化、体系化落地阶段,成为支撑企业运营、产业…

2026-02-22

宇树科技王兴兴谈机器人:技术如十岁孩童,大规模应用未来可期
对话中,对于“现在机器人发展的技术阶段是否就如一个10岁的孩子甚至更小?”2月17日,宇树科技创始人王兴兴发微博称:“有朋友问春晚机器人进化速度有多快,我想说这取决于大家对AI的想象力。 此前,春晚《武B…

2026-02-21