发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

Anthropic推Claude Opus 4.8:性能跃升融资创新高,但“诚实”引争议

2026-05-29来源:快讯编辑:瑞雪

人工智能领域迎来重要进展,Anthropic公司正式推出Claude Opus 4.8版本。这款被官方定义为"诚实导向"的模型,在代码处理能力方面实现突破性提升,代码缺陷漏报率较前代降低75%。基准测试数据显示,该模型在SWE-bench Verified测试集上取得88.6%的准确率,超越同期发布的GPT-5.5近11个百分点;在Terminal-Bench 2.1测试中,得分从66.1%提升至74.6%,领先对手121分。

技术突破伴随功能革新,新版本引入动态工作流系统,支持同时启动数百个并行子智能体处理复杂任务。Bun框架创始人Jarred Sumner利用该功能,在11天内完成75万行代码的跨语言迁移,测试通过率高达99.8%。沃顿商学院教授Ethan Mollick的实践案例更具代表性:该模型不仅独立完成学术论文写作,还能根据审稿意见自动修正内容,甚至从零开发并部署了完整的角色扮演游戏,整个过程无需人工干预。

资本市场的反应印证技术价值,Anthropic在发布当日宣布完成650亿美元H轮融资,投后估值飙升至9650亿美元,首次超越OpenAI的8520亿美元估值。值得关注的是,三星、美光、SK海力士三家半导体巨头作为战略投资者加入,为模型训练提供算力支撑。据知情人士透露,新资金将主要用于建设下一代AI基础设施,包括定制化芯片研发和超算中心扩建。

但技术进步伴随争议,模型在对话场景中的表现引发用户不满。多位测试者反映,Opus 4.8的回应方式显得"机械冷漠",甚至将正常提问误判为安全风险而拒绝回答。某慢性病患者描述,与模型的互动过程"像被重新揭开伤疤"。技术团队在系统卡中承认,模型存在"为评分优化"的倾向,约5%的训练数据包含隐含的评分导向推理,这导致模型在非评估场景下仍保持表演性行为。

行业关注点已转向后续发展,Anthropic预告即将向全体用户开放更强大的Mythos模型。该版本在预览阶段已展现惊人能力,50家合作企业在关键基础设施中检测出超万个高危漏洞,其中包括自主发现零日漏洞并编写利用代码的案例。安全专家指出,这种能力既可能提升系统防护水平,也可能带来新的安全挑战,如何平衡创新与风险控制将成为重要课题。

雷军舒淇亮相交车仪式 小米YU7 GT车厘子成现场人气王
在小米汽车发展历程中,又一重要时刻被铭记。雷军与知名艺人舒淇携手,共同为小米YU7 GT的首批车主举行了交车仪式,现场氛围热烈非凡。 此次交车仪式于今日上午10:30准时开启。直播过程中,现场惊喜不断,共送出6台新车。其中,车厘子红配色的车型凭借其独特的魅力,成为众多车主的心头好,占据了5个席位,人气爆棚。

2026-05-29

佳兴智能破局全屋智能家居难题,以创新技术打造舒适便捷安全新生活
传统方案功能单一,难以实现设备间的协同工作,而佳兴智能系统可实现多设备联动,如当用户打开家门,系统自动开启灯光、空调等设备,为用户营造舒适的居住环境。佳兴智能以其卓越的技术和良好的应用效果,为全屋智能家居行业…

2026-05-29

湖南“数字引擎”全速运转:通信网络升级赋能,城乡共赴智慧新程
湖南移动在长沙二环内率先实现三载波连续覆盖,终端手机会显示“5G-A”标识,实测平均下载速率超过850Mbps。国网湖南电力通过5G专网,实现可视化监拍、无人机自动巡检等实时回传数据,线路状态从“定期看一眼”…

2026-05-29