发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

OpenAI推出GPT-5.3-Codex:基准测试创新高,成开发者协作新利器

2026-02-06来源:互联网编辑:瑞雪

OpenAI 正式推出新一代编程模型 GPT-5.3-Codex,宣称其在编程能力与开发者协作体验上实现重大突破。该模型在多项基准测试中刷新纪录,同时支持任务执行过程中的实时交互,标志着人工智能从单一编程工具向通用计算机协作者转型。

在性能测试中,GPT-5.3-Codex展现出显著提升。SWE-bench Pro(公开版)测试显示其得分达56.8%,较前代56.4%微幅增长;Terminal-Bench 2.0测试中,成绩从64.0%跃升至77.3%;最引人注目的是OSWorld-Verified智能体计算机操作测试,得分从38.2%飙升至64.7%,证明其在复杂系统环境中的操作能力实现质的飞跃。官方特别强调,新模型运行速度较GPT-5.2-Codex提升25%,在保持精度的同时显著优化效率。

开发者协作模式迎来革命性升级。新模型支持用户在任务执行过程中随时介入引导,通过高频进度更新实现双向对话。开发者可实时提问、调整方案或修正方向,系统能够完整保留上下文信息,避免传统交互中常见的断层问题。这种设计使Codex从被动执行工具转变为具备主动协作能力的智能伙伴,大幅降低应用开发的技术门槛。

技术实现层面,OpenAI重构了模型的任务处理架构。通过动态上下文管理机制,系统在保持长序列记忆能力的同时,实现多轮交互的精准响应。在代码生成测试中,新模型展现更强的环境适应能力,能够根据开发者反馈动态优化输出策略,在复杂项目开发中表现出更强的稳定性。

产品落地方面,GPT-5.3-Codex已全面开放给ChatGPT付费用户,覆盖Plus、Team及Enterprise等订阅层级。用户可通过Codex专用应用、命令行工具、IDE扩展插件及网页端四种方式访问,API接口计划于近期上线。这种多端协同的部署策略,使不同技术背景的开发者都能找到适合的接入方式。

行业观察人士指出,该模型的突破在于重新定义了AI与开发者的协作边界。通过将编程任务分解为可交互的模块化流程,GPT-5.3-Codex使非专业开发者也能参与复杂系统开发,这可能引发软件开发领域的范式转变。随着API接口的开放,预计将催生大量基于该模型的垂直领域应用。

“十四五”收官亮眼:我国网民超11亿 互联网赋能数字社会与产业出海
《中国互联网络发展状况统计报告》显示,目前我国中小企业数量超6000万家,已累计培育专精特新“小巨人”企业超1.76万家,从行业分布看,超六成“小巨人”企业深耕工业基础领域,量子科技、人工智能、低空经济等未…

2026-02-06

荣耀2025年手机出货量增速领跑全球,2026年将推手机机器人与Magic V6
极目新闻记者 黄永进 实习生 曹亚丹 李秉坤 2025年荣耀手机出货量全球增速第一,并官宣今年将发布首款手机机器人与Magic V6。此外,IDC数据显示,2025年前三季度,荣耀在300美元以上手机高端及中…

2026-02-06

贾跃亭携FF发布三大系列具身智能机器人,背后是持续自救之路
北京时间2月5日早上7:30,FF在拉斯维加斯举办美国国家汽车经销商大会活动上,举行了FF首批具身智能(EmbodiedAI)机器人产品发布会。 FF创始人、合伙人、首席产品及用户生态官贾跃亭表示,本次FF共…

2026-02-06

马斯克“商业帝国”再扩张:特斯拉机器人或成星际文明“开拓者”?
特斯拉创始人马斯克此前还曾表示,旗下Optimus人形机器人有望在三年内超越全球顶尖人类外科医生。 载体端:特斯拉汽车与 Optimus人形机器人,成为AI落地物理世界的重要触角; 未来人们驾驶特斯拉汽车…

2026-02-06

2025年我国数字发展成果丰硕:网民超11亿,生成式AI用户达6.02亿
截至2025年12月,我国生成式人工智能用户规模达6.02亿人,较2024年底增长141.7%,普及率达42.8%,同比提升25.2个百分点,正加速融入生活、生产全领域,成为推动社会数字化、智能化转型的重要…

2026-02-06