发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

GPT-5.2发布引热议:性能表现不一,清北华人团队成幕后关键力量

2025-12-13来源:快讯编辑:瑞雪

OpenAI最新发布的GPT-5.2模型引发了科技圈的广泛关注。这款被寄予厚望的AI系统在基准测试中展现出惊人实力,几乎全面超越了Gemini 3 Pro,尤其在处理电子表格、PPT制作、代码编写与审查等经济价值任务方面表现突出。官方数据显示,该模型在GDPval等专业基准测试中,有70.9%的场景能达到或超越人类专家水平。

然而产品上线初期却出现意外状况。有用户在社交平台X上发帖称,当询问"garlic"中包含多少个字母"R"时,系统错误地返回"0个"的结果。这一现象被指与大语言模型的token化处理机制有关,属于底层技术局限。不过当用户强制切换至Thinking版本后,模型立即给出了正确答案。更有趣的是,部分用户反映模型性能在发布数小时后出现波动,有人调侃"喝完咖啡回来就变笨了",这种异常表现引发了对OpenAI技术策略的猜测。

技术社区的深度测试进一步验证了模型的进步。开发者构建的智能体系统显示,GPT-5.2能无缝调用多种工具且不会迷失方向,其多步骤任务处理能力获得特别称赞。在ARC Prize的评估中,Pro版本(X-High)取得90.5%的SOTA得分,意味着AI效率在一年内提升了近390倍。有用户尝试用ASCII字符描绘内心世界,模型生成的复杂图案令人震撼。

这款现象级产品的背后,活跃着多位华人科学家的身影。最早预告该模型的OpenAI研究员Yu Bai本科就读于北京大学数学系,后在斯坦福取得统计学博士学位;负责后训练的Yun Dai拥有清华大学本科和加州大学尔湾分校计算机硕士学位;推理模型团队成员Zuxin Liu则毕业于北京航空航天大学,并在卡内基梅隆大学完成硕博学业。这些技术精英的贡献,为OpenAI在AI竞赛中保持领先提供了重要支撑。

上海智慧养老社区兴起:科技赋能守护银发族,安享智能便捷晚年
在这个系统中,每一位老人都拥有专属的数字健康档案,从血压、血糖到睡眠质量,各项数据都能被实时采集和分析。社区还组织各种线下活动,让老人们在享受科技便利的同时,也能感受到人与人之间的温暖。它不仅解决了"空巢老人…

2025-12-13

OpenAI推出GPT-5.2:三版本细分策略,职场生产力工具再升级
Pro版:高端专家级版本,面向高难度任务,强调“极致准确性与可靠性”,可支撑科研辅助、金融建模、复杂系统调试等,是OpenAI目前“能力天花板”。 GPT-5.2在多个关键领域实现了显著突破,例如在职场效率…

2025-12-13

“九天”无人机首飞成功 助力航空产业创新升级与低空经济发展
(航空工业第一飞机设计研究院供图) 作为我国自主创新的大型通用无人机平台,该机型采用“通用平台+模块化任务载荷”设计理念,依托自主集成技术创新,具备大载重、高升限、宽速域、短起降等核心优势,——机长16.35…

2025-12-13

从“笨拙”到“灵巧”:看年轻人如何助力机器人“进化”成长
更让小郑有收获的是,她觉得在陪伴、训练机器人的过程中,自己也在飞速成长。“去年,我们还主要在探索通过视觉和文本的判断来调用不同模型,构建一个‘大脑控制小脑’的简易系统;而到了今年,我们已经能够在多种异构机器…

2025-12-13