发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

OpenAI科学家震惊TED大会:让AI模型思考20秒,提升10万倍性能!

2024-10-25来源:华尔街见闻编辑:瑞雪

今天凌晨,知名科技媒体Venturebeat消息,OpenAI高级研究科学家、德扑AI之父Noam Brown,在美国旧金山举办的TED AI大会上提出了一个震惊的理论——让AI模型思考 20 秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。

最初,Brown也被这个结果吓到了,还写了多篇论文来验证其真实性。他发现“系统二思维”( System 2 thinking)才是让AI模型性能大幅度提升的关键所在。而OpenAI最新发布的o1模型同样引入了这个技术概念,并且获得了非常出色的性能提升。

Brown在演讲中表示,过去5年AI能获得巨大提升可以用一个词来概括——规模。但如今的前沿AI模型仍基于 2017年推出的Transformer架构,主要区别在于数据规模和计算能力。

现在是时候进行训练、推理范式转变了,AI模型需要超越单纯的数据预处理,进入 “系统二思维”模式,以一种更慢、更审慎的拟人化推理形式来解决超复杂的难题。

系统二思维介绍

“系统二思维”是一个心理学概念,描述了人类处理复杂问题时所采用的深度思考方式。这个概念最初由心理学家Daniel Kahneman在他的著作《思考,快与慢》中提出,用来解释人类大脑的两种不同的思考模式。

在Kahneman的理论中,系统一思维是快速、直觉、自动的,它处理日常的、熟悉的任务,比如识别熟悉的面孔或者理解简单的句子。

这种思维方式不需要我们有意识地思考,它依赖于我们的直觉和经验,但有时也可能导致错误,因为它不涉及深入的逻辑推理。

而系统二思维则是缓慢、逻辑、努力的,它涉及到深思熟虑、计算和推理。当我们面对复杂的、新颖的或者需要深入分析的问题时,就会启动系统二思维。这种思维方式需要我们集中注意力,消耗更多的认知资源,但它可以帮助我们做出更准确和深思熟虑的决策。

Brown直接将这个概念应用到AI领域,提出了一个革命性的想法:通过模拟人类的系统二思维,AI模型可以在不增加大量数据或计算资源的情况下显著提升性能。

以他开发的战胜人类的德扑AI Libratus为例,仅让AI在每手牌中思考20秒,就能获得与将模型扩大100,000倍相同的性能提升。这种方法的核心在于让AI模型在做出决策前进行更深入的分析和推理,而不是仅仅依赖于大规模数据和计算。

而OpenAI最新发布的o1模型同样引入了系统二思维,能够进行深度推理,模仿人类逐步解决问题的过程,通过自我对弈等强化学习训练方式提升推理能力。

例如,在国际数学奥林匹克资格考试中,o1 模型凭借系统二思维准确推理复杂数学公式取得 83%的准确率,远高于GPT - 4o的13%。这对于金融、医疗、科研、编码等对数据要求严谨的行业来说非常重要。

所以,系统二思维对于增强大模型的能力有很多好处,使其能够更好地适应新的、未见过的任务和环境。在面对错误、不确定性和异常情况时,系统二思维还可以帮助大模型变得更加鲁棒,因为它鼓励模型采取更加谨慎和保守的策略。而在人机交互方面,模拟系统二思维能帮助大模型可以更好地理解和预测人类用户的需求和意图,从而改善交互体验。

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

光联携手利元亨,共话新能源制造AI时代网络新路径与新机遇
聚焦企业在全球范围内的多分支互联与云IDC接入问题,方案基于光联自建全球光纤骨干网络及华为SD-WAN设备,支持MPLS、Internet与4G/5G等多种链路融合,并可弹性部署多种拓扑模型,实现总部、分支…

2025-11-15

恒为科技:从可视化到智算,让复杂算力“看得见、管得住”
这家公司从 2003 年起步,长期在“网络可视化”和“智能系统平台”两条看似技术化的赛道上耕耘,逐步在运营商、科研院所、大型行业客户中建立信任与交付能力。它不像爆款公司那样靠一款产品跑路,而是靠一条条项目、…

2025-11-15

6寸LCD显示屏:小身材大能量,技术优势与多元应用前景深度剖析
采用IPS等先进技术的6寸LCD屏,能够实现更广色域覆盖,色彩显示真实自然,更适用于图像监控、医疗设备显示、智能终端等对色彩还原要求较高的场合。 随着技术的不断发展,6寸LCD显示屏将在未来呈现更高清、更智…

2025-11-14

5.5G辐射危害健康?物理学者:比太阳光频率低,基站越密越安全
我当时听了都愣了,太阳光那不是好东西吗,怎么还跟信号辐射扯一块儿了? 最有意思的是,他说大家都觉得基站多了辐射就大,这完全是搞反了。之前吵得最凶的那个阿姨,现在天天用5.5G跟外地的孙子视频,还跟邻居说这新基…

2025-11-14

苹果设备与电信流量卡全攻略:从兼容到技巧,助你畅享无忧网络
•运营商网络覆盖差异•手机版本支持频段不同•套餐类型与设备性能不匹配最新的iPhone 14系列甚至已经支持电信的5GSA组网,网速体验绝对令人惊艳!

2025-11-12

企业宽带选不对,带宽再大也白费!这些关键因素决定实际网速
• 网速(用户感知):即实际访问体验,取决于 3 个核心因素 —— 带宽只是基础,更重要的是网络质量、路由优化和并发处理能力。 真正专业的服务商,会从企业实际业务场景出发提供解决方案,而非一味推销高带宽产品…

2025-11-12

爱立信完成上行L4S技术测试,为5G时延敏感业务提供网络支撑
(全球TMT2025年11月11日讯)近日,在IMT-2020(5G)推进组的组织下,爱立信成功完成了上行L4S技术测试,验证了L4S在提升上行实时交互业务体验方面的显著效果。测试结果表明,L4S技术能够有效…

2025-11-11

上海贝尔发布《2025年AI-ICT赋能与重构白皮书》:剖析趋势、需求与战略方向
《2025年AI-ICT赋能与重构白皮书》由上海贝尔发布,系统剖析了AI与ICT产业融合的核心趋势、技术需求及战略方向,展现了全球AI发展浪潮下ICT基础设施的变革路径与机遇。实施路径上,需夯实数据与模型基础…

2025-11-11

海外游语言障碍终结者:时空壶新T1离线翻译,精准适配复杂场景
时空壶新T1翻译机凭借端侧AI翻译技术与全面的离线功能配置,成为假期中解决无网沟通难题的关键设备,其技术设计精准匹配了海外旅行中的复杂网络环境。这种“离线核心+在线补充”的双模式设计,精准命中了国庆海外游中“…

2025-11-11