发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 产业互联网 AI大模型 汽车出行

苹果AI研究揭秘:简单算术竟难倒20多个顶尖模型,AI真能超越人类智慧?

2024-11-02来源:ITBEAR编辑:瑞雪

近日,苹果公司内部研究团队揭露了一个令人惊讶的发现:即便是目前最尖端的AI模型,在处理包含干扰信息的简单算术问题时,表现竟不如小学生。这一结果引发了关于人工智能真实能力的新一轮讨论。

据《洛杉矶时报》报道,苹果团队采用了一道涉及猕猴桃采摘数量的算术题进行测试。题目描述了一个简单的场景:Oliver在三天内采摘了不同数量的猕猴桃,其中还包括了一些额外的、与总数计算无关的信息。然而,就是这样一个看似简单的问题,却让20多个高级AI模型纷纷“栽跟头”。

正确答案应为190个猕猴桃,但多数AI模型给出的答案却是185个。研究发现,这些模型在处理问题时,难以忽略那些看似相关、实则无关的干扰信息,如“其中有5个猕猴桃的块头要比平均值要小”。这一细节虽不影响总数的计算,却成功迷惑了众多AI。

苹果团队进一步指出,这一问题的根源在于,当前的AI模型主要依赖于训练数据中的语言模式进行推理,而非真正理解了数学概念本身。这意味着,在面对稍微复杂或包含非典型信息的问题时,AI的“智能”可能就会变得不再可靠。

值得注意的是,苹果的研究并非旨在全盘否定AI的价值。相反,他们希望通过这一发现,提醒人们在热情拥抱AI技术的同时,也应保持理性的认知和审慎的态度。简单的数据扩展或计算能力提升,并不能从根本上解决AI在逻辑推理方面的局限性。

此次研究不仅揭示了AI模型在处理复杂问题时的潜在弱点,也为未来AI技术的发展提供了新的思考方向。随着技术的不断进步,我们期待看到更加智能、更加可靠的AI系统出现。

北京发布第五轮拟供应商品住宅项目清单,涉及7宗地
11月1日,北京市规划自然资源委发布2024年度第五轮拟供应商品住宅用地清单,共涉及7宗地,土地面积约32公顷,建筑规模约78万平方米,将于11月30日前供应。据悉,本轮次项目全部位于轨道交通站点1000米范…

2024-11-02

德意志银行分析师Michael Hsueh:如果哈里斯获胜,金价可能会最初遭到抛售,但跌势将会是短暂的。哈里斯获胜导致美元下跌
可能会提高中国和印度等国的购买力,而经济增长放缓的前景也可能促使美国加快降息从而提振金价。…

2024-11-02

股票型公募基金前十月分红额同比增超160%
今年前10个月,公募基金分红整体金额与次数同比提升。公募排排网统计数据显示,今年前10个月,公募基金合计分红5008次,共1598.97亿元,分别同比增加9.42%、2.39%,分红产品覆盖到140家公募机构…

2024-11-02

造车新势力10月份交付量“涨”声一片,增程车型“领跑”
11月1日,国内造车新势力相继交出了2024年“银十”答卷。总体来看,10月份大部分品牌的销量均实现同比与环比双增长。全国乘用车市场信息联席会表示:“金九银十”是车市的传统旺季,同时,国家报废更新政策及各地方…

2024-11-02

今年砸2000亿明年还加码!三季报曝光硅谷四巨头豪赌AI手笔
本周出炉的三季度财报告诉我们一件大事:不管目前得到的回报相比投入有多不成正比,微软、谷歌母公司Alphabet、亚马逊和Meta四家科技巨头押注人工智能(AI)的脚步都不会放慢,明年甚至还会加码。 …

2024-11-02