发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

Meta闭源新篇:Muse Spark“偏科”逆袭,AI赛道开启新角逐?

2026-04-10来源:快讯编辑:瑞雪

meta全新大模型Muse Spark的登场,犹如一颗重磅炸弹投入科技圈,激起层层涟漪。这款内部代号为Avocado的模型,不仅是meta超级智能实验室(MSL)成立9个月后的首个成果,更是扎克伯格在经历Llama 4的挫折后,大刀阔斧进行组织与战略调整后的首份答卷。令人意外的是,曾经高举“开源对抗闭源”大旗的meta,此次给Muse Spark贴上了“闭源”标签,API也仅向少数指定合作伙伴开放预览。

回顾Llama 4的发布,可谓开局不利。它承载着meta的厚望,却很快陷入信誉危机。社区质疑声不断,更有爆料称meta在基准测试中弄虚作假,用针对特定任务微调的“特供版”刷榜,而普通用户使用的版本表现大相径庭。这一事件对meta AI品牌造成了致命打击,就连图灵奖得主、meta前首席科学家Yann LeCun离职后也承认,Llama 4的测试结果“确实被修饰了一点”。

扎克伯格对此怒不可遏,据外媒报道,他对相关人员失去信心,直接架空了整个生成式AI团队,大批人员离开。这不仅仅是某个模型的失败,更意味着过去从模型架构到研发流程,从开源路线到组织文化的道路可能都行不通了。扎克伯格面临艰难抉择,最终选择全部推翻,在废墟上重建。

2025年夏天,扎克伯格做出震惊硅谷的决策,以143亿美元的天价拿下数据标注巨头Scale AI 49%的无投票权股份。更关键的是,时年不到30岁的华裔创始人Alexandr Wang被请进meta,出任首席AI官,统管全新组建的MSL。这位MIT辍学、19岁创立Scale AI、26岁跻身亿万富豪行列的年轻人,被扎克伯格评价为“同辈创业者中最杰出的一位,深刻理解超级智能的历史重要性”。

Alexandr Wang上任后雷厉风行,从OpenAI、谷歌DeepMind、Anthropic等竞争对手那里,以天价薪酬挖来一整支“复仇者联盟”。翻看MSL首批11人名单,7位核心研究员都有华人背景,包括浙大校友毕树超、清华校友赵晟佳、中科大校友于佳慧等业内顶尖高手。这支“亿元天团”的目标明确,就是从零开始,重写meta的AI命运。

Muse Spark究竟实力如何?meta此次态度格外坦诚,在官方博客里列出了一张优缺点分明的成绩单。在医疗和视觉多模态领域,Muse Spark表现堪称惊艳。在极高难度的医学开放式问答评测HealthBench Hard中,它取得42.8分,而GPT - 5.4只有40.1分,Gemini 3.1 Pro仅20.6分,差距明显。这得益于meta与超过1000名专业医生合作整理训练数据,为模型配备了强大的专家顾问团。在科研论文图表的深度理解测试(CharXiv Reasoning)中,Muse Spark以86.4分力压GPT - 5.4的82.8和Gemini 3.1 Pro的80.2。

Muse Spark的应用场景也十分丰富。官方案例显示,对着食物拍照,它能分析出每种食物的卡路里;能识别瑜伽动作,指出发力肌群并纠正姿态;甚至还会操作咖啡机。可以想象,若应用在AI眼镜上,将带来极大便利。

然而,Muse Spark并非完美无缺。在纯逻辑推理和代码编程方面,它的表现不尽如人意。在ARC AGI 2抽象推理测试中,仅拿到42.5分,与Gemini 3.1 Pro(76.5分)和GPT - 5.4(76.1分)差距巨大。在软件工程实测(SWE - bench Pro)中,通过率(52.4%)也略逊于GPT - 5.4的57.7%。

Muse Spark背后真正令人瞩目的,是meta公布的一项技术数据。在新重建的技术栈下,它达到与上一代Llama 4 Maverick同等性能水平所需的计算量,减少了超过一个数量级,实现了10倍以上的效率跃升。这得益于MSL团队提出的“思维压缩”(Thought Compression)核心技术。在强化学习训练阶段,引入“思考时间惩罚”机制,模型回答问题时若思考过久就会被“扣分”,从而被迫进化,学会用更少的推理token、更短的逻辑链条解决复杂问题,且准确率不降反升。Muse Spark还推出多Agent并行推理的“沉思模式”(Contemplating Mode),传统推理模式是一个模型独自思考,而它是同时拉起多个子智能体处理不同维度信息后汇总,在相近响应时间内,在Humanity‘s Last Exam等评测中表现出色。

Muse Spark虽不完美,但用9个月时间将meta从Llama 4的舆论困境中拉出,重新回到与GPT - 5.4、Gemini 3.1 Pro同场竞技的第一梯队。对于扎克伯格和这支“华人天团”来说,它更像是一个宣言,标志着靠开源攒口碑的meta已成为过去,一个更务实、更有技术野心的新meta正崭露头角。

移远通信新专利:通信方法创新,助力网络设备简化多层传输扩频码关联
国家知识产权局信息显示,上海移远通信技术股份有限公司申请一项名为“通信方法、终端设备及网络设备”的专利,公开号CN121842715A,申请日期为2025年12月。通过天眼查大数据分析,上海移远通信技术股份有…

2026-04-10

局域网联机总掉线?掌握这些方法轻松搞定内网穿透与连接稳定难题
利用网络检测工具确认NAT类型,提前预判打洞是否具备可行性 重启路由器及游戏客户端,清理积压的网络缓存调整游戏内网络参数,比如变更服务器节点或连接模式 确认所有玩家均为相同的游戏版本,避免因版本差异导致…

2026-04-10

山东拓新电气获破碎机与梭车联动控制专利,提升作业效率有新招
国家知识产权局信息显示,山东拓新电气有限公司取得一项名为“一种破碎机与梭车联动的控制系统”的专利,授权公告号CN224109788U,申请日期为2025年6月。企业注册资本5000万人民币。 声明:市场有风险…

2026-04-10