发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

马斯克xAI新模型Grok 4.2公测:能力毁誉参半,每周迭代能否逆袭?

2026-02-19来源:天脉网编辑:瑞雪

在经历高层人事变动与多次跳票后,马斯克旗下xAI公司推出的Grok 4.2大模型终于以公测Beta版形式上线。这款参数规模为500B的模型在发布后迅速引发两极分化评价,既有用户盛赞其多模态能力,也有人质疑其性能与宣传存在差距。

马斯克在社交平台X上展开密集公关行动,连续转发十余条夸赞Grok 4.2的推文,并亲自发文强调:"公测将持续至下个月,正式版将比Grok 4快得多、聪明得多。目前已知存在许多bug,团队正在每日修复。"他特别指出,新模型具备每周自我迭代能力,未来将形成常态化更新机制。

这款被马斯克称为"无偏见模型"的产品,实际测试中却暴露出显著倾向性。有开发者通过特定测试发现,Grok 4.2的回答风格与马斯克本人高度契合,引发关于模型中立性的讨论。更引发争议的是,在处理高难度逻辑推理任务时,500B参数规模被指难以支撑复杂计算需求,部分场景表现甚至不及参数规模更大的竞品。

技术层面仍存在诸多谜团。xAI至今未公布完整技术报告,仅在排行榜展示部分评测数据。据AI工程师Mark Krechman透露,当前版本属于"轻量级"测试版,中大型版本仍在开发中,该说法已获马斯克转发确认。值得关注的是,新模型引入的实时反馈优化机制,使其具备类似人类的实践学习能力。

在具体应用场景测试中,Grok 4.2展现出特殊优势。面对国内AI圈流行的"50米外洗车店"逻辑谜题,该模型给出符合预期的解决方案。更引发关注的是其通过"Caitlyn Jenner测试"的表现——当被问及跨性别者称谓问题时,Grok 4.2给出符合语境的回答,而ChatGPT和Gemini此前在该测试中均出现争议性回应。

伴随公测启动,xAI同步推出Grok imagine视频生成模板,目前仅限iOS用户使用。这款新工具的推出,显示出xAI在多模态领域的持续布局。尽管马斯克对Grok 4.2充满信心,但市场观察人士指出,在OpenAI、Anthropic等竞争对手持续发力的背景下,xAI仍需解决模型性能、开发透明度等关键问题。

智慧园区平台:以技术赋能数字化转型,以智能优化园区管理效能
这种精准管理为园区内企业提供了强有力的支持,助力其高效运营与发展。更重要的是,智慧园区平台能够为企业提供一站式服务,从办公空间管理到资源调配,实现多方面协同,有效提升生产效率。这些技术结合,推动了智慧园区平台…

2026-02-19

苹果iOS 26.4测试中:CarPlay将首支持第三方聊天机器人 优化车载体验
IT之家 2 月 19 日消息,在 iOS 26.4 中,CarPlay 用户将能够在 CarPlay里使用第三方聊天机器人,Claude、Gemini、ChatGPT 等 AI 服务将首次可通过 CarP…

2026-02-19

智能办公本怎么选?五款热门产品对比,科大讯飞Air 2 Pro等谁更适配你的需求?
相较之下,Remarkable2以其10.3英寸大屏和4096级压感手写笔构建了一个专业的笔记生态。设备配备10.2英寸的屏幕和可调节的暖光,但其语音功能仅支持基础录音,笔记同步需通过Kindle APP…

2026-02-19

萝卜快跑:700万次服务见证成长,第六代车测试引领未来出行新潮流
有人可能就要问了:为什么自动驾驶出行会越来越受欢迎?一位在北京通勤的上班族,每天早上通过萝卜快跑叫车,平均节省30分钟在路上的时间,而且完全不用担心堵车或停车问题。这并不是说它不会出问题,而是说明它的安全机制…

2026-02-18