发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

马斯克xAI新模型Grok 4.2公测,通过趣味测试,回答风格似“老马”亲临

2026-02-18来源:天脉网编辑:瑞雪

马斯克旗下xAI公司推出的Grok 4.2公测Beta版在争议声中悄然上线。这款参数规模仅500B的模型,与当前动辄数万亿参数的行业主流形成鲜明对比,其市场表现呈现出两极分化的态势——部分用户盛赞其创新功能,另一派则直言性能不及预期。

面对质疑声浪,马斯克在社交平台展开密集公关行动。他不仅连续转发十余条夸赞推文,更亲自下场承诺:"公测将持续至下月,正式版将比Grok 4快得多、聪明得多。"据其透露,模型具备每周自我迭代的独特能力,未来将形成固定更新节奏。这一表态与xAI联合创始人近期离职引发的动荡形成微妙对比,此前外界甚至猜测项目可能难产。

技术特性方面,Grok 4.2首次引入实时反馈优化机制。与传统静态更新模式不同,新模型能根据用户交互数据持续调整性能。在弱智吧风格测试题"50米外洗车店该开车还是步行"中,该模型展现出逻辑推理能力,顺利通过考验。不过官方至今未公布完整技术报告,仅在排行榜释放有限评测数据,导致讨论多集中于使用体验而非技术细节。

用户反馈呈现明显分化。批评者指出,在处理复杂逻辑问题时,500B参数规模明显力不从心,怀疑所谓"横扫榜单"成绩来自特定实验环境优化。更有开发者测算其使用成本高于竞品模型。支持阵营则强调代码生成速度和多模态处理能力,特别提及该模型通过"Caitlyn Jenner测试"——这道曾让ChatGPT和Gemini折戟的性别认知题,成为Grok 4.2的亮点战绩。

争议焦点还涉及模型偏见问题。尽管马斯克宣称Grok 4.2保持中立,但测试显示其回答倾向与创始人观点高度吻合。对此马斯克回应称:"这还是个宝宝模型",并预告中大型版本即将推出。AI工程师Mark Krechman的爆料得到本人转发确认——当前版本实为"精简版",完整功能尚未释放。

在模型发布同期,xAI还推出Grok imagine视频生成模板,目前仅限iOS用户体验。这款马年主题创作工具,为争议中的产品矩阵增添新变量。随着公测推进,每周迭代机制能否兑现承诺,将成为决定Grok 4.2命运的关键因素。

我国科研新突破:首个集成光量子芯片量子密钥分发网络构建成功
北京大学物理学院教授王剑威、中国科学院院士龚旗煌等研究团队,研发出系列高性能、全功能集成的光量子芯片,并在此基础上成功构建包含20个量子芯片节点的双场量子密钥分发网络。实验表明,团队研发的光量子芯片在晶圆级…

2026-02-18

苹果可穿戴设备新布局:智能眼镜、AI吊坠等齐发力,拓展交互新场景
2月18日消息,据macworld援引彭博社报道称,苹果公司正全力推进三款新型人工智能驱动的可穿戴设备研发,包括一款高端智能眼镜、一款AI吊坠配件,以及配备红外摄像头和隔空手势功能的新一代AirPods。设备…

2026-02-18

宇树人形机器人“武”动春晚:黑科技赋能,开启产业化新征程
在节目中,数十台机器人在舞台上完成复杂队形变换、快速跑位、对招互动,甚至在高强度动作后仍能精准归位,这一切的背后,离不开宇树自主研发、全新升级的高并发集群控制系统的支撑。 以多机协同系统为例,支撑整场武术表…

2026-02-18