马斯克xAI新模型Grok 4.2公测，通过趣味测试，回答风格似“老马”亲临-文化传媒-发现者网

马斯克旗下xAI公司推出的Grok 4.2公测Beta版在争议声中悄然上线。这款参数规模仅500B的模型，与当前动辄数万亿参数的行业主流形成鲜明对比，其市场表现呈现出两极分化的态势——部分用户盛赞其创新功能，另一派则直言性能不及预期。

面对质疑声浪，马斯克在社交平台展开密集公关行动。他不仅连续转发十余条夸赞推文，更亲自下场承诺："公测将持续至下月，正式版将比Grok 4快得多、聪明得多。"据其透露，模型具备每周自我迭代的独特能力，未来将形成固定更新节奏。这一表态与xAI联合创始人近期离职引发的动荡形成微妙对比，此前外界甚至猜测项目可能难产。

技术特性方面，Grok 4.2首次引入实时反馈优化机制。与传统静态更新模式不同，新模型能根据用户交互数据持续调整性能。在弱智吧风格测试题"50米外洗车店该开车还是步行"中，该模型展现出逻辑推理能力，顺利通过考验。不过官方至今未公布完整技术报告，仅在排行榜释放有限评测数据，导致讨论多集中于使用体验而非技术细节。

用户反馈呈现明显分化。批评者指出，在处理复杂逻辑问题时，500B参数规模明显力不从心，怀疑所谓"横扫榜单"成绩来自特定实验环境优化。更有开发者测算其使用成本高于竞品模型。支持阵营则强调代码生成速度和多模态处理能力，特别提及该模型通过"Caitlyn Jenner测试"——这道曾让ChatGPT和Gemini折戟的性别认知题，成为Grok 4.2的亮点战绩。

争议焦点还涉及模型偏见问题。尽管马斯克宣称Grok 4.2保持中立，但测试显示其回答倾向与创始人观点高度吻合。对此马斯克回应称："这还是个宝宝模型"，并预告中大型版本即将推出。AI工程师Mark Krechman的爆料得到本人转发确认——当前版本实为"精简版"，完整功能尚未释放。

在模型发布同期，xAI还推出Grok imagine视频生成模板，目前仅限iOS用户体验。这款马年主题创作工具，为争议中的产品矩阵增添新变量。随着公测推进，每周迭代机制能否兑现承诺，将成为决定Grok 4.2命运的关键因素。

景洪春节消费市场热力足：商品丰富服务暖年味满溢购销旺

2026-02-18

我国科研新突破：首个集成光量子芯片量子密钥分发网络构建成功

北京大学物理学院教授王剑威、中国科学院院士龚旗煌等研究团队，研发出系列高性能、全功能集成的光量子芯片，并在此基础上成功构建包含20个量子芯片节点的双场量子密钥分发网络。实验表明，团队研发的光量子芯片在晶圆级…

2026-02-18

苹果可穿戴设备新布局：智能眼镜、AI吊坠等齐发力，拓展交互新场景

2月18日消息，据macworld援引彭博社报道称，苹果公司正全力推进三款新型人工智能驱动的可穿戴设备研发，包括一款高端智能眼镜、一款AI吊坠配件，以及配备红外摄像头和隔空手势功能的新一代AirPods。设备…

2026-02-18

岁末冬日暖意浓庙坝镇集体分红绘就共富新篇章
2026-02-18

从电商到实体：江陵在女装赛道如何以新模式谋稳定发展？

2026-02-18

宇树人形机器人“武”动春晚：黑科技赋能，开启产业化新征程

在节目中，数十台机器人在舞台上完成复杂队形变换、快速跑位、对招互动，甚至在高强度动作后仍能精准归位，这一切的背后，离不开宇树自主研发、全新升级的高并发集群控制系统的支撑。以多机协同系统为例，支撑整场武术表…

2026-02-18

宜兴实体店短视频营销秘籍：扎根本地生活，用真实场景引爆客流

2026-02-18

新春消费避坑指南：年夜饭预订“五问清” 年货采购“三防范”

2026-02-18