发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

马斯克xAI新模型Grok 4.2公测,通过趣味测试,回答倾向引发热议

2026-02-18来源:快讯编辑:瑞雪

马斯克旗下xAI公司推出的Grok 4.2公测版近日悄然上线,尽管团队近期经历高层动荡,这款新模型仍成为科技圈焦点。与当前主流大模型动辄万亿参数的规模不同,Grok 4.2仅采用5000亿参数架构,这种"轻量化"设计在测试阶段引发了截然相反的评价。

马斯克在社交平台连续转发十余条用户好评,并亲自下场"公关":"当前版本仍有缺陷,但公测结束后将比前代快得多、聪明得多。模型具备每周自我迭代能力,未来会持续进化。"据技术团队披露,新架构引入实时反馈机制,使模型能像人类一样通过实践快速优化,这种动态更新模式区别于传统静态升级逻辑。

测试阶段暴露的争议尤为突出。支持者展示其通过"弱智吧"风格逻辑测试的案例——当被问及"50米外洗车店该开车还是步行"时,模型准确识别出距离过近的矛盾性。另有用户证实其成功通过涉及性别认知的敏感测试,这项曾让ChatGPT陷入争议的题目,成为Grok 4.2的加分项。代码生成和多模态处理能力也获得开发者认可,部分测试显示其响应速度超越竞品。

反对声音则聚焦于参数规模限制。深度用户指出,在处理复杂逻辑推理时,5000亿参数明显力不从心,有开发者调侃:"马斯克说的'横扫榜单'可能只在特定实验室环境成立。"更尖锐的批评指向模型偏见问题,测试显示多个回答与马斯克个人观点高度吻合,这与他宣称的"无偏见"原则形成反差。成本争议同样存在,有消息称其训练成本高于同类模型。

技术细节的缺失加剧了讨论的两极分化。xAI至今未发布完整技术报告,公开的评测数据仅限于部分排行榜成绩。这种信息透明度引发两种猜测:要么模型尚未成熟,要么团队在刻意保持神秘感。值得注意的是,马斯克转发确认了AI工程师Mark Krechman的爆料——当前版本只是"小尺寸"试水,中大型版本将在后续推出。

在模型公测同期,xAI还低调上线了Grok imagine视频生成工具,目前仅支持iOS平台。这项新功能与模型升级形成互补,显示出团队在多模态领域的布局野心。随着公测持续至下月,这场关于参数规模、更新模式与商业化的争论,或将因更多实测数据披露而迎来新转折。

春晚机器人成“顶流”!多款被秒抢一空,62万元高端款也瞬间售罄
如果我们能因为我们的一个作品,带动了一个产业的勃兴,带动了一个领域的这种破圈的关注度,这个我觉得是每一个创作者的荣耀。” 据悉,从确定仿生人形机器人要登上春晚开始,仅经过两个多月,松延动力就完成了从全栈自主研…

2026-02-18

苹果加速AI布局:智能眼镜、带摄像头AirPods及吊坠三款新品研发中
2026年2月18日,彭博社科技记者马克·古尔曼爆料称,苹果正加紧研发三款AI可穿戴设备:智能眼镜、带摄像头的AirPods耳机,以及一款可以作为项链佩戴或别在衣服上的吊坠。此外,这三款设备都可与iPhone…

2026-02-18

科沃斯T90与热门扫地机器人大比拼:谁才是智能清洁的优选答案?
为了更好地了解T90的市场地位,我们将与以下几款同类产品进行详细对比:iRobotRoombai7、石头科技S5Max、360扫地机器人和小米米家扫地机器人。总结来看,科沃斯T90凭借其智能导航、强劲清洁能力…

2026-02-18

马年春晚机器人成焦点!从武术到互动,AI深度融入,多款产品被抢空
宇树科技创始人王兴兴告诉央视新闻记者,今年机器人在快速奔跑中完成了穿插变阵和武术动作,这种高动态、高协同的集群控制技术是全球首次亮相,“这个动作非常实用,为后续机器人在其他场景集群或单台机器人调度做好了铺垫…

2026-02-18

2026春节临夏地质公园博物馆:探地质奇观,品古生物韵味,共赴新春之约
这里不仅展现了亿万年的地质传奇,更与新春的喜庆相结合,形成了独特的年味体验。 在这个寒假与新春交汇的时刻,博物馆推出了一系列精彩活动,包括“史前”NPC秘境漫游、国潮杂耍戏春擂台等,让每位游客都能在欢声笑语中…

2026-02-18