谷歌尚未正式发布新品,但Gemini 3.2 Flash已在网页端悄然现身,被眼尖的开发者率先捕捉到这一动态。这款新模型在编码能力上表现惊艳,单次提示即可生成超过2200行代码,甚至能完成手搓Windows 98这样的复杂任务,性能远超此前版本,直接对标自家旗舰产品Pro。
最先发现异常的是一名Reddit用户。他在使用Gemini Canvas时注意到,生成的代码风格与Google AI Studio中同一模型的输出截然不同——前者能生成高质量、类似GPT风格的UI设计SVG,而后者仍保持朴素的老Flash风格。这一差异引发了开发者社区的广泛讨论,最终确认谷歌在后台偷偷切换了模型。
进一步挖掘发现,Google Cloud Console后端已出现名为“gemini-3.2-flash-lite-live-preview”的模型条目,而网页端也通过特定模式(如Thinking+Canvas)静默路由至这一新模型。许多开发者分享了触发方法,并进行了实测,结果令人震惊:在物理模拟3D场景测试中,Gemini 3.2 Flash仅凭单次提示,便用代码实现了气球透明光影、撞击反馈、水花粒子特效等复杂效果,甚至能生成细节丰富、可交互的PS5主机SVG。
编码能力的飞跃是Gemini 3.2 Flash的最大亮点。过去,Flash模型的代码输出量难以突破400-500行,而新版本轻松突破1000行,甚至能达到2200行。这种提升不仅体现在数量上,更体现在质量上——生成的代码结构清晰、功能完备,可直接用于实际项目。例如,有开发者在LM Arena上盲测3.2 Pro版本时,仅凭简单提示便还原了一个功能完整的Windows 98系统,包括拖拽窗口、联网浏览器、计算器、画图工具等经典应用,且所有功能均支持真实交互。
这一突破得益于谷歌DeepMind在模型蒸馏与稀疏化技术上的深耕。通过将大型语言模型(LLM)的精髓压缩至轻量化版本,Gemini 3.2 Flash打破了“模型变小、性能雪崩”的行业魔咒。据传,基准测试显示,新模型在核心代码与推理任务上的性能已接近GPT-5.5的92%,而推理成本却降低了15-20倍,大多数查询的响应延迟被压缩至200毫秒以内。
除了模型本身的升级,Gemini App的生态整合也在加速推进。目前,该应用已接入GitHub、OpenStax、Spotify、WhatsApp等第三方服务,并支持Canva、Instacart、OpenTable等应用的集成。用户可直接在Gemini中完成设计请柬、查询库存、预订餐厅等操作,无需切换应用。例如,通过Canva集成,用户只需一句指令,Gemini便能调用Canva完成设计,或生成图片后一键推送至Canva编辑;通过Instacart集成,用户可上传菜谱链接,自动将所需食材添加至购物车。
谷歌的野心不止于此。随着I/O大会临近,更多新品信息陆续曝光,包括全天候在线的Agent(Gemini Spark/Remy)、支持视频生成与编辑的Gemini Omni、深度融入视频技术栈的Veo升级版,以及性能进一步提升的Gemini 3.5 Pro等。这些产品共同构成了谷歌的“AI全家桶”,旨在打造一个能打电话、订餐、设计、购物的全能AI管家,将所有功能整合至一个对话窗口中。
然而,谷歌的追赶之路并非一帆风顺。OpenAI正在筹备GPT-5.6,Anthropic的下一代模型也蓄势待发。此前有爆料称,Gemini新模型虽对标GPT-5.5,但与Claude Mythos仍有差距。有评论直言:“谷歌不能再只是追赶了,它需要超越。”对于这家拥有最强基础设施、最大用户基数和最全产品矩阵的科技巨头而言,如何在模型性能上实现真正领先,将是其在I/O大会上必须回答的问题。


