谷歌近日正式发布了新一代图像生成模型Nano Banana 2,该模型基于Gemini 3.1 Flash Image架构开发,在响应速度、语义理解能力以及提示词解析精准度方面实现显著提升。相较于前代产品,新模型不仅优化了核心性能,还针对性解决了中文用户长期面临的字符显示异常问题。
技术团队重点改进了模型的多语言处理能力,通过优化字符编码机制,成功消除此前版本中普遍存在的中文乱码现象。测试数据显示,在处理复杂语义的中文提示时,新模型的文本还原准确率提升至98.7%,同时有效减少了画面中出现非预期伪影的概率。针对角色一致性难题,开发人员引入动态特征绑定技术,使模型能够在跨图像生成时保持最多5个角色形象的高度统一。
在图像质量维度,Nano Banana 2将输出分辨率上限从2K提升至4K,并支持单张画面融合多达14个独立元素。通过改进的注意力分配算法,模型能够更精准地解析包含多重条件的复杂提示,例如"在雨夜的城市街道上,穿着红色风衣的长发女子牵着金毛犬,背景需包含霓虹招牌和复古路灯"这类详细描述。
该模型将通过分阶段部署策略逐步替代旧版本,首批上线平台包括谷歌Gemini智能助手、Google AI Studio开发环境以及Google Flow创意工具套件。商业用户可通过付费API接口调用增强版功能,广告客户则能在Google Ads系统中直接使用模型生成营销素材。开发团队透露,后续版本计划引入3D场景构建能力,并优化对小众语言的支持效率。