OpenAI推出gpt-image-1.5：对标谷歌Nano Banana，成本更低性能更强-文化传媒-发现者网

OpenAI近日正式发布新一代图像生成模型gpt-image-1.5，这款被视为直接对标Google Gemini Nano Banana系列的产品，标志着其在AI图像生成领域的技术布局进入新阶段。新模型不仅面向开发者开放API接口，更全面接管ChatGPT的图像生成功能，成为普通用户创作工具的核心引擎。

技术突破方面，gpt-image-1.5在多个维度实现显著提升。据OpenAI披露，新模型在图像编辑精细度、品牌标识与面部特征的还原度上表现突出，尤其擅长处理复杂指令场景。针对文字生成这一行业痛点，模型优化了密集文本与小字号字体的清晰度，在保持语义准确性的同时大幅提升视觉效果。测试数据显示，在相同质量参数下，新模型生成速度较前代提升最高达4倍，编辑响应延迟降低60%。

开发者生态建设成为本次发布的另一重点。新模型采用阶梯式定价策略，图像生成与编辑的计费标准较gpt-image-1降低约20%，同时保留quality参数调节功能。OpenAI强调，即使在低质量设置下，模型仍能维持商业级输出效果，这为预算敏感型应用提供了更多选择。目前，开发者可通过API文档快速集成图像生成能力，覆盖电商、广告、内容创作等多元场景。

普通用户将直接感受到功能升级带来的体验跃迁。ChatGPT内置的图像工具现已全面切换至gpt-image-1.5引擎，用户可在保持画面主体特征（如光线、构图、人物轮廓）不变的前提下，实现精准修改。例如调整服装颜色、替换背景元素或修改文字内容等操作，均能以更自然的过渡效果完成。OpenAI产品负责人表示，这种"无损编辑"能力将重新定义人机协作的创作流程。

市场竞速态势愈发激烈。Google今年9月推出的Gemini Nano Banana系列凭借强大的画面控制力迅速占领开发者市场，其后续升级版Nano Banana Pro更通过整合多模态推理能力，在生成一致性方面树立新标杆。面对竞争，OpenAI选择以技术迭代速度与生态开放度构建护城河。行业分析师指出，两家公司的模型迭代周期已缩短至季度级别，这种"贴身肉搏"正推动整个AI图像生成赛道加速成熟。

据内部人士透露，gpt-image-1.5的研发团队重点优化了模型架构中的注意力机制，通过动态权重分配提升对局部细节的关注度。这种技术路线与Google的扩散模型形成差异化竞争，在特定场景下展现出独特优势。随着双方技术军备竞赛升级，用户有望在未来获得更强大的创作工具，而开发者生态的繁荣也将催生更多创新应用。

阿里创投与马云减持华谊兄弟股份持股比例跌破5%关口

2025-12-18

豪威科技OP03021 LCOS面板亮相：高分辨率低功耗助力智能眼镜新体验

IT之家 12 月 17日消息，半导体技术研发企业豪威科技（OMNIVISION）推出了业内首款单芯片超低功耗硅基液晶（LCOS）小尺寸面板，专为下一代智能眼镜打造。KGOnTech 公司总裁卡尔・古塔格…

2025-12-18

2025蓝牙耳机怎么选？五大品牌凭技术口碑脱颖而出，总有一款适合你

在2025年的音频市场中，消费者对于“好耳机”的定义已经从单一的音质追求，转向了佩戴舒适度、AI智能化以及全场景适应能力的综合考量。从Sanag塞那在AI音频与开放式佩戴领域的突破，到索尼、Bose在降噪算法…

2025-12-17

阿里创投与马云减持华谊兄弟股份持股比例双双降至5%以下

2025-12-17

A股午后强势反攻！沪深300ETF与A500ETF资金流向藏玄机

2025-12-17