发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 AI大模型 汽车出行 热点资讯

OpenAI推出gpt-image-1.5:对标谷歌Nano Banana,成本更低性能更强

2025-12-18来源:快讯编辑:瑞雪

OpenAI近日正式发布新一代图像生成模型gpt-image-1.5,这款被视为直接对标Google Gemini Nano Banana系列的产品,标志着其在AI图像生成领域的技术布局进入新阶段。新模型不仅面向开发者开放API接口,更全面接管ChatGPT的图像生成功能,成为普通用户创作工具的核心引擎。

技术突破方面,gpt-image-1.5在多个维度实现显著提升。据OpenAI披露,新模型在图像编辑精细度、品牌标识与面部特征的还原度上表现突出,尤其擅长处理复杂指令场景。针对文字生成这一行业痛点,模型优化了密集文本与小字号字体的清晰度,在保持语义准确性的同时大幅提升视觉效果。测试数据显示,在相同质量参数下,新模型生成速度较前代提升最高达4倍,编辑响应延迟降低60%。

开发者生态建设成为本次发布的另一重点。新模型采用阶梯式定价策略,图像生成与编辑的计费标准较gpt-image-1降低约20%,同时保留quality参数调节功能。OpenAI强调,即使在低质量设置下,模型仍能维持商业级输出效果,这为预算敏感型应用提供了更多选择。目前,开发者可通过API文档快速集成图像生成能力,覆盖电商、广告、内容创作等多元场景。

普通用户将直接感受到功能升级带来的体验跃迁。ChatGPT内置的图像工具现已全面切换至gpt-image-1.5引擎,用户可在保持画面主体特征(如光线、构图、人物轮廓)不变的前提下,实现精准修改。例如调整服装颜色、替换背景元素或修改文字内容等操作,均能以更自然的过渡效果完成。OpenAI产品负责人表示,这种"无损编辑"能力将重新定义人机协作的创作流程。

市场竞速态势愈发激烈。Google今年9月推出的Gemini Nano Banana系列凭借强大的画面控制力迅速占领开发者市场,其后续升级版Nano Banana Pro更通过整合多模态推理能力,在生成一致性方面树立新标杆。面对竞争,OpenAI选择以技术迭代速度与生态开放度构建护城河。行业分析师指出,两家公司的模型迭代周期已缩短至季度级别,这种"贴身肉搏"正推动整个AI图像生成赛道加速成熟。

据内部人士透露,gpt-image-1.5的研发团队重点优化了模型架构中的注意力机制,通过动态权重分配提升对局部细节的关注度。这种技术路线与Google的扩散模型形成差异化竞争,在特定场景下展现出独特优势。随着双方技术军备竞赛升级,用户有望在未来获得更强大的创作工具,而开发者生态的繁荣也将催生更多创新应用。

豪威科技OP03021 LCOS面板亮相:高分辨率低功耗 助力智能眼镜新体验
IT之家 12 月 17日消息,半导体技术研发企业豪威科技(OMNIVISION)推出了业内首款单芯片超低功耗硅基液晶(LCOS)小尺寸面板,专为下一代智能眼镜打造。KGOnTech 公司总裁卡尔・古塔格…

2025-12-18

2025蓝牙耳机怎么选?五大品牌凭技术口碑脱颖而出,总有一款适合你
在2025年的音频市场中,消费者对于“好耳机”的定义已经从单一的音质追求,转向了佩戴舒适度、AI智能化以及全场景适应能力的综合考量。从Sanag塞那在AI音频与开放式佩戴领域的突破,到索尼、Bose在降噪算法…

2025-12-17

科创50ETF富国(588940)午间收涨0.60% 成交额超1295万元 重仓股涨跌互现
来源:新浪基金∞工作室 12月17日,截止午间收盘,科创50ETF富国(588940)涨0.60%,报1.333元,成交额1295.99万元。科创50ETF富国(588940)重仓股方面,中芯国际截止午盘涨0…

2025-12-17