发现者网
产业经济 科技业界 3C数码 文化传媒 移动智能 家电行业 产业互联网 AI大模型 汽车出行

谷歌+UC伯克利合力开创IGN时代:单步生成逼真图像冲击扩散模型

2023-11-14来源:发现者网编辑:芳华

【发现者网】11月14日消息,近日,谷歌携手加州大学伯克利分校(UC Berkeley)宣布研发出一项革命性的生成式人工智能方法,名为幂等生成网络(IGN),该方法有望取代当前主流的扩散模型。

传统的生成式AI模型,如生成对抗网络(GAN)、扩散模型和一致性模型,通常以随机噪点、草图或低分辨率图像等为输入,通过多步骤映射到目标数据分布上。而扩散模型在训练期间学习目标数据分布,然后通过多步“去噪”处理生成图像。

谷歌的研究团队在新模型IGN中实现了全新的生成方式。IGN被形象地比喻为一种“全局投影仪”,能够从任何形式的输入数据中直接生成适应目标数据分布的图像,理想情况下只需一步即可完成。

与传统的生成对抗网络不同,IGN是一种“自我对抗”的模型,能够同时扮演生成器和鉴别器的角色。此外,与扩散模型相比,IGN能够在单个步骤中将输入映射到目标数据分布上,无需执行增量步骤。

研究人员使用MNIST和CelebA数据集展示了IGN的潜力,并展示了一些应用场景,包括将草图转换为逼真图像、从噪点生成图像以及修复损坏的图像等。据发现者网了解,这一创新为生成式AI领域带来了新的可能性,有望推动未来图像生成技术的发展。