【发现者网】11月30日消息,近日,Stability AI推出了Stable Diffusion XL Turbo(SDXL Turbo)。这一模型被宣称采用了“对抗性扩散蒸馏技术(Adversarial Diffusion Distillation)”,将图片生成的迭代步骤从之前的50步减少至仅1步,据称仅需进行一次迭代步骤就能生成高品质图像。
Stable Diffusion XL Turbo模型最引人注目的特点之一是其能够进行“即时文字转图像输出”,并且在保证图片质量的同时,大幅提高了生成效率。
该模型的“对抗性扩散蒸馏技术”以现有的大型图像扩散模型作为“教师网络”来指导生成过程。这种技术结合了“蒸馏技术”和“对抗训练”,其中“蒸馏技术”将大型模型的知识精炼到更小的模型中,而对抗性训练则通过改进模型以更好地模仿教师模型的输出。
在过去,模型蒸馏技术往往难以在效率和品质之间找到平衡。然而,Stable Diffusion XL Turbo通过“对抗性扩散蒸馏技术”实现了高效生成高品质图像的重要突破。
据发现者网了解,官方已将Stable Diffusion XL Turbo与多个不同的模型变体进行比较,包括StyleGAN-T++、OpenMUSE、IF-XL、SDXL和LCM-XL。通过两项实验,结果显示Stable Diffusion XL Turbo在大幅降低运算需求的同时,依然能够保持出色的图像生成品质。该模型仅进行一次迭代即可超越LCM-XL进行4次迭代的表现,而进行4次迭代的Stable Diffusion XL Turbo则胜过之前经过50步迭代配置的Stable Diffusion XL。在A100 GPU上,计算512x512分辨率的图像仅需207毫秒。
目前Stability AI已经将相关代码公布在Hugging Face,供个人和非商业用途使用。对于对该技术感兴趣的用户,可以访问相关网站获取更多信息。