【发现者网】8月2日消息,meta公司近日发布了一款名为AudioCraft的生成式AI工具,旨在帮助用户通过文本提示创作音乐和音频。这款工具包含三个核心组件,分别是MusicGen、AudioGen和EnCodec(改进版)。
据官方介绍,MusicGen是通过meta拥有或特别授权的音乐进行训练,能够根据文本提示生成音乐。这对音乐家和声音设计师来说,将是一个富有灵感的创作助手,能够将他们的创意与已有旋律转化为完整的乐曲,极大地拓展了音乐创作的可能性。
同时,AudioGen是另一个重要组件,它是通过公共音效进行训练生成音频或扩展现有音频。通过这个功能,用户能够在创作中使用更多元化的音频素材,例如狗叫、汽车鸣笛、木地板上的脚步声等,从而丰富音频的表现形式。
EnCodec(改进版)作为一种基于神经网络的音频压缩解码器,可生成更高质量的音乐并减少人工痕迹,还可以对音频文件进行无损压缩。这一技术的应用,有助于提高生成音频的质量,同时减少了人工编辑的必要性,使得创作更加高效。
meta公司表示,他们希望通过开源这一系列的AudioCraft模型,能够激发更多研究人员和从业人员参与,使用自己的数据集来训练模型,以满足不同领域的需求。这些模型被宣称能够长期稳定地生成高质量音频,而且易于使用,将为音乐家和声音设计师提供新的灵感,助力他们在创作过程中快速集思广益,不断以新的方式迭代作品。