吉网

Meta推出人工智能生成的音乐文本描述中的音频

导读 Meta和微软最近合作推出了新的Llama 2,这是一种尖端的大语言人工智能模型,促使 Meta 为 Instagram 开发生成人工智能工具,其中包括

Meta和微软最近合作推出了新的Llama 2,这是一种尖端的大语言人工智能模型,促使 Meta 为 Instagram 开发生成人工智能工具,其中包括一个用于检测人工智能生成内容的工具。

现在,Meta 在最近的一篇博客文章中介绍了其最新的人工智能工具 AudioCraft。

AudioCraft 是一款人工智能工具,可以根据文本描述生成高质量、逼真的音频和音乐。例如,它可以帮助小企业主轻松地将配乐添加到 Instagram 上的视频广告中。

该工具有望简化在内容创建中添加音乐的过程,使用户免于搜索合适歌曲的艰巨任务。

Meta 尚未在其平台上发布 AudioCraft,但他们正在将该工具的代码开源。

此举允许研究人员和从业者使用自定义数据集训练自己的模型,从而促进人工智能生成的音频和音乐的进步。

AudioCraft 由三个模型组成:MusicGen、AudioGen 和 EnCodec 的改进版本。MusicGen 专门从事音乐创作,并接受了包含 400,000 个音乐录音的庞大数据集的训练,并附有文本描述和元数据。

另一方面,AudioGen 根据书面声学场景描述生成逼真的环境声音。EnCodec 解码器可确保生成更高质量的音乐并减少问题。

Meta强调负责任创新的重要性,并承认他们的训练数据集缺乏多样性,特别是在音乐风格和语言方面。

通过分享 AudioCraft 的代码,他们希望鼓励其他研究人员致力于减少生成模型中的偏见和潜在的滥用。

Meta 很高兴见证人们使用这个人工智能工具产生的创造性成果。