Meta 开源 AI 语言【yán】模【mó】型 MusicGen,可将文本和旋【xuán】律转【zhuǎn】化【huà】为完整乐曲

2024-9-21 14:12:13来源:品玩


【资料图】

品【pǐn】玩 6 月 12 日讯,Meta 近日在 Github 上开源了其 AI 语言【yán】模型【xíng】 MusicGen,该模型【xíng】基【jī】于谷歌 2017 年推出的 Transformer 模型。如同模型名【míng】称所示,MusicGen 主要用于音乐【lè】生成【chéng】,它【tā】可以将文本【běn】和已有的旋律转化为完【wán】整乐曲。

研发团【tuán】队表示:" 我们【men】使用【yòng】了 20000 小【xiǎo】时的授权音乐来对【duì】训练该模型,并【bìng】采用 Meta 的 EnCodec 编码器将音频数据【jù】分【fèn】解为更小【xiǎo】的单元进行【háng】并行【háng】处理,进而让 MusicGen 的运算效率和生成速度都比【bǐ】同类型【xíng】 AI 模型更为出色【sè】。"

除此之外,MusicGen 还支持文本与旋律的组合输入,例如【rú】你【nǐ】可以提【tí】出生【shēng】成 " 一首轻快的曲目 " 并同时要【yào】求【qiú】 " 将它与【yǔ】贝多芬的《欢乐颂》结合起来 "。

研发团队【duì】还对 MusicGen 的【de】实际表【biǎo】现进行了测试。结果显示,与谷歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其【qí】他音乐模型【xíng】相比,MusicGen 在【zài】测试【shì】音乐与【yǔ】文本【běn】提示的匹配【pèi】度以及作曲的可【kě】信度【dù】等指标上表现更好,总【zǒng】体而言略高于谷【gǔ】歌 MusicLM 的水平。

最新资讯

股票软件