【資料圖】
美國東部時間8月2日,Meta公司開源了一款名為AudioCraft的生成式AI工具,該工具能夠幫助用戶通過文本提示創作音樂和音頻。 據Meta公司介紹,AudioCraft主要包含三個核心組件。首先是MusicGen,它使用Meta公司擁有或特別授權的音樂進行訓練,根據文本提示生成音樂。其次是AudioGen,它使用公共音效進行訓練生成音頻或擴展現有音頻,未來還可以生成環境音效,如狗叫、汽車鳴笛、木地板上的腳步聲等。最后是改進版的EnCodec,這是一個基于神經網絡的音頻壓縮解碼器,能夠生成更高質量的音樂并減少人工痕跡,或對音頻文件進行無損壓縮。 開源后的AudioCraft工具,相關研究人員和從業人員可以使用自己的數據集訓練模型。Meta公司宣稱,AudioCraft系列模型能夠長期穩定地生成高質量音頻,而且易于使用,能夠為音樂家和聲音設計師提供靈感,幫助他們快速集思廣益,并以新的方式迭代他們的作品。 此外,今年6月份,Meta公司已經開源了AI語言模型MusicGen。該模型基于2017年谷歌推出的Transformer模型,主要用于音樂生成,能夠將文本和已有的旋律轉化為完整樂曲。
關鍵詞: