Audiocraft-webui 體驗本地端 AI 音樂生成的樂趣!

2024/07/07 95 0 軟體介紹 , 軟體應用 , 人工智慧
■ 軟體檔案 ■
軟體名稱
Audiocraft-webui
軟體類別
工具
軟體性質
開源軟體
軟體下載
請到官方網站下載!
支援系統
Windows、MacOS、Linux
支援語言
英文

Audiocraft-webui 是一款本地網頁使用者介面,專為 Facebook 的 Audiocraft 模型設計。這款工具的最新版本提供了多項強大功能,讓使用者能夠創作長時間的音訊,並且可以隨心所欲地添加各種不同的提示到處理排程中。使用者可以在添加提示後悠閒地去喝杯咖啡,再回來就能享受生成的美妙音樂。Audiocraft-webui 還具備生成歷史功能,使用者可以回放先前生成的音樂並查看使用的設定。

如果想啟用 GPU 加速,並且尚未安裝 torch,請到 PyTorch 官方網站獲取安裝 GPU 版 torch 的正確指引,然後只需運行以下命令 pip install -r requirements.txt 安裝相關套件。若在安裝 audiocraft 時遇到問題,請參考其官方文件。安裝完成後,可以透過以下命令啟動應用程式:python webui.py。無需下載任何外部模型,首次運行時只需從下拉選單中選擇一個模型,然後點擊運行,模型將會自動透過 audiocraft 下載。如果你想使用旋律模式,選擇 Melody 模型後,介面會出現選擇旋律音訊文件的選項。生成的文件會儲存在 statc/audio/ 目錄中。預設情況下,當前使用的模型會保留在記憶體中。如果希望在每次生成後卸載模型,可以使用以下命令啟動應用程式:python webui.py --unload-after-gen

Audiocraft-webui 提供了多種參數設置,讓使用者能夠微調生成音樂的效果:

Top-K:較高的 Top-K 值會增加可能的樂器和延續選項,與較高的溫度結合可以創作出更有趣的音樂,但可能會使音樂變得異常。建議與溫度設置結合使用。
Top-P:推薦值為 0.7,這表示我們從前 70% 的可能延續中進行取樣。較高的 Top-P 值會使音樂不那麼有趣和創意,還可能引入靜態和噪音。建議將其設置為 0.7,不需過多考慮。
Duration:生成音樂的長度,單位為秒。
CFG/Classifier Free Guidance:值越高,生成的音樂越能匹配提示內容。一般建議設置在 3-5 之間。
Temperature:隨機性程度,建議值為 1.05-1.5。若想創作混亂的音樂,應設置較高值;若想創作規則/重複的音樂(如俱樂部節拍),應設置較低值。


▲ 先到喜歡的目錄下 git clone https://github.com/CoffeeVampir3/audiocraft-webui.git,接著 cd audiocraft-webui,再來 pip install -r requirements.txt,這邊可能會遇到不少相依性問題,可能跟 Python、PyTorch 及 CUDA 版本都有關係,建議搭配 ChatGPT 及官方文件去排除相關問題,這邊我弄蠻久的,PyTorch 重裝好幾次,因為該指令會一直安裝 CPU 版的 PyTorch,導致我反覆安裝多次 GPU 版的 PyTorch,檢查 CUDA 支援度等,蠻大的坑。

▲ 輸入 python webui.py 啟動 UI,瀏覽器可以到 127.0.0.1:5000 操作 UI。

▲ Audiocraft-webui 介面長這樣,有模型選單、參數調整、提詞輸入區及送出按鈕,右側可以看到先前生成過的音樂及其使用參數。Audiocraft 生成的音樂目前聽起來比 Suno AI 差,目前感覺只能當作玩玩而已,不過能自由生成指定長度的音樂倒是真的蠻厲害的。

贊助廣告 ‧ Sponsor advertisements

留言區 / Comments

萌芽論壇