Stable Diffusion web UI 訓練超網路(Hypernetwork)教學，讓 AI 學習畫風！

多數時候我們向 Stable Diffusion、Waifu Diffusion 等的大型模型輸入提詞（Prompt）以產生圖片，但這樣的模型是用大量實驗室等級的電腦運算出來的，隨便就動輒數 GB 大小，如果有沒收錄到的畫風就沒辦法畫出來，這時候就會用到 Stable Diffusion web UI 訓練小模型的功能了！所謂的小模型就是使用者可以基於大型模型，用不多的素材樣本進行訓練，最後可輸出一些原來無法輸出的圖，如特殊畫風或角色特徵。目前可自行訓練的小模型有兩種，分別是 embedding（Textual Inversion）和 hypernetwork，模型空間占用是前者較小後者較大，前者適合學習單個物體、角色及簡易的畫風，後者則是適合學習整體畫風用。

這次主要來做訓練超網路(Hypernetwork)的教學，它是一種小型模型，副檔名為 .pt。首先您電腦需要有非常大的 GPU VRAM 可以用（建議 > 10GB），訓練模型非常吃 VRAM，因此如果您準備添購顯示卡來玩 AI，甜品卡 RTX 3060 12G VRAM 會是不錯的選擇。以前就一直非常欣賞常繪製東方角色的繪師60枚，想說利用這個學術研究的機會讓 AI 學習該繪師的畫風，看能做到什麼程度！首先要準備一些要進行訓練的素材樣本，借用繪師公開在平台上的作品，再裁切為 1:1 並建議為 512 x 512 px 的解析度，這邊可用喜歡的軟體或線上工具 Birme 進行，然後建立一個資源集的路徑，可參考我的設置方式：

D:\ai\source -> 原始素材樣本放置區（來源目錄）
D:\ai\destination -> 預處理素材樣本放置區（目標目錄）

※ 備註：建議原始素材樣本要有 30 張或以上，若為角色請只有單人（排除多人），品質高比數量多來的重要。這次我總共處理了 30 張，訓練結果就非常理想，一致性跟高品質的樣本是很重要的。

接著就是打開 Stable Diffusion web UI 開始以下步驟。

▲ 進入介面，上方「Stable Diffusion 模型權重存檔點」選取基礎的大型模型以利後續訓練小模型用。選到「訓練」頁籤，進入「生成超網路（Hypernetwork）」，我們要在這邊建立新的 Hypernetwork，名稱自訂好辨識即可，我用 60mai 作為該模型名稱，其他參數就預設值即可，好了就點「生成超網路（Hypernetwork）」，右側會有生成成功提示：

Created: D:\stable-diffusion-webui\models\hypernetworks\60mai.pt

▲ 來到「圖像預處理」的部分，這邊要將來源目錄跟目標目錄指定好，這邊主要是做原始素材樣本的預處理，寬高請跟您處理過後的解析度一樣，一定要為 1:1 的比例！勾選「生成鏡像副本」會將原始圖左右水平翻轉產生兩倍樣本，再勾選「使用 deepbooru 生成說明文字（標記）」以產生相關提詞（這邊是針對二次元角色才勾這個，要先安裝這個外掛才能用），點「預處理」開始跑！

▲ 預處理完後可以在指定目錄中看到相關檔案，軟體已經自動生成每張圖可能的對應提詞了！

▲ 最後來到「訓練」，超網路（Hypernetwork）選剛剛建立的，其餘參數就先不動，資料集目錄填入預處理完的路徑（我是 D:\ai\destination）。

▲ 日誌目錄建議用預設的，提示詞模版檔案跳過，寬高跟預處理圖像一樣即可（要 1:1 別忘記！），最大疊代步數可自行設定，建議為 10000，這種小模型差不多訓練個一萬步就能用了！RTX 3060 12G 大概要跑 1 個半小時，還算蠻快的。點「訓練超網路（Hypernetwork）」開始訓練。接著就是漫長的等待。

▲ 完成後預設會將最後訓練出來的模型檔放入軟體根目錄 models\hypernetworks 下，這樣就能在「設定」頁籤的「超網路（Hypernetwork）」項目中找到，找不到可點「🔄」重新載入清單，最後記得到上方點「儲存設定」，接著就能以這個超網路小模型生圖了！

▲ 由 500 步訓練到 10000 步的預覽圖，這次訓練成果很理想，AI 有確實學習到特殊的畫風。

▲ 預設日誌在軟體根目錄下的 textual_inversion 中，會用日期再分子目錄，進入後才是小模型名稱的目錄，hypernetworks 目錄放的是指定每幾步（預設 500 步）產生的 .pt 小模型，images 目錄放預覽圖（剛剛秀給大家看的），hypernetwork_loss.csv 檔案存訓練完整過程記錄，我此次的結果如下：

step,epoch,epoch_step,loss,learn_rate
500,8,20,0.2029166,1e-05
1000,16,40,0.1839280,1e-05
1500,24,60,0.2266962,1e-05
2000,33,20,0.1809429,1e-05
2500,41,40,0.2151944,1e-05
3000,49,60,0.2457536,1e-05
3500,58,20,0.1882944,1e-05
4000,66,40,0.2001344,1e-05
4500,74,60,0.2098990,1e-05
5000,83,20,0.1939295,1e-05
5500,91,40,0.1465946,1e-05
6000,99,60,0.1900364,1e-05
6500,108,20,0.1813054,1e-05
7000,116,40,0.1496066,1e-05
7500,124,60,0.1841173,1e-05
8000,133,20,0.2041402,1e-05
8500,141,40,0.1839602,1e-05
9000,149,60,0.1743100,1e-05
9500,158,20,0.1775405,1e-05
10000,166,40,0.1903121,1e-05

一般來說 loss 越低越好，但還是要依照情況去調整使用的小模型。

▲ 軟體讀取超網路小模型的路徑就是 models\hypernetworks，您可以直接將指定訓練步數的模型檔案放進去，就能到「設定」中切換使用。畫面中就是我將最終訓練模型、500 步模型及 5000 步模型放入目錄中給軟體讀取。

來看看最終產圖結果及畫風的變化吧！我使用相同種子碼及各種相同參數去生東方角色「風見幽香」的畫作！

提詞：masterpiece, best quality, best quality,Amazing,beautiful detailed eyes,1girl, solo,finely detail,Depth of field,extremely detailed CG unity 8k wallpaper, {solo focus},(Touhou), (kazami_yuuka:1.2), yellow_ascot, ascot, bangs, breasts, medium_breasts, day, eyebrows_visible_through_hair, field, sunflower, flower_field, frilled_skirt, frills, green_hair, short_hair, hair_between_eyes, long_sleeves, looking_at_viewer, petals, plaid, plaid_skirt, plaid_vest, red_eyes, red_skirt, red_vest, shirt, skirt, standing, vest, wavy_hair, white_shirt, wing_collar. (來源:萌芽二次元)

▲ 左邊是原始不用超網路小模型生出來的圖，右邊是用最終訓練一萬步之超網路小模型生出來的圖，可見 AI 學習到我指定給它的畫風。

▲ 附給大家用訓練了 500 步 (左) 及 5000 步 (右) 之超網路小模型生出來的圖，看來步數越多，畫風影響越明顯。也許再往下訓練會更接近指定繪師的畫風，但也難保證會不會訓練過頭變成鬼畫符，這就考驗 AI 操作技術及運氣了... 希望大家都能訓練出理想的小模型！👍😁

影像僅用於學術研究目的，以上教學僅供參考。

另外用了幾種畫風訓練後得到以下作品，歡迎大家參考：

【AI 繪圖】二次元小蘿莉(第一彈)
【AI 繪圖】二次元小蘿莉(第二彈)
【AI 繪圖】二次元小蘿莉(第三彈)
【AI 繪圖】二次元小蘿莉(第四彈)
【AI 繪圖】二次元小蘿莉(第五彈)

贊助廣告 ‧ Sponsor advertisements

《上一篇》Stable Diffusion web UI 訓練小模型 embedding (Textual Inversion) 教學

《下一篇》Stable Diffusion web UI 之 AI 繪圖教學：多色頭髮二次元動漫角色

萌芽站長

您好，我是萌芽系列網站（Mnya Series Website）的站長&創始人，可以稱呼我「萌芽站長」。我的興趣與專長有登山、觀察地形、攝影、旅遊、網頁設計＆架設＆經營、動畫製作、圖片處理、資料彙整等。有任何問題或建議請至萌芽論壇發表。網站業務、商業合作的聯絡方式在「關於本站 → 團隊介紹 → 站長介紹」，很高興認識您！請多指教！

留言區 / Comments

萌芽站長

熱門文章

近期文章

頁面

其他操作