在二次元 AI 繪圖領域,模型架構的演進速度令人目不暇給。近期由 CircleStone Labs 與 Comfy Org 攜手合作推出的「Anima」模型,無疑是社群中最受矚目的焦點。作為一個擁有 20 億參數(2B)的中量級模型,Anima 並未依循傳統 Stable Diffusion 的舊路,而是選擇了基於 NVIDIA Cosmos 架構進行開發。這意味著它在生成邏輯與底層技術上展現出了全新的可能性。Anima 的定位非常明確:它不追求照片般的寫實感,而是全心全意地鑽研動漫、插畫與藝術風格。這對於長期深耕二次元領域的創作者來說,無疑提供了一個更純粹、更具表現力的創作工具。其訓練集包含了數百萬張高品質動漫圖像與數十萬張藝術畫作,確保了它在線條處理與色彩分布上,能更精準地捕捉日系畫風的精髓,而非像通用型模型那樣在寫實與二次元之間搖擺不定。
技術層面上,此次測試所使用的 Anima Preview 2 版本(發布於 2026 年 3 月 11 日)展現了顯著的進化。最令人驚豔的在於其文本編碼器的升級,使用了 Qwen-3 系列的大語言模型(LLM)作為基礎,這使得模型對提示詞的理解不再局限於破碎的標籤組合,而是能精確解讀複雜的語境與自然語言描述。相比於過往模型常遇到的「提示詞理解崩潰」,Anima 在 Preview 2 中透過重新調整超參數與技術細節,大幅提升了對微調(Fine-tuning)的相容性與角色知識的儲存量。即便是在中等解析度下進行訓練,它依然能展現出極強的角色辨識能力,甚至引入了正則化數據集來維護非動漫類型的美學知識,確保在發揮創意的同時,畫面結構依然穩健。
對於廣大的 SDXL 用戶來說,最關心的核心問題莫過於:「我辛苦研究出的提示詞還能用嗎?」經過實測,Anima 對於 SDXL 的提示詞展現出了驚人的相容性。它完美繼承了 Danbooru 風格的標籤體系,並可支援 score_9 這種美學評分標籤。這意味著用戶可以無痛接軌,將原本在 SDXL 上使用的角色描述與品質指令直接套用。然而,Anima 更強大的地方在於它的「寬容度」。得益於 LLM 適配器的加入,當用戶混合使用傳統標籤與自然語言長句時,模型能夠更細膩地處理光影與動作層次,甚至能更準確地處理多角色互動。這種「混合模式」的提示詞撰寫方法,不僅降低了新用戶的入門門檻,也為資深用戶打開了創作的新大門。
本次專題將深入測試 Anima 在處理熱門二次元角色時的表現,透過實際案例來驗證這個 2B 參數模型是否完美相容 SDXL 提示詞。要特別注意!此模型仍在訓練階段,因次不建議拿預覽版模型來訓練 LoRA 微調模型,但直接拿來生圖是沒問題的。
生成圖片參數
疊代步數:30 步
輸出尺寸:1280 x 960 px(4:3)[原始檔案]
使用工具:ComfyUI、Anima Preview 2
CFG Scale:4
採樣器:er_sde

▲「蔚藍檔案 Blue Archive」的「橘光」(橘 ヒカリ,Tachibana Hikari),生成此圖的提示詞來自萌芽二次元。

▲「蔚藍檔案 Blue Archive」的「橘希望」(橘 ノゾミ,Tachibana Nozomi),生成此圖的提示詞來自萌芽二次元。
幾乎是一次就生成成功,不太需要抽卡,手指、腳趾等 SDXL 疲弱不堪的部分,這個新模型表現都相當完美,這還只是直接拿我以前使用 SDXL 生成的提示詞直接生成的成果,如果進一步研究改善提示詞結構、加入自然語言敘述,應該能獲得更具創意力、驚艷感的成品。個人非常期待正式版模型的登場!
《上一篇》Z-Image Turbo:二次元 Q 版角色進入真實世界的虛實融合提示詞指南
《下一篇》Anima:全新 2B 參數二次元模型,能否輕鬆生成雙人互動的圖片? 









留言區 / Comments
萌芽論壇