在影像生成模型快速演進的當下,「同一底層架構、不同微調方向」所帶來的風格差異,已成為評估模型特性的關鍵切入點。本次主題聚焦於 Z-Image Turbo 與其二次元導向衍生模型 Z Animimage Turbo,前者以高效率蒸餾架構與寫實表現見長,後者則在動漫語彙、風格化控制與創作自由度上進行深度調校。透過相同生成條件下的對照,我們能更清楚看見「原版通用模型」與「風格專用微調模型」在畫面取向與細節決策上的本質差異。若要親自用 ComfyUI 嘗試這兩個模型,可以參考我先前的文章。
為了降低變因、放大模型本身的性格,本比較將在固定 seed、steps 為 9、CFG 為 1.0,並使用 res_multistep 取樣器與 simple scheduler、denoise 1.00 的設定下進行。十組提示詞皆以「動漫二次元,女性人像」作為共同起點,刻意選擇簡單的描述,觀察 Z-Image Turbo 如何以寫實基底回應動漫提示,以及 Z Animimage Turbo 如何在保留底模穩定性的同時,進一步強化線條、色彩、材質與敘事張力。這不僅是畫風優劣的比較,更是一場關於「模型理解世界方式」的直觀展示。

▲ 對照組(一),提示詞:動漫二次元,女性人像,坐在沙發邊緣微微前傾,雙手自然放在膝上,上半身朝向鏡頭,眼神溫和注視,表情沉靜內斂。

▲ 對照組(二),提示詞:動漫二次元,女性人像,站在白色牆面前,身體側向鏡頭,頭部輕輕轉回正面,眼神冷靜直視,嘴角沒有明顯表情。

▲ 對照組(三),提示詞:動漫二次元,女性人像,倚靠窗框站立,一肩略微下沉,上半身轉向鏡頭,目光柔和而專注,神情自然放鬆。

▲ 對照組(四),提示詞:動漫二次元,女性人像,坐在窗邊椅子上,身體微微側轉,雙眼平靜看向鏡頭,臉部表情安靜且克制。

▲ 對照組(五),提示詞:動漫二次元,女性人像,站在室內陰影處,上半身微微前傾,臉部朝向鏡頭,眼神穩定直視,嘴角輕輕放鬆。

▲ 對照組(六),提示詞:動漫二次元,女性人像,靠近窗邊低頭站立,聽到呼喚般抬眼看向鏡頭,神情平靜中帶些思索。

▲ 對照組(七),提示詞:動漫二次元,女性人像,坐在木椅上,身體正對鏡頭但肩膀略微傾斜,眼神清澈直視,表情自然不刻意。

▲ 對照組(八),提示詞:動漫二次元,女性人像,室外公園,吃著冰淇淋,看向鏡頭,臉部表情柔和。

▲ 對照組(九),提示詞:動漫二次元,女性人像,辦公室,打著電腦,看向螢幕,神情淡然。

▲ 對照組(十),提示詞:動漫二次元,女性人像,郊外,青山綠水背景,健行服裝,開心面向鏡頭,一旁木牌指標,寫著"登山口"。
就實際觀察而言,Z Animimage Turbo 的預設輸出確實更貼近 SDXL 系列模型常見的二次元審美:色彩飽和度較高,膚質與光影帶有明顯風格化處理,人物情緒與姿態也更容易呈現出偏「色氣」與情感張力的氛圍;相對之下,Z-Image Turbo 即使套用動漫提示詞,畫面仍保有較強的平面感與結構克制,更像是動畫截圖或設定稿取向,情緒表現偏冷靜理性。這樣的差異,使兩者在二次元創作中自然分工:一個適合追求性感、風格強烈的插畫表現,另一個則更適合作為乾淨、中性的基底模型使用。
《上一篇》不想資料被拿去訓練 AI?一步步關閉 X 的 Grok 三大選項 









留言區 / Comments
萌芽論壇