在 AI 繪圖的技術演進中,「文字渲染(Text Rendering)」一直被視為最具挑戰性的領域之一。即便進入了 2026 年,許多大型模型在處理複雜排版或特定語系時,依然容易出現拼字錯誤或筆畫崩壞。由 CircleStone Labs 與 Comfy Org 合作推出的 Anima 模型,其核心優勢在於搭載了 Qwen-3 大語言模型(LLM)作為適配器。理論上,擁有強大語言處理能力的 LLM 應該能顯著提升模型對文字結構的理解。為了驗證這一點,我們特別針對最新的 Anima Preview 3 版本進行壓力測試,看看這個僅有 20 億參數的模型,在處理二次元插畫中常見的「說話氣泡」與「對白文字」時,究竟能達到什麼樣的完成度。
本次測試選用了《蔚藍檔案》中極具迷因潛力的角色——才羽桃井(才羽 モモイ,Saiba Momoi)作為主角。測試場景設定為桃井指著鏡頭,並在嘴邊浮現一個帶有文字的說話氣泡。我們設計了兩組對照實驗:第一組是挑戰最基礎的短英文對白,使用網路迷因中常見的「Ni...」作為測試詞;第二組則是進階挑戰中文生成能力,嘗試讓氣泡中出現「你好」二字。
實測結果揭示了 Anima Preview 3 目前在文字渲染上的「偏食」現象。在英文測試中,模型表現出了驚人的潛力,不僅能穩定地生成出具備動漫風格的說話氣泡,對於「Ni...」這種簡單的字母組合也能維持極高的正確率與手寫質感。然而,一旦進入非拉丁語系的領域,情況便急轉直下。無論是中文的「你好」還是後續測試的日文假名,生成結果皆不正確。這顯示出目前的預覽版本雖然具備處理文字的邏輯框架,但在 CJK(中日韓)字元集的訓練密度上仍明顯不足。對於中文創作者而言,目前 Anima 仍需搭配後製軟體或局部重繪才能達成理想的對白效果。
生成圖片參數
疊代步數:30 步
輸出尺寸:1280 x 960 px(4:3)[原始檔案]
使用工具:ComfyUI、Anima Preview 3
CFG Scale:4
採樣器:er_sde

▲「蔚藍檔案 Blue Archive」的「才羽桃井」正指著鏡頭說著「Ni...」。這是使用 Preview 3 測試英文短語生成的結果,可以看到模型非常成功地理解了「Speech Bubble」的提示詞指令,氣泡形狀極具動漫感,且內部的「Ni...」文字筆畫清晰且正確,展現出 Anima 在處理短英文單字時具備極高的實用度。是說桃井兩側前髮上的蝴蝶結怎麼變成黑色的了 ... 😬
📝 提示詞:newest, score_9, score_8, masterpiece, best quality, highres, year 2024, safe, 1girl, saiba momoi, blue archive, Saiba Momoi, a playful girl with blonde short hair, bangs, pink eyes, and wearing fake cat ear headphones, points her right index finger directly at the viewer with a playful, slightly mischievous smile. A stylized anime speech bubble floats near her mouth, containing the handwritten text "Ni...". She is dressed in her Blue Archive uniform: an open white wide-sleeved jacket over a collared shirt with a red hair bow and blue necktie, a black pleated skirt, black thighhighs, and a visible cat tail swaying behind her in a cozy, cluttered Game Development Department room bathed in warm ambient light.

▲ 同樣是「才羽桃井」的生成測試,但將提示詞改為中文的「你好」。實驗結果相當遺憾,模型雖然維持了穩定的角色構圖與氣泡形狀,但氣泡內部的文字完全不正確。這證實了 Anima 目前的版本(Preview 3)尚未具備生成中文字元的能力,對於非英語系文字的形狀捕捉依然處於摸索階段。
📝 提示詞:newest, score_9, score_8, masterpiece, best quality, highres, year 2024, safe, 1girl, saiba momoi, blue archive, Saiba Momoi, a playful girl with blonde short hair, bangs, pink eyes, and wearing fake cat ear headphones, points her right index finger directly at the viewer with a playful, slightly mischievous smile. A stylized anime speech bubble floats near her mouth, containing the handwritten text "你好". She is dressed in her Blue Archive uniform: an open white wide-sleeved jacket over a collared shirt with a red hair bow and blue necktie, a black pleated skirt, black thighhighs, and a visible cat tail swaying behind her in a cozy, cluttered Game Development Department room bathed in warm ambient light.
《上一篇》Anima:Preview 3 已推出!與 Preview 2 有何差異? 









留言區 / Comments
萌芽論壇