在 AI 繪圖的技術演進中,對於「左」與「右」的精確定義一直是一個令人頭痛的難題。這並非單純的單字識別問題,而是涉及到模型對「主客體視角」的判斷。在 Stable Diffusion 1.5 或 SDXL 的許多模型中,即便提示詞明確寫了「角色的左手」,模型往往還是會依照「觀者視角」來進行佈局。這種邏輯上的歧義,在需要精確動作或特定角色特徵的構圖中,是一個極大的挑戰。因此,測試 Anima Preview 2(2026/03/11)這一款僅有 20 億參數(2B)的中量級模型在處理「左右指令」時的行為邏輯,就顯得非常有指標意義。
本次實測,我們選擇了《約會大作戰》中的「冰芽川四糸乃」作為測試對象。四糸乃最具標誌性的特徵莫過於她的手偶——「四糸奈」。在設定上,四糸奈通常戴在她的左手上。這個測試的核心在於:Anima 是會讀懂「角色自身的主觀空間」,還是會優先遵循「觀測者的視覺方位」?實測結果揭示了 Anima 目前的運算邏輯:模型主要是以「觀者角度」為基準。從生成的圖片來看,模型顯然將「Left」關鍵字直接映射到了螢幕的左側。在我們生成的九張圖片中,有八張的手偶出現在觀者的右邊(實際上是角色的左手),而勝利姿勢則出現在觀者的左邊(實際上是角色的右手)。這證明了 Anima 在理解空間方位時,「畫布坐標」的優先權高於角色的解剖學邏輯。這種「鏡像生成」現象在 2D 擴散模型中非常普遍,因為訓練數據中的標註往往混雜了觀者視角與主觀視角,而模型傾向於選擇最直觀的視覺映射。
總結來說,Anima 在處理左右指令時展現了極高的一致性(成功率 9 張中達 8 張,本文將「成功」定義為:手偶與 V 手勢在畫面左右位置符合提示詞中的 Left/Right 映射關係),但使用者必須意識到其邏輯是「觀者導向」。如果您希望角色在畫面右側做出動作,直接使用「Right」通常會比強調「角色的左/右手」來得更有效。這個案例與大家分享,提醒大家在使用 Anima 進行精細構圖時,可以善用這種「鏡像邏輯」來精準控制角色的肢體分佈,避免在提示詞上繞遠路。另外,四糸乃作為熱門角色,其訓練資料可能非常多且穩定,讓模型更容易將手偶放在角色自身左手,因此結果僅供參考。
生成圖片參數
疊代步數:30 步
輸出尺寸:1280 x 960 px(4:3)[原始檔案]
使用工具:ComfyUI、Anima Preview 2
CFG Scale:4
採樣器:er_sde
提示詞:newest, score_9, score_8, masterpiece, best quality, highres, year 2024, safe, 1girl, himekawa yoshino, himekawa yoshino (spirit), date a live, hand puppet, yoshinon, full body, Himekawa Yoshino, the cheerful Spirit with her long blue hair and large bunny-eared green Spirit coat, is captured mid-air in a floating leap against a stunning sunset sky that blends deep amber, rose-pink, and vibrant gold, with feathered clouds reflecting the last warm rays. Her blue eyes are bright, and she smiles widely, raising her left hand in a 'V' sign. On her right hand, her puppet companion Yoshinon, with its eyepatch and cheerful open mouth, is animatedly waving towards the viewer, seemingly sharing in the joy. The sunset light illuminates the elaborate gold patterns on her green coat and the multiple layers of her white frilled dress, which billows slightly as she floats above a distant, sun-drenched landscape, casting a gentle warmth over the entire scene.

▲ 總共生成了九張「約會大作戰」(デート・ア・ライブ,DATE A LIVE)登場的「冰芽川四糸乃」(氷芽川 四糸乃,Himekawa Yoshino),較大張的是我最滿意的。唯一失敗的一張有標記紅星。

▲ 這是九張中表現最穩定的大圖。從成品可以清楚看見:模型將手偶「四糸奈」放在了畫面右側,並將勝利手勢放在畫面左側。這證明了在使用 Anima 進行生成時,直接以螢幕方位的「左/右」來思考提示詞,會比強調角色主觀空間更容易獲得預期的構圖效果。
《上一篇》【日本網卡】DJB 暢日卡PLUS 7天吃到飽不降速 









留言區 / Comments
萌芽論壇