2023年12月24日日曜日

Stable Diffusion でポーズを生成するための対訳集

ちょっとお遊びでStable Diffusionで好みのポーズを生成するために、英語の表現をしらべてみました。
体育座りの英語の言い方は知らなかった。

画像を生成するためのモデル類の情報は末尾に。
日本語英語
立っているstanding

横たわっているlies down on

仰向けになるlie on her back

背伸びするStretch out with her arms up

両手を上に突き上げて背伸をするthrows her arms up and stretches her back.

彼女は四つん這いになる    
gets on all fours.
goes down on all fours.
腕を組むfolds her arms.

祈るように手を組む          folds her hands in prayer.
体育座りをしているSitting on the floor holding her knees

踊るdancing

右足をけり上げる
kicks her right leg up.


(kicks her legs up.だとちょっといやらしい恰好になってしまう)
後ろ手を組むcrosses her hands behind her back.

うまく生成できなかったもの(多分、学習データにあまりない)
手を前に伸ばす       reaches forward with her hands.
彼女は右腕を上に伸ばし、左手は右腕の肘に手をかけ背伸びする She stretches her right arm upwards, places her left hand on the elbow of her right arm, and stands tall.

なお、webuiで以下のような設定で処理しました。

基本プロンプト
super top quality, absurdres, highest resolution, whole body, chromatic aberration, Raw photo, Photo realistic, sharp focus, opening wide eye, 16yo cute japanese girl, school uniform, smiling, in park,
(この後に上記の例文を入れる)

ネガティブプロンプト
verybadimagenegative_v1.3, EasyNegative, ng_deepnegative_v1_75t, badhandv4, (ugly face:0.8),cross-eyed,sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, bad anatomy, facing away, tilted head, {Multiple people}, lowres, bad anatomy, bad hands, cropped, worstquality, low quality, normal quality, jpegartifacts, signature, watermark, username, blurry, bad feet, cropped, poorly drawn hands, poorly drawn face, mutation, deformed, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, extra fingers, fewer digits, extra limbs, extra arms,extra legs, malformed limbs, fused fingers, too many fingers, long neck, cross-eyed,mutated hands,  bad body, bad proportions, gross proportions, text, error, missing fingers, missing arms, missing legs, extra digit, extra arms, extra leg, extra foot, (repeating hair)

モデル
breakdomainrealistic_R2333.safetensors 

VAE
vae-ft-mse-840000-ema-pruned.ckpt

CLIP SKIP 1~2

CFGは20~30で顔が整うまで調整しています。

ネガティブプロンプトの冒頭にあるEMBEDを使っています。




seedsは残していません。