【Stable Diffusion】顔がバグるときは Hires upscale でなんとかなる!

画像作ってるとたまに顔がバグるときがあるんですけど、どんなときバグるのかってのが自分でいまいち分かってませんでした。でも検証したら顔の描写領域が狭いことが原因だったようです! 順を追って説明します。まず次の4枚は 504×896 で作った普通の画像です。特に顔は崩れていません。

次に、上の呪文に「(full body shot:1.5)」を加えます。これで上半身または全身が映るようになるんですが… うまく行ってるのもありますけど4枚目、顔が若干おかしくなってます。full body shot を使うと顔おかしくなるよなーってのはこれまで体感してたことです。

さらに全身写すために「(standing:1.2)」で立ってもらうと、もう全部顔がおかしくなってしまいました。斜視になったり、目のバランスがおかしかったり、瞳が正確に描写されなかったり。よく見るバグ顔。

こういうときは Hires. fix にチェックを入れて、Upscale by を 1.5 くらいにしてみましょう。呪文は変えずにそのまままた画像生成。そうすると立ち姿全身写っていても顔がバグがマシに、というかまず問題なくなります。

504×896 で顔アップ、上半身は問題ないのに立たせるとバグるということは、おそらく顔の描写領域が狭くなったことが原因だと思われます。狭いところを精巧に描くのは苦手なんですねきっと。そこで Upscale by 1.5 にする対策がとれますが、これは最初に設定した横504px、縦896pxを1.5倍にするというやつ。1.5倍にするから顔の描写領域も縦横1.5倍になって広くなります。広くなると精巧な描写が可能にという具合でしょう。ぜひ参考に。

(最終の画像の)Generation Data
best quality,masterpiece,illustration,photorealistic,(realistic:1.4),photo-realistic,RAW photo,ultra-detailed,CG,unity,8k wallpaper,16k wallpaper,extremely detailed CG,extremely detailed,an extremely delicate and beautiful,extremely detailed,Amazing,finely detail,official art,High quality texture,incredibly absurdres,highres,huge filesize,highres,beautiful detailed girl,extremely detailed eyes and face,beautiful detailed eyes,delicate fingers and hands,light on face,1girl,(white tee),(smiling:1.2),(restaurant:1.3),(full body shot:1.5),(standing:1.2)
Negative prompt: (worst quality:2),(low quality:2),(normal quality:2),sketches,ugly,error,jpeg artifacts,lowers,blurry,bokeh,poorly draw,bad anatomy,text,watermark,monochrome,DeepNegative,signature,out of focus,extra arms,extra legs,extra hands,extra limbs,extra fingers,extra digit,extra foots,missing arms,missing legs,missing hands,missing limbs,missing fingers,missing digit,missing foots,fewer digits,bad hands,ugly face,bad face,long neck,long body,malformed limbs,fused fingers,mutated hands,cross-eyed,bad body,bad proportions,gross proportions,(off-shoulder),(hair accessories:1.5)
Steps: 22, Sampler: DPM++ SDE, CFG scale: 7, Seed: 3534352018, Size: 504×896, Model hash: fc2511737a, Model: chilloutmix_NiPrunedFp32Fix, Denoising strength: 0.7, Hires upscale: 1.5, Hires upscaler: Latent

AI,Stable Diffusion,呪文まとめ