!stable-diffusion で遊ぶ なんか乗り遅れた感があるけど,遊んでおこうかな,と. 遊ぶだけなら[Stable Diffusion Demo|https://huggingface.co/spaces/stabilityai/stable-diffusion]もいいけど,休んでいるGPUマシンでも動かしてみた. セットアップは https://github.com/CompVis/stable-diffusion 通りに,Anaconda使ってセットアップ conda env create -f environment.yaml conda activate ldm mkdir -p models/ldm/stable-diffusion-v1/ で,https://huggingface.co/CompVis/stable-diffusion-v-1-4-original から sd-v1-4.ckptダウンロードして models/ldm/stable-diffusion-v1/model.ckpt としてコピー. 想定されているのはVRAMが10GBのGPUだけど,手元のGPU環境はVRAMが8GBなGTX1080なので, [テキストから画像を生成するAI「Stable Diffusion」をWindowsにインストールしてみた|https://forest.watch.impress.co.jp/docs/special/1437123.html]を参考に, python scripts/txt2img.py \ --prompt "a photograph of an astronaut riding a horse" \ --plms --W 384 --H 256 と,サイズ小さ目に. ...全然,オンラインデモの結果と全然違う. {{ref_image grid-0000.png}} 折角なので,他にもいくつか試してみた.それぞれ,それっぽい(?)のを抜粋. * a cute girl eating a piece of cake {{ref_image 00015.png}} * a boy eating a piece of cake {{ref_image 00018.png}} なんかいろいろ試している先人を真似してみると,それっぽいのが出力されてびっくり. うまくいかないものも多いので --n_iter の値を変えて候補を増やした中から抽出. {{ref_image 00251.png}} {{ref_image 00226.png}} これなんかは,ちょっと上手に恐い. {{ref_image 00087.png}} 特に工夫せずに, * japanese anime of a beautiful girl だけだと {{ref_image 00070.png}} {{ref_image 00071.png}} とか,そんな感じ.文字列で絵を描かせてる,って感じだなあ. ちなみに,なんか,謎の歌手がでてくるのなんでだろうと思ったら,Twitterで教えてもらった. https://twitter.com/hotpepsi/status/1579022560419024897 Rick Astleyさんっていうのか. ...別にエッチな画像だしたかったわけじゃないのに,ちょっとず恥かしい. あらためて,実行結果みたら, Potential NSFW content was detected in one or more images. A black image will be returned instead. Try again with a different prompt and/or seed. って,ちゃんと書いてあった.'A black image'じゃなくて洒落が利いてたけど. こういう(?)学術的なコード公開でもnsfwとか気にするあたり, ディープラーニング界隈は倫理関係に注意はらってるんだなあ,と,感心する. 単に描かせるだけじゃなくて,追加学習させたモデル使ってみるとか, 自分で追加学習させようとかも,いろいろあって楽しい.