スポンサーリンク
画像生成AIの代表格の一つ、Stable Diffusionの開発者が作ったFLUX.1を試してみた。FLUX.1には3つエディションがあるが、商用利用も可能なものを選んでインストールしたがうまくいかず。色々知らべて、まずComfyUIを使って解決することになった。今回はいよいよ画像生成をする。
画像生成AIについてのまとめはこちら。
前回の記事はこちら。
前回までにやったこと。
いよいよプロンプトに入力してやっていく準備だ。
ダウンロードしたら、comfyUI/models/unet に移動しておく。
ダウンロードしたら、comfyUI/models/clip に移動しておく。
ダウンロードしたら、ファイル名を flux_vae.safetensors に変えて、comfyUI/models/vae に配置する。
あとはこのサイトの右上のDownloadからComfy UIの設定ファイルをダウンロードして読み込ませる。
これだけだ。
Comfy UIを起動する。デフォルトの画面とは異なるワークフローだ。
早速デフォルトのプロンプトのまま右上のQueue Prompt」をクリックして、生成を開始する。サンプルの玉ねぎができる。
プロンプトをかえてみた。
2 japanese women, solo, cute, (smile), watching firework ,night time, standing, BREAK (yukata:1.4), cinematic still {prompt) . emotional, harmonious, vignette,highly detailed, highbudget, bokeh, cinemascope, moody, epic,gorgeous, film grain, grainy
これでできたものがこの写真。
動かしているとエラーになった。
エラーの回避には、Comfy UIの起動バッチファイルにオプションを追加する。
.\python_embeded\python.exe -s ComfyUI\main.py –windows-standalone-build –lowvram
まだチューニングの余地があるのか、画像生成にかかる時間は長い。1枚で4分だ。
先ほどのFLUX 12GB SUPER EASY のサイトのコメントにも書かれているが、20ステップではなく4ステップに減らせば30秒弱という人もいる。
さらに改良するといいのだろうけど、自分にはわからないので他力本願かな。
時間はかかるけど、品質はいいので、使えるなと思っている。
今回の手法がAIの世界ではどういうものなのか不明だが(名称からすると、浮動小数点演算を8ビットでやっているのかな)標準的な手法なら今後現れる新たな画像生成AIでも同様にメモリ消費削減バージョンを作り人が出てきそうだ。楽しみだ。
生成の様子を動画にまとめた。ご参考に。
PR