Fooocusは、難しいインストール作業や設定作業が必要なく、簡単にローカル環境で画像生成AIを使用できるツールです。最初から高品質な画像が生成され、がっかりすることがないので、初めての方にこそ向いているかもしれません。この記事では、Fooocusの基本的な使い方を、分かりやすく解説いたします。
Fooocusとは
Fooocusの特徴と注意点、インストール・アンインストール方法について解説します。
Fooocusの概要
「Fooocus」とは、Stable Diffusion XLをベースとした、画像生成AIツールです。
モデルやパラメーターの設定が自動的に行われるので、簡単なプロンプトを入力するだけで、高品質な画像が生成されることが特徴です。
オープンソースで開発されており、無料で使用できます。
Fooocusは、lllyasviel(Lvmin Zhang)氏によって、2023年に公開されました。
lllyasviel氏は、ForgeやControlNetの開発者としても知られており、画像生成AI界の主要人物の一人です。
Stable Diffusionのバージョン
Stable Diffusionには複数のバージョンがあり、以下が代表的なものです。
バージョン | 解像度 | 公開日 |
---|---|---|
1.5 | 512 x 512 | 2022年10月 |
2.1 | 768 x 768 | 2022年12月 |
XL | 1024 x 1024 | 2023年7月 |
3.0 | 1024 x 1024 | 2024年4月 |
3.5 | 1024 x 1024 | 2024年10月 |
FooocusはSDXLに最適化されています。
3.0以降には対応していません。
Fooocusの開発はほぼ終了しており、現在はメンテナンスのみとなっています。
3.0以降をローカル環境で実行するためにはハイスペックPCが必要となるため、まだまだFooocusを利用する意味はあります。
偽サイトに注意
Fooocusの公式サイトは「https://github.com/lllyasviel/fooocus」のみであり、全て無料で利用できます。
その他の、以下のようなサイトは全て偽サイトです。
- foocus.com
- fooocus.net
- fooocus.co
- fooocus.ai
- fooocus.org
- fooocus.pro
- fooocus.one
これらの偽サイトに課金をしないようにご注意ください。
ローカルで実行するメリット
Fooocusを実行するには、次の2つの方法があります。
- Google Colab(クラウド上でPythonを実行)
- ローカル(Windows、macOS、Linux)
Google Colabは気軽に始めることができますが、無料プランの場合は時間に制限がありますし、何より画像やプロンプトが検閲されることが問題です。
ローカル環境であれば誰にも見られることはありませんので、自由に、何度でも実行することができます。
ただし、生成した画像を公開する場合には注意が必要です。
商用利用できる?
Fooocusで生成した画像を商用利用できるかどうかは、利用するモデルによります。
ここで問題となるのは、Fooocusはモデルを自動でダウンロードしてくるということです。
バージョン2.5.5の場合、標準で以下のモデルが使用されています。
モデル名 | 商用利用 |
---|---|
juggernautXL_v8Rundiffusion | 要連絡 |
realisticStockPhoto_v20 | 不明 |
animaPencilXL_v500 | Fair AI Public License 1.0-SD (常識の範囲で可能) |
これ以外にも、LoRA等の拡張機能が、必要となった時点で自動ダウンロードされてきます。
全体的にライセンスが曖昧なので、商用利用することは避けたほうが良いのではないかと思います。
インストール
Windowsの場合、Fooocusのインストール作業というものはなく、ファイルをダウンロードするだけです。
公式サイトにアクセスして「Click here to download」をクリックします。
拡張子「7z」で圧縮されているので、解凍ツールが必要となります。
まだお持ちでなければ、「7-Zip」をおすすめします。
好きなフォルダに展開します。
ダウンロードは数分でも、展開するのに数十分かかるかもしれません。
「run.bat」をダブルクリックして実行します。
しばらく待ち、ブラウザで「http://127.0.0.1:7865」が開き、以下のような画面となったら完了です。
アンインストール
Fooocusのアンインストールをするには、展開したフォルダを丸ごと削除するだけです。
「Fooocus\outputs」フォルダに、生成された画像が保存されているので、削除しても問題ないかご確認ください。
起動しない場合
バージョンアップ等の影響で、Fooocusが正常に起動しなくなることがあります。
その場合は、下手にいろいろと考えるより、全部削除した上で、再度ダウンロードし直したほうが速いようです。
Fooocusの使い方
img2img機能を中心に、Fooocusの使い方を解説します。
単純に生成する
Fooocusの初期画面はシンプルです。
単純に画像を生成するだけであれば、プロンプトを書き、「Generate」をクリックするだけです。
プロンプトは英語で入力する必要があります。
例として「japanese」とだけ入力して生成したところ、このようになりました。
初期設定では2枚の画像が生成されるようになっています。
左は文字がおかしいので、すぐに生成AIだと分かりますが、右は遠目で見たら分からないかもしれません。
こちらの右の画像を、以下のテストでも使用していきます。
起動プリセット
Fooocusはどちらかと言えば、実写系画像を得意としていますが、アニメ系画像への対応も可能です。
「run.bat」「run_anime.bat」「run_realistic.bat」という3つの起動ファイルがあり、それぞれ、使用するモデルやパラメーターが自動設定されますので、使い分けるとよいでしょう。
使用する機能によって、必要なファイルも自動ダウンロードされます。
Advanced
「Advanced」にチェックを入れ、設定を手動変更することもできます。
ただし個人的には、これらの設定をしなくてもよいのがFooocusのメリットなので、あえて設定する必要はないのではないかと思います。
より細かな設定をしたいのであれば、別のAIツールを使用することをおすすめします。
Variation
「Variation」は、画像を入力として、さらに似た画像を生成することができます。
上記の画像を使用して、「Vary(Subtle)」で生成したところ、以下のようになりました。
しかし「Vary(Strong)」の場合は、人間にとっては意味不明なものとなりました。
Upscale
「Upscale」では、画像の解像度を1.5倍、2倍にすることができます。
Image Prompt
「Image Prompt」も、似た画像を生成できる機能です。
テキストプロンプトを組み合わせて使用することもできますが、画像だけで生成したところ、以下のようになりました。
PyraCanny
「PyraCanny」は輪郭を抽出する機能で、似たポーズの画像を生成することができます。
つまりControlNetですが、ControlNetもlllyasviel氏が開発したものです。
ここではテキストプロンプトとして「man」を付け加えて生成したところ、以下のようになりました。
CPDS
「CPDS」も似たポーズの画像を生成する機能ですが、PyraCannyと比べて、上手く機能しないことが多いようです。
(少し気持ち悪い画像となったのでモザイク処理)
FaceSwap
「FaceSwap」は、顔を入れ替えることができる機能です。
「PyraCanny」でポーズを指定して、「FaceSwap」で顔を入れ替える、という使い方ができます。
スノーボードという指定はしなかったので意味不明ではありますが、ポーズと顔は真似ることはできました。
なおFaceSwapで生成した画像はそっくりさん感があるので、本当に似せるのであれば「Stop At:1」「Weight:1.2」くらいから試してみることをおすすめします。
Inpaint
「Inpaint」では、選択した範囲だけを再生成することができます。
ここでは料理を釣り潰し、テキストプロンプトで「ramen」としています。
ラーメンにはなりませんでしたが、料理部分は変更されました。
Outpaint
「Outpaint」は、上下左右に対して拡張して画像を生成することができます。
元々が生成画像なので、細かなツッコミはありますが、遠目で見ればなかなか自然な出来栄えとなっています。
Enhance
「Enhance」は、指定した箇所のみを変更する機能です。
「Inpaint」で塗りつぶす代わりに、言葉で指定できるということです。
ここでは髪の色をピンクにしてみたいと思います。
「Detection prompt」を「hair」、「Enhancement positive prompt」を「changing hair color to pink」とします。
以下のようになりました。
Describe
「Describe」では、テキストから画像ではなく、画像からテキストを生成できます。
ここでは「the woman is waiting for her meal to be eaten(その女性は食事が食べられるのを待っている)」という、若干意味不明な内容となりました。
これをプロンプトとして利用し、また新たな画像を生成することができます。
余談ですが、GoogleのAPIを利用した「They see your photos」では、Googleが画像の内容だけでなく、年収・趣味・宗教・支持政党・興味ある商品まで分析していることが分かります。
-
Googleが画像をどのように認識しているかを確かめることができる「They see your photos.」
近年、画像生成AIが話題となっていますが、生成AIは分析AIの逆をおこなっているということは、忘れられがちです。精密な生成ができるということは、精密な分析ができるということです。では実際どのような分析 ...
Metadata
「Metadata」では、画像に埋め込まれた生成AIのパラメーター情報を参照できます。
主に、Automatic1111で生成した画像を想定しているようです。
「Apply Metadata」をクリックすれば、同じ設定を用いて画像生成できますが、使用する環境の違いなのか、エラーとなりました。
なお、メタデータを確認するだけであれば、Exiftoolの使用をおすすめします。
-
AI生成した画像であることがバレる? C2PAとは
画像や動画の生成AIが進化し、本物と偽物の区別がつかなくなってきています。そこで業界団体は、作成者や使用ツールなどの情報をコンテンツに埋め込み、さらにデジタル署名をして信頼性を確保する、C2PAという ...
まとめ Fooocusの使い方
Fooocusは、SDXLをローカル環境で簡単に使えるツールです。
モデルやパラメーターが自動設定されるので、細かな調整が必要ありません。
txt2imgだけでなく、img2imgの機能が充実しています。
SDXL自体が古いバージョンはありますが、現状では十分に使うことができます。
変な画像が生成されるという不快感が少なく、意図した通りの結果となるので、画像生成AI初心者の方におすすめできます。