画像生成AIツール Stable Diffusion を始めてみた

初めての〇〇

記事の内容

・画像生成AIツールの導入から簡単な使い方までをまとめました。
・他のサイトを参考にしながら導入し、つまずいたポイントとその解決方法を説明します。

こんな画像が簡単に作れました。

初めて作ったAI画像。
始めてでこのクオリティ。

実写風も簡単に作れる。

謎の文字。文字の指定方法はこれから学ぶ。

簡単な手順(読み飛ばしてOK)

  1. ソフトをインストールする。
  2. モデル(画風)をインストールする(複数のモデルを導入可能)。
  3. 作りたい画像のイメージを単語で入力する。
  4. モデルと単語の組み合わせで画像が生成される(モデルの切り替えや単語の変更で異なる画像が作れる)。

画像生成AIツールの種類(読み飛ばしてOK)

ウェブサイトにアクセスして利用するタイプ

自分のPCにインストールして使うタイプ

  • Stable Diffusion

両方試した結果、Stable Diffusion の方が使い勝手がよかったです。

なぜ Stable Diffusion を選んだのか(読み飛ばしてOK)

  • 完全無料で制限なく使える
  • 日本語化が可能
  • 生成する画像に制限がない
  • Midjourney では思い通りの画像が出にくかったが、Stable Diffusion は意図的に出したい画像が作れた
  • 使い方がシンプルで直感的に理解できた

Stable Diffusion の導入方法

使用するツールを決める

Stable Diffusion を利用するにはいくつかのツールがあります。

  1. Stable Diffusion Web UI(おすすめ)
  2. NMKD Stable Diffusion GUI

簡単で使いやすい Stable Diffusion Web UI を選びました。

Stable Diffusion Web UI の公式ページ(読み飛ばしてOK)

Stable Diffusion Web UI 公式ページ

このサイトは分かりにくいですが、理解できなくてもツールは問題なく使えました。

動作に必要なスペック(読み飛ばしてOK)

  • NVIDIA GeForce RTX20シリーズ以降
  • VRAM(ビデオメモリ)10GB以上推奨

自分のPCがこのスペックを満たしているか分かりませんでしたが、とりあえず試してみることにしました。

基本ツールのダウンロードとインストール(必須)

  1. 以下のサイトから「sd.webui.zip」をダウンロード(無料)。
  2. ダウンロードしたZIPファイルを解凍し、Cドライブ直下に配置。
    ウェブで調べると、任意の場所に置けるという説明と、Cドライブ直下に置く方がよいという説明の両方があった。試してみたところ、Cドライブ直下の方がスムーズに動作したため、そちらを選んだ。

これで基本ツールのインストールは完了。

(参考)2023/10/24時点での画面

モデルのインストール(必須)

モデルとは?(理解必須)

Stable Diffusion では、「モデル」を使用して画風を決定します。モデルとは、AIが画像を作るための画風を決める設定データです。これを変えることで、写真風やアニメ風など、異なるスタイルの画像を作れます。

  • 同じ指示を出しても、選んだモデルによって生成される画像が大きく異なる。
  • インターネット上に多くのモデルが公開されており、複数のモデルをインストール可能。
  • 目的に応じてモデルを切り替えて利用

モデルのダウンロード(必須)

例として、クオリティの高い美少女イラストが作れるモデルを紹介。

Counterfeit-V2.5

以下の2つのファイルをダウンロードする。

  • Files and versions タブで Counterfeit-V2.5.safetensors をダウンロード(モデルファイル)
  • Files and versions タブで Counterfeit-V2.5.vae.pt をダウンロード(VAEファイル:画像の品質向上用)

safetensors がモデルデータで、VAE は画像をよりきれいにする補助ツール。safetensors だけでも動作するかもしれない。

(参考)2023/10/24時点の画面

モデル・VAEのインストール(必須)

ダウンロードしたファイルを以下のフォルダに配置。

  • モデルフォルダ: C:\sd.webui\webui\models\Stable-diffusion
  • VAEフォルダ: C:\sd.webui\webui\models\VAE

これで初期設定は完了。

(必須)モデル・VAEのインストール

解凍した基本ツールのフォルダの中に、ダウンロードしたモデルとVAEを入れる。

・モデルを入れるフォルダ
 C:\sd.webui\webui\models\Stable-diffusion
・VAEを入れるフォルダ
 C:\sd.webui\webui\models\VAE

※Cドライブ直下以外に配置した場合は、フォルダパスを適宜読み替えてください。

これで初期設定完了。

Stable Diffusion の起動

私はここで大きくつまずいたが、調べてみると意外と簡単な解決方法が見つかったので紹介する。

起動手順

  1. C:\sd.webui\run.bat を実行。
  2. コマンド画面が立ち上がり、処理が始まる。

※ここでかなりつまづいた

初回起動時のエラーと解決方法(読み飛ばしてOK)

  • Python のインストールは成功したが、その後エラーで黒いコマンド画面が閉じてしまう。
  • C:\sd.webui\update.bat を実行する。これだけで解決した。

なお、Stable Diffusion を使用中は黒いコマンド画面を閉じずに開いたままにしておく必要がある。

日本語化の方法

  1. Extensions タブ → Available タブ → localization のチェックを外す。
  2. Load from: ボタンを押す。
  3. stable-diffusion-webui-localization-ja_JP をインストール。
  4. SettingsUser interfaceLocalizationja_JP を選択。
    ※最初はja_JPが選択肢に出なかったが、右の青いリフレッシュボタンを押したら出た。
  5. Apply settings を押して完了。

画像生成方法

画像生成の基本

AIで画像を生成するには、プロンプト(呪文)を入力します。

① モデル(画風)を選ぶ

複数のモデル(画風)をインストールしている場合は、ここで切り替えが可能です。

② プロンプトを入力

生成したい画像の内容を英単語でカンマ区切りにして指定します。

(例) 1girl, snow, sports

これが生成された

③ ネガティブプロンプトを入力

避けたい要素を指定します。こちらも英単語をカンマ区切りで記述。
以下は基本的な文例

(例) EasyNegative, (worst quality, low quality:1.3), (monochrome, grayscale, poorly eyes, bad hands, watermark, username:1.2), nsfw

これが生成された

生成した画像の保存場所

C:\sd.webui\webui\outputs\txt2img-images に保存される。

モデル(画風)の追加

モデルを追加・切り替えることで、異なる画風の画像を生成できます。

  • Civitai(https://civitai.com/
    • 多数のモデルが公開されており、ダウンロードしてフォルダに入れることで使用可能。
    • 初回使用時には「青いリフレッシュボタン」を押す。
  • モデルを保存するフォルダ
    • C:\sd.webui\webui\models\Stable-diffusion
  • 青いリフレッシュボタン
    • 新しいモデルを読み込むために必要。

プロンプトの参考

  • ちちぷい(https://www.chichi-pui.com/
    • AI画像が多数投稿されており、プロンプトの例が掲載されている。

よく使われるが意味が分かりにくいプロンプト

特定の単語を強調したい場合

  • ( )で囲むと強調される
  • ( )内に数値を入れると強調度を指定できる

(プロンプトの例)

1girl, snow, sports  ← 普通の指示
1girl, (snow), sports  ← snow を強調
1girl, (snow:2), sports  ← snow を強く強調
1girl, (snow:0.2), sports  ← snow を弱める

1girl, snow, sports ← 普通の指示

1girl, (snow), sports ← snow を強調

1girl, (snow:2), sports ← snow を強く強調

1girl, (snow:0.2), sports ← snow を弱める

(モデルを変更した場合の例:Beautiful Realistic Asians

1girl, snow, sports  ← 普通の指示
1girl, (snow), sports  ← snow を強調
1girl, (snow:2), sports  ← snow を強く強調
1girl, (snow:0.2), sports  ← snow を弱める

1girl, snow, sports ← 普通の指示

1girl, (snow), sports ← snow を強調

1girl, (snow:2), sports ← snow を強く強調

1girl, (snow:0.2), sports ← snow を弱める

アダルト画像を作りたい/作りたくない場合

  • nsfw(not safe for work:職場閲覧注意)を使う。
    • 作りたい場合 → プロンプトに nsfw を含める。
    • 作りたくない場合 → ネガティブプロンプトに nsfw を入れる。

まとめ

Stable Diffusionは、無料で高品質な画像を生成できるAIツールであり、導入も比較的簡単です。本記事では、 インストールから基本的な使い方、エラー対処法、日本語化の方法 まで詳しく解説しました。

最初は設定やモデルの選択に戸惑うこともあるかもしれませんが、少しずつ試しながら慣れていくことで、 自分好みの画像を自在に生成できるようになります 。追加のモデルを導入することで、さらに多彩な表現が可能になるので、ぜひいろいろ試してみてください!

Stable Diffusionを活用して、 あなただけのオリジナル画像を楽しみましょう!