この記事では、GR-illustrious 3in1について、より発展的に解説します。このモデルは他のillustriousモデルとは異なる特徴を持っているので、モデルについての知識を深めて更に高品質な画像を生成できるようになりましょう。実際の生成画像を用いて比較する記事もありますので、そちらも参照してみてください。
概要
GR-illustrious 3in1はSeaArt独占モデルの一つであり、illustriousをベースとしたアニメスタイルのモデルです。SeaArtの公式ガイドのモデレーターであるGrayManが制作したアニメ系の革命的モデルです。3つのスタイルの画像を生成することができます。通常のillustriousモデルのようにdanbooruデータベースのアーティストタグに加えて、GR-illustrious 3in1独自のスタイルを有効化する特定のキーワードがあります。
他のillustriousモデルと同様にdanbooruのタグが使用可能です。CFG Detail sliderと呼ばれる機能を備えており、CFGの値を変更することで生成画像の詳細をコントロールできます。GR-illustrious 3in1は、「美的アニメ (60%)、アニメ スクリーン キャップ (20%)、2.5D リアル レンダリング (20%)」の 3 つの異なるスタイルをベースとして生成するように調整されています。
他のillustriousモデルとの共通点
GR-illustrious 3in1は他のillustriousモデルと同様にdanbooru形式のタグ付けシステムに基づいています。これにより他のillustriousモデルで使ったプロンプトをそのまま使用できます。同様にパラメーター設定に関しても、そのほとんどを流用できます。
ほぼ全てのillustriousベースのLoRAが機能します。また、一部のAnimagine,PonyベースのLoRAも効果を発揮することがあります。
GR-illustrious 3in1の独自の特徴
GR-illustrious 3in1はいくつかの固有の特徴を持っています。以下にそれぞれの特徴を解説します。別記事で実際の生成画像を比較していますので、ご覧ください。
タグの反応性
まず、danbooruタグに準拠しないプロンプトへの反応がよくなるように調整されています。つまり、厳密にdanbooruタグを知らなくてもそれっぽくプロンプトを記述すればモデルがそれを理解して生成してくれるということです(当然ですがartistタグは例外です)。pony式のプロンプトに慣れている場合でも比較的スムーズにモデルを扱えます。これを応用して、GR-illustrious 3in1では自然言語形式でのプロンプトでも良好な反応を示します。一応、他のillustrious モデルでも自然言語形式でのプロンプトは可能ですが、その生成結果はdanbooruタグに準拠した場合と比べて明らかに劣ります。その一方でGR-illustrious 3in1では比較的danbooruタグに準拠した場合に近い品質での生成が可能です。実際には、割とめちゃくちゃなプロンプトでもそれなりに反応します。
生成時の解像度
また、GR-illustrious 3in1は生成時の解像度設定も特徴的です。同じくSeaArt独占モデルであるWAI-Pluralistic-Noobと比較してみましょう。WAI氏のモデルでは768x1152,1024x1024,程度から最大で1024x1536の解像度が推奨されています。これ以上の解像度での生成では画像の品質が低下します。この傾向は他の一般的なillustriousモデルにも当てはまります。一方でGR-illustrious 3in1においては更に大きな解像度が推奨されています。1024x1024から最大で2048x2048の高解像度が推奨されています。WAI氏のモデルとは逆に、768x1152などの比較的小さな解像度では生成画像の品質が低下します。これは別記事で比較しています。問題は、SeaArtのデフォルト設定では多くのモデルに合わせて1024x程度の解像度での設定が有効になっていることです。これではモデルの真価が発揮されません。そして多くのユーザーはGR-illustrious 3in1の特徴に気づいておらず、もったいないことをしています。モデル製作者のGrayManもDiscordで怒っていました😂
3つのスタイル
次に、モデルの名前にもなっている3つのスタイルについて解説します。3つのスタイルとは 美的アニメ 、アニメスクリーンキャップ、2.5D リアルレンダリングです。通常のillustriousモデルでは美的アニメの画像のみを対象にしていますが、GR-illustrious 3in1は他に2つのスタイルにも対応します。このスタイルの切り替えにはパラメーターの設定は必要ありません。artistタグのように、特定のキーワードをプロンプトに含めることでそれぞれのスタイルを有効化できます。具体的には、美的アニメはモデルのデフォルトのスタイルであり、タグは必要ありません。アニメスクリーンキャップは、プロンプトの最後に”anime screencap”を追加します。2.5D リアルレンダリングは、プロンプトの最後に”hyper-detailed, realistic”を追加します。こちらもそれぞれ別記事で比較しています。
CFG Detail Slider
最後に、CFG Detail Sliderについて触れておきましょう。これは、生成時のパラメーターのひとつであるCFG scaleを生成画像の詳細さのパラメーターとして扱う機能です。SD1.5のLoRAにDetail Tweaker LoRA (细节调整LoRA) がありましたが、それと同様の効果をもたらします。GR-illustrious 3in1ではCFGの値は3-7が推奨されていますが、つまりCFGを3に設定すれば柔らかい雰囲気の画像が生成され、7に設定すればより詳細に書き込まれた画像が生成されるということです。こちらも別記事で比較しています。
まとめ
GR-illustrious 3in1は他のillustriousモデルと異なる特徴を多く持っています。それ故にモデルに対する知識量が生成品質に大きく影響し、実際に使いこなせていないユーザーを多く目にします。GR-illustrious 3in1は非常に網羅性の高いモデルなので、モデルに対する知識が深まれば 創作の幅が大きく広がります。ぜひこのモデルを使いこなしてみてください~












