この記事では2025年2月に公開されたillustrious XL 1.0 及び 1.1 について解説します。
Illustriousの基本概要
Illustriousは、主にアニメスタイルに特化したモデルです。その特徴を一言で表すならば、「Flux.1のアニメ版」。従来のモデルでは人物の詳細(特に手足)に破綻が見られることが多かったのに対して、Illustriousはこの問題を克服しました。このモデルの誕生により、アニメ調の画像生成が一段と精密で多様性に富んだものとなりました。
圧倒的な学習規模
これまで主流だったAnimagine XLやその派生モデルと比較すると、Illustriousの学習データ量は桁違いに多く、結果としてより多様な画像を生成する能力を持っています。
1.人物描写の進化
従来のSDXL系モデルでたびたび指摘されていた、手足や指の破綻が大幅に改善されています。「指が6本あるけど、まぁいいか」という古い時代は終わりました。また、学習規模の拡大により様々なポージングにも対応しました。これにより何度もseedガチャをしたり、いくつものポーズ専用のLoRAを用意する必要がなくなります。
2.アニメ系特化の完成度
SDXLベースのモデル全体としては風景や物体の描写が高品質である反面、人物描写の詳細は不安定という欠点がありました。しかし、Illustriousはこれを克服し、アニメ調画像では他を圧倒するクオリティを実現しています。
illustrious XL 1.0 及び 1.1の概要
illustrious XL 1.0 及び 1.1 は ONOMAAI によって公開されました。illustrious XL v0.1 の正式な後継であり、高品質な画像を生成するために調整されました。
高いプロンプト追従性を保ったまま、最高で1536x1536 ピクセルの画像を生成できます。
2024年6月までにdanbooruに追加された画像について学習されており、v0.1のLoRAと互換性があります。
v0.1からの主な進化点
高い解像度(1536x1536など)での生成にネイティブに対応しております。以前のSDXLモデルではこの解像度では画像が崩れる事が多かったのに対し、illustrious XL 1.0 及び 1.1 では正常に生成できます。
自然言語とdanbooruタグの両方のプロンプトスタイルに対応しており、生成画像のニュアンスを正確に調整できます。
特定のスタイルやアーティストなどに偏って学習されていないため、追加トレーニングのベースモデルとしても優秀です。
1.0と1.1の違い
- v1.1では、色とコントラストが調整されています
- 50%の迅速な自然言語をサポート
- 1536x1536などの高解像度でより良い結果を得られます
自然言語のプロンプトに関しては、ニュアンスの理解がv1.0とv1.1の間でわずかに異なります。
推奨設定
Steps: 22-28 (最大40まで設定できます)
CFG Scale: 3-5.5 (最大7まで設定できます)
Sampler: DPM 2S++ ancestral (他のほとんどのサンプラーも利用できます)
生成画像例
v0.1

v1.0

v1.1
















