東北ずん子プロジェクトより ずんだの妖精 ずんだもん です。
素材はすべて生成AIによる30枚の画像です。
Qwen-Imageは解像度1024で学習する場合、Vram24Gbに収まらないためブロックスワップを使わないといけなくなり、そのため非常に学習時間がかかってしまいました。
そこで解像度512ではどうかと思いテストをするためにデータセットを作りました。
600ステップを21分程度で完了でき、まぁまぁな出来になってるのではないかと思います。
問題はキャプションのほうで、トリガーワードに指定したものはあまり意味が無いというのは少し前のテストでわかっていたので 彼女の名前はずんだもん(Her name is Zundamon) というものを最初に持ってきました。
結果として、これでも ずんだもん(zundamon) というワードでは出てきませんでした。
初音ミクが走っている と入れれば出てくるぐらいになるにはどうすればいいのか、というテストを今後していきたいと思っています。
と言ってもおそらくQwen-Imageは主流になるとは思いませんので今後の次期モデルにも応用できそうな知見を発見できたらと考えています。
1. The rights to reposted models belong to original creators.
2. Original creators should contact SeaArt.AI staff through official channels to claim their models. We are committed to protecting every creator's rights. Click to Claim
