詳細
おすすめ
unet q8_0
unet q4_0
checkpoints
diffusion_models bf16
Qwen 2vl Flux

Qwen 2vl Flux

870
18
175
#ベースモデル
#FLUX

Original Project found here: https://huggingface.co/Djrango/Qwen2vl-Flux

Qwen2vl-Flux is a state-of-the-art multimodal image generation model that enhances FLUX with Qwen2VL's vision-language understanding capabilities. This model excels at generating high-quality images based on both text prompts and visual references, offering superior multimodal understanding and control.

  • ComfyUI currently doesn't support and there is no available nodes to load the CLIP+LLM portion into it

  • This is just for reviewing/testing the finetuned trained part of the Flux model

  • CFG set to 1 on KSampler

  • Rendered an image in 150s using 8GB GPU @ 512px / 10 steps using the bf16 model

  • This model comes will be available in 3 formats named after the folder it should be in

    • diffusion_models - This one is in diffusers format, it is just the merged safetensors file from HuggingFace page

    • checkpoints - This one has been converted to Flux Transformers format and prefix for stable_diffusion compatibility, does not include CLIP and VAE

    • unet - I will provide the q4_0 and q8 variants, make a comment if you'd like to see any other quants

翻訳を表示

評価とレビュー

-- /5
0 件の評価

まだ十分な評価やレビューが集まっていません

no-data
データなし
A
モデルと会話する
お知らせ
2024-11-26
モデルを公開
2024-11-26
モデル情報を更新
モデル詳細
タイプ
Checkpoint
投稿日時
2024-11-26
基本モデル
Flux.1 D
バージョン紹介
  • This file goes in the unet folder

  • Loaded with UNET Loader (GGUF)

  • Quantsized from bf16 to q8_0

許可範囲
モデルソース: civitai

1.転載モデルは学習・共有目的のみで使用し、著作権は原作者に帰属します

2.モデルの認証は公式チャンネルでご連絡ください。クリエイターの権利保護に努めています クリックして認証

創作許可範囲
オンライン画像生成
統合
ダウンロード
商用利用の許可範囲
生成された画像は販売または商業目的での使用
モデルの転売やモデル統合後の販売
QR Code
SeaArt Appをダウンロード
モバイルでAI創作の旅を続けよう