Flux installation : guide pas à pas pour l’exécution locale
Installer Flux localement, c’est générer des images IA de qualité professionnelle sans abonnement, sans API et sans limite. Ce guide couvre le choix du modèle, l’installation de ComfyUI, le téléchargement des fichiers et l’optimisation VRAM.
L’un des plus grands avantages de Flux par rapport à Midjourney ou DALL-E est la possibilité de l’exécuter sur votre propre GPU. Zéro coût récurrent, confidentialité totale, générations illimitées. En contrepartie, l’installation demande quelques étapes techniques. Ce guide est conçu pour être complet et accessible, même si vous n’avez jamais installé de modèle de diffusion localement.
- GPU
- NVIDIA avec 8 Go VRAM minimum (12-24 Go recommandé)
- RAM
- 16 Go minimum (32 Go recommandé)
- Stockage
- ≈ 15-30 Go d’espace libre (selon le modèle)
- OS
- Windows 10/11, Linux, macOS (Apple Silicon supporté, plus lent)
- Interface
- ComfyUI (recommandé) ou Forge
- Temps d’installation
- ≈ 20-45 minutes (téléchargements inclus)
Étape 1 : choisir le bon modèle Flux
Avant de commencer l’installation, vous devez choisir quel modèle Flux installer. Le choix dépend principalement de votre VRAM disponible et de votre usage.
| Modèle | VRAM requise | Taille fichier | Qualité | Vitesse | Recommandé pour |
|---|---|---|---|---|---|
| FLUX.1 [schnell] | 8-12 Go | ≈ 12 Go | Bonne | Très rapide (1-4 steps) | Prototypage, itération rapide, GPU limité |
| FLUX.1 [dev] FP8 | 12-16 Go | ≈ 12 Go | Très bonne | Moyenne (20-50 steps) | Meilleur rapport qualité/VRAM (choix recommandé) |
| FLUX.1 [dev] FP16 | 24 Go | ≈ 24 Go | Excellente | Moyenne | Qualité maximale FLUX.1, GPU haut de gamme |
| FLUX.1 [dev] GGUF Q5 | 8-10 Go | ≈ 8 Go | Bonne (légère perte) | Plus lente | GPU 8 Go (RTX 3060) |
| FLUX.1 [dev] GGUF Q3/Q4 | 4-6 Go | ≈ 4-6 Go | Correcte (perte notable) | Lente | GPU très limité (expérimental) |
| FLUX.2 [klein 4B] | 8-12 Go | ≈ 8 Go | Très bonne | Sub-seconde à quelques sec | Meilleur compromis 2026 pour GPU milieu de gamme |
| FLUX.2 [dev] FP8 | 24 Go | ≈ 20 Go | Excellente | Moyenne-lente | Qualité maximale FLUX.2, RTX 4090 |
Étape 2 : installer ComfyUI
ComfyUI est l’interface recommandée pour Flux. C’est un éditeur de workflows par nœuds (nodes) qui offre un contrôle total sur le pipeline de génération. Black Forest Labs collabore directement avec ComfyUI pour fournir des templates optimisés.
Installation Windows
Méthode simple (package portable) :
- Rendez-vous sur la page des releases ComfyUI sur GitHub.
- Téléchargez le fichier
ComfyUI_windows_portable_nvidia.7z. - Extrayez l’archive avec 7-Zip dans un dossier facile d’accès (ex.
C:comfyui). - Double-cliquez sur
run_nvidia_gpu.batpour lancer ComfyUI. - Vérifiez dans le terminal que votre GPU est détecté correctement.
Méthode alternative (ComfyUI Desktop) : ComfyUI propose aussi un installateur standalone qui gère Python et les dépendances automatiquement. C’est l’option la plus simple si vous ne voulez pas toucher à la ligne de commande.
Installation Linux et macOS
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
python3.10 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
# Lancement standard
python main.py
# Lancement low VRAM (8-12 Go)
python main.py --lowvram
# Lancement très low VRAM (6-8 Go)
python main.py --lowvram --cpu-text-encoder
Étape 3 : télécharger les fichiers du modèle
Flux utilise une architecture séparée : le modèle principal (UNET), les encodeurs de texte (CLIP + T5) et le VAE sont des fichiers distincts. Voici les fichiers à télécharger et où les placer.
Pour FLUX.1 [dev] FP8 (recommandé pour débuter)
| Fichier | Source | Taille | Dossier ComfyUI |
|---|---|---|---|
| flux1-dev-fp8.safetensors | Hugging Face (black-forest-labs) | ≈ 12 Go | models/checkpoints/ ou models/unet/ |
| t5xxl_fp8_e4m3fn.safetensors | Hugging Face (comfyanonymous) | ≈ 5 Go | models/clip/ |
| clip_l.safetensors | Hugging Face (comfyanonymous) | ≈ 250 Mo | models/clip/ |
| ae.safetensors (VAE Flux) | Hugging Face (black-forest-labs) | ≈ 350 Mo | models/vae/ |
Le téléchargement total est d’environ 17 Go. Si votre connexion est lente, commencez par le modèle schnell (≈ 12 Go au total, mêmes encodeurs) pour tester rapidement.
Pour FLUX.1 [dev] GGUF (GPU 8 Go)
Les modèles GGUF sont des versions quantifiées qui réduisent drastiquement la VRAM requise. Vous devez installer le nœud custom ComfyUI-GGUF via le ComfyUI Manager :
- Dans ComfyUI, ouvrez le Manager (menu en haut à droite).
- Cherchez « GGUF » et installez le nœud ComfyUI-GGUF.
- Redémarrez ComfyUI.
- Téléchargez le fichier GGUF de votre choix (Q5 pour un bon compromis qualité/VRAM, Q3 pour 4 Go VRAM).
- Placez-le dans
models/unet/. - Utilisez le nœud « UNETLoader (GGUF) » au lieu du « Load Checkpoint » standard.
Étape 4 : générer votre première image
Charger le workflow Flux
- Lancez ComfyUI.
- Cliquez sur « Workflow » en haut à gauche, puis « Browse Templates ».
- Sélectionnez « Flux Dev » pour charger le workflow pré-configuré.
- Dans le nœud « Load Checkpoint » ou « Load Diffusion Model », sélectionnez votre fichier modèle (
flux1-dev-fp8.safetensors). - Dans le nœud « DualCLIPLoader », sélectionnez
clip_l.safetensorsett5xxl_fp8_e4m3fn.safetensors. - Dans le nœud « VAELoader », sélectionnez
ae.safetensors.
Votre premier prompt
Tapez un prompt dans le nœud « CLIP Text Encode ». Commencez par quelque chose de simple :
A cat holding a sign that says "Hello World", studio lighting,
high detail, professional photography
Réglez les paramètres du sampler :
- Steps : 20 pour Flux Dev (4 pour schnell)
- CFG : 3.5 (Flux fonctionne mieux avec un CFG bas, contrairement à SDXL qui utilise 7-12)
- Résolution : 1024×1024 pour commencer
- Seed : -1 pour un résultat aléatoire à chaque génération
Cliquez sur « Queue Prompt » (ou appuyez sur Ctrl+Enter). La première génération est plus lente car le modèle est chargé en mémoire. Les suivantes seront plus rapides.
Étape 5 : optimiser les performances
Gestion de la VRAM
Si vous rencontrez des erreurs « CUDA out of memory », voici les solutions par ordre de priorité :
1. Activer le mode lowVRAM. Lancez ComfyUI avec python main.py --lowvram (ou ajoutez --lowvram dans le fichier .bat sur Windows). Ce mode décharge les parties inactives du modèle vers la RAM système.
2. Décharger l’encodeur T5 sur CPU. L’encodeur T5 (≈ 5 Go) peut tourner sur CPU sans impact majeur sur la qualité. Ajoutez --cpu-text-encoder aux arguments de lancement.
3. Utiliser un modèle quantifié. Passez de FP16 à FP8 (environ 50 % de réduction VRAM) ou à GGUF Q5/Q4 pour des réductions encore plus agressives.
4. Réduire la résolution. Générez en 768×768 au lieu de 1024×1024, puis upscalez avec un nœud de super-résolution intégré à ComfyUI.
5. Activer le weight streaming (FLUX.2). ComfyUI supporte le weight streaming, qui charge progressivement le modèle en VRAM à la demande. C’est indispensable pour FLUX.2 sur des GPU de 24 Go.
Conseils pour de meilleures performances
Utilisez schnell pour itérer, dev pour finaliser. Testez vos prompts avec FLUX.1 [schnell] (1 à 4 étapes, très rapide), puis basculez vers [dev] une fois le prompt validé. C’est le workflow le plus productif.
Gardez le CFG bas. Flux fonctionne mieux avec un CFG (Classifier-Free Guidance) entre 1.0 et 4.0. Des valeurs plus élevées (7+) produisent des images « over-cooked » (surtraitées, couleurs saturées, perte de naturel). Si vous venez de SDXL (CFG typique 7-12), baissez votre CFG.
Activez le cache modèle. Dans les paramètres ComfyUI, activez le cache pour éviter de recharger le modèle entre chaque génération. Le gain de temps est significatif si vous générez de nombreuses images successivement.
Installer des LoRA
Les LoRA ajoutent des styles ou des sujets spécialisés au modèle de base. Pour installer un LoRA Flux :
- Téléchargez le fichier LoRA (
.safetensors, typiquement 20 à 300 Mo) depuis Hugging Face ou CivitAI. - Placez-le dans
ComfyUI/models/loras/. - Dans votre workflow, ajoutez un nœud « Load LoRA » entre le chargement du modèle et le sampler.
- Réglez la force (strength) entre 0.5 et 0.8 pour un résultat naturel. Au-delà de 1.0, le LoRA domine excessivement le résultat.
LoRA populaires pour Flux : FLUX-RealismLoRA (22 Mo, améliore le photoréalisme), Flux UltraRealistic V2 (anatomie et éclairage), ainsi que des LoRA de style (anime, peinture, illustration) disponibles sur CivitAI.
Installer FLUX.2 localement
FLUX.2 est le modèle de dernière génération (32B paramètres), significativement plus exigeant que FLUX.1. L’installation suit le même processus que FLUX.1 via ComfyUI, mais avec des exigences matérielles supérieures et quelques spécificités.
FLUX.2 [klein 4B] est le point d’entrée recommandé. Sous licence Apache 2.0, il fonctionne sur des GPU de 12 Go en FP8 et génère des images en sub-seconde à quelques secondes. Le processus d’installation est identique à FLUX.1 : téléchargez le checkpoint FLUX.2 klein depuis Hugging Face, placez-le dans models/checkpoints/ ou models/unet/, et utilisez les templates FLUX.2 de ComfyUI. L’encodeur de texte de FLUX.2 est basé sur Mistral-3 au lieu du T5 utilisé par FLUX.1, ce qui nécessite un fichier encodeur différent.
FLUX.2 [dev] complet nécessite au minimum 24 Go de VRAM en FP8. Sur une RTX 4090, activez le weight streaming dans ComfyUI pour charger progressivement le modèle. Stability Matrix peut simplifier la gestion des dépendances et des fichiers de modèles si vous gérez plusieurs versions de Flux simultanément. Pour un setup FLUX.2 Max (le modèle le plus puissant avec multi-référence jusqu’à 10 images), comptez 32 Go de RAM système et idéalement 64 Go pour un fonctionnement fluide du weight offloading.
Les workflows FLUX.2 sont disponibles sur le GitHub de Black Forest Labs et dans les templates ComfyUI. Le nœud principal change : utilisez « UNETLoader » pointant vers le fichier FLUX.2 et « DualCLIPLoader » avec l’encodeur Mistral au lieu du T5.
Workflows avancés
Une fois l’installation de base fonctionnelle, explorez ces workflows avancés dans ComfyUI :
Img2Img. Chargez une image existante dans le nœud « Load Image » et utilisez-la comme point de départ pour la génération. Le nœud VAEEncode transforme l’image en espace latent, puis le sampler la modifie selon votre prompt. Ajustez le « denoise » (0.0 à 1.0) pour contrôler combien l’image originale est préservée.
Inpainting avec Flux Fill. Les outils FLUX.1 Tools incluent Flux Fill pour l’inpainting (remplir une zone masquée) et l’outpainting (étendre l’image au-delà de ses bords). Téléchargez le modèle Fill correspondant et utilisez les nœuds dédiés dans ComfyUI. Pour une page de guide sur les prompts optimaux pour Flux, consultez Flux prompts.
ControlNet (Depth, Canny). Flux Depth et Flux Canny permettent de contrôler la génération en extrayant la carte de profondeur ou les contours d’une image d’entrée. C’est essentiel pour maintenir une pose ou une composition spécifique tout en changeant le style ou le sujet.
Upscaling en deux passes. Générez d’abord en 768×768 (plus rapide, moins de VRAM), puis utilisez un nœud d’upscaling (HighResFix, ESRGAN ou un second passage de diffusion) pour monter en résolution. Ce workflow est particulièrement utile sur les GPU avec VRAM limitée.
Dépannage
Erreur « CUDA out of memory ». Voir la section optimisation ci-dessus. En résumé : ajoutez --lowvram, utilisez un modèle FP8 ou GGUF, réduisez la résolution.
Erreur « No module named torch ». Votre environnement Python n’a pas PyTorch installé avec le support CUDA. Réinstallez PyTorch avec CUDA 12.1 : pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121.
Image entièrement noire ou bruitée. Vérifiez que vous utilisez le bon VAE (ae.safetensors pour Flux, pas un VAE SDXL). Vérifiez aussi que le CFG n’est pas trop élevé (gardez-le sous 5.0).
Le texte dans les images est illisible. Assurez-vous d’utiliser Flux Dev ou Pro (schnell a un rendu de texte moins fiable). Mettez le texte souhaité entre guillemets dans le prompt : A sign that says "Welcome".
ComfyUI ne détecte pas le GPU. Vérifiez que vos drivers NVIDIA sont à jour (CUDA 12.1+ recommandé). Sur Linux, vérifiez que le package nvidia-smi fonctionne. Sur Windows, utilisez le fichier run_nvidia_gpu.bat et pas un lancement manuel.
Questions fréquentes sur l’installation de Flux
Peut-on installer Flux sans GPU NVIDIA ?
Partiellement. Sur Apple Silicon (M1/M2/M3/M4), Flux fonctionne via le backend Metal, avec une vitesse 2 à 4 fois inférieure à un GPU NVIDIA. Sur AMD (Linux avec ROCm), le support est expérimental. Sur CPU uniquement, c’est techniquement possible mais extrêmement lent (5 à 15 minutes par image). Pour une expérience locale correcte, un GPU NVIDIA avec 12 Go de VRAM minimum est fortement recommandé.
Combien d’espace disque faut-il ?
Comptez environ 15 à 30 Go selon le modèle choisi. FLUX.1 [dev] FP8 avec les encodeurs et le VAE totalise ≈ 17 Go. FLUX.1 [dev] FP16 monte à ≈ 30 Go. Les modèles GGUF quantifiés sont plus légers (4 à 10 Go). Ajoutez de l’espace pour les LoRA (20 à 300 Mo chacun) et les images générées.
ComfyUI ou Forge : lequel choisir pour Flux ?
ComfyUI est le choix recommandé. C’est l’interface la mieux supportée par Black Forest Labs, avec des templates officiels Flux et un support optimisé du weight streaming pour FLUX.2. Forge est une alternative si vous préférez une interface formulaire classique (type Automatic1111) plutôt que des nœuds. Automatic1111 standard ne supporte pas Flux.
Peut-on utiliser les images générées commercialement ?
FLUX.1 [schnell] est sous licence Apache 2.0, libre pour tout usage commercial. FLUX.1 [dev] est sous licence non-commerciale : l’usage commercial nécessite l’achat d’une licence à 999 $/mois auprès de BFL. Pour un usage commercial sans licence, utilisez schnell (gratuit) ou l’API BFL Pro (pay-per-image, droits commerciaux inclus). FLUX.2 [klein] sous Apache 2.0 est aussi libre pour l’usage commercial.
Quel est le temps de génération par image ?
Cela dépend du modèle et du GPU. Sur une RTX 4090 : FLUX.1 [schnell] ≈ 3-6 secondes, FLUX.1 [dev] FP8 ≈ 15-30 secondes, FLUX.2 [klein] ≈ 1-2 secondes. Sur une RTX 3060 12 Go avec FLUX.1 [dev] FP8 : environ 45-60 secondes par image. La première génération de chaque session est plus lente (chargement du modèle en mémoire).