Flux installation : guide pas à pas pour l’exécution locale

Installer Flux localement, c’est générer des images IA de qualité professionnelle sans abonnement, sans API et sans limite. Ce guide couvre le choix du modèle, l’installation de ComfyUI, le téléchargement des fichiers et l’optimisation VRAM.

L’un des plus grands avantages de Flux par rapport à Midjourney ou DALL-E est la possibilité de l’exécuter sur votre propre GPU. Zéro coût récurrent, confidentialité totale, générations illimitées. En contrepartie, l’installation demande quelques étapes techniques. Ce guide est conçu pour être complet et accessible, même si vous n’avez jamais installé de modèle de diffusion localement.

GPU: NVIDIA avec 8 Go VRAM minimum (12-24 Go recommandé)
RAM: 16 Go minimum (32 Go recommandé)
Stockage: ≈ 15-30 Go d’espace libre (selon le modèle)
OS: Windows 10/11, Linux, macOS (Apple Silicon supporté, plus lent)
Interface: ComfyUI (recommandé) ou Forge
Temps d’installation: ≈ 20-45 minutes (téléchargements inclus)

Étape 1 : choisir le bon modèle Flux

Avant de commencer l’installation, vous devez choisir quel modèle Flux installer. Le choix dépend principalement de votre VRAM disponible et de votre usage.

Modèle	VRAM requise	Taille fichier	Qualité	Vitesse	Recommandé pour
FLUX.1 [schnell]	8-12 Go	≈ 12 Go	Bonne	Très rapide (1-4 steps)	Prototypage, itération rapide, GPU limité
FLUX.1 [dev] FP8	12-16 Go	≈ 12 Go	Très bonne	Moyenne (20-50 steps)	Meilleur rapport qualité/VRAM (choix recommandé)
FLUX.1 [dev] FP16	24 Go	≈ 24 Go	Excellente	Moyenne	Qualité maximale FLUX.1, GPU haut de gamme
FLUX.1 [dev] GGUF Q5	8-10 Go	≈ 8 Go	Bonne (légère perte)	Plus lente	GPU 8 Go (RTX 3060)
FLUX.1 [dev] GGUF Q3/Q4	4-6 Go	≈ 4-6 Go	Correcte (perte notable)	Lente	GPU très limité (expérimental)
FLUX.2 [klein 4B]	8-12 Go	≈ 8 Go	Très bonne	Sub-seconde à quelques sec	Meilleur compromis 2026 pour GPU milieu de gamme
FLUX.2 [dev] FP8	24 Go	≈ 20 Go	Excellente	Moyenne-lente	Qualité maximale FLUX.2, RTX 4090

Recommandation par GPU RTX 3060 12 Go ou RTX 4060 Ti 16 Go : commencez par FLUX.1 [dev] FP8 ou FLUX.2 [klein 4B]. RTX 4090 24 Go ou RTX 3090 24 Go : installez FLUX.1 [dev] FP16 ou FLUX.2 [dev] FP8. GPU 8 Go : essayez FLUX.1 [dev] GGUF Q5 ou restez sur SDXL pour une meilleure expérience.

Étape 2 : installer ComfyUI

ComfyUI est l’interface recommandée pour Flux. C’est un éditeur de workflows par nœuds (nodes) qui offre un contrôle total sur le pipeline de génération. Black Forest Labs collabore directement avec ComfyUI pour fournir des templates optimisés.

Installation Windows

Méthode simple (package portable) :

Rendez-vous sur la page des releases ComfyUI sur GitHub.
Téléchargez le fichier ComfyUI_windows_portable_nvidia.7z.
Extrayez l’archive avec 7-Zip dans un dossier facile d’accès (ex. C:comfyui).
Double-cliquez sur run_nvidia_gpu.bat pour lancer ComfyUI.
Vérifiez dans le terminal que votre GPU est détecté correctement.

Méthode alternative (ComfyUI Desktop) : ComfyUI propose aussi un installateur standalone qui gère Python et les dépendances automatiquement. C’est l’option la plus simple si vous ne voulez pas toucher à la ligne de commande.

Installation Linux et macOS

git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
python3.10 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

# Lancement standard
python main.py

# Lancement low VRAM (8-12 Go)
python main.py --lowvram

# Lancement très low VRAM (6-8 Go)
python main.py --lowvram --cpu-text-encoder

macOS (Apple Silicon) Flux fonctionne sur Apple Silicon (M1/M2/M3/M4) via le backend Metal, mais la vitesse est 2 à 4 fois inférieure à un GPU NVIDIA équivalent. Pour la meilleure expérience sur Mac, utilisez Draw Things ou Stability Matrix. Les Mac avec 16 Go de mémoire unifiée peuvent faire tourner FLUX.1 [dev] FP8 sans problème grâce à l’architecture mémoire unifiée.

Automatic1111 et Forge Automatic1111 ne supporte pas Flux nativement. Si vous préférez une interface classique (formulaire web) plutôt que les nœuds de ComfyUI, utilisez Forge (un fork optimisé d’Automatic1111) qui supporte Flux. Téléchargez le package one-click Forge depuis GitHub.

Étape 3 : télécharger les fichiers du modèle

Flux utilise une architecture séparée : le modèle principal (UNET), les encodeurs de texte (CLIP + T5) et le VAE sont des fichiers distincts. Voici les fichiers à télécharger et où les placer.

Pour FLUX.1 [dev] FP8 (recommandé pour débuter)

Fichier	Source	Taille	Dossier ComfyUI
flux1-dev-fp8.safetensors	Hugging Face (black-forest-labs)	≈ 12 Go	`models/checkpoints/` ou `models/unet/`
t5xxl_fp8_e4m3fn.safetensors	Hugging Face (comfyanonymous)	≈ 5 Go	`models/clip/`
clip_l.safetensors	Hugging Face (comfyanonymous)	≈ 250 Mo	`models/clip/`
ae.safetensors (VAE Flux)	Hugging Face (black-forest-labs)	≈ 350 Mo	`models/vae/`

Le téléchargement total est d’environ 17 Go. Si votre connexion est lente, commencez par le modèle schnell (≈ 12 Go au total, mêmes encodeurs) pour tester rapidement.

Pour FLUX.1 [dev] GGUF (GPU 8 Go)

Les modèles GGUF sont des versions quantifiées qui réduisent drastiquement la VRAM requise. Vous devez installer le nœud custom ComfyUI-GGUF via le ComfyUI Manager :

Dans ComfyUI, ouvrez le Manager (menu en haut à droite).
Cherchez « GGUF » et installez le nœud ComfyUI-GGUF.
Redémarrez ComfyUI.
Téléchargez le fichier GGUF de votre choix (Q5 pour un bon compromis qualité/VRAM, Q3 pour 4 Go VRAM).
Placez-le dans models/unet/.
Utilisez le nœud « UNETLoader (GGUF) » au lieu du « Load Checkpoint » standard.

Règle empirique GGUF La taille du fichier GGUF en Go correspond approximativement à la VRAM nécessaire. Un fichier Q5 de 8 Go nécessite environ 8 Go de VRAM. Un fichier Q3 de 4 Go fonctionne sur un GPU de 4-6 Go. Plus la quantification est agressive, plus la qualité diminue, mais la perte est souvent acceptable jusqu’à Q4.

Étape 4 : générer votre première image

Charger le workflow Flux

Lancez ComfyUI.
Cliquez sur « Workflow » en haut à gauche, puis « Browse Templates ».
Sélectionnez « Flux Dev » pour charger le workflow pré-configuré.
Dans le nœud « Load Checkpoint » ou « Load Diffusion Model », sélectionnez votre fichier modèle (flux1-dev-fp8.safetensors).
Dans le nœud « DualCLIPLoader », sélectionnez clip_l.safetensors et t5xxl_fp8_e4m3fn.safetensors.
Dans le nœud « VAELoader », sélectionnez ae.safetensors.

Votre premier prompt

Tapez un prompt dans le nœud « CLIP Text Encode ». Commencez par quelque chose de simple :

A cat holding a sign that says "Hello World", studio lighting, 
high detail, professional photography

Réglez les paramètres du sampler :

Steps : 20 pour Flux Dev (4 pour schnell)
CFG : 3.5 (Flux fonctionne mieux avec un CFG bas, contrairement à SDXL qui utilise 7-12)
Résolution : 1024×1024 pour commencer
Seed : -1 pour un résultat aléatoire à chaque génération

Cliquez sur « Queue Prompt » (ou appuyez sur Ctrl+Enter). La première génération est plus lente car le modèle est chargé en mémoire. Les suivantes seront plus rapides.

Étape 5 : optimiser les performances

Gestion de la VRAM

Si vous rencontrez des erreurs « CUDA out of memory », voici les solutions par ordre de priorité :

1. Activer le mode lowVRAM. Lancez ComfyUI avec python main.py --lowvram (ou ajoutez --lowvram dans le fichier .bat sur Windows). Ce mode décharge les parties inactives du modèle vers la RAM système.

2. Décharger l’encodeur T5 sur CPU. L’encodeur T5 (≈ 5 Go) peut tourner sur CPU sans impact majeur sur la qualité. Ajoutez --cpu-text-encoder aux arguments de lancement.

3. Utiliser un modèle quantifié. Passez de FP16 à FP8 (environ 50 % de réduction VRAM) ou à GGUF Q5/Q4 pour des réductions encore plus agressives.

4. Réduire la résolution. Générez en 768×768 au lieu de 1024×1024, puis upscalez avec un nœud de super-résolution intégré à ComfyUI.

5. Activer le weight streaming (FLUX.2). ComfyUI supporte le weight streaming, qui charge progressivement le modèle en VRAM à la demande. C’est indispensable pour FLUX.2 sur des GPU de 24 Go.

Conseils pour de meilleures performances

Utilisez schnell pour itérer, dev pour finaliser. Testez vos prompts avec FLUX.1 [schnell] (1 à 4 étapes, très rapide), puis basculez vers [dev] une fois le prompt validé. C’est le workflow le plus productif.

Gardez le CFG bas. Flux fonctionne mieux avec un CFG (Classifier-Free Guidance) entre 1.0 et 4.0. Des valeurs plus élevées (7+) produisent des images « over-cooked » (surtraitées, couleurs saturées, perte de naturel). Si vous venez de SDXL (CFG typique 7-12), baissez votre CFG.

Activez le cache modèle. Dans les paramètres ComfyUI, activez le cache pour éviter de recharger le modèle entre chaque génération. Le gain de temps est significatif si vous générez de nombreuses images successivement.

Installer des LoRA

Les LoRA ajoutent des styles ou des sujets spécialisés au modèle de base. Pour installer un LoRA Flux :

Téléchargez le fichier LoRA (.safetensors, typiquement 20 à 300 Mo) depuis Hugging Face ou CivitAI.
Placez-le dans ComfyUI/models/loras/.
Dans votre workflow, ajoutez un nœud « Load LoRA » entre le chargement du modèle et le sampler.
Réglez la force (strength) entre 0.5 et 0.8 pour un résultat naturel. Au-delà de 1.0, le LoRA domine excessivement le résultat.

LoRA populaires pour Flux : FLUX-RealismLoRA (22 Mo, améliore le photoréalisme), Flux UltraRealistic V2 (anatomie et éclairage), ainsi que des LoRA de style (anime, peinture, illustration) disponibles sur CivitAI.

Installer FLUX.2 localement

FLUX.2 est le modèle de dernière génération (32B paramètres), significativement plus exigeant que FLUX.1. L’installation suit le même processus que FLUX.1 via ComfyUI, mais avec des exigences matérielles supérieures et quelques spécificités.

FLUX.2 [klein 4B] est le point d’entrée recommandé. Sous licence Apache 2.0, il fonctionne sur des GPU de 12 Go en FP8 et génère des images en sub-seconde à quelques secondes. Le processus d’installation est identique à FLUX.1 : téléchargez le checkpoint FLUX.2 klein depuis Hugging Face, placez-le dans models/checkpoints/ ou models/unet/, et utilisez les templates FLUX.2 de ComfyUI. L’encodeur de texte de FLUX.2 est basé sur Mistral-3 au lieu du T5 utilisé par FLUX.1, ce qui nécessite un fichier encodeur différent.

FLUX.2 [dev] complet nécessite au minimum 24 Go de VRAM en FP8. Sur une RTX 4090, activez le weight streaming dans ComfyUI pour charger progressivement le modèle. Stability Matrix peut simplifier la gestion des dépendances et des fichiers de modèles si vous gérez plusieurs versions de Flux simultanément. Pour un setup FLUX.2 Max (le modèle le plus puissant avec multi-référence jusqu’à 10 images), comptez 32 Go de RAM système et idéalement 64 Go pour un fonctionnement fluide du weight offloading.

Les workflows FLUX.2 sont disponibles sur le GitHub de Black Forest Labs et dans les templates ComfyUI. Le nœud principal change : utilisez « UNETLoader » pointant vers le fichier FLUX.2 et « DualCLIPLoader » avec l’encodeur Mistral au lieu du T5.

Workflows avancés

Une fois l’installation de base fonctionnelle, explorez ces workflows avancés dans ComfyUI :

Img2Img. Chargez une image existante dans le nœud « Load Image » et utilisez-la comme point de départ pour la génération. Le nœud VAEEncode transforme l’image en espace latent, puis le sampler la modifie selon votre prompt. Ajustez le « denoise » (0.0 à 1.0) pour contrôler combien l’image originale est préservée.

Inpainting avec Flux Fill. Les outils FLUX.1 Tools incluent Flux Fill pour l’inpainting (remplir une zone masquée) et l’outpainting (étendre l’image au-delà de ses bords). Téléchargez le modèle Fill correspondant et utilisez les nœuds dédiés dans ComfyUI. Pour une page de guide sur les prompts optimaux pour Flux, consultez Flux prompts.

ControlNet (Depth, Canny). Flux Depth et Flux Canny permettent de contrôler la génération en extrayant la carte de profondeur ou les contours d’une image d’entrée. C’est essentiel pour maintenir une pose ou une composition spécifique tout en changeant le style ou le sujet.

Upscaling en deux passes. Générez d’abord en 768×768 (plus rapide, moins de VRAM), puis utilisez un nœud d’upscaling (HighResFix, ESRGAN ou un second passage de diffusion) pour monter en résolution. Ce workflow est particulièrement utile sur les GPU avec VRAM limitée.

Dépannage

Erreur « CUDA out of memory ». Voir la section optimisation ci-dessus. En résumé : ajoutez --lowvram, utilisez un modèle FP8 ou GGUF, réduisez la résolution.

Erreur « No module named torch ». Votre environnement Python n’a pas PyTorch installé avec le support CUDA. Réinstallez PyTorch avec CUDA 12.1 : pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121.

Image entièrement noire ou bruitée. Vérifiez que vous utilisez le bon VAE (ae.safetensors pour Flux, pas un VAE SDXL). Vérifiez aussi que le CFG n’est pas trop élevé (gardez-le sous 5.0).

Le texte dans les images est illisible. Assurez-vous d’utiliser Flux Dev ou Pro (schnell a un rendu de texte moins fiable). Mettez le texte souhaité entre guillemets dans le prompt : A sign that says "Welcome".

ComfyUI ne détecte pas le GPU. Vérifiez que vos drivers NVIDIA sont à jour (CUDA 12.1+ recommandé). Sur Linux, vérifiez que le package nvidia-smi fonctionne. Sur Windows, utilisez le fichier run_nvidia_gpu.bat et pas un lancement manuel.

Questions fréquentes sur l’installation de Flux

Peut-on installer Flux sans GPU NVIDIA ?

Partiellement. Sur Apple Silicon (M1/M2/M3/M4), Flux fonctionne via le backend Metal, avec une vitesse 2 à 4 fois inférieure à un GPU NVIDIA. Sur AMD (Linux avec ROCm), le support est expérimental. Sur CPU uniquement, c’est techniquement possible mais extrêmement lent (5 à 15 minutes par image). Pour une expérience locale correcte, un GPU NVIDIA avec 12 Go de VRAM minimum est fortement recommandé.

Combien d’espace disque faut-il ?

Comptez environ 15 à 30 Go selon le modèle choisi. FLUX.1 [dev] FP8 avec les encodeurs et le VAE totalise ≈ 17 Go. FLUX.1 [dev] FP16 monte à ≈ 30 Go. Les modèles GGUF quantifiés sont plus légers (4 à 10 Go). Ajoutez de l’espace pour les LoRA (20 à 300 Mo chacun) et les images générées.

ComfyUI ou Forge : lequel choisir pour Flux ?

ComfyUI est le choix recommandé. C’est l’interface la mieux supportée par Black Forest Labs, avec des templates officiels Flux et un support optimisé du weight streaming pour FLUX.2. Forge est une alternative si vous préférez une interface formulaire classique (type Automatic1111) plutôt que des nœuds. Automatic1111 standard ne supporte pas Flux.

Peut-on utiliser les images générées commercialement ?

FLUX.1 [schnell] est sous licence Apache 2.0, libre pour tout usage commercial. FLUX.1 [dev] est sous licence non-commerciale : l’usage commercial nécessite l’achat d’une licence à 999 $/mois auprès de BFL. Pour un usage commercial sans licence, utilisez schnell (gratuit) ou l’API BFL Pro (pay-per-image, droits commerciaux inclus). FLUX.2 [klein] sous Apache 2.0 est aussi libre pour l’usage commercial.

Quel est le temps de génération par image ?

Cela dépend du modèle et du GPU. Sur une RTX 4090 : FLUX.1 [schnell] ≈ 3-6 secondes, FLUX.1 [dev] FP8 ≈ 15-30 secondes, FLUX.2 [klein] ≈ 1-2 secondes. Sur une RTX 3060 12 Go avec FLUX.1 [dev] FP8 : environ 45-60 secondes par image. La première génération de chaque session est plus lente (chargement du modèle en mémoire).