ComfyUI
ComfyUI est une interface graphique open source basée sur un système de nœuds (nodes) pour concevoir et exécuter des pipelines de génération d’image et de vidéo par IA, principalement autour de Stable Diffusion, SDXL, FLUX et d’autres modèles de diffusion.
- Type
- Interface nodale (graph/nodes) pour modèles de diffusion
- Développeur
- comfyanonymous / Comfy-Org
- Licence
- Open source (GPL-3.0)
- Langages
- Python (backend), TypeScript (frontend)
- Plateformes
- Windows, macOS, Linux (Desktop, Portable, CLI)
- GPU supportés
- NVIDIA (CUDA), AMD (ROCm), Intel, Apple Silicon (Metal), Ascend
- Modèles
- SD 1.5, SD 2.x, SDXL, SD 3.5, FLUX, Wan, LTX, et plus
- Cloud
- Comfy Cloud (officiel), RunComfy, ThinkDiffusion
- URL
- comfy.org
Qu’est-ce que ComfyUI ?
ComfyUI est un outil qui transforme la génération d’images par IA en programmation visuelle. Au lieu d’une interface classique avec des champs de texte et des boutons (comme AUTOMATIC1111), ComfyUI affiche un graphe de nœuds interconnectés : chaque nœud exécute une opération spécifique (charger un modèle, encoder un prompt, exécuter le sampler, décoder le VAE), et les arêtes entre les nœuds représentent le flux de données (tenseurs latents, images, embeddings de conditionnement).
Le résultat : un contrôle total sur chaque étape du pipeline de diffusion. Vous voyez exactement comment les données circulent du prompt à l’image finale, vous pouvez modifier n’importe quelle étape, insérer des traitements intermédiaires (ControlNet, LoRA, upscaling), et sauvegarder le workflow entier en JSON pour le partager ou le réutiliser.
Lancé en 2023 par le développeur comfyanonymous, ComfyUI est devenu l’interface préférée des utilisateurs avancés de Stable Diffusion. Son adoption a explosé grâce à ses performances (plus rapide qu’AUTOMATIC1111 sur les workflows complexes), sa flexibilité (n’importe quel pipeline est constructible), et sa compatibilité rapide avec les nouveaux modèles (FLUX, SD 3.5, Wan pour la vidéo).
Architecture et fonctionnement
Le graphe acyclique dirigé (DAG)
L’interface de ComfyUI repose sur un graphe acyclique dirigé (DAG). Chaque nœud a des entrées (à gauche), des paramètres (au centre), et des sorties (à droite). Les arêtes (fils) relient les sorties d’un nœud aux entrées d’un autre. Le système évalue le graphe de manière paresseuse : seuls les nœuds dont les sorties sont nécessaires sont exécutés, et seuls les nœuds dont les entrées ont changé sont recalculés entre deux exécutions.
Ce modèle d’exécution est extrêmement efficace. Si vous modifiez uniquement le prompt dans un workflow de 20 nœuds, ComfyUI ne recalcule que les nœuds affectés par le changement (l’encodeur CLIP et le sampler), pas le chargement du modèle ni le décodage VAE si le latent n’a pas changé. C’est l’une des raisons principales de sa vitesse supérieure par rapport aux interfaces classiques.
Les nœuds fondamentaux
Un workflow txt2img minimal dans ComfyUI utilise 5 nœuds :
| Nœud | Rôle | Entrées | Sorties |
|---|---|---|---|
| Load Checkpoint | Charge le modèle de diffusion | Nom du fichier .safetensors | MODEL, CLIP, VAE |
| CLIP Text Encode (×2) | Encode le prompt positif et négatif | CLIP + texte | CONDITIONING |
| KSampler | Exécute le processus de débruitage | MODEL, CONDITIONING+, CONDITIONING-, latent | LATENT |
| Empty Latent Image | Crée le tenseur de bruit initial | Dimensions, batch size | LATENT |
| VAE Decode | Convertit le latent en image pixels | LATENT, VAE | IMAGE |
Ces 5 nœuds reproduisent exactement le pipeline expliqué dans notre page txt2img. La différence : ici, chaque étape est visible, configurable, et remplaçable. Vous pouvez insérer un nœud LoRA entre le checkpoint et le CLIP, ajouter un ControlNet comme conditionnement supplémentaire, ou brancher la sortie latent vers un upscaler avant le décodage VAE.
Gestion intelligente de la mémoire
ComfyUI implémente un système de gestion mémoire sophistiqué qui lui permet de fonctionner sur des GPU avec seulement 1 Go de VRAM (en mode --lowvram). Le système déplace automatiquement les modèles entre le GPU, la RAM CPU et le disque selon les besoins, en gardant en VRAM uniquement les tenseurs nécessaires au nœud en cours d’exécution. Les résultats intermédiaires sont mis en cache pour éviter les recalculs inutiles.
En pratique, ComfyUI utilise environ 2,5 Go de VRAM de moins qu’AUTOMATIC1111 pour un workflow SDXL standard, ce qui signifie que des GPU 8 Go peuvent exécuter des workflows qui nécessiteraient 10-12 Go dans d’autres interfaces.
Installation
ComfyUI Desktop (recommandé pour débuter)
L’application Desktop, disponible sur Windows et macOS, est la manière la plus simple d’installer ComfyUI. Le client pèse environ 200 Mo et gère automatiquement l’installation de Python, des dépendances, et des mises à jour. L’installation prend moins de 5 minutes. Les mises à jour sont automatiques : ComfyUI Desktop se met à jour avec les releases stables du backend.
Version portable (Windows)
Pour Windows, une version portable (aucune installation requise) est disponible. Téléchargez l’archive, extrayez-la, et lancez run_nvidia_gpu.bat ou run_cpu.bat. Cette version est idéale pour tester ComfyUI sans modifier votre système, ou pour transporter votre installation sur une clé USB.
Installation CLI (tous OS)
Pour les développeurs et les utilisateurs avancés, comfy-cli (installable via pip) gère l’installation, la configuration et le lancement de ComfyUI. Cette méthode fonctionne sur Windows, macOS et Linux, et supporte tous les types de GPU (NVIDIA, AMD, Intel, Apple Silicon, Ascend).
# Installation via comfy-cli
pip install comfy-cli
comfy install
# Lancement
comfy launch
# Ou installation manuelle
git clone https://github.com/Comfy-Org/ComfyUI
cd ComfyUI
pip install -r requirements.txt
python main.pyComfy Cloud et alternatives cloud
Comfy Cloud est la version cloud officielle de ComfyUI. Pas d’installation, pas de GPU local : vous ouvrez votre navigateur et vous travaillez. La facturation est basée sur l’utilisation GPU, pas sur le temps passé à construire des workflows. Tous les modèles populaires (FLUX, SDXL, SD 3.5, Wan) sont pré-installés.
D’autres services cloud hébergent ComfyUI : RunComfy, ThinkDiffusion, et Replicate. Ils offrent des GPU puissants (16 à 80 Go de VRAM), des modèles pré-installés, et la possibilité d’importer des modèles depuis Civitai ou Hugging Face.
L’écosystème des custom nodes
La puissance de ComfyUI réside dans ses custom nodes : des nœuds créés par la communauté qui étendent les fonctionnalités de base. Le Comfy Node Registry (CNR), intégré dans l’interface Desktop, fonctionne comme un App Store pour les nœuds IA. Plus de 600 nœuds sont disponibles.
ComfyUI Manager
L’extension essentielle. ComfyUI Manager permet d’installer, mettre à jour et gérer les custom nodes directement depuis l’interface. Il détecte aussi automatiquement les nœuds manquants dans un workflow importé et propose de les installer. C’est la première extension à installer après ComfyUI lui-même.
Nœuds populaires
| Custom Node | Fonction |
|---|---|
| ControlNet Auxiliary Preprocessors | Pré-traitement pour ControlNet (Canny, Depth, OpenPose, etc.) |
| Impact Pack | Collection de nœuds utilitaires (détection, segmentation, inpainting) |
| AnimateDiff | Génération de vidéo/animation à partir de Stable Diffusion |
| IP-Adapter | Conditionnement par image (transférer le style ou le sujet d’une image de référence) |
| Ultimate SD Upscale | Upscaling par tuiles avec diffusion |
| WAS Node Suite | Manipulation d’images, texte, mathématiques, utilitaires divers |
| Efficiency Nodes | Nœuds optimisés pour les workflows courants (txt2img, img2img en un seul nœud) |
App Mode et App Builder (nouveauté mars 2026)
Le 10 mars 2026, ComfyUI a introduit App Mode, une fonctionnalité qui transforme n’importe quel workflow nodal en interface simplifiée. En un clic, le graphe de nœuds disparaît et laisse place à une interface épurée ne montrant que les champs de saisie essentiels (prompt, image d’entrée, paramètres clés) et la sortie. C’est la réponse à la critique la plus fréquente de ComfyUI : la complexité visuelle de ses workflows qui décourageait les débutants.
App Builder va plus loin en permettant de configurer précisément quels paramètres sont visibles dans l’App Mode. Vous pouvez concevoir un workflow complexe de 40 nœuds, puis exposer uniquement les 3-4 champs que l’utilisateur final doit modifier. ComfyHub est la marketplace associée pour partager ces « apps » avec la communauté.
App Mode fonctionne à la fois en local et sur Comfy Cloud, ce qui permet de créer un workflow sur votre machine et de le déployer dans le cloud pour que d’autres l’utilisent sans installation.
ComfyUI vs AUTOMATIC1111 : quel choix ?
| Critère | ComfyUI | AUTOMATIC1111 |
|---|---|---|
| Interface | Nœuds visuels (graphe) | Formulaire web classique (onglets) |
| Courbe d’apprentissage | Raide (jours à semaines) | Douce (minutes à heures) |
| Vitesse | Plus rapide (~2× sur les workflows complexes) | Standard |
| VRAM | ~2,5 Go de moins pour SDXL | Consommation standard |
| Flexibilité | Quasi illimitée (n’importe quel pipeline) | Limitée aux fonctionnalités/extensions disponibles |
| Reproductibilité | Excellente (workflow JSON complet) | Bonne (paramètres dans PNG metadata) |
| Support FLUX | Natif, premier jour | Via Forge (fork) |
| Support vidéo | AnimateDiff, Wan, LTX (natif) | Limité |
| Extensions | 600+ custom nodes | Extensions matures et nombreuses |
| Recommandé pour | Power users, pipelines complexes, automatisation | Débutants, usage simple, prototypage rapide |
Le verdict : ComfyUI est objectivement plus puissant, plus rapide, et plus flexible qu’AUTOMATIC1111. Mais AUTOMATIC1111 reste imbattable pour la simplicité d’accès. La recommandation la plus courante dans la communauté : commencez avec Fooocus (ultra-simple) ou AUTOMATIC1111 (classique), puis migrez vers ComfyUI quand vous avez besoin de workflows avancés. Avec App Mode (mars 2026), ComfyUI comble progressivement l’écart d’accessibilité.
Workflows types
Txt2img basique
Le workflow de base (5 nœuds) est fourni par défaut à l’ouverture de ComfyUI. Il couvre 80% des besoins en génération d’image. Les templates intégrés proposent aussi des workflows prêts pour img2img, inpainting, et l’utilisation du refiner SDXL.
ControlNet
Un workflow ControlNet ajoute un nœud de pré-traitement (ex. : Canny Edge Detector) et un nœud Apply ControlNet entre le conditionnement et le sampler. La transparence de ComfyUI rend la configuration de ControlNet beaucoup plus intuitive qu’en interface classique : vous voyez exactement comment le conditionnement structurel est injecté dans le pipeline.
Upscaling multi-passes
Le workflow d’upscaling chaîne un nœud Upscale Image Using Model (Real-ESRGAN) avec un passage KSampler à faible denoising pour ajouter des détails. La sortie est un upscale à la fois net (GAN) et texturalement riche (diffusion).
Génération vidéo
ComfyUI supporte nativement les modèles de génération vidéo : AnimateDiff pour la vidéo à partir de SD/SDXL, Wan 2.5 pour le text-to-video et image-to-video, et LTX pour la vidéo audio-visuelle. Les workflows vidéo utilisent les mêmes nœuds de base avec des nœuds supplémentaires pour la gestion temporelle.
ComfyUI comme backend/API
ComfyUI n’est pas seulement une interface utilisateur. Son backend expose une API REST qui permet d’exécuter des workflows par programmation. Vous pouvez soumettre un workflow JSON via HTTP, recevoir les images générées en retour, et intégrer ComfyUI dans n’importe quelle application ou pipeline de production.
En mai 2025, Comfy-Org a ajouté 62 nœuds API supportant des modèles comme Flux Ultra, Veo2, et Kling. Ces nœuds permettent d’appeler des APIs externes directement depuis un workflow ComfyUI, transformant l’outil en orchestrateur de pipeline IA multi-modèles.
Bonnes pratiques
Pour bien débuter
Commencez par les workflows templates fournis avec ComfyUI (cliquez sur Workflows > Browse Templates dans la barre latérale). Modifiez-les progressivement plutôt que de construire un workflow de zéro. Installez ComfyUI Manager comme toute première extension : c’est la porte d’entrée vers l’écosystème de custom nodes, et il détecte automatiquement les nœuds manquants dans les workflows importés.
Organisation et reproductibilité
Sauvegardez systématiquement vos workflows en JSON et organisez-les par type (txt2img, img2img, upscale, vidéo). ComfyUI embarque les paramètres de génération dans les fichiers PNG, ce qui permet de recréer un workflow à partir d’une image générée : glissez une image PNG sur l’interface et ComfyUI reconstruit le graphe complet. Utilisez des noms descriptifs pour vos groupes de nœuds (clic droit > Add Group) pour documenter les sections de votre workflow.
Optimisation des performances
Activez le mode « preview » (TAESD) sur les nœuds d’image pour visualiser les résultats intermédiaires sans attendre le décodage VAE complet. Utilisez --fp16-vae ou --bf16-vae pour réduire la VRAM du VAE de moitié. Pour les workflows avec plusieurs modèles, le système de cache de ComfyUI garde les modèles en mémoire entre les exécutions, ce qui accélère considérablement les itérations. Si la VRAM est un problème, activez --lowvram pour un déchargement agressif.
Partage de workflows
Pour partager un workflow avec quelqu’un qui utilise ComfyUI, exportez-le en JSON (Save Workflow). Pour partager avec un non-technicien, utilisez App Mode pour créer une interface simplifiée, ou publiez sur ComfyHub. Des plateformes comme OpenArt et CivitAI hébergent aussi des milliers de workflows ComfyUI partagés par la communauté, souvent avec des aperçus visuels et des instructions.
Problèmes courants et solutions
Nœud en rouge / « Node type not found »
Ce message signifie qu’un custom node nécessaire au workflow n’est pas installé. Ouvrez ComfyUI Manager, cliquez « Install Missing Custom Nodes », et il détectera et installera automatiquement les nœuds manquants. Redémarrez ComfyUI après l’installation.
Erreur « CUDA out of memory »
Réduisez la résolution de génération ou le batch size. Activez --lowvram au lancement. Vérifiez qu’aucun autre programme n’utilise la VRAM (navigateur web avec accélération GPU, jeux en arrière-plan). Si vous utilisez SDXL ou FLUX, un GPU de 8 Go est le minimum confortable, 12 Go recommandé.
Génération très lente
Vérifiez que ComfyUI utilise bien le GPU et non le CPU (l’absence de CUDA disponible force le mode CPU). Assurez-vous que vos drivers GPU sont à jour. Activez les previews TAESD pour le feedback visuel sans ralentir la génération. Si vous êtes sur AMD, vérifiez que ROCm est correctement installé.
Un workflow importé ne fonctionne pas
Les causes les plus fréquentes : custom nodes manquants (utilisez ComfyUI Manager), modèles manquants (vérifiez les noms de fichiers attendus dans les nœuds Load Checkpoint/LoRA), ou incompatibilité de version de ComfyUI. Mettez ComfyUI à jour et vérifiez la compatibilité des custom nodes.
Questions fréquentes sur ComfyUI
ComfyUI est-il gratuit ?
Oui, ComfyUI est entièrement open source et gratuit (licence GPL-3.0). L’application Desktop, la version portable et l’installation CLI sont toutes gratuites. Comfy Cloud (la version cloud officielle) est payante à l’usage (facturation GPU). D’autres services cloud (RunComfy, ThinkDiffusion) proposent aussi des versions hébergées payantes si vous n’avez pas de GPU local.
ComfyUI est-il compatible avec les modèles FLUX ?
Oui, ComfyUI a été l’une des premières interfaces à supporter FLUX nativement. Tous les modèles FLUX (Dev, Schnell, Fill, Redux, Kontext) sont supportés via les nœuds standard (Load Checkpoint, KSampler). Les ControlNets pour FLUX (Canny, Depth, HED par XLab) sont aussi supportés. Comfy Cloud pré-installe tous les modèles FLUX populaires.
Faut-il un GPU puissant pour ComfyUI ?
ComfyUI est l’interface la plus économe en VRAM grâce à sa gestion mémoire intelligente. Un GPU de 4 Go de VRAM suffit pour SD 1.5, 6-8 Go pour SDXL, et 10-12 Go pour FLUX (en mode optimisé). Le mode --lowvram permet de fonctionner avec aussi peu que 1 Go de VRAM en déplaçant les modèles entre GPU et CPU. ComfyUI supporte aussi le CPU pur (lent mais fonctionnel) et Apple Silicon via Metal.
Comment passer d’AUTOMATIC1111 à ComfyUI ?
Vous pouvez réutiliser tous vos modèles existants (checkpoints, LoRAs, embeddings, VAE) en configurant le fichier extra_model_paths.yaml pour pointer vers vos dossiers AUTOMATIC1111. Pas besoin de copier les fichiers. Côté apprentissage, commencez par les workflows templates, puis reproduisez vos pipelines habituels nœud par nœud. La transition prend typiquement quelques jours pour les workflows simples, une à deux semaines pour les workflows avancés.
Qu’est-ce que App Mode dans ComfyUI ?
App Mode (lancé le 10 mars 2026) transforme n’importe quel workflow ComfyUI en interface simplifiée en masquant le graphe de nœuds. Seuls les champs de saisie essentiels (prompt, paramètres sélectionnés) et la sortie sont visibles. App Builder permet de configurer précisément quels paramètres exposer. ComfyHub est la marketplace pour partager ces « apps » simplifiées. L’objectif : rendre les workflows ComfyUI accessibles à des utilisateurs qui ne veulent pas apprendre le système de nœuds.