Forge (Stable Diffusion WebUI Forge)

Forge est un fork de AUTOMATIC1111 créé par Lvmin Zhang (le créateur de ControlNet et Fooocus) qui optimise les performances de génération de 30 à 75% selon le GPU, réduit la consommation de VRAM, et ajoute le support de modèles non pris en charge par A1111, notamment FLUX.

Type: Fork optimisé d’AUTOMATIC1111
Créateur: Lvmin Zhang (lllyasviel), créateur de ControlNet et Fooocus
Licence: Open source (AGPL-3.0)
Modèles: SD 1.x, SD 2.x, SDXL, FLUX, SD 3.5, SVD
Gain de performance: 30-75% (6 Go VRAM), 30-45% (8 Go), ~5% (24 Go)
VRAM minimum: 2 Go (SD 1.5), 4 Go (SDXL)
Forks actifs: reForge (Panchovix), Forge Neo (6Morpheus6)
Build stable recommandé: Commit a9e0c38 (22 juillet 2024)
GitHub: github.com/lllyasviel/stable-diffusion-webui-forge

Qu’est-ce que Forge ?

Forge est né d’un constat simple : AUTOMATIC1111 est l’interface la plus populaire pour Stable Diffusion, mais elle souffre de problèmes de performances et de gestion mémoire, particulièrement sur les GPU avec 6-8 Go de VRAM. Lvmin Zhang, déjà reconnu dans la communauté pour ses contributions majeures (ControlNet, Fooocus), a créé Forge pour résoudre ces problèmes tout en conservant l’interface familière d’A1111.

Le résultat : une interface qui ressemble exactement à A1111 (mêmes onglets, mêmes paramètres, mêmes menus), mais avec un backend entièrement remanié qui emprunte des techniques d’optimisation de ComfyUI et en ajoute de nouvelles. Les extensions A1111 existantes fonctionnent pour la plupart sans modification.

L’ajout le plus impactant est le support de FLUX, introduit en août 2024. A1111 ne supporte pas nativement FLUX, ce qui a poussé de nombreux utilisateurs à migrer vers Forge ou ComfyUI. Forge offre une transition transparente : même interface, mêmes habitudes, modèle FLUX en plus.

Les gains de performance

Vitesse de génération

Les gains de vitesse de Forge par rapport à A1111 dépendent du GPU et de la VRAM disponible. Plus la VRAM est limitée, plus le gain est spectaculaire :

Configuration GPU	Gain de vitesse (SDXL 1024×1024)	Notes
6 Go VRAM (ex. RTX 2060)	60-75%	Le gain le plus spectaculaire, rend SDXL utilisable
8 Go VRAM (ex. RTX 3060 Ti)	30-45%	Gain très significatif au quotidien
12 Go VRAM (ex. RTX 3060)	10-30%	Gain notable, surtout avec ControlNet
24 Go VRAM (ex. RTX 4090)	~5%	Gain modeste, l’A1111 ne bottleneck plus

L’explication : A1111 gère la mémoire de manière peu optimisée, forçant souvent des transferts inutiles entre GPU et CPU. Forge réorganise le pipeline pour minimiser ces transferts, garder les tenseurs nécessaires en VRAM, et décharger intelligemment le reste. Cette différence est marginale quand la VRAM est abondante (24 Go), mais transforme l’expérience sur les GPU avec 6-8 Go.

Réduction de l’utilisation VRAM

Au-delà de la vitesse, Forge réduit le pic de consommation VRAM. Cela signifie concrètement que des configurations auparavant impossibles deviennent accessibles : générer en SDXL à 1024×1024 sur un GPU 4 Go, utiliser ControlNet avec SDXL sur un GPU 8 Go sans erreurs Out of Memory, ou augmenter le batch size sur un GPU 12 Go.

Avec ControlNet en particulier, le gain est frappant : le nombre maximum de ControlNets utilisables simultanément avant d’atteindre une erreur OOM est environ doublé dans Forge par rapport à A1111. La vitesse de génération avec ControlNet + SDXL augmente de 30 à 45%.

Swap de modèles

A1111 souffrait d’un problème bien connu : changer de checkpoint en cours de session pouvait entraîner des fuites mémoire (le modèle précédent n’était pas complètement libéré) ou des erreurs subtiles (le nouveau modèle n’était pas correctement chargé). Forge résout ce problème grâce à son système de gestion mémoire remanié. Le swap de modèle est propre, sans fuite, et sans artefact.

Le Unet Patcher : l’innovation architecturale clé

L’innovation technique majeure de Forge est le Unet Patcher, un système qui permet de modifier le comportement du U-Net sans monkeypatching (remplacement sauvage de fonctions). Les techniques comme Self-Attention Guidance, Kohya Hires Fix, FreeU, StyleAlign, et Hypertile sont implémentées en environ 100 lignes de code chacune grâce au Unet Patcher.

L’avantage pour les développeurs d’extensions est considérable : les extensions ne se marchent plus dessus. Dans A1111, deux extensions qui modifiaient le U-Net pouvaient entrer en conflit et produire des résultats imprévisibles. Avec le Unet Patcher, chaque modification est proprement isolée et composable. C’est ce qui a permis à Forge d’intégrer nativement des fonctionnalités qui nécessitaient des extensions séparées dans A1111 : IP-Adapter avec masques, ControlNet intégré, PhotoMaker, Stable Video Diffusion (SVD), Zero123, etc.

Support de FLUX

Forge a ajouté le support de FLUX (Black Forest Labs) en août 2024, faisant de lui la première interface de type « A1111 » à proposer ce modèle. Le support inclut les variantes FLUX.1 Dev, Schnell, et les checkpoints quantifiés (NF4 via BitsAndBytes) pour réduire la VRAM nécessaire.

Avec FLUX en quantification NF4, Forge permet de générer des images FLUX sur des GPU aussi modestes que 6-8 Go de VRAM. Le checkpoint flux1-dev-bnb-nf4-v2.safetensors est le plus utilisé pour cette configuration. La qualité est légèrement réduite par rapport au modèle full-precision, mais reste largement suffisante pour la majorité des usages.

Forge propose aussi des UI presets spécifiques pour FLUX qui masquent les paramètres non pertinents (comme le prompt négatif, que FLUX n’utilise pas) et exposent les paramètres spécifiques à FLUX.

Fonctionnalités exclusives de Forge

Samplers supplémentaires

Forge ajoute plusieurs samplers absents d’A1111 : DDPM, DDPM Karras, DPM++ 2M Turbo, DPM++ 2M SDE Turbo, LCM Karras, Euler A Turbo, et d’autres. Ces samplers offrent des caractéristiques différentes (convergence plus rapide, détails plus fins, résultats plus stochastiques) et élargissent les possibilités d’exploration.

IP-Adapter et masques intégrés

Forge intègre nativement IP-Adapter (conditionnement par image de référence) avec support des masques. Cela permet d’appliquer le style ou les caractéristiques d’une image de référence à des zones spécifiques de la génération, sans extension supplémentaire. Dans A1111, cette fonctionnalité nécessitait une extension ControlNet séparée avec une configuration plus complexe.

Stable Video Diffusion (SVD)

Forge supporte nativement Stable Video Diffusion pour la génération de courtes vidéos à partir d’une image. L’onglet SVD permet de passer directement une image générée en txt2img vers la génération vidéo, avec des exigences VRAM réduites par rapport aux implémentations alternatives.

UI Presets

Forge propose des presets d’interface qui adaptent automatiquement les paramètres visibles selon le modèle utilisé. Un preset SDXL masque les paramètres non pertinents et ajuste les valeurs par défaut. Un preset FLUX fait de même pour les spécificités de FLUX. Cela réduit la confusion pour les utilisateurs qui travaillent avec plusieurs architectures de modèles.

Forge, reForge, Forge Neo : l’écosystème des forks

L’histoire de Forge est marquée par des phases de développement actif suivies de pauses prolongées du développeur principal. Cela a conduit à l’émergence de forks communautaires qui maintiennent et étendent Forge.

Forge original (lllyasviel)

Le dépôt original de Lvmin Zhang. Le développement actif a ralenti après les mises à jour majeures de mi-2024. La communauté recommande le build du 22 juillet 2024 (commit a9e0c38) comme la version la plus stable pour un usage quotidien. Les versions ultérieures ont introduit des changements expérimentaux qui pouvaient être instables, notamment sur les configurations cloud.

reForge (Panchovix)

reForge est un fork maintenu activement par Panchovix qui ajoute des corrections de bugs, le support de Python 3.12, SageAttention 2 et 3, Flash Attention, et d’autres optimisations. reForge est le choix recommandé pour les utilisateurs qui veulent rester à jour avec les corrections de bugs tout en conservant la base Forge. Le développement continue avec des travaux en cours sur le support de nouveaux modèles et architectures.

Forge Neo (6Morpheus6)

Forge Neo est un fork plus récent qui se concentre sur le support des derniers modèles : FLUX, Z-Image, Qwen, Wan, Lumina, FLUX Kontext, et les optimisations Nunchaku. Il supporte les GPU NVIDIA des séries RTX 1000 à 5000 ainsi que les GPU cloud, avec Torch 2.9.1, CUDA 13, et Flash Attention. Les exigences minimum sont 6 Go de VRAM / 16 Go de RAM (16 Go VRAM / 48 Go RAM recommandés).

Quel fork choisir ? Pour la stabilité maximale avec SD 1.5/SDXL : Forge original (commit a9e0c38 du 22 juillet 2024). Pour les corrections de bugs et le support Python 3.12 : reForge. Pour les derniers modèles (FLUX Kontext, Wan, etc.) : Forge Neo. Pour la flexibilité maximale et les workflows avancés : migrez vers ComfyUI.

Installation

One-click (Windows)

Téléchargez le package one-click depuis le dépôt GitHub de Forge. Extrayez l’archive et lancez run.bat. C’est la méthode la plus simple mais elle offre moins de contrôle sur la configuration.

Installation manuelle (recommandé)

# Cloner le dépôt Forge
git clone https://github.com/lllyasviel/stable-diffusion-webui-forge.git
cd stable-diffusion-webui-forge

# Lancer (première exécution : installe les dépendances)
# Windows :
webui-user.bat
# Linux/Mac :
bash webui.sh

Partager les modèles avec A1111

Inutile de dupliquer vos modèles. Créez un lien symbolique du dossier models/ de Forge vers celui d’A1111 :

# Windows (en tant qu'administrateur)
mklink /d C:cheminforgemodels C:chemina1111models

# Linux/Mac
ln -s /chemin/a1111/models /chemin/forge/models

Forge détectera automatiquement tous vos checkpoints, LoRAs, embeddings, VAE et modèles ControlNet existants.

Forge vs A1111 vs ComfyUI

Critère	Forge	A1111	ComfyUI
Interface	Formulaire web (identique à A1111)	Formulaire web	Nœuds visuels
Vitesse (SDXL, 8 Go)	+30-45% vs A1111	Standard	+~40-60% vs A1111
Support FLUX	Oui (NF4 inclus)	Non	Oui (natif)
Extensions A1111	Compatibles (majorité)	Compatibles (toutes)	Écosystème custom nodes séparé
Prise en main	Immédiate si vous connaissez A1111	Rapide	Longue
Maintenance	Développement par forks communautaires	Développement actif mais ralenti	Développement très actif
Vidéo (SVD, Wan)	SVD natif, Wan via Forge Neo	Limité	AnimateDiff, Wan natif

Le verdict : Forge est le meilleur choix pour les utilisateurs d’A1111 qui veulent de meilleures performances et le support de FLUX sans changer leurs habitudes. La transition est transparente : même interface, mêmes extensions, modèles partagés. Si vous avez besoin de flexibilité maximale et de workflows avancés, ComfyUI reste supérieur. Si vous n’avez besoin que de SD 1.5/SDXL et que la simplicité prime, A1111 standard suffit.

Limites et considérations

Compatibilité partielle des extensions

La majorité des extensions A1111 fonctionnent dans Forge, mais pas toutes. Certaines extensions anciennes ou peu maintenues peuvent provoquer des erreurs à cause de la refonte du backend. Testez vos extensions essentielles avant de migrer complètement. Les extensions les plus populaires (ControlNet, ADetailer, Ultimate SD Upscale, Regional Prompter) fonctionnent sans problème. En cas de doute, désactivez toutes les extensions (--disable-all-extensions) et réactivez-les une par une pour identifier les incompatibilités.

Fragmentation de l’écosystème

L’existence de multiples forks (Forge original, reForge, Forge Neo, Forge2) peut être déroutante. Le développement du Forge original a connu des phases d’activité intense suivies de pauses prolongées, ce qui a motivé la création des forks communautaires. Chaque fork a ses priorités : reForge pour la stabilité et les corrections, Forge Neo pour les derniers modèles. Suivez les discussions GitHub et les recommandations de la communauté pour choisir le fork adapté à vos besoins.

GPU NVIDIA fortement recommandé

Les optimisations de Forge (BitsAndBytes NF4, optimisations CUDA spécifiques) sont principalement ciblées sur les GPU NVIDIA. Le support AMD (ROCm) et Apple Silicon (Metal) existe mais est moins testé et moins stable. Si vous êtes sur AMD ou Apple, ComfyUI offre une meilleure compatibilité multi-plateformes grâce à son backend plus agnostique.

Gains de performance variables

Les gains annoncés (jusqu’à 75%) sont réels mais concernent des cas spécifiques : GPU avec VRAM limitée, workflows SDXL, utilisation de ControlNet. Sur un GPU haut de gamme (RTX 4090, 24 Go) avec des workflows simples (txt2img sans ControlNet en SD 1.5), le gain est négligeable (~5%). Migrez vers Forge pour le support FLUX, les samplers supplémentaires ou les fonctionnalités intégrées (IP-Adapter, SVD), pas uniquement pour la vitesse si vous avez déjà un GPU puissant.

Migrer d’A1111 vers Forge

La migration est conçue pour être indolore. Installez Forge dans un dossier séparé (ne remplacez pas votre installation A1111). Partagez les modèles via un lien symbolique du dossier models/ de Forge vers celui d’A1111 pour éviter de dupliquer des fichiers volumineux. Copiez vos extensions depuis le dossier extensions/ d’A1111 vers celui de Forge (ou clonez-les à nouveau). Lancez Forge et vérifiez que vos extensions se chargent sans erreur. Testez avec vos workflows habituels pour valider que les résultats sont identiques (même seed, mêmes paramètres = même image, à quelques différences de précision flottante près).

Gardez votre installation A1111 en place pendant la période de transition. Vous pourrez la supprimer une fois que Forge sera validé pour tous vos usages. La coexistence des deux installations est parfaitement supportée, à condition de ne pas les lancer simultanément (elles se disputeraient le GPU).

Questions fréquentes sur Forge

Forge est-il compatible avec mes extensions AUTOMATIC1111 ?

La majorité des extensions A1111 fonctionnent dans Forge sans modification. Les extensions populaires (ControlNet, ADetailer, Ultimate SD Upscale, Regional Prompter, Dynamic Prompts) sont toutes compatibles. Certaines extensions anciennes ou qui modifient profondément le U-Net peuvent avoir des problèmes. Testez vos extensions essentielles avant de migrer. Le Unet Patcher de Forge résout la plupart des conflits entre extensions qui existaient dans A1111.

Forge est-il plus rapide que ComfyUI ?

Non. ComfyUI est généralement plus rapide que Forge grâce à son système d’exécution par graphe (ne recalcule que les nœuds modifiés). Forge est plus rapide qu’A1111, mais ComfyUI reste l’interface la plus performante. L’avantage de Forge sur ComfyUI est la facilité d’utilisation : même interface qu’A1111, pas de courbe d’apprentissage, extensions compatibles. Si la performance pure est votre priorité, ComfyUI est le meilleur choix.

Quelle version de Forge installer ?

La communauté recommande le build du 22 juillet 2024 (commit a9e0c38) du dépôt original comme la version la plus stable. Pour les dernières corrections de bugs avec le support de Python 3.12, utilisez reForge (Panchovix). Pour les derniers modèles (FLUX Kontext, Wan, etc.) avec Torch 2.9.1 et CUDA 13, utilisez Forge Neo (6Morpheus6). Le choix dépend de vos priorités : stabilité, compatibilité, ou accès aux dernières fonctionnalités.

Puis-je utiliser Forge et A1111 en parallèle ?

Oui. Installez Forge dans un dossier séparé et partagez les modèles via un lien symbolique (mklink /d sur Windows, ln -s sur Linux/Mac). Vous pouvez basculer entre les deux en lançant l’un ou l’autre. Ils utilisent les mêmes fichiers de modèles, LoRAs, et embeddings. Ne les lancez pas simultanément (ils se disputeraient le GPU).

Forge supporte-t-il FLUX en faible VRAM ?

Oui, c’est l’un de ses points forts. Forge supporte les checkpoints FLUX quantifiés en NF4 via BitsAndBytes, ce qui réduit drastiquement la VRAM nécessaire. Le modèle flux1-dev-bnb-nf4-v2.safetensors fonctionne sur des GPU avec 6-8 Go de VRAM. La qualité est légèrement réduite par rapport au modèle full-precision (FP16) mais reste excellente pour la grande majorité des usages. Forge a été le premier à démocratiser l’accès à FLUX sur du matériel grand public.