PC pour ComfyUI 2026 : guide GPU, VRAM et workflows
Share
ComfyUI est devenu en 2026 l'interface de référence pour la génération d'images IA. Architecture nodale, gestion mémoire efficace, support natif de Flux, SD 3.5, Qwen Image, vidéo IA (Hunyuan, LTX-Video), audio (StableAudio) — c'est l'outil que tous les pros utilisent. Mais ComfyUI est aussi gourmand et capricieux : workflows multi-modèles, custom nodes par centaines, ControlNets empilés, TensorRT… Quel PC faut-il vraiment pour en tirer le meilleur ? Ce guide vous donne la réponse précise, modèle par modèle, avec des benchmarks réels.
Pourquoi ComfyUI est devenu LE standard en 2026 ?
En 2024, Automatic1111 (A1111) dominait. En 2026, ComfyUI a pris la place pour quatre raisons :
- Architecture nodale. Vous construisez visuellement votre pipeline : nodes de chargement de modèle, conditionning, sampler, VAE decode, etc. Vous voyez exactement ce qui se passe à chaque étape — et vous pouvez tout modifier.
- Gestion mémoire efficace. ComfyUI charge et décharge les composants à la demande. Un GPU 12 Go peut faire tourner des workflows qui crashent en A1111 ou Forge.
- Support des nouveaux modèles en jours. Flux, SD 3.5, Qwen Image, Hunyuan Video — tous supportés nativement quelques jours après leur sortie. A1111 prend souvent des mois.
- Écosystème de custom nodes énorme. ComfyUI Manager donne accès à plus de 2 000 extensions communautaires en mai 2026 — ControlNet Aux, IPAdapter, AnimateDiff, ComfyRoll, Impact Pack, WAS Suite, et bien d'autres.
Les vrais besoins matériels de ComfyUI en 2026
ComfyUI a la réputation d'être "économe en VRAM". C'est vrai pour la génération simple. Faux dès qu'on empile : ajouter un ControlNet (+2 Go), un IPAdapter (+2 Go), un refiner (+5 Go), un LoRA (+200 Mo chacun), un upscaler (+3 Go)… vous arrivez vite à 20 Go même sur un modèle SDXL de base.
Voici les vrais besoins par type de workflow en mai 2026 :
Génération SDXL simple
Workflow texte→image basique avec checkpoint SDXL, sampler, VAE decode. Sans extras.
VRAM : 8 Go suffitSDXL + Refiner + 1 ControlNet
Pipeline pro classique : base SDXL → refiner → ControlNet pose ou depth. Setup standard illustration.
VRAM : 12-16 GoFlux Dev FP8 + ControlNet
Le workflow 2026 par défaut. Flux Dev quantisé FP8 (~13 Go) + ControlNet (Union ou Canny).
VRAM : 16 Go (tight) / 20 Go (confort)SDXL + IPAdapter + ControlNet + LoRA stack
Workflow pro illustration : transfert de style (IPAdapter), pose (ControlNet), 2-3 LoRAs empilées, upscale.
VRAM : 16-24 GoAnimateDiff / Vidéo IA (LTX-Video, Hunyuan)
Génération de séquences vidéo courtes. Hunyuan Video et LTX-Video sont très gourmands en VRAM par image × nombre de frames.
VRAM : 24 Go minimum, 32 Go confortMulti-modèle parallèle (SDXL + Flux + Qwen)
Workflows comparatifs avancés ou pipelines de production qui chaînent plusieurs modèles différents sans déchargement.
VRAM : 32 Go ou bi-GPUFlux LoRA training (via ComfyUI nodes)
Entraînement de LoRA Flux directement depuis ComfyUI via custom nodes (Kohya, AI Toolkit). Très exigeant.
VRAM : 24 Go minimum, 32 Go confortProduction studio batch + API serveur
ComfyUI en mode serveur (API REST), batchs de 10-50 images Flux, files d'attente parallèles.
VRAM : 32 Go ou multi-GPUVRAM minimum recommandée pour ComfyUI en 2026
| Usage ComfyUI | VRAM minimum | VRAM confort | GPU type |
|---|---|---|---|
| Découverte / SDXL simple | 8 Go | 12 Go | RTX 5060 12 Go |
| Workflow pro standard ⭐ | 16 Go | 16 Go | RTX 5060 Ti / 5070 Ti 16 Go |
| Flux FP16 / IPAdapter stack | 16 Go (tight) | 24 Go | RTX 4090 24 Go |
| Vidéo IA + LoRA training | 24 Go | 32 Go | RTX 5090 32 Go |
| Production studio multi-GPU | 2× 32 Go | 2× 96 Go ECC | Rack 2× RTX 5090 ou 2× RTX 6000 Pro |
Au-delà de la VRAM : ce qui compte pour ComfyUI
RAM système — 32 Go minimum, 64 Go conseillés
ComfyUI swappe les modèles entre VRAM et RAM système quand la VRAM est insuffisante. Avec 32 Go DDR5, vous gardez 2-3 checkpoints chargés en RAM pour des switchs instantanés. Avec 64 Go, vous chargez toute votre bibliothèque (SDXL base + refiner + Flux + 5 LoRAs + 3 ControlNets) en mémoire — aucun rechargement disque entre générations.
SSD NVMe Gen 4 ou Gen 5 — critique
Chaque switch de checkpoint = lecture disque. Un Flux Dev pèse 24 Go, un SDXL 7 Go, un ControlNet 2-5 Go. Sur SSD Gen 4 (5 000 Mo/s), le chargement initial d'un workflow Flux + IPAdapter + ControlNet prend ~8 secondes. Sur Gen 5 (12 000+ Mo/s), c'est 3 secondes. Sur SATA SSD, 30+ secondes. Prévoyez 2 To NVMe Gen 4 minimum pour ne pas devoir gérer une bibliothèque externe.
CPU — moins critique que vous ne le pensez
L'inférence ComfyUI est ~95% GPU. Le CPU sert au pré-processing (chargement modèles, parsing du workflow JSON, post-processing PIL). Un Ryzen 5 récent suffit. Pour les workflows complexes avec dizaines de nodes ou les pipelines temps réel, un Ryzen 7 ou 9 apporte du confort marginal.
Bande passante GPU — l'optimisation cachée
Pour ComfyUI, la bande passante mémoire du GPU compte presque autant que la VRAM. Une RTX 5090 (1 792 Go/s) est 2,7× plus rapide qu'une RTX 5060 Ti 16 Go (672 Go/s) sur Flux, même quand le modèle tient dans les deux cartes. C'est pour ça que le RTX 4060 Ti 16 Go (288 Go/s) reste un piège malgré sa VRAM correcte.
Optimisations ComfyUI 2026 — gagner 30-60% de vitesse
Quelques flags de lancement et extensions transforment votre setup ComfyUI :
# Lancement ComfyUI optimisé Blackwell (RTX 50xx) : python main.py \ --use-pytorch-cross-attention \ --fast \ --highvram \ --enable-cors-header # Variables d'environnement utiles : export PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True export CUDA_LAUNCH_BLOCKING=0 export TORCHINDUCTOR_CACHE_DIR=/path/ssd/cache
-
TensorRT compilation via
ComfyUI-TensorRT: +30-60% de vitesse sur les workflows répétitifs. Première génération lente (compilation), suivantes ultra-rapides. - FP8 / GGUF quantization : Flux en FP8 = -50% VRAM, qualité quasi identique. GGUF Q4/Q6 = encore moins de VRAM pour les configs 12 Go.
- Flash Attention 2 : économie de 15-25% VRAM sur les architectures supportées (Blackwell, Ada Lovelace).
- Tiled VAE dans VAE Decode : permet le 4K même sur 16 Go.
- ComfyUI-Crystools : monitoring GPU/VRAM en temps réel dans l'interface — essentiel pour optimiser ses workflows.
- RAM disk pour les modèles : si vous avez 128 Go RAM, mapper un disque RAM pour les checkpoints donne des switchs instantanés.
Custom nodes incontournables ComfyUI en 2026
| Custom Node | Utilité | VRAM impact |
|---|---|---|
| ComfyUI Manager | Installation/MAJ des custom nodes en 1 clic | Aucun |
| ComfyUI-Impact-Pack | Face/Hand detailer, segmentation, regional prompt | +1-3 Go |
| ComfyUI_IPAdapter_plus | Transfert de style depuis une image source | +1-2 Go |
| ComfyUI-AnimateDiff-Evolved | Animation de séquences à partir d'image fixe | +4-8 Go |
| comfyui_controlnet_aux | Pré-processors ControlNet (depth, pose, canny, lineart) | +0,5-2 Go |
| ComfyUI-WAS-Suite | 200+ nodes utilitaires (texte, masques, math) | Négligeable |
| ComfyUI-TensorRT | Compilation TensorRT = +30-60% vitesse | +2-4 Go pendant compilation |
| ComfyUI-Crystools | Monitoring GPU/CPU/RAM temps réel | Négligeable |
| ComfyUI-HunyuanVideoWrapper | Génération vidéo Hunyuan | +12-20 Go |
| ComfyUI-LTXVideo | Génération vidéo LTX (plus rapide qu'Hunyuan) | +8-14 Go |
Installation rapide de ComfyUI optimisée sur votre PC
# 1. Cloner ComfyUI git clone https://github.com/comfyanonymous/ComfyUI cd ComfyUI # 2. Créer un venv Python 3.12 python -m venv venv source venv/bin/activate # Linux/Mac # .\venv\Scripts\activate # Windows # 3. PyTorch avec CUDA 12.8 (RTX 50xx Blackwell) pip install torch torchvision torchaudio \ --index-url https://download.pytorch.org/whl/cu128 # 4. Dépendances ComfyUI pip install -r requirements.txt # 5. Installer ComfyUI Manager (essentiel) cd custom_nodes git clone https://github.com/ltdrdata/ComfyUI-Manager cd .. # 6. Télécharger un modèle de base (Flux Dev FP8) # https://huggingface.co/Comfy-Org/flux1-dev # Placer le .safetensors dans ComfyUI/models/diffusion_models/ # 7. Lancer ComfyUI optimisé python main.py --use-pytorch-cross-attention --fast --highvram
Nos PC optimisés ComfyUI — pré-configurés et prêts à générer
Radiance Systems conçoit des stations spécifiquement testées sous ComfyUI. Sur demande, on livre votre PC avec ComfyUI installé, configuré (PyTorch CUDA, Manager, custom nodes essentiels) et les modèles de votre choix téléchargés — Flux Dev, SDXL, ControlNets, IPAdapter. Vous démarrez, vous générez votre première image en moins de 2 minutes.
Radiance PC CoreAI 16 — RTX 5060 Ti 16 Go
✅ Workflows SDXL + Refiner · Flux Dev FP8 · ControlNet · IPAdapter · LoRA stack léger
Point d'entrée idéal pour ComfyUI sérieux en 2026. 16 Go GDDR7 — le minimum pour les workflows pros standards. Plateforme AM5 DDR5 pour les switchs de modèles rapides. Évolutif : upgrade GPU possible plus tard sans changer de plateforme.
ComfyUI + Manager + Flux Dev FP8 pré-installés sur demande
Configurer cette station →
Radiance PC CoreAI 32 — RTX 5070 Ti 16 Go
✅ Workflow pro complet · Multi-ControlNet · IPAdapter stack · TensorRT · AnimateDiff
La station polyvalente pour les illustrateurs et créateurs qui empilent les nodes. Bande passante 1,9× supérieure pour des générations fluides en workflow complexe. 32 Go DDR5 permettent de garder Flux + SDXL + 5 LoRAs + 3 ControlNets en mémoire simultanément.
TensorRT pré-configuré · Custom nodes essentiels installés
Configurer cette station →
⭐ Radiance PC CoreAI 64 — RTX 5090 32 Go
✅ Tous workflows ComfyUI · Vidéo IA (LTX, Hunyuan) · Flux LoRA training · Multi-modèle simultané
La meilleure workstation grand public pour ComfyUI en 2026. 32 Go GDDR7 permettent de garder tous les composants chargés simultanément — aucun déchargement entre nodes. Bande passante record (1 792 Go/s) pour des workflows 3-5× plus rapides qu'une RTX 5070 Ti. Vidéo IA, training LoRA Flux, batchs Flux Dev FP16 — tout est accessible.
Bibliothèque ComfyUI complète pré-installée sur demande
Configurer cette station →
Radiance CoreAI Rack — 2× RTX 5090 (64 Go VRAM)
✅ ComfyUI server multi-tenant · Pipelines parallèles · Production batch · Vidéo IA longue
Pour les studios et agences créatives qui font de la production volumique. 2× RTX 5090 indépendantes via ComfyUI server mode : un GPU dédié à la génération en cours, l'autre au pré-rendu du batch suivant ou au training de LoRAs. Idéal pour les équipes de 3-10 créatifs.
ComfyUI server API · Multi-tenant · Rack 4U
Configurer ce rack →
CoreAI 128 Rack — 2× RTX 6000 PRO Blackwell (192 Go ECC)
✅ Vidéo IA longue durée · Fine-tuning modèles base · Batchs Flux 2 9B · Production 24/7
La station ultime pour les studios pro qui font de la vidéo IA longue (Hunyuan 30+ secondes), du fine-tuning complet de modèles ou de la production 24/7. 192 Go VRAM ECC permettent de charger plusieurs modèles complets simultanément et de générer des batchs massifs sans aucune contrainte mémoire.
Studios pro · Vidéo IA longue · Production continue
Configurer ce rack →
Radiance PC Pro AI Ultra Threadripper
✅ Recherche IA · Custom nodes développement · Pipelines HPC · Fine-tuning lourd
Pour les studios VFX, chercheurs et agences IA qui développent leurs propres custom nodes ou pipelines avancés. Plateforme Threadripper PRO sTR5 extensible jusqu'à 96 cœurs et 2 To de RAM ECC. La machine pérenne 5+ ans pour ne jamais être limité.
Sur mesure · Devis personnalisé · Installation sur site
Demander un devis →Questions fréquentes — PC pour ComfyUI
ComfyUI est-il plus exigeant qu'Automatic1111 ?
Non, c'est même l'inverse pour la génération simple. ComfyUI gère mieux la mémoire et peut faire tourner Flux sur 12 Go là où A1111 crash. Mais dès qu'on empile les custom nodes et workflows complexes (multi-ControlNet, IPAdapter, AnimateDiff…), ComfyUI peut consommer plus que A1111 sur la même tâche car il charge tout en mémoire pour optimiser la vitesse.
Combien de VRAM pour faire tourner ComfyUI sereinement ?
16 Go est le minimum pratique en 2026 pour des workflows pros (SDXL + Refiner + ControlNet + LoRA stack). 24 Go offre du confort pour Flux FP16 et les pipelines complexes. 32 Go (RTX 5090) ou plus sont nécessaires pour la vidéo IA, le training LoRA Flux ou la production studio.
Quelle est la différence entre ComfyUI et Forge UI ?
ComfyUI est nodal (graphe visuel de nodes) — courbe d'apprentissage plus raide mais flexibilité totale, idéal pour les pros. Forge UI est un fork d'A1111 — interface classique, plus simple à apprendre, bonne gestion VRAM. Pour 2026, ComfyUI est le choix recommandé car il supporte tous les nouveaux modèles en premier et l'écosystème de custom nodes est sans équivalent.
Peut-on utiliser ComfyUI sur GPU AMD ou Mac ?
Oui techniquement, via ROCm pour AMD ou MPS pour Apple Silicon. En pratique, beaucoup de custom nodes (TensorRT, certains ControlNets, IPAdapter avancés, training nodes) sont NVIDIA-only ou très limités. Pour un PC dédié ComfyUI en 2026, NVIDIA reste largement recommandé — surtout les RTX 50xx (Blackwell) qui ont le meilleur support PyTorch et TensorRT.
Peut-on faire tourner un serveur ComfyUI en réseau pour plusieurs utilisateurs ?
Oui. ComfyUI peut être lancé en mode serveur avec une API REST accessible sur le réseau local ou via Cloudflare Tunnel. Plusieurs utilisateurs peuvent envoyer des workflows en file d'attente. Pour 3-10 utilisateurs simultanés, le Rack 2× RTX 5090 ou le Rack 2× RTX 6000 ECC sont les configurations idéales — chaque GPU peut traiter une file séparée.
TensorRT vaut-il vraiment le coup pour ComfyUI ?
Oui pour les workflows répétitifs (production batch, API server). La compilation prend 5-15 minutes par modèle/résolution mais les générations suivantes sont 30-60% plus rapides. Inconvénient : chaque combinaison modèle+résolution doit être compilée séparément, et le résultat n'est pas portable entre GPU. Pour de l'expérimentation occasionnelle, TensorRT est inutile.
Quelle alimentation pour ComfyUI avec une RTX 5090 ?
1 200 W 80+ Gold minimum. La RTX 5090 consomme jusqu'à 575 W en pic, le Ryzen 9 9950X3D autour de 170 W, plus les autres composants. Compter 30-40% de marge pour la longévité de l'alimentation et les pics de consommation simultanés. Pour bi-GPU, 2 000 W Platinum.
Linux ou Windows pour ComfyUI ?
Linux (Ubuntu 24.04) offre la meilleure performance brute, le support CUDA optimal et la compatibilité maximale avec les custom nodes les plus pointus. Windows 11 fonctionne très bien et est plus simple pour les non-développeurs. WSL2 sur Windows 11 offre un excellent compromis. Nos stations sont livrées avec l'OS de votre choix et ComfyUI pré-configuré.




