PC pour ComfyUI 2026 : guide GPU, VRAM et workflows

27 mai 2026

ComfyUI est devenu en 2026 l'interface de référence pour la génération d'images IA. Architecture nodale, gestion mémoire efficace, support natif de Flux, SD 3.5, Qwen Image, vidéo IA (Hunyuan, LTX-Video), audio (StableAudio) — c'est l'outil que tous les pros utilisent. Mais ComfyUI est aussi gourmand et capricieux : workflows multi-modèles, custom nodes par centaines, ControlNets empilés, TensorRT… Quel PC faut-il vraiment pour en tirer le meilleur ? Ce guide vous donne la réponse précise, modèle par modèle, avec des benchmarks réels.

Pourquoi ComfyUI est devenu LE standard en 2026 ?

En 2024, Automatic1111 (A1111) dominait. En 2026, ComfyUI a pris la place pour quatre raisons :

Architecture nodale. Vous construisez visuellement votre pipeline : nodes de chargement de modèle, conditionning, sampler, VAE decode, etc. Vous voyez exactement ce qui se passe à chaque étape — et vous pouvez tout modifier.
Gestion mémoire efficace. ComfyUI charge et décharge les composants à la demande. Un GPU 12 Go peut faire tourner des workflows qui crashent en A1111 ou Forge.
Support des nouveaux modèles en jours. Flux, SD 3.5, Qwen Image, Hunyuan Video — tous supportés nativement quelques jours après leur sortie. A1111 prend souvent des mois.
Écosystème de custom nodes énorme. ComfyUI Manager donne accès à plus de 2 000 extensions communautaires en mai 2026 — ControlNet Aux, IPAdapter, AnimateDiff, ComfyRoll, Impact Pack, WAS Suite, et bien d'autres.

💡 Le vrai pouvoir de ComfyUI : au-delà de la simple génération texte-vers-image, ComfyUI permet de créer des pipelines complets — par exemple : générer un personnage avec SDXL, l'affiner avec un refiner, appliquer un ControlNet pose, ajouter un IPAdapter style, faire un upscale en 2 passes, puis générer une vidéo courte avec LTX-Video — tout dans un seul workflow que vous sauvegardez et réutilisez.

Les vrais besoins matériels de ComfyUI en 2026

ComfyUI a la réputation d'être "économe en VRAM". C'est vrai pour la génération simple. Faux dès qu'on empile : ajouter un ControlNet (+2 Go), un IPAdapter (+2 Go), un refiner (+5 Go), un LoRA (+200 Mo chacun), un upscaler (+3 Go)… vous arrivez vite à 20 Go même sur un modèle SDXL de base.

Voici les vrais besoins par type de workflow en mai 2026 :

📷

Génération SDXL simple

Workflow texte→image basique avec checkpoint SDXL, sampler, VAE decode. Sans extras.

VRAM : 8 Go suffit

🎨

SDXL + Refiner + 1 ControlNet

Pipeline pro classique : base SDXL → refiner → ControlNet pose ou depth. Setup standard illustration.

VRAM : 12-16 Go

⚡

Flux Dev FP8 + ControlNet

Le workflow 2026 par défaut. Flux Dev quantisé FP8 (~13 Go) + ControlNet (Union ou Canny).

VRAM : 16 Go (tight) / 20 Go (confort)

🎭

SDXL + IPAdapter + ControlNet + LoRA stack

Workflow pro illustration : transfert de style (IPAdapter), pose (ControlNet), 2-3 LoRAs empilées, upscale.

VRAM : 16-24 Go

🎬

AnimateDiff / Vidéo IA (LTX-Video, Hunyuan)

Génération de séquences vidéo courtes. Hunyuan Video et LTX-Video sont très gourmands en VRAM par image × nombre de frames.

VRAM : 24 Go minimum, 32 Go confort

🔄

Multi-modèle parallèle (SDXL + Flux + Qwen)

Workflows comparatifs avancés ou pipelines de production qui chaînent plusieurs modèles différents sans déchargement.

VRAM : 32 Go ou bi-GPU

🧪

Flux LoRA training (via ComfyUI nodes)

Entraînement de LoRA Flux directement depuis ComfyUI via custom nodes (Kohya, AI Toolkit). Très exigeant.

VRAM : 24 Go minimum, 32 Go confort

🏭

Production studio batch + API serveur

ComfyUI en mode serveur (API REST), batchs de 10-50 images Flux, files d'attente parallèles.

VRAM : 32 Go ou multi-GPU

VRAM minimum recommandée pour ComfyUI en 2026

Usage ComfyUI	VRAM minimum	VRAM confort	GPU type
Découverte / SDXL simple	8 Go	12 Go	RTX 5060 12 Go
Workflow pro standard ⭐	16 Go	16 Go	RTX 5060 Ti / 5070 Ti 16 Go
Flux FP16 / IPAdapter stack	16 Go (tight)	24 Go	RTX 4090 24 Go
Vidéo IA + LoRA training	24 Go	32 Go	RTX 5090 32 Go
Production studio multi-GPU	2× 32 Go	2× 96 Go ECC	Rack 2× RTX 5090 ou 2× RTX 6000 Pro

⚠️ L'erreur classique sur ComfyUI : acheter un GPU "qui fait tourner SDXL" puis découvrir que dès qu'on empile un refiner, un ControlNet et un IPAdapter, ComfyUI doit décharger/recharger les modèles à chaque étape — chaque génération devient 3-5× plus lente. Sur ComfyUI, prévoir 4-8 Go de VRAM en plus du modèle principal est crucial.

Au-delà de la VRAM : ce qui compte pour ComfyUI

RAM système — 32 Go minimum, 64 Go conseillés

ComfyUI swappe les modèles entre VRAM et RAM système quand la VRAM est insuffisante. Avec 32 Go DDR5, vous gardez 2-3 checkpoints chargés en RAM pour des switchs instantanés. Avec 64 Go, vous chargez toute votre bibliothèque (SDXL base + refiner + Flux + 5 LoRAs + 3 ControlNets) en mémoire — aucun rechargement disque entre générations.

SSD NVMe Gen 4 ou Gen 5 — critique

Chaque switch de checkpoint = lecture disque. Un Flux Dev pèse 24 Go, un SDXL 7 Go, un ControlNet 2-5 Go. Sur SSD Gen 4 (5 000 Mo/s), le chargement initial d'un workflow Flux + IPAdapter + ControlNet prend ~8 secondes. Sur Gen 5 (12 000+ Mo/s), c'est 3 secondes. Sur SATA SSD, 30+ secondes. Prévoyez 2 To NVMe Gen 4 minimum pour ne pas devoir gérer une bibliothèque externe.

CPU — moins critique que vous ne le pensez

L'inférence ComfyUI est ~95% GPU. Le CPU sert au pré-processing (chargement modèles, parsing du workflow JSON, post-processing PIL). Un Ryzen 5 récent suffit. Pour les workflows complexes avec dizaines de nodes ou les pipelines temps réel, un Ryzen 7 ou 9 apporte du confort marginal.

Bande passante GPU — l'optimisation cachée

Pour ComfyUI, la bande passante mémoire du GPU compte presque autant que la VRAM. Une RTX 5090 (1 792 Go/s) est 2,7× plus rapide qu'une RTX 5060 Ti 16 Go (672 Go/s) sur Flux, même quand le modèle tient dans les deux cartes. C'est pour ça que le RTX 4060 Ti 16 Go (288 Go/s) reste un piège malgré sa VRAM correcte.

Optimisations ComfyUI 2026 — gagner 30-60% de vitesse

Quelques flags de lancement et extensions transforment votre setup ComfyUI :

# Lancement ComfyUI optimisé Blackwell (RTX 50xx) :
python main.py \
  --use-pytorch-cross-attention \
  --fast \
  --highvram \
  --enable-cors-header

# Variables d'environnement utiles :
export PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True
export CUDA_LAUNCH_BLOCKING=0
export TORCHINDUCTOR_CACHE_DIR=/path/ssd/cache

TensorRT compilation via ComfyUI-TensorRT : +30-60% de vitesse sur les workflows répétitifs. Première génération lente (compilation), suivantes ultra-rapides.
FP8 / GGUF quantization : Flux en FP8 = -50% VRAM, qualité quasi identique. GGUF Q4/Q6 = encore moins de VRAM pour les configs 12 Go.
Flash Attention 2 : économie de 15-25% VRAM sur les architectures supportées (Blackwell, Ada Lovelace).
Tiled VAE dans VAE Decode : permet le 4K même sur 16 Go.
ComfyUI-Crystools : monitoring GPU/VRAM en temps réel dans l'interface — essentiel pour optimiser ses workflows.
RAM disk pour les modèles : si vous avez 128 Go RAM, mapper un disque RAM pour les checkpoints donne des switchs instantanés.

Custom nodes incontournables ComfyUI en 2026

Custom Node	Utilité	VRAM impact
ComfyUI Manager	Installation/MAJ des custom nodes en 1 clic	Aucun
ComfyUI-Impact-Pack	Face/Hand detailer, segmentation, regional prompt	+1-3 Go
ComfyUI_IPAdapter_plus	Transfert de style depuis une image source	+1-2 Go
ComfyUI-AnimateDiff-Evolved	Animation de séquences à partir d'image fixe	+4-8 Go
comfyui_controlnet_aux	Pré-processors ControlNet (depth, pose, canny, lineart)	+0,5-2 Go
ComfyUI-WAS-Suite	200+ nodes utilitaires (texte, masques, math)	Négligeable
ComfyUI-TensorRT	Compilation TensorRT = +30-60% vitesse	+2-4 Go pendant compilation
ComfyUI-Crystools	Monitoring GPU/CPU/RAM temps réel	Négligeable
ComfyUI-HunyuanVideoWrapper	Génération vidéo Hunyuan	+12-20 Go
ComfyUI-LTXVideo	Génération vidéo LTX (plus rapide qu'Hunyuan)	+8-14 Go

Installation rapide de ComfyUI optimisée sur votre PC

# 1. Cloner ComfyUI
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI

# 2. Créer un venv Python 3.12
python -m venv venv
source venv/bin/activate    # Linux/Mac
# .\venv\Scripts\activate   # Windows

# 3. PyTorch avec CUDA 12.8 (RTX 50xx Blackwell)
pip install torch torchvision torchaudio \
  --index-url https://download.pytorch.org/whl/cu128

# 4. Dépendances ComfyUI
pip install -r requirements.txt

# 5. Installer ComfyUI Manager (essentiel)
cd custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager
cd ..

# 6. Télécharger un modèle de base (Flux Dev FP8)
# https://huggingface.co/Comfy-Org/flux1-dev
# Placer le .safetensors dans ComfyUI/models/diffusion_models/

# 7. Lancer ComfyUI optimisé
python main.py --use-pytorch-cross-attention --fast --highvram

Nos PC optimisés ComfyUI — pré-configurés et prêts à générer

Radiance Systems conçoit des stations spécifiquement testées sous ComfyUI. Sur demande, on livre votre PC avec ComfyUI installé, configuré (PyTorch CUDA, Manager, custom nodes essentiels) et les modèles de votre choix téléchargés — Flux Dev, SDXL, ControlNets, IPAdapter. Vous démarrez, vous générez votre première image en moins de 2 minutes.

Entrée de gamme ComfyUI

PC ComfyUI Radiance CoreAI 16 RTX 5060 Ti 16Go - workflow standard

Radiance PC CoreAI 16 — RTX 5060 Ti 16 Go

CPU AMD Ryzen 5 7500F

GPU RTX 5060 Ti 16 Go GDDR7

RAM DDR5 16 Go

Stockage NVMe 1 To Gen 4

Plateforme AM5 DDR5

OS Windows 11 Pro / Ubuntu

✅ Workflows SDXL + Refiner · Flux Dev FP8 · ControlNet · IPAdapter · LoRA stack léger

Point d'entrée idéal pour ComfyUI sérieux en 2026. 16 Go GDDR7 — le minimum pour les workflows pros standards. Plateforme AM5 DDR5 pour les switchs de modèles rapides. Évolutif : upgrade GPU possible plus tard sans changer de plateforme.

1 703 € à partir de

ComfyUI + Manager + Flux Dev FP8 pré-installés sur demande

Configurer cette station →

Workflows pros · Multi-ControlNet

PC ComfyUI Radiance CoreAI 32 RTX 5070 Ti - workflows pros

Radiance PC CoreAI 32 — RTX 5070 Ti 16 Go

CPU AMD Ryzen 9 9900X

GPU RTX 5070 Ti 16 Go GDDR7

RAM DDR5 32 Go

Stockage NVMe 1 To Gen 4

Bande passante GPU ~1 280 Go/s

OS Windows 11 Pro / Ubuntu

✅ Workflow pro complet · Multi-ControlNet · IPAdapter stack · TensorRT · AnimateDiff

La station polyvalente pour les illustrateurs et créateurs qui empilent les nodes. Bande passante 1,9× supérieure pour des générations fluides en workflow complexe. 32 Go DDR5 permettent de garder Flux + SDXL + 5 LoRAs + 3 ControlNets en mémoire simultanément.

2 442 € à partir de

TensorRT pré-configuré · Custom nodes essentiels installés

Configurer cette station →

Référence ComfyUI · Vidéo IA · Training LoRA

PC ComfyUI RTX 5090 32Go - vidéo IA Hunyuan LTX training

⭐ Radiance PC CoreAI 64 — RTX 5090 32 Go

CPU AMD Ryzen 9 9950X3D

GPU RTX 5090 32 Go GDDR7

RAM DDR5 64 Go

Stockage NVMe 1 To Gen 4

Bande passante GPU 1 792 Go/s

Alimentation 1 200 W 80+ Gold

✅ Tous workflows ComfyUI · Vidéo IA (LTX, Hunyuan) · Flux LoRA training · Multi-modèle simultané

La meilleure workstation grand public pour ComfyUI en 2026. 32 Go GDDR7 permettent de garder tous les composants chargés simultanément — aucun déchargement entre nodes. Bande passante record (1 792 Go/s) pour des workflows 3-5× plus rapides qu'une RTX 5070 Ti. Vidéo IA, training LoRA Flux, batchs Flux Dev FP16 — tout est accessible.

6 042 € à partir de

Bibliothèque ComfyUI complète pré-installée sur demande

Configurer cette station →

Studio · Bi-GPU · API server

Workstation ComfyUI double RTX 5090 - studio batch génération API

Radiance CoreAI Rack — 2× RTX 5090 (64 Go VRAM)

CPU AMD Ryzen 9 9950X3D

GPU 2× RTX 5090 32 Go

VRAM totale 64 Go GDDR7

RAM DDR5 128 Go

Format Rack 4U

Alimentation 2 000 W Platinum

✅ ComfyUI server multi-tenant · Pipelines parallèles · Production batch · Vidéo IA longue

Pour les studios et agences créatives qui font de la production volumique. 2× RTX 5090 indépendantes via ComfyUI server mode : un GPU dédié à la génération en cours, l'autre au pré-rendu du batch suivant ou au training de LoRAs. Idéal pour les équipes de 3-10 créatifs.

11 221 € à partir de

ComfyUI server API · Multi-tenant · Rack 4U

Configurer ce rack →

Pro Studio · ECC · Vidéo IA longue · Fine-tuning

Workstation ComfyUI pro 2x RTX 6000 Blackwell ECC vidéo IA

CoreAI 128 Rack — 2× RTX 6000 PRO Blackwell (192 Go ECC)

CPU AMD Ryzen 9 9950X3D

GPU 2× RTX 6000 96 Go ECC

VRAM totale 192 Go ECC

RAM DDR5 128 Go

Format Rack 4U

Alimentation 2 000 W Platinum

✅ Vidéo IA longue durée · Fine-tuning modèles base · Batchs Flux 2 9B · Production 24/7

La station ultime pour les studios pro qui font de la vidéo IA longue (Hunyuan 30+ secondes), du fine-tuning complet de modèles ou de la production 24/7. 192 Go VRAM ECC permettent de charger plusieurs modèles complets simultanément et de générer des batchs massifs sans aucune contrainte mémoire.

27 980 € à partir de

Studios pro · Vidéo IA longue · Production continue

Configurer ce rack →

Threadripper PRO · 2 To RAM · HPC / R&D

Workstation ComfyUI Threadripper PRO 2 To RAM recherche IA

Radiance PC Pro AI Ultra Threadripper

CPU Threadripper PRO 7955WX 16c

GPU RTX 6000 Blackwell 96 Go

RAM ECC DDR5 128 Go RDIMM

RAM max Jusqu'à 2 To ECC

Format Rack 4U

Alimentation 2 000 W Platinum

✅ Recherche IA · Custom nodes développement · Pipelines HPC · Fine-tuning lourd

Pour les studios VFX, chercheurs et agences IA qui développent leurs propres custom nodes ou pipelines avancés. Plateforme Threadripper PRO sTR5 extensible jusqu'à 96 cœurs et 2 To de RAM ECC. La machine pérenne 5+ ans pour ne jamais être limité.

20 213 € à partir de

Sur mesure · Devis personnalisé · Installation sur site

Demander un devis →

Questions fréquentes — PC pour ComfyUI

ComfyUI est-il plus exigeant qu'Automatic1111 ?

Non, c'est même l'inverse pour la génération simple. ComfyUI gère mieux la mémoire et peut faire tourner Flux sur 12 Go là où A1111 crash. Mais dès qu'on empile les custom nodes et workflows complexes (multi-ControlNet, IPAdapter, AnimateDiff…), ComfyUI peut consommer plus que A1111 sur la même tâche car il charge tout en mémoire pour optimiser la vitesse.

Combien de VRAM pour faire tourner ComfyUI sereinement ?

16 Go est le minimum pratique en 2026 pour des workflows pros (SDXL + Refiner + ControlNet + LoRA stack). 24 Go offre du confort pour Flux FP16 et les pipelines complexes. 32 Go (RTX 5090) ou plus sont nécessaires pour la vidéo IA, le training LoRA Flux ou la production studio.

Quelle est la différence entre ComfyUI et Forge UI ?

ComfyUI est nodal (graphe visuel de nodes) — courbe d'apprentissage plus raide mais flexibilité totale, idéal pour les pros. Forge UI est un fork d'A1111 — interface classique, plus simple à apprendre, bonne gestion VRAM. Pour 2026, ComfyUI est le choix recommandé car il supporte tous les nouveaux modèles en premier et l'écosystème de custom nodes est sans équivalent.

Peut-on utiliser ComfyUI sur GPU AMD ou Mac ?

Oui techniquement, via ROCm pour AMD ou MPS pour Apple Silicon. En pratique, beaucoup de custom nodes (TensorRT, certains ControlNets, IPAdapter avancés, training nodes) sont NVIDIA-only ou très limités. Pour un PC dédié ComfyUI en 2026, NVIDIA reste largement recommandé — surtout les RTX 50xx (Blackwell) qui ont le meilleur support PyTorch et TensorRT.

Peut-on faire tourner un serveur ComfyUI en réseau pour plusieurs utilisateurs ?

Oui. ComfyUI peut être lancé en mode serveur avec une API REST accessible sur le réseau local ou via Cloudflare Tunnel. Plusieurs utilisateurs peuvent envoyer des workflows en file d'attente. Pour 3-10 utilisateurs simultanés, le Rack 2× RTX 5090 ou le Rack 2× RTX 6000 ECC sont les configurations idéales — chaque GPU peut traiter une file séparée.

TensorRT vaut-il vraiment le coup pour ComfyUI ?

Oui pour les workflows répétitifs (production batch, API server). La compilation prend 5-15 minutes par modèle/résolution mais les générations suivantes sont 30-60% plus rapides. Inconvénient : chaque combinaison modèle+résolution doit être compilée séparément, et le résultat n'est pas portable entre GPU. Pour de l'expérimentation occasionnelle, TensorRT est inutile.

Quelle alimentation pour ComfyUI avec une RTX 5090 ?

1 200 W 80+ Gold minimum. La RTX 5090 consomme jusqu'à 575 W en pic, le Ryzen 9 9950X3D autour de 170 W, plus les autres composants. Compter 30-40% de marge pour la longévité de l'alimentation et les pics de consommation simultanés. Pour bi-GPU, 2 000 W Platinum.

Linux ou Windows pour ComfyUI ?

Linux (Ubuntu 24.04) offre la meilleure performance brute, le support CUDA optimal et la compatibilité maximale avec les custom nodes les plus pointus. Windows 11 fonctionne très bien et est plus simple pour les non-développeurs. WSL2 sur Windows 11 offre un excellent compromis. Nos stations sont livrées avec l'OS de votre choix et ComfyUI pré-configuré.

Retour au blog