PC-Konfiguration für lokale KI im Jahr 2026: Umfassender Leitfaden und Vergleich
Aktie
Konfigurierte Workstation, Dual-GPU oder NVIDIA GB10 Mini-Server: Wir vergleichen jede Option, damit Sie die richtige Maschine für Ihre Bedürfnisse finden: ohne Cloud, ohne Kompromisse bei Ihren Daten.
Warum KI lokal ausführen?
Im Jahr 2026 ist künstliche Intelligenz nicht mehr nur Rechenzentren vorbehalten. Dank neuer GPU-Architekturen und optimierter Open-Source-Modelle (Llama 4, Mistral, DeepSeek, Qwen...) ist es heute möglich, leistungsstarke LLMs direkt auf Ihrem eigenen Computer auszuführen, ohne Daten in die Cloud zu senden.
Für Fachleute, die der DSGVO unterliegen, wie Anwälte, Ärzte, Buchhalter, Notare, Ingenieurbüros: Dies ist eine Revolution. Sie profitieren von einer leistungsstarken KI, ohne Ihre Kundendaten jemals Dritten preiszugeben.
- Vollständige Vertraulichkeit: Ihre Daten bleiben in Ihrem lokalen Netzwerk, kein Versand an externe Server.
- Keine wiederkehrenden Abonnements: Nach dem Kauf der Maschine sind die Inferenzkosten gleich Null.
- Geringe Latenz: Die Antwort ist sofort da, ohne von der Qualität Ihrer Verbindung abzuhängen.
- Offline-Betrieb: Nützlich vor Ort, unterwegs oder bei Netzwerkausfall.
- Umfassende Anpassung: Fine-Tuning, RAG, Agenten: Sie kontrollieren die gesamte Umgebung.
Gut zu wissen: Alle Radiance Systems Maschinen werden in Frankreich (Auriol, 13) montiert, getestet und optimiert, mit einer 2-jährigen Garantie und dediziertem technischem Support, der innerhalb von 3 Stunden antwortet.
Die wichtigsten Kriterien einer PC-Konfiguration für KI
Die GPU-VRAM: der wichtigste Faktor
Für lokale KI bestimmt der Videospeicher (VRAM) direkt die Größe der Modelle, die Sie ausführen können. Ein LLM mit 7 Milliarden Parametern in 4-Bit benötigt etwa 4–5 GB VRAM; ein 70B-Modell in 4-Bit benötigt 35–40 GB. Je größer der VRAM, desto größere Modelle können Sie laden oder mehrere Modelle gleichzeitig ausführen.
Gute Nachricht: Alle unsere Workstations sind vollständig konfigurierbar, einschließlich der Grafikkarte. Der CoreAI 64 bietet zum Beispiel Consumer-GPUs (RTX 5070 Ti bis RTX 5090), aber auch professionelle GPUs mit bis zu 96 GB VRAM (RTX 6000 Blackwell, L40S, H100…). Wenn Sie einen spezifischen Bedarf an GPU-Speicher haben, können Sie genau die Maschine zusammenstellen, die Sie benötigen, entweder über den Konfigurator oder indem Sie uns für ein maßgeschneidertes Angebot kontaktieren.
| Modellgröße | Quantisierung | Benötigter VRAM | Kompatibel mit |
|---|---|---|---|
| 7B (z. B. Mistral 7B) | 4-bit (GGUF) | ~4–5 GB | RTX 5070 Ti, RTX 5090, GB10 |
| 13–14B | 4-bit | ~8–10 GB | RTX 5070 Ti, RTX 5090, GB10 |
| 32–34B | 4-bit | ~18–22 GB | RTX 5090 (32 GB), RTX 6000 Blackwell (96 GB), GB10 (128 GB) |
| 70B (z. B. Llama 4 Scout) | 4-bit | ~35–40 GB | RTX 5090 (teilweise), L40S (48 GB) ✅, GB10 ✅ |
| 70B volle Präzision / 2×70B | 8-bit oder FP16 | 60–96 GB | RTX 6000 Blackwell (96 GB) ✅, GB10 ✅ |
| Modelle 200B+ / schwere Multimodal-Modelle | 4–8-bit | 100–128 GB+ | GB10 (128 GB Unified) ✅, H100 NVL (94 GB) ✅ |
GPU-Konfigurator: Der CoreAI 64 ermöglicht die Auswahl aus über 15 GPUs, von der Consumer-RTX 5070 Ti bis zur H200 141 GB. Sie sind nicht auf die angezeigten Konfigurationen beschränkt: Kontaktieren Sie uns für ein auf Ihre genauen VRAM-Anforderungen zugeschnittenes Angebot.
System-RAM, Prozessor und Speicher
Der System-RAM wird für komplexe Pipelines (RAG, Multi-Agenten-Orchestrierung, Verarbeitung großer Dokumente) benötigt. 32 GB sind ein ernstzunehmendes Minimum; 64 GB und mehr werden notwendig, sobald Sie mehrere Aufgaben parallel ausführen. Auf der CPU-Seite bieten die AMD Ryzen 9-Serien auf AM5 das hervorragende Gleichgewicht zwischen Rechenleistung und Speicherdurchsatz, das KI-Frameworks benötigen. Schließlich beschleunigt eine schnelle NVMe-SSD das anfängliche Laden von Modellgewichten: Rechnen Sie mit mindestens 1 TB für eine komfortable Nutzung.
Vergleich der 3 Radiance Systems Konfigurationen
| Modell | GPU / KI-Speicher | CPU | RAM | Grundpreis | Ideal für |
|---|---|---|---|---|---|
| CoreAI 32 RTX 5070 Ti Profi-Einstieg | RTX 5070 Ti: 16 GB VRAM | Ryzen 9 9900X (12c) | 32 GB DDR5 (bis zu 256 GB) | 2.442 € | LLM bis 13B, Bildgenerierung, KI-Entwicklung, Multimedia |
| CoreAI 64 RTX 5090 High-End | RTX 5090: 32 GB VRAM | Ryzen 9 9950X3D (16c) | 64 GB DDR5 (bis zu 256 GB) | 6.042 € | LLM 70B, Fine-Tuning, professionelles 3D-Rendering, intensive KI-Pipelines |
| Mini Server GB10 ASUS Ascent | NVIDIA GB10: 128 GB LPDDR5X Unified | Grace (ARM, 20 Kerne) | 128 GB Unified CPU+GPU | 3.999 € | Dedizierter KI-Server, 70B+-Modelle, Multi-User-Inferenz, On-Premise-Bereitstellung |
Radiance PC CoreAI 32: RTX 5070 Ti
Der Radiance PC CoreAI 32 ist die professionelle Einsteiger-KI-Workstation. Dies ist die ideale Konfiguration, um ernsthaft mit lokaler KI zu beginnen, ohne das Budget zu sprengen, und gleichzeitig eine voll erweiterbare Maschine zu behalten.
Basiskonfiguration
- GPU: NVIDIA GeForce RTX 5070 Ti: 16 GB VRAM (Blackwell-Architektur)
- CPU: AMD Ryzen 9 9900X: 12 Kerne / 24 Threads, AM5-Sockel
- RAM: 32 GB DDR5 5600 MHz: erweiterbar auf bis zu 256 GB
- Speicher: 1 TB NVMe (bis zu 3.500 MB/s)
- Netzteil: MSI 850W 80+ Gold PCIe 5
- Betriebssystem: Windows 11 Professional (Lizenz enthalten)
- WiFi 6E + Bluetooth je nach gewähltem Mainboard enthalten
Was Sie ausführen können
Mit 16 GB VRAM bewältigt der CoreAI 32 komfortabel LLMs bis 13B in voller Qualität, 7B-Modelle im langen Kontext, Bildgenerierung mit FLUX, Stable Diffusion XL sowie leichte multimodale Verarbeitungspipelines. Dies ist die Maschine, die typischerweise von Anwälten, KMU und Freiberuflern verwendet wird, die eine effiziente lokale KI ohne Serverbeschränkungen wünschen.
⚠️ Wichtige Einschränkung: Modelle ab 30B überschreiten den VRAM-Speicher und werden teilweise in den System-RAM ausgelagert, was die Inferenz erheblich verlangsamt. Für diese Anwendungen bevorzugen Sie den CoreAI 64 oder den GB10.
Radiance PC CoreAI 64: RTX 5090
Der Radiance PC CoreAI 64 ist die High-End KI-Workstation der Serie. Mit der RTX 5090 und ihren 32 GB VRAM kann sie aktuelle LLMs mit voller Leistung ausführen, einschließlich 70B-Modelle mit aggressiver Quantisierung. Und wenn Ihre Anforderungen über den Consumer-Bereich hinausgehen, bietet der Konfigurator auch professionelle GPUs: L40S 48 GB, RTX 5000 Blackwell 48 GB, RTX 6000 Blackwell 96 GB oder sogar H100 NVL für die intensivsten Workloads.
Basiskonfiguration
- GPU: NVIDIA GeForce RTX 5090: 32 GB VRAM (die leistungsstärkste Consumer-GPU im Jahr 2026)
- CPU: AMD Ryzen 9 9950X3D: 16 Kerne / 32 Threads + 3D V-Cache
- RAM: 64 GB DDR5 6000 MHz: erweiterbar auf bis zu 256 GB
- Speicher: 1 TB NVMe (bis zu 3.500 MB/s): einfach erweiterbar
- Netzteil: Deepcool 1200W 80+ Gold
- Betriebssystem: Windows 11 Professional (Lizenz enthalten)
- WiFi 7 + Bluetooth enthalten (MSI X870E)
Was Sie ausführen können
Die RTX 5090 32 GB ist die Referenz-GPU für lokale KI auf Consumer-Workstations. Sie ermöglicht die Ausführung von Llama 4 Scout (109B MoE mit 17B-Aktivierung), Qwen 2.5 72B in 4-Bit, DeepSeek-R2 destilliert oder auch schwerer multimodaler Pipelines, die Vision + Text kombinieren. Dies ist auch die Referenzkonfiguration für leichtes Fine-Tuning (LoRA, QLoRA) auf Unternehmensdatensätzen.
Um noch weiter zu gehen, bietet der Konfigurator professionelle GPUs: Die RTX 6000 Blackwell 96 GB ermöglicht die Ausführung von 70B-Modellen in voller Präzision oder mehreren Modellen parallel; die L40S 48 GB ist für Server-Inferenz optimiert; und bis zur H100 NVL 94 GB für die anspruchsvollsten Anforderungen. Der VRAM ist keine feste Obergrenze: Er ist konfigurierbar.
Voll konfigurierbare GPU: Der CoreAI 64 bietet über 15 GPU-Optionen in seinem Konfigurator, von der RTX 5070 Ti bis zur H200 141 GB. Sie können auch eine zweite Grafikkarte hinzufügen (Multi-GPU). Der VRAM ist keine feste Einschränkung: Er passt sich Ihrer Nutzung an. Kontaktieren Sie uns für ein maßgeschneidertes Angebot.
Mini-KI-Server NVIDIA GB10: ASUS Ascent GX10
Der ASUS Ascent GX10 (NVIDIA GB10 Grace Blackwell) ist eine eigene Kategorie. Es ist keine klassische Workstation: Es ist ein dedizierter Mini-KI-Server, ultrakompakt (150×150×51 mm), ausschließlich für KI-Workloads konzipiert: lokale Inferenz, Fine-Tuning, RAG, autonome Agenten, Multi-User-Bereitstellung.
Unified Architecture: Der GB10-Vorteil
Der NVIDIA GB10-Chip kombiniert ARM-CPU (Grace, 20 Kerne) und Blackwell-GPU in einer Unified Memory Architecture mit 128 GB LPDDR5X. Im Gegensatz zu einer klassischen Grafikkarte (separater VRAM) ist dieser Unified Memory sowohl für CPU als auch GPU uneingeschränkt zugänglich, ohne kostspielige Übertragungen zwischen beiden. Das Ergebnis: Sie können 70B-Modelle in voller Präzision oder mehrere Modelle gleichzeitig mit außergewöhnlicher Speicherbandbreite ausführen.
- 1 PetaFLOP KI-Leistung (INT8): Zum Vergleich erreichen die besten Gaming-GPUs ~0,35 PFLOPS INT8
- 128 GB Unified Memory: Llama 4 Maverick (400B MoE) ist denkbar
- DGX OS vorinstalliert: CUDA, PyTorch, TensorFlow, Jupyter: alles ist sofort einsatzbereit
- Professionelle Netzwerkverbindung: 10G LAN + ConnectX-7 (2×200G QSFP)
- Wi-Fi 7 + Bluetooth 5 integriert
- Ultrakompaktes Desktop-Format: 1,48 kg, auf jedem Schreibtisch oder im Rack verwendbar
Für wen ist er gemacht?
Der GB10 richtet sich an Unternehmen, die einen dedizierten KI-Server getrennt von den Arbeitsplätzen wünschen: eine Arztpraxis, die eine KI über das lokale Netzwerk für das gesamte Team zugänglich machen möchte, ein Ingenieurbüro, das einen RAG-Assistenten für seine internen Dokumente bereitstellt, oder ein KI-Entwickler, der eine native Linux-Umgebung wünscht, die für das Modelltraining optimiert ist.
⚠️ Wichtig: Der ASUS Ascent GX10 läuft unter DGX OS (Linux Ubuntu). Er ist nicht für den Windows-Bürogebrauch konzipiert. Wenn Sie eine vielseitige Maschine benötigen (Textverarbeitung, Tabellenkalkulation, tägliches Surfen), ist eine CoreAI Workstation besser geeignet.
Konfigurieren Sie Ihre KI-Maschine
Jede Konfiguration ist über unseren Online-Konfigurator vollständig anpassbar. Alle Optionen sind kompatibel und werden vor dem Versand von unseren Technikern überprüft.
CoreAI 32
RTX 5070 Ti
- GPU RTX 5070 Ti 16 GB
- CPU Ryzen 9 9900X
- RAM 32 GB DDR5 → 256 GB
- SSD 1 TB NVMe
CoreAI 64
RTX 5090
- GPU RTX 5090 32 GB
- CPU Ryzen 9 9950X3D
- RAM 64 GB DDR5 → 256 GB
- SSD 1 TB NVMe
ASUS Ascent
NVIDIA GB10
- GPU NVIDIA GB10 Blackwell
- Speicher 128 GB LPDDR5X Unified
- KI-Leistung 1 PetaFLOP INT8
- OS DGX OS (Linux)
Welche Konfiguration wählen Sie je nach Anwendungsfall?
Die richtige Wahl hängt von drei Faktoren ab: der Größe der Modelle, die Sie verwenden möchten, Ihrer Arbeitsumgebung (Einzelplatz vs. Shared Server) und Ihrem Software-Stack (Windows oder natives Linux).
Anwalt / Notar
DSGVO-Assistent für vertrauliche Dokumente, Vertragsanalyse. CoreAI 32 oder GB10, je nachdem, ob Sie eine Maschine oder einen gemeinsam genutzten Server in der Kanzlei wünschen.
Arzt / Arztpraxis
Unterstützung beim Schreiben, Berichte, Analyse medizinischer Bilder. GB10 empfohlen für Multi-User-Einsatz im lokalen Netzwerk.
KI-Entwickler
LoRA Fine-Tuning, RAG, autonome Agenten. CoreAI 64 RTX 5090 für maximale GPU-Leistung unter Windows; GB10 für eine native Linux CUDA-Umgebung.
KMU / Mittelständische Unternehmen
Bereitstellung eines internen Shared LLM. GB10 als zentraler Server + Workstations für Schlüsselmitarbeiter.
Kreation & 3D
Generative KI (Bilder, Videos), 3D-Rendering, 4K-Schnitt. CoreAI 32 für den Einstieg, CoreAI 64 für die anspruchsvollsten Projekte.
Data Science
Training benutzerdefinierter Modelle, Verarbeitung großer Datensätze. CoreAI 64 oder GB10 je nach Größe der Workloads.
Benötigen Sie Hilfe bei der Auswahl Ihrer Konfiguration?
Unser Team antwortet innerhalb von 3 Stunden und erstellt Ihnen ein auf Ihre Nutzung, Ihr Budget und Ihre bestehende Infrastruktur zugeschnittenes Angebot. Abholung vor Ort in Auriol (13) möglich.
Häufig gestellte Fragen





















