PC-Konfiguration für lokale KI im Jahr 2026: Umfassender Leitfaden und Vergleich

 

Leitfaden aktualisiert · März 2026

Konfigurierte Workstation, Dual-GPU oder NVIDIA GB10 Mini-Server: Wir vergleichen jede Option, damit Sie die richtige Maschine für Ihre Bedürfnisse finden: ohne Cloud, ohne Kompromisse bei Ihren Daten.

Vom Radiance Systems Team Lesezeit: 8 Min. Konfigurator für jedes Modell enthalten

Warum KI lokal ausführen?

Im Jahr 2026 ist künstliche Intelligenz nicht mehr nur Rechenzentren vorbehalten. Dank neuer GPU-Architekturen und optimierter Open-Source-Modelle (Llama 4, Mistral, DeepSeek, Qwen...) ist es heute möglich, leistungsstarke LLMs direkt auf Ihrem eigenen Computer auszuführen, ohne Daten in die Cloud zu senden.

Für Fachleute, die der DSGVO unterliegen, wie Anwälte, Ärzte, Buchhalter, Notare, Ingenieurbüros: Dies ist eine Revolution. Sie profitieren von einer leistungsstarken KI, ohne Ihre Kundendaten jemals Dritten preiszugeben.

  • Vollständige Vertraulichkeit: Ihre Daten bleiben in Ihrem lokalen Netzwerk, kein Versand an externe Server.
  • Keine wiederkehrenden Abonnements: Nach dem Kauf der Maschine sind die Inferenzkosten gleich Null.
  • Geringe Latenz: Die Antwort ist sofort da, ohne von der Qualität Ihrer Verbindung abzuhängen.
  • Offline-Betrieb: Nützlich vor Ort, unterwegs oder bei Netzwerkausfall.
  • Umfassende Anpassung: Fine-Tuning, RAG, Agenten: Sie kontrollieren die gesamte Umgebung.

Gut zu wissen: Alle Radiance Systems Maschinen werden in Frankreich (Auriol, 13) montiert, getestet und optimiert, mit einer 2-jährigen Garantie und dediziertem technischem Support, der innerhalb von 3 Stunden antwortet.

Die wichtigsten Kriterien einer PC-Konfiguration für KI

Die GPU-VRAM: der wichtigste Faktor

Für lokale KI bestimmt der Videospeicher (VRAM) direkt die Größe der Modelle, die Sie ausführen können. Ein LLM mit 7 Milliarden Parametern in 4-Bit benötigt etwa 4–5 GB VRAM; ein 70B-Modell in 4-Bit benötigt 35–40 GB. Je größer der VRAM, desto größere Modelle können Sie laden oder mehrere Modelle gleichzeitig ausführen.

Gute Nachricht: Alle unsere Workstations sind vollständig konfigurierbar, einschließlich der Grafikkarte. Der CoreAI 64 bietet zum Beispiel Consumer-GPUs (RTX 5070 Ti bis RTX 5090), aber auch professionelle GPUs mit bis zu 96 GB VRAM (RTX 6000 Blackwell, L40S, H100…). Wenn Sie einen spezifischen Bedarf an GPU-Speicher haben, können Sie genau die Maschine zusammenstellen, die Sie benötigen, entweder über den Konfigurator oder indem Sie uns für ein maßgeschneidertes Angebot kontaktieren.

Modellgröße Quantisierung Benötigter VRAM Kompatibel mit
7B (z. B. Mistral 7B) 4-bit (GGUF) ~4–5 GB RTX 5070 Ti, RTX 5090, GB10
13–14B 4-bit ~8–10 GB RTX 5070 Ti, RTX 5090, GB10
32–34B 4-bit ~18–22 GB RTX 5090 (32 GB), RTX 6000 Blackwell (96 GB), GB10 (128 GB)
70B (z. B. Llama 4 Scout) 4-bit ~35–40 GB RTX 5090 (teilweise), L40S (48 GB) ✅, GB10 ✅
70B volle Präzision / 2×70B 8-bit oder FP16 60–96 GB RTX 6000 Blackwell (96 GB) ✅, GB10 ✅
Modelle 200B+ / schwere Multimodal-Modelle 4–8-bit 100–128 GB+ GB10 (128 GB Unified) ✅, H100 NVL (94 GB) ✅

GPU-Konfigurator: Der CoreAI 64 ermöglicht die Auswahl aus über 15 GPUs, von der Consumer-RTX 5070 Ti bis zur H200 141 GB. Sie sind nicht auf die angezeigten Konfigurationen beschränkt: Kontaktieren Sie uns für ein auf Ihre genauen VRAM-Anforderungen zugeschnittenes Angebot.

System-RAM, Prozessor und Speicher

Der System-RAM wird für komplexe Pipelines (RAG, Multi-Agenten-Orchestrierung, Verarbeitung großer Dokumente) benötigt. 32 GB sind ein ernstzunehmendes Minimum; 64 GB und mehr werden notwendig, sobald Sie mehrere Aufgaben parallel ausführen. Auf der CPU-Seite bieten die AMD Ryzen 9-Serien auf AM5 das hervorragende Gleichgewicht zwischen Rechenleistung und Speicherdurchsatz, das KI-Frameworks benötigen. Schließlich beschleunigt eine schnelle NVMe-SSD das anfängliche Laden von Modellgewichten: Rechnen Sie mit mindestens 1 TB für eine komfortable Nutzung.

Vergleich der 3 Radiance Systems Konfigurationen

Modell GPU / KI-Speicher CPU RAM Grundpreis Ideal für
CoreAI 32 RTX 5070 Ti Profi-Einstieg RTX 5070 Ti: 16 GB VRAM Ryzen 9 9900X (12c) 32 GB DDR5 (bis zu 256 GB) 2.442 € LLM bis 13B, Bildgenerierung, KI-Entwicklung, Multimedia
CoreAI 64 RTX 5090 High-End RTX 5090: 32 GB VRAM Ryzen 9 9950X3D (16c) 64 GB DDR5 (bis zu 256 GB) 6.042 € LLM 70B, Fine-Tuning, professionelles 3D-Rendering, intensive KI-Pipelines
Mini Server GB10 ASUS Ascent NVIDIA GB10: 128 GB LPDDR5X Unified Grace (ARM, 20 Kerne) 128 GB Unified CPU+GPU 3.999 € Dedizierter KI-Server, 70B+-Modelle, Multi-User-Inferenz, On-Premise-Bereitstellung

Radiance PC CoreAI 32: RTX 5070 Ti

Der Radiance PC CoreAI 32 ist die professionelle Einsteiger-KI-Workstation. Dies ist die ideale Konfiguration, um ernsthaft mit lokaler KI zu beginnen, ohne das Budget zu sprengen, und gleichzeitig eine voll erweiterbare Maschine zu behalten.

Basiskonfiguration

  • GPU: NVIDIA GeForce RTX 5070 Ti: 16 GB VRAM (Blackwell-Architektur)
  • CPU: AMD Ryzen 9 9900X: 12 Kerne / 24 Threads, AM5-Sockel
  • RAM: 32 GB DDR5 5600 MHz: erweiterbar auf bis zu 256 GB
  • Speicher: 1 TB NVMe (bis zu 3.500 MB/s)
  • Netzteil: MSI 850W 80+ Gold PCIe 5
  • Betriebssystem: Windows 11 Professional (Lizenz enthalten)
  • WiFi 6E + Bluetooth je nach gewähltem Mainboard enthalten

Was Sie ausführen können

Mit 16 GB VRAM bewältigt der CoreAI 32 komfortabel LLMs bis 13B in voller Qualität, 7B-Modelle im langen Kontext, Bildgenerierung mit FLUX, Stable Diffusion XL sowie leichte multimodale Verarbeitungspipelines. Dies ist die Maschine, die typischerweise von Anwälten, KMU und Freiberuflern verwendet wird, die eine effiziente lokale KI ohne Serverbeschränkungen wünschen.

⚠️ Wichtige Einschränkung: Modelle ab 30B überschreiten den VRAM-Speicher und werden teilweise in den System-RAM ausgelagert, was die Inferenz erheblich verlangsamt. Für diese Anwendungen bevorzugen Sie den CoreAI 64 oder den GB10.

Radiance PC CoreAI 64: RTX 5090

Der Radiance PC CoreAI 64 ist die High-End KI-Workstation der Serie. Mit der RTX 5090 und ihren 32 GB VRAM kann sie aktuelle LLMs mit voller Leistung ausführen, einschließlich 70B-Modelle mit aggressiver Quantisierung. Und wenn Ihre Anforderungen über den Consumer-Bereich hinausgehen, bietet der Konfigurator auch professionelle GPUs: L40S 48 GB, RTX 5000 Blackwell 48 GB, RTX 6000 Blackwell 96 GB oder sogar H100 NVL für die intensivsten Workloads.

Basiskonfiguration

  • GPU: NVIDIA GeForce RTX 5090: 32 GB VRAM (die leistungsstärkste Consumer-GPU im Jahr 2026)
  • CPU: AMD Ryzen 9 9950X3D: 16 Kerne / 32 Threads + 3D V-Cache
  • RAM: 64 GB DDR5 6000 MHz: erweiterbar auf bis zu 256 GB
  • Speicher: 1 TB NVMe (bis zu 3.500 MB/s): einfach erweiterbar
  • Netzteil: Deepcool 1200W 80+ Gold
  • Betriebssystem: Windows 11 Professional (Lizenz enthalten)
  • WiFi 7 + Bluetooth enthalten (MSI X870E)

Was Sie ausführen können

Die RTX 5090 32 GB ist die Referenz-GPU für lokale KI auf Consumer-Workstations. Sie ermöglicht die Ausführung von Llama 4 Scout (109B MoE mit 17B-Aktivierung), Qwen 2.5 72B in 4-Bit, DeepSeek-R2 destilliert oder auch schwerer multimodaler Pipelines, die Vision + Text kombinieren. Dies ist auch die Referenzkonfiguration für leichtes Fine-Tuning (LoRA, QLoRA) auf Unternehmensdatensätzen.

Um noch weiter zu gehen, bietet der Konfigurator professionelle GPUs: Die RTX 6000 Blackwell 96 GB ermöglicht die Ausführung von 70B-Modellen in voller Präzision oder mehreren Modellen parallel; die L40S 48 GB ist für Server-Inferenz optimiert; und bis zur H100 NVL 94 GB für die anspruchsvollsten Anforderungen. Der VRAM ist keine feste Obergrenze: Er ist konfigurierbar.

Voll konfigurierbare GPU: Der CoreAI 64 bietet über 15 GPU-Optionen in seinem Konfigurator, von der RTX 5070 Ti bis zur H200 141 GB. Sie können auch eine zweite Grafikkarte hinzufügen (Multi-GPU). Der VRAM ist keine feste Einschränkung: Er passt sich Ihrer Nutzung an. Kontaktieren Sie uns für ein maßgeschneidertes Angebot.

Mini-KI-Server NVIDIA GB10: ASUS Ascent GX10

Der ASUS Ascent GX10 (NVIDIA GB10 Grace Blackwell) ist eine eigene Kategorie. Es ist keine klassische Workstation: Es ist ein dedizierter Mini-KI-Server, ultrakompakt (150×150×51 mm), ausschließlich für KI-Workloads konzipiert: lokale Inferenz, Fine-Tuning, RAG, autonome Agenten, Multi-User-Bereitstellung.

Unified Architecture: Der GB10-Vorteil

Der NVIDIA GB10-Chip kombiniert ARM-CPU (Grace, 20 Kerne) und Blackwell-GPU in einer Unified Memory Architecture mit 128 GB LPDDR5X. Im Gegensatz zu einer klassischen Grafikkarte (separater VRAM) ist dieser Unified Memory sowohl für CPU als auch GPU uneingeschränkt zugänglich, ohne kostspielige Übertragungen zwischen beiden. Das Ergebnis: Sie können 70B-Modelle in voller Präzision oder mehrere Modelle gleichzeitig mit außergewöhnlicher Speicherbandbreite ausführen.

  • 1 PetaFLOP KI-Leistung (INT8): Zum Vergleich erreichen die besten Gaming-GPUs ~0,35 PFLOPS INT8
  • 128 GB Unified Memory: Llama 4 Maverick (400B MoE) ist denkbar
  • DGX OS vorinstalliert: CUDA, PyTorch, TensorFlow, Jupyter: alles ist sofort einsatzbereit
  • Professionelle Netzwerkverbindung: 10G LAN + ConnectX-7 (2×200G QSFP)
  • Wi-Fi 7 + Bluetooth 5 integriert
  • Ultrakompaktes Desktop-Format: 1,48 kg, auf jedem Schreibtisch oder im Rack verwendbar

Für wen ist er gemacht?

Der GB10 richtet sich an Unternehmen, die einen dedizierten KI-Server getrennt von den Arbeitsplätzen wünschen: eine Arztpraxis, die eine KI über das lokale Netzwerk für das gesamte Team zugänglich machen möchte, ein Ingenieurbüro, das einen RAG-Assistenten für seine internen Dokumente bereitstellt, oder ein KI-Entwickler, der eine native Linux-Umgebung wünscht, die für das Modelltraining optimiert ist.

⚠️ Wichtig: Der ASUS Ascent GX10 läuft unter DGX OS (Linux Ubuntu). Er ist nicht für den Windows-Bürogebrauch konzipiert. Wenn Sie eine vielseitige Maschine benötigen (Textverarbeitung, Tabellenkalkulation, tägliches Surfen), ist eine CoreAI Workstation besser geeignet.

Konfigurieren Sie Ihre KI-Maschine

Jede Konfiguration ist über unseren Online-Konfigurator vollständig anpassbar. Alle Optionen sind kompatibel und werden vor dem Versand von unseren Technikern überprüft.

Pro-Einstieg

CoreAI 32
RTX 5070 Ti

2.442 € ab
  • GPU RTX 5070 Ti 16 GB
  • CPU Ryzen 9 9900X
  • RAM 32 GB DDR5 → 256 GB
  • SSD 1 TB NVMe
Konfigurieren & Bestellen →
High-End

CoreAI 64
RTX 5090

6.042 € ab
  • GPU RTX 5090 32 GB
  • CPU Ryzen 9 9950X3D
  • RAM 64 GB DDR5 → 256 GB
  • SSD 1 TB NVMe
Konfigurieren & Bestellen →
Mini-KI-Server

ASUS Ascent
NVIDIA GB10

3.999 € ab
  • GPU NVIDIA GB10 Blackwell
  • Speicher 128 GB LPDDR5X Unified
  • KI-Leistung 1 PetaFLOP INT8
  • OS DGX OS (Linux)
Konfigurieren & Bestellen →

Welche Konfiguration wählen Sie je nach Anwendungsfall?

Die richtige Wahl hängt von drei Faktoren ab: der Größe der Modelle, die Sie verwenden möchten, Ihrer Arbeitsumgebung (Einzelplatz vs. Shared Server) und Ihrem Software-Stack (Windows oder natives Linux).

⚖️

Anwalt / Notar

DSGVO-Assistent für vertrauliche Dokumente, Vertragsanalyse. CoreAI 32 oder GB10, je nachdem, ob Sie eine Maschine oder einen gemeinsam genutzten Server in der Kanzlei wünschen.

🏥

Arzt / Arztpraxis

Unterstützung beim Schreiben, Berichte, Analyse medizinischer Bilder. GB10 empfohlen für Multi-User-Einsatz im lokalen Netzwerk.

💻

KI-Entwickler

LoRA Fine-Tuning, RAG, autonome Agenten. CoreAI 64 RTX 5090 für maximale GPU-Leistung unter Windows; GB10 für eine native Linux CUDA-Umgebung.

🏢

KMU / Mittelständische Unternehmen

Bereitstellung eines internen Shared LLM. GB10 als zentraler Server + Workstations für Schlüsselmitarbeiter.

🎨

Kreation & 3D

Generative KI (Bilder, Videos), 3D-Rendering, 4K-Schnitt. CoreAI 32 für den Einstieg, CoreAI 64 für die anspruchsvollsten Projekte.

📊

Data Science

Training benutzerdefinierter Modelle, Verarbeitung großer Datensätze. CoreAI 64 oder GB10 je nach Größe der Workloads.

Benötigen Sie Hilfe bei der Auswahl Ihrer Konfiguration?

Unser Team antwortet innerhalb von 3 Stunden und erstellt Ihnen ein auf Ihre Nutzung, Ihr Budget und Ihre bestehende Infrastruktur zugeschnittenes Angebot. Abholung vor Ort in Auriol (13) möglich.

Häufig gestellte Fragen

Eine Workstation (CoreAI 32/64) ist ein vollständiger PC mit Windows, Bildschirm, Tastatur: nutzbar für all Ihre täglichen Aufgaben zusätzlich zur KI. Der Mini-Server GB10 ist ein dediziertes Gerät ohne Standard-Grafikoberfläche, das unter Linux DGX OS läuft. Er ist dafür konzipiert, in ein Netzwerk integriert und über API oder SSH abgefragt zu werden. Dies ist die richtige Wahl, wenn Sie eine KI wünschen, die mehreren Personen in Ihrem lokalen Netzwerk zugänglich ist, ohne einen vollständigen Desktop-PC zu belegen.
Ja. Der CoreAI 32 (16 GB VRAM) verwaltet Llama 4 Scout in der destillierten Version oder Mistral Small in voller Präzision sehr gut. Der CoreAI 64 (32 GB VRAM) reicht bis zu den quantisierten 70B-Versionen. Der GB10 mit 128 GB Unified Memory kann die größten Open-Source-Modelle ausführen, einschließlich Llama 4 Maverick. Tools wie LM Studio, Ollama oder llama.cpp funktionieren perfekt unter Windows; der GB10 integriert nativ die CUDA- und Jupyter-Tools.
Ja. Lokale KI bedeutet, dass Ihre Daten Ihre Infrastruktur niemals verlassen. Während der Inferenz werden keine Netzwerkanrufe an Drittanbieter-Server getätigt. In Verbindung mit einem sicheren lokalen Netzwerk und unseren für den GB10 verfügbaren NAS- + USV-Optionen stellen diese Maschinen eine vollständig DSGVO-konforme KI-Infrastruktur für regulierte Berufe dar.
CoreAI Workstations werden je nach Verfügbarkeit der Komponenten in der Regel innerhalb von 5 bis 10 Arbeitstagen montiert und versandt. Der ASUS Ascent GX10 (GB10) wird nach Vorbereitung und Tests durch unsere Techniker innerhalb von 5 bis 7 Arbeitstagen versandt. Sie können Ihre Bestellung auch direkt bei uns in Auriol (13) nach Terminvereinbarung abholen.
Ja. Für den GB10 Mini-Server bieten wir eine Installation vor Ort in Frankreich (790 €) oder Europa (1.490 €) an, einschließlich Netzwerkkonfiguration, KI-Umgebungskonfiguration und Schulung zur Inbetriebnahme. "Schlüsselfertige KI"-Pakete (499 €) und "erweiterte Inbetriebnahme" (249 €) sind ebenfalls im Konfigurator erhältlich.
Alle unsere Maschinen haben eine 2-jährige Radiance Systems Garantie (schneller Austausch oder Reparatur). Garantieerweiterungen sind verfügbar: +1 Jahr (insgesamt 3 Jahre, 499 €) oder +3 Jahre (insgesamt 5 Jahre, 999 €) mit Übernahme der Rücksendekosten und Express-Diagnose innerhalb von 12 Arbeitsstunden.
🔒
100% lokal & DSGVO
Keine Daten in der Cloud
🇫🇷
Montiert in Frankreich
Auriol (13), Bouches-du-Rhône
Antwort in < 3h
Mo–Fr 9h–17h
🛠️
2 Jahre Garantie
Austausch oder schnelle Reparatur
🚀
Sofort einsatzbereit
Premium-Montage inklusive