PC pour OpenClaw en local : quel matériel choisir ? | Radiance Systems

PC für OpenClaw lokal: Welche Hardware soll ich wählen? | Radiance Systems

Technischer Leitfaden · Lokale KI

OpenClaw ist ein Framework für KI-Agenten, das vollständig auf Ihrem Rechner läuft. Um jedoch seine volle Leistung auszuschöpfen – schnelle Inferenz, große Modelle, latenzfreie Pipeline – ist Ihre Hardware genauso wichtig wie Ihre Softwarekonfiguration. Hier erfahren Sie alles, was Sie wissen müssen.

Vom Radiance Systems Team · · 8 Min. Lesezeit

TL;DR — Wichtige Punkte
  • OpenClaw funktioniert 100 % offline, sobald die Modelle heruntergeladen sind – keine Cloud-Abhängigkeit.
  • Das Minimum für eine flüssige Nutzung: eine NVIDIA GPU mit mindestens 16 GB VRAM.
  • Für 30B+-Modelle benötigen Sie eine GPU mit 24–32 GB VRAM oder ein Multi-GPU-System.
  • System-RAM: mindestens 32 GB DDR5 für gemischte KI-Workloads + Büroanwendungen.
  • Radiance CoreAI Workstations werden vorkonfiguriert mit CUDA, Ollama und der Umgebung für OpenClaw geliefert.
  • Kein Abonnement, keine Kosten pro Token: Ihre KI gehört Ihnen.


Was ist OpenClaw und warum sollte man es lokal ausführen?

OpenClaw ist ein Open-Source-Framework zur Orchestrierung von KI-Agenten. Es ermöglicht Ihnen, Sprachmodelle (LLM) direkt auf Ihrer Infrastruktur bereitzustellen, zu verketten und mit ihnen zu interagieren – ohne eine Drittanbieter-API zu nutzen, ohne Ihre Daten an externe Server zu senden.

Das Versprechen ist einfach: Sie behalten die volle Kontrolle über Ihre KI-Pipeline. Ihre Dokumente, Ihre Anfragen, Ihre Antworten verlassen niemals Ihr Netzwerk. Für Fachleute, die der DSGVO, dem Berufsgeheimnis oder der juristischen Ethik unterliegen, ist dies ein grundlegender Paradigmenwechsel.

Aber OpenClaw ist ressourcenintensiv. Es basiert auf LLM-Modellen, die im GPU-Speicher geladen werden, und seine Leistung hängt direkt von Ihrer Hardware ab. Ein Consumer-PC oder Laptop wird nicht lange durchhalten.

💡
Warum „lokal“ statt Cloud-API? APIs wie OpenAI berechnen nach Token und übertragen Ihre Daten außerhalb Ihres Unternehmens. Lokal bezahlen Sie Ihre Hardware einmal, und jede Anfrage kostet nur wenige Cent Strom – ohne jegliche Datenabwanderung.


Welche PC-Konfiguration für OpenClaw lokal?

OpenClaw orchestriert Agenten, die LLM-Modelle zur Inferenz aufrufen. Diese Modelle bestimmen den Hardwarebedarf. Hier sind die Schwellenwerte, die Sie kennen sollten:


Die GPU: das Herzstück

Der VRAM (Videospeicher) bestimmt, welche Modelle Sie laden können und wie schnell sie Tokens generieren. Dies ist der wichtigste limitierende Faktor.

16 GB VRAM → 7B–13B Modelle komfortabel 24–32 GB VRAM → 30B–70B quantisierte Modelle 48–96 GB VRAM → 70B+ Modelle in voller Präzision

NVIDIA GPUs werden aufgrund des CUDA-Ökosystems bevorzugt, das für Frameworks wie llama.cpp, Ollama oder vLLM, die OpenClaw antreiben, unerlässlich ist. Die RTX 5000-Serie (Blackwell-Architektur) bietet derzeit das beste Verhältnis von Leistung zu VRAM, das in Workstations erhältlich ist.


Der System-RAM

Der RAM wird für lange Kontexte, Embeddings und parallele Pipelines verwendet. Unter 32 GB DDR5 riskieren Sie Engpässe bei komplexen Workflows.


Der Speicher

LLM-Modelle sind groß: von 4 GB für ein quantisiertes 7B-Modell bis zu 80 GB+ für ein vollständiges 70B-Modell. Planen Sie eine NVMe-SSD von mindestens 2 TB ein, wenn Sie mehrere Modelle gleichzeitig speichern möchten.

⚠️
Vorsicht bei hybriden CPU/GPU-Konfigurationen. Wenn Ihr Modell nicht vollständig in den VRAM passt, lädt OpenClaw einen Teil in den CPU-RAM. Die Generierungsgeschwindigkeit sinkt dann um 80 bis 95 %. Dimensionieren Sie Ihre GPU so, dass sie das vollständige Modell aufnehmen kann.


Schritt-für-Schritt-Installationsanleitung für OpenClaw auf Ihrem PC

Hier ist der vollständige Prozess, um OpenClaw unter Windows 11 oder Ubuntu betriebsbereit zu machen. Radiance CoreAI Workstations werden mit vorinstallierten CUDA-Treibern und Ollama geliefert, was diesen Prozess auf 3–4 Schritte reduziert.

1
NVIDIA-Treiber und CUDA überprüfen

Stellen Sie sicher, dass Ihr NVIDIA-Treiber aktuell ist (Version ≥ 525) und das CUDA Toolkit installiert ist. Überprüfen Sie dies mit nvidia-smi im Terminal. Auf Radiance-Maschinen ist dies bereits erledigt.

2
Ollama installieren (Inferenz-Backend)

OpenClaw basiert auf Ollama, um Modelle lokal zu laden und zu bedienen. Installieren Sie es von ollama.com oder über das Terminal: curl -fsSL https://ollama.com/install.sh | sh. Unter Windows genügt der GUI-Installer.

3
Ihr erstes Modell herunterladen

Im Terminal: ollama pull mistral für ein 7B-Modell oder ollama pull qwen2.5:32b für ein leistungsstärkeres Modell. Der Download erfolgt nur einmal.

4
OpenClaw und seine Abhängigkeiten installieren

Klonen Sie das offizielle OpenClaw-Repository, installieren Sie die Python-Abhängigkeiten (venv empfohlen), und konfigurieren Sie dann config.yaml, um auf Ihren lokalen Ollama-Endpoint (http://localhost:11434) zu verweisen.

5
Ihren ersten Agenten starten

Starten Sie Ollama im Hintergrund (ollama serve), dann starten Sie OpenClaw. Ihr erster KI-Agent läuft vollständig auf Ihrem Rechner – keine Daten verlassen Ihr Netzwerk.

6
(Optional) Ihre Dokumente über RAG verbinden

Fügen Sie eine RAG-Schicht hinzu, indem Sie Ihre PDFs, Word-Dokumente oder lokalen Datenbanken indizieren. OpenClaw kann Ihre internen Dokumente in natürlicher Sprache abfragen – Berufsgeheimnis garantiert.


Hardware-Vergleich: Welche Workstation für welchen OpenClaw-Einsatz?

Nicht alle PCs sind für OpenClaw gleich gut geeignet. Diese Tabelle fasst die Schlüsselkriterien je nach Nutzungsprofil zusammen.

Nutzungsprofil Benötigter VRAM System-RAM Unterstützte Modelle Empfohlener Tier
Leichte individuelle Nutzung — 1 Agent, gelegentliche Nutzung 16 GB 16–32 GB 7B–13B
Mistral, LLaMA 3.1
CoreAI 16
Regelmäßiger professioneller Einsatz — RAG, Multi-Docs, komplexe Agenten 16–24 GB 32 GB 13B–30B quantisiert
Qwen 2.5, DeepSeek
CoreAI 32
Mehrbenutzer-Büro — gleichzeitige Inferenz 32 GB 64 GB 70B quantisiert
Mixtral, Qwen 72B
CoreAI 64
24/7 Multi-Agenten-Produktion — Fine-Tuning 64–96 GB (Multi-GPU) 128 GB 70B+ voll / 200B
Fine-Tuning möglich
Rack 2×5090 / GB10

Hinweis zur Quantisierung: 4-Bit- oder 8-Bit-GGUF-Modelle können ein 30B-Modell auf 16 GB VRAM ausführen, mit einem leichten Qualitätsverlust. Für kritische professionelle Anwendungen ist maximale Präzision vorzuziehen – was eine korrekte Dimensionierung Ihrer GPU erfordert.


Die Radiance-Maschinen, bereit für OpenClaw

Jede Maschine wird in Auriol (13) montiert, vorkonfiguriert und betriebsbereit geliefert. CUDA-Treiber, Ollama und die Python-Umgebung sind bereits eingerichtet.

🛠️
Betriebsbereit geliefert. NVIDIA-Treiber, CUDA Toolkit, Ollama vorinstalliert. Sie müssen nur Ihr Modell auswählen und OpenClaw starten. Unser Team unterstützt Sie in den ersten Stunden der Inbetriebnahme.


Welche LLM-Modelle können mit OpenClaw lokal verwendet werden?

OpenClaw ist kompatibel mit jedem Modell, das über eine OpenAI-kompatible API bereitgestellt wird – dazu gehören Ollama, llama.cpp, LM Studio oder vLLM. Unsere Auswahl 2025:

Modell Größe Benötigter VRAM Stärken Zielprofil
Mistral Small 3.1 24B ~14 GB (Q4) Schnell, mehrsprachig, präzise Anweisungen Allgemeine Nutzung, Assistenten
Qwen 2.5 / Qwen3 7B–72B 4–40 GB Hervorragend in Französisch, starke Argumentation Recht, Medizin, Buchhaltung
DeepSeek-R1 7B–70B 4–38 GB Chain-of-Thought-Reasoning, Code, Analyse F&E, Ingenieurbüros
LLaMA 3.3 70B ~38 GB (Q4) Referenzmodell, vielseitig Für alle professionellen Anwendungen
Gemma 3 9B–27B 5–16 GB Leicht, multimodal, leistungsstark auf kleinen GPUs Einzelpraxen, Medizin

Für den professionellen Einsatz in deutscher Sprache bieten Qwen 2.5 32B und Mistral Small 3.1 das beste Gleichgewicht zwischen Antwortqualität und Inferenzgeschwindigkeit auf einer 16–24 GB GPU.

Lokale KI vs. Cloud: Die entscheidenden Argumente für Profis

Kriterium Lokale KI (OpenClaw + Radiance) Cloud-KI (ChatGPT, Copilot…)
Datenvertraulichkeit ✓ Vollständig – nichts verlässt das System ✗ Daten werden an den Anbieter übermittelt
DSGVO-Konformität ✓ Nativ – keine Übertragung außerhalb der EU ⚠ Variabel je nach DPA-Verträgen
Kostenmodell Einmalige Investition Abonnement + Abrechnung pro Token
Offline-Verfügbarkeit ✓ Funktioniert ohne Internet ✗ Erfordert eine permanente Verbindung
Anpassung / Fine-Tuning ✓ Vollständig auf Ihren Daten Je nach Angebot begrenzt
Berufsgeheimnis ✓ Designbedingt respektiert ⚠ Echtes ethisches Risiko


Radiance Praxiserfahrung: Unsere Pro-Tipps für OpenClaw

Wir montieren und deployen KI-Workstations von Auriol aus für Fachleute in ganz Europa. Das haben wir aus unseren Praxiserfahrungen gelernt:


💡 Unterschätzen Sie nicht die NVMe-Bandbreite

Beim Start lädt OpenClaw das Modell vom Datenträger in den VRAM. Ein NVMe Gen 4 (~7.000 MB/s) reduziert diese Ladezeit um 40 bis 70 % im Vergleich zu einer SATA-SSD. Auf unseren CoreAI-Maschinen ist Gen 4 Standard.


💡 Begrenzen Sie das Kontextfenster, wenn Ihnen VRAM fehlt

OpenClaw kann lange Kontexte öffnen (32K, 128K Tokens). Jeder Kontext-Token verbraucht VRAM. Beschränken Sie auf einer 16 GB GPU auf 8K–16K Tokens, um eine schnelle Generierung zu gewährleisten. Auf einer 32 GB GPU ist 128K problemlos zugänglich.


💡 Aktivieren Sie Flash Attention, wenn Ihre GPU dies unterstützt

Die RTX 5000 (Blackwell) unterstützen Flash Attention 3 nativ, was den Speicherbedarf für lange Kontexte um 30 bis 50 % reduziert. Aktivieren Sie es in der Konfiguration Ihres Inferenz-Backends.


💡 Für ein Multi-User-Büro: OpenClaw als interne API bereitstellen

Anstatt OpenClaw auf jedem Arbeitsplatz zu installieren, deployen Sie eine Serverinstanz auf einer Radiance Rack-Workstation, die über Ihr lokales Netzwerk zugänglich ist. Alle Ihre Mitarbeiter verbinden sich lokal, die Daten bleiben vor Ort, und Sie teilen sich die GPU-Leistung.

🏆
Unsere Praxisfeststellung: Fachleute, die auf lokale KI über OpenClaw umsteigen, stellen einen ROI von 4 bis 8 Monaten im Vergleich zu Cloud-Abonnements mit gleichem Nutzungsvolumen fest. Und sie müssen ihren Kunden nicht mehr erklären, warum ihre Daten ins Ausland gehen.


Häufig gestellte Fragen zu OpenClaw lokal


Ist OpenClaw schwer zu installieren?

Auf einem Standardrechner erfordert die Installation Grundkenntnisse über Terminal und Python. Auf Radiance CoreAI Workstations ist die Umgebung (CUDA, Ollama, Python) vorkonfiguriert, wodurch die Installation auf etwa zehn Minuten reduziert wird. Unser Team kann auch die Erstkonfiguration aus der Ferne durchführen.


Kann man mit OpenClaw lokales Fine-Tuning durchführen?

OpenClaw ist ein Agenten-Orchestrator, kein Fine-Tuning-Tool. Um ein Modell auf Ihren Daten zu verfeinern, benötigen Sie ein spezielles Tool (Axolotl, LLaMA-Factory) und eine GPU mit mindestens 24 GB VRAM für 7B-Modelle oder ein Multi-GPU-System für größere Modelle. Unsere Rack-Konfigurationen 2×RTX 5090 und RTX 6000 PRO Blackwell sind für diesen Einsatzzweck ausgelegt.


Funktioniert OpenClaw unter Windows?

Ja, OpenClaw unterstützt Windows über WSL2 oder nativ mit Python. Unsere CoreAI-Maschinen werden mit Windows 11 Pro und voraktiviertem WSL2 geliefert, was eine vollständige Kompatibilität mit dem Ökosystem der Open-Source-KI-Tools gewährleistet.


Was ist der Unterschied zwischen OpenClaw und Open WebUI?

Open WebUI ist eine grafische Benutzeroberfläche zur Interaktion mit Modellen über einen Chat. OpenClaw ist ein Framework für KI-Agenten – es automatisiert komplexe Aufgaben, verknüpft Modellaufrufe, integriert externe Tools und kann in mehreren Schritten argumentieren. Beide können auf derselben Maschine koexistieren.


Meine Kanzlei hat strenge DSGVO-Auflagen. Ist lokale KI wirklich konform?

Ja. Sobald die Verarbeitung personenbezogener Daten auf Ihrer Hardware, in Ihren Räumlichkeiten und ohne Übermittlung an einen Drittanbieter erfolgt, erfüllen Sie die Grundsätze der Datenminimierung und Datensouveränität der DSGVO. Die Radiance Workstations sind genau darauf ausgelegt, diese Architektur standardmäßig zu gewährleisten.


Ihr PC für OpenClaw lokal, montiert in Auriol

Nennen Sie uns Ihren Verwendungszweck, Ihren Beruf, Ihre Zielmodelle. Wir konfigurieren die ideale Maschine und senden sie Ihnen innerhalb von 4 bis 10 Werktagen betriebsbereit zu.

Kostenloses Angebot anfordern →
Zurück zum Blog

Weitere Fragen?

Senden Sie uns eine E-Mail an contact@radiancesystems,eu oder kontaktieren Sie uns über das Kontaktformular. Wir beantworten alle Anfragen während der Arbeitszeiten (Montag bis Freitag von 9 bis 17 Uhr) innerhalb von 3 Stunden.

📞 +33 4 65 84 48 21