💻 Lokal & sicher

KI auf deinem PC

Wenn du KI lieber auf deinem eigenen Rechner laufen lässt – und warum das immer wichtiger wird.

🤖 KI-KompendiumKI lokal & sicher

Cloud-KI ist bequem – aber jede Frage, jedes Foto, jedes Dokument geht zum Anbieter. Für sensible Daten oder einfach aus Prinzip: KI läuft auch lokal auf deinem PC. Hier zeigen wir, wie das funktioniert, was du dafür brauchst und welche Modelle das Beste rausholen.

🔐

Warum lokale KI?

Cloud-KI hat Vorteile: Kein Setup, immer aktuell, beste Modelle. Aber lokale KI hat fünf gute Gründe für sich:

  • Datenschutz: Deine Daten verlassen deinen PC nicht. Familienfotos, Geschäftsdokumente, persönliche Gedanken — alles bleibt bei dir.
  • Keine laufenden Kosten: Einmal eingerichtet, kostet's nichts mehr. Keine Abos, keine Token-Limits.
  • Offline-Nutzbar: Bahn, Flugzeug, abgelegene Orte — KI auch ohne Internet.
  • Keine Zensur, keine Limits: Lokale Modelle weigern sich nicht, kreative Schreibanfragen zu beantworten oder weichen Themen aus.
  • Lernen: Wer lokale KI selber aufsetzt, versteht viel besser, was unter der Haube passiert.

Wann lohnt sich's nicht?

  • Wenn du selten KI nutzt — der Setup-Aufwand lohnt sich nicht
  • Wenn du alte Hardware ohne starke GPU hast — siehe „KI auf älteren PCs"
  • Wenn du maximale Qualität willst — Cloud-Modelle sind oft (noch) besser
  • Wenn du multimodale Aufgaben hast (Bilder, Audio, Video) — Cloud-Tools sind hier weiter
🪟

KI lokal auf Windows einrichten

Das Setup ist einfacher als gedacht. Drei Tools dominieren das Feld:

Ollama

Der Favorit für Profis. Konsole-basiert, aber sehr stabil. Eine Zeile in der PowerShell, und du hast ein KI-Modell laufen. Riesige Modell-Bibliothek (Llama, Mistral, Phi, Qwen).

LM Studio

Grafische Oberfläche. Komfortabler für Einsteiger. Du klickst Modelle an, lädst sie herunter, chattest direkt los. Mit Web-Server-Funktion auch aus anderen Apps nutzbar.

GPT4All

Sehr einsteigerfreundlich. Open Source. Modelle und Chat-Oberfläche in einer App. Funktioniert auch auf älteren Rechnern erstaunlich gut.

Jan

Der Newcomer. Eine ChatGPT-ähnliche Oberfläche, die komplett lokal läuft. Open Source, sehr durchdacht.

Setup mit LM Studio (einfachster Einstieg)

  1. LM Studio herunterladen Auf lmstudio.ai → Windows-Installer laden → installieren. 5 Minuten.
  2. Modell auswählen In LM Studio nach „Llama 3" oder „Mistral" suchen. Die App zeigt dir, welche Modelle auf deine Hardware passen.
  3. Modell laden Click auf „Download". Größe je nach Modell 2–40 GB. Warte 10–30 Minuten.
  4. Chat-Oberfläche starten Modell auswählen, „Load model" klicken, im Chat-Tab loslegen.
  5. Optional: Web-Server für andere Apps Wenn du das Modell aus anderen Programmen nutzen willst, in LM Studio den lokalen Server starten — kompatibel zur OpenAI-API.

Hardware-Anforderungen (Faustregel)

Modell-Größe Empfohlen Beispiel-Modelle
Klein (≤7 Mrd. Parameter) 16 GB RAM, integrierte GPU oder schwache dedizierte GPU Llama 3 8B, Phi 3 Mini, Mistral 7B
Mittel (13–34 Mrd. Parameter) 32 GB RAM, RTX 3060+ mit 12 GB VRAM Llama 3 70B (quantisiert), Mixtral
Groß (70 Mrd. Parameter) 64 GB RAM, RTX 4090 oder mehrere GPUs Llama 3 70B (volle Präzision)
Riesig (200+ Mrd. Parameter) Profi-Hardware mit viel VRAM, ggf. Cloud DeepSeek-V3, Llama 3 405B

💡 Quantisierung — der Trick für ältere Hardware: Die meisten Modelle gibt's „quantisiert" — also mit reduzierter Präzision. Ein 70B-Modell auf 4-bit quantisiert braucht statt 140 GB nur noch 35 GB. Funktioniert mit minimalem Qualitätsverlust und macht Modelle auf normaler Hardware lauffähig.

🧠

Lokale KI-Modelle im Vergleich

Die wichtigsten Open-Source-Modelle 2026:

Llama (Meta)

Das populärste Open-Source-Modell. Von 1B (winzig) bis 405B (riesig). Sehr gut für allgemeine Aufgaben, exzellent dokumentiert. Erste Wahl für die meisten.

Mistral / Mixtral

Aus Frankreich. Effizient: Mit 7B Parametern oft besser als andere mit 13B. Mixtral nutzt „Mixture of Experts" — sehr stark, sehr schnell.

DeepSeek

Aus China. Hat 2025/26 für Aufsehen gesorgt: Top-Performance bei einem Bruchteil der Trainingskosten. Sehr stark beim Programmieren und Reasoning.

Phi (Microsoft)

Sehr klein (3–14B), aber erstaunlich fähig. Speziell für lokales Setup auf normalen Laptops gemacht. Microsoft-typisch gut für Office-Aufgaben.

Qwen (Alibaba)

Sehr stark bei mehrsprachigen Aufgaben (Chinesisch, Englisch, Deutsch). Multimodale Varianten verfügbar (Text + Bild).

Gemma (Google)

Googles Open-Source-Familie. Klein und effizient. Gut, wenn du eine etablierte, dokumentierte Lösung suchst.

Welches Modell für was?

  • Allrounder, Einstieg: Llama 3 8B (passt auf jede halbwegs moderne Hardware)
  • Programmieren: DeepSeek Coder oder Qwen Coder
  • Lange Texte / Analyse: Mixtral oder Llama 3 70B (quantisiert)
  • Schwache Hardware: Phi 3 Mini oder Llama 3 1B
  • Maximale Qualität, viel VRAM: Llama 3 70B unquantisiert oder DeepSeek-V3

📊 Open Source holt rasant auf

Vor zwei Jahren waren proprietäre Modelle (ChatGPT, Claude) deutlich überlegen. Inzwischen liegt der Abstand bei Llama und DeepSeek nur noch wenige Prozentpunkte. Für die meisten Privatanwender sind die Open-Source-Modelle vollkommen ausreichend — und beim Datenschutz unschlagbar.

🐢

KI auf älteren PCs zum Laufen bringen

Du musst keinen RTX-4090-Workstation kaufen, um KI lokal zu nutzen. Auch ältere Rechner können — mit den richtigen Modellen und Einstellungen.

Was geht auch auf älterer Hardware?

  • 4 GB RAM, alte CPU, keine GPU: Kleine Modelle wie Phi 3 Mini oder Llama 3.2 1B. Antwortzeit 5–30 Sek pro Antwort.
  • 8 GB RAM, 4-Kern-CPU: Llama 3 8B mit 4-bit-Quantisierung. Brauchbar für Alltagsaufgaben.
  • 16 GB RAM, alte GPU mit 4 GB VRAM: Auch mittlere Modelle laufen — mit Geduld.

Tipps für mehr Leistung

  • Aktuelle GPU-Treiber: Veraltete Treiber lassen viel Performance liegen — gerade bei NVIDIA-Karten kann der Unterschied 30%+ ausmachen
  • Quantisierte Modelle nutzen (4-bit oder 5-bit) — mehr Speed, kaum Qualitätsverlust
  • Kleine Modelle gezielt einsetzen — Phi 3 für Office, Llama für Allgemeines
  • Hintergrund-Apps schließen während KI-Nutzung — RAM und CPU freihalten
  • SSD statt HDD — Modelle laden 10–20× schneller

🟡 Engelmann-Hilfe für KI-Performance

Lokale KI hängt sehr stark an aktuellen GPU-Treibern. Bei NVIDIA-Karten kann ein veralteter Treiber bis zu 30 % Performance kosten – beim AI-Inferencing macht das den Unterschied zwischen „flüssig" und „stockend".

Unser Driver Updater findet veraltete GPU-Treiber automatisch und aktualisiert sie sicher mit den Original-Treibern der Hersteller. Wenn du KI lokal nutzt, ist das die einfachste Performance-Optimierung.

Driver Updater ansehen →

🔒

Datenschutz bei KI

Wer KI nutzt, gibt Daten preis – egal ob er will oder nicht. Wer Cloud-KI nutzt, sollte zumindest wissen, was wohin geht.

Was passiert mit deinen Daten bei Cloud-KI?

  • OpenAI (ChatGPT): Standardmäßig werden Konversationen zur Modellverbesserung genutzt — kann in den Einstellungen deaktiviert werden. Bei Pro/Team/Enterprise-Plänen werden Daten nicht für Training genutzt.
  • Anthropic (Claude): Daten werden standardmäßig nicht für Training genutzt — Claude ist hier mit am datenschutz­freundlichsten.
  • Google (Gemini): Daten können für Modelltraining und Werbung genutzt werden. Sehr ähnlich zu anderen Google-Diensten.
  • Microsoft (Copilot): Geschäfts- und Enterprise-Daten werden separat behandelt — Privatkunden-Daten gehen ins Training.

Was du tun kannst

1. Lokale KI nutzen

Wenn Datenschutz absolut wichtig ist, gibt's kein „besser" als lokale Modelle. Ollama, LM Studio, GPT4All — siehe oben.

2. Cloud-KI bewusst nutzen

Sensible Daten vor dem Prompt anonymisieren. Echte Namen und Identifier durch Platzhalter ersetzen. Keine Krankenakten, Gehälter, Passwörter.

3. Pro-Account oder Enterprise

Bei OpenAI, Anthropic etc. werden Pro/Team/Enterprise-Daten nicht für Training genutzt. Geringer Aufpreis, viel besserer Datenschutz.

4. Trainings-Opt-Out

In den Einstellungen aller großen KI-Anbieter kann man (oft tief versteckt) das Training mit eigenen Daten deaktivieren. Lohnt sich.

Windows-Spionage neben KI

Selbst ohne KI sammelt Windows 10/11 viele Telemetrie-Daten – das Thema bekommt im KI-Zeitalter neue Brisanz, weil auch Microsoft KI-Modelle mit Nutzerdaten trainiert.

🟡 Engelmann-Tipp: AntiSpy für Windows

Wer KI lokal nutzen will, hat oft auch ein Interesse daran, dass Windows nicht im Hintergrund Daten an Microsoft sendet. Unser AntiSpy deaktiviert Telemetrie und unnötige Datenübertragungen — ohne dass Windows kaputt geht.

Empfehlung: Wenn du dir lokale KI einrichtest, ist die Gelegenheit perfekt, auch das Windows-Setup datenschutz­freundlicher zu machen.

AntiSpy ansehen →

Goldene Regeln für KI & Datenschutz

  1. Lokale KI für sensible Daten Familienfotos, persönliche Briefe, Steuerunterlagen, Geschäftsdokumente — niemals in Cloud-KI eingeben.
  2. Cloud-KI für allgemeine Aufgaben Brainstorming, Recherche, allgemeine Texte — Cloud ist OK. Aber bewusst.
  3. Anonymisieren vor dem Prompt Echte Namen, Adressen, Beträge in Prompts durch Platzhalter ersetzen.
  4. Settings checken Bei jedem KI-Tool die Datenschutz-Einstellungen prüfen. Trainings-Opt-Out aktivieren.
  5. Kosten-Nutzen-Abwägung Pro-Accounts (oft 20 €/Monat) sind beim Datenschutz deutlich besser als Free-Versionen. Wenn KI wichtig wird, lohnt sich das.
💻

Engelmann-Tools für dein KI-Setup

Driver Updater hält die GPU-Treiber aktuell – wichtig für lokale KI-Performance. AntiSpy schaltet Windows-Telemetrie ab.