Zum Inhalt springen
K Krynex Labs
Technik & Architektur

Welche LLMs sind 2026 DSGVO-konform betreibbar?

Welche LLMs sind 2026 DSGVO-konform betreibbar?

Die ehrliche Kurzantwort

DSGVO-Konformität ist kein Modell-Attribut, sondern eine Frage des Gesamt-Setups: Hosting-Region, AVV, Trainings-Opt-Out, Anbieter-Vertragslage, deine eigenen Prozesse. Das gleiche Modell kann konform betrieben werden oder nicht — je nachdem, wo es läuft und wie es eingekauft wird.

Klar konform betreibbar 2026:

  • Azure OpenAI (Sweden Central, Germany West Central, France Central)
  • Anthropic Claude API + Claude for Work (Frankfurt, Dublin)
  • Mistral La Plateforme (Paris)
  • AWS Bedrock in Frankfurt/Irland (Claude, Llama, Mistral, Amazon Nova)
  • Google Vertex AI in EU-Regionen (Gemini, PaLM)
  • Alle on-prem-Modelle (Llama 4, Mistral Large 3, Qwen 3.5, DeepSeek V4) auf eigener Hardware

Nicht ohne Weiteres konform:

  • Consumer ChatGPT (chat.openai.com Free/Plus)
  • Claude.ai für Personen-Accounts ohne Workspace-Tier
  • Google Gemini (Consumer-Variante)
  • Perplexity ohne Enterprise-Tier
  • DeepSeek, Qwen, GLM in der jeweiligen China-Cloud
  • OpenAI API direkt wenn Region nicht EU/DPF-konform konfiguriert ist

Anbieter-Tiefencheck

Azure OpenAI (Microsoft)

Stand 2026. DPF-zertifiziert. Datenresidenz pro Region garantiert. AVV-Vorlage über Microsoft Compliance-Portal. Trainings-Opt-Out vertraglich, nicht nur Settings.

Stärken. Microsoft 365-Integration, Active-Directory-Anbindung, sehr solider Enterprise-Support. CLOUD-Act-Risiko theoretisch, in der Praxis durch DPF abgemildert.

Schwächen. Modell-Pool hinkt OpenAI-direkt um 1–3 Monate hinterher. Setup und Quotenfreischaltung kann initial Tage bis Wochen dauern.

Preise. Pricing identisch mit OpenAI direkt — GPT-5.5 ca. 5 €/M Input, 20 €/M Output; GPT-5.5 Instant deutlich günstiger. PTU (Provisioned Throughput Units) für planbare Last.

Empfohlen für. Mittelstand mit Microsoft-Stack, regulierte Branchen mit Audit-Anforderungen.

Anthropic Claude (API + Claude for Work)

Stand 2026. DPF-zertifiziert. EU-Hosting in Frankfurt und Dublin seit 2025 verfügbar. AVV über Account-Manager. Trainings-Opt-Out vertraglich.

Stärken. Modellqualität (Claude Sonnet 4.6, Claude Opus 4.7) in vielen Reasoning-Tasks führend. 1-Million-Token-Kontext für lange Dokumente. Sehr hohe Sicherheits-Defaults.

Schwächen. Kein Fine-Tuning öffentlich verfügbar. EU-Hosting nur über direkten Account, nicht über AWS Bedrock (dort separat zu konfigurieren). Quoten anfangs eng, müssen freigeschaltet werden.

Preise. Claude Sonnet 4.6 ca. 3 €/M Input, 15 €/M Output. Prompt-Caching senkt Input-Kosten auf ~0,30 €/M bei wiederholten System-Prompts.

Empfohlen für. Anspruchsvolle Reasoning-Use-Cases, Long-Context-Anwendungen, Customer-Support mit Qualitätsfokus.

Mistral La Plateforme

Stand 2026. Französischer Anbieter, Datacenter Paris. DSGVO-konform ohne Drittland-Transfer-Komplexität. AVV als Standardvertrag.

Stärken. Souveränitäts-Story (kein US-Drittlandsproblem). Modellqualität auf Top-Niveau — Mistral Large 3 (Dezember 2025, 41 B aktive / 675 B Gesamt MoE) und Mistral Medium 3.5 (April 2026, 128 B dense, 256 k Kontext) liegen nahe an Claude Sonnet bei Standardaufgaben. Gute Deutsch-Performance.

Schwächen. Modell-Pool kleiner als bei OpenAI/Anthropic. Komplexes Top-Tier-Reasoning weiter hinter Claude Opus 4.7 und GPT-5.5. Quoten und Enterprise-Support weniger ausgebaut.

Preise. Mistral Large 3: ca. 2 €/M Input, 6 €/M Output. Mistral Small 4 (März 2026, unified Reasoning + Vision + Coding): ca. 0,20 €/M Input, 0,60 €/M Output.

Empfohlen für. Unternehmen mit klarem Souveränitäts-Anspruch (Behörden, kritische Infrastruktur, sensible Datenverarbeitung).

AWS Bedrock

Stand 2026. Multi-Modell-Provider — Claude, Llama, Mistral, Amazon Nova, DeepSeek (eingeschränkt) auf AWS-Infrastruktur. EU-Regionen Frankfurt, Irland, Paris, Stockholm.

Stärken. Bestehende AWS-Stack-Integration, ein AVV deckt alles ab. Bedrock-Region bestimmt Daten-Residenz pro Modell.

Schwächen. Modell-Versionen oft 2–4 Wochen hinter Anbieter-direkt. Preise leicht über Direktanbietern. Komplexere IAM-Konfiguration.

Empfohlen für. AWS-Bestandskunden mit zentralem Compliance-Setup.

Google Vertex AI

Stand 2026. DPF-zertifiziert. EU-Regionen europe-west1 bis west12. Gemini 2.5 Pro/Flash, plus PaLM und Open-Source-Modelle.

Stärken. 2-Million-Token-Kontext bei Gemini 2.5 Pro. Multimodal von Anfang an (Bild, Video, Audio nativ).

Schwächen. Marketing-/Marktposition bei Mittelstand schwächer. Google- Workspace-Integration ja, aber nicht so tief wie Azure-OpenAI in M365.

Empfohlen für. Multimodale Use-Cases (Video-Analyse, OCR mit Verständnis).

On-prem-Modelle (Llama 4, Mistral, Qwen 3.5, DeepSeek V4)

Stand Mai 2026. Alle vier Open-Weight-Modell-Familien sind frei betreibbar. Inferenz-Stack vLLM (am performantesten, beste MoE-Unterstützung), Ollama (am einfachsten), llama.cpp (am vielseitigsten), SGLang (stark für strukturierte Outputs).

Lizenzen prüfen.

  • Llama 4 Scout / Maverick (Meta, April 2025): Llama Community License, kommerziell nutzbar bis 700 Mio monatliche Nutzer. Im Mittelstand kein Problem. 10 Mio bzw. 1 Mio Token Kontext.
  • Mistral Large 3 (Dezember 2025) und Mistral Medium 3.5 (April 2026): Apache 2.0 für die meisten Modelle. Vollständig kommerziell nutzbar.
  • Qwen 3.5 (Alibaba, Februar 2026): Tongyi Qianwen License, kommerziell nutzbar mit Hinweis-Pflicht. 397 B-A17B MoE. Anbieter-Risiko durch chinesische Herkunft, wenn Daten in deren Cloud landen — on-prem ist die saubere Lösung.
  • DeepSeek V4 (April 2026 Preview): MIT License, vollständig kommerziell nutzbar. V4-Pro 1,6 T / V4-Flash 284 B, jeweils mit 1 Mio Token Kontext. Modell-Gewichte herunterladen und selbst hosten — kein Drittland-Problem.

Wichtig. On-prem heißt Modell auf eigener Hardware. Wenn du DeepSeek oder Qwen über deren China-Cloud-API nutzt, gilt das nicht — Daten gehen dann nach China, DSGVO-rechtlich kritisch.

Was bei der Anbieter-Wahl konkret zu prüfen ist

Bevor du einen Anbieter live schaltest, prüf systematisch:

  • DPF-Zertifizierung auf dataprivacyframework.gov nachschauen
  • Vertragsentität in der eigenen Rechnung — mit der schließt du AVV
  • AVV-Standardtext durchlesen (vor allem Trainings-Opt-Out, Sub-Prozessoren, Löschpflichten)
  • Region im API-Setup explizit setzen, nicht Default
  • Modell-Lifecycle prüfen (Deprecation-Notices, Pinning-Optionen für reproduzierbare Outputs)
  • Logging-Verhalten klären (welche Logs entstehen, wer hat Zugriff, Aufbewahrungsfrist)

Pragmatische Empfehlung für Mittelstand

Wenn ihr 2026 startet und keine speziellen Compliance-Constraints habt: Azure OpenAI in Sweden Central oder Anthropic Claude API mit EU-Hosting. Beides ist DSGVO-konform, AVV-Standard, Performance auf Top-Niveau, und ihr seid auf einem stabilen Anbieter ohne offene Rechtsfragen.

Wenn ihr ein Souveränitäts-Profil habt (Behörde, kritische Infrastruktur, M&A-Daten): Mistral La Plateforme plus on-prem Llama 4 Scout als Backup für besonders sensible Daten.

Wenn ihr on-prem aus Compliance-Gründen müsst: Llama 4 Scout (17 B aktiv / 109 B Gesamt) oder Mistral Medium 3.5 (128 B dense) mit vLLM-Inferenz. Hardware-Tier-1 für Einstieg (1× H100 80 GB oder 2× RTX 6000 Ada, ~15.000–35.000 €), Tier-2 für ernsthafte Last (H100-Server mit 2× H100 oder 1× H200, ~60.000 €+).

Was du heute nicht tun solltest

Keine Consumer-LLMs mit personenbezogenen Geschäftsdaten füttern. Keine chinesischen Cloud-APIs (DeepSeek-Cloud, Qwen-Cloud) für deutsche Mittelstandskunden — selbst hosten ist ok, deren Cloud ist DSGVO-rechtlich hoch problematisch. Und keine “wir warten ab”-Strategie — wer 2026 startet, hat 2–3 Jahre Vorsprung gegenüber Wettbewerbern, die erst nach dem Druck der Aufsicht reagieren.

Konkrete Frage zu eurem Setup?

Ein 30-Minuten-Erstgespräch klärt meistens schon, ob euer aktueller AI-Stack hält oder wo nachzuarbeiten ist. Kostenlos, ohne Verkaufsdruck.

Erstgespräch buchen

Passend dazu