Welche LLMs sind 2026 DSGVO-konform betreibbar?
Die ehrliche Kurzantwort
DSGVO-Konformität ist kein Modell-Attribut, sondern eine Frage des Gesamt-Setups: Hosting-Region, AVV, Trainings-Opt-Out, Anbieter-Vertragslage, deine eigenen Prozesse. Das gleiche Modell kann konform betrieben werden oder nicht — je nachdem, wo es läuft und wie es eingekauft wird.
Klar konform betreibbar 2026:
- Azure OpenAI (Sweden Central, Germany West Central, France Central)
- Anthropic Claude API + Claude for Work (Frankfurt, Dublin)
- Mistral La Plateforme (Paris)
- AWS Bedrock in Frankfurt/Irland (Claude, Llama, Mistral, Amazon Nova)
- Google Vertex AI in EU-Regionen (Gemini, PaLM)
- Alle on-prem-Modelle (Llama 4, Mistral Large 3, Qwen 3.5, DeepSeek V4) auf eigener Hardware
Nicht ohne Weiteres konform:
- Consumer ChatGPT (chat.openai.com Free/Plus)
- Claude.ai für Personen-Accounts ohne Workspace-Tier
- Google Gemini (Consumer-Variante)
- Perplexity ohne Enterprise-Tier
- DeepSeek, Qwen, GLM in der jeweiligen China-Cloud
- OpenAI API direkt wenn Region nicht EU/DPF-konform konfiguriert ist
Anbieter-Tiefencheck
Azure OpenAI (Microsoft)
Stand 2026. DPF-zertifiziert. Datenresidenz pro Region garantiert. AVV-Vorlage über Microsoft Compliance-Portal. Trainings-Opt-Out vertraglich, nicht nur Settings.
Stärken. Microsoft 365-Integration, Active-Directory-Anbindung, sehr solider Enterprise-Support. CLOUD-Act-Risiko theoretisch, in der Praxis durch DPF abgemildert.
Schwächen. Modell-Pool hinkt OpenAI-direkt um 1–3 Monate hinterher. Setup und Quotenfreischaltung kann initial Tage bis Wochen dauern.
Preise. Pricing identisch mit OpenAI direkt — GPT-5.5 ca. 5 €/M Input, 20 €/M Output; GPT-5.5 Instant deutlich günstiger. PTU (Provisioned Throughput Units) für planbare Last.
Empfohlen für. Mittelstand mit Microsoft-Stack, regulierte Branchen mit Audit-Anforderungen.
Anthropic Claude (API + Claude for Work)
Stand 2026. DPF-zertifiziert. EU-Hosting in Frankfurt und Dublin seit 2025 verfügbar. AVV über Account-Manager. Trainings-Opt-Out vertraglich.
Stärken. Modellqualität (Claude Sonnet 4.6, Claude Opus 4.7) in vielen Reasoning-Tasks führend. 1-Million-Token-Kontext für lange Dokumente. Sehr hohe Sicherheits-Defaults.
Schwächen. Kein Fine-Tuning öffentlich verfügbar. EU-Hosting nur über direkten Account, nicht über AWS Bedrock (dort separat zu konfigurieren). Quoten anfangs eng, müssen freigeschaltet werden.
Preise. Claude Sonnet 4.6 ca. 3 €/M Input, 15 €/M Output. Prompt-Caching senkt Input-Kosten auf ~0,30 €/M bei wiederholten System-Prompts.
Empfohlen für. Anspruchsvolle Reasoning-Use-Cases, Long-Context-Anwendungen, Customer-Support mit Qualitätsfokus.
Mistral La Plateforme
Stand 2026. Französischer Anbieter, Datacenter Paris. DSGVO-konform ohne Drittland-Transfer-Komplexität. AVV als Standardvertrag.
Stärken. Souveränitäts-Story (kein US-Drittlandsproblem). Modellqualität auf Top-Niveau — Mistral Large 3 (Dezember 2025, 41 B aktive / 675 B Gesamt MoE) und Mistral Medium 3.5 (April 2026, 128 B dense, 256 k Kontext) liegen nahe an Claude Sonnet bei Standardaufgaben. Gute Deutsch-Performance.
Schwächen. Modell-Pool kleiner als bei OpenAI/Anthropic. Komplexes Top-Tier-Reasoning weiter hinter Claude Opus 4.7 und GPT-5.5. Quoten und Enterprise-Support weniger ausgebaut.
Preise. Mistral Large 3: ca. 2 €/M Input, 6 €/M Output. Mistral Small 4 (März 2026, unified Reasoning + Vision + Coding): ca. 0,20 €/M Input, 0,60 €/M Output.
Empfohlen für. Unternehmen mit klarem Souveränitäts-Anspruch (Behörden, kritische Infrastruktur, sensible Datenverarbeitung).
AWS Bedrock
Stand 2026. Multi-Modell-Provider — Claude, Llama, Mistral, Amazon Nova, DeepSeek (eingeschränkt) auf AWS-Infrastruktur. EU-Regionen Frankfurt, Irland, Paris, Stockholm.
Stärken. Bestehende AWS-Stack-Integration, ein AVV deckt alles ab. Bedrock-Region bestimmt Daten-Residenz pro Modell.
Schwächen. Modell-Versionen oft 2–4 Wochen hinter Anbieter-direkt. Preise leicht über Direktanbietern. Komplexere IAM-Konfiguration.
Empfohlen für. AWS-Bestandskunden mit zentralem Compliance-Setup.
Google Vertex AI
Stand 2026. DPF-zertifiziert. EU-Regionen europe-west1 bis west12. Gemini 2.5 Pro/Flash, plus PaLM und Open-Source-Modelle.
Stärken. 2-Million-Token-Kontext bei Gemini 2.5 Pro. Multimodal von Anfang an (Bild, Video, Audio nativ).
Schwächen. Marketing-/Marktposition bei Mittelstand schwächer. Google- Workspace-Integration ja, aber nicht so tief wie Azure-OpenAI in M365.
Empfohlen für. Multimodale Use-Cases (Video-Analyse, OCR mit Verständnis).
On-prem-Modelle (Llama 4, Mistral, Qwen 3.5, DeepSeek V4)
Stand Mai 2026. Alle vier Open-Weight-Modell-Familien sind frei betreibbar. Inferenz-Stack vLLM (am performantesten, beste MoE-Unterstützung), Ollama (am einfachsten), llama.cpp (am vielseitigsten), SGLang (stark für strukturierte Outputs).
Lizenzen prüfen.
- Llama 4 Scout / Maverick (Meta, April 2025): Llama Community License, kommerziell nutzbar bis 700 Mio monatliche Nutzer. Im Mittelstand kein Problem. 10 Mio bzw. 1 Mio Token Kontext.
- Mistral Large 3 (Dezember 2025) und Mistral Medium 3.5 (April 2026): Apache 2.0 für die meisten Modelle. Vollständig kommerziell nutzbar.
- Qwen 3.5 (Alibaba, Februar 2026): Tongyi Qianwen License, kommerziell nutzbar mit Hinweis-Pflicht. 397 B-A17B MoE. Anbieter-Risiko durch chinesische Herkunft, wenn Daten in deren Cloud landen — on-prem ist die saubere Lösung.
- DeepSeek V4 (April 2026 Preview): MIT License, vollständig kommerziell nutzbar. V4-Pro 1,6 T / V4-Flash 284 B, jeweils mit 1 Mio Token Kontext. Modell-Gewichte herunterladen und selbst hosten — kein Drittland-Problem.
Wichtig. On-prem heißt Modell auf eigener Hardware. Wenn du DeepSeek oder Qwen über deren China-Cloud-API nutzt, gilt das nicht — Daten gehen dann nach China, DSGVO-rechtlich kritisch.
Was bei der Anbieter-Wahl konkret zu prüfen ist
Bevor du einen Anbieter live schaltest, prüf systematisch:
- DPF-Zertifizierung auf dataprivacyframework.gov nachschauen
- Vertragsentität in der eigenen Rechnung — mit der schließt du AVV
- AVV-Standardtext durchlesen (vor allem Trainings-Opt-Out, Sub-Prozessoren, Löschpflichten)
- Region im API-Setup explizit setzen, nicht Default
- Modell-Lifecycle prüfen (Deprecation-Notices, Pinning-Optionen für reproduzierbare Outputs)
- Logging-Verhalten klären (welche Logs entstehen, wer hat Zugriff, Aufbewahrungsfrist)
Pragmatische Empfehlung für Mittelstand
Wenn ihr 2026 startet und keine speziellen Compliance-Constraints habt: Azure OpenAI in Sweden Central oder Anthropic Claude API mit EU-Hosting. Beides ist DSGVO-konform, AVV-Standard, Performance auf Top-Niveau, und ihr seid auf einem stabilen Anbieter ohne offene Rechtsfragen.
Wenn ihr ein Souveränitäts-Profil habt (Behörde, kritische Infrastruktur, M&A-Daten): Mistral La Plateforme plus on-prem Llama 4 Scout als Backup für besonders sensible Daten.
Wenn ihr on-prem aus Compliance-Gründen müsst: Llama 4 Scout (17 B aktiv / 109 B Gesamt) oder Mistral Medium 3.5 (128 B dense) mit vLLM-Inferenz. Hardware-Tier-1 für Einstieg (1× H100 80 GB oder 2× RTX 6000 Ada, ~15.000–35.000 €), Tier-2 für ernsthafte Last (H100-Server mit 2× H100 oder 1× H200, ~60.000 €+).
Was du heute nicht tun solltest
Keine Consumer-LLMs mit personenbezogenen Geschäftsdaten füttern. Keine chinesischen Cloud-APIs (DeepSeek-Cloud, Qwen-Cloud) für deutsche Mittelstandskunden — selbst hosten ist ok, deren Cloud ist DSGVO-rechtlich hoch problematisch. Und keine “wir warten ab”-Strategie — wer 2026 startet, hat 2–3 Jahre Vorsprung gegenüber Wettbewerbern, die erst nach dem Druck der Aufsicht reagieren.
Konkrete Frage zu eurem Setup?
Ein 30-Minuten-Erstgespräch klärt meistens schon, ob euer aktueller AI-Stack hält oder wo nachzuarbeiten ist. Kostenlos, ohne Verkaufsdruck.
Erstgespräch buchen