Mit welchen LLM-Anbietern und -Modellen kann ich 2026 wirklich DSGVO-konform arbeiten?

DSGVO-konform betreibbar sind 2026: Azure OpenAI in EU-Regionen, Anthropic Claude (API + Workspace) mit EU-Hosting, Mistral La Plateforme, sowie alle on-prem-Setups mit Llama 4, Mistral Large 3, Qwen 3.5 oder DeepSeek V4. Nicht ohne Weiteres konform: Consumer-ChatGPT, Claude.ai-Web ohne Workspace-Tier, OpenAI-API in US-Region ohne dezidiertes DPF-Setup, Gemini-Consumer und chinesische Modelle in der Cloud.

DSGVO-konforme LLMs 2026 — Anbieter-Vergleich für Mittelstand

Die ehrliche Kurzantwort

DSGVO-Konformität ist kein Modell-Attribut, sondern eine Frage des Gesamt-Setups: Hosting-Region, AVV, Trainings-Opt-Out, Anbieter-Vertragslage, deine eigenen Prozesse. Das gleiche Modell kann konform betrieben werden oder nicht — je nachdem, wo es läuft und wie es eingekauft wird.

Dieser Beitrag ist Teil unseres Leitfadens KI-Compliance für den Mittelstand — dort findest du DSGVO, EU AI Act, Architektur und Praxis gebündelt.

Warum Datensouveränität 2026 zum Wettbewerbsfaktor wird

93 % der deutschen Unternehmen bevorzugen KI-Lösungen „made in Germany”, und 88 % sagen, das Herkunftsland des Anbieters sei relevant (Bitkom KI-Studie 2026).
61 % der westeuropäischen CIOs priorisieren lokale Cloud-Anbieter, um geopolitische Risiken zu senken (Gartner, November 2025).
Der US CLOUD Act bedeutet: US-Anbieter können selbst mit EU-Rechenzentrum keine vollständige Rechtssouveränität garantieren — der bestimmende Faktor ist die Nationalität des Mutterkonzerns, nicht der Serverstandort.

Kurz: „EU-Region” ist nicht gleich „souverän”. Wer auf Nummer sicher gehen will, betreibt sensible Workloads on-premise oder bei einem europäischen Anbieter ohne US-Konzernbindung.

Klar konform betreibbar 2026:

Azure OpenAI (Sweden Central, Germany West Central, France Central)
Anthropic Claude API + Claude for Work (Frankfurt, Dublin)
Mistral La Plateforme (Paris)
AWS Bedrock in Frankfurt/Irland (Claude, Llama, Mistral, Amazon Nova)
Google Vertex AI in EU-Regionen (Gemini, PaLM)
Alle on-prem-Modelle (Llama 4, Mistral Large 3, Qwen 3.5, DeepSeek V4) auf eigener Hardware

Nicht ohne Weiteres konform:

Consumer ChatGPT (chat.openai.com Free/Plus) — wie ChatGPT trotzdem konform nutzbar ist
Claude.ai für Personen-Accounts ohne Workspace-Tier
Google Gemini (Consumer-Variante)
Perplexity ohne Enterprise-Tier
DeepSeek, Qwen, GLM in der jeweiligen China-Cloud
OpenAI API direkt wenn Region nicht EU/DPF-konform konfiguriert ist

Anbieter-Tiefencheck

Azure OpenAI (Microsoft)

Stand 2026. DPF-zertifiziert. Datenresidenz pro Region garantiert. AVV-Vorlage über Microsoft Compliance-Portal. Trainings-Opt-Out vertraglich, nicht nur Settings.

Stärken. Microsoft 365-Integration, Active-Directory-Anbindung, sehr solider Enterprise-Support. CLOUD-Act-Risiko theoretisch, in der Praxis durch DPF abgemildert — Details im Schrems-II-Check zu Azure OpenAI.

Schwächen. Modell-Pool hinkt OpenAI-direkt um 1–3 Monate hinterher. Setup und Quotenfreischaltung kann initial Tage bis Wochen dauern.

Preise. Pricing identisch mit OpenAI direkt — GPT-5.5 ca. 5 €/M Input, 20 €/M Output; GPT-5.5 Instant deutlich günstiger. PTU (Provisioned Throughput Units) für planbare Last.

Empfohlen für. Mittelstand mit Microsoft-Stack, regulierte Branchen mit Audit-Anforderungen.

Anthropic Claude (API + Claude for Work)

Stand 2026. DPF-zertifiziert. EU-Hosting in Frankfurt und Dublin seit 2025 verfügbar. AVV über Account-Manager. Trainings-Opt-Out vertraglich.

Stärken. Modellqualität (Claude Sonnet 4.6, Claude Opus 4.7) in vielen Reasoning-Tasks führend. 1-Million-Token-Kontext für lange Dokumente. Sehr hohe Sicherheits-Defaults.

Schwächen. Kein Fine-Tuning öffentlich verfügbar. EU-Hosting nur über direkten Account, nicht über AWS Bedrock (dort separat zu konfigurieren). Quoten anfangs eng, müssen freigeschaltet werden.

Preise. Claude Sonnet 4.6 ca. 3 €/M Input, 15 €/M Output. Prompt-Caching senkt Input-Kosten auf ~0,30 €/M bei wiederholten System-Prompts.

Empfohlen für. Anspruchsvolle Reasoning-Use-Cases, Long-Context-Anwendungen, Customer-Support mit Qualitätsfokus.

Mistral La Plateforme

Stand 2026. Französischer Anbieter, Datacenter Paris. DSGVO-konform ohne Drittland-Transfer-Komplexität. AVV als Standardvertrag.

Stärken. Souveränitäts-Story (kein US-Drittlandsproblem). Modellqualität auf Top-Niveau — Mistral Large 3 (Dezember 2025, 41 B aktive / 675 B Gesamt MoE) und Mistral Medium 3.5 (April 2026, 128 B dense, 256 k Kontext) liegen nahe an Claude Sonnet bei Standardaufgaben. Gute Deutsch-Performance.

Schwächen. Modell-Pool kleiner als bei OpenAI/Anthropic. Komplexes Top-Tier-Reasoning weiter hinter Claude Opus 4.7 und GPT-5.5. Quoten und Enterprise-Support weniger ausgebaut.

Preise. Mistral Large 3: ca. 2 €/M Input, 6 €/M Output. Mistral Small 4 (März 2026, unified Reasoning + Vision + Coding): ca. 0,20 €/M Input, 0,60 €/M Output.

Empfohlen für. Unternehmen mit klarem Souveränitäts-Anspruch (Behörden, kritische Infrastruktur, sensible Datenverarbeitung).

AWS Bedrock

Stand 2026. Multi-Modell-Provider — Claude, Llama, Mistral, Amazon Nova, DeepSeek (eingeschränkt) auf AWS-Infrastruktur. EU-Regionen Frankfurt, Irland, Paris, Stockholm.

Stärken. Bestehende AWS-Stack-Integration, ein AVV deckt alles ab. Bedrock-Region bestimmt Daten-Residenz pro Modell.

Schwächen. Modell-Versionen oft 2–4 Wochen hinter Anbieter-direkt. Preise leicht über Direktanbietern. Komplexere IAM-Konfiguration.

Empfohlen für. AWS-Bestandskunden mit zentralem Compliance-Setup.

Google Vertex AI

Stand 2026. DPF-zertifiziert. EU-Regionen europe-west1 bis west12. Gemini 2.5 Pro/Flash, plus PaLM und Open-Source-Modelle.

Stärken. 2-Million-Token-Kontext bei Gemini 2.5 Pro. Multimodal von Anfang an (Bild, Video, Audio nativ).

Schwächen. Marketing-/Marktposition bei Mittelstand schwächer. Google- Workspace-Integration ja, aber nicht so tief wie Azure-OpenAI in M365.

Empfohlen für. Multimodale Use-Cases (Video-Analyse, OCR mit Verständnis).

On-prem-Modelle (Llama 4, Mistral, Qwen 3.5, DeepSeek V4)

Stand Mai 2026. Alle vier Open-Weight-Modell-Familien sind frei betreibbar. Inferenz-Stack vLLM (am performantesten, beste MoE-Unterstützung), Ollama (am einfachsten), llama.cpp (am vielseitigsten), SGLang (stark für strukturierte Outputs).

Lizenzen prüfen.

Llama 4 Scout / Maverick (Meta, April 2025): Llama Community License, kommerziell nutzbar bis 700 Mio monatliche Nutzer. Im Mittelstand kein Problem. 10 Mio bzw. 1 Mio Token Kontext.
Mistral Large 3 (Dezember 2025) und Mistral Medium 3.5 (April 2026): Apache 2.0 für die meisten Modelle. Vollständig kommerziell nutzbar.
Qwen 3.5 (Alibaba, Februar 2026): Tongyi Qianwen License, kommerziell nutzbar mit Hinweis-Pflicht. 397 B-A17B MoE. Anbieter-Risiko durch chinesische Herkunft, wenn Daten in deren Cloud landen — on-prem ist die saubere Lösung.
DeepSeek V4 (April 2026 Preview): MIT License, vollständig kommerziell nutzbar. V4-Pro 1,6 T / V4-Flash 284 B, jeweils mit 1 Mio Token Kontext. Modell-Gewichte herunterladen und selbst hosten — kein Drittland-Problem.

Wichtig. On-prem heißt Modell auf eigener Hardware. Wenn du DeepSeek oder Qwen über deren China-Cloud-API nutzt, gilt das nicht — Daten gehen dann nach China, DSGVO-rechtlich kritisch.

Was bei der Anbieter-Wahl konkret zu prüfen ist

Bevor du einen Anbieter live schaltest, prüf systematisch:

DPF-Zertifizierung auf dataprivacyframework.gov nachschauen
Vertragsentität in der eigenen Rechnung — mit der schließt du AVV
AVV-Standardtext durchlesen (vor allem Trainings-Opt-Out, Sub-Prozessoren, Löschpflichten) — worauf es im AVV mit AI-Anbietern ankommt
Region im API-Setup explizit setzen, nicht Default
Modell-Lifecycle prüfen (Deprecation-Notices, Pinning-Optionen für reproduzierbare Outputs) — und Vendor-Lock-in von vornherein vermeiden
Logging-Verhalten klären (welche Logs entstehen, wer hat Zugriff, Aufbewahrungsfrist)

Pragmatische Empfehlung für Mittelstand

Wenn ihr 2026 startet und keine speziellen Compliance-Constraints habt: Azure OpenAI in Sweden Central oder Anthropic Claude API mit EU-Hosting. Beides ist DSGVO-konform, AVV-Standard, Performance auf Top-Niveau, und ihr seid auf einem stabilen Anbieter ohne offene Rechtsfragen.

Wenn ihr ein Souveränitäts-Profil habt (Behörde, kritische Infrastruktur, M&A-Daten): Mistral La Plateforme plus on-prem Llama 4 Scout als Backup für besonders sensible Daten.

Wenn ihr on-prem aus Compliance-Gründen müsst: Llama 4 Scout (17 B aktiv / 109 B Gesamt) oder Mistral Medium 3.5 (128 B dense) mit vLLM-Inferenz. Hardware-Tier-1 für Einstieg (1× H100 80 GB oder 2× RTX 6000 Ada, ~15.000–35.000 €), Tier-2 für ernsthafte Last (H100-Server mit 2× H100 oder 1× H200, ~60.000 €+).

Was du heute nicht tun solltest

Keine Consumer-LLMs mit personenbezogenen Geschäftsdaten füttern — und wo doch Personendaten ins Spiel kommen, vorher pseudonymisieren. Keine chinesischen Cloud-APIs (DeepSeek-Cloud, Qwen-Cloud) für deutsche Mittelstandskunden — selbst hosten ist ok, deren Cloud ist DSGVO-rechtlich hoch problematisch. Und keine “wir warten ab”-Strategie — wer 2026 startet, hat 2–3 Jahre Vorsprung gegenüber Wettbewerbern, die erst nach dem Druck der Aufsicht reagieren.

Welche LLMs sind 2026 DSGVO-konform betreibbar?