Im Juni 2025 hat die Datenschutzkonferenz (DSK), also der Zusammenschluss aller deutschen Datenschutzbehörden, eine neue Orientierungshilfe veröffentlicht. Darin erklären sie, worauf Unternehmen und Entwickler bei KI-Projekten achten sollten, um die DSGVO einzuhalten. Das Papier zeigt, wie die Datenschutzpflichten praktisch auf alle Phasen eines KI-Projekts angewendet werden können, von der Planung über das Training bis zum laufenden Betrieb.
Der Inhalt im Überblick
Worum geht es in der Orientierungshilfe?
Die „Orientierungshilfe zu empfohlenen technischen und organisatorischen Maßnahmen bei der Entwicklung und beim Betrieb von KI-Systemen“ richtet sich vor allem an Entwickler und Hersteller von KI-Systemen. Sie soll zeigen, wie man KI-Projekte von Anfang an datenschutzkonform gestaltet. Im Mittelpunkt stehen die technischen und organisatorischen Maßnahmen (TOM), also praktische Schutzmaßnahmen für Daten. Die Datenschutzkonferenz nutzt dabei das Standard-Datenschutzmodell (SDM), das hilft, die abstrakten Vorgaben der DSGVO in konkrete Schritte zu übersetzen.
Wer sich für die rechtlichen Hintergründe interessiert, sollte zusätzlich die DSK-Orientierungshilfe „Künstliche Intelligenz und Datenschutz“ lesen. Dort geht es um Themen wie Rechtsgrundlagen, Zweckbindung, Betroffenenrechte und Datenschutz-Folgenabschätzung. In diesem Artikel finden Sie noch weitere Hinweise zum Training von KI.
Was ist das Standard-Datenschutzmodell?
Das Standard-Datenschutzmodell (SDM) ist ein Leitfaden der Datenschutzbehörden. Es hilft dabei, die Vorgaben der DSGVO in verständliche und umsetzbare Schritte zu übersetzen. Das SDM nennt sieben zentrale Datenschutz-Ziele, wie zum Beispiel Datenminimierung oder Transparenz, und zeigt, wie man diese praktisch in jedem größeren Projekt berücksichtigen kann.
Vier Phasen, sieben Ziele
Die DSK teilt jedes KI-Projekt in vier Phasen ein:
- Design (Planung und Auswahl der Daten)
- Entwicklung (Training und Testen der KI)
- Einführung (Roll-out und Konfiguration)
- Betrieb und Monitoring (laufende Nutzung und Überwachung)
Für jede Phase beschreibt die Orientierungshilfe, wie die sieben Gewährleistungsziele praktisch umgesetzt werden können:
- Datenminimierung (so wenig Daten wie möglich verwenden)
- Verfügbarkeit (Daten und Systeme müssen zuverlässig funktionieren)
- Vertraulichkeit (Schutz vor unbefugtem Zugriff)
- Integrität (Daten und Modelle dürfen nicht manipuliert werden)
- Intervenierbarkeit (Betroffene müssen ihre Rechte ausüben können)
- Transparenz (Nachvollziehbarkeit für Betroffene und Behörden)
- Nichtverkettung (Daten dürfen nicht für andere Zwecke weiterverwendet werden)
Designphase: Klare Regeln von Anfang an
Schon bei der Planung eines KI-Systems ist wichtig: Wofür wird die KI eingesetzt? Welche Daten werden gebraucht? Und auf welcher Rechtsgrundlage werden sie erhoben? Jede Datenquelle sollte dokumentiert werden – zum Beispiel in einem „Datasheet“, das Herkunft, Art und Zweck der Daten beschreibt. Auch sollte schon jetzt überlegt werden, wie später Anfragen von Betroffenen (z. B. auf Löschung) umgesetzt werden können.
Entwicklungsphase: Nur so viele Daten wie nötig
In der Entwicklungsphase werden die Daten für das Training der KI vorbereitet. Hier gilt: Nur so viele Daten verwenden, wie wirklich nötig sind. Alle Verarbeitungsschritte sollten dokumentiert werden. Es muss geprüft werden, ob das Modell Fehler macht oder bestimmte Gruppen benachteiligt. Außerdem müssen Schutzmechanismen verhindern, dass sensible oder manipulierte Daten ins Training gelangen oder später versehentlich ausgegeben werden. Es muss ebenfalls möglich sein, falsche oder zu löschende Informationen auch nachträglich aus Modell und Datensatz zu entfernen.
Einführungsphase: Datenschutzfreundliche Voreinstellungen
Vor dem Start in den Echtbetrieb („Go-Live“) sind datenschutzfreundliche Einstellungen wichtig. KI-Modelle sollten möglichst ohne unnötige Trainingsdaten ausgeliefert werden. Wo das nicht geht, müssen die Daten verschlüsselt und auf das Nötigste beschränkt werden. Alle Einstellungen, etwa zur Protokollierung oder zu Filterfunktionen, sollten so gewählt sein, dass sie die Privatsphäre schützen, ohne dass der Betreiber noch nachbessern muss.
Betrieb und Monitoring: Kontinuierliche Kontrolle
Im laufenden Betrieb muss die Qualität der KI regelmäßig überwacht werden. Wenn sich die Datenlage ändert, neue Gesetze gelten oder das Modell unerwartete Fehler macht, muss schnell reagiert werden. Die Rechte der Betroffenen, etwa auf Auskunft, Berichtigung oder Löschung, müssen auch im laufenden Betrieb technisch durchsetzbar sein. Es reicht nicht, einfach nur unerwünschte Ausgaben zu blockieren. Die Datenschutzkonferenz empfiehlt außerdem Schutzmaßnahmen gegen Angriffe, bei denen versucht wird, Trainingsdaten aus dem Modell herauszulesen. Dazu gehören zum Beispiel Zugriffsbeschränkungen oder die Ausführung der KI direkt beim Nutzer.
Datenschutz von Anfang an mitdenken
Die neue Orientierungshilfe der Datenschutzkonferenz zeigt, dass Datenschutz nicht nur eine Formalität, sondern ein Grundbaustein für jedes KI-Projekt ist. Wer von Anfang an sauber dokumentiert, Daten sparsam einsetzt und im Betrieb für Transparenz sorgt, erfüllt nicht nur die Erwartungen der Behörden – sondern schafft auch Vertrauen bei Kunden und Mitarbeitenden.