Nach der Erkennung werden die personenbezogenen Daten durch konsistente Pseudonyme ersetzt. Das Kernprinzip: Gleiche Person = gleiches Pseudonym — über alle Dokumente und alle Verarbeitungsdurchläufe hinweg.
Konsistenz ist der Schlüssel
Wenn Max Müller in 50 Dokumenten vorkommt, wird er überall zu Person_A. Wenn seine Frau Anna Müller in 30 Dokumenten erscheint, wird sie überall zu Person_B. So bleiben Zusammenhänge erhalten:
- In Dokument 1: „Person_A unterzeichnete den Vertrag mit Firma_A“
- In Dokument 2: „Person_A erhielt eine E-Mail von Person_C“
- In Dokument 3: „Die Rechnung wurde an Adresse_A von Person_A gesendet“
Die KI erkennt, dass es sich überall um dieselbe Person handelt — ohne deren Identität zu kennen.
Batch-übergreifende Pseudonyme
Die Konsistenz gilt nicht nur innerhalb eines Verarbeitungsdurchlaufs, sondern auch batch-übergreifend. Wenn Max Müller in Charge 1 als Person_A pseudonymisiert wurde, erhält er auch in Charge 2, 3 und allen weiteren Durchläufen das Pseudonym Person_A. Die Ersetzungstabelle wird kontinuierlich erweitert.