Bei der Anonymisierung werden personenbezogene Daten dauerhaft und irreversibel entfernt. Das kann durch Schwärzung (schwarze Balken), durch Löschung oder durch Generalisierung (z. B. exaktes Alter durch Altersgruppe ersetzen) geschehen. Das Ergebnis: Der Dokumentenkontext geht verloren.
Beispiel: Vertrag anonymisiert
Stellen Sie sich einen Kaufvertrag vor, der anonymisiert an ChatGPT übergeben wird:
Anonymisiert: „Der Vertrag zwischen [ENTFERNT] und [ENTFERNT] über die Lieferung von [ENTFERNT] im Wert von [ENTFERNT] wurde am [ENTFERNT] unterzeichnet. [ENTFERNT] verpflichtet sich, die Ware bis zum [ENTFERNT] an die Adresse [ENTFERNT] zu liefern.“
Die KI kann mit diesem Text nichts anfangen. Sie weiß nicht, wer die Vertragsparteien sind, was geliefert wird, wie hoch der Wert ist oder wann die Lieferung erfolgen soll. Eine sinnvolle Analyse ist unmöglich.
Beispiel: Vertrag pseudonymisiert
Derselbe Vertrag, pseudonymisiert:
Pseudonymisiert: „Der Vertrag zwischen Person_A und Firma_A über die Lieferung von Produkt_A im Wert von Betrag_A wurde am Datum_A unterzeichnet. Firma_A verpflichtet sich, die Ware bis zum Datum_B an die Adresse_A zu liefern.“
Die KI kann den Vertrag vollständig analysieren. Sie versteht die Struktur, die Verpflichtungen und die Fristen. Nach der Analyse werden die Pseudonyme über die Ersetzungstabelle wieder durch die Originaldaten ersetzt — das Ergebnis ist vollständig nutzbar.