Skip to content
Snippets Groups Projects

Anonymizer

Service that automatically anonymizes text for polish language.

Anonymizer works in 3 modes, when sensitive data is detected, it can perform operations:

  • delete - sensitive data is deleted
  • tag - sensitive data is replaced by the category tag it belongs to
  • pseudo (pseudonymization) - sensitive data is replaced by another object in the same category

Examples:

  • Delete
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z .
  • Tag
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z [OSOBA] [OSOBA].
  • Pseudonymization
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z Stefanem Michlem.

Liner2 should use model 5nam. tekst->any2txt->morphodita->liner2->anonymizer