Skip to content
Snippets Groups Projects
Szymon Ciombor's avatar
Szymon Ciombor authored
Support for English and Russian language

See merge request !5
1677a12c

Anonymizer

Service that automatically anonymizes text for polish language.

Anonymizer works in 3 modes, when sensitive data is detected, it can perform operations:

  • delete - sensitive data is deleted
  • tag - sensitive data is replaced by the category tag it belongs to
  • pseudo (pseudonymization) - sensitive data is replaced by another object in the same category

Examples:

  • Delete
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z .
  • Tag
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z [OSOBA] [OSOBA].
  • Pseudonymization
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z Stefanem Michlem.

Liner2 should use model 5nam. tekst->any2txt->morphodita->liner2->anonymizer