Skip to content
Snippets Groups Projects
Tomasz Walkowiak's avatar
Tomasz Walkowiak authored
Fix - add one more argument in for loop

See merge request !6
7eb47376

Anonymizer

Service that automatically anonymizes text for polish language.

Anonymizer works in 3 modes, when sensitive data is detected, it can perform operations:

  • delete - sensitive data is deleted
  • tag - sensitive data is replaced by the category tag it belongs to
  • pseudo (pseudonymization) - sensitive data is replaced by another object in the same category

Examples:

  • Delete
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z .
  • Tag
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z [OSOBA] [OSOBA].
  • Pseudonymization
    • Spotkałem się dzisiaj z Janem Kowalskim.
    • Spotkałem się dzisiaj z Stefanem Michlem.

Liner2 should use model 5nam. tekst->any2txt->morphodita->liner2->anonymizer