Skip to content
Snippets Groups Projects
README.md 803 B
Newer Older
Service that automatically anonymizes text for polish language.

Anonymizer works in 3 modes, when sensitive data is detected, it can perform operations:
- delete - sensitive data is deleted
- tag - sensitive data is replaced by the category tag it belongs to
- pseudo (pseudonymization) - sensitive data is replaced by another object in the same category

### Examples:
- Delete
    - Spotkałem się dzisiaj z Janem Kowalskim. 
    - Spotkałem się dzisiaj z  .
- Tag
    - Spotkałem się dzisiaj z Janem Kowalskim. 
    - Spotkałem się dzisiaj z [OSOBA] [OSOBA]. 
- Pseudonymization
    - Spotkałem się dzisiaj z Janem Kowalskim.
    - Spotkałem się dzisiaj z Stefanem Michlem.

Liner2 should use model 5nam.
tekst->any2txt->morphodita->liner2->anonymizer