README.md 803 Bytes
Newer Older
1 2
# Anonymizer

3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Service that automatically anonymizes text for polish language.

Anonymizer works in 3 modes, when sensitive data is detected, it can perform operations:
- delete - sensitive data is deleted
- tag - sensitive data is replaced by the category tag it belongs to
- pseudo (pseudonymization) - sensitive data is replaced by another object in the same category

### Examples:
- Delete
    - Spotkałem się dzisiaj z Janem Kowalskim. 
    - Spotkałem się dzisiaj z  .
- Tag
    - Spotkałem się dzisiaj z Janem Kowalskim. 
    - Spotkałem się dzisiaj z [OSOBA] [OSOBA]. 
- Pseudonymization
    - Spotkałem się dzisiaj z Janem Kowalskim.
    - Spotkałem się dzisiaj z Stefanem Michlem.

21
Liner2 should use model 5nam.
22
tekst->any2txt->morphodita->liner2->anonymizer