Skip to content
Snippets Groups Projects
Select Git revision
  • 9f152c1825009879a17818c675fc5b1c95eb739b
  • master default protected
  • lemmas_counter
3 results

fextor

  • Clone with SSH
  • Clone with HTTPS
  • =========
    fextorbis
    =========
    
    Usługa udostępniająca pewien konkretny zbiór ekstraktorów cech Desifexa,
    które żądania mogą wydobyć z przesyłanych dokumentów.
    
    Cechy są zapisywane w postaci standardowego wyjściowego słownika Desifexa,
    w formacie JSON.
    
    
    Wymaga
    ======
    
    Desifex >= 3.2
    growdict >= 0.1 (w katalogu "external")
    
    
    config.ini
    ==========
    
    [tool]
    ------
    
    stoplist_basedir
    
        Katalog bazowy dla ścieżek plików przekazywanych jako stoplisty
        w task_options.
    
    
    task_options
    ============
    
    lang: {"pl" | "en"}
    
        Język dokumentu, z którego mają być wydobyte cechy. Zestaw dostępnych cech
        różni się nieco w zależności od wybranego języka; tak samo niektóre metody
        wydobycia.
    
        Jeśli ta opcja nie jest podana, domyślna wartość to "pl".
    
    features: str
    
        String zawierający nazwy cech do wydobycia, oddzielonych spacjami. Dostępne
        cechy, dla obu języków, są wymienione w pliku konfiguracyjnym
        "fextorbis.yaml".
    
    filters: dict
    
        Słownik mapujący nazwy cech do definicji filtrów do zastosowania dla danej
        cechy.
    
        Definicją cechy może być:
    
        * Słownik zawierający klucze {"type": ..., "args": ...}, gdzie "type" to
          jeden z typów filtrów corpus2_filtering, a "args" to argumenty jego
          konstruktora.
        * Lista słowników opisanych w poprzednim punkcie; filtry zostaną
          zastosowane w kolejności takiej w jakiej są na liście.
    
    override_arguments: dict
    
        Słownik mapujący nazwy cech do słowników odpowiadających sekcjom "args"
        w pliku fextorbis.yaml. Pozwala dynamicznie zmienić niektóre
        z argumentów ustawionych w pliku konfiguracyjnym dla danych cech.
    
        Dozwolone wartości w słowniku zależą od typu cechy.