... | ... | @@ -3,13 +3,15 @@ |
|
|
# Uruchomienie
|
|
|
Można uruchomić narzędzie *kwazon* na trzy sposoby:
|
|
|
## Poprzez workera (lpmn)
|
|
|
Standardowy pipeline na potrzeby ```AZONu```
|
|
|
Standardowy pipeline na potrzeby ```AZONu```. Polecenie kolejkujące zadanie: [wywołanie lpmn](https://gitlab.clarin-pl.eu/snippets/2)
|
|
|
## Z poziomu sesji ipythona
|
|
|
Najwygodniejsza opcja w przypadku testów developerskich. W tym przypadku ładowanie zasobów następuje raz. Wykorzystywany jest moduł *kwazon_plugin* dostępny razem z narzędziem *kwazon*.
|
|
|
Dużą zaletą jest to, że istnieje możliwość keszowania (cache) raz załadowanych danych tak aby były dostępne pomiędzy kolejnymi uruchomieniami sesji ipython. Szczegółowe instrukcje które należy wykonać są dostępne w [caching.txt](https://gitlab.clarin-pl.eu/team-semantics/kwazon/blob/26b8f277d0c5ffe8c54ce84f3809e711f6b8b282/caching.txt)
|
|
|
|
|
|
### Tryby uruchomienia poprzez kwazon_plugin
|
|
|
Możliwe jest dwa tryby uruchomienia:
|
|
|
- standardowe uruchomienie z ładowaniem statycznych zasobów (```run_kwazon_prepared```) - w efekcie wygenerowany zostanie plik z listą deskryptywnych słów kluczowych
|
|
|
- uruchomienie w trybie debug (albo po prostu verbose) (```run_kwazon_prepared_debug```) z generowaniem dwóch dodatkowych plików wyjściowych dostarczających dodatkowych informacji z wykonania narzędzia na danym dokumencie:
|
|
|
Możliwe są dwa tryby uruchomienia:
|
|
|
- standardowe uruchomienie z ładowaniem statycznych zasobów (metoda ```run_kwazon_prepared```) - w efekcie wygenerowany zostanie plik z listą deskryptywnych słów kluczowych
|
|
|
- uruchomienie w trybie debug (albo po prostu verbose) (metoda ```run_kwazon_prepared_debug```) z generowaniem dwóch dodatkowych plików wyjściowych dostarczających dodatkowych informacji z wykonania narzędzia na danym dokumencie:
|
|
|
- plik rankingu: zawiera wybrane słowa kluczowe (urle) i ich wartości rankingu dla algorytmu **gtpprmc**. Jeśli wybrano jakiś sposób filtrowania wyjściowej listy słów kluczowych, to ten ranking też będzie przefiltrowany.
|
|
|
- plik ze szczegółowymi danymi (debug) z uruchomienia
|
|
|
Zawiera następujące informacje:
|
... | ... | |