... | ... | @@ -6,17 +6,19 @@ Można uruchomić narzędzie *kwazon* na trzy sposoby: |
|
|
Standardowy pipeline na potrzeby ```AZONu```
|
|
|
## Z poziomu sesji ipythona
|
|
|
Najwygodniejsza opcja w przypadku testów developerskich. W tym przypadku ładowanie zasobów następuje raz. Wykorzystywany jest moduł *kwazon_plugin* dostępny razem z narzędziem *kwazon*.
|
|
|
### Tryby uruchomienia
|
|
|
Możliwe jest standardowe uruchomienie z ładowaniem statycznych zasobów (```run_kwazon_prepared```) - w efekcie wygenerowany zostanie plik z listą deskryptywnych słów kluczowych. Można również uruchomić w trybie debug (albo po prostu verbose) z generowaniem dwóch dodatkowych plików wyjściowych dostarczających dodatkowych informacji z wykonania narzędzia na danym dokumencie:
|
|
|
- plik rankingu: zawiera wybrane słowa kluczowe (urle) i ich wartości rankingu dla algorytmu **gtpprmc**. Jeśli wybrano jakiś sposób filtrowania wyjściowej listy słów kluczowych, to ten ranking też będzie przefiltrowany.
|
|
|
- plik ze szczegółowymi danymi (debug) z uruchomienia
|
|
|
### Tryby uruchomienia poprzez kwazon_plugin
|
|
|
Możliwe jest dwa tryby uruchomienia:
|
|
|
- standardowe uruchomienie z ładowaniem statycznych zasobów (```run_kwazon_prepared```) - w efekcie wygenerowany zostanie plik z listą deskryptywnych słów kluczowych
|
|
|
- uruchomienie w trybie debug (albo po prostu verbose) (```run_kwazon_prepared_debug```) z generowaniem dwóch dodatkowych plików wyjściowych dostarczających dodatkowych informacji z wykonania narzędzia na danym dokumencie:
|
|
|
- plik rankingu: zawiera wybrane słowa kluczowe (urle) i ich wartości rankingu dla algorytmu **gtpprmc**. Jeśli wybrano jakiś sposób filtrowania wyjściowej listy słów kluczowych, to ten ranking też będzie przefiltrowany.
|
|
|
- plik ze szczegółowymi danymi (debug) z uruchomienia
|
|
|
Zawiera następujące informacje:
|
|
|
- ```CONCEPT_CATEGORY MAPPING```: URLe dla rozpoznanych w dokumencie pojęć i kategorie z którymi są powiązane
|
|
|
- ```CONCEPT COUNTER MAPPING```: liczba wystąpień poszczególnych pojęć (URLi) w dokumencie
|
|
|
- ```CATEGORY COUNTER```: liczba różnych pojęć (sprawdzić?) z dokumentu rzutowanych na daną kategorię
|
|
|
- ```CATEGORY CUMMULATIVE COUNTER```: liczba odniesień do kategorii w dokumencie - suma wystąpień wszystkich pojęć rzutowanych na daną kategorię
|
|
|
- ```INIT PERSONALISATION VALUES```: Niezerowe wartości początkowej personalizacji dla węzłów (kategorii) w grafie dla algorytmu ```gtpprmc```
|
|
|
- ```RESULTED RANKING```: **pełną** wynikowy ranking dla algorytmu ```pprmc```. Kategorie początkowe (posiadające niezerową wartość początkowej personalizacji) są **oznaczone przez znak ```*```** poprzedzający ich URL
|
|
|
- ```CONCEPT_CATEGORY MAPPING```: URLe dla rozpoznanych w dokumencie pojęć i kategorie z którymi są powiązane
|
|
|
- ```CONCEPT COUNTER MAPPING```: liczba wystąpień poszczególnych pojęć (URLi) w dokumencie
|
|
|
- ```CATEGORY COUNTER```: liczba różnych pojęć (sprawdzić?) z dokumentu rzutowanych na daną kategorię
|
|
|
- ```CATEGORY CUMMULATIVE COUNTER```: liczba odniesień do kategorii w dokumencie - suma wystąpień wszystkich pojęć rzutowanych na daną kategorię
|
|
|
- ```INIT PERSONALISATION VALUES```: Niezerowe wartości początkowej personalizacji dla węzłów (kategorii) w grafie dla algorytmu ```gtpprmc```
|
|
|
- ```RESULTED RANKING```: **pełny** wynikowy ranking dla algorytmu ```pprmc```. Kategorie początkowe (posiadające niezerową wartość początkowej personalizacji) są **oznaczone przez znak ```*```** poprzedzający ich URL
|
|
|
|
|
|
## Jako samodzielna aplikacja z poziomu wiersza poleceń
|
|
|
Po zainstalowaniu narzędzie będzie dostępne pod nazwą **kwazon**. Parametry wejściowe należy podać
|
... | ... | |