Commit fddee0bd authored by Grzegorz Kostkowski's avatar Grzegorz Kostkowski

Merge branch 'current' into 'develop_MTC_filtering'

# Conflicts:
#   keyword_assignment_tool/algorithm/gt_pprmc.py
#   keyword_assignment_tool/config/config.ini
#   keyword_assignment_tool/config/config.py
#   keyword_assignment_tool/keyword_assignment_pmc.py
#   keyword_assignment_tool/kwazon_plugin.py
#   keyword_assignment_tool/loaders/loader.py
#   keyword_assignment_tool/results/results.py
#   keyword_assignment_tool/utils/utils.py
#   setup.py
parents 2806760e 7ac8b6dd
KeyWord-Assignment-Tool (kwazon)
1. INFORMACJE WSTĘPNE
Narzędzie KeyWord-Assignment-Tool (kwat) służy do przypisywania deskryptywnych
słów kluczowych do dokumentu na podstawie grafu zasobów połączonych.
W aktualnej wersji używany graf zawiera wyłącznie kategorie DBPEDII.
2. ZALEŻNOŚCI
* python 2.x
* graph-tool (customowa wersja z implementacją pprmc)
3. SPOSÓB UŻYCIA
Narzędzie obsługuje dokumenty w formacie *.ccl.
Uwaga! W bieżącej wersji narzędzie nie przeproawadza dopasowania odnośników URL
do pojęć w tekście dlatego wprowadzany dokument powinien być uprzednio opatrzony
takimi odnośnikami URL do pojęć z sieci połączonych zasobów (WSS) oraz
adnotacjami 'keyword first instance'.
Na wejście programu należy podać przynajmniej ścieżkę pliku oraz ścieżkę gdzie
zostanie zapisany wynikowy plik ze słowami kluczowymi:
kwazon path/to/doc/doc.xml out/path/out.txt
W celu informacji na temat pełnej listy parametrów oraz szczegółowych instrukcji
na temat użycia należy uruchomić program z opcją '--help':
kwazon --help
W przypadku przetwarzania wielu dokumentów narzędzie można uruchomić z poziomu
sesji ipythona, uprzednio ładując do pamięci potrzebne komponenty (obsługa
wielu dokumentów (tryb "batch") z poziomu linii poleceń zostanie dodana w
przyszłości).
Sposób użycia w sesji ipython (stara metoda):
>>> from loaders import loader
>>> import keyword_assignment as ka
>>> graph_path = 'path_to_graph.graphml'
>>> output = 'output_file.txt'
>>> concepts_categories_path = 'path_to_concepts_categories_file.txt'
>>> graph, concept_nodes_map = loader\
.load_all(graph_path, concepts_categories_path)
>>> ka.run(graph, loader.load_doc(ccl_doc), output,\
concept_nodes_map=concept_nodes_map)
Sposób użycia w sesji ipython (nowa metoda - z wykorzystaniem cachowania w ipythonie):
# utrwalenie
>>> from keyword_assignment_tool import kwazon_plugin
>>> kw_plugin = kwazon_plugin.KwazonPlugin()
>>> ...
>>> doc_path = ...
>>> kw_plugin.run_kwazon_prepared_debug(*kwazon_plugin._make_out_paths(doc_path, 'extra_info'))
>>> ...
>>> kwazon_plugin.store_in_cache(kw_plugin)
# odtworzenie z chache
>>> from keyword_assignment_tool import kwazon_plugin
>>> kwazon_plugin.restore_from_cache()
>>> cached_vars = {'graph':graph, 'concept_cat_map': concept_cat_map, 'v_id_lod_url_map': v_id_lod_url_map, 'lod_url_v_id_map': lod_url_v_id_map, 'cats_keyed_vectors': cats_keyed_vectors, 'v_id_vector
_map': v_id_vector_map}
>>> kw_plugin = kwazon_plugin.initialize_plugin_from_cache(cached_vars)
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment