... | ... | @@ -2,6 +2,15 @@ |
|
|
|
|
|
- posiadana baza wiedzy jako źródło potencjalnych deskryptorów. Baza wiedzy skonstruowana
|
|
|
na podstawie wordnetu oraz linked open data,
|
|
|
- baza wiedzy zawiera kategorie z możliwie wielu różnych dziedzin
|
|
|
- baza wiedzy zawiera kategorie z możliwie wielu różnych dziedzin,
|
|
|
- algorytmy powinny być w stanie szybko generować słowa klucze nawet, gdy baza wiedzy jest bardzo rozbudowana
|
|
|
|
|
|
#### |
|
|
\ No newline at end of file |
|
|
#### Model
|
|
|
|
|
|
Model stanowi graf wiedzy (knowledge base) zawierający pojęcia, a struktura tego grafu definiuje relacje semantyczne zachodzące między pojęciami. Pojęcia podobne tematycznie powinny znajdować się w podobnych obszarach sieci (grafu), a relacje między nimi odzwierciedlać podobieństwo semantyczne.
|
|
|
|
|
|
Graf przetwarzany jest za pomocą algorytmów grafowych, które wyznaczają istotność węzła w odniesieniu do tekstu. Podobieństwo tematyczne węzła do tekstu powinno być uchwycone za pomocą wynikowej miary grafowej, która ustala jego istotność. W tym przypadku bazową miarą (baseline) jest algorytm PageRank, jednak jego złożoność obliczeniowa zmusza nas do zastąpienia tego algorytmu innymi, przybliżonymi miarami istotności węzła poprzez wprowadzenie metod Monte Carlo.
|
|
|
|
|
|
#### Algorytm - wersja bazowa
|
|
|
|
|
|
Wykryte poję |
|
|
\ No newline at end of file |