... | ... | @@ -18,6 +18,18 @@ Wykryte pojęcia stanowią tło tematyczne tekstu. Tło tematyczne powinno być |
|
|
1. Dla każdego węzła _s_ z ziarna _seed_ wygeneruj _k_ spacerów losowych aktywując węzły po drodze
|
|
|
2. Wyznacz miarę istotności dla każdego węzła w grafie
|
|
|
|
|
|
##### Potencjalne problemy
|
|
|
##### Potencjalne problemy
|
|
|
|
|
|
#### Algorytm - warianty rozszerzone |
|
|
\ No newline at end of file |
|
|
- powolna zbieżność MC
|
|
|
- wysoka wariancja MC
|
|
|
|
|
|
#### Algorytm - warianty rozszerzone
|
|
|
|
|
|
Wprowadzenie podobieństwa tekstowego (węzeł w grafie posiada przypisany artykuł Wikipedii). Podobieństwo artykułu węzła do tekstu powinno wpłynąć na kształt spacerów (spacery powinny poruszać się wyłącznie ścieżkami, które są treściowo powiązane z analizowanym tekstem.
|
|
|
|
|
|
1. Wyznaczenie wektorów dla węzłów w grafie (Wikipedia2Vec),
|
|
|
2. Wyznaczenie wagi węzła na podstawie jego podobieństwa wektorowego do wektora analizowanego tekstu,
|
|
|
3. Wykonanie algorytmu spaceru losowego z uwzględnieniem prawdopodobieństw przejść wynikającym z podobieństwa wektorowego,
|
|
|
4. Uwzględnienie typu relacji w prawdopodobieństwie przechodzenia z węzła do węzła.
|
|
|
|
|
|
Uśrednienie istotności po sąsiadach powinno zredukować wariancję. Moż |
|
|
\ No newline at end of file |