|
|
# Informacje ogólne
|
|
|
Przeanalizowano rankingi dla 13 losowych dokumentów z korpusu rum@k/ceon (które bezpośrednio przekładają się na wynikowe listy słów kluczowych), oceniono je biorąc pod uwagę:
|
|
|
- tematyczną zgodność z dokumentem (przede wszystkim)
|
|
|
- związek słów kluczowych ze słowami w dokumencie
|
|
|
|
|
|
Kategorie oznaczone `$` to kategorie związane z deskryptorami BN - reprezentujące *dziedzinę*, oznaczenie `*` dotyczy kategorii początkowych (dla algorytmu pprmc).
|
|
|
|
|
|
# Skala ocen
|
|
|
Ocena od 1! do 5 dotycząca adekwatności względem tekstu:
|
|
|
5 - zdecydowanie pasuje
|
|
|
4 - raczej pasuje
|
|
|
3 - trudno stwierdzić
|
|
|
2 - raczej nie pasuje
|
|
|
1 - nie pasuje
|
|
|
1! - zdecydowanie nie pasuje
|
|
|
|
|
|
|
|
|
# Ocena
|
|
|
## format
|
|
|
nazwa pliku
|
|
|
tytuł dokumentu
|
|
|
ranking
|
|
|
```
|
|
|
==> 1391.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Pracownik socjalny zorientowany szkolnie wobec problemu sekt i zjawisk pokrewnych
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
2 $ http://dbpedia.org/resource/Category:Mass_media 0.00227805266405
|
|
|
3 http://dbpedia.org/resource/Category:Religious_conversion 0.00998688961872
|
|
|
4 http://dbpedia.org/resource/Category:New_religious_movements 0.00878736130575
|
|
|
4 http://dbpedia.org/resource/Category:Learning_methods 0.00827136153912
|
|
|
5 http://dbpedia.org/resource/Category:Cults 0.00349509024094
|
|
|
2 http://dbpedia.org/resource/Category:Language_acquisition 0.00322980405118
|
|
|
4 http://dbpedia.org/resource/Category:Adoption,_fostering,_orphan_care_and_displacement 0.00269452849507
|
|
|
5 http://dbpedia.org/resource/Category:Anti-cult_terms_and_concepts 0.00225787688927
|
|
|
2 http://dbpedia.org/resource/Category:Formalism_(philosophy) 0.0020168415294
|
|
|
3 http://dbpedia.org/resource/Category:Applied_learning 0.00194473259147
|
|
|
|
|
|
==> 2529.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Arbiter jednostronnie mianowany przez stronę w arbitrażu międzynarodowym
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
4 $ http://dbpedia.org/resource/Category:Ethics 8.01341632085e-05
|
|
|
1 http://dbpedia.org/resource/Category:Vitreous_rocks 0.047758511704
|
|
|
1 http://dbpedia.org/resource/Category:Basalt 0.0296290889428
|
|
|
1 http://dbpedia.org/resource/Category:Tephra 0.0274074350134
|
|
|
1 http://dbpedia.org/resource/Category:Volcanoes 0.0235856299787
|
|
|
1 http://dbpedia.org/resource/Category:Volcanic_rocks 0.0184888273271
|
|
|
1 http://dbpedia.org/resource/Category:Large_igneous_provinces 0.017450628295
|
|
|
1 http://dbpedia.org/resource/Category:Aphanitic_rocks 0.0164801210019
|
|
|
1 http://dbpedia.org/resource/Category:Flood_basalts 0.0160677981
|
|
|
1 http://dbpedia.org/resource/Category:Porphyritic_rocks 0.0106054451192
|
|
|
|
|
|
==> 1987.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Inspiracje Schopenhauerowskie w filozofii zła Mariana Zdziechowskiego
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
5 $ http://dbpedia.org/resource/Category:Spirituality 0.00212794439786
|
|
|
? http://dbpedia.org/resource/Category:Max_Stirner 0.0199582240616
|
|
|
4 http://dbpedia.org/resource/Category:Agnosticism 0.0094752457472
|
|
|
4 http://dbpedia.org/resource/Category:Cruelty_to_animals 0.00750920366669
|
|
|
4 * http://dbpedia.org/resource/Category:Happiness 0.00742968010615
|
|
|
3 http://dbpedia.org/resource/Category:Doubt 0.00737521854086
|
|
|
4 http://dbpedia.org/resource/Category:Belief 0.00625356287534
|
|
|
3 http://dbpedia.org/resource/Category:Love 0.00553438905849
|
|
|
3 http://dbpedia.org/resource/Category:A_priori 0.00536507784667
|
|
|
4 http://dbpedia.org/resource/Category:Cognitive_inertia 0.00379039081202
|
|
|
|
|
|
==> 155.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
KONWERGENCJA GOSPODARCZA W WYBRANYCH KRAJACH OECD W ŚWIETLE TESTÓW KOINTEGRACJI NIELINIOWEJ
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
2 $ http://dbpedia.org/resource/Category:Law 0.000482787801945
|
|
|
1 http://dbpedia.org/resource/Category:India 0.0176534629175
|
|
|
1 http://dbpedia.org/resource/Category:Republic_of_Ireland 0.00899284713408
|
|
|
4 * http://dbpedia.org/resource/Category:Australia 0.00710929612822
|
|
|
4 http://dbpedia.org/resource/Category:Sweden 0.00391025633627
|
|
|
1 http://dbpedia.org/resource/Category:Russia 0.00356809369003
|
|
|
3 http://dbpedia.org/resource/Category:Nordic_countries 0.00348265892418
|
|
|
4 http://dbpedia.org/resource/Category:France 0.00313155328451
|
|
|
4 http://dbpedia.org/resource/Category:Scientific_theories 0.00289474693023
|
|
|
1 http://dbpedia.org/resource/Category:Northeast_Asian_countries 0.00286346536709
|
|
|
|
|
|
==> 1079.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Digitalizacja zbiorów w bibliotekach polskich - próba oceny doświadczeń krajowych
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
3 $ http://dbpedia.org/resource/Category:History 0.000391846313194
|
|
|
4 * http://dbpedia.org/resource/Category:Poland 0.0119424363232
|
|
|
2 http://dbpedia.org/resource/Category:Inductive_reasoning 0.00397144044286
|
|
|
1! http://dbpedia.org/resource/Category:Railway_stations_in_Gdynia 0.00298294956603
|
|
|
1 http://dbpedia.org/resource/Category:May_events 0.00294807350436
|
|
|
1 http://dbpedia.org/resource/Category:Slovakia 0.0029026612786
|
|
|
1 http://dbpedia.org/resource/Category:Slovenia 0.00279407338826
|
|
|
1 http://dbpedia.org/resource/Category:Rocketry 0.00243952999603
|
|
|
2 http://dbpedia.org/resource/Category:Geography_of_Poland 0.00220353943645
|
|
|
1 http://dbpedia.org/resource/Category:Sport_in_Poland 0.00217690166625
|
|
|
|
|
|
==> 2814.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Mk 1,1–13 w egzegezie homiletycznej św. Hieronima ze Strydonu
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
4 $ http://dbpedia.org/resource/Category:Literary_criticism 9.08284852834e-05
|
|
|
4 * http://dbpedia.org/resource/Category:Jesus 0.0387663761419
|
|
|
2 http://dbpedia.org/resource/Category:Mary_(mother_of_Jesus) 0.0278646705903
|
|
|
2 http://dbpedia.org/resource/Category:Adoration_of_the_Magi_in_art 0.0173720751014
|
|
|
2 http://dbpedia.org/resource/Category:Biblical_Magi 0.0159393175511
|
|
|
4 http://dbpedia.org/resource/Category:Fruit_of_the_Holy_Spirit 0.0140137440876
|
|
|
3 http://dbpedia.org/resource/Category:Peace 0.0131746779367
|
|
|
2 http://dbpedia.org/resource/Category:Pauline_Christianity 0.0108543319131
|
|
|
3 http://dbpedia.org/resource/Category:Sermon_on_the_Mount 0.00770594542829
|
|
|
5 http://dbpedia.org/resource/Category:Gospel_episodes 0.0068803653316
|
|
|
|
|
|
==> 2657.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
SZACOWANIE NATURALNEJ STOPY PROCENTOWEJ DLA POLSKI
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
2 $ http://dbpedia.org/resource/Category:Marketing 0.00295624458948
|
|
|
5 http://dbpedia.org/resource/Category:Demand_for_money 0.0108198168272
|
|
|
3 http://dbpedia.org/resource/Category:Inductive_reasoning 0.0074430831288
|
|
|
2 http://dbpedia.org/resource/Category:Paradoxes_in_utility_theory 0.00622686775787
|
|
|
4 http://dbpedia.org/resource/Category:Financial_markets 0.00557046589592
|
|
|
3 http://dbpedia.org/resource/Category:Scientific_theories 0.00477127936084
|
|
|
5 http://dbpedia.org/resource/Category:Econometrics 0.00472384741137
|
|
|
4 http://dbpedia.org/resource/Category:Scientific_modeling 0.00470448580202
|
|
|
3 http://dbpedia.org/resource/Category:Utility 0.00449370076967
|
|
|
2 http://dbpedia.org/resource/Category:A_priori 0.00443459264334
|
|
|
|
|
|
==> 1227.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Funkcje i potencjał informacyjny sloganu w hasłach wyborczych kandydatów na prezydenta RP w 2015 roku
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
5 $ http://dbpedia.org/resource/Category:Mass_media 0.0011598174089
|
|
|
5 http://dbpedia.org/resource/Category:Advertising_techniques 0.00647400533966
|
|
|
5 http://dbpedia.org/resource/Category:Political_slogans 0.00630824820253
|
|
|
2 http://dbpedia.org/resource/Category:A_priori 0.00438696442873
|
|
|
4 http://dbpedia.org/resource/Category:Advertising_terminology 0.00424586849338
|
|
|
4 http://dbpedia.org/resource/Category:Public_relations 0.00412517965527
|
|
|
3 http://dbpedia.org/resource/Category:Philosophical_phrases 0.0039356201451
|
|
|
5 http://dbpedia.org/resource/Category:Slogan_lists 0.00356212667734
|
|
|
3 http://dbpedia.org/resource/Category:Idioms 0.00342944118149
|
|
|
5 http://dbpedia.org/resource/Category:Advertising_slogans 0.00312716722991
|
|
|
|
|
|
==> 2744.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
POSŁANNICTWO CHRZEŚCIJAN ŚWIECKICH W ŚWIECIE
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
4 $ http://dbpedia.org/resource/Category:Spirituality 0.00286035828359
|
|
|
5 http://dbpedia.org/resource/Category:Jesus 0.061008504984
|
|
|
2 http://dbpedia.org/resource/Category:A_priori 0.00701304201588
|
|
|
2 http://dbpedia.org/resource/Category:Mary_(mother_of_Jesus) 0.00592039693856
|
|
|
2 http://dbpedia.org/resource/Category:Causality 0.00485630292997
|
|
|
3 http://dbpedia.org/resource/Category:Existentialist_concepts 0.00456934365893
|
|
|
2 * http://dbpedia.org/resource/Category:Nature 0.00455216239592
|
|
|
3 http://dbpedia.org/resource/Category:Concepts_in_metaphysics 0.00447935247257
|
|
|
3 http://dbpedia.org/resource/Category:Fruit_of_the_Holy_Spirit 0.00404624769157
|
|
|
3 http://dbpedia.org/resource/Category:Peace 0.00398809448949
|
|
|
|
|
|
==> 1544.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Rządy mniejszościowe w Belgii: trudności istnienia stabilnego rządu w państwie Flamandów i Walonów
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
5 $ http://dbpedia.org/resource/Category:Law 0.000595648251191
|
|
|
1 http://dbpedia.org/resource/Category:Isle_of_Portland 0.00510138863019
|
|
|
1 http://dbpedia.org/resource/Category:Roadstead 0.0046179162255
|
|
|
1 http://dbpedia.org/resource/Category:Law_of_the_sea 0.00443969133348
|
|
|
4 * http://dbpedia.org/resource/Category:Belgium 0.00331524268877
|
|
|
1 http://dbpedia.org/resource/Category:Maritime_communication 0.00321542051935
|
|
|
1 http://dbpedia.org/resource/Category:Republic_of_Ireland 0.00291599060191
|
|
|
4 http://dbpedia.org/resource/Category:Forms_of_government 0.00269090493692
|
|
|
1 http://dbpedia.org/resource/Category:Admiralty_law 0.00229864196165
|
|
|
1 http://dbpedia.org/resource/Category:Piracy 0.0018716598556
|
|
|
|
|
|
==> 2119.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Okolice bibliologii (?)
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
1 $ http://dbpedia.org/resource/Category:Philosophy 0.000676875890007
|
|
|
2 http://dbpedia.org/resource/Category:Rhetoric 0.0198376527817
|
|
|
1 http://dbpedia.org/resource/Category:Films_about_high_school_debate 0.00451635934423
|
|
|
2 http://dbpedia.org/resource/Category:Rhetorical_techniques 0.00324958478676
|
|
|
2 http://dbpedia.org/resource/Category:Metaphors 0.00289099306936
|
|
|
? http://dbpedia.org/resource/Category:Inductive_fallacies 0.00250517313337
|
|
|
3 http://dbpedia.org/resource/Category:Student_organizations 0.00242560611342
|
|
|
? http://dbpedia.org/resource/Category:Romney_Literary_Society 0.0020263039139
|
|
|
1 http://dbpedia.org/resource/Category:Republic_of_Ireland 0.00165669462555
|
|
|
1 http://dbpedia.org/resource/Category:Language_exchange_programs 0.00158028676676
|
|
|
|
|
|
==> 2396.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
Class action arbitration – w poszukiwaniu skutecznego mechanizmu dochodzenia roszczeń przez konsumentów
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
4 $ http://dbpedia.org/resource/Category:Communication 0.000718634568861
|
|
|
3 http://dbpedia.org/resource/Category:Utility 0.0112987279251
|
|
|
3 http://dbpedia.org/resource/Category:Home_economics 0.0108526610965
|
|
|
4 http://dbpedia.org/resource/Category:Consumer_theory 0.00677528923889
|
|
|
4 http://dbpedia.org/resource/Category:Market-based_policy_instruments 0.00596729335412
|
|
|
3 http://dbpedia.org/resource/Category:Demand_for_money 0.00593158859126
|
|
|
3 http://dbpedia.org/resource/Category:Demand 0.00505587797349
|
|
|
2 http://dbpedia.org/resource/Category:Local_currencies 0.00455849558411
|
|
|
2 http://dbpedia.org/resource/Category:Disposable_products 0.00346976673045
|
|
|
4 http://dbpedia.org/resource/Category:Compensation_for_victims_of_crime 0.00296906922453
|
|
|
|
|
|
==> 1660.txt.tag.mwe.wosedon.elinker-damp_f-0_1-iters-100-kwazon-07-with-first-bn-descr-ranking.txt <==
|
|
|
europeizacja tradycyjnych funkcji polskiego parlamentu w świetle postanowień traktatu z lizbony
|
|
|
RESULTED RANKING (for 10 categories):
|
|
|
5 $ http://dbpedia.org/resource/Category:Law 0.000544163092771
|
|
|
5 http://dbpedia.org/resource/Category:Forms_of_government 0.00391335849026
|
|
|
? http://dbpedia.org/resource/Category:States_by_power_status 0.0035425048526
|
|
|
4 http://dbpedia.org/resource/Category:Customary_legal_systems 0.00343629526941
|
|
|
2 http://dbpedia.org/resource/Category:Decentralization 0.00237010334232
|
|
|
5 * http://dbpedia.org/resource/Category:Poland 0.00183612109123
|
|
|
4 http://dbpedia.org/resource/Category:Separation_of_powers 0.00165729157937
|
|
|
2 http://dbpedia.org/resource/Category:Criminal_records 0.00158851567749
|
|
|
1 http://dbpedia.org/resource/Category:Sex_offender_registration 0.00156712385572
|
|
|
1! http://dbpedia.org/resource/Category:Angle 0.00142674689418
|
|
|
```
|
|
|
|
|
|
# Spostrzeżenia, uwagi
|
|
|
1. kategorie typu "http://dbpedia.org/resource/Category:May_events" do wyrzucenia
|
|
|
2. żadne słowa kluczowe nie pasują dla 2529
|
|
|
3. różne niekoniecznie poprawne kraje zostały wybrane w 155 (podobnie w 1079), podczas gdy dokument dotyczył 8 krajów
|
|
|
4. dlaczego Max_stirner w 1987?
|
|
|
5. Podobna zależność współwystępowania (jak w pkt 3) może być widoczna w 2814 (Jezus i Maryja)
|
|
|
6. Dość często pojawiają się kategorie: A_priori oraz Casuality
|
|
|
7. ("rząd ten opracował projekt paktu *szkolnego*" + "Model organizacji władzy w państwie") * kilka wystąpień !=> Category:Student_organizations (dokument 2119)
|
|
|
dok 1544 (Prawo + reda(morska)) !=> prawo morskie
|
|
|
8. Występujące często w przypisach "red." rozpoznane jako reda (Roadstead), np: "Minority Rights, red. G. A. Tarr" - CZY FORMA BAZOWA SŁOWA JEST ZALEŻNA OD WYNIKU UJEDNOZNACZNIANIA?
|
|
|
|
|
|
# Sugestie dot. poprawy jakości
|
|
|
1. Wprowadzić skierowanie spacerów w górę
|
|
|
- żeby uniknąć spacerów z wieloma "przeskokami" góra -> dół -> góra -> dół i odwiedzania "rodzeństwa" danego pojęcia
|
|
|
- żeby schodzić do kategorii bardziej uniwersalnych - ryzyko pomyłki jest mniejsze |