Obecnie wielowyrazowce nie oznaczone jako mwe lub ne nie są rozpoznawane i linkowane. Można użyć indeks Crosswiki, żeby generować kandydatów do linkowania.
Dodać (jako opcję, konfigurowalna z poziomu usługi) możliwość ignorowania linków, które są przekierowaniami, np:
<prop key="e01">http://dbpedia.org/resource/Earth's_universe</prop>
<prop key="e02">http://dbpedia.org/resource/Formation_of_the_Universe</prop>
<prop key="e03">http://dbpedia.org/resource/Local_Universe</prop>
<prop key="e04">http://dbpedia.org/resource/Localverse</prop>
<prop key="e05">http://dbpedia.org/resource/Our_universe</prop>
<prop key="e06">http://dbpedia.org/resource/Physical_world</prop>
<prop key="e07">http://dbpedia.org/resource/Size_of_Universe</prop>
<prop key="e08">http://dbpedia.org/resource/Size_of_the_universe</prop>
<prop key="e09">http://dbpedia.org/resource/Space_and_the_universe</prop>
<prop key="e10">http://dbpedia.org/resource/The_Theory_of_The_Universe</prop>
<prop key="e11">http://dbpedia.org/resource/The_Universe</prop>
<prop key="e12">http://dbpedia.org/resource/The_universe</prop>
<prop key="e13">http://dbpedia.org/resource/Theory_of_the_universe</prop>
<prop key="e14">http://dbpedia.org/resource/Universal_theories</prop>
<prop key="e15">http://dbpedia.org/resource/Universal_theory</prop>
<prop key="e16">http://dbpedia.org/resource/Universe</prop>
<prop key="e17">http://dbpedia.org/resource/Universe_(thermodynamics)</prop>
<prop key="e18">http://dbpedia.org/resource/Universes</prop>
Powyższe linki prowadzą do http://dbpedia.org/resource/Universe
, w związku z tym nie powinny być dodawane do listy linków
wymaga rozwiązania: #6
Wtedy można odkomentować linie elinker.py:100 i elinker.py:102
Aktualnie (v0.5) nazwy własne są linkowane w takiej formie jakiej występują w tekście (np. Unii Europejskiej) przez co dla takich nazw nie można dopasować linków (z WSS, gdzie są tylko formy podstawowe). Należy dodać możliwość rozpoznania formy bazowej lub dodać formę bazową do każdej grupy tokenów (ne_base, podobnie jak w przypadku mwe ?)
Grzegorz Kostkowski (6b39de73) at 04 Mar 16:54
Add stoplist for english
Grzegorz Kostkowski (0e26a26c) at 04 Mar 16:47
Merge branch 'develop' of gitlab.clarin-pl.eu:team-semantics/elinke...
... and 1 more commit
Grzegorz Kostkowski (1dfc652b) at 02 Mar 18:52
Reformat code with black
Grzegorz Kostkowski (fe5841af) at 02 Mar 18:41
Merge branch 'develop' into 'master'
Grzegorz Kostkowski (fe5841af) at 28 Feb 10:48
Merge branch 'develop' into 'master'
Grzegorz Kostkowski (fe5841af) at 28 Feb 10:47
Merge branch 'develop' into 'master'
... and 23 more commits
Refactored / reimplemented modules & features:
Additionally, using corpus2 with hashable tokens: Thanks to this fix tokens can be used in dicts (keys) and sets.
Refactored / reimplemented modules & features:
Additionally, using corpus2 with hashable tokens: Thanks to this fix tokens can be used in dicts (keys) and sets.
Grzegorz Kostkowski (0d7b724d) at 28 Feb 10:43
Bump version and update changelog
Grzegorz Kostkowski (fc3c4ffd) at 28 Feb 09:30
Dev version of docs and examples
Grzegorz Kostkowski (fc3c4ffd) at 25 Feb 18:49
Dev version of docs and examples
Grzegorz Kostkowski (adb17b6a) at 25 Feb 18:49
Reimplement and extend functionality of document filter to apply fi...
... and 20 more commits
Grzegorz Kostkowski (adb17b6a) at 25 Feb 18:48
Reimplement and extend functionality of document filter to apply fi...
Grzegorz Kostkowski (683a9321) at 25 Feb 13:43
Crosswiki linking will no longer use wsd tokens
Grzegorz Kostkowski (771fa41b) at 25 Feb 13:42
Minor fix for closing db connector for case when it fails before in...