Skip to content
Snippets Groups Projects
Commit 686e653b authored by Adam Pawlaczek's avatar Adam Pawlaczek
Browse files

Added config

parent 4a9e1351
No related merge requests found
This diff is collapsed.
This diff is collapsed.
angażować 1
bawić 1
borykać 1
bronić 1
buntować 1
chować 1
chwycić 1
chwytać 1
cieszyć 1
cisnąć 1
cofnąć 1
decydować 1
dobijać 1
dobrać 1
doczytać 1
dogadać 1
dokładać 1
dołączać 1
dopominać 1
dopytywać 1
dostać 1
dostosować 1
dostosowywać 1
dowiadywać 1
dowiedzieć 1
dźwignąć 1
fotografować 1
garnąć 1
godzić 1
gotować 1
identyfikować 1
kąpać 1
kłębić 1
kleić 1
kłócić 1
kojarzyć 1
koncentrować 1
konsultować 1
kontaktować 1
kwalifikować 1
kwapić 1
lać 1
łączyć 1
ładować 1
lękać 1
martwić 1
męczyć 1
mieścić 1
mieszać 1
mijać 1
mobilizować 1
modlić 1
mścić 1
nadawać 1
nadziać 1
nakładać 1
nałożyć 1
narażać 1
narazić 1
nastawiać 1
nastawić 1
natknąć 1
niepokoić 1
obrazić 1
obrócić 1
oburzać 1
obwiniać 1
ocierać 1
ocknąć 1
odbić 1
odbijać 1
odbyć 1
odcinać 1
oddalać 1
oderwać 1
odkładać 1
odłączyć 1
odnieść 1
odnosić 1
odróżniać 1
odrywać 1
odsunąć 1
odsuwać 1
odważyć 1
odwołać 1
odwoływać 1
odzywać 1
ograniczać 1
ograniczyć 1
opierać 1
opóźnić 1
oprzeć 1
orientować 1
osiedlić 1
osunąć 1
oswoić 1
otrząsnąć 1
otrzeć 1
ożenić 1
pakować 1
pchać 1
piąć 1
plasować 1
pochylać 1
pochylić 1
poczuwać 1
poderwać 1
podłączyć 1
podwoić 1
pogodzić 1
pokłócić 1
pokusić 1
połączyć 1
porozumieć 1
porozumiewać 1
poskarżyć 1
poślizgnąć 1
pospieszyć 1
postarać 1
postrzelić 1
posunąć 1
posuwać 1
potknąć 1
potykać 1
powiększyć 1
powołać 1
powoływać 1
powstrzymać 1
pozbierać 1
pożegnać 1
przebierać 1
przebrać 1
przechylić 1
przeciągnąć 1
przedostać 1
przedostawać 1
przekładać 1
przekonać 1
przekształcać 1
przekształcić 1
przeliczyć 1
przełożyć 1
przenieść 1
przenosić 1
przepisać 1
przeplatać 1
przerodzić 1
przerzucać 1
przerzucić 1
prześcigać 1
przesunąć 1
przewijać 1
przewrócić 1
przybliżyć 1
przychylać 1
przychylić 1
przyczyniać 1
przyczynić 1
przygotowywać 1
przyjaźnić 1
przykładać 1
przyłączać 1
przyłączyć 1
przyłożyć 1
przymierzać 1
przysiąść 1
przysłuchiwać 1
przytulić 1
przywitać 1
przyznać 1
przyznawać 1
przyzwyczaić 1
przyzwyczajać 1
pukać 1
roić 1
rozbić 1
rozbijać 1
rozchodzić 1
rozciągać 1
rozejść 1
rozjechać 1
rozkręcać 1
rozliczać 1
rozliczyć 1
różnić 1
rozpadać 1
rozpoczynać 1
rozstać 1
rozstawać 1
roztaczać 1
rwać 1
rzucać 1
rzucić 1
sączyć 1
schronić 1
ścigać 1
skarżyć 1
składać 1
skłaniać 1
skoncentrować 1
skontaktować 1
skupiać 1
skupić 1
śmiać 1
solidaryzować 1
specjalizować 1
spierać 1
spieszyć 1
spotkać 1
spotykać 1
spóźnić 1
sprowadzać 1
starać 1
stawić 1
stoczyć 1
stosować 1
stykać 1
szykować 1
toczyć 1
troszczyć 1
trząść 1
uaktywnić 1
ubiegać 1
ubierać 1
ubrać 1
uchronić 1
uchylać 1
ucieszyć 1
udawać 1
ukryć 1
ulokować 1
umawiać 1
umówić 1
unieść 1
unosić 1
uplasować 1
upominać 1
upomnieć 1
uporać 1
urodzić 1
uskarżać 1
uśmiechać 1
uśmiechnąć 1
ustawiać 1
ustosunkować 1
ustosunkowywać 1
utopić 1
utożsamiać 1
utrzymywać 1
uwidocznić 1
uzależnić 1
walić 1
ważyć 1
wbić 1
wbijać 1
wcielić 1
wdać 1
wdawać 1
wedrzeć 1
wiązać 1
wić 1
wkomponować 1
wkraść 1
włączać 1
włączyć 1
włamać 1
wpatrywać 1
wpisać 1
wpisywać 1
wsłuchiwać 1
wspiąć 1
wspinać 1
wstrzymać 1
wstrzymywać 1
wtrącać 1
wybierać 1
wybijać 1
wybrać 1
wychylać 1
wychylić 1
wycofać 1
wycofywać 1
wyczerpać 1
wydarzyć 1
wydłużyć 1
wydobywać 1
wydostać 1
wylać 1
wyłaniać 1
wyleczyć 1
wylewać 1
wymknąć 1
wymykać 1
wynosić 1
wypisać 1
wypowiadać 1
wypowiedzieć 1
wyprowadzić 1
wyrwać 1
wysunąć 1
wysuwać 1
wysypać 1
wywiązać 1
wywiązywać 1
wywodzić 1
wywrócić 1
wzbogacić 1
wzorować 1
zaaklimatyzować 1
zaangażować 1
zabierać 1
zabrać 1
zacząć 1
zaczepić 1
zaczynać 1
zagłębiać 1
zakochać 1
zakwalifikować 1
żalić 1
zaliczać 1
zameldować 1
zamieniać 1
zamienić 1
zamyślić 1
zanurzyć 1
zaopatrywać 1
zapisać 1
zapisywać 1
zapoznać 1
zapoznawać 1
zaprezentować 1
zaprzyjaźnić 1
zarysować 1
zastanawiać 1
zastanowić 1
zbiec 1
zbiegać 1
zbliżać 1
zbliżyć 1
zdać 1
zdecydować 1
zderzyć 1
żegnać 1
zemścić 1
zerwać 1
zetknąć 1
zgadzać 1
zgłaszać 1
zgłosić 1
zgodzić 1
zmagać 1
zmierzyć 1
zmieścić 1
znajdować 1
znęcać 1
zobowiązać 1
zobowiązywać 1
zrehabilitować 1
zrewanżować 1
zrównać 1
zsunąć 1
zwalić 1
związać 1
zwracać 1
zwrócić 1
# Unigram
# orth
U00:%x[-2,0]
U01:%x[-1,0]
U02:%x[0,0]
U03:%x[1,0]
U04:%x[2,0]
U05:%x[-1,0]/%x[0,0]
U06:%x[0,0]/%x[1,0]
# class
U10:%x[-2,1]
U11:%x[-1,1]
U12:%x[0,1]
U13:%x[1,1]
U14:%x[2,1]
U15:%x[-2,1]/%x[-1,1]
U16:%x[-1,1]/%x[0,1]
U17:%x[0,1]/%x[1,1]
U18:%x[1,1]/%x[2,1]
# cas
U20:%x[-2,2]
U21:%x[-1,2]
U22:%x[0,2]
U23:%x[1,2]
U24:%x[2,2]
# gnd
U30:%x[-2,3]
U31:%x[-1,3]
U32:%x[0,3]
U33:%x[1,3]
U34:%x[2,3]
# nmb
U40:%x[-2,4]
U41:%x[-1,4]
U42:%x[0,4]
U43:%x[1,4]
U44:%x[2,4]
# agr
U50:%x[-1,5] # agr(0,1) -> agr(-1,0)
U51:%x[0,5] # agr(0,1)
U52:%x[-1,6] # agr..(-1,1) -> agr(-2,0)
U53:%x[0,6] # (-1,1)
U54:%x[1,6] # ... -> (0,2)
# regex feats
#U60:%x[-1,7]/%x[-1,8]
U61:%x[0,7]/%x[0,8]
#U62:%x[1,7]/%x[1,8]
# wordclass trigrams
U80:%x[-2,1]/%x[-1,1]/%x[0,1]
U81:%x[-1,1]/%x[0,1]/%x[1,1]
U82:%x[0,1]/%x[1,1]/%x[2,1]
# Bigram
B
# Unigram
# orth
U00:%x[-2,0]
U01:%x[-1,0]
U02:%x[0,0]
U03:%x[1,0]
U04:%x[2,0]
U05:%x[-1,0]/%x[0,0]
U06:%x[0,0]/%x[1,0]
# class
U10:%x[-2,1]
U11:%x[-1,1]
U12:%x[0,1]
U13:%x[1,1]
U14:%x[2,1]
U15:%x[-2,1]/%x[-1,1]
U16:%x[-1,1]/%x[0,1]
U17:%x[0,1]/%x[1,1]
U18:%x[1,1]/%x[2,1]
# cas
U20:%x[-2,2]
U21:%x[-1,2]
U22:%x[0,2]
U23:%x[1,2]
U24:%x[2,2]
# gnd
U30:%x[-2,3]
U31:%x[-1,3]
U32:%x[0,3]
U33:%x[1,3]
U34:%x[2,3]
# nmb
U40:%x[-2,4]
U41:%x[-1,4]
U42:%x[0,4]
U43:%x[1,4]
U44:%x[2,4]
# agr
U50:%x[-1,5] # agr(0,1) -> agr(-1,0)
U51:%x[0,5] # agr(0,1)
U52:%x[-1,6] # agr..(-1,1) -> agr(-2,0)
U53:%x[0,6] # (-1,1)
U54:%x[1,6] # ... -> (0,2)
# regex feats
#U60:%x[-1,7]/%x[-1,8]
U61:%x[0,7]/%x[0,8]
#U62:%x[1,7]/%x[1,8]
# wordclass trigrams
U80:%x[-2,1]/%x[-1,1]/%x[0,1]
U81:%x[-1,1]/%x[0,1]/%x[1,1]
U82:%x[0,1]/%x[1,1]/%x[2,1]
# Bigram
B
import("dict-case.lex", "case")
import("dict-prep.lex", "prep")
import("dict-sie.lex", "sie")
@ "default" (
orth[0]; // 0
class[0]; // 1
cas[0]; // 2
gnd[0]; // 3
nmb[0]; // 4
agrpp(0,1,{nmb,gnd,cas}); // 5
and(inside(-1), inside(1), wagr(-1,1,{nmb,gnd,cas})); // 6
regex(orth[0], "\\P{Ll}.*"); regex(orth[0], "\\P{Lu}.*"); // 7, 8
and(
equal(cas[0],{gen}),
llook(-1, begin, $var, in(class[$var], {pact, ppas, ger, bedzie, comp, fin, imps, impt, inf, pcon, pant, praet, winien})),
in(class[$var], {pact, ppas, ger}),
in(["gen"], lex(base[$var], "case"))
); //9
and(
equal(cas[0],{dat}),
llook(-1, begin, $var, in(class[$var], {pact, ppas, ger, bedzie, comp, fin, imps, impt, inf, pcon, pant, praet, winien})),
in(class[$var], {pact, ppas, ger}),
in(["dat"], lex(base[$var], "case"))
); //10
and(
equal(cas[0],{acc}),
llook(-1, begin, $var, in(class[$var], {pact, ppas, ger, bedzie, comp, fin, imps, impt, inf, pcon, pant, praet, winien})),
in(class[$var], {pact, ppas, ger}),
in(["acc"], lex(base[$var], "case"))
); //11
and(
equal(cas[0],{inst}),
llook(-1, begin, $var, in(class[$var], {pact, ppas, ger, bedzie, comp, fin, imps, impt, inf, pcon, pant, praet, winien})),
in(class[$var], {pact, ppas, ger}),
in(["inst"], lex(base[$var], "case"))
); //12
and(
equal(cas[0],{loc}),
llook(-1, begin, $var, in(class[$var], {pact, ppas, ger, bedzie, comp, fin, imps, impt, inf, pcon, pant, praet, winien})),
in(class[$var], {pact, ppas, ger}),
in(["loc"], lex(base[$var], "case"))
); //13
and(
equal(class[0],{prep}),
llook(-1, begin, $var, in(class[$var], {pact, ppas, ger, bedzie, comp, fin, imps, impt, inf, pcon, pant, praet, winien})),
in(class[$var], {pact, ppas, ger}),
in(base[0], lex(base[$var], "prep"))
); //14
/* Z lemmatyzacji */
lower(orth[0]); // 15
lower(affix(orth[0], -1)); // 16
lower(affix(orth[0], -2)); // 17
lower(affix(orth[0], -3)); // 18
affix(orth[0], 1); // 19
affix(orth[0], 2); // 20
affix(orth[0], 3); // 21
if(rlook(0, end, $S, inter({subst,ger,depr,ppron3,ppron12}, class[$S])), cas[$S]); //22
if(llook(0, begin, $S, inter({subst,ger,depr,ppron3,ppron12}, class[$S])), cas[$S]); //23
if(
not(and(rlook(0, end, $S, inter({subst,ger,depr,ppron3,ppron12}, class[$S])),
rlook(0, $S, $P,
not(setvar($s:Prep, union($s:Prep, if(inter(class[$P], {prep}), base[$P]))))
))),
$s:Prep
); //24
if(
not(and(
llook(-1, begin, $S, inter({subst,ger,depr,ppron3,ppron12}, class[$S])),
llook(0, $S, $P,
not(setvar($s:Prep, union($s:Prep, if(inter(class[$P], {prep}), base[$P]))))
))),
$s:Prep
); //25
if(
rlook(0, end, $V, inter({fin,praet,bedzie,inf,imps,pred,winien},class[$V])),
class[$V]
); //26
if(
llook(0, begin, $V, inter({fin,praet,bedzie,inf,imps,pred,winien},class[$V])),
class[$V]
); //27
if(
rlook(0, end, $V, inter({fin,praet,bedzie,inf,imps,pred,winien},class[$V])),
base[$V]
); //28
if(
llook(0, begin, $V, inter({fin,praet,bedzie,inf,imps,pred,winien},class[$V])),
base[$V]
); //29
if(
rlook(0, end, $V, or(inter(orth[$V], [",","(",")"]), inter({fin,praet,bedzie,inf,imps,pred,winien, subst,ger,depr,ppron3,ppron12,comp,conj},class[$V]))),
if(inter({subst,ger,depr,ppron3,ppron12},class[$V]), "noun",
if(inter({fin,praet,bedzie,inf,imps,pred,winien}, class[$V]), "verb")
)
); //30
if(
llook(0, begin, $V, or(inter(orth[$V], [",","(",")"]), inter({fin,praet,bedzie,inf,imps,pred,winien, subst,ger,depr,ppron3,ppron12,comp,conj},class[$V]))),
if(inter({subst,ger,depr,ppron3,ppron12},class[$V]), "noun",
if(inter({fin,praet,bedzie,inf,imps,pred,winien}, class[$V]), "verb")
)
) //31
)
/*
@ "layer2" (
isannpart(0, "chunk_agp") // 9
)
*/
; Configuration for chunking phrases defined in KPWr, assuming NKJP tagset.
;
; Syntactic chunks are divided into two "layers".
; 1. Pred-arg chunks:
; * chunk_np (noun phrases),
; * chunk_adjp (top-level adjective phrases),
; * chunk_vp (verb phrases without nominal arguments).
; 2. Low-level phrases based on agreement:
; * chunk_agp (simple agreement-based noun or adj phrases).
;
; Chunks in one layer are disjoint (if they would overlap in the training data,
; a warning would be issued during training, while the resulting chunker
; will not produce any overlaps between one-layer chunks anyway).
; The chunker is unable to annotate discontinuous chunks. If such cases
; appear in the training data (which is the case in KPWr), each continuous
; part is treated as a separate chunk. Note that it may be altered in the
; future.
; The chunker is also unable to recognise heads. They may be annotated after
; chunking with a dedicated script.
[general]
tagset = nkjp
tagged = yes
[layers]
; the layer ordering is inferred from alphabetical order of their names!
; channel names should contain no hyphens
;layer1 = chunk_agp
layer2 = chunk_vp,chunk_np,chunk_adjp
[crf]
params = -a CRF-L2
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment