Skip to content
Snippets Groups Projects
Commit fecd8785 authored by Paweł Walkowiak's avatar Paweł Walkowiak
Browse files

Merge branch 'test_de_json2lemmas' into 'master'

Add integration test for json2lemmas for lang != pl

See merge request !7
parents c23d5e0f 65d29514
Branches
1 merge request!7Add integration test for json2lemmas for lang != pl
Pipeline #10390 passed with stages
in 1 minute and 27 seconds
......@@ -7,7 +7,9 @@
"post_any2txt": {"task": ["any2txt", {"postagger": {"lang": "en", "output": "json"}}], "input": "post_spacy_input", "expected": "post_spacy_expected.json"},
"postagger_lone_lemmas": {"task": [{"postagger": {"lang": "pl", "output": "lemmas"}}], "input": "post_postagger_input", "expected": "post_postagger_input_lemmas"},
"postagger_lone_lemmas_pl": {"task": [{"postagger": {"lang": "pl", "output": "lemmas"}}], "input": "post_postagger_input", "expected": "post_postagger_input_lemmas"},
"postagger_lone_lemmas_de": {"task": [{"postagger": {"lang": "de", "output": "lemmas"}}], "input": "deutsch.txt", "expected": "deutsch_lemmas.txt"},
"ner_for_pl": {"task": [{"postagger": {"lang": "pl", "output": "json", "method": "ner"}}], "input": "post_postagger_input", "expected": "ner_for_pl.json"},
......
der Germanistik erforschen -- dokumentieren und vermitteln der deutsch Sprache und Literatur in ihr historisch und gegenwärtig Form -- der Inventar der deutsch Sprache umfas gegen Ende der 20. Jahrhundert etwa 500.000 Wort -- wobei der tatsächlich Anzahl von der Auswertungsmethodik abhängen -- etwa ob -- Buch -- und -- Buch -- als ein Wort oder als zwei Wort zählen werden --
Die Germanistik erforscht, dokumentiert und vermittelt die deutsche Sprache und Literatur in ihren historischen und gegenwärtigen Formen. Das Inventar der deutschen Sprache umfasste gegen Ende des 20. Jahrhunderts etwa 500.000 Wörter, wobei die tatsächliche Anzahl von der Auswertungsmethodik abhängt – etwa ob "Buch" und "Bücher" als ein Wort oder als zwei Wörter gezählt werden.
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment