Sentence/chunk generators - fix

72657010 · Piotr Wątorski · d46fe12a · 72657010
Commit 72657010 authored Jun 3, 2020 by Piotr Wątorski
--- a/cclutils/_base.py
+++ b/cclutils/_base.py
@@ -162,13 +162,14 @@ def get_tagset(tagset):
 def read_chunks_it(filepath, tagset='nkjp'):
-""" Returns a iterable sentence generator.
+""" Returns a iterable chunk generator.
    Args:
        filepath: a path to CCL file
        tagset: the name of the tagset that is used in the document or a tagset object itself.
-    Returns:                                                                                                                                                                                                                                         a iterable sentence generator.                                                                                                                                                                                                       
+    Returns:
+        a iterable chunk generator.
    """
    tagset = get_tagset(tagset)
    reader = corpus2.TokenReader_create_path_reader('ccl', tagset, filepath)
@@ -176,10 +177,9 @@ def read_chunks_it(filepath, tagset='nkjp'):
    while True:
        chunk = reader.get_next_chunk()
-        if chunk:
+        if not chunk:
-            yield chunk
-        else:
            break
+        yield chunk
    del reader
@@ -201,10 +201,9 @@ def read_sentences_it(filepath, tagset='nkjp'):
    while True:
        sentence = reader.get_next_sentence()
-        if sentence:
+        if not sentence:
-            yield sentence
-        else:
            break
+        yield sentence
    del reader