From a02cdd275af75fa9e5e337188dfed8ae09b88a87 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Marcin=20W=C4=85troba?= <markowanga@gmail.com>
Date: Wed, 27 Apr 2022 07:47:27 +0200
Subject: [PATCH] Add LUNA processing

---
 .gitignore                                    |    2 +
 .idea/asr-benchmarks.iml                      |    2 +-
 .idea/misc.xml                                |    2 +-
 examples/import_dataset/luna/import_luna.py   |    7 +-
 examples/luna/__init__.py                     |    1 +
 examples/luna/load_datasource_luna.py         |    5 +
 .../luna/luna_gold_transcript_processor.py    |   33 +
 examples/luna/luna_main.py                    |   92 +
 examples/luna/luna_record_provider.py         |   35 +
 examples/luna/pos.ipynb                       | 4255 +++++++++++++++++
 examples/luna/pos_processing/__init__.py      |    0
 .../asr_spacy_token_pos_processing_task.py    |   24 +
 ...nscript_spacy_token_pos_processing_task.py |   24 +
 .../spacy_pos_wer_processing_task.py          |   85 +
 .../spacy_token_pos_processing_task.py        |   58 +
 poetry.lock                                   |   18 +-
 pyproject.toml                                |    1 +
 sziszapangma/.DS_Store                        |  Bin 6148 -> 6148 bytes
 ...ached_embedding_transformer.cpython-38.pyc |  Bin 1923 -> 1986 bytes
 .../__pycache__/asr_processor.cpython-38.pyc  |  Bin 1471 -> 2207 bytes
 .../experiment_manager.cpython-38.pyc         |  Bin 1211 -> 1362 bytes
 sziszapangma/integration/asr_processor.py     |   22 +-
 .../integration/experiment_manager.py         |    2 +
 .../experiment_repository.cpython-38.pyc      |  Bin 2351 -> 2151 bytes
 ...mongo_experiment_repository.cpython-38.pyc |  Bin 3189 -> 2958 bytes
 .../repository/experiment_repository.py       |    4 -
 .../repository/file_experiment_repository.py  |   13 -
 .../repository/minio_experiment_repository.py |   63 +
 .../repository/mongo_experiment_repository.py |    4 -
 .../multi_files_experiment_repository.py      |   61 +
 .../multiple_experiment_repository.py         |   39 +
 .../task/__pycache__/asr_task.cpython-38.pyc  |  Bin 1752 -> 2149 bytes
 .../classic_wer_metric_task.cpython-38.pyc    |  Bin 2835 -> 3429 bytes
 .../embedding_wer_metrics_task.cpython-38.pyc |  Bin 3078 -> 3627 bytes
 .../processing_task.cpython-38.pyc            |  Bin 1769 -> 2207 bytes
 .../integration/task/gold_transcript_task.py  |   35 +
 36 files changed, 4860 insertions(+), 27 deletions(-)
 create mode 100644 examples/luna/__init__.py
 create mode 100644 examples/luna/load_datasource_luna.py
 create mode 100644 examples/luna/luna_gold_transcript_processor.py
 create mode 100644 examples/luna/luna_main.py
 create mode 100644 examples/luna/luna_record_provider.py
 create mode 100644 examples/luna/pos.ipynb
 create mode 100644 examples/luna/pos_processing/__init__.py
 create mode 100644 examples/luna/pos_processing/asr_spacy_token_pos_processing_task.py
 create mode 100644 examples/luna/pos_processing/gold_transcript_spacy_token_pos_processing_task.py
 create mode 100644 examples/luna/pos_processing/spacy_pos_wer_processing_task.py
 create mode 100644 examples/luna/pos_processing/spacy_token_pos_processing_task.py
 create mode 100644 sziszapangma/integration/repository/minio_experiment_repository.py
 create mode 100644 sziszapangma/integration/repository/multi_files_experiment_repository.py
 create mode 100644 sziszapangma/integration/repository/multiple_experiment_repository.py
 create mode 100644 sziszapangma/integration/task/gold_transcript_task.py

diff --git a/.gitignore b/.gitignore
index 6ed7d72..10f676d 100644
--- a/.gitignore
+++ b/.gitignore
@@ -109,3 +109,5 @@ ENV/
 
 debug_run/
 publish_to_theliver.sh
+
+.idea
diff --git a/.idea/asr-benchmarks.iml b/.idea/asr-benchmarks.iml
index 816680e..8e8eecc 100644
--- a/.idea/asr-benchmarks.iml
+++ b/.idea/asr-benchmarks.iml
@@ -4,7 +4,7 @@
     <content url="file://$MODULE_DIR$">
       <excludeFolder url="file://$MODULE_DIR$/venv" />
     </content>
-    <orderEntry type="jdk" jdkName="Poetry (asr-benchmarks) (2)" jdkType="Python SDK" />
+    <orderEntry type="jdk" jdkName="Python 3.8 (asr-benchmarks)" jdkType="Python SDK" />
     <orderEntry type="sourceFolder" forTests="false" />
   </component>
   <component name="PyDocumentationSettings">
diff --git a/.idea/misc.xml b/.idea/misc.xml
index 060748f..65f24ff 100644
--- a/.idea/misc.xml
+++ b/.idea/misc.xml
@@ -1,4 +1,4 @@
 <?xml version="1.0" encoding="UTF-8"?>
 <project version="4">
-  <component name="ProjectRootManager" version="2" project-jdk-name="Poetry (asr-benchmarks) (2)" project-jdk-type="Python SDK" />
+  <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.8 (asr-benchmarks)" project-jdk-type="Python SDK" />
 </project>
\ No newline at end of file
diff --git a/examples/import_dataset/luna/import_luna.py b/examples/import_dataset/luna/import_luna.py
index cd07f7d..3038632 100644
--- a/examples/import_dataset/luna/import_luna.py
+++ b/examples/import_dataset/luna/import_luna.py
@@ -1,3 +1,4 @@
+from pprint import pprint
 from typing import Tuple, List
 from xml.etree import ElementTree
 
@@ -167,7 +168,7 @@ class LunaAdapter:
 
 
 if __name__ == "__main__":
-    luna_directory = '/Users/marcinwatroba/Desktop/asr_datasets/LUNA/LUNA.PL'
+    luna_directory = '/Users/marcinwatroba/Desktop/LUNA/LUNA.PL'
     luna_record_provider = LunaRecordProvider(ExtensionPathFilter(
         root_directory=luna_directory,
         extension='wav'
@@ -177,4 +178,6 @@ if __name__ == "__main__":
         document = [itt for itt in relation_manager.get_all_items() if itt['type'] == 'Document'][0]
         document_words = [relation_manager.get_item_by_id(item_id)
                           for item_id in document['word_ids']]
-        print(document_words)
+        all_relations = relation_manager.get_all_relations_for_item(document_words[0]['id'])
+        ids = [it['second_id'] for it in all_relations if it['second_type'] in ['lemma', 'pos']]
+        pprint([relation_manager.get_item_by_id(it) for it in ids])
diff --git a/examples/luna/__init__.py b/examples/luna/__init__.py
new file mode 100644
index 0000000..8b13789
--- /dev/null
+++ b/examples/luna/__init__.py
@@ -0,0 +1 @@
+
diff --git a/examples/luna/load_datasource_luna.py b/examples/luna/load_datasource_luna.py
new file mode 100644
index 0000000..062a6c8
--- /dev/null
+++ b/examples/luna/load_datasource_luna.py
@@ -0,0 +1,5 @@
+from lhotse import AudioSource, SupervisionSegment
+
+
+def load_single_datasource(path: str) -> AudioSource:
+    return AudioSource('file', [1], path)
diff --git a/examples/luna/luna_gold_transcript_processor.py b/examples/luna/luna_gold_transcript_processor.py
new file mode 100644
index 0000000..b3d508a
--- /dev/null
+++ b/examples/luna/luna_gold_transcript_processor.py
@@ -0,0 +1,33 @@
+from typing import List, Dict
+
+# from examples.luna.luna_record_provider import LunaRecordProvider
+from examples.luna.luna_record_provider import LunaRecordProvider
+from sziszapangma.integration.gold_transcript_processor import GoldTranscriptProcessor
+from sziszapangma.model.relation_manager import RelationManager
+
+
+class LunaGoldTranscriptProcessor(GoldTranscriptProcessor):
+    _record_provider: LunaRecordProvider
+
+    def __init__(self, record_provider: LunaRecordProvider):
+        self._record_provider = record_provider
+
+    def parse_word(self, word, relation_manager: RelationManager):
+        # print(word)
+        all_relations = relation_manager.get_all_relations_for_item(word['id'])
+        pos_id = [it['second_id'] for it in all_relations if it['second_type'] in ['pos']][0]
+        return {
+            'id': word['id'],
+            'word': word['text'],
+            'pos': relation_manager.get_item_by_id(pos_id)['value']
+        }
+
+    def get_gold_transcript(self, record_id: str) -> List[Dict[str, any]]:
+        relation_manager = self._record_provider.get_relation_manager(record_id)
+        document = [itt for itt in relation_manager.get_all_items() if itt['type'] == 'Document'][0]
+        document_words = [relation_manager.get_item_by_id(item_id)
+                          for item_id in document['word_ids']]
+        return [
+            self.parse_word(word, relation_manager)
+            for word in document_words
+        ]
diff --git a/examples/luna/luna_main.py b/examples/luna/luna_main.py
new file mode 100644
index 0000000..98684c5
--- /dev/null
+++ b/examples/luna/luna_main.py
@@ -0,0 +1,92 @@
+from examples.luna.luna_gold_transcript_processor import LunaGoldTranscriptProcessor
+from examples.luna.luna_record_provider import LunaRecordProvider
+from examples.luna.pos_processing.asr_spacy_token_pos_processing_task import \
+    AsrSpacyTokenPosProcessingTask
+from examples.luna.pos_processing.gold_transcript_spacy_token_pos_processing_task import \
+    GoldTranscriptSpacyTokenPosProcessingTask
+from examples.luna.pos_processing.spacy_pos_wer_processing_task import SpacyPosWerProcessingTask
+from sziszapangma.integration.asr_processor import AsrPathCacheClient
+from sziszapangma.integration.experiment_manager import ExperimentManager
+from sziszapangma.integration.path_filter import ExtensionPathFilter
+from sziszapangma.integration.repository.experiment_repository import ExperimentRepository
+from sziszapangma.integration.repository.multi_files_experiment_repository import \
+    MultiFilesExperimentRepository
+from sziszapangma.integration.task.asr_task import AsrTask
+from sziszapangma.integration.task.classic_wer_metric_task import ClassicWerMetricTask
+from sziszapangma.integration.task.gold_transcript_task import GoldTranscriptTask
+
+LUNA_DIRECTORY = '/Users/marcinwatroba/Desktop/LUNA/LUNA.PL'
+GOLD_TRANSCRIPT = 'gold_transcript'
+TECHMO_POLISH_ASR = 'techmo_polish_asr'
+TECHMO_POLISH_CLASSIC_WER_METRIC = 'techmo_polish_classic_wer_metric'
+TECHMO_POLISH_CLASSIC_ALIGNMENT = 'techmo_polish_classic_alignment'
+TECHMO_SPACY = 'techmo_spacy'
+GOLD_TRANSCRIPT_SPACY = 'gold_transcript_spacy'
+POS_ALIGNMENT_WER = 'pos_alignment_wer'
+POS_METRICS_WER = 'pos_metrics_wer'
+
+
+def run_luna_experiment(experiment_repository: ExperimentRepository):
+    record_provider = LunaRecordProvider(ExtensionPathFilter(
+        root_directory=LUNA_DIRECTORY,
+        extension='wav'
+    ))
+    experiment_processor = ExperimentManager(
+        record_id_iterator=record_provider,
+        processing_tasks=[
+            GoldTranscriptTask(
+                task_name='gold_transcript_task',
+                gold_transcript_processor=LunaGoldTranscriptProcessor(record_provider),
+                gold_transcript_property_name=GOLD_TRANSCRIPT,
+                require_update=False
+            ),
+            AsrTask(
+                task_name='techmo_polish_task',
+                # asr_processor=AsrWebClient('http://192.168.0.124:4999/process_asr', 'test1234'),
+                asr_processor=AsrPathCacheClient(),
+                asr_property_name=TECHMO_POLISH_ASR,
+                require_update=False,
+                record_path_provider=record_provider
+            ),
+            ClassicWerMetricTask(
+                task_name='classic_wer_metric_task',
+                asr_property_name=TECHMO_POLISH_ASR,
+                gold_transcript_property_name=GOLD_TRANSCRIPT,
+                metrics_property_name=TECHMO_POLISH_CLASSIC_WER_METRIC,
+                require_update=False,
+                alignment_property_name=TECHMO_POLISH_CLASSIC_ALIGNMENT
+            ),
+            GoldTranscriptSpacyTokenPosProcessingTask(
+                task_name='gold_transcript_spacy_task',
+                input_property_name=GOLD_TRANSCRIPT,
+                spacy_property_name=GOLD_TRANSCRIPT_SPACY,
+                require_update=True
+            ),
+            AsrSpacyTokenPosProcessingTask(
+                task_name='techmo_spacy_task',
+                input_property_name=TECHMO_POLISH_ASR,
+                spacy_property_name=TECHMO_SPACY,
+                require_update=True
+            ),
+            SpacyPosWerProcessingTask(
+                task_name='PosWerProcessor',
+                require_update=False,
+                gold_transcript_pos_property_name=GOLD_TRANSCRIPT_SPACY,
+                asr_pos_property_name=TECHMO_SPACY,
+                pos_alignment_wer=POS_ALIGNMENT_WER,
+                pos_metrics_wer=POS_METRICS_WER
+            )
+        ],
+        experiment_repository=experiment_repository,
+        relation_manager_provider=record_provider
+    )
+    experiment_processor.process()
+
+
+def example_run():
+    experiment_repository = MultiFilesExperimentRepository('experiment_data', 'asr_benchmark_luna')
+    run_luna_experiment(experiment_repository)
+
+
+if __name__ == '__main__':
+    example_run()
diff --git a/examples/luna/luna_record_provider.py b/examples/luna/luna_record_provider.py
new file mode 100644
index 0000000..aa0f30a
--- /dev/null
+++ b/examples/luna/luna_record_provider.py
@@ -0,0 +1,35 @@
+from typing import Dict, Set
+
+from sziszapangma.integration.path_filter import PathFilter
+from sziszapangma.integration.record_id_iterator import RecordIdIterator
+from sziszapangma.integration.record_path_provider import RecordPathProvider
+from sziszapangma.integration.relation_manager_provider import RelationManagerProvider
+from sziszapangma.model.relation_manager import RelationManager, FileRelationManager
+
+
+class LunaRecordProvider(RecordIdIterator, RecordPathProvider, RelationManagerProvider):
+    _path_by_id: Dict[str, str]
+
+    def __init__(self, path_filter: PathFilter):
+        self._path_by_id = dict({
+            self._get_id(it): it
+            for it in path_filter.get_list_of_files()
+        })
+
+    def get_all_records(self) -> Set[str]:
+        return set(self._path_by_id.keys())
+
+    def get_path(self, record_id: str) -> str:
+        return self._path_by_id[record_id]
+
+    def get_item_file_path(self, record_id: str, file) -> str:
+        return self._path_by_id[record_id]
+
+    def get_relation_manager(self, record_id: str) -> RelationManager:
+        basic_path = self.get_path(record_id)[:-4]
+        return FileRelationManager(f'{basic_path}_ab_relations.csv', f'{basic_path}_ab_items.json')
+
+    @staticmethod
+    def _get_id(record_file_path: str) -> str:
+        path = record_file_path.replace('.wav', '')
+        return '/'.join(path.split('/')[-6:]).replace('/', '__')
diff --git a/examples/luna/pos.ipynb b/examples/luna/pos.ipynb
new file mode 100644
index 0000000..b744f9f
--- /dev/null
+++ b/examples/luna/pos.ipynb
@@ -0,0 +1,4255 @@
+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": 20,
+   "id": "4256d3f1-62cd-44c2-b4c9-3eb9df2c751d",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from luna_record_provider_new import LunaRecordProvider\n",
+    "from sziszapangma.integration.experiment_manager import ExperimentManager\n",
+    "from sziszapangma.integration.repository.multi_files_experiment_repository import MultiFilesExperimentRepository\n",
+    "from sziszapangma.integration.path_filter import ExtensionPathFilter\n",
+    "from pymongo import MongoClient\n",
+    "from spacy.tokens.doc import Doc\n",
+    "import pandas as pd"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 21,
+   "id": "bbe2a7bf-bb6d-42ee-b5ce-48e6ec7fcd94",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "luna_directory = '/Users/marcinwatroba/Desktop/LUNA/LUNA.PL'"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 22,
+   "id": "4dec626b-02e4-4c78-a238-04ef2f090ea5",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "experiment_repository = MultiFilesExperimentRepository('experiment_data', 'asr_benchmark_luna')"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 23,
+   "id": "98c6ff1d-4fbd-4b68-9e23-ecea33852b12",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "record_provider = LunaRecordProvider(ExtensionPathFilter(\n",
+    "    root_directory=luna_directory,\n",
+    "    extension='wav'\n",
+    "))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 24,
+   "id": "d7dd603d-2335-4bc5-9a26-bd7efa916c96",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "record_id = list(record_provider.get_all_records())[0]"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 25,
+   "id": "0ca138ff-199d-4018-84a6-758ebdfa4ffa",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "{'classic_wer': 0.19727891156462585}"
+      ]
+     },
+     "execution_count": 25,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "experiment_repository.get_property_for_key(record_id, 'pos_metrics_wer')"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 26,
+   "id": "1426bc16-1598-47a6-bdfc-3e2d59b80331",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "pos_alignment_wer = experiment_repository.get_property_for_key(record_id, 'pos_alignment_wer')\n",
+    "gold_transcript_spacy = experiment_repository.get_property_for_key(record_id, 'gold_transcript_spacy')\n",
+    "gold_trnascript_spacy_word_dict = {it['id']: it['word'] for it in gold_transcript_spacy}\n",
+    "asr_spacy = experiment_repository.get_property_for_key(record_id, 'techmo_spacy')\n",
+    "asr_spacy_word_dict = {it['id']: it['word'] for it in asr_spacy}"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 27,
+   "id": "60269a31-2d10-4cfa-9153-f2b1979941ec",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>143</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>144</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>145</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>146</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>147</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>148 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    DELETION               PRON                 xxx                       \n",
+       "1     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "2     CORRECT                ADJ               dobry                 ADJ   \n",
+       "3     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "4     CORRECT                ADJ               dobry                 ADJ   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "143  DELETION               NOUN            widzenia                       \n",
+       "144   CORRECT               VERB              proszÄ™                VERB   \n",
+       "145   CORRECT                ADV              bardzo                 ADV   \n",
+       "146  DELETION                ADP                  do                       \n",
+       "147   CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                         \n",
+       "1                  dzieÅ„  \n",
+       "2                  dobry  \n",
+       "3                  dzieÅ„  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "143                       \n",
+       "144               proszÄ™  \n",
+       "145               bardzo  \n",
+       "146                       \n",
+       "147             widzenia  \n",
+       "\n",
+       "[148 rows x 5 columns]"
+      ]
+     },
+     "execution_count": 27,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "arr = [\n",
+    "    {\n",
+    "        'step_type': it['step_type'],\n",
+    "        'reference_word_pos': it['step_words']['reference_word']['text'] if 'reference_word' in it['step_words'] else '',\n",
+    "        'reference_word_text': gold_trnascript_spacy_word_dict[it['step_words']['reference_word']['id']] \n",
+    "        if 'reference_word' in it['step_words'] else '',\n",
+    "        'hypothesis_word_pos': it['step_words']['hypothesis_word']['text'] if 'hypothesis_word' in it['step_words'] else '',\n",
+    "        'hypothesis_word_text': asr_spacy_word_dict[it['step_words']['hypothesis_word']['id']] \n",
+    "        if 'hypothesis_word' in it['step_words'] else ''\n",
+    "\n",
+    "    }\n",
+    "    for it in pos_alignment_wer\n",
+    "]\n",
+    "pd.DataFrame(arr)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 47,
+   "id": "74bf17ba-8572-4758-8116-794708b6ea08",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def get_gold_transcript_for(record_id: str) -> str:\n",
+    "    gold_trnascript_property = experiment_repository.get_property_for_key(record_id, 'gold_transcript')\n",
+    "    return ' '.join([it['word'] for it in gold_trnascript_property])\n",
+    "\n",
+    "def get_asr_transcript_for(record_id: str) -> str:\n",
+    "    gold_trnascript_property = experiment_repository.get_property_for_key(record_id, 'techmo_polish_asr')\n",
+    "    return gold_trnascript_property['full_text']\n",
+    "\n",
+    "def get_pos_alignment_df(record_id: str) -> pd.DataFrame:\n",
+    "    pos_alignment_wer = experiment_repository.get_property_for_key(record_id, 'pos_alignment_wer')\n",
+    "    gold_transcript_spacy = experiment_repository.get_property_for_key(record_id, 'gold_transcript_spacy')\n",
+    "    gold_trnascript_spacy_word_dict = {it['id']: it['word'] for it in gold_transcript_spacy}\n",
+    "    asr_spacy = experiment_repository.get_property_for_key(record_id, 'techmo_spacy')\n",
+    "    asr_spacy_word_dict = {it['id']: it['word'] for it in asr_spacy}\n",
+    "    \n",
+    "    arr = [\n",
+    "        {\n",
+    "            'step_type': it['step_type'],\n",
+    "            'reference_word_pos': it['step_words']['reference_word']['text'] if 'reference_word' in it['step_words'] else '',\n",
+    "            'reference_word_text': gold_trnascript_spacy_word_dict[it['step_words']['reference_word']['id']] \n",
+    "            if 'reference_word' in it['step_words'] else '',\n",
+    "            'hypothesis_word_pos': it['step_words']['hypothesis_word']['text'] if 'hypothesis_word' in it['step_words'] else '',\n",
+    "            'hypothesis_word_text': asr_spacy_word_dict[it['step_words']['hypothesis_word']['id']] \n",
+    "            if 'hypothesis_word' in it['step_words'] else ''\n",
+    "\n",
+    "        }\n",
+    "        for it in pos_alignment_wer\n",
+    "    ]\n",
+    "    return pd.DataFrame(arr)\n",
+    "    \n",
+    "    \n",
+    "def show_report_for(record_id: str):\n",
+    "    print(f'gold transcript: {get_gold_transcript_for(record_id)}')    \n",
+    "    print()\n",
+    "    print(f'asr transcript: {get_asr_transcript_for(record_id)}')\n",
+    "    print()\n",
+    "    print(f\"word wer {experiment_repository.get_property_for_key(record_id, 'techmo_polish_classic_wer_metric')}\")\n",
+    "    print()\n",
+    "    print(f\"pos wer {experiment_repository.get_property_for_key(record_id, 'pos_metrics_wer')}\")\n",
+    "    print()\n",
+    "    display(get_pos_alignment_df(record_id))\n",
+    "    print('--------------------------------------------------------------')\n",
+    "    print('--------------------------------------------------------------')\n",
+    "    print('--------------------------------------------------------------')"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 48,
+   "id": "3395e091-3488-4b49-aede-af15a0055a8b",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "gold transcript: xxx dzieÅ„ dobry dzieÅ„ dobry proszÄ™ pana mam takie pytanie jestem emerytkÄ… i chcÄ™ se kupiÄ‡ miesiÄ™czny bilet to ile za jakie muszÄ™ czy sto procent pÅ‚aciÄ‡ czy poÅ‚Ã³wkÄ™ a nie ma pani jeszcze siedemdziesiÄ™ciu lat no nie mam proszÄ™ pani jeÅ›li jest pani emerytkÄ… to na podstawie legitymacji emery~ emeryta i rencisty i dokumentu toÅ¼samoÅ›ci jest ulga czterdzieÅ›ci osiem procent czterdzieÅ›ci osiem procent tak a teraz niech pan mi powie jak ja chcÄ™ kupiÄ‡ sobie bilet miesiÄ™czny na tÄ… eskaemkÄ™ to ile ale pani chce tylko na eskaemkÄ™ ? na eskaemkÄ™ i na tramwaje aha a bÄ™dzie pani jeÅºdziÅ‚a eskaemkÄ… dokÄ…d ? z Pruszkowa do Warszawy aha czyli musiaÅ‚aby pani se taki na trzydzieÅ›ci dni by kosztowaÅ‚ paniÄ… czterdzieÅ›ci szeÅ›Ä‡ osiemdziesiÄ…t czterdzieÅ›ci szeÅ›Ä‡ osiemdziesiÄ…t to taki bilet bym tak to siÄ™ nazywa bilet sieciowy imienny bilet sieciowy dziÄ™kujÄ™ bardzo do widzenia proszÄ™ bardzo do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry dzieÅ„ dobry proszÄ™ pana ja mam takie pytanie jestem emerytkÄ… i chcÄ™ se kupiÄ‡ miesiÄ™czny bilet to ile za jakie muszÄ™ czy co czy poÅ‚Ã³wkÄ™ a nie ma pani jeszcze siedemdziesiÄ™ciu lat no nie mam proszÄ™ pani jeÅ›li jest pani emerytkÄ… to na podstawie legitymacji emery emeryta i rencisty i dokumentu toÅ¼samoÅ›ci jest ulga 48 procent tak a teraz niech pan mi powie jak ja chcÄ™ kupiÄ‡ sobie bilet miesiÄ™czny na tÄ… skm kiedy ile ale pani chce tylko na skm na tramwaje aha a bÄ™dzie pani jeÅºdziÅ‚a skm konto kont z pruszkowa do warszawy aha czyli musiaÅ‚aby pani se taki na 30 dni by kosztowaÅ‚ paniÄ… 40 46 800 taki bilet bym tak to siÄ™ nazywa bilet sieciowy imienny bilet sieciowy dziÄ™kujÄ™ bardzo proszÄ™ bardzo widzenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.2328767123287671}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.19727891156462585}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>143</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>144</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>145</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>146</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>147</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>148 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    DELETION               PRON                 xxx                       \n",
+       "1     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "2     CORRECT                ADJ               dobry                 ADJ   \n",
+       "3     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "4     CORRECT                ADJ               dobry                 ADJ   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "143  DELETION               NOUN            widzenia                       \n",
+       "144   CORRECT               VERB              proszÄ™                VERB   \n",
+       "145   CORRECT                ADV              bardzo                 ADV   \n",
+       "146  DELETION                ADP                  do                       \n",
+       "147   CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                         \n",
+       "1                  dzieÅ„  \n",
+       "2                  dobry  \n",
+       "3                  dzieÅ„  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "143                       \n",
+       "144               proszÄ™  \n",
+       "145               bardzo  \n",
+       "146                       \n",
+       "147             widzenia  \n",
+       "\n",
+       "[148 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx sÅ‚ucham dzieÅ„ dobry ja siÄ™ chciaÅ‚em zapytaÄ‡ o autobus sto dwadzieÅ›cia trzy z przystanku Meissnera w kierunku Ronda Wiatraczna dobrze juÅ¼ momencik sto dwadzieÅ›cia trzy chwileczkÄ™ dobrze przystanek Meissnera kierunek Wiatraczna juÅ¼ panu podajÄ™ kiedy pan Å¼yczy dzisiaj ? tak teraz proszÄ™ bardzo proszÄ™ pana to mamy tak dwudziesta zero dziewiÄ™Ä‡ i dwadzieÅ›cia dziewiÄ™Ä‡ dobrze dziÄ™kujÄ™ bardzo dziÄ™kujÄ™ uprzejmie do widzenia do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry sÅ‚ucham dzieÅ„ dobry ja siÄ™ chciaÅ‚em zapytaÄ‡ o autobus 123 z przystanku meissnera w kierunku ronda wiatraczna dobrze juÅ¼ momencik 100 chwileczkÄ™ dobrze przystanek meissnera kierunek wiatraczna juÅ¼ panu podajÄ™ kiedy pan Å¼yczy dzisiaj tak teraz proszÄ™ bardzo proszÄ™ pana to mamy tak dwudziesta 0 9 i 29 dobrze dziÄ™kujÄ™ bardzo dziÄ™kujÄ™ uprzejmie do widzenia do widzenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.25757575757575757}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.22727272727272727}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>61</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>62</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>63</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>64</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>65</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>66 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "   step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1    CORRECT                ADJ               dobry                 ADJ   \n",
+       "2   DELETION               NOUN                 xxx                       \n",
+       "3    CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4    CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "..       ...                ...                 ...                 ...   \n",
+       "61   CORRECT                ADV           uprzejmie                 ADV   \n",
+       "62   CORRECT                ADP                  do                 ADP   \n",
+       "63   CORRECT               NOUN            widzenia                NOUN   \n",
+       "64   CORRECT                ADP                  do                 ADP   \n",
+       "65   CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "   hypothesis_word_text  \n",
+       "0                 dzieÅ„  \n",
+       "1                 dobry  \n",
+       "2                        \n",
+       "3               sÅ‚ucham  \n",
+       "4                 dzieÅ„  \n",
+       "..                  ...  \n",
+       "61            uprzejmie  \n",
+       "62                   do  \n",
+       "63             widzenia  \n",
+       "64                   do  \n",
+       "65             widzenia  \n",
+       "\n",
+       "[66 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dobry wieczÃ³r xxx sÅ‚ucham dzieÅ„ dobry ja mam takie pytanie bo dowiedziaÅ‚am siÄ™ wÅ‚aÅ›nie jestem w sumie doktorantkÄ… Å¼e obowiÄ…zuje mnie czterdziestooÅ›mioprocentowa zniÅ¼ka na MZK i teraz mam takie pytanie bo ja wÅ‚aÅ›ciwie ukoÅ„czyÅ‚am studia doktoranckie dostanÄ™ Å›wiadectwo ukoÅ„czenia tych studiÃ³w ale praktycznie zostaÅ‚o mi pisanie pracy doktorskiej i teraz mi juÅ¼ legitymacji nie podbijajÄ… czy dalej mogÄ™ korzystaÄ‡ z tej zniÅ¼ki ? znaczy proszÄ™ pani ta zniÅ¼ka przysÅ‚uguje uczestnikom studiÃ³w doktoranckich ona przysÅ‚uguje wÅ‚aÅ›nie na podstawie legitymacji jeÅ›li nie ma pani legitymacji to niestety czyli jeÅ¼eli mam po prostu nie podbijanÄ… bo juÅ¼ studia ukoÅ„czyÅ‚am ale jeszcze piszÄ™ pracÄ™ doktorskÄ… to juÅ¼ chyba raczej nie to juÅ¼ nie przysÅ‚uguje niestety aha no to dziÄ™kujÄ™ Å›licznie do widzenia bardzo proszÄ™ do usÅ‚yszenia\n",
+      "\n",
+      "asr transcript: dobry wieczÃ³r sÅ‚ucham dzieÅ„ dobry ja mam takie pytanie bo dowiedziaÅ‚am siÄ™ wÅ‚aÅ›nie jestem w sumie doktorantkÄ… Å¼e oboje zajmie czterdziestu oÅ›miu procentowÄ… edytka i teraz mam takie pytanie bo ja wÅ‚aÅ›ciwie ukoÅ„czyÅ‚am studia doktoranckie dostanÄ™ Å›wiadectwo ukoÅ„czenia tych studiÃ³w ale praktycznie zostaÅ‚o mi pisanie pracy doktorskiej i teraz sojusz czy nie podbijaÅ‚em czy dalej mogÄ™ korzystaÄ‡ z tej zniÅ¼ki znaczy proszÄ™ pani ta zniÅ¼ka przysÅ‚uguje uczestnikom studiÃ³w doktoranckich ona przysÅ‚uguje wÅ‚aÅ›nie na podstawie legii temu nie ma pani legitymacji to niestety czyli jeÅ¼eli mam po prostu nie podbijane bo juÅ¼ studia ukoÅ„czyÅ‚am ale jeszcze piszÄ™ pracÄ™ doktorskÄ… to juÅ¼ chyba raczej nie to juÅ¼ nie przysÅ‚uguje niestety aha no to dziÄ™kujÄ™ Å›licznie nadzoru nie\n",
+      "\n",
+      "word wer {'classic_wer': 0.1721311475409836}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.13114754098360656}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>119</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>nadzoru</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>120</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>121</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>122</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>123</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>usÅ‚yszenia</td>\n",
+       "      <td>PART</td>\n",
+       "      <td>nie</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>124 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "        step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0         CORRECT                ADJ               dobry                 ADJ   \n",
+       "1         CORRECT               NOUN             wieczÃ³r                NOUN   \n",
+       "2        DELETION               PRON                 xxx                       \n",
+       "3         CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4         CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "..            ...                ...                 ...                 ...   \n",
+       "119       CORRECT               NOUN            widzenia                NOUN   \n",
+       "120      DELETION                ADV              bardzo                       \n",
+       "121      DELETION               VERB              proszÄ™                       \n",
+       "122      DELETION                ADP                  do                       \n",
+       "123  SUBSTITUTION               NOUN          usÅ‚yszenia                PART   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dobry  \n",
+       "1                wieczÃ³r  \n",
+       "2                         \n",
+       "3                sÅ‚ucham  \n",
+       "4                  dzieÅ„  \n",
+       "..                   ...  \n",
+       "119              nadzoru  \n",
+       "120                       \n",
+       "121                       \n",
+       "122                       \n",
+       "123                  nie  \n",
+       "\n",
+       "[124 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx w czym mogÄ™ pomÃ³c ? dzieÅ„ dobry panu chciaÅ‚am zapytaÄ‡ siÄ™ czy na Dolnym Mokotowie jest taka ulica Kostrzewskiego ? jest jest taki przystanek nawet Kostrzewskiego czy tamtÄ™dy jeÅºdzi autobus sto szeÅ›Ä‡dziesiÄ…t szeÅ›Ä‡ przez Kostrzewskiego ? tak tutaj przez ten przystanek ? tak przejeÅ¼dÅ¼a jeÅºdzi to dobrze niech mi pan teraz powie jutro a czy jest przystanek w drugÄ… stronÄ™ w stronÄ™ Ursynowa tam gdzieÅ› naprzeciwko tak Kostrzewskiego w stronÄ™ Ursynowa tak jest jest czyli mniej wiÄ™cej naprzeciwko jest tak ? tak dokÅ‚adnie tak i ten z tego przystanku Kostrzewskiego w kierunku Ursynowa jakiÅ› autobus jutro okoÅ‚o Ã³smej rano w kierunku Ursynowa tak ? tak tak bo cÃ³rka musi dojechaÄ‡ jutro stamtÄ…d aÅ¼ na Kabaty na Kabaty tak ona bÄ™dzie jechaÅ‚a tak po imprezie proszÄ™ paniÄ… to te sto szeÅ›Ä‡dziesiÄ…t szeÅ›Ä‡ bÄ™dzie Ã³sma osiem Ã³sma zero osiem tak a pÃ³Åºniej Ã³sma czterdzieÅ›ci piÄ™Ä‡ nie nie to Ã³sma zero osiem rozumiem a przed Ã³smÄ… jeszcze o ktÃ³rej ? siÃ³dma czterdzieÅ›ci cztery no dobra to ten Ã³sma zero osiem bÄ™dzie musiaÅ‚a pojechaÄ‡ na dziewiÄ…tÄ… dojedzie tak tutaj to bÄ™dzie na na na na nie bÄ™dzie tego nie bÄ™dzie chyba korkÃ³w nie o tej porze to na tak dziÄ™kujÄ™ panu uprzejmie do widzenia proszÄ™ bardzo do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry w czym mogÄ™ pomÃ³c dzieÅ„ dobry panu chciaÅ‚am zapytaÄ‡ siÄ™ czy na dolnym mokotowie jest taka ulica kostrzewskiego jest taki pod kostrzewskiego czy tamtÄ™dy jeÅºdzi autobus 166 przez kostrzewskiego tak tutaj przez ten przystanek tak przejeÅ¼dÅ¼a jeÅºdzi to dobrze niech mi pan teraz powie jutro a przestanÄ™ w drugÄ… stronÄ™ w stronÄ™ ursynowa tam gdzieÅ› naprzeciwko tak kostrzewskiego w stronÄ™ ursynowa tak jest czyli mniej wiÄ™cej naprzeciwko jest tak tak dokÅ‚adnie tak i ten sam po kostrzewskiego w kierunku ursynowa jakiÅ› autobus jutro okoÅ‚o Ã³smej rano w kierunku ursynowa tak tak bo cÃ³rka musi dojechaÄ‡ jutro stamtÄ…d aÅ¼ na kabaty na kabaty ta bÄ™dzie jechaÅ‚a tak broÅ„ bo razie to te 160 8 Ã³sma 0 8 tak a pÃ³Åºniej Ã³sma 45 nie nie to Ã³sma 0 8 rozumiem a przed Ã³smÄ… jeszcze o ktÃ³rej siÃ³dma 40 no dobra 0 8 bÄ™dzie musiaÅ‚a pojechaÄ‡ na dziewiÄ…tÄ… dojedzie tak tutaj to mydlana leonarda dyrektora nie bÄ™dzie tego nie bÄ™dzie korkÃ³w nie raty i powtarzaÄ‡ dziÄ™kujÄ™ panu uprzejmie nie\n",
+      "\n",
+      "word wer {'classic_wer': 0.37681159420289856}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.33816425120772947}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>X</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>202</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>panu</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>203</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>204</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>205</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>206</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>PART</td>\n",
+       "      <td>nie</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>207 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "        step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0         CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1         CORRECT                ADJ               dobry                 ADJ   \n",
+       "2        DELETION                  X                 xxx                       \n",
+       "3         CORRECT                ADP                   w                 ADP   \n",
+       "4         CORRECT               PRON                czym                PRON   \n",
+       "..            ...                ...                 ...                 ...   \n",
+       "202       CORRECT               NOUN            widzenia                NOUN   \n",
+       "203      DELETION               VERB              proszÄ™                       \n",
+       "204       CORRECT                ADV              bardzo                 ADV   \n",
+       "205      DELETION                ADP                  do                       \n",
+       "206  SUBSTITUTION               NOUN            widzenia                PART   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dzieÅ„  \n",
+       "1                  dobry  \n",
+       "2                         \n",
+       "3                      w  \n",
+       "4                   czym  \n",
+       "..                   ...  \n",
+       "202                 panu  \n",
+       "203                       \n",
+       "204            uprzejmie  \n",
+       "205                       \n",
+       "206                  nie  \n",
+       "\n",
+       "[207 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: xxx dzieÅ„ dobry dzieÅ„ dobry jak siÄ™ dostaÄ‡ z Ochoty na KsiÄ…Å¼Ä™cÄ… ? jakim Å›rodkiem lokomocji ? z Ochoty na KsiÄ…Å¼Ä™cÄ… ? tak z Ochoty a z ktÃ³rego miejsca z Ochoty by pani jechaÅ‚a ? z o to tutaj koÅ‚o Hotelu Sobieskich z tego miejsca do szpitala konkretnie na KsiÄ…Å¼Ä™cÄ… a pani chodzi do tego Szpitala OrÅ‚owskiego ? tak ? na KsiÄ…Å¼Ä™cÄ… tak proszÄ™ pani na samÄ… KsiÄ…Å¼Ä™cÄ… od szpitala od Hotelu Sobieskiego nic nie ma od Centralnego ma pani sto osiemnaÅ›cie aha ale sto osiemnaÅ›cie i co i idzie na KsiÄ…Å¼Ä™cÄ… ? on jedzie KsiÄ…Å¼Ä™cÄ… albo jak pani podjedzie do Centrum to jest jeszcze sto siedemdziesiÄ…t jeden ile ? sto siedemdziesiÄ…t jeden tutaj sto osiemnaÅ›cie a tam sto siedemdziesiÄ…t jeden tak ? tak dziÄ™kujÄ™ proszÄ™\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry dzieÅ„ dobry jak siÄ™ dostaÄ‡ z ochoty na ksiÄ…Å¼Ä™cÄ… jakim Å›rodkiem lokomocji z ochoty na ksiÄ…Å¼Ä™cÄ… tak z ochoty a z ktÃ³rego miejsca z ochoty by pani jechaÅ‚a tutaj koÅ‚o hotelu sobieski z tego miejsca do szpitala konkretnie na ksiÄ…Å¼Ä™cÄ… a pani chodzi do tego szpitala orÅ‚owskiego tak na ksiÄ…Å¼Ä™cÄ… tak czy pani na samÄ… ksiÄ…Å¼Ä™cÄ… od szczyt nic nie ma od centralnego ma pani 118 aha ale 118 i co i idzie na ksiÄ…Å¼Ä™cÄ… on jedzie ksiÄ…Å¼Ä™cÄ… albo jak pani podjedzie docent 171 171 tutaj 118 a tam 171 tak tak dziÄ™kujÄ™ proszÄ™\n",
+      "\n",
+      "word wer {'classic_wer': 0.4365079365079365}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.29365079365079366}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>121</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>122</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PUNCT</td>\n",
+       "      <td>?</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>123</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>124</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>125</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>126 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    DELETION               PRON                 xxx                       \n",
+       "1     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "2     CORRECT                ADJ               dobry                 ADJ   \n",
+       "3     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "4     CORRECT                ADJ               dobry                 ADJ   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "121   CORRECT                ADV                 tak                 ADV   \n",
+       "122  DELETION              PUNCT                   ?                       \n",
+       "123   CORRECT                ADV                 tak                 ADV   \n",
+       "124   CORRECT               VERB            dziÄ™kujÄ™                VERB   \n",
+       "125   CORRECT               VERB              proszÄ™                VERB   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                         \n",
+       "1                  dzieÅ„  \n",
+       "2                  dobry  \n",
+       "3                  dzieÅ„  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "121                  tak  \n",
+       "122                       \n",
+       "123                  tak  \n",
+       "124             dziÄ™kujÄ™  \n",
+       "125               proszÄ™  \n",
+       "\n",
+       "[126 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dobry wieczÃ³r xxx sÅ‚ucham dobry wieczÃ³r chciaÅ‚am siÄ™ dowiedzieÄ‡ o ktÃ³rej godzinie odchodzi z przystanku przy ulicy Kosiarzy w stronÄ™ pÄ™tli w Wilanowie autobus linii sto osiemdziesiÄ…t i piÄ™Ä‡set dwadzieÅ›cia dwa chodzi mi o godzinÄ™ tak gdzieÅ› czy bÄ™dzie to za dziesiÄ™Ä‡ siÃ³dma czy za piÄ™Ä‡ siÃ³dma tak przed siÃ³dmÄ… dobrze czyli tak przystanek Kosiarzy w z kierunku ktÃ³rym pani mÃ³wiÅ‚a ? do Wilanowa do pÄ™tli w Wilanowie to jest ostatni przystanek a do pÄ™tli w Wilanowie przed pÄ™tlÄ… tak zgadza siÄ™ proszÄ™ pani to mamy tak dzisiaj tak ? znaczy jutro rano przed a jutro rano jutro rano przed siÃ³dmÄ… tak przed siÃ³dmÄ… proszÄ™ bardzo proszÄ™ pani to mamy tak szÃ³sta czterdzieÅ›ci trzy tak tylko momencik dobrze ja zobaczÄ™ czy nie bÄ™dzie jutro zmiany rozkÅ‚adu jazdy przypadkiem dobrze momencik dobrze momencik bo jeszcze na jutro nie mam ustawionego a na wszelki wypadek sprawdzÄ™ Å¼e paniÄ… w bÅ‚Ä…d nie wprowadziÄ‡ dobrze mam juÅ¼ sto osiemdziesiÄ…t kierunek WilanÃ³w Kosiarzy i przed siÃ³dmÄ… miaÅ‚o byÄ‡ ? tak proszÄ™ uprzejmie proszÄ™ pani to mamy tak szÃ³sta czterdzieÅ›ci trzy tak bo potem jest siÃ³dma zero dwie aha a piÄ™Ä‡set dwadzieÅ›cia dwa ? a piÄ™Ä‡set dwadzieÅ›cia dwa proszÄ™ bardzo juÅ¼ podajÄ™ proszÄ™ pani mamy tak szÃ³sta trzydzieÅ›ci jeden i piÄ™Ä‡dziesiÄ…t cztery i siÃ³dma zero dziewiÄ™Ä‡ a jeszcze mam takie pytanie bo tam rÃ³wnieÅ¼ staje autobus tylko wÅ‚aÅ›nie nie pamiÄ™tam czy sto szeÅ›Ä‡dziesiÄ…t trzy czy sto szeÅ›Ä‡dziesiÄ…t cztery na Kosiarzy tak i jeÅ›li juÅ¼ sprawdzamy tak to teÅ¼ o tÄ… samÄ… godzinÄ™ sto szeÅ›Ä‡dziesiÄ…t cztery dobrze juÅ¼ sprawdzam dobrze mamy sto szeÅ›Ä‡dziesiÄ…t cztery tutaj kierunek proszÄ™ pani to mamy tak dobrze mamy Kosiarzy proszÄ™ proszÄ™ pani to jest tak szÃ³sta dwadzieÅ›cia szeÅ›Ä‡ i piÄ™Ä‡dziesiÄ…t jeden dziÄ™kujÄ™ pani uprzejmie dziÄ™kujÄ™ dobranoc dobranoc\n",
+      "\n",
+      "asr transcript: dobry wieczÃ³r sÅ‚ucham dobry wieczÃ³r chciaÅ‚em siÄ™ dowiedzieÄ‡ o ktÃ³rej godzinie odchodzi z przystanku przy ulicy kosiarzy w stronÄ™ pÄ™tli w wilanowie autobus linii 180 i 522 chodzi mi o godzinÄ™ tak gdzieÅ› czy bÄ™dzie to za 10 siÃ³dma czy za 5 siÃ³dma tak przed siÃ³dmÄ… dobrze czyli tak przystanek kojarzy tak w kierunku ktÃ³rym pani mÃ³wiÅ‚a do wilanowa do pÄ™tli fila do persowie dni przed pÄ™tlÄ… tak tak zgadza siÄ™ proszÄ™ pani to mamy tak dzisiaj tak znaczy jutro rano przed a jutro ra siÃ³dmÄ… tak przed siÃ³dmÄ… proszÄ™ bardzo proszÄ™ pani to mamy tak szÃ³sta 43 tak tylko momencik dobrze ja zobaczÄ™ czy nie bÄ™dzie jutro zmiany rozkÅ‚adu jazdy Å›wiÄ™ta juÅ¼ momencik dobrze momencik jeszcze na jutro nie mam ustawionego a na wszelki wypadek sprawdzÄ™ Å¼e paniÄ… w bÅ‚Ä…d nie wprowadziÄ‡ dobrze mam juÅ¼ 180 panÃ³w kosiarzy i przed siÃ³dmÄ… miaÅ‚o byÄ‡ tak proszÄ™ uprzejmie proszÄ™ pani to mamy tak szÃ³sta 43 tak bo potem jest siÃ³dma 0 dwie aha a 502 a 522 proszÄ™ bardzo juÅ¼ podajÄ™ proszÄ™ pani mamy tak szÃ³sta 31 i 54 0 9 a jeszcze mam takie pytanie bo tam rÃ³wnieÅ¼ staje autobus tylko wÅ‚aÅ›nie nie pamiÄ™tam czy 163 czy 164 na kosiarzy tak i kreÅ›lone tak toteÅ¼ tatÄ™ jeÅ›li moÅ¼na wÅ‚aÅ›nie nie pamiÄ™tam wulkan w koÅ„cu czy czwÃ³rkÄ™ 164 dobrze juÅ¼ sprawdzam dobrze mamy 164 tutaj kierunek proszÄ™ pani to mamy tak tak jarzy proszÄ™ proszÄ™ pani to jest tak szÃ³sta 26 i 51 dziÄ™kujÄ™ pani uprzejmie dziÄ™kujÄ™ dobranoc\n",
+      "\n",
+      "word wer {'classic_wer': 0.3298245614035088}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.28421052631578947}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>283</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>pani</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>pani</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>284</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>285</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>286</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>287</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>288 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0     CORRECT                ADJ               dobry                 ADJ   \n",
+       "1     CORRECT               NOUN             wieczÃ³r                NOUN   \n",
+       "2    DELETION               PRON                 xxx                       \n",
+       "3     CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4     CORRECT                ADJ               dobry                 ADJ   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "283   CORRECT               NOUN                pani                NOUN   \n",
+       "284   CORRECT                ADV           uprzejmie                 ADV   \n",
+       "285   CORRECT               VERB            dziÄ™kujÄ™                VERB   \n",
+       "286  DELETION               NOUN            dobranoc                       \n",
+       "287   CORRECT               NOUN            dobranoc                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dobry  \n",
+       "1                wieczÃ³r  \n",
+       "2                         \n",
+       "3                sÅ‚ucham  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "283                 pani  \n",
+       "284            uprzejmie  \n",
+       "285             dziÄ™kujÄ™  \n",
+       "286                       \n",
+       "287             dobranoc  \n",
+       "\n",
+       "[288 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dobry wieczÃ³r xxx sÅ‚ucham dobry wieczÃ³r tramwaj Targowa Lubelska tutaj w stronÄ™ GocÅ‚awia a jaka linia dwadzieÅ›cia szeÅ›Ä‡ co moÅ¼e jeszcze jeÅºdziÄ‡ Ã³semka w stronÄ™ GocÅ‚awka szÃ³stka w stronÄ™ GocÅ‚awia GocÅ‚awka GocÅ‚awka ? wie pan potrzebujÄ™ do Ronda Wiatraczna dojechaÄ‡ z jakiego przystanku na Targowej ? Lubelska to juÅ¼ jest na Grochowskiej Zamoyskiego Lubelska to bÄ™dzie chyba nie ? no tu koÅ„czy siÄ™ Zamoyskiego zaczyna Grochowska tak czy trÃ³jki to juÅ¼ nie bÄ™dzie bo ona w teraz juÅ¼ wczeÅ›niej koÅ„czy szÃ³stka ? szÃ³stka moÅ¼e byÄ‡ dwudziesta trzecia trzy ostatnia szÃ³stka Ã³semki teÅ¼ juÅ¼ nie bÄ™dzie a dwadzieÅ›cia szeÅ›Ä‡ ? dwudziesta druga piÄ™Ä‡dziesiÄ…t osiem dwudziesta trzecia osiemnaÅ›cie trzydzieÅ›ci osiem dobrze dziÄ™kujÄ™ uprzejmie proszÄ™ bardzo dobranoc dobranoc\n",
+      "\n",
+      "asr transcript: dobry wieczÃ³r sÅ‚ucham dobry wieczÃ³r tramwaj targowa lubelska tutaj w stronÄ™ gocÅ‚awia a jaka linia 26 co moÅ¼e jeszcze jeÅºdziÄ‡ Ã³semka w stronÄ™ gocÅ‚awka rolska w stronÄ™ gocÅ‚awia gocÅ‚awka gocÅ‚awka wie pan poczuÅ‚y do ronda wiatraczna dojechaÄ‡ z jakiego przystanku na targowej lubelska to juÅ¼ jest na grochowskiej zamoyskiego lubelska to bÄ™dzie chowania koÅ„czy siÄ™ zamoyskiego zaczyna grochowska tak czy trÃ³jki to juÅ¼ nie bÄ™dzie bo ona w teraz juÅ¼ wczeÅ›niej koÅ„czy szÃ³stka szÃ³stka moÅ¼e byÄ‡ dwudziesta trzecia 3 ostatnia szÃ³stka Ã³semki teÅ¼ juÅ¼ nie bÄ™dzie a 26 dwudziesta druga 58 dwudziesta trzecia 18 38 dobrze dziÄ™kujÄ™ dobranoc\n",
+      "\n",
+      "word wer {'classic_wer': 0.3652173913043478}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.28695652173913044}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>110</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>dobrze</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>111</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>112</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>113</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>114</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>115 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0     CORRECT                ADJ               dobry                 ADJ   \n",
+       "1     CORRECT               NOUN             wieczÃ³r                NOUN   \n",
+       "2    DELETION               PRON                 xxx                       \n",
+       "3     CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4     CORRECT                ADJ               dobry                 ADJ   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "110   CORRECT                ADV           uprzejmie                 ADV   \n",
+       "111   CORRECT               VERB              proszÄ™                VERB   \n",
+       "112  DELETION                ADV              bardzo                       \n",
+       "113  DELETION               NOUN            dobranoc                       \n",
+       "114   CORRECT               NOUN            dobranoc                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dobry  \n",
+       "1                wieczÃ³r  \n",
+       "2                         \n",
+       "3                sÅ‚ucham  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "110               dobrze  \n",
+       "111             dziÄ™kujÄ™  \n",
+       "112                       \n",
+       "113                       \n",
+       "114             dobranoc  \n",
+       "\n",
+       "[115 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dobry wieczÃ³r xxx w czym mogÄ™ pomÃ³c ? dobry wieczÃ³r mam takie pytania chciaÅ‚bym siÄ™ dowiedzieÄ‡ sto szeÅ›Ä‡dziesiÄ…t dziewiÄ™Ä‡ z przystanku Å»uromiÅ„ska w stronÄ™ Pragi i jutro tak gdzieÅ› przed siÃ³dmÄ… rano w stronÄ™ Wschodniego ? tak stronÄ™ Wschodniego tak przed siÃ³dmÄ… siÃ³dma coÅ› koÅ‚o tego proszÄ™ pana szÃ³sta czterdzieÅ›ci jeden lub siÃ³dma jedenaÅ›cie szÃ³sta czterdzieÅ›ci jeden lub ? siÃ³dma jedenaÅ›cie siÃ³dma jedenaÅ›cie dobrze dziÄ™kujÄ™ proszÄ™ bardzo dobranoc\n",
+      "\n",
+      "asr transcript: dobry wieczÃ³r w czym mogÄ™ pomÃ³c dobry wieczÃ³r mam takie pytania chciaÅ‚bym siÄ™ dowiedzieÄ‡ 169 z przystanku szoruj miejska s jutro tak gdzieÅ› przed siÃ³dmÄ… rano tak przez stronÄ™ wschodniego a zresztÄ… wschodniego tak przed siÃ³dmÄ… siÃ³dma coÅ› podaÄ‡ proszÄ™ pana szÃ³sta 41 lub siÃ³dma 11 szÃ³sta 41 lub siÃ³dma 11 siÃ³dma 11 dobrze dziÄ™kujÄ™ proszÄ™ bardzo dobranoc\n",
+      "\n",
+      "word wer {'classic_wer': 0.39705882352941174}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.3382352941176471}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PROPN</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>64</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>dobrze</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>dobrze</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>65</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>66</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>67</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>68</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>69 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "   step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    CORRECT                ADJ               dobry                 ADJ   \n",
+       "1    CORRECT               NOUN             wieczÃ³r                NOUN   \n",
+       "2   DELETION              PROPN                 xxx                       \n",
+       "3    CORRECT                ADP                   w                 ADP   \n",
+       "4    CORRECT               PRON                czym                PRON   \n",
+       "..       ...                ...                 ...                 ...   \n",
+       "64   CORRECT                ADV              dobrze                 ADV   \n",
+       "65   CORRECT               VERB            dziÄ™kujÄ™                VERB   \n",
+       "66   CORRECT               VERB              proszÄ™                VERB   \n",
+       "67   CORRECT                ADV              bardzo                 ADV   \n",
+       "68   CORRECT               NOUN            dobranoc                NOUN   \n",
+       "\n",
+       "   hypothesis_word_text  \n",
+       "0                 dobry  \n",
+       "1               wieczÃ³r  \n",
+       "2                        \n",
+       "3                     w  \n",
+       "4                  czym  \n",
+       "..                  ...  \n",
+       "64               dobrze  \n",
+       "65             dziÄ™kujÄ™  \n",
+       "66               proszÄ™  \n",
+       "67               bardzo  \n",
+       "68             dobranoc  \n",
+       "\n",
+       "[69 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx sÅ‚ucham dzieÅ„ dobry proszÄ™ pani chciaÅ‚bym zapytaÄ‡ siÄ™ o odjazdy autobusÃ³w sto dziewiÄ™Ä‡dziesiÄ…t siedem tak z przystanku PerzyÅ„skiego w kierunku Dworca Zachodniego teraz po osiemnastej dobrze proszÄ™ pana osiemnasta dwadzieÅ›cia jeden i piÄ™Ä‡dziesiÄ…t jeden dwadzieÅ›cia jeden i piÄ™Ä‡dziesiÄ…t jeden aha rozumiem a jeszcze gdyby mogÅ‚a pani sprawdziÄ‡ o ktÃ³rej on jest na przystanku Duracza w tym sami kierunku na przystanku Duracza proszÄ™ pana przejazd jest trzy minuty trzy minuty aha tak to sÄ… dwa przystanki rozumiem rozumiem dobrze to dziÄ™kujÄ™ bardzo dziÄ™kujÄ™ uprzejmie do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry sÅ‚ucham dzieÅ„ dobry proszÄ™ pani chciaÅ‚bym zapytaÄ‡ siÄ™ o odjazdy autobusÃ³w 197 tak to jest wierzyÅ„skiego w kierunku dworca zachodniego teraz po osiemnastej dobrze proszÄ™ pana osiemnasta 21 i 51 21 i 51 aha rozumiem a jeszcze gdyby mogÅ‚a pani sprawdziÄ‡ o ktÃ³rej on jest duracza w tym sami kierunku na przystanku duracza proszÄ™ pana przejazd jest 3 minuty 3 minuty aha to sÄ… 2 przystanki rozumiem dobrze to dziÄ™kujÄ™ bardzo dziÄ™kujÄ™ uprzejmie do widzenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.29545454545454547}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.23863636363636365}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>83</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>84</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>85</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>86</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>87</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>88 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "   step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1    CORRECT                ADJ               dobry                 ADJ   \n",
+       "2   DELETION               NOUN                 xxx                       \n",
+       "3    CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4    CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "..       ...                ...                 ...                 ...   \n",
+       "83   CORRECT                ADV              bardzo                 ADV   \n",
+       "84   CORRECT               VERB            dziÄ™kujÄ™                VERB   \n",
+       "85   CORRECT                ADV           uprzejmie                 ADV   \n",
+       "86   CORRECT                ADP                  do                 ADP   \n",
+       "87   CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "   hypothesis_word_text  \n",
+       "0                 dzieÅ„  \n",
+       "1                 dobry  \n",
+       "2                        \n",
+       "3               sÅ‚ucham  \n",
+       "4                 dzieÅ„  \n",
+       "..                  ...  \n",
+       "83               bardzo  \n",
+       "84             dziÄ™kujÄ™  \n",
+       "85            uprzejmie  \n",
+       "86                   do  \n",
+       "87             widzenia  \n",
+       "\n",
+       "[88 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: xxx dzieÅ„ dobry dzieÅ„ dobry proszÄ™ pana na Karolin tutaj ze ÅšwiÄ™tokrzyskiej to sto piÄ™Ä‡dziesiÄ…t piÄ™Ä‡ jedzie prawda ? sto piÄ™Ä‡dziesiÄ…t piÄ™Ä‡ tylko chwileczkÄ™ czy dzisiaj jest zmiana trasy tak ze ÅšwiÄ™tokrzyskiej na Karolin moÅ¼e pani dobrze czy mÃ³gÅ‚by pan mi dwa najbliÅ¼sze podaÄ‡ ? dobrze i powiedzieÄ‡ ile siÄ™ jedzie do Fortu Wola bo tam z Fortu Wola ja siÄ™ potem chciaÅ‚am na siedemset trzynaÅ›cie przesiÄ…Å›Ä‡ a pani bÄ™dzie wsiadaÅ‚a tutaj przy metrze ? czy przy Nowym Åšwiecie przy Nowym Åšwiecie dobrze do Fort Wola to jest okoÅ‚o pÃ³Å‚ godziny przejazd odjazdy sÄ… dziesiÄ…ta trzydzieÅ›ci siedem jedenasta zero dwa najbliÅ¼sze a bo tak bo jest dziesiÄ…ta tak bo siÄ™ czas zmieniÅ‚ jeszcze stary zegarek dobrze a potem siedem to czy jedenasta zero dwa tak powiedzmy jedenasta czterdzieÅ›ci no mniej wiÄ™cej i stamtÄ…d jest ojej jedenasta dwadzieÅ›cia albo dwunasta zero zero czyli musiaÅ‚aby pani tym wczeÅ›niejszym jechaÄ‡ a a mÃ³gÅ‚by pan sprawdziÄ‡ kombinacjÄ™ jakbym jechaÅ‚a na przykÅ‚ad co tam jedzie dwadzieÅ›cia nie dwadzieÅ›cia dwa nie jedzie dwadzieÅ›cia szeÅ›Ä‡ od Bankowego a to nie ja muszÄ™ mieÄ‡ coÅ› z Alej z Alej tam jest Ã³semka ? Ã³semka Ã³semka tak to Ã³semka wyglÄ…daÅ‚oby tak Ã³semka jedzie godzinÄ™ dziesiÄ…ta czterdzieÅ›ci dwa albo jedenasta dwanaÅ›cie to na to samo wychodzi no tak wyglÄ…da Å¼e Å¼e jakby pani chciaÅ‚a zdÄ…Å¼yÄ‡ na ten dwunasta zero zero no to moÅ¼na jechaÄ‡ jedenasta dwanaÅ›cie i z oczekiwanie albo dziesiÄ…ta ile jedzie Ã³semka ? tam do Fortu Wola przepraszam teÅ¼ teÅ¼ to jest w granicach pÃ³Å‚ godziny jazdy czyli na to samo wychodzi na to samo wychodzi dobrze a teraz jeszcze powrotne z Bronisz gdzieÅ› w okolicach czternastej dobrze wiedziaÅ‚a jak tam mam potem celowaÄ‡ czternasta jedenaÅ›cie i piÄ™Ä‡dziesiÄ…t jeden a wczeÅ›niejszy jeszcze na trzynasta trzydzieÅ›ci jeden trzydzieÅ›ci jeden dobra dziÄ™kujÄ™ bardzo dziÄ™kujÄ™ do widzenia do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry dzieÅ„ dobry proszÄ™ pana na karolin tutaj ze Å›wiÄ™tokrzyskiej to 155 jedzie prawda 150 tylko chwileczkÄ™ czy dzisiaj jest zmiana trasy tak ze Å›wiÄ™tokrzyskiej na karolin moÅ¼e pani dobrze to mogÅ‚em pan 2 najbliÅ¼sze podaÄ‡ dobrze i powiedzieÄ‡ ile siÄ™ jedzie do fortu wola warto wola ja siÄ™ potem chciaÅ‚am na 713 przesiÄ…Å›Ä‡ a pani bÄ™dzie shella tutaj przy metrze 3 3 razem Å›wiecie przy nowym Å›wiecie dobrze dla to jest okoÅ‚o pÃ³Å‚ godziny przejazd odjazdy sÄ… dziesiÄ…ta 37 jedenasta 0 2 najbliÅ¼sze a bo tak bo jest dziesiÄ…ta tak bo siÄ™ czas zmieniÅ‚ jeszcze stary zegarek dobrze a potem 7 to czy jedenasta 0 2 realne powiedzmy jedenasta 40 danny fala mniej wiÄ™cej tamta nt jest ojej jedenasta 20 jest albo dwunasta 0 0 czyli musiaÅ‚aby pani tym wczeÅ›niejszym nie kombinacja michaÅ‚a na przykÅ‚ad co tam jedzie 20 nie 22 nie jedzie 26 od bankowego a to nie ja muszÄ™ mieÄ‡ coÅ› z alej czemu kanka Ã³semka tak to Ã³semka wyglÄ…daÅ‚oby tak Ã³semka jedzie godzinÄ™ dziesiÄ…ta 42 albo jedenasta 12 to na to samo wychodzi no tak wyglÄ…da Å¼e Å¼e jakby pani chciaÅ‚a zdÄ…Å¼yÄ‡ na ten dwunasta 0 0 no tak jedenasta 12 i z oczekiwanie albo dziesiÄ…ta ile jedzie Ã³semka tam do fortu wola przepraszam teÅ¼ to jest w granicach pÃ³Å‚ godz kto i na to samo wychodzi na to samo dobrze a teraz jeszcze powrotne z bronisz gdzieÅ› w okolicach czternastej dobrze wiedziaÅ‚a jak tam mam potem celowaÄ‡ czternasta 11 i 51 a wczeÅ›niejszy jeszcze na trzynasta 31 31 dobrze dziÄ™kujÄ™ bardzo do widzenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.35570469798657717}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.31543624161073824}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>295</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>296</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>297</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>298</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>299</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>300 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "        step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0        DELETION               PRON                 xxx                       \n",
+       "1         CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "2         CORRECT                ADJ               dobry                 ADJ   \n",
+       "3         CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "4         CORRECT                ADJ               dobry                 ADJ   \n",
+       "..            ...                ...                 ...                 ...   \n",
+       "295       CORRECT               VERB            dziÄ™kujÄ™                VERB   \n",
+       "296      DELETION                ADP                  do                       \n",
+       "297  SUBSTITUTION               NOUN            widzenia                 ADV   \n",
+       "298       CORRECT                ADP                  do                 ADP   \n",
+       "299       CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                         \n",
+       "1                  dzieÅ„  \n",
+       "2                  dobry  \n",
+       "3                  dzieÅ„  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "295             dziÄ™kujÄ™  \n",
+       "296                       \n",
+       "297               bardzo  \n",
+       "298                   do  \n",
+       "299             widzenia  \n",
+       "\n",
+       "[300 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx sÅ‚ucham dzieÅ„ dobry chodzi mi o SzybkÄ… Kolej MiejskÄ… tak mieszkam w Pruszkowie skoÅ„czyÅ‚em siedemdziesiÄ…t lat czy mam prawo do bezpÅ‚atnego przejazdu ? tak proszÄ™ pana ma pan prawo do bezpÅ‚atnych przejazdÃ³w od Pruszkowa do Warszawy na caÅ‚ej dÅ‚ugoÅ›ci trasy linii Szybkiej Kolei Miejskiej dziÄ™kujÄ™ uprzejmie bardzo proszÄ™ do widzenia do usÅ‚yszenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry sÅ‚ucham dzieÅ„ dobry chodzi mi o szybkÄ… kolej miejskÄ… tak mieszkam w pruszkowie skoÅ„czyÅ‚em 70 czy mam prawo do bezpÅ‚atnego przejazdu tak proszÄ™ pana ma pan prawo do bezpÅ‚atnych przejazdÃ³w 8 Å‚Ã³Å¼kowa do warszawy na caÅ‚ej dÅ‚ugoÅ›ci trasy linii szybkiej kolei miejskiej przechylenia do usÅ‚yszenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.36363636363636365}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.21818181818181817}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>5</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>6</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>chodzi</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>chodzi</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>7</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>mi</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>mi</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>8</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>o</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>o</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>9</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>SzybkÄ…</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>szybkÄ…</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>10</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>Kolej</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>kolej</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>11</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>MiejskÄ…</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>miejskÄ…</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>12</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>13</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>mieszkam</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>mieszkam</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>14</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>15</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>PROPN</td>\n",
+       "      <td>Pruszkowie</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>pruszkowie</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>16</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>skoÅ„czyÅ‚em</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>skoÅ„czyÅ‚em</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>17</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NUM</td>\n",
+       "      <td>siedemdziesiÄ…t</td>\n",
+       "      <td>NUM</td>\n",
+       "      <td>70</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>18</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>lat</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>19</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>CCONJ</td>\n",
+       "      <td>czy</td>\n",
+       "      <td>PART</td>\n",
+       "      <td>czy</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>20</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>mam</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>mam</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>21</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>prawo</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>prawo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>22</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>23</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>bezpÅ‚atnego</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>bezpÅ‚atnego</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>24</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>przejazdu</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>przejazdu</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>25</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PUNCT</td>\n",
+       "      <td>?</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>26</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>27</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>28</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>pana</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>pana</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>29</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>ma</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>ma</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>30</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>pan</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>pan</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>31</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>prawo</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>prawo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>32</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>33</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>bezpÅ‚atnych</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>bezpÅ‚atnych</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>34</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>przejazdÃ³w</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>przejazdÃ³w</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>35</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>od</td>\n",
+       "      <td>X</td>\n",
+       "      <td>8</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>36</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>PROPN</td>\n",
+       "      <td>Pruszkowa</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>Å‚Ã³Å¼kowa</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>37</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>38</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>PROPN</td>\n",
+       "      <td>Warszawy</td>\n",
+       "      <td>PROPN</td>\n",
+       "      <td>warszawy</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>39</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>na</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>na</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>40</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>caÅ‚ej</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>caÅ‚ej</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>41</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dÅ‚ugoÅ›ci</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dÅ‚ugoÅ›ci</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>42</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>trasy</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>trasy</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>43</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>linii</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>linii</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>44</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>Szybkiej</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>szybkiej</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>45</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>Kolei</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>kolei</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>46</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>Miejskiej</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>miejskiej</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>47</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>48</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>uprzejmie</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>49</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>50</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>51</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>52</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>przechylenia</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>53</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>54</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>usÅ‚yszenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>usÅ‚yszenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "       step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0        CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1        CORRECT                ADJ               dobry                 ADJ   \n",
+       "2       DELETION               NOUN                 xxx                       \n",
+       "3        CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4        CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "5        CORRECT                ADJ               dobry                 ADJ   \n",
+       "6        CORRECT               VERB              chodzi                VERB   \n",
+       "7        CORRECT               PRON                  mi                PRON   \n",
+       "8        CORRECT                ADP                   o                 ADP   \n",
+       "9        CORRECT                ADJ              SzybkÄ…                 ADJ   \n",
+       "10       CORRECT               NOUN               Kolej                NOUN   \n",
+       "11       CORRECT                ADJ             MiejskÄ…                 ADJ   \n",
+       "12       CORRECT                ADV                 tak                 ADV   \n",
+       "13       CORRECT               VERB            mieszkam                VERB   \n",
+       "14       CORRECT                ADP                   w                 ADP   \n",
+       "15  SUBSTITUTION              PROPN          Pruszkowie                NOUN   \n",
+       "16       CORRECT               VERB          skoÅ„czyÅ‚em                VERB   \n",
+       "17       CORRECT                NUM      siedemdziesiÄ…t                 NUM   \n",
+       "18      DELETION               NOUN                 lat                       \n",
+       "19  SUBSTITUTION              CCONJ                 czy                PART   \n",
+       "20       CORRECT               VERB                 mam                VERB   \n",
+       "21       CORRECT               NOUN               prawo                NOUN   \n",
+       "22       CORRECT                ADP                  do                 ADP   \n",
+       "23       CORRECT                ADJ         bezpÅ‚atnego                 ADJ   \n",
+       "24       CORRECT               NOUN           przejazdu                NOUN   \n",
+       "25      DELETION              PUNCT                   ?                       \n",
+       "26       CORRECT                ADV                 tak                 ADV   \n",
+       "27       CORRECT               VERB              proszÄ™                VERB   \n",
+       "28       CORRECT               NOUN                pana                NOUN   \n",
+       "29       CORRECT               VERB                  ma                VERB   \n",
+       "30       CORRECT               NOUN                 pan                NOUN   \n",
+       "31       CORRECT               NOUN               prawo                NOUN   \n",
+       "32       CORRECT                ADP                  do                 ADP   \n",
+       "33       CORRECT                ADJ         bezpÅ‚atnych                 ADJ   \n",
+       "34       CORRECT               NOUN          przejazdÃ³w                NOUN   \n",
+       "35  SUBSTITUTION                ADP                  od                   X   \n",
+       "36  SUBSTITUTION              PROPN           Pruszkowa                 ADJ   \n",
+       "37       CORRECT                ADP                  do                 ADP   \n",
+       "38       CORRECT              PROPN            Warszawy               PROPN   \n",
+       "39       CORRECT                ADP                  na                 ADP   \n",
+       "40       CORRECT                ADJ               caÅ‚ej                 ADJ   \n",
+       "41       CORRECT               NOUN            dÅ‚ugoÅ›ci                NOUN   \n",
+       "42       CORRECT               NOUN               trasy                NOUN   \n",
+       "43       CORRECT               NOUN               linii                NOUN   \n",
+       "44       CORRECT                ADJ            Szybkiej                 ADJ   \n",
+       "45       CORRECT               NOUN               Kolei                NOUN   \n",
+       "46       CORRECT                ADJ           Miejskiej                 ADJ   \n",
+       "47      DELETION               VERB            dziÄ™kujÄ™                       \n",
+       "48      DELETION                ADV           uprzejmie                       \n",
+       "49      DELETION                ADV              bardzo                       \n",
+       "50      DELETION               VERB              proszÄ™                       \n",
+       "51      DELETION                ADP                  do                       \n",
+       "52       CORRECT               NOUN            widzenia                NOUN   \n",
+       "53       CORRECT                ADP                  do                 ADP   \n",
+       "54       CORRECT               NOUN          usÅ‚yszenia                NOUN   \n",
+       "\n",
+       "   hypothesis_word_text  \n",
+       "0                 dzieÅ„  \n",
+       "1                 dobry  \n",
+       "2                        \n",
+       "3               sÅ‚ucham  \n",
+       "4                 dzieÅ„  \n",
+       "5                 dobry  \n",
+       "6                chodzi  \n",
+       "7                    mi  \n",
+       "8                     o  \n",
+       "9                szybkÄ…  \n",
+       "10                kolej  \n",
+       "11              miejskÄ…  \n",
+       "12                  tak  \n",
+       "13             mieszkam  \n",
+       "14                    w  \n",
+       "15           pruszkowie  \n",
+       "16           skoÅ„czyÅ‚em  \n",
+       "17                   70  \n",
+       "18                       \n",
+       "19                  czy  \n",
+       "20                  mam  \n",
+       "21                prawo  \n",
+       "22                   do  \n",
+       "23          bezpÅ‚atnego  \n",
+       "24            przejazdu  \n",
+       "25                       \n",
+       "26                  tak  \n",
+       "27               proszÄ™  \n",
+       "28                 pana  \n",
+       "29                   ma  \n",
+       "30                  pan  \n",
+       "31                prawo  \n",
+       "32                   do  \n",
+       "33          bezpÅ‚atnych  \n",
+       "34           przejazdÃ³w  \n",
+       "35                    8  \n",
+       "36              Å‚Ã³Å¼kowa  \n",
+       "37                   do  \n",
+       "38             warszawy  \n",
+       "39                   na  \n",
+       "40                caÅ‚ej  \n",
+       "41             dÅ‚ugoÅ›ci  \n",
+       "42                trasy  \n",
+       "43                linii  \n",
+       "44             szybkiej  \n",
+       "45                kolei  \n",
+       "46            miejskiej  \n",
+       "47                       \n",
+       "48                       \n",
+       "49                       \n",
+       "50                       \n",
+       "51                       \n",
+       "52         przechylenia  \n",
+       "53                   do  \n",
+       "54           usÅ‚yszenia  "
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx w czym mogÄ™ pomÃ³c ? moje uszanowanie panu proszÄ™ pana chcÄ™ siÄ™ upewniÄ‡ czy na ulicÄ™ SpartaÅ„skÄ… do szpitala to jeÅºdzi sto dziewiÄ™tnaÅ›cie ? nie proszÄ™ pana sto osiemnaÅ›cie sto osiemnaÅ›cie sto osiemnaÅ›cie bÄ…dÅº sto dwadzieÅ›cia dwa dojeÅ¼dÅ¼a i sto dwadzieÅ›cia dwa tak proszÄ™ pana a sto osiemnaÅ›cie czy on przejeÅ¼dÅ¼a koÅ‚o Dworca Ochota ? koÅ‚o Dworca Ochota nie proszÄ™ pana skrÄ™ca przy ChaÅ‚ubiÅ„skiego w ChaÅ‚ubiÅ„skiego to to gdybym jechaÅ‚ przy Dworcu Centralnym pociÄ…giem z MilanÃ³wka to gdzie najlepiej w jaki a pan bÄ™dzie jechaÅ‚ ? od MilanÃ³wka pociÄ…giem elektrycznym ale czy wukadkÄ… czy Kolejami Mazowieckimi ? nie nie nie duÅ¼Ä… kolejÄ… duÅ¼Ä… czyli to najwygodniej by byÅ‚o wysiÄ…Å›Ä‡ na ÅšrÃ³dmieÅ›ciu ÅšrÃ³dmieÅ›cie tak ? tak i tutaj wyjÅ›Ä‡ na gÃ³rÄ™ i naprzeciwko Hotelu Polonia jest przystanek dla sto osiemnaÅ›cie aha na na MarszaÅ‚kowskiej ? to znaczy przystanek sam jest zlokalizowany na w Alejach Jerozolimskich w Alejach Jerozolimskich tak bo on jedzie naprzeciwko po aha naprzeciwko Hotelu Polonia rozumiem rozumiem sto osiemnaÅ›cie i on dojeÅ¼dÅ¼a do pod sam Instytut Reumatologii rozumiem aha ma tam przystanek tam jest koniec tam pÄ™tla tak znaczy koÅ„czy koÅ„czy przystanek dalej ale ma przystanek Instytutu Reumatologii rozumiem rozumiem rozumiem bardzo panu a sto dwadzieÅ›cia dwa z Nowego Åšwiatu tak sto dwadzieÅ›cia dwa to musiaÅ‚by pan z PowiÅ›la i troszeczkÄ™ dojÅ›Ä‡ to ja wiem to ja wiem tak dziÄ™kujÄ™ panu piÄ™knie proszÄ™ bardzo\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry proszÄ™ o pomoc moje uszanowanie panu proszÄ™ pana chcÄ™ siÄ™ upewniÄ‡ czy na ulicÄ™ spartaÅ„skÄ… do szpi to jeÅºdzi 119 nie proszÄ™ pana 118 118 118 bÄ…dÅº 122 dojeÅ¼dÅ¼a i 122 tak proszÄ™ pana 118 czy on przejeÅ¼dÅ¼a koÅ‚o dworca ochota koÅ‚o dworca ochota nie proszÄ™ pana skrÄ™ca przy chaÅ‚ubiÅ„skiego chaÅ‚biÅ„ski gdyby przy dworcu centralnym pociÄ…giem z milanÃ³wka to gdzie najlepiej w jaki a pan bÄ™dzie jechaÅ‚ od milanÃ³wka po sÅ‚yszymy ale czy wkÅ‚adkÄ… czego miaÅ‚am nie duÅ¼Ä… kolejÄ… duÅ¼Ä… czyli to najwygodniej by byÅ‚o wysiÄ…Å›Ä‡ na Å›rÃ³dmieÅ›ciu Å›rÃ³dmieÅ›cie tak i tutaj wejÅ›Ä‡ i naprzeciwko hotelu polonia jest przystanek dla 118 aha na na marszaÅ‚kowskiej to znaczy przystanek sam jest zlokalizowany na w alejach jarosz w alejach jerozolimskich ta albo religiÄ… dziwko bo ha naprzeciwko hotelu polonia rozumiem rozumiem 118 i on dojeÅ¼dÅ¼a do pod tu traumatologii rozumiem aha ma tam przystanek tam jest koniec tora rent znaczy koÅ„czy koÅ„czy przystanek dalej ale ma monologi bardzo panu 20 tak 122 to musiaÅ‚by pan z powiÅ›la i troszeczkÄ™ dojÅ›Ä‡ to ja wiem tak dziÄ™kujÄ™ panu rÃ³wnieÅ¼ formie\n",
+      "\n",
+      "word wer {'classic_wer': 0.4759825327510917}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.3799126637554585}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>X</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>224</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>225</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>panu</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>panu</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>226</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>piÄ™knie</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>227</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>PART</td>\n",
+       "      <td>rÃ³wnieÅ¼</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>228</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>formie</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>229 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "        step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0         CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1         CORRECT                ADJ               dobry                 ADJ   \n",
+       "2        DELETION                  X                 xxx                       \n",
+       "3        DELETION                ADP                   w                       \n",
+       "4        DELETION               PRON                czym                       \n",
+       "..            ...                ...                 ...                 ...   \n",
+       "224       CORRECT               VERB            dziÄ™kujÄ™                VERB   \n",
+       "225       CORRECT               NOUN                panu                NOUN   \n",
+       "226      DELETION                ADV             piÄ™knie                       \n",
+       "227  SUBSTITUTION               VERB              proszÄ™                PART   \n",
+       "228  SUBSTITUTION                ADV              bardzo                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dzieÅ„  \n",
+       "1                  dobry  \n",
+       "2                         \n",
+       "3                         \n",
+       "4                         \n",
+       "..                   ...  \n",
+       "224             dziÄ™kujÄ™  \n",
+       "225                 panu  \n",
+       "226                       \n",
+       "227              rÃ³wnieÅ¼  \n",
+       "228               formie  \n",
+       "\n",
+       "[229 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx sÅ‚ucham dzieÅ„ dobry proszÄ™ pana mam pytanie jak dojadÄ™ do Nowego Åšwiatu i wsiÄ…dÄ™ tam w jakiÅ› sto szesnaÅ›cie czy tam dwa w stronÄ™ Å»oliborza chciaÅ‚bym wysiÄ…Å›Ä‡ na Placu Zamkowym czy one tam przejeÅ¼dÅ¼ajÄ… jak okrÄ…Å¼ajÄ… czy wracajÄ… na Plac Zamkowy ? tak aha czyli jakoÅ› tam okrÄ…Å¼ajÄ… pewnie MazowieckÄ… albo coÅ› tam i zawracajÄ… na Plac Zamkowy tak ? tak dobrze dziÄ™kujÄ™ bardzo bardzo proszÄ™\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry sÅ‚ucham dzieÅ„ dobry proszÄ™ pana mam pytanie jak dojadÄ™ do nowego Å›wiatu i wsiÄ…dÄ™ tam w jakiÅ› proszÄ™ 62 w stronÄ™ Å¼oliborza chciaÅ‚bym wysiÄ…Å›Ä‡ na placu zamkowym czy one tam przejeÅ¼dÅ¼ajÄ… jak okrÄ…Å¼ajÄ… czy wracajÄ… na plac zamkowy tak aha czyli jakoÅ› tam okrÄ…Å¼ajÄ… pewnie mazowieckÄ… albo coÅ› tam i zawracajÄ… na plac zamkowy tak tak dobrze dziÄ™kujÄ™ bardzo proszÄ™\n",
+      "\n",
+      "word wer {'classic_wer': 0.2753623188405797}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.17391304347826086}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>64</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>dobrze</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>dobrze</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>65</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>66</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>67</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>68</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>69 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "   step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1    CORRECT                ADJ               dobry                 ADJ   \n",
+       "2   DELETION               NOUN                 xxx                       \n",
+       "3    CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4    CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "..       ...                ...                 ...                 ...   \n",
+       "64   CORRECT                ADV              dobrze                 ADV   \n",
+       "65   CORRECT               VERB            dziÄ™kujÄ™                VERB   \n",
+       "66  DELETION                ADV              bardzo                       \n",
+       "67   CORRECT                ADV              bardzo                 ADV   \n",
+       "68   CORRECT               VERB              proszÄ™                VERB   \n",
+       "\n",
+       "   hypothesis_word_text  \n",
+       "0                 dzieÅ„  \n",
+       "1                 dobry  \n",
+       "2                        \n",
+       "3               sÅ‚ucham  \n",
+       "4                 dzieÅ„  \n",
+       "..                  ...  \n",
+       "64               dobrze  \n",
+       "65             dziÄ™kujÄ™  \n",
+       "66                       \n",
+       "67               bardzo  \n",
+       "68               proszÄ™  \n",
+       "\n",
+       "[69 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dobry wieczÃ³r xxx sÅ‚ucham ? dobry wieczÃ³r chciaÅ‚abym zapytaÄ‡ o ktÃ³rej godzinie bÄ™dzie najbliÅ¼szy tramwaj numer dziesiÄ™Ä‡ z Dworca Centralnego w kierunku Woli juÅ¼ sprawdzam dwudziesta druga dwadzieÅ›cia szeÅ›Ä‡ ale to za trzy minuty nastÄ™pny czterdzieÅ›ci szeÅ›Ä‡ aha a proszÄ™ mi powiedzieÄ‡ a Ã³semka czy bÄ™dzie jeszcze ? wÄ…tpiÄ™ ale sprawdzÄ™ nie nie nie bÄ™dzie nie dobrze to dziÄ™kujÄ™ bardzo dobranoc proszÄ™ bardzo dobranoc\n",
+      "\n",
+      "asr transcript: dobry wieczÃ³r sÅ‚ucham dobry wieczÃ³r chciaÅ‚abym zapytaÄ‡ o ktÃ³rej godzinie bÄ™dzie najbliÅ¼szy tramwaj numer 10 centralnego w kierunku woli juÅ¼ sprawdzam dwudziesta druga 26 ale to za 3 minuty nastÄ™pny 46 aha proszÄ™ mi powiedzieÄ‡ a Ã³semka czy bÄ™dzie jeszcze reala sprawdza nie nie nie bÄ™dzie nie dobrze to dziÄ™kujÄ™ bardzo proszÄ™ bardzo dobranoc\n",
+      "\n",
+      "word wer {'classic_wer': 0.28125}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.21875}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PUNCT</td>\n",
+       "      <td>?</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>59</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>60</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>61</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>62</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>63</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dobranoc</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>64 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "   step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    CORRECT                ADJ               dobry                 ADJ   \n",
+       "1    CORRECT               NOUN             wieczÃ³r                NOUN   \n",
+       "2   DELETION               PRON                 xxx                       \n",
+       "3    CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4   DELETION              PUNCT                   ?                       \n",
+       "..       ...                ...                 ...                 ...   \n",
+       "59   CORRECT                ADV              bardzo                 ADV   \n",
+       "60  DELETION               NOUN            dobranoc                       \n",
+       "61   CORRECT               VERB              proszÄ™                VERB   \n",
+       "62   CORRECT                ADV              bardzo                 ADV   \n",
+       "63   CORRECT               NOUN            dobranoc                NOUN   \n",
+       "\n",
+       "   hypothesis_word_text  \n",
+       "0                 dobry  \n",
+       "1               wieczÃ³r  \n",
+       "2                        \n",
+       "3               sÅ‚ucham  \n",
+       "4                        \n",
+       "..                  ...  \n",
+       "59               bardzo  \n",
+       "60                       \n",
+       "61               proszÄ™  \n",
+       "62               bardzo  \n",
+       "63             dobranoc  \n",
+       "\n",
+       "[64 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx w czym mogÄ™ pomÃ³c ? a dzieÅ„ dobry jedno pytanko tak czy matka z dzieckiem jak wchodzi do z wÃ³zkiem wchodzi do tramwaju czy autobusu czy pÅ‚aci bilet ? jak to jest ? to znaczy jeÅ¼eli chodzi o dziecko ktÃ³re nie jeszcze nie chodzi do pierwszej klasy to jeÅºdzi bezpÅ‚atnie no dobrze ale w wÃ³zku w gÅ‚Ä™bokim wÃ³zku to wÃ³zek jako bagaÅ¼ nie podlega opÅ‚acie nie podlega nie a matka ? no tutaj jeÅ¼eli nie ma Å¼adnych praw do ulg to niestety ale bilety normalne wtedy aha nie ma tam Å¼e teÅ¼ trza pÅ‚aciÄ‡ po prostu no~ tak bilety tak aha no wÅ‚aÅ›nie siÄ™ zapytaÄ‡ czy to teÅ¼ jest ulga jakaÅ› czy nie nie nie tutaj w tym przypadku nie to tylko wÃ³zek z dzieckiem ewentualnie a matka to pÅ‚aci dokÅ‚adnie tak aha no to dziÄ™kujÄ™ proszÄ™ bardzo do widzenia do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry w czym mogÄ™ pomÃ³c a dzieÅ„ dobry jedno pytanko tak czy matka z dzieckiem jak wchodzi do z wÃ³zkiem wchodzi do czy pÅ‚aci bilet jak to jest to znaczy jeÅ¼eli chodzi o dziecko ktÃ³re nie jeszcze nie chodzi do pierwszej klasy to jeÅºdzi bezpÅ‚atnie no dobrze ale w wÃ³zku bokiem wÃ³zku to wÃ³zek jako nie podlega opÅ‚acie podlega a matka no tutaj jeÅ¼eli nie ma Å¼adnych praw do ulg to niestety ale bilety normalne wtedy aha nie ma tam Å¼e teÅ¼ trza pÅ‚aciÄ‡ po prostu tak tak na 20 lat zapytaÄ‡ czy to teÅ¼ jest ulga jakaÅ› czy nie nie nie tutaj w tym przypadku nie to tylko wÃ³zek z dzieckiem ewentualnie a matka to pÅ‚aci dokÅ‚adnie tak to dziÄ™kujÄ™ proszÄ™ bardzo do widzenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.15862068965517243}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.19863013698630136}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>X</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>141</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>142</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>143</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>144</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>145</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>146 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1     CORRECT                ADJ               dobry                 ADJ   \n",
+       "2    DELETION                  X                 xxx                       \n",
+       "3     CORRECT                ADP                   w                 ADP   \n",
+       "4     CORRECT               PRON                czym                PRON   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "141   CORRECT                ADV              bardzo                 ADV   \n",
+       "142  DELETION                ADP                  do                       \n",
+       "143  DELETION               NOUN            widzenia                       \n",
+       "144   CORRECT                ADP                  do                 ADP   \n",
+       "145   CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dzieÅ„  \n",
+       "1                  dobry  \n",
+       "2                         \n",
+       "3                      w  \n",
+       "4                   czym  \n",
+       "..                   ...  \n",
+       "141               bardzo  \n",
+       "142                       \n",
+       "143                       \n",
+       "144                   do  \n",
+       "145             widzenia  \n",
+       "\n",
+       "[146 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dobry wieczÃ³r xxx sÅ‚ucham dobry wieczÃ³r chciaÅ‚am siÄ™ zapytaÄ‡ o autobus sto siedemdziesiÄ…t dwa w stronÄ™ Dworca Zachodniego z Sadyby z przystanku kurczÄ™ ja nie wiem jak siÄ™ ten przystanek nazywa to jest przy Metrze RacÅ‚awicka jakoÅ› dwa najbliÅ¼sze jeÅ¼eli jeszcze jeÅ¼dÅ¼Ä… albo jeden proszÄ™ pani sto siedemdziesiÄ…t dwa skrzyÅ¼owanie OdyÅ„ca tak tak tak tak OdyÅ„ca chyba NiepodlegÅ‚oÅ›ci to jest przystanek OdyÅ„ca jeÅºdzi jeszcze w ogÃ³le ? tak z tym Å¼e bÄ™dÄ… to juÅ¼ zjazdy na zajezdniÄ™ czyli ? wiÄ™c tylko do do przystanku WoÅ‚oska czyli do do skrzyÅ¼owania Wo~ WoÅ‚oskiej a nie to nie to nie to nic to nic to dziÄ™kujÄ™ bardzo proszÄ™ bardzo do widzenia do usÅ‚yszenia\n",
+      "\n",
+      "asr transcript: dobry wieczÃ³r sÅ‚ucham dobry wieczÃ³r chciaÅ‚em siÄ™ zapytaÄ‡ o autobus 172 w stronÄ™ od niego sadyby z przystanku kurczÄ™ ja nie mam siÄ™ przystanek nazywa to jest przy metrze racÅ‚awicka jakoÅ› 2 najbliÅ¼sze jeÅ¼eli jeszcze jeÅ¼dÅ¼Ä… albo czy wyraÅ¼a pani 172 skrzyÅ¼owanie odyÅ„ca tak tak tak tak odyÅ„ca chyba zalegÅ‚oÅ›ci to jest przystanek odyÅ„ca wiesz gdzie jeszcze w ogÃ³le tak z tym Å¼e bÄ™dÄ… to juÅ¼ zjazdy na zajezdniÄ™ czyli Å¼e tylko do do przystanku woÅ‚oska czyli do nie proszÄ™ bardzo proszÄ™ bardzo do usÅ‚yszenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.42727272727272725}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.3153153153153153}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>wieczÃ³r</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>sÅ‚ucham</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>107</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>108</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>109</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>110</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>111</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>usÅ‚yszenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>usÅ‚yszenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>112 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0     CORRECT                ADJ               dobry                 ADJ   \n",
+       "1     CORRECT               NOUN             wieczÃ³r                NOUN   \n",
+       "2    DELETION               PRON                 xxx                       \n",
+       "3     CORRECT               VERB             sÅ‚ucham                VERB   \n",
+       "4     CORRECT                ADJ               dobry                 ADJ   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "107   CORRECT                ADV              bardzo                 ADV   \n",
+       "108  DELETION                ADP                  do                       \n",
+       "109  DELETION               NOUN            widzenia                       \n",
+       "110   CORRECT                ADP                  do                 ADP   \n",
+       "111   CORRECT               NOUN          usÅ‚yszenia                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dobry  \n",
+       "1                wieczÃ³r  \n",
+       "2                         \n",
+       "3                sÅ‚ucham  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "107               bardzo  \n",
+       "108                       \n",
+       "109                       \n",
+       "110                   do  \n",
+       "111           usÅ‚yszenia  \n",
+       "\n",
+       "[112 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: xxx dzieÅ„ dobry dzieÅ„ dobry informacja ? tak proszÄ™ pana jestem rencistÄ… KRUSu to jest Kasa Rolniczego Ubezpieczenia jaka mi zniÅ¼ka obowiÄ…zuje w transporcie czy w ogÃ³le nie pÅ‚acÄ™ bo bo nie mogÄ™ podjÄ…Ä‡ Å¼adnej pracy jak jestem a ma pan pierwszÄ… grupÄ™ inwalidzkÄ… ? to znaczy tam w KRUSie nie ma grup ale rentÄ™ pan dostaje tak ? rentÄ™ dostaje czterysta zÅ‚~ czterysta trzydzieÅ›ci zÅ‚otych i nie mogÄ™ podjÄ…Ä‡ Å¼adnej pracy bo w KRUSie po dostaniu renciÅ›ci nie nie nie nie moÅ¼na podjÄ…Ä‡ Å¼adnej pracy rozumiem momencik proszÄ™ pana jeÅ›li chodzi o rencistÃ³w to jeÅ›li to nie jest Å¼adna grupa inwalidzka pierwsza no to wtedy tylko jest zniÅ¼ka czterdzieÅ›ci osiem procent na podstawie odcinka renty na podstawie na podstawie aha musi pan mieÄ‡ odcinki renty ewentualnie no legitymacjÄ™ rencisty i czterdzieÅ›ci osiem procent zniÅ¼ki czterdzieÅ›ci osiem procent zniÅ¼ki tak legitymacja Å¼adna niepotrzebna w znaczy moÅ¼e pan mieÄ‡ legitymacjÄ™ ale to musi byÄ‡ jeszcze jakiÅ› dokument ze zdjÄ™ciem albo odcinek jak pan dostaje odcinki to odcinek wtedy czterdzieÅ›ci osiem procent a ja~ jak kupiÄ‡ gdzie kupiÄ‡ takie bilety ? proszÄ™ pana no na kaÅ¼dej poczcie moÅ¼e pan kupiÄ‡ tylko prosiÄ‡ z ulgÄ… czterdziestu osiem procent aha dobrze dziÄ™kujÄ™ proszÄ™\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry dzieÅ„ dobry informacja tak proszÄ™ pana jestem rencistÄ… kruszcu to jest kasa rolniczego ubezpieczenia jaka mi zniÅ¼ka obowiÄ…zuje w transporcie czy w ogÃ³le nie pÅ‚acÄ™ bo bo nie mogÄ™ podjÄ…Ä‡ Å¼adnej pracy jak jestem a ma pan pierwszÄ… grupÄ™ inwalidzkÄ… w gÅ‚osie nie ma grup ale rentÄ™ pan dostaje tak rentÄ™ dostaje 400 zÅ‚ote 430 zÅ‚otych i nie mogÄ™ podjÄ…Ä‡ Å¼adnej pracy bo w krusie po dostaniemy nie nie moÅ¼na podjÄ…Ä‡ Å¼adnej pracy rozumiem momencik proszÄ™ pana jeÅ›li chodzi o rencistÃ³w to jeÅ›li to nie jest Å¼adna grupa inwalidzka pier w sza no to wtedy tylko jest zniÅ¼ka 48 procent na podstawie odci kÄ™ty na nowodwory jeÅºdzi aha no to nie musi pan mieÄ‡ odcinki renty ewentualnie no legitymacjÄ™ rencisty i 48 procent zniÅ¼ki 48 procent zniÅ¼ki tak legitymacja Å¼adna niepotrzebna w tymÅ¼e po czym moÅ¼e mieÄ‡ legitymacjÄ™ ale to musi byÄ‡ jeszcze jakiÅ› dokument ze zdjÄ™ciem albo odcinek jak pan dostaje odcinki wtedy 48 procent a ja jak kupiÄ‡ gdzie kupiÄ‡ takie bilety proszÄ™ pana no na kaÅ¼dej poczcie moÅ¼e pan kupiÄ‡ tylko prosiÄ‡ z ulgÄ… czterdziestu oÅ›miu procent waha siÄ™ zostaÅ‚em skÄ…d nie konto juÅ¼ mam zapÅ‚aciÄ‡ 151 120 zÅ‚ote 120 zÅ‚otych to wtedy mogÄ™ zapÅ‚aciÄ‡ poÅ‚owÄ™ tej sumy liga nie dostaÅ‚ pan karÄ™ to nie moÅ¼na juÅ¼ finansowania przestawiÅ‚em dokumenty renty nie dogadam przestali legitymacjÄ™ i dowÃ³d osobisty zÄ™ba nie wziÄ…Å‚ pod uwagÄ™ musimy i nawigacja wie pan co to von zadzwoni podam panu numer do dziaÅ‚u windykacji trzeba by do nich zadzwoniÄ‡ 800 820 6 826 54 51 54 54 51 5 dziewiÄ™Ä‡dziesiÄ…ty 1000 dlatego sprawy a ja siÄ™ uzyskaÄ‡ w kasie rolniczego ubezpieczenia spoÅ‚ecznego pierwszÄ… grupÄ™ a to nie wiem proszÄ™ pana wÅ›rÃ³d siÄ™ tam nieÅ‚ad jÄ™zyk jako opiekun opiekuÅ„cze bez pierwsza grupa zÅ‚ymi opiekuna jeszcze byÅ‚a pierwsza grupa inwalidzka to wtedy opiekun bezpÅ‚atnie jeÅºdzi ale to juÅ¼ niezdolne do pracy i samodzielnej egzystencji no to teÅ¼ by to wtedy mogÄ™ jeÅºdziÄ‡ bez w darmowo dach jeÅ›li byÅ‚aby pierwsza grupa inwalidzka nieznany samodzielnej decyzji pierwszego Å¼yje pierwsza grupa niezdolne do pracy i samodzielnej egzystencji pierwsza globalna tak aha dobrze proszÄ™\n",
+      "\n",
+      "word wer {'classic_wer': 1.065326633165829}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.9751243781094527}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>357</th>\n",
+       "      <td>INSERTION</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>globalna</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>358</th>\n",
+       "      <td>INSERTION</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>tak</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>359</th>\n",
+       "      <td>INSERTION</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td>PART</td>\n",
+       "      <td>aha</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>360</th>\n",
+       "      <td>INSERTION</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>dobrze</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>361</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>362 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "     step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0     DELETION               PRON                 xxx                       \n",
+       "1      CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "2      CORRECT                ADJ               dobry                 ADJ   \n",
+       "3      CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "4      CORRECT                ADJ               dobry                 ADJ   \n",
+       "..         ...                ...                 ...                 ...   \n",
+       "357  INSERTION                                                        ADJ   \n",
+       "358  INSERTION                                                        ADV   \n",
+       "359  INSERTION                                                       PART   \n",
+       "360  INSERTION                                                        ADV   \n",
+       "361    CORRECT               VERB              proszÄ™                VERB   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                         \n",
+       "1                  dzieÅ„  \n",
+       "2                  dobry  \n",
+       "3                  dzieÅ„  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "357             globalna  \n",
+       "358                  tak  \n",
+       "359                  aha  \n",
+       "360               dobrze  \n",
+       "361               proszÄ™  \n",
+       "\n",
+       "[362 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx w czym mogÄ™ pomÃ³c ? proszÄ™ pana ja chciaÅ‚am siÄ™ dowiedzieÄ‡ czy sto szeÅ›Ä‡dziesiÄ…t siedem jeÅºdzi CioÅ‚ka czy nadal kursuje tÄ… innÄ… trasÄ… to znaczy jeszcze ma trasÄ™ objazdowÄ… objazdowÄ… tak ? i jeszcze tak a to gdzie siÄ™ zatrzymuje a zatrzymuje siÄ™ przy jaki w stronÄ™ Wawelskiej czy zatrzymuje siÄ™ przy rogu no naprzeciw CioÅ‚ka i na GÃ³rczewskiej tam siÄ™ zatrzymuje ? to znaczy naprzeciw CioÅ‚ka i GÃ³rczewskiej aha czy siÄ™ zatrzymuje jak on jedzie bo ja chciaÅ‚am jechaÄ‡ na WawelskÄ… do szpitala onkologicznego nie wiem gdzie tam moÅ¼na najbliÅ¼ej z tego z nie tutaj z no z GÃ³rczewskiej proszÄ™ GÃ³rczewskiej przy Syreny gdzie najbliÅ¼ej wÅ‚aÅ›nie tam moÅ¼na no wsiÄ…Å›Ä‡ przesiÄ…Å›Ä‡ siÄ™ proszÄ™ paniÄ… to autobus bÄ™dzie jechaÅ‚ tak on jedzie ulicÄ… ObozowÄ… potem skrÄ™ca w Deotymy o zaraz to ja sobie zapiszÄ™ moÅ¼e dobrze ale gdzie siÄ™ zatrzymuje pan mnie powie proszÄ™ paniÄ… to najlepiej to tutaj Obozowa gdzie ? proszÄ™ paniÄ… na Obozowej to byÅ‚by przystanek tutaj KoÅ‚o bÄ…dÅº Dalibora KoÅ‚o to jest na Kole tak ? tak potem on jak jak pÄ™tla tam przy dziaÅ‚kach ? tak dokÅ‚adnie tak ? tak ano to dobrze to tam moÅ¼e ewentualnie jak on wyjedzie z Deotymy ale to dopiero musiaÅ‚aby pani przejÅ›Ä‡ na ulicÄ™ ElekcyjnÄ… ktÃ³ra odchodzi od GÃ³rczewskiej no to nie to to lepiej mnie tam podjadÄ™ tramwajem podejdÄ™ do rozumiem tramwaju podjadÄ™ tramwajem mi to znaczy przy na KsiÄ™cia Janusza przy KsiÄ™cia Janusza gdzieÅ› tak tak niedaleko KsiÄ™cia Janusza i on tam siÄ™ zatrzymuje wÅ‚aÅ›nie aha to tak znaczy ja to jest tym przy tym bazarze znaczy tak ? tak niedaleko wÅ‚aÅ›nie tego bazaru tutaj byÅ‚by przystanek wÅ‚aÅ›nie Dalibora wtedy to jest zaraz przy bazarze na przy bazarze bo przy bazarze jest taki przystanek tak dokÅ‚adnie to tam tak ? tak to dziÄ™kujÄ™ proszÄ™ bardzo do widzenia do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry w czym mogÄ™ pomÃ³c proszÄ™ pana ja chciaÅ‚am siÄ™ dowiedzieÄ‡ czy 167 jeÅºdzi cioÅ‚ka czy nadal kursuje tÄ… ojej no tak czyli jeszcze ma trasÄ™ objazdowÄ… objazdowÄ… tak i jeszcze tak a to gdzie siÄ™ zatrzymuje a zatrzymuje siÄ™ przy jaki w stronÄ™ wawel czy zatrzymuje siÄ™ przy rogu no naprzeciw cioÅ‚ka jego na gÃ³rczewskiej tam siÄ™ zatrzymuje to znaczy naprzeciw cioÅ‚ka aha czy siÄ™ zatrzymuje jak on jedzie bo ja chciaÅ‚am jechaÄ‡ na wawelskÄ… do szpitala onkologicznego nie wiem gdzie tam moÅ¼na grzegorz tu dojÅ›Ä‡ do gÃ³rczewskiej doroszewskiej przesrane gdzie najbliÅ¼ej wÅ‚aÅ›nie tam moÅ¼na na trasie siÄ™ proszÄ™ paniÄ… to autobus bÄ™dzie jechaÅ‚ tak on jedzie ulicÄ… obozowÄ… potem skrÄ™ca w deotymy zaraz to ja sobie zapiszÄ™ moÅ¼e dobrze ale przyjaciel to otrzymuje pan je bowiem proszÄ™ mojÄ… najlepiej Å›wiÄ™to tutaj no pozowaÅ‚ gdzie proszÄ™ paniÄ… to byÅ‚by przystanek tutaj koÅ‚o bÄ…dÅº dalibora koÅ‚o to jest trudna ale to tak potem on jak ja k pÄ™tla tam na przydziaÅ‚ tak dokÅ‚adnie tak tak ano to dobrze to tam moÅ¼e ewentualnie jak on wyjedzie z deotymy ale to dopiero musiaÅ‚a pani przejÅ›Ä‡ na ulicÄ™ elekcyjnÄ… ktÃ³ra odchodzi od gÃ³rczewskiej no to nie to miaÅ‚ tam podjadÄ™ tramwajem podejdÄ™ do tramwaju podjadÄ™ tramwajem mi do okoÅ‚o to znaczy Å¼e przelew na ksiÄ™cia chciaÅ‚em musiaÅ‚y gdzieÅ› tak tak niedaleko ksiÄ™cia janusza nie on tam siÄ™ zatrzymuje wÅ‚aÅ›nie aha to tak znaczy ja jestem przy tym bazarze znaczy tak tak niedaleko wÅ‚aÅ›nie tego bazaru tu taj byÅ‚by przystanek wÅ‚aÅ›nie dalibora wtedy przy bazarze trzeba 2 przy bazarze jest taki przystanek tak dokÅ‚adnie to tam tak tak to dziÄ™kujÄ™ proszÄ™ bardzo do widzenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.3377049180327869}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.2754098360655738}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>X</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>304</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>305</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>306</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>307</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>308</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>309 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1     CORRECT                ADJ               dobry                 ADJ   \n",
+       "2    DELETION                  X                 xxx                       \n",
+       "3     CORRECT                ADP                   w                 ADP   \n",
+       "4     CORRECT               PRON                czym                PRON   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "304   CORRECT                ADV              bardzo                 ADV   \n",
+       "305  DELETION                ADP                  do                       \n",
+       "306  DELETION               NOUN            widzenia                       \n",
+       "307   CORRECT                ADP                  do                 ADP   \n",
+       "308   CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dzieÅ„  \n",
+       "1                  dobry  \n",
+       "2                         \n",
+       "3                      w  \n",
+       "4                   czym  \n",
+       "..                   ...  \n",
+       "304               bardzo  \n",
+       "305                       \n",
+       "306                       \n",
+       "307                   do  \n",
+       "308             widzenia  \n",
+       "\n",
+       "[309 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: xxx dzieÅ„ dobry dzieÅ„ dobry proszÄ™ pana ja potrzebujÄ™ dojechaÄ‡ z przystanku MÅ‚odzieÅ„cza tak z Ronda Waszyngtona moÅ¼e pan mi podaÄ‡ podaÄ‡ jak mogÄ™ dojechaÄ‡ od przystanku MÅ‚odzieÅ„cza ? tak do trzeba od MÅ‚odzieÅ„czej wsiÄ…Å›Ä‡ albo sto dziewiÄ™Ä‡dziesiÄ…t piÄ™Ä‡set dwanaÅ›cie siedemset osiemnaÅ›cie dojechaÄ‡ do Dworca WileÅ„skiego do WileÅ„skiego tak ? tak i z WileÅ„skiego najlepiej w tramwaj dwadzieÅ›cia piÄ™Ä‡ ewentualnie autobus sto jeden z piÄ™Ä‡set dziewiÄ™Ä‡ a czy z WileÅ„skiego juÅ¼ tramwajem tak ? tak tramwaj dwadzieÅ›cia piÄ™Ä‡ dwadzieÅ›cia piÄ™Ä‡ tak ? tak dobrze dziÄ™kujÄ™ bardzo proszÄ™ bardzo a proszÄ™ pana moÅ¼e pan mi jeszcze powiedzieÄ‡ czy ulica Francuska jest w tych okolicach ? jeszcze raz pan powtÃ³rzy ? ulica Francuska ona odchodzi od Ronda Waszyngtona odchodzi tak ? tak a Francuska piÄ™Ä‡dziesiÄ…t to jest jeszcze trochÄ™ drogi ? a zaraz sprawdzÄ™ nie to bÄ™dzie przy Rondzie Waszyngtona przy przy Rondzie dziÄ™kujÄ™ bardzo proszÄ™ do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry dzieÅ„ dobry proszÄ™ pana ja potrzebujÄ™ dojechaÄ‡ z przystanku mÅ‚odzieÅ„cza tak z ronda waszyngtona moÅ¼e daÄ‡ podaÄ‡ jak mogÄ™ dojechaÄ‡ mÅ‚odzieÅ„cza tak do trzeba od mÅ‚odzieÅ„czej wsiÄ…Å›Ä‡ albo 190 512 718 dojechaÄ‡ do dworca wileÅ„skiego do wileÅ„skiego data wiesz wileÅ„skiego najlepiej w tramwaj 25 ewentualnie autobus 101 z 509 a czy z wileÅ„skiego juÅ¼ tramwajem tramwaj 25 25 tak tak dobrze dziÄ™kujÄ™ bardzo proszÄ™ bardzo a proszÄ™ pana moÅ¼e pan mi jeszcze powiedzieÄ‡ czy ulica francuska okolicach jeszcze raz pan powtÃ³rzy ulica francuska ona odchodzi od ronda waszyngtona odchodzi tak a francuska 50 to jest jeszcze trochÄ™ drogi a za nie to bÄ™dzie przy rondzie waszyngtona przy rondzie dziÄ™kujÄ™ bardzo do widzenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.4315068493150685}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.3424657534246575}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>141</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>142</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>bardzo</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>143</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>proszÄ™</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>144</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>145</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>146 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0    DELETION               PRON                 xxx                       \n",
+       "1     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "2     CORRECT                ADJ               dobry                 ADJ   \n",
+       "3     CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "4     CORRECT                ADJ               dobry                 ADJ   \n",
+       "..        ...                ...                 ...                 ...   \n",
+       "141   CORRECT               VERB            dziÄ™kujÄ™                VERB   \n",
+       "142   CORRECT                ADV              bardzo                 ADV   \n",
+       "143  DELETION               VERB              proszÄ™                       \n",
+       "144   CORRECT                ADP                  do                 ADP   \n",
+       "145   CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                         \n",
+       "1                  dzieÅ„  \n",
+       "2                  dobry  \n",
+       "3                  dzieÅ„  \n",
+       "4                  dobry  \n",
+       "..                   ...  \n",
+       "141             dziÄ™kujÄ™  \n",
+       "142               bardzo  \n",
+       "143                       \n",
+       "144                   do  \n",
+       "145             widzenia  \n",
+       "\n",
+       "[146 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "gold transcript: dzieÅ„ dobry xxx w czym mogÄ™ pomÃ³c ? dzieÅ„ dobry proszÄ™ pana chciaÅ‚am uzyskaÄ‡ od pana takÄ… informacjÄ™ proszÄ™ mi powiedzieÄ‡ Å¼e chodzi mi o ulgi chodzi mi o ulgi czy jeÅ¼eli dziecko ma bezpÅ‚atne przejazdy autobusowe i tramwajowe czy na tÄ… szybkÄ… emzetkÄ™ dziecko teÅ¼ ma musi pÅ‚aciÄ‡ bilet ? to znaczy na SzybkÄ… Kolej MiejskÄ… ? tak nie proszÄ™ paniÄ… te i te bezpÅ‚atne przejazdy rÃ³wnieÅ¼ przysÅ‚ugujÄ… i na ten Å›rodek transportu aha dobrze dobrze bo wie pan bo dziecko ma po prostu bezpÅ‚atnie jeÅºdzi autobusami i tramwajami ja jestem jako jego opiekun po prostu chciaÅ‚am siÄ™ tylko dowiedzieÄ‡ czy przysÅ‚uguje nam taka ulga jeÅ¼eli dziecko ma takÄ… legitymacjÄ™ i po prostu czy dziecko bÄ™dzie moÅ¼e czy dziecko moÅ¼e jeÅºdziÄ‡ na tÄ… szybkÄ… kolej na tÄ… legitymacjÄ™ tak ? tak proszÄ™ paniÄ… ze wzglÄ™du na to Å¼e na Szybkiej Kolei Miejskiej obowiÄ…zuje ten sam regulamin co w pojazdach komunikacji miejskiej czyli autobusy tramwaje metro aha to jest ten sam rodzaj regulaminu i proszÄ™ mi powiedzieÄ‡ ona w ogÃ³le jeÅºdzi co pÃ³Å‚ godziny ? znaczy tutaj jest tak nieregularnie co pÃ³Å‚ godziny co co czterdzieÅ›ci minut czasami to zaleÅ¼y tutaj od pory dnia szczerze mÃ³wiÄ…c aha dobrze bardzo panu dziÄ™kujÄ™ Å¼yczÄ™ miÅ‚ego proszÄ™ bardzo dnia do widzenia dziÄ™kujÄ™ wzajemnie do widzenia\n",
+      "\n",
+      "asr transcript: dzieÅ„ dobry w czym mogÄ™ pomÃ³c dzieÅ„ dobry proszÄ™ pana chciaÅ‚am uzyskaÄ‡ od pana takÄ… informacjÄ™ proszÄ™ mi powiedzieÄ‡ Å¼e chodzi mi o chodzi mi o ulgi czy jeÅ¼eli dziecko ma bezpÅ‚atne przejazdy autobusowe i tramwajowe czy na tÄ… szybkÄ… klucz do em zetkÄ™ musi pÅ‚aciÄ‡ bilet to znaczy na szybkÄ… kolej miejskÄ… tak nie proszÄ™ paniÄ… te i te bezpÅ‚atne przejazdy rÃ³wnieÅ¼ przysÅ‚ugujÄ… i na ten Å›rodek transportu aha dobrze dobrze bo wie pan bo dziecko ma po prostu bezpÅ‚atnie jeÅºdzi autobusami i tramwajami ja jestem jako jego opiekun po prostu chciaÅ‚am siÄ™ czy przysÅ‚uguje nam taka ulga jeÅ¼eli dziecko ma takÄ… legitymacjÄ™ i po prostu czy dziecko bÄ™dzie moÅ¼e czy dziecko moÅ¼e jeÅºdziÄ‡ na tÄ… szybkÄ… kolej na tÄ… legitymacjÄ™ chyba niÄ… ze wzglÄ™du na to Å¼e na szybkiej kolei miejskiej obowiÄ…zuje ten sam regulamin co w pojazdach komunikacji miejskiej czyli autobusy tramwaje metro aha to jest ten sam rodzaj regule i proszÄ™ mi powiedzieÄ‡ ona w ogÃ³le jeÅºdzi co pÃ³Å‚ godziny znaczy tutaj jest tak nieregularnie co pÃ³Å‚ godziny co co 40 minut czasami to zaleÅ¼y od pory dnia aÅ¼ aha dobrze bardzo panu dziÄ™kujÄ™ Å¼yczÄ™ miÅ‚ego dnia dobrze to ja wzajemnie do widzenia\n",
+      "\n",
+      "word wer {'classic_wer': 0.15566037735849056}\n",
+      "\n",
+      "pos wer {'classic_wer': 0.1179245283018868}\n",
+      "\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>step_type</th>\n",
+       "      <th>reference_word_pos</th>\n",
+       "      <th>reference_word_text</th>\n",
+       "      <th>hypothesis_word_pos</th>\n",
+       "      <th>hypothesis_word_text</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>dzieÅ„</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "      <td>ADJ</td>\n",
+       "      <td>dobry</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>DELETION</td>\n",
+       "      <td>X</td>\n",
+       "      <td>xxx</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>w</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>czym</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>207</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>AUX</td>\n",
+       "      <td>to</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>208</th>\n",
+       "      <td>SUBSTITUTION</td>\n",
+       "      <td>VERB</td>\n",
+       "      <td>dziÄ™kujÄ™</td>\n",
+       "      <td>PRON</td>\n",
+       "      <td>ja</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>209</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>wzajemnie</td>\n",
+       "      <td>ADV</td>\n",
+       "      <td>wzajemnie</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>210</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "      <td>ADP</td>\n",
+       "      <td>do</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>211</th>\n",
+       "      <td>CORRECT</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "      <td>NOUN</td>\n",
+       "      <td>widzenia</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>212 rows Ã— 5 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "        step_type reference_word_pos reference_word_text hypothesis_word_pos  \\\n",
+       "0         CORRECT               NOUN               dzieÅ„                NOUN   \n",
+       "1         CORRECT                ADJ               dobry                 ADJ   \n",
+       "2        DELETION                  X                 xxx                       \n",
+       "3         CORRECT                ADP                   w                 ADP   \n",
+       "4         CORRECT               PRON                czym                PRON   \n",
+       "..            ...                ...                 ...                 ...   \n",
+       "207  SUBSTITUTION               NOUN            widzenia                 AUX   \n",
+       "208  SUBSTITUTION               VERB            dziÄ™kujÄ™                PRON   \n",
+       "209       CORRECT                ADV           wzajemnie                 ADV   \n",
+       "210       CORRECT                ADP                  do                 ADP   \n",
+       "211       CORRECT               NOUN            widzenia                NOUN   \n",
+       "\n",
+       "    hypothesis_word_text  \n",
+       "0                  dzieÅ„  \n",
+       "1                  dobry  \n",
+       "2                         \n",
+       "3                      w  \n",
+       "4                   czym  \n",
+       "..                   ...  \n",
+       "207                   to  \n",
+       "208                   ja  \n",
+       "209            wzajemnie  \n",
+       "210                   do  \n",
+       "211             widzenia  \n",
+       "\n",
+       "[212 rows x 5 columns]"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n",
+      "--------------------------------------------------------------\n"
+     ]
+    }
+   ],
+   "source": [
+    "for it in list(record_provider.get_all_records())[:20]:\n",
+    "    show_report_for(it)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "27797bad-c92a-45a6-87f2-071645c18150",
+   "metadata": {},
+   "outputs": [],
+   "source": []
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.8.13"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}
diff --git a/examples/luna/pos_processing/__init__.py b/examples/luna/pos_processing/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/examples/luna/pos_processing/asr_spacy_token_pos_processing_task.py b/examples/luna/pos_processing/asr_spacy_token_pos_processing_task.py
new file mode 100644
index 0000000..1f6b11e
--- /dev/null
+++ b/examples/luna/pos_processing/asr_spacy_token_pos_processing_task.py
@@ -0,0 +1,24 @@
+from dataclasses import dataclass
+from typing import Any
+
+from examples.luna.pos_processing.spacy_token_pos_processing_task import SpacyTokenPosProcessingTask
+
+
+@dataclass
+class WordSpan:
+    text: str
+    index_start: int
+    index_end: int
+
+
+class AsrSpacyTokenPosProcessingTask(SpacyTokenPosProcessingTask):
+    _spacy_property_name: str
+    _nlp: Any
+    _input_property_name: str
+
+    def __init__(self, task_name: str, spacy_property_name: str, require_update: bool,
+                 input_property_name: str):
+        super().__init__(task_name, spacy_property_name, require_update, input_property_name)
+
+    def get_transcript_to_process(self, property_value: Any) -> str:
+        return property_value['full_text']
diff --git a/examples/luna/pos_processing/gold_transcript_spacy_token_pos_processing_task.py b/examples/luna/pos_processing/gold_transcript_spacy_token_pos_processing_task.py
new file mode 100644
index 0000000..52861da
--- /dev/null
+++ b/examples/luna/pos_processing/gold_transcript_spacy_token_pos_processing_task.py
@@ -0,0 +1,24 @@
+from dataclasses import dataclass
+from typing import Any
+
+from examples.luna.pos_processing.spacy_token_pos_processing_task import SpacyTokenPosProcessingTask
+
+
+@dataclass
+class WordSpan:
+    text: str
+    index_start: int
+    index_end: int
+
+
+class GoldTranscriptSpacyTokenPosProcessingTask(SpacyTokenPosProcessingTask):
+    _spacy_property_name: str
+    _nlp: Any
+    _input_property_name: str
+
+    def __init__(self, task_name: str, spacy_property_name: str, require_update: bool,
+                 input_property_name: str):
+        super().__init__(task_name, spacy_property_name, require_update, input_property_name)
+
+    def get_transcript_to_process(self, property_value: Any) -> str:
+        return ' '.join([it['word'] for it in property_value])
diff --git a/examples/luna/pos_processing/spacy_pos_wer_processing_task.py b/examples/luna/pos_processing/spacy_pos_wer_processing_task.py
new file mode 100644
index 0000000..23d4f57
--- /dev/null
+++ b/examples/luna/pos_processing/spacy_pos_wer_processing_task.py
@@ -0,0 +1,85 @@
+from typing import Any, List, Dict
+
+from sziszapangma.core.alignment.alignment_classic_calculator import AlignmentClassicCalculator
+from sziszapangma.core.alignment.alignment_step import AlignmentStep
+from sziszapangma.core.wer.wer_calculator import WerCalculator
+from sziszapangma.integration.mapper.alignment_step_mapper import AlignmentStepMapper
+from sziszapangma.integration.repository.experiment_repository import ExperimentRepository
+from sziszapangma.integration.task.processing_task import ProcessingTask
+from sziszapangma.model.model import Word
+from sziszapangma.model.relation_manager import RelationManager
+
+_CLASSIC_WER = "classic_wer"
+
+
+class SpacyPosWerProcessingTask(ProcessingTask):
+    _gold_transcript_pos_property_name: str
+    _asr_pos_property_name: str
+    _pos_alignment_wer: str
+    _pos_metrics_wer: str
+    _alignment_classic_calculator: AlignmentClassicCalculator
+    _wer_calculator: WerCalculator
+
+    def __init__(
+        self,
+        task_name: str,
+        gold_transcript_pos_property_name: str,
+        require_update: bool,
+        asr_pos_property_name: str,
+        pos_alignment_wer: str,
+        pos_metrics_wer: str
+    ):
+        super().__init__(task_name, require_update)
+        self._gold_transcript_pos_property_name = gold_transcript_pos_property_name
+        self._asr_pos_property_name = asr_pos_property_name
+        self._pos_alignment_wer = pos_alignment_wer
+        self._pos_metrics_wer = pos_metrics_wer
+        self._alignment_classic_calculator = AlignmentClassicCalculator()
+        self._wer_calculator = WerCalculator()
+
+    def run_single_process(
+        self,
+        record_id: str,
+        experiment_repository: ExperimentRepository,
+        relation_manager: RelationManager,
+    ):
+        gold_transcript_pos = [
+            Word(id=it['id'], type='Word', text=it['pos'])
+            for it in
+            experiment_repository.get_property_for_key(
+                record_id, self._gold_transcript_pos_property_name)
+        ]
+        asr_transcript_pos = [
+            Word(id=it['id'], type='Word', text=it['pos'])
+            for it in
+            experiment_repository.get_property_for_key(record_id, self._asr_pos_property_name)
+        ]
+        if gold_transcript_pos is not None and asr_transcript_pos is not None:
+            alignment_steps = self._get_alignment(gold_transcript_pos, asr_transcript_pos)
+            experiment_repository.update_property_for_key(
+                record_id,
+                self._pos_alignment_wer,
+                [AlignmentStepMapper.to_json_dict(it) for it in alignment_steps],
+            )
+            experiment_repository.update_property_for_key(
+                record_id, self._pos_metrics_wer, self.calculate_metrics(alignment_steps)
+            )
+
+    def _get_alignment(
+        self, gold_transcript: List[Word], asr_transcript: List[Word]
+    ) -> List[AlignmentStep]:
+        return self._alignment_classic_calculator.calculate_alignment(
+            reference=gold_transcript, hypothesis=asr_transcript
+        )
+
+    def calculate_metrics(self, alignment_steps: List[AlignmentStep]) -> Dict[str, Any]:
+        """Calculate all metrics for data sample."""
+        metrics = dict()
+        metrics[_CLASSIC_WER] = self._wer_calculator.calculate_wer(alignment_steps)
+        return metrics
+
+    def skip_for_record(self, record_id: str, experiment_repository: ExperimentRepository) -> bool:
+        return (
+            experiment_repository.get_property_for_key(record_id, self._pos_metrics_wer)
+            is not None
+        )
diff --git a/examples/luna/pos_processing/spacy_token_pos_processing_task.py b/examples/luna/pos_processing/spacy_token_pos_processing_task.py
new file mode 100644
index 0000000..2c8bb0b
--- /dev/null
+++ b/examples/luna/pos_processing/spacy_token_pos_processing_task.py
@@ -0,0 +1,58 @@
+import uuid
+from abc import abstractmethod, ABC
+from dataclasses import dataclass
+from typing import Any, Dict
+
+import spacy
+from spacy.tokens import Token
+
+from sziszapangma.integration.repository.experiment_repository import ExperimentRepository
+from sziszapangma.integration.task.processing_task import ProcessingTask
+from sziszapangma.model.relation_manager import RelationManager
+
+
+@dataclass
+class WordSpan:
+    text: str
+    index_start: int
+    index_end: int
+
+
+class SpacyTokenPosProcessingTask(ProcessingTask, ABC):
+    _spacy_model_name: str
+    _nlp: Any
+    _input_property_name: str
+    _spacy_property_name: str
+
+    def __init__(
+        self,
+        task_name: str,
+        spacy_property_name: str,
+        require_update: bool,
+        input_property_name: str
+    ):
+        super().__init__(task_name, require_update)
+        self._spacy_property_name = spacy_property_name
+        self._nlp = spacy.load("pl_core_news_lg")
+        self._input_property_name = input_property_name
+
+    def run_single_process(self, record_id: str, experiment_repository: ExperimentRepository,
+                           relation_manager: RelationManager):
+        test_property = experiment_repository.get_property_for_key(
+            record_id, self._input_property_name)
+        document = self._nlp(self.get_transcript_to_process(test_property))
+
+        spacy_result = [self.token_to_result_dict(token) for token in document]
+        experiment_repository.update_property_for_key(record_id, self._spacy_property_name,
+                                                      spacy_result)
+
+    @staticmethod
+    def token_to_result_dict(token: Token) -> Dict[str, str]:
+        return {'id': str(uuid.uuid4()), 'word': token.text, 'pos': token.pos_}
+
+    @abstractmethod
+    def get_transcript_to_process(self, property_value: Any) -> str:
+        pass
+
+    def skip_for_record(self, record_id: str, experiment_repository: ExperimentRepository) -> bool:
+        return experiment_repository.property_exists(record_id, self._spacy_property_name)
diff --git a/poetry.lock b/poetry.lock
index 67d2132..1a1aa4f 100644
--- a/poetry.lock
+++ b/poetry.lock
@@ -169,6 +169,18 @@ category = "main"
 optional = false
 python-versions = ">=3.6"
 
+[[package]]
+name = "minio"
+version = "7.1.6"
+description = "MinIO Python SDK for Amazon S3 Compatible Cloud Storage"
+category = "main"
+optional = false
+python-versions = "*"
+
+[package.dependencies]
+certifi = "*"
+urllib3 = "*"
+
 [[package]]
 name = "more-itertools"
 version = "8.12.0"
@@ -470,7 +482,7 @@ developer = []
 [metadata]
 lock-version = "1.1"
 python-versions = "^3.8"
-content-hash = "bab8ca229cd4148ad31bc571be09a6da007f8c00cf95d0a4f52dc11ad1ad9887"
+content-hash = "5acab1de3fd0643e686d2b1ae70c5d63fa81315b0543d3608083c57b11a814cd"
 
 [metadata.files]
 appdirs = [
@@ -599,6 +611,10 @@ markupsafe = [
     {file = "MarkupSafe-2.0.1-cp39-cp39-win_amd64.whl", hash = "sha256:693ce3f9e70a6cf7d2fb9e6c9d8b204b6b39897a2c4a1aa65728d5ac97dcc1d8"},
     {file = "MarkupSafe-2.0.1.tar.gz", hash = "sha256:594c67807fb16238b30c44bdf74f36c02cdf22d1c8cda91ef8a0ed8dabf5620a"},
 ]
+minio = [
+    {file = "minio-7.1.6-py3-none-any.whl", hash = "sha256:1ed6d4df7bbd505be984657ecce81ac6b196f434acf23315227aa892c98f9531"},
+    {file = "minio-7.1.6.tar.gz", hash = "sha256:54a5e6eefcc958c88c493cf116ba86e52341efab88686163594f2e9410385124"},
+]
 more-itertools = [
     {file = "more-itertools-8.12.0.tar.gz", hash = "sha256:7dc6ad46f05f545f900dd59e8dfb4e84a4827b97b3cfecb175ea0c7d247f6064"},
     {file = "more_itertools-8.12.0-py3-none-any.whl", hash = "sha256:43e6dd9942dffd72661a2c4ef383ad7da1e6a3e968a927ad7a6083ab410a688b"},
diff --git a/pyproject.toml b/pyproject.toml
index 136e373..e95bac9 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -20,6 +20,7 @@ pandas = "^1.2.4"
 pymongo = "^3.11.4"
 Flask = "^2.0.1"
 Flask-HTTPAuth = "^4.4.0"
+minio = "^7.1.6"
 
 [tool.poetry.dev-dependencies]
 pytest = "^5.2"
diff --git a/sziszapangma/.DS_Store b/sziszapangma/.DS_Store
index b4c1ad28389434242f75e13e11d1692bf083ec69..062879d567633535389664d2fc945e64a8d081de 100644
GIT binary patch
delta 330
zcmZoMXfc@J&nUPtU^g?P;A9>aO~$i8QfhJl3lE!M$)mUD_Dr6@A~U%Tnd=toz`?-4
zz`~Hskk3%WkeZwC;*yk;p9B=+c-vQQH)HQ%M^yO~yz&JZhQZ1CxdlKy3=GT@CL6Q*
zGUa`myn$6_@;p{9whKXBKqDuwW7R+~WhVb%<*jG_0MfzAkPCE23PUPGPEI<KNel)D
nQDu?cxq9ndm^+d5=jJ0^id_Y=TbUUc8a5U-Fm7h&_{$Ff`fgv-

delta 200
zcmZoMXfc@J&&azmU^g=(?_?epO~wmAQfhJl3lCeO#Z^ZEx5*P&WG2@kbKPQ@`571(
zSQwHS@)?R4QgicNT#|C~lYn9zc?pphZ>1h~M3qm$D_@Xd7@VA+TL9F<z`)Ef*_hRr
sspR(L4XiSg=dp6J1)M7c8aa6#s|JE8Gx-NAFC)vwLPn;|>>Pjj0f1FHLjV8(

diff --git a/sziszapangma/core/transformer/__pycache__/cached_embedding_transformer.cpython-38.pyc b/sziszapangma/core/transformer/__pycache__/cached_embedding_transformer.cpython-38.pyc
index d2655581e4ce34acb616f35c06fb8e4ec3d05ddb..0ce5df23cfc1255b9563c274caccbf4fb6fc0826 100644
GIT binary patch
delta 519
zcmYk2&ui2`6vyXBGRbC>O(+Go)fGf9VQaTg=|w9RR|JtFl!D|oyKidKZn9yLBD)ub
z7Qtf(-ugcXdhqU_;K9TE2mTfM(t79&^LX>VpZ8_noQFTd;4lb0g6q{cM;_F{fR5|o
z-CZ`bGm;2OfB>I4nVYzjyd+?OeL=uh?m167zz#?({<PgOGuAkrR>pdrmi2Pz*;ssr
zr~FiZ9ehxo6K{<iu{EMBU{8qRz%S{Qo0W8xP|k^a&49RM;DCE!CB6!jzz+MS-g-a>
z84tS1^uUJzoq7=BEd(E56q)tsa(b-bMK)0YY5uPM+-;uHFB|FTuvEGnWl~Sm{JpI7
zd?H6<Ri0M!VkArbaH8_*G0LaqcgB9RTesU01O`DE?&a>abNz9(d1I|N13T~gs1mxu
z?)+ukr4e1mH<{4gkExCjX@1#n>7W^k4HidDA|7ustQuZc+VH%njI%%9(^@VJ%M0Ti
z&E~S&d8B&?>6JF{=7-qc>$9HK=MOr%{o&X%qFNL<qHfJJ$6)OIEGriJew+JO`R0G-
SUR!GVj`Us3BIZ(``TQT|o_-1d

delta 391
zcmWlTze~eV5XaxUy!Vo(P5Og^w%Cd~NT}%GpdgBZpo4U&Mag9J#S&>lNutnBh4vo^
z4>t$@2S>%h#s9z|gP@yJS10Ss!5zna?)$xa%a8L$+c0z_WBUDmu^JmSyd5{{TS}Mq
zn9VRcLY#0qL7cj5tk^1t7P8n+s<0p-CtesO<j}i{nifvVVg%**v8WS?_hp8D{9KDa
z=MFM1bJZJ-vj^ZR*Cxc)-K@(h$d$e+xrPej8A)}Xl{Ck5+?XKS;HJEnPpaaTR>dX0
z$6fJ@YsIs6>vSU=dg0LNJAS9<JgvY76sze?CJO_Y0UGW~nI%RfEB2_rFfReZCD3OY
zh8e+R2B6^r)&c&+3vGxgJ;#gUn5`*I%M^EPXIYVoL<yrH0l#mnK6iq^83d*r2c@)t
x_+p#uB``@zsb>Q!XO@<*XwdikP5|jj>S0s=w$~p7OKC6Ks-vf07C?g>`3EJ9TxtLS

diff --git a/sziszapangma/integration/__pycache__/asr_processor.cpython-38.pyc b/sziszapangma/integration/__pycache__/asr_processor.cpython-38.pyc
index b70aca5ff61fb49ab62aded80d52d31f3990f1a8..1351c5e0615d469566e90382919de84c575aadf8 100644
GIT binary patch
literal 2207
zcmaJ?TW=gS6t+E{%WgJlC~0UZLK9U87TV;6#|pJgCEfy36+rVcogF*bY35ejt17GH
zX(RQCUqF#k@swYL<X4{f3rGmg@nkpM6k*9{eU3f8eCPYl?ys))3AC->4oANSg#3Zd
zyN!eM2)Z7F5k%0EB>2lpTCs#xUgA;oy^>dc;#WZuRACaj7%ihD`j!YT{4*ka$!1>C
z13wTU_@V59-v>VuJ@9+ZUlH^f8TS8#)5zYCS?}?aUAvZzv{6}ZDrv@z7<v${k1c;%
z<i<wdwWet5tjzJ7cbgB+Bk1}IFp?xxkc3H3a_K`44%i)d&l@I~@Xq**CZXVPwr>ZI
zwfbH)xzxH*7tHn!ic+R+X2v#9(o9sHGuUz7a7>}^Lf43wdjgvt_T$U8J5fs3raX?T
zMw_^(+D4hIhLMgB3R#NyIXth{xhh)oJbqP}aa<O#vN?#aCKlVhYLw913wQ5=z$Lks
z<$>zK@oHsm{@UN!*HY=7DpPq;zsihiM%m6&sgF$4?qpg$7|A*x!}O8f(bGatvo@;_
zt8AyJjXYEtB8%(Nc8<q(du-S8tSnO{^X9NFw8TTTLnN5qeHXj!<#l_*$VO>eXO&D-
z+fUP~5feZ*wSzQ$ImyayMtQKG^&sO4GpG<!bpy@fVclpAV<DIbx<fvqjJn8sT)<7R
z=^wz%xv)==4T3%-zzFXSfiZ)z*LlKw!(NjE>i9cI0*HsuBgdNncoT}~j3>R<gp;HX
z%;`Di{3u7eWdZ57Je{c0uB6$-j8oGb$r=fbvHn#k$Jfpqj^|x}3XUO$o{$+kXK#UH
zCooRE69$$G@{C;2J)o<vC#_U!1C}GaMO~OQRky%Zn_z~XTE+24Xl{eKpthH$d6{Vq
z>l~&I$-6LzA84op!00s^(CIBm=i))zi_H=6B@N&w*mt4p=U@aia9zP>te~fG;TIsj
zqn^5NKx~4e{|osQ=4Q0!hRw*SXS^2}_u+Y-@I~-5KjkO<Ja|h^eG`iC#K$jY6kzZH
z>}bz&)TL!=l&n4mh#OT*9bu>86PYQg;^HS@B~%L^7it@hWhOulHZ(;gn~9lj0=45y
zY8UlktfZclCI+7Jrj@nB&vN0)jFK-WQX6e~3nF&-TK+;ewe?#Cav264&Q5|cK%ln3
zSP%A0R&gB&Mz>83g1q9f10K1J;Om=U0C+F@XOr>2nZH3JNQ2YVRT7ppHC$2a@R9le
z4Suga1Y>WcX;#;bad=>wF*ynkxuz+*dP#*`f}}6$;O_ScE_U}rX5rQv)82<W4cKkp
z@hykIQd`LEYY5L}=0pTsIE#|y;tK+E;^Il@L=-_@1A7xo2o&4hEFa5GN;%fodBgES
zBzUi7k)SZt9S8&QKZYN59}PZzNV^QVmo4-DOPKCTSO@pD^Z$qWSog3@Ip!l$hMZHw
zPJrKnB46L)9~#@64z`ViQrm1J7vOH6!&=MBCKKu&4AlV5e=y?##Jj7lOt;>L=30#%
z_OA26B^^m|E%WND<pZzsjey}_W>-?#z;h4|2i=vuY?Lc}byueYbKHV-x+?AJwWHc+
mxBzRj<4Ko;tH&+Cx6#AyPv9HOszwYVx=uG(<gNGDH~$6P_2p9l

literal 1471
zcmZWp&2Aev5GJ|Y)k?M;H9u&L7KN??3JWND42q-*&>RAxKx(Ae3r#I4dENaBNx`rn
zpKKtfyg-pda`Y?l+EXumfSx)-IkJpU;4Ftj4rjjkM#uerkHDDy^w-J1jF7)k*&Q5|
zXE5z65Q->Tl8R=uVi}{Tvofl9#;Z7sgC3Phmi$T-SMfDbv8Gp1)&V_H9nd?v1A3~W
z*JPCb10KnU`RMsC6MrCQ))|?*O1slW!8U(YSm*hRB6rgqkM52HlxHyQ4<Izjs3IBD
zk>)zq3CPZz9g;%`_XAT*Mc4d_!m}Knjs5;}Yko6LuB~m%4fEZ3QEJgjcj^<P-O|)K
zAh8{|rZ6WkEyAHFxM8bBZ+JT<OJj8H%8OyuST`)HwlPlDu(HE>p-VM9fz)c7o1%3m
z!}G$O4ogUG*vyA_hON8v#wdHVRi`%y61TdXn-rcmSg;`e`(u1;wXx$$n!Kpbr8CV;
zj$df|r)%2ro8#BNkL{|kE7{6=QOWyCQ9Hdb(iKfTmez>&GbBgtg+It;Sqh``W>FVb
zcQN+>O0xQP7rvwW=cc2sPlc#urG@Z4A*x0#0bJqtg?PJ^<;G$n@aH2axIsWo98_6f
zm_Dl81UIXF+{1!*V1^2$jM1?31uxJO4*L?sXI>l=WQL+o;j7pO`i{)0iWI-z&tkA7
zx&t!3WlRi=L9+6!`;Ksu^^mH8GjH^4QWj8X&&AS|BkCjge8CmW4X6DEgd>iw$rby^
zJ^_i=uojUb;F3;9+{bp=YGWS3L4>WS3nzqm4C;uPJ@}X>Aa1Dd3Xzx6TCfIi0wiC9
z4ebFELJ#Qb36y3V<<Zt5;&v}gL<xbP;O!qlDC!_M#jaREFPWofY)#IhHFVB<b{Vas
zkNgw4<St%AA3++}M||ozHjZaz22jMfwxh)Jrq#7ijefh-*4d1=&=Vmi&(CaA`?xhg
zy-~bLFfjT%2*F22+pLdAfOocSYM}NV6GFzwjzf$Y_c7xEP2m?Pd6)NnN{;r-0US0D
zPz+Ff1;RfNLe_QT0{;<LMDvb~<{_&1p6}mcpKIudTl_;@SYH$3!UEz2i!ANYls)93
zsL&0OoaF{PXT$l#U9?5L*m>xCwBfyQV<+Qnp?&&v(?&nz-;hPb26VvEXt4J`;ZIH`

diff --git a/sziszapangma/integration/__pycache__/experiment_manager.cpython-38.pyc b/sziszapangma/integration/__pycache__/experiment_manager.cpython-38.pyc
index 878ec62a813cd95936980836e5a04d91728a0606..8da8726202ed5dd42b5b88d2119dad72d4773efa 100644
GIT binary patch
literal 1362
zcmZ`(-A)uS6mI8#h5?p85#kH%g*(?K#F&UNBudO8H<OsAZ0kBOKTA8PY}PAz3@^Yt
zUa7ZU@d_Ff&zV_Z1K4iAp7wM)=ljl?-JhS22sHY0co4dT{KCa-vtjW9hTa7bM9`cR
zG^G@6E4K<ewZXQ9lRJf*x{dATUg4*HV|#f}glS00Ya)CRoDmUxx6(+2d!!p(!JVW_
zjq@hcHO#B8zK*2I3R%{DIjVG4SL*bNwud@>IjEG_5j(Y196a#AdSB+e&Z_b)FZoca
zcdGiF35l)+um@7>tQ@}Q`e=Z!nr%R~CDsQ+l9URPTKh!W(h+ovNEc=cW>5MX1Z*4Z
z0A>ef8@%m)Alx60@PvQnq@f5zct(I+1mxz-(k+{5c;*q4Hw>A&p=efMf#g^QzbQSl
z#6~w1SPdMs*@SZ~VOF$^@k~qEF>4QBzWl)5oqJbr{P*SoN_E}PwqU%3p`QRu=!7sb
zu>k4B2DBy)pe@KAxum;YM}=@oVU?*lgczXf8b{0gqngK^1%yR}4!|W*D=_^|lYK3f
zP71CDS^0(6syg7ww$w*;HA=WvPY+}{_yq1Fo#=6<$9%-gVZoEEtmP0&1nMH0kz}e^
zZ**z`#<DW28N(Oq0D$-&#XjD=m$lyY;Q?0Sbwd$67>y7;Fec=XoYM<J(XzJ5hsWRO
zgr0*Whakuy?z$K7u^e|$8npzEbiGC#6JanJ&ody58X13@o>sO-F-t9jCtbXgxJIiM
zR>7~<0Wd8ZMI|(X?zH{yc;h~`>214EuAoWD3(1&?7%M7qlA|3nc6`F~)}!#>z$`Mx
z%d)B)fi+_aYeJzO%11y|)EWW?GZP@DRW(tf;#d(HR}l@M$24#(YC#IDKXI(^1V-i6
zrz7};o9oT9*);cN(%ifKmU=T8zuj#jZwsx77W3W&ny%uP)w`=|Lj+@ZD0~xawfa2A
Og3w4Lwx9!t*!~CBja}FP

delta 573
zcmZuuyG|T26!o<|FEhKmQ9^=*lu!&QqKF101Ob9Vwao@0ZG>QiCuqpBfDH}eQLsO-
zaf`%K@(p}I`jk_XE?*Euh<hhNqKL2Vnd|#Fb8P=mw^4PqQc(=ox2xODpQ2NJ35%UK
zQ$rt__I1!^I=JACP=|GvM4hvRPBE?|cE3lrD^9}XE0KAbp9RmEmX|_%+HXr72z1zH
zjYvm0sN83$%S05z?f^#I9ZbB~B9g~NF-KoQw<B(z4^L}WXE#twgb6WeA_9_`$U@qz
z`Ni~5CMKvL+%VIJpWo~5l8^PTt=2!iwa2+VPWRK+_HOFF^O>G1Hdr5l`K}_~oqHIS
zf1JeNgzc~{Tr;4Ee_-oFr*HyYfjddHYYyz7k5n1rNxV{5L*=dfFi)Gg%}RMiuy6LZ
zGHXl42{*mi-01z6%v;+VhpGKqYJFXz>Bj~$i0};E(t#K#G)Z>veu*(qPRZpJQf>wa
zsQd3Qo%sn(fLppLOL+w$S}Zwm@c+chP_>pst}APPd2yb*m!s1qFV+4>S%kB@d-|xE
O%>nV!Tf`g<V(|dZ*k}9z

diff --git a/sziszapangma/integration/asr_processor.py b/sziszapangma/integration/asr_processor.py
index 83cecdb..9adc99c 100644
--- a/sziszapangma/integration/asr_processor.py
+++ b/sziszapangma/integration/asr_processor.py
@@ -1,3 +1,4 @@
+import json
 from abc import ABC, abstractmethod
 from typing import Any, Dict, Optional
 
@@ -32,5 +33,24 @@ class AsrWebClient(AsrProcessor):
         )
         res = requests.post(self._url, files=files, headers=headers, timeout=600)
         json_response = res.json()
-        print(json_response)
+        print(f'asr processing result {json_response}')
         return json_response
+
+
+class AsrPathCacheClient(AsrProcessor):
+
+    def __init__(self):
+        super(AsrPathCacheClient, self).__init__()
+
+    def call_recognise(self, file_path: str) -> Dict[str, Any]:
+        # files = {"file": open(file_path, "rb")}
+        # headers = (
+        #     dict({"Authorization": f"Bearer {self._auth_token}"})
+        #     if self._auth_token is not None
+        #     else dict()
+        # )
+        # res = requests.post(self._url, files=files, headers=headers, timeout=600)
+        # json_response = res.json()
+        # print(f'asr processing result {json_response}')
+        # return json_response
+        return json.load(open(f'{file_path}.techmo.json'))
diff --git a/sziszapangma/integration/experiment_manager.py b/sziszapangma/integration/experiment_manager.py
index 85566e0..7732d7c 100644
--- a/sziszapangma/integration/experiment_manager.py
+++ b/sziszapangma/integration/experiment_manager.py
@@ -18,10 +18,12 @@ class ExperimentManager:
         experiment_repository: ExperimentRepository,
         record_id_iterator: RecordIdIterator,
         processing_tasks: List[ProcessingTask],
+        relation_manager_provider: RelationManagerProvider
     ):
         self._experiment_repository = experiment_repository
         self._record_id_iterator = record_id_iterator
         self._processing_tasks = processing_tasks
+        self._relation_manager_provider = relation_manager_provider
 
     def process(self):
         self._experiment_repository.initialise()
diff --git a/sziszapangma/integration/repository/__pycache__/experiment_repository.cpython-38.pyc b/sziszapangma/integration/repository/__pycache__/experiment_repository.cpython-38.pyc
index 6cb018db21eee03da8a9dd6115dbd67446c02b87..b79c46b62439be55b5efe5a33cc28b01ffd877c8 100644
GIT binary patch
delta 171
zcmZ24^jv^1l$V!_0SFq-rY9X>naKByamB>1b^3g%Y?2Hq%ySr11XF}sSehB5_)}R@
z5u(B=B4AO06sBMXP0`I;82wo$Z(yrol%1^0zMfHW@?CZlM#0HK9EsfQK+}uFL4?HQ
u{~Y3zXK`@p$N{+=j4Vt{i~`I|j3Q7h1f(UP>>>`J5<gAOBALloIHCa&D<h8p

delta 345
zcmaDZuwIBSl$V!_0SM+Q3MMMDPUL&WxNG9qI!Cq?!8wd6LMg&6EX|Bje5ov{{Hbh`
z3@OY&QIQl;u&4lvs91_PSX3~DDVRZ1V)G(Kf0lYp##;ipsU=03$;I&nMfnA(MJ1KV
zOd$K90K{elVrL*OW&si@3_#tCenlWhX)+b@0I4Ez5CIZ^5WGOvEs6Bhl6aWWMXAN5
zIVJHW`SB@fvOw8luoX;Idb+L^Ksz&YQ}arKQVa5nGfVP|D)n$_o&1rthEZ{H9@~0G
z)yZ<~CX7OpgV_@WBtSN^g9u3wAvJkFyCS2~<cI9CLITW8j3Pi>!~vA?)8s6Yo6N%z
F4FHXyQmX&}

diff --git a/sziszapangma/integration/repository/__pycache__/mongo_experiment_repository.cpython-38.pyc b/sziszapangma/integration/repository/__pycache__/mongo_experiment_repository.cpython-38.pyc
index 32f957c9503ef7ba409a19f25cb4578e649b51e8..8d4fa80ffa121e22f40d31c19a0a38dad8cde621 100644
GIT binary patch
delta 505
zcmYk2!D|yi6vpSxOtza%vQ4MSHX9X7t&$k5cvDbl#X~RZq4v;%En9c3!MIIl_hQ&+
z!Gbp-eFwqzkemfCf~bFi9t1sj*`t3zPc0Nr&MY1}10Ns1_wjh|9oODW*~_JpMbz8*
zvAJ>29M~^xwh%r~&HLTBy%l<$!TuV29sJ$BHSSLyfM4;eyL`1AOawWXWW@2O6cMLL
z&36@<d`&o6tt^pdJ$3i;F8+bf5aK>PXM2&nvJr%jo;>s9(+I!QMJS_SJEf``B%*p8
z=*{ls>mR=`6RI^$vmwFEKBv8=s^SShglYU{G|)9Zz^rn=CmK3zWG#wNr@c8H{5j^}
zJ97o*@W{OT@}{cB<Q3^dLWVFRcgVv=pDIsBB%v-DvW$s7OJK+o7OPc90Azb++fHDK
z$Z^%6X{0O);#6z~@w(UPtas&BH;{2Vh~!ySPx<3^=%>u{eR*EzxfB|YN&J+*Ev_m5
ze<uTqPyvBM>mpvY=HW7St(ja)1+L>;>jqTum-WDr`YiI2mJ3>#mL|>@YS6-!LhDRX
gfyhx}=^N2X&Sb(Ayv!W~-xn4k#iK%!qZ~N<2YyX;p8x;=

delta 672
zcmZ`$&1(}u6rVRUyWLImvH8x{q?Ibw^dq7O+JjKAU_eDAEkZ=&(p^iS&ByF|=&~t_
z1ur7RxfKr$c<`bK9xQkgJb2KPw;cK>c<Z4k)|vGKFV4V^_kQzxZ{E!BNq)Z&Uyj8h
zNG!AZ?#?;AAKy%9*E(La-Llq(^h(q9`rEhRWB*|5vSO#7ft|6lTeO~V3_B;Xyj>7k
z(n&dri9*J-#{`r9hdE*w1(SJ%D5_^`s9YMF+#n|Z0=v-Vk8vq^W4X3;%JrMBZ*{EJ
z>bk|>;wmJclKYT*^MF*KWQqyhl$;Z^a8s;-dWZoZ`eo5=jPKE}`AMmYOBIen6fhF!
z2>;-()gs?lUcof~teoVZ)R$)EuTqi9U!5rND`BtaBe|nPW8LvsbH#0RSi9peZ({|^
z&c7Gt3uIg`V<v}U(|n+$rwXf%*Z5P#9QWRu*YMg6`|iBZxM4N+&&V78tK_>QH{k-$
zXjd<u7eyX=h<Xs99T=cRbnAEzix>}3fK8dFdL)1y5)hA?XaIn^<K1`wHN+C4xUBFO
z+C-9Aw#_DFPQzjAd{0}<E(pR6jR#eHfB`A+XT!%|*Q+qgxAjS7PG~Oi_xe2K_&0s&
z?2uTk4K^iMc1(hN5i3iWk)TQ_N}v)>OPJ%Ek(m=Q5xUZxi1ZF;6pf^GD!hwohAKP)
W^?P(QPWgvO73w@T8YqMUB|ic9!<Y2{

diff --git a/sziszapangma/integration/repository/experiment_repository.py b/sziszapangma/integration/repository/experiment_repository.py
index 8e1e67d..4e01d55 100644
--- a/sziszapangma/integration/repository/experiment_repository.py
+++ b/sziszapangma/integration/repository/experiment_repository.py
@@ -26,10 +26,6 @@ class ExperimentRepository(ABC):
     def get_property_for_key(self, record_id: str, property_name: str) -> Optional[Any]:
         """Method returns property for record."""
 
-    @abstractmethod
-    def get_metrics_result_to_df(self, metrics_property: str):
-        pass
-
     @abstractmethod
     def get_all_record_ids(self) -> Set[str]:
         """Methods returns all possible record ids."""
diff --git a/sziszapangma/integration/repository/file_experiment_repository.py b/sziszapangma/integration/repository/file_experiment_repository.py
index 93e9d96..a528aad 100644
--- a/sziszapangma/integration/repository/file_experiment_repository.py
+++ b/sziszapangma/integration/repository/file_experiment_repository.py
@@ -59,19 +59,6 @@ class FileExperimentRepository(ExperimentRepository):
         with open(self._metadata_file_path, "w") as f:
             f.write(json.dumps(json_content, indent=indent))
 
-    def get_metrics_result_to_df(self, metrics_property: str) -> pd.DataFrame:
-        list_of_dicts = list()
-        all_metadata = self._get_file_parsed_json()
-        for item_id in all_metadata.keys():
-            item_dict = dict()
-            item_dict["id"] = item_id
-            for metric_keys in all_metadata[item_id][metrics_property].keys():
-                item_dict[f"{metrics_property}.{metric_keys}"] = all_metadata[item_id][
-                    metrics_property
-                ][metric_keys]
-            list_of_dicts.append(item_dict)
-        return pd.DataFrame(list_of_dicts)
-
     def delete_property_for_key(self, record_id: str, property_name: str):
         json_content = self._get_file_parsed_json()
         if record_id not in json_content:
diff --git a/sziszapangma/integration/repository/minio_experiment_repository.py b/sziszapangma/integration/repository/minio_experiment_repository.py
new file mode 100644
index 0000000..6d53f3a
--- /dev/null
+++ b/sziszapangma/integration/repository/minio_experiment_repository.py
@@ -0,0 +1,63 @@
+import io
+import json
+from typing import Any, Optional, Set
+
+from minio import Minio
+
+from sziszapangma.integration.repository.experiment_repository import ExperimentRepository
+
+
+class MinioExperimentRepository(ExperimentRepository):
+    _bucket_name: str
+    _root_path: str
+    _experiment_name: str
+    _client: Minio
+
+    def __init__(self, client: Minio, bucket_name: str, root_path: str, experiment_name: str):
+        self._client = client
+        self._bucket_name = bucket_name
+        self._root_path = root_path
+        self._experiment_name = experiment_name
+
+    def initialise(self) -> None:
+        return
+
+    def property_exists(self, record_id: str, property_name: str) -> bool:
+        path = self._get_file_path(property_name, record_id)
+        return self._client.get_object(self._bucket_name, path).status < 400
+
+    def update_property_for_key(self, record_id: str, property_name: str, property_value: Any):
+        path = self._get_file_path(property_name, record_id)
+        content_bytes = json.dumps(property_value).encode('utf-8')
+        print(self._bucket_name, path)
+        self._client.put_object(self._bucket_name, path, io.BytesIO(content_bytes),
+                                len(content_bytes))
+
+    def delete_property_for_key(self, record_id: str, property_name: str):
+        path = self._get_file_path(property_name, record_id)
+        self._client.remove_object(self._bucket_name, path)
+
+    def get_property_for_key(self, record_id: str, property_name: str) -> Optional[Any]:
+        if self.property_exists(record_id, property_name):
+            path = self._get_file_path(property_name, record_id)
+            json_content = self._client.get_object(self._bucket_name, path).read().decode('utf-8')
+            return json.loads(json_content)
+        else:
+            return None
+
+    def get_all_record_ids(self) -> Set[str]:
+        ids = []
+        for property_name in self.get_all_properties():
+            path = f'{self._root_path}{self._experiment_name}/{property_name}/'
+            property_ids = set([obj.object_name.split('/')[-1].replace('.json', '') for obj in
+                                self._client.list_objects(self._bucket_name, path)])
+            ids.extend(property_ids)
+        return set(ids)
+
+    def get_all_properties(self) -> Set[str]:
+        experiment_path = f'{self._root_path}{self._experiment_name}/'
+        return set([obj.object_name.split('/')[-1] for obj in
+                    self._client.list_objects(self._bucket_name, experiment_path)])
+
+    def _get_file_path(self, property_name: str, record_id: str) -> str:
+        return f'{self._root_path}{self._experiment_name}/{property_name}/{record_id}.json'
diff --git a/sziszapangma/integration/repository/mongo_experiment_repository.py b/sziszapangma/integration/repository/mongo_experiment_repository.py
index 45e0d96..b169735 100644
--- a/sziszapangma/integration/repository/mongo_experiment_repository.py
+++ b/sziszapangma/integration/repository/mongo_experiment_repository.py
@@ -43,10 +43,6 @@ class MongoExperimentRepository(ExperimentRepository):
         else:
             return None
 
-    def get_metrics_result_to_df(self, metrics_property: str):
-        # TODO: implement
-        pass
-
     def _get_database(self) -> Database:
         return self._mongo_client[self._database_name]
 
diff --git a/sziszapangma/integration/repository/multi_files_experiment_repository.py b/sziszapangma/integration/repository/multi_files_experiment_repository.py
new file mode 100644
index 0000000..c6b5a23
--- /dev/null
+++ b/sziszapangma/integration/repository/multi_files_experiment_repository.py
@@ -0,0 +1,61 @@
+import json
+from pathlib import Path
+from typing import Any, Optional, Set
+
+from sziszapangma.integration.repository.experiment_repository import ExperimentRepository
+
+
+class MultiFilesExperimentRepository(ExperimentRepository):
+    _root_directory: str
+    _experiment_name: str
+
+    def __init__(self, root_directory: str, experiment_name: str):
+        self._root_directory = root_directory
+        self._experiment_name = experiment_name
+
+    def initialise(self) -> None:
+        if not Path(self._root_directory).exists():
+            Path(self._root_directory).mkdir()
+        return
+
+    def property_exists(self, record_id: str, property_name: str) -> bool:
+        return self._get_file_path(property_name, record_id).exists()
+
+    def update_property_for_key(self, record_id: str, property_name: str, property_value: Any):
+        path = self._get_file_path(property_name, record_id)
+        path.parent.mkdir(parents=True, exist_ok=True)
+        json.dump(property_value, open(path, 'w'))
+
+    def delete_property_for_key(self, record_id: str, property_name: str):
+        self._get_file_path(property_name, record_id).unlink()
+
+    def get_property_for_key(self, record_id: str, property_name: str) -> Optional[Any]:
+        if self.property_exists(record_id, property_name):
+            path = self._get_file_path(property_name, record_id)
+            return json.load(open(path, 'r'))
+        else:
+            return None
+
+    def get_all_record_ids(self) -> Set[str]:
+        ids = []
+        for property_name in self.get_all_properties():
+            path = Path(self._root_directory).joinpath(self._experiment_name)\
+                .joinpath(property_name)
+            property_ids = set([children.name.replace('.json', '') for children in path.iterdir()])
+            ids.extend(property_ids)
+        return set(ids)
+
+    def get_all_properties(self) -> Set[str]:
+        experiment_path = Path(self._root_directory).joinpath(self._experiment_name)
+        return set([it.name for it in experiment_path.iterdir()])
+
+
+    def _get_file_path(self, property_name: str, record_id: str) -> Path:
+        return Path(self._root_directory) \
+            .joinpath(self._experiment_name) \
+            .joinpath(property_name) \
+            .joinpath(f'{record_id}.json')
+
+
+if __name__ == '__main__':
+    print(list(Path('./').iterdir()))
diff --git a/sziszapangma/integration/repository/multiple_experiment_repository.py b/sziszapangma/integration/repository/multiple_experiment_repository.py
new file mode 100644
index 0000000..b8e1d35
--- /dev/null
+++ b/sziszapangma/integration/repository/multiple_experiment_repository.py
@@ -0,0 +1,39 @@
+from typing import Any, Optional, Set, List
+
+from sziszapangma.integration.repository.experiment_repository import ExperimentRepository
+
+
+class MultipleExperimentRepository(ExperimentRepository):
+    _repositories: List[ExperimentRepository]
+    _index_to_read: int
+
+    def __init__(self, repositories: List[ExperimentRepository], index_to_read: int):
+        self._repositories = repositories
+        self._index_to_read = index_to_read
+
+    def initialise(self) -> None:
+        for it in self._repositories:
+            it.initialise()
+
+    def get_read_repository(self) -> ExperimentRepository:
+        return self._repositories[self._index_to_read]
+
+    def property_exists(self, record_id: str, property_name: str) -> bool:
+        return self.get_read_repository().property_exists(record_id, property_name)
+
+    def update_property_for_key(self, record_id: str, property_name: str, property_value: Any):
+        for it in self._repositories:
+            it.update_property_for_key(record_id, property_name, property_value)
+
+    def delete_property_for_key(self, record_id: str, property_name: str):
+        for it in self._repositories:
+            it.delete_property_for_key(record_id, property_name)
+
+    def get_property_for_key(self, record_id: str, property_name: str) -> Optional[Any]:
+        return self.get_read_repository().get_property_for_key(record_id, property_name)
+
+    def get_all_record_ids(self) -> Set[str]:
+        return self.get_read_repository().get_all_record_ids()
+
+    def get_all_properties(self) -> Set[str]:
+        return self.get_read_repository().get_all_properties()
diff --git a/sziszapangma/integration/task/__pycache__/asr_task.cpython-38.pyc b/sziszapangma/integration/task/__pycache__/asr_task.cpython-38.pyc
index c984f35f66feeb3525f85bbbeffc0f0f683a234b..d359f7e343c9c1b2e0cdcfeb83f3b0e5c1c3ae16 100644
GIT binary patch
literal 2149
zcmaJ?OK%)S5bmDW&aQXYj<GQbh=)MHBC^XB$+8Fpaf%h$_%Z^u#?$T1c<1Hr*%+_Z
zCtJ#yyASa(e}$jWS5Eu^4&eY*Ju}Waw&_;aRM+%Wb$#`iy<V?FU>yGaNBE>g$e*}b
z91d*0gQb1}!U?AdNohbS@>XJ{c3>OcPMp*YT*Etwm$rhI;oZbf+d<p#UeZaIf+b3R
zBD}@@bHaVmI<tc=Z|{;p=P$5822^(+Dfv|9kx(j^uwUH~Q7-w@uzUvM=P?&3UHkF3
zLdZB3S-B&MT*YNBPe9(UKaI2T&!L*UqIx-!A}j^V#4$StMQ~_&M<ihx=h>4m3&%o6
zXnJvY^+p{6BS=6w39LOLY~gUaNrVee3!WZ4ZS%B2=7|<}F5DO7fO406=iR^uSsSFS
z3!D4AeeMJuBU$1dzI5U6F7JV?`+_(m=m7|Q-2(6N;(DD)<2Nh7aaPox>plyW#BGI-
zUTyY(MtQ=rFckw=w@XlAHhS$=HNERv?$z5jN_1a}qiHM!n-(14iyBA}8RRiDY*^|u
zASF2?FX^1l-Ajv-xiu%un%h9_xdYVU1e~MWa5Gm;!HD)5i?g_7Ok)1YB_v%S15Z0j
zBnPsGl0K4UBr8bn0fB(F8H<uoDaKxr*L$NqC8Qdqp^W0}I4otpAC4XiH7WCA1a3Xt
z7g_WSUQg6W&0;kRi!d9f;V8~ZF_tC`MhF)kX2=YS6ZsC9LhH&0Li|4UV9r(^RlylH
zw;$NLUE>>by)LeD5`xzxrS_yKr!tEWt!5y4xPE}8z6LV4UJ}5M9MVhc)Gn=xpWA0p
zUvrz2Njv|F)44tI07+|G_evRNDw1)5c?|bh8;cV2q6*<bF4;t!7)-TWNN{%G$Tct|
z?<08tBxs|@&%<OY<OT{2c@H?ftR`{6P)X(8`yf;%185)SY@-3<t#jL8<VwF@k#(7|
zw5l_SdLs0@8K~2RWpMZ&7(l>e(j`5G%sI4PLIwfva>}i9GIzOspFAdKkZD+WfSO~F
zav}3fCjxYw?T9w|;c3A_le@4KA}|IczjjY)34ou`->oBOxAq-xGqAKZ{6<@G`8Ft>
z%_LT3l&8hkm#7PsdZ2zbY|xO?j49|miD)WxxS8Zpn5ZpanvdlNXvQ;{uYD6XC~;E*
zx(|mF1Nu0NmCzei_1zv=&~ZJY@?+2(tQ^E}frYXUIv8jv)HJ!_)auPUqY{M$N4zfW
z(s!vtEkMxvclO|JN1=5=O=J6EOm`Sdb3TPzFx_SBXc{Kf8;Lcbml+GQEH6#%K^aR7
zk+xMSwX>h+iK#w`@XC*nU=7MI@Jz2R{YU^xY#~7Fcmz{dwt?VM9|Gx6AE#r{dcI!i
zt+s0ZA9Hql(9@qUHiqFsV;CZESIxG%=fgV>FF=kTnO{}q@wfl;P17faw{{N$LvXjv
zs$o^X1IRqnz$8{w@X0ls5D$?I4Q1wsm`f$$k5BZcx176CxF!S$>jLI)+J(Pag?kI@
MPGKL%#HpwKAJBJ7EdT%j

delta 777
zcmY*Xzi-n(6uvv#=cKU{ezXZBp(-q3RZ503BBY8+44^J)1j=$4+et&5IJ!$fjf^@_
z2??=8w=yJS7XAS?{sT5-#K?-6ks!P?MG0r!=jZ45zI)$$_wB-GJKwbJ4Fv1Qn-5QF
zbegZ?gX!*G@jmhmpPnI~2IecRmGR96ax&Am&5Ea@*B3qi5N&w_H;ewpJL2bj>r8Lu
zULzf~EXcIw6n{Bg;6ukq3^5)CJjpQD9dt*GaT5r5MnM+9p@}Ynu+3FjJg2}?U@OQ2
zEO3%#%nMy17+av9kLyhla8d8O-0KcrxFa4tb?XO#=#8Rb{ZX@VR2P%3n7DN44my2T
zekZ%eMIf@}wsu_J1}i2r6yq2@!*lXdi!~qhvQbsO*D9wZ+3W-(Hslc$Jvw3Sh_haB
z^0!o-Us6?-6kGvlWnID9b2l6Zd`me~D1wy~M6Wwcvw7e}+%JPuq@5=^CP-iEWK!A}
z{Kyr(+A6l620LVRhNnU1zomnr+IJ7OxCH<j&<w|TjzI^RkyMoiUVUc7+8oa{jC|BU
zya2%tO?#hYQibm5Sk8>{O*Mpc97*1D!;q<ZJA<wWod4v?PsWzDu2TLst`~@fK@Mz+
z$&&n%HF^!(@*#b&uR6|Ey}YVm2OzP}=ja7+4qGF;tU^@ZxVl~HZipTEm6kRM^olGk
t3h!n5@6gFgYR=`JS&<*jtG83<8q;b5nLGW+ABVwRtmqV{h2bHV_6K)4ti=ET

diff --git a/sziszapangma/integration/task/__pycache__/classic_wer_metric_task.cpython-38.pyc b/sziszapangma/integration/task/__pycache__/classic_wer_metric_task.cpython-38.pyc
index afb1c1a779039fb604f524ec832bd68c10553e17..94827e74b006da359353ae07802d25af99e2a6f0 100644
GIT binary patch
literal 3429
zcma)9NpBp-6|U;;=~*}nm!U)%mP1>zl?kF5BMXw)f?$C%5(AcCh!zAiU=&*2MXJSK
zMpZpfNQ_Pr;8PB{<)DLj)IGl<KcTKZ<qrf%kVO7o&B`%lxCiy>)vN98ujYQM)nND@
z|LY&&2Q9|Fqrvj$VelE6{u@BdVxF>$2Rw5ECvyXr6U|AztP)f#?xucL4XPIR(ppvz
z>K3o0jchGgv$&r&vsTcucr|TjouFg!TDqQX1REBwr<>VUux0T^+Re6uZQyIcg+H>m
z8Mj`rxFtK!-QZ%}-e<keKfxXAxyHSf9~<v>5|zgLGSOv^n|E%d$zh(!yxdDet&?ak
zOrud6mW9G>Yd*VQ${`URNOfk#)|nM|!r@TT#_s2T29nUZ_vEn93C=qPz5SIcB8hwQ
z!>>bq1WJwi`(=^>_Z}1~M&G$7!9h~wcfve8lqy(@Cd`SaQbi=p@>iV>^xuI<7Vww_
z&V43b>BaoUq<5yhi@pN7hu%kDv2+(}=~s>Ym;SfxfXCIi_M#coK&yjVf9b}Jc<qH3
zG%RH;Zi3Q^+n_XMOSUhuIqY0waR;;O@djqsK?g-{VBh9}gSpL@PP`R&F}L+C^H|V@
zfwoO|s(q;Ujx1FYkygwFk=cP3LsdYZ<*~@aOqv}L&aAdF^PV^?(pZ!#%yp!aVYxDY
zd1>cNr_tQvrb7xA3qsE~^%9&+uD$%@XK#dBtz5T#KK~cr#(rDLC!<73F&f5UDWjQb
z$-;zFyt!!l6M&LEXRr8}kNs1Jv#~Q~!Wp}O?zjTzjXl6h=|5-at7Xmh^_cCm*Zgj;
zVJdnAotl~uNuHEKs0|!yHpLIbQ0tgb9Rd{sn*@j*wFS_t8c)mgKy`_-P2d87iv)HE
zTmpE_O<f49av@%`|HOm)S}HxrLKP+X)38*<!*Fn0>Z7t44#2|ohcb^IVfsi9^hu&m
z!eN*nX5k>oOL?elcnrukgP9%4bQ66GqW6c#>RsGSeCRd+tGBs7{nhx%<?~#wKT`&>
zMP11V@hFnmY|D8#3pI~t<11N?R34E@W*^~Xrad%Gni@N=7>vXo^HV2gNA-QC-T}Gi
znC_um^3Q`pi6ePz_1tsSdsw5c5V%U<{W<smnCa-FWGHCMgvp<SsA~YsX>#X{^XBC0
zx#F#C!#(pW%(|Lp9g$7aPDFCdKC(A8D_04mB<FKa`7;j^I#xpW)Ol7JdnBbAjw_Qs
z=Htqdk1=~iE?J5BC5ClAc2(>yKXzjG1snUf*>ir1qA{PTVowe3ZK>qAJ@2k*ErJ^v
zGU77^(K~45q5Ei>obV8?|4sWDx4iOG{#WOT2mO;WdyXP~1<kS$k9CoY7-a!Qarz${
zCn;AI-nfyXU_?bWy!k1ePO9;7;mN1x>RF9)K}kN9lo2T7_iv;H5{teGWOh=ouGWZ$
zZE}RC@HH(CRFO?>sy@P;x(s02f>zA4hPgP&4~uLwbDnvmnvGc&ld~k+tFAf~d5!6;
zWHr;E1fZlIrKRc2?-UvpP_L?G^Bh5OsHVVUeuKC94qxXUchH*u^D4j)9kn+n*M6ef
z;GrKAmu+HdVR`i-h;NTOQUf9mF$WKGV*VEgzT@2OIRS$DKq{mbX&R4?hei2F>O{jC
zC{%;3h0^AN&tj3-P`@E?HWt-&&~Bkk;?MOVBI57LxdNWGBd+}w9cYCi=be2n5NbBq
zC|gjje})YIm{X{oLZ}j@d`x2TlaKbM6-@4iX}UYDIlJ(QT~v{9SBKd!mHnP)JaTfI
zwS(3|R3uK*6nkIZ+TZ_TPdxbi-b`d-E~rk=TNQhN$v>fKAAmVN><msO@02rTyuY|<
zdK3yist%QMAxuMvtcXX56ag;8lTnyXXIxz>lw=X+c~RPguTiCJ38GA7yoW`R+8nRy
z7^`ap@Jwau*90g;Rg(a5Xw9TZsfskMh<($VmZV6gDUMzk_Gh$&GOeP@LGGk~3DDrR
z+0S#})YIR;*Ecq67XNRv>oXLY|2M04=iT0p@yp{OQo-a}%K&i}{C>Hr^-*bLf9`V&
zY*I3lXz5X6H4yybr){UGwekm7f4BjL?^D&B8K_XUtOvh6vvjH8_A~pyU1E>UN4=nD
zug$0C4{zPOD4hLs%c(VDaQ&_OCq;e!ezrwk(f^a++K=zCFSrq&*f!gmoinT9dot}?
tXr0AeIcIvcGEThgcevYHdC76C3z6fP+Kq`@-{ctCYScw-Uimqm`#rt%xO@Nr

literal 2835
zcma)8NpBoQ6t1pbJTo3|Nt|FHVSo^rD2#LAfUwMB2ZR(%6vwjE5-K{~WvAnw=}A?O
zf=82+E#;I0_Z;G*FC6$2-1q@?<-}izvhclb&*I5|=vKXcwY`4ttGCqF%uI#h`R&g?
ze!dUxFY1gw4mw|<>02NXi>!n-E#GQ#pIg-DiQRO3C+F?NZF;_!^G-6=Ecqqyu3wHk
zzw#Z6rlQgzi%PO|VEfZid6U&Ee?uy(bK~5Mb!MFPILzvnIk%PsTF2qGRBJ&Jc9I}V
z6^-Bcr7cz5l&$QxY^OTL@IJ<8Z>cnt*wNa(6X-pEIxO~!hf*2mVXC5#{xkY`CmsDe
z7|DDqVm{wu(w0tStrTC5uZzB&_ifDC(u<s@?qjxNMQ-FBR{bfAl`uN>)Q(C~`Oxvp
zG!j*w@@P7$qF<5IvWl^p9lpet7<xA7Y&3%%v(X$@%uQS|*psiEj~1|U{xNfyzX0UU
zjDqxo%v2nb>E^s><{d5CDg{{CzGwwaX)cM~G>Jr}f|d?d+|I`4FNhJ$L^wp<HRTL~
z3n>@>TgXD7)tKDH$?D81`JfXkDLU;a$Yj_*4muU$$?a@3eGMdI2ke>EvwH3koUX@v
zOz@r!YWEyaCvy)NzFx#O*|D`zpE9oQz;;s-B5uW*5Q?1KoDpy6r^=X6^fxsPQumCb
zWwN8HG%`bEmdG5Dd5~kvltlrR5XbEK?(&wFN-sA96~?WHL8j8X!ScG)ds*6E-rm~0
zv#h(Z?gs6kwc89%cj8ticU6$ZX=|A<ULHMy0yjb9jrP7ei=Qu`={#IZvzC{?-HXFe
z8G1pZZ+G1`WhFxdfQTcrC<oyq)F6J0r)1Vqt&s5UKg1I%YiODv=<#O^C&2DoM|_hh
zQUzgqZdZ;t(oU+xp4`tdt=no5Yt-9B-XZeVfGmMCb9ygs3))gB_#Osz350RS;>>y7
zy*$yhv2Are{KY8?Tu35uxdq>X8MWY%J?QZx{s<x8bM`#-4My$UO8C`%7e0oWB_z2g
z{K%%XhQPBo%*-%~aCCrSZY(TJg&a*u-AS^#r!L~}xd*Cq;LL@>=ZAqZikn&J$DZs*
za@`$=vPJ^mCo%@=8P#bCN`r|c@stxUW10Q{B*)cqUO9Gwuft0gI5eW(E9YhR<B5pB
zDHDfVgTO+Ccfp-P{*>>0f>~e*zlp4fAHs*$*?|?=InQ(6dBP)iiLmuHLJRBr4+ld|
zxQV6-x?PC+srm@1AVVhol|OLciUa{_fGf6tyuE(R4R2gGJkG|UsjMU@F=5(luYN)D
zNU+B^>#j~TT9DN!AA?kglh%!uB*pRQRWN;FZ)i;B=NePK$TcpJ#v|Gms$IeKn3AfF
zu@$s|c6II}fOn*ltx)=vd;9G)yC-$56#)h3r>y1A41ESF_d~CSsfk{)IMKMzuv}B#
zW3FdattuRazwBQ9|LB}@0)m%X9)6SrD2XHNibRf}>)9FVYtP29Tiq*bCk02=f+VS(
z)QlPeqlWSj)O65nC$fQb=0vz6sH+fYs$%Wt*PEN)uZis&x9d(3BsI+BM*CAIQpPd<
z5G%e!D{S>Va(~8OmpHT-TsuZ`=@8o!fvCMGEL2s6Fcl%1Y1Bcy2`D5Ubb{n$#@3lK
zb3z2IR+{BWUZW5ZCdRp&rb(XC6{RV4iO6Ll<noF<$k;(^-?%$Tikd>^D$?7`oD`o>
zCJCes!~Z-jp~R{v>CrLj>mU`YM6bgU;`#f0eimQYTXpe$T|G;cgukd(>05b`@7}0a
zjhF4Wkw=CK`PW7ZSpzjiHsEZHaCp@k#7e3PJ3l|QWu)9ShUKR*u_)!Zm{0$8e^C|(
sx4yhgD!Mo*x-h7Zh!7AX2<2GirKhw~9N8+xQ0@lv91hQ`s63AS59k=%PXGV_

diff --git a/sziszapangma/integration/task/__pycache__/embedding_wer_metrics_task.cpython-38.pyc b/sziszapangma/integration/task/__pycache__/embedding_wer_metrics_task.cpython-38.pyc
index fb121b6163c23215d419fc36220f227d69e09cb4..4918ee5191cb5b9f9f58c552c124e883bb704be7 100644
GIT binary patch
literal 3627
zcmbUjO>f-Bb@;j55ANz)j+^hKbvI2`0n!v`U<hd~HON6qVA(K0AQ;e`(S{PaT+eXf
zSfEcbkV`MQ<=}$^<f8wPQ;$8)wWt1pq9}^0?+tgk)Y=MyaKJZj=FP|ZeskaVTLiwN
zfBh}|VTq7`;Gq85F!&UH`8@zen30gw2n+*pGci*uurzKZcIpI<#_hyS8$m<kPU5A_
zps8^;X{GI;t?@?EN&UdrxR-R(UeMEcGg(TPgJq4kl9hBdSOvTttg%k8&ir8GGs3#8
z_l&R}@10t~CR;in{pEiGccgEqSO1j6!%@md`EL4<GZv4Acfur^Bw?Njpl??6gX}QB
zLb`b;jK1cq+ILTcBYBvKl;g&=Yv%n2TwFP3b$&z6$9v&;Jl+2dATe@wmya_U13ypT
z-0qhmi@21)=)F)L!;FXh{X9+p@7?9Vd7O>*!cjQnLU|I{rjG&h`Ak4Pv>#`JMW}`P
z=S>IluYhn87>oqweZnnnGvjvIo73Kc-hp`=dKY>J`Udna^d9sL=&h<Xd5d|^8{d*c
zgEd*}Stn=%t;3tF{oG<5=0CFoU(a+|7iM~F31)iV5}O3tVrsL}D5!9c=OT_Iimo<j
zT8`*gWT3SC2_1zgS2t)lGwuTAbvn!vMsu`SB;s+tK;NKqW$8twS=Af06Xz?U%3;*a
z+5)Zl8m)(Vr}K$^Lp5{Yzhw5cpXO*elwyI&^_NS%d7aQ*!5>Xx!Rcho!knx1xdb&C
zqnQh!Cm@aiZNV?^0m#WIIWr2QaL-MH6lOuFSy%wA!UkyPPSH3u0CV$3L5^IFdwH|M
zTY3AG0KHQ<0DVRd$c3@r?<z-5z;w!^G#<q{rD6rHQ!DfZxdmh$B9JSwiois$h5)$~
z>j+!~8wi#G^gU%uo*arzoVkJE6$CdC{0hOV2wnqlVW=jhQ4&f?=>_@EaO=M0LT;s@
zh~m-XFc;awaBGLl<2)O00dF5X<fG_oARo&uc@oQ$a2$??X}A@Say}F~7PrvKTXSur
z8_aBnq`~-!coQy1ek5{DT3y4{t!0>oed$^q!!u6a+?_@6)c_dGbk?_2Q}74^o5l?6
zTV)U`suZGJ!Sjh2MX0UWhd65V4*U`oUzleEtW1uKbCZ$d<^d6}!*t(NYeQa(7KjUa
z%%5nR^eyo=tP!^m{1(BlEASh@R8JnqV~Sf!CO?Epsol-&80MvUd2;JI2^V(4Rn;wO
zNlbGdP0OSgp(wMj3y1^17VYnV<mkZGx$)EnAx$l$b#6X&3L6C#KNe2eGox^hUGXEV
zw+kEAyBc$t@d|+vy0>%Y7H-ji-5!h@)d=0)J8KpmtZPm2Cg5#mGV2*Byd83CFk9nI
zjXTfHr=6lzw3!Q-51h3$XYHbM4)wAccM4yR$&r87JttW8pqe%Il|RpAko_ZLCO-5S
zAgF-@__cctAppPXJ~gx^jC12V^N|e(Mr&P|q5+-i<QYAZ*@&_@$}dc14n9<7oG)6m
zbvub=9%boxdk;@X#k+9f$@X=I6q6Cf+Ldt3W?0Aux04K#qTB{#cGxfGUkrc)fsVDn
zs`v=z_TeviG)(m6u1?WazErF87_BDzrs&{tK7f8t;NwTFV+>&Zl=M(!>C~OYd${f`
zT+l6vpu{ADXxB+et<F+EpBITTabe6We@=!iYO~DJ^PE2mHOy#b4#f1QoG9U;=yw-m
z?|mfp7K(~$VLBCDPLe!WUm%ve25Y!v?oCq(evh|)jG)p+uv{r=dZY~6nA^(p<$?v&
z%8R!D0~{zn1wh=E(KT)u08JN+V_w?Uw6{A(2l5|`F75xhZp*ZRZtE2lW}m$G^Bu0g
zj8z6-2$ZT8rD?_{;Eq&vD19^ulPSfLxllby!_g?qbsmS3P}Ut?axiD=LZj@5S(XS4
zF`dQ*rZn+81Z@P{0F*ziDiKc-I0j>_1n(e*=~46mpm8PU&K4y6TC+_k1XcU@(#DFX
zNB`Bk_WL)2PwLfY05yOQD)Y>-+Ph}vZkf;}H2C=E9kB4K(M9)Vm)D*YgGfJ=Yj@X(
zTBGWt7cZ}^8O-CdHmfzR-hFW=_}~EjuqGis2-H;xYXy3c>Q{G7O%k5sP)_hIUM9pp
zUb&{ecV1ctFD<y*9fA+8-Cw={sz*J=v1lT{w|;sLE~FE9_m@fOohz%ssd+M3tc=<r
zgC;%r;xG5;gWbD9m+tQUd3R^$^Zn2C*r5-;xVxjBs^+8GTXhNdZkN%rjRi*Hg9V~<
Ku|b4Fv;Geu`WMOo

literal 3078
zcma)8OK;mo5MC}RijpPy5yyekHg($|0sD}P=G4Lsio{M(Aa#N`h5-V_mf@~l+N7xL
zQb;VwCmYDAhu(9rd&@8Btv_IIMNj<+E!w0rD@&r~C@2Ze&dxsP^$j=c^(uj<{rj&!
z{8l6659|~l2Rh%tr=9`fgj)$ot-wlYKrQUk#7>>SF}$6WQa5l7?<D2a3p~S@l1f?)
zs)l!ysk9c<3|~&_X(MO=?*-Gm63p;wFngEqDPB7wye1llb}+~58^mw?38xdEYUf_8
za_y|fQSMv%^6fDCQSi0&vEV#z?L3lUOKoQ|6%t10C&(AJgd7gt4wI;pgn5Q5W?^I_
z+s@Aj=hvRKg^W|t${&h$rec`850e`YWEKgf@Z3=C1)hSH?5U7JT?{USUF|&0B#%&m
z;!{5Ds9%5)B(OLM=q3@iaJaS7Zz;4T=-be`&^pkTp)Hwl8|K==6BX{haG#THi<h}~
zR12ygof00eys&wdPaQcy4JEwxg7P|VK))^;Vj5&K+jNmE66o1LhY~&wD`)sD%$$8r
z91_fd3+D8tq0zuh--%qtkwVS&0!#Zn)|MIAD&J?VFcta=+sP8na`Z|h<90qazQ9I?
zGL!nQ(~D@f!dNu)k)Ah0#?m9H@9Ihp7wMn+-rEnI4V4_b$Hg~azahnwPAmoMw0W2d
zeesRAjRuZHe<F_=W5cKJ0LjTAIktLMuXF<W(xW}XXwL>}_Z*;3Uh27r7I1D}?vdR-
z@8y*tU*%+jytLN+DP2+>Fs}9(i(7Hdn5@GAdXAk_NJ1hLiT98VBrcL^BzQkL1H><D
zM~P%x&Z1-v$ps|yNG>8-0P@n(6~>|@REn{e<nP_(O(mpSPD2^Rt*2owv&Z4`s!)4*
z)?VJ)+<3ICy0Pkp?Xb0zhG#o*D;GO5%;T)JjNV!vnG@YT@Bt1r+xv16&c6(w!Yh$V
z!*cPZ?rX>P%-3C-5Rc7)fqYw6q=+E<Sj@qF!#rkkn8@0dBJapngf1IA$fNmg!>7=M
zJ$g*QiDcJ0p&LYA0ug}G{EjGuGz2f(6Z^*azAfK@IdTcf2S~0A$@{?RX|)%(87}Ex
zun9ut0U^|}C~;nQuTRo$Y^6^}r<_ru1e@WGMu`W&6qPuzhdp{i4*+s{&Yml8fz&pN
zLUityAW~su5m5dodSXNTLWCZdPY9wnK!Uxl>!aibzk*Gs$FfgXF+8PEoh0`?`4Qa1
z#H~c%>P!998s%frh<bLA;$jdTCZ2UEN<=9A(zuPU;pW$oj9Gh5c3KR9IuUpjqV^4#
zrmg}p2DhA7j@>uBLp=*P_>j7<oPQm!`|%`aoZlE+Kf1?<u>U!y3?pk5MiC$mY;JLS
z1QE7M4y^+;y>(0hAiy;okhy2)Pys;dj7gym^lWg1)4et*Sz;+nlBLsRS^{$}0d|E;
zDoopnXhs%leELvm@h%(inJn9ZGrq4K09@rz6@I2q9Ef!^B~-f-+q(a76&y^PpKBWD
z<0h`IBv6^7EN$Pshx_5iE}^9R^(51sb8d4b$v~)X0yEf4;)Ma<9S#-WAeXL>7Gia+
zu#Nk79<i;phX&$wgROmcYi)J)+x5FB97M^`C%SxU9K?ogAw??^W6DS$4qZbnP<i6I
z7NQR&^fk5UYmXNBuK&OF^DiKFV`XGaR~bt)-hqH*y2jX(PMDmI*eaKLnz69e%5npj
z0KR=RH$aXUuARqOmPkx-1C$aIU0y}<2@-UzL=@9@*xEPx==v#=M<PjJ!%>R7i<1$R
z<P?w#@F|3&s^tw{2lO7if6dGT54Nb4&>FRQv`zINvvwU+bo2c-WLn`0UlnUY6W~}h
z3)Q|EnSZ!Kxi1VFwe^j+Zy<($Tg8=Vo1l4qCB#f~((i?-lz~5a(b$iNsi*qOGxG~&
zt~n|*%{LYw<2L=-#P$7JIQ-3I*q0ShOn!j`F-(4n1RYoKsPV0-Gu}!+%5GvFnIxZ~
Nwf<{iizw&V{{aLtPy7G?

diff --git a/sziszapangma/integration/task/__pycache__/processing_task.cpython-38.pyc b/sziszapangma/integration/task/__pycache__/processing_task.cpython-38.pyc
index 46a1b9f7e3a486498a384e05811cafe91ee187cf..04380c866974537282bb2280d7f4cbf65d66aa7b 100644
GIT binary patch
literal 2207
zcmaJ?OK%)S5bmD$>>J0i9TCBzaA1Y(m5?}qA{0m>$N>u_L`g<LquK3_Gx0pu-EDAI
zvs~;ezaWWZAM+PDap1&}6Y49c`~eOT5>)j*VsE0%YHIu4RbPGe&FyBhM&Nn$&mYOT
zfRMkjbNX?ha|K>`9}FXmW+cLYE2Fs;S-BnA6#I7O<Zk4ewv&0eANi*3W<efCp=o<r
zEw4v)O1>t{XTcF+0k;nAsKMwh(hFa}4P?7#Y5U8suIg4YkV+&&m2>s5WId`oH~Fv>
z>;}7`xJXnfU~K&+&k~iE#kWb3>~Qg&D1S^D$Enrp2O}=hoEPdQAC)qN9gktWy|iVB
z*Peb{=v;wUW?(ppC?k<|n{b;uj9w<(g@4QZ+suAyF^9QFPULYPW&$2E@2PFVa}H@#
zn~mBmgwYzSAK_@7H(+IxHDIjCTClst+5kaEw;+HamohDOzE9+?ZpVV}?Wcmr`y-Yp
zu4}P^@wiBG4oHQIj&7Y@IJCj}`Gai>-mCD+4w%ZSNK7gU7NWaFo>RbGgfJtJ4n12t
zl4lP@9Y-2qo)giAznAy>w<Q;{pC@9N7C$9Ql!K&yjmuqCj{1odn*&}9AHwvm?8|W~
z$H^!ucJid37K-mc+8|eb^twM<L~26X8a>uQ9H&L9;<yEONu(a39v!cr1!Zf#3fv5Z
z;Y6G=eV#A!4WP{vt~+AJkT{=GWN6OCv*E!uh1Vd19YjMkp<&|fIRae~D`?K4S)EUr
zd4XW+6|rB$n6iw=v#4-`M97Ih{$R=d*H`!KS2t)+aJ4Ur*An<PH|=FNF<GZPY|Gtr
z6h9~hAcHmZ?!rB5{N9p#OG^Rdl?BLgIx9T`hQ6?jErxIE?+nODAY_sO`7dZFpx!Y(
zA%}G0C`;KD6vZLEMt=Bp;#MxB>*NV2%yj$-d1g<%%BkE7Wa3xkkyH7V#q3|KNdP?;
zRyvgj)~$S4>rTQd5D#I-6Td6J3J)nI<BOGj98~@ZozyCF9O4O8?F5wT4%z$DA*!}p
z6TeY10c{$uDW7>&{m`OB)sGt|z>hoRQy|8q{&W2<xd%J$lD!Q)8*cTVS$M<V1`?+i
zY`?%XjqPr~3k9{H&A8E>5d&D#eM!6Hjc<~IW!M8cY$}kcE*GK{pO5R^&CM<*VZ>Rl
zshup9O1F2oijypx<xgr?Kv{8ZXS@*WaHXkRQ^DFD2`Dzbid&WwB+kQH9bP{e@)4FI
zC<tgQA0)$F9h!YHKN$8JQ$B6r!G`u1pcU1pJdjXrGHT38Q80d>olzo`i5HXue2;=b
zB6*yZJEmf^4Z%(MXqair#-Bm*KAbH-1Vg+A?a(zEP={K?`p>i1XbpN6*cF(m(Tmo2
zZHcb4L$-Tuln>O!I0luB^OEgDJ;u5b$9wxpHk)w<WtoAj#z|3>%E*y~MK*kE#5>@E
zK&=!W8XpbfH3b;eLEyJRe1zszg)Jfy@Bt;LpYkF$!1KWBIF@Ze1lGT;z@n?}v~5=Q
zn&J|y({?f#3e*a7xBmFFY;K*B&8<1&>{S_}Q_&}H*)jb(&b4n*pC%Cf*;_Ww1$66;
rvT6|0m(J`5#CZlzp1pDkBO>!A$aHXdny4?ZZX_y2Ks#20nxFkYl?Fvp

literal 1769
zcmaJ>OK;mo5Z(u0vSnFuQ`@}+%8@8yoeLO6+PElkF^V`w0RqLA)^2RZ6iM%{kVK$*
zkxvDB=`{(E9Q_;mPxjhVZaoKm%}|mbN)Q5^<;)Iuzxn2IxVE-J;Q8y<KYrc|2>BD0
z>yHP@eR$0-2uUQ($&e;=$Pz|TXE`5wiPwDd+#d!>K*{$+deT29(pPlKlTZc+Bo5!f
z2_$BYfAj4F*GZ3z)#<<vl|3nCOkMYp8kAZ-ln<@asVz0wZh!Z@QaT%|!ah<}X)-Xs
z7~nbAA0L$a@R}14iX>E$gdGyal_%*gQ9i7!S-Iq|ScA<=0u{neBm=O7GCKFBG-=Ij
zip$n3E?4AgV_i|J;MWGfHQ71$lD1rjc)G6hgDwZkn5;N{oSIX&F0?uuWm<_*B~z>1
zim+f8MLJXvck5DdotusW4!{==elvI<z-zi7YE~0LY6=n}J0KTyKV~|F9UXy)x$}(5
zpXe4^Fq;=dufg(O^bd{Fraw&eAS<4wR+mR<e@~fHTUPxa4-X#q%{VjTv`UNPVR}=^
z3agGG4_R6C5qQ7447Q1Cr+VQcA+jQ~LbTyJgQY@fK*w7*dD&TbT>uBVNwUbK`&?b-
z7I?c%?lKh=4sEEw<1u`_3Li~?7hL1T`WA|fg|*qz9Z=nd9u)%9lPfWYkAxbemjvUx
zOE^FDj``K$F3`%3bn!v5K7mkw1{ci$VMb=C*3D^Fi6^Cou(9H|VP^s9&Jv_0SE!<m
zO9n+YZ<HqX8?dkxpqppJ{SF@%>gNr8OQv+fEwjAlQ#z%4<R?4vYUq+J@)CM^W`9Xu
z^NC;c+WUe`f|@+_>Y!$l|HdXEXg+v)HA=q@z}KHdb*N8ZC(ysxu#TpblA64U@UOQp
zCC;|d3jV=shI?n*n8rBVe}~MCd9UBon3i$7H%}5|toNSw#;d)1_j*V{rDWW4UY;52
z){m7HX`av7GtSpgzRK}j6?zlSX}Y5659e1J>R8_fYuuU@%NBZIu_UWACJhv$N!klq
z3#pzvuS&ITQV+ca_b1U&YLv*!<K<+AbI3h7(cA$+{5I{<O&U>;GRpo9yiK|ST0q%<
z0UvKJC3yb(e!Pa=gp)!Dm>XhP$`MqpaBU&ZMrl6Z@s7$ehe0FKq9|?Cod%pZ%u>A$
zmuqYvjRUa>dd3HKj=qbcDZ(p(O`@?*aE>(S5oyG_9^-)hpHA4Ul>Oalq2BoJ$C2ad
z(LiGtHTStMuaA+PYm;MV!K%C}Rz%~z`otfLQLyvT0Wk{>L4Pb77wyiN`x<M@pj(%<
HY1{iB7#Y6%

diff --git a/sziszapangma/integration/task/gold_transcript_task.py b/sziszapangma/integration/task/gold_transcript_task.py
new file mode 100644
index 0000000..d4cc6ba
--- /dev/null
+++ b/sziszapangma/integration/task/gold_transcript_task.py
@@ -0,0 +1,35 @@
+from sziszapangma.integration.gold_transcript_processor import GoldTranscriptProcessor
+from sziszapangma.integration.repository.experiment_repository import ExperimentRepository
+from sziszapangma.integration.task.processing_task import ProcessingTask
+from sziszapangma.model.relation_manager import RelationManager
+
+
+class GoldTranscriptTask(ProcessingTask):
+    _gold_transcript_processor: GoldTranscriptProcessor
+    _gold_transcript_property_name: str
+
+    def __init__(
+        self,
+        task_name: str,
+        gold_transcript_processor: GoldTranscriptProcessor,
+        gold_transcript_property_name: str,
+        require_update: bool,
+    ):
+        super().__init__(task_name, require_update)
+        self._gold_transcript_processor = gold_transcript_processor
+        self._gold_transcript_property_name = gold_transcript_property_name
+
+    def skip_for_record(self, record_id: str, experiment_repository: ExperimentRepository) -> bool:
+        return (
+            experiment_repository.get_property_for_key(
+                record_id, self._gold_transcript_property_name
+            )
+            is not None
+        )
+
+    def run_single_process(self, record_id: str, experiment_repository: ExperimentRepository, relation_manager: RelationManager,):
+        experiment_repository.update_property_for_key(
+            record_id,
+            self._gold_transcript_property_name,
+            self._gold_transcript_processor.get_gold_transcript(record_id),
+        )
-- 
GitLab