In [20]:
from luna_record_provider_new import LunaRecordProvider
from sziszapangma.integration.experiment_manager import ExperimentManager
from sziszapangma.integration.repository.multi_files_experiment_repository import MultiFilesExperimentRepository
from sziszapangma.integration.path_filter import ExtensionPathFilter
from pymongo import MongoClient
from spacy.tokens.doc import Doc
import pandas as pd

In [21]:
luna_directory = '/Users/marcinwatroba/Desktop/LUNA/LUNA.PL'

In [22]:
experiment_repository = MultiFilesExperimentRepository('experiment_data', 'asr_benchmark_luna')

In [23]:
record_provider = LunaRecordProvider(ExtensionPathFilter(
    root_directory=luna_directory,
    extension='wav'
))

In [24]:
record_id = list(record_provider.get_all_records())[0]

In [25]:
experiment_repository.get_property_for_key(record_id, 'pos_metrics_wer')

{'classic_wer': 0.19727891156462585}

In [26]:
pos_alignment_wer = experiment_repository.get_property_for_key(record_id, 'pos_alignment_wer')
gold_transcript_spacy = experiment_repository.get_property_for_key(record_id, 'gold_transcript_spacy')
gold_trnascript_spacy_word_dict = {it['id']: it['word'] for it in gold_transcript_spacy}
asr_spacy = experiment_repository.get_property_for_key(record_id, 'techmo_spacy')
asr_spacy_word_dict = {it['id']: it['word'] for it in asr_spacy}

In [27]:
arr = [
    {
        'step_type': it['step_type'],
        'reference_word_pos': it['step_words']['reference_word']['text'] if 'reference_word' in it['step_words'] else '',
        'reference_word_text': gold_trnascript_spacy_word_dict[it['step_words']['reference_word']['id']] 
        if 'reference_word' in it['step_words'] else '',
        'hypothesis_word_pos': it['step_words']['hypothesis_word']['text'] if 'hypothesis_word' in it['step_words'] else '',
        'hypothesis_word_text': asr_spacy_word_dict[it['step_words']['hypothesis_word']['id']] 
        if 'hypothesis_word' in it['step_words'] else ''

    }
    for it in pos_alignment_wer
]
pd.DataFrame(arr)

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,DELETION,PRON,xxx,,
1,CORRECT,NOUN,dzień,NOUN,dzień
2,CORRECT,ADJ,dobry,ADJ,dobry
3,CORRECT,NOUN,dzień,NOUN,dzień
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
143,DELETION,NOUN,widzenia,,
144,CORRECT,VERB,proszę,VERB,proszę
145,CORRECT,ADV,bardzo,ADV,bardzo
146,DELETION,ADP,do,,


In [47]:
def get_gold_transcript_for(record_id: str) -> str:
    gold_trnascript_property = experiment_repository.get_property_for_key(record_id, 'gold_transcript')
    return ' '.join([it['word'] for it in gold_trnascript_property])

def get_asr_transcript_for(record_id: str) -> str:
    gold_trnascript_property = experiment_repository.get_property_for_key(record_id, 'techmo_polish_asr')
    return gold_trnascript_property['full_text']

def get_pos_alignment_df(record_id: str) -> pd.DataFrame:
    pos_alignment_wer = experiment_repository.get_property_for_key(record_id, 'pos_alignment_wer')
    gold_transcript_spacy = experiment_repository.get_property_for_key(record_id, 'gold_transcript_spacy')
    gold_trnascript_spacy_word_dict = {it['id']: it['word'] for it in gold_transcript_spacy}
    asr_spacy = experiment_repository.get_property_for_key(record_id, 'techmo_spacy')
    asr_spacy_word_dict = {it['id']: it['word'] for it in asr_spacy}
    
    arr = [
        {
            'step_type': it['step_type'],
            'reference_word_pos': it['step_words']['reference_word']['text'] if 'reference_word' in it['step_words'] else '',
            'reference_word_text': gold_trnascript_spacy_word_dict[it['step_words']['reference_word']['id']] 
            if 'reference_word' in it['step_words'] else '',
            'hypothesis_word_pos': it['step_words']['hypothesis_word']['text'] if 'hypothesis_word' in it['step_words'] else '',
            'hypothesis_word_text': asr_spacy_word_dict[it['step_words']['hypothesis_word']['id']] 
            if 'hypothesis_word' in it['step_words'] else ''

        }
        for it in pos_alignment_wer
    ]
    return pd.DataFrame(arr)
    
    
def show_report_for(record_id: str):
    print(f'gold transcript: {get_gold_transcript_for(record_id)}')    
    print()
    print(f'asr transcript: {get_asr_transcript_for(record_id)}')
    print()
    print(f"word wer {experiment_repository.get_property_for_key(record_id, 'techmo_polish_classic_wer_metric')}")
    print()
    print(f"pos wer {experiment_repository.get_property_for_key(record_id, 'pos_metrics_wer')}")
    print()
    display(get_pos_alignment_df(record_id))
    print('--------------------------------------------------------------')
    print('--------------------------------------------------------------')
    print('--------------------------------------------------------------')

In [48]:
for it in list(record_provider.get_all_records())[:20]:
    show_report_for(it)

gold transcript: xxx dzień dobry dzień dobry proszę pana mam takie pytanie jestem emerytką i chcę se kupić miesięczny bilet to ile za jakie muszę czy sto procent płacić czy połówkę a nie ma pani jeszcze siedemdziesięciu lat no nie mam proszę pani jeśli jest pani emerytką to na podstawie legitymacji emery~ emeryta i rencisty i dokumentu tożsamości jest ulga czterdzieści osiem procent czterdzieści osiem procent tak a teraz niech pan mi powie jak ja chcę kupić sobie bilet miesięczny na tą eskaemkę to ile ale pani chce tylko na eskaemkę ? na eskaemkę i na tramwaje aha a będzie pani jeździła eskaemką dokąd ? z Pruszkowa do Warszawy aha czyli musiałaby pani se taki na trzydzieści dni by kosztował panią czterdzieści sześć osiemdziesiąt czterdzieści sześć osiemdziesiąt to taki bilet bym tak to się nazywa bilet sieciowy imienny bilet sieciowy dziękuję bardzo do widzenia proszę bardzo do widzenia

asr transcript: dzień dobry dzień dobry proszę pana ja mam takie pytanie jestem emerytką i chcę se 

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,DELETION,PRON,xxx,,
1,CORRECT,NOUN,dzień,NOUN,dzień
2,CORRECT,ADJ,dobry,ADJ,dobry
3,CORRECT,NOUN,dzień,NOUN,dzień
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
143,DELETION,NOUN,widzenia,,
144,CORRECT,VERB,proszę,VERB,proszę
145,CORRECT,ADV,bardzo,ADV,bardzo
146,DELETION,ADP,do,,


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx słucham dzień dobry ja się chciałem zapytać o autobus sto dwadzieścia trzy z przystanku Meissnera w kierunku Ronda Wiatraczna dobrze już momencik sto dwadzieścia trzy chwileczkę dobrze przystanek Meissnera kierunek Wiatraczna już panu podaję kiedy pan życzy dzisiaj ? tak teraz proszę bardzo proszę pana to mamy tak dwudziesta zero dziewięć i dwadzieścia dziewięć dobrze dziękuję bardzo dziękuję uprzejmie do widzenia do widzenia

asr transcript: dzień dobry słucham dzień dobry ja się chciałem zapytać o autobus 123 z przystanku meissnera w kierunku ronda wiatraczna dobrze już momencik 100 chwileczkę dobrze przystanek meissnera kierunek wiatraczna już panu podaję kiedy pan życzy dzisiaj tak teraz proszę bardzo proszę pana to mamy tak dwudziesta 0 9 i 29 dobrze dziękuję bar

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,NOUN,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,CORRECT,NOUN,dzień,NOUN,dzień
...,...,...,...,...,...
61,CORRECT,ADV,uprzejmie,ADV,uprzejmie
62,CORRECT,ADP,do,ADP,do
63,CORRECT,NOUN,widzenia,NOUN,widzenia
64,CORRECT,ADP,do,ADP,do


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dobry wieczór xxx słucham dzień dobry ja mam takie pytanie bo dowiedziałam się właśnie jestem w sumie doktorantką że obowiązuje mnie czterdziestoośmioprocentowa zniżka na MZK i teraz mam takie pytanie bo ja właściwie ukończyłam studia doktoranckie dostanę świadectwo ukończenia tych studiów ale praktycznie zostało mi pisanie pracy doktorskiej i teraz mi już legitymacji nie podbijają czy dalej mogę korzystać z tej zniżki ? znaczy proszę pani ta zniżka przysługuje uczestnikom studiów doktoranckich ona przysługuje właśnie na podstawie legitymacji jeśli nie ma pani legitymacji to niestety czyli jeżeli mam po prostu nie podbijaną bo już studia ukończyłam ale jeszcze piszę pracę doktorską to już chyba raczej nie to już nie przysługuje niestety aha no to dziękuję ślicznie do widzenia bardzo 

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,ADJ,dobry,ADJ,dobry
1,CORRECT,NOUN,wieczór,NOUN,wieczór
2,DELETION,PRON,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,CORRECT,NOUN,dzień,NOUN,dzień
...,...,...,...,...,...
119,CORRECT,NOUN,widzenia,NOUN,nadzoru
120,DELETION,ADV,bardzo,,
121,DELETION,VERB,proszę,,
122,DELETION,ADP,do,,


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx w czym mogę pomóc ? dzień dobry panu chciałam zapytać się czy na Dolnym Mokotowie jest taka ulica Kostrzewskiego ? jest jest taki przystanek nawet Kostrzewskiego czy tamtędy jeździ autobus sto sześćdziesiąt sześć przez Kostrzewskiego ? tak tutaj przez ten przystanek ? tak przejeżdża jeździ to dobrze niech mi pan teraz powie jutro a czy jest przystanek w drugą stronę w stronę Ursynowa tam gdzieś naprzeciwko tak Kostrzewskiego w stronę Ursynowa tak jest jest czyli mniej więcej naprzeciwko jest tak ? tak dokładnie tak i ten z tego przystanku Kostrzewskiego w kierunku Ursynowa jakiś autobus jutro około ósmej rano w kierunku Ursynowa tak ? tak tak bo córka musi dojechać jutro stamtąd aż na Kabaty na Kabaty tak ona będzie jechała tak po imprezie proszę panią to te sto sześć

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,X,xxx,,
3,CORRECT,ADP,w,ADP,w
4,CORRECT,PRON,czym,PRON,czym
...,...,...,...,...,...
202,CORRECT,NOUN,widzenia,NOUN,panu
203,DELETION,VERB,proszę,,
204,CORRECT,ADV,bardzo,ADV,uprzejmie
205,DELETION,ADP,do,,


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: xxx dzień dobry dzień dobry jak się dostać z Ochoty na Książęcą ? jakim środkiem lokomocji ? z Ochoty na Książęcą ? tak z Ochoty a z którego miejsca z Ochoty by pani jechała ? z o to tutaj koło Hotelu Sobieskich z tego miejsca do szpitala konkretnie na Książęcą a pani chodzi do tego Szpitala Orłowskiego ? tak ? na Książęcą tak proszę pani na samą Książęcą od szpitala od Hotelu Sobieskiego nic nie ma od Centralnego ma pani sto osiemnaście aha ale sto osiemnaście i co i idzie na Książęcą ? on jedzie Książęcą albo jak pani podjedzie do Centrum to jest jeszcze sto siedemdziesiąt jeden ile ? sto siedemdziesiąt jeden tutaj sto osiemnaście a tam sto siedemdziesiąt jeden tak ? tak dziękuję proszę

asr transcript: dzień dobry dzień dobry jak się dostać z ochoty na książęcą jakim środkiem loko

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,DELETION,PRON,xxx,,
1,CORRECT,NOUN,dzień,NOUN,dzień
2,CORRECT,ADJ,dobry,ADJ,dobry
3,CORRECT,NOUN,dzień,NOUN,dzień
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
121,CORRECT,ADV,tak,ADV,tak
122,DELETION,PUNCT,?,,
123,CORRECT,ADV,tak,ADV,tak
124,CORRECT,VERB,dziękuję,VERB,dziękuję


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dobry wieczór xxx słucham dobry wieczór chciałam się dowiedzieć o której godzinie odchodzi z przystanku przy ulicy Kosiarzy w stronę pętli w Wilanowie autobus linii sto osiemdziesiąt i pięćset dwadzieścia dwa chodzi mi o godzinę tak gdzieś czy będzie to za dziesięć siódma czy za pięć siódma tak przed siódmą dobrze czyli tak przystanek Kosiarzy w z kierunku którym pani mówiła ? do Wilanowa do pętli w Wilanowie to jest ostatni przystanek a do pętli w Wilanowie przed pętlą tak zgadza się proszę pani to mamy tak dzisiaj tak ? znaczy jutro rano przed a jutro rano jutro rano przed siódmą tak przed siódmą proszę bardzo proszę pani to mamy tak szósta czterdzieści trzy tak tylko momencik dobrze ja zobaczę czy nie będzie jutro zmiany rozkładu jazdy przypadkiem dobrze momencik dobrze momencik b

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,ADJ,dobry,ADJ,dobry
1,CORRECT,NOUN,wieczór,NOUN,wieczór
2,DELETION,PRON,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
283,CORRECT,NOUN,pani,NOUN,pani
284,CORRECT,ADV,uprzejmie,ADV,uprzejmie
285,CORRECT,VERB,dziękuję,VERB,dziękuję
286,DELETION,NOUN,dobranoc,,


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dobry wieczór xxx słucham dobry wieczór tramwaj Targowa Lubelska tutaj w stronę Gocławia a jaka linia dwadzieścia sześć co może jeszcze jeździć ósemka w stronę Gocławka szóstka w stronę Gocławia Gocławka Gocławka ? wie pan potrzebuję do Ronda Wiatraczna dojechać z jakiego przystanku na Targowej ? Lubelska to już jest na Grochowskiej Zamoyskiego Lubelska to będzie chyba nie ? no tu kończy się Zamoyskiego zaczyna Grochowska tak czy trójki to już nie będzie bo ona w teraz już wcześniej kończy szóstka ? szóstka może być dwudziesta trzecia trzy ostatnia szóstka ósemki też już nie będzie a dwadzieścia sześć ? dwudziesta druga pięćdziesiąt osiem dwudziesta trzecia osiemnaście trzydzieści osiem dobrze dziękuję uprzejmie proszę bardzo dobranoc dobranoc

asr transcript: dobry wieczór słucham d

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,ADJ,dobry,ADJ,dobry
1,CORRECT,NOUN,wieczór,NOUN,wieczór
2,DELETION,PRON,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
110,CORRECT,ADV,uprzejmie,ADV,dobrze
111,CORRECT,VERB,proszę,VERB,dziękuję
112,DELETION,ADV,bardzo,,
113,DELETION,NOUN,dobranoc,,


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dobry wieczór xxx w czym mogę pomóc ? dobry wieczór mam takie pytania chciałbym się dowiedzieć sto sześćdziesiąt dziewięć z przystanku Żuromińska w stronę Pragi i jutro tak gdzieś przed siódmą rano w stronę Wschodniego ? tak stronę Wschodniego tak przed siódmą siódma coś koło tego proszę pana szósta czterdzieści jeden lub siódma jedenaście szósta czterdzieści jeden lub ? siódma jedenaście siódma jedenaście dobrze dziękuję proszę bardzo dobranoc

asr transcript: dobry wieczór w czym mogę pomóc dobry wieczór mam takie pytania chciałbym się dowiedzieć 169 z przystanku szoruj miejska s jutro tak gdzieś przed siódmą rano tak przez stronę wschodniego a zresztą wschodniego tak przed siódmą siódma coś podać proszę pana szósta 41 lub siódma 11 szósta 41 lub siódma 11 siódma 11 dobrze dziękuję

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,ADJ,dobry,ADJ,dobry
1,CORRECT,NOUN,wieczór,NOUN,wieczór
2,DELETION,PROPN,xxx,,
3,CORRECT,ADP,w,ADP,w
4,CORRECT,PRON,czym,PRON,czym
...,...,...,...,...,...
64,CORRECT,ADV,dobrze,ADV,dobrze
65,CORRECT,VERB,dziękuję,VERB,dziękuję
66,CORRECT,VERB,proszę,VERB,proszę
67,CORRECT,ADV,bardzo,ADV,bardzo


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx słucham dzień dobry proszę pani chciałbym zapytać się o odjazdy autobusów sto dziewięćdziesiąt siedem tak z przystanku Perzyńskiego w kierunku Dworca Zachodniego teraz po osiemnastej dobrze proszę pana osiemnasta dwadzieścia jeden i pięćdziesiąt jeden dwadzieścia jeden i pięćdziesiąt jeden aha rozumiem a jeszcze gdyby mogła pani sprawdzić o której on jest na przystanku Duracza w tym sami kierunku na przystanku Duracza proszę pana przejazd jest trzy minuty trzy minuty aha tak to są dwa przystanki rozumiem rozumiem dobrze to dziękuję bardzo dziękuję uprzejmie do widzenia

asr transcript: dzień dobry słucham dzień dobry proszę pani chciałbym zapytać się o odjazdy autobusów 197 tak to jest wierzyńskiego w kierunku dworca zachodniego teraz po osiemnastej dobrze proszę pana

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,NOUN,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,CORRECT,NOUN,dzień,NOUN,dzień
...,...,...,...,...,...
83,CORRECT,ADV,bardzo,ADV,bardzo
84,CORRECT,VERB,dziękuję,VERB,dziękuję
85,CORRECT,ADV,uprzejmie,ADV,uprzejmie
86,CORRECT,ADP,do,ADP,do


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: xxx dzień dobry dzień dobry proszę pana na Karolin tutaj ze Świętokrzyskiej to sto pięćdziesiąt pięć jedzie prawda ? sto pięćdziesiąt pięć tylko chwileczkę czy dzisiaj jest zmiana trasy tak ze Świętokrzyskiej na Karolin może pani dobrze czy mógłby pan mi dwa najbliższe podać ? dobrze i powiedzieć ile się jedzie do Fortu Wola bo tam z Fortu Wola ja się potem chciałam na siedemset trzynaście przesiąść a pani będzie wsiadała tutaj przy metrze ? czy przy Nowym Świecie przy Nowym Świecie dobrze do Fort Wola to jest około pół godziny przejazd odjazdy są dziesiąta trzydzieści siedem jedenasta zero dwa najbliższe a bo tak bo jest dziesiąta tak bo się czas zmienił jeszcze stary zegarek dobrze a potem siedem to czy jedenasta zero dwa tak powiedzmy jedenasta czterdzieści no mniej więcej i stamt

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,DELETION,PRON,xxx,,
1,CORRECT,NOUN,dzień,NOUN,dzień
2,CORRECT,ADJ,dobry,ADJ,dobry
3,CORRECT,NOUN,dzień,NOUN,dzień
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
295,CORRECT,VERB,dziękuję,VERB,dziękuję
296,DELETION,ADP,do,,
297,SUBSTITUTION,NOUN,widzenia,ADV,bardzo
298,CORRECT,ADP,do,ADP,do


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx słucham dzień dobry chodzi mi o Szybką Kolej Miejską tak mieszkam w Pruszkowie skończyłem siedemdziesiąt lat czy mam prawo do bezpłatnego przejazdu ? tak proszę pana ma pan prawo do bezpłatnych przejazdów od Pruszkowa do Warszawy na całej długości trasy linii Szybkiej Kolei Miejskiej dziękuję uprzejmie bardzo proszę do widzenia do usłyszenia

asr transcript: dzień dobry słucham dzień dobry chodzi mi o szybką kolej miejską tak mieszkam w pruszkowie skończyłem 70 czy mam prawo do bezpłatnego przejazdu tak proszę pana ma pan prawo do bezpłatnych przejazdów 8 łóżkowa do warszawy na całej długości trasy linii szybkiej kolei miejskiej przechylenia do usłyszenia

word wer {'classic_wer': 0.36363636363636365}

pos wer {'classic_wer': 0.21818181818181817}



Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,NOUN,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,CORRECT,NOUN,dzień,NOUN,dzień
5,CORRECT,ADJ,dobry,ADJ,dobry
6,CORRECT,VERB,chodzi,VERB,chodzi
7,CORRECT,PRON,mi,PRON,mi
8,CORRECT,ADP,o,ADP,o
9,CORRECT,ADJ,Szybką,ADJ,szybką


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx w czym mogę pomóc ? moje uszanowanie panu proszę pana chcę się upewnić czy na ulicę Spartańską do szpitala to jeździ sto dziewiętnaście ? nie proszę pana sto osiemnaście sto osiemnaście sto osiemnaście bądź sto dwadzieścia dwa dojeżdża i sto dwadzieścia dwa tak proszę pana a sto osiemnaście czy on przejeżdża koło Dworca Ochota ? koło Dworca Ochota nie proszę pana skręca przy Chałubińskiego w Chałubińskiego to to gdybym jechał przy Dworcu Centralnym pociągiem z Milanówka to gdzie najlepiej w jaki a pan będzie jechał ? od Milanówka pociągiem elektrycznym ale czy wukadką czy Kolejami Mazowieckimi ? nie nie nie dużą koleją dużą czyli to najwygodniej by było wysiąść na Śródmieściu Śródmieście tak ? tak i tutaj wyjść na górę i naprzeciwko Hotelu Polonia jest przystanek dla 

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,X,xxx,,
3,DELETION,ADP,w,,
4,DELETION,PRON,czym,,
...,...,...,...,...,...
224,CORRECT,VERB,dziękuję,VERB,dziękuję
225,CORRECT,NOUN,panu,NOUN,panu
226,DELETION,ADV,pięknie,,
227,SUBSTITUTION,VERB,proszę,PART,również


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx słucham dzień dobry proszę pana mam pytanie jak dojadę do Nowego Światu i wsiądę tam w jakiś sto szesnaście czy tam dwa w stronę Żoliborza chciałbym wysiąść na Placu Zamkowym czy one tam przejeżdżają jak okrążają czy wracają na Plac Zamkowy ? tak aha czyli jakoś tam okrążają pewnie Mazowiecką albo coś tam i zawracają na Plac Zamkowy tak ? tak dobrze dziękuję bardzo bardzo proszę

asr transcript: dzień dobry słucham dzień dobry proszę pana mam pytanie jak dojadę do nowego światu i wsiądę tam w jakiś proszę 62 w stronę żoliborza chciałbym wysiąść na placu zamkowym czy one tam przejeżdżają jak okrążają czy wracają na plac zamkowy tak aha czyli jakoś tam okrążają pewnie mazowiecką albo coś tam i zawracają na plac zamkowy tak tak dobrze dziękuję bardzo proszę

word wer {'c

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,NOUN,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,CORRECT,NOUN,dzień,NOUN,dzień
...,...,...,...,...,...
64,CORRECT,ADV,dobrze,ADV,dobrze
65,CORRECT,VERB,dziękuję,VERB,dziękuję
66,DELETION,ADV,bardzo,,
67,CORRECT,ADV,bardzo,ADV,bardzo


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dobry wieczór xxx słucham ? dobry wieczór chciałabym zapytać o której godzinie będzie najbliższy tramwaj numer dziesięć z Dworca Centralnego w kierunku Woli już sprawdzam dwudziesta druga dwadzieścia sześć ale to za trzy minuty następny czterdzieści sześć aha a proszę mi powiedzieć a ósemka czy będzie jeszcze ? wątpię ale sprawdzę nie nie nie będzie nie dobrze to dziękuję bardzo dobranoc proszę bardzo dobranoc

asr transcript: dobry wieczór słucham dobry wieczór chciałabym zapytać o której godzinie będzie najbliższy tramwaj numer 10 centralnego w kierunku woli już sprawdzam dwudziesta druga 26 ale to za 3 minuty następny 46 aha proszę mi powiedzieć a ósemka czy będzie jeszcze reala sprawdza nie nie nie będzie nie dobrze to dziękuję bardzo proszę bardzo dobranoc

word wer {'classic_we

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,ADJ,dobry,ADJ,dobry
1,CORRECT,NOUN,wieczór,NOUN,wieczór
2,DELETION,PRON,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,DELETION,PUNCT,?,,
...,...,...,...,...,...
59,CORRECT,ADV,bardzo,ADV,bardzo
60,DELETION,NOUN,dobranoc,,
61,CORRECT,VERB,proszę,VERB,proszę
62,CORRECT,ADV,bardzo,ADV,bardzo


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx w czym mogę pomóc ? a dzień dobry jedno pytanko tak czy matka z dzieckiem jak wchodzi do z wózkiem wchodzi do tramwaju czy autobusu czy płaci bilet ? jak to jest ? to znaczy jeżeli chodzi o dziecko które nie jeszcze nie chodzi do pierwszej klasy to jeździ bezpłatnie no dobrze ale w wózku w głębokim wózku to wózek jako bagaż nie podlega opłacie nie podlega nie a matka ? no tutaj jeżeli nie ma żadnych praw do ulg to niestety ale bilety normalne wtedy aha nie ma tam że też trza płacić po prostu no~ tak bilety tak aha no właśnie się zapytać czy to też jest ulga jakaś czy nie nie nie tutaj w tym przypadku nie to tylko wózek z dzieckiem ewentualnie a matka to płaci dokładnie tak aha no to dziękuję proszę bardzo do widzenia do widzenia

asr transcript: dzień dobry w czym mog

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,X,xxx,,
3,CORRECT,ADP,w,ADP,w
4,CORRECT,PRON,czym,PRON,czym
...,...,...,...,...,...
141,CORRECT,ADV,bardzo,ADV,bardzo
142,DELETION,ADP,do,,
143,DELETION,NOUN,widzenia,,
144,CORRECT,ADP,do,ADP,do


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dobry wieczór xxx słucham dobry wieczór chciałam się zapytać o autobus sto siedemdziesiąt dwa w stronę Dworca Zachodniego z Sadyby z przystanku kurczę ja nie wiem jak się ten przystanek nazywa to jest przy Metrze Racławicka jakoś dwa najbliższe jeżeli jeszcze jeżdżą albo jeden proszę pani sto siedemdziesiąt dwa skrzyżowanie Odyńca tak tak tak tak Odyńca chyba Niepodległości to jest przystanek Odyńca jeździ jeszcze w ogóle ? tak z tym że będą to już zjazdy na zajezdnię czyli ? więc tylko do do przystanku Wołoska czyli do do skrzyżowania Wo~ Wołoskiej a nie to nie to nie to nic to nic to dziękuję bardzo proszę bardzo do widzenia do usłyszenia

asr transcript: dobry wieczór słucham dobry wieczór chciałem się zapytać o autobus 172 w stronę od niego sadyby z przystanku kurczę ja nie mam s

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,ADJ,dobry,ADJ,dobry
1,CORRECT,NOUN,wieczór,NOUN,wieczór
2,DELETION,PRON,xxx,,
3,CORRECT,VERB,słucham,VERB,słucham
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
107,CORRECT,ADV,bardzo,ADV,bardzo
108,DELETION,ADP,do,,
109,DELETION,NOUN,widzenia,,
110,CORRECT,ADP,do,ADP,do


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: xxx dzień dobry dzień dobry informacja ? tak proszę pana jestem rencistą KRUSu to jest Kasa Rolniczego Ubezpieczenia jaka mi zniżka obowiązuje w transporcie czy w ogóle nie płacę bo bo nie mogę podjąć żadnej pracy jak jestem a ma pan pierwszą grupę inwalidzką ? to znaczy tam w KRUSie nie ma grup ale rentę pan dostaje tak ? rentę dostaje czterysta zł~ czterysta trzydzieści złotych i nie mogę podjąć żadnej pracy bo w KRUSie po dostaniu renciści nie nie nie nie można podjąć żadnej pracy rozumiem momencik proszę pana jeśli chodzi o rencistów to jeśli to nie jest żadna grupa inwalidzka pierwsza no to wtedy tylko jest zniżka czterdzieści osiem procent na podstawie odcinka renty na podstawie na podstawie aha musi pan mieć odcinki renty ewentualnie no legitymację rencisty i czterdzieści osie

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,DELETION,PRON,xxx,,
1,CORRECT,NOUN,dzień,NOUN,dzień
2,CORRECT,ADJ,dobry,ADJ,dobry
3,CORRECT,NOUN,dzień,NOUN,dzień
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
357,INSERTION,,,ADJ,globalna
358,INSERTION,,,ADV,tak
359,INSERTION,,,PART,aha
360,INSERTION,,,ADV,dobrze


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx w czym mogę pomóc ? proszę pana ja chciałam się dowiedzieć czy sto sześćdziesiąt siedem jeździ Ciołka czy nadal kursuje tą inną trasą to znaczy jeszcze ma trasę objazdową objazdową tak ? i jeszcze tak a to gdzie się zatrzymuje a zatrzymuje się przy jaki w stronę Wawelskiej czy zatrzymuje się przy rogu no naprzeciw Ciołka i na Górczewskiej tam się zatrzymuje ? to znaczy naprzeciw Ciołka i Górczewskiej aha czy się zatrzymuje jak on jedzie bo ja chciałam jechać na Wawelską do szpitala onkologicznego nie wiem gdzie tam można najbliżej z tego z nie tutaj z no z Górczewskiej proszę Górczewskiej przy Syreny gdzie najbliżej właśnie tam można no wsiąść przesiąść się proszę panią to autobus będzie jechał tak on jedzie ulicą Obozową potem skręca w Deotymy o zaraz to ja sobie zap

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,X,xxx,,
3,CORRECT,ADP,w,ADP,w
4,CORRECT,PRON,czym,PRON,czym
...,...,...,...,...,...
304,CORRECT,ADV,bardzo,ADV,bardzo
305,DELETION,ADP,do,,
306,DELETION,NOUN,widzenia,,
307,CORRECT,ADP,do,ADP,do


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: xxx dzień dobry dzień dobry proszę pana ja potrzebuję dojechać z przystanku Młodzieńcza tak z Ronda Waszyngtona może pan mi podać podać jak mogę dojechać od przystanku Młodzieńcza ? tak do trzeba od Młodzieńczej wsiąść albo sto dziewięćdziesiąt pięćset dwanaście siedemset osiemnaście dojechać do Dworca Wileńskiego do Wileńskiego tak ? tak i z Wileńskiego najlepiej w tramwaj dwadzieścia pięć ewentualnie autobus sto jeden z pięćset dziewięć a czy z Wileńskiego już tramwajem tak ? tak tramwaj dwadzieścia pięć dwadzieścia pięć tak ? tak dobrze dziękuję bardzo proszę bardzo a proszę pana może pan mi jeszcze powiedzieć czy ulica Francuska jest w tych okolicach ? jeszcze raz pan powtórzy ? ulica Francuska ona odchodzi od Ronda Waszyngtona odchodzi tak ? tak a Francuska pięćdziesiąt to jest 

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,DELETION,PRON,xxx,,
1,CORRECT,NOUN,dzień,NOUN,dzień
2,CORRECT,ADJ,dobry,ADJ,dobry
3,CORRECT,NOUN,dzień,NOUN,dzień
4,CORRECT,ADJ,dobry,ADJ,dobry
...,...,...,...,...,...
141,CORRECT,VERB,dziękuję,VERB,dziękuję
142,CORRECT,ADV,bardzo,ADV,bardzo
143,DELETION,VERB,proszę,,
144,CORRECT,ADP,do,ADP,do


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
gold transcript: dzień dobry xxx w czym mogę pomóc ? dzień dobry proszę pana chciałam uzyskać od pana taką informację proszę mi powiedzieć że chodzi mi o ulgi chodzi mi o ulgi czy jeżeli dziecko ma bezpłatne przejazdy autobusowe i tramwajowe czy na tą szybką emzetkę dziecko też ma musi płacić bilet ? to znaczy na Szybką Kolej Miejską ? tak nie proszę panią te i te bezpłatne przejazdy również przysługują i na ten środek transportu aha dobrze dobrze bo wie pan bo dziecko ma po prostu bezpłatnie jeździ autobusami i tramwajami ja jestem jako jego opiekun po prostu chciałam się tylko dowiedzieć czy przysługuje nam taka ulga jeżeli dziecko ma taką legitymację i po prostu czy dziecko będzie może czy dziecko może jeździć na tą szybką kolej na tą legitymację tak ? tak proszę panią ze względu na to że na Szybk

Unnamed: 0,step_type,reference_word_pos,reference_word_text,hypothesis_word_pos,hypothesis_word_text
0,CORRECT,NOUN,dzień,NOUN,dzień
1,CORRECT,ADJ,dobry,ADJ,dobry
2,DELETION,X,xxx,,
3,CORRECT,ADP,w,ADP,w
4,CORRECT,PRON,czym,PRON,czym
...,...,...,...,...,...
207,SUBSTITUTION,NOUN,widzenia,AUX,to
208,SUBSTITUTION,VERB,dziękuję,PRON,ja
209,CORRECT,ADV,wzajemnie,ADV,wzajemnie
210,CORRECT,ADP,do,ADP,do


--------------------------------------------------------------
--------------------------------------------------------------
--------------------------------------------------------------
